Die Suchmaschine Collecta ermittelt Tweets, Photos, Videos, Blog-Beiträge, Kommentare zu einem bestimmten Suchwort in Echtzeit. So sind die Suchergebnisse nicht statisch, sondern werden durch weitere neuere Beiträge ständig während der Betrachtung ergänzt und aktualisiert. Derzeit ist der Dienst noch nicht online. Dennoch kann die Arbeitsweise von Collecta auf den Webseiten “Obama in real Time” und “Swine Flu” beobachtet werden.

Diese Art der Suche ist schon gewöhnungsbedürftig, da sich die dargestellten Suchergebnisse ständig in ihrer Positionierung ändern und man leicht überfordert durch die Fülle an Informationen ist. Zumal auch die Suchergebnisse bislang ungefiltert ausgegeben werden. Es gib keinerlei Auswertung oder Rating. Es zählt lediglich die Aktualität der Beiträge und diese ist für gewöhlich kein Qualitätsmerkmal. Nichtsdestotrotz ist Collecta ein recht interessanter und sehenswerter Ansatz.
Die Basis für das Semantic Web bildet das Ressource Description Framework (RDF). RDF ist ein vom W3-Consortium empfohlener Standard zur Definition von maschinenlesbaren Metadaten und damit zur Ermöglichung von Interoperabilität zwischen Anwendungen im Internet. Mittels RDF können einfache Aussagen und Relationen zwischen Ressourcen formuliert werden. Jede einzelne Ressource besitzt eine eindeutige Adresse, die sogenannte URI (Uniform Ressource Identifier). RDF-Aussagen bilden einen gerichteter Graph, bestehend aus Knoten und Kanten. Die Elemente dieses Graphs sind RDF-Tripeln, welche ein Subjekt ein Prädikat und ein Objekt darstellen. Das Subjekt und das Objekt sind Knoten und das Prädikat die gerichtete Kante, die immer auf das Objekt zeigt.
Mittels RDF können nun Aussagen im HTML-Code einer Website formuliert werden, wie beispielsweise die Aussage “Elisabeth Kaliva ist die Autorin dieses Beitrags”. Im HTML-Code würde man dann im Tag des Autors und im Tag des Beitrag, entsprechend RDF-Auszeichnungen finden, die diese Aussage zusammenstellen.
Für Anwender ist es vordergründig nicht interessant. Maschinen können aber eine Website mit den RDF-Auszeichnungen scannen und entsprechende Informationen rausfiltern. Sie besteht somit nicht nur aus einem unspezifischen langen Text mit Bildern und anderen Elementen, sondern aus kleinen Inhaltsmodulen mit individueller Bedeutung. Wenn eine Maschinen nun eine solche Website durchläuft, kann sie die jeweiligen Module selektieren und entsprechend darstellen – beispielsweise in Suchergebnissen oder in Personeneztwerken.
Folgendes Video zeigt, mögliche Anwendungen, die durch den Einsatz von RDF in Drupal entstehen.
Und nun ein Beispiel für ein Tool, das auf Technologien des sogenannten Semantic Web basiert. Mit Hilfe des Webtools “US Presidents” kann man seine Kenntnisse über die Amerikanischen Präsidenten verbessern.
Es wurde mit Hilfe des Frameworks Exhibit realisiert, das vom Projekt SMILE (Semantic Interoperability of Metadata and Information in unLike Environments) entwickelt wurde. Weitere interessante Beispiele sind auf der Seite von Exhibit zu finden.
Der Lehrstuhl für Wirtschaftsinformatik im Fachbereich Wirtschaftswissenschaft der Freien Universität Berlin hat einen Crawler geschrieben, der im Internet nach Daten, die in RDF formatiert sind sucht, diese sammelt, um sie dann in Google Base zu veröffentlichen. Google Base ist eine öffentliche Datenbank, in der jeder strukturierte Daten hochladen kann. Der Lehrstuhl für Wirtschaftsinformatik experimentiert momentan mit FOAF-Profilen. Mit dem Friend OF A Friend Format (FOAF) können sowohl eigene Profildaten wie auch Daten über Beziehungen zu anderen Personen maschinenlesbar in RDF beschreiben werden. Diese Daten können dann von Computern gesammelt, verarbeitet, dargestellt oder mit anderen strukturierten Daten kombiniert werden. Das macht auch dieser Crawler. Er sammelt die Daten und veröffentlicht sie in der Google Base. Die geographischen Koordinaten im Profil werden entsprechend in Google Maps ausgegeben.
Und natürlich darf das in FOAF erstellte Profil von Tim Berners-Lee in Google Base nicht fehlen.
[tags]semantic web, foaf, google base[/tags]
In diversen Weblogs ist erneut eine Diskussion um den Begriff “Web 2.0″ ausgebrochen. Im Read/WriteWeb schreibt Richard MacManus, dass er es satt habe ständig die Kritik um diesen Begriff zu hören und einem Artikel in ZDNet zustimme, dass der Begriff “Web 2.0″ die derzeitige Entwicklung im Netz nicht richtig darstelle. Im diesem Artikel wird zum wiederholten Male darauf Aufmerksam gemacht, dass der Begriff ein Marketing-Slogan sei, der in einem Brainstorming entstanden ist. “It was coined by Dale Dougherty during a meeting between O’Reilly and Associates (a computer book publisher) and MediaLive International (an event organizer) as a marketable term for a series of conferences” (http://en.wikipedia.org/wiki/Web2.0). Im Weiteren wird in diesem Artikel angeführt, dass der Begriff Ähnlichkeit mit einer Versionsnummer habe. Es sehe so aus, als wäre Web 1.0 eine Vorläufer von Web 2.0 und im Web 3.0 werden Fehler von Web 2.0 eliminiert und Erweiterungen ergänzt. Darüber hinaus würde dieser Begriff Elemente miteinander vereinen, die eigentlich nichts miteinander zu tun hätten. Und wieder kommen die cleveren Marketingleute ins Spiel, die damit versuchen Kunden zu angeln: “Skeptics argue that the term is essentially meaningless, or that it means whatever its proponents decide that they want it to mean in order to convince the media and investors that they are creating something fundamentally new, rather than continuing to develop and use well-established technologies” (http://en.wikipedia.org/wiki/Web2.0). Interessant ist, dass beide in dem ZDNet Artikel zitierten Absätze in Wikipedia am 18.12.2005 und am 20.12.2005 von Benutzern entfernt wurden. Sie sind noch gemeinsam in der Version vom 18.12.2005 zu finden.
Als Resultat dieser im Jahr 2005 anhaltenden Diskussion um den Begriff “Web 2.0″ hat Richard MacManus von Read/WriteWeb nun beschlossen dem Begriff, nicht den Technologien, den Rücken zu kehren. Er schreibt nicht mehr über “Web 2.0″, sondern über “Web Technology and Media”.
Der Begriff “Read/WriteWeb” wurde von Tim Berners-Lee das erste Mal erwähnt. Er stellt seine ursprüngliche Idee eines Webs dar, indem alle Benutzer gleichzeitig Informationskonsumenten wie auch Informationserzeuger sind. Eine andere Vorstellung von Tim Berners-Lee bezüglich der Entwicklung des Web ist das “Semantic Web”. “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation” (The semantic web, Tim Berners-Lee, James Hendler and Ora Lassila, 2001). Im deutschsprachigen Wikipedia wird unter dem Begriff “Web 2.0″ folgendes angemerkt: “Als Synonym für das Semantische Web wurde Web 2.0 auch benutzt. Die beiden Konzepte sind ähnlich und ergänzen sich. Die Kombination von sozialen Netzwerken wie FOAF und XFN zusammen mit der Entwicklung von Folksonomy verbreitet durch Weblogs, Soziale Lesezeichen und Wikis erschuf eine natürliche Basis für eine semantische Umgebung” (http://de.wikipedia.org/wiki/Web_2.0).
Aber der Begriff “Semantic Web” scheint sich schwer durchzusetzen. Vielleicht weil er nicht so abstrakt ist wie “Web 2.0″, zu technisch klingt und man sich schwer die Funktionalitäten und Technologien aus dem Begriff heraus vorstellen kann, die ermöglicht und verwendet werden. Seit neustem hat nun auch Tim Berners-Lee einen Weblog. Zum Thema Weblog hat er in einem Interview bei den BBC Newsnight’s gesagt: ” When you write a blog, you don’t write complicated hypertext, you just write text, so I’m very, very happy to see that now it’s gone in the direction of becoming more of a creative medium”. Mal schauen, ob er sich in Zukunft in seinem eigenen Weblog zu dem Thema “Web 2.0″ äußern wird.
