Echtzeit Suchmaschine Collecta

Die Suchmaschine Collecta ermittelt  Tweets, Photos, Videos, Blog-Beiträge, Kommentare zu einem bestimmten Suchwort in Echtzeit. So sind die Suchergebnisse nicht statisch, sondern werden durch weitere neuere Beiträge ständig während der Betrachtung ergänzt und aktualisiert. Derzeit ist der Dienst noch nicht online. Dennoch kann die  Arbeitsweise von Collecta auf den Webseiten “Obama in real Time” und “Swine Flu” beobachtet werden.

collecta

Diese Art der Suche ist schon gewöhnungsbedürftig, da sich die dargestellten Suchergebnisse  ständig in ihrer Positionierung ändern und man leicht überfordert durch die Fülle an Informationen ist. Zumal auch die  Suchergebnisse bislang ungefiltert ausgegeben werden. Es gib keinerlei Auswertung oder Rating. Es zählt lediglich die Aktualität der Beiträge und diese ist für gewöhlich kein Qualitätsmerkmal.  Nichtsdestotrotz ist Collecta ein recht interessanter und sehenswerter Ansatz.

Drupal und RDF

Die Basis für das Semantic Web bildet das Ressource Description Framework (RDF). RDF ist ein vom W3-Consortium empfohlener Standard zur Definition von maschinenlesbaren Metadaten und damit zur Ermöglichung von Interoperabilität zwischen Anwendungen im Internet. Mittels RDF können einfache Aussagen und Relationen zwischen Ressourcen formuliert werden. Jede einzelne Ressource besitzt eine eindeutige Adresse, die sogenannte URI (Uniform Ressource Identifier). RDF-Aussagen bilden einen gerichteter Graph, bestehend aus Knoten und Kanten. Die Elemente dieses Graphs sind RDF-Tripeln, welche ein Subjekt ein Prädikat und ein Objekt darstellen. Das Subjekt und das Objekt sind Knoten und das Prädikat die gerichtete Kante, die immer auf das Objekt zeigt.

Mittels RDF können nun Aussagen im HTML-Code einer Website formuliert werden, wie beispielsweise die Aussage “Elisabeth Kaliva ist die Autorin dieses Beitrags”. Im HTML-Code würde man dann im Tag des Autors und im Tag des Beitrag, entsprechend RDF-Auszeichnungen finden, die diese Aussage zusammenstellen.

Für Anwender ist es vordergründig nicht interessant. Maschinen können aber eine Website mit den RDF-Auszeichnungen scannen und entsprechende Informationen rausfiltern. Sie besteht somit nicht nur aus einem unspezifischen langen Text mit Bildern und anderen Elementen, sondern aus kleinen Inhaltsmodulen mit individueller Bedeutung. Wenn eine Maschinen nun eine solche Website durchläuft, kann sie die jeweiligen Module selektieren und entsprechend darstellen – beispielsweise in Suchergebnissen oder in Personeneztwerken.

Folgendes Video zeigt, mögliche Anwendungen, die durch den Einsatz von RDF in Drupal entstehen.

[youtube r4WgTRIRoa0]

US Presidents

Und nun ein Beispiel für ein Tool, das auf Technologien des sogenannten Semantic Web basiert. Mit Hilfe des Webtools “US Presidents” kann man seine Kenntnisse über die Amerikanischen Präsidenten verbessern.
Es wurde mit Hilfe des Frameworks Exhibit realisiert, das vom Projekt SMILE (Semantic Interoperability of Metadata and Information in unLike Environments) entwickelt wurde. Weitere interessante Beispiele sind auf der Seite von Exhibit zu finden.

Web 3.0, 4.0, 10.0

Mittlerweile sieht man immer öfter den Begriff Web 3.0. Anscheinend sind viele Blogger mit den Eigenschaften des sogenannten Web 2.0 nicht zufrieden. Deswegen sehnen sie sich nach einer neuen Version. Ich kann ihre Verwirrung verstehen, ist es doch wirklich schwer, eine Web 2.0 Anwendung zu identifizieren und zu klassifizieren. Welche Eigenschaften, Eigenarten haben Web 2.0 Anwendungen? Ist es, dass sie RSS/Atom zum Datenaustausch verwendet, oder, dass sie AJAX zur Darstellung einsetzen, Skype zur Kommunikation, und so weiter? RSS wird schon seit 1999 zum Datenaustausch verwendet. IP-Telefonie ist auch nichts Neues. Sogar AJAX existiert seit 1998. Sind vielleicht die Zusammenführung der jeweiligen Tools und Daten und die Möglichkeit zur Kommunikation spezifische Eigenarten einer Web 2.0 Anwendung?

Die Vermischung verschiedener Daten unterschiedlicher Quellen, scheint eine Schlüsseleigenschaft der sogenannten Web 2.0 Anwendungen zu sein. In herkömmlichen Websites liegen die Informationen meistens in Form von einzelnen HTML-Dokumenten, die miteinander verlinkt sind vor. Ihr Inhalt und ihre Struktur kann von Menschen interpretiert werden. Maschinen können nur begrenzt diese Information verarbeiten. In einem Artikel „Web 2.0 for Designers“, der im Mai 2005 von Richard MacMagnus und Joshua Porter veröffentlich wurde, steht „“The Web of Documents has morphed into a Web of data. We are no longer just looking to the same old sources of information. Now we’re looking to a new set of tools to aggregate and remix microcontent in new and useful ways“.

Auch in „Native to a Web of Data“, einer Präsentation von Tom Coates von Yahoo, die er während der Konferenz „Future of Web Apps“ in London gehalten hat, wird in den ersten Folien der Präsentation die Undeutlichkeit des Begriffs Web 2.0 und seiner Anwendungen deutlich. Er zeigt diverse Anwendungen und verschiedene Graphiken, die versuchen das Web 2.0 darzustellen, welche nicht eine Antwort liefern, sondern viele Fragen aufwerfen. Tom Coates baut seine Präsentation auf folgendem Satz auf: „A web of data sources, services for exploring and manipulating data and ways that users can connect them together“. Aus dem Web von Dokumenten wird das Web der „Mash-Ups „ und daraus folgt das Web of Data. Dave Beckett bezieht sich auf diese Präsentation und schreibt in seinem Blog “ that the open data part of the web 2.0 buzzword space, actually aligns well with semantic web ideas – a web of data”, da auch im Semantic Web die maschinenlesbaren Daten ein wesentliches Merkmal sind.

Die Web 2.0 Anwendungen sollen die jeweiligen Dateneinheiten sammeln, verarbeiten und mit anderen Daten vermischen und darstellen. Die von den Anwendungen bereitgestellte, standardisierte und strukturierte Daten sind einfacherer, untereinander auszutauschen (content aggregation) und miteinander zu vermischen (content syndication). Die Daten werden von ihrem ursprünglichen Kontext herausgefiltert und auf dem lokalen Browser (oder entsprechenden Applikationen) mit anderen Daten verknüpft und dargestellt.

Ein weiteres Merkmal von Web 2.0 Anwendungen ist, dass sie nicht nur die Daten maschinenlesbar ablegen, sondern auch unterschiedliche Schnittstellen und Services zur Erstellung, Suche, Manipulation und Austausch der strukturierten Daten anbieten. Beispiele dafür in der Datenebene sind: RSS/Atom , Microformats, Permalinks und weitere. In der Anwendungsebene gehören dazu Weblogs- oder Wikis, aber auch Widgets und offene APIs, die von unterschiedlichen Anbietern bereitgestellt werden, wie beispielsweise von Yahoo und Google. Die angebotenen APIs erweitern den Austausch auch auf der Anwendungsebene (service syndication). Im Web 2.0 wird das Web als Plattform gesehen, auf der Entwickler neue Anwendungen schreiben, untereinander austauschen und miteinander vermischen können. Baly Iyer von der School of Management at Boston University hat in seinem Blog eine Graphik veröffentlich, die basierend auf den Daten von programmableweb.com zeigt, welche APIs am häufigsten genutzt und in Mash-Ups am häufigsten miteinander verknüpft werden. Die Größe der Knoten in der Graphik entspricht der Nutzung der jeweiligen API und die Breite der Kante zwischen zwei Knoten die Häufigkeit der gemeinsamen Nutzung in Form von Mash-Ups . Knoten der gleichen Firma besitzen auch die gleiche Farbe.

In Verbindung mit Web 2.0 erscheint oft der Begriff Social Software. Kurz angemerkt: Social Software ermöglicht Kommunikation und Interaktion zwischen Benutzern im Internet. Zu den Social Software Anwendungen gehören neben E-Mail und Instand Message auch Wikis, und Blogs, die als Musterbeispiele von Web 2.0 Anwendungen gelten. Daraus folgend können nun die Eigenschaften von Web 2.0 Anwendungen um die Möglichkeiten der Interaktion und Kommunikation von Social Software erweitert werden.

Der Begriff Web 2.0 scheint ein Oberbegriff für verschiedene Technologien und Anwendungsgebiete zu sein. Die drei hier herausgestellten Eigenschaften: maschinenlesbare Daten, Services, Kommunikations- und Interaktionsmöglichkeiten erinnern mal wieder an den Satz zur Definition von Semantic Web: „The Semantic Web is an extension of the current Web in which information is given well-defined meaning, better enabling computers and people to work in cooperation“ (The semantic web, Tim Berners-Lee, James Hendler and Ora Lassila, 2001). Unabhängig davon, scheint das Thema und der Hype um das Web 2.0 ein gutes Vehikel zu sein, um die Vorstellungen und die Möglichkeiten von Semantic Web nach dem Buttom-Up Ansatz allmählich im Web zu etablieren. Yahoo sucht bereits nach Semantic Web Entwicklern.

[tags]semantic web, web 2.0[/tags]

Semantic Web und Google Base

Der Lehrstuhl für Wirtschaftsinformatik im Fachbereich Wirtschaftswissenschaft der Freien Universität Berlin hat einen Crawler geschrieben, der im Internet nach Daten, die in RDF formatiert sind sucht, diese sammelt, um sie dann in Google Base zu veröffentlichen. Google Base ist eine öffentliche Datenbank, in der jeder strukturierte Daten hochladen kann. Der Lehrstuhl für Wirtschaftsinformatik experimentiert momentan mit FOAF-Profilen. Mit dem Friend OF A Friend Format (FOAF) können sowohl eigene Profildaten wie auch Daten über Beziehungen zu anderen Personen maschinenlesbar in RDF beschreiben werden. Diese Daten können dann von Computern gesammelt, verarbeitet, dargestellt oder mit anderen strukturierten Daten kombiniert werden. Das macht auch dieser Crawler. Er sammelt die Daten und veröffentlicht sie in der Google Base. Die geographischen Koordinaten im Profil werden entsprechend in Google Maps ausgegeben.

Und natürlich darf das in FOAF erstellte Profil von Tim Berners-Lee in Google Base nicht fehlen.

[tags]semantic web, foaf, google base[/tags]

Web 2.0 ist tot

In diversen Weblogs ist erneut eine Diskussion um den Begriff “Web 2.0” ausgebrochen. Im Read/WriteWeb schreibt Richard MacManus, dass er es satt habe ständig die Kritik um diesen Begriff zu hören und einem Artikel in ZDNet zustimme, dass der Begriff “Web 2.0” die derzeitige Entwicklung im Netz nicht richtig darstelle. Im diesem Artikel wird zum wiederholten Male darauf Aufmerksam gemacht, dass der Begriff ein Marketing-Slogan sei, der in einem Brainstorming entstanden ist. “It was coined by Dale Dougherty during a meeting between O’Reilly and Associates (a computer book publisher) and MediaLive International (an event organizer) as a marketable term for a series of conferences” (http://en.wikipedia.org/wiki/Web2.0). Im Weiteren wird in diesem Artikel angeführt, dass der Begriff Ähnlichkeit mit einer Versionsnummer habe. Es sehe so aus, als wäre Web 1.0 eine Vorläufer von Web 2.0 und im Web 3.0 werden Fehler von Web 2.0 eliminiert und Erweiterungen ergänzt. Darüber hinaus würde dieser Begriff Elemente miteinander vereinen, die eigentlich nichts miteinander zu tun hätten. Und wieder kommen die cleveren Marketingleute ins Spiel, die damit versuchen Kunden zu angeln: “Skeptics argue that the term is essentially meaningless, or that it means whatever its proponents decide that they want it to mean in order to convince the media and investors that they are creating something fundamentally new, rather than continuing to develop and use well-established technologies” (http://en.wikipedia.org/wiki/Web2.0). Interessant ist, dass beide in dem ZDNet Artikel zitierten Absätze in Wikipedia am 18.12.2005 und am 20.12.2005 von Benutzern entfernt wurden. Sie sind noch gemeinsam in der Version vom 18.12.2005 zu finden.

Als Resultat dieser im Jahr 2005 anhaltenden Diskussion um den Begriff “Web 2.0” hat Richard MacManus von Read/WriteWeb nun beschlossen dem Begriff, nicht den Technologien, den Rücken zu kehren. Er schreibt nicht mehr über “Web 2.0”, sondern über “Web Technology and Media”.

Der Begriff “Read/WriteWeb” wurde von Tim Berners-Lee das erste Mal erwähnt. Er stellt seine ursprüngliche Idee eines Webs dar, indem alle Benutzer gleichzeitig Informationskonsumenten wie auch Informationserzeuger sind. Eine andere Vorstellung von Tim Berners-Lee bezüglich der Entwicklung des Web ist das “Semantic Web”. “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation” (The semantic web, Tim Berners-Lee, James Hendler and Ora Lassila, 2001). Im deutschsprachigen Wikipedia wird unter dem Begriff “Web 2.0” folgendes angemerkt: “Als Synonym für das Semantische Web wurde Web 2.0 auch benutzt. Die beiden Konzepte sind ähnlich und ergänzen sich. Die Kombination von sozialen Netzwerken wie FOAF und XFN zusammen mit der Entwicklung von Folksonomy verbreitet durch Weblogs, Soziale Lesezeichen und Wikis erschuf eine natürliche Basis für eine semantische Umgebung” (http://de.wikipedia.org/wiki/Web_2.0).

Aber der Begriff “Semantic Web” scheint sich schwer durchzusetzen. Vielleicht weil er nicht so abstrakt ist wie “Web 2.0”, zu technisch klingt und man sich schwer die Funktionalitäten und Technologien aus dem Begriff heraus vorstellen kann, die ermöglicht und verwendet werden. Seit neustem hat nun auch Tim Berners-Lee einen Weblog. Zum Thema Weblog hat er in einem Interview bei den BBC Newsnight’s gesagt: ” When you write a blog, you don’t write complicated hypertext, you just write text, so I’m very, very happy to see that now it’s gone in the direction of becoming more of a creative medium”. Mal schauen, ob er sich in Zukunft in seinem eigenen Weblog zu dem Thema “Web 2.0” äußern wird.