<< Themensammlung Netzwertig

Unter netzwertig veröffentlichen wir in unserem Blog Einschätzungen zu aktuellen digitalen Geschäftsmodellen und IT-Trends, Meldungen, Analysen, Reviews und Specials.

11.05.07

Semantisches Web Teil 1: Was steckt hinter dem Begriff?

Der Begriff «Semantisches Web« ist zwar nicht wirklich neu aber trotzdem für viele noch eine nebulöse graue Wolke. Da das Thema aber immer mehr an Fahrt gewinnt (siehe etwa diesen oder auch diesen Artikel bei Heise) ist das Grund genug für zweinull.cc, sich dem Thema semantisches Web in einer Serie von insgesamt vier Beiträgen etwas ausführlicher zu widmen.

In diesem Artikel werde ich allerdings erstmal nicht allzu weit ins Detail gehen, sondern nur die grundsätzliche Idee hinter dem semantischen Web vorstellen. Der zweite Artikel wird sich mit der heutigen technischen Umsetzung befassen, der dritte Beitrag wird konkrete Anwendungsbeispiele vorstellen und im vierten Artikel letztendlich werde ich auf Kritikpunkte und Gefahren eingehen, welche die neue Technologie mit sich bringen könnte.

Ausgangslage – Das Web von heute

Nehmen wir an, ich suche nach dem günstigsten Modell einer Digitalkamera und möchte dieses noch am selben Tag in einem Laden der Umgebung kaufen. Da ich neu in der Stadt bin, werde ich erst einmal damit beginnen, die Adressen verschiedener Elektrohändler aus meiner Umgebung zu suchen. Dazu benutze ich eine Online-Branchenauskunft. Anschließend trage ich die gewonnen Ergebnisse in eine Excel-Liste ein und besuche die Webseiten der einzelnen Händler, um die Preise meines gewünschten Kameramodells zu vergleichen. Zudem möchte ich wissen, wie lange die jeweiligen Läden heute geöffnet haben. Ich beginne also, der Reihe nach, die einzelnen Webseiten der Händler anzusurfen und die gewonnen Informationen in einer Liste zusammenzutragen. Obwohl die Internetauftritte der verschiedenen Händler sehr unterschiedlich gestaltet sind, ist es dennoch ein leichtes, Informationen wie die Öffnungszeiten einer Filiale daraus zu gewinnen. Das Zusammentragen der Liste ist zwar etwas mühselig, aber dennoch eine intellektuell leicht zu bewältigende Aufgabe.

Was für einen Menschen kein Problem darstellt, ist für einen Crawler hingegen nicht so ohne weiteres zu bewerkstelligen. Denn um gezielte Informationsketten wie die oben genannte aus verschiedenen Webseiten und Datenquellen extrahieren zu können, präsentieren sich die Daten viel zu unterschiedlich (siehe Screenshot) - Computer sind mit der heutigen Rechenleistung schlichtweg nicht in der Lage, jene Abstraktion herzustellen, die notwendig ist, um etwa aus einer beliebigen Webseite eines Online-Shops den Preis eines bestimmen Digitalkameramodells zu ermitteln. Aber wäre es nicht fantastisch, wenn es doch eine Möglichkeit gäbe, dass ein Computerprogramm diese Daten verarbeiten kann? So könnte ich, anstatt aufwändig händisch eine Liste zusammenzutragen, einfach eine Anwendung diese Arbeit für mich erledigen lassen. Genau hier kommt die Idee des semantischen Webs ins Spiel.

online_shops.jpg

Blickt man auf verschiedene Webshops so erkennt man warum es so schwierig ist, Inhalte automatisch auszulesen: Angaben, wie etwa der Verkaufspreis, sind alle unterschiedlich formatiert und an verschiedenen Stellen eingebettet. Das semantische Web hilft, diese Daten im Hintergrund zu vereinheitlichen, ohne das Layout zu verändern.

Die Idee des semantischen Webs

Vereinfacht gesagt kann man sich das semantische Web so vorstellen, dass Informationen eben nicht nur für Menschen verarbeitbar aufbereitet werden, sondern diese auch für Maschinen lesbar gemacht werden. Man erklärt Robots und Crawlern sozusagen, worum es sich bei einem Inhalt handelt und in welcher Beziehung dieser zu anderen Informationen steht. Dies geschieht mit einheitlichen Formaten und Auszeichnungen, von welchen eines der Wichtigsten das «Resource Description Framework« (kurz RDF) ist, auf welches ich im zweiten Artikel dieser Serie ausführlich eingehen werde.

Durch die Vereinheitlichung von Daten im Hintergrund lassen sich diese dann beliebig kombinieren – egal aus welcher Quelle diese auch kommen. Ein Objekt vom Typ «Adresse« bleibt ein Objekt des Typs «Adresse«, egal auf welcher Webseite dieses definiert wird und wie es letztendlich auch formatiert ist. Dadurch lassen sich diese Daten auch webseitenübergreifend abfragen und auswerten. So kann ein Crawler das Netz beispielsweise nach allen Webseiten durchforsten, die vom Typ «Elektronikhändler« sind, deren Objekt «Adresse« auswerten und in einen Stadtplan einarbeiten. Auch das ist einer der Kernpunkte des semantischen Webs: Daten sind nicht mehr nur isoliert pro Webseite verfügbar, sondern das gesamte Web verschmilzt zu einem einzigen riesigen Datenspeicher.

Einen ersten Einblick, welche vielfältigen neuen Möglichen sich mit einer solchen Verknüpfung von Daten erzielen lassen, zeigen die vielfältigen so genannten Mash-Ups derzeit. Diese sprießen derzeit wie Pilze aus dem Boden und vermischen in der Regel Daten von zwei Web 2.0 Diensten so, dass daraus eine neue Anwendung geschaffen wird. Doch mit dem semantischen Web werden noch viel mehr Möglichkeiten geschaffen, die weit über heutige Mash-Ups hinausgehen werden. Kein Wunder also, dass nicht selten im selben Atemzug das Wort «Web 3.0« fällt, wenn von semantischen Webdiensten die Rede ist .

Welch großes Potential das semantische Web wird nicht zuletzt dadurch aufgezeigt, dass einer der größten Unterstützer des semantischen Webs niemand geringeres als das W3C ist, jenes Konsortium also, welches die Standard im Internet festlegt. Deren Vorsitzender und der Erfinder des Webs, Tim Berners-Lee, gilt als Galionsfigur und einer der treibenden Kräfte hinter der neuen Technologie. Auf der Webseite des amerikanischen BusinessWeek-Magazin findet sich ein lesenswertes und interessantes Interview mit Berners-Lee.

Sollte sich die Idee des semantischen Webs durchsetzen, so würde dies die Nutzung des Internets für uns alle drastisch effizienter machen. Doch bevor ich mich im dritten Teil den praktischen Anwendungsmöglichkeiten widme, wird im nächsten Teil zu lesen sein, welche Ansätze es von der technischen Seite gibt. In Kürze auf zweinull.cc!

Dieser Beitrag wurde ursprünglich im Blog zweinull.cc veröffentlicht. Im Mai 2008 wurden zweinull.cc und netzwertig.com zusammengeführt.

Das könnte Sie auch interessieren

Förderland-Newsletter

Wissen für Gründer und Unternehmer