Galerie

Sprachtechnologie treibt das semantische Web!

Das semantische Web ist in aller Munde (vgl. auch den Forumbeitrag: Web 2.0 ? was bedeutet VOICE für das semantische Web?). Der Begriff steht für die Bemühung, Beschreibungsstandards und Technologien zu entwickeln, mit denen einerseits die Suche nach Informationen und Dokumenten verbessert werden kann und andererseits die automatische Verarbeitung von Daten und Wissen aus unterschiedlichen Quellen unterstützt wird. Insofern ist das semantische Web vergleichbar mit den assoziativen Netzwerken des menschlichen Gehirns. Semantische Suchmaschinen sollen in absehbarer Zeit auf semantische Definitionen und damit verbundene Begriffshierarchien Rücksicht nehmen und auch Inhalte auffind- und nutzbar machen, die nicht genau die gesuchten, sondern nur bedeutungsverwandte Begriffe enthalten.

Der Begründer des Internets, Tim Berners-Lee, stellte vor wenigen Tagen auf der ‚World Wide Web Conference 2006‘ in Edinburgh fest, dass für das Semantische Web nunmehr alle Standards und Techniken verfügbar seien, die für eine massenhafte Verbreitung und die Entwicklung entsprechender Anwendungen nötig sein. So ist es seiner Ansicht nach heute kein Problem mehr, Daten mit Informationen anzureichern und sie damit leichter nutzbar zu machen. Metadaten (Daten über Daten), die einem Objekt (der Information) zugewiesen werden, machen es ‚bedeutsam‘. Programmierer und Content Provider können semantische Sprachen zusätzlich zu HTML nutzen, so der Guru der Netzwelt: „Wir haben jetzt ein Resource Description Framework (RDF), wir haben Ontologien und wir haben Abfrage- und Befehlssprachen.“ Als letzten Schritt habe man SPARQL (SPARQL Protocol and RDF Query Language) fertig gestellt. Diese Abfragesprache ist derzeit in der Candidate Recommendation Phase des W3C, „das heißt, es ist Zeit SPARQL zu implementieren“, so Berners-Lee.

Ein Beispiel für solche Bemühungen, vorhandene Inhalte einer semantischen Nutzung zuzuführen, ist das Semantic-Wiki-Team des Web 2.0-Lexikons Wikipedia. Dieses frei verfügbare online-Lexikon wird permament von kompetenten ?Unbekannten? aktualisiert –  seine Akkuratesse ist dementsprechend hoch, da falsche Darstellungen von anderen ?Sachverständigen? umgehend abgeändert und verbessert werden (vgl. http://de.wikipedia.org/wiki/VoiceXML mit dem Eintrag der VOICE Community). Diese internationale Gruppe von Wikipedianern arbeitet derzeit daran, dass Listen semantischer Bezüge künftig automatisch erstellt werden können. Ihr Ziel ist es, den gewaltigen Wissensschatz der Wikipedia besser zu verknüpfen. Denn bisher wird in den Lexikon-Einträgen zwar ausgiebig verlinkt und eingeordnet, doch der inhaltliche Zusammenhang zwischen den verlinkten Artikeln bleibt offen. Die semantische Verknüpfung der Artikel ergibt eine so genannte Ontologie ? ein Netz aus Sachverhalten und ihren Beziehungen zueinander, das bestimmte Wissensbereiche mehr oder weniger genau abbildet. Aus diesem Netz lässt sich neues Wissen ableiten, dass so nie explizit formuliert wurde. Zudem ist die Struktur der Verknüpfung unabhängig von der Sprache. So ließen sich auch die Wikipedias unterschiedlicher Sprache einfacher homogenisieren.

Die Ergebnisse solcher Projekte und der laufenden Forschung und Entwicklung werden zukünftig echten Informations-Zugang schaffen, also die Möglichkeit, jede beliebige Information aus Video-, Audio- und Text-Datenbasen zu beschaffen. Weil im semantischen Web alle Arten von ?versteckten? Bedeutungen transportiert werden und weil man von einem Teil der Hintergrund-Informationen, die einem Wort anhängen, auf seine Bedeutung schließen kann, wird VOICE sicher ein integrativer Bestandteil des semantischen Webs sein, nicht nur, was gesprochene, als Audios vorliegende Inhalte angeht: Auch vor dem Hintergrund, dass für den orts- und endgeräteunabhängigen Infoabruf (per Telefon) immer auch ein interaktives Element vorhanden sein muss, spricht natürlich alles dafür, dass VOICE und Semantisches Web immer stärker miteinander verbunden sein werden. Das kürzlich veröffentlichte und Google zugesprochene US-Patent 7027989 ist ein starkes Indiz dafür, dass auch Google in diese Richtung denkt und an einer sprachgesteuerten Suchtechnologie arbeitet. Je weiter die Technologie für Informationszugang und Informationsabrufsteuerung vorangetrieben wird, desto mehr Synergieeffekte werden auch eintreten – der Informationszugang der Zukunft wird absehbar mobil, multimedial, multimodal und multilingual sein, was sicher einer der gewaltigsten Meilensteine in der menschlichen Informationsnutzung überhaupt darstellen wird. 

Sprachgesteuerter Zugang zu Informationen ist der Schlüssel zur Zukunft des Internets, der eine Vielzahl an Anwendungen schaffen wird: Für Contact Center ebenso wie für die Gemeinde der ?Wissensarbeiter? und natürlich für die Endverbraucher, die sich ungehinderten Zugang zu den Informationen des Internets wünschen, auch ohne über die entsprechende Infrastruktur aus Computer und Webzugang zu verfügen, wird es eine Fülle von Anwendungen geben, die semantischer Natur sind.

Natural Language Understanding wird dadurch zu einer Schlüsseltechnologie für das semantische Web ? ebenso wie Text to Speech. Wenn Texte in menschlicher Qualität ?vorgelesen? werden sollen, muss die Maschine Verständnis der zu lesenden Texte und ihrer Struktur ebenso wie ihrer Bedeutung haben. Von einem wirklichen ?Verständnis? von Bedeutung ist die Technologie nach Ansicht führender Wissenschaftler jedoch noch weit über zehn Jahre entfernt, trotz aller Hyperinformation, die das semantische Web bereits für automatisiertes ?Verständnis? zur Verfügung stellen kann.

Wie lange wird es Ihrer Ansicht nach dauern, bis das semantische, sprachgesteuerte Web Realität ist? Was sind die Hürden, die bis dahin von Seiten der Sprachtechnologiebranche noch überwunden werden müssen? Eröffnet sich durch die Verbindung aus semantischem Web tatsächlich auch eine Fülle neuer ?Killer?-Anwendungen im B2B- wie im B2C Bereich?

Diskutieren Sie mit ? schreiben Sie uns, wie Sie die Zukunft des Webs und den Einfluss der Sprachtechnologie darauf vorstellen!

Advertisements

Kommentar verfassen

Bitte logge dich mit einer dieser Methoden ein, um deinen Kommentar zu veröffentlichen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s