Galerie

SpeechTek 2006 – Zeitenwende und Aufbruchstimmung

Vom 7. ? 11. August fand in New York wieder die SpeechTek-Konferenz statt, der größte Branchentreff der Voice-Branche und ihrer Kunden im englischsprachigen Raum. Es war die letzte Konferenz, die von John Kelly, ihrem Gründer und dem bisherigen Herausgeber des Speech Technology Magazines, veranstaltet wurde ? er verkaufte den Event und die Publikation an den Weltkonzern Information Today (www.infotoday.com). Für die VOICE Community Anlass genug, mit Tom Houwing (voiceandvision), Teilnehmer und Dozent auf der SpeechTek, über seine Eindrücke zu sprechen.

VOICE Community: Herr Houwing, was waren die interessantesten Trends, die Sie auf der SpeechTek-Konferenz in New York feststellen konnten?

Tom Houwing: Am bedeutsamsten für die Branche war, dass erstmals seit Bestehen der SpeechTek-Konferenz sich die Einsicht zeigte, dass Sprachtechnologie noch nicht ausgereift ist ? und dass ohne einen stärkeren Fokus auf die Belange der Anrufer Sprachanwendungen die Erwartungen nicht werden erfüllen können, die Anbieter ebenso wie Betreiber in sie setzen. Langsam setzt sich nun auch in den USA die Einsicht durch, dass die Erwartungen der Nutzer im Vordergrund stehen müssen, wenn Anwendungen erfolgreich sein sollen! In diesem Zusammenhang wurde dieses Jahr auch erstmals deutlich, wie unterschätzt die Bedeutung der Grammatikentwicklung für die Entwicklung richtig guter Voice User Interfaces ist. Auch das Thema „Natural Language Understanding“, das eng damit verbunden ist, wurde intensiv diskutiert ? auch hier zeigten sich neue Einsichten und Ansätze. Und sicher waren die Präsentationen von Microsofts neuem Vista-Betriebssystem von herausragender Bedeutung für die Zukunft des Voice Business ? wenn es Microsoft gelingt, mit Vista die breite Masse der Verbraucher an die Sprachinteraktion mit Maschinen heranzuführen, so wird das enorme Auswirkungen haben: Microsoft wird damit Standards setzen, wie sie es bei den grafischen Beutzeroberflächen taten. Idiome, Befehle und Funktionen werden die Verbraucher dann von Microsoft erlernen ? mit den entsprechenden Folgen für die Nutzerschnittstellen anderer Sprachanwendungen, die sich den daraus resultierenden Erwartungen der Nutzer stellen werden müssen.

VOICE Community: Viele Leser der VOICE Community kennen das Video der misslungenen Präsentation der Vista-Sprachsteuerung, das vor einigen Wochen durch die Medien geisterte. Sie sagen: Da steckt mehr drin?

Tom Houwing: Microsoft stellt mit Vista die ganze Microsoft-Welt auf Sprachsteuerung um. Und wie wir auf der SpeechTek gesehen haben, mit großen Erfolgsaussichten. Ich glaube, dass das enorme Auswirkungen haben wird insbesondere auf die Verbraucher: Sie werden lernen, Sprachsteuerung als natürlich anzusehen, täglich damit umzugehen und viel eher bereit sein, auch auf anderen Gebieten sprachgesteuerte Anwendungen zu nutzen.

VOICE Community: Worum ging es bei der Diskussionen um das ?Natural Language Understanding??

Tom Houwing: Hier müssen wir erstmal die Begriffe klären: Natürlich kann keine Maschine wirklich ?verstehen“, daher sprechen die Amerikaner auch von Open Ended Prompting ? ?Was kann ich für Sie tun?? fragen heute viele Anwendungen den Anrufer und schaffen damit Schwierigkeiten für Nutzer wie Entwickler dieser Anwendungen. Diese Diskussion verlief daher auch zweigleisig: Einerseits wurde klar, dass man viel ausführlichere Grammatiken braucht, wenn man mit offenen Fragen arbeitet, zum anderen wurde heiß diskutiert, ob es überhaupt Sinn macht, solche Fragen zu stellen. Studien beispielsweise wie von den Leppik-Brothers (www.vocalabs.com) zeigen, dass Systeme am erfolgreichsten sind, die sich durch sehr kurzes Prompting, direkte Führung des Anrufers und ein gutes Voice User Interface auszeichnen. Es ist ein Riesenunterschied, ob ein Call Center Agent die höfliche Floskel ?Was kann ich für Sie tun?? benutzt oder eine Maschine, die eine klar umrissene Aufgabe hat. Unabhängig davon ist der Branche jedoch klar geworden, dass im Bereich der Grammatiken noch viel Arbeit wartet. Die Branche braucht heute ein intelligentes Grammatikdesign, universelle Grammatiken fehlen völlig. Es gibt viele Spezialgrammatiken, jedoch zum Beispiel noch keine, die sich ohne Weiteres von einer auf eine andere Sprache übertragen ließen. Wenn wir den Anrufern also mehr und bessere Eingabemöglichkeiten anbieten wollen, muss in die Entwicklung von Grammatiken noch viel Arbeit investiert werden. Ich halte die Bedeutung der Grammatikentwicklung derzeit für ähnlich unterschätzt wie noch vor einiger Zeit die des Voice User Interface-Designs.

VOICE Community: Dieses Thema zielt vor allem auf die Bedienbarkeit der Anwendungen. Warum ist diese so wichtig?

Tom Houwing: Bisher war und ist die Entwicklung von Sprachanwendungen meist zu technikgetrieben. Es wird viel Geld in die Technologie gesteckt, von der die Industrie lange behauptete, sie könne alles. Dank der Industrialisierung der Branche und der damit verbundenen Erfahrungen wissen wir heute, dass der Erfolg einer Anwendung aber nicht von der verwendeten Technologie abhängt, sondern von den Erwartungen der Nutzer und deren Befriedigung sowie von den zugrunde liegenden Geschäftsmodellen. Ich fordere die Branche auf, zurück zum Kunden zu finden, der die Anwendung nutzen soll. Und natürlich besteht noch eine Menge Lernbedarf. Auch das hat die SpeechTek gezeigt: Unternehmenspräsentationen sind gut und schön, aber sie führen nicht weiter, weil sie Technik vorführen und nicht Nutzerinteressen. Hier muss noch viel gelernt werden. Da erwarte ich mir viel von den VOICE Days und dem VOICE Campus: Erstmals besteht hierzulande die Möglichkeit, sich auf dem VOICE Campus inhaltlich so vorzubereiten, dass man ein Maximum an Ideen, Visionen und auch Herausforderungen von den anschließenden Diskussionen und Fachsessions der VOICE Days mitnehmen kann. Es geht nicht mehr darum, was kann diese oder jene Plattform oder Technologie; das Interessantere ist, was kann ich damit machen und wie muss ich es tun, damit der Nutzer die Anwendung zum Erfolg werden lässt.

+ VOICE Campus

 Hinweis der Redaktion: Freuen Sie sich auf Tom Houwings „in-depth“ Analyse der SpeechTEK – nächste Woche exklusiv in der VOICE Community!

Advertisements

Kommentar verfassen

Bitte logge dich mit einer dieser Methoden ein, um deinen Kommentar zu veröffentlichen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s