Hier finden Sie weitere Artikel aus der Themensammlung Technik

17.06.12Leser-Kommentare

Sprachsteuerung: Alles hört auf mein Kommando – oder auch nicht

Seitdem man Siris Fähigkeiten und Unfähigkeiten im Alltag ausprobieren kann, ist der Hype darum einer gewissen Ernüchterung gewichen. Aber dennoch: Sprachsteuerung wird vielen eine große Zukunft bescheinigt. Auf der Suchmaschinen-Konferenz SEMSEO 2012 in Hannover habe ich einen nicht wirklich ernst gemeinten Vortrag zu "Voice Search" gehalten. Eigentlich ist er eine Kolumne. Hier nun zum Nachlesen.

Ein Blick in unsere Zukunft: tolle Frisuren, schicke Jacken und vor allem ein Auto, mit dem man sich via Armbanduhr unterhalten kann.Sprachsteuerung ist derzeit ja in aller Munde und ich bitte dieses lahme Wortspiel gleich zu Beginn meines Textes zu entschuldigen. Jedenfalls: Vor allem Apples Siri hat die Phantasie neu beflügelt. Und „Phantasie“ ist auch schon das richtige Stichwort: Werfen wir doch einmal einen Blick darauf, wie Sprachsteuerung und sprachgesteuerte Suche laut Werbung angeblich funktionieren. Und noch viel wichtiger: Die Werbung erklärt uns auch, warum und wozu wir das alles eigentlich nutzen sollten.

In Apples erstem Werbeclip zu Siri sieht man da z.B. einen jungen Mann joggen und währenddessen SMS beantworten – alles über Sprachbefehle an Siri. Und ist es nicht genau das, was wir uns alle schon gewünscht haben? Ganz bestimmt! Jedenfalls mit kleinen Einschränkungen. Sagen wir einmal so: Vorausgesetzt ich würde joggen und ich wäre so wichtig, dass ich zwingend meine SMS während einer Joggingrunde beantworten müsste, würde ich das genau so machen wollen.

Dass ich diesen Anwendungsfall nicht habe, ebenso wie übrigens der Großteil der menschlichen Bevölkerung, ist ja alles in allem nicht Apples Schuld. In Berlin joggen und per Siri SMS beantworten – hipper wird's nimmer.

Jedenfalls eröffnet ein solches Tool wie Siri vollkommen neue Anwendungsmöglichkeiten! Endlich kann ich einen Termin mit meinem Chiropraktiker anlegen, noch während ich am Bungeeseil hänge. Endlich kann ich Notizen machen, während ich drei Kinder und fünf kleine Kätzchen aus einem brennenden Haus rette. Endlich kann ich eine SMS beantworten, während ich ans Bett gefesselt bin.

Und das sind nur einige Beispiele dafür, was man damit alles anstellen kann. Da soll noch einmal jemand behaupten, auf so etwas wie Siri hätten wir nicht alle schon viele Jahre ungeduldig gewartet.

Da ich ein kritischer und unbestechlicher Journalist bin, will ich natürlich nicht verschweigen, dass nicht alles so super ist. Restaurant-Bewertungen sind auch dann noch gefälscht, wenn ich sie mit Siri abfrage. Die Wettervorhersage bleibt ein Glücksspiel. Und überflüssiges Wissen aus Wolfram Alpha bleibt überflüssiges Wissen aus Wolfram Alpha.

Aber gut: Nehmen wir einmal an, das sei an sich alles sinnvoll. Da fragen wir uns: Kann denn das in der Realität überhaupt so funktionieren?

Dazu habe ich drei Punkte.

Und der erste Punkt zeigt auch schon, wie kompliziert das Thema in Wirklichkeit ist:

Sprachsteuerung unter Menschen

Erster Härtetest für die Sprachsteuerung: Menschen.

Wenn Sprachsteuerung und sprachgesteuerte Suche funktionieren, dann müssen sie doch wohl auf jeden Fall von Mensch zu Mensch funktionieren. Oder etwa nicht? Dafür ist doch die Sprache mal erfunden worden. Aber was muss ich feststellen und ich glaube, so mancher wird das auch kennen: Es funktioniert nicht. Oder nur selten. Denn wann wird schon einmal gemacht, was ich sage?

Wir alle kennen doch die Situation: Wir wohnen mit unserem Lebenspartner zusammen. Und als Mann sagt man da zum Beispiel einen typischen Satz wie: „Schatz, bring mich Bier.“

So reden Männer. Alle. Und das ist auch vollkommen in Ordnung so, denn „Schatz, bring mich Bier“ ist schließlich ein ganz klar formulierter Sprachbefehl: Subjekt, Prädikat, Objekt – alles drin.

Und obwohl dieser Sprachbefehl so klar und eindeutig scheint, haben wir doch alle schon erlebt, dass er entweder ignoriert wird oder zu einem ganz anderen Ergebnis führt. Man hat schließlich nicht gesagt: „Schatz, stell unsere Beziehung in Frage.“ Man hat auch nicht gesagt: „Schatz, lass uns mal über unsere Rollen in dieser Partnerschaft diskutieren.“ Es hieß ganz klar: „Schatz, bring mich Bier.“ Und da merkt man, wie schnell man an die Grenzen der Sprachsteuerung kommt.

Das Problem wird nicht besser, wenn wir uns nicht mehr nur mit Sprachbefehlen beschäftigen, sondern mit sprachgesteuerter Suche unter Menschen, die so genannte Human Voice Search. Auf die klare Suchanfrage: „Schatz, wo sind die Autoschlüssel?“ bekommt man da beispielsweise die Antwort: „Da, wo du sie hingelegt hast, du Dussel.“ Die Antwort ist zwar korrekt, aber wenig hilfreich.

Nur: Wenn das zwischen Menschen schon nicht funktioniert, kann das zwischen Mensch und Maschine funktionieren? Auch dazu ein Beispiel aus der Praxis:

Automatische Hotlines

Weiterlesen auf Seite 2/3...

Wer sich gern mit Computern unterhält und Labyrinthe mag, muss automatische Hotlines einfach lieben.

Jeder von uns hatte doch schon einmal das unermesslich großartige Vergnügen, sich mit einem automatisierten Callcenter zu unterhalten. Hotline-Computer zeigen, welche Fortschritte die Menschheit in den letzten 20.000 Jahren gemacht hat. Phantastisch! Beeindruckend! Die Mondlandung ist nichts dagegen.

Im Prospekt oder auf der Website einer Firma heißt es dann z.B.: „Kundenservice ist uns wichtig! Rufen Sie uns jederzeit an! Unsere Berater stehen gern für ein persönliches Gespräch zur Verfügung.“ Dahinter findet sich ein Sternchen und unten die Erklärung: „Dies gilt nur montags bis freitags zwischen 4 und 4.15 Uhr an gerade Tagen bei Temperaturen über 25 Grad, sofern der Mond im dritten Haus des Wassermanns steht.“ Falls das dummerweise gerade nicht der Fall sein sollte, könne man aber gern das automatische Callcenter anrufen. Dort bekomme man alle Auskünfte rund um die Uhr! Was nicht so explizit dabeisteht: Man bekommt diese Auskünfte sofern man sich tatsächlich durch das irrsinnig verschachtelte Hotline-Menü schlägt, das nach dem Vorbild des Labyrinths von Knossos entworfen wurde.

Wenn ich allein schon höre, wie mir dieses künstliche Stimme ins Ohr flötet: „Herzlich Willkommen im Hauptmenü!“ Ich habe da sofort psychosomatische Störungen. Aber es geht ja noch weiter.

Die Stimme flötet dann: „Wenn Sie blablabla wollen, drücken Sie die 1“ und ich denke: „Mh, nee, das will ich nicht.“ „Wollen Sie blablablablabla, drücken Sie die 2“ und ich denke: „Ja, das könnte es vielleicht sein...“ „Wollen sie blablabla drücken Sie die 3“ und ich denke: „Das könnte es auch sein – irgendwie“

Und dann drücke ich erst die 2, im nächsten Menü die 1, danach die 3, dann die Raute-Taste, gebe meine Kundennummer ein, lande doch am falschen Ende, gehe zurück ins Hauptmenü, versuche es doch mit der 3, verliere mich dort ebenso, nur um festzustellen, dass es im Hauptmenü eigentlich noch einen Punkt 6 gibt und der ist es dann und ich habe es geschafft – nur habe ich leider gerade nicht die Vorgangsnummer zur Hand.

Dann gibt es ja noch diesen ausgefuchsten Trick, etwas Unverständliches zu murmeln. Fast schon betroffen flötet der Computer: „Das habe ich leider nicht verstanden.“ Hat man oft genug etwas Unverständliches gemurmelt, gibt der Computer auf und man wird direkt an einen Menschen weitergeleitet – einen echten Menschen! Endlich, denkt man sich! – Nur um dann zwei Minuten später festzustellen, dass dieser Mensch absolut keine Ahnung hat.

Aber der Fortschritt ist ja nicht nicht aufzuhalten und wir haben Spracherkennung und Sprachsteuerung auf unseren Smartphones. Ich gehöre ja zu denjenigen, die das immer alles ausprobieren, auch wenn es die letzten Jahre nie wirklich funktioniert hat. Aber ich lasse mich da nicht beirren. Irgendwann kommt sicher der Durchbruch.

Neulich zum Beispiel hatte ich ein Testgerät in der Hand und da hat die Spracherkennung mich besser verstanden als ich mich selbst. Ich hatte diktiert:

„Nun teste ich einmal die Sprachsteuerung.“

Heraus kam als Text:

„Nun teste ich Armer die Sprachsteuerung.“

Das war schon sehr verblüffend.

Die Zukunft

Weiterlesen auf Seite 3/3...

Künftig sind wir alle David Hasselhoff. Und auch sonst gibt es viel Grund zur Vorfreude.

Aber genug von Vergangenheit und Gegenwart. Kommen wir zurück in die Zukunft. Denn da wird bekanntlich alles besser und alles das, was laut gestern im Prinzip eigentlich schon heute funktionieren sollte, wird dann sicherlich spätestens morgen wirklich funktionieren. Ehrlich. Keine Werbelüge. Die Zukunft wird toll.

Denn in Zukunft werden wir uns mit unseren Computern unterhalten, wie wir das aus Star Trek kennen. So wie Scotty in Star Trek IV versucht, Kontakt mit einem Macintosh aufzunehmen, in dem er in die Maus spricht. Heute könnte er sich immerhin schon mit Siri austauschen.

Mit Sicherheit werden wir auch bald mit unseren Autos sprechen und bestimmt wird dann jemand eine Uhr als Fernsteuerung auf den Markt bringen und dann sind wir alle David Hasselhoff. Brusthaartupets als Sonderzubehör erhältlich.

Und wer freut sich nicht auf Unterhaltung auf hohem Niveau mit einem Computer wie HAL 9000 aus „2001 – Odyssee im Weltraum“. Mit dem kann man dann ganz frei und offen darüber diskutieren, ob die Menschheit nun ausgelöscht gehört oder nicht. Ich denke, das wird alles sehr, sehr schön.

Aber worauf ich mich am meisten freue, ist der Siegeszug der Sprachsteuerung im Alltag. Denn bislang gehen uns Menschen am Nebentisch im Restaurant oder im ICE-Großraumabteil nur mit ihren sinnlosen und lauten Handytelefonaten auf den Geist. Dazwischen aber gibt es Pausen mit Stille. Was haben uns diese Pausen bislang gestört, wenn niemand ungefragt aller Welt mitgeteilt hat, wie bescheuert er den eigenen Chef findet, dass die Hamörrhoiden-Salbe endlich anschlägt oder dass man die neue Praktikantin aus der Buchhaltung rumgekriegt hat und die Frau nichts erfahren darf. In Zukunft können wir uns alle endlich intensiv mit unseren Smartphones unterhalten und dann sind auch diese Pausen mit Stille Vergangenheit.

Konsequent zu Ende gedacht wird das alles sogar noch besser. Denn nicht nur Menschen und Maschinen können sich künftig unterhalten, sondern natürlich auch Maschinen mit Maschinen. Roboter können ganz viel dummes Zeug quasseln, so wie hier C3PO und R2D2 aus Star Wars.

Ich finde diesen Ausblick auf die Zukunft so großartig, dass ich derzeit intensiv nach Hütten im norwegischen Hochgebirge suche. Falls da jemand einen Tipp hat, darf man mich gerne ansprechen.

Auch das wird toll: Lebensnahe Computer haben künftig Launen wie Menschen. Oder wie Katzen.

Was ich mir von den Ingenieuren dort draußen aber tatsächlich erhoffe, ist noch mehr Wirklichkeitsnähe bei den künstlichen Gesprächspartnern. Mit Siri soll man ja laut Werbung schon Dialoge führen können. Noch besser fänd ich es, wenn Computer, Automaten und andere Maschinen auch einfach mal Launen hätten. So wie Menschen eben auch. Oder Katzen. Vor allem Katzen. Das würde die Kommunikation jedenfalls an vielen Stellen viel natürlicher erscheinen lassen und darum geht es doch.

Man stelle sich vor: Fahrkartenautomaten wären dann beispielsweise zur Hauptverkehrszeit genervt und einsilbig. Geldautomaten würden versuchen, einem tolle neue Anlagemodelle anzudrehen oder einen günstigeren Stromtarif. Süßigkeitenautomaten könnten bei übergewichtigen Kunden einen Apfel statt des gewünschten Kitkat ausgeben und sich dann gemeinsam mit dem Getränkeautomaten darüber lustig machen.

Oder nehmen wir Google. Statt der Suchergebnisse bekäme man dann vielleicht die Antwort: „Das suchst du jetzt schon zum dritten Mal innerhalb einer Woche, du Depp. Wie dumm bist du eigentlich?“ Oder auch: „Wenn dir meine Suchergebnisse nicht passen, geh doch zum Bing.“ Oder natürlich: „Hey, das hat jetzt mit deiner Suche nichts zu tun, aber hast du schon Google+ ausprobiert? Das ist wirklich ganz, ganz toll. Und es ist überhaupt keine Geisterstadt. Wenn du noch dazukommst, sind wir schon zwei. Bitte, bitte komm! Hilfe, ich bin so einsam.“

Und das ist dann vielleicht doch der Moment, wo wir merken, dass Gespräche mit Maschinen nicht alles sind. Wir erkennen, was wir am Leben haben und wie wertvoll unsere Existenz ist. Wir erkennen, dass nur zwischenmenschliche Beziehungen das einzig Wahre sind.

Und dann rufen wir, voller Freude: „Schatz, bring mich Bier!“

Schlagworte zu diesem Artikel

Kommentare

  • Tom BPunkt

    18.06.12 (06:41:32)

    Köstlich! Danke. :)

  • Jan Tißler

    18.06.12 (11:44:03)

    Danke fürs Lob :)

  • paulchen

    19.06.12 (20:37:50)

    Dem kann ich nur zustimmen. Sehr gut :)

  • Tribleeye

    22.06.12 (07:30:21)

    Aus der Seele gesprochen und genial zu Papier gebracht. Sehr gut :o)

Diesen Beitrag kommentieren:

Die Kommentare können nur zwischen 9 und 16 Uhr
freigeschaltet werden. Wir bitten um Verständnis.

Um Spam zu vermeiden, schreiben Sie bitte die Buchstaben aus diesem Bild in das nebenstehende Formularfeld:

Das könnte Sie auch interessieren

Förderland-Newsletter

Wissen für Gründer und Unternehmer