"Alexa, was ist die Hauptstadt von Litauen?"
Wenn Kinder nicht mehr im Buch nachschlagen, sondern digitale Assistenten fragen, hat Spracherkennung im Alltag Einzug gefunden. Werden wir Systeme, von denen wir nur den Vornamen kennen, in unsere Unterhaltung am Küchentisch einbinden? Wird das Auto zur "fahrenden Siri"? Ist Sprechen das neue Wischen, Drücken und Tippen? APA-Science hat nachgefragt.
"Sprache wird zunehmend von Systemen verstanden. Ob das die Zukunft der Mensch-Maschine-Interaktion ist, lässt sich schwer sagen, vor allem weil dazu noch einige Schritte notwendig sind - etwa in Hinblick auf soziale Aspekte", erklärte Stephan Schlögl, Assistant Professor am Management Center Innsbruck (MCI), im Gespräch mit APA-Science. "Sprache ist - vor allem seit Beginn der Forschung zu Künstlicher Intelligenz - das zentrale Medium, das wir aus Forschungssicht knacken wollen. Langsam sind wir in der Lage, das auch zu tun", so Schlögl.
Alexa und Co. begegnen uns bereits in zahlreichen Bereichen des Alltags. Morgens wird abgefragt, ob man untertags einen Regenschirm braucht, im Auto entsteht eine Art schlauer Beifahrer, der hilft, organisiert und vorausdenkt und auch im Kontakt mit dem Kundenservice ist das Gegenüber oft nicht mehr menschlich. "Was ihnen in der Regel jedoch fehlt, ist sogenannte soziale Intelligenz - eine Anzahl von menschlichen Charakteristiken an denen sich die Technologie bisweilen noch die Zähne ausbeißt", konstatierte Schlögl.
So natürlich und logisch Sprache sei: Viele Menschen - vor allem ältere - hätten eine Hemmschwelle mit einem Computer zu reden. Und noch seien die Systeme auch nicht sonderlich intelligent. "Man muss sich im Vorfeld überlegen, was man sagt, viel mehr als bei einem normalen Gesprächspartner, der gezielt nachfragen kann, wenn er etwas nicht versteht", sagte der Experte. "Ich muss die Interaktion lernen, was ja eigentlich diesem Natürlichen ein bisschen widerspricht", erklärte Schlögl. Besonders schwierig sei der Dialog mit Systemen, die kein Ziel - etwa einen Flug zu buchen - haben: "Der Computer weiß dann nicht genau, was er nachfragen soll, weil er eigentlich kein Verständnis aufbaut."
Vom "Wow-Effekt" zum Befehlston
Auch bei gängigen Sprachassistenten wie Alexa von Amazon und Siri von Apple würden sich die Anwender schon im Vorfeld die Befehle überlegen. Zuerst gebe es beim Ausprobieren einen "Wow-Effekt", sehr schnell neige man aber zur Befehlsform, weil das kürzer und einfacher sei: "Alexa, mach das!" Mit einem Menschen würde man nicht so sprechen. "Das ist ein sozialwissenschaftlich interessanter Aspekt, dass es anders ist mit einer Maschine zu sprechen als mit einem Menschen und wahrscheinlich immer sein wird", so Schlögl, der derzeit den Aspekt der sozialen Intelligenz untersucht.
Er geht davon aus, dass entsprechende Systeme Einzug in unseren Alltag halten werden. Voraussetzung dafür sei, dass man das Thema Datenschutz in den Griff bekomme. Sprachtechnologie benötige Daten, um zu funktionieren. "Wenn wir damit umgehen können, dann wird das Gespräch mit Alexa und Co. am Küchentisch kommen." Derzeit untersuche man, wie man Sprachsteuerung im Unternehmensbereich einsetzen könnte - etwa bei der Steuerung von Industrierobotern. Aufgrund des Lärms in der Fabrik sei hier die Fehleranfälligkeit aber noch hoch.
Gesprächspartner für ältere Personen
Digitale Assistenten müssten sozial erträglicher und akzeptierter werden, wenn sie zusätzliche Funktionen übernehmen sollen, sagte der Wissenschafter. Dann könnten sie beispielsweise als Gesprächspartner in der Altenbetreuung eingesetzt werden, auch wenn das nicht an die Kommunikation mit den Enkelkindern oder guten Freunden rankomme. Dass ältere Menschen eine Art Beziehung zu Maschinen aufbauen könnten, habe aber schon der Roboterhund Aibo gezeigt. Man könnte auch soziale Agenten sozusagen als Ghostwriter einsetzen, die die Lebensgeschichten von älteren Personen aufzeichnen.
"Das hätte zwei Effekte: Durch das Erzählen könnte bis zu einem gewissen Grad der Demenz vorgebeugt werden und das System könnte dadurch lernen. Das braucht es auch, um zu einem gewissen Grad intelligent zu werden und seine Funktionen zu erweitern. Alles in allem wäre das ein Gewinn für die Technik und für den Menschen", gab sich der Experte überzeugt. "Wir haben eine alternde Gesellschaft - und so schrecklich es klingt - die Angehörigen haben oft nicht viel Zeit, um sich zu kümmern. Technologien, die das Altwerden unterstützen, sind auf dem Vormarsch." Von echten Unterhaltungen sei man derzeit noch einen Schritt weit weg, Sprachsteuerung könnte aber schon dazu verwendet werden, um gewisse Kognitionsfähigkeiten zu trainieren.
"Mit Siri, Alexa, Cortana und Co. ist begonnen worden, Kernbereiche der Informatik aufzubrechen, indem die Technologie zu den Endusern gebracht wurde. Davor war das in irgendwelchen Labors. Jetzt hat man die Möglichkeiten zu optimieren", sieht Schlögl große Fortschritte. Noch gebe es aber einige Hürden zu überwinden: "Vom heiligen Gral, ein System zu schaffen, das selbstständig denkt und lernt, und sich durch das dem Menschen Ureigenste - nämlich Sprache - auszeichnet, da sind wir weiter weg als manche denken", so der Forscher.
Von Stefan Thaler / APA-Science