Sprache und KI: "Es fehlt die zündende Idee"
Was hat Sprachverständnis mit Künstlicher Intelligenz (KI) zu tun? Welche Probleme gibt es bei der maschinellen Übersetzung? Und wie aussagekräftig ist der Turing-Test tatsächlich? Diese Fragen beantwortete Harald Trost, Leiter der "Language Technology Group" am Österreichischen Forschungsinstitut für Artificial Intelligence (OFAI), im Gespräch mit APA-Science.
"Alles begann mit einfachen regelbasierten Systemen. Das hat aber nichts gebracht, weil Sprache zu vielfältig ist und sich letztlich nie 100-prozentig dem Regelansatz beugen wird", so der Experte. Erstens gebe es im gesprochenen Text viele Fehler, mehr als im geschriebenen. Zweitens werde es extrem komplex, wenn man Regelsysteme haben wolle, die die Sprache im Wesentlichen abdecken. Dann müsse man mit Zehntausenden Regeln leben.
"Die vergangenen 20 Jahre hat sich dann ein extremer Wandel vollzogen - von den regelbasierten zu statistischen Methoden. Die liegen zwar auch oft falsch, aber wenn sie falsch liegen, liefern sie trotzdem eine Antwort. Mit etwas Glück ist die Antwort nicht so weit weg von dem was man will", sagte Trost, der am Zentrum für Medizinische Statistik, Informatik und Intelligente Systeme (CeMSIIS) der Medizinischen Universität Wien tätig ist. Das habe erstmalig funktioniert, weil die Computer schnell und groß genug waren. "In den 80ern waren wir froh, dass wir ein Lexikon von 500 Wörtern quasi im Speicher halten konnten. Heutzutage sind es Millionen und Abermillionen."
Hindernisse für maschinelle Übersetzung
Dennoch stoße man in vielen Bereichen auf Hindernisse. "Maschinelle Übersetzung ist zum Beispiel extrem schwierig. Das funktioniert in technischen und administrativen Bereichen nicht schlecht, in der Alltagssprache geht es nicht", erläuterte der Wissenschafter. Problematisch sei, dass an Textdaten und nicht an gesprochener Sprache trainiert werde, "weil es oft keine korrekte Transkription von Millionen von gesprochenen Wörtern gibt". Daher nehme er nicht an, "dass es in den nächsten paar Jahrzehnten ein Computerprogramm geben wird, das so übersetzen kann wie ein guter Übersetzer. Das kann ich mir nicht vorstellen."
Große Datenmengen würden zwar viele neue Felder eröffnen, "aber ob das beim Sprachverstehen viel bringt, da bin ich eher skeptisch, weil es hier eine natürliche Grenze gibt. Wir Menschen hören ja sehr wenig an Sprache und trotzdem funktioniert das Verstehen. Die Datenmengen, die die jetzigen Rechner für diese Sprachverarbeitungsprobleme verwenden, sind viel, viel größer. Deshalb funktionieren sie. Ob sie besser funktionieren, wenn aus viel größer noch viel größer wird, bezweifle ich".
Big Data heiße außerdem nicht, dass ausreichend mit Zusatzinfos versehene Daten verfügbar seien, sondern nur, dass man viele Daten habe. "Aus denen kann man natürlich Muster lernen. Bei der Übersetzung gibt es aber zu wenig parallele Daten, beispielsweise zwischen Deutsch und Kambodschanisch. Da ändert sich also nichts, auch wenn ich die Daten der ganzen Welt hernehme." Man lerne auch nichts, wenn man sich eine fremde Sprache anhöre. "Erst wenn ich die Übersetzung dazu habe, geht das", so Trost. Im Moment sehe er hier keinen qualitativen Sprung. "Es kann schon sein, dass Big Data etwas bringt, aber nur, wenn jemand eine zündende Idee hat - und die habe ich bisher noch nicht gesehen", konstatierte der Experte.
Nachholbedarf in Österreich
Dass dieser Durchbruch in Österreich stattfindet, scheint eher unrealistisch. "Es schaut nicht gut aus. Philips hat an Nuance verkauft (Die Spracherkennungs-Firma Philips Speech Recognition Systems wurde im Jahr 2008 vom US-Unternehmen Nuance Communications übernommen; Anm.), wodurch der Forschungsschwerpunkt in Wien kleiner geworden ist. Der Bereich ist hierzulande aber ohnehin immer ignoriert worden", sagte Trost.
So existiere beispielsweise kein einziger Lehrstuhl, der sich damit beschäftige. "Unser Universitätsinstitut hat das auch nur als kleines Nebenthema", erklärte der Wissenschafter. Das OFAI sei das einzige Institut in Österreich gewesen, das dieses Thema über sehr lange Zeit konsequent mit fünf bis zehn Leuten verfolgt habe. "Daneben gibt es natürlich noch andere, aber das sind zum Gutteil Einzelkämpfer, die das aus persönlichem Interesse machen. Eine lebhafte Szene existiert nicht", so Trost.
Dabei habe die KI-Forschung sehr viel gebracht, wie etwa Spracherkennung oder -synthese, Dialogsysteme oder Information Retrieval. "Da ist unheimlich viel drinnen, wo man vor 30 Jahren gesagt hätte, das ist klar KI. Der Intelligenz-Begriff von damals ist aber nicht mehr state of the art. Ich würde folgende Definition bevorzugen: Ein Teil der KI sind all die Systeme, die Leistungen vollbringen, von denen man gemeint hat, dass sie menschliche Intelligenz erfordern und nicht rein mechanisch machbar sind. Egal, ob die Art und Weise, wie das gemacht wird, nicht doch eine sehr mechanistische ist und nur funktioniert, weil wir jetzt eine irre Menge an Daten verarbeiten können", erklärte er.
Schummelei beim Turing-Test
So sei ihm der Turing-Test, mit dem festgestellt werden soll, ob eine Maschine für einen Beobachter von außen von einem Menschen unterscheidbar ist, am Anfang ziemlich plausibel erschienen. "Mittlerweile glaube ich nicht mehr, dass er tatsächlich eine Entscheidung liefert, ob etwas intelligent ist oder nicht. Es ist inzwischen klar, dass eigentlich alle diese Programme nicht intelligent sind, sondern sich nur mit viel Intelligenz des Entwicklers herumschummeln, damit es so ausschaut als ob", ist Trost überzeugt.
Ein Erfolg der KI sei, "dass Sachen, die in Forschungsprojekten über Jahrzehnte ausprobiert worden sind, jetzt so weit sind, dass das von der Industrie aufgegriffen wird und wirklich Produkte daraus entstehen. Was Siri (Sprachassistentin von Apple, Anm.) kann, ist überhaupt nichts Neues. Das ist die Technologie von vor fünf oder zehn Jahren, die jetzt tatsächlich bis zum Endkunden gebracht wurde. Neu ist nur das Produkt".
Sprachverstehen sei eine Komponente in einem System, aber nie ein Alleinstellungsmerkmal, warum man etwas kauft - Diktiersysteme und Übersetzung ausgenommen. "Es ist etwas, das viele Produkte besser und benutzerfreundlicher macht. Aber nicht das, womit man eine Menge Geld verdient. Und das verhindert natürlich auch, dass da viele Unternehmen aufspringen", sagte Trost.
Von Stefan Thaler / APA-Science
Das könnte Sie auch interessieren
Partnermeldung
BOKU-Rektorin Eva Schulev-Steindl einstimmig wiederbestellt
Partnermeldung
BM Polaschek: Studienbeihilfe für 2024/25 kann noch bis 15. Dezember beantragt werden
Partnermeldung