Es ist lange Zeit her, als wir Computer noch mit Lochkarten füttern mussten. Doch der heilige Gral der Mensch-Computer-Interaktion ist noch immer in weiter Ferne: Das schlichte Kommunizieren mit Computern so, wie wir es auch mit anderen Menschen machen – per Sprache, Mimik und Gestik.

Bei Mensch-Maschinen-Schnittstellen hat die Spracherkennung auf der Basis von Audiodaten gewaltige Fortschritte gemacht. Dies sieht man an den Fähigkeiten von Apples Siri und an Googles Now. Ihre Spracherkennung bzw. die Umwandlung von Sprache in Text funktioniert nahezu in Echtzeit. Doch könnte die maschinelle Spracherkennung durch den Einbezug des Lippenlesens noch deutlich verbessert werden, denn schließlich hilft dies auch Menschen, wenn sie das Gesprochene des Gegenübers nicht richtig verstehen. Leider aber ist es mit der optischen Spracherkennung nicht so weit her. Jetzt aber haben zwei Wissenschaftler hierzu völlig neuartige Methoden vorgestellt.

Weiterlesen im englischen Originalartikel >>