All das fing vor einigen Jahren mit Siri von Apple an. Dieser „intelligente“ persönliche Assistent war plötzlich im iOS von Apples Smartphones und Tablets eingebaut. Natürlich konnte das die Konkurrenz nicht auf sich sitzen lassen und zog nach. Microsoft brachte Cortana, Google seinen Assistant und Samsung dann Viv. Alle haben ihre Stärken und Schwächen, doch werden sie wohl in Zukunft immer besser. Überraschenderweise hat Alexa, der Nachzügler von Amazon, das Potential sie alle zu schlagen.

Zuerst als Bestandteil des extrem erfolgreichen sprachgesteuerten Lautsprechers „Echo“ samt Verwandtschaft (Echo Dot und Tap) implementiert, zeigte sich Alexa auf der CES 2017 in Las Vegas schon in gut 30 Produkten. Die Sprachbegabung erschöpft sich dabei nicht darin, Text hörbar zu machen, sondern in der Steuerbarkeit durch gesprochene Sprache. Man sagt „spiele Elvis“ und die Kiste spielt Elvis.

Der Erfolg von Alexa hat wohl mit der Offenheit des Konzepts zu tun. Wo Siri und Cortana zumindest zu Anfang komplett abgeschottet waren, gibt es für Alexa von Anfang an eine offene Plattform, was diverse Entwickler dazu motiviert hat, „skills“ hinzuzufügen. Ein Skill ist einfach eine neue Funktion, wie etwa die Direktbestellung von Pizza oder die Änderung der Lichtfarbe einer Beleuchtung, indem man dies einfach befiehlt. Google Assistant ist ebenfalls offen und erlaubt die Entwicklung von „actions“ durch Dritte. Durch den Erfolg von Alexa sahen sich Microsoft und Apple seit kurzem genötigt, einen Entwicklerzugang zu Cortana und Siri zu schaffen.

Anders als Siri und Cortana, die zumindest teilweise auf die Rechenleistung der Mobilgeräte setzen, vertraut Alexa voll auf die Server von Amazon für ihre Dienste. Letzteres erlaubt einfachere Elektronik mit Sprachsteuerung für alle möglichen Geräte. Der Fokus auf die Cloud erzwingt logischerweise eine permanente Internetverbindung.

Ein System, das Alexa-Services nutzt, muss immer zuhören und erwacht dann, wenn das Wort „Alexa“ gesprochen wird. Das Trigger-Wort kann durch den Anwender auch geändert werden. Ab dann beginnt eine Audio-Aufzeichnung und die parallele Übertragung des registrierten über das Internet zum verarbeitenden Server. Diese Daten werden außerdem für weitere Zwecke wie etwa die Verbesserung der Spracherkennung gespeichert. An diesem Punkt kommt die Privatsphäre und ihre mögliche Verletzung ins Spiel. Ein Gerät, dass gesprochene Sprache aus privaten Unterhaltungen registrieren und ins Internet übertragen kann, ist prinzipiell dazu in der Lage, die Privatsphäre zu verletzen. Nicht nur staatliche Stellen, sondern auch Hacker könnten Interesse daran haben, so eine interessante Datenbasis zu infiltrieren und unangenehme Dinge daraus zutage fördern.

Laut Amazon wurden bisher alle Anfragen bezüglich Zugriff auf diese Daten zurückgewiesen. Doch wie lange noch? Und was passiert im Geheimen? Zwar können Anwender ihre Aufzeichnungen löschen, doch wenn man das tut, beschädigt man auch die Leistungsfähigkeit seines digitalen Assistenten, weshalb das nur wenige Leute machen werden.

Aristotle von Mattel ist ein Beispiel eines erweiterten Alexa-Systems, das auf das Trigger-Wort „Aristotle“ hört und für die Interaktion mit Kindern konzipiert ist. Hier wird übrigens nicht nur Audio, sondern auch Video aufgezeichnet und auf Smartphones gestreamt.

Sind Sie bereit, Ihre Privatsphäre einer bequemen Pizzabestellung zu opfern? Oder werden Sie lieber Mitglied bei der EWF Voice Privacy Alliance?
Übrigens gab es in Deutschland das erste Einschreiten von Justitia gegen diese moderne Technik. Die spionierende Bluetooth-Puppe „My Friend Cayla“ wurde verboten, denn sie verstößt gegen deutsche Sicherheitsgesetze...