Als treuer Elektor-Leser sind werden Sie sich daran erinnern, dass am Ende des letzten Jahrhunderts computerbasierte Kommunikation per Sprache DAS Thema war. Wir sprechen heute aber nicht mehr nur von Heimautomation, Sprachunterstützung oder künstlicher Intelligenz. Heute ist die Spracherkennung in einem ganz anderen Umfeld aktiv. Im Juni 2018 veröffentlichte Amazon endlich auch die französische Version seines Flaggschiffs Alexa. Französisch wird zwar von einer wachsenden Zahl Menschen mehr oder minder gesprochen, ist aber auch für Algorithmen und KI nach wie vor eine schwer beherrschbare Sprache.

Voice HAT for Raspberry PiEin Karton mit Big Brother drin

Das von Elektor-TV ausgewählte Video dreht sich um das Google AI Voice Kit, mit dem Google "seine" KI in den Dienst der sprachlichen Kommunikation zwischen Mensch und Maschine stellen will. Man muss sich zwar über die Motive dieser "Großzügigkeit" von Google Gedanken machen – trotzdem ist das eine interessante Sache. Dieser Bausatz ist eher unscheinbar, da er in einem bescheidenen Karton daher kommt. Aber lassen Sie sich nicht durch den Schein täuschen: Seine Möglichkeiten sind enorm, quasi unbegrenzt, wenn man Google glauben darf. Die Funktion der Spracherkennung besteht darin, alle üblichen Schnittstellen zu eliminieren: Tasten, Tastaturen, Mäuse und Joysticks. Der Mensch kommuniziert direkt mit der KI-Software. Eine beeindruckende Erfahrung!

Das Google AI Voice Kit ist für Raspberry Pi entwickelt worden. Es ist ein HAT für RPi. Und es eröffnet wirklich neue Horizonte. Das Kit wird mit einer vollständigen Bedienungsanleitung geliefert. Um loszulegen, benötigen Sie lediglich einen RPi 3B(+) mit einer guten Stromversorgung (2 A) und einer SD-Speicherkarte.
 

Nicht bloß ein Gadget!

Der Hinweis ist wichtig, dass in der Box und auf dem HAT selbst nicht viel passiert. Zusammen bilden sie eine Schnittstelle, einerseits zum Lautsprecher und Mikrofon, andererseits zum Internet. Dort befindet sich Google und seine KI namens "& Sound". Das Entscheidende passiert also in der Cloud, auf den Servern von Google. Wenn die von Google verarbeiteten Sprachbefehle als Antwort in Ihrem Karton einlaufen, werden sie dort in ein Audiosignal umgewandelt und per Lautsprecher ausgegeben.

Als Anleitung für dieses außergewöhnliche Kit sind die folgenden zwei Video-Tutorials besonders empfehlenswert: