Wir alle kennen die Sprachbefehle für intelligente Geräte wie „Alexa“, „Hey Siri“ oder „Okay, Google“. Doch wie funktioniert das eigentlich? Dieser Vorgang wird als Keyword Spotting oder Audioklassifikation bezeichnet und ist ein Verfahren des maschinellen Lernens, das hörbare Ereignisse – insbesondere Sprache – erkennen kann, selbst wenn im Hintergrund andere Geräusche oder Gespräche stattfinden.

Keyword-Erkennung

Hier lernen Sie, wie Sie mit Edge Impulse ein Keyword-Spotting-Modell erstellen. Wir erfassen Audiodaten von Mikrofonen, nutzen Signalverarbeitung, um die wichtigsten Informationen herauszufiltern, und trainieren ein tiefes neuronales Netz, das erkennen kann, ob Ihr Schlüsselwort in einem bestimmten Audioausschnitt enthalten ist. Abschließend wird das System auf ein Embedded-Gerät übertragen, und wir bewerten, wie gut es funktioniert. Am Ende dieses Tutorials haben Sie ein fundiertes Verständnis davon, wie Sie mit Edge Impulse Audio klassifizieren können.

Es gibt...