Vision-Language-Modelle für Edge-Geräte: Kaskadierte Modelle für höhere Zuverlässigkeit
über
Vision-Language-Modelle (VLMs) sind generative KI-Modelle, die sowohl Bilddaten als auch Textanweisungen verarbeiten. Einige der neuesten VLMs lassen sich inzwischen auch auf kostengünstiger Edge-Hardware implementieren, etwa auf der RUBIK-Pi-3-Plattform. Diese verfügt über mehrere Beschleuniger, die es ermöglichen, ein VLM und ein Objekterkennungsmodell gleichzeitig auszuführen. Dadurch wird eine Technik namens Modellkaskadierung ermöglicht, die Zuverlässigkeit und Leistung bei komplexen Edge-KI-Anwendungen deutlich verbessert.
Im letzten Jahr haben wir eine Konvergenz von zwei Technologien beobachtet, die völlig neue Wege zur Entwicklung von Edge-KI-Anwendungen ermöglichen. Die erste ist die Leistung von Edge-Hardware. Einplatinencomputer zu einem niedrigen Preis sind jetzt mit leistungsstarker Hardwarebeschleunigung in Form von GPUs (Grafikprozessoren) für all...
