SaxnPaule
Fleet Admiral
- Registriert
- Okt. 2010
- Beiträge
- 10.073
Hallo Community,
ich habe etwas mit dem Assistant von Home-Assistant rumgespielt und die Voice Control mit Whisper, Piper und OpenWakeWord eingerichtet.
So lange die Sprache auf Englisch eingestellt ist, funktioniert die Speech-To-Text Erkennung und somit das Ausführen von Kommandos ziemlich gut.
Ändert man die Sprache jedoch auf Deutsch, liegt die Speech-To-Text Trefferquote bei gefühlt <5%. So wie ich es gesehen habe bietet Whisper kein deutsches LLM. Bei Verwendung des medium LLM funktioniert zwar die Erkennung deutscher Sprache deutlich besser (nicht zufriedenstellend), allerdings dauert das auf einem NUC mit i5-6260U und 8GB Ram über 10 Sekunden, was nicht alltagstauglich ist. Es liegt jedoch kein Hardwarelimit vor. CPU Auslastung steigt während der Erkennung auf 15%.
Hat jemand von euch schon Erfahrungen mit lokaler Sprachsteuerung in Kombination mit Home-Assistant gemacht? Gibt es bereits brauchbare Lösungsansätze für die Sprachsteuerung auf deutsch?
Ich möchte explizit keine Cloud Lösung, sondern eine, bei der die Daten mein lokales Netzwerk nicht verlassen!
ich habe etwas mit dem Assistant von Home-Assistant rumgespielt und die Voice Control mit Whisper, Piper und OpenWakeWord eingerichtet.
So lange die Sprache auf Englisch eingestellt ist, funktioniert die Speech-To-Text Erkennung und somit das Ausführen von Kommandos ziemlich gut.
Ändert man die Sprache jedoch auf Deutsch, liegt die Speech-To-Text Trefferquote bei gefühlt <5%. So wie ich es gesehen habe bietet Whisper kein deutsches LLM. Bei Verwendung des medium LLM funktioniert zwar die Erkennung deutscher Sprache deutlich besser (nicht zufriedenstellend), allerdings dauert das auf einem NUC mit i5-6260U und 8GB Ram über 10 Sekunden, was nicht alltagstauglich ist. Es liegt jedoch kein Hardwarelimit vor. CPU Auslastung steigt während der Erkennung auf 15%.
Hat jemand von euch schon Erfahrungen mit lokaler Sprachsteuerung in Kombination mit Home-Assistant gemacht? Gibt es bereits brauchbare Lösungsansätze für die Sprachsteuerung auf deutsch?
Ich möchte explizit keine Cloud Lösung, sondern eine, bei der die Daten mein lokales Netzwerk nicht verlassen!
Zuletzt bearbeitet: