Amazon Echo (Dot) im Test: Ein bisschen Zukunft schon heute
3/6Sprachsteuerung und ESP
„Alexa“, „Echo“ oder „Amazon“
Die Sprachsteuerung ist das zentrale Element von Amazons Echo. Das in Deutschland erhältliche Modell des Echo Dot wurde gegenüber der ersten Variante, die nur in den USA verfügbar war, in dieser Hinsicht überarbeitet, indem Amazon einen neuen Sprachprozessor einsetzt, der auch etwas besser als das Modell im großen Echo sein soll.
Da theoretisch mehrere Echo oder Echo Dot in einem Haushalt zum Einsatz kommen können, stattet Amazon die Geräte mit der sogenannten Echo Spatial Detection (ESP) aus, die verhindern soll, dass auf ein gemeinsames Schlagwort mehrere Echo gleichzeitig reagieren. Durch diese Technik soll immer der Echo (Dot) auf eine Anfrage reagieren, der dem Benutzer am nächsten ist. Möchte der Benutzer explizit zwischen verschiedenen Echo-Geräten unterscheiden, kann er auf einem Echo beispielsweise das Schlagwort „Alexa“ und auf einem anderen das Schlagwort „Echo“ nutzen. Da jedoch nur drei Schlagworte zur Verfügung stehen, ist diese Option begrenzt. Einziger Ausweg ist in diesem Fall die separat erhältliche Sprachfernbedienung für jeden Echo.
In der Praxis funktioniert diese Zuordnung der Stimme zu einem Echo (Dot) aufgrund der Entfernung insbesondere dann gut, wenn beide Geräte in unterschiedlicher Richtung zum Benutzer aufgestellt sind und dieser in die Richtung eines Echos spricht. Werden beide Echo zu nah nebeneinander gestellt oder ist die Richtung nicht eindeutig, reagieren beide Echo auf das Schlagwort, die Auswahl des antwortenden Echo scheint dann jedoch beliebig und es ist nicht immer zwingend der nächstgelegene Echo, der antwortet. Im Alltag ist dies nur selten relevant, da zwei Echos kaum im selben Raum nebeneinander stehen werden, im Zweifel bietet sich aber tatsächlich die Nutzung unterschiedlicher Schlagworte an.
Sprachsteuerung im Alltag
Amazon gibt dem Benutzer zum Start von Echo eine Reihe von Beispielfragen und Sätzen an die Hand, anhand derer Alexa befragt und gesteuert werden kann. Im Test offenbart sich schnell, dass man von diesem Schema noch nicht zu stark abweichen sollte, weil freier gestellte Fragen häufig nicht beantwortet werden können. Schon „Alexa, spiele aktuelle Musik“ führt nicht zum gewünschten Ergebnis, Alexa missachtet diese Anfrage einfach, ohne sie auszuführen oder zu verneinen. „Alexa, spiele ein Liebeslied“ hat zur Folge, dass der Song „Liebeslied“ von Absolute Beginner gespielt wird, auch wenn der Nutzer eher die Gattung als das konkrete Lied im Sinn hatte. „Alexa, spiele Musik aus dem Jahr 2015“ führt zur Antwort „Musik wird zufällig wiedergegeben“, die Playlist enthält dann allerdings nicht nur Musik aus diesem Jahr.
Genauso gibt es jedoch zahlreiche Befehle, die fehlerfrei umgesetzt und problemlos selbst bei etwas undeutlicherer Aussprache erkannt werden. „Alexa, spiele Energy Berlin von TuneIn“ funktioniert ebenso problemlos wie die Wiedergabe ausgewählter Musikstücke von einzelnen Interpreten – den lokalen Radiosender RadioEins vom rbb per Sprache zu starten, resultierte jedoch immer wieder entweder in der Wiedergabe von „Power Radio“ oder in der Antwort „Ich kann den Sender RadioEins vom rbb nicht finden“. Die Steuerung der Heizung in einzelnen Wohnräumen über tado funktioniert hingegen wieder erstaunlich treffsicher und unproblematisch.
Auch die Erkennung des Schlagwortes und gegebenenfalls Reduzierung der Lautstärke von gerade wiedergegebener Musik funktioniert zuverlässig. Ist die Musik allerdings zu laut, muss man als Nutzer schon lautstark gegen die Musikwiedergabe anschreien, um noch Gehör zu finden.
Beim Timer hatte Alexa zunächst erhebliche Probleme
Mit dem Setzen eines Timers hatte Alexa im Test zunächst nachhaltig Probleme. Ein Timer ab 13 Minuten ließ sich ohne Probleme einstellen. Sagte man Alexa jedoch, dass sie einen Timer auf 2, 7 oder 12 Minuten stellen soll, konnte sie die Anfrage nicht verarbeiten. Der Befehl, dass sie den Timer auf 120 Sekunden stellen sollte, wurde hingegen ohne Probleme ausgeführt und Alexa quittierte die Anfrage sogar mit der Ansage, dass der Timer auf „2 Minuten“ gestellt wurde – also jene Zeitangabe, die sie selbst zuvor nicht verstanden hat. Bereits im Laufe des Tests hat sich dieses Verhalten jedoch komplett gewandelt. Plötzlich ist auch die Ansage „Alexa, stelle den Timer auf 2 Minuten“ kein Problem mehr. Hierin zeigt sich, dass Alexa einerseits noch lernen muss und kein finales Produkt ist, andererseits aber auch ständig dazulernt, so dass sich derartige Probleme von selbst lösen können.
Eine Geburtstagsfeier bringt Alexa aus dem Konzept
Bei einer sehr lauten Umgebung mit 20 Personen, die sich unterhalten, enden dann die Fähigkeiten von Alexa und Amazon Echo. Wird das Schlagwort noch gut erkannt, kann Alexa in diesem Fall nicht immer die konkrete Anfrage eindeutig identifizieren und hört so weiter zu, auch wenn der Benutzer selbst mit seiner Anweisung bereits fertig ist, weil im Hintergrund noch andere Personen reden. Dies führt dazu, dass die eigentliche Anfrage nicht mehr analysiert und ausgeführt wird. Es kommt entweder zu völlig falschen Anfragen oder Alexa quittiert die Anfrage mit der Aussage, dass sie diese nicht beantworten könne.
In diesem Fall offenbart sich ein Problem, das aus dem Umstand resultiert, dass Alexa auf Anfragen aller Personen reagieren können soll und nicht einem Nutzer explizit zugeordnet ist, wie es beispielsweise – zumindest in der Theorie – die Assistenten von Google und Apple sind.
Die Sprachsteuerung muss noch lernen, kann es aber wenigstens
Die Sprachsteuerung erkennt und versteht somit bereits vieles, was der Benutzer Alexa zuruft, bei Weitem jedoch noch nicht alles. Ein Grund, warum Amazon den Echo und Echo Dot derzeit nur auf Einladung verschickt und bei jeder Anfrage, die übrigens immer auch als Verlauf in der App erscheinen, um Feedback bittet, ob Alexa die Anfrage richtig verstanden hat. Auch Amazon weiß, dass der Echo im Zusammenspiel mit deutscher Sprache noch etwas in der Beta-Phase steckt.
Der große Vorteil der cloud-basierten Sprachsteuerung ist jedoch gerade, dass sie kontinuierlich lernt und besser wird. Je mehr Nutzer und je mehr Anfragen an Alexa gestellt werden, desto besser wird die Spracherkennung und das Verständnis dafür, was der Benutzer möchte. Genau hierin liegt ein enormer Vorteil der neuen Technik, denn der Benutzer kauft eben nicht mehr nur den Auslieferungszustand und muss sich mit den zu diesem Zeitpunkt gebotenen Möglichkeiten abfinden, sondern erhält immer neue Möglichkeiten und ein Produkt, das sich immer weiter verbessert.