Kein Eingriff: Amazon-Mitarbeiter lauschen wenigen Alexa-Aufnahmen
Wie Amazon bestätigt, hören sich Mitarbeiter des Unternehmens einen sehr kleinen Teil der Audioaufnahmen an, die aufgenommen werden, wenn eine Frage oder ein Befehl an die Sprachassistentin Alexa auf einem Echo-Lautsprecher gestellt wird. In fast allen Fällen höre jedoch nur die automatische Spracherkennung zu.
Einem Bericht von Bloomberg zufolge beschäftigt Amazon weltweit tausende Mitarbeiter, die die Spracherkennung der Sprachassistentin Alexa verbessern sollen. Diese Mitarbeiter würden sich hierfür auch eine sehr kleine Anzahl von Audioaufnahmen anhören, die beim Nutzer zuhause aufgenommen wurden. Die Aufnahmen werden transkribiert, kommentiert und dann zurück in das System gespielt, um das Verständnis für die menschliche Sprache und die Antworten von Alexa zu verbessern. Ein kleiner Teil des Lernprozesses bedürfe immer noch menschlicher Hilfe.
Mitarbeiter schicken lustige Aufnahmen im Team umher
Ein Mitarbeiter bearbeite demnach bis zu 1.000 Audioaufnahmen pro Tag, wobei vorab auch gezielt nach Äußerungen der Kunden gefiltert wird – beispielsweise nach Anfragen, die „Taylor Swift“ enthalten, um zu prüfen, ob die Musikerin gemeint war. Immer wieder hören die Mitarbeiter allerdings auch Aufnahmen, die der Echo-Nutzer voraussichtlich nicht mit anderen Personen teilen wollen würde, zu deren unverfänglicheren Beispielen etwa der von Alexa zufällig aufgenommene, schlechte Gesang unter der Dusche zählt. Über ein internes Chat-System teilen die Mitarbeiter Audioaufnahmen, wenn sie Probleme haben, bestimmte Wörter zu verstehen – oder auf besonders amüsante Aufnahmen stoßen, die sie mit anderen teilen möchten, so Bloombergs Quellen.
Amazon sieht sich auch bei sexuellen Übergriffen nicht in der Pflicht
Zwei Mitarbeiter sollen auch gesagt haben, dass auf Aufnahmen, die ihrer Meinung nach einen sexuellen Übergriff festgehalten haben, von Amazon nach interner Meldung nicht reagiert wurde, weil dies nicht Aufgabe des Unternehmens sei. Bei kritischen persönlichen Informationen wie etwa zufällig aufgenommene Bankdaten, sollen die Mitarbeiter eine Checkbox markieren, dass die Aufnahme solche Informationen enthält, und zur nächsten Aufnahme springen.
Ein Sprecher von Amazon gab gegenüber Bloomberg an, dass man die Privatsphäre und die Sicherheit der persönlichen Daten der eigenen Kunden sehr ernst nehme. Man kommentiere nur einen sehr kleinen Teil der Alexa-Sprachaufnahmen, um den Dienst für den Kunden zu verbessern.
We take the security and privacy of our customers’ personal information seriously. We only annotate an extremely small sample of Alexa voice recordings in order [to] improve the customer experience. For example, this information helps us train our speech recognition and natural language understanding systems, so Alexa can better understand your requests, and ensure the service works well for everyone.
We have strict technical and operational safeguards, and have a zero tolerance policy for the abuse of our system. Employees do not have direct access to information that can identify the person or account as part of this workflow. All information is treated with high confidentiality and we use multi-factor authentication to restrict access, service encryption and audits of our control environment to protect it.
Amazon gegenüber Bloomberg
Aufnahmen sind für Mitarbeiter nur teilweise anonymisiert
In den Datenschutzeinstellungen von Alexa haben Nutzer die Möglichkeit, der Nutzung ihrer Sprachaufnahmen zur Entwicklung neuer Funktionen zu widersprechen. Darüber hinaus enthalten die Aufnahmen, auf die die Mitarbeiter zugreifen können, keine persönlichen Daten des Nutzers wie den vollständigen Namen oder die Anschrift. Den Mitarbeitern soll es nicht möglich sein, den Nutzer zu identifizieren. Allerdings sind eine Account-Nummer, der Vorname und die Seriennummer des Endgeräts hinterlegt.
Auch Google und Apple hören sich Aufnahmen an
Auch Google greift auf das manuelle Trainieren des Google Assistant zurück und hört sich hierfür Aufnahmen der Nutzer an. Allerdings sind diese, so Google, mit keinerlei Daten des Nutzers mehr verknüpft. Darüber hinaus würden die Aufnahmen vor der Anhörung durch Mitarbeiter verzerrt, um den Nutzer zusätzlich zu schützen.
Apple speichert die Audioaufnahmen von Siri mit Zuordnung zu einem Nutzer für sechs Monate, um das System zu trainieren. Nach diesen sechs Monaten werden die Zuordnungen zum Nutzer entfernt und die Aufnahmen für maximal weitere zwei Jahre gespeichert, um Siri zu verbessern – auch unter menschlicher Mitarbeit.