Amazon: Daten von Alexa-Aufnahmen leben trotz Löschung weiter
Jetzt ist es amtlich: Amazon hat bestätigt, dass über den Alexa-Assistenten erstellte Sprachaufnahmen sowie zugehörige Protokolle so lange gespeichert werden, bis der Anwender eine Löschung veranlasst. Doch selbst dann ist nicht sicher, dass die nicht anonymisierten Daten vollständig von den Amazon-Servern verschwinden.
Amazon antwortet auf besorgte Anfrage eines US-Senators
In Sorge um die Frage, ob Amazon Protokolle (transcripts) der über den Alexa-Sprachassistenten getätigten Sprachaufnahmen von Anwendern ohne Frist speichert, hatte sich der demokratische US-Senator Chris Coons (Delaware) Ende Mai mit einem Schreiben direkt an Amazon-Chef Jeff Bezos gewandt. Der Anfrage ging ein Bericht von Cnet voraus, in dem behauptet wurde, dass Amazon die Protokolle in Textform selbst nach Löschung der Aufnahmen durch den Nutzer weiterhin speichert. Die von Amazons Vice President Brian Huseman unterzeichnete Antwort an Senator Coons wurde nun veröffentlicht (PDF).
Alexa-Aufnahmen werden ohne Zeitlimit gespeichert
Darin erklärt Amazon zunächst, dass Aufnahmen wie Protokolle solange gespeichert werden, bis der Kunde entscheide, diese zu löschen. Andernfalls ist das Speichern der Daten also unbefristet und somit theoretisch unendlich. Über die Verlaufsfunktion der Alexa-App könne der Kunde einzelne oder alle Aufnahmen einsehen und auch löschen. Wird eine Sprachaufzeichnung vom Anwender gelöscht, würden auch die Abschriften in Textform von „allen primären Storage-Systemen“ in Amazons Server-Netzwerk entfernt.
Protokolle lassen sich nicht vollständig löschen
Doch macht Amazon klar, dass die Daten noch auf anderen Servern verweilen können. „Wir sind ständig bemüht, sicherzustellen, dass diese Transkripte in keinem der anderen Speichersysteme von Alexa verbleiben“, erklärt Amazon lediglich. Zudem könnten Daten über Interaktionen mit Alexa sowie von Alexa ausgeführten Aktionen trotz aller Löschbemühungen erhalten bleiben: „Wir speichern die Audiodaten von Alexas Antwort nicht. Wir können jedoch noch andere Aufzeichnungen über die Alexa-Interaktionen der Kunden, einschließlich Aufzeichnungen über Maßnahmen, die Alexa als Reaktion auf die Anfrage des Kunden getätigt hat, behalten. Und wenn ein Kunde mit einem Alexa-Skill interagiert, behält dieser Skill-Entwickler möglicherweise ebenso Aufzeichnungen der Interaktion.“
Folglich ist das vollständige Löschen aller Aufzeichnungen durch Alexa für Kunden überhaupt nicht möglich. Und auch Skill-Entwickler könnten Daten nicht nur zur Bearbeitung von Anfragen, sondern dauerhaft vorhalten.
Daten laut Amazon zur Verbesserung von Alexa nötig
Die Frage, warum die Transkripts überhaupt gespeichert werden, beantwortet Amazon damit, dass dies nötig sei, um die Dienste zu verbessern. Mittels Machine Learning würden die Daten genutzt, um unter anderem die Spracherkennung zu verbessern: „Um gut zu funktionieren, müssen maschinelle Lernsysteme mit realen Daten trainiert werden.“ Dies sei auch ein Grund dafür, dass generell auch Sprachaufnahmen gespeichert werden.
Die Aufzeichnungen sollen außerdem für Transparenz beim Kunden sorgen, indem dieser im Verlauf sämtliche Interaktionen mit Alexa nachvollziehen kann: „Mit der Sprachverlaufsfunktion von Alexa können Kunden das eigentliche Audio abspielen, das in die Cloud gestreamt wurde, sich das Protokoll darüber ansehen, was der Kunde nach Ansicht von Alexa sagte, sowie Alexas Antwort lesen. Das hilft Kunden zu verstehen, wie Alexa funktioniert.“
Diese Transparenz für Kunden bedeutet aber auch, dass die Daten nicht anonymisiert gespeichert werden, sondern explizit dem jeweiligen Kundenkonto zugeordnet sind.