Microsoft 365: Office-Dokumente der Kunden werden nicht für KI-Training verwendet

Andreas Frischholz
37 Kommentare
Microsoft 365: Office-Dokumente der Kunden werden nicht für KI-Training verwendet
Bild: Microsoft

Microsoft nutzt keine Kundendaten aus den Microsoft-365-Apps, um die KI-Modelle zu trainieren. Das stellte der Konzern nochmals öffentlich klar, nachdem zuvor der Verdacht in sozialen Medien die Runde machte. Ausschlaggebend für die Vorwürfe sind vage Beschreibungstexte in den Datenschutzeinstellungen.

Wie The Verge berichtet, war die Klarstellung aufgrund der „Verbundenen Erfahrungen (engl. „connected experiences“) notwendig. Diese finden sich etwa in Word unter den „Datenschutzeinstellungen“, auf die man in den Optionen über den Reiter „Allgemein“ zugreifen kann. Wer dort scrollt, kommt zu den „Verbundenen Erfahrungen“.

Unter dem Punkt „Erfahrungen, die ihren Inhalt analysieren“ heißt es dann, dass Inhalte der Nutzer verwendet werden, um etwa verbesserte Empfehlungen anzeigen zu können. Ebenso kann Office die Erlaubnis erhalten, über die verbundenen Erfahrungen nach Online-Inhalten wie Bildern zu suchen.

Microsoft 365: Datenschutz-Einstellungen zu den „Verbundenen Erfahrungen“
Microsoft 365: Datenschutz-Einstellungen zu den „Verbundenen Erfahrungen“

Beides ist standardmäßig aktiviert. Und die Beschreibungstexte schließen das KI-Training nicht explizit aus, was beim Schlagwort „Ihren Inhalt analysieren“ aber durchaus heikel ist. Weitere Verwirrung stiftete zudem eine Übersicht der „Verbundenen Erfahrungen“.

Unternehmen wollen auch Nutzerdaten für die KI-Entwicklung

Die Konsequenz ist nun eine öffentliche Klarstellung. Als Reaktion auf einen X-Beitrag mit den Vorwürfen erklärte Microsoft, keine Inhalte aus Microsoft-365-Apps für das Training der Large Language Models (LLM) zu verwenden. Ebenso äußerte sich Microsofts Kommunikationschef Frank Shaw auf Bluesky.

Während der Konzern also beschwichtigen will, bleibt das grundsätzliche Thema omnipräsent: Die KI-Entwickler wollen rigoros Daten sammeln und nehmen auch Nutzerdaten ins Visier. Microsoft selbst lieferte erst im September ein Beispiel. Wie Windows Central berichtete, wurde das Business-Netzwerk LinkedIn still und leise um Feature ergänzt, um Daten für generative KI-Systeme zu sammeln. Standardmäßig ist es aktiviert, Nutzer müssen es also selbst deaktivieren. In der EU wurde es übrigens nicht freigeschaltet, ausschlaggebend waren scheinbar der AI Act und der Digital Markets Act (DMA).

Weil diese Regelwerke das Datensammeln für KI-Dienste erschweren, hat Meta aber bereits verkündet, dass bestimmte KI-Features vorerst nicht in der EU erscheinen. Dazu zählt etwa der Chatbot Meta AI.

Bei ChatGPT ist das Modell-Training mit Nutzerdaten von Anfang ein Thema. Eine Konsequenz war, dass Konzerne wie Apple und Samsung den Mitarbeitern zeitweise untersagten, mit dem AI-Chatbot zu arbeiten. Die Sorge war, dass so sensible Firmendaten in fremde Hände gelangen können. Mittlerweile bietet OpenAI Geschäftstarife für ChatGPT an, in denen klargestellt wird, dass Eingaben nicht für das Training der Modelle verwendet werden.