ChatGPT-Entwickler: OpenAI bietet Verlagen Millionen-Beträge für Trainingsdaten

Update Andreas Frischholz
74 Kommentare
ChatGPT-Entwickler: OpenAI bietet Verlagen Millionen-Beträge für Trainingsdaten
Bild: OpenAI

Auf der Suche nach Trainingsdaten befindet sich OpenAI in Gesprächen mit Presseverlagen, um Zugang zu Nachrichtenarchiven zu erhalten. Laut The Information sollen sich die Angebote auf 1 bis 5 Millionen US-Dollar pro Jahr belaufen.

Für Presseverlage könnten sich die KI-Firmen somit zumindest kurzfristig zum Geschäft entwickeln. Denn auch weitere Konzerne haben Interesse an den Daten. Apple will laut Medienberichten für Lizenzen, die allerdings über mehrere Jahre laufen, bis zu 50 Millionen US-Dollar zahlen.

Entscheidend bei solchen Abkommen sind aber Details wie der Umfang der Datennutzung. Wie die New York Times berichtet, sind die Verlage bei Apple etwa noch skeptisch, weil der Konzern weitreichende Rechte einfordert. So erklärten mit den Verhandlungen vertraute Personen, Apple sei noch äußerst vage bei der Frage, wie man die generative AI-Inhalte im Nachrichtengeschäft einsetzen will. Die an den Gesprächen beteiligten Verlage befürchteten daher eine potenzielle Konkurrenz, die durch Apples Marktmacht entstehen könnte.

OpenAI geht Partnerschaften ein

Wie eine umfassende Kooperation aussieht, zeigt derweil der Axel-Springer-Deal von OpenAI. So bekommt OpenAI nicht nur Trainingsdaten, sondern kann die Nachrichten von den Presseangeboten des Verlags in Echtzeit in ChatGPT ausspielen. Zu den Medien zählen neben Bild und Welt auch amerikanische Angebote wie Business Insider und Politico.

Offiziell sind für diesen Deal keine Zahlen bekannt. Die Financial Times meldete aber eine achtstellige Summe – also mehr als 10 Millionen US-Dollar –, die Axel Springer erhalten soll. Was das Abkommen zwischen OpenAI und Axel Springer im Detail bedeutet und was generative AI für den Journalismus bedeutet, hat ComputerBase in einem Hintergrundbericht beschrieben.

Was OpenAI derzeit den anderen Verlagen anbietet, scheint aber eher dem Deal zu entsprechen, den man bereits mit der Nachrichtenagentur Associated Press eingegangen ist. In diesem Fall geht es also in erster Linie um Trainingsdaten, weniger um aktuelle Inhalte für ChatGPT. OpenAI gab auf Anfrage von The Verge keinen Kommentar zu den Berichten ab.

Kooperation oder Klage

Klar ist nur: Die AI-Firmen stehen unter Zugzwang. Das betrifft nicht nur die Suche nach Trainingsdaten, sondern vor allem der Schutz vor Copyright-Klagen. Autoren, Künstler und Schauspieler haben entsprechende Gerichtsverfahren schon im Verlauf von 2023 auf den Weg gebracht, Ende des Jahres folgte dann noch eine Klage der New York Times.

Diese richtet sich sowohl gegen OpenAI mit ChatGPT als auch Microsoft, der Konzern nutzt GPT-4 als Basis für den KI-Assistenten Copilot. Der Vorwurf der New York Times ist, dass OpenAI die Inhalte des Verlags ohne Zustimmung für das Training der Modelle verwendet hat.

Zuvor liefen Verhandlungen, in diesen konnte man sich aber nicht einigen. OpenAI hofft aber weiterhin, dass eine Vereinbarung zustande kommt. „Wir respektieren das Recht der Urheber und Eigentümer von Inhalten und sind bemüht, mit ihnen so zusammen zu arbeiten, dass sie von AI-Technologie und den neuen Geschäftsmodellen profitieren“, heißt es in einer Stellungnahme, die dem Wall Street Journal vorliegt. Man hoffe nun, dass man noch eine vorteilhafte Lösung für beide Seiten erziele.

Update

Neben Presseverlagen klagen nun auch zwei Autoren gegen OpenAI und Microsoft, berichtet Reuters. Der Vorwurf lautet wie gehabt: Die AI-Entwickler sollen deren Werke ohne Erlaubnis verwendet haben, um die Modelle zu trainieren. In diesem Fall handelt es sich um mehrere Sachbücher.

Deutlich wird an dieser Stelle ein Knackpunkt bei den bisherigen Abkommen und Gesprächen. Solange die KI-Entwickler nur mit bestimmten Verlagen verhandeln, bleibt ein Großteil der kleineren Medienbetriebe außen vor, obwohl auch Inhalte von diesen Anbietern verwendet worden sind. Interessant wird, wie in diesem Bereich eine Lösung aussehen soll – denkbar wären etwa Verhandlungen mit Verwertungsgesellschaften.

Sowohl OpenAI als auch Microsoft haben mitgeteilt, dass man Urheber an den AI-Geschäftsmodellen beteiligen will. Wie das etwa mit Autoren gelingen soll, die außerhalb der Medienunternehmen arbeiten, ist noch offen. Neben dem Klagen aus dem journalistischen Umfeld sind OpenAI und Microsoft auch mit Verfahren konfrontiert, an denen Kulturschaffende aus dem kreativen Bereich wie etwa Game-of-Thrones-Autor George R.R. Martin sowie die Schauspielerin und Autorin Sarah Silverman beteiligt sind.