News Vorwurf von OpenAI: DeepSeek soll mit ChatGPT-Inhalten trainiert worden sein

metoer · 29. Januar 2025

Sron schrieb:
Ich sehe schon einen Unterschied ob "tote" Daten geklaut werden um ein Modell zu trainieren oder direkt das ganze Modell geklaut wird um selbst überhaupt ein erstes Produkt auf den Markt zu bringen. Die Qualität ist aus meiner Sicht eine andere.

Erstmal ist das nur eine Unterstellung des direkten Konkurrenten, nicht mehr.
Auf der Github Seite ist alles aufgeschlüsselt was wie verwendet wurde.

therealcola · 29. Januar 2025

China numba wan

0x8100 · 29. Januar 2025

metoer schrieb:
Auf der Github Seite ist alles aufgeschlüsselt was wie verwendet wurde.

und wie jeder weiss beinhaltet eine readme.md auch grundsätzlich nur die wahrheit und ist immer vollständig... deepseek bedient sich also nur an gwen, llama und anscheinend chatgpt und lässt schön andere die aufwändige und teure arbeit machen.

stefan92x · 29. Januar 2025

Sron schrieb:
Ich sehe schon einen Unterschied ob "tote" Daten geklaut werden um ein Modell zu trainieren oder direkt das ganze Modell geklaut wird um selbst überhaupt ein erstes Produkt auf den Markt zu bringen. Die Qualität ist aus meiner Sicht eine andere.

Sie haben aber nicht das Modell geklaut, sondern mit dem OpenAI Modell geredet. Das ist ganz grob gesagt alles.

Rockbreak · 29. Januar 2025

Soll ich jetzt weinen? Die großen Amerikanischen Firmen klauen auch Nutzerdaten. Ist mir sowas von egal. Wenn Diebe von anderen Dieben bestohlen werden finde ich das sogar befriedigend. Und wie Open AI sagt, sie können ja legal nichtmal was machen weil es nicht illegal ist.

Beefsupreme · 29. Januar 2025

Bei der Nachricht habe ich nur müde gegähnt.

Das Problem ist, dass die meisten Leute noch nicht verstanden haben, dass China einfach fake und scam ist. (auch mit staatlicher Unterstützung)

zombie · 29. Januar 2025

Tja die Chinesen machen das was sie schon immer gut konnten, erstmal die anderen teuer machen lassen und dann günstig nachmachen. Wie will man das verhindern in einer Welt voller Gier ? Schon funny das sie ihre eigene KI mit Hilfe der US KI entwickelt haben. KI einfach so toll. Noch funnier das Thema Aktien und KI.

habla2k · 29. Januar 2025

Weyoun schrieb:
indem ich unsere chinesischen Entwicklerkollegen unsere geschützten Technologien erkläre

Wahrscheinlich wachst du eher irgendwann ohne Job auf, weil die Kollegen das dann auch können, für die Hälfte an Gehalt.

Nennt sich Globalisierung.

mRcL · 29. Januar 2025

Kuristina schrieb:
Hast du vor heute schon mal was davon gehört? Die Börsianer auch nicht. ^^

Nee, natürlich nicht ^^
Aber wenn es im Prinzip (nach meinem Laienverständnis), nur ein großes Modell als Basis braucht, um die "kleinen" Kostengünstig zu trainieren und entsprechend gut auszustatten, ist die Marktreaktion doch reichlich übertrieben, da diese Entwicklung eh kommt.

Scheint nochmal ein Beleg dafür zu sein, wie viel Unwissenheit im Markt ist und gleichzeitig wie überhitzt er ist...

xerex.exe · 29. Januar 2025

MacMuffin schrieb:
Chinesen machen Chinesen Sachen, bin schockiert, lol ....

Ich habe letztens eine Dokumentation gesehen, in dem die chinesische Kultur ein wenig erklärt wird.
In China gibt es eine traditionelle Kultur des „Shanzhai“ (山寨), was so viel wie „Nachahmung mit Anpassung“ bedeutet. In der chinesischen Kultur galt es lange als ehrenvoll, etwas Gutes zu kopieren und zu verbessern.

Weyoun · 29. Januar 2025

habla2k schrieb:
Wahrscheinlich wachst du eher irgendwann ohne Job auf, weil die Kollegen das dann auch können, für die Hälfte an Gehalt.

Das Problem ist eher, dass die Informationen nicht zwingend in der China-Niederlassung meines Unternehmens landen, sondern wohl eher in staatseigenen Unternehmen.

floq0r · 29. Januar 2025

@xerex.exe Davon habe ich auch einmal gelesen. Was man sich als "ehrenvoller Kopierer" dann überlegen sollte ist, wieviel Motivation der ursprüngliche Erfinder für neue Erfindungen hat wenn er weiß, dass er eh bald "ehrenvoll kopiert" wird.

Whitehorse1979 · 29. Januar 2025

Moment. OpenAI bestielt das gesamte Internet und vermutlich auch massig Clouddienste und der Chinese darf dieses gesammelte Diebesgut nicht weiterverarbeiten weil es eben die Chinesen sind? Ich glaube so wird das Ganze nicht funktionieren.

7H0M45 · 29. Januar 2025

mRcL schrieb:
aber wenn diese Form der "Destillation" ein bekanntes Vorgehen ist, warum löste der Release von DeepSeek dann so einen Börsencrash aus?

Das lässt sich ganz leicht erklären. Zum einen sind an der Börse keine KI Fachexperten unterwegs. Heißt die können die Technik welche vorgestellt wurde gar nicht wirklich einschätzen. Genau aus diesem Grund ist ja auch erst der AI Hype an der Börse entstanden, in welchem wir uns ja nach wie vor befinden. Dort ist viel Träumerei unterwegs, deswegen wir das früher oder später auch wieder zusammensacken.

Der Witz ist jetzt, die Börsenteilnehmer wissen in der Regel, dass sie auf einen Hypezug aufgesprungen sind, der bald kollabieren könnte. Heißt, wenn sie eine solche Nachricht hören, dann ist zeit ein wichtiger Faktor. Also springen die mit den höchsten Einstiegskursen erstmal ganz schnell ab. Dadurch sinkt der Kurs dann schonmal ein gutes Stück ab. Danach kommen die, welche niedrigere Einstiegskurse haben, aber sehen, dass es diese Nachrichten gibt und dass die Kurse schon am fallen sind. Also springen auch die ganz schnell ab.

tomgit · 29. Januar 2025

Sron schrieb:
Staatlich orchestriertes klauen von geistigem Eigentum ist ja jetzt nichts neues.

Genau, es gibt ja kein so unbeschriebenes Blatt wie OpenAI, insbesondere, was Urheberrechte anbelangt.

https://originality.ai/blog/openai-chatgpt-lawsuit-list

ReactivateMe347 · 29. Januar 2025

Es heißt doch immer, wenn man KI-Output an eine KI füttert, dann kommt da nur noch mehr murks bei raus. Wiesonist das jetzt offenbar hier ganz anders? Das stinkt doch zum Himmel.

metoer · 29. Januar 2025

0x8100 schrieb:
und wie jeder weiss beinhaltet eine readme.md auch grundsätzlich nur die wahrheit und ist immer vollständig... deepseek bedient sich also nur an gwen, llama und anscheinend chatgpt und lässt schön andere die aufwändige und teure arbeit machen.

GPT2 wurde mit einer modifizierten MIT Lizenz veröffentlicht, hätte sich OpenAI eben vorher überlegen sollen. OpenAI hat genauso auf die Erkenntnisse der LLM Forschung aufgebaut und musste nicht bei null anfangen.

0x8100 · 29. Januar 2025

metoer schrieb:
GPT2 wurde mit einer modifizierten MIT Lizenz veröffentlicht

und woher weisst du, dass deepseek openais gpt2 benutzt hat und nicht daten späterer versionen? oder war das jetzt einfach geraten?

Seven2758 · 29. Januar 2025

Also verhärtet sich der Verdacht weiter wie ich bereits schrieb.
Sie haben es indirekt zugegeben, dass es durch ein größeres Model angelernt wurde.

"They can take a really good, big model and use a process called distillation," said Chetan Puttagunta, general partner at Benchmark. "Basically you use a very large model to help your small model get smart at the thing you want it to get smart at. That's actually very cost-efficient."
CNBC

pioneer3001 · 29. Januar 2025

Man könnte auch argumentieren, dass Distillation auch nur Fair Use ist

News Vorwurf von OpenAI: DeepSeek soll mit ChatGPT-Inhalten trainiert worden sein

Lieutenant Pro

Lt. Commander

Admiral

Captain

Lt. Junior Grade

Lt. Commander

Captain

Vice Admiral Pro

Lieutenant

Lieutenant

Admiral Pro

Captain

Lieutenant

Lt. Commander Pro

Commodore

Lt. Commander

Lieutenant Pro

Admiral

Lieutenant

Ensign