News Chinesisches AI-Modell: DeepSeek ist schneller und günstiger als OpenAIs o1-Modell

  • Gefällt mir
Reaktionen: LH96, gesperrter_User, vidarv und 2 andere
LamaMitHut schrieb:
Wird hier halt gerne vergessen. Aber wer benötigt schon Freiheit, wenn man stattdessen billiger einkaufen kann?
Wobei das aber auch nur den aktuellen offiziellen Live-Zustand zeigt. Das ganze haben die Chinesen ja auf Github veröffentlicht. Man könnte also auch eine Version ohne Zensur bauen.
 
  • Gefällt mir
Reaktionen: Maviapril2, gartenriese, LamaTux und 9 andere
Ich habe keinen Benchmark warum auch ich kann nur zwei mal das selbe fragen und die Ergebnisse vergleichen. Mal gibt der eine was brauchbares, mal der andere, mal beide, mal keine.

Chatbots sind Müll, wenn man nicht die Antwort kennt/versteht. Ja man kann damit Programmieren, wenn man Programmieren versteht.
 
  • Gefällt mir
Reaktionen: gartenriese, Wedge. und fr13del
xNeo92x schrieb:
Anhang anzeigen 1575245
Hmm ja, vielleicht besser nicht...
Wenn du die offizielle App aus den Stores runterlädt, dann kommuniziert die mit den Servern in China und da ist entsprechend sowas gesperrt.
Lasse das Modell lokal laufen auf eigener Hardware, dann gibt's diese Einschränkungen nicht.
 
  • Gefällt mir
Reaktionen: Raykus, DrSky, rosenholz und 7 andere
Pippen123 schrieb:
Hat den mal jmd. getestet? Wie schneidet er im Vgl. zu Chatgpt 4 ab?
Für Coding ist DeepSeek hervorragend - als Chatbot ist es ChatGPT unterlegen, weil es nur mit chinesischen Daten gefüttert wurde. Die Herkunft und Menge der Daten ist unbekannt, was aber ganz offensichtlich ist: alle Daten sind regierungstreu zensiert und Fragen, deren Antwort der KP nicht gefallen würde, werden nicht beantwortet.

Gibt auch schon Fälle, wo Usern ihre Accounts gesperrt/gelöscht wurden, weil sie die KI mehrfach über die Geschehnisse beim Tian'anmen-Massaker und die Menschenrechtslage der Uiguren befragt haben.
 
  • Gefällt mir
Reaktionen: Snapuman, Volvo480, Rock Lee und 9 andere
HighDefinist schrieb:
Ja, das behauptet DeepSeek. Ueberpruefen laesst es sich natuerlich nicht.
vor allem sagt es exakt nichts aus. Was bedeutet die Zahl?
Hardware zu dem Preis? Hardware gemietet? Sind das die kosten eines einzigen trainingsruns (sehr wahrscheinlich, weil die zahl halt zu dem was meta, openai, mistral & Co da ausgeben passt)?
 
  • Gefällt mir
Reaktionen: Kazuja, Obvision und Jarhead91
Keine Blase, nein überhaupt nicht! Alles normal, wenn ein Konkurrent der nicht die ultra Krasse Ressourcen brauch direkt nen Makro-Ökonomischen Einfluss im Wert von XX Mrd. auf eine gesamte Branche hat... Gehen sie weiter, hier gibt es nichts zu sehen! Keine Zockerei, keine Probleme!

Dass OpenAI hier immer mehr teilweise brauchbare Konkurrenz bekommt, ist relativ normal, da sie schon weit in den Diminishing Returns sind und immer mehr Ressourcen und Arbeit in immer weniger Verbesserungen gesteckt werden müssen.

Daher ist meine These auch immer noch, dass wenn die Blase platzt die viel zu generalisierten und viel zu teuren Modelle bisher durch deutlich kleinere aber für ihre spezielle Aufgabe deutlich effizientere Modelle ersetzt werden. Man sieht es heute schon, dass in den Anwendungsfällen wo "KI" wirklich sinnvoll ist die Modelle sehr speziell sind und dort dann eben nicht auf Clustern mit XXX.XXXX GPUs laufen müssen. Unter Trump und dem Zockerei-Instinkt der Leute wird die Blase aber wahrscheinlich noch nicht platzen, lieber steckt man da XXX weitere Mrd. rein, weil das eine sehr sinnvolle Investition ist. Wer brauch schon Bildung, Gesundheit, Straßen etc.! Ich zitiere Gamers Nexus "AI AI AI AI AI". Mehr brauch es nicht.
 
  • Gefällt mir
Reaktionen: stormi, CableGuy82, Maviapril2 und 10 andere
  • Gefällt mir
Reaktionen: CableGuy82, konkretor und dernettehans
ICh finde den Artikel reißerisch und offensichtlich wurde nicht recherchiert. DeepSeek ist massiv zensiert und gibt nur den chinesischen Narrativ zu vielen geschichtlichen und politischen Themen wieder. Zu Tian’anmen 1989 hat DeepSeek wenig zu sagen, ebenso wenn es um XYi Jinpings Spitznamen geht. Auch zur Taiwanfrage kommen merkwürdige Aussagen, wie das die Mehrheit der Welt die Ein China Politik favorisieren würde.

Das soll eine Konkurrenz sein? Was nützt Open Source, wenn es durch und durch von der Kommunistischen partei vorgegeben ist, was DeepSeek für "Fakten" kennt? Wer würde sowas als Unterbau nehmen? Und wenn hier schon so eingegriffen wurde, dann wäre ich auch bei vielen Aussagen zu den kosten von DeepSeek vorsichtig und unterstelle Porpaganda der Partei...
 
  • Gefällt mir
Reaktionen: Alesis, zett0, gartenriese und 18 andere
Gerade ein wenig gespielt damit, hat auf alle Fälle Potential, nur ist es so instabil oder einfach "derzeit" überlastet. :lol:
 
Atomkeks schrieb:
Die Herkunft und Menge der Daten ist unbekannt, was aber ganz offensichtlich ist: alle Daten sind regierungstreu zensiert und Fragen, deren Antwort der KP nicht gefallen würde, werden nicht beantwortet.

Da bin ich mal gespannt, ob was dran ist, dass es lediglich mit ChatGPT gefüttert wurde.

Es gibt auch Vermutungen, dass Deepseek nicht ganz die Wahrheit erzählt, wenn es um die Entwicklung der Modelle geht. Laut CNBC sagte Chetan Puttagunt vom Wagniskapitalgeber Benchmark bereits, Deepseek habe die sogenannte Model-Destillation nutzen können. Dabei wird das Wissen eines großen Modells in ein kleines Modell überführt. Daran arbeiten auch andere KI-Unternehmen wie Meta. Der Chatbot von Deepseek soll häufiger mal behaupten, er selbst sei ChatGPT, was dafür spricht, dass er über diesen Chatbot trainiert wurde.

Problematisch ist, dass die Deepseek-Modelle auf manche Fragen im Sinne der chinesischen Regierung antworten. Es werden beispielsweise Ereignisse auf dem Tian’anmen-Platz verschwiegen. Dort wurden 1989 Proteste einer Demokratiebewegung blutig beendet. Mit üblichen KI-Tricks bekommt man das Modell dazu, über das Massaker zu schreiben. Wer nicht weiß, dass etwas verschwiegen wird, kann aber nur schwerlich Tricks anwenden, weil er gar nicht weiß, dass etwas fehlt.

Heise
 
  • Gefällt mir
Reaktionen: Volvo480, CableGuy82, Pestplatte und 4 andere
  • Gefällt mir
Reaktionen: andi_sco, Newbie_9000, MiyamotoMusashi und 8 andere
Sehr gut, das bedeutet man kann wieder günstig Aktien nachkaufen :)
 
  • Gefällt mir
Reaktionen: medsommer, p4z1f1st, Pummeluff und 3 andere
Donot999 schrieb:
Die Kosten ohne Mengenrabatt nur 1,9 Mrd€

Edit: Die 6 Mio. ergebn sich durch das Mieten von 50.000 dieser GPUs für 2 Monate.
Wenn du nur die Trainingszeit rechnest, ist ChatGPT auch viel günstiger. Das originale Modell ist auf ein paar Tausend A100 trainiert worden.
 
  • Gefällt mir
Reaktionen: Calid und madmax2010
Das für mich interessante sind die um einen Faktor 1000 geringeren Kosten zum trainieren des Models, also Strom und GPUs. Wenn die KI Branche nun folglich in naher Zukunft (2-3 Jahre; das schon eingesammelte Investment muss ja noch ausgegeben werden ;)) einen etwa um Faktor 1000 geringeren Bedarf an GPUs hat könnte Nvidia in ein paar Jahren reudig zu uns Gamern zurück gekrochen kommen nachdem der Absatz auf 1/10 von Heute eingebrochen ist.
Sollten sich die Meldung als allgemeingültig heraus stellen und es steckt so was wie die der nächster Schritt nach der Transfomer-Architektur dahinter wäre das ein Harter Markt-Disruptor und Silicon Valey muss sich schnell anpassen, sonst können die die Milliarden an Investitionen abschreiben.

Time to short NV stocks - not an investment advice :smokin:
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Act4, Dgini und Gortha
Hi,
laut der Panik an den Börsen scheint es ja der Hammer zu sein das AI Modell.
Klar kann es so sein. ABER
Komisch ist schon der Zeitpunkt wo die massiven Meldungen über das AI Modell kommen.
Nachdem Trump das hohe Investitionsprogramm verkündet hat und auf Konfrontationskurs zu China geht.
Nicht falsch verstehen ich mag Trump nicht, aber das fehlt doch schon sehr auf.
Auch das die App so oft runtergeladen wird ist doch nicht schwer zu manipulieren.
Und man darf nicht vergessen aus welchen Land es kommt. Die meisten Daten dort sind eh schon aufbereitet. Falls der Staat da mithilft ist es nicht schwer gute Ergebnisse zu bekommen. Datenschutz gibt es ja nicht in China und dazu noch die Zensur.

Was mich daran nur aufregt ist die Panik die vor allem an den Börsen los ist. Man sollte immer erst Denken dann handeln. Das ist in aber schon immer so an der Börse. Egal ob nach unten oder nach oben.
Bestimmt mittlerweile auch KI im Spiel :)
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: prayhe
Vor allem, dass viel geringere Ressourcen nötig sind, um Modelle mit vergleichbarer Qualität zu entwickeln, gilt als einschneidend.

Der Schluss daraus ist nur der völlig falsche. Als ob jetzt die Big Tech alle sagen würden "ach dann bauen wir halt viel weniger Rechenleistung auf, der Status Quo reicht uns ja völlig".
Das was passieren wird ist doch dass die Aufrüstung genauso weiter läuft, nur führen effizientere Modelle eben im besten Fall zu einer schnelleren Leistungssteigerung.

Interessant wird sein woher DeepSeek diese Effizienz bezieht, was genau hier anders gemacht wird als bei den etablierten Modellen - und dann werden das eben alle in ihre Entwicklung übernehmen.

Alles unter der Voraussetzung dass das auch alles so stimmt und DeepSeek nicht letztlich auch massiv durch China gepusht wurde und viel mehr Entwicklungs und Rechenpower dahinter steckt als man jetzt vorgibt.
 
  • Gefällt mir
Reaktionen: medsommer, DefconDev, Lurandil und 2 andere
Zurück
Oben