News Gemini 2.5 Thinking: Googles neues KI-Modell setzt sich an die Spitze

Schade, dass das Modell nicht im Bereich "Code Generation" mit Claude 3.7 Sonnet verglichen wurde. Das ist seit dem Release das Modell meiner Wahl, wenn es um Code Generation mit Python im Bereich Data Science / KI Entwicklung und generell in komplexeren Softwareprojekten geht.
 
  • Gefällt mir
Reaktionen: flo.murr, kim88, eastcoast_pete und 12 andere
"Verfügbar ist Gemini 2.5 Pro über Google AI Studio sowie für Gemini Advanced, Nutzer benötigen also die kostenpflichtige Abonnement des Chatbots."

Auf AI Studio ist es doch kostenlos verfügbar?
 
Slowz schrieb:
im Bereich "Code Generation"
Wäre generell mal interessant, viele verschiedene KIs in Bezug auf Codegenerierung zu vergleichen. Vielleicht kommt ja mal ein Artikel nur speziell dazu. :)
 
  • Gefällt mir
Reaktionen: Mantasia, Laz-Y, eastcoast_pete und 14 andere
Slowz schrieb:
Schade, dass das Modell nicht im Bereich "Code Generation" mit Claude 3.7 Sonnet verglichen wurde.
Ist da nicht SWE-bench verified am aussagekräftigsten? Wurde doch speziell erstellt um praxisnahe Codingprobleme zu bewerten.
 
Kuristina schrieb:
Wäre generell mal interessant, viele verschiedene KIs in Bezug auf Codegenerierung zu vergleichen. Vielleicht kommt ja mal ein Artikel nur speziell dazu. :)
Wann nutze ich welches Modell?
✅ OpenAI (GPT-4):

  • Beste Wahl für allgemeine Code-Generierung & komplexe Projekte.
  • Gut für Code-Optimierung, Debugging & Erklärungen.
✅ Gemini:
  • Ideal für Google-Entwickler (TensorFlow, Android, Google Cloud).
  • Besser für Multimodale Anfragen (z. B. Code aus Bildern generieren).
✅ DeepSeek:
  • Perfekt für chinesische Entwickler & Open-Source-Projekte.
  • Gut für Mathematik, wissenschaftliche Berechnungen & Rust/C++-Optimierungen.
  • Für die beste Code-Qualität & Debugging: OpenAI (GPT-4).
  • Für Google-Ökosystem & Multimodalität: Gemini.
  • Für Open-Source & mathematische Berechnungen: DeepSeek.
Gleiches hab ich mich auf gefragt ;)
 
  • Gefällt mir
Reaktionen: KI_Ghost, eastcoast_pete, fox40phil und eine weitere Person
Nutz mittlerweile Gemini auch gern in VSCode, ich Frag mich nur wann Google beginnt die Preise an ChatGPT anzugleichen, das gabs ja für 1 Jahr geschenkt zum Google Smartphone. Die 30 € pro Monat sind verglichen zu dem was man bei der Konkurrenz bezahlt fast schon zu günstig. Aber gut, Google hat wohl verstanden dass das Service zuerst an die Massen geliefert werden muss und dann sukzessive im Netflix Stil die Preise angehoben werden.
Den Reasoning Modellen konnte ich bis jetzt aber nichts abgewinnen. Das ist einfach ne Wall of Text vor dem Resultat die mir persönlich keinen Mehrwert bietet.

Aber schon verrückt was damit alles schon Möglich ist: Hab mir rein über Gemini ein komplexes Aquarium Projekt zusammen stellen lassen, da wurde alles von Größe, Wasser, Soil, Pflanzenvariationen, Beleuchtung, Heizung, Filter, Inbetriebnahme, Ausstreuen, bepflanzen/welche Pflanzen wo/hin, Beleuchtungsdauer, Energieeffizenz, welche Tierchen kommen dann rein die nicht ganzjährig mit 25°C Wasser beheizt werden müssen, welche Spezies lassen sich kombinieren usw. in einer doch sehr komplexen Kette abgearbeitet.
Das Aquarium steht nach der Woche und das ganze Grünzeugs wuchert wie verrückt. Aber Gemini erlaubt mir erst Morgen die ersten kleinen Schneckchen hinein zu setzen. Fische und Garnelen dann viel später. Sogar meine Wassertests und Pflanzenwachstum hat sie mir auf Basis von Handyfotos erklären können und Tips gegeben wie es weiter geht. Manchmal wünscht ich mir halt einfach nur gleich Fische in das Ding werfen zu dürfen. Aber da sind wir uns noch nicht einig geworden :D
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: DNS81, MacFu, spacy51 und 16 andere
hennich schrieb:
Wann nutze ich welches Modell?
Und welche KI hat das ausgespuckt? Was macht DeepSeek denn zum Beispiel besser für Open-Source-Projekte? Welche besonderen Anforderungen an den Code hat ein Open-Source-Projekt überhaupt?
 
  • Gefällt mir
Reaktionen: FeelsGoodManJPG, MalWiederIch, ReignInBlo0d und 6 andere
Blaexe schrieb:
Ist da nicht SWE-bench verified am aussagekräftigsten? Wurde doch speziell erstellt um praxisnahe Codingprobleme zu bewerten.
Das kann gut sein, kenne mich mit den Benchmarks nicht im Detail aus. Aber beim SWE-Bench liegt Claude 3.7 Sonnet ja schon noch ein gutes Stück vor dem neuen Gemini 2.5.
 
  • Gefällt mir
Reaktionen: Sav3k
Slowz schrieb:
Aber beim SWE-Bench liegt Claude 3.7 Sonnet ja schon noch ein gutes Stück vor dem neuen Gemini 2.5.
Richtig. Passt auch tendenziell zu den ersten Erfahrungen der Nutzer. Coding ist halt irgendwie die "Inselbegabung" von Claude.
 
  • Gefällt mir
Reaktionen: Sav3k, konkretor und Slowz
@Blaexe Genau, in der Grafik sieht man ja diverse Vergleiche wo Gemini 2.5 seine Stärken hat und wo andere Modelle noch besser sind. Am Ende gibt es aktuell einfach kein Modell, welches überall auf Rang 1 liegt. Claude hat ja auch sehr lange mit 3.5 geführt und mit 3.7 das noch mal ausgebaut.
 
shysdrag schrieb:
Aber schon verrückt was damit alles schon Möglich ist: Hab mir rein über Gemini ein komplexes Aquarium Projekt zusammen stellen lassen, da wurde alles von Größe, Wasser, Soil, Pflanzenvariationen, Beleuchtung, Heizung, Filter, Inbetriebnahme, Ausstreuen, bepflanzen/welche Pflanzen wo/hin, Beleuchtungsdauer, Energieeffizenz, welche Tierchen kommen dann rein die nicht ganzjährig mit 25°C Wasser beheizt werden müssen, welche Spezies lassen sich kombinieren usw. in einer doch sehr komplexen Kette abgearbeitet.
Das Aquarium steht nach der Woche und das ganze Grünzeugs wuchert wie verrückt. Aber Gemini erlaubt mir erst Morgen die ersten kleinen Schneckchen hinein zu setzen. Fische und Garnelen dann viel später. Sogar meine Wassertests und Pflanzenwachstum hat sie mir auf Basis von Handyfotos erklären können und Tips gegeben wie es weiter geht. Manchmal wünscht ich mir halt einfach nur gleich Fische in das Ding werfen zu dürfen. Aber da sind wir uns noch nicht einig geworden :D
Das kann man jetzt so oder so sehen. Normalerweise ist genau der Prozess den du beschreibst der Reiz an einem Hobby. Du hast die Methode Kopf aus und den Computer machen lassen gewählt. Kann man machen, muss man aber nicht.
 
  • Gefällt mir
Reaktionen: Loro Husk, MalWiederIch, SockeTM und 2 andere
@Balkoth Klar, sich damit zu beschäftigen ist ja auch sehr Interessant, bei der Vielzahl an Informationen die dazu kursieren verliert man aber schnell den Überblick bzw. ist es die Interaktion der Flora und Fauna im Ökokosmos mit Temperatur, wie (lange) Beleuchten, Wasserwerten, wie viel Wasserstrom, wie Filtern, wer Frisst wen, wer kommt mit wem gut zurecht usw. halt auch unheimlich Komplex. Der Vorteil für nen Anfänger wie mich ist halt das einem ein bisschen das Händchen gehalten wird und alle Informationen an einer Stelle angeboten werden, man immer wieder Fragen stellen kann, alternativen ausarbeitet und dann trotzdem was "Individuelles" dabei raus kommt. Wenn ich in den Aquarienhandel geh kann sich niemand so viel Zeit dafür nehmen das so detailliert mit mir zu besprechen. Aber ich bin das trotzdem alles mit meinem Händler durchgegangen und wir haben das auch weiter verfeinert. Aber für einen kompletten Anfänger wie mich schon sehr praktisch.
 
  • Gefällt mir
Reaktionen: JDK91, Gewuerzwiesel, CableGuy82 und 4 andere
hennich schrieb:
✅ Gemini:
  • Ideal für Google-Entwickler (TensorFlow, Android, Google Cloud).
  • Besser für Multimodale Anfragen (z. B. Code aus Bildern generieren).
Ich habe tatsächlich die Erfahrung gemacht, das Copilot oder ChatGPT (ist es das gleiche?) deutlich besser sind. Gemini ist selbst mit einfachen Aachen überfordert wo Copilot für mich schon 2 Schritte weiter denkt und mir Vorschläge für die weitere Vorgehensweise gibt. Da kommen öfter mal Sachen zum Vorschein, woran ich selbst nicht gedacht habe.
 
Mhm, wär ja schon einmal interessant auf ein komplett neues Modell zu setzen. Ich bezahle für ChatGPT 20 Euro im Monat. Da ich es nun echt lange schon nutze, weiß es natürlich auch eine ganze Menge was wirklich praktisch ist. Dieser Transfer in ein neues LLM, uff
 
@Duststorm
ChatGPT arbeitet wirklich vorzüglich mit meinem Daten. Man merkt sehr oft, das es von einem Strukturen übernimmt. Fällt mir immer wieder beim refaktorieren auf.
 
  • Gefällt mir
Reaktionen: Duststorm
shysdrag schrieb:
Aber schon verrückt was damit alles schon Möglich ist: Hab mir rein über Gemini ein komplexes Aquarium Projekt zusammen stellen lassen, da wurde alles von Größe, Wasser, Soil, Pflanzenvariationen, Beleuchtung, Heizung, Filter, Inbetriebnahme, Ausstreuen, bepflanzen/welche Pflanzen wo/hin, Beleuchtungsdauer, Energieeffizenz, welche Tierchen kommen dann rein die nicht ganzjährig mit 25°C Wasser beheizt werden müssen, welche Spezies lassen sich kombinieren usw. in einer doch sehr komplexen Kette abgearbeitet.
Das Aquarium steht nach der Woche und das ganze Grünzeugs wuchert wie verrückt. Aber Gemini erlaubt mir erst Morgen die ersten kleinen Schneckchen hinein zu setzen. Fische und Garnelen dann viel später. Sogar meine Wassertests und Pflanzenwachstum hat sie mir auf Basis von Handyfotos erklären können und Tips gegeben wie es weiter geht. Manchmal wünscht ich mir halt einfach nur gleich Fische in das Ding werfen zu dürfen. Aber da sind wir uns noch nicht einig geworden
Und dann kommen wieder einige um die Ecke und meinen "Alles Spielerei" "Ich sehe keinen Anwendungsfall" "Alles nur eine Blase"

Viel Spaß beim Fische bewundern :daumen:
 
  • Gefällt mir
Reaktionen: DNS81, ###Zaunpfahl###, shysdrag und 8 andere
Schön zu lesen, ich nutze nahezu täglich Gemini, 50:50 Deep Research und Pro.
 
Bei mir habe ich ganz schnell mal ein Python-Programm mit O3-mini-high geschrieben. Das aus csv-Daten, 3D Diagramme macht.
Nach 2 Prompts kam ein (fast) fertiges Programm raus, das sehr gut war und meinen Vorstellungen entsprach. Mit Claude3.7, die Gleichen prompts verwendet, war nicht so gut, hat mir nicht gefallen und mit diesem Modell ,Gemini2.5, hat er auch nichts gutes gemacht, was auf anhieb lief.
Also jedes Modell hat so seine Vor und Nachteile. Für mich persönlich ist gerade O3-Mini der Favorit, zumindest was programmieren betrifft. Wobei Claude3.7 gut sein soll, ich werde mal das im nächsten Projekt ausprobieren.
 
Bisher konnte ich mit KI-Tools wenig anfangen. Doch seit meinem neuen Job als Systemadministrator und der intensiven Arbeit mit PowerShell hat sich das grundlegend geändert. Ich habe die Unterstützung durch KI sehr zu schätzen gelernt. Aktuell habe ich verschiedene KI-Anwendungen getestet, und für meine Bedürfnisse, insbesondere im Bereich PowerShell, überzeugt mich ChatGPT am meisten. Sollten Sie jedoch andere Empfehlungen für mich haben, bin ich offen dafür!

PS: Natürlich ist es nicht möglich, die Ergebnisse von ChatGPT eins zu eins zu übernehmen. Oft generiert die KI eine Fülle an Code, der für meine Zwecke nicht relevant ist. Daher ist eine manuelle Anpassung und Reduzierung unerlässlich. Dennoch ist ChatGPT eine wertvolle Hilfe und ein guter Ausgangspunkt.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: zhompster, shaggy86 und Kuristina
Zurück
Oben