Neue Sprachmodelle: OpenAI will mit o1 Logik­auf­gaben auf PhD-Niveau lösen

Andreas Frischholz
95 Kommentare
Neue Sprachmodelle: OpenAI will mit o1 Logik­auf­gaben auf PhD-Niveau lösen
Bild: OpenAI

Mit o1 hat OpenAI eine neue Reihe von Sprachmodellen vorgestellt, die wesentlich stärker darauf trainiert ist, komplexe Aufgaben zu lösen. Versprochen werden deutliche Fortschritte im Bereich Wissenschaft, Mathematik und beim Programmieren. Nutzen lassen sich die Modelle mit ChatGPT.

KI-System soll zunächst „nachdenken“

Bei o1 handelt es sich um das Strawberry-System (zuvor Q*), zu dem bereits vor kurzem erste Informationen durchgesickert sind. Das Neue bei den Modellen ist: Diese sollen erst eine längere Zeit „nachdenken“, bevor sie eine Antwort geben. Verändert wird also der Prozess, wie die Modelle Aufgaben lösen.

OpenAI veröffentlicht das neue Modell zunächst in zwei Vorschau-Varianten: o1 und o1 mini. Die kleinere Version soll schneller und günstiger sein – im Vergleich zu o1 sind die Kosten um 80 Prozent reduziert. Geeignet ist es für Anwendungen, die komplexe Aufgaben beinhalten, aber keine umfassende Wissensdatenbank benötigen.

Die Logik-Fortschritte sind laut OpenAI so weitreichend für die generative KI-Entwicklung, dass man mit o1 ein neues Namensschema startet.

o1 soll PhD-Niveau erreichen

OpenAI will mit o1 das Niveau von PhD-Studenten erreichen. Anwendungen finden sich dementsprechend auch tendenziell eher im wissenschaftlichen Umfeld. Beispiele präsentiert man in Bereichen wie Genetik, Verhaltensforschung, Quantenphysik und Ökonomie.

OpenAI-Benchmarks: o1-Modelle im Vergleich mit GPT-4o (Bild: OpenAI)

Erkennen lassen sich die Fortschritte auch in Benchmarks. Auf dem Papier setzen sich die o1-Modelle deutlich von GPT-4o ab.

Im Alltag bleibt GPT-4o vorerst nützlicher

Noch handelt es sich bei o1 um ein Modell, das sich in einem frühen Stadium befindet. Selbst wenn die Fortschritte – so wie OpenAI vermeldet – ein Meilenstein sind, bietet es noch keine alltagstauglichen ChatGPT-Funktionen wie das Web-Browsing oder das Hochladen von Bildern und Daten. GPT-4o wird daher auch in naher Zukunft das beste Modell für die meisten Anwendungsfälle sein.

Verbesserungen verspricht man zudem im Bereich Sicherheit. OpenAI spricht von einem neuen Ansatz, von dem die Modelle profitieren. Bei einem Jailbreaking-Test, dessen Bewertung auf einer Skala von 0 bis 100 erfolgt, erreichte GPT-4o 22 Punkte. Die neuen o1-Modelle sollen auf 84 kommen. Details dazu finden sich im technischen Bericht von OpenAI.

Vorschau-Version für ChatGPT-Plus-Nutzer ab heute verfügbar

Nutzer von ChatGPT Plus und Teams können beide Modelle ab sofort in einer Vorschau testen, allerdings nur in begrenztem Umfang. Bei o1 sind es 30 Nachrichten pro Woche, bei o1 mini 50. Nutzer der kostenlosen Version von ChatGPT sollen bald Zugang zu o1 mini erhalten. Perspektivisch soll ChatGPT selbst in der Lage sein, je nach Anfrage das passende Modell auszuwählen.

Unternehmen und Bildungseinrichtungen erhalten Anfang nächster Woche Zugang, dann unterstützen auch ChatGPT Enterpise und Edu die Preview-Modelle. API-Zugang für Entwickler ist ebenfalls ab jetzt möglich, Details dazu liefert die Dokumentation (PDF).

Feature wie Datei-Upload kommen noch

Für die kommende Zeit verspricht OpenAI weitere Fortschritte bei den o1-Modellen, die sich noch im frühen Stadium befinden. Dazu zählen auch Alltagsfunktionen wie der Datei-Upload.

Neben o1 will OpenAI zusätzlich noch die GPT-Reihe weiterentwickeln.