Anthropic Claude 3.5 Sonnet: Leistungsfähigere Modelle, die den Computer steuern können

Andreas Frischholz
10 Kommentare
Anthropic Claude 3.5 Sonnet: Leistungsfähigere Modelle, die den Computer steuern können
Bild: Microsoft Copilot Designer

Anthropic hat mit Claude 3.5 Sonnet und Claude 3.5 Haiku zwei überarbeitete Modelle veröffentlicht, die generell leistungsfähiger sind und vor allem beim Programmieren deutliche Fortschritte erzielen sollen. Interessanter ist aber eine neue Funktion: die Computer-Nutzung.

Verfügbar ist es als öffentliche Beta. Laut der Mitteilung von Anthropic können Entwickler nun per API die Claude-Modelle anweisen, bestimmte Aufgaben auf einem Computer zu erfüllen. Dazu zählt das Betrachten des Bildschirms, das Bewegen des Mauszeigers, das Klicken auf Schaltflächen sowie das Verfassen von Texten.

In einem Demo-Video zeigt Anthropic, wie Claude ein Formular ausfüllt, indem zuvor verschiedene Datenquellen durchsucht werden. Erkennbar ist die Vorgehensweise. Der KI-Assistent erstellt zunächst Screenshots und erkennt, dass benötigte Angaben nicht in einer Tabelle auftauchen. Danach ist der Assistent dann – dem Prompt folgend – in der Lage, eine Suche durchzuführen und so an die Informationen zu gelangen, die für das Ausfüllen des Antrags benötigt werden.

Neuer Ansatz für Agenten-Systeme

Die Computer-Nutzung ist also ein weiterer Ansatz, um generative KI-Systeme zu Agenten zu entwickeln, die automatisiert komplexere und mehrstufige Aufgaben abarbeiten. Nur dass das System nicht für bestimmte Aufgaben trainiert wird, sondern generell lernen soll, wie es bestehende Computer-Infrastruktur nutzt.

Noch befindet sich das Feature in einem frühen Entwicklungsstadium. Claude 3.5 Sonnet ist das erste Modell, das die Computer-Nutzung unterstützt. Und es hat Schwächen. Einige Aufgaben wie Scrollen oder Zoomen, die Menschen mühelos erledigen können, seien für Claude herausfordernd. Anthropic empfiehlt Entwicklern daher, bei den Experimenten zunächst Aufgaben zu wählen, die ein niedrigeres Ausfallrisiko haben.

Sicherheitsaspekte spielen auch bei diesem KI-System eine Rolle. Anthropic selbst erklärt, Computer-Nutzung könne ein neuer Angriffsvektor für bekannte Bedrohungen wie Spam, Falschinformationen und Betrug sein. Verhindern will man das mit einem proaktiven Verfahren, bei dem das System erkennen soll, ob es für missbräuchliche Zwecke eingesetzt wird. Dazu stellt Anthropic auch ausführlichere Informationen bereit.

Claude 3.5 Sonnet und Haiku: Überarbeitete Modelle mit mehr Leistung

Bei den neuen Modellen Claude 3.5 Sonnet und Claude 3.5 Haiku verspricht Anthropic mehr Leistung, Fortschritte gebe es insbesondere beim Programmieren. In den veröffentlichten Benchmarks schneiden die Modelle ebenfalls vielversprechend ab.

Anthropic: Benchmarks für Claude 3.5 Sonnet und Claude 3.5 Haiku
Anthropic: Benchmarks für Claude 3.5 Sonnet und Claude 3.5 Haiku (Bild: Anthropic)

So kann sich Claude 3.5 Sonnet vom Vorgänger absetzen und sowohl vor GPT-4o als auch Gemini 1.5 Pro einordnen. Claude 3.5 Haiku zählt zu den kleineren Modellen, die vor allem auf Geschwindigkeit ausgelegt sind. Das liefert eine Benchmark-Performance auf einem Niveau, das vergleichbar ist mit dem von GPT-4o mini.

Verfügbar sein wird Claude 3.5 Haiku im Verlauf dieses Monats über Amazon Bedrock und der Google-Cloud Vertex AI. Zuerst kommt es als Textmodell, später soll die Bildeingabe folgen.

Snapdragon Summit 2024 (21.–23. Oktober 2024): Alle News auf der Themenseite!