Gegenschlag im KI-Wettrüsten: Neues Sprachmodell PaLM 2 für Bard und die Google Apps
Wie erwartet stellte Google bei der Entwicklerkonferenz I/O 2023 die aktuellen KI-Entwicklungen in den Mittelpunkt. Neue Grundlage für die generativen KI-Lösungen des Konzerns ist das PaLM-2-Sprachmodell, davon profitieren sowohl die Google Apps im Workspace als auch der Bard-Chatbot und die Suchmaschine.
Sundar Pichai erklärte bereits beim Start der Keynote, dass es vor allem die KI-Assistenten sind, die Googles Produktstrategie in der kommenden Zeit bestimmen. Das illustrierte er anhand von Gmail und dem KI-Assistenten „Help me write“, bei E-Mails vollständige Antworten vorschlägt und sich auch in der Tonalität anpassen lässt.
Neues Large Language Model
Die neuen KI-Assistenten basieren auf PaLM 2, Googles neuestem und leistungsfähigstem Large Language Model (LLM). Im Vergleich zu dem im April 2022 vorgestellten Vorgänger soll PaLM 2 vor allem beim Umgang mit Sprachen nochmals deutlich dazu gelernt haben. Es beherrscht nun mehr als 100 Sprachen. Fortschritte betreffen vor allem die Nuancen, also sprachliche Feinheiten, die etwa bei Gedichten, Essays oder generell dem kreativen Schreiben erforderlich sind. Darüber hinaus bietet es die für Sprachmodelle dieser Gewichtsklasse eine gewohnt breite Palette an Funktionen, zu der auch das Lösen von Logikaufgaben, mathematischen Tests und das Programmieren zählen.
PaLM 2 will Google in vier Größen anbieten, die unter den Codenamen Gecko, Otter, Bison und Unicorn laufen. Gecko als kleinstes Sprachmodell soll so klein sein, dass es auf Mobilgeräten laufen kann und trotzdem schnell genug für interaktive Anwendungen ist. Angesichts der Größenordnungen spricht Google von einer Vielseitigkeit, sodass PaLM 2 mit entsprechenden Finetuning für komplette Produktklassen auf mehrere Arten einsetzbar ist.
Eine dieser spezialisierten Varianten ist Med-PaLM-2, das für den Einsatz im Gesundheitswesen vorgesehen ist. Es ist auf medizinische Inhalte ausgelegt und soll etwa helfen, komplexe und unstrukturierte Texte verständlich darzustellen. Ebenso kann es bei Aufgaben wie der Dokumentation unterstützen. Zunächst folgt aber eine Testphase, um potenzielle Anwendungsfälle und Sicherheitsmechanismen zu prüfen. Verfügbar sein wird es in den kommenden Wochen für eine ausgewählte Gruppe.
Bard mit neuem Sprachmodell und mehr Funktionen
PaLM 2 ist auch die neue Grundlage für Bard. Bislang basierte der Chatbot auf dem LaMDA-Sprachmodell. Wie die auf komplexen Sprachmodellen aufbauenden KI-Chatbots funktionieren, erklärt ComputerBase in einem Hintergrundartikel.
Was heute erfolgt, ist so etwas wie ein Neustart für Bard. Der Chatbot war symptomatisch für Googles enttäuschende KI-Performance der letzten Monate. Eigentlich als ChatGPT-Konkurrent geplant, verhagelte bereits eine fehlerhafte Antwort bei der offiziellen Präsentation den Start – und seitdem lief es nicht wesentlich besser. Intern sollen Mitarbeiter vor einer verfrühten Veröffentlichung gewarnt haben. Zu viele Fehler machte und nicht kreativ genug bei den Antworten war Bard. Vor allem im Vergleich mit ChatGPT machte Bard keine gute Figur.
Die Botschaft bei der I/O 2023 ist nun: Google ist wieder bei der Musik. Bereits in den letzten Wochen wurde Bard um neue Funktionen wie das Programmieren erweitert, was bereits eine der beliebtesten Funktionen ist, erklärte Google Vice President Sissie Hsiao. Durch die Fähigkeiten von PaLM 2 wurde der Chatbot nun weiter aufgerüstet.
Verfügbar sollen auch bald visuelle Antworten sein. Fragt der Nutzer nach den interessantesten Sehenswürdigkeiten einer Stadt, erhält er auch Bilder in der Ausgabe. Durch die Integration von Google Lens kann Bard bald auch Bilder als Prompt-Eingabe verarbeiten.
Künftig soll der Chatbot zudem um weitere Google Apps wie Docs, Gmail und Maps sowie um externe Anwendungen wie Adobe Firefly ergänzt werden. Im Kern dürfte es sich um Erweiterungen wie die Plugins bei ChatGPT handeln.
Warteliste für Bard entfällt
Zudem ist Bard nun in mehr Sprachen und Ländern verfügbar. Bislang war der Einsatz auf die USA und das Vereinigte Königreich beschränkt, bald sollen weitere folgen. Zudem gibt es von nun an keine Warteliste mehr, Bard öffnet sich somit für deutlich mehr Anwender. In Deutschland ist der Chatbot stand jetzt noch nicht verfügbar.
PaLM2-Nachfolger wird bereits trainiert
Mit Gemini arbeitet Google bereits am PaLM-2-Nachfolger. Derzeit wird das Sprachmodell noch trainiert, der Schwerpunkt soll auf multimodalen Funktionen liegen – neben Text soll es also verstärkt auch Bilder-, Video- und Audio-Inhalte verarbeiten können. Sowohl bei den Fähigkeiten als auch der Effizienz soll sich Gemini nochmals deutlich von PaLM 2 absetzen.