Generatives Löschen, Cocreator und mehr: Die KI-Bildbearbeitung in Windows 11 ist eine Baustelle

Andreas Frischholz
51 Kommentare
Generatives Löschen, Cocreator und mehr: Die KI-Bildbearbeitung in Windows 11 ist eine Baustelle

KI-Bildbearbeitung hält Einzug in Windows 11. Microsoft stattet Paint und die Foto-App mit Funktionen wie Generatives Löschen aus, Copilot+ PCs bieten mit dem Cocreator und Restyle Image noch mehr. Der Haken: Die Qualität ist ernüchternd und kein Vergleich zu dem, was Adobe oder Google bieten. Eine Analyse.

Paint und die Foto-App in Windows 11 bieten mittlerweile eine breite Palette an KI-Funktionen. Wenn man einen Copilot+ PC nutzt, reicht die Spannweite von Generatives Löschen über Generatives Füllen und Hintergrund-Effekte bis zu Größenskalierungen von Bildern. Mit dem Cocreator, den Microsoft als Vorzeige-Feature vermarktet, lassen sich in Paint Vorlagen zeichnen, die dann die Grundlage für KI-Bilder sind.

Weil Copilot+ PCs bislang nicht weit verbreitet sind, dürfte für die meisten Nutzer aber die Funktionen von Interesse sein, die auf allen Windows-11-Systemen laufen. Das ist in erster Linie das Generative Löschen, also eines der KI-Standardwerkzeuge bei der Bildbearbeitung, das Microsoft für alle zugänglich macht. Ebenfalls für alle verfügbar ist das Entfernen der Hintergründe.

Die Frage ist nur: Wie gut sind Microsofts KI-Werkzeuge? Und wie schneiden diese im Vergleich zur Konkurrenz ab?

KI-Feature in Paint und der Windows Foto-App

Der Test der exklusiven Copilot+-Funktionen erfolgte auf einem Asus ProArt PZ13, zusätzlich wurde noch ein herkömmliches Laptop mit Windows 11 24H2 verwendet. Verglichen wurden die Ergebnisse mit den generativen KI-Tools in Adobe Photoshop sowie dem Magischen Editor in Googles Foto-App auf einem Pixel 8.

Der Ablauf für die Tests sollte jeweils so einfach wie möglich sein: Bei jedem Bild wurden die Bearbeitungsfunktion in der jeweiligen App geöffnet und der erste Versuch gespeichert. Weil KI-Funktionen wie Generatives Löschen immer etwas unterschiedliche Ergebnisse ausgeben, sind diese Ergebnisse nicht repräsentativ. Was sich aber erkennen lässt, ist ein Eindruck von dem, was die jeweilige App generell leisten kann.

Wie gut funktioniert Generatives Löschen in Paint?

Mit dem Generativen Löschen lassen sich unerwünschte Objekte aus Bildern entfernen, während der Hintergrund intakt bleibt. In Paint öffnet man die Funktion, indem man über das Auswahlmenü eine Stelle im Bild markiert. Dann erscheint die entsprechende Werkzeugleiste. In der Fotos-App muss man über den Menüpunkt Bearbeiten den entsprechenden Reiter auswählen, dann kann man Objekte im Bild markieren, die entfernt werden sollen.

Microsoft hat die Testphase in Paint bereits Ende 2023 gestartet. Nun lässt es sich sowohl über Paint als auch die Fotos-App in Windows nutzen. Man benötigt lediglich die aktuelle Paint-Version und muss sich mit einem Microsoft-Konto anmelden.

Für den Testlauf beim Generativen Löschen wurden vier Bilder mit unterschiedlichen Schwierigkeitsgraden ausgewählt. Bei Bild 1 in diesem Testlauf ist die Aufgabe noch simpel, entfernt werden soll das CB-Logo auf der Jubiläumstasse von ComputerBase. Das schaffen sowohl Paint als auch die Windows-Foto-App – auch wenn letztere zwei Anläufe benötigte. Bei diesem Bild gibt es auch keine Unterschiede im Vergleich zu Adobes KI-Tools in Photoshop sowie dem magischen Editor in der Google-Foto-App.

Im zweiten Bild sind die Grenzen aber bereits erkennbar. Entfernt werden soll bei diesem Test das Laptop auf dem Tisch. Bei Paint ist der generierte Hintergrund verwaschen, die Line zwischen Tisch und Wand wird nicht sauber erstellt und zudem wird die Putzstruktur auf der Wand nicht übernommen. Die Foto-App von Windows liefert ein ähnliches Ergebnis. Photoshop schafft es hingegen, die Struktur der Wand zu übernehmen. Hintergrund und Linienführung sind aber nicht so scharf wie bei Google Fotos. Erstaunlich ist zudem bei Photoshop: Obwohl man nur Objekte entfernen will, tendiert das Programm manchmal dazu, zufällig neue Inhalte zu generieren.

Bild 3 ist eine Waldaufnahme mit einer Bank mitten im Laub. Ab jetzt werden die Unterschiede sichtbar. Während Paint und die Windows-Foto-App es nicht schaffen, die Bank adäquat zu entfernen, ist so eine Anpassung mit Photoshop und Googles KI-Funktionen einfach möglich. Dasselbe Ergebnis zeigt sich bei Bild 4, bei dem eine Person aus einem Bild entfernt werden soll. Diese steht vor einem Zaun, dessen Struktur übertragen werden muss. Paint und die Windows-Foto-App schaffen es nicht, der generierte Inhalte ist matschig. Während Photoshop im ersten Anlauf eine ordentliche Vorlage liefert, generiert Googles Magischer Editor ein beeindruckendes Ergebnis.

Was anhand dieses kleinen Testlaufs erkennbar ist: Kleinere Retuschen lassen sich in Windows 11 mit Paint und der Foto-App umsetzen, vergleichbar mit Photoshop und Googles Foto-App sind die Resultate aber nicht. Dass Photoshop beim Generativen Entfernen vereinzelt schwächelt, ist etwas überraschend. Im Endeffekt ist es aber weniger relevant, weil das Bildbearbeitungsprogramm einen riesigen Werkzeugkasten bietet. Man kann also ohne Weiteres nachjustieren, um Makel zielgerichtet auszubessern. Das Profi-Tool lässt hier die Muskeln spielen, während die Grenzen von Paint und Co. klar ersichtlich sind.

Den besten Eindruck für eine schnelle Bildkorrektur hinterlässt aber Googles Magischer Editor. Am Smartphone lassen sich Bilder im Handumdrehen bearbeiten, selbst komplexere Objekte verschwinden tadellos.

Wie gut lassen sich Hintergründe entfernen?

Sowohl mit Paint als auch mit der Foto-App lassen sich Hintergründe freistellen. In Paint erreicht man die Funktion erneut über das Auswahlmenü, in der Foto-App über die Bearbeiten-Funktion. Bei einfachen Aufnahmen mit klaren Grenzen wie dem CPU-Foto klappt es in beiden Apps gut. Handelt es sich um komplexere Objekte wie die Reihe an Grafikkarten, kommt das System beim ersten Anlauf an seine Grenzen. Bei der Foto-App ist es immerhin möglich, einzelne Stellen im Bild nachträglich noch zu markieren.

Exklusive Copilot+-Funktionen: Cocreator und Restyle Image

Während die bisherigen Funktionen für alle Nutzer bereitstehen, bietet Microsoft noch KI-Tools, die exklusiv für Copilot+ PCs sind. Paint wurde um den Cocreator und Generatives Füllen ergänzt, die Foto-App hat eine Restyle-Image-Funktion und ein KI-Upscaling für Bilder.

Cocreator: Zeichnen und Prompten

Der Cocreator in Paint verarbeitet neben Text-Prompts auch Zeichnungen als Eingaben. Per Maus oder Tablet-Stift kann man so eine Vorlage erstellen, die das Tool in ein KI-Bild übersetzt. Beim Generieren kann man zwischen Stilen wie Ölgemälde oder Anime wählen und zusätzlich noch das Maß an Kreativität festlegen – je höher der Wert, desto mehr Freiheiten hat der KI-Bildergenerator, von der Vorlage abzuweichen.

Bei den ersten Versuchen ist der Cocreator tatsächlich unterhaltsam. Da das Testgerät Asus ProArt PZ13 mit dem Asus Pen ausgeliefert wird, ist das Setup für das KI-Tool ideal. Wer schon mit KI-Bildgeneratoren Spaß hat, dürfte hier zumindest für eine kurze Zeit ebenso Freude haben.

Nur stellt sich – wie bei anderen KI-Bildgeneratoren – schnell die Frage, wer das System dauerhaft nutzen soll. Der größte Haken beim Cocreator: Vor allem für professionelle Anwender ist es technisch zu wenig ausgereift. Eine der Schwächen ist, dass es zu Artefakten neigt. Einfach mal schnell ein Logo zeichnen und mehre Vorlagen generieren lassen, klappt so noch nicht. Dasselbe gilt bei allgemeinen Bildmotiven wie Tieren oder Landschaften, Makel und Mängel sind keine Seltenheit.

Wie stark die Artefakte sind, hängt von der Qualität der Zeichnung ab. Hat die Vorlage eine ordentliche Qualität, sehen die Bilder besser aus. Möglich ist es zudem, das vom Cocreator generierte Bild als neue Vorlage zu verwenden, um es so iterativ zu verbessern – durch angepasste Prompts (englische Eingaben funktionieren in der Regel besser als deutsche), den Kreativregeler oder die Stilvorlagen wie Pixelkunst oder Freiheitsskizze. Manchmal kommt so ein brauchbares Bild zu Stande, immer klappt es aber auch nicht.

Wer aber tatsächlich wert auf hochwertige KI-Bilder legt, sollte eher zu einem der normalen Bildgenerator tendieren. Will man aber mit Vorlagen arbeiten und nicht für Angebote wie die von Adobe zahlen, empfehlen sich Stable-Diffusion-Tools wie Automatic1111. Die Installation ist zwar umständlicher, dafür hat man wesentlich mehr Optionen und Gestaltungsspielraum – und erzielt bessere Ergebnisse. Auf den Bildern ist etwa zu sehen, wie eine Porträt-Aufnahme in das Blade-Runner-Setting übertragen wird. Während der Cocreator ein mehr oder weniger generisches Bild von einer Figur erstellt, liefert Automatic1111 ein Bild, in dem die Vorlage wiederzuerkennen ist.

Restyle Image und AI-Skalierung in der Fotos-App

Der Vergleich mit Automatic111 drängt sich auch bei der Restyle-Funktion in der Foto-App auf. Diese ist eines der exklusiven KI-Feature, das es ermöglicht, Bilder in anderen Stilrichtungen umzuwandeln. Man erreicht diese ebenfalls über das Bearbeiten-Menü. Vorlagen kann man also in ein Cyberpunk-Szenarien oder Pixelkunst übertragen – zumindest in der Theorie. Das Problem in der Praxis: Es funktioniert fast nie. Selbst bei Landschaftsaufnahmen wie dem Bild mit der Bank im Wald scheitert es. Der Stil soll in diesem Fall „Papierkunstwerk“ sein, es ist einer der Stilrichtungen, die in der Foto-App als Vorlage angezeigt werden.

Wie so ein Ergebnis zu Stande kommt, ist unverständlich. Denn mit Microsoft Designer bietet der Konzern ein Tool an, das so eine Aufgabe adäquat umsetzt.

Was tatsächlich wirklich nützlich ist, ist die Superauflösung-Funktion in der Foto-App. Die Auflösung von Bildern mit KI-Upscaling zu erhöhen, ist keine Neuheit, funktioniert in der App aber gut und erleichtert tatsächlich den Alltag.

Generatives Füllen in Paint

Beim Generativen Füllen, das sich in Paint ebenfalls über das Auswahlmenü öffnen lässt, fällt das Fazit ebenfalls ernüchternd aus. Nur bei einfachen Motiven lassen sich die Bilder sinnvoll um zusätzliche Objekte ergänzen – bei klaren Hintergründen wie einer Tischplatte kann man etwa eine Kaffeetasse hinzufügen. So etwas sieht halbwegs adäquat aus. Versucht man hingegen, ein Bild wie die Waldaufnahme um Elemente wie Pilze zu ergänzen, scheitert Microsofts KI. Alternativen wie Photoshop liefern realistischere Ergebnisse.

Was zudem irritiert: Will man Inhalte in ein Bild generieren, liegt die Grenze bei 2.000 x 2.000 Pixeln. Bei größeren Aufnahmen verweigert das Tool den Dienst. Bei aktuellen Bildern ist das also praktisch immer der Fall.

Fazit: Microsofts Bild-KI ist eine Baustelle

Was Microsoft derzeit bei der generativen KI-Bildbearbeitung bietet, ist in der Summe so enttäuschend, dass es schon wieder erstaunt. Während Standardwerkzeuge wie generatives Löschen – die für alle Nutzer zur Verfügung stehen – zumindest bei kleinen Aufgaben funktionieren, bleiben vor allem die exklusiven Copilot+-Funktionen unter den Erwartungen.

Der Cocreator in Paint macht etwa kurzzeitig Spaß, nur stellt sich die Frage: Wo ist der Einsatzzweck? Denkbar sind grundsätzlich diverse Szenarien. Wenn man etwa plant, die Wohnung neu einzurichten, können Tools wie ChatGPT oder Gemini schon heute Vorschläge unterbreiten. Die Ergebnisse sind in der Regel aber noch ausbaufähig und fehlerhaft, Schranktüren zeigen auf solchen Plänen schon mal zur Denke und Eingaben sowie Korrekturen lassen sich kaum einbauen. Der Cocreator könnte bei so einem Szenario Vorteile haben: Man gibt bestehende Pläne ein, ergänzt diese händisch und erhält am Ende ein brauchbares Ergebnis – am besten noch mit Visualisierung.

Solche Lösungen wären auch nötig, um die Ansprüche der Copilot+ PCs zu erfüllen, die Microsoft immer wieder formuliert. Noch ist der Cocreator davon aber meilenweit entfernt. Und es ist nicht mal klar, ob Microsoft überhaupt in diese Richtung gehen will. Schaut man sich die Werbevideos an, ist der Cocreator derzeit eher eine Eingabehilfe für eine Bild-KI. Ein nettes Feature, mehr aber nicht.

So steht der Cocreator symptomatisch für Microsofts KI-Bildbearbeitung in Windows 11, die derzeit vor allem eine Baustelle ist. Zu viele der Tools und KI-Helfer wirken nur halbfertig und schlecht integriert, Konzepte scheinen nicht zu Ende gedacht. Wie es besser geht, zeigt etwa Google. Der Magische Editor liefert beim Generativen Löschen hervorragende Ergebnisse, mit „Best Take“ lassen sich auf Fotos die Köpfe von Personen neu ausrichten. Und mit der Pixel-9-Funktionen „Mich hinzufügen“ ist es zudem möglich, komplette Personen in ein Bild einzufügen. Solche Feature führen zwar zu Diskussionen über Fake Fotos und die Frage, wann ein Foto überhaupt noch ein Foto ist. Der zentrale Punkt an der Debatte ist aber: Den Bildern selbst merkt man es in der Regel kaum an, so gut sind die Anpassungen. Es ist eine Qualität, die Diskussionen überhaupt erst entstehen lässt.

Was Google damit zeigt, ist das Niveau, das Microsoft bei der KI-Bildbearbeitung in Windows 11 erreichen muss. Denn damit wäre es eine Alternative für diejenigen, die Bilder nachjustieren wollen, aber nicht für ein Profi-Tool wie Photoshop zahlen möchten. Bislang scheitert Microsoft aber an diesem Standard.

Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.