[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Ayo34 · 31. Oktober 2024

@blubberbirne Bei Stable Diffusion 3.5 stimme ich dir zu. Es bleibt eine kleine Verbesserung zu 3.0, aber ist eben nicht im Bereich von Flux.

Aber an Flux führt kein Weg vorbei? Ich prompte gerade mit dem Red Panda... und in der Arena übertrifft das Modell schon mal Flux Pro und auch das neue Flux Pro 1.1!

https://www.all-ai.de/news/top-news24/recrafts-red-panda-v3-die-neue-spitze-in-der-arena

Rickmer · 31. Oktober 2024

Hmm... abgesehen davon, dass ich eh nicht für Bildgeneratoren zu haben bin, die ich nicht lokal laufen lassen kann, waren die wenigen Testrender die ich kurz gemacht habe nicht vollständig überzeugend.

Beispiel:

five 20 year old women looking at the viewer in a lineup starting with a petite blonde white woman on the left, a tan mediterranian woman in the middle and a large black woman with an afro on the right

Zum einen sind die meisten Frauen sicherlich keine 20 Jahre alt vom Aussehen (auch bei anderen Bildern), zweitens haben die auch in mehreren Versuchen immer zur Seite geschaut und drittens ist das nicht was ich mit 'lineup' meinte. Nebeneinander bitte!

Auch als ich nach einem neuschwänzigem Fuchs (kitsune) gefragt habe gab's nur einen Schwanz.

a nine tailed kitsune in a forest hunting a rabbit

Für mich sieht das mehr aus als ob der Fuchs vorm Hasen Schiss hat... und dass ein Hase einen langen Schwanz hat wär mir auch neu.

Ayo34 · 31. Oktober 2024

Ich glaube beim zweiten Bild gibt es mehrere Probleme für die KI. Auf der einen Seite haben wir ein realistisches Bild, wollen aber einen Fuchs mit 9 Schwänzen. Und häufig ist es ja so, dass Beschreibungen sich auch auf andere Dinge im Bild auswirken. Wollen wir z.B. einen weißen Fuchs und schreiben keine Farbe zum anderen Tier dazu, dann wird es häufig auch weiß. Hier hat die KI wohl beim versuch realistisch 9 Schwänze unterzubringen auch einen beim Kaninchen platziert. Ebenso ist nicht angegeben im Prompt, wer vor wem Angst hat. Hat das Kaninchen bereits den Fuchs wahr genommen? ...

Hier sieht dann der "Hase" ängstlich aus und nicht mehr der Fuchs. Müsste man mal schauen wie man den Prompt noch anpassen müsste. Interessant ist ja dann immer der Vergleich, was andere KIs aus dem gleichen Prompt machen.

Rickmer schrieb:
Hmm... abgesehen davon, dass ich eh nicht für Bildgeneratoren zu haben bin, die ich nicht lokal laufen lassen kann, waren die wenigen Testrender die ich kurz gemacht habe nicht vollständig überzeugend.

Das sehe ich genauso, daher ist Stable Diffusion und meistens Flux im Einsatz.

Deine Prompts mit Flux Dev:

Hier sieht man meiner Meinung nach 2 Dinge. Einmal ist Flux überragend bei realistischen Personen, aber es sind eben nur 3 und nicht 5. Und den anderen Prompt habe ich 4x versucht, aber jedes mal wurden es Freunde, und das Problem mit dem Schwanz ist ebenfalls vorhanden.

Rickmer · 31. Oktober 2024

Ayo34 schrieb:
Auf der einen Seite haben wir ein realistisches Bild, wollen aber einen Fuchs mit 9 Schwänzen.

Da ich keine Angabe zum Stil vorgegeben hatte, ist das Sache der KI.

Ayo34 schrieb:
Deine Prompts mit Flux Dev:

Ich hatte mehr Erfolg mit Flux im Breitformat - wobei da wirkliche Perfektion auch nicht zustande kam. Aber immerhin meistens 5 Personen (teils 4) und die Angaben zur Größe wurden auch (teils) befolgt.

Mit ausgiebiger Beschreibung hatte ich (bei einem NSFW Test) halt auch schonmal solche Resultate:

five nude women facing the viewer in a lineup starting with a petite blonde white woman with small breasts on the left followed by a tiny japanese woman with a purple bob cut, a tan mediterranian woman in the middle, a tall indian woman in the middle right and a large black woman with big breasts and an afro on the right

Die Nationalitäten würde SDXL mit Verwendung von Regional Prompter besser hinbekommen, aber dann wären alle wieder gleich groß...

Wie dem auch sei.

Ayo34 schrieb:
Und den anderen Prompt habe ich 4x versucht, aber jedes mal wurden es Freunde, und das Problem mit dem Schwanz ist ebenfalls vorhanden.

Stimmt, im Nachtest von mir hatte ich heute Flux auch keine mehrfachen Schwänze in dem Kontext abgewinnen bekommen.

Allerdings hatte ich auch mit Flux (jibMixFlux_v31ClarityKey) mal das generiert ohne ein spezifisches LoRa:

ninetales pokemon, kitsune, fox with nine fluffy tails sitting upgright, yellow fur

Ayo34 · 9. November 2024

Ohne Upscaling oder Lora, direkt gepromptet in 2048x2048 bzw. 2752x1536. Die Entwicklung geht weiter und der KI-Touch von vielen Bildern fehlt auch bzw. ist viel geringer. 👍

Vigilant · 9. November 2024

Welche Software, Modell, Anbieter?

Ayo34 · 9. November 2024

@Vigilant Flux Pro Ultra mit der Raw-Option über Replicate:

https://www.all-ai.de/news/top-news...dus-authentische-schnappschüsse-wie-nie-zuvor

blubberbirne · 31. Dezember 2024

Erstellt mit Flux Redux Workflow

Vigilant · 12. Januar 2025

Gerade darüber gestolpert:

https://www.worldlabs.ai/blog

Hier werden aus 2D-Grafiken 3D-Umgebungen erzeugt. Sehr spannend.

A.K. · 12. Februar 2025

Moin😎✌️

UniversalUpscaler_a26b7a9b-6657-4098-b4cc-4c41fcb64729.jpg

UniversalUpscaler_cdb327fd-c2ef-4e13-be8e-65c9307f42ae.jpg

UniversalUpscaler_af63b2d4-1743-4e19-ad8b-0242e8cecbaa_1.jpg

UniversalUpscaler_1d26c670-568f-43ef-9046-7d8e1d5d6897.jpg

UniversalUpscaler_7c09c4a0-421c-4964-af37-742344d55d4e.jpg

UniversalUpscaler_74665c87-3a6b-443d-b968-f313ee075a3e.jpg

UniversalUpscaler_78471228-7996-41d1-84fb-5a2334c4c7dd.jpg

UniversalUpscaler_5143c7b3-5555-4bf1-b463-481a3cb3b2c1.jpg

UniversalUpscaler_619b0945-4b8e-4b51-8420-9f9c48c7207b.jpg

UniversalUpscaler_be302279-2750-4135-b57b-8bdeaca82472.jpg

painomatic · 12. Februar 2025

@A.K. Schreib doch gern mal das genutzte Tool und Prompts/Settings dazu.

A.K. · 13. Februar 2025

Alles erstellt bei MS Designer

Prompts sind meine Eigenkreationen und die entwickelt man mit der Zeit weiter wenn man mal wieder eine Idee hatte und dabei einen neuen Trick17 lernt

Aber die KI macht halt auch viel selbst wie z.B. bei Wall Art da reicht ein Thema vorzugeben und man staunt was dabei rum kommt

MechanimaL · 14. Februar 2025

MS Designer verwendet übrigens das DALL-E 3 Model, soweit ich das grade nachsehen konnte ^^

Hatecore · 17. Februar 2025

Hallo zusammen, ich hatte letzte Woche mich mal wieder an die Grafikerstellung gemacht. Ich hatte ein Programm gefunden, samt Anleitung, in dem man diverse Generatoren wie Stable Diffusion aussuchen und installieren konnte. Leider hatte ich einen Festplattencrash und daher weder Download, Installation noch Browserverlauf zur Verfügung.

Das Ganze könnte man von der Funktion wie Steam beschreiben, man installiert das Programm und sucht die Generatoren aus die man haben möchte, sie werden auch über das Programm gestartet. Leider brachte die Suche ohne genauen Namen keinen Erfolg. Vielleicht hat der ein oder andere von euch eine Idee was ich suche.

Ayo34 · 17. Februar 2025

Hatecore schrieb:
Hallo zusammen, ich hatte letzte Woche mich mal wieder an die Grafikerstellung gemacht. Ich hatte ein Programm gefunden, ...

Du suchst ein Programm, welches beim Lügen eine lange Nase bekommt.

pinokio

Hatecore · 18. Februar 2025

Danke für die Info, das was ich hatte war zwar ein anderes, das sieht aber gut aus, ich beschäftige mich nachher an meinem Rechner mal damit.

Ayo34 · 18. Februar 2025

Pinokio ist ein System wo du ganz viele verschiedene KIs mit einem Knopfdruck quasi installieren kannst (Bild-Generatoren, Musik-KI, Text-to-Speech, LLM-Modelle wie Llama oder Deepseek). Sonst musst du noch etwas mehr beschreiben, was du hattest. War das nur ein Programm, wo du dann verschiedene Bildgeneratoren auswählen konntest, also keine andere KI-Programme?

Da gibt es dann jede Menge mit Automatic1111, ComfyUI... allerdings muss man da auch mehr machen.

Hatecore · 18. Februar 2025

Im Prinzip beschreibst du das andere Programm ziemlich genau, man installiert ein Programm, in diesem kann man dann die Generatoren aus einer Liste auswählen und installieren. Es muss ja nicht exakt das Programm sein das ich hatte, mehr als reingucken ging leider eh nicht, Pinokio ist ja vielleicht sogar überlegen, auf jeden Fall lade ich es mir runter und probiere es aus, Danke.

Tr8or · 9. März 2025

Hat hier schon jemand eine 9070(xt) und kann über die Performance berichten?

Vigilant · 9. März 2025

@Tr8or
Wurde gestestet: https://www.computerbase.de/artikel/grafikkarten/amd-radeon-rx-9070-xt-rx-9070-test.91578/seite-8

Oder meintest du etwas Besonderes?

[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Vice Admiral

Silent-Fanatiker Pro

Vice Admiral

Silent-Fanatiker Pro

Vice Admiral

Admiral

Vice Admiral

Lt. Commander

Admiral

Admiral

Lt. Commander

Admiral

Lieutenant

Lt. Commander

Vice Admiral

Lt. Commander

Vice Admiral

Lt. Commander

Lt. Commander

Admiral