[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Uzer1510 · 12. April 2025

ich nutze aktuell die pro also das 4o modell

Ayo34 · 12. April 2025

@Uzer1510
Wirklich Pro für 200$? Plus für 20$ macht bei der Bildgenerierung eigentlich alles sehr gut. Und wenn man nur ab und zu Bilder promptet, dann geht auch viel mit der Free-Version. Ab und zu ist es aber immer mal wieder deaktiviert oder limitiert.

Uzer1510 · 12. April 2025

naja pro wird durch meinen Arbeitgeber bezahlt selber würde ich das nicht bezahlen, ich nutze das eher für so krimkrams

Hendoul · 13. April 2025

Welches Tool ist denn empfehlenswert wenn ich ein Bild hochladen möchte und dann beschreiben möchte wie es angepasst werden soll? Mit ChatGPT funktioniert das super. Gibt es noch gute Alternativen?

Bei Reve kann ich zwar eins uploaden aber er generiert dann gleich was ohne dass ich sagen kann wie er es verändern soll. Auch Leonardo.AI und Pixlr waren nicht das gesuchte.

Ayo34 · 13. April 2025

Das Zauberwort heißt Inpainting. Das ist die Funktion um ein Bild zu bearbeiten. Bei Flux geht das z.B. extrem gut, da kann man dann auch nur bestimmte Bereiche auswählen, die bearbeiten werden soll im Bild. Inpainting funktioniert zwar auch bei GPT4o, allerdings wird trotzdem das ganze Bild verändert, was ich irgendwie merkwürdig finde, weil, warum dann einen Bereich auswählen.

Andere Funktionen übernehmen dann teilweise nur den Stil, die Umrisse oder dienen als Vorlage. Und wenn man ein Bild erweitern möchte, dann heißt es Outpainting.

Vigilant · 13. April 2025

Mit Flux habe ich mich noch gar beschäftigt. Gibt es für ComfyUI vielleicht einen guten Workflow? Idealerweise mit Upscaler, Face/Eye-Detailer etc.?

MechanimaL · 14. April 2025

Im Eingangspost habe ich SwarmUI empfohlen. Dort kannst Du sachen wie Inpainting (und Outpainting), Upscaling und auch segmentiertes inpainting in der der Art von Face/Eye detailing machen, außerdem hast Du jederzeit die Möglichkeit in das Workflow TAB zu wechseln und dort jeden beliebigen Workflow zu laden. Also Comfy+Interface. Als die Flux Tools rauskamen, zu denen Flux Fill, das Inpainting-Model gehört, fand ich das Video recht hilfreich (ist in Swarm und sehr umfangreich) da es direkt die benötigten Werte bespricht (z.B. muss neben dem üblichen CFG 1 die FluxGuidance Scale auf 30 hochgesetzt werden).

Habe mit Flux Fill schon einige Bilder von chatGPT verbessert, da das Inpainting dort noch nicht so das gelbe vom Ei ist, wie oben schon erwähnt wurde..

Ich glaube das Flux Fill full Model läuft erst ab 24GB gut, bin mir aber nicht sicher, mit der 4080 kannst du ja FP8 und Full mal testen.. Du findest die Models hier:

Full: https://huggingface.co/black-forest-labs/FLUX.1-Fill-dev/tree/main oder https://civitai.com/models/970162/flux-tools-fill
FP8: https://civitai.com/models/969431/flux-fill-fp8

Vigilant · 14. April 2025

Prima, danke. Werde ich mir bei Gelegenheit anschauen.

MaverickM · Freitag um 03:51

Amuse v3.0.1 ist erschienen. Dazu gibt es auch einen neuen Betra Treiber für AMD Karten.

Amuse v3.0
------------------------------------------
SDXL ControlNet Support
Added support for Canny, SoftEdge, OpenPose, Depth, Lineart, Scribble, and Tile ControlNets.

Inpaint Improvements
Enhanced inpainting quality and output, including full SDXL support.

Memory Management
New automatic memory mode that optimizes performance based on your hardware.

Upscaler Improvements
Added support for tiling, reducing VRAM usage and enabling infinite upscaling.

Locomotion Support
Support for Locomotion Text-to-Video models.

Model Download Improvements
Download queuing and resume-on-failure support added.

Vigilant · Freitag um 09:24

Danke, kannte ich noch nicht. Ich nehme mal an, trotz AMD-Optimierung kommt Nvidia auch damit klar?

MaverickM · Freitag um 21:24

@Vigilant
Mangels nVidia GPU kann ich das nicht prüfen, aber ich gehe davon aus. Lässt sich auch auf der CPU berechnen damit... Dann halt deutlich langsamer, aber dafür mit allem was der Systemspeicher hergibt für die großen Modelle.

Außerdem scheint es mir deutlich stabiler als die vorherige Version 2.3.x. Die ist gerne noch mal gelegentlich abgestürzt. Gestern bei einigen dutzend Versuchen keinerlei Probleme.

Hab versucht eines meiner Selbstportraits in einen Comic-Stil umzuwandeln:

Shaav · Samstag um 09:37

Shaav schrieb:
Anhang anzeigen 1371985

Positive Promt:
guinea pig with sabre-toothes is howling,
night,
moonlight,
on a big rock,
forest,
wide angle,
sideview

Negative Promt:
painting,
oil painting,
watermark

Weitere Einstellungen:
Steps: 50,
Sampler: Euler a,
CFG scale: 13,
Seed: 342471910,
Size: 910x512,
Model hash: 27a4ac756c,
Model: SD15NewVAEpruned,
Version: v1.4.0

Ich bräuchte mal eure Hilfe.
Es fehlen weiterhin die Säbelzähne, das Heulen und die Tageszeit ist falsch.

Verschiedene Werte für CFG Scale hatten kein Erfolg. Habt ihr eine bessere Idee?

2 Jahre später mit Sora:
"Ein Meerschweinchen mit Säbelzähnen eines Säbelzahntigers am Oberkiefer steht an einer Klippe auf brüllt. dadurch soll das Meerschwein furchteinflößend wirken. es ist Vollmond."

Ayo34 · Samstag um 11:47

@Shaav Das zeigt so schön die Entwicklung und das in so kurzer Zeit. Früher für schlechte Ergebnisse jede Menge komplizierten Prompt schreiben. Heute einfach einem Chatbot sagen, was man möchte und Anpassungen fordern.

oicfar · Samstag um 11:50

@Shaav mit ChatGPT ...

Ayo34 · Samstag um 11:52

Sora ist doch ChatGPT?

Vigilant · Samstag um 11:53

oicfar · Samstag um 11:54

Ayo34 schrieb:
Sora ist doch ChatGPT?

ok, wusste nicht, dass das an der Stelle über Sora läuft.

Ayo34 · Samstag um 12:11

@oicfar Über Sora hast du einfach eine andere Benutzeroberfläche um Bilder über GPT4o zu erstellen. Kannst 2-4 Bildervarianten gleichzeitig erstellen, hast eine Queue, kannst Formate und Designvorlage auswählen. Aber je nach Funktion braucht man da das Plus oder Pro Abo.

painomatic · Sonntag um 19:44

Hier mal zwei Beispiele aus der aktuellen Midjourney v7 Alpha...

pain_o_matic_A_guinea_pig_with_the_sabre_teeth_of_a_sabre-too_f1edb492-8a0b-4ea1-b26e-7ddc9422...png

MechanimaL · Gestern um 16:02

MaverickM schrieb:
Amuse v3.0.1 ist erschienen. Dazu gibt es auch einen neuen Betra Treiber für AMD Karten.

in einem Kommentar bei Huggingface habe ich was von "zensiert" gelesen. Kannst du das mal testen ? ^^

[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Lt. Junior Grade

Vice Admiral

Lt. Junior Grade

Commander

Vice Admiral

Admiral

Lieutenant

Admiral

20k Fleet Admiral Pro

Admiral

20k Fleet Admiral Pro

Fleet Admiral

Anhänge

Vice Admiral

Captain

Vice Admiral

Admiral

Captain

Vice Admiral

Lt. Commander

Lieutenant