[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

@Uzer1510
Wirklich Pro für 200$? Plus für 20$ macht bei der Bildgenerierung eigentlich alles sehr gut. Und wenn man nur ab und zu Bilder promptet, dann geht auch viel mit der Free-Version. Ab und zu ist es aber immer mal wieder deaktiviert oder limitiert.
 
naja pro wird durch meinen Arbeitgeber bezahlt selber würde ich das nicht bezahlen, ich nutze das eher für so krimkrams
 
  • Gefällt mir
Reaktionen: Ayo34
Welches Tool ist denn empfehlenswert wenn ich ein Bild hochladen möchte und dann beschreiben möchte wie es angepasst werden soll? Mit ChatGPT funktioniert das super. Gibt es noch gute Alternativen?

Bei Reve kann ich zwar eins uploaden aber er generiert dann gleich was ohne dass ich sagen kann wie er es verändern soll. Auch Leonardo.AI und Pixlr waren nicht das gesuchte.
 
Das Zauberwort heißt Inpainting. Das ist die Funktion um ein Bild zu bearbeiten. Bei Flux geht das z.B. extrem gut, da kann man dann auch nur bestimmte Bereiche auswählen, die bearbeiten werden soll im Bild. Inpainting funktioniert zwar auch bei GPT4o, allerdings wird trotzdem das ganze Bild verändert, was ich irgendwie merkwürdig finde, weil, warum dann einen Bereich auswählen.

Andere Funktionen übernehmen dann teilweise nur den Stil, die Umrisse oder dienen als Vorlage. Und wenn man ein Bild erweitern möchte, dann heißt es Outpainting.
 
Mit Flux habe ich mich noch gar beschäftigt. Gibt es für ComfyUI vielleicht einen guten Workflow? Idealerweise mit Upscaler, Face/Eye-Detailer etc.?
 
Im Eingangspost habe ich SwarmUI empfohlen. Dort kannst Du sachen wie Inpainting (und Outpainting), Upscaling und auch segmentiertes inpainting in der der Art von Face/Eye detailing machen, außerdem hast Du jederzeit die Möglichkeit in das Workflow TAB zu wechseln und dort jeden beliebigen Workflow zu laden. Also Comfy+Interface. Als die Flux Tools rauskamen, zu denen Flux Fill, das Inpainting-Model gehört, fand ich das Video recht hilfreich (ist in Swarm und sehr umfangreich) da es direkt die benötigten Werte bespricht (z.B. muss neben dem üblichen CFG 1 die FluxGuidance Scale auf 30 hochgesetzt werden).


Habe mit Flux Fill schon einige Bilder von chatGPT verbessert, da das Inpainting dort noch nicht so das gelbe vom Ei ist, wie oben schon erwähnt wurde.. :)

Ich glaube das Flux Fill full Model läuft erst ab 24GB gut, bin mir aber nicht sicher, mit der 4080 kannst du ja FP8 und Full mal testen.. Du findest die Models hier:

Full: https://huggingface.co/black-forest-labs/FLUX.1-Fill-dev/tree/main oder https://civitai.com/models/970162/flux-tools-fill
FP8: https://civitai.com/models/969431/flux-fill-fp8
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Vigilant
Prima, danke. Werde ich mir bei Gelegenheit anschauen.
 
Amuse v3.0.1 ist erschienen. Dazu gibt es auch einen neuen Betra Treiber für AMD Karten. :daumen:

Amuse v3.0
------------------------------------------
SDXL ControlNet Support
Added support for Canny, SoftEdge, OpenPose, Depth, Lineart, Scribble, and Tile ControlNets.

Inpaint Improvements
Enhanced inpainting quality and output, including full SDXL support.

Memory Management
New automatic memory mode that optimizes performance based on your hardware.

Upscaler Improvements
Added support for tiling, reducing VRAM usage and enabling infinite upscaling.

Locomotion Support
Support for Locomotion Text-to-Video models.

Model Download Improvements
Download queuing and resume-on-failure support added.
 
  • Gefällt mir
Reaktionen: MechanimaL
Danke, kannte ich noch nicht. Ich nehme mal an, trotz AMD-Optimierung kommt Nvidia auch damit klar?
 
Zurück
Oben