[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

@Uzer1510
Wirklich Pro für 200$? Plus für 20$ macht bei der Bildgenerierung eigentlich alles sehr gut. Und wenn man nur ab und zu Bilder promptet, dann geht auch viel mit der Free-Version. Ab und zu ist es aber immer mal wieder deaktiviert oder limitiert.
 
naja pro wird durch meinen Arbeitgeber bezahlt selber würde ich das nicht bezahlen, ich nutze das eher für so krimkrams
 
  • Gefällt mir
Reaktionen: Ayo34
Welches Tool ist denn empfehlenswert wenn ich ein Bild hochladen möchte und dann beschreiben möchte wie es angepasst werden soll? Mit ChatGPT funktioniert das super. Gibt es noch gute Alternativen?

Bei Reve kann ich zwar eins uploaden aber er generiert dann gleich was ohne dass ich sagen kann wie er es verändern soll. Auch Leonardo.AI und Pixlr waren nicht das gesuchte.
 
Das Zauberwort heißt Inpainting. Das ist die Funktion um ein Bild zu bearbeiten. Bei Flux geht das z.B. extrem gut, da kann man dann auch nur bestimmte Bereiche auswählen, die bearbeiten werden soll im Bild. Inpainting funktioniert zwar auch bei GPT4o, allerdings wird trotzdem das ganze Bild verändert, was ich irgendwie merkwürdig finde, weil, warum dann einen Bereich auswählen.

Andere Funktionen übernehmen dann teilweise nur den Stil, die Umrisse oder dienen als Vorlage. Und wenn man ein Bild erweitern möchte, dann heißt es Outpainting.
 
Mit Flux habe ich mich noch gar beschäftigt. Gibt es für ComfyUI vielleicht einen guten Workflow? Idealerweise mit Upscaler, Face/Eye-Detailer etc.?
 
Im Eingangspost habe ich SwarmUI empfohlen. Dort kannst Du sachen wie Inpainting (und Outpainting), Upscaling und auch segmentiertes inpainting in der der Art von Face/Eye detailing machen, außerdem hast Du jederzeit die Möglichkeit in das Workflow TAB zu wechseln und dort jeden beliebigen Workflow zu laden. Also Comfy+Interface. Als die Flux Tools rauskamen, zu denen Flux Fill, das Inpainting-Model gehört, fand ich das Video recht hilfreich (ist in Swarm und sehr umfangreich) da es direkt die benötigten Werte bespricht (z.B. muss neben dem üblichen CFG 1 die FluxGuidance Scale auf 30 hochgesetzt werden).


Habe mit Flux Fill schon einige Bilder von chatGPT verbessert, da das Inpainting dort noch nicht so das gelbe vom Ei ist, wie oben schon erwähnt wurde.. :)

Ich glaube das Flux Fill full Model läuft erst ab 24GB gut, bin mir aber nicht sicher, mit der 4080 kannst du ja FP8 und Full mal testen.. Du findest die Models hier:

Full: https://huggingface.co/black-forest-labs/FLUX.1-Fill-dev/tree/main oder https://civitai.com/models/970162/flux-tools-fill
FP8: https://civitai.com/models/969431/flux-fill-fp8
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Vigilant
Prima, danke. Werde ich mir bei Gelegenheit anschauen.
 
Amuse v3.0.1 ist erschienen. Dazu gibt es auch einen neuen Betra Treiber für AMD Karten. :daumen:

Amuse v3.0
------------------------------------------
SDXL ControlNet Support
Added support for Canny, SoftEdge, OpenPose, Depth, Lineart, Scribble, and Tile ControlNets.

Inpaint Improvements
Enhanced inpainting quality and output, including full SDXL support.

Memory Management
New automatic memory mode that optimizes performance based on your hardware.

Upscaler Improvements
Added support for tiling, reducing VRAM usage and enabling infinite upscaling.

Locomotion Support
Support for Locomotion Text-to-Video models.

Model Download Improvements
Download queuing and resume-on-failure support added.
 
  • Gefällt mir
Reaktionen: MechanimaL
Danke, kannte ich noch nicht. Ich nehme mal an, trotz AMD-Optimierung kommt Nvidia auch damit klar?
 
@Vigilant
Mangels nVidia GPU kann ich das nicht prüfen, aber ich gehe davon aus. Lässt sich auch auf der CPU berechnen damit... Dann halt deutlich langsamer, aber dafür mit allem was der Systemspeicher hergibt für die großen Modelle. :D

Außerdem scheint es mir deutlich stabiler als die vorherige Version 2.3.x. Die ist gerne noch mal gelegentlich abgestürzt. Gestern bei einigen dutzend Versuchen keinerlei Probleme. :daumen:

Hab versucht eines meiner Selbstportraits in einen Comic-Stil umzuwandeln:

image-1887511966.png
 
  • Gefällt mir
Reaktionen: Vigilant
Shaav schrieb:
Anhang anzeigen 1371985

Positive Promt:
guinea pig with sabre-toothes is howling,
night,
moonlight,
on a big rock,
forest,
wide angle,
sideview

Negative Promt:
painting,
oil painting,
watermark

Weitere Einstellungen:
Steps: 50,
Sampler: Euler a,
CFG scale: 13,
Seed: 342471910,
Size: 910x512,
Model hash: 27a4ac756c,
Model: SD15NewVAEpruned,
Version: v1.4.0

Ich bräuchte mal eure Hilfe.
Es fehlen weiterhin die Säbelzähne, das Heulen und die Tageszeit ist falsch.

Verschiedene Werte für CFG Scale hatten kein Erfolg. Habt ihr eine bessere Idee?


2 Jahre später mit Sora:
"Ein Meerschweinchen mit Säbelzähnen eines Säbelzahntigers am Oberkiefer steht an einer Klippe auf brüllt. dadurch soll das Meerschwein furchteinflößend wirken. es ist Vollmond."
 

Anhänge

  • assets-task_01js6fa9zfe4tvye1pwes2gw6w-img_0.webp
    assets-task_01js6fa9zfe4tvye1pwes2gw6w-img_0.webp
    197,8 KB · Aufrufe: 20
  • Gefällt mir
Reaktionen: Ayo34
@Shaav Das zeigt so schön die Entwicklung und das in so kurzer Zeit. Früher für schlechte Ergebnisse jede Menge komplizierten Prompt schreiben. Heute einfach einem Chatbot sagen, was man möchte und Anpassungen fordern.
 
  • Gefällt mir
Reaktionen: Uzer1510
Sora ist doch ChatGPT?
 
@oicfar Über Sora hast du einfach eine andere Benutzeroberfläche um Bilder über GPT4o zu erstellen. Kannst 2-4 Bildervarianten gleichzeitig erstellen, hast eine Queue, kannst Formate und Designvorlage auswählen. Aber je nach Funktion braucht man da das Plus oder Pro Abo.
 
  • Gefällt mir
Reaktionen: oicfar
Hier mal zwei Beispiele aus der aktuellen Midjourney v7 Alpha...

1000047483.pngpain_o_matic_A_guinea_pig_with_the_sabre_teeth_of_a_sabre-too_f1edb492-8a0b-4ea1-b26e-7ddc9422...png
 
  • Gefällt mir
Reaktionen: Uzer1510
MaverickM schrieb:
Amuse v3.0.1 ist erschienen. Dazu gibt es auch einen neuen Betra Treiber für AMD Karten. :daumen:
in einem Kommentar bei Huggingface habe ich was von "zensiert" gelesen. Kannst du das mal testen ? ^^
 
Zurück
Oben