Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)
- Ersteller MechanimaL
- Erstellt am
- Registriert
- Feb. 2019
- Beiträge
- 6.500
Welches Tool ist denn empfehlenswert wenn ich ein Bild hochladen möchte und dann beschreiben möchte wie es angepasst werden soll? Mit ChatGPT funktioniert das super. Gibt es noch gute Alternativen?
Bei Reve kann ich zwar eins uploaden aber er generiert dann gleich was ohne dass ich sagen kann wie er es verändern soll. Auch Leonardo.AI und Pixlr waren nicht das gesuchte.
Bei Reve kann ich zwar eins uploaden aber er generiert dann gleich was ohne dass ich sagen kann wie er es verändern soll. Auch Leonardo.AI und Pixlr waren nicht das gesuchte.
- Registriert
- Feb. 2019
- Beiträge
- 6.500
Das Zauberwort heißt Inpainting. Das ist die Funktion um ein Bild zu bearbeiten. Bei Flux geht das z.B. extrem gut, da kann man dann auch nur bestimmte Bereiche auswählen, die bearbeiten werden soll im Bild. Inpainting funktioniert zwar auch bei GPT4o, allerdings wird trotzdem das ganze Bild verändert, was ich irgendwie merkwürdig finde, weil, warum dann einen Bereich auswählen.
Andere Funktionen übernehmen dann teilweise nur den Stil, die Umrisse oder dienen als Vorlage. Und wenn man ein Bild erweitern möchte, dann heißt es Outpainting.
Andere Funktionen übernehmen dann teilweise nur den Stil, die Umrisse oder dienen als Vorlage. Und wenn man ein Bild erweitern möchte, dann heißt es Outpainting.
- Registriert
- Nov. 2005
- Beiträge
- 1.000
Im Eingangspost habe ich SwarmUI empfohlen. Dort kannst Du sachen wie Inpainting (und Outpainting), Upscaling und auch segmentiertes inpainting in der der Art von Face/Eye detailing machen, außerdem hast Du jederzeit die Möglichkeit in das Workflow TAB zu wechseln und dort jeden beliebigen Workflow zu laden. Also Comfy+Interface. Als die Flux Tools rauskamen, zu denen Flux Fill, das Inpainting-Model gehört, fand ich das Video recht hilfreich (ist in Swarm und sehr umfangreich) da es direkt die benötigten Werte bespricht (z.B. muss neben dem üblichen CFG 1 die FluxGuidance Scale auf 30 hochgesetzt werden).
Habe mit Flux Fill schon einige Bilder von chatGPT verbessert, da das Inpainting dort noch nicht so das gelbe vom Ei ist, wie oben schon erwähnt wurde..
Ich glaube das Flux Fill full Model läuft erst ab 24GB gut, bin mir aber nicht sicher, mit der 4080 kannst du ja FP8 und Full mal testen.. Du findest die Models hier:
Full: https://huggingface.co/black-forest-labs/FLUX.1-Fill-dev/tree/main oder https://civitai.com/models/970162/flux-tools-fill
FP8: https://civitai.com/models/969431/flux-fill-fp8
YouTube
An dieser Stelle steht ein externer Inhalt von YouTube, der den Forumbeitrag ergänzt. Er kann mit einem Klick geladen und auch wieder ausgeblendet werden.
Ich bin damit einverstanden, dass YouTube-Embeds geladen werden. Dabei können personenbezogene Daten an YouTube übermittelt werden. Mehr dazu in der Datenschutzerklärung.
Habe mit Flux Fill schon einige Bilder von chatGPT verbessert, da das Inpainting dort noch nicht so das gelbe vom Ei ist, wie oben schon erwähnt wurde..

Ich glaube das Flux Fill full Model läuft erst ab 24GB gut, bin mir aber nicht sicher, mit der 4080 kannst du ja FP8 und Full mal testen.. Du findest die Models hier:
Full: https://huggingface.co/black-forest-labs/FLUX.1-Fill-dev/tree/main oder https://civitai.com/models/970162/flux-tools-fill
FP8: https://civitai.com/models/969431/flux-fill-fp8
Zuletzt bearbeitet:
Amuse v3.0.1 ist erschienen. Dazu gibt es auch einen neuen Betra Treiber für AMD Karten. 

Amuse v3.0
------------------------------------------
SDXL ControlNet Support
Added support for Canny, SoftEdge, OpenPose, Depth, Lineart, Scribble, and Tile ControlNets.
Inpaint Improvements
Enhanced inpainting quality and output, including full SDXL support.
Memory Management
New automatic memory mode that optimizes performance based on your hardware.
Upscaler Improvements
Added support for tiling, reducing VRAM usage and enabling infinite upscaling.
Locomotion Support
Support for Locomotion Text-to-Video models.
Model Download Improvements
Download queuing and resume-on-failure support added.
@Vigilant
Mangels nVidia GPU kann ich das nicht prüfen, aber ich gehe davon aus. Lässt sich auch auf der CPU berechnen damit... Dann halt deutlich langsamer, aber dafür mit allem was der Systemspeicher hergibt für die großen Modelle.
Außerdem scheint es mir deutlich stabiler als die vorherige Version 2.3.x. Die ist gerne noch mal gelegentlich abgestürzt. Gestern bei einigen dutzend Versuchen keinerlei Probleme.
Hab versucht eines meiner Selbstportraits in einen Comic-Stil umzuwandeln:

Mangels nVidia GPU kann ich das nicht prüfen, aber ich gehe davon aus. Lässt sich auch auf der CPU berechnen damit... Dann halt deutlich langsamer, aber dafür mit allem was der Systemspeicher hergibt für die großen Modelle.

Außerdem scheint es mir deutlich stabiler als die vorherige Version 2.3.x. Die ist gerne noch mal gelegentlich abgestürzt. Gestern bei einigen dutzend Versuchen keinerlei Probleme.

Hab versucht eines meiner Selbstportraits in einen Comic-Stil umzuwandeln:

Shaav
Fleet Admiral
- Registriert
- Okt. 2009
- Beiträge
- 12.117
Shaav schrieb:Anhang anzeigen 1371985
Positive Promt:
guinea pig with sabre-toothes is howling,
night,
moonlight,
on a big rock,
forest,
wide angle,
sideview
Negative Promt:
painting,
oil painting,
watermark
Weitere Einstellungen:
Steps: 50,
Sampler: Euler a,
CFG scale: 13,
Seed: 342471910,
Size: 910x512,
Model hash: 27a4ac756c,
Model: SD15NewVAEpruned,
Version: v1.4.0
Ich bräuchte mal eure Hilfe.
Es fehlen weiterhin die Säbelzähne, das Heulen und die Tageszeit ist falsch.
Verschiedene Werte für CFG Scale hatten kein Erfolg. Habt ihr eine bessere Idee?
2 Jahre später mit Sora:
"Ein Meerschweinchen mit Säbelzähnen eines Säbelzahntigers am Oberkiefer steht an einer Klippe auf brüllt. dadurch soll das Meerschwein furchteinflößend wirken. es ist Vollmond."
Anhänge
oicfar
Captain
- Registriert
- Juni 2020
- Beiträge
- 3.295
ok, wusste nicht, dass das an der Stelle über Sora läuft.Ayo34 schrieb:Sora ist doch ChatGPT?
- Registriert
- Feb. 2019
- Beiträge
- 6.500
painomatic
Lt. Commander
- Registriert
- Okt. 2010
- Beiträge
- 1.095
- Registriert
- Nov. 2005
- Beiträge
- 1.000
in einem Kommentar bei Huggingface habe ich was von "zensiert" gelesen. Kannst du das mal testen ? ^^MaverickM schrieb: