[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Rickmer · 13. April 2023

MechanimaL schrieb:
Cool. Könntest Du mal das Ausgangsbild schicken?

Klar, das Controlnet hatte ich auf Basis von diesem Bildchen gemacht:

Wie man sehen kann, hatte sich Stable Diffusion nicht super strikt dran gehalten - hatte ich auch in diesem Fall garnicht versucht.

Weitere Bilder gibts nicht - ich hatte mit einem Text2Image Prompt angefangen, den ich mir freihand ausgedacht hatte. Das Bild oben war rein für das Openpose Controlnet, weil ich keine Lust hatte, für drei Leute eine Pose manuell zusammen zu frickeln.

Gestern habe ich noch gesehen, dass es mittlerweile Controlnet-Sammlungen gibt, z.B. bei controlnetposes.com
Auch interessant, jedoch sind (bisher) fast keine Controlnets mit mehreren Personen bei.

MechanimaL schrieb:
Hast Du eigtl. versucht weitere Teile von Controlnet zu verwenden? Ich lese raus, dass ja, aber dass das nicht so gut geklappt hat? Oder war in dem Prozess bisher "nur" Openpose im Einsatz?

Bei dem spezifischen Bild oben hatte ich nur Openpose genutzt.

Ich hatte schon ein wenig mit Openpose_bones_ver_07 in Blender rum probiert, hier ein Beispiel von Schulterzucken mit Händen hoch geworfen und gleichzeitig Zunge rausstecken:

Das hat soweit funktioniert, bis auf das mit dem Zunge rausstecken - damit hat sich Stable Diffusion schwer getan. Ein Oopsie bei der Verwendung von Inpainting hat mir dafür aber diese Horrorshow beschert:

MechanimaL schrieb:
In der "3D-Openpose" Extension kann man ja auch Hände bearbeiten. Aber ich glaube, die Erkennung davon läuft dann über andere Teile von Controlnet, da der Openpose-Adapter nicht so detalliert arbeitet (Finger)- richtig? Evtl wäre da noch was rauszuholen

Hmm... 3D-Openpose scheint mehr oder weniger dasselbe wie Openpose_bones_ver_07 in Blender zu bieten, aber vereinfacht und dafür weniger flexibel.
Wie gut Openpose inkl. Fingern funktioniert, hatte ich noch nicht experimentiert.

Aber dafür ist es direkt in Stable Diffusion drin und besser als Openpose-Editor oder Posex. Jetzt fehlen noch Möglichkeiten für Gesichtsausdrücke sowie eine gut gefüllte Bibliothek voller Presets...

MechanimaL schrieb:
PS: Hast Du das mal getestet: https://github.com/hako-mikan/sd-webui-regional-prompter ? Scheint ähnlich wie Latent Couple zu arbeiten, aber laut Eigendarstellung eine "potentielle Verbesserung".

Kannte ich noch nicht, aber überzeugt mich ganz ehrlich nicht vollständig. Die Steuerung scheint klobig zu sein. Dann arbeite ich lieber mit Tiled Diffusion...
Latent Couple kann übrigens auch eine komplexe Segmentierung mithilfe dem LatentCoupleHelper (oder wenn du das hinbekommst, solch eine segmentierung freihand zu machen...)
Der wird auch im Video von Aitrepreneur aus meinem letzten Post vorgestellt.

Bzw. ist auch noch auf meiner todo Liste, mich mal mit der ComfyUI zu beschäftigen, welche auch viele mächtige Möglichkeiten mitbringt.

smeck · 27. April 2023

Wieso ist MidJourney nicht mehr kostenlos sondern nur gegen ein Abo erhältlich? -.-
Wurde nun also doch monetarisiert....

Luckeie · 27. April 2023

Ich bekomme mittlerweile recht ansehnliche Bilder von 'Celebrities' hin und würde darüber gerne in meinem Blog schreiben und ein paar dieser Bilder dazu veröffentlichen. Wer weiß wie das mit den Bildrechten ist? Darf ich die in meinem Blog zeigen oder nicht?

Rickmer · 27. April 2023

smeck schrieb:
Wieso ist MidJourney nicht mehr kostenlos sondern nur gegen ein Abo erhältlich? -.-

Warum hast du jemals etwas anderes erwartet?

Die müssen Server und Entwickler irgendwie bezahlen.

Luckeie schrieb:
Wer weiß wie das mit den Bildrechten ist?

Bei 'celebrities' machste da ein Fass auf... stability ai hat nicht umsonst ihr Dataset für die 2.0 Version beschnitten, sodass genau sowas schwieriger wird.

Luckeie · 27. April 2023

Rickmer schrieb:
Bei 'celebrities' machste da ein Fass auf... stability ai hat nicht umsonst ihr Dataset für die 2.0 Version beschnitten, sodass genau sowas schwieriger wird.

Ok, also lasse ich es besser sein. Hab ich mir schon gedacht, dass das wahrscheinlich problematisch ist. Vielen Dank!

MechanimaL · 27. April 2023

smeck schrieb:
Wieso ist MidJourney nicht mehr kostenlos sondern nur gegen ein Abo erhältlich? -.-
Wurde nun also doch monetarisiert....

Die kostenlose Test-Möglichkeit war eh recht beschnitten; wenn man sich eingehender damit befassen wollte, brauchte man von Anfang an ein Abo.

ripa · 27. April 2023

Luckeie schrieb:
Ich bekomme mittlerweile recht ansehnliche Bilder von 'Celebrities' hin und würde darüber gerne in meinem Blog schreiben und ein paar dieser Bilder dazu veröffentlichen. Wer weiß wie das mit den Bildrechten ist? Darf ich die in meinem Blog zeigen oder nicht?

Ich glaube so lange es SFW, nicht explizit als echtes Foto beworben wird und du damit nicht direkt Geld verdienst sollte das kein Problem sein.
Letzterer Punkt sollte eigentlich auch kein Problem sein, sonst dürften Paparazzi ihr Fotos auch nicht am Zeitschriften verkaufen.

Luckeie · 27. April 2023

Na ja, ich bin technikverliebt. Stable Diffusion find ich absolut faszinierend. In meinem Blog schreib ich meistens über Microcontroller Programmierung, aber manchmal auch über andere Dinge. Angesichts der Möglichkeiten mit KI Bilder wollte ich einen Artikel bringen, in dem ich es so darstelle, als ob ein Super-Model mit mir ein Shooting gemacht hat und die Bilder zum Beweis zeigen. Am Ende dann natürlich die Aufklärung.

MechanimaL · 30. April 2023

@Luckeie Wie wolltest Du dabei genau vorgehen, d.h. wolltest Du bspw. ein LORA für die entsprechende Person erstellen ?

Luckeie · 30. April 2023

N

MechanimaL schrieb:
Wie wolltest Du dabei genau vorgehen, d.h. wolltest Du bspw. ein LORA für die entsprechende Person erstellen ?

Nein, so weit kenne ich mich nicht aus. Aber mir ist aufgefallen, das ich bei Stable Diffusion einfach den Namen einiger der bekannten Models zusammen mit anderen Parametern angeben kann, um fotorealistische Bilder zu bekommen, die ziemlich eindeutig das Model im Porträt zeigen. Da ich gelegentlich als Amateurfotograf unterwegs bin, hat mich das natürlich fasziniert. Und ganz ehrlich: Das wäre halt einmal ein bildreicher Artikel geworden, mit dem ich vielleicht einige neue Leser hätte gewinnen können. Ähnlich meinem Artikel über Reisefotografie in Corona Zeiten: https://steinlaus.de/reisefotografie-in-corona-zeiten/ :-)

Ergänzung (30. April 2023)

Also zum Beispiel Toni Garrn als Surfergirl. Wenn das hier nicht erlaubt ist, bitte gleich wieder löschen.

Der Kabelbinder · 30. April 2023

Prompts/Parameter dazu bitte.

Rickmer · 30. April 2023

@Der Kabelbinder Sind doch in der PNG Info drin

Fürs erste Bild z.B. ausgelesen:

Toni Garrn surfing a big wave full body, photorealistic, photo, masterpiece, realistic, realism, photorealism, high contrast, photorealistic digital art trending on Artstation 8k HD high definition detailed realistic, detailed, skin texture, hyper detailed, realistic skin texture, armature, best quality, ultra high res, (photorealistic:1.4),, high resolution, detailed, raw photo, sharp re, by lee jeffries nikon d850 film stock photograph 4 kodak portra 400 camera f1.6 lens rich colors hyper realistic lifelike texture dramatic lighting unrealengine trending on artstation cinestill 800,
Negative prompt: ((3d, cartoon, anime, sketches)), (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), bad anatomy, out of view, cut off, ugly, deformed, mutated, EasyNegative, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans,extra fingers,fewer fingers,, "(ugly eyes, deformed iris, deformed pupils, fused lips and teeth:1.2), (un-detailed skin, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.2), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck"
Steps: 25, Sampler: Euler a, CFG scale: 7, Seed: 3551032658, Size: 512x768, Model hash: 9aba26abdf, Model: deliberate_v2

Der Kabelbinder · 30. April 2023

@Rickmer

MechanimaL schrieb:
Posting-Regeln für Bilder

Bei Bildern bitte immer (mindestens) angeben, womit und mit welchem Prompt es erstellt wurde,

Luckeie · 30. April 2023

Bei Stable Diffusion werden alle wichtigen Bildparameter im Bild gespeichert. Falls das nicht so ist, kann das in den Einstellungen aktiviert werden. Bei den von mir geposteten Bildern ist das jedenfalls so. Zieht man ein Bild in das PNG Info Tab, so werden diese Einstellungen angezeigt. Von dort können sie mit einem einzigen Klick in das txt2img Tab kopiert werden und stehen dann unmittelbar für eigene Versuche zur Verfügung. Im feld 'Seed' sollte man allerdings eine -1 eintragen. :-) Ich finde das sehr komfortabel so.

MechanimaL · 30. April 2023

painomatic schrieb:
Hier einmal ne kleine Übersicht, wie sich Midjourney über die einzelnen Modelle entwickelt hat.

Prompt:
Atomic age cosmonaut, soviet red, outer space, high detail, ultra realistic, 8k, octane render, cinematic

Cyborg geisha in translucent traditionell dress, cute, teasing, full body shot

a scene from the dark scifi version of Ghost in the shell movie reimagined by wes anderson, photorealistic, influenced by the dark crystal and twin peaks and pan's labyrinth, filmed with 25mm Panavision Camera, pastel colors, high detail, 4k, bioluminescent

Ich hatte damals (~22.03.) Deine Prompts zum Testen verschiedener Models in SD A1111 verwendet und wollte die Ergebnisse zeitnah hier posten, was ich aber nicht gemacht habe

nun komme ich dem nach.

Die verwendeten Models findet man auf civitai.com, die Prompts habe ich ggf. leicht erweitert, hauptsächlich um Qualitätsbegriffe. Mir hat der Fotorealismus bspw. bei den Anzügen der Astronauten und den Geishas gut gefallen. Außerdem kamen bei dem Ghost-In-The-Shell-Prompt viele Bilder raus, die tatsächlich aussahen, wie Movie-Stills

Mein Problem mit dem Raussuchen: Da tue ich mir immer schwer.. Von daher einfach mal eine größere Ladung mit Spoilern, vielleicht ist es ja ein Ansporn, mal verschiedene Models zu testen.

Erst kommen die Asronauten, die übrigen Motive folgen später. Wie man viele Bilder mit Promptinfo am besten postet frage ich mich grade. Nebeneinander geht ja dann nicht mehr, oder?

@All: PNG Info auslesen ist natürlich kein Problem, wenn man eh entsprechende Viewer verwendet oder als A1111-User o.ä., aber für Nutzer anderer Systeme ist das dann schon umständlich, wenn sie ein gleiches Prompt bei sich mal eben verwenden wollen. Ich rede mal mit der Moderation, wie wir die Posting-Regel am besten gestalten sollen in Zukunft.

Astronaut

photograph of a man in a red suit and helmet, visible face, atomic age cosmonaut, soviet red, outer space, wearing dirty flight suit, 1 9 5 0 s scifi, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck
Steps: 35, Sampler: DDIM, CFG scale: 7, Seed: 3984610753, Size: 512x512, Model hash: c35782bad8, Model: realisticVisionV13_v13VAEIncluded, Denoising strength: 0.6, Hires upscale: 2, Hires upscaler: Latent

photograph of a man in a red suit and helmet, visible face, atomic age cosmonaut, soviet, outer space, wearing dirty flight suit, 1950 s scifi, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck
Steps: 35, Sampler: DDIM, CFG scale: 6.5, Seed: 3136737267, Size: 512x512, Model hash: c35782bad8, Model: realisticVisionV13_v13VAEIncluded, Denoising strength: 0.7, Hires upscale: 2, Hires upscaler: Latent

photograph of a man in a red suit and helmet, visible face, atomic age cosmonaut, soviet red, outer space, wearing dirty flight suit, 1 9 5 0 s scifi, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck
Steps: 35, Sampler: DDIM, CFG scale: 7, Seed: 2269265985, Size: 512x512, Model hash: f36b3ca4d1, Model: edgeOfRealism_edgeOfRealismBakedVAE, Denoising strength: 0.6, Hires upscale: 2, Hires upscaler: Latent

a man in a red suit and helmet, visible face, atomic age cosmonaut, soviet red, outer space, wearing dirty flight suit, 1 9 5 0 s scifi, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck
Steps: 30, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1179998645, Size: 512x512, Model hash: b513c6287d, Model: realismEngine_v10, Denoising strength: 0.5, Hires upscale: 2, Hires upscaler: ESRGAN_4x

photograph of a man in a red suit and helmet, visible face, atomic age cosmonaut, soviet red, outer space, wearing dirty flight suit, 1 9 5 0 s scifi, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck
Steps: 35, Sampler: DDIM, CFG scale: 7, Seed: 1757990805, Size: 512x512, Model hash: f36b3ca4d1, Model: edgeOfRealism_edgeOfRealismBakedVAE, Denoising strength: 0.6, Hires upscale: 2, Hires upscaler: Latent

photograph of a man in a red suit and helmet, visible face, atomic age cosmonaut, soviet red, outer space, wearing dirty flight suit, 1 9 5 0 s scifi, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, signature
Steps: 35, Sampler: DDIM, CFG scale: 7, Seed: 2940492433, Size: 512x512, Model hash: f36b3ca4d1, Model: edgeOfRealism_edgeOfRealismBakedVAE, Denoising strength: 0.6, Hires upscale: 2, Hires upscaler: Latent

photograph of a man in a red suit and helmet, visible face, atomic age cosmonaut, soviet red, outer space, wearing dirty flight suit, 1 9 5 0 s scifi, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, signature
Steps: 35, Sampler: DDIM, CFG scale: 7, Seed: 2885434755, Size: 512x512, Model hash: f36b3ca4d1, Model: edgeOfRealism_edgeOfRealismBakedVAE, Denoising strength: 0.6, Hires upscale: 2, Hires upscaler: Latent

photograph of a man in a red suit and helmet, visible face, atomic age cosmonaut, soviet red, outer space, wearing dirty flight suit, 1 9 5 0 s scifi, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck
Steps: 35, Sampler: DDIM, CFG scale: 7, Seed: 705838958, Size: 512x512, Model hash: c35782bad8, Model: realisticVisionV13_v13VAEIncluded, Denoising strength: 0.6, Hires upscale: 2, Hires upscaler: Latent

photograph of a man in a red suit and helmet, visible face, atomic age cosmonaut, soviet red, outer space, wearing dirty flight suit, 1 9 5 0 s scifi, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, signature
Steps: 35, Sampler: DDIM, CFG scale: 7, Seed: 951349096, Size: 512x512, Model hash: b13ae9fe56, Model: wyvernmix_v7, Denoising strength: 0.6, Hires upscale: 2, Hires upscaler: Latent

photograph of a man in a red suit and helmet,atomic age cosmonaut, soviet red, outer space, wearing dirty flight suit, 1 9 5 0 s scifi, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, signature
Steps: 35, Sampler: DDIM, CFG scale: 7, Seed: 2811916945, Size: 512x512, Model hash: b513c6287d, Model: realismEngine_v10, Denoising strength: 0.6, Hires upscale: 2, Hires upscaler: Latent

ripa · 30. April 2023

Bin immer wieder überrascht wie lang manche Promts sind - vor allem die negativen. Nach meiner Erfahrung ist lang nicht unbedingt besser.
Zumal Stable Diffusion default meines Wissens nicht mehr als 75 Promts verarbeitet.
Desweiteren sollte niemand dazu gezwungen werden seinen Promt zu veröffentlichen, wenn er das nicht möchte. In naher Zukunft wird genau das das heutige Betriebsgeheimnis sein.

painomatic · 30. April 2023

MechanimaL schrieb:
Prompts habe ich ggf. leicht erweitert, hauptsächlich um Qualitätsbegriffe. Mir hat der Fotorealismus bspw. bei den Anzügen der Astronauten und den Geishas gut gefallen.

Tolle Bilder dabei - aber auch spannend, wieviel lang die Prompts sind gegen die von Midjourney - wie sehen die Ergebnisse aus, wenn man diese 1:1 verwendet, wobei ich das ja auch selber testen kann 😉

@ripa Der Threads dient ja gerade den Austausch untereinander und wie man bestimmte Ergebnisse bekommt. Dazu sind die Prompts dann schon ganz hilfreich bzw sollte man daraus nicht solch ein Geheimnis machen.

MechanimaL · 30. April 2023

ripa schrieb:
Bin immer wieder überrascht wie lang manche Promts sind - vor allem die negativen. Nach meiner Erfahrung ist lang nicht unbedingt besser. Zumal Stable Diffusion default meines Wissens nicht mehr als 75 Promts verarbeitet.

Das variiert.. auf jedenfall kann man festhalten: Negativprompts helfen, die Qualität zu verbessern. Ist auch alles abhängig vom verwendeten Model. Ich habe ein paar verschiedene und benutze die meist eher zufällig, evtl. noch abhängig, um was es geht und ggf leicht angepasst ,wenn etwas ins Bild kommt, was da nicht hin soll

ripa schrieb:
Desweiteren sollte niemand dazu gezwungen werden seinen Promt zu veröffentlichen, wenn er das nicht möchte. In naher Zukunft wird genau das das heutige Betriebsgeheimnis sein.

Dieser Thread ist ja zum Austausch und voneinander Lernen gedacht, von daher ist die Regel durchaus sinnvoll, dass für Bilder, die hier präsentiert werden, auch die entsprechenden Prompts mitgeschickt werden. Außerdem sollen Leser, die sich mal eben durch den Thread klicken, auch direkt anhand des Posts/Bildes eine Vorstellung davon haben, womit ein Bild entstanden ist und bspw. auch nicht erst die Datei herunterladen und in den Metadaten nachsehen müssen.

painomatic schrieb:
Tolle Bilder dabei - aber auch spannend, wieviel lang die Prompts sind gegen die von Midjourney - wie sehen die Ergebnisse aus, wenn man diese 1:1 verwendet, wobei ich das ja auch selber testen kann 😉

Ja das stimmt, bei MJ ist halt vieles automatisiert, was nicht heißt, dass es mit SD bei manchen Models nicht auch möglich ist. Beim 3.Subjekt dem Ghost in the shell- Thema, habe ich, soweit ich das sehe, zumindest das Positiv-Prompt 1:1 übernommen.

Rickmer · 30. April 2023

ripa schrieb:
Zumal Stable Diffusion default meines Wissens nicht mehr als 75 Promts verarbeitet.

Vorhin experimentell bestimmt: der negative Prompt scheint ab einer Länge von 150 nicht mehr zu reagieren, beim positiven Prompt konnte ich auch bei einer Länge von >300 auch an letzter Position noch eine Wirkung erzielen.

Interessant - der negative Prompt ist extrem wichtig, darf aber nicht zu lang werden. Wieder was gelernt, danke für den Denkanstoß.

painomatic schrieb:
aber auch spannend, wieviel lang die Prompts sind gegen die von Midjourney

Midjourney arbeitet ja intern auch komplett anders als Stable Diffusion, da ist eine äquivalenz nicht zu erwarten.

Ich wette auch, dass so mancher auf Stable Diffusion basierender Render-Dienst automatisch positive und negative Prompts einfügt, ohne, dass der User davon was mitbekommt - mit der Intention des einfacheren Einstieg.

painomatic schrieb:
wie sehen die Ergebnisse aus, wenn man diese 1:1 verwendet

Leider kann man beim Midjourney Showcase den vollen Prompt nur nachsehen, wenn man eine Subscription hat -_-

Aber die Idee hatte z.B. ein youtuber schon, hatte gut funktioniert:

MechanimaL · 30. April 2023

So hier mal noch ein paar Geishas, es ist immer das Realistic Vision 13 Modell verwendet worden, bis auf das letzte Bild, da ist es waterclockrealism_v10. Prompt siehe unten, Parameter in der PNG Datei.

StableDiffusion
Cyborg geisha in translucent traditionell dress, cute, teasing, full body shot, cinematic cgsociety, very realistic cinematic, very realistic, low dark light, high detail, ultra realistic, 8k, octane render, cinematic, reflections
Negative prompt: ((cartoon rendering 3d doll drawing painting)) child ((text watermark)) monochrome b&w, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, (anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck

[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Silent-Fanatiker

Lieutenant

Ensign

Silent-Fanatiker

Ensign

Lieutenant

Banned

Ensign

Lieutenant

Ensign

Anhänge

Higitus figitus zumbakazing.

Silent-Fanatiker

Higitus figitus zumbakazing.

Posting-Regeln für Bilder​

Ensign

Lieutenant

Banned

Lt. Commander

Lieutenant

Silent-Fanatiker

Lieutenant

Posting-Regeln für Bilder