[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

kein Thema, gerne. Ich würde sagen beim Prompt könntest du die Beschreibung noch etwas straffen; zb: "photo of a woman with red hair, sitting beside a little child with black hair, at a kitchen table, (fruit on the table:1.2)," evtl den Hintergrund noch noch näher beschreiben und Wörter wie Hands usw. würd ich nicht in die Beschreibung nehmen, das führt eher zu zuvielen Händen ^^ Highly Detailed, Intricate Eyes oder Hair, z.B. ist sicher gut. Und bei Foto kann es sich lohnen noch ein paar Fotografie bezogene Sachen reinzubringen um die Qualität zu steigern.
 
Danke, war halt ein erster Test mit einer "normalen" Szene, was ich komisch fand, ist das bei child 99% Mädchen kommen, wobei es bei mir nur Mittel zum Zweck des klaren Unterscheidens der beiden Personen dienen sollte.
 
SD ist ja nicht in einer Form ausbalanciert, es orientiert sich an dem, was ihm an realen Bildern gezeigt wurde. Das heißt, gut möglich, dass da Mädchen öfter vorkommen, da könntest Du aber einfach gegensteuern indem du spezifizierst, dass es ein Junge sein soll, ggf. noch Girl als Negativ-Prompt.
 
  • Gefällt mir
Reaktionen: Hatecore
Habe ich mir schon gedacht, da es ein Test ist das System zu verstehen ist es eigentlich egal was auf den Bildern ist, solange es etwas mit dem zu tun hat was ich versuche zu erreich.
 
Gestern auch mal wieder nen bisschen mit Midjourney rumgespielt - ein paar Werke inkl der Prompts:

production stills, a wes anderson movie mixed with star wars, directed by wes anderson, action scene, in the style of the life aquatic, symmetry, cinematic, intricate, highly detailed

pain_o_matic_production_stills_a_wes_anderson_movie_mixed_with__5d974e60-c125-47e6-a410-c31c75...pngpain_o_matic_production_stills_a_wes_anderson_movie_mixed_with__25a7e89f-b8e4-4b53-bafd-e09e7c...pngpain_o_matic_production_stills_a_wes_anderson_movie_mixed_with__c34e3a8a-7b44-43b8-b14e-d3c500...png

A frame from the beautiful epic 1988 fantasy adventure film “Goblin Market: a light in the forest” directed by Guillermo del Toro, and Brian Froud. adventurers enter a magical forest. Everything is luminous, sparkling, dewy, strange. supernatural fosting glowing entities seem to fly through the trees, futuristic botanical creatures. Twisting branches laden with lichen lace and moss. Gorgeous cinematography, dreamlike. The trees are glistening and subtly sparkling. Everything is illuminated with soft firelight. Lighting is at golden hour. Octane render, photorealistic. Intricate, highly detailed, emotive expressive fantasy characters

pain_o_matic_A_frame_from_the_beautiful_epic_1988_fantasy_adven_6dd63606-d99f-45b7-b6f2-80f11c...pngpain_o_matic_A_frame_from_the_beautiful_epic_1988_fantasy_adven_9b263d5c-bae4-46b8-8e88-3076ca...pngpain_o_matic_A_frame_from_the_beautiful_epic_1988_fantasy_adven_de82a6ad-6f0b-4d54-bbb2-1a8b5e...png

80's dark scifi dvd screengrab, princess mononoke, photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, shot on 35mm lens, 35mm film stock, ultra-wide angle lens, depth of field, hyper-detailed, high sharpness, beautifully color graded, film grain, cinematic, color grading, kodak film, directed by christopher nolan

pain_o_matic_80s_dark_scifi_dvd_screengrab_princess_mononoke_ph_b56731d1-fa7e-4252-908c-98cf87...pngpain_o_matic_80s_dark_scifi_dvd_screengrab_princess_mononoke_ph_c9b12895-eba4-48f2-8db3-1a296b...pngpain_o_matic_80s_dark_scifi_dvd_screengrab_princess_mononoke_ph_d4aa2c47-311e-496f-a4d7-ee9433...png

80's dark scifi dvd screengrab, akira with motorcycle, photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, shot on 35mm lens, 35mm film stock, ultra-wide angle lens, depth of field, hyper-detailed, high sharpness, beautifully color graded, film grain, cinematic, color grading, kodak film, directed by christopher nolan

pain_o_matic_80s_dark_scifi_dvd_screengrab_akira_with_motorcycl_625bc2ae-764f-4e80-8803-3d2cf0...pngpain_o_matic_80s_dark_scifi_dvd_screengrab_akira_with_motorcycl_aa43f416-3e2d-4b8f-baac-53fad8...pngpain_o_matic_80s_dark_scifi_dvd_screengrab_akira_with_motorcycl_c2da5245-7912-4996-b424-b561a7...png

Real life Photograph 1970s kids summon a mutant deamon dripping red slime with rotting moony and dirty sharp teeth dry flakey bubbled on giant dripping ooze on ground covered in mold spores eyes protruding from under the bubbled mutation, High Quality, Hyper realistic, Photorealistic, Cinematic Lighting, Hyper detailed, 22 Mega pixels, 16k, Award Winning Photography, Digital Photography

pain_o_matic_Real_life_Photograph_1970s_kids_summon_a_mutant_de_63c2cc16-be3e-484e-aacb-cf8c0d...pngpain_o_matic_Real_life_Photograph_1970s_kids_summon_a_mutant_de_cbb60bbc-01e9-4298-8424-63523c...pngpain_o_matic_Real_life_Photograph_1970s_kids_summon_a_mutant_de_f0a17695-7899-49e8-b268-16c925...png

native American graveyard, death, colonization, Ojibwe trail of tears, Ojibwe ruins, retro tribe of native American mech pilots, migrating tribe, traveling tribal group of ojibwe gundam mech pilots, realistic anime, children native , lost planet, Photogenic, sad, retro frank frazetta & Simon stalenhag art style, ojibwe child warrior, graffiti, weapons, sniper, sniper rifle, ojibwe clothing, annishanabe mech pilot, stunning tan boy, magnificent mech gadgets, native hunter warrior mech, digital nomad, ready player one fight scene vibe, hero pose, cinematic shot realistic, sneaky, surreal, high octane render, Indigenous concept realism, majestic perspective, perfect angle, surreal view, glowing atmosphere, native man Anishinabe, led retro cyberpunk Gundam mech pilot, hologram, Gundam engineering, mech, advanced mech pilot, neon gloomy, HD wallpaper, comic style, iconic

pain_o_matic_native_American_graveyard_death_colonization_Ojibw_505dbdf3-a3ae-42ca-a6da-933b41...pngpain_o_matic_native_American_graveyard_death_colonization_Ojibw_0715c0fb-822d-4a41-bf24-5cbbbc...pngpain_o_matic_native_American_graveyard_death_colonization_Ojibw_6947ad9c-1f25-4dee-9bfc-6fc61e...png

1979, Fishermen at the haunted river, The Cult of the Weever, Pentax k1000, Tokina ATX-I 100mm F/2.8, Kodak ultramax 400, fish god, worship, carnival, float, smoke, bubbles, bones, offering, alter, Vates, Welsh, nostalgia, uncanny valley, weirdcore, oddcore, retro aesthetic, eerie
#uncanny valley

pain_o_matic_1979_Fishermen_at_the_haunted_river_The_Cult_of_th_76c1bd9b-5a92-4c8b-a362-d85e1b...pngpain_o_matic_1979_Fishermen_at_the_haunted_river_The_Cult_of_th_478f5d7f-ebac-47b2-98b7-900494...pngpain_o_matic_1979_Fishermen_at_the_haunted_river_The_Cult_of_th_efbbcd84-6b01-4c8c-a464-52ffaa...png

giant rats with modular battle rifles, holding negotiations, squad, wide angle view power armor, exosuit, glow, battle, explosions, machine gun, 80's scifi, detailed, 8k, studio light, sleek, aerodynamic, DVD screengrab from a James Cameron fantasy sci-fi film 1988 –ar 3:2

pain_o_matic_giant_rats_with_modular_battle_rifles_holding_nego_4e90e083-fd7d-458f-bc71-d50db3...pngpain_o_matic_giant_rats_with_modular_battle_rifles_holding_nego_b247c91e-c44f-4d06-ac3f-e566f4...pngpain_o_matic_giant_rats_with_modular_battle_rifles_holding_nego_db4db387-dba4-4479-8dcb-232ada...png
 
  • Gefällt mir
Reaktionen: wrglsgrft, Der Kabelbinder, tHE_nICKEL und 2 andere
painomatic schrieb:
Gestern auch mal wieder nen bisschen mit Midjourney rumgespielt - ein paar Werke inkl der Prompts:
Nice! Sehr interessante Ergebnisse und auch spannende Prompts verwendet :)
 
  • Gefällt mir
Reaktionen: painomatic
Hallo,
ich beschäftige mich aktuell auch intensiv mit AI Art/KI-Kunst. Insbesondere arbeite ich mit Midjourney. Von denen, die ich getestet habe (DALL-E und Lexica), finde ich die Möglichkeiten und Ergebnisse bei Midjourney am besten!

Es gibt ja bereits Buchautoren, die mithilfe von Midjourney die Illustrationen ihrer Bücher realisiert haben.

Dazu habe ich auch gleich eine Frage. Wie kann ich in Midjourney meine erstellten Charaktere in weiteren Images einbinden? Also stets mit demselben Aussehen?

Denn es ist doch eigentlich so, dass es bei exakt demselben Befehl immer ein neues Zufallsergebnis gibt.

Ich habe bereits versucht, über Google eine Antwort zu finden. Aber mir fielen anscheinend nicht die passenden Schlagwörter ein.

Ich hoffe, Ihr könnt mir helfen!
 
@Sloddy1985
Such mal nach "Img2Img". Damit kannst du ein Ausgangsbild vorgeben. Du kannst auch in MJ Bilder als Quelle vorgeben. Meines Wissens dient das aber nur der Festlegung des Stils und nicht des Motivs. Stabile Diffusion hat da ein deutlich potenteres Tool-Set.
 
Der Kabelbinder schrieb:
@Sloddy1985
Such mal nach "Img2Img". Damit kannst du ein Ausgangsbild vorgeben. Du kannst auch in MJ Bilder als Quelle vorgeben. Meines Wissens dient das aber nur der Festlegung des Stils und nicht dem Motiv. Stabile Diffusion hat da ein deutlich potenteres Tool-Set.
Stable Diffusion habe ich auch eben mal getestet, muss aber sagen, dass die Ergebnisse mit DALL-E gleichzusetzen sind, also überhaupt nicht mit Midjourney zu vergleichen.
 
Ja, MidJourney ist ziemlich "polished". Dafür hat man aber relativ wenig Einfluss auf die Bildsemantik und kann das Bild dort auch nicht gezielt weiterarbeiten. Wer spezielle Vorstellungen hat, sollte alle Mechaniken miteinander kombinieren und in Photoshop final retouchieren bzw. zusammensetzen.
 
Hier mal etwas ganz anderes - aber passend zum Thema. Ich habe mir heute mal meine Lieblingsserie aus der Kindheit - Saber Rider and the Star Sheriff vorgenommen und mich einen Upscale via AI probiert.

Zum Einsatz kam ein Upscale via Waifu2x und RealESRGAN. Diese habe ich in Premiere Pro überlagert. Dazu noch ein paar leichte Farb und Audio Tweaks - danach das ganze via Topaz Video AI von 25P auf 50P gebracht - Renderzeit ca 3h. Quelle war die Remastered DVD.

Hier mal der Upscale:


Hier der Vergleich zwischen Original und Upscale

 
  • Gefällt mir
Reaktionen: MechanimaL
Ziemlich gut, auch wenn es nicht zum Thema passt.
 
@Bob.Dig - war irgendwie noch das passendeste Thread dafür - ist ja auch nen AI Model, was dafür genutzt wurde. Leider sehr rechenintensiv, sonst würde ich mal eine komplette Folge upscalen. Hatte heute morgen mal geschaut - der Upscale dauert ca 25h für 22min -_-
 
@painomatic mpv-lazy hat auch die von dir erwähnten Filter wie Waifu und weiteres inklusive AI-Frame-Verdoppelung. Könnte also gut sein, dass Du das in Realtime haben kannst. Vermutlich nicht die gleiche Qualtät, aber ähnlich. Nur das Chinesisch nervt etwas. 😉
 
  • Gefällt mir
Reaktionen: MechanimaL
Wer ein fauler Alter Sack wie ich ist, kann auch einfach ChatGPT für gute Prompts nutzen.
Das generiert wirklich 1A Vorlagen!
mMn Besser als diese online-Generatoren die nur Müll generieren.
Mein Bsp. ist jetzt einfach gehalten. Es kann natürlich unendlich erweitert werden.
Bitte, gern geschehen.

1.png

2.png

3.png

4.png


P.S.
Wie ihr seht ist Rechtschreibung relativ, AI stören die 100+ Fehler nicht.
Sorry es ist WE und 1-2 Bierle intus^^

Die Reihenfolge Bilder (Screenshot) stimmt nicht mit den Prompts überein, aber jedes Result passt!
Da kein Highres fix aktiviert war, SD typische fehler, 2 frauen bei einem, keine genaue Angabe was angeschnitten angeht (normalerweise neg prompt cropped usw.) und es gab keinen Platzhalter für zb Fullbody und so.

Deshalb nur Portraits. Habe direkt RAW ChatGPT Ausgabe Prompts in SD gefüttert.
Mit Optimierungen Vorlage & weiteren Platzhaltern bekommt man das aber alles perfekt hin :D

Beim Bsp oben hat es Fotograf irgendwie nicht verstanden, aber wenn alles auf Englisch angegeben wird hatte es bei mir kein problem. Da wurde korrekt {name of a famous commercial photographer} durch einen passenden ersetzt.

Wer gut Englisch kann lieber gleich alles direkt in Englisch schreiben, aber auch in Deutsch funktioniert es wie oben gezeigt.

Vorschläge, Tricks, Optimieruingen für ChatGPT Prompts, gerne nur her damit und posten🤩
 
Zuletzt bearbeitet von einem Moderator:
  • Gefällt mir
Reaktionen: wrglsgrft, Rickmer, painomatic und eine weitere Person
JonaPower schrieb:
Wer ein fauler Alter Sack wie ich ist, kann auch einfach ChatGPT für gute Prompts nutzen.
Das generiert wirklich 1A Vorlagen!
mMn Besser als diese online-Generatoren die nur Müll generieren.
Mein Bsp. ist jetzt einfach gehalten. Es kann natürlich unendlich erweitert werden.
Bitte, gern geschehen.

Ja, warum nicht Chat-GPT auch hierfür einsetzen und Du hast gezeigt, es funktioniert grundsätzlich auf jedenfall. Inwiefern es bereits "weiß", auf welche Prompts SD am besten anspricht (bspw. Qualitätswörter/bestimmte Kombinationen fotografischer Termini usw.), die SD bekannten Künstler "kennt", wäre noch eine Frage. In manchen sehr spezifischen Bereichen, fehlt chat-gpt sozusagen ja das "Detail-Wissen".

Online "Generatoren" habe ich wenig benutzt, da ich generell versuche, die - nennen wir es mal Kreativ-Plattform, offline unabhängig der Verfügbarkeit weiterer Dienste betreiben zu können, was ja gerade ein Vorzug von SD ist. Von daher finde ich es auf der einen Seite cool, sich Chat GPT zur Hilfe zu nehmen, es macht ja auch einfach Spaß damit zu arbeiten. Andererseits würde ich es - auch aufgrund der Abhängigkeit, dass es gerade verfügbar ist ;) - selbst wohl eher als Tool verwenden, um etwas zu erstellen, auf das ich dann in der Folge unabhängig Zugriff habe (Beispiel weiter unten).

Das Prinzip automatische Prompt-Genese ist in SD jetzt nicht neu. Zunächst gab es einfache Wildcard-Scripts, die es erlauben im Prompting in SD Wildcards nach belieben zu setzen, an der Stelle, wo man das dem Zufall überlassen möchte (Alter, Geschlecht, Augenfarbe (usw), also im Prinzip, was Du Chat-GPT hast machen lassen. Dann gibt es für jede Wildcard, eine Liste im .txt Format, von wo die Ergebnisse zufällig gewählt werden. Diese Listen kann man sich natürlich auch direkt mit Chat GPT erstellen lassen, ähnlich hier.

Das Wildcards Script wurde irgendwann integriert in das Dynamic Prompts Scripts, das im vorhigen Link auch verwendet wird. Es bietet in seiner Grundfunktion eine Kombinationsmöglichkeit aus bereits im Prompt formulierter Begriffe und kann direkt mehrere Bilder in verschiedenen Kombinationen als Output erzeugen. Dieses Script ist mittlerweile sehr mächtig und bietet jetzt nicht nur umfassende Wildcard Optionen, es hat auch die Magic Prompt Option, d.h dass Du verschiedene Models wählen kannst, die z.T. mit ChatGPT u.ä. erstellt wurden, anhand bestehender AI Bild/Prompts, um eigene Prompts zu erzeugen, kombinierbar mit den Wildcards. Für die Wildcards gibts auch schon fertige Listen: https://github.com/adieyal/sd-dynamic-prompts#collections

Die Magic Prompt Funktion habe ich über das Dynamik Prompt Script noch nicht verwendet, aber ich hab bereits recht interessante und brauchbare Prompts mit dem https://github.com/imrayya/stable-diffusion-webui-Prompt_Generator erzeugt.
 
  • Gefällt mir
Reaktionen: painomatic
Sloddy1985 schrieb:
Hallo,
ich beschäftige mich aktuell auch intensiv mit AI Art/KI-Kunst. Insbesondere arbeite ich mit Midjourney. Von denen, die ich getestet habe (DALL-E und Lexica), finde ich die Möglichkeiten und Ergebnisse bei Midjourney am besten!

Es gibt ja bereits Buchautoren, die mithilfe von Midjourney die Illustrationen ihrer Bücher realisiert haben.

Dazu habe ich auch gleich eine Frage. Wie kann ich in Midjourney meine erstellten Charaktere in weiteren Images einbinden? Also stets mit demselben Aussehen?

Denn es ist doch eigentlich so, dass es bei exakt demselben Befehl immer ein neues Zufallsergebnis gibt.

Ich habe bereits versucht, über Google eine Antwort zu finden. Aber mir fielen anscheinend nicht die passenden Schlagwörter ein.

Ich hoffe, Ihr könnt mir helfen!
 
  • Gefällt mir
Reaktionen: painomatic
Hat Midjourney bzw. Stable Diffusion mittlerweile eigentlich mal die Probleme mit den Händen und insbesondere Fingern halbwegs in den Griff bekommen? Das schien mir bisher immer eine schwerwiegende Baustelle zu sein.
 
Zurück
Oben