[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Danke für den Hinweis, habe ich tatsächlich übersehen.
Bin neu in der Thematik und habe erstaunt festgestellt, dass durch Powerlimit kaum ein Leistungsverlust beim rendern entsteht. 75% Powerlimit und nur knapp 10% Geschwindigkeitseinbuße.

Hat jemand eine nette Seite mit Prompt-Beispielen? Das fällt mir noch sehr schwer...
 
  • Gefällt mir
Reaktionen: Vigilant
Tr8or schrieb:
Hat jemand eine nette Seite mit Prompt-Beispielen?
Beispiele wofür? Stable Diffusion?

Einfach mal bei civitai.com schauen, bei den zur Schau gestellten Bildern steht häufig der Prompt mit bei

Da wirst du auch schnell feststellen, dass es nicht 'die eine wahre Technik' gibt.

Abgesehen von manchen Modellreihen wie Pony (eine SDXL Variante), die einfach besser funktionieren wenn spezifische Prompt Elemente mit enthalten sind
 
  • Gefällt mir
Reaktionen: Tr8or
  • Gefällt mir
Reaktionen: Tr8or
Wunderbar, das werde ich mal in Ruhe studieren.
In Deutsch habe ich bisher dies hier gefunden, falls es noch einem Anfänger hilft :)
 
  • Gefällt mir
Reaktionen: Vigilant
Wieder etwas spielerei :)

A close up view of a woman's eye, the eye is a vibrant shade of brown, with a dark brown tint. The eye has a clear, shiny blue center, and dark brown eyebrows. The eyebrows are lined with long, thin black eyelashes. The woman's eyebrows are a darker shade of black, adding a touch of black to the eye. The eyes appear to be perfectly manicured, and the woman's skin is a pale, smooth beige. Her nose, a light pink, is visible in the lower right corner of the frame. A shadow of the eye can be seen on the left side of the photo, adding depth to the composition.

Erstellt mit ComfyUI. Weitere Settings bleiben mein Geheimnis :)

Iris_woman.jpg
 
ComfyUI ist schon was Feines. Lohnt den Einarbeitungsaufwand.
 
Das Stimmt, aber mit einer RTX 50X0 ist es aktuell leider noch nicht optimal.
 
Geht so. Je nach Flux-Model kann es mal eng werden. Aber Stable Diffusion sollte halbwegs passen. Initiale Bilderstellung geht ja relativ flott. Upscaler und Detailer futtern dann noch mal mehr Zeit.
 
Es gibt ein neues T2I Modell namens REVE, das sich an die Spitze des Huggingface Leaderboards gesetzt hat.

Man hat erhält 100 Credits mit einem neuen Account. 20 Credits erhält man pro Tag. Für 5$ gibt es 500.

 
  • Gefällt mir
Reaktionen: Ayo34
Gerade mal REVE ausprobiert und der Ersteindruck ist deutlich besser als bei Recraft, welches ja auch da oben steht, mich aber nie überzeugen konnte. Quasi jedes Bild war gut und brauchbar. Bleibt die Frage wie es vermarktet wird. Eine lokales Modell ist schon immer besser, wie Flux...

reve-5.webp


reve-8.webp


reve-2.webp


reve-4.webp
 
Ayo34 schrieb:
[IMG]https://www.computerbase.de/forum/attachments/reve-5-webp.1600490/[/IMG]
Linke Hand: Größe Gullideckel... und was auch immer ihm rechts am Arm hängt

Im letzten Bild sind auch die üblichen anatomischen Ungereimtheiten vorhanden wenn man genauer hinschaut
 
  • Gefällt mir
Reaktionen: Ayo34
@Rickmer Mit dem Free-Kontigent hat man auch nicht viele Versuche.

Aber ich denke man sieht gut das Potenzial. Mit Inpainting kann man das ja alles in ein paar Sekunden fixen/verändern. Das grundsätzliche Bild gefällt mir aber sehr gut und das quasi mit null Aufwand.
 
  • Gefällt mir
Reaktionen: Rickmer
Open AI (ChatGPT) hat die Bildfunktion ihres 4o Models veröffentlicht. Die Ergebnisse sind beeindruckend.



Habe es heute ein wenig getestet und zwar im Kontext Plakaterstellung für eine Veranstaltung.. Spuckte auf Anhieb super Ergebnisse aus. Auch deutscher Text ist kein Problem. Was ich allerdings noch zusätzlich verwendet habe war Flux Fill/Affinity Photo für leichte Anpassungen.

Im Bereich Inpainting hat es eine Art Instruction Modus, du kannst sagen, was geändert werden soll, allerdings ist mir im Vergleich aufgefallen, dass die "Remixes" von Ausgangsbildern an Kontrast eingebußt haben. Außerdem verändert sich häufig mehr, als man eigtl möchte, auch wenn man die Maskenfunktion verwendet. Dieser Bereich kann also noch deutlich verbessert werden.
 
Zuletzt bearbeitet:
Moin. Es ist Frühling hab ich gehört ^^

Meine Prompts+MS Designer=

UniversalUpscaler_f7e4996a-d2cd-4526-9f1e-5c9747970f2b.jpg
UniversalUpscaler_5fed8c54-e693-41da-b5cc-c24c00fc6101.jpg
UniversalUpscaler_f0f616f5-97e5-4eff-93e4-939e225d1388.jpg

UniversalUpscaler_a0c43c7d-1d53-4dac-8a53-420d7b91239c.jpg
 
  • Gefällt mir
Reaktionen: Uzer1510, Ayo34 und Tr8or
Ich hab mal auch mal mit dem aktuelle ChatGPT einen meiner Standardtests laufen lassen eine Anzeige für eine Zeitmaschine aus 1950 für eine Boulevardzeitung (Vorgabe war nur der Preis von 999 USD den Text hat die AI dazugebaut) und dann brauchte ich noch ein Cover Bild fuer meine Jonas Radio HSPs

Für beide nur Vorgaben über die Stimmung und nichts konkrete, aber finde das sind beide so vom Stil echt richtig gut geworden! und das gute Scienufic Buch ist auch dabei - das ist nunmal die Grundlage für Zeitreisentechnologie :D


Meine Prompts sind halt immer recht einfach weil mich halt vor allem interessiert wie das umgesetzt wird

z.B.
can you create a mp3 cover art picture for "Jonas der letzte Detektiv" from M. Koser - it's a detective story in the future but in the mood of "Humphry Bogart"

Selbst wenn man den AIs inzwischen viel Freiraum lässt werden die Ergebnisse erstaunlich gut.

Das die Bildgens so photomässig realistisch werden ist ja schon länger so aber finde langsam sind die in der Lage auch das Gesamtbild so zu bauen dass es zur Grundstimmung des Inhalts passt - und das ist schon echt verrückt - mein Prompts werden - zumindest bei den BildGen LLM Modellen - immer kürzer statt länger :D
 

Anhänge

  • 1744464465709.png
    1744464465709.png
    899,7 KB · Aufrufe: 19
  • 1744464546380.png
    1744464546380.png
    490,3 KB · Aufrufe: 21
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Vigilant, Ayo34 und Tr8or
Ja fand ich auch cool - bei der Zeitmaschinenwerbung habe ich nur gesagt die soll halt $999 kosten uind halt dass es eine Werbeanzeige in so einem Zeitschriftenblättchen aus der Zeit sein soll.

Beim mp3 cover halt obigen Prompt, da hat er noch den Vornamen vom Koser von allein ergänzt, auch nett

Und beides nur 1x generiert - ohne Anpassungen

Solche Bilder die man per AI erzeugen lässt sind doch irgendwie am Interessantesten finde ich
 

Anhänge

  • 1744483452161.png
    1744483452161.png
    1,1 MB · Aufrufe: 15
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Ayo34
Das geniale ist wirklich, dass kurze Prompts direkt zu guten Ergebnissen führen, nicht so wie früher. Noch genialer ist aber, dass man auch richtig richtig lange Texte verfassen kann und die KI sich 1:1 an die Anweisungen hält. Man kann also auch alles bestimmen. Dazu funktionieren deutsche Prompts fast genauso gut wie Englische.

Das Zusammenspiel aus LLM und Bildgenerator sieht man hier das Erste mal so richtig!
 
das stimmt echt verrückt was sich hier in wenigen Jahren getan hat - das richtig nette ist halt dass man nun Texte integrieren kann, finde das hat früher immer sehr gefehlt

Auch wenn das noch Jahre weg ist das wird sicher früher oder später auch in Realtime gehen evtl auch in Games - es reichen da ja lokal begrenze Bildänderungen

Hihi aber lustig ist ich erzeuge für mich gerade so mp3 covers da wo keine vorhanden z.b. für "Tagebuch der Apokalypse" weil ich davor was mit Einhörnern gemacht habe steht da jetzt eines im Hintergund allerdings zombiemässig xD

Aber die Bilder selber absolut top für so Cover Art. Man weiss gleich um was es wohl geht :D

Dass die Buchstaben des Titels leicht verdreckt sind sind halt einfach super Details, die für mich auch den Fortschritt zeigen dass der Inhalt sozusagen wirklich "verstanden" wird.
 

Anhänge

  • 1744485246907.png
    1744485246907.png
    2 MB · Aufrufe: 11
Zuletzt bearbeitet:
Zurück
Oben