MechanimaL
Lieutenant
- Registriert
- Nov. 2005
- Beiträge
- 996
Die Möglichkeiten der Bild-Erschaffung mittels künstlicher Intelligenz haben in der jüngsten Zeit einen enormen Schub erfahren. Zugleich wurde der Zugang für die Allgemeinheit erleichtert, indem mehrere Anbieter entstanden sind, die "txt2img" Dienste kommerziell betreiben (z.B. "Midjourney") oder die nötige Software kostenfrei und quelloffen zur Verfügung stellen ("Stable Diffusion").
"Txt2Img" bedeutet, dass Bilder durch die Eingabe eines "Prompts" in Form einer Beschreibung, was auf dem Bild zu sehen sein soll, erschaffen werden. Hierfür wurden AI-Systeme mit Millionen von Bildern und deren Beschreibungen trainiert. Somit stehen uns prinzipiell zuvor nicht da gewesene Möglichkeiten der künstlerischen Entfaltung bzw. Erschaffung von Bildern, ganz ohne selbst die handwerklichen Fertigkeiten dafür zu besitzen, zur Verfügung.
Im CB-Forum sind zu dem Thema bereits einzelne Threads aufgeploppt. Um dem bestehenden Interesse gerecht zu werden, die aktiven Nutzer zusammenzubringen und Neue auf dieses Thema aufmerksam zu machen, soll nun dieser Sammelthread dienen. Im Folgenden findet Ihr außerdem Hinweise auf Online- Dienste, Testseiten und lokale Nutzungsmöglichkeiten, samt Installationshilfe. Am Ende dieses Posts stehen Links zu Youtube Channels (u.a. mit Tutorials zu bestimmten GUIs), sowie zu Wikis, Guides, Prompting Tipps, Communities- hauptsächlich zu Stable-Diffusion.
Beispiel:
Stable Diffusion 1.5
Es gibt eine sehr aktive "GUI"-Entwickler-Szene, die verschiedene (häufig Browser-basierte) "UIs" dafür hervorgebracht hat, die z.T. mehrere Updates täglich unterlaufen. Im folgenden eine Übersicht:
Ob Euch die Perfomance mit eurer jeweiligen Hardware zufriedenstellt, probiert ihr am besten selbst aus. Diese ist auch stark davon abhängig, mit welchen KI-Modellen ihr arbeitet. Bereits ab 4GB VRAM könnt ihr kleinere Modelle, wie z.B. SD1.5 (Basisauflösung 512x512) nutzen. Die Bilder können im Prozess der Erstellung oder im Nachgang noch hochskaliert werden und bereits mit Community Modellen von SD1.5 können ansehliche Bilder erstellt werden. (Ergebnisse von SDXL und FLUX, die mehr VRAM benötigen, findet ihr in der obigen Tabelle.)
Hier findet ihr Benchmarks der Bildgenerierung mit verschiedenen Karten. Hier listet comfyUI Empfehlungen zum Kauf von Grafikkarten auf.
Folgt den Installationsanweisungen auf der Github-Seite und installiert das Tool am besten auf einer SSD mit mehr als 30GB freiem Platz (sonst müsst ihr ständig Models, die zwischen 6-22GB groß sind hin und herschieben oder von langsameren Platten laden.)
Stellt fragen gerne in diesem Thread oder besucht den Discord von SwarmUI.
Tipp: Sowohl SwarmUI, als auch andere GUIs, sowie KI-Anwendungen in den Bereichen Audio/Video/Bild/Text könnt ihr in der Regel vereinfacht über Pinokio installieren. Dabei müsst ihr Euch keine Sorgen über Änderungen an bestehenden Abhängigkeiten/Programmversionen oder Datendownload in andere Orte, als den Speicherort von Pinokio machen, da es alles Benötigte in seinem eigenen Installations-Ordner sammelt. Ideal also zum Testen.
Weiterführende Links
Im Folgenden noch etliche, nützliche Links (hauptsächlich für SD).
Hier findet ihr ausführliche WIKIs, Guides, Linklisten, Datenbanken von Künstlern/Stilen und vieles mehr - alles was ihr braucht, um den Durchblick zu erlangen, gute Ergebnisse zu erzielen und tiefer in die Materie einzusteigen.
Die Links sind auf Englisch, wer deutschsprachige Links parat hat, schickt mir diese gerne (per Nachricht) und ich ergänze die Liste entsprechend.
Ich hoffe dieser Thread wächst und gedeiht, mit zahlreichen Bildern, an denen wir uns gemeinsam erfreuen können und die neue User dafür begeistern, sich auch mit diesem spannenden Thema zu beschäftigen. Bei Änderungs- oder Ergänzungswünschen, schreibt mich einfach per PN an.
"Txt2Img" bedeutet, dass Bilder durch die Eingabe eines "Prompts" in Form einer Beschreibung, was auf dem Bild zu sehen sein soll, erschaffen werden. Hierfür wurden AI-Systeme mit Millionen von Bildern und deren Beschreibungen trainiert. Somit stehen uns prinzipiell zuvor nicht da gewesene Möglichkeiten der künstlerischen Entfaltung bzw. Erschaffung von Bildern, ganz ohne selbst die handwerklichen Fertigkeiten dafür zu besitzen, zur Verfügung.
Im CB-Forum sind zu dem Thema bereits einzelne Threads aufgeploppt. Um dem bestehenden Interesse gerecht zu werden, die aktiven Nutzer zusammenzubringen und Neue auf dieses Thema aufmerksam zu machen, soll nun dieser Sammelthread dienen. Im Folgenden findet Ihr außerdem Hinweise auf Online- Dienste, Testseiten und lokale Nutzungsmöglichkeiten, samt Installationshilfe. Am Ende dieses Posts stehen Links zu Youtube Channels (u.a. mit Tutorials zu bestimmten GUIs), sowie zu Wikis, Guides, Prompting Tipps, Communities- hauptsächlich zu Stable-Diffusion.
Wünschenswerter Inhalt von Beiträgen
- Fragen zu entsprechenden Plattformen / Software und deren Nutzung
- Das Teilen von selbst erstellten Bildern, bzw. Feedback zu diesen
- Tipps und Tricks zur Bilderstellung, sowie das Teilen von Informationsquellen
- Neue Entwicklungen in dem Bereich mitteilen und kommentieren
- Genereller Austausch zum Thema Bild-KI
Posting-Regeln für Bilder
- Bei Bildern bitte immer (mindestens) angeben, womit und mit welchem Prompt es erstellt wurde, wie im folgenden Beispiel dargestellt. Bei mit Hilfe von "img2img" oder anders weiter bearbeiteten Bildern, gerne den Entstehungsprozess mitteilen oder mit Bildern darstellen - das kann sehr hilfreich sein.
- Für den Inhalt der Bilder gelten die Allgemeinen Forenregeln
Beispiel:
Stable Diffusion 1.5
award winning underwater photo of a cute sea urchin eagle, 4k
Online Dienste und Test-Seiten
Wer einmal txt2img online testen möchte, kann dies auf den folgenden Webseiten tun, in der Regel kostenlos für eine gewisse Zahl an Versuchen bzw. mit eingeschränkten Funktionen (evtl. einmalige Anmeldung erforderlich). Eine weitere Übersicht über die aktuell besten Modelle bietet dieses Leaderboard.Multi-Modell | FLUX | Stable Diffusion | Midjourney | Ideogram | Imagen (Google) | Dall-E | REVE | Recraft |
Civit Ai Generator | Entwickler | SD - Entwickler Testseite | Discord-Channel (Testversion) (Anleitung unter #getting-started) | Ideogram | Imagen 3 | Craiyon (DALL-E mini) | Reve | Recraft |
Openart.ai | HF-dev Model HF-schnell Model | Mage-Space | MS-Image Creator | |||||
tensor.art | Tost.ai | Chat GPT 4 User | ||||||
fal.ai | MS-Designer |
So sehen Ergebnisse aus
Galerien erschaffener Bildern gibt es jeweils hier (inkl. Angabe der verwendeten Prompts):FLUX | Stable Diffusion | Ideogram | Midjourney | Dall-E | Recraft |
CivitAI (SFW) CivitAI (NSFW) | CivitAI (SFW) CivitAI (NSFW) | Ideogram | Showcase | Dall-E 2025 | Gallery |
GUIs für eine kostenlose, lokale Anwendung von Bildgeneratoren
Im Gegensatz zu anderen Produkten, lassen sich "Stable Diffusion", "Flux" und "AuroFlow" (u.a.) offline auf dem eigenen Rechner installieren und komplett ohne Anmeldung oder Einschränkung, sowie mit ständig wachsendem Funktionsumfang nutzen. Dazu zählt u.a. img2img, was es erlaubt, im Zusammenspiel mit der AI das Bild weiter zu verfeinern, bestimmte Bereiche zu erhalten, andere zu verändern (inpainting) usw.!Es gibt eine sehr aktive "GUI"-Entwickler-Szene, die verschiedene (häufig Browser-basierte) "UIs" dafür hervorgebracht hat, die z.T. mehrere Updates täglich unterlaufen. Im folgenden eine Übersicht:
Name | Basis | 1 click installer | OS | Models | Projekt Page |
Swarm UI | Ein Interface auf Basis von ComfyUI, verbindet somit das umfangreichste Tool für lokale Bild- und Videogeneration mit den einfachen Bedienmöglichkeiten anderer GUIs. Multi-GPU Support. | ja | Windows, Linux, Mac | SD1+2, SDXL, SD3, FLUX, AuraFLow, uvm. | https://github.com/mcmonkeyprojects/SwarmUI |
reForge | Weiterentwickeltes A1111 mit besserem Ressourcenmanagement und Unterstützung von mehr Models (u.a. FLUX). | ja | Windows, Linux, Mac | SD1+2, SDXL, FLUX | https://github.com/Panchovix/stable-diffusion-webui-reForge |
ruined Fooocus | Einsteigerfreundliches UI, orientiert an Midjourney. | ja | Windows, Linux, Mac | SD1+2, SDXL, | https://github.com/runew0lf/RuinedFooocus |
ComfyUI | Node basiertes Backend mit vielseitigem Code Support für versch. Models (u.a. FLUX). Häufig Erstimplementierung neuer Tools und Models, sowie hohe Anpassbarkeit. | ja | Windows, Linux, Mac | SD1+2, SDXL, SD3, FLUX, AuraFLow, uvm. | https://github.com/comfyanonymous/ComfyUI |
Invoke AI | Node basiertes GUI auf Diffusers Basis mit Fokus auf In-/Outpainting und Komposition. | ja | Windows (Nvidia), Linux, MAC | SD1+2, SDXL, FLUX | https://invoke-ai.github.io/InvokeAI/ |
SD Next | Fork von A1111 mit Support für Diffusers und somit mehr Models. Gute Dokumentation, aber manuelle Installation. | nein | Windows (Nvidia), Linux, Mac | SD1+2, SDXL, SD3, FLUX, AuraFlow uvm | https://github.com/vladmandic/automatic |
A1111 SD-WEBUI | Der "OG" der GUIs- auf Basis von Stability AI s LDM/CompVis Diffusion; sehr viele Extensions, wird nicht mehr upgdedated. | ja | Windows, Linux, Mac | SD1+2, SDXL, SD3 | https://github.com/AUTOMATIC1111/stable-diffusion-webui/ |
Grafikkarten/System Voraussetzungen für lokale Anwendung
Am besten fahrt ihr als Besitzer von NVIDIA Karten (ab der 2xxxer Serie) mit möglichst viel VRAM. Unter Linux können auch mit AMD, sofern ROCm unterstützt wird, gute Ergebnisse erzielt werden, unter Windows ist es mit AMD etwas umständlicher auf akzeptable Geschwindigkeiten zu kommen, man benötigt ZLUDA oder DirectML, was die Installation komplizierter macht.Ob Euch die Perfomance mit eurer jeweiligen Hardware zufriedenstellt, probiert ihr am besten selbst aus. Diese ist auch stark davon abhängig, mit welchen KI-Modellen ihr arbeitet. Bereits ab 4GB VRAM könnt ihr kleinere Modelle, wie z.B. SD1.5 (Basisauflösung 512x512) nutzen. Die Bilder können im Prozess der Erstellung oder im Nachgang noch hochskaliert werden und bereits mit Community Modellen von SD1.5 können ansehliche Bilder erstellt werden. (Ergebnisse von SDXL und FLUX, die mehr VRAM benötigen, findet ihr in der obigen Tabelle.)
Hier findet ihr Benchmarks der Bildgenerierung mit verschiedenen Karten. Hier listet comfyUI Empfehlungen zum Kauf von Grafikkarten auf.
Aktuelle GUI Empfehlung (März 2025):
SwarmUI damit seid ihr bestens ausgerüstet, sowohl "klassische" Models zu nutzen, in einem bequem bedienbaren Interface, habt aber auch, dank des ComfyUI Backends, die Möglichkeit, neue Modelle und Tools (idR) direkt zum Release auszuprobieren. Es läuft auf Windows, Linux und Mac (M1/M2 vorausgesetzt).Folgt den Installationsanweisungen auf der Github-Seite und installiert das Tool am besten auf einer SSD mit mehr als 30GB freiem Platz (sonst müsst ihr ständig Models, die zwischen 6-22GB groß sind hin und herschieben oder von langsameren Platten laden.)
Stellt fragen gerne in diesem Thread oder besucht den Discord von SwarmUI.
Tipp: Sowohl SwarmUI, als auch andere GUIs, sowie KI-Anwendungen in den Bereichen Audio/Video/Bild/Text könnt ihr in der Regel vereinfacht über Pinokio installieren. Dabei müsst ihr Euch keine Sorgen über Änderungen an bestehenden Abhängigkeiten/Programmversionen oder Datendownload in andere Orte, als den Speicherort von Pinokio machen, da es alles Benötigte in seinem eigenen Installations-Ordner sammelt. Ideal also zum Testen.
Weiterführende Links
Im Folgenden noch etliche, nützliche Links (hauptsächlich für SD).
Hier findet ihr ausführliche WIKIs, Guides, Linklisten, Datenbanken von Künstlern/Stilen und vieles mehr - alles was ihr braucht, um den Durchblick zu erlangen, gute Ergebnisse zu erzielen und tiefer in die Materie einzusteigen.
Die Links sind auf Englisch, wer deutschsprachige Links parat hat, schickt mir diese gerne (per Nachricht) und ich ergänze die Liste entsprechend.
Youtube Kanäle
- Wossi86 (Deutsch)
- A Latent Place (Deutsch - Comfy UI)
- Samson Vowles - Delightful Design
- Nerdy Rodent
- Olivio Sarikas
- bycloud
- Aitrepreneur
- Software Engineering Courses - SE Courses
- Sebastian Kamph
- Levende Streg
- Bitesized Genius
- PromptGeek
- Scott Detweiler
- Arch_AI_3D
- Ai Flux
- AIchemy with Xerophayze
- Aiconomist
- AIKnowledge2Go
- AIVERSE
- Arch_AI_3D
- Artificially Intelligent
- CoderX
- Monzon Media
- Next Diffusion
- Not4Talent
- pixaroma
- invoke (invoke AI GUI)
Wikis & Allgemeine Guides
- Civit AI Articles (Guides etc.)
- Reddit - StableDiffusion WIKI
- Stable Diffusion - InstallGentoo Wiki
- GitHub - Maks-s/sd-akashic: A compendium of informations regarding Stable Diffusion (SD)
- Dreamer's Guide to Getting Started w/ Stable Diffusion! : StableDiffusion
- How to get images that don't suck: a Beginner/Intermediate Guide to Getting Cool Images from Stable Diffusion : StableDiffusion
- Made an easy quickstart guide for Stable Diffusion : StableDiffusion
- Noob's Guide to Using Automatic1111's WebUI : StableDiffusion
Communities
Künstler
- Stable Diffusion Artist Style Studies | Gallery View
- SD Artist Collection
- WIP list of artists for SD v1.4
- Comparison of top 500 Artists in Stable Diffusion
- Comparison of artist names. : StableDiffusion
- ARTISTS+KEYWORDS+ARTSTYLES KNOWN TO WORK WITH TEXT TO IMAGE - Google Docs
Models
Prompting
- H&A - 3DKX_1.0b Cheat Sheet - Google Docs
- Stable Diffusion Prompt Book — Stability.Ai
- Stable Diffusion Prompt Book From OpenArt - Stable Diffusion Prompt Book From OpenArt 11-13.pdf
- PromptHero users are some of the best artists out there. Here are 5 examples you can get inspired by: : StableDiffusion
- PublicPrompts (u/Why_Soooo_Serious) - Reddit
- Compositional Visual Generation with Composable Diffusion Models
- Prompts (Modifiers) to Get Midjourney Style in Stable Diffusion : StableDiffusion
- Things that not everybody knows: Emoji prompting : StableDiffusion
- Prompt Crafter & Organizer by kfs334
- How to Write an Awesome Stable Diffusion Prompt
- Using decreased attention to reduce the caricature SD gives to some celebrities : StableDiffusion
- (2) how can I make the AI pay special attention to face details? : StableDiffusion
- Stable Diffusion prompting cheatsheet | Moritz' Blog
- Prompt Design for DALL·E: Photorealism — Emulating Reality | by Merzmensch | Merzazine | Medium
- Recommendations for Fantasy Artists to use in prompts (besides Greg)? : StableDiffusion
- promptoMANIA:: prompt builder
- Prompt Builder - AI Text Prompt Generator
- Generator
- CLIP Prompt Engineering for Generative Art - matthewmcateer.me
- http://vectors.nlpl.eu/explore/embeddings/en/associates/
- Prompt to create "Hyper-Realistic Anime Portraits" with SD v1.4-1.5 : StableDiffusion
- Home - Public Prompts
Ich hoffe dieser Thread wächst und gedeiht, mit zahlreichen Bildern, an denen wir uns gemeinsam erfreuen können und die neue User dafür begeistern, sich auch mit diesem spannenden Thema zu beschäftigen. Bei Änderungs- oder Ergänzungswünschen, schreibt mich einfach per PN an.
Zuletzt bearbeitet: