MechanimaL
Lieutenant
- Registriert
- Nov. 2005
- Beiträge
- 976
Die Möglichkeiten der Bild-Erschaffung mittels künstlicher Intelligenz haben in der jüngsten Zeit einen enormen Schub erfahren. Zugleich wurde der Zugang für die Allgemeinheit erleichtert, indem mehrere Anbieter entstanden sind, die "txt2img" Dienste kommerziell betreiben (z.B. "Midjourney") oder die nötige Software kostenfrei und quelloffen zur Verfügung stellen ("Stable Diffusion").
"Txt2Img" bedeutet, dass Bilder durch die Eingabe eines "Prompts" in Form einer Beschreibung, was auf dem Bild zu sehen sein soll, erschaffen werden. Hierfür wurden AI-Systeme mit Millionen von Bildern und deren Beschreibungen trainiert. Somit stehen uns prinzipiell zuvor nicht da gewesene Möglichkeiten der künstlerischen Entfaltung bzw. Erschaffung von Bildern, ganz ohne selbst die handwerklichen Fertigkeiten dafür zu besitzen, zur Verfügung.
Im CB-Forum sind zu dem Thema bereits einzelne Threads aufgeploppt. Um dem bestehenden Interesse gerecht zu werden, die aktiven Nutzer zusammenzubringen und Neue auf dieses Thema aufmerksam zu machen, soll nun dieser Sammelthread dienen. Im Folgenden findet Ihr außerdem Hinweise auf Online- Dienste, Testseiten und lokale Nutzungsmöglichkeiten, samt Installationshilfe. Am Ende dieses Posts stehen Links zu Youtube Channels (u.a. mit Tutorials zu bestimmten GUIs), sowie zu Wikis, Guides, Prompting Tipps, Communities- hauptsächlich zu Stable-Diffusion.
Beispiel:
Stable Diffusion
Es gibt eine sehr aktive "GUI"-Entwickler-Szene, die verschiedene (häufig Browser-basierte) "UIs" dafür hervorgebracht hat, die z.T. mehrere Updates täglich unterlaufen. Im folgenden eine Übersicht:
Einen relativ einfachen und übersichtlichen Einstieg in Stable Diffusion bietet FOOOCUS, das sich vornimmt, die einfache Bedienung des kostenpflichtigen Midjourney mit den Vorteilen des lokalen, kostenfreien und zensurfreien Stable-Diffusion zu vereinen.
Am besten entwickelt und am meisten genutzt unter den SD-GUIs ist wahrsch. die Version von Automatic1111 (Features), die ich insb. erfahreneren bzw. ambitionierten Nutzern ans Herz legen würde.
Für die Installation mit AMD Grafikkarte muss, wie hier erklärt, die Startdatei editiert werden.
Wer Linux nutzt, findet hier die nähere Info zur Installation. Am Ende des Kapitels wird auch auf die Kombination Linux+AMD eingegangen.
In diesem Video (deutsch), wird die Installation durchgeführt und das Programm vorgestellt:
Nachfolgend die "offizielle" Anleitung für A1111 (unter Windows mit AMD):
Hier Schritt 1 bis 3 durchführen: Anleitung und Downloadlinks und folgendes bei der Installation berücksichtigen:
Wie man das UI verwendet, darauf findet ihr unter den weiterführenden Links zahlreiche Tutorials und How-Tos. Bei Fragen könnt ihr Euch auch immer an die User in diesem Thread wenden. Wir freuen uns, Euch zu helfen
Bei Problemen mit A1111 sind hier ein paar typische Lösungsansätze gesammelt.
Guide für A1111 für Mac User:
Installation und Starten auf MAC
Hier findet ihr ausführliche WIKIs, Guides, Linklisten, Datenbanken von Künstlern/Stilen und vieles mehr - alles was ihr braucht, um den Durchblick zu erlangen, gute Ergebnisse zu erzielen und tiefer in die Materie einzusteigen.
Die Links sind auf Englisch, wer deutschsprachige Links parat hat, schickt mir diese gerne (per Nachricht) und ich ergänze die Liste entsprechend.
Ich hoffe dieser Thread wächst und gedeiht, mit zahlreichen Bildern, an denen wir uns gemeinsam erfreuen können und die neue User dafür begeistern, sich auch mit diesem spannenden Thema zu beschäftigen. Bei Änderungs- oder Ergänzungswünschen, schreibt mich einfach per PN an.
"Txt2Img" bedeutet, dass Bilder durch die Eingabe eines "Prompts" in Form einer Beschreibung, was auf dem Bild zu sehen sein soll, erschaffen werden. Hierfür wurden AI-Systeme mit Millionen von Bildern und deren Beschreibungen trainiert. Somit stehen uns prinzipiell zuvor nicht da gewesene Möglichkeiten der künstlerischen Entfaltung bzw. Erschaffung von Bildern, ganz ohne selbst die handwerklichen Fertigkeiten dafür zu besitzen, zur Verfügung.
Im CB-Forum sind zu dem Thema bereits einzelne Threads aufgeploppt. Um dem bestehenden Interesse gerecht zu werden, die aktiven Nutzer zusammenzubringen und Neue auf dieses Thema aufmerksam zu machen, soll nun dieser Sammelthread dienen. Im Folgenden findet Ihr außerdem Hinweise auf Online- Dienste, Testseiten und lokale Nutzungsmöglichkeiten, samt Installationshilfe. Am Ende dieses Posts stehen Links zu Youtube Channels (u.a. mit Tutorials zu bestimmten GUIs), sowie zu Wikis, Guides, Prompting Tipps, Communities- hauptsächlich zu Stable-Diffusion.
Wünschenswerter Inhalt von Beiträgen
- Fragen zu entsprechenden Plattformen / Software und deren Nutzung
- Das Teilen von selbst erstellten Bildern, bzw. Feedback zu diesen
- Tipps und Tricks zur Bilderstellung, sowie das Teilen von Informationsquellen
- Neue Entwicklungen in dem Bereich mitteilen und kommentieren
- Genereller Austausch zum Thema Bild-KI
Posting-Regeln für Bilder
- Bei Bildern bitte immer (mindestens) angeben, womit und mit welchem Prompt es erstellt wurde, wie im folgenden Beispiel dargestellt. Bei mit Hilfe von "img2img" oder anders weiter bearbeiteten Bildern, gerne den Entstehungsprozess mitteilen oder mit Bildern darstellen - das kann sehr hilfreich sein.
- Für den Inhalt der Bilder gelten die Allgemeinen Forenregeln
Beispiel:
Stable Diffusion
award winning underwater photo of a cute sea urchin eagle, 4k
Online Dienste und Test-Seiten
Wer einmal txt2img online testen möchte, kann dies auf den folgenden Webseiten tun, in der Regel kostenlos für eine gewisse Zahl an Versuchen bzw. mit eingeschränkten Funktionen (evtl. einmalige Anmeldung erforderlich):Multi-Modell | FLUX | Stable Diffusion | Midjourney | Ideogram | Imagen (Google) | Dall-E | Auraflow |
Civit Ai Generator | Entwicklerseite | SD - Entwickler Testseite | Discord-Channel (Testversion) (Anleitung unter #getting-started) | IdeogramAI | Imagen 3 | Craiyon (DALL-E mini) | Auraflow (0.3) Model Page |
Openart.ai | HF-dev Model HF-schnell Model | Mage Space | MS-Image Creator | Test-Seite | |||
tensor.art | Tost.ai | Chat GPT 4 User | |||||
fal.ai |
So sehen Ergebnisse aus
Galerien erschaffener Bildern gibt es jeweils hier (inkl. Angabe der verwendeten Prompts):FLUX | Stable Diffusion | Ideogram | Midjourney | Dall-E | Auraflow |
CivitAI (SFW) CivitAI (NSFW) | CivitAI (SFW) CivitAI (NSFW) | Ideogram | Showcase | Dall-E 2 Gallery | Vergleichsgalerie |
GUIs für eine kostenlose, lokale Anwendung von Bildgeneratoren
Im Gegensatz zu anderen Produkten, lassen sich "Stable Diffusion", "Flux" und "AuroFlow" (u.a.) offline auf dem eigenen Rechner installieren und komplett ohne Anmeldung oder Einschränkung, sowie mit ständig wachsendem Funktionsumfang nutzen. Dazu zählt u.a. img2img, was es erlaubt, im Zusammenspiel mit der AI das Bild weiter zu verfeinern, bestimmte Bereiche zu erhalten, andere zu verändern (inpainting) usw.!Es gibt eine sehr aktive "GUI"-Entwickler-Szene, die verschiedene (häufig Browser-basierte) "UIs" dafür hervorgebracht hat, die z.T. mehrere Updates täglich unterlaufen. Im folgenden eine Übersicht:
Name | Basis | 1 click installer | OS | Models | Projekt Page |
A1111 SD-WEBUI | Bekanntestes UI auf Basis von Stability AI s LDM/CompVis Diffusion; sehr viele Extensions | ja | Windows, Linux, Mac | SD1+2, SDXL, SD3 | https://github.com/AUTOMATIC1111/stable-diffusion-webui/ |
Forge | Weiterentwickeltes A1111 mit besserem Ressourcenmanagement und Unterstützung von mehr Models (u.a. FLUX). | ja | Windows, Linux, Mac | SD1+2, SDXL, FLUX | https://github.com/lllyasviel/stable-diffusion-webui-forge |
Fooocus | Einsteigerfreundliches UI, orientiert an Midjourney. | ja | Windows, Linux, Mac | SD1+2, SDXL, | https://github.com/lllyasviel/Fooocus |
ComfyUI | Node basiertes Backend mit vielseitigem Code Support für versch. Models (u.a. FLUX). Häufig Erstimplementierung und hohe Anpassbarkeit. | ja | Windows, Linux, Mac | SD1+2, SDXL, SD3, FLUX, AuraFLow, uvm. | https://github.com/comfyanonymous/ComfyUI |
Swarm UI | Einfachere Anwendung von ComfyUI, dank eigener Oberfläche; Multi-GPU Support. | ja | Windows, Linux, Mac | SD1+2, SDXL, SD3, FLUX, AuraFLow, uvm. | https://github.com/mcmonkeyprojects/SwarmUI |
Invoke AI | Node basiertes GUI auf Diffusers Basis mit Fokus auf In-Outpainting und Komposition. | ja | Windows (Nvidia), Linux, MAC | SD1+2, SDXL | https://invoke-ai.github.io/InvokeAI/ |
SD Next | Fork von A1111 mit Support für Diffusers und somit mehr Models | nein | Windows (Nvidia), Linux, Mac | SD1+2, SDXL, SD3, FLUX, AuraFlow uvm | https://github.com/vladmandic/automatic |
Installation von SD auf dem eigenen PC (am Beispiel von FOOOCUS und A1111 SD-WEBUI) für die kostenlose Offline Nutzung
Einen relativ einfachen und übersichtlichen Einstieg in Stable Diffusion bietet FOOOCUS, das sich vornimmt, die einfache Bedienung des kostenpflichtigen Midjourney mit den Vorteilen des lokalen, kostenfreien und zensurfreien Stable-Diffusion zu vereinen.
Am besten entwickelt und am meisten genutzt unter den SD-GUIs ist wahrsch. die Version von Automatic1111 (Features), die ich insb. erfahreneren bzw. ambitionierten Nutzern ans Herz legen würde.
Hardware Anforderungen
Wie hier zu lesen ist, wird bei NVIDIA Karten jeweils (Win/Linux) mindestens 4GB VRAM und 8GB System RAM benötigt, ab der NVIDIA RTX 2xxx-er Serie (GTX 1000er wird zwar unterstützt, benötigt aber mehr RAM und ist kaum schneller als CPU). AMD Karten benötigen 8GB VRAM; ansonsten wird noch M1/M2 unterstützt, soll aber laut Usern sehr langsam sein, hierzu gibt es ggf. bessere Anwendungen.Automatische Installation (Windows, NVIDIA)
Zur Installation von FOOOCUS die hier verlinkte Datei herunterladen und in einem Ordner der Wahl entpacken. Mit "run.bat" wird das Programm dann gestartet. Hier ist zunächst eine (je nach Internetverbindung) dauernde Wartezeit angesagt, da automatisch Standardmodels (sog. Checkpoints) heruntergeladen werden. Diese landen in "Fooocus\models\checkpoints". Anschließend öffnet sich das Programm im Broswer und die Arbeit damit kann beginnen.Für die Installation mit AMD Grafikkarte muss, wie hier erklärt, die Startdatei editiert werden.
Wer Linux nutzt, findet hier die nähere Info zur Installation. Am Ende des Kapitels wird auch auf die Kombination Linux+AMD eingegangen.
Nutzung
Eine kurze deutsche Anleitung zu Fooocus ist hier zu finden.In diesem Video (deutsch), wird die Installation durchgeführt und das Programm vorgestellt:
YouTube
An dieser Stelle steht ein externer Inhalt von YouTube, der den Forumbeitrag ergänzt. Er kann mit einem Klick geladen und auch wieder ausgeblendet werden.
Ich bin damit einverstanden, dass YouTube-Embeds geladen werden. Dabei können personenbezogene Daten an YouTube übermittelt werden. Mehr dazu in der Datenschutzerklärung.
Hardware Anforderungen
Hier kommt es vor allem auf die Grafikkarte an, denn sie leistet die Haupt-Arbeit. Mit einer Nvidia Karte ab 4GB und ab der 10xx er Geforce Serie sollte es bereits funktionieren. Empfehlenswert wäre aus Performance Gründen eine Karte ab der 20xx Series mit 8GB oder mehr. Was den System-RAM angeht, sollten es mindestens 8GB sein.Automatische Installation (Windows, NVIDIA)
- Die hier verlinkte .zip-Datei downloaden und an den gewünschten Installationsort entpacken.
- Der Ordnerpfad sollte keine Leerzeichen enthalten.
- Anschließend "update.bat" durchführen und warten bis die Operationen beendet sind, danach das Fenster schließen.
- Abschließend kann die "run.bat" durchgeführt werden, um die Installation abzuschließen und das Programm zu starten. Ist alles korrekt verlaufen solltet Ihr ein "Running on local URL: http://127.0.0.1:7860" sehen, unter diesem Link könnt ihr das WEB-UI öffnen, sollte es sich nicht von selbst im Browser öffnen.
Installation (Windows, AMD)
In diesem Thread widmet sich ein CB-User dem Vergleich verschiedener Stable Diffusion Anwendungen mit einer AMD Karte. Am besten schneidet in der Performance "ComfyUI" - eine Alternative zu A1111 - ab. Wer dieses gerne probieren möchte, findet hier eine Anleitung und hier noch weitere Hilfe.Nachfolgend die "offizielle" Anleitung für A1111 (unter Windows mit AMD):
Hier Schritt 1 bis 3 durchführen: Anleitung und Downloadlinks und folgendes bei der Installation berücksichtigen:
- Bei Python darauf achten, das Häkchen bei "Set Path" zu Beginn der Installation zu setzen.
- Eine Festplatte/einen Ordner wählen, wo das Programm installiert sein soll (Empfehlung SSD mit mind. 25 GB Platz) und dort im Explorer nach einem Rechtsklick darauf "git bash here" wählen; im folgenden Fenster "git clone https://github.com/lshqqytiger/stable-diffusion-webui-directml.git"ausführen
- Der Ordnerpfad sollte an keiner Stelle Leerzeichen enthalten
A1111 Installation (Linux, Nvidia)
Dieser Anleitung folgen.A1111 Installation (Linux, AMD)
Dieser Anleitung folgen.WEB-UI starten
Im Browser auf http://127.0.0.1:7860 verbinden, sofern dieser sich nicht von selbst geöffnet hat, und man befindet sich im WEB-UI und kann loslegen.Wie man das UI verwendet, darauf findet ihr unter den weiterführenden Links zahlreiche Tutorials und How-Tos. Bei Fragen könnt ihr Euch auch immer an die User in diesem Thread wenden. Wir freuen uns, Euch zu helfen
Bei Problemen mit A1111 sind hier ein paar typische Lösungsansätze gesammelt.
Guide für A1111 für Mac User:
Installation und Starten auf MAC
Versionsspezifische Tipps
SDXL 1.0Weiterführende Links
Im Folgenden noch etliche, nützliche Links (hauptsächlich für SD).Hier findet ihr ausführliche WIKIs, Guides, Linklisten, Datenbanken von Künstlern/Stilen und vieles mehr - alles was ihr braucht, um den Durchblick zu erlangen, gute Ergebnisse zu erzielen und tiefer in die Materie einzusteigen.
Die Links sind auf Englisch, wer deutschsprachige Links parat hat, schickt mir diese gerne (per Nachricht) und ich ergänze die Liste entsprechend.
Youtube Kanäle
- Wossi86 (Deutsch)
- A Latent Place (Deutsch - Comfy UI)
- Samson Vowles - Delightful Design
- Nerdy Rodent
- Olivio Sarikas
- bycloud
- Aitrepreneur
- Software Engineering Courses - SE Courses
- Sebastian Kamph
- Levende Streg
- Bitesized Genius
- PromptGeek
- Scott Detweiler
- Arch_AI_3D
- Ai Flux
- AIchemy with Xerophayze
- Aiconomist
- AIKnowledge2Go
- AIVERSE
- Arch_AI_3D
- Artificially Intelligent
- CoderX
- Monzon Media
- Next Diffusion
- Not4Talent
- pixaroma
- invoke (invoke AI GUI)
Wikis & Allgemeine Guides
- Civit AI Articles (Guides etc.)
- Reddit - StableDiffusion WIKI
- Stable Diffusion - InstallGentoo Wiki
- GitHub - Maks-s/sd-akashic: A compendium of informations regarding Stable Diffusion (SD)
- Dreamer's Guide to Getting Started w/ Stable Diffusion! : StableDiffusion
- How to get images that don't suck: a Beginner/Intermediate Guide to Getting Cool Images from Stable Diffusion : StableDiffusion
- Made an easy quickstart guide for Stable Diffusion : StableDiffusion
- Noob's Guide to Using Automatic1111's WebUI : StableDiffusion
Communities
Künstler
- Stable Diffusion Artist Style Studies | Gallery View
- SD Artist Collection
- WIP list of artists for SD v1.4
- Comparison of top 500 Artists in Stable Diffusion
- Comparison of artist names. : StableDiffusion
- ARTISTS+KEYWORDS+ARTSTYLES KNOWN TO WORK WITH TEXT TO IMAGE - Google Docs
Models
Prompting
- H&A - 3DKX_1.0b Cheat Sheet - Google Docs
- Stable Diffusion Prompt Book — Stability.Ai
- Stable Diffusion Prompt Book From OpenArt - Stable Diffusion Prompt Book From OpenArt 11-13.pdf
- PromptHero users are some of the best artists out there. Here are 5 examples you can get inspired by: : StableDiffusion
- PublicPrompts (u/Why_Soooo_Serious) - Reddit
- Compositional Visual Generation with Composable Diffusion Models
- Prompts (Modifiers) to Get Midjourney Style in Stable Diffusion : StableDiffusion
- Things that not everybody knows: Emoji prompting : StableDiffusion
- Prompt Crafter & Organizer by kfs334
- How to Write an Awesome Stable Diffusion Prompt
- Using decreased attention to reduce the caricature SD gives to some celebrities : StableDiffusion
- (2) how can I make the AI pay special attention to face details? : StableDiffusion
- Stable Diffusion prompting cheatsheet | Moritz' Blog
- Prompt Design for DALL·E: Photorealism — Emulating Reality | by Merzmensch | Merzazine | Medium
- Recommendations for Fantasy Artists to use in prompts (besides Greg)? : StableDiffusion
- promptoMANIA:: prompt builder
- Prompt Builder - AI Text Prompt Generator
- Generator
- CLIP Prompt Engineering for Generative Art - matthewmcateer.me
- http://vectors.nlpl.eu/explore/embeddings/en/associates/
- Prompt to create "Hyper-Realistic Anime Portraits" with SD v1.4-1.5 : StableDiffusion
- Home - Public Prompts
Ich hoffe dieser Thread wächst und gedeiht, mit zahlreichen Bildern, an denen wir uns gemeinsam erfreuen können und die neue User dafür begeistern, sich auch mit diesem spannenden Thema zu beschäftigen. Bei Änderungs- oder Ergänzungswünschen, schreibt mich einfach per PN an.
Zuletzt bearbeitet: