Laptop (Win) als Mac-Ersatz für Stable Diffusion

Thrushbeard

Newbie
Registriert
Apr. 2024
Beiträge
6
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]
1. Wofür möchtest du deinen Laptop nutzen? Gewerblicher oder privater Einsatz?
Stable Diffusion, etwas Bildbearbeitung / Privat

1.1. Möchtest du den Laptop in erster Linie mobil oder stationär nutzen? Wie mobil soll der Laptop sein? Soll es ein 2in1-Notebook/Convertible sein?
Stationär auf Tisch (wenn vorhanden) und am Stromnetz

1.2. Wenn du Spiele spielen möchtest: Welche Spiele? Welcher Detailgrad?
Keine Spiele

1.3. Musik-/Bild-/Videobearbeitung oder CAD: Welche Software? Professionell oder Hobby?
A1111, Krita, Photoshop / Hobby

2. Wie groß soll das Display sein? Möchtest du einen Touchscreen oder eine besonders hohe Display-Qualität?
ist mir relativ egal

3. Wie lang soll die Akkulaufzeit sein?
auch egal, da ich den Laptop wohl meist ans Stromnetz anschließe

4. Welches Betriebssystem möchtest du nutzen? Ist eine Lizenz vorhanden? Soll das Notebook schon ein Betriebssystem vorinstalliert haben? Bekommst du Windows über die Uni?
Windows

5. Hast du Wünsche bezüglich des Designs, der Verarbeitungsqualität, des Materials oder der Farbe?
Gute Verarbeitungsqualität ist wünschenswert

6. Gibt es noch andere besondere Anforderungen, die nicht abgefragt wurden? Große Festplatte? Nummernblock? Tastaturbeleuchtung? Stiftunterstützung? Docking per USB-C/Thunderbolt 3? CD/DVD-Laufwerk? (Bildungs-)Rabatte? Service & Garantie? Wartungsmöglichkeiten? SD-Kartenleser?


7. Wie viel Geld bist du bereit auszugeben? Kommt ein Gebrauchtkauf in Frage?
absolute Schmerzgrenze: maximal 4000€

Erstmal ein Hallo an die Runde.
Ich bin neu hier und hoffe ich falle nicht gleich mit der Tür ins Haus (Forum) für die eher komplexe (oder simple ?) Kaufberatung 😉

Zu meinem Anliegen (Thread-Titel), da hole ich mal etwas weiter aus, tut aber nicht weh:
Aktuell suche ich einen Laptop für Stable Diffusion (A1111, Krita).
Im Moment nutze ich noch für die ganze Sache einen Mac Studio M2 Max (auch wenn das Ding nicht wirklich für SD optimiert ist).
Möchte aber gerne wieder vom Mac inkl. MacOS weg und zurück zu Windows - also warum nicht gleich zwei Fliegen mit einer Klatsche ... klatschen?!

Denke mal das die Fragen kommen wird, daher beantworte ich diese mal schnell:
"Warum keinen Stationärer PC (Tower) der weitaus mehr Power bietet ?"
Ich bin viel unterwegs, lebe mehrere Monate von Hotel zu Hotel - um da Abends vom Berufsstress abzuschalten hab ich vor 1 1/2 Jahren Stable Diffusion für mich entdeckt... versetzt mich quasi in nen Zen Modus.
Hab bisher den Mac Studio mit dabei gehabt, war schnell im Hotel per HDMI an die "Fernseher" dort angeschlossen, gab aber auch schon Momente mit Röhrenfernseher (ja, die gibt es tatsächlich noch), dumm aus der Wäsche geguckt.
Nun, da kann ich leider keinen Tower durch die Weltgeschichte schleppen, da ist ein Laptop schon etwas mobiler.

Meinen letzten Laptop hatte ich vor etwa 20 Jahren... kurz gesagt: ich habe keine große Ahnung von Laptop´s (was ist gut ?, was ist brauchbar ? u.s.w.).

So weit wie ich bis jetzt weiß: ist ein Laptop mit ner 4090 mobile und 3080ti mobile (beide 16GB VRAM) ganz brauchbar für das Vorhaben !?
Habt ihr mögliche Kaufvorschläge ? Nutzt ihr selber SD Lokal auf einem Laptop und könnt ganz spezifisch ein System empfehlen ?


Viele Grüße

P.S: Sorry für den langen Text, habe versucht mich kurz zu halten.
 
Zuletzt bearbeitet: (typos)
Zunächst Mal der obligatorische Hinweis auf den Sammelthread zum Thema Stable Diffusion:

https://www.computerbase.de/forum/t...erung-stable-diffusion-midjourney-co.2107246/

Ansonsten ist CUDA mit möglichst viel VRAM auf jeden Fall der richtige Weg. Der tatsächliche Chip ist dann fast schon etwas weniger wichtig als der VRAM.

Genaue Hardware-Empfehlungen können andere im Laptop Bereich sicher besser geben, aber ich dachte ich gebe schonmal einen kurzen Einstand.
 
  • Gefällt mir
Reaktionen: Thrushbeard
Wie sind CPU-Kerne und RAM im Studio ausgelastet?

Die 4090 Laptop startet bei 3000€ bis max. 4000€ gibt's dann ca. 5-8 Modelle mit jeweils leicht unterschiedlicher Ram/SSD, CPU und Bildschirm Bestückung. Die Entscheidung kann also übersichtlich sein.
 
  • Gefällt mir
Reaktionen: Thrushbeard
Gibt es denn einen signifikanten unterschied zwischen der 4090 und der 3080ti was die performance betrifft in Sachen Stable Diffusion, nicht fürs Gaming ?

Zur CPU und RAM Auslastung beim Mac Studio:
Mac Studio M2 Max (64GB RAM - 12‑Core CPU, 38‑Core GPU)

Test mit A1111 (v1.8.0)

1. SD1.5 (Photon): - 768x768 - DPM++2M Karras - 20 Steps - CFG: 4 - Renderzeit: 23sec
CPU: 2% - GPU:97% - RAM (Phyton Prozess) 9.61GB
2. Das gleiche mit HiresFix - 4x Ultra Sharp - 2x upscale - 8 Hires Steps - 0.35 denoise - 2min 44sec
CPU: 3% - GPU:97% - RAM (Phyton Prozess) 22.00 GB

3. SDXL (JuggernautXL v8) - 1024x1024 - DPM++2M Karras - 20 Steps - CFG: 4 - 39.3sec
CPU: 3% - GPU:97% - RAM (Phyton Prozess) 20.82 GB
4. Das gleiche mit HiresFix - gleiche Einstellungen wie (2.) - 2min 48sec
CPU: 3% - GPU:97% - RAM (Phyton Prozess) 37.84 GB


Wusste jetzt nicht wie genau ich CPU/GPU und RAM auslesen soll - für RAM habe ich den Python Prozess (von A1111) genommen...
 
Keine Ahnung, ob es einen signifikanten Unterschied zwischen 3080 Ti und 4090 Laptop gibt für deine Anwendung. Die Aussage von @SpartanerTom scheint der Chip eher egal zu sein, aber vllt weißt du da ja noch Details? Die 4090 hätte mehr Cuda Cores (7500 zu 9300 ca.) und eben eine aktuellere Generation derer. Ggf. musst das im verlinkten Sammelthread nachfragen, ob sich die 4090 Laptop wirklich lohnt.

Bzgl. deinen Daten zur Auslastung. Da sind 1-2 Hinweise drin, danke, aber könntest du Szenario "4." mal laufen lassen und während dessen den Aktivitätsanzeige (= MacOS TaskManager) laufen lassen und grob etwas zur CPU-Auslastung (in xxx%, maximal können es 1200% sein, 100% pro Kern) sagen?

Die GPU Auslastung scheint hoch, bzw. praktisch maximal zu sein, allerdings sind die Apple GPUs völlig anders aufgebaut und ich hab keine Ahnung, welche Ausführungseinheiten dort genau genutzt werden und wie genau MacOS die 97% berechnet.

Da du 64GB Ram/VRam im Studio hast, reichen warhscheinlich die 16GB VRam + 32GB Ram der Windows-Laptops erstmal aus. Aufrüsten geht immer.

Wenn du viel mit dem Flugzeug unterwegs bist, spielt Gewicht und Größe des Gerätes für dich eine Rolle?

Anbei schon mal die Marktübersicht bei Geizhals, gefiltert nach 4090 + 3080 Ti, ab 16 Zoll (alles darunter hat ggf. Mühe mit der Kühlung), ab 300nits Bildschirm (unterste Grenze der Helligkeit, ist ein latenter Indikator für Bildschirm-Qualität) und bis 4000€:
https://geizhals.de/?cat=nb&xf=1129...e&hloc=de&plz=&dist=&filter=&sort=p&bl1_id=30

Mit weiteren Infos zu Gewicht/Größe, GPU und CPU können wir dann weiter eingrenzen.
 
  • Gefällt mir
Reaktionen: Thrushbeard
Also ich vermute die 4090 Laptop/Mobile wird sicher ein gutes Stück schneller sein, allerdings finde ich es weniger schlimm wenn man einen Tick länger warten muss als wenn man eine Anwendung/ein Modell gar nicht laufen lassen kann, weil der VRAM zu klein ist. Das war letztlich was ich zum Ausdruck bringen wollte.
 
  • Gefällt mir
Reaktionen: Thrushbeard
Hallo,
nein die Größe und das Gewicht des zukünftigen Laptops spielt keine Rolle - da habe ich keine Einschränkungen.

Das mit der Zoll-Größe des Bildschirms habe ich z.B. nicht gewusst, danke dafür 👍
Größerer Bildschirm = größeres Case = mehr/bessere Luftzirkulation ?
Und die mindest Nits als Indikator für die Qualität des Bildschirms, ebenfalls danke, da hätte ich nun als "Laptop-Laie" überhaupt nicht drauf geachtet.

Was den Mac betrifft, ich habe einfach mal ein Screenshot von den ganzen Aktivitäten gemacht (Anhang).
Gleiche Einstellungen wie Szenario (4.), UltraSharp, x2 upscale .... - Screenshot bei etwa 75% während des Hires.Fix-Prozess gemacht.

Üblicherweise gehe ich meist auf x1.5 statt x2 upscale...wenn überhaupt.
x2 nur, um den Mac etwas zu nerven 😉
Loras und Checkpoints trainiere ich selber nicht, habe ich auch nicht vor.

Denke mal das der 4090/3080ti Laptop zumindest die gleichen Renderzeiten wie der Mac erreichen kann - oder gar schneller ist ?!
 

Anhänge

  • ScreenshotHires.png
    ScreenshotHires.png
    480,7 KB · Aufrufe: 77
Nur, damit du hinterher nicht enttäuscht bist:

Ist dir klar, was dir Geräusch-technisch bevorsteht, wenn du so ein Hochleistungsnotebook beanspruchst? Dein Mac Studio gibt ja selbst unter Volllast höchstens ein leichtes Lüftchen von sich. Bei einem Windows-Notebook kannst du dich direkt mal auf 45 bis 55 dB einstellen.

+10 dB empfindet man in etwa als Verdoppelung der Lautstärke.
 
  • Gefällt mir
Reaktionen: Thrushbeard
Jep, vor dem Mac hatte ich ein Jahrzehnt lang diverse "potente" MiniPc´s und NUCs (Hades Canyon u.s.w.).
Ich finde leises aber dezent hörbares Spulenfiepen weitaus schlimmer als ein Raketenstart in kompakter Form.
 
Thrushbeard schrieb:
Das mit der Zoll-Größe des Bildschirms habe ich z.B. nicht gewusst, danke dafür 👍
Größerer Bildschirm = größeres Case = mehr/bessere Luftzirkulation ?
Ja so in etwa. Also es ist kein Automatismus, aber gibt ne Korrelation. 300W Stromverbrauch oder so in der Spitze wegzukühlen ist halt Aufwand, der Platz braucht.
Thrushbeard schrieb:
Und die mindest Nits als Indikator für die Qualität des Bildschirms, ebenfalls danke, da hätte ich nun als "Laptop-Laie" überhaupt nicht drauf geachtet.
Ist ein sehr loser Indikator und du scheinst ja auch Kontrolle über die Licht & Helligkeitsbedingungen zu haben, aber trotzdem...
Thrushbeard schrieb:
Was den Mac betrifft, ich habe einfach mal ein Screenshot von den ganzen Aktivitäten gemacht (Anhang).
Gleiche Einstellungen wie Szenario (4.), UltraSharp, x2 upscale .... - Screenshot bei etwa 75% während des Hires.Fix-Prozess gemacht.
Top, die CPU wird anscheinend praktisch gar nicht genutzt, ggf. zum Start der Berechnung, um alle Daten in den VRam zu schaufeln. Heißt etwa jeder der verfügbaren CPUs wird ausreichend sein.
Thrushbeard schrieb:
Denke mal das der 4090/3080ti Laptop zumindest die gleichen Renderzeiten wie der Mac erreichen kann - oder gar schneller ist ?!
Ich weiß es tatsächlich nicht, wahrscheinlich können das nur die Experten im verlinkten Thread abschätzen oder du googelst nochmal genauer, ggf. auf YT bzgl. Vergleichen zwischen Apples M Hardware (egal welche genau) und Nvidia Karten bei einem Workflow der deinem möglichst nahe kommt (bei den genutzten Software Bestandteilen).
Zwei Aspekte machen mich unsicher:
1) VRam - in Windows Notebooks bekommst du maximal 16GB. Wie sich dein Szenario 4 verhält, wenn 16GB VRam + 32GB Ram verfügbar sind und nicht potentielle 64GB VRam weiß ich nicht. Was passiert wenn der VRam voll ist? Wird in den Ram ausgelagert (=wäre gut) oder bricht die Berechnung ab?
2) GPU Rechenwerke - ich weiß nicht, welche exakten Bestandteile der Apple GPU und welche der NV GPUs von deiner Software (-Kombination) genutzt werden. Daher kann ich die Geschwindigkeit nicht einschätzen.

Ansonsten, schau dir die Geräte doch mal optisch an, so viele sind es ja nicht:
https://geizhals.de/?cat=nb&bpmax=4...3+05+17+-+RTX+4090~12_32768~13697_300~2379_16

Ich würde wahrscheinlich das Lenovo Legion nehmen, wenn du das Budget (fast) ausschöpfen willst. 1) dezentes Aussehen (subjektiv!), 2) 16 normale Kerne (nicht 8 + 16 kleine), 3) sehr stabiles und wertiges Gehäuse.
https://geizhals.de/lenovo-legion-pro-7-16arx8h-onyx-grey-82ws001dge-a3020498.html?hloc=de

Als "Budget" Option mit 3080 Ti werfe ich mal das HP Omen 17 in den Ring, das Asus RoG Zepherus M16 scheint bei der GPU Leistung leicht zu schwächeln.
 
  • Gefällt mir
Reaktionen: Thrushbeard
Also ich weiß noch von meinen Intel NUC, dass wenn der VRAM voll ist, der rest auf dem RAM ausgelagert wird. Denke mal das es beim Laptop/Notebook nicht anders sein wird, da beide mobile GPUs nutzen.

Vorteil vom MAC ist: man kann ihn quälen... 3 ControlNet Units mit versch. Preprocessoren + HiresFix x2 + aDetailer mit 2 Units, alles samt auf SDXL - da kommt keine Meldung von wegen Speicher ist voll.
Glaube das wird mit nem Laptop etwas anders sein.

Den Lenovo hab ich mir auch schon angeschaut, gefällt 👍

Werde in jeden Fall noch versuchen etwas über die Performance des Laptop zu recherchieren b.z.w. der GPU (in Sachen SD) im vergleich zum Mac Studio M2 - bevor ich jetzt überstürzt kaufe.


Schonmal einen Riesendank für die große Hilfe und vielen (wichtigen) Infos !
 
Zuletzt bearbeitet: (was vergessen...)
  • Gefällt mir
Reaktionen: Thrushbeard
Thrushbeard schrieb:
Also ich weiß noch von meinen Intel NUC, dass wenn der VRAM voll ist, der rest auf dem RAM ausgelagert wird. Denke mal das es beim Laptop/Notebook nicht anders sein wird, da beide mobile GPUs nutzen.

Vorteil vom MAC ist: man kann ihn quälen... 3 ControlNet Units mit versch. Preprocessoren + HiresFix x2 + aDetailer mit 2 Units, alles samt auf SDXL - da kommt keine Meldung von wegen Speicher ist voll.
Glaube das wird mit nem Laptop etwas anders sein.
Diese beiden Aussagen widersprechen sich doch, oder? Wenn beim NUC der VRam voll war, hat er einfach ausgelagert, aber auf dem Mac kommen/kamen keine Meldungen wegen vollem Speicher? Auf dem NUC aber doch, oder wie? :confused_alt:
Ein Vorteil der Windows Geräte wäre in diesem Sinne, dass du den Ram halt sehr leicht aufrüsten kannst, derzeit bis auf 96GB. Mittelfristig wird es auch noch 64GB Module geben, sprich 128GB Ram in den meisten Laptops (mit 2 Ram Slots).
Thrushbeard schrieb:
Schonmal einen Riesendank für die große Hilfe und vielen (wichtigen) Infos !
Gerne - spezielle Anfragen machen doch Spaß, falls du was handfestes raus findest, geb uns gerne Feedback hier! :)
 
  • Gefällt mir
Reaktionen: Thrushbeard
SpartanerTom schrieb:
Eventuell lohnt sich ein Blick auf
https://vladmandic.github.io/sd-extension-system-info/pages/benchmark.html

Da du ja mit der Materie schon etwas vertraut bist, kannst du mit den angegebenen Parametern ja schon eher etwas anfangen. Allerdings hab ich bei einer ersten Suche nicht viele Ergebnisse zur 3080Ti mobile gesehen.

Super hilfreich !
Habe mal die System Info Extension in A1111 installiert und den Benchmark durchlaufen lassen (SDXL Model).
Im schnitt komme ich da auf etwa 2.26it/s - 2.46it/s - habe das mal auf der Benchmark Seite mit der 4090 (16GB) Laptop verglichen.
Teilweiße kommen die 4090 Laptop Benchmarks auf 9it/s bis 14it/s mit SDXL Model - das ist schon weitaus schneller als auf dem Mac.

Model schrieb:
Diese beiden Aussagen widersprechen sich doch, oder? Wenn beim NUC der VRam voll war, hat er einfach ausgelagert, aber auf dem Mac kommen/kamen keine Meldungen wegen vollem Speicher? Auf dem NUC aber doch, oder wie? :confused_alt:
Ein Vorteil der Windows Geräte wäre in diesem Sinne, dass du den Ram halt sehr leicht aufrüsten kannst, derzeit bis auf 96GB. Mittelfristig wird es auch noch 64GB Module geben, sprich 128GB Ram in den meisten Laptops (mit 2 Ram Slots).

Gerne - spezielle Anfragen machen doch Spaß, falls du was handfestes raus findest, geb uns gerne Feedback hier! :)

Den NUC hatte ich nicht für SD genutzt, SD gab es da noch nicht.
War bezogen auf deine Frage: "Was passiert wenn der VRam voll ist? Wird in den Ram ausgelagert (=wäre gut) oder bricht die Berechnung ab?"
Ist mir damals nur aufgefallen, dass der NUC, wenn der VRAM voll war, auf den RAM ausgelagert hat (in der ein oder anderen 3D Grafik Software).
Was ich sagen wollte, dass man ab und zu mal im Netz liest, bei komplexeren Workflows in SD, "RuntimeError: CUDA out of memory" bei relativ kompetenten Grafikkarten aber hingegen der Mac mit selben Workflow keine Probleme damit hat das irgendwas "Out of Memory" ist - der frisst das einfach, auch wenns etwas länger dauert 🤭
 
Ah verstehe - ja klar, Auslagern auf den nächst größeren Speicher (der idR. langsamer ist) ist ja ein übliches Verhalten praktisch aller Betriebssysteme.

Das der Mac das einfach fressen kann, liegt eben daran, dass die M-Chips Ram und VRam nicht getrennt haben, sondern das ein Modul ist. Die SD Software erkennt in deinem Studio also 64GB VRam - so viel kriegt man bei NV/AMD nur mit (mehreren) Profi/Server-Karten.
 
  • Gefällt mir
Reaktionen: Thrushbeard und SpartanerTom
Zurück
Oben