News Blackwell Mini-PC und Workstation: Nvidia bietet DGX Spark und DGX Station für Endkunden an

nlr

Redakteur
Teammitglied
Registriert
Sep. 2005
Beiträge
10.622
  • Gefällt mir
Reaktionen: BrollyLSSJ, KarlsruheArgus, eastcoast_pete und 3 andere
Ist ja fast schon "günstig" ! :cool_alt:
 
Ja ist zumindest ein Bezahlbarer KI-Rechner. Für Spielereien leider zu teurer aber für kleine Firmen ab 10-20 Mitarbeiter wo sich einer mit KI beschäftigt, sicher eine Lohnende Investition. Da kann die Arbeit dann schön von Bots erledigt werden :D

Was bezahlbares von Nvidia mit 32-48 GB VRAM wäre nice. Muss ja auch nicht der größte Chip. (ne 5070 mit 48 GB GDDR7 wäre nice ^_^) und das dann so für 1300-1400 €
 
Interessanter RAM ist in dem Studio verbaut. Ist das CAMM2?
 
Die GPU ist vergleichbar mit welchem Modell der 5xxx Serie? 5050/5060?

GB10 bietet eine GPU mit 1 PetaFLOPS FP4-Leistung (mit Sparsity)
Mal ist es FP4 oder FP8. Ist für mich wenig aussagekräftig.
 
Die DGX Station setzt auf den GB300 Grace Blackwell Ultra Desktop Superchip, der ein Blackwell-Ultra-Package mit zwei GPUs und 288 GB HBM3e über einen 900 GB/s schnellen NVLink-C2C-Interconnect mit einer Grace-CPU verbindet
Ist das wirklich so @nlr ? Ich sehe auf den Bildern nur eine GPU, nicht zwei.
 
Also eine 5070 mit 128Gb RAM für 3999$

Geht schlimmer aber geht auch besser. Glaube da macht eine RTX PRO 6000 schnell mehr Sinn. Bringt immerhin 3-4x mehr Rechenleistung mit. Und günstiger zusammenschließen kann man die auch in einem System mit 2-6 Karten
Ergänzung ()

stefan92x schrieb:
Ist das wirklich so @nlr ? Ich sehe auf den Bildern nur eine GPU, nicht zwei.
Eine GB200 besteht aus zwei Dies. Das ist vermutlich gemeint
 
  • Gefällt mir
Reaktionen: Bunhy
  • Gefällt mir
Reaktionen: MalWiederIch
@phanter Wäre ja cool wenn das in der News mit drin stehen würde. Bei der 6000 Pro stehen auch nur FP32 Angaben drin. Zumindest weis man dort das es der Vollausbau des 5090 Chips ist, weil es erwähnt wird.
 
NameHere schrieb:
@phanter Wäre ja cool wenn das in der News mit drin stehen würde. Bei der 6000 Pro stehen auch nur FP32 Angaben drin. Zumindest weis man dort das es der Vollausbau des 5090 Chips ist, weil es erwähnt wird.
Reden wir über das selbe in der news steht doch:
Der Chip vereint eine Blackwell-GPU mit einer Grace-Arm-CPU zu einem SoC mit 128 GB LPDDR5X und 1 TB oder 4 TB großer SSD. GB10 bietet eine GPU mit 1 PetaFLOPS FP4-Leistung (mit Sparsity) und ist wie die aktuellen RTX-50-Grafikkarten mit Tensor-Cores der 5.
 
@phanter wer soll mit dieser Angabe etwas anfangen können?
Schau mal was ich in #7 geschrieben habe.
 
War auf der Präsentation tatsächlich eines der interessantesten Produkte. Preislich ausnahmsweise - wie schon gesagt wurde in den Kommentaren - mal nicht komplett daneben und für Unternehmen vernünftig bepreist. Würde damit durchaus auch gerne mal ein wenig testen, was damit so geht. :)
 
Der Speicherdurchsatz liegt leider nur bei 273 GB/s. Siehe https://www.nvidia.com/en-us/products/workstations/dgx-spark/

Man bekommt also eine 5070 mit 128 GB RAM, das aber nur 40,625% des Durchsatzes der 5070 hat. Für LLM ist das aber der entscheidende Wert, da für jedes Token das komplette Modell ganz eingelesen werden muss, d.h. ein 100 GB großes Modell würde zwar laufen, aber maximal mit 2,73 Token/s, realistisch wahrscheinlich mit ca. 2 Token/s.

Bei dem Preis könnte man auch über einen Mac Studio nachdenken mit 128 GB (oder auch mehr) unified RAM, der dann aber mit 819 GB/s angebunden ist, also exakt 3 mal so schnell.
 
  • Gefällt mir
Reaktionen: Azdak und Mugen
Was ist "sparsity"?
 
Zurück
Oben