Racks mit Nvidia Blackwell: Erste Auslieferungen starten flankiert von möglichen Hitzeproblemen
CoreWeave und Dell verkünden die Auslieferung erster Blackwell-Racks, die den Auftakt der HPC-Messe SC24 in Atlanta begleiten. Zeitlich passend werden jedoch mögliche Hitzeprobleme bekannt. Unklar bleibt, inwiefern diese aber schon beseitigt wurden.
Der Report von The Information (Bezahlschranke) wird von großen Medienportalen wie Bloomberg und Reuters aufgegriffen und hat wenige Tage vor Bekanntgabe der Quartalszahlen von Nvidia einiges an Potenzial.
Nvidia NVL72 beherbergt 36 Grace-CPUs und 72 Blackwell-GPUs in einem flüssigkeitsgekühlten Rack. Hier soll es laut The Information zu Hitzeproblemen gekommen sein, die jedoch bereits vor einigen Monaten aufgetaucht waren und Anpassungen am Design nötig machten.
Inwiefern das umgesetzt wurde, ist unbekannt, Partner sollen jedoch angehalten worden sein, das Design der Racks mehrfach zu überarbeiten. Nvidia hatte kürzlich ein Problem bestätigt, das vor einigen Monaten bei der Blackwell-GPU aufgetaucht war und auch die Ausbeute reduzierte, und gemeinsam mit TSMC als behoben erachtet. Auch hier war es unter anderem The Information, die hierüber als erstes berichteten.
In einer Mitteilung an Reuters erklärte Nvidia, dass alle Auslieferungen im Plan liegen. Nvidia arbeite zusammen mit den Partnern an den Lösungen, heißt es weiter, die Dinge laufen „normal“ und „wie erwartet“. Dies ist kein echtes Dementi, denn wie erwartet schließt oft auch einige mögliche Probleme mit ein.
Erste Auslieferungen gestartet
Unabhängig davon vermeldeten in der Nacht CoreWeave und Dell die ersten Auslieferungen von GB200-Systemen, die den Meldungen über mögliche Hitzeprobleme schnell das Wasser abgraben.
Die Basis dafür ist der neue Dell PowerEdge XE9712, wie Firmenchef Michael Dell persönlich via X bestätigt. Der hohe Verbrauch der Komponenten hat Nvidia und den Partnern beim Design der Racks aber durchaus einiges abverlangt und Neuigkeiten hervorgebracht. Dell bekam im Juli ein umfassendes Patent zugesprochen, das sich um das erweiterte Management der Kühlung kümmert, um so in den unterschiedlichen Bereichen des Racks möglichst effizient zu arbeiten.