GTC 2025

Blackwell-Nachfolger: Nvidia gibt Ausblick auf Rubin (Ultra) und Feynman

18.3.2025 22:44 Uhr

Zur Computex letzten Juni hatte sich Nvidia offen gezeigt und einen Blick auf die Roadmap bis Rubin (Ultra) erlaubt. Zur Keynote der GTC 2025 gab Nvidia-CEO Jensen Huang erste technische Details für Rubin und Rubin Ultra preis, bevor es auch einen Ausblick auf die übernächste Architektur Feynman gab. Die Zahlen sind gigantisch.

Nachdem Blackwell Ultra vor einem dreiviertel Jahr noch auf der zur Computex gezeigten Roadmap stand, ist die neue Data-Center-Lösung für schnelleres Inferencing vor allem von AI-Reasoning-Modellen heute offiziell vorgestellt worden und soll in der zweiten Jahreshälfte an den Start gehen. Analog zur Computex hat das Nvidia nicht davon abgehalten, schon heute einen Ausblick auf die nächsten drei Jahre zu geben.

Rubin-GPU und Vera-CPU folgen 2026

Im zweiten Halbjahr 2026 soll Rubin respektive die Doppellösung Vera Rubin vorgestellt werden. Namensgeberin ist die 2016 verstorbene Astronomin Vera Cooper Rubin, deren Enkelkinder heute im Publikum der GTC-Keynote saßen. Rubin stand auch schon zur Computex auf der Roadmap, das Produkt war damals aber nur grob umrissen worden. Heute zeigte sich Jensen Huang erstaunlich offen mit technischen Details.

Neues Namensschema mit Anzahl der GPUs

Zunächst einmal musste Huang eingestehen, dass man mit der bisherigen Produktbezeichnung einen Fehler gemacht habe. Bei Blackwell setzt sich jeder Chip aus zwei GPUs zusammen, dennoch ist zum Beispiel bei GB300 NVL72 nur von 72 GPUs die Rede, obwohl es sich eigentlich um 72 Chip-Packages mit 144 GPUs handelt.

144 GPUs mit 20 TB HBM4 im neuen Oberon Rack

Bei Rubin geht Nvidia das Problem mit einem neuen Namensschema an, das sich rein auf die Anzahl der GPUs und nicht mehr auf die Anzahl der Chip-Packages bezieht. Rubin wiederum ist die neue GPU, Vera hingegen die neue Nvidia-CPU mit Arm-Kernen. Als Komplettlösung im neuen „Oberon Rack“ lautet der Name Vera Rubin NVL144.

Die Zahlen sind gigantisch, werden aber noch größer

Rubin ist analog zu Blackwell eine 2-Retikel-GPU mit einem schnellen Die-to-Die-Interconnect (10 TB/s bei Blackwell). Rubin bietet 288 GB HBM4 und eine FP4-Leistung von 50 PetaFLOPS, was einer Steigerung um den Faktor 3,3x gegenüber Blackwell Ultra entspricht. Die Vera-CPU bietet 88 Custom-Arm-Kerne mit SMT für 176 Threads und wird mittels NVLink-C2C-Interconnect mit 1,8 TB/s an die GPU angebunden. Vera Rubin NVL144 als fertiges Rack erreicht 3,6 ExaFLOPS für FP4-Inferencing, 1,2 ExaFLOPS für FP8-Training und bietet 20,7 TB HBM4 mit einer Gesamtbandbreite von 13 TB/s. NVLink 6 führt rückseitig alles mit einer Bandbreite von 260 TB/s zusammen.

Rubin Ultra verdoppelt 2027 die Anzahl der GPUs

Schluss ist damit bei Rubin aber noch lange nicht, im zweiten Halbjahr 2027 soll die abermals größere Lösung Rubin Ultra mit 4-Retikel-GPUs, also mit vier GPUs für jedes Chip-Package folgen. 16 Stapel HBM4e mit insgesamt 1 TB pro Package sieht Nvidia für Rubin Ultra vor, die Vera-CPU soll hingegen die gleiche wie bei Rubin bleiben.

So dicht war noch kein Rack zuvor gepackt

Als komplettes „Kyber Rack“ heißt die Lösung Rubin Ultra NVL576, weil jetzt 576 GPUs verteilt über 144 Packages zum Einsatz kommen. Das sind doppelt so viele Packages und viermal so viele GPUs wie aktuell mit Blackwell Ultra, die Nvidia in einem einzigen Rack unterbringen will. Dem einen von Nvidia veröffentlichten Bild nach geurteilt baut das Rack mit um 90 Grad gedrehten Compute-Trays noch einmal deutlich dichter als die aktuellen Racks. Der wassergekühlte Turm komme laut Jensen Huang auf einen Energiebedarf von 600 Kilowatt.

Rubin Ultra

15 ExaFLOPS für FP4-Inferencing

Rubin Ultra NVL576 bietet im Gegenzug 15 ExaFLOPS für FP4-Inferencing, 5 ExaFLOPS für FP8-Training, 1 TB HBM4e pro Package verteilt über 16 Stapel zu je 64 GB und insgesamt 144 TB HBM4e mit einer Gesamtbandbreite von 4,6 PB/s.

Feynman folgt 2028

Für das zweite Halbjahr 2028 steht schließlich Feynman als neue Architektur an, gewidmet dem Physiker Richard Phillips Feynman. Feynman war bislang auf keiner öffentlichen Roadmap zu sehen, auch zur GTC hielt sich Nvidia eher bedeckt.

Feynman soll demnach auf „Next-Gen“ HBM und bei Auswahl der Doppellösung weiterhin auf die Vera-CPU setzen. Mit der Generation einher gehen die 8. Generation NVSwitch für „NVL-Next“ und die neuen Netzwerklösungen Spectrum7 und ConnectX 10.

ComputerBase hat Informationen zu diesem Artikel von Nvidia im Rahmen einer Veranstaltung des Herstellers in San Jose, Kalifornien erhalten. Die Kosten für An-, Abreise und fünf Hotelübernachtungen wurden vom Unternehmen getragen. Eine Einflussnahme des Herstellers oder eine Verpflichtung zur Berichterstattung bestand nicht.

Wo gibt es GeForce RTX 5000 und Radeon RX 9000 zu kaufen? Unser RTX-50-Verfügbarkeits-Check und der RX-9000-Verfügbarkeits-Check informieren über aktuelle Listungen.

Nvidia GTC 2025 (17.–21. März 2025): Alle News auf der Themenseite!

SOCAMM: LPDDR5X-basierte RAM-Riegel für hohe Kapazität und Bandbreite
Nvidia RTX Pro 6000 (Max-Q): Blackwell mit 96 GB GDDR7 bei 300 bis 600 Watt ist offiziell
Für Rubin und Feynman: SK Hynix, Samsung und Micron zeigen HBM4 mit bis zu 48-GB-Stack
+6 weitere News