Grace: Nvidias erste CPU auf ARM-Basis erscheint 2023
Nvidia entwickelt jetzt auch CPUs. Mit „Grace“ auf ARM-Basis will es der Hersteller ab 2023 im HPC-Segment mit der Konkurrenz aufnehmen. Grace wird auf Next-Gen-ARM-Kerne setzen und soll vor allem Flaschenhälse bei der Verbindung zu GPU und Speicher lösen. Das soll Nvidia im High-Performance-Computing noch stärker machen.
Nvidias neues 3. Standbein: CPUs
„Grace“ kommt von Grace Hopper, einer US-amerikanischen Informatikerin und Computerpionierin. Der Codename „Hopper“ war bei Nvidia bisher als Bezeichnung für eine Multi-Chip-Grafiklösung vermutet worden, ab heute steht zumindest „Grace“ für ein nicht weniger wichtiges Projekt: Nvidias ersten eigenen Prozessor, dem neuen Standbein Nummer 3 und zugleich „fehlenden Puzzlestein“ im AI-Datenzentrum, wie der Konzern selbst sagt. Hopper als GPU könnte damit Geschichte sein, es sei denn, Nvidia vergibt Vor- und Nachname derselben Person separat.
Grace ist bei Nvidia primär der Codename für die gesamte neue ARM-Architektur von Nvidia, die jedoch auch als eigenständige CPU aufgelegt wird. „Grace-Next“ kündigt der Hersteller heute ebenfalls schon an, sie soll in der Automotive-Lösung Atlan mit abermals überarbeiteten CPU-Kernen als Bestandteil eines SoCs genutzt werden. Grace-Next wird allerdings erst im Jahr 2025 ein Thema, die erste Generation Grace soll hingegen schon in zwei Jahren für das HPC-Umfeld verfügbar sein. Zielmarkt für Grace sind AI-Datenzentren mit ihrem enormen Bedarf an Speicherbandbreite nicht nur in Richtung CPU, sondern insbesondere in Richtung GPU.
Um die 80 Kerne sind möglich
Laut erstem Schaubild könnte eine Grace-CPU für dieses Segment rund 80 Kerne umfassen. Sicht- respektive zählbar sind 84, acht davon sind aber nicht eindeutig, weshalb auch 76 Kerne denkbar sind. Technische Details liefert der Hersteller vorerst allerdings nicht. Inwiefern es verschiedene Ausführungen auf Basis von Grace geben wird, dazu ist heute ebenfalls noch nichts bekannt.
Laut Nvidia ist die zugrunde liegende Architektur „Next Gen Neoverse“, also der Nachfolger dessen, was bei ARM aktuell im Einsatz ist. ARM hatte erst vor zwei Wochen aber bereits die nächste Stufe angekündigt, ohne schon explizite Produkte zu nennen. Auf ARM v9 dürfte Grace dann letztendlich auch basieren. Nvidia nennt über 300 Punkte im SPECrate2017_int_base-Benchmark als aktuelle Zielvorgabe. AMD Epyc „Milan“ mit 64-Zen-3-Kernen erreicht in diesem Benchmark 820 Punkte, andere ARM-Prozessoren mit 64 bis 80 Kernen aber auch nur eine Spanne von 150 bis 250 Punkten.
Kampf den Flaschenhälsen
Um die reine CPU-Leistung geht es Nvidia dabei aber offensichtlich aber nicht ausschließlich. Nvidia will die CPU hingegen dazu nutzen, um Flaschenhälse in großen Systemen auszuräumen. Explizit gibt der Hersteller dabei x86-Prozessoren als de facto zu langsam an, wie er an einem Schaubild eines aktuellen DGX A100 mit AMD-Epyc-Prozessor nebst A100-Grafikkarten und zukünftigen Grace-CPUs mit A100-Grafikchips verdeutlicht.
Nicht nur soll bei Grace die CPU-Speicherbandbreite im Beispiel-System durch den Wechsel von klassischen DDR4 auf LPDDR5X von 200 auf 500 GB/s erhöht werden, der Wegfall von PCI Express 4.0 mit nur 16 GB/s Transferrate zum nativen NVLink der vierten Generation mit 900 GB/s zwischen Grace-CPUs und GPUs soll das System darüber hinaus massiv beschleunigen. Nvidia nennt eine Datentransferrate vom Arbeitsspeicher über den Prozessor zu den GPUs von bis zu 2.000 GB/s statt zuvor lediglich 64 GByte pro Sekunde.
Wie so oft scheint der Hersteller-Vergleich aber noch zu hinken, denn der grundlegende Aufbau ändert sich ebenfalls deutlich: Ein DXG A100 hat heute zwei Epyc-Prozessoren und acht A100-Grafiklösungen. Die zukünftigen Systeme werden jedoch auf acht Grace-Prozessoren für acht GPUs setzen.
Nvidias Intention wird dennoch deutlich: Die wesentlich effizientere Verzahnung von bereits bestehenden Technologien soll für eine deutliche Mehrleistung sorgen. Nvidia spricht in Bezug auf die Bandbreite von einem Faktor 30, wobei erneut die rund 2.000 GB/s zu 64 GB/s gemeint sein dürften. Das soll sich auch in der Praxis niederschlagen, bis zu 10 Prozent mehr Leistung sollen in Anwendungen möglich sein.
Im Swiss National Supercomputing Center (CSCS) soll mit dem Supercomputer Alps eine der ersten Lösungen bis zu 20 Exaflops an AI-Leistung im Jahr 2023 bereitstellen. Inwiefern AI-Funktionalitäten dabei abseits der GPUs auch durch Grace bereitgestellt werden, hat Nvidia ebenfalls noch nicht verraten.
Eine Schlappe für x86 und damit für Intel und AMD
Immer mehr Firmen wandern von x86 ab. Intel spürt das als x86-Marktführer seit geraumer Zeit, Konkurrent AMD weht derselbe Wind beim Wiedereinstieg mit Epyc in den Markt entgegen. Und der vor einem Jahr erzielte Erfolg mit einem Epyc-Prozessor in der DGX-Station wird heute schon wieder genutzt um zu zeigen, wie rückständig das x86-System mittlerweile vor allem in Spezialbereichen doch ist.
Hersteller wie Apple, Amazon, Google, Huawei und zuletzt auch Microsoft setzten immer häufiger auf eigene Lösung auf ARM-Basis. Weil Nvidia seit Jahren ARM-basierte SoCs baut und die Firma im vergangenen Jahr dann auch noch angekündigt hat, ARM für 40 Milliarden US-Dollar kaufen zu wollen, war es nur eine Frage der Zeit, bis auch Nvidia folgt. Die CPU sollte Nvidia zwar auch mit einer reinen ARM-Lizenz entwickeln können, aber der Schritt macht einmal mehr deutlich, wie wichtig ARM für den von Nvidia eingeschlagenen Weg zukünftig sein wird.
Nicht nur für den Markt, sondern insbesondere die x86-Konkurrenten dürften die kommenden Jahre spannend werden, wenn es um die CPU-Architektur im High-Performance-Segment insbesondere in Kombination mit GPU-Computing geht.
ComputerBase hat Informationen zu diesem Artikel von Nvidia unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.