SC23

Top500 Supercomputer: Wenn hinter Auroras halber Kraft ein Adler über Nvidia landet

Michael Günsch
54 Kommentare
Top500 Supercomputer: Wenn hinter Auroras halber Kraft ein Adler über Nvidia landet
Bild: Argonne National Laboratory

Die Novemberausgabe der Top500 schnellsten Supercomputer ist da. Auch wenn Frontier Spitzenreiter bleibt, wurden die Top10 gehörig aufgemischt. Intels Aurora-System erreicht schon mit halber Kraft Platz 2. Direkt dahinter folgt Eagle von Microsoft und erstmals unter den schnellsten zehn ist auch Nvidia mit einem eigenen System.

AMD-System Frontier bleibt die Nummer 1

Ohne ebenbürtige Konkurrenz bleibt Frontier mit knapp 1,2 ExaFLOPS die Nummer eins. Das System nutzt AMDs 64-Kern-Prozessoren mit Zen-3 Architektur (Epyc Milan) sowie GPU-basierte Rechenbeschleuniger des Typs AMD Instinct MI250X. Daher ist es das Aushängeschild für HPC-Hardware aus dem Hause AMD.

Frontier
Frontier (Bild: HPE)

Auf den nachfolgenden Plätzen gab es gleich vier Neueinsteiger, so viel hat sich im Spitzenfeld schon lange nicht mehr getan.

Die Top10 der schnellsten Supercomputer laut Top500.org
Rang (zuvor) System Standort Rechenleistung (Rmax) Prozessoren Aufnahme Top500
1 (1) Frontier USA 1.194,00 PetaFLOPS AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
Juni 2022
2 (-) Aurora USA 585,34 PetaFLOPS Intel Xeon Max 9470 (52C, 2,4 GHz)
Intel GPU Max 1550 (?)
November 2023
3 (-) Eagle USA 561,20 PetaFLOPS Intel Xeon Platinum 8480C (48C, 2,0 GHz)
Nvidia H100
November 2023
4 (2) Fugaku Japan 442,01 PetaFLOPS Fujitsu A64FX (48C, 2,2 GHz) Juni 2020
5 (3) LUMI Finnland 379,70 PetaFLOPS AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
Juni 2022
6 (4) Leonardo Italien 238,70 PetaFLOPS Intel Xeon Platinum 8358 (32C, 2,6 GHz)
Nvidia A100
November 2022
7 (5) Summit USA 148,60 PetaFLOPS IBM Power9 (22C, 3,07 GHz)
Nvidia Volta GV100
Juni 2018
8 (-) MareNostrum 5 ACC Spanien 138,20 PetaFLOPS Intel Xeon Platinum 8460Y (32C, 2,3 GHz)
Nvidia H100
November 2023
9 (-) Eos Nvidia DGX Superpod USA 121,40 PetaFLOPS Intel Xeon Platinum 8480C (56C, 3,8 GHz)
Nvidia H100
November 2023
10 (6) Sierra USA 94,64 PetaFLOPS IBM Power9 (22C, 3,1 GHz)
Nvidia Volta GV100
Juni 2018
Änderungen gegenüber letzter Liste fett hervorgehoben

Intels Aurora mit halber Kraft schon auf Rang 2

Das Gegenstück des Erzrivalen Intel nennt sich Aurora. Immer wieder kam es zu Verspätungen, doch jetzt ist Aurora endlich in den Top500 angekommen. Allerdings läuft das System noch mit halber Kraft: Zunächst liefert etwa die Hälfte der geplanten Rechenknoten eine Leistung von rund 585 PetaFLOPS (Rmax). Die nicht für die Rangliste relevante theoretische Spitzenleistung (Rpeak) soll die Marke von 1 ExaFLOPS knapp übertreffen.

Im Vollausbau sollen dann rund 2 ExaFLOPS erreicht werden, die lange angekündigt worden waren. Das würde reichen, um die rund 1,7 ExaFLOPS (Rpeak) von Frontier zu überbieten. Doch bei dem für die Rangliste entscheidenden Rmax-Wert würde es wohl nicht ganz reichen. Hier bleibt aber abzuwarten, welche Leistung das vollständige Aurora-System letztlich im Benchmark erzielt. Eine Hochrechnung ist weiter unten zu finden.

Die geplanten Eckdaten für Aurora im Vollausbau
Die geplanten Eckdaten für Aurora im Vollausbau (Bild: Intel)

Aurora nutzt CPUs der Familie Sapphire Rapids von Intel, die ihrerseits spät dran waren. Konkret kommen Intel Xeon Max 9470 mit je 52 Kernen zum Einsatz. Die Beschleuniger stammen ebenso von Intel und werden in der Liste als „Data Center GPU Max“ bezeichnet. Dabei handelt es sich um Beschleunigerkarten mit Xe-HPC-Architektur, PCIe 5.0 und HBM2e.

Ausbaustufen vom Intel Aurora Supercomputer
Aktuell Finales System*
Nodes 5.439 10.624
CPUs (2 pro Node, je 52 Kerne) 10.878 21.248
GPUs (6 pro Node, je 128 Kerne) 32.634 63.744
Kerne (CPU/GPU) 4.742.808 (565.656 + 4.177.152) 9.264.128 (1.104.896 + 8.159.232)
Leistung (Rmax/Rpeak) 585,34 PFLOPS / 1.059,33 PFLOPS 1.143,34 PFLOPS / 2.069,19 PFLOPS
*errechnet/geschätzt

Auch wenn Details noch bestätigt werden müssen, ist von der größten Variante namens Max 1550 mit je 128 GPU-Kernen auszugehen. Da in jedem Node von Aurora 2 CPUs und 6 GPUs stecken, ergeben sich dann zusammengerechnet 872 Kerne pro Node. Beim Top500-Eintrag werden insgesamt 4.742.808 Kerne angegeben. Umgerechnet würde das 5.439 Nodes entsprechen, was etwas mehr als der Hälfte der von Intel anvisierten 10.624 Nodes im Vollausbau entspricht. Sofern die Leistung pro Node perfekt skaliert, würden sich bei Vollbestückung dann rund 1.143 PetaFLOPS (Rmax) respektive 2.069 PFLOPS (Rpeak) ergeben, doch ist dies nur eine Schätzung.

Sapphire Rapids stark im Kommen

Inzwischen nutzen schon 25 Systeme der Top500 Intel Sapphire Rapids, 20 davon sind mit der November-Liste neu hinzugekommen. Doch nur vier davon nutzen Intels GPU-Beschleuniger wie es bei Aurora in großem Maßstab der Fall ist.

Microsofts Adler aus der Azure-Cloud landet

Erstmals in den Top10 ist Microsoft mit einem System aus der Azure Cloud vertreten und markiert die eigentliche Überraschung in der neuen Liste. Der Supercomputer Eagle ist mit 561 PetaFLOPS kaum langsamer als Aurora in seiner bisherigen Form und damit das bisher mit Abstand schnellste System aus der Cloud in den Top500. Genutzt werden CPUs vom Typ Intel Xeon Platinum 8480C mit 56 Kernen aus der Generation Sapphire Rapids sowie Beschleuniger der Gattung Nvidia H100. Insgesamt kommt Eagle so auf 1.123.200 Kerne (CPU + GPU).

Somit rutscht Fugaku, die vorherige Nummer zwei auf den vierten Platz ab. Während das System mit Fujitsu-Chips aus Japan unverändert bei 442 PetaFLOPS liegt, legte LUMI, das weiterhin schnellste System Europas, etwas zu: Knapp 380 PetaFLOPS sind 70 mehr als in der letzten Ausgabe, trotzdem reicht es „nur“ für Platz fünf.

Nvidia mit eigenem System in den Top10

Ebenfalls zwei Plätze abgerutscht sind Leonardo (Italien) und Summit (USA). Auf Platz 8 liegt nun der spanische Neueinsteiger MareNostrum 5 mit einer gängigen Intel/Nvidia-Kombination. Diese nutzt auch Nvidia selbst mit seinem ersten System in den Top10: Der Eos Nvidia DGX SuperPOD bringt es mit 121 PetaFLOPS auf den neunten Rang. Somit wird der „Oldie“ Sierra mit IBM-Prozessoren auf Rang 10 verdrängt. Aus der Spitzengruppe herausgefallen sind unter anderem die chinesischen Systeme TaihuLight und das seit 10 Jahren in der Liste geführte Tianhe-2A.

Chinas schnellste nicht in der Liste?

An dieser Stelle muss erwähnt werden, dass Asienexperten davon ausgehen, dass China inzwischen über noch sehr viel leistungsfähigere Superrechner verfügt. In der offiziellen Weltrangliste fehlen diese aber, was angesichts der angespannten Wirtschaftsbeziehungen zwischen den USA und China wiederum nicht überrascht.

Nationen: USA gewinnt, China verliert

Sowohl bei der Anzahl der Systeme als auch bei deren kombinierter Rechenleistung legen die USA nochmals deutlich zu und dominieren die Rangliste klar. Die nunmehr 161 US-Systeme bringen es auf zusammen rund 3,7 ExaFLOPS oder über die Hälfte der kombinierten Rechenleistung der gesamten Top500, die im November 2023 bei rund 7,03 ExaFLOPS liegt. China wiederum verlor ganze 30 Systeme. Wie oben angemerkt, dürfte es aber weitere geben, die nur nicht mehr erfasst werden. Deutschland liegt unverändert mit 36 Systemen auf Platz 3, gefolgt von Japan und Frankreich.

Rang Nation Systeme Rmax (TFLOPS, kombiniert)
1 USA 161 (+11) 3.725.851
2 China 104 (-30) 407.240
3 Deutschland 36 (unverändert) 256.266
4 Japan 32 (-1) 669.834
5 Frankreich 23 (-1) 173.226

AMD, Intel und Nvidia

Intels Anteil als CPU-Lieferant nimmt trotz der hohen Akzeptanz von Sapphire Rapids weiter ab. Nur noch 67,6 Prozent der Top500 nutzen Intel, während es vor einem halben Jahr noch 72,0 Prozent waren. Im Gegenzug legt AMD zu: Statt 24,2 Prozent im Mai sind nun 28,0 Prozent oder 140 Systeme mit AMD-CPUs bestückt.

Bei den GPU-basierten Co-Prozessoren respektive Beschleunigern ist Nvidia weiter führend. Von den 186 Supercomputern, die solche Chips nutzen, entfallen allein 78 auf Nvidia Ampere und 65 auf Nvidia Volta. Nur 11 Systeme nutzen AMD Instinct und Intels Data Center GPU Max ist in vier Systemen vertreten.

Green500

Auf den ersten Plätzen der Green500 hat sich nichts geändert und Henri bleibt mit 65,4 GFLOPS/Watt das effizienteste System, gefolgt vom Frontier Test & Development System (TDS), bei dem es sich im Prinzip um nur 1 Rack des schnellsten Supercomputers Frontier handelt, welcher in Gänze auf Rang 8 der Green 500 landet.

Neu eingestiegen ist auch hier MareNostrum 5 ACC aus Spanien, das mit 53,98 GFLOPS/Watt Platz sechs erreicht. Erneut auf Platz 7 liegt LUMI mit einer Verbesserung auf 53,43 GFLOPS/Watt durch den jüngsten Ausbau. Danach folgt das effizienteste System aus Deutschland mit Goethe-NHR. Platz 10 gebührt dem Neueinsteiger Olaf aus Südkorea.

Mit 51,34 GFLOPS/Watt war das deutsche System amplitUDE in der Mai-Ausgabe 2023 noch auf dem achten Platz und hätte es auch wieder in die Top10 der Green500 geschafft. Doch reichte die Rechenleistung diesmal nicht mehr für die Top500, womit das System auch aus den Green500 verschwand.

Rang (Top500) System Standort Energieeffizienz Prozessoren Aufnahme Top500
1 (293) Henri USA 65,40 GFLOPS/Watt Intel Xeon Platinum 8362 (32C, 2,8 GHz)
Nvidia H100
November 2022
2 (44) Frontier TDS USA 62,68 GFLOPS/Watt AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
Juni 2022
3 (17) Adastra Frankreich 58,02 GFLOPS/Watt AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
Juni 2022
4 (25) Setonix GPU Australien 56,98 GFLOPS/Watt AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
November 2022
5 (92) Dardel GPU Schweden 56,49 GFLOPS/Watt AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
November 2022
6 (8) MareNostrum 5 ACC Spanien 53,98 GFLOPS/Watt Intel Xeon Platinum 8460Y (32C, 2,3 GHz)
Nvidia H100
November 2023
7 (5) LUMI Finnland 53,43 GFLOPS/Watt AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
Juni 2022
8 (1) Frontier USA 52,59 GFLOPS/Watt AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
Juni 2022
9 (84) Goethe-NHR Deutschland 46,54 GFLOPS/Watt AMD Epyc 7452 (32C, 2,35 GHz)
AMD Instinct MI210
Mai 2023
10 (496) Olaf Südkorea 45,12 GFLOPS/Watt AMD Epyc 9334 (32C, 2,7 GHz)
Nvidia H100
November 2023
Änderungen gegenüber letzter Liste fett hervorgehoben

ComputerBase hat Informationen zu diesem Artikel von Top500.org unter NDA erhalten. Die einzige Vorgabe war der frühest mögliche Veröffentlichungszeitpunkt.