Top500 Supercomputer: Wenn hinter Auroras halber Kraft ein Adler über Nvidia landet
Die Novemberausgabe der Top500 schnellsten Supercomputer ist da. Auch wenn Frontier Spitzenreiter bleibt, wurden die Top10 gehörig aufgemischt. Intels Aurora-System erreicht schon mit halber Kraft Platz 2. Direkt dahinter folgt Eagle von Microsoft und erstmals unter den schnellsten zehn ist auch Nvidia mit einem eigenen System.
AMD-System Frontier bleibt die Nummer 1
Ohne ebenbürtige Konkurrenz bleibt Frontier mit knapp 1,2 ExaFLOPS die Nummer eins. Das System nutzt AMDs 64-Kern-Prozessoren mit Zen-3 Architektur (Epyc Milan) sowie GPU-basierte Rechenbeschleuniger des Typs AMD Instinct MI250X. Daher ist es das Aushängeschild für HPC-Hardware aus dem Hause AMD.
Auf den nachfolgenden Plätzen gab es gleich vier Neueinsteiger, so viel hat sich im Spitzenfeld schon lange nicht mehr getan.
Rang (zuvor) | System | Standort | Rechenleistung (Rmax) | Prozessoren | Aufnahme Top500 |
---|---|---|---|---|---|
1 (1) | Frontier | USA | 1.194,00 PetaFLOPS | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
Juni 2022 |
2 (-) | Aurora | USA | 585,34 PetaFLOPS | Intel Xeon Max 9470 (52C, 2,4 GHz) Intel GPU Max 1550 (?) |
November 2023 |
3 (-) | Eagle | USA | 561,20 PetaFLOPS | Intel Xeon Platinum 8480C (48C, 2,0 GHz) Nvidia H100 |
November 2023 |
4 (2) | Fugaku | Japan | 442,01 PetaFLOPS | Fujitsu A64FX (48C, 2,2 GHz) | Juni 2020 |
5 (3) | LUMI | Finnland | 379,70 PetaFLOPS | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
Juni 2022 |
6 (4) | Leonardo | Italien | 238,70 PetaFLOPS | Intel Xeon Platinum 8358 (32C, 2,6 GHz) Nvidia A100 |
November 2022 |
7 (5) | Summit | USA | 148,60 PetaFLOPS | IBM Power9 (22C, 3,07 GHz) Nvidia Volta GV100 |
Juni 2018 |
8 (-) | MareNostrum 5 ACC | Spanien | 138,20 PetaFLOPS | Intel Xeon Platinum 8460Y (32C, 2,3 GHz) Nvidia H100 |
November 2023 |
9 (-) | Eos Nvidia DGX Superpod | USA | 121,40 PetaFLOPS | Intel Xeon Platinum 8480C (56C, 3,8 GHz) Nvidia H100 |
November 2023 |
10 (6) | Sierra | USA | 94,64 PetaFLOPS | IBM Power9 (22C, 3,1 GHz) Nvidia Volta GV100 |
Juni 2018 |
Änderungen gegenüber letzter Liste fett hervorgehoben |
Intels Aurora mit halber Kraft schon auf Rang 2
Das Gegenstück des Erzrivalen Intel nennt sich Aurora. Immer wieder kam es zu Verspätungen, doch jetzt ist Aurora endlich in den Top500 angekommen. Allerdings läuft das System noch mit halber Kraft: Zunächst liefert etwa die Hälfte der geplanten Rechenknoten eine Leistung von rund 585 PetaFLOPS (Rmax). Die nicht für die Rangliste relevante theoretische Spitzenleistung (Rpeak) soll die Marke von 1 ExaFLOPS knapp übertreffen.
Im Vollausbau sollen dann rund 2 ExaFLOPS erreicht werden, die lange angekündigt worden waren. Das würde reichen, um die rund 1,7 ExaFLOPS (Rpeak) von Frontier zu überbieten. Doch bei dem für die Rangliste entscheidenden Rmax-Wert würde es wohl nicht ganz reichen. Hier bleibt aber abzuwarten, welche Leistung das vollständige Aurora-System letztlich im Benchmark erzielt. Eine Hochrechnung ist weiter unten zu finden.
Aurora nutzt CPUs der Familie Sapphire Rapids von Intel, die ihrerseits spät dran waren. Konkret kommen Intel Xeon Max 9470 mit je 52 Kernen zum Einsatz. Die Beschleuniger stammen ebenso von Intel und werden in der Liste als „Data Center GPU Max“ bezeichnet. Dabei handelt es sich um Beschleunigerkarten mit Xe-HPC-Architektur, PCIe 5.0 und HBM2e.
Aktuell | Finales System* | |
---|---|---|
Nodes | 5.439 | 10.624 |
CPUs (2 pro Node, je 52 Kerne) | 10.878 | 21.248 |
GPUs (6 pro Node, je 128 Kerne) | 32.634 | 63.744 |
Kerne (CPU/GPU) | 4.742.808 (565.656 + 4.177.152) | 9.264.128 (1.104.896 + 8.159.232) |
Leistung (Rmax/Rpeak) | 585,34 PFLOPS / 1.059,33 PFLOPS | 1.143,34 PFLOPS / 2.069,19 PFLOPS |
*errechnet/geschätzt |
Auch wenn Details noch bestätigt werden müssen, ist von der größten Variante namens Max 1550 mit je 128 GPU-Kernen auszugehen. Da in jedem Node von Aurora 2 CPUs und 6 GPUs stecken, ergeben sich dann zusammengerechnet 872 Kerne pro Node. Beim Top500-Eintrag werden insgesamt 4.742.808 Kerne angegeben. Umgerechnet würde das 5.439 Nodes entsprechen, was etwas mehr als der Hälfte der von Intel anvisierten 10.624 Nodes im Vollausbau entspricht. Sofern die Leistung pro Node perfekt skaliert, würden sich bei Vollbestückung dann rund 1.143 PetaFLOPS (Rmax) respektive 2.069 PFLOPS (Rpeak) ergeben, doch ist dies nur eine Schätzung.
Sapphire Rapids stark im Kommen
Inzwischen nutzen schon 25 Systeme der Top500 Intel Sapphire Rapids, 20 davon sind mit der November-Liste neu hinzugekommen. Doch nur vier davon nutzen Intels GPU-Beschleuniger wie es bei Aurora in großem Maßstab der Fall ist.
Microsofts Adler aus der Azure-Cloud landet
Erstmals in den Top10 ist Microsoft mit einem System aus der Azure Cloud vertreten und markiert die eigentliche Überraschung in der neuen Liste. Der Supercomputer Eagle ist mit 561 PetaFLOPS kaum langsamer als Aurora in seiner bisherigen Form und damit das bisher mit Abstand schnellste System aus der Cloud in den Top500. Genutzt werden CPUs vom Typ Intel Xeon Platinum 8480C mit 56 Kernen aus der Generation Sapphire Rapids sowie Beschleuniger der Gattung Nvidia H100. Insgesamt kommt Eagle so auf 1.123.200 Kerne (CPU + GPU).
Somit rutscht Fugaku, die vorherige Nummer zwei auf den vierten Platz ab. Während das System mit Fujitsu-Chips aus Japan unverändert bei 442 PetaFLOPS liegt, legte LUMI, das weiterhin schnellste System Europas, etwas zu: Knapp 380 PetaFLOPS sind 70 mehr als in der letzten Ausgabe, trotzdem reicht es „nur“ für Platz fünf.
Nvidia mit eigenem System in den Top10
Ebenfalls zwei Plätze abgerutscht sind Leonardo (Italien) und Summit (USA). Auf Platz 8 liegt nun der spanische Neueinsteiger MareNostrum 5 mit einer gängigen Intel/Nvidia-Kombination. Diese nutzt auch Nvidia selbst mit seinem ersten System in den Top10: Der Eos Nvidia DGX SuperPOD bringt es mit 121 PetaFLOPS auf den neunten Rang. Somit wird der „Oldie“ Sierra mit IBM-Prozessoren auf Rang 10 verdrängt. Aus der Spitzengruppe herausgefallen sind unter anderem die chinesischen Systeme TaihuLight und das seit 10 Jahren in der Liste geführte Tianhe-2A.
Chinas schnellste nicht in der Liste?
An dieser Stelle muss erwähnt werden, dass Asienexperten davon ausgehen, dass China inzwischen über noch sehr viel leistungsfähigere Superrechner verfügt. In der offiziellen Weltrangliste fehlen diese aber, was angesichts der angespannten Wirtschaftsbeziehungen zwischen den USA und China wiederum nicht überrascht.
Nationen: USA gewinnt, China verliert
Sowohl bei der Anzahl der Systeme als auch bei deren kombinierter Rechenleistung legen die USA nochmals deutlich zu und dominieren die Rangliste klar. Die nunmehr 161 US-Systeme bringen es auf zusammen rund 3,7 ExaFLOPS oder über die Hälfte der kombinierten Rechenleistung der gesamten Top500, die im November 2023 bei rund 7,03 ExaFLOPS liegt. China wiederum verlor ganze 30 Systeme. Wie oben angemerkt, dürfte es aber weitere geben, die nur nicht mehr erfasst werden. Deutschland liegt unverändert mit 36 Systemen auf Platz 3, gefolgt von Japan und Frankreich.
Rang | Nation | Systeme | Rmax (TFLOPS, kombiniert) |
---|---|---|---|
1 | USA | 161 (+11) | 3.725.851 |
2 | China | 104 (-30) | 407.240 |
3 | Deutschland | 36 (unverändert) | 256.266 |
4 | Japan | 32 (-1) | 669.834 |
5 | Frankreich | 23 (-1) | 173.226 |
AMD, Intel und Nvidia
Intels Anteil als CPU-Lieferant nimmt trotz der hohen Akzeptanz von Sapphire Rapids weiter ab. Nur noch 67,6 Prozent der Top500 nutzen Intel, während es vor einem halben Jahr noch 72,0 Prozent waren. Im Gegenzug legt AMD zu: Statt 24,2 Prozent im Mai sind nun 28,0 Prozent oder 140 Systeme mit AMD-CPUs bestückt.
Bei den GPU-basierten Co-Prozessoren respektive Beschleunigern ist Nvidia weiter führend. Von den 186 Supercomputern, die solche Chips nutzen, entfallen allein 78 auf Nvidia Ampere und 65 auf Nvidia Volta. Nur 11 Systeme nutzen AMD Instinct und Intels Data Center GPU Max ist in vier Systemen vertreten.
Green500
Auf den ersten Plätzen der Green500 hat sich nichts geändert und Henri bleibt mit 65,4 GFLOPS/Watt das effizienteste System, gefolgt vom Frontier Test & Development System (TDS), bei dem es sich im Prinzip um nur 1 Rack des schnellsten Supercomputers Frontier handelt, welcher in Gänze auf Rang 8 der Green 500 landet.
Neu eingestiegen ist auch hier MareNostrum 5 ACC aus Spanien, das mit 53,98 GFLOPS/Watt Platz sechs erreicht. Erneut auf Platz 7 liegt LUMI mit einer Verbesserung auf 53,43 GFLOPS/Watt durch den jüngsten Ausbau. Danach folgt das effizienteste System aus Deutschland mit Goethe-NHR. Platz 10 gebührt dem Neueinsteiger Olaf aus Südkorea.
Mit 51,34 GFLOPS/Watt war das deutsche System amplitUDE in der Mai-Ausgabe 2023 noch auf dem achten Platz und hätte es auch wieder in die Top10 der Green500 geschafft. Doch reichte die Rechenleistung diesmal nicht mehr für die Top500, womit das System auch aus den Green500 verschwand.
Rang (Top500) | System | Standort | Energieeffizienz | Prozessoren | Aufnahme Top500 |
---|---|---|---|---|---|
1 (293) | Henri | USA | 65,40 GFLOPS/Watt | Intel Xeon Platinum 8362 (32C, 2,8 GHz) Nvidia H100 |
November 2022 |
2 (44) | Frontier TDS | USA | 62,68 GFLOPS/Watt | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
Juni 2022 |
3 (17) | Adastra | Frankreich | 58,02 GFLOPS/Watt | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
Juni 2022 |
4 (25) | Setonix GPU | Australien | 56,98 GFLOPS/Watt | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
November 2022 |
5 (92) | Dardel GPU | Schweden | 56,49 GFLOPS/Watt | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
November 2022 |
6 (8) | MareNostrum 5 ACC | Spanien | 53,98 GFLOPS/Watt | Intel Xeon Platinum 8460Y (32C, 2,3 GHz) Nvidia H100 |
November 2023 |
7 (5) | LUMI | Finnland | 53,43 GFLOPS/Watt | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
Juni 2022 |
8 (1) | Frontier | USA | 52,59 GFLOPS/Watt | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
Juni 2022 |
9 (84) | Goethe-NHR | Deutschland | 46,54 GFLOPS/Watt | AMD Epyc 7452 (32C, 2,35 GHz) AMD Instinct MI210 |
Mai 2023 |
10 (496) | Olaf | Südkorea | 45,12 GFLOPS/Watt | AMD Epyc 9334 (32C, 2,7 GHz) Nvidia H100 |
November 2023 |
Änderungen gegenüber letzter Liste fett hervorgehoben |
ComputerBase hat Informationen zu diesem Artikel von Top500.org unter NDA erhalten. Die einzige Vorgabe war der frühest mögliche Veröffentlichungszeitpunkt.