Top500 November 2021: Noch kein Exascale, mehr AMD und HPE mit Cray vereint

Michael Günsch
35 Kommentare
Top500 November 2021: Noch kein Exascale, mehr AMD und HPE mit Cray vereint
Bild: Preferred Networks

Die 58. Ausgabe der „Top500“ als Weltrangliste der schnellsten Supercomputer bringt keine Änderungen an der Spitze und noch immer kein Exascale-System mit. Ein System von Microsoft Azure schafft den Sprung in die Top10. AMD legt in etwa so viel zu wie Intel verliert und HPE ist jetzt mit Cray vereint die Nummer zwei nach Lenovo.

Neueinsteiger auf der 10

Die ersten neun Plätze der Top10 sind unverändert. Das japanische System Fugaku bleibt mit 442 PFLOPS unangefochten an der Spitze und ist drei Mal so schnell wie Summit aus den USA auf Rang zwei. Der Neuzugang aus dem Sommer, Perlmutter, wurde von 64,59 auf 70,87 PFLOPS etwa um 10 Prozent beschleunigt, liegt aber unverändert auf Rang 5. Ohne Leistungsänderung bleibt das deutsche JUWELS Booster Module das schnellste System Europas mit 44 PFLOPS auf Platz 8.

Neu auf dem zehnten Platz steigt Voyager-EUS2 in die Top10 ein. Das System vom US-Cloud-Anbieter Microsoft Azure ist mit CPUs vom Typ AMD Epyc 7V12 mit je 48 Kernen und 2,45 GHz Takt sowie GPU-Beschleunigern vom Typ Nvidia A100 mit je 80 GB Speicher bestückt. Die einzelnen Server sind über InfiniBand verbunden, was nach Gigabit-Ethernet die häufigste Interconnect-Technik in den Top500 ist.

Rang (zuvor) System Standort Rechenleistung (Rmax) Prozessoren Aufnahme Top500
1 (1) Fugaku Japan 442,01 PetaFLOPS A64FX (48C, 2,2 GHz) Juni 2020
2 (2) Summit USA 148,60 PetaFLOPS IBM Power9 (22C, 3,07 GHz)
Nvidia Volta GV100
Juni 2018
3 (3) Sierra USA 94,64 PetaFLOPS IBM Power9 (22C, 3,1 GHz)
Nvidia Volta GV100
Juni 2018
4 (4) Sunway TaihuLight China 93,01 PetaFLOPS Sunway SW26010 (260C, 1,45 GHz) Juni 2016
5 (5) Perlmutter USA 70,87 PetaFLOPS AMD Epyc 7763 (64C, 2,45 GHz)
Nvidia A100
Juni 2021
6 (6) Selene USA 63,46 PetaFLOPS AMD Epyc 7742 (64C, 2,25 GHz)
Nvidia A100
Juni 2020
7 (7) Tianhe-2A China 61,44 PetaFLOPS Intel Xeon E5-2692v2 (12C, 2,2 GHz) Juni 2013
8 (8) JUWELS Booster Module Deutschland 44,12 PetaFLOPS AMD Eypc 7402 (24C, 2,8 GHz)
Nvidia A100
November 2020
9 (9) HPC5 Italien 35,45 PetaFLOPS Intel Xeon Gold 6252 (24C, 2,1 GHz)
Nvidia Tesla V100
Juni 2020
10 (–) Voyager-EUS2 USA 30,05 PetaFLOPS AMD Epyc 7V12 (48C, 2,45 GHz)
Nvidia A100
November 2021
Änderungen gegenüber letzter Liste fett hervorgehoben

Exascale nur abseits der offiziellen Disziplin

Entscheidend für die Weltrangliste der schnellsten Supercomputer ist die maximale Rechenleistung (Rmax) im High-Performance Linpack Benchmark mit doppelter Präzision (64 Bit Floating Point). Dort bleibt Fugaku mit bestätigten 442 PFLOPS das schnellste System der Welt. Stellvertretend für Anwendungen im Bereich Künstliche Intelligenz und Machine Learning steht der neue HPL-AI-Benchmark mit geringerer Präzision. Dort soll Fugaku bereits die Marke von 2 ExaFLOPS (2.000 PetaFLOPS) erreichen.

Wie die Betreiber der Top500-Liste mitteilen, gab es bereits Berichte über chinesische Systeme, die schon die ExaFLOPS-Marke geschafft haben sollen. Doch wurde für diese bisher kein gültiges HPL-Resultat eingereicht.

Voraussichtlich der erste Exascale-Supercomputer mit über 1 ExaFLOPS in FP64 wird das US-System Frontier werden. Dieses war für Ende 2021 geplant, wird aber doch erst nächstes Jahr in Betrieb genommen. Daher wurde die November-Ausgabe der Top500 knapp verpasst. Bestückt mit Epyc-CPUs und Instinct-GPUs von AMD soll Frontier im Vollausbau 1,5 ExaFLOPS erreichen. Ein hochrangiger Intel-Mitarbeiter hatte kürzlich eingestanden, dass das Rennen um den ersten Exascale-Supercomputer an AMD verloren werde. Das lange angekündigte Aurora-System hat zu viel Verspätung und wird wohl erst Ende 2022 fertig sein.

AMD-Systeme erobern Top15

Da auf den ersten Rängen so wenig Bewegung herrscht, wird in der Pressemitteilung von Top500.org ein Blick auf die direkt nachfolgenden Plätze 11 bis 15 geworfen. Dort gab es gleich vier Neueinsteiger. Neue Nummer 11 ist Voyager-EUS, ein zweites Microsoft-Azure-System mit AMD Epyc und Nvidia A100, das rund 28,7 PFLOPS erreicht. Auf Platz 12 und 13 folgen SSC-21 aus Südkorea und Polaris aus USA, die ebenfalls Epyc und A100 für 25,2 PFLOPS respektive 23,8 PFLOPS kombinieren. Platz 14 wird weiterhin von Frontera mit Intel Xeon und 23,5 PFLOPS belegt, während sich auf Platz 15 jetzt mit CEA-HF ein weiteres System mit AMD Epyc befindet.

Anteile bei CPUs und GPUs

Dass AMD-Systeme aktuell gefragt sind, zeigt sich bei den Anteilen der CPU-Hersteller in den Top500. Während AMD um knapp 5 Prozentpunkte auf nunmehr 14,8 Prozent der Systeme zulegen konnte, verlor Intel den etwa gleichen Anteil und liegt nur noch bei 81,4 Prozent. Unter den CPU-Architekturen ist Intel Skylake mit 155 Systemen oder 31 Prozent Anteil führend. AMD Rome (Zen 2) liegt mit 55 Systemen und 11 Prozent Anteil auf Rang 4. Erst auf dem neunten Platz kommt mit IBM Power eine CPU-Familie eines anderen Anbieters, die in sieben Systemen verbaut ist.

CPU-Familie Systeme (Anteil) Kerne (kombiniert)
Intel Skylake 155 (31,0 %) 11.441.300
Intel Cascade Lake 121 (24,2 %) 9.626.760
Intel Broadwell 83 (16,6 %) 6.195.260
AMD Rome (Zen 2) 55 (11,0 %) 10.360.240
Intel Haswell 20 (4,0 %) 4.521.516
AMD Milan (Zen 3) 17 (3,4 %) 2.929.504
Intel Ice Lake 10 (2,0 %) 1.184.452
Intel Xeon Phi 9 (1,8 %) 4.139.324
IBM Power 7 (1,4 %) 5.081.600
Intel Ivy Bridge 7 (1,4 %) 5.841.172

Fast konkurrenzlos ist weiterhin Nvidia bei den Systemen mit Beschleuniger/Co-Prozessor. Von den von 147 auf 152 angestiegenen entsprechenden Systemen nutzen allein 88 Nvidias Volta-Chips, 44 verwenden die neuere Ampere-Generation und acht sind noch mit Nvidia Pascal bestückt. Der verbreitetste Chip ist Nvidia Tesla V100 mit 68 Systemen oder 13,6 Prozent Anteil vor Nvidia A100 mit 18 Systemen und 3,6 Prozent Anteil. AMD Vega 20 steckt nur in einem System.

Länder und Hersteller

Auch wenn die Systeme aus China erneut weniger wurden und von 187 auf 173 sanken, bleibt das Land mit 34,6 Prozent Anteil führend. Die USA legten hingegen deutlich zu und stellen jetzt 150 Supercomputer beziehungsweise 30 Prozent der Top500. Danach folgen Japan (32), Deutschland (26) und Frankreich (19).

Sortiert nach kumulierter Rechenleistung führen die USA mit über 1.500 PFLOPs vor China (1.159 PFLOPs), Japan (828 PFLOPs) und Deutschland (281 PFLOPs).

Bei den Herstellern der Hochleistungsrechner führt weiterhin Lenovo mit 179 Systemen (35,8 %) vor HPE (16,8 %) und Inspur (10,0 %). Dass HPE jetzt mit 84 Systemen deutlich zugelegt und Inspur vom zweiten Platz verdrängt hat, liegt schlicht daran, dass nun auch die Systeme von Cray nach der Übernahme mitgezählt und nicht mehr separat aufgeführt werden. Nvidia kommt mit seinen eigenen Supercomputern inzwischen auf 14 Systeme (2,8 %) und den siebten Platz neben Fujitsu. Microsoft Azure bringt es auf mittlerweile 6 Systeme (1,2 %).

Green500 nach Effizienz

Die nach Energieeffizienz in GigaFLOPs pro Watt sortierte Green500-Liste wird weiterhin vom japanischen System MN-3 angeführt (Titelbild), das Xeon-Prozessoren vom Typ Platinum 8260M mit eigener Interconnect-Technik „MN-Core DirectConnect“ kombiniert und damit zwar „nur“ knapp 2,2 PetaFLOPs Spitzenleistung aber eine bisher unerreichte Effizienz von 39,379 GigaFLOPs pro Watt erreicht.

Zur Verteidigung des ersten Platzes wurde die Energieeffizienz deutlich gesteigert, denn die 29,7 GFLOPs/Watt aus der letzten Liste hätten diesmal nicht gereicht: Mit SSC-21 aus Südkorea, Tethys aus den USA und Wilkes-3 aus dem Vereinigten Königreich gibt es jetzt noch drei Systeme, die diese Marke übertreffen.

Rang (Top500) System Standort Energieeffizienz Prozessoren Aufnahme Top500
1 (302) MN-3 Japan 39,379 GFLOPs/Watt Intel Xeon Platinum 8260M (24C, 2,4 GHz) Juni 2020
2 (292) SSC-21 Scalable Module Südkorea 33,983 GFLOPs/Watt AMD Epyc 7543 (32C, 2,8 GHz)
Nvidia A100
November 2021
3 (296) Tethys USA 31,538 GFLOPs/Watt AMD Epyc 7742 (64C, 2,25 GHz)
Nvidia A100
November 2021
4 (281) Wilkes-3 UK 30,797 GFLOPs/Watt AMD Eypc 7763 (64C, 2,45 GHz)
Nvidia A100
November 2021
5 (31) HiPerGator AI USA 29,521 GFLOPs/Watt AMD Epyc 7742 (64C, 2,25 GHz)
Nvidia A100
Juni 2021
6 (404) Snellius Phase 1 GPU Niederlande 29,046 GFLOPs/Watt Intel Xeon Platinum 8360Y (36C, 2,4 GHz) November 2021
7 (5) Perlmutter USA 27,374 GFLOPs/Watt AMD Epyc 7763 (64C, 2,45 GHz)
Nvidia A100
Juni 2021
8 (72) Karolina, GPU partition Tschechien 27,213 GFLOPs/Watt AMD Epyc 7763 (64C, 2,45 GHz)
Nvidia A100
November 2021
9 (46) MeluXina - Accelerator Module Luxemburg 26,957 GFLOPs/Watt AMD Epyc 7452 (32C, 2,35 GHz)
Nvidia A100
Juni 2021
10 (263) Nvidia DGX SuperPOD USA 26,195 GFLOPs/Watt AMD Epyc 7742 (64C, 2,25 GHz)
Nvidia A100
November 2020

Als Gesamtsieger in allen Klassen müsste eigentlich Perlmutter gekrönt werden, denn neben Platz fünf in den Top500 gibt es für das nach dem Astrophysiker und Nobelpreisträger Dr. Saul Perlmutter benannte US-System auch den siebten Platz in den Green500.

In Sachen Energieeffizienz führt zwar ein Intel-System die Liste an, aber 8 von 10 der Top10 aus den Green500 sind mit AMD Epyc und Nvidia A100 bestückt.

Weitere Details zu den Weltranglisten und Systemen sind wie gewohnt auf top500.org abrufbar.

ComputerBase hat Informationen zu diesem Artikel von Top500.org unter NDA erhalten. Die einzige Vorgabe war der frühest mögliche Veröffentlichungszeitpunkt.