HPE & Intel: Aurora ist wenigstens der schnellste AI-Supercomputer
Intels Aurora läuft weiterhin nur mit unter 90 Prozent der Sollkapazität. Zum 1. Platz in der Disziplin AI reicht es trotzdem. So schnell wie vielerorts gedacht wird das System aber auch fertig nicht, wie Betreiber Argonne Labs erklärte: Intels Werbung mit „2 ExaFLOPs Rpeak“ war unglücklich. HPE ist hingegen in Feierlaune.
Endlich über 1 ExaFLOPS, aber 2 werden es nicht
Der Supercomputer Aurora hat zumindest endlich die ExaFLOPS-Marke überschritten. Das macht ihn übergeordnet zwar nicht zum schnellsten der Welt, in speziellen Sub-Tests kann er diesen Titel nichtsdestoweniger für sich vereinnahmen: Dass dies auch noch im Bereich AI passiert, freut neben dem Argonne Labs auch Intel.
Für Frontier auf Basis von AMD-Hardware an der Spitze hat es aber auch im zweiten Anlauf nicht gereicht. Das System ist zwar vollständig aufgebaut und es gibt keine echten Probleme, es wird aber noch immer optimiert. Für Benchmark-Durchläufe standen so nur etwas über 9.200 respektive 9.500 Blades der insgesamt über 10.600 Blades im Supercomputer zur Verfügung, was 87 respektive 89 Prozent der Gesamtleistung entspricht. Damit holt Intel/HPE/Argonne die Krone letztlich nicht, selbst beim Peak-Wert bleibt das Produkt noch unter den beworbenen 2 ExaFLOPs.
Rpeak ist nicht gleich Rmax
Was „Peak“ und was Alltagsleistung bedeutet, dazu gab es im Vorfeld der neuen Supercomputer Top500 einige Diskussion. Der Grund: Intel hatte in den Präsentationen zuletzt immer 2 ExaFLOPs als Angabe getätigt und dabei auch erwähnt, dass es sich um den Peak-Wert (Rpeak) handelt – das wurde medial in der Regel jedoch unterschlagen.
Rick L. Stevens, Quasi-Chef des Argonne National Laboratory, war davon doch ein wenig genervt zur Vorstellung, denn dieser Wert hat nicht viel mit der Realität zu tun. In der Regel bleiben von der theoretischen Leistung am Ende nur noch 50, 60 oder im besten Fall 70 Prozent Leistung übrig, erklärte er. Sie ist wiederum als Rmax definiert und bestimmt die Rangfolge in der Top100-Liste.
An Platz 1 und 2 der Liste wird das nun auch deutlich: Aurora kommt auf einen Rpeak von 1,98 ExaFLOPS, macht daraus aber nur Rmax von 1,012 ExaFLOPS. Frontier hingegen setzt Rpeak von 1,715 ExaFLOP in Rmax von 1,206 ExaFLOPs um. Theoretisch ist Aurora also schneller, praktisch aber nicht. Mit etwas Optimierung könnte Aurora Frontier noch knacken, es dürfte aber eine ziemlich enge Sache werden. In jeden Fall muss das System über die 60-Prozent-Marke der theoretisch verfügbaren Leistung klettern und wenn möglich alle Blades zur Verfügung stehen, Frontier mit 70 Prozent Rmax von Rpeak einmal mehr eindrucksvoll vor, wie effizient das System aufgesetzt ist. Und dann kommt ja auch bald El Capitan ...
Aurora ist im Vergleich zu Frontier ineffizient
Leistung ist dabei aber nicht alles. Aurora hat für die 1,012 ExaFLOPs 38,7 Megawatt Leistung aufgenommen, während Frontier für mehr Performance nur 22,8 Megawatt nutzt. Unterm Strich ist Aurora also nur halb so effizient wie Frontier. Das ist heutzutage für ein neues System eine eher unrühmliche Vorstellung, zumal der Chef der Argonne Labs auch direkt betont, dass die „Power Wall“ die größte Herausforderung für alle kommenden Systeme ist: Leistung einfach über die Leistungsaufnahme zu steigern, ist weder sinnvoll noch erstrebenswert, denn schon heute kommt die regionale Infrastruktur an ihre Grenzen, wenn es um die Stromversorgung von Rechenzentren geschweige denn Supercomputern geht.
HPE ist im Supercomputerbereich ganz oben
Bei HPE hat man mit Blick auf die neue Supercomputer-Rangliste wiederum alles richtig gemacht und darf sich zur ISC 2024 im Ruhm sonnen. Die Cray-EX-Plattform treibt die besten Systeme der Welt an: Nicht nur stellt HPE Platz 1 und Platz 2 der Bestenliste, eindrucksvoll sind vor allem auch die sieben Systeme in den Top10 der effizientesten Lösungen.
Die weitere Berichterstattung rund um die neuen Spitzenplätze zum ISC 2024:
- Top500 Supercomputer: Intels Aurora trotz ExaFLOPS nicht die Nummer 1
- Green500 Supercomputer: Nvidias GH200 setzt deutschen JEDI auf den Effizienz-Thron
ComputerBase hat Informationen zu diesem Artikel von HPE unter NDA erhalten. Die einzige Vorgabe war der frühest mögliche Veröffentlichungszeitpunkt.
- High Performance Computing: Ohne Wakü ist die Leistung in Zukunft nicht mehr zu bändigen
- Intels HPC-Chips: Ponte Vecchio tritt unrühmlich ab, Falcon Shores mit 1,5 kW
- EuroHPC zur ISC: Supercomputer in Europa wieder auf dem aufsteigenden Ast
- +4 weitere News