ExaFLOPS-Supercomputer: Chinas OceanLight schlägt mit 390-Kern-CPUs die Top 500
Die Gerüchte, dass Supercomputer aus China erstmals die magische Grenze von 1 ExaFLOPS Rechenleistung geknackt haben, werden durch einen Bericht des renommierten Asien-Experten Dr. David K. Kahaner zur Fachkonferenz SC21 bestätigt.
Kahaner, Gründer des Asian Technology Information Program (ATIP) und vielfach zitierter Experte für Hochleistungstechnologie in Asien, hat für die derzeit stattfindende Supercomputing Conference (SC21) eine Präsentation über demnach extrem leistungsstarke Supercomputer aus China erstellt. Teile der Präsentation wurden auf Twitter veröffentlicht.
Demnach erreicht das System Qingdao Marine Sunway Pro „OceanLight“ im auch für die Weltrangliste Top500 relevanten Linpack-Benchmark eine maximale Rechenleistung (Rmax) von etwa 1,05 ExaFLOPS. Die theoretische Spitzenleistung (Rpeak) soll bei 1,3 ExaFLOPS liegen. Mit 1 ExaFLOPS, was 1.000 PetaFLOPS entspricht, ist das System mehr als doppelt so schnell wie der Superrechner Fugaku aus Japan, der als amtierender Spitzenreiter der Top500 auf etwa 442 PetaFLOPS kommt.
Problem an den Ergebnissen aus China: Die westliche Welt erkennt sie nicht wirklich an, dafür müsste es ihre Benchmarks durchlaufen. Die offizielle Top500-Liste sieht deshalb noch anders aus.
Tianhe-3 ist noch schneller
Sogar noch deutlich schneller soll das zweite System NSCC Tianjin Tianhe-3 rechnen, dessen Linpack-Ergebnis auf mehr als 1,3 ExaFLOPS und die theoretische Spitzenleistung auf 1,7 ExaFLOPS geschätzt wird. Beim dritten System NSCC Shenzhen Phase 2 werde eine Rechenleistung von 2 ExaFLOPS anvisiert, doch sei noch nicht klar, wann dieses fertiggestellt sein wird, da sich der bisherige Zeitplan (2022) wohl verzögert.
Sunway-CPUs mit 390 Kernen
Die hohe Rechenleistung für OceanLight sollen Prozessoren vom Typ SW39010 mit je 390 CPU-Kernen und hybrider Architektur mit kleinen und großen Kernen liefern, die mit 512-Bit-Befehlen (analog zu AVX-512) umgehen können sollen. Laut Schätzung des Experten kommen in 96 Serverschränken jeweils 1.024 der 390-Kern-CPUs zum Einsatz, was insgesamt 38.338.560 Kerne für das System bedeuten würde. Die offizielle Nummer Vier der Top500 TaihuLight, die ebenfalls vom chinesischen Hersteller Sunway stammt, kommt mit ihren 260-Kern-CPUs auf insgesamt über 10,6 Millionen Kerne, bei der Nummer Eins Fugaku sind es gut 7,6 Millionen Kerne mit den 48-Kern-CPUs vom Typ Fujitsu A64FX.
OceanLight soll eine Leistungsaufnahme im Bereich von 35 MegaWatt (+/- 10 %) erreichen. Der nicht einmal halb so schnelle Fugaku liegt bei knapp 30 MegaWatt, was somit auch eine erheblich höhere Energieeffizienz für OceanLight bedeuten würde. Das System soll bereits im März 2021 vollendet worden sein.
Zu Tianhe-3, dessen Fertigstellung auf Ende Oktober 2021 geschätzt wird, liegen deutlich weniger Eckdaten vor. Die Rede ist von einer „Dual-Chip FeiTeng ARM and Matrix accelerator node architecture“. Bei den Vorgängern Tianhe-1A und Tianhe-2A wurden Intel-Prozessoren eingesetzt.
Beim verspäteten Shenzhen Phase 2 spekuliert Kahanar noch über die eingesetzte Plattform. Den Einsatz von Hygon-Prozessoren hält er eher für unwahrscheinlich, da diese wohl kaum die anvisierte Rechenleistung erreichen würden. Den Einsatz von AMD Zen 4 mit GPU-basierten Beschleunigern hält er nur für wahrscheinlich, wenn Sugon das System baut, was aber ebenso nicht gesichert ist. Aufgrund von US-Sanktionen gegen Sugon und auch einen Führungswechsel in Shenzhen hält er einen Wechsel bei den Plattformplänen für möglich, der auch für die Verzögerungen sorgen könnte.
Mit AMD Genoa alias Zen 4 und Radeon Instinct wird zum Beispiel der kommende US-Supercomputer El Capitan bestückt sein, der im Jahr 2023 ebenfalls zwei ExaFLOPS erreichen soll.