Fujitsu Monaka: Neues vom 144-Kern-Superchip aus Japan
In Japan wird an einem neuen Supercomputer-Chip gearbeitet. Dieser heißt Monaka, besitzt auf Chiplets verteilte 144 Kerne und wird der nächste Arm-Prozessor von Fujitsu für das Segment High-Performance-Computing (HPC) nach dem A64FX. Letzterer dient im einst schnellsten Supercomputer der Welt namens Fugaku.
Neue Details zum Fujitsu Monaka
Professor Satoshi Matsuoka, der das RIKEN Center for Computational Science (R-CCS) im japanischen Kobe leitet, an dem der Supercomputer Fugaku seinen Dienst verrichtet, hat ein Foto des neuen Chips Fujitsu Monaka als „mechanical Sample“ auf X geteilt. Dass der Chip aus mehreren Dies besteht, die als Chiplets zusammengefügt wurden, ist spätestens am beiliegenden Schema klar zu erkennen.
Und so sitzt im Zentrum der große, in 5 nm gefertigte I/O-Die, der die Schnittstellen bereitstellen wird, zu denen etwa auch PCIe 6.0 respektive der darauf basierende Compute Express Link (CXL) in Version 3.0 zählt.
Rundherum sind vier SRAM-Dies (ebenfalls 5 nm) verteilt, die den Zwischenspeicher (Last Level Cache) beinhalten. Darauf sitzen wiederum die eigentlichen CPU-Kerne, die in einem noch feineren 2-nm-Prozess hergestellt werden sollen. Jeweils einer dieser vier Core-Dies trägt demnach 36 Kerne in sich, denn insgesamt soll Monaka 144 Kerne bieten. Das entspricht nicht ganz den im Vorfeld erwarteten 150 Kernen, ist aber ein großer Schritt von den 48 Kernen des Fujitsu A64FX.
Monaka soll vor allem effizient werden
Natürlich wird mit dem neuen Prozessor eine Steigerung der Rechenleistung anvisiert. Im Vorfeld war davon die Rede, dass die Anwendungsleistung um den Faktor 1,7 höher als bei Konkurrenzprodukten im Erscheinungsjahr ausfallen werde. Jetzt soll Monaka sogar direkt doppelt so schnell sein, wie der Wettbewerb im Jahr 2027. Wie man das jetzt schon wissen kann, steht allerdings auf einem anderen Blatt. Vielmehr als eine grobe Schätzung ist dies also nicht.
Ebenfalls doppelt so hoch wie bei der Konkurrenz soll die Energieeffizienz in Leistung pro Watt ausfallen. Fujitsu spricht von „Ultra Low Voltage“, während es beim A64FX nur „Low Voltage“ heißt. Zudem soll diesmal eine reine Luftkühlung statt einer Kombination aus Luft- und Wasserkühlung genügen. Das Thema Energieeffizienz steht bei den Japanern ganz oben auf der Liste.
Kein HBM mehr im Einsatz
Ist der A64FX noch mit schnellem HBM2-Speicher bestückt, wird es beim Nachfolger Monaka allerdings nur DDR5-RAM geben. Verteilt auf 12 Kanäle wie bei den HPC-CPUs von AMD und Intel, wird dies trotzdem nur einen etwa halb so hohen Durchsatz bedeuten, letztlich die Plattform aber günstiger machen.
Der Vorgänger A64FX
Im Juni 2020 erstürmte Japans Supercomputer Fugaku mit über 400 PetaFLOPS und seinerzeit großem Vorsprung (Platz zwei kam nicht einmal auf 150 PetaFLOPS) den Thron der Top-500-Systeme. Zwei Jahre lang blieb Fugaku an der Spitze und wurde erst im Juni 2022 durch das US-System Frontier mit über 1.000 PetaFLOPS abgelöst. In der jüngsten Weltrangliste aus dem November 2024 liegt Fugaku immerhin noch auf Rang 6, was für 4,5 Jahre seit Aufnahme in die Liste sehr beachtlich ist.
Die seinerzeit unübertroffene Rechenleistung erzielte Fugaku nicht mit Hilfe von GPU-basierten Rechenbeschleunigern wie es bei Frontier und den meisten der Top10 der Fall ist. Stattdessen wird eine Armada von 48-Kern-CPUs eingesetzt. In jedem der 158.976 Rechenknoten (Nodes) steckt ein 48-Kern-Prozessor des Typs A64FX. Der von Fujitsu in Kooperation mit Arm entwickelte Chip nutzte erstmals die Befehlssatzerweiterung ARMv8.2-A SVE (Scalable Vector Extension). Beinm Nachfolger wird es ARMv9 und SVE2 geben.
Rang (zuvor) | System | Standort | Rechenleistung (Rmax) | Prozessoren | Aufnahme Top500 |
---|---|---|---|---|---|
1 (-) | El Capitan | USA | 1.742,00 PetaFLOPS | AMD Epyc 4th Gen (24C, 1,8 GHz) AMD Instinct MI300A |
November 2024 |
2 (1) | Frontier | USA | 1.353,00 PetaFLOPS | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
Juni 2022 |
3 (2) | Aurora | USA | 1.012,00 PetaFLOPS | Intel Xeon Max 9470 (52C, 2,4 GHz) Intel GPU Max 1550 (?) |
November 2023 |
4 (3) | Eagle | USA | 561,20 PetaFLOPS | Intel Xeon Platinum 8480C (48C, 2,0 GHz) Nvidia H100 |
November 2023 |
5 (-) | HPC6 | Italien | 477,90 PetaFLOPS | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
November 2024 |
6 (4) | Fugaku | Japan | 442,01 PetaFLOPS | Fujitsu A64FX (48C, 2,2 GHz) | Juni 2020 |
7 (6) | Alps | Schweiz | 434,90 PetaFLOPS | Nvidia Grace (72C, 3,1 GHz) Nvidia GH200 |
Juni 2024 |
8 (5) | LUMI | Finnland | 379,70 PetaFLOPS | AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X |
Juni 2022 |
9 (6) | Leonardo | Italien | 241,20 PetaFLOPS | Intel Xeon Platinum 8358 (32C, 2,6 GHz) Nvidia A100 |
November 2022 |
10 (-) | Tuolumne | USA | 208,10 PetaFLOPS | AMD Epyc 4th Gen (24C, 1,8 GHz) AMD Instinct MI300A |
November 2024 |
Änderungen gegenüber letzter Liste fett hervorgehoben |