Fujitsu Monaka: Neues vom 144-Kern-Superchip aus Japan

Michael Günsch
6 Kommentare
Fujitsu Monaka: Neues vom 144-Kern-Superchip aus Japan
Bild: Satoshi Matsuoka (X)

In Japan wird an einem neuen Supercomputer-Chip gearbeitet. Dieser heißt Monaka, besitzt auf Chiplets verteilte 144 Kerne und wird der nächste Arm-Prozessor von Fujitsu für das Segment High-Performance-Computing (HPC) nach dem A64FX. Letzterer dient im einst schnellsten Supercomputer der Welt namens Fugaku.

Neue Details zum Fujitsu Monaka

Professor Satoshi Matsuoka, der das RIKEN Center for Computational Science (R-CCS) im japanischen Kobe leitet, an dem der Supercomputer Fugaku seinen Dienst verrichtet, hat ein Foto des neuen Chips Fujitsu Monaka als „mechanical Sample“ auf X geteilt. Dass der Chip aus mehreren Dies besteht, die als Chiplets zusammengefügt wurden, ist spätestens am beiliegenden Schema klar zu erkennen.

Und so sitzt im Zentrum der große, in 5 nm gefertigte I/O-Die, der die Schnittstellen bereitstellen wird, zu denen etwa auch PCIe 6.0 respektive der darauf basierende Compute Express Link (CXL) in Version 3.0 zählt.

Fujitsu Monaka
Fujitsu Monaka (Bild: Fujitsu)

Rundherum sind vier SRAM-Dies (ebenfalls 5 nm) verteilt, die den Zwischenspeicher (Last Level Cache) beinhalten. Darauf sitzen wiederum die eigentlichen CPU-Kerne, die in einem noch feineren 2-nm-Prozess hergestellt werden sollen. Jeweils einer dieser vier Core-Dies trägt demnach 36 Kerne in sich, denn insgesamt soll Monaka 144 Kerne bieten. Das entspricht nicht ganz den im Vorfeld erwarteten 150 Kernen, ist aber ein großer Schritt von den 48 Kernen des Fujitsu A64FX.

Fujitsu Monaka
Fujitsu Monaka (Bild: Fujitsu)

Monaka soll vor allem effizient werden

Natürlich wird mit dem neuen Prozessor eine Steigerung der Rechenleistung anvisiert. Im Vorfeld war davon die Rede, dass die Anwendungsleistung um den Faktor 1,7 höher als bei Konkurrenzprodukten im Erscheinungsjahr ausfallen werde. Jetzt soll Monaka sogar direkt doppelt so schnell sein, wie der Wettbewerb im Jahr 2027. Wie man das jetzt schon wissen kann, steht allerdings auf einem anderen Blatt. Vielmehr als eine grobe Schätzung ist dies also nicht.

Fujitsu Monaka (Bild: Fujitsu)

Ebenfalls doppelt so hoch wie bei der Konkurrenz soll die Energieeffizienz in Leistung pro Watt ausfallen. Fujitsu spricht von „Ultra Low Voltage“, während es beim A64FX nur „Low Voltage“ heißt. Zudem soll diesmal eine reine Luftkühlung statt einer Kombination aus Luft- und Wasserkühlung genügen. Das Thema Energieeffizienz steht bei den Japanern ganz oben auf der Liste.

Kein HBM mehr im Einsatz

Ist der A64FX noch mit schnellem HBM2-Speicher bestückt, wird es beim Nachfolger Monaka allerdings nur DDR5-RAM geben. Verteilt auf 12 Kanäle wie bei den HPC-CPUs von AMD und Intel, wird dies trotzdem nur einen etwa halb so hohen Durchsatz bedeuten, letztlich die Plattform aber günstiger machen.

Der Vorgänger A64FX

Im Juni 2020 erstürmte Japans Supercomputer Fugaku mit über 400 PetaFLOPS und seinerzeit großem Vorsprung (Platz zwei kam nicht einmal auf 150 PetaFLOPS) den Thron der Top-500-Systeme. Zwei Jahre lang blieb Fugaku an der Spitze und wurde erst im Juni 2022 durch das US-System Frontier mit über 1.000 PetaFLOPS abgelöst. In der jüngsten Weltrangliste aus dem November 2024 liegt Fugaku immerhin noch auf Rang 6, was für 4,5 Jahre seit Aufnahme in die Liste sehr beachtlich ist.

A64FX-Prozessor des Supercomputers „Fugaku“
A64FX-Prozessor des Supercomputers „Fugaku“ (Bild: Fujitsu)

Die seinerzeit unübertroffene Rechenleistung erzielte Fugaku nicht mit Hilfe von GPU-basierten Rechenbeschleunigern wie es bei Frontier und den meisten der Top10 der Fall ist. Stattdessen wird eine Armada von 48-Kern-CPUs eingesetzt. In jedem der 158.976 Rechenknoten (Nodes) steckt ein 48-Kern-Prozessor des Typs A64FX. Der von Fujitsu in Kooperation mit Arm entwickelte Chip nutzte erstmals die Befehlssatzerweiterung ARMv8.2-A SVE (Scalable Vector Extension). Beinm Nachfolger wird es ARMv9 und SVE2 geben.

Die Top10 der schnellsten Supercomputer laut Top500.org
Rang (zuvor) System Standort Rechenleistung (Rmax) Prozessoren Aufnahme Top500
1 (-) El Capitan USA 1.742,00 PetaFLOPS AMD Epyc 4th Gen (24C, 1,8 GHz)
AMD Instinct MI300A
November 2024
2 (1) Frontier USA 1.353,00 PetaFLOPS AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
Juni 2022
3 (2) Aurora USA 1.012,00 PetaFLOPS Intel Xeon Max 9470 (52C, 2,4 GHz)
Intel GPU Max 1550 (?)
November 2023
4 (3) Eagle USA 561,20 PetaFLOPS Intel Xeon Platinum 8480C (48C, 2,0 GHz)
Nvidia H100
November 2023
5 (-) HPC6 Italien 477,90 PetaFLOPS AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
November 2024
6 (4) Fugaku Japan 442,01 PetaFLOPS Fujitsu A64FX (48C, 2,2 GHz) Juni 2020
7 (6) Alps Schweiz 434,90 PetaFLOPS Nvidia Grace (72C, 3,1 GHz)
Nvidia GH200
Juni 2024
8 (5) LUMI Finnland 379,70 PetaFLOPS AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X
Juni 2022
9 (6) Leonardo Italien 241,20 PetaFLOPS Intel Xeon Platinum 8358 (32C, 2,6 GHz)
Nvidia A100
November 2022
10 (-) Tuolumne USA 208,10 PetaFLOPS AMD Epyc 4th Gen (24C, 1,8 GHz)
AMD Instinct MI300A
November 2024
Änderungen gegenüber letzter Liste fett hervorgehoben