Fujitsu Monaka: Neues vom 144-Kern-Superchip aus Japan

12.12.2024 16:08 Uhr

In Japan wird an einem neuen Supercomputer-Chip gearbeitet. Dieser heißt Monaka, besitzt auf Chiplets verteilte 144 Kerne und wird der nächste Arm-Prozessor von Fujitsu für das Segment High-Performance-Computing (HPC) nach dem A64FX. Letzterer dient im einst schnellsten Supercomputer der Welt namens Fugaku.

Neue Details zum Fujitsu Monaka

Professor Satoshi Matsuoka, der das RIKEN Center for Computational Science (R-CCS) im japanischen Kobe leitet, an dem der Supercomputer Fugaku seinen Dienst verrichtet, hat ein Foto des neuen Chips Fujitsu Monaka als „mechanical Sample“ auf X geteilt. Dass der Chip aus mehreren Dies besteht, die als Chiplets zusammengefügt wurden, ist spätestens am beiliegenden Schema klar zu erkennen.

Fujitsu Monaka Arm CPU (2027) Mechanical Sample. 2nm computer chiplet die planned. pic.twitter.com/0bAGAjlf7p
— Satoshi Matsuoka (@ProfMatsuoka) December 11, 2024

Und so sitzt im Zentrum der große, in 5 nm gefertigte I/O-Die, der die Schnittstellen bereitstellen wird, zu denen etwa auch PCIe 6.0 respektive der darauf basierende Compute Express Link (CXL) in Version 3.0 zählt.

Rundherum sind vier SRAM-Dies (ebenfalls 5 nm) verteilt, die den Zwischenspeicher (Last Level Cache) beinhalten. Darauf sitzen wiederum die eigentlichen CPU-Kerne, die in einem noch feineren 2-nm-Prozess hergestellt werden sollen. Jeweils einer dieser vier Core-Dies trägt demnach 36 Kerne in sich, denn insgesamt soll Monaka 144 Kerne bieten. Das entspricht nicht ganz den im Vorfeld erwarteten 150 Kernen, ist aber ein großer Schritt von den 48 Kernen des Fujitsu A64FX.

Monaka soll vor allem effizient werden

Natürlich wird mit dem neuen Prozessor eine Steigerung der Rechenleistung anvisiert. Im Vorfeld war davon die Rede, dass die Anwendungsleistung um den Faktor 1,7 höher als bei Konkurrenzprodukten im Erscheinungsjahr ausfallen werde. Jetzt soll Monaka sogar direkt doppelt so schnell sein, wie der Wettbewerb im Jahr 2027. Wie man das jetzt schon wissen kann, steht allerdings auf einem anderen Blatt. Vielmehr als eine grobe Schätzung ist dies also nicht.

Ebenfalls doppelt so hoch wie bei der Konkurrenz soll die Energieeffizienz in Leistung pro Watt ausfallen. Fujitsu spricht von „Ultra Low Voltage“, während es beim A64FX nur „Low Voltage“ heißt. Zudem soll diesmal eine reine Luftkühlung statt einer Kombination aus Luft- und Wasserkühlung genügen. Das Thema Energieeffizienz steht bei den Japanern ganz oben auf der Liste.

Kein HBM mehr im Einsatz

Ist der A64FX noch mit schnellem HBM2-Speicher bestückt, wird es beim Nachfolger Monaka allerdings nur DDR5-RAM geben. Verteilt auf 12 Kanäle wie bei den HPC-CPUs von AMD und Intel, wird dies trotzdem nur einen etwa halb so hohen Durchsatz bedeuten, letztlich die Plattform aber günstiger machen.

Der Vorgänger A64FX

Im Juni 2020 erstürmte Japans Supercomputer Fugaku mit über 400 PetaFLOPS und seinerzeit großem Vorsprung (Platz zwei kam nicht einmal auf 150 PetaFLOPS) den Thron der Top-500-Systeme. Zwei Jahre lang blieb Fugaku an der Spitze und wurde erst im Juni 2022 durch das US-System Frontier mit über 1.000 PetaFLOPS abgelöst. In der jüngsten Weltrangliste aus dem November 2024 liegt Fugaku immerhin noch auf Rang 6, was für 4,5 Jahre seit Aufnahme in die Liste sehr beachtlich ist.

A64FX-Prozessor des Supercomputers „Fugaku“ (Bild: Fujitsu)

Die seinerzeit unübertroffene Rechenleistung erzielte Fugaku nicht mit Hilfe von GPU-basierten Rechenbeschleunigern wie es bei Frontier und den meisten der Top10 der Fall ist. Stattdessen wird eine Armada von 48-Kern-CPUs eingesetzt. In jedem der 158.976 Rechenknoten (Nodes) steckt ein 48-Kern-Prozessor des Typs A64FX. Der von Fujitsu in Kooperation mit Arm entwickelte Chip nutzte erstmals die Befehlssatzerweiterung ARMv8.2-A SVE (Scalable Vector Extension). Beinm Nachfolger wird es ARMv9 und SVE2 geben.

Die Top10 der schnellsten Supercomputer laut Top500.org

Rang (zuvor)	System	Standort	Rechenleistung (Rmax)	Prozessoren	Aufnahme Top500
1 (-)	El Capitan	USA	1.742,00 PetaFLOPS	AMD Epyc 4th Gen (24C, 1,8 GHz) AMD Instinct MI300A	November 2024
2 (1)	Frontier	USA	1.353,00 PetaFLOPS	AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X	Juni 2022
3 (2)	Aurora	USA	1.012,00 PetaFLOPS	Intel Xeon Max 9470 (52C, 2,4 GHz) Intel GPU Max 1550 (?)	November 2023
4 (3)	Eagle	USA	561,20 PetaFLOPS	Intel Xeon Platinum 8480C (48C, 2,0 GHz) Nvidia H100	November 2023
5 (-)	HPC6	Italien	477,90 PetaFLOPS	AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X	November 2024
6 (4)	Fugaku	Japan	442,01 PetaFLOPS	Fujitsu A64FX (48C, 2,2 GHz)	Juni 2020
7 (6)	Alps	Schweiz	434,90 PetaFLOPS	Nvidia Grace (72C, 3,1 GHz) Nvidia GH200	Juni 2024
8 (5)	LUMI	Finnland	379,70 PetaFLOPS	AMD Epyc 3rd Gen (64C, 2,0 GHz) AMD Instinct MI250X	Juni 2022
9 (6)	Leonardo	Italien	241,20 PetaFLOPS	Intel Xeon Platinum 8358 (32C, 2,6 GHz) Nvidia A100	November 2022
10 (-)	Tuolumne	USA	208,10 PetaFLOPS	AMD Epyc 4th Gen (24C, 1,8 GHz) AMD Instinct MI300A	November 2024
Änderungen gegenüber letzter Liste fett hervorgehoben