Instinct MI300A in El Capitan: Vier Mal 24 Zen-4-Kerne, CDNA 3 und 128 GB HBM3 pro Blade
Offiziell hatte AMD zur ISC 2023 keine Neuheiten im Gepäck, doch die Macher des kommenden Supercomputers El Capitan plauderten ein wenig über MI300A als Herzstück dieser Lösung. Dort werden neue AMD-Recheneinheiten erstmals als riesige APU vier Mal pro Node eingesetzt, ein Produkt, das bald ein Jahrzehnt lang entwickelt wurde.
4 × MI300A pro HPE-Blade
Bereits vor Jahren angekündigt geht die Fertigstellung des neuen ExaFLOP-Systems El Capitan auf die Zielgerade. Die technischen Grundlagen der HPC-APU hatte AMD bereits selbst zu Beginn dieses Jahres offengelegt: Mittels 146 Milliarden Transistoren werden in TSMCs N5-Fertigung 24 Zen-4-Kerne und CDNA3-Grafikeinheit gefertigt und auf einen Base Layer aus TSMCs N6-Fertigung gesetzt, auf dem 128 GByte HBM3 sowie der Infinity Cache zu finden sind. Der CPU-Teil belegt dabei laut Schaubild rund ein Viertel des Chips, die Grafikeinheit wie vermutet die restlichen Dreiviertel. Denn auf Exascale-Leistung kommt man nur mittels GPU.
Pro Blade werden in El Capitan vier dieser großen Instinct MI300A verbaut, was sich deutlich von den Frontier-Nodes unterscheidet, die ComputerBase vor einem Jahr auf der ISC 2022 ablichten konnte. Bei beiden ist HPE der Hersteller.
Effizienz mit „nur“ 30 MW Verbrauch im Blick
El Capitan wird nach wie vor mit über 2 ExaFLOPS Leistung spezifiziert, aber auch deshalb, weil am Lawrence Livermore National Laboratory beim Energiebedarf nicht „All In“ gegangen wird. El Capitan wird dort keine Systeme ersetzen oder ablösen, die bestehenden Supercomputer werden weiter genutzt. Die Spezifikation für El Capitan sieht deshalb maximal 40 Megawatt vor, im Alltag sollen realistisch jedoch „nur“ rund 30 Megawatt Verbrauch anliegen. Dennoch wurde am Standort die Energieversorgung verbessert, 85 MW für die Systeme werden von zusätzlichen 15 MW für die Kühlung ergänzt.
Damit würde das System rund 50 Prozent mehr Energie verbrauchen als Frontier, welches bei rund 21 Megawatt im Einsatz rangiert, aber vermutlich (mindestens) rund doppelt so viel leisten. Für Aurora waren zuletzt bis zu 60 Megawatt aber auch theoretisch deutlich über 2 ExaFLOPS im Gespräch – eine Krone könnte El Capitan also vermutlich spielend leicht holen.
Abnahme erst Ende 2024
Wenngleich El Capitan noch in diesem Jahr gebaut wird, wird die finale Abnahme erst im Jahr 2024 erfolgen. Laut aktuellem Plan wird es auch eher Ende des Jahres werden. Intels Aurora könnte so zumindest eine Weile an der Spitze der Supercomputer stehen, wenn sie zum Ende dieses Jahres ihr Ergebnis einreichen.