SuperMUC-NG: Deutscher Top-10-Super-Computer mit 309.504 Kernen
Intel und Lenovo haben den Zuschlag zur Installation eines Supercomputers am Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften in München erhalten. Mit einer Spitzenleistung von 26,7 PetaFLOPS würde er sich auf dem 6. Platz der aktuellen Supercomputer-Top-500 einreihen. Das System wird mit Wasser gekühlt.
6.448 Server mit Wasserkühlung
Der SuperMUC-NG folgt dem SuperMUC, der in seiner zweiten Ausbaustufe aktuell 6,8 PetaFLOPS bereitstellt. Zusammengestellt wird der Next-Gen-Großrechner aus 6.448 Servern vom Typ ThinkSystem SD 650 DWC. Dabei handelt es sich um so genannte High-Density-Server, die mehr Hardware auf engerem Raum unterbringen als klassische Server im U-Formfaktor für standardisierte Server-Racks.
DWC steht für Direct Water Cooling, denn die pro System maximal vier CPUs werden mit Wasser gekühlt. Das soll sowohl die Wärmeabfuhr auf kleinem Raum maximieren, als auch den Energiebedarf der ganzen Anlage signifikant senken, weil keine Klimatisierung benötigt wird. Lenovo spricht von bis zu 45 Prozent gesenkten Stromkosten. Die Wärmeenergie aus dem Kühlwasser wird über eine Absorptionskältemaschine abgeführt.
Zwei Sockel pro Knoten sind noch frei
Jedes ThinkSystem SD 650 DWC kann maximal mit vier Intel Xeon Platinum 8180 mit je 28 Kernen bei 205 Watt TDP ausgestattet werden, den schnellsten Prozessoren auf Basis von Skylake-SP. Der Listenpreis pro CPU liegt bei 10.009 US-Dollar. Vorerst sind aber nur zwei CPUs mit 24 Kernen pro System verbaut und es gibt mehrere Modelle, die dafür in Frage kommen: Xeon Platinum 8160, Xeon Platinum 8160F, Xeon Platinum 8160M und Xeon Platinum 8160T. In Summe ergeben sich 309.504 CPU-Kerne.
715 TByte Arbeits- und 70 PByte Massenspeicher
6.304 Server kommen mit jeweils 96 GByte Speicher daher, 144 weitere Knoten verfügen sogar über 768 GByte. Insgesamt ergeben sich 715 TByte RAM. Auch hier scheint der Maximalausbau aber noch nicht erreicht, denn Skylake-SP bietet pro Sockel 768 GByte, die M-Versionen sogar 1,5 TByte. Der Massenspeicher fasst 50 PByte mit einer aggregierten Bandbreite von 500 GByte/s. Weitere 20 PByte Speicher sind auf Langlebigkeit und nicht auf Geschwindigkeit ausgelegt.
Die Kommunikation zwischen den Knoten erfolgt über Intels OmniPath-Technologie. Als Betriebssystem kommt SuSE Linux Enterprise (HPC Module) Version 12 zum Einsatz.
Cloud-Anbindung mit Nvidia Volta
Der Rechner wird über die Cloud verfügbar sein, 64 weitere Knoten sind nur für diesen Zweck eingeplant. 32 davon setzen auf Nvidia Tesla V100 mit Volta-Architektur.
SuperMUC-NG wird im Rahmen eines Strategie- und Finanzierungsplanes für das Gauss Centre for Supercomputing (GCS) gemeinsam von Bund und Freistaat Bayern je zur Hälfte finanziert. Die Gesamtkosten des Projektes betragen bei einer Laufzeit von sechs Jahren 96 Millionen Euro. Darin sind die Kosten für Energie, Wartung und Personal eingeschlossen. Das Projekt war Ende 2016 ausgeschrieben worden.