Intel-Supercomputer: Aurora soll 2 ExaFLOPS liefern, ZettaFLOPS schon ab 2027
Fast überschwänglich hob Intel-CEO Gelsinger zum Auftakt des Intel ON den Supercomputer Aurora hervor, der nochmals schneller werden soll. Zwei statt einem ExaFLOPS soll er liefern. Intel will nach Jahren der Verzögerung also doch noch einen versöhnlichen Abschluss im Projekt finden. Parallel hält jedoch neuer Größenwahn Einzug.
Nur der Name „Aurora“ ist geblieben
Über das Problemkind Aurora hat ComputerBase zuletzt wiederholt berichtet. Schon 2015 angekündigt sollte Intel CPUs und Knights-Hill-Beschleuniger in 10 nm für einen Start des Supercomputers im Jahr 2018 liefern. Es folgte der große Abgesang: Knights Hill und die ganze Familie wurde eingestellt, Aurora kam nicht.
Doch Intel wollte den prestigeträchtigen Vertrag halten, 2019 wurde ein komplett überarbeitetes Aurora-System mit Xe-GPUs für 2021/2022 in Aussicht gestellt. Doch das kämpfte mit Verzögerungen, sogar Vertragsstrafen werden mittlerweile fällig: Im Quartalsbericht Q2/2021 erklärte Intel gegenüber Analysten, zum Ende des Jahres 300 Millionen US-Dollar hierfür zurücklegen zu müssen.
Doch jetzt spricht Intel plötzlich von „Über-Erfüllung“ des Vertrags – „yet again“, behauptet Gelsinger zudem. Doch wie kommt es dazu?
Ponte Vecchio leistet mehr als gedacht
Intel hatte den Supercomputer bei der Neuankündigung mit Xe-GPUs im Jahr 2019 so ausgelegt, dass in jedem Fall die Marke von einem ExaFLOP erreicht wird, und deshalb viele zusätzliche Nodes und Platz für mehr CPUs und GPUs vorgesehen. Denn vor drei Jahren wusste der Hersteller noch nicht, wie gut oder schlecht Ponte Vecchio am Ende wirklich wird – und die GPUs stemmen in Auroa den Großteil der Leistung.
Allem Anschein nach läuft der HPC-Beschleuniger-Chip nun aber besser als erwartet, Intel spricht von „well ahead of those performance objectives“, sodass der Reserveplatz nicht genutzt wird um die 1-ExaFLOPS-Marke zu erreichen, sondern ein System mit über 2 ExaFLOPS Peak-Performance zu realisieren.
Die Installation des Supercomputers hat zudem endlich begonnen. Der Rohbau der Halle sei nahezu fertiggestellt, nun soll das System folgen – in jedem Fall noch dieses Jahr, wie Intel mit ersten Bildern beweisen will. Im Jahr 2022 soll das System einsatzbereit sein. Am Ende könnte Aurora damit für kurze Zeit doch der schnellste Supercomputer sein.
Der erste ExaScale-Supercomputer kommt aus China
Der erste ExaScale-Supercomputer wird Aurora höchstwahrscheinlich nichtmal in den USA, das wird AMDs Frontier. Im weltweiten Wettbewerb dürften andere Rechner das Ziel sogar bereits erreicht haben. Wie The Next Platform ausführt, hat China allem Anschein nach bereits zwei ExaScale-Systeme seit dem Frühjahr in Betrieb, dieses nur nicht an die große Glocke gehängt.
ZettaScale schon 2027!?
Kürzlich hatte Intels neuer Chef der Supercomputer-Abteilung behauptet, Intel wolle bei Supercomputern nicht mehr so im Rampenlicht stehen. Zum Intel ON kommt nur Tage später quasi die Kehrtwende: Nach der ersten Andeutung vor nicht einmal zwei Wochen, dass Intel ZettaScale in diesem Jahrzehnt anstrebe, wurde nun schon fest das Jahr 2027 draus – und Intel will natürlich erster sein (und im Rampenlicht stehen).
Aktuell und vor allem nach den Problemen zuletzt klingt das alles andere als realistisch und nahezu nach Größenwahn, wie selbst Raja Koduri auf Twitter eingesteht. Um das Ziel zu erreichen, wären weitere massive Neuerungen notwendig, wenn das System nicht einfach nur hundertfach weiter skaliert werden soll und damit Gigawatt an Strom verbrauchen soll, wie auch The Next Platform ausführt.
Es darf mit Spannung erwartet werden, was Intel im Jahr 2027 letztlich wirklich an Leistung zu welchem Preis und bei welchem Verbrauch hervorbringt.
Intels Raja Koduri hat sich zu dem Thema noch einmal via mehreren Twitter-Postings zu Wort gemeldet. Da Intel zuletzt nicht geliefert hat, versteht er die Skepsis und auch Lacher bei den neuen Zielsetzungen – auch wenn ihn letzteres natürlich ärgert, wie man im Verlauf der Tweets lesen kann. In mehreren Postings führt er dann etwas genauer aus, wie das Ziel erreicht werden könnte. Der Übersichtlichkeit halber sind sie hier zusammen kopiert worden.
Thanks for the feedback. Given our past decade of not so stellar execution on HPC, we did expect to be laughed at..fair enough..
Starting SC’21 we will begin rolling out more details on our near and medium term plans.
I have been framing the need for 1000x more compute for rapidly evolving AI models by 2025 for the past couple of years. My talks at hot-chips 2020 and Samsung forum highlighted the need for the whole eco-system coming together to accelerate towards this goal.
1000x in which workload is an important detail..but not the top order bit IMO, as you can always narrow down to a “benchmark” to make the goal either “easy” or “hard”.
As highlighted in the “no transistor left behind talk”..there’s 65,000x opportunity today with sw-hw co-optimization today without any new physics or crazy hw and this path will be exploited by many as we already see evidence with M1 etc
The 1000x framing we are looking at doesn’t count these single node level hw-sw co-optimizations. Those will be on top of the basic hardware+system arch targets we set. As you can imagine there are a lot of internal debates on choices of the workloads and scale
So, why declare this now? The new intel that pat aspires to be an “all-in” culture..we declared our commitment for open - Pat opening this up definitely makes our (engineers) jobs easier to collaborate with other key external players who are also inspired by the these targets.
And the price of an open approach to any forward looking roadmap is - being laughed at..
If the world gets to 1000x computational energy efficiency on key workloads one way or another by 2027, it’s a small price to pay!
And even more important than the goals - just one or two fundamentally new things created during this journey will help other moon and beyond shots.
Raja Koduri
- Für Notebooks & AIOs: Intel Meteor Lake kommt nicht für „klassische Desktop-PCs“
- Moore's Law lebt: Das „Grundgesetz“ wird mit neuen Technologien am Leben gehalten
- 576 E-Cores im Server: „Pro Kern will die Lizenz eher niemand bezahlen“
- +27 weitere News