News El Capitan Supercomputer: AMDs Flaggschiff versenkt Intel Aurora mit 44.544 MI300A-APUs

  • Gefällt mir
Reaktionen: SweetOhm, Wilfriede und Mario2002
In den seltensten Fällen wird so ein Rechenmonster für sinnvolle Sachen genutzt.
 
  • Gefällt mir
Reaktionen: SweetOhm
Einfach krass was möglich ist auch wenn es schade ist fad man den Conpuzer nicht "öffentlich" macht.
 
👍Gefällt mir
 
  • Gefällt mir
Reaktionen: SweetOhm
@Volker & @Jan

Eine APU bietet bekanntlich 128 GByte HBM3e, pro Dual-Node-Blade sind es 1.024 GByte – auch das geht bei 43.808 aktiven APUs auf.

AMD Instinct MI300A und MI300X unterstützen "nur" 128 GB HBM3 und nicht HBM3e.

1731961030559.jpeg

1731961082270.png


Liebe Grüße
Sven
 
  • Gefällt mir
Reaktionen: nyster
Skudrinka schrieb:
Schon klar deine Argumentation, vollkommen richtig. Aber lass uns hier doch einfach in einem Technik Forum sein :)
Und genau das halte ich persönlich eben für falsch. Gerade hier, in solchen Foren sollte doch auch über die Schattenseiten solcher Technologie geredet werden. Denn dies trägt ja auch zu einer öffentlichen Meinungsbildung bei. Ich finde es selber faszinierend was da mittlerweile möglich ist, dies aber zum Guten wie zum Schlechten. Das Problem ist in vielen Foren heutzutage nur leider der veranschlagte Ton der Unterhaltung und mangelnder Respekt vor anderen!

Mfg Inelouki
 
  • Gefällt mir
Reaktionen: joshlukas, n8mahr, Parabol(a) und 6 andere
Skudrinka schrieb:
Wenn sie jetzt noch GPUs könnten..
Können sie. Sind ja schließlich 10 Millionen CDNA3-Kerne in dem Teil. Nur Gamer stehen halt nicht mehr im Mittelpunkt von AMD. Wozu auch? Selbst zu Zeiten, als AMD gleichauf oder besser als die Grünen war, wurde unbeirrt weiter Grün gekauft. Dann doch besser die Ressourcen in den Bereich stecken, wo richtig Geld verdient wird.
 
  • Gefällt mir
Reaktionen: SweetOhm, daknoll, zett0 und 18 andere
Wieviele High End Desktop PCs (meinetwegen alle mit einem AMD Ryzen 9 9950x) wären nötig um an die Rechenleistung des EL Capitan Supercomputers zu kommen?
 
  • Gefällt mir
Reaktionen: AlphaKaninchen und SolidSnake
Ich habe da noch ein Monster Query und würde das Ergebnis gern in 2ms haben, statt in 2,5h.
Wo kann ich mich melden?

Im Ernst:
Auch wenn jedes "quasi SQL Statement" unwürdig dieses Leistungspotential ist, würde ich doch gern wissen um wieviel schneller meine Abfragen auf derartigen Systemen wären.
Okay ... kolportierte Leistung ... denn ich habe noch niemanden T-SQL Queries auf INSTINCT laufen lassen sehen ^^

... und bevor jemand schreit: ja, Äpfel und Birnen ... hab's kapiert ...
 
Technisch beeindruckend. Und schön zu sehen wie skalierbar AMDs Technik von Stromspar-Notebooks bis Supercomputern ist.
Aber ich finde es hier schon berechtigt die Nutzung zu hinterfragen. Ist ja nicht so, dass solche Resourcen einfach übrig sind. 29,5 MW Leistung ist das die Größenordnung einer ganzen Kleinstadt, die man damit alternativ versorgen könnte.
 
  • Gefällt mir
Reaktionen: Inelouki
@WinstonSmith101 Das kann man wahrscheinlich nicht ermitteln. Dazu sind die Ansätze viel zu unterschiedlich.

In der Diskussion zu den Green 500 wurde erwähnt, dass die Rechenleistung bei Consumerkarten in FP32, bei den Supercomputern in FP64 angegeben wird. Über die Anzahl der Nodes sinkt die Rechenleistung der einzelnen Rechenkomponenten, als wenn sie für sich alleine sein würden. Die Diskussion beginnt hier.
DJMadMax schrieb:
Mir ist durchaus bewusst, dass beim Skalieren über mehrere Nodes hinweg die Effizienz abnimmt, ABER:

Ein möglicher Ansatz wäre, über die Anzahl der GPU Cores zu gehen.
Man müsste erstmal wissen, welche FP64 Leistung RDNA 3 im Vergleich zu CDNA 3 in der Instinct MI300A APU hat. Hierzu konnte ich auf die schnelle keine Zahlen finden. Dann könnte man errechnen, wie viele RDNA 3 Cores es braucht, um an die Rechenleistung von rund 10 Millionen CDNA 3 Cores zu kommen.
Dann könnte man die errechnete Anzahl von RDNA 3 Core durch 96 teilen, und hätte die Anzahl von Systemen, die eine 7900XTX in sich tragen und diese mit HighEnd Desktops gleichsetzen. Und das wäre immer noch eine unseriöse Angabe über einen extrem dicken Daumen.
 
  • Gefällt mir
Reaktionen: WinstonSmith101
WinstonSmith101 schrieb:
Wieviele High End Desktop PCs (meinetwegen alle mit einem AMD Ryzen 9 9950x) wären nötig um an die Rechenleistung des EL Capitan Supercomputers zu kommen?
Du schaust auf das falsche die meiste Leistung kommt von den GPUs, nicht den CPUs. Die iGPUs darin würde 0,5 TFLOPS schaffen, das teil hier hat 1,7 EFLOPS also knapp über das 3 Millionenfache, braucht dafür aber das 5 Millionenfache an CUs (2 CUs vs 10.000.000 CUs) (Aber der Wert bei der iGPU ist FP32, der Supercomputer Wert dürfte sich auf FP64 beziehen)
 
Zuletzt bearbeitet:
SVΞN schrieb:
AMD Instinct MI300A und MI300X unterstützen "nur" 128 GB HBM3 und nicht HBM3e.
Sind dad nicht auch 4 Knoten pro Blade?

Also 2 Dualnode Boards bilden ein Blade.

AMD supported nur Dual Socket und kein Quad Socket. Es sind daher auch nicht wirklich 1024GB sondern 4x 256GB HBM3 Knoten. Die 1024GB sieht kein einzelner Knoten. Wenn man mehr als 256GB nutzen will muss man über Netz auf den anderen Speicher zugreifen. Per RDMA zwar aber trotzdem remote. Ohne Software Support geht da nichts.
=dantE= schrieb:
Auch wenn jedes "quasi SQL Statement" unwürdig dieses Leistungspotential ist, würde ich doch gern wissen um wieviel schneller meine Abfragen auf derartigen Systemen wären.
Gar nicht. Die Parallelität kannst du nicht nutzen. Das Zeug ist nicht skalierbar.
 
Schreibt doch nicht so einen Mist. Auf der Liste isses der Schnellste, ja. Tatsächlich aber ein Winzling. Für KI-Training werden in der Privatindustrie ganz andere Dinger installiert.
 
Ist schon fett was so ein 1U Blade zu leisten vermag...

29.58MW für die 44.544 APUs wären da 666 Watt pro APU. Türlich ist da auch die Energie mit eingerechnet die zur Kühlung benötigt wird. Aber trotzdem so ein 8 APU Blade dürfte schon an die 4kW ziehen.
Bei den 110V der Amis wären das 36A Absicherungen pro Blade....
 
Skysnake schrieb:
AMD supported nur Dual Socket und kein Quad Socket.
Da liegst du tatsächlich falsch. Deine Aussage stimmt für den Sockel SP5 / Epyc. Wir reden hier aber über Sockel SH5 / Instinct. Das ist in der Tat ein Quad-Socket-System, 4x MI300A bilden einen Node.
 
Zurück
Oben