Ich auchWilfriede schrieb:ich habe eine,
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
News El Capitan Supercomputer: AMDs Flaggschiff versenkt Intel Aurora mit 44.544 MI300A-APUs
Davy Jones
Cadet 4th Year
- Registriert
- Juli 2007
- Beiträge
- 64
Wie lange braucht der für 1000 Bitcoins - 30 min oder ?
fef_ on_berg
Cadet 4th Year
- Registriert
- Aug. 2024
- Beiträge
- 85
Einfach krass was möglich ist auch wenn es schade ist fad man den Conpuzer nicht "öffentlich" macht.
Und genau das halte ich persönlich eben für falsch. Gerade hier, in solchen Foren sollte doch auch über die Schattenseiten solcher Technologie geredet werden. Denn dies trägt ja auch zu einer öffentlichen Meinungsbildung bei. Ich finde es selber faszinierend was da mittlerweile möglich ist, dies aber zum Guten wie zum Schlechten. Das Problem ist in vielen Foren heutzutage nur leider der veranschlagte Ton der Unterhaltung und mangelnder Respekt vor anderen!Skudrinka schrieb:Schon klar deine Argumentation, vollkommen richtig. Aber lass uns hier doch einfach in einem Technik Forum sein
Mfg Inelouki
Können sie. Sind ja schließlich 10 Millionen CDNA3-Kerne in dem Teil. Nur Gamer stehen halt nicht mehr im Mittelpunkt von AMD. Wozu auch? Selbst zu Zeiten, als AMD gleichauf oder besser als die Grünen war, wurde unbeirrt weiter Grün gekauft. Dann doch besser die Ressourcen in den Bereich stecken, wo richtig Geld verdient wird.Skudrinka schrieb:Wenn sie jetzt noch GPUs könnten..
WinstonSmith101
Lieutenant
- Registriert
- Dez. 2019
- Beiträge
- 728
Wieviele High End Desktop PCs (meinetwegen alle mit einem AMD Ryzen 9 9950x) wären nötig um an die Rechenleistung des EL Capitan Supercomputers zu kommen?
=dantE=
Lt. Commander
- Registriert
- Feb. 2021
- Beiträge
- 1.432
Ich habe da noch ein Monster Query und würde das Ergebnis gern in 2ms haben, statt in 2,5h.
Wo kann ich mich melden?
Im Ernst:
Auch wenn jedes "quasi SQL Statement" unwürdig dieses Leistungspotential ist, würde ich doch gern wissen um wieviel schneller meine Abfragen auf derartigen Systemen wären.
Okay ... kolportierte Leistung ... denn ich habe noch niemanden T-SQL Queries auf INSTINCT laufen lassen sehen ^^
... und bevor jemand schreit: ja, Äpfel und Birnen ... hab's kapiert ...
Wo kann ich mich melden?
Im Ernst:
Auch wenn jedes "quasi SQL Statement" unwürdig dieses Leistungspotential ist, würde ich doch gern wissen um wieviel schneller meine Abfragen auf derartigen Systemen wären.
Okay ... kolportierte Leistung ... denn ich habe noch niemanden T-SQL Queries auf INSTINCT laufen lassen sehen ^^
... und bevor jemand schreit: ja, Äpfel und Birnen ... hab's kapiert ...
- Registriert
- Okt. 2020
- Beiträge
- 420
Technisch beeindruckend. Und schön zu sehen wie skalierbar AMDs Technik von Stromspar-Notebooks bis Supercomputern ist.
Aber ich finde es hier schon berechtigt die Nutzung zu hinterfragen. Ist ja nicht so, dass solche Resourcen einfach übrig sind. 29,5 MW Leistung ist das die Größenordnung einer ganzen Kleinstadt, die man damit alternativ versorgen könnte.
Aber ich finde es hier schon berechtigt die Nutzung zu hinterfragen. Ist ja nicht so, dass solche Resourcen einfach übrig sind. 29,5 MW Leistung ist das die Größenordnung einer ganzen Kleinstadt, die man damit alternativ versorgen könnte.
@WinstonSmith101 Das kann man wahrscheinlich nicht ermitteln. Dazu sind die Ansätze viel zu unterschiedlich.
In der Diskussion zu den Green 500 wurde erwähnt, dass die Rechenleistung bei Consumerkarten in FP32, bei den Supercomputern in FP64 angegeben wird. Über die Anzahl der Nodes sinkt die Rechenleistung der einzelnen Rechenkomponenten, als wenn sie für sich alleine sein würden. Die Diskussion beginnt hier.
Ein möglicher Ansatz wäre, über die Anzahl der GPU Cores zu gehen.
Man müsste erstmal wissen, welche FP64 Leistung RDNA 3 im Vergleich zu CDNA 3 in der Instinct MI300A APU hat. Hierzu konnte ich auf die schnelle keine Zahlen finden. Dann könnte man errechnen, wie viele RDNA 3 Cores es braucht, um an die Rechenleistung von rund 10 Millionen CDNA 3 Cores zu kommen.
Dann könnte man die errechnete Anzahl von RDNA 3 Core durch 96 teilen, und hätte die Anzahl von Systemen, die eine 7900XTX in sich tragen und diese mit HighEnd Desktops gleichsetzen. Und das wäre immer noch eine unseriöse Angabe über einen extrem dicken Daumen.
In der Diskussion zu den Green 500 wurde erwähnt, dass die Rechenleistung bei Consumerkarten in FP32, bei den Supercomputern in FP64 angegeben wird. Über die Anzahl der Nodes sinkt die Rechenleistung der einzelnen Rechenkomponenten, als wenn sie für sich alleine sein würden. Die Diskussion beginnt hier.
DJMadMax schrieb:Mir ist durchaus bewusst, dass beim Skalieren über mehrere Nodes hinweg die Effizienz abnimmt, ABER:
Ein möglicher Ansatz wäre, über die Anzahl der GPU Cores zu gehen.
Man müsste erstmal wissen, welche FP64 Leistung RDNA 3 im Vergleich zu CDNA 3 in der Instinct MI300A APU hat. Hierzu konnte ich auf die schnelle keine Zahlen finden. Dann könnte man errechnen, wie viele RDNA 3 Cores es braucht, um an die Rechenleistung von rund 10 Millionen CDNA 3 Cores zu kommen.
Dann könnte man die errechnete Anzahl von RDNA 3 Core durch 96 teilen, und hätte die Anzahl von Systemen, die eine 7900XTX in sich tragen und diese mit HighEnd Desktops gleichsetzen. Und das wäre immer noch eine unseriöse Angabe über einen extrem dicken Daumen.
AlphaKaninchen
Commander Pro
- Registriert
- Mai 2018
- Beiträge
- 2.980
Du schaust auf das falsche die meiste Leistung kommt von den GPUs, nicht den CPUs. Die iGPUs darin würde 0,5 TFLOPS schaffen, das teil hier hat 1,7 EFLOPS also knapp über das 3 Millionenfache, braucht dafür aber das 5 Millionenfache an CUs (2 CUs vs 10.000.000 CUs) (Aber der Wert bei der iGPU ist FP32, der Supercomputer Wert dürfte sich auf FP64 beziehen)WinstonSmith101 schrieb:Wieviele High End Desktop PCs (meinetwegen alle mit einem AMD Ryzen 9 9950x) wären nötig um an die Rechenleistung des EL Capitan Supercomputers zu kommen?
Zuletzt bearbeitet:
Sind dad nicht auch 4 Knoten pro Blade?SVΞN schrieb:AMD Instinct MI300A und MI300X unterstützen "nur" 128 GB HBM3 und nicht HBM3e.
Also 2 Dualnode Boards bilden ein Blade.
AMD supported nur Dual Socket und kein Quad Socket. Es sind daher auch nicht wirklich 1024GB sondern 4x 256GB HBM3 Knoten. Die 1024GB sieht kein einzelner Knoten. Wenn man mehr als 256GB nutzen will muss man über Netz auf den anderen Speicher zugreifen. Per RDMA zwar aber trotzdem remote. Ohne Software Support geht da nichts.
Gar nicht. Die Parallelität kannst du nicht nutzen. Das Zeug ist nicht skalierbar.=dantE= schrieb:Auch wenn jedes "quasi SQL Statement" unwürdig dieses Leistungspotential ist, würde ich doch gern wissen um wieviel schneller meine Abfragen auf derartigen Systemen wären.
monty.cantsin
Newbie
- Registriert
- Okt. 2024
- Beiträge
- 4
Schreibt doch nicht so einen Mist. Auf der Liste isses der Schnellste, ja. Tatsächlich aber ein Winzling. Für KI-Training werden in der Privatindustrie ganz andere Dinger installiert.
Haldi
Admiral
- Registriert
- Feb. 2009
- Beiträge
- 9.896
Ist schon fett was so ein 1U Blade zu leisten vermag...
29.58MW für die 44.544 APUs wären da 666 Watt pro APU. Türlich ist da auch die Energie mit eingerechnet die zur Kühlung benötigt wird. Aber trotzdem so ein 8 APU Blade dürfte schon an die 4kW ziehen.
Bei den 110V der Amis wären das 36A Absicherungen pro Blade....
29.58MW für die 44.544 APUs wären da 666 Watt pro APU. Türlich ist da auch die Energie mit eingerechnet die zur Kühlung benötigt wird. Aber trotzdem so ein 8 APU Blade dürfte schon an die 4kW ziehen.
Bei den 110V der Amis wären das 36A Absicherungen pro Blade....
Da liegst du tatsächlich falsch. Deine Aussage stimmt für den Sockel SP5 / Epyc. Wir reden hier aber über Sockel SH5 / Instinct. Das ist in der Tat ein Quad-Socket-System, 4x MI300A bilden einen Node.Skysnake schrieb:AMD supported nur Dual Socket und kein Quad Socket.