News El Capitan Supercomputer: AMDs Flaggschiff versenkt Intel Aurora mit 44.544 MI300A-APUs

LeeSakura schrieb:
Was passiert eigentlich wenn ein Bauteil kaputt geht? Steht das gesamte System dann erst mal still oder läuft das nebenher weiter? Bei derart vielen einzelnen Bauteilen könnte das ja durchaus öfters vorkommen.
In der Regel ist der Job der X Stunden/Tage/Wochen lief kaputt. Der Betroffene Knoten wird aus dem System genommen repariert und wieder hinzugefügt.

Bei so riesen Maschinen wie von DoE ist das leider recht häufig der Fall. Da geht alle paar Stunden/Tage irgendwo auf dem System etwas kaputt. Daher schreiben die in der Regel Restart files. Das verbraucht aber halt auch Zeit in der man nicht sinnvolles tut. Man muss da also gut abwägen wie häufig man einen restart schreibt.
Magellan schrieb:
Da darf man wohl davon ausgehen dass die privaten Cluster der Big Tech die Top10 nochmal ziemlich pulverisieren würden.
Kann so sein muss es aber nicht. Kommt drauf an wie gut saß System aufgesetzt ist und wie gut sie Hardware geschüttelt wurde.

Bei AI/ML ist es eher so das man wie bei Hadoop unabhängige Aufgaben hat wo man eine Teilaufgabe einfach nochmals rechnen kann.
 
  • Gefällt mir
Reaktionen: LeeSakura
Haldi schrieb:
Thats Not how this works!
Die Hauptleistung stammt ja vom GPU teil und nicht von der CPU.
Die 7900xtx hat 1.918 TFLOPS weil sie auf 1:32 limitiert ist und nicht wie Professionellen Karten 1:2 hat, das wären sonst 30.695 TFLOPS.
um die 1.742 Exaflops zu erreichen benötigt man davon also Hardware mässig nur rund 56'700 Einheiten!

Wären das RTX 4090er die nicht auf 1:64 limitiert sind und nur mit 1.29 tflops laufen, hätten die 41.29 TFLOPS und man würde somit nur 42'200 Stück benötigen.

Ähnlich zu den 44'544 verbauten APU's.

P.S sicher das du dich nicht verrechnet hast?
Wenn ich mit 0.6Tflops für fp64 rechne komme ich auf 3Mio Stück der 9950X.
Auch aus den von Dir genannten Gründen ist der Fokus auf FLOPS ohne weitere Spezifizierung
eher irreführend. Selbst wenn man sich auf fp64 als Vergleichsgröße beschränkt, gibt's genug Anwendungen (und Anwender!) die damit nur begrenzt erfasst sind. Es gab schon gute Gründe, warum zB Fugaku (Mount Fuji), der lange nach Rechenleistung als zweitgrößter Supercomputer galt, stark auf sehr viele speziell dafür von Fujitsu und ARM entwickelte CPUs basiert bzw basierte.
Im historischen Kontext (Rechenleistung eines originalen Cray) gesehen haben viele von uns ja einen Supercomputer auf oder unter unserem Schreibtisch stehen. Was wir damit machen ist dann eine andere Sache 😁.
 
DJMadMax schrieb:
Und alles nur zur Kriegstreiberei, ich könnte nicht einmal annähernd so viel fressen, wie ich gerade gerne kotzen würde.
keiner weiß wofür exakt die "kisten" eingesetzt werden und wenn man so ein klein bischen zurück in der geschichte schaut, ist diese "kriegstreiberei" der hauptgrund das wir mitteleuropäer laaange zeit die sog. "friedensdividende" einstreichen konnten ohne groß etwas für die eigene verteidigung leisten zu müssen!
einfach mal ein-zwei empörungslevel runterschalten und vielleicht auch ein-zwei stufen vom hohen moralischen sockel runtersteigen und schon kann man sein essen bei sich behalten...

technisch ist vor allem die hochskalierung beeindruckend und gleichzeitig interessant. wenn neue hpc module vorgestellt werden wie z.b. so ein mi-instinct oder hopper, sieht man zunächst zahlen für eine solche einheit und schon die sehen im vergleich zu dem was man so daheim hat beeindruckend aus - wenn man sich dann vorstellt dass zehntausende davon gekoppelt werden, entzieht sich das sehr schnell der skalierungsvorstellung die man im kopf hat...
 
  • Gefällt mir
Reaktionen: gustlegga, Skysnake und Avatoma
cypeak schrieb:
keiner weiß wofür exakt die "kisten" eingesetzt werden
Lies den Artikel nochmal... der Einsatz von El Capitan war von Anfang an auf die Simulation von Atom- und sonstigen Kriegswaffen ausgelegt.
 
  • Gefällt mir
Reaktionen: gartenriese
@DJMadMax ich habe das gelesen...das ist das was in der pressemitteilung steht; unterm strich weiß keiner von uns was genau da simuliert wird. selbst wenn es exakt das verhalten von nuklearsprengköpfen ist, so what?
ist ja jetzt nicht eine neue nachricht dass wir in einer welt leben in der nationen nuklear bewaffnet sind.

solange die menscheit keinen geeigneten anderen weg findet offene konflikte auszutragen, wird es kriege und kämpfe geben und so lange wird das militär weltweit "kriegswaffen" entwickeln, herstellen und meistens auch einsetzen..
 
Zurück
Oben