News AMD Instinct: MI300X mit 192 GB HBM3 und 153 Milliarden Transistoren

Nextplatform geht bei XCD davon aus dass die halben CUs eines MI250 Dies drauf sind.
Die anderen haben gezählt was sie in den Grafiken gesehen haben. Wenn die Strukturen in den Grafiken tatsächlich stimmen haben die anderen Recht.

Aber Semianalysis hatte den Speicherausbau der MI300X falsch. Also sind Dylan Patel wohl wieder ein paar Informationen zugeflogen und er hat kräftig außen herum gesponnen. Aber niemand weiß was in den Informationen war und was er dazugesponnen hat.

Nextplatform hat gute Kontakte zu AMD und hält sich an Spielregeln.

Wenn Der Claim von AMD dem entspricht was für die MI250 angegeben ist wäre das 3133 T
 
https://twitter.com/LisaSu/status/1669848494637735936
1686961089292.png



BTW:
https://twitter.com/AMD/status/1669739718806781952
1686961374875.png
 
ETI1120 schrieb:
Und das ist der Punkt. alles was AMD in die FP64-Unterstützung steckt, fehlt bei den AI-Datentypen
richtig. was ich aber nicht unbedingt als problem sehe weil man für HPC eben FP 64 und drüber hinaus braucht ^^ hier ist man konkurenzlos weil direkt drauf programmiert wird bzw schnittstellen geschaffen werden. da hat cuda auch kein argument weil die teile einfach keine power mit den großen datensätzen haben

einfachste anwendung hier steife diffenzialgleichungen. hier ist runden per definition unmöglich und um die sache numerisch zu schaffen brucht mal riesen zahlen mit vielen vielen kommastellen. und überall wo das nötig ist (gibts dann doch recht oft besonders in der wissenschaft und technischen entwicklung) sind die nvidia karten zahnlose tiger.

dass dann der kompromiss mit der AI leistung kommt ist leider eine folge davon. bin gespannt ob AMD für exakt sowas noch einen AI tile aufsetzt sodass man zwewi verschiedene GPU tiles hat die man je nach anwendung bestellen kann ^^

auch frag ich mich wie viele kerne eine reine CPU variante hätte, hat man doch über die Epycs einen wesentlich besseren unterbau für sowas der wesentlich mehr speicher adressieren kann als über den HBM3 hier.

weil speicher ist oft key.
 
  • Gefällt mir
Reaktionen: Redundanz
Blogeintrag von Mosaic ML der bei Twitter hohe Wellen schlägt.

Der AI-Software Stack von AMD ist bereit. Sie konnten ihren Softwarestack ohne Änderung auf MI250 und ROCm ausführen. Die Performance befinden sie OK.
https://www.mosaicml.com/blog/amd-mi250

Das basiert auf ROCm 5.4, am Donnerstag kam ROCm 5.6 heraus, siehe oben
 
Zuletzt bearbeitet: (Infos ergänzt)
@ETI1120 bitte bei links immer was dazuschreiben sonnst ist das spam ;)
 
Level1Techs über ROCm und AMD Hardware für AI
 
Zurück
Oben