Arms Refresh im Datacenter bringt mehr Performance. Weil bisherige Problemstellen beseitigt wurden, legt Neoverse V3 bei der Leistung um 20 Prozent zu – bei AI mitunter noch mehr. Echte Neuheiten halten sich wiederum überraschend in Grenzen. Auch traut sich Arm nicht höher hinaus, das wird Partnern überlassen.
Die an den Haaren herbeigezogenenen Benchmarks und komischen Vergleichen mit teilweise anderen Produktklassen (vergleichbar mit Last Gen E core vs. Next Gen P core) sind schon komisch.
Da stimmt der Zuwachs an Leistung am ende natürlich
Die Basis für Neoverse V3 ist die Armv9.2-A-Architektur. Pro Chip werden bis zu 64 Kerne geboten, die fortan jeweils bis zu 3 MByte L3L2-Cache auffahren.
Gut so! CPU Leistung ist auf jeden Fall auf einem Stand wo Software erstmal nach kommen muss. GPU Leistung kann aber auf jeden Fall gesteigert werden. Das ist auch bei den M-Chips meiner Meinung nach aktuell das größte Manko.
Arm priorisiert die GPU
[...]
Arm sucht im Marketing derweil die Nähe zu GPUs, AI-Beschleuniger sind aktuell natürlich in aller Munde. Das Schaubild für den neuen Arm Neoverse V3 mit angeflanschter GPU ähnelt deshalb einem denkbaren Nachfolger respektive Mitbewerber von Nvidia Grace Hopper GH200. Bei diesem SoC wurde ein solches Design nämlich das erste Mal umgesetzt, aktuell feiert es große Erfolge in hocheffizienten Supercomputern – unter anderem im deutschen Jupiter.
Bei dem Was ARM selbst auf ihrem "Newsroom" veröffentlichen schreiben sie doch gar nichts über die GPU. Da wird nur generisch ein Ip-Block gezeigt, auf dem "irgendwas mit AI" steht und fröhlich HBM Speicher drumherum angeordnet.
Derzeit bietet ARM nur nichts, was derart groß skaliert wird, um so eine Speicherkonfiguration zu rechtfertigen. Die Mali GPUs sind zu klein, die ARM Cores mit DSP Erweiterung sind auch eher winzig, und die ARM Ethos NPU sind ebenso bisher darauf ausglegt um in Kleinstgeräten zu stecken. Da werden je IP-Block 1..10TOP/s als Leistung angegeben. Wenn ich die Produktübersicht richtig verstehe aber nur für Int8, Int16 (https://armkeil.blob.core.windows.net/developer/Files/pdf/ethos/arm-ethos-n-product-brief.pdf). Bei perfekter Skalierung braucht es also ~400Ethos IP Blöcke in Maximalkonfiguration, um mit Nvidias H200 mitzuhalten und dann gibt es immer noch das Problem, dass es an FP8, FP16 Durchsatz fehlt.
Imho: ARM wollte irgendwas mit AI in ihren Schaubildern haben, hat aber derzeit keine eigene IP angemessener Größe für AI. Daher gibt es da nur einen grauen Block.
Ergänzung ()
Interessant ist auch, das ARM zwar Neoverse der 3. Generation vorstellt, aber bei der Vortstellung der 2. Generation gab es auch noch die "E"-Linie und es wurde "Neoverse Next" geteasert für N, V und E mit PCIe6. Nur scheint es E3 (bisher?) nicht zu geben?!
Ganz abgesehen, dass mir bei E1 und E2 keine Implementierungen bekannt sind, und mir größere Cluster aus In-Order Kernen irgendwie auch nicht sinnvoll erscheinen.