Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsAmpereOne: 192 5-nm-Custom-Arm-Kerne für Cloud-Anwendungen
Ampere Computing hat in seinem jährlichen Zyklus eine neue CPU-Familie mit bis zu 192 Arm-Kernen, DDR5, PCIe 5.0 und mehr angekündigt. Ziel dieser Custom-Lösungen sind vor allem Cloud-Betreiber, die bereits verstärkt auf Arm-Prozessoren setzen, die den ganzen „Ballast“ der x86-Prozessoren nicht mitbringen.
Das erschließt sich mir nicht so ganz. Hat man SMT nicht ursprünglich mal deswegen eingeführt, damit man die Kerne effizienter nutzen kann weil bei vielen Berechnungen bestimmte Bereiche nicht genutzt werden?
Ansonsten ist das denke ich im Endeffekt der richtige Weg.
Für mich als Laie, welchen Ballast schleppen x86 denn eigentlich noch so mit sich rum und warum kann man den nicht weglassen?
x86-CPU sind abwärtskompatibel, d.h. bspw. dass von AVX-512 Richtung Abwärts bis MMX hunderte von Befehlen unterstützt werden. x86-CPUs kennen bislang über 4000 Befehle, aber kein Programm nutzt die alle gleichzeitig. Ein Programm das bspw. AVX2-Befehle nutzt, wird nicht gleichzeitig MMX-Befehle nutzen. Die x86-Kerne haben dadurch sehr viel mehr Transistoren als ARM-CPUs die oft nicht abwärtskompatibel sind. Wenn Caches immer größere Flächen der CPU einnehmen, relativiert sich das aber mit der Zeit.
Zitat aus dem Artikel: "Nicht nur wurde die Konkurrenz von AMD verkrüppelt betrieben, auch wurden krumme Vergleiche zwischen FP16 und FP32 angestellt."
Wenn sich das für Ampere Computing mal nicht rächt...
Es ist vor allem so dumm .. als wenn das keiner sieht oder merkt!? Immer wieder die gleiche Scheisse .. man kanns ja alle paar Monate mal wieder probieren, evtl merkt es dann ja keiner 🤪
Das mit dem „Ballast von x86“ ließt sich in der Tat etwas seltsam.
Das einzige physische Bauteil in dem sich dieser Balast wiederfindet sind die Decoder und die sind heutzutage so klein, dass es schon garnicht mehr auffällt.
AVX512 ist sowieso eine reine x86 Erweiterung, die kann ein ARM Kern garnicht haben. Das Äquivalent wäre NEON / SVE und das haben diese Kerne ja anscheinend, sonst könnte man keine Benchmarks mit FP16 vorstellen.
FP16 gibts bei x86 aktuell auch nur bei Intels Sapphire Rapid CPUs wodurch der Vergleich doch irgendwie Sinn macht. Aber ganz koscher ist er trotzdem nicht.
Ich denke schon das es die CPUs fürs Hosting von Services werden. Der Speed von ARM reicht für die meisten 0815 Services aus. Die x86 haben weiter Berechtigung aber mein Gefühl ist das sich da in den ñächsten Jahren ein wechsel ankündigt.
Tja, die Caches dominieren und wirklich Balast sind die 4.000 Befehle nicht, denn es wird nur eine begrenze Zahl ab Kombinationen in Varianten bedient.
Zudem ist x86-64 Binärcode sehr kompakt und somit passt viel Code in die Caches L2/3. Das bringt Vorteile, die etwas Verschlechterung per ewiger Kompatibilität kompensiert.
2/3-Speicherbestückung (AMD Genoa*) vs. Speichervollbestückung (AmpereOne)
FP32 Genauigkeit (AMD Genoa*) vs. FP16 Genauigkeit (AmpereOne)
*wobei Bergamo mit 128 Cores der Konkurrent wird
Erschreckend gut wie sich AMD schlägt, da man bei FP16 gegenüber FP32 von einer Verdoppelung der Leistung ausgehen kann. Klasse Antiwerbung von Ampere Computing. Bergamo schickt sich an aufzuräumen.