Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsAMD Milan-X: Neue Epyc-CPUs mit 768 MB L3-Cache für 16 bis 64 Kerne
AMD lüftet heute den Vorhang für Milan-X. Dahinter stecken Epyc-CPUs der dritten Generation, die auf bis zu acht CPU-Dies 3D-V-Cache setzen. Diese Cache-Monster stellen damit die Speerspitze im Portfolio dar, die in ganz speziellen industriellen Anwendungen massive Leistungsgewinne erzielen können.
Ja aber Hallöchen, das sind wirklich schöne CPUs.
Da bin ich mal gespannt was Intel dagegen halten will.
Das mit den Caches hab ich mal im Unikurs "Clustercomputing" beim Matrixmultiplizieren kennen gelernt.
Matrixmultiplikation ist ganz grob gesagt "Zeile x mal Spalte y = Eintrag xy im Ergebnis".
Solange die ganze Matrix in den Cache passt geht das richtig schnell.
Nun liegen diese Matritzen aber alls Array im SPeicher vor, also linear.
Jedesmal die Spalte auszulesen sorgt für viele Cachemisses, da man für eine Matrix größer als 32Byte Kantenlänge meist schon die Cachezeilengröße überschreitet.
Es ist schneller eine Spalte mit viel Cachemisses in ein linearen Speicher zu kopieren, der dann keine Cachemisses mehr produziert und mit dieser alles aus dem Cache zu berechnen.
Das war ein 2 stelliger Faktor in der Beschleunigung!
Jetzt sind die Caches von dem Ding aber so riesig, dass do viele Matritzden direkt im Cache gerechnet werden können.
Der Aufpreis dürfte erklecklich ausfallen, dazu geringe Herstellungskosten der L3 slices und eine hoffentlich gute Ausbeute in der Stapelfertigung und die Gewinnmarge freut sich.
Normalerweise gar nicht. Daten aus dem Cache holen ist effizienter als aus dem RAM. Nur bei Anwendungen die absolut nicht vom größeren Cache profitieren wird der den Verbrauch der CPU leicht erhöhen, aber wo das der Fall ist wird man eh keinen Milan-X einsetzen.
Die Effizienz würde nur leiden wenn Deine Applikation nicht im gleichem Maße schneller wird wie der Energieverbrauch durch den zusätzlichen L3 steigt. Aber wo das der Fall ist, würde man gar nicht erst zu den Modellen mit zusätzlichem L3 greifen, also mach ich mir da keine Sorgen.
Mein lieber Schwan.
Wenn die in der Spitze >60% herausholen, heißt das doch auch, das sie durch den Schritt in die 3. Dimension nur sehr geringe bis vielleicht gar keine? zusätzlichen Strafzyklen für den Zugriff auf den ziemlich riesigen Cache haben?
Das hieße dann, man kann nur Gewinnen und Programme, welche nicht vom Cache profitieren werden nicht wie üblich abgestraft.
Ich freu mich schon mal auf meinen neuen 12 Ender.
Da lohnt sich wohl auch mal ein CPU Upgrade.
Zen 4D ist ja mittlerweile auch schon geleaked, wobei dann 16 Kerne mit weniger Cache autf einem Chiplet untergebracht werden. Ich frage mich, ob die dort ebenfalls auf gestackten Cache zurückgreifen werden um das Auszugleichen.
Mein lieber Schwan.
Wenn die in der Spitze >60% herausholen, heißt das doch auch, das sie durch den Schritt in die 3. Dimension nur sehr geringe bis vielleicht gar keine? zusätzlichen Strafzyklen für den Zugriff auf den ziemlich riesigen Cache haben?
Darauf würde ich nicht wetten. AMD hat da wohl einfach ein herausragend positives Beispiel für eine Anwendungen gesucht und gefunden, die mehr Cache braucht als ein regulärer Epyc bietet und daher besonders beindruckend skaliert, wenn man den Speicherflaschenhals aus dem Spiel nimmt.
Wenn die in der Spitze >60% herausholen, heißt das doch auch, das sie durch den Schritt in die 3. Dimension nur sehr geringe bis vielleicht gar keine? zusätzlichen Strafzyklen für den Zugriff auf den ziemlich riesigen Cache haben?
Microsoft hat gegenüber Servethehome schon bestätigt, dass sie ihre HBv3 Instanzen generell auf Milan-X umstellen werden, weil es offenbar selbst im schlimmsten Fall keine Nachteile gibt. Spricht dafür, dass du absolut recht hast.
Hat AMD doch schon bei der Vorstellung vor ein paar Monaten bestätigt. Die Latenz wird nicht viel höher sein. Macht ja auch Sinn, da die Wege kurz sind.
Hoffe ihr bekommt einen kleinen 16 Kerner mit 768 MB in die Finger und könnt mal prüfen was das beim Gaming bringt (so ganz ohne Optimierung). Im Vergleich zu einem "normalen" 16 Core mit gleichem Takt und kleinem Cache.
Deshalb, und weil Facebook auch auf Epyc setzt. Die waren bislang ja so eng mit Intel verwoben, dass z.B. Cooper Lake primär für Facebooks Anforderungen optimiert war.