News AMD Epyc 9004 im Benchmark: Bergamo und Genoa machen Cloud und Server effizienter

Philste schrieb:
Ich hoffe doch mal, dass die 1.7×Performance/Watt im Vergleich zu Milan ist. Im Vergleich zu nem 40 Core Ice Lake wäre das absolut nicht beeindruckend mit fast 2.5× mehr Kernen.
Denkfehler ?
was hat performance pro Watt mit der Anzahl der Kerne zu tun? ^^
 
  • Gefällt mir
Reaktionen: Zocker1996 und SaschaHa
@Zokrace @SaschaHa 70% Perf/W. Heißt für mich, dass eine CPU 70% mehr Leistung at ISO Power hat. Nehmen wir einfach mal die 270W TDP vom 40Core Xeon. Meiner Meinung nach müsste ein 96Core Epyc bei 270W deutlich mehr als 70% vor dem Xeon liegen. Natürlich hat das was mit der Kern Anzahl zu Tun. Hätte der Epic 128 Kerne, hätte er bei 270W noch mehr Leistung, da der Takt bei "Umverteilung" auf das Mehr an Kernen nicht soviel fällt wie die Anzahl der Kerne steigt.
Wenn man mit 270W bei 40 Kernen sagen wir mal 3GHz schafft, dann schafft man mit 64 Kernen derselben Sorte z.B. immernoch 2.5GHz, da das Scaling Takt/Leistungsaufnahme halt nicht Linear ist. Und zack haben wir ne bessere Perf/W nur durch mehr Kerne.
 
Zuletzt bearbeitet:
mae schrieb:
Der L3-Cache ist laut Tabelle pro Zen4c-CCD genauso 32MB gross wie bei den Zen4-CCDs, nur sind's halt 16 Kerne statt 8. Wenn so eine CPU nichts fuer Spiele sein sollte, kann das AMD egal sein, fuer Spiele bieten sie was anderes an.
Wenn man 6 Kerne deaktiviert, bekommt man einen 10-Kerner mit 32 MB L3-Cache. Das wäre vielleicht was für einen Ryzen 7 7800 @65W TDP?

Aber ich denke mal der L2-Cache ist pro Kern auch nur halb so groß. Irgendwo müssen ja die ganzen Kerne untergebracht werden... Außerdem setzt Bergamo vermutlich auf eine Library, die sehr dicht packt, dafür aber keine hohen Taktraten schafft. Daher vielleicht doch nicht so einfach daraus einen Ryzen 7 für Spieler zu machen... Eher eine 65W CPU für Multithreading....
 
mae schrieb:
Der L3-Cache ist laut Tabelle pro Zen4c-CCD genauso 32MB gross wie bei den Zen4-CCDs, nur sind's halt 16 Kerne statt 8.
Eben je Kern der halbe Cache.
mae schrieb:
Wenn so eine CPU nichts fuer Spiele sein sollte, kann das AMD egal sein, fuer Spiele bieten sie was anderes an. Ich kann mir durchaus vorstellen, dass es im Ryzen-Preissegment Anwendungen gibt, die von den zusaetzlichen Kernen etwas haben, schliesslich gibt's das im EPYC-Preissegment auch (oder zumindest glaubt das AMD, sonst haetten sie Zen4c nicht entwickelt).
Es geht hier um die maximal Anzahl von Kernen je Sockel. das brauchen die Cloudanbieter. Die Single-Thead-Leistung ist hier nicht so wichtig.
mae schrieb:
Und ich denke, damit koennten sie den Kern- und Thread-Vorteil gegenueber Intel auch im Desktop-Segment behalten.
Beim Desktop geht Single-Thread-Leistung über alles. Nur wenn die stimmt, ist die Multicoreleistung von Interesse.

Ich bin sehr skeptisch, was den Desktop-Einsatz von Zen 4c angeht. Ich habe noch keine AMD-Folie gesehen, dass diese Kerne außerhalb von Servern eingesetzt werden sollen.
Ergänzung ()

Philste schrieb:
Wenn man mit 270W bei 40 Kernen sagen wir mal 3GHz schafft, dann schafft man mit 64 Kernen derselben Sorte z.B. immernoch 2.5GHz, da das Scaling Takt/Leistungsaufnahme halt nicht Linear ist. Und zack haben wir ne bessere Perf/W nur durch mehr Kerne.
Und deshalb sollte man solche Vergleiche nur mit vergleichbaren CPUs machen.

Aber ich würde das Ganze nicht zu hoch hängen, immer beachten wo es ursprünglich herkommt. Was MLID bericht kann stimmen, muss es aber nicht.

Im übrigen lohnt ein Blick auf en Test von Ryzen 7000. Hier hat der 7950X bei 65 W eine ordentliche Leistung abgeliefert. Server betreibt AFAIK man mit sehr wenigen Ausnahmen im Sweetspot.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Philste
Philste schrieb:
Meiner Meinung nach müsste ein 96Core Epyc bei 270W deutlich mehr als 70% vor dem Xeon liegen
Das tut er ja auch. Er ist 160% schneller (2,6x), aber bei rund 400 Watt. Die Effizienz bei gleicher TDP ist hier ja überhaupt nicht angegeben, daher hinkt dein Vergleich, wenn du dort den gleichen Wert von 70% höherer Effizienz annimmst.

Mit auf 270 Watt reduziertem Powerlimit würde der Epic - wie du im zweiten Zitat unten ja selbst feststellst - vermutlich kaum an Takt verlieren und seine Effizienz damit deutlich steigern, da "das Scaling Takt/Leistungsaufnahme halt nicht Linear ist". Er hätte dann vermutlich immer noch 110 bis 120% mehr Leistung und wäre dementsprechend also um genau diesen Wert effizienter, und eben nicht "nur" um 70%.

Philste schrieb:
Wenn man mit 270W bei 40 Kernen sagen wir mal 3GHz schafft, dann schafft man mit 64 Kernen derselben Sorte z.B. immernoch 2.5GHz, da das Scaling Takt/Leistungsaufnahme halt nicht Linear ist.
Und ja, hier sagst du es ja richtig, genauso ist es. Die Grafik bewertet aber die Effizienz bei voller Leistung und nicht bei identischem Powerlimit. Der Epic arbeitet mit 400 Watt und damit ineffizienter, als er es bei 270 Watt täte.
 
mae schrieb:
Mein System von 1995 hatte nur 32MB RAM, nicht 1152MB (und da hatten viele andere weniger). Also kann man alles, was ich damals gemacht habe, im L3 Cache eines einzigen Ryzen-CCDs halten. Auf 1024MB kam ich erst mit dem System von 2003 (und da hatte ich mir zuerst auch nur 512MB geleistet).

Themenwechsel: Koennte AMD die Zen4c-Chiplets mit je 16 Kernen mit dem Ryzen-IOD kombinieren und so 16 Kerne mit einem CCD oder 32 Kerne mit zwei abdecken? Wenn ja, werden sie es machen?
Ich meine die Games auf der diskette/ CD selbst unreal 1 1cd 6xxmb. Dann noch os alles im l3 Cache
 
Wenn man bedenkt, dass Zen 4 Desktop-CPU die meiste Leistung aus dem Takt zieht, weil die IPC nur um 12 Prozent gestiegen ist und sich dann die Taktraten der Epycs anschaut, dann fällt auf, dass beim Epyc dieser Taktvorteil weg fällt. Was bleibt, ist die leicht gestiegene IPC bei höherer TDP, die von 8 auf 12 Kanälle gestiegene RAM-Anbindung und der Umstieg auf DDR5 und PCIe 5. Wer also von den Kanälen zum RAM und PCIe nicht limitiert worden war, für den bringt der Zen 4 Epyc kaum was.

https://www.computerbase.de/2021-03/amd-epyc-7003-milan-zen-3-server/

Die fast gleiche Taktrate gibt es zu einer höheren TDP.

Epyc 74F324 / 483,20 / 4,00256 MB3200 MHz240 W225 W / 240 W$2.900

Epyc 9274F***Zen 4GenoaN5824/48256 MB3,30 GHz4,00 GHz+320 Watt320 – 400 Watt


Basistakt steigt von 3,2 auf 3,3 GHz, die TDP steigt für diesen Basistakt dabei von 240W auf 320W

Wenn man also den Zen 4 auf gleiche TDP des zen 3 zurückstellen würde, würde der Zen 4 Epic langsamer takten und damit die gewonnene IPC gar nicht in mehr Leistung umwandeln können, solange die 8-Kanal-Ram-Anbindung beim Zen 3 nicht limitiert.

Scheinbar ist das I/O-Die mit 12 Kanälen und PCie 5.0 doch recht durstig.
Ergänzung ()

ETI1120 schrieb:
Eben je Kern der halbe Cache.
Wenn die anderen Kerne aber gar kein Cache benötigen, weil ein Spiel nicht mehr als 8 Kerne auslastet, dann hat der voll ausgelastete Kern immer noch so viel, wie der eines 8-Kerners mit ebenfalls 32MB-Cache. Der Zugriff auf L3-Cache ist ja nicht auf die 2MB bzw. 4 MB pro Kern begrenzt.

War ja schon bei Zen 3 recht flexibel:

https://pics.computerbase.de/9/7/6/7/6-6c0a910eb8f3bad9/10-1080.c13e08aa.png
Ergänzung ()

ETI1120 schrieb:
Viele Anwendungen werden mit 2 MByte L3-Cache je Kern auch nicht mögen.
Bei Computerbase-Tests landet der 5700G nicht weit vom 5700X (beides 65W-CPUs) bei Anwendungen (ohne Spiele)

1665957487849.png


Würde also zumindest bei CB-Tests nicht auffalen....
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: SaschaHa
Convert schrieb:
Wenn man bedenkt, dass Zen 4 Desktop-CPU die meiste Leistung aus dem Takt zieht, weil die IPC nur um 12 Prozent gestiegen ist und sich dann die Taktraten der Epycs anschaut, dann fällt auf, dass beim Epyc dieser Taktvorteil weg fällt.
Und dann frage ich mich warum sollte beim Ryzen dieser Taktvorteil da sein und beim EPYC dieser Taktvorteil wegfallen? Vor allem da die EPYC im Sweetspot betrieben werden wo der Taktvorteil voll zuschlägt. Den höheren Verbrauch durch die mehr Speicherkanäle sollte die angehobene TDP abdecken.

Ich würde Mal in Ruhe die offiziellen Daten und Benchmarks abwarten.

AMD sagt dass bei einer TPD von 65 W der 7950 im Cinebench 23 um 75 % schneller als der 5950 ist. Das sind jetzt nicht Werte die der Steigerung der IPC entsprechen. Und das sind TPD-Werte bei denen sich die Server bewegen. 4 * 65 W = 260 W, 6 * 65 W = 390 W.

Convert schrieb:
Bei Computerbase-Tests landet der 5700G nicht weit vom 5700X (beides 65W-CPUs) bei Anwendungen (ohne Spiele)
Der 5700G ist monolithisch, hat also intern bessere Latenzen. Ich würde mich jetzt nicht darauf verlassen, dass sich ein CCD mit Zen 4c genauso verhält.

Ganz davon abgesehen, halte ich es für sehr unwahrscheinlich, dass AMD ein CCX mit 16 Kernen macht. Ich halte es für sehr viel wahrscheinlicher, dass AMD 2 CCX mit jeweils 8 Kernen macht und damit reduziert sich auch der L3-Cache, den ein Kern sieht, auf 16 MByte.
 
  • Gefällt mir
Reaktionen: Colindo
SaschaHa schrieb:
Die Effizienz bei gleicher TDP ist hier ja überhaupt nicht angegeben, daher hinkt dein Vergleich,

SaschaHa schrieb:
Und ja, hier sagst du es ja richtig, genauso ist es. Die Grafik bewertet aber die Effizienz bei voller Leistung und nicht bei identischem Powerlimit
Wer sagt, dass das so ist? Hier steht nichts, also gehe ich vom best Case aus und der ist meistens nicht bei voller Leistung. Wenn keine Besondere Erwähnung volle Leistung bedeuten würde, hätte AMD bei Raphael ja mit 10% LESS Performance/Watt werben müssen. Hat man aber nicht, warum auch? Wobei es in diesem Fall natürlich ungefähr aufgehen würde mit Effizienz bei maximaler (c)TDP. Wäre aber für Marketingfolien definitiv ein recht ungewöhnlicher Schachzug.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: ETI1120
@SVΞN
Ich glaube, die Liste enthält einen Fehler. Die CPUs mit F am Ende haben, je mehr Kerne sie haben, bisher immer einen niedrigigeren Takt gehabt. In der Tabelle ist es genau andersherum. Je mehr Kerne desto mehr GHz. Das halte ich auf Grund der vergangenen Produktpolitik für ausgeschlossen. Ergibt technisch ja auch nicht wirklich Sinn.
 
ETI1120 schrieb:
Beim Desktop geht Single-Thread-Leistung über alles. Nur wenn die stimmt, ist die Multicoreleistung von Interesse.

Fuer die Single-thread-Leistung ist es aber egal, ob sich daneben noch 7 Kerne langweilen oder 15, von daher sehe ich keinen Nachteil fuer Zen4c.

Wenn Du recht hast, und die Zen4c als 2x(8Kerne+16MB L3) organisiert haben (was wohl leichter geht als 1x(16Kerne+32MB L3), der Schritt von Zen2 auf Zen3 war ja offenbar schon recht aufwendig), ist das fuer single-threaded dann 1 Kern mit 32MB L3 (Zen4) vs. 1 Kern mit 16MB L3 (Zen4c). Das waere m.E. trotzdem kein Grund, sowas nicht zu machen, auch wenn's vielleicht fuer Spieler keine interessante CPU waere; fuer Leute, die viel Encoding o.ae. betreiben, koennte das trotzdem interessant sein. Aber so eine Organisation koennte technische Gruende gegen einen Ryzen mit Zen4c nach sich ziehen: Kann der Ryzen 7000-IOD mit 4 CCX reden? (Erklaert vielleicht auch, dass es nur Bergamos mit 8 Zen4c-CCDs geben soll: wenn der EPYC-IOD nur mit maximal 16 CCX reden kann.) Und es wuerde auch erklaeren, warum man nichts von Zen4c mit 3D-Cache liest: Wenn der Cache anders organisiert ist als beim Zen4-CCD, geht der 3D-cache fuer Zen4 nicht fuer Zen4c.
 
Da sprintet AMD ja völlig davon wenn die Informationen stimmen sollten.
 
Novasun schrieb:
Dell und AMD muhahahah - Sorry die hängen so sehr an Intels Zitzen... Auf dem Papier vermutlich ja... Nur bekommen wirst du sie nicht...
Also wir werden wohl nächstes Jahr auf VxRail Systeme von Dell wechseln - mit AMD Epyc.
 
Das ist ja sogar noch mehr Streuung nun als vorher schon. Alleine schon wieviele 32 Kerner es gibt ist der wahninn. Billig wird das dennoch nicht. Selbst ein 32 Kerner mit nur 4 ramriegel wird teuer bleiben.
Und wieviele es sich am Ende kaufen werden bzw sich leisten ist ne andere frage. Weil was mit 5400 € ist schon heftig für einen 32 Kerner. Klar ist AMD keine Wohlstand aber dennoch, ist da halt irgendwann mal die Schmerzgrenze erreicht. Es gibt keine unendliche steigerung beim Preis.

Und naja ist halt die frage wie stark so cpus da zulegen werden gegenüber dem Vorgänger. Da bin ich ja mal gespannt weil das wird gewiss interessant werden. Hoffen wir mal das es kein so einen start wie bei der 5000 serie kommen wird. Weil da kaufen sich erst recht sonst keiner bei einer festen Plattform wo man nicht ganz zufrieden ist und sogar noch viel mehr bezahlt als sonst.
 
Mich würde es interessieren on wir Desktop Mobile Consumer CPUs sehen die aus CCDs Zen4 + Zen4C bestehen und direkt Intel BigBigger angreifen.
 
ETI1120 schrieb:
Eben je Kern der halbe Cache.

Es geht hier um die maximal Anzahl von Kernen je Sockel. das brauchen die Cloudanbieter. Die Single-Thead-Leistung ist hier nicht so wichtig.

Beim Desktop geht Single-Thread-Leistung über alles. Nur wenn die stimmt, ist die Multicoreleistung von Interesse.

Echt ist das dein ernst das die single core Leistung über die muticore leistung beeinflusst. Das ist schmarn weil das ist getrennt zu Werten. Nur weil ein hoher single core Leistung einer CPU geschafft hatte, heißt das noch lange nix. Weil der tskt geht dann runter beim multicore. Also ich konnte auch bisher nie die Werte von dem single core nehmen weil ich mich immer im multicore befunden hatte. Gibt es da Beweise das nur alleine der single core auch über die multicore Leistung allein entscheidet?
 
mae schrieb:
Fuer die Single-thread-Leistung ist es aber egal, ob sich daneben noch 7 Kerne langweilen oder 15, von daher sehe ich keinen Nachteil fuer Zen4c.
Nicht in den Anwendungen auf dem Server wo 128 oder gar 256 Threads laufen.

Aber auf dem Desktop tut es sehr wohl weh wenn die einzelnen Threads nicht genügend Leistung haben.

Wir wissen fast nichts über Zen 4c. Wenn die Tabelle stimmt, hat er einen halb so großen Cache. Damit wäre der Flächenbedarf um 25 % gesenkt. Da genügt IMO nicht um 16 Kerne auf so ziemlich derselben Fläche unterzubringen. IMO hat AMD auch etwas an den Kernen gemacht.

Wie gesagt, es gibt keine Folie von AMD, die auf eine Verwendung von Zen 4c außerhalb der Server-CPUs hindeutet. Es gab jede Menge Gerüchte. Aber deren Logik ist, Intel macht Hybrid also muss es AMD auch machen. Dabei hat AMD kein Problem mit der Größe der Kerne, sondern mit dem CCX der 8 Kerne hat.

Auf 12 Kerne zu gehen hätte bedeutet, dass AMD auf 2 CCX mit je 6 Kerne zurückgehen müsste.
3 CCDs hätte den IOD erheblich komplexer gemacht.

Philste schrieb:
Hier steht nichts, also gehe ich vom best Case aus und der ist meistens nicht bei voller Leistung.
Eben, wir reden hier von Severn.

Bei Servern geht es in der Regeln um TCO und die hängt massive von der Effizienz ab. Da man Rechenzentren aktiv kühlen muss, schlägt jedes Watt doppelt zu Buche.

Außerdem hat Mark Papermaster doch ganz klar gezeigt, wie es sich mit der Effizienz des 7950X verhält:
1665994517883.png

Wenn ich mich recht erinnere hat er 65 W TDP ausdrücklich als Sweetspot des 7950X bezeichnet. Und hier werden die meisten Epyc laufen.

Und auch der Test des Ryzen 7000 zeigt deutlich wie effizient der 7950X bei sinnvoller Wahl der TDP wird.

In der Leistungsspitze kann man jeden Effizienzgewinn verheizen.
 
Philste schrieb:
Wer sagt, dass das so ist? Hier steht nichts, also gehe ich vom best Case aus und der ist meistens nicht bei voller Leistung.
Die Zahlen, die dort stehen, sagen das.
Schau dir die Grafik an und rechne es nach. Wir haben die 2,6-fache Leistung bei rund 400 statt 270 Watt Verbrauch. 2,6/(400/270) = 1,755, also rund 75% Mehrleistung bei voller Last. Mein Gott, warum sind manche hier nicht einmal dazu in der Lage, die vorhandenen Zahlen eigenständig nachzurechnen?
 
  • Gefällt mir
Reaktionen: Lamaan
ETI1120 schrieb:
Aber auf dem Desktop tut es sehr wohl weh wenn die einzelnen Threads nicht genügend Leistung haben.

Aber warum sollte ein einzelner Zen4-Kern auf einem Zen4c weniger Leistung haben?

Wir wissen fast nichts über Zen 4c. Wenn die Tabelle stimmt, hat er einen halb so großen Cache.

Also ich sehe einen genauso grossen Cache pro CCD, aber dafuer doppelt soviele Kerne.

Damit wäre der Flächenbedarf um 25 % gesenkt. Da genügt IMO nicht um 16 Kerne auf so ziemlich derselben Fläche unterzubringen.

Nein, aber warum sollten sie sich auf dieselbe Flaeche beschraenken? Ich gehe davon aus, dass der Zen4c-CCD entsprechend (um 8 Zen4-Kerne) groesser ist als der Zen4-CCD.
 
  • Gefällt mir
Reaktionen: Lamaan und SaschaHa
Zurück
Oben