News Zen 4c „Bergamo“: AMDs 16-Kern-CCD benötigt nur 9,6 % mehr Fläche als 8 Kerne

Novasun schrieb:
Na ja Griff ins Klo - wohl kaum. Und das RDNA 3 deutlich höher takten kann wissen wir doch schon. Nur explodiert auch der Stromverbrauch. NV kann sich definitiv nicht ausruhen...
Gut Griff ins Klo ist vielleicht etwas übertrieben. Aber enttäuscht war ich schon als ich die ersten Tests und Benchmarks gesehen. Ich habe da mehr erwartet. Und glaube auch dass es einen Fehler im Design gibt und RDNA3 deswegen nicht so gut performt. Vor allem bei RT hatte ich einen größeren Sprung erwartet.
 
  • Gefällt mir
Reaktionen: Inxession
jotecklen schrieb:
Das liegt aber mehr an nVidia und Intel als an AMD :)
Well, natürlich wird ein Marktteilnehmer immer an seiner Konkurrenz gemessen. Ließe sich auf jeden Bereich anwenden. Samsung ist auch nur die zweitbeste Foundry, weil TSMC eben besser ist. Sonst wären sie top :P
 
Ziemliche interessanter Ansatz. Vermutlich wird die nächste AMD highend CPU ein 24-Kerner. 8 Zen 5 Kerne ggf. mit 3D Cache sowie 16 Zen 5c Kerne.
Aus meiner Sicht eibe realistische big.LITTLE Konfiguration. Das ganze hätte eine gute Flächeneffizienz und durch den limitierten Takt der ZenC Kerne, wäre die Energieeffizienz nicht bescheiden.
 
Intel versteht nur noch Bahnhof
 
  • Gefällt mir
Reaktionen: iron_monkey
[wege]mini schrieb:
Der Unterschied ist nur der Cache. Man könnte sagen, die Zen4c Kerne sind explizit entwickelte Celerons.

Der Stromverbrauch wird (bei gleichem Takt) nicht signifikant sinken und ob man diesen Takt bei höherer Dichte der Transistoren überhaupt erreicht, weiß aktuell nur AMD.

mfg
Das ist reines Fabulieren deinerseits. Quelle bitte, du Dampfplauderer.
 
LEDs schrieb:
Also bei der für HPC wichtigen FP64 Performance ist die mi250x vor der H100 und die mi300 APU kommt schon nächste Woche.
So pauschal völlig falsch. Die Nachfrage momentan ist durch AI getrieben. Und da wird fürs Interferencing auf FP8 oder Int8 gesetzt.
Ich glaube kaum, dass Nvidia die Nachfrage kaum bedienen kann, weil Hopper so schlecht ist
 
Donnidonis schrieb:
Wie genau unterscheidet sich denn ein C Kern von einem nicht C Kern? Wenn er so viel kleiner ist, was fehlt denn dann? Oder beherrscht er das gleiche Instruction Set wie die großen, hat nur weniger Takt etc? Ist es ein ähnlicher Ansatz wie Intel E Kerne, oder ist es was ganz anderes?
Es ist derselbe Kern aber anders layoutet. Bei Zen 4c war IMO das Ziel das Layout auf geringe Fläche und geringe Power zu optimieren, beim Zen 4 war das Ziel auf hohe Performance und geringe Power zu optimieren.

Zen 4c sollte so ungefähr dieselbe IPC wie Zen 4 haben. Der halbe L3-Cache je Kern und das kompakte Design sorgen für Abweichungen. Sobald ausgiebige unabhängige Benchmarks vorliegen wissen wir es genau.

Ein einzelnes Zen 4c CCD wird deutlich niedriger takten als ein einzelnes Zen 4 CCD. Ich würde jetzt Mal keine Frequenzen erwarten die viel höher als 3,2 GHz sind.

Der Eypc 9754 mit 128 Zen 4 Kernen hat einen Basistakt von 2,05 GHz und einen Turbo von 3,2 Ghz bei einer TDP von 360 Watt. Der Basistakt liegt mit den 64 Kern-Varianten von Genoa so ziemlich gleich auf, liegt aber beim Turbo um 500 bzw. 600 MHz niedriger als bei Genoa.

[wege]mini schrieb:
Wenn der Takt komplett abkackt, braucht das nicht einmal der Servermarkt.
Der Takt wird im Vergleich zu Zen 4 im Desktop komplett abkacken.
Aber beim Server kann Zen 4 auch keinen hohen Takt fahren.
Donnidonis schrieb:
Das TSMC die restlichen Mittel liefert in den Kern so zu bekommen wie er ist hab ich gelesen.
Bei SRAM gibt es viele verschiedene Zell-Designs, es hängt eben von den Anforderungen ab, was man wählt. Dass TSMC hier eine neue SRAM-Zelle bereitstellt ist nur eine Nuance.
[wege]mini schrieb:
Der Unterschied ist nur der Cache. Man könnte sagen, die Zen4c Kerne sind explizit entwickelte Celerons.
Der Unterschied ist weit mehr als nur der Cache. Wenn die Benchmarks draußen sind wissen wir für welche Lasten sich Zen 4c lohnt.
[wege]mini schrieb:
Der Stromverbrauch wird (bei gleichem Takt) nicht signifikant sinken und ob man diesen Takt bei höherer Dichte der Transistoren überhaupt erreicht, weiß aktuell nur AMD.
Das werden wir bald wissen. Beim gleichen Takt muss die Power je Kern deutlich sinken. Sonst AMD könnte nicht 33 % mehr Kerne im selben Power-Budget und selben Frequenzbereich betreiben.
ThePlayer schrieb:
Naja seit RDNA ist es deutlich besser geworden. RDNA2 war bis auf Raytracing richtig gut. Und RDNA3 ist irgendwie ein griff ins Klo. Die Frage ist nur ob da ein Fehler im Design von RDNA3 ist.
Wir kennen 3 Chip-Designs von RDNA3 und keines überzeugt.
  • Navi 31 mit 5 nm
  • Navi 33 mit 7 nm
  • Phoenix mit 4 nm
Ich habe große Zweifel dass es ausschließlich am Chip-Design liegt.
ThePlayer schrieb:
Und sie die GPUs nicht so hoch Takten lassen können wie gedacht. Mal sehen wie es in 1,5 Jahren aussieht.
IMO ist ein Teil des Problems, dass die reale IPC des neuen Shaders zu klein ist. Dass ein sehr kompaktes Chip-Design nicht extrem hoch taktet, kann nicht überraschen. Der überraschend hohe Verbrauch von Navi 31 kommt IMO daher, dass AMD die Taktschraube überdrehen musste, um trotz zu geringer IPC eine halbwegs akzeptable Performance zu erreichen.

Bei Navi 33 wird offensichtlich, dass die IPC verfehlt wurde. AMD packt dieselbe Anzahl der Shader auf eine kleinere Fläche und fertigt das ganze im selben Node. Wo sollen hier großartige Taktsteigerungen herkommen? RDNA und vor allem RDNA 2 haben schon einen hohen Takt erreicht. Eine deutliche Perfoermancesteigerung wäre nur mit bessere IPC drin gewesen.

Novasun schrieb:
Mit einem 16er CCD kann man faktisch alles was für Desktop benötigt wird abdecken. Maximal einen zweiten dazu und gut.
Ich sehe bei den Desktop-Ryzen die Zen 4c bestenfalls als zweites CCD. Also als Teil einer Hybridlösung
Aber das ist auch nur dann realistisch, wenn Zen 4c eine deutlich höhere Taktfrequenz als bei Bergamo erreicht sollte.

Northstar2710 schrieb:
im Endeffekt ist ein 4c ein Phoenix wenn man die caches betrachtet. Die Monolitischen mobil\desktop apus hatten bei AMD immer den halbierten L3 cache gegenüber den normalen Ryzen cpus.
Der L3-Cache ist aber nur ein Aspekt der ganzen Geschichte. Bei den CCD-Lösungen muss der L3-Cache auch die höheren Latenzen kompensieren. Die monolitischen APUs haben bessere Latenzen und deshalb wirkt sich der kleinere L3-Cache nicht so stark aus.

Der Zen 4c-Kern ist ein Design das auf kleine Fläche und geringe Power optimiert ist. Die Dieshots der Kerne unterscheiden sich erheblich. Man kommt anhand der Dieshots nicht auf die Idee, dass beide Kerne dieselbe Architektur haben.

Bisher sind zwei Anwendungen von Zen 4c bekannt:
  • Zen 4c CCD für Bergamo
  • Phoenix 2 Hybrid APU
    • zwei Zen 4 Kerne mit zusammen 2 MB-L2 und 4 MByte L3-Cache
    • vier Zen 4c Kerne mit zusammen 2 MB-L2 und 2 MByte L3-Cache

ThePlayer schrieb:
Aber ich denke das der AM5 Sockel mit Zen CPUs mit mehr als 16 Kernen geplannt worden ist. Kann mir gut vorstellen das wir da in den nächsten Jahren dann Ryzen CPUs mit 32 und 64 Kernen sehen werden.
Von der TDP her gesehen würde ich Dir mit den 32 Kernen voll zustimmen. Auch mit der Speicherbandbreite sollte es genügen. 64 Kerne halte ich für unrealistisch.

Vom Platz auf dem Substrat her gesehen wird es IMO nicht funktionieren. Richtig klar wird es wenn man sich die Sache im Heatspreader anschaut. Der Abstand zwischen IOD und den CCD ist für das Routing im Substrat erforderlich. Und mit diesem Abstand ist kein Platz für zusätzliche CCDs. Eine CPU mit 2 Zen 5c CCDs wird im Desktop nicht funktionieren.

Die einzige Option für mehr Kerne wäre, dass AMD das Substrat durch eine kompaktere Technik ersetzt.

ThePlayer schrieb:
Zu der News selbst "WOW"! Erstaunlich was so eine kleine Klitsche wie AMD da abliefert.
Ich finde es eine coole Lösung und bin auf die Benchmarks gespannt. Ich habe lange gerätselt was AMD mit Zen 4c machen wird. Dass nur den L3-Cache zu halbieren nicht genügt war klar. Es war ausgerechnet Tom von MLID der diese Lösung erwähnt hat. Dass es so gut funktioniert hat mich aber überrascht.

Du hast bei "kleine Klitsche" die Anführungszeichen vergessen.

AMD ist keine kleine Klische mehr.

Vom Financial Analyst Day im Juni 2022:
1686173088897.png

Tatsächlich hat AMD im Jahr 2022 5 Mrd USD für Forschung und Entwicklung ausgegeben. Also das 5-fache wie 2017

Der Umsatz von AMD im Jahr 2017 war ca 5,2 Mrd USD.

jotecklen schrieb:
Das liegt aber mehr an nVidia und Intel als an AMD :)
Richtig Nvidia ist nicht Intel.

Dass Nvidia ein anderes Kaliber als Intel ist, war sicher auch ein Aspekt, bei der Entscheidung von AMD sich zuerst auf die CPUs zu konzentrieren.

mae schrieb:
Taktfrequenz auch, und die wird bei Zen4c und Zen5c nicht so prickelnd sein. Aber fuer das zweite Chiplet waere das fuer Leute, die viele Kerne brauchen, schon cool.
Das hängt aber auch ganz stark davon ab, welche Taktfrequenz tatsächlich erreicht wird.
Wenn es bei 3,2 GHz oder 3,5 GHz bleibt wird es auf dem Desktop nicht viel bringen. Wenn es 4 GHz werden sollten, wird's interessant.

Ich sehe viele Anwendungsgebiete für diesen Kern, auch wenn es bei 3 GHz bleibt.
mae schrieb:
Was 3D-cache bei Zen4c und Zen5c betrifft, der L3-cache kommt bei Zen4c in zwei Teilen daher, was den Aufbau von 3D-cache noch arbeitsaufwaendiger machen wuerde (und wohl auch den Yield ein bisschen druecken wuerde).
Das ist ein Aspekt.

Der andere ist, bei Zen 3 und Zen 4 ist die zusätzliche Fläche für die Einbindung des optionalen L3-caches viel leichter zu verschmerzen als bei einem sehr kompakten Kern.

ThePlayer schrieb:
Gut Griff ins Klo ist vielleicht etwas übertrieben.
nein, das trifft es ganz gut.

Den Vollausbau der Navi 33 muss AMD als RX7600 verkaufen. Nur so kann AMD so etwas wie einen Fortschritt suggerieren.
ThePlayer schrieb:
Aber enttäuscht war ich schon als ich die ersten Tests und Benchmarks gesehen. Ich habe da mehr erwartet.
AMD hat bei der offiziellen Vorstellung erheblich mehr angekündigt als sie schließlich geliefert haben.

Als ich die unabhängigen Benchmarks gesehen habe, war ich fassungslos. Da kamen ganz starke Vega-Feelings auf.

ThePlayer schrieb:
Vor allem bei RT hatte ich einen größeren Sprung erwartet.
Der Witz ist doch, dass der Zuwachs bei RT so ziemlich der Ankündigung von AMD entspricht. Bei RT ist die Lücke zu Nvidia kleiner geworden. Bei der Rasterperformance ist die Lücke zu Nvidia wieder größer geworden.

LEDs schrieb:
Also bei der für HPC wichtigen FP64 Performance ist die mi250x vor der H100 und die mi300 APU kommt schon nächste Woche.
Das klassische HPC wird immer mehr zu einem Nischenmarkt. Hier war die MI250X sicher ein Prestigeerfolg. Aber für AI, den eigentlich relevanten Markt, muss AMD in der Hardware und Software nachlegen.

Die MI300 ist für Ende diesen Jahres angekündigt. Natürlich wird AMD wegen des aktuelle AI-Hypes versuchen das zu beschleunigen, aber Wunder wird es keine geben.

Ich finde die MI300 vor allem wegen dem Advanced Packaging spannend. Aber für den Markt ist nur relevant was tatsächlich an Performance kommt. Und hier sind die Angaben von AMD sehr vage.
Wenn im Faktor 8 das Unterstützen neuer Formate schon mit eingerechnet ist, wird es nicht reichen.

Taurus104 schrieb:
Schon eine etwas übertriebene Aussage.
Nein ist es nicht.

Dass AMD in der Performance mit RDNA 3 hinterläuft, kannst Du in jedem Vergleich der Grafikkarten sehen.
Und wie gesagt der Abstand zu Nvidia ist mit RDNA 3 wieder deutlich größer geworden.

Dass AMD das Performance-Defizit durch niedrigere Preise kompensieren will, ist auch klar.
 
PS828 schrieb:
Können sie und man würde nichtmal Features verlieren wie bei intel P zu E core. Hat viele Vorteile da die ZenC kerne nicht wirklich "little" sind
Naja aktuell würde man die Option auf 3D Cache verlieren falls man das als „Feature“ betrachtet. Aber ansonsten ist es wenigstens im Funktionsumfang identisch.
Ergänzung ()

RKCPU schrieb:
Auch etwas merkwürdig, dass im Mobilbereich nicht die 16-Core Zen4c Chiplets 'Vindhya' Einzug halten.
Im groben benötigt ein 8-Core Zen4c mit 16 MB-L3 etwa soviel Platz wie ein 4-Core Zen4 mit ebenfalls 16 MB-L3. Ab Zen5 / Zen5c könnten vielleicht beide Bereiche ähnlich groß werden ggf. erst ab der 3nm Fertigung?

Bei 3nm könnte ggf. 8* Zen5 mit 16 MB-L3 plus 3D-Cache 32 MB und zugleich 4* Zen5c an 8 MB konnen,
bzw. der ganze L3 als Einheit beschaltet werden.
Interessant wäre es ob man irgendwann das platzsparende Design in Kombination mit TSVs hinbekommt und den L3 Cache „ohne größere“ Leistungseinschränkungen komplett auf eine andere Ebene verlegen kann. Dies würde dann richtig abgehen… Evtl. den L2 Cache im Gegenzug sogar erhöhen.
Ergänzung ()

MrHeisenberg schrieb:
Nvidia nutzt TSMCs Fertigungsverfahren für ihre GPUs, Intel nicht.
Möglicherweise ist TSMCs Verfahren besser als Intels?
Intels GPUs sollten doch ebenso bei TSMC laufen…
Ergänzung ()

Floxxwhite schrieb:
Zumindest im Heim-Computing macht das immer weitere Verdichten keinen Sinn. Warum sollte eine CPU nicht 7x7 cm messen. Das würde die Wärmeabfuhr deutlich erleichtern. In vielen Lösungen müsste man nicht mal mehr auf Kupfer oder Hestpipes zurück greifen.
Preise für Wafer?
 
Zuletzt bearbeitet:
Ich verstehe nicht ganz warum hier einige jetzt AMD sich hochloben und auf Intel eintreten.

Der Artikel liest sich für mich eigentlich so als kommt die Wesentliche Magie hier von TSMC und AMD hat grob gesagt ein bisschen Tetris gespielt.
 
ThePlayer schrieb:
Naja seit RDNA ist es deutlich besser geworden. RDNA2 war bis auf Raytracing richtig gut. Und RDNA3 ist irgendwie ein griff ins Klo. Die Frage ist nur ob da ein Fehler im Design von RDNA3 ist. Und sie die GPUs nicht so hoch Takten lassen können wie gedacht. Mal sehen wie es in 1,5 Jahren aussieht.
Könnte ein Fehler sein auch weil relativ zeitnah RDNA 3.5 kommuniziert wird aber würde generell nicht nur davon ausgehen.

Die Tatsache dass es kein volles Programm gab - Navi31 bis Navi33 geplant und Navi33 TSMC N6 und monolithisch ist zeigt mir eher dass RDNA3 von vornherein nicht komplett ausgelegt und möglich ein Zwischenschritt war.

Ok das Technologie, der ökonomischen Umstände oder beidem geschuldet war werden wir nie erhalten. Entscheidend aber ist für mich wie RDNA 4 wird:

  • komplettes Portfolio
  • aggressive Preise, Features und Leistungssteigerung men
  • komplettes ausnutzen von TSMC N3 und 3D stacking

Wenn man es mit RDNA4 nicht schafft klare Zeichen zu setzen, evtl. leistungsmässig (auch RT) gleichzuziehen und Nvidia Marktanteile abzunehmen verliere ich die Hoffnung oder muss auf Intel’s GPUs hoffen.
 
@ETI1120 Sorry aber RDNA3 mit Vegavibes zu vergleichen... Geht gar nicht.

Wo konnte denn deine Erwartung enttäuscht werden? AMD hatte vorher offiziell nichts angegeben... Ja in den Gerüchten gab es zuvor den Hinweis das Sampels bis über 3GHz gingen... Wie wir wissen ist das sogar möglich. Nur in einer Art und Weise wie wir das heute eigentlich nicht mehr wollen...
Du siehst RDN3 nur so schlecht weil du die 4090 als Ankerpunkt nimmst... Wo hat denn in Bezug auf die 7600 NV im unteren Segment abgeliefert? Da sind viele Karten auch Grütze - spätestens wenn man sich Preis/Leistung anschaut...

In den unteren Segmenten passiert zu wenig. Aber bei beiden Herstellern. Gut da haben sie auf der anderen Seite aber auch das wenigste Interesse daran. So sieht es im Moment zumindest aus.
 
  • Gefällt mir
Reaktionen: Harpenerkkk, HierGibtsNichts und ThePlayer
Raucherdackel! schrieb:
Quelle bitte, du Dampfplauderer

Das ist in etwa so, als wenn du mich nach einer Quelle nach dem kleinen ein mal eins fragen würdest.

Sage doch einfach, du glaubst mir nicht. Das ist für dich nicht peinlich und tangiert mich genauso peripher, wie das von dir gewählte Wort.

mfg

p.s.

ETI1120 schrieb:
Der Takt wird im Vergleich zu Zen 4 im Desktop komplett abkacken.

Davon gehe ich auch aktuell aus. Dafür wird der Verbrauch extrem geil sein und die Fläche pro Chip im Verhältnis zu den Recheneinheiten ist, wie hier beschrieben, mehr als beachtlich.

Wunder, gibt es immer wieder aber genau bei diesem Produkt, wird es keine Eier legende Wollmilchsau. Es hat seine Einsatzszenarien und dafür wurde es gebaut.

Für jeden und alle, aber nicht.
 
Der neue Ryzen 9 8970X kommt dann mit 32 Kernen und 64 Threads auf den Desktop :daumen:
 
  • Gefällt mir
Reaktionen: [wege]mini
HerrRossi schrieb:
Der neue Ryzen 9 8970X

Beim 9970X ziemlich sicher. Die Richtung ist eingeschlagen und jetzt schaut man, wie schnell man voran kommt.

mfg

p.s.

Ziemlich sicher, wird er keine 10 Ghz haben. Dieser Weg war eine Sackgasse. :heilig:
 
Crifty schrieb:
Um so erschreckender finde ich die Tatsache das sie bei den GPUs so hart hinterherlaufen.
Tun sie ja auch nicht, wenn man die Preisklassen vergleicht. Dann ist die 7900XTX im Raytracing gerade mal 10% langsamer als die 4080, dafür ist sie im Rasterizing etwas schneller, die 7900XTX hat mehr RAM und ist momentan ca. 10% günstiger.
Ja, mit einer 4090 kann AMD nicht konkurrieren, das ist aber nur für sehr wenige User relevant.
 
7H0M45 schrieb:
Der Artikel liest sich für mich eigentlich so als kommt die Wesentliche Magie hier von TSMC und AMD hat grob gesagt ein bisschen Tetris gespielt.
Ähnlich wird das auch auf Prozessen von Samsung und Intel funktionieren.

Wobei TSMC durch seine diverse Kundschaft wahrscheinlich am meisten Erfahrung mit dem Auslegen seiner Fertigungsmöglichkeiten auf verschiedene Ziele (Performance, Dichte, Stromsparen) haben wird.
 
C4rp3di3m schrieb:
Schönes Stück Technik
Gute Neuigkeiten, das bedeutet dass bald auch mehr wie 16C auf Desktop möglich ist.
Wenn AMD den Zen4 auf 4nm shrinked, dann Hexacore mit 24 MB-L3 plus Quar Zen4c mit 4 MB L3 (um 90° gedreht) auf einem DIE so wären 10/20 Cores mit einem Chiplet machbar. Mit 2 Chiplets dann 20/40 Cores ...

Aber auch teildeaktiviert mit 6/12 & 0/0, 6/12 & 2/4, 4/8 & 4/8 oder 2/4 & 4/8 big.little vermarktbar. Aktuell kann AMD per Zen4 Chiplet 5nm ja nur 8/16 und 6/12 sinnvoll vermarkten in Konkurrenz zu Intel.
 
Zurück
Oben