Perdakles schrieb:
Hier eine recht neue Info dazu:
https://videocardz.com/newz/amd-ryz...27-higher-transistor-density-over-predecessor
Die Transistordichte soll um 26,8% gestiegen sein im Vergleich zu Zen4. Das erklärt das doch eigentlich ganz gut oder?
Es erklärt eben nichts.
Denn TSMC selbst sagt, dass N4P gegenüber N5 eine um 6 % höhere Transistordichte hat. Auch wenn man diese Angabe nicht zu ernst nehmen sollte, ist der Unterschied zu knapp 27 % zu groß um ignoriert zu werden.
Also muss da etwas zusätzliches passiert sein. Aber was?
- Hat AMD Takt gegen Flächeneinsparung getauscht?
- Ist AMD auf eine kompaktere SRAM IP gewechselt, so wie bei Zen 4c?
Wenn ich die bisher verfügbaren Die Shots mit denen von Zen 4 vergleiche komme ich zu folgenden Ergebnisse für den Anteil der Kerne an der horizontalen Ausdehnung des CCD:
- Zen 4: ca. 56 %
- Zen 5: ca. 68 %
- Angesichts der Auflösung der Bilder ist das alles nur ungefähr. Aber diese Verschiebung ist IMO offensichtlich und ein klarer Hinweis darauf, dass AMD bei der IP für das SRAM im L3 Cache etwas geändert hat. Auch wenn AMD dazu nichts gesagt hat.
Perdakles schrieb:
Gegenüber TSMC N4P soll TSMC N3P eine um ca. 57% höhere Transistordichte ermöglichen.
Das bezieht sich überdies nur auf die Logik. Auf einem CCD ist sehr viel SRAM.
Wenn man dieselben SRAM-Schaltungen beibehält, gibt es
keine Skalierung für den SRAM von N4P auf N3P.
Perdakles schrieb:
Wie soll man damit die Anzahl der Kerne verdoppeln (von vervierfachen ganz zu schweigen), ohne dass das CCD zu groß wird? Schließlich wird das ganze ja aller Voraussicht nach noch in den Sockel AM5 passen müssen wie du selber ja schreibst.
Du willst auf AM5 mehr Kerne,
.
Ich habe schon mehrfach gesagt dass ich nicht nachvollziehen kann warum AMD nicht einfach den Sockel größer gemacht hat. Denn dieser bizarre Heat Spreader schränkt die tatsächlich verfügbare Fläche weiter ein. Allerdings hat AMD eine Roadmap für den Sockel AM5 und sie sind offensichtlich zum Schluss gekommen dass es genügt. Zumindest bis 2027.
Und wer sagt denn dass die größeren CCDs überhaupt für AM5 vorgesehen sind?
Laut Keppler soll es weiterhin CCDs mit 8 Kernen geben.
https://twitter.com/Kepler_L2/status/1791931625443356959
Perdakles schrieb:
Und aus Yield-Gründen wird AMD in einem neuen Prozess wie N3P sicher nicht wollen, dass die CCDs viel größer werden als bei Zen5 in N4P.
Beim Modularisieren gibt es immer mehrere Gesichtspunkte. Man muss immer die Größe der Module und Anzahl der Module miteinander abwägen.
Größere Module sind teurer, mehr Module zu integrieren ist ebenfalls teurer.
Perdakles schrieb:
Ich würde mir zumindest wünschen, dass sie ein 12 Kern CCX umsetzen
und ein CCD dann weiterhin aus nur einem CCX besteht. Aber wer weiß, vielleicht machen sie es ja wie bei Zen2 und Zen3 Step-by-Step.
Ich werde das Gefühl nicht los, dass Du das Ganze nur willst weil 12 größer als 8 ist.
Wie gesagt ist 12 nicht in der Verlosung. Und 2 CCX auf einem CCD hat AMD bisher immer über den IOD verbunden.
Perdakles schrieb:
Das kann aber auch daran liegen, dass man Zen5 und Zen5c kombiniert bei Strix Point und dies so einfacher ist.
Die Dense-Kerne werden IMO maximal über die Notebook-APUs in den Desktop kommen.
Perdakles schrieb:
Wann und wo habe ich das behauptet? Ich gehe ziemlich fest von N3P für Zen6 im Desktop aus. Zen6c für Server dann evtl. in N2.
Das war nicht auf Dich bezogen.
Es gibt diese Spekulationen.
stefan92x schrieb:
Dagegen spricht, dass schon Phoenix2 problemlos Zen 4 und 4c in einem CCX zusammengefasst hat.
War es tatsächlich problemlos?
Alle Leaker sind sich einig dass das Zen 5 CCD nur 1 CCX hat. Falls das zutrifft bei Strix Point ein 12 Kern CCX ebenso möglich, oder?
Aber bei Strix Point hat AMD beide Zen 5 classic und Zen 5 dense sauber getrennt.
Nixdorf schrieb:
Ich sehe da gleich mehrere Möglichkeiten:
- Man könnte den L3-Cache pro Kern halbieren, wie es auch beim Zen4c-CCD für Bergamo schon passiert ist. Beispielrechnung dazu: Der L3-Cache belegt regulär etwa 1/3 der Chip-Fläche. Halbiert man das, wird das Die um 1/6 kleiner. Das verdoppelt und dann mit 57% mehr Transistoren pro Fläche nach Shrink führt zu ((2*5/6)/1,57)=1,062. Das neue CCD wäre also nur etwa 6% größer. Will man den Verlust an L3 kompensieren, ergänzt man grundsätzlich V-Cache.
Ein Gutteil des Zugewinns von Zen 3 gegenüber Zen 2 kam durch das zusammenführen der CCDs und dem Vergrößern des L3-Caches den ein Kern sieht.
Wenn der L3- Cache halbiert wird, werden die Versionen ohne 3D V-Cache eingebremst.
Ein anderes Problem kann sein, dass dann der Cache auch aktive Regionen überdeckt.
Aber das wird wenn die Abbildungen der Dies korrekt sind, wahrscheinlich schon jetzt blühen.
Nixdorf schrieb:
- Aus der Gerüchteküche heißt es, dass zu Zen6 der Wechsel auf neuere Packaging-Techniken gehört. Mit Silicon-Bridge-Technologien wandern die CCDs näher ans IOD, und auf dem Substrat wird dann Fläche frei.
Es ist ein gut gemachtes Video.
Aber die Optionen Silizium Interposer uind Silizium Brücke hätte er sich sparen können. Nur Fanout, das er als Organic RDL Technology bezeichnet ist, realistisch.
CPUs haben keine Anforderungen an die Bandbreite die den Einsatz von so teuren Technologien wie Silizium Interposer oder Silizium Brücken erfordern. Das hat Sam Naffziger bei seinen Vorträgen über Zen 2 erklärt.
Silizium Brücken sind zwar deutlich billiger als Silizium Interposer. Sie sind aber keine Option für EPYC. Mit Silizium Brücken kann man zwei Dies verbinden die aneinander stoßen. Dies ist bei EPYC mit den vielen CCD rein geometrisch nicht möglich. Für Ryzen wäre es machbar, aber IMO viel zu teuer.
Selbst bei Fanout frage ich mich, warum AMD ausgerechnet bei Zen 6 auf Advanced Packaging wechselt. Hier gibt es eigentlich nur folgende Optionen:
- Durch mehr Dies ist das Routing im Substrat nicht mehr möglich.
- Mehr Dies können nur untergebracht werden, wenn man sie enger zusammen rückt, was mit Substrat nicht möglich ist.
- Es gibt neue Typen von Chiplets, die mehr Bandbreite als CCDs erfordern.
Mir gefällt die 3. Option am besten. Aber sie ist allerdings nur für die EPYC realistisch.
Ein interessanter Twist ist außerdem, dass Trendforce behauptet, dass AMD momentan die Logistik für die Einführung von Glasinterposern abklärt. Die Produktion soll 2025/26 sein.
Dazu 2 Dinge:
- Mit Glasinterposern beschäftigen sich momentan sehr viele. Intel hat hier ein großes Statement gemacht. Glasinterposer haben einige sehr interessante Vorteile. Allerdings habe ich bisher alles nur aus der Sicht von Leuten gesehen, die die Glasinterposer pushen.
- Ich habe jede Menge Patente/-anträge von AMD zu Fanout gesehen, aber noch nichts zu Glasinterposern.
Nixdorf schrieb:
- Das IOD ist derzeit noch auf N6. Ein Shrink auf einen aktuellen Node bringt auch hier mehr Spielraum. Die Frage ist allerdings, inwiefern der durch eine stärkere iGPU und/oder zusätzliche NPU aufgefressen wird. Jedenfalls ist hier fast eine Verdoppelung der Transistordichte möglich.
Sam Naffiziger hat bei seinen Vorträgen zu Zen 2 erklärt, warum AMD den Ansatz mit den Chiplets gewählt hat. Beweggrund war dass die IO-Schaltungen seit 14 nm nur noch sehr wenig skalieren. Deshalb hat AMD alles was von 14 auf 7 nm skaliert in die CCDs gepackt und alles was nicht oder nur sehr wenig skaliert in den IOD gepackt.
Schauen wir Mal kurz in die Vergangenheit
- cIOD
- Zen 2 : 124,9 mm²
- Zen 4 : 127,7 mm²
- Die iGPU hat allen Zugewinn von 14 nm auf N6 mehr als aufgefressen.
- sIOD
- Zen 2 : 416 mm²
- Zen 4 : 397 mm²
- Hier gab es trotz neuer Schaltungen eine kleine Flächenreduktion
Deshalb wird auch ein weiteres Wechseln des Nodes nur einen überschaubaren Flächengewinn bei den IODs bringen.