LamaMitHut
Commander
- Registriert
- Nov. 2013
- Beiträge
- 2.972
@stefan92x genau an den Chip habe ich gedacht. Könnte man nicht im den L1 vergrößern, um das auszugleichen?
Folge dem Video um zu sehen, wie unsere Website als Web-App auf dem Startbildschirm installiert werden kann.
Anmerkung: Diese Funktion ist in einigen Browsern möglicherweise nicht verfügbar.
Wenn AMD Zen 6/7 in N3P bzw. 2nm herstellt, darunter dann 1-2 dünne Wafer mit 64 MB SRAM in 4nm Technik.stefan92x schrieb:@SaschaHa das sind alles gute Ausführungen, denen ich auch so zustimmen würde. Du bist allerdings auf eine Option nicht eingegangen: 3D-Cache. Es gibt nunmal Anwendungen, die enorm von Cache profitieren, andere hingegen weniger (erst recht, wenn der IF schneller/IOD besser wird).
Da wir bei Zen 5 praktisch keinen Nachteil mehr durch den 3D-Cache haben, sondern nur noch Vorteile, kann ich mir gut vorstellen, dass AMD da einfach auch stärker drauf setzen könnte. Also CCD mit begrenzt großem Cache in N3P, aber Option auf deutlich mehr Cache (in günstigerem Node) für die, die es brauchen.
Zen 5 hat aber 4nm, der Umstieg auf 3nm bringt zusätzlich was.ETI1120 schrieb:N3P bringt im Vergleich zu N3E 5 % mehr Performance bei gleicher Power oder 5 bis 10 % weniger Power bei gleicher Performance. Und zusätzlich ca. 4 % höhere Dichte.
AMD hat seit der PS4 Kombinationen aus 4* Jaguar-Core und shared L2 à 2 MB bis 2,1 GHz im Verkauf.ETI1120 schrieb:Privater L2, geteilter L3 hat sich bewährt. Was sollte der Grund sein dies zu ändern?
https://www.computerbase.de/news/pr...hots-zeigen-ueberraschende-aenderungen.89869/ETI1120 schrieb:Wenn AMD in der Lage sein sollte bei Zen 6 den L3 Cache komplett auf einen anderen Die zu verschieben, wieso nur den L3 Cache verschieben?
Stimmt, ist aber ja eine völlig andere Architektur. Und deshalb widerspricht diese Idee diesem Wunsch:RKCPU schrieb:AMD hat seit der PS4 Kombinationen aus 4* Jaguar-Core und shared L2 à 2 MB bis 2,1 GHz im Verkauf.
Unterschiedliche Cache-Architekturen innerhalb einer Generation sind nämlich eben nicht simple.RKCPU schrieb:Keep it simple...
Unter 'AMDs „Medusa“-Reihe von Client-CPUs überspringt RDNA 4 für RDNA 5 iGPUs'stefan92x schrieb:(4* Jaguar-Core )
Stimmt, ist aber ja eine völlig andere Architektur. Und deshalb widerspricht diese Idee diesem Wunsch: Keep it simple
Wenn AMD den Aufbau eines CCD auf mehrere Wafer verteilen kann, ist den Kern + L2 auf einem Wafer zu behalten und dann mehrere Wafer mit L3 Cache darunter zu verteilen nur eine Option.RKCPU schrieb:Wenn AMD Zen 6/7 in N3P bzw. 2nm herstellt, darunter dann 1-2 dünne Wafer mit 64 MB SRAM in 4nm Technik.
Zu thin X3D: youtube 'ZEN 5 has a 3D V-Cache Secret'
Oben sitzen dann 8* Zen 6 plus 4* Zen 6c und später 8* Zen 7 plus 8* Zen 7c,
Letzterer vielleicht in 2* 4 Zen 7c mit shared L2 4MB plus beim Zen 7 dann 2 MB L2 je Core und das 2-fach.
Es ist die Frage was N4P beim IOD tatsächlich bringt. Es hängt ganz davon ab wie der uncore der GPU skaliert.RKCPU schrieb:4nm wird auch beim I/O Chip (Mitte 2025 ?) selbst für Zen5 interessant, erhöht die mögliche DRAM-Anbindung.
Krackan Point ist wie Strix Point ein Mobilchip. Anbetracht von 16 PCIe anstatt 28 PCIe Lanes stellt sich mir die Frage wie sinnvoll diese APUs für AM5 tatsächlich sind.RKCPU schrieb:Möglicherweise ähnlich zu Krackan Point, also mit 8* CU und AI Funktionen.
Mitte 2025 ein 9700G mit Oktacore - Zen 5, RDNA 3,5 GPU und AI wäre eine interessante Ergänzung im Desktop, oder?
Du hast die dense Kerne erwähnt und im übrigen meine Frage, was ihr volles Potential sein soll, nicht beantwortet.RKCPU schrieb:Zen 5 hat aber 4nm, der Umstieg auf 3nm bringt zusätzlich was.
Das wird aber schwierig, wenn man die aktuelle Kommunikation von TSMC zu N2 ansieht: HVM in der zweiten Jahreshälfte 2025. Das wäre zu spät für das IPhone 17.RKCPU schrieb:Apple nutzt noch N3E, steigt aber Mitte 2025 auf 2nm um.
Die low power Kerne hat AMD schon 2015 eingestellt. Noch bevor Zen draußen war.RKCPU schrieb:AMD hat seit der PS4 Kombinationen aus 4* Jaguar-Core und shared L2 à 2 MB bis 2,1 GHz im Verkauf.
Das Problem bei den Desktop Ryzen ist komplexer. Die dense Cores auf dem CCD mit ansonsten gleicher Architektur und Firmware würden praktisch nichts daran ändern.RKCPU schrieb:Bei Desktop-Client und Notebook diesen die 'c' Cores aber nur der sparsamen Versorgung mit Rechenpower nahe IDLE, ansonsten übernehmen die big Cores.
Oder frei nach Einstein, so einfach wie möglich aber eben nicht noch einfacher.RKCPU schrieb:Keep it simple...
@stefan92x hat den kritischen Punkt genannt: Man kann einen Cache nicht beliebig vergrößern, ohne die Zugriffszeit zu verschlechtern. Deshalb ist der Cache mehrstufig und als als Pyramide konzipiert.RKCPU schrieb:Der L3 nimmt viel mehr Fläche ein als der L2, selbst aufgebohrt auf 1,5 MB je Core - wenn AMD es so angeht.
Weißt Du wie groß die Zen 6 Kerne werden?RKCPU schrieb:Da würden selbst 96 MB L3 in 4nm noch unter ein Chiplet in 3nm mit 8* Zen 6 plus 4* Zen 6c geometrisch passen.
Neither of these paired nodes contain the full set of optimized devices required for a new process node, but they do so as a pair. This approach enables an “advanced” version of the process pair to include (e.g., principally or exclusively) logic transistors that are manufactured in isolation and optimized purely to improve the performance and power efficiency of logic without the compromises needed to support devices and/or feature sets of the integrated circuit (e.g., static random access memory (SRAM) and analog devices) that would compromise performance of the logic transistors. The SRAM and analog devices, plus less optimized logic devices, can be implemented (e.g., principally or exclusively) in a “pair” technology node that is also manufactured in isolation and then 3D bonded to the advanced node. The combination of the advanced and pair node in a 3D hybrid bonded configuration can deliver a much higher performing, more efficient (e.g., for logic which is the most important contributor to technology node gains), and fully functional (e.g., SRAM and analog) technology node for a SoC design.
[0031] Benefits obtained from the above results can include avoiding the manufacturing compromises required to balance a process optimization window delivering the full suite of analog, SRAM, and logic devices in an advanced technology node. The advanced node can focus (e.g., principally or exclusively) on optimizing the logic devices.
These logic devices are the most important contributors to performance and performance/Watt. Additionally, the combination of the node pairs can provide a denser, higher performance, and more power efficient technology than a one-size-fits-all technology node with all devices in a single FEOL.
Wie schon oben erwähnt für LP Kerne könnte diese Konfiguration einen Sinn ergeben, aber nicht für die General Purpose Kerne.stefan92x schrieb:Stimmt, ist aber ja eine völlig andere Architektur. Und deshalb widerspricht diese Idee diesem Wunsch:
Genau.stefan92x schrieb:Unterschiedliche Cache-Architekturen innerhalb einer Generation sind nämlich eben nicht simple.
Ich habe von AMD noch nichts dazu gehört.RKCPU schrieb:Unter 'AMDs „Medusa“-Reihe von Client-CPUs überspringt RDNA 4 für RDNA 5 iGPUs'
Ich bin davon überzeugt die Ingenieure von AMD finden Antworten. Fallen diese Antworten so aus, wie Du es Dir vorstellst?RKCPU schrieb:Die Fertigung wird immer teurer je mm² da sind Einsparungen immer zu betrachten.
Hallo ETI1120,ETI1120 schrieb:Ich bin davon überzeugt die Ingenieure von AMD finden Antworten.
Fallen diese Antworten so aus, wie Du es Dir vorstellst?
AMD fehlt eine (große) AI Unit in der Chiplet - Produktreihe.ETI1120 schrieb:Es ist die Frage was N4P beim IOD tatsächlich bringt.
Dass Hybrid Bonding die Zukunft ist, ist schon sehr lange klar. Das hat z. B. Sam Naffziger in seinem Vortrag bei der DAC im November 2021 unmissverständlich klar gemacht.RKCPU schrieb:Unter youtube 'ZEN 5 has a 3D V-Cache Secret' mit Hybrid Bonding und neu vor 2 Wochen 'Why Hybrid Bonding is the Future of Packaging' mit thinned 3D Cache unten.
Wir sind doch längst darüber hinaus wie es die MI300 zeigt.RKCPU schrieb:Es müsste für AMD also nicht bei einem 3D SRAM Chip enden.
Wenn AMD die Anzahl der Kerne bei EPYC weiter erhöhen will, wird dies mit CCDs mit 8 Kernen immer aufwändiger. Hier sehe ich den Druck die Anzahl der Kerne je CCD zu erhöhen. Nicht bei den Ryzen.RKCPU schrieb:Ein 'klassisches' 8* Zen 6 Chiplet und bei X3D gestapelt mit 96 MB L3,
der baugleich zu EPIC unter 16 Core Zen 6, wäre wohl die beste Synergie für beide Zielgruppen.
Fehlt der wirklich?RKCPU schrieb:AMD fehlt eine (große) AI Unit in der Chiplet - Produktreihe.
Die beiden CUs sind nur vorhanden, damit der Rest der GPU, d.h Bildausgabe und Decoder, funktioniert.RKCPU schrieb:Zudem sind 2* CU RDNA 2 veraltet, 4* CU RDNA 3.5 gibt's bereits beim Ryzen 8500G:
Es ist auf alle Fälle ein neues IOD fällig, wenn AMD auf Advanced Packaging wechselt.RKCPU schrieb:Der 'alte' 6nm I/O wäre dann noch für ?700, ?800X3D und ?900X3D und ?950X3D interessant.
ggf. reicht es dann für AI viele CPU-Power ?!
David McAfee hat sich ziemlich zurückhaltend bzw. eher ablehnend zu dense Kernen im Desktop geäußert.RKCPU schrieb:AM5 hat mit 128 Bit DDR5 Limits, da ist 8* Zen * plus 4* Zen *c und Budget DRAMs vernünftiges Limit.
Die Frage ist, welche Bandbreite das Speicherinterface zum Hauptspeicher haben müsste, damit eine Non-X3D CPUs dieselbe Game-Performance erreicht, wie die entsprechende X3D Variante.RKCPU schrieb:Bei Games kompensiert ja der X3D die begrenzte Bandbreite gut, egal ob DDR4 auf AM4 oder eben DDR5 auf AM5.