News 3D V-Cache Technology: AMD stapelt L3-Cache bei Ryzen auf 192 MByte

Was ich auch noch nicht so ganz verstehe ist, wie AMD in 7nm über der Fläche von 32mb L3 Cache des CCDs (ebenfalls 7nm) 64mb Cache unterbringen....

Sind das in Wirklichkeit sogar zwei Cache Dies oder haben die die Dichte der 7nm Fertigung mal eben verdoppelt. Haben die was dazu gesagt oder verlautbaren lassen was ich verpasst hab@Volker?
 
  • Gefällt mir
Reaktionen: TheCrazyIvan, Fritzler, Maggolos und eine weitere Person
Ja siehe Update, das sind vermutlich zwei 32er. Deshalb ja quasi die exakte Übereinstimmung bei der Fläche. Bei gleicher Fertigung das zu verdoppeln ist unmöglich. Offiziell haben sie es aber nicht gesagt, das dürfte alles später zum Launch folgen.
 
  • Gefällt mir
Reaktionen: Maggolos, Colindo und Baal Netbeck
Ich kenne eigentlich keine Finger von Fotos besser, als die von Dr. Lisa Sue :)
Die da fast immer irgendwas cooles darin hält...

Aber ich frage mich seit einer Weile, was immer mehr Cache bei Ryzen generell bringt.
Nicht, das weniger besser wäre oder so.

Nur der Vergleich der Ryzen CPUs untereinander. Da bringen z.b Ryzen 4650g mit viel weniger Cache auf der CPU ähnliche / gleiche Leistungen wie z.b ein R5 3600, mit eben weit mehr CPU Cache, bei gleicher Kernanzahl.

Beim Ryzen 4750g auch, der eben in etwa dem R7 3700x entspricht von der Leistung her, aber eben deutlich weniger Cache hat. Auch beim R3 3100/3300x ist das mit weniger CPU Cache kaum wirklich anders.

Wo bringt denn deutlich mehr Cache auf der gleichen CPU Architektur massive Vorteile?
 
Revan1710 schrieb:
Ich rede ja auch nicht davon, dass sie ihre CPUs billger verkaufen sondern ihr Portfolio erweitern - die Produkpalette ist ja auch erstmalig mit Zen3 so überschaubar.

Wenn sich nun der Refresh auch auf die Top-Modelle begrenzt und alles mit Budget < 250 € weiterhin Zen2 kaufen soll, wandern viele Kunden gezwungenermaßen zu Intel. Wie das AMD deiner Meinung nach weiterhelfen, soll ist mir schleierhaft

Wenn TSMC nur eine Menge A an DIEs liefern kann, wieso sollte AMD, deren Silizium Kreise um Intel dreht, die nochmal günstiger anbieten?
Sie würden mit niedrigeren Preisen nicht einen einzigen DIE mehr verkaufen.
Mehr als 100% der gelieferten Menge kann man nicht verkaufen.

Hätte auch lieber auch günstige AMD Produkte, aber fehlende Konkurrenz und Menge die TSMC liefern kann sprichen kaufmännisch dagegen.
 
  • Gefällt mir
Reaktionen: TheCrazyIvan, ETI1120, Winder und eine weitere Person
Ja die Wafer-Frage ergibt sich natürlich, auch wie das dann letzlich gestacked ist und wer das übernimmt. AMD sagt nicht umsonst nur das High-End bekommt es zu Beginn .. mehr wird nicht drin sein bei der aktuellen Liefersituation am Markt.

36 mm² pro so einem Chip. Ist nur die Frage ob jede Lage extra gefertigt wird!? Bei 2 CCD pro Ryzen 5000 wären das dann schon vier Chips mit je 36 mm² und damit quasi die gleiche Fläche nochmal, die sie komplett ohne diesen Zusatz nur für die beiden CCDs brauchen. Klar kosten die Caches weniger, die Durchlaufzeit wäre vermutlich auch geringer, es ist nur SRAM-Stuff; aber Wafer-Platz ist Wafer-Platz.

Also steht natürlich am Ende auch fest das es nur teurer werden kann. Und auch nicht nur 50 Euro, sondern deutlich mehr.
 
  • Gefällt mir
Reaktionen: Zwiebelsoße, Floppes, konkretor und 2 andere
so_oder_so schrieb:
AMD hat doch gesagt, dass es keine IPC Improvements oder sowas geben wird mitm dem Refresh.

Woher kommen jetzt wieder diese 5% Gerüchte?! Ebenso der höhere Takt. Davon war nie die Rede.
Woher weißt du, dass der Refresh überhaupt kommt und woher weißt du, dass Zen 3+ nicht existiert, im Moment sind alles Gerüchte. Zen 3+ ist anscheinend gecancelt (zumindest für nicht-APUs), aber trotzdem sollte Zen 3+ ursprünglich 4-7% mehr IPC bringen. Deswegen habe ich ja auch "vielleicht wird es ja aber doch Zen 3+ geben" geschrieben und nicht, dass es Warhol zu 100% geben wird, einfach richtig lesen. 4-7% mehr IPC und leicht höhere Taktraten waren das Gerücht über Warhol, ich weiß auch, dass der Zen 3 Refresh (also nicht Zen 3+) per se keine Leistungssprünge bringen wird. Bis jetzt wusste ja auch keiner von dem Extra-Cache.

Die Möglichkeiten für die erste Architektur mit mehr Cache sind im Moment:
  • Zen 3 Refresh mit mehr Cache, gleicher IPC und gleichem Takt
  • Zen 3 Refresh mit mehr Cache, gleicher IPC und 100-200MHz höherem Takt (ähnlich Ryzen 3000XT bloß mit mehr Cache)
  • Zen 3+ mit mehr Cache, 4-7% mehr IPC und höherem Takt
  • Zen 4 mit mehr Cache, deutlich mehr IPC und eventuell höherem Takt

darauf können wir uns glaube ich einigen. Und darauf, dass Zen 4 sicher diesen Extra-Cache unterstützen wird und das mit 15-25% mehr IPC als Zen 3 wahrscheinlich in ziemlich viel Mehrleistung resultieren wird. Hoffe wir sehen den Cache schon Ende des Jahres vor Alder-Lake, entweder als Zen 3 Refresh oder eben als Zen 3+. Ein 5600XT, 5650X oder 6600X wäre für 1080p für die meisten E-Sportsspieler ein absoluter Traum. (CSGO ich komme)
 
Wenn die normierten 15% mehr Leistung hinkommen ist AMD bis Zen 4 hervorragend aufgestellt, das waren früher drei Intel Generationen :evillol:

Mal sehen ob das auch bei Zen 4 dann so gemacht wird. Mal sehen wie sich Alder Lake gegen diese "Zen3+" CPUs schlägt. Dürfte auch nochmal eine Ehrenrunde für AM4 sein.
 
  • Gefällt mir
Reaktionen: Gringoli
AMD haut einen nach dem anderen raus.

Volker schrieb:
bei Genoa mit 96 Kernen würde man intern + maximal extern auf 3456 MByte L3-Cache kommen. Das ist schon WTF.

Das sollen die mal machen.
Da gibt es sicher genügend Usecases dafür.


Da kommt Intel die nächsten 5 Jahre nicht ran.

Bei so fetten CPUs lohnt es sich auch, da die ohnehin teuer sind, pro Kern mit wenig Energie laufen (leicht zu kühlen, effizienter durch mehr Cache) und man evtl. auch Geld für Lizenzen sparen kann, wenn man so etwas einsetzt.

Alleine die Zahlen.... 96Kerne, 3456MB L3 Cache in einem Sockel. :D

Mehr als "WTF" fällt mir dafür auch nicht ein.
 
@Volker
Für Zen 4 ist das zu früh, dass dürfte der Zen 3 Refresh sein, mit dem so bisher jedoch keiner gerechnet hatte.
Da ist ein s zu viel reingerutscht.
Für die Gamer sind das großartige Nachrichten, AMD hält somit den Druck hoch.
Bin gespannt auf die Preise der CPUs, denn eigentlich dürfte der Cache nicht ganz billig sein.
 
Ohne die Kommentare gelesen zu haben...

Eine APU mit RDNA2 iGPU könnte den L3 Cache ja auch als Infinity Cache verwenden und dabei die magere Bandbreite von DDR4/5 verbessern.

16 MB wären erstmal 32 MB und später wohl sogar 128 MB? Um Himmels willen!
 
@Shoryuken94
Also befehlsatzerweiterungen sind aber auch nicht immer der heilige gral. Weil wenn die software nicht alle befehlsätze unterstüzt oder sie nur moderat nutzt dann ist auch da der vorteil dahin.
Ich habe solche software die von so wenig davon profitiert das ea kaum der rede wert ist. Also es kommt dann am ende auf was anderes dann an. Wenn schon man von sowas nicht profitiert wie avx und so wird es halt in Zukunft wohl leider nicht mehr besser werden. Was wäre also dann in dem fall dann goldrichtig?
 
Deinorius schrieb:
Eine APU mit RDNA2 iGPU könnte den L3 Cache ja auch als Infinity Cache verwenden und dabei die magere Bandbreite von DDR4/5 verbessern.

Macht wahrscheinlich wenig Sinn.

Die Leute wollen kein Geld für APUs ausgeben und auch mit massig Cache wird aus einem Grafik-Sparbrötchen keine Rennmaschine.

Eigener Grafikspeicher mit HBM würde sich dafür eher anbieten.
Aber auch das ist zu teuer.
 
drunk_chipmunk schrieb:
Du Jungspund. ;) Wenn es so weitergeht, muss ich bald damit klarkommen, dass selbst die CPU-Caches größer sind als die Festplatte in meinem ersten PC.
Du Jungspund!
Meine erste Festplatte hatte 20MB.
Mein jetziger 5800 hat 32MB cache…. 😀
 
  • Gefällt mir
Reaktionen: Deinorius, Coeckchen, LinuxTux und 3 andere
piccolo85 schrieb:
Evtl. taktet es noch nicht hoch genug, oder die Ausbeute ist zu gering, wenn man für den Vergleich auf 4GHz normieren muss...
IPC Vergleiche wurden auch bei Zen3 vs Zen2 mit 4GHz gemacht
 
@Colindo
Zu deiner frage freilich habe ich das auch direkt auf die ssd kopiert und dann von ssd auf die ssd umgewandelt. Das ergebnis war das selbe, es gab keine veränderung bei der Geschwindigkeit. Hätte es also eine gegeben dann würde ich dies ja sehen. Wo ich es getestet hatte war es noch ne sata ssd gewesen. Und bezweifle das wenn es schon zwischen sata ssd und hdd keinen unterschied gibt, es auch dann bei pci express ssed nvme ebenso keine geben wird. Ich schrieb ja habe alles ausprobiert, wie alle befehlsätze im programm abgeschaltet mit und ohne smt und auch bei intel mit und ohne ht. Mit und ohne oc. Auch ram in unterschiedlicher Geschwindigkeit. Sogar schon damals als ich nen i9 system mit seinen 18 kernen noch quadchannel gehabt hatte.
Da dachte ich ok sind ja 4 riegel darum egal welche Geschwindigkeit. Da wusste ich nicht das die 2133 mhz egal sind. Ich habe halt ne software wo es von ram nicht profitiert weil lieber die cpu ihr am liebsten ist. Das gilt also auch auf der festplatte. Mir rechnete einer sogar aus das ich nicht mal die hdd voll auslasten würde weil ja am ende 5 mbit/s meine Aufnamen als Bitrate haben würden. Ich wollte es nixht glauben aber es ist leider wahr. Und egal was ich mache, ich erhalte keinen Boost mehr beim umwandeln. Stelle ich alles auf total niedrig, alle befehlsätze auf aus und so dann erhalte ich 60 % an Geschwindigkeit. Nur die videos sehen dann so aus als ob sie aus ner alten Vhs Kassette kommen würden. Augenkrebs bekommt man dann gratis dazu. Der Abstand wird also mit zunehmender Generation immer geringer werden. Bis es dann kein effekt mehr hat. Das einzige was mich da noch retten wird ist da Ipc. Wenn schon der vergleich mit mehr kernen mir ebenso nichts bringt. Der 5950x ist auf dem level eines threadripper 3960x angekommen. Die sind wirklich bei mir auf dem selben level. Würde ich beim 3960x also smt nicht abgeschaltet würde wohl der 5950x dem davon ziehen. Ich dachte früher noch es ist nichts zu ersetzen als immer noch mehr kerne zu haben. Das diese dann bremsen oder langsamer werden können bekam ich als ich wirklich mehrere unterschiedliche cpu getestet haben durfte zu spüren.
Und die Ipc steigerung wird sich wohl bei 2 programmen gleichzeitig auch sich aufteilen. Oder kann man da noch immer von ipc vorteile schreiben bzw rechnen.

Also bei 1 x gleichzeitig habe ich trotz ipc steigerung null mehr leistung weil alle hängen da auf ein bestimmtes level fest. Merke ich ja selbst ob 8,12,16 oder mehr die leistung ändert sich nicht mehr und auch egal welche Generation. Ich musste also die anzahl gleichzeitiger erhöhen um unterschiede festzustellen.

Mein traum war es damals ein video bei cpu in nur 30 sekunden umzuwandeln. Der traum hat sich nie erfüllen lassen unter normaler bedingung. Ich habe es dann aufgegeben weil es zu unrealistisch ist. Also das mit den 30 sekunden bezog sich auf ner ganzen folge oder film. Und nicht mit der gpu sondern cpu only.
Und nachdem auch takt nicht das ergebnis geführt hatte was ich gedacht hatte weil sonst würde ich jede cpu auf 5 ghz hoch jubeln. Da dies ja nicht so ist, habe ich den takt auf standard gelassen. Pro takt leistung ist auch nicht mehr so wie früher wo 100 mhz gleich 5 % oder sowas gebracht hatte.

Ich merke schon das ich schon mehrmals auf den boden der tatsache gebracht wurde. Denn sonst würde ich immer noch heftigere vorstellung wie doppelte leistung weil 100 % mehr leistung durch nen upgrader gleicher anzahl an kernen. Mir ist klar das 100 % mehrleistung auch in zukunft nicht möglich sein wird. Und am ende muss es sich ja auch lohnen. Ich dachte auch das ich so 75 000 aufnahmen noch zum umwandeln hätte aber sich am ende als nur 20 000 aufnahmen herausgestellt hatte. Und das kann man in rund 2 jahren wenn man will schon schaffen ist also garnicht mal so viel. Wenn fertig langweilt sich dann der 5950x zu tode mit nur only games. Und auch das mit immer mehr videos gleichzeitig umzuwandeln das schaffe ich nicht. Hier limitiere ich selbst und nicht die cpu oder das system. Es wird also immer grenzen geben. Manches lässt sich auch mit roher leistung auch nicht mehr bewältigen egal wie sehr man es auch haben will.
 
  • Gefällt mir
Reaktionen: Colindo
Artikel-Update: AMD hat im Nachgang am Abend Fragen zur der 3D-Technologie beantwortet, die überraschende Erkenntnisse hervor brachten. Demnach ist der gestapelte L3-Cache ein nativer 64-MByte-Chip. Er fungiert als direkte Erweiterung des bestehenden L3-Caches im CCD, was keine Software-Anpassungen nötig macht, da er ohne Kontrollfunktionen und für alle der für die grundlegende Funktionalität benötigten Einheiten daherkommen kann. Da diese bereits vorhanden sind, kann AMD quasi 64 MByte reinen SRAM auf dem gleichen Raum wie zuvor 32 MByte unterbringen. Zen 3 war bereits von Vornherein für diese Möglichkeit vorbereitet, die Entwicklung und Umsetzung mit Partner TSMC nahm mehrere Jahre in Anspruch, erklärte AMD.

Leistungsaufnahme, Wärme und Latenzen sind wichtige Fragen, doch alle will AMD gelöst haben. Die Leistungsaufnahme soll extrem gering sein. Da der 3D V-Cache über den bisherigen L3-Cache gesetzt wird und dieser nicht der Hotspot der CPU ist, sollen thermische Probleme nicht auftreten. Dabei hilft aber auch effektives Powergating, nur aktive Teile nutzen auch Energie. Die Frage der Latenzen erklärt AMD knapp: Aus 2D wird 3D. Um von Punkt A nach B zu gelangen muss die Abfrage nicht den ganzen Cache durchlaufen, sondern kürzt über TSV in der 3. Dimension ab. So entsteht nahezu keine Strafzeit, in Tests soll diese quasi nicht einmal merkbar sein.

Um den zusätzlichen L3-Cache auf dem CCD unterzubringen, ohne die Höhe zu verändern, werden die CCDs der betreffenden Prozessoren in Zukunft dünner, um am Ende mit gestapeltem Zusatz-Cache wieder genau so hoch zu sein wie der I/O-Die und um letztlich unter den Heatspreader zu passen. AMD bestätigte noch einmal, dass es sich beim ersten Produkt um Zen-3-Prozessoren in 7-nm-Fertigung handeln wird, die als High-End-Ryzen auf den Markt kommen. Produktionsstart ist Ende des Jahres.

Zukünftige Produkte schloss AMD natürlich nicht aus, ohne jedoch welche zu nennen. APUs stehen dabei neben Server-Prozessoren hoch im Kurs. AMD erklärte aber, dass Cache kein Allheilmittel für alles sei. DRAM wird man damit nicht ersetzen können, der Cache helfe jedoch in gewissen Szenarien.
 
  • Gefällt mir
Reaktionen: Deinorius, Baal Netbeck, Recharging und 37 andere
Interessantes Konzept und mehr Cache ist mehr besser. Für mich sieht das etwas nach einer Techdemo auf 7nm für die kommende Generation an. Mit einem Shrink auf 5nm würden die 64MB dann auf die 36mm^2 passen und der Produktionsstart! würde für Zen4 passen.
 
Zwiebelsoße schrieb:
@Volker

Da ist ein s zu viel reingerutscht.
Ich hatte den ersten Kommentar gesehen, das "s" gelöscht, und Volker hat dann auch den Kommentar gesehen, und wieder ein "s" reingesetzt. Jetzt stimmt es wieder.
Ergänzung ()

Leo.16 schrieb:
Interessantes Konzept und mehr Cache ist mehr besser. Für mich sieht das etwas nach einer Techdemo auf 7nm für die kommende Generation an. Mit einem Shrink auf 5nm würden die 64MB dann auf die 36mm^2 passen und der Produktionsstart! würde für Zen4 passen.
Noch nicht das Update gelesen? Es ist bereits ein Chip für 64 MiB
 
  • Gefällt mir
Reaktionen: evilhunter und Leo.16
Colindo schrieb:
Noch nicht das Update gelesen? Es ist bereits ein Chip für 64 MiB
Kam, als ich am Tippen war...
Naja, AMD überrascht mich immer wieder
 
  • Gefällt mir
Reaktionen: SVΞN, Floppes, evilhunter und eine weitere Person
Mich hat es auch überrascht. Da sieht man mal, wie präzise AMD ihre Innovationen durchdenkt, dass sie jetzt den maximalen Vorteil aus einem weiteren Chiplet ziehen. Gleichzeitig wird auch die Höhe der Chiplets verringert, damit alles sauber unter den Heatspreader passt. Einfach extrem gut durchdacht, das Ganze.
 
  • Gefällt mir
Reaktionen: dohderbert, Hatch, jemandanders und 9 andere
Zurück
Oben