News AMD Ryzen 7 9800X3D: Versteckter 3D-Cache, freier Multi und Aufpreis zum 7800X3D

Motorrad schrieb:
Ist das jetzt Clickbait oder doch schon Clickbait!?
1. "AMD Ryzen 7 9800X3D: Gerüchte über unter dem CCD liegenden 3D-Cache und freien Multiplikator"
2. "AMD Ryzen 7 9800X3D: Gerüchte über versteckten 3D-Cache und freien Multiplikator"
3. "Du glaubst nicht was AMD mit dem 3d-Cache gemacht hat 😱"

Auf meiner Clickbait-Skala ist die 2. Version da ziemlich nah an der ersten dran und sehr weit von der 3. Version entfernt.

Da CB Geld verdienen muss, sei es erlaubt die Clickbait-Skala auf ein erträgliches Maß nach oben zu rutschen.

PS: Mit genug CB-Pro-Usern wäre da sicherlich mehr Clickbait-Vermeidung drin. Da muss am Ende aber jeder für sich selbst entscheiden wie er seinen Beitrag zum Erhalt von Computerbase leisten möchte.
 
  • Gefällt mir
Reaktionen: Merit, Land_Kind, Obvision und 3 andere
lynx007 schrieb:
Unabhängig davon, macht der 3D V-Cache auch nur bei einem CCD sinn! Denn was macht der v3D Cache. Er verhindert das Daten aus über den weit entfernten IO, aus dem langsamen Ram geholt werden müssen.
Das ist so nicht vollständig richtig. Im Endeffekt puffert der Cache Daten. Das hat nicht zwingend was mit dem RAM zu tun. Das ist auch nicht nur ein Cache für das holen, sondern auch für das Ablegen.

Was noch dazu kommt, es ist keine zusätzliche Stufe wie seinerzeit der L4 Cache bei Broadwell. Sprich die Aussage, es macht nur auf einem CCD Sinn ergibt keinen Sinn, da der X3D Cache lediglich die eh vorhandenen 32MB pro CCD L3 Cache auf Faktor 3 erweitert. Das ist kein Ersatz, sondern einfach nur mehr. Entsprechen "Sinn" ergibt das natürlich überall, weil überall die selben Anforderungen gelten.

Warum AMD das im Consumer Markt primär auf einem CCD macht ist wohl viele her dem Kosten/Nutzen Faktor geschuldet. Denn mehr wie eine primäre Tätigkeit werden die wenigsten mit ihrem PC Zuhause fabrizieren.
lynx007 schrieb:
Wichtig für Gaming, wo es einen Hauptthread gibt, der auf ein einen CCD läuft. Macht also keinen Sinn den auf mehrer zu kleben!
Doch schon, der Cache bringt immer was, wenn Daten über die IF geholt werden müssen, weil er dafür sorgt, dass sie dann lokal verfügbar im CCD sind. Ob das jetzt einen gleich hohen Nutzen hat oder nicht, hängt am Ende vom Anwendungsszenario ab.
Gaming profitiert halt extrem, weil die Art und Weise der Benchmarkmessung dazu beiträgt, dass der Cache stark Punkte bringt. Man will das quasi immer nahezu gleiche möglichst oft pro Sekunde berechnen. Paradebeispiel für Cacheskalierung.
Das heißt aber nicht, dass andere Threads verteilt über mehrere CCDs nicht auch davon profitieren würden, wenn der Cache bei allen CCDs drauf wäre.
lynx007 schrieb:
Die profesionellen alternativen Threadripper wie auch Epic verfügen ja ohnehin über deutlich mehr cache (256-768mb) on die.
Die bestehen halt aus mehr CCDs was folglich zu mehr L3 Cache führt. Allerdings ist die Rechnung "falsch". Sprich das wird technisch nicht addiert. Es bleibt bei 32MB pro CCD. Im großen 128C Zen4 Epyc sind es eben 16x32MB. Der Cache sitzt zwischen RAM bzw. IF und den Cores und federt die Zugriffe über die langsame IF ab. Ein Thread, egal ob jetzt Consumer Ryzen oder TopEnd Epyc kann nur von dem Cache gepuffert werden, der ihm am nächsten liegt. Von den 512MB L3 Cache total des regulären non Huckepack Cache Epyc bleiben auch nur 32MB pro CCD. Mehr Cache wird dort hingegen trotzdem verbaut, weil der Anwendungsmix in so einem Umfeld viel viel größer ist. Wo haufenweise verschiedene Tasks parallel auf dem selben Prozessor laufen, ist auch mehr Kram dabei, was von größeren Caches profitiert. So einen riesen Trümmer kauft man in aller Regel nicht für exakt eine Aufgabe (wie Gaming), bestenfalls noch als Cloud Instanz für Remote Gaming. Dann sinds halt 16x8 Cores mit fixem Pinning der Instanzen pro CCD.

Bei den Zen5c CCDs sind es pro CCD auch 32MB, dafür aber 16 Cores pro CCD und bei 192 Cores in Total damit 384MB pro Sockel.
Packt man jetzt auf die regulären 32MB ähnlich der X3D Ryzen 64MB huckepack oben drauf, ergibt das 96MB pro CCD.
 
Otsy schrieb:
Ob man sich mit einem freien Multiplikator einen Gefallen tun würde? Und wozu überhaupt? In ihrem Feld sind die X3Ds bereits jetzt ohne Konkurrenz.
Mit einem Freien Multiplikator hat mans in der Nachfolgegeneration dann nochmal schwieriger ein Argument zu finden... das ist ja jetzt schon problematisch (9700X) Auch die erhöhte Taktfrequenz ist da zwar in erster Hinsicht gut, aber dann muss Zen 6 non-3D nochmal deutlich drauflegen, damit es hier eine Kaufberechtigung gibt.
Mehr 3D Cache wäre zwar nett, aber ist wohl nicht realistisch.
Am Liebstgen wär mir natürlich, wenn man nächstes Jahr einen 16 Core CCD nachlegt in N3E
 
SKu schrieb:
CPU-OC ist bei modernen CPUs einfach nur noch langweilig.
Wenn es am Ende 5-10% werden für den 9800X3D, vor allem durch den Taktvorteil, reicht das völlig aus.
In der Regel bringt OC immer noch einiges.. allerdings nicht mehr im Singlecore Bereich.. da 200-300mhz sich irgendwo im 2-5% Bereich einpendeln..
Im Multicore Bereich bringt es nach wie vor einiges da wir hier von 8(oder 16) mal 200-300 MHz reden

Wenn ich mir meinen 5950x anschaue macht es schon einen ordentlichen leistungsboost on das Ding 16x 3,7Ghz oder 16x 4.6Ghz läuft
Das waren dann schon Mal knackige 20% Mehrleistung

Die Kerne erreichen alle knapp 4.8ghz einzeln (manche sogar 5.1) man muss in der Regel nur mehr Saft drauf geben und das ganze weg kühlen

Im Falle des 9800x3d macht es einen Unterschied ob er 8 x 5ghz oder 8x5.4+Ghz erreicht.. (ich glaub 5.6 auf einen Kern ist max)
Klar sind zwar nur 200-400mhz mehr.. aber das halt auf 8 Kernen dann.

Auch hat man das Problem das eine Anwendung viel Singelcore Leistung braucht und die Auslastung der anderen Kerne sie aus TDP Gründen daran hindern den entsprechenden Core hochzuboosten

Für Spiele mit wenig Kern Auslastung eventuell uninteressant.. aber je mehr Kerne genutzt werden desto eher wird man das merken
 
Zuletzt bearbeitet:
Darklordx schrieb:
Ich habe noch 382€ für meinen "alten" 7800X3D aus der erste Charge auf Ebay erhalten... Die Teile werden mit Gold aufgewogen. Dabei wollte ich als Sofortkauf "nur" 350€ haben, aber einer bot erstmal nur 1 € und dann ging die wilde Fahrt los. 🤷‍♂️

Bei 449,48€ Neupreis bei Caseking wären 30% dann 314,64€. Also wenn du deinen 7800X3D verschenken willst...
verschenkt wird es nicht, ich habe es für 340.- ca gekauft :) da bin ich einer der wenigen menschen die nur profitieren will. ich hab was davon, der käufer hat was davon und beide sind glücklich
 
  • Gefällt mir
Reaktionen: Darklordx
Rexaris schrieb:
Auf meiner Clickbait-Skala ist die 2. Version da ziemlich nah an der ersten dran und sehr weit von der 3. Version entfernt.

Anzumerken sei zudem, dass Variante eins sprachlich einfach unschön ist, auch wenn es inhaltlich spezifischer ist. Ich kann die Diskussion über den Titel mal wieder nicht nachvollziehen. Das klingt für mich wieder nach einer Meta-Diskussion einiger Nutzer, die bewusst etwas Negatives suchen wollen.
 
  • Gefällt mir
Reaktionen: Mr.House und Rexaris
@stefan92x
Danke. Geht leider etwas in meiner Buble unter. Sprich Zen5 verbesserung ist eigentlich für Epic/Theadripper gedacht? Oder gibt es wirklich einen Ryzen/Ryzenpro Server markt? Entschuldige wen ich so dumm fragen muss.
Bei Intel ist es irgendwie einfach(er). Da ist, war i core consumer, büro.... und workstation/server xeon. Selbst wen der Chip praktisch gesehen mehr ähnlichkeit mit nem i core hatte, als mit nem Xeon ausm Datacenter.
 
Nighteye schrieb:
Bei Zen 5 haben beide CCD,s X3D Anbindung.
Und es gibt nicht wenige Spiele die einen 12 Kerner Voll auslasten.
Star Citizen zum Beispiel.
Die Diskussion hast du doch schon mehrfach geführt? Von den angeblich "vielen" bleibt am Ende primär Star Cititzen über. Und was dann noch dazu kommt, die Last dort kann so hoch sein, wie im von dir verlinkten Video, dass bei 16C/32T >50% Load entstehen und ein 12C/24T Prozessor dann starke Nutzung von SMT machen würde, was letztlich dazu führt, dass der X3D Cache am Ende nur bedingt Punkte bringt - der 12C hat ca. 1/4tel weniger MT Performance ggü. dem 16C. Du gewinnst vielleicht dann dort was von bisschen Latenzreduktion, aber verlierst durch das sharen der physischen Recheneinheiten durch SMT wieder Ausführungsgeschwindigkeit pro Thread. Trifft das den falschen Thread, sinkt die FPS Rate merklich bzw. die Frametimes werden anfangen stark zu tanzen und zu schwanken. In einer FPS Messung mag das alles irgendwo gehen, aber es fühlt sich dann komisch an.
 
  • Gefällt mir
Reaktionen: Kitsune-Senpai und RogueSix
Alesis schrieb:
Also müsste man einen Vergleich machen, in dem ein Teil vom Motor nicht mehr vorne wäre, sondern hinten. Oder ein Teil vom Motor, der mal oben war, jetzt unten ist.
Ein etwas besserer Vergleich wäre also eher, dass man den Kühler vom Heckmotor nicht zwischen Motor und Heckklappe packt, sondern den Kühler in die Fahrzeugfront verlegt, wo dann durch den Fahrtwind die Wärme besser abgeführt werden kann.
 
  • Gefällt mir
Reaktionen: Alesis
digitalfrost schrieb:
Da ist halt das Problem das du nur 6 Kerne pro CCD hast. Der Vcache mag das abfedern können aber für Spiele ist es nicht optimal. Schade das AMD die CPU nicht mit 8+4 Kernen rausbringt.
Ich hatte auch gehofft, dass ein 9900X Tatsache aus einem 8C CCD besteht und zen 5C Core halt zum Support dabei sind. Schade eig, aber dann sehen wir mit Zen6 vermutlich C Core
 
fdsonne schrieb:
Trifft das den falschen Thread, sinkt die FPS Rate merklich bzw. die Frametimes werden anfangen stark zu tanzen und zu schwanken. In einer FPS Messung mag das alles irgendwo gehen, aber es fühlt sich dann komisch an.
Daher würde ich mich Mega über einen 9900X3D VS 9800X3D Test in genau diesem Spiel freuen.
Du bist ja Hardwareluxx Moderator. Kann Luxx diesen Test evtl machen sobald der 9900X3D raus kommt ?
Theoretisch benötigt man dazu ja nur einen 9900X3D oder 9950X3D. Man kann ja dann beliebig viele Kerne abschalten um auf 9900X3D oder 9800X3D Simulation zu kommen.
Ich denke der 9950X3D wäre etwas overkill von den Kernen + MT. 32 Threads sind einfach noch ein Ticken zu viel für dass Spiel. Aber 24T ist auf jeden fall der Sweetspot (zumindest in Hauptstädten)
Und ja da würden mich genau die 0,1% Lows und 1% Lows dazu interessieren.
Also ein richtig Professioneller Test.
Dazu wäre dann halt noch Relevant ob die Moores Law is Death Spekulationen stimmen, und beide CCD,s am X3D angebunden sind.
Star Citizen ist auf jeden fall ein Spiel was Perfekt dafür geeignet ist. Nicht selten sah ich 13900K mit 99% CPU Auslastung.
Aber gibt auch noch ein paar andere Spiele die gut mit mehr als 8 Kernen Skalieren.
Total War Troy
Total War Troy Kernskalierung (2022).jpg


F1 2021
F1 2021 kernskalierung.jpg

Ergänzung ()

Rockstar85 schrieb:
Ich hatte auch gehofft, dass ein 9900X Tatsache aus einem 8C CCD besteht und zen 5C Core halt zum Support dabei sind. Schade eig, aber dann sehen wir mit Zen6 vermutlich C Core
Mit Zen 6 haben wir vermutlich eher 16 Kerne pro CCD.
 
  • Gefällt mir
Reaktionen: Rockstar85 und SVΞN
lynx007 schrieb:
Sprich Zen5 verbesserung ist eigentlich für Epic/Theadripper gedacht? Oder gibt es wirklich einen Ryzen/Ryzenpro Server markt?
Ich gehe mal davon aus, dass deine "Bubble" vor allem Gaming ist. Entsprechend erkläre ich das mal dazu passend: Zen 5 ist ein breiterer Kern, was letztlich bedeutet, dass er mehr Sachen gleichzeitig ausführen kann als Zen 4. Das auffälligste ist die Verdoppelung der AVX-Einheiten, die jetzt 512bit statt 256bit breit sind (und damit AVX512-Befehle mit vollem Takt ausführen können, statt wie Zen 4 zwei Takte pro Operation zu brauchen), aber auch an anderen Stellen hat sich einiges in der Art getan. Das ist gut für Aufgaben, bei denen man viele Daten durchschleusen muss - das kann sowas wie Rendering-Workloads sein, aber auch sowas spezielles wie JSON-Parsing geht mittlerweile mit Unterstützung von AVX-512. Und ja, das sind eher professionelle Anwendungen.

Gaming verhält sich da ganz anders. Der Datendurchsatz durch den Kern ist eher klein, dafür ist oft aber sehr variabel, was passieren muss. Gaming-Workloads sind viel schlechter vorhersagbar und daher viel schlechter parallelisierbar als die genannten Beispiele. Darum zählt da fast nur Takt und Latenzen, aber von dieser besseren Abarbeitung paralleler Operationen profitieren Spiele eben kaum. Und wenn wir jetzt Zen 4 und 5 vergleichen, dann hat sich am Takt kaum was getan und die Latenzen (und RAM-Taktraten) sind durch den IOD stärker beeinflusst als durch den eigentlichen Kern - und da hat AMD von Ryzen 7000 zu 9000 ja den gleichen IOD behalten. Im Server gab es übrigens einen neuen IOD (weil man da auch die Anzahl der CCDs und damit Kerne erhöht hat), im Desktop hat sich AMD den gespart.

Und in der Tat gibt es einen Ryzen-Servermarkt, wobei AMD da vor einigen Monaten die Serie "Epyc 4004" rausgebracht hat - im Prinzip einfach umgelabelte Ryzen 7000, die über die vollen Server-Features verfügen.
lynx007 schrieb:
Bei Intel ist es irgendwie einfach(er). Da ist, war i core consumer, büro.... und workstation/server xeon. Selbst wen der Chip praktisch gesehen mehr ähnlichkeit mit nem i core hatte, als mit nem Xeon ausm Datacenter.
Das macht AMD doch genauso... Ryzen ist für den Desktop, Threadripper Workstation und Epyc ist Server. Gibt da schon gewisse Unterschiede, wie die verschiedenen Silizium-Chips in Produkte umgesetzt werden, aber Intel hat es eher komplizierter als einfacher gemacht.
 
  • Gefällt mir
Reaktionen: dev/random
lynx007 schrieb:
Sprich Zen5 verbesserung ist eigentlich für Epic/Theadripper gedacht? Oder gibt es wirklich einen Ryzen/Ryzenpro Server markt?

Man macht sich die Arbeit in der Entwicklung... Warum sollte man dann die Erkenntnisse nicht auch in beiden Bereichen einfließen lassen? Wäre doch nur unnötige Mehrarbeit, wenn man da unterscheiden würde. Zumal ja die Aufgaben und Ziele die gleichen sind.
Ergänzung ()

mcdexter schrieb:
Wo ist der Vorteil?

Steht im Artikel...
 
MaverickM schrieb:
die bewusst etwas Negatives suchen wollen.
Ich suche hier nichts negatives.

Wenn ich durch eine gezielt formulierte Überschrift in meiner Phantasie angeregt werde und dann wissen will, wie es weitergeht, dann ist das für mich eben Clickbait.

Oder was sollte ich vermuten, wenn mir erzählt wird, daß es vielleicht noch versteckte Optionen bei einem Gerät zu finden gibt.
Der Gebrauch von dem Wort "versteckt" macht neugierig und ich sehe das in keinerlei Hinsicht als möglichen Ersatz für z.B. eine Bezeichnung "umpositioniert" oder "umgestaltet". Der Hersteller hat nichts versteckt, wenn er das Layout des Chips ändert.
 
@MaverickM
Der hintergrund ist mir schon klar. Ich wollte nur noch bestätigt haben das die verbesserung primär für ein anderes Segement gedacht waren.
Leider wird halt oft sehr stark der Fokus immer nur auf ein Feld gelegt. In dem Fall Gaming. Das der Zen5 durchaus auch notwenidge und gute verbesserunge hat ist halt kaum behandelt worden.
 
Zurück
Oben