Chismon schrieb:
Wenn ich an die Treiber-/Stabilitäts-Probleme der RX 5700XT denke, dann war RDNA 1 leider auch alles andere als perfekt, aber sicherlich war die Halbgeneration ordentlich;
Ich habe extra auf die Einschränkung mit den Treibern verzichtet, weil ich die Hardware hervorheben wollte.
Die Treiber und Software bei AMD sind eine eigene Geschichte. Für RDNA musste AMD den Treiber umstellen und zu dieser Zeit hatte AMD deutlich weniger Softwareentwickler als aktuell. Also haben sie es nicht rechtzeitig geschafft alle Ecken und Kanten rauszunehmen. Und wer auf eine Kante getroffen ist, ...
Ich habe in meiner Kiste eine RX 5500 XT drin. Ich habe sie ziemlich schnell nach dem Release gekauft. Ich war angenehm überrascht wie problemlos das mit den Linuxtreibern lief.
Aber es gehört zur Realität, dass es bei AMD ein bisschen mehr hakt und dass Nvidia mehr Softwarefeatures hat.
Wobei das mit dem Haken nicht immer nur an AMD liegt. Die PC-Games werden nun Mal bevorzugt mit Nvidia-Karten entwickelt und getestet. Und das hat eben Auswirkungen.
Außerdem ist es doch so, dass bei Problemen immer zuerst der AMD-Komponente im System die Schuld gegeben wird.
Chismon schrieb:
RDNA 2 war in der Tat eine sehr gut ausgeführte Grafikkartengeneration, auch wenn etwa die RX 6400 und RX 6500XT nicht das Gelbe vom Ei waren, aber das war wohl auch der dGPU Preisexplosion durch den Kryptominingbooms geschuldet.
Das wäre eine passable Entschuldigung. Würde aber zeitlich in den ersten Boom fallen.
Ich kann Begründung von AMD nicht nachvollziehen, dass Navi 24 als Tandem zu Rembrandt konzipiert war. Es war von vorne herein klar, dass es sehr schwer werden wird AMD-Mobil-GPUs bei den Notebookherstellern zu platzieren. Und einen Chip für diese fragliche Anwendung so zu verstümmeln, dass er als GPU auf einer Grafikkarte nur noch ein schlechter Kompromiss ist, ...
Chismon schrieb:
Die Hintergründe sind nicht bekannt und ja, es ist pure Spekulation, die Deinen Ausführungen nach mehr Unfähigkeit seitens AMD/RTG nahelegt als Kompetenz.
AMD/RTG wäre inkompetent, wenn sie beabsichtigt hätten, dass Navi 33 nur 2 % schneller als Navi 23 ist.
Es gibt ausreichend Fakten die Aufzeigen dass RDNA 3 nicht die Erwartungen erfüllt hat, die AMD an RDNA 3 hatte. Also ist klar dass etwas schief gelaufen ist. Shit happens.
Die Spekulation ist nun was genau verursacht, dass RDNA 3 die Taktziele nicht oder nur mit zu hoher Spannung erreicht. Das wird AMD nie rauslassen.
Die zweite Spekulation (meine) ist, dass der Fehler bereits im RTL-Code liegt und nicht im Chip-Design. Es sind alle 4 Chipdesigns von RDNA 3 (Navi 31, Navi 32, Navi 33, Phoenix) betroffen.
Die Chipdesigns haben 3 verschiedene Prozesse und sind auf 2 Nodes. Ich halte da eine gemeinsame Ursache (RTL-Code) für wahrscheinlicher. Natürlich kenne ich als Laie und Außenstehender die Vorgänge nicht, ...
Die dritte Spekulation (meine) ist nun, dass das seltsame Line Up von RDNA 4 nicht die Folge eines weiteren Problems ist, sondern darauf beruht, dass die Fehler von RDNA 3 ursprünglich auch bei RDNA 4 aufgetreten sind. Und ich (Laie) halte die Weiterverwendung von RTL-Code für eine Möglichkeit.
Chismon schrieb:
Das kann sein, dass man RDNA 4 zu einer Notlösung zusammen gestrichen hat, aber dann wäre das für eine PS 5 Pro Konsole (als mutmasslichem Mix aus RDNA 3.5 und 4) evt. auch fragwürdig, auch wenn man natürlich entgegnen kann, dass Konsolen technisch weniger relevant und fordernd sind und es deswegen passt.
Die Konsolen-APUs werden von anderen Teams als die Gaming GPUs entwickelt. Die Konsolen haben andere Zyklen als die Gaming GPUs. Und so wie es verstehe verwenden sie nicht exakt dieselbe IP wie die Gaming GPUs.
RDNA 3.5 enthält offensichtlich den Fix.
Chismon schrieb:
Wenn RDNA 4 so kommt wie im Artikel kolportiert, kann es - wie RDNA 1 und ein mit RDNA 3 Technik mögliches RTX 4090 Pendant laut Statements von AMD/RTG - auch andeuten, dass es sich für AMD/RTG einfach nicht kostentechnisch lohnt im Gegensatz zu einer Halbgeneration (bei einem RTX 4090 Pendant von AMD/RTG wäre wohl auch der Energiebedarf exorbitant ausgefallen und hätte daher wenig Sinn gemacht).
Genau das hat David Wang im Frühjahr 2023 in einem Interview in Japan gesagt. Er hat gesagt, 1000 USD sind das obere Limit für AMD. Das halte ich für eine sehr realistische Einschätzung des Marktes.
AMD ging mit Navi 31 also an die Grenzen dessen was AMD vermarkten kann. Auch wenn alles geklappt hätte, wäre die 4090 vorne gewesen. Aber Navi 31 wäre im Vollausbau nach dem Plan von AMD deutlich über der 4080 gewesen.
Aber Navi 48 liegt weit unter dem 1000 USD Limit.
Chismon schrieb:
Das MCM Design sehe ich auch nicht abgeschafft und schätze, es wird mit RDNA 5 - hoffentlich ausgereifter/vorab getestet und idealer Weise komplexer und leistungsfähiger als bei RDNA 3 - wieder kehren,
Seit ich das erste Mal von den AMD-Patenten zu den GPU-Chiplets gelesen habe, elektrisiert mich das Thema. Ich war mir sicher, dass AMD bei RDNA 3 auf Multi-GCD-Designs geht. So sicher wie ich mir lange Zeit sicher war, dass Zen 4 von MCM auf Fanout wechselt.
Da beides nicht eingetreten ist, ist bei mir nun ein bisschen Realismus eingekehrt. Ich habe einige Statements nochmal in Ruhe gelesen.
Ich halte es für sehr unwahrscheinlich, dass AMD für RDNA 4 ein Multi-GCD-Design geplant hat. Navi 31 hat ca. 300 mm², mit 50 % mehr Fläche hätte ein RDNA 4 Flagschiff 450 mm². Das ist kein Problem. Eine Multichiplet-GPU benötigt mindestens eine Silicon Bridge. Das sehe ich momentan noch nicht für eine 1000 USD Grafikkarte.
Bei RDNA 5 könnte es notwendig werden, aber da kommt es auch darauf an wie die AMD-Prozesse samt DTCO skalieren.
Chismon schrieb:
aber das heisst nicht, dass es Navi 41, 42 und 42 Chips (basierend auf MCM Design) vorher überhaupt gab
Wieso sollte AMD die Vorgehensweise bei den internen Namen ändern? Die eigenen Teams irritieren?
Chismon schrieb:
und diese alle gestrichen wurden, weil AMD/RTGH nicht rechtzeitg gehandelt hat und die gleiche durch die Architektur festgelegte Problematik wie bei RDNA 3 dort nicht mehr beseitigt werden konnte.
Dass AMD nicht rechtzeitig gehandelt hat, habe ich nicht gesagt.
Die Fehlerursachen sind in den Simulationen und Tests, die bei der RTL-Programmierung und später beim Chip Design für RDNA 3 gelaufen sind, nicht aufgefallen. Oder bestenfalls erst viel zu spät im Chip Design von RDNA 3 aufgefallen. So spät, dass der Fehler selbst mit dem Nachzügler Navi 32 nicht behoben werden konnte.
Falls ich recht habe und der Fehler ursprünglich auch RDNA 4 betroffen hat, es es doch keine Überraschung dass der Fehler der bei der Simulation von RDNA 3 nicht aufgefallen ist auch bei der Simulation von RDNA 4 erst Mal nicht auffällt.
Und je später ein Fehler auffällt, desto schwerer wird es ihn zu beheben. Und das gilt ganz besonders für Halbleiter-Chips
Chismon schrieb:
Eben dieses waren die Gründe, wieso - wenn auch von einigen gefordert - es eben keine RDNA 1 High-End Grafikkarten gab, zumal die Felle größtenteils sowieso schon an nVidia verteilt waren (RDNA 1 vergleichsweise später bei den Marktstarts der Kartenmodelle dran war).
Ich denke es gibt einen weiteren ganz profanen Grund.
AMD hat zu dieser Zeit das GPU-Team gesplitted um RDNA und CDNA getrennt zu entwickleln. Es war zu dieser Zeit (2015/2016) schlicht keine Kapazität und kein Geld da um einen großen GPU-Die für RDNA 1 zu entwickeln.
Chismon schrieb:
Wenn AMD/RTG schon soweit geht ein RDNA 3.5 aufzulegen, könnte man auch davon ausgehen, dass man ein MCM Design für RDNA 4 aus dem Boden hätte stampfen können (welches aber zu spät als Alternative zu RTX 5000 auf den Markt gekommen wäre), aber es macht dann wohl eher Sinn RDNA 5 zeitlich vor zu ziehen (mit einem Marktstart bspw., in etwa zum Zeitpunkt eines RTX 5000er Refreshs, den nVidia schon als Konter planen dürfte) und RDNA 4 zu einer Halbgeneration zu machen.
RDNA 3.5 gibt es soweit ich weis nur für die APUs.
Die Geschichte mit dem Vorziehen hatte ich zuerst auch im Kopf, aber vom Timing her bin ich sehr skeptisch.
Chismon schrieb:
Ja, das gilt aber ebenso für nVidia oder Intel, nicht ausschließlich für AMD(/RTG) und dass die Qualitätskontrolle von AMD/RTG (hinsichtlich der Zulieferer) bei den Vapor Chambern versagt hat, will ich auch nicht beschönigen, aber ebenso gilt das auch für nVidia mit dem testen der für sie gefertigten 12VHPWR-Steckeradapater.
Die Linie auf die Nvidia sich zurückzieht ist, dass ein korrekt eingesteckter Stecker keine Probleme macht. So weit ich weiß hat noch niemand gezeigt, dass korrekt eingesteckte Stecker Probleme machen.
Das ist formaljuristisch OK, und deshalb gibt es auch keine Klagen gegen Nvidia. Und darauf reiten ja auch die Nvidia-Fanboys herum.
Sachlich ist es falsch. Ein Stecker den Laien bedienen, muss sicher sein, auch in dem Sinne dass man ihn nicht falsch einstecken kann.
Wenn man die Linie "Anwenderfehler" konsequent weiterdenkt, bedeutet es, dass nur Fachpersonal mit diesen Steckern hantieren darf. Das wäre das Ende des DIY-Marktes. Deswegen hat die PCI-SIG reagiert, und den Stecker korrigiert.
Natürlich hätte Nvidia das Problem aus der Portokasse bereinigen können, aber das hätte IMO als Schuldeingeständnis gewertet werden können und den Klagen erst die Tür geöffnet.
Und Nvidia hatte auch keinen Druck zu reagieren, da die lautstarke Fraktion der Nvidia-Fanboys das ganze als Majestätsbeleidigung aufgefasst hat und ziemlich heftig Position für Nvidia bezogen hat.
Chismon schrieb:
Ja, davon ist wohl auszugehen und es ist wohl auch nicht immer Interesse der Konzerne, in dem Fall AMD/RTG mit RDNA 4, das zu kommunizieren, denn das dürfte rufschädigend und damit kontraproduktiv sein.
Das Platzen der RDNA 3 Hypeblase war rufschädigend genug.
Das eigentliche Problem ist IMO, das es in den USA einige Anwälte dazu animieren könnte eine Sammelklage anzustrengen.
Deshalb habe ich schon im Dezember 2022 gesagt dass an den Gerüchten zu einem Refresh der das Problem behebt, nichts dran ist.
Chismon schrieb:
Es bleibt zu hoffen, dass sie daraus lernen, wenn es wirklich die von RDNA 3 herrührende, nicht mehr zu ändernde Architektur war und nicht vordergründig Kostenkalkulationen/Produktplatzierungsstrategie, aber da das nicht bestätigt ist, würde ich das auch nicht anführen wollen.
Ob ich nun recht habe dass auch RDNA 4 betroffen war oder ob nur RDNA 3 betroffen war spielt keine Rolle. Die Halbleiterunternehmen geben Unsummen dafür aus, schon beim Schaltungsentwurf das Verhalten des fertigen Produktes zu simulieren. Dass diese Sache RDNA 3 so massiv beeinträchtigt hat, hatte ganz gewiss Folgen. Denn AMD ist auf schmerzliche Art und Weise ein Lücke im Chipentwicklungsprozess gestoßen und diese muss geschlossen werden.
Ob es nun eine Fehlerkette von AMD Mitarbeitern war, ob EDA-Tools versagt haben oder eine unglückliche Mischung aus beidem war, IMO werden die EDA-Tools so erweitert, dass dieser Fehler in Zukunft frühzeitig erkannt wird. Falls erforderlich werden auch organisatorische Massnahmen getroffen.
Noch eine Anmerkung: Offensichtlich hat AMD die Radeon Technologies Group umbenannt. Sie heißt nun AMD GPU Technologies and Engineering Group. Chef (Senior Vice President) ist nach wie vor David Wang.