Fegr8 schrieb:
Das bestreite ich auch nicht. Ich habe nur die Änderungen für RDNA2 beziehen wollen.
Du lieferst doch - 3dcenter und deinen Hinweis auf Forbes - selbst bereits die Indizien, die "tiefere" Verantwortung für RDNA durchaus infrage stellt, vor allem wenn man mal alle Artikel wirklich als ganzes liest und auch auf so ein paar Sachen achtet*.
Hier im Übrigen mal der Artikel, der Auslöser für den Twitter-Austausch war:
https://www.theinformation.com/articles/intels-manufacturing-glitch-opens-door-for-amd
Das führte dann dazu, dass ein "Pro-Intel"-Insider damals relativ erbost behauptet, dass Vega so schlecht war, weil man Koduri für Vega ja die Ingenieure abgezogen hat und man diese auf RDNA
in für der Semi-Custom ansetzte, während er in der RTG quasi wichtige "Köpfe" für
sein Team Vega verloren hat.
Gab damals dann wirklich ein kleines Gefecht zwischen den Leuten, aber alle haben es relativ schnell gelöscht, weil da keiner wirklich gut wegkam.
Man hat die Leute gegen seinen Wunsch von Vega und aus der RTG abgezogen.
Und es gab ja da noch einen Artikel.
Fegr8 schrieb:
Die Tweets sind schon gelöscht, aber kurz danach haben Forbes und WCFtech im Prinzip fast was Ähnliches publiziert aus anderen Quellen.
Und da man die Sachen ja abrufen kann:
https://wccftech.com/exclusive-amd-navi-gpu-roadmap-cost-zen/
Fegr8 schrieb:
Der Grund war schlichtweg wie die Shader und Pipeline gruppiert waren. Man hat gesehen wenn die Software die Komplexität programmiert wurde, war GCN sehr effizent. [...] Navi ist also zum Teil also ein Rückschritt.
Das Problem bei GCN war, dass die Treiber selbst mit Wave64 gearbeitet haben und ein Wave64-Befehl in einer CU nur auf einer der Vec16-ALUs ausgeführt wurde und dafür 4 Takte brauchte.
Ein weiteres Problem war, dass - anders als jetzt in RDNA und nun RDNA2 - ein Wave64-Befehl wirklich IMMER die 4 Takte brauchte, auch wenn zum Beispiel nur 16 Werte drin waren. Um also die CU auszulasten und die ganze Rechenleistung abzurufen, braucht man also immer 4 Befehle, egal ob jetzt Wave16, Wave32 oder Wave64.
Die Umstellung auf Vec32 hat also alleine schon zu ca. 50 % IPC geführt, weil ein Wave64-Befehl nur noch 2 Takte benötigte, statt 4 und man damit auch weniger Threads brauchte als vorher. Die zweite Besonderheit bei RDNA ist aber auch, dass inzwischen ein Wave64-Befehl, der nur maximal 32 Werte enthält, auch nur noch in einem Takt ausgeführt wird.
AMD hat - um die Auslastung zu verbessern - auch den Treiber auf Wave32 umgemodelt und DIESE Arbeit war 2019 noch nicht abgeschlossen, das hat AMD auch mehrfach angedeutet. Ich kann da auch mal das Whitepaper zu
RDNA empfehlen, in dem man auf die Probleme eingeht.
Navi/RDNA hat einige wichtige Änderungen vorgenommen und einige Probleme der Hardware gelöst. Man muss da aber fair sein, einige der Probleme zeigten sich auch erst mit der Zeit, eben weil der Chip trotz immer mehr Shader nicht mehr ordentlich skalierte. GCN war 2012 sehr viel Zukunftsmusik und eigentlich sogar ein Schritt in die richtige Richtung.
Und das mit dem Rückschritt ist so eine Sache bei RDNA, weil man das so überhaupt nicht wirklich klar fassen kann. Wenn man RDNA2 mit Ampere vergleicht - und auch RDNA mit Turing - dann ergeben sich da ein paar interessante Punkte, die immer noch zeigen, dass RDNA eine sehr flexibel und vielseitige Architektur ist, die sehr gut auf verschiedene Workloads reagieren kann. Und wenn man diese eigenheiten beachtet, dann steht RDNA auch in OpenCL GCN nicht wirklich nach, auch wenn RDNA den Wave16-Modus eingebüßt hat.
Man hat bei RDNA an vielen Stellen gearbeitet, um die GPU "leichter" auszulasten und gleichzeitig auch, dass diese Auslastung konstant anliegt und die GPU nicht leerläuft. Und jetzt kommt das lustige: Vieles was AMD mit RDNA eingeführt hat, hat AMD nun auch bei CDNA2 eingeführt, nur eben auf "CU"-Basis. Man kann - stark vereinfacht - heute sagen: Eine RDNA-WGP ist mit einer CDNA-CU vergleichbar. Die CDNA-CU ist mit 4 * Vec16 "filigraner", während die WGP mit 4 * Vec32 "gröber" ist.
Fegr8 schrieb:
Raja hat die Grundpfeiler für Navi gestellt das ohne Zweifel. Aber die Frage ist wieviel von seinen Visionen steckt da jetzt wirklich drinnen.
Mit der Aussage kann ich sogar leben, wobei ich da mal frech bin: *Wenn man sich die Artikel durchliest, auch auf die du dich beziehst: Koduri - etwas frei übersetzt und bisschen überspitzt - hatte von Navi scheinbar auch keine wirklich gute Meinung und hielt es für den falschen Weg, um im PC-Gaming-Markt im High-End-Bereich anzugreifen.
Also ich bekomme langsam so den Gedanken, dass Navi eventuell auch einer der Gründe war, warum Koduri AMD verlassen hat und zu Intel ging.
Koduri kam 2013 zurück zu AMD und übernahm die RTG. Lisa Su kam ein Jahr davor zu AMD und war auch daran beteiligt, dass die Deals mit Sony und Microsoft für die PlayStation 4 und XBox One zustande kamen. Lisa Su wird CEO und weiß auch, wie wichtig Sony und MS für AMD sind. Sony hat damit auch den entsprechenden Rückhalt. Da Sony an die Zukunft von "GCN" nicht wirklich glaubt und Su dem entsprechend auch Gewicht beimisst, wird die RTG "näher" an Semi-Custom gedrückt und Su gibt die Anweisung auch einen weiteren "Entwicklungszweig" aufzumachen - Navi. Sie gibt die Anweisung, dass man doch auf Sony "achten" soll. Koduri ist mit seinen Teams eigentlich voll an Vega dran und Koduri - wie du ja auch andeutest - hält auch nicht viel von x86-Zen und glaubt da nicht dran. Su legt die Priorität nun auf Zen und entzieht ihn wichtige Mitarbeiter für Vega und setzt diese an Navi. Vega fängt an zu stocken. Sony zeigt sich auch unzufrieden, also zieht Su wegen Sony noch mehr Leute von Vega ab und forciert Navi. Sie greift damit aktiv in die RTG ein, obwohl er die RTG leitet.
Koduri wollte sich auf Vega konzentrieren, hatte da sehr gute Eisen im Feuer - Primitive Shaders und Co - aber weil eben sein Team für Vega kastriert wurde, fehlten Ressourcen um Vega so abzuliefern, wie er es sich vorstellte. Koduri ist zu dem Zeitpunkt tierisch frustriert. Statt dass die RTG unabhängiger wird in AMD, ist sie enger an die Semi-Custom gedrückt worden, weil Su entsprechend agiert. Statt dass Su auf seine Einschätzung vertraut und ihm freie Hand lässt, mischt sie sich immer wieder in seine Entscheidungen ein, verlagert Ressourcen zu anderen Bereichen.
Im Endeffekt würde das auch erklären, warum er nach der Vorstellung von Vega seine Auszeit angekündigt hat und warum der Gang dann zu Intel so schnell ging. Wenn man in so einer Position von der eigenen Chefin kein Vertrauen genießt und auch übergangen wird und gegen die eigenen Wünsche gehandelt wird, dann zieht man irgendwann einen Schlussstrich.