MichaG schrieb:
Interessant! Es wirkt so, als wäre die 780M nur eine übertaktete 680M. Leistung steigt minimal und Stromverbrauch und Takt in ähnlichem Maße.
Da AMD die Treiber mit RDNA von Wave64 auf Wave32 primär geändert hat, kann die 780M ihre Leistung quasi nur abrufen, wenn der Shader-Compiler es schafft möglichst viel Code im Shader auf die Dual-Issues münzen kann. Ohne diese Änderungen schlägt quasi nur der Takt durch, da ja keine WGP/CU dazu gekommen sind.
MichaG schrieb:
Wo sind da die Architekturverbesserungen von RDNA 2 auf RDNA 3?
@Jan nur so aus Neugierde: Könntet ihr mal Modernwarfare 2 auf den Geräten testen? Das ist eines der Spiele, die ja wirklich auf Dual-Issues anspricht. Weil neben diesem "Spiel" steigt ja selbst bei Navi31 ja oft eher die Leistung im erwartbaren Rahmen des Taktes und der CU.
Ansonsten: Die anderen Änderungen an der Architektur -
@Locuza hat es ja gut aufgeführt - dienen eher dazu, die Auslastung weiter zu verbessern sowie die Daten schneller beizuschaffen und vorzuhalten. Das kann sich bei großen Chips dann deutlich eher zeigen, als bei einer iGPU.
Philste schrieb:
OMG stimmt, laut Notebookcheck kommt das Blade 14 mit 5600er RAM. Das heißt RAM bereinigt sprechen wir von maximal 3-4% Mehrleistung.
Das ist an der Stelle dann nur nicht ganz so passend. Es ist bekannt, dass iGPU oft ihr volles Potenzial erst mit entsprechendem RAM ausspielen können. Es kann gut sein, dass RDNA3 an dieser Stelle quasi deutlich mehr Bandbreite benötigt - alleine durch den maximal möglichen Takt von 2,9 / 3 GHz.
Um hier wirklich die 780M zu bewerten, müsste man auch die Taktraten im Spiel sehen, um zu sehen, ob die GPU sich langweilt, weil keine Daten schnell genug kommen.
Northstar2710 schrieb:
Wir bewegen uns in Fhd da langweilen sich die CPU Cores zu Tode.
Kleine Verbesserung: GPU-Cores. Ansonsten: Ja und Nein. FHD reicht für die meisten iGPUs durchaus auch aus, um hier die Kerne gut auszulasten. Mit den 12 CU kann die 680M und 780M 24 Threads/Tasks/Wavefronten bearbeiten, das bekommt man mit FHD auf jeden Fall locker zusammen.
Dual-Issues schlägt nicht in jedem Spiel durch und auch nicht in jedem Zusammenhang. Entsprechend muss man hier auch aufpassen.
Philste schrieb:
Die 780M ist RAM bereinigt wohl überhaupt nicht schneller als die 680M und anscheinend auch nicht effizienter.
Wie gesagt, wenn die GPU sich langweilt, kann das in dem Fall durchaus auch der Fall sein. Da die zweite ALU-Front in den Vec-Einheiten nicht ganz "abgeschaltet" werden kann, verbraucht die immer auch etwas mit und entsprechend steigt dann auch nicht die Effizienz.
Aber um hier eine finale Aussage zu treffen, müsste hier wirklich mal die Taktraten und die Auslastung analyisiert werden. Vorher kann man keine finale Aussage treffen.
franzerich schrieb:
Wie gesagt, in den ersten paar Leaks vom Billibilli (oder wie der hiess). Der hat damals einen Port Royal Benchmark Vergleich gemacht: dort hatte die 680m irgendwas mit 900 Punkten oder so, und die 780m hatte 1500 Punkte oder so. Daher kam das mit den +50% mehr Raytracing Leistung.
Port Royal ist in dem Fall dann aber ein Idealfall, weil nicht alle Änderungen an RDNA3 auch in jedem Szenario durchschlagen. Ob die 50 % ankommen, hängt am Ende auch von der RT-Implementation ab und wie hoch der RT-Anteil ist.-
franzerich schrieb:
Als Grund für diese Mehrleistung wurde der "Dual Issue" spekuliert, welcher in der 780m angeblich doppelt soviele FP32 Berechnungen ausführen könnte als die 680m. Das hat sich auch ganz plausibel angehört, denn Nvidia hat ja ähnliche Änderungen bei ihrer RTX3000 Serie begonnen (also mit zusätzlichen FP32 Einheiten), um die Raytracing Leistung zu verbessern.
An sowas merkt man dann aber wieder, dass die meisten Youtube eben doch einfach nur "Contentcreatoren" sind, die gute Videos machen können und die Leute unterhalten, aber von tiefen Analysen lieber die Finger lassen sollten.
Ein Teil der Leistung in RT kommen durch Verbesserungen in den RT-Kernen als auch der TMU beim Abrufen des BVH-Trees und dass hier die Speicherzugriffe als auch Teile der RT-Shader sortiert werden. Ein weitere Teil der Verbesserungen kommen dann aus den neuen Vektor-Operationen, die implementiert wurden und dann auch davon, dass man nun bei RT statt auf eine Wave32 auf einen Wave64-Befehlen gehen kann.
Aktuell gibt AMD an, dass die neuen
Vec-ALUs ca. 4 % "mehr fps" bringen in RT-Szenarien, weil entsprechend mehr Daten berechnet werden können. Das soll sich weiter verbessern.
Ich schätze aktuell, dass die neuen Vecs auch die erste Iteration sind, mit der man nun raus musste, damit man jetzt richtige Erfahrungen sammelt, damit die Treiberentwickler für RDNA4 und den Änderungen da entsprechende Anpassungen betreiben können und die Hardwareenwickler weitere Verbesserungen für RDNA5 einbringen können.
bad_sign schrieb:
Die extra FP32 EInheiten werden nicht für Spiele verwendet, warum auch immer :/
Oh, die werden auch für Spiele verwendet, nur kannst du nicht in jedem Shader entweder zwei möglichst "unabhängige" Wave32-Befehle erstellen oder nicht immer sinnvoll auf Wave64 aufblähen.
RDNA3 hat bei den neuen Shader das gleiche Problem wie NVIDIA bei Ampere und Ada: Man bekommt oft nicht genug Daten für zwei volle 64er-Vektoren zusammen. Entsprechend langweilt sich ein Teil der ALUs.
RDNA3 ist - wie Ampere und Ada - die Vorbereitung auf die Zukunft - "8K" und RT.