AMD Radeon RX 6800 XT im Test: SAM mit Ryzen 5000, Effizienz-Analysen, Apps
5/6Das Standard-Testsystem für Grafikkarte setzt Ende 2020 auf einen Ryzen 9 3900XT. Der Wechsel auf Ryzen 5000 (Test) ist schon lange geplant, die Zeit seit dessen Freigabe hat aber nicht ausgereicht, um ihn schon zu vollziehen. Damit ist Smart Access Memory (SAM) in den Standard-Benchmarks nicht aktiv. Was es theoretisch bringen kann, hat sich ComputerBase trotzdem angesehen.
Smart Access Memory (SAM) auf Ryzen 5000
Für die Tests von Smart Access Memory hat ComputerBase das Testsystem gewechselt: Ein Ryzen 9 5950X lief auf einem Asus Crosshair VIII Hero mit dem X570-Chipsatz und einem frisch aufgespielten Windows 10. Um SAM nutzen zu können, müssen das letzte offizielle BIOS aufgespielt werden und dort die Optionen „Above 4G Decode“ sowie „Resizable Bar Support“ aktiviert werden. Dass die Funktion aktiv ist, lässt sich in Windows selbst oder im Treiber (noch) nicht erkennen. Aus Zeitgründen wurde die Spieleauswahl für die nachfolgenden Benchmarks reduziert und vorerst nur UHD getestet.
Im Durchschnitt bringt SAM im Parcours in UHD nur einen minimalen Leistungsvorteil. Die Radeon RX 6800 wird um ein Prozent bei den Durchschnitts- und den Perzentil-FPS beschleunigt. Die Radeon RX 6800 XT legt um ein Prozent bei den Durchschnitts- und um zwei Prozent bei den Perzentil-Messungen zu. Bringt SAM also nichts, auch wenn AMD von bis zu zweistelligen Zuwächsen gesprochen hat?
Nein. SAM scheint stark spieleabhängig zu sein. In manchen Titeln wie Death Stranding tut sich beispielsweise nichts. Borderlands 3 gehört dagegen zu den Spielen, die auf SAM anspringen. Sowohl die Radeon RX 6800 als auch die Radeon RX 6800 XT legen um mindestens 2 Prozent bei jeder Messreihe zu, die Perzentil-FPS der Radeon RX 6800 steigen gar um 3 Prozent.
Den mit Abstand größten Sprung zeigt Smart Access Memory im Parcours in Shadow of the Tomb Raider. Sowohl die Radeon RX 6800 als auch die Radeon RX 6800 XT legen in Lara Crofts neuestem Abenteuer um 4 Prozent bei den Durchschnitts-FPS zu, die Perzentil-FPS steigen um 2 Prozent bei der kleinen und um drei Prozent bei der großen Karte an.
SAM kann also durchaus einen Unterschied machen, in den von der Redaktion getesteten Spielen ist er in UHD aber klein und könnte auch die Reihenfolge zwischen Radeon RX 6800 XT und GeForce RTX 3080 FE nicht umkehren. Ob das in anderen Spielen der Fall ist, müssen weitere Tests zeigen.
6800 XT & 3080 bei 270 Watt, 6800, 5700 XT & 3070 bei 220 Watt
Mit der GeForce RTX 3080 hat Nvidia die Leistungsaufnahme beim Spielen von 270 Watt bei der GeForce RTX 2080 Ti auf 320 Watt angehoben. Im Test der Redaktion hatte sich allerdings gezeigt, dass die mit 50 Watt erkaufte Mehrleistung nur sehr klein ausfällt. Wie sieht das bei RDNA 2 aus?
Die Radeon RX 6800 XT arbeitet mit den gemessenen 296 Watt knapp 30 Watt über der 270-Watt-Marke der alten Generation. Was also passiert, wenn auch der Radeon RX 6800 XT nur 270 Watt zustehen?
Um das heraus zu finden hat ComputerBase das Power Limit um 6 Prozent und damit um das im Treiber derzeit verfügte Maximum reduziert. In Spielen benötigt die Radeon RX 6800 XT dann noch gemessene 272 Watt und so ein Watt mehr als die ebenso im Power Limit reduzierte GeForce RTX 3080. Die GeForce RTX 2080 Ti benötigt exakt 270 Watt, sodass alle drei Grafikkarten innerhalb von 2 Watt liegen.
Neben der Radeon RX 6800 XT bei 270 Watt hat sich ComputerBase auch die Radeon RX 6800 bei reduzierter TDP im Vergleich zur Konkurrenz angesehen. In diesem Fall wurden 221 statt ab Werk 231 Watt eingestellt (-5 Prozent), was quasi der TDP von 220 Watt der GeForce RTX 3070 FE entspricht. Mit um neun Prozent angehobenem Power Limit wurde auch die Radeon RX 5700 XT auf dieses Niveau gebracht. Es ist zwar in der Regel nicht so effizient, eine deutlich kleinere GPU (Navi 10 gegen Navi 21) bei derselben Leistungsaufnahme zu betreiben, doch ist der Vergleich von RDNA und RDNA 2 derzeit anders nicht möglich.
RDNA verliert bei weniger Energie kaum Performance
Sowohl die Radeon RX 6800 als auch die Radeon RX 6800 XT verlieren durch die reduzierte Leistungsaufnahme kaum an Geschwindigkeit. Die Radeon RX 6800 wird bei 220 Watt gerade einmal im Durchschnitt 1 Prozent langsamer. Damit ist die Grafikkarte immer noch 6 Prozent bei den Durchschnitts-FPS und 8 Prozent bei den Perzentil-FPS schneller als die GeForce RTX 3070 bei gleicher Leistungsaufnahme. Der Performance-Schub gegenüber der ebenso auf 220 Watt konfigurierten Radeon RX 5700 mit der ersten RDNA-Generation beträgt 57 Prozent.
Auch die Radeon RX 6800 XT verliert nur 1 Prozent an Leistung, wenn diese auf 270 Watt konfiguriert ist, was immerhin 10 Prozent weniger Leistungsaufnahme als im Werkszustand sind. In einzelnen Spielen wächst die FPS-Differenz auf bis zu 2 Prozent an, größer wird diese aber nie.
Weil die GeForce RTX 3080 bei 270 Watt 4 Prozent an Geschwindigkeit verliert, beträgt AMDs Rückstand bei gleicher Leistungsaufnahme nur noch 3 Prozent bei den Durchschnitts-FPS, während die Radeon bei den Perzentil-FPS um 1 Prozent besser abschneidet.
Weil die Performance bei verringerter Leistungsaufnahme kaum abfällt, steigt die Energieeffizienz auch bei RDNA 2 in Folge der Maßnahme an. Mit 220 Watt Verbrauch liefert die Radeon RX 6800 noch einmal 4 Prozent mehr Performance pro Watt als bei der schon effizienten Werkseinstellung. Bei identischer Leistungsaufnahme ist die Radeon RX 6800 damit 6 Prozent effizienter als die GeForce RTX 3070 und zugleich die effizienteste Grafikkarte im Parcours.
Die Radeon RX 6800 XT wiederum hebt bei einem maximalen Verbrauch von 270 Watt das Performance-Pro-Watt-Verhältnis um 7 Prozent. Da die GeForce RTX 3080 bei 270 Watt jedoch 14 Prozent effizienter gegenüber der Werkseinstellung wird, ist der Ampere-Ableger auf dieser Stufe drei Prozent effizienter. Bei identischer Leistungsaufnahme ist die Radeon RX 6800 XT 21 Prozent effizienter als die GeForce RTX 2080 Ti.
Infinity Cache und 4K: Limitiert er in hohen Auflösungen? (Update)
Die Hitrate des Infinity Caches wird bei höheren Auflösungen immer schlechter, das liegt in der Natur eines Caches. Beträgt sie in Full HD noch 80 Prozent, sind es in Ultra HD hingegen nur noch 58 Prozent. Wird die Navi-21-GPU dadurch aber ausgebremst? Das lässt sich zwar nicht hundertprozentig herausfinden, aber mit Hilfe von Speicher-OC kann man der Antwort doch sehr nah kommen.
Der Treiber erlaubt es, den Speicher auf der Radeon RX 6800 XT von 8.000 MHz auf 8.600 MHz zu übertakten, dementsprechend steigt die klassische Speicherbandbreite von 512 GB/s auf 550 GB/s und damit um 7,5 Prozent. Falls Navi 21 in Ultra HD durch den Infinity Cache in größerem Maße ausgebremst werden würde, würde die Spiele-Performance durch die höhere Bandbreite entsprechend stark ansteigen.
Speicher-OC bringt auf Navi 21 wenig
Wie die Benchmarks zeigen, bleibt der Leistungssprung aber weit von den 7,5 Prozent entfernt. Gar so weit, dass man mit ziemlicher Sicherheit sagen kann, dass der Infinity Cache auch in 3.840 × 2.160 die Rechenleistung nicht limitiert. Im Gegenteil sogar, im Durchschnitt wird die Grafikkarte durch das Übertakten des Speichers nur um 1 Prozent schneller, sodass offenbar überhaupt kein generelles Limit an Speicherbandbreite vorliegt. In Einzelfällen kann das Plus auf 3 Prozent ansteigen, dies ist aber nur in Anno 1800 der Fall. Andere Spiele reagieren mit 1 bis 2 Prozent Mehrleistung, andere mit gar keiner.
- Anno 1800
- Borderlands 3
- Call of Duty: Modern Warfare
- Control
- Death Stranding
- Doom Eternal
- F1 2020
- Gears Tactics
- Ghost Recon Breakpoint
- Horizon Zero Dawn
- Metro Exodus
- Red Dead Redemption 2
- Resident Evil 3
- Shadow of the Tomb Raider
- The Division 2: Warlords of New York
- Trackmania
- Wolcen: Lords of Mayhem
Es lässt sich also festhalten, dass der Infinity Cache die neuen Radeon-Grafikkarten in 3.840 × 2.160 nicht ausbremst. Das zeigt übrigens auch ein Quervergleich mit der GeForce RTX 2080 Ti. Wenn man das in niedrigen Auflösungen schlecht skalierende Wolcen aus den Benchmarks heraus nimmt, kann die Radeon RX 6800 XT ihren Vorsprung zur GeForce RTX 2080 Ti beibehalten. Da die GeForce RTX 3080 sowohl im Vergleich zur GeForce RTX 2080 Ti als auch zur Radeon RX 6800 XT in höheren Auflösungen immer schneller wird, hat vermutlich eher die Ampere-Architektur Schwierigkeiten, ihre deutlich erhöhte Rechenleistung in niedrigen Auflösungen auf den Boden zu bringen.
Die höheren Taktraten bringen gut mehr Leistung (Update)
RDNA 2 taktet deutlich höher als RDNA. Aber was bringen die Frequenzen überhaupt. Und wie würde die Radeon RX 6800 XT aussehen, wenn sie gleich schnell wie die Radeon RX 5700 XT takten würde? Oder vergleichbar mit schnellen GeForce-RTX-3000-Modellen? Um das herauszufinden, wurde der Takt der Radeon RX 6800 XT auf 1,8 GHz reduziert, sodass die Grafikkarte in etwa so hoch wie die Radeon RX 5700 XT taktet. Ein zusätzlicher Lauf wurde mit 2,0 GHz durchgeführt, was übertaktete GeForce-RTX-3000-Karten erreichen können.
Im Werkszustand ist die Radeon RX 6800 XT 89 Prozent schneller als die Radeon RX 5700 XT. Würde die neue Navi-21-Grafikkarte nur mit 1,8 GHz laufen, würde der Vorsprung nur noch 62 Prozent betragen. Damit beschleunigen die bessere Taktbarkeit die Grafikkarte um 17 Prozent. Mit 2,0 GHz ist die Radeon RX 6800 XT 8 Prozent schneller als mit 1,8 GHz, die Differenz zum Werkszustand liegt bei ebenso 8 Prozent.
- Anno 1800
- Borderlands 3
- Call of Duty: Modern Warfare
- Control
- Death Stranding
- Doom Eternal
- F1 2020
- Gears Tactics
- Ghost Recon Breakpoint
- Horizon Zero Dawn
- Metro Exodus
- Red Dead Redemption 2
- Resident Evil 3
- Shadow of the Tomb Raider
- The Division 2: Warlords of New York
- Trackmania
- Wolcen: Lords of Mayhem
Bei den Perzentil-FPS sind die Unterschiede leicht anders. Mit Standard-Einstellungen ist die Radeon RX 6800 XT 93 Prozent flotter unterwegs als die Radeon RX 5700 XT. Mit nur noch 1,8 GHz würde der Vorsprung noch 67 Prozent betragen, sodass die höheren Taktraten 16 Prozent mehr Geschwindigkeit bringen. Mit 2,0 GHz wird die Grafikkarte 8 Prozent schneller als die 1,8 GHz, der Abstand zum Werkszustand beträgt noch 7 Prozent.
Benchmarks in 5K zeigen teils Abweichungen (Update)
Nvidia hat die GeForce RTX 3090 als 8K-Gaming-Grafikkarte beworben, auch wenn dazu meist der Einsatz von DLSS notwendig ist. 5K, also 5.120 × 2.880, lässt sich hingegen auch nativ halbwegs brauchbar nutzen. Deshalb misst die Redaktion die 5K-Performance der Radeon RX 6800 XT in 3 verschiedenen Spielen und vergleicht diese mit den Ergebnissen der GeForce RTX 3080. Interessant ist auch, ob sich der Abstand der beiden Grafikkarten gegenüber 4K ändert, denn für höhere Auflösungen als Ultra HD ist der Infinity Cache eigentlich nicht gedacht. Weil ComputerBase nicht über einen nativen 5K-Monitor verfügt, erfolgt die Ausgabe in 4K mittels VSR- beziehungsweise DSR-Downsampling.
Die Radeon RX 6800 XT erreicht in den 3 Spielen auch in 5K spielbare Frameraten. In Call of Duty: Modern Warfare arbeitet die Grafikkarte vergleichbar schnell wie die GeForce RTX 3080 und kommt auf knapp unter 60 FPS. In Doom muss sich die Radeon RX 6800 XT um 7 Prozent geschlagen geben, in Resident Evil 3 um 9 Prozent.
Vergleicht man die Abstände in den jeweiligen Spielen in Ultra HD zeigt sich, dass der Abstand in Doom Eternal absolut gleich bleibt, in COD: Modern Warfare minimal größer wird und in Resident Evil 3 um 5 Prozent ansteigt. In Resident Evil 3 kündigt sich beim Quervergleich mit der GeForce RTX 2080 Ti in 5K eine Schwäche der AMD-Grafikkarte an, hier ist womöglich der Infinity Cache zu klein für die hohe Auflösung. Das ist aber kein generelles Problem in 5.120 × 2.880, da die zwei anderen Spiele eine normale Leistung abliefern.
Benchmarks in Anwendungen
GPUs können heute mehr als nur (Spiele-)Grafik ausgeben. Seit 2001 ist die Berechnung anderer Aufgaben auf einem extrem parallelisierten Grafikprozessor als GPGPU bekannt. Seit 2007 stellt Nvidia Entwicklern mit CUDA eine Programmier-Technik zur Verfügung, mit der Programmteile standardisiert durch Nvidia-GPUs abgearbeitet werden können. Ein herstellerübergreifendes Pendant wurde mit OpenCL im Jahr 2008 vorgestellt, AMD setzt darauf.
OpenCL und CUDA wurden zu Anfangszeiten vor allem bei wissenschaftlichen und technischen Berechnungen eingesetzt, beschleunigt inzwischen aber immer mehr Anwendungen, die von Kreativen genutzt werden. Mit Nvidia Turing und Ampere stehen über CUDA inzwischen nicht nur die klassischen Shader zur Verfügung, Programme können sich auch der Tensor- und RT-Kerne zur Hardware-Beschleunigung von KI-Algorithmen und Raytracing-Berechnungen bedienen. OpenCL bietet das für RDNA 2 noch nicht.
Die Bedeutung der GPU im professionellen Umfeld abseits von Rechenzentren und Wissenschaft hat über die letzten Jahre in Folge dessen stetig zugenommen. Aus diesem Grund sind auch Anwendungs-Benchmarks Teil dieses Tests.
Getestet hat ComputerBase in diesem Fall auf einem System mit AMD Ryzen Threadripper 3990X (64K/128T) und 64 GB Corsair Dominator DDR4-3200 auf dem MSI Creator TRx40, um das Spiele-Testsystem nicht doppelt zu belegen.
Rendern der Vorschau mit Blender 2.90
Blender ist ein weit verbreitetes Rendering-Programm. Es ist mächtig, frei und für Windows, macOS und Linux verfügbar. Je komplexer das Projekt, desto höher fallen die Anforderungen an die Hardware aus. Und das betrifft nicht nur das finale Rendern beim Projekt-Export, sondern auch die Vorschau.
Neben OpenCL und CUDA steht in dieser Anwendung mittlerweile Nvidias API OptiX zur Verfügung. Mit OptiX lassen sich nicht nur die GPU-Shader, sondern auch die RT- (seit Blender 2.81, zum Rendern) und die Tensor-Kerne (seit Bender 2.83, für Denoising) der Ampere- und Turing-GPUs nutzen. Dabei gilt es allerdings zu bedenken: Die OptiX-Integration ist noch experimentell, noch nicht alle Funktionen der Rendering-Engine Cycles werden unterstützt.
ComputerBase hat für den Benchmark die Zeit gemessen, die bis zum Abschluss der Render-Vorschau im Projekt Blenderman benötigt wird. Grafikkarten von AMD wurden mit OpenCL, Modelle von Nvidia mit (Optix) und ohne RT-Kerne (CUDA) getestet. Denoising war im Viewport nicht aktiv. Motion Blur, das die RT-Kerne der Ampere-GPUs jetzt erstmals effizient berechnen können, spielt keine Rolle.
In Blender 2.90 legt RDNA 2 mit aktuellem Treiber mit OpenCL zwar gegenüber RDNA zu, knapp 30 Prozent Leistungsvorteil gegenüber der Radeon RX 5700 XT liegen aber deutlich hinter dem Vorteil in Spielen zurück.
Post-Processing und Export in Premiere Pro
Video-Bearbeitung in Adobe Premiere kann an vielen Stellen von der Beschleunigung durch eine GPU profitieren, sei es bei der Anwendung von Effekten in der Live-Vorschau oder beim Export. Seit diesem Frühjahr kann darüber hinaus Nvidias Video-Encoder NVENC zum Exportieren genutzt werden. Eine reine GPU-Anwendung ist Adobe Premiere Pro aber noch lange nicht, die CPU bleibt bei vielen Aufgaben und Filtern noch das Rechenwerk der Wahl.
Um das breite Band an Anforderungen in Adobe Premiere Pro im Test abzubilden, hat ComputerBase auf den PugetBench für Adobe Premiere Pro Version 0.92 Beta (Download und ausführliche Beschreibung) von Puget Systems aus den USA zurückgegriffen.
Der Benchmark ermittelt die Leistung in verschiedenen Export- und Bearbeitungs-Szenarien auf Basis unterschiedlicher Quellmedien. Die gewählten Effekte sind zum Teil stark auf die GPU, zum Teil stark auf die CPU angewiesen.
Auch in Adobe muss Radeon RX 6000 sich mit einer Ausnahme hinter den GeForce RTX der aktuellen sowie der letzten Generation einreihen. In der Live-Vorschau liefert RDNA 2 wiederum die beste Leistung ab.
Post-Processing und Export in DaVinci Resolve
Als letzte Anwendung hat ComputerBase das Video-Bearbeitungsprogramm DaVinci Resolve getestet. Auch in diesem Fall wurde auf eine Test-Umgebung von Puget Systems zurückgegriffen. Neben dem PugetBench für DaVinci Resolve Version 0.61 Beta (Download und ausführliche Beschreibung) wurden die GPUs im Standard Candle Benchmark von Sascha Haber getestet. Basis war jeweils DaVinci Resolve 16.2.
Im Standard-Candle-Benchmark erzielt RDNA 2 wiederum das beste Resultat im App-Parcours: Beide Grafikkarten berechnen die Post-Processing-Effekte in der Live-Vorschau drastisch schneller als die jeweilige Konkurrenz. Selbst die GeForce RTX 3090 behält in diesem Fall nur selten die Überhand, der Zuwachs gegenüber der Radeon RX 5700 XT erinnert erstmals an den Zuwachs in Spielen.
In der Test-Suite von Puget Systems liegt der Vorsprung der neuen auf die alte XT bei der Nutzung von 4K-Quellmaterial bei 40 Prozent. Nvidia Ampere bleibt deutlich performanter. Wie bei Adobe Premier Pro gilt allerdings, dass viele Szenarien im Test von der CPU abhängig sind, das gleicht die Ergebnisse an.