Nvidia GeForce RTX 3090 im Test: Benchmarks in Anwendungen

 5/8
Update Wolfgang Andermahr (+1)
1.091 Kommentare

Warum Tests in Anwendungen?

GPUs können heute mehr als nur (Spiele-)Grafik ausgeben. Seit 2001 ist die Berechnung anderer Aufgaben auf einem extrem parallelisierten Grafikprozessor als GPGPU bekannt. Seit 2007 stellt Nvidia Entwicklern mit CUDA eine Programmier-Technik zur Verfügung, mit der Programmteile standardisiert durch Nvidia-GPUs abgearbeitet werden können. Ein herstellerübergreifendes Pendant wurde mit OpenCL im Jahr 2008 vorgestellt, AMD setzt darauf.

OpenCL und CUDA wurden zu Anfangszeiten vor allem bei wissenschaftlichen und technischen Berechnungen eingesetzt, beschleunigt inzwischen aber immer mehr Anwendungen, die von Kreativen genutzt werden. Mit Nvidia Turing und jetzt auch Ampere stehen über CUDA inzwischen nicht nur die klassischen Shader zur Verfügung, Programme können sich auch der Tensor- und RT-Kerne zur Hardware-Beschleunigung von KI-Algorithmen und Raytracing-Berechnungen bedienen.

Die Bedeutung der GPU im professionellen Umfeld abseits von Rechenzentren und Wissenschaft hat über die letzten Jahre in Folge dessen stetig zugenommen. Aus diesem Grund sind auch Anwendungs-Benchmarks Teil dieses Tests.

Getestet hat ComputerBase in diesem Fall auf einem System mit AMD Ryzen Threadripper 3990X (64K/128T) und 64 GB Corsair Dominator DDR4-3200 auf dem MSI Creator TRx40, um das Spiele-Testsystem nicht doppelt zu belegen.

Rendern der Vorschau mit Blender 2.90

Blender ist ein weit verbreitetes Rendering-Programm. Es ist mächtig, frei und für Windows, macOS und Linux verfügbar. Je komplexer das Projekt, desto höher fallen die Anforderungen an die Hardware aus. Und das betrifft nicht nur das finale Rendern beim Projekt-Export, sondern auch die Vorschau.

Neben OpenCL und CUDA steht in dieser Anwendung mittlerweile Nvidias API OptiX zur Verfügung. Mit OptiX lassen sich nicht nur die GPU-Shader, sondern auch die RT- (seit Blender 2.81, zum Rendern) und die Tensor-Kerne (seit Blender 2.83, für Denoising) der Ampere- und Turing-GPUs nutzen. Dabei gilt es allerdings zu bedenken: Die OptiX-Integration ist noch experimentell, noch nicht alle Funktionen der Rendering-Engine Cycles werden unterstützt.

Diesen Viewport gilt es unter WQHD zu rendern
Diesen Viewport gilt es unter WQHD zu rendern

ComputerBase hat für den Benchmark die Zeit gemessen, die bis zum Abschluss der Render-Vorschau im Projekt Blenderman benötigt wird. Grafikkarten von Nvidia wurden mit (Optix) und ohne RT-Kerne (CUDA) getestet. Denoising war im Viewport nicht aktiv. Motion Blur, das die RT-Kerne der Ampere-GPUs jetzt erstmals effizient berechnen können, spielt keine Rolle.

Blender 2.90 (Erstellen der Vorschau Blenderman)
    • MSI GeForce RTX 3090 – RTX on
      0:52
    • MSI GeForce RTX 3080 – RTX on
      1:05
    • GeForce RTX 2080 Ti FE – RTX on
      1:41
    • GeForce RTX 2080 Super FE – RTX on
      1:57
    • GeForce RTX 2070 Super FE – RTX on
      2:00
    • MSI GeForce RTX 3090 – RTX off
      2:27
    • MSI GeForce RTX 3080 – RTX off
      2:52
    • GeForce RTX 2080 Ti FE – RTX off
      4:00
    • GeForce RTX 2080 Super FE – RTX off
      5:10
    • GeForce RTX 2070 Super FE – RTX off
      5:20
    • Radeon RX 5700 XT
      6:20
    • GeForce GTX 1080 FE – RTX off
      9:08
    • Ryzen TR 3990WX
      10:20
    • Radeon VII
      12:16
Einheit: Minuten, Sekunden

In Blender ist die GeForce RTX 3090 in der Version MSI Gaming X Trio in der Tat fast analog zur höheren Anzahl der Shader respektive RT-Kernen mit der Arbeit schneller fertig. Von ihrem großen Speicher profitieren kann die Grafikkarte in diesem Fall nicht.

Anders sieht das aus, wenn parallel zur kontinuierlich aktualisierten Render-Vorschau im Projekt „Junk Shop“ ein Frame abschließend gerendert werden soll. Auf der GeForce RTX 3090 ist das mit fast 16 GB Speicherbelegung möglich, die GeForce RTX 3080 schafft das nicht und stürzt ab. Hier muss zuvor der Modus im Viewport gewechselt werden.

Rendern mit OTOY OctaneRender

Das Render-Programm OctaneRender von OTOY, das schon immer für mehr Leistung exklusiv auf GPU-Rendering über CUDA setzte, kann das Rendern durch Nutzung der RT-Kerne der Turing-Architektur inzwischen weiter deutlich beschleunigen. Verfügbar ist die RT-Kern-Unterstützung allerdings weiterhin nur in einer Vorschau auf OctaneRender 2020 sowie einem Benchmark auf Basis von OctaneRender 2019. ComputerBase hat die nicht öffentliche Vorschau OctaneRender 2020.1.5 genutzt.

OctaneRender 2020.1.5
  • Path Tracing:
    • MSI GeForce RTX 3090 – RTX on
      91,1
    • MSI GeForce RTX 3080 – RTX on
      74,6
    • GeForce RTX 2080 Ti FE – RTX on
      48,9
    • GeForce RTX 2080 Super FE – RTX on
      36,7
    • GeForce RTX 2070 Super FE – RTX on
      35,0
    • MSI GeForce RTX 3090 – RTX off
      34,0
    • MSI GeForce RTX 3080 – RTX off
      29,3
    • GeForce RTX 2080 Ti FE – RTX off
      21,4
    • GeForce RTX 2080 Super FE – RTX off
      15,7
    • GeForce RTX 2070 Super FE – RTX off
      14,8
    • GeForce GTX 1080 FE – RTX off
      7,9
  • Direct Lighting:
    • MSI GeForce RTX 3090 – RTX on
      115,2
    • MSI GeForce RTX 3080 – RTX on
      94,5
    • GeForce RTX 2080 Ti FE – RTX on
      63,4
    • GeForce RTX 2080 Super FE – RTX on
      47,6
    • GeForce RTX 2070 Super FE – RTX on
      46,4
    • MSI GeForce RTX 3090 – RTX off
      44,5
    • MSI GeForce RTX 3080 – RTX off
      38,3
    • GeForce RTX 2080 Ti FE – RTX off
      28,5
    • GeForce RTX 2080 Super FE – RTX off
      20,7
    • GeForce RTX 2070 Super FE – RTX off
      19,7
    • GeForce GTX 1080 FE – RTX off
      10,5
Einheit: Megatexel pro Sekunde (MTex/s)

In OctaneRender liegt die leicht übertaktete GeForce RTX 3090 Gaming X Trio bei Nutzung der RT-Kerne sogar bis zu 22 Prozent vor der GeForce RTX 3080 Gaming X Trio, ohne RT-Kerne sind es immer noch 16 Prozent. In der von der Redaktion bisher genutzten Szene reichen allerdings auch wenige GB Grafikspeicher aus.

In einer von Nvidia zum Testen bereitgestellten Projektdatei ist das anders. Sie fordert von der GPU 14 GB Platz im Speicher ein. Ist der nicht vorhanden, können Anwender OctaneRender erlauben, den Arbeitsspeicher als Auslagerungsdatei zu nutzen. Das kostet aber auch auf einem Ryzen Threadripper 3990X mit 64 GB DDR4-3200 im Quad-Channel-Modus viel Leistung.

7 Minuten und 22 Sekunden benötigt das Rendering auf einer GeForce RTX 3080, auf einer GeForce RTX 3090 sind es lediglich 38 Sekunden. In solchen Szenarien zeigt sich, dass „der Speicher reicht“ im Vergleich zu „der Speicher reicht nicht“ – wie in Spielen – exorbitante Auswirkungen auf die Leistung haben kann.

OctaneRender 2020.1.5 (15,6 GB VRAM-Bedarf)
    • MSI GeForce RTX 3090
      0:38
    • MSI GeForce RTX 3080 – RTX off
      7:22
Einheit: Minuten, Sekunden

Post-Processing und Export in Premiere Pro

Video-Bearbeitung in Adobe Premiere kann an vielen Stellen von der Beschleunigung durch eine GPU profitieren, sei es bei der Anwendung von Effekten in der Live-Vorschau oder beim Export. Seit diesem Frühjahr kann darüber hinaus Nvidias Video-Encoder NVENC zum Exportieren genutzt werden. Eine reine GPU-Anwendung ist Adobe Premiere Pro aber noch lange nicht, die CPU bleibt bei vielen Aufgaben und Filtern noch das Rechenwerk der Wahl.

Um das breite Band an Anforderungen in Adobe Premiere Pro im Test abzubilden, hat ComputerBase auf den PugetBench für Adobe Premiere Pro Version 0.92 Beta (Download und ausführliche Beschreibung) von Puget Systems aus den USA zurückgegriffen.

Der Benchmark ermittelt die Leistung in verschiedenen Export- und Bearbeitungs-Szenarien auf Basis unterschiedlicher Quellmedien. Die gewählten Effekte sind zum Teil stark auf die GPU, zum Teil stark auf die CPU angewiesen. Das zeigt auch das in Punkten gewichtete Endergebnis: Turing und Ampere liegen hier vergleichsweise dicht beieinander und die GeForce RTX 3090 zwar mit neuem Bestwert an der Spitze, aber nicht wesentlich.

Premiere Pro (PugetBench 0.92 Beta)
  • Gesamtergebnis:
    • MSI GeForce RTX 3090
      1.188,0
    • MSI GeForce RTX 3080
      1.164,0
    • GeForce RTX 2080 Ti FE
      1.111,0
    • GeForce RTX 2080 Super FE
      1.077,0
    • GeForce RTX 2070 Super FE
      1.069,0
    • Radeon RX 5700 XT
      1.019,0
    • Radeon VII
      931,0
    • GeForce GTX 1080 FE
      887,0
    • Ryzen TR 3990WX
      486,0
  • Export-Ergebnis:
    • MSI GeForce RTX 3090
      143,7
    • MSI GeForce RTX 3080
      138,7
    • GeForce RTX 2080 Ti FE
      131,4
    • GeForce RTX 2080 Super FE
      124,4
    • GeForce RTX 2070 Super FE
      123,7
    • Radeon RX 5700 XT
      111,9
    • GeForce GTX 1080 FE
      98,5
    • Radeon VII
      94,1
    • Ryzen TR 3990WX
      14,0
  • Live-Vorschau-Ergebnis:
    • MSI GeForce RTX 3080
      94,0
    • MSI GeForce RTX 3090
      93,8
    • Radeon VII
      92,1
    • Radeon RX 5700 XT
      91,9
    • GeForce RTX 2080 Super FE
      90,9
    • GeForce RTX 2080 Ti FE
      90,7
    • GeForce RTX 2070 Super FE
      90,1
    • Ryzen TR 3990WX
      83,2
    • GeForce GTX 1080 FE
      78,9
  • GPU-Ergebnis:
    • MSI GeForce RTX 3090
      92,5
    • MSI GeForce RTX 3080
      88,2
    • GeForce RTX 2080 Ti FE
      82,2
    • GeForce RTX 2080 Super FE
      77,1
    • GeForce RTX 2070 Super FE
      72,3
    • Radeon VII
      62,8
    • Radeon RX 5700 XT
      57,6
    • Ryzen TR 3990WX
      37,4
    • GeForce GTX 1080 FE
      24,5
Einheit: Punkte

Werden allerdings die Szenarien herausgegriffen, die die GPU besonders stark fordern, kann die GeForce RTX 3090 auch in diesem professionellen Umfeld bis zu 20 Prozent mehr Leistung an den Tag legen.

Premiere Pro (PugetBench 0.92 Beta – Details)
  • Lumetri Color - Export (H.264 40Mbps UHD):
    • MSI GeForce RTX 3090
      139,2
    • MSI GeForce RTX 3080
      135,6
    • GeForce RTX 2080 Ti FE
      128,6
    • GeForce RTX 2080 Super FE
      125,5
    • GeForce RTX 2070 Super FE
      121,2
    • Radeon RX 5700 XT
      97,5
    • GeForce GTX 1080 FE
      87,1
    • Radeon VII
      58,2
    • Ryzen TR 3990WX
      7,0
  • Lumetri Color - Export (H.264 40Mbps UHD):
    • MSI GeForce RTX 3090
      126,1
    • MSI GeForce RTX 3080
      125,5
    • GeForce RTX 2080 Ti FE
      100,9
    • GeForce RTX 2080 Super FE
      90,2
    • GeForce RTX 2070 Super FE
      85,0
    • Radeon RX 5700 XT
      81,4
    • Radeon VII
      58,1
    • GeForce GTX 1080 FE
      52,6
    • Ryzen TR 3990WX
      4,7
  • 4K RED (59.94FPS) – Export:
    • MSI GeForce RTX 3090
      192,5
    • MSI GeForce RTX 3080
      192,4
    • GeForce RTX 2080 Ti FE
      153,7
    • GeForce RTX 2080 Super FE
      144,5
    • GeForce RTX 2070 Super FE
      139,9
    • Radeon RX 5700 XT
      129,4
    • Radeon VII
      115,3
    • GeForce GTX 1080 FE
      103,5
    • Ryzen TR 3990WX
      7,7
  • 4K Heavy GPU Effects (59.94FPS) – Playback:
    • MSI GeForce RTX 3090
      57,7
    • MSI GeForce RTX 3080
      56,9
    • GeForce RTX 2080 Ti FE
      55,4
    • GeForce RTX 2080 Super FE
      52,9
    • GeForce RTX 2070 Super FE
      47,5
    • Radeon VII
      29,7
    • Ryzen TR 3990WX
      29,1
    • Radeon RX 5700 XT
      28,9
      Auf CPU berechnet
    • GeForce GTX 1080 FE
      12,6
  • 4K Heavy GPU Effects (59.94FPS) – Playback:
    • MSI GeForce RTX 3090
      57,7
    • MSI GeForce RTX 3080
      57,0
    • GeForce RTX 2080 Ti FE
      55,6
    • GeForce RTX 2080 Super FE
      52,9
    • GeForce RTX 2070 Super FE
      47,5
    • Radeon VII
      29,7
    • Radeon RX 5700 XT
      28,8
      Auf CPU berechnet
    • Ryzen TR 3990WX
      28,2
    • GeForce GTX 1080 FE
      12,7
  • 4K Heavy GPU Effects Advanced (59.94FPS) – Export:
    • MSI GeForce RTX 3090
      73,0
    • MSI GeForce RTX 3080
      61,9
    • GeForce RTX 2080 Ti FE
      48,1
    • Radeon VII
      38,2
    • GeForce RTX 2080 Super FE
      38,1
    • GeForce RTX 2070 Super FE
      34,3
    • Radeon RX 5700 XT
      24,3
    • GeForce GTX 1080 FE
      7,0
    • Ryzen TR 3990WX
      3,0
  • 4K Heavy GPU Extreme (59.94FPS) – Export:
    • MSI GeForce RTX 3090
      26,2
    • MSI GeForce RTX 3080
      21,8
    • GeForce RTX 2080 Ti FE
      17,1
    • GeForce RTX 2080 Super FE
      13,4
    • GeForce RTX 2070 Super FE
      11,5
    • Radeon VII
      8,4
    • Radeon RX 5700 XT
      7,1
    • GeForce GTX 1080 FE
      3,8
    • Ryzen TR 3990WX
      3,1
  • 4K Heavy GPU Effects (59.94FPS) – Playback:
    • MSI GeForce RTX 3090
      97,4
    • MSI GeForce RTX 3080
      97,1
    • GeForce RTX 2080 Ti FE
      96,1
    • GeForce RTX 2080 Super FE
      94,1
    • GeForce RTX 2070 Super FE
      89,4
    • Radeon VII
      74,7
    • Radeon RX 5700 XT
      73,2
    • Ryzen TR 3990WX
      53,6
    • GeForce GTX 1080 FE
      32,3
  • 4K Heavy GPU Effects (59.94FPS) – Export:
    • MSI GeForce RTX 3090
      82,7
    • MSI GeForce RTX 3080
      69,8
    • GeForce RTX 2080 Ti FE
      54,4
    • GeForce RTX 2080 Super FE
      42,9
    • Radeon VII
      38,8
    • GeForce RTX 2070 Super FE
      38,2
    • Radeon RX 5700 XT
      26,2
    • GeForce GTX 1080 FE
      9,1
    • Ryzen TR 3990WX
      5,1
Einheit: Bilder pro Sekunde (FPS)

Post-Processing und Export in DaVinci Resolve

Als letzte Anwendung hat ComputerBase das Video-Bearbeitungsprogramm DaVinci Resolve getestet. Auch in diesem Fall wurde auf eine Test-Umgebung von Puget Systems zurückgegriffen. Neben dem PugetBench für DaVinci Resolve Version 0.61 Beta (Download und ausführliche Beschreibung) wurden die GPUs im Standard Candle Benchmark von Sascha Haber getestet. Basis war jeweils DaVinci Resolve 16.2.

DaVinci Resolve (Standard Candle Benchmark)
  • 09 Nodes:
    • MSI GeForce RTX 3090
      144,0
    • MSI GeForce RTX 3080
      126,0
    • Radeon VII
      107,0
    • GeForce RTX 2080 Ti FE
      104,0
    • GeForce RTX 2070 Super FE
      78,0
    • Radeon RX 5700 XT
      69,0
    • GeForce GTX 1080 FE
      64,0
  • 18 Nodes:
    • MSI GeForce RTX 3090
      83,0
    • MSI GeForce RTX 3080
      73,0
    • GeForce RTX 2080 Ti FE
      58,0
    • Radeon VII
      55,0
    • GeForce RTX 2070 Super FE
      43,0
    • Radeon RX 5700 XT
      37,0
    • GeForce GTX 1080 FE
      35,0
  • 30 Nodes:
    • MSI GeForce RTX 3090
      53,0
    • MSI GeForce RTX 3080
      47,0
    • GeForce RTX 2080 Ti FE
      37,0
    • Radeon VII
      33,0
    • GeForce RTX 2070 Super FE
      27,0
    • Radeon RX 5700 XT
      23,0
    • GeForce GTX 1080 FE
      22,0
  • 66 Nodes:
    • MSI GeForce RTX 3090
      26,0
    • MSI GeForce RTX 3080
      24,0
    • GeForce RTX 2080 Ti FE
      18,0
    • Radeon VII
      15,0
    • GeForce RTX 2070 Super FE
      13,0
    • Radeon RX 5700 XT
      11,0
    • GeForce GTX 1080 FE
      10,0
  • 1 TRN Node:
    • MSI GeForce RTX 3090
      159,0
    • MSI GeForce RTX 3080
      141,0
    • GeForce RTX 2080 Ti FE
      128,0
    • Radeon VII
      112,0
    • GeForce RTX 2070 Super FE
      104,0
    • Radeon RX 5700 XT
      86,0
    • GeForce GTX 1080 FE
      84,0
  • 2 TRN Nodes:
    • MSI GeForce RTX 3090
      87,0
    • MSI GeForce RTX 3080
      78,0
    • GeForce RTX 2080 Ti FE
      69,0
    • Radeon VII
      63,0
    • GeForce RTX 2070 Super FE
      54,0
    • Radeon RX 5700 XT
      43,0
    • GeForce GTX 1080 FE
      42,0
  • 4 TRN Nodes:
    • MSI GeForce RTX 3090
      47,0
    • MSI GeForce RTX 3080
      42,0
    • GeForce RTX 2080 Ti FE
      36,0
    • Radeon VII
      33,0
    • GeForce RTX 2070 Super FE
      27,0
    • Radeon RX 5700 XT
      22,0
    • GeForce GTX 1080 FE
      21,0
  • 6 TRN Nodes:
    • MSI GeForce RTX 3090
      33,0
    • MSI GeForce RTX 3080
      29,0
    • GeForce RTX 2080 Ti FE
      25,0
    • Radeon VII
      22,0
    • GeForce RTX 2070 Super FE
      19,0
    • GeForce GTX 1080 FE
      15,0
    • Radeon RX 5700 XT
      14,0
Einheit: Bilder pro Sekunde (FPS)

Im Standard-Candle-Benchmark geht die GeForce RTX 3090 FE erneut als Sieger vom Platz, der Vorsprung entspricht den Erwartungen ohne Speicher-Engpass.

DaVinci Resolve (PugetBench 0.61 Beta)
  • Gesamtergebnis 4K:
    • MSI GeForce RTX 3090
      1.808,0
    • MSI GeForce RTX 3080
      1.633,0
    • Radeon VII
      1.414,0
    • GeForce RTX 2080 Ti FE
      1.354,0
    • GeForce RTX 2070 Super FE
      1.116,0
    • Radeon RX 5700 XT
      908,0
    • GeForce GTX 1080 FE
      837,0
  • Gesamtergebnis 8K:
    • MSI GeForce RTX 3090
      621,0
    • MSI GeForce RTX 3080
      582,0
    • Radeon VII
      537,0
    • GeForce RTX 2080 Ti FE
      524,0
    • GeForce RTX 2070 Super FE
      490,0
    • Radeon RX 5700 XT
      409,0
    • GeForce GTX 1080 FE
      397,0
Einheit: Punkte

In der Test-Suite von Puget Systems sind es 7 Prozent bei der Nutzung von 8K-Quellmaterial und 11 Prozent bei der Nutzung von 4K-Quellmaterial. Wie bei Adobe Premier Pro gilt, dass viele Szenarien im Test von der CPU abhängig sind, das gleicht die Ergebnisse an. Das Resultat in 8K ist dennoch eine Überraschung, die Autoren der Test Suite geben an, dass hier 20 GB VRAM für die maximale Leistung vonnöten sind. Mehr als 8 GB Belegung konnte ComputerBase allerdings nicht ermitteln.

Der 8K-Durchlauf gibt sich mit maximal 8 GB zufrieden
Der 8K-Durchlauf gibt sich mit maximal 8 GB zufrieden

Insgesamt kann die GeForce RTX 3090 ihr Plus von 20 Prozent Rohleistung in Anwendungen besser in mehr Leistung umsetzen als in Spielen, insbesondere dann, wenn RT-Kerne zum Einsatz kommen. Sind mehr als 11 GB Speicher erforderlich, hängt sie alle anderen GeForce deutlich ab. Eine Titan RTX stand ComputerBase zum Vergleich leider nicht zur Verfügung.

AV1-Decoding mit Nvidia NVDEC

Keine klassische Anwendung, aber dennoch ein zukünftiges Alltagsszenario ist das Decoding des zukünftigen Video-Codes AV1. Bisher gelang das nur in Software, was in 8K selbst auf schnellen CPUs und GPUs nicht schnell genug vonstatten ging.

Grafikkarten auf Basis von Nvidia Ampere sind die ersten GPUs, die den neuen Internet-Video-Codec AV1 nativ in Hardware beschleunigen können. Damit können erstmals AV1-8K-Videos mit 60 FPS über YouTube flüssig wiedergegeben werden. Intels Xe-iGPU in Tiger Lake wird es in Kürze ebenfalls können.

GeForce-RTX-3000-Grafikkarten können AV1 über Nvidias Hardware-Decoder (NVDEC) decodieren. Voraussetzung sind aktuell allerdings noch Windows 10, die AV1 Extension aus dem Microsoft Store sowie Chrome 85 oder neuer. Unterstützt wird AV1 Profile 0 (monochrome/4:2:0, 8/10 bit) bis zu 8K mit 60 FPS. Details dazu liefert das Whitepaper zu Ampere GA102 ab Seite 33 (PDF).

Das nachfolgende Video zeigt die Wiedergabe des Videos „Japan in 8K“ auf YouTube mit AV1-Codec sowohl in 4K als auch 8K auf einer GeForce RTX 3080 (Ampere) im Vergleich zur GeForce RTX 2070 Super (Turing) und GeForce GTX 1080 (Pascal). Die GeForce RTX 3090 zeigt dasselbe Verhalten, ein neues Video hat die Redaktion aber nicht erstellt.