Nvidia GeForce RTX 5090 im Test: AI-, Studio- und Video-Benchmarks

 9/15
Wolfgang Andermahr
659 Kommentare

Der neue Testparcours umfasst auch „AI-Benchmarks“. Neben dem Procyon AI Image Generation Benchmark von UL Solutions (3DMark, PCMark), der vielfältige AI-Lasten nachstellt, sind auch zwei handfeste Praxisbeispiele darunter:

Moderne PC-Hardware kann bereits länger ein neuronales Netzwerk beschleunigen, konzentriert sich anders als eine NPU aber nicht auf Effizienz, sondern auf Performance. Nvidia verbaut seit der GeForce-RTX-2000-Serie so genannte Tensor-Kerne in Gaming-Grafikkarten, die „AI“ beschleunigen können. AMD hat zwar keine separate Hardware in den GPUs, ist seit RDNA 3 aufgrund neuer WMMA-Operationen (Wave Matrix Multiply Accumulate) aber auch deutlich besser für AI gerüstet. Und Intels Arc-Beschleuniger fahren mit ihren MXM-Einheiten ebenso eine dedizierte Matrizen-Beschleunigung auf.

Für alle Tests gilt, dass jede Grafikkarte, falls möglich, mit den für sie optimalen Bibliotheken arbeitet. Alle GeForce-RTX-GPU arbeiten entsprechend mit Nvidias auf CUDA basiertem TensorRT, während für Intel Arc OpenVINO zum Einsatz kommt. AMD hat dagegen noch keine eigene Bibliothek für AI Inference, entsprechend kommt Microsofts überall lauffähiges DirectML zum Einsatz.

Benchmarks noch kaum möglich

AI-Benchmarks beziehungsweise vor allem die speziell angepassten APIs der GPU-Hersteller (bei Nvidia TensorRT) haben einen großen Nachteil: Während Spiele mit DirectX und Vulkan mehr Recheneinheiten ohne weitere Anpassungen in mehr Leistung umsetzen können, ist das mit AI-Benchmarks nicht so ohne Weiteres möglich. Hier benötigt es speziell für Blackwell angepasste Software-Versionen, um die größere AI-Leistung auch in mehr Performance umzusetzen. Das gilt nicht nur für die neue FP4-Präzision, auch die zusätzlichen Tensor-Kerne tun ohne eine Anpassung eigentlich nichts. Genauso kann es passieren, dass eine Software ohne angepasste Version gar nicht erst vernünftig funktioniert.

Das ist zum Beispiel im Procyon-Benchmark der Fall, der in der offiziellen Version gar nicht erst die eigentlichen Tests starten will und stattdessen mit einer Fehlermeldung abbricht. Erst eine kurz vor launch von Nvidia bereit gestellte Beta-Version hat hier Abhilfe geschaffen. ON1 Resize AI und Topaz Video AI laufen dagegen mit der GeForce RTX 5090 im Bereich der Messungenauigkeit gleich schnell wie mit der GeForce RTX 4090.

Nvidia hatte der Redaktion für den Procyon-Benchmark eine angepasste Vorabversion bereitgestellt, die dieselben Testszenarien wie der frei verfügbare Benchmark durchlaufen lassen. Entsprechend kann die Redaktion für den Test dennoch Ergebnisse anbieten, die öffentliche Software-Version kann mit Blackwell dagegen noch nicht umgehen.

In Bezug auf AI wird ComputerBase also nach dem Launch der Grafikkarte nochmals Benchmarks durchführen. Aktuell kann RTX 5000 im Parcours hingegen noch nicht zeigen, zu was die Architektur im Stande ist.

Procyon AI Image Generation mit Stable Diffusion

Abgesehen vom MS Copilot gibt es für den PC immer mehr Software, die AI für etwaige Aufgaben nutzt. Mit die bekannteste ist die Erstellung künstlicher Bilder nach Eingabe gewisser Vorgaben, die dann mittels „Stable Diffusion“ umgesetzt wird.

ComputerBase nutzt den synthetischen Benchmark Procyon AI Image Generation und daraus den Test „Stable Diffusion 1.5 (FP16)“ mit geringen Anforderungen sowie „Stable Diffusion XL (FP16)“ mit hohen Anforderungen an die GPU-Hardware, der unter anderem deutlich mehr VRAM benötigt und daher längst nicht überall läuft. Die Ergebnisse werden in „Sekunden pro Bild“ dargestellt.

Procyon AI Image Generation – Stable Diffusion 1.5 (FP16)
    • GeForce RTX 5090 (32 GB)
      0,9
    • GeForce RTX 4090 (24 GB)
      1,1
    • GeForce RTX 4080 Super (16 GB)
      1,5
    • GeForce RTX 4070 Ti Super (16 GB)
      1,8
    • GeForce RTX 4070 Super (12 GB)
      2,2
    • GeForce RTX 4070 (12 GB)
      2,6
    • GeForce RTX 3080 (10 GB)
      2,6
    • Radeon RX 7900 XTX (24 GB)
      3,1
    • Radeon RX 7900 XT (20 GB)
      3,6
    • Radeon RX 7900 GRE (16 GB)
      4,1
    • GeForce RTX 4060 Ti (8 GB)
      4,1
    • Arc B580 (12 GB)
      4,2
    • GeForce RTX 3060 Ti (8 GB)
      4,3
    • Radeon RX 7800 XT (16 GB)
      5,0
    • Radeon RX 7700 XT (12 GB)
      5,4
    • GeForce RTX 4060 (8 GB)
      5,4
    • Arc A770 (16 GB)
      5,7
    • Arc A580 (8 GB)
      8,5
    • Radeon RX 7600 (8 GB)
      9,1
    • Radeon RX 6800 XT (16 GB)
      15,8
    • Radeon RX 6700 XT (12 GB)
      30,1
Einheit: Sekunden pro Bild
Procyon AI Image Generation – Stable Diffusion XL (FP16)
    • GeForce RTX 5090 (32 GB)
      5,4
    • GeForce RTX 4090 (24 GB)
      7,5
    • GeForce RTX 4080 Super (16 GB)
      9,6
    • GeForce RTX 4070 Ti Super (16 GB)
      12,3
    • GeForce RTX 4070 Super (12 GB)
      14,6
    • GeForce RTX 4070 (12 GB)
      18,3
    • GeForce RTX 3080 (10 GB)
      19,4
    • Arc B580 (12 GB)
      23,5
    • Radeon RX 7900 XTX (24 GB)
      25,2
    • Radeon RX 7900 XT (20 GB)
      28,5
    • Radeon RX 7900 GRE (16 GB)
      34,2
    • Arc A770 (16 GB)
      34,2
    • Radeon RX 7800 XT (16 GB)
      42,2
    • Arc A580 (8 GB)
      43,4
    • Radeon RX 7700 XT (12 GB)
      47,5
    • Radeon RX 7600 (8 GB)
      Absturz
    • Radeon RX 6800 XT (16 GB)
      Absturz
    • Radeon RX 6700 XT (12 GB)
      Absturz
    • GeForce RTX 4060 Ti (8 GB)
      Absturz
    • GeForce RTX 4060 (8 GB)
      Absturz
    • GeForce RTX 3060 Ti (8 GB)
      Absturz
Einheit: Sekunden pro Bild

Topaz Video AI 5 – Aufhübschung von Videos

Neben dem Erstellen von Bildern gehört das Optimieren/Verbessern/Aufhübschen von Bildern und Videos zu klassischen KI-Aufgaben. Als Repräsentant kommt der integrierte Benchmark aus Topaz Video AI 5 zum Einsatz, den in der freien Version auch jeder selbst kostenlos und ohne Einschränkungen ausführen kann.

Der Benchmark nutzt verschiedene neuronale Netzwerke, die dafür verwendet werden, verschiedene Effekte auf Videos anzuwenden. Die Ergebnisse werden in klassischen Frames per Second dargestellt. ComputerBase fasst dabei alle Ergebnisse der verschiedenen Effekte zu einem einzelnen Wert zusammen und nutzt dafür das geometrische Mittel.

Topaz Video AI 5
    • GeForce RTX 5090 (32 GB)
      25,9
    • GeForce RTX 4090 (24 GB)
      25,6
    • GeForce RTX 4080 Super (16 GB)
      20,5
    • GeForce RTX 4070 Ti Super (16 GB)
      18,3
    • Radeon RX 7900 XTX (24 GB)
      15,6
    • GeForce RTX 4070 Super (12 GB)
      15,4
    • GeForce RTX 3080 (10 GB)
      13,9
    • Radeon RX 7900 XT (20 GB)
      13,8
    • GeForce RTX 4070 (12 GB)
      13,0
    • Radeon RX 7900 GRE (16 GB)
      12,6
    • Radeon RX 7800 XT (16 GB)
      10,7
    • Radeon RX 7700 XT (12 GB)
      9,8
    • Radeon RX 6800 XT (16 GB)
      9,8
    • GeForce RTX 4060 Ti (8 GB)
      9,1
    • GeForce RTX 3060 Ti (8 GB)
      8,8
    • Radeon RX 6700 XT (12 GB)
      6,5
    • Arc A770 (16 GB)
      6,5
    • GeForce RTX 4060 (8 GB)
      6,3
    • Arc A580 (8 GB)
      5,9
    • Radeon RX 7600 (8 GB)
      5,7
    • Arc B580 (12 GB)
      3,8
Einheit: Bilder pro Sekunde (FPS)

ON1 Resize AI – Bildervergrößerung

Der dritte und letzte AI-Benchmark beschäftigt sich mit dem Vergrößern von Bildern. Mit Hilfe der Software ON1 Resize AI werden 10 verschiedene Fotos in der Auflösung pro Achse verdoppelt. Dabei handelt es sich um 10 ohnehin schon hoch aufgelöste Bilder mit einer Auflösung von 5.472 × 3.078 bis zu 7.657 × 5.119, die Anforderungen sind entsprechend hoch. Mittels Log-Datei wird die genaue Berechnungszeit der einzelnen Bilder erfasst und daraus dann das Ergebnis mittels des geometrischen Mittels gebildet. Die Ergebnisse werden in „Sekunden pro Bild“ ausgegeben.

ON1 Resize AI 2023.5
    • GeForce RTX 5090 (32 GB)
      4,9
    • GeForce RTX 4090 (24 GB)
      5,3
    • GeForce RTX 4080 Super (16 GB)
      6,9
    • GeForce RTX 4070 Ti Super (16 GB)
      7,3
    • GeForce RTX 4070 Super (12 GB)
      8,0
    • Radeon RX 7900 XTX (24 GB)
      9,1
    • GeForce RTX 3080 (10 GB)
      9,4
    • Radeon RX 7900 XT (20 GB)
      9,6
    • GeForce RTX 4070 (12 GB)
      9,9
    • Radeon RX 7900 GRE (16 GB)
      10,6
    • Arc B580 (12 GB)
      10,9
    • GeForce RTX 4060 Ti (8 GB)
      11,4
    • Radeon RX 7800 XT (16 GB)
      12,2
    • Radeon RX 7700 XT (12 GB)
      12,4
    • Radeon RX 6800 XT (16 GB)
      13,7
    • GeForce RTX 3060 Ti (8 GB)
      14,9
    • GeForce RTX 4060 (8 GB)
      15,6
    • Radeon RX 6700 XT (12 GB)
      16,4
    • Radeon RX 7600 (8 GB)
      18,7
    • Arc A770 (16 GB)
      47,5
    • Arc A580 (8 GB)
      56,8
Einheit: Sekunden pro Bild

Blackmagic Davinci Resolve 19 – AI

In Blackmagic Davinci Resolve 19 lässt sich umfangreiche Videobearbeitung auf professionellen durchführen. Unter anderem lassen sich Videos auch mit künstlicher Intelligenz bearbeiten, angefangen mit Super Resolution Videostabilisierung, Tracking-Möglichkeiten oder der automatischen Erstellung von Untertiteln anhand von Audioinformationen.

Für die Benchmarks mit Blackmagic Davinci Resolve Studio 19 nutzt ComputerBase die Testsuite PugetBench for Creators vom Systemintegrator PugetSystems, der sich auf professionelle Systeme spezialisiert hat. Die Testsuite erlaubt neben AI-Benchmarks auch noch weitere Testreihen mit Blackmagic Davinci Resolve 19, unter anderem Studio- sowie Codec-Tests lassen sich damit durchlaufen.

PugetBench für DaVinci Resolve 19 – AI
  • AI Score (Extended):
    • GeForce RTX 4090 (24 GB)
      128
    • GeForce RTX 5090 (32 GB)
      126
Einheit: Punkte

Auch mit einer ersten Software-Anpassung für Blackwell kann sich die GeForce RTX 5090 im PugetBench für DaVinci Resolve 19 nicht von der GeForce RTX 4090 absetzen. Immerhin, das Programm stürzt mit der neuen Version nicht mehr ab und langsamer als mit der alten Karte ist es auch nicht mehr – nur eben auch nicht schneller. 128 zu 126 Punkten zu Gunsten der GeForce RTX 4090 lautet das Endergebnis.

Ein Blick in die Einzelergebnisse zeigt dann, dass es durchaus Abstände zwischen den Grafikkarten gibt, mal für die eine, mal für die andere. Optical Flow mittels AI läuft auf der GeForce RTX 5090 mit 21,3 zu 17,2 FPS zum Beispiel 24 Prozent schneller auf der Blackwell-Grafikkarte, während der Tracking-Test mit 78,5 zu 63,1 FPS auf der GeForce RTX 4090 24 Prozent besser läuft.

Blackmagic Davinci Resolve 19 – Studio

Davinci Resolve 19 lässt sich natürlich auch als klassischer Studio-Benchmark abseits von AI benutzen, wo einzelne Effekte mittels GPU Compute ganz klassisch auf der Grafikkarte berechnet werden. Der PugetBench for Creators bietet diesbezüglich unter anderem Tests mit Noise Reduction, Blur und der Erstellung von Lens Flares an.

PugetBench für DaVinci Resolve 19 – Studio
  • GPU Effects (Extended):
    • GeForce RTX 5090 (32 GB)
      202
    • GeForce RTX 4090 (24 GB)
      145
Einheit: Punkte

Anders als bei den AI-Tests kann Davinci Resolve 19 in den Studio-Benchmarks ordentlich von der GeForce RTX 5090 profitieren, die sich gegenüber der GeForce RTX 5090 einen Vorsprung von 39 Prozent erkämpfen kann. Das ist mehr als in jeglichem getesteten Spiel, was vermutlich mit der deutlich gesteigerten Speicherbandbreite zu erklären ist, die in Studio-Anwendungen oft von Bedeutung ist.

In den Einzeltests ist dann zu erkennen, dass sämtliche Testszenarien auf der GeForce RTX 5090 schneller laufen. Eine Besonderheit ist dann die Testreihe zum Nachschärfen, wo die Blackwell-Grafikkarte einen Ausreißer zeigt und satte 120 Prozent mehr Performance als die GeForce RTX 4090 liefert. Auch hier bietet sich die Speicherbandbreite als mögliche Erklärung an, jedoch muss es noch einen weiteren Faktor für diesen Sprung geben.

Blackmagic Davinci Resolve 19 – Encoding

Nach der Videobearbeitung mit Davinci Resolve 19 muss das Video dann natürlich auch exportiert und damit encodiert werden. Auch hierfür bietet PugetBench for Creators eine Testreihe an, die H.264- und HEVC-Videos bearbeitet sowie encodiert.

PugetBench für DaVinci Resolve 19 – Video-Transcodierung
  • LongGOP/Encoding/Processing (Extended):
    • GeForce RTX 5090 (32 GB)
      180
    • GeForce RTX 4090 (24 GB)
      123
Einheit: Punkte

Bei der Testreihe hat die GeForce RTX 5090 noch einmal einen größeren Vorteil gegenüber der GeForce RTX 4090, was aufgrund der 3 anstatt 2 Encoder, die darüber hinaus auch noch schneller geworden sind, nicht verwundert. Einen 46 prozentigen Vorsprung kann die Blackwell-Grafikkarte in diesem Test für sich erkämpfen.

Die Einzelergebnisse zeigen wieder größere Varianzen. Ein H.264-Video lässt sich auf der GeForce RTX 5090 zum Beispiel nur 15 Prozent schneller encodieren, ein HEVC-Video dagegen gleich 30 Prozent und liegt dieses dann im HDR-Format vor sind es gar 46 Prozent.

Noch einmal deutlich größer sind die Sprünge beim Video-Processing, wenn dies in 4K-Auflösung durchgeführt wird. Ein H.264-Video mit 150 Mbps und einer Farbunterabtastung von 4:2:0 läuft auf der GeForce RTX 5090 111 Prozent schneller, ein 100-Mbit-Video im HEVC-Format und einer Farbunterabtastung von 4:2:2 mit HDR sind es 95 Prozent.