Nvidia GeForce RTX 5070 Ti im Test: AI-, Studio- und Video-Benchmarks

 8/10
Wolfgang Andermahr
594 Kommentare

Der neue Testparcours umfasst auch „AI-Benchmarks“. Neben dem Procyon AI Image Generation Benchmark von UL Solutions (3DMark, PCMark), der vielfältige AI-Lasten nachstellt, sind auch zwei handfeste Praxisbeispiele darunter:

Moderne PC-Hardware kann bereits länger ein neuronales Netzwerk beschleunigen, konzentriert sich anders als eine NPU aber nicht auf Effizienz, sondern auf Performance. Nvidia verbaut seit der GeForce-RTX-2000-Serie so genannte Tensor-Kerne in Gaming-Grafikkarten, die „AI“ beschleunigen können. AMD hat zwar keine separate Hardware in den GPUs, ist seit RDNA 3 aufgrund neuer WMMA-Operationen (Wave Matrix Multiply Accumulate) aber auch deutlich besser für AI gerüstet. Und Intels Arc-Beschleuniger fahren mit ihren MXM-Einheiten ebenso eine dedizierte Matrizen-Beschleunigung auf.

Für alle Tests gilt, dass jede Grafikkarte, falls möglich, mit den für sie optimalen Bibliotheken arbeitet. Alle GeForce-RTX-GPU arbeiten entsprechend mit Nvidias auf CUDA basiertem TensorRT, während für Intel Arc OpenVINO zum Einsatz kommt. AMD hat dagegen noch keine eigene Bibliothek für AI Inference, entsprechend kommt Microsofts überall lauffähiges DirectML zum Einsatz.

Procyon AI Image Generation mit Stable Diffusion

Abgesehen vom MS Copilot gibt es für den PC immer mehr Software, die AI für etwaige Aufgaben nutzt. Mit die bekannteste ist die Erstellung künstlicher Bilder nach Eingabe gewisser Vorgaben, die dann mittels „Stable Diffusion“ umgesetzt wird.

ComputerBase nutzt den synthetischen Benchmark Procyon AI Image Generation und daraus den Test „Stable Diffusion 1.5 (FP16)“ mit geringen Anforderungen sowie „Stable Diffusion XL (FP16)“ mit hohen Anforderungen an die GPU-Hardware, der unter anderem deutlich mehr VRAM benötigt und daher längst nicht immer läuft. Die Ergebnisse werden in „Sekunden pro Bild“ dargestellt.

Procyon AI Image Generation – Stable Diffusion 1.5 (FP16)
    • GeForce RTX 5090 (32 GB)
      0,9
    • GeForce RTX 4090 (24 GB)
      1,1
    • GeForce RTX 5080 (16 GB)
      1,3
    • GeForce RTX 4080 Super (16 GB)
      1,5
    • GeForce RTX 5070 Ti (16 GB)
      1,6
    • GeForce RTX 4070 Ti Super (16 GB)
      1,8
    • GeForce RTX 4070 Super (12 GB)
      2,2
    • GeForce RTX 4070 (12 GB)
      2,6
    • GeForce RTX 3080 (10 GB)
      2,6
    • Radeon RX 7900 XTX (24 GB)
      3,1
    • Radeon RX 7900 XT (20 GB)
      3,6
    • Radeon RX 7900 GRE (16 GB)
      4,1
    • GeForce RTX 4060 Ti (8 GB)
      4,1
    • Arc B580 (12 GB)
      4,2
    • GeForce RTX 3060 Ti (8 GB)
      4,3
    • Radeon RX 7800 XT (16 GB)
      5,0
    • Radeon RX 7700 XT (12 GB)
      5,4
    • GeForce RTX 4060 (8 GB)
      5,4
    • Arc A770 (16 GB)
      5,7
    • Arc A580 (8 GB)
      8,5
    • Radeon RX 7600 (8 GB)
      9,1
    • Radeon RX 6800 XT (16 GB)
      15,8
    • Radeon RX 6700 XT (12 GB)
      30,1
Einheit: Sekunden pro Bild
Procyon AI Image Generation – Stable Diffusion XL (FP16)
    • GeForce RTX 5090 (32 GB)
      5,4
    • GeForce RTX 4090 (24 GB)
      7,5
    • GeForce RTX 5080 (16 GB)
      9,0
    • GeForce RTX 4080 Super (16 GB)
      9,6
    • GeForce RTX 5070 Ti (16 GB)
      11,1
    • GeForce RTX 4070 Ti Super (16 GB)
      12,3
    • GeForce RTX 4070 Super (12 GB)
      14,6
    • GeForce RTX 4070 (12 GB)
      18,3
    • GeForce RTX 3080 (10 GB)
      19,4
    • Arc B580 (12 GB)
      23,5
    • Radeon RX 7900 XTX (24 GB)
      25,2
    • Radeon RX 7900 XT (20 GB)
      28,5
    • Radeon RX 7900 GRE (16 GB)
      34,2
    • Arc A770 (16 GB)
      34,2
    • Radeon RX 7800 XT (16 GB)
      42,2
    • Arc A580 (8 GB)
      43,4
    • Radeon RX 7700 XT (12 GB)
      47,5
    • Radeon RX 7600 (8 GB)
      Absturz
    • Radeon RX 6800 XT (16 GB)
      Absturz
    • Radeon RX 6700 XT (12 GB)
      Absturz
    • GeForce RTX 4060 Ti (8 GB)
      Absturz
    • GeForce RTX 4060 (8 GB)
      Absturz
    • GeForce RTX 3060 Ti (8 GB)
      Absturz
Einheit: Sekunden pro Bild

Bei dem Stable-Diffusion-1.5-Test im Procyon-Benchmark arbeitet die GeForce RTX 5070 Ti 11 Prozent schneller als die GeForce RTX 4070 Ti Super, bleibt aber noch 6 Prozent hinter der GeForce RTX 4080 Super zurück. Im deutlich anspruchsvolleren Stable-Diffusion-XL-Test liegt die GeForce RTX 5070 Ti dann 10 Prozent vor der GeForce RTX 4070 Ti Super, während die GeForce RTX 4080 Super 14 Prozent schneller ist.

Topaz Video AI 5 – Aufhübschen von Videos

Neben dem Erstellen von Bildern gehört das Optimieren/Verbessern/Aufhübschen von Bildern und Videos zu klassischen KI-Aufgaben. Als Repräsentant kommt der integrierte Benchmark aus Topaz Video AI 5 zum Einsatz, den in der freien Version auch jeder selbst kostenlos und ohne Einschränkungen ausführen kann.

Der Benchmark nutzt verschiedene neuronale Netzwerke, die dafür verwendet werden, verschiedene Effekte auf Videos anzuwenden. Die Ergebnisse werden in klassischen Frames per Second dargestellt. ComputerBase fasst dabei alle Ergebnisse der verschiedenen Effekte zu einem einzelnen Wert zusammen und nutzt dafür das geometrische Mittel.

Topaz Video AI 5
    • GeForce RTX 5090 (32 GB)
      25,9
    • GeForce RTX 4090 (24 GB)
      25,6
    • GeForce RTX 5080 (16 GB)
      20,5
    • GeForce RTX 4080 Super (16 GB)
      20,5
    • GeForce RTX 4070 Ti Super (16 GB)
      18,3
    • GeForce RTX 5070 Ti (16 GB)
      18,2
    • Radeon RX 7900 XTX (24 GB)
      15,6
    • GeForce RTX 4070 Super (12 GB)
      15,4
    • GeForce RTX 3080 (10 GB)
      13,9
    • Radeon RX 7900 XT (20 GB)
      13,8
    • GeForce RTX 4070 (12 GB)
      13,0
    • Radeon RX 7900 GRE (16 GB)
      12,6
    • Radeon RX 7800 XT (16 GB)
      10,7
    • Radeon RX 7700 XT (12 GB)
      9,8
    • Radeon RX 6800 XT (16 GB)
      9,8
    • GeForce RTX 4060 Ti (8 GB)
      9,1
    • GeForce RTX 3060 Ti (8 GB)
      8,8
    • Radeon RX 6700 XT (12 GB)
      6,5
    • Arc A770 (16 GB)
      6,5
    • GeForce RTX 4060 (8 GB)
      6,3
    • Arc A580 (8 GB)
      5,9
    • Radeon RX 7600 (8 GB)
      5,7
    • Arc B580 (12 GB)
      3,8
Einheit: Bilder pro Sekunde (FPS)

Topaz Video AI 5 hat bis jetzt keine Softwareanpassung für Blackwell erhalten und deshalb ist auch die GeForce RTX 5070 Ti im Test erneut nicht schneller als die GeForce RTX 4070 Ti Super. Anders als Spiele benötigen AI-Programme explizite Software-Anpassungen an neue Hardware, um an Performance zulegen zu können.

ON1 Resize AI – Bildervergrößerung

Der dritte und letzte AI-Benchmark beschäftigt sich mit dem Vergrößern von Bildern. Mit Hilfe der Software ON1 Resize AI werden 10 verschiedene Fotos in der Auflösung pro Achse verdoppelt. Dabei handelt es sich um 10 ohnehin schon hoch aufgelöste Bilder mit einer Auflösung von 5.472 × 3.078 bis zu 7.657 × 5.119, die Anforderungen sind entsprechend hoch. Mittels Log-Datei wird die genaue Berechnungszeit der einzelnen Bilder erfasst und daraus dann das Ergebnis mittels des geometrischen Mittels gebildet. Die Ergebnisse werden in „Sekunden pro Bild“ ausgegeben.

ON1 Resize AI 2023.5
    • GeForce RTX 5090 (32 GB)
      4,9
    • GeForce RTX 4090 (24 GB)
      5,3
    • GeForce RTX 5080 (16 GB)
      6,8
    • GeForce RTX 4080 Super (16 GB)
      6,9
    • GeForce RTX 5070 Ti (16 GB)
      7,2
    • GeForce RTX 4070 Ti Super (16 GB)
      7,3
    • GeForce RTX 4070 Super (12 GB)
      8,0
    • Radeon RX 7900 XTX (24 GB)
      9,1
    • GeForce RTX 3080 (10 GB)
      9,4
    • Radeon RX 7900 XT (20 GB)
      9,6
    • GeForce RTX 4070 (12 GB)
      9,9
    • Radeon RX 7900 GRE (16 GB)
      10,6
    • Arc B580 (12 GB)
      10,9
    • GeForce RTX 4060 Ti (8 GB)
      11,4
    • Radeon RX 7800 XT (16 GB)
      12,2
    • Radeon RX 7700 XT (12 GB)
      12,4
    • Radeon RX 6800 XT (16 GB)
      13,7
    • GeForce RTX 3060 Ti (8 GB)
      14,9
    • GeForce RTX 4060 (8 GB)
      15,6
    • Radeon RX 6700 XT (12 GB)
      16,4
    • Radeon RX 7600 (8 GB)
      18,7
    • Arc A770 (16 GB)
      47,5
    • Arc A580 (8 GB)
      56,8
Einheit: Sekunden pro Bild

Auch ON1 hat bis jetzt keine Softwareanpassung zu Blackwell erhalten und sieht die RTX 5070 Ti nur auf dem Niveau der RTX 4070 Ti Super.

Blackmagic Davinci Resolve 19 – AI

In Blackmagic Davinci Resolve 19 lässt sich umfangreiche Videobearbeitung auf professionellen Niveau durchführen. Unter anderem lassen sich Videos auch mit künstlicher Intelligenz bearbeiten, angefangen mit Super Resolution Videostabilisierung, Tracking-Möglichkeiten oder der automatischen Erstellung von Untertiteln anhand von Audioinformationen.

Für die Benchmarks mit Blackmagic Davinci Resolve Studio 19 nutzt ComputerBase die Testsuite PugetBench for Creators vom Systemintegrator PugetSystems, der sich auf professionelle Systeme spezialisiert hat. Die Testsuite erlaubt neben AI-Benchmarks auch weitere Testreihen mit Blackmagic Davinci Resolve 19, unter anderem Studio- sowie Codec-Tests lassen sich damit durchlaufen.

PugetBench für DaVinci Resolve 19 – AI
  • AI Score (Extended):
    • GeForce RTX 4090 (24 GB)
      128,0
    • GeForce RTX 5090 (32 GB)
      126,0
    • GeForce RTX 5080 (16 GB)
      109,0
    • GeForce RTX 4080 Super (16 GB)
      108,0
    • GeForce RTX 4070 Ti Super (16 GB)
      104,0
    • GeForce RTX 5070 Ti (16 GB)
      102,0
    • GeForce RTX 4070 Super (12 GB)
      81,8
    • GeForce RTX 4070 (12 GB)
      76,1
    • Radeon RX 7900 XTX (24 GB)
      59,8
    • GeForce RTX 4060 Ti (8 GB)
      59,0
    • Radeon RX 7900 XT (20 GB)
      56,9
    • GeForce RTX 4060 (8 GB)
      52,3
    • Radeon RX 7900 GRE (16 GB)
      39,4
    • Radeon RX 7800 XT (16 GB)
      38,5
    • Radeon RX 7700 XT (12 GB)
      37,3
    • Arc A770 (16 GB)
      35,6
    • Radeon RX 6800 XT (16 GB)
      34,5
    • Radeon RX 6700 XT (12 GB)
      27,7
    • Radeon RX 7600 (8 GB)
      25,9
    • GeForce RTX 3060 Ti (8 GB)
      0,0
      Stürzt ab
Einheit: Punkte

ComputerBase steht eine für Blackwell optimierte Version von Davinci Resolve Studio 19 zur Verfügung, doch die AI-Testreihe des PugetBench zeigt auf der GeForce RTX 5070 Ti trotzdem keinerlei Verbesserung gegenüber der GeForce RTX 4070 Ti Super. Ganz im Gegenteil: Die alte Grafikkarte ist geringfügig schneller.

Blackmagic Davinci Resolve 19 – Studio

Davinci Resolve 19 lässt sich natürlich auch als klassischer „Studio-Benchmark“ (Workflows für Kreative) abseits von AI benutzen, wo einzelne Effekte mittels GPU Compute ganz klassisch auf der Grafikkarte berechnet werden. Der PugetBench for Creators bietet diesbezüglich unter anderem Tests mit Noise Reduction, Blur und der Erstellung von Lens Flares an.

PugetBench für DaVinci Resolve 19 – Studio
  • GPU Effects (Extended):
    • GeForce RTX 5090 (32 GB)
      202,0
    • GeForce RTX 4090 (24 GB)
      145,0
    • GeForce RTX 5080 (16 GB)
      127,0
    • GeForce RTX 5070 Ti (16 GB)
      112,0
    • Radeon RX 7900 XTX (24 GB)
      107,0
    • GeForce RTX 4080 Super (16 GB)
      105,0
    • GeForce RTX 4070 Ti Super (16 GB)
      94,5
    • Radeon RX 7900 XT (20 GB)
      92,0
    • GeForce RTX 4070 Super (12 GB)
      74,3
    • GeForce RTX 4070 (12 GB)
      70,9
    • Radeon RX 6800 XT (16 GB)
      58,5
    • Radeon RX 7900 GRE (16 GB)
      52,5
    • Radeon RX 7800 XT (16 GB)
      52,0
    • Radeon RX 7700 XT (12 GB)
      51,7
    • GeForce RTX 4060 Ti (8 GB)
      44,5
    • Arc A770 (16 GB)
      41,8
    • GeForce RTX 4060 (8 GB)
      39,6
    • Radeon RX 6700 XT (12 GB)
      39,2
    • Radeon RX 7600 (8 GB)
      29,6
Einheit: Punkte

In den „Studio-Test“ (Kreativ-Workflows) mit DaVinci Resolve 19 zeigt sich erstmals eine bessere Performance gegenüber der GeForce RTX 4070 Ti Super: Die GeForce RTX 5070 Ti ist in der Testreihe 19 Prozent schneller als die alte Grafikkarte und platziert sich damit 7 Prozent über einer GeForce RTX 4080 Super. Vermutlich ist die deutlich höhere Speicherbandbreite der Blackwell-Grafikkarte für den überproportionalen Leistungssprung verantwortlich.

Blackmagic Davinci Resolve 19 – Encoding

Nach der Videobearbeitung mit Davinci Resolve 19 muss das Video dann natürlich auch exportiert und damit encodiert werden. Auch hierfür bietet PugetBench for Creators eine Testreihe an, die H.264- und HEVC-Videos bearbeitet sowie encodiert.

PugetBench für DaVinci Resolve 19 – Video-Transcodierung
  • LongGOP/Encoding/Processing (Extended):
    • GeForce RTX 5090 (32 GB)
      180,0
    • GeForce RTX 5080 (16 GB)
      161,0
    • GeForce RTX 5070 Ti (16 GB)
      161,0
    • GeForce RTX 4090 (24 GB)
      123,0
    • GeForce RTX 4080 Super (16 GB)
      120,0
    • GeForce RTX 4070 Ti Super (16 GB)
      120,0
    • Radeon RX 7900 XTX (24 GB)
      107,0
    • Radeon RX 7900 XT (20 GB)
      107,0
    • Radeon RX 7900 GRE (16 GB)
      107,0
    • Radeon RX 7800 XT (16 GB)
      107,0
    • Radeon RX 7700 XT (12 GB)
      107,0
    • GeForce RTX 4070 Super (12 GB)
      100,0
    • GeForce RTX 4070 (12 GB)
      100,0
    • Radeon RX 7600 (8 GB)
      91,9
    • GeForce RTX 4060 Ti (8 GB)
      91,2
    • GeForce RTX 4060 (8 GB)
      91,0
    • Arc A770 (16 GB)
      76,6
    • Radeon RX 6800 XT (16 GB)
      60,1
    • Radeon RX 6700 XT (12 GB)
      60,0
Einheit: Punkte

Beim Encoding-Test machen sich die neuen Videoeinheiten von Blackwell positiv bemerkbar: Im PugetBench zeigt sich eine 34 Prozent bessere Performance als mit der GeForce RTX 4070 Ti Super. Die GeForce RTX 5070 Ti liegt damit auf dem Niveau der GeForce RTX 5080 mit der gleichen GPU, während die GeForce RTX 5090 mit dem zusätzlichen dritten aktiven Encoder noch einmal etwas davon ziehen kann.

Wo gibt es GeForce RTX 5090, 5080 oder 5070 Ti zu kaufen? Unser RTX-50-Verfügbarkeits-Check informiert über (absurd teure) Listungen.