AMD Radeon RX 9070 (XT) im Test: AI-, Studio- und Video-Benchmarks

 8/10
Wolfgang Andermahr
904 Kommentare

Das Thema künstliche Intelligenz, „AI“ schwirrt derzeit in der gesamten IT-Branche herum. Sei es Hardware für AI oder Software die (oft angeblich) AI für irgendwelche Verbesserungen nutzt – das Thema ist nicht mehr wegzudenken. Umso mehr, da nun auch Microsoft ein neuronales Netzwerk für den Copilot+ nutzt und manche SoCs mit einer NPU auch separate Hardware verbaut haben, die Matrizen-Berechnungen, aus diesen entsteht ein neuronales Netzwerk, effizient durchführen können.

Moderne PC-Hardware kann bereits länger ein neuronales Netzwerk beschleunigen, konzentriert sich anders als eine NPU aber nicht auf Effizienz, sondern auf Performance. Nvidia verbaut seit der GeForce-RTX-2000-Serie sogenannte Tensor-Kerne in Gaming-Grafikkarten, die „AI“ beschleunigen können. AMD hat zwar keine separate Hardware in den GPUs, ist seit RDNA 3 aufgrund neuer WMMA-Operationen (Wave Matrix Multiply Accumulate) aber auch deutlich besser für AI gerüstet. Und Intels Arc-Beschleuniger fahren mit ihren MXM-Einheiten ebenso eine dedizierte Matrizen-Beschleunigung auf. Erwähnenswert ist noch, dass auf dem Heim-PC nicht das AI-Training, also das Anlernen eines neuronalen Netzwerkes, sondern das AI-Inference, das Ausführen eines neuronalen Netzwerkes im Fokus steht. Beides hat sehr unterschiedliche Anforderungen und benötigt auch sehr verschiedene Hardware.

Für alle Tests gilt, dass jede Grafikkarte, falls möglich, mit ihrer für sie optimalen Bibliotheken arbeitet. Alle GeForce-RTX-GPU arbeiten mit Nvidias auf CUDA basiertem TensorRT, während für Intel Arc OpenVINO zum Einsatz kommt. AMD hat noch keine eigene Bibliothek für AI Inference, entsprechend kommt Microsofts überall lauffähiges DirectML zum Einsatz.

Procyon AI Image Generation mit Stable Diffusion

Abgesehen vom Copilot+ gibt es für den PC immer mehr Software, die AI für etwaige Aufgaben nutzt. Mit die bekannteste ist die Erstellung künstlicher Bilder nach Eingabe gewisser Vorgaben, die dann mittels „Stable Diffusion“ umgesetzt wird. ComputerBase nutzt den synthetischen Benchmark Procyon AI Image Generation dafür und daraus den Test „Stable Diffusion 1.5 (FP16)“ mit geringen Anforderungen sowie „Stable Diffusion XL (FP16)“ mit hohen Anforderungen an die GPU-Hardware, der unter anderem deutlich mehr VRAM benötigt und daher längst nicht überall läuft. Die Ergebnisse werden in „Sekunden pro Bild“ dargestellt.

Procyon AI Image Generation – Stable Diffusion 1.5 (FP16)
    • GeForce RTX 5090 (32 GB)
      0,9
    • GeForce RTX 4090 (24 GB)
      1,1
    • GeForce RTX 5080 (16 GB)
      1,3
    • GeForce RTX 4080 Super (16 GB)
      1,5
    • GeForce RTX 5070 Ti (16 GB)
      1,6
    • GeForce RTX 4070 Ti Super (16 GB)
      1,8
    • GeForce RTX 5070 (12 GB)
      2,1
    • GeForce RTX 4070 Super (12 GB)
      2,2
    • Radeon RX 9070 XT (16 GB)
      2,4
    • GeForce RTX 4070 (12 GB)
      2,6
    • GeForce RTX 3080 (10 GB)
      2,6
    • Radeon RX 9070 (16 GB)
      2,8
    • Radeon RX 7900 XTX (24 GB)
      3,1
    • Radeon RX 7900 XT (20 GB)
      3,6
    • Radeon RX 7900 GRE (16 GB)
      4,1
    • GeForce RTX 4060 Ti (8 GB)
      4,1
    • Arc B580 (12 GB)
      4,2
    • GeForce RTX 3060 Ti (8 GB)
      4,3
    • Radeon RX 7800 XT (16 GB)
      5,0
    • Radeon RX 7700 XT (12 GB)
      5,4
    • GeForce RTX 4060 (8 GB)
      5,4
    • Arc A770 (16 GB)
      5,7
    • Arc A580 (8 GB)
      8,5
    • Radeon RX 7600 (8 GB)
      9,1
    • Radeon RX 6800 XT (16 GB)
      15,8
    • Radeon RX 6700 XT (12 GB)
      30,1
Einheit: Sekunden pro Bild

Im Procyon AI Image Generation zeigen sich große Sprünge, die AMD bei RDNA 4 bezüglich der AI-Leistung gemacht hat. Die Radeon RX 9070 ist mit Stable Diffusion 1.5 108 Prozent schneller als die Radeon RX 7800 XT und immer noch 29 Prozent schneller als die Radeon RX 7900 XTX, obwohl diese über deutlich mehr Ausführungseinheiten verfügt. An die GeForce-Grafikkarten mit ihren dedizierten Matrix-Einheiten kommen aber auch die neuen Radeons nicht heran, sind aber deutlich herangerückt. Die Radeon RX 9070 XT liegt 14 Prozent hinter der GeForce RTX 5070 5070 zurück.

Mit dem komplexeren Stable Diffusion XL sieht es ähnlich aus. Die Radeon RX 9070 XT ist 131 Prozent schneller als die Radeon RX 7800 XT und 38 Prozent schneller als die Radeon RX 7900 XTX. Damit rücken die Radeons in die Reichweite der GeForce-Grafikkarten, erreichen diese aber nicht ganz. Der Rückstand zur GeForce RTX 5070 beträgt 22 Prozent.

Procyon AI Image Generation – Stable Diffusion XL (FP16)
    • GeForce RTX 5090 (32 GB)
      5,4
    • GeForce RTX 4090 (24 GB)
      7,5
    • GeForce RTX 5080 (16 GB)
      9,0
    • GeForce RTX 4080 Super (16 GB)
      9,6
    • GeForce RTX 5070 Ti (16 GB)
      11,1
    • GeForce RTX 4070 Ti Super (16 GB)
      12,3
    • GeForce RTX 4070 Super (12 GB)
      14,6
    • GeForce RTX 5070 (12 GB)
      15,0
    • Radeon RX 9070 XT (16 GB)
      18,3
    • GeForce RTX 4070 (12 GB)
      18,3
    • GeForce RTX 3080 (10 GB)
      19,4
    • Radeon RX 9070 (16 GB)
      21,4
    • Arc B580 (12 GB)
      23,5
    • Radeon RX 7900 XTX (24 GB)
      25,2
    • Radeon RX 7900 XT (20 GB)
      28,5
    • Radeon RX 7900 GRE (16 GB)
      34,2
    • Arc A770 (16 GB)
      34,2
    • Radeon RX 7800 XT (16 GB)
      42,2
    • Arc A580 (8 GB)
      43,4
    • Radeon RX 7700 XT (12 GB)
      47,5
    • Radeon RX 7600 (8 GB)
      Absturz
    • Radeon RX 6800 XT (16 GB)
      Absturz
    • Radeon RX 6700 XT (12 GB)
      Absturz
    • GeForce RTX 4060 Ti (8 GB)
      Absturz
    • GeForce RTX 4060 (8 GB)
      Absturz
    • GeForce RTX 3060 Ti (8 GB)
      Absturz
Einheit: Sekunden pro Bild

Topaz Video AI 5 – Aufhübschung von Videos

Neben dem Erstellen von Bildern gehört die (zumindest theoretische) Aufhübschung von Bildern zu klassischen KI-Aufgaben. Hierfür kommt der Integrierte Benchmark Topaz Video AI 5, den in der freien Version auch jeder selbst kostenlos und ohne Einschränkungen ausführen kann. Der Benchmark nutzt verschiedene neuronale Netzwerke, die dazu benutzt werden, verschiedene Effekte auf Videos anzuwenden. Die Ergebnisse werden in klassischen Frames per Second dargestellt, so viele Bilder kann die Hardware in Echtzeit bei einem 1.080p-Video berechnen. ComputerBase fasst dabei alle Ergebnisse der verschiedenen Effekte zu einem einzelnen Wert zusammen und nutzt dafür das geometrische Mittel.

Topaz Video AI 5
    • GeForce RTX 5090 (32 GB)
      25,9
    • GeForce RTX 4090 (24 GB)
      25,6
    • Radeon RX 9070 XT (16 GB)
      22,7
    • GeForce RTX 5080 (16 GB)
      20,5
    • GeForce RTX 4080 Super (16 GB)
      20,5
    • Radeon RX 9070 (16 GB)
      20,0
    • GeForce RTX 4070 Ti Super (16 GB)
      18,3
    • GeForce RTX 5070 Ti (16 GB)
      18,2
    • Radeon RX 7900 XTX (24 GB)
      15,6
    • GeForce RTX 5070 (12 GB)
      15,5
    • GeForce RTX 4070 Super (12 GB)
      15,4
    • GeForce RTX 3080 (10 GB)
      13,9
    • Radeon RX 7900 XT (20 GB)
      13,8
    • GeForce RTX 4070 (12 GB)
      13,0
    • Radeon RX 7900 GRE (16 GB)
      12,6
    • Radeon RX 7800 XT (16 GB)
      10,7
    • Radeon RX 7700 XT (12 GB)
      9,8
    • Radeon RX 6800 XT (16 GB)
      9,8
    • GeForce RTX 4060 Ti (8 GB)
      9,1
    • GeForce RTX 3060 Ti (8 GB)
      8,8
    • Radeon RX 6700 XT (12 GB)
      6,5
    • Arc A770 (16 GB)
      6,5
    • GeForce RTX 4060 (8 GB)
      6,3
    • Arc A580 (8 GB)
      5,9
    • Radeon RX 7600 (8 GB)
      5,7
    • Arc B580 (12 GB)
      3,8
Einheit: Bilder pro Sekunde (FPS)

Topaz Video AI 5 stellt eine deutlich geringere Last an die AI-Fähigkeiten der Grafikkarten und hier können die zwei AMD-Grafikkarten richtig auftrumpfen. Die Radeon RX 9070 XT ist nicht nur 24 Prozent schneller als die GeForce RTX 5070 Ti, sondern auch 11 Prozent schneller als die GeForce RTX 5080. Die Radeon RX 9070 ist 29 Prozent schneller als die GeForce RTX 5070 und noch 10 Prozent schneller als die GeForce RTX 5070 Ti.

ON1 Resize AI – Bildervergrößerung

Der dritte und letzte AI-Benchmarks beschäftigt sich mit der Vergrößerung von Bildern. Mit Hilfe der Software ON1 Resize AI werden 10 verschiedene Fotos in der Auflösung pro Achse verdoppelt. Dabei handelt es sich um 10 ohnehin schon hoch aufgelöste Bilder mit einer Auflösung von 5.472 × 3.078 bis zu 7.657 × 5.119, die Anforderungen sind entsprechend hoch. Mittels Log-Datei wird die genaue Berechnungszeit der einzelnen Bilder erfasst und das geometrische Mittel gebildet. Die Ergebnisse werden in „Sekunden pro Bild“ ausgegeben.

ON1 Resize AI 2023.5
    • GeForce RTX 5090 (32 GB)
      4,9
    • Radeon RX 9070 XT (16 GB)
      5,3
    • GeForce RTX 4090 (24 GB)
      5,3
    • Radeon RX 9070 (16 GB)
      5,6
    • GeForce RTX 5080 (16 GB)
      6,8
    • GeForce RTX 4080 Super (16 GB)
      6,9
    • GeForce RTX 5070 Ti (16 GB)
      7,2
    • GeForce RTX 4070 Ti Super (16 GB)
      7,3
    • GeForce RTX 4070 Super (12 GB)
      8,0
    • GeForce RTX 5070 (12 GB)
      8,1
    • Radeon RX 7900 XTX (24 GB)
      9,1
    • GeForce RTX 3080 (10 GB)
      9,4
    • Radeon RX 7900 XT (20 GB)
      9,6
    • GeForce RTX 4070 (12 GB)
      9,9
    • Radeon RX 7900 GRE (16 GB)
      10,6
    • Arc B580 (12 GB)
      10,9
    • GeForce RTX 4060 Ti (8 GB)
      11,4
    • Radeon RX 7800 XT (16 GB)
      12,2
    • Radeon RX 7700 XT (12 GB)
      12,4
    • Radeon RX 6800 XT (16 GB)
      13,7
    • GeForce RTX 3060 Ti (8 GB)
      14,9
    • GeForce RTX 4060 (8 GB)
      15,6
    • Radeon RX 6700 XT (12 GB)
      16,4
    • Radeon RX 7600 (8 GB)
      18,7
    • Arc A770 (16 GB)
      47,5
    • Arc A580 (8 GB)
      56,8
Einheit: Sekunden pro Bild

Auch ON1 hat geringere Anforderungen, weshalb auch in ON1 RDNA 4 richtig gut unterwegs ist – sogar noch besser als in Topaz Video AI 5. Die Radeon RX 9070 XT ist mit der Aufgabe 26 Prozent früher fertig als eine GeForce RTX 5070 Ti und 22 Prozent eher als die GeForce RTX 5080. Die Radeon RX 9070 ist gleich schnell wie die GeForce RTX 4090 und muss sich nur der GeForce RTX 5090 um 8 Prozent geschlagen geben.

Blackmagic Davinci Resolve 19

Die sonst an dieser Stelle durchgeführten Tests mit Davinci Resolve 19 können aktuell nicht durchgeführt werden, da die PugetBench-Testsuite beim Starten eines einzelnen AI-Tests nicht beginnt und nach einigen Minuten abbricht. Wird dieser Test alleine gestartet, läuft er hingegen problemlos durch. Hier gibt es also einen Fehler, der den Test verhindert, da der PugetBench so gestaltet ist, dass alle Tests durchlaufen werden müssen, um ein Ergebnis für einzelne Untertests zu erhalten. Entsprechend können generell keine Ergebnisse mit Davinci Resolve 19 gezeigt werden.

Wo gibt es GeForce RTX 5000 und Radeon RX 9000 zu kaufen? Unser RTX-50-Verfügbarkeits-Check und der RX-9000-Verfügbarkeits-Check informieren über aktuelle Listungen.
MWC 2025 (3.–6. März 2025): Alle News auf der Themenseite!