Gaming-Grafikkarten 2025 im Test: AI-Benchmarks

 6/7
Wolfgang Andermahr
178 Kommentare

Der neue Testparcours umfasst auch „AI-Benchmarks“. Neben dem Procyon AI Image Generation Benchmark von UL Solutions (3DMark, PCMark), der vielfältige AI-Lasten nachstellt, sind auch zwei handfeste Praxisbeispiele darunter:

Für alle Tests gilt, dass jede Grafikkarte, falls möglich, mit den für sie optimalen Bibliotheken arbeitet. Alle GeForce-RTX-GPU arbeiten entsprechend mit Nvidias auf CUDA basiertem TensorRT, während für Intel Arc OpenVINO zum Einsatz kommt. AMD hat dagegen noch keine eigene Bibliothek für AI Inference, entsprechend kommt Microsofts überall lauffähiges DirectML zum Einsatz.

Procyon AI Image Generation – Stable Diffusion

Abgesehen vom MS Copilot gibt es für den PC immer mehr Software, die AI für etwaige Aufgaben nutzt. Mit die bekannteste ist die Erstellung künstlicher Bilder nach Eingabe gewisser Vorgaben, die dann mittels „Stable Diffusion“ umgesetzt wird.

ComputerBase nutzt den synthetischen Benchmark Procyon AI Image Generation und daraus den Test „Stable Diffusion 1.5 (FP16)“ mit geringen Anforderungen sowie „Stable Diffusion XL (FP16)“ mit hohen Anforderungen an die GPU-Hardware, der unter anderem deutlich mehr VRAM benötigt und daher längst nicht überall läuft. Die Ergebnisse werden in „Sekunden pro Bild“ dargestellt.

Procyon AI Image Generation – Stable Diffusion 1.5 (FP16)
    • GeForce RTX 4090 (24 GB)
      1,1
    • GeForce RTX 4080 Super (16 GB)
      1,5
    • GeForce RTX 4070 Ti Super (16 GB)
      1,8
    • GeForce RTX 4070 Super (12 GB)
      2,2
    • GeForce RTX 4070 (12 GB)
      2,6
    • GeForce RTX 3080 (10 GB)
      2,6
    • Radeon RX 7900 XTX (24 GB)
      3,1
    • Radeon RX 7900 XT (20 GB)
      3,6
    • Radeon RX 7900 GRE (16 GB)
      4,1
    • GeForce RTX 4060 Ti (8 GB)
      4,1
    • Arc B580 (12 GB)
      4,2
    • GeForce RTX 3060 Ti (8 GB)
      4,3
    • Radeon RX 7800 XT (16 GB)
      5,0
    • Radeon RX 7700 XT (12 GB)
      5,4
    • GeForce RTX 4060 (8 GB)
      5,4
    • Arc A770 (16 GB)
      5,7
    • Arc A580 (8 GB)
      8,5
    • Radeon RX 7600 (8 GB)
      9,1
    • Radeon RX 6800 XT (16 GB)
      15,8
    • Radeon RX 6700 XT (12 GB)
      30,1
Einheit: Sekunden pro Bild

Bei den für moderne GPUs eher simple Berechnungen mit Stable Diffusion 1.5 fällt vor allem auf, dass AMDs RDNA-3-Generation gegenüber dem Vorgänger RDNA 2 einen riesigen Schritt nach vorne macht. Die Radeon RX 7900 XTX kann ein Bild fünf Mal schneller erstellen als die Radeon RX 6800 XT, selbst die Radeon RX 7600 ist immer noch klar schneller als AMDs High-End-Modell der vorherigen Generation.

Darüber hinaus zeigt sich, dass die Spezialeinheiten für Matrizenberechnungen klar im Vorteil gegenüber dem Rechnen mittels WMMA auf den normalen FP32-Einheiten sind. Die GeForce RTX 4080 Super ist doppelt so schnell wie die Radeon RX 7900 XTX, während die Intel Arc B580 klar über ihrer normalen Leistungsklasse boxt und gleich schnell Bilder abliefert wie die GeForce RTX 4060 Ti und so schneller als eine Radeon RX 7800 XT ist.

Procyon AI Image Generation – Stable Diffusion XL (FP16)
    • GeForce RTX 4090 (24 GB)
      7,5
    • GeForce RTX 4080 Super (16 GB)
      9,6
    • GeForce RTX 4070 Ti Super (16 GB)
      12,3
    • GeForce RTX 4070 Super (12 GB)
      14,6
    • GeForce RTX 4070 (12 GB)
      18,3
    • GeForce RTX 3080 (10 GB)
      19,4
    • Arc B580 (12 GB)
      23,5
    • Radeon RX 7900 XTX (24 GB)
      25,2
    • Radeon RX 7900 XT (20 GB)
      28,5
    • Radeon RX 7900 GRE (16 GB)
      34,2
    • Arc A770 (16 GB)
      34,2
    • Radeon RX 7800 XT (16 GB)
      42,2
    • Arc A580 (8 GB)
      43,4
    • Radeon RX 7700 XT (12 GB)
      47,5
    • Radeon RX 7600 (8 GB)
      Absturz
    • Radeon RX 6800 XT (16 GB)
      Absturz
    • Radeon RX 6700 XT (12 GB)
      Absturz
    • GeForce RTX 4060 Ti (8 GB)
      Absturz
    • GeForce RTX 4060 (8 GB)
      Absturz
    • GeForce RTX 3060 Ti (8 GB)
      Absturz
Einheit: Sekunden pro Bild

Im deutlich anspruchsvolleren Stable Diffusion XL haben sämtliche GeForce-Grafikkarten dann klar die Nase vorn. Die GeForce RTX 4080 Super erzeugt ein Bild in durchschnittlich 9,6 Sekunden, die Radeon RX 7900 XTX kommt dagegen auf 25,2 Sekunden. Auch die Arc B580 ist mit 23,5 Sekunden schneller als AMDs-Flaggschiff, ohne Matrix-Einheiten geht es in dem Fall also nicht.

Topaz Video AI 5 – Aufhübschen von Videos

Neben dem Erstellen von Bildern gehört das Optimieren/Verbessern/Aufhübschen von Bildern und Videos zu klassischen KI-Aufgaben. Als Repräsentant kommt der integrierte Benchmark aus Topaz Video AI 5 zum Einsatz, den in der freien Version auch jeder selbst kostenlos und ohne Einschränkungen ausführen kann.

Der Benchmark nutzt verschiedene neuronale Netzwerke, die dafür verwendet werden, verschiedene Effekte auf Videos anzuwenden. Die Ergebnisse werden in klassischen Frames per Second dargestellt. ComputerBase fasst dabei alle Ergebnisse der verschiedenen Effekte zu einem einzelnen Wert zusammen und nutzt dafür das geometrische Mittel.

Topaz Video AI 5
    • GeForce RTX 4090 (24 GB)
      25,6
    • GeForce RTX 4080 Super (16 GB)
      20,5
    • GeForce RTX 4070 Ti Super (16 GB)
      18,3
    • Radeon RX 7900 XTX (24 GB)
      15,6
    • GeForce RTX 4070 Super (12 GB)
      15,4
    • GeForce RTX 3080 (10 GB)
      13,9
    • Radeon RX 7900 XT (20 GB)
      13,8
    • GeForce RTX 4070 (12 GB)
      13,0
    • Radeon RX 7900 GRE (16 GB)
      12,6
    • Radeon RX 7800 XT (16 GB)
      10,7
    • Radeon RX 7700 XT (12 GB)
      9,8
    • Radeon RX 6800 XT (16 GB)
      9,8
    • GeForce RTX 4060 Ti (8 GB)
      9,1
    • GeForce RTX 3060 Ti (8 GB)
      8,8
    • Radeon RX 6700 XT (12 GB)
      6,5
    • Arc A770 (16 GB)
      6,5
    • GeForce RTX 4060 (8 GB)
      6,3
    • Arc A580 (8 GB)
      5,9
    • Radeon RX 7600 (8 GB)
      5,7
    • Arc B580 (12 GB)
      3,8
Einheit: Bilder pro Sekunde (FPS)

Auch bei der Videoaufhübschung mit Topaz Video AI 5 sind die Tensor- und XMX-Kerne wichtig, spielen aber eine kleinere Rolle als bei Stable Diffusion. So ist die GeForce RTX 4080 Super bei dieser Messreihe „nur“ noch 31 Prozent schneller als die Radeon RX 7900 XTX, letztere legt sich damit mit der GeForce RTX 4070 Super an. RDNA 2 schneidet bei dem Programm gar nicht so schlecht ab, die Radeon RX 6800 XT kommt immerhin auf das Leistungsniveau der Radeon RX 7700 XT. Überhaupt nicht zurecht kommt die neue Intel Arc B580, die klar das Schlusslicht bildet und hinter der älteren Arc A770 zurück liegt. Das zeigt, dass bei „AI“ die Software genauso wichtig wie die Hardware ist.

ON1 Resize AI – Bilder hochskalieren

Der dritte und letzte AI-Benchmark beschäftigt sich mit dem Vergrößern von Bildern. Mit Hilfe der Software ON1 Resize AI werden 10 verschiedene Fotos in der Auflösung pro Achse verdoppelt. Dabei handelt es sich um 10 ohnehin schon hoch aufgelöste Bilder mit einer Auflösung von 5.472 × 3.078 bis zu 7.657 × 5.119, die Anforderungen sind entsprechend hoch. Mittels Log-Datei wird die genaue Berechnungszeit der einzelnen Bilder erfasst und daraus dann das Ergebnis mittels des geometrischen Mittels gebildet. Die Ergebnisse werden in „Sekunden pro Bild“ ausgegeben.

ON1 Resize AI 2023.5
    • GeForce RTX 4090 (24 GB)
      5,3
    • GeForce RTX 4080 Super (16 GB)
      6,9
    • GeForce RTX 4070 Ti Super (16 GB)
      7,3
    • GeForce RTX 4070 Super (12 GB)
      8,0
    • Radeon RX 7900 XTX (24 GB)
      9,1
    • GeForce RTX 3080 (10 GB)
      9,4
    • Radeon RX 7900 XT (20 GB)
      9,6
    • GeForce RTX 4070 (12 GB)
      9,9
    • Radeon RX 7900 GRE (16 GB)
      10,6
    • Arc B580 (12 GB)
      10,9
    • GeForce RTX 4060 Ti (8 GB)
      11,4
    • Radeon RX 7800 XT (16 GB)
      12,2
    • Radeon RX 7700 XT (12 GB)
      12,4
    • Radeon RX 6800 XT (16 GB)
      13,7
    • GeForce RTX 3060 Ti (8 GB)
      14,9
    • GeForce RTX 4060 (8 GB)
      15,6
    • Radeon RX 6700 XT (12 GB)
      16,4
    • Radeon RX 7600 (8 GB)
      18,7
    • Arc A770 (16 GB)
      47,5
    • Arc A580 (8 GB)
      56,8
Einheit: Sekunden pro Bild

Bei der Bildvergrößerung mittels ON1 Resize AI haben erneut die GeForce-Grafikkarten die Nase vorn. Die GeForce RTX 4080 Super benötigt im Schnitt 6,9 Sekunden pro Bild, die Radeon RX 7900 XTX dagegen 9,1 Sekunden und damit 32 Prozent länger, was ein vergleichbares Ergebnis zu Topaz Video AI ist. Die Radeon RX 6800 XT ist derweil leicht langsamer als die Radeon RX 7700 XT, während die Arc B580 diesmal stark unterwegs ist und knapp die GeForce RTX 4060 Ti schlägt. Damit liegt die Intel-Grafikkarte auf dem Niveau der eigentlich deutlich rechenstärkeren Radeon RX 7900 GRE.