Retro

Im Test vor 15 Jahren: Microsoft WHQL torpedierte Nvidias Quad-SLI

Robert McHardy
56 Kommentare
Im Test vor 15 Jahren: Microsoft WHQL torpedierte Nvidias Quad-SLI

Mit GeForce 7900 GX2 und 7950 GX2 hatte Nvidia im Juli 2006 bereits Dual-GPU-Grafikkarten im Angebot. Mit dem ForceWare 91.37 folgte der erste Grafiktreiber, der Quad-SLI unterstützte. Im Test vor 15 Jahren traten zwei GeForce 7950 GX2 (Test) an. Bei der Leistung machte Microsoft Nvidia einen Strich durch die Rechnung.

Zwei GeForce 7950 GX2 = vier G71-GPUs

Um Quad-SLI zu testen, kamen zwei GeForce 7950 GX2 von Gigabyte zum Einsatz, die jeweils über zwei G71-GPUs verfügten. Die GPUs arbeiteten mit jeweils 500 MHz und damit 150 MHz langsamer als eine G71 auf einer GeForce 7900 GTX. Jede der beiden Grafikkarten verfügte über 2 × 512 MByte Grafikspeicher, wobei der effektiv verfügbare Gesamtspeicher damit nicht gleich 2 GByte betrug. Für ein Quad-SLI-Gespann bot Nvidia vier verschiedene Rendermodi im Treiber an, die sich in Sachen Leistung und Kompatibilität stark voneinander unterschieden.

GeForce 7950 GX2 GeForce 7900 GTX Radeon X1900 XTX
Chip 2 × G71 G71 R580
Transistoren ca. 2 × 278 Mio. ca. 278 Mio. ca. 384 Mio.
Fertigung 90 nm
Chiptakt 500 MHz 650 MHz
Pixel-Pipelines 2 × 24 24 16
Shader-Einheiten pro Pipeline (MADD) 2 3
FLOPs (MADD/ADD) 2 × 192 GFLOPS 250 GFLOPS 374 GFLOPS
ROPs 2 × 16 16
Pixelfüllrate 2 × 8.000 MPix/s 10.400 MPix/s
TMUs je Pixel-Pipeline 1
Texelfüllrate 2 × 12.000 MTex/s 15.600 MTex/s 10.400 MTex/s
Vertex-Shader 2 × 8 8
Dreiecksdurchsatz 2 × 1.000 MV/s 1.400 MV/s 1.300 MV/s
Pixel-Shader PS 3.0
Vertex-Shader VS 3.0
Speichermenge 2 × 512 MByte GDDR3 512 MByte GDDR3
Speichertakt 600 MHz 800 MHz 775 MHz
Speicherinterface 2 × 256 Bit 256 Bit
Speicherbandbreite 2 × 38.400 MByte/s 51.200 MByte/s 49.600 MByte/s
Präzision pro Kanal FP16/FP32 FP32
SLI/CF-Unterstützung Ja

SLI-Modi: AFR, SFR oder AFR of SFR

Der schnellste Modus war „Alternate Frame Rendering“ (AFR). Hier wurde der Reihe nach von jeder GPU ein vollständiger Frame berechnet und diese Frames dann ausgegeben. Da jede GPU sämtliche Daten der Spielszene vorhalten musste, betrug der effektive Grafikspeicher bei zwei GeForce 7950 GX2 512 MByte. Ein Nachteil von AFR war, dass es speziell von Spieleentwicklern in ihr Spiel integriert werden musste. War das nicht der Fall, wich der Treiber auf den zweiten Modus namens „Split Frame Rendering“ (SFR) aus. Hierbei wurde ein einzelner Frame dynamisch in mehrere Bereiche aufgeteilt und jede GPU arbeitete am ihr zugewiesenen Bereich. Anschließend wurde ein vollständiger Frame aus den Teilen zusammengesetzt und ausgegeben. SFR wies typischerweise eine niedrigere Leistung auf als AFR, war jedoch zu jedem Spiel kompatibel. Als Kompromiss zwischen den beiden Lösungen führte Nvidia mit AFR of SFR einen dritten Modus speziell für Quad-SLI ein. Hierbei arbeiteten zwei GPUs an einem Frame und die anderen beiden GPUs an dem nächsten Frame. Die Leistung ordnete sich damit zwischen AFR und SFR ein.

Standardmäßiger SLI-Modus
3D-Anwendung 4WayAFR AFR of SFR 4WaySFR
3DMark05 kompatibel
Battlefield 2 kompatibel
Call of Duty 2 kompatibel
Doom 3 kompatibel
F.E.A.R. kompatibel
HL2: Lost Coast kompatibel
Oblivion kompatibel
Quake 4 kompatibel
Riddick kompatibel
Serious Sam 2 kompatibel
SpellForce 2 kompatibel
Splinter Cell 3 kompatibel
TR: Legend kompatibel

Vor 15 Jahren stellte sich damit die Frage: Wenn Entwickler AFR einsetzen können, wieso sollten sie dann auf AFR of SFR ausweichen? Die Antwort darauf fand sich im Direct3D-9-Standard. Um von Microsoft eine WHQL-Zertifizierung für einen Grafiktreiber zu erhalten, durfte dieser beim Rendern eines Frames maximal Parameter für drei Frames entgegennehmen. Da bei vier GPUs im AFR-Modus aber vier Frames parallel gerendert wurden, hätte dieses Vorgehen darin resultiert, dass dem Treiber die WHQL-Zertifizierung verwehrt geblieben wäre. Dieses Problem wurde mit AFR of SFR umgangen. Anders sah es in OpenGL-Titeln aus: Hier konnte der Treiber, sofern von den Entwicklern unterstützt, auch mit vier GPUs AFR verwenden.

In den Benchmarks sah es düster aus

Aufgrund der geschilderten Problematik sah es in den Benchmarks für das Quad-SLI-Gespann nicht gut aus. In 1.280 × 1.024 Bildpunkten betrug der Vorsprung des Quad-SLI-Systems auf eine einzelne GeForce 7950 GX2 nur 14 Prozent und damit weniger als die 20 Prozent, die zwei GeForce 7900 GTX schneller arbeiteten. In 1.600 × 1.200 Pixeln wuchs der Vorsprung auf 22 Prozent – und damit 1 Prozent mehr als bei zwei GeForce 7900 GTX. Wie zu erwarten war, ergab das Quad-SLI-Gespann in für damalige Verhältnisse extrem hohen Auflösungen wie 2.560 × 1.600 Bildpunkten am meisten Sinn. Hier betrug der Leistungsvorteil gegenüber einer GeForce 7950 GX2 immerhin 31 Prozent. Zwei Radeon X1900 arbeiteten allerdings weitere 3 Prozent schneller.

Diagramme
Rating SLI/CF Qualität 1280x1024
    • nVidia GeForce 7900 GTX SLI
      89,2
    • nVidia GeForce 7950 GX2 Quad-SLI
      85,2
    • ATi Radeon X1900 XT CF
      79,3
    • nVidia GeForce 7800 GTX 512 SLI
      78,1
    • nVidia GeForce 7950 GX2
      74,6
    • nVidia GeForce 7900 GT SLI
      67,3
    • nVidia GeForce 7800 GTX SLI
      61,7
    • nVidia GeForce 7800 GT SLI
      54,8
    • nVidia GeForce 7600 GT SLI
      47,5
    • ATi Radeon X1600 XT CF
      25,3
Einheit: Prozent, Arithmetisches Mittel

Um das volle Potential der vier GPUs zu betrachten, konnte der Leistungszuwachs in OpenGL-Titeln mit AFR-Unterstützung betrachtet werden. Darin konnten sich die zwei GeForce 7950 GX2 problemlos an die Spitze absetzen – die Leistung gegenüber einer GX2 stieg um 78 Prozent und im Vergleich zu zwei GeForce 7900 GTX um 35 Prozent.

In den B-Noten konnte das Quad-SLI-System nicht überzeugen. Der Geräuschpegel verdoppelte sich, die GPU-Temperaturen unter Last lagen bei über 100 °C und die Energieaufnahme des Gesamtsystems stieg unter Last um fast 50 Prozent an. Von Mikrorucklern, die damals noch kein Thema waren, ganz zu schweigen.

Fazit

Überzeugen konnte Quad-SLI im Test vor 15 Jahren nicht. Der Löwenanteil der Spiele setzte auf die Direct3D-API und war damit nicht in der Lage, AFR in Kombination mit vier GPUs zu nutzen. Damit war der Leistungszuwachs in keinem Fall den Mehrkosten angemessen. Zudem sorgte ein System mit vier GPUs für heißere und lautere Grafikkarten und eine höhere Energieaufnahme. Für die wenigen Leute, die unbedingt vier GPUs einsetzen wollten, bot Nvidia zumindest die Option an.

Multi-GPU-Gaming-PCs heute

Multi-GPU-Systeme spielen heutzutage eine untergeordnete Rolle. Die GeForce-RTX-3000-Serie unterstützt SLI überhaupt nicht mehr, nur DirectX-12- und Vulkan-Titel können selbst Multi-GPU-Unterstützung implementieren. Den Aufwand ist das Resultat quasi keinem Entwickler wert. Zahlreiche Probleme mit SLI wie beispielsweise Mikroruckler, hohe Anschaffungs- und Unterhaltskosten sowie geringe Leistungszugewinne machten die Technik zunehmend unattraktiv. Ende 2020 gaben nur noch 1 Prozent der ComputerBase-Leser an, ein Multi-GPU-System ihr Eigen zu nennen.

Nutzt du eine Multi-GPU-Technologie?
  • Ja, Nvidia SLI
    ➘ 0,7 %
    Historie: 1,6 % 0,9 % ➙ 0,9 %
  • Ja, AMD Crossfire
    ➘ 0,3 %
    Historie: 0,7 % 0,5 % 0,3 %
  • Nein
    ➚ 99,1 %
    Historie: 97,7 % 98,6 % 98,8 %

In der Kategorie „Im Test vor 15 Jahren“ wirft die Redaktion seit Juli 2017 jeden Samstag einen Blick in das Test-Archiv. Die letzten 20 Artikel, die in dieser Reihe erschienen sind, führen wir nachfolgend auf:

Noch mehr Inhalte dieser Art und viele weitere Berichte und Anekdoten finden sich in der Retro-Ecke im Forum von ComputerBase.