Im Test vor 15 Jahren: Microsoft WHQL torpedierte Nvidias Quad-SLI
Mit GeForce 7900 GX2 und 7950 GX2 hatte Nvidia im Juli 2006 bereits Dual-GPU-Grafikkarten im Angebot. Mit dem ForceWare 91.37 folgte der erste Grafiktreiber, der Quad-SLI unterstützte. Im Test vor 15 Jahren traten zwei GeForce 7950 GX2 (Test) an. Bei der Leistung machte Microsoft Nvidia einen Strich durch die Rechnung.
Zwei GeForce 7950 GX2 = vier G71-GPUs
Um Quad-SLI zu testen, kamen zwei GeForce 7950 GX2 von Gigabyte zum Einsatz, die jeweils über zwei G71-GPUs verfügten. Die GPUs arbeiteten mit jeweils 500 MHz und damit 150 MHz langsamer als eine G71 auf einer GeForce 7900 GTX. Jede der beiden Grafikkarten verfügte über 2 × 512 MByte Grafikspeicher, wobei der effektiv verfügbare Gesamtspeicher damit nicht gleich 2 GByte betrug. Für ein Quad-SLI-Gespann bot Nvidia vier verschiedene Rendermodi im Treiber an, die sich in Sachen Leistung und Kompatibilität stark voneinander unterschieden.
GeForce 7950 GX2 | GeForce 7900 GTX | Radeon X1900 XTX | |
---|---|---|---|
Chip | 2 × G71 | G71 | R580 |
Transistoren | ca. 2 × 278 Mio. | ca. 278 Mio. | ca. 384 Mio. |
Fertigung | 90 nm | ||
Chiptakt | 500 MHz | 650 MHz | |
Pixel-Pipelines | 2 × 24 | 24 | 16 |
Shader-Einheiten pro Pipeline (MADD) | 2 | 3 | |
FLOPs (MADD/ADD) | 2 × 192 GFLOPS | 250 GFLOPS | 374 GFLOPS |
ROPs | 2 × 16 | 16 | |
Pixelfüllrate | 2 × 8.000 MPix/s | 10.400 MPix/s | |
TMUs je Pixel-Pipeline | 1 | ||
Texelfüllrate | 2 × 12.000 MTex/s | 15.600 MTex/s | 10.400 MTex/s |
Vertex-Shader | 2 × 8 | 8 | |
Dreiecksdurchsatz | 2 × 1.000 MV/s | 1.400 MV/s | 1.300 MV/s |
Pixel-Shader | PS 3.0 | ||
Vertex-Shader | VS 3.0 | ||
Speichermenge | 2 × 512 MByte GDDR3 | 512 MByte GDDR3 | |
Speichertakt | 600 MHz | 800 MHz | 775 MHz |
Speicherinterface | 2 × 256 Bit | 256 Bit | |
Speicherbandbreite | 2 × 38.400 MByte/s | 51.200 MByte/s | 49.600 MByte/s |
Präzision pro Kanal | FP16/FP32 | FP32 | |
SLI/CF-Unterstützung | Ja |
SLI-Modi: AFR, SFR oder AFR of SFR
Der schnellste Modus war „Alternate Frame Rendering“ (AFR). Hier wurde der Reihe nach von jeder GPU ein vollständiger Frame berechnet und diese Frames dann ausgegeben. Da jede GPU sämtliche Daten der Spielszene vorhalten musste, betrug der effektive Grafikspeicher bei zwei GeForce 7950 GX2 512 MByte. Ein Nachteil von AFR war, dass es speziell von Spieleentwicklern in ihr Spiel integriert werden musste. War das nicht der Fall, wich der Treiber auf den zweiten Modus namens „Split Frame Rendering“ (SFR) aus. Hierbei wurde ein einzelner Frame dynamisch in mehrere Bereiche aufgeteilt und jede GPU arbeitete am ihr zugewiesenen Bereich. Anschließend wurde ein vollständiger Frame aus den Teilen zusammengesetzt und ausgegeben. SFR wies typischerweise eine niedrigere Leistung auf als AFR, war jedoch zu jedem Spiel kompatibel. Als Kompromiss zwischen den beiden Lösungen führte Nvidia mit AFR of SFR einen dritten Modus speziell für Quad-SLI ein. Hierbei arbeiteten zwei GPUs an einem Frame und die anderen beiden GPUs an dem nächsten Frame. Die Leistung ordnete sich damit zwischen AFR und SFR ein.
3D-Anwendung | 4WayAFR | AFR of SFR | 4WaySFR |
---|---|---|---|
3DMark05 | – | ✓ | kompatibel |
Battlefield 2 | – | ✓ | kompatibel |
Call of Duty 2 | – | ✓ | kompatibel |
Doom 3 | ✓ | – | kompatibel |
F.E.A.R. | – | ✓ | kompatibel |
HL2: Lost Coast | – | ✓ | kompatibel |
Oblivion | – | ✓ | kompatibel |
Quake 4 | ✓ | – | kompatibel |
Riddick | ✓ | – | kompatibel |
Serious Sam 2 | – | ✓ | kompatibel |
SpellForce 2 | – | ✓ | kompatibel |
Splinter Cell 3 | – | ✓ | kompatibel |
TR: Legend | – | ✓ | kompatibel |
Vor 15 Jahren stellte sich damit die Frage: Wenn Entwickler AFR einsetzen können, wieso sollten sie dann auf AFR of SFR ausweichen? Die Antwort darauf fand sich im Direct3D-9-Standard. Um von Microsoft eine WHQL-Zertifizierung für einen Grafiktreiber zu erhalten, durfte dieser beim Rendern eines Frames maximal Parameter für drei Frames entgegennehmen. Da bei vier GPUs im AFR-Modus aber vier Frames parallel gerendert wurden, hätte dieses Vorgehen darin resultiert, dass dem Treiber die WHQL-Zertifizierung verwehrt geblieben wäre. Dieses Problem wurde mit AFR of SFR umgangen. Anders sah es in OpenGL-Titeln aus: Hier konnte der Treiber, sofern von den Entwicklern unterstützt, auch mit vier GPUs AFR verwenden.
In den Benchmarks sah es düster aus
Aufgrund der geschilderten Problematik sah es in den Benchmarks für das Quad-SLI-Gespann nicht gut aus. In 1.280 × 1.024 Bildpunkten betrug der Vorsprung des Quad-SLI-Systems auf eine einzelne GeForce 7950 GX2 nur 14 Prozent und damit weniger als die 20 Prozent, die zwei GeForce 7900 GTX schneller arbeiteten. In 1.600 × 1.200 Pixeln wuchs der Vorsprung auf 22 Prozent – und damit 1 Prozent mehr als bei zwei GeForce 7900 GTX. Wie zu erwarten war, ergab das Quad-SLI-Gespann in für damalige Verhältnisse extrem hohen Auflösungen wie 2.560 × 1.600 Bildpunkten am meisten Sinn. Hier betrug der Leistungsvorteil gegenüber einer GeForce 7950 GX2 immerhin 31 Prozent. Zwei Radeon X1900 arbeiteten allerdings weitere 3 Prozent schneller.
Um das volle Potential der vier GPUs zu betrachten, konnte der Leistungszuwachs in OpenGL-Titeln mit AFR-Unterstützung betrachtet werden. Darin konnten sich die zwei GeForce 7950 GX2 problemlos an die Spitze absetzen – die Leistung gegenüber einer GX2 stieg um 78 Prozent und im Vergleich zu zwei GeForce 7900 GTX um 35 Prozent.
In den B-Noten konnte das Quad-SLI-System nicht überzeugen. Der Geräuschpegel verdoppelte sich, die GPU-Temperaturen unter Last lagen bei über 100 °C und die Energieaufnahme des Gesamtsystems stieg unter Last um fast 50 Prozent an. Von Mikrorucklern, die damals noch kein Thema waren, ganz zu schweigen.
Fazit
Überzeugen konnte Quad-SLI im Test vor 15 Jahren nicht. Der Löwenanteil der Spiele setzte auf die Direct3D-API und war damit nicht in der Lage, AFR in Kombination mit vier GPUs zu nutzen. Damit war der Leistungszuwachs in keinem Fall den Mehrkosten angemessen. Zudem sorgte ein System mit vier GPUs für heißere und lautere Grafikkarten und eine höhere Energieaufnahme. Für die wenigen Leute, die unbedingt vier GPUs einsetzen wollten, bot Nvidia zumindest die Option an.
Multi-GPU-Gaming-PCs heute
Multi-GPU-Systeme spielen heutzutage eine untergeordnete Rolle. Die GeForce-RTX-3000-Serie unterstützt SLI überhaupt nicht mehr, nur DirectX-12- und Vulkan-Titel können selbst Multi-GPU-Unterstützung implementieren. Den Aufwand ist das Resultat quasi keinem Entwickler wert. Zahlreiche Probleme mit SLI wie beispielsweise Mikroruckler, hohe Anschaffungs- und Unterhaltskosten sowie geringe Leistungszugewinne machten die Technik zunehmend unattraktiv. Ende 2020 gaben nur noch 1 Prozent der ComputerBase-Leser an, ein Multi-GPU-System ihr Eigen zu nennen.
In der Kategorie „Im Test vor 15 Jahren“ wirft die Redaktion seit Juli 2017 jeden Samstag einen Blick in das Test-Archiv. Die letzten 20 Artikel, die in dieser Reihe erschienen sind, führen wir nachfolgend auf:
- Eine übertaktete GeForce 7600 GS mit 512 MByte Speicher
- Intels Core 2 Duo E6600 und E6700 räumten mit AMD auf
- Der absolute Preis-Leistungs-Tipp GeForce 7600 GST
- Der Core 2 Extreme X6800 hängte alle ab
- Der Zalman VF-900 Cu dominierte sie alle
- Drei GeForce 7950 GX2 von laut bis schnell
- GeForce-Custom-Designs in extra schnell und lautlos
- Der „Gamer-Cube“, der nur über das Netzteil lüftete
- Nvidias Doppeldecker alias GeForce 7950 GX2
- Intels Core 2 Duo E6700 glänzte im Vorabtest
- Nvidias nForce 500 für AMDs Sockel AM2 mit DDR2-RAM
- Die beste Radeon X1900 XTX kam mit Zalman-Kühler
- PCIe x8 gegen PCIe x16 für Multi-GPU-Systeme
- ATis X1900 GT biss sich an Nvidias 7900 GT die Zähne aus
- PhysX-Beschleuniger für 299 Euro von Ageia
- Die GeForce 7600 GS war für 125 Euro eine Wucht
- HTPC-Gehäuse von Lian Li und Silverstone
- Die GeForce 7900 GTX in 90 nm und mit höherem Takt
- Creative Sound Blaster X-Fi für mehr Audioqualität und FPS
- Intels Pentium EE 965 war schneller und sparsamer
Noch mehr Inhalte dieser Art und viele weitere Berichte und Anekdoten finden sich in der Retro-Ecke im Forum von ComputerBase.