HD 3850 X2 im Test: Asus bastelt spezielle HD 3850 mit zwei GPUs

 2/25
Wolfgang Andermahr
83 Kommentare

Technische Daten

Radeon
HD 3870
Radeon
HD 3870 X2
Asus Radeon
HD 3850 X2
GeForce
9800 GTX
Logo ATi Radeon Graphics ATi Radeon Graphics ATi Radeon Graphics GeForce 9800 GTX
Chip RV670 R680 (2x RV670) R680 (2x RV670) G92
Transistoren ca. 666 Mio. ca. 2x 666 Mio. a. 2x 666 Mio. ca. 754 Mio.
Fertigung 55 nm 55 nm 55 nm 65 nm
Chiptakt 775MHz 825 MHz 668 MHz 675 MHz
Shadertakt 775MHz 828 MHz 668 MHz 1675 MHz
Shader-Einheiten
(MADD)
64 (5D) 2x 64 (5D) 2x 64 (5D) 128 (1D)
FLOPs (MADD/ADD) 496 GFLOPS 2x 528 GFLOPS 2x 428 GFLOP/s 643 GFLOPS*
ROPs 16 2x 16 2x 16 16
Pixelfüllrate 12400 MPix/s 2x 13200 MPix/s 2x 10688 MPix/s 10800 MPix/s
TMUs 16 2x 16 2x 16 64
TAUs 32 2x 32 2x 32 64
Texelfüllrate 12400 MTex/s 2x 12400 MTex/s 2x 10688 MTex/s 43200 MTex/s
Shader-Model SM 4.1 SM 4.1 SM 4.1 SM 4
Hybrid-CF/-SLI X X X
effektive Windows
Stromsparfunktion
X
Speichermenge 512 GDDR4 2x 512 GDDR3 2x 512 GDDR3 512 GDDR3
Speichertakt 1125 MHz 900 MHz 828 MHz 1100 MHz
Speicherinterface 256 Bit 2x 256 Bit 2x 256 Bit 256 Bit
Speicherbandbreite 72000 MB/s 2x 57600 MB/s 2x 52992 MB/s 70400 MB/s

Die Asus Radeon HD 3850 X2 basiert auf zwei vollwertigen RV670-GPUs, die im 55-nm-Prozess bei TSMC gefertigt werden. Pro GPU stehen jeweils 64 5D-Vektorshadereinheiten zur Verfügung, die sich im Verhältnis 1:1:1:1:1 aufsplitten können (wobei sie sich dann wie Skalarshader verhalten), jedoch müssen die Operationen dafür vollkommen unabhängig voneinander sein. Sind sie hingegen voneinander abhängig, warten einige ALUs auf die Ergebnisse der anderen und stehen still. Der Thread-Scheduler versucht dies zu verhindern und die ALUs mit anderweitigen Aufgaben zu belegen, doch ist dazu eine Menge Treiberoptimierung von Nöten. Jede ALU kann auf einem RV670 eine MADD-Operation (Multiply-ADD) pro Takt durchführen. Darüber hinaus setzt die Asus Radeon HD 3850 X2 auf zwei mal 16 Textureinheiten, die pro Takt jeweils 16 Pixel texturieren und 32 Pixel adressieren können.

Die Anzahl der ROPs liegt ebenfalls bei 16 pro Chip. Pro Takt können 32 Z-Operationen (Sichtbarkeitsprüfungen von Pixel, die je nach Ergebnis gar nicht erst gerendert werden) ausgeführt werden. Der Chiptakt beträgt auf der Multi-GPU-Karte 668 MHz und entspricht somit den Referenzvorgaben von ATi für eine Radeon HD 3850. Das gleiche gilt für den Speicher, der mit 828 MHz angesprochen wird. Beiden GPUs steht je ein 512 MB großer VRAM zur Verfügung, wobei jeder Rechenkern auf dieselben Daten zugreifen können müssen. Darum kann man nicht von einem 1.024-MB-Speicher sprechen, auch wenn es der Name der Karte genau so sieht. Jeder VRAM wird mittels eines 256 Bit breiten Speicherinterfaces an eine GPU angebunden.

Damit die beiden RV670-Chips im CrossFire-Modus miteinander kommunizieren können, verbaut Asus auf der Radeon HD 3850 X2 einen PCIe-Switch von PLX, der auf den Namen „PEX 8547“ hört. Dieser PCIe-Switch verfügt über insgesamt 48 PCIe-Lanes. 16 Lanes werden für die Ankopplung der Grafikkarte an den PCIe-Slot und jeweils 16 Lanes für die Anbindung der GPUs an den Switch verwendet. Jede einzelne GPU kann also auf die maximale Bandbreite des PCIe-Bus' zurückgreifen, ohne durch eine Auftrennung in zwei Mal acht Leiterbahnen ausgebremst zu werden. Da der PEX 8547 ein PCIe-1.1-Switch ist, ist die Radeon HD 3850 X2 allerdings nur zum älteren PCIe-1.1-Standard kompatibel, obwohl die RV670-Chips durchaus PCIe 2.0 unterstützen. Der Switch ist derselbe wie auf einer Radeon HD 3870 X2.

Wer mehr über die Realisierung einer Multi-GPU-Karte auf Basis von ATis CrossFire-Technologie erfahren möchte, dem empfehlen wir unser Launch-Review zur Radeon HD 3870 X2.

RV670-GPU
RV670-GPU

*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.