HD 3850 X2 im Test: Asus bastelt spezielle HD 3850 mit zwei GPUs
2/25Technische Daten
Radeon HD 3870 |
Radeon HD 3870 X2 |
Asus Radeon HD 3850 X2 |
GeForce 9800 GTX |
|
---|---|---|---|---|
Logo | GeForce 9800 GTX | |||
Chip | RV670 | R680 (2x RV670) | R680 (2x RV670) | G92 |
Transistoren | ca. 666 Mio. | ca. 2x 666 Mio. | a. 2x 666 Mio. | ca. 754 Mio. |
Fertigung | 55 nm | 55 nm | 55 nm | 65 nm |
Chiptakt | 775MHz | 825 MHz | 668 MHz | 675 MHz |
Shadertakt | 775MHz | 828 MHz | 668 MHz | 1675 MHz |
Shader-Einheiten (MADD) |
64 (5D) | 2x 64 (5D) | 2x 64 (5D) | 128 (1D) |
FLOPs (MADD/ADD) | 496 GFLOPS | 2x 528 GFLOPS | 2x 428 GFLOP/s | 643 GFLOPS* |
ROPs | 16 | 2x 16 | 2x 16 | 16 |
Pixelfüllrate | 12400 MPix/s | 2x 13200 MPix/s | 2x 10688 MPix/s | 10800 MPix/s |
TMUs | 16 | 2x 16 | 2x 16 | 64 |
TAUs | 32 | 2x 32 | 2x 32 | 64 |
Texelfüllrate | 12400 MTex/s | 2x 12400 MTex/s | 2x 10688 MTex/s | 43200 MTex/s |
Shader-Model | SM 4.1 | SM 4.1 | SM 4.1 | SM 4 |
Hybrid-CF/-SLI | X | X | X | ✓ |
effektive Windows Stromsparfunktion |
✓ | ✓ | ✓ | X |
Speichermenge | 512 GDDR4 | 2x 512 GDDR3 | 2x 512 GDDR3 | 512 GDDR3 |
Speichertakt | 1125 MHz | 900 MHz | 828 MHz | 1100 MHz |
Speicherinterface | 256 Bit | 2x 256 Bit | 2x 256 Bit | 256 Bit |
Speicherbandbreite | 72000 MB/s | 2x 57600 MB/s | 2x 52992 MB/s | 70400 MB/s |
Die Asus Radeon HD 3850 X2 basiert auf zwei vollwertigen RV670-GPUs, die im 55-nm-Prozess bei TSMC gefertigt werden. Pro GPU stehen jeweils 64 5D-Vektorshadereinheiten zur Verfügung, die sich im Verhältnis 1:1:1:1:1 aufsplitten können (wobei sie sich dann wie Skalarshader verhalten), jedoch müssen die Operationen dafür vollkommen unabhängig voneinander sein. Sind sie hingegen voneinander abhängig, warten einige ALUs auf die Ergebnisse der anderen und stehen still. Der Thread-Scheduler versucht dies zu verhindern und die ALUs mit anderweitigen Aufgaben zu belegen, doch ist dazu eine Menge Treiberoptimierung von Nöten. Jede ALU kann auf einem RV670 eine MADD-Operation (Multiply-ADD) pro Takt durchführen. Darüber hinaus setzt die Asus Radeon HD 3850 X2 auf zwei mal 16 Textureinheiten, die pro Takt jeweils 16 Pixel texturieren und 32 Pixel adressieren können.
Die Anzahl der ROPs liegt ebenfalls bei 16 pro Chip. Pro Takt können 32 Z-Operationen (Sichtbarkeitsprüfungen von Pixel, die je nach Ergebnis gar nicht erst gerendert werden) ausgeführt werden. Der Chiptakt beträgt auf der Multi-GPU-Karte 668 MHz und entspricht somit den Referenzvorgaben von ATi für eine Radeon HD 3850. Das gleiche gilt für den Speicher, der mit 828 MHz angesprochen wird. Beiden GPUs steht je ein 512 MB großer VRAM zur Verfügung, wobei jeder Rechenkern auf dieselben Daten zugreifen können müssen. Darum kann man nicht von einem 1.024-MB-Speicher sprechen, auch wenn es der Name der Karte genau so sieht. Jeder VRAM wird mittels eines 256 Bit breiten Speicherinterfaces an eine GPU angebunden.
Damit die beiden RV670-Chips im CrossFire-Modus miteinander kommunizieren können, verbaut Asus auf der Radeon HD 3850 X2 einen PCIe-Switch von PLX, der auf den Namen „PEX 8547“ hört. Dieser PCIe-Switch verfügt über insgesamt 48 PCIe-Lanes. 16 Lanes werden für die Ankopplung der Grafikkarte an den PCIe-Slot und jeweils 16 Lanes für die Anbindung der GPUs an den Switch verwendet. Jede einzelne GPU kann also auf die maximale Bandbreite des PCIe-Bus' zurückgreifen, ohne durch eine Auftrennung in zwei Mal acht Leiterbahnen ausgebremst zu werden. Da der PEX 8547 ein PCIe-1.1-Switch ist, ist die Radeon HD 3850 X2 allerdings nur zum älteren PCIe-1.1-Standard kompatibel, obwohl die RV670-Chips durchaus PCIe 2.0 unterstützen. Der Switch ist derselbe wie auf einer Radeon HD 3870 X2.
Wer mehr über die Realisierung einer Multi-GPU-Karte auf Basis von ATis CrossFire-Technologie erfahren möchte, dem empfehlen wir unser Launch-Review zur Radeon HD 3870 X2.
*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.