ATi Radeon HD 3850 im Test: Ein weiterer Preis-Leistungs-Knüller?
2/29Technische Daten
Radeon HD 3870 |
Radeon HD 3850 |
Radeon HD 2600 XT |
GeForce 8800 GTS (320MB) |
GeForce 8600 GTS |
|
---|---|---|---|---|---|
Logo | |||||
Chip | RV670 | RV670 | RV630 | G80 | G84 |
Transistoren | ca. 666 Mio. | ca. 666 Mio | ca. 390 Mio. | ca. 681 Mio. | ca. 289 Mio. |
Fertigung | 55 nm | 55 nm | 65 nm | 90 nm | 80 nm |
Chiptakt | 775 MHz | 670 MHz | 800 MHz | 500 MHz | 675 MHz |
Shadertakt | 775 MHz | 670 MHz | 800 MHz | 1200 MHz | 1450 MHz |
Pixel-Pipelines | X | X | X | X | X |
Shader-Einheiten (MADD) |
64 (5D) | 64 (5D) | 24 (5D) | 96 (1D) | 32 (1D) |
FLOPs (MADD/ADD) | 496 GFLOPS | 429 GFLOPS | 192 GFLOPS | 346 GFLOPS* | 139 GFLOP/s* |
ROPs | 16 | 16 | 4 | 20 | 8 |
Pixelfüllrate | 12400 MPix/s | 10720 MPix/s | 3200 MPix/s | 10000 MPix/s | 5400 MPix/s |
TMUs | 16 | 16 | 8 | 48 | 16 |
TAUs | 32 | 32 | 16 | 24 | 16 |
Texelfüllrate | 12400 MTex/s | 10720 MPix/s | 6400 MTex/s | 24000 MTex/s | 10800 MTex/s |
Vertex-Shader | X | X | X | X | X |
Unified-Shader in Hardware |
✓ | ✓ | ✓ | ✓ | ✓ |
Shader-Model | SM 4.1 | SM 4.1 | SM 4 | SM 4 | SM 4 |
Geometryshader | ✓ | ✓ | ✓ | ✓ | ✓ |
Speichermenge | 512 GDDR4 | 256 GDDR3 | 256 GDDR3 (256 GDDR4) |
640 GDDR3 (320 GDDR3) |
256 GDDR3 |
Speichertakt | 1125 MHz | 830 MHz | 700 MHz (1100 MHz) |
800 MHz | 1000 MHz |
Speicherinterface | 256 Bit | 256 Bit | 128 Bit | 320 Bit | 128 Bit |
Speicherbandbreite | 72000 MB/s | 53120 MB/s | 22400 MB/s (35200 MB/s) |
64000 MB/s | 32000 MB/s |
Die ATi Radeon HD 3850 basiert auf einer voll aktivierten RV670-GPU, die im modernen 55-nm-Prozess bei TSMC hergestellt wird, 666 Millionen Transistoren umfasst und über 64 5D-Vektorshadereinheiten verfügt. Zwar können sich die 5D-Einheiten theoretisch im Verhältnis 1:1:1:1:1 aufsplitten (wobei sie sich dann wie Skalarshader verhalten), jedoch müssen die Operationen dafür vollkommen unabhängig voneinander sein. Sind sie hingegen voneinander abhängig, warten einige ALUs auf die Ergebnisse der anderen und stehen still. Der Thread-Scheduler versucht dies zu verhindern und die ALUs mit anderweitigen Aufgaben zu belegen, doch ist dazu eine Menge Treiberoptimierung von Nöten. Jede ALU kann auf dem RV670 eine MADD-Operation (Multiply-ADD) pro Takt durchführen. Darüber hinaus setzt die ATi Radeon HD 3850 auf 16 Textureinheiten, die pro Takt 16 Pixel texturieren und 32 Pixel adressieren kann. Dieses gegensätzliche Verhältnis zum G80-Chip von Nvidia soll vor allem in Direct3D-10-Anwendungen von Vorteil sein.
Die Anzahl der ROPs liegt ebenfalls bei 16. Pro Takt können 32 Z-Operationen (Sichtbarkeitsprüfungen von Pixel, die je nach Ergebnis gar nicht erst gerendert werden) ausgeführt werden. Das Multi-Sampling-Shader-Resolve wird auf dem RV670 wie auf dem Vorgänger R600, der auf der Radeon HD 2900 XT verwendet wird, selbst für einfache Anti-Aliasing-Modi mit dem Box-Filter in den Shadereinheiten durchgeführt. Normalerweise ist dies Aufgabe der ROPs, was auf dem RV670 aber nicht funktioniert. Ob dies nun Absicht von ATi, oder ein Fehler im Chipdesign ist, wird wohl auf Ewig ein Geheimnis bleiben. Die GPU taktet auf der Radeon HD 3850 mit 670 MHz. Das Speicherinterface ist auf der Grafikkarte 256 Bit breit und mit 830 MHz an die GPU angebunden. Auf dem Referenzdesign von ATi werden 256 MB verbaut, die sich aus acht 32 Megabyte große Speicherchips zusammensetzen. Auf Wunsch kann der Hersteller den Speicher auf 512 MB verdoppelt, indem 64-Megabyte-Module eingesetzt werden. Der Speichercontroller auf dem RV670 setzt sich aus vier 64-Bit-Kanälen zusammen.
Die Radeon HD 3850 unterstützt den Direct3D-10.1-Standard, der mit dem Service Pack 1 in Windows Vista Einzug halten wird. Die „PowerPlay“ genannte und aus den Notebook-Chips bekannte Technologie sorgt für einen niedrigen Stromverbrauch, indem Taktraten und Spannungen im Idle-Modus unter Last gesenkt und nicht benötigte Chipteile deaktiviert werden. Der Unified Video Decoder (UVD) ist auch auf der HD 3850 an Bord und kümmert sich um die Beschleunigung von HD-Videos. Die Grafikkarte ist PCIe-2.0-kompatibel.
*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.