GTX 295 im Test: Nvidias neue Multi-GPU-Karte ist kein eindeutiger Gewinner
2/27Technische Daten
Bevor wir uns mit der GeForce GTX 295 und ihrer Architektur im Detail beschäftigen, möchten wir mit den obligatorischen Spezifikationen des überarbeiteten Chips starten.
Radeon HD 4870 X2 |
GeForce GTX 260 216 |
GeForce GTX 280 |
GeForce GTX 295 |
|
---|---|---|---|---|
Logo | ||||
Chip | 2x RV770 | GT200 | GT200 | 2x GT200b |
Transistoren | ca. 2x 965 Mio. | ca. 1,4 Mrd. | ca. 1,4 Mrd. | ca. 2x 1,4 Mrd. |
Fertigung | 55 nm | 65 nm | 65 nm | 55 nm |
Chiptakt | 750 MHz | 576 MHz | 602 MHz | 576 MHz |
Shadertakt | 750 MHz | 1.242 MHz | 1.296 MHz | 1.242 MHz |
Shader-Einheiten (MADD) |
2x 160 (5D) | 216 (1D) | 240 (1D) | 2x 240 (1D) |
FLOPs (MADD/ADD) | 2x 1.200 GFLOP/s | 805 GFLOP/s | 933 GFLOPS | 2x 894 GLOPs |
ROPs | 2x 16 | 28 | 32 | 2x 28 |
Pixelfüllrate | 2x 12000 MPix/s | 16128 MPix/s | 19264 MPix/s | 2x 16128 MPix/s |
TMUs | 2x 40 | 72 | 80 | 2x 80 |
TAUs | 2x 40 | 72 | 80 | 2x 80 |
Texelfüllrate | 2x 30000 MTex/s | 41472 MTex/s | 48160 MTex/s | 2x 46080 MTex/s |
Shader-Model | SM 4.1 | SM 4 | SM 4 | SM 4 |
Hybrid-CF/-SLI | X | ✓ | ✓ | ✓ |
effektive Windows Stromsparfunktion |
✓ | ✓ | ✓ | ✓ |
Speichermenge | 2x 1.024 MB GDDR5 | 896 MB GDDR3 | 1.024 MB GDDR3 | 2x 896 MB GDDR3 |
Speichertakt | 1.800 MHz | 999 MHz | 1.107 MHz | 999 MHz |
Speicherinterface | 2x 256 Bit | 448 Bit | 512 Bit | 2x 448 Bit |
Speicherbandbreite | 2x 115200 MB/s | 111888 MB/s | 141696 MB/s | 2x 111888 MB/s |
Technische Details
Die Nvidia GeForce GTX 295 setzt auf eine leicht überarbeitete GT200-GPU, die auf den Namen GT200b hört und anstatt im 65-nm- im modernen 55-nm-Verfahren produziert wird. Dadurch wird die GPU kleiner (benötigt weniger Platz auf dem Wafer und ist deswegen günstiger zu produzieren) und die Leistungsaufnahme sinkt, weshalb es überhaupt erst möglich ist, eine Dual-GPU-Karte mit einer Leistungsaufnahme unter 300 Watt zu produzieren.
Der GT200b besteht weiterhin aus 1,4 Mrd. Transistoren und ist im Aufbau absolut identisch mit dem des GT200. An sämtlichen Ausführungseinheiten hat Nvidia keinerlei Veränderungen vorgenommen und auch deren Anzahl ist gleich geblieben. Nichtsdestotrotz entsprechen die beiden GT200b-GPUs auf der GeForce GTX 295 nicht der maximal machbaren Ausbaustufe des Chips, da man das Speicherinterface beschnitten hat.
Wie bereits erwähnt, ist die GeForce GTX 295 wie die GeForce 9800 GX2 sowie die GeForce 7950 GX2 eine Multi-GPU-Karte, die mit zwei Rechenkernen daher kommt, die jeweils auf einem eigenen PCB ihren Platz finden. Der Konkurrent ATi geht einen leicht anderen Weg und verbaut die GPUs auf einem einzelnen PCB. Damit die GPUs untereinander kommunizieren können, benutzt Nvidia einen nForce-200-Chip, der die ankommenden 16 PCIe-2.0-x16-Lanes auf die beiden Kerne mit der maximalen Bandbreite verteilt. Darüber hinaus sind die PCBs mit einer zur SLI-Bridge vergleichbaren Verbindung ausgestattet.
Die GeForce GTX 295 benutzt die SLI-Technologie, damit die beiden Grafikchips Daten untereinander austauschen können. Dabei kommt mittlerweile beinahe ausschließlich AFR (Alternate Frame Rendering) zum Einsatz, sprich jede GPU rendert ein eigenes Frame. Dies stellt die derzeit optimale Methode zur Performanceverbesserung dar, da AFR auch die Geometrie beschleunigen kann. Quad-SLI nutzt ebenfalls AFR, was sich dann allerdings 4-Way-AFR nennt, da jede GPU an einem eigenen Bild arbeitet.
Neben den Vorteilen von AFR übernimmt man aber logischerweise auch dessen Schwachstellen. So muss jede GPU in ihrem eigenen VRAM auf dieselben Daten zurückgreifen können, weswegen beide Chips die jeweils 896 MB Speicher mit einheitlichen Bits füllen. Darum können effektiv nur 896 MB genutzt werden. Zudem kann man nicht alle Ausführungseinheiten in den Chips doppelt zählen, da einige Berechnungen ebenfalls doppelt anfallen und natürlich die entstehenden Latenzen eine Rolle spielen. Nicht zu vergessen ist das Problem der „Mikroruckler“, das in niedrigen FPS-Bereichen den Spielspaß massiv mindern kann.
Auf jeder GT200b-GPU sind auf der GeForce GTX 295 240 skalare Shadereinheiten aktiv, die pro Takt ein MADD (Multiply-ADD) sowie ein MUL (Multiplikation) berechnen können. Auch sind 80 vollwertige Textureinheiten vorhanden. Damit kommt dieser Teil des Rechenkerns wie auf der GeForce GTX 280 mit der maximalen Leistung daher. Die TMU-Domäne taktet auf der GeForce GTX 295 mit 576 MHz, die Shadereinheiten mit 1.242 MHz.
Beschnitten hat man die GeForce GTX 295 am Speicherinterface, das anstatt 512 Bit „nur“ jeweils 448 Bit breit ist. Dies erreicht man, indem man nicht alle acht 64-Bit-Controller aktiviert, sondern nur noch deren sieben. Somit sind 14 und nicht 16 Speicherbausteine pro Platine vorhanden, was den VRAM auf je 896 MB verringert. Der GDDR3-Speicher wird mit 999 MHz angesteuert. Dadurch entsprechen die Taktraten sowie das komplette Speicherinterface der GeForce GTX 260. Die Anzahl der Shadereinheiten sowie TMUs hat man aber auf dem Niveau der GeForce GTX 280 belassen, weswegen die GeForce GTX 295 eine (doppelte) Kombination aus beiden 3D-Beschleunigern ist, mit einer Tendenz zur GeForce GTX 260 216 hin.