ATi Radeon X800 Pro und X800 XT in der Vorschau: Goodbye, Ruby Tuesday

 2/5
Carsten Spille
94 Kommentare

Chip und Karte

Da ist es nun offiziell und zu allererst müssen wir eine Fehleinschätzung unsererseits eingestehen. Hatten wir noch vor knapp zehn Tagen das in Taiwan aufgetauchte Bild der Radeon X800 als unecht gewertet, werden wir heute eines besseren belehrt.

Foto X800
Foto X800
DRAM DC IO Power
DRAM DC IO Power
A Series that Delivers
A Series that Delivers

ATi hat es, wie wir schon als Möglichkeit einräumten, tatsächlich geschafft, sowohl die Radeon X800 Pro als auch die X800 XT durch die Umstellung des Herstellungsprozesses auf einen 0,13µ-lowK Prozess der Chipschmiede TSMC und durch die Verwendung von GDDR3-RAM, welches mit deutlich weniger Leistung auskommt, als DDR- oder gar DDR-II RAM, die Leistungsaufnahme des kompletten Boards nicht allzu stark ansteigen zu lassen. Die X800 Pro soll sogar weniger Strom verbrauchen, als die Radeon 9800 XT.

Hier haben wir die beiden Chips und Taktraten nochmal im direkten Vergleich. Der Übersicht halber auch nochmal direkt in unserer bekannten Tabelle und mit den entsprechenden Werten der GeForce.

Radeon
9800 XT
Radeon
X800 Pro
Radeon
X800 XT
GeForce FX
5950 Ultra
GeForce
6800 Ultra
Chip R360 R420 R420 NV38 NV40
Transistoren ca. 110M 160M 160M ca. 135M ca. 222M
Fertigung 0,15µ 0,13 µm
lowK copper
0,13 µm
lowK copper
0,13 µm 0,13µ
Taktung (MHz) 412 475 520 475 400
Renderpipes 8 12 16 4(8)* 16(32)*
Pixelfüllrate 3296MPix/s 5700MPix/s 8320MPix/s 1900 6400MPix/s
TMUs je Pipe 1 1 1 2 1
Texelfüllrate 3296MTex/s 5700MTex/s 8320MTex/s 3800MTex/s 6400MTex/s
Vertexeinheit DX9 VS2.0 DX9 VS 2.0 DX9 VS 2.0 DX9 VS2.0+ DX9 VS3.0
Vertexpipes 4 6 6 3 (Array) 6
Dreiecksdurchsatz ca. 412MV/s ca. 712MV/s ca. 780MV/s ca. 356MV/s ca. 600MV/s
Texturen pro Pass 8 (16) 8 (16) 8 (16) 8 (16) 8 (16)
Pixelshader PS2.0 PS 2.0+ PS 2.0+ PS2.0+ PS 3.0
FP-Einheiten 3+1 ALU
3+1 Mini ALU
1TexOp
3+1 ALU
3+1 Mini ALU
1TexOp
3+1 ALU
3+1 Mini ALU
1TexOp
2 (Shadercore + FPU) 2 (Shader-Unit 1 & 2)**
Speicher (MB) 256 DDR 256 GDDR3 256 GDDR3 256 DDR 256+ GDDR3
Anbindung 256-bit DDR 256-bit GDDR3 256Bit GDDR3 256-bit DDR 256-bit GDDR3
Speichertakt (MHz) 365 450 560 475 550
Bandbreite (MB/s) 23360 28800 35840 30400 35200
SinglePass Texturop. 16 D3D / 8 (oGL) 16 (D3D) / 8 (oGL) 16 (D3D) / 8 (oGL) 16 (D3D) / 4 (oGL) 16 (D3D) / 4 (oGL)
RAMDAC 2x400MHz 2x400MHz 2x400MHz 2x400MHz 2x400MHz
TV-Encoder integriert integriert integriert integriert integriert
Sonstiges DVD MC/iDCT DVD MC/iDCT,
MPEG2 En- / Decoder,
MPEG4 En- / Decoder
DVD MC/iDCT,
MPEG2 En- / Decoder,
MPEG4 En- / Decoder
DVD MC/iDCT DVD MC/iDCT,
MPEG2 En- / Decoder,
MPEG4 En- / Decoder
Präz. pro Kanal 24Bit (FP24) 24Bit (FP24) 24Bit (FP24 32Bit (FP32) 32Bit (FP32)
* nVidias High-End GPU unterstützen seit dem NV30 ein Verfahren, bei dem in den ROPs am Ende der Pipeline jeweils zwei, anstatt der üblichen einen Z-/Stencilwerte verarbeitet werden können. Solange Pixel also ohne Farbwert auskommen und auch nicht texturiert sind (Stencilschatten und reine Z-Writes) bekommt man zwei Pixel pro Takt durch eine physikalische Pixelpipeline.
** Wenn die vorliegenden Informationen korrekt sind, besitzt der NV40 zwei FP-Einheiten in jeder seiner 16 Pipelines. Allerdings scheint es ebenso vielfältige Möglichkeiten wie Einschränkungen zu geben, um diese gemeinsam zu nutzen. Nur die wenigsten der komplexeren Shader-Instruktionen können auf beiden wirklich parallel und ohne irgendwelche Abhängigkeiten laufen. Für detailliertere Informationen zur CineFX-Architektur der GeForceFX bietet 3DCenter.de einen passenden Artikel an.

Kommen wir nun zum Chip an sich und dessen Interna. Auch beim R420, das sei vorab schonmal gesagt, verläßt sich ATi zum größten Teil noch auf die mittlerweile fast zwei Jahre alte Architektur der Radeon 9700 Pro. Natürlich wurde alles schneller, weiter und höher (bis auf den Kühler).