Connect3D Radeon 9700 Pro im Test: Leistungssprung bei hohen Auflösungen

 4/36
Carsten Spille
22 Kommentare

Specs und Technik

Werfen wir nun einen kurzen Blick auf die Architektur und technischen Spezifikationen der Radeon9700pro. ATi selber stellt natürlich umfangreiche, aber auch sehr marketinglastige Informationen bereit, um Interessenten zum Kauf zu bewegen. Wer darauf einen Blick werfen möchte, wird hier fündig.

Wir haben uns bemüht das wirklich Relevante ein wenig herauszufiltern und einen kleinen Überlblick über das Grundgerüst von ATis Flaggschiff, welches auch die Connect3D Radeon9700pro antreibt, zu geben.

Eckdaten der Radeon9700pro im Überblick
  Radeon9700pro Radeon8500 GeForce4 Ti4600
Chipname R300 R200 nV25/nV28
Herstellungsprozess 0,15µ 0,15µ 0,15µ
Transistorzahl ~107Millionen ~60Millionen ~63Millionen
Chiptakt 325MHz 275MHz 300MHz
Rendering-Pipelines 8 4 4
TMU pro Pipeline 1 2 2
Füllrate (Mrd. Pixel/s 2,6 GPix/s 1,1 GPix/s 1,2GPix/s
Füllrate (Mrd. Texel/s) 2,6 GTex/s 2,2 GTex/s 2,4 GTex/s
Füllrate (Mrd. AA-Samples/s) 15,6 GSamp/s 1,1 GSamp/s 4,8 GSamp/s
max. Texturen pro Pass 8 6 4
max. Texturzugriffe pro Pass 16 11 4
Speichergröße 128MB 64MB / 128MB 128MB
Speichertakt 310MHz 275MHz 325MHz
RAM-Busbreite 256Bit DDR 128Bit DDR 128Bit DDR
RAM-Bandbreite (Mrd. Byte/s) 19,84 GB/s 8,8 GB/s 10,4 GB/s
Vertexshader / TnL-Einheiten 4 1/1 2
max. Vertexshader Version 2.0 1.1 1.1
max. Pixelshader Version 2.0 1.4 1.3
max. Vertexdurchsatz ~325M Vertices/s ~69M Vertices/s ~136M Vertices/s
integrierte RAMDACs 2x 400MHz 1x 400MHz 2x400MHz
max. AGP-Modus AGP 8x AGP 4x AGP 4x/8x

Da wir auf die DirectX9-Funktionalität in einer separaten Tabelle eingehen wollen, konzentrieren wir uns hier vorerst darauf, was die vorhandene Hardware für Möglichkeiten mit aktueller Software hat.

Wie schon bei der Radeon9000 und beim kürzlich vorgestellten nV30 hat man auch beim R300 auf eine weitere Erhöhung der TMUs pro Pipeline verzichtet. Die für ein High-End Modell allerdings unverzichtbare Füllrate erreicht man durch "einfache" Verdoppelung der ganzen Renderpipelines. Das hat den positiven Nebeneffekt, dass nun eine mehr als doppelt so hohe Pixelfüllrate im Vergleich zu den nächsten Konkurrenten vorhanden ist und man durch tiefe Loopback-Funktionalität wesentlich flexibler beim Multitexturing agieren kann.

Damit diese gewaltige Rohleistung nicht brachliegt, hat sich ATi auch beim Speicherinterface nicht lumpen lassen und ein 256Bit breites DDR-RAM Interface integriert. Die zur Verfügung stehende Speicherbandbreite verdoppelt sich damit nahezu und auch deren Effektive Ausnutzung wird durch einen vierfach ausgelegten Memory-Controller sichergestellt (Ein Verzicht darauf könnte einen ebensolchen Effekt wie beim, in Bezug auf die Spieleleistung, grandios gefloppten Matrox Parhelia bedeuten).

Die bei der GeForce4 Ti vorhandenen 2 Vertexshader toppt der R300 ebenfalls mühelos und verdoppelt deren Anzahl auf 4, woraus sich die enorme (theoretische!!) Transformationsleistung von mehr als 300 Millionen Eckpunkten pro Sekunde ergibt. Wie schon beim Radeon9000 (RV250) integriert jetzt auch der R300 zwei hochtaktende RAMDACs und somit ist sichergestellt, dass das Multi-Monitor-Feature auch bei allen Karten mit zwei Monitorausgängen verfügbar ist im Gegensatz zu etlichen billigen Radeon8500-Karten der letzten Serien. Die mittlerweile gehäuft anzutreffende AGP 8x-Funktionalität kann man vorerst, besonders in Ermangelung ausgereifter Mainboards die diesen Standard ebenfalls unterstützen, als Marketing-Feature abtun.

Shaderfunktionalität
  R300 nV25
Vertexshader
max. Instruktionen (inkl. Loops) 65536 32
statische Instruktionen 256 128
Statische Flusskontrolle Ja Nein
Dynamische Flusskontrolle Nein Nein
Textur-Zugriff Nein Nein
Pixelshader
Floating-Point Präzision (max. Präz.) Ja (96Bit) Nein (32Bit)
Flusskontrolle Nein Nein
Multiple Render Targets Ja (4) Nein
Max. Texturadressierungs Instr. 32 4
Max. Instruktionen zur Laufzeit 160 (DX9 PS2.0: 96) 4

Wie an einigen ausgewählten Spezifikationen deutlich wird, sind die ehemals (auch von uns!) als "frei programmierbare" Einheiten gepriesenen Shader nach DirectX8-Standard doch nur sehr begrenzt nutzbar, so dass jetzt immer mehr ehemalige begeisterte Fürsprecher dieser Technik nunmehr in DirectX9 das sehen, was sie zuvor in DX7 und danach in DX8 zu erkennen glaubten. Sehr von Vorteil sind auf jeden Fall die erhöhten Präzisionswerte und die Gleitkomma-Tauglichkeit der Pixelpipelines, da dies im Rahmen der Möglichkeiten des Gesamtproduktes einen nicht zu verachtenden Fortschritt besonders bei komplexen Materialshadern und Lichtberechnungen darstellt. Durch die höhere Präzision der internen Berechnungen und die ausgeglichenere Verteilung des Wertebereichs besonders im Lichtbereich lassen sich nun deutlich "echter" wirkende Beleuchtungen und Materialoberflächen realisieren, als es noch vor kurzem der Fall war. Doch auch hier braucht man sich nichts vorzumachen, da schon die ersten Erweiterungen der DX9-Spezifikation in Aussicht stehen und spätestens mit DirectX10 wieder einmal alles "Alte" auch gründlich veraltet erscheinen wird.

Weitere Features der Radeon9700pro:

  • Smartshader 2.0
    Hierunter sind die oben schon angesprochenen, erweiterten Shadermöglichkeiten der Radeon9700 zu verstehen.
  • Smoothvision 2.0
    Smoothvision fasst nunmehr alle Optionen bezüglich Fullscreen Antialiasing und anisotroper Filterung hierunter zusammen. Ersteres wurde komplett auf Multisampling umgestellt und durch entsprechende Auslegung der Hardware mit jeweils 6 erzeugten AA-Samples pro Pipeline wirklich drastisch beschleunigt. Dafür glättet es nunmehr auch nur noch, wie schon bei nVidia, Polygonkanten und keine Texturen mehr. Der anisotrope Filter wurde dahingehend korrigiert, dass er endlich das schnelle 16fache AF mit trilinearer Mipmap-Interpolation verbinden kann.
  • Videoshader
    Früher als Motion Compensation, iDCT (inverse Discrete Cosinus Transformation) bekannte Features, für die die notwendige Zusatzhardware nun durch die Pixelshader ersetzt wird.
  • Fullstream
    Eine Neuerung mit der ATi mittels geeigneter Plug-Ins (z.Zt. nur für die Bezahl-Version des Real-One Players verfügbar) aus kleinen pixelig-blockigen Videostreams aus dem Internet eine gesteigerte Bildqualtät herausholen will, indem sie durch geeignete Pixelshader gefiltert werden.
  • TruForm 2.0
    Das ehemalis nur den n-Patch Support umfassende TruForm hat sich nun zu DirectX9 Displacement Mapping gemausert, welches den Legacy-TruForm Support eigentlich nebenbei erledigen sollte. "Sollte" deshalb, weil bislang noch kein Treiber (inklusive des BETA-DirectX9-Treibers) in der Lage ist, TruForm wirklich in akzeptabler Geschwindigkeit darzustellen.
  • Hyper-Z III
    Das durch alle bislang erhältlichen Radeon-Generationen weiterentwickelte Effizienzprogramm erreicht in seiner dritten Inkarnation eine neue Stufe. Durch verlustfreie Z-Buffer Kompression (ATi gibt hier eine Rate von bis zu 24:1 an), einen dreistufig hierachischen Z-Buffer und blockweisem Überschreiben des Z-Buffers in Kombination mit dem vierfach unterteilten Speichersubsystem versucht man, sowohl die Vermeidung unnötigen Renderns von nicht sichtbaren Pixeln als auch die Auslastung des 256Bit-Interfaces auf ein Maximum zu treiben.