GeForce FX5900, FX5200 Ultra und Ti4800 im Test: Roundup von nV15 bis nV35

7/26

24.2.2004 23:04 Uhr Carsten Spille

Technische Daten

Und hier, wie üblich, ein paar technische Eckdaten zu den Chips im Testparcours. Wir haben, entgegen aller Übersichtlichkeit, einmal die Chips der alten Garde gegen diejenigen gestellt, auf die man mindestens aufrüsten sollte, um eine akzeptable Leistungssteigerung, bzw. einen anderen Mehrwehrt, sei es in Form von Dual-Monitoring, DX9 oder FSAA zu erhalten.

Deswegen bitten wir schon im Vorfeld, uns die etwas ungewöhnliche Anordnung der Tabellen nachzusehen. Wer übrigens nicht auf nVidia fixiert ist (wozu es auch keinen Grund gibt), der sollte sich eventuell auch einmal unser vier Monate altes Radeon RoundUp zu Gemüte führen. Auch dort tummeln sich interessante Grafikkarten. Bei den einzelnen Benchmarks befindet sich jeweils auch ein Link in diesen Artikel, so daß quasi ein direkter Vergleich bei Interesse möglich ist ohne die Diagramme ins absolut Uferlose auswuchern zu lassen.

	GF2 MX	FX 5200
Chip	nV11	nV34
Taktung (MHz)	175	250
Renderpipelines	2	4 (2/1)*
Pixelfüllrate	350MPix/s	1000MPix/s
TMUs je Pipe	2	1
Texelfüllrate	700MTex/s	1000MTex/s
Vertexeinheit	DX7 TnL	DX9 VS 2.0+
Vertexpipes	1	1
Dreiecksdurchsatz	~20MT/s	~62MV/s
Texturen pro Pass	2	8 (16)
Pixelshader	keine	PS 2.0+
Speicher	32MB	128MB
Anbindung	128Bit SDR	128Bit DDR
Speichertakt (MHz)	183	200
Bandbreite	2928 MB/s	6400 MB/s
SinglePass Texturop.	2	16(D3D) / 4(oGL)**
FSAA/AF-Technik	Supersampling	Accuview°
RAMDAC	1x350MHz	2x350MHz
TV-Encoder	extern	integriert
Sonstiges	TwinView nur mit 2. RAMDAC DVD MC	DVD MC/iDCT
Effizienz-Maßnahmen	keine	Zweikanal Speichercontroller, Fast ZClear, EarlyZ
Präz. pro Kanal°°	8Bit	32Bit (FP32)
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°°
Min. Instr./s	entfällt	0+500M
Max. Instr./s	entfällt	1000+0M
Peak Instr./s	entfällt	500M
* nVidia gibt zwar ein Maximum von vier Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen und Single-Texturing zu. Sobald Multitexturing genutzt wird, verhält sich der nV34 wie ein Design mit zwei Pipelines à zwei TMUs. Bei Einsatz von MultiTexturing mit mehr als vier Texturen ist beim nV34 ist gar nur eine Pipeline aktiv, die aber alle TMUs simultan nutzen kann. Die genaue Umkehrung des 4x1-Designs für Z-, Stencil- und Single-Texturing.
** Stand: Detonator 53.03
° Hierbei handelt es sich um eine Marketingbezeichnung für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig; GF2 (MX) und GF4MX bieten hier nur 2xAF als maximalen Grad an.
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format).
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt kann der nV34 bis zu vier Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen.

Der Nachfolger der GeForce2 MX als abgespeckteste Variante einer Generation ist die FX5200. Mit ihren Shader-Einheiten und sonstiger Ausstattung ermöglicht sie es Computerverkäufern Kunden mit "128MB RAM und DirectX9-fähig" zu ködern.

Schaut man einmal auf die rohen Leistungsdaten, so scheint die FX5200 wirklich ein wenig überdimensioniert für einen reinen Office-/Multimedia-PC zu sein. Ob man eher ihren Features oder ihrer Positionierung trauen sollte - wir werden sehen!

	GF2 U	GF4 MX440	GF3 Ti200	FX 5200 U	FX 5600	FX 5600 U
Chip	nV15	nV17	nV20	nV34	nV31	nV36
Taktung (MHz)	250	270	175	325	325	350
Renderpipes	4	2	4	4 (2/1)*	4 (2)*
Pixelfüllrate	1000MPix/s	540MPix/s	700MPix/s	1300MPix/s	1300MPix/s	1400 MPix/s
TMUs je Pipe	2	2	2	1
Texelfüllrate	2000MTex/s	1080MTex/s	1400MTex/s	1300MTex/s		1400 MTex/s
Vertexeinheit	DX7 TnL		DX8 VS1.1	DX9 VS 2.0+
Vertexpipes	1
Dreiecksdurchsatz	~31MT/s	~34MT/s	~44MV/s	~81MV/s		~87MV/s
Texturen pro Pass	2		4	8 (16)
Pixelshader	keine		PS1.1	PS 2.0+
Speicher	64MB			128MB
Anbindung	128Bit SDR	128Bit DDR
Speichertakt (MHz)	230	200		325	275	350
Bandbreite	7360MB/s	6400MB/s		10400MB/s	8800MB/s	11200MB/s
SinglePass Texturop.	2		4	16(D3D) / 4(oGL)**
FSAA/AF-Technik	Super-Sampling	HRAA°	AccuView°	IntelliSample°
RAMDAC	1x350MHz	2x350MHz	1x350MHz	2x350MHz	2x400MHz
TV-Encoder	extern	integriert	extern	integriert
Sonstiges	DVD MC	DVD MC/iDCT	DVD MC	DVD MC/iDCT
Effizienz-Maßnahmen	keine	Zweikanal-LMA, Fast Z-Clear, EarlyZ	Vierkanal-LMA, Fast ZClear, EarlyZ, Z-Compression	Zweikanal-LMA II(I), Fast Z-Clear, EarlyZ	Zweikanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression
Präz. pro Kanal°°	8Bit	8Bit	9Bit (FX9)	32Bit (FP32)
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°°
Min. Instr./s	entfällt			0+650M		0+700M
Max. Instr./s	entfällt			1300M+0		1400M+0
Peak Instr./s	entfällt			1300M		1400M
* nVidia gibt zwar ein Maximum von vier Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen und Single-Texturing zu. Sobald Multitexturing genutzt wird, verhalten sich der nV31/nV34 wie ein Design mit zwei Pipelines à zwei TMUs. Bei Einsatz von MultiTexturing mit mehr als vier Texturen ist beim nV34 ist gar nur eine Pipeline aktiv, die aber alle TMUs simultan nutzen kann. Die genaue Umkehrung des 4x1-Designs für Z-, Stencil- und Single-Texturing.
** Stand: Detonator 53.03
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig; GF2 (MX) und GF4MX bieten hier nur 2xAF als maximalen Grad an.
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format).
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt können der nV31/nV34 bis zu vier Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen.

Wer allerhöchstens eine Grafikkarte aus den ersten drei Spalten sein Eigen nennt, für den könnte sich die rechte Hälfte der Tabelle eventuell schon als Upgrade-Option anbieten - sei es, weil er keine allzugroßen Ansprüche stellt (Die GeForce2 Ultra Käufer einmal ausgenommen, aber deren Leistung liegt mittlerweile nunmal im Bereich der GF4 MX440 und bestenfalls in dem der GF3 Ti200) oder sei es, weil schlicht das Budget zu limitiert ist.

Zu beachten ist hier auch noch für unsere Benchmarks mit aktivierten Bildqualitätsoptionen, dass GeForce2 Ultra und GeForce4 MX440 zu höchstens zweifach anisotroper Filterung in der Lage sind.

Ob neben DirectX 9-Features auch die Leistung dieses mögliche Upgrade rechtfertigt? Wir sprechen uns im Fazit wieder!

	GF4 Ti4200	GF FX 5800	GF FX 5900 XT
Chip	nV25	nV30	nV35
Taktung (MHz)	250	400	390²
Renderpipes	4	4 (8)*
Pixelfüllrate	1000MPix/s	1600MPix/s	1560MPix/s
TMUs je Pipe	2
Texelfüllrate	2000MTex/s	3200MTex/s	3120MTex/s
Vertexeinheit	DX8 VS1.1	DX9 VS 2.0+
Vertexpipes	2	3 (Array)
Dreiecksdurchsatz	~113MV/s	~300MV/s	~292MV/s
Texturen pro Pass	4	8 (16)
Pixelshader	PS1.3	PS 2.0+
Speicher	64MB	128MB
Anbindung	128Bit DDR		256Bit DDR
Speichertakt (MHz)	253	400	350
Bandbreite	8096MB/s	12800MB/s	22400MB/s
SinglePass Texturop.	4	16(D3D) / 4(oGL)**
FSAA/AF-Technik	AccuView°	IntelliSample°	IntelliSample HCT°
RAMDAC	2x400MHz
TV-Encoder	extern	integriert
Sonstiges	DVD MC	DVD MC/iDCT
Effizienz-Maßnahmen	Vierkanal-LMA II, Fast ZClear, EarlyZ, Z-Compression	Vierkanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression
Präz. pro Kanal°°	9Bit (FX9)	32Bit (FP32)
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°°
Min. Instr./s	entfällt	0+1600M	0+3120M
Max. Instr./s	entfällt	3200M+0	3120M+3120M
Peak Instr./s	entfällt	3200M	6240M
²Unser Testsample war mit 400MHz getaktet, wie auch schon die Karte von Albatron und wurde dementsprechend auch so getestet. Überhaupt scheint nicht 100%ige Einigkeit zu herrschen, welches nun der Standard-Takt der 5900Xt ist.
* nVidia gibt zwar ein Maximum von acht Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen zu. Sobald Multitexturing genutzt wird, verhält sich der nV3o wie ein Design mit vier Pipelines à zwei TMUs.
** Stand: Detonator 53.03
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig. HCT steht für verlustarme Komprimierung des gesamten Contents.
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format).
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt kann der nV30 bis zu acht Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen. Der nV35 kann ebenfalls acht Textur-Ops, allerdings zusätzlich noch bis zu acht Arithmetik-Ops pro Takt und Pipeline ausführen.

Der upper-Mid-Range Kunde, der typischerweise versucht, die Karten mit dem besten Preis-Leistungs-Verhältnis zu kaufen, könnte angesichts von mehr als 18 Monaten Lebenszeit und mehr noch, auf 64MB (in unserem Beispiel) begrenztem Grafikspeicher schon der Sinn nach mehr stehen. Eine kleine Vorauswahl haben wir schon getroffen - Upgrades auf kleinere Karten als in dieser Tabelle lohnen nur bedingt.

	GF4 Ti4800	GF FX 5800 U	GF FX 5900	GF FX 5900 U
Chip	nV28	nV30	nV35	nV35
Taktung (MHz)	300	500	400	450
Renderpipes	4	4 (8)*
Pixelfüllrate	1200MPix/s	2000MPix/s	1600MPix/s	1800MPix/s
TMUs je Pipe	2
Texelfüllrate	2400MTex/s	4000MTex/s	3200MTex/s	3600MTex/s
Vertexeinheit	DX8 VS1.1	DX9 VS 2.0+
Vertexpipes	2	3 (Array)
Dreiecksdurchsatz	~136MV/s	~375MV/s	~300MV/s	~337MV/s
Texturen pro Pass	4	8 (16)
Pixelshader	PS1.3	PS 2.0+
Speicher	128MB			256MB
Anbindung	128Bit DDR		256Bit DDR
Speichertakt (MHz)	325	500	425
Bandbreite	10400MB/s	16000MB/s	25600MB/s
SinglePass Texturop.	4	16(D3D) / 4(oGL)**
FSAA/AF-Technik	AccuView°	IntelliSample°	IntelliSample HCT°
RAMDAC	2x400MHz
TV-Encoder	extern	integriert
Sonstiges	DVD MC	DVD MC/iDCT
Effizienz-Maßnahmen	Vierkanal-LMA II, Fast ZClear, EarlyZ, Z-Compression	Vierkanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression	Vierkanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression, Ultra Shadow, HCT
Präz. pro Kanal°°	9Bit (FX9)	32Bit (FP32)
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°°
Min. Instr./s	entfällt	0+2000M	0+3200M	0+3600M
Max. Instr./s	entfällt	4000M+0	3200M+3200M	3600M+3600M
Peak Instr./s	entfällt	4000M	6400M	7200M
* nVidia gibt zwar ein Maximum von acht Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen zu. Sobald Multitexturing genutzt wird, verhält sich der nV3o wie ein Design mit vier Pipelines à zwei TMUs.
** Stand: Detonator 53.03
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig. HCT steht für verlustarme Komprimierung des gesamten Contents.
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format).
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt kann der nV30 bis zu acht Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen. Der nV35 kann ebenfalls acht Textur-Ops, allerdings zusätzlich noch bis zu acht Arithmetik-Ops pro Takt und Pipeline ausführen.

Entweder man nutzt seine Karten bis zum bitteren Ende und hat wirklich lange mit dem Upgrade gewartet oder will prinzipiell nur High-End Modelle in seinem Rechner sehen. In beiden Fällen sollte man, eventuell mit Ausnahme der FX 5900 XT, unterhalb der Modelle in unserer letzten Tabelle nicht anfangen. Hier tummelt sich die vergangene und aktuelle High-End Garde von nVidia.

[b]UPDATE 27.02.2004: Die Tabellen enthielten Fehler sowohl bezüglich der Rechengenauigkeit, die pro Kanal natürlich nur 32Bit beträgt, als auch bezüglich der Leistungsfähigkeit der CineFX II Chips. Diese können unter Umständen bis zu acht zusätzliche FP-Operationen verglichen mit CineFX I ausführen.

Danke an Demirug, den Autor des CineFX-Artikels für den Hinweis! [/b]