GeForce FX5900, FX5200 Ultra und Ti4800 im Test: Roundup von nV15 bis nV35
7/26Technische Daten
Und hier, wie üblich, ein paar technische Eckdaten zu den Chips im Testparcours. Wir haben, entgegen aller Übersichtlichkeit, einmal die Chips der alten Garde gegen diejenigen gestellt, auf die man mindestens aufrüsten sollte, um eine akzeptable Leistungssteigerung, bzw. einen anderen Mehrwehrt, sei es in Form von Dual-Monitoring, DX9 oder FSAA zu erhalten.
Deswegen bitten wir schon im Vorfeld, uns die etwas ungewöhnliche Anordnung der Tabellen nachzusehen. Wer übrigens nicht auf nVidia fixiert ist (wozu es auch keinen Grund gibt), der sollte sich eventuell auch einmal unser vier Monate altes Radeon RoundUp zu Gemüte führen. Auch dort tummeln sich interessante Grafikkarten. Bei den einzelnen Benchmarks befindet sich jeweils auch ein Link in diesen Artikel, so daß quasi ein direkter Vergleich bei Interesse möglich ist ohne die Diagramme ins absolut Uferlose auswuchern zu lassen.
GF2 MX | FX 5200 | |
---|---|---|
Chip | nV11 | nV34 |
Taktung (MHz) | 175 | 250 |
Renderpipelines | 2 | 4 (2/1)* |
Pixelfüllrate | 350MPix/s | 1000MPix/s |
TMUs je Pipe | 2 | 1 |
Texelfüllrate | 700MTex/s | 1000MTex/s |
Vertexeinheit | DX7 TnL | DX9 VS 2.0+ |
Vertexpipes | 1 | 1 |
Dreiecksdurchsatz | ~20MT/s | ~62MV/s |
Texturen pro Pass | 2 | 8 (16) |
Pixelshader | keine | PS 2.0+ |
Speicher | 32MB | 128MB |
Anbindung | 128Bit SDR | 128Bit DDR |
Speichertakt (MHz) | 183 | 200 |
Bandbreite | 2928 MB/s | 6400 MB/s |
SinglePass Texturop. | 2 | 16(D3D) / 4(oGL)** |
FSAA/AF-Technik | Supersampling | Accuview° |
RAMDAC | 1x350MHz | 2x350MHz |
TV-Encoder | extern | integriert |
Sonstiges | TwinView nur mit 2. RAMDAC DVD MC | DVD MC/iDCT |
Effizienz-Maßnahmen | keine | Zweikanal Speichercontroller, Fast ZClear, EarlyZ |
Präz. pro Kanal°° | 8Bit | 32Bit (FP32) |
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°° | ||
Min. Instr./s | entfällt | 0+500M |
Max. Instr./s | entfällt | 1000+0M |
Peak Instr./s | entfällt | 500M |
* nVidia gibt zwar ein Maximum von vier Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen und Single-Texturing zu. Sobald Multitexturing genutzt wird, verhält sich der nV34 wie ein Design mit zwei Pipelines à zwei TMUs. Bei Einsatz von MultiTexturing mit mehr als vier Texturen ist beim nV34 ist gar nur eine Pipeline aktiv, die aber alle TMUs simultan nutzen kann. Die genaue Umkehrung des 4x1-Designs für Z-, Stencil- und Single-Texturing. | ||
** Stand: Detonator 53.03 | ||
° Hierbei handelt es sich um eine Marketingbezeichnung für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig; GF2 (MX) und GF4MX bieten hier nur 2xAF als maximalen Grad an. |
||
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format). | ||
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt kann der nV34 bis zu vier Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen. |
Der Nachfolger der GeForce2 MX als abgespeckteste Variante einer Generation ist die FX5200. Mit ihren Shader-Einheiten und sonstiger Ausstattung ermöglicht sie es Computerverkäufern Kunden mit "128MB RAM und DirectX9-fähig" zu ködern.
Schaut man einmal auf die rohen Leistungsdaten, so scheint die FX5200 wirklich ein wenig überdimensioniert für einen reinen Office-/Multimedia-PC zu sein. Ob man eher ihren Features oder ihrer Positionierung trauen sollte - wir werden sehen!
GF2 U | GF4 MX440 | GF3 Ti200 | FX 5200 U | FX 5600 | FX 5600 U | |
---|---|---|---|---|---|---|
Chip | nV15 | nV17 | nV20 | nV34 | nV31 | nV36 |
Taktung (MHz) | 250 | 270 | 175 | 325 | 325 | 350 |
Renderpipes | 4 | 2 | 4 | 4 (2/1)* | 4 (2)* | |
Pixelfüllrate | 1000MPix/s | 540MPix/s | 700MPix/s | 1300MPix/s | 1300MPix/s | 1400 MPix/s |
TMUs je Pipe | 2 | 2 | 2 | 1 | ||
Texelfüllrate | 2000MTex/s | 1080MTex/s | 1400MTex/s | 1300MTex/s | 1400 MTex/s | |
Vertexeinheit | DX7 TnL | DX8 VS1.1 | DX9 VS 2.0+ | |||
Vertexpipes | 1 | |||||
Dreiecksdurchsatz | ~31MT/s | ~34MT/s | ~44MV/s | ~81MV/s | ~87MV/s | |
Texturen pro Pass | 2 | 4 | 8 (16) | |||
Pixelshader | keine | PS1.1 | PS 2.0+ | |||
Speicher | 64MB | 128MB | ||||
Anbindung | 128Bit SDR | 128Bit DDR | ||||
Speichertakt (MHz) | 230 | 200 | 325 | 275 | 350 | |
Bandbreite | 7360MB/s | 6400MB/s | 10400MB/s | 8800MB/s | 11200MB/s | |
SinglePass Texturop. | 2 | 4 | 16(D3D) / 4(oGL)** | |||
FSAA/AF-Technik | Super-Sampling | HRAA° | AccuView° | IntelliSample° | ||
RAMDAC | 1x350MHz | 2x350MHz | 1x350MHz | 2x350MHz | 2x400MHz | |
TV-Encoder | extern | integriert | extern | integriert | ||
Sonstiges | DVD MC | DVD MC/iDCT | DVD MC | DVD MC/iDCT | ||
Effizienz-Maßnahmen | keine | Zweikanal-LMA, Fast Z-Clear, EarlyZ | Vierkanal-LMA, Fast ZClear, EarlyZ, Z-Compression | Zweikanal-LMA II(I), Fast Z-Clear, EarlyZ | Zweikanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression | |
Präz. pro Kanal°° | 8Bit | 8Bit | 9Bit (FX9) | 32Bit (FP32) | ||
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°° | ||||||
Min. Instr./s | entfällt | 0+650M | 0+700M | |||
Max. Instr./s | entfällt | 1300M+0 | 1400M+0 | |||
Peak Instr./s | entfällt | 1300M | 1400M | |||
* nVidia gibt zwar ein Maximum von vier Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen und Single-Texturing zu. Sobald Multitexturing genutzt wird, verhalten sich der nV31/nV34 wie ein Design mit zwei Pipelines à zwei TMUs. Bei Einsatz von MultiTexturing mit mehr als vier Texturen ist beim nV34 ist gar nur eine Pipeline aktiv, die aber alle TMUs simultan nutzen kann. Die genaue Umkehrung des 4x1-Designs für Z-, Stencil- und Single-Texturing. | ||||||
** Stand: Detonator 53.03 | ||||||
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig; GF2 (MX) und GF4MX bieten hier nur 2xAF als maximalen Grad an. | ||||||
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format). | ||||||
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt können der nV31/nV34 bis zu vier Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen. |
Wer allerhöchstens eine Grafikkarte aus den ersten drei Spalten sein Eigen nennt, für den könnte sich die rechte Hälfte der Tabelle eventuell schon als Upgrade-Option anbieten - sei es, weil er keine allzugroßen Ansprüche stellt (Die GeForce2 Ultra Käufer einmal ausgenommen, aber deren Leistung liegt mittlerweile nunmal im Bereich der GF4 MX440 und bestenfalls in dem der GF3 Ti200) oder sei es, weil schlicht das Budget zu limitiert ist.
Zu beachten ist hier auch noch für unsere Benchmarks mit aktivierten Bildqualitätsoptionen, dass GeForce2 Ultra und GeForce4 MX440 zu höchstens zweifach anisotroper Filterung in der Lage sind.
Ob neben DirectX 9-Features auch die Leistung dieses mögliche Upgrade rechtfertigt? Wir sprechen uns im Fazit wieder!
GF4 Ti4200 | GF FX 5800 | GF FX 5900 XT | |
---|---|---|---|
Chip | nV25 | nV30 | nV35 |
Taktung (MHz) | 250 | 400 | 390² |
Renderpipes | 4 | 4 (8)* | |
Pixelfüllrate | 1000MPix/s | 1600MPix/s | 1560MPix/s |
TMUs je Pipe | 2 | ||
Texelfüllrate | 2000MTex/s | 3200MTex/s | 3120MTex/s |
Vertexeinheit | DX8 VS1.1 | DX9 VS 2.0+ | |
Vertexpipes | 2 | 3 (Array) | |
Dreiecksdurchsatz | ~113MV/s | ~300MV/s | ~292MV/s |
Texturen pro Pass | 4 | 8 (16) | |
Pixelshader | PS1.3 | PS 2.0+ | |
Speicher | 64MB | 128MB | |
Anbindung | 128Bit DDR | 256Bit DDR | |
Speichertakt (MHz) | 253 | 400 | 350 |
Bandbreite | 8096MB/s | 12800MB/s | 22400MB/s |
SinglePass Texturop. | 4 | 16(D3D) / 4(oGL)** | |
FSAA/AF-Technik | AccuView° | IntelliSample° | IntelliSample HCT° |
RAMDAC | 2x400MHz | ||
TV-Encoder | extern | integriert | |
Sonstiges | DVD MC | DVD MC/iDCT | |
Effizienz-Maßnahmen | Vierkanal-LMA II, Fast ZClear, EarlyZ, Z-Compression | Vierkanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression | |
Präz. pro Kanal°° | 9Bit (FX9) | 32Bit (FP32) | |
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°° | |||
Min. Instr./s | entfällt | 0+1600M | 0+3120M |
Max. Instr./s | entfällt | 3200M+0 | 3120M+3120M |
Peak Instr./s | entfällt | 3200M | 6240M |
²Unser Testsample war mit 400MHz getaktet, wie auch schon die Karte von Albatron und wurde dementsprechend auch so getestet. Überhaupt scheint nicht 100%ige Einigkeit zu herrschen, welches nun der Standard-Takt der 5900Xt ist. | |||
* nVidia gibt zwar ein Maximum von acht Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen zu. Sobald Multitexturing genutzt wird, verhält sich der nV3o wie ein Design mit vier Pipelines à zwei TMUs. | |||
** Stand: Detonator 53.03 | |||
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig. HCT steht für verlustarme Komprimierung des gesamten Contents. | |||
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format). | |||
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt kann der nV30 bis zu acht Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen. Der nV35 kann ebenfalls acht Textur-Ops, allerdings zusätzlich noch bis zu acht Arithmetik-Ops pro Takt und Pipeline ausführen. |
Der upper-Mid-Range Kunde, der typischerweise versucht, die Karten mit dem besten Preis-Leistungs-Verhältnis zu kaufen, könnte angesichts von mehr als 18 Monaten Lebenszeit und mehr noch, auf 64MB (in unserem Beispiel) begrenztem Grafikspeicher schon der Sinn nach mehr stehen. Eine kleine Vorauswahl haben wir schon getroffen - Upgrades auf kleinere Karten als in dieser Tabelle lohnen nur bedingt.
GF4 Ti4800 | GF FX 5800 U | GF FX 5900 | GF FX 5900 U | |
---|---|---|---|---|
Chip | nV28 | nV30 | nV35 | nV35 |
Taktung (MHz) | 300 | 500 | 400 | 450 |
Renderpipes | 4 | 4 (8)* | ||
Pixelfüllrate | 1200MPix/s | 2000MPix/s | 1600MPix/s | 1800MPix/s |
TMUs je Pipe | 2 | |||
Texelfüllrate | 2400MTex/s | 4000MTex/s | 3200MTex/s | 3600MTex/s |
Vertexeinheit | DX8 VS1.1 | DX9 VS 2.0+ | ||
Vertexpipes | 2 | 3 (Array) | ||
Dreiecksdurchsatz | ~136MV/s | ~375MV/s | ~300MV/s | ~337MV/s |
Texturen pro Pass | 4 | 8 (16) | ||
Pixelshader | PS1.3 | PS 2.0+ | ||
Speicher | 128MB | 256MB | ||
Anbindung | 128Bit DDR | 256Bit DDR | ||
Speichertakt (MHz) | 325 | 500 | 425 | |
Bandbreite | 10400MB/s | 16000MB/s | 25600MB/s | |
SinglePass Texturop. | 4 | 16(D3D) / 4(oGL)** | ||
FSAA/AF-Technik | AccuView° | IntelliSample° | IntelliSample HCT° | |
RAMDAC | 2x400MHz | |||
TV-Encoder | extern | integriert | ||
Sonstiges | DVD MC | DVD MC/iDCT | ||
Effizienz-Maßnahmen | Vierkanal-LMA II, Fast ZClear, EarlyZ, Z-Compression | Vierkanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression | Vierkanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression, Ultra Shadow, HCT | |
Präz. pro Kanal°° | 9Bit (FX9) | 32Bit (FP32) | ||
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°° | ||||
Min. Instr./s | entfällt | 0+2000M | 0+3200M | 0+3600M |
Max. Instr./s | entfällt | 4000M+0 | 3200M+3200M | 3600M+3600M |
Peak Instr./s | entfällt | 4000M | 6400M | 7200M |
* nVidia gibt zwar ein Maximum von acht Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen zu. Sobald Multitexturing genutzt wird, verhält sich der nV3o wie ein Design mit vier Pipelines à zwei TMUs. | ||||
** Stand: Detonator 53.03 | ||||
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig. HCT steht für verlustarme Komprimierung des gesamten Contents. | ||||
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format). | ||||
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt kann der nV30 bis zu acht Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen. Der nV35 kann ebenfalls acht Textur-Ops, allerdings zusätzlich noch bis zu acht Arithmetik-Ops pro Takt und Pipeline ausführen. |
Entweder man nutzt seine Karten bis zum bitteren Ende und hat wirklich lange mit dem Upgrade gewartet oder will prinzipiell nur High-End Modelle in seinem Rechner sehen. In beiden Fällen sollte man, eventuell mit Ausnahme der FX 5900 XT, unterhalb der Modelle in unserer letzten Tabelle nicht anfangen. Hier tummelt sich die vergangene und aktuelle High-End Garde von nVidia.
[b]UPDATE 27.02.2004: Die Tabellen enthielten Fehler sowohl bezüglich der Rechengenauigkeit, die pro Kanal natürlich nur 32Bit beträgt, als auch bezüglich der Leistungsfähigkeit der CineFX II Chips. Diese können unter Umständen bis zu acht zusätzliche FP-Operationen verglichen mit CineFX I ausführen.
Danke an Demirug, den Autor des CineFX-Artikels für den Hinweis! [/b]