GeForce GTS 450 im Test: Nvidias Fermi-Einstieg überzeugt mit gutem Kühlsystem
2/29Technische Daten
GeForce GTS 250 |
GeForce GTS 450 |
GeForce GTX 460 |
Radeon HD 5750 |
|
---|---|---|---|---|
Logo | ||||
Chip | G92b | GF106 | GF104 | RV840/Juniper |
Transistoren | ca. 754 Mio. | ca. 1,17 Mrd. | ca. 1,95 Mrd. | ca. 1,04 Mrd. |
Fertigung | 55nm | 40 nm | 40 nm | 40 nm |
Chiptakt | 738 MHz | 783 MHz | 675 MHz | 700 MHz |
Shadertakt | 1.836 MHz | 1.566 MHz | 1.350 MHz | 700 MHz |
Shader-Einheiten (MADD) |
128 (1D) | 192 (1D) | 336 (1D) | 144 (5D) |
FLOPs (MADD/ADD) | 705 GFLOPS* | 601 GFLOPS | 907 GFLOPS | 1.008 GFLOPS |
ROPs | 16 | 16 | 24 | 16 |
Pixelfüllrate | 11.808 MPix/s | 12.528 MPix/s | 16.200 MPix/s | 11.200 MPix/s |
TMUs | 64 | 32 | 56 | 36 |
TAUs | 64 | 32 | 56 | 36 |
Texelfüllrate | 47.232 MTex/s | 25.056 MTex/s | 37.800 MTex/s | 25.200 MTex/s |
Shader-Model | SM 4 | SM 5 | SM 5 | SM 5 |
Hybrid-CF/-SLI | X | X | X | X |
effektive Windows Stromsparfunktion |
✓ | ✓ | ✓ | ✓ |
Speichermenge | 1.024 MB GDDR3 | 1.024MB GDDR5 | 768 MB GDDR5 | 1.024 MB GDDR5 |
Speichertakt | 1.100 MHz | 1.804 MHz | 1.800 MHz | 2.300 MHz |
Speicherinterface | 256 Bit | 128 Bit | 192 Bit | 128 Bit |
Speicherbandbreite | 70.400 MB/s | 57.728 MB/s | 86.440 MB/s | 73.660 MB/s |
Bereits die GF104-GPU auf der GeForce GTX 460 basierte zwar grundsätzlich auf der GF100-Architektur, doch gab es einige tiefgreifende Änderungen, um den Rechenkern auf den 200-Euro-Markt anpassen zu können. So wurde zum Beispiel das ALU-zu-TMU-Verhältnis modifiziert. Der GF106 auf der GeForce GTS 450 basiert nun seinerseits vollständig auf dem GF104, einzig die Anzahl der Ausführungseinheiten wurde erneut reduziert.
Der GF106 wird weiterhin im 40-nm-Verfahren bei TSMC hergestellt und umfasst 1,17 Milliarden Transistoren. Auf der GPU ist nur noch ein vollwertiger Graphics Processing Clusters (GPCs) übrig geblieben, weswegen es noch vier Streaming-Multiprocessors (SM) gibt, die jeweils aus 48 skalare Shadereinheiten (GF100: 32 ALUs), die pro Takt ein MADD (Multiply-ADD) ausführen können, bestehen. Insgesamt gibt es auf dem GF106 also noch 192 ALUs.
An die Streaming-Multiprocessors sind wie gewohnt die Textureinheiten angeschlossen. Pro SM ist ein Texture-Cluster angeschlossen, der sich jeweils aus acht vollwertigen Texture Mapping Units, kurz TMUs, die pro Takt einen Pixel bilinear filtern sowie adressieren können, zusammen setzt. Die GeForce GTS 450 kann so auf 32 Textureinheiten zurück greifen. Darüber hinaus kommt jeder SM mit einer Polymorph-Engine daher (vier auf dem GF106), die sich um die Raster-Arbeit inklusive der Tessellation-Berechnungen kümmert.
Drei ROP-Partitions werden auf dem GF106 verbaut, die jeweils aus acht Raster Operation Processors (ROPs) bestehen. Jedoch sind auf der GeForce GTS 450 nur deren zwei aktiviert. Pro ROP-Partition ist weiterhin ein 64 Bit großer Speichercontroller angeschlossen, womit das Speicherinterface auf der GeForce GTS 450 eine Breite von 128 Bit aufweist (der GF106 ermöglicht maximal ein 192-Bit-Interface mit 24 ROPs). Damit beträgt die Speichergröße je nach Wahl des Herstellers 512 MB (entsprechende Modelle sollen möglicherweise später kommen), 1.024 MB oder 2.048 MB.
Die TMU-Domäne auf der GeForce GTS 450 wird mit 783 MHz angesteuert, während die Shadereinheiten einen Takt von 1.566 MHz aufweisen. Der GDDR5-Speicher arbeitet auf der Mid-Range-Karte mit 1.804 MHz. Die Leistungsaufnahme der Grafikkarte soll laut Nvidia in typischen Last-Szenarien wie in Spielen höchstens 106 Watt betragen. Dementsprechend ist ein Sechs-Pin-Stromstecker für die Versorgung ausreichend.
*Die von uns angegebenen GFLOP-Zahlen der G80/G92-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.