Nvidia GeForce GTX 670 im Test: Selbst ein Gegner für die HD 7970
Einleitung
Nachdem zu Anfang des Jahres AMD eine Grafikkarte nach der anderen vorgestellt und sowohl die High-End-, Performance- sowie die Mid-Range-Serie in die Händlerregale gestellt hat, folgte Ende März Nvidia mit der neuen Kepler-Architektur in Form der GeForce GTX 680. Die Karte macht dem Konkurrenzmodell Radeon HD 7970 zwar das Leben schwer, lässt diese aber nicht chancenlos zurück.
Mit der GeForce GTX 690 haben die Kalifornier vor genau einer Woche eine kleine Überraschung ausgepackt, denn die Multi-GPU-Karte vereint die Vorteile des zweiten Rechenkerns, ohne aber die Nachteile einer derartigen Lösung zu sehr in den Vordergrund zu rücken. Sprich, die Lautstärke sowie Leistungsaufnahme hält sich in Grenzen und die Mikroruckler wurden weiter reduziert. Mit einem Kaufpreis von rund 1.000 Euro spricht die Karte aber nur die absoluten Enthusiasten an.
Deutlich günstiger wird das heute neu vorgestellte Produkt, die GeForce GTX 670. Die Karte kommt wie die größere GeForce GTX 680 mit der GK104-GPU daher, wobei Nvidia einige Ausführungseinheiten deaktiviert und den Takt etwas reduziert hat. Schlussendlich soll es nach den eigenen Angaben aber dazu reichen, die AMD Radeon HD 7950 schlagen zu können. Ob dies wirklich gelingt, werden wir anhand einer Referenzkarte der GeForce GTX 670 herausfinden.
Technische Eckdaten
Die GeForce GTX 670 ist wie der größere Bruder, die GeForce GTX 680, mit der GK104-GPU bestückt, die bei TSMC im modernen 28-nm-Verfahren gefertigt wird und aus 3,54 Milliarden Transistoren besteht. Damit kommt auch bei der neusten GeForce-Karte die Kepler-Architektur inklusive sämtlicher Features wie DirectX 11.1, PCIe 3.0 sowie der GPU-Boost-Funktion zum Einsatz.
Damit die GeForce GTX 670 dem Single-GPU-Flaggschiff keine allzu große Konkurrenz macht, hat Nvidia die Anzahl der Ausführungseinheiten reduziert. So gibt es zwar immer noch die vollen vier Graphics Processing Clusters (GPC), jedoch sind nur noch in deren drei die vollen zwei SMX-Blöcke aktiv, während im vierten einer abgeschaltet wurde. Da jede SMX aus 192 skalaren Shadereinheiten besteht, sind auf der GeForce GTX 670 somit 1.344 ALUs übrig geblieben.
Die SMX besteht aber nicht nur aus den Shadereinheiten. So sind ebenfalls 16 vollwertige Textureinheiten verbaut, wovon der GeForce GTX 670 deren 112 zur Verfügung stehen. Zudem geht gegenüber der GeForce GTX 680 eine Polymorph-Engine 2.0, die sich um die Tessellation kümmert, verloren – es sind noch sieben Stück aktiv. Von den Raster-Engines gibt es unverändert vier Stück. Der L1-Cache wurde von 512 KB (8x 64 KB) auf 448 KB (7x 64 KB) verkleinert, der L2-Cache bleibt aber bei einer Größe von 512 KB.
Unangetastet gelassen hat Nvidia bei der GeForce GTX 670 die ROP-Cluster. Die Grafikkarte ist mit vier ROP-Cluster zu je acht Raster Operation Processors ausgestattet, was 32 ROPs ergibt. Das Speicherinterface ist ebenso unangetastet. Vier 64-Bit-Controller ergeben eine 256 Bit breite Anbindung zum Rechenkern.
Nvidia taktet die GK104-GPU der GeForce GTX 670 mit 915 MHz, während der Boost-Clock (der Turbo) im Durchschnitt mit 980 MHz arbeiten soll. Dieser kann je nach Spiel höher oder auch niedriger liegen. Der 2.048 MB große GDDR5-Speicher wird mit 3.004 MHz angesteuert – die Speicherbandbreite ist also identisch zur GeForce GTX 680. Mit den Standard-Einstellung des Power Targets soll die GeForce GTX 670 etwa 141 Watt aus der Steckdose ziehen, wobei der Energiehunger beim maximal möglichen Power Target (+22 Prozent) bei 173 Watt liegen soll. Als TDP gibt Nvidia 170 Watt an.
Wer mehr Details über Nvidias neue Kepler-Architektur erfahren möchte, dem empfehlen wir einen Blick in unser Launch-Review zur GeForce GTX 680.
Radeon HD 7970 |
Radeon HD 7950 |
GeForce GTX 580 |
GeForce GTX 670 |
GeForce GTX 680 |
|
---|---|---|---|---|---|
Logo | |||||
Chip | Tahiti | Tahiti | GF110 | GK104 | GK104 |
Transistoren | ca. 4,31 Mrd. | ca. 4,31 Mrd. | ca. 3 Mrd. | ca. 3,54 Mrd. | ca. 3,54 Mrd. |
Fertigung | 28 nm | 28 nm | 40 nm | 28 nm | 28 nm |
Chiptakt | 925 MHz | 800 MHz | 772 MHz | 915 MHz | 1.006 MHz |
Shadertakt | 925 MHz | 800 MHz | 1.544 MHz | 915 MHz | 1.006 MHz |
Boost-Takt | X | X | X | 980 MHz | 1.058 MHz |
Shader-Einheiten (MADD) |
2.048 (1D) | 1.792 (1D) | 512 (1D) | 1.344 (1D) | 1.536 (1D) |
FLOPs (MAD) | 3.789 GFLOPS | 2.867 GFLOPS | 1.581 GFLOPS | 2.459 GFLOPS | 3.090 GFLOPS |
ROPs | 32 | 32 | 48 | 32 | 32 |
Pixelfüllrate | 29.600 MPix/s | 25.600 MPix/s | 24.704 MPix/s | 29.280 MPix/s | 32.192 MPix/s |
TMUs | 128 | 112 | 64 | 112 | 128 |
Texelfüllrate | 118.400 MTex/s | 89.600 MTex/s | 49.408 MTex/s | 102.480 MTex/s | 128.768 MTex/s |
Shader-Model | SM 5.1 | SM5.1 | SM 5 | SM 5.1 | SM 5.1 |
effektive Windows Stromsparfunktion |
✓ (ZeroCore) | ✓ (ZeroCore) | ✓ | ✓ | ✓ |
Speichermenge | 3.072 MB GDDR5 | 3.072 MB GDDR5 | 1.536 MB GDDR5 | 2.048 MB GDDR5 | 2.048 MB GDDR5 |
Speichertakt | 2.750 MHz | 2.500 MHz | 2.004 MHz | 3.004 MHz | 3.004 MHz |
Speicherinterface | 384 Bit | 384 Bit | 384 Bit | 256 Bit | 256 Bit |
Speicherbandbreite | 264.000 MB/s | 240.000 MB/s | 192.384 MB/s | 192.256 MB/s | 192.256 MB/s |
Stromangaben Typisch/Maximal |
210/250 Watt | ?/200 Watt | 244/? Watt | 141/173 Watt | 170/195 Watt |