Nvidia GeForce GTX Titan im Test: Schnellste Grafikkarte mit großem Namen

 2/22
Wolfgang Andermahr
795 Kommentare

Die Neuerungen

Die Nvidia GeForce GTX Titan basiert auf der im Desktop-Markt bis jetzt noch unbekannten GK110-GPU, die im modernen 28-mm-Verfahren bei TSMC gefertigt wird und sich aus 7,1 Milliarden Transistoren zusammensetzt. Diese finden Platz auf einem ungefähr 550 mm² Die, womit es sich um die bisher mit Abstand größte 28-nm-GPU handelt.

GK110 baut auf der mit der GeForce GTX 680 eingeführten Kepler-Architektur auf, wobei diese geringfügig modifiziert worden ist. So sind auf dem Rechenkern 15 SMX-Blöcke mit jeweils 192 ALUs verbaut, die pro Takt ein MADD (Multiply-ADD) berechnen können. Nvidia hat auf der GeForce GTX Titan jedoch nur 14 SMX-Blöcke aktiviert, weswegen anstatt der theoretisch möglichen 2.880 ALUs „nur“ 2.688 Shadereinheiten aktiv sind – der GK104 bietet im Vergleich dazu maximal 1.536 ALUs.

GK110 Diagramm
GK110 Diagramm

Genauso enthält der GK110 weitere separate ALUs, die aber nicht für die Single-Precision- (FP32), sondern für die Double-Precision-Leistung (FP64) zuständig sind. Jeder SMX ist genauso mit 64 DP-ALUs ausgestattet, womit es im Maximalausbau 960 eigenständige DP-ALUs und auf der GeForce GTX Titan 896 DP-ALUs gibt – die im Gegensatz zu vorherigen GeForce-Produkten nicht gegenüber den Tesla-Gegenstücken in der Leistung beschnitten sind. Jedoch muss die volle DP-Leistung erst im Treibermenü aktiviert werden (732 MHz für die GPU sind dann möglich), denn andernfalls liegt die Taktrate nur bei einem Achtel des Möglichen. Diese Funktion muss dann aber erneut abgeschaltet werden, wenn wieder Single-Precision-Leistung gefragt ist – denn ansonsten werden dort die Taktraten reduziert.

Double Precision muss separat aktiviert werden
Double Precision muss separat aktiviert werden

Davon abgesehen ist der SMX-Aufbau identisch zum GK104 geblieben. Pro SMX sind damit auch 32 Special-Funktion- (448 auf GTX Titan, Sonderberechnungen wie Sinus und Kosinus) sowie 32 Load-and-Store-Einheiten (448 auf GTX Titan, Berechnung von Quell- und Zieladressen) vorhanden.

Nicht vergessen werden dürfen die Textureinheiten: Jeder SMX kann auf 16 vollwertige Textureinheiten zurückgreifen, die pro Takt einen Pixel adressieren sowie texturieren können. Damit gibt es auf der GeForce GTX Titan 224 Texture Mapping Units, kurz TMU. Darüber hinaus ist eine Polymorph-2.0-Engine (14 auf der GeForce GTX Titan) verbaut, die sich unter anderem um die Tessellation-Leistung kümmert. GK110 baut auf fünf Graphics Processing Clusters (GPCs) auf, die mit fünf Raster-Engines das so genannte „Front-End“ bilden.

Der konfigurierbare Shared-Memory/L1-Cache pro SMX weist eine Größe von 64 KB auf (insgesamt demnach 896 KB auf GTX Titan, konfigurierbar als 16 KB L1- und 48 KB-Shared-Memory-Cache oder anders herum oder als 32/32 KB) und der Read-Only-Data-Cache von 48 KB (672 KB auf GTX Titan). Auf einen zusätzlichen 1.536 KB großen L2-Cache auf dem GK110 können alle SMX-Einheiten gemeinsam zugreifen (GK104: 512 KB).

GK110 Diagramm
GK110 Diagramm

Der GK110 auf der GeForce GTX Titan kommt mit einigen Features daher, die primär für die Tesla-Karten nützlich sind. Darunter fällt zum Beispiel „Dynamic Parallelism“, was bei der GPU für eine bessere Auslastung sorgen soll. Denn während GPUs bis jetzt auf die Befehle der CPU warten mussten, um einen neuen Kernel starten zu können, kann der GK110 jene Kernels nun selbstständig erstellen, sodass parallele Rechenaufgaben schneller erledigt werden können.

Dasselbe Ziel hat „Hyper-Q“, das es mehreren CPU-Kernen ermöglicht, Berechnungen auf einer einzelnen GPU gleichzeitig (maximal 32) zu starten. „GPUDirect“ kümmert sich dagegen bei mehreren GPUs in einem System oder auf mehreren Systemen verteilt darum, dass Daten direkt miteinander ausgetauscht werden können, ohne einen Umweg über die CPU gehen zu müssen. Wir bereits erwähnt sind die drei Features allerdings ausschließlich bei CUDA-Programmen von Nutzen.

Ebenfalls hat es Verbesserungen bei den Raster-Operation-Processors, ROPs, gegeben. Aus den vier ROP-Clustern auf dem GK104 sind auf dem GK110 deren sechs geworden, die jeweils acht ROPs beinhalten. Damit gibt es 48 anstatt 32 ROPS auf dem GK110. Zugleich wächst das Speicherinterface mit: Sechs 64-Bit-Controller sorgen für ein 384 Bit breites Speicherinterface, 128 Bit mehr als auf den bisherigen Kepler-Karten.

Beim Speicher schöpft die GeForce GTX Titan aus den Vollen. So wäre ein 3.072 MB großer Speicher denkbar, doch Nvidia hat diesen verdoppelt, so dass der GDDR5-VRAM eine Größe von satten 6.144 MB aufweist, der zudem mit hohen 3.004 MHz taktet. Die TDP für die Grafikkarte liegt trotz der vielen Änderungen bei nicht allzu hohen 250 Watt. Die Stromversorgung wird entsprechend über einen Acht-Pin- sowie einen Sechs-Pin-Anschluss sichergestellt.