TU102, TU104, TU106: Nvidias Turing-Chips im (Größen-) Vergleich
Die für Leaks berüchtigte Website VideoCardz will an Dokumente über die Architektur der neuen Turing-GPUs von Nvidia gelangt sein. Geliefert werden Spezifikationen zu den drei Grafikchips TU102, TU104 und TU106, die auf den Grafikkarten GeForce RTX 2080 Ti, RTX 2080 und RTX 2070 eingesetzt werden sollen.
RTX 2070 mit TU106 und nicht TU104
Ältere Gerüchte, dass die GeForce RTX 2070 mit TU106 einen kleineren Chip anstatt einer weiter abgespeckten Version des TU104 (RTX 2080) erhält, werden durch die Informationen bestärkt. Angeblich soll die RTX 2070 den Vollausbau des TU106 mit 2.304 Shader-Einheiten bekommen. Die RTX 2080 setzt hingegen auf den größeren TU104, der bei der Quadro RTX 5000 3.072 Shader-Einheiten besitzt, bei der RTX 2080 allerdings auf 2.944 beschränkt ist. Das Flaggschiff GeForce RTX 2080 Ti basiert auf einer auf 4.352 aktive Shader limitierten Version der TU102-GPU, die mit 4.608 Shader-Einheiten bei der Quadro RTX 6000 und RTX 8000 eingesetzt wird.
TU102 | TU104 | TU106 | |
---|---|---|---|
Fertigung | 12nm FFN (TSMC) | ||
Die-Fläche | 754 mm² | 545 mm² | 445 mm² |
Transistoren | 18,6 Milliarden | 13,6 Milliarden | 10,6 Milliarden |
GPCs | 6 | 3 | |
TPCs | 36 (6/GPC) | 24 (4/GPC) | 18 (6/GPC) |
SMs | 72 (12/GPC) | 48 (8/GPC) | 36 (12/GPC) |
Tensor Cores | 576 | 384 | 288 |
RT Cores | 72 | 48 | 36 |
FP32 Cores (CUDAs) | 4.608 | 3.072 | 2.304 |
INT32 Cores | 4.608 | 3.072 | 2.304 |
ROPs | 96 | 64 | |
TMUs | 288 | 192 | 144 |
Memory Interface | 384 Bit | 256 Bit | |
L2 Cache | 6.144 KB | 4.096 KB | |
Quelle: VideoCardz |
TU102 und TU104 sollen je über sechs Graphics Processing Clusters (GPC) verfügen, beim kleineren TU106 seien es nur deren drei. Bei TU102 und TU106 sollen in jedem GPC je sechs Texture Processing Clusters (TPC) vorhanden sein, bei TU104 seien es nur deren vier pro GPC. Allen gemein wiederum sei, dass pro TPC je zwei Streaming-Multiprozessoren (SM) eingesetzt werden.
Die Tabelle schlüsselt auch die Zahl der neuen Tensor- und RT-Kerne (Raytracing) auf, die den wesentlichen Unterschied zu den Vorgängern der Pascal-Architektur ausmachen.
Unter den weiteren Neuerungen wird eine verbesserte Speicherkomprimierung für „50 Prozent mehr effektive Bandbreite im Vergleich zu Pascal“ genannt. Hinzu kommen eine überarbeitete Display- und Video-Engine und der neue „SLI“-Anschluss NVLink für das Zusammenschalten von zwei GeForce RTX 2080 (Ti) – die RTX 2070 besitzt kein NVLink.
Turing ist im Vergleich zu Pascal riesig
Auf Reddit wird über die stattliche Größe der neuen Turing-GPUs diskutiert, von Nutzern erstellte Grafiken liefern einen Größenvergleich mit Pascal anhand symbolisierter Chips (im nicht zwingend korrekten Seitenverhältnis). Dass TU102 mit einer Fläche von 754 mm² die zweitgrößte GPU aller Zeiten nach Nvidias GV100 (Volta) darstellt, hatte Nvidia bereits offiziell verkündet.
TU104 soll mit 545 mm² fast die Größe des größten Pascal-Chips GP100 mit 610 mm² erreichen. Dass eine xx106-GPU einen kleinen Chip für die Mittelklasse darstellt, ist mit Turing ebenso Geschichte: TU106 wäre mit 445 mm² mehr als doppelt so groß wie der GP106 und sogar rund 42 Prozent größer als der auf der GeForce GTX 1070 und GTX 1080 eingesetzte GP104.
Die zusätzlichen Rechenwerke für Deep Learning (Tensor Cores) und Raytracing (RT Cores) benötigen nun einmal mehr Platz. Das 12nm-FinFET-Verfahren von TSMC bietet zudem keine wesentlich höhere Packdichte als der 16-nm-Prozess bei Pascal.