GeForce GTX 1660 Ti im Test: Wie die GTX 1070 FE mit neuen Shadern und weniger Speicher

22.2.2019 15:15 Uhr

tl;dr: Die GeForce GTX 1660 Ti basiert auf Nvidias Turing-Technik, kommt aber ohne Raytracing- und KI-Kerne aus. Sie steht also zwischen Turing und Pascal, die Bezeichnung soll das kenntlich machen. Bei der Leistung in Spielen gibt es GeForce-GTX-1070-FE-Niveau, Konkurrenz zum Preis von 300 Euro aber auch von AMD.

Die Nvidia GeForce GTX 1660 Ti mit Turing

Nicht GeForce GTX 2050, nicht GeForce GTX 1160 sondern GeForce GTX 1660 Ti heißt die vierte Grafikkartenklasse mit Turing-GPU für Spieler. GeForce GTX 1660 Ti war für Nvidia damit die beste Bezeichnung für eine Grafikkarte auf Basis von Turing, die die wesentlichen neuen Funktionen zwar nicht bietet, aber dank modernerer GPU auch nichts mehr mit Pascal zu tun hat. GeForce GTX 2050 mit GTX statt RTX reichte Nvidia für die Abgrenzung zur GeForce RTX 2000 demnach nicht, GeForce GTX 1160 stand Pascal zu nahe. 1660 soll es jetzt richten: GTX statt RTX hebt die fehlenden Funktionen hervor, 1660 mit weniger Abstand zu 2060 als zu 1060 die deutlich gestiegene Leistung.

Nicht GeForce RTX sondern GeForce GTX mit Turing

Doch was ist die GeForce GTX 1660 Ti nun überhaupt? Grob gesagt bietet sie dieselbe Turing-Technik wie die GeForce-RTX-2000-Probanden, allerdings ohne Raytracing- und ohne Tensor-Kerne. Davon abgesehen ist die Architektur identisch. Nvidia hat allerdings die Anzahl der Shadereinheiten gegenüber der GeForce RTX 2060 weiter reduziert, den Speicherausbau aber bei 6 GB GDDR6 belassen.

Modelle von PNY und Asus im Test

Die GeForce GTX 1660 Ti soll damit spürbar schneller als die Radeon RX 590 und in etwa so schnell wie die GeForce GTX 1070 arbeiten. Mindestens 299 Euro werden Partner laut Nvidia zu Anfang für Custom Designs haben wollen.

Ob die Rechnung aufgeht, findet ComputerBase auf den kommenden Seiten anhand einer einfach gehaltenen PNY GeForce GTX 1660 Ti XLR8 Gaming und einer hochwertigeren aber auch teureren Asus GeForce GTX 1660 Ti Strix OC heraus.

TU116 – Turing ohne RT- & KI-Kerne

Die GeForce GTX 1660 Ti kommt mit einer neuen und damit der vierten Turing-GPU daher: dem TU116. Der TU116 wird wie die größeren Varianten im 12-nm-Prozess bei TSMC gefertigt, ist mit 284 mm² aber kleiner und mit 6,6 Milliarden Transistoren weniger komplex – der deutlich größere TU106 auf GeForce RTX 2060 und RTX 2070 kommt noch auf 445 mm² und 10,8 Milliarden Schaltungen.

Die GPUs der Turing- und Pascal-Serie

GPU	Im Einsatz auf	Fertigung	Größe	Flächenzuwachs zur kleineren GPU	Transistoren	Packdichte*
TU102	GeForce RTX 2080 Ti	12 nm	754 mm²	+38 %	18,6 Mrd.	24,67
TU104	GeForce RTX 2080	12 nm	545 mm²	+22 %	13,6 Mrd.	24,95
TU106	GeForce RTX 2070 & 2060	12 nm	445 mm²	–	10,9 Mrd.	24,49
TU116	GeForce GTX 1660 Ti	12 nm	284 mm²	–	6,6 Mrd.	23,24
Zum Vergleich
GP102	GeForce GTX 1080 Ti	16 nm	471 mm²	+50 %	12,0 Mrd.	25,48
GP104	GeForce GTX 1080 & 1070	16 nm	314 mm²	+57 %	7,2 Mrd.	22,93
GP106	GeForce GTX 1060	16 nm	200 mm²	–	4,4 Mrd.	22,00
*In Mio. Transistoren pro mm²

Drei Graphics Processing Clusters sind dem TU116 geblieben und jeder kommt wie bei TU104 mit 8 Streaming Multiprocessor daher. Die Anzahl der Shadereinheiten reduziert gegenüber TU106 damit von 2.304 auf 1.536 FP32-ALUs. dazu gibt es, wie bei Turing üblich, genauso viele INT32-ALUs, die gleichzeitig zu Floating-Point- auch Integer-Berechnungen durchführen können. Auch bezüglich der Cache-Organisation pro SM, Polymorph-Engines und weiteren Eigenschaften wie Variable Rate Shading gibt es keinerlei Unterschiede zu den anderen Turing-Ablegern. Die Anzahl der Einheiten wird zwar nach unten skaliert, bleibt im Verhältnis aber gleich wie bei den großen GPUs.

Interessant ist zudem, wenn man die Performance der TU116-GPU auf der GeForce GTX 1660 Ti mit der der GP104-GPU auf der GeForce GTX 1080 vergleicht. Denn der GP104 ist zwar elf Prozent größer, in der Konfiguration der beiden Grafikkarten aber eben auch 23 Prozent schneller. Das deutet darauf hin, dass ein Turing-Shader zwar schneller als ein Pascal-Shader ist, pro mm² Chipfläche Turing aber zugleich in aktuellen Spielen auch langsamer als Pascal ist.

Die Turing-GPU TU116 auf der Grafikkarte von Asus

TU106 Streaming Multiprocessor (Bild: Nvidia)

Ein Streaming Multiprocessor unterscheidet sich auf dem TU116 nur in zwei Dingen von den anderen Turing-GPUs: Es gibt weder Raytracing- noch Tensor-Kerne für KI-Berechnungen auf dem TU116. Darum gibt es auch kein RTX mehr im Namen der GeForce GTX 1660 Ti, sondern wieder das altbekannte Kürzel „GTX“. Damit sinkt aber automatisch der Platzbedarf pro SM, sodass der TU116 kleiner ausfällt als wenn es ein hypothetischer TU116 mit genauso vielen SM inklusive RT- und Tensor-Kernen geben würde, wobei der Unterschied überraschend klein ausfällt. Dennoch ermöglicht gesparter Platz mehr Dies auf einem Wafer und reduziert die Produktionskosten.

Offiziell ist der Hintergrund für den Verzicht auf die Spezial-Kerne allerdings, dass es eine gewisse Grundleistung benötigt, um die Features sinnvoll nutzen zu können. Für Raytracing ist das sicher richtig, für die Tensor-Kerne und damit DLSS funktioniert das Argument aber nicht.

6 GB GDDR6 mit weniger Takt am 192-Bit-Interface

Auch beim Speicherinterface hat Nvidia den Rotstift angesetzt. Von den 256 Bit des TU106 sind beim TU116 noch 192 Bit und damit sechs 32-Bit-Controller übrig geblieben. Das hat automatisch zur Folge, dass der Speicherausbau auf 6.144 MB (beziehungsweise die Hälfte) beschränkt ist. Es bleibt allerdings beim neuen und schnellen GDDR6-Speicher, wobei die Frequenz bei der GeForce GTX 1660 Ti von 7.000 MHz auf 6.000 MHz fällt – 7.000 MHz war bei Turing bisher Standard.

Apropos Frequenz: Nvidia gibt für die Grafikkarte einen Basis-Takt von 1.550 MHz an. Der durchschnittliche Turbo soll 1.770 MHz betragen. Nvidia erlaubt der GeForce GTX 1660 Ti maximal 120 Watt – so viel wie bei der GeForce GTX 1060.

Einen Hinweis auf die Frage, wie groß Turing ist

Wer die Eigenschaften der Pascal- und Turing-GPUs vergleicht, kann einige interessante Details daran erkennen. Zum Beispiel, dass Turing pro Shader deutlich mehr Chipfläche als Pascal benötigt – trotz kleinerer Fertigung. So ist der GP104 nur elf Prozent größer, bietet aber 67 Prozent mehr FP32-ALUs. Da beim TU116 weder Raytracing- noch Tensor-Kerne eine Rolle spielen, muss der klassische Chip dafür verantwortlich sein. Wenn man ferner bedenkt, dass der TU116 auch noch ein kleineres Speicherinterface als der GP104 hat, wird ersichtlich, dass die zusätzlichen Turing-Eigenschaften wie separate Integer-Einheiten und weitere neue Feature wie Variable Rate Shading massiv Chipfläche kosten.

	GP106	GP104	TU116	TU106
Transistoren	4,4 Mrd.	7,2 Mrd.	6,6 Mrd.	10,8 Mrd.
Prozentual zu TU116	67 %	109 %	100 %	164 %
Chipfläche	200 mm²	314 mm²	284 mm²	445 mm²
Prozentual zu TU116	70 %	111 %	100 %	157 %
Packdichte*	22,0	22,9	23,2	24,3
FP32-ALUs	1.280	2.560	1.536	2.304
Prozentual zu TU116	83 %	167 %	100 %	150 %
* In Millionen Transistoren pro mm²

Vergleicht man wiederum den TU116 und den TU106, zeigt sich, dass Raytracing- und Tensor-Kerne zwar Fläche kosten, groß ist der Anteil aber nicht: Mit 50 Prozent mehr Shadereinheiten sowie dem größeren Speicherinterface ist der TU106 nur 64 Prozent größer als der TU116. Damit können RT- und Tensor-Kerne nicht allzu viel Chipfläche belegen, zumal die Packdichte nur leicht zu Gunsten des TU106 ausfällt.

	Nvidia GeForce GTX 1060	Nvidia GeForce GTX 1070 Founders Edition	Nvidia GeForce GTX 1660 Ti	Nvidia GeForce RTX 2060
Chip:	GP106	GP104	TU116	TU106
Transistoren:	ca. 4,4 Mrd.	ca. 7,2 Mrd.	ca. 6,6 Mrd.	ca. 10,8 Mrd.
Fertigung:	TSMC 16 nm FF+		TSMC 12 nm
Shader-Einheiten:	1.280	1.920	1.536	1.920 Variante 2.176
Basis-Chiptakt:	1.506 MHz		1.500 MHz	1.365 MHz Variante 1.470 MHz
Maximaler Chiptakt:	1.848 MHz	1.785 MHz	1.845 MHz	1.875 MHz Variante 1.860 MHz
TFLOPs (FP32):	4,7 TFLOPs	6,9 TFLOPs	5,7 TFLOPs	7,2 TFLOPs Variante 8,1 TFLOPs
TFLOPs (FP16):	4,7 TFLOPs	6,9 TFLOPs	11,3 TFLOPs	14,4 TFLOPs Variante 16,2 TFLOPs
KI-Kerne:	Keine			240 Variante 272
TFLOPs (FP16) mit KI:	Nein			57,6 TFLOPs Variante 64,8 TFLOPs
Raytracing:	Nein			✓
ROPs:	48	64	48	48 Variante 64
Pixelfüllrate:	89 GPix/s	114 GPix/s	89 GPix/s	90 GPix/s Variante 119 GPix/s
TMUs:	80	120	96	120 Variante 136
Texelfüllrate:	148 GTex/s	214 GTex/s	177 GTex/s	225 GTex/s Variante 253 GTex/s
DirectX (Feature-Level):	12_1
Speichergröße:	6 GB GDDR5	8 GB GDDR5	6 GB GDDR6	6 / 12 GB GDDR6
Speichertakt:	4.000 MHz		6.000 MHz	7.000 MHz
Speicherinterface:	192 Bit	256 Bit	192 Bit
Speicherbandbreite:	192 GB/s	256 GB/s	288 GB/s	336 GB/s
Leistungsaufnahme Typisch/Maximal:	?/120 Watt	?/150 Watt	?/120 Watt	?/160 Watt Variante ?/185 Watt

GeForce GTX 1660 Ti von Asus (Strix) und PNY (XLR8) im Detail

Die GeForce GTX 1660 Ti gibt es nicht als Founders Edition, nur Custom Designs werden im Handel verfügbar sein. ComputerBase vergleicht in diesem Test zwei extrem gegensätzlich Exemplare.

Die PNY GeForce GTX 1660 Ti XLR8 OC richtet sich an Puristen. Das kleine und einfach gehalten Kühlsystem, kein RGB und den relativ niedrigen Takt gibt es dafür zum niedrigsten Einstiegspreis von 299 Euro. Das komplette Gegenteil ist die Asus GeForce GTX 1660 Ti Strix OC: Ein hoher Takt, ein aufwendiges Kühlsystem, RGB und zahlreiche weitere Features kosten aber 50 Euro Aufpreis. Der Klassenunterschied wird auch beim Gewicht deutlich: Die PNY-Grafikkarte bringt nur 414 Gramm auf die Waage, das Asus-Gegenstück satte 1.190 Gramm.

Die PNY GTX 1660 Ti XLR8 richtet sich an Puristen

Die PNY GeForce GTX 1660 Ti XLR8 OC ist nur 17 cm lang, das PCB gar nur 15 cm. Einzig bezüglich der Breite ist PNY mit 12,5 cm spendabler. Auch das Kühlsystem ist schlicht gehalten: Es gibt einen Alu-Kühler, drei Heatpipes und einen im Durchmesser 95 mm großen Axial-Lüfter.

Der hält bei niedrigen Temperaturen nicht an, 1.000 Umdrehungen in der Minute liegen mindestens immer an. Der durchschnittliche Turbo-Takt liegt bei 1.815 MHz, die TU116-GPU ist also um 45 MHz übertaktet. Ein Acht-Pin-Stromstecker wird benötigt, 120 Watt darf die GeForce GTX 1660 Ti XLR8 OC maximal ziehen – das entspricht wiederum Nvidias Referenz-Vorgaben. Der Speicher agiert mit den normalen 6.000 MHz. Monitore können an einem DisplayPort-1.4-, einem HDMI-2.0b- sowie einem Dual-Link-DVI-Ausgang angeschlossen werden.

DVI, HDMI und DisplayPort beim PNY-Modell

Auch die kleine PNY-Karte benötigt Strom über 8-Pin-PCIe

Die Asus GTX 1660 Ti Strix ist ein richtiges Premium-Modell

Die Asus GeForce GTX 1660 Ti Strix OC unterscheidet sich bezüglich der Eigenschaften nicht von der GeForce RTX 2080 Ti Strix OC, sämtliche Features sind mit dabei. Das PCB richtet sich an Übertakter und ist mit 29 cm fast doppelt so lang wie das von PNY. Die Grafikkarte selbst ist aufgrund des Kühlers gar 30 cm lang.

Beim Kühler handelt es sich um den bekannten Strix-Dual-Slot-Kühler in der 2,1-Slot-Fassung, wobei Asus jedoch weniger Material als zum Beispiel auf der GeForce RTX 2060 Strix verbaut. Die Radiatoren sind weniger voluminös und die Anzahl der Heatpipes Schrumpft auf deren drei. Drei im Durchmesser 85 mm große Axial-Lüfter sorgen für Frischluft. Dabei handelt es sich um den von Asus mit der GeForce-RTX-Serie neu eingeführten Lüftertyp, der bei gleicher Drehzahl mehr Luftdruck erzeugen soll. Die Lüfter halten bei niedrigen Temperaturen und damit auf dem Desktop an. Ab einer GPU-Temperatur von 56 Grad Celsius laufen sie mit rund 850 Umdrehungen in der Minute an.

Ein 8-Pin-PCIe-Anschluss ist zum Betrieb notwendig

Zwei Mal HDMI und zwei Mal DisplayPort bei Asus

Die LED-Beleuchtung lässt sich auch per Knopf abschalten

Die Grafikkarte hat ein zweites, Performance genanntes BIOS, das die Lüfter schneller drehen lässt und dafür niedrigere Temperaturen bietet. Auf der Asus GeForce GTX 1660 Ti Strix OC ist das Performance-BIOS allerdings völlig sinnlos, es sollte nur das werksseitig aktive Quiet-BIOS genutzt werden.

Asus bietet ein gutes Stück mehr Takt

Asus übertaktet die GeForce GTX 1660 Ti deutlich. Der durchschnittliche Turbo ist mit 1.860 MHz angegeben, 90 MHz mehr als der Standard. In Verbindung mit der auf 130 Watt angehobenen maximalen Leistungsaufnahme liegt in der Praxis ein deutlich höherer Takt als bei PNY an. Wem das nicht reicht, kann per Asus-eigener Software GPU Tweak II den „OC Mode“ aktivieren. Dieser erhöht den GPU-Takt um weitere 30 MHz auf 1.890 MHz und das Power Target auf 110 Prozent. Der 6.144 MB große GDDR6-Speicher wird hingegen immer mit 6.000 MHz angesteuert. Ein Acht-Pin-Stromstecker muss mit der Grafikkarte auch in diesem Fall verbunden sein.

Darüber hinaus bietet die Asus GeForce GTX 1660 Ti Strix OC eine komplexe RGB-Beleuchtung. Diese lässt sich auch per Tool oder direkt per Knopfdruck auf dem PCB abschalten. Die Grafikkarte kann zudem zwei am Ende angeschlossene PWM-Lüfter mit Hilfe des Asus-Tools steuern. Monitore können an zwei DisplayPort- oder zwei HDMI-Anschlüssen angesteuert werden.

Merkmal		PNY GeForce GTX 1660 Ti XLR8 OC	Asus GeForce GTX 1660 Ti Strix OC
Karte	PCB-Design	PNY	Asus
	Länge, Breite	17,0 cm, 12,5 cm	30,0 cm, 13,0 cm
	Stromversorgung	1 × 8 Pin	1 × 8 Pin
Kühler	Design	2,0 Slot	Strix, 2,1 Slot
	Kühlkörper	Alu-Kern/Radiator 3 Heatpipes	Alu-Kern/Radiator 3 Heatpipes
	Lüfter	1 × 95 mm (axial)	3 × 85 mm (axial)
	Lüfter abgeschaltet (2D)	Nein	Ja (Quiet-BIOS)
	Anlaufdrehzahl	Immer an	850 Umdrehungen
Takt (Stromsparmodus)	GPU-Basis	1.550 (300) MHz	1.550 (300) MHz
	GPU-Durchschnitt	1.815 MHz	1.860 MHz 1.890 MHz (OC-Mode)
	GPU-Maximum	1.995 MHz	1.980 MHz
	Speicher	6.000 (810) MHz	6.000 (810) MHz
Speichergröße		6.144 MB GDDR6	6.144 MB GDDR6
Leistungsaufnahme	Standard-TDP	120 Watt	130 Watt
	Maximale TDP	130 Watt	156 Watt
Anschlüsse		1 x DisplayPort 1.4 1 x HDMI 2.0b 1 × Dual-Link-DVI	2 x DisplayPort 1.4 2 x HDMI 2.0b