GeForce GTX 1660 Ti im Test: Wie die GTX 1070 FE mit neuen Shadern und weniger Speicher
tl;dr: Die GeForce GTX 1660 Ti basiert auf Nvidias Turing-Technik, kommt aber ohne Raytracing- und KI-Kerne aus. Sie steht also zwischen Turing und Pascal, die Bezeichnung soll das kenntlich machen. Bei der Leistung in Spielen gibt es GeForce-GTX-1070-FE-Niveau, Konkurrenz zum Preis von 300 Euro aber auch von AMD.
Die Nvidia GeForce GTX 1660 Ti mit Turing
Nicht GeForce GTX 2050, nicht GeForce GTX 1160 sondern GeForce GTX 1660 Ti heißt die vierte Grafikkartenklasse mit Turing-GPU für Spieler. GeForce GTX 1660 Ti war für Nvidia damit die beste Bezeichnung für eine Grafikkarte auf Basis von Turing, die die wesentlichen neuen Funktionen zwar nicht bietet, aber dank modernerer GPU auch nichts mehr mit Pascal zu tun hat. GeForce GTX 2050 mit GTX statt RTX reichte Nvidia für die Abgrenzung zur GeForce RTX 2000 demnach nicht, GeForce GTX 1160 stand Pascal zu nahe. 1660 soll es jetzt richten: GTX statt RTX hebt die fehlenden Funktionen hervor, 1660 mit weniger Abstand zu 2060 als zu 1060 die deutlich gestiegene Leistung.
Doch was ist die GeForce GTX 1660 Ti nun überhaupt? Grob gesagt bietet sie dieselbe Turing-Technik wie die GeForce-RTX-2000-Probanden, allerdings ohne Raytracing- und ohne Tensor-Kerne. Davon abgesehen ist die Architektur identisch. Nvidia hat allerdings die Anzahl der Shadereinheiten gegenüber der GeForce RTX 2060 weiter reduziert, den Speicherausbau aber bei 6 GB GDDR6 belassen.
Modelle von PNY und Asus im Test
Die GeForce GTX 1660 Ti soll damit spürbar schneller als die Radeon RX 590 und in etwa so schnell wie die GeForce GTX 1070 arbeiten. Mindestens 299 Euro werden Partner laut Nvidia zu Anfang für Custom Designs haben wollen.
Ob die Rechnung aufgeht, findet ComputerBase auf den kommenden Seiten anhand einer einfach gehaltenen PNY GeForce GTX 1660 Ti XLR8 Gaming und einer hochwertigeren aber auch teureren Asus GeForce GTX 1660 Ti Strix OC heraus.
TU116 – Turing ohne RT- & KI-Kerne
Die GeForce GTX 1660 Ti kommt mit einer neuen und damit der vierten Turing-GPU daher: dem TU116. Der TU116 wird wie die größeren Varianten im 12-nm-Prozess bei TSMC gefertigt, ist mit 284 mm² aber kleiner und mit 6,6 Milliarden Transistoren weniger komplex – der deutlich größere TU106 auf GeForce RTX 2060 und RTX 2070 kommt noch auf 445 mm² und 10,8 Milliarden Schaltungen.
GPU | Im Einsatz auf | Fertigung | Größe | Flächenzuwachs zur kleineren GPU |
Transistoren | Packdichte* |
---|---|---|---|---|---|---|
TU102 | GeForce RTX 2080 Ti | 12 nm | 754 mm² | +38 % | 18,6 Mrd. | 24,67 |
TU104 | GeForce RTX 2080 | 12 nm | 545 mm² | +22 % | 13,6 Mrd. | 24,95 |
TU106 | GeForce RTX 2070 & 2060 | 12 nm | 445 mm² | – | 10,9 Mrd. | 24,49 |
TU116 | GeForce GTX 1660 Ti | 12 nm | 284 mm² | – | 6,6 Mrd. | 23,24 |
Zum Vergleich | ||||||
GP102 | GeForce GTX 1080 Ti | 16 nm | 471 mm² | +50 % | 12,0 Mrd. | 25,48 |
GP104 | GeForce GTX 1080 & 1070 | 16 nm | 314 mm² | +57 % | 7,2 Mrd. | 22,93 |
GP106 | GeForce GTX 1060 | 16 nm | 200 mm² | – | 4,4 Mrd. | 22,00 |
*In Mio. Transistoren pro mm² |
Drei Graphics Processing Clusters sind dem TU116 geblieben und jeder kommt wie bei TU104 mit 8 Streaming Multiprocessor daher. Die Anzahl der Shadereinheiten reduziert gegenüber TU106 damit von 2.304 auf 1.536 FP32-ALUs. dazu gibt es, wie bei Turing üblich, genauso viele INT32-ALUs, die gleichzeitig zu Floating-Point- auch Integer-Berechnungen durchführen können. Auch bezüglich der Cache-Organisation pro SM, Polymorph-Engines und weiteren Eigenschaften wie Variable Rate Shading gibt es keinerlei Unterschiede zu den anderen Turing-Ablegern. Die Anzahl der Einheiten wird zwar nach unten skaliert, bleibt im Verhältnis aber gleich wie bei den großen GPUs.
Interessant ist zudem, wenn man die Performance der TU116-GPU auf der GeForce GTX 1660 Ti mit der der GP104-GPU auf der GeForce GTX 1080 vergleicht. Denn der GP104 ist zwar elf Prozent größer, in der Konfiguration der beiden Grafikkarten aber eben auch 23 Prozent schneller. Das deutet darauf hin, dass ein Turing-Shader zwar schneller als ein Pascal-Shader ist, pro mm² Chipfläche Turing aber zugleich in aktuellen Spielen auch langsamer als Pascal ist.
Ein Streaming Multiprocessor unterscheidet sich auf dem TU116 nur in zwei Dingen von den anderen Turing-GPUs: Es gibt weder Raytracing- noch Tensor-Kerne für KI-Berechnungen auf dem TU116. Darum gibt es auch kein RTX mehr im Namen der GeForce GTX 1660 Ti, sondern wieder das altbekannte Kürzel „GTX“. Damit sinkt aber automatisch der Platzbedarf pro SM, sodass der TU116 kleiner ausfällt als wenn es ein hypothetischer TU116 mit genauso vielen SM inklusive RT- und Tensor-Kernen geben würde, wobei der Unterschied überraschend klein ausfällt. Dennoch ermöglicht gesparter Platz mehr Dies auf einem Wafer und reduziert die Produktionskosten.
Offiziell ist der Hintergrund für den Verzicht auf die Spezial-Kerne allerdings, dass es eine gewisse Grundleistung benötigt, um die Features sinnvoll nutzen zu können. Für Raytracing ist das sicher richtig, für die Tensor-Kerne und damit DLSS funktioniert das Argument aber nicht.
6 GB GDDR6 mit weniger Takt am 192-Bit-Interface
Auch beim Speicherinterface hat Nvidia den Rotstift angesetzt. Von den 256 Bit des TU106 sind beim TU116 noch 192 Bit und damit sechs 32-Bit-Controller übrig geblieben. Das hat automatisch zur Folge, dass der Speicherausbau auf 6.144 MB (beziehungsweise die Hälfte) beschränkt ist. Es bleibt allerdings beim neuen und schnellen GDDR6-Speicher, wobei die Frequenz bei der GeForce GTX 1660 Ti von 7.000 MHz auf 6.000 MHz fällt – 7.000 MHz war bei Turing bisher Standard.
Apropos Frequenz: Nvidia gibt für die Grafikkarte einen Basis-Takt von 1.550 MHz an. Der durchschnittliche Turbo soll 1.770 MHz betragen. Nvidia erlaubt der GeForce GTX 1660 Ti maximal 120 Watt – so viel wie bei der GeForce GTX 1060.
Einen Hinweis auf die Frage, wie groß Turing ist
Wer die Eigenschaften der Pascal- und Turing-GPUs vergleicht, kann einige interessante Details daran erkennen. Zum Beispiel, dass Turing pro Shader deutlich mehr Chipfläche als Pascal benötigt – trotz kleinerer Fertigung. So ist der GP104 nur elf Prozent größer, bietet aber 67 Prozent mehr FP32-ALUs. Da beim TU116 weder Raytracing- noch Tensor-Kerne eine Rolle spielen, muss der klassische Chip dafür verantwortlich sein. Wenn man ferner bedenkt, dass der TU116 auch noch ein kleineres Speicherinterface als der GP104 hat, wird ersichtlich, dass die zusätzlichen Turing-Eigenschaften wie separate Integer-Einheiten und weitere neue Feature wie Variable Rate Shading massiv Chipfläche kosten.
GP106 | GP104 | TU116 | TU106 | |
---|---|---|---|---|
Transistoren | 4,4 Mrd. | 7,2 Mrd. | 6,6 Mrd. | 10,8 Mrd. |
Prozentual zu TU116 | 67 % | 109 % | 100 % | 164 % |
Chipfläche | 200 mm² | 314 mm² | 284 mm² | 445 mm² |
Prozentual zu TU116 | 70 % | 111 % | 100 % | 157 % |
Packdichte* | 22,0 | 22,9 | 23,2 | 24,3 |
FP32-ALUs | 1.280 | 2.560 | 1.536 | 2.304 |
Prozentual zu TU116 | 83 % | 167 % | 100 % | 150 % |
* In Millionen Transistoren pro mm² |
Vergleicht man wiederum den TU116 und den TU106, zeigt sich, dass Raytracing- und Tensor-Kerne zwar Fläche kosten, groß ist der Anteil aber nicht: Mit 50 Prozent mehr Shadereinheiten sowie dem größeren Speicherinterface ist der TU106 nur 64 Prozent größer als der TU116. Damit können RT- und Tensor-Kerne nicht allzu viel Chipfläche belegen, zumal die Packdichte nur leicht zu Gunsten des TU106 ausfällt.
Nvidia GeForce GTX 1060 | Nvidia GeForce GTX 1070 Founders Edition | Nvidia GeForce GTX 1660 Ti | Nvidia GeForce RTX 2060 | |
---|---|---|---|---|
Chip: | GP106 | GP104 | TU116 | TU106 |
Transistoren: | ca. 4,4 Mrd. | ca. 7,2 Mrd. | ca. 6,6 Mrd. | ca. 10,8 Mrd. |
Fertigung: | TSMC 16 nm FF+ | TSMC 12 nm | ||
Shader-Einheiten: | 1.280 | 1.920 | 1.536 | 1.920 Variante 2.176 |
Basis-Chiptakt: | 1.506 MHz | 1.500 MHz | 1.365 MHz Variante 1.470 MHz |
|
Maximaler Chiptakt: | 1.848 MHz | 1.785 MHz | 1.845 MHz | 1.875 MHz Variante 1.860 MHz |
TFLOPs (FP32): | 4,7 TFLOPs | 6,9 TFLOPs | 5,7 TFLOPs | 7,2 TFLOPs Variante 8,1 TFLOPs |
TFLOPs (FP16): | 4,7 TFLOPs | 6,9 TFLOPs | 11,3 TFLOPs | 14,4 TFLOPs Variante 16,2 TFLOPs |
KI-Kerne: | Keine | 240 Variante 272 |
||
TFLOPs (FP16) mit KI: | Nein | 57,6 TFLOPs Variante 64,8 TFLOPs |
||
Raytracing: | Nein | ✓ | ||
ROPs: | 48 | 64 | 48 | 48 Variante 64 |
Pixelfüllrate: | 89 GPix/s | 114 GPix/s | 89 GPix/s | 90 GPix/s Variante 119 GPix/s |
TMUs: | 80 | 120 | 96 | 120 Variante 136 |
Texelfüllrate: | 148 GTex/s | 214 GTex/s | 177 GTex/s | 225 GTex/s Variante 253 GTex/s |
DirectX (Feature-Level): | 12_1 | |||
Speichergröße: | 6 GB GDDR5 | 8 GB GDDR5 | 6 GB GDDR6 | 6 / 12 GB GDDR6 |
Speichertakt: | 4.000 MHz | 6.000 MHz | 7.000 MHz | |
Speicherinterface: | 192 Bit | 256 Bit | 192 Bit | |
Speicherbandbreite: | 192 GB/s | 256 GB/s | 288 GB/s | 336 GB/s |
Leistungsaufnahme Typisch/Maximal: | ?/120 Watt | ?/150 Watt | ?/120 Watt | ?/160 Watt Variante ?/185 Watt |
GeForce GTX 1660 Ti von Asus (Strix) und PNY (XLR8) im Detail
Die GeForce GTX 1660 Ti gibt es nicht als Founders Edition, nur Custom Designs werden im Handel verfügbar sein. ComputerBase vergleicht in diesem Test zwei extrem gegensätzlich Exemplare.
Die PNY GeForce GTX 1660 Ti XLR8 OC richtet sich an Puristen. Das kleine und einfach gehalten Kühlsystem, kein RGB und den relativ niedrigen Takt gibt es dafür zum niedrigsten Einstiegspreis von 299 Euro. Das komplette Gegenteil ist die Asus GeForce GTX 1660 Ti Strix OC: Ein hoher Takt, ein aufwendiges Kühlsystem, RGB und zahlreiche weitere Features kosten aber 50 Euro Aufpreis. Der Klassenunterschied wird auch beim Gewicht deutlich: Die PNY-Grafikkarte bringt nur 414 Gramm auf die Waage, das Asus-Gegenstück satte 1.190 Gramm.
Die PNY GTX 1660 Ti XLR8 richtet sich an Puristen
Die PNY GeForce GTX 1660 Ti XLR8 OC ist nur 17 cm lang, das PCB gar nur 15 cm. Einzig bezüglich der Breite ist PNY mit 12,5 cm spendabler. Auch das Kühlsystem ist schlicht gehalten: Es gibt einen Alu-Kühler, drei Heatpipes und einen im Durchmesser 95 mm großen Axial-Lüfter.
Der hält bei niedrigen Temperaturen nicht an, 1.000 Umdrehungen in der Minute liegen mindestens immer an. Der durchschnittliche Turbo-Takt liegt bei 1.815 MHz, die TU116-GPU ist also um 45 MHz übertaktet. Ein Acht-Pin-Stromstecker wird benötigt, 120 Watt darf die GeForce GTX 1660 Ti XLR8 OC maximal ziehen – das entspricht wiederum Nvidias Referenz-Vorgaben. Der Speicher agiert mit den normalen 6.000 MHz. Monitore können an einem DisplayPort-1.4-, einem HDMI-2.0b- sowie einem Dual-Link-DVI-Ausgang angeschlossen werden.
Die Asus GTX 1660 Ti Strix ist ein richtiges Premium-Modell
Die Asus GeForce GTX 1660 Ti Strix OC unterscheidet sich bezüglich der Eigenschaften nicht von der GeForce RTX 2080 Ti Strix OC, sämtliche Features sind mit dabei. Das PCB richtet sich an Übertakter und ist mit 29 cm fast doppelt so lang wie das von PNY. Die Grafikkarte selbst ist aufgrund des Kühlers gar 30 cm lang.
Beim Kühler handelt es sich um den bekannten Strix-Dual-Slot-Kühler in der 2,1-Slot-Fassung, wobei Asus jedoch weniger Material als zum Beispiel auf der GeForce RTX 2060 Strix verbaut. Die Radiatoren sind weniger voluminös und die Anzahl der Heatpipes Schrumpft auf deren drei. Drei im Durchmesser 85 mm große Axial-Lüfter sorgen für Frischluft. Dabei handelt es sich um den von Asus mit der GeForce-RTX-Serie neu eingeführten Lüftertyp, der bei gleicher Drehzahl mehr Luftdruck erzeugen soll. Die Lüfter halten bei niedrigen Temperaturen und damit auf dem Desktop an. Ab einer GPU-Temperatur von 56 Grad Celsius laufen sie mit rund 850 Umdrehungen in der Minute an.
Die Grafikkarte hat ein zweites, Performance genanntes BIOS, das die Lüfter schneller drehen lässt und dafür niedrigere Temperaturen bietet. Auf der Asus GeForce GTX 1660 Ti Strix OC ist das Performance-BIOS allerdings völlig sinnlos, es sollte nur das werksseitig aktive Quiet-BIOS genutzt werden.
Asus bietet ein gutes Stück mehr Takt
Asus übertaktet die GeForce GTX 1660 Ti deutlich. Der durchschnittliche Turbo ist mit 1.860 MHz angegeben, 90 MHz mehr als der Standard. In Verbindung mit der auf 130 Watt angehobenen maximalen Leistungsaufnahme liegt in der Praxis ein deutlich höherer Takt als bei PNY an. Wem das nicht reicht, kann per Asus-eigener Software GPU Tweak II den „OC Mode“ aktivieren. Dieser erhöht den GPU-Takt um weitere 30 MHz auf 1.890 MHz und das Power Target auf 110 Prozent. Der 6.144 MB große GDDR6-Speicher wird hingegen immer mit 6.000 MHz angesteuert. Ein Acht-Pin-Stromstecker muss mit der Grafikkarte auch in diesem Fall verbunden sein.
Darüber hinaus bietet die Asus GeForce GTX 1660 Ti Strix OC eine komplexe RGB-Beleuchtung. Diese lässt sich auch per Tool oder direkt per Knopfdruck auf dem PCB abschalten. Die Grafikkarte kann zudem zwei am Ende angeschlossene PWM-Lüfter mit Hilfe des Asus-Tools steuern. Monitore können an zwei DisplayPort- oder zwei HDMI-Anschlüssen angesteuert werden.
Merkmal | PNY GeForce GTX 1660 Ti XLR8 OC | Asus GeForce GTX 1660 Ti Strix OC | |
---|---|---|---|
Karte | PCB-Design | PNY | Asus |
Länge, Breite | 17,0 cm, 12,5 cm | 30,0 cm, 13,0 cm | |
Stromversorgung | 1 × 8 Pin | 1 × 8 Pin | |
Kühler | Design | 2,0 Slot | Strix, 2,1 Slot |
Kühlkörper | Alu-Kern/Radiator 3 Heatpipes |
Alu-Kern/Radiator 3 Heatpipes |
|
Lüfter | 1 × 95 mm (axial) | 3 × 85 mm (axial) | |
Lüfter abgeschaltet (2D) | Nein | Ja (Quiet-BIOS) | |
Anlaufdrehzahl | Immer an | 850 Umdrehungen | |
Takt (Stromsparmodus) |
GPU-Basis | 1.550 (300) MHz | 1.550 (300) MHz |
GPU-Durchschnitt | 1.815 MHz | 1.860 MHz 1.890 MHz (OC-Mode) |
|
GPU-Maximum | 1.995 MHz | 1.980 MHz | |
Speicher | 6.000 (810) MHz | 6.000 (810) MHz | |
Speichergröße | 6.144 MB GDDR6 | 6.144 MB GDDR6 | |
Leistungsaufnahme | Standard-TDP | 120 Watt | 130 Watt |
Maximale TDP | 130 Watt | 156 Watt | |
Anschlüsse | 1 x DisplayPort 1.4 1 x HDMI 2.0b 1 × Dual-Link-DVI |
2 x DisplayPort 1.4 2 x HDMI 2.0b |