Nvidia GeForce: RTX 3090, 3080 & 3070 mit viel mehr Leistung ab 499 €
Nvidias CEO Jensen Huang hat auf dem GeForce Special Event die Next-Gen-Grafikkarten GeForce RTX 3090, RTX 3080 und RTX 3070 mit Ampere-Technik vorgestellt. Die Performance mit und ohne Raytracing soll massiv gegenüber Turing zulegen und die Effizienz soll deutlich steigen. Die Preise sind da fast eine Überraschung.
Die finalen Spezifikationen waren zu einem Großteil schon kein Geheimnis mehr. Entsprechend fällt die Meldung eher mit der Tür ins Haus und konzentriert sich auf das noch Unbekannte und ohnehin Interessantere: Wie schnell sind die neuen Grafikkarten? Macht die Leistung pro Shader bei gleichem Takt einen Sprung? Gibt es Verbesserungen bei Raytracing sowie DLSS? Ab wann können die Grafikkarten gekauft werden? Und was kosten die 3D-Beschleuniger überhaupt? Die nackten Spezifikationen finden dann weiter unten Beachtung.
Ampere auf 8 nm mit doppelten FP32 Shadern
Viele Technik-Details zu Ampere hatte der Livestream nicht zu bieten, einige Überraschungen hat es dann aber doch gegeben. Nachdem man zuletzt für Ampere eigentlich von einer 7-nm-Fertigung ausgegangen war, sind es schlussendlich doch 8 nm bei Samsung geworden. Nvidia spricht von einem Custom-Prozess mit Optimierungen, wie es auch schon bei Turing mit 12 nm bei TSMC der Fall war. Die GA102-GPU trägt 28 Milliarden Transistoren und ist damit deutlich größer als der TU102 von Turing.
Was sich genau bei der Ampere-Architektur geändert hat, bleibt noch ein Geheimnis. Offenbar hat Nvidia jedoch die Shadereinheiten deutlich umgebaut. Anscheinend kann eine ALU bei Ampere nicht mehr nur eine MAD-Berechnung (Multiply-ADD) mit FP32-Genauigkeit pro Takt durchführen, sondern gleich deren zwei. Damit wäre die theoretische Rechenleistung pro Takt für eine einzelne Shadereinheit verdoppelt.
Aus diesem Grund nennt Nvidia mit Ampere auch doppelt so viele CUDA-Kerne wie bis jetzt. So ist die GeForce RTX 3070 mit gleich 5.888 CUDA-Kernen angegeben, die GeForce RTX 3080 mit 8.704 und die GeForce RTX 3090 mit gleich 10.496. Die GeForce RTX 2080 Ti hat im Vergleich dazu gerade einmal 4.352 CUDA-Kerne.
Apropos stärker: Nvidia gibt für die GeForce RTX 3070 eine Rechenleistung von 20 TFLOPS an, bei der GeForce RTX 3080 sind es gleich 30 TFLOPS und bei dem Flaggschiff GeForce RTX 3090 36 TFLOPS. Im Vergleich dazu hat die GeForce RTX 2080 Ti gerade einmal 13,4 TFLOPS. Das klingt gewaltig, allerdings ist eine FP32-ALU von Ampere nicht doppelt so schnell wie die von Turing. In von Nvidia herangezogenen Spielen soll die GeForce RTX 3070 leicht schneller als die GeForce RTX 2080 Ti sein. Das ist immer noch ein beeindruckendes Ergebnis, aber entspricht nicht dem Abstand in der theoretischen Rechenleistung.
Auch bei den Taktraten scheint Ampere gegenüber Turing leicht zulegen zu können. Zumindest gibt Nvidia für alle drei Modelle eine Frequenz von etwas über 1.700 MHz an, was 150 MHz über den Werten einer GeForce RTX 2080 Ti liegt. Wenn der Turbo von Ampere ähnlich wie der von Turing arbeitet, werden die Taktraten in Spielen höher liegen und könnten die 2.000-MHz-Marke überschreiten.
Der FPS-Sprung von Ampere ist deutlich größer als der von Turing
Die GeForce RTX 3070 soll also schneller als eine GeForce RTX 2080 Ti bei normalen Rasterizer-Spielen sein. Dies ist ein deutlich größerer Schritt als der der alten Turing-Generation, bei dem sich teils selbst die GeForce RTX 2080 schwer mit der GeForce GTX 1080 Ti getan hat. Auch die GeForce RTX 3080 macht einen großen Schritt, mit dem sie der GeForce RTX 2080 Ti weit enteilen soll.
Einen direkten Vergleich mit dem Turing-Flaggschiff nennt Nvidia nicht, die Performance soll aber bis zu doppelt so hoch wie bei einer GeForce RTX 2080 sein. Überschlagen scheint ein Plus von rund 55 Prozent gegenüber der GeForce RTX 2080 Ti damit durchaus als möglich. Die GeForce RTX 3090 hat dann nochmal 20 Prozent mehr Rechenleistung als das kleinere Modell. Genauere Leistungsangaben fehlen aber.
Auch Raytracing und DLSS werden deutlich schneller
Abseits der klassischen Rasterizer-Performance standen bei Ampere Raytracing und DLSS im Fokus. Laut Nvidia wurden die Raytracing-Kerne deutlich aufgewertet und sollen nun 70 Prozent schneller pro Kern als bei Turing arbeiten. Sowohl Grafik- als auch Compute-Berechnungen können separat zu Raytracing ausgeführt werden, darüber hinaus können die Kerne die Schnittstellenprüfung (Ray Traversal) doppelt so schnell wie bis jetzt durchführen. Die Anzahl der RT-Kerne ist noch unbekannt.
In der Praxis spricht Nvidia zwischen einer etwa 60 bis 100 Prozent höheren Raytracing-Performance von Ampere gegenüber Turing. Der Abstand ist abhängig von der Komplexität der Berechnungen. Battlefield V soll „nur“ bei etwa 60 Prozent liegen, Metro Exodus bei etwa 70 Prozent und Quake 2 RTX bei etwa 85 Prozent. In professionellen Programmen wie Blender kann es auch etwas mehr als doppelt so schnell werden.
Laut Nvidia ist die GeForce RTX 3080 dazu in der Lage, Raytracing-Spiele in Ultra HD mit DLSS in 60 FPS wiederzugeben. Die GeForce RTX 3070 kommt mit Raytracing und DLSS auf 60 bei einer Auflösung mittig zwischen WQHD und Ultra HD – für WQHD mit DLSS ist die Framerate also deutlich über 60 FPS.
Tensor-Kerne in der dritten Generation
Die Tensor-Kerne gehen bei Ampere für Gaming-Grafikkarten bereits in die dritte Generation und stammen daher von der professionellen GA100-GPU ab. Vermutlich können die Derivate der Gaming-Ampere-GPUs nicht alle Formate der Profi-Version beschleunigen – weil dies einfach nicht nötig ist –, dazu hat sich Nvidia jedoch nicht geäußert. Davon abgesehen werden die Tensor-Kerne jedoch deutlich schneller als auf Turing. Die Anzahl der Tensor-Kerne ist bei Ampere ebenso noch unbekannt.
Nvidia spricht von deutlich mehr Performance pro Watt
Die verbesserte Fertigung in Verbindung mit einer offenbar nicht nur schnelleren, sondern auch effizienteren Architektur heben das Performance-pro-Watt-Verhältnis bei der GeForce-RTX-3000-Generation an. Nvidia spricht von einer um 90 Prozent höheren Effizienz als bei Turing. Allerdings zeigt das Diagramm, dass die Aussage beim Vergleich einer GeForce RTX 3080 mit einer GeForce RTX 2080 und einer jeweiligen Framerate von 60 FPS getroffen worden ist – entsprechend lief die GeForce RTX 3080 nicht am Maximum der Leistungsfähigkeit, was gewöhnlich einen Einfluss auf die Effizienz hat.
Um die höhere Performance zu erzielen, hat Nvidia unter anderem die Leistungsaufnahme der Ampere-Generation durchweg deutlich erhöht. Die GeForce RTX 3070 darf sich 220 Watt genehmigen, die GeForce RTX 3080 320 Watt und die GeForce RTX 3090 350 Watt. Die GeForce RTX 2080 Ti limitiert nach Nvidia-Vorgaben dagegen bei 250 Watt. Die GeForce RTX 3090 und RTX 3080 werden dafür zwei 8-Pin-Stromstecker benötigen, die per Adapter auf der Founders Edition im neuen 12-Pin-Anschluss münden, die GeForce RTX 3070 begnügt sich mit einem einzigen 8-Pin-Stecker.
GDDR6X für die zwei schnellsten Modelle
Die GeForce RTX 3080 und die GeForce RTX 3090 werden neuen und sehr schnellen GDDR6X-Speicher erhalten. Bei der GeForce RTX 3080 ist dieser 10 GB groß, bei der GeForce RTX 3090 sind es satte 24 GB. Auf der GeForce RTX 3070 kommt dagegen klassischer GDDR6-Speicher mit einer Kapazität von 8 GB zum Einsatz. Angaben zur Geschwindigkeit hat Nvidia nicht gemacht.
HDMI 2.1 macht Premiere
Alle drei Ampere-Grafikkarten unterstützen als erste Grafikkarten überhaupt HDMI 2.1. Alternativ steht DisplayPort 1.4 zur Verfügung. Den USB-C-Anschluss für VR-Headsets gibt es bei den neuen Grafikkarten nicht mehr.
Eine weitere interessante Neuerung der Ampere-Grafikkarten ist die zusammen mit Microsoft für Windows 10 entwickelte Schnittstelle RTX I/O. Sie macht es den Grafikkarten möglich, Daten ohne Umwege über die CPU aus PCIe-4.0-SSDs zu lesen – und das sogar in hoch komprimierter Form. Den neuen GeForce RTX 3000 soll es so möglich sein, Daten mit bis zu 14 GB/s aus dem Speicher zu lesen, ohne den Prozessor dabei signifikant zu belasten. Das erinnert an die Next-Gen-Konsolen PlayStation 5 und Xbox Series X, deren Fortschritt ebenfalls darin besteht, besonders schnelle SSDs besonders schnell an die Grafikkarte angebunden zu haben, um unter anderem noch hochauflösendere Texturen nutzen zu können, ohne den Grafikkartenspeicher exorbitant vergrößern zu müssen.
Die RTX 3080 macht den Anfang, dann kommen 3090 und 3070
Noch ein paar Tage muss man sich gedulden, bis die GeForce RTX 3000 mit Ampere-Technologie zu kaufen sein wird. Die GeForce RTX 3080 macht den Anfang und wird ab dem 17. September ab 699 Euro im Handel stehen. Am 24. September folgt dann die GeForce RTX 3090, die 1.499 Euro kosten wird. Die GeForce RTX 3070 wird es im Laufe des Oktobers ab 499 Euro zu kaufen geben. Die Lücke von vorerst 800 Euro zwischen RTX 3090 und RTX 3080 scheint prädestiniert, um in Zukunft noch geschlossen zu werden. Gerüchte um eine GeForce RTX 3070 Ti mit 16 GB sind nur Stunden nach der Präsentation erneut entfacht, eine GeForce RTX 3080 Ti mit 20 GB und mehr Shadern dürfte nur eine Frage der Zeit sein.
Einige Spezifikationen bleiben noch offen
Nicht im Livestream, aber online hat Nvidia mittlerweile auch viele Spezifikationen der drei ersten Ampere-Gaming-Grafikkarten veröffentlicht. Einige Angaben fehlen allerdings noch immer. Da sich die bisherigen Spekulationen über die Grafikkarten jedoch robust gezeigt haben, werden vermutlich auch die anderen Daten, zumindest zu einem Großteil, korrekt sein. Die noch nicht offiziellen Daten sind entsprechend gekennzeichnet.
RTX 3090 | RTX 3080 | RTX 3070 | RTX 2080 Ti | |
---|---|---|---|---|
Architektur | Ampere | Turing | ||
GPU | GA102 | GA104 | TU102 | |
Prozess | Samsung 8 nm Custom-Prozess | 12 nm TSMC | ||
Chipgröße | 628 mm | 393 mm² | 754 mm² | |
Transistoren | 28 Mrd. | 17,4 Mrd. | 18,6 Mrd. | |
GPC | 7 | 6 | 6 | 6 |
SM | 82 | 68 | 46 | 68 |
FP32-ALUs pro SM | 128 | 64 | ||
FP32-ALUs | 10.496 | 8.704 | 5.888 | 4.352 |
RT-Kerne | 82 2nd Gen | 68 2nd Gen | 46 2nd Gen | 68 1st Gen |
RT-Kerne + ALUs synchron | Ja | Nein | ||
Tensor-Kerne | 328 3rd Gen | 272 3rd Gen | 184 3rd Gen | 544 2nd Gen |
Basis-Takt | 1.400 MHz | 1.450 MHz | 1.500 MHz | 1.350 MHz |
Boost-Takt | 1.700 MHz | 1.710 MHz | 1.730 MHz | 1.545 MHz |
FP32-Leistung | 35,7 TFLOPS | 29,8 TFLOPS | 20,4 TFLOPS | 13,4 TFLOPS |
FP16-Leistung | 35,7 TFLOPS | 28,8 TFLOPS | 20,4 TFLOPS | 26,9 TFLOPS |
FP16-Leistung über Tensor | 143 TFLOPS 285 TFLOPS (Sparsity) |
119 TFLOPS 238 TFLOPS (Sparsity) |
82 TFLOPS 163 TFLOPS (Sparsity) |
107,6 TFLOPS |
Textureinheiten | 328 | 272 | 184 | 272 |
ROPs | 112 | 96 | 96 | 88 |
Speicher | 24 GB GDDR6X | 10 GB GDDR6X | 8 GB GDDR6 | 11 GB GDDR6 |
Speicher-Geschwindigkeit | 19,5 Gbps | 19,0 Gbps | 14,0 Gbps | 14,0 Gbps |
Speicher-Interface | 384 Bit | 320 Bit | 256 Bit | 352 Bit |
Speicher-Bandbreite | 936 GB/s | 760 GB/s | 448 GB/s | 616 GB/s |
L2-Cache | 6 MB | 5 MB | 4 MB | 6 MB |
TDP | 350 Watt | 320 Watt | 220 Watt | 250 Watt |
Slot-Anbindung | PCIe 4.0 | PCIe 4.0 | PCIe 4.0 | PCIe 3.0 |
UVP | 1.499 Euro | 699 Euro | 499 Euro | 1.259 Euro |
Alle namhaften Partner haben inzwischen erste Custom Designs auf Basis der ersten drei Ampere-Grafikkarten für Spieler angekündigt. Preise oder konkrete Taktraten ab Werk übertakteter Modelle hat bisher allerdings noch kein Hersteller genannt. Einen Start der Custom Designs parallel mit dem Verkaufsstart der Founders Edition hat bisher nur Zotac in Aussicht gestellt, Asus spricht von „September 2020“.
- Strix, TUF & Dual: Asus GeForce RTX 3090, 3080 und 3070 noch im September
- GeForce RTX 3000: EVGA flankiert Ampere mit fünf Serien
- Gigabyte GeForce RTX 3000: Vier Modelle zum Start der Ampere-Gaming-Lösungen
- GeForce RTX 3090/3080: Gainward führt vier Custom Designs in allen Details
- GeForce RTX 3000: MSI setzt bei Ampere vorerst auf Gaming und Ventus
- Nvidia Ampere: Inno3D GeForce RTX 3090 und 3080 in Bildern
- Custom Designs: Erste Bilder zu Zotacs GeForce RTX 3090, 3080 und 3070
Den veröffentlichten Bildern zufolge setzen alle Hersteller bei ihren Custom Designs auf eigene PCBs, das PCB der Founders Edition verkauft Nvidia in diesem Jahr offensichtlich nicht. Weil GPU und GDDR6X auch auf Partnerkarten auf engem Raum untergebracht sind, sind auch die beiden großen Modelle alternativer Hersteller allerdings mit vergleichsweise kurzen PCBs versehen – der Kühler ragt in der Regel deutlich darüber hinaus. Einigkeit scheint bei dessen Lüfterbestückung und Dicke zu herrschen: Drei Lüfter sind die Regel, bis zu drei Slot Breite auch.
Auf den neuen 12-Pin-Stromanschluss setzt nach aktuellem Kenntnisstand kein Hersteller abseits von Nvidia. Die Stromversorgung der großen GeForce RTX 3090 wird stattdessen entweder über zwei oder gar drei 8-Pin-Stecker umgesetzt. Nvidia sieht bei der Founders Edition vor, dass der neue 12-Pin-Anschluss über zwei separate 8-Pin-Stränge vom Netzteil gespeist wird – ein Adapter liegt den Grafikkarten bei.
-
Nvidia hat mich positiv überrascht
-
Nvidia hat meine Erwartungen erfüllt
-
Nvidia hat mich enttäuscht