Threadripper 3970X & 3960X im Test: AMDs große Ryzen beerdigen Intel Core X

Volker Rißka (+1)
1.130 Kommentare
Threadripper 3970X & 3960X im Test: AMDs große Ryzen beerdigen Intel Core X

tl;dr: Mit Ryzen Threadripper 3970X und 3960X rückt AMD das Verhältnis aus eigener HEDT- und Mainstream-Plattform wieder gerade. Die neuen CPUs bieten zwar weiterhin „nur“ 32 und 24 Kerne, dank Wechsel auf Zen 2 und das Chiplet-Design legen sie aber trotzdem um 50 Prozent zu. Intel Core X sieht da kein Land mehr.

Auf AMD Ryzen folgt AMD Ryzen Threadripper – und das in mittlerweile dritter Generation. Nachdem AMD in den vergangenen beiden Jahren die Messlatte für die Anzahl der Kerne von bis zu 16 bei Threadripper 1000 auf bis zu 32 bei Threadripper 2000 nach oben geschraubt und endlich wieder ein eigenes High-End-Produkt am Start hatte, steht in der neuen Generation zumindest für dieses Jahr der Wechsel auf Zen 2 im Fokus. Die beiden heute vorgestellten Varianten 3960X und 3970X bleiben bei maximal 32 Kernen, dafür wird quasi alles andere so stark aufgewertet, dass es einem in Benchmarks so vorkommt, als wäre ein weiteres „Kern-Upgrade“ erfolgt. Der Leistungsgewinn ist stellenweise atemberaubend. Und auch an anderer Stelle blieb beim Testen ab und an die Luft weg.

Technische Daten zum Vorgänger im Vergleich

Der Ryzen Threadripper 3970X mit 32 Kernen ersetzt also den Ryzen Threadripper 2990WX mit 32 Kernen, der 3960X mit 24 Kernen den 2970WX mit 24 Kernen. Doch wer daraus schlussfolgert, das sich vergleichsweise wenig tut, der täuscht sich fatal.

Das Testkit von AMD mit ASUS ROG Zenith II Extreme und MSI Creator TRX40
Das Testkit von AMD mit ASUS ROG Zenith II Extreme und MSI Creator TRX40

Mit dem Wechsel auf das neue I/O-Die-Chiplet-Design und Zen 2 verdoppelt sich nicht nur der schnelle L3-Cache und das Speicherinterface kann mit schnellerem Speicher umgehen, es gibt auf 7-nm-Basis auch viel höhere Taktraten und die drastisch gestiegene IPC, mit der schon Ryzen 3000 punkten konnte. Allein den IPC-Zugewinn beziffert AMD erneut mit 15 Prozent, der Taktzuwachs liegt auch im realen Alltag dank zusätzlich erhöhter TDP auf 280 Watt bei rund 20 Prozent. Und wird das alles kombiniert, kommen im Test in Multi-Core-Anwendungen im Durchschnitt tatsächlich 50 Prozent schnellere Prozessoren heraus.

Doch das Ende der Fahnenstange ist damit noch nicht erreicht. Wie AMD parallel zum Fall des NDA für 3970X und 3960X bekanntgibt, wird es im kommenden Jahr einen Ryzen Threadripper 3990X mit 64 Kernen bei 280 Watt TDP geben. Keine dieser CPUs trägt das erst im letzten Jahr eingeführte „W“ für Workstation im Namen.

Threadripper 3000 und der Vorgänger im Vergleich
Kerne/Threads Takt / max. 1C-Takt L3-Cache Speicherkanäle / Takt TDP Preis
(UVP, Start)
Preis
(Handel, heute)
Threadripper 3990X 64/128 ? GHz 256 MB ?/DDR4-3200 280 Watt ab 2020 ab 2020
Threadripper 3970X 32/64 3,7/4,5 GHz 128 MB 4/DDR4-3200 280 Watt $ 1.999 2.159 Euro (UVP)
Threadripper 3960X 24/48 3,8/4,5 GHz 128 MB 4/DDR4-3200 280 Watt $ 1.399 1.509 Euro (UVP)
Threadripper 2990WX 32/64 3,0/ 4,2 GHz 64 MB 4/DDR4-2933 250 Watt $ 1.799 1.800 Euro
Threadripper 2970WX 24/48 3,0/4,2 GHz 64 MB 4/DDR4-2933 250 Watt $ 1.299 1.050 Euro
Threadripper 2950X 16/32 3,5/4,4 GHz 32 MB 4/DDR4-2933 180 Watt $ 899 800 Euro
Threadripper 2920X 12/24 3,5/4,3 GHz 32 MB 4/DDR4-2933 180 Watt $ 649 425 Euro

Wachstum gibt es wie bei allen 3000er-Prozessoren von AMD auch bei Threadripper beim Preis. 100 respektive 200 US-Dollar Aufpreis vor Steuern heißt das bei den Threadripper 3000 im Vergleich zum direkten Vorgänger in den USA, in Deutschland sind es sogar 200 respektive 360 Euro. Und das geschieht nicht nur, weil die Leistung so stark steigt, sondern auch mit Blick auf Epyc. Dort gibt es die beiden Single-Sockel-Varianten Epyc 7402P und 7502P mit gleicher Anzahl an Kernen, weniger Takt und TDP aber Octa-Channel-RAM für 1.250 und 2.300 US-Dollar. Mit einem Dumping beim Preis würde sich AMD hier primär selbst schaden. Gefahr von Intel? Droht derzeit nicht.

ASUS ROG Zenith II Extreme: Zwei 25-mm-Lüfter kühlen die VRM bei Bedarf
ASUS ROG Zenith II Extreme: Zwei 25-mm-Lüfter kühlen die VRM bei Bedarf

Das Chiplet-Design perfektioniert

Die größte Neuheit von AMD war mit der Einführung von Zen 2 neben 7 nm das Chiplet-Design. Multi-Chip-Prozessoren mit in der Regel identischen Dies gab es zwar bereits zuvor, doch verfolgt es jetzt einen ganz neuen Ansatz. Erstmals im November 2018 der Presse präsentiert, zieht sich dies nun durch alle neuen Lösungen von klein mit nur zwei Chips (1 × I/O-Die, 1 × CPU-Chiplet) pro Package bis groß mit gleich neun Chips auf einem Träger (1 × I/O-Die, 8 × CPU-Chiplet) .

Dabei nutzt AMD viele Gemeinsamkeiten und die sich ergebenen Synergien, die den gesamten Prozess vereinfachen und auf lange Zeit viel Geld sparen. So ist zum Beispiel jeder CPU-Die identisch, egal ob er im kleinsten Matisse genutzt wird oder im größten Epyc. Ein CPU-Die besitzt seit der Zen-2-Generation immer acht Kerne und 32 MByte L3-Cache, die sogenannten Chiplets werden dann mit anderen kombiniert und ergeben das fertige Endprodukt.

Zen 2 CCD: Acht Kerne am Rand und 32 MByte L3-Cache in der Mitte
Zen 2 CCD: Acht Kerne am Rand und 32 MByte L3-Cache in der Mitte (Bild: Fritzchens Fritz)

Zu den CPU-Dies gehört zwingend auch immer ein I/O-Die, in dem die Speichercontroller und PCIe-Lanes beheimatet sind. Genau in diesem liegt nun auch der größte Unterschied zwischen den kleinen Mainstream-Produkten auf dem Sockel AM4 und den High-End-Modelle auf Sockel SP3/sTRX4.

Threadripper 3000 ist nahezu ein Epyc „Rome“

Der I/O-Die von Epyc 2 „Rome“ und nun auch Threadripper 3000 „Castle Peak“ ist ein Riese. 8,34 Milliarden Transistoren bringt Globalfoundries in der 12-nm-Fertigung auf einem 412 mm² großen Chip unter. Zum Vergleich: Der Consumer-I/O-Chip für Ryzen 3000 ist lediglich 2,09 Milliarden Transistoren schwer und belegt 125 mm² Platz.

Die Dies mit je acht CPU-Kernen sind mit 74 mm² noch winziger, wenngleich auch dort 3,8 Milliarden Transistoren verbaut sind. Hier spielt die viel feinere 7-nm-Fertigung von TSMC eine gewichtige Rolle.

I/O-Die von Epyc und Threadripper
I/O-Die von Epyc und Threadripper (Bild: Fritzchens Fritz, CC0 1.0)

Die I/O-Dies (IOD) von Castle Peak und Rome sind zwar identisch, für das Einsatzgebiet aber nicht gleich. Denn zumindest die ersten beiden Threadripper 3000 nutzen nicht alle verbauten acht Speichercontroller (im Bild jeweils links und rechts am Rand), lediglich die Hälfte ist vorgesehen, aus acht Kanälen werden so folglich vier. Die Halbierung geht auch an anderer Stelle weiter: Von den 128 PCIe-4.0-Lanes des IOD (oben und unten in der Mitte erkennbar) darf Threadripper nur 64 nutzen. Bei Rome sind es volle 128 Lanes pro CPU, von denen im Dual-Sockel-Setup je 64 zur Kommunikation zwischen den CPUs genutzt werden, in Summe bleiben auch dann also noch 128 frei.

Threadripper 3960X und 3970X bestehen auf fünf Chips

Beide Threadripper nutzen vier CPU-Chiplets mit je acht Kernen pro CPU-Die (CCD). Beim 3970X sind alle vier komplett aktiviert, beim 3960X sind in jedem CCD zwei Kerne deaktiviert, der Cache bleibt jedoch in voller Größe erhalten. Die beiden schnellsten Kerne, also jene, die den höchsten Turbo-Takt fahren können, sitzen laut Hierarchie immer im CCD4. Die vier CCDs sind wie gehabt über das Infinity Fabric mit dem großen I/O-Die verbunden.

Ein Threadripper 3000 besteht aktuell aus fünf Chips
Ein Threadripper 3000 besteht aktuell aus fünf Chips (Bild: AMD)

Neue Plattform mit neuem alten Sockel LGA 4096

LGA 4096 hieß der Sockel für AMDs High-End-Lösungen seit der ersten Stunde von Zen und er bleibt es auch bei Threadripper 3000, doch liegt der Hund im Detail begraben. Denn funktional kompatibel ist der neue Prozessor mit dem bisherigen Sockel nicht, obwohl er es mechanisch ist. Die Pin-Belegung wurde jedoch nahezu komplett verändert, ein neues Modell kann somit gar nicht im alten Sockel oder umgekehrt funktionieren. Installieren lassen sich alte und neue CPUs hingegen auf der jeweils falschen Plattform.

Der neue Sockel ist nur mechanisch der alte
Der neue Sockel ist nur mechanisch der alte

Die Motivation erklärte AMD mit fehlender Skalierbarkeit des Sockel TR4, der nun zu sTRX4 wird. Den original Sockel und die Boards hatte AMD anscheinend so stark kastriert, dass jetzt keine andere Möglichkeit gegeben war, als es komplett neu zu machen, während Epyc auf Sockel SP3 auch in der neuen Rome-Generation problemlos auf einem zwei Jahre alten Mainboard der ersten Generation funktioniert. Zumindest deutet AMDs Roadmap für den neuen Threadripper-Sockel den Einsatz auch in der nächste Generation an – „Subject to Change“-Hinweis inbegriffen.

Threadripper-Sockel: sTRX4 mit Zukunft!?
Threadripper-Sockel: sTRX4 mit Zukunft!? (Bild: AMD)

Neuer Chipsatz TRX40 für beachtliche Luxus-Mainboards

Ein neuer Sockel erfordert neue Mainboards. Die logische Folge: Auch ein angepasster neuer Chipsatz („TRX40“) ist mit dabei, wenn ohnehin alles neu gemacht werden muss. Heraus kommen die am besten ausgerüsteten Platinen, die es bisher gab, denn sie kombinieren die vielfältigen Ports der CPUs, genauer gesagt des I/O-Dies, mit dem Chipsatz.

Platform Diagram für AMD TRX40
Platform Diagram für AMD TRX40 (Bild: AMD)

Die Ausstattung der neuen High-End-Plattform von AMD hat so keine Konkurrenz. Die CPUs bieten aufgrund der gleichen Architektur wie im Mainstream-Desktop die gleichen Features, da der I/O-Die aber eine Ausbaustufe größer ist, werden auch die Anschlüsse mehr. Von den 64 PCIe-Lanes des I/O-Dies sind einige reserviert, andere direkt für Speicher vorgesehen. Am Ende bleiben aber immer noch 48 frei nutzbare Lanes übrig – drei PCIe-x16-Slots können damit voll nach PCIe-4.0-Standard angesteuert werden. Darüber hinaus können weitere 2 × 4 PCIe-Lanes als solche oder für die Anbindung von NVMe-Laufwerken oder 2 × 4 SATA-Ports genutzt werden. In Summe ergeben sich somit 56 nutzbare PCIe-Lanes der CPU.

Der eigentliche Chipsatz TRX40 ist dabei nichts anderes als der X570 für die High-End-Plattform – beim Vorgänger entsprach der X399 dem X370. Der in 14 nm bei Globalfoundries gebaute TRX40-Chip mit einer TDP von maximal 15 Watt, der quasi der I/O-Die der Matisse-Prozessoren ist, bietet die gleichen Anschlüsse wie der X570-Chipsatz für den Sockel AM4. Um der High-End-Plattform gerecht zu werden, ist die Anbindung zum Prozessor mit acht Lanes jedoch doppelt so breit wie auf der Mainstream-Ebene. Maximal 16 PCIe-4.0-Lanes können direkt vom Chipsatz vielfältig genutzt werden, beispielsweise maximal zwölf SATA-Ports gibt es beim X570 ebenso wie vier reguläre plus acht schnelle USB-Schnittstellen. In Summe mit der CPU ergeben sich für die Plattform die von AMD beworbenen 72 PCIe-Lanes nach Standard 4.0.

Bis zu 256 GByte RAM unterstützt

Da der I/O-Die überall quasi der gleiche ist, sind auch die Speicherausbauten gleich. Threadripper profitiert dabei nun auch von hohen Taktraten, selbst bei Nutzung von großen Dual-Rank-Modulen. Erst bei Vollbestückung sinkt die offiziell unterstützte Geschwindigkeit – was jedoch nicht davon abhält, dennoch alles auf das gleiche, vorherige Niveau zu takten. Der neue Speichercontroller hatte sich bereits mit Matisse als viel besser als früher erwiesen.

Theoretisch unterstützt die TRX40-Plattform auch die Fehlerkorrektur ECC. Hier liegt es am Ende aber stets am Mainboardhersteller, ob der dies durch ein passendes BIOS ebenfalls unterstützt. Daran haperte es in der Vergangenheit oft.

Offizieller Speichersupport bei Ryzen Threadripper 3000 „Castle Peak“
Anzahl Module Modul-Typ maximaler Takt
4 × 8 GByte Single Rank DDR4-3.200
8 × 8 GByte Single Rank DDR4-2.933
4 × 16 GByte Dual Rank DDR4-3.200
8 × 16 GByte Dual Rank DDR4-2.667
4 × 32 GByte Dual Rank DDR4-3.200
8 × 32 GByte Dual Rank DDR4-2.667

Das wird ein teurer Spaß!

AMDs neue High-End-Plattform setzt nicht nur bei der Leistung einen neuen Meilenstein in der Geschichte, auch der Preis zieht deutlich an. Und während die CPU-Aufpreise für das Gebotene durchaus realistisch bleiben, werden die Mainboards ein teures Unterfangen. Viele Hersteller der Platinen haben sich hier richtig ausleben können, die Herausforderung für den Kunden besteht nun darin, überhaupt ein Board in bezahlbaren Regionen zu finden. Wer vor zwei Jahren gedacht hätte, die 300 bis 400 Euro teuren X399-Mainboards wären schon kostspielig, wird beim Nachfolger dafür noch nicht einmal das günstigste erhalten. Und nach oben sind dieses Mal wirklich keine Grenzen gesetzt.

Der Preis für das günstigste Komplettpaket aus CPU, Board und mindestens einem Quad-Channel-Speicherkit liegt zum Start Ende November 2019 deutlich jenseits der 2.000-Euro-Marke. Maxed out sind problemlos 4.000 Euro möglich, denn zur CPU von 2.150 Euro können problemlos 256 GByte DDR4-3200 verbaut werden – und die schlagen auch mit mindestens 1.200 Euro zu Buche. Was das teuerste Board kosten wird, war vor dem Fall des NDA nicht klar. Knapp vierstellig dürfte aber gesetzt sein.

Und das ist ja noch nicht das Ende, denn 64 Kerne kommen im nächsten Jahr. Der Aufpreis für den dann noch einmal deutlicheren Alleinherrscher in dem Marktsegment dürfte enorm ausfallen. Einen offiziellen Preis und eine Aussage dazu, ob der Ryzen Threadripper 3990X noch einmal die Plattform wechseln wird, gibt es heute aber noch nicht.

64 Kerne als Threadripper kommen 2020
64 Kerne als Threadripper kommen 2020 (Bild: AMD)