AMD Threadripper 3000: Multi-Threading mit 32 Kernen auf die Spitze getrieben

Jan-Frederik Timm
167 Kommentare
AMD Threadripper 3000: Multi-Threading mit 32 Kernen auf die Spitze getrieben

AMD Threadripper 3970X und 3960X (Test) mussten im Test nicht nur die bekannten Benchmark-Parcours absolvieren, sondern auch zwei Szenarien meistern, in denen Multi-Threading mit verschiedenen Anwendungen anstand. Im großen Artikel geht dieser Aspekt allerdings schnell unter, weshalb er hier noch einmal separat erscheint.

In auf Parallelisierung ausgelegten Anwendungen sind die neuen AMD Ryzen Threadripper 3000 mit 32 und 24 Kernen extrem schnell. Doch auch ein anderes Szenario zeigt, welche Rechenleistung mit Threadripper 3000 zur Verfügung steht und wofür sich eine aktuelle HEDT-Plattform mit so vielen Kernen noch anbietet.

Massive Parallelisierung ohne Leistungsverlust

Auf dem Ryzen Threadripper 3970X mit 32 Kernen wurden zu diesem Zweck Kerne gezielt Anwendungen zugewiesen. Es sollten Blender Benchmark, der Corona Benchmark und der Benchmark POV-Ray parallel ausgeführt werden. Jeder Anwendung wurden 8 Kerne und 16 Threads zugewiesen, acht Kerne und 16 Threads blieben also noch frei. Als Vergleich wurde der Ryzen 7 3700X mit „nur“ acht Kernen und 16 Threads herangezogen. Er musste alle Benchmarks nacheinander ausführen. Die Tests wurden auf Windows 10 Version 1903 mit allen aktuellen Updates mit einer Titan RTX (GeForce 441.20) durchgeführt. 32 GB RAM (4 × 8 GB DDR4-3200, CL14, 1T) waren installiert.

Der Ryzen Threadripper 3970X auf ASUS ROG Zenith II Extreme
Der Ryzen Threadripper 3970X auf ASUS ROG Zenith II Extreme

Die Ergebnisse sprechen für sich: Der Threadripper schließt Blender Benchmark und POV-Ray trotz paralleler Ausführung nur um fünf respektive drei Prozent langsamer ab als der Ryzen 3000, wenn er sie nacheinander einzeln ausführt. Lediglich Corona zeigt 23 Prozent Abweichung.

Unter Berücksichtigung der Tatsache, dass der 3970X POV-Ray und Corona aber ein paar Mal hintereinander ausführen kann, bevor er Blender quasi in der Zeit des 3700X abschließt, ist das Ergebnis dennoch beachtlich.

Ryzen 7 3700X (8K/16T) Ryzen Threadripper 3970X (32K/64T)
Kerne/Threads 8K/16T 8K/16T 8K/16T 8K/16T 8K/16T
Lasten 1 × Blender 1 × Blender 17 × POV-Ray 8 × Corona frei
1 × POV-Ray
1 × Corona
Gesamtlaufzeit 19:10 Minuten 17:11 Minuten 17:34 Minuten 18:24 Minuten
3700X: Blender 16:18, POV-Ray 1:00, Corona 1:52, 3970X: Blender 17:11, POV-Ray 1:02, Corona 2:18

In den 19 Minuten und 10 Sekunden, die der Ryzen 7 3700X für den Parcours benötigt, schließt der Ryzen Threadripper einmal Blender, siebzehn Mal POV-Ray und acht Mal Corona ab – und hat noch einen kompletten Ryzen 7 3700X quasi frei zur Verfügung.

Die drei Benchmarks ohne manuelle Zuweisung auszuführen gelingt auch, die Ergebnisse je Anwendung sind dann aber sehr schwankend, weil der Windows Scheduler mal der einen, mal der anderen Anwendung mehr Rechenleistung (Threads) zuweist. Das Ergebnis in POV-Ray auf dem 3970X bei Zugriff auf alle 32 Kerne schwankt so beispielsweise zwischen 3.600 und 5.900 Punkten, während parallel Corona zwischen 36 und 55 Sekunden benötigt und Blender immer mal eine Pause einlegt. Wird ein Benchmark neu gestartet, während zwei andere noch laufen, kommt es ebenfalls immer mal zu Wartepausen. Die manuelle Zuweisung ermöglicht hingegen einen zuverlässigen Fortschritt je Anwendung.

Auch Spielen beim Rendern ist kein Problem

Während immer mehr Anwendungen auch mit 32 Kernen zurecht kommen, geben sich die meisten Spiele noch mit vier zufrieden, nur wenige skalieren noch mit sechs oder acht Kernen, einige machen mit mehr sogar Probleme. Mit acht Kernen ist man in Spielen also meistens auf der sicheren Seite, das haben die Benchmarks zum Wochenanfang abermals gezeigt.

Damit steht die Frage im Raum, ob eine CPU mit 24 oder sogar 32 Kernen nicht parallel zur Berechnung von Spielen auf acht Kernen noch problemlos stark parallelisierte Anwendungen berechnen kann.

ComputerBase hat das sowohl mit dem AMD Ryzen Threadripper 3960X als auch dem Ryzen Threadripper 3970X und im Vergleich auch mit dem Ryzen 9 3950X (Test) und dem Intel Core i9-10980XE (Test) getestet. Über den Windows Explorer wurden den Spielen F1 2019 und Shadow of the Tomb Raider zu diesem Zweck die Threads 0 bis 15 zugewiesen, der parallel ausgeführten App Blender die verbleibenden Threads 16 bis 47 (3960X) respektive 16 bis 63 (3970X), 16 bis 35 (10980XE) und 16 bis 31 (3950X). Die Spiele wurden in WQHD bei maximalen Details (kein RTX) ausgeführt.

In F1 2019 zeigt keine der getesteten CPUs einen relevanten Leistungsverlust (FPS und Frametimes), wenn nur noch 16 Threads dem Spiel und der Rest der CPU dem Blender Benchmark zur Verfügung stehen. Bei den drei Ryzen ist interessant zu beobachten, dass die Leistung in Blender kaum niedriger ausfällt als würde F1 nicht laufen. Beim Core X ist das nicht der Fall: Hier fällt die Leistung in Blender um 17 Prozent, wenn Blender mit 20 Threads nicht allein auf der CPU läuft, sondern auch noch mit 16 Threads F1 2019 ausgeführt wird.

Diagramme
Leistung in F1 2019 mit parallel Blender
  • Laufzeit Blender:
    • TR 3970X 64T Blender
      4:24
    • TR 3970X 48T Blender
      5:49
    • TR 3970X 48T Blender/16T F1 2019
      6:00
    • TR 3960X 48T Blender
      5:43
    • TR 3960X 32T Blender
      8:34
    • TR 3960X 32T Blender/16T F1 2019
      8:47
    • i9-10980XE 36T Blender
      8:51
    • i9-10980XE 20T Blender
      14:31
    • i9-10980XE 20T Blender/16T F1 2019
      16:55
    • R9 3950X 32T Blender
      8:17
    • R9 3950X 16T Blender
      16:00
    • R9 3950X 16T Blender/16T F1 2019
      16:12
    Einheit: Minuten, Sekunden
  • FPS in F1 2019:
    • TR 3970X 64T F1 2019
      155,4
    • TR 3970X 16T F1 2019
      156,9
    • TR 3970X 16T F1 2019/48T Blender
      155,5
    • TR 3960X 48T F1 2019
      158,5
    • TR 3960X 16T F1 2019
      159,1
    • TR 3960X 16T F1 2019/32T Blender
      156,0
    • i9-10980XE 36T F1 2019
      160,2
    • i9-10980XE 16T F1 2019
      159,6
    • i9-10980XE 16T F1 2019/20T Blender
      161,0
    • R9 3950X 32T F1 2019
      157,1
    • R9 3950X 16T F1 2019
      157,8
    • R9 3950X 16T F1 2019/16T Blender
      154,3
    Einheit: Frames

Wird statt F1 2019 das Spiel Shadow of the Tomb Raider ausgeführt, verlieren die Zen-2-CPUs hingegen leicht an Leistung. Ryzen Threadripper verliert bei den FPS elf (3970X), sechs (3950X) und fünf (3960X) Prozent, während der Core X weiterhin unbeeindruckt ist. Bei Blender bleibt das Bild hingegen gleich: Die Ryzen liefern im Rahmen der Messgenauigkeit zu F1 vergleichbare Ergebnisse und zeigen sich kaum vom parallel ausgeführten Spiel beeindruckt, der Core X hingegen schon.

Diagramme
Leistung in SotTR mit parallel Blender
  • Laufzeit Blender:
    • TR 3970X 64T Blender
      4:24
    • TR 3970X 48T Blender
      5:49
    • TR 3970X 48T Blender/16T SotTR
      6:00
    • TR 3960X 48T Blender
      5:43
    • TR 3960X 32T Blender
      8:34
    • TR 3960X 32T Blender/16T SotTR
      8:47
    • i9-10980XE 36T Blender
      8:51
    • i9-10980XE 20T Blender
      14:31
    • i9-10980XE 20T Blender/16T SotTR
      16:55
    • R9 3950X 32T Blender
      8:17
    • R9 3950X 16T Blender
      16:00
    • R9 3950X 16T Blender/16T SotTR
      16:49
    Einheit: Minuten, Sekunden
  • FPS in SotTR:
    • TR 3970X 64T SotTR
      96,2
    • TR 3970X 16T SotTR
      93,5
    • TR 3970X 16T SotTR/48T Blender
      85,5
    • TR 3960X 48T SotTR
      103,1
    • TR 3960X 16T SotTR
      103,0
    • TR 3960X 16T SotTR/32T Blender
      97,9
    • i9-10980XE 36T SotTR
      104,1
    • i9-10980XE 16T SotTR
      103,7
    • i9-10980XE 16T SotTR/20T Blender
      102,1
    • R9 3950X 32T F1 2019
      99,1
    • R9 3950X 16T F1 2019
      99,3
    • R9 3950X 16T SotTR/16T Blender
      93,2
    Einheit: Bilder pro Sekunde (FPS)

Auch bei den Frametimes zeigt sich der 32-Kern-Threadripper am „anfälligsten“, wobei am Fazit für alle CPUs nichts zu rütteln ist: Beide CPUs können eine Titan RTX auf nur 16 Threads ausreichend schnell mit Daten versorgen, selbst wenn auf allen verbleibenden Threads Blender läuft. Und die Ryzen können Blender sogar ohne nennenswerten Leistungsverlust berechnen, während der Core X deutlicher nachlässt.

Apps Threads zuweisen unter Windows 10

Die Zuweisung von Threads zu Anwendungen kann über den Task Manager von Windows 10 erfolgen, wird auf diesem allerdings nicht von jeder Anwendung akzeptiert. Cinebench und Handbrake aus dem Parcours ignorierten die Vorgaben geflissentlich und nutzten immer alle verfügbaren Threads. Grundsätzlich gilt es die Einstellung bei jedem Start des Programmes neu vorzunehmen. Windows merkt sie sich nicht.