Test Ryzen Threadripper 2000 im Test: 32 Kerne sind verrückt, 16 sehr gut nutzbar

@MK one
Ja, paar zusätzliche Tests bzw Einstellungen wären interessant gewesen. In handbrake zb ist der 2990wx langsamer auf Grund der 64 threads, aber wäre interessant wie schnell der mit 32 threads, also deaktiviertem SMT wäre.
Müsste ja an sich trotzdem schneller sein als der 2950X
 
ghecko schrieb:
Warum stört es dich, das Phoronix zu ergründen versucht, was genau das Problem ist?

Tut er das? Genau das tut er eben nicht!

Im Test testet der Typ verschiedene Anzahl der Kerne und dann springt er von 32 ohne HT auf 64 mit HT. Ist jetzt HT das Problem? Womöglich! Wieso testet der Typ dann nicht auch mit 16 Kernen und HT?

Man kann Anhand der Tests gar nichts vergleichen. Nicht wie sich Windows 10 zu Server 2019 verhält. Nicht ob das Problem vielleicht an der Speicherbandbreite liegt oder an den zusätzlichen Compute Kernen. Nach mehr als einen persönlichen Feldzug gegen Windows und einen Clickbait hören sich seine Tests nicht an.

Ich konnte um ehrlich zu sein nicht einmal auf Anhieb feststellen ob mit oder ohne aktivierten NUMA getestet wurde und wie sich dies auf das Testergebnis auswirkt. Da war der Test vom ursprünglichen TR hier bei CB zig mal umfangreicher und lies diverse Rückschlüsse zu.
https://www.computerbase.de/2017-08/amd-ryzen-threadripper-test-1950x-1920x/
 
Zuletzt bearbeitet:
@xexex
und du gibst nur haltlose Behauptungen von dir ...
unter Linux zeigt der 2990 WX durch die Bank höhere Werte als unter Windows .
und die Vermutung mit SMT stammt von mir ...
siehe meine Postings auf Seite 31 (614 ,620) ...
wäre es eine Hardware Schwäche , würde sie sich auch unter Linux zeigen
 
Zuletzt bearbeitet:
MK one schrieb:
unter Linux zeigt der 2990 WX durch die Bank höhere Werte als unter Windows .

Habe ich was anderes behauptet? Nur hat keins dieser ganzen tollen "Benchmarks" auch nur ansatzweise auf mögliche Ursachen hingewiesen. Auch deine Vermutung, ist letztlich nur eine Vermutung, weil der Typ es nicht geschafft hat mal mit 16 oder 24 Kernen und HT zu testen. Dann bräuchtest du auch keine Vermutungen anzustellen.

Das ist jetzt der wievielte Artikel von Phoronix? Der Erste war nur so gespickt mit synthetischen Tests, der zweite war noch halbwegs interessant und der dritte vollkommen unnötig. Daraus gelernt haben wir gar nichts, weil man mit synthetischen Benchmarks keine Rückschlüsse auf mögliche Probleme mit Speicherdurchsatz ziehen kann, und bei jedem "Benchmark" wieder eine komplett neue Auswahl getestet wird.

So ist weder Windows 10 mit Server 2019 vergleichbar, noch der 2990WX mit dem 2950X unter Windows. Das ist Rosinenpickerei und macht die ganzen Tests unnötigerweise unglaubwürdig und nicht miteinander vergleichbar. Hätten die Tests einen Sinn ergeben sollen, hätte man mit Linux, Windows 10 und Server 2019 einen gleichen Testparcour fahren sollen und schauen sollen ob es an den Kernen, NUMA, Speicherbandbreite oder SMT liegt.

Jeder dürfte mittlerweile begriffen haben, dass der 2990WX derzeit unter Windows eine schlechte Wahl ist. Da helfen auch 20 Tests nicht, wenn man nicht einmal versucht dem auf den Grund zu gehen oder einfach mal abwartet.
 
Zuletzt bearbeitet:
Wie schlecht so ein 32 Kernprozessor abschneidet kann man hier z.B. hier sehen:

https://www.cfd-online.com/Forums/hardware/205498-epyc-7551-vs-6850k-fluent-bench.html

Und hier sind 8 Speicherkanäle am Werk, anstatt nur 4 wie beim 2990WX. Sobald Speicherbandbreite gefordet wird, sieht es sehr schlecht für den 32 Kerner aus. Im Vergleich, ein Dual Epyc System mit 2x 16 Kernen ist doppelt so schnell wie der 32 Kerner.
Von daher ist das "W" für Workstation ein sehr schlechter Scherz. Das Nischenprodukt vom Nischenprodukt eignet sich auch wirklich nur maximal fürs rendern.
 
  • Gefällt mir
Reaktionen: powercf
@Duke711

Und was soll daran nun schlecht sein? Das isn 2 GHz bzw. 2,55 GHz Prozessor. In den Benches geht es von 108 Sek bis 392 Sek.

Wie ich schon schrieb wartet doch mal erste BIOS bzw. UEFI Updates ab. Das is nun mal ne neue CPU, auch wenn sie auf TR 1 basiert. Ich denke bei AMD wird schon an neuem Code gearbeitet der den Board-Herstellern bald zur verfügung steht.
 
Duke711 schrieb:
Wie schlecht so ein 32 Kernprozessor abschneidet kann man hier z.B. hier sehen:

https://www.cfd-online.com/Forums/hardware/205498-epyc-7551-vs-6850k-fluent-bench.html

Und hier sind 8 Speicherkanäle am Werk, anstatt nur 4 wie beim 2990WX. Sobald Speicherbandbreite gefordet wird, sieht es sehr schlecht für den 32 Kerner aus. Im Vergleich, ein Dual Epyc System mit 2x 16 Kernen ist doppelt so schnell wie der 32 Kerner.
Von daher ist das "W" für Workstation ein sehr schlechter Scherz. Das Nischenprodukt vom Nischenprodukt eignet sich auch wirklich nur maximal fürs rendern.


ist auch irgendwie logisch oder? Wenn du 32 Kerne hast und du teilst es durch Bandbreite und vergleichst mit 16 Kernen bei gleicher Bandbreite hast du pro Kern mehr Bandbreite...
 
Gib es auf Xexex , nicht bei AMD , nicht bei dem 2900 WX , nicht bei UMA oder Numa ist der schuldige zu suchen
Wie üblich ist es Microsoft bei Win 10 / Win Server .
Das ist wirklich nichts neues , schon beim Ryzen gab es ( kleinere ) Probleme
https://www.golem.de/news/fma3-inst...sst-ryzen-systeme-abstuerzen-1703-126770.html

Dass der Absturz wie beschrieben nur unter bestimmten Umständen bei der Verwendung von Windows 10 auftritt, deutet daraufhin, dass es sich nicht um einen Fehler der Hardware selbst handelt, sondern eben um einen sehr spezifischen Fehler in Verbindung mit der SMT-Verarbeitung von Windows.

Ebenso hatte Intel mit HT an Anfang einige Probleme
 
MK one schrieb:
Gib es auf Xexex , nicht bei AMD , nicht bei dem 2900 WX , nicht bei UMA oder Numa ist der schuldige zu suchen
Wie üblich ist es Microsoft bei Win 10 / Win Server .

Mir ist schon klar, dass wenn es um dein Kind geht alle, um ihn rum, nur nicht das Kind schuld sein kann! Diese Art von "Schuld" interessiert mich aber um ehrlich gesagt wenig.

Was mich aber brennend interessiert, welche Besonderheit von diesem Ryzen zu dem schlechten abschneiden unter Windows führt und welche Möglichkeiten es gibt diese Probleme möglicherweise zu umgehen.

Eine Hardware kann nur so gut sein, wie die Software die man damit einsetzen möchte und derzeit kann man bei Windows zum Einsatz vom WX nur abraten. Wird sich das ändern? Vielleicht irgendwann! Einen Termin oder einen Workaround gibt es für das Problem nicht.
 
xexex schrieb:

Der Mann hat leider auch nur begrenzt Zeit und muss sich daher entscheiden was er in welchen Konfiguratinen benchmarkt. Hätte er vorher gewusst, dass 32 Kerne + SMT unter Windows so stark abfällt, hätte er sicherlich einen stärkeren Fokus auf SMT gelegt. Trotzdem sind seine Tests wesentlich umfangreicher als die von CB zu ThreadRipper 2.

Übrigens können auch synthetische Tests Probleme mit dem Speichersystem aufzeigen. Ich habe dir dafür sogar in diesem Thread schon ein mal einen Beleg dafür geliefert.

xexex schrieb:
Eine Hardware kann nur so gut sein, wie die Software die man damit einsetzen möchte und derzeit kann man bei Windows zum Einsatz vom WX nur abraten. Wird sich das ändern? Vielleicht irgendwann! Einen Termin oder einen Workaround gibt es für das Problem nicht.

Das kann man so pauschal nicht sagen. Cine Bench läuft z.B. auch unter Windows gut
 
xexex schrieb:
Eine Hardware kann nur so gut sein, wie die Software die man damit einsetzen möchte und derzeit kann man bei Windows zum Einsatz vom WX nur abraten. Wird sich das ändern? Vielleicht irgendwann! Einen Termin oder einen Workaround gibt es für das Problem nicht.

SMT abschalten z.b ? wenn das 20 - 30 % mehr Leistung bringt ...
deswegen sollte da mal jemand nachtesten ...
2018-08-20.png

und aufschlussreich sind die Benchmarks allemal z.b hier , eine Anwendung die nicht wirklich multicore ist, am besten funktioniert sie mit 8 - 12 Threads , ansonsten ist die 4 Thread Leistung dieselbe wie mit 16/ 24 /32 Threads , mit einem bemerkenswerten Ausreißer , Win Server und 64 Threads ( 2990 WX / SMT on ) - das schlechteste Ergebniss von allen .
Das hat garantiert nichts mit Bandbreite zu tun , da bereits 4 Threads höhere Leistung bringen
Ich wiederhole gern meine Vermutung : Da wird Rechenlast auf einen SMT Kern gelegt anstatt auf einen echten , sodass es zu Verzögerungen in der Abarbeitung kommt

Ich würde es tatsächlich nicht überraschend finden wenn beim EPYC dasselbe Problem mit Win Server 2016/2019 existiert denn der einzige Unterschied ist Octa statt Quad Channel , den EPYC hat man nur nicht so genau unter die Lupe genommen weil er nur in Server Umgebungen zu Hause ist
 
Zuletzt bearbeitet:
Cool Master schrieb:
@Duke711

Und was soll daran nun schlecht sein? Das isn 2 GHz bzw. 2,55 GHz Prozessor. In den Benches geht es von 108 Sek bis 392 Sek.

Wie ich schon schrieb wartet doch mal erste BIOS bzw. UEFI Updates ab. Das is nun mal ne neue CPU, auch wenn sie auf TR 1 basiert. Ich denke bei AMD wird schon an neuem Code gearbeitet der den Board-Herstellern bald zur verfügung steht.


Dann schau Dir mal den Vergleich zwischen 16 und 32 Kerne genau an. Die 32 Kerne sind genauso schnell oder nur minimal schneller als die 16 Kerne. Daran wird auch kein UEFI Update was ändern, denn 32 Kerne müssen sich acht Speicherkänäle bzw. beim TR sogar nur vier teilen. Wie schlecht das für bandbreitenlastige Anwendungen sein kann, sieht man an Benches. Von 32 Kernen können nur effektiv die Hälfte genutzt werden, der Rest verpufft. Darum ist dann z.B. ein Dual 2x16 Epyc System auch doppelt so schnell wie 1x 32.
Der Chinebench ist deshalb auch keim Maßstab und bewusst von AMD als Marketing gewählt. Z.B. Blender ist ebenfalls von Speicherbandbreite abhängig.
 
Duke711 schrieb:
Z.B. Blender ist ebenfalls von Speicherbandbreite abhängig.

und welches OS wurde genutzt ? Win Server ? schau dir mal an wie Blender unter Linux rennt ...

2018-08-20 (1).png

ist der Unterschied meist bei 30 % oder darüber ( Windows Server langsamer ) geht das bei 64 Threads nur etwas zurück ( 27,36 % )
sieht man auch beim Vergleich der OS Systeme https://www.phoronix.com/scan.php?page=article&item=windows-server-2990wx&num=4
wo ist da denn deine Bandbreitenlimitierung ? Ich will nicht sagen das es keine Anwendungen gibt , bei denen das Multichipdesign Nachteile bietet , jedoch scheint Blender nicht dazu zu gehören .
Selbst SMT bringt bei Blender noch 30 % ( 32 C = 103,9 s , 32C + SMT = 80,17 s unter Linux )
 
Zuletzt bearbeitet:
Naja auch hier sieht man deutlich eine Speicherbandbreitenlimitierung, zwar nicht so extrem wie beim CFD Bench, aber von 8 auf 16 beudet dies auch beinahe bei der Renderzeit eine Halbierung, also Faktor 2, bei 16 von 32 nur noch Faktor 1,4.

"Ich will nicht sagen das es keine Anwendungen gibt , bei denen das Multichipdesign Nachteile bietet , jedoch scheint Blender nicht dazu zu gehören ."
Da gibt es genügend Anwendungen und ja bei Blender handelt es sich eben um eine Renderingsoftware. Da funktioniert Multichipdesign in der Regel relativ gut. Nur sind in der Regel nicht alle Workstations Renderingfarmen.
 
Duke711 schrieb:
Naja auch hier sieht man deutlich eine Speicherbandbreitenlimitierung, zwar nicht so extrem wie beim CFD Bench, aber von 8 auf 16 beudet dies auch beinahe bei der Renderzeit eine Halbierung, also Faktor 2, bei 16 von 32 nur noch Faktor 1,4.

.

ich weiß ja nicht von wo du deine Zahlen nimmst ... , aber im Bild über deinem Posting ( 633 ) kann ich von faktor 1,4 nichts erkennen
fangen wir oben an
4 T = 645,41 = 100 %
8T = 331,97->323s wäre doppelt so schnell , 9s zu 100% nicht wirklich ein großer Unterschied , = 51,43% Soll 50%
16T =181,37 ----->166s wäre doppelt so schnell , 16s zu 100% Unterschied , = 28,1 % , Soll : 25 %
32T =103,90 ----->91s wäre doppelt so schnell , 13 s zu 100% , = 16,09 % , Soll : 12,5 % , Faktor 1,4 ist das nicht sondern eher 1,8
 
Zuletzt bearbeitet:
chithanh schrieb:
Das ist aber nur ein Beispiel für einen CFD-Benchmark. Da gibt es noch andere, die schlechter (z.B. Euler CFD), mittelmäßig (SPECwpc CFD) oder besser (Rodinia CFD unter Linux) auf Threadripper skalieren.

Haben Sie Benchmarks dafür? Die Benchmarks, die ich gefunden haben, zeigen eine 3%* Leistungssteigerung oder einen 25%† Leistungsverlust im Vergleich zum 2950X.

* https://techreport.com/review/33977/amd-ryzen-threadripper-2990wx-cpu-reviewed/7
https://hothardware.com/reviews/amd-ryzen-threadripper-2950x-and-2990wx-review?page=5


MK one schrieb:
ich weiß ja nicht von wo du deine Zahlen nimmst ...

Er nimmt seine Zahlen von:
https://www.cfd-online.com/Forums/hardware/205498-epyc-7551-vs-6850k-fluent-bench.html
Bei ihm sind 32 Threads ~20% schneller als 16.


Wer nur Blender oder Ähnliches benutzt, kann vielleicht den 2990WX gut gebrauchen. Außerhalb dieser Nische einer Nische bleibt er ein sehr unausgewogener Prozessor (zu viele Kerne, nicht ausreichend Speicherbandbreite).
 
powercf schrieb:
Haben Sie Benchmarks dafür? Die Benchmarks, die ich gefunden haben, zeigen eine 3%* Leistungssteigerung oder einen 25%† Leistungsverlust im Vergleich zum 2950X.

* https://techreport.com/review/33977/amd-ryzen-threadripper-2990wx-cpu-reviewed/7
Das ist SPECwpc CFD, darauf habe ich bereits Bezug genommen.

powercf schrieb:
Das ist Euler CFD, darauf habe ich ebenfalls bereits Bezug genommen.

Rodinia CFD gibt es z.B. hier
https://techgage.com/article/amd-ryzen-threadripper-2990wx-32-core-workstation-processor-review/6/
oder hier
https://www.phoronix.com/scan.php?page=article&item=amd-linux-2990wx&num=4
 
  • Gefällt mir
Reaktionen: powercf
Was mir beim Threadripper bisher noch fehlt, ist ein ordentliches Workstation-Board. Auf den diversen Preisvergleichslisten finde ich für diese CPU nur Gaming-Boards mit LED und ähnlichem Bling-Bling. Jetzt, wo AMD den Threadripper 2970WX und 2990WX ganz offiziell als Workstation-CPU bewirbt, schaffen die Mainboard-Hersteller in diesem Punkt ja vielleicht Abhilfe.

Eine sinnvolle Marktaufteilung seitens AMD wäre vermutlich Ryzen für Gamer, Threadripper für Workstations und Epyc für Server. Will man den Threadripper als Workstation-CPU positionieren, wäre es vielleicht auch überlegenswert, Exemplare mit integrierter GPU herauszubringen (wie es Intel beim Xeon E macht).

Für uns Kunden ist es jedenfalls schön, dass AMD endlich wieder Druck auf Intel ausübt. Konkurrenz belebt das Geschäft (und verbilligt die Produkte).
 
@Laskaris

Was macht ein WS Board deiner Meinung nach aus? Ich hab das Taichi und das ist ein WS Board. Super IOMMU Gruppen, super Erweiterbarkeit und super Kühlung. Klar hat das auch LEDs dran so what? Wenn das einem nicht zu sagt einfach im BIOS die LED Controller ausschalten und das "Problem" ist weg.
 
Zurück
Oben