News Threadripper 3990X: 64 Zen-2-Kerne in einer TRX40-CPU kosten 3.990 USD

GHad schrieb:
Hat da Intel eigentlich irgendwas um das zu kontern in den nächsten Jahren?

Solange die im Server bzw. HEDT Markt bei 14nm+ bleiben, können die AMD nicht mehr aufholen. Ich denke auch nicht, dass die die 10nm bei Server und HEDT schon ende des Jahres schaffen, eher im zweitem Halbjahr 2021. Wenn AMD die 5nm dann 2021 wirklich schafft, könnte Intel dann mit 10nm bereits wieder "veraltet" sein.
 
  • Gefällt mir
Reaktionen: cppnap
Icetea36 schrieb:
Wenn AMD die 5nm dann 2021 wirklich schafft, könnte Intel dann mit 10nm bereits wieder "veraltet" sein.

Intel ist da jetzt schon hinterher und wenn dann die zusätzlichen "+" dran hängen um dann etwas beim 7nm Verfahren mitreden zu können sind andere schon beim 5er. Intel sollte diesen Zweig einfach fallen lassen.
 
Zuletzt bearbeitet:
Icelake-SP soll ja bis 38 Kerne im Extreme Core Count schaffen. D.h. für mehr braucht man trotzdem 2 Sockel. Lt. letzter Intel Folie waren die außerdem auch auf 2 Sockel beschränkt. Evtl. wird Comet Lake SP, was ja parallel raus kommt nochmal was drauflegen, aber da bin ich jetzt von max 28 Kernen ausgegangen, wird aber bis 4 Sockel gehen. 112 Kerne gegen 128 Kerne dann als Maximum.

Sieht (kerntechnisch) nicht so gut aus für Intel... AVX-512, KI-Functions und IPC-/Takt-Steigerungen müssen es wohl reißen.
 
Summerbreeze schrieb:
Solche Leistungsabstände wird es wohl so schnell nicht wieder geben.
... und dann plaudert AMD von weiteren 7-10% IPC in der nächsten Generation. Ich glaube da kann noch viel geschrieben werden in die Geschichtsbücher.
 
spcqike schrieb:
Da hast du Recht. Hab mich vielleicht schlecht ausgedrückt :)
Selbstverständlich is er nur der Konkurrent für die 32 Kern TR. Da er da nur marginal weniger Leistung bietet als bspw. der 3970X. Was bei 28 Kernen gegen 32 Kerne auch nicht verwundert, dafür hat er aber einen Hexa-Channel Speichercontroller und ist bereits 1 Jahr älter. Er "war" ja mal als Gegenspieler zum 2990WX angesiedelt, den er auch mit weniger Kernen geschlagen hat. Verständlicher Weise dann auch teurer war.

Dass ein 1 Jahr alter W-3175X von neuen TR geschlagen wird sollte niemanden verwundern. Die Forschung bleibt halt weder bei AMD, noch bei Intel stehen. Nur hat Intel eben noch keine neuen Prozessoren in der Richtung auf dem Markt.
Die Einordnung ist momentan eher schwierig aber angesichts dessen was geboten wird halte ich den Preis des 64 Kerners für halbwegs vertretbar.
Ich hatte mir selbst überlegt einen zuzulegen aber aktuell hat der für mich einen richtig dicken Pferdefuß, die RAM Bestückung.
Wenn dann wären für mich 128 GB ECC RAM ein absolutes Muss gewesen aber das ist in der aktuellen Form ist das für mich kaum sinnvoll umsetzbar. Zum einen wären dafür zumindest 8x 16 GB oder besser 4x 32 GB Module erforderlich, zum anderen kann ich aber keine 3200er unbuffered ECC Module mit der entsprechenden Größe finden. Die gehen nur bis 2666 und selbst wenn man damit argumentieren würde das man sie ja übertakten könne, dann wäre es besser auf ein Modul pro Kanal runter zu gehen und dann bleibt exakt ein Riegel übrig der nicht verfügbar ist.
https://geizhals.de/?cat=ramddr3&xf...3_keinSO~15903_mitECC~15903_ohnepuff~254_2666

PS: ich hatte mit dem Handy zu schreiben, wo istd as Edit vom zweiten Teil des Postings geblieben?
 
Novasun schrieb:
Betreiber, die Renderfarmen betreiben, werden sich diese Balken sehr genau anschauen.
Naja, ich hoffe die werden sich vor allem die Balken ansehen, die für die wichtig sind.
intel winselt ja zumindest ein wenig richtig, dass AMDs „Lieblingsbalken“ zu nicht so wirklich viel Aussage taugt.
Oba schee is scho ozschaun.
Ergänzung ()

.Snoopy. schrieb:
Verstehe nur nicht was du daran komisch findest.
Mir gefällt vor allem die verdrehte menschliche Psyche an der Sache.
Auch wenn man es besser weiß, bzw. besser wüsste, kann man sich der Wirkung nur schwer entziehen.
;)
 
  • Gefällt mir
Reaktionen: .Snoopy.
Snoopy69 schrieb:

Das ist wirklich sehr interessant und bestätigt auch meine Benchmarks.

Schaut man sich zb den 24C AMD Ryzen Threadripper 3960X gegen meinen i9 an dann sieht es so aus:

Code:
x265 Multithread
-------------------------------------
encoded 250 frames in 5.77s (43.36 fps), 23221.11 kb/s, Avg QP:25.44
encoded 250 frames in 5.83s (42.88 fps), 23221.11 kb/s, Avg QP:25.44


System Details
--------------
    Specification        AMD Ryzen Threadripper 3960X 24-Core Processor
    Specification        DDR4-3200
    Specification        DDR4-3200
    Specification        DDR4-3200
    Specification        DDR4-3200

mein i9 7980 XE @ 4.1 Ghz @ 3000 Mesh @ 3800 Ram (wobei das kein Einfluss hat)

Code:
x265 Multithread
-------------------------------------
encoded 250 frames in 5.64s (44.29 fps), 23221.11 kb/s, Avg QP:25.44
encoded 250 frames in 5.67s (44.13 fps), 23221.11 kb/s, Avg QP:25.44


System Details
--------------
Specification Intel(R) Core(TM) i9-7980XE CPU @ 2.60GHz
Specification DDR4-3200

Wobei das Testset mit nur 6s Laufzeit etwas kurz ist. Und wenn kauft man sich ja wohl nen richten Threadripper, kein so ein 24C Lümmel.
 
Zuletzt bearbeitet:
Wadenbeisser schrieb:
zum anderen kann ich aber keine 3200er unbuffered ECC Module mit der entsprechenden Größe finden.
3200 ECC kannst Knicken.
Das einzige was es gibt ist 32GB ECC 2933er Samsung M391A4G43AB1-CVF
Nur nicht über Geizhals zu finden. Und bisher nur bei wenigen Anbietern auf Anfrage.
Ich habe mich aber noch nicht getraut nach dem Preis zu fragen. ;)
Die paar MHz werden auch einfach überbewertet. Dann ist die Kiste eben 3% langsamer. Und? Wen juckts?
 
@Summerbreeze
Das Problem ist das man bereits beim 2990WX im Vergleich zum Epyc merkte das ein Stück der Leistung durch das schmalere Speicherinterface auf der Strecke blieb und das dürfte mit doppelt so vielen Kernen nicht wirklich besser ausschauen.
Mit reg. ECC hätte die Sache wieder anders ausgesehen denn solche Module bekommt man und sind auch noch deutlich billiger als der langsamere, unbuffered Speicher.
https://geizhals.de/?cat=ramddr3&xf...03_DDR4~15903_gepuffert~15903_mitECC~254_3200
Aber nein, man muss sich ja auf unbuffered versteifen......
 
TheGreatMM schrieb:

Ist erst auf der CES vorgestellt worden. Denke das wir die nächsten Wochen auf die Seite kommen.
 
Und was mach ich hetzt mit macOS als lieblings OS? Looos AMD wir brauchen Thunderbolt unterstützung 😄
Ergänzung ()

Wadenbeisser schrieb:
@Summerbreeze
Das Problem ist das man bereits beim 2990WX im Vergleich zum Epyc merkte das ein Stück der Leistung durch das schmalere Speicherinterface auf der Strecke blieb und das dürfte mit doppelt so vielen Kernen nicht wirklich besser ausschauen.
Mit reg. ECC hätte die Sache wieder anders ausgesehen denn solche Module bekommt man und sind auch noch deutlich billiger als der langsamere, unbuffered Speicher.
https://geizhals.de/?cat=ramddr3&xf...03_DDR4~15903_gepuffert~15903_mitECC~254_3200
Aber nein, man muss sich ja auf unbuffered versteifen......
ECC brauchst du doch zur Fehleranalyse? Sprich nur für Server wochtig. Oder verstehe ich was nicht?
 
Wadenbeisser schrieb:
@Summerbreeze
Das Problem ist das man bereits beim 2990WX im Vergleich zum Epyc merkte das ein Stück der Leistung durch das schmalere Speicherinterface auf der Strecke blieb und das dürfte mit doppelt so vielen Kernen nicht wirklich besser ausschauen.
Mit reg. ECC hätte die Sache wieder anders ausgesehen denn solche Module bekommt man und sind auch noch deutlich billiger als der langsamere, unbuffered Speicher.
https://geizhals.de/?cat=ramddr3&xf=1454_16384~1454_32768~15903_DDR4~15903_gepuffert~15903_mitECC~254_3200
Aber nein, man muss sich ja auf unbuffered versteifen......
TR Gen 1+2 haben aber ein Speicherproblem, dadurch das alle Die untereinander kommunizieren müssen.
Das fällt jetzt mit dem zentralen I/O weg. Was meinst denn, warum TR3 die Gen 1+2 so eindrucksvoll geschlagen hat? Grob die hälfte des Zuwachses sollte auf das Konto der besseren Speicheranbindung gehen.
 
@Krautmaster
Habt ihr dabei auch mal auf die CPU Auslastung geachtet?
Bereits bei den Tests des 2990WX fiel auf das gerade Video Encoder ein ziemliches Problem mit den vielen Kernen/Threads hatten. Ich glaube bei x264 war z.B. nach ca. 10 Kernen Feierabend und man musste schon mehrere Videos parallel encoden um das Teil auszulasten..
 
kann gelöschtbwerden,ups
 
JDBryne schrieb:
ECC brauchst du doch zur Fehleranalyse? Sprich nur für Server wochtig. Oder verstehe ich was nicht?
Nicht ganz, es dient der Fehlerkorrektur und wenn es allso oft eingreifen muss dann ist was am System faul.
Ohne ECC schmiert dann im besten Fall das System sang und klanglos ab, im schlechtesten Fall rauschen die Speicherfehler durch und zerstören dir so die Daten.

Mit ECC läuft das System weiter solange die Fehler nicht zu massiv ausfallen.
Man ist durch Fehlermeldungen im Log gewarnt, hat Zeit zu reagieren und den Fehler rechtzeitig zu beheben.

Gerade bei einem so großen Speicherausbau und bei der heutigen Lage der Module (zwischen dem Spannungswandler Kühler, dem CPU Sockel und darüber am besten noch ein dicker Tower Kühler der dem Bereich endgültig die Luft abdreht) will ich nicht mehr darauf verzichten denn ich hatte schonmal das unangenehme Erlebnis das sich die Module (damals noch normale OC Module) dort so sehr aufheizten das es nach einiger Zeit auf Vollast zu Speicherfehlern kam und das Teil abschmierte.
Mit einem extra Propeller Richtung RAM und Spannungswandler war das Problem weg und mit dem ECC RAM erst recht, auch ohne extra Propeller denn die Dinger hatten auch noch einen weiteren Vorteil, ohne die dollen Speicher Kühlkörper kommt mehr Luft zwischen die Module und sie werden so besser gekühlt.
Ergänzung ()

Summerbreeze schrieb:
TR Gen 1+2 haben aber ein Speicherproblem, dadurch das alle Die untereinander kommunizieren müssen.
Das fällt jetzt mit dem zentralen I/O weg. Was meinst denn, warum TR3 die Gen 1+2 so eindrucksvoll geschlagen hat? Grob die hälfte des Zuwachses sollte auf das Konto der besseren Speicheranbindung gehen.
Ich sprach nicht umsonst vom Threadripper und dessen Epyc Variante denn der grobe Aufbau ist abgesehen von den indirekt angebundenen DIE beim Ripper weitestgehend gleich. Die Kommunikation zwischen den DIE sollte also nicht der entscheidene Punkt sein. Was durch den aktuellen Aufbau entfällt sind vor allem Latenzen die sich bei dem vernetzten Aufbau der ersten Generation nicht nur höher ausfielen sondern sich auch noch aufsummierten wenn der Speicherbereich mit den benötigten Daten für die aktuellen Berechnungen z.B. in den Modulen am Controller eines anderen DIE liegen. Mit dem zentralen IO DIE, welches auch die Speichercontroller besitzt, ist der Weg für jedes Chiplet gleich und direkt ansteuerbar.
 
Zuletzt bearbeitet von einem Moderator:
  • Gefällt mir
Reaktionen: Unnu und max9123
AMD delivering more bandwidth for creators than ever before.😍


Bard schrieb:
Ob man den ohne Probleme mit einer Luftkühlung gebändigt bekommt?

Laut Datenblatt wohlmöglich. ja im standard Takt und am limit,
verbraucht soviel wie ein TDP 280W wie ein 3960X/3970X.

Aber nicht vergessen der wir wahrscheinlich auch um die 166Watt wie die 3960x/3970X alleine im Idle/ Leerlauf ziehen.

Ergänzung ()

Wadenbeisser schrieb:
@Krautmaster
Habt ihr dabei auch mal auf die CPU Auslastung geachtet?
Bereits bei den Tests des 2990WX fiel auf das gerade Video Encoder ein ziemliches Problem mit den vielen Kernen/Threads hatten. Ich glaube bei x264 war z.B. nach ca. 10 Kernen Feierabend und man musste schon mehrere Videos parallel encoden um das Teil auszulasten..

Exacto Mundo man benötigt auch immer die passende Software.
Mehr Kerne heißt nicht gleichzeitig das die Software "darauf" schneller läuft.



https://images.idgesg.net/images/article/2020/01/ryzen_threadripper_3990wx-100826121-orig.jpg

Although we don’t see quite double the performance of the 32-core Threadripper 3970X, it’s not clear if the scaling is a limitation of clock frequencies, architectural limitations, or OS issues—or if Maxon’s Cinebench R20 just doesn’t scale to 128-threads. The reason we don’t know how far Cinebench can go? Because no company has ever dared to introduce a consumer or prosumer 64-core CPU.

Until now, that is.

And not to rub it in too much, but AMD also demonstrated the new Threadripper 3990X out performing a dual Xeon machine with with 56 cores in a V-Ray render. While the Threadripper took about an hour, the dual Xeon took another 30 minutes to finish a render job.

https://www.pcworld.com
 
Zuletzt bearbeitet:
Krautmaster schrieb:
Hab dafür ne kleine benchmark.cmd gemacht die nen 4K file nach HEVC wandelt
https://cloud.krautmaster.de/index.php/s/32rxpPmZjTnHmAg
Krautmaster schrieb:
i9 16C @ 4.2 GHz
Time elapsed: 0:04:14,XX

i9 7980 XE @ 17x4Ghz
encoded 1497 frames in 247.93s (6.04 fps), 20051.42 kb/s, Avg QP:22.89
Time elapsed: 0:04:08,55

Ryzen 3900X
encoded 1497 frames in 390.82s (3.83 fps), 20051.42 kb/s, Avg QP:22.89
Time elapsed: 0:06:33,75

TR 1950X (thx @wern001 ) -> Local Memory Mode
encoded 1497 frames in 460.06s (3.25 fps), 20051.42 kb/s, Avg QP:22.89
Time elapsed: 0:07:40,70

TR 1950X (thx @wern001 ) -> Shared Memory Mode
encoded 1497 frames in 376.37s (3.98 fps), 20051.42 kb/s, Avg QP:22.89
Time elapsed: 0:06:17,17

Da danach gefragt wurde, hier sind die Werte mit Deinem Benchmark von meinem TR 3960X

Auto-OC (PBO + PE):
encoded 1497 frames in 167.77s (8.92 fps), 20051.42 kb/s, Avg QP:22.89
Time elapsed: 00:02:48

4.3 GHz AllCore
encoded 1497 frames in 166.59s (8.99 fps), 20051.42 kb/s, Avg QP:22.89
Time elapsed: 00:02:47

4.4 GHz AllCore
encoded 1497 frames in 162.66s (9.20 fps), 20051.42 kb/s, Avg QP:22.89
Time elapsed: 00:02:43

Was mir auch wieder zeigt, das das Auto-OC von AMD ziemlich gut ist und AllCore OC nur wenig Sinn macht, selbst für MT Anmwendungen.
Allerdings hatte ich bei keinem Durchlauf eine volle Kernauslastung, pendelte so um die 80%.
 
  • Gefällt mir
Reaktionen: Krautmaster und Unnu
MADman_One schrieb:
Da danach gefragt wurde, hier sind die Werte mit Deinem Benchmark von meinem TR 3960X

Auto-OC (PBO + PE):
encoded 1497 frames in 167.77s (8.92 fps), 20051.42 kb/s, Avg QP:22.89
Time elapsed: 00:02:48

4.3 GHz AllCore
encoded 1497 frames in 166.59s (8.99 fps), 20051.42 kb/s, Avg QP:22.89
Time elapsed: 00:02:47

4.4 GHz AllCore
encoded 1497 frames in 162.66s (9.20 fps), 20051.42 kb/s, Avg QP:22.89
Time elapsed: 00:02:43

Was mir auch wieder zeigt, das das Auto-OC von AMD ziemlich gut ist und AllCore OC nur wenig Sinn macht, selbst für MT Anmwendungen.
Allerdings hatte ich bei keinem Durchlauf eine volle Kernauslastung, pendelte so um die 80%.
Kommt auf die Anwendung an...
Hier mag allcore-OC keinen Sinn machen. Bei CB20 bringt es schon was. Wenn auch nur für den Score
Am Meisten bringt CCX-OC. Versuche mal mit einem AMD in cpu-z bei SC mehr als 600 zu knacken. Daher mag ich CCX-OC sehr... :)
 
MADman_One schrieb:
Allerdings hatte ich bei keinem Durchlauf eine volle Kernauslastung, pendelte so um die 80%.
Ich gehe mal davon aus das SMT an war, das würde dann bei dem 24 Kerner bedeuten das rein rechnerisch bei ca. 38 Kernen/Threads Feierabend war.
Der i9 7980 XE mit deinen 18 Kernen/36 Threads geht da beispielsweise schon voll drin auf, für einen 32 Kerner mit den 64 Threads wären bereits 2 Instanzen erforderlich um ihn auszulasten und beim 64 Kerner mit den 128 Threads sogar 4.
 
Zurück
Oben