News AMD: 32-Kern-Threadripper mit 250 Watt TDP ab 13. August

peru3232 · 12. Juli 2018

Bezüglich der Leistungsfähigkeit/Leistungsaufnahme möchte ich folgendes beisteuern:

Mein 2700X mit eingestellter cTDP von 65W (die überprüft auch eingehalten wird) läuft beim Rendern unter C4D auf 3,45GHz Allcore. Das sollte somit für den 2990X für 250W TDP ähnlich ausschauen... denke, da kann man nicht meckern

Btw. bei 45W cTDP, was etwa 180W entsprechen würde, sind es ziemlich genau 3 GHz Allcore ...

Ned Flanders · 12. Juli 2018

Brrr schrieb:
@Ned Flanders
Das würde dann aber bedeuten, dass 2 der 4 CCX den Memory-Zugriff immer über die anderen CCX machen müssten.

AFAIK Das ist im UMA Mode (default) auch heute schon so. Die Daten liegen verteilt im RAM. Nur bei NUMA liegen die Daten lokal vor. UMA=Bandbreitenvorteil NUMA= Latenzvorteil

Bei typischen Threadripper Anwendungen ist UMA aber praktisch gleich schnell wie NUMA. Hauptsächlich Spiele reagieren besonders sensitiv auf Latenzen. Rendern oder bei uns DEseq reagiert praktisch garnicht.

Brrr schrieb:
Ich habe noch die Hoffnung, dass in TR4 bereits Octa-Channel vorgesehen war und die Mainboard-Hersteller das unterstützen können, wenn sie wollen. Aber mal schauen.

Das hätte ich eigentlich auch erwartet. Nicht als Octa sondern als 4x Single Channel. Im UMA bliebe die Bandbreite gleich und im NUMA die Latenz gleichmäßig. Schauen wir mal, aber gerüchtehalber siehts er nach 2x2+2x0 aus. Warum weiss ich auch nicht. Vermutlich wars von der Entwicklungszeit her billiger. Einfach hoch getakteten RAM verbauen, das bringt bei TR noch deutlich mehr als bei Ryzen, weil die IF mit hoch geht und somit die "externen" Daten schneller beim Kern landen.

Wadenbeisser · 12. Juli 2018

@Ned Flanders
Die Bilder zeigen lediglich das Schema beim aktuellen Ripper mit 2 genutzten DIE, welcher die TR4 Plattform ja auch ausreizen kann. Für einen Ripper mit 4 Keksen wäre das aufgrund der fehlenden Symetrie bei den Speicher Zugriffen mehr hinderlich als sinnvoll. Hier vertrete ich immernoch die Meinung das jedes DIE nur einen Speicher Controller nutzen wird denn so hat jedes DIE einen direkten Zugriffsmöglichkeit auf einen Teil des RAM und die IF Links werden dadurch ebenfalls entlastet, was wiederum der internen Kommunikation zu gute kommen würde.
Für eine solche Umverteilung wäre zudem noch nicht einmal allso viel Aufwand erforderlich denn dafür muss man lediglich den Chip Träger vom CPU Gehäuse entsprechend auslegen.

Hill Ridge · 12. Juli 2018

Brrr schrieb:
Ich bin vorallem gespannt wie viele Memory Channels der neue Threadripper hat

Sind genau 4...

Brrr schrieb:
@Ned Flanders
Das würde dann aber bedeuten, dass 2 der 4 CCX den Memory-Zugriff immer über die anderen CCX machen müssten.

Verwechselst du da gerade CCX mit Die?

Ned Flanders · 12. Juli 2018

@Wadenbeisser

siehe post #202 zweiter Absatz. Das hätte ich auch erwartet. Vieleicht stimmts ja auch. Mehr Sinn ergeben würde es definitiv.

Trotzdem definiert bei UMA der entfernteste Zugriff die Latenz und der ist bei TR1 genauso weit weg wie bei TR2 sollte es zu 2x2+2x0 konfig kommen. Entsprechend wenig aufregend wird unter UMA der Effekt ausfallen.

eine 2x2 + 2x0 hat aber auch Vorteile. Man kann einen "Game Mode" definieren, bei dem 16 Kerne mit DualChannel im NUMA laufen. Das wäre sonst nur Single Channel und daher wäre TR2 bei gleichem Takt dort eventuell langsamer als TR1.

Schauen wir mal.

Wadenbeisser · 12. Juli 2018

@Whiskey Lake
Nun ja, es besteht zumindest Sockel technisch die Möglichkeit das er 8 haben könnte denn mechanisch ist es der gleiche Sockel wie bei den SP3 Boards. Die wiederum erheblich mehr PCIe und RAM Kanäle haben.
PCIe technisch wird sich nichts ändern denn die sind so oder so fest verdrahtet aber beim RAM ist aktuell ist eben nicht mehr Speicher nutzbar weil der aktuelle Ripper eben nicht mehr kann. Durch das Design wäre aber interessant wie die Speicher Steckplätze an das Chip Gehäuse angebunden sind.
Das kleine Fünkchen Hoffnung lasse ich mir aber erst von den Tests des fertigen Produkts zerstören.

Ergänzung (12. Juli 2018)

@Ned Flanders
Nicht ganz denn das würde nur für die DIE gelten die direkt an den Speicher angebunden sind. Die anderen beiden hätten immer deutlich schlechtere Latenzen weil sie nur über Umwege an den RAM ran kommen, welche wiederum die Bandbreite des IF Links recht deutlich ausreizen könnte und so für die inter Core Kommunikation hinderlich sein könnte. Bekommt jedes DIE einen eigenen Speicher Kanal hätte jedes DIE die Möglichkeit direkt auf ein Speicher Modul zuzugreifen und jeder IF Link muss nur noch die Datenmenge eines Speicherkanals transportieren, womit Platz für anderweitige Kommunikation bliebe. Als Nachteil bliebe lediglich dass ein DIE nicht direkt auf 2 Speicher Kanäle zugreifen kann aber die Vorteile würden die Nachteile deutlich überwiegen.

Ned Flanders · 12. Juli 2018

@Wadenbeisser

im UMA Betriebsmodus liegen alle Daten verteilt vor. Da gibt es nur einen Teil eines jeden Speicherzugriffs lokal. Der Rest muss IMMER über die IF gehen. Da die gesamt Latenz aber vom langsamsten Teilnehmer bestimmt wird, ist es völlig wurscht ob nun ein Teil lokal liegt oder nicht.

In anderen Worten, die Latenz eines Dies mit direktem Zugriff auf einen IMC hat im UMA Modus die gleiche Gesamtlatenz wie ein Die ohne aktiven IMC.

Einen Vorteil hätte eine 4x1 IMC config nur im NUMA Mode über alle Kerne. Unter 2x2 + 2x0 wäre das halt asymmetrisch mit unklarem Ausgang. Da ist unter NUMA dann der Scheduler gefragt. Ich würde 4x1 ebenfalls favorisieren, wobei auch da der Scheduler gefragt wäre die Threads sinnvoll zu verteilen.

NUMA ist immer ein etwas schwieriges Konstrukt.

tolga9009 · 12. Juli 2018

rg88 schrieb:
Und die Workload einer Workstation ist halt nunmal komplett anders als bei einem typischen Server.
Man würde sich da also nicht wirklich selbst kanibalisieren, wenn man sowas anbieten würde. Die Frage ist, ob es den Aufwand wert ist, für so eine Nische Ressourcen zu verschwenden.

Nische? Wenn ich mir mal so angucke, was es alles auf dem Workstation Markt gibt, ist das alles andere als eine Nische. Im Enterprise-Markt (dazu zählen Workstations) wird das meiste Geld gemacht. Und Threadripper wäre in der Lage den kompletten Workstation Markt einmal auf den Kopf zu stellen.

~~Threadripper bietet sogar Support für Registered ECC RAM, stünde also einer Xeon Workstation mit Reg ECC, wie z.B. HP Z840 / Z8 oder Dell Precision 7820 in nichts nach.~~ Im Gegenteil: es würde sogar mehr PCIe-Lanes bieten (bei Single CPU). Es bietet dafür kein Remote Management ala Intel AMT, aber das "richtige" Remote Management wird eh von HP bzw. Dell mit iLO bzw. iDRAC realisiert. Leider scheinen die Mainboard Hersteller der Meinung zu sein, Threadripper sei eine Gaming CPU und rüsten die Mainboards entsprechend aus: RGB, keine ECC Validierung (und wenn, nur UDIMM), Bling Bling.

Dabei wäre Threadripper im Workstation Markt das Non-Plus Ultra - aber anscheinend haben Dell, HP und Supermicro (und AMD?) keine Lust drauf. Somit bleibt Threadripper weiterhin ein gutes Produkt für Konsumenten, Selbstständige, Freiberufler und Kleinunternehmen, aber keins für Großunternehmen.

rg88 · 12. Juli 2018

Nische deshalb, weil die Stückzahlen hier weitaus geringer sind als bei den Brot-und-Butter-Modellen.
Da wird in der Regel gekauft, was zB der Softwareanbieter als empfohlene Hardware angibt.
Sprich: geben die SW-Anbieter keine Empfehlung ab, wird dann beim Support wieder rumgezickt, also nimmt man die Intel-Workstation. Dadurch entsteht aber auch keine Markt für AMD-Workstations. Ergo prouzieren die PC-Hersteller auch keine AMD-WSs. Weil es diese nicht gibt, kann der SW-Anbieter auch keine empfehlen, selbst wenn er wollte.
Du verstehst, worauf ich hinaus will.
Wenn, dann muss der erste Schritt von den PC-Herstellern kommen, mit dem Risiko erstmal wenige bis keine zu verkaufen, bis sich dafür ein Markt entwickelt hat. Das Risiko geht wohl aktuell keiner ein, bzw. Die kosten werden gescheut. Dell hat sich dazu ja sehr eindeutig dazu geäußert. Insofern kann man eigentlich nur auf HP hoffen. Sie anderen werden dann mitziehen, wenn HP damit erfolg hätte

Wadenbeisser · 12. Juli 2018

@Ned Flanders
Das würde aber auch bedeuten das bei NUMA nur ein Teil des Speichers nutzbar wäre, nämlich der Teil der in den Speicher Modulen liegt die an eben jenem DIE angeschlossen sind.

Was die bessere Wahl wäre lässt sich ja bereits mit dem aktuellen Ripper simulieren.
Einfach 2 Speichermodule so stecken das sie einmal nur an einem DIE und das andere mal an beiden DIE hängen.
Mich würde jedenfalls nicht wundern wenn die 1:1 Config im Durchschnitt die bessere Wahl wäre.

tolga9009 · 12. Juli 2018

Ich denke, die Ursache liegt darin, dass Threadripper eigentlich garnicht geplant war, sondern als "Freizeit-Projekt" einiger AMD Ingenieure "zufällig" entstanden ist. Zum Launch von EPYC gab es praktisch zum Start entsprechende Produkte von Supermicro, HP hat kurze Zeit später den DL385 Gen10 nachgelegt und Dell kam dann fast ein halbes Jahr später mit ihren Modellen an. Bei TR konnte diese Zusammenarbeit, die lange vorher geplant werden muss, vermutlich nicht entstehen.

Ein Markt wird sich zwangsweise entwickeln, da auch z.B. EPYC heutzutage in einigen Anwendungsbereichen einen Kostenvorteil bietet. Je nachdem, was man braucht, lässt sich bei EPYC mit einem Sockel das realisieren, wo man mit Xeon 2 Sockel braucht. Auf Threadripper bezogen denke ich, dass spätestens ab Threadripper 7nm mit einer gewissen Reaktion gerechnet werden kann, da AMD voraussichtlich mit 7nm (zumindest vorrübergehend) die besseren Prozessoren anbieten wird, die auch der Enterprise-Markt haben will.

Und das Software-Problem denke ich wird sich mit der Zeit lösen, nachdem sich Zen mehr und mehr, sowohl im Server-, als auch im Konsumenten-Bereich etabiliert hat. Und falls Intel nicht wieder wettbewerbswidrige Strategien verfolgt, denke ich, dass wir ab Zen 2 mit einer steigenden Akzeptanz in beiden Bereichen rechnen dürfen.

peru3232 · 12. Juli 2018

tolga9009 schrieb:
Threadripper bietet sogar Support für Registered ECC RAM

gibt es da eine Quelle dafür? Die vermeintliche Nichtunterstützung von RDIMMs ist für mich nämlich derzeit der einzige Grund weswegen ich noch nicht von meiner XEON WS wechseln kann... (8x32GB RDIMM, die dann nutzlos wären)

Brrr · 12. Juli 2018

Whiskey Lake schrieb:
Verwechselst du da gerade CCX mit Die?

Ja, hatte vergessen, dass ein CCX "nur" 4 Cores hat und nicht 8.

tolga9009 · 12. Juli 2018

peru3232 schrieb:
gibt es da eine Quelle dafür? Die vermeintliche Nichtunterstützung von RDIMMs ist für mich nämlich derzeit der einzige Grund weswegen ich noch nicht von meiner XEON WS wechseln kann... (8x32GB RDIMM, die dann nutzlos wären)

Beim Raussuchen der Quelle ist mir aufgefallen, dass ich doch etwas zu schnell war

. Unter "Update 2" hatte AMD das vorher gesagte dementiert und klar gestellt, dass TR kein RDIMM unterstützt, sondern es EPYC Prozessoren vorenthalten bleibt.
Quelle: https://www.faceofit.com/reviews/best-ecc-ddr4-memory-amd-threadripper-1950x-1920-cpus/

Ned Flanders · 12. Juli 2018

peru3232 schrieb:
Die vermeintliche Nichtunterstützung von RDIMMs ist für mich nämlich derzeit der einzige Grund

Threadripper unterstützt ECC aber nur unbuffered. Registered wird afaik nur von Epyc und Xeon unterstützt.

Das ist das Hauptdifferenzierungsmerkmal (neben Octa Channel) Threadripper -- Epyc

peru3232 · 12. Juli 2018

Wäre auch stark verwundert darüber gewesen...
Wirklich schade - und ich denke, ich bin da auch nicht der einzige, der deswegen nicht bereit ist zu wechseln...
Da finde ich die Intel Lösung noch besser, also RDIMM aber ohne ECC, damit können wenigstens die Module weiter verwendet werden (und auch wenn benötigt mehr Speicher verwendet werden!)
Vermute AMD lässt sich da einiges an Kundschaft entgehen

EPYC ist ja aus 2 Gründen keine Option: A) es gibt schlicht und ergreifend kein einziges WS-Board, nur Server - und B) der natürlich eingeschränkte Takt

Ebrithil · 12. Juli 2018

Ned Flanders schrieb:
Threadripper unterstützt ECC aber nur unbuffered. Registered wird afaik nur von Epyc und Xeon unterstützt.

Mal so als nicht ECC Experte, was genau ist der Unterschied zwischen Registered und Unbuffered ECC?

peru3232 · 12. Juli 2018

Ned Flanders schrieb:
Threadripper unterstützt ECC aber nur unbuffered. Registered wird afaik nur von Epyc und Xeon unterstützt.

Auch die 2066er zumindest mit älterer FW haben offizielle RDIMM Unterstützung (aber ohne ECC-Möglichkeit)

Ned Flanders · 12. Juli 2018

@peru3232

Was genau fehlt Dir denn?

B) ist natürlich ein Problem.

Ebrithil schrieb:
Mal so als nicht ECC Experte, was genau ist der Unterschied zwischen Registered und Unbuffered ECC?

Lies dazu am besten mal die einschlägigen Wikis. Die Unterscheide sind relativ umfangreich.

peru3232 · 12. Juli 2018

@Ned Flanders
Als WS Board:
Neben dem sicherlich viel zu eingeschränkten BIOS Optionen, zumindest USB 3.1, zuwenig normale USB Anschlüsse, kein Sound, vermutlich rudimentäre Lüftersteuerung(da für Server Lautstärke irrelevant), nur 1 m.2 ...

News AMD: 32-Kern-Threadripper mit 250 Watt TDP ab 13. August

Lieutenant

Fleet Admiral

Wadenbeisser

Gast

Banned

Fleet Admiral

Wadenbeisser

Gast

Fleet Admiral

Cadet 4th Year

Fleet Admiral

Wadenbeisser

Gast

Cadet 4th Year

Lieutenant

Lt. Commander Pro

Cadet 4th Year

Fleet Admiral

Lieutenant

Lieutenant

Lieutenant

Fleet Admiral

Lieutenant

Passend zum Thema