News Ryzen Threadripper 2000: AMD kontert Intels 28-Kerner mit 32 Kernen

Cool Master schrieb:
Sollte mit schnellerem RAM aber wieder etwas reingeholt werden. Es ist ja nicht neu, dass AMD schnellen RAM liebt vor allem schnelle Timings.
Der neue Speicherkontroller soll wohl 3200er RAM unterstützen.
 
Das klingt alles sehr verlockend. Kann man nur hoffen, dass dieser AMD-Zug noch ein Weilchen sprintet. Und ich nehme jeden zusätzlichen Kern zum günstigen Preis beinahe mit Kusshand :) Keine Ahnung, was so viele hier wieder meckern wegen ihren scheiß Spielen, die trotz Meckerei absolut flüssig laufen :D
 
  • Gefällt mir
Reaktionen: Excel und Hatsune_Miku
@Krautmaster
Meinst du nicht dass weitere CCX Blöcke nicht kontraproduktiv wären?
IF wird ja als Punkt zu Punkt Verbindung genutzt und entweder müsste man innerhalb des DIE bereits über mehrere CCX Module hinweg kommunizieren, wodurch die Latenz den Bach runter geht, oder mit 4 CCX Blöcken über einen Verbund wie bei der DIE Verbindung arbeiten, wodurch man 3x so viele IF Controller pro CCX benötigen würde.
Ich halte das für sehr kontraproduktiv und erheblich aufwändiger als den CCX Block von 4 auf 6 oder gar 8 Kernen zu erweitern.
 
Interessant wird auch sein, ob AMD den 16-Kern Threadripper in zwei Varianten rausbringen wird.

Einmal in der bekannten 8+0+8+0 Konfiguration, und vielleicht einmal als 4+4+4+4 mit doppeltem L3-Cache? Darüber würden sich die Kryptominer freuen.
 
Intressanter waer, ob das OS mitbekommt welcher Core nicht direkt auf den Speicher zugreifen kann und hoehere Latenzen hat.
Und vor allem Prozesse mit wenig Speicherverbrauch und Durchsatz dorthin legt, und die anderen Prozesse bevorzugt auf direkt angebundene Cores.
 
HardRockDude schrieb:
Das klingt alles sehr verlockend. Kann man nur hoffen, dass dieser AMD-Zug noch ein Weilchen sprintet. Und ich nehme jeden zusätzlichen Kern zum günstigen Preis beinahe mit Kusshand :) Keine Ahnung, was so viele hier wieder meckern wegen ihren scheiß Spielen, die trotz Meckerei absolut flüssig laufen :D
Beim Bulli war es wegen der deutlich geringeren Einzelkern Leistung ärgerlich wenn da nur ein Bruchteil der Kerne vom Spiel genutzt wurden, da dann das Spiel schneller ins CPU Limit rannte wärend die anderen Kerne sich langweilten.
Durch die wieder vergleichbare IPC und dem besseren CPU Support bei den neuen APIs (Vulkan, DX12, Mantle) hat sich die Lage aber deutlich entspannt.
 
Krautmaster schrieb:
ich denke beides ist möglich. Ich weiß nicht mehr ob AMD von 48 oder 64 Kernen geredet hat. Einfacher dürfte sein ein weiteres 4er CCX mit an den gemeinsamen L3 zu hängen (oder?). Ggf sogar 4. Also eine 16C Die und in der Mitte einen vllt doppelt so großen L3.

Früher oder später kommt man aber wieder zu dem Problem dass man viele Kerne auf einer Die möglichst fix ansprechen muss. Bei 16C auf einem Zen 2 Die geht das vllt noch gut (ggf sogar über Ring wie Intel damals) aber denke Zen3 wird schon was das angeht ggf bei der Architektur und der Kommunikation der Kerne untereinander wieder etwas anders machen müssen (wenn man von einem weiteren Shrink ausgeht).

Ich halte mehr als 4 CCX auf einem Package für technisch unmöglich, da ich mir beim besten Willen nicht die "Verdrahtung" von mehr als 4 CCX per INF zur Kommunikation vorstellen kann bzw., da ich keine Lösung sehe, dass alle untereinander verdrahtet sind.
Insoweit geht es nur über das aufbohren der CCX, wobei 8 Kerne (Ringbus) auch hier eine technische Grenze darstellen, denn bei größeren CCX müßte man erstmal eine gescheite und schnelle Komminikation von mehr als 8 Kernen im CCX entwickeln.
 
  • Gefällt mir
Reaktionen: yummycandy
Krautmaster schrieb:
... Wirklich auslasten kann ich 36 Threads nur mit FFMPEG und Handbrake, und das auch nur bei 4K Exporten.
Geht x264 bei 36 threads? Ich hatte Probleme mit 2 Numa Knoten. Aber threads mässig sind 18vs 36 threads wirklich doppelt so schnell?

Brrr schrieb:
Oh sehr schön, dann liesse sich damit bald so etwas umsetzen:
Dazu bitte eine Nvidia GRID Graka... Oder Nvidia erlaubt endlich multiple User auf Home Grakas (hahahahaha nope -.-).
Dann könnte man 2x 1080ti für SLI reinstecken. Und wenn Kollegen für ne LAN vorbei kommen braucht man nur noch nen Laptop und hat volle Leistung.
 
Wadenbeisser schrieb:
@Krautmaster
Meinst du nicht dass weitere CCX Blöcke nicht kontraproduktiv wären?
IF wird ja als Punkt zu Punkt Verbindung genutzt und entweder müsste man innerhalb des DIE bereits über mehrere CCX Module hinweg kommunizieren, wodurch die Latenz den Bach runter geht, oder mit 4 CCX Blöcken über einen Verbund wie bei der DIE Verbindung arbeiten, wodurch man 3x so viele IF Controller pro CCX benötigen würde.
Ich halte das für sehr kontraproduktiv und erheblich aufwändiger als den CCX Block von 4 auf 6 oder gar 8 Kernen zu erweitern.

Jeder Zeppelin DIE besitzt 4 Punkte für die IF, außerdem kann IF auch als Mesh benutzt werden (siehe VEGA).

900px-amd_zeppelin_basic_block_4-dies.svg.png


https://en.wikichip.org/wiki/amd/infinity_fabric
 
@Wadenbeisser

ka da bin ich jetzt fachlich nicht weit genug drin. Wenn man 4 Kerne in einem CCX hab brauch ich (n(n-1))/ 2 Verbindungen oder? Bei 4 Kernen also 4*3 / 2 = 6. (wie auch bei den Die eines TR mit 4 Die).
Bei 8 Kernen sind das 8*7 / 2 = 28. Dass is schon ne Ecke komplexer als 6 Interconnects.

Im Prinzip ist die Frage ob man das auf Unterster Ebene (als Kern zu Kern) realisiert oder auf der Eben wie aktuell von CCX zu CCX also über den L3.

:) interessant ist es alle mal.

Haldi schrieb:
Geht x264 bei 36 threads? Ich hatte Probleme mit 2 Numa Knoten. Aber threads mässig sind 18vs 36 threads wirklich doppelt so schnell?

Ich meine schon. Wenn ich mit FFMPEG nen 2h Clip in 4K kleinrechte geht das mit durchweg 100%. HEVC auf jeden Fall.

Wie da parallelisiert wird ka. Kann ja durchaus sein dass man irgendwann hingeht und nicht nur das Bild zerlegt sondern auch den Film an sich, also wenn ich zb aus 2h Filmlänge dann 2x1h mache und die parallel kleinrechne / analysiere. Je nach eingesetzter Methode halt. Constant Quality sollte das an sich kein Problem sein.

Aber 100% Auslastung geht wie gesagt recht einfach. Bei 1080p Streifen nach HEVC ist man nahe dran, da wandle ich aber 2 parallel.

yummycandy schrieb:
Jeder Zeppelin DIE besitzt 4 Punkte für die IF, außerdem kann IF auch als Mesh benutzt werden (siehe VEGA).

Danke. Ja ich hatte mir schon gedacht dass das Prinzipiell auch als Mesh gehen müsste. Die Frage ist wie performant. Im Prinzip ist IF erstmal ein Name. Wie das dann konkret realisiert wird hängt ganz vom Einsatzgebiet ab. Ob zb ein breiter Bus, oder eher schlank mit hohem Takt oder auf bestehendem Standard wie PCIe 4.0.
DMI usw ist ja auch nicht wirklich was anderes als PCIe, genauso AMDs Chipsatzanbindung.
 
Zuletzt bearbeitet:
Kaleo Meow schrieb:
möchte auch gerne mal 32 kerne und noch viel mehr, im privaten bereich benutzen.
bisher konnte ich das aber nie, weil mir das einfach viiiiiiiel zu teuer war! >.<
Seit Epyc ist das nicht mehr soo teuer.

Der 16-Kern 1950X und Mainboard waren bei AMD ja schon seit einem Jahr zu vernünftigen Preisen zu haben (aktuell ca. 850€ + 300€ ~ 1150€).
Bei Epyc ist die günstigste Möglichkeit ein 32-Kern-System zu bauen ein Dual-7281 + Supermicro H11DSi (2*680€ + 500€ ~ 1840€) was teurer ist, aber nicht um Größenordnungen.

Wenn man das damit vergleicht, was man noch vor einem Jahr für einen Intel 6900K oder gar 6950X gezahlt hat, ist das fantastisch günstig.
 
  • Gefällt mir
Reaktionen: Unnu
motul300 schrieb:
mit dem neuen Prozess von Globalfoundies wird Die-Fläche mehr als halbiert was sollen sie sonst machen als mehr Kerne auf einen Zeppelin-Die zu klatschen
klar kann man die Kerne noch etwas ausbauen und das werden sie auch tun
aber weiterhin auf nur 8 Kerne zu setzen es macht nicht unbedingt sinn
auch deutlich kleinere Zeppelin-Dies herzustellen spart jetzt noch sooo viel Geld
Gut das macht natürlich auch Sinn, wäre halt die Frage ob sie 8 Kerne drauf packen können die ungefähr so groß sind wie die jetzigen 4 und sie kaum Ausschuss damit haben, das würde dann schon einschlagen wie eine Bombe :)
 
  • Gefällt mir
Reaktionen: DonL_
Krautmaster schrieb:
kommt drauf an was man mit Videobearbeitung meinst.
Habe ich doch zu Anfang des Threads geschrieben: Blu-rays von optischem Medium auf Festplatte rippen und dabei ggf. etwas die Datenrate schrumpfen.
 
6 Kerne pro CCX bei 7 nm wird gemunkelt, aber noch keine offizielle Bestätigung.

Das wären dann maximal 6 Kerne in den APUs, 12 im Ryzen, 48 in Threadripper/Epyc.
 
@yummycandy
Es ging aber nicht um die externe Kommunikation vom DIE sondern um die interne Kommunikation zwischen den CCX.
2 CCX kannst du direkt mit je einem IF Link verbinden, bei 4 CCX pro DIE bräuchte man pro CCX bereits 3 IF Links für die direkte Kommunikation, siehe die Verbindung zwischen den 4 DIE auf dem Träger der CPU.
Der Kommunikationsaufwand (Overhead Verlußte) und der Platzbedarf der internen Schnittstellen würde meiner Meinung nach übermäßig zunehmen und wäre in meinen Augen auch nicht wirklich sinnvoll.
 
Das freut mich grad richtig. Was werden die Leute mit Zen+ weinen, wenn nächstes Jahr AM4 mit 16 Kernen kommen sollte. Dank AMD verdoppeln sich die Kerne bzw. die Effizienz. Das alleine gleicht schon die hohen Kosten für den Arbeitsspeicher aus. Bei soviel Entwicklung derzeit, ist da richtig Spannung drin. Ein Krimi ist da nichts dagegen^^.
 
Mich würde tatsächlich mal der Idle-Verbrauch interessieren, da die meisten Server ja Idlen ohne Ende. Man wird ja vermutlich die Cores nicht ganz abschalten können, daher wird da selbst im Idle was zusammen kommen...

Ich würde mir solche CPUs ja als Standard im Desktop wünschen und bereits mit Games / Software die mit so vielen Kernen skaliert. Da werde/n ich/wir aber noch lange warten müssen...
Die Entwicklung ist schon gut, es wird auch immer effizienter, dennoch ist insgesamt gesehen so ein System nach wie vor ein Stromfresser, auch wenn die Leistung im Vergleich zu Vorgänger wieder steigt. Erinnert mich irgendwie an Smartphones, da steigt auch jährlich die Leistung, aber der Akku hält nicht wirklich länger durch, da die Verbesserungen in Effizienz meist so genutzt werden, dass mehr Leistung möglich ist, aber nicht wesentlich mehr Laufzeit... bin mal gespannt, wann es da nen Durchbruch gibt. Im mobilen Bereich stört mich das aber bedeutend mehr, als bei einem Server :D
 
hippiemanuide schrieb:
Ernsthaft? Nun gibt man sich den "Core"-Battle? :freak: Warum nutzt man nun nicht die Chance und baut die Effizienz aus? Besser im Singletakt sein etc... Ich meine 32 Core sind nett wenn man die richtigen Anwendungen nutzt im Pro-Bereich. Aber zum Daddel, Streamen und im privaten eher nicht so sinnvoll.
:D Warum nicht einen 10 Core 20 Thread von AMD, welcher den 28 Kernen von Intel alt aussehen lässt?

Naja, schließlich gibt es bereits 8C/16T für Desktop bei AMD. Und das seit zwei Generationen. Nur kann Intel das halt auch. i9 lässt grüßen.
 
Der Hammer, bin begeistert. Ich hock hier noch mit meiner 4 Core-Plattform herum und die reicht mir für viele Anwendungen nicht aus. War aber abzusehen, der 28 Kerner von Intel musste überboten werden. ^^
 
Zurück
Oben