News Ryzen Threadripper 2000: AMD kontert Intels 28-Kerner mit 32 Kernen

XTR³M³ schrieb:
wenn der TR+ sich so gut undervolten lässt wie die kleinen brüder, sollten bei 4.2GHz allcore unter 380W möglich sein. :)
Mit UV geht sicherlich noch mehr aber ich wollte das eh nur grob abschätzen. :)

onkas schrieb:
Vor 15 Monaten war noch die Aussage hier, niemand braucht mehr als 4C, Ryzen mit seinen 8c ist doch überdimensioniert, niemand braucht Cores, wir brauchen Single Core und hier reichen 4 Cores. Heute wird geschrien, ach so ein 8C Intel 5GHZ wäre schon was feines. Niemand redet mehr vom 7700K - auch der 8700K interessiert nur noch Hardcore FPS Sammler. Alle anderen freuen sich über mehr Power.. :-)
Und/oder eine längere Nutzungszeit durch die bei späterer Software zusätzlich genutzten aber schon vorhandenen Kerne. :)
 
Baal Netbeck schrieb:
Es sieht so ais als würden zwei der Dies mit dem Ram kommunizieren und die anderen beiden dies müssen über den IF Umweg darauf zugreifen.

das ist heute schon ständig so der Fall. Wenn der Kern eines anderes Die auf eine Speicheradresse zugreifen will die zufällig in einem DIMM an einer anderen Die legt dann muss er über diese Die und damit L3, IF, L3, DIMM gehen. Ganz normal. Daran ändert das weglassen von zwei SI Controllern erstmal wenig bzw nichts.
 
WOW. Gut gekontert AMD!
Als Intel den 28kerner vorgestellt hat, habe ich im Grunde mit den 32kernigen Konter gerechnet.
Aber jetzt wo es sogar offiziell bestätigt wurde finde ich das echt klasse.

Obwohl ich mich nicht unbedingt zur Zielgruppe des 32Kerners zähle.
Noch nicht....

Ich wünsche mir im Grunde die eierlegende Wollmichsau.
Vielleicht später mal einen 16kerner mit 8 schnellen spieltaugliche Kernen zum Daddeln und den rest für hungrige Anwendungen.
 
Zuletzt bearbeitet:
Krautmaster schrieb:
Wenn der Kern eines anderes Die auf eine Speicheradresse zugreifen will die zufällig in einem DIMM an einer anderen Die legt, dann....

Man kann die Dinger aber auch NUMA betreiben... Dann passiert sowas seltener. Naja, Schauen wir mal. Wenn der Scheduler des OS schlau genug ist, belegt er zuerst die Kerne die lokalen RAM haben. Zumindest wenn diese NUMA betrieben sind.
 
borizb schrieb:
Ein paar wesentliche Fakten fehlen in deinem Beitrag:

Intel hat den laufenden Chip bereits demonstriert und baut das Teil seit fast einem Jahr
für eine andere ihrer Platformen als Xeon Platinum 8176. Und offensichtlich hat der
Schritt von 3647 auf 2066 ja ziemlich gut funktioniert, denn:

Intels 28Kerner läuft mit 5GHz auf allen Kernen - keine AMD CPU kann das ohne OC. Man
kann mal ne dumme Leute Rechung machen, die aber im CPU Limit funktioniert: 28x 5GHz
= 140 während 32x 4,2GHz (ausgehend vom Epyc 7601 2017) nur 134,4 sind - bestenfalls.
Dass mehr Kerne nicht in jedem Szenario besser sind, ist kein Geheimnis. Bei jedem Szena-
rio, bei also dem nicht alle Kerne genutzt werden, ist AMD warscheinlich immer Nachteil.


Ich finde solche Aussagen völlig nutzlos, weil sie den einfachen Umstand ignorieren,
dass mit jedem Hz mehr die Performance pro Watt schmäler wird. Wenn man das
normiert, wird man leicht erkennen können, das Intel auch hier die Nase vorne hat.
Vergleichs doch mal mit dem 8700T, der braucht weniger Saft als ein Ryzen 5 2600X
bei mehr GHz im Turbo und gleich viel Kernen. Es kommt immer auf die Optimierung an.

*hust*

131460_upload_2018-6-5_16-6-29.png


Wieviel bleibt noch bei Standard Kühlung davon übrig und was ist mit den ~8% Leistungverlust (nach Intel) durch Spectre NG Patches?

Wir müssen halt abwarten, Fakt ist, es ist endlich wieder spannend und interessant geworden und das haben wir nicht Intel zu verdanken. ;)



Viele Grüße,
stolpi
 
  • Gefällt mir
Reaktionen: ottoman und Fragger911
@Krautmaster Jein, das ist zwar teilweise notwendig, aber Software kann auch so ausgelegt werden, dass Zugriffe auf fremde NUMA-Knoten minimiert werden. Einfachstes Beispiel wären zwei Programme, die parallel auf zwei Dies laufen, und jeweils den Speicher, mit dem sich arbeiten, direkt "vor der Nase" haben.

Mit dem Aufbau von TR2000 muss aber die Hälfte der Kerne immer einen "Hop" zu anderen Knoten durchführen. Es ist also absolut nicht davon auszugehen, dass man so die doppelte Leistung eines 1950X erreicht (jedenfalls nicht bei "memory-bound" Anwendungen)
 
DonL_ schrieb:
Zeige mir bitte den Epyc Prozesser, der mehr als 4 CCX auf dem Package hat?!
Ein CCX ist nicht das was du meinst. Du sprichst von einem Verbund aus 2 CCX.
Ein Zeppelin DIE (Summit Ridge ) besteht aus 2 CCX während Raven Ridge 1x CCX + Vega hat. Nachdem TR aus 2 Zeppelin DIE besteht hat es also wieviele CCX? Und wie gehts weiter mit Epyc mit 4 DIE? Siehste, geht doch :)
 
MK one schrieb:
...so ist es nur eine Frage der Latenzen und der Ansteuerung , erst die 16 Cores die direkten Zugriff auf den Speicher haben , ...

Beim bisherigen Threadripper mit 2 Zeppelin-DIE ist es doch auch schon so, dass die halbe Zeit bei allen Speicherzugriffen der andere Zeppelin-DIE die Informationen in seinem Speicherbereich hat, die der erste Zeppelin-DIE benötigt. Der kann dann eben auch nicht sofort darauf zugreifen. Der gesamte Hauptspeicher dürfte in kleine Segmente verschachtelt, auf die 4 Speicherkanäle gleichmäßig verteilt sein. Keine CPU kann ein Programm in nur "ihrem Speicherbereich" ausführen, aber der L3-Cache hilft ja hier etwas, die hohen Latenzen beim Zugriff meistens abzufangen.
 
DonL_ schrieb:
Zeige mir bitte den Epyc Prozesser, der mehr als 4 CCX auf dem Package hat?!
https://geizhals.eu/amd-epyc-7551p-ps755pbdafwof-a1759992.html

es gibt nur 2 x Epyc Systeme mit 64 Cores, dass sind aber 2 X CPUs auf einem Mainbord!
Ja, das sidn dann sogar 16 CCX auf einem Mainboard, aufgeteilt auf 2 Packages/Sockel.

Alle Epyc Prozessoren sehen genauso aus, wie TR2 auf den Bildern mit 4 CCX!
Meinst du das Bild, auf dem man 8 CCX sieht?
Aufgeteilt über 4 Dice?

stolperstein schrieb:
Meint Intel das eigentlich ernst?
Glauben die, Fachleute erkennen nicht, sie sie da verarscht werden?

HITCHER_I schrieb:
eine CPU kann ein Programm in nur "ihrem Speicherbereich" ausführen, aber der L3-Cache hilft ja hier etwas, die hohen Latenzen beim Zugriff meistens abzufangen.
Warum soll das nicht gehen?
 
Unwahrscheinlich, sehr unwahrscheinlich, dass AMD mit 32 Kernen schneller ist als Intel mit 28...
 
onkas schrieb:
Niemand redet mehr vom 7700K - auch der 8700K interessiert nur noch Hardcore FPS Sammler. Alle anderen freuen sich über mehr Power.. :-)

Ja- Der gemeine Spieler kann sich dann riesig über seine "Power" freuen, mit 16 Kern Prozessoren. Hat aber dafür bei dem, was er gerne tut (spielen) schlechtere Frametimes und niedrigere FPS als mit dem 4 Kerner, über den keiner mehr redet... Schonmal die aktuellen CPU Ratings bei Spielen angeschaut? Schonmal gesehen, wo da ein 7700K (der ja nun plötzlich wohl nichts mehr kann) steht?

Die Multikernprozessoren bieten nur in einem verschwindend geringen Teil der vorhandenen Anwendersoftware tatsächlich Geschwindigkeitsvorteile. (Dort wo es um Rendering und massives Computing geht).
Im überwigenden Teil der Anwendungspakete sind die niedriger getakteten Multicore- CPUs teils deutlich im Nachteil.

Also bitte immer die Realitäten bzw. Anwendungsszenarien im Auge behalten.
Ich finde es immer befremdlich, dass gewisse User, wenn es um dieses Thema geht plötzlich 300 Tabs im Browser offen haben müssen, nebenbei 5 Videos rendern, dabei Youtube laufen haben und noch zocken, zeitgleich streamen, MP3 hören, Teamspeak betreiben und zudem davon ausgehen, dass das alle User so handhaben ;)

Noch befremdlicher finde ich, dass diese Klientel nicht versteht, dass das alles ein Prozessor mit einem Core, entsprechender IPC und Takt auch tun könnte....
Multicore bleibt eine Notlösung deren Grenznutzen mit steigender Anzahl immer niedriger wird.

Grüße
Zero
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: vlim
Tobi86 schrieb:
Unwahrscheinlich, sehr unwahrscheinlich, dass AMD mit 32 Kernen schneller ist als Intel mit 28...
Sehr unwahrscheinlich, dass mit so einer allgemeinen Aussage etwas Sinnvolles beschrieben werden kann.
Der Anwendungsfall lässt grüßen! :daumen:
 
  • Gefällt mir
Reaktionen: Fragger911, engramm, msv und 4 andere
HITCHER_I schrieb:
Keine CPU kann ein Programm in nur "ihrem Speicherbereich" ausführen, aber der L3-Cache hilft ja hier etwas, die hohen Latenzen beim Zugriff meistens abzufangen.

deswegen kann man den L3 von SLX und TR / Epyc auch nicht vergleichen. Der L3 Cache der einzelnen Zeppelin Die agiert erstmal für sich. Der Zugriff über IF auf den L3 / Speicher des anderen Die ist natürlich weit langsamer als im selben Die. Deswegen hat TR / Epyc vor allem da seine Stärken wo jeder Task / Thread unabh voneinander seinen kleinen Speicherbereich benötigt und abarbeiten kann, ohne viel "Zusammenarbeit" der Kerne. Cinebench / Rendering ist da zB ein Musterbeispiel. Datenbanken wohl eher ein Negativbeispiel.

Deswegen kommts gerade bei so CPU schon sehr drauf an seinen Use Case zu kennen. genau wie AVX. Da ist zB ein SLX Kern auch Längen schneller als ein Zen Kern. Virtualisierung mit vielen VMs dürfte aber Epyc auch super liegen.
 
Krautmaster schrieb:
Intel hätte da von Anfang an den Server Sockel für HEDT hernehmen müssen, aber 6Ch Ram und >3600 Pins sind eben heftig unwirtschaftlich. Auch weiß ich garnicht ob Intel im Server Umfeld das kleinere Silizium für zb 16C CPu auf LGA 3647 hernimmt oder ob das immer die teure XCC mit Cut down ist.
Denke aber schon dass das mit dem HCC Silizium gehen sollte, ging bei Kaby Lake ja auch und immerhin haben alle Die drüber dasselbe Mesh und alles.

Auch im Server-Bereich gibt es XCC (20 - 28 Kerne), HCC (12 - 18 Kerne) und LCC (bis 10 Kerne). Es gibt aber ein paar Besonderheiten bei den optimierten SKUs. So sind z.B. die Gold 6134/6144 abgespeckte HCC, obwohl sie nur 8 Kerne haben.

Bei manchen Modellen könnte das sogar richtig krank sein. So ist vermutlich selbst der Platinum 8156 mit 4 Kernen eigentlich ein 28C-XCC, da volle 8-Sockel-Kompatibitlität gegeben ist.
 
HITCHER_I schrieb:
Intel hat ja schon AVX-512 integriert in ihren Skylake-X, AMD aber noch nicht in ZEN 2000, das dürfte den Ausschlag geben, in Benchmarks wie Cinebench 15 zB.
wüsste nicht das CB15 irgendwas mit AVX am Hut hat? Ist dem so?

Simon schrieb:
Bei manchen Modellen könnte das sogar richtig krank sein. So ist vermutlich selbst der Platinum 8156 mit 4 Kernen eigentlich ein 28C-XCC, da volle 8-Sockel-Kompatibitlität gegeben ist.

ja, das braucht es im Consumer Umfeld aber nicht. Aber wie ich sehe gibt es mit dem Gold 6134/6144 dann also zumindest das HCC schon auf dem LGA3647, also ist das Material prinzipiell da. Danke für die Info.
 
Krautmaster schrieb:
da is mein Workflow leider ein anderer. ...
Was wäre denn der smartere Weg? :)

Achso, ich drueck nach dem Bearbeiten einfach 5. Damit hats eine 5er Wertung. Und wenn ich fertig bin lasse ich in der Uebersicht einfach nur Bilder mit 5er Wertung anzeigen. Markiere alle und exportiere dann.
 
  • Gefällt mir
Reaktionen: Krautmaster
Zurück
Oben