News Skylake-SP: Der Ringbus ist tot, es lebe das Mesh

Skylake-X hat Mesh, die Dies sind die gleichen wie bei Skylake-SP. Dies sollte gegenüber den CCX von AMD eben immer dann besonder punkten können, wenn deren CCX Architektur eben nicht "kaum oder nur geringe Einbußen" hat. Wie gut es das macht, auch im Vergleich zu den alten Ringbussen, wird man erst anhand entsprechender Test in den Reviews sehen können. Die beiden bisher veröffentlichten Reviews sind ja noch sehr dünn und Performance leider offensichtlich noch sehr unter dem frühen Entwicklungsstadium des BIOS, daraus kann man noch keine wirklich sicheren Schlüsse ziehen.

Vermutlich hängt es auch noch von der Anzahl der Kerne ab, der Effekt dürfte umso große sein, je macht native Kerne ein Die hat und womöglich sind Ringbusse bei den CPUs mit wenigen Kernen sogar im Vorteil.
 
Ich habe absichtlich kaum oder geringe Einbußen geschrieben. Da mir bisher kein eindeutiger Anwendungsfall bekannt ist (heißt nicht das es ihn nicht gibt unter gewissen Voraussetzungen), indem CCX starke Einbußen in der Performance gezeigt hat. Die meisten waren sich ja sicher, dass CCX wenn überhaupt nur in Spielen zu Einbußen führen könnte, dahingehend gab es ja Benchmarks die die Performance zwischen z. B. 4 Kerne im eigenen CCX gegen 2+2 Kerne gestellt haben. PCGH war es glaub ich die diesen Test durchgeführt haben und auch sie haben, selbst mit nur 2400er DDR, in ihrem Parcours nur minimale Unterschiede zwischen den beiden Testszenarien feststellen können. (2-3 % Unterschied)
 
Ringbusse sind immer schneller als alles andere solange es um weige teilnehmer (Kerne) geht. Daher wird AMDs CCX bei der geringen Kernzahl (4+4 ist nun mal wirklich nicht viel) als Untetlegen empfunden. Doch Ringbusse, wie Intel das jetzt selbst merkt skalieren schlecht. Mit immer mehr Kernen bedarf Interconnect innovative Lösungen. Intel bleibt keine andere Wahl als Ringbus abzulösen. Und ich glaube hier setzten sie vielleicht auf den falschen Pferd. Bei manycores wird AMDs CCX Lösung wahrscheinlich dem mesh netz haushoch überlegen sein.
 
Zuletzt bearbeitet:
Bei letzerem wäre ich mir nicht so sicher, da die Mesh viele parallele Routen bieten, AMD aber viele Kerne nur als MCM realisiert und da ist die große Frage wie hoch die Bandbreite und die Latenz der Verbindungen zwischen diesen Dies sind, auch Imposer die sehr viel Verbindungen ermöglichen würden, wird ja offenbar verzichtet.
 
warten wir mal ab was passiert wenn der Naples Nachfolger Starship kommt , nen 48 Core / 96 Thread Monster in 7 Nm

das dauert gar nicht mal sooo lang mitte- ende 2018 vermute ich mal , wenn GF weiter so gute Meldungen verbreitet





http://www.pcgameshardware.de/CPU-Hardware-154106/News/Globalfoundries-7-nm-7LP-AMD-Navi-Zen-2-1230767/

Nachdem Globalfoundries bei der 14-nm-Generation Samsungs 14LPP (14 nm FinFET Low Power Plus) lizenziert hat, entwickelt der Auftragsfertiger im Bereich von 7 nm wieder eigene Prozesse. Für den PC-Bereich wird 7LP interessant, das selbstbewusst für 7 nm FinFET Leading Performance steht. Laut einer kürzlich verschickten Pressemitteilung befinde sich Globalfoundries bei der Entwicklung im Zeitplan, die Performance-Erwartungen seien sogar übertroffen worden.

Initial wirbt Globalfoundries mit einer Leistungssteigerung von mindestens 40 Prozent gegenüber 14LPP oder einer Reduzierung der Leistungsaufnahme um 60 Prozent.


die Aussage über die Leistungssteigerung stammt übrigens nicht von AMD ..
Anhang anzeigen 628564
https://techreport.com/news/32110/globalfoundries-fires-up-its-7-nm-leading-performance-forges

Das sind gute Nachrichten für Zen2 und Navi
 
Erstmal schauen wie EPYC performt und dann schauen was Intel dann hat, wenn dessen Nachfolger rauskommt, denn auch bei Intel herrscht ja kein Stillstand, auch nicht bei der Fertigung und Intel wird 2018 das Angebot an 10nm CPUs in die Breite ziehen. Die nm Namen der Prozesse alleine sagen wenig aus und die Fertigung ist nur ein Teil der die Eigenschaften von CPUs bestimmt. Wichtig wird es z.B. auch sein, wie hoch man mit der jeweiligen Fertigung bzgl. des Taktes kommt, also ab welcher Frequenz die benötigte Spannung und damit die Verlustleistung so massiv steigen, dass es überhaupt nicht mehr sinnvoll oder gar möglich ist CPUs in dem Bereich zu betreiben, von Extrem-OC abgesehen.

Gerade die neuesten Intel CPUs Kaby Lake und Skylake-X zeigen dort die Fortschritte die Intel bei den Entwicklungsstufen seiner 14nm genannten Prozesse gemacht hat, da muss GF nun auch mal nachziehen. Aber mit dem Thema Mesh hat das nun wirklich nichts mehr zu tun!
 
Aldaric87 schrieb:
Ich habe absichtlich kaum oder geringe Einbußen geschrieben. Da mir bisher kein eindeutiger Anwendungsfall bekannt ist (heißt nicht das es ihn nicht gibt unter gewissen Voraussetzungen), indem CCX starke Einbußen in der Performance gezeigt hat.

Auffällig ist z.B. dass Ryzen bei Echtzeit-Audioanwendungen (DAWs wie Cubase, Ableton, Reaper, Fruity Loops, usw) überproportional starke Performance-Einbrüche zeigt, wenn mit niedrigen Latenzen gearbeitet wird. Das heißt, je kleiner die gewählte Latenz, umso kürzer sind die Zeitabschnitte die für die Berechnung des Audiosignals zur Verfügung steht. Das Audiosignal wird dabei auf zig Spuren (tw. weit über 100) mit jeweils etlichen in Reihe geschalteten PlugIns berechnet, so dass von denen insgesamt schnell 4stellige Zahlen zustande kommen, die alle innerhalb eines Zeitabschnitts berechnet werden müssen. Mit kleineren Zeitabschnitten steigt natürlich der Overhead, d.h. der Druck auf Cache und Memory nehmen zu und die Threads werden häufiger durchgewechselt und es bleibt weniger Rechenzeit für die Berechnung der daten an sich.
Nach allen Tests die ich diesbezüglich verfolgt habe, kann Ryzen seine Rohleistung ziemlich gut umsetzen, wenn dieser Berechnungszyklus z.B. nur 100x pro Sekunde erfolgt. Während die Leistung im Vergleich zu sämtlichen Core iX aller Generationen überproportional einbricht, wenn der Berechnungszyklus bei niedrigen Latenzen 500-1000x erfolgt. Da sind dann nicht so hohe Plugin-Zahlen möglich, wie man eigentlich erwarten würde bevor es zu Dropouts kommt.
Interessant ist, dass damals mit Einführung der Nehalems (IMC, Ringbus, usw.) diese CPUs im Vergleich zu den älteren Core2 CPUs im Niedriglatenzbereich deutlich besser performten. Die damaligen AMD Phenom II CPUs konnten ihre (sowieso schon geringere) Rohleistung ebenfalls bei niedrigen Latenzen schlechter umsetzen.
Was das Niedriglatenzverhalten angeht bin ich wirklich gespannt, wie sich sowohl Threadripper als auch Skylake-X in Vergleich zu den bisherigen Modellen schlagen. Ich denke das wird sehr aufschlußreich...
 
Ähem, Leute, freut euch doch einfach darüber, dass Intel was Neues und besseres herausgebracht hat. Und das haben sie im Grunde schon lange geplant (so eine Entwicklung macht man nicht eben innerhalb von Wochen), nur bis lange erschien es ihnen nicht nötig, es auch heraus zu bringen.

Und was die Effekte angeht, da habe ich schon in einem anderen Thread geschrieben: Entscheidend ist, was am Ende für den Käufer herauskommt und was man davon auch merkt.
 
Holt schrieb:
Erstmal schauen wie EPYC performt und dann schauen was Intel dann hat, wenn dessen Nachfolger rauskommt, denn auch bei Intel herrscht ja kein Stillstand, auch nicht bei der Fertigung und Intel wird 2018 das Angebot an 10nm CPUs in die Breite ziehen.

Problem an der ganzen Sache ist dass man es eh schwer testen können wird. Rechnet man zb granular auf Threadebene wie in vielen Benchmarks einfach diverse Probleme durch die keinerlei Kommunikation zwischen den Kernen benötigen, dann stehen Multi Sockel Systeme, CCX mit Interconnected oder auch zu langsame Rings immer top da.

Was eine zu langsame Kern zu Kern Kommunikation teils ausmacht sieht man wirklich selten und kann es auch schwer nachstellen. Bei Ryzen sieht man es vielleicht noch bei manchen Games die dann mehr einbrechen als gedacht, oder auch an sowas:

https://www.youtube.com/watch?v=Rhj6CvBnwNk

-> in Game kaum relevant ob 4+0 oder 2+2. Zumal er meist im GPU Limit testet.

Mehr macht es hier aus:

https://www.youtube.com/watch?v=BORHnYLLgyY

I noticed that I would sometimes get 14 FPS, then 17 FPS on another run. After playing around with CPU affinity using Process Lasso, I found I was getting 14 FPS when the threads were split across cores on the two CCX units.

Wobei das absehbar war dass bei der kleinen Kernzahl von 8 Kernen und einer kleinen Ryzen Die das kaum auftritt. Bei Threadripper mit 2 Die wäre ein (2+0) + (2+0) Test interessant sofern möglich.

Oder eben diesen Drawcall Test mit 2 Threads die dann Random über die Kerne verteilt werden.


Edit: Intel und AMDs Ansätze sind da verschieden. AMD schaut aktuell nur dass 4 Kerne maximal schnell kommunizieren können. Danach skaliert man quasi auf eine indirekte Kommunikation. Intel hingehen versucht auf einer Die >20 Kerne sich möglichst gut austauschen zu lassen.

Was besser ist lässt sich so kaum sagen. AMD wird in 7nm auch mehr kerne auf einer Die unterbringen müssen, dann wird auch da die Kommunikation komplexer. Den weg über mehrere Die bzw CPU ist immer der den man zuletzt wählt.
 
Zuletzt bearbeitet:
Weiß man, ab wann dieser neue "Mesh"-Bus auch im E3 Einzug halten wird?
 
Zurück
Oben