News AMD über Ryzen: Scheduling ist kein Problem, Core Parking schon

Cytrox schrieb:
Wo schließt du sonst den Monitor an? Oder bist du etwa der Ansicht das ein "Allrounder" erst ein Gerät mit dedizierter Grafikkarte ist?

Ein Allrounder ist für mich etwas, worauf ich sehr gut arbeiten aber auch spielen kann. Was Du meinst, ist in meinen Augen ein Office PC, eventuell mit marginalen gaming Möglichkeiten.
 
Cytrox schrieb:
Windows sieht die Architektur genau so wie sie vom System berichtet wird. Sowas wie NUMA für Caches gibt es in der Form nicht, nachdem Caches für Software ja auch gar nicht direkt adressierbar sind. Entsprechend kann W10 hier nicht wirklich mehr "sehen" als die CPU Modellnummer und dann anhand dessen eventuell entsprechende Annahmen zu treffen.

Das wuerde mich schwer wundern, wenn der Scheduler das nicht einsehen kann. Gerade im HPC Bereich ist das ja sonst reines Gluecksspiel. Gerade kurz den Wikipedia Artikel zu NUMA ueberflogen. Das scheint sehr Cache-aware zu sein. Das ganze Konzept basiert darauf. Von dem her sollte der Scheduler sehr wohl wissen welchen Cache welcher Complex mit niedrigster Latenz adressieren kann. Und wenn ich den Kommentar bei dem Blogartikel sehe, dass 4 Kerne eine 35% schnellere Compilertime haben, dann stimmt einfach etwas nicht.
 
Ned Flanders schrieb:
Ein Allrounder ist für mich etwas, worauf ich sehr gut arbeiten aber auch spielen kann.

Ok, dann wollen wir mal die Haare spalten, welche Workstation wäre deiner Definition zu folge kein Allrounder?

Das wären soweit nur die 10+ Kern Xeons die TDP-bedingt nicht über 3GHz pro Kern kommen ... welche soweit nur in den wenigsten Workstations auch tatsächlich drinnen stecken dürften.

EDIT:

Kacha schrieb:
Gerade kurz den Wikipedia Artikel zu NUMA ueberflogen. Das scheint sehr Cache-aware zu sein. Das ganze Konzept basiert darauf.

NUMA funktioniert in der Form trotzdem nur erst dadurch das die CPUs einzelne RAM Riegel exklusiv verwalten und dies auch entsprechend so an das Betriebssystem kommunizieren. Nur für Cache-Ebene gibt es das aber halt nicht. Ryzen kann W10 nicht sagen dieser L2 gehört diesem CCX und dieser L2 gehört dem anderen .. weil wie auch? L2 haben keine eigenen Adressen.
 
Zuletzt bearbeitet:
Die Spieleentwickler können ihre Thread -> Kern - Zuordnung optimieren. Ryzen hat nicht einfach 8 Kerne, sonder 2 x 4 Kerne. Jeweils 4 Kerne bilden ein CCX und teilen sich 8 MB L3 Cache.

Falls zwei Threads zusammen arbeiten müssen (häufig in Spielen der Fall), erfolgt deren Datenaustausch im selben CCX wegen des gemeinsamen L3 Cache deutlich schneller, als wenn ein Thread auf CCX1 und der andere auf CCX2 läuft.

Die Architektur mit 2x 4 Kernen gibt es schon in PS4 und XBONE (auch AMD chips), Spieleentwickler kennen sich damit also aus.
 
R-47 schrieb:
@Jan
Habt ihr auch Tests gemacht mit 8 Threads auf dem CCX-1 vs CCX-2?
Bei mir laufen einige, jedoch nicht alle Benchmarks auf dem CCX-2 (Threads 8-15) langsamer als auf dem CCX-1 (Threads 0-7)

Laut PCGH kommt Windows 10 mit dem SMT von Ryzen gut zurecht, kennt aber die CCX nicht. Es werden also Threads unnötig zwischen den CCX verschoben, was zu längeren Latenzen führen kann.

Die Frage ist, ob man das wirklich dem Windows10-Scheduler anlasten kann, oder ob das halt einfach eine Auswirkung der CPU-Architektur ist. (Vor- und Nachteile gegenüber Intels Ringbus)

Schnitz schrieb:
Software muss sich nach der Hardware richten und nicht anders herum, sonst bleiben Potentiale ungenutzt.

Die Rechnung geht aber nur dann auf, wenn sich die Hardware schnell und weit genug verbreitet, so dass es sich für die Softwareentwickler lohnt, dafür zu optimieren. Dieser Erfolg muss also passieren, bevor es optimierte Software dafür gibt. Ein typisches Henne-Ei-Problem.

Ein CPU-Hersteller darf sich eher nicht darauf verlassen, dass die Softwareentwickler seine neue Architektur auf jeden Fall nach Kräften unterstützen werden, unabhängig von der Verbreitung am Markt. Das kann sogar beim Platzhirsch Intel in die Hose gehen. Siehe das Debakel mit dem Pentium Pro, der mit damals noch weit verbreitetem 16Bit-Code schlecht zurecht kam und deshalb floppte.

Der sicherere Weg ist, wenn die CPU auch schon mit alter, nicht dafür optimierter Software eine überzeugende Leistung liefert. So wie z.B. AMDs Athlon 64, die auch mit herkömmlicher 32Bit-Software stark waren. Deshalb verbreiteten sie sich am Markt und setzten so den Standard für kommende 64Bit-Software.

Intel ging bei den Core(2)-CPUs damals sogar so weit, die CPU gezielt auf am Markt vorhandene, alte Software zu optimieren. Da hatten sie aus den Problemen der Netburst-Pentiums (und dem PPro) gelernt.
 
Cytrox schrieb:
Ok, dann wollen wir mal die Haare spalten, welche Workstation wäre deiner Definition zu folge kein Allrounder?

Alle unsere Workstations hier sind mit Xeon E5-2687W + FirePro W4300 ausgerüstet (musste gerade extra nochmal nachschauen gehen)

--> kein Allrounder

Zuhause hoffentlich bald: Ryzen 1700 + 16gb RAM + RX470

--> Allrounder
 
Zuletzt bearbeitet:
MHumann schrieb:
.....
Damit ist der 7700k für einzelne Anwendungen, die maximal 8 Threads auslasten die ideale Wahl..
....

Nein, denn da ist der Ryzen mit seinen 8 echten Kernen @4Ghz schneller, als ein 4 Kerner mit SMT @4,5Ghz.
Natürlich nur, wenn jeder Thread die gleiche Leistung der CPU abverlangt und Threads nicht auf virtuellen Kernen und über CCX hinweg hoppen. Trotz anderslautender offizieller Meldungen gabs entsprechende Tests/Videos im Netz die genau das bestätigt haben, wie man im Mammuthtread zu Ryzen sehen kann.

Ich bin jedenfalls gespannt auf die Tests heute mittag. Falls nicht bereits geschehen, würde ich dennoch mal darum bitten, die Tests mit einer AMD Grafikarte wie der Fury X ebenfalls durchzuführen.
 
Zumindest macht AMD sich Gedanken um die Probleme und kommuniziert, was man bisher heraus gefunden hat. Das sehe ich schon mal positiv.
Wenn jetzt dann irgendwann bessere Bios Versionen kommen, Core Parking richtig funktioniert und die Compiler optimiert wurden, dann wird das schon mit Ryzen.

Mein Spiel WoW's und vorher WOT lief mit Intel und NVidia auch besser auf Windows 7 als es jetzt auf Windows 10 läuft. Damn You DX12! :mad:
 
@Herdware
Habe die Threads manuell zugewiesen und im Task-Manager die Auslastung kontrolliert.

Lässt sich schnell mit dem CPU-Z Benchmark feststellen. Screens kann ich leider erst heute Abend hochladen.

Score war ungefähr so:

CPU 0+2+4+6: 2800
CPU 8+10+12+14 : 2200
 
Zuletzt bearbeitet:
Herdware schrieb:
Die Rechnung geht aber nur dann auf, wenn sich die Hardware schnell und weit genug verbreitet, so dass es sich für die Softwareentwickler lohnt, dafür zu optimieren. Dieser Erfolg muss also passieren, bevor es optimierte Software dafür gibt. Ein typisches Henne-Ei-Problem.

In dem Fall aber nur in Bezug auf Games, wobei das auch Luxus-Geheul ist, denn mit Ryzen kann man alles ohne Einschränkungen zocken.

Herdware schrieb:
Der sicherere Weg ist, wenn die CPU auch schon mit alter, nicht dafür optimierter Software eine überzeugende Leistung liefert.

In Bezug auf Anwendungen wurde das ja auch hervorragend umgesetzt. Das es dann hier in diesem Gamer-Kiddie-Forum geheul gibt, war ja klar, hat aber zum Glück wenig mit der Realität zu tun.

Herdware schrieb:
Intel ging bei den Core(2)-CPUs damals sogar so weit, die CPU gezielt auf am Markt vorhandene, alte Software zu optimieren. Da hatten sie aus den Problemen der Netburst-Pentiums (und dem PPro) gelernt.

Ja, da hatten sie aber auch ernsthaft gegen AMD zu kämpfen und auch den Grundstein für ihre eigene Zukunft gelegt denn die IPC ging dann ja mit den Core-i erst richtig ab - jeder rümpft heute doch die Nase über einen Core2.
 
Tranceport schrieb:
Kommt Ryzen auf W10 denn mit Profil "Höchstleistung" auf das Niveau von Windows 7? Fragen über Fragen =D

Dafür gibt es schon ein YT-Video, was diesen Sachverhalt untersucht:

https://www.youtube.com/watch?v=Nfv5aF_GfWg

Ziemlich gutes Review, wenngleich nur der 1700X betrachtet wird. Aber die Ergebnisse sollten sich auf die anderen beiden Vertreter übertragen lassen.
 
Ned Flanders schrieb:
[...] Xeon E5-2687W + FirePro W4300 [...] --> kein Allrounder

[...] Ryzen 1700 [...] RX470 [...] --> Allrounder

Ok, wo ordnest du dann 1-Sockel <10-Kern Xeons ein? Industriegeräte? :freak:

Broadwell-E wäre dann wohl auch ein "Allrounder"? Und der 7600 non-K ein Office-PC?

Ich bleibe ansonsten nach wie vor dabei dass

Cytrox schrieb:
die 10+ Kern Xeons die TDP-bedingt nicht über 3GHz pro Kern kommen [...] soweit nur in den wenigsten Workstations auch tatsächlich drinnen stecken dürften.
 
Zuletzt bearbeitet:
Krautmaster schrieb:
Dennoch etwas schade dass ich bei dem bestellten 1700er wohl nicht wirklich mit mehr Leistung rechnen kann.

Hast du den Artikel komplett gelesen? Du kannst davon ausgehen, dass alle künftigen AAA Spiele mehr Leistung aus dem Ryzen 7 rausholen.
Die IPC liegt auf Broadwell-Niveau, das belegen auch die meisten Single-Thread Tests. Warum sollte also die Spieleleistung bei ähnlichem Takt nennenswert niedriger sein?

Was bei der ganzen Diskussion irgendwie ignoriert wird ist, dass in den vergangenen 4-5 Jahren quasi jede Software also auch Spiele auf die Core Architektur von Intel optimiert wurde. Wie kann man also erwarten, dass alle bereits erschienenen Spiele auf einer neuer Architektur von Tag 1 ohne Patches 1A laufen?

Das Hauptproblem ist soweit ich weiss dass CCX Design von Zen. 2 Quadcores sind beim Ryzem 7 miteinander per Infinity Fabric verbunden. Die Latenzen zwischen den Kernen aus verschiedenen CCX ist um ein vielfaches höher als innerhalb eines CCX. Dafür sind sie innerhalb eines CCX nur halb so groß wie bei Intel. Weshalb Ryzen in Multuthreading Anwendungen besser als Intel ist.

Die Software muss die Rechenlast in den beidem CCX unabhängig voneinander abarbeiten lassen und nicht zwischen dem CCX hin und her schieben. Es gibt dazu ein YouTube Video von einem Softwareentwickler.

Die meisten, die ein wenig Ahnung von der Materie haben, sagen Ryzen wird nur schneller, im Gegensatz zu Intel's Quadcores. Und je größer Ryzen's Marktanteil ist umso schneller und konsequenter werden Spiele darauf optimiert.
 
Zuletzt bearbeitet:
AMD scheint Ryzen einfach so schnell wie möglich auf den Markt geworfen haben, ohne sich im Vorfeld genug mit Microsoft abgesprochen zu haben. Die Architektur muss doch schon seit Jahren fertig sein, möglicherweise bereits seit Jim Kellers Abgang, da hätte man schon damit anfangen können, das Scheduling für Ryzen zu optimieren.

Es ist wohl ein völlig neuer Ansatz nötig, um Sprünge von Threads zwischen den Core Complexes zuzulassen aber zu minimieren.
Wenn das jetzt einfach auf die Spieleentwickler abgeschoben wird, ist AMDs Konzept zum Scheitern verurteilt.
Wenn Spiele der Zukunft mehr als 8 Threads verwenden, die viel mitenander kommunizieren, wird Ryzen eher mehr Probleme bekommen als weniger.

Sehr interessant zu dem Thema ist die Analyse von PC Perspective:
https://www.youtube.com/watch?v=6laL-_hiAK0
 
Cytrox schrieb:
Broadwell-E wäre dann wohl auch ein "Allrounder"? Und der 7600 non-K ein Office-PC?

https://de.wikipedia.org/wiki/Allrounder

Kann ein 7600 ohne dedizierte Grafikkarte nur werfen oder auch schlagen?

Anyway.... du weisst was ich mit Allrounder mein und ich was du mit workstation meinst.... das ist für mich gut genug.... [end of OT]
 
Zuletzt bearbeitet:
valnar77 schrieb:
Nein, denn da ist der Ryzen mit seinen 8 echten Kernen @4Ghz schneller, als ein 4 Kerner mit SMT @4,5Ghz.
Bitte Äpfel mit Äpfel vergleichen und nicht Äpfel mit Birnen!
Ein Ryzen, der alle Kerne auf 4 Ghz läuft ist stark übertaktet. Ein i7700K stark übertaktet läuft auf 5 Ghz. Beide CPU's laufen dann am Limit. Also bitte beide Stock oder beide übertaktet vergleichen.
 
oldmanhunting schrieb:
Bitte Äpfel mit Äpfel vergleichen und nicht Äpfel mit Birnen!
Ein Ryzen, der alle Kerne auf 4 Ghz läuft ist stark übertaktet. Ein i7700K stark übertaktet läuft auf 5 Ghz. Beide CPU's laufen dann am Limit. Also bitte beide Stock oder beide übertaktet vergleichen.

Der Ryzen 1800X kann aber auch mit 4 GHz laufen, auf allen Kernen und selbst wenn.
von 3,8 GHz auf 4 GHz sind auch keine Starke Übertaktung, da wären ein Intel 7700K auf 5 GHz weit stärker übertaktet.....

Ein R7 1700 Stock ist im Multi Threaded Anwendungen immer noch schneller als ein i7 7700K Stock.....

Also egal ob Stock oder nicht, AMD ist bei mehreren Threads besser dran als Intels 7700K....
 
aber es muss in Crysis 3 schon vorhanden sein
Crysis 3 kann, wie viele andere Games auch, mehr als 8 Threads nutzen und somit ist eine 16 Thread CPU natürlich im Vorteil.
Allerdings dürfte sich das Blatt bei einem Intel 6/8/10 Kerner sofort wieder wenden!

AMD ist bei mehreren Threads besser dran als Intels 7700K....
was willst Du uns mit so einem Vergleich sagen?
Nimmst Du dann Intels 10-Kerner gegen AMDs 8-Kerner ist es wieder anders herum.......bringt doch nichts, solche Vergleiche.......
 
Zuletzt bearbeitet:
Zurück
Oben