Test AMD-Ryzen-Benchmarks: Spiele unter Windows 7, Core Parking und HPET analysiert

Taxxor schrieb:
Hier z.B.Anhang anzeigen 612341

Und auch in Witcher 3 liegt ein i5 7400 an der Spitze

Das u.U. Broadwell-DT bei manchen Spielen besser abschneidet lass ich mir noch einreden, auch wenn das nicht unbedingt eine "günstigere" CPU ist, aber bei einem 7350/7400 oder ähnliches würde ich hier einfach mal das Ergebnis in Frage stellen.

An anderer Stelle sieht das nämlich so aus.

Änliches bild auch bei Witcher.
 
duskstalker schrieb:
in deus ex und in doom ist der 4c/4t deutlich (!) schneller, was wohl daran liegt, dass in diesen spielen die threads miteinander kommunizieren, und da nicht der infinity fabric im weg steht,

Genau das meinte ich ja.
SMT aus, nur um ganz sicher zu gehen, das dies das Ergebnis nicht positiv "verfälscht".


Ich hab das Video an an paar stellen mit unterschiedlichen spielen angesprungen und nicht alles geguckt, ich hatte halt nur die gesehen, die mehr FPS bei dem 16K hatten.
 
flappes schrieb:
Genau, darum ginge es mir ja, dann könnte man genau feststellen ob es ein CCX-Problem ist.

ein thread auf 2 kernen, die in getrennten ccx sitzen, performen schlechter als im selben ccx. das ist fakt, das wurde schon bewiesen.

https://www.youtube.com/watch?v=JbryPYcnscA
https://www.youtube.com/watch?v=BORHnYLLgyY

das ist nur so ein mini"benchmark" - wenn da noch ordentlich datenflüsse von speicher und gpu dazukommen, siehts vermutlich nochmal n bisschen "schlimmer" aus.

auch schön zu sehen ist die zufällige verteilung der threads von win10. gabs nicht mal probleme mit ständig schwankenden ergebnissen mit ryzen? das wäre nämlich die erklärung dafür.
 
Zuletzt bearbeitet:
VikingGe schrieb:
Bei Thread Pools muss die Anwendung am besten selbst zusehen, dass sie ihre Worker-Threads selbst an einzelne Kerne pinnt und das Scheduling ihrer Jobs selbst übernimmt. Das ist kein Hexenwerk, erfordert aber natürlich Anpassungen an die jeweilige CPU-Topologie, und dürfte spätestens dann für Probleme sorgen, wenn noch ein paar Fixed-Purpose-Threads mitlaufen. Ich hab selbst noch Code rumfliegen, der entsprechende Anpassungen gut gebrauchen könnte.

das stimmt, aber auch ein Programm oder Thread Pool müsste sich CPU spezifisch beim pinnen der Threads ausrichten. Muss man bei Bulldozer vielleicht auch das ein oder andere mal machen ober überlässt das dem OS Scheduler. Bei Ryzen muss ich die Logik aber mit in den Pool Manager packen.

Zb bei AMD Ryzen den Pool auf 0234 pinnen (wenn ich sie lieber innerhalb eines CCX hab) während ein Intel mit 0248 mehr anfangen könnte da nur dann wirklich je ein "echter" Core dahinter ist.

Diese Logik müsste aber explizit im Pool hinterlegt werden, ohne Aufwand vom Programmierer- bzw der muss auch wissen ob die Threads viel miteinander quatschen sollen.

Weiß nicht, trivial ist das glaub nicht.
 
Zuletzt bearbeitet:
Es ging um 1 oder 2 Core Spiele, bitte nicht an den billigen CPUs aufhängen, ich würde mir die auch nie kaufen.
 
da_reini schrieb:
Doch. Genau das ist der Fall. Mit den neu ausgewählten Spielen, steht Ryzen wesentlich besser da. So könnte man fast meinen, dass es sich um einen Ryzen-optimierten Parcours handelt.

Und weiter? Soll man jetzt also die Spiele garnicht mehr ändern? Am Besten nur noch Monopoly für MsDos mit drölftausend Frames und Single Thread?
Irgendwann _muss_ man die Spiele halt mal anpassen, und wenn die gut mit Kernen skalieren hat AMD halt mal (im Gegensatz zu Bulldozer) nicht am Markt vorbei entwickelt. Als bei den alten Spielen Intel weiter vorn lag hat ja auch keiner Zeter und Mordio geschrien. Get over it, neue Spiele skalieren halt besser mit mehr Kernen.
 
duskstalker schrieb:
ein thread auf 2 kernen, die in getrennten ccx sitzen, performen schlechter als im selben ccx. das ist fakt, das wurde schon bewiesen.

Dann ist es zu 100% ein Scheduler-Problem. (das vermute ich ja schon die ganze Zeit)

Der Microsoft Scheduler arbeitet natürlich gut, er arbeitet so wie er angedacht ist, mit den bisherigen Architekturen.

Aber AMDs CCX machen halt eine Anpassung notwendig. Von daher finde ich es etwas unverständlich, wieso AMD und Microsoft das schön reden und so tun, als wäre alles TipTop mit dem Scheduler. Das kann ja dann nicht der Fall sein.

Und es ist garantiert nicht die Aufgabe der Anwendungssoftware (Spiele), dem Betriebssystem zu sagen, wie es seine Ressourcen Managen soll.

Also Microsoft, beweg deinen Arsch! Papa will sich einen 1600X kaufen ;-)
 
Krautmaster schrieb:
Zb bei AMD Ryzen den Pool auf 0234 pinnen (wenn ich sie lieber innerhalb eines CCX hab) während ein Intel mit 0246 mehr anfangen könnte da nur dann wirklich je ein "echter" Core dahinter ist.


Das hast du in einem vorherigen Post auch schon mal so geschrieben, daher die Frage: warum soll bei AMD nicht 0246 gehen? die 6 liegt nicht im zweiten sondern ebenfalls im ersten CCX.

8, 10, 12, 14 sind die physischen Kerne im zweiten.

Es sei denn du redest irgendwie vom 6-Kerner
 
duskstalker schrieb:
ein thread auf 2 kernen, die in getrennten ccx sitzen, performen schlechter als im selben ccx. das ist fakt, das wurde schon bewiesen.
auch schön zu sehen ist die zufällige verteilung der threads von win10. gabs nicht mal probleme mit ständig schwankenden ergebnissen mit ryzen? das wäre nämlich die erklärung dafür.
Schönes Video!

naja Windows 10 macht da Stand heute nichts falsch. Es nimmt zb immer die geraden Kerne wo es eigentlich weiß "dahinter ist ein physikalischer Kern".

Was denkbar wäre und ein erster Ansatz ist dass es primär die 0246 nimmt, also 2 Threads auf entweder das eine oder andere CCX verlagert. Das funktioniert bis 4 Threads gut, aber bei allem darüber nicht. Denn auch da kann es schneller sein eben nicht aufs 2. CCX zu streuen.

Aber wer weiß, vielleicht behebt genannte "Policy" schon 90% der Probleme durch CCX Aufteilung.
Ergänzung ()

Taxxor schrieb:
Das hast du in einem vorherigen Post auch schon mal so geschrieben, daher die Frage: warum soll bei AMD nicht 0246 gehen? die 6 liegt nicht im zweiten sondern ebenfalls im ersten CCX.

8, 10, 12, 14 sind die physischen Kerne im zweiten.


ja mein Fehler. Ich meine natürlich wie du richtig erkennst >=8 bzw

Zur ganzen Thematik ist eher die Frage weshalb sowas die Community regeln muss. Das muss doch AMD schon über Monate mit Microsoft auskaspern. Man sieht doch 1a dass 2 Threads innerhalb eines CCX schneller sind. 14 -> 16,5 FPS sind schon einige %. :rolleyes:

Da Intel CPU das 0 betreffen würde wäre es nur sinnig beim Release die Sache mit Sicherheit im System zu haben - dass MS eben mit Ryzen nicht zufällig über alle physikalischen Kerne verteilt sondern Modulo 4 ;)
 
Zuletzt bearbeitet:
Ist denn bei Intel die Aufteilung genauso? Ich meine mal gelesen zu haben, dass beim 6900K z.B. CPU 0-7 alle physisch sind und 8-15 dann die logischen.
Wenn Windows die SMT Kerne so behandelt wie es das von Intel gewohnt ist, könnte hier auch eine Baustelle sein.
 
@Taxxor

Das sieht man in dem geposteten Video auch ganz gut:

Intel ist exakt wie AMD Ryzen von der Nummerierung / Aufteilung. Das passt. Nur dass bei AMD eben nen Unterschied macht ob man zufällig einen physikalischen Thread rauspickt oder diese gezielt auf einen CCX packt.

Die Idee das via Thread zu Thread Latenz zu messen ist schon sehr cool.
 
fromdadarkside schrieb:
Ok, Anschlussfrage, wieso sollte ich mir eine CPU kaufen die ich stark übertakten muss um auf das Level des gleich teuren Konkurrenzmodells zu kommen? Das man ja freilich auch übertakten kann. Mir gehts dabei nur um Spieleleistung. Ich rendere nichts, de/kodiere nichts.
[...]
Naja unter anderem in diesem Thread schwingt so eine "jetzt ist Ryzen doch besser" Welle. Er mag bei Anwendungen schneller sein, bei Spielen gleich gut bzw. in Zukunft ein bisschen schneller, aber preislich liegen zwischen dem 1800X und dem 7700K eben Welten, während der 1700 übertaktet werden muss um an den 7700K zu kommen - zum gleichen Preis.
Die Diskussion gabe es ja schon ein paar mal. Natürlich kosten die 8-Kerner keine 250 Euro. Daher infach einen R5 1600X kaufen, der ist Singlethreaded genauso schnell wie der X1800 und Multithreaded weit schneller als die blauen Vertreter mit ähnlichem Preis, z. B. der 7700K.

JJJT schrieb:
Da hier auch die Problematik mit den zwei ccx angesprochen wurde, Frage ich mich wie AMD das beim 6 Core r5 lösen wird.
4+2 oder 3+3 oder mal so,mal so, je nachdem was in der CPU defekt ist? Hat das Auswirkungen auf die Performance?
Der 6-Kerner wird eine 3+3-Konfiguration haben. Die Listungen welche im Großhandel für April aufgetaucht sind, sprechen von 19 MB Cache (insgesamt), d. h. der L3-Cache ist noch vollständig vorhanden.

@CB

Keine Anwendungsbenchmarks mit Windows 7? AMD sprach ja nicht ausdrücklich von Games.

Zum Thema Spiele: ich habe sehr stark den Eindruck, dass die Steuerung der Threads bei Spielen sehr stark vom Spiel bzw. der Engine übernommen wird (was gute Gründe haben kann), daher diese Anomalien.
 
Zuletzt bearbeitet:
Taxxor schrieb:
@v_ossi: Wieso? Wenn das Spiel nur 4 Threads voll nutzen kann liegt der i3 mit seinem hohen Takt natürlich vorne.

Und die min fps liegen beim i3 bei 143, beim i7 bei 134, 7% höher, es hat also nichts mit einem GPU Limit zu tun.

Habe mir jetzt nicht alle Antworten hier durchgelesen, aber nur weil du mit deinem Golf in der 30er Zone geblitzt wurdest, ist der nicht prinzipiell besser als anderer Leute Ferrari. Aber ich lasse man Richard von Digiral Foundry für mich sprechen:
G4560 Review
 
@v_ossi: Ein besseres Beispiel für diesen Fall wäre, wenn der Golf und der Ferrari beide bei 200 abgeriegelt werden(GPU Limit) aber der Ferrari auf der Teststrecke bergauf(min fps) teilweise auf 170 zurückfällt, während der Golf mindestens 180 schafft.
 
Wenn Win 10 und Win 7 unterschiedliche "ausbalanciert" Profile benutzen wäre es sinnvoller gewesen dies manuell anzugleichen, mein Win 8 angepasstes "ausbalanciert" geht auch auch bis 0% Minimum weil ich den Modus eh nicht in Spielen benutz und auf dem Desktop oder zum Filme schauen brauche ich auch kein Minimum von 50%.
In GPU-Tests ist interessanterweise hier immer Win 10 vorne, sollte sich das dann nicht alles unterm Strich ausgleichen? ;)
 
evtl. könnte man noch erwähnen, dass Microsoft zu den Bulldozer-Patches dieses hier schreibt:
KB2645594
multithreaded workloads may not be optimally distributed on computers that have one of these processors installed in a lightly-threaded environment. This may result in decreased system performance for some applications.

Important
The power management policy for processor core parking on your computer may prevent this update from producing the desired performance increase.
To disable core parking, install the hotfix that is described in Microsoft Knowledge Base (KB) article 2646060

Bedeutet:
1. Der erforderliche Win7 Scheduling-Patch kann mitunter nicht wirken ohne den Core-Parking-Patch.
2. Ab Windows 8 ist das behoben und die Win7-Patches sind Backports.
3. Win10 Scheduled richtig aber das Parking (welches intel aktuell nicht nutzt) hat noch seine Probleme.

Noch eine Frage in eigener Sache:
"ist es nachteilig im Profil Höchstleistung den minimalen CPU-Leistungszustand von 100% auf 5% zu stellen und HPET abzuschalten?" Parking sollte dann doch aus sein oder ?
 
Taxxor schrieb:
@v_ossi: Ein besseres Beispiel für diesen Fall wäre, wenn der Golf und der Ferrari beide bei 200 abgeriegelt werden(GPU Limit) aber der Ferrari auf der Teststrecke bergauf(min fps) teilweise auf 170 zurückfällt, während der Golf mindestens 180 schafft.

Also hast du dir das Video nicht angeguckt?!
 
Dittsche schrieb:
wer Battlefield 1 bei maximalen Frames mit einer High-End Grafikkarte (1080Ti) im Multiplayer zocken will - MUSS Ryzen kaufen (ab 350€), oder gibt 1000€ aus.

So sieht es mal aus. Harte Realität.

Ich bin nie Deiner Meinung, doch hier muss ich dir recht geben!

Weiß noch genau als CS:S damals multicore support bekam... Fps-Drops waren einfach weg, wie geil war das denn!

Zum Thema Ryzen,

kann ich mit der Software da, den 1800X zu nem Vierkerner umbasteln und kann ich den auch als reinen Achtkerner laufen lassen ohne SMT ?


imaginez schrieb:
Ich weiß nicht woher das Gerücht kommt, aber ein Intel profitiert definitiv massiv von schnellem RAM.

Bei irgendeiner Generation wars bei Intel egal und bei AMD waren scharfe Ram-Timmings vorteilhaft... das hält sich dann im Netz gefühlt 50 Jahre!
 
Zuletzt bearbeitet:
Zurück
Oben