Baal Netbeck
Fleet Admiral
- Registriert
- Apr. 2008
- Beiträge
- 12.347
Dies ist ein ausgelagertes Thema aus diesem Hauptthread:
https://www.computerbase.de/forum/t...kussion-zu-spieletests.1728575/#post-20678303
Intro:
Cities Skylines ist gerade mit größeren Städten ein ziemlich CPU lastiges Spiel und hat es daher in meinen eigenen Testparcour für CPU Tests geschafft.
Die Testkandidaten sind mein Ryzen 1800X in verschiedenen Konfigurationen gegen einen i5 3570K.
Beide mit meiner Vega64 LC(undervolted) gepaart.
Und als Bonus noch meinen alten Core2Quad 9550 mit einer GTX285 hineingemixt.
In diesem Review zeige ich diverse Aspekte wie:
Einflüsse von 4 vs 8 Kernen, SMT an/aus, Skalierung mit Ramgeschwindigkeit, verschiedene CCX Konfigurationen für Ryzen. IPC Vergleiche, Einfluss des HBCC, Einfluss von CPU und RAM Optimierungen, Windows 7 vs. 10 und eine Betrachtung der Infinity Fabric Skalierung.
Fangen wir mit der Testszene an.
https://www.youtube.com/watch?v=KNQRPgm3P9o&t=0s&index=6&list=PLP9fskJGwUOT5CByAJMJrXaggyMuUgsFt
Da die Leistung sehr stark mit der Kameraposition schwankt und sich bei naher Betrachtung(direkt nach dem Laden) gerne mal das Stadtbild verändert, habe ich mich für diese ganz heraus gezoomte mittige Ansicht von oben entschieden.
Als Stadt dient mir ein savegame das ich aus dem Workshop Inhalt namens Atoll gemacht habe.
Eine solche Stadt und eine solche Kameraperspektive entspricht nahezu einem Worst-case szenario ohne eine unrealistische Szene zu zeigen.
Wer die Szene selbst testen möchte findet hier das benutzte savegame:
https://drive.google.com/drive/folders/1Hahuj2q234W1LTFi5WLAZOo_uR4tF-qu?usp=sharing
Frametimegraphen:
Zuerst der Vergleich meines Ryzen 7@3,8GHz und des Ivy Bridge i5 mit 4,4GHz
Wie man sieht, hat das Spiel mit großen Frametime Schwankungen zu kämpfen.
Die Durchschnitte ähneln sich stark aber der 8 Kerner kann hier deutlich bessere Frametimes liefern, auch wenn er trotzdem immer wieder unschöne Peaks aufweist.
Um diesem Auf und Ab eine quantitative Entsprechung zu geben benutze ich eine Reihe statistischer Werte die ich aus der Auswertung von jeweils fünf Messungen gewinne.
Die gezeigten Frametimeverläufe waren jeweils die zweit besten was die 0.1% low Werte angeht.
Aber erstmal werfen wir einen Blick auf einen Vergleich mit dem alten C2Q 9550:
Er macht im Vergleich gar keine gute Figur, musste sich jedoch auch mit einer deutlich schlechteren Grafikkarte abgeben. Ich habe versucht dies auszugleichen indem ich niedrige Settings und eine niedrige Auflösung benutzt habe, aber es ist nicht auszuschließen, dass die Grafikkarte trotzdem einen Einfluss hatte.....seht es als Bonus-Ergebnis eines 10 Jahre alten Systems.....und zumindest in der Anfangsphase des Spiels mit kleinen Städtchen ist es überaschenderweise gut spielbar ........ und wer leidensfähig ist, könnte auch eine Stadt wie in der Testsequenz bauen.
Vergleichen wir also die Systeme quantitativ:
C2Q vs. i5 vs. Ryzen
Zur Erklärung des Diagramms:
Wie schon in den Frametimegraphen zu sehen, ist der alte Core2Quad völlig abgeschlagen und der Ryzen mit 8 Kernen und SMT liegt in allen Bereichen an der Spitze.
Mit nur 4 Kernen und ohne SMT sind die Unterschiede zum i5 insgesamt nur gering aber der i5 kann sich gerade bei den wichtigen Werten im rechten Bereich etwas absetzen.
Schalten wir bei den 4 zen Kernen SMT hinzu, dreht sich das Bild um. Auch wenn der Durchschnitt leicht sinkt, liegt der Ryzen im rechen Bereich deutlich in Führung, kann aber nicht an echte 8 Kerne herankommen.
Ryzen CCX Konfiguration und SMT
Hier sehen wir, dass sich für Cities Skylines(zumindest mit 3200er Ram) keine Unterschiede von 4+0 zu 2+2 zeigen die über Messungenauigkeiten hinausgehen. Die 2+2 Konfiguration würde der eines 1500X ohne SMT@3,8GHz entsprechen. 4+0 kann man nur bei dem APUs kaufen.
4+0 hat den Vorteil keine Komunikation der Kerne über den IF zu haben, muss im Gegenzug aber mit dem halben L3 Cache zurechtkommen.
Wie schon vorher gezeigt verbesser SMT bei vier Kernen das Spielgefühl deutlich.
Bei 8 Kernen ändert sich dies und das abschalten von SMT erhöht die Performance durch die Bank.
Leistungsaufspaltung beim i5
Keine großen Überraschungen hier.
Nur 2,8 GHz machen sich trotz schnellem Ram nicht gut, die stock Taktraten mit 1600er Ram(Intel Freigabe) müssen sich der Übertaktung auf 4,4GHz geschlagen geben.
Der Wechsel von 1333 auf 1866 macht aus dem 40% schnelleren Ram also ca 15% mehr avg FPS aus und 13,3% mehr 1% low.
Von 2,8 zu 4,4GHz sind es 57% mehr Takt. Dies führt zu einer Steigerung der avg FPS von 42,3% und ganzen 86,7% bei den 1% low.
Die Ram Geschwindigkeit zeigt sich also deutlich, aber nicht so deutlich wie der CPU Takt.
IPC Vergleich
Drei mal vier Kerne, ohne HT/SMT, bei 2,8GHz im Vergleich.
Wie man sehen kann hat sich viel getan was die Leistung pro CPU Takt angeht.
Auch wenn ein guter Teil davon mit schnellere Ram zusammenhängen kann und der C2Q mit einer alten GPU und Windows 7 zurechtkommen muss.
DDR4 Ram Skalierung
Ich habe eine etwas andere Auftragung gewählt.
Wir sehen hier wie sich die verschiedenen Statistikwerte mit steigender Ram Geschwindigkeit verändern.
Bis zu den 5% low Werten ist der Gewinn ziemlich linear.
Die 1% und 0.1% low Werte zeigen eine Sättigung zu höheren Taktraten und profitieren vor allem bis 2666MHz.
Unterschiedliche Ram Skalierung bei 4 Kernen?
Egal ob 4 Kerne ohne SMT, mit SMT oder 8 Kerne mit SMT, der Wechsel von 2133 auf 3200 MHz bringt deutliche wenn auch nicht extreme Leistungsgewinne.
Interssant ist, dass bei SMT ein, der Wechsel auf schnellen Ram bei 4 Kernen sogar minimal besser ist als 8 Kerne mit 2133MHz Ram.
Bei den avg FPS gewinnen 2+2 SMT off 18,2%, 2+2 SMT on 15,8%.
4+4 SMT on gewinnt 13,2%
Windows 7 vs. 10
Wenn nicht anders erwähnt, kommt immer Windows 10 zum Einsatz.
Ich habe mit dem i5 bei 4,4GHz und bei 2,8GHz die Leistung verglichen und es zeigt sich vor allem für die Spielbarkeit ein deutlich besseres Bild bei Windows 10.
Die Unterschiede, die sich im IPC Vergleich bei 2,8GHz zum C2Q gezeigt haben, werden hier dadurch relativiert, dass der i5 unter Windows 7 ebenfalls stark abbaut.
HBCC settings
Alle Unterschiede sind nur selten außerhalb des Konfidenzintervalls und sollten daher mit Vorsicht bewertet werden!
Wenn man es trotzdem macht, sieht man für den i5 einen kleinen Vorteil bei den avg FPS, für 12GB zugewiesenem HBCC.
Beim Ryzen ist es anders und 16GB sind im Durchschnitt leicht schlechter als 8 und 12GB.
Auf der rechten Seite bei den 99th percentile und 0,1% lows wiederum liegen 8GB vor den anderen beiden.
Es ergibt alles wenig Sinn und was man wählt ist vermutlich egal .
Ryzen optimieren und übertakten
Mit dem 1800X habe ich bereits das stärkste Modell der Ryzen 100er Serie.
Aber wie viel Leistung verschenkt man wenn man weder den Ram im Bios einstellt noch den Energiesparplan ändert.
Der ausbalancierte Energiesparplan sollte inzwischen auch für Ryzen funktionieren und nicht mehr die Kerne schlafen legen aber auf Höchstleistung wird nicht heruntergetaktet.
Und wie viel Leistung kann man mit einem minimalen OC auf 3,8GHz und optimieren von Subtimings noch herausholen?
Antwort A.....man verliert ziemlich viel.
Antwort B.....man gewinnt durchaus mehr als ich erwartet hätte.
100MHz mehr allcore(3,6% mehr score in Cinebench) und 9,6% mehr Leserate des Ram bringen immerhin 5,5% mehr avg FPS und 5,2% mehr 1% low.
Einfuss von Ramtakt auf den Infinity Fabric
Hintergrund:
Ganz wichtig sind hier die Fehlerbalken!
Nur die oberen drei Werte haben eine Aussagekraft und auch diese ist nur begrenzt!
Grob kann man sagen, dass eine Beschleunigung des IF um 50%, um die 2% bessere FPS in Cities Skylines ausmacht.
Mein Fazit aus diesem speziellen Ergebnis lautet:"Da das Spiel von schnellerem Ram profitiert, sollte man wenn möglich diesen einsetzen. Die Angst das der IF sonst deutlich limitiert ist jedoch nicht begründet.
4+0 profitiert fast genauso viel nur durch den Ram und der i5 profitiert ebenfalls."
Fazit:
Cities Skylines ist vor allem CPU limitiert.
Es liebt mehr CPU Takt, mag mehr Ram Takt und kann mit mehr als 4 Threads etwas anfangen.
Wie man schon an der Auslastung der CPU im Video sieht, werden 20-25% der 16Threads ausgelastet. Das entspricht vier Kernen und da verwundert es wenig, wenn mit 8 Kernen SMT besser deaktiviert sein sollte und ich erwarte das gleiche für 6 Kerne.
HBCC und den Infinity Fabric kann man ignorieren, Windows 7 sollte jedoch gemieden werden.
Die vielen Frametimeschwankungen scheinen am Spiel zu liegen und können zwar verbessert aber nicht verhindert werden.
https://www.computerbase.de/forum/t...kussion-zu-spieletests.1728575/#post-20678303
Intro:
Cities Skylines ist gerade mit größeren Städten ein ziemlich CPU lastiges Spiel und hat es daher in meinen eigenen Testparcour für CPU Tests geschafft.
Die Testkandidaten sind mein Ryzen 1800X in verschiedenen Konfigurationen gegen einen i5 3570K.
Beide mit meiner Vega64 LC(undervolted) gepaart.
Und als Bonus noch meinen alten Core2Quad 9550 mit einer GTX285 hineingemixt.
In diesem Review zeige ich diverse Aspekte wie:
Einflüsse von 4 vs 8 Kernen, SMT an/aus, Skalierung mit Ramgeschwindigkeit, verschiedene CCX Konfigurationen für Ryzen. IPC Vergleiche, Einfluss des HBCC, Einfluss von CPU und RAM Optimierungen, Windows 7 vs. 10 und eine Betrachtung der Infinity Fabric Skalierung.
Fangen wir mit der Testszene an.
https://www.youtube.com/watch?v=KNQRPgm3P9o&t=0s&index=6&list=PLP9fskJGwUOT5CByAJMJrXaggyMuUgsFt
Da die Leistung sehr stark mit der Kameraposition schwankt und sich bei naher Betrachtung(direkt nach dem Laden) gerne mal das Stadtbild verändert, habe ich mich für diese ganz heraus gezoomte mittige Ansicht von oben entschieden.
Als Stadt dient mir ein savegame das ich aus dem Workshop Inhalt namens Atoll gemacht habe.
Eine solche Stadt und eine solche Kameraperspektive entspricht nahezu einem Worst-case szenario ohne eine unrealistische Szene zu zeigen.
Wer die Szene selbst testen möchte findet hier das benutzte savegame:
https://drive.google.com/drive/folders/1Hahuj2q234W1LTFi5WLAZOo_uR4tF-qu?usp=sharing
Frametimegraphen:
Zuerst der Vergleich meines Ryzen 7@3,8GHz und des Ivy Bridge i5 mit 4,4GHz
Wie man sieht, hat das Spiel mit großen Frametime Schwankungen zu kämpfen.
Die Durchschnitte ähneln sich stark aber der 8 Kerner kann hier deutlich bessere Frametimes liefern, auch wenn er trotzdem immer wieder unschöne Peaks aufweist.
Um diesem Auf und Ab eine quantitative Entsprechung zu geben benutze ich eine Reihe statistischer Werte die ich aus der Auswertung von jeweils fünf Messungen gewinne.
Die gezeigten Frametimeverläufe waren jeweils die zweit besten was die 0.1% low Werte angeht.
Aber erstmal werfen wir einen Blick auf einen Vergleich mit dem alten C2Q 9550:
Er macht im Vergleich gar keine gute Figur, musste sich jedoch auch mit einer deutlich schlechteren Grafikkarte abgeben. Ich habe versucht dies auszugleichen indem ich niedrige Settings und eine niedrige Auflösung benutzt habe, aber es ist nicht auszuschließen, dass die Grafikkarte trotzdem einen Einfluss hatte.....seht es als Bonus-Ergebnis eines 10 Jahre alten Systems.....und zumindest in der Anfangsphase des Spiels mit kleinen Städtchen ist es überaschenderweise gut spielbar ........ und wer leidensfähig ist, könnte auch eine Stadt wie in der Testsequenz bauen.
Vergleichen wir also die Systeme quantitativ:
C2Q vs. i5 vs. Ryzen
Zur Erklärung des Diagramms:
Aufgetragen auf der y- Achse sind die "inversen Frametimes". Das sind im Grunde die FPS aber halt nicht durch "Zählen von Frames über einen Zeitraum" bestimmt, sondern über den Kehrwert der Frametimes gebildet.
Wenn ihr hier bei einem Wert links(avg FPS) 44 in 1/s seht, dann würde euch Fraps auch 44 FPS anzeigen.
Aus dem Frametimeverlauf bestimme ich einen effektiven Frametimeverlauf. Diesen habe ich ausführlich im Hauptthread unter "Nomenklatur" diskutiert.
"avg eff FPS" ist der Kehrwert des Durchschnitts dieses effektiven Frametimeverlaufs.
Um so stärker dieser Wert gegenüber den avg FPS abfällt um so stärker sind die relativen Schwankungen der Frametimes ....eine Art "Mikroschwankungsindikator".
Es folgen die Xth percentile und X% low Werte, die sich Stück für Stück immer weiter den schlechten Frametime Werten zuwenden und daher für das Spielgefühl besonders wichtig sind.
5%low und 99th percentile sind dabei noch eher auf den allgemeinen Spielfluss konzentriert und bekommen wenig bis nichts von einzelnen Frametimepeaks(Rucklern) mit.
Die letzten drei Werte werden je nach Spiel mehr oder weniger von diesen Frametimepeaks dominiert und sind meiner Meinung nach oft das beste Mittel um zu beschreiben ob und wie "Ruckelig" sich das Spiel anfühlt.
Leider basieren sie nur auf einem kleinen Teil der Frametimes und daher unterliegen sie größeren Ungenauigkeiten.
Auch wenn ich die 0,1% low Werte sehr schätze, bieten sie oft zu schlechte Reproduzierbarkeiten und daher bin ich ein großer Fan der 1% low Werte.
Diese sind in der Regel noch gut zu reproduzieren und entsprechen sinnvoll dem Spielgefühl.
Die Linien zwischen den Symbolen sind extra gestrichelt, da sie nur zur besseren Lesbarkeit beitragen sollen und keine Punkte dazwischen suggerieren sollen.
In der Legende sieht man die Symbolformen und Farben der verscheidenen Testkandidaten.
Die Wertepunkte selbst sind Durchschnittswerte aus den drei besten Werten von fünf Messungen und haben zusätzlich Fehlerbalken, die sich aus der empirischen Standardabweichung dieser drei besten Werte ergeben.
Wenn ihr hier bei einem Wert links(avg FPS) 44 in 1/s seht, dann würde euch Fraps auch 44 FPS anzeigen.
Aus dem Frametimeverlauf bestimme ich einen effektiven Frametimeverlauf. Diesen habe ich ausführlich im Hauptthread unter "Nomenklatur" diskutiert.
"avg eff FPS" ist der Kehrwert des Durchschnitts dieses effektiven Frametimeverlaufs.
Um so stärker dieser Wert gegenüber den avg FPS abfällt um so stärker sind die relativen Schwankungen der Frametimes ....eine Art "Mikroschwankungsindikator".
Es folgen die Xth percentile und X% low Werte, die sich Stück für Stück immer weiter den schlechten Frametime Werten zuwenden und daher für das Spielgefühl besonders wichtig sind.
5%low und 99th percentile sind dabei noch eher auf den allgemeinen Spielfluss konzentriert und bekommen wenig bis nichts von einzelnen Frametimepeaks(Rucklern) mit.
Die letzten drei Werte werden je nach Spiel mehr oder weniger von diesen Frametimepeaks dominiert und sind meiner Meinung nach oft das beste Mittel um zu beschreiben ob und wie "Ruckelig" sich das Spiel anfühlt.
Leider basieren sie nur auf einem kleinen Teil der Frametimes und daher unterliegen sie größeren Ungenauigkeiten.
Auch wenn ich die 0,1% low Werte sehr schätze, bieten sie oft zu schlechte Reproduzierbarkeiten und daher bin ich ein großer Fan der 1% low Werte.
Diese sind in der Regel noch gut zu reproduzieren und entsprechen sinnvoll dem Spielgefühl.
Die Linien zwischen den Symbolen sind extra gestrichelt, da sie nur zur besseren Lesbarkeit beitragen sollen und keine Punkte dazwischen suggerieren sollen.
In der Legende sieht man die Symbolformen und Farben der verscheidenen Testkandidaten.
Die Wertepunkte selbst sind Durchschnittswerte aus den drei besten Werten von fünf Messungen und haben zusätzlich Fehlerbalken, die sich aus der empirischen Standardabweichung dieser drei besten Werte ergeben.
Mit nur 4 Kernen und ohne SMT sind die Unterschiede zum i5 insgesamt nur gering aber der i5 kann sich gerade bei den wichtigen Werten im rechten Bereich etwas absetzen.
Schalten wir bei den 4 zen Kernen SMT hinzu, dreht sich das Bild um. Auch wenn der Durchschnitt leicht sinkt, liegt der Ryzen im rechen Bereich deutlich in Führung, kann aber nicht an echte 8 Kerne herankommen.
Ryzen CCX Konfiguration und SMT
Hier sehen wir, dass sich für Cities Skylines(zumindest mit 3200er Ram) keine Unterschiede von 4+0 zu 2+2 zeigen die über Messungenauigkeiten hinausgehen. Die 2+2 Konfiguration würde der eines 1500X ohne SMT@3,8GHz entsprechen. 4+0 kann man nur bei dem APUs kaufen.
4+0 hat den Vorteil keine Komunikation der Kerne über den IF zu haben, muss im Gegenzug aber mit dem halben L3 Cache zurechtkommen.
Wie schon vorher gezeigt verbesser SMT bei vier Kernen das Spielgefühl deutlich.
Bei 8 Kernen ändert sich dies und das abschalten von SMT erhöht die Performance durch die Bank.
Leistungsaufspaltung beim i5
Keine großen Überraschungen hier.
Nur 2,8 GHz machen sich trotz schnellem Ram nicht gut, die stock Taktraten mit 1600er Ram(Intel Freigabe) müssen sich der Übertaktung auf 4,4GHz geschlagen geben.
Der Wechsel von 1333 auf 1866 macht aus dem 40% schnelleren Ram also ca 15% mehr avg FPS aus und 13,3% mehr 1% low.
Von 2,8 zu 4,4GHz sind es 57% mehr Takt. Dies führt zu einer Steigerung der avg FPS von 42,3% und ganzen 86,7% bei den 1% low.
Die Ram Geschwindigkeit zeigt sich also deutlich, aber nicht so deutlich wie der CPU Takt.
IPC Vergleich
Drei mal vier Kerne, ohne HT/SMT, bei 2,8GHz im Vergleich.
Wie man sehen kann hat sich viel getan was die Leistung pro CPU Takt angeht.
Auch wenn ein guter Teil davon mit schnellere Ram zusammenhängen kann und der C2Q mit einer alten GPU und Windows 7 zurechtkommen muss.
DDR4 Ram Skalierung
Ich habe eine etwas andere Auftragung gewählt.
Wir sehen hier wie sich die verschiedenen Statistikwerte mit steigender Ram Geschwindigkeit verändern.
Bis zu den 5% low Werten ist der Gewinn ziemlich linear.
Die 1% und 0.1% low Werte zeigen eine Sättigung zu höheren Taktraten und profitieren vor allem bis 2666MHz.
Unterschiedliche Ram Skalierung bei 4 Kernen?
Egal ob 4 Kerne ohne SMT, mit SMT oder 8 Kerne mit SMT, der Wechsel von 2133 auf 3200 MHz bringt deutliche wenn auch nicht extreme Leistungsgewinne.
Interssant ist, dass bei SMT ein, der Wechsel auf schnellen Ram bei 4 Kernen sogar minimal besser ist als 8 Kerne mit 2133MHz Ram.
Bei den avg FPS gewinnen 2+2 SMT off 18,2%, 2+2 SMT on 15,8%.
4+4 SMT on gewinnt 13,2%
Windows 7 vs. 10
Wenn nicht anders erwähnt, kommt immer Windows 10 zum Einsatz.
Ich habe mit dem i5 bei 4,4GHz und bei 2,8GHz die Leistung verglichen und es zeigt sich vor allem für die Spielbarkeit ein deutlich besseres Bild bei Windows 10.
Die Unterschiede, die sich im IPC Vergleich bei 2,8GHz zum C2Q gezeigt haben, werden hier dadurch relativiert, dass der i5 unter Windows 7 ebenfalls stark abbaut.
HBCC settings
Alle Unterschiede sind nur selten außerhalb des Konfidenzintervalls und sollten daher mit Vorsicht bewertet werden!
Wenn man es trotzdem macht, sieht man für den i5 einen kleinen Vorteil bei den avg FPS, für 12GB zugewiesenem HBCC.
Beim Ryzen ist es anders und 16GB sind im Durchschnitt leicht schlechter als 8 und 12GB.
Auf der rechten Seite bei den 99th percentile und 0,1% lows wiederum liegen 8GB vor den anderen beiden.
Es ergibt alles wenig Sinn und was man wählt ist vermutlich egal .
Ryzen optimieren und übertakten
Mit dem 1800X habe ich bereits das stärkste Modell der Ryzen 100er Serie.
Aber wie viel Leistung verschenkt man wenn man weder den Ram im Bios einstellt noch den Energiesparplan ändert.
Der ausbalancierte Energiesparplan sollte inzwischen auch für Ryzen funktionieren und nicht mehr die Kerne schlafen legen aber auf Höchstleistung wird nicht heruntergetaktet.
Und wie viel Leistung kann man mit einem minimalen OC auf 3,8GHz und optimieren von Subtimings noch herausholen?
Antwort A.....man verliert ziemlich viel.
Antwort B.....man gewinnt durchaus mehr als ich erwartet hätte.
100MHz mehr allcore(3,6% mehr score in Cinebench) und 9,6% mehr Leserate des Ram bringen immerhin 5,5% mehr avg FPS und 5,2% mehr 1% low.
Einfuss von Ramtakt auf den Infinity Fabric
Hintergrund:
Wer sich mit Ryzen beschäftigt hat, der wird öfter gehört haben, dass Ryzen schnellen Ram braucht, weil sonst die Kommunikation zwischen den CCX durch einen lansamen IF behindert wird.
Aber ist dem auch so? Ich habe noch keinen brauchbaren Test gesehen, der das untersucht hat und habe mir was eigenes überlegt.
Theoretisch ist da schonmal was dran. Gerade in neueren PC Spielen wird die Arbeit auf mehrere Kerne aufgeteilt und es findet viel Kommunikation statt um alles synchron zu halten und die Ergebnisse zusammenzuführen.
Der IF ist an den Takt des Ram gekoppelt und es gibt Veröffentlichungen, die zeigen das sich die Latenzen von einem CCX zum anderen mit schnellerem Ram verbessern.
Die Frage ist, ob dies rein theoretisch ist oder wirklich so signifikant, dass es sich auch in der Spieleperformance niederschlägt.
Leider steigt mit schnellerem Ram auch die Spieleperformance und es wird schwer zu sehen, was davon die IF Verbesserung war und was einfach der schnelle Ram.
Die IF Unterschiede von 2+2 zu 4+0 werden durch den doppelten L3 Cache bei 2+2 verschleiert.
Vorgehen
Bei den Ryzen 8 Kernern hat man die Möglichkeit über das Bios Kerne zu deaktivieren und dies habe ich einmal als 2+2 und einmal als 4+0 Konfiguration gemacht. SMT war deaktiviert.
Dann habe ich beides einmal mit 2133 und einmal mit 3200er Ram getestet.
Dann habe ich den prozentualen Performance Gewinn(2133 zu 3200) einmal für 2+2 und für 4+0 ermittelt und die Differenz gebildet.
Unter der Annahme, das der Gewinn durch den schnelleren Ram gleich sein sollte, zeigt die Differenz also den reinen Einfluss durch den beschleunigten IF.
Die Ergebnisse beruhen allerdings auf je vier fehlerbehafteten Größen und wenn man mit Gaußscher Fehlerfortpflanzung die Fortpflanzung dieser Fehler in das Endergebnis berechnet, zeigen sich leider große Unsicherheiten.
Aber ist dem auch so? Ich habe noch keinen brauchbaren Test gesehen, der das untersucht hat und habe mir was eigenes überlegt.
Theoretisch ist da schonmal was dran. Gerade in neueren PC Spielen wird die Arbeit auf mehrere Kerne aufgeteilt und es findet viel Kommunikation statt um alles synchron zu halten und die Ergebnisse zusammenzuführen.
Der IF ist an den Takt des Ram gekoppelt und es gibt Veröffentlichungen, die zeigen das sich die Latenzen von einem CCX zum anderen mit schnellerem Ram verbessern.
Die Frage ist, ob dies rein theoretisch ist oder wirklich so signifikant, dass es sich auch in der Spieleperformance niederschlägt.
Leider steigt mit schnellerem Ram auch die Spieleperformance und es wird schwer zu sehen, was davon die IF Verbesserung war und was einfach der schnelle Ram.
Die IF Unterschiede von 2+2 zu 4+0 werden durch den doppelten L3 Cache bei 2+2 verschleiert.
Vorgehen
Bei den Ryzen 8 Kernern hat man die Möglichkeit über das Bios Kerne zu deaktivieren und dies habe ich einmal als 2+2 und einmal als 4+0 Konfiguration gemacht. SMT war deaktiviert.
Dann habe ich beides einmal mit 2133 und einmal mit 3200er Ram getestet.
Dann habe ich den prozentualen Performance Gewinn(2133 zu 3200) einmal für 2+2 und für 4+0 ermittelt und die Differenz gebildet.
Unter der Annahme, das der Gewinn durch den schnelleren Ram gleich sein sollte, zeigt die Differenz also den reinen Einfluss durch den beschleunigten IF.
Die Ergebnisse beruhen allerdings auf je vier fehlerbehafteten Größen und wenn man mit Gaußscher Fehlerfortpflanzung die Fortpflanzung dieser Fehler in das Endergebnis berechnet, zeigen sich leider große Unsicherheiten.
Ganz wichtig sind hier die Fehlerbalken!
Nur die oberen drei Werte haben eine Aussagekraft und auch diese ist nur begrenzt!
Grob kann man sagen, dass eine Beschleunigung des IF um 50%, um die 2% bessere FPS in Cities Skylines ausmacht.
Mein Fazit aus diesem speziellen Ergebnis lautet:"Da das Spiel von schnellerem Ram profitiert, sollte man wenn möglich diesen einsetzen. Die Angst das der IF sonst deutlich limitiert ist jedoch nicht begründet.
4+0 profitiert fast genauso viel nur durch den Ram und der i5 profitiert ebenfalls."
Fazit:
Cities Skylines ist vor allem CPU limitiert.
Es liebt mehr CPU Takt, mag mehr Ram Takt und kann mit mehr als 4 Threads etwas anfangen.
Wie man schon an der Auslastung der CPU im Video sieht, werden 20-25% der 16Threads ausgelastet. Das entspricht vier Kernen und da verwundert es wenig, wenn mit 8 Kernen SMT besser deaktiviert sein sollte und ich erwarte das gleiche für 6 Kerne.
HBCC und den Infinity Fabric kann man ignorieren, Windows 7 sollte jedoch gemieden werden.
Die vielen Frametimeschwankungen scheinen am Spiel zu liegen und können zwar verbessert aber nicht verhindert werden.
Zuletzt bearbeitet: