Pjack schrieb:
Urgh....Youtube Videos ohne Erklärung zu den Einstellungen und mit vielen fragwürdigen Begebenheiten.
...und im trotzdem bestätigen sie das was ich geschrieben habe.
Ich habe mich beim Nutzen von SMT und HT vor allem auf die quadcores bezogen....nicht auf die 6 Kerne.....da kann es was bringen, wenn diese richtig ausgelastet sind, was aber die meisten Spiele nicht schaffen....und auch nur in CPU intensiven Szenen.
Wo HT/SMT nicht gebraucht wird, um fehlende Rohleistung auszugleichen kostet der Verwaltungsaufwand minimal Leistung....genau das zeigen die Videos....Aber du wirst dich wohl kaum darum kümmern wollen ob zu im Metro 130 oder 140FPS hast?? Das ist ein Unterschied von 0,45ms pro Frame....das merkt niemand.
Da gibt es dutzende Dinge, die mich an den beiden Videos stören.
1. Das 8700K Video setzt auf sehr hohe FPS über tendenziell niedrige Settings.....Nicht nur vergleicht man dann FPS in einem unsinnigen Bereich, weil der Unterschied nicht zu spüren ist.....niedrige Settings belasten oft auch die CPU weniger.
2. Ich zitiere zwei Kommentare darunter: "basicly no games that struggle with framerate anyway :< " und "this raises more questions than awsners "
Die Spieleauswahl will ich gar nicht groß kritisieren....es sind beliebte Spiele und es wird daher viele Leute interessieren.....aber selbst da, wo es interessante Unterschiede geben kann, wurden sie meist geschickt umgangen.
....und es bleibt ein Videovergleich von
einem Messdurchlauf....das ist sehr fraglich und für Multiplayer-Spiele absolut nicht zu vergleichen.
Das eine Video zeigt am Ende die FPS und 1%low Frametimes, aber erwähnt nicht, dass hier mehrere Messungen gemittelt wurden oder wie gemessen wurde. Daher muss ich von nur einer Messung ausgehen und das wäre nicht ausreichend bei den oft geringen Unterschieden....und es wäre wichtig, wie die 1%low gemessen wurden....ich hoffe nicht mit dem MSI Afterburner der fürs Overlay verwendet wurde, denn die Benchmarkfunktion die da integriert ist, ist abenteuerlich undurchschaubar und unzuverlässig.....ich weiß, dass manche Youtuber die nutzen, aber man sollte sie definitiv meiden.....Der Entwickler hat auf die Frage auf welche Art bei den X%Low gemessen wurde ein vielsagendes "It works as intended." geantwortet.....Aha..."Nein danke!"
3. Testszenen......
Pubg(einzeltest einem MP Spiels).....
.BF 1 oft an einem 200FPS limiter und mit DX11...
Hitman in dem eher weniger CPU intensiven ersten Level...Einstellungen für FPS weit über 100FPS und der eher unzuverlässige integrierte Benchmark(eigene Erfahrung)....und dann in DX11, wo es erst mit DX12 möglich wird, mehr Threads sinnvoll zu nutzen....
Witcher 3 low,low,low für den 8700K und hier mag es mit Nvidia GPU viel später zu einem CPU limit kommen. In dem R5 1600 Video sind die FPS sehr viel niedriger, und dann zeigt isch halt wieder, dass die 6 Kerne ausreichen(Meiner Erfahrung nach sind 4 Kerne ohne SMT aber zu wenig für hohe Settings und flüssige FPS)........zu
Fallout kann ich nix sagen.....PCars ist wieder eine Mischung aus low und off, bei fast 300FPS.....GTA V ist auch bei 65-75% der 6 Kerne im CPU limit, was wo wieder 6 Kerne ausreichend sind aber 4 Kerne Probleme haben könnten. Außerdem wieder FPS über 100....
RotTR mit dem schlechten integrieren Benchmark und DX11. Das Spiel hat definitiv Szenen, die mit DX11 ruckelig laufen und wo man mit DX12 mit mehr Threads Vorteile hat...aber nicht in dem GPU orientierten Benchmark und nicht in DX11.....
SotTR in dem anderen Video , hat die gleichen Kritikpunkte. GPU Lastige Szene mit vielen FPS getestet aber nicht eine der CPU intensiven Szenen des Spiels gewählt....
AC:Odyssey habe ich eher als solala CPU optimiert getestet, aber hier zeigt sich zum ersten Mal, dass eine Szene gewählt wurde, die eine 6 Kern CPU ins Schwitzen bringt.
um die 90% Auslastung der 6 Kerne und jetzt sieht man auch, dass SMT etwas bringt und das auch in einem Bereich um 60FPS, der spürbar sein kann.......Far Cry:ND mit dem unzuverlässigen integrierten Benchmark(eigene Erfahrung).....Kingdome come Deliverance, auf einer einsammen Straße getestet anstatt in einem CPU intensiven Bereich mit NPCs.......Fortnite ist MP.....Und die anderen drei Spiele im Video haben auch völlig unkritische FPS und zeigen keine CPU intensiven Szenen.
....Fazit....eigentlich passen alle gezeigten Szenen zu dem was ich gesagt habe....HT/SMT hilft erst etwas wenn die Spielszene auch nach mehr Leistung verlangt, als die normalen Kerne der CPU bereitstellen können.
Das ist bei all den gezeigten Szenen nur in AC:O der Fall.
Sonst kann man mit HT/SMT etwas Leistung verlieren, aber es ist nur wenig und eines von den alten Beispielen, wo man starke Verluste hatte weil das Spiel beide virtuellen Threads zu einem Kern überlastet und dafür andere Threads ignoriert, war nicht dabei.
Daher bedeutet das für mich....du verlierst nie wirklich was....aber wenn es kritisch wird, kann es dir helfen...also lass es aktiviert.
4. So ein Video hat Vorteile, weil man sieht, an welcher Stelle welche Leistung erreicht wird....das sehe ich positiv.
Aber wer guckt denn das ganze Video super aufmerksam links und rechts vergleichend, um die interressanten Szenen zu suchen......Dafür bröuchte man eine zuverlässige Messung der 1% low Frametimes oder der 99th Percentile....das bedeutet natürlich mehrere Messungen für einen brauchbaren Mittelwert...und vor allem Messungen mit einem geeigneten Programm für Frametimemessungen(Fraps, OCAT(ohne overlay!), CapFrameX). Da gibt es nicht viele Youtuber, denen ich das zutraue.......HWunboxed mittelt mehrere Läufe und ich meine sie haben mal gesagt, dass sie unrealistische Messungen rausnehmen.....Gamers Nexus misst auch mehrere Male und sie bilden immer die Standardabweichung(welche Variante weiß ich nicht) und wenn diese zu schlecht ist, machen sie mehr Messungen bis der Fehler kleingenug ist.......sind beides sinnvolle Varianten, und beide berechnen die 1% und 0.1% low Frametimes korrekt...sie bilden den Mittelwert der schlechtesten 1 bzw. 0,1% der Frametimes.
So sieht man am Mittelwert, welche CPU mehr Frametimes raushaut, und an den 1% low sieht man entweder wenn die Schwankungen weit runter gehen, oder wenn Phasen des Benchmarks schlecht laufen.
Und vor allem achten beide darauf, für CPU Tests auch CPU intensivere Szenen zu verwenden!
Pjack schrieb:
Ich habe aber ehrlich gesagt auch keinen Test gefunden, der das breitgefächert über einen ausgewogenen Spieleparkour untersucht, vor allem auch im Bezug auf minimale FPS.
Das sind jetzt nicht viele Spiele....aber zumindest vertraue ich den Daten.
Pjack schrieb:
Witcher 3 ist oben in beiden Videos mit drin. Ich sehe da keinen erwähnenswerten Unterschied.
Wie oben erklärt sind einmal die Settings zu anspruchslos und einmal reichen die 6 Kerne schon aus...meine Aussage war, dass 4 Kerne ohne HT/SMT zu wenig sind.
Pjack schrieb:
Warum ist das so? Gerade Games mit den völlig unterschiedlichen Inhalten der Threads sollten für SMT wenig zu holen bieten. SMT ist dann stark, wenn Cores gleichartige Aufgaben ausführen, d.h. Daten für den eingeschobenen virtuellen Thread bereits im Cache liegen. Gerade das ist doch in Spielen unwahrscheinlich, wenn man nicht speziell dafür entwickelt.
Ist in der Regel genau andersherum.
Sind die Daten im L1 Cache(grob 1ns), dann sind für jede Berechnung sofort die Daten bereit und die CPU hat keine Wartezeiten....HT/SMT kann hier(wie du sagst) zu leichten Nachteilen führen, wenn die Threads an unterschiedlichen Daten rechnen und sich gegenseitig die Daten aus dem L1 Cache werfen.
Hier ist HT/SMT also etwas langsamer, denn der Kern wäre auch ohen HT/SMT super ausgelastet...keine Wartezeiten...alles super......mit SMT...muss vermutlich öfter auf den L2 Cache (grob 3ns)zugegriffen werden...oder gar auf dem L3 Cache(9ns).
Aber in Spielen liegen die Daten an denen gearbeitet wird, ziemlich oft nicht im Cache... Es passieren für die CPU unvorhergesehen Dinge...die Sprungvorhersage kann nicht gut arbeiten...einige Daten sind sehr groß...Alles in allem gibt es viele Cache misses und der Ram wird oft benötigt.
Und sofern das Spiel die Arbeit sinnvoll auf genügend Threads aufteilen kann, kommen hier die Vorteile durch.
Anstatt dass ein Thread auf einem CPU Kern ( bei AMD-Zen+ 60-90ns) auf eine Antwort des Rams wartet und dann erst die nächste Berechnung durchgeführt werden kann, kann mit HT/SMT ein zweiter Thread der seine Daten schon im Cache finden kann sich vormogeln und somit steigert sich die interne Auslastung des Kerns.
Von Außen sieht man die interne Auslastung nicht....was Windows da angibt ist eher sowas wie(
gibt es X% der Zeit eine Warteschlange an Berechnungen bei dem Kern).
Das ist auch der Fall wenn der CPU Kern ohne HT/SMT einfach mal 70ns auf die Daten aus dem Ram wartet und alles sich staut.
Auch wenn der zweite Thread seine Daten nicht im Cache findet, kann er zumindest schonmal eine Ramanfrage stellen und hat sie dann wenn seine Berechnung an der Reihe ist, schneller
parat.
In Situationen, wo es ein Spiel schafft, wirklich alle virtuellen Threads, komplett auszulasten...und es sehr Ramlimitiert läuft, kann SMT/HT die Leistung einer CPU in Spielen verdoppeln....siehe dual core CPUs mit HT....die sind dann fast so schnell wie 4 Kerne ohne HT.
Ist z.B. in dem HW unboxed Video am Ende eingefügt.
Natürlich hilft es nur so viel, wenn die CPU wirklich komplett mit Arbeit überhäuft ist, und diese Arbeit aus einfachen Berechnungen mit extrem vielen Cache misses besteht.....aber so eine Steigerung hast du in Benchmarks die aus dem Cache heraus laufen wie Cinebench nie.
Pjack schrieb:
Dazu hätte ich gern die Quelle. Weil das klingt nach einem Review, das die Frage endlich mal tiefgründiger aufgreift, als es meistens der Fall ist.
Ich kann meine eigenen Daten aus 2018 anbieten...Settings wähle ich so, dass ich meine ausreichend gute FPS für möglichst gute Optik zu bekommen....Auflösung ist 1440p...
Hitman bei einem Lauf über den Marktplatz und eine angrenzende Gasse in Marrakesch:
Ist jeweils die zweitbeste Messung was die 0.1% low Frametimes angeht, aus 5 Messungen insgesamt.
Hier die statistische Auswertung:
4 Kerne sehen bei den FPS gar nicht so schlecht aus, aber es fühlt sich deutlich schlechter an....und SMT reicht schon, um die 4 Kerne fast auf ein Level mit 8 echten Kernen zu bringen..die haben dann nur winzige Unterschiede über SMT....und SMT off ist minimal besser, aber eben auch nicht spürbar schlechter.
The Witcher 3 bei einem Lauf durch Novigrad bei Nacht...mal viele NPCs, mal wenige.
..da wo viele NPCs auf einem Haufen sind, zeigen sich die Unterschiede durch SMT.
Hier sieht man, wie 8 Kerne+ SMT zwar nicht spürbar besser sind als 4Kerne+ SMT, aber geringere Frametimeschwankungen aufweisen.
https://www.computerbase.de/forum/attachments/w3-graph-8-vs-4-smt-png.678715/
Hier in Zahlen....vier Zen Kerne ohne SMT fallen auf 50FPS... mit SMT auf 60FPS....und 8Kerne können nicht sinnvoll genutzt werden und bringen keine weiteren Vorteil:
https://www.computerbase.de/forum/attachments/w3-i5-zen-png.678713/
Pjack schrieb:
Welche Games umgehen denn den Windows Scheduler?
Ansonsten klingt das bei dir alles irgendwie nach Hören-Sagen...das, was man halt in Foren jedes Mal zu lesen bekommt, wenn das Thema angeschnitten wird.
Da liest es sich dann immer so, als wären die 100 bis 200 Euro gerechtfertigt, die Intel dafür in der Regel aufruft. Ich bezweifle das immer noch.
Als einziges aktuelles Beispiel fällt mir Frostpunk ein, allerdings hat das vor wenigen Monaten einen Patch erhalten, der das Problem gelöst hat....zusammen mit einigen anderen Optimierungen läuft es jetzt richtig gut.
Ansonsten ein paar ganz alte Spiele aus der dual/quad core Zeit....wo man noch nicht mit X Kernen programmiert hat und dann gesagt hat..das läuft hier und das läuft auf Kern 2.
Ich weiß es nicht mehr genau...ich glaube Mafia 2 und Company of Heroes waren dabei....aber nagel mich da nicht drauf fest.
......ob es sich lohnt.....gute Frage.....wer sich einen ivy oder sandy bridge i7 gekauft hatte, der hat damals nicht profitiert und erst jetzt, gibt es die Spiele, die mit HT sinnvoll was anfangen können......Hat sich das gelohnt, damals mehr Geld auszugeben?
Wenn die CPU jetzt noch im Einsatz ist und mit einer modernen GPU gekoppelt ist....eventuell??
Dann ist aber damals auch oft nu 8GB Ram verbaut gewesen und der ist dann inzwischen knapp und DDR3 Nachkaufen für ein altes System wäre nicht so mein Ding.
Ob es sich jetzt lohnt....auch eine gute Frage....einen Quadcore wird jetzt keiner mehr im Desktop Bereich kaufen, der sich um HT/SMT Gedanken macht.......im Mobilen Bereich würde ich mit 4 Kernen auf jeden Fall zu HT/SMT raten...aber die haben das eh fast alle.
Ist die Frage was mit einem i5 8400 oder einem i7 9700K ist....aus meiner Sicht gibt es für beide bessere Alternativen von AMD, die SMT haben.....und ganz Selten gibt es auch Spiele, die mit 8 Threads oder weniger....in Verbindung mit zu hohen FPS in Probleme kommen.
GTA V und RDR2, können sich mit sehr hohen FPS und nur 8 Threads oder weniger daran"verschlucken" und fies Stottern.....ziemliche Ausnahmesituationen, und eher ein Fehler der Programmierer, aber zumindest 6 Kerne würde ich nicht ohne HT/SMT kaufen.....und wenn ich eine CPU mit HT/SMT habe, dann ergibt es keinen Sinn dies zu deaktivieren um irgendwo minimal mehr FPS zu erhalten......das sieht mit einer 16 Kern+ CPU eventuell anders aus, da kann der Unterschied grüßer ausfallen.....aber die kaufen sich die meisten Leute ja nicht fürs Gaming, und wollen für andere Anwendungen viele Kerne und Threads....Aber da würde ich SMT wohl selbst auch deaktivieren..für meinen 8 Kerner lasse ich es aktiviert.