Leserartikel Performance Efficiency Suite (PES)

TheCrazyIvan · 18. Juli 2021

@Bigeagle
Sehr interessante Beobachtung. Laut Website der Bibliothek, die ich verwende, sollte Ivy Bridge eigentlich unterstützt werden: https://openhardwaremonitor.org/documentation/

Vielleicht schaust Du Dir das Ganze noch einmal an, während Du den OpenHardwareMonitor sowie HWInfo parallel laufen lässt.

TheCrazyIvan · 18. Juli 2021

Bigeagle schrieb:
Bezüglich Sampling und sleep: Ich dachte nicht daran ohne sleep zu messen, sondern einen festen Takt vorzugeben und das sleep daran anzupassen. quasi
gettime
messen
gettime
sleep(10ms - dauer zum messen)

mit warnung/hinweis wenn die effektive zeit unter einen schwellwert fällt weil die messung zu lange dauert und einen hinweis falls der takt nicht eingehalten werden konnte weil die messung mehr als einen slot belegt hat.

Wie versprochen habe ich darüber nochmal ein wenig nachgedacht:
In meinen Augen besteht das Problem dieses Ansatz darin, dass das Sampling teilweise sehr unterschiedlich ausfällt - also auch innerhalb eines Runs differiert das bei meiner Maschine teilweise sehr stark. Das einmalige Messen der "Messdauer" würde da IMHO nicht viel bringen. Auf die 10ms bin ich wie gesagt empirisch gekommen - zumindest bei meiner Maschine hat das Weglassen der Begrenzung nach unten nicht zu einer signifikanten Steigerung der Sample-Anzahl geführt.

Ergänzung (18. Juli 2021)

andi_sco schrieb:
Ryzen 5 3500U im hp 15s-eq0355ng, 2x8 GB DDR4-2400, 512 GB nvme SSD, Windows 11 Pro
Einmal mit ca. 1,7 GHz Takt und dann ungedrosselt.

Anbei Dein Ergebnis (und zwar das ungedrosselte).

Ergänzung (18. Juli 2021)

JeanLegi schrieb:
Moin,

hier mal noch zwei Werte mit der CPU aus dem Testsample GL66, der erste Wert ist Windows "Beste Leistung" und der zweite ist Windows "Bessere Leistung".

"Beste Leistung"
Anhang anzeigen 1102728

"Bessere Leistung"
Anhang anzeigen 1102729

Hm, da waren aber die Werte im OP Deines Artikels deutlich besser - verstehe ich irgendwie nicht so ganz...

Ergänzung (18. Juli 2021)

@Tenferenzu / @Asghan / @andi_sco
Von Euch Dreien gibt es nun jeweils Werte zum 3500U:

Tenferenzu ist viel zu gut
andi_sco ist viel zu schlecht
Asghan könnte ungefähr hinkommen

Ich werde in Kürze die Version v0.7.0 releasen - da habe ich die Methodik zur MT-Messung verändert.
Ich würde Euch bitten, dann nochmal eine Messung mit Standard-Presets (Steckdose, bessere/beste Leistung, wasauchimmer in Vantage) durchzuführen. Bei drei derart unterschiedlichen Werten weiß ich nicht, was gehauen und gestochen ist.

TheCrazyIvan · 18. Juli 2021

Update

Rankings aktualisiert - siehe Post #2
Letzter berücksichtigter 3DC-Ergebnis-Post: #186
Letzter berücksichtigter CB-Ergebnis-Post: #122

andi_sco · 18. Juli 2021

TheCrazyIvan schrieb:
Von Euch Dreien gibt es nun jeweils Werte zum 3500U:

Tenferenzu ist viel zu gut

andi_sco ist viel zu schlecht

Asghan könnte ungefähr hinkommen

Schon seltsam
@Tenferenzu und @Asghan welche Laptops nutzt Ihr denn?

Tenferenzu · 18. Juli 2021

@andi_sco Ein ThinkPad E495. Weitere Infos warum mein Wert Blödsinn sein könnte stehen schon im Post #10

@TheCrazyIvan ein @ wäre nett wenn die neue Version da ist! Dann lass ich es direkt in der Mittagspause mal durchlaufen auf der Arbeit.

TheCrazyIvan · 18. Juli 2021

Tenferenzu schrieb:
@TheCrazyIvan ein @ wäre nett wenn die neue Version da ist! Dann lass ich es direkt in der Mittagspause mal durchlaufen auf der Arbeit.

Claro!
Noob-Frage: Gibt es eigentlich sowas wie @ Alle Thread-Nutzer?

Asghan · 18. Juli 2021

@andi_sco Bei mir ebenso ein Lenovo E495. (RAM in DualChannel, 2x8 GB)

Kannst du was sagen wann 0.7.0 ca kommt?

TheCrazyIvan · 18. Juli 2021

Asghan schrieb:
Kannst du was sagen wann 0.7.0 ca kommt?

Entweder noch heute oder morgen.
Muss nur noch die ReadMe anpassen und wollte @LordPoekel noch Zeit geben, seine LibreOffice-Datei darauf anzupassen.

Ihr könnt es aber gern bereits testen: https://github.com/BrsVgl/PerformanceEfficiencySuite/releases

Bigeagle · 18. Juli 2021

TheCrazyIvan schrieb:
@Bigeagle
Sehr interessante Beobachtung. Laut Website der Bibliothek, die ich verwende, sollte Ivy Bridge eigentlich unterstützt werden: https://openhardwaremonitor.org/documentation/

Vielleicht schaust Du Dir das Ganze noch einmal an, während Du den OpenHardwareMonitor sowie HWInfo parallel laufen lässt.

Ich gehe davon aus dass die wie hwinfo64 auch nur die Werte ausliest die die CPU bereitstellt. Da dürfte sich, bugs außen vor, nichts ändern wenn man die library wechselt mit der die Daten ausgelesen werden.
Dazu stimmen die Werte ja an sich, ist nicht so als würde da etwas nicht so funktionieren wie es meines wissens nach soll. Nur ist das was rauskommt eben nicht das was viele denken das es ist. Es kann aber sein dass bei neueren Generationen tatsächlich Strom und Spannung gemessen werden, oder Änderungen an Spannung und Takt mit in die Schätzung einfließen. Wenn die CPU exakt mit stock settings ohne Turbo läuft kommen die Werte ja hin.

TheCrazyIvan schrieb:
In meinen Augen besteht das Problem dieses Ansatz darin, dass das Sampling teilweise sehr unterschiedlich ausfällt - also auch innerhalb eines Runs differiert das bei meiner Maschine teilweise sehr stark. Das einmalige Messen der "Messdauer" würde da IMHO nicht viel bringen. Auf die 10ms bin ich wie gesagt empirisch gekommen - zumindest bei meiner Maschine hat das Weglassen der Begrenzung nach unten nicht zu einer signifikanten Steigerung der Sample-Anzahl geführt.

Deshalb ja die Idee zu messen, aber nicht einmalig, sondern innerhalb der Schleife. Die Zeit abrufen sollte nicht zu teuer sein. Kurzer Test in Python bei mir sagt dass time.time() (welches sekunden seit epoch als float zurückgibt) etwas mehr als 10 Mio. mal pro Sekunde durchläuft.
Es soll ja dafür sorgen dass der genaue Takt der Messungen eingehalten wird wenn möglich, unabhängig davon ob einzelne Messungen mal länger dauern, oder allgemein auf der gerade zu testenden Maschine langsam sind.

Vielleicht machts ein Beispiel einfacher.
Angenommene Benchmarkzeit jeweils 60 Sekunden.
Fall 1: Messung dauert 1 ms, danach 10 ms sleep. Die erste Messung findet bei 0 ms statt, die zweite bei 11, die dritte bei 22 usw. Es finden 5454 Messungen statt.
Fall 2: Messung dauert 1 ms, danach 9 ms sleep, zweite Messung dauert 5 ms, danach nur 5 ms sleep, dritte Messung 2 ms, danach 8 ms sleep. Es finden 6000, bzw 5999 Messungen statt, je nachdem ob die letzte noch gemacht wird da der Benchmark ja exakt zu beginn beendet ist

Zusätzlich würde ich mitzählen und angeben wie viele Messungen ausgefallen sind weil sie ihr Zeitfenster nicht geschafft haben. Das hilft ggf. bei der Fehlersuche wenn komische Ergebnisse rauskommen und zeigt dass das Interval zu kurz war, bzw der PC zu langsam.

Ich finde in der Doku leider nichts eindeutiges zur Art wie die Werte ermittelt werden. Aber ggf. könnte man per low-level zugriff genauere Werte bekommen, denn die geben tatsächlich Energie an und nicht Leistung.
Kapitel 14.10, Seite 45 MSR_PKG_ENERGY_STATUS
Bei ungefähr 60 Sekunden Wraptime braucht man sich auch keinen Stress mit dem Sampling machen.
Leider stehe ich gerade total auf dem Schlauch bei der Frage wie viel denn nun safe in das Register passt. 15,3 µJ als Standardeinheit, 32 bit unsigned Int. Irgendwie kommt da nichts sinnvolles in Verbindung mit den 60 Sekunden raus. Außer Intel hat tatsächlich über 500 W einkalkuliert.
Eigentlich würde das die ganze Messung erheblich vereinfachen (Messung am Start, Ende und mindestens einmal pro Minute mittendrin und am Ende addieren) und würde Fehler durchs Sampling vermeiden.

Für AMD weiß ich auf die Schnelle nix. Da kann jemand anders suchen ^^

P.S.: Die übergeordnete Seite zu den Intel Architecture Dokus

Tenferenzu · 18. Juli 2021

mit 0.7.0. R5 3500u Thinkpad E495, 32GB RAM dual Channel. 2. Run folgt sogleich da der ST Test doch etwas komisch aussieht.

TheCrazyIvan · 18. Juli 2021

@Tenferenzu
Ich bin wirklich überrascht, wie niedrig TDP und auch Peak bei Deinem Thinkpad liegen. Kann man da mit Avantage oder wie das bei Lenovo heißt noch Einfluss drauf nehmen? Die scheinen Laufzeit bei den Thinkpads deutlich höher zu wichten als Performance.

Ergänzung (18. Juli 2021)

BTW...
Hat hier wirklich niemand einen Rocket Lake oder trauen sich die Besitzer nicht?

Tenferenzu · 18. Juli 2021

Gleiches Thinkpad E495 mit R5 3500u, dieses mal ganz im Idle am Strom angeschlossen, Windows Profil 'Ausbalanziert', Vantage Einstellung 'Leistung'.

Noch ein run, dieses mal mit dem Vantage Profil 'Leise und Kühl', ansonsten sind alle Einstellungen gleich.

Und noch einer mit den Standardeinstellungen vom ersten Durchlauf da der ST Test nun endlich halbwegs 'stabil' (wenig Taktunterschiede) ist.

JeanLegi · 18. Juli 2021

@TheCrazyIvan Vorsicht andere CPU anstatt des AMD 5800H. Ich habe hier noch ein Egineering Sample mit einer Intel CPU (ebenfalls Engineering Sample) aufgrund der Werte aus CPU-Z könnte es sich dabei um einen 11980HK oder 11900H handeln. Wobei könnte, könnte, könnte.

TheCrazyIvan · 18. Juli 2021

JeanLegi schrieb:
@TheCrazyIvan Vorsicht andere CPU anstatt des AMD 5800H. Ich habe hier noch ein Egineering Sample mit einer Intel CPU (ebenfalls Engineering Sample) aufgrund der Werte aus CPU-Z könnte es sich dabei um einen 11980HK oder 11900H handeln. Wobei könnte, könnte, könnte.

Achso, spuckt das HWInfo nicht aus?

JeanLegi · 18. Juli 2021

nein, spuckt es leider nicht aus😒

TheCrazyIvan · 18. Juli 2021

JeanLegi schrieb:
nein, spuckt es leider nicht aus😒

Hm, aber egal. In jedem Fall ein TGL-H. Den hatten wir noch nichtm

andi_sco · 19. Juli 2021

Hier ein Ryzen 5 2500U aus einem acer Aspire 3, Win 10 Pro, OEM nvme SATA SSD, 2x8 GB DDR4-2400

Max. Temp. laut Task Manager 75° C und getestet mit 0.7 (Energiesparplan 1usmus Universal)

Edit: teste meinen 3500U jetzt auch nochmal mit 0.7
Edit: melde Ausführung

PS du wunderst dich ja, das meine Ergebnisse so schlecht sind: mit Windows 11 sind die CB Werte tatsächlich eingebrochen, ist aber auch noch die erste Version:

andi_sco schrieb:
So, da auf dem Rechner testweise Win 11 als Pro Version läuft, habe ich mal den Cinebench R10 durchlaufen lassen:

Takt in GHz Windows Punkte
1 Kern 2 Kerne 4 Kerne 8 Kerne
1,6 GHz Ryzen 5 3500U Windows 10 Pro 3247 6616 11684 13182
max. Takt Win 10 7326 13198 19736 25492
1,6 GHz Windows 11 Pro 2608 8143
max. Takt Win 11 5256 16232

Die Werte sind kräftig eingebrochen
Ich werde die anderen Werte noch nachtragen

TheCrazyIvan · 19. Juli 2021

UPDATE

Version 0.7.0 releast.
Download und Changes hier: PES GitHub Repo: Release v0.7.0
Eine kompatible Version der LibreOffice Auswertung ist hier zu finden: 3DC-Thread Post #194 (Dank an [Lord]Poekel)

@Tenferenzu (Du wolltest es ja so)

Tenferenzu · 19. Juli 2021

In Post 132 habe ich schon 3 runs mit dem 0.7.0 RC gepostet.

@TheCrazyIvan

Beitrag im Thema "Performance Efficiency Suite (PES)" https://www.computerbase.de/forum/threads/performance-efficiency-suite-pes.2031876/post-25846547

Asghan · 19. Juli 2021

mein 3500U rennt gerade, Ergebnisse gibts dann bald (ich mach wieder beides: "Performance" und "Leise und Kühl").

//hier sind sie.

Takt in GHz		Windows	Punkte 1 Kern	2 Kerne	4 Kerne	8 Kerne
1,6 GHz	Ryzen 5 3500U	Windows 10 Pro	3247	6616	11684	13182
max. Takt		Win 10	7326	13198	19736	25492
1,6 GHz		Windows 11 Pro	2608		8143
max. Takt		Win 11	5256		16232

Leserartikel Performance Efficiency Suite (PES)

Ensign

Ensign

Anhänge

Ensign

Legends of Tomorrow

Vice Admiral Pro

Ensign

Der Ranglose Pro

Ensign

Lt. Commander

Vice Admiral Pro

Ensign

Vice Admiral Pro

Lieutenant

Ensign

Lieutenant

Ensign

Legends of Tomorrow

Anhänge

Ensign

Vice Admiral Pro

Der Ranglose Pro

Anhänge

Ähnliche Themen

Passend zum Thema