Leserartikel Performance Efficiency Suite (PES)

Bigeagle schrieb:
Bezüglich Sampling und sleep: Ich dachte nicht daran ohne sleep zu messen, sondern einen festen Takt vorzugeben und das sleep daran anzupassen. quasi
gettime
messen
gettime
sleep(10ms - dauer zum messen)

mit warnung/hinweis wenn die effektive zeit unter einen schwellwert fällt weil die messung zu lange dauert und einen hinweis falls der takt nicht eingehalten werden konnte weil die messung mehr als einen slot belegt hat.
Wie versprochen habe ich darüber nochmal ein wenig nachgedacht:
In meinen Augen besteht das Problem dieses Ansatz darin, dass das Sampling teilweise sehr unterschiedlich ausfällt - also auch innerhalb eines Runs differiert das bei meiner Maschine teilweise sehr stark. Das einmalige Messen der "Messdauer" würde da IMHO nicht viel bringen. Auf die 10ms bin ich wie gesagt empirisch gekommen - zumindest bei meiner Maschine hat das Weglassen der Begrenzung nach unten nicht zu einer signifikanten Steigerung der Sample-Anzahl geführt.
Ergänzung ()

andi_sco schrieb:
Ryzen 5 3500U im hp 15s-eq0355ng, 2x8 GB DDR4-2400, 512 GB nvme SSD, Windows 11 Pro
Einmal mit ca. 1,7 GHz Takt und dann ungedrosselt.
Anbei Dein Ergebnis (und zwar das ungedrosselte).
Ergänzung ()

JeanLegi schrieb:
Moin,

hier mal noch zwei Werte mit der CPU aus dem Testsample GL66, der erste Wert ist Windows "Beste Leistung" und der zweite ist Windows "Bessere Leistung".

"Beste Leistung"
Anhang anzeigen 1102728

"Bessere Leistung"
Anhang anzeigen 1102729
Hm, da waren aber die Werte im OP Deines Artikels deutlich besser - verstehe ich irgendwie nicht so ganz...
Ergänzung ()

@Tenferenzu / @Asghan / @andi_sco
Von Euch Dreien gibt es nun jeweils Werte zum 3500U:
  • Tenferenzu ist viel zu gut
  • andi_sco ist viel zu schlecht
  • Asghan könnte ungefähr hinkommen

Ich werde in Kürze die Version v0.7.0 releasen - da habe ich die Methodik zur MT-Messung verändert.
Ich würde Euch bitten, dann nochmal eine Messung mit Standard-Presets (Steckdose, bessere/beste Leistung, wasauchimmer in Vantage) durchzuführen. Bei drei derart unterschiedlichen Werten weiß ich nicht, was gehauen und gestochen ist.
 

Anhänge

  • CB #83 andi_sco 2021-07-18 095323.png
    CB #83 andi_sco 2021-07-18 095323.png
    103,6 KB · Aufrufe: 259
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Asghan und andi_sco
Update
  • Rankings aktualisiert - siehe Post #2
  • Letzter berücksichtigter 3DC-Ergebnis-Post: #186
  • Letzter berücksichtigter CB-Ergebnis-Post: #122
 
TheCrazyIvan schrieb:
Von Euch Dreien gibt es nun jeweils Werte zum 3500U:
  • Tenferenzu ist viel zu gut
  • andi_sco ist viel zu schlecht
  • Asghan könnte ungefähr hinkommen
Schon seltsam
@Tenferenzu und @Asghan welche Laptops nutzt Ihr denn?
 
@andi_sco Bei mir ebenso ein Lenovo E495. (RAM in DualChannel, 2x8 GB)

Kannst du was sagen wann 0.7.0 ca kommt?
 
TheCrazyIvan schrieb:
@Bigeagle
Sehr interessante Beobachtung. Laut Website der Bibliothek, die ich verwende, sollte Ivy Bridge eigentlich unterstützt werden: https://openhardwaremonitor.org/documentation/

Vielleicht schaust Du Dir das Ganze noch einmal an, während Du den OpenHardwareMonitor sowie HWInfo parallel laufen lässt.
Ich gehe davon aus dass die wie hwinfo64 auch nur die Werte ausliest die die CPU bereitstellt. Da dürfte sich, bugs außen vor, nichts ändern wenn man die library wechselt mit der die Daten ausgelesen werden.
Dazu stimmen die Werte ja an sich, ist nicht so als würde da etwas nicht so funktionieren wie es meines wissens nach soll. Nur ist das was rauskommt eben nicht das was viele denken das es ist. Es kann aber sein dass bei neueren Generationen tatsächlich Strom und Spannung gemessen werden, oder Änderungen an Spannung und Takt mit in die Schätzung einfließen. Wenn die CPU exakt mit stock settings ohne Turbo läuft kommen die Werte ja hin.
TheCrazyIvan schrieb:
In meinen Augen besteht das Problem dieses Ansatz darin, dass das Sampling teilweise sehr unterschiedlich ausfällt - also auch innerhalb eines Runs differiert das bei meiner Maschine teilweise sehr stark. Das einmalige Messen der "Messdauer" würde da IMHO nicht viel bringen. Auf die 10ms bin ich wie gesagt empirisch gekommen - zumindest bei meiner Maschine hat das Weglassen der Begrenzung nach unten nicht zu einer signifikanten Steigerung der Sample-Anzahl geführt.
Deshalb ja die Idee zu messen, aber nicht einmalig, sondern innerhalb der Schleife. Die Zeit abrufen sollte nicht zu teuer sein. Kurzer Test in Python bei mir sagt dass time.time() (welches sekunden seit epoch als float zurückgibt) etwas mehr als 10 Mio. mal pro Sekunde durchläuft.
Es soll ja dafür sorgen dass der genaue Takt der Messungen eingehalten wird wenn möglich, unabhängig davon ob einzelne Messungen mal länger dauern, oder allgemein auf der gerade zu testenden Maschine langsam sind.

Vielleicht machts ein Beispiel einfacher.
Angenommene Benchmarkzeit jeweils 60 Sekunden.
Fall 1: Messung dauert 1 ms, danach 10 ms sleep. Die erste Messung findet bei 0 ms statt, die zweite bei 11, die dritte bei 22 usw. Es finden 5454 Messungen statt.
Fall 2: Messung dauert 1 ms, danach 9 ms sleep, zweite Messung dauert 5 ms, danach nur 5 ms sleep, dritte Messung 2 ms, danach 8 ms sleep. Es finden 6000, bzw 5999 Messungen statt, je nachdem ob die letzte noch gemacht wird da der Benchmark ja exakt zu beginn beendet ist :)

Zusätzlich würde ich mitzählen und angeben wie viele Messungen ausgefallen sind weil sie ihr Zeitfenster nicht geschafft haben. Das hilft ggf. bei der Fehlersuche wenn komische Ergebnisse rauskommen und zeigt dass das Interval zu kurz war, bzw der PC zu langsam.

Ich finde in der Doku leider nichts eindeutiges zur Art wie die Werte ermittelt werden. Aber ggf. könnte man per low-level zugriff genauere Werte bekommen, denn die geben tatsächlich Energie an und nicht Leistung.
Kapitel 14.10, Seite 45 MSR_PKG_ENERGY_STATUS
Bei ungefähr 60 Sekunden Wraptime braucht man sich auch keinen Stress mit dem Sampling machen.
Leider stehe ich gerade total auf dem Schlauch bei der Frage wie viel denn nun safe in das Register passt. 15,3 µJ als Standardeinheit, 32 bit unsigned Int. Irgendwie kommt da nichts sinnvolles in Verbindung mit den 60 Sekunden raus. Außer Intel hat tatsächlich über 500 W einkalkuliert.
Eigentlich würde das die ganze Messung erheblich vereinfachen (Messung am Start, Ende und mindestens einmal pro Minute mittendrin und am Ende addieren) und würde Fehler durchs Sampling vermeiden.

Für AMD weiß ich auf die Schnelle nix. Da kann jemand anders suchen ^^

P.S.: Die übergeordnete Seite zu den Intel Architecture Dokus
 
  • Gefällt mir
Reaktionen: TheCrazyIvan
@Tenferenzu
Ich bin wirklich überrascht, wie niedrig TDP und auch Peak bei Deinem Thinkpad liegen. Kann man da mit Avantage oder wie das bei Lenovo heißt noch Einfluss drauf nehmen? Die scheinen Laufzeit bei den Thinkpads deutlich höher zu wichten als Performance.
Ergänzung ()

BTW...
Hat hier wirklich niemand einen Rocket Lake oder trauen sich die Besitzer nicht?
 
Zuletzt bearbeitet: (@ hinzz)
Gleiches Thinkpad E495 mit R5 3500u, dieses mal ganz im Idle am Strom angeschlossen, Windows Profil 'Ausbalanziert', Vantage Einstellung 'Leistung'.

1626620628153.png


1626620772106.png



Noch ein run, dieses mal mit dem Vantage Profil 'Leise und Kühl', ansonsten sind alle Einstellungen gleich.
1626622964273.png




Und noch einer mit den Standardeinstellungen vom ersten Durchlauf da der ST Test nun endlich halbwegs 'stabil' (wenig Taktunterschiede) ist.
1626629020834.png
 
@TheCrazyIvan Vorsicht andere CPU anstatt des AMD 5800H. Ich habe hier noch ein Egineering Sample mit einer Intel CPU (ebenfalls Engineering Sample) aufgrund der Werte aus CPU-Z könnte es sich dabei um einen 11980HK oder 11900H handeln. Wobei könnte, könnte, könnte.
 
  • Gefällt mir
Reaktionen: TheCrazyIvan
JeanLegi schrieb:
@TheCrazyIvan Vorsicht andere CPU anstatt des AMD 5800H. Ich habe hier noch ein Egineering Sample mit einer Intel CPU (ebenfalls Engineering Sample) aufgrund der Werte aus CPU-Z könnte es sich dabei um einen 11980HK oder 11900H handeln. Wobei könnte, könnte, könnte.
Achso, spuckt das HWInfo nicht aus?
 
  • Gefällt mir
Reaktionen: JeanLegi
nein, spuckt es leider nicht aus😒
 
  • Gefällt mir
Reaktionen: TheCrazyIvan
Hier ein Ryzen 5 2500U aus einem acer Aspire 3, Win 10 Pro, OEM nvme SATA SSD, 2x8 GB DDR4-2400

Max. Temp. laut Task Manager 75° C und getestet mit 0.7 (Energiesparplan 1usmus Universal)

Edit: teste meinen 3500U jetzt auch nochmal mit 0.7
Edit: melde Ausführung

PS du wunderst dich ja, das meine Ergebnisse so schlecht sind: mit Windows 11 sind die CB Werte tatsächlich eingebrochen, ist aber auch noch die erste Version:
andi_sco schrieb:
So, da auf dem Rechner testweise Win 11 als Pro Version läuft, habe ich mal den Cinebench R10 durchlaufen lassen:
Takt in GHzWindowsPunkte
1 Kern
2 Kerne4 Kerne8 Kerne
1,6 GHzRyzen 5 3500UWindows 10 Pro324766161168413182
max. TaktWin 107326131981973625492
1,6 GHzWindows 11 Pro26088143
max. TaktWin 11525616232

Die Werte sind kräftig eingebrochen
Ich werde die anderen Werte noch nachtragen
 

Anhänge

Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: TheCrazyIvan
mein 3500U rennt gerade, Ergebnisse gibts dann bald (ich mach wieder beides: "Performance" und "Leise und Kühl").

//hier sind sie.
 

Anhänge

Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: TheCrazyIvan und JeanLegi
Zurück
Oben