Leserartikel Performance Efficiency Suite (PES)

Dann verschiebe ich mal die Unterhaltung hierher
Wissenschaftlichkeit vs. Menschen mitnehmen: Hier tendiere ich wohl eher zu ersterem. Persönliche Einstellung und ein bisschen Zeit an der Uni hats nicht besser gemacht. Bevor etwas so verfälscht ist dass im Ergebnis der falsche Schluss herauskommt lieber ein paar Leute verlieren. Daher bin ich auch neugierig wie groß die Abweichungen sind.

Bezüglich Sampling und sleep: Ich dachte nicht daran ohne sleep zu messen, sondern einen festen Takt vorzugeben und das sleep daran anzupassen. quasi
gettime
messen
gettime
sleep(10ms - dauer zum messen)

mit warnung/hinweis wenn die effektive zeit unter einen schwellwert fällt weil die messung zu lange dauert und einen hinweis falls der takt nicht eingehalten werden konnte weil die messung mehr als einen slot belegt hat. Da kann es auch hübsche/hässliche Messfehler geben. Ich saß in einem Büro wo Leute eben Energiebedarf an Hardware gemessen haben und da ging es iirc unter anderem darum dass einige kHz Samplingrate nicht ausreichend waren. Sonst misst man am Ende zufällig zu viele niedrige Samples bei schwankendem Workload und hat Messfehler von mehr als nur ein, zwei prozent.
Eventuell lohnt es sich auch noch mal in die Doku zu den CPUs zu gucken, was genau man auslesen kann. Womöglich bieten die schon Energie an. Dann müsste man nur noch gucken wie schnell der counter überlaufen kann um eine sinnvolle messperiode zu finden.

Fühl dich nicht gehetzt, ich dachte nur ich gebe mal meinen Senf dazu, für den Fall dass es hilft. Korrektheit und eine gewisse Flexibilität bei der Last die man misst dürfte helfen dass es seinen Weg in Testberichte findet und macht das Ergebnis auch nützlicher.
 
  • Gefällt mir
Reaktionen: TheCrazyIvan
Bigeagle schrieb:
wenn du die energie willst musst du leistung mit zeit multiplizieren :)
76 W * 71 Sekunden = 5396 Ws
9,8 W * 257 Sekunden = 2518,6 Ws
ja es fehlt der gemeinsame Nenner, womit man dann darauf kommt das die 76W kurzeitig, anstelle über längere Zeit die 9,8, schneller und effizienter sind.

Ws ist ja nun Watt pro Sekunde ?
Was nicht sein kann, kein Rechner zieht 5000 Watt aus der Buchse, was wir hier so messen :D

Aber nehmen wir das mal als "Rohwert"
71*5396= 383
9,8*2518,6= 24 682,42

Öhm joa..., verdammte Formeln wieder... :D
Ich denke man sieht aber was ich meine, was ich zuvor Formuliert habe.
Der 76W ist eben schneller und effizienter und ne ähnliche Formel steckt hier dahinter im Tool, daher ist es richtig.

Edit:
@Bigeagle
Könnte man sicherlich auch ansetzen und ausprobieren
Sehe ich nur keinen Sinn darin, wenn so ein Tool hier, exakte differenzen aufweist wie ein Leistungsmessgerät, es schafft, während Berechnungen darzulegen, innerhalb einer gewissen Zeit die so eine Berechnung ja durchläuft, dann muss man da denke ich nichts "verbessern"

Wir können damit in Software intern Messen, was extern ein Leistungsmessgerät sonst tut, mit entsprechenden und passenden Toleranzen beim Messen.

Gruss HL
 
Ryzen 5 3500U im hp 15s-eq0355ng, 2x8 GB DDR4-2400, 512 GB nvme SSD, Windows 11 Pro
Einmal mit ca. 1,7 GHz Takt und dann ungedrosselt.
 

Anhänge

  • Gefällt mir
Reaktionen: TheCrazyIvan
HasseLadebalken schrieb:
Ws ist ja nun Watt pro Sekunde ?
Was nicht sein kann, kein Rechner zieht 5000 Watt aus der Buchse, was wir hier so messen :D
Die Frage lässt sich doch mit Google beantworten: Wikipedia: Wattstunde
  • 1 Wh = 3600 Ws (Wattsekunde) = 3600 Joule = 3,6 Kilojoule (kJ).
Daraus folgt: 5396 Ws = 1,5 Wh
Somit kann man den Test also 667mal laufen lassen bis eine kWh verbraucht ist.
 
  • Gefällt mir
Reaktionen: HasseLadebalken
Mongoo schrieb:
interessant.
erstelle ich eine verknüpfung zum desktop.
kommts zum fehler wie beschrieben,
Kurzes dosfenster und ende

Starte ich pes direkt gehts
Na dann kann ich es mir erklären: Ich habe mir übelst einen abgebrochen, um eine "relative" Verknüpfung zu erzeugen. Dass das mit der weiteren Abstraktionsebene nicht funktionieren würde, war mir ziemlich klar.
Deshalb ist übrigens eine genaue Beschreibung des Tathergangs so wichtig. Denn am Ende ist Debugging vor allem eines: Ein Kriminalfall, bei dem man Polizist und Mörder zugleich ist 😂
 
andi_sco schrieb:
Ryzen 5 3500U im hp 15s-eq0355ng, 2x8 GB DDR4-2400, 512 GB nvme SSD, Windows 11 Pro
Einmal mit ca. 1,7 GHz Takt und dann ungedrosselt.
also irgendwas ist da komisch mit den csv-Dateien,
man ist doch nicht etwa nur in der Lage seine eigenen csv's auszuwerten ?

Wenn ich diese nun schnappe und auch entsprechend umbenenne die cvd-Dateien bringt das mein LibreOffice nur zum Absturz.
Meine eigenen gesammelten csv, kann ich aber problemlos auswerten.

Gruss HL
 
HasseLadebalken schrieb:
Ws ist ja nun Watt pro Sekunde ?
Nein, ganz falsch! (sorry)
Watt * Sekunde im Sinne von Gesamtverbrauch oder umgekehrt auch Kapazität. Wenn ein Akku 1Wh = 3600 Ws Kapazität hat, dann kann er für 1s 3,6kW Energie abgeben, oder für 1 Stunde 1W oder alles dazwischen.
Es geht um das Integral oder auch die Fläche in einer Watt über Zeitraum Messung. Das ist der Energieverbrauch für einen definierten Workload und das Fundament der Thematik.
Ergänzung ()

Danke Dir vielmals für Deinen Beitrag und vorab - ich glaube, wir teilen weitestgehend die Einstellung zur Sache.
Bigeagle schrieb:
Dann verschiebe ich mal die Unterhaltung hierher
Wissenschaftlichkeit vs. Menschen mitnehmen: Hier tendiere ich wohl eher zu ersterem. Persönliche Einstellung und ein bisschen Zeit an der Uni hats nicht besser gemacht. Bevor etwas so verfälscht ist dass im Ergebnis der falsche Schluss herauskommt lieber ein paar Leute verlieren. Daher bin ich auch neugierig wie groß die Abweichungen sind.
Ich auch! Ich habe auch "ein bißchen" Zeit an der Uni verbracht. Nenn es meinetwegen Lebenserfahrung, aber ich habe irgendwann erkannt, dass es auch übergenau geht - da muss jeder sein eigenes Abbruchkriterium finden. Ich neige gern dazu, mich im Promille Bereich zu verlieren.
Bigeagle schrieb:
Bezüglich Sampling und sleep: Ich dachte nicht daran ohne sleep zu messen, sondern einen festen Takt vorzugeben und das sleep daran anzupassen. quasi
gettime
messen
gettime
sleep(10ms - dauer zum messen)

mit warnung/hinweis wenn die effektive zeit unter einen schwellwert fällt weil die messung zu lange dauert und einen hinweis falls der takt nicht eingehalten werden konnte weil die messung mehr als einen slot belegt hat. Da kann es auch hübsche/hässliche Messfehler geben. Ich saß in einem Büro wo Leute eben Energiebedarf an Hardware gemessen haben und da ging es iirc unter anderem darum dass einige kHz Samplingrate nicht ausreichend waren. Sonst misst man am Ende zufällig zu viele niedrige Samples bei schwankendem Workload und hat Messfehler von mehr als nur ein, zwei prozent.
Eventuell lohnt es sich auch noch mal in die Doku zu den CPUs zu gucken, was genau man auslesen kann. Womöglich bieten die schon Energie an. Dann müsste man nur noch gucken wie schnell der counter überlaufen kann um eine sinnvolle messperiode zu finden.
Ich verstehe und muss darüber ein wenig nachdenken.
Bigeagle schrieb:
Fühl dich nicht gehetzt, ich dachte nur ich gebe mal meinen Senf dazu, für den Fall dass es hilft. Korrektheit und eine gewisse Flexibilität bei der Last die man misst dürfte helfen dass es seinen Weg in Testberichte findet und macht das Ergebnis auch nützlicher.
Es hilft auf jeden Fall 🙂
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Bigeagle
Moin

HasseLadebalken schrieb:
Ist der geköpft oder ist er zum Sterben verurteilt ? ;-)
Nee, der ist noch mit Kopf und Allem ;-) Der Erste den ich hatte ist aber gestorben. Habe dann auf Garantie einen neuen bekommen, und der tut halt seit Jahren klaglos seinen Dienst (mittlerweile aber nicht mehr 24/7 Prime95 :-)

An so etwas hätte ich mich auch nicht ran getraut. Der war teuer Mann! :D

Ich hab immer mal wieder welche mit 4.5Ghz und höher in Vergleichen gesehen. Ich denke mal, dass geht dann halt auch nur geköpft oder WaKü. Meiner wie gesagt bis 4.2 dann Ende, oder ordentlich OV, aber dann zu heiß.

Gott, es ist eh erstaunlich dass der tatsächlich immer noch gut reicht. Wir sind nun nicht so die 3D SHooter Generation, das übelste was mein Frau darauf macht ist Lightroom und Majong... Das macht er sicher noch n weilchen....

Grüüße
 
Blende Up schrieb:
Moin


Nee, der ist noch mit Kopf und Allem ;-) Der Erste den ich hatte ist aber gestorben. Habe dann auf Garantie einen neuen bekommen, und der tut halt seit Jahren klaglos seinen Dienst (mittlerweile aber nicht mehr 24/7 Prime95 :-)

An so etwas hätte ich mich auch nicht ran getraut. Der war teuer Mann! :D

Ich hab immer mal wieder welche mit 4.5Ghz und höher in Vergleichen gesehen. Ich denke mal, dass geht dann halt auch nur geköpft oder WaKü. Meiner wie gesagt bis 4.2 dann Ende, oder ordentlich OV, aber dann zu heiß.

Gott, es ist eh erstaunlich dass der tatsächlich immer noch gut reicht. Wir sind nun nicht so die 3D SHooter Generation, das übelste was mein Frau darauf macht ist Lightroom und Majong... Das macht er sicher noch n weilchen....

Grüüße
Ohje, also am besten so machen, wie man es halt kennt, oder vom "8auer" ein DelidDieMate besorgen, besser is das :-)

Mit dem erwähnten Werkzeug ist das eher ein Kinderspiel und bei Montage notfalls zweimal WLP anstelle den Heatspreader wieder zu verkleben tut es auch.

Solange man im UV bleiben kann ist OC gut ansonsten lieber lassen, das artet schnelö zu exponentiell Mehrverbrauch aus, ohne das du wirklich eine lohnenswerte Leistungssteigerung davon hast.
Klar man kann auch einfach alles rausholen was geht "mit der Brechstange", macht nur einfach keinen Sinn

Ja na klar, Sandy Bridge und Ivy Bridge kann man immernoch gut gebrauchen, selbst die Generationen davor laufen noch gut.
Sprich Phenom II oder equivalten zu diesen Sandy's und Ivy's der AMD FX eben, die Rechenleistung sowie der Verbrauch ist durch die Benchmarks hindurch +/- 5 & Toleranzbereich.
8300er Vishera vs. i7 2600, wäre beispielsweise bei GTA V völlig banane, habe da einen Vergleich mit 7870/7970 im Hinterkopf, genauso auch zum Stromverbrauch und sehr gleichauf rauslaufende Benchmarkwerte dazu. Beispielsweise Prime95 und dabei Fire Strike, Stromverbrauch vom Gesamtsystem dasselbe, Performance dabei nachher an den Punkten, dasselbe :D

TheCrazyIvan schrieb:
Danke Dir vielmals für Deinen Beitrag und vorab - ich glaube, wir teilen weitestgehend die Einstellung zur Sache.
Wenn du mich damit auch noch meinst, definitiv ja :-)
Ich will doch hoffen das es hilft, da ja immerhin Messdaten mit externem Leistungsmessgerät, mit den Daten von dem Tool durch Cinebench übereinstimmen und gewisse parallelen aufweist.

Interessant ist das im SingleCore Test, "as it is" halt eine parallele zu sehen ist zu 10 Watt die man im IDLE spart, ohne CnQ, ohne Turbo und PBO, mit Undervolting bei festen 3,9gHz eben.

Die Ergebnisse vom PES zeigen halt schön auf was man sich so im Kopf roundabout recht einfach ausmahlen kann aus Vollast und IDLE vergleich, einfach nur mit nem Leistungsmessgerät hinter dem Netzeil vom Rechner.
Verbrauch steigt und fällt eben 1:1 mit der Last, bei einer gewissen Spannung, nach alter Schule halt die CPU VCore, wenn man nur am Takt schraubt tut sich quasi nichts da wären wir dann bei dem was du so schön schreibst "sich im Promille Bereich zu verlieren"

Was dann auch darauf schliessen lässt, "UserBenchmark" da kann man sich soviel aufregen was die Masse an Leuten ja auch tut von wegen SingleCore-Leistung.
Am Ende des tages ist es nunmal doch Multithread worauf es ankommt und die Sache mit dem SingleCore, das das auch Singlethread mal durchgängig auf nur auf einem einzigen Core läuft, das muss erstmal tatsächlich umgesetzt werden das es auch so läuft und nicht irgendwie.
Wen wunderts das man das rausnimmt, ist nicht reproduzierbar, vergleichbar.

Gruss HL
 
Hier nochmal nen Rund, bei 4150mhz, also sprich 4,15gHz, ich bin ja da im Multithread derjenige mit dem wohl schnellstem 2600X hier in CB
https://www.computerbase.de/2020-11/cinebench-r23-community-benchmarks/
https://www.computerbase.de/forum/t...n-cinebench-r23.1980752/page-33#post-24869956

LLC6, 1,4V VCore, immernoch weniger Spannung und somit Undervolting im Vergleich zu , standard mit Turbo und PBO, jetz bin ich mal gespannt wenn ich das noch mit dazu nehme in den Vergleich.
Ich vermute eine annähernd schlechtere Effizienz, weil man eben für 250mhz so krass viel mehr VCore aufschlagen musste. (Takt kaum messbar, Spannung exponentiell am Stromverbrauch, beim Schalten, wenn denn geschalten wird)

Gruss HL
Ergänzung ()

4gHz auch nochmal getestet mit 1,3V
4ghz1,3V.jpg

Ab hier geht es los das die Effizienz schlechter wird, ich mein PBO ist automatisches übertakten, das tuts auch, macht Sinn, nur wirklich mehr Leistung die Sinn ergibt, bringt es ja dummerweise nicht wie wir gesehen haben.

Ob nun 3,95gHz mit nur ein wenig mehr Spannung irgendwo zwischen 1,2 und 1,3V VCore Spannung stabil zum laufen zu bekommen sind und wie es da aussieht das erspare ich mir.
Das bringt keine Mehrleistung die irgendwann Sinn macht oder spürbar wäre, das ist es ja schon bei 250mhz nicht, nur das es unnötig Energie verpulvert im Vergleich zu 3,9 im Undervolting soweit es geht und eben jene bringen dieselbe Performance.
Das Board macht es jedenfalls mit von der Energieversorgung her soweit ich das sehe

Gruss HL
 

Anhänge

Zuletzt bearbeitet:
HasseLadebalken schrieb:
also irgendwas ist da komisch mit den csv-Dateien,
man ist doch nicht etwa nur in der Lage seine eigenen csv's auszuwerten ?

Wenn ich diese nun schnappe und auch entsprechend umbenenne die cvd-Dateien bringt das mein LibreOffice nur zum Absturz.
Meine eigenen gesammelten csv, kann ich aber problemlos auswerten.

Gruss HL
Irgendjemand, der Ahnung von Tabellenkalkulationen hat, kriegt das auch bestimmt in vernünftig hin, das ist mehr oder weniger von mir mit wenig TK-Kenntnissen zusammengebastelt worden, um zu schauen, ob das relativ simpel geht.

Du darfst die Tabelle bei dir nicht abspeichern, dann funktioniert es auch mit anderen CSV (für die Tabelle habe ich eine Dummy CSV mit 60k Einträgen erstellt, lädt man eine andere Tabelle und speichert, werden anscheinend die Max Einträge der neuen Tabelle genommen, was bei Tabellen, mit mehr oder weniger Einträgen (weiß nicht mehr, wie rum es war; bei sehr langsamen CPUs kann es evtl. notwendig sein, die Tabelle zu verlängern), zum Absturz führt oder zum Datensalat.
Hab auch festgestellt, dass der empfohlene Datenbereich für die Tonne ist (einfach als grobe Richtlinie nehmen und dann entsprechend 20% rauf oder runter gehen, bis es passt).
 
was mache ich jetzt mit der pes libreoffice.ods ?
Hab excel 2003
Mit excel gehts ja nicht.

Wie macht man die results auf mit *.ods?
 
TheCrazyIvan schrieb:
Wo genau siehst Du das Quadrat? Wegen der Einheiten Ws und s?
Die Berechnung für den PES ist folgendermaßen aufgebaut:
Über dem Bruchstrich steht eine Konstante von 1.000.000.000. Das dient einzig und allein dem Zweck, dass gilt: Größer = besser
Unter dem Strich steht einfach das Produkt aus Gesamtverbrauch in Ws (also das Integral von Energieeinsatz über die Zeit) und Dauer. Halbe Dauer = doppelte Punktzahl; halber Verbrauch = doppelte Punktzahl
Das ist nicht ganz korrekt, da es nur bei einem CB23-Durchlauf funktioniert (der Vergleichswert 1 berechnetes CB23-Bild ist) und die Formel die beiden Quadrate "verwischt".
Die Formal sollte eigentlich lauten: (1.000.000.000 * (berechnete Bilder)²) / (W*S*S)
Das kommt auch raus, wenn man Performance (berechnete Bilder/Zeit) mit Effizienz (berechnete Bilder/Energieverbrauch) multipliziert und lässt man beispielsweise CB23 fünfmal durchlaufen, muss die Formel 25.000.000.000/Verbrauch*Zeit lauten.

@Mongoo: Die CSV-Datei muss im übergeordneten Verzeichnis des LogCSV-Verzeichnisses stehen (das Verzeichnis mit PES Start) und dann reicht es aus, die CSV-Datei mit LibreOffice zu öffnen und die Aktualisierung der verknüpften Dateien bestätigen.
Dann kannst du noch die Diagramme auswählen und per Rechtsklicks den Datenbereich angleichen, wenn das Diagramm abgeschnitten ist (empfohlener Datenbereich +- 30% sollte grob passen).
Die Ergebnisse sind im Tab "Leistungseffizienzindex"
 
  • Gefällt mir
Reaktionen: TheCrazyIvan
blick ich nicht
die csv ins pes verzeichnis ist noch klar.
Hab kein Libreoffice - nur excel 2003 und die pes libreoffice4.ods datei
 
LordPoekel schrieb:
Das ist nicht ganz korrekt, da es nur bei einem CB23-Durchlauf funktioniert (der Vergleichswert 1 berechnetes CB23-Bild ist) und die Formel die beiden Quadrate "verwischt".
Die Formal sollte eigentlich lauten: (1.000.000.000 * (berechnete Bilder)²) / (W*S*S)
Mensch Poekel, jetzt habe ich endlich verstanden, was Du mir schon im 3DC sagen wolltest. Ich muss nur den konstanten Faktor mit der Anzahl der Runs multiplizieren und kann die Vergleichbarkeit zwischen 1 Run im ST und n Runs im MT gewährleisten. Ein echter Eye opener! Wald und Bäume und so... 😂
 
TheCrazyIvan schrieb:
Mensch Poekel, jetzt habe ich endlich verstanden, was Du mir schon im 3DC sagen wolltest. Ich muss nur den konstanten Faktor mit der Anzahl der Runs multiplizieren und kann die Vergleichbarkeit zwischen 1 Run im ST und n Runs im MT gewährleisten. Ein echter Eye opener! Wald und Bäume und so... 😂
Der Faktor muss mit dem Quadrat der Anzahl der Runs multipliziert werden, nicht mit der Anzahl der Runs (sonst kommen wieder Zahlen raus, die nicht vergleichbar sind).
 
  • Gefällt mir
Reaktionen: TheCrazyIvan
LordPoekel schrieb:
Der Faktor muss mit dem Quadrat der Anzahl der Runs multipliziert werden, nicht mit der Anzahl der Runs (sonst kommen wieder Zahlen raus, die nicht vergleichbar sind).
Okay
 
Schon interessant wie die Effizienz sinkt, 2933 (XMP, Profil 2) Standard vs. Ryzen DRAM Calculator
"Ausbalanciert" enthält doch Core-Parking, auf einen Tipp hin mit dem Tool Core-Parking kann man das an den Energieprofilen feststellen.
Ausbalanciert vs Höchstleistung bring einen nicht nennenswerten Leistungsverlust, und eine nicht nennenswerte Ersparnis.
RAM OC, kostet Effizienz, muss man mal so feststellen, also nicht nur das es nichts bringt was von Vorteil wäre im Alltag, abgesehen von instabilitäten die es mit sich bringt, es macht das System ineffizienter

Gruss HL
 

Anhänge

Zurück
Oben