HWINFO: PCIe-Busfehler

@inge70 @LiniXXus Ja, natürlich hab ich die Spannungen jeweils unter Last ausgelesen. Das hab ich nicht extra erwähnt, weil es doch klar ist. :P Ich mach das alles nicht erst seit gestern. Dachte, mein Post ließ das vermuten. ;)
Ergänzung ()

Nachtrag zum PCIe-Busfehler selbst: Hab inzwischen im HWINFO-Forum einen Post gefunden, wo diskutiert wird, dass auch das PCIe-Power Management dann und wann dazwischenfunken könnte. Der HWINFO-Mensch empfiehlt das ASPM zu deaktivieren. Hab ich mal testweise gemacht und beobachte.
 
  • Gefällt mir
Reaktionen: inge70
RustyGunFighter schrieb:
@inge70 @LiniXXus Ja, natürlich hab ich die Spannungen jeweils unter Last ausgelesen. Das hab ich nicht extra erwähnt, weil es doch klar ist. :P Ich mach das alles nicht erst seit gestern. Dachte, mein Post ließ das vermuten. ;)
Kenne dich nicht und daher sind mir deine Kenntnisse nicht bekannt. Hatte schon oft genug hier Themen, wo die VID als Vore angenommen wurde. Nur ließ sich das schnell mit Screenshots erkennen. Soll man nur geschriebenes glauben, bin ich in erster Linie etwas misstrauisch. :D
 
LiniXXus schrieb:
Manche Leute kennen auch nicht den Unterschied zwischen der VID und der VCore und dann wird oft fälschlicherweise die VID dazu ausgelesen.
Na, nee. Also wenn ich Vcore schreibe, dann meine ich auch Vcore. Wirklich! :D
 
  • Gefällt mir
Reaktionen: inge70 und LiniXXus
Alles klar. 👍

Dann würde ich wie bereits geschrieben eine vorherige Bios Version austesten, um die Bios Version damit ausschließen zu können. Natürlich, wenn du dieses nicht bereits gemacht hast. :D

Es gab im April eine Bios Version, wo auch die 12/13 Generation diese APO Funktion mit freigeschaltet bekommen haben. Mit dieser Version war noch kein Fix bezüglich dieser Intel Problematik mit dabei.

Mehr kann ich dazu nicht mit beitragen. :)
 
Zur Information: Seit vier Tagen habe ich oben erwähntes ASPM deaktiviert. Und siehe da: kein Whea mehr (Abstürze hatte ich auch so schon nicht, was natürlich nicht heißt, dass alles stabil wäre). Das ASPM - also ein System, das Methoden enthält um im Bereich PCIe Strom zu sparen, kommt offenbar nicht gut mit meinen 130 mV Undervolting Vcore zurecht. Hier habe ich gerade den Knackpunkt in meinem System erwischt. Das war ein kalkuliertes Risiko, das es zu beobachten galt. Ich kann nunmehr behaupten, dass es stabil läuft wenn ich ASPM deaktiviere. Jedenfalls bis jetzt. :D

Am allgemeinen Stromverbrauch konnte ich bislang keine nennenswerten Verschlechterungen feststellen. Insofern derzeit alles gut.
 
  • Gefällt mir
Reaktionen: qiller und LiniXXus
Also bei mir ist ASPM standardmäßig deaktiviert (Gigabyte AM4 System). Ist das bei Intel per default aktiviert?
 
  • Gefällt mir
Reaktionen: qiller
RustyGunFighter schrieb:
sporadisch auftretende Whea-Fehler (HWINFO) bekomme. Allerdings nicht von der CPU (weshalb ich zunächst mal vermute, dass es nicht am Offset liegt), sondern vom PCIe-Bus. Das heißt, ich erhalte - nicht direkt reproduzierbar - bis zu 3 PCIe-Busfehler pro Tag. Ich kann nicht sagen woran es liegt. Kann es auch nicht durch "heavy use" provozieren.
Same here. Keine Ahnung was Asus da macht. Die Fehler finde ich auch schon vor dem BIOS Update. Und ich denke nicht das meine CPU degradiert ist, die ist weit von übertaktet betrieben.

Ich glaube die Fehler haben nichts mit dem Update zu tun
 
Micha- schrieb:
Ich glaube die Fehler haben nichts mit dem Update zu tun
Na ja, vielleicht doch. Ich kann zum Beispiel nicht sagen, ob damals (mit BIOS 2102) ASPM per default aktiviert oder deaktiviert war. Ich weiß, dass es nach dem BIOS-Update definitiv aktiviert ist - zumindest per Intel Defaults. Ich hatte mich jedenfalls um exakt diese Option nie gekümmert. Also entweder hatte ich einfach Glück, oder bei LLC-Optimierung wirkt das anders oder das BIOS-Update hat tatsächlich etwas verändert. Ich hab allerdings keine Lust, das jetzt pö a pö nachzuforschen, samt BIOS Backflash etc. Dafür hab ich keine Zeit.

Meine (derzeit) finale Erkenntnis besagt jedoch, dass ich neuerdings per Offset simples Undervolting betreiben kann. Das ging früher nicht wirklich (max. bis ca. 50 mV, was ein Witz ist).
 
Starres Offset-UV berücksichtigt nicht die verschiedenen Lastzustände, und zumindest bei AMD-Systemen (bei Intel weiß ich nicht genau, wie die das z.B. per CEP handeln) erhöht sich dann einfach die Chance aufs Clockstretching, was dann zwar hohes UV stabil erscheinen lässt, aber die Leistung sinkt halt auch. Ähnliches hab ich auch von Intels CEP gelesen (klingt irgendwie nach nem "Clockstretching"-Pendent von Intel).
 
qiller schrieb:
... erhöht sich dann einfach die Chance aufs Clockstretching, was dann zwar hohes UV stabil erscheinen lässt, aber die Leistung sinkt halt auch. Ähnliches hab ich auch von Intels CEP gelesen (klingt irgendwie nach nem "Clockstretching"-Pendent von Intel).
CEP heißt Current Excursion Protection und soll zu niedrige Spannungen vermeiden (insofern Instabilitäten durch zu niedrige Spannungen). Dabei wird der Takt nicht gestretched sondern (ab bestimmten Spannungsstufen) reduziert.

Soweit mir bekannt ist (man mag mich korrigieren), wurde das eingeführt, weil Intel krampfhaft nach Methoden gesucht hat, um den Leistungshunger der 13. und 14. Generation irgendwie zu bändigen. Teilweise greifen Stromsparmaßnahmen dann nämlich zu aggressiv ein - CEP soll genau das verhindern. Also eigentlich eine Maßnahme für eine Maßnahme. :D

CEP habe ich als grundsätzlich aktiviert.
 
RustyGunFighter schrieb:
Dabei wird der Takt nicht gestretched sondern (ab bestimmten Spannungsstufen) reduziert.
Klingt nach demselben Impact wie AMDs Clockstretching: Die Leistung sinkt.

Und damit stellt sich halt für mich die Frage, ob du dein UV auch mit mehreren Lastszenarien gegengetestet hast. Also mit "mehrere Lastszenarien" mein ich halt nicht einfach nur Multicore Cinebench. Sondern auch Single-/Low-Thread Benchmarks, 16-Thread, nur P-Cores, nur E-Cores, AVX/Non-AVX, speicherintensive Benchmarks (ähnlich wie P95 large FFTs), Kernintensive Benchmarks (ähnlich P95 smallest FFTs) etc.

Wenn man da in allen Situationen ein Leistungsplus gegenüber Non-UV verzeichnet (ohne Fehler und Abstürze natürlich), passt das ja auch. Ich erwähne das nur, weil bei AMD durch zu starkes VCore-UV häufig gar nicht die Multithread-Leistung als erstes einbricht, sondern eben die Single-Thread Leistung.
 
RustyGunFighter schrieb:
Ich kann zum Beispiel nicht sagen, ob damals (mit BIOS 2102) ASPM per default aktiviert oder deaktiviert war.
ich glaube es war deaktiviert, denn ich hatte mir notiert das ich diverse energiesparende Optionen einschalten musste. Ich habe auch diesmal alles aktiviert, was im IDLE Strom zu sparen verspricht...
 
qiller schrieb:
Klingt nach demselben Impact wie AMDs Clockstretching: Die Leistung sinkt.

Und damit stellt sich halt für mich die Frage, ob du dein UV auch mit mehreren Lastszenarien gegengetestet hast.

Wenn man da in allen Situationen ein Leistungsplus gegenüber Non-UV verzeichnet (ohne Fehler und Abstürze natürlich), passt das ja auch. Ich erwähne das nur, weil bei AMD durch zu starkes VCore-UV häufig gar nicht die Multithread-Leistung als erstes einbricht, sondern eben die Single-Thread Leistung.
Wie oben schon geschrieben - ich habe diverse Tests durchgeführt. Meiner Erfahrung nach gibt es beim Undervolting (egal ob via Offset-UV oder LLC) stets einen Sweetspot. Also genau einen Bereich (+/-), an dem die Leistungsaufnahme (respektive die Spannungen) akzeptabel (niedrig genug) sind aber gleichzeitig die Performance des Gesamtsystems nicht all zu stark einknickt. Dass man im Rahmen von UV mit etwas weniger Multicore-Leistung rechnen muss, ist - glaube ich - allgemein bekannt. Das ist im Grunde auch normal. (Das war blöd formuliert.) Wenn man im Singlecore plötzlich nennenswert weniger Leistung ausfährt, stimmt etwas nicht. Das hast du völlig recht.

Um mein System kennenzulernen, habe ich drei Konfigurationstypen (von dutzenden Anpassungen abgesehen) herangezogen:

#1 Volle Kanone = ASUS OC, alle Limits raus, alles was geht -> ohne Rücksicht auf Verluste :D
#2 Intel Defaults/Extreme = Stock direkt nach BIOS-Update (2504)
#3 Intel Defaults/Performance + meine Anpassungen samt Offset-UV von 130 mV

Ohne jetzt sämtliche Zahlen heranzuziehen (das ist ne ganze Exceltabelle), nur einmal exemplarisch Punkte aus CPUZ und CB23 - jeweils Singlecore/Multicore gerundet) - bezogen auf die o.g. Configs (jeweils Maximalverbrauchswerte):

#1 CPUZ [ 966 / 17450 ] ... CB23 [ 2334 / 41.900 ]
-> Power (CPU): 370 Watt
-> Vcore: max. 1,447 V
-> TEMPmax (CPU): 97 °C

#2 CPUZ [ 963 / 16203 ] ... CB23 [ 2331 / 37.225 ]
-> Power (CPU): 267 Watt (obwohl PL1 = PL2 = 253 Watt!)
-> Vcore: max. 1,465 V
-> TEMPmax (CPU): 75 °C

#3 CPUZ [ 970 / 17112 ] ... CB23 [ 2348 / 39.207 ]
-> Power (CPU): 253 Watt
-> Vcore: max. 1,385 V (manchmal Spikes auf 1,412 V)
-> TEMPmax (CPU): 74 °C

Je nach Anwendung erreiche ich sowohl in SC als auch MC Leistungssteigerungen mit "meinem" Offset-Setup gegenüber dem Intel Default-Setup. Das zieht sich im Übrigen durch viele weitere Tests, wie verschiedene 3DMark-Benches, Superposition, Blender, AIDA64, Geekbench, PCMark und diverse Games.

Vielleicht noch ein Wort zu den Temperaturen und dem Verbrauch:
Ich habe die ganze Zeit (!) ein Silent-Setup in Betrieb. Also alles auf maximale Laufruhe ausgelegt - selbst im "Volle Kanne"-Modus. So gesehen, sind die 97 °C zwar krass, aber erwartbar. ;) Das Silent-Setup ist auch der Grund für die nicht mehr viel niedrigeren Temps von max. 74 °C bei #3. Es ist "nur" eine AIO, keine CustomWakü. Insofern muss man das ein wenig relativieren. Ich habe noch Luft nach oben, wenn ich die Leistung hochdrehe. Das brauche ich aber derzeit nicht. Die oben genannten Maximalwerte sind eben auch das - maximale Werte - nicht nur bei CB23, sondern quer durch die Bank.

Für mich persönlich ergibt sich daraus ein stabiles und performantes System bei gleichzeitig gebändigter Verlustleistung/Temperaturentwicklung. Klar, ein Stromsparer ist das jetzt nicht, aber das kann kein (kaum ein) 14900K, würde ich sagen. Jedenfalls kauft man sich nicht so ein Ding, wenn man nur 65 Watt verbrauchen will. :P
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: qiller
RustyGunFighter schrieb:
Dass man im Rahmen von UV mit etwas weniger Multicore-Leistung rechnen muss, ist - glaube ich - allgemein bekannt.
Ähm, nein, eigentlich passiert genau das umgedrehte. Durch die geringere Betriebsspannung wird mehr "Boost"-Kapazität freigeschaltet, die die Boostalgorithmen ausnutzen und die Kerne höher takten lässt und damit steigt die Leistung an. Also zumindest ist das bei AMD Ryzen so. Und das Ergebnis #2 gegenüber #3 bestätigt das das ja auch bei dir so ist.

Edit: Aber wenn man es mit dem UV übertreibt, dann sinkt die Leistung dank der Schutzmaßnahmen (Clockstretching, CEP) wieder. Und wenn mans gänzlich zu weit treibt, gibts halt wieder Fehler/Abstürze/BSODs.
 
Zuletzt bearbeitet:
qiller schrieb:
Ähm, nein, eigentlich passiert genau das umgedrehte.
Ja, nee ... das hatte ich blöd formuliert, war Quatsch. :p
 
  • Gefällt mir
Reaktionen: qiller
Zurück
Oben