Neuer PC WHEA Logger Error 18 - WHEA_UNCORRECTABLE_ERROR

Dizzard

Lt. Junior Grade
Registriert
Juli 2007
Beiträge
366
Hallo zusammen!

1. Nenne uns bitte deine aktuelle Hardware:
  • Prozessor (CPU): AMD Ryzen 9 5900x
  • Arbeitsspeicher (RAM): G.Skill Trident Z Neo 32GB DDR4 3600 CL16 (F4-3600C16D-32GTZN(
  • Mainboard: MSI B550 Gaming Carbon Wifi
  • Netzteil: be quiet! Straight Power 11 750Watt Gold
  • Gehäuse: be quiet! Dark Base 700
  • Grafikkarte: MSI GeForce RTX 3070 Gaming X Trio 8GB
  • HDD / SSD: Samsung SSD 980 PRO 500GB
  • Weitere Hardware:
    • CPU-Kühler: be quiet! Dark Rock 4 Pro

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden(zusätzliche Bilder könnten z.b. hilfreich sein):
Ich habe in unregelmäßigen Abständen Abstürze inkl. Bluescreen mit meinem neuen PC. Dabei ist es egal ob ich einfach auf dem Desktop bin oder etwas spiele. Es handelt sich um den WHEA Logger Error 18 oder auch WHEA_UNCORRECTABLE_ERROR (siehe minidump im Anhang). Im Internet findet man unzählige Beiträge und Anfragen zu der Problematik, leider aber auch viele Lösungsansätze. Z.B.:
  • BIOS Update
  • Verschiedene BIOS Einstellungen ausprobieren
  • Unterschiedliche RAM Taktungen
  • CPU Austausch
  • GPU Austausch
  • Mainboard Austausch

Die CPU Temperatur und Last scheint keine Rolle zu Spielen. CPU Temp liegt im Idle um die 40C, unter Last erreiche ich Spikes bis 85C.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
BIOS Update auf die letzte Stable Version: AGESA ComboAm4v2PI 1.1.0.0 Patch C
BIOS Update auf die neuste Beta Version: AGESA ComboAM4PIV2 1.1.9.0
Ryzen PBO deaktiviert
RAM auf folgenden Werten (2133MHZ, 3200MHZ und XMP 3600MHZ) laufen lassen
Ryzen CPU VCore Offset auf 0.05V eingestellt.

Keine der Punkte konnte das Problem lösen.

Zuletzt lief der PC in der Kombi: Beta Bios, PBO deaktiviert, RAM auf XMP und CPU VCore Offset. Bisher war das der stabilste Zustand, dort kommt es aber ebenfalls zu Abbrüchen. Ich habe Prime95, Memtest und Cinebench ohne Aufälligkeiten durchführen können.
Beim 3DMark ist mir der PC einmal abgeschmiert, beim zweiten Lauf lief der dann durch. Leider bin ich mit meinem Latein ein bisschen am Ende.

Aktuell hoffe ich einfach auf eine neue BIOS Version (AGESA 1.2) die die kommenden Tage erscheinen sollte.
Workarounds aus diesem Thread (MSI X570/B550 Beta BIOS Update & Bug Status | MSI Global English Forum - Index) haben ebenfalls nicht geholfen.

Wie würdet ihr vorgehen? Gibt es noch Sachen die ich testen könnte? Würdet ihr Hardware (CPU und Mainboard) per RMA umtauschen lassen und damit nochmal testen?

Viele Grüße,
Dizzard
 

Anhänge

  • whea.png
    whea.png
    19,1 KB · Aufrufe: 498
  • whea2.png
    whea2.png
    18,9 KB · Aufrufe: 476
  • minidump.zip
    minidump.zip
    147,3 KB · Aufrufe: 317
Nur einen Dump File mit anhängen reicht üblicherweise nicht aus, häng mal die letzten 5 oder so an....
 
  • Gefällt mir
Reaktionen: Dizzard
Ist natürlich auch nur meine Anekdote.

Ich hatte die gleichen whea 18 cache hierarchy und interconnect auf meinem 5950x mit stock settings. Ich habe über Tage einen Haufen der Vorschläge getestet, die man so in den diversen Threads zu dem Thema findet - u.a. fast alles was so in dem igor und overclock.net thread dazu zu finden war. Letztendlich haben einige Ansätze die Zeit bis zum crash teils signifikant erhöht aber gelöst war es nicht.



CCD deaktivieren hat es dann glaube ich zur Stabilität gebracht zumindest habe ich den Test dann nach 24h abgebrochen aber ist natürlich völlig inakzeptabel.



Einfach rma und siehe da zumindest scheint es ohne Probleme und ohne etwas geändert zu haben zu funktionieren sogar mit ram oc. Im Nachhinein habe ich mich geärgert, diesen ganzen Quatsch ausprobiert zu haben.
 
  • Gefällt mir
Reaktionen: Dizzard
CK_TEXT:
ffffcb00`33dbd938 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KeBugCheckEx


MODULE_NAME: AuthenticAMD

IMAGE_NAME: AuthenticAMD.sys

STACK_COMMAND: .thread ; .cxr ; kb

FAILURE_BUCKET_ID: 0x124_0_AuthenticAMD_BANK0_MSCOD060C_MCACOD0859_UC_IMAGE_AuthenticAMD.sys

OSPLATFORM_TYPE: x64

OSNAME: Windows 10

FAILURE_ID_HASH: {af26fd66-1025-e79d-1f5b-29ede38d49c6}
Der Fehler liegt beim Prozessor.
1. Passt der Prozessor zum Motherboard?
2. Bios auf dem neusten Stand?
3. Chipsatztreiber vom Motherboard Hersteller neu installiert?
4. Prozessor übertaktet?
5. Wird der Prozessor zu warm?
6. Prozessor defekt?

--------------------

Noch was wichtiges
Du hast Kaspersky auf dem Rechner

fffff807`6abf0000 fffff807`6abfe000 klelam.sys
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000E000

So ein Programm führt unter Windows 10 immer wieder zum Fehlern bis hin zum blue screen.
Kaspersky deinstallieren. Reste des Programm mit dem Entfernungstool beseitigen.
Nur den Windows Defender benutzen.
Sollte es dann weiterhin zum blue screen kommen die Punkte 1 bis 6 abarbeiten.
https://www.computerbild.de/downloa...-und-Kaspersky-Internet-Security-2887978.html
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Dizzard
Tornhoof schrieb:
Nur einen Dump File mit anhängen reicht üblicherweise nicht aus, häng mal die letzten 5 oder so an....
Da liegt der Hund begraben :D Ich bin froh überhaupt ein Dumpfile zu haben, in der Regel wird da nämlich gar keins erstellt. Habe extra in den Systemeinstellungen eingestellt dass ein Dumpfile geschrieben wird und das hat nie funktioniert außer ein mal.
dsxiadndxe schrieb:
Ist natürlich auch nur meine Anekdote.

Ich hatte die gleichen whea 18 cache hierarchy und interconnect auf meinem 5950x mit stock settings. Ich habe über Tage einen Haufen der Vorschläge getestet, die man so in den diversen Threads zu dem Thema findet - u.a. fast alles was so in dem igor und overclock.net thread dazu zu finden war. Letztendlich haben einige Ansätze die Zeit bis zum crash teils signifikant erhöht aber gelöst war es nicht.



CCD deaktivieren hat es dann glaube ich zur Stabilität gebracht zumindest habe ich den Test dann nach 24h abgebrochen aber ist natürlich völlig inakzeptabel.



Einfach rma und siehe da zumindest scheint es ohne Probleme und ohne etwas geändert zu haben zu funktionieren sogar mit ram oc. Im Nachhinein habe ich mich geärgert, diesen ganzen Quatsch ausprobiert zu haben.
Danke, ich denke ich werde nochmal bisschen rumspielen gff. Windows einfach neu installieren, da ist eh nicht wirklich was drauf und wenn das alles nichts hilft lass ich den Kram umtauschen.

Silver Server schrieb:
CK_TEXT:
ffffcb00`33dbd938 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KeBugCheckEx


MODULE_NAME: AuthenticAMD

IMAGE_NAME: AuthenticAMD.sys

STACK_COMMAND: .thread ; .cxr ; kb

FAILURE_BUCKET_ID: 0x124_0_AuthenticAMD_BANK0_MSCOD060C_MCACOD0859_UC_IMAGE_AuthenticAMD.sys

OSPLATFORM_TYPE: x64

OSNAME: Windows 10

FAILURE_ID_HASH: {af26fd66-1025-e79d-1f5b-29ede38d49c6}
Der Fehler liegt beim Prozessor.
1. Passt der Prozessor zum Motherboard?
2. Bios auf dem neusten Stand?
3. Chipsatztreiber vom Motherboard Hersteller neu installiert?
4. Prozessor übertaktet?
5. Wird der Prozessor zu warm?
6. Prozessor defekt?

--------------------

Noch was wichtiges
Du hast Kaspersky auf dem Rechner

fffff807`6abf0000 fffff807`6abfe000 klelam.sys
Timestamp: unavailable (00000000)
Checksum: 00000000
ImageSize: 0000E000

So ein Programm führt unter Windows 10 immer wieder zum Fehlern bis hin zum blue screen.
Kaspersky deinstallieren. Reste des Programm mit dem Entfernungstool beseitigen.
Nur den Windows Defender benutzen.
Sollte es dann weiterhin zum blue screen kommen die Punkte 1 bis 6 abarbeiten.
https://www.computerbild.de/downloa...-und-Kaspersky-Internet-Security-2887978.html
Danke für den Tipp, werde ich ausprobieren!
 
Habe nun Windows neu installiert. Diesmal ohne Kaspersky. Aktuell läuft das System mit dem Beta Bios, XMP Profil, PBO aus und VCore Offset auf 0.05V.

Bisher keine Abbrüche, aber werde jetzt erstmal die nächsten Tage abwarten. Mal sehen :D
 
Hallo!

Das Problem scheint weit verbreitet zu sein. Man kann seinen Prozessor bei AMD einschicken und bekommt dafür ohne Probleme einen neuen. Allerdings scheint hier nicht gesagt zu sein, dass der neue Funktioniert.

Sollten immer noch Probleme auftreten, bitte kurz posten wie weit die Spannungen von den folgenden Werten abweicht:
DRAM 1.350 bis 1.370 V
VDDG Voltage 950 mV
VDDP Voltage 950 mV

Das war bei sehr viele der Auslöser. Ob es der Grund ist, scheint eine andere Frage. In jedem Fall scheint entweder der Memory Controller auf der CPU sich stark von CPU zu CPU zu unterscheiden und/oder das AGESA (BIOS) ist einfach schlecht wie bei Ryzen 3000
 
Lies doch mal deine Mainboarddaten mit HWINFO aus. Kontrolliere insbesondere den neuen Wert von HWINFO unter : "power reporting deviation (accuracy)". Aktuelles HWINFO evtl. erforderlich!

Dieser Wert sollte bei ca. 100% liegen. Liegt der weit darunter, würde ich mal Resizable BAR im BIOS deaktivieren und dann nochmals vergleichen. Alle Werte entgegen der Norm, werden von HWINFO in ROT dargestellt.

Liegt dieser Wert unterhalb von 100 Prozent, wobei leichte Schwankungen im Rahmen der Messungenauigkeit liegen und man sich bei +/-5 Prozent noch keine Gedanken machen müsse, betreibt das Mainboard die CPU außerhalb der Spezifikationen Der ein oder andere mag nun die Stirn runzeln - geringer, und doch außerhalb der Spezifikationen? Tatsächlich ist es so, dass die CPU erst mehr als vorgesehen aus sich herausholt, wenn das Board niedrigere Parameter meldet. Dann nämlich unterliegt die CPU dem Trugschluss, noch Spielraum zu besitzen. Wirft das Mainboard bei einem Ryzen 7 3700X mit einer PPT von 88 W beispielsweise einen Parameter aus, der bei 60 Prozent des tatsächlichen Wertes liegt, kann die CPU in der Theorie 147 Watt ziehen (88/0,6).

Wie ich auch bei meinem GigaByte Board beobachten konnte, ist ein Wert um die -50% besorgniserregend.
Wenn es geht, flashe zurück auf ein BIOS, was deinen Ryzen 5000 gerade unterstützt.

Auch mein GigaByte Board wurde auf BIOS Version F30 und AGESA 1.0.8.1 zurück geflasht, welches die besseren Werte liefert!
Bild 1 vorher mit AGESA 1.1.0.0 Patch D und Resizable BAR, sowie Bild 2 mit AGESA 1.0.8.1.

hwinfo.png hwinfo3.png

Man sieht den Unterschied ganz deutlich!

Overclocker warnt und Nutzer fürchten, dass CPUs nicht lange halten

 
Zuletzt bearbeitet:
Vielen Dank für eure Antworten!

Thomygnomi schrieb:
Hallo!

Das Problem scheint weit verbreitet zu sein. Man kann seinen Prozessor bei AMD einschicken und bekommt dafür ohne Probleme einen neuen. Allerdings scheint hier nicht gesagt zu sein, dass der neue Funktioniert.

Sollten immer noch Probleme auftreten, bitte kurz posten wie weit die Spannungen von den folgenden Werten abweicht:
DRAM 1.350 bis 1.370 V
VDDG Voltage 950 mV
VDDP Voltage 950 mV

Das war bei sehr viele der Auslöser. Ob es der Grund ist, scheint eine andere Frage. In jedem Fall scheint entweder der Memory Controller auf der CPU sich stark von CPU zu CPU zu unterscheiden und/oder das AGESA (BIOS) ist einfach schlecht wie bei Ryzen 3000
Habe die Infos aus HWiNFO:
DRAM liegt bei 1.340V
VDDG Voltage und VDDP Voltage bin ich gerade zu blöd in HWiNFO zu finden, ich habe einfach mal Screenshots all meiner Voltages beigefügt. Was mir ein bisschen sauer aufstößt, ist die Tatsache dass durch das 0.05 CPU Offset meine CPU Volt peaks von 1.55V erreicht.

Schildkröte09 schrieb:
Lies doch mal deine Mainboarddaten mit HWINFO aus. Kontrolliere insbesondere den neuen Wert von HWINFO unter : "power reporting deviation (accuracy)". Aktuelles HWINFO evtl. erforderlich!

Dieser Wert sollte bei ca. 100% liegen. Liegt der weit darunter, würde ich mal Resizable BAR im BIOS deaktivieren und dann nochmals vergleichen. Alle Werte entgegen der Norm, werden von HWINFO in ROT dargestellt.



Wie ich auch bei meinem GigaByte Board beobachten konnte, ist ein Wert um die -50% besorgniserregend.
Wenn es geht, flashe zurück auf ein BIOS, was deinen Ryzen 5000 gerade unterstützt.

Auch mein GigaByte Board wurde auf BIOS Version F30 und AGESA 1.0.8.1 zurück geflasht, welches die besseren Werte liefert!
Bild 1 vorher mit AGESA 1.1.0.0 Patch D und Resizable BAR, sowie Bild 2 mit AGESA 1.0.8.1.

Anhang anzeigen 1026345 Anhang anzeigen 1026346
Der Wert liegt bei mir deutlich über 100% im Idle
Current | Minimum | Maximum | Average

1610696587167.png


Während Cinebench R23 Multicore erhalte ich folgende Werte:
1610697597704.png

Ich muss mich zu dem Thema mal einlesen, ich kann nicht beurteilen was Werte über und unter 100% genau aussagen und ob das jetzt gut oder schlecht ist was ich da sehe....
 

Anhänge

  • volt.png
    volt.png
    18,4 KB · Aufrufe: 328
  • volt2.png
    volt2.png
    47,6 KB · Aufrufe: 331
  • volt3.png
    volt3.png
    34 KB · Aufrufe: 344
Zuletzt bearbeitet:
Auf jeden Fall schon mal besser, als bei mir! Du kommst nicht ins minus von über 50%, allerdings ins Plus.
Wie sich das ganze verhält, ich weiß es nicht ganz genau, habe mich auch nur eingelesen!
So kann die CPU nicht ungeachtet mehr Saft aus der Leitung ziehen ...

Es zeigt aber deutlich, dass die Mainboardhersteller mit ihren BIOS Versionen tricksen, zu Lasten der CPU!
Alle Ryzen 3000 sollen davon noch eher betroffen sein. Man sollte über diese neuen BIOS Versionen gewarnt sein! Es empfiehlt sich für alle Ryzen 3000 derzeit nicht, auf die neuen BIOS Versionen zu wechseln.

Nur die Mainboardhersteller können Abhilfe schaffen!
Du kannst ja mal den PBO deaktivieren und die Werte auslesen ...
 
PBO ist schon die ganze Zeit deaktiviert, das war das erste was ich gemacht habe um das System stabiler zu bekommen. Alle hier geposteten Werte sind ohne PBO.
 
Gut, den PBO hatte ich noch an und werde es auch mal mit deaktivierter PBO kontrollieren.
Derzeit bin ich wegen einem Beitrag im HardwareLuxx wieder auf meine CPU Ryzen 9 vom 5900X auf den 3900X gewechselt. Bald kommt der 5900er wieder auf mein Board.

Die Whea Fehler können auf alle Fälle auch daher stammen ...
 
Ich bin komme von einem i7-920:rolleyes: Für mich ist also alles eine komplett neue Welt.
 
Das Problem tut sich ja auch jetzt erst mit den neuen BIOS Versionen ab AGESA 1.0.8.1 auf!
Für einen Ryzen 3000 ein gewaltiges Problem von minus 50% bei diesem o.a. gemessenen Wert von unter 50% mit BIOS AGESA 1.1.0.0. (Bild 1 aus #8).

Viele Grüße
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Dizzard
Schildkröte09 schrieb:
Das Problem tut sich ja auch jetzt erst mit den neuen BIOS Versionen ab AGESA 1.0.8.1 auf!
Für einen Ryzen 3000 ein gewaltiges Problem von minus 50% bei diesem o.a. gemessenen Wert von unter 50% mit BIOS AGESA 1.1.0.0. (Bild 1 aus #8).

Viele Grüße

Finde ich ziemlich krass, dass durch eine neue BIOS Version die Werte sich so zum negativen verändern.


Laut MSI Forum erscheint in nächster Zeit (~ 1 Woche) ein neues BIOS Update für mein Mainboard mit AGESA 1.2. Für vereinzelte B550 und X570 Boards ist 1.2 ja schon draußen. Ich hoffe das bringt dann auch etwas.
 
Ohne PBO fällt der Wert noch einmal weiter ab. Erheblich weiter. Man muss sich wohl mit einem Ryzen 3000 erheblich Sorgen machen ... und das mit BIOS AGESA 1.0.8.1!

hwinfo4.png hwinfo5.png

Ich überlege mir ernsthaft auf ein BIOS darunter zu flashen, welches dann allerdings keinen Ryzen 5000 mehr unterstützt. Zum Test werde ich das wohl später machen ... Mit Benchmark liegt der 3000er Ryzen immer noch über 20% unter dem realen Wert von 100% ...
 
Zuletzt bearbeitet:
Hatte den gleichen Fehler mit I7-9700k, Egal ob Idle oder in Games. Bei mir lag zu wenig VCore an. Nach Erhöhung war das Problem nie wieder da.
 
  • Gefällt mir
Reaktionen: Schildkröte09
Nicht lange rumfackeln bei dem Thema. Jegliche Tests sind Zeitverschwendung. Ist ein bekanntes Problem. Kumpel hatte exakt dasselbe. Stock Settings, Whea Error Bluescreens in unregelmäßigen Abständen. Höchstes Wahrscheinlichkeit bei Monster Hunter World und Escape from Tarkov.
Nachdem er gefühlt Millionen Sachen probiert hat (samt diverse Hardware getauscht) und der ganze Spaß über 1 Monat Zeit gekostet hat, hat er einfach nochmal ein 5900x bestellt, eingebaut und lief absolut problemlos.

Er hat nun die alte CPU bei AMD reklamiert und schon dorthin geschickt. Wenn das Ding Stock Probleme macht, melde dich bei AMD. Man muss keine Spannungen etc. einstellen. Sobald man da etwas verstellen muss, ist die CPU Müll. Da ich dieselbe CPU und Board habe, habe ich teilweise mit ihm Settings abgeglichen und ihm bestätigt, dass das Ding so laufen muss.
 
Ich werde die nächste BIOS Version abwarten, wenn dann immer noch nicht alles läuft wird das Ding umgetauscht.

Edit: Hat einer von euch vielleicht ne Ahnung wie lange so ein RMA Vorgang dauern kann?
 
Zuletzt bearbeitet:
Es wird echt immer verrückter. Ich habe mit dem AMD Support geschrieben, dieser hat mir noch paar Lösungsvorschläge genannt. Habe jetzt erstmal nen CMOS clear gemacht. Heißt ich bin weiterhin auf dem Beta BIOS aber alles läuft Default. PBO an, kein XMP Profil aktiv (RAM läuft auf 2133 MHZ) und kein CPU VCore Offset mehr. Werde jetzt erstmal die Performance testen aber ich habe seit dem CMOS clear MASSIVES Spulenfiepen unter Last, kommt definitiv von der Grafikkarte. Wie kann das sein, das war definitiv vorher nicht da :freak:
 
Zuletzt bearbeitet:
Zurück
Oben