Plötzliche Freezes mit Ryzen 5900X

Mojo1987

Admiral
Registriert
Feb. 2009
Beiträge
9.746
Hallo zusammen,


seit Montag habe ich das Problem das mein AMD System im Idle einfach einfriert.
Manchmal nach 2 Minuten, manchmal erst nach 15 Minuten. Wenn ich ihn lange genug im Freeze Zustand gelassen habe, dann kam irgendwann der immer selbe dpc_violation_watchdog Bluescreen, mit Bugcheck-Code 0x133 und Verweis auf die ntoskrnl.exe laut Bluescreenview.

Diablo 4 zocken über Stunden war kein Problem, sauber gelaufen wie immer mit der zu erwartenden Performance.

System:
AMD Ryzen 9 5900X (2 1/2 Jahre alt)
EK-AIO 360 D-RGB
MSI MAG B550 Tomahawk (3 Jahre alt)
32 GB G.Skill Trident Z RGB 3200Mhz CL16 (3 Jahre alt)
MSI Geforce RTX 4080 Suprim X (6 Monate alt)
Seasonic Prime GX-1300 (6 Monate alt)
ADATA XPG SX8200 Pro 1TB
ADATA XPG SX8200 Pro 2 TB
Samsung SSD 860 QVO 4 TB SATA
Phanteks Enthoo Evolv X

Ich hab nach dem Testen der folgenden Dinge das "Problem" im Prinzip gefunden und auch einen Workaround, versuche aber zu verstehen warum das jetzt passiert ist.

Was ich probiert habe, aber alles samt keine Verbesserung brachte:
  • Temperaturen prüfen, sind alle im grünen Bereich.
  • CMOS Reset
  • RAM ohne XMP Profil
  • anderer RAM getestet
  • Windows 11 Backup von vor 2 Wochen zurückspielen
  • Windows 11 Clean Install
  • Alle Geräte abstecken die nicht für den Boot nötig sind (keine USB Gerät, außer Eingabegeräte, nur die Main SSD)
  • BIOS Update aufs Neueste (meins war von September letztes Jahr)
  • Grafiktreiber mit DDU Clean neuinstalliert

Bevor ich mir dann den Aufwand machen wollte und die Main SSD gegen eine andere tausche und ggf. die Grafikkarte gegen eine andere Tausche zum testen hab ich ein wenig recherchiert und in den Tiefen des Netzes Leute gefunden mit dem selben Problem.

Dort wurde darauf verwiesen Power Supply Idle Control auf "Typical Current Idle" zu setzen und die C-States im BIOS zu deaktivieren.
Ich habe es erst damit versucht nur Power Supply Idle Control zu ändern, das hat nichts gebracht.
Nachdem ich zusätzlich die C-States im BIOS deaktiviert habe, war das Problem weg.

Jetzt ist die Frage, was ist passiert und was ist wirklich defekt?
Hat die CPU durch Elektromigration oÄ. nachgelassen und schafft ihre Idle Voltages auf einmal nicht mehr? OC hatte ich außer dem geladenen XMP Profil keines aktiv, BIOS Settings waren alle samt immer auf Auto für die CPU was in 142W PPT resultiert hatte.
Hat das Netzteil einen Schlag im Idle obwohl ziemlich neu?
Vielleicht doch die Board Spannungsversorgung?

Leider kann ich weder Netzteil, noch CPU oder Board einfach testen. Dafür müsste ich meinen zweiten PC komplett zerlegen, was ich mir gerne sparen würde.

Ich fürchte ja, das ich um weiteres Testen nicht herum komme, aber meine Hoffnung ist das hier vllt. jemand das selbe Problem hatte und definitiv sagen kann das es, wie ich vermute, tatsächlich einfach an der CPU liegt.

Grüße
Mojo1987
 
Würde mal Win10 versuchen. Da hat ja was nicht mit dem Umschalten der C-States funktioniert und das geschieht ja im/ über das OS.
Ergänzung ()

Mojo1987 schrieb:
Hat die CPU durch Elektromigration oÄ. nachgelassen und schafft ihre Idle Voltages auf einmal nicht mehr?
Kann immer mal sein, dass Spannungen auf einmal nicht mehr ausreichen, sofern diese vom Nutzer eingestellt wurden (UV). Ob das dann automatisch mit Elektromigration zu tun hat bezweifle ich.
 
Versuch es mal mit HWINFO ,falls noch nicht geschehen - starten und lassen und dann auslesen. Vielleicht ist auch in der Windows Ereignis Anzeige was abgelegt,was Dich weiterbringt.
 
Wie war das noch... Schaltnetzteile niemals ohne Last betreiben, mal von der Effizienz mal ganz abgesehen, 1300Watt... Willst du ein Minigrig aufbauen?
Immerhin ein Netzteil direkt vom Hersteller und nicht mit Aufkleber vom Verkäufer...
 
Zuletzt bearbeitet von einem Moderator:
Das System wird sicherlich im Idle genug Last erzeugen das es keine Probleme gibt.
Das wird hier aber auch nicht das Problem sein.
 
ikarus1603 schrieb:
Wie war das noch... Schaltnetzteile niemals ohne Last betreiben, mal von der Effizienz mal ganz abgesehen, 1300Watt... Willst du ein Minigrig aufbauen?
Immerhin ein Netzteil direkt vom Hersteller und nicht mit Aufkleber vom Verkäufer...
Also moderne PC Netzteile kann man sehr wohl ohne Last betreiben.

Abgesehen davon ist es ein Markennetzteil eines Namhaften Herstellers. Natürlich könnte es defekt sein, aber ein grundlegendes Problem mit der Technik sehe ich hier nicht.

Und 1300W sind es weil das zum Zeitpunkt der Anschaffung eben lieferbar und bezahlbar war. Das es überdimensioniert ist weiß ich selbst.
Drewkev schrieb:
Hast du noch die Files davon?
Hab ich noch ja, aber wie gesagt Bluescreenviewer und dumpchk bedienen kann ich auch. Ich hab die ausgelesen, spezifische Treiber werden nicht genannt. Die Dumps sind auch praktisch die selben.

Ich kann die aber gerne Bereitstellen wenn du Trick 17 kennst :)

Xedos99 schrieb:
Versuch es mal mit HWINFO ,falls noch nicht geschehen - starten und lassen und dann auslesen. Vielleicht ist auch in der Windows Ereignis Anzeige was abgelegt,was Dich weiterbringt.
HWInfo lief zum Test mit, nichts auffälliges. Die CPU Temp ist mit unter 40 Grad sehr niedrig zum Zeitpunkt des Freezes, so niedrige Temps sehe ich sonst eigentlich nie, was auf Idle State Problematik hindeutet.

Die Ereignisanzeige ist leer zum Freeezezeitpunkt und wird auch danach nicht fortgeschrieben. Erst nach einem Neustart wieder, aber da taucht dann nur der klassische Kernel Power 41 auf, weil ich das System abwürgen musste.
 
Zuletzt bearbeitet:
Das gleiche Problem habe ich neuerdings auch wieder, bei meinem 3800X

Seit Kernel 6.2 oder 6.3 (Linux).
Eigentlich sollte das schon lange gefixt worden sein ab einer gewissen Agesa Version (Teil des Uefi)

Schau Mal ob du nur C6 abschalten kannst, anstatt alle C-States.

So kannst du wenigstens die Stromsparmodi bis C5 nutzen.
 
Mojo1987 schrieb:
dpc_violation_watchdog Bluescreen, mit Bugcheck-Code 0x133 und Verweis auf die ntoskrnl.exe laut Bluescreenview.
ntoskrnl.exe wird hier immer angezeigt, weil das ganze System (Windows) ja gecrasht ist.
Lade die letzt paar Dumpfiles doch wie gewünscht hier mal hoch.
Der "dpc_violation_watchdog" kommt ja auch gerne mal wenn sich was beißt (Software/Tools - Treiber)
 
  • Gefällt mir
Reaktionen: Drewkev
Ich werde heute Abend wenn ich am Rechner bin die Dumps bereitstellen und hab natürlich nichts dagegen wenn ihr Mal gegenprüfen wollt.

Treiber/Software schließe ich aber nahezu aus, da weder ein Cleaninstall noch das Einspielen eines 2 Wochen alten Backups, zu dessen Zeitpunkt alles problemlos funktioniert hat, was an dem Problem geändert hat.
 
Nein gar nichts, das Problem kam aus dem nichts. Das letzte Mal wurde im Januar was geändert. Da gab's das neue Netzteil + die 4080, in dem Zuge auch das Upgrade auf Windows 11 und damit verbunden das damalige verfügbare BIOS Update auf Stand September 2022.

Das System lief seither täglich, in unterschiedlichen Szenarien. Stundenlanges zocken war kein Problem, genauso wenig Stundenlanges idlen inkl. Standby etc.
Genau so wie man es sich eigentlich wünscht.
 
Mojo1987 schrieb:
Nein gar nichts, das Problem kam aus dem nichts.
Was it damit?
Mojo1987 schrieb:
BIOS Update aufs Neueste (meins war von September letztes Jahr)
Das neuste BIOS ist übrigens eine Beta.
Ergänzung ()

Und nimm 3 separate Kabel um vom Adapter der RX 4080
an 3 PCIe Anschlüsse des Seasonic Prime GX-1300 zu gehen.
Seasonic empfiehlt dies sogar ausdrücklich:
 

Anhänge

  • Recommended.PNG
    Recommended.PNG
    185 KB · Aufrufe: 135
Zuletzt bearbeitet:
Nickel schrieb:
Was it damit?

Das neuste BIOS ist übrigens eine Beta.
Das neueste BIOS wurde wie oben geschrieben als Versuch das Problem zu lösen installiert. Das Problem war zu dem Zeitpunkt bereits vorhanden.

Installiert wurde auch nicht das Beta BIOS, das gibt's erst seit heute sondern die Version 7C91vAD vom 05.05.2023.

Die Grafikkarte ist entsprechend der Empfehlung seitens Seasonic mit 3 seperaten Kabel. angeschlossen.
 
Anbei wir besprochen die beiden Crashdumps.
Einen Full Memory Dump hat er nicht erstellt, obwohl eingestellt.

Das waren ohnehin die beiden einzigen Bluescreens die er angezeigt hat und das auch erst nach ewigem warten im Freeze. Es waren im gesamten rund 20 Freezes am Montag und Dienstag bis zum Abstellen der C-States.
 

Anhänge

Razer?
Falls da was installiert ist an Software, mal deinstallieren und beobachten.
 
Beide Programme waren beim Cleaninstall nicht installiert und das System ist dennoch eingefroren. Da hab ich nur keine Dumps davon, weil er die wie gesagt erst nach Ewigkeiten wenn überhaupt erstellt hat.
Steam muss ohnehin funktionieren, auf das zu verzichten ist keine Option.

Das mit Razer Synapse werde ich mal versuchen, glaube aber nicht das es was ändert, zumindest passt zum zeitlichen Ablauf kein Update der Software.
 
Du hast angeblich bereits alle Ratschläge im Voraus schon umgesetzt
und an das was noch nicht, glaubst du nicht.
Ich glaube das wird hier wohl nichts.
 
Zurück
Oben