Sporadische Rechner Neustarts mit Ryzen 5800X3D

Zomb2k

Lt. Junior Grade
🎅Rätsel-Elite ’24
Registriert
Nov. 2020
Beiträge
264
1. Nenne uns bitte deine aktuelle Hardware:
  • Prozessor (CPU): AMD Ryzen 7 5800X3D
  • Arbeitsspeicher (RAM): 32GB GSKILL Trident Z NEO 3600 16CL
  • Mainboard: MSI B450 Gaming plus
  • Netzteil: bequiet Straight Power 11 850Watt
  • Gehäuse: bequiet 500DX
  • Grafikkarte: RTX 4080 Gamingpro
  • HDD / SSD: Samsung 860 evo 500GB + 2TB Western Digital 750
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat(Monitormodell, Kühlung usw.): CPU, Netzteil, Mainboard

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Moin zusammen,

mein Problem ist das ich seit dem 14.11.2022 sporadisch Neustarts mitten im Gaming Betrieb habe. Diese Neustarts treten manchmal mehrfach am Tag auf, manchmal anderthalb Monate gar nicht. Deswegen melde ich mich auch erst jetzt mit dem Fehler, ich dachte zwischendurch ihn behoben zu haben. Der Rechner startet aus heiterem Himmel einfach direkt neu, als ob man den RESET Schalter drücken würde und ist dann auch direkt nach 10 Sekunden wieder hochgefahren. Im Eventlog findet man dann einen WHEA LOGGER Fehler. Diese Fehler änderten sich in der Vergangenheit von "halbwegs aussagekräftig" hinzu "nicht aussagekräftig". Folgende Meldungen hatte ich seit dem 14.11. im LOG:
__________________________________________________________________________________________
Schwerwiegender Hardwarefehler. Ein Fehlereintrag mit einer Beschreibung des Zustands befindet sich im Datenbereich dieses Ereignisses. (diese Meldung kommt aktuell)
__________________________________________________________________________________________
Schwerwiegender Hardwarefehler. (die kamen später)

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 6

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.

__________________________________________________________________________________________

Behobener Hardwarefehler. (die kamen anfangs)

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Corrected Machine Check
Fehlertyp: Bus/Interconnect Error
Prozessor-APIC-ID: 0

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.

__________________________________________________________________________________________

Die CPU ist seit dem 26.10.2022 im Rechner verbaut. Am 14.11. fingen die Fehler an. etwas später die Neustarts.


3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
Alle Netzteil Kabel abgezogen, kontrolliert und neu verbunden.
Energieprofil umgestellt.
Alle Updates installiert (BIOS, Chipsatz, Windows 11)
RGB Firlefanz abgesteckt
Lüfter auf dem Board an andere Steckplätze umgesteckt

Das schwierige an dem Problem ist die Reproduzierbarkeit. Ich habe gestern diverse Benchmarks und stress tests laufen lassen und es gab nicht einen Neustart (AIDA, FURMARK, PRIME95, heavyload, Cinebench). Ebenso habe ich gezockt und den Rechner zwischendurch in den Standby geschickt. Keine Probleme, er rennt und rennt.
Das was mir seltsam vorkommt ist das die CPU, egal mit welchem Kühler ich arbeite, beim benchen, stressen und gaming (auch rocket league, lol, diablo 3) die ganze Zeit im PPT liegt (90°). Ich hatte schon einen Deepcool AS500, Dark Rock und aktuell einen Arctic liquid freezer 2 240 drauf. Nen Kumpel meinte es ist das Netzteil, ein anderer meint es ist die CPU. Ich komm leider nur aktuell nicht wirklich weiter. Ich schaff es nicht mal den Fehler zu reproduzieren...


Vielleicht hat von euch jemand ne Idee?
 
Stell man dein Ram Takt auf 3200MHz, vielleicht bringt das was.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Tr8or, Mickey Mouse und arvan
Hast du noch die alte CPU? Kannst du die einbauen und gegentesten?
RAM wäre laut Reddit auch möglich.
 
Sieht mir auch nach einem CPU Fehler aus. Eventuell hast du eine Gurke erwischt und sie macht den IF Takt von 1800 Mhz nicht mit. Also mal runter mit dem RAM Takt. Offiziell geht das Board auch nur bis 3466 MHz.

Hast du mal MemTest86 oder ähnliches durchlaufen lassen?
 
  • Gefällt mir
Reaktionen: djducky und Azghul0815
kann die CPU sein, RAM ist aber meiner Meinung nach wahrscheinlicher, ganz einfach weil das RAM weniger von der Auslastung des PC "mitbekommt".
das RAM muss immer liefern, fast im Gegenteil: wenn die CPU auf allen Kernen Prime oder Pi berechnet und alle Daten im Cache liegen, dann hat es "weniger zu tun" als wenn der Desktop angezeigt wird ;)

daher würde ich am besten erstmal gar nichts verstellen und memtest86(+) laufen lassen.
falls es Probleme mit dem RAM geben sollte, dann werden die sehr wahrscheinlich relativ schnell ("relativ schnell" bedeutet aber immer noch >1 Stunde ;) ) angezeigt.
werden Fehler angezeigt, dann weißt du recht eindeutig woran es liegt.
läuft der Test komplett fehlerfrei durch, dann kann es immer noch das RAM sein und ich würde dann mal auf 3200MHz stellen.
 
  • Gefällt mir
Reaktionen: Azghul0815 und djducky
Vom Bauchgefühl würde ich auch auf dem RAM tippen, gerade in Verbindung mit dem B450 er Board. Und ich weiß, der Ram Controller sitzt in der CPU 😜. 3200 MHz einstellen und langsam hochtasten.
 
Kombostrike oder CO aktiv? Falls ja dann deaktivieren. RAM in den richtigen slots? A2/B2
Auch erst mal ohne XMP testen oder manuell auf 3200Mhz und 1.35v
 
Danke für die vielen Tipps. Hier noch ein paar Antworten von mir:

Memtest86 lief bereits einmal, ich glaub das war der Standard Durchlauf mit 8 Passes, war schon einige Zeit wie der lief, wie lange weiß ich nicht mehr, kann ich aber noch mal machen.
Ich hatte letztens auch den RAM gewechselt, hatte davor ein CRUCIAL BALLISTIX 16GB Kit drin, die Fehler gab es auch mit denen. Ich vermutete auch den RAM, deshalb hab ich nen neues KIT geholt und gleich aufgerüstet.

Kombostrike? CO meint CurveOptimizer? Wenn ja, beides nicht aktiv. Ich hab im BIOS nach den Defaults das XMP angeschaltet, hab TPM aktiviert (WIN11) und das wars, mehr hab ich nicht geändert nach dem letzten BIOS Update.

Ich werde MEMTEST noch nen bisschen laufen lassen. Aktuell versuche ich den Fehler zwanghaft zu reproduzieren, weil ich natürlich eine Lösung finden will, bevor mir hier bei einigen Teilen die Garantie wegrennt.

@Azghul0815 am 14.11. war es immer die 0, später einmal die 6 und seitdem nur noch die kryptische Nichts aussagende Meldung ohne Inhalt.
1684601261032.png
 
Hast du es denn ohne XMP probiert?
 
Noch nicht, das war in den letzten Jahren mit anderer CPU und anderem Speicher nie ein Problem. Auch der alte Speicher lief mit xmp 3600, teilweiße sogar mit 3800 und 1900 Infinity fabric.
Aber ja, kann natürlich von einem auf den anderen Moment kaputt sein. Also das Board zum Beispiel.
 
Nicht das Board, der Speichercontroller in der CPU macht das eben nicht so einfach mit, wie die CPU davor.
Das der Grund zu einem sehr hohen Prozentsatz! BTW wenn du Leistung haben möchtest solltest in meiner Signatur vorbei schauen. In dem Thread behebe ich dir dein Problem gerne!
 
  • Gefällt mir
Reaktionen: Azghul0815
Und in meinem Thread nicht so gerne? ;) :P

Die Karre läuft nun 4 Tage durch.
5,5 Stunden testmem5 mit extreme config
8 stunden karhu
1 Stunde Prime95
1 Stunde Cinebench
4,5 Stunden AIDA Stress Test

kein einziger Fehler, kein Neustart...
 
Ich hab im BIOS von XMP 1 auf XMP 2 umgestellt und dann getestet.
Ich teste nun mit dem corecycler
 
Ich hatte einen 5900x, solange ich gezockt habe oder Prime, Benchmarks usw. liefen wart die Kiste stabil.
Beim Zocken, wenn mal Ladebildschirme waren oder wenn der PC in den Idle ging und dann aufgeweckt wurde, gab es einen Neustart. WHEA Fehler immer auf Kern 0 oder Kern 7. (Stock Settings btw.)

CPU via RMA ausgetauscht und keine Probleme mehr.
 
Es läuft nun seit 7 stunden der corecycler, keine Fehler, keine Neustarts...
 
  • Gefällt mir
Reaktionen: Azghul0815
Ich weiß nicht ob das so gut ist azghul, Fehler die man nicht reproduzieren kann, tauchen meistens in Momenten wieder auf, in denen man sie nicht gebrauchen kann ;)
Mir fällt grad ein das ich für die Tests das Energie Profil geändert habe, von ausbalanciert auf Ryzen high Performance, damit der Rechner durchläuft und an bleibt. Kann es damit zu tun gehabt haben?

Kann es beim X3D zu Problemen kommen wenn nicht die AMD Energie Profile ausgewählt sind?
 
Naja. Aktuell sind alle Tests gut und es wurde ja schon der RAM vermutet.
Nun läuft ein anderes XMP profil und es scheint alles ok zu sein.

Das ganze Thema mit Speicher, Speichercontroller und XMP ist nicht ganz trivial.

Gleicher DDR4 RAM, auf x370 mit 2700x und 3700x locker 3800, selbe Timings und Subtimings. Erster 5900x auf B550 defekt, 2ter ne Diva. 3800 geht auch, dauerte aber mehrere Wochen zum Stabil bekommen.
 
Zurück
Oben