Seit 2 Jahren Idle/Low Load Crashes (Zen 3)

K0NG95

Cadet 2nd Year
Registriert
Jan. 2022
Beiträge
19
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): 2x 5800X, 2x 5900X, 1x 5950X, 1x 5800X3D
  • Arbeitsspeicher (RAM): G.Skill Trident Z Neo 2x16GB 3600mb/s CL 16 (Dual Rank), 2x8GB alter generischer Corsair LPX 3200 CL16, 2x8GB Ripjaws V 3200 CL16.
  • Mainboard: 2x B550 Strix F, 2x B550 Tomahawk
  • Netzteil: Corsair RM750x (2021 Version), BeQuiet Straight Power 1200W Platinum, BeQuiet Dark Power Pro 11 750W, altes EVGA G2 750W?
  • Gehäuse: NZXT H510 Flow, Corsair 4000D Airflow, Fractal Design Meshify S2
  • Grafikkarte: Vega 64, 1080 Ti, 2070S, 2080S, 2080Ti, 2x 3060, 2x 3070, 3x 3080, 1x 3080 Ti, 1x 3090, 3x 6700XT, 1x 6800XT, 2x 6900XT.
  • HDD / SSD: 4x Crucial MX500 1TB, 2x Corsair MP600 Pro 1TB, 2x Samsung 970 Evo Plus, 2x Samsung 870 QVO 4TB.

    "Doppelte CPUs und Mainboards sind Austauschgeräte"
    Restliche genannte Teile sind/waren über den Zeitraum von 2 Jahren in meinem Besitz.

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Hauptsächlich im Leerlauf, Leichte Last stirbt der PC einfach zufällig und nicht reproduzierbar ab. Sprich man schaut ein YT Video, ist im Idle, Spielt ein Spiel oder schreibt gerade diesen Text hier und der Bildschirm wird Schwarz und der PC Startet neu mit dem WHEA Error CPU ID (zufällig) Error Code 18.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
Alle CPUs auf allen Mainboards mit allen Ram Kits getestet, alle erdenklichen Grafikkarten mit allen vorhanden Netzteilen getestet.
PSU Idle Control auf Typical gestellt, RAM Power Down Mode deaktiviert, RAM Spannung erhöht, XMP/DOCP deaktiviert, positive und negative Curve Optimizer offsets getestet, Gear down mode deaktiviert, manuelle sehr lose timings versucht, mit SoC, VDDG CCD Voltage , VDDG IOD Voltage , CLDO VDDP gespielt, JEDES Bios installiert was zum Zeitpunkt aktuell war von Zen 3 Launch bis Heute, Windows Power Pläne getestet, bestimmt 30x Windows neu installiert (alle Treiber sind IMMER aktuell, keine Bloatware, keine Pseudo Cleanup tools oder ähnliches.)
Jedes RAM Kit läuft auf meinen Intel UND AMD Systemen problemlos im Memtest bis 1000% ohne Fehler.
Alle Netzteile, Grafikkarten, SSDs und RAM Kits laufen tadellos auf allen Intel Systemen. (Mehr als 10 Prozessoren von Skylake bis Alder Lake)
Die Probleme treten nur mit Ryzen 5000 auf. (Nur der erste 5800X von ende 2020 läuft einigermaßen (2-3 Crashes pro Monat wenn man ihn manuell übertaktet. (4.5Ghz 1.25V))
CPUs wurden von AMD getauscht, Boards von Händlern. Nichts hilft.
Ich habe absolut keine Anhaltspunkte mehr um die Probleme zu lösen und weiß nicht was ich noch versuchen soll.
Nicht das jemand aufgrund der vielen Hardware davon ausgeht das ich ein Troll wäre... Hier sind ein paar Bilder meiner Hardware.
Einige davon wird man auch durch die google rückwärtssuche finden da ich auch in anderen foren wie z.B. TechPowerUp aktiv bin.

Wenn irgend jemand noch ein Ass im Ärmel hat... lasst es mich bitte wissen.
 

Anhänge

  • 1 (2).jpg
    1 (2).jpg
    961,4 KB · Aufrufe: 204
  • 1 (29).jpg
    1 (29).jpg
    900,5 KB · Aufrufe: 223
  • 1 (22).jpg
    1 (22).jpg
    899,7 KB · Aufrufe: 201
  • 1 (21).jpg
    1 (21).jpg
    1.001,1 KB · Aufrufe: 206
  • 1 (20).jpg
    1 (20).jpg
    950,7 KB · Aufrufe: 213
  • 1 (18).jpg
    1 (18).jpg
    891,7 KB · Aufrufe: 206
  • 1 (17).jpg
    1 (17).jpg
    884,4 KB · Aufrufe: 207
  • 1 (8).jpg
    1 (8).jpg
    782,6 KB · Aufrufe: 208
  • 1 (7).jpg
    1 (7).jpg
    975,9 KB · Aufrufe: 201
  • 1 (4).jpg
    1 (4).jpg
    1 MB · Aufrufe: 208
  • 1 (1).jpg
    1 (1).jpg
    957,6 KB · Aufrufe: 226
  • Screenshot 2022-07-09 013350.png
    Screenshot 2022-07-09 013350.png
    12,6 KB · Aufrufe: 219
Zuletzt bearbeitet:
Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Bus/Interconnect Error
Prozessor-APIC-ID: 0

Error 18
 
  • Gefällt mir
Reaktionen: EyBananaJoe
Welches Uefi ist aktuell drauf?

Das frage ich nicht nur aus Langweile, sondern weil es recht wichtig ist !!
 
Bei der Menge an Hardware die Du durch hast, liegt es an deinen Einstellungen.
Sicher dass es komplett @Stock nicht problemfrei läuft?

Ansonsten liegt es vielleicht an deinen lokalen Gegebenheiten.
(Steckerleiste, Stomversorung, Erdungsprobleme, EMV, Lankabel nicht geerdet, Fehlerstrom auf USB Gerät, starke EM Felder in der Nähe....)

Ich habe sicher schon 20 5000er Ryzens verbaut und einen WHEA Fehler habe ich noch nie gesehen.
 
Jede kombination ist komplett Stock genau gleich instabil.
der 5950x ist am schlimmsten, der 5800X3D ist in den letzten zwei Wochen 4-5 Mal abgestürzt (Davon zwei mal Heute)
"
Ansonsten liegt es vielleicht an deinen lokalen Gegebenheiten.
(Steckerleiste, Stomversorung, Erdungsprobleme, EMV, Lankabel nicht geerdet, Fehlerstrom auf USB Gerät, starke EM Felder in der Nähe....)"
Das bezweifle ich da in diesem Raum, an den gleichen Steckdosen seit über 20 Jahren PCs laufen (Mein FX, und ein Ryzen 3800X laufen tadellos)
Dazu läuft JEDES Intel System was ich besitze/besaß absolut einwandfrei:
Core i5 6600K
Core i7 7700K
Core i5 8600K
Core i7 8086K
Core i5 9600K
Core i9 9900K
Core i5 10400F
Core i5 10600KF
Core i7 10700K
Core i9 10900F
Core i9 10850K
Core i9 10900KF
Core i5 11600K
Core i3 12100F
Core i5 12600K
Core i7 12700K

ASROCK Z170 Extreme4
ASUS TUF Z270 Mark 2
ASUS TUF Z370 Gaming Plus II
Gigabyte Z390 Aorus Master
Gigabyte Z390 Aorus Pro AX
ASROCK Z490 Extreme4
ASUS Z490 TUF Gaming Plus
MSI Z490 Unify
ASUS Z590 STRIX-F
ASUS B660 Prime Plus D4
MSI Z690 PRO-A DDR4
Ergänzung ()

Burki73 schrieb:
Welches Uefi ist aktuell drauf?

Das frage ich nicht nur aus Langweile, sondern weil es recht wichtig ist !!

immer die aktuellste 7C91vAA (AGESA 1.2.0.7 auf dem Tomahawk)
Ich habe JEDES Bios was seit Launch erschienen war mit praktisch jedem Chipset Treiber drauf gehabt.
Immer das aktuellste bis zum jetzigen Zeitpunkt. vom Launch von Zen 3 bis Heute.
 
  • Gefällt mir
Reaktionen: Burki73
Will dir nicht zu nahe treten...
Alle Systeme immer selbst zusammen gebaut, installiert?
Schon allein durch Glück müsste eine Kombi mal ohne Probleme laufen.
Hab zwei Jungs...
Regelmäßig muss, wird, darf ach verdammt. Werden unsere Systeme geupgradet.
Haben alles irgendwann mal gehabt.
Solche Probleme gibt es bei uns nie.

Verklopp alle Teile und lass dir ein "fertig" System von einem guten Anbieter nach deinen Vorgaben zusammen stellen.

Wenn ich das Muster sehe...
Intel only k.

Überhaupt mal Stock angefangen bei amd?
Oder immer gleich alles hochgerubt?
Bitte ehrlich sein.
Beim ersten Starten zu viel und kaputt gemacht?

Mfg
 
Hatte ich auch mit dem 9900ks und gigabyte master,stock settings waren irre, totaler overvolt bis zur kernschmelze und crash im idle. Spannungen und boost manuell tunen
 
Matthias80 schrieb:
Will dir nicht zu nahe treten...
Alle Systeme immer selbst zusammen gebaut, installiert?
Schon allein durch Glück müsste eine Kombi mal ohne Probleme laufen.
Hab zwei Jungs...
Regelmäßig muss, wird, darf ach verdammt. Werden unsere Systeme geupgradet.
Haben alles irgendwann mal gehabt.
Solche Probleme gibt es bei uns nie.

Verklopp alle Teile und lass dir ein "fertig" System von einem guten Anbieter nach deinen Vorgaben zusammen stellen.

Mfg
Ich baue jedes System selbst. (insgesamt bestimmt 40-50 Stück angefangen mit einer GeForce 4 Ti 4200 und einem Pentium 4)
Aber anscheinend kann ich seit ~20 Jahren nur Intel CPUs in den Sockel legen. (Und dann erstaunlicherweise ohne je ein Problem gehabt zu haben.)
 
Also laut Ereignisanzeige ist es die CPU.

Ich denke es liegt am Strom und würde das System bei einem Bekannten testen um die Hardware auszuschließen.

Tritt der Fehler da nicht auf würde ich mir eine USV kaufen und den PC daran anschließen
 
Die anderen Frage?
Gerade bei der 5000 Serie ist oc fast komplett sinnlos.
Vielleicht intel tweaks (uefi) bei AMD mit rübergenommen?

Hört sich ja leider wirklich nach Hardware Problemen an...
Bin in 95 Zeiten groß geworden.
Da war das Problem einfach die Software.
Da war man Abstürze gewohnt.
Wenn in an diese Zeiten denke, wäre ein Absturz im Monat. Ein Traum!

Jetzt im Nachhinein wird es eh schwer...

Daten deinen aktuellen Systems.
Screenshots.
Bilder.

Attacke.

Mfg
 
Matthias80 schrieb:
Vielleicht intel tweaks (uefi) bei AMD mit rübergenommen?
booten, xmp an. fertig.
Matthias80 schrieb:
Daten deinen aktuellen Systems.
Screenshots.
Bilder.
Ich kann dir mein jetziges Aktuelles System was gerade läuft zeigen... ich habe einige.
Morgen wird der 12700K wieder in Betrieb genommen, vermutlich mit der 3090 oder der 6900XT.
20220709_021617.jpg
Screenshot 2022-07-09 021707.png
Screenshot 2022-07-09 021845.png

Ergänzung ()

Giggity schrieb:
Ich denke es liegt am Strom und würde das System bei einem Bekannten testen um die Hardware auszuschließen.

Tritt der Fehler da nicht auf würde ich mir eine USV kaufen und den PC daran anschließen
Und Der Stromkreislauf ist auf magische Art und Weise wieder gut sobald ein Intel Chip den Saft aus der Dose zieht? :lol:
Meinen ersten 5900X hatte ich mit bei meinen Eltern. Da ist er ebenfalls andauernd verreckt.
 
Zuletzt bearbeitet:
WHEA 18 ist meist CPU fehler, auch wenn es recht unwahrscheinlich ist, kann es auch sein das deine Bretter die CPUs grillt. Ausschliessen kann man sowas nicht. Welche Batches haben die ?
Mal nur mit dem nötigsten probiert ? Also tastatur, maus und monitor.
Mir selbst sind auch schon 2 5950x mehr oder weniger gestorben, einer war von jetzt auf gleich tot, sprich rechner ging sofort wieder aus und der andere hat mit der zeit angefangen zu crashen mit WHEA18, egal ob getuntes oder stock setting.
 
K0NG95 schrieb:
Und Der Stromkreislauf ist auf magische Art und Weise wieder gut sobald ein Intel Chip den Saft aus der Dose zieht? :lol:
Scheinbar! :D

Hast du einen USB-Hub dran, oder die Möglichkeit ganz andere Tastatur/Maus zu testen? Mir scheint fast, dass die Hardware im PC an sich okay ist.

Und hast du andere Lüfter (CPU+Gehäuse) verfügbar? Nicht, dass ein Lüfter im Idle brav runtergeregelt wird und dann aus irgendeinem Grund viel mehr Strom frisst als er sollte...
 
Test bitte die Einstellung für den RAM-Takt mit 3200 MHz.
Wenn man sich den Screenshot von CPU-Z anschaut, so ist dort der RAM-Takt mit knapp 1800 MHz angegeben, was aufgrund von DDR einem Takt von 3600 MHz entsprechen würde.
AMD-CPUs lassen ab Werk einen maximalen Takt von 3200 MHz zu, alles darüber ist Overclocking und kann, muss aber nicht, funktionieren, dies würde unter Umständen zum geschilderten Problem führen.

Edit:
1657351794074.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: cutterslade1234
Vielleicht liegen die Probleme auch einfach an den Mainboards ? Bei deinen Intelsystemen kamen nicht gerade die preiswertesten Bretter als Unterbau zum Einsatz.
 
Eher unwahrscheinlich aber mal probiert im CBS Menü die Option "Power Supply Idle Control" auf Typical Current Idle anstatt Auto zu stellen?
 
Das ist ein bekanntes, aber kommerziell verschwiegenes Problem was du hast. Wurde auch hier im Forum schon sehr oft durchgekaut. Ich war selbst zwei Jahre davon betroffen, bis es auf magische Art und Weise mit den AMD Chipsettreibern vom 17.03. von selbst verschwand. Allerdings nur bei mir, bei vielen anderen weiterhin nicht.
Bei der Menge an CPUs, den 4x AM4 Boards, den vielen GPUs und Netzteilen, den Alternativsystemen, die du hast braucht man gar nicht an vermeintlichen, anwenderseitigen Ursachen rumzuforschen.
Es ist und bleibt ein Fehler von AMD, der sich nur deswegen nicht bei allen bemerkbar macht, weil sie Glück haben, dass gewisse Komponenten, Setup-Konstellationen oder die Chipgüte ihrer CPUs irgendwelche Cache-Hierarchy Fehler oder Spannungen tolerieren.

Das Netz ist voll mit diesem Problem. Stichwort: Idle-Crash, Idle-Reboot.
Die Problematik geht so weit, dass selbst eine Urgroßvater-Stocksetting mit abgeschalteten Stromsparmechanismen die Abstürze nicht vermeidet. Ich habe zwei Jahre lang versucht das Problem mit den verschiedensten Stellschrauben zu lösen. Es hat nichts gebracht, zumal die Fehlersuche auch aufgrund der schwierigen Reproduzierbarkeit extrem nervig ist. Dann hast du mal für zwei Wochen Ruhe und denkst, dass Problem sei beseitigt, aber zack haste plötzlich wieder 2 idle-reboots am Tag.

Eine Vermutung, die ich schon ziemlich lange habe ist, dass die Telemetrie zwischen CPU<->MB ein wesentlicher Bestandteil des Problems ist. Theoretisch kann man über LLC Einstellungen dem entgegenwirken, hatte bei mir aber nichts gebracht.
Das einzige, was bei meinem System half (3700X @X570) war ein fixed Vcore mit fixem CPU-Takt. Im Zuge der Fehlersuche hatte ich irgendwann herausgefunden, dass ich den crash garantiert mit einem VCore Offset von +25mV reproduzieren konnte. Daraus ließ sich vermeintlich ableiten, dass der Crash durch zu hohe Spannungen geschieht, was sich aber im späteren Verlauf widerlegt hat.

Hier ist eine Umfrage, die ich mal gestartet hatte, um Informationen zu sammeln:
https://forms.gle/gkLSDpazHdvExyTj9
 
  • Gefällt mir
Reaktionen: Shadow86
iron_monkey schrieb:
Vielleicht liegen die Probleme auch einfach an den Mainboards ? Bei deinen Intelsystemen kamen nicht gerade die preiswertesten Bretter als Unterbau zum Einsatz.
Das Z690 Pro A ist das billigste Z690 Board was man kaufen kann.
Darkling71 schrieb:
Test bitte die Einstellung für den RAM-Takt mit 3200 MHz.
Wenn man sich den Screenshot von CPU-Z anschaut, so ist dort der RAM-Takt mit knapp 1800 MHz angegeben, was aufgrund von DDR einem Takt von 3600 MHz entsprechen würde.
AMD-CPUs lassen ab Werk einen maximalen Takt von 3200 MHz zu, alles darüber ist Overclocking und kann, muss aber nicht, funktionieren, dies würde unter Umständen zum geschilderten Problem führen.

Edit:
Anhang anzeigen 1236953
Hat damit ebenfalls nichts zu tun... die Crashes passieren auch mit 2400Mhz ohne XMP.
Und hier ist ein Frischer 9 Stunden Memtest der Gerade eben vor 3 Minuten beendet wurde.
5800X3D 9H Memtest.png

ShiftC schrieb:
Das ist ein bekanntes, aber kommerziell verschwiegenes Problem was du hast.
Ich weiß... es gibt etliche tausende Einträge in allen erdenklichen Foren. :(
Hatsune_Miku schrieb:
Mal nur mit dem nötigsten probiert ? Also tastatur, maus und monitor.
Ich habe nie mehr dran als Tastatur/Maus.
Hilda12 schrieb:
Eher unwahrscheinlich aber mal probiert im CBS Menü die Option "Power Supply Idle Control" auf Typical Current Idle anstatt Auto zu stellen?
Lies bitte erst meinen Post.
Looniversity schrieb:
Und hast du andere Lüfter (CPU+Gehäuse) verfügbar?
Hatte bis vor kurzem ein ganzes Kit aus NF A12x25 drin. sowie einen NH-D15 im Meshify und zwei AIOs.

Ergänzung ()

So und nun kann ich einfach Das Board raus nehmen, einen 12700K einbauen und den PC ohne irgend welche Veränderungen mit sonst der identischen Hardware auf alle Ewigkeit ohne auch nur ein Problem zu haben weiter benutzen. (Gerade den 58X3D ausgebaut und meinen 12700K eingebaut.)
Und so geht der Spaß schon seit 2 Jahren.
123.jpg
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Shadow86
ShiftC schrieb:
Bei dir hat fixer Takt mit fixer Spannung nichts gebracht ? Wie siehts mit Deaktivieren von CorePerformanceBoost aus ? Hilft auch das nicht ?
Mein ersten 5800X stürzt praktisch nicht mehr ab mit fixem Takt und Spannung.
 
Zurück
Oben