PC stürzt ab / System unter Last instabil (CPU defekt?)

OlafOlafson

Cadet 3rd Year
Registriert
Aug. 2021
Beiträge
35
Hallo zusammen.

Ich bin mittlerweile mit meinem Latein am Ende. Vielleicht habt Ihr ja noch eine Idee, woran der Fehler liegen könnte. Um es vorweg zu nehmen: Ich bin zwar kein kompletter Laie, was Hardware angeht, aber auch nicht besonders tief in der Materie.

1. Nenne uns bitte deine aktuelle Hardware:
  • Prozessor (CPU): i9 9900k mit Noctua NH-D15S + Thermal Grizzly Conductonaut
  • Arbeitsspeicher (RAM): G.SKILL Trident Z 4400 CL 16 32GB
  • Mainboard: Gigabyte Z390 Gaming X
  • Netzteil: Corsair RM850
  • Gehäuse: Corsair iCue 465X
  • Grafikkarte: RTX 3080 FE
  • HDD / SSD: 1 TB Samsung 970 Evo Plus NVME, 500 GB SSD, 4 TB HDD
2. Beschreibe dein Problem:

Bis vor ca. 2 Wochen lief mein System absolut schnell und stabil. Da ich allerdings u. a. viel Videoschnitt mache oder streame, komme ich mit 16 GB RAM teilweise an die Grenzen. Deshalb habe ich das exakt gleiche G.SKILL Set nochmal gekauft (4x 8 GB) und entsprechend eingebaut. Seit diesem Tag stürzt der PC bei anspruchsvollen Anwendungen 30-40min mit verschiedenen Bluescreens ab, meist mit der Beschreibung "IRQL_NOTLESS_OR_EQUAL" oder "MEMORY_MANAGEMENT". Auch Spiele wie z. B. Battlefield 5, der Export eines Videos oder das Rendern von Bildern in Lightroom führen nach 30-40min zum Bluescreen.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?

Da naheliegend war, dass entweder der RAM oder das Mainboard hinüber sind, habe ich den RAM intensiv getestet (MemTest und MemTest86). Mit XMP, ohne XMP, auf allen Stufen von 4400 bis auf 3200 runter. Einmal zeigte MemTest86 mehrere Fehler bei Test 6 an, weshalb ich noch zwei weitere Male den gleichen Test machte, allerdings beide Male ohne Fehlermeldungen. Um einen Defekt des RAMs auszuschließen, habe ich alle Riegel nochmal einzeln getestet (immer nur einer im System) und alle Tests (MemTest, MemTest86) waren unauffällig.

Der Prime95 Torture Test (Blend Modus) führt nach ca. 10min zum Abbruch, wenn alle vier RAM-Riegel verbaut sind (Fatal-Error: Final result was 00000000, expected: E3CA2ED >>> variiert). Wenn nur einer verbaut ist, sind es ca. 20min. Ich habe alle vier Riegel einzeln mit Prime95 getestet und der Abbruch tritt bei allen vier Riegeln auf. Es wäre jedoch ein sehr großer Zufall, wenn alle vier RAM-Riegel gleichzeitig defekt wären.


Die Temperatur habe ich mit zwei verschiedenen Tools überwacht und liege unter Volllast (Prime95) bei maximal 70°C (CPU). Windows habe ich 2x neu installiert, BIOS ist aktuell und ich habe alle Tests mit den Standard-Einstellungen, als auch mit geringfügiger Übertaktung, getestet. Machte jedoch keinen Unterschied. Die Treiber sind aktuell.

Alle Festplatten und die GPU habe ich geprüft, sind relativ neu und laufen einwandfrei. Sie dürften für die Abstürze ohnehin irrelevant sein.

Da das Intel CPU-Test-Tool keine Auffälligkeiten zeigte, bin ich davon ausgegangen, dass evtl. einer der RAM-Controller defekt ist und mir ein neues Mainboard besorgt. Doch das Problem tritt weiterhin auf. Das Netzteil habe ich auch gewechselt, jedoch ohne Besserung. Heute habe ich mir den RAM meines Schwagers ausgeliehen, doch Prime95 (und auch anspruchsvolle Anwendungen) führen mit der Zeit zum Abbruch oder Bluescreen. Dass ich so voreilig ein neues Mainboard gekauft habe, obwohl es offensichtlich doch nicht am Mainboard liegt, war jetzt halt Pech.

Als letzte Möglichkeit bleibt wohl, dass die CPU defekt ist. Der 9900k lief trotz übertaktung auf 5 Ghz immer sehr stabil und dank des starken Noctua Kühlers und Flüssigmetall waren die Temperaturen immer relativ niedrig (max. 75°C, der i9 9900k ist ja als Hitzkopf bekannt). Ich habe auch alles auf Standard zurückgesetzt sowie XMP deaktiviert. Läuft trotzdem nicht.

Bevor ich jetzt aber wieder los renne und nur auf Verdacht die CPU einschicke (habe noch 6 Wochen Garantie), dachte ich, frage ich hier mal nach. Vielleicht hat ja jemand eine Idee…

Solltet Ihr noch Infos brauchen > einfach Bescheid geben.

Danke vorweg für Eure Hilfe.

Grüße
Patrick
 

Anhänge

  • 82B89D9C-8678-484F-AB77-23A05138119A.JPG
    82B89D9C-8678-484F-AB77-23A05138119A.JPG
    4,7 MB · Aufrufe: 441
  • D4E23068-C909-436A-9738-E467D50A7746.JPG
    D4E23068-C909-436A-9738-E467D50A7746.JPG
    145 KB · Aufrufe: 431
Zuletzt bearbeitet: (Tippfehler)
4x8gb, vollbestückung... mit 4400?
das ist quasi rütteln am watschenbaum.
mit garantie, daß die frucht fällt.

und erwartungsgemäß sind die fehler speichertypisch.
was NED heisst, daß der speicher an sich defekt ist.
aber diese settings sind völlig absurd mit vollbestückung.

geh mit dem speed runter.

lass das xmp, geh manuell auf 3200, teste dich in stufen nach oben.
3200, 3600, 3733... immer nur rauf, wenn das vorige fehlerfrei.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: .Sentinel. und Captain Mumpitz
Auf Deinem zweiten Bild ist ein defekter Arbeitsspeicher zu sehen, der sollte ersetzt
OlafOlafson schrieb:
MEMORY_MANAGEMENT
Passt auch zu diesem blue screen.
werden.
Ergänzung ()

OlafOlafson schrieb:
trotz übertaktung auf 5 Ghz
Wenn ein System nicht Fehler frei läuft sollte man auf Übertaktung verzichten.
 
  • Gefällt mir
Reaktionen: lord_mogul und TouchGameplay
@whats4 und @Silver Server

Sorry, ich habe es ganz vergessen zu erwähnen: Es ist bereits alles auf auf Stock zurückgesetzt und XMP deaktiviert. Habe auch alle Varianten getestet (mit OC, ohne OC, mit XMP, ohne XMP), aber das Problem besteht weiterhin. Liegt also nicht am OC oder XMP. Ich ergänze es im Eingangspost.
 
Wie geschrieben, Dein Bild zeigt einen defekten Arbeitsspeicher, der sollt erneuert werden.

Bei einer Übertaktung kann auch ein dauerhafter Schaden entstehen, der auch noch da ist wenn man bereits wieder auf Standard zurück kehrt.

Aber erneure erst mal den Arbeitsspeicher oder sortiere die defekten Riegel aus.
 
Silver Server schrieb:
Wie geschrieben, Dein Bild zeigt einen defekten Arbeitsspeicher, der sollt erneuert werden.

Bei einer Übertaktung kann auch ein dauerhafter Schaden entstehen, der auch noch da ist wenn man bereits wieder auf Standard zurück kehrt.

Aber erneure erst mal den Arbeitsspeicher oder sortiere die defekten Riegel aus.

Wie bereits geschrieben, habe ich alle vier Riegel bereits ausführlich getestet, das System mit jedem Riegel einzeln getestet und das Problem tritt sogar auf, wenn ich die Riegel meines Schwagers einbaue. Es wäre ein großer Zufall, wenn alle 6 Riegel gleichzeitig defekt sind. Die Fehlermeldung in MemTest86 trat bisher nur einmal auf, danach verliefen alle RAM-Tests ohne Fehler.
 
dein bild sagt was anderes. dort steht: 4404.

probiere doch bitte malxmp mit ned so absurdem takt.

das sind keine jedec speicher. die wollen ihr profil.
daß alles mit jedec rennen sollte ist eher theoretisch.
 
  • Gefällt mir
Reaktionen: Silver Server
whats4 schrieb:
dein bild sagt was anderes. dort steht: 4404.

probiere doch bitte malxmp mit ned so absurdem takt.

Ich habe Dutzende Tests gemacht, mit und ohne XMP. Auch XMP mit allen Stufen von 4400 bis 3200 runter. Das war der einzige Test, der einen Fehler gebracht hat.
 
dann versuche halbbestückung.

edit: garantiert sind 2666, mit vollbestückung. alles andere ist OC.
 
Im Ordner C:/Windows/Minidump
sind die Informationen zum blue screen.
Die letzten fünf Dumpfiles auf den Desktop kopieren.
Mit rar oder zip verpacken.
Hier im Forum hoch laden.
 
  • Gefällt mir
Reaktionen: OlafOlafson
whats4 schrieb:
dann versuche halbbestückung.

Habe ich auch schon. Vollbestückung (4x 8 GB), Halbbestück (2x 8 GB) und auch einzeln (1x 8 GB) habe ich alle durch gestartet.

Silver Server schrieb:
Im Ordner C:/Windows/Minidump
sind die Informationen zum blue screen.
Die letzten fünf Dumpfiles auf den Desktop kopieren.
Mit rar oder zip verpacken.
Hier im Forum hoch laden.

Mach ich morgen gerne.
Ergänzung ()

whats4 schrieb:
dann versuche halbbestückung.

edit: garantiert sind 2666, mit vollbestückung. alles andere ist OC.

Nicht mal 2133 MHz sind stabil.
 
dann verträgt sich die kombi halt ned. soll passieren.
 
whats4 schrieb:
dann verträgt sich die kombi halt ned. soll passieren.

Welche „Kombi“? Es lief doch vorher alles stabil, allerdings mit 16 GB statt 32 GB. Sogar auf 4266 MHz. Erst, als ich nochmal zwei identische Riegel hinzugefügt habe, fingen die Probleme schlagartig an.
 
OlafOlafson schrieb:
Da das Intel CPU-Test-Tool keine Auffälligkeiten zeigte, bin ich davon ausgegangen, dass evtl. einer der RAM-Controller defekt ist und mir ein neues Mainboard besorgt. Doch das Problem tritt weiterhin auf.
Das ergibt überhaupt keinen Sinn was du da schrit. Zum einen gibt's nur einen RAM Controller und zum anderen ist der in der CPU, nicht auf dem Mainboard.

Deine Probleme sind typisch für defekten oder falsch konfigurierten RAM
 
rg88 schrieb:
Das ergibt überhaupt keinen Sinn was du da schrit. Zum einen gibt's nur einen RAM Controller und zum anderen ist der in der CPU, nicht auf dem Mainboard.

Deine Probleme sind typisch für defekten oder falsch konfigurierten RAM

Aber selbst wenn es typisch dafür ist: Ich habe 6 Riegel vor mir liegen. 2x 6 Monate alt (vom Schwager), 2x 4 Monate alt und 2x 2 Wochen alt. Die sollen alle, unabhängig voneinander und bei zwei verschiedenen Mainboards, defekt sein? Die Riegel wurden alle mit XMP, ohne XMP, auf 4400 bis runter auf 3200 (manuell) und sogar auf Standard-Takt von 2133 durchgetestet. Einzeln, zu zweit, zu viert. Dutzende Tests, bis auf einer, waren ohne Fehler. Beide Mainboards (MSI: 2 Jahre alt, Gigabyte: nagelneu, Dienstag gekauft) habe ich auf Werkseinstellungen zurückgesetzt und alles nochmal getestet. Ebenfalls ohne Fehler in MemTest / MemTest86.
 
@OlafOlafson
Richtig ist, dass unter Vollbestückung meistens die Settings reduziert werden müssen. Manche teure Gamer-Boards haben deshalb auch genausowenige Slots wie Unterklasseboards. Mehr Slots verlängern die Leitung. Es ist dann interessant, herauszufinden, ob bei dem Board, das man da gerade verwendet, die vier RAM-Slots in zwei Daisy-Chains oder mit T-Topology angeschlossen sind. T-Topology erlaubt ähnliche Settings für Halb und Vollbestückung während Daisy-Chain bei Halbbestückung höhere Frequenzen erlaubt und besser für Boards ist, auf denen jeder zweite RAM-Slot nur angeboten wird, weils als Dekoration gut aussieht. Ich weiß nicht, wie das Z390 Gaming da gebaut ist.

Das ist das Board, der Speichercontroller in der CPU ist dann noch anders. Speichercontroller verkraften je nach Board (wie stabil das Board die Spannung liefert, die der Speichercontroller braucht) unterschiedlich bandbreite Betriebsmodi - aber nicht nur so, sondern auch mit unterschiedlichen Modulmodellen verkraften die unterchiedlich viel bei Vollbestückung.

Ganz wichtig: Bei Vollbestückung verkaftet jeder Speichercontroller der PC-Geschichte immer weniger Bandbreite und weniger scharfe Settings als bei weniger Modulen.

Und das ist jetzt, was whats4 mit Kombi meint. Deine Modulmodelle in deinem Mainboard mit deinem CPU-Speichercontroller vertragen sich nicht für Vollbestückung - vielleicht, weil die Module in Kombination mit diesem Speichercontroller nicht mit einem DaisyChain-Design klarkommen, falls das Board eins haben sollte, vielleicht weil dein Board bei Vollbestückung mit Speichern mit dieser Spannung keine stabile Spannungsversorgung mehr schafft, vielleicht hilft bessere Kühlung auf die VRMs was oder auf irgendwas anderes was heiß wird, vielleicht nicht, vielleicht laufen Crucial Ballistix oder Corsair Value RAM besser - vielleicht irgendwas mit Standardspannung von 1,2 V.
Ergänzung ()

OlafOlafson schrieb:
... bis auf einer, waren ohne Fehler. ...
Ich bin jetzt gerade ein bisschen verwirrt: Also hat ein Modul nun definitiv einen Fehler, auch bei 2133 im Einzelbetrieb?
 
@MountWalker > Danke für die ausführliche Antwort. Jedoch funktioniert nicht mal mehr das vorherige Setup (2x 8 GB), welches zuvor monatelang schnell & stabil lief. Und auch mit dem zweiten Ersatz-Mainboard tritt das exakt selbe Problem weiterhin auf, egal mit welchem RAM, egal mit welcher Bestückung und egal welcher Geschwindigkeit. Außerdem habe ich ja auch RAM eines anderen Herstellers hier und ausgiebig getestet (die zwei Riegel meines Schwagers).
Ergänzung ()

MountWalker schrieb:
Ich bin jetzt gerade ein bisschen verwirrt: Also hat ein Modul nun definitiv einen Fehler, auch bei 2133 im Einzelbetrieb?

Ich habe viele Dutzend Tests gemacht. Und bei einem einzigen dieser Tests, mit XMP aktiv, 4400 MHz und 32 GB Vollbestückung, gab es vier Fehler (Screenshot im Startbeitrag). Exakt diesen Test habe ich danach wiederholt, jedoch ohne Fehler. Und auch die zig Tests danach, mit vielen verschiedenen Kombinationen/Konfigurationen, brachten keinen einzigen RAM Fehler mehr.

Falls es hilft, kann ich auch gerne alle meine Riegel im System meines Schwagers testen (einzeln, Halbbestückung, Vollbestückung). Aber wie gesagt - es würde mich sehr wundern, wenn alle 6 RAM Riegel defekt und/oder mit zwei verschiedenen Mainboards inkompatibel sind (bei einem System, das monatelang gut lief).
 
Zuletzt bearbeitet:
Man sollte an den Ramlatencen mal was abändern und nicht Schalter bedienen bzw. jahrelang alles durchtesten. Genug Ramspannung, 3200 einstellen und Ramlatencen/Command Rate auf 2 sollten genügen bei Vollbestückung. Altes Ram z.B. auch in A1+2, neues Ram in B1+2 Ramslot eingesteckt. Wenn das alte Ram auf A2+B2 gesteckt und das neue auf A1+B1, oder neues und altes umgekehrt, können schon merkliche Ausfälle auftreten.
 
Achso, dann hatte ich das ursprünglich richtig verstanden. Bei Stabilitätstests gilt immer: Nur weil ein Test bestanden wird, muss nicht alles in Ordnung sein, aber zumindest ist keine Stelle im Modul ganz tot.

Hast du bei der ursprünglichen Bestückung mit XMP wieder die korrekte Spannung für diese Module eingestellt? Falls ja und instabil:

An sich unterstützt der Prozessor im DualChannel-Betrieb nu DDR4-2666. Wenns schneller nicht stabil läuft, auch wenns vorher stabil lief, würde mich das nicht stören, solange er mit 2666 noch läuft. Aber mit mehr als 2666 war der Speichercontroller schon übertaktet und das zerrt in der Regel an der Haltbarkeit.

Vielleicht ist beim Betrieb mit Vollbestückung die Spannungsversorgung der CPU ins Wanken gekommen und eine Spannungsspitze hat den Speichercontroller beschädigt oder der Speichercontroller hat allein dadurch Schaden genommen, dass er Vollbestückung mit 4444 statt 2666 bewältigen musste. Je nachdem, wie der beschädigt ist, läuft der vielleicht jetzt im SingleChannel-Betrieb stabil. Stabiltätstests sind immer so eine Sache: Stabil ist es dann, wenn man das 24 Stunden im Dauerloop laufen lassen kann ohne dass auch nur einmal was passiert (was nicht das eine, seltene Bitflip durch einen Sonnensturm ist).

Also ich gehe schon davon aus, dass der Speichercontroller in der CPU Schaden genommen hat, aber probier mal, ob er im Single Channel noch läuft, damit du nicht sofort einen neuen Prozessor kaufen musst.
 
MountWalker schrieb:
Hast du bei der ursprünglichen Bestückung mit XMP wieder die korrekte Spannung für diese Module eingestellt? Falls ja und instabil:

An sich unterstützt der Prozessor im DualChannel-Betrieb nu DDR4-2666. Wenns schneller nicht stabil läuft, auch wenns vorher stabil lief, würde mich das nicht stören, solange er mit 2666 noch läuft. Aber mit mehr als 2666 war der Speichercontroller schon übertaktet und das zerrt in der Regel an der Haltbarkeit.

Ja, ich hatte alle Einstellungen mehrfach auf Werkseinstellungen zurückgesetzt. Es läuft ja nicht mal mehr auf 2133.

MountWalker schrieb:
Vielleicht ist beim Betrieb mit Vollbestückung die Spannungsversorgung der CPU ins Wanken gekommen und eine Spannungsspitze hat den Speichercontroller beschädigt oder der Speichercontroller hat allein dadurch Schaden genommen, dass er Vollbestückung mit 4444 statt 2666 bewältigen musste. Je nachdem, wie der beschädigt ist, läuft der vielleicht jetzt im SingleChannel-Betrieb stabil. Stabiltätstests sind immer so eine Sache: Stabil ist es dann, wenn man das 24 Stunden im Dauerloop laufen lassen kann ohne dass auch nur einmal was passiert (was nicht das eine, seltene Bitflip durch einen Sonnensturm ist).

Also ich gehe schon davon aus, dass der Speichercontroller in der CPU Schaden genommen hat, aber probier mal, ob er im Single Channel noch läuft, damit du nicht sofort einen neuen Prozessor kaufen musst.

Ja, das könnte möglich sein, dass 4400 bei 32 GB zu viel war. Wobei Windows bei 4400 nicht mal bootet (auch mit 16 GB nicht), weshalb ich bei 4266 eingestiegen bin. Ich hatte ja auch bereits auf 2133 Single Channel getestet, aber auch dort kommt in Prime95 nach wenigen Minuten ein Fehler.

Ich habe jetzt viele Stunden am PC verbracht, obwohl ich für solche Fehlersuche weder Zeit noch Lust habe. Wenn ich bis morgen keine Lösung finde, organisiere ich mir eine andere CPU und teste das System erneut. Dann wird ja hoffentlich Gewissheit herrschen, ob die CPU das Problem ist oder nicht…alles andere kann ich mittlerweile ja praktisch ausschließen.
 

Ähnliche Themen

Zurück
Oben