Sporadische Rechnerausfälle

Cant4ria

Cadet 4th Year
Registriert
März 2022
Beiträge
64
Hi,

seit 2005 stelle ich für Freunde, Bekannte, Familie usw Computer zusammen, baue diese auf und richte sie ein. Das mal ein Teil Defekt ist, oder irgendwann den Geist aufgibt, ist dabei normal und hat noch nie große Probleme bereitet. Einzig der Computer meiner Frau bereitet mir langsam Kopfzerbrechen. Da nicht nur mir, sondern auch meinen Freunden und Arbeitskollegen die Fantasie ausgeht, was mit diesem Teil verkehrt ist, dachte ich, ich versuche es mal im Computerbase-Forum.

Zum Computer:​

Einsatzgebiet des Rechners sind alltägliche Aufgaben. Word, Email, Office, Web. Ab und zu muss der auch zum Zocken herhalten, wobei sich da die Anforderungen dank (nur) FullHD und keine Grafisch aufwendigen Spielen in kleinen Grenzen halten. (Größte Gaming Herausforderung für den PC ist Dead by Daylight, Tropico). Also wirklich kein Hochleistungsrechner erforderlich.

Da der Rechner auch nicht zu teuer werden sollte, habe ich im März 2020 diese Hardware genommen:
CPU: AMD Ryzen 5 2600 6x3,4GHz (AM4)
Board: ASRock B450M Pro4-F
RAM: 16GB (2x8) G.Skill DDR4-3000 CL-16-18-38
Power: BeQuiet 450W -> mittlerweile ersetzt durch Sharkoon 650W
GPU alt: MSI R9 290
GPU jetzt: NVidia 1050 (neueres Modell, welches rein über PCIe versorgt wird)

Zum Problem:​

Der Rechner leidet an sporadischen Abstürzen und Reboots. Leider ist es dabei egal, ob nur ein Webbrowser offen ist, oder ein Spiel gespielt wird. Manchmal läuft der Rechner stabil über stunden hinweg. Manchmal fällt er nach 30Minuten aus. Manchmal schneller, manchmal länger. Dabei gibt es 2 Varianten wie der PC ausfällt:

Variante 1:
Der Bildschirm wird schwarz und der Rechner bootet ganz normal neu.

Variante 2:
Der Bildschirm wird schwarz aber der Rechner bleibt aktiv. Die Musik spielt weiter, nimmt aber auch keine Tastatureingaben mehr an (nichtmal die NUM-Taste reagiert).


Was bisher gemacht wurde:​

Treiberupdates
Das hatte leider rein gar nichts geändert.

Windows 10 neu installiert
Auch das war ohne Besserung. Mehrfach.

Mainboard eingesendet und getauscht
Danach lief die Kiste für ca. 2 Monate stabil.

Grafikkarte getauscht (komplett, und zwischen Rechnern)
Die GPU habe ich zwischen den Computern getauscht und die stellte sich am Ende tatsächlich als Defekt raus. Daher haben wir die MSI(AMD) durch die Nvidia ersetzt. Danach lief die Kiste wieder für 1-2 Monate stabil.

Bildschirm getauscht
Hier habe ich schon insg. 3 Bildschirme durch gereicht. An meinem PC funktionierten alle, an ihrem kam es immer zu dem Problem.

Netzteil getauscht
Da mir ein Freund sein 650W Netzteil geliehen hat, habe ich das mal eingebaut. Auch auf den Verdacht, das das alte evtl die Spannung nicht sauber hält. Diese Änderung hatte bisher den größten Effekt und die Rechner lief für mehr als 2 Monate stabil.

Dauer MemTest über 2h
Dauer CPU Stress/Stabilitätstest über 2h

Beide Tests hat der Rechner mit Bravour abgeschlossen und blieben ohne Fehler. Interessanterweise ist er während der Tests nicht abgestürzt. Beim Zocken am Abend dann aber schon...

RAM zwischen meinem Rechner und dem meiner Frau getauscht
Auch hier bewiesen die RAMs eine absolute stabilität und arbeiteten problemlos. Ihr Rechner blieb davon unbeeindruckt.

Temperaturmonitoring CPU beim Zocken (max 65°C)
Auch das ist für eine CPU heutzutage eigentlich kein Problem -meines Wissens


Aktuell fallen mir nur noch 2 Möglichkeiten ein, die ich zwar schon einmal hatte, aber an dem PC noch nicht ausprobiert habe:
  • Kurzschluss über das Gehäuse
  • Kurzschluss im Ein/Ausschalter


Da, wie bereits geschrieben, mir, meinen Freunden und Arbeitskollegen (IT-Abteilung) die Fantasie ausgeht. Frage ich euch ob noch jemanden was einfällt. Mittlerweile handwerken 3 Informatiker ratlos an dem Teil herum. Vor allem, da der Rechner mal stabil läuft und mal nicht.

Vielen Dank.
Ergänzung ()

Kleiner Nachtrag von mir:

Wenn der Rechner für paar Stunden stabil läuft, dann macht er das auch für den Rest des Tages weiter.

Sobald dieser Fehler einmal auftritt, tritt er nach 15-30 Minuten nochmal auf. Und as immer wieder. Bis der Rechner über Nacht paar Stunden aus bleibt. Dann geht dieses Rätsel am nächsten Tag von vorne los.
 
Zuletzt bearbeitet:
Cant4ria schrieb:
Power: BeQuiet 450W -> mittlerweile ersetzt durch Sharkoon 650W
Welche sind das genau?

Cant4ria schrieb:
Beim Zocken am Abend dann aber schon...
Welcher Stresstest für die CPU wurde denn durchgeführt?

Cant4ria schrieb:
RAM: 16GB (2x8) G.Skill DDR4-3000 CL-16-18-38
In welchen Slots steckt der und wurde das XMP auf Stabilität geprüft?

Cant4ria schrieb:
  • Kurzschluss über das Gehäuse
  • Kurzschluss im Ein/Ausschalter
Mit einem Minimalaufbau könnte man das herausfinden.

Was sagt die Ereignisanzeige bzw. der Zuverlässigkeitsverlauf? Gibt es .dmp-Dateien in C:\Windows\Minidump?
 
dass das BIOS aktuell ist und auch mal die Defaults gelanden worden setzen wir mal voraus...
steht etwas im EventLog von Windows?
 
hängt der Rechner mit weiteren Verbrauchern an einer Steckdosenleiste? Falls ja, dass mal getauscht bzw. verändert?
 
  • Gefällt mir
Reaktionen: pvcf
Hi @Drewkev ,

"Sharkoon WP700 Bronze" steht drauf.
Das BeQuiet ist das hier: https://www.mindfactory.de/product_...em-Power-9-CM-Modular-80--Bronze_1322106.html

Anbei der Zuverlässigkeitsverlauf:
07.05 - 19.05 sieht man, wenn, dann läuft er stabil.
18.05 + 20.05 + 21.05 hier stürzte er öfters ab.
22.05 - 25.05 wurde der Rechner nicht genutzt (meine Frau ist auf den Laptop umgestiegen)
26.05 Da steht nur drin "Windows wurde nicht ordnungsgemäßs runtergefahren", wahrscheinlich wegen dem 25.05
Zuverlässugkeit1.png


Zuverlässigkeit2.png


Die Hardwarefehler sehen immer so aus:
Problem1.png
Problem2.png


Interessant finde ich den BlueScreen. Den haben wir noch nie gesehen. Der muss wohl hinter der schwarzen Leinwand passiert sein -.-

Bei den Dumps habe ich .txt hinzugefügt, um sie hier hochladen zu können.
 

Anhänge

XN04113 schrieb:
dass das BIOS aktuell ist und auch mal die Defaults gelanden worden setzen wir mal voraus...
steht etwas im EventLog von Windows?
Das BIOS kann Bei Bedarf Updates direkt über das Internet laden. Die Funktion behauptet es wäre alles aktuell. Bisher habe ich der Funktion mal vertraut.
derlorenz schrieb:
hängt der Rechner mit weiteren Verbrauchern an einer Steckdosenleiste? Falls ja, dass mal getauscht bzw. verändert?
Leider Steckdosenleiste. Ist aber baulich bedingt. Das Büro hat nur 2 Steckdosen O.o (ka wer die Idee hatte). Wir hatten auch schon den Rechner direkt an der Wandsteckdose. Hat ihn leider auch nicht interessiert. Dennoch haben wir danach vorsichtshalber alle Steckdosenleisten durch neue hochwertigere ersetzt.
Meinen Rechner brauche ich beruflich (Software Engineer), daher konnte ich die Steckdose nicht dauerhaft freihalten.
 
CMOS clear, RAM händisch einstellen fällt mir noch ein. Manchmal übernehmen die Bretter einfach nicht alles aus dem XMP.
 
Fusionator schrieb:
--> Aegis etwa? Da brauchts nicht viel Fantasie um den als Schrott-RAM auszumachen. Eine Zeitlang hier mitlesen reicht schon.
Ähm ... ja. Tatsächlich sind es die hier: https://www.mindfactory.de/product_...gis-DDR4-3000-DIMM-CL16-Dual-Kit_1111126.html

Ich persönlich verbaue immmer Corsair oder GEIL. Die G.Skill hatte ich genommen als "günstige Alternative", da meine Frau nicht so viel ausgeben wollte. Meines Wissens sind G.Skill auch ganz gute Rams -bin ich da falsch informiert? Oder betrifft das nur die AEGIS-Serie?


der Unzensierte schrieb:
CMOS clear, RAM händisch einstellen fällt mir noch ein. Manchmal übernehmen die Bretter einfach nicht alles aus dem XMP.
BIOS läuft auf Default bis auf eine Änderung. Ich hab den aut. Overclock deaktiviert. Und den TPM-Chip, damit der Rechner kein windows 11 bekommt ;)

RAM händisch einstellen. Meinst du die Timings auf das festsetzen was der Hersteller vorgibt? Das habe ich tatsächlich noch nicht probiert.
 
@Cant4ria
Das mit dem RAM ist kein Scherz. Es gab hier schon mehrere Threads, wo Aegis oder Vengeance RAM für seltsame Abstürze oder Freezes sorgte und der Fehler nach Einbau von Crucial Ballistix verschwunden ist (trotz vorher fehlerfreiem Memtest).

Ich persönlich würde sowieso nur RAM mit Micron oder Samsung Chips kaufen, also kein Wundertüte.

Der dmp deutet übrigens auf einen Fehler im Nvidia Treiber hin (kann aber auch einfach nur ein Folgefehler des RAMs sein). Und das Windows ist auch nicht ganz up to date.
1653558997934.png


Da bin ich aber nicht der Spezialist für sowas.
Vielleicht meldet sich @Silver Server diesbezüglich ;)
Ergänzung ()

https://www.wikiwand.com/en/Windows_10_version_history
 
Drewkev schrieb:
Jup. Deshalb auch meine Frage, ob das XMP auf Stabilität getestet wurde.
Mit XMP habe ich ehrlich gesagt noch nie etwas gemacht. So tief bin ich bei RAM noch nicht eingestiegen.
Hab die Kiste mal gebootet und das BIOS sagt mir folgendes:
Eingesteckt sind die auf DDR4_A1 und DDR4_B1. Laufen auch im Dual Channel.

Die Einstellung "Load XMP Settings" steht aber auf "AUTO". Es ist noch ein XMP Profil zur Auswahl verfügbar:
Das XMP Profil zeigt die Timings "16-18-18-38".
Bei AUTO steht bei den Timings "15-15-15-36"

Der MemTest86 hat dann damals auch unter dem AUTO-Profil gearbeitet.

Ich hab jetzt mal das XMP Profil geladen und rebootet.

Fusionator schrieb:
nach Einbau von Crucial Ballistix verschwunden ist (trotz vorher fehlerfreiem Memtest).

Ich persönlich würde sowieso nur RAM mit Micron oder Samsung Chips kaufen, also kein Wundertüte.
Die meisten Antworten haben den RAM in Verdacht. Scheinbar habe ich hier tatsächlich einen Griff ins Klo gelandet. Den Ram hatte ich tatsächlich bereits ausgeschlossen, auch wegen des erfoglreichen Memtest86 und weil sie in meinen Rechner funktioniert haben. Aber bei der eindeutigen Rückmeldung....
Für die Rückmeldung auch erstmal Danke an @Fusionator , @Drewkev und @der Unzensierte


Vengeance Rams sind mir ein Begriff. Um die mache ich auch einen Bogen. Nur die Aegis-Info ging scheinbar an mir vorbei :(

XMP habe ich, wie beschrieben, eben mal aktiviert. Da ich heute noch eingeladen bin, kann ich das leider erst die Tage probieren. Dennoch werde ich mich die Tage auf neue RAMs begeben.
 
Drewkev schrieb:
Prinzipiell ist A2/B2 zu empfehlen, auch ohne XMP kann A1/B1 für Probleme sorgen.

Ich würde mich aber (noch) nicht zu sehr auf den RAM versteifen.
Das kann ich heute Abend mal umstecken. Das Handbuch hatte ich damals so verstanden, man solle für DualChannel bei den 1-Slots anfangen.

Aus reiner neugier interessiert es mich dann doch, warum die 2-Slots? :D
 
Fusionator schrieb:
Da bin ich aber nicht der Spezialist für sowas.
Vielleicht meldet sich @Silver Server diesbezüglich
nvlddmkm.sys ist ein Treiber für die Grafikkarte. Wenn der in der Dumpfile aufgetaucht ist liegt der Fehler bei der Grafikkarte. Was kann man machen?
Den Treiber für die Grafikkarte neu installieren.
Auch andere, ältere Treiber versuchen.
Wenn das nicht hilft eine andere Grafikkarte einbauen.
 
Cant4ria schrieb:
warum die 2-Slots?
Weil bei einer DaisyChain Topologie das Signal am Ende terminiert werden sollte und das sind eben die 2. Slots.
 
Silver Server schrieb:
nvlddmkm.sys ist ein Treiber für die Grafikkarte. Wenn der in der Dumpfile aufgetaucht ist liegt der Fehler bei der Grafikkarte. Was kann man machen? Den Treiber für die Grafikkarte neu installieren.
Öhm, ja. Wäre naheliegend mit dem Treiber.
Ich meinte auch, dass du da wesentlich fitter im Auswerten von .dmp files bist.

Cant4ria schrieb:
Das Handbuch hatte ich damals so verstanden, man solle für DualChannel bei den 1-Slots anfangen.
Dann nochmal genau anschauen. Erst wenn der RAM richtig steckt, sollte man weiter probieren.
https://download.asrock.com/Manual/QIG/B450M Pro4-F_multiQIG.pdf
 
Zurück
Oben