PC friert - nicht direkt reproduzierbar - ein?

HEADSTyLE1337

Cadet 3rd Year
Registriert
Sep. 2009
Beiträge
40
Moin,

zu allererst, das Wichtigste:
CPU: I7, 7700k - nicht overclocked
GPU: EVGA - RTX3080 - FTW3 Ultra
MoBo: Asus ROG Maximus IX Hero
PSU: beQuiet Dark Power Pro 850w (p11, wenn ich mich nicht täusche)
RAM: 16 Gb D416GB 3000-16 Trident Z RGB K2 GSK
Kühlung: Noctua NH-D15
Case: inWin 905

und zwar friert neuerdings - ohne irgendwelche Ankündigung mein PC komplett ein => meine (drei) Bilderschirme zeigen dabei weiter das letzte Bild/Frame an, der PC ist einfach nur eingefroren und ich kann nichts mehr tun.
Dies tritt hauptsächlich und nicht reproduzierbar bei Last (Gaming) auf - mal nach ner Stunde, mal nach 20 Minuten, vorhin beim Start der 3D Anwendung nach dem Laden des Spiels (World of Tanks), mal den ganzen Tag gar nicht.

Leider ist, wie erwähnt, der freeze nicht zu "erzwingen" und kommt ohne irgendwelche Vorankündigungen.
Also habe ich nun folgende Tests durchgeführt:

Prime 95 solo => 15 Minuten Stable, kein Problem
Cinebench solo => 10 Minuten Stable, kein Problem
Furmark solo => 10 Minuten Stable, kein Problem
Furmark + Cinebench => 3x probiert, 1 Freeze nach ~6 Minuten, beim zweiten Freeze direkt nach Start von Cinebench (Furmark lief bereits), beim dritten Try eben => kein Problem für über 20 Minuten?!

Meine Werte habe ich mal hier (nach ca 10 Mins Furmark + Cinebench) großflächig für euch dargelegt - mMn. sind alle Temps aber mehr als im grünen Bereich (gute Luftzirkulation, riesiges Gehäuse, etc.)

details_10minsin.JPG


Arbeitsspeicher habe ich über die Windows-Speicherdiagnose getestet => keine Fehler.
Windows habe ich, basierend auf diesem Problem, bereits neu aufgesetzt, Treiber sind alle aktuell.


Leider bin ich langsam mit meinem Latein am Ende.

Wenn das Netzteil einen weg hätte, würde es doch immer bei der Last abstürzen und nicht hin und wieder die Last akzeptieren?
Wenn die GraKa einen weg hätte, würde FurMark/Gaming doch überhaupt nicht funktionieren?
Wenn der CPU einen weg hätte, würde Prime/Cinebench doch nicht ständig durchlaufen?
Wie kann es sein, dass er manchmal stundenlanges Gaming durchhält, ohne einzufrieren, o.ä.?

Jmd ne Idee?
 
Moin @cyberpirate:

Zuverlässigkeitsverlauf sieht nicht so prickelnd aus:
zuver.jpg


Doppelklick auf einen Hardwarefehler bringt mich zu:
1650383588672.png



In der Ereignisanzeige finde ich zur o.g. Zeit folgendes:
1650383890972.png

1650383916801.png



Aber was sagt mir das?
Angeschlossene Monitore sind:
Primär: ASUS ROG SWIFT PG348Q
Sekundär: Dell 24" - P2419H
Tertiär: ASUS - MX279
(über HDMI habe ich noch meinen TV gegenüber angeschlossen, den jedoch unter GFORCE deaktiviert, sodass der nicht als Monitor mit auftaucht)


Wichtige Info, die ich vergaß zu erwähnen - dasselbe(!) Problem trat bei mir schonmal in 2020 auf, dort noch mit ner 1080Ti, aber sonst gleicher Hardware - dort ging das Problem irgendwann "von selber" weg.. nun ist es wieder da... :-(
Ergänzung ()

dvor schrieb:
Die taugt nichts.
Memtest86.

Präparier grad den USB Stick - schiebe ich nochmal nach!
Ergänzung ()

Memtest86 durchgelaufen - 0 Fehler, Test passed
 
Zuletzt bearbeitet:
Ist jetzt alles ok, nach dem BIOS-Update?
HEADSTyLE1337 schrieb:
Memtest86 durchgelaufen - 0 Fehler, Test passed
Läft das nicht etwas länger als eine Stunde? Kommt mir recht schnell vor. :confused_alt:
Wenn auch mehrere Durchläufe keine Fehler ergeben, dann mach' Einzeltests deiner Speicherriegel in der Praxis (Windows). Überprüfe dabei auch gleich, ob alles richtig & fest & auf den richtigen Slots sitzt oder steckt.

Überprüfe auch alle Treiber, Tools, Hintergrund-Programme; entferne/deinstalliere alles nicht benötigte zum Test (RGB, Lüftersteuerung, Monitoring-Tools, AV-Software/Firewall, ...). Da scheint ja schon alleine an Datenträgern einiges dran zu hängen. :rolleyes:
 
  • Gefällt mir
Reaktionen: HEADSTyLE1337 und cyberpirate
Hi, Fehler 116/117 gehen in Richtung Grafikkarte und/oder deren Treiber.

Du kannst jeweils verschiedene Treiber Mal testen ob es hilft. Den aktuell installierten dann aber möglichst restlos zwischen den einzelnen Versionen entfernen.

Die Fehlersuche kann aber langwierig sein.
 
  • Gefällt mir
Reaktionen: HEADSTyLE1337 und cyberpirate
Moin Leute - ich war gestern leider noch unterwegs und arbeite jetzt mal die Kommentare ab:

eYc schrieb:
Ist jetzt alles ok, nach dem BIOS-Update?
Ich habe leider bisher nicht gespielt/gebencht - Update kommt heute über den Tag
eYc schrieb:
Läft das nicht etwas länger als eine Stunde? Kommt mir recht schnell vor. :confused_alt:
Wenn auch mehrere Durchläufe keine Fehler ergeben, dann mach' Einzeltests deiner Speicherriegel in der Praxis (Windows). Überprüfe dabei auch gleich, ob alles richtig & fest & auf den richtigen Slots sitzt oder steckt.
ich habe 3,5/4 Loops laufen lassen, danach musste ich in ein Meeting und brauchte meinen PC :D (welcher unter Windows in jeder Lebenslage richtig läuft und keinerlei Mucken hat)
eYc schrieb:
Überprüfe auch alle Treiber, Tools, Hintergrund-Programme; entferne/deinstalliere alles nicht benötigte zum Test (RGB, Lüftersteuerung, Monitoring-Tools, AV-Software/Firewall, ...). Da scheint ja schon alleine an Datenträgern einiges dran zu hängen. :rolleyes:
Ich fange heute mit den Treibern an - grad mit dem Grafikkartentreiber - dieser Fehlercode 117 scheint ein Hinweis auf ein GraKa Treiber, statt HW, Problem zu sein - andere Software ist, außer Dropbox, genaugenommen noch gar nicht installiert - ich hatte Windows grad erst frisch aufgesetzt.



cyberpirate schrieb:
GraKa Treiber am besten n solch einem Fall im abgesicherten Modus mit dem Tool entfernen:

https://www.computerbase.de/downloads/treiber/grafikkarten/display-driver-uninstaller-ddu/

am besten den neuen dann vorher downloaden damit Win sich nicht wieder einen vorher installiert. Du kannst auch mal die Systemdateien prüfen mit SFC / scannow
Das hatte ich gestern Nacht in der Bettrecherche auch gelesen - ich werde mal den GraKa Treiber komplett entfernen.
Dadurch, dass ich das selbe(!) Fehlerbild schonmal vor ~2 Jahren hatte, scheint ja wirklich Richtung Treiberproblem zu gehen, oder?
Abrauchende HW würde doch nicht "mal funktionieren" und mal nicht?
Ergänzung ()

So - Treiber per DDU im Safemode deinstalliert und den letzten Treiber (den vor dem Aktuellen) installiert - neu gebootet, 15 mins FurMark+Cinebench laufen lassen => Stabil.
Werte nach ca 14:45

1650445631689.png



Irgendwie fühlte sich CB auch "ruckelfreier" an - ich hatte das Gefühl, wenn ich mit der Maus im CB war, hatte ich Frameverlust (oder einfach nur einen an der Pfanne, kann auch sein).
Mal schauen ob sich damit das Problem erledigt hat -ich melde mich :-)
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: cyberpirate
cyberpirate schrieb:
Du kannst auch mal die Systemdateien prüfen mit SFC / scannow

Habe ich auch nochmal durchgeführt - angeblich hatte er korrumpierte Dateien gefunden, jedoch reparieren können - laut Log schien es mir jedoch eher nach Doppelbelegung "der Eigentümer"(?) o.ä.

Mal schauen.
 
oookay - vorhin so ca 2 Std !ohne Probleme! gespielt - alles butterweich gelaufen.

Eben grad ne Runde WoT gestartet - als es vom Menü in die Runde geladen wurde ist mein Game gecrasht (Keine Rückmeldung).
Zuverlässigkeitsüberprüfung:
1650484304315.png


1650484327496.png



Ich konnte das Game dann einfach beenden und neustarten und die Runde zu Ende spielen.

Also - so langsam bin ich mit meinem Latein am Ende :D Wie kann FurMark/CB 15+ Mins durchlaufen - 2 Std WoT locker durchlaufen etc. pp.
und jetzt aufeinmal crasht das Game?
Kanns evtl auch am Game liegen? (Mein PC ist ja nicht eingefroren?)
 
Weitere Fragen und Tips, falls es doch nicht geht, stehen ja schon oben.
 
eYc schrieb:
Weitere Fragen und Tips, falls es doch nicht geht, stehen ja schon oben.
Hab ich die Fragen übersehen?

Zu den Tipps:
Die Memtest86 nun durchlaufen lassen (4/4) => Test passed.

eYc schrieb:
Überprüfe auch alle Treiber, Tools, Hintergrund-Programme; entferne/deinstalliere alles nicht benötigte zum Test (RGB, Lüftersteuerung, Monitoring-Tools, AV-Software/Firewall, ...). Da scheint ja schon alleine an Datenträgern einiges dran zu hängen. :rolleyes:
Treiber habe ich lediglich den Grafikkartentreiber heute nach DDU neuinstalliert.
Mainboardtreiber habe ich - seit ich das MoBo habe (5 Jahre ca?) nie irgendwas installiert/installieren müssen - hatte gestern aber im Verlauf meiner Tests bereits den Chipset Treiber von Asus runtergeladen und im Zuge dessen installiert.
RGB, Lüfersteuerung/Monitoring-Tools, AV-Software/Firewall habe ich alles nicht installiert - wie erwähnt ist das System bzw. das Windows jungfräulich.

Datenträger werden in der übersicht irgendwie doppelt angezeigt - real hängen nur 2 M.2 SSDs und 2 normale SSDs dran.

Eben ists bei einer Runde WoT wieder abgestürzt - Plakkativ war, dass es ebenfalls beim "reinladen in die nächste Runde" (vom Hauptmenü aus) passierte - Lastenwechsel?
Aber nochmal - wieso kann ich diese Sache dann nicht erzwingen (Stichwort FurMark/CB?)?
Ergänzung ()

Nochmal Furmark und CB auf Multicore durchlaufen lassen => stable.

Aber mein Score bei CB ist eher... schlecht?
1650489581840.png


Kanns sein, das mein MoBo n Knacks hat?
 
Zuletzt bearbeitet:
HEADSTyLE1337 schrieb:
Hab ich die Fragen übersehen?
memtest86 -> Läuft das nicht etwas länger als eine Stunde? Wie lange lief's bei dir?

Wenn auch mehrere Durchläufe keine Fehler ergeben, dann mach' Einzeltests deiner Speicherriegel in der Praxis (Windows). Überprüfe dabei auch gleich, ob alles richtig & fest & auf den richtigen Slots sitzt oder steckt.
HEADSTyLE1337 schrieb:
Datenträger werden in der übersicht irgendwie doppelt angezeigt - real hängen nur 2 M.2 SSDs und 2 normale SSDs dran.
Das wären mir schon drei zu viel zum Test, außerdem könnte es einen Grund geben warum die doppelt angezeigt werden?
HEADSTyLE1337 schrieb:
Aber mein Score bei CB ist eher... schlecht?
CB R23? Dein Score ist 3903? Obwohl er 5521 sein sollte?
Lief's wirklich mit allen 4 Kernen und 8 Threads (Taskmanager)? Temperatur der CPU währenddessen?
HEADSTyLE1337 schrieb:
Mainboardtreiber habe ich - seit ich das MoBo habe (5 Jahre ca?) nie irgendwas installiert/installieren müssen
Du hast das System doch neu installiert? Welche Treiber sind denn dann drauf für Chipsatz, onboard-Devices usw.? Wenn du da nichts gemacht hast, dann schau nochmal beim Board-Hersteller oder Intel vorbei.
Ist das UEFI vielleicht auch schon so alt? Dann updaten, würde ich meinen.
 
  • Gefällt mir
Reaktionen: HEADSTyLE1337
eYc schrieb:
memtest86 -> Läuft das nicht etwas länger als eine Stunde? Wie lange lief's bei dir?

Wenn auch mehrere Durchläufe keine Fehler ergeben, dann mach' Einzeltests deiner Speicherriegel in der Praxis (Windows). Überprüfe dabei auch gleich, ob alles richtig & fest & auf den richtigen Slots sitzt oder steckt.
1. Durchlauf (Zeitlich hatte ich nur Zeit für 3/4 Loops) => ~45-50 Mins => Test passed
2. Durchlauf vorhin, bevor ich den Post geschrieben habe, 4/4 Loops => ~60 Mins => Test passed

Wie genau meinst du "Einzeltests meiner Speicherriegel in der Praxis"? Einen Riegel raus und dann mit 8GB rumdümpeln?

eYc schrieb:
Das wären mir schon drei zu viel zum Test, außerdem könnte es einen Grund geben warum die doppelt angezeigt werden?
auf der einen M.2 ist nur Windows drauf - wenn ich die andere M.2 ausbaue, kann ich leider nichts mehr testen (Programme/Spiele) :D
Unter Windows läuft mein System ja komplett(!) stabil - besonders weil der PC jetzt ja auch nicht mehr einfriert, sondern nur mein Game crasht mit o.g. Hardwarefehlern im Zuverlässigkeitslog.

Doppelt angezeigt - 4x werden meine SSDs per S.M.A.R.T. angezeigt und 4x per "Drive" - das eine sind Temps/Lebensdauer, das andere irgendwie nur Schreib/Leseraten, scheinbar?

eYc schrieb:
CB R23? Dein Score ist 3903? Obwohl er 5521 sein sollte?
Lief's wirklich mit allen 4 Kernen und 8 Threads (Taskmanager)? Temperatur der CPU währenddessen?
CB R23, ja - Gut - er lief im Hintergrund (Nebenbei im Discord und Firefox war auf, mit ca 20 Tabs) - evtl hat das den Score gedrückt... Pardon, war nur überraschend niedrig..

eYc schrieb:
Du hast das System doch neu installiert? Welche Treiber sind denn dann drauf für Chipsatz, onboard-Devices usw.? Wenn du da nichts gemacht hast, dann schau nochmal beim Board-Hersteller oder Intel vorbei.
Ist das UEFI vielleicht auch schon so alt? Dann updaten, würde ich meinen.
System neu installiert = Alle Datenträger formatiert, Windows neu rauf, keine Treiber (außer den Geforce Experience + neusten GrakaTreiber, welchen ich heute morgen per DDU im Safemode deinstalliert und den vorletzten GameReady Driver (only, ohne Geforce Müll) installiert habe.



Ich bräuchte irgendwie einen verlässlichen Moment um "die Grenze meines Systems" anzufahren - ergo, aktiv Testen zu können.
Dass es einmal (zwei Mal) alle 12 Stunden, während ich die 20. Runde meines Games starte(!) das Game mal zerschießt (wobei die 19 Runden vorher ohne jedwedes Problem/Ruckeln abläuft) ist leider keine allzugute Grundlage um jedwede Tests durchzuführen, oder?
Kann ja schlecht morgen eine SSD abklemmen, und erstmal 12 Std zocken? :D
Gibts ne Kombi, wo ich wirklich an die Grenze so gehen kann, dass ich sicher sein kann, dass es bspw nicht auch das Game/Mods vom Game o.ä. sein kann?
 
HEADSTyLE1337 schrieb:
Wie genau meinst du "Einzeltests meiner Speicherriegel in der Praxis"? Einen Riegel raus und dann mit 8GB rumdümpeln?
Genau so. Und danach den anderen, und möglichst immer im laut Handbuch dafür vorgesehenen Slot.
HEADSTyLE1337 schrieb:
System neu installiert = Alle Datenträger formatiert, Windows neu rauf, keine Treiber (außer den Geforce Experience + neusten GrakaTreiber, welchen ich heute morgen per DDU im Safemode deinstalliert und den vorletzten GameReady Driver (only, ohne Geforce Müll) installiert habe.
jaja, hauptsache DDU kam mal wieder zum Einsatz um seine Daseinsberechtigung beweisen zu dürfen - aber blos kein Zeit damit verschwenden um alle weiteren Treiber für Chipsatz und den anderen unnützen Kram installieren zu müssen :D
 
eYc schrieb:
Genau so. Und danach den anderen, und möglichst immer im laut Handbuch dafür vorgesehenen Slot.

Ich werde mein System wohl ohnehin komplett auseinander und wieder zusammenbauen, evtl hilft das ja.


hast du hierzu noch eine Idee:
Ich bräuchte irgendwie einen verlässlichen Moment um "die Grenze meines Systems" anzufahren - ergo, aktiv Testen zu können.
Dass es einmal (zwei Mal) alle 12 Stunden, während ich die 20. Runde meines Games starte(!) das Game mal zerschießt (wobei die 19 Runden vorher ohne jedwedes Problem/Ruckeln abläuft) ist leider keine allzugute Grundlage um jedwede Tests durchzuführen, oder?
Kann ja schlecht morgen eine SSD abklemmen, und erstmal 12 Std zocken? :D
Gibts ne Kombi, wo ich wirklich an die Grenze so gehen kann, dass ich sicher sein kann, dass es bspw nicht auch das Game/Mods vom Game o.ä. sein kann?
 
Statusupdate - heute mal den RAM auf die anderen beiden Bänke gepackt, Graka aus und wieder eingebaut, bisschen entstaubt, etc.

Bisher läuft er - mal wieder - selbst beim zocken - stabil.
ein Mysterium.
 
Zurück
Oben