Random Treiber Timeouts unter Teillast (Surfen)

kachiri

Fleet Admiral
Registriert
Apr. 2011
Beiträge
17.971
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): AMD Ryzen 7 5800X3D
  • Arbeitsspeicher (RAM): Kingston FURY Beast 32GB Dual-Kit DDR4-3200 CL16 (KF432C16BB1K2/32)
  • Mainboard: ASUS ROG Strix B550-I Gaming
  • Netzteil: Corsair SF600 Platinum
  • Gehäuse: Fractal Terra
  • Grafikkarte: NVIDIA RTX 4070 Super FE
  • HDD / SSD: WD_BLACK SN850 2TB / WD_BLACK SN750 SE 512GB
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat(Monitormodell, Kühlung usw.): Nope
  • Wird ein sog. "PCIe Riserkabel" genutzt? Ja

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Ich bin ein wenig mit meinem Latein am Ende. Seit Anfang Februar bin ich im Besitz einer RTX 4070 Super Founders Edition und sie lief auch wochenlang wunderbar. Bis ich vor ein paar Wochen mein System neu aufgesetzt habe. Vorher hatte ich einfach nur den AMD Treiber deinstalliert und im Nachgang den NV Treiber installiert.
Lief tadellos. Mit UV/OC und allem.
Nach der Neuinstallation von Windows 11 fingen dann die Probleme an. Es kommt in Teillast vor allem beim Surfen (hier auf Computerbase, auf YouTube, ...) zu Freezes (die sich nur mit betätigen des Power Button und Neustart beheben lassen) oder direkt zu Black Screens die in einem Neustart münden. Ich kann kein Muster erkennen. Also kein Anhaltspunkt, woran es genau liegen könnte...

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
UV/OC zurückgenommen (Karte läuft mit der Stock Spannungskurve, allerdings 925 mV fixiert, sprich, ich habe die Stock Kurve ab den Punkt 925 mV geglättet ohne die Kurve vorher oder nach zu schieben)
Zwischendurch neuere Treiber installiert

Minidump Files
https://www.sendspace.com/filegroup/P+8I+vo/WhuPTN879BZxot504n9kimNZ



Liegt es doch am UV, obwohl es ja quasi die Spannungskurve ab Werk ist? Hat die Karte ein Knacks weg? Doch irgendwas anderes? :x
 
flott nachgefragt: Schon mal Windows erneut frisch installiert? Womöglich ist bei der letzten Neuinstallation irgendetwas quer gelaufen. Wenn das System vorher problemlos lief, dann könnte einfach ein Fehler im Betriebssystem vorliegen.
 
Tatsächlich war das auch mein erster Gedanke. Und japp. Ebenfalls auch schon gemacht. Sogar auch den Stick (anderer Stick) neu gemacht.
Vielleicht so lange probieren, bis es wieder passt 😅
 
kachiri schrieb:
Wird ein sog. "PCIe Riserkabel" genutzt? Ja
Was passiert ohne dem Kabel? Was lässt dich darauf schließen, dass es unbedingt an der GPU liegt?
 
Zumindest bei der 6800 war der Riser kein Problem und die 4070S lief vorher ja auch genau in diesem Aufbau... Der Unterschied ist die Neuinstallation...
Wäre wohl ein Ansatz, dass System in ein anderes Gehäuse zu verfrachten. Irgendwas findet sich da im Keller sicherlich. Das Symptom tritt ja nicht regelmäßig auf. Gibt Tage, da läuft der Rechner, gibt Tage, wie eben vorhin, da macht er die Biege.

Auf die GPU komme ich halt, weil eben die GPU zuletzt gewechselt wurde und der NV-Treiber scheinbar der Auslöser ist. Kann natürlich sein, dass er auch nur ein Symptom von einem anderen Problem ist. Das fuchst mich ja.

Gehen wir mal davon aus, dass die GPU nur das Opfer ist: Hau ich mal die aktuellsten Treiber für Chipsatz & Co. drauf.
 
kachiri schrieb:
Gehen wir mal davon aus, dass die GPU nur das Opfer ist: Hau ich mal die aktuellsten Treiber für Chipsatz & Co. drauf.
Gerade wieder Random beim Surfen. Analysierte Dump:

Code:
3: kd> !analyze -v
*******************************************************************************
*                                                                             *
*                        Bugcheck Analysis                                    *
*                                                                             *
*******************************************************************************

VIDEO_TDR_FAILURE (116)
Attempt to reset the display driver and recover from timeout failed.
Arguments:
Arg1: ffffa70a6b136010, Optional pointer to internal TDR recovery context (TDR_RECOVERY_CONTEXT).
Arg2: fffff806a2423670, The pointer into responsible device driver module (e.g. owner tag).
Arg3: ffffffffc000009a, Optional error code (NTSTATUS) of the last failed operation.
Arg4: 0000000000000004, Optional internal context dependent data.

Debugging Details:
------------------

Unable to load image nvlddmkm.sys, Win32 error 0n2
*** WARNING: Unable to verify timestamp for nvlddmkm.sys

KEY_VALUES_STRING: 1

    Key  : Analysis.CPU.mSec
    Value: 2390

    Key  : Analysis.Elapsed.mSec
    Value: 6175

    Key  : Analysis.IO.Other.Mb
    Value: 19

    Key  : Analysis.IO.Read.Mb
    Value: 0

    Key  : Analysis.IO.Write.Mb
    Value: 39

    Key  : Analysis.Init.CPU.mSec
    Value: 359

    Key  : Analysis.Init.Elapsed.mSec
    Value: 23971

    Key  : Analysis.Memory.CommitPeak.Mb
    Value: 110

    Key  : Bugcheck.Code.LegacyAPI
    Value: 0x116

    Key  : Bugcheck.Code.TargetModel
    Value: 0x116

    Key  : Dump.Attributes.AsUlong
    Value: 1008

    Key  : Dump.Attributes.DiagDataWrittenToHeader
    Value: 1

    Key  : Dump.Attributes.ErrorCode
    Value: 0

    Key  : Dump.Attributes.KernelGeneratedTriageDump
    Value: 1

    Key  : Dump.Attributes.LastLine
    Value: Dump completed successfully.

    Key  : Dump.Attributes.ProgressPercentage
    Value: 0

    Key  : Failure.Bucket
    Value: 0x116_IMAGE_nvlddmkm.sys

    Key  : Failure.Hash
    Value: {c89bfe8c-ed39-f658-ef27-f2898997fdbd}


BUGCHECK_CODE:  116

BUGCHECK_P1: ffffa70a6b136010

BUGCHECK_P2: fffff806a2423670

BUGCHECK_P3: ffffffffc000009a

BUGCHECK_P4: 4

FILE_IN_CAB:  040324-13296-01.dmp

DUMP_FILE_ATTRIBUTES: 0x1008
  Kernel Generated Triage Dump

VIDEO_TDR_CONTEXT: dt dxgkrnl!_TDR_RECOVERY_CONTEXT ffffa70a6b136010
Symbol dxgkrnl!_TDR_RECOVERY_CONTEXT not found.

PROCESS_OBJECT: 0000000000000004

BLACKBOXBSD: 1 (!blackboxbsd)


BLACKBOXNTFS: 1 (!blackboxntfs)


BLACKBOXPNP: 1 (!blackboxpnp)


BLACKBOXWINLOGON: 1

CUSTOMER_CRASH_COUNT:  1

PROCESS_NAME:  System

STACK_TEXT:  
ffffdd89`5145f828 fffff806`84e0cc6e     : 00000000`00000116 ffffa70a`6b136010 fffff806`a2423670 ffffffff`c000009a : nt!KeBugCheckEx
ffffdd89`5145f830 fffff806`84dbe7d2     : fffff806`a2423670 ffffa70a`636110a0 00000000`00000080 ffffa70a`63611160 : dxgkrnl!TdrBugcheckOnTimeout+0xfe
ffffdd89`5145f870 fffff806`84db6c79     : ffffa70a`636c6000 ffffa70a`6406c040 ffffa70a`636c6b50 ffffa70a`636c6b50 : dxgkrnl!ADAPTER_RENDER::Reset+0x12a
ffffdd89`5145f8a0 fffff806`84e0c3c5     : 00000000`00000100 ffffa70a`6406c040 00000000`00000000 ffffa70a`68506150 : dxgkrnl!DXGADAPTER::Reset+0x60d
ffffdd89`5145f950 fffff806`84e0c522     : 00000000`00000000 fffff806`796172f0 00000000`00000200 fffff806`75749ac0 : dxgkrnl!TdrResetFromTimeout+0x15
ffffdd89`5145f980 fffff806`74d53665     : ffffa70a`6406c040 ffffa70a`510b4cd0 ffffa70a`00000000 fffff806`00000000 : dxgkrnl!TdrResetFromTimeoutWorkItem+0x22
ffffdd89`5145f9c0 fffff806`74ced757     : ffffa70a`6406c040 00000000`00000484 ffffa70a`6406c040 fffff806`74d53510 : nt!ExpWorkerThread+0x155
ffffdd89`5145fbb0 fffff806`74e1c944     : ffffb881`fdee8180 ffffa70a`6406c040 fffff806`74ced700 00000000`00000246 : nt!PspSystemThreadStartup+0x57
ffffdd89`5145fc00 00000000`00000000     : ffffdd89`51460000 ffffdd89`51459000 00000000`00000000 00000000`00000000 : nt!KiStartSystemThread+0x34


SYMBOL_NAME:  nvlddmkm+1493670

MODULE_NAME: nvlddmkm

IMAGE_NAME:  nvlddmkm.sys

STACK_COMMAND:  .cxr; .ecxr ; kb

FAILURE_BUCKET_ID:  0x116_IMAGE_nvlddmkm.sys

OSPLATFORM_TYPE:  x64

OSNAME:  Windows 10

FAILURE_ID_HASH:  {c89bfe8c-ed39-f658-ef27-f2898997fdbd}

Followup:     MachineOwner
---------

Mäh. Also wirklich das System mal paar Tage ins andere Case verfrachten.
 
Ich frag mal auf gut Glück: Ist der Monitor direkt an der GPU angeschlossen oder hängt ein KVM-Switch etc. dazwischen?
 
@Eggman Gar nicht mehr gesehen. Ne, alles direkt. Inzwischen bin ich von der Idee, ein neues Case zu kaufen, um die Fehlerquelle Riser auszuschließen, auch wieder weg.
Den inzwischen sieht wohl alles danach aus, dass Mainboard das Problem ist:

https://www.google.com/search?q=asus+b550i+rtx+4000
 
Zurück
Oben