Regelmäßige Bluescreens (DPC_WATCHDOG_VIOLATION) auf dem Desktop - Defekte 4090?

John Reese

Lt. Commander
🎅 Nikolaus-Rätsel-Elite
Registriert
März 2008
Beiträge
1.357
1. Nenne uns bitte deine aktuelle Hardware:
  • Prozessor (CPU): 7800X3D
  • Arbeitsspeicher (RAM): Corsair CMK32GX5M2B6000C30 2x16GB
  • Mainboard: GIGABYTE B650 AORUS ELITE AX
  • Netzteil: MSI MPG A850G PCIE5 850W ATX 3.0
  • Gehäuse: Fractal Design North
  • Grafikkarte: PNY GeForce RTX 4090 XLR8 Gaming Verto Epic-X
  • HDD / SSD: Kingston KC3000 PCIe 4.0 NVMe SSD 2TB
  • Wird ein sog. "PCIe Riserkabel" genutzt? Nein
  • Ich nutze das HPWR-Kabel, welches beim Netzteil dabei war

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):

Seit drei Wochen passiert es unter Windows z.B. beim YouTube schauen, dass das Bild einfriert (der Ton läuft weiter) und nach wenigen Minuten dann ein Bluescreen mit dem Fehler "DPC_WATCHDOG_VIOLATION" erscheint.

Ich hatte Ende Dezember das BIOS aktualisiert und seit neuestem besitze ich auch noch einen LG OLED-Fernseher, welcher per HDMI an die GPU angeschlossen ist. Davor lief das System seit August stabil und problemfrei.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
  • Downgrade des BIOS auf Version F7 (die Version, die ich seit Zusammenbau installiert hatte)
  • Volle Berechtigungen meinem Account der Datei nvlddmkm.sys zugewiesen
  • "Power management mode" auf "Prefer maximum performance"
  • Prüfen, ob das HPWR-Kabel und die GPU richtig stecken
  • Mittels DDU den alten Treiber deinstalliert und den aktuellsten Treiber 546.33 installiert
  • "NVIDIA High Definition Audio" im Gerätemanager deaktiviert
  • Windows-Installation mittels "DISM" und "sfc /scannow" auf Fehler / kaputte Dateien geprüft
Ich habe vorhin dann wieder auf das aktuellste BIOS F20 aktualisiert und XMP mal testweise deaktiviert.
Memtest86+ ist schon vorbereitet und werde ich nächste Nacht laufen lassen.

Die letzten 5 Minidumps findet ihr im Anhang dieses Beitrags.

Okay XMP deaktivieren hat auch nicht geholfen, gerade nach dem Starten eines YouTube-Videos direkt wieder einen Bluescreen gehabt.
 

Anhänge

Zuletzt bearbeitet:
Deine CPU hat eine Grafikeinheit... Also 4090 raus und über die iGPU mal Youtube gucken und paar Anwendungen laufen lassen. Sollte der Fehler nicht auftreten 4090 wahrscheinlich defekt. Tritt er auf, ist es was anderes.
 
clock watchdog heißt, dass mindestens ein CPU kern instabil ist. Vermutlich boostet die CPU mit xfr in halblast in instabile Bereiche. vcore erhöhen, curve optimizer zurücknehmen, llc erhöhen oder takt senken und nochmal probieren
 
Nordwind2000 schrieb:
Deine CPU hat eine Grafikeinheit... Also 4090 raus und über die iGPU mal Youtube gucken und paar Anwendungen laufen lassen. Sollte der Fehler nicht auftreten 4090 wahrscheinlich defekt. Tritt er auf, ist es was anderes.
Gute Idee, danke. Werde ich machen und dann berichten.

duskstalker schrieb:
clock watchdog heißt, dass mindestens ein CPU kern instabil ist. Vermutlich boostet die CPU mit xfr in halblast in instabile Bereiche. vcore erhöhen, curve optimizer zurücknehmen, llc erhöhen oder takt senken und nochmal probieren
Wie kommst du auf "Clock Watchdog"?
 
Ich kenne den Fehler nur in Verbindung mit nicht unterstützer Hardware oder einen "falschen" Treiber bzw. einen zu alten Treiber, was ja nicht der Fall ist.
 
haha verlesen. Ist ja garnicht der gute alte clock watchdog. Wäre auch zu einfach gewesen.

zieh mal sämtliche Hardware ab, die du nicht brauchst, inkl. interne Festplatten. teste auch mal diverse USB Anschlüsse (Front USB auch ausstecken). Manchmal kann das auch ne sterbende hdd / ssd ankündigen.

was sagen die Windows System Ereignisprotokolle? whea Fehler irgendwo?
 
duskstalker schrieb:
was sagen die Windows System Ereignisprotokolle? whea Fehler irgendwo?
Ne, keine WHEA-Fehler. Nur:
1705264931842.png


Jetzt gerade läuft wieder alles stabil. Was mich auch wurmt ist, dass der Crash in aller Regel erst nach Stunden auftritt.
Ergänzung ()

Oh wow, diese Ironie: Kurz nachdem ich den Beitrag verfasst habe, ist der Rechner wieder gecrasht. Ich baue jetzt die 4090 aus.
 
duskstalker schrieb:
hast du mal ddu probiert?
Ja, hab ich, hat nicht geholfen. Und wie gesagt: Die Probleme treten erst auf, seitdem ich den Fernseher via HDMI angeschlossen und das MB-BIOS aktualisiert habe.

duskstalker schrieb:
Wie siehts mit memtest aus?
Mache ich nächste Nacht.

duskstalker schrieb:
kannst du ne andere gpu testen? vorzüglich nvidia
Hab leider keine da, aber wenn dann könnte ich mir natürlich eine Low-End-Karte (https://geizhals.de/?cat=gra16_512&xf=653_NVIDIA) kaufen.
Mich wundert, dass die Karte ja seit August im Rechner steckt (der Rechner ist auch neu) und alles problemlos lief.
Ergänzung ()

So, ich habe die 4090 ausgebaut und bin sehr gespannt, ob es jetzt auch wieder auftritt.
Mein Eindruck ist, dass es heute besonders oft auftritt, davor war es eher höchstens 1x pro Tag (wenn überhaupt). Und komischerweise nicht unter Last, hatte vorhin testweise mal Red Dead Redemption 2 angeschmissen.
 
Zuletzt bearbeitet:
ist es ggf. möglich, dass das bios update irgendwelche energiespareinstellungen erzwungen hat (bspw. aspm states, erp, usw.) was die 4090 auf dem desktop in einen instabile energiesparzustand unter niedriger last bringt? die letzten am4 bios updates haben bspw. auch tpm, secure boot, aib software installer usw standardmäßig aktiviert.
 
Kann sein, aber ich hatte zurückgerollt auf F7 und damit trat es immer noch auf.

Ich beobachte es weiter.

EDIT:
Memtest86+ hab ich über Nacht übrigens ~8h laufen lassen und hat bei 7 Durchläufen keine Fehler gefunden.
 
Zuletzt bearbeitet:
Habe die Grafikkarte mittlerweile an den Händler geschickt nachdem kein einziger BSOD mehr aufgetreten ist.
Ich hoffe, sie tauschen sie um, die E-Mail sagt, dass der Servicepartner sie testet und es 2 bis 4 Wochen dauern kann. Ist halt schwierig, weil die Crashes nicht einfach reproduzierbar sind und erst im Idle auftreten.
 
  • Gefällt mir
Reaktionen: Ostler
Ich habe meine 4090 bei Caseking eingeschickt, die meinten das sie 6 Stunden im Bench ohne Probleme lief, sie kam also mit Ablehnung RMA zurück. Zwischenzeitlich habe ich mir ein komplett neues System bestellt, dort habe ich die 4090 reingehangen und wieder Bluescreens. Habe nun von einem Kollegen die 3070TI eingebaut und der Rechner läuft wunderbar ohne Macken.

Ich frage mich nun wie ich vorgehen soll. Die Karte muss definitiv wie du es gesagt hast einen Schaden haben, Der Verkäufer kann diesen nach eigener Aussage aber nicht reproduzieren. Kann ich einen Ersatz verlangen?
 
Wir können die Grafikkarte gern ein weiteres Mal testen. Der Kunde hat bereits ein entsprechendes Supportticket eröffnet und von uns eine kostenfreie Paketmarke erhalten.

Liebe Grüße
Mike
 
  • Gefällt mir
Reaktionen: John Reese
Zurück
Oben