4070Super Blackscreen / kompletter Absturz

amokkx

Lt. Commander
Registriert
Jan. 2010
Beiträge
1.177
1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): AMD Ryzen 5 7600
  • Arbeitsspeicher (RAM): 32GB G.Skill Flare EXPO X5 DDR5-6000 DIMM CL32-38-38-96
  • Mainboard: MSI Tomahawk WIFI B650
  • Netzteil: Seasonic G-Series G-650 650W (+mitgelieferter Adapter der GPU)
  • Grafikkarte: ASUS GeForce RTX 4070 Super Dual OC
  • HDD / SSD: WD Blue SN570 / Samsung HD105 jeweils 1TB
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat (Monitormodell, Kühlung usw.): Benq xl2420t / Dell S2719DGF
  • Wird ein sog. "PCIe Riserkabel" genutzt? Nein
  • Windows 11 Pro (10.0, Build 22631)

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Ich habe 2 unterschiedliche Fehlerbilder, die aber beide darin Enden, dass ich den PC per Knopf ausschalten muss
a) Monitore werden schwarz, Beleuchtung der Tastatur wird bunt (Treiber nicht mehr anwesend) etcpp, Windows schmiert wohl komplett ab. Der CPU-Lüfter dreht voll auf
b) Seit der Neuinstallation der Treiber: Monitore werden schwarz, Sound da, Treiber der Tastatur ebenfalls. Scheint alles zu funktionieren, außer die GPU.

Unter Last ist mir das noch nicht wirklich passiert. Spiele nur Overwatch und TFT, da langweilt sich die GPU sowieso. Das ist auch schon im Idle passiert, als ich 2h auf der Couch war und der PC nur vor sich hin dümpelte.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
  • Deinstallation der Treiber mit DDU und Installation der aktuellen Treiber
  • OC von GPU und auch CPU ausgeschaltet
  • Powerlimit auf 70%

Hier auch ein Dump, der es mMn eindeutig auf die GPU (oder zumindest den Treiber) schließen lässt
2: kd> !analyze -v
*******************************************************************************
  • *
  • Bugcheck Analysis *
  • *
*******************************************************************************

VIDEO_ENGINE_TIMEOUT_DETECTED (141)
One of the display engines failed to respond in timely fashion.
(This code can never be used for a real BugCheck; it is used to identify live dumps.)
Arguments:
Arg1: ffff91072d7d8010, Optional pointer to internal TDR recovery context (TDR_RECOVERY_CONTEXT).
Arg2: fffff800a39946e0, The pointer into responsible device driver module (e.g. owner tag).
Arg3: 0000000000000000, The secondary driver specific bucketing key.
Arg4: 0000000000000000, Optional internal context dependent data.

Debugging Details:
------------------

Unable to load image nvlddmkm.sys, Win32 error 0n2
*** WARNING: Unable to verify timestamp for nvlddmkm.sys

KEY_VALUES_STRING: 1

Key : Analysis.CPU.mSec
Value: 968

Key : Analysis.Elapsed.mSec
Value: 2182

Key : Analysis.IO.Other.Mb
Value: 0

Key : Analysis.IO.Read.Mb
Value: 0

Key : Analysis.IO.Write.Mb
Value: 0

Key : Analysis.Init.CPU.mSec
Value: 61

Key : Analysis.Init.Elapsed.mSec
Value: 4548

Key : Analysis.Memory.CommitPeak.Mb
Value: 166

Key : Bugcheck.Code.LegacyAPI
Value: 0x141

Key : Bugcheck.Code.TargetModel
Value: 0x141

Key : Dump.Attributes.AsUlong
Value: 18

Key : Dump.Attributes.KernelGeneratedTriageDump
Value: 1

Key : Failure.Bucket
Value: LKD_0x141_IMAGE_nvlddmkm.sys

Key : Failure.Hash
Value: {341dd0b3-9ebd-47a8-9de8-23f4b00fabbc}


BUGCHECK_CODE: 141

BUGCHECK_P1: ffff91072d7d8010

BUGCHECK_P2: fffff800a39946e0

BUGCHECK_P3: 0

BUGCHECK_P4: 0

FILE_IN_CAB: WATCHDOG-20240423-0125.dmp

DUMP_FILE_ATTRIBUTES: 0x18
Kernel Generated Triage Dump
Live Generated Dump

TAG_NOT_DEFINED_202b: *** Unknown TAG in analysis list 202b


VIDEO_TDR_CONTEXT: dt dxgkrnl!_TDR_RECOVERY_CONTEXT ffff91072d7d8010
Symbol dxgkrnl!_TDR_RECOVERY_CONTEXT not found.

PROCESS_NAME: System

STACK_TEXT:
fffffb0c`3707ee50 fffff800`93128f24 : ffff9107`25653030 ffff9107`25653030 ffff9107`3604c320 ffff9107`2d7d8010 : watchdog!WdpDbgCaptureTriageDump+0xb7
fffffb0c`3707eec0 fffff800`92f8c79d : ffff9107`2d7d8010 fffffb0c`3707f080 00000000`00000000 fffffb0c`3707f080 : watchdog!WdDbgReportRecreate+0xd4
fffffb0c`3707ef20 fffff800`92f8b200 : ffff8005`00000000 ffff8005`6709c930 00000000`00004800 00000000`00004800 : dxgkrnl!TdrUpdateDbgReport+0x11d
fffffb0c`3707ef80 fffff800`4dad60a8 : ffff9107`2f34a000 ffff9107`2f2d5000 ffff9107`2f34a000 ffff9107`2d7d8010 : dxgkrnl!TdrCollectDbgInfoStage1+0x300
fffffb0c`3707f0c0 fffff800`4db98e62 : ffff9107`2f34a001 00000000`00000000 00000000`00000000 00000000`00000000 : dxgmms2!VidSchiResetHwEngine+0x1c8
fffffb0c`3707f270 fffff800`4db6759d : ffff9107`2f2d5000 00000000`00000000 00000000`00000000 00000000`00000000 : dxgmms2!VidSchiResetEngines+0xaa
fffffb0c`3707f2c0 fffff800`4db38469 : 00000000`00000000 00000000`00000000 00000000`00000a0e 00000000`00989680 : dxgmms2!VidSchiCheckHwProgress+0x2f10d
fffffb0c`3707f340 fffff800`4da99ae1 : 00000000`00000000 ffff9107`2f2d5000 fffffb0c`3707f479 00000000`00000000 : dxgmms2!VidSchiWaitForSchedulerEvents+0x389
fffffb0c`3707f410 fffff800`4db446f5 : ffff9107`36967000 ffff9107`2f2d5000 ffff9107`36967010 ffff9107`2f3a2820 : dxgmms2!VidSchiScheduleCommandToRun+0x291
fffffb0c`3707f4e0 fffff800`4db4466a : 00000000`00000000 fffff800`4db445a0 ffff9107`2f2d5000 ffff9107`1bc2d040 : dxgmms2!VidSchiRun_PriorityTable+0x35
fffffb0c`3707f530 fffff800`5096db37 : ffff9107`2f349480 fffff800`00000001 ffff9107`2f2d5000 005fe07f`bcbbbdff : dxgmms2!VidSchiWorkerThread+0xca
fffffb0c`3707f570 fffff800`50a1d554 : ffffbd81`385c5180 ffff9107`2f349480 fffff800`5096dae0 6c6f466c`6c656853 : nt!PspSystemThreadStartup+0x57
fffffb0c`3707f5c0 00000000`00000000 : fffffb0c`37080000 fffffb0c`37079000 00000000`00000000 00000000`00000000 : nt!KiStartSystemThread+0x34


SYMBOL_NAME: nvlddmkm+14946e0

MODULE_NAME: nvlddmkm

IMAGE_NAME: nvlddmkm.sys

STACK_COMMAND: .cxr; .ecxr ; kb

FAILURE_BUCKET_ID: LKD_0x141_IMAGE_nvlddmkm.sys

OSPLATFORM_TYPE: x64

OSNAME: Windows 10

FAILURE_ID_HASH: {341dd0b3-9ebd-47a8-9de8-23f4b00fabbc}

Followup: MachineOwner
---------

Ist auch nicht jeden Tag so, die Nacht bzw. heute aber relativ häufig.

1713881737326.png


Nicht jedes rote X ist der gleiche Fehler. Davor war es das letzte mal am 07.04, da hab ich aber auch keinen Dump erhalten. Es ist auch ein anderer Fehler als sonst, aber hat wohl auch mit der GPU zu tun, weil nVidia.
1713881796300.png


Am 1.4 hab ich auch von meiner Soundkarte einen Fehler gemeldet bekommen, hängt ebenfalls im PCI Slot aber keine Ahnung ob das irgendwie in Zusammenhang steht.
1713881964697.png


Über mögliche Tipps wär ich sehr dankbar.
 
amokkx schrieb:
Netzteil: Seasonic G-Series G-650 650W
Grafikkarte: ASUS GeForce RTX 4070 Super Dual OC
Könnte durchaus am (alten) Netzteil liegen, hast du beide Kabelstränge für die Grafikkarte genutzt oder nur einen?

Mehrere Versionen des Treibers auch schon probiert? Hast du idealerweise einen zweiten Monitor, den du parallel an die iGPU hängen kannst?
 
@Maxysch Ne, nicht wirklich. Heute morgen ist es bei TFT 3x passiert, aber da zieht die GPU gerade mal 40W (wenn überhaupt). Und wie gesagt, ist auch im Idle passiert, als ich gar nicht mehr am PC war. Bildschirme waren und blieben aber schwarz, als ich wieder an den PC wollte.

@Drewkev Das NT wär auch meine nächste Anlaufstelle gewesen, weil es dann doch schon einige Jahre aufm Buckel hat. Aber selbst bei Benchmarks, wo die GPU auf 100% rennt, ist das noch nie passiert. Vorher war ne 2080 Ti drin mit Windows 10, da hatte ich nie den Fehler.


Ja, habe 2 Monitore, einen davon kann ich wohl an die iGPU stecken. Ich weiß gerade nicht, welchen Treiber ich vorher hatte, dürfte aber auch nur max 1 Monat alt sein, weil ich die 4070 erst vor kurzem eingebaut habe.

Gerade auch wieder 2x passiert, während ich die Antwort hier tippe. Zum Glück speichert cb das und kann ich am handy absenden 🥲
 
Das erinnert mich an mein fast so ähnliches Problem.

Versuch mal ein be quiet! Pure Power 12 M 650W ATX 3.0.

@Maxysch

Das sollte man auch prüfen und ob der Biegeradius nicht zu stark ist. Der Stecker ist mehr Murks als gut gemeint. Und warum setzen die Hersteller nicht die Strombuchse ans Ende der Grafikkarte statt oben? So macht es Gigabyte. Kein Propblem mehr mit Biegeradius und sieht auch besser aus, wenn man ein Fenster im Gehäuse hat.
 
  • Gefällt mir
Reaktionen: Maxysch
In den vielen Fehleranalysen zur RTX 4070 Super ist häufig ein altes BIOS der Übeltäter.
Platz 2 nimmt das Netzteil und/oder der beiliegende Adapter ein.
 
So ists momentan verkabelt. Werde mir dann heute mal ein anderes NT bestellen. Wird eh mal wieder Zeit. Dann hab ich alles, außer das Gehäuse gewechselt 😂

.. bei den Bildern merk ich, dass der Rechner mal wieder durchgepustet gehört :D
 

Anhänge

  • IMG_0637.jpeg
    IMG_0637.jpeg
    1,8 MB · Aufrufe: 102
  • IMG_0636.jpeg
    IMG_0636.jpeg
    1,7 MB · Aufrufe: 102
  • IMG_0635.jpeg
    IMG_0635.jpeg
    2 MB · Aufrufe: 104
  • Gefällt mir
Reaktionen: kachiri und Maxysch
Zwirbelkatz schrieb:
Du hast nur 1 Kabel vom Netzteil zum Adapter geführt?

Anhang anzeigen 1477020



:confused_alt:
Wie meinen? Ich hab die Stecker, welche vorher in der 2080 ti waren, an den Adapter gehängt und diesen dann in die 4070 gesteckt.

Die Verkabelung ist aber anscheinend generell nich so prickelnd. Kabel kurz angepackt und PC ging aus 😅
 

Anhänge

  • IMG_0638.jpeg
    IMG_0638.jpeg
    1,6 MB · Aufrufe: 83
amokkx schrieb:
Ich hab die Stecker, (...)
Bitte beantworte die Frage:

Kommen aus deinem Netzteil MEHRERE, getrennte Stromkabel heraus, die an deine alte oder neue Grafikkarte gehen, oder nicht?
Bitte nicht mit abgezweigtem "Y-Adapter" arbeiten. Falls das der Fall ist.


Mir scheint, das BIOS ignorierst du weiterhin.



Der Wechsel ist fragwürdig. Gerade mal ~50% mehr Power und fast gleiche Speicherausstattung.
Hoffentlich hat es sich gerechnet beim Verkauf.
https://www.techpowerup.com/gpu-specs/geforce-rtx-2080-ti.c3305
 
@Zwirbelkatz Ist nur ein Kabel. Da sind auch sonst keine PCI-Stecker mehr im Gehäuse zu sehen. Erweiterungskabel vom NT hab ich auch nicht mehr. Also ist neues NT kaufen wohl angesagt...

Ich hatte vorher eine 2080 Ti aus einem Alienware-Rechner, die mir ein Kollege für meine damalige 2070 gegeben hat. Mal davon abgesehen, dass das Teil bei 0,9mV schon gethrottled hat, weil se einfach zu heiß war, war sie auch noch laut wie ne Turbine. Also ja, hat sich gerechnet ;)

GPU BIOS find ich gerade nichts zu. Mobo-Bios wurde nach dem Kauf (~2 Monate) geupdated.
 
@Drewkev Gerade noch mal alle Schubladen abgesucht und tatsächlich noch einen PCIe-Stecker gefunden und angeschlossen. Nun gehen 2 Kabel vom NT in den Adapter. Ich werds dann mal paar Tage so testen und schauen ob das Problem erneut auftaucht.
 
  • Gefällt mir
Reaktionen: Zwirbelkatz, UK Monkey, Drewkev und eine weitere Person
amokkx schrieb:
Ich werds dann mal paar Tage so testen und schauen ob das Problem erneut auftaucht.
Hast du bereits Zeit gefunden? Wäre nützlich zu wissen, was daraus geworden ist.
 
So wirklich drin scheint der Stecker an der GPU aber nicht zu stecken wenn man den Spalt sieht.Bild_2024-04-26_180751568.png
 
Der 12VHPWR Stecker hat sich ja nicht gerade mit Ruhm bekleckert, aber wenn man "das" wieder sieht wie manche User nichtmal nen Stecker richtig reinstecken können, fehlt mir echt jedes Mitleid.

Lass den PC von einem Fachmann zusammenbauen. Der gibt dir dann auch Gewährleistung.
 
@Zwirbelkatz PC lief seit dem ca. 12h ohne Probleme, mehr Zeit hatte ich bis jetzt nicht wirklich.

@Tornavida @patze812 Der Stecker geht nicht weiter rein und sitzt so auch bombenfest. Auch wenn ich mit ordentlich Schmackes nachdrücke, passiert da nichts.
 
Zurück
Oben