Immer wieder Absturz der RTX 3060 Grafikkarte, was tun?

Tom111222333

Ensign
Registriert
Mai 2019
Beiträge
203
1. Nenne uns bitte deine aktuelle Hardware:
CPU: Ryzen 7 5800X mit Corsair H100x RGB Elite (240mm AIO) Kühlung
GPU: Inno3D RTX 3060
Mainboard: MSI MPG B550 Gaming Plus
RAM: Corsair VENGEANCE LPX DDR4 RAM 32GB (2x16GB)
Netzteil: 600 Watt be quiet! Pure Power 11 CM Modular 80+ Gold
SSD1: Samsung SSD 850 EVO (500GB)
SSD2: Samsung SSD 860QVO (1TB)
Gehäuse: Corsair SPEC-DELTA RGB
OS: Windows 11 23H2

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Ich erhalte reproduzierbar jedes mal, wenn ich entweder eine Zeit lang (Ganz Unterschiedlich, mal 10 Minuten nach Spielstart, mal eine halbe Stunde) ein beliebiges Spiel (Egal ob BeamNG Drive oder House Flipper 2 oder RDR2, GTA5 oder eben ein beliebiges anderes) spiele, oder wenn ich eine Ubuntu VM starte (Dann lustigerweise sofort) einen Blackscreen und im Ereignislog mehrere Nvidia Treiber Fehler:

"Die Beschreibung für die Ereignis-ID "13" aus der Quelle "nvlddmkm" wurde nicht gefunden. Entweder ist die Komponente, die dieses Ereignis auslöst, nicht auf dem lokalen Computer installiert, oder die Installation ist beschädigt. Sie können die Komponente auf dem lokalen Computer installieren oder reparieren.

Falls das Ereignis auf einem anderen Computer aufgetreten ist, mussten die Anzeigeinformationen mit dem Ereignis gespeichert werden.

Die folgenden Informationen wurden mit dem Ereignis gespeichert:

\Device\Video3
Graphics Exception: ESR 0x404000=0x80000002

Die Nachrichtenressource ist vorhanden, die Nachricht wurde in der Nachrichtentabelle jedoch nicht gefunden"

Der Text unter \Device\Video3 ändert sich dabei wie Folgt:
Graphics Exception: ESR 0x404000=0x80000002
Graphics Exception: ESR 0x4041b0=0x200709
Graphics Exception: Class 0x709 Subchannel 0x0 Mismatch"

Außerdem bekomme ich mehrere Fehlermeldungen aller:

"Beschreibung
Aufgrund eines Hardwareproblems ist Windows nicht mehr voll funktionsfähig.

Problemsignatur
Problemereignisame: LiveKernelEvent
Code: 141
Parameter 1: ffffbe0d5fbca460
Parameter 2: fffff8056887fd60
Parameter 3: 0
Parameter 4: 6710
Betriebssystemversion: 10_0_22631
Service Pack: 0_0
Produkt: 768_1
Betriebsystemversion: 10.0.22631.2.0.0.768.101
Gebietsschema-ID: 1031
"

Wenn ich einen Furmark Stress Test laufen lasse kommt es tatsächlich auch nach über einer Stunde zu keinem Fehler.


3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
Ich habe bereits diverse Dinge versucht. Darunter ein entfernen und neu installieren des Grafiktreibers mit DDU, ein reduzieren des Taktes und der Spannung mittels NVIDIA AfterBurner. Ich habe derzeit als Übergangslösung eine AMD Vega 56 verbaut und diese läuft soweit stabil. Gibt es noch etwas, was ich noch ausprobieren kann, oder denkt Ihr die Karte ist tatsächlich defekt? Falls defekt, kann man vielleicht über den Hersteller noch etwas bezüglich Reparatur machen, oder muss tatsächlich eine neue Karte her? Wäre das erste mal, dass mir eine Grafikkarte kaputt geht.

Seltsamerweise läuft Sie im Desktop und Browsing Betrieb soweit stabil. Ich habe noch ein HWMonitor Log angehangen, was aufgezeichnet wurde als ein Blackscreen stattfand. Eventuell ist noch wichtig zu erwähnen, dass die CPU im Eco Modus (65 Watt) läuft, da ansonsten der PC gerade beim spielen zu heiß wird.

Anbei noch ein Bild vom PC, allerdings mit der Übergangsgrafikkarte Vega56.

Update: Auch mit der Vega Karte hängt der PC sich bei einer Runde BeamNG Drive auf, hier allerdings sogar mit Bluescreen und "WHEA Uncorrectable Error". Im Spiel war ich etwa 10 Minuten. Im Log sind diverse Fehler wie:

"Beschreibung
Aufgrund eines Hardwareproblems ist Windows nicht mehr voll funktionsfähig.

Problemsignatur
Problemereignisame: LiveKernelEvent
Code: 124
Parameter 1: 0
Parameter 2: ffffd38e40da0020
Parameter 3: bc000800
Parameter 4: 1010135
Betriebssystemversion: 10_0_22631
Service Pack: 0_0
Produkt: 768_1
Betriebsystemversion: 10.0.22631.2.0.0.768.101
Gebietsschema-ID: 1031"

Leider auch hier wieder ein Hardwareerror. Nirsoft Bluescreenview zeigt Folgendes an:
Screenshot 2024-08-12 121349.png
 

Anhänge

  • HWMonitor_07082024.txt
    HWMonitor_07082024.txt
    125,8 KB · Aufrufe: 63
  • 1723412232421.png
    1723412232421.png
    59,1 KB · Aufrufe: 83
  • 24-08-12 12-33-43 0923.jpg
    24-08-12 12-33-43 0923.jpg
    1,5 MB · Aufrufe: 70
Zuletzt bearbeitet:
der Vollständigkeit halber: welches Betriebsystem? Aktuelle Patches? hast du das Problem seit einem Windows Patch?


Hast du mal versucht anstatt in einer VM Ubuntu via einem USB Stick zu laden? Wenn das Problemlos funktioniert, dann ist es ja ein Windows Treiber Problem und eher weniger ein Hardware defekt.

du könntest auch mal versuchen, den Vorletzten Nvidia Treiber zu installieren, und schauen ob das hilft. Auch Nvidia kann mal einen Bug in den Treiber hauen.
 
@Pyrukar Es handelt sich um ein aktuelles Windows 11 23H2. Updates gibt es keine.
Einen Ubuntu Stick zu starten habe ich tatsächlich noch nicht versucht. Werde ich aber morgen gerne mal testen. Seltsam ist jedoch, dass die AMD Karte problemlos funktioniert.

Das mit dem älteren Treiber habe ich tatsächlich auch schon versucht. Ich habe es sogar mit dem Auslieferungstreiber probiert, jedoch ohne Erfolg.
 
Zuletzt bearbeitet:
Ergänze die OS info doch noch in deinem Eingangspost ... bis auf dass ich win 10 habe haben wir sehr ähnliche Systeme :) also ich habe keinerlei probleme weder mit linux (VM habe ich nicht ausprobiert) noch mit Spielen (aber mehr als ca 2h habe ich in letzter zeit nicht am stück gespielt.)

vielleicht kannst du ja auch noch präzisieren nach welchem Zeitraum beim Spielen der Fehler auftritt und welche spiele du getestet hast.
Du kannst auch mal einen Stresstest wie Furmark laufen lassen um zu testen ob es auch bei Synthetischer Last zum absturz kommt.
 
  • Gefällt mir
Reaktionen: Tom111222333
@Pyrukar Wurde hinzugefügt. Es gibt hier kein wirkliches Muster denke ich. Es passiert recht willkürlich. Das einzige Muster was ich feststellen kann ist in VMWare sobald ich im Linux Desktop bin (Nach der Anmeldemaske) stürzt es ab. Ich habe den Zuverlässigkeitsverlauf mal angehangen.
 
Zuletzt bearbeitet:
@Tom111222333 wenn die Vega56 ohne Probleme läuft, würde ich schon sagen dass die Karte einen weg hat, ggf. die Möglichkeit in einem anderen System zu testen ? wann hast du die Karte gekauft, mehr als drei Jahre Garantie sollte sie nicht haben
 
@Verak Drezzt die hätte ich erst in ein paar Tagen. Werde da aber dann ggf. auch mal testen. Sie wurde am 16.05.2022 gekauft. Ich werde nun mal versuchen mich mit dem Support von INNO3d in Verbindung zu setzen. Die Karte hat 3 Jahre Garantie habe ich eben herausgefunden.
 
  • Gefällt mir
Reaktionen: Verak Drezzt
Verak Drezzt schrieb:
wenn die Vega56 ohne Probleme läuft, würde ich schon sagen dass die Karte einen weg hat
Na ja, letztlich ist die ersatzkarte eben nicht mehr Nvidia ... wenn die Nvidia Treiber einen Weg haben betrifft das die AMD Karte natürlich nicht und die Nvidia hardware wäre dennoch nicht schuld.

Da deine Testspiele jetzt nicht gerade die Grafikmonster sind würde mich wirklich interessieren wie sie sich in einem Synthetischen Benchmark schlägt ... ich tippe mal dass sie entweder sehr schnell abstürzt oder gar nicht.

Ach ja ist das eine 8 oder 12 gb VRam Karte?
 
Zuletzt bearbeitet:
Setze mal den Rechner komplett neu sauber auf, installiere nur die Treiber und Furmark bzw. ein Spiel bei dem der Fehler aufgetreten ist und lass das mal laufen. Vielleicht läuft jetzt auf dem Rechner noch irgendwas was sich mit dem Grafikkartentreiber nicht verträgt und dieser deswegen abstürzt.

Ist zwar aufwendig aber wenn es dann funktioniert, dürfte es ein Softwareproblem gewesen sein. Vielleicht auch mal die Karte in nen anderen PC einbauen von nem Freund und dort testen.

Edit: Hatte überlesen dass Furmark auch jetzt bei dir problemlos läuft. Dann nach dem Neuaufsetzen noch eine Software installieren bei der der Fehler auftritt bevor du alles andere einrichtest und installierst.
 
Azeron schrieb:
Setze mal den Rechner komplett neu sauber auf
Wenn du noch eine alte SSD rumliegen hast kannst du auch auf die Neu installieren und dein Hauptsystem erstmal belassen bzw. währendessen ausbauen. Win11 muss ja für so einen Test nicht aktiviert werden, das läuft auch so.

Ich würde morgen aber erstmal mit dem Live Linux bzw. mit einer Richtigen LInux installation (auf eine Festplatte) versuchen. vermutlich hast du mind. 1 Spiel das auch unter Linux laufen sollte.
 
  • Gefällt mir
Reaktionen: Azeron
Pyrukar schrieb:
wenn die Nvidia Treiber einen Weg haben betrifft das die AMD Karte natürlich nicht und die Nvidia hardware wäre dennoch nicht schuld.
naja wenn er diese schon mit DDU entfernt hatte, kann er da eigentlich sicher sein, ansonsten wenn er 100% sichergehen will, die 3060 in nem anderen System noch testen oder Windows neu aufsetzen
 
Tom111222333 schrieb:
Das einzige Muster was ich feststellen kann ist in VMWare sobald ich im Linux Desktop bin (Nach der Anmeldemaske) stürzt es ab.
Dass es Nvidia nicht so hat mit Linuxunterstützung ist doch bekannt
 
Tom111222333 schrieb:
Eventuell ist noch wichtig zu erwähnen, dass die CPU im Eco Modus (65 Watt) läuft, da ansonsten der PC gerade beim spielen zu heiß wird.
Du hast eine WaKü aber der PC wird trotzdem zu heiß beim Spielen? Wie das?
Was bedeutet "zu heiß"?

Ich weiß, das hat, vermutlich, nichts unmittelbar mit deinem aktuellen Problem zutun aber normal finde ich das trotzdem nicht.
Ergänzung ()

Do Berek schrieb:
Dass es Nvidia nicht so hat mit Linuxunterstützung ist doch bekannt
Ich hab das so verstanden das nicht die VM abstürzt sondern das Wirtssystem auf dem die VM läuft.
 
@Tulol Naja, die CPU wird unter Volllast etwa 85 Grad heiß. Wenn die GPU zusätzlich Hitze verursacht werden daraus auch teilweise 90 Grad und mehr. Ohne Last läuft die CPU auf geschmeidigen 40 Grad. Alle Gehäuselüfter laufen durchgängig auf 9V Leistung und die Lüfter von der Wasserkühlung laufen immer auf 10V. Auch wenn die alle auf Volllast laufen wird das System nicht bemerkenswert kühler. Die dynamische Regelung habe ich deaktiviert, da ansonsten die Lüfter im Sekundentakt voll aufdrehen und wieder runter drehen was nach einer gewissen Zeit ziemlich an die Nerven geht.. Die Pumpe läuft immer auf 100% Leistung. Problem ist denke ich auch, dass das Gehäuse eben relativ klein ist. Wenn jemand eine Idee hat wie man die Kühlung verbessern kann dann immer her damit. Ich habe langsam das Gefühl die CPU bekommt man (zumindest in dem Gehäuse) nicht kühl.
Ergänzung ()

@Verak Drezzt Sehe ich eben genauso. DDU entfernt ja sogar die Registry Einträge von Nvidia, also ist es ja quasi so wie bei einer Neuinstallation. Ich werde aber dennoch mal versuchen das System neu zu installieren, auch wenn das einen erheblichen Aufwand bedeutet. Dafür habe ich aber erst im Laufe der Woche Zeit.
Ergänzung ()

@Pyrukar Ich habe mal ein paar Spiele angefügt bei denen das auch auftritt. Die sind wohl eher für grafische Meisterleistungen bekannt als House Flipper 2, stimmt schon ;D

Bei der Grafikkarte handelt es sich um eine 12GB VRAM Karte.
 
Zuletzt bearbeitet:
So, ich denke es wird ein grundsätzliches (eventuell noch anderes?) Problem vorliegen. Gerade ist mir der PC beim spielen mit einem Bluescreen "WHEA_Uncorrectable_Error" abgestürzt. Im Log finde ich Folgendes:

"Beschreibung
Aufgrund eines Hardwareproblems ist Windows nicht mehr voll funktionsfähig.

Problemsignatur
Problemereignisame: LiveKernelEvent
Code: 124
Parameter 1: 0
Parameter 2: ffffd38e40da0020
Parameter 3: bc000800
Parameter 4: 1010135
Betriebssystemversion: 10_0_22631
Service Pack: 0_0
Produkt: 768_1
Betriebsystemversion: 10.0.22631.2.0.0.768.101
Gebietsschema-ID: 1031"

Nun steht im Nirsoft Bluescreenview Folgendes:

1723457638014.png
 
Zuletzt bearbeitet:
Hab auch einen "midi tower".
Einen lufgekühlten r7 5800x3d und eine rtx4070s.

Nichts davon überschreitet die 80°C marke.

Hab lüfterkurven selber eingestellt, schnelles auf und ab regeln bekommt man mit entsprechenden hysterese Einstellungen in den griff.


Vielleicht liegt ja doch ein Temperaturproblem vor? (spawas?, SSDs?)
 
@Tulol ich glaube eben langsam auch, dass es ein Temperaturproblem sein kann, allerdings von Seiten der CPU. Die Frage ist nur wie man das am besten in den Griff bekommt. Das Problem ist eben, dass ich den Rechner trotz mehrerer Lüfter und Wasserkühlung (Sieht man ja im Bild) nicht wirklich kühl bekomme. Die nächste Idee wäre nun ein neues Gehäuse mit mehr Kühlmöglichkeiten oder eben eine andere CPU, die erheblich kühler läuft. Die Wärmeleitpaste der CPU habe ich auch bereits ersetzt. Keine Besserung. Langsam gehen mir hier die Ideen aus.

Die SSDs bleiben mit 30 Grad angenehm kühl. Die Spannungswandler habe ich bislang noch nicht überprüft. Hier fehlt mir aber auch das nötige Werkzeug zu. Oder kann man die auch irgendwie auslesen?
 
Zuletzt bearbeitet:
Kann dir da leider nicht wirklich weiterhelfen.

Das problem das ich mit deinem Setup habe ist die AiO WaKü^^
Ich kann die nicht leiden. Ein (anständiger)Luftkühler leistet IMHO zumindest die Selbe kühlung und bläst zusätzlich auf Mainboardbauteile in richtung Gehäuseausgangslüfter. Eine AiO tut das eben nicht.

Aber jeder wie er mag und wenn ich weiter schreibe könnte man mir noch unterstellen das ich AiOs schlecht rede und mich darauf versteife ect...^^
 
Ich werde morgen mal die komplette Wasserkühlung abmontieren und neu anbringen inklusive neuer Wärmeleitpaste. Dann werde ich auf einer anderen SSD Windows neu installieren. Zusätzlich dazu werde ich die Lüfterkurve nochmals anpassen und eventuell einen besseren Lüfter für hinten raus anschaffen. Im Moment ist da der Standard Gehäuselüfter der beim Spec Delta mitgeliefert wurde verbaut. Bei einem Freund läuft die gleiche CPU (Ryzen 7 5800X) mit 45 bis maximal 80 Grad und das auch unter Last beim spielen. Das ganze mit einem (nicht besonders großen) Luftkühler und einer RTX 4060. Was mich stutzig macht ist, dass ich auch mehrmals von fehlerhaften Ryzen der 5000er Serie gelesen habe, die unter Last abstürzen und zu heiß werden. Eine Theorie ist, dass die GPU Abstürze eventuell auch mit Fehlern der CPU zusammenhängen könnten. Ich denke ich werde da falls die Aktion morgen nichts bringt mal bei AMD ein Ticket eröffnen. Eventuell ist das ganze ja auch ein CPU Problem. Viele Ideen habe ich ansonsten nicht mehr.
 
Zuletzt bearbeitet:
Zurück
Oben