Gtx 1080 DXGI_ERROR_DeVICE_REMOVED und andere Fehler - GPU defekt?

Bioforge

Lt. Junior Grade
Registriert
Apr. 2009
Beiträge
379
Tach zusammen,

ich habe für nen Kollegen vor etwa 6 Wochen einen Rechner zusammengebaut, Konfiguration ist folgende (weiß gerade nicht mehr alle Details für jede Komponente:

GPU: Gainward GTX 1080 Phoenix (nicht die GS oder GLH) mit Treiber 378.92 (und ältere)
CPU: Intel Core I7 7700K mit Enermax Liqmax II 240
Mainboard: ASUS ROG Strix Z270E Gaming
RAM: 16 GB DDR4 (weiß nicht mehr genau welchen, Crucial Ballistix Sport, Corsair Vengeance oder einen G.Skill --> auf jeden Fall sind die Timings über XMP Profil eingestellt).
Netzteil: bequiet Pure Power 10 700 W (könnte auch das straight power gewesen sein)
2 SSDs 960 Evo, 1x250 GB, 1x 1000 GB
Gehäuse: Dark Base Pro 900
Windows 10 Pro x64
4K Monitor

Das System lief in den ersten 5 Wochen sehr stabil, ohne jegliche Probleme bei Spielen wie BF1, Star Wars Battlefront und auch neuerdings mit Ghost Recon Wildlands, aber auch verschiedenste Steam Spiele.

Seit kurzem läuft es bei allen Spielen sehr unrund. Regelmäßig, manchmal nach 1-2 Minuten, manchmal 10 Minuten stürzt das Spiel (egal welches der o.g.) meist mit einem bunten Bildchen ab, meist mit einer Meldung wie DXGI_ERROR_DEVICE_REMOVED (siehe Bilder) oder gar keine Meldung, manchmal geht gar nichts mehr und das System muss neugestartet werden.

Es gibt kein bestimmtes Ereignis, mit dem dieses Problem aufgetreten ist, außer generelle GPU-Treiber und Windows-Updates


Ich habe mich mit diesen Angaben gestern der Sache angenommen und verschiedenes probiert:
- GPU Treiber deinstalliert, System mit DDU gereinigt und neu installiert --> keine Besserung
- ältere NVIDIA Treiber installiert bis zu 378.49 (natürlich nach DDU Säuberung) --> keine Besserung
- Ingame Overlay (Origin) etc deaktiviert --> nichts gebracht
- Expert Tool (eine Art MSI Afterburner von Gainward) deaktiviert (hier war nichts übertaktet oä)
- Microsoft Visual C++ Komponenten entfernt und neu installiert (hat bei manchen mit dieser Fehlermeldung geholfen)
- Dxwebsetup ausgeführt (kann ggf DirectX neu installieren, meldete es sei nicht notwendig); Dxdiag meldet auch keine Probleme
- DirectX 12 falls möglich im Spiel einstellen --> keine Besserung
- Windows 10 "Refresh" gemacht --> keine Besserung
- Prime 95 läuft stabil (nur etwa 15 min getestet), CPU Temp geht auf etwa 60 °C hoch bei Vollast
- Festplatten weißen keine Fehler auf (Smart Werte OK)
- RAM noch nicht getestet

Das System wurde beim abschmieren später mit MSI Afterburner beobachtet und war an sich unauffällig:
GPU Temp geht auf etwa 70 °C hoch, Speicher je nach Game bis zu 6 GB von 8 ausgelastet
CPU Temp auf etwa 55-60 °C


Zusätzlich wurde mit MSI Kombustor ein GPU Stresstest gemacht (hauptsächlich der 6 GB Mem test)
--> Das System stürzt reproduzierbar nach etwa 5 Minuten mit nem bunten Bild ab, auch hier Temperaturen unauffällig, ABER hier ist zum ersten Mal aufgefallen, dass die Core Clocks nicht dem Standard entsprechen (vielleicht doch eine Phoenix GS oder GLH?)
Core Clock: geht bis zu 1873 Mhz hoch (laut Hersteller im Boost eigentlich nur bis zu 1733), Mem Clock ist normal (5000 MHz), obwohl das System mit Afterburner (oder auch dem Experttool) nicht übertaktet ist. Ich weiß natürlich nicht, ob von Anfang an dieser Takt anlag und ob das normal ist.
Core Clock wurde mit Afterburner runtergetaktet (um etwa 150 MHz), schien danach stabil zu laufen im Benchmark, stürzte aber darauf in Battlefront 1 wieder ab.

Langsam bin ich mit meinem Latein am Ende.
Bevor ich die GPU in meinem Rechner teste (mache ich nur ungern, habe ein AMD System), wollte ich fragen, was ich sonst noch direkt testen sollte, um einen GPU-Defekt auszuschließen bzw einzukreisen.
- Alle Steckverbindungen prüfen, Sitz im PCie Slot
- anderes Netzteil?
- gibt es ein Live-Linux mit dem ich die GPU testen kann (um System auszuschließen)
- oder kann man jetzt schon sagen, dass die Grafikkarte vermutlich einen Defekt hat und man besser eine RMA einleitet?
Ergänzung ()

Achja, Wiederherstellungspunkt ist auch keine Lösung, sind leider nur noch recht neue Wiederherstellungspunkte da, bei denen das Problem schon auftritt
 

Anhänge

  • IMG-20170321-WA0002.jpg
    IMG-20170321-WA0002.jpg
    142,2 KB · Aufrufe: 662
  • IMG-20170321-WA0001.jpg
    IMG-20170321-WA0001.jpg
    523,1 KB · Aufrufe: 672
Zuletzt bearbeitet:
PCIe ist auf Auto eingestellt, ich denke mal dass er sich auf Gen 3 einstellt.
--> aber warum sollte das auf einmal ein Problem sein wenn es wochenlang keines war?
 
OK wird getestet; was kann ich noch machen?
 
Wenns nix bringt, Mainboard BIOS Uppen , wenn möglich/nötig, aber dann ist auch schon Ende.
 
Bios ist aktuell, Version 0801
 
Ich kann das leider gerade nicht testen, evtl morgen, werde Rückmeldung geben.
 
Ist doch ein bekannter Fehler, oder?

Deaktiviere bitte mal die OnChip Graka des i7 ... selbst wenn du diese eigentlich nicht nutzt stört sich die aktuelle Frostbite wohl daran wenn die genrelle Bereitschaft zum Rendern über den Chip aktiv ist.
 
Selbst wenn der Moni an der GPU hängt.

Wir hatten das Problem auf 2-3 Systemen auch. Mal konnten die Herren mehrer Stunden spielen...mal nur 2 Minuten.
Nach kompletter Deaktivierung der iGPU lief es dann ohne Probs...

Würde ich also mal probieren. Frostbite ist sehr zickig geworden. Starte z.B. mal Fifa17 wenn du über Afterburner die Daten an das Display einer G19 sendest. Gibt direkt nen Crash :D
 
OK, deaktivieren der iGPU wird auch getestet, ist notiert

Monitor ist über DP an der GTX 1080 angeschlossen
 
Also, kurzes Update
integrierte GPU deaktivieren --> keine Besserung
Bios Update (gab zwischenzeitlich ein neues) --> keine Besserung
PCI E auf Gen 2 gestellt --> keine Besserung
sämtliche Kabel gecheckt, andere Lane am Netzteil getestet --> keine Besserung

System komplett neu installiert --> Fehler immer noch da (zwar nicht mit DirectX Fehlermeldung, sondern mit plötzlichem schwarzem Bild oder buntes Standbild)

Ich denke jetzt ist die Zeit gekommen, die Garantie in Anspruch zu nehmen; ich hoffe dass Alternate einem Umtausch zustimmt, leider ist die OVP nicht mehr vorhanden....
 
Krass...hätte ich jetzt nicht mit gerechnet.

Ich drücke die Daumen. Poste gerne ein Update wenn es Fortschritte gibt.
 
Keine Ersatz-Grafikkarte zum Testen da?
 
Bringt nicht viel wenn der Treiber auf seiner Karte crasht ...
was bringt es dann wenn ne andere Karte läuft?
 
Man weiss, ob der Treibercrash aufgrund einer defekten Grafikkarte erfolgt oder aus anderen Gründen...
 
Kurze Zwischenmeldung, die Windows Neuinstallation scheint doch was gebracht zu haben, die Grafikkarte stürzt jetzt bei Bf1, Battlefront und andere nicht mehr ab, auch Stresstest mit MSI Kombustor läuft jetzt problemlos über 1 Stunde (vorher nur 5-10 min).
Nur noch Ghost Recon Wildlands schmiert regelmäßig ab (aber kein DXGI Error Device Removed, meist schwarzes Bild). Da viele andere bei diesem Spiel auch Probleme haben gewichte ich das mal nicht allzu hoch, evtl hilft es auch mal das Game komplett neu zu installieren (Reparaturfunktion schon gemacht).
Trotzdem traue ich dem Frieden noch nicht so ganz, auf jeden Fall kann man sie so erst mal nicht einsenden...
 
Um das Thema abzuschließen:

Nach kurzer Zeit traten wieder unregelmäßig Abstürze (meistens Reboots, seltener Crashes auf Desktop) während dem Spielen verschiedenster Titel auf, mal nach 5 min, mal erst nach einer Stunde :mad:. Wenn aber ein Absturz kam, passierte der nächste Absturz beim erneuten Spielen sehr schnell (in den ersten paar Minuten). Die Windows Ereignis-Anzeige zeigte meistens Fehler verursacht durch Treiber "dxgkrnl.sys", der Fehler "DXGI_ERROR_DEVICE_REMOVED" tauchte so gut wie gar nicht mehr auf... :freak:

Deswegen habe ich einen Schlussstrich gezogen und die Grafikkarte ausgebaut und wir sind direkt zu Alternate gefahren. Nach Schilderung aller Probleme haben die die Karte in ein Testsystem gebaut und im Loop getestet (Benchmark). Natürlich ist erst mal nichts passiert und alles lief stabil, bis auch da plötzlich nach einiger Zeit der Rechner neu gestartet ist. Das erste Mal haben die das gar nicht mitgeschnitten (der Support bearbeitet Vorort naturgemäß viele Anfragen gleichzeitig), aber als auch da anschließend der Testrechner immer wieder mit den gleichen Symptomen abgestürzt ist, war es eindeutig, dass es an der Grafikkarte liegt.

Kurzum wurde die Karte direkt getauscht, und seitdem ist endlich Frieden und das System läuft seit 2 Wochen stabil egal welches Spiel.
Ich hoffe das bleibt so (bei der ersten Karte war in den ersten 5 Wochen ja auch alles prima), Daumen drücken :daumen::daumen::daumen:
 
Zurück
Oben