Anzeigetreiber "nvlddmkm" reagiert nicht mehr und wurde wiederhergestellt

erich56

Lieutenant
Registriert
Dez. 2014
Beiträge
1.012
Habe vor einigen Tagen auf einem PC, auf welchem bislang Windows XP lief, als Dual-Boot Windows 10 installiert, und führe darauf nun genau das gleiche Grid-Computing Programm GPUGRID aus, welches unter XP seit 2 1/2 Jahren problemlosest funktioniert hat.
Die dafür verwendeten Grafikkarten sind 2 Palit GTX980Ti.
Zur näheren Info: bei GPUGRID werden molekular-biologische Simulationen mittels Grafikkarte durchgeführt (die Grafikkarte dient als Co-Prozessor zur CPU).

Allerdings ergibt sich unter Windows 10 nun folgendes gravierende Problem:

Nach unterschiedlicher Zeitdauer (zwischen 1 und mehreren Stunden) ab Start von GPUGRID wird der Bildschirm plötzlich schwarz, und die Grafikkarten stellen ihre Arbeit ein. Ich habe dann nur mehr die Möglichkeit, den "Aus"-Knopf zu drücken und neu zu booten.
In der Windows-Ereignisanzeige sehe ich dann die Meldung "Der Anzeigetreiber 'nvlddmkm' reagiert nicht mehr und wurde wiederhergestellt" - siehe Screenshot. Und diese Meldung wiederholt sich alle 4 Sekunden, vom Zeitpunkt des Abschaltens der Grafikkarten bis zum Drücken des Aus-Knopfes durch mich.

nvlddmkm.JPG

Nach dem Hochfahren des PC ist wieder alles okay, GPUGRID kann genau dort wieder fortgesetzt werden, wo es aufgehört hat.

Ich habe, um sicherzugehen, das ganze zwischenzeitlich wieder mit XP laufen lassen, und dabei funktioniert alles, wie gehabt, einwandfrei. Also das Problem sollte nicht Hardware-mäßig bedingt sein.
Abgesehen davon laufen die beiden Grafikkarten maximal am Default-Takt von 1152 MHz (bzw. etwas darunter), die Temperaturen sind zwischen 60 und 62°C.

Im GPUGRID-Forum kann sich niemand einen Reim auf dieses Problem machen, außer daß mir empfohlen wurde, mal bei den Energiespar-Einstellungen nachzusehen, ob dort irgendwelche Abschaltungen nach einer bestimmten Zeit eingestellt sind.
Außer der Bildschirm-Abschaltung (nach 5 Minuten) gab es nichts in diese Richtung.

Weiters ist dazu zu sagen, daß ich GPUGRID auch auf weiteren zwei Windows10-Rechnern laufen habe - also gibt es offensichtlich auch kein Kompatibilitätsproblem zwischen Windows10 und der aktuellen GPUGRID-Version.

Weiters habe ich den ursprünglich bei der Windows10-Installation mitinstallierten NVIDIA-Treiber 388... durch den aktuellsten 398.36 ersetzt - hat auch nichts geholfen. Also ist es wohl auch kein Treiberproblem.

Kann mir irgendwer anhand der im Screenshot gezeigten Fehlermeldung sagen, wo das Problem liegen könnte?
 
Ich vermute, dass es daran liegt, dass die verwendete Pipeline zur GPU-Berechnung (Auftrag -> GPU) unter Windows 10 eine andere ist, wie unter Windows XP und evtl. der Teil einer deiner Grafikkarten einen Fehler hat.

Was passiert, wenn du nur Grafikkarte A oder B für die Berechnungen nimmst? Was ist, wenn du die Displays an die andere Grafikkarte anschließt?
 
EIner der Top-Crunsher nutzt Treiberversion 388.13 , aber obs hilft ?
 
Sephe schrieb:
Was passiert, wenn du nur Grafikkarte A oder B für die Berechnungen nimmst? Was ist, wenn du die Displays an die andere Grafikkarte anschließt?
werde das heute mal ausprobieren

emeraldmine schrieb:
EIner der Top-Crunsher nutzt Treiberversion 388.13 , aber obs hilft ?
das war jener Treiber, der urspünglich mit Windows10 installiert wurde. Und auch damit gab's das Problem (weshalb ich den Treiber dann gewechselt habe, in der Annahme, es könnte am Treiber liegen).
 
erich56 schrieb:
der urspünglich mit Windows10 installiert wurde

so ? Sicher automatisch mit MS Update verteilt, dann isser für nix zu gebrauchen was Du vorhast. Bei Nvidia.de laden oder guru3d.com.
 
ist dein system irgenwie übertacktet?
was in xp stabil läuft muss nicht in win10 laufen
im gpu-z sensor fenster mal schauen wie hoch deine karten boosten inter last

nach 4 jahren hier im forum könnte man mal die system, specs ausfüllen bitte-tun sich alle leichter
 
Hanne schrieb:
Mainboard / RAM sind welche ?

MoBo: Asus P9X79WS
RAM: Kingston HyperX Fury, DDR3-1866, 4x8GB
CPU: Intel i7-4930k 3.4GHz - läuft mit 3.9GHz

vascos schrieb:
ist dein system irgenwie übertacktet?
was in xp stabil läuft muss nicht in win10 laufen
im gpu-z sensor fenster mal schauen wie hoch deine karten boosten inter last
nach 4 jahren hier im forum könnte man mal die system, specs ausfüllen bitte-tun sich alle leichter

Die Karten übertakten unter Last bis weit über 1400GHz, allerdings komme ich mit der Temperatur dann in den 70er-Bereich.

Bezüglich des Ausfüllens der System-Specs wurde ich schon mal gerügt; allerdings ist das dann ein Problem, wenn man im Laufe der Zeit Beiträge für mehrere verschiedene Systeme schreibt, und immer etwas anderes zutrifft.
In meinem Fall wären das gesamt 9 Systeme.
 
Zuletzt bearbeitet:
und gpu grid läuft im sli modus? oder karte für karte?
netzteil?

ok bei 9 systemen verständlich
 
Nicht im SLI Modus, ist bei GPUGRID so nicht vorgesehen. Jede Karte arbeitet für sich, unabhängig von der anderen, eine Task ab.

Netzteil: Corsair Prof. Series HX1000i (1000Watt).
 
RAM = vier Module
A1 + B1 + D1 + C1 eingesetzt ? Diese auf 1,55V (1,6V) bei mehr als zwei Modulen getestet ?

Im BIOS
DRAM Timing Control
DRAM Command Mode = 2T

TESTEN
 
ich würde einfach mal probieren die karten etwas untertakten so um die 100mhz-geht schnell und dann weisss mas halt fix.

mir ist vor kurzem mein fast 10 jahre altes 1000hx ohne i eingegangen-habe monate gebraucht um draufzukommen da es nicht nachvollziehbare fehler zu unterschiedlichsten zeiten waren.-manchmal sogar tage lang gefunkt ohne probs.
 
leider scheint mein neu aufgesetztes Windows10 auch noch ein ganz anderes Problem zu haben als das oben angesprochene bezüglich Grafiktreiber:
heute nachmittag wurde, und dies zum ca. 3. Mal innerhalb von 4 Tagen (hatte bei meinem ersten Beitrag von heute morgen darauf ganz vergessen, das zu erwähnen) das System "unerwartet heruntergefahren" und dann neu gestartet.
Hier die entsprechenden Meldungen aus der Ereignisanzeige:

Neustart_1 - 16.42.09 Uhr.JPGNeustart_2 - 16.42.22 Uhr.JPGNeustart_3 - 16.42.24 Uhr.JPG

die im 3. Screenshot erwähnte Minidump-Datei gibt es leider nicht - der Ordner ist leer :-(

Kann möglicherweise jemand aufgrund der angezeigten Fehlercodes u.ä. zumindest vermuten, wo das Problem liegt?

Ich bin tatsächlich erstaunt, daß dieser PC, auf dem bislang Windows XP seit 2 1/2 Jahren völlig problemlos lief, das Windows 10 nun derartige Probleme macht.
 
Zuletzt bearbeitet:
habe mich nun erinnert, daß ich vor längerer Zeit bei einem anderen PC die Fehlermeldung "Kernel Power - Ereignis-ID 41" auch schon mal hatte, und das Problem damals waren neu gekaufte, aber nicht genau zum MoBo passende RAM-Bausteine.
Herausgefunden hatte ich das das ganze durch den Memtest86+ (5.01).

Und genau diesen habe ich nun beim gegenständlichen PC gestartet, er läuft zwar noch, bringt aber bereits jetzt eine Menge Fehlermeldungen. Also offenbar werden die Probleme durch einen defekt gewordenen RAM verursacht :-(
 
wie lässt du den ram laufen? auf 1866mhz oder ? standard?
mal das von hanne probiert falls nicht eh auf 2T steht.

win 10 kann ich leider nicht helfen bin noch auf win7
 
tja, grundsätzlich ist RAM auf 1866mhz im BIOs so eingestellt.

Allerdings wurde ich nach dem Posten des Screenshots des MemTest86-Ergebnisses (in einem anderen Forum hier) auf den Eintrag "DDR3-3109" hingewiesen, was natürlich viel zu hoch wäre - siehe ScreenshotRAM_Test_3_klein.jpg

Habe mir die BIOS-Einstellungen angesehen, dort sehe ich ausschließlich 1866MHz eingetragen.
Werde dann den Wert auch noch mittels CPU-Z (Tab "Memory") auslesen.

Abgesehen davon zeigt MemTest86 jede Menge Fehler an. Habe heute morgen einen Bekannten, der sich technisch einigermaßen gut auskennt, darauf angesprochen - und er meinte, daß MemTest86 ein viel zu altes und relativ unverläßliches Tool wäre; denn gäb's tatsächlich derart viele Fehler im RAM, dann würde WindowsXP (im Gegensatz zu Win10) nicht derart einwandfrei laufen - was es aber tut.

Im Moment läuft seit einigen Stunden das "Windows Arbeitsspeicher-Diagnosetool" (in Windows10 mittels "mdsched" zu starten, war mir bislang gar nicht bekannt, und das kennen offenbar auch die wenigsten), der Pass 1 ist gerade zu 90% durch, bislang wurden keine Fehler angezeigt. Natürlich kann bei den restlichen 10% noch was kommen, werde dann hier berichten.

Die von Hanne empfohlenen BIOS-Einstellungen muß ich mir dann auch noch ansehen.
 
vor kurzem wurde Pass 1 dieses "Windows Arbeitsspeicher Diagnosetools" fertig, und es wurden keinerlei Fehler angezeigt. Nun läuft Pass 2, sicher wieder über mehrere Stunden. Mal sehen, was am Ende dabei rauskommt.
Und vor allem: welches Tool ist nun tatsächlich verläßlich aussagekräftig?
Hat jemand von Euch Empfehlungen für weitere solche Tools (Google bringt ja so einiges; das eine oder andere, welches ich heute morgen testen wollte, war ein richtiger Schmarrn).
 
vascos schrieb:
wie lässt du den ram laufen? auf 1866mhz oder ? standard?
mal das von hanne probiert falls nicht eh auf 2T steht.
RAM läuft auf 1866MHz:
Target DRAM Speed 1866MHz.jpg

Wenn Hanne sagt:
Im BIOS
DRAM Timing Control
DRAM Command Mode = 2T

meint er damit: DRAM Command Rate?
diese schaut in meinem BIOS so aus:
DRAM Command Rate 2 2 2 2.jpg

Übrigens: Das "Windows Arbeitsspeicher Diagnosetools" hat gerade vorhin 2 Durchläufe (mehrere Stunden) hinter sich gebracht, und zeigt keine Fehler.
 
ja der ist aber eh auf 2Takte eingestellt.

also memtest ist 2013 letztes mal aktualisiert worden dein system ist um die wieviel jahre jung? also so weit ist das nicht auseinander.
ich weiss beim auslesen ist es nicht besonders.
ok habs grad selbst getestet und bei test 7 hängts bei mir obwohl meins stabil sein sollte.

win xp ist auch 32bit und kann nicht auf deinen ganzen ramspeicher zugreifen-das es da eher funkt ist abzusehen.

ich schätze dein ram war nie komplett stabil oder ein riegel war von anfang an defekt.
in welchen slots stecken deine ram riegel?-hast noch dein mainboard handbuch?

könntest noch die ram frequenzy auf 1333mhz mal stellen und nochmal prüfen.

probier mal das hier bitte.
https://www.techpowerup.com/232536/techpowerup-announces-memtest64-test-memory-from-within-windows
 
Zuletzt bearbeitet:
habe heute morgen das neu auf CD gebrannte Mentest86 (OHNE +) v7.5 (bzw. v4.3.7) gestartet.
Circa 2 Stunden lang hab ich immer wieder einen Blick auf den Monitor geworfen: soweit keine Fehler.
Als ich dann weg ging und nach ca. 2 1/2 Stunden wiederkam, merkte ich, daß sich das Tool offenbar aufgehängt hatte:
es lief zwar immer noch irgendwie, allerdings stand sowohl bei Pass als auch bei Test jeweils 100%, und das änderte sich trotz fortlaufender Zeit nicht mehr - siehe Screenshot:
Memtest86 v4.3.7 - Ende.jpg
also scheint dieses Tool wohl nur bedingt brauchbar bzw. bedingt aussagekräftig zu sein. Schade war auch, daß hier der RAM-Takt nicht angezeigt wurde (welcher beim MemTest86+ ja als viel zu hoch angezeigt wurde, in den BIOS allerdings korrekt mit 1866MHz).

Davor ist XP die ganze Nacht hindurch völlig problemlos gelaufen, mit zwei Gridcomputing-Programmen, von denen eines an die 85% RAM beansprucht.
Aja - mein XP ist 64 bit, daher die volle RAM-Ausnützung möglich.

Die Riegel stecken auf A1 B1 C1 D1 (wird auch in den BIOS so angezeigt).

Frequenz-Senkung auf 1333MHz wäre den Versuch wert.

Memtest64 werde ich jedenfalls demnächst mal probieren. Obwohl es Aussagen gibt, die ein solches Tool, welches direkt vom einem OS aus startet, für nicht 100% aussagekräftig halten, weil beim Testen natürlich genau auf jene Bereiche, die vom OS selbst belegt sind, nicht zugeriffen werden kann.
Aber trotzdem wäre interessant, was sich da zeigt.
 
Zurück
Oben