Bluescreen NMI_HARDWARE_FAILURE

--Epox--

Cadet 3rd Year
Registriert
Sep. 2019
Beiträge
56
Guten Tag liebe Gemeinde,
ich habe aktuell ein Problem, mit einem widerkehrenden BSOD in unregelmäßigen Abständen. Es scheint zumindest immer nur dann aufzutreten, wenn ich mich im Spiel, oder der Queue von New World befinde.

Ich umreiße kurz meine Hardware specs:

Alle Teile sind von 08.2016
  • Intel Core i7 6700k (ohne OC oder UV, habe ich zwecks Diagnosse schon rausgenommen)
  • Asus Maximus VIII Formula Z170
  • 32 GB CL14 2400 Corsair Platinum (4 Riegel)
  • GTX 1080 FTW von EVGA
  • be quiet! Dark Power Pro P11
  • M2 SSD 1TB
Das komplette System steht unter Wasser und wird von einem MORA 420 extern gekühlt, wobei folgende Temps entstehen (Laut HW Sensoren) Idle - Last:
  • MB 30-50°
  • CPU 35-60°
  • GPU 35-50°
  • RAM 40°
Es gab nie irgendwelche Stabilitätsprobleme bisher, ich habe zudem ca 1h Prime und Furmark laufen lassen, nichts passierte. Der Memtest von Windows ergab ebenfalls keine Probleme und auch ein Treiber Downgrade für die GPU hat nichts gebracht. Also habe ich mein System neu aufgespielt und nur Treiber, Steam, Bnet und Discord installiert, leider ohne Erfolg.

Ich füge mal noch den Windows Eventlog an, eventuell bringt das mehr informationen.

- <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
- <System>
<Provider Name="Microsoft-Windows-Kernel-Power" Guid="{331c3b3a-2005-44c2-ac5e-77220c37d6b4}" />
<EventID>41</EventID>
<Version>8</Version>
<Level>1</Level>
<Task>63</Task>
<Opcode>0</Opcode>
<Keywords>0x8000400000000002</Keywords>
<TimeCreated SystemTime="2021-09-30T10:36:02.3733905Z" />
<EventRecordID>1627</EventRecordID>
<Correlation />
<Execution ProcessID="4" ThreadID="8" />
<Channel>System</Channel>
<Computer>EpoX</Computer>
<Security UserID="S-1-5-18" />
</System>
- <EventData>
<Data Name="BugcheckCode">128</Data>
<Data Name="BugcheckParameter1">0x4f4454</Data>
<Data Name="BugcheckParameter2">0x0</Data>
<Data Name="BugcheckParameter3">0x0</Data>
<Data Name="BugcheckParameter4">0x0</Data>
<Data Name="SleepInProgress">0</Data>
<Data Name="PowerButtonTimestamp">0</Data>
<Data Name="BootAppStatus">0</Data>
<Data Name="Checkpoint">0</Data>
<Data Name="ConnectedStandbyInProgress">false</Data>
<Data Name="SystemSleepTransitionsToOn">0</Data>
<Data Name="CsEntryScenarioInstanceId">0</Data>
<Data Name="BugcheckInfoFromEFI">false</Data>
<Data Name="CheckpointStatus">0</Data>
<Data Name="CsEntryScenarioInstanceIdV2">0</Data>
<Data Name="LongPowerButtonPressDetected">false</Data>
</EventData>
</Event>

Bei Fragen liefere ich gerne auch noch Informationen nach, ich bin leider mit meinem Latein am Ende und auch Google kann bei dem BS leider alles liefern zwischen Schwiegermutter krank und RAM kaputt. Auch mit speziellem Bezug auf NW scheint das Problem für andere nicht zu bestehen.

Beste Grüße

EpoX
 
  • Gefällt mir
Reaktionen: Staubgeborener
Der Memtest von Windows ist nicht so aussagekräftig, besser Memtest 86+ von USB oder CD gestartet benutzen, wenn das ohne Fehler läuft, im Bios das RAM auf 2133Mhz stellen. 2400Mhz mit 4 Modulen
ist schon unter overclocking zu verbuchen
 
  • Gefällt mir
Reaktionen: --Epox--
Tom-S schrieb:
Der Memtest von Windows ist nicht so aussagekräftig, besser Memtest 86+

Der alte "Memtest86+ (2013)" ist für DDR4 aber nicht geeignet und somit nicht aussagekräftiger.
Auch wenn dieser vor zwei Jahren mal ein Update erhalten hat und nun auch noch eine Beta ist.
Es gibt aber auch aktuelle Tools um den RAM zu überprüfen:

"MemTest86 Free 9.2 Build 2000"
 
  • Gefällt mir
Reaktionen: whats4 und --Epox--
Im Ordner C:/Windows/Minidump
befinden sich die Informationen zum blue screen.
Die letzten fünf Files auf den Desktop kopieren.
Mit rar oder zip verpacken.
Hier im Forum hoch laden.
 
  • Gefällt mir
Reaktionen: AwesomSTUFF und --Epox--
--Epox-- schrieb:
Ich füge mal noch den Windows Eventlog an, eventuell bringt das mehr informationen.
Der "Kernel Power - ID:41" ist völlig normal in deinem Fall.
Dieser erscheint nach jedem Neustart des Systems, wenn es nicht heruntergefahren wurde.
Den hast du durch deine Abstürze des Systems.
 
  • Gefällt mir
Reaktionen: --Epox--
Danke schonmal für die Tipps, der Ram läuft nicht auf 2400 das ist nur die max Frequenz, das war eine fehlerhafte Angabe meinerseits. Memtest lasse ich später mal laufen.

Es waren nur 2 Dumps im Folder, vermutlich wegen "frischem" Windows, ich hänge diese einmal an.
 

Anhänge

Die CPU war nie OCed, sie war nur im UV unterwegs :) ein Umstand der meines Erachtens nach die Lebensdauer eher verlängern sollte.
 
dcz01 schrieb:
Ich vermute hald, dass du nach 5 Jahren deine CPU per OC schon aufgearbeitet hast...

Ist gibt mehrere Hinweise im Netz zu "NMI_HARDWARE_FAILURE".
Du liest einen und kommst gleich mit defekter CPU.

 
@--Epox-- Aso ok, ja das konnte man nicht genau rauslesen... Aber wenn nur UV, dann machts nichts nein.
Wie du sagst, eher positiv richtig.

@Nickel Ich las keinen einzigen aus dem Internet...
Ich such BSOD immer direkt bei MS raus und nunja, genauer ham die leider auch nicht eingrenzen können.
Da aber das Mainboard sehr hochwertig ist, schließe ich dies mal aus.
 
@--Epox--

Ein NMI ist ein Non-Maskable Interrupt, eine Art Not-Aus bei Hardwarefehlern.
Die Dump-Dateien deuten auf einen CPU-Fehler hin.

Das muss natürlich nicht unbedingt ein Hardwarefehler sein.
Es könnte auch eine nicht richtig montierte CPU sein, Übertaktungen oder auch Undervolting.

Da NMI BSODs sehr sehr selten sind, würde ich persönlich aber trotzdem auf einen echten Hardwarefehler tippen. Hier könnte man wahrscheinlich nur per Ausschlussprinzip vorgehen, fürchte ich.
 
Ich würde hald auch einfach mal empfehlen, Windows neu zu installieren und nur nötige Treiber frisch und aktuell drauf.
Dann alles nochmal testen.
 
Nickel schrieb:
Immer noch?
Kann gut sein, dass du evtl. ein bisschen mehr brauchst nach langer Zeit.
Gib der CPU mal ihre Standart VCore und beobachte.
Nein habe ich inzwischen entfernt, hat aber leider nichts geändert.

Inzwischen habe ich schon etliche Support-Beiträge von Microsoft gewälzt und und in einem stand auch etwas von defektem Wifi Chip, der befindet sich zwar onboard bei mir, aber ich habe trotzdem mal auf ein Kabel gewechselt, welches ich durch den Raum verlegt habe, um das schon einmal auszuschließen

@DocWindows ich habs schon fast befürchtet, dachte aber nach dem Benchen der CPU, welches stabil über einige Stunden lief, dass dort alles in Ordnung sei, muss natürlich nicht. Leider habe ich keine Möglichkeit Einzelteile zu tauschen, nun stellt sich mir die Frage, wie ich am intelligentesten vorgehe, ohne sinnlos Geld zu verbennen.

@dcz01 das Windows ist komplett frisch, wie voran beschrieben.
 
Du sagst, du hast kein OC und auch kein UV mehr und trotzdem schmiert dir das System aus heiterem Himmel ab, oder?

Und sie treten nur auf, wenn du dich in einem Spiel befindest.
Beim daddeln im Internet passiert das nicht und wenn der PC auf Dauerlast (Prime und Furmark) ist.

Dann würde ich den Fehler beim Netzteil suchen, weil es evtl. mit den Lastwechsel der Graka im Spiel nicht mehr zurechtkommt.

Hast du ein anderes zum Testen da?
 
@--Epox-- Oh sorry, hab ich wohl überlesen...
Nunja, dann bitte mal den WLAN-Chip im BIOS komplett abschalten und nochmal prüfen ;)
Die rauchen echt mal schneller ab als man denkt... (kenn ich aus HP-Notebook direkt nach Ablauf der Garantie gut)
Ergänzung ()

@dasardo Ein NT verursacht aber keine Bluescreens, da dies in keinster Weise softwaretechnisch angesteuert wird...
 
dcz01 schrieb:
Ein NT verursacht aber keine Bluescreens, da dies in keinster Weise softwaretechnisch angesteuert wird...
Ein fehlerhaftes Netzteil kann durchaus auch für Bluescreens sorgen.
Ergänzung ()

--Epox-- schrieb:
das Windows ist komplett frisch, wie voran beschrieben.
Du hättest aber erst mal für eine Weile, keine unnötigen Treiber und Tools installieren sollen,
um Software Probleme je nachdem ausschließen zu können.
--Epox-- schrieb:
Steam, Bnet und Discord installiert,
Hätte ich dann mal weggelassen für ein paar Stunden
und dann eins nach dem anderen installiert, mit etwas Zeit dazwischen zum Beobachten.

"Bnet und Discord", wirkt irgendwie so verdächtig auf mich,
was "NMI_HARDWARE_FAILURE" betrifft.
Ergänzung ()

--Epox-- schrieb:
Memtest lasse ich später mal laufen.
Mach das mal später, wenn sich nichts ergibt hier.
Aber nimm den oben verlinkten Memtest86.
 
Zuletzt bearbeitet:
Nickel schrieb:
Ein fehlerhaftes Netzteil kann durchaus auch für Bluescreens sorgen.
Ergänzung ()


Du hättest aber erst mal für eine Weile, keine unnötigen Treiber und Tools installieren sollen,
um Software Probleme je nachdem ausschließen zu können.

Hätte ich dann mal weggelassen für ein paar Stunden
und dann eins nach dem anderen installiert, mit etwas Zeit dazwischen zum Beobachten.
Ich habe leider garkeine Austauschteile im Zugriff, das Spiel lastet die GPU weit weniger aus als Bspw in verschiedenen Benchmarks, bei denen auch Lastwechsel stattfinden, wenn ich nicht irre.

Ich habe auch weder unnötige Treiber noch Tools installiert, ich habe einen Grafikkartentreiber installiert, nachdem der Fehler mit dem von Windows selbst gewählten GPU-Treiber (welcher eine Versionsnummer älter war) ebenfalls aufgtreten ist, dieser ist laut NV der aktuellste stable Treiber für meinen Grafikchip.

Nach der Installation der Software ist nichts passiert, das System lief über Nacht mit Benchmark währrend Steam und Co an waren total stabil bis etwa gg 12 Uhr in NW der erste BS kam, ich habe dort inzwischen auch die Settings auf Low stehn was die GPU auf 50-70% load runter bringt, keine Besserung. Evt ist es einer dieser Fehler in Verbindung mit dem Nvidia Treiber, da gibts einige von im Netz in Verbindung mit dem Spiel, denn auch vorher hatte ich bei anderen Spielen nie Probleme (auch nach dem ersten Auftreten).
 
Zuletzt bearbeitet:
PROCESS_NAME: vmware-vmx.exe

STACK_TEXT:
ffffc400`6c69bb38 fffff807`2b4b417a : 00000000`00000080 00000000`004f4454 00000000`00000000 00000000`00000000 : nt!KeBugCheckEx
ffffc400`6c69bb40 fffff807`28d615b0 : 00000000`00000000 ffff8802`4d90a038 fffff807`2bc506a0 ffff8802`4d90a038 : nt!HalBugCheckSystem+0x7a
ffffc400`6c69bb80 fffff807`2b5b612e : 00000000`00000000 ffffc400`6c69bc29 ffff8802`4d90a038 fffff807`2bc506a0 : PSHED!PshedBugCheckSystem+0x10
ffffc400`6c69bbb0 fffff807`2b4b8832 : 00000000`0000003c 00000000`0000003c fffff807`2bc506a0 00000000`0000005c : nt!WheaReportHwError+0x46e
ffffc400`6c69bc90 fffff807`2b50d882 : 00000000`00000001 ffffc400`6c69bd10 00000000`00000000 fffff807`2b520130 : nt!HalHandleNMI+0x142
ffffc400`6c69bcc0 fffff807`2b402882 : ffffc400`6c3e2fb0 ffffc400`6c69bed0 00000000`00000000 00000000`00000000 : nt!KiProcessNMI+0x132
ffffc400`6c69bd10 fffff807`2b402652 : ffffc400`6c3e2fb0 00000000`00000000 4860245c`8b48a575 24748b48`68246c8b : nt!KxNmiInterrupt+0x82
ffffc400`6c69be50 fffff807`29f9200a : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiNmiInterrupt+0x212
ffffd605`e2592388 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : vmx86+0x200a


MODULE_NAME: GenuineIntel

IMAGE_NAME: GenuineIntel.sys

STACK_COMMAND: .thread ; .cxr ; kb

FAILURE_BUCKET_ID: 0x80_4F4454_GenuineIntel_NOERRREC_IMAGE_GenuineIntel.sys

OS_VERSION: 10.0.19041.1

BUILDLAB_STR: vb_release

OSPLATFORM_TYPE: x64

OSNAME: Windows 10

FAILURE_ID_HASH: {d5ef3836-2107-b7ec-b4d4-4d2ae9fc0e02}

Followup: MachineOwner
Der Rechner ist jeweils abgestürzt bei der Nutzung von VMware Workstation.
Das ist eine Virtuelle Maschine?

Der eigentliche Fehler aber hängt mit dem Prozessor zusammen.
Passt der Prozessor zum Motherboard?
Bios auf dem aktuellen Stand?
Chipsatztreiber neu installiert?
Ist der Prozessor übertaktet?
Wird der Prozessor zu warm?
Oder ist der Prozessor defekt?
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: --Epox--
Perfekt, die VM is portable, das hatte ich außer acht gelassen, sie befindet sich auf einer externen Platte.

Der eigentliche Fehler aber hängt mit dem Prozessor zusammen, sagst du:

Passt der Prozessor zum Motherboard? -> Laut Hersteller Ja
Bios auf dem aktuellen Stand? -> Ja, letztes Update von 2018
Chipsatztreiber neu installiert? -> Ja, installiert
Ist der Prozessor übertaktet? -> Nein
Wird der Prozessor zu warm? -> 40-60 Grad unter Wasserkühlung (schlechter Heatspreader bei den Skylakes)
Oder ist der Prozessor defekt? -> Beim Benchmark oder sonstigen Betrieb bisher keine Fehler festgestellt

Ich schätze aber mal, das trotzdem ein Defekt vorliegen kann, auch wenn anscheinshalber alles stabil läuft.
 
Zurück
Oben