Bluescreen Fehler 124, bitte Unterstützung bei Analyse

NutFlush

Cadet 3rd Year
Registriert
Nov. 2011
Beiträge
36
Hallo,

ich habe ein massives Problem mit unregelmäßigen Abstürzen meines Rechners. Bitte helft mir bei der Analyse der Ursachen! Danke!

Systeminfo:
CPU: AMD Athlon 64 x2 5600+ 2,81 GHz
MoBo: ASRock N68C-S UCC auf neustem BIOS Stand (1.6)
RAM: 4 GB DDR2
OS: Win7 Ultimate 64bit mit SP1

Fehlerbeschreibung:
Ich hatte (und habe) unregelmäßig Abstürze. Die letzte "wesentliche" Aktion bevor die Probleme anfingen war, daß ich ein Unicrypt-Modul (für TV) programmiert habe. Dazu waren zwei USB Kabel vom Programmiergerät mit dem PC verbunden (ein port am Mainboard & ein port an Gehäusefront). Das Kabel zur Gehäusefront war mittels USB-to-serial Adapter (Manhattan 205146) verbunden.
Ein paar Tage danach ging's los mit den Abstürzen. Rücksicherungen von diversen Backups und Wiederherstellungspunkten blieben erfolglos. Da ich vermutete, daß der USB-Port auf dem MoBo etwas abbekommen hat, habe ich das MoBo durch das oben genannte ersetzt. Leider habe ich keine Fehler-Dumps mehr aus der Zeit mit dem ersten MoBo.

Nach dem MoBo-Tausch habe ich Win7 komplett neu installiert, alle Treiber des MoBo incl. BIOS-update gemacht. Trotzdem crasht es weiterhin. Bin dann auf die Fehlerdumps aufmerksam geworden und habe diese soweit ich konnte mit WinDBG analysiert. Bin jetzt aber leider an einem Punkt, wo ich nicht weiterkomme und auch nicht erkennen kann, wo die Ursache liegt (Hardware? Treiber?).

Mein letzter Anlauf war der Versuch mittels der Software "DLL Suite" defekte bzw. fehlende Windowskomponenten zu fixen, aber das Programm stürzt auch irgendwann ab (siehe Fehlerdump).

Kann mir jemand weiterhelfen?

Hier ein Auszug aus dem Bericht mittels WinDBG:

Code:
WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: fffffa80046bc038, Address of the WHEA_ERROR_RECORD structure.
Arg3: 00000000b60a0000, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000000015, Low order 32-bits of the MCi_STATUS value.

Debugging Details:
------------------


BUGCHECK_STR:  0x124_AuthenticAMD

CUSTOMER_CRASH_COUNT:  1

DEFAULT_BUCKET_ID:  VISTA_DRIVER_FAULT

PROCESS_NAME:  DLLSuite.exe

CURRENT_IRQL:  f

STACK_TEXT:  
fffff880`009f1a08 fffff800`02c1ca3b : 00000000`00000124 00000000`00000000 fffffa80`046bc038 00000000`b60a0000 : nt!KeBugCheckEx
fffff880`009f1a10 fffff800`02de0513 : 00000000`00000001 fffffa80`046b7240 00000000`00000000 fffffa80`046b7290 : hal!HalBugCheckSystem+0x1e3
fffff880`009f1a50 fffff800`02c1c700 : 00000000`00000728 fffffa80`046b7240 fffff880`009f1db0 00000000`00000100 : nt!WheaReportHwError+0x263
fffff880`009f1ab0 fffff800`02c1c052 : fffffa80`046b7240 fffff880`009f1db0 fffffa80`046b7240 00000000`00000000 : hal!HalpMcaReportError+0x4c
fffff880`009f1c00 fffff800`02c0fe8f : 00000000`00000000 00000000`00000001 fffff880`009f1e30 00000000`00000000 : hal!HalpMceHandler+0x9e
fffff880`009f1c40 fffff800`02cce52c : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : hal!HalHandleMcheck+0x47
fffff880`009f1c70 fffff800`02cce393 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KxMcheckAbort+0x6c
fffff880`009f1db0 00000000`728c2750 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiMcheckAbort+0x153
00000000`0008ec10 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0x728c2750


STACK_COMMAND:  kb

FOLLOWUP_NAME:  MachineOwner

MODULE_NAME: hardware

IMAGE_NAME:  hardware

DEBUG_FLR_IMAGE_TIMESTAMP:  0

FAILURE_BUCKET_ID:  X64_0x124_AuthenticAMD_PROCESSOR_TLB

BUCKET_ID:  X64_0x124_AuthenticAMD_PROCESSOR_TLB

Followup: MachineOwner
---------

Herzlichen Dank im voraus!

NutFlush
 
Hanne schrieb:
Ist im BIOS "Unlock CPU Core" = disabled gestellt ?

Hi Hanne,

einen Eintrag mit exakt dieser Bezeichnung kann ich nicht finden. Aber hier vielleicht Infos, die weiterhelfen (ansonsten bitte Info, in welchem Menüpunkt dieser Eintrag stehen sollte):
- Im Prinzip habe ich alles auf default gelassen.
- Overclock Mode = Auto
- CPU Active Core Control = disabled
- Multiplier/Voltage Change = Auto
- Memory Clock = Auto
- DRAM Voltage = Auto
- Chipset Voltage = Auto
- AM2 Boost = disabled
- Cool'n'Quiet = disabled
- Secure Virtual Machine = enabled
- Share Memory = Auto
- Primary Graphics Adapter = PCI (ich habe vergessen zu schreiben, dass ich eine GeForce 6600 LE als Grafikkarte eingebaut habe)
- CPU Thermal Throttle = enabled
- CPU Quiet Fan = enabled
- Target CPU Temperature = 50° C
- Target Fan Speed = Level 9

Hilft das weiter?

Gruß,
NutFlush
 
Lade die .dmp noch einmal in WinDbg, und gib in der Kommandozeile !errec fffffa80046bc038 ein und drück [Enter], wenn ein Error-Record vorhanden ist, poste den bitte. Ein erneutes analyze -v brauchst du nicht machen.
 
Inzersdorfer schrieb:
Lade die .dmp noch einmal in WinDbg, und gib in der Kommandozeile !errec fffffa80046bc038 ein und drück [Enter], wenn ein Error-Record vorhanden ist, poste den bitte. Ein erneutes analyze -v brauchst du nicht machen.

Hi,

ich weiß nicht, ob ich alles richtig gemacht habe, aber hier ist das Resultat:
Code:
1: kd> !errec fffffa80046bc038
No export errec found

Muss ich irgendwo was einstellen, damit hierfür etwas abgespeichert wird?

Ich habe das auch bei anderen dumps ausprobiert (statt fffffa80046bc038 habe ich fffffa8004718038 oder fffffaa5044ad798 verwendet, da dieser code in der Klammer {} nach der Bugcheck Analysis steht). Gleiches Resultat. :(

Danke und Gruß,
NutFlush
 
Nein, nach !errec steht die Adresse aus Parameter 2, hier sollte der Error-Record sein, der automatisch erstellt wird, allerdings kommt es gerne vor, das Selbiger nicht mehr abgespeichert werden kann, bevor der PC heruntergefahren wurde.
 
Ganz allgemein:
Führe einen CMOS Reset durch (näheres dazu findest du im Handbuch deines Boards).
Bleiben danach die Probleme, überprüfe die Temperaturen (insbes. CPU).

Was für ein Netzteil ist eingebaut? Hättest du ein anderes NT für einen Gegentest?

Poste ein paar Screenshots von CPU-Z (Reiter Mainboard, CPU, Memory und SPD) - nach dem CMOS Reset.
 
simpel1970 schrieb:
Ganz allgemein:
Führe einen CMOS Reset durch (näheres dazu findest du im Handbuch deines Boards).
Bleiben danach die Probleme, überprüfe die Temperaturen (insbes. CPU).

Was für ein Netzteil ist eingebaut? Hättest du ein anderes NT für einen Gegentest?

Poste ein paar Screenshots von CPU-Z (Reiter Mainboard, CPU, Memory und SPD) - nach dem CMOS Reset.

1) CMOS reset kann ich machen. Was kann denn dadurch verbessert werden?

2) Temperaturen würde ich eher ausschließen, aber sicher bin ich mir natürlich nicht. Habe jetzt die Log-Funktion vom Tool "Core Temp" aktiviert. Beim letzten Absturz lagen die maximalen Temperaturen der Kerne bei 35°C und 37°C bis zum letzten Eintrag im log. Habe beim MoBo-Tausch auch den Lüfter gewechselt: Arctic Cooling Freezer 13

3) Netzteil ist das AXLE ATX PC Netzteil 450 Watt 1xPCIe 3xSATA TYPHOON

4) Was meinst du mit "CPU-Z (Reiter Mainboard, CPU, Memory und SPD)"?

5) Kann ich Bilder direkt von der Festplatte hier hochladen oder nur über z.B. photobucket?

Ich warte erst mal auf deine Antworten, bevor ich den CMOS-reset mache.

Gruß,
NutFlush
 
Zu 1) Um sicher zu gehen, dass die Probleme nicht durch ein verkorkstes Bios ausgelöst werden. Gehe aber genau nach dem Handbuch vor!
Zu 2) :daumen:
Zu 3) Hier würde ich auf jeden Fall ein anderes NT testen
Zu 4) Mit CPU-Z meine ich dieses Tool: http://www.cpu-z.de/ Im Link siehst du ein paar Screenshots und darauf die einzelnen Reiter, die Infos über die verbaute Hardware ausspucken. Hiervon die Screenshots machen
Zu 5) Screenshots am Besten mit dem windoweigenen Snipping Tool machen: http://www.drwindows.de/windows-anl...eenshots-erstellen-mit-dem-snipping-tool.html
und so hochladen: https://www.computerbase.de/forum/threads/minifaq-bilder-im-forum-einbinden.658283/
 
So,

CPU-Z habe ich mir besorgt. Ist das korrekt, daß das Programm nicht installiert wird, sondern man einfach die Datei CPUZ.EXE startet?

Warum meinst du, ich sollte ein anderes NT testen? Erscheint dir das unterdimensioniert? Ich hatte mal als Versuch alles abgestöpselt und nur Netzwerk & Maus/Tastatur eingesteckt gehabt. Dann HeavyLoad gestartet und nach einiger Zeit kam der crash.

So, werde jetzt das CMOS flashen.

Bis gleich - dann mit den screenshots.
Ergänzung ()

So, hier die screenshots nach dem CMOS-reset. Ich hatte auch den Zustand vorher dokumentiert und der einzige Unterschied ist, daß auf dem Reiter "CPU" die Core Voltage vorher bei 1,352 V und nachher bei 1,36 V war.

Hoffe, das führt zu aufschlußreichen Erkenntnissen!

Gruß,
NutFlush
Ergänzung ()

Um den Punkt Temperatur nochmal etwas genauer zu untersuchen, habe ich mit Core Temp ein log aufgezeichnet und dann mit HeavyLoad den nächsten crash produziert:

WinDBG sagt wieder:
Code:
*******************************************************************************
*                                                                             *
*                        Bugcheck Analysis                                    *
*                                                                             *
*******************************************************************************

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: fffffa8004750038, Address of the WHEA_ERROR_RECORD structure.
Arg3: 00000000b2024000, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000000175, Low order 32-bits of the MCi_STATUS value.

Debugging Details:
------------------


BUGCHECK_STR:  0x124_AuthenticAMD

CUSTOMER_CRASH_COUNT:  1

DEFAULT_BUCKET_ID:  VISTA_DRIVER_FAULT

PROCESS_NAME:  HeavyLoad.exe

CURRENT_IRQL:  f

STACK_TEXT:  
fffff880`009f1a08 fffff800`03206a3b : 00000000`00000124 00000000`00000000 fffffa80`04750038 00000000`b2024000 : nt!KeBugCheckEx
fffff880`009f1a10 fffff800`02d98513 : 00000000`00000001 fffffa80`0469d660 00000000`00000000 fffffa80`0469d6b0 : hal!HalBugCheckSystem+0x1e3
fffff880`009f1a50 fffff800`03206700 : 00000000`00000728 fffffa80`0469d660 fffff880`009f1db0 00000000`00002500 : nt!WheaReportHwError+0x263
fffff880`009f1ab0 fffff800`03206052 : fffffa80`0469d660 fffff880`009f1db0 fffffa80`0469d660 00000000`00000000 : hal!HalpMcaReportError+0x4c
fffff880`009f1c00 fffff800`031f9e8f : 00000000`02861858 00000000`00000001 fffff880`009f1e30 00000000`00000000 : hal!HalpMceHandler+0x9e
fffff880`009f1c40 fffff800`02c8652c : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : hal!HalHandleMcheck+0x47
fffff880`009f1c70 fffff800`02c86393 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KxMcheckAbort+0x6c
fffff880`009f1db0 00000000`006a5788 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiMcheckAbort+0x153
00000000`056be6c4 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0x6a5788


STACK_COMMAND:  kb

FOLLOWUP_NAME:  MachineOwner

MODULE_NAME: hardware

IMAGE_NAME:  hardware

DEBUG_FLR_IMAGE_TIMESTAMP:  0

FAILURE_BUCKET_ID:  X64_0x124_AuthenticAMD_PROCESSOR_CACHE

BUCKET_ID:  X64_0x124_AuthenticAMD_PROCESSOR_CACHE

Followup: MachineOwner

Core Temp gibt mir als letzte Kerntemperaturen 44°C & 46°C, mit einem Maximum während der Aufzeichnung von 46°C & 48°C. Das liegt doch gut im Rahmen, oder?

Fragen:
- Kann es sein, daß die Temperatur falsch gemessen wird? Macht das die CPU selber oder ein Fühler vom mainboard?
- Kann ich irgendwie messen und aufzeichnen, wie stark das Netzteil gefordert wird? Da ich nicht overclocke war ich der Meinung, daß 450 Watt mehr als ausreichend sind. Oder wieviel sollte es sein?

Gruß,
NutFlush
 

Anhänge

  • nach reset-1.PNG
    nach reset-1.PNG
    33,7 KB · Aufrufe: 246
  • nach reset-2.PNG
    nach reset-2.PNG
    19,6 KB · Aufrufe: 241
  • nach reset-3.PNG
    nach reset-3.PNG
    18,3 KB · Aufrufe: 263
  • nach reset-4.PNG
    nach reset-4.PNG
    22 KB · Aufrufe: 224
  • nach reset-5.PNG
    nach reset-5.PNG
    22,3 KB · Aufrufe: 269
Nach dem CMOS Reset hast du die Uhrzeit und das Datum im Bios neu einstellen müssen?

450W ansich sollten ausreichend sein. Allerdings sollte es dann auch ein Marken-NT sein. Dem von dir verbauten NT würde ich da nicht unbedingt 100%ig vertrauen.

Teste zur Sicherheit ein anderes NT.
 
simpel1970 schrieb:
Nach dem CMOS Reset hast du die Uhrzeit und das Datum im Bios neu einstellen müssen?

450W ansich sollten ausreichend sein. Allerdings sollte es dann auch ein Marken-NT sein. Dem von dir verbauten NT würde ich da nicht unbedingt 100%ig vertrauen.

Teste zur Sicherheit ein anderes NT.

Ja, nach dem CMOS-Reset habe ich die Uhrzeit & Datum neu eingestellt.

Hm, ein anderes Netzteil kann ich leider nicht mal so eben auftreiben und einbauen. Gibt's keine Möglichkeit, um das Netzteil irgendwie zu testen ob dort die Ursache liegt? Hast du denn Grund zur Annahme, daß die Stromversorgung das Problem ist?

Gruß,
NutFlush
 
HisN schrieb:

Danke für den Hinweis. Aber als Nicht-Overclocker sagt mir das, was ich bei dem link finde leider nicht viel:
0x124 = increase/decrease QPI/VTT first, if not increase/decrease vcore...have to test to see which one it is

Es wäre nett, wenn du mir sagen könntest, ob ich im BIOS oder sonst wo etwas verändern muss und vor allen Dingen was und dann in welche Richtung. Möchte mir hier nicht die CPU oder andere Bausteine verbrutzeln.

Besten Dank,
NutFlush
 
Das ist tatsächlich das Bios.
VTT und QPI sind die gebräuchlichen Bezeichnungen für den Speicher-Controller einer aktuellen Intel-CPU. Da die Spannung ein wenig nach unten oder/und oben korrigieren und schauen ob es hilft.
Wenn nicht dann die Core-Spannung der CPU (Vcore) nehmen. Genau das gleiche Spiel.
Nicht gleich mit der groben Kelle, sondern nur ein oder zwei Klicks.

Worauf ich eigentlich hinaus wollte: Suche benutzen vor dem Eröffnen eines neuen Threads^^
 
Zuletzt bearbeitet:
HisN schrieb:
Das ist tatsächlich das Bios.
VTT und QPI sind die gebräuchlichen Bezeichnungen für den Speicher-Controller einer aktuellen Intel-CPU. Da die Spannung ein wenig nach unten oder/und oben korrigieren und schauen ob es hilft.
Wenn nicht dann die Core-Spannung der CPU (Vcore) nehmen. Genau das gleiche Spiel.
Nicht gleich mit der groben Kelle, sondern nur ein oder zwei Klicks.

OK! Ich habe Memtest86+ laufen lassen und keine Probleme gehabt. Würdest du dann eher bei der CPU-Spannung anfangen statt beim Speicher?

Folgende Punkte habe ich im BIOS gefunden (aktuelle Einstellung in Klammern):
a) Multiplier/Voltage Change (Auto)
b) DRAM Voltage (Auto)
c) Chipset Voltage (Auto)
d) AM2 Boost (Disabled)
e) CPU Thermal Throttle (Enabled)

Wo drehe ich dann am sinnvollsten zuerst?
Ist es besser die Spannung zu steigern oder zu senken? Ich hätte jetzt vermutet, daß ein solcher Fehler bei ungetunten Rechnern eher auf eine Abweichung in einer bestimmten Richtung hindeutet.
Woran merke ich, daß ich an eine für die Bauteile kritische Grenze komme? Kannst du mir Zahlenwerte für max/min geben (gerne auch einen link auf entsprechende postings... :) )?



Merci,
NutFlush
 
Ich bin natürlich ein bisschen Banane, indem ich ignoriert habe dass Du gar keinen Intel, sondern einen AMD fährst. Sorry mein Fehler.
Schaden kann ein Versuch trotzdem nicht.
Ich hab bei AMD leider eine Platte. Dazu findest Du bestimmt was im AMD-OC-Unterforum. Meistens steht auch ein Maximalwert auf der Packung der CPU an der Seite drauf.
 
Bei AMD-Systemen sollte man OHNE OC nichts an den Spannungswerten der NB / CPU ändern -
 
Zurück
Oben