RX 7900XTX Nitro + WHEA Fehler und zufällige Neustarts

Lerinol72 schrieb:
Wurde beides bereits gemacht. BIOS und Chipsatz sind beide aktuell, zudem sind die Chipsatztreiber einmal über AMD und MSI runtergeladen worden.
Anscheinend besteht irgend ein Konflikt mit dem Adrenalin und mit dem Chipsatztreiber? Ist aber nur mehr oder weniger raten
Evtl. Windows neu aufsetzen, wenn es keine allzu großen Umstände macht.
Und die Treiber von MSI musst du nicht laden, sind oft nicht die aktuellsten

Lerinol72 schrieb:
Aber wenn ich diesen im Dual Channel betreibe auf 2133mhz und das Problme dennoch auftritt, kann es doch unmöglich der RAM sein oder?
Denke nicht.
Aber du kannst es einfach mit einem Riegel probieren. Wenn das immernoch noch abschmiert, ist es ganz sicher nicht der RAM.
 
Zuletzt bearbeitet:
Lerinol72 schrieb:
Bei mäßigem OC nach paar Stunden erst.
Wenn man eine Grafikkarte in einem OC System testet, dann natürlich nur mit 100% funktionierendem Profil oder in Default. Ich denke, das sollte klar sein.
 
  • Gefällt mir
Reaktionen: wuest3nfuchs
Lerinol72 schrieb:
Aber wenn ich diesen im Dual Channel betreibe auf 2133mhz und das Problme dennoch auftritt, kann es doch unmöglich der RAM sein oder?
Ergänzung ()


Ja genau so ist es! Aber ohne Adrenalin kann ich die Karte ja nicht übertakten und ich denke MSI Afterburner ist da nicht die beste Lösung….
Warum nutzt du nicht MCT gibs beim igorslab...
 
Who dares wins !

Und unter uns gesagt, wer übertaktet denn bei den Strompreisen anstatt das powerlimit runterzudrehn , heizt du damit?

Bei meiner nitro war auch ein problem und ja es war der RAM .klingt komisch is aber so.
 
GOOFY71 schrieb:
Wenn man eine Grafikkarte in einem OC System testet, dann natürlich nur mit 100% funktionierendem Profil oder in Default. Ich denke, das sollte klar sein.

wuest3nfuchs schrieb:
Who dares wins !

Und unter uns gesagt, wer übertaktet denn bei den Strompreisen anstatt das powerlimit runterzudrehn , heizt du damit?

Bei meiner nitro war auch ein problem und ja es war der RAM .klingt komisch is aber so.
Brauche die extra Leistung für 4K Spiele und der PC läuft konstant auf 100% Lüfterdrehzahl, so warm wird der garnicht 😂

Was hast du denn bei dir am RAM fürs Einstellungen geändert genau?

Memtest86 läuft über die Nacht nämlich fehlerfrei….
 
Die Hardware-IDs in deinem Startpost weisen auf…. ein HP Headset hin? Also laut IDs HyperX Cloud Wireless
Hast das mal entfernt zum Testen? Ich weiß, hört sich komisch an.

Alternativ: Alle drei PCIe Buchsen am Netzteil verwendet? Auch beide extra Stromanschlüsse für die CPU?
 
Das ist alles recht Mühselig. Bios auf default stellen mit nur 2 Ram Modulen in den richtigen Slots.
4x8GB bei 4000 Mhz ist zu 99% nicht stabil. Auch macht es keinen Sinn FLCK auf 1800 laufen zu lassen und den Speicher bei 2000.
Solange das nicht stabil läuft macht es keinen Sinn das Problem mit dem Graka anzugehen.
 
Am4 Erfahrung bei mir war immer 3600mhz gehen, mit 2 Modulen meistens, alles darüber eher weniger. Bei 4 Modulen maximal 3200mhz. Du bist also weit außerhalb, der normalen Range und ich wette, da liegt auch der Fehler, hoffen wir mal nicht das die CPU durch das oc jetzt einen Schaden im ram Controller hat.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: wuest3nfuchs
LadykillerTHG schrieb:
Am4 Erfahrung bei mir war immer 3600mhz gehen, mit 2 Modulen meistens, alles darüber eher weniger. Bei 4 Modulen maximal 3200mhz. Du bist also weit außerhalb, der normalen Range und ich wette, da liegt auch der Fehler, hoffen wir mal nicht das die CPU durch das oc jetzt einen Schaden im ram Controller hat.

BeezleBug schrieb:
Das ist alles recht Mühselig. Bios auf default stellen mit nur 2 Ram Modulen in den richtigen Slots.
4x8GB bei 4000 Mhz ist zu 99% nicht stabil. Auch macht es keinen Sinn FLCK auf 1800 laufen zu lassen und den Speicher bei 2000.
Solange das nicht stabil läuft macht es keinen Sinn das Problem mit dem Graka anzugehen.


Dann frage ich mich aber, wieso mein System mit der 6900XT über Jahre stabil lief, obwohl die GPU, CPU und der RAM aufs maximale übertaktet waren….
Ergänzung ()

andimo3 schrieb:
Die Hardware-IDs in deinem Startpost weisen auf…. ein HP Headset hin? Also laut IDs HyperX Cloud Wireless
Hast das mal entfernt zum Testen? Ich weiß, hört sich komisch an.

Alternativ: Alle drei PCIe Buchsen am Netzteil verwendet? Auch beide extra Stromanschlüsse für die CPU?

Ja ich habe ein HyperX Cloud 3 Wireless, dieses hab ich auch eben absteckt, aber der Fehler tritt trotzdem auf. ( Du meintest doch den Treiber Fehler oder welchen der Fehler vom Startpost genau? )

Und bei der GPU und CPU wurden alle Steckplätze des PSU verwendet.
 
Lerinol72 schrieb:
Brauche die extra Leistung für 4K Spiele und der PC läuft konstant auf 100% Lüfterdrehzahl, so warm wird der garnicht 😂

Was hast du denn bei dir am RAM fürs Einstellungen geändert genau?

Memtest86 läuft über die Nacht nämlich fehlerfrei….
Ok 4k is ja ne ausnahme.

Ganz ehrlich bin von 3800mt/s auf 3200mt/s seitdem lüppts.

allerdings hab ich einen lustigen bug in win10 der sich bei der C: SSD samsung 850evo alle 7 Tage erneut auftaucht.den hat ich auch schin zuvor mit einee anderen cpu ram etc.
...und zwar geht die SSD dann auf 100% wobei nur ein paar KB oder MB geschrieben werden also echt strange behave.
Aber das system wurde auch seit 2018 nie neu aufgesetzt ,wird doch langsam Zeit.
 
Ok. Ich schiess mal ins Blaue...
deine CPU kam mit der Bandbreite und dem "Stress" der 6900xt klar...
nun hast du nen 7900 XTX, die braucht mehr Bandbreite und stresst deine CPU mehr (PCIe Lanes) und das führt dazu, das deine CPU instabil wird...aus welchen Gründen auch immer.
Wenn die GPU und das System ohen OC läuft...well...lass es so laufen. wenn es dich stört...neue CPU testen..
 
  • Gefällt mir
Reaktionen: Knobi Wahn
Der pc war wohl nur so weit stabil,bis du gewechselt hast. Die Mehrleistung durch die neue Grafikkarte, kann sehr wohl dazu führen, das es jetzt eher Fehler gibt. Aber wenn du sagst ne isses nicht, wird es dein Problem, so nicht lösen. OC kann Fehler machen,die es normal nicht gibt.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Knobi Wahn
LadykillerTHG schrieb:
Am4 Erfahrung bei mir war immer 3600mhz gehen, mit 2 Modulen meistens, alles darüber eher weniger. Bei 4 Modulen maximal 3200mhz. Du bist also weit außerhalb, der normalen Range und ich wette, da liegt auch der Fehler, hoffen wir mal nicht das die CPU durch das oc jetzt einen Schaden im ram Controller hat.

wuest3nfuchs schrieb:
Ok 4k is ja ne ausnahme.

Ganz ehrlich bin von 3800mt/s auf 3200mt/s seitdem lüppts.

allerdings hab ich einen lustigen bug in win10 der sich bei der C: SSD samsung 850evo alle 7 Tage erneut auftaucht.den hat ich auch schin zuvor mit einee anderen cpu ram etc.
...und zwar geht die SSD dann auf 100% wobei nur ein paar KB oder MB geschrieben werden also echt strange behave.
Aber das system wurde auch seit 2018 nie neu aufgesetzt ,wird doch langsam Zeit.

LadykillerTHG schrieb:
Sie war wohl nur so weit stabil,bis du gewechselt hast. Die Mehrleistung durch die neue Grafikkarte, kann sehr wohl dazu führen, das es jetzt eher Fehler gibt. Aber wenn du sagst ne isses nicht, wird es dein Problem so nicht lösen OC kann Fehler machen die es normal nicht gibt.

Dann probiere ich mal 3200 und 1600 FLCK mit manuellem Timings (ohne XMP) und schau, ob der Fehler nochmal auftritt.


Mir ist vorhin bei dem letzten Absturz noch Folgender Eintrag aufgefallen, welcher neu ist:

Fehler beim Laden des Treibers \Driver\WUDERd. Gerät: RO0T\DISPLAY\0000
Status: 0xC0000365

Könnte dies auf eine möglicherweise defekte bzw. fehlerhafte GPU hindeuten?
 
Zuletzt bearbeitet:
1. Hardware-Informationen

• Prozessor (CPU): 9 5900x

• Arbeitsspeicher (RAM): Corsair Vengeance 4000 MHz (4 x 8GB)

• Mainboard: MSI MPG x570s

• Netzteil: BeQuiet Straight Power 11 1000W

• Grafikkarte: 7900XTX Nitro+ (vorher 6900XT)

• Speicher: Samsung 980 Pro und 870 QVO





2. Problem-Beschreibung

Nach der Aufrüstung meines PCs mit der neuen GPU treten sporadische Neustarts auf. Der Bildschirm wird plötzlich schwarz, der PC fährt nicht korrekt herunter, sondern startet direkt neu.


Die Neustarts treten nur auf, wenn der PC vorher unter Last war, dann stürztet er nach dem Beenden dieser im Leerlauf oftmals ne Stunde später ab. Wenn ich den PC im idle betreibe, funktioniert er problemlos…


Die ersten Tage nach dem GPU-Einbau verliefen fehlerfrei. Auffällig war jedoch eine Häufung von WHEA-Fehlern während der GPU-Übertaktung, die nach etwa 30 Minuten zuverlässig zu einem Neustart führten.

Nach dem Deaktivieren des OC traten die Neustarts seltener, aber weiterhin unregelmäßig auf und vorallem nicht reproduzierbar …


Hinweis: Bei vielen waren die WHEA-Fehler nach dem Wechsel auf eine neue GPU Treiberbedingt bzw. auch durch eine defekte Grafikarte, sprich das Problem war mit einer NVDIA-Karte bei vielen weg….



Ein paar genauere Infos zu den Fehlern:


In Bluescreen Viewer:


Nichts!

Im Ereignisprotokoll:

05.03.2025 23:40:31
Das System wurde zuvor am ‎05.‎03.‎2025 um 23:16:47 unerwartet heruntergefahren.


05.03.2025 23:40:26
Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.


06.03.2025 00:39:03
Schwerwiegender Hardwarefehler. [WHEA-Fehler-ID: 18]

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 22 —>( Diese Zahl variiert und ist immer anders!)

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.


06.03.2025 00:39:24
Gemeldet von Komponente: Prozessorkern [WHEA-Fehler-ID: 18]
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 5 —>( Hier steht sehr häufig eine 0)


06.03.2025 00:47:26
Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.


06.03.2025 00:47:31
Das System wurde zuvor am ‎06.‎03.‎2025 um 00:44:58 unerwartet heruntergefahren.



3. Bereits unternommene Schritte

1. Treiber und Software:

• Grafiktreiber-Entfernung: Deinstallation der Grafiktreiber mit Display Driver Uninstaller (DDU).

• AMD-ONLY-Treiber: Installation nur der offiziellen AMD-Treiber ohne Zusatzsoftware.

• Windows zurückgesetzt: Durchführung eines System-Resets.


2. Hardware-Überprüfung:

• Kabelverbindungen: Kontrolle aller internen Kabel auf festen Sitz und Schäden.

• GPU an drei separate Kabel angeschlossen und die CPU am zwei

• Arbeitsspeicher-Test: Durchführung eines Memtest86 zur Fehlerüberprüfung des RAMs.

• CMOS-Reset: Rücksetzen des BIOS auf Standardeinstellungen.


3. BIOS- und Übertaktungseinstellungen:

• Übertaktung deaktiviert: Deaktivierung von PBO und CPO.

• Curve Optimizer: Einstellung auf +15.

• C-States deaktiviert: Deaktivierung für Kerne und Infinity Fabric.

• Fixierte VCore/Taktfrequenz: VCore auf 1,25 V und Taktfrequenz auf 4 GHz festgelegt.


4. Komponenten-Tests:

• GPU- und Netzteil-Tests: Belastungstests über mehrere Stunden ohne Fehler.

• Netzteil-Wechsel: Test mit einem BeQuiet 850W Netzteil.

• XMP-Profil deaktiviert: RAM im Dual-Channel-Modus ohne XMP-Profil betrieben. Memtest86 ganze Nacht laufen lassen, ohne Probleme.

• RAM auf 3200 und 1600FLCK laufen lassen mit manuellen Timings.


5. Speicheranalyse:

• Festplattenprüfung: Analyse mit CrystalDiskInfo auf mögliche Fehler.


6. Temperaturüberwachung:

• Monitoring: Überwachung der Temperaturen mit HWINFO.





Schonmal Danke für Vorschläge, wie ich das System bzw. die GPU stabil bekomme. ;)
 
Lerinol72 schrieb:
• Arbeitsspeicher (RAM): Corsair Vengeance 4000 MHz (4 x 8GB)
Hast du FCLK=MCLK=2000 MHz eingestellt?
Das führt zu diesem Fehlerbild. Du kannst froh sein, wenn der Speichercontroller 1900 MHz schafft. Ich würde es erstmal mit 1800 bis 1866 MHz versuchen.
 
  • Gefällt mir
Reaktionen: Azghul0815
Das ist doch Käse...
Teste eine andere CPU...war im alten Thread schon den Konsens.
Die GPU zieht mehr last, deine CPU word stärker belastet und wirft Fehler.

Also andere CPU testen. Rest hast ja schon versucht....
Ergänzung ()

AMD-Flo schrieb:
Ich würde es erstmal mit 1800 bis 1866 MHz versuchen
Fehler tritt anscheinend auch nach CMOS Reset und 2133mt/s auf.
 
  • Gefällt mir
Reaktionen: AMD-Flo
AMD-Flo schrieb:
Hast du FCLK=MCLK=2000 MHz eingestellt?
Das führt zu diesem Fehlerbild. Du kannst froh sein, wenn der Speichercontroller 1900 MHz schafft. Ich würde es erstmal mit 1800 bis 1866 MHz versuchen.

Nein, ich habe den RAM immer im XMP geladen. Ich habe aber diesen schon lange ausgeschlossen als Ursache, aufgrund des Fehlerfreien Memtest86 Ergebnisses und, da ich den RAM schon auf 3200 MHZ mit FLCK=MLCK=1600 betrieben habe, in Dual- und Singlechannel, ohne XMP bzw. auf 2133 mhz …
 
Zurück
Oben