- Registriert
- Juni 2019
- Beiträge
- 8.335
Guten Abend liebe Community,
Ich wende mich nun doch einmal umfangreich an die allgemeine Expertise hier im Forum, da ich mir langsam keinen Rat mehr weiß und evtl. das offensichtliche übersehe. Aber von beginn an. (wird leider etwas dauern alles zu beschreiben)
Das System um das es hier geht ist folgendes:
CPU: AMD Ryzen Threadripper 3970X (kein overclocking)
Mainboard: Gigabyte Aorus Master TRX40
GPU: Radeon RX 6900 XT (kein Overclocking) + Radeon Pro WX3200
RAM: 128 GB (8x16GB) Crucial Balistix 3000 MT/s CL15
Netzteil: Corsair AX1600i
Soundkarte: Creative SoundblasterX AE-7
Speicher: 3x HDD (2,4,8 TB) 1x AIC SSD Corsair Neutron NX500 (400GB)
In dieser Konfiguration lief das System seit Februar 2019 absolut stabil und es gab keinerlei Probleme.
aus Platzmangel für schnellen SSD Speicher habe ich nun bereits Anfang August 3 nvme SSDs eingebaut. (2x 1TB +1 x 2TB Samsung 970 EVO Plus)
Die drei M.2 Slots des Mainboards sind vorher seit dem kauf Anfang 2019 nicht benutzt worden. Aufgrund von Speichermangel sollte die AIC SSD nun durch die genannten drei nvme M.2 SSDs ersetzt werden. Nach dem Einbau der SSDs sind alle drei sofort erkannt worden und die Installation der aktuellsten nvme Treiber (direkt von Samsung) konnte durchgeführt werden. Die aktuellste Firmware war bereits installiert und auch die Windows-Installation vorher verlief ohne Probleme.
Leider tritt seit dem Einbau immer wieder der gleiche Fehler auf , welcher das System spontan deaktiviert. Dabei handelt es sich nicht um einen blitz-Shutdown wie man ihn von Stromausfällen kennt, sondern einen langsameren Shutdown. Der einzige Hinweis auf den Absturz findet sich in der Windows Ereignisanzeige:
"Ereignis 56" , Application Popup
ACPI
15
Bei diesen Abstürzen verliert das System zunächst sämtlichen Ton, bleibt aber völlig normal benutzbar. Im Taskmanager liegt zeitgleich kurz auf allen installierten Festplatten und SSDs eine schreiblast an (zurückschreiben des Caches auf die Festplatten vielleicht?) und dann geht das System ohne abschaltbildschirm einfach aus ohne Fehlermeldung oder Bluescreen. Zwischen dem Ausfall des Tons und dem ausgehen des Systems vergehen ca. 5-10 Sekunden. Anschließend lässt es sich normal wieder einschalten und funktioniert normal bis dieser Fehler erneut auftritt. Daten oder fortschritt verliere ich bei diesem gesamten Vorgang nicht.
Die Zeitpunkte des Auftretens dieses Fehlers sind völlig willkürlich können von zwei mal binnen 15 Minuten bis einmal in zwei tagen schwanken.
Auch spielt die Anwendung oder systemlast keine rolle. Der Absturz tritt auf im Leerlauf, aber auch nach stundenlanger Volllast bei Computing oder Gamingaufgaben mit mäßiger gesamtlast.
Um die Ursache einzugrenzen habe ich jede andere Hardwarecomponente auf Stabilität und Funktionalität geprüft. Alle Tests wurden bestanden.
Ich habe getestet:
-aktuellste BIOS Version aufgespielt, System lief aber auch mit alter Version stabil
-Die CPU: vor SSD-Einbau dauerlast über Tage, absolut stabil, egal ob mit oder ohne PBO und Single Core oder alle 64 Threads unter Volllast
-GPU: Im dauertest nie auffällig gewesen, beide karten laufen ohne Probleme.
-Netzteil: dank 1600 W eigentlich kein Problem, dennoch CPU (PBO 415+W) und beide GPUs (ges. nochmal 400 W) dauerlast über viele stunden stabil, power Spikes bis 1200 W, weit unterhalb der 1600W Kapazitätsgrenze, kein auslösen der Schutzschaltungen oder abstürze vor oder nach dem Einbau der SSDs.
-soundkarte: System Stabilität mit und ohne getestet, in keinem fall bedenklich oder auffällig
- Windows und alle Programme bis auf Davinci Resolve und spiele Bibliotheken auf SATA SSD installiert, abstürze traten auch auf obwohl nur minimale Last an den nvme SDDs anlag
-SMART werte der drei SSDs überprüft und Scan mit Samsung Magican durchgeführt: keine Auffälligkeiten Leistungsdaten entsprechen ebenfalls vorgaben. Abstürze sind weiterhin zufällig, egal ob SSDs starker, mittlerer oder geringer/keiner Belastung ausgesetzt sind.
-RAM mit Hilfe von MEMTST86 auf Instabilitäten geprüft. Sowohl unter JEDEC als auch XMP Timings kein einziger Fehler im Test mit vier kompletten Durchläufen.
Das einzige was nicht final ausgeschlossen werden kann, ist dass die Anschlüsse des Mainboards irgendetwas mit den Abstürzen zutun hatten, da diese bis zum Kauf dieser SSDs nicht benutzt worden sind. Falls der Fehler im UEFI liegt dann existiert er länger als ein Jahr und tritt auf allen UEFI-Versionen des Boards auf.
Bei einer Umfangreichen Onlinesuche zu speziell diesem Absturz mit diesem Absturzbericht gibt es eine leichte Tendenz, dass dieses Problem besonders bei Systemen mit Gigabyte Mainboard (AMD AM4, X399, TRX40, Intel Z und B chipätze der letzten jahre (300er 400er und 500er) und Samsung 970 Evo plus SSDs auftritt.
In folge dieser Ereignisse und der recherche habe ich die drei SSDs zurückgeschickt um erstmal auf der SATA SSD von 2015 (Kingston HyerX 240 GB) ein minimalsetup zu betreiben damit der PC benutzbar bleibt und zu schauen ob der Fehler nun immer noch auftritt. Diese SSD hat schon meine alte x99 Plattform von ende 2015 bis Februar 2019 begleitet und hat nie Probleme verursacht.
Doch leider tritt der oben beschriebene Fehler, welcher seit Installation der 3 M.2 SSDs zum ersten mal auftrat, nun weiterhin auf und verschwindet nicht mehr, obwohl das System nun wieder wie vor dem Einbau ist, mit dessen Setup es fehlerfrei funktionierte.
Neuinstallationen von Windows helfen leider auch nicht, also habe ich versucht auf Linux auszuweichen um dort evtl. keine Abstürze mehr zu haben, diese kamen auch in den wenigen stunden in denen ich mich an Manjaro versucht habe nicht mehr vor. Problem ist aber dass bestimmte Treiberfeatures der Radeon Pro Software und meine Soundkarte unter Linux nicht funktionieren, weshalb ein umstieg nicht möglich ist.
Da das Problem weiterhin besteht gehen mir nun langsam die Ideen aus ob es nun ein Hard, oder software problem ist. An windosw 11 hab ich mich noch nicht herangetraut und diese Seltsamen, nicht reproduzierbaren Soft-crashes scheinen auch erstmal nicht an der Hardware zu liegen.
Die Sache ist dass das Mainboard und dessen UEFI so ziemlich das einzige ist was ich nicht ausschließen kann, doch sollte ein 600 Euro Board nach knapp 3 Jahren fehlerfreien Betriebs wirklich kaputt gehen, und das einfach so?
Ich möchte auch ohne Garantie bei dieser teuren Hardware nicht auf verdacht anfangen irgendwelche dinge auszutauschen solange die Ursache nicht zweifelsfrei identifiziert ist.
Ich hoffe hier sieht einer noch einen weiteren Ansatz was ich versuchen kann, so wie es jetzt ist ist es Ziemlich belastend. Falls noch Informationen für bestimmte Lösungsvorschläge fehlen bitte einfach fragen!
Mit freundlichen Grüßen
Philipp/PS828
Ich wende mich nun doch einmal umfangreich an die allgemeine Expertise hier im Forum, da ich mir langsam keinen Rat mehr weiß und evtl. das offensichtliche übersehe. Aber von beginn an. (wird leider etwas dauern alles zu beschreiben)
Das System um das es hier geht ist folgendes:
CPU: AMD Ryzen Threadripper 3970X (kein overclocking)
Mainboard: Gigabyte Aorus Master TRX40
GPU: Radeon RX 6900 XT (kein Overclocking) + Radeon Pro WX3200
RAM: 128 GB (8x16GB) Crucial Balistix 3000 MT/s CL15
Netzteil: Corsair AX1600i
Soundkarte: Creative SoundblasterX AE-7
Speicher: 3x HDD (2,4,8 TB) 1x AIC SSD Corsair Neutron NX500 (400GB)
In dieser Konfiguration lief das System seit Februar 2019 absolut stabil und es gab keinerlei Probleme.
aus Platzmangel für schnellen SSD Speicher habe ich nun bereits Anfang August 3 nvme SSDs eingebaut. (2x 1TB +1 x 2TB Samsung 970 EVO Plus)
Die drei M.2 Slots des Mainboards sind vorher seit dem kauf Anfang 2019 nicht benutzt worden. Aufgrund von Speichermangel sollte die AIC SSD nun durch die genannten drei nvme M.2 SSDs ersetzt werden. Nach dem Einbau der SSDs sind alle drei sofort erkannt worden und die Installation der aktuellsten nvme Treiber (direkt von Samsung) konnte durchgeführt werden. Die aktuellste Firmware war bereits installiert und auch die Windows-Installation vorher verlief ohne Probleme.
Leider tritt seit dem Einbau immer wieder der gleiche Fehler auf , welcher das System spontan deaktiviert. Dabei handelt es sich nicht um einen blitz-Shutdown wie man ihn von Stromausfällen kennt, sondern einen langsameren Shutdown. Der einzige Hinweis auf den Absturz findet sich in der Windows Ereignisanzeige:
"Ereignis 56" , Application Popup
ACPI
15
Bei diesen Abstürzen verliert das System zunächst sämtlichen Ton, bleibt aber völlig normal benutzbar. Im Taskmanager liegt zeitgleich kurz auf allen installierten Festplatten und SSDs eine schreiblast an (zurückschreiben des Caches auf die Festplatten vielleicht?) und dann geht das System ohne abschaltbildschirm einfach aus ohne Fehlermeldung oder Bluescreen. Zwischen dem Ausfall des Tons und dem ausgehen des Systems vergehen ca. 5-10 Sekunden. Anschließend lässt es sich normal wieder einschalten und funktioniert normal bis dieser Fehler erneut auftritt. Daten oder fortschritt verliere ich bei diesem gesamten Vorgang nicht.
Die Zeitpunkte des Auftretens dieses Fehlers sind völlig willkürlich können von zwei mal binnen 15 Minuten bis einmal in zwei tagen schwanken.
Auch spielt die Anwendung oder systemlast keine rolle. Der Absturz tritt auf im Leerlauf, aber auch nach stundenlanger Volllast bei Computing oder Gamingaufgaben mit mäßiger gesamtlast.
Um die Ursache einzugrenzen habe ich jede andere Hardwarecomponente auf Stabilität und Funktionalität geprüft. Alle Tests wurden bestanden.
Ich habe getestet:
-aktuellste BIOS Version aufgespielt, System lief aber auch mit alter Version stabil
-Die CPU: vor SSD-Einbau dauerlast über Tage, absolut stabil, egal ob mit oder ohne PBO und Single Core oder alle 64 Threads unter Volllast
-GPU: Im dauertest nie auffällig gewesen, beide karten laufen ohne Probleme.
-Netzteil: dank 1600 W eigentlich kein Problem, dennoch CPU (PBO 415+W) und beide GPUs (ges. nochmal 400 W) dauerlast über viele stunden stabil, power Spikes bis 1200 W, weit unterhalb der 1600W Kapazitätsgrenze, kein auslösen der Schutzschaltungen oder abstürze vor oder nach dem Einbau der SSDs.
-soundkarte: System Stabilität mit und ohne getestet, in keinem fall bedenklich oder auffällig
- Windows und alle Programme bis auf Davinci Resolve und spiele Bibliotheken auf SATA SSD installiert, abstürze traten auch auf obwohl nur minimale Last an den nvme SDDs anlag
-SMART werte der drei SSDs überprüft und Scan mit Samsung Magican durchgeführt: keine Auffälligkeiten Leistungsdaten entsprechen ebenfalls vorgaben. Abstürze sind weiterhin zufällig, egal ob SSDs starker, mittlerer oder geringer/keiner Belastung ausgesetzt sind.
-RAM mit Hilfe von MEMTST86 auf Instabilitäten geprüft. Sowohl unter JEDEC als auch XMP Timings kein einziger Fehler im Test mit vier kompletten Durchläufen.
Das einzige was nicht final ausgeschlossen werden kann, ist dass die Anschlüsse des Mainboards irgendetwas mit den Abstürzen zutun hatten, da diese bis zum Kauf dieser SSDs nicht benutzt worden sind. Falls der Fehler im UEFI liegt dann existiert er länger als ein Jahr und tritt auf allen UEFI-Versionen des Boards auf.
Bei einer Umfangreichen Onlinesuche zu speziell diesem Absturz mit diesem Absturzbericht gibt es eine leichte Tendenz, dass dieses Problem besonders bei Systemen mit Gigabyte Mainboard (AMD AM4, X399, TRX40, Intel Z und B chipätze der letzten jahre (300er 400er und 500er) und Samsung 970 Evo plus SSDs auftritt.
In folge dieser Ereignisse und der recherche habe ich die drei SSDs zurückgeschickt um erstmal auf der SATA SSD von 2015 (Kingston HyerX 240 GB) ein minimalsetup zu betreiben damit der PC benutzbar bleibt und zu schauen ob der Fehler nun immer noch auftritt. Diese SSD hat schon meine alte x99 Plattform von ende 2015 bis Februar 2019 begleitet und hat nie Probleme verursacht.
Doch leider tritt der oben beschriebene Fehler, welcher seit Installation der 3 M.2 SSDs zum ersten mal auftrat, nun weiterhin auf und verschwindet nicht mehr, obwohl das System nun wieder wie vor dem Einbau ist, mit dessen Setup es fehlerfrei funktionierte.
Neuinstallationen von Windows helfen leider auch nicht, also habe ich versucht auf Linux auszuweichen um dort evtl. keine Abstürze mehr zu haben, diese kamen auch in den wenigen stunden in denen ich mich an Manjaro versucht habe nicht mehr vor. Problem ist aber dass bestimmte Treiberfeatures der Radeon Pro Software und meine Soundkarte unter Linux nicht funktionieren, weshalb ein umstieg nicht möglich ist.
Da das Problem weiterhin besteht gehen mir nun langsam die Ideen aus ob es nun ein Hard, oder software problem ist. An windosw 11 hab ich mich noch nicht herangetraut und diese Seltsamen, nicht reproduzierbaren Soft-crashes scheinen auch erstmal nicht an der Hardware zu liegen.
Die Sache ist dass das Mainboard und dessen UEFI so ziemlich das einzige ist was ich nicht ausschließen kann, doch sollte ein 600 Euro Board nach knapp 3 Jahren fehlerfreien Betriebs wirklich kaputt gehen, und das einfach so?
Ich möchte auch ohne Garantie bei dieser teuren Hardware nicht auf verdacht anfangen irgendwelche dinge auszutauschen solange die Ursache nicht zweifelsfrei identifiziert ist.
Ich hoffe hier sieht einer noch einen weiteren Ansatz was ich versuchen kann, so wie es jetzt ist ist es Ziemlich belastend. Falls noch Informationen für bestimmte Lösungsvorschläge fehlen bitte einfach fragen!
Mit freundlichen Grüßen
Philipp/PS828