BSOD wenn 2. eingebaute SSD belastet wird

Shynara

Newbie
Registriert
Feb. 2019
Beiträge
6
Hallo zusammen,

ich habe mir eine weitere SSD (Crucial MX500 2,5Zoll) als Ergänzung für mein Windows 7 BS gekauft.
Ziel ist, die SSD für Games wie Path of Exile tauglich zu machen, um Ladezeiten zu minimieren.
Sie soll nicht zum booten genutzt werden.
PC Konfiguration: s. Anhang (speccy)
Ergänzung:
Netzteil: be quiet! System Power 7 Modell: BQ-SU7 450W
Lüfter: 120x120x25mm Xigmatek Lüfter schwarz BULK


Wie bin ich vorgegangen:
1.) SSD an Netzteil / Mainboard angeschlossen
2.) SSD via EaseUS Partition Master 13.0 eingerichtet (Partition / Laufwerksbuchstabe)
3.) Game-Ordner Path of Exile von der HDD -> SSD kopiert
4.) Game gestartet, eingeloggt in Account, eingeloggt ins Spiel => 1. BSOD

*** STOP 0x0000001e (0x0000000000000000, 0x0000000000000000, 0x0000000000000000, 0x0000000000000000)

5.) Game-Ordner von SSD gelöscht => 2. BSOD
6.) Game von Website runtergeladen => 3. BSOD (allerdings erst nach einigen Minuten, ca. 800mb Download bis dahin)
7.) Im Gerätemanager unbenutzte Treiber entfernt
8.) Ereignisanzeige von Windows geöffnet & nach Fehlerursache gesucht
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x0000001e (0x0000000000000000, 0x0000000000000000, 0x0000000000000000, 0x0000000000000000). Ein volles Abbild wurde gespeichert in: C:\Windows\MEMORY.DMP. Berichts-ID: 022719-24367-01.

9.) Tools zum öffnen der Dump-Datei gesucht => nicht fündig geworden
10.) WhoCrashed installiert und Analyse laufen lassen (Ergebnis s. Anhang)
11.) nach der volmgr.sys Datei gegoogelt
12.) Wise Registry Cleaner installiert & Registry bereinigen lassen
13.) Game-Download erneut angesetzt => BSOD

14.) CrystalDiskInfo installiert


15.) jeweils die entsprechenden RAM Riegel-Paare rausgenommen & erneut die SSD "belastet" => BSOD
16.) Path of Exile auf HDD gestartet => keine Probleme
17.) Zusätzlich World of Warcraft auf HDD gestartet => keine Probleme

Bisherige Erkenntnisse:
a) SSD stürzt ab, sobald sie länger belastet wird.
b) BlueScreen Fehlercode: 0x0000001e
c) volmgr.sys als Ursprung identifiziert?
d) restliches System (Boot-SSD mit BS und HDD laufen parallel ohne Probleme)

Kann man den Fehler weiter eingrenzen?
Werden andere Tools / Informationen dafür gebraucht?

Vielen Dank im Voraus!
 

Anhänge

  • 09_Speccy.png
    09_Speccy.png
    53 KB · Aufrufe: 500
  • 08_whocrashed.png
    08_whocrashed.png
    23,1 KB · Aufrufe: 517
  • 10_CrystalDiskInfo.png
    10_CrystalDiskInfo.png
    114,4 KB · Aufrufe: 500
Zuletzt bearbeitet: (Ergänzung Komponenten Netzteil / Lüfter)
Check mal die Temperatur von der SSD, wobei die bei 2,5" eingentlich weniger kritisch sein sollte.
Dann check mal die Firmware der SSD, was ist drauf, was gibts vom Hersteller? Die Crucial hatte in den letzten Tranchen machmal etwas spezialfirmware.

Sollte dennoch keinen BSOD auslösen können. Eigentlich sollte Windoze dann eine Meldung ausspucken, dass das Laufwerk nicht so richtig tut.

Den Ram hast du ja schon geprüft und ne weitere SSD klingt mir, ohne deine Komponenten näher zu können nicht nach DEM Kandidaten, der den Output von deinem Netzteil bei etwas Last überfordert... es sei denn das Netzteil ist uralt und nicht sonderlich hochwertig (Ich benutze eines aus 2011, was ne Vega VII problemlos versorgt).

Ggf. ist die SSD kaputt. Der ultimative Test wäre die von dir versuchten Schreib/Lesevorgänge mit einem anderen Rechner zu widerholen.
 
Erstmal Willkommen im Forum!
Die S.M.A.R.T. Werte der SSD sind in Ordnung und es gab auch keine Probleme mit dem Datenkabel. Poste man den Screenshot von CrystalDiskInfo für die beiden anderen Laufwerke.
 
Vielen Dank für die schnelle Antwort teufelernie

SSD Temperatur: s. CrystaDiskInfo - war ~33°C
Netzteil: be quiet! System Power 7 Modell: BQ-SU7 450W
Der Rechner wurde 2013 zusammengestellt.

Was bedeutet hier Firmware der SSD?

Liebe Grüße
Ergänzung ()

Danke auch @ Holt

CrystalDiskInfo der beiden anderen Festplatten:
11_CrystalDisk restl. Festplatten.png


Liebe Grüße
 
firmware: interne software der ssd, quasi das betriebssystem der ssd
sollte aktuell gehalten werden
steuert den controller der ssd
 
Die MX500 ist auch nie wärmer als 45°C geworden, an deren Temperatur liegt es sicher nicht. Die Werte der anderen sehen auch gut aus, wobei ich bei der V300 nicht zu viel darauf gebe. Von irgendwelcher "spezialfirmware" für die MX500 habe ich auch noch nichts gelesen, keine Ahnung wo diese Information herkommt.

Bzgl. der RAM: Hast da Du da nur ein Riegel Paar rausgenommen oder die wirklich mal mit Memtest86(+) getestet?
 
Ich weiss nicht, ob es und was es bedeutet, aber mir fällt auf, dass die 120 GB SSD (die "zweite") im Screenshot oben zwar "Gut" meldet, aber 91%. Das klingt eigentlich nicht so gut.
 
@Holt
Ich hab nur die RAMs entfernt und die SSD nochmal getestet.
Den Memtest86+ hab ich noch nicht gemacht.

Hab ihn hier runtergeladen:
https://www.memtest86.com/download.htm
Starte grade die ISO-Übertragung auf einen USB-Stick und lasse den Test gleich laufen.

@zazie
Dann müsste das System die Wochen vorher schon Abstürze gemeldet haben - ich vermute die 91% hängen einfach mit dem Verschleiß zusammen. (s. Stunden in Betrieb im Screenshot von CrystalDiskInfo)
 
es sind unterschiedliche programme:
memtest86+ ist veraltet(2013)
memtest86 ist aktuell
und die 91% sind ok(wear level), heisst nur, daß die seit einiger zeit in gebrauch ist, und somit ein teil der tbw verbraucht ist
 
zazie schrieb:
Ich weiss nicht, ob es und was es bedeutet, aber mir fällt auf, dass die 120 GB SSD (die "zweite") im Screenshot oben zwar "Gut" meldet, aber 91%. Das klingt eigentlich nicht so gut.
Die hat 25TB geschrieben! :freak: Da sind 91% völlig ok.


€dit: um noch was konstruktives beizutragen: ich habe einen ganz anderen Verdacht:
PC, 6 Jahre alt. Bisher wurde eine wirklich lahme SSD und eine HDD verwendet. System lief. Limitierender Faktor war die HDD. Die CPU hatte nie wirklich zu tun, außer auf die HDD zu warten.
Jetzt wurde die HDD gegen eine richtig schnelle SATA-SSD ersetzt und das Sytem ist instabil. Limitierender Faktor ist jetzt die CPU, die beim lesen/schreiben auf die Crucial immer wieder auf 100% geht.
Richtig? Wie heiß wird die CPU?

...und wenn wir schon dabei sind: TO, bist du bitte so nett und führst dein komplettes System hier auf?

Mögliche Ursachen, je nachdem ob AMD- oder Intel-CPU und Standard- oder Zukaufkühler:
  • Wärmeleitpaste eingetrocknet
  • Kühlung der Powermosfets unzureichend
  • taube Elkos am CPU-Sockel und/oder im NT
Jemand, der 25TB schreibt, nutzt zur Abwechslung auch mal den PC!



€dit#2: ich habe erst jetzt den Screenshot mit der Hardware gesehen. Bitte trotzdem noch das NT und den Kühler angeben.
"Billig-Board" mit 4Phasen-Stromversorgung für die CPU. Immerhin sind die Powermosfets gekühlt. Aber das Board (die Stromversorgung) ist für einen i7/Xeon unterdimensioniert.
Ich bleibe bei meinem Verdacht, das die wenigen Polymerkondis fertig und die Elkos im NT taub sind.
 
Zuletzt bearbeitet:
zazie schrieb:
zwar "Gut" meldet, aber 91%. Das klingt eigentlich nicht so gut.
Vergiss die Prozentangaben, die basieren bei den unterschiedlichen SSDs auf unterschiedlichen Attributen, bei einigen wie dieser hier, ist es der Media Wear Indicator (also im Prinzip die verbleibenden spezifizierten P/E Zyklen, aber dies handhaben die Controller auch nicht einheitlich, der SF beginnt intern bei 110 und braucht daher lange bis er unter 100 geht und fällt danach umso schneller, bei 10% sind dann die spezifizierten P/E Zyklen verbraucht und die letzten Prozent fallen mit den verfügbaren Reserveblöcken), bei anderen sind es die verfügbaren Reserveblöcke.
whats4 schrieb:
memtest86+ ist veraltet(2013)
Das ist egal, denn erstens hat er ein altes System und zweitens ist das nur für die Anzeigen oben relevant, die Grundfunktion bestimmte Daten in die RAMs zu schreiben, dann wieder auszulesen und mit den erwarteten Daten zu vergleichen, ist immer noch die gleiche und funktioniert auch, wenn die Anzeige oben falsche Angaben zum System und Speicher macht.
 
ja, aber er wird ein modernes system drauf fahren, und ich hatte schon rams, bei denen memtest86+ keine fehler reportet hat, aber was 64bittiges schon.
warum auch immer, wurscht
 
Wenn es keine Fehler bei Memtest86(+) gibt, aber dann welche im Betrieb, so hat dies entweder mit der Last zu tun, die ist bei Memtest86(+) ja nicht so groß und vor allem konstant. Kommt es dann im Betrieb zu Probleme mit der Temperatur oder der Spannungsregelung bei den Laständerungen, kann dies RAM Fehler provozieren. Außerdem müssen die Einstellungen natürlich stimmen, der Test gilt ja nur für die Einstellungen wie sie auch beim Test verwendet wurde. Ändert man nun mit einem SW OC Tool unter Windows etwas an den Einstellungen, dann kann Test mit den anderen Einstellungen natürlich nicht aussagen, dass auch bei den unter Windows verwendeten Einstellungen noch alles passt. Ein andere Problem kann auftreten, wenn man unterschiedliche Riegel mit unterschiedlichen Werten im SPD hat und das BIOS mal die Einen und mal die Anderen ausliest und anwendet, wenn dann mit denen die beim Test aktiv waren fehlerfrei läuft, muss doch mit den anderen die vielleicht beim nächsten Booten genommen werden, nicht auch der Fall sein.

Außerdem kann so ein RAM Test natürlich praktisch nur hard errors finden, denn die Zeit zwischen dem Schreiben und Wiedereinlesen der Daten ist so kurz, dass die Wahrscheinlichkeit das in der kurzen Zeit ein soft error auftritt (also spontan ein Bit im RAM kippt) einfach viel zu kurz ist.

Wer wirklich eine gute Sicherheit vor RAM Fehlern haben möchte, der muss ECC RAM und natürlich ein passendes System (also Board und CPU) verwenden! Der Xeon des TE würde es unterstützen, aber sein H87 Board nicht, dazu müsste es eines mit C Chipsatz sein.
 
So,
zunächst einmal möchte ich ein großes Lob an die Community aussprechen - hätte nicht mit so vielen Antworten in so kurzer Zeit gerechnet!

Der Memtest86 ist nun die letzten 4h durchgelaufen - es wurden 0 Errors verzeichnet (laut Endscreen).
Der Endreport sollte wohl als .html-Datei irgendwo gespeichert werden - hab ihn bisher nicht gefunden.

Zu der Temperatur-Entwicklung:
Hab die SSD Festplatte nochmal mit einem Download belastet.
Währenddessen mit SpeedFan die Temperaturen beobachtet.
Bis zum Absturz ergaben sich folgende Werte f. GPU / CPU / SSD:

Max.-Werte:
CPU = 52°C
GPU = 50°C
SSD = 45°C


Die Temperaturen sehen für mich noch normal aus - die GPU kühlt immer erst relativ spät (ab 60°C aufwärts ), um möglichst leise zu arbeiten.

@ UweW.
Danke noch für die Ergänzungen!

Netzteil: be quiet! System Power 7 Modell: BQ-SU7 450W
Lüfter: 120x120x25mm Xigmatek Lüfter schwarz BULK
UweW. schrieb:
Ich bleibe bei meinem Verdacht, das die wenigen Polymerkondis fertig und die Elkos im NT taub sind.

Was genau ist damit gemeint?

Liebe Grüße

Edit:
Habe mal die beiden letzten Mini-Dumps angehangen:
 

Anhänge

Zuletzt bearbeitet: (Anhang Minidumps)
Shynara schrieb:
Netzteil: be quiet! System Power 7 Modell: BQ-SU7 450W
Die Marke hat viele Fans, aber nicht nur gute Netzteile und leider teste CB nicht wie Tomshardware auch das dynamische Regelverhalten. Die Marke hat viele Fans, aber ich habe hier schon mal was dazu geschrieben und Du wärst jetzt nicht der erste bei dem ein Netzteil dieser Firma zu Problemen mit der M.2 SSD führt. In einem Fall hat der Besitzer es auch eingeschickt und der Support hat das Netzteil als Ursache dann auch bestätigt.
 
Danke @Holt

Hab mir den Post einmal durchgelesen.
Das Netzteil kann mit den schwankenden Leistungsschüben der SSD nicht umgehen und bringt den Computer zum Absturz. Wenn es stimmt was da steht und auf meine HW übertragen werden kann, sollte ich mir dringenst ein neues NT zulegen, welches mit der restlichen HW ebenso kompatibel ist.

Gibt es spontan zu empfehlende Netzteile, oder kann ich mir das erstbeste rausnehmen, das ich finde?

Ich danke auch allen anderen an dieser Stelle für ihr Mitwirken und würde diesen Thread sonst als geschlossen/gelöst erklären.



Shynara
 
Zuletzt bearbeitet: (Ergänzung)
Sorry, "taube" Elkos ist Fachchinesisch. Das steht für Kondensatoren, die am Ende von Ihrem Lebenszyklus angekommen sind und den größten Teil ihrer Kapazität verloren haben.

Elektrolytkondensatoren (mit flüssigem Elektrolyt) im Netzteil sind meist mit 85°C, selten mit 105°C spezifiziert. Je nach Serie halten die von BeQuiet meist verbauten Teapo-Elkos bei max. Temperatur 500, 1000 bestenfalls 2000h durch. Bei niedrigerer Temperatur deutlich länger. Ein Jahr hat rund 8750h. Dein NT ist 6 Jahre alt. Der exzessiven Schreiblast auf deiner 120GB SSD nach zu urteilen läuft dein PC praktisch Tag und Nacht durch?

Die Polymerkondensatoren der 2. Generation (fester Elektrolyt), die auf deinem Mainboard direkt neben dem CPU-Sockel sind, sollten i.d.R. für 5000h bei 85°C ausgelegt sein. Gigabyte hatte zumindest zu der Zeit mit fetten Schriftzügen auf den Mainboardkartons dafür geworben. Die thermische Belastung zwischen CPU und Powermosfets ist nicht zu unterschätzen. Ich gehe immer noch davon aus, das die Elkos im NT fertig sind. D. h., das sie ihrer Aufgabe - sieben und glätten der Ausgangsspannung nur noch sehr eingeschränkt nachkommen: die Restwelligkeit (Brumm) der Gleichspannungen aus dem NT ist zu hoch.
Dadurch werden die Polymerkondis auf dem Board jetzt doppelt belastet: die Brummspannung liegt oberhalb der Spezifikation, die Kondis altern rapide.
Ein Teufelskreislauf.


Richtig ist mal grundsätzlich mit einem neuen NT dein System zu testen. Ewig wird dein Board aber auch nicht mehr halten, dazu ist der Alterungsprozess m.E. zu weit fortgeschritten.
Ich würde dir ein NT mit besonders niedriger Restwelligkeit empfehlen um die Kondis auf dem Mainboard zu schonen. Gibt einige NT-Tester, die wert auf diesen Punkt legen und Screenshots vom Oszi posten.
Du kannst dir die NT-Tests auf computerbase ansehen, aber auch Jonny Guru http://www.jonnyguru.com/blog/2017/08/21/seasonic-focus-plus-550-gold-power-supply/4/ , Anandtech https://www.anandtech.com/tag/casecoolingpsus etc.
 
Shynara schrieb:
Das Netzteil kann mit den schwankenden Leistungsschüben der SSD nicht umgehen
Es ist eher umgekehrt, die Änderungen der Leistungsaufnahme der SSD dürfte das Netzteil nicht so sehr stören wie die der CPU und der Graka. Eine GTX1070 braucht ja schon nicht wenig Storm:

GTX1070_PowerConsumption.png


(Quelle)

Die ist zwar mit 150W angegeben, braucht aber eben auch mal über 200W und auch mal nur 100W und diese Schwankungen sind das Problem. Die modernen CPUs und GPUs wechseln den Takt sehr schnell und häufig, immer der Last entsprechend und damit sind sie im Mittel sparsamer und zugleich bei kurzen Belastungen schneller als wenn sie mit konstantem Takt arbeiten würden. Dies beansprucht aber eben das Regelverhalten der Netzteile sehr und sie müssen viel schneller auf diese Änderungen bei ihrer Last reagieren. Leider schaffen dies nicht alle, gerade auch die älteren von beQuiet glänzen da eben nicht und wie im schon einmal verlinkten älteren Beitrag von mir erwähnt, hat beQuiet die im Review des L10 erkannte Auffälligkeit mit dem Power-Good-Signal:
Das PWR OK Signal einfach aktiv zu lassen obwohl die Spannungen den Toleranzbereich verlassen haben, ist ein Trick um das Ausgeben des Rechner zu verhindert, ohne das Regelverhalten der Schaltung optimieren zu müssen. Die CPU und GPU werden ja auch mit 1,xV versorgt die aus den 12V begonnen werden, da fällt es auch nicht gleich auf wenn sie 12V den Toleranzbereich verlassen. Die Nebenspannungen werden aber wie die Transient Response Test zeigen, ob viel stärker beeinflusst und verlassen den Toleranzbereich noch vor den 12V und da oft nur die SSD an 5V (2.5W) bzw. 3,3V (mSATA und M.2) hängt, ist die dann die Leidtragende.

Probiere mal ob Du den Takt der GPU und ggf. auch der CPU fixieren kannst, eben um diese Lastschwankungen für das Netzteil zu vermeiden oder wenigsten zu vermindern. Gibt es dann keine Probleme mehr, so hast Du das Netzteil sicher als Ursache identifiziert und wenn die Probleme dann trotzdem noch auftreten, würde ich mal überlegen die alte V300 zu ersetzen, die sind nie wirklich empfehlenswerte SSDs gewesen und deren Sandforce Controller machte auch nicht gerade wenig Ärger.
Shynara schrieb:
Gibt es spontan zu empfehlende Netzteile
Also ich würde mich auf jeden Fall am Abscheiden beim Transient Response Test in einem Netzteilreview bei Tomshardware orientieren und wenn es dann wie z.B. bei diesem Seasonic SSR-650PX oder dem Corsair CX450 bei 3,3V durchfällt, die Finger von der Serie lassen. Die Hersteller haben ja auch andere Serien, so besteht das Corsair SF450 Platinum den Test sogar mit einem sehr gutem Ergebnis von maximal 3,26% Abweichung. Gerade für ein Netzteil mit nur 450W ist der Test nämlich recht hart.
 
STATUS UPDATE:

Samsung EVO 860 (500GB SSD) gekauft & angeschlossen.
Keine Abstürze mehr.

Vermute die Crucial SSD war defekt....

Danke trotzdem an alle die hier aktiv waren!
 

Ähnliche Themen

Zurück
Oben