Samsung SSD 970 EVO Plus 1 TB schuld an Abstürzen und Freezes bei Games?

Arkantos

Ensign
Registriert
Juli 2007
Beiträge
211
Hallo zusammen,

ich bin mit meinem Latein langsam aber sicher am Ende... Habe mir Ende letzten Jahres einen neuen Rechner gegönnt und nutze als Hauptplatte die Samsung SSD 970 EVO Plus mit 1 TB. Leider habe ich unregelmäßig sporadisch auftretende Abstürze und Freezes (mal läuft stunden und/oder tagelang alles gut, mal habe ich während eines Abends 8 Abstürze/Freezes), während des Spielens von (meist anspruchsvollen) Titeln (aktuell DOOM Eternal). Diese Abstürze und Freezes sind auch bereits bei Spielen wie DOOM (2016), Subnautica, A Plague Tale: Innocence und Kingdom Come: Deliverance aufgetreten, sodass ich ein Engine-spezifisches Problem ausschließen würde...

Mich beschleicht langsam aber sicher das Gefühl, die SSD sei Schuld, da ich sie während all der Zeit noch nie über die Temperatur von 59 Grad habe hinausgehen sehen, während meine Grafikkarte bislang stets bis maximal 70 Grad und meine CPU unter 80 Grad geblieben sind (s. unten für die gesamten Specs meines Systems). Mein Verdacht wird auch dadurch bestätigt, dass Samsung Magician sagt, die Temperatur sei zu hoch.

Die Abstürze und Freezes variieren immer wieder mal: Mal bekomme ich einen Crash to Desktop (ohne jegliche Fehlermeldung). Schaue ich dann in HWMonitor nach der Temperatur, liegt die maximal erreichte sowie aktuelle Temperatur der SSD bei 59 Grad - ich habe sie wie gesagt noch nie wärmer erlebt. Meist friert das Bild jedoch ein und der Sound läuft weiter. In diesem Fall gelingt es mir manchmal aus dem Spiel "heraustabben", ich kann das Spiel dann aber nicht beenden, auch nicht durch den den Task-Manager, da sich nichts anklicken oder gar das Spiel schließen lässt. Somit hilft in aller Regel nur ein Komplett-Neustart des Systems über das Gedrückthalten des Power-Buttons.

Was ich alles schon probiert habe:
  • Alle mir bekannten notwendigen Treiber installiert und aktualisiert (AMD-Chipsatztreiber, Grafikkarte, NVMe-Treiber der SSD, LAN-Treiber, Windows auf aktuellem Stand)
  • RAM-Tresstest über Nacht mit einem bootbaren USB-Stick und darauf befindlichen MemTest (bei Standardtakt von 3000 MHz ohne einen einzigen Fehler), RAM läuft aktuell jedoch wieder auf 3200 MHz, da die Probleme auch bei 3000 MHz auftraten...
  • BIOS ist ebenfalls auf dem aktuellsten Stand (01/2020 gemäß Homepage von MSI).
  • Rechner platt gemacht und in Verbindung damit auch BIOS auf Stadardwerte zurück gesetzt, ehe ich es wieder angepasst habe (Lüfterkurven, Bootreihenfolge, DDR-Geschwindigkeit von Standardwert von 2400 MHz auf 3200 MHz hochgesetzt)
  • SMART-Test mit Samsungs Magician-Software durchgeführt: kein Fehler entdeckt
  • Stress-Test mit Prime95 und Furmark (auch gleichzeitig): Beim letzten Versuch beides gleichzeitig laufen zu lassen, bekam ich nach dem Beenden der Benchmarks jedoch einen Blue-Screen (Stillstandscode: DPC_WATCHDOG_VIOLATION)

Mein System:

Die SSD sitzt unterhalb meiner Grafikkarte. Ich habe schon daran gedacht die SSD an den zweiten Anschluss weiter unten zu hängen, aber ich bin mir unsicher, ob damit nicht auch ein Geschwindigkeitsverlust einhergehen würde. Soweit ich herauslesen konnte, sollte das nicht der Fall sein... Ansonsten habe ich auch schon daran gedacht, dass vielleicht das Mainboard (soll ja nicht das beste sein) oder mein Netzteil (zu wenig Power, hätte lieber gleich 650 Watt nehmen sollen) schuld sein könnte.

Ich bin für jeden Ratschlag dankbar!

EDIT: Habe eben nochmal zwei Screenshots nach einer ~2 1/2-stündigen Zock-Session von DOOM-Eternal angehängt. Die angezeigten Maximalwerte wurden während des Spielens erreicht, die aktuellen Werte sind die Werte im Idle während des Surfens nach dem Runterkühlen.
 

Anhänge

  • HWMonitor_1.png
    HWMonitor_1.png
    64,4 KB · Aufrufe: 509
  • HWMonitor_2.png
    HWMonitor_2.png
    61,8 KB · Aufrufe: 517
Zuletzt bearbeitet:
Gib dem RAM mal etwas mehr Spannung und teste das mit der SSD im anderen Port.
 
  • Gefällt mir
Reaktionen: poerem
Auch wenn es neu ist, klingt das für mich eher nach einem Fehler bei der Grafikkarte oder ggf. in der Grafikkarten-Stromversorgung durch das Netzteil.
Gerade, dass du noch heraustabben kannst (manchmal) spricht dafür, dass der Grafikkartentreiber einen kompletten Absturz verhindern kann und wieder eine Bildausgabe auf Desktop Level herstellen kann.
RAM oder CPU Fehler sind in der Regel verheerender und fangen sich im Betrieb weniger.
Dass die Sachen neu sind schließt einen Defekt leider nicht komplett aus.

Ggf. kannst du natürlich noch mal Windows neu aufsetzen mit allen Treibern, um ein Software Problem auszuschließen. Anschließend würde ich aber versuchen die Grafikkarte zu wechseln, um dich zu vergewissern.
 
  • Gefällt mir
Reaktionen: Baal Netbeck
Auch wenn die SSD zu heiß wird, hört eine 970er nicht auf zu arbeiten, sondern throttelt nur die Geschwindigkeit, aber dazu muss sie noch mehr als 59°C erreichen. Es liegt zu 99,99% nicht an der SSD, sondern eher am RAM, dem Netzteil oder sonstwas. Hast Du mal einen RAM Test gemacht?
 
BFF schrieb:
Gib dem RAM mal etwas mehr Spannung und teste das mit der SSD im anderen Port.

Das mit dem anderen Port werde ich morgen gleich mal ausprobieren. Welche Einstellungen genau muss ich denn bei der Erhöhung der Spannung worauf (welcher Wert) anpassen?

SFFox schrieb:
Auch wenn es neu ist, klingt das für mich eher nach einem Fehler bei der Grafikkarte oder ggf. in der Grafikkarten-Stromversorgung durch das Netzteil.
Gerade, dass du noch heraustabben kannst (manchmal) spricht dafür, dass der Grafikkartentreiber einen kompletten Absturz verhindern kann und wieder eine Bildausgabe auf Desktop Level herstellen kann.
RAM oder CPU Fehler sind in der Regel verheerender und fangen sich im Betrieb weniger.
Dass die Sachen neu sind schließt einen Defekt leider nicht komplett aus.

Ggf. kannst du natürlich noch mal Windows neu aufsetzen mit allen Treibern, um ein Software Problem auszuschließen. Anschließend würde ich aber versuchen die Grafikkarte zu wechseln, um dich zu vergewissern.

Den Rechner habe ich inzwischen sogar schon zwei Mal neu aufgesetzt - die erstmalige Inbetriebnahme vor einigen Monaten nicht mit eingerechnet. Ich glaube nicht, dass ein nochmaliges Neuaufsetzen Abhilfe schaffen würde - zuletzt habe ich ihn ja erst gestern neu gemacht. Das Problem ist ja, dass ich die Nadel im Heuhaufen suche, im Grunde nur nach dem Ausschlussverfahren vielleicht den Fehler finde. :( Weil du die Grafikkartenversorgung ansprichst: Kann es denn an einer zu geringen Wattzahl des Netzteils liegen? Vom Rechner abgesehen, genehmigen sich noch eine externe Soundkarte FiiO E10K und eine alte Logitech G15 (refresh) ein wenig Strom vom Netzteil.

Holt schrieb:
Auch wenn die SSD zu heiß wird, hört eine 970er nicht auf zu arbeiten, sondern throttelt nur die Geschwindigkeit, aber dazu muss sie noch mehr als 59°C erreichen. Es liegt zu 99,99% nicht an der SSD, sondern eher am RAM, dem Netzteil oder sonstwas. Hast Du mal einen RAM Test gemacht?

Ja, siehe oben. MemTest lief die ganze Nacht durch bis zum Ende des Tests, ohne einen einzigen Fehler.
 
Ich bin mir ziemlich sicher, dass es die Graka ist. Die Stromversorgung sollte noch passen, die 550 Watt vom BeQuiet sollten reichen für eine 2070 Super und einen 3900X (vor allem wenn es "nur" Gaming-Last) ist.
Ich tippen von der Prio auf:
1. Graka oder
2. Netzteil
Eins von beiden hat wahrscheinlich nen Defekt.
 
Arkantos schrieb:
  • MemTest (bei Standardtakt von 3000 MHz)
  • RAM läuft aktuell jedoch wieder auf 3200 MHz, da die Probleme auch bei 3000 MHz auftraten...
  • Rechner platt gemacht ... (DDR-Geschwindigkeit von Standardwert von 2400 MHz auf 3200 MHz hochgesetzt)...
32GB Crucial Ballistix Sport LT V2 Dual Rank grau DDR4-3000 DIMM CL15 Dual Kit

mMn mutest Du dem RAM zuviel zu
probiere doch mal über längeren Zeitraum 2400 MHz: Stabilität wäre -wie man sieht- wichtiger als das letzte Quäntchen Speed
 
Klingt zwar nach Problemen mit der GPU bei den Game crashes. Aber der Bluescreen bei Prime und Furmark klingt eher nach dem CPU/Ram Problem.
Würde RAM überhaupt mal auf nur 2133 für ne Weile setzen. (Entweder ne Woche Altagsnutzung oder 24h Prime/Memtest o.Ä - die eine Nacht kann man sich meiner Erfahrung nach schenken)

Hatte schon so oft Probleme mit Arbeitsspeicher, auch wenn auf den ersten Blick alles stabil schien gab es alle paar Tage mal irgendein Programmabsturz, habe wortwörtlich Monate gebraucht um ein wirklich 100% stabiles System mit 3600Mhz Ram zu haben (Und das bei nem 4266Mhz Ram Kit und nem Z390 Maximus Extreme mit 9900K, die beide eigentlich leicht hohe Ramgeschwindigkeiten vertragen sollten).
Bei meinem Server bringt bereits 2400Mhz Ram Probleme mit sich (Serverfreeze 1x die Woche), seit dem er mit 2133 läuft, gab es auch keine Probleme mehr (Ist nun 3 Monate her).
 
Was sagt die Ereignisanzeige nach den Abstürzen?
 
Wenn die 5v+ Leitung tatsächlich richtig ausgelesen nur bei 1V+, könnte das die Ursache sein. Das müsste man aber mit einem Multimeter gegen testen.
 
Nur das M.2 SSDs nicht mit 5V sondern mit 3,3V versorgt werden und gerade die 3,3V Schiene bei Lastwechseln in aller Regel die stärksten Ausschläge zeigt, wie der Transient Response Tests von Netzteile bei Tomshardware zeigt. Wenn, dann es meist diese Spannung die dabei auch den Toleranzbereich verlässt und da außer den M.2 SSDs kaum etwas dran hängt, fällt dies meistens auch gar nicht auf. Es gab schon Fälle wo dies zu Problemen mit der SSD geführt hat, die dann behoben waren, nachdem diese in einem 2.5" Adapter betrieben wurden, denn 2.5" Laufwerke werden i.d.R. mit 5V versorgt und bessere 2.5" Adapter für M.2 SATA SSDs haben dann auch genau wie die 2.5" SSDs eine Spannungswandlung von 5V auf 3,3V, was sie noch einmal unempfindlicher gegenüber Spannungsschwankungen macht.
 
koech schrieb:
mMn mutest Du dem RAM zuviel zu

3200 MHz sind doch ein Klacks für Micron E Dies, außerdem ist es 3000er RAM warum sollte man den auf 2400 laufen lassen?
 
@Holt
Ist ja richtig, aber wenn eine Komponente die 5V+ Leitung vom Netzteil anfordert die nicht richtig anliegt und nicht vom Mainbord selbst generiert wird, kann auch hier das Problem begraben sein. Zumindestens alle wichtigen Spannungen sollten im grünen Bereich liegen. Solch sporadisches Verhaltensmuster ist penetrant bei der Fehlersuche, wenn die Fehlerereignisanzeige nichts verwertbares ausgibt. Da bleibt dann auch gerne ein Rückbau mit einem Tischaufbau übrig. Mit Windows 10 wird die Fehlersuche auch nicht vereinfacht und ich musste letztens den Realtek Audiocodec deaktivieren, weil ich gelegentlich Bluescreens erhielt und mich nicht durch die Treiber wühlen wollte. Ist aber nicht mein Hauptaudio Ausgabegerät, daher darf der Realtek Audiocodec sogar hardwareseitig kaputt sein.

-
Wenn der Themenersteller die SSD im Verdacht hat, sollte er auch die Cristaldiskinfo SMART Werte mal anzeigen lassen.
 
Der Nachbar schrieb:
Zumindestens alle wichtigen Spannungen sollten im grünen Bereich liegen.
Ja, aber man kann ohne aufwendige Messtechnik gar nicht wissen, ob die Spannungen immer im grünen Bereich liegen oder diesen bei Lastwechseln mal kurz verlassen, dazu sind normale Multimeter und auch die Spannungssensoren auf den Boards viel zu träge. Als Test könnte man einen Slot Adapter mit eigener Spannungswandlung von 12V auf 3,3V wie die ASUS Hyper M.2 X16 Card nehmen, ein PCIe Slot ist ja für maximal 3A auf der 3,3V Schiene ausgelegt, aber eine M.2 SSD alleine kann locker mehr als die Hälfte davon ziehen, deshalb haben alle Adapter mit 4 M.2 Slot und die besseren mit 2 so eine Spannungswandlung. Verschwindet das Problem dann, so lang es an der 3,3V Schiene.

Gerade beQuiet fällt ja bei dem Transient Response Tests immer wieder durch, auch das be quiet! Straight Power 11 1000W hat im Review bei tomshardware den mit bis 4.,87% Abweichung auf der 3,3V Schiene gerade noch so bestanden, obwohl der Test für ein Netzteil mit so einer hohen Leistung von 1000W ein Kinderspiel sein sollte, wie das Modell mit geringer Leistung abschneiden würde, kann man sich daher vorstellen. Wer eine M.2 SSD verbauen will, dem kann man nur raten kein Netzteil von be quiet! zu nehmen, bei denen zieht sich auf der "Against" Seite "3.3V transient response" wie ein roter Faden durch die Reviews von Tomshardware und leider kenne ich keinen anderen Reviewer der diesen wichtigen Test macht, dabei sind die Laständerungen heute wegen der Energiesparvorrichtungen die die Taktraten von CPUs und GPUs blitzschnell anpassen (bei Zen2 kann sich laut AMD der Takt binnen 1ms ändern!) viel häufiger und heftiger als früher.
 
Also erst einmal vielen Dank an alle für die Antworten. Ich glaube zwar auch nicht, dass die Geschwindigkeit des RAMs schuld an der Misere ist, aber ich werde dennoch versuchen ihn als erstes als Fehlerquelle auszuschließen, indem ich die Geschwindigkeit auf 2400 MHz reduziere. Vielleicht hilft das ja schon.

Sollte das auch nichts bringen, werde ich in einem zweiten Schritt meine SSD am zweiten Slot ausprobieren. Heute Abend werde ich nochmal ein Ründchen spielen und dann berichten. Allerdings werde ich wohl nicht darum herumkommen das langfristig auszutesten. Wie gesagt, manchmal habe ich tagelang keinen Absturz, mal bis zu 8 Mal innerhalb einer Stunde. Irgendetwas stimmt also nicht.

Ach ja: Ich hatte im EP noch vergessen zu erwähnen, dass auch das BIOS auf dem aktuellsten Stand ist. Habe es oben noch ergänzt.
 
Holt schrieb:
Ja, aber man kann ohne aufwendige Messtechnik gar nicht wissen, ob die Spannungen immer im grünen Bereich liegen oder diesen bei Lastwechseln mal kurz verlassen, dazu sind normale Multimeter und auch die Spannungssensoren auf den Boards viel zu träge. ......
Irgendwo muss man trotzdem als Nutzer anfangen das Problem mit Hausmitteln zu untersuchen. Am Ende bleiben ohne teure Messtechnik und ausreichend Netzteilreviews, die auch nicht mehr groß ComputerBase in deutscher Sprache verfasst für den PC Nutzer halt eigene Quertests mit Hardwaretausch übrig, aber ein Multimeter gehört bei der verfügbaren Elektrotechnik wie ein Schraubendreherset bei den Schrauben einfach in den Haushalt um auch hier mal die Schranktür neu einzustellen. Spannungen messen und einfacher Aufbau Elktroschaltung hatte ich schon in der 5.Klasse Grundschule und das war neben dem Grundübungen Nähtechnik Anfang der 90'er Jahre.

Die Probleme mit schlecht dimensionierten Netzteilen scheinen mehrheitlich erst seit der DC/DC Technik aufgekommen zu sein. SeaSonic hat ja nachträglich seine Kabel mit Kondensatoren ausgestattet, bis man die Netzteile intern auf die Lastwechsel hin umgerüstet hat. Ich habe mit meinem alten Seasonic S12 nämlich keine Stabilitätsprobleme bei Lastwechseln mit einem übertakteten ZEN+, VEGA 56 und eine Samsung 970 Evo ist ebenso verbaut. Deswegen tue ich mir momentan schwer trotz des Netzteil Alters ein neues Focus GX mit der tollen Gold Effizienzsteigerung zu kaufen und be Quiet! kommt bei mir seit gut 10 Jahren nicht mehr in das System, weil das Seasonic bis jetzt stabil läuft.

@Arkantos
Wenn wir die Lastwechsel so ansprechen, wäre es vielleicht gut alle Komponenten auf einen Leistungswert durch OC Werkzeuge und Energiepläne tatsächlich zu fixieren. Sollte nach Tagen trotz erhöhten Mehrverbrauch das System sauber laufen, kann ein Netzteil Quertest nicht schaden.
 
Der Nachbar schrieb:
Die Probleme mit schlecht dimensionierten Netzteilen scheinen mehrheitlich erst seit der DC/DC Technik aufgekommen zu sein.
Nein, die DC/DC Technik ist ja bei allen besseren Netzteilen heute Standard und da gibt es viele die sehr wohl eine sehr gute Spannungsreglung haben und problemlos mit dem Transient Response Tests klarkommen. Lies mal diesen Post von mir aus 2017, da sieht man wie das be quiet! Pure Power 10 600W im Vergleich zum Enermax Revolution SFX 650W regelt, die Spannung schießt beim bequiet nach dem Lastwechsel hoch und steigt dann noch weiter an bis der nächste Lastwechsel erfolgt, während sie sich beim Enermax (und den meisten anderen Netzteilen die getestet wurden) nach der Spitze die durch den Lastwechsel kommt, wieder in Richtung des Sollwertes bewegt und selbst bei beim Test mit Lastwechseln alle 1ms schafft es das Enermax in weniger als der Hälfte der Zeit wieder auf eine normale Spannung zu kommen, während das be quiet! nur ständig zwischen zwei extremen herumeiert ohne überhaupt auf die Mittellinie zu kommen. Dies schafft es erst im Test mit Lastwechseln alle 20ms der im untersten Bild zu sehen ist, da braucht es aber auch einige Zeit, prozentual mehr als bei Enermax beim 1ms Test, die Spannungsregelung dürfte also beim be quiet! mindestens um den Faktor 20 langsamer arbeiten als beim Enermax.

Wieso be quiet! so eine langsame Spannungsregelung verwendet,weiß ich auch nicht, vielleicht ist es leiser, billiger oder erlaubt eine höhere Effizienzklasse zu erreichen. Aber im Zusammenhang mit einer M.2 SSD ist es einfach Mist, da diese eben an den 3,3V hängen und Probleme mit der 3,3V Schiene damit erstmal überhaupt auffallen.
 
PCTüftler schrieb:
3200 MHz sind doch ein Klacks für Micron E Dies, außerdem ist es 3000er RAM warum sollte man den auf 2400 laufen lassen?

Ich habe hier 4000er RAM (also 4000 x Klacks), läuft trotzdem nicht mit der Frequenz bei ähnlichem Setup wie oben (3900x, x570 asrock). Obwohl genau der RAM auf der Kompatibilitätsliste des Boards steht: Tatsächlich sogar als 4000er! Funktioniert inzwischen nach dem dritten neuen BIOS gerade mal so XMP3600 stabil, mit älterem BIOS lief der anfangs nur 3400, alles darüber endete unregelmäßig mit unterschiedlichen Fehlern herzlichst instabil. Da half nur RAM-Frequenz runter (ist nun mal kein Intel)...
 
Und wie bereits geschrieben ist Intel auch kein Allheilmittel. Auch wenn mein 4266Mhz Ram auch mit voller Frequenz auf der Kompatibilitätsliste des Boards steht.
Ohne manuelle Anpassung der Spannung für den Mem Controller lief nicht mal 3000Mhz stabil - und das mit einem der teuersten Intel Boards, Speicher und CPUs.

Wobei man auch sagen muss, dass ich mehrere 9900K hatte und bei manchen 4266 gleich funktionierten - die hatten halt nen top Mem Controller, dafür nen schlechten CPU Part und ließen sich wie Müll übertakten (schafften mit ner custom Wakü teilweise nicht mal 4,8Ghz unter AVX Prime, egal wie viel Spannung)
Derzeitig läufts 5Ghz All-Core in AVX Prime mit sehr humanen 1,26V, dafür halt nur 3600Mhz Mem. CPU OC war nach 1-2 Tagen stabil, RAM OC erst nach Monaten.

Und ja auch wenn CPU Board sowie Ram sagen die unterstützen x Mhz und sind miteinander kompatibel, ist es Ram OC samt OC des Mem Controllers. AMD und Intel schließen (eigentlich) auch die Garantie aus wenn man XMP aktiviert. Nur kann man bei ner CPU nicht so einfach prüfen ob XMP je aktiviert war und man kann einfach sagen XMP hätte man nicht aktiviert gehabt.
 
Hier mal ein kurzes Update meinerseits:
Nach der Reduzierung auf 2400 MHz hatte ich bislang beim Spielen keinen einzigen Absturz mehr. Das muss nichts heißen, schließlich traten meine sporadischen Abstürze ja auch "nur" immer wieder mal und nicht täglich oder gar ständig auf. Bevor ich also eine abschließende Entwarnung geben kann, bedarf es noch weiterer Tests und vor allem eines längeren Testzeitraums. Trotzdem bin ich vorsichtig optimistisch. :)

Sollte das aber tatsächlich bereits der Fehler gewesen sein: Den Arbeitsspeicher mit angezogener Handbremse laufen zu lassen, ist zwar nicht Sinn der Sache, aber wenn es nicht anders geht, ist das wohl ein notwendiges Übel. Ich hoffe, das es nur einen mess- aber nicht wahrnehmbaren Performanceverlust bedeutet. Was ich mich jedoch auch in Hinblick auf die Posts von koech frage, ist, warum Mainboardhersteller in ihrer offiziellen Kompatibilitätsliste den RAM mit entsprechender Geschwindigkeit aufführen, es dann aber doch nicht stabil funktioniert. Es handelt sich ja dabei offenbar nicht um Einzelfälle.
 
Zurück
Oben