DDD schrieb:
Wie kann man eig. prüfen ob eine SSD bald die Grätsche macht?
Normalerweise gar nicht, die meisten fallen spontan und ohne Vorwarnung aus.
DDD schrieb:
Nun weiß ich aber nicht ob es an der SSD liegt oder einfach was doof gelaufen ist und nichts mit der SSD zu tun hat.
Nach den S.M.A.R.T. Werten dürfte es nicht mit der SSD zusammenhängen. Man muss auch nicht bei allen unerklärlichen Vorfällen immer sofort die SSDs verdächtigen, die gab es auch bevor man eine SSD hatte und da hat man auch nicht für jeden Fehler die HDD im Verdacht gehabt.
DDD schrieb:
Da kann man doch nur mit Smart Werten arbeiten, oder? Bei HDDs gabs ja noch diese BootCD mit Hersteller Tools und
Hitachi Drive Fitness Test und sowas.
Ja, da gibt es nur die S.M.A.R.T. Werte, die reichen aber i.d.R. auch vollkommen aus.
DDD schrieb:
Passt, von daher ist diese Warnung falsch:
DDD schrieb:
==> WARNING: This drive may hang after 5184 hours of power-on time:
DDD schrieb:
1 Raw_Read_Error_Rate 0x002f 100 100 050 Pre-fail Always - 0
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
Die beiden sind wichtig, solange die Rohwerte auf 0 stehen, ist die SSD praktisch nagelneu.
DDD schrieb:
171 Program_Fail_Count 0x0032 100 100 001 Old_age Always - 0
172 Erase_Fail_Count 0x0032 100 100 001 Old_age Always - 0
Die beiden hängen mit 05 zusammen.
DDD schrieb:
173 Wear_Leveling_Count 0x0033 098 098 010 Pre-fail Always - 82
Da sieht Du, dass die NANDs gerade erst 82 Zyklen auf dem Buckel haben, das ist nichts, Micron garantiert 3000 und in Test die teils über 30.000 erreicht.
DDD schrieb:
174 Unexpect_Power_Loss_Ct 0x0032 100 100 001 Old_age Always - 60
Der Rohwert sollten nicht zu hoch sein, ein Hardreset oder Stromausfall kommt immer mal vor, aber der gefähredt die SSD und kann auch zu Ausfällen von NANDs führen, wenn die gerade beschrieben oder gelöscht wurden.
DDD schrieb:
195 Hardware_ECC_Recovered 0x003a 100 100 001 Old_age Always - 0
196 Reallocated_Event_Count 0x0032 100 100 001 Old_age Always - 0
Das sind die Gegenstücke zu 01 und 05. Solange alle Lesefehler noch über die Hardware ECC bereinigt werden können, ist alles in Ordnung, der Rohwert von 195 sollte also dem von 01 entsprechen. Die Reallocation Events geben bei NANDs im Grund an, wie oft es einen Ausfall gegeben hat, die Anzahl der Sektoren ist dann immer sehr hoch, da immer ein ganzer Block ausrangiert wird und ein Block hat schon mal 1MB oder 2MB, was in 512 Sektoren (alle Sektorzähler von SSDs und HDDs beziehen sich auf die Größe eines LBA also bisher immer auf 512 Byte!) ausgedrückt dann eben gleich 2048 oder 4096 sind, bei einem Ausfall. Der Rohwert von 05 zeigt dann also Werte an, die bei einer HDD einen sofotigen Austauch ratsam erscheinen lassen, bei SSDs aber total harmlos sind. Vor allem wenn man sich überlegt, dass aber Werk 80 Blöcke als defekt erkannt wurden:
DDD schrieb:
189 Factory_Bad_Block_Ct 0x000e 100 100 001 Old_age Always - 80
DDD schrieb:
199 UDMA_CRC_Error_Count 0x0032 100 100 001 Old_age Always - 0
Der zeigt nur Kommunikationsfehler an, wenn da welche registriert sind, sollte man das SATA Kabel auf festen Sitz prüfen und ggf. austauschen, das hat mit dem Zustand der SSD nichts zu tun.
DDD schrieb:
202 Perc_Rated_Life_Used 0x0018 098 098 001 Old_age Offline - 2
Da Gegenstück zu "173 Wear_Leveling_Count", es zeigt im Grund das gleiche an.
DDD schrieb:
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
So ein Selbsttest wäre das Gegenstück zu den oben genannten Herstellertools von HDDs, da prüft der Controller die SSD.
Wenn man sich
diesen Endurance Test einer 840 Pro ansieht, dann stellt man schnell fest, woran man erkennt, wann die NANDs einer SSD am Ende sind:
Die SSD hat am Ende 3PB geschrieben, nach etwa 500TB waren die 3000 garantierten P/E Zyklen verbraucht. Bei einer guten SSD mit hochwertigen NANDs ist also noch lange nicht Schluß, wenn die garantieren P/E Zyklen verbraucht sind, was ja gerade das hochwertige NAND von miderwertigen NANDs unterscheidet, da minderwertigen NANDs die garantierten P/E Zyklen laut dem Media Wear Indicator gar nicht erreichen bzw. der dann plötzlich massiv abgfällt und nicht linear bis 0 oder 1, wie es hier im obersten Bild zu sehen ist.
Im zweiten und dritten Bild sieht man, dass die Bad Block, also Wiederzugewiesene Blöcke (bei Sektoren wäre die Y-Skala entsprichen um den Faktor 2048 oder 4096 höher!) schon etwa ab der Hälfte der Zeit auftreten und selbst am Ende nicht einmal die Hälfte von ihnen verbraucht war. Ab und an ein defekte Block ist also noch lange kein Hinweis auf ein baldiges Ende der SSD, da sieht man hingegen bei den ECC-Fehlern, die steigen erst gegen Ende der Lebenszeit massiv an. Ab und an mal ein ECC-Fehler, nicht mit den Ultra-DMA Fehler zu verwechseln, macht also auch noch nichts, aber wenn die Wiederzuweisungen stätig steigen und dann noch die ECC-Fehler massiv ansteigen, dann gehen die NANDs dem Ende entgegen.