SSD 840 Pro: Wear_Leveling_Count - Ab wann spricht man von einem sehr hohen Wert?

Andi07

Banned
Registriert
Aug. 2013
Beiträge
681
Hallo ihr Lieben, Hallo liebe SSD-Erfahrenen!

Wear_Leveling_Count
Dies ist ein Wert, der nur bei SSD Festplatten vorkommt. Er definiert die Anzahl der Löschvorgänge auf einem einzelnen Speicherblock. Ist dieser Wert sehr hoch, sollte ebenfalls ein Tausch der Festplatte vorgenommen werden.
Zitat aus: http://blog.ip-projects.de/rootserver-festplatte-auf-fehler-pruefen/

Vorsichts halber oder Interessen halber möchte ich mich bzgl. meiner Samsung SSD 840 Pro (512GB) informieren, ab welchem Wert ich mir Sorgen machen muss und an Ersatz denken sollte? Aktuell steht der Wert bei 139. Vielen Dank!

Gruß Andi

smartctl:

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.2.0-34-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Samsung based SSDs
Device Model: Samsung SSD 840 PRO Series
Serial Number: XXXXXXXXXXXXXXX
LU WWN Device Id: 5 002538 5503ffea2
Firmware Version: DXM06B0Q
User Capacity: 512,110,190,592 bytes [512 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Wed Mar 16 12:16:26 2016 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (53956) seconds.
Offline data collection
capabilities: (0x53) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 35) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
9 Power_On_Hours 0x0032 098 098 000 Old_age Always - 8113
12 Power_Cycle_Count 0x0032 093 093 000 Old_age Always - 6870
177 Wear_Leveling_Count 0x0013 096 096 000 Pre-fail Always - 139
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0
181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 100 100 010 Pre-fail Always - 0
187 Uncorrectable_Error_Cnt 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0032 080 054 000 Old_age Always - 20
195 ECC_Error_Rate 0x001a 200 200 000 Old_age Always - 0
199 CRC_Error_Count 0x003e 097 097 000 Old_age Always - 2323
235 POR_Recovery_Count 0x0012 099 099 000 Old_age Always - 2167
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 73515838350

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 5083 -
# 2 Short offline Completed without error 00% 5083 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
255 0 65535 Read_scanning was never started
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 
Das kann dir doch eigentlich vollkommen egal sein. Immer ein Backup ist doch standard, also tausche die SSD wenn sie wirklich defekt ist, was aber in der Regel mindestens 5 Jahre dauert.. Dein Smartctl ist übrigens steinalt! Viel wichtiger bei SSDs sind die geschrieben TB, aber das zeigt dir diese uralt Version anscheinend nicht an.

BZW. hier findest du nähere Informationen... ist anscheinend ne Gleichung aus den written TB.
http://www.tomshardware.co.uk/answe...and-wear-level-count-sansung-840-pro-ssd.html
 
An Ersatz denkst du wenn die SSD auch wirklich ausfällt.

Bei der/ einer HDD machst du dir doch auch vorher keine Gedanken und weißt, dass die S.M.A.R.T.-Werte lediglich ein Anhaltspunkt sind/ sein können. Wenn die HDD ausfällt, schaffst du Ersatz an. Wenn die SSD ausfällt, schaffst du Ersatz an.

Oder rennst du sofort los und kaufst Ersatz, nur weil dir ein S.M.A.R.T.-Tool jetzt Werte anzeigt bei denen man mal so ganz langsam vorsichtig werden könnte und die HDD/ SSD entgegen der Anzeige des S.M.A.R.T.-Tools noch 280 Tage oder auch noch weitere 250 Wear-Leveling Vorgänge hält.

Und da du ja sicherlich auch weißt was Backups/ Sicherungen sind, kann dir der Ausfall, egal zu welchem Zeitpunkt auch passieren sollte, doch relativ egal sein.
 
Andi07 schrieb:
177 Wear_Leveling_Count 0x0013 096 096 000 Pre-fail Always - 139

Die SSD hat noch 96% ihrer spezifizierten Lebensdauer. Diese sollte also noch ein wenig halten.

199 CRC_Error_Count 0x003e 097 097 000 Old_age Always - 2323
Du solltest den korrekten Sitz des SATA Kabels prüfen, wenn der Wert 2323 noch ansteigt. Bei der Datenübertragung vom Mainboard zur SSD kam es 2323 zu Fehlern.
 
Wenn dir der Controller morgen abraucht, nützt dir der Status deiner verbleibenden Schreibvorgänge auch nichts.
 
Hallo32 schrieb:
Die SSD hat noch 96% ihrer spezifizierten Lebensdauer. Diese sollte also noch ein wenig halten.


Du solltest den korrekten Sitz des SATA Kabels prüfen, wenn der Wert 2323 noch ansteigt. Bei der Datenübertragung vom Mainboard zur SSD kam es 2323 zu Fehlern.

Vielen Dank für die Rückmeldungen!

Das SATA-Kabel und das Stromkabel habe ich aufgrund dessen schon getauscht. Das ist schon eine Weile her und der Wert hat sich seit dem nicht erhöht. Trotzdem Danke für den Hinweis! :)


"Die SSD hat noch 96% ihrer spezifizierten Lebensdauer." Das klingt ja sehr gut! Wie berechnet sich der Wert? Habe ich etwas überlesen?
____________________________________________________________________________________________________

Ob smartctl nun steinalt ist, das mag ja sein. Für mich ist es aber ausreichend, da es die relevanten Werte wohl anzeigt. Auch das als wichtig angesprochene LBAs_Written.
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 73515838350

Und Backup(s) habe ich natürlich. Mir geht es hier nicht darum, die SSD aufgrund von Smart-Werten auszutauschen. Sondern mich ggf. auf einen Ausfall vorzubereiten, da ich doch etwas auf `s Geld achten muss oder dann eben sparen muss.

Und da frage ich lieber etwas früher, als den Rechner eine Zeitlang nicht benutzen zu können. Grundsätzlich ist es schon so, wie angesprochen wurde, dass, wenn die SSD ausfällt, ich mir eine neue SSD holen werde. Natürlich.

Und falls das so rüber gekommen sein sollte, Entschuldigung, ich mache mich wegen dem Smart-Wert Wear_Leveling_Count von 139 nicht verrückt. Da ich eben nicht weiß, ob das ein sehr hoher Wert ist. Es ist einfach nur eine ganz nüchterne Frage, ab wann der Wert als sehr hoch angesehen wird. Denn spätestens ab dann würde ich anfangen müssen Geld zurückzulegen.

Wie bereits gesagt, ich frage lieber zu früh als zu spät. Und die SSD funktioniert nach wie vor super. Und darüber bin ich natürlich froh. Das hat aber nichts mit der Ausgangsfrage zu tun, um ggf. vorbereitet zu sein.

Mit freundlichem Gruß, Andi
 
Andi07 schrieb:
177 Wear_Leveling_Count 0x0013 096 096 000 Pre-fail Always - 139

Ja, du hast etwas überlesen. ;) (Siehe Markierung)

Der Hersteller der SSD hinterlegt in der Firmware einen Werten für die spezifizierte Anzahl der PE-Zyklen des Nands. Das dürften bei deinen Modell wahrscheinlich 3.000 sein. (Notfalls mal googeln.)
Von diesen hast du aktuell 139 Zyklen verbraucht.

1-139/3.000 ~ 0.96

Wichtig sind auch folgende Argumente:
5, 179, 183
Die Werte dieser Argumente sollten Null sein.

Über diese Argumente könnte man streiten:
181, 182, 195
Wobei ich auch bei diesen eine Null erwarte.
 
It is said that TLC 3 bit cell has roughly 1000 P/E cycle for its lifespan
Zitat aus http://www.tomshardware.co.uk/answers/id-2180127/ssd-die-wear-leveling-count-smart-reaches.html

Wenn das stimmt, dann habe ich bzgl. Wear_Leveling_Count mit einem Wert von 139 noch einiges an Luft. Auch wenn ich da auf einen Verbrauch von 13,9% komme und nicht von 4%. Oder galten die erwähnten 96% der noch verfügbaren spezifischen Lebensdauer dem LBAs_Written?

Was ich aber nicht verstehe, ist der in smartctl angegebene Grenzwert von 99 bei Wear_Leveling_Count, wenn TLC 3 angeblich bis zu 1000 Löschzyklen verkraftet.

Gruß Andi
 
a) Du hast eine Pro mit MLC und nicht mit TLC. Die 1.000 Zyklen sind für die TLC Modelle. Deine Pro dürfte ~3000 haben.
b) Das LBAs_Written spielt nur für die Garantie eine Rolle. Dieser Wert sagt nur aus, wie viele LBAs vom Betriebssystem beschrieben wurden. Es beinhaltet aber keine Information wie viele LBAs von der SSD beschrieben wurden.

Smart Werte Samsung:
http://www.samsung.com/global/busin.../SSD/global/html/whitepaper/whitepaper07.html

Woher hast du die 99 beim Wear_Leveling_Count?
 
Wobei man die 1000 P/E Zyklen nicht für alle TLC NANDs ansetzen kann, die waren bei der 840 (ohne Namenszusatz) gültig, die TLC NANDs der 850 Evo müssten 3000 spezifizierte P/E Zyklen haben, weil es 3D NAND ist, bei Samsung wird das V-NAND genannt und damit so viele wie die MLC NAND der 840 Pro. Die planaren TLC der 840 Evo haben so 1200 und für die von SanDisk in der Ultra II hat Anandtech aus den S.M.A.R.T. Werten rund 500 abgeleitet. So pauschale Aussagen wie SLC hat MLC 3000 Zyklen und TLC 1000 sind also totaler Quatsch und im konkreten Fall kann man damit total daneben liegen.

Die NANDs Deiner SSD werden Dich übrigens überleben, wenn nicht vorher etwas anderes an der SSD kaputt geht oder Du sie ausgrangierst, mache Dir darum also keine Sorgen, denn 139 Zyklen sind nach rund 2 oder mehr rein gar nichts. Von der 840 Pro 128GB gibt es hier einen Endurance Test und die NANDs haben ungefähr das 6x der spezifizierten P/E Zyklen erreicht, die 3000 sind also sehr zurückhaltend angegeben.
 
Wenn man die Retention Time beachtet, wird so ein Test nie fertig. Das hat mit Fahrlässigkeit nichts zu tun, es ist nur eben ein Test der nicht die Aussage macht, die Du vielleicht dort erwartest, aber man kann eben nicht in einen Test hineininterpretieren, was dort nicht da ist. Das Ergebnis erlaubt aber den Schluss, dass die NAND eben weit mehr als die spezifizierten Zyklen aushalten, was man auch erwarten kann, denn die müssen ja bis zum Erreichen der spezifizierten auch noch bestimmte Eigenschaften einhalten können und das geht nicht mehr, wenn sie gleich darauf so kaputt sind, dass die SSD stirbt. Das Doppelte sollten sie also etwa aushalten, dann kann man wohl davon ausgehen, dass sie die Spezifikationen einhalten.

Ein weitere Unsicherheit bei solchen Tests ist die Temperatur der NANDs, die JESD218 geht ja bei Consumer SSD von 40°C im Betrieb aus und je wärmer die NANDs sind, umso weniger leidet die Isolierschicht beim Schreiben und Löschen, die NANDs halten dann also mehr P/E Zyklen aus. Man kann aber bei einem Dauertest wohl unterstellen, dass NANDs die ständig beschrieben werden auch wärmer sind als im Normalbetrieb beim Heimanwendern üblich. Von daher sind die Ergebnisse wohl generell eher immer zu optimistisch, aber wissenschaftlich Genauigkeit kann man auch von solche Tests im Netz nicht verlangen und das Schreiben bis zum Ende ist ja häufig und daher sind die Ergebnisse dann wenigstens halbwegs vergleichbar und liegen vor allem realtiv schnell vor.
 
Vielen Dank ihr Lieben! :)

Na dann kann ich die SSD weiterhin ganz nüchtern und zufrieden benutzen.

Bei TLC oder MLC war ich mir nicht sicher. Habe mich zwar versucht zu informieren, aber bei Samsung habe ich in Verbindung mit meiner SSD keine der Abkürzungen gefunden. Nur 840 Pro
Samsung 2x nm Toggle DDR 2.0 NAND Flash Memory
, weshalb ich wohl auch TLC mit angeblich 1000 Löschzyklen zitiert habe.

Die Werte von 99 habe ich aus smartctl, aber das war ein Lesefehler. Verzeihung! Richtig ist 96.

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
177 Wear_Leveling_Count 0x0013 096 096 000 Pre-fail Always - 139

Ich kann das hier nicht so richtig wiedergeben. Die Werte 096 stehen in smartctl unter VALUE und unter WORST.

Gruß Andi
 
Zuletzt bearbeitet:
Ja 96 ist im Prinzip wie viele Prozent der 3000 spezifizierten P/E Zyklen noch übrig sind, wobei Samsung da immer durch abschneiden der Nachkommastellen abrundet. Da der Wert nur fallen kann, ist VALUE und WORST auch immer identisch, da WORST ja den tiefsten Stand anzeigen soll, den VALUE jemals gehabt hat. Das Du eine 840 Pro hast, siehst Du ja auch schon an der Ausgabe von smartctl.
 
Holt schrieb:
Das Doppelte sollten sie also etwa aushalten, dann kann man wohl davon ausgehen, dass sie die Spezifikationen einhalten.
Wie kommst du auf den Wert?

Die maximale Anzahl der Zyklen die der Flash in solchen "Tests" aushält dürfte den meisten Personen egal sein, in möglicher Verlust der Daten hingegen aber nicht.

Was bringen Aussagen, dass der Flash x Zyklen aushält aber nicht einmal bekannt ist, ob die Daten nach 1 Woche noch lesbar sind?
 
Der Wert ist geschätzt und wie lange die Daten nach wie viele Zyklen noch lesbar sind, könnte man nur mit extrem aufwendigen und langwierigen Tests ermitteln, wenn die Ergebnisse dann da sind, taugen sie nur noch um das Schild in der Vitrine eines SSD Museums zu aktualisieren. :evillol:

Die Daten Retention Time fällt eben mit der Anzahl der benutzen Zyklen in so eine Kurve, wobei man beachten sollte, dass Skalen nicht beschriftet, aber logarithmisch sind und auf der Basis zusammen mit den Ergebnissen anderer solche Endurance Tests und den Herstellerangaben zu den P/E Zyklen der NANDs der dort getesteten SSDs beruht meine Schätzung:

dataretention-png.320901



Gegen Datenverlust helfen nur Backups, einerseits kann jede HW auch mal plötzlich ausfallen, auch jede SSD und zum anderen Bedrohen nicht nur HW Ausfälle die Daten. Wer also wirklich schmerzhaften Datenverlust erleidet, war vorher beim Backup schlampig.
 
Hallo32 schrieb:
Wichtig sind auch folgende Argumente:
5, 179, 183
Die Werte dieser Argumente sollten Null sein.

Über diese Argumente könnte man streiten:
181, 182, 195
Wobei ich auch bei diesen eine Null erwarte.

Entschuldigung Hallo32!

Darauf bin ich gar nicht eingegangen. Alle dieser genannten Argumente sind Null! ;)

Gruß Andi
 
Auch wenn sie mal nicht mehr 0 sind, wenn mal ein NAND Block ausfällt, ist das kein Beinbruch und kann z.B. passieren, wenn während eines Schreib- oder Löschvorgangs darauf unerwartet die Spannung ausfällt, was schon 2167 mal passiert ist:
Code:
235 POR_Recovery_Count 0x0012 099 099 000 Old_age Always - 2167
Das ist auch im Verhältnis zu den Einschaltungen viel:
Code:
12 Power_Cycle_Count 0x0032 093 093 000 Old_age Always - 6870
Fast jedes 3. mal wurde der Rechner nicht korrekt runtergefahren oder die SSD darüber nicht informiert!

Am wichtigsten ist aber der Wert 187, der gibt die Fehler aus, die die SSD intern nicht mehr korrigieren konnte, was also am ehesten den Schwebenden Sektoren einer HDD entspricht und der ist 0:
Code:
187 Uncorrectable_Error_Cnt 0x0032 100 100 000 Old_age Always - 0
 
Hallo Holt!

Wegen
Code:
199 CRC_Error_Count 0x003e 097 097 000 Old_age Always - 2323
habe ich ja

Andi07 schrieb:
Das SATA-Kabel und das Stromkabel habe ich aufgrund dessen schon getauscht. Das ist schon eine Weile her und der Wert hat sich seit dem nicht erhöht. Trotzdem Danke für den Hinweis! :)

Ich habe mir das damals aufgeschrieben oder smartctl ausgedruckt, um das nach den Kabelwechseln (SATA+Strom) vergleichen zu können. Allerdings habe ich da leider nur darauf geachtet, ob sich die 2323 von Faktor 199 erhöht.

Leider finde ich den Ausdruck oder Zettel nicht, um sagen zu können, ob
Code:
235 POR_Recovery_Count 0x0012 099 099 000 Old_age Always - 2167
und
Code:
12 Power_Cycle_Count 0x0032 093 093 000 Old_age Always - 6870
gleich geblieben sind. Ich habe wohl den Zettel oder den Ausdruck weggeschmissen, nachdem sich der Wert von 2323 seit einer halben Ewigkeit nicht geändert hat.

Leider habe ich da die Faktoren 12 und 235 wohl nicht beachtet, um sagen zu können, ob die Werte auch gleich geblieben sind oder nicht.

Aber ich kann ja mal die Faktoren 12 und 235 eine Weile beobachten, ob sich die Werte erhöhen.

Und das ich den Rechner nicht korrekt herunterfahre, das kann ich nicht sagen. Allerdings ist mir dabei, bis vor einer Weile, immer aufgefallen, dass im Post-Screen (kurz vor dem Abschalten) immer eine Zeile vorhanden war mit

cryptdisk irgendwas ... failed
failed war farbig geschrieben. Seit einer Weile kommt diese Meldung nicht mehr. Keine Ahnung, vielleicht waren das Fehler im Kernel oder andere Fehler, die durch Updates behoben wurden.

Gruß Andi
 
Der Power_Cycle_Count steigt bei jedem Ein- Ausschalten des Rechner, sehr wahrscheinlich auch wenn er in den Standby geht. Der Wert steigt also sowieso regelmäßig, aber die POR_Recovery_Count sollten möglichst nicht steigen. Bei einem BOSD, wenn man ins BIOS/UEFI geht oder wenn der Rechner abstürtzt, passiert das schon mal. Man sollte nur aufpassen, dass der Rechner immer richtig und komplett runtergefahren ist, bevor man z.B. den Stromstecker abzieht oder die Mehrfachsteckdose ausschaltet. Es reicht nicht, bis der Monitor ausgeht, sondern der Rechner muss wirklich aus sein, die Power-LED also ausgegenen sein und am Besten die Lüfter stillstehen.
 
Zurück
Oben