SanDisk SSD mit unplausiblen SMART-Werten

Mordi

Uwubernetes 1.30
Moderator
Registriert
Okt. 2015
Beiträge
12.367
Hi,

vor etwa 9-10 Jahren kaufte ich eine SanDisk 120GB SSD. Die tut auch nach wie vor funktionieren, derzeit als OS-SSD fürs NAS. Hab nun routinemäßig mir die SMART-Werte ausgeben lassen, aber die Betriebsstunden sind absolut unplausibel mit 1397. Zum Vergleich: Im selben System laufende Platten sind seit Sommer nun auf über 3000 gekommen.
Hier ein (gekürzter) Auszug von smartctl --all:
Code:
Device Model:     SanDisk SDSSDA120G
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Retired_Block_Count     0x0032   100   100   000    Old_age   Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   117   100   000    Old_age   Always       -       1397h+00m+00.000s
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       2961
166 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       2700
167 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
168 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       2750
169 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       21
170 Reserve_Block_Count     0x0032   100   100   000    Old_age   Always       -       0
171 Program_Fail_Count      0x0032   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
173 Unknown_SandForce_Attr  0x0032   100   100   ---    Old_age   Always       -       2734
174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       340
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   072   100   000    Old_age   Always       -       28 (Min/Max 0/67)
199 SATA_CRC_Error_Count    0x0032   100   100   000    Old_age   Always       -       9
230 Life_Curve_Status       0x0032   100   100   000    Old_age   Always       -       91
232 Available_Reservd_Space 0x0033   100   100   004    Pre-fail  Always       -       100
233 SandForce_Internal      0x0032   100   100   000    Old_age   Always       -       256844
241 Lifetime_Writes_GiB     0x0030   253   253   000    Old_age   Offline      -       12462
242 Lifetime_Reads_GiB      0x0030   253   253   000    Old_age   Offline      -       10870

SMART Error Log Version: 1
No Errors Logged
Ich habe auch mal in die SMART Test Logs geschaut, da gibts die Tests #12 und #13 mit wesentlich höheren PowerOn-Hours:
Code:
um  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1339         -
# 2  Short offline       Completed without error       00%      1339         -
# 3  Reserved (0x0d)     Completed without error       00%      1338         -
# 4  Vendor (0x4b)       Self-test routine in progress 90%      1338         -
# 5  Short offline       Unknown status (0xb)          10%      1338         -
# 6  Short offline       Completed without error       00%      1338         -
# 7  Short offline       Completed without error       00%      1338         -
# 8  Short offline       Completed without error       00%      1327         -
# 9  Short offline       Completed without error       00%      1316         -
#10  Reserved (0x0d)     Completed without error       00%      1316         -
#11  Vendor (0x4b)       Self-test routine in progress 90%      1293         -
#12  Short offline       Unknown status (0xb)          10%     63819         -
#13  Short offline       Completed without error       00%     45326         -
#14  Short offline       Completed without error       00%      1282         -
#15  Short offline       Completed without error       00%      1282         -
#16  Short offline       Completed without error       00%      1270         -
#17  Short offline       Completed without error       00%      1270         -
#18  Short offline       Completed without error       00%      1270         -
#19  Short offline       Completed without error       00%      1258         -
Könnt ihr euch einen Reim auf diese offensichtlich unplausiblen Werte machen? Was könnte diese seltsamen Betriebsstunden ausmachen?
 
  • Gefällt mir
Reaktionen: madmax2010
Auf dieses "Power On Hours" gebe ich nix mehr.
Ich hab hier 2 CT500MX die ich zeitgleich verbaut habe damals.
Beide lt CDI jungfraeulich. Gleiche Firmware.
Eine hat nun 8541h mit 1720 mal einschalten (ist die SSD mit dem Windows), die andere 16397h mit 1718 mal einschalten (sind meine VM abgelegt).

Crucial konnte mir keine Auskunft geben warum das so ist. 🤷‍♂️
 
  • Gefällt mir
Reaktionen: Wolfpac
Habe in meinem TV Reciever meine allerste SSD laufen " Bestellt am 20. April 2009 " die rennt angeblich nun seit erst seit 3 Jahren... Und arbeitet nebenbei bemerkt perfekt in dem Reciever. Ich gebe auf die Daten auch nicht mehr das meiste....

Edit: in meinem Fall war es eine:

A-Data ASX1064GSUML SSD XPG Externe Festplatte 6,4 cm (2,5 Zoll) 64 GB SATA USB 2.0​


https://m.media-amazon.com/images/I/41TR87JHulL._AC_SY450_.jpg

Warum auch immer damals USB dabei stand, es war eine SSD :)
 
Das häufigste Problem mit dem Power-On-Zähler scheint wohl zu sein, dass der wirklich Stunde zählt und unterschiedliche Hersteller da auch unterschiedliche Ideen dazu haben, ob si eine On-Time von 37 Mnuten als Stunde eintragen oder nicht.
 
  • Gefällt mir
Reaktionen: prayhe
Die Idee hat was. Aber...
Dann muesste ja bei mir ein Hersteller unterschiedlich zaehlen bei zwei seiner SSD mit selbiger Firmware. 🤔

Am besten garnicht auf diesen Wert achten ausser einmal gleich nach Einbau.
 
  • Gefällt mir
Reaktionen: prayhe
Die Stundenzahl wird oft durch Stromsparmechanismen beeinflusst. Wenn der SATA-Link in den Sleep-Mode versetzt wird zählt die SSD nicht weiter. Firmware-intern wird sicherlich nicht nur nach Stunden gezählt
 
@Denniss

Naja, das kann nach Hersteller unterschiedlich sein, zumindest laut eines 15 Jahre alten Fachzeitschriftartikels:
"Bei allen anderen SMART-Attributen sind die Rohdaten für den Anwender unerheblich. Denn es kann sein, dass ein Hersteller bei seinem Laufwerk die Betriebsdauer einer Festplatte (Attribut „Power On Hours Count“) in Stunden, ein anderer wiederum in Minuten zählt. Das probatere Mittel zur Vorsorgeuntersuchung bei einer Platte ist, sich daher an den normalisierten Werten zu orientieren." (Boi Feddern. Vergissmeinicht, Festplatten für die Langzeitdatenarchivierung. c't 2008, Heft 16)
 
Die Hex-Werte sind noch die Rohwerte ohne Normalisierung - wobei dir unterschiedliche Programme manchmal die Hexadezimalwerte in Dezimalwerte umwandeln. In der SMART-Werteliste sollte es vier Kathegorien geben: Value, Threshold, Worst und Raw. Viele Windows-Smart-Anzeige-Programme vor 2010 zeigten RAW gar nicht an - obwohl das bei Reallocated Sector Count schon interessant sein kann. Was unter "Value" angezeigt wird, ist der normalisierte Wert.

GSmartControl zeigt zu einer bei mir gerade an Windows eingehängten Backup-Platte an (Power On Time):
Value: 100; Threshold: 100; Worst: 0; Raw: 375
während mir gerade gleichzeitig Crystal Disk Info anzeigt:
Value: 100; Threshold: 100; Worst: 0; Raw: 177

Crystal Disk Info zeigt die Rohwerte hexadezimal an, GSmartControl dezimal - normalisiert ist aber die 100 bei Value und weil mir die Funktionsweise der Normalisierten Werte nicht 100% klar ist, ignorier ich die auch - wenn daran irgendwas pre-failure sein sollte, zeigen die Anzeigeprogramme schon eine konkrete Warnung.

P.S.
Bei Spin-Up Retry Count funktioniert es wohl so, da hat diese Platte (Toshiba HDWQ140) eine 105 als normalisierten Wert, 100 als Worst und Threshold 30. Bei jedem Anlauffehler wird Value um 1 verringert, fällt er unter 100, zeigt Crystal Disk Info Status Gelb "Vorsicht" und bei unter 30 Status Rot "defekt".
 
Zuletzt bearbeitet:
Eine alte SSD hat mal die SMART-Werte vergessen nach dem die für längere Zeit vom Strom getrennt war. Dann würde jedoch nicht eine andere Methode andere Werte auslesen.

Stimmen denn die Read and write? 12 TB write bei 10 TB read kommen mir spanisch vor bei einer 120 GB SSD.
 
Zurück
Oben