[Sammelthread] HDD-Probleme, SMART-Analysen

Yumix · 2. Februar 2013

Hier mal meine:

Spieleplatte, WD Caviar Black 500GB, die letzten Tage öfters Programme gecrasht (vor allem Origin) und ist ab und zu einfach im Windows verschwunden, Papierkorb korrupt und nun heute dann kein Zugriff mehr darauf gehabt.
Die Sache ist dass ich noch ein Mainboard mit P67 Chipsatz in der Revision B2 verwende, also da wo die SATAII Ports nach einiger Zeit ein defekt aufweisen können. Hab die Platte auf den 2. SATAIII Port gewechselt und sie wird wieder erkannt und spackt seitdem nicht mehr rum, so dass ich davon ausgehe dass das Problem auch vom Mainboard kommt, darauf könnten auch die UltraDMA CRC Errors deuten oder ist das nur Kabel?
Und wie ist der Current Pending Sector Count zu werten bzw. sind die SMART Werte ansonsten okay? Will auf Nummer sicher gehen.

edit: Gerade #811 gelesen, damit hat es sich schon fast beantwortet. Würde sagen abwarten und schauen ob die 3 Sektoren verschwinden und die UltraDMA Fehler nicht weiter steigen?

Inzersdorfer · 2. Februar 2013

Eben, für 7.320 Betriebsstunden sind die 3 pending Sectors unbedenklich, von selbst verschwinden die aber meistens nicht, die UDMA CRC Fehler sind wohl älter (Aktueller Wert ist ja auf optimalen 200).

Mark93 · 3. Februar 2013

Guten Tag,

folgende Frage zu meiner Systemfestplatte und einer weiteren: wie lange werden Sie noch durchhalten? Ich weiß das ist schwer zu beurteilen, aber eine grobe Richtung wäre super.
Zur Info: Die Systemfestplatte (252 HJ) hat sich wohl plötzlich im Zustand verschlechtert. Alle Daten sind schon gesichert, also diesbezüglich mache ich mir keine Gedanken. Ich möchte nur nicht eine noch halbwegs intakte Festplatte wegschmeißen.

Danke!

Madnex · 3. Februar 2013

Mark93 schrieb:
Ich weiß das ist schwer zu beurteilen, aber eine grobe Richtung wäre super.

Ein grobe Richtung kannst du haben. Die 252HJ ist nicht mehr zu gebrauchen. Da ist anscheinend der interne Cache der Festplatte defekt. Deshalb auch die Beurteilung "Schlecht". Wenn du noch Garantie auf die Spinpoint F1 hast, lass sie vom Hersteller austauschen. Benutzen würde ich sie jedenfalls nicht mehr.

Die HD501LJ hat zwar bereits zwei ersetzte Sektoren, was nicht tragisch sein muss, aber ohne die gesamten Smart-Werte sehen zu können, ist eine Beurteilung (selbst als grobe Richtung) nicht machbar. Zieh das Fenster bitte mal so weit auf, dass alle Smart-Attribute zu sehen sind und erstelle erneut ein Screenshot.

Mark93 · 3. Februar 2013

Danke für die Info!
Hier der Screenshot von der 501er.

Inzersdorfer · 3. Februar 2013

2 defekte Sektoren wurden durch Reservesektoren ersetzt
19 Datenadressierungsfehler, Anzahl der fehlerhaften oder ungültigen Datenadressen.

Im Hinblick auf die ersetzten Sektoren kann man die Platte als noch gut einstufen.
Die Datenadressierungsfehler haben meist keine negativen Auswirkungen.

Mark93 · 3. Februar 2013

Danke für die schnellen Antworten!

.:Mo · 6. Februar 2013

Nabend,

ich hab mir inna Bucht ne Platte gekauft und würde mich freuen, wenn Ihr mal die smart Werte checken könntet (s. Bild).
Gibts vll. auch noch andere Möglichkeiten die Gesundheit der Platte zu überprüfen?
Danke schonmal!

Inzersdorfer · 6. Februar 2013

29 Wiederzuweisungsereignisse (C4) sind protokoliert, diese waren nicht erfolgreich da 0 Wiederzugewiesene Sektoren (05) verzeichnet sind. Es gab auch 3 Command Timeouts (BC) und 302 ReadError Retrys (FA). Die Platte wurde mittels Seatools überschrieben, dabei wurden die damaligen Leseprobleme einiger Sektoren behoben.

1) CrystalDiskInfo
Mit "Als Administrator ausführen" Aufrufen und in den Optionen
a) "Im Systray anzeigen" klicken
b) bei "Systray-Verhalten" "Hauptfenster verstecken" wählen
c) "Mit Windows starten" klicken
d) in "Verzögerung beim Windows-Start" "30 Sekunden" wählen

CDI startet automatisch minimiert mit und warnt bei einem nicht lesbaren/defekten Sektor (05, C5, C6).

.:Mo · 6. Februar 2013

Danke Dir, also ist die Platte noch "gesund" genug, um sie weiter nutzen zu können?
Übrigens hat sich der Wert C4 auf 31 bzw. 1F erhöht...

Inzersdorfer · 7. Februar 2013

Ohne entsprechende Erhöhung von 05 ? Kein gutes Zeichen. Hier sollte einmal mittels Seatools die Festplatte geprüft werden.

MichaelBW · 7. Februar 2013

Hallo Freunde,

hier das Logfile einer Platte, von der nicht mehr gebootet bzw. die nicht mehr erkannt wurde.
Nachdem das Stromkabel intern getauscht wurde hat es wieder funktioniert. Allerdings möchte ich Fehler auf der Platte ausschließen.
CrystalDisk Info hat unter Windows keine Fehler angezeigt. Unter Linux waren einige einträge rot eingefärbt.

Code:

smartctl 5.41 2011-06-09 r3365 [i686-linux-3.2.13-pmagic] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     SAMSUNG SpinPoint P80
Device Model:     SAMSUNG SP1614N
Serial Number:    S016J10Y360778
Firmware Version: TM100-30
User Capacity:    160,041,885,696 bytes [160 GB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Sat Feb  2 16:04:24 2013 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		( 6000) seconds.
Offline data collection
capabilities: 			 (0x1b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					No Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					No General Purpose Logging support.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 100) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   096   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   100   001   025    Pre-fail  Always   In_the_past 5696
  4 Start_Stop_Count        0x0032   096   096   000    Old_age   Always       -       4856
  5 Reallocated_Sector_Ct   0x0033   100   100   011    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail  Offline      -       0
  9 Power_On_Half_Minutes   0x0032   098   098   000    Old_age   Always       -       11821h+04m
 10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   000    Old_age   Always       -       527
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3812
194 Temperature_Celsius     0x0022   151   091   000    Old_age   Always       -       29
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       82338
196 Reallocated_Event_Count 0x0032   099   099   000    Old_age   Always       -       4
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Total_Offl_Uncorrectabl 0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   051    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   100   100   051    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 7 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 7 occurred at disk power-on lifetime: 11820 hours (492 days + 12 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 01 01 4f c2 b0  Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  b0 d0 01 01 4f c2 b0 00      00:04:35.375  SMART READ DATA
  ec 00 00 00 00 00 b0 00      00:04:35.375  IDENTIFY DEVICE
  ec 00 00 00 00 00 b0 00      00:00:35.563  IDENTIFY DEVICE
  ef 02 00 00 00 00 b0 00      00:00:35.563  SET FEATURES [Enable write cache]
  f5 00 00 00 00 00 b0 00      00:00:35.563  SECURITY FREEZE LOCK

Error 6 occurred at disk power-on lifetime: 9835 hours (409 days + 19 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  01 51 00 1f 12 60 e0  Error: AMNF at LBA = 0x0060121f = 6296095

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 d8 00 1f 12 60 e0 00      00:01:28.063  READ DMA
  c8 d8 08 df 0c 60 e0 00      00:01:28.000  READ DMA
  c8 d8 88 e7 0a 60 e0 00      00:01:27.625  READ DMA
  c8 d8 70 67 09 60 e0 00      00:01:27.438  READ DMA
  c8 d8 08 a7 ac 1a e1 00      00:01:27.375  READ DMA

Error 5 occurred at disk power-on lifetime: 4870 hours (202 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  02 51 00 00 00 00 a0  Error: TK0NF

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  10 00 00 00 00 00 a0 00      06:53:38.250  RECALIBRATE [OBS-4]
  00 00 01 01 00 00 a0 00      06:53:38.188  NOP [Abort queued commands]
  90 00 04 01 00 00 e0 00      06:53:37.188  EXECUTE DEVICE DIAGNOSTIC
  ec 00 05 01 00 00 a0 00      06:53:37.125  IDENTIFY DEVICE
  00 00 01 01 00 00 a0 00      06:53:25.500  NOP [Abort queued commands]

Error 4 occurred at disk power-on lifetime: 4839 hours (201 days + 15 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  02 51 00 00 00 00 a0  Error: TK0NF

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  10 00 00 00 00 00 a0 00      00:02:00.563  RECALIBRATE [OBS-4]
  00 00 01 01 00 00 a0 00      00:02:00.500  NOP [Abort queued commands]
  90 00 04 01 00 00 e0 00      00:01:59.500  EXECUTE DEVICE DIAGNOSTIC
  ec 00 05 01 00 00 a0 00      00:01:59.375  IDENTIFY DEVICE
  00 00 01 01 00 00 a0 00      00:01:45.188  NOP [Abort queued commands]

Error 3 occurred at disk power-on lifetime: 4839 hours (201 days + 15 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  02 51 00 00 00 00 a0  Error: TK0NF

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  10 00 00 00 00 00 a0 00      19:11:03.438  RECALIBRATE [OBS-4]
  00 00 01 01 00 00 a0 00      19:11:03.375  NOP [Abort queued commands]
  90 00 04 01 00 00 e0 00      19:11:02.375  EXECUTE DEVICE DIAGNOSTIC
  ec 00 05 01 00 00 a0 00      19:11:02.313  IDENTIFY DEVICE
  00 00 01 01 00 00 a0 00      19:10:48.125  NOP [Abort queued commands]

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     11821         -

Device does not support Selective Self Tests/Logging

Vielen Dank,
Michael

Inzersdorfer · 7. Februar 2013

Es gab 4 gescheiterte Wiederzuweisungsereignisse (ID 196/C4) aber 0 Wiederzugewiesene Sektoren und 527 Kalibrierwiederholungen (ID 11/0B), bei denen der vorhergegangene Kalibriervorgang gescheitert ist, das sind Anzeichen für mechanische Probleme, beobachte die Platte einige Tage, steigt ID 11/0B weiter an, sollte die Platte ersetz werden.

Apfelorange · 8. Februar 2013

Hallo,

es geht mir um die angehängten SMART-Werte, warum bei 685 power on hours, schon überall "pre-fail" und "old age" steht.

Falls es interessiert hier noch weitere "Fehlerinfos" dazu:

ich hab hier meine Samsung 1TB Platte (Modell siehe SMART-screenshot). Es ist bekannt, dass Samsung-Platten Probleme mit externen Sonnet-Produkten an Macs machen. Die Probleme hatte ich in einem Sonnet Gehäuse in der Form, das 4x 1TB nicht komplett erkannt wurden.
Seit einiger Zeit habe ich die Platte an einem internen SATA-PCI-Controller.

Heute habe ich die Lüfter (Gehäuse und NT) getauscht, ich weiß das kann nichts damit zu tun haben, aber seit dem, konnte ich keine Dateien mehr Schreiben.
Das Festplattendienstprogramm meldete sowas wie "Datei bla und Datei bli haben überlappende Bereiche" oder so ähnlich.
Auf reparieren geklickt dann kam:

Volume „Samsung2008a“ überprüfen
HFS+ Volume wird überprüft.
Ungültige Knotengröße des B-Baum-Headers
Das Volume „“ muss repariert werden.

Fehler: Der zugrundeliegende Prozess meldete einen Fehler beim Beenden.

1 HFS-Volume überprüft
Volume muss repariert werden.

Letzteres sollte eigentlich nur ein Fehler im Dateisystem sein und durch Formatieren gelöst werden können.

Meine Sorge ist nur folgende. Da die Samsung Platten ja immer irgendeine Möglichkeit der Inkompatibilität mit Macs beinhalten, würde ich sie gern irgendwann loswerden, aber ich kann sie ja schlecht jemandem anbieten, wenn die nicht in Ordnung ist. Deshalb: kann ich den SMART-Werten vertrauen und sie als fehlerlos bezeichnen?

Inzersdorfer · 8. Februar 2013

Type bezieht sich auf Attribute Name, d.h. bei erreichen des Threshold Wertes:
Old age = Bad/Failed: "Aktueller Wert" Zähler abgelaufen (meist unbedenklich)
Pre-fail = Bad/Failed: kritische Parameter, noach nicht gesicherte Daten umgehend sichern,
ein Versagen der Platte kann unmittelbar bevorstehen.

Der obige Screenshot der SMART Werte sollte als Nachweis reichen, die Platte ist in Ordnung.

Madnex · 8. Februar 2013

Apfelorange schrieb:
es geht mir um die angehängten SMART-Werte, warum bei 685 power on hours, schon überall "pre-fail" und "old age" steht.

"pre-fail" und "old age" sind keine Bewertung sondern nur der Typ des Attributes. "pre-fail" bedeutet beispielsweise nur, dass dieses Attribut kritische Funktionen der Festplatte überwacht.

Apfelorange · 8. Februar 2013

Es sagt mir also nur, dass die Platte so eingestellt ist, dass ich gewarnt weren werde, sollte die Platte "vor dem Durchfallen" / "pre fail" sein?

Sobald der threshold-Wert unterschritten wird, steht bei Typ "failing now" oder "failed", das heißt im Umkehrschluss, dass pre-fail überschritten wurde? ("pre-fail" heißt aber nicht, dass ein Attribut vorm Ausfall steht, sondern, dass SMART reagieren wird, sobald bedenkliche Werte unter threshold fallen werden?).

Diese http://www.volitans-software.com/support.php#questionattributeattributes Erklärung zu diesme SMART-Programm selber, verstehe ich dann aber auch nicht, das heißt, ich muss eure Info im Kopf haben, um das englische so zu verstehen, wie es wahrscheinllich gemeint ist.

PS: nach Wikipedia heißt es aber, dass die Platte kurz vorm defekt ist und nicht, dass der Typ so gesetzt ist, dass sie warnen wird, wenn sie mal vorm defekt sein sollte. "„Pre-fail“ ist eine Warnung vor einem baldigen Ausfall, während „Old age“ bedeutet dass es sich allgemein um fortschreitende Alterung handelt." (http://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology).
PPS: das interpretieren auch andere Googleergebnisse so. Ist jetzt die Platte doch schon nach bloß 658 Stunden, ausgelutscht? "If the attribute type is “Pre-fail”, this means that SMART thinks the hard disk is just
before failure." (http://www.google.de/search?q=smart...&rls=org.mozilla:de:official&client=firefox-a)

Inzersdorfer · 8. Februar 2013

Jaja, Memo an michr: keine Post mehr nach dem Nachtdienst.
Type Pre fail: bei Warnung kann ein Versagen bevorstehen.
Type Old age: bei Warnung läuft der vom Hersteller in der Firmware vorgesehene Zähler ab.

Hier zum Beispiel
1) für Power On Hours, Zähler abgelaufen, die Quantum funktioniert natürlich weiterhin
2) für Reallocated Sectors, es sind keine Reservesektoren mehr vorhanden, der nächste Pending Sector steht aber schon an, diese Samsung ist zu entsorgen.

Madnex · 8. Februar 2013

Apfelorange schrieb:
PS: nach Wikipedia heißt es aber, dass die Platte kurz vorm defekt ist und nicht, dass der Typ so gesetzt ist, dass sie warnen wird, wenn sie mal vorm defekt sein sollte. "„Pre-fail“ ist eine Warnung vor einem baldigen Ausfall, während „Old age“ bedeutet dass es sich allgemein um fortschreitende Alterung handelt." (http://de.wikipedia.org/wiki/Self-Mo...ing_Technology).
PPS: das interpretieren auch andere Googleergebnisse so. Ist jetzt die Platte doch schon nach bloß 658 Stunden, ausgelutscht? "If the attribute type is “Pre-fail”, this means that SMART thinks the hard disk is just
before failure." (http://www.google.de/search?q=smart+...ient=firefox-a)

Nein, "Pre-fail" ist keine Warnung. Das ist nur der Name des Typs, sprich, die Kategorie des jeweiligen Smart-Attributes. Das wird sich auch nicht in "failing now" oder "failed" ändern.

Apfelorange · 8. Februar 2013

Sorry, ich bin auch etwas blind

Wenn man sich nochmal meinen screenshot anschaut, dann hätte ich mir es auch selbst zusammenreimen können. Der Typ heißt "pre-fail: ich heiße so, weil ich nebenstehend angebe, ob failed, wenn failed und nicht ob old, weil alt", dahinter steht in der Rubrik mit dem Namen "Failed", das Wort "Never". Sprich also, der gegen den threshold abgeglichene Wert hat für den "Mecker"typus "pre-fail" keinen Anlass gegeben neben sich zu melden "failed".

[Sammelthread] HDD-Probleme, SMART-Analysen

Commander

Admiral

Newbie

Vice Admiral

Newbie

Admiral

Newbie

Cadet 3rd Year

Anhänge

Admiral

Cadet 3rd Year

Admiral

Cadet 4th Year

Admiral

Lieutenant

Anhänge

Admiral

Vice Admiral

Lieutenant

Admiral

Anhänge

Vice Admiral

Lieutenant

Ähnliche Themen

Passend zum Thema