[Sammelthread] HDD-Probleme, SMART-Analysen

Hallo, ich habe mir vor ca. 3 Wochen eine 2TB 2,5" Seagate Expansion Portable Modell 2016 für meinen Media Player gekauft.
Die SMART-Werte wurde am Anfang getestet waren alle in Ordnung.

Die Festplatte lief bislang problemlos, jetzt hatte ich aber gestern Abend zum ersten Mal Ärger. Während gerade ein Film geschaut wurde, blieb das Bild plötzlich hängen und von der Festplatte kam nur noch eine Art fiepen. Ein Zugriff auf die Festplatte war scheinbar garnicht mehr möglich, Film stoppen funktionierte nicht, ebenso wenig wie der Versuch die Festplatte vom Media Player "sicher entfernen zu lassen".
Es blieb mir nicht anderes möglich als das USB-Kabel der Festplatte zum Media Player hin abzuziehen. Der Media Player ließ sich weiterhin normal bedienen, er war also nicht eingefroren.

Kann sowas schon auf ein baldiges ableben der Festplatte hindeuten oder kann sowas schon mal vorkommen ?
Hier sind die aktuellen Smart-Werte:
seagate.PNG
 
Die Werte zeigen nichts an, was auf ein baldiges Ableben hindeuten würde, die sind markellos. Nicht einmal einen Power-Off-Retract gab es bei der Aktion, die Platte hatte also die Köpfe beim Abziehen schon geparkt.
 
Ist der Mediaplayer ein normaler PC? Gerade die Frontanschlüsse können da immer wieder Ärger machen. Teste mal die Anschlüsse direkt auf dem Mainboard.
 
Nein, ein PC ist es nicht. Es ist ein richtiger Media Player genau gesagt handelt es sich um den Asus O!Play Mini

Das die Werte in Ordnung sind ist schon mal gut zu hören. Das Fiepen hörte sich jedenfalls nicht allzu gesund an. Ich hoffe es war ein einmaliges Verschlucken.
 
Hier mal was altes. Als IBM noch IBM war.

Die 14, 22, und 45 GB IBMs habe ich ja alle mechanisch demontiert ... aber so eine mächtige 123 GB Platte hebe ich vielleicht noch auf.
Vielleicht verstirbt mal die 512 MB-IDE-Platte, die ich noch im Einsatz habe ... wäre ein bisschen blöd. Falls es von der einen Backup gibt, ist der auf QIC-Bändern.
Allerdings dürfte sich der entsprechende Rechner sehr schwer mit >4 GB Platten tun.
:evillol:

IC35_Deskstar_label.jpg
IC35_120GB.PNG
 
Eine IC35L :D Bin mir jetzt bei dem Modell nicht sicher, aber gehört die zur Deathstar Serie? :evillol:

Anyway, da haben wir wieder ein Beispiel für die Werte C0/C1 die identisch sind.
 
C0 und C1 sind vor allem auch höher als 0C, wobei ich bei einer Deskstar das nun auch wieder gesehen habe. Keine Ahnung wie das bei denen passiert und was da genau als Power-Off Retract gewertet wird, dass muss ja nicht immer das gleiche bei allen Herstellern / Modellen sein, da muss man dann im Zweifel ins Product Manual oder eine entsprechende andere Dokumentation schauen, nur findet man diese bei den meisten Hersteller kaum noch im Netz. Üblicherweise ist es halt heutzutage dann, wenn die Spannungsversorgung unterbrochen wird und dabei die Köpfe nicht geparkt waren.
 
Die 7K6000 zählt C0 ja auch dann hoch, wenn die einfach nur durch Software in den Standby geht.
Wenn eine 14 Jahre alte IBM das auch schon macht, dann ist das bestimmt "richtig".

Nun ist es gerade schade, dass ich die anderen alten IBMs gerade vor 2-3 Wochen demontiert habe. Mein solo USB-IDE-Adapter liest SMART nicht, daher habe ich die Werte nicht. Das externe Gehäuse mit der IC35 drin kann es ja, das wäre jetzt was gewesen.

Zur 7K6000 finde man ein "Datasheet" mit 274 Seiten:
https://www.hgst.com/sites/default/...star_7K6000_SATA_OEM_Specification_Rev1.3.pdf

Das Attribut hat da den bekannten Namen, aber eine Erklärung gibt es nicht.
 
Aber auf S. 240 steht gerade mal eine kurze Liste mit den Namen der Attribute und da ist eben 0xC0 bzw. 192 Power off Retract Count und 193 Load Cycle Count, nur sind die nicht weiter dokumentiert. Bei Seagate wird "Attribute 192 - Emergency Retract Count" genannt, ist damit schon anderes benannt und besagt eben nur die Unload die ungeplant erfolgten. Bei HGST scheint es wie in Wikipedia als "Count of times the heads are loaded off the media. Heads can be unloaded without actually powering off" definiert zu sein, wobei ich mich frage was es dann mit "Power-Off" zu tun hat und es ist dann eben genau das Gleiche wie Attribut 193 "Count of load/unload cycles into head landing zone position". Deshalb macht es dann auch eigentlich wenig Sinn beide Attribute auszugeben. Die Seagate Definition ist da irgendwo sinniger, denn solche Notfall Parkvorgänge der Köpfe sind meist mit mehr Verschleiß verbunden als die geplanten.
 
Hallöchen,

ich hatte eine ältere Reserve-HDD aus dem Schrank hervorgekramt und vorm Einbau ein paar Tests (SeaTools u.a.) durchlaufen lassen, die alle ohne Makel oder ungewöhnliche Geräusche bestanden wurden. Jedoch ist mir beim Auslesen der SMART-Werte aufgefallen, dass sich die Platte anscheinend nicht mehr im besten Zustand befindet. Soweit ich beurteilen kann, könnten End-to-End-Fehler auf fortgeschrittenen Verschleiß hindeuten; die HDD lief ja auch quasi im Dauerbetrieb, bevor sie eingelagert wurde. Sicher bin ich mir aber nicht. Was meint ihr?

http://f.666kb.com/i/d7s2yr0i5esm8by00.jpg

Grüße
 
Ja, aber gar nicht mal wegen der 14 wiederzugewiesenen Sektoren, das wäre ein sehr hartes Urteil, sondern weil die auch schon 46 Ende-zu-Ende Fehler hat, was kein Hinweis auf einen Verschleiß ist, sondern Fehler auf den internen Datenpfaden. Die hat also vermutlich wirklich korrupte Daten geliefert, denn ich bezweifeln das die solche Fehler auch noch selbst korrigieren kann, denn schon eine Erkennung wie viele Seagate sie haben ist für Consumer HDDs nicht selbstverständlich. Wie man sieht ist dort der Threshold 99 und der Aktuelle Wert erreicht den schon beim ersten Fehler, was zeigt wie ernst der Controller diese Fehler nimmt und schon ein solche Ende-zu-Ende Fehler bedeutet das Aus für eine HDD!

Außerdem hat der G-Sensor schon über 10.000 zu harte Schocks/Stöße während des Betriebs ermittelt, Leute HDDs sind empfindlich!! und dafür sind nur 14 wiederzugewiesene Sektoren wirklich wenig, aber da sie ja auch schon 373669 mal die Köpfe geparkt hat, waren diese bei den meisten der Stöße vermutlich geparkt und dann vertragen HDDs diese Misshandlung etwas besser.

Tausche sie aus und wenn es für das gleiche Gerät ist, dann nimm besser eine SSD, die vertragen mechanische Stöße viel besser und offenbar erleiden die Platten dort eine Menge davon.
 
Unten mal die SMART - Werte von meiner Platte, ist eine Seagate Nas 2TB.

Bei den Werten für "Raw Read Error Rate" und "Seek Error Rate" bin ich erst mal erschrocken, aber nach etwas googlen bin ich dann doch beruhigt. Seagate nutzt da wohl eine andere Darstellung (Stichwort 48 bit), die eigentliche Anzahl der Fehler ist hier wohl 0.



Code:
smartctl 6.4 2014-10-07 r4002 [i686-linux-3.16.0-4-586] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate NAS HDD
Device Model:     ST2000VN000-1HJ164
Serial Number:    
LU WWN Device Id: 
Firmware Version: SC60
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5900 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2, ACS-3 T13/2161-D revision 3b
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sun Apr  3 18:56:53 2016 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  107) seconds.
Offline data collection
capabilities: 			 (0x73) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 262) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x10bd)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   111   100   006    Pre-fail  Always       -       40944832
  3 Spin_Up_Time            0x0003   095   095   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       17
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       651225
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       7
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       17
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   072   066   045    Old_age   Always       -       28 (Min/Max 20/28)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       3
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       17
194 Temperature_Celsius     0x0022   028   040   000    Old_age   Always       -       28 (0 18 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 
Was es mit die Lese- und Suchfehlern auf sich hat, ist Dir ja schon klar und damit ist alles bestens. Die anderen Werte sind ebenfalls in Ordnung.
 
@ kisser & Holt

Okay, danke. Woher die ganzen Stöße kommen sollen, ist mir jedoch schleierhaft. Vor der Einlagerung war die Platte durchweg in einem großen Tower eingebaut, der nur sehr selten bewegt (dann natürlich im ausgeschalteten Zustand) oder überhaupt berührt wurde. An einer Hauptverkehrsstraße oder Eisenbahnstrecke wohne ich auch nicht.
 
Hast du zufällig ein Soundsystem mit Subwoofer? Festplatten mögen Bass überhaupt nicht.
 
Die Mechanik ist hier das kleinere Problem. Die Elektronik ist defekt. Der Grenzwert für die End-to-end errors ist bei weitem überschritten.
 
kisser, Du meinst die von Trio3D und das hatte ich ja schon geschrieben, die von Dagobah ist auch in der Hinsicht in Ordnung:
Code:
End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
 
Ja, damals war in einem angrenzenen Raum ein Subwoofer in Betrieb, nur eben nicht in der Nähe des PCs. Na ja. Jedenfalls danke für die Hilfe, ich werde die HDD nicht mehr einbauen.
 

Ähnliche Themen

Antworten
1.922
Aufrufe
256.572
J
Zurück
Oben