[Sammelthread] HDD-Probleme, SMART-Analysen

@Holt
Also... eigentlich stehts (bis auf das Alter) um die HDD gar nicht so schlecht?

Wo sieht man da, dass sie schon weeeeit älter ist?
Bei Power on Hours steht doch 322d.
 
An der Kapazität, 120GB HDD werden schon lange nicht mehr gefertigt und am Modell, die HGST Travelstar 5K250 120GB, SATA (HTS542512K9SA00) wird bei Geizhals seit dem 26.06.2007 gelistet, erschien also schon vor 10 Jahren und so lange wird keine HDD gefertigt. Außerdem ist verrät die Preisentwicklung das sie nur bis so September 2010 überhaupt gelistet war, wobei die Preise ab März 2009 verraten, dass ab da nur noch wenige Reststücke angeboten worden sein dürften. Du solltest das genaue Alter anhand des Labels auf der Platte ermitteln können. Die Betriebsstunden sagen wenig aus, da HDDs eben auch altern wenn sie nicht benutzt werden und nicht unbeschränkt lagerbar sind.

Dazu schreibt Seagate z.B. hier und auch in einigen anderen Product Manuals:
Wenn also die Lagerbedingungen nicht eingehalten werde, sind 90 Tage und zwar in der ungeöffneten Originalverpackung, sonst bestenfalls 1 Jahr. Nach dem Öffnen sollten HDD nicht länger als 30 Tage stromlos sein.

Bei der neuen Barracuda Pro 10TB mit Heliumfüllung schreibt Seagate:
Also hier nur ein halbes Jahr in der ungeöffneten originalen Versandverpackung von Seagate und sonst 2 Monate, nur bei optimalen Bedingungen bis zu einem Jahr.

HGST schreibt für die Megascale:
Eine HDD die vermutlich schon seit 2008 nicht mehr gefertigt wird, ist also in jedem Fall alt und über die geplante Nutzungsdauer hinaus. Die kann noch eine ganze Weile funktionieren, ein Produkt sollte so ausgelegt werden das 95 bis 99% Exemplare bei Einhaltung der Spezifikationen die geplante Nutzungsdauer wenigstens erreichen und damit die 5 Jahre überschreiten, danach kann es dann aber auch jederzeit zuende gehen.
 
Hallo zusammen

ich habe wieder einmal ein Sorgenkind in form einer WD RED 4 TB
Die Smart werte sehen sehr gut aus:
Code:
=== START OF INFORMATION SECTION ===
Device Model:     WDC WD40EFRX-68WT0N0
Serial Number:    WD-WCC4E7DUDCD6
LU WWN Device Id: 5 0014ee 20bc8b08d
Firmware Version: 82.00A82
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon Jun 12 14:04:09 2017 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(53520) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 535) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x703d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   187   178   021    Pre-fail  Always       -       7608
  4 Start_Stop_Count        0x0032   098   098   000    Old_age   Always       -       2052
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   086   086   000    Old_age   Always       -       10788
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1695
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       4
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       2077
194 Temperature_Celsius     0x0022   107   106   000    Old_age   Always       -       45
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     10583         -
# 2  Short offline       Completed without error       00%     10416         -
# 3  Short offline       Completed without error       00%     10248         -
# 4  Short offline       Completed without error       00%     10081         -
# 5  Short offline       Completed without error       00%      9913         -
# 6  Short offline       Completed without error       00%      9745         -
# 7  Short offline       Completed without error       00%      9577         -
# 8  Short offline       Completed without error       00%      9410         -
# 9  Short offline       Completed without error       00%      9242         -
#10  Short offline       Completed without error       00%      9074         -
#11  Short offline       Completed without error       00%      8906         -
#12  Short offline       Completed without error       00%      8738         -
#13  Short offline       Completed without error       00%      8570         -
#14  Short offline       Completed without error       00%      8403         -
#15  Short offline       Completed without error       00%      8235         -
#16  Short offline       Completed without error       00%      8067         -
#17  Short offline       Completed without error       00%      7899         -
#18  Short offline       Completed without error       00%      7731         -
#19  Short offline       Completed without error       00%      7605         -
#20  Short offline       Completed without error       00%      7437         -
#21  Short offline       Completed without error       00%      7269         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

crystaldisk.JPG

Sieht doch alles gut aus....:D
Jedoch bekomme ich diese Fehlermeldung unter linux bei kill disk:
wdc wd20ears-00mvwb2.png
Ein Reboot und die Sache ist weg... Komisch...

Wen ich jedoch mit Miene Knapp TS220 die disk in ein Bestehendes RAID 1 einfügen möchte als ersetzt disk..
Bekomme ich einen Disk Fehler im Log und es passiert nichts..
in der Konsole diese Meldung:
Code:
WARNING: Re-reading the partition table failed with error 16: Device or resource busy.
The kernel still uses the old table.
The new table will be used at the next reboot.
Syncing disks.

Die Disk hat noch garantie was meint ihr?
 
Die Werte sind soweit in Ordnung, da deutet nichts auf einen HW Fehler hin. Es greift wohl noch ein Prozess auf die Platte zu, so dass dies eben busy ist.
 
Zuletzt bearbeitet:
@Holt

Das dachte ich auch aber irgend etwas muss ja Faul sein an der Disk... Ich kann sie beim ersten start mit Kildisk LINUX nicht löschen Geadert spuckte beim löschen auch nur Fehler aus, und mein Knapp Nas möchte sie nicht ins RAID einbinden wob wohl sie mit der Seriennummer erkannt wird.... ( Da half auch kein Restart des NAS) Könnte ja ein Defekt des Controllers sein...
 
Kann mir mal jemand sagen ob die Werte wirklich noch gut sind wie das Programm anzeigt? Habe immer wieder die Meldung wenn ich von der HDD wo meine Medien drauf streame das es zu langsam sei oder die wenn ich einen Film abspiele das dieser einfach unterbrochen wird oder auch mal nachgebuffert werden muss. Habe das seid ca. 3 Wochen, vorher nie.

Edit: auch das starten von Windows dauert in denn letzten tagen länger als sonst. Wollte mal Daten von dieser HDD wo anders hin kopieren und das ging nicht immer. Laut smart soll aber alles gut sein. Habe diese jetzt ausgebaut und extern angeschlossen über USB und kopiere die Daten auf eine andere HDD was derzeit normal geht.

Hier mal die Werte der betroffenen HDD:

2017-06-15_101938.png

Und hier noch meine andere:

2017-06-15_181531.png2017-06-15_181527.png
 
Toby-ch schrieb:
Das dachte ich auch aber irgend etwas muss ja Faul sein an der Disk...
Es könnte auch an den Metadaten auf der Platte liegen, wenn sich gewissen Tool weigern sie zu überschreiben, zumindest ist es bei der Datenträgerverwaltung von Windows so. Hast Du mal probiert sie mit dd (if=/dev/zero ...) zu überschreiben?

Scoty, die 500GB WD hat mit fast 750.000 nun ihre spezifizierten Lade-Entladzyklen hinter sich, die hat auch einen Ultra-DMA CRC Fehler, es gab also mal ein Problem mit dem SATA Datenkabel. Dies kann aber längst behoben sein, schau also mal ob der Wert (Rohwert von C7) steigt. Außerdem solltest Du mal mit dem Resorucen Monitor prüfen ob es weitere Zugriffe auf die zu lahme Platte durch andere Programme gibt und die deswegen die Daten so langsam liefert. Parallele Zugriffe auf HDDs bremsen sich nun einmal gegenseitig sehr stark aus, aber abgesehen von den genannten Dingen ist dort nichts, nichts beunruhigenden und auch nichts was dies erklären würde.
 
Hmm komisch. Die 500gb HDD hatte ich erst jetzt wieder eingebaut weil eben die andere sich merkwürdig verhalten hat heute. Die vermeindlich betroffene ist jetzt extern per USB angeschlossen und die 500gb sozusagen wieder reaktiviert. Auf diese habe ich auch die Daten erst mal kopiert. Werde das ganze jetzt paar Tage so testen, sollte alles normal wieder sein dann muss die HDD was haben, sollte sich nichts ändern dann muss man weiter schauen.

Es schreibt nichts auf die HDD wenn ich es nicht will.
 
Bei der ST2000 werden 25 Command Timeouts angezeigt, das sind dann wohl die Verzögerungen. Mögliche Ursachen können neben einer vollen Platte, wildgewordene Systemprozesse (insbesonderes nach Updates) auch Probleme mit der Spannungsversorgung oder ein interner Defekt der HDD sein, läßt sich hier mit deiner Beschreibung nicht weiter einschränken.

Die WD5000 ist schon jenseits der geplanten Lebensdauer (747.017 Load/UnloadCycles bei 31.500 Betriebsstunden) aber in Ordnung.
 
Scoty schrieb:
Es schreibt nichts auf die HDD wenn ich es nicht will.
Es ist egal ob ein Prozess schreibt oder liest, beides verzögert die Zugriffe anderer Programme auf die HDD massiv.
 
Bei mehreren HDDs im Gehäuse oder mehr als 2400 Power On Hours im Jahr würde ich unbedingt eine Red (oder ggf. Purple) nehmen, aber keine einfache Deskopplatte wie die Blue.
 
Schau mal ins Datenblat, da steht doch drin wofür die gedacht sind. Man kann sie aber auch einfach in den Desktop packen, zumindest die Seagate SkyHawk hat auch im Product Manual die gleichen "10,000 average motor start/stop cycles per year" stehen wie die Barracuda Desktopplatten. Bei WD sind diese Informationen leider kaum bis gar nicht im Netz zu finden und das nun endlich auch mal das Workload Rating der Purple (180TB/Jahr) angegeben wird, ist schon fast ein Wunder. Da sich das mit dem der SkyHawk deckt, sollte es auch bei Start-Stopp Zyklen ähnlich sein.
 
@ Holt

ich habe das mit dem Tool KillDisk gemacht und zuerst alles mit gepaddelt gelöscht ( mit Fehler)
Code:
Erase Fixed Disk1 WDC WD40EFRX-68WT0N0 (S/N: WD-WCC4E7DUDCD6) - 3.64 TB Started: 2017-06-13 01:33:23
Storage size: 3.64 TB (4000787030016 bytes)
Erase method: One Pass Zeros (1 pass) [Verification 10%]
Pass 1 - OK (0x000000000000) Verification passed OK
Erase Finished: 2017-06-13 11:15:05
Total Erase Time: 09:41:42 Sanitizing Status: SUCCESS

eigentlich wollte ich 7 Mal dies mir jedoch durch einen Stromausfall abgebrochen, und an diesem pc habe (noch) keine USV:mad:
sollte doch das selbe sein wie dein Befehl?!?
Jedoch brachte dies bezüglich, RAID nichts auch danach wurde sie nicht akzeptiert... ich wollte es dann auf 7 mal erhöhen jedoch kam dann der Stromausfall bei 50 oder 60 % und da startete ich einfach den einfachen....:freaky::freaky:
 
Wie oft man überschreibt ist egal, einmal reicht danach lässt sich sowieso nichts mehr wiederherstellen. Wenn das RAID die HDD danach immer noch nicht akzeptiert, muss es einen anderen Grund haben, es kann dann aber nicht mehr an irgendwelchen Metadaten auf der Platte liegen, nachdem diese komplett mit 00 überschrieben wurde.
 
Holt schrieb:
Wie oft man überschreibt ist egal, einmal reicht danach lässt sich sowieso nichts mehr wiederherstellen. Wenn das RAID die HDD danach immer noch nicht akzeptiert, muss es einen anderen Grund haben.
Somit sind wir wieder bei einem Defekt der nicht mit den Smart werten auslesbar ist...
Danke für deine Mühe, ich mache einmal ein Ticket beim Händler.
 
Hallo!
Ich habe eine neue Platte (Seagate ST2000LM015) und die SMART Werte verwirren mich bei diesem Modell:
Rohwerte sind übrigens auf DEC eingestellt.
smart.png smart2.png
Lesefehlerrate: 78 - 69 - 6 (Rohwert 70177467)
Anz. Suchfehl: 100 - 253 - 45 (Rohwert 42320)

Bei meinen sonstigen Platten: Seagate ST1750LM000 bzw Hitachi HTS547550A9E84
Lesefehlerrate: 100 - 100 - 51 (Rohwert 0) bzw 100 - 100 - 62 (Rohwert 0)
Anz. Suchfehl: 252 - 252 - 51 (Rohwert 0) bzw 100 - 100 - 67 (Rohwert 0)

Hat die Platte nun was oder ist das normal?
Bitte auch die anderen SMART Werte überprüfen.
 
@Theobald93: Seagate verwendet bei den Parametern 01 und 07 einen geteilt auszuwertenden hexadezimalen Rohwert dessen erste 4 Stellen Fehler, die restlichen 8 Stellen Lese- bzw. Such-Vorgänge sind, in deinem Fall beides 0 Fehler. Auch die anderen Werte sind i.O.

@scoty: die Spalte Grenzwert zeigt dir nur die Grenze an ab der bei Unterschreiten selbigens duch den Aktuellen Wert ein >Failed/Bad< ausgegeben wird.
 
Zuletzt bearbeitet:

Ähnliche Themen

Antworten
1.922
Aufrufe
256.904
J
Zurück
Oben