[Sammelthread] HDD-Probleme, SMART-Analysen

crucay schrieb:
@seagate_surfer,
Ich habe grade den SMART Test mit dem SeaTool durchgeführt und hier bekomme ich ein positives Ergebnis und keine Fehler werden angezeigt. Was kann ich daraus schließen?

Inkonsistente Ergebnisse kommen leider immer mal vor - entweder in die eine oder andere Richtung; wir hatten auch schon Fälle, da hat SeaTools die Fehler erkannt und CrystalDiskInfo die Platte als ok angezeigt. Daher -besonders bei seltsamen Verhalten oder komischen Geräuschen- am besten wiederholt testen..

Es gibt auch keinen Grund, die HDD sofort rauszuschmeißen - sofern sie im Moment funktioniert und Dir nicht irgendwelche Daten zerschießt. Du solltest nur auf einen Ausfall vorbereitet sein und vor allem Deine wichtigen Daten immer sichern!
 
seagate_surfer schrieb:
Inkonsistente Ergebnisse kommen leider immer mal vor - entweder in die eine oder andere Richtung; wir hatten auch schon Fälle, da hat SeaTools die Fehler erkannt und CrystalDiskInfo die Platte als ok angezeigt. Daher -besonders bei seltsamen Verhalten oder komischen Geräuschen- am besten wiederholt testen..

Es gibt auch keinen Grund, die HDD sofort rauszuschmeißen - sofern sie im Moment funktioniert und Dir nicht irgendwelche Daten zerschießt. Du solltest nur auf einen Ausfall vorbereitet sein und vor allem Deine wichtigen Daten immer sichern!

Bisher funktioniert es noch ausreichend, also werde ich das ganze vorerst laufen lassen. Backups habe ich im Zweifel. Danke für die kompetente Hilfe.
 
Bis zu einer bestimmten Anzahl sind schwebende und auch wiederzugewiesene Sektoren noch kein Grund eine HDD als defekt einzustufen, sondern fast noch normal. Die Reservesektoren gibt es ja extra um auch mal einen Sektor ersetzen zu können wenn dieser ausfällt. Nur bei dem Alter und der Anzahl ist Vorsicht geboten, erst recht wenn deren Zahl massiv ansteigt, da dies dann meist ein Hinweis auf einen Schaden ist der bald zum Totalausfäll führen dürfte.
 
Holt schrieb:
Bis zu einer bestimmten Anzahl sind schwebende und auch wiederzugewiesene Sektoren noch kein Grund eine HDD als defekt einzustufen, sondern fast noch normal. Die Reservesektoren gibt es ja extra um auch mal einen Sektor ersetzen zu können wenn dieser ausfällt. Nur bei dem Alter und der Anzahl ist Vorsicht geboten, erst recht wenn deren Zahl massiv ansteigt, da dies dann meist ein Hinweis auf einen Schaden ist der bald zum Totalausfäll führen dürfte.

"C5" und "C6" sind seit 14 Uhr um 56 gestiegen, während "05" gleich geblieben ist. Zählt das als massiv?
 
Zuletzt bearbeitet:
05 steigt ja erst wenn die schwebenden Sektoren überschrieben werden und wirklich defekt waren. 56 weitere schwebende Sektoren sind nicht wenig, sehe zu alle wichtigen Daten auf einem anderen Medium gesichert zu bekommen und die HDD so schnell wie möglich zu ersetzen.
 
Holt schrieb:
05 steigt ja erst wenn die schwebenden Sektoren überschrieben werden und wirklich defekt waren. 56 weitere schwebende Sektoren sind nicht wenig, sehe zu alle wichtigen Daten auf einem anderen Medium gesichert zu bekommen und die HDD so schnell wie möglich zu ersetzen.

Dachte ich mir. Auch danke für deine Hilfe.
 
Hi Leute,
ich bitte euch folgende Smart-Analysen zu betrachten:

Seagate IronWolf 8TB, neu:
Seagate Ironwolf 8TB.png

Und von einer alten WD Green 1,5TB:
WD Green 1,5TB.png

Die sieht glaube ich nicht mehr so gut aus bei den wiederzugewiesenen Sektoren. Habe sie schon 2x neu formatiert, weil Crystaldiskinfo eine Warnung ausgespuckt hat.
 
Keine der bedien Platten hat wiederzugewiesenen Sektoren, die WD hat 392 Lese- und 22 Schreibfehler und bei der Seagate ist alles bestens, da stehen in den Rohwerten für die Lesefehler, Suchfehler Hardware ECC Recovered nicht einfache Zählerstände der Fehler, sondern die enthalten die Fehlerzähler nur in den 2 höchsten Bytes (die linken 4 Stellen bei hexadezimaler Anzeige der Rohwert in CrystalDiskInfo) und die rechten 8 Stellen (4 Byte) sind der Zähler der Vorgänge dar. Die Ermittlung der Aktuellen Werte funktioniert mehr oder weniger für diese Attribute nach dieser Formel für die Suchfehler:
Wie man sieht, muss auch erst eine bestimmten Anzahl von Vorgängen erfolgt sein, bevor der Aktuelle Wert überhaupt errechnet wird, ist diese Anzahl erreicht fällt er und steigt dann wieder, sofern es nicht keine/nicht zu häufig Fehler gibt.
 
Vielen Dank für deine Hilfe, das ist ganz schön kompliziert...

Aber gut, dann kann ich auf die Seagate bedenkenlos mein Backup aufspielen.
Sind die Lese- bzw Schreibfehler der WD bedenklich? Sind die Fehler seit dem Start von Crystaldiskinfo entstanden oder in der gesamten Betriebszeit der Platte?

Dann waren es schwebende Sektoren, weswegen ich die WD 2x neu formatieren musste nach einer Warnung von CDI, das letzte mal vor zwei Wochen. Sollte ich die Platte deswegen in den Ruhestand schicken?
 
==>AUDI<== schrieb:
Sind die Lese- bzw Schreibfehler der WD bedenklich?
Die aktuellen Werte sind noch auf dem Ausgangsniveau von 200, der Controller sieht es also noch nicht als bedenklich an.
==>AUDI<== schrieb:
Sind die Fehler seit dem Start von Crystaldiskinfo entstanden oder in der gesamten Betriebszeit der Platte?
Ja, zumindest sollte es eigentlich so sein.
==>AUDI<== schrieb:
Dann waren es schwebende Sektoren, weswegen ich die WD 2x neu formatieren musste nach einer Warnung von CDI, das letzte mal vor zwei Wochen. Sollte ich die Platte deswegen in den Ruhestand schicken?
Schwebende Sektoren sind Sektoren deren Daten nicht mehr zur ECC passen die hinter jedem Sektor steht und mit deren Hilfe auch nicht mehr korrigiert werden können. Da die korrekten Daten nicht mehr feststellbar sind, gibt die Platte statt falscher Daten einen Lesefehler als Antwort wenn man versucht diese zu lesen. Das kann auch anderen Gründe als defekte Oberflächen haben, z.B. einen Stromausfall während eines Schreibvorgang der dazu führt, dass eben nicht die ganze Daten plus der neuen ECC geschrieben wurden oder wegen eines Stoßes oder Vibrationen ist der Kopf beim Schreiben aus der Spur gekommen und hat Daten auf der Nachbarspur überschrieben. Auch arbeiten HDDs nicht 100%ig und die Hersteller geben die Fehlerhäufigkeit auch in Form der UBER an, wobei eine UBER von 1:10^14 bedeutet, dass je 10^14 gelesener Bits was etwa 12TB gelesener Daten entspricht, ein Lesefehler und damit schwebender Sektor im Rahmen der Erwartungen liegt.

Die Controller merken sich die schwebenden Sektoren und prüfen die Daten nach dem erneuten Schreiben auf diese Sektoren, dann verschwinden diese einfach oder werden eben durch Reservesektoren ersetzt. Dies ist ja nicht passiert, die Sektoren waren also nicht wirklich defekt. Mit 0x33F = 831 gab es bei 1734 Einschaltungen bei fast jeder zweiten einen unerwarteten Spannungsabfall, wenn auch nur ein paarmal dabei gerade geschrieben wurde, wären zwei schwebende Sektoren überhaupt kein Wunder. Außerdem sind da 6 Laufwerke zu sehen, keine Ahnung wie viele davon interne HDDs sind, aber so ein Green ist nicht unbedingt dafür gemacht mit vielen anderen HDDs in einem Gehäuse zu arbeiten, HDDs sind empfindlich was Vibrationen angeht, schau Dir mal das Video "Shouting in the Datacenter" an um zu sehen wie wenig es da braucht. Die HDDs dort im Video sind Enterprsie Platten die entsprechende Sensoren haben und auf Vibrationen reagieren können, etwa indem sie Schreibvorgänge unterbrechen um nichts auf den Nachbarspuren zu überschrieben, bei einer einfachen Desktopplatte wie einer Green ist sowas nicht vorhanden.
 
Guten Morgen zusammen, ich würde gern die Gelegenheit nutzen und die S.M.A.R.T. -werter meiner HDD's von euch interpretieren zu lassen.
Ich hoffe es ist ok wenn ich nicht CrystalDiskInfo, sondern das von Synology zur Verfügung gestellt tool nutze.

Platten sind zwei WD Red 2TB.

HDD0
HDD0.png

HDD1
HDD1.png

Der Grund warum ich überhaupt nach diesen Informationen von euch bitte, ist, dass bei HDD0 der erweiterte S.M.A.R.T.-Test bei 90% stehen bleibt.
Im Syno-Forum war "nur" die HDD0 mit ID200 auffällig.

Die Frage dahinter ist, reicht das schon um einen Garantieanspruch zu rechtfertigen?


Gruß!
 
HDD0 hat 4 Schreibfehler, deswegen sollte sie aber nicht beim Selbsttest hängen bleiben. Kann es sein das die einfach noch nicht fertigt ist? Bedenke das der Selbstest länger dauert, wenn derweil auf die HDD anderweitig zugegriffen wird. Poste auch mal was smartctl -a /dev/sdx (x durch den passenden Buchstaben ersetzen) für die Platte ausgibt.
 
Holt schrieb:
Kann es sein das die einfach noch nicht fertigt ist? B

mehrere Wochen sollten reichen, oder?

Holt schrieb:
Poste auch mal was smartctl -a /dev/sdx (x durch den passenden Buchstaben ersetzen) für die Platte ausgibt.

SDA
Code:
=== START OF INFORMATION SECTION ===
Vendor:               WDC
Product:              WD30EFRX-68EUZN0
Revision:             82.0
User Capacity:        3,000,592,982,016 bytes [3.00 TB]
Logical block size:   512 bytes
Physical block size:  4096 bytes
LU is fully provisioned
Rotation Rate:        5400 rpm
Logical Unit id:      0x50014ee2b683c88e
Serial number:        xxxx
Device type:          disk
Local Time is:        Fri Jan 12 13:15:57 2018 CET
SMART support is:     Unavailable - device lacks SMART capability.

=== START OF READ SMART DATA SECTION ===
Current Drive Temperature:     0 C
Drive Trip Temperature:        0 C

Error Counter logging not supported


SDB

Code:
=== START OF INFORMATION SECTION ===
Vendor:               WDC
Product:              WD30EFRX-68EUZN0
Revision:             82.0
User Capacity:        3,000,592,982,016 bytes [3.00 TB]
Logical block size:   512 bytes
Physical block size:  4096 bytes
LU is fully provisioned
Rotation Rate:        5400 rpm
Logical Unit id:      0x50014ee2b6837875
Serial number:        xxxx
Device type:          disk
Local Time is:        Fri Jan 12 13:16:41 2018 CET
SMART support is:     Unavailable - device lacks SMART capability.

=== START OF READ SMART DATA SECTION ===
Current Drive Temperature:     0 C
Drive Trip Temperature:        0 C

Error Counter logging not supported
 
Zuletzt bearbeitet:
Wieso ist denn das Auslesen der S.M.A.R.T. Werte unterbunden: "SMART support is: Unavailable - device lacks SMART capability."

Damit hilft die Ausgabe natürlich nicht weiter, aber wo kommt die Aussage mit den 90% her? Die hätte eigentlich hier zu finden sein müssen. Die Selbsttests werden meine ich nach einer Spannungsunterbrechung nicht fortgesetzt, von daher könnte es auch daran liegen, etwa weil das NAS in den Standby gegangen ist.
 
habs


HDA
Code:
sh-4.3# smartctl -a /dev/hda
smartctl 6.5 (build date Sep  7 2017) [armv7l-linux-3.2.40] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD30EFRX-68EUZN0
Serial Number:    WD-xxx
LU WWN Device Id: 5 0014ee 2b683c88e
Firmware Version: 82.00A82
User Capacity:    3,000,592,982,016 bytes [3.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Fri Jan 12 14:09:31 2018 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (39060) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 392) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x703d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time                                                     0x0027   180   179   021    Pre-fail  Always       -       5958
  4 Start_Stop_Count                                                 0x0032   100   100   000    Old_age   Always       -       68
  5 Reallocated_Sector_Ct                                            0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   079   079   000    Old_age   Always       -       16027
 10 Spin_Retry_Count                                                 0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count                                          0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   000    Old_age   Always       -       63
192 Power-Off_Retract_Count                                          0x0032   200   200   000    Old_age   Always       -       1
193 Load_Cycle_Count                                                 0x0032   200   200   000    Old_age   Always       -       122
194 Temperature_Celsius                                              0x0022   125   112   000    Old_age   Always       -       25
196 Reallocated_Event_Count                                          0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate                                            0x0008   200   200   000    Old_age   Offline      -       4

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     15870         -
# 2  Extended offline    Aborted by host               10%     15819         -
# 3  Extended offline    Aborted by host               10%     15596         -
# 4  Short offline       Completed without error       00%     15367         -
# 5  Short offline       Completed without error       00%     14527         -
# 6  Short offline       Completed without error       00%     14360         -
# 7  Short offline       Completed without error       00%     14191         -
# 8  Extended offline    Aborted by host               10%     14163         -
# 9  Extended offline    Aborted by host               10%     13206         -
#10  Short offline       Completed without error       00%     12755         -
#11  Extended offline    Aborted by host               10%     12755         -
#12  Extended offline    Aborted by host               10%     12636         -
#13  Extended offline    Completed without error       00%      9629         -
#14  Extended offline    Completed without error       00%      9312         -
#15  Extended offline    Completed without error       00%      9006         -
#16  Extended offline    Completed without error       00%      8836         -
#17  Extended offline    Completed without error       00%      8677         -
#18  Extended offline    Completed without error       00%      8513         -
#19  Extended offline    Completed without error       00%      8332         -
#20  Extended offline    Completed without error       00%      8163         -
#21  Extended offline    Completed without error       00%      7995         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

HDB
Code:
ash-4.3# smartctl -a /dev/hdb
smartctl 6.5 (build date Sep  7 2017) [armv7l-linux-3.2.40] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

Smartctl open device: /dev/hdb failed: No such device
 

Anhänge

  • HDD0 SMART.png
    HDD0 SMART.png
    19,7 KB · Aufrufe: 454
Zuletzt bearbeitet:
Der Test wurde abgebrochen (Aborted by host). Er dauert 392 Minuten, also etwa 6,5 Stunden. Ggf. auch länger, wenn die Platte währendessen in Benutzung ist.
 
Das habe ich sehen wollen, da steht es doch auch:

DanFu schrieb:
Code:
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     15870         -
# 2  Extended offline    Aborted by host               10%     15819         -
# 3  Extended offline    Aborted by host               10%     15596         -
# 4  Short offline       Completed without error       00%     15367         -
# 5  Short offline       Completed without error       00%     14527         -
# 6  Short offline       Completed without error       00%     14360         -
# 7  Short offline       Completed without error       00%     14191         -
# 8  Extended offline    Aborted by host               10%     14163         -
# 9  Extended offline    Aborted by host               10%     13206         -
#10  Short offline       Completed without error       00%     12755         -
#11  Extended offline    Aborted by host               10%     12755         -
#12  Extended offline    Aborted by host               10%     12636         -
#13  Extended offline    Completed without error       00%      9629         -
#14  Extended offline    Completed without error       00%      9312         -
#15  Extended offline    Completed without error       00%      9006         -
#16  Extended offline    Completed without error       00%      8836         -
#17  Extended offline    Completed without error       00%      8677         -
#18  Extended offline    Completed without error       00%      8513         -
#19  Extended offline    Completed without error       00%      8332         -
#20  Extended offline    Completed without error       00%      8163         -
#21  Extended offline    Completed without error       00%      7995         -
Der Extended wurde also immer vom Host abgebrochen wenn noch 10% gefehlt haben, also 90% durch waren. Wie lange der dauern sollte, erfahren wir hier auch:
DanFu schrieb:
Code:
Extended self-test routine
recommended polling time:        ( 392) minutes.
Bei Test #13 bei 9629 Betriebsstunden hat es ja noch geklappt, seit Test #12 bei 12636 Betriebsstunden wurde jeder Extended self-test bei 90% (10% remaining) vom Host abgebrochen. Also würde ich mal einen Anstoßen und nach so 5½ Stunden anfangen regelmäßig zu schauen (watch -n 60 smartctl -a /dev/hda, da sollte der laufende Test dann ganz oben in dieser Liste stehen) wie weit der Selbsttest ist und ob er wirklich bei 90% stockt, so alle 4 Minuten müsste die Prozentangabe ja um 1 fallen (aber das sollte man ja dann auch an der Ausgabe sehen), oder ob der Vorgang dann abgebrochen wird ohne das die Platte überhaupt die Chance hatte den Selbsttest zu beenden.
 
Wenn ich das richtig verstanden habe, sind die schwebenden Sektoren nach einer Formatierung wieder "beseitigt"?
Dann kann ich die ja ohne Sorge weiterverwenden.
Ich habe 3 HDDs intern verbaut 2x eine WD Red 3TB und die WD Green 1,5TB zuzüglich zu meiner SSD. Sind die Reds besser geeignet?
Hab mir das Video angeschaut, wow! Hätte nie gedacht, dass das so empfindlich ist. Schließlich werden ja Laptops teilweise herumgeworfen. Wie ist das denn beim Musikhören wenn der Sub losgeht und der Boden vibriert?
 
==>AUDI<== schrieb:
Wenn ich das richtig verstanden habe, sind die schwebenden Sektoren nach einer Formatierung wieder "beseitigt"?
Ja durch das Überschreiben verschwinden schwebenden Sektoren wieder.
==>AUDI<== schrieb:
Dann kann ich die ja ohne Sorge weiterverwenden.
Im Prinzip ja, schwebende Sektoren müssen eben kein Hinweis auf einen Defekt der Platte sein, sie können es zwar sein, aber nicht zwangsläufig und längst nicht immer.
==>AUDI<== schrieb:
Ich habe 3 HDDs intern verbaut 2x eine WD Red 3TB und die WD Green 1,5TB zuzüglich zu meiner SSD. Sind die Reds besser geeignet?
Ja für mehrere HDDs in einem Gehäuse sind die Reds praktisch Pflicht. Selbst WD verbaut die Red im MyBook Duo, wo ja 2 HDDs im Gehäuse sind und in den normalen MyBooks sind die Blue. Die Green wurden vor Jahren bei den Blue eingereiht.
==>AUDI<== schrieb:
Schließlich werden ja Laptops teilweise herumgeworfen.
Was nicht empfehlenswert ist und oft genug haben Notebookplatten ja auch recht früh Schäden.
==>AUDI<== schrieb:
Wie ist das denn beim Musikhören wenn der Sub losgeht und der Boden vibriert?
Da gab es hier schon öfter Fälle mit Problemen wegen Sub Woofern in der Nähe, von nur G-Sensor Auslösung bis zu richtigen Schäden.
 
dein "Code" hat nicht funktioniert und das herabzählen funktioniert nur in 10% Schritten.

Habe den Scan gestern gegen 17:00 gestartet und seit 21:30 ist er unverändert...
Code:
ash-4.3# smartctl -a /dev/hda | grep "progress" -i -A 1
Self-test execution status:      ( 241) Self-test routine in progress...
                                        10% of test remaining.

uebersicht.png
 

Ähnliche Themen

Antworten
1.922
Aufrufe
256.887
J
Zurück
Oben