[Sammelthread] HDD-Probleme, SMART-Analysen

Inzersdorfer schrieb:
E hat neben den 2 schwebenden (= nicht lesbaren) Sektoren und 2.810 Lesefehlern auch 3.277 Schreibfehler, bei denen die Schreib/Leseeinheit ausserhalb ihrer vorgesehenen Position war.
Auf die Attribute habe ich gar nicht geachtet, da sie nicht gelb markiert waren. Im Vergleich mit gleichen HDDs fällt aber sofort auf, dass der Rohwert nicht normal ist. Da wäre ein Ersatz wohl nicht verkehrt.
R4ID schrieb:
spricht was gegen den Einsatz von Seagate EXOS X16 ?
Absolut nicht. Hab selber welche. Als Expansion früher relativ günstig zu bekommen :daumen:
 
Ich habe mich jetzt dazu entschieden alle HDDs zu ersetzen und heute 3 EXOS 16TB geordert.
Bin sehr gespannt wie laut diese beim arbeiten sind, habe dazu ja schon einiges negatives im Netz gelesen :D
 
Hallo zusammen,
HDD war soweit okay laut Crystal Disk .. aber nach formatieren hat er mir ein "Vorsicht" ausgegeben..
Was sagen die Profis?
Danke schon einmal vorab!


Haltet mich für bekloppt .. aber jetzt ist alles okay? Habe erneut angefangen zu formatieren- keine schnellformatierung und jetzt ist kein Fehler mehr da? Sehr suspekt das ganze..


Festplatte.PNG
 

Anhänge

  • Unbenannt2.PNG
    Unbenannt2.PNG
    61,9 KB · Aufrufe: 229
Zuletzt bearbeitet:
DcJ schrieb:
Haltet mich für bekloppt .. aber jetzt ist alles okay? Habe erneut angefangen zu formatieren- keine schnellformatierung und jetzt ist kein Fehler mehr da? Sehr suspekt das ganze..
Nö, kann völlig normal sein. Das waren ja nur 2 Sektoren die als "Pending" vermerkt waren. Da gab es beim lesen ein Problem und die Sektoren werden erst mal "unter Beobachtung" gestellt. Beim zweiten Formatieren gabs dann aber keine Probleme mit den Sektoren, also wurden sie einfach wieder von der Liste gestrichen.

Weshalb sie ursprünglich einen Fehler produzierten kann man schwer sagen, da gibts die diversesten Gründe. Genau deshalb machen die Platten auch dieses Verfahren das Sektoren erst aussortiert werden wenn sie zwei mal hintereinander einen Fehler verursachen. Aber momentan sieht soweit wieder alles gut aus.
 
Meine eine WD (E) die 2 schwebende Sektoren hatte wurde nun gründlich formatiert mit Erfolg.
Keine Fehler mehr vorhanden :)

1.PNG
 
Allerdings ist innerhalb von 61 zusätzlichen Betriebsstunden die Anzahl der Lesefehler von 2810 um 1166 auf nunmehr 3976 gestiegen.
 
Stimmt, was könnte das sein ?

Defektes Sata Kabel eventuell ?
 
Dann will ich auch mal.

Hab ein Synology NAS mit 12 x 8 TB WD Red Pro (originalverpackt) erweitert. Noch während der Prüfung der Platten während des RAID Builds hat mich das NAS auf defekte Sektoren einer Festplatte aufmerksam gemacht. Ein erweiterter Test brachte keine Fehler. Die SMART-Attribute sehen ebenfalls OK aus. Im Error-Log stehen allerding uncorrectable errors an LBA 0. Ergibt für mich keinen Sinn. Jemand ne Idee?

Ich pack das SMART-Log erstellt mit smartctl auf dem NAS mal in Spoiler-Tags, weil es recht lang ist.
Code:
sudo smartctl -a -d sat -T permissive /dev/sdna
smartctl 6.5 (build date Mar  2 2021) [x86_64-linux-4.4.59+] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red Pro
Device Model:     WDC WD8003FFBX-68B9AN0
Serial Number:    xxxxxxxx
LU WWN Device Id: 5 000cca 0c2ca0ecb
Firmware Version: 83.00A83
User Capacity:    8,001,563,222,016 bytes [8.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Aug 17 09:58:39 2021 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (   87) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 845) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance                                           0x0004   132   132   054    Old_age   Offline      -       96
  3 Spin_Up_Time                                                     0x0007   158   158   024    Pre-fail  Always       -       505 (Average 524)
  4 Start_Stop_Count                                                 0x0012   100   100   000    Old_age   Always       -       30
  5 Reallocated_Sector_Ct                                            0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x000a   100   100   067    Old_age   Always       -       0
  8 Seek_Time_Performance                                            0x0004   128   128   020    Old_age   Offline      -       18
  9 Power_On_Hours                                                   0x0012   100   100   000    Old_age   Always       -       143
 10 Spin_Retry_Count                                                 0x0012   100   100   060    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   000    Old_age   Always       -       1
192 Power-Off_Retract_Count                                          0x0032   100   100   000    Old_age   Always       -       32
193 Load_Cycle_Count                                                 0x0012   100   100   000    Old_age   Always       -       32
194 Temperature_Celsius                                              0x0002   139   139   000    Old_age   Always       -       43 (Min/Max 24/47)
196 Reallocated_Event_Count                                          0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x000a   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 12 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 12 occurred at disk power-on lifetime: 20 hours (0 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 00 00 00 00 00  Error: UNC at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 40 f0 c8 ba 2f 40 08      20:20:33.243  READ FPDMA QUEUED
  60 08 a8 a8 51 2f 40 08      20:20:25.591  READ FPDMA QUEUED
  60 08 c0 a0 51 2f 40 08      20:20:25.591  READ FPDMA QUEUED
  60 08 a0 98 51 2f 40 08      20:20:25.591  READ FPDMA QUEUED
  60 08 88 90 51 2f 40 08      20:20:25.591  READ FPDMA QUEUED

Error 11 occurred at disk power-on lifetime: 20 hours (0 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 00 00 00 00 00  Error: UNC at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 40 a0 88 b5 2f 40 08      20:20:17.022  READ FPDMA QUEUED
  60 08 38 48 51 2f 40 08      20:20:09.660  READ FPDMA QUEUED
  60 08 30 38 51 2f 40 08      20:20:09.660  READ FPDMA QUEUED
  60 40 28 48 9b 2f 40 08      20:20:09.660  READ FPDMA QUEUED
  60 40 20 88 a0 2f 40 08      20:20:09.660  READ FPDMA QUEUED

Error 10 occurred at disk power-on lifetime: 20 hours (0 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 00 00 00 00 00  Error: UNC at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 40 78 f8 7d 2f 40 08      20:20:09.323  READ FPDMA QUEUED
  60 08 30 40 51 2f 40 08      20:20:02.399  READ FPDMA QUEUED
  60 40 28 48 c5 2f 40 08      20:20:02.399  READ FPDMA QUEUED
  60 28 20 38 71 2f 40 08      20:20:02.399  READ FPDMA QUEUED
  60 40 18 c8 a5 2f 40 08      20:20:02.399  READ FPDMA QUEUED

Error 9 occurred at disk power-on lifetime: 20 hours (0 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 00 00 00 00 00  Error: UNC at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 c0 38 88 ca 2f 40 08      20:20:02.079  READ FPDMA QUEUED
  60 08 28 38 51 2f 40 08      20:19:54.683  READ FPDMA QUEUED
  60 40 20 48 9b 2f 40 08      20:19:54.683  READ FPDMA QUEUED
  60 40 18 88 a0 2f 40 08      20:19:54.683  READ FPDMA QUEUED
  60 40 10 c8 a5 2f 40 08      20:19:54.683  READ FPDMA QUEUED

Error 8 occurred at disk power-on lifetime: 20 hours (0 days + 20 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 00 00 00 00 00  Error: UNC at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 40 70 b8 78 2f 40 08      20:19:54.336  READ FPDMA QUEUED
  60 08 48 30 51 2f 40 08      20:19:40.825  READ FPDMA QUEUED
  60 e0 40 60 71 2f 40 08      20:19:40.825  READ FPDMA QUEUED
  60 18 38 b8 6a 2f 40 08      20:19:40.825  READ FPDMA QUEUED
  60 40 30 38 83 2f 40 08      20:19:40.825  READ FPDMA QUEUED

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%        59         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 
Zuletzt bearbeitet:
Alle Fehler traten bei 20 Betriebsstunden oder früher auf

Error 12 occurred at disk power-on lifetime: 20 hours / Error: UNC at LBA = 0x00000000 = 0

vermutlich am Bootsektor. Da mittlerweile ja mindestens 123 weitere Betriebsstunden ohne Fehler verstrichen sind, können diese Fehlermeldungen ignoriert werden, war wohl ein digitaler Schluckauf.
 
Hey,

ich habe hier noch eine externe WD Passport Ultra 2TB HDD sowie eine Seagate 1TB HDD, die in der Familie weitergeben werden sollen.

Gibt es Auffälligkeiten bei den Smartwerten?

WesternDigital Passport Ultra 2TB ext. 2,5 HDD_CDI_2021.08.29.JPG Seagate HDD 1TB_CDI_2021.08.29.JPG

Vielen Dank :)

mrcoconut
 
Zuletzt bearbeitet:
Ich habe ein wenig Probleme mit meiner Speicher HDD.

nachdem ich Probleme bei einer lange gespeicherten Video Datei hatte, habe ich mal Crystal gecheckt und dort steht ja vorsicht.
Auf der anderen Seite scheint die Platte in einem Check noch gut zu arbeiten.

hier mal die Info zu den Checks:
HDDCheck.jpg


Die Daten die darauf sind sind jetzt alle nicht superwichtig aber unbedingt weg muss auch nicht sein.

Normal würde ich eine Platte in so einem Fall gleich tauschen aber eigentlich wollte ich noch etwas warten bis die nächste Generation größerer Platten in den nächsten Monaten raus kommen soll.
Was mich auch etwas ärgert ist, dass die Platte ja noch nicht wirklich viel gelaufen ist.

Was meint ihr dazu?
 
HDD raus, ssd rein, nochmal 5-10 jahre nutzen
solltest du kein backup haben, hol jetzt raus was noch zu holen ist. mach keine benchmarks. lass es nicht unnoetig laufen.

S_W_I_N_E schrieb:
Normal würde ich eine Platte in so einem Fall gleich tauschen aber eigentlich wollte ich noch etwas warten bis die nächste Generation größerer Platten in den nächsten Monaten raus kommen soll.
was und wann soll das sein?
 
madmax2010 schrieb:
was und wann soll das sein?
Das war auf einer englischen Seite dass ein Hersteller gegen Ende diesen Jahres/ anfang nächsten Jahres eine neue Serie mit 16 TB raus bringen zu wollen.

Das ist die Platte für Massedaten die ab und zu mal gebraucht werden eine SSD ist mir bei der Menge dann doch zu teuer und nicht nötig
 
Also acht Sektoren verhalten sich eigenartig.
Was ich machen würde:
  • komplett mit Nullen überschreiben
  • Danach die ein paar Stunden normal angeklemmt lassen, die wird dann erstmal sortieren und prüfen.
  • zwischendurch immer mal beobachten, ob da sich die Werte ändern.
  • wenn nicht, als Archivplatte benutzen. Daten müssen ja eh noch mal woanders gespeichert werden
 
S_W_I_N_E schrieb:
eine SSD ist mir bei der Menge dann doch zu teuer und nicht nötig
Gut, aber dann kopiere jetzt wenigstens die Daten auf eine andere Platte. Wie gesagt, es sind noch keine Wiederzugewiesenen Sektoren ersichtlich, und wenn sich die schwebenden nach dem Formatieren nicht mehr zeigen, kannst Du sie -- unter Beobachtung -- weiterverwenden. Es dürfen dort aber niemals alleinig wichtige Daten abgelegt sein.
 

Ähnliche Themen

Antworten
1.922
Aufrufe
256.883
J
Zurück
Oben