[Sammelthread] HDD-Probleme, SMART-Analysen

Inzersdorfer · 24. Januar 2023

Die Rohwerte sind in Ordnung, bei der Anzeige "Aktueller Wert" liegt bei ID-07 IMHO ein "Schluckauf " der Software vor, hier eine fehlerhafte Ausgabe die nicht weiter interessant ist.

Im Übrigen: der optimale Zustandswert ("Aktueller Wert") ist, je nach Parameter, Plattenmodell und Revision 100, 200 oder 253.

muc_berg · 24. Januar 2023

Hallo @Inzersdorfer ,

ich danke dir ganz herzlich. Wenn ich dich so richtig interpretiere, dann ist alles bestens für eine neue Festplatte, richtig? Lässt sich erklären woher der "Schluckauf" bei der ID 07 kommt? Ich habe einen sehr alten Windows-Rechner, kann das daher kommen?

Gibt es auch eine Möglichkeit unter Mac die Smart-Werte auszulesen? Ich habe schon viel recherchiert aber noch keine Lösung gefunden und das würde mir sehr helfen, da ich eigentlich nur mit dem Mac Book unterwegs bin.

Viele Grüße
Stefan

HerrAbisZ · 24. Januar 2023

https://www.xgadget.de/app-software/smart-werte-unter-mac-osx-auslesen-kostenlos/

Inzersdorfer · 24. Januar 2023

Das hängt mit der aufwendigen Berechnung des aktuellen Zustandswertes bei Seagate und seinen geteilten Rohwerten zusammen, wie du bei ID-01 gesehen hast, "normalisiert" sich dieser Wert wenn eine bestimmte Anzahl von Lese/Such-Vorgängen erreicht wird ohne Fehler.

muc_berg · 24. Januar 2023

Halo @HerrAbisZ und @Inzersdorfer ,

ich danke euch ganz herzlich. Mega das man auch unter Mac die Werte auslesen kann 👍🏻und vielen dank für das Dokument zu den Zustandswerten bei Seagate.

Ihr habt mir sehr geholfen.

Vielen Dank
Stefan

muc_berg · 1. Februar 2023

Hallo ihr lieben,

ich habe nun 2,6 TB auf meine neue Seagate HDD geschrieben und nochmal die Werte ausgelesen. Wenn ich das korrekt interpretiere ist alles bestens, richtig?

CrystalDiskInfo Seagate 10 TB 25 %-01.jpeg

Bei 01 und 07 weiterhin der Rohrwert auf 0, nur aktueller und schlechtester Wert wieder komisch. Kommen die Werte eigentlich von der Festplatte oder von CrystalDiskInfo das von der komischen Berechnung von Seagate verwirrt ist?

Meine zweite ältere externe Festplatte habe ich auch ausgelesen, sieht auch super aus, richtig?

CrystalDiskInfo WD 2022 5 TB 90 %-01.jpeg

Liebe Grüße

Stefan

Inzersdorfer · 1. Februar 2023

Ja, Alles in Ordnung.

muc_berg · 3. Februar 2023

@Inzersdorfer vielen Dank dir, perfekt 👍🏻. Dann kann ich beide Festplatten beruhigt einsetzen.

awu12 · 6. Februar 2023

Hallo,

melde mich auch mit der Bitte um Unterstützung zu meiner Festplatte:

nutze sie zur Datensicherung ca. 5-6 Mal im Jahr alle paar Monate mal.
Bisher an sich keine Auffälligkeiten zu vermelden, habe eher zufällig die Vorsicht-Warnung im Screenshot gesehen.

Was würdet ihr mir raten? Schnell tauschen oder beobachten, ob sie die Anzahl der Werte in der gelben Zeilen erhöht?
Ach ja, die Platte ist momentan Bitlocker verschlüsselt, sollte man den evtl. inaktivieren?

Weitere Infos: Seagate Backup Plus Portable, extern 5 TB, 2.5 Zoll, USB3, 2017 gekauft, genau diese hier https://amzn.eu/d/5BDLnW7

Danke euch im Voraus!

PS: habe Checkdisk laufen lassen, an sich unauffällig s. Log unten:

"Chkdsk" wurde im Überprüfungsmodus für eine Volumemomentaufnahme ausgeführt.
Dateisystem auf H: wird überprüft.
Die Volumebezeichnung lautet 5tb_defSekt.
Phase 1: Die Basisdatei-Systemstruktur wird untersucht...
472064 Datensätze verarbeitet. Dateiüberprüfung beendet.
Phasendauer (Datei-Datensatz Überprüfung): 10.16 Sekunden.
20 große Datensätze verarbeitet. Phasendauer (Wiederherstellung für verwaisten Datei-Datensatz): 0.00 Millisekunden.
0 ungültige Datensätze verarbeitet. Phasendauer (Prüfung auf falschen Datei-Datensatz): 1.77 Millisekunden.
Phase 2: Die Dateinamenverknüpfung wird untersucht...
649 Analysedatensätze verarbeitet. 498168 Indexeinträge verarbeitet. Indexüberprüfung beendet.
Phasendauer (Indexüberprüfung): 1.21 Minuten.
Phasendauer (Wiederverbindung für verwaisten Datensatz): 236.71 Millisekunden.
Phasendauer (Wiederherstellung für verwaiste Datensatz): 38.46 Millisekunden.
649 Analysedatensätze verarbeitet. Phasendauer (Überprüfung von Analysepunkts und Objekt-ID): 16.99 Millisekunden.
Phase 3: Sicherheitsbeschreibungen werden untersucht...
Überprüfung der Sicherheitsbeschreibungen beendet.
Phasendauer (Überprüfung für Sicherheits-Deskriptor): 23.66 Millisekunden.
13052 Datendateien verarbeitet. Phasendauer (Datenattributüberprüfung): 11.59 Millisekunden.
Dateisystem wurde überprüft, keine Probleme festgestellt.
Keine weiteren Aktionen erforderlich.

4769177 MB Speicherplatz auf dem Datenträger insgesamt.
3258255 MB in 259406 Dateien
71592 KB in 13054 Indizes
687127 KB vom System benutzt
65536 KB von der Protokolldatei belegt
1546426412 KB auf dem Datenträger verfügbar

4096 Bytes in jeder Zuordnungseinheit
1220909567 Zuordnungseinheiten auf dem Datenträger insgesamt
386606603 Zuordnungseinheiten auf dem Datenträger verfügbar
Gesamtdauer: 1.38 Minuten (83336 ms).
----------------------------------------------------------------------
Phase 1: Die Basisdatei-Systemstruktur wird untersucht...
Phase 2: Die Dateinamenverknüpfung wird untersucht...
Phase 3: Sicherheitsbeschreibungen werden untersucht...

Dr. McCoy · 6. Februar 2023

awu12 schrieb:
nutze sie zur Datensicherung ca. 5-6 Mal im Jahr alle paar Monate mal.

Und die gleichen Daten, die dort in Sicherung liegen, befinden sich auch noch zusätzlich in Kopie auf einem weiteren Backup-Datenträger? Dieser Punkt ist in so einem Fall wie diesem hier mindestens sicherzustellen.

awu12 · 6. Februar 2023

Dr. McCoy schrieb:
Und die gleichen Daten, die dort in Sicherung liegen, befinden sich auch noch zusätzlich in Kopie auf einem weiteren Backup-Datenträger

ja schiebe sie meist (zu 90%) von dieser 5TB 2,5Zoll auf ne 8TB 3,5Zoll als weitere Sicherheitsstufe.
Wär halt aber trotzdem interessant eure Einschätzung zum Zustand der Platte zu haben

HerrAbisZ · 7. Februar 2023

Da 05,C5+6 dieselben Werte hat, kann es auch sein, das hier nur eine "Datenungereimtheit" besteht

Eine langsame Formatierung könnte das eventuell beheben.

Inzersdorfer · 7. Februar 2023

0 Lesefehler, 0 Suchfehler, 8 defekte Sektoren wurden durch Reservesektoren ersetzt (ID-05), 371 unkorrigierbare Fehler (ID-BB), da aber 0 Lesefehler verzeichnet sind konnten die Fehler in einem/meheren wiederholungen des Leseversuchs schlußendlich dióch noch gelesen werden; Es gab 11 command timeouts (ID-BC) wahrscheinlich im Zusammenhang mit ID-05 oder ID-C5/C6, weitere 8 Sektoren können nicht gelesen werden (ID-C5 bzw. C6), ob diese Sektoren defekt sind zeigt sich üblicherweise erst nach dem nächsten Beschreiben, da hier ein chkdsk durchgeführt wurde sind diese Sektoren aus dem Filesystem exlkludiert und bleiben deshalb dauerhaft in den SMART Werten obwohl sie unter Windows nicht mehr verwendet werden.

Für 576 Betriebsstunden ist der Zustand schlecht.
Hier müßen zumindest wöchentlich die SMART Werte kontrolliert werden. Grundsätzlich ist die Ausfallwahrscheinlichkeit dieses Maßenspeichers deutlich höher als Einens gleichen Alters ohne defekten Sektoren.

Penman · 25. März 2023

Mal folgendes Problem: Ich habe 4 WD Red 4 TB im RAID 6 Verbund. Ursprünglich war es ein RAID 5, aber nachdem eine Disk damit anfing, habe ich sicherheitshalber auf RAID 6 aufgerüstet. Es ist bisher nichts Dramatisches passiert und das RAID tut was es soll: Es korrigiert Fehler. Bevor es das tut, lässt es mich aber gerne 30 Sekunden warten und friert dabei den gesamten Verbund ein.

Ich habe mir zum Wochenende hin etwas Zeit genommen, die Daten mal auf andere Festplatten geschaufelt und alle Platten des RAIDs mal mit einem destruktiven badblocks Durchlauf und einem Smart long Test überzogen. Eine der beiden Problemfälle hat sich geheilt, die andere möchte immer noch nicht richtig und ich bekomme es nicht hin, die Festplatte dazu zu bringen, einen defekten bzw. langsamen Sektor auszutauschen.

Aber mal etwas Output:

Hier der Kernel Log. Ganz eindeutig, was mir die Festplatte sagen möchte. Warum sie kein auto rellocate hinbekommt, bleibt mir aber ein Rätsel.

Code:

[175855.698123] ata2.00: configured for UDMA/133
[175855.698151] sd 1:0:0:0: [sdb] tag#5 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=4s
[175855.698157] sd 1:0:0:0: [sdb] tag#5 Sense Key : Medium Error [current] 
[175855.698161] sd 1:0:0:0: [sdb] tag#5 Add. Sense: Unrecovered read error - auto reallocate failed
[175855.698164] sd 1:0:0:0: [sdb] tag#5 CDB: Read(16) 88 00 00 00 00 01 ba 86 da 08 00 00 02 00 00 00
[175855.698166] I/O error, dev sdb, sector 7424367112 op 0x0:(READ) flags 0x800 phys_seg 64 prio class 2
[175855.698192] ata2: EH complete
[175859.938942] ata2.00: exception Emask 0x0 SAct 0x8000 SErr 0x0 action 0x0
[175859.938957] ata2.00: irq_stat 0x40000008
[175859.938965] ata2.00: failed command: READ FPDMA QUEUED
[175859.938969] ata2.00: cmd 60/08:78:28:db:86/00:00:ba:01:00/40 tag 15 ncq dma 4096 in
                         res 41/40:00:28:db:86/00:00:ba:01:00/00 Emask 0x409 (media error) <F>
[175859.938983] ata2.00: status: { DRDY ERR }
[175859.938987] ata2.00: error: { UNC }

Praktischerweise gibt der Kernel auch gleich den Sektor aus, der das Problem verursacht: 7424367112. Da könnte man die Platte doch gezielt dazu zwingen, den Sektor auszulesen. hdparm kann das wunderbar und siehe da: Nach etwa 1-2 Sekunden taucht der Sektor auch auf und weitere Aufrufe gehen danach auch zügig (vermutlich durch den Cache). Wirklich defekt ist er also nicht. Aber richtig gelesen werden möchte er auch nicht.

Code:

# hdparm --read-sector 7424367112 /dev/sdb
                                                                           
/dev/sdb:                                                                  
reading sector 7424367400: succeeded                                       
5555 5555 5555 5555 5555 5555 5555 5555
...

Stellen wir die Platte mal kurz vor und was sie über sich selbst denkt:

Code:

=== START OF INFORMATION SECTION ===                                                                                                                  
Model Family:     Western Digital Red                                                                                                                 
Device Model:     WDC WD40EFRX-68N32N0                                                                                                                
Serial Number:    WD-WCC7K0YEXXXX                                                                                                                     
LU WWN Device Id: 5 0014ee 2663b4729                                                                                                                  
Firmware Version: 82.00A82                                                                                                                            
User Capacity:    4.000.787.030.016 bytes [4,00 TB]                                                                                                   
Sector Sizes:     512 bytes logical, 4096 bytes physical                                                                                              
Rotation Rate:    5400 rpm                                                                                                                            
Form Factor:      3.5 inches   
[...]
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     POSR-K   200   157   051    -    3
  3 Spin_Up_Time            POS--K   176   168   021    -    6158
  4 Start_Stop_Count        -O--CK   100   100   000    -    98
  5 Reallocated_Sector_Ct   PO--CK   200   200   140    -    0
  7 Seek_Error_Rate         -OSR-K   200   200   000    -    0
  9 Power_On_Hours          -O--CK   056   056   000    -    32272
 10 Spin_Retry_Count        -O--CK   100   253   000    -    0
 11 Calibration_Retry_Count -O--CK   100   253   000    -    0
 12 Power_Cycle_Count       -O--CK   100   100   000    -    98
192 Power-Off_Retract_Count -O--CK   200   200   000    -    57
193 Load_Cycle_Count        -O--CK   200   200   000    -    204
194 Temperature_Celsius     -O---K   115   106   000    -    35
196 Reallocated_Event_Count -O--CK   200   200   000    -    0
197 Current_Pending_Sector  -O--CK   200   200   000    -    1
198 Offline_Uncorrectable   ----CK   100   253   000    -    0
199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    8
200 Multi_Zone_Error_Rate   ---R--   200   200   000    -    13
[...]
Error 1755 [2] occurred at disk power-on lifetime: 32271 hours (1344 days + 15 hours)                                                                 
  When the command that caused the error occurred, the device was doing SMART Offline or Self-test.                                                   
                                                                                                                                                      
  After command completion occurred, registers were:                                                                                                  
  ER -- ST COUNT  LBA_48  LH LM LL DV DC                                                                                                              
  -- -- -- == -- == == == -- -- -- -- --                                                                                                              
  40 -- 51 00 00 00 01 ba 86 db 28 40 00  Error: UNC at LBA = 0x1ba86db28 = 7424367400                                                                
                                                                                                                                                      
  Commands leading to the command that caused the error were:                                                                                         
  CR FEATR COUNT  LBA_48  LH LM LL DV DC  Powered_Up_Time  Command/Feature_Name                                                                       
  -- == -- == -- == == == -- -- -- -- --  ---------------  --------------------                                                                       
  60 00 08 00 78 00 01 ba 86 db 28 40 08  2d+00:48:12.368  READ FPDMA QUEUED                                                                          
  60 00 08 00 70 00 01 ba 86 db 20 40 08  2d+00:48:12.368  READ FPDMA QUEUED
  60 00 08 00 68 00 01 ba 86 db 18 40 08  2d+00:48:12.368  READ FPDMA QUEUED
  60 00 08 00 60 00 01 ba 86 db 10 40 08  2d+00:48:12.368  READ FPDMA QUEUED
  60 00 08 00 58 00 01 ba 86 db 08 40 08  2d+00:48:12.368  READ FPDMA QUEUED
[...]
SMART Extended Self-test Log Version: 1 (1 sectors)                                                                                                   
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error                                                       
# 1  Selective captive   Interrupted (host reset)      90%     32270         -                                                                        
# 2  Selective captive   Interrupted (host reset)      90%     32270         -                                                                        
# 3  Selective captive   Interrupted (host reset)      90%     32270         -                                                                        
# 4  Short offline       Completed without error       00%     32270         -                                                                        
# 5  Selective offline   Completed: read failure       90%     32269         7528551873                                                               
# 6  Extended offline    Completed: read failure       10%     32269         7526054736                                                               
# 7  Extended offline    Completed: read failure       90%     30011         100173888                                                                
# 8  Extended offline    Completed: read failure       90%     29339         100173888                                                                
# 9  Extended offline    Completed: read failure       90%     27452         100173888                                                                
#10  Selective offline   Completed without error       00%     26475         -                                                                        
#11  Extended offline    Completed: read failure       10%     26415         7423573328                                                               
#12  Extended offline    Completed: read failure       10%     26404         7423573328                                                               
#13  Extended offline    Completed without error       00%     19509         -                                                                        
#14  Extended offline    Completed without error       00%     14888         -                                                                        
#15  Extended offline    Completed without error       00%     11652         -
#16  Extended offline    Completed without error       00%      8765         -
#17  Extended offline    Completed without error       00%      6748         -
#18  Extended offline    Completed without error       00%        27         -

Badblocks scheint von dem Problem auch etwas mitbekommen zu haben. 1 Lesefehler wurde erkannt.

Code:

Testing with pattern 0x55: done                                                 
Reading and comparing:  98.06% done, 2:36:35 elapsed. (1/0/0 errors)

Man sieht, dass ich die Platte gerade aktiv untersuche und Dinge ausprobiere. Kaputt machen kann ich ja gerade nichts.

Die Platte hat Probleme, aber prinzipiell würde ich meinen, dass ich hier keine 80 Euro in die Hand nehmen muss. Die Platte würde ich sowieso weiter benutzen, um Daten auszulagern und Daten wurden bisher nicht korrumpiert. Meiner Meinung nach, ist es einfach nur ein Kratzer im Lack.
Ich möchte diesen Kratzer trotzdem gerne beseitigen. Aber der Klassiker, die Platte einfach zu überschreiben und selbst erkennen zu lassen, dass sie einen Sektor austauschen muss, funktioniert hier leider nicht.

Der GP Log 0x04 zeigt noch mal weitere Statistiken:

Code:

0x03  =====  =               =  ===  == Rotating Media Statistics (rev 1) ==                                                                          
0x03  0x008  4           32162  ---  Spindle Motor Power-on Hours                                                                                     
0x03  0x010  4           32133  ---  Head Flying Hours                                                                                                
0x03  0x018  4             262  ---  Head Load Events                                                                                                 
0x03  0x020  4               0  ---  Number of Reallocated Logical Sectors                                                                            
0x03  0x028  4            4385  ---  Read Recovery Attempts                                                                                           
0x03  0x030  4               0  ---  Number of Mechanical Start Failures                                                                              
0x03  0x038  4               8  ---  Number of Realloc. Candidate Logical Sectors                                                                     
0x03  0x040  4              57  ---  Number of High Priority Unload Events
0x04  =====  =               =  ===  == General Errors Statistics (rev 1) ==
0x04  0x008  4            1754  ---  Number of Reported Uncorrectable Errors
0x04  0x010  4               0  ---  Resets Between Cmd Acceptance and Completion

Ich nenne es mal, nicht so gesund, aber funktioniert.

Also meine Frage: Hat jemand schon mal mit ähnlichen Symptomen zu kämpfen gehabt? Wie bekomme ich die Platte dazu, ihre fehlerhaften Sektoren auszutauschen?

--- edit
Es wäre auch zu einfach. Der selektive Test auf einen Bereich mit vormals defekten Sektoren wird ohne Fehler beendet.

Code:

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Selective offline   Completed without error       00%     32272         -                                                                        
[...]
# 7  Selective offline   Completed: read failure       90%     32269         7528551873
# 8  Extended offline    Completed: read failure       10%     32269         7526054736

 SPAN     MIN_LBA     MAX_LBA  CURRENT_TEST_STATUS
    1  7526000000  7600000000  Not_testing

Vielleicht fällt ja jemanden dazu etwas ein. Sobald badblocks durch ist, schicke ich die Platte noch mal in ihren 8 stündigen long Test. Mit etwas Glück hat sich das Problem mit Beharrlichkeit gelöst.

--- Nachtrag
Ich werde nicht schlau daraus, aber badblocks ein paar Mal über die fehlerhaften Sektoren schreiben zu lassen, hat die Platte anscheinend zu Einsicht bewegt. Weil mir die Rechnung LBA auf Sektoren und Blöcke für die späte Nacht zu lästig war, hatte ich einfach eine Partition von knapp 200 GB erstellt und badblocks dort arbeiten lassen.
Der anschließende long Test ist erfolgreich abgeschlossen worden. Fragt mich nicht, aber ich mache mit der Platte jetzt weiter. Als Parity Laufwerk taugt sie trotz des Vertrauensverlusts doch noch.

Inzersdorfer · 25. März 2023

Es war ja ein current pending sector verzeichnet, der wird erst nach einem beschreiben entweder a) weil er auch wieder gelesen werden konnte als i.O. eingestuft oder b) nicht gelesen werden konnte durch einen Reservesektor ersetzt.

Ein neues SMART Log könnte hier eventuell Aufschluß bringen.

Penman · 25. März 2023

Es war ja nicht nur ein Sektor, sondern mehrerer, die nicht gelesen werden konnten. Das Seltsame ist ja, dass er die ganze Zeit nicht korrigiert wurde und die Platte erst nach mehrmaligen Neuschreiben irgendetwas gemacht hat.

Code:

ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE                                                                                
  1 Raw_Read_Error_Rate     POSR-K   200   157   051    -    3                                                                                        
  3 Spin_Up_Time            POS--K   176   168   021    -    6158                                                                                     
  4 Start_Stop_Count        -O--CK   100   100   000    -    98                                                                                       
  5 Reallocated_Sector_Ct   PO--CK   200   200   140    -    0                                                                                        
  7 Seek_Error_Rate         -OSR-K   200   200   000    -    0                                                                                        
  9 Power_On_Hours          -O--CK   056   056   000    -    32291                                                                                    
 10 Spin_Retry_Count        -O--CK   100   253   000    -    0                                                                                        
 11 Calibration_Retry_Count -O--CK   100   253   000    -    0                                                                                        
 12 Power_Cycle_Count       -O--CK   100   100   000    -    98                                                                                       
192 Power-Off_Retract_Count -O--CK   200   200   000    -    57                                                                                       
193 Load_Cycle_Count        -O--CK   200   200   000    -    218                                                                                      
194 Temperature_Celsius     -O---K   114   106   000    -    36                                                                                       
196 Reallocated_Event_Count -O--CK   200   200   000    -    0                                                                                        
197 Current_Pending_Sector  -O--CK   200   200   000    -    0                                                                                        
198 Offline_Uncorrectable   ----CK   100   253   000    -    0                                                                                        
199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    8
200 Multi_Zone_Error_Rate   ---R--   200   200   000    -    3

Current Pending Sector ist jetzt auf 0, aber Reallocated Sector Count ist ebenfalls bei 0 geblieben. Es wäre ja auch nicht das erste Mal, dass sie sich auf magische Art und Weise selbst repariert hätte.

Inzersdorfer · 25. März 2023

Der Sektor, der nicht gelesen werden konnte, wurde überschrieben und dannach, bei einer Leseprüfung, konnte er wieder gelesen werden, deshalb mußte er auch nicht durch einen Reservesektor ersetzt werden. Das ist keine Magie sondern die Standardvorgehensweise.

Magie ist eher das sich die Anzahl der gemeldeten Schreibfehler von 13 auf 3 reduziert hat.

Penman · 27. März 2023

Inzersdorfer schrieb:
Magie ist eher das sich die Anzahl der gemeldeten Schreibfehler von 13 auf 3 reduziert hat.

Multi Zone Error Rate klingt für mich nicht nach einem Zähler. Mich würde interessieren, was jetzt eigentlich genau das Problem war und warum es mehrere Anläufe gebraucht hat, um festzustellen, dass es doch kein Problem war.
Die Firmware meldet dem Interface, "Unrecovered read error - auto reallocate failed". Beim Lesen wird meines Wissens auch nicht reallokiert sondern beim Schreiben. Aber zumindest "weiß" die Platte, dass da ein Problem liegt. Das wollte sie aber auch nicht als Pending Sector eintragen. Lesbar war der Sektor ja eigentlich auch. Mit hdparm konnte ich die Daten ja auslesen. Es hat nur einen Moment gedauert.

Es ist zwar schön, dass die Platte sich wieder gefangen hat, ab der Weg dahin gibt mir zu denken. Ich weiß, dass die betroffenen Sektoren ein Festplatten Image für eine VM zugewiesen waren. Darin wahrscheinlich auch selten gelesen, weil der Lesefehler selten im Kernel Log auftauchte. Gelöst wurde das Problem am Ende, dass ich die Sektoren mit Badblocks mehrfach neu beschreiben und in den Read Error laufen lassen habe. Badblocks hatten diese auch als Lesefehler erkannt, aber nicht im Log vermerkt und anschließend waren sie ja verschwunden.

Ich habe jetzt von RAID 6 auf ZFS umgestellt. Die Druckbetankung mit den Daten hat das Dateisystem erst mal anstandslos und zügig ausgeführt und tut still seinen Dienst. Es bleibt einfach seltsam. Ich beobachte das mal weiter.

Chefkoch42 · 13. April 2023

Moin,

wie sehen die SMART-Werte hier für euch aus? Meine Platten sind, bis auf die 840 relativ neu.

Ironwolf 10 TB: Datengrab, Backups
980 Pro: OS
970 EVO: Games
840 SSD: Test-OS
MX500: Sensible Daten, Arbeitsplatte (Vollständig synchronisiert mit einem NAS)

Inzersdorfer · 13. April 2023

Bis auf die 5 CRC Fehler der 840er (wohl älteren Datums) sieht das Sammelsurium soweit eh gut aus.

[Sammelthread] HDD-Probleme, SMART-Analysen

Admiral

Cadet 1st Year

Commodore

Admiral

Cadet 1st Year

Cadet 1st Year

Admiral

Cadet 1st Year

Newbie

Fleet Admiral

Newbie

Commodore

Admiral

Lieutenant

Admiral

Lieutenant

Admiral

Lieutenant

Cadet 4th Year

Admiral

Ähnliche Themen

Passend zum Thema