3TB NAS Festplatte, READ Error, C5/197 Pending Sectors 602, zurücksetzen/reallocate oder austauschen?

gojomo

Ensign
Registriert
Okt. 2005
Beiträge
203
Vor ein paar Tagen hat mein QNAP NAS angefangen mir für eine der beiden WD RED HDDs (RAID 1) folgende Fehlermeldung rauszugeben:

Code:
[Hardware Status] "Host: 3.5" SATA HDD 2": Read  I/O error, "UNRECOVERED READ ERROR ", sense_key=0x3, asc=0x11, ascq=0x4, CDB=88 00 00 00 00 01 5a e3 97 88 00 00 04 00 00 00 ..

Habe dann einen "Complete Test" durchgeführt:

Code:
[Disk S.M.A.R.T.] Host: 3.5" SATA HDD 2 Complete Test result: Fatal or unknown error.

Das NAS hat empfohlen einen bad block test laufen zu lassen

Code:
[Hardware Status] "Host: 3.5" SATA HDD 2": Medium error. Run a bad block scan on the drive. Replace the drive if the error persists.

Habe ich mit folgendem Ergebnis gemacht:

Code:
 [Storage & Snapshots] Finished scanning for bad blocks on disk "Host: 3.5" SATA HDD 2". Bad blocks detected: 602.

Habe dann in die SMART werte reingeschaut auf der NAS reingeschaut.

Code:
ID 196 "Reallocated Event Count" = 0
ID 197 "Current Pending Sector"  = 602
ID 198 "Uncorrectable Sector Count" = 0

Habe das dann gegoogelt und wenn ich das richtig verstehe sind 602 blocks(oder sektoren?) fehlerbehaftet aber noch nicht endgültig als bad markiert und keine blocks "aus der Reserve" als Ersatz zugewiesen worden.

Ich habe dann gelesen, dass das WD Drive Utility einen "Complete Drive Test" machen kann, bei dem dann alle Blöcke abgearbeitet und entsprechend zugewiesen oder wieder als "good" markiert werden.

Complete Drive Test
The complete drive test checks every sector for error conditions, and inserts bad sector markers as needed.

Habe das Tool heruntergeladen und auf einem Windows rechner installiert, die HDD aus dem NAS gezogen und angeschlossen. Leider erkennt das WD Drive Utility keine Festplatten (im PC steckt auch eine WD Green als Datenspeicher) und das alternative WD Dashboard Utility bricht den erweiterten Test nach einer Minute mit einer nichtssagenden Fehlermeldung ab. Habe dann noch mit CrystalDiskInfo ausgelesen aber keine neuen Erkenntnise:

2024-08-19 09.23.09.jpg

Ich habe auch gegoogelt, dass andere Tools ausser WD Drive Utility alle Blöcke entsprechend behandeln können, angeblich auch Windows Bordmittel aber ich bin mir unsicher welche ich nehmen sollte. Meine Erwartung ist, dass entweder diese 602 Blöcke doch ok sind und zurückgesetzt werden oder eben "reallocated". Irgendwo stand dass eine moderne HDD ca. 1500 Reserveblöcke hat.

Auf der anderen Seite hat die Platte jetzt auch 48,5k Betriebsstunden (Fast 24/7 Betrieb seit ca. 2019) . Vielleicht ist das ja ein Zeichen die Platte in den Ruhestand zu schicken bevor sie komplett aufgibt und sich gar nicht mehr mit den Blöcken rumzuschlagen?:)
 
  • Gefällt mir
Reaktionen: Azghul0815
gojomo schrieb:
Vielleicht ist das ja ein Zeichen die Platte in den Ruhestand zu schicken bevor sie komplett aufgibt und sich gar nicht mehr mit den Blöcken rumzuschlagen?
Wäre meine Empfehlung.
Nachher passiert noch was mit deiner 2ten Platte und dann darfst dich mit dem Backup und 2 neuen Platten rumschlagen
 
  • Gefällt mir
Reaktionen: M@rsupil@mi, nutrix und gojomo
Sobald was komisch ist, einfach HDD wechseln ohne wenn und aber. Verlust der Daten ist kritischer als eine neue HDD reinzubauen.
 
  • Gefällt mir
Reaktionen: Banned, M@rsupil@mi, Azghul0815 und 2 andere
na hoffentlich hattest du ein Raid1 und kein Raid0
 
Zuletzt bearbeitet:
derChemnitzer schrieb:
na hoffentlich hattest du ein Raid0 und kein Raid1
Azghul0815 schrieb:
@derChemnitzer Raid 0 wäre ja alles am Sack und würde nach Ausbau der Platte ja gar nix mehr gehen. Raid 1 passt schon.

Doch doch wirklich RAID1. Sonst hätte ich jetzt ja ein kleines Problem. Klein, weil ich sicherheitshalber trotzdem ein aktuelles externes Backup gezogen habe
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: redjack1000, H3llF15H und Azghul0815
Alternatives Backup ist trotzdem immer gut, auf ein Raid1 alleine würde ich mich grundsätzlich nicht verlassen. Du mußt immer damit rechnen, daß ein Gerät incl. Datenträger komplett ausfallen kann (Gewitter mit Überspannung im Netz etc.). Daher, mach ein regelmäßiges Backup auf ein Medium, was dann nicht angeschlossen ist.
 
  • Gefällt mir
Reaktionen: Das MatZe
Ich mache ein wöchentliches Backup auf eine externe 2.5“ 3TB USB 3.0 HDD die ich immer auf der Arbeit lagere (off-site, sicher verschlossen) und die ich ausschließlich dafür nutze.

Wenn ich irgendwann mal günstig ein gebrauchtes NAS schieße würde ich das gern bei meinen Eltern/Geschwistern hinstellen und dann wöchentlich per schedule und VPN ein Remote Backup auf ein zweites NAS machen.
 
  • Gefällt mir
Reaktionen: nutrix
gojomo schrieb:
andere Tools ausser WD Drive Utility alle Blöcke entsprechend behandeln können, angeblich auch Windows Bordmittel
Es reicht, schwebende Sektoren zu überschreiben, die Plattenlogik prüft dann diese Sektoren, können sie gelesen werden wird der Rohwert entsprechend reduziert, kann man sie wieder nicht lesen werden sie durch Reservesektoren ersetzt.

Windows Bordmittel wär diskpart.exe: clean all, dabei werden alle Sektoren überschrieben aber auch die Partition gelöscht.

Für nicht Bootlaufwerke: in Start/Suche: cmd eingeben und mit [Strg]+[Umschalt]+[Enter] bestätigen,
das cmd Fenster ist jetzt mit Adminrechten gestartet.

Im Prompt folgendes eingeben und jeweils [Enter] drücken:

diskpart
list disk
(zeigt die Nummer deiner Festplatten)
hier muß die richtige Platte ausgewählt werden, ansonsten droht Datenverlust!
select disk x (X ist die Datenträgernummer der Platte)
clean all (überschreibt alle Sektoren der Platte, dauert aber lange)
nach Ende der Aktionen
exit

Nach einem Neuboot in der Datenträgerverwaltung Initialisieren und anschließend Partitionieren.
 
  • Gefällt mir
Reaktionen: gojomo
@Inzersdorfer Danke aber leider zu spät, weil ich schon folgendes gemacht habe:

In Datenträgerverwaltung/Snap-In alle Volumes gelöscht (waren eh nicht lesbar da NAS filesystem)
Komplette 3TB NTFS langsam formatiert.

Danach war der Rohwert schon auf 0 zurückgesetzt bei pending.

Jetzt gerade läuft noch im cmd.exe chkdsk /x /r /f

Denke aber nicht dass sich da noch was ändert.

Werde die Platte wohl noch paar Wochen nutzen und dann austauschen. Vielleicht taugt sie dann in einem ext Gehäuse noch als dritt-backup
 
Update:

chkdsk /x /r /f ist nach über 4 Stunden ohne Fehler durchgelaufen. CrystalDiskInfo Werte haben sich aber nicht geändert. Wie erwartet sind die 602 "Pending" Sektoren zurückgesetzt worden und es gab keine reallocation.

Unbenannt.JPG

Habe das NTFS Volume danach gelöscht und die Platte zurück ins NAS gesteckt.
Das RAID1 Rebuilding hat automatisch gestartet und dauert jetzt etwas.

Das QNAP zeigt bei S.M.A.R.T health die gleichen Werte wie CrystalDiskInfo

Screenshot from 2024-08-19 20-35-28.png

Mir machen die Schreibfehlerrate (C8)/200 Multi_Zone_Error_Rate doch noch ziemlich Sorgen, dass die Platte doch irgendeine Macke hat. Im Vergleich die HDD1 Werte mit absoluten 0-Raw Values in den entsprechenden Spalten. Beide Platten habe ich damals zusammen gekauft (gleiche Laufzeit/Temperaturen, gleicher Händler/Batch/Versandweg)
Screenshot from 2024-08-19 20-35-18.png

Daher werde ich auf jeden Fall den Tausch anstreben. Bis dahin muss ich mich aber auf die RAID1 Redundanz verlassen. Danke für eure Hilfe!
 
  • Gefällt mir
Reaktionen: Azghul0815
gojomo schrieb:
Mir machen die Schreibfehlerrate (C8)/200 Multi_Zone_Error_Rate doch noch ziemlich Sorgen, dass die Platte doch irgendeine Macke hat.

Klar hat die Platte ne Macke. Denkst du 602 schwebende Sektoren sind normal und entstehen einfach durch ein paar gekippte Bit im Laufe der Zeit?

Da du sie eh im RAID1 betreibst, ist das jetzt nicht so tragisch, aber die solltest du auf jeden Fall zeitnah austauschen und danach auch nicht für Backups verwenden.
 
  • Gefällt mir
Reaktionen: dms
Die Schreibfehler hatten eine mechanische Ursache, eine Verifizierung der Schreibvorgänge gibt es bei PCs nicht, Schreibfehler werden nur registriert wenn dabei die Schreib/Leseeinheit außerhalb ihrer vorgesehenen Position war.

Ob die pending sectors nur die Folge der Schreibfehler, oder doch Oberflächendefekte der Platter der Grund waren, wird sich erst in Zukunft weisen.
 
@Inzersdorfer

Sektoren werden doch als schwebend gekennzeichnet, wenn die Daten nicht zur Sektorprüfsumme passen und auch über den ECC nicht wiederhergestellt werden können. (Klappt dies dann bei weiteren Versuchen, wird der Sektor remapped.)
Wie kann für diese Fehlermeldung ein Schreibfehler (wo der Kopf beim beabsichtigten Schreibvorgang an falscher Position war) verantwortlich sein?
 
Zuletzt bearbeitet:
Der erste Satz klingt aber schon sehr Holtesk...

Wenn du später einen solchen Sektor zu lesen versuchst...
Banned schrieb:
(Klappt dies dann bei weiteren Versuchen, wird der Sektor remapped.)
Remapped wird nur wenn bei einem gelegentlichen Neubeschreiben eines pending sectors dieser wieder nicht gelesen werden kann, dann wird die Sektoradresse auf einen Reservesektor umgeleitet (remapped).
 
Inzersdorfer schrieb:
Remapped wird nur wenn bei einem gelegentlichen Neubeschreiben eines pending sectors dieser wieder nicht gelesen werden kann, dann wird die Sektoradresse auf einen Reservesektor umgeleitet (remapped).


Bei Wikipedia steht zu Current Pending Sector Count:

Count of "unstable" sectors (waiting to be remapped, because of unrecoverable read errors). If an unstable sector is subsequently read successfully, the sector is remapped and this value is decreased. Read errors on a sector will not remap the sector immediately (since the correct value cannot be read and so the value to remap is not known, and also it might become readable later); instead, the drive firmware remembers that the sector needs to be remapped, and will remap it the next time it has been successfully read.
(https://en.wikipedia.org/wiki/Self-...ng_Technology#Known_ATA_S.M.A.R.T._attributes)


Meinem Verständnis nach muss man da zwischen Sektoren, die bei einem erneuten Versuch erfolgreich gelesen werden und deren Inhalt dann an anderer Stelle hinterlegt wird, und den Bad Sectors (deren Inhalt gar nicht mehr gelesen bzw. wiederhergestellt werden kann) unterscheiden. Remapping findet in beiden Fällen statt ab einem gewissen Schwellenwert statt.

Beantwortet letztendlich meine Frage aber auch nicht, wie ein schwebender Sektor aus einem Schreibfehler (also der reinen temporären - und erkannten - Fehlstellung des Schreib-/Lesekopfs) resultieren soll.


Inzersdorfer schrieb:
Der erste Satz klingt aber schon sehr Holtesk...

Wenn du meinst... Ich bin aber ganz sicher nicht Holt. :P
 
Zurück
Oben