Synology - Anzahl fehlerhafter Sektoren

Hot Dog

Lieutenant
Registriert
Mai 2007
Beiträge
940
Sorry, falls es hier dazu schon was gibt, konnte auf den 17 Seiten im Forum allerdings nichts dazu finden.

Hai Leute, irgendwelche Synology bzw. Seagate-Cracks unter euch? :)
Mein Synology NAS "DS413" berichtet seit 2-3 Monaten von einer steigenen Anzahl fehlerhafter Sektoren auf einem meiner insgesamt 4 Laufwerke (4xSeagate je 4 TB im Raid 5).
Jetzt habe ich mich durch einige Foren gekämpft und alle berichten davon, dass wenn die Zahl 100 fehlerhafte Sektoren überschreitet man sich Sorgen machen sollte. Die Anzahl ist in den letzten Monaten gestiegen (siehe Screenshot Verlauf) aber soweit laut Synology OS noch alles "in Ordnung" (siehe Screenshot Übersicht).

Jetzt zu meiner Frage: Synology gibt mir "43464 fehlerhafte Sektoren für Laufwerk 1 an", aber das sind ja nur die Rohdaten der SMART-Werte, welche man ja nicht 1 zu 1 so übernehmen kann (siehe Screenshots SMART-Werte Laufwerk 1). Es handelt sich um eine Seagate-Platte. Wie genau bemisst Seagate seine SMART-Werte? Also wie viel Bit, wie ist Einteilung in oberer/unterer Bereich und ab wann wird in den oberen Bereich geschrieben?.
Mit anderen Worten: 43464 ist noch kein Grund zur Sorge, richtig? Die SMART-Werte sehen soweit mal noch vollkommen in Ordnung aus. Also kann man die Warnung mehr oder weniger ignorieren, richtig?
Ich verstehe nur nicht, warum dann alle so ein großes Ding um "mehr als 100 fehlerhafte Sektoren" machen. Weiß dazu jemand was?

Besten Dank schonmal.
Grüße, HD

UPDATE (15.05.22):
Habe die Migration vom alten zum neuen NAS jetzt beinahe abgeschlossen. Bisher gab es keine Fehler oder gar verlorene Dateien. Das alte NAS hat die Parity des alten Raids trotz fehlerhafter Sektoren aufrecht erhalten.
 

Anhänge

  • Synology_Volume_Laufwerk_1_Uebersicht.jpg
    Synology_Volume_Laufwerk_1_Uebersicht.jpg
    132,5 KB · Aufrufe: 615
  • Synology_Volume_Laufwerk_1_Verlauf.jpg
    Synology_Volume_Laufwerk_1_Verlauf.jpg
    62,7 KB · Aufrufe: 582
  • Laufwerk_1_01.jpg
    Laufwerk_1_01.jpg
    73,5 KB · Aufrufe: 566
  • Laufwerk_1_02.jpg
    Laufwerk_1_02.jpg
    73,3 KB · Aufrufe: 557
Zuletzt bearbeitet:
Was ist mit der zweiten HDD - die mit Warndreieck?

Hot Dog schrieb:
Mit anderen Worten: 43464 ist noch kein Grund zur Sorge, richtig?
Ich würde mich nicht wundern, wenn die HDD in den nächsten Wochen/Monaten krepiert

1744 offline_uncorrectable sind auch ein eher mieses Zeichen bezüglich dem Zustand der HDD


Insgesamt: Ich hoffe deine Backups sind aktuell gehalten.
 
Du kannst den Zustand der Platte nicht and einer bestimmten Zahl festmachen.
99 fehlerhafte Sektoren = kein Problem, 100 fehlerhafte Sektoren = Platte schrott, ist schlichtweg einfach nur falsch.
Du musst dir immer den Verlauf anschauen.
Hast du 100 defekte Sektoren und ein Jahr später immernoch 100 defekte, dann tut die Platte warscheinlich auch noch weiter.
Hast du aber 100 jetzt und morgen 200 , übermorgen 300 usw. dann wird dir die Platte warscheinlich abrauchen.
 
die platte ist so gut wie hinüber. reallokierte sektoren sind zwar durchaus vorgesehen, aber wenn das sprunghaft und stark steigt, dann ist das ein sicheres zeichen, dass die platte bald ganz aussteigt.
 
Rickmer schrieb:
Was ist mit der zweiten HDD - die mit Warndreieck?
Die ist bereits vor 1 Jahr krepiert. Aber darum hab ich ja RAID5. Jetzt darf halt Laufwerk 1 nicht auch noch ausfallen, darum wollte ich mich hier mal schlau machen :)
Ergänzung ()

Sunweb schrieb:
Du kannst den Zustand der Platte nicht and einer bestimmten Zahl festmachen.
99 fehlerhafte Sektoren = kein Problem, 100 fehlerhafte Sektoren = Platte schrott, ist schlichtweg einfach nur falsch.
Ja das ist klar. Aber wie kommen die überhaupt auf 100 fehlerhafte Sektoren?
Damit können doch wohl kaum die Rohdaten der SMART-Werte gemeint sein oder? Weil die sagen ja nur bedingt etwas über die tatsächliche Anzahl fehlerhafter Sektoren aus. Stichwort: oberer/unterer Bereich im Bit-Wert.
 
Die Festplatte kannst du auf den Müll hauen. Die ist defekt und Daten würde ich der nicht mehr anvertrauen. "In Ordnung" ist die schon lange nicht mehr!
 
wenn dir was an deinen daten liegt, dann mach JETZT ein backup sofern noch nicht vorhanden. ersetze laufwerk2 mit einer ersatzplatte und hoffe, dass das rebuild noch klappt. danach laufwerk1 ersetzen.
 
  • Gefällt mir
Reaktionen: PHuV und Blende Up
floklo4 schrieb:
Die Festplatte kannst du auf den Müll hauen. Die ist defekt und Daten würde ich der nicht mehr anvertrauen. "In Ordnung" ist die schon lange nicht mehr!
Geht es auch etwas genauer? Die SMART-Werte sehen noch vollkommen in Ordnung aus.
 
Hot Dog schrieb:
Die ist bereits vor 1 Jahr krepiert. Aber darum hab ich ja RAID5.
Uff viel Glück, gerade das Rebuild ist mit das beanspruchendste an eine Festplatte. Würde mich nicht wundern, wenn du die wirklich kaputte Festplatte (die mit dem Dreieck) ersetzt und dabei die Festplatte mit den 40k fehlerhaften Sektoren hops geht. Ich hoffe du hast ein Backup.
 
  • Gefällt mir
Reaktionen: nkler und n8mahr
b4sk schrieb:
Uff viel Glück, gerade das Rebuild ist mit das beanspruchendste an eine Festplatte. Würde mich nicht wundern, wenn du die wirklich kaputte Festplatte (die mit dem Dreieck) ersetzt und dabei die Festplatte mit den 40k fehlerhaften Sektoren hops geht. Ich hoffe du hast ein Backup.
Ja, habe ein Backup. Aber ein Rebuild kommt sowieso nicht in Frage. Wenn dann hole ich mir ein 8-bay-NAS und ein komplett neues Set an Platten.

Sunweb schrieb:
Nein tun sie nicht...
Wieso? Bin noch weit von den Schwellenwerten entfernt.
 
Schwellenwert ?
Bitte vergiss das mal ganz schnell wieder...
Nochmal: Du kannst den Zustand nicht and fixen Zahlen festmachen.
 
  • Gefällt mir
Reaktionen: n8mahr
Hot Dog schrieb:
Geht es auch etwas genauer? Die SMART-Werte sehen noch vollkommen in Ordnung aus.
Gerne:

ID 1 und ID 7 kann bei Seagate Festplatten ignoriert werden. Die hohen Zahlen sind normal.

ID 5 sagt dir, wie viele defekte Sektoren wieder zugewiesen wurden, d.h. mit Austauschsektoren ersetzt wurden. In deinem Fall 39976.

ID 197 sagt, wie viele Sektoren "vielleicht" defekt sind. Bei dir 1744 Sektoren.

ID 198 sagt, wie viele Sektoren wirklich defekt sind, bei dir auch 1744.

Das die HDD überhaupt noch lebt und ansprechbar ist, ist ein Wunder...
 
  • Gefällt mir
Reaktionen: Hot Dog
Sunweb schrieb:
Schwellenwert ?
Bitte vergiss das mal ganz schnell wieder...
Nochmal: Du kannst den Zustand nicht and fixen Zahlen festmachen.
Etwas genauer bitte?
Mein Grundverständnis ist folgendes:
SMART-Rohdaten werden in den unteren Bit-Bereich gespeichert, bis sie einen gewissen Wert übersteigen. Ab dann wird in den oberen Bereich geschrieben und man nähert sich ab dann dem Schwellenwert an. Also es wird solange abgezogen, bis man unten angekommen ist.
Aber das ist bei mir ja nicht der Fall. Hab ja noch Raum nach unten.

floklo4 schrieb:
Danke für die Erklärung, das hilft bereits etwas. 👍
 
Hot Dog schrieb:
Wieso? Bin noch weit von den Schwellenwerten entfernt.
wie schon einige hier sagten - sch.. auf den schwellenwert.
du hast ein raid5.
du hast eine platte, bei denen fehlerhafte sektoren sprunghaft deutlich zunehmen.
du hast eine weitere platte, die mit !! gekennzeichnet ist, bei der wir nicht wissen, was das soll.
...
...
viel spaß mit deinem raid5 und zwei unzuverlässigen platten.
entweder, dir liegt was an dem raid, oder du lässt es abrauchen und kaufst neu. was fragst du hier überhaupt? willst du als antwort haben: ist nicht wild, die zahlen sind unwichtig. wichtig ist nur, dass sie läuft und nicht klingt wie eine kreissäge?
die antwort ist doch klar: JEDER rät dir, die platte zu tauschen, da sie offensichtlich etwas hat und die möglichkeit des ausfalls deutlich erhöht ist.

anders formuliert: kann sein, dass die platte noch 3 jahre so weiter läuft. es ist nur sehr unwahrscheinlich.
 
Ich kann dir ebenfalls nur ganz dringend empfehlen deine Daten zu sichern und dann versuchen die bereits ausgefallene Disk zu ersetzen. Wenn der Rebuild geklappt hat, dann auch die Disk mit den Fehlerhaften Sektoren ersetzen.
Leider ist ein Rebuild eine ziemliche Belastung für die Platte, so das ein weiterer Ausfall nicht unwahrscheinlich ist... also sofort sichern, anfangen mit den wichtigsten Daten.

Sag später nicht man hätte dich nicht gewarnt...
 
Hot Dog schrieb:
Etwas genauer bitte?
Mein Grundverständnis ist folgendes:
SMART-Rohdaten werden in den unteren Bit-Bereich gespeichert, bis sie einen gewissen Wert übersteigen. Ab dann wird in den oberen Bereich geschrieben und man nähert sich ab dann dem Schwellenwert an. Also es wird solange abgezogen, bis man unten angekommen ist.
Aber das ist bei mir ja nicht der Fall. Hab ja noch Raum nach unten.
Vergiss ganz schnell den Schwellenwert. Du schaust immer dir die Rohdaten bzw. die Dezimalzahl der einzelnen Werte an. Und die sind eben unter aller Kanone ;) Das NAS müsste die schon längst anders einstufen...
 
n8mahr schrieb:
viel spaß mit deinem raid5 und zwei unzuverlässigen platten.
Geht es auch etwas freundlicher? Sowas kannst du dir wahrlich sparen.
Nein, ich brauch hier keine guten Zusprüche. Darum bin ich auch in einem Tech-Forum 🤦‍♂️
Es geht mir um das Grundverständnis. Insbesondere bei Seagate-Platten.
Nicht mehr und nicht weniger.
 
current/worst/threshold sind in smart nicht standardisiert. hier wird "Reallocated_Sector_Ct" wahrscheinlich auf 100% normiert sein, d.h. deine platte hat 31% der reserve-sektoren aufgebraucht. du hast allerdings schon 1744 defekte sektoren - wenn die ausgefallen sind, als dein laufwerk2 schon defekt war, dann hast du schon datenverlust gehabt.
 
  • Gefällt mir
Reaktionen: Hot Dog
0x8100 schrieb:
current/worst/threshold sind in smart nicht standardisiert. hier wird "Reallocated_Sector_Ct" wahrscheinlich auf 100% normiert sein, d.h. deine platte hat 31% der reserve-sektoren aufgebraucht. du hast allerdings schon 1744 defekte sektoren - wenn die ausgefallen sind, als dein laufwerk2 schon defekt war, dann hast du schon datenverlust gehabt.
okay danke, das hilft ebenfalls.
Aber wenn erst 31% aufgebraucht sind, habe ich ja noch Raum. Das meinte ich ja.
Und ja, Laufwerk 2 ist schon seit über einem Jahr hinüber.
 
Zurück
Oben