Banned schrieb:
Kann die HDD einen Sektor über ihren eigenen ECC nicht wiederherstellen, kommt dies zum Einsatz.
Hier sollte man aber sowohl die verschiedenen Fehlerfälle im Kontext ECC durch die Platte differenzieren als auch wie die RAID-Steuerung die Daten liest und prüft.
Bei ECC gibt es neben A) erkennbaren und korrigierbaren Fehlern auch B) erkennbare, aber nicht korrigierbare und sogar (wenn auch am recht unwahrscheinlich) C) nicht erkennbare (die dann logischerweise auch nicht korrigierbar sind, da es gar nicht erst versucht wird).
Im Fall A) korrigiert die Platte selbst, zählt das Korrekturevent per SMART hoch und behält den verdächtigen Sektor vermutlich im Blick um ihn bei Bedarf zu tauschen. Die nach oben gelieferten Daten sind hier garantiert richtig, was heißt, dass hier alles normal weiter läuft. Dieser Fall ist dem RAID also relativ wurst.
Im Fall B) meldet die Platte aktiv ein Problem und kann keine (korrekten) Daten liefern. Primär in diesem Fall hat die RAID-Steuerung also nun einen klaren Anlass, um auf anderen Datenträgern nach dem korrekten Sektorinhalt zu fragen und diesen auch neu auf den Problemdatenträger zurückschreiben.
Nur im unwahrscheinlichsten Fall C) würde die Platte allerdings stellenweise falsche Daten liefern, ohne dass sie dabei ein Problem signalisiert. Falls die RAID-Steuerung im Sinne der Performanz jeden Sektor nur von einer Platte liest (statt von allen möglichen redundanten Ablageorten), würde auch sie den Fehler möglicherweise nicht bemerken (sofern sie nicht eigene Checksummen verwaltet und prüft) und würde folglich die vorhandene Redundanz durch das RAID nicht zur Korrektur nutzen. Ein intelligentes RAID muss also schon etwas mehr machen als sich auf die ECC-Korrektur und ggf. Fehlermeldung durch die Platte zu verlassen....
Banned schrieb:
Hast du z.B. eine einzelne HDD und ein Sektor kann nicht wiederhergestellt werden, sind seine Daten erst mal verloren. Du kriegst als Nutzer noch nicht mal unbedingt mit, dass es überhaupt einen Fehler gegeben hat.
Nicht beide Fälle vermischen. Wenn eine Wiederherstellung gescheitert ist, sind wir in Fall B), wo die Platte auf jeden Fall einen Fehler wirft und z.B. der Windows Explorer meckert, dass nicht vom Quelldatenträger gelesen werden konnte. Nur, wenn der Fehler
nicht erkannt wurde (da trotz Multi-Bit-Fehlern in den beschädigten Daten die geprüfte ECC Checksumme zufällig weiterhin passt), würde es passieren können, dass falsche Daten geliefert werden, ohne dass man es mitbekommt - dem ging dann aber kein gescheiterter Wiederherstellungsversuch voraus.