Ausfall von WD red im NAS, defekt oder nicht?

Shadow1701

Ensign
Registriert
Juli 2012
Beiträge
221
Guten Morgen,

vorgestern ist ein Problem mit einer HDD aufgetreten, dass ich so noch nie hatte.

In einem 6-bay QNAP sind 6 WD red mit je 8TB verbaut. Alle 6 HDD haben laut Qnap eine Betriebszeit von 808 Tagen.

Vorgestern ist Nummer 5 ausgefallen. Das NAS hat in periodischen Abständen angefangen zu Piepen (2 Piepser mit kurzer Pause). In der Datenträgerverwaltung war HDD 5 nicht mehr vorhanden. So als hätte ich die Platte physisch entfernt. Dann habe ich das NAS neu gestartet, daraufhin wurde Nr. 5 wieder erkannt, SMART Werte allesamt gut, kurzer Test erfolgreich. QNAP hat dann angefangen das Raid5 zu synchronisieren, dauer vorrausichtlich 28 Stunden. Etwas 5 Stunden später, 23 Uhr, hat die Piepserei wieder angefangen, Ausfall von Platte 5. NAS abgeschalten und schlafen gegangen.

Gestern Abend wieder eingeschalten. Platte 5 funktioniert, QNAP beginnt wieder mit der Synchronisierung. Diesmal ist die HDD nicht nach 5 Stunden ausgefallen. Heute Morgen war das NAS immer noch mit synchronisieren beschäftigt.

Als das NAS die Platte nicht mehr erkannt hat ist sie noch gelaufen, begleitet von leisen klackern. Privat und in der Arbeit hatte ich schon einige defekte HDDs, da war das Klackern immer deutlich lauter. Es war nur zu hören wenn ich das Ohr praktisch an das NAS gelegt hatte.

Die alles entscheidende Frage: defekt oder nicht, und was kann diese für mich seltsamen Sympthome erklären?

Vielen Dank und schöne Grüße, Shadow.
 
In den PC damit und mal mit Crystal Disk gucken, was die Smart Werte konkret sagen oder kann das NAS das auch detailiert so anzeigen?
 
Ja, können die (hatte auch mal ein QNAP im Einsatz), nur die Interpretationen sind manchmal nicht identisch. Im Zweifel würde ich von Defekt ausgehen, da es ja nichts bringt, wenn die Platte ständig aus dem System fliegt.
Nicht immer äußern sich Fehler durch Klackern und nicht immer wird die Platte danach nicht wieder erkannt. Hatte erst kürzlich ähnliches mit WD RED 3 TB. Immer wieder aus dem System geflogen (Synology DS220j, Platten aus altem NAS). Am Ende mussten beide ersetzt werden, obwohl SMART (sowohl von DSM als auch CDI) nichts anzeigte und die Fehler scheinbar mit HDD Tests nicht proviziert werden konnten.

Hier mal das Protokoll, seit dem Austausch ist da Ruhe im Karton (Laufwerk 2 wurde bereits Anfang Mai ausgetauscht):

1593754856328.png

Wie man sieht können Fehler auch mal ein paar Tage nicht auftreten und dann wieder kommen.

Ich hatte jetzt mehrfach 3 TB Reds aus den Produktionsjahren 2015/2016, die nur 3-4 Jahre liefen, also gerade so über die Garantie. Bei früheren Produktionsjahren (z.B. 2013) hatte ich bislang keine Probleme. Ob Zufall oder nicht kann icht nicht sagen.


BTW ich hoffe du hast RAID 6 bei dem Einsatz dieses Plattentyps? RAID 5 wäre ungeschickt.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: up.whatever
Wenn mir sowas passieren würde würde ich das System nicht x-mal aus und einschalten sondern die Platte austauschen :o
Außer die sind die Daten eher unwichtig? Smart werte sind kein Garant für reibungslose Funktion. Auch funktionierende Platten können klackern, das würde ich jetzt nicht unbedingt als Fehlerquelle ausmachen.
 
d3nso schrieb:
Smart werte sind kein Garant für reibungslose Funktion.
Bei SSDs gibt es Anbieter die Probleme dort nicht anzeigen, aber bei HDDs kennen ich keinen der dort Probleme verschweigt, wohl aber eine Menge Leute die die Werte nicht richtig interpretieren können und deshalb diese blödsinnige Meinung vertreten.
 
Alles klar, ich werde die Platte ersetzen damit ich künftig keinen Ärger habe. Trotzdem werde ich sie in meinen Rechner einbauen und testen.

Raid5 oder Raid6? Ich bin nicht zu Hause und kann das nicht überprüfen. Bin mir jetzt nicht sicher.

Ja, ich kann mit dem NAS herumspielen soviel ich will, weil ich sämtliche Daten gesichert habe. Wirklich wichtige Daten (das sind jetzt nicht soooo viele) sind sogar doppelt gesichert.
 
Klingt für mich nach ähnlichen Symptomen, wie bei diesem Leserartikel: https://www.computerbase.de/forum/t...onwolf-festplatte-im-qnap-ts451a-nas.1945514/

Die Frage des RAIDs muss sich der TE selber stellen, um ihm RAID5 reicht, ich wäre evtl. auch auf 6 gegangen, kenne aber seine Anforderungen nicht.

Lange Vorrede, nicht viel Sinn: Ich würde auch (bei R5 schneller als bei R6) ne neue Platte einhängen und die Synchro starten.

Catos
 
  • Gefällt mir
Reaktionen: Shadow1701
Holt schrieb:
ber bei HDDs kennen ich keinen der dort Probleme verschweigt
Naja WD ist da so ein Fall. Bei einer meiner HDD mit fehlerhaften Sektoren, wurden diese wieder wundersam geheilt. Nur, daß neue Fehler kurz darauf aufzutauchen.
 
Ich komme jetzt ein bischen vom Thema ab:

Wie sieht es heute mit Seagate Platten aus? Ich habe aufgehört die zu kaufen weil bis jetzt jede einzelne Seagate HDD mit der ich zu tun hatte den Geist aufgegeben hat. Allerdings boykottiere ich Seagate schon seit vielen Jahren. Hat sich da was verändert?

Gibt es andere NAS taugliche HDDs die zu empfehlen sind?
 
cgs schrieb:
Bei einer meiner HDD mit fehlerhaften Sektoren, wurden diese wieder wundersam geheilt.
Was Du als "fehlerhaften Sektoren" bezeichnest, dürften Schwebende Sektoren gewesen sein, aber Schwebende Sektoren sind einfach nur Sektoren deren Daten nicht mehr zur ECC passen die hinter jedem Sektor steht und die mit deren Hilfe auch nicht mehr korrigiert werden können. Da die korrekten Daten nicht mehr feststellbar sind, gibt die Platte statt falscher Daten einen Lesefehler als Antwort wenn man versucht diese schwebenden Sektoren zu lesen. Das kann auch anderen Gründe als defekte Oberflächen haben, z.B. einen Stromausfall während eines Schreibvorgang der dazu führt, dass eben nicht die ganze Daten plus der neuen ECC geschrieben wurden oder wegen eines Stoßes oder Vibrationen ist der Kopf beim Schreiben aus der Spur gekommen und hat Daten auf der Nachbarspur überschrieben. Auch arbeiten HDDs nicht 100%ig und die Hersteller geben die Fehlerhäufigkeit auch in Form der UBER an, wobei eine UBER von 1:10^14 bedeutet, dass je 10^14 gelesener Bits was etwa 12TB gelesener Daten entspricht, ein Lesefehler und damit schwebender Sektor im Rahmen der Erwartungen liegt.

Die Controller merken sich die schwebenden Sektoren und prüfen die Daten nach dem erneuten Schreiben auf diese Sektoren, dann verschwinden diese einfach oder werden eben durch Reservesektoren ersetzt. Dies sind eben nicht automatisch fehlerhafte Sektoren und dies zeigt mal wieder, dass das Misstrauen gegenüber den S.M.A.R.T. Werten nur auf mangelndem Wissen beruht und unberechtigt ist.

Shadow1701 schrieb:
Wie sieht es heute mit Seagate Platten aus?
Bei denen sah es nie schlecht aus, wenn man die passenden HDDs für den Einsatz gekauft hat, also für ein NAS eben eine NAS Platte und keine billige einfache Desktopplatte.
 
@Holt ja das stimmt, dennoch hatte diese Platte einen Schaden, aber das Löschen dieser Probleme aus den SMART Daten hat mir den RMA sehr erschwert.
 
cgs schrieb:
dennoch hatte diese Platte einen Schaden
Kann sein, aber ohne deren S.M.A.R.T. Werte zu kennen, würde ich dies nicht beschreien. Außerdem schrieb der TE:
Shadow1701 schrieb:
So als hätte ich die Platte physisch entfernt.
Entfernen ist nicht das Gleiche wie Ersetzen, wenn sie nur entfernt wurde, ist das RAID hinterher eben degradiert und wenn sie ersetzt wurde, so bleibt noch das Problem der mies UBER der WD Red von nur 1:10^14: Bei 6 HDDs zu 8TB im RAID 5 beträgt die theoretische Chance auf ein erfolgreiches Rebuild nur so 0,4%! Wären es Platten mit einer UBER von 1:10^15 wie bei den IronWolf ab 6TB, wären es über 70%, also ein gewaltiger Unterschied!
 
@Holt oder eben Raid 6 bei 1:10^14, deshalb ja oben meine Nachfrage an @Shadow1701.
 
Das hier sind die SMART Werte von CrystalDisk:
SnapShot.jpg


Was sagt das euch Experten?
 
Die Werte der Platte sind bestens, keine Ahnung wieso diese aus dem RAID geflogen sein soll. Man sollte die S.M.A.R.T. Werte übrigens auch direkt vom NAS auslesen können, über die GUI oder per Konsole, bei Linux geht dies mit smartctl -a /dev/sdx, wobei das x von sdx durch den passenden Buchstaben a, b, c, etc zu ersetzen ist.
 
Auch der lange Test mit der WD-Software ergab nach 12 Stunden Testdauer keinen Fehler. Ausgefallen ist sie in meinem Rechner auch nicht.

Wenn ich die HDD ins NAS stecke ist der Fehler allerdings reproduzierbar. Seit etwa 20 Stunden ist eine neue WD im NAS, das synchronisieren ist fast abgeschlossen, es trat kein Fehler auf. Ich schließe das NAS als Fehlerquelle aus, da die HDD immer nach spätestens 5 Stunden rausgeflogen ist. Manchmal auch nach einer Stunde.

Dafür habe ich herausgefunden dass die HDD noch Garantie bis 01.08.2020 hat. Ich werde sie einschicken.

Das Thema ist also erledigt.
 
Shadow1701 schrieb:
Wenn ich die HDD ins NAS stecke ist der Fehler allerdings reproduzierbar.
Das liegt das Problem wohl am NAS, die Werte der HDD sind in Ordnung und geben keinerlei Hinweis auf einen Schaden an der HDD. Hast Du vielleicht die falsche Platte erwischt? Prüfe doch mal S.M.A.R.T. Werte der anderen, dies sollte wie gesagt auch im NAS gehen.
 
Dann schau bitte nochmal über die SMART Werte drüber. Es steht überall "Gut" dabei. Meine Interpretation der Werte reicht leider nicht viel weiter.

Disk 1
D1-1.jpg
D1-2.jpg



Disk 2
D2-1.jpg
D2-2.jpg


Disk 3
D3-1.jpg
D3-2.jpg


Disk 4
D4-1.jpg
D4-2.jpg


Disk 5 (die neue HDD)
D5-1.jpg
D5-2.jpg


Disk 6
D6-1.jpg
D6-2.jpg
 
Deren Werte sind auch alle gut, das einzige was mir auffällt ist, dass die "ausgefallene" HDD mehr Einschaltvorgänge hat, 575 statt der 530 (bei 3), 538 bzw. 548 der anderen. Wobei es schon etwas wundert, dass auch hier zwei HDDs mehr als die anderen 3 haben. Das kann an den Tests jetzt liegen, aber es könnte auch ein Hinweis auf Probleme mit der Spannungsversorgung an den Bays sein, wenn immer alle zusammen verbaut waren. Wenn sie dann keinen Strom bekommen hat, wäre klar wieso sie rausgeflogen ist.

Beobachte mal wie sich die Anzahl der Einschaltvorgänge bei allen Platten entwickelt, wenn die bei einer stärker steigt als bei den anderen, dann dürfte es ein Problem der Spannungsversorgung sein.
 
Ich habe mir mit der Antwort ein bischen Zeit gelassen um das weiter zu beobachten. Das NAS hat weder die neue noch irgend eine andere HDD ausgeworfen, zumindest nicht dieses Wochenende.

Die scheinbar defekte HDD ist in meinem Rechner eingebaut der jetzt fast 48 Stunden ununterbrochen läuft. In der Zeit konnte ich immer auf die HDD zugreifen. Auch der über 12 Stunden andauernde Test durch die WD Software "Data Lifeguard Diagnostic for Windows" ist problemlos durchgelaufen und hat keinerlei Probleme ans Tageslicht befördert. Dann habe ich die Platte mit Veracypt verschlüsselt was über 12 Stunden gedauert hat. Hat funktioniert.

Trotzdem gibt diese HDD in periodischen Abständen ein Geräusch von sich, ein leises kurzes Klackern das sich jedesmal leicht anders anhört. Das tut sie immer, egal ob ich sie mit der WD Software, mit VeraCrypt oder gar nicht beschäftige. Ich habe hier noch andere Festplatten rumliegen die ich nicht nutze. Davon habe ich zwei in meinen Rechner eingebaut, statt der wahrscheinlich defekten NAS HDD. Beide machen dieses Geräusch nicht, eine davon ist sogar eine WD red, allerdings mit 2 statt 8 TB.

Dafür habe ich noch 5 baugleiche WD Red 8TB im NAS welche dieses Geräusch im NAS nicht machen. Selbst hier habe ich mir die Mühe gemacht das NAS auszuschalten und eine HDD vom NAS in meinen PC einzubauen. Läuft ohne dieses Geräusch.

Deshalb werde ich trotz langen Test der WD Software und trotz der SMART Werte die HDD als defekt behandeln und kommende Woche einschicken.

Mir ist wieder eingefallen, dass wir in der Firma vor ein paar Jahren ein ähnliches Problem, ebenfalls mit einem QNAP hatten. Da wurde die Platte zwar nicht ausgeworfen, aber das RAID hat sich immer wieder aufgehängt. (an den genauen Fehler kann ich mich nicht mehr erinnern) Jedenfalls war das Problem gelöst nachdem diese, ebenfalls WD red getauscht wurde. Die angeblich defekte HDD steckt heute noch in einem USB3 Gehäuse und wird benutzt um Daten hin und her zu tragen. Ohne Probleme.

Ja schon klar, das hier klingt alles sehr laienhaft. Möglicherweise gibt es ein Problem mit der Stromversorgung des NAS. Die HDD hat meiner Überzeugung trotz SMART Werte einen Schaden der sie zumindest für den Betrieb in einem NAS im RAID Verbund untauglich macht..

Danke jedenfalls, dass du dich meines Problems angenommen hast.
 
Zurück
Oben