[Sammelthread] HDD-Probleme, SMART-Analysen

Die Temperaturen sollte man im Auge behalten, zu warm sollte sie nicht werden und auch zu schnelle Temperaturänderungen sind nicht gut. Bei Platten in USB Gehäuse sind also durchaus eine gewisse Vorsicht bei den Burn In Tests geboten um sie nicht dadurch zu schädigen.
Danke für die Antwort.
Schade, dass HGST das nicht im pdf angibt, weiviel Grad pro Nutzungsdauer die Temperatur ansteigen darf. Ich erinnere mich, dass du mal ein pdf von einer anderen Platte (Enterprise) in diesem thread gepostet hast, da wurde das mit angegeben.

--------
Ich habe noch ne Verständnisfrage unabhängig von obiger Frage.
Hier https://www.thomas-krenn.com/de/wiki/Analyse_einer_fehlerhaften_Festplatte_mit_smartctl steht unter Punkt 4 folgende, ein Erklärbeispiel zu einer WD RE4 und einer Samsung HD.
Ich versteh nicht worauf das abzielt (mich irritiert, dass er irgendwas vom RAID redet. Heißt das, in einem RAID werden keine wiederzugewiesenen Sektoren verzeichnet, wenn er auf Platte A einen Sektor vom Abbild A' her wieder herstellen konnte?).

Dann hab ich noch eine Frage zu deinem Post weiter vorne
Nicht unbedingt, es leider auch Fälle wo zwar weiterhin der Rohwert von 05 (reallocated sector count) bei 0 bleibt, aber der von Attribut C5 (reallocation event count) steigt. Den sollte man also auch im Auge behalten. Von vorgemerkt würde ich auch nur bedingt reden, die Controller merken sich die schwebenden Sektoren eben und prüfen beim Überschreiben die neu geschriebenen Daten. Wenn diese korrekt lesbar sind, sollte der schwebende Sektor einfach verschwinden, wenn nicht, dann sollte er auch verschwinden, aber eben ein Reservesektor an seiner Stelle genutzt werden.
Schwebender Sektor gefunden, kann beim erneuten lesen gelesen werden, wird wieder auf 0 gesetzt dabei steigt aber der reallocated event count an und der reallocated sector count kann, muss aber nicht hochgezählt werden
Schwebender Sektor gefunden, kann nicht erneut gelesen werden, wird Reservesektor zugeteilt (gemapped), auf jeden Fall steigt der "reallocated sector count". Habe ich das verstanden?

Steht der Wert 01 Lesefehlerrate in einem Zusammenhang dazu? Kann der eine Zahl aufweisen, aber 05 und C5 stehen auf 0?
 
Zuletzt bearbeitet:
Hallo liebe Community,

ich habe einige Festplatten, welche laut ChrystalDiskInfo 7.0 einen "Vorsicht" Zustand aufweisen.
Wie ist der Zustand/die Werte der FP zu interpretieren? Sollte ich sie sofort austauschen oder ist CDI hier "überkritisch"?

Besonders wichtig ist mir Festplatte 1.

Vielen Dank!
 

Anhänge

  • FP 1.png
    FP 1.png
    118,9 KB · Aufrufe: 457
  • FP 2.png
    FP 2.png
    123,7 KB · Aufrufe: 433
  • FP 3.png
    FP 3.png
    117,8 KB · Aufrufe: 423
  • FP 4.png
    FP 4.png
    121,1 KB · Aufrufe: 451
Lyle, die haben alle ein paar schwebende Sektoren (wie viele steht im Rohwert von Attribut C5) und bis auf FP4 auch schon wiederzugewiesene Sektoren. Entweder sind die einfach schon alt, HDDs altern und sind maximal ein Jahr lagerbar und für 5 Jahre Nutzungsdauer ausgelegt, also spätestens 6 Jahre nach den Herstellungsdatum nicht mehr wirklich zuverlässig und im Grunde als Schrott zu betrachten. Wenn sie dann noch problemlos laufen ist es gut, sonst ersetzt man sie besser.

Apfelorange schrieb:
Heißt das, in einem RAID werden keine wiederzugewiesenen Sektoren verzeichnet, wenn er auf Platte A einen Sektor vom Abbild A' her wieder herstellen konnte?).
In einem echten RAID, also nicht gerade einem RAID 0 welches eigentlich ein AID 0 ist, gibt es eigentlich nie schwebende Sektoren, da jeder vernünftige RAID Lösung bei Lesefehlern einer Platte die Daten aus den Daten der anderen rekonstruiert und dann auf der Platte mit dem Lesefehler überschreibt.

Apfelorange schrieb:
Schwebender Sektor gefunden, kann beim erneuten lesen gelesen werden, wird wieder auf 0 gesetzt dabei steigt aber der reallocated event count an und der reallocated sector count kann, muss aber nicht hochgezählt werden
Nein, wenn nach dem erneuten Schreiben der neue Inhalt korrekt gelesen werden kann, dann verschwindet er einfach und es wird kein Reservesektor genutzt und es gibt auch keinen Reallocation Event.
Apfelorange schrieb:
Schwebender Sektor gefunden, kann nicht erneut gelesen werden, wird Reservesektor zugeteilt (gemapped), auf jeden Fall steigt der "reallocated sector count".
Genau und dann gibt es auch einen
Reallocation Event, zumindest sollte es so sein, aber Ausnahmen bestätigen die Regel. So sieht man zuweilen eben HDDs mit Reallocation Events bei denen aber trotzdem der Reallocated Sector Count 0 ist.
Apfelorange schrieb:
Steht der Wert 01 Lesefehlerrate in einem Zusammenhang dazu? Kann der eine Zahl aufweisen, aber 05 und C5 stehen auf 0?
Ja und ja. Einmal ist aber die Frage, was ein Controller genau als Lesefehler zählt, reicht es wenn das Lesen beim ersten Versuch nicht klappt oder erst, wenn er nach dem Timeout aufgibt den Sektor doch noch erfolgreich zu lesen? Im letzteren Fall sollte es einen schwebenden Sektor geben, aber der kann dann ja überschrieben werden und verschwinden, womit der Rohwert von C5 wieder 0 ist, aber der von 01 geht deswegen nicht mehr zurück auf 0. Zu beachten ist auch, dass Seagate HDDs dort in der Regel die Fehler und die Anzahl der Lesevorgängen in verschiedenen Bytes zählen.
 
Guten Tag :)

Habe seit ein paar Tagen eine "HGST 0S03665 Deskstar NAS 4TB 6Gb/s SATA 7200rpm 24x7" in meinem NAS (Asustor AS6202T), leider hörte Sie sich von Anfang an auch meines Erachtens schon komisch und sehr laut an ..
Habe dann mal im NAS mit dem SMART Tool eine Analyse machen lassen. Das Ergebnis:

71e459fcf3b6357a52fb44724efde0db.png

Sieht meines Erachtens sehr schlecht aus. Soviel wie ich schon herausgefunden habe sagt der Reallocated_Sector_Ct, dass 5 Sektoren nicht mehr korrekt gelesen/geschrieben/geprüft werden können. Was auf baldigen head-crash hinweisen kann. Des Weiteren scheint wohl die Festplatte ein defektes Plattenlagter oder Motorproblem zu haben, so wie ich die Spin_Up_Time verstehe.

Könnt ihr diese Aussagen so unterstützen und ist noch etwas auffälliges ?

Hatte mir die Platte eigentlich wegen der angeblich geringen Ausfallquote gekauft ..
Wird dann wohl wieder zurück gehen. Wie lösche ich am einfachsten die Daten auf der Festplatte ?

Vielen Dank im Voraus !

Mit freundlichen Grüßen

Chris
 
Die Spinup Time ist in Ordnung, der Aktuelle Wert liegt bei 126 und damit weit über dem Schwell- bzw. Grenzwert von 24. Der "Grober Wert" soll wohl der Rohwert sein, aber die Grenzwerte beziehen sich immer auf die Aktuellen- bzw. Schlechtesten Werte.

5 Wiederzugewiesene Sektoren sind nicht so viel, aber innerhalb der ersten 66 Betriebsstunden deutet dies auf eine schlechte Behandlung der HDD hin, entweder beim Händler, ggf. in Form einer schlechten Verpackung für den Transport/Postversand oder auch beim Einbau. Von HGST gibt es dieses Video über die Empfindlichkeit und korrekt Handhabung von HDDs, mit dem Empfehlung wie die Umgebung aussehen sollte auf denen mit HDDs gearbeitet wird und sie weisen darauf hin, dass die Schäden sich auch erst später bemerkbar machen können. Genau das scheint hier der Fall zu sein.

Wenn sich das mit den "angeblich geringen Ausfallquote" auf die Statik von Backbaze bezieht so lass Dir gesagt sein, dass diese Quatsch ist weil dort HDDs komplett unterschiedlicher Kategorien verwendet werden, von Seagate und Toshiba z.B. nur Desktop HDDs (die sind nur für 2400 Power-On Hours im Jahr, nicht für mehrere HDDs in einem Gehäuse und nur 55TB/Jahr Workload gedacht), von WD aktuell einfache NAS Platten die auch nur für bis zu 8 HDDs in einem Gehäuse zugelassen sind und nur von HGST überhaupt für den dortigen Einsatz passende Enterprise (die Megascale und He8) HDD. Die Deskstar NAS wird doch sowieso nicht genutzt, von daher können deren Zahlen auch absolut nichts über die Ausfallwahrscheinlichkeit dieser HDD aussagen, bei den dort genutzten sagen sie auch nur was über die Wahrscheinlichkeit unter den Bedingungen aus und sind nicht auf andere Nutzungsbedingungen, insbesondere solchen bei Heimanwendern, übertragbar.
 
Zuletzt bearbeitet:
Hallo, ich bräuchte mal von jemanden Rat welcher sich mit Seagate Platten auskennt.Und zwar, ich habe ein neues System mit einer neuen 2TB Seagate Platte und wenn ich mir die Smart Werte anschaue ist die "Seek Error Rate" bei der Seagate ziemlich niedrig.

Bei meiner WD10EZEX im anderen PC, ist die "Seek Error Rate" seit 2 Jahren immernoch auf 100.

Hier eine Screenshot:



Ist das normal bei Seagate Platten ?
 
Zuletzt bearbeitet von einem Moderator:
Die HDD ist vollkommen ok. Der Rohwert 2605378 muss in Hex umgewandelt werden --> 0x27C142. Das entspricht 0x00000027C142. Die ersten 16 Bit sind 0x0000 ergo 0 Fehler.
 
Ich hab auch schon im Netz gelesen. Dass bei vielen Seagate Platten die "Seek Error Rate" niedrig angezeigt wird. Weil Seagate das irgendwie anders auslesen lässt als Western Digital z.B.

Die sollen das irgendwie "anderes als die Anderen" machen. Keine Ahnung ob das so ist :)
 
Zuletzt bearbeitet von einem Moderator:
Wurde mal wieder Zeit, denn das Thema hatte wir ja früher mehrfach auf jeder Seite. Bei Seagate sind die Rohwerte der Attribute Seek Error Rate, Raw Read Error Rate und Hardware ECC Recovered nicht einfache Zählerstände der Fehler, sondern enthalten die Fehlerzähler nur in den 2 höchsten Bytes (die linken 4 Stellen bei hexadezimaler Anzeige der Rohwert in CrystalDiskInfo) und die rechten 8 Stellen (4 Byte) sind der Zähler der Vorgänge dar. Die Ermittlung der Aktuellen Werte funktioniert mehr oder weniger für diese Attribute nach dieser Formel für die Suchfehler:
Wie man sieht, muss auch erst eine bestimmten Anzahl von Vorgängen erfolgt sein, bevor der Aktuelle Wert überhaupt errechnet wird, ist diese Anzahl erreicht fällt er und steigt dann wieder, sofern es nicht keine/nicht zu häufig Fehler gibt.

Die 2605378 wären also hexdezimal 27C142 und damit nur 6 stellig, CrystalDiskInfo würde als 00000027C142 anzeigen und die 4 vor mit hier fett hervorgehobenen Stellen sind 0, also gibt es keine einzigen Suchfehler bei den bisher 2605378. Die 98511144 Rohwert bei Lesefehlern sind hexadezimal 5DF2928, also 7 stellig und damit gibt es auch genau 0 Lesefehler, nur eben 98511144 Lesevorgänge.
 
Holt schrieb:
Wie man sieht, muss auch erst eine bestimmten Anzahl von Vorgängen erfolgt sein, bevor der Aktuelle Wert überhaupt errechnet wird

Ja genau Holt, genauso war das bei mir. Als ich die Platte eingebaut hatte und direkt danach die Smart Werte laß.War die Seek Error Rate noch bei 100. Dann hab ich ein paar Programme und Spiele installiert und mal richtig defragmentiert und schwups stand da die 60.

Jetzt ist sie schonwieder auf 63 hoch :)

Vielen Dank für eure hilfreichen Antworten :)
 
71 Wiederzugewiesene Sektoren, 2 weitere warten darauf entweder doch noch als fehlerfrei erkannt oder ersetzt zu werden.

Dann noch 366 HighFly Writes, 25.575 gemeldete unkorrigierbare Sektoren => Die Platte sollte entsorgt werden.
 
mein pc startete in den letzten tagen verdammt langsam. windows logo stand bestimmt 3 min bis es weiter ging. durch zufall heute drauf gekommen, dass er ohne folgende platte wieder einwandfrei bootet.

ausserdem muss ich mehrmals booten bis die platte erkannt wird. mache grad backup, also sie läuft noch. zumindest ab und zu. so gut wie tot oder was ist da los?

Unbenannt-1.png
Unbenannt-2.png

thx
yaegi
 
Bzgl. der Lese- und Suchfehler lies mal Post #3430 etwas weiter oben, aber kurz: es gibt keine. Es gab oder gibt aber ein Problem mit dem SATA Datenkabel und daher kommen auch die Befehlszeitüberschreitungen. Wurde da schon mal was gemacht? Wenn nicht, dann beobachte mal den Rohwert vom Attribut C7 (bzw. 199), wenn der sich ändert gibt es aktuell immer noch Kommunikationsfehler bei der Übertragung und das liegt zu fast 100% am SATA Datenkabel, bei dem entweder ein Stecker nicht ordentlich sitzt oder welches defekt ist, wobei die gerne kaputt gehen wenn man am Stecker statt am Kabel zieht und man den Schaden auch so nicht sieht. Es könnte auch an einem Wechselrahmen liegen, sollte einer verwendet werden.

Ansonsten ist der Zustand gut, ich sehe aber viele Ausschaltabbrüche, entweder wird der Rechner sehr oft nicht ordentlich runtergefahren oder es gibt auch mit dem Kabel vom Netzteil ein Problem.
 
Kommunikationsfehler bei der Übertragung und das liegt zu fast 100% am SATA Datenkabel
hmm... das muss dann aber eher am anschluss der hdd liegen, denn:

- ich habe die platte an einer dockingstation laufen gehabt, an der sie garnicht mehr erkannt wurde, letzte woche aber schon
- an einem zweitrechner am sata kabel wurde sie auch nur sporadisch erkannt
- an meinem raid controller wurde sie zwar auf anhieb erkannt, da allerdings als unformatiert

das wären dann schon zu viele zufälle oder?

entweder wird der Rechner sehr oft nicht ordentlich runtergefahren
mein rechner wird immer ordentlich runtergefahren. keine abstürze, nix.
 
Es kann auch am Anschluss der HDD liegen, diese SATA Stecher sind auch nur für eine sehr beschränkte Anzahl von Steckvorgängen ausgelegt. Wenn die also sehr oft ein- und ausgesteckt wurden, könnte der verschlissen sein und sonst merkt oder sieht man meist, wenn mit dem was nicht stimmt, etwas weil der wackelt oder eine Ecke abgebrochen ist. Prüfe das und schau Dir auch genau an ob das SATA Stromkabel richtig sitzt und achte auf die Rohwerte der Attribute C0 und C7. Übrigens machen Molex SATA Adapter auch gerne mal Ärger und bei modularen Netzteilen kann auch mal der Kabelstrang am Netzteil selbst lose sein oder keinen guten Kontakt bekommen.

Ausschaltabbrüche werden bei der Platte immer dann registriert, wenn die Spannungsversorgung unterbrochen wird und die Köpfe nicht geparkt waren. Wenn ein Rechner ordentlich runtergefahren wird, bekommen die Platten immer einen ATA Befehl (STANDBY IMMEDIATE) der sie auf den bevorstehenden Spannungsabfall vorbereitet. Geht man ins BIOS ist das meist nicht der Fall, von daher ist es dann kein Wunder wenn es danach einen weiteren Ausschaltabbruch gibt, aber so und vor allem während des laufenden Windowsbetriebs dürfte keiner auftreten.
 
Ist das eigentlich definitiv, was C0 Ausschaltungsabbrüche bedeutet? Denn wie ich bei der Recherche herausfinden musste gibt es dazu unterschiedliche Übersetzungen und Beschreibungen.

Mein ursprünglicher Kenntnisstand war, dass das ist, wenn hart vom Strom getrennt wurde (was im folgenden Link der Fujitsu-Definition "Emergency power-off count" entsprechen würde).
Dann aber las ich, dass dieser Wert häufig bei Laptops ohne, dass man falsch heruntergefahren hat ansteigt, weil manche Laptops zu hart mit der Energiesparfunktion seitens des OS (also nicht das APM) reingehen.
Ich hatte lustigerweise den Thread gestern erst gefunden, wo ihr Experten euch auch nicht ganz einig wart:
https://www.computerbase.de/forum/t...-c0-power-off-retract-count-status-0.1254238/

Power Off Retract Count
Emergency Retract Cycle Count (nur Fujitsu)
Unsafe Shutdown count (HD Tune)
https://en.wikipedia.org/wiki/S.M.A.R.T. (ohne Erklärung)

Bei Acronis steht:
This parameter is considered informational by the most hardware vendors. The value is counted every time the heads are loaded off the media (i.e. every time the machine is powered down, put to sleep or is idle). Quelle: https://kb.acronis.com/content/9127
Das hört sich dann eher nach Energiesparfunktion, als unsanftem Ausschalten oder unerwartetem Stromausfall an, oder?

Mir ist klar, es kommt auf den Hersteller und das Programm an, aber dennoch ist das ganze etwas seltsam, finde ich. Man müsste mal über ne Zeit lang beobachten, ob der Wert zunimmt, wenn man im OS selber eingestellt hat, dass nicht genutzte HDDs schlafen gehen dürfen, und wie er sich verhält, wenn man es im OS ausgestellt hat, um daraus abzuleiten, ob ein Zusammenhang besteht zum Energiesparen.
 
Nein, bei HGST (und WDs 8TB HDDs) wird das Attribut "Ausschaltungsabbrüche" anders gehandhabt. Deswegen habe ich mich auf diese Platte bezogen "bei der Platte", da dies bei Seagate irgendwo so dokumentiert ist, frag mich jetzt nicht wo. Was Tools wie HD Tune dem Attribut für einen Namen geben (die Namen kommen vom Tool und nicht vom Controller!!!) oder irgendwelche Seiten wie Wikipedia angeben, ist egal, nur die Dokumentation der Hersteller zählt.

Micron definiert z.B. Unexpected Power Loss als "Unexpected power loss can be avoided by preceding a power off with an ATA STBI (STANDBY IMMEDIATE) command, and allowing the SSD to properly complete this command before removing power to the SSD." Demnach muss das ATA STBI (STANDBY IMMEDIATE) geschickt und auf die Antwort der SSD gewartet werden.

Beim Umgang mit den S.M.A.R.T. Werten stellt man eben immer wieder fest, dass die Hersteller diese nur als eine sehr unverbindliche Empfehlung zu betrachten scheinen und es mehr Ausnahmen als Regeln gibt.
 

Ähnliche Themen

Antworten
1.922
Aufrufe
256.809
J
Zurück
Oben