[Sammelthread] HDD-Probleme, SMART-Analysen

Hey Leute,
habe ein Problem mit meiner Festplatte.
Es lassen sich kaum Daten von der Platte kopieren, weil die Übertragungsrate nach kurzer Zeit auf 0 fällt.
Zudem steigen die schwebenen Sektoren. Die Platte ist noch nicht mal 3 Jahre alt. Ist sie defekt
oder kann es auch etwas anderes sein?

disk.jpg



kopi.jpg
 
Die Platte hat 5 schwebende Sektoren und ist damit noch lange nicht kaputt, denn Schwebende Sektoren sind Sektoren deren Daten nicht mehr zur ECC passen die hinter jedem Sektor steht und mit deren Hilfe auch nicht mehr korrigiert werden können. Da die korrekten Daten nicht mehr feststellbar sind, gibt die Platte statt falscher Daten einen Lesefehler als Antwort wenn man versucht diese zu lesen. Das kann auch anderen Gründe als defekte Oberflächen haben, z.B. einen Stromausfall während eines Schreibvorgang der dazu führt, dass eben nicht die ganze Daten plus der neuen ECC geschrieben wurden oder wegen eines Stoßes oder Vibrationen ist der Kopf beim Schreiben aus der Spur gekommen und hat Daten auf der Nachbarspur überschrieben. Auch arbeiten HDDs nicht 100%ig und die Hersteller geben die Fehlerhäufigkeit auch in Form der UBER an, wobei eine UBER von 1:10^14 bedeutet, dass je 10^14 gelesener Bits was etwa 12TB gelesener Daten entspricht, ein Lesefehler und damit schwebender Sektor im Rahmen der Erwartungen liegt.

Die Controller merken sich die schwebenden Sektoren und prüfen die Daten nach dem erneuten Schreiben auf diese Sektoren, dann verschwinden diese einfach oder werden eben durch Reservesektoren ersetzt. Erst wenn letzteres passiert, dann liegt wirklich ein Defekt auf der Oberfläche an der Stelle vor.

Es kann natürlich sein das diese schwebenden Sektoren die Ursache sind, wenn dies die Quellplatte ist und die Dateien auf diesen Sektoren liegen. Es kann aber auch daran liegen das Du offenbar viele HDDs im Gehäuse verbaut hat, eine WD Blue ist aber eine einfache Desktopplatte und die sind nur für den Einsatz als einzige HDD im Gehäuse gedacht, da sie eben keine Vorkehrungen hat um mit den Vibrationen umzugehen, die die anderen Platte im Gehäuse verursachen. Eine NAS Platte wie die Red wäre die korrekte Wahl bei mehreren HDDs in einem Gehäuse, WD macht es ja selbst schon bei den zwei HDD in den MyBook Duo so, da stecken auch die Red und nicht in den einfachen USB Gehäusen mit einer HDD die Blue drin.

Außerdem biete dies hier lesen, es kann nämlich auch andere Gründe haben warum die Geschwindigkeit auf 0 fällt, neben den im verlinkten Beitrag genannten auch, dass auch schon Dateien mit dem gleichen Namen schon im Zielverzeichnis stehen.
 
Und wie sieht es mit G: genau aus ?
 
Danke schon mal für eure Antworten:)
Ganz so viele Platten sind zum Glück nicht im Gehäuse, da C eine M.2 SSD ist und H und M externe Festplatten sind, worauf ich versucht habe die Daten zu sichern. Das die Festplatten trotzdem durch Vibrationen gestört sind, ist natürlich trotzdem möglich. Ich betreibe die Festplatte aber schon seit 3 Jahren in dieser Konstellation und sie fängt erst jetzt damit an. Kann das sein zumal die Platten gedämpft eingebaut sind. Das mit dem RAM Zwischenspeichern denke ich ist nicht der Fall, da die Geschwindigkeit nicht nur kurz auf 0 fällt sondern für mehrere Minuten. Außer der RAM hat einen Defekt? Was dann aber heißen müsste, dass er dies bei den anderen Platten auch machen müsste oder? Was sollte ich denn jetzt machen. Einmal die anderen Festplatten ausbauen und testen was dann passiert? Oder auch Mal ein anderes Kabel testen?

Die andere Festplatte kann ich nachher Mal zeigen. Diese ist aber schon aus einem anderen PC mit diesen Smart werten in den neuen gekommen und hat sich auch nicht verschlechtert.
 
thommy4 schrieb:
ch betreibe die Festplatte aber schon seit 3 Jahren in dieser Konstellation und sie fängt erst jetzt damit an.
Ob sie jetzt damit anfangen oder ob es erst jetzt sichtbar wird, ist die Frage. Die Vibrationen können eben dazu führen, dass die Köpfe bei Schreibvorgängen die Spur verlassen und Daten auf der Nachbarspur überschreiben. Ohne entsprechende Sensoren und die einfachen Desktopplatten wie die WD Green/Blue haben solche Sensoren eben nicht, bemerkt die Platte dies nicht und unterbricht den Schreibvorgang deswegen auch nicht. Bemerken wird man (der User ebenso wie der Controller der Platte) dies erst dann, wenn man die betroffenen Daten ausliest. Deshalb macht man bei RAIDs ja auch regelmäßig ein Scrubbing, eben um solche Fehler zu finden und zu beheben bevor es so viele werden, dass man eben nicht mehr alle beheben kann.
thommy4 schrieb:
Kann das sein zumal die Platten gedämpft eingebaut sind.
Auch eine übertriebene Dämpfung ist nicht so gut, da die Platten dann wegen der eigenen Kopfbewegungen in Schwingung kommen können und dann deshalb die Köpfe die Spure verlassen. Die Hersteller schreiben i.d.R. eine feste Verschraubung mit 4 Schrauben vor, auch wenn die meisten Designer von PC Gehäuse dann doch auf andere Lösungen setzen und der Zubehöhrhandel Produkte bietet, die eben HDDs extrem weich in Gummi aufhängen.
thommy4 schrieb:
Außer der RAM hat einen Defekt?
Wenn RAM defekt ist, hast Du entweder einen Absturz oder korrupte Daten, aber nicht plötzlich weniger RAM. Wenn da nicht ein anderen Programm im Hintergrund mehr RAM anfordert und die Dateien auch nicht schon zum Teil auf dem Zielordner liegen, dann dürften diese "Unterbrechungen" schon daran liegen, dass die Platte die Daten nur schwer lesen kann. HDDs versuchen ja die Daten durch wiederholtes Auslesen mit leicht anderen Parametern doch noch zu lesen und die Green haben damals einen Timeout von 14s gehabt bevor sie es aufgegeben haben. Bei HDDs mit TLER/ERC ist dieser Timeout übrigens einstellbar und ab Wert meist auf 7s voreingestellt, mehr bedeutet TLER/ERC nicht, aber der Unterschied ist gewaltig wenn man die HDD an einem HW RAID Controller betreibt, denn die werfen HDDs i.d.R. nach 8s als defekt aus dem RAID wenn sie bis dahin nicht geantwortet haben, sei es mit den Daten oder einem Lesefehler.
thommy4 schrieb:
Einmal die anderen Festplatten ausbauen und testen was dann passiert?
Dies kann helfen, wenn die Vibrationen jetzt beim Lesen stören, also die Köpfe Probleme haben die Spur zu halten. Waren die Probleme aber schon beim Schreiben, stehen da also schon korrupte Daten auf der Platte, so wird es nichts bringen.
thommy4 schrieb:
Oder auch Mal ein anderes Kabel testen?
Da der Rohwert des Attributes C7, also der Zähler der Kommunikationsfehler mit dem Host Controller noch 0 ist, gibt es aktuell keine Probleme mit dem Datenkabel und da der für die ganze Lebenszeit der Platte gilt, gab es auch nie welche. Das Kabel dieser Platte ist also in Ordnung und ganz sicher nicht das Problem, es könnte aber am Kabel einer anderen Platte ein Problem geben und dann blockieren die Wiederholungen der Übertragungen meist der ganze SATA Host Controller, schau Dir also die Rohwerte (rechte Spalte) des Atributes C7 der anderen Platten an und wenn der bei einer nicht 0 ist, beobachte ob der Wert mit der Zeit steigt (ggf. bei CDI mal F5 drücken um die Werte neu einlesen zu lassen).
 
Danke für eure Bemühungen.
Ich werde mal die anderen Festplatten ausbauen und chkdsk testen.
Ob die Festplatte jetzt zu sehr gedämpft ist kann ich nicht beurteilen.
Mein Gehäuse ist jedenfalls das Nanoxia Deep Silence 5 Rev. B

Hier noch die Daten zur anderen Platte:


disk2.jpg
 
Die hat auch kein Problem mit dem Datenkabel, aber die 5 Jahre von Samsung mal geplanter Nutzungsdauer hinter sich und daran ändert auch die Tatsache nichts, dass sie erst 6226 Betriebsstunden runter hat. Die 11 wiederzugewiesenen Sektoren sind aber auch noch nicht tragisch, wenn es nicht innerhalb kurzer Zeit (zusammen mit den schwebenden Sektoren) mehr werden, dann besteht noch kein Grund sie nicht auch noch im Rentenalter weiter zu beschäftigen.

Während schwebende Sektoren von chkdsk (mit /r oder besser noch /b) überschrieben werden können und dann verschwinden, trifft dies bei den wiederzugewiesenen Sektoren nicht zu, da hier Sektoren schon als wirklich kaputt erkannt und ausrangiert wurden, so dass an deren Stelle nur Reservesektoren verwendet werden die keinen Fehler aufweisen. Dafür gibt es diese Reservesektoren und alleine die Tatsache das sie genutzt werden, ist noch kein Grund zu Besorgnis. Sorgen muss man sich eher über den Grund machen, warum da ein paar Sektoren kaputtgegangen sind, aber die Ursache sieht man den S.M.A.R.T. Werten eben nicht an. Es kann harmlos sein und eben nur diese paar Sektoren betreffen, es kann auch eine schlimmere Ursache haben die bald weitere Sektoren in Mitleidenschaft zieht und sogar den baldigen Totalausfall der Platte zur Folge hat, was sich dann eben in einem schnellen Anstieg der Zahl der schwebenden und wiederzugewiesenen Sektoren äußert. Daher ist es wichtig dies zu beobachten (CDI sagt deshalb auch Vorsicht und noch nicht Schlecht) um zu erkennen ob die Ursache eher harmlos oder doch kritischer ist.
 
  • Gefällt mir
Reaktionen: HerrAbisZ
Ja, die Samsung ist auch nicht das Problem und funktioniert auch noch super. Das Problem ist ja die WD und bei der probiere ich chkdsk /b. Die hat ja bis jetzt nur schwebende Sektoren.
 
Diese schwebenden Sektoren sollten nach der Ausführung von chkdek /B D: weg sein und wenn es dann weder wiederzugewiesene Sektoren noch Wiederzuweisungsereignisse gibt, dann waren die schwebenden Sektoren nicht die Folge von wirklich Defekten der Oberfläche, sondern eben z.B. die Köpfen während Schreibvorgängen die Spur verlassen haben oder eben unerwarteten Spannungsabfällen (es gab ja immerhin 11 Ausschaltungsabbrüche, was bei der Platte Spannungsabfälle sind während denen die Köpfe nicht sowieso schon geparkt waren) während eines Schreibvorgangs.

Dann sind die schwebenden Sektoren kein Hinweis auf einen Schaden der Platte, sondern entweder auf einen schlechten Umgang mit ihr, also z.B. wenn jemand bei einem Schreibvorgang mit dem Fuß ans Gehäuse stößt oder da ein Bass in der Nähe hämmert (schau Dir das Video "Shouting in the Datacenter" an, falls Du es nicht noch kennst und die Platten dort haben Sensoren um sowas zu bemerken, deshalb fällt der Durchsatz dann ja auch ab, dafür sollte es dann eben keinen korrupten Daten geben) oder eben schlicht der Auswahl der falschen Platten für die Umgebung in der sie arbeiten müssen.

Geiz ist eben auch beim Festplattenkauf nicht geil und es gibt zwischen den Modellen mehr Unterscheide als nur das Marketing, auch wenn man diese beim Blick in den Preisvergleich oft gar nicht und beim Blick in die Datenblätter nur mit genug Erfahrung erkennt. Die Folgen der falschen Auswahl zeigen sich meistens auch erst mit der Zeit, so halten auch die einfachen Desktopplatten eine ganze Weile im Dauerbetrieb durch, nur erreichen diese dann oft nicht die zu erwartende Nutzungsdauer von 5 Jahren und auch an Hardware RAID Controllern laufen sie dann anfangs meistens problemlos, aber wehe es gibt dann mit dem Lesen eines Sektors Probleme, dann lassen die sich bis zu 14s Zeit es zu versuchen und der HW RAID Controller wirft sie nach 8s als defekt aus dem RAID. Hat die Platte es dann doch noch geschafft, so zeigt sie nicht einmal einen schwebenden Sektor und der Laie versteht gar nicht mehr wieso die Platte aus dem RAID geflogen ist. Passiert dies bei einem RAID1 oder 5 mit der zweiten Platten bevor es bemerkt wurde, ist das ganze RAID nicht mehr ansprechbar. Hätte man eine passenden Platte mit TLER/ERC genommen, hätte diese nach 7s einen Lesefehler gemeldet, der Controller hätte die Daten aus den Daten der anderen Platte(n) mit rekonstruiert und den Sektor überschrieben, außer einen kleinen Verzögerung hätte man davon also gar nichts gemerkt und es allenfalls im Log gesehen.
 
  • Gefällt mir
Reaktionen: HerrAbisZ
Guten Morgen!

Ich habe hier einen Rechner, den ich als Datengrab nutze. Leider hat eine Festplatte jetzt angefangen, gelegentlich auszusetzen, bzw. das typsiche "klack....anfahren....klack anfahren...klack anfahren" Geräusch von sich zu geben.

Da in dem Rechner 6 HDDs verbaut sind und das Problem sehr selten auftritt und ich auch noch auf alle Zugriff habe und ohne Geräusche schreiben kann...kann ich leider nicht einfach die HDDs nacheinander abziehen, um den Bereich so einzugrenzen (das letzte mal ratterte es vor 2 Tagen)

Könnt ihr eventuell anhand der Rohwerte von Crystal DIsk sagen, welche Festplatte hier das Problem verursacht?
Bin da nicht wirklich fit und die verschlüsselten Rohwerte waren doch irgendwie wichtig, was ich so aus der Vergangenheit mitbekommen habe.

Mir ist bekannt, das die richtigen Freaks und Diagnosetechniker natürlich viele andere, komplexere Daten und Fakten zur Analyse ranziehen...aber als Otto Normal User fange ich jetzt einfach mal mit den Crystal Disk Daten an ;)

Falls ihr Auffälligkeiten findet, würde ich diese mal an einen anderen Port hängen. Nur um da sicher zu gehen, das es nicht am Board liegt.

Vielen Dank und Gruß,
Ben

c1.JPG


e1.JPG

f1.JPG


g1.JPG


h1.JPG


i1.JPG
 
Zuletzt bearbeitet:
3 HDD`s haben UltraDMA-CRC Fehler - Kabelkontakte prüfen , gegeben falls Tauschen

Ich finde, man tut sich leichter, wenn man In den Optionen - erweiterten Optionen - Rohwert auf 10[DEC] umstellen.
 
  • Gefällt mir
Reaktionen: CRX_Fan
Hi AbisZ...ich galube ich habe auch dahingehend gerade zufälig was gefunden. Mir ist gerade aufgefallen, das Laufwerk G: plötzlich verschwunden war. Ich hatte den Rechner daraufhin dann mal runtergefahren und zufällig, kurz bevor er abgeschaltet hat, das Stromkabel mal bewegt, da startet die Platte plötzlich. Es kann also durchaus jetzt speziell bei dem Prolem wirklich ein Versorungsproblem sein. Ich weiss jetzt nur gerade nicht, ob es vielleicht auch am runterfahren lag. Mir ist öfters schonmal aufgefallen, wenn ich aus dem Standby den Rechner aufwecke und dann runterfahre, das die HDDs dann starten (aber noch im Windows selber). Allerdings eine Sekunde vor dem ausschalten?

Nichts desto trotz werde ich mal alle Kabel tauschen.
Danke Dir schonmal.

P.S. habe mal auf DEC umgestellt
 
Zuletzt bearbeitet:
Interessant finde ich auch, das die Samsung G-Sensor Werte haben - Stoß Zähler ?, aber keine Ausschaltungsabbrüche - Seagate schon. einmal sogar ziemlich viele

Und ne besser Kühlung kann nicht Schaden, weil ich da sogar einmal 66° max mal lese
 
Hallo,

ich will mein NAS in naher Zukunft veräußern und zu diesem Zwecke habe ich einmal die Smart-Werte der beiden verwendeten Festplatten ausgelesen. Da ich kein Windows zur Hand habe, habe ich kein CrystalDiskInfo verwendet, sondern die Ansicht vom NAS selber. Ich hoffe das ist kein Problem :)

Die Frage die ich habe: Bei beiden Festplatten sind recht große Werte bei Raw_Read_Error_Rate und Seek_Error_Rate. Muss ich mir da Gedanken machen, dass die Festplatten nicht mehr wirklich rund sind? Die Laufzeit sind ja nicht dramatisch, daher hatte ich eher ein beruhigenderes Bild erwartet.

Ich sage schonmal Danke für die Hilfe, das besser zu verstehen :)
 

Anhänge

  • Bildschirmfoto 2018-11-11 um 10.52.58.png
    Bildschirmfoto 2018-11-11 um 10.52.58.png
    314,4 KB · Aufrufe: 291
  • Bildschirmfoto 2018-11-11 um 10.53.27.png
    Bildschirmfoto 2018-11-11 um 10.53.27.png
    304,3 KB · Aufrufe: 298
Schau dir die Bilder ein paar Post über deinem mal an ;)
 
HerrAbisZ schrieb:
Interessant finde ich auch, das die Samsung G-Sensor Werte haben - Stoß Zähler ?, aber keine Ausschaltungsabbrüche - Seagate schon. einmal sogar ziemlich viele

Und ne besser Kühlung kann nicht Schaden, weil ich da sogar einmal 66° max mal lese

Du meinst die über 8600 Ausschaltungsabbrüche? Das ist die einzige Festplatte, die über einen Wechselrahmen in das System eingebunden ist. Der PC wird oft in den StandBy gesetzt und diese Platte taucht auch nach dem aufwecken nie mit auf - nur bei einem Neustart. da ich die selten brauche, habe ich mich dahingehend noch nicht weiter damit beschädtigt, woran das liegt, das sie nach dem Aufwecken nie mit angezeigt wird.

Eventuell hängen diese extrem vielen Abbrüche damit zusammen ?!
 
HerrAbisZ schrieb:
Schau dir die Bilder ein paar Post über deinem mal an ;)
Das hatte ich :) da gibt es z.B. bei Laufwerk I: bei der knapp 3 fachen Laufzeit nur halb so viele Suchfehler wie bei meinen Festplatten. Gut die Anzahl an Lesefehlern ist signifikant größer.
 

Ähnliche Themen

Antworten
1.922
Aufrufe
257.126
J
Zurück
Oben