"End-to-End Error" - hinüber oder nicht?

Erbsenkönig

Lt. Commander
Registriert
Jan. 2008
Beiträge
1.437
Hallo,

ich hab mir im Urlaub mal die Zeit genommen und bin meine "Festplatten-Sammlung" mal durchgegangen (vieles ist übrig geblieben beim Wechsel auf SSDs). Dabei ist mir bei meiner "zweiten Datenplatte" (Backups, Filme, etc." aufgefallen, dass mir HDDScan bei SMART Probleme bei den End-To-End Errors anzeigt:

5d2KQuH.png


CDI hingegen scheint sich damit zufrieden zu geben:

XNQlkWq.png


Wie ernst muss ich diesen Fehler denn nun nehmen? Ich hatte bisher keine wirklichen Probleme mit der Platte (auch wenn ich letztens einen Ordner hatte, den ich partout nicht löschen konnte...), will aber nicht wieder 2 TB draufschaufeln, nur um ihr dann beim Sterben zuzusehen.

Was meint ihr?
 
Danke für den Link. Dann tausche ich das Ding lieber aus. Hier übrigens noch die Dezimal Werte:

qOOTXzu.png
 
USB Platten gehen immer recht schnell kaputt, besonders die 3,5" Geräte, wenn man sie häufiger bewegt. Würde also eine 2,5"Platte holen, wenn 2tb reichen. Und immer auswerfen vorm Abziehen.
 
Erbsenkönig schrieb:
CDI hingegen scheint sich damit zufrieden zu geben:
CDI wertet für seine Zustandsbeschreibung nur ein paar wenige Attribute aus. Dies dürfte auch daran liegen, dass viele Hersteller, gerade von SSDs, Schindluder mit den S.M.A.R.T. Attributen treiben und schon im Neuzustand bei einigen Aktuellen Werten 0 eintragen, was dann dem Grenzwert entspricht und eigentlich zur Bewertung Schlecht führen müsste, aber in so einen Fall ein Fehlalarm wäre.

Erbsenkönig schrieb:
Wie ernst muss ich diesen Fehler denn nun nehmen?
Da ich leider keine Dokumentation gefunden haben ob diese Ende-zu-Ende Fehler, die Fehler auf den internen Datenpfaden sind, nun nur erkannt oder auch korrigiert werden, kann ich dies nicht mit Sicherheit sagen. Wenn sie nur erkannt aber nicht korrigiert werden, würde es Datenkorruption zur Folge haben und da der Grenzwert so gesetzt ist das er schon beim ersten Fehler dieser Art erreicht wird, würde ich eine HDD mit so einem Fehler sofort ersetzen, da ich den Grenzwert als Hinweis werte, dass diese solche Fehler eben nicht korrigiert werden, sonst müsste man ja nicht gleich beim ersten Fehler derart Alarm schlagen.
 
Holt schrieb:
Da ich leider keine Dokumentation gefunden haben ob diese Ende-zu-Ende Fehler, die Fehler auf den internen Datenpfaden sind, nun nur erkannt oder auch korrigiert werden, kann ich dies nicht mit Sicherheit sagen. Wenn sie nur erkannt aber nicht korrigiert werden, würde es Datenkorruption zur Folge haben und da der Grenzwert so gesetzt ist das er schon beim ersten Fehler dieser Art erreicht wird, würde ich eine HDD mit so einem Fehler sofort ersetzen, da ich den Grenzwert als Hinweis werte, dass diese solche Fehler eben nicht korrigiert werden, sonst müsste man ja nicht gleich beim ersten Fehler derart Alarm schlagen.


Könnte ich es noch mit den Seatools probieren order würde auch das wenig bringen? Die bieten ja auch eine "Reparatur" an.
 
Inzersdorfer schrieb:
Aber nicht für End-to-End Errors, Seatools bringen da nichts.

Danke für die Klarstellung. Dann schaue ich mich mal nach Ersatz um. :)
 
Erbsenkönig schrieb:
Dann schaue ich mich mal nach Ersatz um. :)

Hallo Erbsenkönig!

Wir bedauern, dass Du Probleme mit Deiner Seagate-Platte hast! Neben dem hier Gesagten kannst Du Dich trotzdem bei Interesse mit dem SeaTools-Report mal an unseren Support wenden. Du schreibst zwar nichts zu dem genauen Alter der Platte aber die Betriebsstunden sind mit 316 ja äußerst gering - vielleicht ist da ja noch was zu machen...
HIER kommst Du direkt zum Garantie-Check mit anschließender Option ein Support-Ticket zu öffnen.
 
seagate_surfer, kannst Du mich und alle hier vielleicht bzgl. der Frage ob es eine Ende-zu-Ende Fehlerkorrektur oder nur -erkennung gibt?
 
Hallo Holt,

ja gerne! Das Thema Ende-zu-Ende Fehler ist allerdings etwas tricky, daher kurz zum Hintergrund und warum diese Art Fehler auftritt:

Der "Ende-zu-Ende"-Wert ist vereinfacht gesagt Teil der IO-Fehlererkennung und -korrektur. Er beinhaltet Informationen darüber, welche bzw. wie viele Abweichungen auf dem Weg zum Medium über den Cache des Laufwerks auftreten.
Oder anders gesagt: unerwartete Ereignisse bei dem Vorgang Daten aus dem Cache tatsächlich auf das Medium zu schreiben!

Der "Ende-zu-Ende"-Fehler weist entsprechend die Daten-Unterschiede zwischen Controller/Cache und den tatsächlich geschriebenen Daten aus. Sollte dieser Wert zu hoch sein, liegt also ein Problem mit dem Controller/Cache des Laufwerks vor.

Entsprechend kann das ganze zwar relativ gut entdeckt aber nicht wirklich "korrigiert" werden. Wir haben aber auch schon Fälle von "Spontanheilungen" gesehen, bei denen die Werte über einige Messungen vorhanden waren und dann auf längere Sicht gar nicht mehr aufgetreten sind. Das lässt natürlich nur auf eine "externe" Verursachung dieses Fehlers schließen (der dann u.U. abgestellt wurde).

Noch eine Anmerkung zum Schluss: sollten diese Werte auf Dauer nicht signifikant ansteigen und das Laufwerk keine weiteren Probleme machen, gibt es keinen Grund, die HDD sofort zu entsorgen. Natürlich ist in einem solchen Fall das Laufwerk im Auge zu behalten und mehr denn je auf regelmäßige Backups zu achten...
 
Zuletzt bearbeitet:
Danke für die Auskunft, eine Korrektur der Fehler auf den internen Datenpfaden findet also nicht statt.

Enterprise Laufwerke, zumindest SSDs, verwenden ja ECC RAM und können damit eben Fehler im Cache erkennen und zumindest die Singlebit Fehler auch korrigieren. Nutzt man nur eine Parität, wie es übrigens schon das RAM des originalen IBM XT besessen hat, so kann man Fehler eben nur erkennen, aber keine korrigieren. Bei RAM Fehlern muss man immer zwischen zwei Arten unterscheiden, den soft errors die spontan, meist aufgrund irgendeiner Strahlung, ein Bit kippen lassen und den hard errors, bei denen ein echter Fehler der HW vorliegt und dafür sogar das unter bestimmten Umständen (z.B. den Werten benachbarter Bits) ein Bit im RAM kippt. Hard errors sind daher reproduzierbar und werden immer wieder auftreten wenn die entsprechenden Umstände eintreten, soft errors hingegen nicht.

Wenn es also ein oder zweimal einen Ende-zu-Ende Fehler gibt und dann lange nicht wieder, würde ich eher einen soft error vermuten und in dem Sinne ist es dann keine Spontanheilungen, sondern nur das Fehlen er extern verursachten Störung. Da soft errors aber in jeder Hinsicht zufällig auftreten und die Daten im Cache eher kurzlebig sind, ist die Wahrscheinlichkeit für solche soft errors auch entsprechend gering, da es ja egal ist wenn ein Bit in einem RAM Bereich kippt der hinterher erst wieder neu beschrieben wird, bevor man ihn erneut ausliest. Gefährlich sind soft errors für Anwendungen wo Daten lange um RAM gehalten werden, daher sollte man zumindest dort dann immer ECC RAM verwenden, wobei sich dies immer dann empfiehlt wenn man sich darauf verlassen können möchte auch korrekte Ergebnisse / konsistente Daten zu bekommen.
 
Zurück
Oben