wie lange darf eine SSD höchstens unbenutzt rumliegen?

retho schrieb:
Das heisst also, man sollten alle seine USB-Sticks, SSDs und Speicherkarten alle paar Monate mal wieder anschliessen, mit Strom versorgen, damit keine Daten verloren gehen?
Ja und ggf. mal eine Refresh der Daten machen, denn ob jeder Controller, auch von Speicherkarten und USB Sticks, dies von selbst macht, würde ich nicht erwarten.

Gerk schrieb:
Eine meiner SSDs liefert nach etwa 1 bis 2 Jahren im Betrieb im täglich eingeschalteten PC regelmäßig beschädigte Daten oder Blue Screen.
Dann poste doch mal die S.M.A.R.T. Werte der SSD, aber ich wrüde fast wetten, dass in Wahrheit ein defektes RAM die Ursache ist, denn SSDs legen wie HDDs eine ECC hinter jeder Page (bei HDD jedem Sektor) ab und liefern keine korrupten Daten wenn diese ECC nicht zu den Daten der Page / des Sektors passt und die Fehler auch nicht mehr korrigieren kann, sondern stattdessen eine Lesefehler. Das Programm sollte den natürlich entsprechend behandeln und nicht so tun als wäre nichts geschehen und die Daten wären korrekt gelesen worden.

Gerk schrieb:
In einer Workstation werden wohl kaum billige Consumer-SSDs eingesetzt werden.
In einer vernünftigen Workstation wird aber auch ECC RAM verwendet und nämlich unterstützt da auch die restliche HW (CPU+Board) die ECC RAM Funktion. Dies ist die wichtigste Maßnahme gegen Datenkorruption, was Matt Ahren, Mitentwickler des ZFS-Dateisystems, schreibt:
Man beachte die Reihenfolge, zuerst empfiehlt er ECC RAM und dann erst oben drauf ein Filesystem mit Prüfsummen wie z.B. ZFS oder ReFS zu verwenden, wenn man seine Daten liebt und vor Korruption schützen möchte!
 
Holt schrieb:
Dann poste doch mal die S.M.A.R.T. Werte der SSD, aber ich wrüde fast wetten, dass in Wahrheit ein defektes RAM die Ursache ist, denn SSDs legen wie HDDs eine ECC hinter jeder Page (bei HDD jedem Sektor) ab und liefern keine korrupten Daten wenn diese ECC nicht zu den Daten der Page / des Sektors passt und die Fehler auch nicht mehr korrigieren kann, sondern stattdessen eine Lesefehler. Das Programm sollte den natürlich entsprechend behandeln und nicht so tun als wäre nichts geschehen und die Daten wären korrekt gelesen worden.

Das stimmt zumindest für Windows leider nicht. Da stellt zum Beispiel erst Acronis True Image bei der Überprüfung eines Images ,Backupdatei fest, dass ihm Windows Mist geliefert hat. Etliche Monate früher war die Überprüfung fehlerfrei. Am RAM kann es also nicht gelegen haben.

xxx@PC01:~$ smartctl -H /dev/sda
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.11.0-14-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

Smartctl open device: /dev/sda failed: Permission denied

:)

"Anständiges" RAM macht (auch ohne ECC) keine Bitfehler. Mein Bios hat seit 2013 noch keinen einzigen korrigierten ECC-Fehler gemeldet. RAM-Fehler hatte ich zuletzt ungefähr zur Jahrtausendwende.
 
Zuletzt bearbeitet:
Wieso kann es nicht am RAM gelegen haben? Wenn während der zwei Überprüfung, also der bei der die Fehler angezeigt wurden, RAM Fehler ausgetreten sind, dann passiert genau das. Die Daten gehen ja alles übers RAM.

Logge Dich als root ein und stelle mal sudo voran und poste bitte die Ausgabe von -a oder -A, also: sudo smartctl -A /dev/sda
 
Zuletzt bearbeitet:
Holt schrieb:
Wieso kann es nicht am RAM gelegen haben?

Weil ich seit etwa 10 Jahren nur noch ECC-RAM habe. Wenn man eine SSD mit H2testw voll schreibt, alles fehlerfrei ist, man die Daten drauf lässt, monatlich, zuerst fehlerfrei, prüft und ab etwa 18 Monaten immer die gleichen Dateien an der gleichen Stelle Fehler haben, dann soll das Deiner Meinung nach am RAM liegen?

Die SSD hatte bisher 9 unkorrigierbare ECC-Fehler, 3 benutzte Reserveblöcke und keine einzige Meldung von Windows - eventuell im Ereignisprotokoll, aber welcher User sieht da ohne Kenntnisse hin.

Ich habe diese SSD nur noch aus Jux. Jetzt ist sie in 2 Partitionen geteilt und alle halbe Jahre wird von rechts nach links und von links nach rechts kopiert und die jeweils freie Partition unter Windows schnellformatiert. Damit gibt es nun keine Fehler mehr. :)
Ergänzung ()

Hier noch ein paar SMART-Werte:

178 Used_Rsvd_Blk_Cnt_Chip 0x0003 100 100 000 Pre-fail Always - 3
181 Program_Fail_Cnt_Total 0x0003 100 100 000 Pre-fail Always - 0
182 Erase_Fail_Count_Total 0x0003 100 100 000 Pre-fail Always - 0
187 Reported_Uncorrect 0x0002 100 100 000 Old_age Always - 9
192 Power-Off_Retract_Count 0x0003 100 100 000 Pre-fail Always - 148
196 Reallocated_Event_Count 0x0003 100 100 000 Pre-fail Always - 9

Und jetzt komm mir bloß nicht mit Power-Off.

Man könnte ja mal einen Sammel-Thread aufmachen, in dem User derartige Werte melden...
 
Zuletzt bearbeitet:
Gerk schrieb:
Weil ich seit etwa 10 Jahren nur noch ECC-RAM habe.
Und hoffentlich auch ein System wo der Rest diese Funktion auch unterstützt, also ein passendes Board und die passende CPU dazu, denn sonst hänge die zusätzlichen Bit der ECC RAM Riegel ja nur unnütz in der Luft. Ein ECC RAM Riegel ohne passendes System ist nicht besser als ein normaler RAM Riegel und kann alleine keine RAM Fehler verhindern, der hat eben einfach nur 72 statt 64 Bit Datenbreite.

Gerk schrieb:
Wenn man eine SSD mit H2testw voll schreibt, alles fehlerfrei ist, man die Daten drauf lässt, monatlich, zuerst fehlerfrei, prüft und ab etwa 18 Monaten immer die gleichen Dateien an der gleichen Stelle Fehler haben, dann soll das Deiner Meinung nach am RAM liegen?
Da Du mit konkreten Informationen sehr sparsam bist und Dein Beiträge mich an jemande erinnern der nur mit komischen Kommentaren aufgefallen ist, habe ich keine Meinung dazu.

Welche SSD ist es denn überhaupt? Wie ist die angeschlossen, über USB oder direkt über SATA? Was für ein Mainboard ist es? Die Controller haben auch RAM, da kann es auch zu RAM Fehlern und damit Datenkorruption kommen, wenn die SSD übr USB angeschlossen wird, dann wären der USB Host Controller und der USB-SATA Bridgechip mögliche Fehlerquellen, sonst der SATA Host Controller, dazu jeweils der Controller und dessen Cache auf der SSD selbst, wenn sie keine internal Data Path Protection hat.
Gerk schrieb:
Die SSD hatte bisher 9 unkorrigierbare ECC-Fehler, 3 benutzte Reserveblöcke und keine einzige Meldung von Windows - eventuell im Ereignisprotokoll, aber welcher User sieht da ohne Kenntnisse hin.
Da kann auch die Ursache liegen, denn es hängt von der FW ab, da gab es genug Probleme bei SSDs in der Vergangenheit. Diese sollten nicht zu Datenkorruption führen, aber 100%ig sicher kann man da nicht sein und bei bestimmten Modellen würde es mich weit weniger wundern als bei anderen. Wenn es unter Linux ist (da läuft h2testw aber nicht), so sind dort auch Bugs im kernel in dem Zusammenhang aufgefallen die zu Datenkorruption führen, u.a. gab es Ärger mit Queued TRIM, aber auch bei der FW bestimmter SSDs.
Gerk schrieb:
Hier noch ein paar SMART-Werte:

178 Used_Rsvd_Blk_Cnt_Chip 0x0003 100 100 000 Pre-fail Always - 3
181 Program_Fail_Cnt_Total 0x0003 100 100 000 Pre-fail Always - 0
182 Erase_Fail_Count_Total 0x0003 100 100 000 Pre-fail Always - 0
187 Reported_Uncorrect 0x0002 100 100 000 Old_age Always - 9
192 Power-Off_Retract_Count 0x0003 100 100 000 Pre-fail Always - 148
196 Reallocated_Event_Count 0x0003 100 100 000 Pre-fail Always - 9
Solche Ausschnitte wie in der Peepshow mag ich gar nicht, zeige alle Attribute, oder was willst Du verbergen was die Lösung aufzeigen würde? Solche Ratespiele mache ich jedenfalls nicht mit.
Gerk schrieb:
Und jetzt komm mir bloß nicht mit Power-Off.
Warum nicht? Unerwartete Spannungsabfälle sind Gift für SSDs, wenn diese die Mappingtabelle dann nach einem Schreibvorgang nicht zurückschreiben konnten, kommt es immer wieder zu Problemen. Der 8MB Bug der ersten Intel SSDs, der bei der 320er als solche aufgefallen aber auch bei den Vorgängern vorhanden war, kommt daher ebenso wie Probleme bei den Crucial SSD mit Marvell Controllern, wenn diese verschinden und dann nach Anwendung der Power Cycle Wiederbelebung wieder funktionieren. Dies sind nämlich Zeichen eines Sicherheitsmechanismus der die Konsistenz der Mappingtabelle und damit der Daten prüft und bei Probleme eben lieber den Zugriff auf die Daten verhindert als Datenkorruption erlaubt. Da es dann meist auch zu Garantiefällen kommt, dürften einige SSD Hersteller versucht sein, lieber die Datenkorruption zu akzeptieren und letztlich dürfte es den meisten Heimanwendern auch lieber sein, dann noch an ihre Daten zu kommen als die SSD einschicken zu müssen.
 
Gerk schrieb:
Das ist ein Grund, warum ich mich von Windows getrennt habe. .

https://www.computerbase.de/forum/threads/linux-4-13-lifetime-hints.1708452/#post-20422125

Gerk schrieb:
heise, "Die Neuerungen von Linux 4.13"

"
Unter den wichtigsten Änderungen am Block Layer (1, 2) waren Umbauten am Code, der Schreib- oder Leser-Fehler an höhere Schichten zurückmeldet (u. a. 1, 2). Dateisysteme und Anwendungen können dadurch jetzt mehr über die Art aufgetretener Fehler erfahren, denn bislang erhielten sie in vielen Fällen nur einen vagen EIO (I/O error); Software blieb daher manchmal nichts anderes übrig, als unwissend aufzugeben oder es einfach nochmal zu probieren. ( ;) )Der neue Ansatz soll andere Teile des Kernels und letztlich auch Anwendungen ermöglichen, einige Fehlersituationen galanter abzufangen. Details hierzu erläutert ein LWN.net-Artikel."

Bei ungeprüften SSDs vertraue ich den Daten ungefähr 6 Monate. Ein normaler Anwender bemerkt Datenfehler erst sehr spät - wenn überhaupt. Meistens wird einfach Windows neu installiert.

Was glaubt Ihr denn, warum es seit 20 Jahren Programme wie Winzip gibt, die Archive mit Prüfsummen versehen? ;)

winzip [dot] de/help/help_encryption.htm

"Verschlüsselt werden nur die Inhalte der in einem Archiv gespeicherten Dateien. Die Informationen zu einer verschlüsselten Datei, d. h. der Dateiname und das Dateidatum, die Attribute, die CRC-Prüfsumme und der Komprimierungsgrad, werden hingegen in nicht verschlüsselter Form in der Dateiliste des Archivs gespeichert und können jederzeit ohne Eingabe eines Kennworts angezeigt werden."

ZIP-Reparaturprogramm
repairzip.recoverytoolbox [dot] com/de/

"Reparatur von Archiven mit CRC-Prüfsummenfehlern"

Ohne diese "Schwächen" gäbe es wohl kein Windows-Kommando >sfc /scannow

"Verwenden des Systemdatei-Überprüfungsprogramms (SFC.exe) zur Problembehandlung bei fehlenden oder beschädigten Systemdateien"

support.microsoft*com/de-de/help/929833/use-the-system-file-checker-tool-to-repair-missing-or-corrupted-system

"Das Systemdatei-Überprüfungsprogramm ist ein Hilfsprogramm in Windows, mit dem Benutzer Windows-Systemdateien auf Beschädigungen überprüfen und beschädigte Dateien wiederherstellen können."

Bei defekten Anwendungsprogrammen und -Daten hat man eben Pech gehabt. :(

drwindows*de/windows-7-allgemein/75192-sfc-scannow-repariert.html
drwindows*de/windows-8-windows-rt/83785-sfc-scannow-findet-fehler.html

"Ein Inplace-Upgrade bleibt dir alle mal." :)

Das soll aber kein normaler User durchschauen. Sonst könnte die Industrie nicht die Abfälle gegen Geld bei den "Consumern" entsorgen.
 
Zuletzt bearbeitet:
Gerk schrieb:
Was glaubt Ihr denn, warum es seit 20 Jahren Programme wie Winzip gibt, die Archive mit Prüfsummen versehen? ;)
Weil es damals nicht einmal eine Absicherung der Übertragung über IDE gab, die wurde erst mit der schnelleren Ultra DMA Übertragung eingeführt. Die einfachen PC sollen vor allem billig sein und müssen nur in den meisten Fällen bei den meisten Usern fehlerfrei laufen, so dass diese benutzbar sind.

Für höhere Ansprüche an den Schutz vor Datenkorruption gibt es andere von Workstations die auch ECC RAM haben und unterstützen über Server bis zu den Mainframes, bei denen alles extrem gegen solche HW Fehler abgesichert ist, weshalb diese z.B. bei Banken und Versicherung weiterhin ihre Daseinsberechtigung haben.

Da Du immer noch nicht verrätst welche SSD es ist oder die kompletten S.M.A.R.T. Werte postest, ist das Thema hier durch, ich wette es ist eine einfache Consumer SSD die kein vernünftiger Mensch in einen Server einbauen würde.
 
Ich habe das Gefühl, Du willst mich veralbern und Nebelkerzen werfen. Mit IDE und UDMA hat das nichts zu tun. Die Daten gelangen fehlerfrei auf die SSD, werden nochmals zur Probe gelesen und sind fehlerfrei - und nach 2 Jahren sind sie doch kaputt.

Windows läuft ja nach der Installation auch bis sagen wir mal 2 Jahre fehlerfrei - bis dann eines Tages beim Start oder immer wieder an der gleichen Stelle ein BSOD kommt.

Meine SSD geht Dich nichts an. Ich habe Dich nicht um etwas gebeten - und ich mag Dich nicht.
 
IDE und UDMA hat damit zu tun, dass ein 20 Jahre altes Tool damals damit konfrontiert wurde, dass vor Ultra-DMA jeder Kabelfehler zu korrupten Daten geführt hat und deswegen eben Prüfsummen vorsieht, nicht mit einer SSD die zwei Jahre rumgelegen hat.

Wenn die SSD hier niemanden was angeht, wozu schreibst du dann darüber? Es bringt niemandem etwas einfach nur zu meckern wenn mit einer bestimmten HW etwas passiert was nicht die Regel ist. Die NANDs deiner SSDs scheinen nicht die besten zu sein, denn es ja schon 3 ausgefallene NAND Blöcke aber komischerweise 9 Reallocated Events in den S.M.A.R.T. Werten, womit dann 2 Jahre Lagerung zu viel sein können. Wenn das Modell, welches uns nicht verraten wird, dann die Fehlerkorrektur nicht korrekt handhabt, so wie der "Reallocated Event Count" nicht zum "Used_Rsvd_Blk_Cnt_Chip" passt, dann können Daten korrupt werden und die Frage wäre hier, ob die SSD diese korrupten Daten trotzdem rausgibt, was eigentlich nicht passieren sollte, aber so vielen Modellen und so viele FW Bugs die einige von denen hatten auch nicht in jedem Fall ausgeschlossen werden kann, oder ob das Tool welches sagt die Daten wären korrupt diese Aussage aufgrund der Fehlermeldungen macht die es beim Versuch die Daten zu Lesen bekommt. Wie weit ReFS hier noch in der Lage gewesen wäre diese Fehler zu korrigieren, kann man auch nur raten, denn auch die Fehlerkorrektur solche Filesysteme hat Grenzen und funktioniert nur bis zu einer bestimmten Anzahl an Fehlern.

Das mit den Sympathiewerten beruht auf Gegenseitigkeit, denn Leute die nur irgendwelchen Mist rauskosten der ihnen vielleicht wirklich passiert ist, vielleicht auch nicht, die aber daraus total falsch Schlüsse ziehen und dann unbelehrbar bleiben, sind mir auch nicht sympatisch. Trotzdem werden ich nicht unkommentiert lassen was die von sich geben, weil es sonst andere Leser glauben könnten.
 
Zurück
Oben