Gendra schrieb:
Der Schutz vor Silent Data Corruption beruht auf Prüfsummen und ist erstmal völlig unabhängig von einem RAID.
Genau, völlig richtig. Da habe ich mich falsch ausgedrückt.
Ich meinte damit, dass das RAID Schutz bietet, indem es Fehler automatisch bei einem Scrub (oder wenn einfach nur gelesen wird bei ZFS) korrigieren kann; die Daten also konsistent bleiben. Die Erkennung beruht natürlich auf den Prüfsummen und da hat das RAID nichts mit zu schaffen, das ist klar. Und klar kann man über ein externes Backup hier mit mehr Aufwand den gleichen Effekt erzielen.
Gendra schrieb:
Den Schutz vor Bit-rot hat man aber in beiden Fällen und für ein Ereignis das statistisch vielleicht einmal in 10 Jahren auftritt ist die 5-minütige manuelle Interaktion durchaus zumutbar.
Vorausgesetzt, das Backup ist noch okay - und das ist eben aus meiner Sicht der springende Punkt. HDDs eignen sich m.E. einfach nicht, um Daten über viele Jahre ohne Kontrolle zu verwahren. Wenn du Backups machst, aber diese nie prüfst, dann weißt du auch nie, ob Fehler schon existieren, und diese können sich über die Zeit kumulieren und dann im schlimmsten Fall sogar zu SDC führen.
Ich halte es also für eine ganz schlechte Idee, sich mehrere Backups ohne Prüfsummen zu erstellen und diese zehn Jahre irgendwo hinzulegen und zu hoffen, dass ein Backup noch okay ist (die Anzahl der Backups erhöht hier natürlich die Wahrscheinlichkeit, aber ist trotzdem keine Garantie).
Gendra schrieb:
Andererseits nutzt z.B: ein einfacher RAID1 von der Stange in der Regel gar keine Prüfsummen und kann daher trotz der Redundanz keinen silent Bit-rot korrigieren, weil es den Fehler zwar finden kann (beiden Kopien unterscheiden sich) aber mangels Prüfsumme nicht weiß, welche der beiden Kopien die richtige ist.
Doch, es nutzt zumindest die Sektorprüfsummen - das ist, wie ein Software-RAID bei einem RAID-Scrub arbeitet. Das Ganze ist jedoch bei RAID1 problematisch:
https://wiki.archlinux.org/title/RAID#RAID1_and_RAID10_notes_on_scrubbing
Genauso werden die Sektorprüfsummen auf Hardwareebene für jeden RAID-Scrub genutzt (z.B. bei RAID5).
Wenn man einen Scrub mit den Prüfsummen des Dateisystems durchführt, ist das ein Data Scrub (wie bei ZFS, Btrfs und ReFS).
Unter Silent Bit Rot ist zu verstehen, dass Daten korrumpiert werden, es aber nicht erkannt wird (also z.B. über den ECC der Festplatte). Wenn in einem RAID jetzt zwei Sektoren an gleicher Position festgestellt werden, die sich unterscheiden, aber deren Sektorprüfsumme jeweils stimmt, ist das tatsächlich eine Extremsituation.
Über eine elaboriertere Prüfsumme auf Dateisystemebene oder Prüfsummen für ganze Dateien hätte solch ein Fehler aber sehr wahrscheinlich identifiziert werden können.
Gendra schrieb:
Ich persönlich würde im Privatbereich nie auf ein RAID setzen, sondern das gesparte Geld lieber in eine bessere Backup-Lösung (Offsite-Backup, mehr Versionierung, Pull statt Push Backup etc.) investieren.
Ist doch auch völlig in Ordnung, solange du ein Prüfsummen-basiertes Dateisystem verwendest oder separate Prüfsummen für die Dateien anlegen lässt.
Es fängt mMn aber schon damit an unkomfortabel zu werden, dass man m.W. unter Windows (was eben die meisten nutzen) nicht einfach mal so ein ZFS- oder Btrfs-Volume einhängen und scrubben kann.
Man könnte alternativ mit einer Backup-Software arbeiten, die Prüfsummen anlegt - hat aber den Nachteil, dass die Überprüfung länger dauert als auf Blockebene per Dateisystem.
Deshalb finde ich die Lösung mit NAS hier recht praktisch. Dort kann man dann auch leicht externe Backups mit z.B. Btrfs einhängen und scrubben; noch dazu hat man den Vorteil, dass Fehler ggf. aus der Redundanz automatisch korrigiert werden können.
Ja, es geht auch ohne, aber ist mMn eher umständlich. Aber muss jeder selbst wissen.
Deshalb
@pattex
Damit du mich hier nicht missverstehst: Ich wollte dir nur die aus meiner Sicht komfortabelste Lösung aufzeigen. Du kannst aber auch einfach externe HDDs verwenden unter der Prämisse, dass du hier eben in irgendeiner Form mit Prüfsummen arbeitest (viele Backup-Programme können dies).
Nur die HDDs einfach nie zu prüfen / nicht prüfen zu können und die Daten sehr lange darauf aufzubewahren, halte ich eben für keine gute Lösung - auch wenn andere da eine abweichende Meinung haben. Für Langzeitverwahrung ohne Prüfung sind Band oder MDISC einfach die deutlich besseren Medien.
PS:
@Gendra Ich denke, wir stimmen hier aber grundlegend überein, dass Prüfsummen bzw. Kontrolle wichtig ist - so wie ich es sehe.