Atkatla schrieb:
Natürlich würde das auf die Performance gehen, aber auch bei Rebuilds ist die Performance sekundär hinter der Datenintregrität. Und die ZFS-Entwickler gehen eben nicht davon aus, dass jedes ZFS-System ECC hat. Es ist empfohlen, aber nicht mandatory.
Das ist alles Spekulation deinerseits bzw. was du irgendwo reininterpretierst.
Davon ausgehen, dass professionelle Systeme idR ECC-RAM verwenden (und ZFS wurde schließlich von Oracle nicht primär für Heim-Systeme entwickelt) und sagen, dass etwas obligatorisch für die Nutzung ist, sind zwei völlig unterschiedliche Dinge.
Alleine schon, dass die in dem zweiten Beitrag genannte Einstellung für die Prüfung der Daten im RAM nicht standardmäßig gesetzt ist, deutet doch wirklich stark darauf hin, dass der Performance-Impact hoch ist und dass dieser den Entwicklern eben nicht egal ist.
Und mal ganz davon abgesehen, um noch mal auf das Beispiel von mir zurückzukommen (ohne die eben genannte Einstellung):
Du hast bei einem Rebuild nun Disk2 verloren und hast 1-x-1. Korrekterweise müsste jetzt x=0 sein. Durch Bitflip ist es aber eine 1.
Um das noch mal zu checken, würde jetzt die Berechnung nochmals durchgeführt und eine 0 käme raus, die jetzt im RAM nicht kippt.
Wie weiß das Sytem jetzt deiner Meinung nach, welche Berechnung korrekt ist? Richtig, es weiß es nicht. Also müsste man noch eine dritte durchführen lassen, um dann mit einer sehr hohen Wahrscheinlichkeit sagen zu können, dass wohl doch 0 der korrekte Wert ist.
Das erscheint mir wirklich eher abwegig. Und mit ECC-RAM könnte man sicher sein, dass es keinen 1-Bit-Fehler gegeben hat und eine Berechnung würde reichen - statt drei, welche auch noch keine absolute Sicherheit geben!
(Mehr-Bit-Fehler wären natürlich trotzdem möglich, aber die sind noch mal deutlich unwahrscheinlicher).
Auch das deutet mMn ganz klar in die gleiche Richtung.
Ansonsten zeig mir Belege dafür, wie genau das ZFS-Dateisystem auf dieser Ebene arbeitet, dann können wir weiterreden.
Bis dahin bleibt es Spekulation und es ist besser, vom Worst Case auszugehen.
Weder du noch ich wissen im Detail, wie ZFS arbeitet.
PS: Es kann im geschäftlichen Bereich übrigens durchaus von Bedeutung sein, wie lange ein Rebuild dauert. Solange der Server das Rebuild macht, ist er nicht verfügbar für Nutzer oder kann nicht anderweitig arbeiten und du verdienst u.U. kein Geld. Deshalb ist Verfügbarkeit auch ein wesentliches Kriterium für den Einsatz von RAID.