Software Raid, Hardware Raid oder gar nichts?

Wieso denn nicht?
Ich nutze auch RAID5 als "Backup" für Datenmengen geringerer Wichtigkeit.

Hat mir in den letzten Jahren schon 6TB an Daten gerettet, welche verloren gegangen wären wenn ich kein RAID genutzt hätte.
Wenn man kein Geld für ein 1:1 Backup ausgeben möchte, ist RAID5 immernoch ein guter Kompromiss.
Man verringert die Wahrscheinlichkeit dass was durch einen HDD-Defekt verloren geht. Doch wenn was schief geht, dann halt richtig :D
 
Genau das meinte ich... Der Mathematiker würde sagen "quod erat demonstrandum" - was zu beweisen war.
Wem meine Ausführungen zu langatmig sind, der kann gleich zum letzten Absatz springen, verpasst aber die Erklärung ;-)


RAID bedeutet Ausfallsicherheit (von RAID0 alias Striping mal abgesehen). Geht eine Platte kaputt, können die Daten aus den Paritätsdaten auf den übrigen Platten wiederhergestellt werden - im laufenden Betrieb. Der laufende Betrieb wiederum führt zur Verfügbarkeit. Die Daten sind auch bei einem Plattendefekt sofort verfügbar, das heißt man kann weiterarbeiten ohne mehrere Stunden von seinen Daten abgeschnitten zu sein.

BACKUP bedeutet Datensicherung. Dabei werden die Daten unabhängig von der Verfügbarkeit auf externen Medien als Kopie gesichert. In einigen Fällen sind das sogar noch Bandlaufwerke, die nicht "mal eben schnell" wieder zurückgesichert sind. Will heißen, man muss warten bis die Rücksicherung abgeschlossen ist bis man wieder an seine Daten rankommt. Im Gegensatz zu RAID hat man aber je nach Backupstrategie sogar eine Versionshistorie der Daten, weil man zB regelmässig ein Vollbackup macht und die letzten x Backups parat hat.


Ausgehend von zwei Festplatten ist es sogar so, dass die Ausfallsicherheit in beiden Szenarien vergleichbar ist. Sowohl bei RAID1 als auch beim Backup kann eine Platte kaputt gehen und die Daten sind noch da. Einzig die Verfügbarkeit ist anders, weil man das Backup erstmal zurückspielen muss. Dafür hat man beim Backup aber eben nicht nur "Hardware-Ausfallsicherheit", sondern auch einen gewissen Schutz vor dem DAU, der doof wie er ist 2 Tage vor Abgabe seine Diplomarbeit löscht ;-)

Im privaten Umfeld ist die Verfügbarkeit aber in aller Regel vollkommen unerheblich. Es mag lästig sein, seine MP3s, etc. von der USB-Platte im Schrank wieder auf den Server zu kopieren, nachdem dort die Platte abgeraucht ist, aber man kann auch ein paar Tage ohne auskommen.
Im professionellen Umfeld ist das ein ganz anderer Schnack. Wenn bei uns in der Firma der Server die Grätsche macht, die Daten also nicht mehr verfügbar wären, dann könnten wir für besagte "paar Tage" Betriebsferien machen, weil keiner arbeiten kann.
Ich wage mal zu behaupten, dass die wenigsten - auch hier im Forum - im privaten Bereich RAID sinnvoll einsetzen können. Meistens ist das vermutlich eher aus einer Laune heraus "Ich tue es, weil ich es kann" ;-) Wer sich jetzt auf den Schlips getreten fühlt, der soll sich bitte nicht angesprochen fühlen. Ausnahmen bestätigen die Regel und in diesem Thread gibt es bedingt durch das Thema sicher viele Ausnahmen :p

Allgemein bleibt noch zu sagen, dass unterschiedliche RAID-Level auch unterschiedliche Anwendungsszenarien bedienen. Bei meinem Server daheim ist beispielweise das System (und eine Handvoll hochverfügbare Daten) auf einem RAID1 installiert - ein Backup hilft hier nur bedingt. Man kann zwar ein Backup vom System ziehen, aber der Server ist im Falle eines Plattendefekts dann tot bis man die Platte ersetzt und das Backup eingespielt hat - Stichwort: Verfügbarkeit. Meine Datenplatten wiederum werden nur gebackupped ohne RAID und Co. Raucht ne Platte ab, dann hab ich eben solange keinen Zugriff drauf bis ich die Daten zurückgespielt habe.
Je nach RAID-Level ist natürlich auch noch die Schreib-/Lese-Geschwindigkeit ein Faktor, der aber je nach Level unterschiedlich ausfällt (schneller, aber zT auch langsamer als Solo-HDD). Die Höhe der Ausfallsicherheit und dementsprechend auch die Brutto-/Nettokapazität hängt ebenfalls vom Level bzw. der Anzahl der Platten ab.


Lange Rede, kurzer Sinn:
Lösch bei deinem RAID mal deine Urlaubsfotos. Das kann so oft gespiegelt sein wie es will, die Daten werden auf allen Laufwerken gelöscht. Oh, das wolltest du nicht? So ein Mist aber auch, nu isses futsch... Hättest du mal ein Backup gemacht, dann wären die Fotos noch auf der USB-Platte im Schrank... Ein Virus hat den gleichen Effekt. Sofern man eine adäquate Backupstrategie hat (täglich/wöchentlich/monatlich) kann man mit Glück noch auf eine virenfreie Version der Daten zurückgreifen. Beim RAID ist alles verseucht, aber dafür doppelt gespiegelt, gestriped und haste nich gesehen.. Der Virus ist dann auch "hochverfügbar" *lach*

RAID und Backup sind und bleiben zwei Paar Schuhe..
 
Zuletzt bearbeitet:
Raijin schrieb:
Lösch bei deinem RAID mal deine Urlaubsfotos.
[...]
Ein Virus hat den gleichen Effekt.

Alles richtig, nur kein Argument gegen RAID - denn ohne RAID hat man ganz die gleichen Probleme, auf RAID zu verzichten löst also nichts. Wobei versehentliches Löschen und Viren sehr vermeidbare Probleme sind.

Ein Backup braucht man so oder so, aber ein RAID kann eben den Normalfall - defekte Platte - abfangen und dir eine langwierige Backup-Herstellung-Prozedur ersparen.

Ich habe z.B. meine Bluray-Sammlung auf Festplatte aber nicht im Backup. Das Backup sind hier die Blurays selbst. Nur die wieder alle zu rippen - das dauert eine Weile. Aber das wird erst notwendig wenn mal zwei Platten gleichzeitig eingehen, und das passiert nur sehr, sehr selten.

Zumindest, wenn man regelmäßig Lesetests durchführt, um Fehler früh zu erkennen, und wenn man Platten auch beim ersten Anzeichen (reallokierter Sektor etc.) tauscht. Wer seine Platten nicht testet, hat früher oder später zwei defekte Platten im RAID, weil Lesefehler nun mal erst auffallen, wenn die betroffene Stelle auch gelesen wird, also Monate später bzw. beim RAID-Rebuild...

Letztendlich muß die Entscheidung für oder gegen RAID jeder für sich selbst treffen.

Wer sich gegen Backup entscheidet ist so oder so selbst schuld.
 
Nu hab ich es schon so ausführlich beschrieben und trotzdem wird es falsch verstanden. Ich argumentiere nicht für oder gegen RAID, sondern stelle nur klar: RAID != Backup

Es sind zwei Paar Schuhe, die völlig andere Zielsetzungen haben und unterschiedliche Szenarien bedienen.

RAID ist keine Datensicherung und Backup bietet keine Ausfallsicherheit/Verfügbarkeit.

Wie sinnvoll RAID eingesetzt bzw. welche Backupstrategie gefahren wird, obliegt jedem selbst. Man kann es just4fun machen oder auch mit einem konkreten Anwendungsszenario im Hinterkopf, mit Hand und Fuß oder auch ohne. Das ändert aber nichts daran, dass Äpfel mit Birnen verglichen werden, oder besser Äpfel mit Zwiebeln, Autoreifen oder Kirchenglocken....
 
Zuletzt bearbeitet:
Der Kern eines Backups ist die Möglichkeit einer Datenwiederherstellung.

Sowohl ein RAID5 als auch ein Backup ermöglichen im Falle eines einzelnen HDD-Ausfalls eine Datenwiederherstellung.

Man kann somit sagen, ein RAID5 erfüllt eine Teilmenge der Aufgabe eines Backups, mehr wollte ich mit dem obigen Punkt auch nicht ausrücken.

Sicher ist man nicht vor allen Eventualitäten geschützt. Ich habe jedoch bis jetzt nur Daten durch Festplattenausfälle verloren, noch nie durch Dummheit oder Viren, weswegen mit ein RAID5 als Backup-Kompromiss für Daten geringer Wichtigkeit völlig ausreicht.
 
Ich widerspreche der strikten Trennung von Backup/Raid:

1.) Man führt ein Backup nie oft genug durch, wenn dies manuell zu erledigen ist.
2.) Was ist mit den Daten, die inzwischen angefallen sind? Üblicherweise sind die aktuellen Daten sogar die wichtigen, auf die man nur schwer verzichten kann.
3.) Das Argument Virus/versehentliches Löschen: dafür gibt es Dateisysteme mit Snapshots!

Ich empfehle dem TE FreeNAS mit ZFS und noch ein zusätzliches Backup.

Wir haben hier folgende Strategie: Server mit ZFS, (fast) Echtzeitreplikation auf einen zweiten Server und dann noch tägliches Rsync auf einen entfernten Server (auch mit ZFS). Die Volumes sind jeweils RaidZ2. Scrub wird einmal wöchentlich ausgeführt. Alle Server bewahren tägliche Snapshots von einem Jahr auf.
 
Bitte vermischt hier nicht alle Ebenen querbeet. Das wie und womit ist noch eine ganz andere Frage und sprengt den Rahmen der Diskussion. Mir geht es prinzipiell darum, die Begrifflichkeiten Backup und RAID voneinander abzugrenzen. Sonst können wir uns auch noch schön über RAID-Level oder gar RAID-Kombinationen unterhalten...

Die strikte Trennung, die du ansprichst, gilt auch nur für die Begrifflichkeiten. Genutzt wird in der Regel beides, quasi Datenbackups von einem RAID-System auf einen externen Speicher (zB ebenfalls RAID)..

1)
Das hat rein gar nichts damit zu tun, dass RAID != Backup ist. Fährt man nicht regelmässig zur Tankstelle, braucht man sich nicht wundern, wenn man plötzlich auf der Autobahn liegenbleibt...
Wie oft man Backups macht und vor allem wie (voll/differentiell/inkrementell) muss jeder eigenverantwortlich entscheiden, weil jeder andere Anforderungen hat. Ändert man täglich seine Daten, sichert sie aber nur alle 14 Tage, dann gehen natürlich potentiell 14 Tage Arbeit verloren. Das ist aber genau genommen ein Anwendungsfehler und eine Frage der Disziplin. Von einem manuellen Backup war auch keine Rede wobei das auch wieder eine Entscheidung des Anwenders ist wie er das Backup durchführt. Bei mir ist es ein Cronjob bzw. ein Script, das dann und dann diese und jene Daten sichert. Genau genommen sind es mehrere, weil ich "statische" und "dynamische" Daten unterschiedlich sichere.

2)
Auch hier wieder: Backupstrategie. Tägliche Änderungen => tägliches Backup. Dafür gibt es ja die Differenzierung von vollen, differentiell und inkrementellen Backups. Ein Backup ist aber nicht dazu da, jeden Tastendruck des Nutzers zu sichern, sondern um einen Totalverlust der Daten zu verhindern. Zwangsläufig gehen die Änderungen seit dem letzten Backup verloren. Darf das nicht passieren, dann ist das aber eine Frage der Verfügbarkeit, weil die Daten nahtlos auch nach einem Defekt weiter verfügbar sein müssen => RAID. Dennoch ist diese Verfügbarkeit kein Backup, weil der Datenverlust auf logischer Ebene (zB versehentliches Löschen oder Speicherung von ungewollten Änderungen) nicht abgesichert ist.

3)
Das Dateisystem ist noch ein ganz anderer Schnack. Wenn das Dateisystem Snapshots ermöglicht, ist das effektiv ja ein Backup - sofern man es nach Möglichkeit auslagert und im Optimalfall physikalisch getrennt aufbewahrt wird. Das was du beschreibst ("Aufbewahren von Snapshots") IST ein Backup. Wenn die Snapshots natürlich "neben" den Live-Daten liegen, sind sie allerdings nach wie vor einer gewissen Gefahr ausgesetzt (Virus, Controller-Defekt, etc).
Allerdings muss man bedenken, dass nicht jedes Betriebssystem mit jedem Dateisystem umgehen kann. Jemand, der sich nicht mit Backups (was/wie oft/wohin) beschäftigt und nur alle Nase lang manuell sichert (siehe dein 1.), der wird sich auch kaum Gedanken über das richtige Dateisystem machen.. Das Gros der Leute schließt ne Platte an, "Format C:" und los geht's.


Was man bei RAID auch nicht außer Acht lassen darf ist, dass auch im Controller ein Defekt auftreten bzw. Fehler passieren können. Dann ist im schlimmsten Falle das komplette RAID im Allerwertesten und sämtliche Daten sind weg, weil irreparabel beschädigt.
Wir können uns gerne noch seitenweise darüber streiten was Backups und RAIDs ausmacht, die Tatsache, dass es zwei verschiedene Dinge sind, bleibt davon aber unberührt. Es spricht nichts dagegen (im Gegenteil!), seine Daten auf einem RAID zu lagern und sie regelmässig auf einen externen Speicher per Backup zu sichern. Auch dieser Speicher kann durchaus wieder ein RAID-System sein, um auch die Backups vor einem Plattendefekt zu schützen.
 
Raijin: Wenn du dich mal mit neuen Dateisystemen (ZFS/btrfs/reFS) beschäftigt hättest, dann würdest du feststellen, dass da die Speichertopologie/der Raid-Level und das Dateisystem eben keine getrennten Dinge mehr sind ;) Ebenso ist das getrennte Abspeichern von Snapshots auf anderen Datenträgern Mumpitz (mir fällt auch kein FS ein, welches das erlaubt;ich glaube, du verwechselst das mit "diff").

Gegen die von dir genannten Hardwaredefekte ist man bei diesen FS durch Prüfsummen abgesichert. Stromausfälle und das Raid Write Hole Problem existieren hier auch nicht.

btrfs und reFS sind noch nicht so ausgereift wie ZFS (da wird sicherlich noch eine Menge passieren). Ein System mit ZFS kann man mithilfe von FreeNAS innerhalb von 5 Minuten auch als Laie aufsetzen. Deswegen würde ich dem TE raten, sich das mal genauer anzusehen. Möchte man sich gegen den Verlust/Defekt aller Platten absichern (Überspannung, Brand, Diebstahl) ist eben noch ein zusätzliches Backup notwendig.
 
Ebenso ist das getrennte Abspeichern von Snapshots auf anderen Datenträgern Mumpitz (mir fällt auch kein FS ein, welches das erlaubt;
Du kannst unter Windows die Schattenkopien auf einen anderen Datenträger legen.

Wenn du dich mal mit neuen Dateisystemen (ZFS/btrfs/reFS) beschäftigt hättest, dann würdest du feststellen, dass da die Speichertopologie/der Raid-Level und das Dateisystem eben keine getrennten Dinge mehr sind
Ist nicht nur bei neuen Dateisystemen so, WAFL von Netapp macht das seit über zehn Jahren so. Nur als Anmerkung.
 
a_engels schrieb:
Raijin: Wenn du dich mal mit neuen Dateisystemen (ZFS/btrfs/reFS) beschäftigt hättest, dann würdest du feststellen, dass da die Speichertopologie/der Raid-Level und das Dateisystem eben keine getrennten Dinge mehr sind ;) Ebenso ist das getrennte Abspeichern von Snapshots auf anderen Datenträgern Mumpitz (mir fällt auch kein FS ein, welches das erlaubt;ich glaube, du verwechselst das mit "diff").

Ich hab mich damit schon beschäftigt, allerdings nur am Rande, das gebe ich zu. Solche Dateisysteme würde ich auch getrost unter "Fortgeschritten" einordnen und meine Absicht war es lediglich, die Begriffe RAID und Backup prinzipiell voneinander abzugrenzen. Das Gros der Leute, die eben RAID und Backup begriffsmäßig gleichsetzen, wird zu 95% einfach das nächstbeste FS nehmen, ohne sich da großartig Gedanken zu machen. Bei technisch versierten Anwendern, die sich eben mit sowas beschäftigen und darüber nachdenken, mache ich mir auch keine Sorgen. Otto Normal dagegen, der sich ein Aldi-NAS kauft und sich über RAID einen Keks freut, weil er ja nu nie wieder Daten verlieren kann, der guckt doof, wenn denn doch etwas inne Grütze geht..

Snapshots und Datenträger: Ich war der Meinung man kann Snapshots auch auslagern. Kann sein, dass ich das mit der Replikation verwechsle, da stecke ich wie gesagt nicht sonderlich tief drin. Die gesicherten Daten sollten zumindest extern gelagert werden, da die Backups sonst derselben Ausfallsicherheit wie die Daten selbst unterliegen - mit allen damit verbundenen Konsequenzen. Das Backup soll ja prinzipiell auch vor einem Totalausfall des Raids schützen, das wäre dann ja nicht mehr gegeben.

Wie dem auch sei, wir gehen viel zu sehr ins Details, da wollte ich gar nicht hin.
 
Naja, ich finde, dass das Thema so ziemlich jeden betrifft.

Ich gebe zu, dass ich absolut paranoid bin. Das liegt aber einfach daran, dass Datenverluste drastische Konsequenzen für mein Leben hätten. Deswegen speichere ich meine Daten an 3 verschiedenen Standorten mit jeweils einem RaidZ2 und ZFS. Und ich denke trotzdem noch darüber nach, wie man die Strategie verbessern könnte.

Jedoch hat doch jeder von uns auch Privates, zB Fotos, auf seinem Rechner und das kann auch einen unschätzbaren Wert haben. Je länger man Daten speichert und je größer die Datenmenge wird, um so wahrscheinlicher wird es, dass es mal zu einem Datenverlust kommt.

Daher finde ich es auch so positiv, dass neuere Dateisystem genau dieses Problem angehen, finde die Situation aber insgesamt unbefriedigend. ZFS scheint das beste Design zu haben und ist inzwischen auch ausgiebig getestet worden, aber inzwischen wird es Dank Oracle als closed source weiterentwickelt. Ich beobachte eine Zeit lang schon BTRFS, aber sehe da leider keine Quantensprünge im Fortschritt. reFS von Microsoft.. naja, ich würde sagen, da liegen auch noch sehr wenige Erfahrungen vor ;)

Am interessantesten finde ich dabei noch den Ansatz von Wuala, einem peer to peer Dateisystem. Wäre super, wenn man einfach eine Gruppe von Rechnern hätte, die untereinander ihre Daten austauschen und einen Ausfall automatisch kompensieren würden.
 
Zurück
Oben