Kurze Frage Raid 5 und Alignment

Entweder ich lese alle Datenplatten und kann mir die Parity sparen oder ich lese eine Datenplatte und die Parität, eine andere Möglichkeit gibt es nicht, sonst habe ich keine Grundlage um die neue Parität zu berechnen. Es gibt also immer zwei Leseoperationen und zwei Schreiboperationen.
 
Kann man aus der alten Parity, den alte und den neuen Daten zuverlässig eine neue Parity bestimmen? Bin zu erkältet mir das jetzt auszurechnen.
 
Also ich freue mich ja, dass wir hier mal auf die ganzen kleinen Details eines RAIDs und Co eingehen.
Ich habe da noch eine andere Frage zur He6.

Ist euch etwas von verschieden Versionen dieser Platte bekannt? Meine erste He6 hat ein tief blaues PCB, meine zweite ein hell blaues bzw. türkises PCB. Sie ist vom MAY 2014. Die Platte ist von Alternate in einer geöffneten Antistatikfolie gekommen. Man versicherte mir, dass sie nur für eine Qualitätsprüfung ausgepackt wurde. Die S.M.A.R.T-Werte verraten 6 Einschalt-Vorgänge, aber 0 Betriebsstunden.

Also ich werde bei der He6 bleiben, weil sie gegenüber der WD RED die höherwertige Platte ist und mir quasi jeden möglichen RAID-Aufbau gewährt. Die WD Red könnte ich nur wirklich sicher mit doppelter Parität im RAID6 benutzen.
 
Die WD Red könnte ich nur wirklich sicher mit doppelter Parität im RAID6 benutzen.
Dafür hättest auch mehr Sicherheit.

Bei der Red hättest du kein Datenverlust,..

wenn dir 2 Festplatten abrauchen
wenn dir 1 Festplatte abraucht und es zu Lesefehlern kommt (können auch mehrere sein sofern nicht an der gleichen Stelle aber das ist sehr unwarscheinlich)

Datenverlust hättest du..

wenn dir 3 Festplatten abrauchen
wenn dir 2 Festplatten abrauchen UND es zu einem Lesefehler kommt


Bei der He6 biste "nackt" wenn eine kaputt ist.

http://www.zdnet.com/has-raid5-stopped-working-7000019939

Heut stand aber auch schon was von ner 8TB Platte auf CB mein ich.

Da du das ganze ja nach und nach aufrüsten willst könnte man also auch mit 3 Festplatten anfangen im Raid5 und nacher aber auf Raid6 umsteigen und dann die 3 jetzigen durch größere ersetzen

1. Read the old data
2. Read the old parity
3. Write the new data
4. Write the new parity
Aber wieso kann das nicht gleichzeitig geschehen? Bei Raid1 schreibe ich doch nicht auch erst auf die eine Platte und dann auf die andere. Also "old data" und "old parity" können doch gleichzeitig gelesen und geschrieben werden.
 
Zuletzt bearbeitet:
Nur weil die beiden Befehle zur gleichen Zeit abgeschickt werden heißt ja nicht das sie gleichzeitig fertig werden. Die Köpfe der Platte können sich ja sonst wo befinden.
 
Aber das selbe trifft doch bei Raid1 und Raid0 auch zu. Ob ich nun ein Raid5 oder 0 aus 3 Platten habe ist doch eigentlich belanglos wenn auf allen Platten etwas geschrieben werden muss.

In dem Fall würde ich bei dem Raid5 immernoch 66% der Leistung erwarten weil im Gegensatz zu Raid0 aus 3 Platten ja die Daten nur über 2 anstatt 3 verteilt werden können.

Oder schreibt man generell die Paritätsinformationen erst zum Schluss nachdem die anderen Platten fertgi sind? Dann würde es mir einleuchten dass hier Performance flöten geht, aber nicht verstehen wieso man es dann überhaupt so macht
 
Zuletzt bearbeitet:
Wenn ich auf ein Raid 0 4kb schreiben will ist das ein Schreibzugriff auf eine Platte. Beim Raid 5 sind das zwei Lesezugriffe (die zwar gleichzeitig starten unterschiedlich lang dauern werden) dann das Ändern der Daten im RAM (ok das geht schnell) und dann zwei Schreibzugriffe (die wieder gleichzeitig starten aber mit hoher Wahrscheinlichkeit nicht gleichzeitig fertig werden. Es dauert in jedem Fall mindestens doppelt so lange.
 
Wieso muss ich beim Raid5 die Platten auslesen wenn gar nix drauf ist bzw ich überschreibe was da steht. Es ist doch egal was vorher da stand.


dann zwei Schreibzugriffe (die wieder gleichzeitig starten aber mit hoher Wahrscheinlichkeit nicht gleichzeitig fertig werden
Das kann man aber ignorieren, wäre doch bei Raid1 genau dasselbe. Zumindest wird das nicht der Grund sein wieso die Performance deutlich schlechter ist.
 
ML89 schrieb:
Ist euch etwas von verschieden Versionen dieser Platte bekannt? Meine erste He6 hat ein tief blaues PCB, meine zweite ein hell blaues bzw. türkises PCB.
Geizhals listet inzwischen 4 HGST mit 6TB, davon zwei He6 SAS (mit und ohne SED) und weiterhin nur eine He6 SATA. Die Farbe der Platine kann aber schon mal anders sein.

ML89 schrieb:
Die Platte ist von Alternate in einer geöffneten Antistatikfolie gekommen. Man versicherte mir, dass sie nur für eine Qualitätsprüfung ausgepackt wurde.
Wie viele Betriebsstunden hat sie?

ML89 schrieb:
Also ich werde bei der He6 bleiben, weil sie gegenüber der WD RED die höherwertige Platte ist und mir quasi jeden möglichen RAID-Aufbau gewährt. Die WD Red könnte ich nur wirklich sicher mit doppelter Parität im RAID6 benutzen.
Genau, wegen der UBER von 1:10^15 bei der HGST und nur 1:10^14 bei der Red.

Masamune2 schrieb:
Danke für den Hinweis, dann bleibt nur die Frage, wo was wie implementiert ist. :D

Ilsan schrieb:
Bei der Red hättest du kein Datenverlust,..

wenn dir 2 Festplatten abrauchen
Nein, da dürfte die UBER dagegen sprechen, zumindest sobald das RAID 6 aus mehr als 4 Platten besteht, denn dann ist dieses Szenario wahrscheinlich:
Ilsan schrieb:
Datenverlust hättest du..
...
wenn dir 2 Festplatten abrauchen UND es zu einem Lesefehler kommt


Ilsan schrieb:
Bei der He6 biste "nackt" wenn eine kaputt ist.

http://www.zdnet.com/has-raid5-stopped-working-7000019939

Heut stand aber auch schon was von ner 8TB Platte auf CB mein ich.
Lies aber auch den vorhergehenden Artikel: http://www.zdnet.com/blog/storage/why-raid-5-stops-working-in-2009/162
Da wird klar, dass die UBER eine entscheidende Rolle bei der Problematik spielt. Das wurde in diesem Thread auch ausgiebigst diskutiert und die ist eben bei den beiden HDDs unterschiedlich.

Ilsan schrieb:
Aber wieso kann das nicht gleichzeitig geschehen? Bei Raid1 schreibe ich doch nicht auch erst auf die eine Platte und dann auf die andere. Also "old data" und "old parity" können doch gleichzeitig gelesen und geschrieben werden.
"old parity" wird ja nicht wieder geschrieben, sondern "new parity" und um die zu berechnen, muss erst "old parity" gelesen worden sein oder alternativ die Daten aller anderen Platte die Daten enthalten.

Ilsan schrieb:
Aber das selbe trifft doch bei Raid1 und Raid0 auch zu. Ob ich nun ein Raid5 oder 0 aus 3 Platten habe ist doch eigentlich belanglos wenn auf allen Platten etwas geschrieben werden muss.

In dem Fall würde ich bei dem Raid5 immernoch 66% der Leistung erwarten weil im Gegensatz zu Raid0 aus 3 Platten ja die Daten nur über 2 anstatt 3 verteilt werden können.
Dann hast Du die Problematik der Write Penalty bei RAID 5/6 noch nicht verstanden.

Ilsan schrieb:
Oder schreibt man generell die Paritätsinformationen erst zum Schluss nachdem die anderen Platten fertgi sind? Dann würde es mir einleuchten dass hier Performance flöten geht, aber nicht verstehen wieso man es dann überhaupt so macht
Man kann sie ja immer erst schreiben, wenn man alle Daten zusammen hat, die für die Bildung der Parity nötig sind und wenn nur ein kleiner Teil des Strips überschrieben wird, werden die sehr wahrscheinlich erst am Ende geschrieben, wobei es im Prinzip egal ist, ob sie nun vor oder nach den neuen Daten geschrieben werden, beides sollte aber wirklich erfolgen und daher möglichst zeitgleich.

Ilsan schrieb:
Wieso muss ich beim Raid5 die Platten auslesen wenn gar nix drauf ist bzw ich überschreibe was da steht. Es ist doch egal was vorher da stand.
Ein RAID Controller ist so dumm wie der Controller eine HDD und beide wissen nicht, wo gültige Daten (also solche die der User geschrieben hat) und wo nicht. Daher werden echte RAIDs ja auch initialisiert, dabei werden die Daten gelesen, ob gültig und sinnvoll oder nicht und die Partiyinformationen gebildet und geschrieben. So ist danach die Parity immer für das ganze RAID gültig und das muss schon deswegen so sein, weil der RAID Controller ja bei Inkonsistenzen des RAIDs nicht wissen kann, ob der betroffene Bereich mit gültigen Daten beschrieben ist oder nicht.
Ergänzung ()

Laut Datenblatt gibt es 4 He 6TB, die HUS726060AL[A/S]64[0/1]. A6 ist SATA 6Gb/s und S6 SAS 6Gb/s, 0 am Ende ist ohne Encryption, 1 mit Encryption.
 
Zuletzt bearbeitet:
Holt schrieb:
Wie viele Betriebsstunden hat sie?

6 Starts der Spindel, 0 Betriebsstunden. Also das es die beiden Versionen je Anschluss, also 4 Modelle gibt. Ich meinte ob es da eine Revision gibt, also sowas wie HUS726060ALA640 (A)/(B). Die Indexe A und B stehen natrlich nicht auf der Platte.
Wie dem auch sei, in 30 Minuten ist der vollständige Test durchgelaufen.

EDIT: Der vollständige Test ist bestanden.
 
Zuletzt bearbeitet:
Nein, da dürfte die UBER dagegen sprechen, zumindest sobald das RAID 6 aus mehr als 4 Platten besteht, denn dann ist dieses Szenario wahrscheinlich:

Wie gesagt ich habe halt bestimtme Situationen aufgezählt wo er Datenverlust hätte und wo nicht. Wenn ich sage bei 2 ausfallenden Platte hat er kein Datenverlust dann stimmt das. Wenn dann noch ein anderes Ereignis hinzu kommt ist es ja wieder ne andere Situation. Daher ist es nicht falsch was ich gesagt habe.

Mit dem Raid5 und der He6 kann er aber auch nicht eine kaputte Platte UND eine gleichzeitig mit Fehlern haben.

Da wird klar, dass die UBER eine entscheidende Rolle bei der Problematik spielt. Das wurde in diesem Thread auch ausgiebigst diskutiert und die ist eben bei den beiden HDDs unterschiedlich.
Ja schon klar, dennoch wird das Problem massiv entschärft durch ne zusätzlich Parity Platte. Wenn er 6 Platten im Raid6 einsetzen würde, wäre die UBER nicht mehr wichtig (erst nachdem ihm 2 Platten ausgefallen sind). Zumindest bei den derzeitigen Plattengrößen vorerst(!) nicht.

Aber mal was anderes das sind ja alles nur Herstellerangaben dass man nach 12,5 bzw 125TB ein Fehler zu erwarten hat. Ich habe hier auch ein RaidZ1 was ich wöchentlich scrubbe. Besteht aus 3x4TB HDDs (WD Green). Sprich ich müsste doch eigentlich pro scrubbing mindestens einen Fehler haben oder nicht? Habe es jedenfalls schon ca. nen halbes Jahr, also 26 Wochen x 12TB wären 312TB gelesen, und noch nie hat es einen Fehler gefunden.

weil der RAID Controller ja bei Inkonsistenzen des RAIDs nicht wissen kann, ob der betroffene Bereich mit gültigen Daten beschrieben ist oder nicht.

Vllt rührt daher ja auch ein Vorteil des ZFS Systems weil man eben belegte und nicht belegte Blöcke unterscheiden kann und es ist ja ein CoW Dateisystem.
 
Zuletzt bearbeitet:
ML89 schrieb:
Also ich freue mich ja, dass wir hier mal auf die ganzen kleinen Details eines RAIDs und Co eingehen.
Ich habe da noch eine andere Frage zur He6.

Ist euch etwas von verschieden Versionen dieser Platte bekannt? Meine erste He6 hat ein tief blaues PCB, meine zweite ein hell blaues bzw. türkises PCB. Sie ist vom MAY 2014. Die Platte ist von Alternate in einer geöffneten Antistatikfolie gekommen. Man versicherte mir, dass sie nur für eine Qualitätsprüfung ausgepackt wurde. Die S.M.A.R.T-Werte verraten 6 Einschalt-Vorgänge, aber 0 Betriebsstunden.

Also ich werde bei der He6 bleiben, weil sie gegenüber der WD RED die höherwertige Platte ist und mir quasi jeden möglichen RAID-Aufbau gewährt. Die WD Red könnte ich nur wirklich sicher mit doppelter Parität im RAID6 benutzen.

War bei meiner letzten neuen Platte auch 0 Stunden, 6 Starts. Vielleicht werden die immer 5mal getestet oder so
 
Ja, alles klar.

Also ich muss sagen, dass ich bisher mit der He6 sehr zufrieden bin. Habe jetzt beide Exemplare im RAID1 laufen. Der Server ist über LACP angebunden. Die He6 ist dabei sehr ruhig - Abgesehen von dem leichten Rattern der Köpfe ist sie fast leiser als eine WD Green. Von der Geräuschkulisse her kann man nicht davon ausgehen, dass es sich dabei um eine 7200er Platte handelt :) Bald werde ich die dritte Platte haben und damit das gewünschte RAID5 aufbauen.
 
Zurück
Oben