ICH9 Raid 5 6x1TB offline

Topdog

Cadet 4th Year
Registriert
Juni 2009
Beiträge
68
Hallo,
mir ist gestern mein Raid 5 ausgestiegen, ohne weiteres komme ich nicht an die Daten. Dazu habe ich Ernst@at angeschrieben, da er schon einigen (auf professionelle weise) geholfen hat. Nun werden wir in diesem Thread versuchen das Raid zu retten.

Ursache:
Durch eine anscheinen defekte Strom Verkabelung ist mir vorgestern Abend HDD5 (Platte 6) ausgefallen. Diese habe ich anschließend wieder ins Rennen gebracht und der Rebuild Prozess hat begonnen. Den wollte ich über Nacht laufen lassen, da ca. 24h gebraucht werden. Am nächsten Morgen schau ich nach ob alles noch läuft und da sagt mir der Matrix Manager, dass ein Fehler aufgetreten ist, das Volumen gelöscht wurde und alle Platten offline sind (3 Platten an einem Stromkabel habe das ganze Stromkabel erneuert). Nun Stehen im Matrix Manager die Platten ohne Raid da mit dem Status Normal. Im Raid BIOS ist kein Volumen mehr definiert und alle Platten sind Offline Member(rote Schrift).

Das System:
Mainboard: Gigabyte P35C-DS3R
CPU: Q6600
IDE- CDLW
GeForce GTX 260
4GB A-Data Speicher
HDDs(Sata):
- 6 x 1TB Samsung Spinpoint F1 (Raid 5) ein Volumen mit einer großen Partition „Daten”
- 1 x WD Velociraptor 150GB (System)

2tes System (zum Testen und Analysieren):
CPU: I7 860
Board: P7P55D (ICH10)




P.S. ich will keine Sprüche hören wie Datensicherung und co., denn von den wichtigsten Daten (ca 50GB) habe ich immer zeitnahe Backups. Es geht hier nur darum das Raid zu retten und mir viel viel viel mehr Arbeit zu ersparen. Also bitte nur Beiträge die dem Thema hilfreich sind.
 
Zentrales Problem ist also doch der Fehler, der über Nacht beim Rebuild augetreten ist. Was besagte dieser Fehler denn, gibt es da mehr Details?
Kann gut sein, dass sich dein Raid 5 in Wohlgefallen aufgelöst hat, warum auch immer.
Den Vortrag zur Datensicherung spar ich mir dann, hätte ich auch garnicht vorgehabt. Aber vielleicht noch den Hinweis, beim nächsten Mal einen vernüntigen Raidcontroller anzuschaffen. Z.B. einen SmartArray. Ich weiß, nicht billig. Aber nirgends steht, das man mit einem Raid Geld spart :)
 
Ja über Nacht muss wohl noch ein Wackler in der Stromversorgung der Platten aufgetreten sein (oder sowas ähnliches) habe ja anschließend alle Stromkabel erneuert. Nen Raid-Controller hab ich schon ins Auge gefasst, aber den Investmentantrag ^^ muss ich meiner Frau noch irgendwie schmackhaft machen :)
 
:)

Also wenn man ein Rebuild abbricht (auch gewaltsam) passiert eigentlich garnichts, sollte zumindest nicht. Wenn man den Rechner dann neu startet, wird der Rebuild fortgesetzt bzw. neu begonnen. Kann natürlich sein, dass der ICH9 extrem empfindlich reagiert und einfach das Raid fallen lässt, wenn nicht alle Platten mehr lesbar sind weil kein Strom mehr da ist. Mit einem "richtigen" Raidcontroller ist das garkein Problem, hab ich schon oft genug gemacht :)
 
und sich auch mal klar machen, dass RAIDs keine Backup-Lösungen sind. Tragisch für dich, aber immerhin kann ich mich darauf beziehen, wenn mir mal wieder jemand von RAIDs rumschwärmt und nicht verstanden hat, was der Sinn eines RAIDs ist...
 
Guten Morgen.

Ich fürchte es wird schwer etwas zu erreichen sein bei einem Software-Raid - leider. Eine Wiederbelebung halte ich für ausgeschlossen, da der Raid sich ja schon aufgelöst hat. Somit liegen keine Informationen für den Controller auf den Platten bereit, die ihm sagen, welche Platte eine Raid-Zugehörigkeit besitzt. Es war nicht gerade günstig für einen Raid5 das gleich 3 Platten ausgefallen sind :(

Ich hätte einen Promise SuperTrak EX8350 zum Verkauf - fall Interesse besteht.

Ich habe verschieden Raid-Controller und auch SoftwareRaids im Einsatz gesehen und eingesetzt. Für eine wirkliche sichere, effiziente und upgradefähige Lösung ist ein Hardware-Raid-Controller ein muss.
 
Lieber Topdog,
dein Investmentantrag wird knapp 500 EUR sein, für einen vernünftigen Controller mit Batterie. Am besten bekommst du den bei deiner frau durch, wenn du ihr verargumentierst das du keine ander Möglichkeit mehr hast eure tausenden von wunderbaren urlaubs und privaten bilder zu sichern ;)
So hats bei mir geklappt. Aber bedenke das ein Raid 5 keine 100% ige Ausfallsicherheit bietet, ist halt kein Backup System.
In meinem Raid 5 mit 6x 1TB Samsung kackt mir gerade die 2te platte innerhalb von 12 Monaten nach kauf ab, ist also sowieso schon gefährlich. Kauf dir nen Controller der Raid 6 Kann und sichhere die wirklich essentiellen Daten (Bilder/Dokumente) online bzw noch extern.

Und nochmal, mach keine halben Sachen und nimm wirklich geld in die Hand, alles andere macht bei der Datenmenge keinen Sinn mehr.
 
Zuletzt bearbeitet:
Ich habe seit Jahren RAID5 im Einsatz - an 2 Rechner, jeweils mit 8 Platten. Ich hatte in diesen Jahren keinen einzigen Zwischenfall. Auch ein RAID6 kann ausfallen, auch wenn 2 Platten ausfallen können, ist nie 100% sicherheit gegeben. Auch ein Raid muss ab und zu überprüft werden, und ein wöchentlicher Blick in die Software oder eine eMail Benachritigung seitens Controller sollte schon drin sein, um Sicherheit zu schaffen. Ganz sich auf alle Technik zu verlassen wäre Selbstmord ;)
 
Zuletzt bearbeitet:
@1668mib du Held, wenn du dir mal alles ordentlich durchlesen würdest anstatt einfach deinen Senf zu Posten, würdest fu feststellen, dass ich Backups von wichtigen Daten habe und es hier nur darum geht zu versuchen ob das Raid noch zu retten ist oder nicht.

@DunklerRabe ich hab den Rebuild nicht abgebrochen, sondern über Nacht laufen lassen (mit def Stromkabeln) im Ereignissprotokoll steht dass es mehrfach Probleme mit den letzten 3 Platten gegeben hat (hingen alle an einem Strom Strang). Daraufhin habe ich die Stromverkabelung erneuert (nach dem totalausfall)

@[82nd]Hawk meine Analyse der Platten hat ergeben, dass die Raidinfos noch auf den Platten sind, denn sonst würde das Raid BIOS auch nicht Offline Member schreiben sondern Non Raid Disk. Der Matrix Manager Informiert immer über Popups wie der Zustand des Raid ist

@Nitewing ich habe von allen wichtigen Daten zeitnahe Backups, dass weis auch meine Frau ^^


Noch eine kleine erkenntnis meinerseit, das Gigabyte Board hat bei einer meiner Platten zugeschlagen (1953523055 von eigentlich 193525168 Sektoren) 2113 Sektoren sind weg, da das BackupBios hier liegt. Aber das scheint noch von Zeiten zu sein als diese Festplatte als Single an dem Board hin. Da ich in dem vorletzten Sektor die Seriennummern der ganzen Platten lesen kann, scheinen die letzten 3 Sektoren (wichtig für Raid noch intakt zu sein)
 
Topdog schrieb:
@DunklerRabe ich hab den Rebuild nicht abgebrochen, sondern über Nacht laufen lassen (mit def Stromkabeln) im Ereignissprotokoll steht dass es mehrfach Probleme mit den letzten 3 Platten gegeben hat (hingen alle an einem Strom Strang). Daraufhin habe ich die Stromverkabelung erneuert (nach dem totalausfall)

Ich weiß, das habe ich verstanden. Das ändert aber im Prinzip nichts an der generellen Tatsache. Ob du es gewaltsam abschießt oder es das selbst tut durch vermeintliche Stromprobleme.
Ich fürchte ich kann dir da nicht weiter helfen, wenn du die Platten nicht wieder auf dem üblichen Weg online setzen kannst, sehe ich schwarz.
 
wenn 2 oder mehr platten durch was auch immer ausfallen, schaltet JEDER raidcontroller ab, egal ob onbaord oder separate karte. auf den platten ist jeweils ein counter, der ständig hochzählt, auch wenn keine schreibzugriffe stattfinden. sind die counter ungleich, ist das raid inkonsistent. einige controller bieten die möglichkeit, das raid neu zu initialiesieren, ohne es zu formatieren = raid parameter neu setzen + counter auf null.

wenn das nicht geht, kann man ein solches raid immer noch mit raid-5 fähiger datenrettungssoftware auslesen. die datenrettungssoftware interessiert es nicht, welchen wert die counter haben, da wird per software der raid algorythmus auf blockebene emuliert.
 
Ich kann dir vlt. helfen, hatte dasselbe Problem gehabt das sich die platten beim rebuild zerfetzen.
Einfachste Lösung ist, wenn noch alle platten funktionsfähig sind, das Riad im Controllermenü zu löschen und anschließend identisch zu erstellen OHNE zu formatieren. Danach solltest du schleunigst deine Daten auf ein anderes Medium spielen und die Platten sector für sector prüfen.. und dann die Investition in einen richtigen Controller tätigen.

Im Prinzip das gleiche was der supaman übermir gesagt hat.
 
ewndb schrieb:
Ich kann dir vlt. helfen, hatte dasselbe Problem gehabt das sich die platten beim rebuild zerfetzen.
Einfachste Lösung ist, wenn noch alle platten funktionsfähig sind, das Riad im Controllermenü zu löschen und anschließend identisch zu erstellen OHNE zu formatieren. Danach solltest du schleunigst deine Daten auf ein anderes Medium spielen und die Platten sector für sector prüfen.. und dann die Investition in einen richtigen Controller tätigen.

Im Prinzip das gleiche was der supaman übermir gesagt hat.

SmartArray Controller können das z.B. schon seit langem.
Die erkennen wenn Platten angeschlossen werden, ob die schonmal in einem Raid waren und konfigurieren das auch wieder, ohne die Platten bzw. ein Raid neu zu initialisieren.
Ich fürchte nur, dass das der ICH9 eventuell nicht kann und sobald man das Raid im Menü einmal gelöscht hat, dann wars das endgültig. Andererseits, ist ja kein großer Unterschied zur aktuellen Lage.
 
Es wäre sinnvoll, am Gigabyte-Board ein Update auf das Finale F12 zu machen. Abstecken der RAID Platten ist dabei überlebensnotwendig
Hat außer dem AHCI-BootROM 1.20 auch noch die Abschaltbarkeit des BIOS-Backup im Gepäck.

Zur Analyse brauchen wir
- HDTune
- HxD (Ausführen unter Administratorrechten)

Am Gigabyte-Board gibt es ja einen jMicron Controller (2 lila SATA-Anschlüsse)
Es ist unbedingt darauf zu achten, dass die Systemplatte während der Analyse jeder Einzelplatte unbedingt am ERSTEN lila Port hängt, die jeweils zu Untersuchende RAID-Platte der Reihe nach einzeln am zweiten lila Port anstecken.
Mit einem Sata-Kabel vom anderen PC an die Platten müsste es auch funktionieren, ohne die HDDs auszubauen.

Mit HDTune/Reiter "Info" per Mausklick auf den "copy information to clipboard" Button (rechts neben der Temperaturanzeige) die Platteninfos in die Zwischenablage übertragen, und in einen .txt File übertragen
dann auf gleiche Weise mit "Health" Reiter die SMART-Daten im .txt File dahinter einfügen.

In der Datenträgerverwaltung nachsehen, welcher Datenträger die zu untersuchende 1TB-Platte ist. Diese Nummer um 1 erhöht, im HxD unter Extras/open disk/physical disk # öffnen.

dann musst Du per Maus den ersten Sektor (Offset 000-1FF) komplett markieren.
danach im Menü/Edit/Copy as.../Editor view; das überträgt den markierten Inhalt in die Zwischenablage; mit Strg+V in den .txt File hinten einfügen.

Die letzten vier Sektoren der HDD markieren
(oben unter der Menüzeile Symbol ">|" geht mit der Anzeige zum letzten Sektor, danach 3x "<" ) , von dort weg bis zum Ende markieren.
danach im Menü/Edit/Copy as.../Editor view; das überträgt den markierten Inhalt in die Zwischenablage; mit Strg+V in den .txt File hinten einfügen.

Den Textfile mit Datei/sichern als... in ein Arbeitsverzeichnis; am besten als Namen die vom HDTune erhobene Seriennummer wählen.
Dann löschen des textfiles, und dasselbe mit der nächsten Platte (ursprüngliches Kabel wieder anstecken, damit die nicht durcheinanderkommen!)...

Wie der Textfile für jede der 6 Platten dann aussehen soll - siehe Beispiel im Anhang
(in meinem Beispiel ist der Bereich der letzten 4 Sektoren leer, weil ich kein RAID-Volume verwendet habe)

Die 6 Textfiles dann zusammen in einen .zip packen und in den Anhang des Posts stellen.

[82nd]Hawk schrieb:
Eine Wiederbelebung halte ich für ausgeschlossen, da der Raid sich ja schon aufgelöst hat.
...
Für eine wirkliche sichere, effiziente und upgradefähige Lösung ist ein Hardware-Raid-Controller ein muss.
Pessimist darf man dabei nicht sein, und im Zusammenhang mit RAID jeder Sorte das Wort "sicher" in den Mund zu nehmen, ist genauso falsch.
 

Anhänge

Zuletzt bearbeitet:
Hi ernst, danke nochmal für die Hilfe.

Wie du mir heute früh in der PM geschrieben hast habe ich die Daten gesammelt aber:
- mit HD Tune habe ich Screenshots gespeichert von Health und Info anstatt Text
- ich habe den ersten und nur die letzten 3 Sektoren, wie in der PM, von jeder Platte ausgelesen (nicht 4)

Die ganzen Daten hänge ich jetzt mal als Anhang hier rein, evtl reicht das ja. Wenn nicht, dann mach ich es morgen nocheinmal nach deinem Beispiel. Habe heute leider keine Zeit mehr.

gruß Topdog
Ergänzung ()

@ ewndb wenn ich das Raid neu erstelle, dann wird es neu Initialisiert, dauert ca 24 Stunden und nur Gott weis was da passiert. :)
 

Anhänge

Zuletzt bearbeitet:
Wird so auch reichen - hoffe ich zumindest
Ein erster Blick drauf lässt erkennen, dass die RAID-Infos insgesamt 9 Sektoren von Ende der Platte belegen - aber das Wichtigste steht in den dreien, welche du ausgelesen hast...
Mal sehen, was die Glaskugel dazu sagt

"wenn ich das Raid neu erstelle, dann wird es neu Initialisiert, dauert ca 24 Stunden und nur Gott weis was da passiert. "
Ich weiß es auch - bei 6 Platten sind danach genau 20% der aktuellen Originaldatenänderungen seit dem Degrade mit Schrott überschrieben und eine Rekonstruktion wird mühsam und nicht mehr zu 100% möglich sein...

Ist die Stripesize nicht wie früher angegeben gewählt, oder die Plattenreihenfolge vertauscht (was, solange der RAID intakt oder degraded war, keine Rolle gespielt hat), ist der resultierende Datensalat reif für die Mülltonne.
 
Zuletzt bearbeitet:
ich wiederhole mich nur ungerne, aber mit raid5-fähiger datenrettungssoftware war es bisher kein problem ein raid auszulesen, sofern das raid nur out-of-sync war.
 
Warum 2009 Raid5 nicht mehr sicher ist:

http://blogs.zdnet.com/storage/?p=162

Statistisch gesehen erhält man pro gelesenen 12 TB einen Unrecoverable Read Error, was einen Rebuild eines Raid5 zum Abbruch führen kann. Je größer das Raid 5 also ist, desto höher wird die Wahrscheinlichkeit, dass ein Rebuild fehlschlägt. (Bei typischen Festplatten mit einer Fehlerwahrscheinlichkeit von 1 Unrecoverable Read Error pro 10^14 Bits)
 
Tja aber mit der ernst@at Methode kann das Raid so wieder hergestellt werden ohne die Daten erst in Images auf neue Platten zu schreiben. Kostenfaktor: neue Platten und die Rettungssoftware. Oder kennst Du eine Software die das ausgefallene Raid so wieder zusammensetzt und es dann wieder voll funktionsfähig ist, ohne neue Hardware anzuschaffen?

Ernst hat mir bei genau dem gleichen Problem mit 6 Samsungs 501LJ geholfen.
Seit dem weiß ich was Sichern heißt. ;)
 
mit raid5-fähiger datenrettungssoftware war es bisher kein problem ein raid auszulesen
Kennst Du eine, die nichts kostet? Ich nicht.
Die meisten dieser Tools schaffen es bloß, mit einer Performance zum Kotzen daraus ein Image zu erstellen - womit man hier eine 5TB Platte (oder 6x1TB RAID5 oder 5x1,5TB RAID5 oder 4x2TB RAID5 oder 5x1TB RAID0 oder 4x1,5TB RAID0 oder 3x2TB RAID0) und 4 Tage bräuchte
Ergänzung ()

So, ich seh mir jetzt mal die bisherigen Daten an und stell die Erkenntnisse hier nach und nach rein:

Code:
Analyzing: \\Pc10\shareddocs\Topdog RAID5\HDD0\HDD0 Sektor 0.txt

===== MBR INFORMATION ===== at LBA=0
00000001FE 55AA              Boot signature='55AA'... valid
.                            ... Partition Table entry 1 ...
00000001C2 EE                Partition Type: GUID Volume
00000001BE 00                Boot indicator: inactive
00000001BF 000200            Start CC-HH-SS:    0-001-02
00000001C3 FFFFFF            End   CC-HH-SS: 1023-256-63
00000001C6 01000000          Start    (LBA):           1 0-0-1
00000001CA FFFFFFFF          Size  (Blocks):  4294967295 266305-4-3 2097151MB 2048.00GB
.                            ... Partition Table entry 2 ...
00000001D2 00                Partition Type: unused partition entry
.                            ... Partition Table entry 3 ...
00000001E2 00                Partition Type: unused partition entry
.                            ... Partition Table entry 4 ...
00000001F2 00                Partition Type: unused partition entry

===== GPT INFORMATION =====   (at LBA= 1)          *** not found ***
Dass es sich um einen GPT-Datenträger handelt, haben wir ja schon erahnt.
Die Partitionaufteilung, welche in den folgenden Sektoren beschrieben ist, ist im Moment nicht wesentlich.

Die Auswertung der RAID-Metadaten (im Anhang) zeigt, dass die 3 Sektoren ausreichend waren - die dahinterliegenden Checkpoint-Informationen sind weniger interessant.

Muss jetzt leider unterbrechen, die abschließende Beurteilung folgt am Abend

---- wird noch ergänzt (Browser refresh nicht vergessen)
 

Anhänge

Zuletzt bearbeitet:
Zurück
Oben