Raid 5 - Fehler bei der Konfiguartion

SMOKY_2

Cadet 3rd Year
Registriert
Nov. 2011
Beiträge
35
Hallo,

ich habe heute einen Totalausfall des Systems produziert und vermutlich einen Fehler
bei der RAID Konfiugaration gemacht.
Vielleicht hat jemand eine Idee, wie ich die Daten noch retten könnte.
Folgendes hat sich ereignet:

Es handelt sich um einen Windows Server mit 4 x 300 GB SAS PLatten die im RAID 5-VErbund sind.
(Hardware Raid)
Diese Woche sind 2 PLatten ausgefallen.
Beim Neustart des System waren zwei Platten foreign und ich konnte das System über
"import foreign configuration(s) and continue" wieder zum Laufen bringen.
Es hat ein Platte Orange und eine Orange/grün geblinkt, so dass ich davon ausgehe, dass nur eine Platte defekt ist.
Nun habe ich schnellstmöglich neue Platten bestellt und die orange blinkende Platte ausgetauscht.
Beim Neustart hat er eine Fehlerhafte Raid Configuration gemeldet und ich habe versucht
über import foreign configuration(s) and continue das System zum Laufen zu bringen.
Der Import wurde abgebrochen (error) so dass ich das SYstem heruntergefahren habe und die alte Plattenkonfiguartion wieder eingebaut habe. Nun musste ich wieder die "foreign configuration(s) and continue." importierend. Danach wurde das Os nicht mehr gefunden. NUn weiß ich nicht mehr weiter. Nach erneutem Neustart sind wieder zwei Platten "foreign".
Meine Vermtung ist, dass ich von den zwei Platten vielleicht die noch Laufende anstelle der komplett defekten austauscht habe. Dann anstelle die neue Platte zu rebuilden die configuration importiert habe.
Aufgrund eines Fehler im Dateisystem der zweiten Platte wurde die tägliche Sicherung abgebrochen und es wäre eine
Woche ARbeit defekt.
Über ein paar Tipps wäre ich froh, weiß momentan einfach nicht weiter.

Viele Grüße


Smoky
 
Mehr Details zum Raid Controller bitte.-Hersteller, Firmware.
OS
 
Was für ein Server und Raidcontroller ist es denn?

Ich vermute mal Folgendes:

Vier Platten, zwei Grün, eine Grün/Orange, eine Orange. Rot gibt es nicht, oder? In dem Fall ist Orange kaputt und Grün/Orange ein predictive Failure / SMART Fehler.
Du hättest zuerst Orange austauschen und beten müssen, dass Grün/Orange den Rebuild überlebt. Dadurch, dass du dem System Grün/Orange weggenommen hast fehlte dem Raid 5 zwei seiner vier Platten und das setzt das Array von Degraded auf Failed. Die Daten kriegst du aus dem Array nicht mehr wieder.
 
naja da gibts zum Glück noch ne Lösung.

1TB SSD kaufen, einbauen, Backup zurückspielen und freuen, dass das Sys schneller wie vorher ist....

Was für ein System ist das denn?
 
RAID-Controller ist PERC 6/i RAID CONTROLLER
(Dell T610)
Problem ist, dass aufgrund des Festplattenfehlers die Datensicherung nicht mehr funktioniert hat.
Somit fehlt ein Teil seit meiner Letzten PRüfung letzte Woche, dort ist die Sicherung nocht gelaufen.
Ich bin nicht täglich am System.
Ergänzung ()

Ich habe auch keine Rebuild durchgeführt, sondern lediglich die foreign configuartion importiert
Ergänzung ()

Noch ein Hinweis:

System ist ein Dell T610 mit Windows SBS
BAckup Acronis 10 SBS

DANKE für eure Hilfe
 
Der Import einer Foreign Configuration ist nicht so sehr das Problem. Das hätte man im Zweifelsfall wieder korrigieren können, denn wenn das Array heile ist, dann erkennt das Controller das jederzeit wieder und würde das wieder importieren.
Unter meiner oben beschriebenen Annahme hattest du zwei ausgefallene Platten in deinem Raid 5 und damit hat sich das dann erledigt. Und das ist das eigentliche Problem, denn einen Ausfall hätte das Array verkraftet, zwei aber nicht. Auf den Platten ist jetzt nur noch Datensalat, du wirst dann wohl mit der Sicherung von letzter Woche leben müssen.

Es gibt eine theoretische zweite Lösung:
Unter der Annahme, dass die noch funktionierenden Platten nicht in Mitleidenschaft gezogen wurden und die blinkende Platte noch lebt könnte man das Array wieder zusammen bauen, wenn es ein professionelles Unternehmen schaffen würde dir ein Image deiner toten Platte zu ziehen. Wenn man das dann auf eine neue Platte bringt, dann könnte man den Controller das Array wieder zusammensetzen lassen.
Aber, wie gesagt, nur eine theoretische Lösung. Dazu müssen erst alle Voraussetzungen erfüllt sein und du müsstest ein paar hundert bis tausend Euro locker machen für die Datenrettung. Und da ist auch noch mal eine gehörige Unsicherheit mit im Spiel.
 
Hallo, hört sich ja leider nicht wirklich erfreulich an.
Nun hätte ich allerdings noch eine Frage:
Es gibt ja neben den zwei funktionierenden Platten, die akutell im Raid sind noch
die "halb" funktionierende Platte. Normalerweise müsst dort doch die RAID-Struktur noch
erhalten sein.
Diese Platte wird aktuell als foraign angezeigt. Ich hatte überlegt,
ob ich noch einen Versuch unternehmen soll, diese configuration zu importieren.

Viele Grüße

Smoky
 
Wenn der Controller seine "eigene" Platte als foreign erkennt, dann weißt du, dass da auch irgendwas nicht mit stimmt. Festplatten toggeln auch gerne mal, d.h. sind mal online und dann wieder nicht. Diese Platte ist in der Vergangenheit sicher schon mal aus dem Array gedroppt, vielleicht auch schon bevor du sie austauschen wolltest. Theoretisch hast du Recht, praktisch sehe ich da aber auch eher schwarz.
 
Wenn die Platten vorher ordentlich im RAID liefen und nicht überschrieben worden sind (etwa weil da ein Re-Sync falsch gelaufen ist o.ä.) und noch funktionieren, kannst du auch wieder an deine Daten kommen. Nur ist das (Hand)Arbeit, wenn der RAID-Controller selbst die Arbeit verweigert und du das z.B. unter Linux mit mdadm Software-RAID nachstellen musst, hast du ein Puzzle bei dem du die Variablen nicht kennst (Plattenreihenfolge, Chunksize, Offset, ...). Wenn du wirklich gut weißt wie RAID unter der Haube funktioniert [und wenn du Linux als Werkzeug benutzt dich auch mit Linux gut auskennst], dann kannst das wieder hinbiegen. Erst wenn zwei Platten ganz futsch sind, oder eben was überschrieben wurde, ist endgültig vorbei.

Damit das mit Linux funktioniert müssen die Platten direkt angeschlossen sein und nicht von einem HWR-Controller versteckt werden, auch nicht als virtuelle RAID-0/JBOD wo dann doch ein Stück fehlt oder doch wieder was auf der Platte überschrieben wird.

Ansonsten musst du dir jemanden suchen der deinen HWR-Controller sehr genau kennt bzw. den Hersteller anschreiben.
 
Hallo Leute,

vielen Dank für die Tipps. Habe gestern nochmals den ganzen Tag gekämpft.
Über Bios konnten wir die offline-Platte online-zwingen. Daraufhin hat der RAID-Controller
das RAID wieder erkannt. Die Partitionen sind nun wieder da :) und aktuell laufen alle Platten wieder.
OS wurde erkannt, aber mit Fehlern, woraufhin ich windows über den Datenträger reparieren habe lassen. (Lief 5 h)
Danach hatte ich ein Problem, Windows startet chkdsk für den Datenpart und bricht bei 70 % ab. Lässt sich auch
nicht wie beschrieben über betätigen einer Taste umgehen.
Nun habe ich sicherheithalber über Acronis Rettungsdatenträger die Daten von der Datenpartition sichern lassen und
hoffe, dass die Daten einigermaßen lesbar sind. Die Größe passt, aber der Sicherungsvorgang läuft noch.

Kann mir jemand einen Tipp geben, wie ich chdsk umgehen kann?
 
Das Problem ist - dein NTFS Filesystem hat ein Dirty Flag. Evtl. mit Linux booten und NTFS3g versuchen dieses zu resetten derweil.
Ich würde es aber nicht empfehlen.
 
Zurück
Oben