RAID 1 an 3ware Escalade, degraded

mothe071171

Newbie
Registriert
Aug. 2009
Beiträge
3
RAID 1 an 3ware Escalade, degraded (reiserfsck, Testdisk)

Hallo, zusammen!

Nach Lektüre hier im Forum habe ich mich doch entschlossen zu posten, weil keiner der Beiträge so richtig zu passen scheint und ich vor dem völligen Datenverlust lieber jmd. frage, der/die sich damit auskennt...

Zur Situation:
Datenserver: SUSE Linux 10.1
Raid-Controller: 3ware Escalade 7006-2
Festplatten: 2x SAMSUNG 300GB P-ATA
RAID: 1
Partitionen: 2 Gb Linux Swap, 20 GB für Betriebssystem (ReiserFS 3.6 mit normalem Journal), Rest für Daten (ebenfalls ReiserFS 3.6)

Das Problem:
Eine von beiden Festplatten ist wegen Elektronikfehlers komplett vollständig hardwaremäßig nicht mehr vorhanden/ansprechbar. Ich habe also nur eine Festplatte aus dem RAID 1-Verbund übrig, auf der sich in der Datenpartition meine Daten befinden (hoffentlich!?).

Was ist bisher geschehen:
- Nach stundenlangem E-Mail-Schriftverkehr mit der Technik-Hotline des Herstellers ist die verbliebene Platte zumindest ohne RAID-Controller ansprechbar. Dazu habe ich auf Anweisung der Hotline mittels eines kleinen Programms ein Logfile erstellt und diese mir daraus ein Skript, das per DOS-Bootdiskette (anscheinend) die Platte zurückgesetzt hat. Die Platte hängt jetzt per externem USB-Gehäuse am PC. Über den 3ware-Controller ist sie jetzt nicht mehr ansprechbar. Muss lt. Hotline so sein.
- Mit den Programmen R-Studio (Testversion), SpinRite 6 und Testdisk habe ich die verblieben Platte mal getestet, mit folgendem Ergebnis:
1. R-Studio und SpinRite 6 finden Daten. Von der jeweilgen Grafik ("Fortschrittsbalken", Blöckchen-Grafik für sektorenweises Lesen) her allerdings nur auf den ersten beiden Partitionen. Die Daten-Partition scheint leer zu sein.
2. Testdisk zeigt alle drei Partitionen an, und zwar einmal "normal" und einmal als "RAID". Ich vermute, das liegt daran, dass die Platte Teil eines MIRROR war. Außerdem erscheint eine Fehlermeldung, dass dem partition sector die Endmarke fehlt (das schreibe ich mal dem Skript des Herstellers zu).

Screenshots habe ich beigefügt.

Was habe ich schon gemacht:
1. Mit dd eine bitweise Kopie der Festplatte auf eine freie Partition einer anderen Platte angefertigt.
2. Mit Testdisk habe ich auf Anweisung der Hersteller-Technik die drei "normalen" Partitionen als Primär wieder hergestellt.
3. Unter Suse habe ich reiserfsck --check über alle die beidenReiserFS-Partitionen laufen lassen. Das Dateisystem soll ok sein.
Außerdem habe ich auf der Datenpartition reiserfsck --rebuild-sb laufen lassen. Im Ergebnis findet er auf der Partition jetzt einen Profilordner, der bei der Einrichtung des Systems Ende 2006 mal angelegt worden ist. Mehr allerdings nicht. Die Ordner mit den Daten sind nach wie vor weg.

Im Moment stehe ich - nachdem ich jetzt etwa 1,5 Wochen keinen Zugriff auf meine Daten mehr habe - vor der Frage, was weiter zu tun ist:

1. Mit Testdisk ein Image erstellen und hoffen, dass es die Daten in der wiederhergestellten Datenpartition findet (dazu müsste ich mir noch eine Festplatte kaufen gehen, ist aber kein Problem...)
2. Mit reiserfsck --rebuild-tree den Verzeichnisbaum wieder auf die Festplatte zwingen.

Um nicht mehr kaputt zu machen als zu heilen, bitte ich Euch um Eure Hilfe. Ich bin langsam etwas ratlos - und der Hotline gehen auch die Ideen aus (manchmal denke ich, der Kollege aus den USA weiß auch nicht so genau, was er mir da rät...)

Ich danke Euch schon mal im voraus....

Gruß

Marc

P. S. Ergänzung:
1. Beim Versuch, unter Testdisk die Files in einer Partition anzeigen zu lassen, erhalte ich eine Fehlermeldung (sinngemäß: "glibc found, double index") und das Programm bricht ab.
2. Ich habe offenbar Zugriff auf die ehemalige Betriebssystem-Partition - ich denke, das könnte hilfreich sein?
Ergänzung ()

So, da wäre denn zur Ergänzung auch die komplette Fehlermeldung zum Listen der Dateien...

Gruß

Marc
 

Anhänge

  • Unbenannt4.jpg
    Unbenannt4.jpg
    67,6 KB · Aufrufe: 417
  • Unbenannt5.jpg
    Unbenannt5.jpg
    52,3 KB · Aufrufe: 403
  • Unbenannt8.jpg
    Unbenannt8.jpg
    81,9 KB · Aufrufe: 394
  • Unbenannt9.jpg
    Unbenannt9.jpg
    79,5 KB · Aufrufe: 379
  • unbenannt10.jpeg
    unbenannt10.jpeg
    69,1 KB · Aufrufe: 375
Zuletzt bearbeitet:
Ich verstehe nicht, warum nicht mit einer Disk weiter gearbeitet wurde! Bei RAID1 wird gespiegelt und abgesehen von Quorum sollte bei einer def. Disk eine Funktion gegeben sein. Das nicht erfüllte Quorum kann man i. d. R. als Administrator überschreiben, ein Fullbackup wäre dann möglich gewesen. Was der Support da nun fabriziert hat, ist mir nicht klar, zumal jetzt ja wohl keine Daten mehr im Zugriff sind.

R-Studio sollte, wenn keine Schreibzugriffe auf die verbliebene Disk erfolgt sind (der oberste Grundsatz bei der Datenrettung!), alle Daten anzeigen können. Bei dem Scan mit einem Datenrettungstool sollte die Disk und nicht evtl. angezeigte Partitionen gescanned werden.

Auch ist darauf zu achten, dass das Datenrettungstool Dein verwendetes Filesystem unterstützt.
 
Hallo!

Vielen Dank für die Antwort ...

Hm, ja, dass ich einfach weiter arbeiten kann, dachte ich - eigentlich - auch. Leider war aber weder von Suse noch von Windows aus ein Zugriff auf die Daten möglich.

Was die Software angeht:

So weit ich weiß, kann ReiserFS zumindest von SpinRite und Testdisk gelesen werden. Bei R-Studio sind nur ext2/3/4 drin.

Leider wurde auf die Disk geschrieben (denke ich): nämlich von dem Skript des technischen Supports. Wiederum leider hat mir der Techniker bis heute nicht verraten, was das Skript anrichtet, obwohl ich mehrfach gefragt habe. Ein UNDO (sagt er) ist allerdings nicht möglich ...

Mal abgesehen davon, dass es im Moment so ist wie es ist:

1. Welchen Grund könnte es haben, dass die Datenordner im Filesystem fehlen, obwohl das Journal und der Superblock anscheinend auf der Platte vorhanden sind?
2. Gibt es eine Möglichkeit, in den Daten auf der ehemaligen Betriebssystempartition nachzuschauen, wo evtl. der Fehler liegen könnte?
3. Wenn das nichts hilft: Hat es Sinn, mit reiserfsck den Verzeichnisbaum wieder herstellen zu lassen?

Vielen Dank im voraus!

Gruß

Marc
 
Ohne ein Image der Disk / Partition solltest Du nicht schreibend auf die Disk zugreifen und ein Reiserfsck wird sicher ins Filesystem schreiben.

Du kannst Dir auch die andere Disk des RAID vornehmen, denn da wurde wahrscheinlich noch nicht manipuliert.

Man könnte im Syslog versuchen der Ursache nachzugehen, nur wird es Dich wohl nicht weiter bringen, denn was nützt es Dir zu wissen wie es passiert ist, wenn Du doch nichts rückgängig machen kannst.

Datenrettungstools scannen alle Blöcke der Disk und rekonstruieren die Daten nach Möglichkeit, ohne über die Verwaltung des Filesystems zu gehen. Also das, was Du via Testdisk 'siehst' ist ohne Belang für z. B. R-Studio. Testdisk ist primär ein Tool um eine verloren gegangene Partitionierung wieder herzustellen. Wenn R-Studio oder ein vergleichbares Tool nichts findet, ist die Disk aller Wahrscheinlichkeit überschrieben worden.
Führe doch mal einen Scan mit einen Datenrettungstool, welches ReiserFS supportet, aus und sieh Dir das Ergebnis an!
 
GELÖST RAID 1 an 3ware Escalade, degraded

Hallo, zusammen!

Nach ein paar Tagen Abwesenheit teile ich hiermit mit, dass mein Problem mittlerweile gelöst ist - alle verloren geglaubten Daten sind wieder da ...!:)

Wie habe ich es gemacht/Woran lag´s?!

- Ich habe die Controller-Platinen der beiden Festplatten getauscht - siehe da: die defekte Platte funktioniert wieder.
- Über die nunmehr wieder funktionierende Festplatte habe ich Testdisk laufen lassen.
- Im Ergebnis wurden diverse - teilweise in der Vergangenheit beim Partitionieren mal angelegte und dann beim Neu-Partitionieren wieder gelöschte - Partitionen gefunden. Eine davon: Meine Daten-Partition!
- Partition mit Testdisk wieder hergestellt.
- Daten-Partition auf neue externe Festplatte geclont (zur Sicherheit, man weiß ja nie).
- Server neu aufgesetzt und Daten wieder eingespielt.

So weit so gut. Wieso allerdings auf der zweiten Platte im Hardware-Raid 1 offenbar weder die Partitionen noch die Daten je drauf waren, ist mir ein Rätsel. Der Escalade-Controller hat jedenfalls nie auch nur einen Fehler gemeldet (natürlich bis der Festplatten-Controller abgeraucht ist).
Da hätte ich lange nach Daten fahnden können ...

Wahrscheinlich werde ich nicht rausfinden, woran es lag, um anderen mit der Antwort zu helfen.

Jedenfalls bin ich froh, dass noch alles da ist.

Gruß

Marc
 
Du solltest die Disk nach dem Umbau der Drive-Electronic nicht so weiter laufen lassen, dieser Workaround ist nur zum Daten retten ein gangbarer Weg. In der Drive Electronic sind vielfach Drive-Mechanic spezifische Daten gespeichert! So wäre der nächste Ausfall vorprogrammiert und Dir wird noch schleierhafter warum dann wieder eine Disk Probleme macht.
 
Zurück
Oben