RAID 5 Array FAILED

dann muss das seltsame Verhalten einen anderen Grund haben - ich liebe solche Rätsel.

Jedenfalls haben wir jetzt eine Patt-Stellung.
Die 4. 500er ist vom Ersatz-System belegt.
Wir haben zwei 500er Member, die wir noch unbedingt für die Rekonstruktion brauchen. Falls da eine davon auch noch irgendeinen Schaden hat, brauchen wir auch noch den Dateninhalt von der dritten rausgefallenen, zur Not sogar auf eine andere kopiert.
Um den RAID wieder zumindest in den degraded-Status zu zwingen, damit wir die Daten runterholen können, brauchen wir noch eine mindestens 500GB große für einen Augenblick.
Das wäre zwar mit der 1TB machbar, aber der Controller merkt sich diese Seriennummer.
Also bliebe nur, die 1TB dann zum Sichern des degraded RAID5 anschließend an den jMicron (lila Anschlüsse) zu hängen. Beim kleinsten Fehler auf einer der beiden verbliebenen Memberplatten wären wir aber im Arsch, weil der Controller dann wieder auf "failed" geht und das dann alles wiederholt werden muss.

Irgendwie wird das schon klappen.
Sehen wir uns mal die Platten der Reihe nach an.
Was hängt derzeit an den lila Anschlüssen?
 
'tschuldigung, dass ich jetzt dazwischenquatsche ;)
Mal um es zu verstehen:
Sollte der Controller nicht, wenn eine Festplatte ausfällt ersteinmal in den degraded-Modus gehen? Da ließen sich die Daten ja noch auslesen, auch wenn keine 3. Platte vorhanden ist auf die ein rebuild gehen könnte.
 
prima.
Dann häng mal die beiden noch-Member Platten von Port0 (Serien-Nr 5QM3CEDW) und Port2 (Serien-Nr 6QM0K6ZW oder so ähnlich) an die lila Anschlüsse, im BIOS stellst Du den onboard-GSATA Controller auf IDE Mode.
Bei einer der beiden Platten ziehst Du den Stromstecker, sonst setzt Win7 eine der beiden Offline, weil sie die selbe Datenträgerkennung haben.

Dann zeig mal das neue Bild der Datenträgerverwaltung.
Achtung! Will Win7 eine der Platten initialisieren - Ablehnen!
läuft chkdsk(Datenträgerüberprüfung) automatisch nach dem Boot an, sofort per beliebigem Tastendruck (zur Not Power-off, wenn es auf USB-Tastatur nicht reagiert) abbrechen
Ergänzung ()

JensS. schrieb:
'tschuldigung, dass ich jetzt dazwischenquatsche ;)
Mal um es zu verstehen:
Sollte der Controller nicht, wenn eine Festplatte ausfällt ersteinmal in den degraded-Modus gehen? Da ließen sich die Daten ja noch auslesen, auch wenn keine 3. Platte vorhanden ist auf die ein rebuild gehen könnte.
Ja, normalerweise....
aber es gibt Ausnahmen - wenn der Controller zB die Nerven wegschmeißt, weil auf den verbleibenden Members auch read-errors(bzw damit verbundenes viele Sekunden dauerndes delay durch die Korrekturversuche der Platte selbst) auftreten.
Im Gigabyte-Forum gab es mal einen ähnlichen Fall, da hatte eine der Platte einfach nur einen Wackelkontakt am Power-Anschluss. 1. Aussetzer - degraded; wieder da - rebuild springt an; 2. Aussetzer: failed.
Hier könnte der Aussetzer durch den SMART-Incident im falschen Moment iniitiert worden sein...

Kann man erst nach Auswertung der Metadaten, wenn überhaupt, erkennen. Manchmal lässt sich das nicht klären, dann schieb ich es auf einen Treiberfehler :p
 
Zuletzt bearbeitet:
gesagt, getan

anbei der Screenshot
 

Anhänge

  • Datenträgerverwaltung02.jpg
    Datenträgerverwaltung02.jpg
    287,5 KB · Aufrufe: 390
soweit, sogut.
Auf Datenträger 0 haben wir die rausgefallene,
auf Datenträger 2 eine der Memberplatten - die hat einen MBR drauf.

jetzt werden wir ein wenig hexen...

- den Hex-Editor HxD von hier in der englischen Version. Damit nicht herumexperimentieren, damit die Defaulteinstellungen erhalten bleiben.

Im HxD sind die physical hard disk Nummern um 1 höher als im Disk Management angezeigte Datenträgernummern

Den MBR von einem RAID-Member sichern wir erst mal, bevor wir ihn modifizieren, damit das Win7 nicht wegen gleicher Datenträgerkennung verwirrt wird und wir die dritte Platte auch anschließen können.

HxD Aufruf unter User mit Administratorrechten (oder per Rechtsklick mit ausführen als...)
========= Überprüfen der Anzeigeeinstellungen, bei Bedarf richtigstellen
- Menü: Extras/Options.../View
Bytes per row: 16
Byte Group size: 1
Charset: ANSI
Offset-base: hexadecimal

- Menü: Extras/open disk/physical disk/hard disk 3 (Häkchen bei "open as readonly" NICHT entfernen)

========= Sichern MBR = Sektor 0
- Menü: Edit/select block/start-offset: 0 , length: 200, hex, OK
- Strg+C (überträgt den markierten Inhalt in die Zwischenablage)
- Menü: File/New (es erscheint in der Anzeige ein zweiter Reiter "untitled1")
- Strg+V (überträgt den Inhalt aus der Zwischenablage) im popup "file size change": OK
- Menü: File/Save as... einen Ordner auswählen und als Dateinamen "MBR1.bin" /speichern
- Menü: File/Close

========= extrahieren Sektor 0
- Menü: Edit/select block/start-offset: 0 , length: 200, hex, OK
- Menü: Edit/copy as.../ editor view (überträgt den markierten Inhalt in die Zwischenablage)
- Menü: File/New (es erscheint in der Anzeige ein zweiter Reiter "untitled2")
- in das kleine punktierte Rechteck rechts unter der mit "... 0E 0F" endenden Zeile klicken
- Strg+V (überträgt den Inhalt aus der Zwischenablage) im popup "file size change": OK
- Menü: File/Save as... einen Ordner auswählen und als Dateinamen "Member1.txt" /speichern
- Menü: File/Close
- HxD beenden


Die erzeugten Dateien gezippt in den Anhang
 
das Erzeugen des Member1.txt Files hat nicht so geklappt, wie geplant.
offenbar hast Du das nicht genauso wie es dasteht durchgeführt

- in das kleine punktierte Rechteck rechts unter der mit "... 0E 0F" endenden Zeile klicken

ist jetzt nicht notwendig, zu wiederholen - aber in Zukunft von essentieller Bedeutung. Wird noch genug Gelegenheit geben, das zu üben :)

so sieht der MBR des RAID5 aus:
Code:
Analyzing: \\Pc10\shareddocs\datacore0815 RAID5\Member1.txt

===== MBR INFORMATION ===== at LBA=0
000001FE 55AA                Boot signature='55AA'... valid
.                            ... Partition Table entry 1 ...
000001C2 07                  Partition Type: NTFS
000001BE 80                  Boot indicator: *** ACTIVE ***
000001BF 010100              Start CC-HH-SS:    0-002-01
000001C3 FEFFFF              End   CC-HH-SS: 1023-255-63 (not CHS addressable)
000001C6 3F000000            Start    (LBA):          63 0-1-0
000001CA 8DF2340C            Size  (Blocks):   204796557 12747-254-0   99998MiB   97.65GiB
.                            ... Partition Table entry 2 ...
000001D2 0F                  Partition Type: Extended Partition, Ext. INT 13
000001CE 00                  Boot indicator: inactive
000001CF 00C1FF              Start CC-HH-SS: 1023-001-01
000001D3 FEFFFF              End   CC-HH-SS: 1023-255-63 (not CHS addressable)
000001D6 CCF2340C            Start    (LBA):   204796620 12748-0-0
000001DA 34283B68            Size  (Blocks):  1748707380 108852-0-0  853861MiB  833.85GiB
.                            ... Partition Table entry 3 ...
000001E2 00                  Partition Type: unused partition entry
.                            ... Partition Table entry 4 ...
000001F2 00                  Partition Type: unused partition entry

Nächster Schritt: Ändern der Datenträgerkennung im MBR

HxD Aufruf unter User mit Administratorrechten (oder per Rechtsklick mit ausführen als...)

- Menü: Extras/open disk/physical disk/hard disk 3 (diesmal das Häkchen bei "open as readonly" wegmachen)

========= Ändern Datenträgerkennung
- Menü: Edit/select block/start-offset: 1BB , length: 1(über das bestehende drübertippen), hex, OK
- an der markierten Stelle tippst Du 40 ein - das erscheint dann rot; falls popup "file size change" kommt - Abbrechen (HxD beende, Änderungen nicht speichern)
- Menü: File/Save (schreibt die Änderung zurück auf die Platte)
- HxD beenden


danach kannst Du nach power-off die zweite Memberplatte anschließen, wieder hochfahren, Bild der Datenträgerverwaltung.
von beiden Memberplatten mit HDTune die Info - und Healthdaten (je 1 File mit Info+Health derselben Platte)
 
Zuletzt bearbeitet:
So richtig weitermachen kann ich erst am Nachmittag. Vielleicht schaff ich die nächste Anweisung schon vorher, die anschließende Auswertung aber erst, wenn ich wieder zu Hause bin.
Ergänzung ()

irgendwie nicht ganz das, was ich mir vorgestellt hätte:
in der Datenträgerverwaltung sollten jetzt alle drei Platten vom RAID (plus der Systemplatte) zu sehen sein.
Sind die beiden noch-Member-Platten beide an den lila Anschlüssen und haben Saft?
 
Habe bei der ersten Member Platte den Stromstecker rausgezogen.
Wenn ich zuhause bin werde ich beide ansetzen über die beiden Lila Stecker.
Und noch mal einen Screenshot der Datenträgerverwaltung zusenden
 
Sieh in der Datenträgerverwaltung nach, welche Datenträgernummer die drei RAID-Platten haben. diese sind im HxD um eins höher als physical disk anzusprechen.
Wenn die also Datenträger 0/2/3 sind, dann im HxD eben 1/3/4 auswählen und unten bei x einsetzen

HxD Aufruf unter User mit Administratorrechten (oder per Rechtsklick mit ausführen als...)

- Menü: Extras/open disk/physical disk/hard disk x (Häkchen bei "open as readonly" NICHT entfernen)
========= extrahieren Sektor 0
- Menü: Edit/select block/start-offset: 0 , length: 200, hex, OK
- Menü: Edit/copy as.../ editor view (überträgt den markierten Inhalt in die Zwischenablage)
- Menü: File/New (es erscheint in der Anzeige ein zweiter Reiter "untitled1")
- in "untitled1" in das kleine punktierte Rechteck rechts unter der Überschriftszeile 'Offset(h) ... 0E 0F" klicken
- Strg+V (überträgt den Inhalt aus der Zwischenablage) im popup "file size change": OK
- den Cursor an der Endposition belassen, nicht in der Anzeige herumklicken!
========= extrahieren maxLBA-4 (RAID-Metadaten)
- auf Reiter "hard disk x" klicken
- in der Menüzeile rechts auf den Button >| drücken, danach < drei Mal klicken (um zum viertletzen Sektor zu kommen)
- Menü: Edit/select block/(den eingetragenen Start-Offset belassen) length: 800, hex, OK
- Menü: Edit/copy as.../ editor view (überträgt den markierten Inhalt in die Zwischenablage)
- Reiter "untitled1" anklicken
- Strg+V (überträgt den Inhalt aus der Zwischenablage) im popup "file size change": OK
- Menü: File/Save as... einen Ordner auswählen und als Dateinamen "physicalx.txt" /speichern
- HxD beenden

Das gleiche wiederholst Du mit den anderen beiden Platten
Danach alles zippen und in den Anhang stellen
 
Zuletzt bearbeitet:
Darf es mit der Auswertung und weiteren Vorgangsweise bis morgen warten? Ich hab mich bei einer anderen RAID5-Wiederherstellung hier bei Mr_Smith gerade totgelacht
 

Anhänge

Zuletzt bearbeitet:
ich habe mir die angehaengten Dateien gerade angeschaut, und habe gesehen das etwas ausgwertet wurde. Wie sieht es aus ?
 
Ich hab das in der früh reingestellt, damit ich es mir selbst tagsüber unterwegs mal ansehen kann.

Auf der ersten Platte ist der MBR drauf, im Basis-Format, wo ich nur eine aktive primäre Partition von 100GB, die den Grenzen nach unter XP angelegt worden sein muss und den Rest als Erweiterte Partition sehe. Du schreibst aber, da war ein Vista drauf.

In den RAID-Metadaten von physical3 und physical4 stehen idente Informationen, welche eine Plattenreihenfolge
HDD[0] <Serial=5QM3GEDW> zuletzt an Port0 vom Raid erkannt, jetzt am jMicron
HDD[1] <Serial=5QM13MDG:0> während des Rebuilds abgesprungen, hängt jetzt noch am Port 1
HDD[2] <Serial=6QM0KGZW> zuletzt an Port2 vom Raid erkannt, jetzt am jMicron
ausweisen; die Anschlussreihenfolge wurde daher seit Erstellung des RAID nicht verändert.


Die rausgefallene Platte gibt vorerst noch Rätsel auf.
(wird fortgesetzt)
 
Was mich an der rausgefallenen verblüfft - Die beiden anderen wurden mit der Intel Version 1.2.02 erstellt - auf der rausgefallenen befindet sich aber die Versions-Kennung 1.0.0
Derartige Konstellationen treten normalerweise dann auf, wenn im Zuge eines BIOS-Checks eine alte BIOS-Version als Recovery aus dem Hut gezaubert wird, oder wenn die Platte an einem anderen Board mit einer Uralt-RAID-BootROM-Version behandelt wird.

Hast Du die rausgefallene Platte derart an ein anderes System gesteckt?
 
Also die rausgefallene Platte lief die ganze Zeit über in dem gleichen System. Hmmm merkwürdig....
 
Mir ist ja schon viel untergekommen - BIOS Recovery auf alte Version, die mit den neuen Versionsinformationen nichts angefangen hat, Verweigerung beim Boardwechsel, Versteckspiel der Metadaten durch das vom BIOS ungefragt angelegte Backup, wenn auf einer Platte mit darauf befindlichem Backup das BIOS plötzlich eine andere Platte viel attraktiver findet und auf derr RAID-Platte die HPA wegnimmt, worauf die Metadaten zu tief auf der Platte statt am Ende liegen...
Aber das habe ich noch nicht gesehen - man erlebt immer wieder Überraschungen. Muss aber jetzt bei diesem Fehler so draufgeschrieben worden sein, wenn die Platte die ganze Zeit da hing.

Nun - die Schritte zur Behebung sehen so aus - Du willst den RAID5 ja sowieso auflösen.

- Sichern des Array-MBR's und des Sektors 0 der zweiten Platte
- Rücksetzen aller drei Platten auf non-RAID
- Neudefinition des RAID5-Arrays mit gleichen Parametern und allen 3 Memberplatten
(wenn der Controller wegen der gemeldeten SMART-Incidents die Platte ablehnt, schalten wir den SMART-Support einfach ab)
- Rausnehmen der kaputten Platte aus dem Verbund und hochfahren im degraded Mode
- Rückspielen des MBR und des ersten Sektors des ersten Stripes der zweiten Platte
- Überprüfen der Filesystemstruktur
- Sichern der Daten vom Array auf die 1TB-Platte, so daß Du auch vom System drauf booten kannst
- Auflösen des RAID5, die beiden Platten kannst Du gleich als Backup verwenden (entweder als Einzelplatten, RAID0 oder dynamischen Cluster für ein großes Volume)
- Daten von der kaputten Memberplatte entfernen, Herstellertest zum Nachweis für Garantietausch

Ich hoff, ich hab nichts vergessen...

zur Sicherheit mach noch einmal einen Screenshot von der Datenträgerverwaltung, auf dem alle 4 Platten sichtbar sind.
 
Ich kann doch die 2 Platte(HDD2) einfach abklemmen oder ?
(In der DV ist es Datenträger 1)
Damit habe ich den Rechner gerade hochgefahren.
Es ist der Datenträger auf dem Windows 7 installiert ist.

Die 1 TB Backup Platte ist nicht angeschlossen.

Anbei ein Screenshot der derzeitigen Datenträgerverwaltung
und die Sicherungen des Sektor 0 von HDD1, HDD3, HDD4
Das sind die Platten vom Raid Array.

Im Raid BIOS gehen dann wie folgt vor
1)
Punkt 3. -> Reset Disks to Non-Raid

2)
Kann ich direkt danach das Raid neu erstellen oder muss ich danach auf
Punkt 2. -> Delete Raid Volume ???

3) Nachdem ich das Raid neu erstellt habe, den Rechner ausschalten und die
defekte Platte rausnehmen

Danach sollte der Rechner mit Windows Vista hochfahren ?

Hab ich das so richtig verstanden ?
 

Anhänge

  • HDD1_S0.zip
    HDD1_S0.zip
    1,3 KB · Aufrufe: 285
  • IMG_0036.JPG
    IMG_0036.JPG
    129,2 KB · Aufrufe: 319
Zurück
Oben