Raid 5 Array FAILED - "Episode 2"

  • Ersteller Ersteller Mr_Smith
  • Erstellt am Erstellt am
M

Mr_Smith

Gast
Servus,

hab fast das gleiche Problem wie datacore0815 hier: https://www.computerbase.de/forum/threads/raid-5-array-failed.754776/

Ich hatte eine Platte für ein (Achtung: Ironie) Backup an den externen FireWire Port gesteckt (hab dies schon zig mal an den FireWire Port des Frontpanels gemacht, ohne Probleme. Aber der hintere läuft wohl über den JMicron Chip).

Daraufhin meldete mir der RST den Ausfall einer Platte des Raid5 Arrays. Hab die externe Platte gleich wieder getrennt. Der Intel RST bot mir ein Rebuild an, was aber nach ca 1 Min. fehlschlug (System war in dieser Zeit arg laggy). Dann bot er mir an, die Platte auf "Normal" zurückzusetzen, was auch nichts brachte. Danach wurde die Festplatte nicht mehr erkannt.

:watt:

Habe mir zwischenzeitlich eine neue Ersatzplatte besorgt. Diese wird vom RST erkannt, lässt sich aber nicht für ein Rebuild zuweisen. Die Platte welche vom RST herausgesprungen ist, wird mittlerweile wieder erkannt, allerdings auch nur als Non-Member.

Der neueste Witz ist, als ich gestern meinen PC startete, erkannte der RST die abgesprungene Platte als einen 2. Raid5 Verbund "taDisk / Raid5:1" (mein Raid Verbund trägt den Namen "DataDisk / Raid5"). Das ganze verwirrt den ICH7R wohl sehr, da der PC mit allen 3 angeschlossenen Platten nun sehr zäh startet. Der RST meldet dann außerdem "RST arbeitet nicht".

:utpulsegun:

Meine Specs:

Mainboard: Asus P5W-DH Deluxe (Bios 3001)
http://www.asus.com/product.aspx?P_ID=m4cR4iaPdABNLtQa
Raid-Controller #1: Intel ICH7R (Intel® Rapid-Storage-Technik v9.6.0.1014) http://downloadcenter.intel.com/Detail_Desc.aspx?agr=Y&DwnldID=18859&lang=deu
http://www.win-lite.de/wbb/index.php?page=Thread&threadID=3141
Raid-Controller #2: Jmicron JMB36x (JMB36X_WinDrv_R1.17.55_WHQL) ftp://driver.jmicron.com.tw/jmb36x/XP_Vista_Win7/
System: Vista Ultimate 32bit (läuft im Raid1-Verbund an den 2 Asus EZ-Raid Ports auf 2 WD 500gb Platten)
Festplatten des Raids: 3x WD Caviar Green 1TB Mod. WD10EACS http://www.wdc.com/de/products/products.asp?DriveID=336
Verfügbare Ersatz-Festplatte: 1x WD RE3 1TB Mod. WD1002FBYS http://www.wdc.com/de/products/Products.asp?DriveID=503


Problem-Raid:

Typ: Raid5
Name: DataDisk / Raid5
Strip Size: 64kb
Hauptarray: Array_0000
HD 1: WDC WD10EACS-00ZJBO - Serial: WD-WCASJ1119641 - Anschluss: 0
HD 2: WDC WD10EACS-00ZJBO - Serial: WD-WCASJ1336241 - Anschluss: 2 *
HD 3: WDC WD10EACS-00ZJBO - Serial: WD-WCASJ0638237 - Anschluss: 3
* abgesprungene Platte

@ Ernst@at:
die Daten wären mir schon extremst wichtig, eine professionelle Datenrettung ist für mich atm aber nicht erschwinglich.
Du scheinst ja echt ein Experte für diese Fälle zu sein. Und Hilfe soll belohnt werden. Ich würde dir daher für deine Hilfe 50,-EUR "spenden".

Nur keine Hektik, hilf zuerst datacore0815 aus der Patsche. Nicht daß noch etwas durcheinander kommt :) Ich verfolge derweil seinen Thread und versuche die benötigten Daten für dich bereit zu stellen. Falls noch etwas nötig ist, einfach sagen.

Teile mir bitte mit wie hoch die Chancen sind die Daten zu retten, damit ich weiß ob ich schon mal eine externe 2TB Platte für ein Backup ordern kann oder eben nicht.

P.S.: ich bin kein Experte, daher bitte möglichst "idiotensicher" Anweisungen geben ;)

Ich kann die Smart/Health Daten der abgesprungenen Platte mit HDTune auch nicht direkt auslesen, da über den ICH7R verbunden & nur das Raid erkannt wird. Soll ich hierfür im Bios auf IDE oder AHCI umstellen & die anderen beiden abklemmen? Ist dies ohne Probleme möglich (nicht daß noch etwas auf der Platte überschrieben wird)?

(Der "IntelMSM-Bericht_2008-04-01" ist schon älter, die Festplatten & die Anordnung stimmen aber noch überein. Aktuell wird das Mainboard Bios v3001 & die/der IntelRST v9.6.0.1014 Sofrware/Treiber verwendet. Ich kann leider bei dem neuen IntelRST keine Option mehr finden, einen Bericht zu drucken & die Reiter-Funktionen vom IntelMSM sind auch verschwunden. Habe daher noch einen Scan eines gedruckten älteren Berichts angehängt, das Textfile davon ist leider auf dem Raid5)

Besten Dank schon mal :)


Asus P5W-DH Deluxe - Handbuch (pdf): P5W-DH Deluxe Hardware User's Manual for German Edtion(G2557)
 

Anhänge

  • IntelRST_Bios.jpg
    IntelRST_Bios.jpg
    249 KB · Aufrufe: 395
  • IntelRST_Main.jpg
    IntelRST_Main.jpg
    290,4 KB · Aufrufe: 384
  • Datenträgerverwaltung.jpg
    Datenträgerverwaltung.jpg
    261,3 KB · Aufrufe: 382
  • IntelMSM-Bericht_2008-04-01.zip
    IntelMSM-Bericht_2008-04-01.zip
    764,6 KB · Aufrufe: 306
  • Asus P5W DH - Connections.jpg
    Asus P5W DH - Connections.jpg
    321,3 KB · Aufrufe: 968
Zuletzt bearbeitet: (Link editiert)
Die einzige Gemeinsamkeit, die ich im Moment feststellen kann, dass es sich um ein RAID5 handelt. Davon hatte ich schon jede Menge am OP-Tisch, die sind alle wieder ohne Datenverlust bei der Vordertüre rausgegangen.
Hier ein paar RAID5-Referenzen der letzten 12 Monate, da kannst Du schmökern, wie es in etwa abläuft:

6x500GB RAID5 nach defekter HDD bei Rebuild eine weitere Platte defekt gegangen
ICH9 Raid 5 6x1TB offline
Raid Controller findet keinen Raid
Raid 5 failed
Nach RAID5 Erweiterung Partition weg
Raid5 durch booten im IDE Modues zerstört?
UD3R V1.0 mit RAID5 Probleme!
Raid5 mit 3 HDDs wird nicht mehr erkannt
Raid 5 failed

Nachtrag: Inzwischen haben sich diese Woche noch dazugesellt
Intel Matrix Raid 5 - None defined
Und wieder ein Raid5@ICH10R ausgefallen
RAID 5 Array FAILED
<an diesem Platz hier wird dieser Thread später eingereiht>

Allgemein sind mir Noobs lieber als Nerds, weil die nebenher keine Extratouren einlegen, welche die Wiederherstellung gefährden könnten :D.
 
Zuletzt bearbeitet: (Update Referenzliste RAID5)
Puhh, da bin ich ja echt mal froh. :D

Dann kann ich ja schon mal die 2TB Platte fürs Backup bestellen.
Die neue 1TB Platte steht auch noch zur Verfügung, falls es nicht reichen sollte (und die abgesprungene Platte natürlich in Ordnung ist).
 
Prinzipielle Richtlinien während aller folgenden Aktionen
(außer es wird ausdrücklich was anderes verlangt)
- Bei den geringsten Zweifeln, Unklarheiten, Schwierigkeiten oder Problemen sofort Rückfrage halten und nicht weitermachen
- Wenn ein popup mit der Aufforderung kommt, eine Platte zu initialisieren, ABLEHNEN !!!
- läuft bei Systemstart ein automatisches chkdsk an, sofort durch beliebigen Tastendruck beenden!(Wenn USB-Tastatur nicht reagiert, notfalls Netz Aus)
- Im Disk Management keine Aktionen zu eventuell angezeigten Partitions oder Versuche, diese im Explorer anzuzeigen, machen!

Für die Diagnose zu installieren:
- HDTune zum Auslesen der SMART-Werte und Seriennummer, sowie
- den Hex-Editor HxD von hier in der englischen Version. Damit nicht herumexperimentieren, damit die Defaulteinstellungen erhalten bleiben:
HxD Aufruf unter User mit Administratorrechten (oder per Rechtsklick mit ausführen als...)
========= Überprüfen der Anzeigeeinstellungen, bei Bedarf richtigstellen
- Menü: Extras/Options.../View
Bytes per row: 16
Byte Group size: 1
Charset: ANSI
Offset-base: hexadecimal
- HxD beenden

Alle auf Anforderung erzeugten Bilder direkt, andere Dateien dann am Schluss in einen zip-File und den in den Post-Anhang stellen (Antworten/Erweitert/Anhänge verwalten)


Umkonfiguration der Hardware:
den jMicron-Controller stellst Du im BIOS/Advanced Menü auf "Basic" Mode

nach Power-Off
Klemm die 3 Sata-Kabeln an der HDD-Seite von den Platten ab
Nimm das SATA-Kabel aus dem Brenner und stecke es der Reihe nach an jede der RAID-Member-Platten, und führe nach dem hochfahren mit jeder die folgenden Anweisungen durch.

Steck jetzt mal die erste an, und stell ein Bild der Datenträgerverwaltung in den Anhang, dann gehts weiter...
 
Zuletzt bearbeitet:
So, der JMicron steht auf "Aktiviert - Basic - Sata/Raid BootRom: Aktiviert".

Hatte dies nach dem Vorfall auch schon kontrolliert & da stand der auf "Raid".
Bin mir aber zu 99% sicher, daß ich den auf Basic hatte. Kann dies beim anstecken der externen Platte automatisch angepasst worden sein?

Hab nun die abgesprungene Platte WCASJ1336241 an den Sata Port vom Brenner gehängt, keine Initialisierung oder Checkdisk angesprungen, Screenshot der Datenträgerverwaltung hab ich angehängt.
 

Anhänge

  • DVW_WCASJ1336241.jpg
    DVW_WCASJ1336241.jpg
    210,3 KB · Aufrufe: 357
die Einstellung des jMicron hat ursächlich wohl nichts mit dem Fehler zu tun, weil die Platten ja am Intel Controller hängen, dessen Einstellungen woanders gemacht werden.
Die jetzt geforderte Einstellung dient nur dazu, von den RAID-Memberplatten die SMART-Daten auslesen zu können. Danach sollte das wieder auf AHCI gestellt werden, um eSATA Hotplug nutzen zu können, wenn da mal was angesteckt wird.

- Erheb als erstes mal den SMART-Status mit HDTune, Auswahl der richtigen Platte und dann nacheinander bei Reiter Info und Health oben rechts mit dem ersten Button rechts neben der Temp-Anzeige in die Zwischenablage stellen (als Text), von dort in einen .txt file,
Name des textfiles = HDTune1.txt

HxD Aufruf unter User mit Administratorrechten (oder per Rechtsklick mit ausführen als...)

- Menü: Extras/open disk/physical disk/hard disk 1 (Häkchen bei "open as readonly" NICHT entfernen)
========= extrahieren Sektor 0
- Menü: Edit/select block/start-offset: 0 , length: 200, hex, OK
- Menü: Edit/copy as.../ editor view (überträgt den markierten Inhalt in die Zwischenablage)
- Menü: File/New (es erscheint in der Anzeige ein zweiter Reiter "untitled1")
- in "untitled1" in das kleine punktierte Rechteck rechts unter der Überschriftszeile 'Offset(h) ... 0E 0F" klicken
- Strg+V (überträgt den Inhalt aus der Zwischenablage) im popup "file size change": OK
- den Cursor an der Endposition belassen, nicht in der Anzeige herumklicken!
========= extrahieren maxLBA-4 (RAID-Metadaten)
- auf Reiter "hard disk 1" klicken
- in der Menüzeile rechts auf den Button >| drücken, danach < drei Mal klicken (um zum viertletzen Sektor zu kommen)
- Menü: Edit/select block/(den eingetragenen Start-Offset belassen) length: 800, hex, OK
- Menü: Edit/copy as.../ editor view (überträgt den markierten Inhalt in die Zwischenablage)
- Reiter "untitled1" anklicken
- Strg+V (überträgt den Inhalt aus der Zwischenablage) im popup "file size change": OK
- Menü: File/Save as... einen Ordner auswählen und als Dateinamen "Member1.txt" /speichern
- HxD beenden

danach Power off, und Du stöpselst die nächste Platte an
dann machst du mit der 2. und 3. das gleiche, und verwendest in den Namen von HDTunex.txt und Memberx.txt dann 2 und 3
hard disk 1 bleibt immer gleich!

Danach alles zippen und in den Anhang stellen
 
Ok, habs jetzt mit der WCASJ133624 versucht die Smart Daten mit HDTune auszulesen (Auch mit "Als Admin ausführen"), klappt aber nicht. Ich kann kein Kästchen anklicken. :(

Der HxD-Zugriff funktionierte. Ich häng schon mal das File der WCASJ1336241 unten an.
 

Anhänge

Zuletzt bearbeitet:
Werden nach Selektion der Platte und klick auf den Info/Health Reiter Daten angezeigt oder nicht?
mit Klick auf das kleine Symbol oben, rechts neben der Temperatur wird das Ganze in Textform nur in die Zwischenablage gestellt.
Eine neue Textdatei musst Du selbst erstellen, und mit "Bearbeiten/Einfügen" dann den Inhalt der Zwischenablage reinholen
 
Geht auch nix mit der nächsten Platte. Habs dann noch mit Everest & CrystalDiskInfo probiert, nix.

Hier mal ein Screenshot was alles (nicht) angezeigt wird:
 

Anhänge

  • Smart.jpg
    Smart.jpg
    89,3 KB · Aufrufe: 367
Geh mal in den Gerätemanager, dort bei Ansicht-"Geräte nach Verbindung" auswählen und dann solange in der Anzeige die "- " aufklappen, bis die Platte erscheint. Unter welchem Controller wird die angezeigt? (Bild reicht auch)
 
So, nun im Anhang die kompletten Screens der Datenverwaltung zu jeder Platte & die HxD-Files.

Bei der 3. Platte (WCASJ0638237) wollte er in der DTV einen MBR schreiben, gleich abgebrochen. Das ist der Unterschied zu den anderen beiden, bei diesen kam kein Popup.

Ist der "Invalid partition table.Error" in den HxD-Files der ersten beiden Platten schlecht oder gehört das so?
Ergänzung ()

Hab jetzt noch die Member3 = WCASJ0638237 dran & die hängt lt. dem Gerätemanager am JMicron JMB36X.
 

Anhänge

Zuletzt bearbeitet: ("HDTune-Files" angehängt)
Der JMB36X wird wohl im BIOS auf AHCI gestellt sein.
Damit der SMART-Befehle durchlässt, musst Du den auf IDE stellen. Danach wieder Bootdevice kontrollieren, dann sollte HDTune funktionieren.

Nachtrag 21:45
Durch das Striping des RAID5 steht auf der ersten Platte ein MBR, welcher dann wenn im ersten Stripe der zweiten Platte 0x00en stehen, als Parity unverändert auf der 3. Platte wiederzufinden ist.
deswegen wollte er Platte2(=Member3, da wir die Nummerierung willkürlich festgelegt haben) initialisieren, weil da kein MBR drauf ist.

Der Dich beunruhigende Text gehört zu den Meldungen des Bootcodes im MBR, die bei Fehlern beim Booten am Bildschirm erscheinen :D
 
Zuletzt bearbeitet:
Nee, der JMicron steht auf "Basic".

Hab jetzt auch noch die IDE-Konfig auf "IDE" umgestellt, daraufhin erkannte er nach der Anmeldung 2 neue ATA oder SATA - Schnittstellen, installierte die Treiber & verlangte danach einen Neustart.

Nach dem Neustart funktioniert es aber immer noch nicht. Keine Ahnung was ich noch umstellen sollte. :(

Vielleicht mal eine Platte an einen der ICH7R Ports hängen, vielleicht klappt's ja da mit der Smart-Auslesung. Ein Versuch wert oder eher nicht zu empfehlen?
 

Anhänge

  • JMicron-Konfig.jpg
    JMicron-Konfig.jpg
    276,8 KB · Aufrufe: 345
  • IDE-Konfig.jpg
    IDE-Konfig.jpg
    268,1 KB · Aufrufe: 324
Zuletzt bearbeitet:
Vielleicht stört ihn noch der jMicron SATA/RAID BootROM - stell das mal auf "Disabled"
Das System fährt aber hoch - Nur im HDTune gibts immer noch keine SMART-Werte im Health-Reiter? Die Platte erkennt er aber?
Wenn es mit obiger Änderung immer noch nicht klappt, werde das mal hier bei mir nachstellen - Morgen früh
 
Zuletzt bearbeitet:
jMicron SATA/RAID BootROM - auf "Disabled" bringt auch nix.
Es werden nur wie in den Screenshots die Temp. & die LW-Größe angezeigt.

Allerdings bekomme ich mitlerweile ein paar Werte für die 2 System-Platten am EZ-Raid angezeigt. Natürlich keine nützlichen, da die im Raid1 laufen & wohl über den Chip nicht geteilt auslesbar sind.
 
Ich werde morgen Früh einen JMB36x mal bei mir ins Verhör nehmen...
 
Ja das ist schon komisch. Könnte vielleicht auch an den Treibern für den JMicron liegen?

Hab ein bisschen gegoogelt & ein paar haben das Problem auch (meistens bei eSata). Hat wohl was mit der Treiber-Version & dem verwendeten Board zu tun. Mit den älteren Treibern funktionierte es wohl & mit den neueren nicht mehr. Dafür soll wohl mit den neueren die HotSwap-Funktion gehen.


So, hab's geschafft die SMART-Daten mit HDTune auszulesen. :D

Hab die "HDTune-Files" an Post #11 zu den anderen Files angehängt.

Also, es lag tatsächlich nur an der Treiverversion des JMicron.

Ich hab den aktuellsten Treiber (JMB36X_WinDrv_R1.17.55_WHQL) von der JMicron-Homepage ftp://driver.jmicron.com.tw/jmb36x/XP_Vista_Win7/ durch einen älteren (JMB363_RAID__V1174405_Beta) von der Asus-Homepage http://support.asus.com/download/ (zu finden unter "Hauptplatine", "Socket775", "P5W DH Deluxe", "Vista 32bit") ersetzt.

Dieser Treiber war unter "Sata" abgelegt & 4 weitere für den JMicron waren unter "Raid" abgelegt (siehe Anhang).

Ist der Treiber speziell für das Asus Board (bzw. für den Non-Raid-Betrieb des JMicron) oder hat man bei den neueren Treibern allgemein keinen SMART-Zugriff mehr? Welchen Treiber sollte ich den jetzt am besten verwenden, nicht das der ältere noch Probleme macht?

Hier auch ein anderer Post zu dem Thema: http://mbforum.gigabyte.de/index.php?page=Thread&postID=3616#post3616
Der hatte den Treiber erst gar nicht installiert, sondern nutzt den "Standard AHCI 1.0 Controller" von Microsoft. :cool_alt:
 

Anhänge

  • Asus_Sata.jpg
    Asus_Sata.jpg
    42,2 KB · Aufrufe: 320
  • Asus_Raid.jpg
    Asus_Raid.jpg
    121,4 KB · Aufrufe: 322
Zuletzt bearbeitet:
Bin zum Versuch am JMB36X bis leider jetzt nicht gekommen, weil an der Kiste, wo der drinnen hängt, eine Datenrettung seit Freitag immer noch rumrödelt und sich tapfer durch defekte Sektoren kämpft, die ich nicht abbrechen kann.

Die SMART-Werte sind unauffällig, bis auf die 2.Platte, welche ein paar UDMA-ECC-Checks aufweist. Wann sich die ereignet haben, kann man so nicht sagen, dazu müsste man den Eventlog von der Platte auslesen. Kann ein früheres Kabelproblem gewesen sein
 
Das würde mich jetzt schon interessieren mit dem Eventlog. Falls es nicht zu umständlich ist & durch die Auslesung keine Gefahr für die Daten besteht, kannst ja mal eine Anleitung reinstellen, dann lese ich den Log mal aus & stell's hier für dich hoch.

Ein Kabelproblem ist eigentlich ausgeschlossen. Habe echt Stunden gebraucht für eine ordentliche Verkabelung (Netzteil mit Kabelmanagement, etc.) in dem Gehäuse. Für die Festplatten hab ich EMI-geschirmte Sata-Kabel mit Verriegelung von Akasa (http://www.akasa.com.tw/update.php?tpl=product/product.detail.tpl&no=181&type=Cables&type_sub=SATA Cables&model=SATA2-45_60_100-BLUV) im Einsatz. Da friert eher die Hölle zu, bevor die mir abspringen. :evillol:
 

Anhänge

  • OrigenAE_Side.jpg
    OrigenAE_Side.jpg
    291,2 KB · Aufrufe: 331
  • OrigenAE_Top.jpg
    OrigenAE_Top.jpg
    286,5 KB · Aufrufe: 333
Zurück
Oben