Raid 5 Array FAILED - "Episode 2"

  • Ersteller Ersteller Mr_Smith
  • Erstellt am Erstellt am
Sorry, wenn ich jetzt einfach mal was einwerfe: Ich hatte auch mal das Problem, dass eine Platte in Windows nicht mehr erkannt wurde ("Unbekannt", "Nicht initialisiert"). Da war einfach nur die Spur 0 defekt - schien so. Mittels Restorer 2000 v2.0 konnte ich die Dateien einfach wiederherstellen (auf eine andere Platte versteht sicht).

Für dich heißt das: Wenn du die defekte Platte entfernt, erkennt er auf RST-Ebene, dass die Platten zusammengehören? Wenn ja => gut. Ich vermute, dass einfach nur die Partitionsinformationen weg sind. Dann einfach mal die o.g. Software drüberlaufen lassen. Das Problem ist das nur noch, die richtige file table zu laden, die Restorer 2000 findet. Ich bin sicher, dass Restorer 2000 ALLE Dateien auflistet und auch wiederherstellen kann. Eine schrittgenaue Anleitung kann ich dir leider nicht geben, tut mir leid :(
Hab mal die kompletten Daten einer Freundin gerettet, von einer formatierten Platte (nur ~20 GB), das hat nen ganzen Tag gedauert.

gruß
hostile
 
Weg ist eigentlich gar nichts - außer der Übersicht. Und die hat der RAID-Controller über seine 3 Platten verloren :D
 
Ok, smartmontools-5.39.1-1.win32 ist drauf & geöffnet.

Soll ich hier (siehe Anhang) jetzt den Befehl "-l ICRC" eingeben?
 

Anhänge

  • smartmontools.jpg
    smartmontools.jpg
    60,4 KB · Aufrufe: 308
zuerst mal ein -i sdx, um auch die richtige Platte zu treffen...
 
Na irgendwie will's nicht so recht. :freaky:
 

Anhänge

  • smartctl.jpg
    smartctl.jpg
    230,8 KB · Aufrufe: 295
probier mal alternativ
"smartctl -i pd0" für physical drive 0 (wie in Datenträgerverw.) pd1, pd2 ...
sollte eigentlich dasselbe sein wie sda, sdb, sdc ...
 
Zuletzt bearbeitet:
Hat geklappt mit "smartctl -i pd1".

Und jetzt "smartctl -l ICRC" oder muß hier noch irgendwo die Info über die Laufwerksnummer untergebracht werden?
 

Anhänge

  • smartctl_2.jpg
    smartctl_2.jpg
    91 KB · Aufrufe: 292
Zuletzt bearbeitet:
das hab ich falsch interpretiert - das sind die Ausgabemeldungen die ICRC-Fehler enthalten können
wenn Du dann die richtige hast, mach einfach ein "smartctl -x pd1"
da spuckt er alles aus, was es dazu zu sagen gibt
 
Zuletzt bearbeitet:
So, hat geklappt. Lässt sich nicht markieren & in ein Textfile einfügen, hab daher mal die Screenshots angehängt.
 

Anhänge

  • smartctl_HDD2_S1.jpg
    smartctl_HDD2_S1.jpg
    179,7 KB · Aufrufe: 298
  • smartctl_HDD2_S2.jpg
    smartctl_HDD2_S2.jpg
    272,7 KB · Aufrufe: 281
  • smartctl_HDD2_S3.jpg
    smartctl_HDD2_S3.jpg
    72,3 KB · Aufrufe: 311
Commandline-versierte Benutzer wissen natürlich, wie man die Ausgabe in eine Textdatei umleitet (>) oder in eine bestehende hintendranfügt(>>) :)
command [parameter] >laufwerk:[\pfad]\dateiname.txt

Verwunderlich, dass er bei Dir keine "physical event counters" ausspuckt, probier mal

"smartctl -l sataphy pd1" (das -l ist ein kleines L)
 
Tja, will'er wohl nicht :)
 

Anhänge

  • smartctl_HDD2_1.jpg
    smartctl_HDD2_1.jpg
    72,8 KB · Aufrufe: 318
Mit dem Geplänkel über die SMART-Werte habe ich doch glatt vergessen, die Auswertung der RAID Metadaten hier reinzustellen.

Das Ergebnis ist ernüchternd: Umzingelt von Vollidioten.

Hast Du mit dieser Konstellation dieser Platten im RAID schon jemals ein erfolgreiches Rebuild nach einem Plattenausfall erlebt? Ich fürchte, nein - und Du wirst auch nie einen erleben.

Welcher Wahnsinnige(wird wohl derselbe sein, der sich auch die Modellnummern ausdenkt) bei WD sich den Spaß erlaubt hat, bei diesen Plattenserien die Seriennummer völlig sinnlos auf 15 Stellen aufzuplustern, indem er noch "WD-" davorstellen musste, wo das doch aus dem Device-Model-Feld (siehe smartctl info) ohnehin schon hervorgeht, dem gehört ein Orden verliehen.
Bei Intel hat einer der Dumpfbacken-Programmierer zwar vorgesehen, in einem 16-stelligen Seriennummernfeld hinten :0 für eine Device im rebuild dranzuhängen, prüft aber nicht, ob die Länge der Seriennummer größer als 14 ist und schneidet vorne überzählige Stellen ab, womit natürlich keine Zuordnung mehr stattfinden kann, weil er die Platte nicht mehr findet.

Fazit: Diese Plattenserie ist wegen der zu langen Seriennummer nicht für Intel-onboard-RAIDs tauglich(für Intel-Controllerkarten wird dasselbe gelten).
NACHTRAG: Genau genommen muss man es umgekehrt formulieren: Boards mit Intel onboard-RAID-Controllern oder Intel RAID-Controllerkarten sind für Platten im RAID-Betrieb mit einer Seriennummer, die länger als 14 Stellen ist, nicht geeignet
Jedes Rebuild nach einem Fehler wird zu so einer Situation führen, dass man den Array wieder per Hand (oder kostenpflichtigem RAID-reconstruction-Utility) zusammenflicken darf.

zum sonstigen Inhalt:

auf der Member1 ist ein MBR mit einer einzigen, an 1MB-Grenzen aligned NTFS-Partition im Basic-Format in der Größe von 2TB (1863GiB) drauf.
auf der Member2 befindet sich ein MBR im GPT-Format, der aber aus einer prä-RAID-Zeit stammt, der ist nicht relevant.

Das einzige, was ich anbieten kann, ist ein Wiederaufbau des RAID im degraded-Mode zum runtersichern der Daten.
Ein Rebuild, um alle drei Platten wieder zusammenzuspannen, ist aus den obengenannten Gründen unmöglich; nach der Sicherung auf eine 2TB würde es aber wieder auf einen neu aufgebauten Raid mit allen 3 Platten funktionieren, die Daten wieder auf den RAID zu bringen. Bis zum nächsten Hoppala. Von erhöhter Verfügbarkeit keine Rede mehr.

technisch wäre es zwar möglich, mit entsprechendem Equipment den Platten kürzere Seriennummern zu verpassen - das wollen wir uns aber nicht antun. Wenn WD ein Utility dafür liefert - dann ja.

Über die Ursache des Ausfalles der Member2 kann ich nur Vermutungen anstellen: irgendeine Spannungsschwankung vielleicht(von wo bezieht die hinten angesteckte Sicherungsplatte ihren Saft?), welche die Platte kurzzeitig ausssetzen hat lassen - und das Rebuild eingeläutet hat, welches dann im Chaos endete

Nachtrag: Im Anhang die Analyse-Ergebnisse
 

Anhänge

Zuletzt bearbeitet: (kleine Verbesserungen und Ergänzungen (in blau, später rot)))
Die externe ist in einem Gehäuse mit eigenem Netzteil. Hab diese im laufenden Betrieb an den FireWire-Port gesteckt. Das wird's wohl dann doch gewesen sein. :)

Das ist ja mal ein Witz mit den Seriennummern. Die Rebuilds mit dem EZ-Raid1 klappten bis jetzt prima, hatte sogar schon eine Platte komplett ersetzen müssen - null problemo. Aber beim Raid5 kam ich noch nicht in die Situation - bis jetzt.

Da bleibt mir wohl nur für die Zukunft Platten mit 14-stelliger Seriennummer zu verwenden oder die selber abzuändern, natürlich problematisch mit der Garantie. Werd wohl mal WD kontaktieren & Fragen, was die einem empfehlen. OMG, gleich mal schaun wie lang die Seriennummer der neuen WD RE3 (Raid Edition) ist. :freak:

Meine Backup-Festplatten (2x 2TB WD2000EARS) & eine LaCie 2 Port eSata/PCI-e Card treffen morgen ein. Währe dann nach dem Umbau/Einbau bestens gerüstet. :D

P.S.: ist dir so ein Fall schon einmal untergekommen? Falls nicht, bist schon wieder 'ne Ecke schlauer. :daumen:
 
Zuletzt bearbeitet:
Bitte die obigen Ergänzungen, die ich nachträglich vorgenommen habe, zur Kenntnis zu nehmen.
Der EZ-RAID arbeitet mit dem Silicon Chip rein hardware(firmware)mäßig; dem ist der Hersteller und die Seriennummer schnurzegal, da gibt es keine doofen Programmierer, welche sich in ATA-Spezifikationen nicht auskennen und vom Programmieren keine Ahnung haben.

Viel Spaß mit den Leuten vom WD-Support, wenn die nur halb so doof wie die von Seagate sind, dann begreifen sie schon in einem halben Jahr nach 50 Mails, worum es eigentlich geht. Wenn sie intelligent sind, sagen sie: Wir haben uns an die ATA-Spezifikation gehalten.

Denen von Intel klarzumachen, was da passiert - dazu müsstest Du erst mal einen Ansprechpartner finden, der das an die richtige Stelle weiterzuleiten imstande ist.
Hilft aber auch recht wenig, weil da noch viele nach Dir reinfallen werden. Aber alle erst dann, wenn eine dieser Platten ausfällt. :D

Bevor der Unsinn nicht auch im RAID-BootROM (der dann von den Boardherstellern erst eingepflegt werden muss, was Jahre dauern kann) und den Treibern geändert wird, werden noch viele RAIDs zerfallen. Erinnert sehr an das Seagate-Debakel, welches derartige Entrüstungsstürme hervorgerufen hat, weil die Leute keine Sicherung von ihrem Kram hatten.
 
So, Seriennummer der WD RE3 (WDC WD1002FBYS): WD-WMATV7829413

Auch 15 Stellen, somit NUTZLOS für mich. Und das soll eine Enterprise-Platte (für Unternehmen) sein: https://www.westerndigital.com/de/products/Products.asp?DriveID=503

Da langst dir doch an den Kopf, wenn dir die Specs der Platte anschaust & dann bekommen die nicht einmal hin, der eine kompatible Seriennummer zu verpassen. Was für NOOBS.

Die geht auf jeden Fall wieder zurück, falls die mir keine Lösung dafür anbieten. :king:

P.S.: greift in dem Fall eigentlich die Garantie noch? Die 3 Platten liegen noch im 3-Jahres-Rahmen.
 

Anhänge

Zuletzt bearbeitet:
Nochmals: Es ist zwar saudumm (weil völlig sinnlos), so lange Seriennummern zu kreieren; aber innerhalb der ATA-Spezifikationen. Also wird auf Garantie nichts zu holen sein.
Intel hat das verschissen - wie so viele andere Dinge auch, aber auch bei AMD tritt man bei RAID in andere Fettnäpfchen.
 
Ist mir eigentlich wurscht wer's verbockt hat. Der Fehler ist jetzt aufgedeckt & dafür muß eine Lösung gefunden werden.
Das ist so ja kein Zustand, sondern eher russisch Roulette. Da kriegst ja kein Auge mehr zu!

Ich fang jetzt nicht an mein Mainboard oder das ganze System auszutauschen oder noch 500,-€ für 'nen Raid-Controller rauszuhaun.

Die sollen sich was einfallen lassen. WD ist kontaktiert. Falls die keine Lösung haben, geht die Enterprise-Platte gleich wieder zurück.
Für die anderen muß man schaun was zu machen ist.

Wenn man als Hersteller "Enterprise"-Festplatten verkauft und diese speziell als Raid-Festplatten verkauft, dann sollte man schon darauf hinweisen, das diese nicht mit einem Intel Raid-Controller harmonieren - oder eben die scheiss Seriennummer kürzer gestalten. Das sagt mir zumindest mein gesunder Menschenverstand.

:stock:

Kann nur hoffen meine Daten wieder zu bekommen, das hat erst einmal Priorität.
Aber bei dir fühlt man sich gut beraten. Sonst währ ich inzwischen vor Bluthochdruck wohl schon längst umgefallen. :)
 
Zuletzt bearbeitet:
Ach bitte, stell den Schriftverkehr dann hier rein - damit alle was zum Lachen haben.
Du bist vielleicht nicht der Erste, dem das passiert ist; aber immerhin der Erste, dem bewusst wurde, warum es ihm passiert ist. Für WD wird die Situation neu sein, oder wurde bisher totgeschwiegen...
Was jetzt folgt, ist mir schon aus mehreren anderen solcher Situationen bekannt.
Nimm ein Nervenruh und schlaf gut, und lass Dich überraschen :D

Die Daten kriegst Du wieder, sobald Du eine 2TB zur Verfügung hast, da werden wir sie dann ganz schnell draufmanschen.
Für Enterprise-Platten sollte man auch ein Enterprise-Board und einen Enterprise-Controller bereitstellen, damit das optisch zusammenpasst, wenn man Wert auf Qualität legt. :)
 
Zuletzt bearbeitet:
Ja, das ist eine gute Idee. Anbei schon einmal meine Reklamation an Western Digital.

Hab ausserdem einen HDTune-Screener von einer Seagate-Festplatte gefunden.
Die haben doch tatsächlich nur 8-stellige Seriennummern. Unfassbar! Da werd ich wohl bald zur Konkurrenz wechseln, wenn sich WD dumm stellt.

Spätestens morgen Nachmittag/Abend sollte meine 4(+1)TB-Erweiterung für die Datenorgie eingerichtet sein. Dann können wir loslegen. :freaky:

Die Enterprise-Platte war jetzt nicht arg viel teuerer als die Desktop-Platte. Höherer MTBF, 5 statt 3 Jahren Garantie, und die sind speziell für Raid entwickelt. Wollt außerdem sehen ob die arg lauter sind, nö sind se nicht :D und mit der Zeit Platte für Platte durch diese ersetzen nachdem eine den Geist aufgibt. Und für's System auf eine SSD umsteigen, sobald die humane Preise erreicht haben.

Spricht doch eigentlich nichts dagegen wenn man eine Premium-Platte in ein Desktop-System pflanzt. Schlechter isses bestimmt nicht - außer natürlich wenn man Intel & WD kombiniert. Da hast mit jedem Modell das Problem, da alle Seriennummern bei denen zu lang sind. :D

Führt wohl nichts an einem professionelleren Raid-Controller vorbei. Haben die eigentlich auch das "Sorry dude, no rebuild. Serial number too long!" - Problem oder läuft da alles geschmeidig wie's soll?
 

Anhänge

  • Reklamation_WD.jpg
    Reklamation_WD.jpg
    96 KB · Aufrufe: 288
  • Seagate_SN.png
    Seagate_SN.png
    27,7 KB · Aufrufe: 300
Zuletzt bearbeitet:
Das ist jetzt nicht wirklich hilfreich fürs Problem, aber die alleinige Tatsache find ich so unfassbar, dass ich das unbedingt verfolgen will, was WD darauf antwortet. Viel spannender wäre aber eine Stellungnahme von Intel :)
Ich konnte mir jedenfalls einen Lacher nicht verkneifen :D
 
Zurück
Oben