RAID 1 Verbund Offline, OS Systemverbund

domidragon

Fleet Admiral
Registriert
Juli 2008
Beiträge
11.532
Hallo liebes CB Forum

Lange war ich nicht mehr hier, aber ich bräuchte mal eure Hilfe, bin am Rande der Verzweiflung.

Folgende Situation:
Mein Privater Datenserver (Windows Server 2008) läuft auf einem RAID1 gegen Hardware ausfälle.
Der Kontroller ist der Intel Embedded Raid II. Board: Intel Server Board S1200BTL

Es hat zudem noch ein RAID 5 Verbund (3 Platten) und ein RAID 0, wobei da nur eine Platte dran ist, ging aber nicht anders um den Steckplatz zu nutzen...

Nun das RAID 1 ist seit dem letzten Neustart auf OFFLINE und ich kriege es nicht mehr auf Online, egal was ich anstelle.
Das RAID läuft seit einiger Zeit nur noch mit einer Platte, mangels 2. HDD und Zeit. Nun habe ich gestern die 2. Platte eingeschoben und den Rebuild Prozess gestartet.

Das Problem der alten aktiven Platte, sie hat viele Sektoren, die kaputt sind.

Der Rebuild schien gut durchzulaufen, im Windows lief wieder alles zu angenehmen Geschwindigkeiten.
Wollte ein aktuelles Image noch ziehen und dabei eine leere Platte anhängen. (Falls das Rebuild doch nicht ganz klappte und ich dann sonst ein Image auf ein leeres Volumen knallen könnte)
Nur hab ich ausversehen dann den Stromstecker anderer HDDs abgehänkt, also nicht den RAID Platten. Das war Windows aber wohl zu viel und endete in einem Bluescreen.

Beim nächsten Start war das RAID1, welches im Windows Betrieb rebuildet wurde, nur noch OFFLINE.
Ich kann im Kontroller biegen und brechen was ich will, selbst wenn ich es auf Degraded bringe, ist beim Start wieder offline als Status hinterlegt. Er versucht dann zwar Windows zu booten, bricht aber auch hier mit einem Bluescreen ab.


So Frage an euch. Wie kann ich am besten ein Image von der Platte machen, damit ich sie ausserhalb vom RAID booten kann?
Oder kann ich dem RAID Kontroller dazu ermutigen, die Platte zu nehmen? Ich habe auch mal gesehen, dass sie im State "rebuild" versetzt wurde. aber da es eigentlich die "master" platte ist, sollte sie ja bootbar sein.

Falls ihr noch Infos braucht oder ich was vergessen habe, sagt bescheid.

DANKE!


IMG_20180107_171510.jpgIMG_20180107_171414.jpgIMG_20180107_171422.jpgIMG_20180107_171431.jpgIMG_20180107_171510.jpgIMG_20180107_171631.jpgIMG_20180107_171639.jpgIMG_20180107_171943_018.jpgIMG_20180107_171700.jpgIMG_20180107_171648.jpg
 
Zuletzt bearbeitet:
Ja, ist nur die alte Platte drin.Ich getraue mich nicht, diese abzuhängen, da ich denke die neu gespiegelte ist in einem Zustand, was nicht klappen wird.
 
mr.malcom, dies dürfte nicht bringen, denn wenn ein RAID 1 Offline ist, dann sind wohl beide Platten aus dem Verbund geflogen. Bei WD Green HDDs wundert mich sowas aber nicht wirklich, die sind nicht für RAID Betrieb oder auch nur den Betrieb mehrere HDDs in einem Gehäuse gedacht. Bei einem RAID muss man auch laufend den Zustand überwachen, damit man rechtzeitig reagieren kann, wenn eine Platte ausgefallen ist, außerdem ersetzen RAIDs keine Backups!

Aber ganz platt scheinen die Platten ja noch nicht zu sein, sie werden ja noch erkannt. Versuche mal mit smartctl -a die S.M.A.R.T. Logs auszulesen um zu sehen welche zuletzt aus dem Verbund geflogen ist, hänge sie z.B. über USB an einen anderen Rechner.
 
Ich weiss welche Platte noch aktuell ist, die andere müsste vlt. aktuell sein.
Habe beide schon per USB an meinem Rechner eingelesen, aber beide haben den Zustand RAW und Mit Rescuva oder so kann ich sie nicht lesen.
Ein Backup der wichtigsten Daten habe ich schon, aber die ganze Arbeit, Konfiguration etc. ist halt verloren. Die Zeit ist hier was mich nervt. Die Daten habe ich auf einer anderen Platte noch. (Zumindest 70%)
 
Wenn Du sie mal wieder extern angeschlossen hast, dann poste doch mal die Screenshots von CrystalDiskInfo für die HDDs. Ziehe aber bitte das Fenster soweit auf, dass alle Attribute und auch die Rohwerte vollständig sichtbar sind, also keine Scrollbalken mehr erscheinen.
 
Hier der Screenshot.

Ich kann nun wieder auf die Platte extern zugreifen, Fragt mich nicht wieso.

Dann scheint es aber eher ein Windows Problem zu sein und nicht ein RAID Problem, sehe ich das richtig?

Kann man so die Platte nicht bearbeiten, dass sie ohne RAID geschmeuse booten kann?

crystaldisk.png
 
Über 40.000 Betriebsstunden, die alten Green waren noch robust, aber die ist am Ende und hat 0x02E2 = 738 schwebende Sektoren, ist also schon länger nicht mehr im RAID gelaufen.

Schwebende Sektoren sind Sektoren deren Daten nicht mehr zur ECC passen die hinter jedem Sektor steht und mit deren Hilfe auch nicht mehr korrigiert werden können. Da die korrekten Daten nicht mehr feststellbar sind, gibt die Platte statt falscher Daten einen Lesefehler als Antwort wenn man versucht diese zu lesen. Das kann auch anderen Gründe als defekte Oberflächen haben, z.B. einen Stromausfall während eines Schreibvorgang der dazu führt, dass eben nicht die ganze Daten plus der neuen ECC geschrieben wurden oder wegen eines Stoßes oder Vibrationen ist der Kopf beim Schreiben aus der Spur gekommen und hat Daten auf der Nachbarspur überschrieben. Auch arbeiten HDDs nicht 100%ig und die Hersteller geben die Fehlerhäufigkeit auch in Form der UBER an, wobei eine UBER von 1:10^14 bedeutet, dass je 10^14 gelesener Bits was etwa 12TB gelesener Daten entspricht, ein Lesefehler und damit schwebender Sektor im Rahmen der Erwartungen liegt.

Die Controller merken sich die schwebenden Sektoren und prüfen die Daten nach dem erneuten Schreiben auf diese Sektoren, dann verschwinden diese einfach oder werden eben durch Reservesektoren ersetzt.

HDDs in einem echten RAID, also einem mit Redundanz wie einem RAID1 oder RAID 5 (also nicht einem RAID 0 welches eigentlich ein AID 0 ist), zeigen normalerweise keine schwebenden Sektoren, weil die RAID Controller (ggf. RAID SW) bei Lesefehlern die Daten aus den Daten der anderen Platten rekonstruiert und den Sektor überschreibt bei denen der Lesefehler aufgetreten ist.

Ersetze die Platten, denn die anderen sind ja wohl auch nicht jünger und dürften kaum in einem viel besseren Zustand sein. Ziehe alle wichtigen Daten runter, kaufe zwei neue HDDs (oder als Systemlaufwerk besser SSDs) und setzen das System damit neu auf. Wenn Du HDDs nimmst, dann unbedingt solche mit der Zulassung für den Dauerbetrieb, also Red statt Blue oder IronWolf statt Barracuda!
 
Die 2 Platte hatte ich abgehängt, weil das System so langsam wurde. Das half kurzfristig, allerdings war das RAID1 dann nur noch mit einer Platte am laufen. Ich vermute die hatte auch schon einige Fehlerhafte Sektoren. Ist gleich alt. Das ist ein paar Wochen her. Hatte da auch neue Platten bestellt.

Ich ziehe aktuell gerade alles runter. Was halt am besten wäre, wenn ich das so machen könnte, dass ich das System gleich wieder so betreiben kann.
Hab zwischenzeitlich versucht ein neues Windows zu installieren (Server 2012 R2), aber da bricht er schon mit einem Bluescreen ab, bevor überhaupt das Konfigurationsfenster kommt.
Also er startet ab dem USB Stick, dann kommt "loading files", dann sieht man noch kurz den Windows Ladescreen mit 2 Punkten und zack neustart.
Hab versucht die Controller Treiber ins ISO zu packen, bisher aber erfolgslos. habe aber so die Vermutung, das liegt an was anderem. Hast du eine Idee?

Oder kennst du eine Möglichkeit, um die alte platte quasi zu clonen, dass ich so das vorherige System wieder habe?

Danke jedenfalls für deine sehr genaue auskunft!

SSD habe ich mir auch schon überlegt. Wäre eine Möglichkeit, wenn ich wirklich neu aufsetzen muss.
 
domidragon schrieb:
Die 2 Platte hatte ich abgehängt, weil das System so langsam wurde.
Besonders schlau war das aber nicht.
domidragon schrieb:
Das half kurzfristig, allerdings war das RAID1 dann nur noch mit einer Platte am laufen. Ich vermute die hatte auch schon einige Fehlerhafte Sektoren. Ist gleich alt. Das ist ein paar Wochen her. Hatte da auch neue Platten bestellt.
Und wieso wurden die dann nicht sofort eingebaut? Erst eine, dann resync des RAIDs, warten bis dies erfolgreich beendet ist dann die andere tauschen und wieder resync. Wobei bei dem Zustand die Chance auf ein erfolgreiches Resync schon nicht mehr hoch war, Du hättest keineswegs die andere rausnehmen sollen.

domidragon schrieb:
Ich ziehe aktuell gerade alles runter. Was halt am besten wäre, wenn ich das so machen könnte, dass ich das System gleich wieder so betreiben kann.
Das würde ich bei so viele schwebenden Sektoren nicht machen, da riskiert man nur das Dateien korrupt sind und damit das System dann instabil läuft.
domidragon schrieb:
Hab zwischenzeitlich versucht ein neues Windows zu installieren (Server 2012 R2), aber da bricht er schon mit einem Bluescreen ab
Auf was zu installieren?
domidragon schrieb:
Also er startet ab dem USB Stick, dann kommt "loading files", dann sieht man noch kurz den Windows Ladescreen mit 2 Punkten und zack neustart.
Dann kann es auch am Stick liegen.
domidragon schrieb:
Hab versucht die Controller Treiber ins ISO zu packen, bisher aber erfolgslos.
Welches Controller ist es denn und kann man da keinen F6 Treiber laden?
domidragon schrieb:
Oder kennst du eine Möglichkeit, um die alte platte quasi zu clonen, dass ich so das vorherige System wieder habe?
Willst Du die mit den ganzen Fehlern wirklich Klonen? Wenn, dann dürfte nur mit ddrescue unter Linux klappen, normale Tools würden beim Versuch den ersten schwebenden Sektor zu lesen nämlich abbrechen.
 
Hi Holt

Naja, wenn die Platte komisch klingt, nimmt man sie besser raus :)
Die neuen Platten dauerten leider etwas über Weihnachten, hatte mal 2 Ersatzplatten, die flogen aber mal zu Boden...

Hm das ist genau meine Zurückhaltung, ob dann das System einfach ständig schlecht läuft bei so vielen schwebenden Sektoren...

Versuche das 2012 auf den gleichen Server zu installieren. Hm am Stick liegt es weniger, an einem anderem Rechner komme ich durch.
Das Problem bei dem Server ist, dass da noch ein aktives RAID5 drin ist. Ich kann also nicht einfach den RAID Modus im BIOS ausmachen...

Pha werde nie wieder ein RAID machen...

Der Kontroller ist der Intel Embedded Raid II. Board: Intel Server Board S1200BTL.

Nein ich glaube ich mache es nun neu, lohnt sich langsam nicht mehr. Müsste nur noch das Setup klappen. Die Daten habe ich ja alle und mal schauen, vlt. kann ich so die eine oder andere Konfiguration einfach kopieren, auch wenn es viel Fleissarbeit ist.

Weisst du per Zufall, wo die Netzlaufwerke gespeichert werden, damit man die übernehmen kann? :P Möchte nur ungern jeden Rechner wieder anfassen nur wegen den Freigabelaufwerken...

Danke für deine tolle Unterstützung!
 
domidragon schrieb:
Naja, wenn die Platte komisch klingt, nimmt man sie besser raus :)
Aber nicht solange sie noch nicht aus dem RAID geflogen ist.
domidragon schrieb:
Die neuen Platten dauerten leider etwas über Weihnachten,
Gibt es denn keinen Laden? So richtig zum Offline Einkauf oder als Ladenlokal eines Onlinehändlers? Wenn ich schon zwei gleich alte und recht alte Platte habe und die eine Probleme macht, dann muss ich doch auch damit rechnen, dass die andere auch bald Probleme machen wird und darf doch nicht mit dem Ersatz trödeln.
domidragon schrieb:
hatte mal 2 Ersatzplatten, die flogen aber mal zu Boden...
Wie "flogen aber mal zu Boden"? Wenn sie runtergefallen sind, dann kann man sie vergessen. Von HGST gibt es dieses Video über die Empfindlichkeit und korrekt Handhabung von HDDs, mit dem Empfehlung wie die Umgebung aussehen sollte auf denen mit HDDs gearbeitet wird und sie weisen darauf hin, dass die Schäden sich auch erst später bemerkbar machen können.

Aber Ersatzplatten sind sowieso ein heikles Thema, dann HDDs altern auch wenn sie nicht benutzt werden und sind daher nicht endlos lagerbar. Dazu schreibt Seagate z.B. hier und auch in einigen anderen Product Manuals:
Wenn also die Lagerbedingungen nicht eingehalten werde, sind 90 Tage und zwar in der ungeöffneten Originalverpackung, sonst bestenfalls 1 Jahr. Nach dem Öffnen sollten HDD nicht länger als 30 Tage stromlos sein.

Bei der neuen Barracuda Pro 10TB mit Heliumfüllung schreibt Seagate:
Also hier nur ein halbes Jahr in der ungeöffneten originalen Versandverpackung von Seagate und sonst 2 Monate, nur bei optimalen Bedingungen bis zu einem Jahr.

HGST schreibt für die meisten Modelle wie z.B. für die Megascale:

domidragon schrieb:
Hm das ist genau meine Zurückhaltung, ob dann das System einfach ständig schlecht läuft bei so vielen schwebenden Sektoren...
Da es schwer zu sagen ist welche Sektoren schwebend sind und damit auch welche Dateien konkrete betroffen sind, besteht dieses Risiko und je mehr Sektoren schweben, umso größer ist das Risiko.

domidragon schrieb:
Versuche das 2012 auf den gleichen Server zu installieren.
Auf welche Platten denn? Doch hoffentlich nicht auf eine dieser alten Greeen oder die Ersatzplatten, die schon mal zu Boden geflogen sind. Bei denen wäre es kein Wunder wenn es dann Probleme mit der Installation gibt.
domidragon schrieb:
Das Problem bei dem Server ist, dass da noch ein aktives RAID5 drin ist. Ich kann also nicht einfach den RAID Modus im BIOS ausmachen...
Es ist doch ein Intel System, da sollten auch im RAID Modus die Platten im AHCI Modus laufen die nicht Teil eines RAIDs sind und einen passenden Treiber müsste Windows auch schon enthalten.

domidragon schrieb:
Pha werde nie wieder ein RAID machen...
Ein RAID macht schon Sinn, aber man muss wissen wie man damit umgeht, nur einfach ein RAID aufsetzen und sich dann sicher fühlen, ist eben nicht. Man muss trotzdem Backups haben, den Zustand des RAIDs regelmäßig prüfen und bei Problemen rechtzeitig handeln.

domidragon schrieb:
Weisst du per Zufall, wo die Netzlaufwerke gespeichert werden, damit man die übernehmen kann?
Keine Ahnung, frage doch mal in Unterforum für Windows.
 
Huhu

Auf welche Platten denn? Doch hoffentlich nicht auf eine dieser alten Greeen oder die Ersatzplatten, die schon mal zu Boden geflogen sind. Bei denen wäre es kein Wunder wenn es dann Probleme mit der Installation gibt.

Auf keinen, ich komme nicht zum Auswahlmenü, das ist ja mein Problem, bricht nach dem Laden der Windows Setup Files bereits ab.
Natürlich nicht die. Darum habe ich ja neue besorgt, die, die auf den Boden gefallen sind, sind ready für die Entsorgung.
Aktuell sind nur noch die Platten fürs RAID5 aktiv angehängt, plus die neue SSD.

Ich habe die letzten 2 Monate 12h am Tag gearbeitet, da ist kein Laden mehr offen, wenn mann unterwegs ist, hat sich genug anderes angestaut in der Zeit. Wie gesagt, Zeit ist so ein Ding, das ich mir kaum leisten konnte, jetzt gehts um Schadensbegrenzung. Der Server wird auch einige Wochen dauern, bis der wieder richtig eingerichtet ist bei meinem Zeitbudget aktuell...


Das mit dem rumliegen ist heftig. Die lagen eh schon 2 Jahre rum.


Dann versuche ich mal, die Installation irgendwie zum laufen zu bekommen.

Dank Dir für die ausführlichen Infos!
Ergänzung ()

Nun hat es mit der Installation geklappt! Endlich. :)

Kennst du ein gescheites Image Backup Tool, um möglichst wenig Zeitverlust bei einer Wiederherstellung zu haben? Oder ist Acronis immer noch eines der Besten?
 
Keine Ahnung welches Tool bei einer HDD in dem Zustand taugt, vielleicht Acronis oder auch die Backupfunktion von Windows, jedenfalls würde ich eines nehmen welches nur die wichtigen Sachen kopiert und nicht alles klont, denn wenn alles geklont wird, fällt es bei den schwebenden Sektoren wohl sicher aus die Nase und wenn nur die wichtigen Sache kopiert werden und es nicht auf die Nase fällt, ist wahrscheinlich nichts wichtiges durch die schwenden Sektoren beschädigt.
 
Ne sorry, ich meinte für ein regelmässiges Backup und Restore beim nächsten Fall :)
 
Zurück
Oben