Raid 5 Degraded durch Systemstart von Windows 7

dEeP-fRiEd

Cadet 4th Year
Registriert
Okt. 2005
Beiträge
70
Hi,

habe follgendes schon im Zusammenstellungen Forum gepostet, aber ich schätze hier macht es mehr Sinn.


Und zwar habe ich mir vor kurzem einen neuen Rechner zusammengestellt:
-Intel Core i7 -860
-Gigabyte GA-P55A-UD3
-PowerColor Radeon HD 5870 PCS+
-G.Skill RipJaws DIMM Kit 4GB PC3-12800U CL7
-3x Samsung SpinPoint F3 1000GB, SATA II (HD103SJ)

Auf den Festplatten habe ich zwei RAID Volumes eingerichtet: Eine Systempartition im Raid 0 und eine Datenpartition im Raid 5.

Damit hat sich nun ein Problem ergeben: Gestern morgen ist der Rechner beim Booten von Windows 7 eingefroren bzw. zumindest hat sich ewig (10 Minuten) nichts getan und ich habe daher reset gedrückt. Dadurch ist das Raid 5 (obwohl davon nicht gebootet wird o_O) "degraded" mit dem super hilfreichen Hinweis "Error Occurred" auf Memberdisk 0. Das Rebuilden sollte dann 26h dauern. Da sich dort grade mal 10 GB befanden, habe ich diese einfach aufs RAID 0 rüberkopieren und das RAID 5 neu angelegt.

Jedenfalls frage ich mich jetzt, ob die eine Festplatte einen Defekt hat. Habe mal mit HD Tune Pro das Raid Array nach Fehlerhaften Sektoren gecheckt: Alles ok so weit.

Alles denke ich mir, dass das Raid Problem nur auf Grund des Resets zustande kam.

Der Systemstart kommt mir jetzt so wie ne Zeitbombe vor, der das Array wohl jederzeit lahm legen könnte, falls die ursprüngliche Fehler weiterbesteht.

Also frage ich mich natürlich, wieso der Bootvorgang schief ging. Gibt es da irgendwelche Möglichkeiten das rauszubekommen? Habe schon ins "Ereignisprotokoll" geschaut, aber das wird wohl erst nach dem Systemstart befüttert.

Die Startprotokollierung (zu finden über die msconfig) habe ich nun angeschaltet, aber das bringt mir rückwirkend ja nichts.

Weiß jemand ne bessere Möglichkeit?

Schon mal danke für alle Ratschläge.
 
Du hast auf 3 Platten gleichzeitig ein Raid5 und ein Raid0 angelegt? Vielleicht solltest Du das mal überdenken :-)
Und das Error Occured ist im Falle eines Onboard-Intel-Controllers meistens ein Software-Fehler im Zusammenspiel mit der Security-Software die installiert ist.
 
3x Samsung SpinPoint F3 1000GB, SATA II (HD103SJ)

Auf den Festplatten habe ich zwei RAID Volumes eingerichtet: Eine Systempartition im Raid 0 und eine Datenpartition im Raid 5.

da solltest du dir echt nochmals die Grundlagen RAID zu gemüte führen, das sind dann auch immer die Leute die an nem schlechten Image eines RAIDSystems schuld sind ...typischer Layer8 Fehler ;P
 
*gg* sehr hilfreich waren die beiden vorherigen kommentare ja nicht .
aber die Grundlagen sind schon sehr wichtig :)

@fredersteller : Nimm noch eine Festplatte mehr zur Hand, nimm diese als Bootplatte und pack das das BS drauf. Der Raid5 Modus über die drei Spinpoints is schon ok, solange du den Onboard Raidcontroller verwendest !?
Wenn du keine weitere einbauen magst oder kannst, was spricht gegen das Booten im Raid5
(außer der extrem langen Wiederherstellungszeit;) ?

Wegen "Wo finde ich genauere Details" kann ich dir nicht helfen.Sry.

Grüße
 
über einen onboard Controller 2 Raids auf den gleichen Platten zu fahren ist sehr fahrlässsig. Auch ein Raid 5 würde ich da nicht machen, das Ausfallrisiko ist viel zu groß und dann sind 2TB futsch. Die meisten Protokollierungen und Testprogramme funktionieren bei einem Fake Raid auch nicht mehr. (Smart daten werden ja auch nicht mehr weitergegeben.)

Nebenbei sollte das Raid 5 änlich schnell sein wie das Raid 0, also nimm wenn es schon so sein muß alle Platten komplett ins Raid 5 und partitionier dir was du brauchst, sonst blockieren die sich gegenseitig und der "Geschwindigkeitsvorteil" des Raid 0 ist wieder weg.

Empfehlen würde ich dir eine SSD als Systemplatte und ein Raid 1 für Daten, alles andere bringt, wie du bemerkt hast deutlich mehr nachteile als Vorteile, außer Du leistest Dir einen "vernünftigen" Hardwarecontroller, der dann aber halt mehr kostet als das gesamte MB. Allerdings ist dies die einzige Lösung ein Raid vernünftig zu fahren.

Übrigens: Ein Raid ersetzt NIEMALS ein Backup, es ist lediglich ein redundantes System. (bis auf Raid 0)
 
error occured (bei festplatten im raid verbund) heißt üblicherweise, die festplatte ist kaputt (mir gestern auch passiert) ... dadurch wird dein raid heruntergestuft (degraded) und ist nicht mehr ausfallsicher.

also die fehlerhafte platte ausbauen und einzeln testen. heißt: smart-werte überprüfen etc.

wenn du keine ersatzplatte hast, lass das raid am besten solange aus. sobald du wieder eine funktionsfähige platte hast (egal ob "repariert" oder komplett neu), kannst du mit dieser wieder dein raid hochstufen.
 
Schon mal danke für die Hinweise.

Die SSD Lösung, die Nitewing vorschlägt, wäre sicherlich das sinnvollste. Ist mir momentan aber zu teuer; hab den Rechner ja grade erst gekauft. (Vlt. rüste ich das später mal nach)

Auf die Idee mit den zwei Raid-Volumes kam ich durch einen Bekannten, der sich nen ähnlichen Rechner wie ich zusammengestellt hat. Von der Performanz her scheint es mir übringens unproblematisch: Hatte zunächst eine reine RAID 5 Konfiguration ausprobiert; mit meiner jetzigen Lösung hat sich u.a. der Windows Leistungsindex von 3,7 auf 6,3 verbessert, Spiele laufen flüssig, etc.

Aber ihr habt wohl recht, dass es zu Fehleranfällig ist. Hatte grade wieder ein ähnliches Problem: Beim Installieren eines Programms reagierte Windows auf ein mal nicht mehr, da wollte ich in den Taskmanager und anschließend bekam ich den "Black Screen of Death" (nur noch Maus reagiert). Obwohl das Festplattenlämpchen leuchtete blieb mir nix anderes übrig als Reset zu drücken, was den Raid 5 wieder degraded hat :(

Werde mir, wenn das Problem weiter auftritt überlegen auf ne Kombination von RAID 0 und 1 umzusteigen, oder meint ihr das dass genauso "fahrlässsig" ist bzw. hat RAID 0 das gleiche "Degradierungsverhalten" beim Reset?
RAID 10 kommt ja glaube ich erst ab 4 Platten in Frage?

Ein Raid ersetzt NIEMALS ein Backup, es ist lediglich ein redundantes System. (bis auf Raid 0)
Ist mir klar.

error occured (bei festplatten im raid verbund) heißt üblicherweise, die festplatte ist kaputt (mir gestern auch passiert) ... dadurch wird dein raid heruntergestuft (degraded) und ist nicht mehr ausfallsicher.

also die fehlerhafte platte ausbauen und einzeln testen. heißt: smart-werte überprüfen etc.
Naja die Festplatten sind wie der Computer nagelneu und ich bin mir inzwischen sicher, dass die Degradierung nur durch den Rest Zustande kam. Aber kann ich aus deinem Beitrag schließen, dass ich die SMART-Werte nur einsehen kann, wenn ich den RAID auflöse? Ist mir nämlich gestern nicht gelungen, die Werte auszulesen.


Habe nun noch ein paar Fragen:
- Kann man irgendwas anderes tun als Reset drücken, wenn Windows 7 nicht mehr reagiert (kenn mich mit dem neuen System noch nicht aus; STRG+SHIFT+ESC hab ich probiert und bei STRG+ALT+ENTF kam der besaget Black Screen!)

- Habe im Intel Matrix Storage Controler gesehen, dass ich den "Rückschreibecache" aktivieren könnte - das bringt aber höchstens Geschwindigektisvorteile und keine "Reset-Robustheit" (da evtl. weniger frequent geschrieben wird), oder?

- Warum wird das RAID 5 degraded, obwohl zu dem Zeitpunkt eigentlich immer nur das RAID 0 beschrieben wurde. Gibts evtl. irgendwelche Win 7 Settings, durch die vom Nutzer unabhängig auf sämtlichen Partitionen "rumgefuscht" wird?

- Muss eigentlich immer das komplette Raid Volume neuaufgebaut werden, wegen so nem Fehler, der ja höchstens nen kleinen Teil des Volumes betroffen haben kann, insbesondere da das Volume fast leer ist, oder liegt das evtl. nur an dem Intel Programm, soll heißen gibts da vielleicht andere Programme, die das besser machen?
 
dEeP-fRiEd schrieb:
Auf die Idee mit den zwei Raid-Volumes kam ich durch einen Bekannten, der sich nen ähnlichen Rechner wie ich zusammengestellt hat. Von der Performanz her scheint es mir übringens unproblematisch: Hatte zunächst eine reine RAID 5 Konfiguration ausprobiert; mit meiner jetzigen Lösung hat sich u.a. der Windows Leistungsindex von 3,7 auf 6,3 verbessert, Spiele laufen flüssig, etc.
Was zeigt: RAID5 macht erst mit einem anständigen Controller Spaß.

dEeP-fRiEd schrieb:
Werde mir, wenn das Problem weiter auftritt überlegen auf ne Kombination von RAID 0 und 1 umzusteigen, oder meint ihr das dass genauso "fahrlässsig" ist bzw. hat RAID 0 das gleiche "Degradierungsverhalten" beim Reset?
RAID 10 kommt ja glaube ich erst ab 4 Platten in Frage?
Das Problem ist ja, dass das Teil mit dem Reset das RAID-Set erstmal als fehlerhaft ansieht - und das dürfte bei einem RAID1 genauso passieren.
R10 geht erst ab 4 HDDs, richtig.

dEeP-fRiEd schrieb:
- Habe im Intel Matrix Storage Controler gesehen, dass ich den "Rückschreibecache" aktivieren könnte - das bringt aber höchstens Geschwindigektisvorteile und keine "Reset-Robustheit" (da evtl. weniger frequent geschrieben wird), oder?
Genau, dann werden schon Daten die im Cache der HDDs liegen als geschrieben markiert - das bringt bei kleinen Dateien einen Vorteil, aber es bringt auch eine mögliche Fehlerquelle mehr: Sobald der Cache-Inhalt gekillt wird (wobei ich gerade nicht weiss, ob das bei einem Reset passiert oder nur wenn der Strom spontan weg ist) fehlt wieder ein kleiner Teil der Daten - und das kann Probleme geben.

dEeP-fRiEd schrieb:
- Muss eigentlich immer das komplette Raid Volume neuaufgebaut werden, wegen so nem Fehler, der ja höchstens nen kleinen Teil des Volumes betroffen haben kann, insbesondere da das Volume fast leer ist, oder liegt das evtl. nur an dem Intel Programm, soll heißen gibts da vielleicht andere Programme, die das besser machen?
Dooferweise weiss der Controller ja nicht, wo bereits Daten liegen - und dementsprechend kann das Teil nur ganz treudoof das RAID überprüfen.
Das Problem wurde bei .. ähh, ZFS angegangen - das ist so eine Kombination aus Dateisystem und Soft-RAID, bei dem eben der Inhalt des Dateisystems mit berücksichtigt wird wenn ein Rebuild nötig wird. Aber das gibts natürlich wieder nicht für Windows-Nutzer...
Das Intel-Programm zeigt dir eigentlich nur an, was der Controller grad tut - der arbeitet ja unabhängig vom Betriebssystem.
 
du kannst einfach die platte abziehen und an einem anderen controller anschließen und da überprüfen ... die sicherheit hast du ja noch, weil sowohl raid 1 & 5 sowas verkraften.

das raid wird immer als unsicher eingestuft, wenn es nicht ordnungsgemäß heruntergefahren wurde. programme können nicht den status vom raid system überprüfen, sondern nur treiber. und da solltest du auf jeden fall bei intel bleiben, anderes ist mir auch nicht bekannt.

theoretisch kann auch der controller smart werte auslesen, intel hat das nur nicht implementiert ...

der rückschreibcache bringt einige performance, große nachteile sehe ich nicht. ausfallen kann es auch direkt bei der übertragung, wäre genauso problematisch. (wenn du also nicht gerade eine blackbox von einem raumschiff ausstattest)
 
<-- versteht diesen Matrix-Raid-Müll nicht.
Entweder man richtet auf seinen Platten einen Raid5-Daten-Array ein, oder ein Raid0-Performance-Array aber keinen Mix. Das macht man bitte mit zwei Platten-Sets und nicht über ein Platten-Set auch wenn Intel das so wunderbar verkauft. Komisch das kein anderer Controller-Hersteller so was anbietet. Es hat schon seine Gründe.

Performance-Raid0 für ein OS und Games? Wo 75% aller Dateien kleiner sind als die Stripsize (oder hast Du 8k eingestellt) ist in meinen Augen völlig umsonst.
 
Und ganz ehrlich, nur weil der Windows Leistungsindex jetzt höher ist tust du dir das an?
Eine 40GB SSD, die für das OS locker reicht kostet 100€. Glaub mir, du wirst das OS nie wieder auf einem Raid laufen lassen wenn Du eine SSD haben kannst. Vor allem nicht auf einem Fake Array.

Mein Raid 5 kann deutlich über 500MB/s lesen und schreiben, aber die SSDs sind trotzdem performanter, da die Access Time wesentlich wichtiger ist... und die steigt im Raid 0 eher
 
HisN schrieb:
<-- versteht diesen Matrix-Raid-Müll nicht.
Entweder man richtet auf seinen Platten einen Raid5-Daten-Array ein, oder ein Raid0-Performance-Array aber keinen Mix. Das macht man bitte mit zwei Platten-Sets und nicht über ein Platten-Set auch wenn Intel das so wunderbar verkauft. Komisch das kein anderer Controller-Hersteller so was anbietet. Es hat schon seine Gründe.

immerhin sind Intel und Silicon Image(kann das auch) keine Hinterhofanbieter, und man kann auch mit einem einfachen RAID ohne Mix Unsinn treiben :)

Der TE hat aber eine etwas unglückliche Konfig gewählt, die ihre Tücken hat.
Hat irgendeine der drei Platten eine Macke, dann ist der vorne liegende RAID0 in jedem Fall im Eimer, und ohne System lebt sichs schlecht, wenn man nicht eines in Reserve hat :)
 
Und ganz ehrlich, nur weil der Windows Leistungsindex jetzt höher ist tust du dir das an?
Mit "das" meinst du das Vermischen von 2 verschiedenen Raids? Um das nochmal klar zu stellen, die Performanz des Raid ist gerade nicht mein Problem, sondern lediglich die "Reset-Problematik".

Und insofern bin ich froh, dass ich jetzt nicht ein reines Raid 5 gefahren bin, weil ich sonst entweder schon 2x 26h hätte warten müssen oder das Betriebssystem neu installieren hätte müssen.

Das Problem ist ja, dass das Teil mit dem Reset das RAID-Set erstmal als fehlerhaft ansieht - und das dürfte bei einem RAID1 genauso passieren.
Hm das ist doof. Hatte nämlich jetzt überlget eine Platte für das Betriebssystem ohne Raid und die anderen beiden gespiegelt zu betreiben, aber wenn man bei nem Absturz/Reset generell Probleme bekommt, weiß ich nicht ob ich überhaupt noch auf Redundanz setzen soll, oder einfach alles im Raid 1 betreiben sollte, zumnal ja Backups sowieso Pflicht sind.

Btw: Stimmt es das eine extra Controllerkarte, das Problem nicht hat, da da ein extra Speicher drauf ist, der sich selbst bei nem Reset (solange der Strom nicht ausfällt) merken würde, wo/was zuletzt geschrieben wurde?
 
Der schreibt Daten solange die Platten online sind.
Ist aber kein Grund aufs Backup zu verzichten :-)
 
Die Problematik liegt darin, dass ein Onboard-Controller von seinen Treibern und diese von der Mainboard-CPU abhängig sind. Wird das System normal runtergefahren, wird auf den Platten "Datenintegrität OK" vermerkt. Fehlt das, so gibt es keinen Plan, wo was zu überprüfen wäre, also muss alles abgeackert werden.
Beim Schreiben auf einem RAID5 muss auf mehreren HDDs operiert werden, um die Parityinformation richtigzustellen, welche durch die Datenänderung beim Schreiben verursacht wird.
Ein externer Controller macht das mit seiner eigenen CPU auch noch, wenn sich der restliche Klimbim am Mainboard(BIOS oder System) erhängt hat, und mit einem Battery Pack selbst dann, wenn der Saft wegbleibt.
Und insofern bin ich froh, dass ich jetzt nicht ein reines Raid 5 gefahren bin, weil ich sonst entweder schon 2x 26h hätte warten müssen oder das Betriebssystem neu installieren hätte müssen.
Das Rebuild eines RAID5 eines Onboard-Controllers zerstört das System nicht, es wird halt nur arschlahm. Die benötigte Zeit kann man runterdrücken, indem man die Stripesize so hoch wie möglich setzt (doppelte Stripesize=halbe Rebuilddauer).
 
Zuletzt bearbeitet:
Das Rebuild eines RAID5 eines Onboard-Controllers zerstört das System nicht, es wird halt nur arschlahm. Die benötigte Zeit kann man runterdrücken, indem man die Stripesize so hoch wie möglich setzt (doppelte Stripesize=halbe Rebuilddauer).
Ah das wusste ich nicht. Gut zu wissen :-)


Jedenfalls hatte ich inzwischen (heute) ein neues Problem: Das System ist beim Spielen von "Crysis Warhead" komplett eingefroren (Bild hängt, Sound hängt, nichts reagiert).

Da ich nun doch einen Hardwaredefekt befürchtet habe, hab ich mal CPU und RAM mit Prime95 und Memtest86+ durchgetestet - damit scheint aber alles in Ordnung zu sein.

Jedenfalls hab ich nun mal Testweise das Raid 5 entfernt und nur noch das Raid 0 laufen. Kommt mir jetzt so vor, dass das System schneller startet. Ich werde jetzt erst mal damit ne Weile beobachten, ob alles Stabil läuft, wenn ja ist's das endgültige aus für meine Raid 5 Überlegung.

Eventuell könnte es natürlich auch irgend ein Treiberproblem sein. Habe mal gegoogelt und scheinbar gab es schon bei Anderen "Freezes" auf Grund von Realtek Treibern. Auf der Gigabyte Webseite gibt es allerdings keine neueren, als die die auch auf meiner Treiber CD mitgeliefert wurden.


Was ich mich jetzt noch Frage: Ist es möglich das vorhandene Raid 0 auszuweiten, so dass es über den kompletten verfügbaren Speicherplatz geht? Hab nämlich eigentlich keine Lust, alles wieder neu zu installieren; mit dem Intel Programm scheint es jedenfalls nicht zu gehen ("Volumenkapazität erhöhen" ist ausgegraut :( )
 
Hallo!

ich bin auf deinen Forumsbeitrag gestoßen, da ich genau das gleiche Problem habe. Das interessante ist, ich habe das gleiche Mainboard wie du, gleiche CPU, (fast) die gleiche Graka und habe auch ein Raid System mit Samsung Festplatten.
Bei mir sind es jedoch zwei Platten, die in einem Raid1 laufen. Gesamte Hardware kürzlich neu gekauft, muss ich dazu sagen.
Ähnlich wie bei dir lief es ein paar Tage problemlos, bis es plötzlich losging: System friert ein, sowohl in Windows, als auch in Spielen, nur Reset half noch. Manchmal Bluescreens mit utnerschiedlichen Meldungen. Naja jedenfalls nach dem Reset stand bei mir beim Booten in der Raid-Übersicht bei einer Platte ebenfalls "Error Occurred" und anschließend auch in Windows sowas wie "Drive missing" oder etwas ähnliches.
Das hört sich doch alles sehr ähnlich zu deinem Problem an, vor allem auch bei gleicher Hardware - kann das Zufall sein? Hat sich bei dir etwas neues ergeben? Wäre cool wenn du dich hier nochmal meldest wie es bei dir weiterging.

P.S: Die Platten selbst scheinen mir nicht defekt, habe sie in einem anderen System eingebaut und per SMART getestet sowie Benchmarks durchgeführt - keinerlei Probleme. Kann es vielleicht doch am MainBoard liegen? Hat das vielleicht einen Hau weg....
 
Hi Majortomster,

sorry für die späte Antwort - muss mir mal angewöhnen hier nicht nur reinzuschauen, wenn ich selbst Probleme habe...

Mein Raid 0 lief jetzt über ein Jahr stabil / ohne Probleme. Daher denke ich, dass der Onboard Controller einfach ungeignet ist für Raid 5. Kürzlich bin ich nun auf Raid 10 umgestigen und schon habe ich wieder Probleme :( Raid 1 habe ich (noch) nicht ausprobiert, aber ich könnte mir vorstellen, dass es mit dem OnBoard Controller generell zu Problemen kommt, sobald dieser Redundanzen garantieren muss...

Ich würde also vermuten, dass auch deine Platten keinen defekt haben.
Oder hat sich bei dir inzwischen was neues ergeben?
 
Zuletzt bearbeitet:

Ähnliche Themen

Zurück
Oben