RAID degraded - Ursachenforschung ...

Bigchipmunk

Cadet 4th Year
Registriert
März 2006
Beiträge
120
Hallo zusammen,

ich habe seit ein paar Tagen ein neues System siehe Sig. Lief bisher sehr stabil und ist nicht OC. (Board ist ein Asus P6T SE)

Nun zum Problem.

Ich hatte u.a. 2x Samsung HD502HJ als RAID1 als reine Datenpartition. Plötzlich im Betreb von Windows beim Speichern erhielt ich die Meldung "RAID degraded" und alles war sehr langsam. Nach nem Neustart lief alles schnell, aber halt nur auf einer Platte. Also neue Platte (wieder HD502HJ) gekauft und auf dieser ein Rebuild gemacht. Der ist nach 5 Minuten abgebrochen und ich hatte wieder ein "RAID degraded".

Nun habe ich wieder die erste vermeintlich kaputte Platte reingehängt, und darauf ein erneutes Rebuild gemacht (ca. 90 Minuten). - Das hat funktioniert. Die 3. Platte habe ich einfach so im System und sie funktioniert auch.

Nun, woran kann das liegen, das das RAID meint kaput zu sein, die Platten aber funktionieren?

Ich bin für Tipps zur Ursachenforschung dankbar.

Danke und Gruß,
Denny

PS.: noch ne Frage am Rande, gibt es ne möglichkeit den S.M.A.R.T.-Status der Platten "hinter" dem RAID Controller auszulesen? - Beim Booten steht nur "OK", mich würden aber Fehler und Temps interessieren.
 
Das kommt mir irgendwie bekannt vor :D

Ist es zufällig ein Intel-Board/Controler?



Sitzen alle Kabel fest - Wackler?!
Treiber etc sauber installiert?



LG
 
Asus P6T SE Board mit Intel ICH10R Controller.

Kabel sind mMn fest, Treiber habe ich auch den aktuellsten von Asus geladen:
Intel(R) Matrix Storage Manager V8.9.0.1023
 
tsewas hab mit Raid 0 nur schlechte Erfahrungen gemacht ! Entweder gingen Platten kaputt oder hatten Sata Kabel nen Wackler (Datenverlust ohne Ende) ! Mittlerweile verzicht ich auf Raid und mach mit Acronis True Image jeden Monat ne Systemsicherung ! Verwende nur noch Serverplatten da mein Pc auch Fernseher und Videorecorder bzw. Blu Ray Player ist.

mfg Herbert
 
ok tschuldige hab ich falsch gelesen aber Raid macht glaub gern probleme ohne gescheiten Raid Controller
 
Bigchipmunk schrieb:
ähm, doofe Frage, ist der ICH10R kein gescheiter RAID Controller?

Alle Software Controller sind was für den Hintern - Deiner ist ein Software Controller.

N gescheiter Hardware Controller von Adaptec oder Promise und gut ist - aber die kosten auch was ;)

LG
 
Naja zum Anschließen vom DVD-Brenner reicht der ICH10R schon :D

Ich hab mit dem Adaptec 3805 vor einigen Wochen über 1,5 TB Datenschrott generiert weil der SAS Expander aufgrund mangelder Kühlung meinerseits Datenfehler verursacht hat beim Verify And Fix prozess. Im Normalbetrieb hat die Kühlung gereicht.....

Mt Samsung Platten hab ich allerdings schon öfter Probleme in Verbindung mit RAID 1 und 5 gehabt. :freak: Mit den WD-10EADS (mit auf 7s eingestellter TLER) gehn die Arrays bei Plattenfehlern im gegensatz zu den Samsung Laufwerken nicht offline weil die Platte zu lange gebraucht hat um "Hallo ich bin Tot" zu sagen.

IntelliPark sollte man auch mit WDIDLE abschalten um nicht den aborted Commands Zähler innerhalb eines Tages auf gut 8000 hochzujagen :rolleyes:

MfG
 
Skudrinka schrieb:
Alle Software Controller sind was für den Hintern - Deiner ist ein Software Controller.
Hab noch nie gehört, dass ein Controller zur Software gezählt wird, und dachte das wird von einem Chip am Board (deswegen heißt es onboard-Controller) gemanagt.

Aber als Fachinformatiker lebt man vielleicht in einer etwas anderen Welt, wo mehr Informationsmüll produziert wird :lol:

Bigchipmunk schrieb:
PS.: noch ne Frage am Rande, gibt es ne möglichkeit den S.M.A.R.T.-Status der Platten "hinter" dem RAID Controller auszulesen? - Beim Booten steht nur "OK", mich würden aber Fehler und Temps interessieren.

Die Ursachenforschung könntest Du damit beginnen,
- Dir ein eSATA/SATA Adapterkabel 1m zu besorgen
- nach einem Rausschmiss der Platte die SMART-Werte dieser erheben, indem Du sie mit dem Kabel über den eSATA-Port an der Rückwand an den jMicron JMB363 anschließt.
Die Methode eignet sich auch zur periodischen Prüfung beider intakten RAID-Member, dabei sollten beide Platten vom ICH abgeklemmt werden, und je eine unter einer Linux-LiveCD im Read-only mode (geht unter Win ja nicht) am eSATA inspiziert werden, damit sie nicht asynchron gemacht werden, ohne dass der ICH-Controller das mitkriegt.

Präventiv könnte man billige Platten zuerst mal komplett mit einem Shredderprogramm zum "sicheren Löschen" einige Tage lang beschreiben (für was anderes sind die ohnehin nicht zu gebrauchen), bis alle schon bei Lieferung defekte Sektoren erkannt sind - dann noch ein "write all zero" mit dem Herstellertool, eine SMART-Inspektion und ein Benchmark helfen zu entscheiden, ob man die Platte gleich zurückschicken soll oder sie für ein RAID verwendbar sind.
Dann kann es gar nicht erst passieren, dass er die Platte gleich beim rebuild wieder rausschmeißt

Meist erfolgt der Rausschmiss, weil die Platte zu lange mit defekten Sektoren herumkämpft
 
Zuletzt bearbeitet:
Die Onboard RAID-Lösungen sind weder RAID-Controller noch Software RAID-Lösungen, Bezeichnungen dafür gibt es diverse, um mal ein paar zu nennen: Fake-RAID, Host-RAID. Die c't schrieb mal dazu:
Ein Mittelding zwischen Hard und Software-RAID sind viele der auf Mainboards integrierten RAID-Chipsätze sowie die meisten günstigen RAID-Adapter. Oft spricht man in diesem Zusammenhang von Host-RAID, denn die RAID-Funktion ist in der Adapter-Firmware beziehungsweise den Treibern implementiert. Aufwendige Berechnungen übernimmt wie bei
einem Software-RAID die CPU des Rechners. Die Adapter bezeichnet man oft spöttisch als FakeRAID. Doch einige moderne Mainboard- Chipsätze sind diesbezüglich erstaunlich
leistungsfähig.
 
c't Zitat: schrieb:
denn die RAID-Funktion ist in der Adapter-Firmware beziehungsweise den Treibern implementiert.
Ohne der Funktionalität des RAID-BIOS-ROM Moduls, welches die Chipsatz-Firmware des onboard-RAID-Controllers darstellt und die hier nicht aufgezählt wurde, würde das nicht laufen. Mit Treibern alleine wäre es funktionsmäßig ein Software-RAID mit I/Os auf Einzeldrives.
 
Das alleinige Vorhandensein eines RAID-BIOS wäre für mich kein Indikator für einen RAID-Controller der u. U. dann nur aus zwei Latchen (LS373 etc.) und etwas Logic besteht, aus vielmehr bestanden die Ur-IDE-Controller auch nicht und waren nicht mehr als etwas Logic um Daten auf einer Disk unterzubringen. Nur ab wann trifft wirklich der Begriff Controller zu? Ich würde es so sehen, dass dieser RAID-Controller oder HBA eigene 'Intelligenz' besitzt um z. B. die Disk's zu erkennen und richtig zum RAID zusammenzusetzen falls einmal die Kabel vertauscht wurden, Handling von Störungen, abwickeln der IO's ohne Einwirkung der CPU usw.
Ich habe beruflich mit RAID-Systemen gearbeitet, die einen fünf bis sieben stelligen Betrag kosten, das sind sicher RAID-Systeme, für einen älteren PC hatte ich mir mal einen Mylex mit drei SCSI-Channeln gegönnt, das war auch ein RAID-Controller, aber bei aller Liebe ein paar Gatter und ein Stückchen Firmware ist in meinen Augen kein RAID-Controller sondern nur eine Lösung RAID-Funktionen zu nutzen.
 
Nur ab wann trifft wirklich der Begriff Controller zu? Ich würde es so sehen, dass dieser RAID-Controller oder HBA eigene 'Intelligenz' besitzt um z. B. die Disk's zu erkennen und richtig zum RAID zusammenzusetzen falls einmal die Kabel vertauscht wurden,
Bis hierher schafft es die Firmware aus dem BIOS-ROM abgearbeitet von der Board-CPU im BOARD-RAM doch auch. Noch vor dem booten eines Systemes, wie man sich überzeugen kann
Die Intelligenz ist da, nur eben in arg beschränktem Rahmen; und als Steuer-und Regelschaltkreis in einem Chip verdient er auch die Bezeichnung Controller.
Als HBA würde ich so ein Ding nicht mehr bezeichnen - dem SATA-Interface fehlt leider ein wesentliches Merkmal von einem Bus - mehrere Teilnehmer. Daran ändert sich auch nichts, wenn am anderen Ende ein Portmultiplier hängt.
 
Zuletzt bearbeitet:
Danke für die vielen Beiträge ... sehr interessant, muss mich dann wohl doch nach nem "richtigen" RAID Controller umsehen ....

Gibt es denn noch Ideen zur Ursache des Ausfalls?
 
Nicht, bevor Du die Smart-Daten ausgelesen hast, wie oben beschrieben
 
Zurück
Oben