PC.Server bootet sporadisch

rasa333

Newbie
Registriert
Okt. 2015
Beiträge
6
Moin!

Nach sechs Monaten macht mein PC-Server plötzlich Probleme. Alle zwei bis drei Tage wird ohne Vorwarnung neue gebootet. Das Gerät läuft 24h.
Es gibt keinerlei Hinweis auf die Ursache, die Linux-Logdateien geben keinen Hinweis.

Hier die Hardware:

CPU-Lüfter: Enermax ETS-T40-TB
CPU: Intel Core i7-5960X
Netzteil: Thermaltake Munich 430W
Mainboard: GigaByte GA-X99-UD3
GraKa: MSI 1GB D3 X N210-MD1GD3H
RAM: DDR4 16 GB Kingston
1xSSD 128GB Samsung 850 Pro Basic
2xHDD 3TB Western Digital WD30EFRX Red (als Raid-1)

Auf dem Rechner laufen Datenbank-Anwendungen, rund um die Uhr.

Wenn ich absichtlich hohe Last auf allen 8 Kernen erzeuge tritt das Problem dadurch NICHT häufiger auf.
Nach dem was ich hier bereits gelesen habe könnte es wohl am Netzteil oder auch an der CPU liegen.

Gibt es einen Weg den Fehler näher einzukreisen?

rasa333
 
Was für ein OS genau läuft denn? Wenn sonst keine Fehler auftreten, wird es wohl nicht die CPU sein, denn wenn die rummuckt, geht meist gar nichts. Netzteil wäre möglich, RAM theoretisch auch, aber eher unwahrscheinlich, wenn es sonst keine Anzeichen gibt. Ist der Prozessor übertaktet? Du kannst mit lm-sensors die Temperatur überwachen und schauen, ob es an mangelnder Kühlung liegt.
 
runagrog schrieb:
Was für ein OS genau läuft denn? Wenn sonst keine Fehler auftreten, wird es wohl nicht die CPU sein, denn wenn die rummuckt, geht meist gar nichts. Netzteil wäre möglich, RAM theoretisch auch, aber eher unwahrscheinlich, wenn es sonst keine Anzeichen gibt. Ist der Prozessor übertaktet? Du kannst mit lm-sensors die Temperatur überwachen und schauen, ob es an mangelnder Kühlung liegt.

Das ist ein Debian Linux, der Rechner ist nicht übertaktet, die Temperatur der Kerne liegt bei ca. 40 Grad, unter hoher Last gehts über knapp 50 Grad.

Wie gesagt, kein "Kernel-Panic" oder dergleichen, als ob wer kurz den Stecker zieht -- von daher evtl. tatsächlich das
Netzteil.

rasa333
 
Dann klingt das zumindest für meine Begriffe wirklich nach dem Netzteil. Ein anderes zum Gegentesten hast du nicht zur Hand?
 
runagrog schrieb:
Dann klingt das zumindest für meine Begriffe wirklich nach dem Netzteil. Ein anderes zum Gegentesten hast du nicht zur Hand?

Das Netzteil muss ich erst noch besorgen, besonders viel Leistung brauche ich eigentlich nicht, dar die verbaute NVidia-GraKa praktisch nur bei Wartungsarbeiten im Text-Modus benutzt wird. Zuverlässigkeit ist wichtig, der Server muss laufen.

Über eine Empfehlung würde ich mich freuen... Vermutlich reichen auch weniger als 400 Watt locker aus. Eigentlich nahm ich an Thermaltake sei eine "gute" Marke aber Montagsgeräte gibt es wohl überall. Achja, möglichst leise sollte es sein, gerne auch Semi-Passiv.
 
rasa333 schrieb:
Das Netzteil muss ich erst noch besorgen, besonders viel Leistung brauche ich eigentlich nicht, dar die verbaute NVidia-GraKa praktisch nur bei Wartungsarbeiten im Text-Modus benutzt wird. Zuverlässigkeit ist wichtig, der Server muss laufen.

Über eine Empfehlung würde ich mich freuen... Vermutlich reichen auch weniger als 400 Watt locker aus. Eigentlich nahm ich an Thermaltake sei eine "gute" Marke aber Montagsgeräte gibt es wohl überall. Achja, möglichst leise sollte es sein, gerne auch Semi-Passiv.

Habe mich nun für ein Seasonic S12II-430 Watt entschieden, der Hersteller wird überall fast nur gelobt. Ich berichte weiter.
 
rasa333 schrieb:
Moin!

Nach sechs Monaten macht mein PC-Server plötzlich Probleme. Alle zwei bis drei Tage wird ohne Vorwarnung neue gebootet. Das Gerät läuft 24h.
Es gibt keinerlei Hinweis auf die Ursache, die Linux-Logdateien geben keinen Hinweis.

Hier die Hardware:

CPU-Lüfter: Enermax ETS-T40-TB
CPU: Intel Core i7-5960X
Netzteil: Thermaltake Munich 430W
Mainboard: GigaByte GA-X99-UD3
GraKa: MSI 1GB D3 X N210-MD1GD3H
RAM: DDR4 16 GB Kingston
1xSSD 128GB Samsung 850 Pro Basic
2xHDD 3TB Western Digital WD30EFRX Red (als Raid-1)

Auf dem Rechner laufen Datenbank-Anwendungen, rund um die Uhr.

Wenn ich absichtlich hohe Last auf allen 8 Kernen erzeuge tritt das Problem dadurch NICHT häufiger auf.
Nach dem was ich hier bereits gelesen habe könnte es wohl am Netzteil oder auch an der CPU liegen.

Gibt es einen Weg den Fehler näher einzukreisen?

rasa333


Bisher keine Lösung in dieser Sache, ich habe

- das Netzteil ausgetauscht,
- die Grafikkarte ausgetauscht
- das RAM über 4 Stunden getestet
- die CPU-Lüfter getauscht
- ich habe das Raid-1 jeweils durch eine neue WD-Red getauscht.

Ich überwache die CPU-Temperatur aber die ist nie über 50 Grad. Die Effekte beim sporadischen Booten
sind unterschiedlich;

- es kommt niemals eine Vorwarnung, kein Kernel-Panic oder dergleichen
- entweder der Rechner bootet direkt wieder das Debian, manchmal jedoch kommt eine
Fehlermeldung vom BIOS die BIOS-Einstellungen würden nicht mit der Hardware übereinstimmen
- eine andere Variante ist, das der Rechner schlicht mit einem schwarzen Bildschirm läuft aber
das Debian nicht gestartet wird -- ich kann dann aber noch mit ALT-CTRL-DEL neu starten.

Auffällig ist auch, dass der Rechner am Wochende kaum oder gar nicht abstürzt, nur in der Woche
wenn die Datenbank aktiver ist als am Wochenende. Direkt vor dem Reboot ist die CPU NICHT
besonders aktiv, normale Last.

Es kommt mir fast so vor als würde sich das Mainboard durch höhere Bus-Last irgendwie "Abnutzen" und
und irgendwann komplett versagen.

Ich bin mit meinem Latein so ziemlich am Ende, gerade die BIOS-Fehlermeldung das die Hardware
nicht den Einstellungen entspricht ist doch eigenartig, ich lade dann die "Optimized Defaults" und das
System startet dann normal -- bis zum nächsten sporadischen Boot :-( mindestens (in der Woche) einmal
pro Tag.

Hilfe!
rasa333
 
Hallo !

Das Problem ist gelöst! Ich habe das RAM im BIOS von 2133 auf 2000 Mhz runtergetaktet. die RAM-Module sollten eigentlich
mehr verkraften aber egal, Performance des Systems ist trotzdem gut.

Übrigens ist das RAM kein Kingston sondern Crucial 4x4 GB Module.




rasa333 schrieb:
Moin!

Nach sechs Monaten macht mein PC-Server plötzlich Probleme. Alle zwei bis drei Tage wird ohne Vorwarnung neue gebootet. Das Gerät läuft 24h.
Es gibt keinerlei Hinweis auf die Ursache, die Linux-Logdateien geben keinen Hinweis.

Hier die Hardware:

CPU-Lüfter: Enermax ETS-T40-TB
CPU: Intel Core i7-5960X
Netzteil: Thermaltake Munich 430W
Mainboard: GigaByte GA-X99-UD3
GraKa: MSI 1GB D3 X N210-MD1GD3H
RAM: DDR4 16 GB Kingston
1xSSD 128GB Samsung 850 Pro Basic
2xHDD 3TB Western Digital WD30EFRX Red (als Raid-1)

Auf dem Rechner laufen Datenbank-Anwendungen, rund um die Uhr.

Wenn ich absichtlich hohe Last auf allen 8 Kernen erzeuge tritt das Problem dadurch NICHT häufiger auf.
Nach dem was ich hier bereits gelesen habe könnte es wohl am Netzteil oder auch an der CPU liegen.

Gibt es einen Weg den Fehler näher einzukreisen?

rasa333
 
Zurück
Oben