10G Ethernet Systemcrash

Mega-Bryte

Lt. Commander
Registriert
Aug. 2016
Beiträge
1.430
System: Asus TS700-E7/RS8 Barebone mit 2x Xeon E5-4620 und 8x 4GB Kingston HyperX DDR3 etlichen Festplatten und Sata SSD als Systemplatte, Windows 10 letzter Stand mit allem an guten Treibern ... läuft so seit Jahren als File-Server und Backup für alles andere drumherum.

Dann kam da eine Synology 1821+ mit E10G18-T2 (dual 10G RJ45) dazu und für den Server gab es erstmal "nur" eine TP-Link TX401. Wenns läuft, dann machen einzelne HDDs auch Vollgas mit 180-200MB/s.

Leider hat sich das System während des Kopierens wiederholt nach einigen zig Gigabyte hart aufgehängt - nur HW-Reset hat geholfen. Auch ein Umstecken in einen anderen PCIe-Steckplatz (Anbindung an CPU1 oder CPU2) brachte dasselbe Ergebnis. Treiber aus dem MS-Bereich oder von der CD machen keinen Unterschied.

Hat hier jemand ne Idee, wer hier das Faule Ei ist?
  • Server
  • NAS
  • NIC im Server oder NAS
  • ...

Mittlerweile soll die TX401 mal in einer HP Z420 getestet werden. Ergebnisse kenne ich noch nicht.

Grüße Bryte
 
Zuletzt bearbeitet: (Ergänzung)
Gibts Dump Files? Was sagt das Eventlog zu dem Zeitraum?
Die Netzwerkkarte in einem anderen System zu Testen ist gut. Auf das Ergebnis wär ich gespannt.

Bei sowas schwingt auch immer der Verdacht auf den RAM mit, nachdems nix kostet würd ich da einfach mal Memtest86 ein paar Stunden laufen lassen.
 
im Eventlog stand immer was zu Nvidia Grafiktreibern, wir haben alles deinstalliert und den Server Headless gemacht (auch onboard per Jumper deaktiviert), leider auch keine Besserung

Das mit dem RAM wird demnächst angegangen - da wird eine Workstation kurzerhand geplündert.
 
Danke, auf eine aktive Kühlung in einem ohnehin servermäßig durchlüfteten Gehäuse wäre ich jetzt nich unbedingt gekommen, aber ich werde es gerne weitergeben. Da muß ja auch erstmal ein passender Quirl gefunden/bestellt werden.

Leider ist der Betroffene mindestens noch 2-3 Wochen in einer Ecke mit nur sehr kleinen (Frei-)Zeitfenstern bzw. Kontakt zu mir; ich versuche bestmöglich als Mittelsmann zu fungieren. Antworten/Tipps kann ich nicht immer gleich "überreichen".
 
Ich habe die TP-Link Netzwerkkarte in einem Linux- Rechner im Einsatz. Da läuft sie absolut stabil. Im Windows- Rechner habe ich eine ASUS XG-C100C verbaut. Die machte am Anfang ähnliche Probleme wie hier beschrieben. Der Rechner hat sich zwar nicht aufgehangen, jedoch die Karte. Ich musste dann jeweils den Rechner neu booten. Da die ASUS Firmware aktuell war, habe ich bei Marvell nachgeschaut (Chipsatz: AQC107). Und wurde fündig. Ich habe die Karte mit der Marvell- Firmware geflasht. Danach lief die Karte, auch unter Volllast, stabil. Wichtig ist die Chipsatz- Version (V1 oder V2). Es soll welche geben, die mit dem Crossflash die Karte mit der Version 2 zerschossen haben.
 
  • Gefällt mir
Reaktionen: SaxnPaule
Vielen Dank für den Hinweis, das wird definitiv mit einbezogen.
 
... wir haben vieles ausprobiert , danke für die Hinweise. Leider war mein Bekannter lange Zeit im Krankenhaus, daher erst jetzt das späte Update.

Die Karte hatte eine Unverträglichkeit mit dem Serverboard ... jaaaa, in der AVL stand sie nicht, aber man darf ja noch hoffen. Kurzerhand wurde eine Workstation abgestellt, den Job des Fileservers zu übernehmen.

Problemkind: Asus Z9PE-D16
hier klappt's: HP Z420 ... falls es jemand anderes Mal ähnlich trifft.
 
  • Gefällt mir
Reaktionen: Howdegen und Mr.Highping
Zurück
Oben