Regelmäßige Timeouts in Netzwerk seit größer Störung

Homura

Lt. Junior Grade
Registriert
Apr. 2016
Beiträge
401
Seit dem eine Schleife unseren Hauptswitch und Virtualisierunsserver zerschossen hat treten in einem unserer 2 Hauptnetze regelmäßig alle 5 minuten Timeouts von 5-7 Sekunden auf. Sowol innerhalb des Netzes als auch die Internetverbindung.

Wir habe schon mehrere Switche ausprobiert und einzelne Segmente wie Räume oder das Wlan getrennt aber die Timeout bleiben. Nur wenn man ein Gerät direkt an unsere Firewall anschließt (der gleiche Port wie unser Hauptschwitch) hat dieses keine Timeouts nach draußen.

Hat jemand eine Idee was die Ursache hierfür sein könnte?
 
Welche Firewall? Welcher Mainswitch? Was sagt Wireshark dazu?

Greift noch irgendein Loopback Schutz? VLAN Bug aufgrund der Schleife ist möglich, falls VLANs verwendet werden. (Hatte ich mal bei ner Schleife. Man musste erst diverse Tagged VLANs killen, auch auf den Desktop PCs die VLANs eliminieren, dann beruhigte es sich).
 
Firewall ist OPNsense. Mainswitch nennen wir den Switch mit dem Uplink zur Firewall. Wir haben dutzende Switches dahinter. Die bisherigen die wir getestet haben waren D-Link. Morgen probiere ich noch einen Level One.
VLANs nutzen wir in diesem Netz nicht.
 
Wie groß sind die Broadcastdomänen?
Kann man auf die Switchte via SSH oder gibt es ein Logging im Webinterface?

Ich würde mich erst mal an den Main Switch hängen und alle anderen Verbindungen kappen. Parallel auf dem Main Switch prüfen ob irgendwo Schleifen dran hängen. Und nach und nach weitere Switche anklemmen - immer mit der Prüfung ob das Netzwerk noch stabil läuft und die Pings durchgehen sowie Prüfung auf Schleifen oder sonst welche Probleme.
 
Loop?

https://kb.netgear.com/000037817/Wh...S808E-Nighthawk-S8000-Gaming-Streaming-Switch

Edit: Solche Loops können entstehen, wenn man beispielsweise linkaggregation benutzt, dieses aber nicht (richtig) konfiguriert ist. Dann kann es passieren, dass Broadcasts unendlich zwischen den zwei switchen hin und her laufen bis irgendwann so viele Broadcast zusammen kommen, dass alleine mit diesen die Bandbreite ausgelastet ist, bis einer der switche neu startet oder irgendeine loop protection greift und alles dropt.

Kann auch sein, dass so ein Loop über mehrere switche hinweg besteht.

Da hilft nur, wireshark an schmeißen und alle switche successive so konfigurieren, das aller traffic auf dem wireguard-Port gemirrored wird. Verringert zwar den Duchsatz des switches temporär, aber anders wüsste ich es nicht.

https://info.support.huawei.com/info-finder/encyclopedia/en/STP+loop+protection.html
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: -Overlord-
Es gibt auch Switches mit dem Spannint Tree Protocol, welches die Loops verhindert.
Aber Wireshark sollte dir helfen, um rauszufinden was los ist.
 
  • Gefällt mir
Reaktionen: redjack1000
Asynchrones Routing? Loop Protection? Wenn ihr ne Loop Protection einsetzt, wie lange werden die Ports deaktiviert? Was sagen die Switch Logs?

Ganz böse sind teilweise auch Inter-VLAN-Loops. Die können auch solche Phänomene hervorrufen, sind aber nur schwer zu finden.
 
Zurück
Oben