Backup-Geschwindigkeit sehr langsam

Rego

Commander
Registriert
Aug. 2004
Beiträge
2.959
Hallo,

ich bin seit längerem auf der Suche nach einer Lösung für mein Geschwindigkeitsproblem. Als erstes ein paar Daten zu meinem Netzwerk:
1599656025695.png


drei Switche:
D-Link DGS-1210-52 (Hardwareversion C1)
mit 2x LWL 1GBit verbunden LACP
D-Link DGS-1210-28 (Hardwareversion F1)
mit 2x LWL 1GBit verbunden LACP
HP 1810-24G (J9450A)

Server und Storage:
Dell PowerEdge T430 mit 2x SAS-Controller und verschiedenen SAS, SATA und Enterprise-SSDs; 2x 1GBit LACP für das Dateisystem; 2x 1GBit LACP für HyperV-Guests (Windows Server 2016 Standard)
HP Proliant MicroServer N36L (2x 500GB RAID1 fürs System; 4x 2TB Storage Space Mirror) 2x 1GBit LACP (Windows Server 2019 Standard)
Imation 5-Slot NAS (5x 1TB RAID5) 2x 1GBit LACP

Problembeschreibung:
Aktuell sichere ich ca. 650GByte, bestehend aus Fotos und selbst gemachten Videos, per Robocopy-Job vom T430 auf das NAS bzw. den Microserver. Leider bekomme ich bei beiden nur zwischen 70 und 300 MBit pro Sekunde übertragen. Die Sicherung dauert zwischen 10 und 20 Stunden. Sichere ich das Ganze auf meinen Gaming-PC, der nur SSDs verbaut hat, ist die Geschwindigkeit auch nur in dieser Höhe zu erreichen.

Kopiere ich von meinem Gaming-PC auf den Server, egal auf welche Platten, erreiche ich meist um die 116 MByte/s. Ich habe schon versucht die Daten von den Enterprise-SSDs am T430 wegzusichern oder auch mal in die andere Richtung, also vom Gaming-PC mit SSDs auf den Server. Die Geschwindigkeit bleibt immer unter 300 MBit. Es ist auch völlig unerheblich an welchem Switch die Backup-Ziele angeschlossen sind. Auch habe ich schon die verschiedenen Netzwerkporteinstellung getestet (u.a. nur eine einzelne NIC, Switchunabhängiges Teaming, Static Trunk, LACP).

An was könnte das liegen?
 
Hast Du bei deinem Test vom Gaming PC nur eine große Datei kopiert oder auch viele kleine? Kleine Dateien senken schon mal den Durchsatz im Netz enorm.

Hast Du bei deinem Robocopy Befehl auch den /MT Schalter benutzt? Dieser sorgt dafür das mehrere parallele Kopien gemacht werden und damit die Leistung steigt.


/MT:32 — Do multi-threaded copies with n threads (default is 8).
 
@tRITON: Ich habe vom Gaming-PC auch einfach einen Teil des Ordners mit den Fotos und Videos kopiert. Hier schwankt die Geschwindigkeit natürlich deutlich. Bei kleinen Fotos sinkt die Geschwindigkeit auf 500 MBit, sobald Videos mit über 50 MByte kopiert werden, steigt es wieder auf das Maximum von 116 MByte (ca. 980 MBit).

Den Schalter "/MT:32" habe ich gesetzt. Habe hier auch schon verschiedene Werte getestet (z.B. 1, 2, 16, 32). Ab "8" erhöht sich die Geschwindigkeit nicht mehr. Die CPU im T430 ist ein Xeon E5-2620 v4 mit aktiviertem HT - also 16 Threads. Während dem Kopiervorgang ist die CPU-Last meist bei unter 5% und die CPU taktet dann nur auf 1,2 GHz. Habe testweise den Server im BIOS auf Höchstleistung gestellt, brachte aber auch keine Änderung.
 
In der Zeichnung fehlt mir eine Info wo der N36L angeschlossen ist...
Der Übersicht halber wäre es super wenn wir uns auf eine Einheit einigen könnten, also bitte MBit/s ODER MByte/s. Ich hab ehrlich gesagt keine große Lust immer hin- und herzurechnen oder gib btte beides an.

Wie sieht denn die CPU, RAM und Disk Last auf dem NAS/N36L aus wenn der Robocopy Job läuft?

Mit LACP wirst du in deinem Setup so oder so maximal 1GBit/s bekommen, niemals zwei. Warum das so ist und warum so unendlich viele Menschen Fehlannahmen über LACP machen wurde bereits hunderte Male erklärt.
Was spricht dagegen sowohl beim Server als auch beim NAS auf SMBv3 Multichannel zu setzen? Also LACP auflösen, NAS + Server an den gleichen Switch und den Status zu SMBv3 bei beiden prüfen.

Dann die widersprüchlichen Angaben:
Rego schrieb:
von meinem Gaming-PC auf den Server
Rego schrieb:
oder auch mal in die andere Richtung, also vom Gaming-PC mit SSDs auf den Server
Könntest du den Fließtext in eine Tabelle überführen? Beim Testing sollte natürlich idealerweise der gleiche Datensatz und stets der gleiche Robocopy Befehl genutzt werden und bei der Skizze bitte noch ergänzen wo NAS und PC verbunden sind wobei ich für die Tests weitere potentielle Fehlerquellen eliminieren würde und daher sofern möglich alle beteiligten Komponenten an einen Switch packen um Fehler bei der Switch-to-Switch Kommunikation auszuschließen.
|Quellsystem | Zielsystem | Durchsatz viele kleine Dateien | Durchsatz große/kleine Dateien |
 
@snaxilian Die CPU im N36L ist immer unter 20% Last. Das NAS bzw. der Microserver sind normalerweise an dem DGS-1210-52 angeschlossen. Ich habe diese aber testweise auch an den beiden anderen betrieben.
LACP verwende ich eigentlich zur Ausfallsicherheit. SMBv3 Multichannel habe ich bereits getestet. Alle LACPs aufgelöst und die Netzwerkkarten einzeln konfiguriert. Brachte leider keine Änderung. Ich möchte auch keine 2 GBit/s (230 MByte/s), normal ausgelastetes GBit würde mir für diesen Backupjob vollkommen reichen - 70 MBit/s (unter 10 MByte/s) ist halt schon sehr übel.
 
Die Suche im Netz ergab, dass /Z Probleme beim Durchsatz bedeuten kann. Ansonsten ist mein Liebling unter Windows ja immer Amok laufende Virenscanner.

Was Anderes: robocopy ist alt, die Welt hat sich weiter gedreht und es gibt Dinge wie https://restic.net/ oder https://www.duplicati.com/

Restic kann in einer Client-Server Architektur betrieben werden und Duplicati kann Shadow Copies vom NTFS nutzen (keine Ahnung ob das Restic unter Windows kann).
 
Wenn ich Deine Beschreibung richtig interpretiere:
1. Lesend vom T430 ist immer zu langsam, egal wohin Du kopierst, ob auf das NAS, den Microserver oder Deinen Gaming PC.
2. Schreibend auf den T430 funktioniert aber schnell (Gaming PC auf T430 ).
 
@Piktogramm Virenscanner hat bei den Windows Servern bereits ne Ausnahme der Ordner drinnen. Dieser frisst sonst gerne auch mal 50% CPU-Last. Das war meine erste Vermutung. Die beiden Tools werde ich mal testen.

@puri genauso ist es
 
puri schrieb:
1. Lesend vom T430 ist immer zu langsam, egal wohin Du kopierst, ob auf das NAS, den Microserver oder Deinen Gaming PC.
@Rego dann schau mal ob der PC lesend auch so arschlahm ist wenn du auf eine lokale SSD (oder USB SSD) kopierst
 
@Rickmer ist er nicht. Am PC kann ich mit über 500 MByte/s zwischen den SSDs kopieren. Vom PC zum Server geht auch schnell. Am Server von einem RAID1 bzw. StorageSpace Mirror auf nen anderen läuft mit Plattenmaximum (bei kleineren Dateien meist immer noch über 80 MByte/s).
 
Wenn du die Tools probierst, fang mit restic an. Das ist als Client-Server deutlich schneller als Duplicati.
 
Robocopy sollte schnell genug sein, nutzen wir hier auch fürs Backup (bei 13TB mit 10 Mio Dateien). Mir fällt hier auch nur der Virenscanner bzw. die Firewall ein, schalte denn halt mal für den Test komplett ab..
 
@Piktogramm werde ich testen

@puri gerade auf beiden Servern Virenscanner und Firewall abgeschaltet, aber der Speed bleibt bei 70 MBit/s (unter 10 MByte/s)
 
Ich hab's grad von meinem PC aus laufen lassen, während ein Backup mit 70 MBit auf den Microserver läuft (IPerf Server war der T430):
1599679932111.png
 
iPerf misst die Bandbreite vom Client zum Server. Also ist die Richtung PC (lesend) zum T430 (schreibend) netzwerktechnisch in Ordnung. Jetzt musst Du mal die Rollen tauschen, damit der T430 zum Client wird..
 
@puri Ich habe nun den Test mit meinem Notebook per GBit LAN am 1210-52 als Server und dem T430 als Client durchgeführt.
1599768294116.png

(Es läuft nebenbei immer noch das Backup mit 70 MBit im Hintergrund)
 
Also ist das Netzwerk nicht das Problem. Wie Du bereits getestet hast, auch nicht die internen Platten. Wenn man Virenscanner und Firewall (auch getestet) auch ausschließen kann, wäre mein nächster Schritt das Betriebssystem. Vielleicht mal mit einer anderen SSD/HDD den Server testweise frisch aufsetzen und direkt testen. Falls das Problem noch besteht kannst Du zumindest ohne größeren Aufwand Deine alte Installation schnell wiederherstellen..
 
@puri Das kann ich leider nicht machen. Müsste dazu das RAID auflösen und danach wieder erstellen. Auch kann ich das Ding nicht so lange offline nehmen :-/

Hast Du noch weitere Ideen?
 
Und wenn Du mal von der Systemplatte des Servers Daten lesend überträgst und nicht vom Raid ? Wenn dann die Geschwindigkeit stimmt bleibt nur noch das Raid übrig..
 
Zurück
Oben