Hyper-V VMs ruckeln, Raid5 auflösen?

Raknar

Ensign
Registriert
Apr. 2006
Beiträge
194
Hallo,

mein alter Herr hat zu Hause einen mittelalten Dell R640 Server mit 5x2TB SAS Platten. Daraus hat er zwar zwei Partitionen gemacht (Windows 2016 und Ablage), allerdings ist alles in einem Raid5 abgesichert. Zudem läuft auf dem Server noch Hyper-V mit 3 VMs. Und diese VMs ruckeln in periodischen Abständen.

Dass das von den Broadcom NICs kommt, konnte ich mittels Einstellungen (VMQ) und Treiberupdates ausschließen.

Eine der VMs ist ein Terminal Server. Wenn ich den neu starte, taucht das Problem etwa 2h nicht merklich auf.

Mir fällt nur noch ein, aus dem Raid5 zwei Raids (1 und 5; 2 und 3 Platten) zu machen. Eins für Win21016 und eins die Ablage/VM-Dateien.
Ich habe testweise eine weitere, frische VM erstellt. Auch hier trat das Ruckeln auf. Nachdem ich die dazugehörigen VM-Dateien auf ein Backup-NAS verschoben habe, lief diese schon etwas besser. Obwohl das NAS nur SATA-Platten hat und ebenfalls ein Raid5.

Das wäre jedoch bestimmt ganz schön zeitintensiv. Kann ich das überhaupt einfach so machen, wenn ich Win2016 neuinstalliere. Oder muss ich vorher (außer Backups) noch etwas tun.

Daher würde mich interessieren, ob es noch andere Lösungsvorschläge gibt.

Vielen Dank im Voraus!

Edit: Specs
DELL R640
2xIntel 6128 = 12/24 cores at max. 3.4Ghz
128 GB RAM
Broadcom Dual 10G NIC NetExtreme
Broadcom Dual 1G
5x2TB SAS Drives, Raid5
 
Zuletzt bearbeitet:
VMs würde ich heute nur noch auf SSDs oder besser NVME SSDs betreiben. Daher, kaufe einen M.2 PCIe x4 Adapter mit passiver Kühlung
https://www.caseking.de/aqua-comput...-adapterkarte-mit-passivkuehler-wahe-102.html
Und je nach Anspruch eine entsprechende dimensionierte NVME SSD ein. Dein Vater wird nie wieder mehr dafür HDDs mit nem RAID verwenden. ;). Diese könnt ihr dann als Backups und Datengrab verwenden.
 
RAID5 ist doch vollkommen okay. In größeren Umgebungen hast du RAID6/DP. Und da läuft auch alles ohne Probleme. Hast du vielleicht nicht genug CPU/RAM Leistung? Guck erstmal genau nach was denn wirklich limitiert.
 
Moin,
was sagt denn die Plattenauslastung auf dem Hypervisor wenn die VMs ruckeln?


Grüße
 
@nosti
Ich habe mal Screenshots angehängt. Laut dem Link von @cloudman könnten die Einträge mit "NativeImages" auf ein Problem hinweisen, aufgrund der Response Time.

Ich habe die Specs ergänzt. Das System langweilt sich eigentlich. CPU ist immer unter 50%, physisch wie virtuell. Meistens sogar unter 10%. Beim RAM des Host sind noch 13GB frei. Die VMs nutzen ihren RAM jeweils weniger als 20% aus.

@deinDadseinFrau
Mit dem Teil will er sich Virtualisierung beibringen. Das Teil wurde bei einem seiner Kunden (er: kleiner IT-Dienstleister) ausgemustert.
 

Anhänge

  • ressource monitor host.png
    ressource monitor host.png
    296,3 KB · Aufrufe: 450
  • ressource monitor host2.png
    ressource monitor host2.png
    289,6 KB · Aufrufe: 447
@Kr1ller Raid6 aber auch nur bei Datenablage...

@Raknar Generell: Die pauschale Annahme SAS > SATA stimmt nicht sondern auf die Art und Weise wie diese angebunden und konfiguriert sind.
Üblicherweise versucht man immer OS von Applikation/Nutzdaten zu trennen. OS bekommt dann oft 2x Disks im Raid1 und wenn Performance egal ist eben ein Raid6, ansonsten besser ein Raid10 bei 4 Disks oder eben bei 6/8/10 Disks immer zwei zum Raid1 und dann über alle stripen. Also ein weiter gestrecktes Raid10 sozusagen.
Hat man zumindest so gemacht bevor SSDs erschwinglich wurden und man IOPS benötigte.
Ob es direkt eine NVMe sein muss stelle ich mal in Frage. Für eine kleine Lab-Umgebung reicht vermutlich auch eine oder mehrere brauchbare SATA/SAS SSDs.
 
Hallo nochmal,

die ganze Sache ist deutlich komplexer geworden, als ich mir vorort alles ansehen konnte:

  • wenn ich remote/direkt auf den Win2016-Host gehe und von dort auf eine der VMs zugreife (connect im Hyper-V Manager), kommt das Ruckeln nicht vor.
  • dann gibt es ein worst practise: ein anderer Host hat den Domain Controller (VM), liefert DNS + DHCP. Eine Fritzbox allerdings auch.
  • Nicht nur der Server ist "neu", sondern auch der Switch. Vorher 0815 D-Link (24G, unmanaged). Jetzt Cisco 350x.

Kommt das einem von euch bekannt vor bzgl. Ruckeln?
 
Dann hast du irgendwo einen Flaschenhals zwischen VM und Endanwender. Schau dir die Netzwerkauslastung der einzelnen vSwitche (keine Ahnung, wie das unter HyperV heißt) an, dann vom Host, prüfe ob es auf dem Switch an den Interfaces irgendwelche Fehler gibt, ob eine Firewall dazwischen ist, die zu schwach/klein dimensioniert ist oder DPI an der Stelle macht, etc.

Klemm halt bei der Fritzbox DHCP ab, eine Baustelle weniger.

Ist halt nen Switch, halbwegs korrekt konfiguriert sehe ich bei dem kein Problem.
 
@snaxilian
Ich habe jetzt DNS und DHCP nur noch auf dem Domain Controller laufen (ging überraschen einfach). Leider gab es keine Verbesserung. Die Netzüberwachung reiche ich nach. (eigentlich bin ich hier im Urlaub...)

@cloudman
Nein, das hat leider nichts gebracht. Auf dem zugreifenden Client läuft übrigens ein nacktes Win7, falls das jemandem etwas sagt.

Bei der Gelegenheit habe ich auch gleich einen Screenshot in dieser RDP-Sitzung gemacht. Hier sind die Antwortzeiten länger und kommen häufiger vor.

Vielleicht hat das jemand von euch schon mal gesehen. Sieht ja irgendwie nach .Net und Office aus.

Vielen Dank eure Mühen!
 

Anhänge

  • SnipImage.JPG
    SnipImage.JPG
    242 KB · Aufrufe: 404
es gibt keine 2TB SAS Platten, vermutlich sind das NLSAS und somit eigentlich 7.2K drehenden Sata Platten mit SAS Interface. Die Performance solcher Laufwerke ist im Vergleich zu echten SAS mit 10 oder 15k unterirdisch schlecht.
Wie siehts mit dem Schreibcache des RAID Controllers aus?
Wie sieht die Datenträgerwarteschlange von Partition D: auf dem Host aus wenns ruckelt?
 
@nubi80
Stimmt, es sind 2.4 TB pro Platte. 15k. Der Raid-Controller ist ein Perc H730p. Was müsste ich mir ansehen, um deine Frage zu beantworten? Die Laufwerk D Datenträgerschlange reiche ich sobald wie möglich nach.

Hyper-V ist für mich noch neu, aber ich vermute, dass folgende Beobachtung relevant ist: Ich habe in den Hyper-V Settings gesehen, dass die dedizierte Grafikkarte (matrox g200ew3 nuvoton wddm 1.2) nicht erkannt bzw. auswählbar ist, obwohl das Feature Remote virtualization host installiert ist. Somit wird kein RemoteFX verwendet. Kann das die Ursache sein? Kann man das beheben?

Vielen Dank, dass du noch am Ball bist 👍
 
Zurück
Oben