Ups, irgendwie ist dieser Beitrag bei mir untergegangen. Falls es noch relevant ist, hier meine Antwort:
xexex schrieb:
Du redest hier von Windows 10 und einem Problem, was anscheinend behoben wurde. Was hat das nun mit Windows Server und der Unterstützung von vielen Kernen zu tun?
Windows 10 und Windows Server unterscheiden sich da nur in Details. Die Windows-Skalierungsprobleme treten mit schöner Regelmäßigkeit immer dann auf, wenn mehr Kerne als bislang üblich auf eine bestimmte Aufgabe angesetzt werden.
Diejenigen Forennutzer, die alt genug sind, erinnern sich vielleicht noch an den AMD Dual-Core Optimizer für Windows.
xexex schrieb:
24 Kerne sind heutzutage bei einem Server schon fast recht wenig. Der Preis/Kern Sweetspot liegt irgendwo bei 14 Kernen und ergibt dann 28 Kerne aufgeteilt auf 2 NUMA Nodes, die man durchaus schon als "Masse" bezeichnen kann. Irgendwelche Probleme wären da schon längst bekannt und zig mal behoben worden. Was glaubst du auf welcher Basis die gesamte Azure Cloud aufgebaut ist?
Mit Epyc betritt man dennoch Neuland. Plötzlich bekommt man 32 Kerne / 64 Thread-CPUs mit NUMA zum gleichen Preis wie zuvor nur 20C/40T ohne NUMA. Das heißt, entsprechende Kunden können auf einmal 50% mehr Kerne und 300% mehr NUMA-Nodes auf die gleichen Aufgaben ansetzen.
xexex schrieb:
Das Windows Bugs hat, wie jedes andere System, dürfte jedem klar sein und viele Bugs merkt man erst wenn irgendeine Grenze überschritten wurde.
Interessanterweise waren die von den Chromium-Entwicklern gefundenen Bugs Microsoft teilweise schon bekannt, aber sie haben erst dann mit der Fehlerbehebung begonnen als es öffentlich wurde. Das steht im krassen Gegensatz dazu, wie Bugs unter Linux behandelt werden.
Teilweise ist es auch kein richtiger Bug sondern krass schlechtes Design, wie das single-threaded Prozessabräumen. Und obwohl Microsoft das inzwischen gefixt hat, gibt es weiterhin richtig üble Defizite dieser Art im Betriebssystem.
Ein Beispiel ist der
Indigo-Benchmark. 2990WX unter Linux erreicht ~3200 Punkte ootb, ~3500 Punkte nach kleineren Optimierungen in diesem Benchmark.
Level1Techs haben sich das mal genauer angesehen, warum der 2990WX im Indigo unter Windows so schlecht performt. Und es stellt sich heraus, wenn man den Benchmark per Prozess-Lasso auf 63 logische Kerne beschränkt und einen freilässt, dann kommt er plötzlich auf über 3000 Punkte. Dieser eine Kern wird aber dennoch ausgelastet, und zwar von Windows mit irgendwelchen Verwaltungsaufgaben - die wie es scheint nur single-threaded abgearbeitet werden.
Hier wird es erklärt, zwischen 7:47 und 8:35, das Video lohnt sich aber in Gänze anzusehen: