Da die Produktion von Vorbestellungen jetzt anläuft, möchten bei dieser Gelegenheit die
Art der thermischen Optimierungen, die unsere Produktionsverzögerung verursacht haben, näher erläutern.
Zusammenfassung
Als wir die erste Charge der Serienproduktion getestet haben, sind uns zwei Probleme aufgefallen:
- Hohe Varianz bei der CPU-Kühlung in All-Core-Stresstests, so dass unterschiedliche Exemplare (Laptops) sich deutlich voneinander unterschieden
- Generell höhere als erwartete GPU-Speichertemperaturen in GPU-Stresstests
Beide Probleme führten in entsprechenden Tests zu einer vorzeitigen thermischen Drosselung unter Luftkühlung.
Beide Probleme traten bei den Vorproduktionsmustern im Dezember und Anfang Januar nicht auf und wurden erst bei der späteren Test- und Serienproduktion Ende Januar gesichtet. Während wir mit unserem ODM-Partner daran arbeiteten, die Ursachen dieser Probleme zu beheben, haben wir unseren Kunden am 7. Februar mitgeteilt, dass sich die Auslieferung ihrer Vorbestellungen um Wochen verzögern wird.
CPU-Kühlung
Das Problem mit der CPU-Kühlung wird deutlich, wenn man die Temperaturen der einzelnen Kerne vergleicht. Normalerweise sollten bei einem CPU-Stresstest mit allen Kernen (z. B. Cinebench) die Temperaturen aller Kerne innerhalb eines engen Rahmens liegen, da sie alle mit demselben Heatpipe-System in Kontakt sind. Bei den meisten Exemplaren aus der Serienfertigung mussten wir jedoch feststellen, dass oft ein oder zwei einzelne Kerne viel heißer liefen als alle anderen.
Gemäß Intels Design wird die CPU-Leistung durch den heißesten aller Kerne begrenzt. Wenn nur ein Kern außergewöhnlich heiß läuft, verdirbt dies allen anderen Kernen den Spaß, da das System gezwungen ist, die CPU-Leistungsaufnahme zu reduzieren, was auch zu einer Verringerung der CPU-Render-Leistung führt.
HWiNFO64 beginnt die Zählung der Kerne bei 0 (Null). Basierend auf diesem Zählsystem waren es bei betroffenen Geräten immer P-Core 1, 3 oder 4, welche heiß liefen. Das Delta (der Abstand) zwischen diesen "heißen" Kernen und dem Durchschnitt der "normalen" Kerne betrug in einigen der am stärksten betroffenen Exemplare bis zu 12 °C.
Dieses Problem wurde durch die Verbesserung der Flüssigmetall-Kühllösung für die CPU behoben. Die CPU-Leistung hat sich erhöht und alle Kerne blieben in einem engen Temperaturband mit weniger als 5° Abweichung vom Durchschnitt aller Kerne.
Diagramm #1: neo_e23_thermal-optimisation_cpu-cooling_before-after_animated.gif
Dieser Link führt zu einem animierten GIF, welches den Zustand der P-Core-Temperaturen vor und nach den Optimierungen der Luftkühlung vergleicht. Die zwei Frames des GIFs sind hier auch einzeln zu sehen:
vorher /
nachher. Es fällt auf: im "nachher"-Diagramm sind alle Kerntemperaturen schön miteinander verwachsen und die CPU Package Power [W] ist deutlich höher als vorher.
GPU-Kühlung
Auf der GPU-Seite haben wir festgestellt, dass bestimmte schwere GPU-Stresstests dazu führten, dass der GPU-Speicher (GDDR6, VRAM) seinen maximalen T-Junction-Wert erreichte. Bei unseren Tests verwendeten wir den 3DMark Time Spy Stress Test anstelle des weit verbreiteten Furmark. Während der normale 3DMark-
Benchmark die GPU jeweils nur für ein paar Minuten belastet, belastet der weniger bekannte 3DMark Time Spy
Stress Test (TSST) die GPU 20 Minuten lang ununterbrochen. Dies ist eine gute Methode, um das System auf thermisches Throttling zu testen.
TSST verursacht auch einen höheren CPU-Stromverbrauch als Furmark, was die gesamte Systemlast erhöht, obwohl es sich um einen GPU-fokussierten Test handelt. Die zusätzliche CPU-Wärme überträgt sich auf die GPU und bringt das System näher an seine Grenzen.
Vor den Optimierungen zeigte TSST eine thermische Drosselung der GPU an, weil der GPU-Speicher seinen maximalen Temperaturwert erreichte. Bei einem System, welche auf 175W GPU-Leistung (RTX 4080/4090) ausgelegt ist, führten diese VRAM-Temperaturen dazu, dass viele Exemplare der Serienproduktion am Ende des 20-minütigen Laufs eine durchschnittliche GPU-Leistung von nur noch 150 Watt aufrechterhalten konnten.
Bei der Überprüfung stellte sich heraus, dass nur bestimmte GPU-Speicherchips betroffen waren. Das Problem wurde behoben, indem der Kontakt zwischen den GPU-Speicherchips und der Heatpipe-Einheit mit sog. "Thermal Gel" verbessert wurde - eine bestimmte Art von Wärmeleitpaste, welche sich beim Zusammenbau plastisch verformt. Die VRAM-Temperaturen haben sich hierbei um etwa 10 °C verbessert. Bei diesem Verfahren stellten wir sicher, dass der erhöhte Kontaktdruck des GPU-Speichers nicht versehentlich den Kontaktdruck der GPU verringert, dass also die niedrigere VRAM-Temperatur nicht auf Kosten der GPU-Temperatur erkauft wird. Mit Erfolg: die GPU-Temperatur blieb bei gleicher GPU-Leistungsaufnahme in allen vorher/nachher-Tests identisch.
Diagramm #2: neo_e23_thermal-optimisation_vram-cooling_before-after.png
Dieses Bild zeigt sowohl "vorher" als auch "nachher" in einem einzigem Diagramm.
Anmerkungen zu GPU-Stresstests
In Zukunft werden wir vom 3DMark Time Spy Stress Test (TSST) auf den neueren Speed Way Stress Test (SWST) umsteigen. Gründe:
- Der TSST verursacht bei dieser GPU-Generation eine überraschend hohe CPU-Leistungsaufnahme. Wir sind nicht sicher, ob dies ein Problem des Treiber-Overheads ist.
- SWST verursacht zwar weniger CPU-Stromverbrauch, aber immer noch mehr als TSST auf bisherigen Systemen mit Intel Core 12th Gen H-Serie - es ist also ebenfalls ein extrem anspruchsvoller Test. Da Speed Way Raytracing und DirectX12 Ultimate bei einer Auflösung von 1440p verwendet, gehen wir davon aus, dass es besser geeignet ist, das reale Systemverhalten mit aktuellen und zukünftigen AAA-Titeln zu simulieren.
Bitte beachtet, dass Time Spy Stress Test und der Speed Way Stress Test nur in der "Advanced"-Version (oder höher) von 3DMark verfügbar sind, nicht in der kostenlosen Basisversion.
Unser Qualitätsversprechen
Wir haben anhand einer großen Anzahl von Geräten verifiziert, dass diese Optimierungen wirkungsvoll und stabil sind. Wir verpflichten uns, dass alle XMG NEO-Kunden diese Optimierungen vom ersten Tag an erhalten werden. XMG-Kunden müssen ihr System also nicht individuell auf diese Probleme hin überprüfen. XMG-Kunden können nach dem Unboxing also einfach ihr Leistungsprofil auswählen (Ausbalanciert, Enthusiast, Overboost) und sofort mit dem System arbeiten.
VG,
Tom