Duke NUC(em) forever
oder Intels ewiger Kampf mit den Treibern
Oberseite des Intel NUC im beleuchteten Zustand
Inhaltsangabeoder Intels ewiger Kampf mit den Treibern
Oberseite des Intel NUC im beleuchteten Zustand
- Fazit
Einführung
Einst zog Intel aus, die Gaming-Krone bei iGPUs zu erobern. Um dies zu ermöglichen, pflanzte man kein GPU-Monster in einen Chip, sondern platzierte einfach 128 MB zusätzlichen Cache/RAM neben die CPU. Was AMD bei der Xbox 360 bereits im kleinen Stil mit 10 MB, rein für Anti-Aliasing Daten, gemacht hatte, wollte Intel jetzt also mit einem größeren Chip für alle Rechenaufgaben der HD 5200 nutzen.
Der große Durchbruch war dies nicht und die Technik, eingeführt bei Haswell, versank nach Skylake wieder in der Versenkung. Doch entweder gab es in Intels GPU-Entwicklungs-Abteilung ein paar Enthusiasten oder man wollte ein Leuchtturm Projekt starten, um zu zeigen, dass man mit AMD nicht nur auf Patent und Lizenz Ebene zusammenarbeitet, sondern auch im Hardware-Bereich eine Kooperation anstrebt, um eine starke Grafikleistung auf sehr kompakten Raum unterzubringen.
Das Produkt
Daraus entstand die Idee, einen großen Polaris Chip, kombiniert mit einem neuen Speicherinterface und 4 GB HBM auf einem Interposer mit Intel Core CPUs der 8. Generation zu verheiraten.
Damit war der hier getestete Core i7-8705G geboren. Ein kleiner Kraftzwerg in der Platinengröße einer R9 Fury.
Intel setzte sich also mit AMD an einen Tisch und entwickelte die Parameter weiter, die gefordert wurden. Da AMD bei Custom Chips mit den Konsolen von Microsoft und Sony bereits Erfahrung sammeln konnte, sicherlich kein großes Problem.
Die Eckdaten lesen sich dann auch wie das Who-is-Who der Custom Chips: vier Kaby Lake G Kerne, mit HT, außer beim i5, ein Polaris 22 Chip mit 20 der 24 CUs, 4 GB HBM. Und alles auf einem riesigen Interposer, trotzdem kompakt, untergebracht. Bei einer TDP von 65 oder 100 W, im Notebook oder in Intels NUCs.
Board des i7-8705G und der Radeon R9 Fury
Kompakt an allen Enden
Bereits die Radeon R9 Fury konnte zeigen, wie gering der Platzbedarf bei der Kombination GPU-HBM sein kann und welche Durchsatzraten beim Speicher trotz dessen erreicht werden können. So ist nicht nur das Platinen Design sehr kompakt, sondern auch auf dem Chip benötigte AMD für ein 4096 Bit Speicherinterface genauso viel Platz, wie eines mit 256 Bit und GDDR5. Und gerade die Nano-Variante treibt es auf die Spitze: High-End auf der Größe einer Midrange Karte.
Das 1024 Bit entspricht bei Vega M also einem mit 64 Bit im GDDR5-Bereich. Zusätzlich ist der HBM-Speicher sehr effizient, da der Takt mit 700 MHz wesentlich geringere Geschwindigkeiten aufweist als entsprechende Konkurrenzprodukte im Notebook.
So schaut dann auch der Vergleich zu einer RX 560X Mobile aus:
RX 6400 | Vega 8 | RX 560X Mobile | Vega M | intel DG1 | intel Arc A310 | |
Datum | 04/2022 | 01/2019 | 04/2018 | 02/2018 | 10/2020 | 10/2023 |
architecture | RDNA 2 | GCN 5.0 | GCN 4.0 | GCN 4.0 | Gen 12 | Gen 12.7, Alchemist |
Codename | Navi 24 | Raven | Polaris 21 | Polaris 22 | Iris Xe | DG2-128 |
Operation Area: | Notebook originally | APU Notebook | Notebook | SoC Notebook/NUC | Notebook originally | Desktop |
Manufacturing Process | 6 nm | 12+ nm | 14 nm | 14 nm | 10 nm | 6 nm |
Transistor count | 5,4 bn (Mrd.) | ca. 4,94 bn (Mrd.) | 3,0 bn (Mrd.) | 5,0 bn (Mrd.) | --- | 7,2 bn (Mrd.) |
DIE size | 107 mm² | ca. 210 mm² | 123 mm² | 208 mm² | 95 mm² | 157 mm² |
TDP | 53 W | ca. 15 W | 65 W | 65 W | 25 W | max. 75 W |
Clock Speed GPU | 1.923 / 2.321 MHz | 300 / 1.200 MHz | 1.175 / 1.202 MHz | 931 / 1.011 MHz | 300 / 1.650 MHz | 2.000+ MHz |
ROPs | 32 | 8 | 16 | 32 | 24 | 32 |
Pixel fillrate | 74,27 GP/s | ca. 8,8 GP/s | 19,23 GP/s | 32,35 GP/s | 39,6 GP/s | 78,4 GP/s |
Cus | 12 | 8 | 16 | 20 | 6 | 6 ? |
Shader | 768 | 512 | 1.024 | 1.280 | 768 | 768 |
TMUs | 48 | 32 | 64 | 80 | 48 | 64 |
Texel fillrate | 111,4 GT/s | ca. 35,2 GT/s | 76,93 GT/s | 80,88 GT/s | 79,2 GT/s | 156,8 GT/s |
TFLOPS: | ||||||
FP16 | 7,13 | ca. 2,253 | 2,462 | 2,588 | 5,069 | 6,14 |
FP32 | 3,565 | ca. 1,126 | 2,462 | 2,588 | 2,534 | 3,07 |
Speichergröße | 4 GB | 2 GB / Shared | 2 / 4 GB | 4 GB | 4 GB | 4 GB |
Typ | GDDR6 | Shared DDR4-2400 | GDDR5 | HBM2 | LPDDR4X | GDDR6 |
Takt | 2.000 MHz (8.000 MHz) | 2.400 MHz | 1.500 MHz | 700 MHz | 2.133 MHz | 1.937 MHz (7.748 MHz) |
SI | 64 Bit | 2x 64 Bit | 128 Bit | 1024 Bit | 128 Bit | 64 Bit |
Speicherbandbreite | 128 GB/s | 38 GB/s | 96 GB/s | 179,2 GB/s | 68,26 GB/s | 124 GB/s |
Infinity Cache | 16 MB @ 416 GB/s | n.a. | n.a. | n.a. | n.a. | n.a. |
L1 Cache | (L0 = 32 KB per WGP, L1 = 128 KB per Array) | 256 KB (16 KB per CU) | 320 KB | ? | ||
L2 Cache | 1.024 KB | ?? | 1.024 KB | 1.024 KB | 1.024 KB | 4.096 KB |
L3 Cache | n.a. | 4 MB (CPU only?) | n.a. | n.a. | 16 MB | ? |
CPU | Core i3 10105 (4C/8T) | Zen+ (4C/8T) | - | Core i7 8705G (4C/8T) | Core i3 10105 (4C/8T) | Core i3 10105 (4C/8T) |
Fun Fact: während der Polaris 20 Chip auf der RX 580 problemlos das verteilte Rechennetzwerk BOINC und da wiederum Einstein@home unterstützt, bricht die Polaris 22 GPU jede GPU-Berechnung mit Fehlern ab.
Technik im Detail
Während man beim GPU-Part also auf AMD setzte, steuerte intel die vier CPU-Kerne bei. AMD bot damals gerade einmal die ersten APUs mit Zen und Vega Technologie an. Aufgrund der starken iGPU konnten diese überzeugen, boten aber nicht ansatzweise die Möglichkeiten des Polaris 22 Chips an.
Der größte Schwachpunkt ist hier nicht einmal die Rechenleistung, der größten Vega 11 getauften Variante, sondern das schmale Speicherinterface, welches man sich noch mit den vier Zen Kernen teilen muss. So bleiben von 38 GB/s, später bis 50 GB/s, immer weniger für den GPU-Part über.
Vega M hatte da absolut verschwenderische 180 GB/s nur für die Grafikberechnung. Zum Vergleich, die nach TFLOPS gleichstarke RX 560X (mobile) musste sich mit 93 GB/s begnügen.
Über allem thronten die Konsolen, die nicht nur auf GPU, sondern auch auf CPU-Seite die Technik von AMD nutzten.
Während man die ersten Versionen mit diesem Hybrid-Chip rein von der Rechenleistung her schlagen konnte, war man den aufgebohrten Versionen hoffnungslos unterlegen. Im Gegenzug benötigte man aber auch nur einen Teil der Energie.
Und gab es einen Wehrmutstropfen? Jaein – denn die Vega M ist in Wahrheit ein Polaris Chip, ergänzt um die Fähigkeit, HBM anzusprechen.
Vor- und Nachteile
Die Weichen für diesen Chip und zukünftige Iterationen waren also gelegt. Kompakt, schnell, effizient(?), bezahlba…, ach streicht das letzte.
Zumindest die Kompaktheit ist ein großes Plus, gegenüber Lösungen mit dedizierter GPU und die Core Prozessoren der achten Generation waren keine schlechten Vertreter ihrer Art.
Doch leider steckte wieder der Teufel im Detail. Einerseits war man bei den NUCs schnell an der 1.000€ Grenze andererseits schlug wieder Intels Treiberproblematik zu.
Denn im Gegensatz zu den normalen Radeon Treibern mussten diese teils über Intel laufen. Und da kommen wir zum größten Problem: laut Treiber ist keine geeignete GPU verbaut – witzig – nicht.
Theoretisch kann man diesen auch über den Geräte-Manager installieren, wenn man den passenden Treiber hätte. Denn Intels eigener Workaround ist für eine ältere Software-Version gedacht.
Zum Glück ignoriert ein alter AMD-Treiber (20.4.1), dass alles und installiert sich ganz normal, wie wir es von Radeon Grafikkarten gewohnt sind.
Hier zeigt sich Intels desaströse Treiberpolitik, die auch schon bei den integrierten GPU-Beschleunigern aus dem Hause Imagination Technology zeigte, dass kein wahres Interesse an diesem Mehraufwand bestand.
Das führt dann aber dazu, das GPU-Berechnungen bei BOINC andauernd mit einem Fehler abgebrochen werden.
Das Testsystem
Der hier getestete NUC nutzt noch folgende Komponenten:
- 2x 8 GB DDR4-3200 @2.933 MHz von Kingston, XMP 1 aktiv
- 16 + 256 GB Hybrid Optane/SSD von Intel
- Windows 11
Gekühlt werden die Chips von einer Vapor Chamber und 2x Radiallüftern, wie man sie im Notebook findet.
Dabei ist das ganze Kühlsystem auch unter Last angenehm leise und verschwindet bei Hintergrundgeräuschen komplett - perfekt für Musik oder einen Filmabend.
Die Leistung
Was die 3D-Leistung betrifft, liegt man mittlerweile selbst hinter Einstiegslösungen wie die RX 6400 Serie. Polaris ist halt nicht mehr die jüngste Arch und auch der schnelle, eigene Speicher hilft hier nicht mehr weiter.
Und selbst an der Radeon 680M in den Ryzen 7 und 9 der 6000er Serie beißt man sich die Zähne aus, trotz geringerem TDP-Spielraum der modernen Lösung. AMD hat hier ganze Arbeit geleistet und seine iGPUs sukzessive weiterentwickelt.
Als Stand Alone Lösung würde so eine Radeon RX 6450 mit 8 GB Speicher und ca. 75 W TDP so einigen Mini-PCs gutstehen. Es muss dann auch nicht immer HBM sein, der erst bei stärkeren GPUs seinen Vorteil ausspielen kann, während der Infinity Cache der kleinen Navis groß genug sein dürfte, um im FullHD Bereich mitzuschwimmen.
AMD gibt bei der RX 6500 eine effektive Bandbreite von 232 GB/s an (RAM = 144 GB/s, Infintiy Cache unbekannt), die für ältere Spiele wie Halo: Infinite völlig ausreichend ist.
Intels DG1, also die erste Stand Alone Lösung seit dem i740 aus den 90ern Jahren, wird immer wieder klar geschlagen. Wobei hier ein Beta-Treiber dem damaligen Test noch ein Ende gesetzt hatte, in dem es nur noch einen schwarzen Bildschirm gab.
Gegenüber der neueren Arc A310 zieht man aber klar den Kürzeren.
3DMark
Neon Noir
Superposition
Crystal Disk Mark mit 1GB
Fazit
Mit dem damaligen Neupreis und dem heutigen Gebrauchtpreis von 350€, ohne SSD, war und ist Intels Vega M kein Schnäppchen.
Dazu krankten die Notebook-Varianten auch am nicht aufrüstbaren RAM, der mir persönlich mit 8 GB zu gering ist.
Für User, die Kuriositäten sammeln, ist es dagegen wieder etwas besonderes, denn wo sonst macht Intel einen so tiefen Kniefall vor AMD und verbaut wichtige Bestandteile der Kalifornier? Und das auch noch als Custom-Chip!
Selbst heute, im Februar 2024 sind nur wenige Notebooks mit Intel-CPU, aber mit dedizierter AMD-GPU gelistet. Wobei von den 9 Stück, drei auf Apple entfallen. Das modernste ist damit die RDNA 1 Generation in Form der RX 5500.
Ich denke zwar nicht, das wir ein derartiges Produkt nochmal sehen werden, aber wer weiß schon, was in einigen Köpfen rumschwirrt.
In meinen Augen haben die Kalifornier mit dieser Custom-Lösung gezeigt, warum Sony, Microsoft und mittlerweile auch Valve auf SoC aus Santa Clara setzen. Die Treiberpflege und das eigene Know-how gegenüber Intel liegen einfach noch zu weit vorne.
Wie schaut es aus, hätte jemand von euch diesen Aufpreis gezahlt, um im Notebook oder NUC diese Kombination zu nutzen?
Habt ihr ein entsprechendes Gerät gekauft und wie waren eure Erfahrungen dabei?
weitere Impressionen
Der Polaris 22 Chip:
Die Hybrid SSD von Intel, mit Optane und QLC:
In der Draufsicht:
Vapor Chamber und die zwei Lüfter:
Gut, gegen Böse - Intel, gegen AMD:
Rückseite der Abdeckung:
Zuletzt bearbeitet: