Hallo Allerseits,
als neuer Besitzer eines ASRock DeskMini X600 habe ich folgende Fragen an die anderen Besitzer.
Vorne weg. Ich hatte eine lange Pause von selbst gebauten Systemen inkl. deren Konfiguration. Das letzte ähnliche System hatte ich zum Anfang der Ryzen 1 (1700) Zeit. Danach nur noch Intel Nuc bzw. die letzten Jahre Mac Mini M1.
Konfiguration
- ASRock DeskMini X600 mit 4.03 BIOS
- AMD Ryzen 7 8700G
- Noctua NH-L9a
- 32 GB (2x 16 GB) Kingston DDR5 SODIMM (KF556S40IBK2-32)
- 2 TB Samsung 990 Pro mit neuster Firmware (4...)
- Intel Wi-Fi 6 AX200 (Gig+) Desktop Kit
- Eizo EV2740X (4k Auflösung mit 200% Skalierung)
- kein OC (z.B. Processor, RAM)
- die allermeisten Einstellungen sind auf Auto bis auf die für die Virtualisierung, TDP auf 35 Watt und Lüfterkontrolle
- manuell installiertes Debian 12 mit UEFI Boot via Grub, vollverschlüsseltem LUKSv1 Container, BTRFS als Dateisystem, Firmware aus den Debian Backports und Kernel 6.10.14 aktuell
Einsatz Szenario
- Office
- Gaming (ich kenne die zu erwartende Leistung, mit dem Mac Mini M1 ging das auch ganz gut, das aktuelle System sollte doch eher mit dem Mac Mini M4 vergleichbar sein)
- KI (z.B. LLMs) testen
- Systemstabilität, Hardware Größe und Lautstärke sind die 3 extrem entscheidenden Kriterien für mich
- aus Diversifikations und auch Linux Wissens Gründen will ich nicht komplett im Apple Universum bleiben
1.) Fehler auf dem Dateisystem / korrupte Dateien, wenn die SSD im oberen PCIe Gen 5 M2 Platz drin ist
- das hat mich bisher zig Stunden Troubleshooting Zeit gekostet
- wenn die Daten auf die SSD geschrieben wurden hat das früher oder später immer zu Fehlern auf dem Dateisystem geführt, die beim Scrub (BTRFS Funktion) auch sofort gefunden wurden
- es ließ sich nahezu garantiert reproduzieren, wenn man die Linux Kernel Sourcen entpackt hat und sofort ein sync gemacht hat
- auch unter Ext4 ließ es sich, wenn auch in abgeschwächter Form, reproduzieren
- verschiedenstes Troubleshooting (RAM Memtest, Default Bios Einstellungen, RAM Riegel durchtauschen, Ext 4 statt BTRFS) ohne Besserung durchgeführt
- dann die SSD auf den zweiten PCIe Gen 4 M2 Platz unter dem Board verbaut und den ersten M2 Platz leer gelassen
- jetzt treten die Fehler auf dem Dateisystem / korrupten Dateien nicht mehr auf
- die Frage für mich ist jetzt, was ist die Ursache
- ich kann aktuell eigentlich nur 2-3 mögliche Ursachen sehen
A) der oberen PCIe Gen 5 M2 Platz hat was weg bzw. ist (teil)defekt
B) es gibt eine Inkompatibilität zwischen der Samsung 990 Pro mit neuster Firmware und dem Board inkl. M2 Platz
C) die WLAN Karte inkl. der langen Antennen Kabel und meiner Verlegung derer hat Auswirkungen
- ich habe aktuell erstmal keinen Antrieb da weiteres Troubleshooting zu dem Thema durchzuführen
- zudem ist es keine Option auf die WLAN Karte zu verzichten
- wenn die Fehler im zweiten unteren M2 Platz ausbleiben, wäre das wohl auch ein akzeptabler SSD Platz für mich
Was ist euer Wissen und Erfahrung zu dem Szenario?
2.) CPU Temperatur Sprünge, wenn nur Single Core Last anliegt
- das Szenario sehe ich z.B. beim Kernel kompilieren an einer bestimmten Stelle
- es wird mit 16 Threads kompiliert und dann an einem oder 2 Punkten im Prozess ist es nur noch eine Single Core Last für einige Sekunden
- dabei springt dann die CPU Temperatur innerhalb von 1-3 Sekunden von 6x° C (16 Thread Last) auf über 80° C hoch
- sobald das spezielle Szenario vorbei ist fällt die Tempereratur wieder unter 70° C
- STAPM habe ich aktuell aktiviert
- hauptsächlich stört mich dabei, das dann die Lüfter Geschwindkeit aufgrund meiner aktuellen Einstellungen auf Maximum geht
Ist das ein bekanntes Temperatur Verhalten bei reduzierter cTDP (35 Watt)?
Was müsste man ggf. einstellen (außer die Lüfter Drehzahlkurven anzupassen) um das Verhalten zu mildern oder ganz abzustellen?
3.) Was wäre der optimale Weg um maximale Leistung bei möglichst geringem Stromverbrauch und damit Wärme Entwicklung zu haben?
- aktuell habe ich einfach nur im BIOS die TDP auf 35 Watt begrenzt und den Performance Modus deaktiviert, das funktioniert auch soweit
- ich habe mich bisher auch noch nicht durch entsprechende Dokumentation im Internet gewühlt
- Grundbedingung ist, das das System absolut Stabil bleibt
- zudem möchte ich auch nicht ewig und 3 Tage verschiedene (Undervolting) Einstellungen testen, da mir die ca. 20 Stunden bisher eingesetzte Zeit aufgrund von Zusammenbau, Betriebssystem Installationen und Troubleshooting aufgrund der Dateisystemfehler erstmal reichen
- zu Intel Zeiten (z.B. i7 3370T, i7 4770T) und auch beim Nuc habe ich dann auch einfach den CPU Kerne Turbo Boost deaktiviert, was gut was beim Verbauch und damit der Wärmeentwicklung gebracht hatte
- ich könnte mir aktuell vorstellen, das ich den Turbo Boost wieder abschalten könnte, weiß aber nicht ob und welche Auswirkungen das auf den iGPU Teil hätte
Was ich noch machen werde ist ein paar Belastungstests (Gaming, Compute/OpenCL Workloads) durchzuführen.
Die Finale Frage für mich ist, ob ich den Barebone aufgrund des Problems mit dem oberen PCIe Gen 5 M2 Platzes umtausche inkl. des damit verbundenen zusätzlichen Aufwands/Arbeit oder die aktuell Situation akzeptiere und das System weiter nutze und beobachte.
Vielen Dank