NVIDIA Quadro RTX 5000, 16 GB GDDR6 defekt

mtemp

Lt. Commander
Registriert
Okt. 2008
Beiträge
1.274
Hallo,
laut HP-Supportmensch ist in der Workstation HP Z4 unter Win10:
Intel(R) Core(TM) i9-10980XE CPU @ 3.00GHz

die Grafikkarte defekt und der Grund dafür, dass der Rechner beim Booten nur noch Signaltöne von sich gab, man nicht mehr ins BIOS gelang:

NVIDIA® Quadro RTX 5000, 16 GB GDDR6

Nach dem Austausch dieser Karte piepst der Rechner zwar nicht mehr, man gelangt ins BIOS und per "Notfall-USB" lässt sich vom Stick booten, doch die M.2 SSD als System"festplatte" wird weiterhin nicht erkannt. Diese war vor ein paar wenigen Monaten bereits ausgetauscht worden.
Nun also kommt die Grafikkarte hinzu.

Frage nur zur getauschten Grafikkarte: was kann wie passiert sein, dass diese nun (immerhin) zu einem Garantiefall geworden ist? Was ist die Ursache für einen solchen "Defekt"? Was von/in der Grafikkarte ist nicht mehr funktionsfähig?

Danke!
mtemp
Ergänzung ()

... just eben Rückruf vom HP-Support: der Techniker kommt in 2 Tagen mit einer neuen M.2 SSD, die er bereits einmal getauscht hatte ...
 
Das kann man so nicht sagen, das ist ein technisch hochkomplexes Bauteil und da kann man schlicht nur raten mit den gegebenen Informationen.

Ich persönlich würde bei HP auf eine miserable OEM Kühlung tippen...

Was die Festplatte betrifft, ist das CSM im UEFI vielleicht deaktiviert aber es wird noch eine alte Windows MBR Partition genutzt?
 
Dachte, es gäbe bei Grafikkarten so 1-2 oder 3 "neuralgische Punkte"...

Auf die Kühlung werde ich den Supportmenschen mal ansprechen. Angesprochen auf Netzteil meinte er, er glaube es eher nicht -- dass diese nun die Grafikkarte und damals (vor ein paar Monate) wie heute die SSD zerschossen haben könnte.

Und bin gerade überrascht, dass die SSD wieder im BIOS in den Boot-Optionen auftaucht -- auf der suche nach CSM/Legacy Mode:

20220315_153809_hp-z4_bios_boot-options.jpg


Hattest Du diese ausgegraute Option gemeint?

Doch Booten von der an die erste Position verschobene SSD geht weiterhin nicht. Nur der Aufruf des BIOS + Booten mittels "Notfall-USB" (zb von Heise), wo dann die Festplatte jedoch nicht auftaucht.

Ob beim nächsten Neustart der Eintrag wieder verschwunden sein wird? Mich würds nicht wundern ...
 
mtemp schrieb:
dass die SSD wieder im BIOS in den Boot-Optionen auftaucht
Ja, CSM wird auch oft als Legacy bezeichnet.

Generell muss man zwischen der SSD als Hardware und dem "Windows Boot Manager" als Bootlaufwerk unterscheiden. Ist CSM nicht aktiv können Laufwerke mit MBR nicht gefunden und gestartet werden.

Da CSM aus dem aktuellen Stand der Technik entspricht sollten alle Windowsinstallationen über UEFI mit GPT erfolgen. Sollte es wirklich MBR sein kann man sein Laufwerk mit MBR2GPT nach GPT konvertieren lassen.
 
cvzone schrieb:
Ich persönlich würde bei HP auf eine miserable OEM Kühlung tippen...

Glaube eher nicht dass es an der Kühlung liegt, wenn die Cases und das Konzept dafür ausgelegt sind bis zu 56 Cores und 3x P6000 zu handlen.

Kann halt sonstwas random kaputt gegangen sein, wie schon gesagt wurde, sind hoch komplexe Bauteile, die dementsprechend viele Stellen haben wo etwas kaputt gehen kann, ob es jetzt Speicher, Stromversorgung usw ist.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: cvzone
Die Z Desktop Serie hat eine sehr gutes und auch in vielen Situationen leises Kühlsystem, hatte mal Dell Workstations zum Vergleich da - das sind schon Unterschiede.

Zum Thema:
Ich würde da auch auf das Board tippen.
Aber bei so einem System solltest Du ja Vorort NBD Service haben, auch wenn es sicherlich schwierig ist grade mit den Ersatzteilen.

Wenn der Techniker die SSD getauscht hat und es nicht bootet oder erkannt wird, wird (lies: sollte) er ziemlicher sicher das nächste Mal mit einem Board wiederkommen.
Wobei eben: Die SSD gemäss Screenshot wird ja erkannt, es scheint aber kein Betriebssystem erkannt worden zu sein.

UEFI ist aktuell? Wenns älter ist: Der Release 2.68 behebt z.B. "Fixes an issue where certain NVMe storage devices may not be detected after warm reset". Aktuell ist 2.76 vom Dezember 2021.
 
Zuletzt bearbeitet:
Der Vor-Ort-Service hatte bereits Okt/Nov 2021 die nach 1,5 Jahren defekte M.2 SSD letztendlich getauscht -- im 3. Anlauf, nachdem tatsächlich auch während der Fehlersuche, wieso das System nicht mehr bootete und die SSD nicht mehr erkannt worden war, das Mainboard getauscht worden war. Doch der Techniker meinte, nachdem das System auch danach nicht booten konnte, dass sein mitgebrachtes Mainboard defekt sei, was passieren könne ...

Nun hatte ich ja anfangs, vor 2 Wochen, exakt das selbe Problem: von der neuen SSD konnte nicht mehr gebootet, nur noch das aktuelle BIOS/UEFI aufgerufen werden, Stunden später hingegen ging dies nicht mehr, nur noch die Signaltöne.
Nach dem heutigen Techniker-Einsatz -- der neben der identischen Grafikkarte auch Netzteil und tatsächlich ein Mainboard dabei hatte --, und seinem Austausch der Grafikkarte konnte nun wieder ins BIOS gestartet und auch von einem "Notfall-USB" gestartet werden. SSD weiterhin nicht erkannt. Und so kommt dieser Techniker am Donnerstag erneut -- diesmal auch mit einer SSD, die ich mir bereits heute gewünscht hätte aufgrund des anfänglichen identischen Verhaltens wie vor ein paar Monaten. Doch auch bei meinen 3 Telefonaten mit dem HP-Support zuvor -- bereits beim 1. wurde mir ein Vor-Ort-Service "versprochen", doch es tat sich nichts -- stieß ich hierbei auf, hmm, mit Verlaub, schwerhörige ;-) Ohren.

Dass das Mainboard defekt sei, so meinte er, eher nicht, denn sonst könne man auch nicht vom Stick booten (er nutzte WinPE).


Dies hier als schnelle Zwischenantwort. Denn eigentlich sollte ich Dinge erledigen, die aufgrund des nun zweiwöchigen Ausfalls auf der Strecke geblieben sind : (



Noch ein paar Daten:
  • Systemmodell HP Z4 G4 Workstation
  • Systemtyp x64-basierter PC
  • System-SKU 1JP11AV
  • Prozessor Intel(R) Core(TM) i9-10980XE CPU @ 3.00GHz, 3000 MHz, 18 Kern(e), 36 logische(r) Prozessor(en)
  • BIOS-Version/-Datum HP P62 v02.76, 29.11.2021
  • SMBIOS-Version 3.2
  • Version des eingebetteten Controllers 255.255
  • BIOS-Modus UEFI
  • BaseBoard-Hersteller HP
  • BaseBoard-Produkt 81C5
 
Rechner lief ja bis zu dem Bluescreen inmitten Videoanschauung mittels VLC mehr oder minder sorgenfrei.
Ein Board hatte der Techniker bei seinem Vor-ort-Einsatz (3 Jahre Vor-Ort-Service). Doch nach dem Tausch der Grafikkarte blieben die Signaltöne aus und BIOS/UEFI konnte wieder aufgerufen werden.
Die M.2 SSD tauchte dabei nur sporadisch dort auf, was mir der Techniker vorhin nochmals bestätigt hatte – denn mit seinem 2. Einsatz hat er vorhin die innerhalb von 2 Tagen gelieferte SSD eingebaut und konnte testweise Win10Pro installieren.
Soweit wiederhergestellt.
Was die Ursache war, zB eben das Mainboard (Netzteil schloss er aus, was er bei seinem 1. Besuch allerdings auch dabeigehabt hatte), weiterhin unklar. Da die Festplatte ja bereits vor weniger als einem halben Jahr getauscht wurde, nun erneut (zzgl. der Grafikkarte), so solle ich – sinngemäßes Zitat – trotzdem nicht zu pessimistisch sein, dass dies ganze ein 3.x passiert. Denn vielleicht gehts und hälts ja jetzt ...

... die Zukunft könnte also im Großen wie hier im Kleinen ruhig etwas besser aussehen : (

Nun läuft die Installation von WIn10 Enterprise übers Netzwerk (und ACMP). Danach wieder Programme installieren und v.a. einrichten u.v.a.m.

Abschließend gefragt: was sagt Ihr nun dazu, zu diesen Problemen, die mich 3 Wochen lang vom "normalen" Arbeiten abhielten und eine "Wiederholung" meines Erachtens wg. der unbekannten Ursache nicht ausgeschlossen ist?

Dankesgrüße!
mtemp


cvzone schrieb:
Was die Festplatte betrifft, ist das CSM im UEFI vielleicht deaktiviert aber es wird noch eine alte Windows MBR Partition genutzt?

Lawnmower schrieb:
Ich würde da auch auf das Board tippen.
Aber bei so einem System solltest Du ja Vorort NBD Service haben, auch wenn es sicherlich schwierig ist grade mit den Ersatzteilen.

Lawnmower schrieb:
Wobei eben: Die SSD gemäss Screenshot wird ja erkannt, es scheint aber kein Betriebssystem erkannt worden zu sein.
Ergänzung ()

Aus dem Protokoll des Technikers:

Problem: SSD is not recognized sporadically. Operating system does not boot anymore. In diagnosis SSD is not recognized. Troubleshooting: SSD exchanged, UEFI diagnostics executed, OK. Windows 10 installed. Windows boots. Several restarts performed.
 
Zuletzt bearbeitet:
Lies mal den letzten Satz von Lawnmower und Upgrade mal das UEFI, falls es der Techniker nicht gemacht hat. Klingt schon sehr nach deiner Fehlerbeschreibung mit der M.2
 
thrawnx schrieb:
Lies mal den letzten Satz von Lawnmower und Upgrade mal das UEFI, falls es der Techniker nicht gemacht hat. Klingt schon sehr nach deiner Fehlerbeschreibung mit der M.2

Ja, BIOS war & ist aktuell:
1648034469357.png



Hatte der Techniker als nicht aktualisieren müssen – nur austauschen...
... der selbe Techniker, der die SSD bereits vor ein paar Monaten tauschen musste. Nun ja zusätzlich & zuvor die Grafikkarte (die der Verursacher für die Signaltöne war und dass ich gar nicht mehr ins BIOS hineingekommen war). Nachdem er die Karte getauscht hatte, gelangte man wieder ins BIOS, die M.2 SSD tauchte bei nachfolgenden Neustarts immer nur sporadisch im BIOS auf, war aber nicht reaktivierbar. So musste also erneut eine solche 2 TB-SSD bestellt werden. 2 Tage später kreuzte der Techniker damit wieder auf und baute sie ein; installierte dabei zum finalen Test ein Win10 von seinem Stick.
Danach durfte ich also wieder einmal Enterprise + alle Programme + alle Einstellungen installieren/anwenden.

Bin gespannt, wie viele Monate das "neue" System nun (mit mir...) aus- & durchhält und welche Komponenten nach dem nächsten Bluescreen ausgetauscht werden müssen. Die vom Techniker bei seinem 1. Besuch mitgebrachte CPU und das Mainboard kamen bei seinen Wiederherstellungsversuchen ja nicht zum Einsatz.

Ursache also weiterhin unbekannt. Somit ist der nächste Totalabsturz vorprogrammiert – behaupte ich ...
Der Techniker hingegen: ich solle nicht so pessimistisch sein ...

Fazit: macht nicht wirklich Spaß, diese teure (oder überteuerte?) und weiterhin noch relativ junge HP-Workstation. : (

Danke Euch!
Ergänzung ()

Nachtrag/Nachfrage:

Wieso erkennt Windows Update -> optionale Update nicht die bereits aktuelle Firmware?

1648035381764.png
 
Zuletzt bearbeitet:
Zurück
Oben