RTX 3080 unter Ubuntu nicht erkannt / Treiberprobleme

ZuseZ3

Lt. Commander
Registriert
Jan. 2014
Beiträge
1.659
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): Ryzen 5700G
  • Arbeitsspeicher (RAM): 48 GB
  • Mainboard: Gigabyte X470 Aorus Ultra Gaming
  • Netzteil: Seasonic Prime Platinum 500W
  • Gehäuse: Bit Phenix Shinobi
  • Grafikkarte: RTX 3080 TUF
  • HDD / SSD: div
  • Ubuntu 20.04 mit neustem Kernel 5.11.0-25

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Mein Problem ist, dass der NVIDIA closed source Treiber wohl installiert wird, aber nicht aktiviert wird.
Nutze ich die GPU zur Bildausgabe fällt er auf llvm-pipe zurück.
Nutze ich die APU und habe einen NVIDIA Treiber unter additional-drivers ausgewählt kann ich ebenfalls nicht auf die GPU zugreifen.
nvidia-smi funktioniert mit keinem der beiden Treiber
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Mittels PyTorch kann ich sie ebenfalls nicht nutzen:
torch.cuda.is_available()
False


Hier mit dem OS Treiber
Code:
➜  CS_BA_Data git:(main) ✗ python3 train.py
2000
<__main__.SegDataset object at 0x7faa7e048340>
dataset lengths 1800 200
/home/zuse/.local/lib/python3.8/site-packages/torch/cuda/__init__.py:52: UserWarning: CUDA initialization: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and installed a driver from http://www.nvidia.com/Download/index.aspx (Triggered internally at  /pytorch/c10/cuda/CUDAFunctions.cpp:100.)
  return torch._C._cuda_getDeviceCount() > 0
  0%|                                                   | 0/112 [00:01<?, ?it/s]
Traceback (most recent call last):
  File "train.py", line 238, in <module>
    retval = training_loop(3,
  File "train.py", line 157, in training_loop
    X = X.to(device).float()
  File "/home/zuse/.local/lib/python3.8/site-packages/torch/cuda/__init__.py", line 172, in _lazy_init
    torch._C._cuda_init()
RuntimeError: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and installed a driver from http://www.nvidia.com/Download/index.aspx
Hier mit dem Closed source 470er Treiber
Code:
➜  CS_BA_Data git:(main) ✗ python3 train.py
2000
<__main__.SegDataset object at 0x7f30dec32340>
dataset lengths 1800 200
  0%|                                                                                                                                                                | 0/112 [00:01<?, ?it/s]
Traceback (most recent call last):
  File "train.py", line 238, in <module>
    retval = training_loop(3,
  File "train.py", line 157, in training_loop
    X = X.to(device).float()
  File "/home/zuse/.local/lib/python3.8/site-packages/torch/cuda/__init__.py", line 172, in _lazy_init
    torch._C._cuda_init()
RuntimeError: No CUDA GPUs are available

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
Den 5700G zum laufen zu bekommen hat etwas gedauert, ich hatte dabei verschiedene PPAs getestet. Diese habe ich jedoch mit ppa-purge wieder entfernt: https://itsfoss.com/install-mesa-ubuntu/

Als Ziel möchte ich die Bildausgabe über die APU, die GPU soll aber bei Bedarf für PyTorch o.ä. zur Verfügung stehen. Sobald ich mal ein paar freie Tage habe werde ich meine systeme vmtl. virtualisieren und die GPU dann nach Bedarf durchreichen, erstmal möchte ich aber mein aktuelles Problem lösen um weiterarbeiten zu können.
Ergänzung ()

sudo apt install linux-headers-5.11.0-25-generic hats behoben, hier habe ich die Lösung gefunden:
https://forum.ubuntuusers.de/topic/nvidia-treiber-nach-rechnerstart-nicht-aktiv-s/
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: cruse
Schön vorsichtig mit dem 500W Netzteil und der 3080 sein 😈
 
  • Gefällt mir
Reaktionen: metallica2006, GTrash81 und NerdmitHerz
Ach, im anderen Thread haben die Leute da auch schon Panik verbreitet, so dass ich am Ende doch noch die 700W Version von meinem NT dazu bestellt habe.
Bisher habe ich aber nicht mal das PT angepasst / uv betrieben und schon mal einiges getestet.
Egal ob Benchmarks, Training von NN (PyTorch), Rendern (Blender), bisher lief alles super stabil durch.
Da ichs nicht zahlen muss werde ich es jetzt einfach austauschen sobald es ankommt. Aber mein Vertrauen in Seasonic war wohl doch gerechtfertigt :)
 
Zurück
Oben