Ubuntu 20.04安装CUDA失败导致系统黑屏的解决方法

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

Ubuntu 20.04安装CUDA失败导致系统黑屏的解决方法

贺志国

前天因为无聊将CUDA 11.7升级到CUDA 12.0 安装完成后重启系统黑屏提示信息如下

nvidia 0000:01:00.0: can't change power state from D3cold to D0 

一看就是CUDA安装失败导致Nvidia显卡驱动异常了于是只能在命令行中修复解决了。

一、进入命令行界面

我的电脑是联想Thinkbook这个电脑选择开机菜单比较繁琐具体方法如下

  1. 开机按shift+esc键进入grub菜单选择ubuntu高级选项注意不要一直按着shift+esc键不动这样会直接进入grub提示界面只需按一次即可
  2. 在显示的界面中选中相应内核的recovery mode模式敲回车到恢复模式主菜单界面
  3. 在恢复模式主菜单界面中选择fsck check all filesystems一直敲回车直到再次返回到恢复模式主菜单界面
  4. 选中root drop to root shell prompt敲回车进入命令行界面。

二、删除CUDA 12.0

罪魁祸首肯定是CUDA 12.0于是需要删除它命令如下

sudo apt-get --purge remove "*cublas*" "*cuda*" "nsight*" 

删除 Nvidia 驱动程序

sudo apt-get --purge remove "*nvidia*"

但上述命令基本上不能够将CUDA 12.0清理干净使用如下命令查找

sudo find / -iname "*ubuntu2004-12*"
sudo find / -iname "*cuda12*"

再使用rm -f命令将搜索到的文件全部删除。执行如下修复安装命令

sudo apt-get --fix-broken install

重启电脑就可重新进入Ubuntu图形化界面。

三、重新安装CUDA

安装CUDA 11.7命令如下

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda-repo-ubuntu2004-11-7-local_11.7.0-515.43.04-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-11-7-local_11.7.0-515.43.04-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda

安装完毕后使用如下命令验证安装是否正常

nvidia-smi
阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6
标签: Ubuntu