Ubuntu20.04显卡驱动CUDA及cuDNN安装与卸载教程
2025-08-24 07:17:42作者:温艾琴Wonderful
1. 适用场景
本教程专为需要在Ubuntu 20.04系统上配置深度学习环境的开发者和研究人员设计。无论是进行机器学习模型训练、计算机视觉项目开发,还是进行高性能计算任务,正确安装NVIDIA显卡驱动、CUDA工具包和cuDNN库都是至关重要的基础步骤。
该教程特别适用于以下场景:
- 新安装Ubuntu 20.04系统后的GPU环境配置
- 需要升级或更换不同版本CUDA和cuDNN的情况
- 遇到驱动冲突或安装失败时的故障排除
- 需要在多GPU环境中进行配置优化
2. 适配系统与环境配置要求
系统要求
- 操作系统: Ubuntu 20.04 LTS (Focal Fossa) 64位版本
- 内核版本: 推荐使用最新稳定版内核
- 存储空间: 至少20GB可用磁盘空间
- 内存: 建议8GB以上RAM
硬件要求
- GPU: NVIDIA GeForce系列、Quadro系列、Tesla系列或RTX系列显卡
- 显存: 建议4GB以上显存以获得更好的深度学习性能
- 架构: 支持CUDA计算的NVIDIA GPU(计算能力3.5及以上)
软件依赖
- GCC编译器和相关开发工具
- 必要的32位兼容库
- zlib压缩库
- NVIDIA官方驱动依赖包
3. 资源使用教程
NVIDIA驱动安装
方法一:通过Ubuntu官方仓库安装(推荐)
# 更新系统包索引
sudo apt update
# 检测可用驱动
ubuntu-drivers devices
# 自动安装推荐驱动
sudo ubuntu-drivers autoinstall
# 重启系统
sudo reboot
方法二:通过PPA仓库安装(获取最新驱动)
# 添加Graphics Drivers PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
# 安装指定版本驱动
sudo apt install nvidia-driver-XXX
CUDA工具包安装
网络安装方式:
# 下载并安装CUDA网络安装包
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/3bf863cc.pub
sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /"
sudo apt update
sudo apt install cuda
cuDNN库安装
使用Debian包安装:
# 下载cuDNN本地安装包
wget https://developer.download.nvidia.com/compute/cudnn/9.x.y/local_installers/cudnn-local-repo-ubuntu2004-9.x.y_1.0-1_amd64.deb
# 安装本地仓库
sudo dpkg -i cudnn-local-repo-ubuntu2004-9.x.y_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-*/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt update
# 安装cuDNN
sudo apt install libcudnn9-dev
环境变量配置
在~/.bashrc
文件中添加以下内容:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda
验证安装
# 验证NVIDIA驱动
nvidia-smi
# 验证CUDA安装
nvcc --version
# 验证cuDNN安装
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
4. 常见问题及解决办法
驱动安装失败
问题: 安装过程中出现依赖错误或冲突 解决方案:
# 完全卸载现有NVIDIA驱动
sudo apt purge *nvidia*
sudo apt autoremove
# 清理残留配置
sudo apt autoclean
sudo apt clean
# 重新安装
sudo ubuntu-drivers autoinstall
CUDA版本不兼容
问题: CUDA工具包与NVIDIA驱动版本不匹配 解决方案:
- 检查当前驱动支持的CUDA版本:
nvidia-smi
- 安装对应版本的CUDA工具包
- 或升级NVIDIA驱动到支持所需CUDA版本的版本
cuDNN安装错误
问题: cuDNN库文件找不到或版本冲突 解决方案:
# 检查CUDA安装路径
echo $CUDA_HOME
# 手动复制cuDNN文件
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
图形界面无法启动
问题: 安装驱动后无法进入桌面环境 解决方案:
- 进入恢复模式或TTY终端
- 卸载问题驱动:
sudo apt purge nvidia-driver-XXX
- 安装稳定版本驱动
- 重新配置显示管理器:
sudo dpkg-reconfigure gdm3
内存不足错误
问题: 编译或运行时报内存不足 解决方案:
- 增加交换空间
- 关闭不必要的应用程序
- 使用
make -j$(nproc)
控制编译线程数
权限问题
问题: 普通用户无法访问GPU设备 解决方案:
# 将用户添加到video组
sudo usermod -a -G video $USER
# 或修改设备权限
sudo chmod 666 /dev/nvidia*
通过遵循本教程的步骤,您将能够在Ubuntu 20.04系统上成功配置完整的GPU计算环境,为深度学习和其他GPU加速应用提供稳定的运行基础。记得在每次重大更改后重启系统以确保所有配置生效。