首页
/ Ubuntu20.04显卡驱动CUDA及cuDNN安装与卸载教程

Ubuntu20.04显卡驱动CUDA及cuDNN安装与卸载教程

2025-08-24 07:17:42作者:温艾琴Wonderful

1. 适用场景

本教程专为需要在Ubuntu 20.04系统上配置深度学习环境的开发者和研究人员设计。无论是进行机器学习模型训练、计算机视觉项目开发,还是进行高性能计算任务,正确安装NVIDIA显卡驱动、CUDA工具包和cuDNN库都是至关重要的基础步骤。

该教程特别适用于以下场景:

  • 新安装Ubuntu 20.04系统后的GPU环境配置
  • 需要升级或更换不同版本CUDA和cuDNN的情况
  • 遇到驱动冲突或安装失败时的故障排除
  • 需要在多GPU环境中进行配置优化

2. 适配系统与环境配置要求

系统要求

  • 操作系统: Ubuntu 20.04 LTS (Focal Fossa) 64位版本
  • 内核版本: 推荐使用最新稳定版内核
  • 存储空间: 至少20GB可用磁盘空间
  • 内存: 建议8GB以上RAM

硬件要求

  • GPU: NVIDIA GeForce系列、Quadro系列、Tesla系列或RTX系列显卡
  • 显存: 建议4GB以上显存以获得更好的深度学习性能
  • 架构: 支持CUDA计算的NVIDIA GPU(计算能力3.5及以上)

软件依赖

  • GCC编译器和相关开发工具
  • 必要的32位兼容库
  • zlib压缩库
  • NVIDIA官方驱动依赖包

3. 资源使用教程

NVIDIA驱动安装

方法一:通过Ubuntu官方仓库安装(推荐)

# 更新系统包索引
sudo apt update

# 检测可用驱动
ubuntu-drivers devices

# 自动安装推荐驱动
sudo ubuntu-drivers autoinstall

# 重启系统
sudo reboot

方法二:通过PPA仓库安装(获取最新驱动)

# 添加Graphics Drivers PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

# 安装指定版本驱动
sudo apt install nvidia-driver-XXX

CUDA工具包安装

网络安装方式:

# 下载并安装CUDA网络安装包
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/3bf863cc.pub
sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /"
sudo apt update
sudo apt install cuda

cuDNN库安装

使用Debian包安装:

# 下载cuDNN本地安装包
wget https://developer.download.nvidia.com/compute/cudnn/9.x.y/local_installers/cudnn-local-repo-ubuntu2004-9.x.y_1.0-1_amd64.deb

# 安装本地仓库
sudo dpkg -i cudnn-local-repo-ubuntu2004-9.x.y_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-*/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt update

# 安装cuDNN
sudo apt install libcudnn9-dev

环境变量配置

~/.bashrc文件中添加以下内容:

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda

验证安装

# 验证NVIDIA驱动
nvidia-smi

# 验证CUDA安装
nvcc --version

# 验证cuDNN安装
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

4. 常见问题及解决办法

驱动安装失败

问题: 安装过程中出现依赖错误或冲突 解决方案:

# 完全卸载现有NVIDIA驱动
sudo apt purge *nvidia*
sudo apt autoremove

# 清理残留配置
sudo apt autoclean
sudo apt clean

# 重新安装
sudo ubuntu-drivers autoinstall

CUDA版本不兼容

问题: CUDA工具包与NVIDIA驱动版本不匹配 解决方案:

  1. 检查当前驱动支持的CUDA版本:nvidia-smi
  2. 安装对应版本的CUDA工具包
  3. 或升级NVIDIA驱动到支持所需CUDA版本的版本

cuDNN安装错误

问题: cuDNN库文件找不到或版本冲突 解决方案:

# 检查CUDA安装路径
echo $CUDA_HOME

# 手动复制cuDNN文件
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

图形界面无法启动

问题: 安装驱动后无法进入桌面环境 解决方案:

  1. 进入恢复模式或TTY终端
  2. 卸载问题驱动:sudo apt purge nvidia-driver-XXX
  3. 安装稳定版本驱动
  4. 重新配置显示管理器:sudo dpkg-reconfigure gdm3

内存不足错误

问题: 编译或运行时报内存不足 解决方案:

  • 增加交换空间
  • 关闭不必要的应用程序
  • 使用make -j$(nproc)控制编译线程数

权限问题

问题: 普通用户无法访问GPU设备 解决方案:

# 将用户添加到video组
sudo usermod -a -G video $USER

# 或修改设备权限
sudo chmod 666 /dev/nvidia*

通过遵循本教程的步骤,您将能够在Ubuntu 20.04系统上成功配置完整的GPU计算环境,为深度学习和其他GPU加速应用提供稳定的运行基础。记得在每次重大更改后重启系统以确保所有配置生效。