在 Ubuntu 24.04.2 LTS 上安装和配置 PyTorch 深度学习环境,主要包括以下几个步骤:
✅ 一、系统准备
1. 更新系统
sudo apt update && sudo apt upgrade -y
2. 安装必要的工具
sudo apt install -y python3-pip python3-dev build-essential git curl
✅ 二、安装 Python 环境(推荐使用虚拟环境)
1. 创建虚拟环境(可选但强烈推荐)
python3 -m venv pytorch_env
source pytorch_env/bin/activate
2. 升级 pip
pip install --upgrade pip
✅ 三、安装 NVIDIA 驱动(如使用 GPU)
若你有 NVIDIA 显卡并希望使用 CUDA X_X,请先确认驱动。
1. 查看显卡型号
lspci | grep -i nvidia
2. 添加官方显卡 PPA 并安装驱动
sudo add-apt-repository ppa:graphics-drivers/ppa -y
sudo apt update
3. 推荐使用 ubuntu-drivers 自动选择合适驱动
ubuntu-drivers devices
sudo ubuntu-drivers autoinstall
或手动安装(例如):
sudo apt install -y nvidia-driver-535 # 或更高版本
⚠️ 安装完成后重启:
sudo reboot
4. 验证驱动安装
nvidia-smi
应看到 GPU 信息和驱动版本。
✅ 四、安装 CUDA Toolkit 和 cuDNN(可选:PyTorch 可自带 CUDA)
注意:从 PyTorch 1.12 起,官方通过
pip提供了包含 CUDA 的预编译包,通常 无需单独安装 CUDA Toolkit。除非你要开发 CUDA 扩展,否则跳过此步。
若你需要完整 CUDA 开发环境:
方法一:通过 NVIDIA 官方安装 CUDA
# 下载 CUDA Toolkit 12.x for Ubuntu 22.04/20.04 (兼容 24.04)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update
sudo apt install -y cuda-toolkit-12-4
添加环境变量到 ~/.bashrc:
echo 'export PATH=/usr/local/cuda-12.4/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
方法二:cuDNN(需注册 NVIDIA 开发者)
参考:https://docs.nvidia.com/deeplearning/cudnn/install-guide/
✅ 五、安装 PyTorch
方式一:使用 pip(推荐,最简单)
前往 https://pytorch.org/get-started/locally/ 获取最新命令。
截至 2025 年 4 月,适用于 Ubuntu 24.04 + CUDA 支持的命令如下:
安装 PyTorch(含 CUDA 支持)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
注:
cu121表示 CUDA 12.1,PyTorch 使用的是内部封装的 CUDA 运行时,与系统 CUDA 版本可以不完全一致(只要驱动支持即可)。
如果只用 CPU
pip install torch torchvision torchaudio
✅ 六、验证安装
1. 启动 Python
python3
2. 测试 PyTorch 和 GPU 支持
import torch
print("PyTorch version:", torch.__version__)
print("CUDA available:", torch.cuda.is_available())
print("CUDA version:", torch.version.cuda)
print("Number of GPUs:", torch.cuda.device_count())
if torch.cuda.is_available():
print("Current GPU:", torch.cuda.get_device_name(0))
预期输出:
PyTorch version: 2.3.0+cu121
CUDA available: True
CUDA version: 12.1
Number of GPUs: 1
Current GPU: NVIDIA GeForce RTX 3070
✅ 七、(可选)安装 Jupyter Notebook / VS Code
安装 Jupyter
pip install jupyter notebook
jupyter notebook --ip=0.0.0.0 --port=8888 --no-browser --allow-root
安装常用深度学习库
pip install numpy pandas matplotlib scikit-learn tqdm tensorboard
✅ 八、常见问题排查
| 问题 | 解决方法 |
|---|---|
nvidia-smi 找不到命令 |
检查驱动是否安装成功,重启系统 |
torch.cuda.is_available() 返回 False |
检查 nvidia-smi 是否正常;确认 PyTorch 是否为 CUDA 版本 |
No module named torch |
检查是否激活了正确的虚拟环境 |
| CUDA 版本不匹配 | 使用 --index-url https://download.pytorch.org/wha/cu121 确保下载正确构建版本 |
✅ 总结:完整脚本(快速部署)
# 1. 更新系统
sudo apt update && sudo apt upgrade -y
# 2. 安装基础工具
sudo apt install -y python3-pip python3-dev build-essential git
# 3. 创建虚拟环境
python3 -m venv pytorch_env
source pytorch_env/bin/activate
# 4. 升级 pip
pip install --upgrade pip
# 5. 安装 PyTorch with CUDA
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# 6. 验证
python3 -c "import torch; print(f'PyTorch: {torch.__version__}, CUDA: {torch.cuda.is_available()}')"
如有特殊需求(如使用 Conda、Docker、多版本管理等),可进一步扩展说明。
需要我提供 Conda 版本 或 Docker 镜像方案 吗?
秒懂云