Ubuntu 24.04.2 LTS安装配置pytorch深度学习环境?

Ubuntu 24.04.2 LTS 上安装和配置 PyTorch 深度学习环境,主要包括以下几个步骤:


✅ 一、系统准备

1. 更新系统

sudo apt update && sudo apt upgrade -y

2. 安装必要的工具

sudo apt install -y python3-pip python3-dev build-essential git curl

✅ 二、安装 Python 环境(推荐使用虚拟环境)

1. 创建虚拟环境(可选但强烈推荐)

python3 -m venv pytorch_env
source pytorch_env/bin/activate

2. 升级 pip

pip install --upgrade pip

✅ 三、安装 NVIDIA 驱动(如使用 GPU)

若你有 NVIDIA 显卡并希望使用 CUDA X_X,请先确认驱动。

1. 查看显卡型号

lspci | grep -i nvidia

2. 添加官方显卡 PPA 并安装驱动

sudo add-apt-repository ppa:graphics-drivers/ppa -y
sudo apt update

3. 推荐使用 ubuntu-drivers 自动选择合适驱动

ubuntu-drivers devices
sudo ubuntu-drivers autoinstall

或手动安装(例如):

sudo apt install -y nvidia-driver-535  # 或更高版本

⚠️ 安装完成后重启:

sudo reboot

4. 验证驱动安装

nvidia-smi

应看到 GPU 信息和驱动版本。


✅ 四、安装 CUDA Toolkit 和 cuDNN(可选:PyTorch 可自带 CUDA)

注意:从 PyTorch 1.12 起,官方通过 pip 提供了包含 CUDA 的预编译包,通常 无需单独安装 CUDA Toolkit。除非你要开发 CUDA 扩展,否则跳过此步。

若你需要完整 CUDA 开发环境:

方法一:通过 NVIDIA 官方安装 CUDA

# 下载 CUDA Toolkit 12.x for Ubuntu 22.04/20.04 (兼容 24.04)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update
sudo apt install -y cuda-toolkit-12-4

添加环境变量到 ~/.bashrc

echo 'export PATH=/usr/local/cuda-12.4/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

方法二:cuDNN(需注册 NVIDIA 开发者)

参考:https://docs.nvidia.com/deeplearning/cudnn/install-guide/


✅ 五、安装 PyTorch

方式一:使用 pip(推荐,最简单)

前往 https://pytorch.org/get-started/locally/ 获取最新命令。

截至 2025 年 4 月,适用于 Ubuntu 24.04 + CUDA 支持的命令如下:

安装 PyTorch(含 CUDA 支持)

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

注:cu121 表示 CUDA 12.1,PyTorch 使用的是内部封装的 CUDA 运行时,与系统 CUDA 版本可以不完全一致(只要驱动支持即可)。

如果只用 CPU

pip install torch torchvision torchaudio

✅ 六、验证安装

1. 启动 Python

python3

2. 测试 PyTorch 和 GPU 支持

import torch

print("PyTorch version:", torch.__version__)
print("CUDA available:", torch.cuda.is_available())
print("CUDA version:", torch.version.cuda)
print("Number of GPUs:", torch.cuda.device_count())

if torch.cuda.is_available():
    print("Current GPU:", torch.cuda.get_device_name(0))

预期输出:

PyTorch version: 2.3.0+cu121
CUDA available: True
CUDA version: 12.1
Number of GPUs: 1
Current GPU: NVIDIA GeForce RTX 3070

✅ 七、(可选)安装 Jupyter Notebook / VS Code

安装 Jupyter

pip install jupyter notebook
jupyter notebook --ip=0.0.0.0 --port=8888 --no-browser --allow-root

安装常用深度学习库

pip install numpy pandas matplotlib scikit-learn tqdm tensorboard

✅ 八、常见问题排查

问题 解决方法
nvidia-smi 找不到命令 检查驱动是否安装成功,重启系统
torch.cuda.is_available() 返回 False 检查 nvidia-smi 是否正常;确认 PyTorch 是否为 CUDA 版本
No module named torch 检查是否激活了正确的虚拟环境
CUDA 版本不匹配 使用 --index-url https://download.pytorch.org/wha/cu121 确保下载正确构建版本

✅ 总结:完整脚本(快速部署)

# 1. 更新系统
sudo apt update && sudo apt upgrade -y

# 2. 安装基础工具
sudo apt install -y python3-pip python3-dev build-essential git

# 3. 创建虚拟环境
python3 -m venv pytorch_env
source pytorch_env/bin/activate

# 4. 升级 pip
pip install --upgrade pip

# 5. 安装 PyTorch with CUDA
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

# 6. 验证
python3 -c "import torch; print(f'PyTorch: {torch.__version__}, CUDA: {torch.cuda.is_available()}')"

如有特殊需求(如使用 Conda、Docker、多版本管理等),可进一步扩展说明。

需要我提供 Conda 版本Docker 镜像方案 吗?

未经允许不得转载:秒懂云 » Ubuntu 24.04.2 LTS安装配置pytorch深度学习环境?