ubuntu24.04上使用pycharm中搭建深度学习环境?

在 Ubuntu 24.04 上使用 PyCharm 搭建深度学习环境,最推荐的方式是利用 PyCharm 自带的虚拟环境管理器(Conda 或 venv)配合 NVIDIA CUDA 驱动。Ubuntu 24.04 默认使用较新的 Python 版本(3.12),且对 Docker 和 WSL2 支持良好。

以下是完整的操作指南,分为前置准备PyCharm 配置安装深度学习框架三个阶段。


第一阶段:系统级前置准备

在打开 PyCharm 之前,必须确保操作系统层面已经安装了 GPU 驱动和必要的工具链。

1. 安装 NVIDIA 驱动

Ubuntu 24.04 通常预装了开源驱动,但为了深度学习性能,建议安装官方专有驱动。

# 更新软件源
sudo apt update && sudo apt upgrade -y

# 查看推荐的驱动版本
ubuntu-drivers devices

# 安装推荐版本(例如 nvidia-driver-535 或更高)
sudo ubuntu-drivers autoinstall
# 或者手动指定版本:sudo apt install nvidia-driver-550

重启电脑后,运行 nvidia-smi 确认驱动正常加载。

2. 安装 CUDA Toolkit (可选但推荐)

虽然 PyTorch/TensorFlow 的 pip 包通常自带了对应的 CUDA 库(无需单独安装系统级 CUDA),但如果你需要编译自定义算子或使用特定版本的 CUDA,建议安装:

# 以 CUDA 12.1 为例(需去 NVIDIA 官网下载 deb 包或使用 apt 源)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update
sudo apt install -y cuda-toolkit-12-1

注意:如果只是为了跑代码,直接通过 pip 安装 pytorch 即可,它会自动处理依赖。

3. 安装 Conda (强烈推荐)

PyCharm 原生支持 Conda,管理深度学习环境比 Python 自带的 venv 更稳定,特别是处理 C++ 扩展时。

# 安装 Miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh

# 初始化 conda (按提示输入 yes)
source ~/.bashrc

第二阶段:在 PyCharm 中创建环境

1. 新建项目

启动 PyCharm,选择 New Project

  • Location: 选择你的工作目录。
  • Python Interpreter: 点击右侧齿轮图标 -> Add…

2. 配置 Conda 解释器

在弹出的对话框中选择 Conda Environment

  1. Interpreter: 选择 Existing environment
  2. Path to executable: 指向你的 conda 路径,通常是 /home/用户名/miniconda3/bin/python
  3. Base interpreter: 保持默认。
  4. Click "Create": 此时会创建一个名为 conda-base 的基础环境。

最佳实践:不要直接在基础环境中安装库。建议在 PyCharm 中再次点击 Add… -> Conda Environment -> New environment,命名为类似 dl_env_pytorch,并勾选 Install packages 选项框。

3. 设置系统解释器路径 (关键步骤)

由于 Ubuntu 24.04 的某些系统库可能与旧版 PyTorch冲突,确保 PyCharm 识别到的 Python 路径是正确的 Conda 环境路径:

  • 进入 File -> Settings -> Project: <YourProject> -> Python Interpreter
  • 确认当前激活的是你刚刚创建的 Conda 环境。

第三阶段:安装深度学习框架

在 PyCharm 下方的 Terminal 标签页中(该终端已自动激活了你配置的 Conda 环境),执行以下命令。

方案 A:安装 PyTorch (推荐)

访问 PyTorch 官网 获取最新命令。对于 Ubuntu + CUDA 12.x,通用命令如下:

# 激活环境 (如果在 Terminal 中未自动激活)
conda activate dl_env_pytorch

# 安装 PyTorch 2.x (CUDA 12.1 版本)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

# 验证安装
python -c "import torch; print(torch.cuda.is_available())"

如果返回 True,说明 GPU 环境搭建成功。

方案 B:安装 TensorFlow

TensorFlow 对 CUDA 版本有严格要求,建议先确定需要的 CUDA 版本。

# 安装 TensorFlow 2.x (CPU 版或 GPU 版,取决于 pip 包内置的 CUDA 版本)
pip install tensorflow[and-cuda]

注意:TF 2.16+ 开始对 CUDA 12 的支持更好,但在 Ubuntu 24.04 上,如果遇到兼容性问题,可能需要降级到 TF 2.15 并使用 CUDA 11.8。


第四阶段:验证与调试

1. 编写测试脚本

在项目中新建一个 test_gpu.py 文件:

import torch

print(f"PyTorch version: {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"CUDA version: {torch.version.cuda}")
    print(f"GPU Device: {torch.cuda.get_device_name(0)}")
else:
    print("No GPU detected!")

2. 运行测试

右键点击该文件 -> Run ‘test_gpu’
观察控制台输出,如果显示 CUDA available: True 且显示了显卡型号,则环境搭建完全成功。


常见问题排查 (Troubleshooting)

  1. PyCharm 找不到 conda

    • 原因:环境变量未生效。
    • 解决:在 PyCharm 的 Settings -> Build, Execution, Deployment -> Console -> Python Console 中,取消勾选 "Use system python",并确保 Interpreter 路径指向正确的 conda python。
  2. CUDA 版本不匹配

    • 现象:ImportError: libcudart.so.12...RuntimeError: CUDA error
    • 解决:确保 pip install 时的 cuXXX 后缀与你系统中安装的 NVIDIA 驱动支持的 CUDA 版本一致。通常新驱动向下兼容,但高版本 CUDA 不一定能跑在低版本驱动上。
  3. Ubuntu 24.04 特有的 Python 3.12 问题

    • 部分旧的深度学习库(如某些旧版 OpenCV 或自定义 C++ 扩展)可能尚未完全适配 Python 3.12。
    • 解决:如果报错 ModuleNotFoundError 或编译失败,建议在 PyCharm 中使用 Conda 创建一个 Python 3.10 或 3.11 的环境来运行旧项目:
      conda create -n old_dl_env python=3.10
      conda activate old_dl_env

通过以上步骤,你可以在 Ubuntu 24.04 上获得一个稳定、隔离且功能完善的 PyCharm 深度学习开发环境。

未经允许不得转载:云知识CLOUD » ubuntu24.04上使用pycharm中搭建深度学习环境?