这是一篇有关在服务器上搭建深度学习开发环境的杂记。
1 cuda已安装,但是nvcc command not found
可能是未添加至路径,通过以下代码解决:
echo 'export PATH=/usr/local/cuda-12.3/bin/:$PATH'>>~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.3/lib64:$LD_LIBRARY_PATH'>>~/.bashrc
source ~/.bashrc
似乎在conda创建的虚拟环境中,如果要添加依赖cuda的库,也需要在虚拟环境中再这样做一次。
2 Anaconda虚拟环境和包管理
2.1 环境创建
conda create --name <env_name> python=3.x
2.2 环境激活或切换、环境退出
conda activate <env_name>
2.3 虚拟环境下安装Pytorch
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
注:本机使用的cuda版本是12.3,在2023.12.19为最新版本。由于cuda是向下兼容的,安装最新的支持cuda 12.1版本的Pytorch
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --set show_channel_urls yes