其实就是需要我们注意CUDA,cuDNN,torch,torchvision之间的版本对应。这个环境挺麻烦的,有一点没配置好在运行程序的时候可能就会有很多错误。更加详细的配置torch GPU版本可以参考我的另一篇博客Dali工具箱🔧1——torch GPU版本环境配置。
1.Google colab环境配置
Google colab提供的免费GPU,是我目前学习的主要工具。很适合还没有进组的同学们进行深度学习练手和学习。
1.1 连接Google Drive
1
2
3
4
5
6
7
8
9
# 连接Google云盘
import os
from google.colab import drive
drive.mount('/content/drive')
# path是ipynb的工作路径
path = "/content/drive/My Drive/水下目标检测/HitDetection"
os.chdir(path)
os.listdir(path)
1.2 安装Anaconda3
!wget -q https://repo.anaconda.com/archive/Anaconda3-2019.10-Linux-x86_64.sh
!chmod +x Anaconda3-2019.10-Linux-x86_64.sh
!bash ./Anaconda3-2019.10-Linux-x86_64.sh -b -f -p /content/drive/MyDrive/anaconda3
# set PATH environment variable
# 添加到系统变量中
import os
os.environ['PATH'] = "/content/drive/MyDrive/anaconda3/bin:" + os.environ['PATH']
查看当前所有的环境变量:
1
2
import os
os.environ.key() #查看当前所有的环境变量
colab中用anaconda环境来运行python文件:
!source activate 环境名 && python 文件.py
1.3 安装gcc(g++5)
由于系统自带了一个版本的gcc,所以我们需要先删除系统的gcc文件,再安装我们需要的版本。
!apt-get install gcc-5 g++-5
!cd /usr/bin && sudo rm gcc-7 g++-7 gcc g++ && sudo ln gcc-5 gcc && sudo ln g++-5 g++
1.4 安装pytorch和cudatoolkit
注意torch和cuda的版本,这里是torch的一个官方文档,可以查看版本对应关系。
!conda install cython
!conda install pytorch=1.3.1 torchvision cudatoolkit=10.0 nccl -c pytorch
2. colab重新安装CUDA9.0, torch1.1.0, torchvision0.3.0
1. 安装CUDA9.0
这个会自动配置好系统环境。
!wget https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64-deb
!dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64-deb
!apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub
!apt-get update
!apt-get install cuda=9.0.176-1
2. 卸载原有的torch和torchvision
!pip uninstall torch
!pip uninstall torchvision
3. 安装torchvision和torch
!pip install torchvision==0.3.0
!pip install -q torch==1.1.0
4.之后sh env.sh安装程序依赖
!sh env.sh