声明:此教程是我根据多个教程的学习,自己经历三天的安装,曾一度想“摔电脑”,最终走通的一个教程,自己记录,吸取血的教训,因在安装中,很多错误没有截屏下来,很多都是别人的图片,仅供参考。
参考:win10下的配置
配置:anaconda3.5.1.0、CUDA10.0、Cudnn7.4.1.5、cu torch=1.2.0
1.检查显卡型号是否支持GPU运算并安装推荐的显卡驱动程序检查方法:终端输入
ubuntu-drivers devices
这是我升完之后的图片
图中,“model”对应的就是电脑显卡型号,“driver”中后面带有“recommanded”就是推荐的显卡驱动型号。根据显卡型号到英伟达官网查询是否支持GPU。
拿着这个图形卡驱动到NAVIDIA官网去查是不是支持GPU运算。
网址是:https://developer.nvidia.com/cuda-gpus
只要里边有你的型号就可以用GPU运算。
安装推荐的驱动
sudo apt install nvidia-510 (**记得这个数字换成你推荐的型号**)
在这里可能会遇到无法定位软件包的问题。
发生这个问题有以下几种情况:
第一 ,你的ubuntu系统需要更新,用以下命令: sudo apt-get update
第二,你的系统软件需要升级,用以下命令:sudo apt-get upgrade
再运行下面这个命令:
sudo apt-get install nvidia-driver-510-server nvidia-settings nvidia-profile(记得这个数字换成你推荐的型号)r
我遇到这个问题基本上就是运行
sudo apt-get update
sudo apt-get upgrade
sudo apt-get install nvidia-driver-510-server nvidia-settings nvidia-profiler
以自己的情况而定,有时运行更新在运行最后一个命令就行。
判断驱动是否安装成功
终端输入命令
sudo nvidia-smi
显示以下信息则表示安装成功
注意:这个是我没有更新为510时的
Anaconda的安装主要是为了方便环境管理,可以同时在一个电脑上安装多种环境,不同环境放置不同框架:pytorch、tensorflow、keras可以在不同的环境下安装,只需要使用conda create –n创建新环境即可。
下载
可以到Anaconda官网下载:https://www.anaconda.com/products/individual
历史版本:https://repo.anaconda.com/archive/
国内的下载速度可能比较慢,选择到清华大学开源软件镜像站下载:https://www.anaconda.com/products/individual
每一个Anaconda版本对应一个python的版本,对应关系:https://blog.csdn.net/yuejisuo1948/article/details/81043823
我使用的python 3.6.4,下载对于的Anaconda版本是3.5.1.0版本(因为安装前选择的python为3.6,所以选择3.6.几的版本,可以跟我选择的一样。)
我装的是Anaconda3-5.1.0-Linux-x86_64.sh(记得是64位的,我下载过32位的,会遇到在装torch时,无法在这个平台安装的问题。)
安装
下载完之后是后缀.sh文件,cd到文件所在位置。
在终端输入:
bash Anaconda3-5.1.0-Linux-x86_64.sh
Welcome to Anaconda3 5.1.0 In order to continue the installation process, please review the licenseagreement.Please, press ENTER to continue>>> 按回车#然后一直按回车到协议完毕#出现:Do you accept the license terms? [yes|no]>>>输入yes#下面就是问你安装目录,建议就是默认的安装路径,直接按回车Anaconda3 will now be installed into this location:/home/mayunteng/anaconda3 - Press ENTER to confirm the location - Press CTRL-C to abort the installation - Or specify a different location below [/home/mayunteng/anaconda3] >>> 按回车
切换默认Python版本(这里我是安装后自动成为了3.6.4版本的)
查看Python版本
python
这是自己换过的结果,如果默认不是python3,则在终端输入:
sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 100sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150
个人未运行,参考结果,但是一定会有anaconda的字样。
添加环境变量(在安装的过程中应该已经添加了环境变量,没有的话,可以自行添加)
将Python添加到环境变量中.
如果在安装Anaconda的过程中没有将安装路径添加到系统环境变量中,需要在安装后手工添加.
第一步:打开bashrc文件.
vim ~/.bashrc
第二步:在文件末尾处添加以下语句
# added by Anaconda3 installerexport PATH="/home/liu/anaconda3/bin:$PATH"(liu换成自己的)
source ~/.bashrc
2 安装CUDA和CUDNN只要记住CUDA的选择要根据CUDNN的型号来选,即CUDA的版本一定要和CUDNN的版本对应,必须是CUDNN支持的版本!
这里选择的CUDA10.0、Cudnn7.4.1.5
首先去官网下载CUDA安装包,注意根据你的系统选,最后一项选择runfile(local)。
CUDA最新版下载地址:https://developer.nvidia.com/cuda-downloads
以前版本的CUDA:https://developer.nvidia.com/cuda-toolkit-archive
sudo sh cuda_10.0.130_410.48_linux.sh
一路按enter,结束协议后的设置如下,注意:第三个选项问是否安装NVIDIA Accelerated Graphics Driver驱动,选否
别人的图,见谅。
添加环境变量
sudo gedit ~/.bashrc
在末尾添加:
export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}export CUDA_HOME=/usr/local/cuda-10.0
测试CUDA
我在装的时候出现了Warning提示,然后就测试了一下:
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuerysudo makesudo ./deviceQuery
别人的图,见谅。
显示 PASS,安装成功。
安装CUDNN
首先是下载CUDNN,前面在下载CUDA的时候就已经说过,CUDA要对应CUDNN的版本,我选择的是CUDA10.0、Cudnn7.4.1.5的版本。
要先注册登录,方可下载
官网:https://developer.nvidia.com/cudnn
下载完毕后,切到默认的Downloads文件夹,可以看到 cudnn的压缩包,先解压,然后将其中的内容复制到CUDA安装文件夹里面.
sudo cp cuda/include/cudnn.h /usr/local/cuda/include #注意,解压后的文件夹名称为cuda ,将对应文件复制到 /usr/local中的cuda内sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
到此处,CUDNN安装就完成。
3.配置torch环境创建一个名为pytorch的环境,该环境的python版本为3.6。
conda create –n pytorch python=3.6
激活名为pytorch的环境
source activate pytorch
在激活的环境中安装pytorch。
打开pytorch的官方安装方法:
https://pytorch.org/get-started/previous-versions/
运行
conda install pytorch==1.2.0 torchvision==0.4.0 cudatoolkit=10.0 -c pytorch
这样运行太慢了,手动安装这两个文件:
链接:https://download.pytorch.org/whl/torch_stable.html
安装torch1.2.0
pip install torch-1.2.0-cp36-cp36m-manylinux1_x86_64.whl
安装torchvision 0.4.0
pip install torchvision-0.4.0-cp36-cp36m-manylinux1_x86_64.wh
**如果这里出现无法在这个平台安装的问题,就是Anaconda3-5.1.0安装错误(记得是64位的,我下载过32位的,会遇到了问题)
然后验证pytorch和torchvision是否安装成功,在python命令行输入import torch,无警告代表成功。
至此,Pytorch安装成功!
最后,我们测试一下安装完这些能不能使用GPU加速:
打开Python,输入以下命令:
import torch as tx = t.rand(5,3)y = t.rand(5,3)if t.cuda.is_available(): x = x.cuda() y = y.cuda() print(x+y)
最后输出下面的界面代表成功调用GPU加速,否则没有成功调用。
0.6720 0.8196 0.3007 1.1233 0.4768 0.9952 0.5416 0.4801 1.5302 0.3140 0.8989 0.1525 1.3961 1.2157 0.5667[torch.cuda.FloatTensor of size 5x3 (GPU 0)]
判断pytorch是否支持GPU加速
import torch as tprint(t.cuda.is_available())
输出为:True,即安装成功
4.其它依赖库的安装但如果想要跑深度学习模型,还有一些其它的依赖库需要安装。具体如下:
pip install scipy==1.2.1pip install numpy==1.17.0pip install matplotlib==3.1.2pip install opencv_python==4.1.2.30pip install torch==1.2.0pip install torchvision==0.4.0pip install tqdm==4.60.0pip install Pillow==8.2.0pip install h5py==2.10.0
5.安装VSCODE直接加载VSCODE的官网https://code.visualstudio.com/
安装完成后在左下角更改自己的环境就行了。
心得:真是一个磨人的小妖精,遇到了各种问题。深度学习,I am coming!!!
按照此过程来装,应该不会遇到什么问题了,遇到了,当我没说,哈哈哈!!!
点击点赞收藏哦,遇到问题可以留言,我看到如果还知道的话就会回复,主要我也是一个小垃圾,也在不断的学习中。
怕什么真理无穷,进一寸有一寸的欢喜。