失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > Ubuntu16.04+GTX1070显卡驱动+cuda8.0+cudnn5.1+tensorflow-gpu环境配置

Ubuntu16.04+GTX1070显卡驱动+cuda8.0+cudnn5.1+tensorflow-gpu环境配置

时间:2019-10-16 11:49:45

相关推荐

Ubuntu16.04+GTX1070显卡驱动+cuda8.0+cudnn5.1+tensorflow-gpu环境配置

决定把自己配环境的过程记录下来,因为自己搭了两遍gpu环境(因为之前搭好后,ubuntu系统自动更新,导致显卡驱动出了问题,循环登录,所以今天又格式化系统,重新来了一遍。。。所以也提醒大家,装好环境之后要把ubuntu的自动更新禁掉,不然会发生意外),希望可以方便自己,也方便大家~~~~~

话不多说,直接进入主题。本人用的是台式机,两个硬盘分别装了win10和ubuntu16.04.2,本环境是64位的Ubuntu下配置的,概括的说,如果想用tensorflow来搞深度学习(如果用其他库,只是最后一步操作不同),配置gpu环境总共需要4步:(1)安装nvidia显卡驱动、(2)安装cuda、(3)安装cudnn、(4)安装tensorflow(gpu版),下面分别介绍每一步需要的操作。

(一)安装nvidia显卡驱动:

在官网下载适配自己显卡和系统的显卡驱动:点击打开链接,如博主用的是Ubuntu16.04-64bits和GTX1070(尽量不要下载最新版的driver,也不要下载BETA结尾的公测版driver),所以下的版本是:375.82

下载好之后先不管,敲几个命令做下准备(因为在装之前需要先禁掉之前系统自带的显卡驱动并且关闭图形界面):

修改属性

sudo chmod 666 /etc/modprobe.d/blacklist.conf

用gedit编辑器打开

sudo gedit /etc/modprobe.d/blacklist.conf

在该文件后添加一下几行:

blacklist vga16fbblacklist rivafbblacklist rivatvblacklist nvidiafbblacklist nouveauoptions nouveau modeset=0

然后保存退出,并打开终端敲下面的命令:

sudo update-initramfs -u

重启ubuntu,开机后再次运行:

lsmod | grep nouveau

如果运行后没有任何输出,则代表自带的显卡驱动禁用成功,便可以开始后面的操作。

接下来就可以进入安装显卡驱动的步骤,先按Ctrl+Alt+F1进入命令行控制台(小黑屏),然后输入用户名和密码进入

先关闭图形界面环境:

sudo service lightdm stop

然后就可以cd到我们刚刚下好的nvidia显卡驱动的地址,博主是/home/xxxxxx/Downloads,然后运行刚刚下好的显卡驱动

sudo sh NVIDIA-Linux-x86_64-xxx.run

在安装的过程中,先选择accept,然后可能会出现一个提示框,不用管,continue install即可,后面一路yes, 便可成功安装

安装完成后,我们又回到了控制台,此时我们要在控制台中输入下面的命令,重新开启图形界面:

sudo service lightdm start

此时又会回到图形界面,当我们输入密码进入系统后,打开终端,输入一下命令来验证nvidia显卡驱动是否安装成功:

nvidia-smi

如果出现了一个关于GPU的列表,就代表nvidia显卡驱动安装成功了!

(二)安装CUDA

/cuda-toolkit(下载地址)

说明:

(1)在NVIDIA的CUDA下载页面下,选择要使用的CUDA版本进行下载。

(2)我们这里使用CUDA8.0(页面有提示GTX1070、GTX1080支持8.0版本),如果没有使用以上两个版本的GPU,可以下载CUDA7.5。(也可能是其他的版本,自己查一下)

(3)注意!!!!在安装cuda之前,一定要把gcc降级到4.8,因为Ubuntu自带的gcc是5.4的,但是cuda里面有些编译需要5以下的gcc,所以我们要先做降级处理,可以参考博文:点击打开链接,命令就几行:

sudo apt-get install gcc-4.8sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.8 100sudo update-alternatives --config gccgcc --version

此时我们便看到默认的gcc版本已经变成4.8

之后便可用安装nvidia显卡驱动一样的方式,安装cuda,我们Ctrl+Alt+F1进入小黑屏,同样先关闭图形界面环境,然后cd到cuda安装文件的目录,输入:

sudo -i./cuda_8.0.61_375.26_linux.run(根据自己下载的文件名输入)

输入命令后应该会出现一个协议,不用看,一直空格,直到提示我们是否同意之前阅读的EULA,然后我们输出accept,回车。注意,下一个问题是是否安装NVIDIA Accelerated Graphics Driver,这里我们一定要输入n,因为之前已经装过了nvidia显卡驱动,所以这里不要再装,后面都是一路y就好,之后就会出现类似以下的提示:

============ Summary ============Driver: Not SelectedToolkit: Installed in /usr/local/cuda-8.0Samples: Installed in /home/textminerPlease make sure that– PATH includes /usr/local/cuda-8.0/bin– LD_LIBRARY_PATH includes /usr/local/cuda-8.0/lib64, or, add /usr/local/cuda-8.0/lib64 to /etc/ld.so.conf and run ldconfig as rootTo uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-8.0/binPlease see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-8.0/doc/pdf for detailed information on setting up CUDA.***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 361.00 is required for CUDA 8.0 functionality to work.To install the driver using this installer, run the following command, replacing with the name of this run file:sudo .run -silent -driverLogfile is /opt/temp//cuda_install_6583.log

出现了上面的提示,就代表已经安装成功,下面我们还需要配置一下环境变量:

打开~./bashrc,进行编辑:

sudo gedit ~./bashrc

然后在文件的最后添加两行:

export PATH=/usr/local/cuda-8.0/bin${PATH:+:{PATH}}export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:{LD_LIBRARY_PATH}}

然后设置环境变量和动态链接库,在命令行输入:

sudo gedit /etc/profile

在打开的文件末尾加入:

export PATH = /usr/local/cuda/bin:$PATH

保存之后,创建链接文件:

sudo gedit /etc/ld.so.conf.d/cuda.conf

在打开的文件中添加如下语句:

/usr/local/cuda/lib64

然后执行:

sudo ldconfig

使链接立即生效。之后便可测试一下cuda是否全部安装完毕,cd到刚刚安装的samples的路径下,分别输入以下3行:

cd /home/xxxx/NVIDIA_CUDA-8.0_Samples/1_Utilities/deviceQuerymakesudo ./deviceQuery

运行完上述命令后,如果输出显卡信息,则代表cuda安装成功!!!

(三)安装cudnn

/cudnn(下载地址)

说明:

(1)下载前需要填写一个调查问卷,建议认真填写,很简单。

(2)填写完毕点击I Agree To前面的小方框,然后选择对应自己安装的cuda版本的cudnn。

(3)cudnn是安装tensorflow-gpu的关键一步,高版本的tensorflow需要高版本的cudnn,博主用的cudnn v5.1,亲测对于tensorflow1.2的

没问题,但是对于tensorflow1.3以上的不适用,需要更高级别的cudnn才可以。

下载好相应版本的cudnn后,cd到存放目录下,输入下列命令:

tar xvzf cudnn-8.0-linux-x64-v5.1.tgzsudo cp cuda/include/cudnn.h /usr/local/cuda/includesudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn.hsudo chmod a+r /usr/local/cuda/lib64/libcudnn*

这样,cudnn就算安装好了,步骤很简单,就是下载,解压缩,复制,改权限。。。

(四)安装gpu版的tensorflow

博主用的是anaconda2,这样就简化了tensorflow的安装步骤,不需要bazel不需要自己make,直接一句话就搞定!

先安装anaconda2,这个自己去官网下一下对应linux版本的.sh安装文件,然后直接bash安装即可,很简单,一键安装,如果不会百度即可,安装好anaconda之后,直接用pip安装tensorflow即可:

pip install tensorflow-gpu==1.2.1

因为博主安装的是tensorflow 1.2.1版本,所以两个“=”后是1.2.1,大家也可以安装任意想要的版本,但是要注意cudnn与tensorflow的版本是否适配,否则会出现安装好后,import tensorflow as tf 时可能会出现libcudnn.so.6:cannot open sharedobject file: No such file or directory,等等类似的错误,原因就是cudnn的版本与tensorflow的版本不匹配。。。。

至此,所有的安装都结束了,我们打开python后即可import tensorflow!

PS:本方案应该适用于大部分系统了,如果有成功的筒子们,也可以多google baidu一些其他的博文和资料~

如果觉得《Ubuntu16.04+GTX1070显卡驱动+cuda8.0+cudnn5.1+tensorflow-gpu环境配置》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。