Ubuntu18.04+Cuda9.0+Cudnn7.1环境配置Tensorflow-gpu

96
Edwin_dl
2018.10.19 22:02* 字数 987

之前一直用Ubuntu16.04的系统,也写过一篇如何在Ubuntu16.04系统上安装tensorflow-gpu的博客,但是自己前几天手贱把系统更新到了Ubuntu18.04,照常的打开Pycharm,输入import tensorflow as tf,发现没卵用了。估计是NVIDIA的驱动升级了,Cuda不能用了,而且Ubuntu16.04系统默认python3.5,Ubuntu18.04系统默认python3.6,这么看来也只有重新装Tensorflow了。

还是跟之前的安装步骤类似:

  • 检查NVIDIA驱动的型号

  • 检查gcc版本

  • 安装对应版本的Cuda

  • 修改环境变量

  • 安装对应版本的Cudnn

  • 安装Tensorflow-gpu

下面将对上述步骤详细说明:

1)查看NVIDIA驱动型号

可以在终端输入nvidia-smi查看具体型号,如果系统有安装NVIDIA驱动,则会显示驱动的型号等信息。

nvidia-smi

如果系统没有安装NVIDIA驱动或者驱动版本较低,可以通过在终端输入ubuntu-drivers devices查看系统为你推荐的驱动型号。

ubuntu-drivers

可以看到系统推荐安装的NVIDIA-410的驱动,为了防止Tensorflow不能支持过新的驱动,我最后安装了NVIDIA-396型号的驱动。在终端输入

sudo apt install nvidia-driver-396

中间如果提醒有依赖包未安装,则先安装依赖包再返回安装驱动,其余根据提示进行安装即可。别忘了安装之后在终端输入nvidia-smi检查是否安装成功。

这里贴一张官网Cuda版本对应NVIDIA驱动型号的示意图

版本对应图

从图中可以看到,NVIDIA-396可以安装Cuda-9.2,但实际中基于Cuda9.2安装Tensorflow一直未成功(可能是我有什么地方没有装正确),所以最后我很保险的选择了Cuda-9.0

2)降级gcc

由于Cuda-9.0只支持gcc-6.0以下的版本,而Ubuntu18.04系统默认安装的gcc-7.3版本(可以在终端输入gcc --version查看系统安装的gcc版本),所以首先需要降级为gcc-5版本。

  • 首先需要安装gcc-5

在终端输入:

sudo apt install gcc-5
sudo apt install g++-5
  • 链接至gcc-5版本

在终端输入:

cd /usr/bin
sudo mv gcc gcc.bak #备份
sudo ln -s gcc-5 gcc
sudo mv g++ g++.bak
sudo ln -s g++-5 g++

通过gcc --version查看系统的gcc版本是否已更改

3)安装对应版本的Cuda

官网下载Cuda-9.0的run文件安装包,注意官网的主文件下面还有四个更新包,一并下载下来。然后在终端输入:

  • 基础安装包
sudo sh cuda_9.0.176.384.81_linux.run --override

在安装过程中,会出现几个是否选装和安装位置的选项,其中第二个不需要安装NVIDIA驱动(系统已安装),其余都选择yes或者敲回车。

Cuda安装过程
  • 四个更新包
sudo sh cuda_9.0.176.1_linux.run
sudo sh cuda_9.0.176.2_linux.run
sudo sh cuda_9.0.176.3_linux.run
sudo sh cuda_9.0.176.4_linux.run

分别安装每个更新包。

4)修改环境变量

安装完Cuda-9.0后,还需要将其添加至系统环境变量。

打开.bashrc文件:

sudo gedit .bashrc

在文本的最后添加以下代码:

export  PATH="$PATH:/usr/local/cuda-9.0/bin"
export  LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64"

保存文本后,更新系统环境变量

source .bashrc

至此,可以通过在终端输入nvcc -V,检查Cuda-9.0是否安装成功。

nvcc -V

5)安装Cuda对应的Cudnn版本

安装完Cuda之后,继续安装与Cuda-9.0版本对应的Cudnn。去官网下载三个deb安装包。

Cudnn安装包

按照下面的顺序分别安装三个deb包。

sudo dpkg -i 'Runtime Library.deb'
sudo dpkg -i 'Developer Library.deb'
sudo dpkg -i 'Code Sample and User Guide.deb'
sudo apt-get update

安装完之后可以检查是否安装成功,在终端输入下面代码,如果安装成功会显示Test Passed字样。

  cd /usr/src/cudnn_samples_v7/mnistCUDNN
  sudo make
  ./mnistCUDNN

6)安装tensorflow-gpu

直接通过pip安装Tensorflow-gpu,默认下载的是最新的1.10版本。

sudo pip3 install tensorflow-gpu

7)卸载Cuda和Cudnn

  • 卸载Cuda-9.0

在终端输入:

cd /usr/local/cuda-9.0/bin
sudo ./uninstall_cuda_9.0.pl
  • 卸载Cudnn-7.1.3

在终端输入:

sudo apt remove cudnn*
日记本
Web note ad 1