1、首先我们需要了解GPU、CUDA、cuDNN的关系:
参考博客:https://blog.csdn.net/u014380165/article/details/77340765
CUDA是NVIDIA推出的用于自家GPU的并行计算框架,也就是说CUDA只能在NVIDIA的GPU上运行,而且只有当要解决的计算问题是可以大量并行计算的时候才能发挥CUDA的作用。
cuDNN是NVIDIA打造的针对深度神经网络的加速库,是一个用于深层神经网络的GPU加速库。如果你要用GPU训练模型,cuDNN不是必须的,但是一般会采用这个加速库。
2、查看主机是否支持CUDA
https://developer.nvidia.com/cuda-gpus
打开上述链接,查看主机是否在NVIDIA产品列表中,老版本的显卡可以对应查看https://developer.nvidia.com/cuda-legacy-gpus。检查GPU是否支持CUDA。
3、安装显卡驱动
驱动下载地址:https://www.geforce.cn/drivers
在上述地址中根据主机的配置选择合适版本的显卡驱动,下载安装
4、正确安装合适的CUDA和cuDNN版本
参考博客:https://blog.csdn.net/XCCCCZ/article/details/80385448
根据显卡驱动的版本号,选择最适当的CUDA版本:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
tensorflow官网提供的安装教程:https://tensorflow.google.cn/install/gpu#hardware_requirements,PDF文档传至平台的资料中(从安装经验来说,并没有太大作用)
以下提供一份表格,对应于各个版本的tensorflow适用于哪个版本的cuDNN和CUDA
在该链接https://developer.nvidia.com/cuda-toolkit-archive中,根据自己机器环境选择对应的版本CUDA,建议下载本地可执行文件
在该链接https://developer.nvidia.com/cudnn下载对应CUDA的cuDNN版本,该网站需要注册账号,登录后进行下载
安装CUDA时,可以选择精简安装或自定义安装,如果不希望麻烦的,直接默认安装即可;
解压cuDNN文件,将解压后文件夹里的bin, include, lib文件夹拷贝至CUDA的安装路径下
在控制台中pip install tensorflow-gpu==合适版本号
测试程序:
import tensorflow as tf
c = tf.constant("Hello, This is tensorflow!")
s = tf.Session()
print(s.run(c))
查看提示信息,若运行成功,表示tensorflow-gpu安装成功!
-----------------------------------下划线-------------------------------------
附:配置过程中卸载以往安装失败的CUDA以及安装需要版本的CUDA教程如下:
参考博客:https://blog.csdn.net/shuiyuejihua/article/details/78738664
在控制面板中根据安装时间卸载带有cuda、版本号、sdk等等的软件,保留NVIDIA图形驱动程序和NVIDIA Physx系统软件;
删除安装路径下的所有文件;
用杀毒软件清理下注册表,同时在环境变量中删除之前生成的环境变量
-------------------------------------------------------------------------------
前人提供了很多经验,同时本人安装过程中也出现了很多问题,仍然存在着知其然但不知其所以然的问题,希望在实践的过程中一步一步的解决!