最近公司买了台RTX5000的服务器,裸机一台,需要安装显卡驱动,CUDA,CUDNN,tensorflow-gpu-1.8, 以前没有装过,导致安装过程中遇到好多坑,最初安装随便搜的个教程安装完后,发现RTX5000自带的驱动高,CUDA是11.2, 以为安不了CUDA9.0,搜索了好久以为只能自己下载tensorflow-1.8的包编译,后边又搜寻了挺多博客,发现一开始就陷入了误区,所以特此记录一下

环境配置如下:

Linux:ubuntu-16.0.4

CUDA: 9.0

Driver Version: 460.39

首先明确以下几个问题:

  • 不同型号的显卡有其匹配的驱动,这个是固定的,显卡和驱动的匹配关系可以通过Download Drivers | NVIDIA 该网站查看,按显卡的具体型号去查询驱动

  • CUDA驱动版本是向下兼容的,所以只要自己的驱动版本很高,CUDA对应的任何低版本或者高版本是都可以安装的,例如如下CUDA和Driver Version的对应关系中,当你Driver Version是455.23时,CUDA9 - CUDA11.1之间的版本是都可以安装的

具体的安装步骤:

  1. Linux环境准备

    因为我目的是安装tensorflow-gpu-1.8(老版本项目需要), 所以Linux服务器系统只能选择ubuntu16.04或者17.04

2. 安装显卡驱动

下载链接:NVIDIA 驱动程序下载

填写合适的信息,然后,点击搜索,接着点击下图的Download,在新页面右键复制下载链接

服务器上使用wget命令下载驱动,然后参考链接:Ubuntu16.04安装NVIDIA驱动+CUDA9.0+cuDNN7.0_mtllyb的博客-CSDN博客, 安装驱动,安装中可能遇到一些nouveau相关的报错,参考链接解决即可

wget https://us.download.nvidia.com/XFree86/Linux-x86_64/470.86/NVIDIA-Linux-x86_64-470.86.run
chmod +x NVIDIA-Linux-x86_64-470.86.run
sh NVIDIA-Linux-x86_64-470.86.run
  1. 安装完这个驱动后, 我试了下,其实在linux是可以直接使用GPU的,但是CUDA版本是这个驱动自带的11.2,所以还需要再单独安装CUDA 9.0, 这个时候/usr/local下是没有cuda-9.0文件夹的,所以按有些安装cudnn的博客安装cudnn的时候会报错,执行第三步:安装CUDA后, 可以发现/usr/local文件夹生成了

  2. 安装CUDA

    使用如下链接下载CUDA Toolkit:

CUDA9.0 Toolkit 下载链接:CUDA Toolkit 9.0 Downloads | NVIDIA Developer

其它CUDA Toolkit 版本下载地址:CUDA Toolkit Archive | NVIDIA Developer

下载完成后使用 sudo sh cuda_9.0.176_384.81_linux.run 命令安装即可,过程中要输入一些指令,参考(Ubuntu16.04安装NVIDIA驱动+CUDA9.0+cuDNN7.0_mtllyb的博客-CSDN博客)。

安装完CUDA后,tensorflow1.8可直接使用GPU了,但是遇到个 failed to run cuBLAS routine cublasSgemm_v2的报错,参考(解决 failed to run cuBLAS routine cublasSgemm_v2: CUBLAS_STATUS_EXECUTION_FAILED_厚积而薄发-程序员宝宝 - 程序员宝宝)多按了个cuda9.0的升级包解决了

4.CONDA环境指定CUDA

参考链接(【引路帖】【conda虚拟环境】【cuda】多个cuda版本路径切换_一苇以航丶的博客-程序员宅基地 - 程序员宅基地),为虚拟环境指定具体的CUDA,或者配置CUDA全局环境变量应该也可以,没尝试

5..安装CUDNN

CUDNN下载地址: cuDNN Archive | NVIDIA Developer

# 登陆后, 下载指定版本的cudnn工具包, 解压完后, 执行如下指令
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/sudo chmod a+r /usr/local/cuda/include/cudnn.hsudo chmod a+r /usr/local/cuda/lib64/libcudnn*

一些实用的命令:

  1. Tensorflow中查看gpu是否可用

    import tensorflow as tf
    tf.test.is_gpu_available()
  2. 实时监控显卡使用情况

     watch --color -n1 gpustat -cpu --colorwatch -n 1 nvidia-smi
  3. 查看NVRM版本()

    cat /proc/driver/nvidia/version
  4. 查看pytorch当前使用的cuda, cudnn 版本

import torchtorch.version.cudatorch.version # PyTorch versiontorch.version.cuda # Corresponding CUDA versiontorch.backends.cudnn.version() # Corresponding cuDNN versiontorch.cuda.get_device_name(0) # GPU type

参考链接:

服务器安装NVIDIA显卡驱动:服务器安装nvidia显卡驱动 - 简书https://www.jianshu.com/p/6af89da53455

Ubuntu16.04安装NVIDIA驱动+CUDA9.0+cuDNN7.0:Ubuntu16.04安装NVIDIA驱动+CUDA9.0+cuDNN7.0_mtllyb的博客-CSDN博客https://blog.csdn.net/mtllyb/article/details/79505012

CUDA Driver 对应关系: Pytorch版本、CUDA版本与显卡驱动版本的对应关系_kelly若的博客-CSDN博客https://blog.csdn.net/kellyroslyn/article/details/109668001

关于CUDA,cuDNN,TF,CUDA驱动版本兼容问题:关于CUDA,cuDNN,TF,CUDA驱动版本兼容问题_小肥柴不是小废柴的博客-CSDN博客_cuda版本向下兼容吗https://blog.csdn.net/xs11222211/article/details/84782046

Tensorflow中查看gpu是否可用:Tensorflow中查看gpu是否可用_sunshine2124ch的博客-CSDN博客https://blog.csdn.net/sunshine2124ch/article/details/103127551

conda虚拟环境 cuda多个cuda版本路径切换:【引路帖】【conda虚拟环境】【cuda】多个cuda版本路径切换_一苇以航丶的博客-程序员宅基地 - 程序员宅基地https://cxyzjd.com/article/Mr__George/106984574

Pytorch 使用不同版本的 cuda:Pytorch 使用不同版本的 cuda - yhjoker - 博客园https://www.cnblogs.com/yhjoker/p/10972795.html

cudnn安装:ubuntu16.04安装cuDNN的两种方式以及验证_Cooper.zhang-CSDN博客_cudnn 验证https://blog.csdn.net/dudu815110/article/details/88592558

linux下cuda安装:Linux 下的 CUDA 安装和使用指南 - 知乎https://zhuanlan.zhihu.com/p/79059379

ubuntu 16.04 nvidai cuda cudnn 安装: ubuntu 16.04 nvidai cuda cudnn 安装,正确的教程, 失败的经历_longteng_guo的博客-程序员宝宝_ubuntu安装cudnn失败 - 程序员宝宝https://www.cxybb.com/article/weixin_44010117/104639125

RTX5000安装显卡驱动 CUDA9.0 CUDNN相关推荐

  1. linux系统英伟达gpu驱动卸载_怎么卸载显卡驱动-手把手教你在 Ubuntu16.04 安装 GPU 驱动 + CUDA9.0 + cuDNN7...

    文章转载自公众号 AI有道 , 作者 红色石头 点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 如果你的电脑安装了 Ubuntu16.04,而 ...

  2. 手把手教你在 Ubuntu16.04 安装 GPU 驱动 + CUDA9.0 + cuDNN7

    点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 如果你的电脑安装了 Ubuntu16.04,而且电脑自带一块 NVIDIA GeForce 的 ...

  3. Ubunt16.04 搭建 GPU 显卡驱动 + CUDA9.0 + cuDNN7 详细教程

    红色石头的个人网站:www.redstonewill.com 如果你的电脑安装了 Ubuntu16.04,而且电脑自带一块 NVIDIA GeForce 的 GPU 显卡,那么不用来跑深度学习模型就太 ...

  4. tesla p4 linux驱动,Ubuntu 16.04. 装tesla p4 显卡驱动+cuda9.0+docker+nvidia-docker 详细方法,这里是服务器为主...

    Ubuntu 16.04. 装tesla p4 显卡驱动+cuda9.0+docker+nvidia-docker 详细方法,这里是服务器为主 这里 说明一下,我也是在网上看的教程,小白一个,通过好几 ...

  5. ubuntu16.04 配置显卡驱动+cuda8.0+cudnn+pytorch

    ubuntu1604 配置显卡驱动cuda80cudnnpytorch 在线安装显卡驱动 离线安装cuda 安装cudnn 配置环境变量 离线安装cond 配置pytorch 测试pytorch 感悟 ...

  6. 深度学习工作站环境搭建 ubantu16.04 安装显卡驱动 CUDA8.0 cuDNN6 anaconda tensorflow1.4.0 opencv3.4 含泪总结

    深度学习工作站环境搭建 ubantu16.04 安装显卡驱动 CUDA8.0 cuDNN6 anaconda tensorflow opencv 1 安装ubantu16.04 安装时不要在线更新,在 ...

  7. ubuntu安装nvidia显卡驱动+cuda9.0+cudnn7.0+查看cuda版本+安装tensorrt+python查看gpu显存

    一,驱动安装 显卡驱动和cuda版本关系 卸载原先驱动 sudo apt-get remove --purge nvidia-\* ubuntu-drivers devices  查看显卡类型 Nvi ...

  8. 1660ti显卡、ubuntu16.04中安装显卡驱动,cuda, cudnn

    ubutntu16.04 1660ti cuda cudnn安装 环境说明 Ubuntu安装 显卡驱动安装 主要代码 cuda9.0安装 小结: cudnn安装 后续1 小结: 后续2 环境说明 项目 ...

  9. ubuntu下使用.deb安装显卡驱动+cuda8.0

    由于Ubuntu中显卡驱动一直安装失败(从NVIDIA官网下载的.run文件) 没有安装显卡驱动,用.run文件安装cuda也不会成功,亲测. 所以没办法,只能使用.deb文件先尝试安装cuda,因为 ...

最新文章

  1. 人工智能可以发现数据中隐藏的物理规律
  2. UVA-10212 The Last Non-zero Digit. 分解质因子+容斥定理
  3. Jdbc连接数据库大全
  4. router linux命令,router os 常用命令详解
  5. bstr java_BSTR详解一 -BSTR简介和内部结构
  6. his系统存储服务器,关于HIS服务器及存储建设的前瞻性需求报告
  7. 如何做项目工作量估算
  8. linux .vimrc教程,vim配置文件~/.vimrc
  9. 简单易上手的Bootstrap
  10. InputStream,BufferedImage与byte数组之间的转换
  11. ip为 : 202.76.52.142/30 怎么看?
  12. Magicodes.IE基础教程之导出Pdf
  13. Sql Server 部署SSIS包完成远程数据传输
  14. 面向对象 委托
  15. Linux多台主机互相免密登陆
  16. 【Oracle】创建概要文件
  17. 完整JAVAweb项目源码,打字游戏,用jdbc在mysql保存游戏数据,完整项目源码和数据库
  18. 小米6线刷包php文件格式,小米6官方固件刷机教程_线刷|救砖教程图解
  19. 游戏中MD5加密的一些作用
  20. 三、字符串拼接和占位符

热门文章

  1. 树莓派点灯笔记(论如何学好控制IO输出)
  2. UE5 使用Slate制作对话窗口
  3. 微信小程序蓝牙模块通信
  4. css中的伪元素、基线对齐、盒子模型
  5. 基于Java的网上蛋糕店销售系统PPT免费模板
  6. Roboware Studio详细安装教程 (ROS kinetic)以及简单使用
  7. 全链路压测原理剖析(Coding)
  8. python使用pyecharts展示中国各城市天气数据
  9. 数据库系列-什么是 JDBC?它的作用是什么?
  10. 实验室服务器SSH连接问题的解决