NCCL 的全称为 Nvidia 聚合通信库(NVIDIA Collective Communications Library),是一个可以实现多个 GPU、多个结点间聚合通信的库,在 PCIe、Nvlink、InfiniBand 上可以实现较高的通信速度。对于每台主机均使用多进程的情况,使用 NCCL 可以获得最大化的性能。

在安装完成后需要测试nccl,就可以使用自带的nccl-tests来测试nccl,但是会出现各种各样的错误。

找不到nccl.h
在编译nccl-tests时,使用

make nccl-tests

但是会出现找不到nccl.h的错误,就需要在~/.basgrc中寫入

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

找不到libnccl.so.2

export LD_LIBRARY_PATH=~/.local/lib/python3.6/site-packages/torch/nccl/build/lib:$LD_LIBRARY_PATH

LD_LIBRARY_PATH是Linux环境变量名,该环境变量主要用于指定查找共享库(动态链接库)时除了默认路径之外的其他路径。使用

echo $LD_LIBRARY_PATH

可以查看環境變量

DEBUG -- 安装nccl-tests时的报错相关推荐

  1. Ubuntu安装Python模块时的报错

    在安装Python的psutil模块时,报"error: command 'x86_64-linux-gnu-gcc' failed with exit status 1"的错误, ...

  2. 安装Oracle10g客户端时出现报错:Error encountered when registering mfc40.dll,please run regsvr32.exe to register

    大家好,我是个实习生小白,前几天在安装Oracle10g客户端时遇到了一个问题,费劲千辛万苦终于解决了,当时有上网查过解决方法,但都没有对应的解决方法,自己瞎摸胡搞了好长一段时间解决了,后知后觉,想要 ...

  3. oracle安装时ins-32031,安装oracle数据库时的报错处理[INS-35172]

    通过桌面安装Oracle在分配SGA的时候报如下错误: [INS-35172] Target database memory (XXMB) exceeds the systems available ...

  4. 在Win7中安装Oracle 10g时检测报错的解决办法

    在Windows 7中安装Oracle 10g. 使用的Orcale版本是10g. 步骤1: 在Orcale官网上下载,下载地址为:http://download.oracle.com/otn/nt/ ...

  5. rails 安装 ‘mysql2’ gem时的报错和解决方案

    前段时间畅言网更换数据库为Mysql,安装mysql数据库以及配置之类的就不在说了应该没什么问题.主要就说一下我遇到的一个gem安装问题. rails连接mysql用的gem 有好几个然后上网查了一下 ...

  6. 完美解决:Python在安装XXX包时,报错拒绝访问的错误,PermissionError: [WinError 5] 拒绝访问。: ‘d:\\anaconda3\\lib\\site-package

    1.环境:我是anaconda3(也即Python3),windows 10. 2.解决方案:最最最简单好用的解决方法就是将我们常规写的                     pip install ...

  7. anaconda在安装依赖包时出现报错提示 ‘requests‘ is a dependency of conda and cannot be remove from conda‘s operatin

  8. redhat linux 5.6 下安装oracle 11g 时netca报错不能配置监听解决方法

    Oracle Net Services 配置: # # An unexpected error has been detected by HotSpot Virtual Machine: # #  S ...

  9. t4 tesla 驱动程序_KVM直通Tesla T4 GPU安装windows虚拟机出现PCIE报错指向GPU

    问题描述 多个客户在使用kvm虚拟机搭配T4 GPU创建windows虚拟机时,物理机出现PCIE报错,且报错指向具体的GPU. 测试发现只有在安装GPU驱动时会引发物理机PCIE报错,具体由以下两种 ...

  10. zabbix 安装时的报错mysql_connect(): Access denied for us

    zabbix在安装完成时的报错 出现提示:mysql_connect(): Access denied for user 'zabbix'@'localhost' (using password: Y ...

最新文章

  1. CTFshow php特性 web92
  2. c++代码转为go_Go调用C/C++
  3. java提取json数组对象所有的id,一文轻松搞定
  4. Excel删除重复数据
  5. 以太坊2.0客户端Lighthouse发布v1.3.0版本,为高优先级建议立即更新
  6. 8183微型计算机,佳木斯大学12年微机原理复习题..doc
  7. 我是如何从零基础自学到找到工作经过
  8. 团体程序设计天梯赛-练习集-L1-046. 整除光棍
  9. java 歌词解析代码_网易云歌词爬取(java)
  10. 【金万维】天联高级版客户端登陆后,打开U8提示服务器端要求网络级身份证(NLA)
  11. 使用RNA-seq数据通过网络熵评估肿瘤内异质性
  12. 第三模块 商务写作的“5步法”
  13. VOA 2011-2-10
  14. PR值计算公式带来的思考
  15. 常见笔顺错误的字_常用汉字中易写错笔顺的字有哪些?
  16. 密码学数学基础,群,阿贝尔群,阶,双线性对,哈希函数,消息认证码概述
  17. 2018 Arab Collegiate Programming Contest (ACPC 2018) H - Hawawshi Decryption 数学 + BSGS
  18. EPROCESS+KPCR+ETHREAD部分介绍-学习记录
  19. 人生就是一场“康波”,你准备好了吗?
  20. 音频视频播放无法拖动快进

热门文章

  1. 巨型机的计算机语言主要应用题,《计算机应用基础》复习资料
  2. Docker-compose
  3. Transformer及其变种
  4. 【转载】ACM计算几何题目推荐
  5. 将CIFAR-10和CIFAR-100数据集处理成“标签文件夹”形式(ImageFolder可读)
  6. 基于Python/Tkinter的拼图单机小游戏
  7. Python入门之Python Colorama模块
  8. matlab linprog 为什么块,matlab中linprog函数的用法总结
  9. Set实现数组对象去重
  10. 永远的飞人--★迈克尔.乔丹★- -