硬盘/固态硬盘SSD

  一般硬盘无法限制我们的深度学习任务的运行,但我们也不能因此小看了硬盘的作用。假设我们从硬盘中读取数据的速度是100MB/s,那加载一个32张ImageNet图片构成的mini-batch,要用185毫秒。

  相反,如果在使用数据前异步获取数据,将在185毫秒内加载这些mini-batch的数据,而ImageNet上大多数神经网络的计算时间约为200毫秒。即在计算状态中加载下一个mini-batch,性能将不会有任何损失。

  我们推荐的是SSD,因为选择SSD效率和舒适度都可以照顾到。和普通硬盘相比,SSD的启动和响应速度更快,大文件的预处理更是要快很多。顶配的就是NVMe SSD,比一般SSD更流畅。

  电源PSU

  随着GPU的更新换代,一个优质的PSU能够经得起时间的考验。我们对电源的基础要求是能满足各种GPU所需的能量。那PSU应该怎么选?

  在这分享一个计算方法:将电脑CPU和GPU的功率相加,再加上额外的10%的功率作为其他组件的能耗,就能得到功率的最大值。

  举个栗子:你有4个GPU,每个功率250瓦,加上一个功率150瓦的CPU,那电源要提供4×250+150+100=1250瓦的电量。在此基础上再加10%,那就是1375瓦。所以可以得出,电源的性能要达到1400瓦。

  还有一点需要我们注意,即便一个PSU达到了所需的瓦数,也可能缺少足够的PCIe 8-pin或6-pin的接头,所以我们在采购时要确保电源上有充足的接头能接GPU。

  

  此外,记得买一个能效等级高的电源,尤其是你需要连很多GPU且需要长期运行工作时。再举个栗子:假设以以满功率(1000-1500瓦)运行4 GPU系统、花两周时间训练一个卷积神经网络,需要耗用300-500度电,消耗电费折合人民币约455-766元。如果将电源效率降到80%,电费则增加140-203元左右。需要的GPU数量越多,数值差距越明显。嘿嘿,PSU的挑选是比我们之前想象的情况要复杂吧?

  CPU和GPU的冷却

  对容易发热的CPU和GPU来讲,如果其散热性不佳,会导致其性能降低。对CPU来说,标配的散热器或是AIO水冷散热器都是不错的选择。但GPU应该用哪种散热方式,是个复杂的问题。

  风冷散热

  风冷对单个的GPU是可以的,但如果你的GPU多达3-4个,光靠空气冷却那可不行。目前GPU会在运行算法时将速度提到最大,所以功耗也会达到最大值。而一旦温度超过80℃,则会导致速度降低,无法实现最佳性能。

  这种现象对于深度学习任务来说更是常见,一般的散热风扇是远远达不到降温效果的,通常运行几秒钟就会达到温度阈值。如果是用多个GPU,性能会降低10%-25%。

  那该怎么办?眼下很多英伟达的GPU都是针对游戏设计开发的,所以也针对Windows系统进行了专门的优化,也可以轻松设置风扇方案。但在Linux系统中这招就不能用了,麻烦的是,很多深度学习库也都是针对Linux编写的。这个问题存在,但并不是无解。

  在Linux系统中,我们可以进行Xorg服务器的配置,选择“coolbits”选项,这对单个GPU还是很有用。如果是多个GPU,就要模拟一个监视器。我们试了不少,但没什么改进。如果想在冷空气环境中运行3-4个小时,则应该需要重视风扇的设计。

  目前市面上的散热风扇的原理大致两类:鼓风式的风扇将热空气从机箱背面推出从而让冷空气流入;非鼓风式的风扇在GPU中吸入冷空气以达到冷却的效果。

  

  所以,如果你有多个GPU彼此相邻,那周围就缺少冷空气可用,所以在这种情况下就不一定需要非鼓风式的散热风扇了。该用什么呢?可用考虑水冷散热。

  水冷散热

  虽然此方法比风冷法略贵,但可以用在多个GPU相邻的地方,能使四个最强劲的GPU保持低温状态,这是风冷法无法达到的效果。

  而且水冷散热法更安静,在公共区域运行多个GPU,水冷的优势更为明显。至于说成本问题,水冷单个GPU要花大约690元,再加上些额外的费用约350左右。还有就是得花点时间去组装计算机,不过这也不复杂,网上教程非常多,几个小时就能轻松搞定,后期维护也简单。

  总结一下就是,单个GPU用风冷,多个GPU的情况,鼓风式的空气冷却可能会导致10%-15%的性能损耗,但是更划算。当然如果你追求散热的极致效果,水冷散热最佳而且不会制造噪音。所以风冷或水冷都可以,关键看你的实际情况和预算。

  主板

  主板该配有足够的PCIe插槽来支持所需的GPU数量。注意,大多数显卡宽度需要占用两个PCIe插槽。如果要使用多个GPU则要购买PCIe插槽之间有足够空间的主板,以确保显卡之间不会相互遮挡。

  

  机箱

  在选择机箱时,要保证机箱能装下主板顶部的全长GPU。一般情况下大部分机箱是没问题的,但是如果你买小了,能不能退换就得看商家说了算了。所以买之前最好确认下机箱的尺寸大小,看下机箱装好GPU的图,这样也能放心点。

  另外,如果你要定制水冷的话,要确保买的机箱能装下散热器,尤其是在给GPU用定制水冷的时候,因为每个GPU的散热器都要占空间。

  显示器

  可能有人会说,选显示器这么简单还用说?那时当然...用的啊。

  多配台显示器是作为一个成熟的技术人员的标配。不然你想,这么多内容挤到同一个小屏幕里来回切换,那多累人?

你有一份超详细的深度学习装机指南等待认领!(下篇)相关推荐

  1. 一份较为详细的深度学习资料汇总

    转载自:https://blog.csdn.net/Times_poem/article/details/51596233,总结的资源还挺多,也很杂,有的东西以前研究过,还是不错的,先囤着吧,以后有空 ...

  2. 深度学习装机指南:从GPU到显示器,全套硬件最新推荐

    晓查 安妮 郭一璞 发自 凹非寺  量子位 报道 | 公众号 QbitAI 硬件设备,是任何一名深度学习er不可或缺的核心装备.各位初级调参魔法师们,你们有没有感到缺少那一根命中注定的魔杖? 可是,各 ...

  3. 给你一份超详细 Spring Boot 知识清单

    转载自   给你一份超详细 Spring Boot 知识清单 在过去两三年的Spring生态圈,最让人兴奋的莫过于Spring Boot框架.或许从命名上就能看出这个框架的设计初衷:快速的启动Spri ...

  4. 一份超详细的MySQL高性能优化实战总结!

    一份超详细的MySQL高性能优化实战总结! MySQL 对于很多 Linux 从业者而言,是一个非常棘手的问题,多数情况都是因为对数据库出现问题的情况和处理思路不清晰. 在进行 MySQL 的优化之前 ...

  5. 分享你一份超详细的公众号文章制作流程,注意查收

    一篇公众号文章的制作,背后需不需要经历千锤百炼?当然这样说还是太夸张了! 但是一篇公众号文章的制作一定是需要经过反复推敲的,是需要经过反复打磨.修改的,是需要经过一道道加工程序的. 今天伯乐网络传媒就 ...

  6. 超详细!Vue-coderwhy个人学习笔记(二)(Day3)

    前言 本文章接上一篇笔记 超详细!Vue-coderwhy个人学习笔记(一)(Day1-Day2) 这篇主要是Day3笔记,组件化,组件通信,插槽 四.组件化开发 (一).内容概述 认识组件化 注册组 ...

  7. 超详细的Git学习记录(Git基础内容/IDEA集成Git/GitHub/Gitee/GitLab及Centos7部署GitLab)

    超详细的Git学习笔记 从B站搜到的尚硅谷视频学习了Git,记录了一下学习的内容,收获很大 学习地址: https://www.bilibili.com/video/BV1vy4y1s7k6?p=11 ...

  8. Carson带你学Android:这是一份全面详细的WebView学习攻略

    前言 现在很多App里都内置了Web网页(Hybrid App),比如说很多电商平台,淘宝.京东.聚划算等等,如下图 那么这种该如何实现呢?其实这是Android里一个叫WebView组件实现 今天, ...

  9. 全网最详细的深度学习pytorch-gpu环境配置

    学习深度学习第一步就是环境的配置,相信很多小伙伴已经被什么anaconda,tensorflow,Pytorch,cuda这些东西搞得晕头转向,今天带大家详细配置深度学习的环境,这一篇准要教书Pyto ...

最新文章

  1. C#中POST数据和接收的几种方式
  2. CountDownLatch应用及原理
  3. 【软件周刊】D语言卷土重来,Vue.js 应获 1024 个赞,小薇可以一键启动了
  4. unix 安装oracle,linux上安装Oracle
  5. 禅道设置bug模板_禅道的自定义功能:表格切换和创建页面的自定义
  6. MFC中获取各种类指针的方法 (转)
  7. redis 使用geo来存储地理经纬度信息
  8. 做技术的出路在哪里?---什么叫有前途?钱图钱图,用最省力的方式挣到更多的钱的路径就是前途
  9. 渗透测试试题-----web方面知识点
  10. A*算法最合理的数据结构
  11. Vufroia相机对焦问题
  12. 【arm】ARM32和AARCH64的几点区别
  13. 字节Scala面试题(2) --- 伴生对象
  14. 浏览器发送请求过程解析
  15. 读书笔记之《设计原本》
  16. 蘑菇街财报:曾经电商第四极的直播末路
  17. Response.Redirect(string url)报错:System.Threading.ThreadAbortException: 正在中止线程。
  18. 产品-Axure9(英文版),原型设计 制作下拉二级菜单
  19. TPS62130电源芯片的学习
  20. 遇到问题之-cacti监控网卡流量traffic

热门文章

  1. msf生成php反弹,反弹shell总结
  2. java openjdk 1.8_linux安装openjdk1.8
  3. 蓝桥杯 17省赛 C10 图形排版(Math)
  4. 临沂三中高考2021成绩查询,临沂2021中考考生10万人参加 6月30前查成绩
  5. mbedtls学习(9)数字签名RSA、DSA、ECDSA
  6. linux中root所属的组的gid为,linux用户和用户组
  7. 使用nvm管理node版本,npm安装失败解决方法
  8. 负载均衡算法--轮询法(Round Robin)
  9. Tensorflow学习——Eager Execution
  10. 滴滴出行2018内推编程题