你有一份超详细的深度学习装机指南等待认领!(下篇)
硬盘/固态硬盘SSD
一般硬盘无法限制我们的深度学习任务的运行,但我们也不能因此小看了硬盘的作用。假设我们从硬盘中读取数据的速度是100MB/s,那加载一个32张ImageNet图片构成的mini-batch,要用185毫秒。
相反,如果在使用数据前异步获取数据,将在185毫秒内加载这些mini-batch的数据,而ImageNet上大多数神经网络的计算时间约为200毫秒。即在计算状态中加载下一个mini-batch,性能将不会有任何损失。
我们推荐的是SSD,因为选择SSD效率和舒适度都可以照顾到。和普通硬盘相比,SSD的启动和响应速度更快,大文件的预处理更是要快很多。顶配的就是NVMe SSD,比一般SSD更流畅。
电源PSU
随着GPU的更新换代,一个优质的PSU能够经得起时间的考验。我们对电源的基础要求是能满足各种GPU所需的能量。那PSU应该怎么选?
在这分享一个计算方法:将电脑CPU和GPU的功率相加,再加上额外的10%的功率作为其他组件的能耗,就能得到功率的最大值。
举个栗子:你有4个GPU,每个功率250瓦,加上一个功率150瓦的CPU,那电源要提供4×250+150+100=1250瓦的电量。在此基础上再加10%,那就是1375瓦。所以可以得出,电源的性能要达到1400瓦。
还有一点需要我们注意,即便一个PSU达到了所需的瓦数,也可能缺少足够的PCIe 8-pin或6-pin的接头,所以我们在采购时要确保电源上有充足的接头能接GPU。
此外,记得买一个能效等级高的电源,尤其是你需要连很多GPU且需要长期运行工作时。再举个栗子:假设以以满功率(1000-1500瓦)运行4 GPU系统、花两周时间训练一个卷积神经网络,需要耗用300-500度电,消耗电费折合人民币约455-766元。如果将电源效率降到80%,电费则增加140-203元左右。需要的GPU数量越多,数值差距越明显。嘿嘿,PSU的挑选是比我们之前想象的情况要复杂吧?
CPU和GPU的冷却
对容易发热的CPU和GPU来讲,如果其散热性不佳,会导致其性能降低。对CPU来说,标配的散热器或是AIO水冷散热器都是不错的选择。但GPU应该用哪种散热方式,是个复杂的问题。
风冷散热
风冷对单个的GPU是可以的,但如果你的GPU多达3-4个,光靠空气冷却那可不行。目前GPU会在运行算法时将速度提到最大,所以功耗也会达到最大值。而一旦温度超过80℃,则会导致速度降低,无法实现最佳性能。
这种现象对于深度学习任务来说更是常见,一般的散热风扇是远远达不到降温效果的,通常运行几秒钟就会达到温度阈值。如果是用多个GPU,性能会降低10%-25%。
那该怎么办?眼下很多英伟达的GPU都是针对游戏设计开发的,所以也针对Windows系统进行了专门的优化,也可以轻松设置风扇方案。但在Linux系统中这招就不能用了,麻烦的是,很多深度学习库也都是针对Linux编写的。这个问题存在,但并不是无解。
在Linux系统中,我们可以进行Xorg服务器的配置,选择“coolbits”选项,这对单个GPU还是很有用。如果是多个GPU,就要模拟一个监视器。我们试了不少,但没什么改进。如果想在冷空气环境中运行3-4个小时,则应该需要重视风扇的设计。
目前市面上的散热风扇的原理大致两类:鼓风式的风扇将热空气从机箱背面推出从而让冷空气流入;非鼓风式的风扇在GPU中吸入冷空气以达到冷却的效果。
所以,如果你有多个GPU彼此相邻,那周围就缺少冷空气可用,所以在这种情况下就不一定需要非鼓风式的散热风扇了。该用什么呢?可用考虑水冷散热。
水冷散热
虽然此方法比风冷法略贵,但可以用在多个GPU相邻的地方,能使四个最强劲的GPU保持低温状态,这是风冷法无法达到的效果。
而且水冷散热法更安静,在公共区域运行多个GPU,水冷的优势更为明显。至于说成本问题,水冷单个GPU要花大约690元,再加上些额外的费用约350左右。还有就是得花点时间去组装计算机,不过这也不复杂,网上教程非常多,几个小时就能轻松搞定,后期维护也简单。
总结一下就是,单个GPU用风冷,多个GPU的情况,鼓风式的空气冷却可能会导致10%-15%的性能损耗,但是更划算。当然如果你追求散热的极致效果,水冷散热最佳而且不会制造噪音。所以风冷或水冷都可以,关键看你的实际情况和预算。
主板
主板该配有足够的PCIe插槽来支持所需的GPU数量。注意,大多数显卡宽度需要占用两个PCIe插槽。如果要使用多个GPU则要购买PCIe插槽之间有足够空间的主板,以确保显卡之间不会相互遮挡。
机箱
在选择机箱时,要保证机箱能装下主板顶部的全长GPU。一般情况下大部分机箱是没问题的,但是如果你买小了,能不能退换就得看商家说了算了。所以买之前最好确认下机箱的尺寸大小,看下机箱装好GPU的图,这样也能放心点。
另外,如果你要定制水冷的话,要确保买的机箱能装下散热器,尤其是在给GPU用定制水冷的时候,因为每个GPU的散热器都要占空间。
显示器
可能有人会说,选显示器这么简单还用说?那时当然...用的啊。
多配台显示器是作为一个成熟的技术人员的标配。不然你想,这么多内容挤到同一个小屏幕里来回切换,那多累人?
你有一份超详细的深度学习装机指南等待认领!(下篇)相关推荐
- 一份较为详细的深度学习资料汇总
转载自:https://blog.csdn.net/Times_poem/article/details/51596233,总结的资源还挺多,也很杂,有的东西以前研究过,还是不错的,先囤着吧,以后有空 ...
- 深度学习装机指南:从GPU到显示器,全套硬件最新推荐
晓查 安妮 郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI 硬件设备,是任何一名深度学习er不可或缺的核心装备.各位初级调参魔法师们,你们有没有感到缺少那一根命中注定的魔杖? 可是,各 ...
- 给你一份超详细 Spring Boot 知识清单
转载自 给你一份超详细 Spring Boot 知识清单 在过去两三年的Spring生态圈,最让人兴奋的莫过于Spring Boot框架.或许从命名上就能看出这个框架的设计初衷:快速的启动Spri ...
- 一份超详细的MySQL高性能优化实战总结!
一份超详细的MySQL高性能优化实战总结! MySQL 对于很多 Linux 从业者而言,是一个非常棘手的问题,多数情况都是因为对数据库出现问题的情况和处理思路不清晰. 在进行 MySQL 的优化之前 ...
- 分享你一份超详细的公众号文章制作流程,注意查收
一篇公众号文章的制作,背后需不需要经历千锤百炼?当然这样说还是太夸张了! 但是一篇公众号文章的制作一定是需要经过反复推敲的,是需要经过反复打磨.修改的,是需要经过一道道加工程序的. 今天伯乐网络传媒就 ...
- 超详细!Vue-coderwhy个人学习笔记(二)(Day3)
前言 本文章接上一篇笔记 超详细!Vue-coderwhy个人学习笔记(一)(Day1-Day2) 这篇主要是Day3笔记,组件化,组件通信,插槽 四.组件化开发 (一).内容概述 认识组件化 注册组 ...
- 超详细的Git学习记录(Git基础内容/IDEA集成Git/GitHub/Gitee/GitLab及Centos7部署GitLab)
超详细的Git学习笔记 从B站搜到的尚硅谷视频学习了Git,记录了一下学习的内容,收获很大 学习地址: https://www.bilibili.com/video/BV1vy4y1s7k6?p=11 ...
- Carson带你学Android:这是一份全面详细的WebView学习攻略
前言 现在很多App里都内置了Web网页(Hybrid App),比如说很多电商平台,淘宝.京东.聚划算等等,如下图 那么这种该如何实现呢?其实这是Android里一个叫WebView组件实现 今天, ...
- 全网最详细的深度学习pytorch-gpu环境配置
学习深度学习第一步就是环境的配置,相信很多小伙伴已经被什么anaconda,tensorflow,Pytorch,cuda这些东西搞得晕头转向,今天带大家详细配置深度学习的环境,这一篇准要教书Pyto ...
最新文章
- C#中POST数据和接收的几种方式
- CountDownLatch应用及原理
- 【软件周刊】D语言卷土重来,Vue.js 应获 1024 个赞,小薇可以一键启动了
- unix 安装oracle,linux上安装Oracle
- 禅道设置bug模板_禅道的自定义功能:表格切换和创建页面的自定义
- MFC中获取各种类指针的方法 (转)
- redis 使用geo来存储地理经纬度信息
- 做技术的出路在哪里?---什么叫有前途?钱图钱图,用最省力的方式挣到更多的钱的路径就是前途
- 渗透测试试题-----web方面知识点
- A*算法最合理的数据结构
- Vufroia相机对焦问题
- 【arm】ARM32和AARCH64的几点区别
- 字节Scala面试题(2) --- 伴生对象
- 浏览器发送请求过程解析
- 读书笔记之《设计原本》
- 蘑菇街财报:曾经电商第四极的直播末路
- Response.Redirect(string url)报错:System.Threading.ThreadAbortException: 正在中止线程。
- 产品-Axure9(英文版),原型设计 制作下拉二级菜单
- TPS62130电源芯片的学习
- 遇到问题之-cacti监控网卡流量traffic
热门文章
- msf生成php反弹,反弹shell总结
- java openjdk 1.8_linux安装openjdk1.8
- 蓝桥杯 17省赛 C10 图形排版(Math)
- 临沂三中高考2021成绩查询,临沂2021中考考生10万人参加 6月30前查成绩
- mbedtls学习(9)数字签名RSA、DSA、ECDSA
- linux中root所属的组的gid为,linux用户和用户组
- 使用nvm管理node版本,npm安装失败解决方法
- 负载均衡算法--轮询法(Round Robin)
- Tensorflow学习——Eager Execution
- 滴滴出行2018内推编程题