2020AI炼丹炉选择参考!大力神丹,this is for U !
点击上方“机器学习与生成对抗网络”,关注"星标"
获取有趣、好玩的前沿干货!
the original:Choosing the Best GPU for Deep Learning in 2020
https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/
author:Michael Balaban
translator :bryant8
# 转 载 请 显 眼 处 注 明 出 处 !
表现State-of-the-art (SOTA) 的深度学习模型越来越需要更大的显存开销,现在很多GPU已经开始日渐乏力。本文将展示一些GPU在训练SOTA模型的情况。
截止到2020 年 2 月,以下 GPU 可以训练所有SOTA(顶尖)的语言模型或图像模型:
RTX 8000:48GB 显存,约 5500 美元
RTX 6000:24GB 显存,约 4000 美元
Titan RTX:24GB 显存,约 2500 美元
而下面的 GPU 可训练大多数 (有些不行)SOTA 模型:
RTX 2080Ti:11GB 显存,约 1150 美元
GTX 1080Ti:11GB 显存,约 800 美元2手
RTX 2080:8GB 显存,约 720 美元
RTX 2070: 8GB 显存,约 500 美元
注意:大模型在上面这些的GPU 上训练,通常需调小 Batch size,同时这可能导致更低的精确率。
以下 GPU 无法训练SOTA了:
RTX 2060: 6GB 显存,约 359 美元
图像模型
1. 显存能支持的最大的批大小
*号表示 GPU 显存不足以运行模型
2. 性能(每秒处理的图像数量)
*号表示 GPU 显存不足以运行模型
语言模型
1. 显存能支持的最大批量大小
2. 性能
以 RTX 8000 为基准(“1”)
结论
1、更大容量的显存对语言模型受益更大。注意语言模型那张图的折线变化轨迹要比图像模型更陡。这表明语言模型受内存的限制更大,而图像模型受算力的限制更大。
2、显存越大往往可以带来更好的模型性能。因为显存越大,batch size 就越大,CUDA 可更加接近满负荷工作。
3、更大的显存可以按比例用更大的 Batch size,比如:24GB 显存的 GPU 相比8GB 显存的 GPU 可以用上 3 倍的 batch。
4、对于长序列,语言模型的内存占用增长不构成比例,因为注意力是序列长度的二次方关系。
建议
1、RTX 2060(6GB):业余炼丹选手。
2、RTX 2070 或 2080(8GB):对炼丹有认真的感情、但较穷的选手,可适用大部分模型啦。
3、RTX 2080Ti(11GB):沉迷炼丹无法自拔者,愿意为之付出到 1200美元左右。注:RTX 2080Ti 在深度学习训练上要比 RTX 2080 快大约 40%。
4、Titan RTX 和 Quadro RTX 6000(24GB):经常研究 SOTA 仙丹选手,但没富到能买 RTX 8000 ,可选这两款。
5、Quadro RTX 8000(48GB):志在炼出大力神丹!丹界新 SOTA,this is for U!
公众号近期荐读:
GAN整整6年了!是时候要来捋捋了!
新手指南综述 | GAN模型太多,不知道选哪儿个?
数百篇GAN论文已下载好!搭配一份生成对抗网络最新综述!
CVPR2020之MSG-GAN:简单有效的SOTA
CVPR2020之姿势变换GAN:图像里谁都会劈叉?
有点夸张、有点扭曲!速览这些GAN如何夸张漫画化人脸!
见微知细之超分辨率GAN!附70多篇论文下载!
天降斯雨,于我却无!GAN用于去雨如何?
脸部转正!GAN能否让侧颜杀手、小猪佩奇真容无处遁形?
容颜渐失!GAN来预测?
强数据所难!SSL(半监督学习)结合GAN如何?
弱水三千,只取你标!AL(主动学习)结合GAN如何?
异常检测,GAN如何gan ?
虚拟换衣!速览这几篇最新论文咋做的!
脸部妆容迁移!速览几篇用GAN来做的论文
【1】GAN在医学图像上的生成,今如何?
01-GAN公式简明原理之铁甲小宝篇
GAN&CV交流群,无论小白还是大佬,诚挚邀您加入!
一起讨论交流!长按备注【进群】加入:
更多分享、长按关注本公众号:
2020AI炼丹炉选择参考!大力神丹,this is for U !相关推荐
- 低代码平台的分类及选择参考
目录 零.认识低代码 一.低代码平台的分类 1.1通用低代码平台 1.2垂直低代码平台 1.3开放式低代码平台 二.低代码平台的特点 三.低代码平台的优缺点对比 四.低代码平台的选择参考 为什么选择I ...
- Arduino ESP32 读取SD卡接口选择参考
ESP32 读取SD卡接口选择参考 ESP3232读取SD卡可以通过spi和sdmmc两种方式来读取,不过我们在市面上能买到的都基本上是4线的SPI接口的SD卡模块套件. 卡类型有如下,8-9Pin被 ...
- mysql数据类型选择_MySQL学习笔记(二):MySQL数据类型汇总及选择参考
本文主要介绍了MySQL 的常用数据类型,以及实际应用时如何选择合适的类型. ******几个通用的简单原则:******* 1. 更小的通常更好.但是要确保没有低估需要存储的值的范围,如果无法确定哪 ...
- PCB layout常用走线线宽选择参考
一些刚入门的小伙伴问我们正常布线的时候线宽需要多宽才能保证我们6层板走线是正常工作的.正常情况下肯定是适当宽一点更好.下面我就给几个差不多的选择: ①.高速线一般走线是5.3mil即可 ②.差分线走线 ...
- 小程序外包公司有哪些选择参考标准?
开发小程序似乎很简单.事实上,有许多专业要点需要注意.如果企业想通过小程序开发小程序,为群众提供更强的服务,就应该选择专业.正规的小程序外包公司提供服务.在许多不同类型的小程序外包公司中,我们应该 ...
- 鼠标微动开关选择参考
[size=x-large][b]转发的可以参考一下,原文连接: [/b][/size] [url]http://zhidao.baidu.com/question/101556579.html[/u ...
- kong笔记——kong的权限认证插件选择参考
kong笔记--目录导航 kong自身共提供了这么几个权限认证插件: basic auth; key auth; hmac auth; jwt auth; oauth2 auth 接下来来逐个介绍其特 ...
- 2021-08-30备货赛灵思Xilinx公司的7系列FPGA选择参考分类
赛灵思公司的7系列FPGA根据不同客户的应用需求,分为4个子系列, 即Spartan7系列.Artix7系列.Kintex7系列以及Virtex7系列. 和前几代FPGA产品不同的是,7系列FPGA采 ...
- 企业如何选择音视频会议系统分析
企业如何选择音视频会议系统分析 腾讯会议和钉钉,哪个费用更划算? 市面上的两大视频会议软件,腾讯会议和钉钉,收费标准和付费功能哪个性价比更高,适合长期使用 腾讯会议和钉钉我都用过,个人认为性价比高一点 ...
最新文章
- Linux TCP/IP协议栈笔记
- python怎么导入包-Python 包的引入顺序到底是怎样的?
- 编译OpenJDK及JDK题外话
- pythonssl双向认证_Python 上的 ssl 提示验证失败,有什么办法深究具体失败的原因么?...
- 【小题目】输入三个数字,获取三个数字中的最小值
- Jquery实现 全选反选
- 【dfs】I Like Matrix!
- 自己动手写一个 strace
- 【python】numpy数据load报错
- strace实现原理:ptrace系统调用
- Spring之动态注册bean
- hadoop入门学习教程--DKHadoop完整安装步骤
- linux重定向到某目录文件,linux shell中12 21 1file_path重定向语法详解
- 禅道去除游客访问功能
- SPSS AMOS常用统计软件及科研神器安装包资源【SPSS 006期】
- vba 位 前 相似 筛选_Excel VBA复制筛选的当前区域可见单元格,但排除最后3列
- 关于谷歌浏览器Google Chrome 打开所有网页都显示“无标题”的解决办法。
- B站热榜 RSS 订阅 - 基于 RSSHub
- 计算机硬件主流参数,小白秒成DIY大神 自学电脑硬件参数速成攻略
- Tag文件和Tag标记的用法详解