拼 命 加 载 中 ...

记得当初GTX

Titan显卡刚发布时,NVIDIA官方强调它不仅仅是最强游戏显卡,而且还可以做专业卡,不仅是因为它强大的性能,也与当初GK110核心保留了专业级的双精度性能有关。GTX

Titan X发布时,NVIDIA为它配备了12GB显存,当时也有说是给一些专业用户预留的,这一次Pascal架构显卡也发布了,其计算性能又如何呢?

对于NVIDIA Kepler及Maxwell架构的计算性能,我们之前分别做过单独的分析和测试,详情可以参考:

GTX Titan

X显卡计算性能:单精度无敌,双精度变渣

GP104架构计算性能改进

与专门针对HPC市场的GP100大核心相比,GP104是针对游戏市场的,后者对GPU通用计算性能并没有多高的精度要求,特别是FP64双精度性能更没特别要求,而高精度浮点运算需要太多的计算单元,因此这种出力不讨好的设计在游戏GPU上并不受欢迎,GP104相比GP100就砍掉了很多与计算无关的设计——包括NV

Link、1:2的FP64性能等,HBM 2显存也降级到了GDDR5X。

在此前的GTX 1080架构分析中,我们可以看到GP104核心的SM单元架构与前代GM204架构非常相似,每组SM单元也是128个CUDA核心(FP32),其中有4组FP64双精度单元,FP64:FP32的比例还是1:32,这一点与GTX

980/GTX 980 Ti都是相同的,与GP100核心FP32:FP64的1:2超高比例大不相同。

对AMD、NVIDIA来说,GPU的单双精度比都是根据需要来设计的,“同一个”核心可能有不同的变化,比如AMD的FirePro W9100跟R9

290X一样都是2816个流处理器单元,但前者的单双精度比是1:2,后者就只有1:8,而Fury

X的Fiji核心虽然浮点性能高达8.6TFLOPS,但单双精度比下降到了1:16,Radeon Pro Duo显卡同核心的FirePro S9300

X2发布时AMD也只强调它是单精度最快的加速卡,因为双精度性能不过0.8TFLOPS,比FirePro S9170/9100还要低得多。

对GP104核心来说,尽管单双精度比维持了GM204/GM200核心的1:32,不过它也不是没有改进,它支持了FP16半精度运算,而且FP32:FP16比例是1:2,也就是说半精度性能是单精度的2倍,上个月的GTC大会上,NVIDIA推出的DGX-1深度学习超算就是强调半精度性能的。

GM204核心的Maxwell架构中,FP16半精度性能与FP32单精度性能还是1:1的,也就是没做优化支持。不过早在Tegra

X1芯片发布时,NVIDIA就开始强调混合精度,也就是支持FP16半精度运算的,理论上目前的Maxwell架构也是可以做优化的。

不过实际测试中Pascal的FP16半精度运算是不理想的,Sandra 2016的GPU计算中,GTX 980/980

Ti显卡的FP16显示是“模拟”出来的,而GTX 1080是“原生”,而且GTX 1080的FP16原生性能远远低于GTX

980显卡“模拟”出来的性能,这很可能意味着GTX 1080显卡现在的FP16支持还没做好驱动支持。

下面就是GTX 1080显卡的计算性能实测,对比的只有GTX 980和GTX 980 Ti,因为手头没有Fury X显卡了。

GTX 1080显卡与GTX 980显卡的计算性能对比

在计算性能方面,GTX 1080的浮点性能是9TFLOPS,GTX 980是5TFLOPS,实测结果也是大比分领先了GTX

980显卡,Sandra的双精度、四精度领先优势更明显。

GTX 1080显卡与GTX 980 Ti显卡的计算性能对比

与GTX 980 Ti显卡相比,GTX 1080的运算性能领先幅度就没这么明显了,当然比GTX 980

Ti领先还是很是有的,特别是Sandra、AIDA64的GPU计算中。

手头没有Fury X显卡了,所以没法对比它的计算性能,不过Fury X的浮点性能也有8.6TFLOPS,与GTX 1080差不多,单双精度比是1:16,要高于GP104核心,理论上其计算性能不会比GTX 1080差多少,双精度应该更有优势。

总之,GP104核心因为是专注游戏市场的,所以在计算性能方面,GTX 1080相比GTX 980并没有明显的架构改变,但它依然有两大优势——首先是GPU性能强劲,浮点性能依然大比分优势领先GTX

980显卡,比GTX 980 Ti也有1/4的提升。

第二点,Pascal架构原生支持FP16半精度运算,高精度运算对游戏、VR来说可能没什么意义,但原生支持FP16半精度运算可以大幅提升计算性能,NVIDIA目前主要强调应用在深度学习中,但未来游戏及VR都有可能因此受益。

GTX1080 matlab计算,GTX 1080显卡计算性能测试:专业的归专业,游戏的归游戏相关推荐

  1. 550w计算机电源,GTX 1080显卡配550W电源够用不?老司机来告诉你如何DIY电脑主机...

    GTX 1080显卡配550W电源够用不?不少人产生疑问,毕竟GTX 1080高端显卡的身份无形中也给人感觉功耗太大.实际上,GTX 1080功耗对比前一代GTX 980要改善很多,这自然也得益于帕斯 ...

  2. 技嘉1080显卡体质测试软件,技嘉GTX 1080 Xtreme Gaming双卡SLI性能深度评测+拆解

    旗舰GTX 1080组SLI会有怎么样的效能,这次SLI测试用的是技嘉刚推出的GTX 1080 Xtreme Gaming显卡,它身上的多处亮点能赋予用户与众不同的体验,尊享套装版还配送了新的SLI ...

  3. 深度学习主机环境配置: Ubuntu16.04+GeForce GTX 1080+TensorFlow

    http://f.dataguru.cn/thread-660774-1-1.html 发表于 2016-7-20 09:04 | 只看该作者 |倒序浏览 |阅读模式 深度学习主机环境配置: Ubun ...

  4. 550w计算机电源,550W电源真的带不起1080显卡?资深老编装台机告诉你

    作为一个已经活在IT界里十年的老编,总是隔三岔五地问到:"这个配置的机器得配什么样的电源?"或者"这样的电源最高能配上什么显卡?",也有一些是如标题一样的&qu ...

  5. 技嘉1080显卡体质测试软件,【技嘉GTX1080评测】突破屏障 技嘉GTX 1080 G1 Gaming评测_技嘉 GTX 1080 G1 Gaming 8G_显卡评测-中关村在线...

    [中关村在线]技嘉GTX1080评测:显卡的性能有没有过剩,性能的顶峰到底在哪?相信不少玩家都想过这一问题.当一块GTX970能基本应付1080p分辨率下的游戏时,VR的出现又打破了这一局面,VR游戏 ...

  6. gtx1080 matlab,深度学习主机环境配置: Ubuntu16.04+Nvidia GTX 1080+CUDA8.0

    这个系列写了好几篇文章,这是相关文章的索引,仅供参考: 接上文<深度学习主机攒机小记>,这台GTX1080主机准备好之后,就是配置深度学习环境了,这里选择了比较熟悉Ubuntu系统,不过是 ...

  7. 【MacBook Pro 2016款 外接 GTX-1080显卡】- 技嘉 AORUS GTX 1080 Gaming Box (附安装参考教程)

    一直存在一个广泛问题:MacBook玩不了大型游戏,显卡差,散热差. 前段时间买了技嘉的AORUS GTX 1080 Gaming Box,这款外接显卡和是在2017年发布的,但是当时只有1070的版 ...

  8. 较真:认真解读“NVIDA CUDA显卡计算能力表”

    博主在硬件设备方面还是个小白,近日想要知道深度学习应当选用哪些显卡,其性能如何?且网络上能搜到的GPU天梯图似乎都停留在以装机选配为目的的个人级别上,于是在本站试图搜索相关文章或者排行,看到有不少博主 ...

  9. 怎么用显卡计算_初试CUDA,入门显卡实现两千倍加速

    众所周知,Nvidia的CUDA计算平台可以实现数量惊人的并行运算,因此受各个流行的机器学习框架青睐.为了尝试人工智能,我最近组装了一台机器,配备了一块入门级的GeForce GTX 1060显卡. ...

最新文章

  1. Error in terms.formula(formula, data = data) : invalid model formula in ExtractVars
  2. Microsoft SQL Server 2000 中的数据转换服务 (DTS)
  3. 获取行信息_论文推荐 | 周乐韬,黄丁发,袁林果,等:基于状态和残差的北斗基准站观测数据表达与信息分级...
  4. python函数示例_PHP closeir()函数与示例
  5. Cacti设置流量阀值实现邮件报警
  6. qt 3d迷宫游戏_《加雷利亚的地下迷宫与魔女的旅团》最新情报公布
  7. VMware NSX part 1(介绍) part 2(NSX-Manager安装) part 3(NSX Controller部署)
  8. ASP.NET MVC - 用户验证和权限验证
  9. 智能优化算法:世界杯优化算法-附代码
  10. 空间计量经济学(2)---广义空间自回归与空间误差模型
  11. windows10远程桌面 删除IP记录
  12. 页面布局中遇到菱形图片时的处理办法
  13. 数据结构与算法分析 收获总结 第11章 图
  14. Go语言实战之数组的内部实现和基础功能
  15. 怎么把PDF翻译成中文?教你便捷翻译方法
  16. win7系统无法连接局域网服务器,Win7局域网无法访问如何解决?
  17. 多元线性回归公式推导及R语言实现
  18. 编写Java程序,做一个MPG和L/100KM的转换器
  19. 河北计算机软件职业技术学院,河北软件职业技术学院2021年排名
  20. Kaldi 入门使用教程

热门文章

  1. 给图片的一个部分加链接
  2. 宝塔安装【我是大白,我是猿】
  3. 广州某高校经典诵读微信小程序分析
  4. Response.Redirec方法传递汉字出现乱码
  5. java多线程同步 多窗口卖票实例_java多线程之火车售票系统模拟实例
  6. 洛谷 P3627 [APIO2009]抢掠计划
  7. 写给刚入门的兄弟们,我常用的几个字段命名参考,大家都这么命名,我们写程序就更规范了...
  8. Python视频教程(Python基础)
  9. Tenth Line
  10. 8款赞不绝口的黑科技软件,实用又强大