【IT168 资讯】NVIDIA目前一代的显卡有GK104和GK110两大分支,它们的侧重点不同,但都是基于Kepler(开普勒,天文学家)架构的,下一代架构名为Maxwell(麦克斯韦尔,物理学家),根据之前的传闻Maxwell最快将在明年Q1季度问世,制程有可能继续使用TSMC的28nm工艺。现在网上又流传开Maxwell的架构设计了,旗舰GM100将有6144个CUDA核心,512bit位宽显存,显存容量达到了更夸张的8GB。

据WCCFTech报道,Maxwell架构也会同时推向游戏及计算两大市场,NVIDIA计划推出四款Maxwell架构GPU芯片——GM100、GM104、GM106和GM108。与Kepler架构相比,Maxwell将进一步增强SMX单元设计,优化双精度逻辑单元。

▲Maxwell线路图

介绍Maxwell之前最好了解一下Kepler架构,相关介绍可以参阅之前的文章:3倍性能从哪里来,GK110的SMX单元升级3.5代。目前Kepler架构中每组SMX单元有192个CUDA核心,Maxwell的SMX单元将进一步提升CUDA核心数到256个,不过DP双精度浮点单元的比例会从目前的1:3降低到1:4,算起来DP单元总数是保持不变的。256个CUDA核心的SMX单元将大幅增加Maxwell的CUDA总数,而DP双精度单元不用时是可以关闭的,这样也能降低能耗。

纹理单元方面,每组SMX单元会继续维持16个TMU单元,跟Kepler是一样的。

Maxwell的缓存设计也会进一步增强,每组SMX单元会额外增加2个寄存器,大量寄存器线程现在也可以并行运行了。L1缓存从Kepler架构的64kb增加到了128kb,而且可以作为共享内存使用,并且可以32/96、64/64、96/32的比例分配成缓存、共享内存。

L1缓存之外,每个GPC单元还会独享768kb L2缓存作为指令缓存。

具体的四款Maxwell芯片的详细架构如下所示:

GM110核心

目前的GK104核心有4组GPC单元,GK110是5组GPC单元,而GM110拥有8组GPC单元,每个GPC单元有三组SMX单元,每组SMX单元又有256个CUDA核心,这样总计有6144个CUDA核心,384个纹理单元,8MB L3缓存,64个ROP单元,512bit显存位宽,显存容量则达到夸张的8GB。

GM100无疑将取代GK110的旗舰地位,同时用于Tesla和GeForce高端产品线,不过这两个市场的GM100核心也有所不同:GeForce领域中的GM110核心频率在930MHz左右,加速频率1GHz左右,而Tesla中的GM110核心频率约为850MHz,双精度浮点性能达到了2.61TFLOPS。(作为对比的是GTX Titan目前的单精度性能是4.5FLOPS,双精度是1.3TFLOPS)

GM104核心

GM104核心将取代目前的GK104核心,后者的代表产品是GTX 680和GTX 770。

GM104的GPC单元数量降低到5组,拥有3840个CUDA核心,240个TMU纹理单元,40个ROP光栅单元,显存位宽降低到320bit,显存容量3GB,也可能是跟Fermi一样的2.5GB,不过显存位宽降低也使得频率可以更高,显存频率在7GHz左右,核心频率1GHz左右。

GM106核心

GM106核心将取代目前249美元以内的GK106核心的显卡,比如GTX 660、GTX 650 Ti、GTX 650 Ti Boost等。

不过GM106相对来说提升也是非常大的,CUDA核心将从目前的960个暴增到2304个,4MB L3缓存,144个纹理单元,24个ROP单元,显存位宽192bit,容量3GB,频率也能达到7GHz。

GM108核心

GM108之前其实还有GM107核心,目前后者的架构未知,不过驱动信息中已经有GM107存在的暗示了。

目前的ES样品显示GM108有576个CUDA核心,48个纹理单元,8个ROP单元,64bit显存位宽,核心面积跟GF117差不多。

丹佛计划将从Maxwell升级版时代开始?

在NVIDIA最神秘的计划中,Preject Denver丹佛计划最为引人注目,因为它将整合NVIDIA的GPU和ARM的CPU,有关这个处理器的进度一直没有明确消息。最新泄露的消息显示NIVIDIA在Maxwell升级版阶(GM11x)段推出丹佛计划,因为NVIDIA一直在等新的FinFET工艺成熟。这个说法跟NVIDIA在之前的GTC 2013大会上公布的进度有些相符。

▲丹佛处理器

丹佛处理器将整合64位ARM CPU核心,其中只有GM110会搭配8核丹佛处理器,GM110实际上应该被成为GM110 SoC处理器,已经不是单一的GPU或者CPU了。消费级的GM110将有4个CPU核心,整合的GPU则是GM114。整合GM116图形核心的丹佛则只会搭配2个CPU核心。泄露的报告没提到GM118核心整合什么丹佛核心,因此它很可能并不会使用新的架构。

丹佛处理器将有一致性总线(coherent link )用于连接CPU和GPU核心,并会在二者之间分配不同负载。爆料者称NVIDIA认为丹佛计划及相应的驱动优化会使他们的显卡比AMD为GCN架构优化的私有Mantle API更强。

目前最重要但是还不能确认的就是这些芯片是否能在2014年上半年发布,因为TSMC预计在2014年2月份才能量产20nm工艺,而且AMD预计在未来两个季度内使用14nm FinFET工艺流片新处理器,不过真正发布要等到2014年底甚至2015年初。这意味着2014年上半年最可能发布的还是他们的移动芯片,AMD是Crystal系列,NVIDIA是GTX 800M系列,而桌面版有可能到2014年下半年才能发布了。

▲Volta架构

2016年,NVIDIA会进入Vlota架构时代,根据之前在GTC 2013大会上公布的官方消息,Volta架构的带宽可达1TB/s。

位宽512bit显卡_6144 CUDA/512bit位宽 Maxwell架构曝光相关推荐

  1. 位宽512bit显卡_显卡知识:关于显卡位宽的基础知识科普

    显卡的位宽,准确应该说是显存的位宽.众所周知显卡的主要部件有GPU和显存,所谓显存位宽可以理解为数据从显存转移到GPU的通道的运载量,就是车间传送带的运输量. 由于买电脑的时候大家对显卡的显存大小过于 ...

  2. 位宽512bit显卡_显卡位宽是什么?详解显卡位宽基础知识科普!

    由于买电脑的时候大家对显卡的显存大小过于重视,很多人忽视了显存位宽的重要性,甚至出现2GB独立显卡但是位宽只有64bit这样坑人的显卡.也许有人说,显卡位宽做大点不就好了么.这是不对的,显卡位宽的扩大 ...

  3. GPU显卡,显存位宽

    显存位宽是显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一. 1简介 显存位宽是显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量 ...

  4. 32位dll注入到64位程序_你用的32位还是64位?有什么区别呢?

    (给程序员零距离加星标,了解项目开发.) 粉丝福利:小编会从今天留言中抽选3名小伙伴赠送现金红包,感谢大家一直以来的支持!文末见喽!通过前面两篇文章的学习,外甥对电脑的产生了各种好奇,差点把自己电脑拆 ...

  5. 4g内存只有1.6g可用_32位系统可用内存小 遇到32位系统内存小的解决方法

    内存是CPU进行沟通的桥梁,我们计算机上所有的程序都是在内存中运行的,如果内存不够用,可能系统缓慢卡顿,甚至会造成系统崩溃.那今天小编就给大家介绍一下32位系统可用内存小的解决方法,感兴趣的小伙伴一起 ...

  6. 应广单片机adc_应广PMC232系列单片机 12位ADC PWM LCD 双核心8位MCU

    PMC232系列 台湾应广 一级代理 现货批发 长期供应 带12位ADC.采用FPPATM技术.双核心8位单片机 PMC232为P232的升级版,内部基准电压更准,节省TL431. 工作电压更宽,功耗 ...

  7. java中位运算传参_java基础之位运算讲解于实战

    一.基础知识点概括 在查看源码中,经常会看到很多这样的符号"&"."|"."-","^","<& ...

  8. C语言int的位数是几位,C中的int总是32位吗?

    这与以下问题有关, 如何在C中声明32位整数 有人提到int在大多数平台上总是32位的.我很好奇这是不是真的. 你知道有什么不同尺寸的现代平台吗?忽略具有8位或16位架构的恐龙平台. 注意:我已经知道 ...

  9. 计算机配置64位,任何电脑都可以装64位系统吗|是不是所有的电脑都可以装64位系统...

    电脑都可以装64位系统吗?相信大家都看到,现在新买的电脑都是自带64位系统,这时候就有部分用户产生了疑惑,是不是所有电脑都能装64位系统?其实不然!操作系统分32位和64位,就说明了有些电脑不能装64 ...

最新文章

  1. dex:来自CoreOS的开源身份认证服务解决方案
  2. CCNP实验+笔记(完整版)
  3. STM32 电机教程 8 - 步进电机开环电流控制
  4. Linux之文件查找命令
  5. C语言验证6174数学问题
  6. 全球如何应对新冠大流行?科学子刊社论:数据驱动模型指导
  7. 进程调度:优先数法与轮转法的实现
  8. 软件工程开发之道:了解能力和复杂度是前提
  9. leetcode—10.栈题型python解答
  10. JavaScript中数组高级编程实践
  11. LwIP协议栈源码说明
  12. abaqus·复合材料建模技术与应用
  13. 基于linux的mplay的mp3程序,mplay_mxplayer播放器1.8.11_linux 视频播放器
  14. 尺度不变特征转换(Scale-invariant feature transform 或 SIFT)
  15. 游戏付费用户RFM分析案例
  16. php绑定银行卡实现,php网站如何绑定银行卡
  17. Win11电脑名如何更改?Win11更改电脑名的方法
  18. 什么是3D打印?3D打印技术?
  19. 《鸟哥的Linux私房菜》Chapter11 20180726~20180806
  20. cdn部署php,Typecho博客全站部署腾讯云CDN教程

热门文章

  1. 好的软件架构设计(zz)
  2. Android刷新率设置
  3. jQuery appendTo ( ) 方法
  4. 智慧能耗监测管理系统
  5. R语言 如何搭建和操作R语言数据框 R语言基础知识rbind,cbind,merge和str用法
  6. python 如何调试uc浏览器_UC浏览器调试移动端网站
  7. tensorflow | tensorflow实现将ckpt转pb文件
  8. 嵌入式工程师招聘要求有哪些?
  9. Vue系列之常见内存泄漏定位与解决
  10. 提升90%!利用结构线索增强视觉场景识别(VPR)能力