GPU发展史之 ATI巅峰时刻
2010年12月16日
  

  
  [b]图注:NVIDIA公司的创始人黄仁勋先生和ATI公司的创始人何国源先生
  [b] 1963年,黄仁勋出生于中国台北。1983年,黄仁勋大学毕业后毫不犹豫地搬到硅谷,并应聘AMD公司,成为一名芯片设计工程师,两年后跳槽到偏向于图形处理的芯片商LSI Logic。在职期间苦读6年后成为斯坦福电子工程硕士。1993年1月,NVIDIA正式成立,作为创始人之一的他担任NVIDIA首席执行官。[b] 1950年,何国源出生在广东省新会地区。1974年,何国源大学毕业回到香港,在那里找到了他平生第一份正式工作。何国源的第一份工作是在“Control Data”电脑公司做部门主管。1983年,何国源决定去加拿大发展之前,年轻的他在王氏电子公司已经做到了总经理。1985年,何国源和另外两名香港移民Benny Lau(产品开发副总裁)和Lee Lau(策略计划副总裁)共同创建的ATI(Array Technology Inc)。公司在多伦多北部的万锦市宣告成立。 2001年2月,NVIDIA终于发布了具有划时代意义的GeForce 3。Geforce 3采用0.15微米工艺制程,在晶体管数量上多达5700万个,这个数据整整是RIVA 128显卡的8倍,已经超高当时最强的P4处理器4200万个。GeForce 3拥有4个Pixel Shader和1个Vertex Shader(顶点处理单元)。同时,NVIDIA为游戏开发者提供了完整的Geforce架构开发工具,允许游戏开发者编制他们自己的程序来控制像素的效果,给游戏和应用开发者带来了极大的方便。
  ●GeForce 3 Ti系列产品 技术优势:★★★★ 市场优势:★★★★[b] 微软在2002年对DirectX 8.0进行升级诞生了DirectX 8.1,新标准对VS和PS的渲染加强,增加对大纹理水波纹的处理效果,新的DirectX 8.1使你获得更好的图像显示质量,使多人游戏更具可伸缩性,以及包括更优异的音频效果。ATI则利用这个机会,通过代号R200的Radeon 8500显卡首次超过了NVIDIA的GeForce 3。在当时,做工优秀、画面显示质量出色的Radeon 8500显卡成为业界公认性能最出色的显卡,一举超越了压制NVIDIA的Geforce 3 Ti系列显卡。
  ●Radeon 8500系列产品 技术优势:★★★★★ 市场优势:★★★★[b] 代号R200的Radeon 8500的基本结构与当时的其他显卡差不多;它拥有四个像素单元,每个像素单元拥有两个纹理单元。它亦支持DirectX 8.1的顶点着色引擎和像素着色引擎,它的两个顶点着色引擎被称为Charisma Engine II,为新的顶点着色程序和旧的DirectX 7硬件T&L都提供出色的效能。Radeon 8500支持像素着色器版本1.4,相对1.x版本的设计,这个修订版本是意义重大的。鉴于PS1.2和1.3只是PS1.1的改进版, 8500拥有第一和唯一的ATI硬件加速细分曲面绘图引擎,名为“Truform”,这个引擎通过十年的艰难发展后,最终成为我们在HD5870显卡中看到的Tessellation引擎。[b] 但是回头看DirectX 8时代的GPU,我们发现无论是NVIDIA还是ATI,都没有推出一款低端产品,而巨大的低端市场正面临产品断档的危险。[b] 2001年,在高端产品Radeon 8500之前,ATI发布了Radeon 7000系列显卡,因为这一系列显卡已经是ATI的第七代产品了。Radeon 7000系列总共有两款芯片,高端的R100(7200)和低端的RV100(7000)都使用了0.18微米工艺制造,拥有三千万晶体管,支持DirectX 7。这种以RV代表低端产品的做法被沿用至今。
  ●Radeon 7500系列产品 技术优势:★★★ 市场优势:★★★★★[b] Radeon 7500是款特别的显卡,核心代号为RV200,因为它是与ATI下一代的8500(R200)一同发布的,但仅支持DirectX 7。客观的讲,作为DirectX7平台下的Radeon7500带给我们的是与GeForce2 TI同等的性能,而且它还具备其他的特点,比如超高的芯片运行频率及显存带宽、Hydra Vision双头显示、优秀的视频流回放与2D显示画面等,更重要的是它有一个吸引人的价格。[b] 总体来说,Radeon 7500等经典显卡为ATI打下了低端和中端市场,市场份额渐渐接近NVIDIA。Radeon 8500在此时也诞生了大量的衍生物,他们包括9000、9100、9200、9250等等,规格型号甚至令人眼花缭乱。
  ●GeForce4 Ti系列产品 技术优势:★★★★ 市场优势:★★★☆[b] 面对竞争对手ATI的步步紧逼,GeForce4 Ti于2002年2月应运而生。GeForce4 Ti基于改良版本的TSMC 0.15微米工艺,采用了最新nfiniteFX II引擎,Vertex Shader增加至2个。在高工作频率下,使得GeForce4 Ti的处理能力有可能高于GeForce3将近三倍。而在全屏反锯齿方面,GeForce4 Ti采用新的Accuview AA技术,改善了取样方式并且优化了渲染的过程,可以进一步保证在高分辨率下的显示速度。显存带宽也一直是制约显卡性能的瓶颈,GeForce4 Ti为了摆脱瓶颈的限制,引入了LightSpeed Memory Architecture II(LMA II)光速显存构架II技术,它的原理就是优化渲染过程和压缩技术的采用。[b] GeForce4 Ti的性能领先程度巨大让ATI根本无力翻身,同时它完整支持DirectX 8.1也让NVIDIA在GPU着色器规格上没有任何遗憾。聪明的NVIDIA顺势推出了GeForce4 Ti4600、TI4400、Ti4200以及GeForce4 MX,其中最受用户欢迎的就是GeForce4 Ti4200,这是NVIDIA首次尝试高端产品低成本化(只有频率区分,没有架构改动),结果大获成功,持续热卖至2004年。
  ●GeForce4 MX系列产品 技术优势:★★★ 市场优势:★★★★★[b] 而面向低端用户的GeForce4 MX更是由于对手产品线的空缺,这款显卡采用的核心实际上是GeForce 2 Ti,而显存控制器和抗锯齿功能则属于GeForce 4 Ti系列,虽然只支持DirectX 7,但它迅速取代GeForce 2 MX,创造了当时最好销量,成为最受欢迎的产品。
  
  
  [b]Radeon 9700开启DirectX 9.0时代,NVIDIA深陷泥潭[/b][b] ●DirectX 9.0带给业界的震撼[b] 随后到来的DirectX 9.0时代,让Shader单元具备了更强劲的性能。2002年底微软发布的DirectX 9.0中,PS单元的渲染精度已达到浮点精度,传统的硬件T&L单元也被取消。全新的Vertex Shader(顶点着色引擎)编程将比以前复杂得多,新的Vertex Shader标准增加了流程控制和更多的常量,每个程序的着色指令增加到了1024条。 [b] PS 2.0具备完全可编程的架构,能对纹理效果即时演算、动态纹理贴图,还不占用显存,理论上对材质贴图的分辨率的精度提高无限多;另外PS1.4只能支持28个硬件指令,同时操作6个材质,而PS2.0却可以支持160个硬件指令,同时操作16个材质数量,新的高精度浮点数据规格可以使用多重纹理贴图,
  可操作的指令数可以任意长,电影级别的显示效果轻而易举的实现。
  基于Shader Model 2.0的3D Mark 03第四项游戏测试Mother Nature,对Shader单元运算复杂度和材质大小提出非常严苛的要求,当时只有高端显卡才能流畅通过该测试。
  [b] VS 2.0通过增加Vertex程序的灵活性,显著的提高了老版本(DirectX 8)的VS性能,新的控制指令,可以用通用的程序代替以前专用的单独着色程序,效率提高许多倍;增加循环操作指令,减少工作时间,提高处理效率;扩展着色指令个数,从128个提升到256个。 [b] 最重要的一点改进是增加对浮点数据的处理功能,以前GPU只能对整数进行处理,改进后提高渲染精度,使最终处理的色彩格式达到电影级别。Shader Model 2.0时代突破了以前限制PC图形图象质量在数学上的精度障碍,它的每条渲染流水线都升级为128位浮点颜色,让游戏程序设计师们更容易更轻松的创造出更漂亮的效果。[b] 如果说DirectX 8中的Shader单元还是个简单尝试的话,DirectX 9中的Shader则成为了标准配置。除了版本升级到2.0外,DirectX 9中PS单元的渲染精度已达到浮点精度,硬件T&L单元也成为历史的产物被取消,在较低DirectX版本游戏运行时会使用VS单元模拟执行硬件T&L单元的功能。
  ●两家厂商的不同命运 从DirectX 9开始,PC显卡业界由三名大佬掌权,它们是微软、ATI和NVIVIA。其中,微软担任3D API软件发展商的角色,不断更新DirectX应用程序接口,其它两个显卡厂商则紧紧跟随,推出相应的硬件产品,它们都想在未来的DX 9市场中称霸,但却遇到了不同的待遇。
  [b] 实际上现在理性回顾当时的场景,ATI抢先发布了代号R300的Radeon 9700,不过,它发布时的DX9未完善,微软则会在最终版中加入VS(Vertex Shader,顶点描影)2.0、PS(Pixel Shader,像素描影)3.0。NVIDIA为了支持更多特性而延迟了NV30的发布,可惜它始终未能支持完整的VS 3.0/PS 3.0特性。[b] 总之,ATI和NVIDIA都不可能实现真正的DX 9,这是由两个厂商一手造成的。ATI发布Radeon 9700时,选择了VS 2.0/PS 2.0,NVIDIA选择了VS 2.0/PS 3.0。ATI和NVIDIA的分歧严重影响了DX的发展,甚至连OpenGL 2.0也受到牵连,微软则想取得领导地位,一直采取拖沿策略,以便保持自己在3D API的优势,借以打击OpenGL。
  ●Radeon 9700系列产品 技术优势:★★★★★ 市场优势:★★★★☆[b] 但是ATI选择的是产品的发布速度,它坚信战场上兵贵神速。所以在NVIDIA沉浸于GeForce4 Ti带来的全盛时,ATI于2002年7月发布了首款支持DirectX 9的GPU――Radeon 9700。首款DX9图形芯片,256Bit的显存位宽,9700凭借8条管线理所当然的坐上了3D之王的宝座。[b] 由Radeon 9700衍生出的中端产品也吸引了消费者的眼球。当年9500显卡上演的改造风波也被传为佳话,9500黄金版(4管线可改8管线,128MB 256Bit显存;普通9500为4管线可改8管,64MB 128Bit显存)的知名度甚至要盖过9700。 直到年末,准确地说是在2002年11月18日,Comdex 2002上,NVIDIA发布了研发代号NV30的GeForce FX,“FX”代表NVIDIA收购3DFX之后的首款作品。这款产品拥有当时最大的功耗,最夸张的散热器设计,多项半导体行业领先技术,却因为一些细节方面导致了GeForce FX的全盘皆输。
  [b] 种种迹象都表明,GeForce FX 5800 Ultra是一款失败的产品,12层PCB以及GDDR2显存带来的高额成本,以及高噪音高功耗的表现使得GeForce FX 5800 Ultra在于ATI Radeon 9700 Pro的竞争中败下阵来,受到自身4x2流水线架构以及性能低下的Shader执行效率限制,导致3D性能上GeForce FX 5800 Ultra也得不到半点好处。为了弥补高端市场上的失策,NVIDIA针对主流市场以及低端市场积极的推出了NV30的精简版本NV31、NV34,即GeForce FX5600以及FX5200,可惜架构仍然继承了NV30的高频低能。
  由于晶体管数达到创纪录的1.25亿个,惊人的500MHz默认频率,致使NVIDIA不得不为GeForce FX 5800 Ultra搭配“FX Flow”的散热系统,它包含一个铜制散热片、热管和换气装置。[b] ●GeForce FX5800系列产品 技术优势:★★★ 市场优势:★★★[b] Radeon 9700成为了ATI最成功的一代显卡,而NVIDIA随后推出Geforce FX系列则是NV最受争议的一代显卡。无论高中低端,R300架构造就的ATI显卡在竞争中都取得明显的优势。但R300架构也拥有明显的不足。R300芯片本身是32位和24位混合型的,内核像素描影器是FP24,而纹理寻址操作和顶点描影管道是FP 32。R300在像素描影管道中有24位内部浮点精度,而代号NV30的Geforce FX系列支持IEEE-32(S23e8)浮点精度,比DX9更精确。[b] 但R300的市场把握水平要明显强于NV30,最后带来了ATI的胜利。这一优势持续了两年多,市场份额资料称,2004年ATI占了全球独立图形芯片出货量的一半儿还多。ATI终于成为第一大独立图形芯片厂商,成功超越了NVIDIA。[b] Radeon 9700的先进架构造就了它的高效率。在普遍\情况下,它能比昔日的王者GeForce4 Ti 4600快大约15-20%。但是,当运行抗锯齿(AA)和各异向性过滤(AF)计算时,它能比Ti 4600快大约40-100%。在当时来说,这种性能提升出乎所有用户意料,R300使到人们广泛接受AA和AF,使之成为必不可少的功能。R300也因为众多优秀之处成为历史上最长寿的显示芯片,R300推出3年后,还能为新游戏够提供合理的性能。总而言之DirectX 9.0时代的最初故事就是这样充满火药味和戏剧性。
  ●FX 5900亡羊补牢,Radeon 9800依然坚挺[b] 经历了GeForce FX 5800的惨痛教训之后,NVIDIA开始着手做两件事。首先是对NV30架构进行改进代号NV35,以图挽回市场份额,重新夺取性能宝座;另一方面则加速NV40芯片设计,这将是NVIDIA在未来上演的重头戏。[b] 半年后,也就是2003年5月份,NVIDIA发布了NV35核心的GeForce FX 5900,与GeForce FX 5800Ultra相比,GeForce FX 5900采用了更加成熟的0.13微米工艺,晶体管数量虽然增加了500万个晶体管,不过借助成熟的0.13微米工艺,芯片良率以及发热量都有了改善。
  ●GeForce FX5900系列产品 技术优势:★★★☆ 市场优势:★★★☆[b] 图像技术方面这款产品也拥有众多亮点,新的NV35采用了备受业界好评的CineFX2.0引擎(增加了UltraShadow光影技术以及Intellisample HTC技术)。其中Intellisample HTC(高分辨率压缩技术),能有效改善全屏抗锯齿以及各向异性过滤的效果。[b] 新的NV35采用了CineFX2.0引擎,和第1代CineFX相比,NVIDIA对Pixel Shader做出了一定的改进,在保留FX12 combiner的同时增加了两个可进行浮点运算的miniALU,虽然miniALU的功能有限,但是还是使得NV35的浮点运算能力提高了一倍。除此之外,最大的改变就是从128bit显存位宽升级到256bit显存位宽,搭配的850MHz DDR-I显存可以提供的带宽高达27.2GB/s,远远高于GeForce FX 5800Ultra的16GB/s。 不久后,NVIDIA又发布了NV36――GeForce FX 5700以及低频版的GeForce FX 5900XT显卡,在全部继承了NV35的基础上大幅缩减了产品的成本。尤其是GeForce FX 5900XT显卡,凭借准确的定位和较高的性价比,市场好评不断。
  ●Radeon 9800系列产品 技术优势:★★★★ 市场优势:★★★☆[b] ATI采用了同样的方法,并且没有重新设计架构,只是用更小的代价稍作改进推出了代号R350的Radeon 9800。虽然9800在架构上并没有太多的改进,制造工艺依然维持0.15微米(之后高频的9800XT还是0.15微米),但频率的提高让它的性能比9700更上一层楼,SmartShader2.1和SmoothVision 2.1可能就是为数不多的改进了。在此基础之上的巅峰之作9800XT显卡更是把频率提升到了极限。[b] 2004年4月,ATI在控制高端市场的基础上,为我们带来了一款意想不到的中端经典显卡――Radeon 9550,这款芯片的成功至今让ATI自己都无法复制。Radeon 9550依然基于RV350制造,在所支持特效方面也完全与该系列最高端的Radeon 9600XT相同。
  ●Radeon 9550系列产品 技术优势:★★★ 市场优势:★★★★★[b] 4条管线和Radeon 9800级别的DX9规格保证了Radeon 9550强大的实力,它与Radeon 9600XT的差别仅仅在于频率,这使得各种非公版、超频版9550立刻席卷中低端市场,掀起了一股超频之风,当然成本下降带来的合理的定价,是Radeon 9550成为一代经典最主要的因素。9550发布之时ATI并没有对其所搭配显存做太多限制,同时RV350核心出色的超频能力更赋予了Radeon 9550强大的生命力。灵活的规格和优秀的性价比使它成为ATI低端显卡中销量最高的型号。
[/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b]

GPU发展史之 ATI巅峰时刻相关推荐

  1. 阿里云POLARDB如何帮助百胜软件应对数据库的“巅峰时刻”

    POLARDB是阿里云自研的下一代关系型云数据库,100%兼容MySQL,存储容量最高可达100TB,性能最高提升至MySQL的6倍,适用于企业多样化的数据库应用场景.POLARDB采用存储和计算分离 ...

  2. 三国武将10大巅峰时刻

    三国武将10大巅峰时刻 NO.10文鸯单骑退雄兵. "背后数百员魏将,抖擞精神,骤马追来:将至乐嘉桥边,看看赶上.鸯忽然勒回马大喝一声,直冲入魏将阵中来:钢鞭起处,纷纷落马,各各倒退.鸯复缓 ...

  3. 指纹锁门锁,在锁具历史上的巅峰时刻

    指纹锁门锁,在锁具历史上的巅峰时刻.在生活中我们都知道锁具对于我们历史的影响是极其深远的,从最早的所到现在最新科技的指纹识别技术的衍生,指纹锁.虽然不知道之后将会有什么,但是通过人们的不断努力,越来越 ...

  4. 揭秘《双11星秀猫巅峰时刻》功能设计

    文章目录 前言 某宝图片 某宝功能逻辑 功能需求背景 助力规则 需要考虑的因素: SQL数据表设计 部分代码实现 结束语 某宝宣传图 前言 为大家提供更好的设计思路,一起看透助力拉人头,坑多多砍一刀等 ...

  5. 3.3亿千瓦,垃圾电终于迎来它的巅峰时刻

    "十四五"是碳达峰的关键期.窗口期,围绕生产生活方式绿色变革,能源该如何发力?我们要立足以煤为主的基本国情,抓好煤炭清洁高效利用,增加新能源消纳能力,推动煤炭和新能源优化组合.风能 ...

  6. 从英伟达 vs ATI的芯片大战看GPU前世今生

    导读:本文带你回顾从CPU到GPU的历史,再展望从GPU到TPU的未来. 作者:钱纲 来源:大数据DT(ID:hzdashuju) 01 第一代.第二代GPU 1998年英伟达宣布GPU的研发成功,是 ...

  7. 马云的至暗时刻:支付宝事件、十月围城 | 阿里巴巴20年

    <阿里巴巴20年>聚焦阿里巴巴20年发展始末,这既是一个时代标杆的系统总结,又是一部阿里发展史的感官体验,更是企业成长的学习指南. <阿里巴巴20年>将不定期在"茅庐 ...

  8. GPU底层技术、全球市场格局分析

    1.集成显卡和独立显卡对比 集成显卡是指一般不带显存,而是使用系统的一部分主内存作为显存的显卡.集成显卡可以被整合进主板作为北桥芯片的一部分,也可以和CPU集成在同一个Die中.集成显卡的显存一般根据 ...

  9. invalidate(true) 图形不显示_2D图像界面-ATI 图形界面卡

    .ATI Technologies, Inc. · 公司创立时间:1985 年 · 市场活跃期间:1986 年至 2006 年 · 退出显示市场:2006 年,被 AMD 收购. · 公司现况:201 ...

最新文章

  1. Angularjs相关文章地址
  2. spring实例教程
  3. js目标时间与当前时间差转换年月日天数
  4. Spring Boot + Thymeleaf 创建web项目
  5. torch.argmax()函数
  6. 在linux或者windows上直观查看linux下生成的自签名证书
  7. 在html页面中怎么打印区域,在HTML中指定打印区域进行打印机打印
  8. 网站开启https后很慢_网站优化中哪些设置会影响蜘蛛的抓取?对网站SEO产生什么影响...
  9. python 图标题上移_Python-Matplotlib将图形标题移动到y轴
  10. 网页打印物理大小尺寸的单位换算
  11. lwip-1.4.1文档sys_arch翻译
  12. WebLogic Clustering Overview Slides
  13. JavaWeb应用项目部署到云ubuntu
  14. html如何写微信弹窗,微信小程序 自定义弹窗实现过程(附代码)_而已_前端开发者...
  15. Linux中rz和sz命令用法详解
  16. 学生成绩分析之成绩的预处理 python3 pandas 学生成绩汇总到一张表
  17. 爬楼梯算法的数学思路
  18. 笔记本如何解除锁定计算机,笔记本键盘锁定解锁方法教程
  19. Tensorflow实现进阶的神经网络
  20. javaweb验证码明明输入正确却还是提示错误,验证码session不同步、不一致问题

热门文章

  1. Android使用动画实现微信扫描线效果
  2. WeZRender:微信小程序Canvas增强组件。
  3. 银行虚拟人技术应用领域及作用介绍
  4. 初级算法_反转字符串
  5. 很不错实用的前端工具
  6. php桌面路径,如何查看桌面文件路径
  7. AutoJs制作简易自动化脚本(持续更新)
  8. 计算机应用基础试题win7,计算机应用基础WIn7操作问题
  9. [人工智能-深度学习-24]:卷积神经网络CNN - CS231n解读 - 卷积神经网络基本层级
  10. Python实战,爬虫实战,用Python抢票