GPU发展史之 ATI巅峰时刻

GPU发展史之 ATI巅峰时刻
2010年12月16日
　　

　　
　　[b]图注：NVIDIA公司的创始人黄仁勋先生和ATI公司的创始人何国源先生
　　[b] 1963年，黄仁勋出生于中国台北。1983年，黄仁勋大学毕业后毫不犹豫地搬到硅谷，并应聘AMD公司，成为一名芯片设计工程师，两年后跳槽到偏向于图形处理的芯片商LSI Logic。在职期间苦读6年后成为斯坦福电子工程硕士。1993年1月，NVIDIA正式成立，作为创始人之一的他担任NVIDIA首席执行官。[b] 1950年，何国源出生在广东省新会地区。1974年，何国源大学毕业回到香港，在那里找到了他平生第一份正式工作。何国源的第一份工作是在“Control Data”电脑公司做部门主管。1983年，何国源决定去加拿大发展之前，年轻的他在王氏电子公司已经做到了总经理。1985年，何国源和另外两名香港移民Benny Lau（产品开发副总裁）和Lee Lau（策略计划副总裁）共同创建的ATI（Array Technology Inc）。公司在多伦多北部的万锦市宣告成立。 2001年2月，NVIDIA终于发布了具有划时代意义的GeForce 3。Geforce 3采用0.15微米工艺制程，在晶体管数量上多达5700万个，这个数据整整是RIVA 128显卡的8倍，已经超高当时最强的P4处理器4200万个。GeForce 3拥有4个Pixel Shader和1个Vertex Shader（顶点处理单元）。同时，NVIDIA为游戏开发者提供了完整的Geforce架构开发工具，允许游戏开发者编制他们自己的程序来控制像素的效果，给游戏和应用开发者带来了极大的方便。
　　●GeForce 3 Ti系列产品技术优势：★★★★ 市场优势：★★★★[b] 微软在2002年对DirectX 8.0进行升级诞生了DirectX 8.1，新标准对VS和PS的渲染加强，增加对大纹理水波纹的处理效果，新的DirectX 8.1使你获得更好的图像显示质量，使多人游戏更具可伸缩性，以及包括更优异的音频效果。ATI则利用这个机会，通过代号R200的Radeon 8500显卡首次超过了NVIDIA的GeForce 3。在当时，做工优秀、画面显示质量出色的Radeon 8500显卡成为业界公认性能最出色的显卡，一举超越了压制NVIDIA的Geforce 3 Ti系列显卡。
　　●Radeon 8500系列产品技术优势：★★★★★ 市场优势：★★★★[b] 代号R200的Radeon 8500的基本结构与当时的其他显卡差不多；它拥有四个像素单元，每个像素单元拥有两个纹理单元。它亦支持DirectX 8.1的顶点着色引擎和像素着色引擎，它的两个顶点着色引擎被称为Charisma Engine II，为新的顶点着色程序和旧的DirectX 7硬件T&L都提供出色的效能。Radeon 8500支持像素着色器版本1.4，相对1.x版本的设计，这个修订版本是意义重大的。鉴于PS1.2和1.3只是PS1.1的改进版， 8500拥有第一和唯一的ATI硬件加速细分曲面绘图引擎，名为“Truform”，这个引擎通过十年的艰难发展后，最终成为我们在HD5870显卡中看到的Tessellation引擎。[b] 但是回头看DirectX 8时代的GPU，我们发现无论是NVIDIA还是ATI，都没有推出一款低端产品，而巨大的低端市场正面临产品断档的危险。[b] 2001年，在高端产品Radeon 8500之前，ATI发布了Radeon 7000系列显卡，因为这一系列显卡已经是ATI的第七代产品了。Radeon 7000系列总共有两款芯片，高端的R100（7200）和低端的RV100（7000）都使用了0.18微米工艺制造，拥有三千万晶体管，支持DirectX 7。这种以RV代表低端产品的做法被沿用至今。
　　●Radeon 7500系列产品技术优势：★★★ 市场优势：★★★★★[b] Radeon 7500是款特别的显卡，核心代号为RV200，因为它是与ATI下一代的8500（R200）一同发布的，但仅支持DirectX 7。客观的讲，作为DirectX7平台下的Radeon7500带给我们的是与GeForce2 TI同等的性能，而且它还具备其他的特点，比如超高的芯片运行频率及显存带宽、Hydra Vision双头显示、优秀的视频流回放与2D显示画面等，更重要的是它有一个吸引人的价格。[b] 总体来说，Radeon 7500等经典显卡为ATI打下了低端和中端市场，市场份额渐渐接近NVIDIA。Radeon 8500在此时也诞生了大量的衍生物，他们包括9000、9100、9200、9250等等，规格型号甚至令人眼花缭乱。
　　●GeForce4 Ti系列产品技术优势：★★★★ 市场优势：★★★☆[b] 面对竞争对手ATI的步步紧逼，GeForce4 Ti于2002年2月应运而生。GeForce4 Ti基于改良版本的TSMC 0.15微米工艺，采用了最新nfiniteFX II引擎，Vertex Shader增加至2个。在高工作频率下，使得GeForce4 Ti的处理能力有可能高于GeForce3将近三倍。而在全屏反锯齿方面，GeForce4 Ti采用新的Accuview AA技术，改善了取样方式并且优化了渲染的过程，可以进一步保证在高分辨率下的显示速度。显存带宽也一直是制约显卡性能的瓶颈，GeForce4 Ti为了摆脱瓶颈的限制，引入了LightSpeed Memory Architecture II（LMA II）光速显存构架II技术，它的原理就是优化渲染过程和压缩技术的采用。[b] GeForce4 Ti的性能领先程度巨大让ATI根本无力翻身，同时它完整支持DirectX 8.1也让NVIDIA在GPU着色器规格上没有任何遗憾。聪明的NVIDIA顺势推出了GeForce4 Ti4600、TI4400、Ti4200以及GeForce4 MX，其中最受用户欢迎的就是GeForce4 Ti4200，这是NVIDIA首次尝试高端产品低成本化（只有频率区分，没有架构改动），结果大获成功，持续热卖至2004年。
　　●GeForce4 MX系列产品技术优势：★★★ 市场优势：★★★★★[b] 而面向低端用户的GeForce4 MX更是由于对手产品线的空缺，这款显卡采用的核心实际上是GeForce 2 Ti，而显存控制器和抗锯齿功能则属于GeForce 4 Ti系列，虽然只支持DirectX 7，但它迅速取代GeForce 2 MX，创造了当时最好销量，成为最受欢迎的产品。
　　
　　
　　[b]Radeon 9700开启DirectX 9.0时代，NVIDIA深陷泥潭[/b][b] ●DirectX 9.0带给业界的震撼[b] 随后到来的DirectX 9.0时代，让Shader单元具备了更强劲的性能。2002年底微软发布的DirectX 9.0中，PS单元的渲染精度已达到浮点精度，传统的硬件T&L单元也被取消。全新的Vertex Shader（顶点着色引擎）编程将比以前复杂得多，新的Vertex Shader标准增加了流程控制和更多的常量，每个程序的着色指令增加到了1024条。 [b] PS 2.0具备完全可编程的架构，能对纹理效果即时演算、动态纹理贴图，还不占用显存，理论上对材质贴图的分辨率的精度提高无限多；另外PS1.4只能支持28个硬件指令，同时操作6个材质，而PS2.0却可以支持160个硬件指令，同时操作16个材质数量，新的高精度浮点数据规格可以使用多重纹理贴图，
　　可操作的指令数可以任意长，电影级别的显示效果轻而易举的实现。
　　基于Shader Model 2.0的3D Mark 03第四项游戏测试Mother Nature，对Shader单元运算复杂度和材质大小提出非常严苛的要求，当时只有高端显卡才能流畅通过该测试。
　　[b] VS 2.0通过增加Vertex程序的灵活性，显著的提高了老版本（DirectX 8）的VS性能，新的控制指令，可以用通用的程序代替以前专用的单独着色程序，效率提高许多倍；增加循环操作指令，减少工作时间，提高处理效率；扩展着色指令个数，从128个提升到256个。 [b] 最重要的一点改进是增加对浮点数据的处理功能，以前GPU只能对整数进行处理，改进后提高渲染精度，使最终处理的色彩格式达到电影级别。Shader Model 2.0时代突破了以前限制PC图形图象质量在数学上的精度障碍，它的每条渲染流水线都升级为128位浮点颜色，让游戏程序设计师们更容易更轻松的创造出更漂亮的效果。[b] 如果说DirectX 8中的Shader单元还是个简单尝试的话，DirectX 9中的Shader则成为了标准配置。除了版本升级到2.0外，DirectX 9中PS单元的渲染精度已达到浮点精度，硬件T&L单元也成为历史的产物被取消，在较低DirectX版本游戏运行时会使用VS单元模拟执行硬件T&L单元的功能。
　　●两家厂商的不同命运从DirectX 9开始，PC显卡业界由三名大佬掌权，它们是微软、ATI和NVIVIA。其中，微软担任3D API软件发展商的角色，不断更新DirectX应用程序接口，其它两个显卡厂商则紧紧跟随，推出相应的硬件产品，它们都想在未来的DX 9市场中称霸，但却遇到了不同的待遇。
　　[b] 实际上现在理性回顾当时的场景，ATI抢先发布了代号R300的Radeon 9700，不过，它发布时的DX9未完善，微软则会在最终版中加入VS（Vertex Shader，顶点描影）2.0、PS（Pixel Shader，像素描影）3.0。NVIDIA为了支持更多特性而延迟了NV30的发布，可惜它始终未能支持完整的VS 3.0/PS 3.0特性。[b] 总之，ATI和NVIDIA都不可能实现真正的DX 9，这是由两个厂商一手造成的。ATI发布Radeon 9700时，选择了VS 2.0/PS 2.0，NVIDIA选择了VS 2.0/PS 3.0。ATI和NVIDIA的分歧严重影响了DX的发展，甚至连OpenGL 2.0也受到牵连，微软则想取得领导地位，一直采取拖沿策略，以便保持自己在3D API的优势，借以打击OpenGL。
　　●Radeon 9700系列产品技术优势：★★★★★ 市场优势：★★★★☆[b] 但是ATI选择的是产品的发布速度，它坚信战场上兵贵神速。所以在NVIDIA沉浸于GeForce4 Ti带来的全盛时，ATI于2002年7月发布了首款支持DirectX 9的GPU――Radeon 9700。首款DX9图形芯片，256Bit的显存位宽，9700凭借8条管线理所当然的坐上了3D之王的宝座。[b] 由Radeon 9700衍生出的中端产品也吸引了消费者的眼球。当年9500显卡上演的改造风波也被传为佳话，9500黄金版（4管线可改8管线，128MB 256Bit显存；普通9500为4管线可改8管，64MB 128Bit显存）的知名度甚至要盖过9700。直到年末，准确地说是在2002年11月18日，Comdex 2002上，NVIDIA发布了研发代号NV30的GeForce FX，“FX”代表NVIDIA收购3DFX之后的首款作品。这款产品拥有当时最大的功耗，最夸张的散热器设计，多项半导体行业领先技术，却因为一些细节方面导致了GeForce FX的全盘皆输。
　　[b] 种种迹象都表明，GeForce FX 5800 Ultra是一款失败的产品，12层PCB以及GDDR2显存带来的高额成本，以及高噪音高功耗的表现使得GeForce FX 5800 Ultra在于ATI Radeon 9700 Pro的竞争中败下阵来，受到自身4x2流水线架构以及性能低下的Shader执行效率限制，导致3D性能上GeForce FX 5800 Ultra也得不到半点好处。为了弥补高端市场上的失策，NVIDIA针对主流市场以及低端市场积极的推出了NV30的精简版本NV31、NV34，即GeForce FX5600以及FX5200，可惜架构仍然继承了NV30的高频低能。
　　由于晶体管数达到创纪录的1.25亿个，惊人的500MHz默认频率，致使NVIDIA不得不为GeForce FX 5800 Ultra搭配“FX Flow”的散热系统，它包含一个铜制散热片、热管和换气装置。[b] ●GeForce FX5800系列产品技术优势：★★★ 市场优势：★★★[b] Radeon 9700成为了ATI最成功的一代显卡，而NVIDIA随后推出Geforce FX系列则是NV最受争议的一代显卡。无论高中低端，R300架构造就的ATI显卡在竞争中都取得明显的优势。但R300架构也拥有明显的不足。R300芯片本身是32位和24位混合型的，内核像素描影器是FP24，而纹理寻址操作和顶点描影管道是FP 32。R300在像素描影管道中有24位内部浮点精度，而代号NV30的Geforce FX系列支持IEEE-32（S23e8）浮点精度，比DX9更精确。[b] 但R300的市场把握水平要明显强于NV30，最后带来了ATI的胜利。这一优势持续了两年多，市场份额资料称，2004年ATI占了全球独立图形芯片出货量的一半儿还多。ATI终于成为第一大独立图形芯片厂商，成功超越了NVIDIA。[b] Radeon 9700的先进架构造就了它的高效率。在普遍\情况下，它能比昔日的王者GeForce4 Ti 4600快大约15-20%。但是，当运行抗锯齿（AA）和各异向性过滤（AF）计算时，它能比Ti 4600快大约40-100%。在当时来说，这种性能提升出乎所有用户意料，R300使到人们广泛接受AA和AF，使之成为必不可少的功能。R300也因为众多优秀之处成为历史上最长寿的显示芯片，R300推出3年后，还能为新游戏够提供合理的性能。总而言之DirectX 9.0时代的最初故事就是这样充满火药味和戏剧性。
　　●FX 5900亡羊补牢，Radeon 9800依然坚挺[b] 经历了GeForce FX 5800的惨痛教训之后，NVIDIA开始着手做两件事。首先是对NV30架构进行改进代号NV35，以图挽回市场份额，重新夺取性能宝座；另一方面则加速NV40芯片设计，这将是NVIDIA在未来上演的重头戏。[b] 半年后，也就是2003年5月份，NVIDIA发布了NV35核心的GeForce FX 5900，与GeForce FX 5800Ultra相比，GeForce FX 5900采用了更加成熟的0.13微米工艺，晶体管数量虽然增加了500万个晶体管，不过借助成熟的0.13微米工艺，芯片良率以及发热量都有了改善。
　　●GeForce FX5900系列产品技术优势：★★★☆ 市场优势：★★★☆[b] 图像技术方面这款产品也拥有众多亮点，新的NV35采用了备受业界好评的CineFX2.0引擎（增加了UltraShadow光影技术以及Intellisample HTC技术）。其中Intellisample HTC（高分辨率压缩技术），能有效改善全屏抗锯齿以及各向异性过滤的效果。[b] 新的NV35采用了CineFX2.0引擎，和第1代CineFX相比，NVIDIA对Pixel Shader做出了一定的改进，在保留FX12 combiner的同时增加了两个可进行浮点运算的miniALU，虽然miniALU的功能有限，但是还是使得NV35的浮点运算能力提高了一倍。除此之外，最大的改变就是从128bit显存位宽升级到256bit显存位宽，搭配的850MHz DDR-I显存可以提供的带宽高达27.2GB/s，远远高于GeForce FX 5800Ultra的16GB/s。不久后，NVIDIA又发布了NV36――GeForce FX 5700以及低频版的GeForce FX 5900XT显卡，在全部继承了NV35的基础上大幅缩减了产品的成本。尤其是GeForce FX 5900XT显卡，凭借准确的定位和较高的性价比，市场好评不断。
　　●Radeon 9800系列产品技术优势：★★★★ 市场优势：★★★☆[b] ATI采用了同样的方法，并且没有重新设计架构，只是用更小的代价稍作改进推出了代号R350的Radeon 9800。虽然9800在架构上并没有太多的改进，制造工艺依然维持0.15微米（之后高频的9800XT还是0.15微米），但频率的提高让它的性能比9700更上一层楼，SmartShader2.1和SmoothVision 2.1可能就是为数不多的改进了。在此基础之上的巅峰之作9800XT显卡更是把频率提升到了极限。[b] 2004年4月，ATI在控制高端市场的基础上，为我们带来了一款意想不到的中端经典显卡――Radeon 9550，这款芯片的成功至今让ATI自己都无法复制。Radeon 9550依然基于RV350制造，在所支持特效方面也完全与该系列最高端的Radeon 9600XT相同。
　　●Radeon 9550系列产品技术优势：★★★ 市场优势：★★★★★[b] 4条管线和Radeon 9800级别的DX9规格保证了Radeon 9550强大的实力，它与Radeon 9600XT的差别仅仅在于频率，这使得各种非公版、超频版9550立刻席卷中低端市场，掀起了一股超频之风，当然成本下降带来的合理的定价，是Radeon 9550成为一代经典最主要的因素。9550发布之时ATI并没有对其所搭配显存做太多限制，同时RV350核心出色的超频能力更赋予了Radeon 9550强大的生命力。灵活的规格和优秀的性价比使它成为ATI低端显卡中销量最高的型号。
[/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b]

GPU发展史之 ATI巅峰时刻相关推荐

阿里云POLARDB如何帮助百胜软件应对数据库的“巅峰时刻”
POLARDB是阿里云自研的下一代关系型云数据库,100%兼容MySQL,存储容量最高可达100TB,性能最高提升至MySQL的6倍,适用于企业多样化的数据库应用场景.POLARDB采用存储和计算分离 ...
三国武将10大巅峰时刻
三国武将10大巅峰时刻 NO.10文鸯单骑退雄兵. "背后数百员魏将,抖擞精神,骤马追来:将至乐嘉桥边,看看赶上.鸯忽然勒回马大喝一声,直冲入魏将阵中来:钢鞭起处,纷纷落马,各各倒退.鸯复缓 ...
指纹锁门锁，在锁具历史上的巅峰时刻
指纹锁门锁,在锁具历史上的巅峰时刻.在生活中我们都知道锁具对于我们历史的影响是极其深远的,从最早的所到现在最新科技的指纹识别技术的衍生,指纹锁.虽然不知道之后将会有什么,但是通过人们的不断努力,越来越 ...
揭秘《双11星秀猫巅峰时刻》功能设计
文章目录前言某宝图片某宝功能逻辑功能需求背景助力规则需要考虑的因素: SQL数据表设计部分代码实现结束语某宝宣传图前言为大家提供更好的设计思路,一起看透助力拉人头,坑多多砍一刀等 ...
3.3亿千瓦，垃圾电终于迎来它的巅峰时刻
"十四五"是碳达峰的关键期.窗口期,围绕生产生活方式绿色变革,能源该如何发力?我们要立足以煤为主的基本国情,抓好煤炭清洁高效利用,增加新能源消纳能力,推动煤炭和新能源优化组合.风能 ...
从英伟达 vs ATI的芯片大战看GPU前世今生
导读:本文带你回顾从CPU到GPU的历史,再展望从GPU到TPU的未来. 作者:钱纲来源:大数据DT(ID:hzdashuju) 01 第一代.第二代GPU 1998年英伟达宣布GPU的研发成功,是 ...
马云的至暗时刻：支付宝事件、十月围城 | 阿里巴巴20年
<阿里巴巴20年>聚焦阿里巴巴20年发展始末,这既是一个时代标杆的系统总结,又是一部阿里发展史的感官体验,更是企业成长的学习指南. <阿里巴巴20年>将不定期在"茅庐 ...
GPU底层技术、全球市场格局分析
1.集成显卡和独立显卡对比集成显卡是指一般不带显存,而是使用系统的一部分主内存作为显存的显卡.集成显卡可以被整合进主板作为北桥芯片的一部分,也可以和CPU集成在同一个Die中.集成显卡的显存一般根据 ...
invalidate(true) 图形不显示_2D图像界面-ATI 图形界面卡
.ATI Technologies, Inc. · 公司创立时间:1985 年 · 市场活跃期间:1986 年至 2006 年 · 退出显示市场:2006 年,被 AMD 收购. · 公司现况:201 ...

GPU发展史之 ATI巅峰时刻

GPU发展史之 ATI巅峰时刻相关推荐

最新文章

热门文章