资源描述
前言:当今半导体领域,只有一种芯片能以3倍于摩尔定律的速度发展,只有一种芯片能够在PC领域挑战甚至超越同时期生产的CPU产品,只有一种芯片让图形业界的创作者和无数游戏玩家为之疯狂,这就是GPU(Graphic Processing Unit),中文译名:图形处理器。
NVIDIA公司在1999年发布GeForce 256图形处理芯片时首先提出GPU的概念,随后大量复杂的应用需求促使整个产业蓬勃发展至今。今天笔者将用最精炼的文字,为各位读者讲述这10年的GPU发展的主要路径,读者可以跟随下面的文字将自己置于当时的市场背景下,体会各种经典产品和先进技术带给我们的震撼。
计算机图形学诞生具有重要意义
利用计算机实现图形生成,或者说地通俗一些实现图像的绘制,是科学家们长期的梦想。我们无法追溯最初这个想法的提出者和具体细节,但是我们还是查阅到了一个人和一门学科。这个人是著名科学家——伊凡•苏泽兰先生,这门学科则是当今计算机领域最热门的专业——计算机图形学(Computer Graphics,简称CG)。
图注:Ivan Sutherland博士1962年在演示中最初的“画板”程序。
1962年,麻省理工学院的一位青年博士研究生提交了论文并发言,他就是伊凡•苏泽兰(Ivan Sutherland)。苏泽兰用幻灯向与会者展示了画板程序,苏泽兰和他所展示的程序最终成为计算机图形学的奠基。而今他已72岁高龄,仍然奋斗在图形业界最前沿,现为Sun公司研究员和副总裁。
计算机图形学,是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。图形学处理需要计算机天然具备大量并行运算能力,并且对精度和运算强度有很高要求,但是这给当时的计算机提出了巨大的难题,由于硬件发展的严重滞后,计算机图形学在提出后的20年内一直艰难前行。
图注:最初的pong街机,将电子娱乐从概念推向实际
在1972年,计算机图形学的发展直接促成了一个让普通用户感兴趣的游戏产品——Pong街机,这是第一款家庭电视游戏产品,也是首款真正取得成功并影响深远的视频游戏,实际上这就是一个简单的乒乓撞球游戏,但它几乎成为电子娱乐领域的始祖。当Pong成为遍布街头巷尾的街机时,越来越多的厂商也开始关注并设计自己的电子娱乐产品。
同样对计算机图形学提出需求的,还有一些工业设计领域,如计算机辅助设计(Computer Aided Design),通称CAD。CAD的出现使情况发生根本性的改变,1974年美国波音飞机制造公司第一架音747客机试飞成功,这架客机的设计图纸全部重量竟有几十吨重,如果没有CAD设计技术,这么浩大的制图工程量,用人工来做是无法想象的。
在20世纪80年代,逐渐出现了专门进行图形计算的硬件,它们是GPU的前生,这极大的加速了计算机图形学的发展进程。八十年代以前主要在军事领域研究发展,其应用目标是各类军用运输工具仿真模拟器的视景生成系统。八十年代早期,斯坦福大学教授Jim Clark产生了用专用集成电路技术实现3D图形绘制处理器的设想,然后与其学生创立了SGI公司,并于1984年开发出了世界上第一个通用图形工作站IRIS 1400。
图注:SGI公司,是技术计算和可视化计算无可争议的领军者
第二代高端通用图形工作站的功能特征包括三角形的Gouraud明暗处理、Phong光照模型和硬件Z-Buffer算法。图象的真实感显著改善,几何变换及扫描转换性能大幅提高。第三代出现于1992年下半年,代表产品是SGI的Reality Engine。它增加了纹理映射及全屏幕反走样,为通用图形工作站用于户外视景模拟打开了大门。
简单来说最初的硬件支持的3D图形绘制可以划分成几何处理和光栅化处理两个阶段。几何处理阶段包括了坐标变换、裁剪、光照计算等,光栅化处理则包含了扫描转换、采用Z-Buffer算法的隐藏面移去、纹理映射等。显然,要使系统的性能最佳就必须使这两个处理阶段具有相匹配的处理能力。3D图形生成的计算量非常巨大,即使最快的通用CPU也难以胜任。
GPU概念提出之前经典的图形硬件
●图形处理芯片出现,市场呈现群雄逐鹿
在GPU概念没有提出之前,图形处理芯片是显卡的心脏,可以说,一款显卡使用的图形处理芯片基本决定了这块显卡的性能和档次。当时有能力生产图形芯片的公司主要有ATI、NVIDIA、3DFX、S3、MATROX、SIS、TRIDENT、STM等几家公司。而经过了显卡市场这几年激烈的竞争之后,不少原先的老牌如S3,3DFX等公司都倒下去了,Matrox、Trident等公司也是日渐衰落,如今只有NVIDIA和ATI可以说是春风得意,把持着民用市场的绝大部分份额和大部分专用市场。
在2D图形时代,ATI曾与OEM客户建立起了亲密的合作关系,同时ATI优质多媒体卡的声誉也在消费者之间广为流传。但进入90年代之后,电脑游戏的发展要求显卡拥有强劲的3D效能,这直接成就了3DFX和NVIDIA,ATI也没有放弃任何机会,Rage 128等产品成就了ATI在图形芯片市场上的活跃度。
图注:在图形芯片市场创造过辉煌过的部分厂商,你能回忆当时的岁月吗……
回过头来看这些年公司在GPU概念之前推出的图形芯片,大致上可以分为四代。
第一代图形芯片的代表S3 Virge系列、ATI的第一款3D芯片3D Rage、NVIDIA的第一代产品NV1和MATROX Mystique系列充斥了整个市场。但是,这四个系列的产品性能都不能令人满意,在配备了高端处理器的电脑中,有时软件加速的效果甚至比硬件加速的效果还要好。其中值得注意的是ATI的3D Rage输在兼容性方面,而NVIDIA的NV1采用的正方形成像技术虽然不错,没有获得微软在Windows 95中就制订的Direct3D多边形立体标准,最后走向失败。
第二代图形芯片的代表是3DFX Voodoo和NVIDIA RIVA128。从第二代起,图形芯片才进入了高速发展的黄金时期,图形芯片领域的发展速度是电脑界权威的摩尔定律的三倍——每六个月产品更新换代一次,性能提高一倍。
当默默无闻的3DFX推出划时代的图形加速卡——Voodoo之后,图形芯片的性能不能令人满意的现象才得到彻底改变。但是Voodoo早期的天价,为它和3DFX带来许多麻烦。Voodoo拥有每秒4500万的像素填充率,每秒100万个多边形的生成能力,支持双线过滤,板载4MB显示内存,这一切价值300美元。而且Voodoo还是一块纯3D加速卡,也就是说它必须和普通的2D显示卡配合使用。但是对于使用低像素填充率,没有过滤功能,2D和3D应用都共享可怜的1MB显存的低端显示卡的游戏玩家来说,高端的Voodoo芯片的出现无疑是个福音。
图注:挽救了NVIDIA的RIVA 128显卡
在竞争对手的打击下,NVIDIA为世嘉游戏机重新设计的NV-2芯片在没有开发完成就被世嘉放弃,加之NV-1并没有得到市场认可,NVIDIA顿时陷入崩溃边缘。但值得注意的是此时NVIDIA启用了极具天才的David Kirk(现为美国工程院院士、NVIDIA首席科学家),开始重新研制NV-3。NV-3的目标是成为当时最先进的图形芯片,并准备在一个芯片中集成优秀的2D和3D性能。在1997年快要结束的时候,NVIDIA终于发布了NV-3,也就是大家所熟悉的RIVA 128,RIVA 128主张128位的内存总线,在全速运行的时候可以达到100Mpixel/Sec,在非GLIDE API游戏性能中超过了当时风靡全球的3Dfx Voodoo。零售市场上,Diamond、STB、ASUS、ELSA和Canopus等等都相继推出了基于此芯片的产品,加上当时不少经典的GLIDE游戏转向微软的D3D阵营,这些都促使RIVA 128终于获得了市场的认可。
此时ATI也经历了一个痛苦的阶段,在同样比较失败的3D Rage之后,ATI真正意义上的第一款3D芯片3D Rage II诞生。此芯片支持双线性、三线性过滤、Z-buffer和一些Direct3D材质混和模式。但是像素过滤只是比S3的Virge略好,在当时来说是只能算一般。1997年2月,ATI发布了3D Rage II+DVD,这是第一块提供了硬件运动补偿的图形芯片,把CPU从软件播放DVD的繁重的工作中解放了出来,使ATI成为DVD加速领域的先行者。同年发布的3D Rage Pro芯片开始,ATI已经采用了当时业界领先的AGP总线。大批的OEM订单使ATI公司在1998年的收入也提高了一倍。
图注:多媒体显卡的开山之作ATI Rage 128
NVIDIA率先崛起,3DFX大势已去,ATI等待良机
第三代图形芯片的代表是3DFX Voodoo 2、NVIDIA TNT、ATI Rage 128、MATROX G200、S3 Savage3D;应该说,时至今日,使用前三代图形芯片的显卡产品已经绝迹,只能在收藏爱好者的仓库里看到它们的身影。其中TNT的推出向世人证实了强劲的3D性能不仅仅是3dfx的专利,在性能上RIVA TNT已经具备了挑战当时显卡之王Voodoo 2的实力。著名的“雷管”(Detonator)驱动也在RIVA TNT时代诞生,这表明NVIDIA注意到优良的驱动程序对充分发挥显示芯片性能的重要性。ATI开发的Rage 128虽然不是当时顶尖的,不过RAGE 128胜在各项性能指标都非常平均。多媒体方面,RAGE 128不仅在DVD动态插值补偿方面依然占据优势,更有支持VIVO和ALL-IN-WONDER的显卡版本。在当时看来,这已经算是功能非常强大的多媒体显卡,ATI逐渐做出了自己的特色。
第四代图形芯片的代表是3DFX Voodoo 3、NVIDIA TNT2、MATROX G400、S3 Savage4。经过这两次换代后,优秀的TNT2使得3DFX在图形加速市场上所占的比重下降了,影响也大不如前。到1999年底,采用TNT2系列芯片的显卡几乎抢占了近80%的显卡市场,NVIDIA第一次在市场份额以及性能上超过了对手3DFX。RIVA TNT2采用了0.25um工艺制造,标准版本运行于125MHz频率,支持32MB显存,支持32bit帧缓冲,支持DVI输出接口,峰值速度250Mpixels/Sec,更重要的是它代表了新一代显卡的特色:128位核心、支持AGP4X、支持32M显存。
图注:TNT2显卡使得NVIDIA首次坐上了市场占有率第一的王座
从TNT2开始NVIDIA对产品进行了市场化细分,在高中低端,面向多种不同的用户,TNT2芯片衍生出TNT2 Vanta、TNT2 M64、TNT2、TNT2 Pro、TNT2 Ultra等不同的型号产品,搭配不同显存的容量,产品线覆盖了大部分的市场。其中TNT2 Ultra是系列最高端产品,也是NVIDIA第一次使用Ultra后缀命名高端产品,TNT2 Ultra只是从NV6核心中挑选出的品质优秀的芯片,并搭配了速度最快的显存,其核心/显存频率高达150/183MHz,后期更是提高到175/200MHz,性能上超过了3DFX的Voodoo 3500以及MATROX的G400 Max。
图注:3DFX的绝唱——疯狂设计的Voodoo5 6000显卡
TNT2的出现,使得NVIDIA和3DFX之间的霸主之争天平发生了倾斜,Direct3D和OpenGL的广泛使用也使3DFX的Glide摇摇欲坠,3DFX的一意孤行终究得到了市场的抛弃。NVIDIA却凭借自身的努力和TNT系列产品的巨大成功登上了“图形加速芯片之王”的宝座。ATI则靠着ATI Rage 128一直将传统优势和市场份额延续下来。
Geforce 256诞生与GPU概念的提出
Geforce 256——代号NV10于1999年8月发布。这是图形芯片领域开天辟地的产品,也是第一款提出GPU概念的产品。Geforce 256所采用的核心技术有硬体T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬体T&L技术可以说是GPU概念形成的标志。
图注:Geforce 256显卡造就了GPU概念
1999年,已经凭借RivaTNT2在图形芯片界立足的NVIDIA,主动放弃帮自己打下江山的Riva品牌,新启用的Geforce强调力量并沿用至今,并衍生出驱动品牌Forceware及芯片组品牌nForce。
Geforce256之所以被称作GPU原因就在于Geforce256划时代的在图形芯片内部集成了T&L(几何光照转换)功能,使得GPU拥有初步的几何处理能力,彻底解决了当时众多游戏瓶颈发生在CPU几何吞吐量不够的瓶颈。Geforce 256显卡的出色表现,NVIDIA强大的技术实力得到全面释放,这块显卡是真正的全面领先型产品,而不是靠16bit色和32bit色的区域优势或者是单纯依赖特定的3D API支持。
T&L几何光照转换原先由CPU负责,或者由另一个独立处理机处理 (例如一些旧式工作站显视卡)。较强劲的3dfx Voodoo2 和 Rendition Verite显示核心已整合了几何(三角形)建构, 但硬件T&L仍是一大进步,原因是拥有该技术的显示核心从CPU接管了大量工作。硬件T&L单元让Geforce 256几乎成为一个全新的GPU标准,也让GPU更加独立自主。
在当时,曾经不可一世的3DFX Voodoo难以抵挡TNT2的攻势,最终被GeForce 256所终结。同时ATI选择在一年后也就是2000年推出Radeon(镭)品牌,从此开创了GPU领域的两强争霸。从此开始桌面图形市场已经演变成两家公司的表演。
● GeForce256系列产品 技术优势:★★★★★ 市场优势:★★★★
当时ATI用来对阵GeForce256的正是Radeon256,它提供了对DDR-RAM的支持,节省带宽的Hyper技术,完整地T&L硬件支持,Dot3,环境贴图和凹凸贴图,采用2管线,单管线3个材质贴图单元(TMU)特殊硬件架构。遗憾的是第三个贴图单元直到Radeon256退市的时候也没有任何程序支持它,同时由于驱动的不成熟,Radeon256并没有叫好又叫座。
图注:市场定位准确的Radeon标准版32M DDR显卡
但Radeon256毕竟打开了AIT公司的Radeon(镭)品牌,Radeon系列显卡除了同样拥有T&L外,具备ATI最先进的硬件几何变形,光照效果,和图象剪切等等功能使ATI Radeon在性能上完全可以与NVIDIA的旗舰产品一决高下。ATI和NVIDIA两大巨头之间的竞争也演化为Radeon和GeForce两大品牌的对决。
●Radeon256系列产品 技术优势:★★★ 市场优势:★★
不可否认在成功的背后,离不开微软推出的图形API——DirectX 7.0的鼎力支持。DirectX 7.0最大的特色就是支持T&L,在T&L问世之前,位置转换和灯光都需要CPU来计算,CPU速度越快,游戏表现越流畅。使用了T&L功能后,这两种效果的计算用显示卡的GPU来计算,这样就可以把CPU从繁忙的劳动中解脱出来。同时从另一个角度提升了GPU在PC系统中的地位。
图注:微软发布了当时最具影响力的图形API——DirectX 7.0
与NVIDIA GeForce 2系列显示芯片的详细划分一样,ATI也将Radeon根据当时的市场情况划分为多个版本,包括Radeon标准板、Radeon SE(高频版)、Radeon VE(双头显示)以及Radeon LE(取消了Hyper-Z技术)。可以说Radeon是ATI跨入DirectX 7.0时代后最成功的一款显示芯片,同时今后的ATI产品也延用“Radeon”来命名。
借助GeForce 256巨大的影响力,2000年5月,NVIDIA终于发布了新一代旗舰显卡,因为代号NV15的GPU拥有1.6Giga Texels/sec纹理填充率,所以NVIDIA将这个标志性的参数缩写为GTS,显卡全称为GeForce2 GTS。
图注:曾今的高端卡GeForce2 GTS架构特色
GeForce2 GTS首次采用了0.18微米工艺制程,由TSMC制造的GeForce2 GTS(0.18微米,564 PBGA 封装)中,晶体管数目已经增加到了2500万,工作频率也首次提高到200Mhz,显存方面搭配了32MB 166Mhz DDR SDRAM内存,GeForce2与上一代比起来最大不同的地方在于:增强的第二代T&L引擎,性能提升幅度达30%,填充速度也增加到1.6GTexel/s,这也是首款填充速度过亿的图形加速器,像素填充速度的增加主要是由原来的每管线单个TMU(纹理单元)增加到两个,GeForce显卡共有4条管线,所以200Mhz x 4 x 2=1.6GTexel/s。
严格来说,GeForce2 GTS并不是一款全新架构的显卡,仅仅是对上代产品GeForce 256的升级改良版。但这种改良收到奇效,这种改良更多的是针对市场的需求做出应变,由GeForce2 pro、GeForce2 Ultra、GeForce2 TI、GeForce2 MX、GeForce2 GO构成了丰富的产品线。
其中最为重要的产品就是2000年6月向低端市场推出的NV11核心GeForce2 MX显卡,这款显卡曾经在一段时间内统治了整个低端市场,即使到GeForce 3显卡推出,仍在市场热卖。同时GeForce2 MX也为NVIDIA与ATI争夺市场的时候增加了筹码。而高端产品GeForce 2 Ultra以更强的电气性能和核心显存频率牢固占据了性能宝座,也代表了DirectX 7时代GPU的顶级性能。
●GeForce2系列产品 技术优势:★★★★市场优势:★★★★
DirectX 8时代两强争霸、你追我赶
面向图形计算,让GPU逐渐找到了自己的方向,那就是给予用户更真更快地视觉体验,但是GPU架构也遇到一些问题亟待解决。首要问题就是,要实现更加复杂多变的图形效果,不能仅仅依赖三角形生成和固定光影转换,虽然当时游戏画面的提高基本上都是通过大量的多边形、更复杂的贴图来实现的。
但后期的发展中,顶点和像素运算的需求量猛增。每个顶点都包含许多信息,比顶点上的纹理信息,散光和映射光源下表现的颜色,所以在生成多边形的时候带上这些附加运算,就可以带来更多的效果,但这也更加考验顶点和像素计算能力。研究人员发现,同硬件T&L仅仅实现的固定光影转换相比,VS和PS单元的灵活性更大。
2001年从DirectX 8发布开始,Shader Model(渲染单元模式)在DirectX体系中的地位就日趋重要,其版本和渲染单元的规格也成为了决定显卡性能高低的关键因素。第一个实践DirectX 8可编程特性的是NVIDIA Geforce3 Ti图形卡。这片代号NV15的Geforce3 GPU首次在内部加入了Pixel Shader处理器和Vertex Shader处理器。为了保险起见,Geforce3内部还同时保留了T&L硬连线为老游戏提供最佳的执行效率。
图注:UT2003场景
Shader概念的提出,意味着程序员可通过它们实现3D场景构建的难度大大降低。通过VS和PS的渲染,可以很容易的宁造出真实的水面动态波纹光影效果。此时DirectX的权威地位终于建成。
Pixel Shader(顶点着色器)和Vertex Shader(像素着色器)硬件逻辑,真正支持像素和顶点的可编程。虽然当时可编程性很弱,硬件限制太多,顶点部分出现可编程性,像素部分可编程性有限。但这的确是硬件T&L之后PC图形技术的又一重大飞跃。3D娱乐的视觉体验也因此向接近真实迈进了一大步,波光粼粼的水面是那个时期用于演示Shader能力的典型DEMO,相比之下DirectX 7绘制的水面效果就单调得多。
Shader单元概念提出之后,无论NVIDIA还是ATI,都在做强显卡前端(Setup Engine及其相关部分,如光栅器Rasterizer、设定Setup和顶点装配器Vertex Assembler)的同时,逐渐将竞争重点放在显卡核心部分——Pixel Shader(顶点着色器)和Vertex Shader(像素着色器),无论是Radeon 8500还是Geforce Ti 4200都内置的规格和频率更强的PS和VS单元。同时显卡的后端ROP(光栅化引擎,负责完成像素的输出)也逐渐强大,各种各样的多重采样AA模式和更高的抗锯齿模式逐步得以实现。
在此基础上,GPU的负担从以前的纹理和像素填充率方面,逐渐开始转向Shader的执行能力。在DirectX 8时代诞生了一系列经典显卡,同时ATI在DirectX 7的不利局面得到逆转。而曾今的3DFX、MATROX、SIS、TRIDENT等厂商,或被收购或再也没有能力登台表演,GPU领域的两强争霸在DirectX 8时代彻底确立。
图注:NVIDIA公司的创始人黄仁勋先生和ATI公司的创始人何国源先生
1963年,黄仁勋出生于中国台北。1983年,黄仁勋大学毕业后毫不犹豫地搬到硅谷,并应聘AMD公司,成为一名芯片设计工程师,两年后跳槽到偏向于图形处理的芯片商LSI Logic。在职期间苦读6年后成为斯坦福电子工程硕士。1993年1月,NVIDIA正式成立,作为创始人之一的他担任NVIDIA首席执行官。
1950年,何国源出生在广东省新会地区。1974年,何国源大学毕业回到香港,在那里找到了他平生第一份正式工作。何国源的第一份工作是在“Control Data”电脑公司做部门主管。1983年,何国源决定去加拿大发展之前,年轻的他在王氏电子公司已经做到了总经理。1985年,何国源和另外两名香港移民Benny Lau(产品开发副总裁)和Lee Lau(策略计划副总裁)共同创建的ATI(Array Technology Inc)。公司在多伦多北部的万锦市宣告成立。
2001年2月,NVIDIA终于发布了具有划时代意义的GeForce 3。Geforce 3采用0.15微米工艺制程,在晶体管数量上多达5700万个,这个数据整整是RIVA 128显卡的8倍,已经超高当时最强的P4处理器4200万个。GeForce 3拥有4个Pixel Shader和1个Vertex Shader(顶点处理单元)。同时,NVIDIA为游戏开发者提供了完整的Geforce架构开发工具,允许游戏开发者编制他们自己的程序来控制像素的效果,给游戏和应用开发者带来了极大的方便。
图注:高端GeForce 3 Ti 500显卡
●GeForce 3 Ti系列产品 技术优势:★★★★ 市场优势:★★★★
微软在2002年对DirectX 8.0进行升级诞生了DirectX 8.1,新标准对VS和PS的渲染加强,增加对大纹理水波纹的处理效果,新的DirectX 8.1使你获得更好的图像显示质量,使多人游戏更具可伸缩性,以及包括更优异的音频效果。ATI则利用这个机会,通过代号R200的Radeon 8500显卡首次超过了NVIDIA的GeForce 3。在当时,做工优秀、画面显示质量出色的Radeon 8500显卡成为业界公认性能最出色的显卡,一举超越了压制NVIDIA的Geforce 3 Ti系列显卡。
图注:同为高端定位的Radeon 8500
●Radeon 8500系列产品 技术优势:★★★★★ 市场优势:★★★★
代号R200的Radeon 8500的基本结构与当时的其他显卡差不多;它拥有四个像素单元,每个像素单元拥有两个纹理单元。它亦支持DirectX 8.1的顶点着色引擎和像素着色引擎,它的两个顶点着色引擎被称为Charisma Engine II,为新的顶点着色程序和旧的DirectX 7硬件T&L都提供出色的效能。Radeon 8500支持像素着色器版本1.4,相对1.x版本的设计,这个修订版本是意义重大的。鉴于PS1.2和1.3只是PS1.1的改进版, 8500拥有第一和唯一的ATI硬件加速细分曲面绘图引擎,名为“Truform”,这个引擎通过十年的艰难发展后,最终成为我们在HD5870显卡中看到的Tessellation引擎。
但是回头看DirectX 8时代的GPU,我们发现无论是NVIDIA还是ATI,都没有推出一款低端产品,而巨大的低端市场正面临产品断档的危险。
2001年,在高端产品Radeon 8500之前,ATI发布了Radeon 7000系列显卡,因为这一系列显卡已经是ATI的第七代产品了。Radeon 7000系列总共有两款芯片,高端的R100(7200)和低端的RV100(7000)都使用了0.18微米工艺制造,拥有三千万晶体管,支持DirectX 7。这种以RV代表低端产品的做法被沿用至今。
图注:深受消费者喜爱的Radeon 7500代表了当时最高的性价比
●Radeon 7500系列产品 技术优势:★★★ 市场优势:★★★★★
Radeon 7500是款特别的显卡,核心代号为RV200,因为它是与ATI下一代的8500(R200)一同发布的,但仅支持DirectX 7。客观的讲,作为DirectX7平台下的Radeon7500带给我们的是与GeForce2 TI同等的性能,而且它还具备其他的特点,比如超高的芯片运行频率及显存带宽、Hydra Vision双头显示、优秀的视频流回放与2D显示画面等,更重要的是它有一个吸引人的价格。
总体来说,Radeon 7500等经典显卡为ATI打下了低端和中端市场,市场份额渐渐接近NVIDIA。Radeon 8500在此时也诞生了大量的衍生物,他们包括9000、9100、9200、9250等等,规格型号甚至令人眼花缭乱。
图注:巩固性能王位的GeForce4 Ti 4600高端显卡
●GeForce4 Ti系列产品 技术优势:★★★★ 市场优势:★★★☆
面对竞争对手ATI的步步紧逼,GeForce4 Ti于2002年2月应运而生。GeForce4 Ti基于改良版本的TSMC 0.15微米工艺,采用了最新nfiniteFX II引擎,Vertex Shader增加至2个。在高工作频率下,使得GeForce4 Ti的处理能力有可能高于GeForce3将近三倍。而在全屏反锯齿方面,GeForce4 Ti采用新的Accuview AA技术,改善了取样方式并且优化了渲染的过程,可以进一步保证在高分辨率下的显示速度。显存带宽也一直是制约显卡性能的瓶颈,GeForce4 Ti为了摆脱瓶颈的限制,引入了LightSpeed Memory Architecture II(LMA II)光速显存构架II技术,它的原理就是优化渲染过程和压缩技术的采用。
GeForce4 Ti的性能领先程度巨大让ATI根本无力翻身,同时它完整支持DirectX 8.1也让NVIDIA在GPU着色器规格上没有任何遗憾。聪明的NVIDIA顺势推出了GeForce4 Ti4600、TI4400、Ti4200以及GeForce4 MX,其中最受用户欢迎的就是GeForce4 Ti4200,这是NVIDIA首次尝试高端产品低成本化(只有频率区分,没有架构改动),结果大获成功,持续热卖至2004年。
图注:在低端显卡市场,GeForce4 MX系列取得了骄人战绩
●GeForce4 MX系列产品 技术优势:★★★ 市场优势:★★★★★
而面向低端用户的GeForce4 MX更是由于对手产品线的空缺,这款显卡采用的核心实际上是GeForce 2 Ti,而显存控制器和抗锯齿功能则属于GeForce 4 Ti系列,虽然只支持DirectX 7,但它迅速取代GeForce 2 MX,创造了当时最好销量,成为最受欢迎的产品。
Radeon 9700开启DirectX 9.0时代,NVIDIA深陷泥潭
●DirectX 9.0带给业界的震撼
随后到来的DirectX 9.0时代,让Shader单元具备了更强劲的性能。2002年底微软发布的DirectX 9.0中,PS单元的渲染精度已达到浮点精度,传统的硬件T&L单元也被取消。全新的Vertex Shader(顶点着色引擎)编程将比以前复杂得多,新的Vertex Shader标准增加了流程控制和更多的常量,每个程序的着色指令增加到了1024条。
PS 2.0具备完全可编程的架构,能对纹理效果即时演算、动态纹理贴图,还不占用显存,理论上对材质贴图的分辨率的精度提高无限多;另外PS1.4只能支持28个硬件指令,同时操作6个材质,而PS2.0却可以支持160个硬件指令,同时操作16个材质数量,新的高精度浮点数据规格可以使用多重纹理贴图,可操作的指令数可以任意长,电影级别的显示效果轻而易举的实现。
图注:3D Mark 03第四项游戏测试Mother Nature
基于Shader Model 2.0的3D Mark 03第四项游戏测试Mother Nature,对Shader单元运算复杂度和材质大小提出非常严苛的要求,当时只有高端显卡才能流畅通过该测试。
VS 2.0通过增加Vertex程序的灵活性,显著的提高了老版本(DirectX 8)的VS性能,新的控制指令,可以用通用的程序代替以前专用的单独着色程序,效率提高许多倍;增加循环操作指令,减少工作时间,提高处理效率;扩展着色指令个数,从128个提升到256个。
最重要的一点改进是增加对浮点数据的处理功能,以前GPU只能对整数进行处理,改进后提高渲染精度,使最终处理的色彩格式达到电影级别。Shader Model 2.0时代突破了以前限制PC图形图象质量在数学上的精度障碍,它的每条渲染流水线都升级为128位浮点颜色,让游戏程序设计师们更容易更轻松的创造出更漂亮的效果。
如果说DirectX 8中的Shader单元还是个简单尝试的话,DirectX 9中的Shader则成为了标准配置。除了版本升级到2.0外,DirectX 9中PS单元的渲染精度已达到浮点精度,硬件T&L单元也成为历史的产物被取消,在较低DirectX版本游戏运行时会使用VS单元模拟执行硬件T&L单元的功能。
●两家厂商的不同命运
从DirectX 9开始,PC显卡业界由三名大佬掌权,它们是微软、ATI和NVIVIA。其中,微软担任3D API软件发展商的角色,不断更新DirectX应用程序接口,其它两个显卡厂商则紧紧跟随,推出相应的硬件产品,它们都想在未来的DX 9市场中称霸,但却遇到了不同的待遇。
实际上现在理性回顾当时的场景,ATI抢先发布了代号R300的Radeon 9700,不过,它发布时的DX9未完善,微软则会在最终版中加入VS(Vertex Shader,顶点描影)2.0、PS(Pixel Shader,像素描影)3.0。NVIDIA为了支持更多特性而延迟了NV30的发布,可惜它始终未能支持完整的VS 3.0/PS 3.0特性。
总之,ATI和NVIDIA都不可能实现真正的DX 9,这是由两个厂商一手造成的。ATI发布Radeon 9700时,选择了VS 2.0/PS 2.0,NVIDIA选择了VS 2.0/PS 3.0。ATI和NVIDIA的分歧严重影响了DX的发展,甚至连OpenGL 2.0也受到牵连,微软则想取得领导地位,一直采取拖沿策略,以便保持自己在3D API的优势,借以打击OpenGL。
图注:Radeon 9700以最快速度开启了DirectX 9时代,并长期占据了性能宝座
●Radeon 9700系列产品 技术优势:★★★★★ 市场优势:★★★★☆
但是ATI选择的是产品的发布速度,它坚信战场上兵贵神速。所以在NVIDIA沉浸于GeForce4 Ti带来的全盛时,ATI于2002年7月发布了首款支持DirectX 9的GPU——Radeon 9700。首款DX9图形芯片,256Bit的显存位宽,9700凭借8条管线理所当然的坐上了3D之王的宝座。
由Radeon 9700衍生出的中端产品也吸引了消费者的眼球。当年9500显卡上演的改造风波也被传为佳话,9500黄金版(4管线可改8管线,128MB 256Bit显存;普通9500为4管线可改8管,64MB 128Bit显存)的知名度甚至要盖过9700。
直到年末,准确地说是在2002年11月18日,Comdex 2002上,NVIDIA发布了研发代号NV30的GeForce FX,“FX”代表NVIDIA收购3DFX之后的首款作品。这款产品拥有当时最大的功耗,最夸张的散热器设计,多项半导体行业领先技术,却因为一些细节方面导致了GeForce FX的全盘皆输。
种种迹象都表明,GeForce FX 5800 Ultra是一款失败的产品,12层PCB以及GDDR2显存带来的高额成本,以及高噪音高功耗的表现使得GeForce FX 5800 Ultra在于ATI Radeon 9700 Pro的竞争中败下阵来,受到自身4x2流水线架构以及性能低下的Shader执行效率限制,导致3D性能上GeForce FX 5800 Ultra也得不到半点好处。为了弥补高端市场上的失策,NVIDIA针对主流市场以及低端市场积极的推出了NV30的精简版本NV31、NV34,即GeForce FX5600以及FX5200,可惜架构仍然继承了NV30的高频低能。
图注:GeForce FX 5800 Ultra
由于晶体管数达到创纪录的1.25亿个,惊人的500MHz默认频率,致使NVIDIA不得不为GeForce FX 5800 Ultra搭配“FX Flow”的散热系统,它包含一个铜制散热片、热管和换气装置。
●GeForce FX5800系列产品 技术优势:★★★ 市场优势:★★★
Radeon 9700成为了ATI最成功的一代显卡,而NVIDIA随后推出Geforce FX系列则是NV最受争议的一代显卡。无论高中低端,R300架构造就的ATI显卡在竞争中都取得明显的优势。但R300架构也拥有明显的不足。R300芯片本身是32位和24位混合型的,内核像素描影器是FP24,而纹理寻址操作和顶点描影管道是FP 32。R300在像素描影管道中有24位内部浮点精度,而代号NV30的Geforce FX系列支持IEEE-32(S23e8)浮点精度,比DX9更精确。
但R300的市场把握水平要明显强于NV30,最后带来了ATI的胜利。这一优势持续了两年多,市场份额资料称,2004年ATI占了全球独立图形芯片出货量的一半儿还多。ATI终于成为第一大独立图形芯片厂商,成功超越了NVIDIA。
Radeon 9700的先进架构造就了它的高效率。在普遍\情况下,它能比昔日的王者GeForce4 Ti 4600快大约15-20%。但是,当运行抗锯齿(AA)和
展开阅读全文