NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧

上傳人：1*** IP屬地：江蘇上傳時(shí)間：2023-09-20 格式：DOCX 頁數(shù)：57 大?。?.97MB 積分：12 舉報(bào) 版權(quán)申訴

NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧_第2頁

NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧_第3頁

NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧_第4頁

NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧_第5頁

已閱讀5頁，還剩52頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

NVIＤＩA/ＡＴI命運(yùn)轉(zhuǎn)折GＰU十年進(jìn)展回顧前言：當(dāng)今半導(dǎo)體領(lǐng)域,只有一種芯片能以３倍于摩爾定律的速度進(jìn)展,只有一種芯片能夠在ＰＣ領(lǐng)域挑戰(zhàn)甚至超越同時(shí)期生產(chǎn)的CPU產(chǎn)品,只有一種芯片讓圖形業(yè)界的創(chuàng)作者和很多游戲玩家為之瘋狂,這就是GＰU(GｒapｈicProcｅssinｇUnit），中文譯名:圖形處理器.NＶＩDIA公司在19９9年發(fā)布GｅFｏrce２56圖形處理芯片時(shí)首先提出GPU的概念，隨后大量簡(jiǎn)潔的應(yīng)用需求促使整個(gè)產(chǎn)業(yè)蓬勃進(jìn)展至今。今日筆者將用最精煉的文字，為各位讀者敘述這1０年的ＧPＵ進(jìn)展的主要路徑，讀者可以跟隨下面的文字將自己置于當(dāng)時(shí)的市場(chǎng)背景下，體會(huì)各種經(jīng)典產(chǎn)品和先進(jìn)技術(shù)帶給我們的震撼。計(jì)算機(jī)圖形學(xué)誕生具有重要意義利用計(jì)算機(jī)實(shí)現(xiàn)圖形生成,或者說地通俗一些實(shí)現(xiàn)圖像的繪制，是科學(xué)家們長(zhǎng)期的幻想。我們無法追溯最初這個(gè)想法的提出者和簡(jiǎn)略細(xì)節(jié),但是我們還是查閱到了一個(gè)人和一門學(xué)科。這個(gè)人是聞名科學(xué)家-—伊凡?蘇澤蘭先生，這門學(xué)科則是當(dāng)今計(jì)算機(jī)領(lǐng)域最熱門的專業(yè)-—計(jì)算機(jī)圖形學(xué)（ComputｅrGraｐhiｃs，簡(jiǎn)稱ＣＧ)。?

圖注：ＩvanＳutheｒｌaｎd博士196２年在演示中最初的“畫板"程序。１962年,麻省理工學(xué)院的一位青年博士討論生提交了論文并發(fā)言,他就是伊凡?蘇澤蘭(IｖanSｕtheｒlａｎd）.蘇澤蘭用幻燈向與會(huì)者展現(xiàn)了畫板程序，蘇澤蘭和他所展現(xiàn)的程序最終成為計(jì)算機(jī)圖形學(xué)的奠基。而今他已72歲高齡,仍然奮斗在圖形業(yè)界最前沿，現(xiàn)為Suｎ公司討論員和副總裁。計(jì)算機(jī)圖形學(xué),是一種使用數(shù)學(xué)算法將二維或三維圖形轉(zhuǎn)化為計(jì)算機(jī)顯示器的柵格形式的科學(xué)。簡(jiǎn)潔地說，計(jì)算機(jī)圖形學(xué)的主要討論內(nèi)容就是討論如何在計(jì)算機(jī)中表示圖形、以及利用計(jì)算機(jī)進(jìn)行圖形的計(jì)算、處理和顯示的相關(guān)原理與算法。圖形學(xué)處理需要計(jì)算機(jī)天然具備大量并行運(yùn)算能力，并且對(duì)精度和運(yùn)算強(qiáng)度有很高要求,但是這給當(dāng)時(shí)的計(jì)算機(jī)提出了巨大的難題,由于硬件進(jìn)展的嚴(yán)重滯后，計(jì)算機(jī)圖形學(xué)在提出后的20年內(nèi)始終困難前行。?圖注:最初的poｎｇ街機(jī)，將電子娛樂從概念推向?qū)嶋H在１972年,計(jì)算機(jī)圖形學(xué)的進(jìn)展直接促成了一個(gè)讓一般用戶感愛好的游戲產(chǎn)品——Ponｇ街機(jī)，這是第一款家庭電視游戲產(chǎn)品,也是首款真正取得成功并影響深遠(yuǎn)的視頻游戲，實(shí)際上這就是一個(gè)簡(jiǎn)潔的乒乓撞球游戲，但它幾乎成為電子娛樂領(lǐng)域的始祖。當(dāng)Pｏng成為遍布街頭巷尾的街機(jī)時(shí),越來越多的廠商也開頭關(guān)注并設(shè)計(jì)自己的電子娛樂產(chǎn)品。同樣對(duì)計(jì)算機(jī)圖形學(xué)提出需求的,還有一些工業(yè)設(shè)計(jì)領(lǐng)域,如計(jì)算機(jī)幫助設(shè)計(jì)（ＣomｐuteｒAｉdedDｅsｉｇn)，通稱CAD。CAＤ的消滅使情況發(fā)生根本性的轉(zhuǎn)變，１9７4年美國波音飛機(jī)制造公司第一架音747客機(jī)試飛成功，這架客機(jī)的設(shè)計(jì)圖紙全部重量竟有幾十噸重，如果沒有CＡＤ設(shè)計(jì)技術(shù)，這么浩大的制圖工程量,用人工來做是無法想象的.在２0世紀(jì)80年月,逐漸消滅了專門進(jìn)行圖形計(jì)算的硬件,它們是ＧＰU的前生,這極大的加速了計(jì)算機(jī)圖形學(xué)的進(jìn)展進(jìn)程。八十年月以前主要在軍事領(lǐng)域討論進(jìn)展，其應(yīng)用目標(biāo)是各類軍用運(yùn)輸工具仿真模擬器的視景生成系統(tǒng)。八十年月早期,斯坦福高校教授ＪimClａrk產(chǎn)生了用專用集成電路技術(shù)實(shí)現(xiàn)3D圖形繪制處理器的設(shè)想，然后與其同學(xué)創(chuàng)立了ＳGI公司，并于198４年開發(fā)出了世界上第一個(gè)通用圖形工作站ＩＲＩS140０。?圖注：SGI公司，是技術(shù)計(jì)算和可視化計(jì)算無可爭(zhēng)議的領(lǐng)軍者其次代高端通用圖形工作站的功能特征包括三角形的Gｏurauｄ明暗處理、Pｈoｎg光照模型和硬件Z－Bufｆer算法.圖象的真實(shí)感顯著改善，幾何變換及掃描轉(zhuǎn)換性能大幅提高。第三代消滅于1９92年下半年，代表產(chǎn)品是ＳGI的ＲeａliｔyＥnｇine。它增加了紋理映射及全屏幕反走樣，為通用圖形工作站用于戶外視景模擬打開了大門。簡(jiǎn)潔來說最初的硬件支持的3D圖形繪制可以劃分成幾何處理和光柵化處理兩個(gè)階段.幾何處理階段包括了坐標(biāo)變換、裁剪、光照計(jì)算等，光柵化處理則包含了掃描轉(zhuǎn)換、采納Ｚ-Buffｅｒ算法的隱藏面移去、紋理映射等。顯然，要使系統(tǒng)的性能最佳就必須使這兩個(gè)處理階段具有相匹配的處理能力。３D圖形生成的計(jì)算量格外巨大，即使最快的通用CPU也難以勝任。3184

第2頁:GPU概念提出之前經(jīng)典的圖形硬件GＰU概念提出之前經(jīng)典的圖形硬件●圖形處理芯片消滅，市場(chǎng)呈現(xiàn)群雄逐鹿在GPＵ概念沒有提出之前，圖形處理芯片是顯卡的心臟,可以說,一款顯卡使用的圖形處理芯片基本決定了這塊顯卡的性能和檔次。當(dāng)時(shí)有能力生產(chǎn)圖形芯片的公司主要有ＡTI、NVIDIA、3DFX、Ｓ3、ＭＡＴＲＯX、ＳIS、TRIＤＥNＴ、ＳTM等幾家公司。而經(jīng)過了顯卡市場(chǎng)這幾年激烈的競(jìng)爭(zhēng)之后,不少原先的老牌如Ｓ3,3DFX等公司都倒下去了，Mａt(yī)rox、Ｔｒidｅｎt等公司也是日漸衰落，如今只有NVIＤIA和ATＩ可以說是春風(fēng)得意，把持著民用市場(chǎng)的絕大部分份額和大部分專用市場(chǎng)。在2Ｄ圖形時(shí)代，ATＩ曾與OＥＭ客戶建立起了親密的合作關(guān)系，同時(shí)ATI優(yōu)質(zhì)多媒體卡的聲譽(yù)也在消費(fèi)者之間廣為流傳。但進(jìn)入90年月之后，電腦游戲的進(jìn)展要求顯卡擁有強(qiáng)勁的3Ｄ效能，這直接成就了３ＤＦX和ＮVIＤIＡ，ATI也沒有放棄任何機(jī)會(huì),Rage128等產(chǎn)品成就了ＡTＩ在圖形芯片市場(chǎng)上的活躍度。??圖注:在圖形芯片市場(chǎng)制造過輝煌過的部分廠商,你能回憶當(dāng)時(shí)的歲月嗎……回過頭來看這些年公司在GPＵ概念之前推出的圖形芯片，大致上可以分為四代.第一代圖形芯片的代表S3Vｉrｇe系列、ＡTI的第一款３D芯片3ＤRaｇe、NVIＤIA的第一代產(chǎn)品NＶ１和MＡTROＸＭyｓtｉqｕｅ系列充斥了整個(gè)市場(chǎng)。但是，這四個(gè)系列的產(chǎn)品性能都不能令人滿意，在配備了高端處理器的電腦中，有時(shí)軟件加速的效果甚至比硬件加速的效果還要好。其中值得注意的是AＴI的3ＤRａｇe輸在兼容性方面，而NVIDIＡ的ＮV１采納的正方形成像技術(shù)雖然不錯(cuò)，沒有獲得微軟在Windows95中就制訂的Direcｔ３D多邊形立體標(biāo)準(zhǔn),最后走向失敗。其次代圖形芯片的代表是3ＤＦXＶoodoo和ＮVIDIＡＲIVＡ１２８。從其次代起,圖形芯片才進(jìn)入了高速進(jìn)展的黃金時(shí)期,圖形芯片領(lǐng)域的進(jìn)展速度是電腦界權(quán)威的摩爾定律的三倍—-每六個(gè)月產(chǎn)品更新?lián)Q代一次，性能提高一倍。當(dāng)靜靜無聞的３ＤFX推出劃時(shí)代的圖形加速卡——Ｖooｄoｏ之后，圖形芯片的性能不能令人滿意的現(xiàn)象才得到徹底轉(zhuǎn)變。但是Ｖｏodｏｏ早期的天價(jià)，為它和３ＤＦX帶來很多麻煩。Vｏｏｄoｏ擁有每秒４50０萬的像素填充率，每秒100萬個(gè)多邊形的生成能力,支持雙線過濾,板載4MB顯示內(nèi)存,這一切價(jià)值３00美元。而且Voodoo還是一塊純３D加速卡，也就是說它必須和一般的2D顯示卡協(xié)作使用。但是對(duì)于使用低像素填充率,沒有過濾功能,2D和3D應(yīng)用都共享可憐的１MB顯存的低端顯示卡的游戲玩家來說，高端的Vｏoｄoｏ芯片的消滅無疑是個(gè)福音.?圖注：挽救了NVIDＩＡ的RIVA１２8顯卡在競(jìng)爭(zhēng)對(duì)手的打擊下,NＶIDIA為世嘉游戲機(jī)重新設(shè)計(jì)的NV－２芯片在沒有開發(fā)完成就被世嘉放棄，加之NＶ－1并沒有得到市場(chǎng)認(rèn)可，ＮＶIDＩA立刻陷入崩潰邊緣。但值得注意的是此時(shí)ＮＶIDＩＡ啟用了極具天才的DａvｉdKirk（現(xiàn)為美國工程院院士、NＶIDIＡ首席科學(xué)家)，開頭重新研制ＮＶ—３.NV－３的目標(biāo)是成為當(dāng)時(shí)最先進(jìn)的圖形芯片，并籌備在一個(gè)芯片中集成優(yōu)秀的２D和3D性能.在1９9７年快要結(jié)束的時(shí)候,NVＩＤＩＡ終究發(fā)布了ＮV-3，也就是大家所熟識(shí)的RIVA12８，ＲＩVA１２８主張１28位的內(nèi)存總線,在全速運(yùn)行的時(shí)候可以達(dá)到100Mｐixeｌ/Sｅｃ，在非GLＩDEAPＩ游戲性能中超過了當(dāng)時(shí)風(fēng)靡全球的3DfxVooｄoo。零售市場(chǎng)上，Diamｏnd、STB、ＡＳUＳ、ＥLSA和Cａｎｏｐus等等都相繼推出了基于此芯片的產(chǎn)品,加上當(dāng)時(shí)不少經(jīng)典的GＬIＤE游戲轉(zhuǎn)向微軟的D3D陣營(yíng)，這些都促使RIＶＡ１28終究獲得了市場(chǎng)的認(rèn)可。此時(shí)ＡＴI也經(jīng)歷了一個(gè)幸福的階段，在同樣比較失敗的3DＲagｅ之后,ＡTＩ真正意義上的第一款３D芯片3DRageＩI誕生。此芯片支持雙線性、三線性過濾、Z-bｕffer和一些Dｉrect3Ｄ材質(zhì)混和模式。但是像素過濾只是比S3的Vｉｒｇe略好,在當(dāng)時(shí)來說是只能算一般.１997年2月，ATI發(fā)布了3DRagｅＩI+ＤＶD，這是第一塊供應(yīng)了硬件運(yùn)動(dòng)補(bǔ)償?shù)膱D形芯片，把CPU從軟件播放ＤVD的繁重的工作中解放了出來，使AＴI成為DＶD加速領(lǐng)域的先行者。同年發(fā)布的3DRagｅPro芯片開頭，ATI已經(jīng)采納了當(dāng)時(shí)業(yè)界領(lǐng)先的ＡGP總線。大批的OEM訂單使ＡＴＩ公司在1998年的收入也提高了一倍.?圖注：多媒體顯卡的開山之作ATIRａge1２8?第３頁：NVＩDＩA、3ＤＦX、ATI三強(qiáng)爭(zhēng)霸NVＩDIA領(lǐng)先崛起,3ＤＦＸ大勢(shì)已去，ATI等待良機(jī)第三代圖形芯片的代表是3ＤFXＶoodoo2、NVＩDIAＴＮＴ、ＡTIＲａge１28、MATROＸG２００、S３Savａge3D；應(yīng)該說，時(shí)至今日,使用前三代圖形芯片的顯卡產(chǎn)品已經(jīng)絕跡,只能在保藏愛好者的倉庫里看到它們的身影。其中TNT的推出向世人證實(shí)了強(qiáng)勁的3D性能不僅僅是3dｆｘ的專利,在性能上RＩVATNT已經(jīng)具備了挑戰(zhàn)當(dāng)時(shí)顯卡之王Ｖｏoｄｏo2的實(shí)力。聞名的“雷管”（Dｅtonatoｒ）驅(qū)動(dòng)也在ＲIＶＡTNT時(shí)代誕生，這表明NVＩＤIA注意到優(yōu)良的驅(qū)動(dòng)程序?qū)Τ浞职l(fā)揮顯示芯片性能的重要性。AＴI開發(fā)的Ｒagｅ1２8雖然不是當(dāng)時(shí)頂尖的,不過ＲAＧE１28勝在各項(xiàng)性能指標(biāo)都格外平均。多媒體方面,RAＧE128不僅在ＤVＤ動(dòng)態(tài)插值補(bǔ)償方面仍然占據(jù)優(yōu)勢(shì),更有支持VＩＶO和ALL-IＮ—WＯNＤEＲ的顯卡版本.在當(dāng)時(shí)看來，這已經(jīng)算是功能格外強(qiáng)大的多媒體顯卡，ＡＴI逐漸做出了自己的特色.第四代圖形芯片的代表是3DＦXＶoodoo３、ＮVIDＩATNＴ2、MＡTRＯXG4０0、S3Ｓａｖage4。經(jīng)過這兩次換代后,優(yōu)秀的ＴＮＴ２使得3ＤＦＸ在圖形加速市場(chǎng)上所占的比重下降了，影響也大不如前。到１９99年底，采納TNＴ２系列芯片的顯卡幾乎搶占了近8０％的顯卡市場(chǎng)，NＶIDIA第一次在市場(chǎng)份額以及性能上超過了對(duì)手3ＤＦX。ＲIVＡＴNＴ2采納了0.2５um工藝制造,標(biāo)準(zhǔn)版本運(yùn)行于12５MＨz頻率，支持32MB顯存,支持３2ｂｉt幀緩沖，支持DＶI輸出接口,峰值速度2５０Mｐiｘelｓ/Sec,更重要的是它代表了新一代顯卡的特色：１28位核心、支持AGP4X、支持３2M顯存.??圖注：ＴＮT2顯卡使得NVIDIA首次坐上了市場(chǎng)占有率第一的王座從TＮT2開頭NVIDＩＡ對(duì)產(chǎn)品進(jìn)行了市場(chǎng)化細(xì)分，在高中低端,面對(duì)多種不同的用戶,TNＴ２芯片衍生出TNT2Ｖａｎｔa、TNT2M6４、ＴNＴ２、TNT2Prｏ、ＴNT2Ｕltra等不同的型號(hào)產(chǎn)品，搭配不同顯存的容量，產(chǎn)品線掩蓋了大部分的市場(chǎng).其中TＮT2Ultｒa是系列最高端產(chǎn)品，也是NＶIDIA第一次使用Ultra后綴命名高端產(chǎn)品，TNＴ2Ｕlｔｒａ只是從NV6核心中選擇出的品質(zhì)優(yōu)秀的芯片，并搭配了速度最快的顯存，其核心/顯存頻率高達(dá)150/１83MHz,后期更是提高到17５/２0０MHz，性能上超過了3ＤFＸ的Vｏodoo３50０以及MATRＯX的G400Ｍax。?圖注：3DFX的絕唱-—瘋狂設(shè)計(jì)的Vｏodoo５6０00顯卡ＴNT2的消滅，使得ＮVIDIA和3DFＸ之間的霸主之爭(zhēng)天平發(fā)生了傾斜,Dｉrecｔ３D和OｐｅnＧL的廣泛使用也使３DＦＸ的Gｌide搖搖欲墜，3DＦＸ的一意孤行終究得到了市場(chǎng)的拋棄.NVIDIＡ卻憑借自身的努力和TNT系列產(chǎn)品的巨大成功登上了“圖形加速芯片之王”的寶座。ATI則靠著ＡTIRaｇe１2８始終將傳統(tǒng)優(yōu)勢(shì)和市場(chǎng)份額連續(xù)下來。?第４頁：Ｇefｏrｃｅ2５6誕生與GＰU概念的提出Geｆorｃｅ256誕生與GPＵ概念的提出Gｅforcｅ２56——代號(hào)NＶ１0于１９９９年8月發(fā)布。這是圖形芯片領(lǐng)域開天辟地的產(chǎn)品，也是第一款提出GPU概念的產(chǎn)品。Ｇｅforce256所采納的核心技術(shù)有硬體T&Ｌ、立方環(huán)境材質(zhì)貼圖和頂點(diǎn)混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素２56位渲染引擎等,而硬體T＆Ｌ技術(shù)可以說是GPU概念形成的標(biāo)志。

圖注：Gｅｆorce256顯卡造就了GPU概念19９9年，已經(jīng)憑借ＲｉvａTNT２在圖形芯片界立足的ＮVIDIA，主動(dòng)放棄幫自己打下江山的Rivａ品牌，新啟用的Geforce強(qiáng)調(diào)力氣并沿用至今,并衍生出驅(qū)動(dòng)品牌Fｏｒcｅｗａre及芯片組品牌nForce。Ｇefoｒcｅ256之所以被稱作ＧPＵ緣由就在于Gｅfｏｒcｅ２５6劃時(shí)代的在圖形芯片內(nèi)部集成了Ｔ＆Ｌ(幾何光照轉(zhuǎn)換）功能，使得ＧＰＵ擁有初步的幾何處理能力，徹底解決了當(dāng)時(shí)眾多游戲瓶頸發(fā)生在CＰU幾何吞吐量不夠的瓶頸。Ｇeforce256顯卡的出色表現(xiàn),NVIＤＩＡ強(qiáng)大的技術(shù)實(shí)力得到全面釋放,這塊顯卡是真正的全面領(lǐng)先型產(chǎn)品，而不是靠16bit色和３2ｂiｔ色的區(qū)域優(yōu)勢(shì)或者是單純依靠特定的3DＡＰＩ支持.Ｔ&L幾何光照轉(zhuǎn)換原先由ＣPＵ負(fù)責(zé)，或者由另一個(gè)獨(dú)立處理機(jī)處理（例如一些舊式工作站顯視卡）。較強(qiáng)勁的３dfxＶoodｏo2和RenditｉoｎVeｒitｅ顯示核心已整合了幾何（三角形）建構(gòu)，但硬件T&Ｌ仍是一大進(jìn)步,緣由是擁有該技術(shù)的顯示核心從CＰU接管了大量工作。硬件Ｔ＆Ｌ單元讓Gefｏrｃe256幾乎成為一個(gè)全新的GPＵ標(biāo)準(zhǔn)，也讓GPU更加獨(dú)立自主.在當(dāng)時(shí),曾經(jīng)不行一世的3DFXVooｄoo難以抵抗TＮＴ2的攻勢(shì)，最終被GｅForcｅ2５6所終結(jié)。同時(shí)ATI選擇在一年后也就是2００0年推出Rａdeｏn（鐳)品牌，從今開創(chuàng)了ＧPU領(lǐng)域的兩強(qiáng)爭(zhēng)霸.從今開頭桌面圖形市場(chǎng)已經(jīng)演化成兩家公司的表演?！馟ｅＦorce2５6系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★★市場(chǎng)優(yōu)勢(shì):★★★★當(dāng)時(shí)AＴI用來對(duì)陣ＧｅForce２5６的正是Radeon2５6，它供應(yīng)了對(duì)DＤR—ＲAM的支持,節(jié)省帶寬的Hｙpｅｒ技術(shù)，完整地T&L硬件支持,Dｏt３,環(huán)境貼圖和凹凸貼圖，采納2管線，單管線３個(gè)材質(zhì)貼圖單元(ＴMU）特殊硬件架構(gòu).圓滿的是第三個(gè)貼圖單元直到Raｄeon25６退市的時(shí)候也沒有任何程序支持它,同時(shí)由于驅(qū)動(dòng)的不成熟，Radeon2５6并沒有叫好又叫座。?圖注:市場(chǎng)定位精準(zhǔn)的Radeon標(biāo)準(zhǔn)版32ＭDDR顯卡但Radｅoｎ256畢竟打開了AIT公司的Rａdｅon(鐳）品牌,Radeon系列顯卡除了同樣擁有T&L外，具備ATI最先進(jìn)的硬件幾何變形，光照效果，和圖象剪切等等功能使ＡＴＩRａdｅｏn在性能上完全可以與NVIDIA的旗艦產(chǎn)品一決高下。ＡTI和NVIDＩA兩大巨頭之間的競(jìng)爭(zhēng)也演化為Ｒadｅon和ＧeForｃe兩大品牌的對(duì)決?！馬adeoｎ256系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★市場(chǎng)優(yōu)勢(shì)：★★不行否認(rèn)在成功的背后,離不開微軟推出的圖形APＩ——DirectX７.０的鼎力支持。DirｅｃtX7．0最大的特色就是支持Ｔ＆L,在T＆L問世之前,位置轉(zhuǎn)換和燈光都需要ＣPU來計(jì)算,ＣＰU速度越快，游戲表現(xiàn)越流暢.使用了T＆L功能后，這兩種效果的計(jì)算用顯示卡的GPU來計(jì)算,這樣就可以把ＣＰU從繁忙的勞動(dòng)中解脫出來.同時(shí)從另一個(gè)角度提升了GPU在PC系統(tǒng)中的地位。?圖注：微軟發(fā)布了當(dāng)時(shí)最具影響力的圖形API——DiｒectX７.0與ＮVIDIAＧeＦｏrｃe２系列顯示芯片的簡(jiǎn)略劃分一樣，ＡＴＩ也將Rａdeｏn依據(jù)當(dāng)時(shí)的市場(chǎng)情況劃分為多個(gè)版本,包括Radｅon標(biāo)準(zhǔn)板、ＲaｄeonＳＥ（高頻版）、RａdeonVＥ（雙頭顯示）以及ＲａdｅｏnLE(取消了Ｈypｅｒ—Z技術(shù)）?？梢哉fＲadeoｎ是ＡTＩ跨入DｉrectＸ7.0時(shí)代后最成功的一款顯示芯片，同時(shí)今后的AＴI產(chǎn)品也延用“Rａdｅｏｎ”來命名。借助ＧeForce256巨大的影響力，2０00年5月，NＶIＤIA終究發(fā)布了新一代旗艦顯卡，由于代號(hào)ＮV１5的GPＵ擁有１．6GiｇaTeｘeｌｓ/ｓeｃ紋理填充率，所以ＮVIDＩA將這個(gè)標(biāo)志性的參數(shù)縮寫為GTS,顯卡全稱為GeＦｏｒce２GＴＳ。

圖注：曾今的高端卡GｅFoｒcｅ2ＧTS架構(gòu)特色GeFｏｒcｅ2GＴS首次采納了0。18微米工藝制程,由ＴSMC制造的GeFｏrce２GTＳ（0.18微米,564ＰBＧA封裝）中,晶體管數(shù)目已經(jīng)增加到了2500萬,工作頻率也首次提高到２00Mhz,顯存方面搭配了3２MB１66MhｚDDRSDRＡM內(nèi)存,GｅFoｒcｅ2與上一代比起來最大不同的地方在于：增強(qiáng)的其次代Ｔ&Ｌ引擎，性能提升幅度達(dá)3０％,填充速度也增加到1.6GTｅxeｌ／s,這也是首款填充速度過億的圖形加速器，像素填充速度的增加主要是由原來的每管線單個(gè)TMＵ（紋理單元）增加到兩個(gè),ＧeForｃe顯卡共有4條管線,所以200Ｍhｚx4x2=1。6ＧTeｘeｌ/s.嚴(yán)格來說，GeFｏrce2GTS并不是一款全新架構(gòu)的顯卡，僅僅是對(duì)上代產(chǎn)品GeFｏｒce25６的升級(jí)改良版。但這種改良收到奇效，這種改良更多的是針對(duì)市場(chǎng)的需求做出應(yīng)變，由GｅForce2ｐro、GeＦorcｅ２Uｌｔrａ、GeＦoｒce2TI、GeForce2ＭX、GeForｃe2GO構(gòu)成了豐富的產(chǎn)品線。其中最為重要的產(chǎn)品就是２０0０年6月向低端市場(chǎng)推出的NV１１核心ＧｅＦorｃｅ２MＸ顯卡，這款顯卡曾經(jīng)在一段時(shí)間內(nèi)統(tǒng)治了整個(gè)低端市場(chǎng)，即使到GｅForｃe3顯卡推出,仍在市場(chǎng)熱賣。同時(shí)GeFoｒcｅ2MX也為NVＩDIＡ與ＡTＩ爭(zhēng)奪市場(chǎng)的時(shí)候增加了籌碼。而高端產(chǎn)品GeForce2Ｕｌｔrａ以更強(qiáng)的電氣性能和核心顯存頻率堅(jiān)固占據(jù)了性能寶座，也代表了ＤｉreｃｔＸ7時(shí)代GPU的頂級(jí)性能?！瘢牵澹疲飏cｅ2系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★市場(chǎng)優(yōu)勢(shì)：★★★★24８ｅ

第5頁：ＤirectＸ8時(shí)代兩強(qiáng)爭(zhēng)霸、你追我趕ＤｉrectＸ8時(shí)代兩強(qiáng)爭(zhēng)霸、你追我趕面對(duì)圖形計(jì)算,讓GPU逐漸找到了自己的方向,那就是給予用戶更真更快地視覺體驗(yàn)，但是ＧPU架構(gòu)也遇到一些問題亟待解決.首要問題就是，要實(shí)現(xiàn)更加簡(jiǎn)潔多變的圖形效果，不能僅僅依靠三角形生成和固定光影轉(zhuǎn)換,雖然當(dāng)時(shí)游戲畫面的提高基本上都是通過大量的多邊形、更簡(jiǎn)潔的貼圖來實(shí)現(xiàn)的。但后期的進(jìn)展中，頂點(diǎn)和像素運(yùn)算的需求量猛增.每個(gè)頂點(diǎn)都包含很多信息，比頂點(diǎn)上的紋理信息，散光和映射光源下表現(xiàn)的顏色，所以在生成多邊形的時(shí)候帶上這些附加運(yùn)算，就可以帶來更多的效果，但這也更加考驗(yàn)頂點(diǎn)和像素計(jì)算能力。討論人員發(fā)現(xiàn)，同硬件T&Ｌ僅僅實(shí)現(xiàn)的固定光影轉(zhuǎn)換相比,VS和PS單元的靈敏性更大。?２001年從DirectX8發(fā)布開頭，ShaderModeｌ（渲染單元模式)在DiｒectX體系中的地位就日趨重要，其版本和渲染單元的規(guī)格也成為了決定顯卡性能凹凸的關(guān)鍵因素。第一個(gè)實(shí)踐ＤｉreｃｔＸ8可編程特性的是NＶIDＩAGｅｆorce3Ti圖形卡。這片代號(hào)ＮV１５的Ｇｅforｃe3ＧＰＵ首次在內(nèi)部加入了ＰiｘｅlShaｄｅr處理器和VeｒｔexShａｄｅｒ處理器。為了保險(xiǎn)起見，Ｇｅfｏrｃe3內(nèi)部還同時(shí)保留了T&L硬連線為老游戲供應(yīng)最佳的執(zhí)行效率。?圖注：ＵＴ2003場(chǎng)景Ｓｈａder概念的提出,意味著程序員可通過它們實(shí)現(xiàn)3D場(chǎng)景構(gòu)建的難度大大降低。通過VＳ和PＳ的渲染，可以很容易的寧造出真實(shí)的水面動(dòng)態(tài)波紋光影效果。此時(shí)DirｅctX的權(quán)威地位終究建成。PiｘelShａｄer(頂點(diǎn)著色器)和VerｔｅxSｈader（像素著色器)硬件規(guī)律,真正支持像素和頂點(diǎn)的可編程.雖然當(dāng)時(shí)可編程性很弱，硬件限制太多，頂點(diǎn)部分消滅可編程性，像素部分可編程性有限。但這的確是硬件T&L之后ＰC圖形技術(shù)的又一重大飛躍.3Ｄ娛樂的視覺體驗(yàn)也因此向接近真實(shí)邁進(jìn)了一大步,波光粼粼的水面是那個(gè)時(shí)期用于演示Sｈadｅr能力的典型DＥMO，相比之下ＤirｅｃｔＸ７繪制的水面效果就單調(diào)得多。Shａder單元概念提出之后，無論NVＩＤＩA還是ATＩ,都在做強(qiáng)顯卡前端(SetｕpEngine及其相關(guān)部分，如光柵器Ｒaｓterｉｚer、設(shè)定Setｕｐ和頂點(diǎn)裝配器VｅrtｅｘAssｅmbler）的同時(shí),逐漸將競(jìng)爭(zhēng)重點(diǎn)放在顯卡核心部分-—PｉxｅlShａder（頂點(diǎn)著色器)和VerｔｅxSｈａdeｒ(像素著色器),無論是Radｅoｎ8500還是GeforｃeTi42０0都內(nèi)置的規(guī)格和頻率更強(qiáng)的PS和ＶＳ單元。同時(shí)顯卡的后端ROP(光柵化引擎，負(fù)責(zé)完成像素的輸出)也逐漸強(qiáng)大，各種各樣的多重采樣ＡA模式和更高的抗鋸齒模式逐步得以實(shí)現(xiàn)。在此基礎(chǔ)上，GPU的負(fù)擔(dān)從以前的紋理和像素填充率方面,逐漸開頭轉(zhuǎn)向Ｓｈadｅｒ的執(zhí)行能力.在DiｒectX8時(shí)代誕生了一系列經(jīng)典顯卡,同時(shí)ATI在DirｅｃｔX7的不利局面得到逆轉(zhuǎn).而曾今的３DFＸ、MATROX、SＩS、TRIDENT等廠商,或被收購或再也沒有能力登臺(tái)表演,GＰU領(lǐng)域的兩強(qiáng)爭(zhēng)霸在ＤirectX８時(shí)代徹底確立。?圖注：ＮVIＤIＡ公司的創(chuàng)始人黃仁勛先生和ATＩ公司的創(chuàng)始人何國源先生1963年，黃仁勛誕生于中國臺(tái)北。１983年,黃仁勛高校畢業(yè)后毫不猶豫地搬到硅谷,并應(yīng)聘AMD公司，成為一名芯片設(shè)計(jì)工程師，兩年后跳槽到偏向于圖形處理的芯片商LSILｏgic.在職期間苦讀6年后成為斯坦福電子工程碩士.19９3年１月，ＮVＩＤIA正式成立,作為創(chuàng)始人之一的他擔(dān)當(dāng)NＶＩＤＩA首席執(zhí)行官。１9５０年，何國源誕生在廣東省新會(huì)地區(qū)。197４年，何國源高校畢業(yè)回到香港，在那里找到了他平生第一份正式工作。何國源的第一份工作是在“CoｎtroｌData”電腦公司做部門主管。198３年，何國源決定去加拿大進(jìn)展之前，年輕的他在王氏電子公司已經(jīng)做到了總經(jīng)理。1985年，何國源和另外兩名香港移民BennyLaｕ(產(chǎn)品開發(fā)副總裁)和LeｅLａu(策略計(jì)劃副總裁）共同創(chuàng)建的ＡTＩ（ArrayTechｎｏｌｏgｙＩnc）。公司在多倫多北部的萬錦市宣告成立。200１年2月，NＶIＤIA終究發(fā)布了具有劃時(shí)代意義的GeＦorce３.Gｅfｏrｃe3采納0．15微米工藝制程,在晶體管數(shù)量上多達(dá)5700萬個(gè),這個(gè)數(shù)據(jù)整整是RIVＡ１28顯卡的８倍,已經(jīng)超高當(dāng)時(shí)最強(qiáng)的Ｐ4處理器４２０0萬個(gè)。GeForcｅ3擁有4個(gè)ＰixelShａder和1個(gè)VeｒtｅxSｈadｅr（頂點(diǎn)處理單元）。同時(shí)，ＮＶIDIＡ為游戲開發(fā)者供應(yīng)了完整的Ｇeｆoｒcｅ架構(gòu)開發(fā)工具，允許游戲開發(fā)者編制他們自己的程序來掌握像素的效果，給游戲和應(yīng)用開發(fā)者帶來了極大的便利。?圖注:高端GｅＦorcｅ３Tｉ500顯卡●ＧｅForｃe３Ti系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★★市場(chǎng)優(yōu)勢(shì):★★★★微軟在2０0２年對(duì)ＤirｅctX8．0進(jìn)行升級(jí)誕生了ＤirecｔX８．１,新標(biāo)準(zhǔn)對(duì)VS和PS的渲染加強(qiáng),增加對(duì)大紋理水波紋的處理效果,新的DiｒｅctX8。1使你獲得更好的圖像顯示質(zhì)量,使多人游戲更具可伸縮性，以及包括更優(yōu)異的音頻效果。ＡＴI則利用這個(gè)機(jī)會(huì),通過代號(hào)R20０的Raｄeｏn８５０0顯卡首次超過了ＮVIDIＡ的GeForce3。在當(dāng)時(shí)，做工優(yōu)秀、畫面顯示質(zhì)量出色的Radｅｏｎ850０顯卡成為業(yè)界公認(rèn)性能最出色的顯卡，一舉超越了壓制NVIＤＩA的Ｇefｏrce3Ti系列顯卡.?圖注：同為高端定位的Radｅon８500●Radeon85０0系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★★★市場(chǎng)優(yōu)勢(shì)：★★★★代號(hào)Ｒ2０0的Ｒaｄｅon8５00的基本結(jié)構(gòu)與當(dāng)時(shí)的其他顯卡差不多；它擁有四個(gè)像素單元，每個(gè)像素單元擁有兩個(gè)紋理單元.它亦支持DｉrecｔX8。1的頂點(diǎn)著色引擎和像素著色引擎,它的兩個(gè)頂點(diǎn)著色引擎被稱為ChａrismaEnｇineIＩ，為新的頂點(diǎn)著色程序和舊的DｉrectＸ７硬件T＆L都供應(yīng)出色的效能。Rａdｅｏn８500支持像素著色器版本１．４,相對(duì)1。ｘ版本的設(shè)計(jì),這個(gè)修訂版本是意義重大的.鑒于PS１.2和１．3只是PS1.1的改進(jìn)版,850０擁有第一和唯一的ATI硬件加速細(xì)分曲面繪圖引擎，名為“Trｕforｍ"，這個(gè)引擎通過十年的困難進(jìn)展后，最終成為我們?cè)贖D58７0顯卡中看到的Tesseｌｌaｔioｎ引擎.但是回頭看DｉrｅcｔX８時(shí)代的GPU，我們發(fā)現(xiàn)無論是NVＩDIA還是ＡＴI,都沒有推出一款低端產(chǎn)品，而巨大的低端市場(chǎng)正面臨產(chǎn)品斷檔的危險(xiǎn)。200１年，在高端產(chǎn)品Rａdeｏn85０0之前，AＴI發(fā)布了Raｄeｏn7００0系列顯卡,由于這一系列顯卡已經(jīng)是ATＩ的第七代產(chǎn)品了。Radeoｎ7000系列總共有兩款芯片,高端的R100（７200)和低端的RＶ100(7000）都使用了0。18微米工藝制造,擁有三千萬晶體管,支持DiｒｅctＸ７。這種以RＶ代表低端產(chǎn)品的做法被沿用至今。

圖注：深受消費(fèi)者喜愛的Radeｏn7５０0代表了當(dāng)時(shí)最高的性價(jià)比●Rａｄeｏn75００系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★市場(chǎng)優(yōu)勢(shì):★★★★★Radｅon7500是款格外的顯卡,核心代號(hào)為ＲV200，由于它是與ATI下一代的８５0０（R20０)一同發(fā)布的，但僅支持DirectＸ7。客觀的講,作為DirectＸ7平臺(tái)下的Radｅｏｎ75０0帶給我們的是與ＧeＦｏｒｃe2ＴI同等的性能,而且它還具備其他的特點(diǎn),比如超高的芯片運(yùn)行頻率及顯存帶寬、ＨｙｄraVｉsiｏn雙頭顯示、優(yōu)秀的視頻流回放與２D顯示畫面等，更重要的是它有一個(gè)吸引人的價(jià)格?？傮w來說,Rａdeｏn75００等經(jīng)典顯卡為ＡTＩ打下了低端和中端市場(chǎng)，市場(chǎng)份額漸漸接近NＶIDＩＡ。Radｅｏn８5０0在此時(shí)也誕生了大量的衍生物，他們包括9０00、９１00、92００、９2５０等等,規(guī)格型號(hào)甚至令人眼花繚亂。?圖注:鞏固性能王位的GeForcｅ4Tｉ4600高端顯卡●ＧeFoｒcｅ４Tｉ系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★★市場(chǎng)優(yōu)勢(shì)：★★★☆面對(duì)競(jìng)爭(zhēng)對(duì)手ATI的步步緊逼，GeForce4Ti于2002年2月應(yīng)運(yùn)而生。ＧeＦorce４Ti基于改良版本的TSMC0。15微米工藝,采納了最新nfｉｎｉteＦＸII引擎，ＶertexＳｈader增加至2個(gè)。在高工作頻率下,使得GeForce４Ｔi的處理能力有可能高于GeFｏrｃe3將近三倍。而在全屏反鋸齒方面，ＧｅFｏｒce4Ｔi采納新的AｃcｕｖiewＡＡ技術(shù)，改善了取樣方式并且優(yōu)化了渲染的過程,可以進(jìn)一步保證在高分辨率下的顯示速度。顯存帶寬也始終是制約顯卡性能的瓶頸,GeＦorce４Ti為了擺脫瓶頸的限制,引入了LigｈｔＳｐeｅｄMｅmoｒｙArchiｔeｃtureＩI（LMＡＩI)光速顯存構(gòu)架IＩ技術(shù),它的原理就是優(yōu)化渲染過程和壓縮技術(shù)的采納。GeForce4Ｔi的性能領(lǐng)先程度巨大讓ATI根本無力翻身，同時(shí)它完整支持DireｃｔX8.１也讓NVＩDIA在GPＵ著色器規(guī)格上沒有任何圓滿.聰慧的NVＩDＩＡ順勢(shì)推出了ＧeＦｏrｃｅ4Ti4６０0、TI４40０、Ti420０以及ＧeFoｒce４MX，其中最受用戶歡迎的就是GｅForｃe4Ti4200，這是NVIDIA首次嘗試高端產(chǎn)品低成本化(只有頻率區(qū)分,沒有架構(gòu)改動(dòng))，結(jié)果大獲成功,持續(xù)熱賣至2004年。?圖注:在低端顯卡市場(chǎng),GｅFoｒce4MＸ系列取得了驕人戰(zhàn)績(jī)●GeFｏrce4ＭX系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★市場(chǎng)優(yōu)勢(shì)：★★★★★而面對(duì)低端用戶的ＧeForce4MX更是由于對(duì)手產(chǎn)品線的空缺,這款顯卡采納的核心實(shí)際上是GｅForce2Tｉ，而顯存掌握器和抗鋸齒功能則屬于GｅForｃe4Ti系列，雖然只支持DirｅｃｔＸ7，但它飛快取代GeFoｒce2ＭＸ,制造了當(dāng)時(shí)最好銷量，成為最受歡迎的產(chǎn)品。２６b８

第６頁:ＤiｒeｃtＸ9。０時(shí)代開啟Radeon９7０0開啟ＤirectＸ9。０時(shí)代，NVＩDIA深陷泥潭●DirｅcｔＸ9.0帶給業(yè)界的震撼隨后到來的DirectX９。０時(shí)代,讓Shader單元具備了更強(qiáng)勁的性能。2０02年底微軟發(fā)布的ＤirｅｃtＸ9．0中,PS單元的渲染精度已達(dá)到浮點(diǎn)精度，傳統(tǒng)的硬件Ｔ＆Ｌ單元也被取消。全新的VｅrtｅxShａder（頂點(diǎn)著色引擎)編程將比以前簡(jiǎn)潔得多，新的VeｒtexＳｈａdｅr標(biāo)準(zhǔn)增加了流程掌握和更多的常量，每個(gè)程序的著色指令增加到了1024條。ＰＳ2.0具備完全可編程的架構(gòu)，能對(duì)紋理效果即時(shí)演算、動(dòng)態(tài)紋理貼圖,還不占用顯存,理論上對(duì)材質(zhì)貼圖的分辨率的精度提高無限多;另外PS1.4只能支持28個(gè)硬件指令，同時(shí)操作6個(gè)材質(zhì)，而ＰS２。０卻可以支持１60個(gè)硬件指令，同時(shí)操作１6個(gè)材質(zhì)數(shù)量,新的高精度浮點(diǎn)數(shù)據(jù)規(guī)格可以使用多重紋理貼圖，可操作的指令數(shù)可以任意長(zhǎng),電影級(jí)別的顯示效果輕而易舉的實(shí)現(xiàn)。??圖注：3DMａrk03第四項(xiàng)游戲測(cè)試MｏtｈerＮaｔｕｒe基于ShaｄｅrMoｄｅl2.0的3DMark０３第四項(xiàng)游戲測(cè)試ＭｏtherＮａｔｕre，對(duì)Shaｄer單元運(yùn)算簡(jiǎn)潔度和材質(zhì)大小提出格外嚴(yán)苛的要求,當(dāng)時(shí)只有高端顯卡才能流暢通過該測(cè)試。VS2。0通過增加Verteｘ程序的靈敏性,顯著的提高了老版本(DｉrectX８)的ＶＳ性能，新的掌握指令,可以用通用的程序代替以前專用的單獨(dú)著色程序，效率提高很多倍;增加循環(huán)操作指令,削減工作時(shí)間,提高處理效率；擴(kuò)展著色指令個(gè)數(shù)，從１２8個(gè)提升到25６個(gè)。最重要的一點(diǎn)改進(jìn)是增加對(duì)浮點(diǎn)數(shù)據(jù)的處理功能,以前GPU只能對(duì)整數(shù)進(jìn)行處理，改進(jìn)后提高渲染精度,使最終處理的顏色格式達(dá)到電影級(jí)別。SｈaｄｅrＭoｄeｌ2。0時(shí)代突破了以前限制PC圖形圖象質(zhì)量在數(shù)學(xué)上的精度障礙，它的每條渲染流水線都升級(jí)為1２８位浮點(diǎn)顏色,讓游戲程序設(shè)計(jì)師們更容易更輕松的制造出更漂亮的效果.如果說DiｒecｔX８中的Sｈａｄeｒ單元還是個(gè)簡(jiǎn)潔嘗試的話，ＤireｃｔＸ９中的Shａder則成為了標(biāo)準(zhǔn)配置.除了版本升級(jí)到２．０外，DirｅｃtX9中ＰS單元的渲染精度已達(dá)到浮點(diǎn)精度,硬件T＆L單元也成為歷史的產(chǎn)物被取消，在較低DｉreｃtX版本游戲運(yùn)行時(shí)會(huì)使用VＳ單元模擬執(zhí)行硬件T＆L單元的功能。?第7頁:兩家廠商的不同命運(yùn)●兩家廠商的不同命運(yùn)從DｉrectX9開頭，ＰＣ顯卡業(yè)界由三名大佬掌權(quán),它們是微軟、ＡTI和NＶIVIA。其中,微軟擔(dān)當(dāng)3DAＰI軟件進(jìn)展商的角色，不斷更新ＤireｃｔX應(yīng)用程序接口,其它兩個(gè)顯卡廠商則緊緊跟隨,推出相應(yīng)的硬件產(chǎn)品，它們都想在將來的ＤX9市場(chǎng)中稱霸，但卻遇到了不同的待遇.實(shí)際上現(xiàn)在理性回顧當(dāng)時(shí)的場(chǎng)景，ＡTI搶先發(fā)布了代號(hào)Ｒ３0０的Radeoｎ9700，不過,它發(fā)布時(shí)的DＸ9未完善,微軟則會(huì)在最終版中加入VS(VerｔeｘＳｈadｅr，頂點(diǎn)描影)2.0、ＰＳ（PixｅlSｈaｄeｒ，像素描影）3.0。NVIDIＡ為了支持更多特性而延遲了NＶ３０的發(fā)布,惋惜它始終未能支持完整的VＳ３。0/PＳ3。０特性?？傊珹TＩ和NVIＤＩA都不行能實(shí)現(xiàn)真正的DＸ9,這是由兩個(gè)廠商一手造成的。AＴI發(fā)布Ｒadｅon97０0時(shí),選擇了VS2.０/PＳ２。0，NVIDIA選擇了ＶS2.0/PS3．0。ATI和NＶIDIA的分歧嚴(yán)重影響了DX的進(jìn)展,甚至連ＯｐｅｎGL2.0也受到牽連，微軟則想取得領(lǐng)導(dǎo)地位,始終實(shí)行拖沿策略，以便保持自己在3DAＰI的優(yōu)勢(shì)，借以打擊OpｅｎＧL.?

圖注:Rａdeｏn9700以最快速度開啟了ＤirectＸ９時(shí)代,并長(zhǎng)期占據(jù)了性能寶座●Radｅon97００系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★★★市場(chǎng)優(yōu)勢(shì):★★★★☆但是ATI選擇的是產(chǎn)品的發(fā)布速度,它堅(jiān)信戰(zhàn)場(chǎng)上兵貴神速.所以在NVＩDIＡ沉醉于GeFｏrｃe4Ti帶來的全盛時(shí)，ＡＴＩ于２002年7月發(fā)布了首款支持DiｒectX9的GＰU——Rａdeon9７００。首款DＸ9圖形芯片,２56Ｂiｔ的顯存位寬，9700憑借8條管線理所當(dāng)然的坐上了3D之王的寶座。由Ｒadｅon970０衍生出的中端產(chǎn)品也吸引了消費(fèi)者的眼球.當(dāng)年950０顯卡上演的改造風(fēng)波也被傳為佳話，9500黃金版（４管線可改8管線，12８MB２56Bｉt顯存;一般95０0為４管線可改8管，６4MB1２8Bit顯存）的知名度甚至要蓋過970０。直到年末，精準(zhǔn)地說是在2002年1１月1８日，Coｍｄex２00２上,NＶＩDＩA發(fā)布了研發(fā)代號(hào)ＮV３0的GｅＦｏrceFX，“FX"代表ＮＶIDIA收購３DFX之后的首款作品。這款產(chǎn)品擁有當(dāng)時(shí)最大的功耗，最夸張的散熱器設(shè)計(jì),多項(xiàng)半導(dǎo)體行業(yè)領(lǐng)先技術(shù),卻由于一些細(xì)節(jié)方面導(dǎo)致了GｅＦｏrｃeFX的全盤皆輸。種種跡象都表明,GｅFｏｒｃｅFX5800Ultra是一款失敗的產(chǎn)品,１２層ＰＣB以及GDDR２顯存帶來的高額成本,以及高噪音高功耗的表現(xiàn)使得GeFｏrｃｅＦＸ５800Ulｔｒa在于ATIRadｅｏｎ9700Ｐrｏ的競(jìng)爭(zhēng)中敗下陣來，受到自身4ｘ２流水線架構(gòu)以及性能低下的Shadｅr執(zhí)行效率限制,導(dǎo)致３Ｄ性能上GeForceFＸ5８０0Ultra也得不到半點(diǎn)好處。為了彌補(bǔ)高端市場(chǎng)上的失策，NＶIDＩA針對(duì)主流市場(chǎng)以及低端市場(chǎng)樂觀的推出了NV３0的精簡(jiǎn)版本NＶ31、ＮＶ３4，即GｅＦｏrcｅFX56０0以及FＸ５２00,惋惜架構(gòu)仍然繼承了ＮＶ30的高頻低能。

圖注:ＧｅForceＦX５800Uｌtra由于晶體管數(shù)達(dá)到創(chuàng)紀(jì)錄的1。25億個(gè),驚人的５０0MHｚ默認(rèn)頻率,致使NVIＤIＡ不得不為GeFｏrｃeFX5800Ultra搭配“ＦXFｌow”的散熱系統(tǒng),它包含一個(gè)銅制散熱片、熱管和換氣裝置。●GeForcｅＦX5８０0系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★市場(chǎng)優(yōu)勢(shì)：★★★Rａdｅｏn9700成為了AＴＩ最成功的一代顯卡，而NVIＤＩA隨后推出GeforcｅFＸ系列則是NV最受爭(zhēng)議的一代顯卡。無論高中低端，R30０架構(gòu)造就的AＴＩ顯卡在競(jìng)爭(zhēng)中都取得明顯的優(yōu)勢(shì).但Ｒ300架構(gòu)也擁有明顯的不足。R300芯片本身是32位和24位混合型的，內(nèi)核像素描影器是FP２４，而紋理尋址操作和頂點(diǎn)描影管道是FＰ3２.R300在像素描影管道中有2４位內(nèi)部浮點(diǎn)精度,而代號(hào)NV３０的ＧeｆｏｒceFX系列支持ＩEEE—32（Ｓ23ｅ8）浮點(diǎn)精度，比ＤX9更精確。但Ｒ30０的市場(chǎng)把握水平要明顯強(qiáng)于NV30,最后帶來了ATI的成功.這一優(yōu)勢(shì)持續(xù)了兩年多,市場(chǎng)份額資料稱，2００4年ＡＴI占了全球獨(dú)立圖形芯片出貨量的一半兒還多.ＡTI終究成為第一大獨(dú)立圖形芯片廠商，成功超越了ＮＶＩDＩA.Rａdｅoｎ9700的先進(jìn)架構(gòu)造就了它的高效率.在普遍＼情況下，它能比昔日的王者GｅForce4Ｔｉ4600快大約15-2０％。但是,當(dāng)運(yùn)行抗鋸齒（AA)和各異向性過濾（AF）計(jì)算時(shí),它能比Ti460０快大約40-100%。在當(dāng)時(shí)來說,這種性能提升出乎全部用戶意料,R30０使到人們廣泛接受ＡA和ＡF,使之成為必不行少的功能.R３00也由于眾多優(yōu)秀之處成為歷史上最長(zhǎng)壽的顯示芯片，Ｒ３0０推出３年后，還能為新游戲夠供應(yīng)合理的性能?？偠灾瓺ｉｒecｔＸ9。0時(shí)代的最初故事就是這樣布滿火藥味和戲劇性。?第8頁:NＶＩDIA亡羊補(bǔ)牢AＴI仍然堅(jiān)挺●ＦX５900亡羊補(bǔ)牢,Radeon9８00仍然堅(jiān)挺經(jīng)歷了GeFoｒcｅFX5800的慘痛教訓(xùn)之后,ＮVＩＤIA開頭著手做兩件事。首先是對(duì)NV３0架構(gòu)進(jìn)行改進(jìn)代號(hào)NＶ３5，以圖挽回市場(chǎng)份額,重新奪取性能寶座;另一方面則加速ＮV４0芯片設(shè)計(jì),這將是ＮＶIＤIＡ在將來上演的重頭戲。半年后，也就是2003年５月份，ＮVＩＤIＡ發(fā)布了ＮＶ35核心的GｅForcｅFＸ５900,與GeＦｏrｃeＦＸ５8０0Ｕｌtrａ相比，GeForcｅFX５900采納了更加成熟的0.１３微米工藝，晶體管數(shù)量雖然增加了５００萬個(gè)晶體管,不過借助成熟的０.13微米工藝，芯片良率以及發(fā)熱量都有了改善。??圖注:改進(jìn)后的GeＦｏrceＦX59００擁有眾多優(yōu)勢(shì),也為NVIDIA摘到了高耗能的帽子●GeＦorceＦX５90０系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★☆市場(chǎng)優(yōu)勢(shì)：★★★☆圖像技術(shù)方面這款產(chǎn)品也擁有眾多亮點(diǎn)，新的NV３5采納了備受業(yè)界好評(píng)的ＣinｅＦＸ２.０引擎(增加了ＵlｔrａＳhadｏw光影技術(shù)以及IntｅllｉsａmpleＨTC技術(shù)）。其中IntelｌiｓaｍpleHTC（高分辨率壓縮技術(shù)),能有效改善全屏抗鋸齒以及各向異性過濾的效果。新的ＮV３５采納了CｉneFＸ2。0引擎，和第1代CiｎeＦX相比,NＶＩＤIA對(duì)PiｘelShadｅr做出了肯定的改進(jìn),在保留ＦX12ｃｏmbｉner的同時(shí)增加了兩個(gè)可進(jìn)行浮點(diǎn)運(yùn)算的ｍｉｎｉALU,雖然miｎiALＵ的功能有限，但是還是使得ＮV35的浮點(diǎn)運(yùn)算能力提高了一倍。除此之外，最大的轉(zhuǎn)變就是從12８bｉｔ顯存位寬升級(jí)到２56biｔ顯存位寬，搭配的85０MＨｚＤＤR－I顯存可以供應(yīng)的帶寬高達(dá)27．2GＢ/ｓ,遠(yuǎn)遠(yuǎn)高于ＧｅForceFＸ５８0０Ｕｌtrａ的16GB/s。不久后，NVＩDIA又發(fā)布了NＶ36-—GeＦoｒｃeFX57００以及低頻版的ＧｅForｃeFＸ5900XT顯卡，在全部繼承了NＶ35的基礎(chǔ)上大幅縮減了產(chǎn)品的成本。尤其是ＧeForｃｅFX590０ＸT顯卡，憑借精準(zhǔn)的定位和較高的性價(jià)比，市場(chǎng)好評(píng)不斷。?圖注:代表ATI最高端產(chǎn)品的Raｄeon9８00XＴ顯卡，使用R360核心，工藝仍然不變●Ｒadeｏｎ98０0系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★市場(chǎng)優(yōu)勢(shì):★★★☆ＡＴI采納了同樣的方法,并且沒有重新設(shè)計(jì)架構(gòu),只是用更小的代價(jià)稍作改進(jìn)推出了代號(hào)R３50的Radeon9８0０。雖然９8００在架構(gòu)上并沒有太多的改進(jìn),制造工藝仍然維持0.15微米（之后高頻的9800ＸT還是０。1５微米)，但頻率的提高讓它的性能比９700更上一層樓，SmａrtShaｄer２.１和SｍoothViｓion2．1可能就是為數(shù)不多的改進(jìn)了.在此基礎(chǔ)之上的巔峰之作9800ＸT顯卡更是把頻率提升到了極限。２0０4年４月,ATI在掌握高端市場(chǎng)的基礎(chǔ)上，為我們帶來了一款意想不到的中端經(jīng)典顯卡--Raｄeｏn9550,這款芯片的成功至今讓AＴＩ自己都無法復(fù)制。Radｅoｎ95５0仍然基于RＶ350制造,在所支持特效方面也完全與該系列最高端的Radeｏn9６００ＸT相同。?圖注：橫掃中端市場(chǎng)的Radeoｎ９550顯卡給游戲玩家供應(yīng)了當(dāng)時(shí)最高的性價(jià)比●Ｒaｄｅｏn９55０系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★市場(chǎng)優(yōu)勢(shì)：★★★★★４條管線和Rａdeon９8００級(jí)別的DX９規(guī)格保證了Rａdeon９550強(qiáng)大的實(shí)力，它與Rａdeｏn9６00ＸＴ的差別僅僅在于頻率，這使得各種非公版、超頻版95５０立刻席卷中低端市場(chǎng)，掀起了一股超頻之風(fēng)，當(dāng)然成本下降帶來的合理的定價(jià),是Ｒadｅｏn９５50成為一代經(jīng)典最主要的因素.9550發(fā)布之時(shí)ATＩ并沒有對(duì)其所搭配顯存做太多限制，同時(shí)RV３5０核心出色的超頻能力更給予了Radeｏn９５5０強(qiáng)大的生命力。靈敏的規(guī)格和優(yōu)秀的性價(jià)比使它成為ATI低端顯卡中銷量最高的型號(hào)。23ｃd?第9頁:DirectＸ9。0ｃ開創(chuàng)ＧPU黃金期后ＤiｒｅctＸ９.0時(shí)代開創(chuàng)ＰC游戲黃金期●ＳhaｄerModｅl３．0將DirectＸ９推向高峰與過去的DiｒecｔX9.０b和SｈaｄeｒＭodel2．0相比較,DirｅｃtX9。０c最大的改進(jìn)，便是引入了對(duì)ShａderMｏdeｌ3。0的全面支持。ＳｈadｅｒＭoｄeｌ３.0除了連續(xù)擴(kuò)展指令長(zhǎng)度之外，還提升了指令執(zhí)行能力，它開頭支持動(dòng)態(tài)分支操作，像素程序開頭支持分支操作（包括循環(huán)、iｆ/ｅlｓe等)，支持函數(shù)調(diào)用.因此DiｒｅctX9。0c和ＳhadeｒMｏdｅl3．0標(biāo)準(zhǔn)的推出,可以說是DireｃtX進(jìn)展歷程中的重要轉(zhuǎn)折點(diǎn)。ShadｅrMｏdel3．0除了取消指令數(shù)限制和加入位移貼圖等新特性之外,更多的特性都是在解決游戲的執(zhí)行效率和品質(zhì)上下功夫，ＳhaderMｏdｅl3.0誕生之后,人們對(duì)待游戲的態(tài)度也開頭從過去單純地追求速度，轉(zhuǎn)變到游戲畫質(zhì)和運(yùn)行速度兩者兼顧。因此ＳｈaderMoｄｅl3.０對(duì)游戲產(chǎn)業(yè)的影響可謂深遠(yuǎn)。SｈａｄeｒＭoｄel3．0對(duì)比SｈaｄerMｏｄel2．０的改進(jìn)

在3Ｄ游戲工作時(shí)，其實(shí)ＰixelＳｈadeｒ、TMU以及ＲOＰ部分都格外重要。讓我們回想一下當(dāng)年《ＦIFA９８》等老一代3D游戲，當(dāng)時(shí)三角形生成能力是最為看重的，基本沒有應(yīng)用到紋理貼圖與像素著色,真正的工作部分是被成為頂點(diǎn)生成器的單元，而且也可以由ＣＰU來模擬執(zhí)行.但是進(jìn)展到ＤirectX6與DｉrectX7時(shí)期，大量3Ｄ游戲開頭追求更加豐富真實(shí)的表面效果,此時(shí)貼圖技術(shù)則飛快普及，如何供應(yīng)強(qiáng)大的紋理填充率成為關(guān)鍵。至于ＤirｅcｔX8之后的時(shí)代，像素處理則異軍突起并且展現(xiàn)出令人驚艷的畫質(zhì)。相對(duì)而言，ROP的概念比較難理解，這實(shí)際上是像素結(jié)果輸出處理器負(fù)責(zé)像素的最終輸出,執(zhí)行像素讀／寫操作、Z—buｆfeｒ檢查、顏色混合、抗鋸齒操作等。進(jìn)入ＤｉｒｅctX9時(shí)代以后，PixeｌSｈadeｒ技術(shù)開頭應(yīng)用得十分普遍，此時(shí)顯卡能否供應(yīng)更多的像素渲染管線成為關(guān)鍵因素。當(dāng)然，造成GPＵ開頭追求更多像素渲染管線的因素絕不僅僅是３Ｄ游戲普及化應(yīng)用PixｅｌShadｅｒ,ＰｉｘelShａｄｅr本身版本的提升也是一個(gè)重要緣由。單流水線內(nèi)置一條像素渲染管線在ＤireｃｔX８游戲橫行的時(shí)代是比較合理的,由于ＤirectX8的PｉｘelSｈader1．3允許的著色器程序比較短，此時(shí)單流水線內(nèi)的多個(gè)像素渲染管線無法發(fā)揮并行工作的優(yōu)勢(shì)。然而ＤｉrectX9時(shí)代的ＰixeｌShaｄeｒ2.0/３。0則全然不同，更長(zhǎng)的著色器程序指令讓多個(gè)像素渲染管線有了用武之地。

第10頁：Gｅfoｒｃｅ6和RadｅonＸ紛來沓至●Geforｃｅ６系列和RａdeoｎＸ系列眾多顯卡紛來沓至NVIＤIＡ回顧整個(gè)GｅFoｒceＦX一代顯卡的表現(xiàn)時(shí)深感圓滿，對(duì)于這個(gè)始終幻想做ＧＰU業(yè)界Ｉnｔｅl的廠商來說,市場(chǎng)和技術(shù)的雙重失利對(duì)它打擊太大。雖然后期產(chǎn)品ＧeForcｅFＸ５900有尚佳的表現(xiàn),但在與ＡＴIＲaｄｅｏｎ980０的競(jìng)爭(zhēng)中也只能說旗鼓相當(dāng),沒有占絲毫上風(fēng)。低端市場(chǎng)面對(duì)ＡTI眾多產(chǎn)品和優(yōu)秀的性價(jià)比，NVＩDIＡ也感到無力回天。此時(shí)只能押寶下一代產(chǎn)品的NＶIDIA顯得沒有退路。20０４年4月,在投入史上最大的一筆研發(fā)經(jīng)費(fèi)后(10億美元以及500多位研發(fā)人員），NVＩDIA終究發(fā)布了新一代NV4０—-GeForce6８00Ｕltｒa?？梢哉f,GｅForｃｅ6800Uｌtra是一款不計(jì)成本,誓要奪回性能王座的產(chǎn)品。同時(shí)它吸取了上一代產(chǎn)品的教訓(xùn),重新設(shè)計(jì)的架構(gòu)和完整支持DirｅcｔＸ9.０c標(biāo)準(zhǔn),讓這款顯卡以全新的形象展現(xiàn)在用戶面前。甚至有分析家評(píng)論ＧｅForcｅ6800和GeForｃeFＸ簡(jiǎn)直不是一家公司設(shè)計(jì)的產(chǎn)品.??圖注：架構(gòu)徹底革新之后的ＧeFｏrce6８００Ultra最終獲得成功●GeForｃe6８００系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★★★市場(chǎng)優(yōu)勢(shì):★★★★當(dāng)NV40代替NＶ3ｘ架構(gòu)新奇出爐的時(shí)候，人們把關(guān)注的焦點(diǎn)更多的放在了采納單貼圖來加強(qiáng)Verｔeｘ和PixｅlShader（頂點(diǎn)著色和象素著色）能力這一改動(dòng)上面。實(shí)現(xiàn)這一點(diǎn)之后只需要將ＧPU處理紋理的能力加倍(也就是16×1的架構(gòu))便可以有效的將PixeｌＳhaderpｉpelines（象素著色管線)的數(shù)目提高到原來的4倍。在NV４0中，最大象素和紋理填充率在現(xiàn)實(shí)使用中同樣可以使硬件的功能發(fā)揮得更均衡。當(dāng)處理雙重貼圖問題的時(shí)候，NＶ４0也可以運(yùn)行在一個(gè)8x2的模式下，這時(shí)一半的管線被專用于處理每一個(gè)紋理。在這種雙重貼圖的模式下,ＮＶ４0的紋理填充率和單紋理模式下是一樣的,只是象素填充率減半而已。

圖注:擁有1６個(gè)像素著色器和６個(gè)頂點(diǎn)著色器的ＧeForce６８０0架構(gòu)在NV3x和ＮV４0架構(gòu)中，都可以同時(shí)處理每個(gè)象素的ｚ和顏色值。另外,不只是對(duì)一個(gè)象素進(jìn)行著色,在顏色單元中還可以進(jìn)行一個(gè)z或者模板操作(stenciｌｏpｅｒation)。這使得NV3x可以在每個(gè)時(shí)鐘周期內(nèi)執(zhí)行8個(gè)z或者模板操作,而ＮV40則可以在每個(gè)時(shí)鐘周期內(nèi)執(zhí)行３2個(gè)z或者模板緩沖操作。由于對(duì)沒有新的象素進(jìn)行繪圖，NVＩDIＡ分別稱之為＂８x０＂和”32x０"。這一模式在首先進(jìn)行z—pass運(yùn)算,或者使用模板陰影的時(shí)候格外有用（在Dooｍ3中使用到)。最重要的是NV40還引入了第三代的ＣｉnｅFX3。0引擎，完全符合Ｄirｅct9.0Ｃ的ＶeｒtexＳｈader３。0和ＰixｅlＳｈａder3.0規(guī)范。而AＴＩ的新產(chǎn)品卻固步自封，堅(jiān)守Ｄirecｔ9．0b規(guī)范。ＧｅＦorce６8０0Ｕｌtra的推出令ＮVIDIＡ飛快奪回了失去已久顯卡性能的王冠，也將世人對(duì)NＶＩDIA實(shí)力的質(zhì)疑一掃而空.NＶIＤＩA士氣大振，隨后就發(fā)布了基于NＶ4０核心的一些列產(chǎn)品ＧｅFoｒｃe68０0ＧT、ＧeFｏrｃｅ6800和ＧeFｏrce6８００LE來面對(duì)不同的市場(chǎng)。主流市場(chǎng)方面，由于Ｄiｒｅｃｔ9游戲的突飛猛進(jìn),中端GPU市場(chǎng)又消滅青黃不接，２0０４年８月，廣受用戶好評(píng)的NV43核心——GeＦorcｅ66０0系列顯卡發(fā)布。?圖注:中端市場(chǎng)上讓很多用戶憧憬的GeＦoｒce66０0系列顯卡大量上市●ＧｅＦｏrce６600系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★☆市場(chǎng)優(yōu)勢(shì)：★★★★★GeFｏrｃｅ6600系列顯卡恰當(dāng)?shù)厥褂昧薚ＳMC0．11微米工藝，顯存位寬為中端顯卡最適合的1２８biｔ,NＶ４3的頻率可以輕松達(dá)到500MHz，并且給用戶預(yù)留了超頻空間。同時(shí)NV43還是首款原生支持PCＩ-E的顯卡，并且?guī)砹薔ＶIDＩA與3DFX合作后的最新技術(shù)——SLI，這項(xiàng)技術(shù)已經(jīng)在GPU領(lǐng)域失傳多年，沒人想到NVIDIA會(huì)在這一代產(chǎn)品上身上將它復(fù)活。NVIDIＡ為了GeFｏrｃe6的成功幾乎用盡全部研發(fā)力氣，而另一方ＡＴI則輕松很多,它推出了架構(gòu)上并沒有太大變化的RａdｅonX８00系列，像素管線翻倍提升至１6條,基于對(duì)圖形領(lǐng)域和游戲廠商開發(fā)能力的推斷，ATI認(rèn)為DirectX9．0ｂ將會(huì)持續(xù)很長(zhǎng)時(shí)間，對(duì)手也不會(huì)支持新的圖形ＡPＩ，所以代號(hào)R４００的ＲａdeoｎX８０0和上一代GPU核心一樣沒有支持最新的ShaderＭｏdel３。0規(guī)范,但是這次ATI賭輸了。

圖注：ATＩ在高端市場(chǎng)推出的RadeｏnＸ800ＸＴ顯卡●RaｄeonX8０0系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★市場(chǎng)優(yōu)勢(shì)：★★★☆首先令ＡTＩ始料未及的是ＧeＦｏｒcｅ6系列完全依據(jù)ＤirectX9.0ｃSM３。0的標(biāo)準(zhǔn)設(shè)計(jì)，而代號(hào)R４２0的Ｘ８00系列僅支持DｉrｅcｔＸ９．0bSＭ2。0b,雖然當(dāng)時(shí)并沒有多少游戲能夠支持SM3.0和HDR，但這已經(jīng)讓X8０0系列失去了上代９70０的王者風(fēng)范。其次基于Ｒ3０0的芯片架構(gòu)在很多測(cè)試中已經(jīng)顯得老邁，無法和全新設(shè)計(jì)的GeFｏrce6800Ultra相抗衡。?圖注：代號(hào)R４20的X800系列架構(gòu)圖我們從圖中可以清楚看到6個(gè)頂點(diǎn)著色器、1６個(gè)像素著色器和２5６位顯存位寬同時(shí)68００和Ｘ800的時(shí)代正值A(chǔ)GP、ＰCI-Ｅ接口改朝換代時(shí)期，NVＩDＩA合理的通過使用橋接芯片兼顧了AGP/PCＩ－E平臺(tái)，而AＴI堅(jiān)持“有路何必搭橋"的策略使得研發(fā)成本增加不少，這也導(dǎo)致Ｘ80０一代ＡＴI的顯示芯片規(guī)格格外紛繁蕪雜。綜合來說,X８00ＸＴ與６800Ultrａ的3D性能差距不是太明顯，但是SＬI雙卡互聯(lián)技術(shù)讓ＡTI失去了高端市場(chǎng)，由于追求極致3D性能的用戶并不會(huì)在意價(jià)格，雖然ATI用最快速度開發(fā)出了CrossFｉｒe技術(shù),但它畢竟成了追逐者而不是領(lǐng)導(dǎo)者.?圖注:連續(xù)Radeon9５0０經(jīng)典的中低端產(chǎn)品RａdｅｏnX5５0●RadeonX５50系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★市場(chǎng)優(yōu)勢(shì):★★★★☆A(yù)TＩ抓緊時(shí)間推出了基于Ｘ８００架構(gòu)的中端產(chǎn)品X700，雖然性能上和６600系列不相上下，但是終因沒有對(duì)手的技術(shù)亮點(diǎn)多，而關(guān)注度下降。但是后期的X800Pro和ＡGP接口的X80０GＴO(shè)在發(fā)布一年之后由于良好的性價(jià)比而受到AGＰ升級(jí)用戶的青睞。在低端市場(chǎng)AＴI也打出了一些亮點(diǎn)，Radeon9550在2００４年的夏天制造了AGP顯卡市場(chǎng)的奇跡，借助于９550的神話,ATI在PCＩ－Ｅ市場(chǎng)推出了RａｄeonX５５0（９550的ＰCI—Ｅ版）。采納0.11微米制程的X550并不是經(jīng)過全新設(shè)計(jì)的產(chǎn)品，它與Ｘ600系列(RＶ３８０）、X３00系列（RＶ37０)在架構(gòu)上是完全相同的。功能及特性上也完全不變，都是擁有４條像素渲染管線和2個(gè)頂點(diǎn)處理單元的產(chǎn)品。它的成功主要在于低價(jià)和快速占據(jù)低端裝機(jī)和品牌機(jī)市場(chǎng)。2４23?第11頁：Ｇｅforce7對(duì)陣ATＩ兩代核心設(shè)計(jì)●Geｆorcｅ7系列對(duì)陣ATI兩代核心設(shè)計(jì)讓我們從另外的一個(gè)角度去看NV3Ｘ--他只是NV的一塊探路石，雖然有用性能不佳，但是為下一代產(chǎn)品的技術(shù)開發(fā)積累了大量的閱歷,我們可以看到，NV３0中的很多技術(shù)都被完整地集成到了NV40中,也就是說NVIDIＡ在NＶ30上的長(zhǎng)期投資開頭產(chǎn)生回報(bào)了——NＶ40在功能上明顯超過了ATI的R４2０，而開發(fā)難度也沒有大大增加，就是由于一些關(guān)鍵技術(shù)早在NV3０這代產(chǎn)品中就已經(jīng)被提前開發(fā).要知道NＶ40的發(fā)布，只是在ＮＶ35發(fā)布后的短短５個(gè)月。2005年0６月２1日，NVＩＤIＡ新一代GPU核心，代號(hào)G70的Geforｃe7800GＴX發(fā)布了，你無法想象NVＩDIA是如何在僅僅一年后設(shè)計(jì)并發(fā)布了這款新的ＧPU,由于這時(shí)ＡＴIRａｄeoｎX800顯卡正處于熱賣中。Geforｃe７80０GＴX讓原來就處于ＤirectX9.０bSM2．０的標(biāo)準(zhǔn)的ATI更加無力回天,畢竟自己的GPU已經(jīng)落后對(duì)手兩代，ＡＴI只能選擇用心開發(fā)Ｒ520核心,等待已經(jīng)越來越渺茫的翻身機(jī)會(huì)……Ｇ７0在正式定型之前的開發(fā)代號(hào)被稱為ＮＶ４7，由于它實(shí)際上就是在NＶ４0的基礎(chǔ)上改進(jìn)升級(jí)而來的，當(dāng)Ｇ70正式面世的時(shí)候，官方的技術(shù)文檔以及核心架構(gòu)的展現(xiàn)證明白它發(fā)布之前所使用的核心代號(hào)和推斷的正確性.??圖注：飛快推出的Geforcｅ７8０0ＧTＸ當(dāng)仁不讓地奪取了高性能桂冠●Gｅｆoｒｃe7８00系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★★★市場(chǎng)優(yōu)勢(shì):★★★G7０在架構(gòu)上基本沒有太大的創(chuàng)新（盡管NＶIDIA將其美名曰“全新的架構(gòu)”），是一款和GｅＦorｃe６（NＶ4ｘ）系列基于同一個(gè)架構(gòu)設(shè)計(jì)的強(qiáng)化版，核心的制程由0．１３μｍ進(jìn)化至0.11μm,核心技術(shù)照舊支持SｈaｄerＡＰIProgrａmmａblｅSｈaｄｅr3．0并在算法上加以強(qiáng)化,除PiｘeｌSｈaｄeｒ管線增加到2４個(gè)，頂點(diǎn)著色單元增加到8個(gè)之外，此外７800ＧTX還新增加/加強(qiáng)了透明材質(zhì)智能采樣抗鋸齒、次表面散射、RｅlｉefMappｉng、64BｉtHDR運(yùn)算、法線貼圖壓縮、光能傳遞貼圖算法等一系列即將在下一代游戲中廣泛消滅的技術(shù)。下表列出的是ＮＶ4０和G７0的基本性能參數(shù)對(duì)比。?圖注：ＮV40和G70的基本性能參數(shù)對(duì)比經(jīng)歷了NV３0的失敗與NV４０的小試牛刀，7８0０GＴX踏上了ATI推崇的延長(zhǎng)新架構(gòu)開發(fā)周期的道路.從G７0的核心架構(gòu)來看，Ｇ70整個(gè)架構(gòu)就是對(duì)NV4０的一個(gè)補(bǔ)完與升級(jí),并著重對(duì)將來游戲中常用的次表面散射、高動(dòng)態(tài)范圍光照、法線貼圖壓縮等前沿技術(shù)增加到核心的硬件支持上。不難發(fā)現(xiàn)，ＮＶＩDIA此舉就等于ATI在９700-9800-X800-X8５0的進(jìn)化過程一樣,在同一個(gè)具有相當(dāng)前瞻性的架構(gòu)上進(jìn)行不斷的深化和升級(jí)補(bǔ)完,保持一個(gè)DirecｔX大版本號(hào)采納一個(gè)統(tǒng)一架構(gòu)的部署方式以適應(yīng)應(yīng)用程序的進(jìn)展以及舒緩昂揚(yáng)的開發(fā)費(fèi)用.

始終以來，SＭ3.0技術(shù)被ＮＶIＤIA作為獨(dú)有賣點(diǎn)而在Ｇｅｆoｒcｅ６/7系列顯卡上大作宣揚(yáng)，該技術(shù)的缺失也使得Ｒ4XX系列顯卡在和競(jìng)爭(zhēng)對(duì)手的產(chǎn)品競(jìng)爭(zhēng)中處于格外不利的地位。雖然ＡＴI的R500在游戲機(jī)市場(chǎng)占得先機(jī)，但桌面領(lǐng)域的R５２0卻經(jīng)歷了數(shù)次跳票之后才在2005年10月來到人們的面前，結(jié)束了AＴＩ顯卡不支持ＤirectＸ9．0c的尷尬歷史。?圖注:AＴI終究發(fā)布了期盼已久的X１８00ＸT顯卡●RadeonＸ1８０0系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★★市場(chǎng)優(yōu)勢(shì):★★★和每一代顯卡產(chǎn)品一樣,ATＩRaｄｅｏｎＸ10０0顯卡也依據(jù)管線數(shù)目,顯存位寬／容量將產(chǎn)品劃分為高、中、低三個(gè)檔次，依次命名為X18０0/Ｘ１６０0／X130０。每個(gè)系列又依據(jù)核心/顯存頻率的不同而再細(xì)分出若干個(gè)產(chǎn)品型號(hào),如Pｒｏ、XL、ＸＴ等。RaｄｅonＸ１00０的問世使得不少玩家在GeFoｒce6/7之外,又多了一個(gè)選擇?；赗520的Ｘ18０0XT是全球首批采納0．09微米制程的顯示核心.采納新工藝的好處是不言而喻的,除了使顯卡的核心頻率能達(dá)到前所未有的高度之外也降低了芯片的生產(chǎn)成本。這也讓只有1６管線的X１800XT具備了和24管線的７8０0GＴX一較高下的實(shí)力。如果你認(rèn)為ATI的新架構(gòu)僅有一款R520，那就大錯(cuò)特錯(cuò)了,由于早就在代號(hào)為R520的RAＤEONＸ18０0發(fā)布的時(shí)候，代號(hào)為R58０的RADＥONＸ190０就完成流片、取樣等一系列的后期研發(fā)，幾乎是進(jìn)入生產(chǎn)階段了。在當(dāng)時(shí)ＡＴＩ供應(yīng)應(yīng)第三方廠商的一些機(jī)密文件中也表明，AＴI對(duì)R580布滿了信心,字里行間所示意的信息當(dāng)然就是盼望這些顯卡廠商不要由于ＲadeｏnX1８00延誤而對(duì)ＡTI的強(qiáng)大研發(fā)能力失去信心。20０6年１月24日，距離RadeonX１8０0發(fā)布4個(gè)月還不到的時(shí)間,AＴＩ正式發(fā)布新一代的高端產(chǎn)品—-RadeoｎX１90０系列。作為06年推出的新高端產(chǎn)品,RＡＤＥONX1９00不僅擁有高時(shí)鐘頻率的特點(diǎn),而且還在架構(gòu)上作了大刀闊斧的改進(jìn)，性能獲得顯著提升.在玩家眼中最為出色的3：１黃金架構(gòu)正是在Ｒ580時(shí)代誕生。?圖注：代號(hào)Ｒ580的RADＥOＮＸ19００系列的每條傳統(tǒng)的像素管線擁有３個(gè)像素渲染單元傳統(tǒng)的管線概念（Ｐｉpelinｅ)中,像素渲染單元(PixeｌSｈadeｒ）跟Pipｅliｎe數(shù)目相同,ＮVIDIＡ的Ｇ70圖形就是這樣一個(gè)概念；但是ATＩ在全新的Ｒ５８0圖形芯片中，略微修正了像素渲染單元跟Piｐeｌｉne的關(guān)系。RadeｏnX190０需要重點(diǎn)強(qiáng)調(diào)的地方在于，R58０圖形芯片擁有1６條傳統(tǒng)的像素管線(PｉxｅｌPiｐｅliｎｅ），但是卻擁有48個(gè)像素渲染單元和１6個(gè)紋理單元，算術(shù)處理能力是以前旗艦級(jí)GＰU的3倍，在晶體管數(shù)量只增加２０％的情況下,渲染能力理論上增加了２00％，像素渲染單元跟紋理單元的比例是３:１。

圖注:代表DiｒｅctX9的頂級(jí)顯卡--RａdeonX190０XTX●RadｅoｎX1900系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★★★市場(chǎng)優(yōu)勢(shì)：★★★☆這一改進(jìn)使得RaｄｅonX1９０0XTX具備了48個(gè)像素著色器的流水線設(shè)計(jì),FＰ32精度像素運(yùn)算能力達(dá)到3７４．4GFＬOPＳ，如果再加上頂點(diǎn)著色器的話,ＲaｄeｏｎX１９0０XTX的ＦＰ32計(jì)算能力總共會(huì)是426.4ＧFLOPS。相比之下，NＶIＤIＡ的GeForce780０GＴＸ５1２ＭＢ(５50MHz內(nèi)核）只能供應(yīng)21１.２ＧFLOPS的FP３2像素運(yùn)算能力和47。2GFLOＰS的FＰ３2頂點(diǎn)運(yùn)算能力。在Ｒ5８0架構(gòu)之后,ＡＴI將3：1黃金架構(gòu)連續(xù)在中低端顯卡上,分別誕生了如下幾款值得我們回憶的產(chǎn)品,它們從上市之初開頭壓制NVIDIA的同檔次產(chǎn)品直到停產(chǎn)退市,都保持著格外高的性價(jià)比，這是用戶最為欣賞和稱道的優(yōu)勢(shì)：●X1300ＸT，X1６50Pro系列:１2個(gè)像素單元，4個(gè)紋理單元，１28Ｂｉｔ顯存?●Ｘ1650ＸT系列：２4個(gè)像素單元，8個(gè)紋理單元,12８Biｔ顯存

?●Ｘ19５０Pｒｏ系列：36個(gè)像素單元,12個(gè)紋理單元,2５6Ｂiｔ顯存

●Ｘ19５０GT系列:36個(gè)像素單元，12個(gè)紋理單元，2５6Bｉt顯存?第12頁：統(tǒng)一終止分立,架構(gòu)之爭(zhēng)日趨激烈統(tǒng)一終止分立,架構(gòu)之爭(zhēng)日趨激烈●統(tǒng)一渲染架構(gòu)的誕生SｈaｄerModｅl在誕生之初就為我們供應(yīng)了PixeｌShaｄｅr(頂點(diǎn)著色器）和ＶerteｘＳhaｄer(像素著色器)兩種簡(jiǎn)略的硬件規(guī)律,它們是相互分置彼此不干涉的。但是在長(zhǎng)期的進(jìn)展過程中，NＶＩＤIA和ATI的工程師都認(rèn)為,要達(dá)到最佳的性能和電力使用效率,還是必須使用統(tǒng)一著色器架構(gòu)，否則在很多情況下PiｘelＳｈader計(jì)算壓力很輕造成大量ＰixｅlShader單元閑置，VｅrtexＳhadｅr資源有限但遇到大量三角形時(shí)會(huì)忙不過來.也就是說不再區(qū)分PixelSｈader和ＶｅｒtexＳhaｄｅｒ，最終設(shè)計(jì)出來的產(chǎn)品可以在任何APＩ編程模型中都不存在任何頂點(diǎn)/像素著色器固定比率或者數(shù)量限制.

每一幀渲染中VerｔexＳhader和ＰｉxelＳｈaｄｅr負(fù)載壓力幾乎沒有相關(guān)性，總是在消滅資源閑置和資源緊缺,所以有必要使用統(tǒng)一著色器架構(gòu).在統(tǒng)一著色器架構(gòu)的GPU中，ＶｅrtｅxＳhadｅｒ和ＰｉxelＳｈader概念都將廢除同時(shí)代之以AＬＵ.ALU是個(gè)完整的圖形處理體系,它既能夠執(zhí)行對(duì)頂點(diǎn)操作的指令（代替VS）,又能夠執(zhí)行對(duì)象素操作的指令（代替PＳ）。ＧＰU內(nèi)部的ALＵ單元甚至能夠依據(jù)需要任意切換調(diào)用,從而極大的提升游戲的表現(xiàn).微軟XBＯX３60所采納的Xeｎos圖形處理器，第一次引入了統(tǒng)一著色器架構(gòu)，這個(gè)著色器架構(gòu)包含了３個(gè)獨(dú)立的著色器矩陣，每個(gè)著色器矩陣內(nèi)有16個(gè)５Ｄ向量SＩMD單元，這些SＩMＤ單元既可以執(zhí)行VerｔexＳhaｄｅｒ也可以執(zhí)行ＰixｅlSｈaｄer，可以稱之為符合DireｃtX9標(biāo)準(zhǔn)的統(tǒng)一著色器架構(gòu)。隨后NVIDIＡ推出的GeＦorｃｅ880０GＴX使用了1２8個(gè)標(biāo)量流處理器(StreamProceｓsor）。在通用計(jì)算方面，ＧｅForcｅ8８00GＴＸ的統(tǒng)一架構(gòu)比Ｘbox360的C1更先進(jìn)、更強(qiáng)大,這表現(xiàn)在標(biāo)量設(shè)計(jì)、整個(gè)UＳ和Ｓhadｅr簇內(nèi)的ＭIMＤ化執(zhí)行。?圖注：ＡMD歷代著色器演進(jìn)在GeForｃe8800GＴX之后,ＡMＤ經(jīng)過數(shù)月的延遲后推出了代號(hào)R６００的ＲAＤEOＮＨＤ２9００ＸT核心，這款產(chǎn)品和NＶＩDＩA的新品一樣使用了統(tǒng)一渲染架構(gòu)，不同之處在于２900XT的64個(gè)ＳIMD著色器內(nèi)包含了５路超標(biāo)量(suｐｅrscａlaｒ）的運(yùn)算單元（ALＵ）,我們習(xí)慣性稱其擁有320個(gè)流處理器。組織形式方面，SIＭD單元采納超標(biāo)量+ＶLIＷ(甚長(zhǎng)指令）設(shè)計(jì)，雖然從數(shù)量上看規(guī)模浩大（共擁有32０個(gè)ＡLＵ，8８00GＴＸ為１２8個(gè)),但是執(zhí)行效率在實(shí)際運(yùn)算中會(huì)發(fā)生不行忽視地衰減。為便利商量，在后文分析中,我們將更多地把著色器Sｈader稱為流處理器StreamＰrｏｃｅssor。27６５?第13頁:G8０橫空出世，Ｒ600臨危受命●GeFｏrce8橫空出世，RadｅｏnＨD2000臨危受命理論上說ＤiｒectX10并沒有要求統(tǒng)一VertｅｘShａder和PｉｘｅlＳhａder，它只是增加了紋理規(guī)格、寄存器數(shù)目等規(guī)格,同時(shí)引入ＧeｏmetryＳhａdeｒ(可批量進(jìn)行幾何處理)加強(qiáng)曲面處理能力.在GeForcｅ88００GTＸ發(fā)布之前，NVＩDIＡ也在媒體表示可能考慮在DirｅctX1０時(shí)代連續(xù)使用分立的著色器,但最終產(chǎn)品還是將著色器統(tǒng)一化。實(shí)際上在２003年，ＡTI的RadｅoｎHD2０00也進(jìn)入開發(fā)期，而在發(fā)布這款產(chǎn)品之前，ＡＴI發(fā)布了一款特殊的GPU,它針對(duì)微軟XBOX３60游戲機(jī)設(shè)計(jì),代號(hào)為Ｘenｏs。Xeｎoｓ是微軟與ATＩ的合作結(jié)晶,于2005年發(fā)布在XBOＸ３60游戲主機(jī)中。這款ＧPU最大的特色是采納了統(tǒng)一著色器單元架構(gòu),頂點(diǎn)、像素著色器程序都在同樣的單元上執(zhí)行,由線程調(diào)度器作動(dòng)態(tài)的資源安排,還引入了頂點(diǎn)紋理拾取(ＶTＦ單元）等AＴI同期R5ＸX產(chǎn)品所不具備的特性。??圖片：第一款采納統(tǒng)一渲染架構(gòu)的ＧPＵ是Ｘenos芯片代號(hào)Ｇ80的GeForce８８００GTＸ相對(duì)于上一代產(chǎn)品，幾乎經(jīng)過了重新設(shè)計(jì)，各方面的改進(jìn)都格外大。而R600家族的體系架構(gòu)在肯定程度上可以看作是連續(xù)自Xenｏｓ。但是ＡTI在２０06年7月２4被ＡMＤ收購以及它之前的研發(fā)精力不足，直接影響了R600家族產(chǎn)品的開發(fā)受到很大影響。最后導(dǎo)致沒有統(tǒng)一架構(gòu)設(shè)計(jì)閱歷的NＶIDIA在2０06年11月8日成功發(fā)布了G８０核心的GｅFｏｒce8800GTX顯卡,巨大的技術(shù)革新和性能提升，獲得了用戶的全都認(rèn)同.?圖片：至今耳熟能詳?shù)腉８0架構(gòu)GeＦorcｅ8８０0GＴX顯卡●GeＦorce8800系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★★★市場(chǎng)優(yōu)勢(shì):★★★★Ｇ8０架構(gòu)使用了多指令流多數(shù)據(jù)流ＭIMD結(jié)構(gòu)標(biāo)量流處理器，一共１28個(gè)流處理器替代了原來分立的VeｒｔexShａdｅｒ和PixelＳｈａｄｅr，擁有當(dāng)時(shí)最強(qiáng)的性能，當(dāng)然G80擁有６.81億個(gè)晶體管,是G71的２．5倍之多，顯存方面384Bit顯存位寬也充分保證了數(shù)據(jù)吞吐能力。在性能上ＧeＦｏrce8８00GTX顯卡把3D圖形處理器的性能又引領(lǐng)到一個(gè)前所未有的高度，這給對(duì)手承重的打擊,ＡTＩ竟在半年之內(nèi)拿不出一款足以抗衡G80核心的產(chǎn)品。NＶＩDIA憑借G80的革命性架構(gòu)毫無懸念的奪取了3D性能的制高點(diǎn).直到2007年６月3日，AＩＴ終結(jié)了長(zhǎng)達(dá)7個(gè)月的等待時(shí)間,RａdeoｎHD２00０家族終究發(fā)布。雖然業(yè)內(nèi)第一片DＸ１０ＧPＵ的頭銜被G８0搶了去，但ＡTI這次也沒有被NＶIDIＡ牽著鼻子走。除了對(duì)DＸ１0和統(tǒng)一著色架構(gòu)的支持外，R６０0還加入了一些特有的功能。例如，獨(dú)立于幾何著色器（GeomeｔrｙＳhaｄｅr）的專用鑲嵌單元(ｔesseｌlaｔion）,加入屬于ＤｉrｅｃｔＸ1０。１范疇的可編程ＡA功能等。?圖片：失去性能皇冠的ＲadeonHD2９00XT顯卡●RadｅoｎHD２90０系列產(chǎn)品技術(shù)優(yōu)勢(shì)：★★★市場(chǎng)優(yōu)勢(shì)：★★☆雖然我們盡力提及這款GPU的重要性和價(jià)值，但它畢竟還是輸了，由于流處理器架構(gòu)過于依靠以前的SＩMD結(jié)構(gòu)著色器模式，所以代號(hào)Ｒ60０的ＲadeoｎＨＤ２9０0ＸT只能和對(duì)手的次高端產(chǎn)品Geｆorce88０0GＴＳ相抗衡。為了彌補(bǔ)性能下降，AＴI提高了這款GPU的運(yùn)行頻率到740ＭＨｚ，配以5１２位顯存掌握器，惋惜的是同樣使用80nm工藝生產(chǎn),29００XＴ的最大功耗達(dá)到了2１５W。?第14頁：G９2連續(xù)領(lǐng)航,RＶ6７0開頭轉(zhuǎn)變●G９２連續(xù)領(lǐng)航,ＲａdeoｎHD３00０開頭轉(zhuǎn)變?cè)?００7年圣誕節(jié)之際，NVIDIＡ的改進(jìn)版Ｇ８０核心誕生了.新核心被命名為G92，它引入了更多的紋理定址單元、完整的Ｈ２64硬件解碼加速以及一些紋理處理方面的增強(qiáng)，晶體管數(shù)量從Ｇ80的6８0M提升到了75４Ｍ,但由于新制程的應(yīng)用，G92無論是面積、發(fā)熱還是功耗都表現(xiàn)優(yōu)秀。G92比Ｇ8０增加了大約7４Ｍ晶體管,這增加的晶體管包括了Ｇ８０顯卡上分離的NVIＯ（G80專用的輸出／輸入芯片)、額外的３2（88０0ＧT上共開啟了５6）個(gè)紋理定址單元、增強(qiáng)的視頻處理引擎（來自Ｇ８4）、PＣIExpress2.０、HDMI的支持。??圖注：?jiǎn)尾凵岬母叨孙@卡Ｇｅforce88０0GＴ上市僅1500元左右●G9２核心Gefoｒcｅ8800系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★★市場(chǎng)優(yōu)勢(shì):★★★★G92核心的第一槍是經(jīng)典的Ｇeforce88０0ＧT。NVIDIA技術(shù)市場(chǎng)經(jīng)理

人人文庫> 全部分類> 行業(yè)資料 > 機(jī)電工程

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔