NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧_第1頁
NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧_第2頁
NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧_第3頁
NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧_第4頁
NVIDIAATI命運(yùn)轉(zhuǎn)折GPU十年發(fā)展回顧_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

NVIDIA/ATI命運(yùn)轉(zhuǎn)折GPU十年進(jìn)展回顧前言:當(dāng)今半導(dǎo)體領(lǐng)域,只有一種芯片能以3倍于摩爾定律的速度進(jìn)展,只有一種芯片能夠在PC領(lǐng)域挑戰(zhàn)甚至超越同時(shí)期生產(chǎn)的CPU產(chǎn)品,只有一種芯片讓圖形業(yè)界的創(chuàng)作者和很多游戲玩家為之瘋狂,這就是GPU(GraphicProcessingUnit),中文譯名:圖形處理器.NVIDIA公司在1999年發(fā)布GeForce256圖形處理芯片時(shí)首先提出GPU的概念,隨后大量簡(jiǎn)潔的應(yīng)用需求促使整個(gè)產(chǎn)業(yè)蓬勃進(jìn)展至今。今日筆者將用最精煉的文字,為各位讀者敘述這10年的GPU進(jìn)展的主要路徑,讀者可以跟隨下面的文字將自己置于當(dāng)時(shí)的市場(chǎng)背景下,體會(huì)各種經(jīng)典產(chǎn)品和先進(jìn)技術(shù)帶給我們的震撼。計(jì)算機(jī)圖形學(xué)誕生具有重要意義利用計(jì)算機(jī)實(shí)現(xiàn)圖形生成,或者說地通俗一些實(shí)現(xiàn)圖像的繪制,是科學(xué)家們長(zhǎng)期的幻想。我們無法追溯最初這個(gè)想法的提出者和簡(jiǎn)略細(xì)節(jié),但是我們還是查閱到了一個(gè)人和一門學(xué)科。這個(gè)人是聞名科學(xué)家-—伊凡?蘇澤蘭先生,這門學(xué)科則是當(dāng)今計(jì)算機(jī)領(lǐng)域最熱門的專業(yè)-—計(jì)算機(jī)圖形學(xué)(ComputerGraphics,簡(jiǎn)稱CG)。?

圖注:IvanSutherland博士1962年在演示中最初的“畫板"程序。1962年,麻省理工學(xué)院的一位青年博士討論生提交了論文并發(fā)言,他就是伊凡?蘇澤蘭(IvanSutherland).蘇澤蘭用幻燈向與會(huì)者展現(xiàn)了畫板程序,蘇澤蘭和他所展現(xiàn)的程序最終成為計(jì)算機(jī)圖形學(xué)的奠基。而今他已72歲高齡,仍然奮斗在圖形業(yè)界最前沿,現(xiàn)為Sun公司討論員和副總裁。計(jì)算機(jī)圖形學(xué),是一種使用數(shù)學(xué)算法將二維或三維圖形轉(zhuǎn)化為計(jì)算機(jī)顯示器的柵格形式的科學(xué)。簡(jiǎn)潔地說,計(jì)算機(jī)圖形學(xué)的主要討論內(nèi)容就是討論如何在計(jì)算機(jī)中表示圖形、以及利用計(jì)算機(jī)進(jìn)行圖形的計(jì)算、處理和顯示的相關(guān)原理與算法。圖形學(xué)處理需要計(jì)算機(jī)天然具備大量并行運(yùn)算能力,并且對(duì)精度和運(yùn)算強(qiáng)度有很高要求,但是這給當(dāng)時(shí)的計(jì)算機(jī)提出了巨大的難題,由于硬件進(jìn)展的嚴(yán)重滯后,計(jì)算機(jī)圖形學(xué)在提出后的20年內(nèi)始終困難前行。?圖注:最初的pong街機(jī),將電子娛樂從概念推向?qū)嶋H在1972年,計(jì)算機(jī)圖形學(xué)的進(jìn)展直接促成了一個(gè)讓一般用戶感愛好的游戲產(chǎn)品——Pong街機(jī),這是第一款家庭電視游戲產(chǎn)品,也是首款真正取得成功并影響深遠(yuǎn)的視頻游戲,實(shí)際上這就是一個(gè)簡(jiǎn)潔的乒乓撞球游戲,但它幾乎成為電子娛樂領(lǐng)域的始祖。當(dāng)Pong成為遍布街頭巷尾的街機(jī)時(shí),越來越多的廠商也開頭關(guān)注并設(shè)計(jì)自己的電子娛樂產(chǎn)品。同樣對(duì)計(jì)算機(jī)圖形學(xué)提出需求的,還有一些工業(yè)設(shè)計(jì)領(lǐng)域,如計(jì)算機(jī)幫助設(shè)計(jì)(ComputerAidedDesign),通稱CAD。CAD的消滅使情況發(fā)生根本性的轉(zhuǎn)變,1974年美國波音飛機(jī)制造公司第一架音747客機(jī)試飛成功,這架客機(jī)的設(shè)計(jì)圖紙全部重量竟有幾十噸重,如果沒有CAD設(shè)計(jì)技術(shù),這么浩大的制圖工程量,用人工來做是無法想象的.在20世紀(jì)80年月,逐漸消滅了專門進(jìn)行圖形計(jì)算的硬件,它們是GPU的前生,這極大的加速了計(jì)算機(jī)圖形學(xué)的進(jìn)展進(jìn)程。八十年月以前主要在軍事領(lǐng)域討論進(jìn)展,其應(yīng)用目標(biāo)是各類軍用運(yùn)輸工具仿真模擬器的視景生成系統(tǒng)。八十年月早期,斯坦福高校教授JimClark產(chǎn)生了用專用集成電路技術(shù)實(shí)現(xiàn)3D圖形繪制處理器的設(shè)想,然后與其同學(xué)創(chuàng)立了SGI公司,并于1984年開發(fā)出了世界上第一個(gè)通用圖形工作站IRIS1400。?圖注:SGI公司,是技術(shù)計(jì)算和可視化計(jì)算無可爭(zhēng)議的領(lǐng)軍者其次代高端通用圖形工作站的功能特征包括三角形的Gouraud明暗處理、Phong光照模型和硬件Z-Buffer算法.圖象的真實(shí)感顯著改善,幾何變換及掃描轉(zhuǎn)換性能大幅提高。第三代消滅于1992年下半年,代表產(chǎn)品是SGI的RealityEngine。它增加了紋理映射及全屏幕反走樣,為通用圖形工作站用于戶外視景模擬打開了大門。簡(jiǎn)潔來說最初的硬件支持的3D圖形繪制可以劃分成幾何處理和光柵化處理兩個(gè)階段.幾何處理階段包括了坐標(biāo)變換、裁剪、光照計(jì)算等,光柵化處理則包含了掃描轉(zhuǎn)換、采納Z-Buffer算法的隱藏面移去、紋理映射等。顯然,要使系統(tǒng)的性能最佳就必須使這兩個(gè)處理階段具有相匹配的處理能力。3D圖形生成的計(jì)算量格外巨大,即使最快的通用CPU也難以勝任。3184

第2頁:GPU概念提出之前經(jīng)典的圖形硬件GPU概念提出之前經(jīng)典的圖形硬件●圖形處理芯片消滅,市場(chǎng)呈現(xiàn)群雄逐鹿在GPU概念沒有提出之前,圖形處理芯片是顯卡的心臟,可以說,一款顯卡使用的圖形處理芯片基本決定了這塊顯卡的性能和檔次。當(dāng)時(shí)有能力生產(chǎn)圖形芯片的公司主要有ATI、NVIDIA、3DFX、S3、MATROX、SIS、TRIDENT、STM等幾家公司。而經(jīng)過了顯卡市場(chǎng)這幾年激烈的競(jìng)爭(zhēng)之后,不少原先的老牌如S3,3DFX等公司都倒下去了,Mat(yī)rox、Trident等公司也是日漸衰落,如今只有NVIDIA和ATI可以說是春風(fēng)得意,把持著民用市場(chǎng)的絕大部分份額和大部分專用市場(chǎng)。在2D圖形時(shí)代,ATI曾與OEM客戶建立起了親密的合作關(guān)系,同時(shí)ATI優(yōu)質(zhì)多媒體卡的聲譽(yù)也在消費(fèi)者之間廣為流傳。但進(jìn)入90年月之后,電腦游戲的進(jìn)展要求顯卡擁有強(qiáng)勁的3D效能,這直接成就了3DFX和NVIDIA,ATI也沒有放棄任何機(jī)會(huì),Rage128等產(chǎn)品成就了ATI在圖形芯片市場(chǎng)上的活躍度。??圖注:在圖形芯片市場(chǎng)制造過輝煌過的部分廠商,你能回憶當(dāng)時(shí)的歲月嗎……回過頭來看這些年公司在GPU概念之前推出的圖形芯片,大致上可以分為四代.第一代圖形芯片的代表S3Virge系列、ATI的第一款3D芯片3DRage、NVIDIA的第一代產(chǎn)品NV1和MATROXMystique系列充斥了整個(gè)市場(chǎng)。但是,這四個(gè)系列的產(chǎn)品性能都不能令人滿意,在配備了高端處理器的電腦中,有時(shí)軟件加速的效果甚至比硬件加速的效果還要好。其中值得注意的是ATI的3DRage輸在兼容性方面,而NVIDIA的NV1采納的正方形成像技術(shù)雖然不錯(cuò),沒有獲得微軟在Windows95中就制訂的Direct3D多邊形立體標(biāo)準(zhǔn),最后走向失敗。其次代圖形芯片的代表是3DFXVoodoo和NVIDIARIVA128。從其次代起,圖形芯片才進(jìn)入了高速進(jìn)展的黃金時(shí)期,圖形芯片領(lǐng)域的進(jìn)展速度是電腦界權(quán)威的摩爾定律的三倍—-每六個(gè)月產(chǎn)品更新?lián)Q代一次,性能提高一倍。當(dāng)靜靜無聞的3DFX推出劃時(shí)代的圖形加速卡——Voodoo之后,圖形芯片的性能不能令人滿意的現(xiàn)象才得到徹底轉(zhuǎn)變。但是Voodoo早期的天價(jià),為它和3DFX帶來很多麻煩。Voodoo擁有每秒4500萬的像素填充率,每秒100萬個(gè)多邊形的生成能力,支持雙線過濾,板載4MB顯示內(nèi)存,這一切價(jià)值300美元。而且Voodoo還是一塊純3D加速卡,也就是說它必須和一般的2D顯示卡協(xié)作使用。但是對(duì)于使用低像素填充率,沒有過濾功能,2D和3D應(yīng)用都共享可憐的1MB顯存的低端顯示卡的游戲玩家來說,高端的Voodoo芯片的消滅無疑是個(gè)福音.?圖注:挽救了NVIDIA的RIVA128顯卡在競(jìng)爭(zhēng)對(duì)手的打擊下,NVIDIA為世嘉游戲機(jī)重新設(shè)計(jì)的NV-2芯片在沒有開發(fā)完成就被世嘉放棄,加之NV-1并沒有得到市場(chǎng)認(rèn)可,NVIDIA立刻陷入崩潰邊緣。但值得注意的是此時(shí)NVIDIA啟用了極具天才的DavidKirk(現(xiàn)為美國工程院院士、NVIDIA首席科學(xué)家),開頭重新研制NV—3.NV-3的目標(biāo)是成為當(dāng)時(shí)最先進(jìn)的圖形芯片,并籌備在一個(gè)芯片中集成優(yōu)秀的2D和3D性能.在1997年快要結(jié)束的時(shí)候,NVIDIA終究發(fā)布了NV-3,也就是大家所熟識(shí)的RIVA128,RIVA128主張128位的內(nèi)存總線,在全速運(yùn)行的時(shí)候可以達(dá)到100Mpixel/Sec,在非GLIDEAPI游戲性能中超過了當(dāng)時(shí)風(fēng)靡全球的3DfxVoodoo。零售市場(chǎng)上,Diamond、STB、ASUS、ELSA和Canopus等等都相繼推出了基于此芯片的產(chǎn)品,加上當(dāng)時(shí)不少經(jīng)典的GLIDE游戲轉(zhuǎn)向微軟的D3D陣營(yíng),這些都促使RIVA128終究獲得了市場(chǎng)的認(rèn)可。此時(shí)ATI也經(jīng)歷了一個(gè)幸福的階段,在同樣比較失敗的3DRage之后,ATI真正意義上的第一款3D芯片3DRageII誕生。此芯片支持雙線性、三線性過濾、Z-buffer和一些Direct3D材質(zhì)混和模式。但是像素過濾只是比S3的Virge略好,在當(dāng)時(shí)來說是只能算一般.1997年2月,ATI發(fā)布了3DRageII+DVD,這是第一塊供應(yīng)了硬件運(yùn)動(dòng)補(bǔ)償?shù)膱D形芯片,把CPU從軟件播放DVD的繁重的工作中解放了出來,使ATI成為DVD加速領(lǐng)域的先行者。同年發(fā)布的3DRagePro芯片開頭,ATI已經(jīng)采納了當(dāng)時(shí)業(yè)界領(lǐng)先的AGP總線。大批的OEM訂單使ATI公司在1998年的收入也提高了一倍.?圖注:多媒體顯卡的開山之作ATIRage128?第3頁:NVIDIA、3DFX、ATI三強(qiáng)爭(zhēng)霸NVIDIA領(lǐng)先崛起,3DFX大勢(shì)已去,ATI等待良機(jī)第三代圖形芯片的代表是3DFXVoodoo2、NVIDIATNT、ATIRage128、MATROXG200、S3Savage3D;應(yīng)該說,時(shí)至今日,使用前三代圖形芯片的顯卡產(chǎn)品已經(jīng)絕跡,只能在保藏愛好者的倉庫里看到它們的身影。其中TNT的推出向世人證實(shí)了強(qiáng)勁的3D性能不僅僅是3dfx的專利,在性能上RIVATNT已經(jīng)具備了挑戰(zhàn)當(dāng)時(shí)顯卡之王Voodoo2的實(shí)力。聞名的“雷管”(Detonator)驅(qū)動(dòng)也在RIVATNT時(shí)代誕生,這表明NVIDIA注意到優(yōu)良的驅(qū)動(dòng)程序?qū)Τ浞职l(fā)揮顯示芯片性能的重要性。ATI開發(fā)的Rage128雖然不是當(dāng)時(shí)頂尖的,不過RAGE128勝在各項(xiàng)性能指標(biāo)都格外平均。多媒體方面,RAGE128不僅在DVD動(dòng)態(tài)插值補(bǔ)償方面仍然占據(jù)優(yōu)勢(shì),更有支持VIVO和ALL-IN—WONDER的顯卡版本.在當(dāng)時(shí)看來,這已經(jīng)算是功能格外強(qiáng)大的多媒體顯卡,ATI逐漸做出了自己的特色.第四代圖形芯片的代表是3DFXVoodoo3、NVIDIATNT2、MATROXG400、S3Savage4。經(jīng)過這兩次換代后,優(yōu)秀的TNT2使得3DFX在圖形加速市場(chǎng)上所占的比重下降了,影響也大不如前。到1999年底,采納TNT2系列芯片的顯卡幾乎搶占了近80%的顯卡市場(chǎng),NVIDIA第一次在市場(chǎng)份額以及性能上超過了對(duì)手3DFX。RIVATNT2采納了0.25um工藝制造,標(biāo)準(zhǔn)版本運(yùn)行于125MHz頻率,支持32MB顯存,支持32bit幀緩沖,支持DVI輸出接口,峰值速度250Mpixels/Sec,更重要的是它代表了新一代顯卡的特色:128位核心、支持AGP4X、支持32M顯存.??圖注:TNT2顯卡使得NVIDIA首次坐上了市場(chǎng)占有率第一的王座從TNT2開頭NVIDIA對(duì)產(chǎn)品進(jìn)行了市場(chǎng)化細(xì)分,在高中低端,面對(duì)多種不同的用戶,TNT2芯片衍生出TNT2Vanta、TNT2M64、TNT2、TNT2Pro、TNT2Ultra等不同的型號(hào)產(chǎn)品,搭配不同顯存的容量,產(chǎn)品線掩蓋了大部分的市場(chǎng).其中TNT2Ultra是系列最高端產(chǎn)品,也是NVIDIA第一次使用Ultra后綴命名高端產(chǎn)品,TNT2Ultra只是從NV6核心中選擇出的品質(zhì)優(yōu)秀的芯片,并搭配了速度最快的顯存,其核心/顯存頻率高達(dá)150/183MHz,后期更是提高到175/200MHz,性能上超過了3DFX的Voodoo3500以及MATROX的G400Max。?圖注:3DFX的絕唱-—瘋狂設(shè)計(jì)的Voodoo56000顯卡TNT2的消滅,使得NVIDIA和3DFX之間的霸主之爭(zhēng)天平發(fā)生了傾斜,Direct3D和OpenGL的廣泛使用也使3DFX的Glide搖搖欲墜,3DFX的一意孤行終究得到了市場(chǎng)的拋棄.NVIDIA卻憑借自身的努力和TNT系列產(chǎn)品的巨大成功登上了“圖形加速芯片之王”的寶座。ATI則靠著ATIRage128始終將傳統(tǒng)優(yōu)勢(shì)和市場(chǎng)份額連續(xù)下來。?第4頁:Geforce256誕生與GPU概念的提出Geforce256誕生與GPU概念的提出Geforce256——代號(hào)NV10于1999年8月發(fā)布。這是圖形芯片領(lǐng)域開天辟地的產(chǎn)品,也是第一款提出GPU概念的產(chǎn)品。Geforce256所采納的核心技術(shù)有硬體T&L、立方環(huán)境材質(zhì)貼圖和頂點(diǎn)混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等,而硬體T&L技術(shù)可以說是GPU概念形成的標(biāo)志。

圖注:Geforce256顯卡造就了GPU概念1999年,已經(jīng)憑借RivaTNT2在圖形芯片界立足的NVIDIA,主動(dòng)放棄幫自己打下江山的Riva品牌,新啟用的Geforce強(qiáng)調(diào)力氣并沿用至今,并衍生出驅(qū)動(dòng)品牌Forceware及芯片組品牌nForce。Geforce256之所以被稱作GPU緣由就在于Geforce256劃時(shí)代的在圖形芯片內(nèi)部集成了T&L(幾何光照轉(zhuǎn)換)功能,使得GPU擁有初步的幾何處理能力,徹底解決了當(dāng)時(shí)眾多游戲瓶頸發(fā)生在CPU幾何吞吐量不夠的瓶頸。Geforce256顯卡的出色表現(xiàn),NVIDIA強(qiáng)大的技術(shù)實(shí)力得到全面釋放,這塊顯卡是真正的全面領(lǐng)先型產(chǎn)品,而不是靠16bit色和32bit色的區(qū)域優(yōu)勢(shì)或者是單純依靠特定的3DAPI支持.T&L幾何光照轉(zhuǎn)換原先由CPU負(fù)責(zé),或者由另一個(gè)獨(dú)立處理機(jī)處理(例如一些舊式工作站顯視卡)。較強(qiáng)勁的3dfxVoodoo2和RenditionVerite顯示核心已整合了幾何(三角形)建構(gòu),但硬件T&L仍是一大進(jìn)步,緣由是擁有該技術(shù)的顯示核心從CPU接管了大量工作。硬件T&L單元讓Geforce256幾乎成為一個(gè)全新的GPU標(biāo)準(zhǔn),也讓GPU更加獨(dú)立自主.在當(dāng)時(shí),曾經(jīng)不行一世的3DFXVoodoo難以抵抗TNT2的攻勢(shì),最終被GeForce256所終結(jié)。同時(shí)ATI選擇在一年后也就是2000年推出Radeon(鐳)品牌,從今開創(chuàng)了GPU領(lǐng)域的兩強(qiáng)爭(zhēng)霸.從今開頭桌面圖形市場(chǎng)已經(jīng)演化成兩家公司的表演?!馟eForce256系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★★市場(chǎng)優(yōu)勢(shì):★★★★當(dāng)時(shí)ATI用來對(duì)陣GeForce256的正是Radeon256,它供應(yīng)了對(duì)DDR—RAM的支持,節(jié)省帶寬的Hyper技術(shù),完整地T&L硬件支持,Dot3,環(huán)境貼圖和凹凸貼圖,采納2管線,單管線3個(gè)材質(zhì)貼圖單元(TMU)特殊硬件架構(gòu).圓滿的是第三個(gè)貼圖單元直到Radeon256退市的時(shí)候也沒有任何程序支持它,同時(shí)由于驅(qū)動(dòng)的不成熟,Radeon256并沒有叫好又叫座。?圖注:市場(chǎng)定位精準(zhǔn)的Radeon標(biāo)準(zhǔn)版32MDDR顯卡但Radeon256畢竟打開了AIT公司的Radeon(鐳)品牌,Radeon系列顯卡除了同樣擁有T&L外,具備ATI最先進(jìn)的硬件幾何變形,光照效果,和圖象剪切等等功能使ATIRadeon在性能上完全可以與NVIDIA的旗艦產(chǎn)品一決高下。ATI和NVIDIA兩大巨頭之間的競(jìng)爭(zhēng)也演化為Radeon和GeForce兩大品牌的對(duì)決?!馬adeon256系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★市場(chǎng)優(yōu)勢(shì):★★不行否認(rèn)在成功的背后,離不開微軟推出的圖形API——DirectX7.0的鼎力支持。DirectX7.0最大的特色就是支持T&L,在T&L問世之前,位置轉(zhuǎn)換和燈光都需要CPU來計(jì)算,CPU速度越快,游戲表現(xiàn)越流暢.使用了T&L功能后,這兩種效果的計(jì)算用顯示卡的GPU來計(jì)算,這樣就可以把CPU從繁忙的勞動(dòng)中解脫出來.同時(shí)從另一個(gè)角度提升了GPU在PC系統(tǒng)中的地位。?圖注:微軟發(fā)布了當(dāng)時(shí)最具影響力的圖形API——DirectX7.0與NVIDIAGeForce2系列顯示芯片的簡(jiǎn)略劃分一樣,ATI也將Radeon依據(jù)當(dāng)時(shí)的市場(chǎng)情況劃分為多個(gè)版本,包括Radeon標(biāo)準(zhǔn)板、RadeonSE(高頻版)、RadeonVE(雙頭顯示)以及RadeonLE(取消了Hyper—Z技術(shù))??梢哉fRadeon是ATI跨入DirectX7.0時(shí)代后最成功的一款顯示芯片,同時(shí)今后的ATI產(chǎn)品也延用“Radeon”來命名。借助GeForce256巨大的影響力,2000年5月,NVIDIA終究發(fā)布了新一代旗艦顯卡,由于代號(hào)NV15的GPU擁有1.6GigaTexels/sec紋理填充率,所以NVIDIA將這個(gè)標(biāo)志性的參數(shù)縮寫為GTS,顯卡全稱為GeForce2GTS。

圖注:曾今的高端卡GeForce2GTS架構(gòu)特色GeForce2GTS首次采納了0。18微米工藝制程,由TSMC制造的GeForce2GTS(0.18微米,564PBGA封裝)中,晶體管數(shù)目已經(jīng)增加到了2500萬,工作頻率也首次提高到200Mhz,顯存方面搭配了32MB166MhzDDRSDRAM內(nèi)存,GeForce2與上一代比起來最大不同的地方在于:增強(qiáng)的其次代T&L引擎,性能提升幅度達(dá)30%,填充速度也增加到1.6GTexel/s,這也是首款填充速度過億的圖形加速器,像素填充速度的增加主要是由原來的每管線單個(gè)TMU(紋理單元)增加到兩個(gè),GeForce顯卡共有4條管線,所以200Mhzx4x2=1。6GTexel/s.嚴(yán)格來說,GeForce2GTS并不是一款全新架構(gòu)的顯卡,僅僅是對(duì)上代產(chǎn)品GeForce256的升級(jí)改良版。但這種改良收到奇效,這種改良更多的是針對(duì)市場(chǎng)的需求做出應(yīng)變,由GeForce2pro、GeForce2Ultra、GeForce2TI、GeForce2MX、GeForce2GO構(gòu)成了豐富的產(chǎn)品線。其中最為重要的產(chǎn)品就是2000年6月向低端市場(chǎng)推出的NV11核心GeForce2MX顯卡,這款顯卡曾經(jīng)在一段時(shí)間內(nèi)統(tǒng)治了整個(gè)低端市場(chǎng),即使到GeForce3顯卡推出,仍在市場(chǎng)熱賣。同時(shí)GeForce2MX也為NVIDIA與ATI爭(zhēng)奪市場(chǎng)的時(shí)候增加了籌碼。而高端產(chǎn)品GeForce2Ultra以更強(qiáng)的電氣性能和核心顯存頻率堅(jiān)固占據(jù)了性能寶座,也代表了DirectX7時(shí)代GPU的頂級(jí)性能?!瘢牵澹疲飏ce2系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★市場(chǎng)優(yōu)勢(shì):★★★★248e

第5頁:DirectX8時(shí)代兩強(qiáng)爭(zhēng)霸、你追我趕DirectX8時(shí)代兩強(qiáng)爭(zhēng)霸、你追我趕面對(duì)圖形計(jì)算,讓GPU逐漸找到了自己的方向,那就是給予用戶更真更快地視覺體驗(yàn),但是GPU架構(gòu)也遇到一些問題亟待解決.首要問題就是,要實(shí)現(xiàn)更加簡(jiǎn)潔多變的圖形效果,不能僅僅依靠三角形生成和固定光影轉(zhuǎn)換,雖然當(dāng)時(shí)游戲畫面的提高基本上都是通過大量的多邊形、更簡(jiǎn)潔的貼圖來實(shí)現(xiàn)的。但后期的進(jìn)展中,頂點(diǎn)和像素運(yùn)算的需求量猛增.每個(gè)頂點(diǎn)都包含很多信息,比頂點(diǎn)上的紋理信息,散光和映射光源下表現(xiàn)的顏色,所以在生成多邊形的時(shí)候帶上這些附加運(yùn)算,就可以帶來更多的效果,但這也更加考驗(yàn)頂點(diǎn)和像素計(jì)算能力。討論人員發(fā)現(xiàn),同硬件T&L僅僅實(shí)現(xiàn)的固定光影轉(zhuǎn)換相比,VS和PS單元的靈敏性更大。?2001年從DirectX8發(fā)布開頭,ShaderModel(渲染單元模式)在DirectX體系中的地位就日趨重要,其版本和渲染單元的規(guī)格也成為了決定顯卡性能凹凸的關(guān)鍵因素。第一個(gè)實(shí)踐DirectX8可編程特性的是NVIDIAGeforce3Ti圖形卡。這片代號(hào)NV15的Geforce3GPU首次在內(nèi)部加入了PixelShader處理器和VertexShader處理器。為了保險(xiǎn)起見,Geforce3內(nèi)部還同時(shí)保留了T&L硬連線為老游戲供應(yīng)最佳的執(zhí)行效率。?圖注:UT2003場(chǎng)景Shader概念的提出,意味著程序員可通過它們實(shí)現(xiàn)3D場(chǎng)景構(gòu)建的難度大大降低。通過VS和PS的渲染,可以很容易的寧造出真實(shí)的水面動(dòng)態(tài)波紋光影效果。此時(shí)DirectX的權(quán)威地位終究建成。PixelShader(頂點(diǎn)著色器)和VertexShader(像素著色器)硬件規(guī)律,真正支持像素和頂點(diǎn)的可編程.雖然當(dāng)時(shí)可編程性很弱,硬件限制太多,頂點(diǎn)部分消滅可編程性,像素部分可編程性有限。但這的確是硬件T&L之后PC圖形技術(shù)的又一重大飛躍.3D娛樂的視覺體驗(yàn)也因此向接近真實(shí)邁進(jìn)了一大步,波光粼粼的水面是那個(gè)時(shí)期用于演示Shader能力的典型DEMO,相比之下DirectX7繪制的水面效果就單調(diào)得多。Shader單元概念提出之后,無論NVIDIA還是ATI,都在做強(qiáng)顯卡前端(SetupEngine及其相關(guān)部分,如光柵器Rasterizer、設(shè)定Setup和頂點(diǎn)裝配器VertexAssembler)的同時(shí),逐漸將競(jìng)爭(zhēng)重點(diǎn)放在顯卡核心部分-—PixelShader(頂點(diǎn)著色器)和VertexShader(像素著色器),無論是Radeon8500還是GeforceTi4200都內(nèi)置的規(guī)格和頻率更強(qiáng)的PS和VS單元。同時(shí)顯卡的后端ROP(光柵化引擎,負(fù)責(zé)完成像素的輸出)也逐漸強(qiáng)大,各種各樣的多重采樣AA模式和更高的抗鋸齒模式逐步得以實(shí)現(xiàn)。在此基礎(chǔ)上,GPU的負(fù)擔(dān)從以前的紋理和像素填充率方面,逐漸開頭轉(zhuǎn)向Shader的執(zhí)行能力.在DirectX8時(shí)代誕生了一系列經(jīng)典顯卡,同時(shí)ATI在DirectX7的不利局面得到逆轉(zhuǎn).而曾今的3DFX、MATROX、SIS、TRIDENT等廠商,或被收購或再也沒有能力登臺(tái)表演,GPU領(lǐng)域的兩強(qiáng)爭(zhēng)霸在DirectX8時(shí)代徹底確立。?圖注:NVIDIA公司的創(chuàng)始人黃仁勛先生和ATI公司的創(chuàng)始人何國源先生1963年,黃仁勛誕生于中國臺(tái)北。1983年,黃仁勛高校畢業(yè)后毫不猶豫地搬到硅谷,并應(yīng)聘AMD公司,成為一名芯片設(shè)計(jì)工程師,兩年后跳槽到偏向于圖形處理的芯片商LSILogic.在職期間苦讀6年后成為斯坦福電子工程碩士.1993年1月,NVIDIA正式成立,作為創(chuàng)始人之一的他擔(dān)當(dāng)NVIDIA首席執(zhí)行官。1950年,何國源誕生在廣東省新會(huì)地區(qū)。1974年,何國源高校畢業(yè)回到香港,在那里找到了他平生第一份正式工作。何國源的第一份工作是在“ControlData”電腦公司做部門主管。1983年,何國源決定去加拿大進(jìn)展之前,年輕的他在王氏電子公司已經(jīng)做到了總經(jīng)理。1985年,何國源和另外兩名香港移民BennyLau(產(chǎn)品開發(fā)副總裁)和LeeLau(策略計(jì)劃副總裁)共同創(chuàng)建的ATI(ArrayTechnologyInc)。公司在多倫多北部的萬錦市宣告成立。2001年2月,NVIDIA終究發(fā)布了具有劃時(shí)代意義的GeForce3.Geforce3采納0.15微米工藝制程,在晶體管數(shù)量上多達(dá)5700萬個(gè),這個(gè)數(shù)據(jù)整整是RIVA128顯卡的8倍,已經(jīng)超高當(dāng)時(shí)最強(qiáng)的P4處理器4200萬個(gè)。GeForce3擁有4個(gè)PixelShader和1個(gè)VertexShader(頂點(diǎn)處理單元)。同時(shí),NVIDIA為游戲開發(fā)者供應(yīng)了完整的Geforce架構(gòu)開發(fā)工具,允許游戲開發(fā)者編制他們自己的程序來掌握像素的效果,給游戲和應(yīng)用開發(fā)者帶來了極大的便利。?圖注:高端GeForce3Ti500顯卡●GeForce3Ti系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★市場(chǎng)優(yōu)勢(shì):★★★★微軟在2002年對(duì)DirectX8.0進(jìn)行升級(jí)誕生了DirectX8.1,新標(biāo)準(zhǔn)對(duì)VS和PS的渲染加強(qiáng),增加對(duì)大紋理水波紋的處理效果,新的DirectX8。1使你獲得更好的圖像顯示質(zhì)量,使多人游戲更具可伸縮性,以及包括更優(yōu)異的音頻效果。ATI則利用這個(gè)機(jī)會(huì),通過代號(hào)R200的Radeon8500顯卡首次超過了NVIDIA的GeForce3。在當(dāng)時(shí),做工優(yōu)秀、畫面顯示質(zhì)量出色的Radeon8500顯卡成為業(yè)界公認(rèn)性能最出色的顯卡,一舉超越了壓制NVIDIA的Geforce3Ti系列顯卡.?圖注:同為高端定位的Radeon8500●Radeon8500系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★★市場(chǎng)優(yōu)勢(shì):★★★★代號(hào)R200的Radeon8500的基本結(jié)構(gòu)與當(dāng)時(shí)的其他顯卡差不多;它擁有四個(gè)像素單元,每個(gè)像素單元擁有兩個(gè)紋理單元.它亦支持DirectX8。1的頂點(diǎn)著色引擎和像素著色引擎,它的兩個(gè)頂點(diǎn)著色引擎被稱為CharismaEngineII,為新的頂點(diǎn)著色程序和舊的DirectX7硬件T&L都供應(yīng)出色的效能。Radeon8500支持像素著色器版本1.4,相對(duì)1。x版本的設(shè)計(jì),這個(gè)修訂版本是意義重大的.鑒于PS1.2和1.3只是PS1.1的改進(jìn)版,8500擁有第一和唯一的ATI硬件加速細(xì)分曲面繪圖引擎,名為“Truform",這個(gè)引擎通過十年的困難進(jìn)展后,最終成為我們?cè)贖D5870顯卡中看到的Tessellation引擎.但是回頭看DirectX8時(shí)代的GPU,我們發(fā)現(xiàn)無論是NVIDIA還是ATI,都沒有推出一款低端產(chǎn)品,而巨大的低端市場(chǎng)正面臨產(chǎn)品斷檔的危險(xiǎn)。2001年,在高端產(chǎn)品Radeon8500之前,ATI發(fā)布了Radeon7000系列顯卡,由于這一系列顯卡已經(jīng)是ATI的第七代產(chǎn)品了。Radeon7000系列總共有兩款芯片,高端的R100(7200)和低端的RV100(7000)都使用了0。18微米工藝制造,擁有三千萬晶體管,支持DirectX7。這種以RV代表低端產(chǎn)品的做法被沿用至今。

圖注:深受消費(fèi)者喜愛的Radeon7500代表了當(dāng)時(shí)最高的性價(jià)比●Radeon7500系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★市場(chǎng)優(yōu)勢(shì):★★★★★Radeon7500是款格外的顯卡,核心代號(hào)為RV200,由于它是與ATI下一代的8500(R200)一同發(fā)布的,但僅支持DirectX7。客觀的講,作為DirectX7平臺(tái)下的Radeon7500帶給我們的是與GeForce2TI同等的性能,而且它還具備其他的特點(diǎn),比如超高的芯片運(yùn)行頻率及顯存帶寬、HydraVision雙頭顯示、優(yōu)秀的視頻流回放與2D顯示畫面等,更重要的是它有一個(gè)吸引人的價(jià)格??傮w來說,Radeon7500等經(jīng)典顯卡為ATI打下了低端和中端市場(chǎng),市場(chǎng)份額漸漸接近NVIDIA。Radeon8500在此時(shí)也誕生了大量的衍生物,他們包括9000、9100、9200、9250等等,規(guī)格型號(hào)甚至令人眼花繚亂。?圖注:鞏固性能王位的GeForce4Ti4600高端顯卡●GeForce4Ti系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★市場(chǎng)優(yōu)勢(shì):★★★☆面對(duì)競(jìng)爭(zhēng)對(duì)手ATI的步步緊逼,GeForce4Ti于2002年2月應(yīng)運(yùn)而生。GeForce4Ti基于改良版本的TSMC0。15微米工藝,采納了最新nfiniteFXII引擎,VertexShader增加至2個(gè)。在高工作頻率下,使得GeForce4Ti的處理能力有可能高于GeForce3將近三倍。而在全屏反鋸齒方面,GeForce4Ti采納新的AccuviewAA技術(shù),改善了取樣方式并且優(yōu)化了渲染的過程,可以進(jìn)一步保證在高分辨率下的顯示速度。顯存帶寬也始終是制約顯卡性能的瓶頸,GeForce4Ti為了擺脫瓶頸的限制,引入了LightSpeedMemoryArchitectureII(LMAII)光速顯存構(gòu)架II技術(shù),它的原理就是優(yōu)化渲染過程和壓縮技術(shù)的采納。GeForce4Ti的性能領(lǐng)先程度巨大讓ATI根本無力翻身,同時(shí)它完整支持DirectX8.1也讓NVIDIA在GPU著色器規(guī)格上沒有任何圓滿.聰慧的NVIDIA順勢(shì)推出了GeForce4Ti4600、TI4400、Ti4200以及GeForce4MX,其中最受用戶歡迎的就是GeForce4Ti4200,這是NVIDIA首次嘗試高端產(chǎn)品低成本化(只有頻率區(qū)分,沒有架構(gòu)改動(dòng)),結(jié)果大獲成功,持續(xù)熱賣至2004年。?圖注:在低端顯卡市場(chǎng),GeForce4MX系列取得了驕人戰(zhàn)績(jī)●GeForce4MX系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★市場(chǎng)優(yōu)勢(shì):★★★★★而面對(duì)低端用戶的GeForce4MX更是由于對(duì)手產(chǎn)品線的空缺,這款顯卡采納的核心實(shí)際上是GeForce2Ti,而顯存掌握器和抗鋸齒功能則屬于GeForce4Ti系列,雖然只支持DirectX7,但它飛快取代GeForce2MX,制造了當(dāng)時(shí)最好銷量,成為最受歡迎的產(chǎn)品。26b8

第6頁:DirectX9。0時(shí)代開啟Radeon9700開啟DirectX9。0時(shí)代,NVIDIA深陷泥潭●DirectX9.0帶給業(yè)界的震撼隨后到來的DirectX9。0時(shí)代,讓Shader單元具備了更強(qiáng)勁的性能。2002年底微軟發(fā)布的DirectX9.0中,PS單元的渲染精度已達(dá)到浮點(diǎn)精度,傳統(tǒng)的硬件T&L單元也被取消。全新的VertexShader(頂點(diǎn)著色引擎)編程將比以前簡(jiǎn)潔得多,新的VertexShader標(biāo)準(zhǔn)增加了流程掌握和更多的常量,每個(gè)程序的著色指令增加到了1024條。PS2.0具備完全可編程的架構(gòu),能對(duì)紋理效果即時(shí)演算、動(dòng)態(tài)紋理貼圖,還不占用顯存,理論上對(duì)材質(zhì)貼圖的分辨率的精度提高無限多;另外PS1.4只能支持28個(gè)硬件指令,同時(shí)操作6個(gè)材質(zhì),而PS2。0卻可以支持160個(gè)硬件指令,同時(shí)操作16個(gè)材質(zhì)數(shù)量,新的高精度浮點(diǎn)數(shù)據(jù)規(guī)格可以使用多重紋理貼圖,可操作的指令數(shù)可以任意長(zhǎng),電影級(jí)別的顯示效果輕而易舉的實(shí)現(xiàn)。??圖注:3DMark03第四項(xiàng)游戲測(cè)試MotherNature基于ShaderModel2.0的3DMark03第四項(xiàng)游戲測(cè)試MotherNature,對(duì)Shader單元運(yùn)算簡(jiǎn)潔度和材質(zhì)大小提出格外嚴(yán)苛的要求,當(dāng)時(shí)只有高端顯卡才能流暢通過該測(cè)試。VS2。0通過增加Vertex程序的靈敏性,顯著的提高了老版本(DirectX8)的VS性能,新的掌握指令,可以用通用的程序代替以前專用的單獨(dú)著色程序,效率提高很多倍;增加循環(huán)操作指令,削減工作時(shí)間,提高處理效率;擴(kuò)展著色指令個(gè)數(shù),從128個(gè)提升到256個(gè)。最重要的一點(diǎn)改進(jìn)是增加對(duì)浮點(diǎn)數(shù)據(jù)的處理功能,以前GPU只能對(duì)整數(shù)進(jìn)行處理,改進(jìn)后提高渲染精度,使最終處理的顏色格式達(dá)到電影級(jí)別。ShaderModel2。0時(shí)代突破了以前限制PC圖形圖象質(zhì)量在數(shù)學(xué)上的精度障礙,它的每條渲染流水線都升級(jí)為128位浮點(diǎn)顏色,讓游戲程序設(shè)計(jì)師們更容易更輕松的制造出更漂亮的效果.如果說DirectX8中的Shader單元還是個(gè)簡(jiǎn)潔嘗試的話,DirectX9中的Shader則成為了標(biāo)準(zhǔn)配置.除了版本升級(jí)到2.0外,DirectX9中PS單元的渲染精度已達(dá)到浮點(diǎn)精度,硬件T&L單元也成為歷史的產(chǎn)物被取消,在較低DirectX版本游戲運(yùn)行時(shí)會(huì)使用VS單元模擬執(zhí)行硬件T&L單元的功能。?第7頁:兩家廠商的不同命運(yùn)●兩家廠商的不同命運(yùn)從DirectX9開頭,PC顯卡業(yè)界由三名大佬掌權(quán),它們是微軟、ATI和NVIVIA。其中,微軟擔(dān)當(dāng)3DAPI軟件進(jìn)展商的角色,不斷更新DirectX應(yīng)用程序接口,其它兩個(gè)顯卡廠商則緊緊跟隨,推出相應(yīng)的硬件產(chǎn)品,它們都想在將來的DX9市場(chǎng)中稱霸,但卻遇到了不同的待遇.實(shí)際上現(xiàn)在理性回顧當(dāng)時(shí)的場(chǎng)景,ATI搶先發(fā)布了代號(hào)R300的Radeon9700,不過,它發(fā)布時(shí)的DX9未完善,微軟則會(huì)在最終版中加入VS(VertexShader,頂點(diǎn)描影)2.0、PS(PixelShader,像素描影)3.0。NVIDIA為了支持更多特性而延遲了NV30的發(fā)布,惋惜它始終未能支持完整的VS3。0/PS3。0特性??傊珹TI和NVIDIA都不行能實(shí)現(xiàn)真正的DX9,這是由兩個(gè)廠商一手造成的。ATI發(fā)布Radeon9700時(shí),選擇了VS2.0/PS2。0,NVIDIA選擇了VS2.0/PS3.0。ATI和NVIDIA的分歧嚴(yán)重影響了DX的進(jìn)展,甚至連OpenGL2.0也受到牽連,微軟則想取得領(lǐng)導(dǎo)地位,始終實(shí)行拖沿策略,以便保持自己在3DAPI的優(yōu)勢(shì),借以打擊OpenGL.?

圖注:Radeon9700以最快速度開啟了DirectX9時(shí)代,并長(zhǎng)期占據(jù)了性能寶座●Radeon9700系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★★市場(chǎng)優(yōu)勢(shì):★★★★☆但是ATI選擇的是產(chǎn)品的發(fā)布速度,它堅(jiān)信戰(zhàn)場(chǎng)上兵貴神速.所以在NVIDIA沉醉于GeForce4Ti帶來的全盛時(shí),ATI于2002年7月發(fā)布了首款支持DirectX9的GPU——Radeon9700。首款DX9圖形芯片,256Bit的顯存位寬,9700憑借8條管線理所當(dāng)然的坐上了3D之王的寶座。由Radeon9700衍生出的中端產(chǎn)品也吸引了消費(fèi)者的眼球.當(dāng)年9500顯卡上演的改造風(fēng)波也被傳為佳話,9500黃金版(4管線可改8管線,128MB256Bit顯存;一般9500為4管線可改8管,64MB128Bit顯存)的知名度甚至要蓋過9700。直到年末,精準(zhǔn)地說是在2002年11月18日,Comdex2002上,NVIDIA發(fā)布了研發(fā)代號(hào)NV30的GeForceFX,“FX"代表NVIDIA收購3DFX之后的首款作品。這款產(chǎn)品擁有當(dāng)時(shí)最大的功耗,最夸張的散熱器設(shè)計(jì),多項(xiàng)半導(dǎo)體行業(yè)領(lǐng)先技術(shù),卻由于一些細(xì)節(jié)方面導(dǎo)致了GeForceFX的全盤皆輸。種種跡象都表明,GeForceFX5800Ultra是一款失敗的產(chǎn)品,12層PCB以及GDDR2顯存帶來的高額成本,以及高噪音高功耗的表現(xiàn)使得GeForceFX5800Ultra在于ATIRadeon9700Pro的競(jìng)爭(zhēng)中敗下陣來,受到自身4x2流水線架構(gòu)以及性能低下的Shader執(zhí)行效率限制,導(dǎo)致3D性能上GeForceFX5800Ultra也得不到半點(diǎn)好處。為了彌補(bǔ)高端市場(chǎng)上的失策,NVIDIA針對(duì)主流市場(chǎng)以及低端市場(chǎng)樂觀的推出了NV30的精簡(jiǎn)版本NV31、NV34,即GeForceFX5600以及FX5200,惋惜架構(gòu)仍然繼承了NV30的高頻低能。

圖注:GeForceFX5800Ultra由于晶體管數(shù)達(dá)到創(chuàng)紀(jì)錄的1。25億個(gè),驚人的500MHz默認(rèn)頻率,致使NVIDIA不得不為GeForceFX5800Ultra搭配“FXFlow”的散熱系統(tǒng),它包含一個(gè)銅制散熱片、熱管和換氣裝置。●GeForceFX5800系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★市場(chǎng)優(yōu)勢(shì):★★★Radeon9700成為了ATI最成功的一代顯卡,而NVIDIA隨后推出GeforceFX系列則是NV最受爭(zhēng)議的一代顯卡。無論高中低端,R300架構(gòu)造就的ATI顯卡在競(jìng)爭(zhēng)中都取得明顯的優(yōu)勢(shì).但R300架構(gòu)也擁有明顯的不足。R300芯片本身是32位和24位混合型的,內(nèi)核像素描影器是FP24,而紋理尋址操作和頂點(diǎn)描影管道是FP32.R300在像素描影管道中有24位內(nèi)部浮點(diǎn)精度,而代號(hào)NV30的GeforceFX系列支持IEEE—32(S23e8)浮點(diǎn)精度,比DX9更精確。但R300的市場(chǎng)把握水平要明顯強(qiáng)于NV30,最后帶來了ATI的成功.這一優(yōu)勢(shì)持續(xù)了兩年多,市場(chǎng)份額資料稱,2004年ATI占了全球獨(dú)立圖形芯片出貨量的一半兒還多.ATI終究成為第一大獨(dú)立圖形芯片廠商,成功超越了NVIDIA.Radeon9700的先進(jìn)架構(gòu)造就了它的高效率.在普遍\情況下,它能比昔日的王者GeForce4Ti4600快大約15-20%。但是,當(dāng)運(yùn)行抗鋸齒(AA)和各異向性過濾(AF)計(jì)算時(shí),它能比Ti4600快大約40-100%。在當(dāng)時(shí)來說,這種性能提升出乎全部用戶意料,R300使到人們廣泛接受AA和AF,使之成為必不行少的功能.R300也由于眾多優(yōu)秀之處成為歷史上最長(zhǎng)壽的顯示芯片,R300推出3年后,還能為新游戲夠供應(yīng)合理的性能??偠灾瓺irectX9。0時(shí)代的最初故事就是這樣布滿火藥味和戲劇性。?第8頁:NVIDIA亡羊補(bǔ)牢ATI仍然堅(jiān)挺●FX5900亡羊補(bǔ)牢,Radeon9800仍然堅(jiān)挺經(jīng)歷了GeForceFX5800的慘痛教訓(xùn)之后,NVIDIA開頭著手做兩件事。首先是對(duì)NV30架構(gòu)進(jìn)行改進(jìn)代號(hào)NV35,以圖挽回市場(chǎng)份額,重新奪取性能寶座;另一方面則加速NV40芯片設(shè)計(jì),這將是NVIDIA在將來上演的重頭戲。半年后,也就是2003年5月份,NVIDIA發(fā)布了NV35核心的GeForceFX5900,與GeForceFX5800Ultra相比,GeForceFX5900采納了更加成熟的0.13微米工藝,晶體管數(shù)量雖然增加了500萬個(gè)晶體管,不過借助成熟的0.13微米工藝,芯片良率以及發(fā)熱量都有了改善。??圖注:改進(jìn)后的GeForceFX5900擁有眾多優(yōu)勢(shì),也為NVIDIA摘到了高耗能的帽子●GeForceFX5900系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★☆市場(chǎng)優(yōu)勢(shì):★★★☆圖像技術(shù)方面這款產(chǎn)品也擁有眾多亮點(diǎn),新的NV35采納了備受業(yè)界好評(píng)的CineFX2.0引擎(增加了UltraShadow光影技術(shù)以及IntellisampleHTC技術(shù))。其中IntellisampleHTC(高分辨率壓縮技術(shù)),能有效改善全屏抗鋸齒以及各向異性過濾的效果。新的NV35采納了CineFX2。0引擎,和第1代CineFX相比,NVIDIA對(duì)PixelShader做出了肯定的改進(jìn),在保留FX12combiner的同時(shí)增加了兩個(gè)可進(jìn)行浮點(diǎn)運(yùn)算的miniALU,雖然miniALU的功能有限,但是還是使得NV35的浮點(diǎn)運(yùn)算能力提高了一倍。除此之外,最大的轉(zhuǎn)變就是從128bit顯存位寬升級(jí)到256bit顯存位寬,搭配的850MHzDDR-I顯存可以供應(yīng)的帶寬高達(dá)27.2GB/s,遠(yuǎn)遠(yuǎn)高于GeForceFX5800Ultra的16GB/s。不久后,NVIDIA又發(fā)布了NV36-—GeForceFX5700以及低頻版的GeForceFX5900XT顯卡,在全部繼承了NV35的基礎(chǔ)上大幅縮減了產(chǎn)品的成本。尤其是GeForceFX5900XT顯卡,憑借精準(zhǔn)的定位和較高的性價(jià)比,市場(chǎng)好評(píng)不斷。?圖注:代表ATI最高端產(chǎn)品的Radeon9800XT顯卡,使用R360核心,工藝仍然不變●Radeon9800系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★市場(chǎng)優(yōu)勢(shì):★★★☆ATI采納了同樣的方法,并且沒有重新設(shè)計(jì)架構(gòu),只是用更小的代價(jià)稍作改進(jìn)推出了代號(hào)R350的Radeon9800。雖然9800在架構(gòu)上并沒有太多的改進(jìn),制造工藝仍然維持0.15微米(之后高頻的9800XT還是0。15微米),但頻率的提高讓它的性能比9700更上一層樓,SmartShader2.1和SmoothVision2.1可能就是為數(shù)不多的改進(jìn)了.在此基礎(chǔ)之上的巔峰之作9800XT顯卡更是把頻率提升到了極限。2004年4月,ATI在掌握高端市場(chǎng)的基礎(chǔ)上,為我們帶來了一款意想不到的中端經(jīng)典顯卡--Radeon9550,這款芯片的成功至今讓ATI自己都無法復(fù)制。Radeon9550仍然基于RV350制造,在所支持特效方面也完全與該系列最高端的Radeon9600XT相同。?圖注:橫掃中端市場(chǎng)的Radeon9550顯卡給游戲玩家供應(yīng)了當(dāng)時(shí)最高的性價(jià)比●Radeon9550系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★市場(chǎng)優(yōu)勢(shì):★★★★★4條管線和Radeon9800級(jí)別的DX9規(guī)格保證了Radeon9550強(qiáng)大的實(shí)力,它與Radeon9600XT的差別僅僅在于頻率,這使得各種非公版、超頻版9550立刻席卷中低端市場(chǎng),掀起了一股超頻之風(fēng),當(dāng)然成本下降帶來的合理的定價(jià),是Radeon9550成為一代經(jīng)典最主要的因素.9550發(fā)布之時(shí)ATI并沒有對(duì)其所搭配顯存做太多限制,同時(shí)RV350核心出色的超頻能力更給予了Radeon9550強(qiáng)大的生命力。靈敏的規(guī)格和優(yōu)秀的性價(jià)比使它成為ATI低端顯卡中銷量最高的型號(hào)。23cd?第9頁:DirectX9。0c開創(chuàng)GPU黃金期后DirectX9.0時(shí)代開創(chuàng)PC游戲黃金期●ShaderModel3.0將DirectX9推向高峰與過去的DirectX9.0b和ShaderModel2.0相比較,DirectX9。0c最大的改進(jìn),便是引入了對(duì)ShaderModel3。0的全面支持。ShaderModel3.0除了連續(xù)擴(kuò)展指令長(zhǎng)度之外,還提升了指令執(zhí)行能力,它開頭支持動(dòng)態(tài)分支操作,像素程序開頭支持分支操作(包括循環(huán)、if/else等),支持函數(shù)調(diào)用.因此DirectX9。0c和ShaderModel3.0標(biāo)準(zhǔn)的推出,可以說是DirectX進(jìn)展歷程中的重要轉(zhuǎn)折點(diǎn)。ShaderModel3.0除了取消指令數(shù)限制和加入位移貼圖等新特性之外,更多的特性都是在解決游戲的執(zhí)行效率和品質(zhì)上下功夫,ShaderModel3.0誕生之后,人們對(duì)待游戲的態(tài)度也開頭從過去單純地追求速度,轉(zhuǎn)變到游戲畫質(zhì)和運(yùn)行速度兩者兼顧。因此ShaderModel3.0對(duì)游戲產(chǎn)業(yè)的影響可謂深遠(yuǎn)。ShaderModel3.0對(duì)比ShaderModel2.0的改進(jìn)

在3D游戲工作時(shí),其實(shí)PixelShader、TMU以及ROP部分都格外重要。讓我們回想一下當(dāng)年《FIFA98》等老一代3D游戲,當(dāng)時(shí)三角形生成能力是最為看重的,基本沒有應(yīng)用到紋理貼圖與像素著色,真正的工作部分是被成為頂點(diǎn)生成器的單元,而且也可以由CPU來模擬執(zhí)行.但是進(jìn)展到DirectX6與DirectX7時(shí)期,大量3D游戲開頭追求更加豐富真實(shí)的表面效果,此時(shí)貼圖技術(shù)則飛快普及,如何供應(yīng)強(qiáng)大的紋理填充率成為關(guān)鍵。至于DirectX8之后的時(shí)代,像素處理則異軍突起并且展現(xiàn)出令人驚艷的畫質(zhì)。相對(duì)而言,ROP的概念比較難理解,這實(shí)際上是像素結(jié)果輸出處理器負(fù)責(zé)像素的最終輸出,執(zhí)行像素讀/寫操作、Z—buffer檢查、顏色混合、抗鋸齒操作等。進(jìn)入DirectX9時(shí)代以后,PixelShader技術(shù)開頭應(yīng)用得十分普遍,此時(shí)顯卡能否供應(yīng)更多的像素渲染管線成為關(guān)鍵因素。當(dāng)然,造成GPU開頭追求更多像素渲染管線的因素絕不僅僅是3D游戲普及化應(yīng)用PixelShader,PixelShader本身版本的提升也是一個(gè)重要緣由。單流水線內(nèi)置一條像素渲染管線在DirectX8游戲橫行的時(shí)代是比較合理的,由于DirectX8的PixelShader1.3允許的著色器程序比較短,此時(shí)單流水線內(nèi)的多個(gè)像素渲染管線無法發(fā)揮并行工作的優(yōu)勢(shì)。然而DirectX9時(shí)代的PixelShader2.0/3。0則全然不同,更長(zhǎng)的著色器程序指令讓多個(gè)像素渲染管線有了用武之地。

第10頁:Geforce6和RadeonX紛來沓至●Geforce6系列和RadeonX系列眾多顯卡紛來沓至NVIDIA回顧整個(gè)GeForceFX一代顯卡的表現(xiàn)時(shí)深感圓滿,對(duì)于這個(gè)始終幻想做GPU業(yè)界Intel的廠商來說,市場(chǎng)和技術(shù)的雙重失利對(duì)它打擊太大。雖然后期產(chǎn)品GeForceFX5900有尚佳的表現(xiàn),但在與ATIRadeon9800的競(jìng)爭(zhēng)中也只能說旗鼓相當(dāng),沒有占絲毫上風(fēng)。低端市場(chǎng)面對(duì)ATI眾多產(chǎn)品和優(yōu)秀的性價(jià)比,NVIDIA也感到無力回天。此時(shí)只能押寶下一代產(chǎn)品的NVIDIA顯得沒有退路。2004年4月,在投入史上最大的一筆研發(fā)經(jīng)費(fèi)后(10億美元以及500多位研發(fā)人員),NVIDIA終究發(fā)布了新一代NV40—-GeForce6800Ultra??梢哉f,GeForce6800Ultra是一款不計(jì)成本,誓要奪回性能王座的產(chǎn)品。同時(shí)它吸取了上一代產(chǎn)品的教訓(xùn),重新設(shè)計(jì)的架構(gòu)和完整支持DirectX9.0c標(biāo)準(zhǔn),讓這款顯卡以全新的形象展現(xiàn)在用戶面前。甚至有分析家評(píng)論GeForce6800和GeForceFX簡(jiǎn)直不是一家公司設(shè)計(jì)的產(chǎn)品.??圖注:架構(gòu)徹底革新之后的GeForce6800Ultra最終獲得成功●GeForce6800系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★★市場(chǎng)優(yōu)勢(shì):★★★★當(dāng)NV40代替NV3x架構(gòu)新奇出爐的時(shí)候,人們把關(guān)注的焦點(diǎn)更多的放在了采納單貼圖來加強(qiáng)Vertex和PixelShader(頂點(diǎn)著色和象素著色)能力這一改動(dòng)上面。實(shí)現(xiàn)這一點(diǎn)之后只需要將GPU處理紋理的能力加倍(也就是16×1的架構(gòu))便可以有效的將PixelShaderpipelines(象素著色管線)的數(shù)目提高到原來的4倍。在NV40中,最大象素和紋理填充率在現(xiàn)實(shí)使用中同樣可以使硬件的功能發(fā)揮得更均衡。當(dāng)處理雙重貼圖問題的時(shí)候,NV40也可以運(yùn)行在一個(gè)8x2的模式下,這時(shí)一半的管線被專用于處理每一個(gè)紋理。在這種雙重貼圖的模式下,NV40的紋理填充率和單紋理模式下是一樣的,只是象素填充率減半而已。

圖注:擁有16個(gè)像素著色器和6個(gè)頂點(diǎn)著色器的GeForce6800架構(gòu)在NV3x和NV40架構(gòu)中,都可以同時(shí)處理每個(gè)象素的z和顏色值。另外,不只是對(duì)一個(gè)象素進(jìn)行著色,在顏色單元中還可以進(jìn)行一個(gè)z或者模板操作(stenciloperation)。這使得NV3x可以在每個(gè)時(shí)鐘周期內(nèi)執(zhí)行8個(gè)z或者模板操作,而NV40則可以在每個(gè)時(shí)鐘周期內(nèi)執(zhí)行32個(gè)z或者模板緩沖操作。由于對(duì)沒有新的象素進(jìn)行繪圖,NVIDIA分別稱之為"8x0"和”32x0"。這一模式在首先進(jìn)行z—pass運(yùn)算,或者使用模板陰影的時(shí)候格外有用(在Doom3中使用到)。最重要的是NV40還引入了第三代的CineFX3。0引擎,完全符合Direct9.0C的VertexShader3。0和PixelShader3.0規(guī)范。而ATI的新產(chǎn)品卻固步自封,堅(jiān)守Direct9.0b規(guī)范。GeForce6800Ultra的推出令NVIDIA飛快奪回了失去已久顯卡性能的王冠,也將世人對(duì)NVIDIA實(shí)力的質(zhì)疑一掃而空.NVIDIA士氣大振,隨后就發(fā)布了基于NV40核心的一些列產(chǎn)品GeForce6800GT、GeForce6800和GeForce6800LE來面對(duì)不同的市場(chǎng)。主流市場(chǎng)方面,由于Direct9游戲的突飛猛進(jìn),中端GPU市場(chǎng)又消滅青黃不接,2004年8月,廣受用戶好評(píng)的NV43核心——GeForce6600系列顯卡發(fā)布。?圖注:中端市場(chǎng)上讓很多用戶憧憬的GeForce6600系列顯卡大量上市●GeForce6600系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★☆市場(chǎng)優(yōu)勢(shì):★★★★★GeForce6600系列顯卡恰當(dāng)?shù)厥褂昧薚SMC0.11微米工藝,顯存位寬為中端顯卡最適合的128bit,NV43的頻率可以輕松達(dá)到500MHz,并且給用戶預(yù)留了超頻空間。同時(shí)NV43還是首款原生支持PCI-E的顯卡,并且?guī)砹薔VIDIA與3DFX合作后的最新技術(shù)——SLI,這項(xiàng)技術(shù)已經(jīng)在GPU領(lǐng)域失傳多年,沒人想到NVIDIA會(huì)在這一代產(chǎn)品上身上將它復(fù)活。NVIDIA為了GeForce6的成功幾乎用盡全部研發(fā)力氣,而另一方ATI則輕松很多,它推出了架構(gòu)上并沒有太大變化的RadeonX800系列,像素管線翻倍提升至16條,基于對(duì)圖形領(lǐng)域和游戲廠商開發(fā)能力的推斷,ATI認(rèn)為DirectX9.0b將會(huì)持續(xù)很長(zhǎng)時(shí)間,對(duì)手也不會(huì)支持新的圖形API,所以代號(hào)R400的RadeonX800和上一代GPU核心一樣沒有支持最新的ShaderModel3。0規(guī)范,但是這次ATI賭輸了。

圖注:ATI在高端市場(chǎng)推出的RadeonX800XT顯卡●RadeonX800系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★市場(chǎng)優(yōu)勢(shì):★★★☆首先令ATI始料未及的是GeForce6系列完全依據(jù)DirectX9.0cSM3。0的標(biāo)準(zhǔn)設(shè)計(jì),而代號(hào)R420的X800系列僅支持DirectX9.0bSM2。0b,雖然當(dāng)時(shí)并沒有多少游戲能夠支持SM3.0和HDR,但這已經(jīng)讓X800系列失去了上代9700的王者風(fēng)范。其次基于R300的芯片架構(gòu)在很多測(cè)試中已經(jīng)顯得老邁,無法和全新設(shè)計(jì)的GeForce6800Ultra相抗衡。?圖注:代號(hào)R420的X800系列架構(gòu)圖我們從圖中可以清楚看到6個(gè)頂點(diǎn)著色器、16個(gè)像素著色器和256位顯存位寬同時(shí)6800和X800的時(shí)代正值A(chǔ)GP、PCI-E接口改朝換代時(shí)期,NVIDIA合理的通過使用橋接芯片兼顧了AGP/PCI-E平臺(tái),而ATI堅(jiān)持“有路何必搭橋"的策略使得研發(fā)成本增加不少,這也導(dǎo)致X800一代ATI的顯示芯片規(guī)格格外紛繁蕪雜。綜合來說,X800XT與6800Ultra的3D性能差距不是太明顯,但是SLI雙卡互聯(lián)技術(shù)讓ATI失去了高端市場(chǎng),由于追求極致3D性能的用戶并不會(huì)在意價(jià)格,雖然ATI用最快速度開發(fā)出了CrossFire技術(shù),但它畢竟成了追逐者而不是領(lǐng)導(dǎo)者.?圖注:連續(xù)Radeon9500經(jīng)典的中低端產(chǎn)品RadeonX550●RadeonX550系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★市場(chǎng)優(yōu)勢(shì):★★★★☆A(yù)TI抓緊時(shí)間推出了基于X800架構(gòu)的中端產(chǎn)品X700,雖然性能上和6600系列不相上下,但是終因沒有對(duì)手的技術(shù)亮點(diǎn)多,而關(guān)注度下降。但是后期的X800Pro和AGP接口的X800GTO(shè)在發(fā)布一年之后由于良好的性價(jià)比而受到AGP升級(jí)用戶的青睞。在低端市場(chǎng)ATI也打出了一些亮點(diǎn),Radeon9550在2004年的夏天制造了AGP顯卡市場(chǎng)的奇跡,借助于9550的神話,ATI在PCI-E市場(chǎng)推出了RadeonX550(9550的PCI—E版)。采納0.11微米制程的X550并不是經(jīng)過全新設(shè)計(jì)的產(chǎn)品,它與X600系列(RV380)、X300系列(RV370)在架構(gòu)上是完全相同的。功能及特性上也完全不變,都是擁有4條像素渲染管線和2個(gè)頂點(diǎn)處理單元的產(chǎn)品。它的成功主要在于低價(jià)和快速占據(jù)低端裝機(jī)和品牌機(jī)市場(chǎng)。2423?第11頁:Geforce7對(duì)陣ATI兩代核心設(shè)計(jì)●Geforce7系列對(duì)陣ATI兩代核心設(shè)計(jì)讓我們從另外的一個(gè)角度去看NV3X--他只是NV的一塊探路石,雖然有用性能不佳,但是為下一代產(chǎn)品的技術(shù)開發(fā)積累了大量的閱歷,我們可以看到,NV30中的很多技術(shù)都被完整地集成到了NV40中,也就是說NVIDIA在NV30上的長(zhǎng)期投資開頭產(chǎn)生回報(bào)了——NV40在功能上明顯超過了ATI的R420,而開發(fā)難度也沒有大大增加,就是由于一些關(guān)鍵技術(shù)早在NV30這代產(chǎn)品中就已經(jīng)被提前開發(fā).要知道NV40的發(fā)布,只是在NV35發(fā)布后的短短5個(gè)月。2005年06月21日,NVIDIA新一代GPU核心,代號(hào)G70的Geforce7800GTX發(fā)布了,你無法想象NVIDIA是如何在僅僅一年后設(shè)計(jì)并發(fā)布了這款新的GPU,由于這時(shí)ATIRadeonX800顯卡正處于熱賣中。Geforce7800GTX讓原來就處于DirectX9.0bSM2.0的標(biāo)準(zhǔn)的ATI更加無力回天,畢竟自己的GPU已經(jīng)落后對(duì)手兩代,ATI只能選擇用心開發(fā)R520核心,等待已經(jīng)越來越渺茫的翻身機(jī)會(huì)……G70在正式定型之前的開發(fā)代號(hào)被稱為NV47,由于它實(shí)際上就是在NV40的基礎(chǔ)上改進(jìn)升級(jí)而來的,當(dāng)G70正式面世的時(shí)候,官方的技術(shù)文檔以及核心架構(gòu)的展現(xiàn)證明白它發(fā)布之前所使用的核心代號(hào)和推斷的正確性.??圖注:飛快推出的Geforce7800GTX當(dāng)仁不讓地奪取了高性能桂冠●Geforce7800系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★★市場(chǎng)優(yōu)勢(shì):★★★G70在架構(gòu)上基本沒有太大的創(chuàng)新(盡管NVIDIA將其美名曰“全新的架構(gòu)”),是一款和GeForce6(NV4x)系列基于同一個(gè)架構(gòu)設(shè)計(jì)的強(qiáng)化版,核心的制程由0.13μm進(jìn)化至0.11μm,核心技術(shù)照舊支持ShaderAPIProgrammableShader3.0并在算法上加以強(qiáng)化,除PixelShader管線增加到24個(gè),頂點(diǎn)著色單元增加到8個(gè)之外,此外7800GTX還新增加/加強(qiáng)了透明材質(zhì)智能采樣抗鋸齒、次表面散射、ReliefMapping、64BitHDR運(yùn)算、法線貼圖壓縮、光能傳遞貼圖算法等一系列即將在下一代游戲中廣泛消滅的技術(shù)。下表列出的是NV40和G70的基本性能參數(shù)對(duì)比。?圖注:NV40和G70的基本性能參數(shù)對(duì)比經(jīng)歷了NV30的失敗與NV40的小試牛刀,7800GTX踏上了ATI推崇的延長(zhǎng)新架構(gòu)開發(fā)周期的道路.從G70的核心架構(gòu)來看,G70整個(gè)架構(gòu)就是對(duì)NV40的一個(gè)補(bǔ)完與升級(jí),并著重對(duì)將來游戲中常用的次表面散射、高動(dòng)態(tài)范圍光照、法線貼圖壓縮等前沿技術(shù)增加到核心的硬件支持上。不難發(fā)現(xiàn),NVIDIA此舉就等于ATI在9700-9800-X800-X850的進(jìn)化過程一樣,在同一個(gè)具有相當(dāng)前瞻性的架構(gòu)上進(jìn)行不斷的深化和升級(jí)補(bǔ)完,保持一個(gè)DirectX大版本號(hào)采納一個(gè)統(tǒng)一架構(gòu)的部署方式以適應(yīng)應(yīng)用程序的進(jìn)展以及舒緩昂揚(yáng)的開發(fā)費(fèi)用.

始終以來,SM3.0技術(shù)被NVIDIA作為獨(dú)有賣點(diǎn)而在Geforce6/7系列顯卡上大作宣揚(yáng),該技術(shù)的缺失也使得R4XX系列顯卡在和競(jìng)爭(zhēng)對(duì)手的產(chǎn)品競(jìng)爭(zhēng)中處于格外不利的地位。雖然ATI的R500在游戲機(jī)市場(chǎng)占得先機(jī),但桌面領(lǐng)域的R520卻經(jīng)歷了數(shù)次跳票之后才在2005年10月來到人們的面前,結(jié)束了ATI顯卡不支持DirectX9.0c的尷尬歷史。?圖注:ATI終究發(fā)布了期盼已久的X1800XT顯卡●RadeonX1800系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★市場(chǎng)優(yōu)勢(shì):★★★和每一代顯卡產(chǎn)品一樣,ATIRadeonX1000顯卡也依據(jù)管線數(shù)目,顯存位寬/容量將產(chǎn)品劃分為高、中、低三個(gè)檔次,依次命名為X1800/X1600/X1300。每個(gè)系列又依據(jù)核心/顯存頻率的不同而再細(xì)分出若干個(gè)產(chǎn)品型號(hào),如Pro、XL、XT等。RadeonX1000的問世使得不少玩家在GeForce6/7之外,又多了一個(gè)選擇?;赗520的X1800XT是全球首批采納0.09微米制程的顯示核心.采納新工藝的好處是不言而喻的,除了使顯卡的核心頻率能達(dá)到前所未有的高度之外也降低了芯片的生產(chǎn)成本。這也讓只有16管線的X1800XT具備了和24管線的7800GTX一較高下的實(shí)力。如果你認(rèn)為ATI的新架構(gòu)僅有一款R520,那就大錯(cuò)特錯(cuò)了,由于早就在代號(hào)為R520的RADEONX1800發(fā)布的時(shí)候,代號(hào)為R580的RADEONX1900就完成流片、取樣等一系列的后期研發(fā),幾乎是進(jìn)入生產(chǎn)階段了。在當(dāng)時(shí)ATI供應(yīng)應(yīng)第三方廠商的一些機(jī)密文件中也表明,ATI對(duì)R580布滿了信心,字里行間所示意的信息當(dāng)然就是盼望這些顯卡廠商不要由于RadeonX1800延誤而對(duì)ATI的強(qiáng)大研發(fā)能力失去信心。2006年1月24日,距離RadeonX1800發(fā)布4個(gè)月還不到的時(shí)間,ATI正式發(fā)布新一代的高端產(chǎn)品—-RadeonX1900系列。作為06年推出的新高端產(chǎn)品,RADEONX1900不僅擁有高時(shí)鐘頻率的特點(diǎn),而且還在架構(gòu)上作了大刀闊斧的改進(jìn),性能獲得顯著提升.在玩家眼中最為出色的3:1黃金架構(gòu)正是在R580時(shí)代誕生。?圖注:代號(hào)R580的RADEONX1900系列的每條傳統(tǒng)的像素管線擁有3個(gè)像素渲染單元傳統(tǒng)的管線概念(Pipeline)中,像素渲染單元(PixelShader)跟Pipeline數(shù)目相同,NVIDIA的G70圖形就是這樣一個(gè)概念;但是ATI在全新的R580圖形芯片中,略微修正了像素渲染單元跟Pipeline的關(guān)系。RadeonX1900需要重點(diǎn)強(qiáng)調(diào)的地方在于,R580圖形芯片擁有16條傳統(tǒng)的像素管線(PixelPipeline),但是卻擁有48個(gè)像素渲染單元和16個(gè)紋理單元,算術(shù)處理能力是以前旗艦級(jí)GPU的3倍,在晶體管數(shù)量只增加20%的情況下,渲染能力理論上增加了200%,像素渲染單元跟紋理單元的比例是3:1。

圖注:代表DirectX9的頂級(jí)顯卡--RadeonX1900XTX●RadeonX1900系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★★市場(chǎng)優(yōu)勢(shì):★★★☆這一改進(jìn)使得RadeonX1900XTX具備了48個(gè)像素著色器的流水線設(shè)計(jì),FP32精度像素運(yùn)算能力達(dá)到374.4GFLOPS,如果再加上頂點(diǎn)著色器的話,RadeonX1900XTX的FP32計(jì)算能力總共會(huì)是426.4GFLOPS。相比之下,NVIDIA的GeForce7800GTX512MB(550MHz內(nèi)核)只能供應(yīng)211.2GFLOPS的FP32像素運(yùn)算能力和47。2GFLOPS的FP32頂點(diǎn)運(yùn)算能力。在R580架構(gòu)之后,ATI將3:1黃金架構(gòu)連續(xù)在中低端顯卡上,分別誕生了如下幾款值得我們回憶的產(chǎn)品,它們從上市之初開頭壓制NVIDIA的同檔次產(chǎn)品直到停產(chǎn)退市,都保持著格外高的性價(jià)比,這是用戶最為欣賞和稱道的優(yōu)勢(shì):●X1300XT,X1650Pro系列:12個(gè)像素單元,4個(gè)紋理單元,128Bit顯存?●X1650XT系列:24個(gè)像素單元,8個(gè)紋理單元,128Bit顯存

?●X1950Pro系列:36個(gè)像素單元,12個(gè)紋理單元,256Bit顯存

●X1950GT系列:36個(gè)像素單元,12個(gè)紋理單元,256Bit顯存?第12頁:統(tǒng)一終止分立,架構(gòu)之爭(zhēng)日趨激烈統(tǒng)一終止分立,架構(gòu)之爭(zhēng)日趨激烈●統(tǒng)一渲染架構(gòu)的誕生ShaderModel在誕生之初就為我們供應(yīng)了PixelShader(頂點(diǎn)著色器)和VertexShader(像素著色器)兩種簡(jiǎn)略的硬件規(guī)律,它們是相互分置彼此不干涉的。但是在長(zhǎng)期的進(jìn)展過程中,NVIDIA和ATI的工程師都認(rèn)為,要達(dá)到最佳的性能和電力使用效率,還是必須使用統(tǒng)一著色器架構(gòu),否則在很多情況下PixelShader計(jì)算壓力很輕造成大量PixelShader單元閑置,VertexShader資源有限但遇到大量三角形時(shí)會(huì)忙不過來.也就是說不再區(qū)分PixelShader和VertexShader,最終設(shè)計(jì)出來的產(chǎn)品可以在任何API編程模型中都不存在任何頂點(diǎn)/像素著色器固定比率或者數(shù)量限制.

每一幀渲染中VertexShader和PixelShader負(fù)載壓力幾乎沒有相關(guān)性,總是在消滅資源閑置和資源緊缺,所以有必要使用統(tǒng)一著色器架構(gòu).在統(tǒng)一著色器架構(gòu)的GPU中,VertexShader和PixelShader概念都將廢除同時(shí)代之以ALU.ALU是個(gè)完整的圖形處理體系,它既能夠執(zhí)行對(duì)頂點(diǎn)操作的指令(代替VS),又能夠執(zhí)行對(duì)象素操作的指令(代替PS)。GPU內(nèi)部的ALU單元甚至能夠依據(jù)需要任意切換調(diào)用,從而極大的提升游戲的表現(xiàn).微軟XBOX360所采納的Xenos圖形處理器,第一次引入了統(tǒng)一著色器架構(gòu),這個(gè)著色器架構(gòu)包含了3個(gè)獨(dú)立的著色器矩陣,每個(gè)著色器矩陣內(nèi)有16個(gè)5D向量SIMD單元,這些SIMD單元既可以執(zhí)行VertexShader也可以執(zhí)行PixelShader,可以稱之為符合DirectX9標(biāo)準(zhǔn)的統(tǒng)一著色器架構(gòu)。隨后NVIDIA推出的GeForce8800GTX使用了128個(gè)標(biāo)量流處理器(StreamProcessor)。在通用計(jì)算方面,GeForce8800GTX的統(tǒng)一架構(gòu)比Xbox360的C1更先進(jìn)、更強(qiáng)大,這表現(xiàn)在標(biāo)量設(shè)計(jì)、整個(gè)US和Shader簇內(nèi)的MIMD化執(zhí)行。?圖注:AMD歷代著色器演進(jìn)在GeForce8800GTX之后,AMD經(jīng)過數(shù)月的延遲后推出了代號(hào)R600的RADEONHD2900XT核心,這款產(chǎn)品和NVIDIA的新品一樣使用了統(tǒng)一渲染架構(gòu),不同之處在于2900XT的64個(gè)SIMD著色器內(nèi)包含了5路超標(biāo)量(superscalar)的運(yùn)算單元(ALU),我們習(xí)慣性稱其擁有320個(gè)流處理器。組織形式方面,SIMD單元采納超標(biāo)量+VLIW(甚長(zhǎng)指令)設(shè)計(jì),雖然從數(shù)量上看規(guī)模浩大(共擁有320個(gè)ALU,8800GTX為128個(gè)),但是執(zhí)行效率在實(shí)際運(yùn)算中會(huì)發(fā)生不行忽視地衰減。為便利商量,在后文分析中,我們將更多地把著色器Shader稱為流處理器StreamProcessor。2765?第13頁:G80橫空出世,R600臨危受命●GeForce8橫空出世,RadeonHD2000臨危受命理論上說DirectX10并沒有要求統(tǒng)一VertexShader和PixelShader,它只是增加了紋理規(guī)格、寄存器數(shù)目等規(guī)格,同時(shí)引入GeometryShader(可批量進(jìn)行幾何處理)加強(qiáng)曲面處理能力.在GeForce8800GTX發(fā)布之前,NVIDIA也在媒體表示可能考慮在DirectX10時(shí)代連續(xù)使用分立的著色器,但最終產(chǎn)品還是將著色器統(tǒng)一化。實(shí)際上在2003年,ATI的RadeonHD2000也進(jìn)入開發(fā)期,而在發(fā)布這款產(chǎn)品之前,ATI發(fā)布了一款特殊的GPU,它針對(duì)微軟XBOX360游戲機(jī)設(shè)計(jì),代號(hào)為Xenos。Xenos是微軟與ATI的合作結(jié)晶,于2005年發(fā)布在XBOX360游戲主機(jī)中。這款GPU最大的特色是采納了統(tǒng)一著色器單元架構(gòu),頂點(diǎn)、像素著色器程序都在同樣的單元上執(zhí)行,由線程調(diào)度器作動(dòng)態(tài)的資源安排,還引入了頂點(diǎn)紋理拾取(VTF單元)等ATI同期R5XX產(chǎn)品所不具備的特性。??圖片:第一款采納統(tǒng)一渲染架構(gòu)的GPU是Xenos芯片代號(hào)G80的GeForce8800GTX相對(duì)于上一代產(chǎn)品,幾乎經(jīng)過了重新設(shè)計(jì),各方面的改進(jìn)都格外大。而R600家族的體系架構(gòu)在肯定程度上可以看作是連續(xù)自Xenos。但是ATI在2006年7月24被AMD收購以及它之前的研發(fā)精力不足,直接影響了R600家族產(chǎn)品的開發(fā)受到很大影響。最后導(dǎo)致沒有統(tǒng)一架構(gòu)設(shè)計(jì)閱歷的NVIDIA在2006年11月8日成功發(fā)布了G80核心的GeForce8800GTX顯卡,巨大的技術(shù)革新和性能提升,獲得了用戶的全都認(rèn)同.?圖片:至今耳熟能詳?shù)腉80架構(gòu)GeForce8800GTX顯卡●GeForce8800系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★★市場(chǎng)優(yōu)勢(shì):★★★★G80架構(gòu)使用了多指令流多數(shù)據(jù)流MIMD結(jié)構(gòu)標(biāo)量流處理器,一共128個(gè)流處理器替代了原來分立的VertexShader和PixelShader,擁有當(dāng)時(shí)最強(qiáng)的性能,當(dāng)然G80擁有6.81億個(gè)晶體管,是G71的2.5倍之多,顯存方面384Bit顯存位寬也充分保證了數(shù)據(jù)吞吐能力。在性能上GeForce8800GTX顯卡把3D圖形處理器的性能又引領(lǐng)到一個(gè)前所未有的高度,這給對(duì)手承重的打擊,ATI竟在半年之內(nèi)拿不出一款足以抗衡G80核心的產(chǎn)品。NVIDIA憑借G80的革命性架構(gòu)毫無懸念的奪取了3D性能的制高點(diǎn).直到2007年6月3日,AIT終結(jié)了長(zhǎng)達(dá)7個(gè)月的等待時(shí)間,RadeonHD2000家族終究發(fā)布。雖然業(yè)內(nèi)第一片DX10GPU的頭銜被G80搶了去,但ATI這次也沒有被NVIDIA牽著鼻子走。除了對(duì)DX10和統(tǒng)一著色架構(gòu)的支持外,R600還加入了一些特有的功能。例如,獨(dú)立于幾何著色器(GeometryShader)的專用鑲嵌單元(tessellation),加入屬于DirectX10。1范疇的可編程AA功能等。?圖片:失去性能皇冠的RadeonHD2900XT顯卡●RadeonHD2900系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★市場(chǎng)優(yōu)勢(shì):★★☆雖然我們盡力提及這款GPU的重要性和價(jià)值,但它畢竟還是輸了,由于流處理器架構(gòu)過于依靠以前的SIMD結(jié)構(gòu)著色器模式,所以代號(hào)R600的RadeonHD2900XT只能和對(duì)手的次高端產(chǎn)品Geforce8800GTS相抗衡。為了彌補(bǔ)性能下降,ATI提高了這款GPU的運(yùn)行頻率到740MHz,配以512位顯存掌握器,惋惜的是同樣使用80nm工藝生產(chǎn),2900XT的最大功耗達(dá)到了215W。?第14頁:G92連續(xù)領(lǐng)航,RV670開頭轉(zhuǎn)變●G92連續(xù)領(lǐng)航,RadeonHD3000開頭轉(zhuǎn)變?cè)?007年圣誕節(jié)之際,NVIDIA的改進(jìn)版G80核心誕生了.新核心被命名為G92,它引入了更多的紋理定址單元、完整的H264硬件解碼加速以及一些紋理處理方面的增強(qiáng),晶體管數(shù)量從G80的680M提升到了754M,但由于新制程的應(yīng)用,G92無論是面積、發(fā)熱還是功耗都表現(xiàn)優(yōu)秀。G92比G80增加了大約74M晶體管,這增加的晶體管包括了G80顯卡上分離的NVIO(G80專用的輸出/輸入芯片)、額外的32(8800GT上共開啟了56)個(gè)紋理定址單元、增強(qiáng)的視頻處理引擎(來自G84)、PCIExpress2.0、HDMI的支持。??圖注:?jiǎn)尾凵岬母叨孙@卡Geforce8800GT上市僅1500元左右●G92核心Geforce8800系列產(chǎn)品技術(shù)優(yōu)勢(shì):★★★★★市場(chǎng)優(yōu)勢(shì):★★★★G92核心的第一槍是經(jīng)典的Geforce8800GT。NVIDIA技術(shù)市場(chǎng)經(jīng)理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論