逃離x86架構(gòu)-----CPU體系結(jié)構(gòu)CISC與RISC之爭_第1頁
逃離x86架構(gòu)-----CPU體系結(jié)構(gòu)CISC與RISC之爭_第2頁
逃離x86架構(gòu)-----CPU體系結(jié)構(gòu)CISC與RISC之爭_第3頁
逃離x86架構(gòu)-----CPU體系結(jié)構(gòu)CISC與RISC之爭_第4頁
逃離x86架構(gòu)-----CPU體系結(jié)構(gòu)CISC與RISC之爭_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、逃離x86架構(gòu)-CPU體系25構(gòu)CISC與RISC之爭收藏x86架構(gòu)誕生早在1981年,舊M公司推出了基于Intel 8088處理器的個人電腦;和不久后的8086處理器相比,它是一臺低價格,低性能的處理 器。盡管在當(dāng)時Motorola MC69000處理器的性能也相當(dāng)不錯,但是IBM這樣選擇的理由是因為 8088處理器已經(jīng)能夠?qū)Φ刂房偩€進行復(fù)用”,并且總線寬度達到8位,和以往相比,大大減少了整個系統(tǒng)的開 銷。由于當(dāng)時沒有芯片組這一概念,因此數(shù)據(jù)和指令的存儲和讀取都要 依靠主板上的特殊門電路,這些部件也是8位的寬度。如果使用 Mortola MC69000 處理器的話,那么在相同功能的情況下,主

2、板需要更多 的此類部件,因此大大增加了主板的制造成本。盡管有人建議,Mortola MC69000 有助于系統(tǒng)性能的提高,但是 舊M固守簡單就是美”的 原則,毅然選擇了 8088處理器。IBM的生死抉擇”卻給軟件開發(fā)者帶來災(zāi)難性的影響(當(dāng)時沒有充分意識到)。由于處理器采用了 808X的架構(gòu),因此數(shù)據(jù)和代碼只能 在64KB的范圍內(nèi)進行訪問。如果某一個程序需要使用超過64KB的內(nèi)存,那么程序不得不使用16位的段地址和16位的偏移地址組合,來 達到20位的數(shù)據(jù)訪問范圍。當(dāng)時的程序員就為16位到20位的地址轉(zhuǎn) 化傷透了腦筋。在程序的編譯過程中,也引進了相應(yīng)的內(nèi)存使用模式(小 型,中型,大型,巨型)。系

3、統(tǒng)集成的匯編語言在程序編寫時,必須指 明是近程調(diào)用(near call )還是遠程調(diào)用(far call )。如果要把 8088處理器的程序移植到如MC68000機時,就必須把地址擴展成 32 位,這個過程非常繁瑣。盡管64KB的限制是 舊M個人電腦的一個死穴,但是當(dāng)時舊M PC的市場銷售額非常不錯。8088處理器和DOS操作系統(tǒng)能夠支持大部 分的應(yīng)用軟件,因此 舊M的個人電腦推出不久就受到各界的好評;而 對于64KB的限制,人們似乎沒有太多的關(guān)注。隨著PC的成功推出,IBM著手于X86系統(tǒng)架構(gòu)標(biāo)準的制定,并且希望成為全球最大的電腦制 造商。Intel 和Microsft都參與了此標(biāo)準的定制,

4、并且攜手進行個人電腦的開發(fā)。第一個x86架構(gòu)的 嬰兒”便是于1985年推出的32位的80386 處理器(386處理器)。當(dāng)時,大部分的操作系統(tǒng)(或者準操作系統(tǒng)) 還是16位模式,因此程序員也必須進行地址的轉(zhuǎn)化,這個令人厭煩的 轉(zhuǎn)化工作直到Microsoft公司發(fā)布了第一款32位的操作系統(tǒng)Windows 95時,才得以解決。Windows 95 是第一款使用32位地址的操作 系統(tǒng),它能夠?qū)?2位空間的數(shù)據(jù)進行讀寫操作, 并且80386處理器的 內(nèi)部有7個通用寄存器(GPRS)。從19世紀80年代開始,X86架構(gòu)快速的發(fā)展著。同時,RISC (精SPAR簡指令集)架構(gòu)也受到人們的關(guān)注,并且有不少成

5、功的產(chǎn)品,如C , PARISC, MIPS等。從價格上而言,X86架構(gòu)的PC機最便宜; 而那些基于RISC處理器的大型機價格昂貴。但是在架構(gòu)上, PC機和 大型機有非常多的相同點,它們都有著良好的軟件支持,并且集成匯編日。它們之間第二個相似點就是 PC和大型機的檔次通常用以整體的性 價比來決定,而不是只決定于 CPU的處理能力??煽啃?,可用性,和 功能性是用于衡量機器性能的主要標(biāo)準。 PC機和大型機的定位也相當(dāng) 的明確,在1980年,一臺PC機的價格只要幾百美元,而大型機的架 構(gòu)至少要上千美元;在功能上, PC機定位于整數(shù)的運算,而大型機卻 是以浮點數(shù)的運算來衡量性能的高低。盡管PC機和RI

6、SC大型機在價格和功能上定位不同,但是在 199 0年初,Sun Microsystems公司推出了桌面的微型 RISC系統(tǒng)“MicroSPARC。為了能夠穩(wěn)固自身的地位,針對 Sun公司這個行為,Int el公司不久后就推出了性能和 MicroSPARC 相當(dāng)?shù)腜entium Pro 處 理器,Pentium Pro處理器是X86架構(gòu)發(fā)展過程中的一個里程碑。Pentium Pro處理器首先在x86體系中引入了彳散指令”的概念,即 一條指令能夠完成原先幾條指令的操作。在256KB二級緩存的協(xié)助下, 微指令使得系統(tǒng)的整體性能有了突破性的飛躍。當(dāng)時由 0.35微米制成 技術(shù)制造的Pentium P

7、ro處理器可以和原先任何一款 RISC處理器叫 板。在當(dāng)時,Pentium Pro 的驚人性能在PC的制造界產(chǎn)生了巨大的影響,那些原先RISC的支持者不得不重新審視起 x86架構(gòu)來。盡管x 86架構(gòu)存在GPRS數(shù)量過少,串行的通訊指令過于復(fù)雜,內(nèi)存操作不 便等缺點,但是RISC的開發(fā)者們不得不承認,當(dāng)時的 RISC架構(gòu)達不 到Pentium Pro的性能。揭開X86的真像隨著經(jīng)濟的不斷發(fā)展,x86處理器的應(yīng)用范圍越來越廣,但是人們 似乎漸漸忘卻x86架構(gòu)的不足。在x86架構(gòu)的發(fā)展過程中,它微處理 器(MPU)或多或少的占據(jù)著領(lǐng)先的地位。為了保持領(lǐng)先,個人電腦的 發(fā)展似乎脫離了舊M原先簡單就是美

8、”的初衷。CPU的制成技術(shù)快速 的發(fā)展著,集成的晶體管數(shù)量也基本按照莫爾定律增加。當(dāng) CPU集成 的晶體管數(shù)量超過1百萬后, 制成工藝“和晶體管集成度”成為衡量 系統(tǒng)性能的另一個標(biāo)準。同時,基于RISC處理器的大型機也不懈的發(fā)展著, 盡管在制成技 術(shù)上不及X86架構(gòu),但是它的整數(shù)和浮點數(shù)性能要高于 X86架構(gòu)。以 下是1993年至今,x86性能和RISC的比值。圖X86/RISC 性能比vs制成工藝x86 performance rel ative to RISCIntegerFloatingpoint1993199419g519961997199319992000200120022003x8

9、60.8 film0.5 /imLI .35 film口一25 /jUh0.1S /im0.13 利m0.09AlphaC,8>0,7 /m0.5 網(wǎng)n0,35 陰n0.25 "m0.1S fitmPA-RISC0.8/0.75 .m0 .5 .m0-250.13 AmPOWER/PPCC,8/0,70,5曲0.35 的0.25 Rm0,22)130.13上圖分為兩個部分,上半部分是X86/RISC的性能比??梢钥闯?,在整體上,RISC的性能要高于x86 (x86/RISC<1 ),但是它們之間的 差距正在逐漸減少。其中 Pentium Pro , P4/1.5, P4/

10、3.06 這幾款CPU的性能已經(jīng)超過了同期 RISC處理器的性能。圖的下半部分是x 86和RISC制成工藝的對比。Pentium Pro 推出時,x86架構(gòu)系統(tǒng)和RISC處理器系統(tǒng)的分工 就相當(dāng)?shù)拿鞔_。RISC系統(tǒng)針對高端的服務(wù)器市場,CPU和所有的部件 都必須確保系統(tǒng)的 穩(wěn)定性”,即使降低10 %的性能也要盡可能的提高系統(tǒng)的穩(wěn)定性。因此 RISC處理器必須經(jīng)過詳細,嚴謹?shù)脑O(shè)計,并且需 要通過一系列嚴格的測試。因此大型機的CPU非常昂貴,每一代的CPU一般只推出23種不同頻率的產(chǎn)品,因為企業(yè)不可能在系統(tǒng)升級上 不斷的投入昂貴的費用。相比之下 x86架構(gòu)系統(tǒng)主要針對個人用戶和 小型的商用系統(tǒng)。和

11、 RISC相比,x86的價格要低12個數(shù)量級,它 主要是確保系統(tǒng)的性能,或者盡可能的提高系統(tǒng)的性價比。因此針對同 一代的CPU,它會推出78種不同頻率的產(chǎn)品。例如Intel North wood Pentium4的整個推出的過程中,一共發(fā)布了 7種不同頻率的產(chǎn)品。圖產(chǎn)品推出力度對比上圖清楚的表明,在同一代產(chǎn)品中,RISC系統(tǒng)一般只會推出2 3種產(chǎn)品,而X86架構(gòu)會有78種的產(chǎn)品。因此后者的粒度要比前者細的多。這也說明RISC系統(tǒng)的CPU 一旦設(shè)計定型,就會進行制造和測試,在產(chǎn)品最后發(fā)布之前,盡可能的改正設(shè)計中的錯誤,因為 RISC昂貴的價格決定一旦CPU的設(shè)計存在問題,那么這就是一款失敗的產(chǎn)品

12、,在市場上就不會有立足之地。而 x86的CPU價格較低,因此它不斷推出的產(chǎn)品能夠彌補以往設(shè)計中的不足,不同產(chǎn)品在于占領(lǐng)不同的市場。RISC發(fā)展步驟x86發(fā)展步驟R R&ttdF7 Rated DevtewF Rftfed Dp/icesL/hximnm OperatingFj RaSed DerviCrSp NhximiHn 1 7 Operating FreqiieicyX86 =永恒?隨著X86架構(gòu)的不斷成熟,人們逐步開始認識到其本身的限制和 不足(例如32位的X86架構(gòu)的尋址空間只有 4GB),但是巨大的商業(yè) 利益和強勁的軟硬件的支持,使得 x86的架構(gòu)難以動搖。盡管在 x86

13、的發(fā)展歷程中,也有不少的體系設(shè)計用于代替x86架構(gòu),但是它們都因為得不到廣泛的支持,最終以失敗告終。其中,影響較大的是以下3次“x86革命”。第一次革命:MIPS/ACE 聯(lián)盟1991 年 4 月,Compaq, Microsoft, DEC, MIPS和一些小型的計算機公司成立了高級計算環(huán)境(ACE)小組,他們的目的在于使用 基于RISC處理器的MIPS架構(gòu)來取來現(xiàn)有的X86/IBM 個人電腦。 但 是由于MPU上市日期的延遲,ACE小組的內(nèi)部競爭,以及利益分成的 問題,使得ACE小組的發(fā)展舉步為艱,最后以失敗而告終。第二次革命:Apple/IBM/Motorola (AIM)聯(lián)盟同樣在 1

14、994 年 4 月底,Apple Computer, IBM 和 Motorola組成了 AIM聯(lián)盟,目的在于把RISC處理器用于個人電腦系統(tǒng)。Motorola 和EM聯(lián)手對POWE磔構(gòu)進行重新設(shè)計,用于取代原先Macintosh 系統(tǒng)中逐漸衰落的680X0 CISC 處理器。POWERg構(gòu)給Mac系統(tǒng)帶來了巨大的成功,它的性能要比原先的Mac大大提高。但是x86架構(gòu)的發(fā)展始終要快于 PowerPC ,而且PowerPC沒有任何的性價比優(yōu)勢,因此不多久,Mac機就在x86架構(gòu)面前敗下陣來。在Intel和Microsoft巨大的壓力下,1994年8.3%的市場占有率也緊縮到目前的3%。第三次革命

15、:DEC/Samsung1996年年底,DEC的芯片制造部門(原先的 Digital Semiconductor 公司)發(fā)布布了 21164PC。它是原先高性能處理器 21164A(EV56)的PC版,因此價格較低,并且使用了微軟的Windows NT操作系統(tǒng)。由于缺少相應(yīng)的軟件支持,DEC開發(fā)了 FX! 32模擬器,它能夠把原先X86的軟件無縫的應(yīng)用到21164PC平臺。盡管CPU的價格低廉,但是支持21164PC的主板卻非常昂貴。而且在當(dāng)時,人們對 NT操作系統(tǒng)并沒有表現(xiàn)出多大的興趣,因此21164PC慢慢的在X86架構(gòu)發(fā)展中退出了歷史舞臺。上述例子中的MPU制造商失敗的主要原因就是跟不上

16、Intel CPU 的發(fā)展速度。Intel不斷進行著新型的CPU設(shè)計,并且以價格來爭取市場;上述的三種新型 CPU架構(gòu)都是被Intel強大的馬力所拖垮。其中,MIPS/ACE 聯(lián)盟主要是資金的問題, 而AIM聯(lián)盟的失敗歸咎于 CPU的設(shè)計跟不上Intel的發(fā)展速度。Intel 的自我革命目前的事實告訴我們,當(dāng)今幾乎不可能有其他的MPU制造商使用其他的系統(tǒng)結(jié)構(gòu),來挑戰(zhàn)Intel 現(xiàn)下兼容的X86平臺;其他的芯片制 造商也沒有雄厚的資金和實力來和Intel公司進行抗衡。人們考慮:是否Intel公司自己會提出一種全新的架構(gòu);或者Intel是否會脫離IBM的x86標(biāo)準來發(fā)展自身的 Wintel 體系架

17、構(gòu)(Wintel : Window s操作系統(tǒng)和Intel處理器)。近幾年,Intel致力研究的Itanium處理器(IPF Itanium Processor Family)似乎有取代 x86的趨勢。Intel也宣布,Itanium 會首先使用在服務(wù)器上,然后過渡到PC平臺,最終在移動平臺上實現(xiàn)。Intel 的IPF主要針對RISC處理器原先占有的中高端服務(wù)器市 場。Intel 推出64位的處理器只是一個時間的問題,可能在目前而言,還為時過早;但是Intel的競爭對手AMD公司已經(jīng)在今年推出了 x86架構(gòu)的擴展64處理器和系統(tǒng)平臺。AMD 64位的架構(gòu)并不是全新的架構(gòu),而是對原先32位的x8

18、6架構(gòu)進行擴展,突破了 4GB尋址空 間的限制;但是64位的計算環(huán)境卻在業(yè)界產(chǎn)生了巨大的影響,它成為 Intel IPF技術(shù)的挑戰(zhàn)者。姑且不論 AMD 64位架構(gòu)推出時機是否合適,但是業(yè)界普遍認為64位的架構(gòu)會在5年內(nèi)成為主流的桌面PC架 構(gòu),同時AMD的這一舉措也加快了 IPF處理器的推出。IPF技術(shù)是由Intel和惠普聯(lián)合研制,取得了一定的成績。但是目前的IPF處理器核心尺寸,電源功耗都決定了其不能使用在桌面系統(tǒng)上。IPF采用0.18 微米的制成工藝,和 Alpha EV (397mm2, 12 5WI) , POWER4 (415 mm2, 115W)相比,Itanium 2 處理器的尺

19、寸 為421 mm2 ,電源功耗高達130W。的Intanium 2 處理在隨后的,代號為 Madison/Deefield器中,Intel 使用了 0.13微米的制成工藝1.3GHz 的 Itanium 2Pentium 4 相當(dāng)。和 2.的整數(shù)運算性能有了 1處理器的最大發(fā)熱量和 2.66GHz Northwood 66GHz Pentium 4 相比,1.3GHz Itanium2 0%的提高,浮點數(shù)性能有了 50%的提高。在高級的優(yōu)化技術(shù)下,IPF 的性能要比原先同等頻率的處理器高出整整一倍,而且隨著 IPF技術(shù)的成熟,這種差距會愈加擴大。盡管在硬件的技術(shù)上,AMD和Intel 都已經(jīng)

20、相當(dāng)成熟;但是 AMD64位的系統(tǒng)和Intel 的IPF都不得不面臨一個相同的問題:缺少軟 件的支持。目前支持 AMD 64位系統(tǒng)和IPF技術(shù)的只有 Window最新的操作系統(tǒng)。AMD公司和Intel公司對于64位架構(gòu)的研發(fā)上都或多或少面臨 雞生蛋,還是蛋生雞”的尷尬局面。64位的架構(gòu)必須有軟件的支持才能發(fā)揮應(yīng)有的功效,同樣軟件只有憑借64位的架構(gòu)才能進行開發(fā)。業(yè)界人員保守的估計,64位的軟件至少要3-5年才能普及起來。對于IPF處理器而言,它和原先x86架構(gòu)下的處理器有什么本質(zhì) 的不同呢?如果不考慮 AMD的64位擴展x86架構(gòu),在相同的電源功 耗,相同的費用,相同的制成工藝下,IPF處理器

21、在整數(shù)運算上的性能 會高出20%30%,浮點數(shù)和DSP的運算性能會有50%的提高。結(jié)論:革命尚未成功,同志仍需努力稅要比做的容易?!彪S著IPF技術(shù)的成熟,32位x86架構(gòu)缺陷的 不斷出現(xiàn),IPF取代x86架構(gòu)勢在必行。但是一旦真正的進行改革” IPF (或者其他架構(gòu))必定會受到來自各方面的壓力和阻礙。樂觀的估 計,IPF取代x86成為主流的架構(gòu)至少要在 2005年以后。如果考慮到 來自AMD 64位的x86的架構(gòu)阻撓,那么整個改革的之間會更長,甚 至有失敗的可能。我們深知,每一項新技術(shù)的應(yīng)用,都會伴隨著出生時的陣痛;但是對于 未來卻是一片光明。Intel 的IPF如此,AMD的64位架構(gòu)也是如

22、此。 在PC發(fā)展歷程中,正是這些一次又一次的陣痛,不斷推動著整個IT界發(fā)展,使IT界保持旺盛的發(fā)展力。也許這些陣痛可能會帶來難產(chǎn), 使得嬰兒死于襁褓之中;但是每一次成功的誕生,都會給 IT界帶來一 個全新的世界。不管X86架構(gòu)未來如何,我們都期待著會有一個嶄新 的明天。CPU體系結(jié)構(gòu) CISC與RISC之爭(轉(zhuǎn)自 )在PC發(fā)展之初,除了成熟的CISC指令架構(gòu)外,舊M沒有更好的 選擇,原因很簡單,更先進的 RISC架構(gòu)在1975年才出現(xiàn),且只針對 超級計算機領(lǐng)域,當(dāng)時沒有人意識到PC會有如此之大的發(fā)展,只是將它作為計算產(chǎn)品的一種補充而已。為圖省事,舊M干脆就選擇了 Intel作為微處理器芯片的合

23、作伙伴,而Intel 所創(chuàng)立的X86指令系統(tǒng)便 屬于CISC架構(gòu)。我們有必要對指令架構(gòu)、CISC、RISC之類的概念作明晰的解釋。 眾所周知,微處理器的基本邏輯是運行指令的電路,計算機的任何一個 程序都是由或多或少的基本指令組成,而指令本身又是由若干個微操作構(gòu)成,例如對兩個二進制數(shù)進行加減運算,或者將結(jié)果送進寄存器中等 等。了解匯編語言或機器語言的讀者對此應(yīng)該比較清楚。這些基本指令 被稱為微處理器的微代碼(Microcode ),指令數(shù)量越多、完成微操 作所需的邏輯電路就越多,芯片的結(jié)構(gòu)就越復(fù)雜。每個處理器開發(fā)商都 可以自己定義出一套指令系統(tǒng),但如果指令系統(tǒng)不相同,構(gòu)成軟件的指 令也不相同,這

24、樣就無法實現(xiàn)軟件兼容。在專用計算機時代,這種情況 十分普遍,各個計算機廠商都獨立發(fā)展指令系統(tǒng)、微處理器、計算整機 和軟件,不同廠商的軟硬件產(chǎn)品無法兼容使用,其原因就在于微處理器 的指令系統(tǒng)采用不同的定義。然而,盡管當(dāng)時指令系統(tǒng)種類甚多,它們 卻都歸屬于CISC架構(gòu)-CISC的英文全稱是 Complex Instruction Set Computer ,意為 復(fù)雜指令系統(tǒng)計算機它的特點是指令數(shù)量 龐大臃腫,每個指令不管執(zhí)行頻度高低都處于同一個優(yōu)先級,程序員的 編程工作相對容易。但它的致命弊端是執(zhí)行效率低下,處理器的晶體管 被大量低效的指令所占據(jù),資源利用率頗為低下。當(dāng)舊M成功發(fā)展出R ISC系

25、統(tǒng)之后,CISC迅速被超級計算機所拋棄。但機緣巧合,它卻在 PC上獲得新生,為了保持軟件兼容,PC必須一直延續(xù)X86架構(gòu)無法脫 離(IBM將標(biāo)準制定權(quán)讓給Intel ,最終葬送了自己在PC領(lǐng)域的前途)。 后來加入微處理器戰(zhàn)團的 Cyrix 、Rise、AMD IDT等廠商無一不是 如此,PC朝著X86道路漸行漸遠,從8位、16位、32位一直擴展到 現(xiàn)在的64位,雖然它依然有旺盛的生命力,但背后的一系列缺陷也逐 漸顯現(xiàn):芯片設(shè)計臃腫不堪,能源利用率低下,性能與晶體管規(guī)模相當(dāng) 的RISC產(chǎn)品根本不在一個水平線上。二打卜夕代;白80 20 -1 1圖1依據(jù)80/20法則劃分的冷代碼”與 熱代碼”概念

26、一前者占據(jù)X86指令總量的80%,后者只占據(jù)20%。與之相應(yīng),冷代碼執(zhí)行單元占據(jù) 絕大多數(shù)硬件資源,而高度活躍的熱代碼執(zhí)行單元所占據(jù)的硬件資源反 而要少得多。PARROT優(yōu)化之后,熱代碼執(zhí)行單元被大大加強,冷代碼單元則被相應(yīng)縮減,在晶體管規(guī)模不變的前提下實現(xiàn)性能的跨越式提 升。相比之下,RISC (全稱 Reduced Instruction Set Computer ,精簡指令系統(tǒng)計算機)則是一套優(yōu)化過的指令架構(gòu),它是根據(jù)著名 的80/20法則所訂立。早在上個世紀 60年代,計算機科學(xué)家們發(fā)現(xiàn), 計算機中80%的任務(wù)只是動用了大約20%的指令,而剩下20%的任務(wù)才 有機會使用到其他80%的指

27、令。如果對指令系統(tǒng)作相應(yīng)的優(yōu)化,就可以 從根本上快速提高處理器的執(zhí)行效率。舊M公司在1975年成功開發(fā)出第一款RISC處理器,從此RISC架構(gòu)開始走進超級計算機中。由于指 令高度簡約,RISC處理器的晶體管規(guī)模普遍都很小而性能強大,深受 超級計算機廠商所青睞。很快,許多廠商都拿出自己的RISC指令系統(tǒng), 除了 IBM 的 Power 和 PowerPC 夕卜,還有 DEC的 Alpha、SUN的 SP ARC、HP的PA-RISC、MIPS技術(shù)公司的 MIPS、ARM公司的ARM等 等。它的應(yīng)用范圍也遠比 X86來得廣泛,大到各種超級計算機、工作 站、高階服務(wù)器,小到各類嵌入式設(shè)備、家用游戲機

28、、消費電子產(chǎn)品、 工業(yè)控制計算機,都可以看到 RISC的身影。只不過這些領(lǐng)域同普通消 費者較為脫離,故而少為人知。無論在執(zhí)行效率、芯片功耗還是制造成本上, 選才I RISC都比沿用 X86更加英明。我們不妨作一番實際的比較:目前 Intel 公司最快的 處理器是Prescott 核心的Pentium 4 XE 系列,它的晶體管總數(shù)在1億7800萬個以上,最高功耗達到130W,但它的運算能力不超過20 GigaFlops (FLoating point Operations per Second, 每秒浮點運算)。而目前最快的 RISC處理器是 舊M剛剛推出的Cell ,它 的晶體管總數(shù)為2.3

29、4億個,在采用90納米工藝制造時芯片面積為 22 1平方毫米,但它的運算力高達 2560GigaFlops ,整整是Pentium 4 XE的128倍。Intel將在年中推出雙核心的 Smithfield ,性能最多能有80%的提升,而芯片規(guī)模將達到與 Cell相同的水平。由此可 見,二者完全不是一個層面上的對手,X86指令系統(tǒng)的低效性在這里一 覽無遺。與此對應(yīng),RISC產(chǎn)品在成本上優(yōu)勢明顯-半導(dǎo)體芯片的制造成 本同芯片面積三次方成正比。在工藝相同的情況下,芯片面積大小取決 于所集成的晶體管規(guī)模。RISC處理器核心精簡、效率更高,只要很少 的晶體管就能達到與 X86產(chǎn)品媲美的效能,制造成本可大

30、大低于現(xiàn)有 的X86處理器。而小晶體管規(guī)模亦有助于保持較低的能耗值,RISC處理器在這方面表現(xiàn)相當(dāng)杰出,現(xiàn)在的嵌入式設(shè)備幾乎都采用RISC產(chǎn)品,原因就在于這類產(chǎn)品的功耗值超低。過去,PC鐘情于X86的原因在于軟件兼容,尤其是微軟只為X86 PC開發(fā)Windows系統(tǒng),這也被認為是 PC采用RISC架構(gòu)的最大障礙。這個障礙最終也將被解除,Linux 操作系統(tǒng)逐漸發(fā)展成熟,Mac OS X 的綜合水準更遠在 Windows之上,辦公、圖形、網(wǎng)絡(luò)、多媒體相關(guān)的 各類跨平臺應(yīng)用軟件極大豐富。如果你是一個游戲玩家,RISC平臺一定會令你大呼過癮,將于 2005-2006 年發(fā)布的索尼PS3、任天堂Rev

31、olution和微軟XBOX2等新一代游戲機產(chǎn)品將全面轉(zhuǎn)入 RISC體系(有趣的是,三種游戲機都采用 舊M所設(shè)計的處理器,指令系統(tǒng)相同), 短時間內(nèi)許多品質(zhì)一流的配套游戲軟件將會大量涌現(xiàn)。只要指令系統(tǒng)相同,這些游戲完全可以實現(xiàn)平滑移植。單從技術(shù)角度考慮,以RISC取代X86作為PC的主力架構(gòu)的確是 非常英明的選擇,更高的效率、更快的速度、更低的成本以及同樣豐富 的軟件支持,RISC PC將展現(xiàn)出勃勃生機。然而,這一切似乎不容易 實現(xiàn),無論Intel 、AMD還是微軟,它們的輝煌成就都構(gòu)建在 X86的 基礎(chǔ)之上,轉(zhuǎn)向RISC對它們來說無異于釜底抽薪。目前執(zhí)著發(fā)展 RIS C PC的只有蘋果公司,

32、它們的全系列PC都基于舊M的PowerPC指令 架構(gòu)。不幸的是,盡管蘋果公司大名鼎鼎,但它對整個市場的影響力極 其有限,PC轉(zhuǎn)向RISC最大的障礙不在于技術(shù)或兼容性,而是缺乏一 個實質(zhì)性的領(lǐng)導(dǎo)者,但有跡象表明,藍色巨人對此有著強烈的意愿,RISC能否把握住PC的下一個三十年盡皆取決于它。即便不采用RISC架構(gòu),我們?nèi)匀豢梢越柚乃枷雽?X86處理器進行 結(jié)構(gòu)性改良。事實上,X86處理器一直都從RISC產(chǎn)品中獲取靈感,包 括EV6總線、整合內(nèi)存控制器、超線程技術(shù)、雙核心等等新技術(shù)新概 念都是首先在RISC產(chǎn)品中得到成功應(yīng)用,之后才被Intel/AMD 引入 到X86處理器當(dāng)中。實踐證明,這種做

33、法往往對X86處理器的性能提升有著決定性的影響,而從RISC汲取營養(yǎng)也就成為X86業(yè)界的習(xí)慣做不過,上述這些技術(shù)改良都只停留在應(yīng)用層面, 指令體系的根本差異成為X86與RISC之間的壁壘,若能借助 RISC理念對X86處理器 進行結(jié)構(gòu)性改良,也許可獲取更大的效益。Intel 在IDF技術(shù)峰會上提出的“PARROT概念便充分體現(xiàn)了這種思想。PARROT的全稱是“Pow er AwaReness thRough selective dynamicallyOptimizedTraces”,從其名稱不難得知,PARROT是一項借助 動態(tài)優(yōu)化執(zhí)行路 徑”來提高處理器執(zhí)行效率的技術(shù)。它的理論基礎(chǔ)也是著名的

34、 80/20法 則,但與RISC不同,X86處理器無法從指令系統(tǒng)層面上實現(xiàn)這一點。,Intel另辟蹊徑,提出了一個全新的發(fā)展思路,將 20%的常用指令定義為熱代碼(Hot Code ) ”,剩余的80%指令使用頻率沒那么高,被 定義為冷代碼(Cold Code ) ”。對應(yīng)的CPU也在邏輯上被劃分為兩 個部分:一是熱核(Hot Spot ),只針對調(diào)用到熱代碼的程序;另一 部分則是冷核(Cold Spot ),負責(zé)執(zhí)行20%的次常用任務(wù)。由于熱 核部分要執(zhí)行80%的任務(wù),設(shè)計者便可以將它設(shè)計得較為強大,占據(jù)更多的晶體管資源。而冷核部分任務(wù)相對簡單,沒有必要在它身上花費同 樣的功夫。理論上說,設(shè)

35、計者可以將80%的晶體管資源用在熱核上面,使之高效率執(zhí)行任務(wù),剩余的20%晶體管資源則用于僅完成20%任務(wù)的 冷核。相比之下,現(xiàn)在的 X86處理器完全沒經(jīng)過結(jié)構(gòu)優(yōu)化,所有指令 地位對等,80%的次常用指令占據(jù)了大量的晶體管資源,又沒有創(chuàng)造出 相應(yīng)的價值,芯片內(nèi)只有 20%的區(qū)域處于活躍狀態(tài),這顯然不夠科學(xué)?!?PARROT創(chuàng)造了一種嶄新的雙核概念,過去我們談?wù)摰碾p核心指的是在一枚芯片內(nèi)集成兩個對等的 CPU內(nèi)核,通過并行運算獲得性能增益,我們可以將它看作是橫向維度的對等設(shè)計。而“PARROT則是一種縱向維度的雙核理念,熱核與冷核地位并不對等,且無法獨立運作, 只能說是一個CPU內(nèi)核中的兩部分分立邏輯。它所起到的是提高CPU的硬件資源利用率,以高執(zhí)行效率達到高效能的目的,這種做法顯然比目前業(yè)界鼓吹的雙核心”更具革命意義。我們不妨深入分析“PARROT 的微架構(gòu)(圖2所示),處理器執(zhí)行管

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論