AMD四核9月10日發(fā)布 K10新品全面解析_第1頁(yè)
AMD四核9月10日發(fā)布 K10新品全面解析_第2頁(yè)
AMD四核9月10日發(fā)布 K10新品全面解析_第3頁(yè)
AMD四核9月10日發(fā)布 K10新品全面解析_第4頁(yè)
AMD四核9月10日發(fā)布 K10新品全面解析_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、前進(jìn)是歷史車輪的必然方向,Pentium 4在歡呼聲中取代Pentium 3,4年后Core構(gòu)架又卷土重來(lái)替代飽受非議的NetBurst構(gòu)架。是非成敗轉(zhuǎn)頭空,青山依舊在,幾度夕陽(yáng)紅?;蛟S十年河?xùn)|十年河西的情況暫時(shí)不會(huì)發(fā)生在穩(wěn)步前進(jìn)的AMD身上,但出于技術(shù)角度的考慮,AMD目前已經(jīng)再一次飛躍性的推出K10微架構(gòu)處理器。AMD K10 Phenom X4核心照 前不久,AMD效勞器/工作站產(chǎn)品全球業(yè)務(wù)經(jīng)理莊富瑞(John Fruehe)正式宣布AMD將在9月10日正式發(fā)布代號(hào)巴塞羅那的四核處理器,由于時(shí)差的原因,中國(guó)此次將成為全球首發(fā)地,早于美國(guó)發(fā)布12個(gè)小時(shí)。莊富瑞此次來(lái)到北京只是為巴塞羅那宣傳

2、的其中一站,未來(lái)幾天,他還將前往香港、臺(tái)灣、新加坡等地,在正式發(fā)布前為新品預(yù)熱造勢(shì)。莊富瑞否認(rèn)外界所謂的巴塞羅那“跳票一說(shuō),他表示,AMD一直說(shuō)將在夏季結(jié)束時(shí)發(fā)布,而9月10日并不晚?!捌鋵?shí)巴塞羅那早已準(zhǔn)備好,原本我們也方案先推出高端的型號(hào),之后再慢慢去降低功耗。但在和客戶交流后,我們發(fā)現(xiàn)這并不是他們所希望的,所以我們改變了方案,決定首發(fā)的產(chǎn)品就保證足夠低的功耗,這是符合客戶需求的做法。莊富瑞表示。那么,競(jìng)爭(zhēng)對(duì)手英特爾在去年11月就發(fā)布了自己四核,并于今年6月宣布出貨量突破百萬(wàn)片,新一代45nm Penryn也已經(jīng)蓄勢(shì)待發(fā),可以說(shuō)在四核市場(chǎng)英特爾已經(jīng)占得先機(jī)。AMD如何在逆境成功“突圍成為業(yè)界

3、關(guān)注的焦點(diǎn)。莊富瑞表示,在和英特爾的對(duì)抗中,AMD的核心競(jìng)爭(zhēng)力主要表達(dá)在兩方面。首先,從產(chǎn)品上來(lái)看,巴塞羅那處理器在功耗方面更有優(yōu)勢(shì),雖然是四核產(chǎn)品,但功耗并沒(méi)有比之前的雙核有所提高。其次,AMD一直是以客戶為本的公司,考慮到客戶的需求,我們的平臺(tái)更加穩(wěn)定,更具可擴(kuò)展性。用戶無(wú)需更換任何部件就可以使用最新的巴塞羅那,并且我們下一代代號(hào)“Shanghai的產(chǎn)品也是如此。產(chǎn)能一直是困擾AMD的一大問(wèn)題,但此次莊富瑞似乎并不擔(dān)憂。他表示,巴塞羅那將采用65nm工藝,目前已經(jīng)開始量產(chǎn),9月10日發(fā)布后就可以大量供貨。此外,AMD方面并沒(méi)有公布巴塞羅那的售價(jià),但業(yè)界分析普遍認(rèn)為,英特爾今年11月發(fā)布45

4、nm Penryn后,必將引發(fā)兩家新一輪的價(jià)格戰(zhàn)。而在性能方面,相信更多的測(cè)試結(jié)果將與大家見面。簡(jiǎn)單回憶一下,相比Intel處理器架構(gòu)上的不斷改良,AMD在過(guò)去幾年里顯得略為保守。AMD的成功從K7架構(gòu)開始,在當(dāng)年其憑借低本錢,高性能成為晚期P6型號(hào)的直接對(duì)手。但AMD可沒(méi)有雄厚的資金來(lái)養(yǎng)活兩個(gè)開發(fā)團(tuán)隊(duì),其在架構(gòu)方面可以說(shuō)是穩(wěn)扎穩(wěn)打。K8架構(gòu)的誕生可以說(shuō)是演進(jìn)自K7:略微加深的流水線級(jí)數(shù)、些許架構(gòu)方面的改良,重點(diǎn)那么是在將北橋芯片中的內(nèi)存控制器整合到了處理器內(nèi)部。從現(xiàn)在來(lái)看,K8架構(gòu)的很多設(shè)計(jì)理念確實(shí)非常超前,并且提供了出色的性能。Core 2確實(shí)在性能上要好于K8,但和上一代的Dothan和

5、Banias相比,K8在很多應(yīng)用上都保持領(lǐng)先。AMD Opteron處理器而Intel為了保持優(yōu)勢(shì),在Conroe發(fā)布不到4個(gè)月的時(shí)間里,再次祭出了業(yè)內(nèi)首款四核心處理器,進(jìn)一步穩(wěn)固了自己在CPU性能方面的優(yōu)勢(shì)。Intel在高端市場(chǎng)的優(yōu)勢(shì),使得AMD的K8處理器顯得暗淡無(wú)光,只能靠低廉的價(jià)格來(lái)保住中低端市場(chǎng)份額。雖然AMD憑借產(chǎn)品優(yōu)良的性價(jià)比在中低端市場(chǎng)占據(jù)了主動(dòng)的地位,并在去年的市場(chǎng)份額占有率中取得不錯(cuò)的成績(jī),但是Intel方面,其在高端布署好產(chǎn)品線之后,隨即發(fā)動(dòng)了價(jià)格戰(zhàn),揮師而下,對(duì)AMD傳統(tǒng)較為強(qiáng)勢(shì)的中低端市場(chǎng)進(jìn)行打擊。一向走高端路線路線的Intel也意識(shí)到了中低端市場(chǎng)的重要性,將于6月份

6、上市的Conroe-L,奔騰E系列就是Intel又一強(qiáng)有力武器,誓要奪回這塊失去的局部市場(chǎng)。AMD也深深明白單靠?jī)r(jià)格上的優(yōu)勢(shì),很難去抵擋Intel一輪接一輪的攻勢(shì),而這樣虧本式的產(chǎn)品價(jià)格策略更是AMD不能承受之重。為了解決目前的困境,AMD唯有靠發(fā)布新品來(lái)取代沿用了將近四年之久的K8微架構(gòu)處理器,而K10微架構(gòu)的出現(xiàn),正是AMD今年絕地還擊的重要法寶。那么,究竟K10與K8有什么不同?與Core又有哪些優(yōu)勢(shì)?等等關(guān)于K10的問(wèn)題,本文將為您一一揭曉。AMD K10桌面處理器新品牌“Phenom 相信大家仍然還是最關(guān)注AMD面向桌面的四核處理器,讓我們先來(lái)看看官方正式宣布了用于下一代四核心、雙核

7、心高端、主流桌面處理器的新品牌“Phenom。在K6之后,AMD的K7、K8架構(gòu)桌面產(chǎn)品都采用了Athlon品牌,與筆記本的Turion和效勞器的Opteron組成AMD的整體產(chǎn)品線。而進(jìn)入K10架構(gòu)之后,Athlon將被廢棄,取而代之的是新的“Phenom。AMD確認(rèn)“Phenom命名 據(jù)AMD代表確認(rèn),Phenom確實(shí)源自英語(yǔ)口語(yǔ),意為“杰出人才,發(fā)音類似精簡(jiǎn)版的“phenomenal(顯著的、現(xiàn)象的)。Phenom處理器由三局部組成:雙路四核心Phenom FX(Agena FX)、四核心Phenom X4(Agena)、雙核心Phenom X2(Kuma)。AMD只是說(shuō)它們的架構(gòu)都源自

8、于效勞器的Barclona Opteron,但沒(méi)有披露任何型號(hào)和規(guī)格信息。有消息稱,Phenom X4主頻2.7-2.9GHz,功耗125W;Phenom X2主頻2.0-2.9GHz,功耗89W。 AMD產(chǎn)品經(jīng)理Ian McNaughton指出,Phenom平臺(tái)支持DDR2-1066規(guī)格內(nèi)存,而“在OEM廠商有所需求之前,AMD不會(huì)轉(zhuǎn)向DDR3。 在啟用新品牌后,AMD還將全面放棄型號(hào)中的“64字樣,因此原來(lái)的Athlon 64 X2將改名Athlon X2并進(jìn)入低端市場(chǎng),單核心Athlon消失,單核心Sempron暫時(shí)還會(huì)存在,競(jìng)爭(zhēng)Intel的Celeron。今年第三季度,AMD將發(fā)布多款

9、新Sempron,基于65nm Sparta核心,包括35W節(jié)能型的3800+、3600+、3500+、3400+等。 此前我們已經(jīng)知道的四核心Agena FX Phenom FX系列是用于雙路系統(tǒng)Quad FX的旗艦型號(hào),主頻2.2-2.4GHz和2.4-2.6GHz,接口Socket F 1207+,二級(jí)緩存4512KB,三級(jí)緩存2MB,熱設(shè)計(jì)功耗(TDP)未定。AMD K10桌面處理器規(guī)格/上市日期面向高端效勞器方面的,AMD用于單路普通系統(tǒng)的Phenom FX,主頻2.2-2.4GHz,接口Socket AM2+。其他各款型號(hào)也都會(huì)采用這種接口。高端桌面市場(chǎng)為四核心Agena,其中四核

10、心Phenom X4兩款,主頻2.4、2.2GHz,二級(jí)緩存4512KB,三級(jí)緩存2MB, TDP 89W。 中端桌面是雙核心Kuma Phenom X2六款,主頻2.8、2.6、2.4、2.3、2.1、1.9GHz,二級(jí)緩存2512KB,三級(jí)緩存2MB,TDP前兩款89W、第三款65W、后三款節(jié)能型45W。中低端雙核心主要是Rana Athlon 64 X2,有一款,主頻2.2GHz,二級(jí)緩存2512KB,沒(méi)有三級(jí)緩存,TDP 65W。 低端單核心那么是Spica Sempron,兩款,主頻2.4、2.2GHz,二級(jí)緩存512KB,沒(méi)有三級(jí)緩存,TDP 45W。 上市時(shí)間方面,從高端到低端依

11、次推出,Phenom FX和Phenom X4在今年第三季度率先登場(chǎng),89W和65W的常規(guī)型Phenom X2第四季度跟上,節(jié)能型Phenom X2、Athlon 64 X2和Sempron都要等到明年第一季度。 對(duì)于“Phenom品牌的中文命名,有人認(rèn)為拋棄使用已久的Athlon名稱更說(shuō)明了K10的革命性,以及AMD對(duì)這款全新架構(gòu)的處理器能帶來(lái)全新突破的希望。但此前AMD處理器中文名以“龍為命名已經(jīng)被廣闊用戶所接受,那么Phenom能是什么“龍呢?我們也做了相關(guān)的投票調(diào)查,結(jié)果網(wǎng)友認(rèn)為可能是“飛龍的占55.8%,意思是“飛龍?jiān)谔?,表達(dá)出了大家的祝福。由于AMD還沒(méi)有正式公布最新一代“Phen

12、om處理器的中文名,因此AMD會(huì)賦予“Phenom品牌什么樣中文名還是個(gè)迷,讓我們拭目以待。K10是什么?K10微架構(gòu)又有哪些新特性?作為AMD下一代的處理器架構(gòu),K10還在孕育期時(shí)就受到各方的關(guān)注。K10也就是通常俗稱的K8L,是AMD現(xiàn)有K8架構(gòu)產(chǎn)品的繼任者(沒(méi)有K9),在架構(gòu)上有所進(jìn)步,并將四核心引入桌面。K10是AMD下一代CPU的架構(gòu),AMD聲稱其K10架構(gòu)四核心具備一系列“革命性設(shè)計(jì),其中最大的賣點(diǎn)依然是“原生,另外還有每核心512KB二級(jí)緩存、共享2MB三級(jí)緩存、HyperTransport 3.0總線、增強(qiáng)型PowerNow省電技術(shù)、AMD-V虛擬化技術(shù)、領(lǐng)先的性能每瓦特指標(biāo)等

13、。 下面我們通過(guò)Barcelona核心介紹,來(lái)了解一下K10微架構(gòu)的幾大新特性。 Barcelona核心介紹:四核、4.63億晶體管Barcelona是AMD第一款四核處理器,原生架構(gòu)基于65nm工藝技術(shù)。和Intel Kentsfield四核不同的是,Barcelona并不是將兩個(gè)雙核封裝在一起,而是真正的單芯片四核心。盡管在技術(shù)上AMD似乎更為領(lǐng)先,但是否能表達(dá)在實(shí)際性能表現(xiàn)上目前還不得而知。AMD四核與Intel四核:原生與非原生比照基于AMD 65nm工藝,Barcelona相比K8在結(jié)構(gòu)上更為復(fù)雜,其需要11層金屬層,而K8只需要9層。在同工藝情況下Barcelona相比Intel處

14、理器需要更多的金屬層,這意味著量產(chǎn)的復(fù)雜程度也更高。擁有四個(gè)核心和2MB三級(jí)緩存,Barcelona的晶體管數(shù)量到達(dá)4.63億個(gè),相比Intel四核Kentsfield的5.82億還是要少1.19億。這1.19億晶體管主要來(lái)自于緩存方面:每一個(gè)Barcelona核心擁有128KB L1緩存和512KB L2緩存,四個(gè)核心共享2MB L3緩存,那么芯片上總緩存容量為4.5MB。而Intel Kentsfield中每一個(gè)核心配備了64KB L1緩存,兩個(gè)核心共享4MB L2緩存,總緩存容量為8.25MB,比Barcelona高出80%,表達(dá)在晶體管數(shù)量上有25.6%的增加。然而Barcelona并

15、不僅僅是配備了L3緩存的四核K8,我們估計(jì)不算緩存的雙核Athlon 64 X2晶體管數(shù)量在9400萬(wàn)左右,而Barcelona大約是2.47億,比前者雙倍還要多,那么新增的晶體管用處何在呢?Barcelona新特性解析:引入全新SSE128技術(shù)Barcelona中的一項(xiàng)重要改良是被AMD稱為“SSE128的技術(shù),在K8架構(gòu)中,處理器可以并行處理兩個(gè)SSE指令,但是SSE執(zhí)行單元一般只有64位帶寬。對(duì)于128位的SSE操作,K8處理器需要將其作為兩個(gè)64位指令對(duì)待。也就是說(shuō),當(dāng)一個(gè)128位 SSE指令被取出后,首先需要將其解碼為兩個(gè)micro-ops,因此一個(gè)單指令還占用了額外的解碼端口,降低

16、了執(zhí)行效率。而Barcelona加寬了執(zhí)行單元從64位到128位,所有128位的SSE操作不再需要進(jìn)行解碼分解為兩個(gè)64位操作,并且浮點(diǎn)調(diào)度器也可以支持這種128位 SSE操作,提高了執(zhí)行效率。提高SSE指令執(zhí)行單元帶寬的同時(shí),也會(huì)帶來(lái)一些新的變化,也可以說(shuō)是新的瓶頸:指令存取帶寬。為了將并行處理器過(guò)程中解碼數(shù)量最大化,Barcelona開始支持32字節(jié)每時(shí)鐘周期的指令存取,而先前K8架構(gòu)只支持16字節(jié)。32字節(jié)的指令存取帶寬不僅對(duì)處理器SSE代碼有幫助,同時(shí)對(duì)于整數(shù)指令也有效果。AMD Architecture ComparisonK8BarcelonaSSE Execution Width

17、64-bit128-bitInstruction Fetch Bandwidth16 bytes/cycle32 bytes/cycleData Cache Bandwidth2 x 64-bit loads/cycle2 x 128-bit loads/cycleL2/Northbridge Bandwidth64 bits/cycle128 bits/cycleFP Scheduler Depth36 Dedicated x 64-bit ops36 Dedicated x 128-bit ops現(xiàn)在你獲得了存取和解碼更多的指令,而你還需要獲得更多的數(shù)據(jù)送往執(zhí)行核心,因此AMD還加寬了L1

18、數(shù)據(jù)緩存和SSE存放器之間的帶寬。AMD在SSE128方面的改良非常類似Intel Yonah到Merom的變化。在Conroe/Merom之前,Yonah在浮點(diǎn)SSE方面的表現(xiàn)并不如K8,我們之前曾經(jīng)比照過(guò)同頻下Yonah和K8處理器這方面的性能,在一般應(yīng)用、3D渲染和游戲等測(cè)試中,Yonah根本可以和K8打平,但在視頻編碼方面,K8性能更好。不過(guò)在Core 2處理器發(fā)布后,AMD K8那么不再有這方面的優(yōu)勢(shì)。Barcelona新特性解析:512級(jí)間接分支預(yù)測(cè)聽起來(lái)好象Barcelona中關(guān)于SSE128的改良很重大,但實(shí)際上這只不過(guò)是新架構(gòu)改變中的九牛一毛。下面我們來(lái)談?wù)劯鼮榫实腷ran

19、ch predictor分支預(yù)測(cè)器。一般來(lái)講,處理器的分支預(yù)測(cè)精準(zhǔn)度取決于設(shè)計(jì)架構(gòu)的深度和廣度。K8在分支預(yù)測(cè)方面的表現(xiàn)出色,對(duì)架構(gòu)優(yōu)化的很好。但I(xiàn)ntel Pentium 4和Pentium M在這方面做的更好,這也讓AMD看到了提升的空間。Barcelona中參加了512級(jí)間接分支預(yù)測(cè)(Indirect Branch Predictor),所謂間接分支預(yù)測(cè)是指在運(yùn)用時(shí)并不是立即分支,而是從存放器中裝載需要的預(yù)測(cè)目標(biāo),它實(shí)際上是一個(gè)首選目標(biāo)地址的歷史記錄表。間接分支預(yù)測(cè)(Indirect Branch Predictor)在運(yùn)用時(shí)并不是立即分支,而是從存放器中裝載需要的預(yù)測(cè)目標(biāo),它實(shí)際上是一

20、個(gè)首選目標(biāo)地址的歷史記錄表。在ROB和RS需要間接分支的時(shí)候它就可以提供幫助,ROB和RS就可以快速提取到適用的結(jié)果,這與P6構(gòu)架用可預(yù)測(cè)的條件分支替換間接分支來(lái)改善性能是相反的。在Prescott中,由于參加間接分支預(yù)測(cè)器,結(jié)果使SPEC CPU2000測(cè)試軟件中12%的分支預(yù)測(cè)錯(cuò)誤,但是AMD和Intel在算法結(jié)構(gòu)上的區(qū)別那么不被公開,在SPEC CPU2000的253.perlbmk測(cè)試工程中,非預(yù)測(cè)分支減少是非常明顯的,到達(dá)了將近55%。間接分支預(yù)測(cè)并不是Barcelona唯一的性能提升亮點(diǎn),回歸堆棧return stack大小較K8有雙倍大小的改良,舉個(gè)例子,在一個(gè)很長(zhǎng)的命令條中,命

21、令代碼包括了很多子程序比方遞歸函數(shù),CPU實(shí)際上會(huì)用完所有空間來(lái)紀(jì)錄它的路徑,一旦開始喪失回歸地址的路徑,就會(huì)導(dǎo)致無(wú)法進(jìn)行下一步的分支預(yù)測(cè),雙倍大小的設(shè)計(jì)正好是為了解決這個(gè)問(wèn)題,據(jù)說(shuō)這個(gè)改良是在收到一個(gè)大型軟件公司的請(qǐng)求才確定的。Barcelona新特性解析:堆棧操作與亂序執(zhí)行Intel最早的Pentium M處理器引入了一項(xiàng)名為“dedicated stack manager專注堆棧管理器的新特性,正如其名字所暗示的一樣,專注堆棧管理器專門處理所有的X86堆棧操作例如push, pop, call, return等。它將這些伐數(shù)據(jù)集中處理而無(wú)需其他執(zhí)行單元參與,這尤其簡(jiǎn)化了CPU整數(shù)執(zhí)行單元

22、的工作,加快了整數(shù)執(zhí)行單元的處理速度。AMD在Barcelona中也引入了類似的技術(shù),AMD稱之為Sideband Stack Optimizer邊帶堆棧優(yōu)化器。有了邊帶堆棧優(yōu)化器,處理器中的伐指令不再需要經(jīng)過(guò)3路編碼,也不再由整數(shù)執(zhí)行單元處理,這加快了堆棧的處理速度,也同時(shí)加快了整數(shù)執(zhí)行單元的處理速度。在Intel Core微構(gòu)架中一個(gè)重要改良是OOOE亂序執(zhí)行:當(dāng)裝載指令隊(duì)列發(fā)生等待時(shí),處理器可以將隊(duì)列前方處于等待的指令優(yōu)先裝載并執(zhí)行,而不是一直等待到堵塞結(jié)束。平均而言,約30%的指令會(huì)發(fā)生一定時(shí)間的堵塞,這一亂序執(zhí)行模式的引入,使新構(gòu)架CPU性能有了明顯的提高。AMD的K8構(gòu)架并不支持O

23、OOE亂序執(zhí)行指令,所以即使K8構(gòu)架有優(yōu)秀的內(nèi)置內(nèi)存控制器,也依然被對(duì)手的Core構(gòu)架擊敗。正視這一技術(shù)上的落后,AMD在K8L構(gòu)架的首款芯片Barcelona上及時(shí)改良為OOOE技術(shù),這一改良必將為K8L構(gòu)架的性能帶來(lái)極大的提高。Barcelona將可以亂序執(zhí)行指令,同樣也可以在前一指令尚未處理完成時(shí),裝載并用空載單元處理下一指令,即使這兩條指令需要讀取不同的內(nèi)存地址。Barcelona擁有3個(gè)地址生成單元,可以完成3個(gè)存放指令每周期,而Core構(gòu)架每周期只能執(zhí)行1次-K8L構(gòu)架的存放速度要比Core構(gòu)架強(qiáng)大3倍。K8L構(gòu)架中參加了新的SSE4指令擴(kuò)展:SSEEXTRQ/INSERTQ指令和

24、MOVNTSD/MOVNTSS指令。前者可以將多條指令合并為一條指令執(zhí)行,后者用來(lái)計(jì)算流量存放指令。Intel也會(huì)將在稍候發(fā)布的Penryn處理器中參加。Barcelona新特性解析:內(nèi)存控制器再度強(qiáng)化當(dāng)年當(dāng)AMD將內(nèi)存控制器集成至CPU內(nèi)部時(shí),我們看到了嶄新而強(qiáng)大的K8構(gòu)架。如今,Barcelona的內(nèi)存控制器在設(shè)計(jì)上將又一次極大的改良其內(nèi)存性能。Intel Xeon效勞器所有使用的FB-DIMM內(nèi)存一大優(yōu)勢(shì)是,可以同時(shí)執(zhí)行讀和寫命令到AMB,而在標(biāo)準(zhǔn)的DDR2內(nèi)存中,你只能同時(shí)進(jìn)行一個(gè)操作,而且讀和寫的切換會(huì)有非常大的損失。如果是一連串的隨機(jī)混合執(zhí)行的話,將會(huì)帶來(lái)非常嚴(yán)重的資源浪費(fèi),而如果

25、是先全部讀然后再轉(zhuǎn)換到寫的話,就可以防止性能的損失。K8內(nèi)存控制器就采用讀取優(yōu)先于寫的策略來(lái)提高運(yùn)行效率,但是Barcelona那么更加智能化。但是讀取的數(shù)據(jù)會(huì)被先存放在buffer中,而不采用先直接執(zhí)行寫,但當(dāng)它的容量到達(dá)了極限就會(huì)溢出,為了防止這種情況,在此之前才對(duì)讀寫之間進(jìn)行切換,同時(shí)可以帶來(lái)帶寬和延遲方面效率的提高。K8核心配備的是128-bits寬度的單內(nèi)存控制器,但是在Barcelona中,AMD把它分割成兩個(gè)64-bit,每個(gè)控制器可以獨(dú)立的進(jìn)行操作,因此它可以帶來(lái)效率上的不小提升,尤其是在四核執(zhí)行的環(huán)境下,每個(gè)核心可以獨(dú)立占有內(nèi)存訪問(wèn)資源。Barcelonas中集成的北橋局部注

26、意不是主板北橋也被設(shè)計(jì)成更高的帶寬,更深的buffers將允許更高的帶寬利用率,同時(shí)北橋自身已經(jīng)可以使用未來(lái)的內(nèi)存技術(shù),比方DDR3。內(nèi)存控制器的預(yù)取功能是運(yùn)用相當(dāng)廣泛、十分重要的一項(xiàng)功能。預(yù)取可以減少內(nèi)存延遲對(duì)整體性能的負(fù)面影響。當(dāng)NVIDIA發(fā)布nForce2主板時(shí),重點(diǎn)介紹的就是nForce2芯片組的128位智能預(yù)取功能。INTEL在發(fā)布Core 2處理器之時(shí)也強(qiáng)調(diào)了CORE構(gòu)架每核心擁有三個(gè)預(yù)取單元。K8構(gòu)架中每個(gè)核心設(shè)計(jì)有2個(gè)預(yù)取器,一個(gè)是指令預(yù)取器,另一個(gè)是數(shù)據(jù)預(yù)取器。K8L構(gòu)架的Barcelona保持了2個(gè)的數(shù)量,但在性能上有了較大的改良。一個(gè)明顯的改良是數(shù)據(jù)預(yù)取器直接將數(shù)據(jù)存放

27、入L1緩存中,相比K8構(gòu)架中存放入L2緩存的做法,新的數(shù)據(jù)預(yù)取器準(zhǔn)確率更高,速度更快,內(nèi)存性能及CPU整體性能將得益于此。Barcelona新特性解析:創(chuàng)新三級(jí)緩存受工藝技術(shù)方面的影響,AMD處理器的緩存容量一直都要落后于Intel,AMD自己也清楚自己無(wú)法在珍貴的die上參加更多的晶體管來(lái)實(shí)現(xiàn)大容量的緩存,但是勇于創(chuàng)新的AMD卻找到了更好的方法集成內(nèi)存控制器。處理器整合內(nèi)存控制器可以說(shuō)是一項(xiàng)杰作,擁有整合內(nèi)存控制器的K8構(gòu)架僅依靠512KB的L2緩存就能夠擊敗當(dāng)時(shí)的對(duì)手Pentium 4。直到現(xiàn)在的Athlon 64 X2也依然保持著Intel 2002年就已過(guò)時(shí)的512KB L2緩村?,F(xiàn)在

28、Core 2已經(jīng)擁有了4MB的L2緩存,看來(lái)Intel和AMD之間的緩存差距還將保持,因?yàn)锽arcelona的L2緩存依然是512KB。相比之下,Intel四核的Kentsfield芯片擁有8MB的L2緩存,而2007年末上市的新型Penryn芯片將擁有12MB的L2緩存。Barcelona的緩存體系和K8構(gòu)架有一定的相似之處,它的四顆核心各擁有64KB的L1緩存和512KB的L2緩存。從簡(jiǎn)化芯片設(shè)計(jì)的角度來(lái)看,四核心共享巨大的L2緩存對(duì)K8L構(gòu)架而言并不適宜,所以AMD引入了L3緩存,得益于65nm工藝,Barcelona在一顆晶圓上集成四顆核心外,還集成了一塊2MB容量的L3緩存。也就是說(shuō)

29、L3緩存與4顆內(nèi)核同樣原生于一塊晶圓,其容量為最小2M起跳。同L2緩存一樣,L3緩存也是獨(dú)立的,L1緩存的數(shù)據(jù)和L3緩存的數(shù)據(jù)將不會(huì)重復(fù)。Barcelona的緩存工作原理是:L2緩存是作為L(zhǎng)1緩存的備用空間。L1緩存儲(chǔ)存著CPU當(dāng)前最需要的數(shù)據(jù),而當(dāng)空間缺乏時(shí),一些不是最重要的數(shù)據(jù)就轉(zhuǎn)移到L2緩存中。而當(dāng)未來(lái)再次需要時(shí),那么從L2緩存中再次轉(zhuǎn)移到L1緩存中。新參加的L3緩存延續(xù)了L2緩存的角色,四顆核心的L2緩存將溢出的數(shù)據(jù)暫時(shí)存放在L3緩存中。L1緩存和L2緩存依然分別是2路和16路,L3緩存那么是32路。快速的32路L3緩存不僅可以更好的滿足多任務(wù)并行,而且對(duì)單任務(wù)的執(zhí)行也有著較大積極作用

30、。尤其在3D運(yùn)用方面,2MB的L3緩存將對(duì)性能產(chǎn)生極大的推進(jìn)作用。Barcelona新特性解析:虛擬化與功耗水平虛擬化技術(shù)在未來(lái)將有著更廣泛的應(yīng)用,以往是效勞器處理器的標(biāo)志,現(xiàn)在也漸漸被更多桌面處理器所支持。在虛擬技術(shù)方面,Barcelona也有了很大的改良,由于采用了更快的虛擬地址轉(zhuǎn)換算法,在擁有多個(gè)客戶操作系統(tǒng)的虛擬軟件堆棧中,有一個(gè)內(nèi)存地址轉(zhuǎn)換必須處理,客戶系統(tǒng)向系統(tǒng)管理程序的地址轉(zhuǎn)換,因?yàn)槊總€(gè)客戶系統(tǒng)擁有獨(dú)立的內(nèi)存管理,據(jù)AMD表示,在此之前這個(gè)轉(zhuǎn)換過(guò)程都是通過(guò)軟件來(lái)實(shí)現(xiàn)的,并且是基于一個(gè)叫shadow paging的技術(shù),而Barcelona提供的是硬件級(jí)加速轉(zhuǎn)換,AMD把它稱為Ne

31、sted Paging。根據(jù)推算大約系統(tǒng)管理程序所消耗的75%的時(shí)間是用于shadow paging,轉(zhuǎn)換的地址是在Barcelonas TLBs中被緩存的,而且AMD指出Nested Paging并不需要太復(fù)雜的設(shè)定,這對(duì)于軟件開發(fā)商來(lái)說(shuō)就變得非常簡(jiǎn)單。處理器的功耗問(wèn)題開始被越來(lái)越多的人重視,目前的Intel四核的功耗非常高,而Barcelona的四個(gè)核心工作電壓都一樣,同時(shí)內(nèi)部的北橋單元那么使用獨(dú)立的電壓方案,可以根據(jù)另外一個(gè)工作情況在0.8V到1.4V之間改變,它們的電壓可以獨(dú)立管理,這將提高功耗效率。獨(dú)立的核心雖然共享同樣的電壓,但是每個(gè)核心都擁有自己的PLL電路,所以它們可以根據(jù)負(fù)載

32、情況,運(yùn)行在不同的頻率下。Barcelona每個(gè)核心支持五個(gè)獨(dú)立的p-states頻率等級(jí)轉(zhuǎn)換,改變只是在頻率上,p-states完全是硬件控制的,所以我們不需要驅(qū)動(dòng)就可以開啟這個(gè)功耗管理特性,同時(shí)AMD也增加了clock gating時(shí)鐘頻率比的數(shù)量,配合最新的65nm工藝,保證AMD首款四核處理器的功耗表現(xiàn)和目前的雙核Opteron一樣。Intel與AMD真正的角逐即將正式上演Intel去年7月份發(fā)布的Core 2系列處理器,其在性能方面的提升可以說(shuō)接近革命性,近年來(lái)新處理器性能有如此大的提升恐怕也只有Core 2了。Core 2系列的成功,很大程度上是受惠于全新的架構(gòu),但是不能否認(rèn)的是,

33、Intel新架構(gòu)的成功,一定程度上還要感謝AMD。基于Core微架構(gòu)的Conroe、Merom以及Woodcrest處理器在性能方面都要強(qiáng)于上一代NetBurst架構(gòu)產(chǎn)品,但是早在2003年,AMD就已經(jīng)做到了這一點(diǎn)。AMD K8架構(gòu)是一個(gè)非常超前的架構(gòu),但是隨著時(shí)間的推移,其畢竟在漸漸變老。過(guò)去的幾年了,AMD并沒(méi)有對(duì)K8架構(gòu)進(jìn)行大的改良,性能上也沒(méi)有明顯的提升。而對(duì)Intel來(lái)說(shuō),K8架構(gòu)就好似是AMD給出的一個(gè)固定的目標(biāo)。正是有了這個(gè)目標(biāo),Intel才能最終開發(fā)完成Athlon 64殺手。在過(guò)去的幾年了,AMD的許多動(dòng)作引領(lǐng)著處理器的開展方向。而也正是K8這樣優(yōu)秀架構(gòu)的存在,才能讓最近一、兩年處理器架構(gòu)的變革如此之大。AMD新架構(gòu)處理器型號(hào)及規(guī)格回歸到實(shí)際的產(chǎn)品上,基于Barcelona的實(shí)際產(chǎn)品將首先出現(xiàn)在Opteron產(chǎn)品線上,2007年中9月10日發(fā)布。最初的產(chǎn)品頻率在2.1GHz到2.3GHz,而到年底左右,主頻有望再次提升。在桌面市場(chǎng),AMD將發(fā)布Agena四核心處理器,主頻在2.72.9GHz,而Kuma將是雙核版本的Agena,主頻涵蓋2.02.9GHz。性能比上代產(chǎn)品提升70%AMD K10新架構(gòu)Barcelona將帶來(lái)大幅的性能提升,尤其將彌補(bǔ)目前K8架構(gòu)在視頻編碼方面的弱勢(shì)。目前在AMD的規(guī)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論