的關(guān)鍵技術(shù)ppt課件_第1頁
的關(guān)鍵技術(shù)ppt課件_第2頁
的關(guān)鍵技術(shù)ppt課件_第3頁
的關(guān)鍵技術(shù)ppt課件_第4頁
的關(guān)鍵技術(shù)ppt課件_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2.5.4 RISC2.5.4 RISC的關(guān)鍵技術(shù)的關(guān)鍵技術(shù)1. 1. 延時(shí)轉(zhuǎn)移技術(shù)延時(shí)轉(zhuǎn)移技術(shù)為了使指令流水線不斷流,在轉(zhuǎn)移指令之后插入一條沒有數(shù)據(jù)為了使指令流水線不斷流,在轉(zhuǎn)移指令之后插入一條沒有數(shù)據(jù)相關(guān)和控制相關(guān)的有效指令,而轉(zhuǎn)移指令被延遲執(zhí)行,這種相關(guān)和控制相關(guān)的有效指令,而轉(zhuǎn)移指令被延遲執(zhí)行,這種技術(shù)稱為延遲轉(zhuǎn)移技術(shù)。技術(shù)稱為延遲轉(zhuǎn)移技術(shù)。采用指令延遲轉(zhuǎn)移技術(shù)時(shí),指令序列的調(diào)整由編譯器自動(dòng)進(jìn)展,采用指令延遲轉(zhuǎn)移技術(shù)時(shí),指令序列的調(diào)整由編譯器自動(dòng)進(jìn)展,用戶不用干涉。用戶不用干涉。讀采用延遲轉(zhuǎn)移的程序,必需非常小心。讀采用延遲轉(zhuǎn)移的程序,必需非常小心。1 1: : 2 2: : 3 3:

2、 : n n: : A AD DD D R R1 1, , R R2 2 1 1: : J JM MP P N NE EX XT T2 2 2 2: : N NE EX XT T1 1: : S SU UB B R R3 3, , R R4 4 3 3: : n n: : N NE EX XT T2 2: : M MO OV VE E R R4 4, , A A F F E E F F E E F F E E F F E E 因因轉(zhuǎn)轉(zhuǎn)移移指指令令引引起起的的流流水水線線斷斷流流 重重新新取取指指令令 指指令令作作廢廢 產(chǎn)產(chǎn)生生轉(zhuǎn)轉(zhuǎn)移移地地址址 1 1: : 2 2: : 3 3: : n n:

3、 : J JM MP P N NE EX XT T2 2 1 1: : A AD DD D R R1 1, , R R2 2 2 2: : N NE EX XT T1 1: : S SU UB B R R3 3, , R R4 4 n n: : N NE EX XT T2 2: : M MO OV VE E R R4 4, , A A F F E E F F E E F F E E 采采用用延延時(shí)時(shí)轉(zhuǎn)轉(zhuǎn)移移技技術(shù)術(shù)的的指指令令流流水水線線 重重新新取取指指令令 插插入入指指令令 產(chǎn)產(chǎn)生生轉(zhuǎn)轉(zhuǎn)移移地地址址 無條件轉(zhuǎn)移指令的延遲執(zhí)行無條件轉(zhuǎn)移指令的延遲執(zhí)行 條件轉(zhuǎn)移指令的延遲執(zhí)行條件轉(zhuǎn)移指令的延遲

4、執(zhí)行調(diào)整前的指令序列:調(diào)整前的指令序列: 1 1:MOVE R1, R2MOVE R1, R2 2 2:CMP R3, R4 ;(R3)CMP R3, R4 ;(R3)與與(R4)(R4)比較比較 3 3:BEQ EXIT ;BEQ EXIT ;假設(shè)假設(shè)(R3)=(R4)(R3)=(R4)那么轉(zhuǎn)移那么轉(zhuǎn)移 NEXT: MOVE R4, A NEXT: MOVE R4, A調(diào)整后的指令序列:調(diào)整后的指令序列: 1 1:CMP R3, R4 ;(R3)CMP R3, R4 ;(R3)與與(R4)(R4)比較比較 2 2:BEQ EXIT ;BEQ EXIT ;假設(shè)假設(shè)(R3)=(R4)(R3)=(

5、R4)那么那么轉(zhuǎn)移轉(zhuǎn)移 3 3:MOVE R1,R2 ;MOVE R1,R2 ;被插入的指令被插入的指令 NEXT: MOVE R4, A NEXT: MOVE R4, A 采用延遲轉(zhuǎn)移技術(shù)的兩個(gè)限制條件采用延遲轉(zhuǎn)移技術(shù)的兩個(gè)限制條件被挪動(dòng)指令在挪動(dòng)過程中與所經(jīng)過的指令之間沒有數(shù)被挪動(dòng)指令在挪動(dòng)過程中與所經(jīng)過的指令之間沒有數(shù)據(jù)相關(guān)據(jù)相關(guān)被挪動(dòng)指令不破壞條件碼,至少不影響后面的指令運(yùn)被挪動(dòng)指令不破壞條件碼,至少不影響后面的指令運(yùn)用條件碼用條件碼假設(shè)找不到符合上述條件的指令,必需在條件轉(zhuǎn)移指假設(shè)找不到符合上述條件的指令,必需在條件轉(zhuǎn)移指令后面插入空操作令后面插入空操作假設(shè)指令的執(zhí)行過程分為多個(gè)流水

6、段,那么要插入多假設(shè)指令的執(zhí)行過程分為多個(gè)流水段,那么要插入多條指令條指令插入插入1條指令勝利的概率比較大,插入條指令勝利的概率比較大,插入2條或條或2條以上條以上指令勝利的概率明顯下降指令勝利的概率明顯下降2. 2. 指令取消技術(shù)指令取消技術(shù) 采用指令延時(shí)技術(shù),經(jīng)常找不到可以用來調(diào)整的指令,采用指令延時(shí)技術(shù),經(jīng)常找不到可以用來調(diào)整的指令, 可思索采用另一種方法:指令取消技術(shù)可思索采用另一種方法:指令取消技術(shù) 分為兩種情況:分為兩種情況:(1)(1)向后轉(zhuǎn)移適用于循環(huán)程序向后轉(zhuǎn)移適用于循環(huán)程序 實(shí)現(xiàn)方法:循環(huán)體的第一條指令安放在兩個(gè)位置,分別在循實(shí)現(xiàn)方法:循環(huán)體的第一條指令安放在兩個(gè)位置,分別

7、在循環(huán)體的前面和后面。環(huán)體的前面和后面。 假設(shè)轉(zhuǎn)移勝利,那么執(zhí)行循環(huán)體后面的指令,然后前往到假設(shè)轉(zhuǎn)移勝利,那么執(zhí)行循環(huán)體后面的指令,然后前往到循環(huán)體開場;循環(huán)體開場; 否那么取消循環(huán)體后面的指令否那么取消循環(huán)體后面的指令 X X X X X X L LO OO OP P: : Y Y Y Y Y Y Z Z Z Z Z Z C CO OM MP P R R1 1, , R R2 2, , L LO OO OP P X X X X X X W W W W W W ( (b b) ) 調(diào)調(diào)整整后后的的程程序序 效果:效果: 可以使指令流可以使指令流水線在絕大多數(shù)水線在絕大多數(shù)情況下不斷流。情況下不

8、斷流。 對(duì)于循環(huán)程序,對(duì)于循環(huán)程序,由于絕大多數(shù)情由于絕大多數(shù)情況下,轉(zhuǎn)移是勝?zèng)r下,轉(zhuǎn)移是勝利的。利的。 只需最后一次只需最后一次出循環(huán)時(shí),轉(zhuǎn)移出循環(huán)時(shí),轉(zhuǎn)移不勝利。不勝利。LOOP: X X X LOOP: X X X Y Y Y Y Y Y Z Z Z Z Z Z COMP R1, R2, LOOP COMP R1, R2, LOOP W W W W W W (a) (a) 調(diào)整前的程序調(diào)整前的程序 (2)向前轉(zhuǎn)移向前轉(zhuǎn)移(IF THEN ) 實(shí)現(xiàn)方法:假設(shè)轉(zhuǎn)移不勝利,執(zhí)行轉(zhuǎn)移指令實(shí)現(xiàn)方法:假設(shè)轉(zhuǎn)移不勝利,執(zhí)行轉(zhuǎn)移指令 之后的下條指令,否那么取消下條指令。之后的下條指令,否那么取消下條指令

9、。 例子:例子:R R R “IF部分的程序代碼部分的程序代碼 S S S COMP R1, R2, THRU T T T “THEN部分的程序代碼部分的程序代碼 U U U THRU: V V V 效果:轉(zhuǎn)移勝利與不勝利的概率效果:轉(zhuǎn)移勝利與不勝利的概率, 通常各通常各50 主要優(yōu)點(diǎn):不用進(jìn)展指令流調(diào)整主要優(yōu)點(diǎn):不用進(jìn)展指令流調(diào)整3. 3. 重疊存放器窗口技術(shù)重疊存放器窗口技術(shù) Overlapping Register WindowOverlapping Register Window緣由:在緣由:在RISCRISC中,子程序比中,子程序比CISCCISC中多中多 由于傳送參數(shù)而訪問存儲(chǔ)器的

10、信息量很大由于傳送參數(shù)而訪問存儲(chǔ)器的信息量很大 美國加洲大學(xué)伯克利分校的美國加洲大學(xué)伯克利分校的F BaskettF Baskett提出提出 實(shí)現(xiàn)方法:設(shè)置一個(gè)數(shù)量比較大的存放器堆,并把它劃分成很多個(gè)窗口。實(shí)現(xiàn)方法:設(shè)置一個(gè)數(shù)量比較大的存放器堆,并把它劃分成很多個(gè)窗口。每個(gè)過程運(yùn)用其中相鄰的三個(gè)窗口和一個(gè)公共的窗口,在這些窗口中:每個(gè)過程運(yùn)用其中相鄰的三個(gè)窗口和一個(gè)公共的窗口,在這些窗口中:有一個(gè)窗口是與前一個(gè)過程共用有一個(gè)窗口是與前一個(gè)過程共用有個(gè)窗口是與下一個(gè)過程共用。有個(gè)窗口是與下一個(gè)過程共用。與前一過程共用的窗口可以用來存放前一過程傳送給本過程的參數(shù),同時(shí)也與前一過程共用的窗口可以用來

11、存放前一過程傳送給本過程的參數(shù),同時(shí)也可以用于存放本過程傳送給前一過程的計(jì)算結(jié)果??梢杂糜诖娣疟具^程傳送給前一過程的計(jì)算結(jié)果。1 13 37 7 1 13 32 2 傳傳送送參參數(shù)數(shù) 寄寄存存器器重重疊疊 1 13 31 1 1 12 22 2 A A 局局部部寄寄存存器器 A A 局局部部寄寄存存器器 1 12 21 1 1 11 16 6 A A, ,B B 公公用用寄寄存存器器 傳傳送送參參數(shù)數(shù) 傳傳送送參參數(shù)數(shù) 寄寄存存器器重重疊疊 1 11 15 5 1 10 06 6 B B 局局部部寄寄存存器器 B B 局局部部寄寄存存器器 1 10 05 5 1 10 00 0 B B, ,C

12、 C 公公用用寄寄存存器器 傳傳送送參參數(shù)數(shù) 傳傳送送參參數(shù)數(shù) 9 99 9 9 90 0 B B 局局部部寄寄存存器器 C C 局局部部寄寄存存器器 8 89 9 8 84 4 C C, ,D D 公公用用寄寄存存器器 傳傳送送參參數(shù)數(shù) 3 31 1 2 26 6 與與上上一一過過程程合合用用 3 31 1 2 26 6 與與上上一一過過程程合合用用 3 31 1 2 26 6 與與上上一一過過程程合合用用 2 25 5 1 16 6 局局部部寄寄存存器器 2 25 5 1 16 6 局局部部寄寄存存器器 2 25 5 1 16 6 局局部部寄寄存存器器 1 10 0 1 15 5 1 10

13、 0 與與下下一一過過程程合合用用 1 15 5 1 10 0 與與下下一一過過程程合合用用 1 15 5 1 10 0 與與下下一一過過程程合合用用 9 9 0 0 全全局局寄寄存存器器 9 9 0 0 全全局局寄寄存存器器 9 9 0 0 全全局局寄寄存存器器 9 9 0 0 全全局局寄寄存存器器 物物理理寄寄存存器器 A A 過過程程的的 寄寄存存器器窗窗口口 B B 過過程程的的 寄寄存存器器窗窗口口 C C 過過程程的的 寄寄存存器器窗窗口口 重重疊疊寄寄存存器器窗窗口口技技術(shù)術(shù) 例子:在例子:在RISC IIRISC II中采用的方法中采用的方法目前,目前,SUNSUN公司的公司的

14、SPARCSPARC、SuperSPARCSuperSPARC、UtraSPARCUtraSPARC等處等處置機(jī),把最后一個(gè)過程與第一個(gè)過程的公用存放器置機(jī),把最后一個(gè)過程與第一個(gè)過程的公用存放器重疊起來,構(gòu)成一個(gè)循環(huán)圈。重疊起來,構(gòu)成一個(gè)循環(huán)圈。效果:可以減少大量的訪存操作。效果:可以減少大量的訪存操作。另外,要在主存中開辟一個(gè)堆棧,當(dāng)調(diào)用層數(shù)超越規(guī)另外,要在主存中開辟一個(gè)堆棧,當(dāng)調(diào)用層數(shù)超越規(guī)定層數(shù)存放器溢出時(shí),把益出部分的存放器中定層數(shù)存放器溢出時(shí),把益出部分的存放器中內(nèi)容壓入堆棧。內(nèi)容壓入堆棧。寄寄 存存 器器 窗窗 口口 技技 術(shù)術(shù) 的的 效效 果果程程 序序 名名 稱稱調(diào)調(diào) 用用

15、次次 數(shù)數(shù)最最 大大調(diào)調(diào) 用用 深深 度度R RI IS SC C I II I溢溢 出出 次次 數(shù)數(shù)R RI IS SC C I II I訪訪 存存 次次 數(shù)數(shù)V VA AX X- -1 11 1訪訪 存存 次次 數(shù)數(shù)Q Qu ui ic ck ks so or rt t 1 11 11 1K K( (0 0. .7 7 ) )1 10 06 64 44 4K K( (0 0. .8 8 ) )6 69 96 6K K( (5 50 0 ) )P Pu uz zz zl le e4 43 3K K( (8 8. .0 0 ) )2 20 01 12 24 48 8K K( (1 1. .0

16、0 ) )4 44 44 4K K( (2 28 8 ) )過過程程調(diào)調(diào)用用所所需需開開銷銷的的比比較較機(jī)機(jī)器器類類型型執(zhí)執(zhí)行行指指令令條條數(shù)數(shù)執(zhí)執(zhí)行行時(shí)時(shí)間間( (微微秒秒) )訪訪問問存存儲(chǔ)儲(chǔ)器器次次數(shù)數(shù)V VA AX X- -1 11 1P PD DP P- -1 11 1M MC C6 68 80 00 00 0R RI IS SC C I II I5 51 19 99 96 62 26 62 22 21 19 92 21 10 01 15 51 12 20 0. .2 2注注:Q Qu ui ic ck ks so or rt t程程序序的的調(diào)調(diào)用用的的次次數(shù)數(shù)多多,深深度度不不大大

17、,P Pu uz zz zl le e程程序序正正好好相相反反4. 4. 指令流調(diào)整技術(shù)指令流調(diào)整技術(shù)目的:經(jīng)過變量重新命名消除數(shù)據(jù)相關(guān),提高流水線效率目的:經(jīng)過變量重新命名消除數(shù)據(jù)相關(guān),提高流水線效率例子:調(diào)整后的指令序列比原指令序列的執(zhí)行速度快一倍例子:調(diào)整后的指令序列比原指令序列的執(zhí)行速度快一倍 ADD R1,R2,R3 ADD R1,R2,R3ADD R1,R2,R3 ADD R1,R2,R3 ADD R3,R4,R5 MUL R6,R7,R0 ADD R3,R4,R5 MUL R6,R7,R0 MUL R6,R7,R3 ADD R3,R4,R5 MUL R6,R7,R3 ADD R3

18、,R4,R5 MUL R3,R8,R9 MUL R0,R8,R9 MUL R3,R8,R9 MUL R0,R8,R9 調(diào)整前的指令序列調(diào)整前的指令序列 調(diào)整后的指令序列調(diào)整后的指令序列5. 5. 以硬件為主固件為輔以硬件為主固件為輔 固件的主要缺陷是:固件的主要缺陷是: 執(zhí)行速度低。目前,執(zhí)行速度低。目前,ROMROM的速度低于的速度低于SRAMSRAM 一條機(jī)器指令通常要多條微指令解釋執(zhí)行一條機(jī)器指令通常要多條微指令解釋執(zhí)行 固件的主要優(yōu)點(diǎn)是:固件的主要優(yōu)點(diǎn)是: 便于實(shí)現(xiàn)復(fù)雜指令,便于修正指令系統(tǒng)便于實(shí)現(xiàn)復(fù)雜指令,便于修正指令系統(tǒng) 以硬聯(lián)邏輯為主來實(shí)現(xiàn)指令系統(tǒng)以硬聯(lián)邏輯為主來實(shí)現(xiàn)指令系統(tǒng) 對(duì)

19、于少數(shù)復(fù)雜的指令,目前的許多處置機(jī)也用微程序技術(shù)實(shí)對(duì)于少數(shù)復(fù)雜的指令,目前的許多處置機(jī)也用微程序技術(shù)實(shí)現(xiàn)。現(xiàn)。2.5.5 RISC2.5.5 RISC優(yōu)化編譯技術(shù)優(yōu)化編譯技術(shù)RISC對(duì)編譯器帶來的方便主要有:對(duì)編譯器帶來的方便主要有: (1)指令系統(tǒng)比較簡單、對(duì)稱、均勻,指令選擇任務(wù)指令系統(tǒng)比較簡單、對(duì)稱、均勻,指令選擇任務(wù)簡單。簡單。 (2)選擇尋址方式的任務(wù)簡單,選擇尋址方式的任務(wù)簡單, (3)由于采用由于采用LOAD/STORE方式,省去了能否生成訪方式,省去了能否生成訪問存儲(chǔ)器指令的選擇任務(wù)。問存儲(chǔ)器指令的選擇任務(wù)。 (4)由于大多數(shù)指令在一個(gè)周期內(nèi)執(zhí)行完成,為編譯由于大多數(shù)指令在一個(gè)

20、周期內(nèi)執(zhí)行完成,為編譯器調(diào)整指令序列提供了極大的方便。器調(diào)整指令序列提供了極大的方便。RISCRISC對(duì)編譯器呵斥的困難主要有:對(duì)編譯器呵斥的困難主要有: (1)(1)必需精心安排每一個(gè)存放器的用法,以便充分發(fā)必需精心安排每一個(gè)存放器的用法,以便充分發(fā)揚(yáng)每一個(gè)通用存放器的效率,盡量減少訪問主存儲(chǔ)揚(yáng)每一個(gè)通用存放器的效率,盡量減少訪問主存儲(chǔ)器的次數(shù)。器的次數(shù)。 (2)(2)做數(shù)據(jù)和控制相關(guān)性分析,要調(diào)整指令的執(zhí)行序做數(shù)據(jù)和控制相關(guān)性分析,要調(diào)整指令的執(zhí)行序列,并與硬件相配合實(shí)現(xiàn)指令延遲技術(shù)和指令取消列,并與硬件相配合實(shí)現(xiàn)指令延遲技術(shù)和指令取消技術(shù)等。技術(shù)等。 (3)(3)要設(shè)計(jì)復(fù)雜的子程序庫,要

21、設(shè)計(jì)復(fù)雜的子程序庫,RISCRISC的子程序庫通常要的子程序庫通常要比比CISCCISC的子程序庫大得多。的子程序庫大得多。2.6 VLIW2.6 VLIW指令系統(tǒng)指令系統(tǒng)2.6.1 什么是什么是WLIW2.6.2 指令級(jí)并行技術(shù)指令級(jí)并行技術(shù)2.6.3 VLIW的主要特點(diǎn)的主要特點(diǎn)2.6.4 VLIW處置機(jī)處置機(jī)2.6.1 2.6.1 什么是什么是VLIWVLIW1. VLIW (Very Long Instruction Word) 1. VLIW (Very Long Instruction Word) 的背景的背景由美國由美國J. A. FisherJ. A. Fisher教授于教授于

22、19811981年首先提出年首先提出 最初來源于程度微程序最初來源于程度微程序由由J. A. FisherJ. A. Fisher創(chuàng)建的創(chuàng)建的MutiflowMutiflow公司研制了的世界上第公司研制了的世界上第一臺(tái)一臺(tái)VLIWVLIW處置機(jī)處置機(jī)TRACE28/300TRACE28/300。一條指令中包含有多個(gè)可以同時(shí)執(zhí)行的操作一條指令中包含有多個(gè)可以同時(shí)執(zhí)行的操作 TRACE28/300TRACE28/300處置機(jī)的一條超長指令中最多有處置機(jī)的一條超長指令中最多有2828條可以條可以同時(shí)執(zhí)行的指令。同時(shí)執(zhí)行的指令。算法和編譯技術(shù)是關(guān)鍵算法和編譯技術(shù)是關(guān)鍵在下一代處置機(jī)中將普遍采用在下一代

23、處置機(jī)中將普遍采用2. 2. 什么是什么是VLIWVLIW指令系統(tǒng)指令系統(tǒng) 一種顯式指令級(jí)并行指令系統(tǒng)。一種顯式指令級(jí)并行指令系統(tǒng)。 EPICEPIC:Explicitly Parallel Explicitly Parallel Instruction ComputingInstruction Computing 在一條在一條VLIWVLIW指令中包含有多個(gè)一樣或不同的操作字段每個(gè)操指令中包含有多個(gè)一樣或不同的操作字段每個(gè)操作字段的功能相當(dāng)于普通處置機(jī)中的一條指令。每個(gè)操作作字段的功能相當(dāng)于普通處置機(jī)中的一條指令。每個(gè)操作字段可以分別獨(dú)立控制各自的功能部件同時(shí)任務(wù),即用一條字段可以分別獨(dú)立控

24、制各自的功能部件同時(shí)任務(wù),即用一條指令來實(shí)現(xiàn)多個(gè)操作的并行執(zhí)行,之所以放到一條指令是為指令來實(shí)現(xiàn)多個(gè)操作的并行執(zhí)行,之所以放到一條指令是為了減少內(nèi)存訪問。了減少內(nèi)存訪問。通常一條指令多達(dá)上百位,有假設(shè)干操作數(shù),每條指令可以做不通常一條指令多達(dá)上百位,有假設(shè)干操作數(shù),每條指令可以做不同的幾種運(yùn)算。哪些指令可以并行執(zhí)行是由編譯器來選擇的。同的幾種運(yùn)算。哪些指令可以并行執(zhí)行是由編譯器來選擇的。通常通常VLIWVLIW機(jī)只需一個(gè)控制器,每個(gè)周期啟動(dòng)一條長指令,長機(jī)只需一個(gè)控制器,每個(gè)周期啟動(dòng)一條長指令,長指令被分為幾個(gè)字段,每個(gè)字段控制相應(yīng)的部件。由于編譯指令被分為幾個(gè)字段,每個(gè)字段控制相應(yīng)的部件。由

25、于編譯器需求思索數(shù)據(jù)相關(guān)性,防止沖突,并且盡能夠利用并行,器需求思索數(shù)據(jù)相關(guān)性,防止沖突,并且盡能夠利用并行,完成指令調(diào)度,所以硬件構(gòu)造較簡單。完成指令調(diào)度,所以硬件構(gòu)造較簡單。 2.6.2 2.6.2 指令級(jí)并行指令級(jí)并行提出VLIW指令系統(tǒng)的主要目的是要開發(fā)程序中的指令級(jí)并行性(Instruction Level Parallelism)超標(biāo)量(Superscalar)處置機(jī) 依托設(shè)置多條指令流水線,并經(jīng)過同時(shí)發(fā)射多條指令來提高處置機(jī)的運(yùn)算速度,將一條指令分成假設(shè)干個(gè)周期處置以到達(dá)多條指令重疊處置,從而提高cpu部件利用率的技術(shù)叫做標(biāo)量流水技術(shù).超級(jí)標(biāo)量是指cpu內(nèi)普通能有多條流水線,這些

26、流水線可以并行處置.在單流水線構(gòu)造中,指令雖然可以重疊執(zhí)行,但依然是順序的,每個(gè)周期只能發(fā)射(issue)或退休(retire)一條指令.超級(jí)標(biāo)量構(gòu)造的cpu支持指令級(jí)并行,每個(gè)周期可以發(fā)射多條指令(2-4條居多).這樣,可以使得cpu的IPC(Instruction Per Clock) 1, 從而提高cpu處置速度.超級(jí)標(biāo)量機(jī)能同時(shí)對(duì)假設(shè)干條指令進(jìn)展譯碼,將可以并行執(zhí)行的指令送往不同的執(zhí)行部件,在程序運(yùn)轉(zhuǎn)期間,由硬件(通常是形狀記錄部件和調(diào)度部件)來完成指令調(diào)度. 超級(jí)標(biāo)量機(jī)主要是借助硬件資源反復(fù)(例如有兩套譯碼器和ALU等)來實(shí)現(xiàn)空間的并行操作. 我們熟知的pentium系列(能夠是p-

27、II開場),還有SUN SPARC系列的較高級(jí)型號(hào),以及MIPS假設(shè)干型號(hào)等都采用了超級(jí)標(biāo)量技術(shù).超流水線超流水線(Superpipelining)處置機(jī)處置機(jī) 經(jīng)過分時(shí)運(yùn)用同一條指令經(jīng)過分時(shí)運(yùn)用同一條指令流水線的不同部分來提高處置機(jī)的運(yùn)算速度。流水線的不同部分來提高處置機(jī)的運(yùn)算速度。超級(jí)流水線又叫做深度流水線,它是提高超級(jí)流水線又叫做深度流水線,它是提高cpu速度通常采取的速度通常采取的一種技術(shù)。一種技術(shù)。CPU處置指令是經(jīng)過處置指令是經(jīng)過Clock來驅(qū)動(dòng)的,每個(gè)來驅(qū)動(dòng)的,每個(gè)clock完成一級(jí)流水線操作。每個(gè)周期所做的操作越少,完成一級(jí)流水線操作。每個(gè)周期所做的操作越少,那么需求的時(shí)間就越

28、短,時(shí)間越短,頻率就可以提得越高。那么需求的時(shí)間就越短,時(shí)間越短,頻率就可以提得越高。所以超級(jí)流水線就是將所以超級(jí)流水線就是將cpu處置指令的操作進(jìn)一步細(xì)分,處置指令的操作進(jìn)一步細(xì)分,添加流水線級(jí)數(shù)來提高頻率。頻率高了,當(dāng)流水線開足馬添加流水線級(jí)數(shù)來提高頻率。頻率高了,當(dāng)流水線開足馬力運(yùn)轉(zhuǎn)時(shí)平均每個(gè)周期完成一條指令單發(fā)射情況下,力運(yùn)轉(zhuǎn)時(shí)平均每個(gè)周期完成一條指令單發(fā)射情況下,這樣這樣cpu處置得速度就提高了。處置得速度就提高了。 2.6.3 VLIW2.6.3 VLIW的主要特點(diǎn)的主要特點(diǎn)1. 1. 采用顯式并行指令計(jì)算采用顯式并行指令計(jì)算(EPIC(EPIC:Explicitly Parall

29、el Explicitly Parallel Instruction Computing)Instruction Computing)方式。方式。在在VLIWVLIW處置機(jī)上運(yùn)轉(zhuǎn)的程序是一個(gè)二維指令矩陣,每一行上的處置機(jī)上運(yùn)轉(zhuǎn)的程序是一個(gè)二維指令矩陣,每一行上的一切操作組成一條超長指令,他們之間沒有數(shù)據(jù)相關(guān)、控一切操作組成一條超長指令,他們之間沒有數(shù)據(jù)相關(guān)、控制相關(guān)和功能部件沖突,這些指令可以在制相關(guān)和功能部件沖突,這些指令可以在VLIWVLIW處置機(jī)上同處置機(jī)上同時(shí)執(zhí)行時(shí)執(zhí)行超標(biāo)量處置機(jī)和超流水線處置機(jī)通常采用隱式并行指令方式。超標(biāo)量處置機(jī)和超流水線處置機(jī)通常采用隱式并行指令方式。程序是一維

30、線性的指令序列,每條指令中普通只包含一個(gè)程序是一維線性的指令序列,每條指令中普通只包含一個(gè)操作。操作。2.2.指令級(jí)并行度高指令級(jí)并行度高超標(biāo)量處置機(jī)和超流水線處置機(jī)的指令級(jí)并行度普通為超標(biāo)量處置機(jī)和超流水線處置機(jī)的指令級(jí)并行度普通為2 2左右,左右,通常不超越通常不超越4 4,目前多數(shù)目前多數(shù)VLIWVLIW處置機(jī)的指令級(jí)并行度在處置機(jī)的指令級(jí)并行度在4 4至至8 8之間,有的曾經(jīng)到之間,有的曾經(jīng)到達(dá)幾十。達(dá)幾十。由于在由于在VLIWVLIW中經(jīng)過并行編譯器來開發(fā)程序中的指令級(jí)并行性,中經(jīng)過并行編譯器來開發(fā)程序中的指令級(jí)并行性,可以在一個(gè)循環(huán)、一個(gè)函數(shù)、甚至整個(gè)程序中尋覓指令級(jí)可以在一個(gè)循環(huán)

31、、一個(gè)函數(shù)、甚至整個(gè)程序中尋覓指令級(jí)并行性,而且,可以采用軟件流水、循環(huán)展開等指令級(jí)并并行性,而且,可以采用軟件流水、循環(huán)展開等指令級(jí)并行度很高的方法充分開發(fā)程序中的多種并行性行度很高的方法充分開發(fā)程序中的多種并行性3. 3. 硬件構(gòu)造規(guī)整、簡單硬件構(gòu)造規(guī)整、簡單 VLIWVLIW處置機(jī)主要由很規(guī)那么的存放器、存儲(chǔ)器、運(yùn)算部件處置機(jī)主要由很規(guī)那么的存放器、存儲(chǔ)器、運(yùn)算部件和數(shù)據(jù)通路等組成,不規(guī)那么的控制器很簡單,而且,不和數(shù)據(jù)通路等組成,不規(guī)那么的控制器很簡單,而且,不需求復(fù)雜的指令并行調(diào)度窗口及多發(fā)射機(jī)制等。需求復(fù)雜的指令并行調(diào)度窗口及多發(fā)射機(jī)制等。4. 4. 編譯器的實(shí)現(xiàn)難度大編譯器的實(shí)現(xiàn)難度大 VLIWVLIW并行編譯器主要依托指令級(jí)并行算法、數(shù)據(jù)相關(guān)性分并行編譯器主要依托指令級(jí)并行算法、數(shù)據(jù)相關(guān)性分析算法、存放器分配算法及并行編譯技術(shù)等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論