




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、五 計算題 目 錄一、填空題1二、判斷題56三、名詞解釋74四、簡答題74五、計算題74五、計算題-1、試題序號:5812、題型:計算題3、難度級別:44、知識點:一、計算機體系結(jié)構(gòu)的基本概念5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:解釋執(zhí)行8、試題內(nèi)容:假設(shè)有一個計算機系統(tǒng)分為四級,每一級指令都比它下一級指令在功能上強M倍,即一條r+1級指令能夠完成M條r指令的工作,且一條r+1級指令需要N條r級指令解釋。對于一段在第一級執(zhí)行時間為K的程序,在第二、第三、第四級上的一段等效程序需要執(zhí)行多少時間?9、答案內(nèi)容:解:假設(shè)在第一級上用時間K執(zhí)行了該級IC條指令。1分對第二級而言,為了完成
2、IC條指令的功能,第二級指令的條數(shù)為:。為了執(zhí)行第二級條指令,需要執(zhí)行條第一級的指令對其進行解釋,所以對于第二級而言,等效程序的執(zhí)行時間是: 2分對于第三級而言,為了完成IC條指令的功能,第三級指令的條數(shù)為:。為了執(zhí)行第三級條指令,需要執(zhí)行條第二級的指令對其進行解釋。那么對第二級而言,總的指令條數(shù)為: 3分而第二級等效于第一級條指令,同時還需要條第一級指令進行解釋,所以第三級等效程序的執(zhí)行時間是: 3分按照同樣的逐層遞推關(guān)系,不難求得第四級等效程序的總的執(zhí)行時間為: 1分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5822、題型:計算題3、難度級別:34、知識點:1
3、.5 定量分析技術(shù)基礎(chǔ)5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:阿姆達爾定律8、試題內(nèi)容:已知某商用計算機擬增加字符串操作功能。 若用軟件實現(xiàn),與無字符串操作相比,速度提高4倍, CPU成本提高1/5倍;若用硬件實現(xiàn),則速度是原來的100倍,,CPU成本是原來的5倍。 由實驗測得,字符串操作占總運行時間的50%, CPU成本約占整機成本的1/3。你選用哪種設(shè)計方案?9、答案內(nèi)容:解:采用軟件方法時根據(jù)阿姆達爾定律,性能提高:=1.66 2分硬件成本提高到C=2/3 + 1/3* (1+1/5)=1.07 1分價格性能比為:C/S = 1.07/1.66 = 0.64 1分采用硬件方法
4、時: S=1/(1-50%)+50%/100=1.98 2分硬件成本提高到C=2/3 + 1/3* 5=2.33 1分價格性能比為:C/S = 2.33/1.98 = 1.18 1分如果僅考慮性能提高,則可選擇硬件方法,而考慮性能提高和成本因素,則應(yīng)選擇軟件方法。 2分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5832、題型:計算題3、難度級別:44、知識點:一、計算機體系結(jié)構(gòu)的基本概念5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:CPU性能公式8、試題內(nèi)容:假設(shè)我們考慮條件分支指令的兩種不同設(shè)計方法如下: (1) CPUA:通過比較指令設(shè)置條件碼,然后測試
5、條件碼進行分支。 (2) CPUB:在分支指令中包括比較過程在兩種CPU中,條件分支指令都占用2個時鐘周期而所有其它指令占用1個時鐘周期,對于CPUA,執(zhí)行的指令中分支指令占20%;由于每個分支指令之前都需要有比較指令,因此比較指令也占20%。由于CPUA在分支時不需要比較,因此假設(shè)它的時鐘周期時間比CPUB快1.25倍。哪一個CPU更快?如果CPUA的時鐘周期時間僅僅比CPUB快1.1倍,哪一個CPU更快呢?9、答案內(nèi)容:解:我們不考慮所有系統(tǒng)問題,所以可用CPU性能公式。占用2個時鐘周期的分支指令占總指令的20%,剩下的指令占用1個時鐘周期。所以 CPIA = 0.2 ´ 2 +
6、 0.80 ´ 1 = 1.2 1分則CPU性能為: 總CPU時間A = IC ´ 1.2 ´ 時鐘周期A 1分根據(jù)假設(shè),有: 時鐘周期B = 1.25 ´ 時鐘周期A 1分在CPUB中沒有獨立的比較指令,所以CPUB的程序量為CPUA的80%,分支指令的比例為: 20%/80% = 25% 2分這些分支指令占用2個時鐘周期,而剩下的75%的指令占用1個時鐘周期,因此: CPIB = 0.25 ´ 2 + 0.75 ´ 1 = 1.25 1分因為CPUB不執(zhí)行比較,故: ICB = 0.8 ´ ICA因此CPUB性能為: 總
7、CPU時間B = ICB ´ CPIB ´ 時鐘周期B = 0.8 ´ ICA ´ 1.25 ´ (1.25 ´ 時鐘周期A) = 1.25 ´ ICA ´ 時鐘周期A 2分在這些假設(shè)之下,盡管CPUB執(zhí)行指令條數(shù)較少,CPUA因為有著更短的時鐘周期,所以比CPUB快。如果CPUA的時鐘周期時間僅僅比CPUB快1.1倍,則 時鐘周期B = 1.10 ´ 時鐘周期ACPUB的性能為: 總CPU時間B = ICB ´ CPIB ´ 時鐘周期B = 0.8 ´ ICA ´
8、 1.25 ´ (1.10 ´ 時鐘周期A) = 1.10 ´ ICA ´ 時鐘周期A因此CPUB由于執(zhí)行更少指令條數(shù),比CPUA運行更快。 2分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5842、題型:計算題3、難度級別:24、知識點:一、計算機體系結(jié)構(gòu)的基本概念5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:CPU性能公式8、試題內(nèi)容:對于一臺400MHz計算機執(zhí)行標準測試程序,程序中指令類型,執(zhí)行數(shù)量和平均時鐘周期數(shù)如下:指令類型指令執(zhí)行數(shù)量平均時鐘周期數(shù)整數(shù)450001數(shù)據(jù)傳送750002浮點80004分支150
9、02求該計算機的有效CPI、MIPS和程序執(zhí)行時間。9、答案內(nèi)容:解: 1分 3分 3分 程序執(zhí)行時間=()400=575s 3分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5852、題型:計算題3、難度級別:24、知識點:一、計算機體系結(jié)構(gòu)的基本概念5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:CPI8、試題內(nèi)容:假定要在一個時鐘速率為40MHz的標量處理機上執(zhí)行20萬條目標代碼指令的程序,該程序中含有4種主要類型指令,每種指令類型所占的比例及CPI數(shù)如圖所示。要求計算:(1)在單處理機上執(zhí)行該程序的平均CPI.(2)根據(jù)(1)所得到的CPI值,計算相應(yīng)的M
10、IPS速率。指令類型CPI指令所占比例ALU160%LOAD/STORE指令(Cache命中時)418%Branch指令412%訪存指令(Cache 不合中時)810%9、答案內(nèi)容:解:=CPIi ICi/IC=1 0.6+4 0.18+4 0.12+8 0.1=2.24 5分階段 5分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5892、題型:計算題3、難度級別:34、知識點:三、流水線技術(shù)5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:1、假設(shè)一條指令的解釋分為取指、分析與執(zhí)行三個階段,每個階段所需時間為t取指、t分析、t執(zhí)行。(1)
11、寫出用下列幾種方式執(zhí)行100條指令所需的時間的通式:1)順序方式;2)僅"執(zhí)行k"、與"取指k+1"重疊;3)僅"執(zhí)行K"、"分析k+1"和"取指k+2"重疊。(2)當t取指=t分析=2,t執(zhí)行=3以及t取指=t分析=4,t執(zhí)行=2時,用上述通式計算所需時間。9、答案內(nèi)容:解:(1)以下是各方式執(zhí)行100條指令所需時間的通式:1)順序方式:100t=t取指i+t分析i+t執(zhí)行i i=1 =100t取指i+t分析i+t執(zhí)行i 2分2)“執(zhí)行i”與“取指k”重疊:100t=t取指1+ t分析i=1
12、100+maxt執(zhí)行i,t取指i +t執(zhí)行100 2分 i=23)僅“執(zhí)行k”、“分析K+1”與“取指K+2”重疊:t=t取指1+maxt分析1,t取指2100+maxt執(zhí)行i2,t分析i1,t取指ii=3+maxt分析100,t執(zhí)行99 2分+t執(zhí)行100(2)當T取指=T分析=2,T執(zhí)行=3時,用上述通式計算所需時間 3分1)T=100(2+2+3)=7002)T=2+2×100+3×99+3=5023)T=2+2+3×97+3+3=301當T取指=T執(zhí)行=4,T分析=2時,用上述通式計算所需時間為:1)T=100(4+2+4)=10002)T=4+2
13、5;100+4×99+4=6043)T=4+4+4×97+4+4=404 1分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5902、題型:計算題3、難度級別:34、知識點:三、流水線技術(shù)5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:一個流水線由四段組成,其中每當流經(jīng)第三段時,總要在該段循環(huán)一次才能流到第四段。如果每段經(jīng)過一次的時間都是t,問:當在流水線的輸入端每t時間輸入任務(wù)時,該流水線會發(fā)生什么情況?此流水線的實際吞吐率為多少?如果每2t輸入一個任務(wù),連續(xù)處理10個任務(wù)的實際吞吐率和效率是多少?當每段時間不變時,如
14、何提高該流水線的吞吐率?仍連續(xù)處理10個任務(wù) 時,其吞吐率提高多少?9、答案內(nèi)容:解:(1)會發(fā)生流水線阻塞情況。2分(2) 4分(3)重復設(shè)置部件 4分吞吐率提高倍數(shù)1.6410、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5912、題型:計算題3、難度級別:34、知識點:三、流水線技術(shù)5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:有一條流水線如下所示。求連續(xù)輸入10條指令,該流水線的實際吞吐率和效率;該流水線的瓶頸在哪一段?請采取三種不同的措施消除此“瓶頸”。對于你所給出的新流水線,計算連續(xù)輸入10條指令時,其實際吞吐率和效率。9、答案內(nèi)
15、容:解:(1) 3分(2)瓶頸在3、4段。l 變成八級流水線(細分) 3分l 變成兩級流水線(合并) 2分l 重復設(shè)置部件123-13-24-14-24-34-4 2分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。1、試題序號:5932、題型:計算題3、難度級別:34、知識點:三、流水線技術(shù)5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:一臺非流水處理器A的工作時鐘頻率為25MHz,它的平均CPI為4,處理器B是A的改進型,它有一條5段的線性指令流水線。由于鎖定電路延遲及時鐘扭斜效應(yīng),它的工作時鐘頻率僅為20MHz。問:(1)若在A和B兩個處理器上執(zhí)行含有
16、100條指令的程序,則處理器B對A的加速比為多少?(2)在執(zhí)行上述程序時,計算A、B處理器各自的MIPS速率為多少?9、答案內(nèi)容:解:(1)Ta=100*4/2.5E7=1.6E-5 秒 Tb=(5+100-1)×4/5)/2E7=4.16E-6 秒 Sp=Ta/tb=3.85 5分(2)MIPSa=100/1.6E-5=6.25MIPSMIPSb=100/4.16E-6=24.04MIPS 5分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5942、題型:計算題3、難度級別:34、知識點:三、流水線技術(shù)5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:流
17、水線技術(shù)8、試題內(nèi)容:一個由4段構(gòu)成的雙輸入端的流水浮點加法器,每一段的延遲為10ns,輸出可直接返回到輸入端或把結(jié)果暫存到相應(yīng)緩沖寄存器中?,F(xiàn)若要將10個浮點數(shù)相加,問最少需用多少時間,要求畫出相應(yīng)的流水線工作的時空圖。9、答案內(nèi)容:解:根據(jù)題意,畫出相應(yīng)流水線時空圖: 6分所需最少時間:Tmin=17*10ns=170ns 4分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5952、題型:計算題3、難度級別:44、知識點:三、流水線技術(shù)5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:8、試題內(nèi)容:若有一靜態(tài)多功能流水線分為6段,如圖所示,其中乘法流水線由1、2
18、、3、6段組成,加法流水線由1、4、5、6段組成,通過每段所需時間如圖所示。使用流水線時,要等某種功能(如加法)操作都處理完畢后才能轉(zhuǎn)換成另種功能(如乘法)。若要計算:A×B=(a1+b1)×(a2+b2)×(a3+b3),問:(1)在上述流水方式下,完成A×B需要多少時間?畫出時空圖并計算此流水線的使用效率和吞吐率。(2)與順序運算方式相比,加速比為多少?9、答案內(nèi)容:解:根據(jù)題意,畫出的時空圖為: 6分(1)T=26吞吐率:Tp=5/26效率:E=(2*17)/(26*6)=21.79% 3分(2)加速比:Sp=Tl/Tk=(6*3+8*2)/26=
19、1.31 1分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5962、題型:計算題3、難度級別:44、知識點:三、流水線技術(shù)5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:在如下圖所示的靜態(tài)流水線上計算,流水線的輸出可以直接返回輸入端或暫存于相應(yīng)于的流水線寄存器中,試計算其吞吐率,加速比,效率。9、答案內(nèi)容:解:該題解題步驟為:(1) 確定適合于流水處理的計算過程。(2) 畫時空圖(3) 計算性能 (1) 確定適合于流水處理的計算過程為:3分(2)根據(jù)所確定的計算過程,畫出時空圖 4分(3) 根據(jù)時空圖和流水線性能公式,計算性能 3分故:吞
20、吐率 TP7(20t) 加速比 S(34t)(20t)1.7效率 E(4×43×6)(8×20)0.2110、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5972、題型:計算題3、難度級別:34、知識點:三、流水線技術(shù)5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:假設(shè)各種分支所占指令數(shù)地百分比如下表所示:條件分支20(其中60是成功的)跳轉(zhuǎn)和調(diào)用5現(xiàn)有一深度為4地流水線(流水線有4段),無條件分支在第二個時鐘周期結(jié)束時就被解析出來,而條件分支要到第三個時鐘周期結(jié)束時才能被解析出來。第一個流水段是完全獨立于指令類型
21、的,即所有的指令都必須經(jīng)過第一個流水段的處理。請問在沒有任何結(jié)構(gòu)相關(guān)地情況下,該流水線相對于存在上述結(jié)構(gòu)相關(guān)情況下地加速比是多少?9、答案內(nèi)容:解:在不存在結(jié)構(gòu)相關(guān)時,每條指令的平均執(zhí)行時間是1個時鐘周期,而存在上述條件相關(guān)的情況下,并假設(shè)條件分支預測成功,那么無條件分支和成功的條件分支的等待時間都是1,而不成功地條件分支等待時間是2個周期;所以加速比就等于存在相關(guān)的每條指令的平均執(zhí)行時間和不存在相關(guān)的每條指令的執(zhí)行時間1的比值: 4分每條指令的平均等待時間: 4分所以: 2分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5982、題型:計算題3、難度級別:44、知識
22、點:3.5向量處理機5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:向量處理機8、試題內(nèi)容:CRAY-1機器上,按照鏈接方式執(zhí)行下述4條向量指令(括號中給出了相應(yīng)功能部件的時間),如果向量寄存器和功能部件之間數(shù)據(jù)傳輸需要1拍,試求此鏈接流水線的通過時間是多少拍?如果向量長度為64,則需要多少拍才能得到全部結(jié)果。V0存儲器(從存儲器中取數(shù):7拍)V2V0V1(向量加:3拍)V2V2 < A3(按(A3)左移:4拍)V5V3V4(向量邏輯乘:2拍)9、答案內(nèi)容:解:通過時間就是每條向量指令的第一個操作數(shù)執(zhí)行完畢需要的時間,也就是各功能流水線由空到滿的時間,具體過程如下圖所示。要得到全部結(jié)
23、果,在流水線充滿之后,向量中后繼操作數(shù)繼續(xù)以流水方式執(zhí)行,直到整組向量執(zhí)行完畢。 2分 6分2分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:5992、題型:計算題3、難度級別:44、知識點:3.5向量處理機5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:向量處理機8、試題內(nèi)容:向量處理機有16個向量寄存器,其中V0V5中分別存放有向量A、B、C、D、E、F,向量長度均為12,向量各元素均為浮點數(shù);處理部件采用兩個單功能流水線,加法功能部件時間為2拍,乘法功能部件時間為3拍。采用類似CRAY-1的鏈接技術(shù),先計算(AB)*C,在流水線不停留的情況下,接著計算(DE
24、)*F。(1) 求此鏈接流水線的通過時間為多少拍?(設(shè)寄存器入、出各需1拍)假如每拍時間為50ns,完成這些計算并把結(jié)果存進相應(yīng)寄存器,此處理部件地實際吞吐率為多少MFLOPS?9、答案內(nèi)容:解:(1)我們在這里假設(shè)AB的中間結(jié)果放在V6中,(AB)*C地最后結(jié)果放在V7中,DE地中間結(jié)果放在V8中,(DE)*F的最后結(jié)果放在V9中。具體實現(xiàn)參考下圖:通過時間應(yīng)該為前者(AB)*C)通過的時間:T通過= (1+2+1)+(1+3+1) =9(拍) 2分(2)在做完(AB)*C之后,作(CD)*E就不需要通過時間了。4分 4分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號
25、:6002、題型:計算題3、難度級別:34、知識點:四、指令級并行5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:指令調(diào)度8、試題內(nèi)容:對于下面的源代碼,轉(zhuǎn)換成DLX匯編語言,在不進行指令調(diào)度和進行指令調(diào)度兩種情況下,分析代碼一次循環(huán)的執(zhí)行時間。for (i=1; i<=1000; i+) xi=xi + s;假設(shè):x0 的內(nèi)存地址為 0 (為簡單起見),R1的初值為x1000的地址,F(xiàn)2中存放的值為常量s。DLX浮點流水線的延遲如下表:產(chǎn)生結(jié)果指令使用結(jié)果指令延遲時鐘周期數(shù)浮點計算另外的浮點計算3浮點計算浮點數(shù)據(jù)存操作(SD)2浮點數(shù)據(jù)取操作(LD)浮點計算1浮點數(shù)據(jù)取操作(LD)
26、浮點數(shù)據(jù)存操作(SD)09、答案內(nèi)容:解:不進行指令調(diào)度的情況下,根據(jù)表中所給浮點流水線中指令執(zhí)行的延遲,實際運行: (1)LOOP:LDF0,0(R1)(2)(空轉(zhuǎn))(3)ADDDF4,F0,F2(4)(空轉(zhuǎn))(5)(空轉(zhuǎn))(6)SD0(R1),F4(7)SUBIR1,R1,#8(8)(空轉(zhuǎn))(9)BNEZR1,LOOP(10)(空轉(zhuǎn))一共 10 個時鐘周期,其中有5個是空轉(zhuǎn)周期。 4分指令調(diào)度:(1)LOOP:LDF0,0(R1)(2)(空轉(zhuǎn))(3)ADDDF4,F0,F2(4)SUBIR1,R1,#8(5)BNEZR1,LOOP(6)SD8(R1),F4一共 6 個時鐘周期,其中有 1
27、個空轉(zhuǎn)周期。 4分經(jīng)過指令調(diào)度,一個元素的操作時間從10個時鐘周期減少到6個時鐘周期,其中5個周期是有指令執(zhí)行的,只剩下一個空轉(zhuǎn)周期。 2分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:6012、題型:計算題3、難度級別:44、知識點:5.2 Cache基本知識5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:Cache基本知識8、試題內(nèi)容:VAX-11/780在Cache命中時的指令平均執(zhí)行時間是8.5時鐘周期,Cache失效時間是6個時鐘周期,假設(shè)不命中率是11%,每條指令平均訪存3次。(1)試計算在考慮了Cache不命中時的指令平均間,它比Cache命中時平均
28、執(zhí)行時間延長百分之幾?(2)若CPU在Cache命中時的指令平均執(zhí)行時間是1.5時鐘周期,其他條件一樣,結(jié)果如何?從結(jié)果的比較可看出什么問題?9、答案內(nèi)容:解:(1)已知:Tie=8.5 Tm=6 1-Hc=0.11 在Cache命中時,每條指令的訪存時間是: Tca=3Tc=3 (Tc為平均訪問Cache時間,一般為1個時鐘周期) 2分而在考慮Cache不命中時,每條指令的訪存時間為:Tcb=3(0.89Tc+0.11×6)=2.67+1.98=4.65因指令執(zhí)行的其他時間相同,所以Ti=8.5-3+4.65=10.15(10.15-8.5)/8.5=0.194=19.4% 3分(
29、2)根據(jù)題意,Tie=1.5則當考慮Cache不命中時,每條指令的平均執(zhí)行時間為:Ti=1.5-3+4.65=3.15(3.15-1.5)/3.15=0.524=52.4% 3分由比較結(jié)果可以看出,在速度較高的系統(tǒng)中,Cache的命中率對指令的執(zhí)行速度有較大的影響,從而影響到整個系統(tǒng)的性能,因此,提高Cache的命中率,降低平均訪存時間,對提高系統(tǒng)的性能有著重要作用。 2分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:6022、題型:計算題3、難度級別:34、知識點:5.2 Cache基本知識5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:存儲層次8、試題內(nèi)容:有
30、一個"Cache-主存"存儲層次,主存共分8個塊(07),Cache分為4個塊(03),采用組相聯(lián)映象,組內(nèi)塊數(shù)為2塊,替換算法為近期最少使用法(LRU)。(1)畫出主存、Cache存儲器地址的各字段對應(yīng)關(guān)系;(2)對于如下主存塊地址流:1、2、4、1、3、7、0、1、2、5、4、6、4、7、2,如主存中內(nèi)空一開始未裝入Cache中,請列出隨時間變化Cache中各塊的使用情況。;(3)對于(2),指出塊失效又發(fā)生塊爭用時刻。(4)對于(23),求出此間的Cache命中率。9、答案內(nèi)容:解:(1)見下表: 3分nd區(qū)號q'組號s'塊號1位1位1位nmr(塊內(nèi)地
31、址)1位1位ncr(塊內(nèi)地址)qs (2)如下表: 3分訪問順序123456789101112131415地址塊號124137012546472Cache中塊分配情況111111111144444 - - 4444000555555 - 22227777776662 - - - - 33332222277操作狀態(tài)調(diào)進調(diào)進調(diào)進命中調(diào)進替換替換命中替換替換替換替換命中替換替換(3)在第14和15次訪問塊時產(chǎn)生塊失效又發(fā)生塊爭用現(xiàn)象。 2分(4)命中率:Hc=3/15=20% 2分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:6032、題型:計
32、算題3、難度級別:34、知識點:五、存儲層次5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:平均訪存時間8、試題內(nèi)容:假設(shè)Cache的命中時間為1個時鐘周期,失效開銷為50 個時鐘周期,在混合Cache中一次load或store操作訪問Cache的命中時間都要增加一個時鐘周期(因為混合Cache只有一個端口,無法同時滿足兩個請求,混合Cache會導致結(jié)構(gòu)沖突),根據(jù)下表所列的失效率,試問指令Cache和數(shù)據(jù)Cache容量均為16KB的分離Cache和容量為32KB的混合Cache相比,哪種Cache的失效率更低?又假設(shè)采用寫直達策略,且有一個寫緩沖器,并且忽略寫緩沖器引起的等待。請問上述兩
33、種情況下平均訪存時間各是多少?表1 指令Cache、數(shù)據(jù)Cache和混合Cache失效率的比較容 量指令 Cache數(shù)據(jù) Cache混合 Cache1 KB3.06%24.61%13.34%2 KB2.26%20.57%9.78%4 KB1.78%15.94%7.24%8 KB1.10%10.19%4.57%16 KB0.64%6.47%2.87%32 KB0.39%4.82%1.99%64 KB0.15%3.77%1.36%128 KB0.02%2.88%0.95%9、答案內(nèi)容:解: 如前所述,約75%的訪存為取指令。因此,分離Cache的總體失效率為: (75%×0.64%)(2
34、5%×6.47%)2.10% 2分 根據(jù)表1容量為32KB的混合Cache的失效率略低一些,只有1.99%。 1分平均訪存時間公式可以分為指令訪問和數(shù)據(jù)訪問兩部分:平均訪存時間指令所占的百分比× (指令命中時間指令失效率×失效開銷)數(shù)據(jù)所占的百分比× (數(shù)據(jù)命中時間數(shù)據(jù)失效率×失效開銷) 2分所以,兩種結(jié)構(gòu)的平均訪存時間分別為:平均訪存時間分離75%×(10.64%×50)25%×(16.47%×50) (75%×1.32)(25%×4.325)0.9901.0592.05 2分平均訪
35、存時間混合75%×(11.99%×50)25%×(111.99%×50) (75%×1.995)(25%×2.995)1.4960.7492.24 2分故,盡管分離Cache的實際失效率比混合Cache的高,但其平均訪存時間反而較低。 1分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:6042、題型:計算題3、難度級別:44、知識點:五、存儲層次5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:Cache失效開銷8、試題內(nèi)容:假設(shè)Cache失效開銷為50個時鐘周期,當不考慮存儲器停頓時,所有指令的執(zhí)行時間都
36、是2.0個時鐘周期, Cache的失效率為2%,平均每條指令訪存1.33次。試分析Cache對性能的影響。9、答案內(nèi)容:解:CPU 時間IC×(CPIexe存儲器停頓周期數(shù)/指令數(shù))×時鐘周期時間 2分考慮Cache的失效后,性能為:CPU 時間有cacheIC×(2.0(1.33×2%×50)×時鐘周期時間 IC×3.33×時鐘周期時間 4分實際CPI :3.333.33/2.0 = 1.67(倍) 2分CPU時間也增加為原來的1.67倍。但若不采用Cache,則: CPI2.0+50×1.3368.5
37、 2分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:6052、題型:計算題3、難度級別:44、知識點:五、存儲層次5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:CPU性能8、試題內(nèi)容:考慮兩種不同組織結(jié)構(gòu)的Cache:直接映象Cache和兩路組相聯(lián)Cache,試問它們對CPU的性能有何影響?先求平均訪存時間,然后再計算CPU性能。分析時請用以下假設(shè):理想Cache(命中率為100)情況下的CPI為2.0,時鐘周期為2ns,平均每條指令訪存1.3次。兩種Cache容量均為64KB,塊大小都是32字節(jié)。在兩路組相聯(lián)Cache中,我們必須增加一個多路選擇器,用于根據(jù)標
38、識匹配結(jié)果從相應(yīng)組的塊中選擇所需的數(shù)據(jù)。因為CPU的速度直接與Cache命中的速度緊密相關(guān),所以對于組相聯(lián)Cache,由于多路選擇器的存在而使CPU的時鐘周期增加到原來的1.10倍。這兩種結(jié)構(gòu)Cache的失效開銷都是70ns。在實際應(yīng)用中,應(yīng)取整為整數(shù)個時鐘周期。 命中時間為1個時鐘周期,64KB直接映象Cache的失效率為1.4%,相同容量的兩路組相聯(lián)Cache的失效率為1.0%。9、答案內(nèi)容:解:由:平均訪存時間命中時間失效率×失效開銷 1分 得:平均訪存時間1路2.0(0.014×70)2.98ns平均訪存時間2路2.0×1.10(0.010×70
39、)2.90ns 2分兩路級相聯(lián)Cache的平均訪存時間比較低。 1分由:CPU 時間IC×(CPIexe每條指令的平均存儲器停頓周期數(shù))×時鐘周期時間 IC ×(CPIexe×時鐘周期時間每條指令的平均存儲器停頓時間) 3分得:CPU時間1路IC×(2.0×2(1.3×0.014×70)5.27×ICCPU時間2路IC×(2.0×2×1.10(1.3×0.010×70)5.31×IC 2分相對性能比為:CPU時間2路/CPU時間1路=5.31
40、215;IC/5.27×IC=1.01 1分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:6062、題型:計算題3、難度級別:34、知識點:五、存儲層次5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:存儲器性能8、試題內(nèi)容:給定以下的假設(shè),試計算直接映象Cache和兩路組相聯(lián)Cache的平均訪問時間以及CPU的性能。由計算結(jié)果能得出什么結(jié)論?(1) 理想Cache情況下的CPI為2.0,時鐘周期為2ns,平均每條指令訪存1.2次;(2) 兩者Cache容量均為64KB,塊大小都是32字節(jié);(3) 組相聯(lián)Cache中的多路選擇器使CPU的時鐘周期增加了10
41、;(4) 這兩種Cache的失效開銷都是80ns;(5) 命中時間為1個時鐘周期;(6) 64KB直接映象Cache的失效率為1.4,64KB兩路組相聯(lián)Cache的失效率為10。9、答案內(nèi)容:解: 平均訪問時間命中時間失效率×失效開銷 1分平均訪問時間1-路=2.0+1.4% *80=3.12ns平均訪問時間2-路=2.0*(1+10%)+1.0% *80=3.0ns兩路組相聯(lián)的平均訪問時間比較低。 3分CPUtime=(CPU執(zhí)行+存儲等待周期)*時鐘周期CPU time=IC(CPI執(zhí)行+總失效次數(shù)/指令總數(shù)*失效開銷) *時鐘周期=IC(CPI執(zhí)行*時鐘周期)+(每條指令的訪存
42、次數(shù)*失效率*失效開銷*時鐘周期) 2分CPU time 1-way=IC(2.0*2+1.2*0.014*80)5.344ICCPU time 2-way=IC(2.2*2+1.2*0.01*80)5.36IC 2分相對性能比:5.36/5.344=1.003 1分直接映象cache的訪問速度比兩路組相聯(lián)cache要快1.04倍,而兩路組相聯(lián)Cache的平均性能比直接映象cache要高1.003倍。因此這里選擇兩路組相聯(lián)。 1分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:6072、題型:計算題3、難度級別:34、知識點:五、存儲層次5、分值:106、所需時間:15
43、分鐘7、試題關(guān)鍵字:cache性能8、試題內(nèi)容:假設(shè)一臺計算機具有以下特性:(1) 95的訪存在Cache中命中;(2) 塊大小為兩個字,且失效時整個塊被調(diào)入;(3) CPU發(fā)出訪存請求的速率為109字/秒;(4) 25的訪存為寫訪問;(5) 存儲器的最大流量為109字/秒(包括讀和寫);(6) 主存每次只能讀或?qū)懸粋€字;(7) 在任何時候,Cache中 有30的塊被修改過;(8) 寫失效時,Cache采用寫分配法?,F(xiàn)欲給計算機增添一臺外設(shè),為此想先知道主存的頻帶已經(jīng)使用了多少。試對于以下兩種情況計算主存頻帶的平均使用比例。(1) 寫直達Cache;(2) 寫回法Cache。9、答案內(nèi)容:解:
44、采用按寫分配(1)寫直達cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,更新cache和主存,訪問主存一次。訪問失效,有兩種情況:讀失效,將主存中的塊調(diào)入cache中,訪問主存兩次;寫失效,將要寫的塊調(diào)入cache,訪問主存兩次,再將修改的數(shù)據(jù)寫入cache和主存,訪問主存一次,共三次。上述分析如下表所示。3分訪問命中訪問類型頻 率訪存次數(shù)Y讀95%*75%=71.3%0Y寫95%*25%=23.8%1N讀5%*75%=3.8%2N寫5%*25%=1.3%3一次訪存請求最后真正的平均訪存次數(shù)=(71.3%*0)+(23.8%*1)+(3.8%*2)+(1.3%*3)0.35已用帶寬
45、=0.35×109/10 9 =35.0% 2分(2)寫回法cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,不訪問主存。采用寫回法,只有當修改的cache塊被換出時,才寫入主存;訪問失效,有一個塊將被換出,這也有兩種情況:如果被替換的塊沒有修改過,將主存中的塊調(diào)入cache塊中,訪問主存兩次;如果被替換的塊修改過,則首先將修改的塊寫入主存,需要訪問主存兩次;然后將主存中的塊調(diào)入cache塊中,需要訪問主存兩次,共四次訪問主存。3分訪問命中塊為臟頻 率訪存次數(shù)YN95%*70%=66.5%0YY95%*30%=28.5%0NN5%*70%=3.5%2NY5%*30%=1.5
46、%4所以:一次訪存請求最后真正的平均訪存次數(shù)=66.5*028.5%*0+3.5%*2+1.5%*4=0.13已用帶寬0.13×10 9/10 913% 2分10、評分細則:10分/小題,評分細則分布在答案內(nèi)容中。-1、試題序號:6082、題型:計算題3、難度級別:34、知識點:五、存儲層次5、分值:106、所需時間:15分鐘7、試題關(guān)鍵字:cache性能8、試題內(nèi)容:偽相聯(lián)中,假設(shè)在直接映象位置沒有發(fā)現(xiàn)匹配,而在另一個位置才找到數(shù)據(jù)(偽命中)時,需要1個額外的周期,而且不交換兩個Cache中的數(shù)據(jù),失效開銷為50個時鐘周期。試求:(1) 推導出平均訪存的時間公式。(2) 利用(1)
47、中得到的公式,對于2KBCache和128KBCache,重新計算偽相聯(lián)的平均訪存時間。請問哪一種偽相聯(lián)更快?假設(shè) 2KB直接映象Cache的總失效率為0.098,2路相聯(lián)的總失效率為0.076;128KB直接映象Cache的總失效率為0.010,2路相聯(lián)的總失效率為0.007。9、答案內(nèi)容:解:不管作了何種改進,失效開銷相同。不管是否交換內(nèi)容,在同一“偽相聯(lián)”組中的兩塊都是用同一個索引得到的,因此失效率相同,即:失效率偽相聯(lián)失效率2路。1分偽相聯(lián)cache的命中時間等于直接映象cache的命中時間加上偽相聯(lián)查找過程中的命中時間*該命中所需的額外開銷。命中時間偽相聯(lián)命中時間1路偽命中率偽相聯(lián)×1 2分交換或不交換內(nèi)容,偽相聯(lián)的命中率都是由于在第一次失效時,將地址取反,再在第二次查找?guī)淼摹R虼?偽命中率偽相聯(lián)命中率2路命中率1路(1失效率2路)(1失效率1路)失效率1路失效率2路。交換內(nèi)容需要增加偽相聯(lián)的額外開銷。2分平均訪存時間偽相聯(lián)命中時間1路(失效率1路失效率2路)×1失效率2路×失效開銷1路 2分將題設(shè)中的數(shù)據(jù)帶入計算,得到:平均訪存時間2Kb=1+(0.098-0.076)*1+(0.076 *50 ) =4.822平均訪存時間128Kb=1+(0.010-0.007)*1+(0.007 *50 ) =1.353 2分顯然是128
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡(luò)攻擊防御及響應(yīng)方案
- 電力設(shè)備及安裝工程承包合同協(xié)議
- 環(huán)境評估與治理專業(yè)證明書(8篇)
- 文化旅游推廣項目合作協(xié)議
- 人工智能技術(shù)合作開發(fā)項目合同
- 農(nóng)產(chǎn)品銷售與供應(yīng)鏈優(yōu)化合作協(xié)議
- 詳盡的社會保險繳納及工作證明(7篇)
- 技術(shù)服務(wù)合作合同書
- 2025汽車融資租賃合同模板
- 2025閑置土地承包合同模板
- 2025江蘇中考:物理高頻考點
- 餐飲抽成合同協(xié)議書
- 2025年江西省安福縣事業(yè)單位公開招聘輔警36名筆試題帶答案
- 大神心理測試題及答案
- 2025初級《銀行業(yè)法律法規(guī)與綜合能力》高分必會試題庫1000題-單選500題
- 低值易耗品試題及答案
- 2025春季學期國開河南電大本科《行政管理理論與實踐專題講座》一平臺無紙化考試(作業(yè)練習+我要考試)試題及答案
- 2025年新高考地區(qū)數(shù)學名校地市選填壓軸題好題匯編(八)(解析版)
- 全球汽車產(chǎn)業(yè)發(fā)展現(xiàn)狀與趨勢
- 機械制造質(zhì)量整改報告范文
- 2025貴州畢節(jié)市七星關(guān)區(qū)招聘城市社區(qū)工作者186人筆試備考題庫及答案解析
評論
0/150
提交評論