計算機(jī)系統(tǒng)結(jié)構(gòu)復(fù)習(xí)重點+課后習(xí)題解答(顧一禾)_第1頁
計算機(jī)系統(tǒng)結(jié)構(gòu)復(fù)習(xí)重點+課后習(xí)題解答(顧一禾)_第2頁
計算機(jī)系統(tǒng)結(jié)構(gòu)復(fù)習(xí)重點+課后習(xí)題解答(顧一禾)_第3頁
計算機(jī)系統(tǒng)結(jié)構(gòu)復(fù)習(xí)重點+課后習(xí)題解答(顧一禾)_第4頁
計算機(jī)系統(tǒng)結(jié)構(gòu)復(fù)習(xí)重點+課后習(xí)題解答(顧一禾)_第5頁
已閱讀5頁,還剩12頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、總 復(fù) 習(xí)第一章1. 計算機(jī)系統(tǒng)結(jié)構(gòu)、組成、實現(xiàn)的基本概念和包含的內(nèi)容;系統(tǒng)結(jié)構(gòu)與軟硬件功能劃分的關(guān)系;計算機(jī)系統(tǒng)的多級層次結(jié)構(gòu);判斷某項內(nèi)容屬于結(jié)構(gòu)、組成、實現(xiàn)的哪一類;判斷某項內(nèi)容針對不同程序員的透明性。 2. 促進(jìn)系統(tǒng)結(jié)構(gòu)發(fā)展的因素(軟件、應(yīng)用、器件)。軟件:實現(xiàn)軟件可移植性的方法;系列機(jī)的概念;軟件兼容的概念(向前、向后、向上、向下兼容);模擬與仿真技術(shù)的概念;應(yīng)用:應(yīng)用對系統(tǒng)結(jié)構(gòu)的要求。器件:系統(tǒng)結(jié)構(gòu)下移的概念。3. 計算機(jī)系統(tǒng)的分型與分類的概念。Flynn分類法4. 系統(tǒng)結(jié)構(gòu)設(shè)計的定量原理(Amdahl定理);加速比的計算方法;5. 程序訪問的局部性原理(時間局部性、空間局部性);

2、判斷系統(tǒng)結(jié)構(gòu)中局部性原理的應(yīng)用。6. 系統(tǒng)評價的指標(biāo)(響應(yīng)時間、CPU時間、MIPS、MFLOPS);運用CPU性能公式、平均CPI比較系統(tǒng)性能。7. 并行性的概念;并行性的等級、粒度;并行性的開發(fā)策略(時間重疊、資源重復(fù)、資源共享);8. 計算機(jī)系統(tǒng)的主要設(shè)計方法部分習(xí)題參考答案:1.6 解:(1)CPI (4500017500028000415002) / 1.776(2)MIPS速率f/ CPI 400/1.776 225.225MIPS(3)程序執(zhí)行時間= (4500017500028000415002)400106=5.75104s=0.575ms=575s1.8 解:(1)在多個部

3、件可改進(jìn)情況下,Amdahl定理的擴(kuò)展:已知re130,re220,re310,Sp10,fe10.3,fe20.3,得:得fe30.36,即部件3的可改進(jìn)比例為36%。(2)設(shè)系統(tǒng)改進(jìn)前的執(zhí)行時間為T,則3個部件改進(jìn)前的執(zhí)行時間為:(0.3+0.3+0.2)T = 0.8T,不可改進(jìn)部分的執(zhí)行時間為0.2T。已知3個部件改進(jìn)后的加速比分別為S130,S220,S310,因此3個部件改進(jìn)后的執(zhí)行時間為: 改進(jìn)后整個系統(tǒng)的執(zhí)行時間為:Tn = 0.045T+0.2T = 0.245T那么系統(tǒng)中不可改進(jìn)部分的執(zhí)行時間在總執(zhí)行時間中占的比例是:=82%1.9 解:(1)改進(jìn)后,各類操作的加速比re分

4、別是:操作類型各類操作的加速比re操作12/12操作220/151.33操作310/33.33操作44/14(2) 改進(jìn)前系統(tǒng)總執(zhí)行時間:102+3020+3510+1541030 改進(jìn)前各類操作時間在所有操作時間中所占的比例fe:操作類型改進(jìn)前各類操作的執(zhí)行時間在總的執(zhí)行時間中所占的比例操作1102/10300.01941.94%操作23020/10300.582558.3%操作33510/10300.339834%操作4154/10300.05835.83%根據(jù)Amdahl定律可得各類操作單獨改進(jìn)后,程序獲得的加速比分別是:操作類型改進(jìn)前各類操作的執(zhí)行時間在總的執(zhí)行時間中所占的比例各類操作

5、單獨改進(jìn)后,程序獲得的加速比操作11.94%1.01操作258.3%1.17操作334%1.31操作45.83%1.05(3)在多個部件可改進(jìn)情況下,Amdahl定理的擴(kuò)展:4類操作均改進(jìn)后,整個程序的加速比是:1/(1.94%/2+58.3%/1.33+34%/3.33+5.83%/4)1.78補(bǔ)充題1. 確定下列內(nèi)容各屬于哪方面的問題。(1)機(jī)器字長為32位。 A. B. C. (2)存儲器最大容量為64MB。 A. B. C. (3)存儲器采用31路交叉存儲方式。 A. B. C. (4)采用4M4位的DRAM存儲器芯片,組裝在一塊印刷電路板。 A. B. C. (5)存儲器字長為32位

6、,邏輯地址空間為4GB。 A. B. C.(6)主存儲器的存儲周期設(shè)計為200ns。 A. B. C. 答案中的符號的含義:A: 系統(tǒng)結(jié)構(gòu) B: 計算機(jī)組成 C: 計算機(jī)實現(xiàn) 答: AABCAB2. 判斷下列哪些內(nèi)容對機(jī)器語言(含匯編語言)程序員是透明的。1)指令寄存器 2)程序計數(shù)器3)數(shù)據(jù)通路的寬度 4)浮點數(shù)據(jù)表示5)行波進(jìn)位加法器 6)Cache7)控制存儲器 8)中斷屏蔽觸發(fā)器9)通用寄存器 10)硬盤11)只讀存儲器使用EPROM芯片 12)微地址寄存器答: 1、3、5、6、7、11、12第二章1. 指令系統(tǒng)的設(shè)計要求(完備性、有效性、兼容性、規(guī)整性、對稱性、可擴(kuò)充性、正交性、有利

7、于編譯)。2. 指令系統(tǒng)的分類(堆棧型、累加器型、通用寄存器型);通用寄存器型指令的特點(RR型、RM型、MM型)。3. 操作數(shù)訪問方式(按地址訪問、按內(nèi)容訪問);按地址訪問的編址問題:字編址、字節(jié)編址、位編址;按字節(jié)編址時的大端排序與小端排序。編址規(guī)定中的訪存越界問題及其解決方法。按內(nèi)容訪問:聯(lián)想存儲器的工作過程。4. 指令格式的設(shè)計準(zhǔn)則;操作碼的優(yōu)化方法(霍夫曼編碼、擴(kuò)展霍夫曼編碼)。5. 指令系統(tǒng)的兩種設(shè)計風(fēng)格CISC和RISC。CISC風(fēng)格的特點;RISC風(fēng)格的特點。RISC風(fēng)格指令系統(tǒng)的實現(xiàn)技術(shù):窗口寄存器重疊技術(shù)、優(yōu)化轉(zhuǎn)移技術(shù)。6. 數(shù)據(jù)類型、數(shù)據(jù)表示、數(shù)據(jù)結(jié)構(gòu)的概念和關(guān)系;引入數(shù)

8、據(jù)表示的原則(減少程序執(zhí)行時間和存儲容量、較好的通用性和較高的效率);數(shù)據(jù)表示與系統(tǒng)結(jié)構(gòu)的關(guān)系。7. 向量數(shù)據(jù)表示的形式;采用向量數(shù)據(jù)表示時,向量指令中應(yīng)給出的內(nèi)容。8. 自定義數(shù)據(jù)表示:帶標(biāo)志符數(shù)據(jù)表示、數(shù)據(jù)描述符表示。部分習(xí)題參考答案:補(bǔ)充題一、 某模型機(jī)的9條指令在程序中的使用頻度經(jīng)統(tǒng)計如下表所示。指令I(lǐng)i使用頻度piADD43%SUB13%JMP7%JOM6%STO5%SHR1%CIL2%CLA22%STP1%寫出這9條指令操作碼的Huffman編碼、3-4擴(kuò)展編碼、2-7擴(kuò)展編碼,并計算這3種編碼的平均碼長。答:兩種Huffman編碼方案指令I(lǐng)i使用頻度piHuffman編碼1Huf

9、fman編碼234編碼27編碼ADD43%0000000CLA22%1010000101SUB13%11010101010JMP7%1110011000110JOM6%1110111010111STO5%1111011101000CIL2%111101001SHR1%1010STP1%1110平均碼長2.422.423.223.1Huffman編碼1的平均碼長:H0.4310.2220.133(0.070.060.05)50.026(0.010.01)72.42Huffman編碼2的平均碼長:H0.431(0.220.13)3(0.070.060.05)40.025(0.010.01)62.4

10、234編碼的平均碼長:H(0.430.220.13)3(0.070.060.050.020.010.01)43.2227編碼的平均碼長:H(0.430.220.13)2(0.070.060.050.020.010.01)73.1二、某處理機(jī)的指令系統(tǒng)的指令字長為12位,每個地址碼的長度為3位,現(xiàn)要求該指令系統(tǒng)中有:三地址指令4條、單地址指令255條、零地址指令16條。問能否用擴(kuò)展編碼的方式為其操作碼編碼?如果要求單地址指令為254條,能否對其操作碼用擴(kuò)展編碼?說明理由。答:三地址指令格式:3位3位3位3位操作碼地址碼1地址碼2地址碼3(1)3位操作碼,可以表示8條三地址指令,現(xiàn)只需4條,剩余4

11、個碼點。設(shè)沒有二地址指令,則單地址指令可以使用6位地址碼作為擴(kuò)展操作碼,共可有464256條指令,但要求有16條零地址指令,需要單地址指令留出2個碼點,2562254,不能滿足單地址指令的需要,所以不能用擴(kuò)展編碼的方式為該方案的操作碼編碼。(2)如果要求單地址指令為254條,則可以滿足單地址指令的需要,可以用擴(kuò)展編碼的方式為該方案的操作碼編碼。三、設(shè)需要計算X(a+b)(c+d)/(f-g),其中a、b、c、d、f、g均事先存放在存儲器中,X為存放結(jié)果的存儲器單元。請用堆棧型、累加器型、寄存器寄存器型指令編寫完成同樣功能的匯編語言程序。設(shè)寄存器寄存器型指令為二地址指令,指令格式中第一操作數(shù)為目

12、的操作數(shù),第二操作數(shù)為源操作數(shù),指令的操作碼占一字節(jié)(包含指令中使用的寄存器),存儲器地址占二字節(jié),操作數(shù)占四字節(jié)。請根據(jù)所編寫的匯編語言程序回答下列問題: 計算三種指令代碼序列從存儲器取指所需的總字節(jié)數(shù)。 計算三種指令代碼序列取數(shù)或存數(shù)所需的總字節(jié)數(shù)。 比較三種結(jié)構(gòu)所需的指令字節(jié)數(shù)和需傳送的總字節(jié)數(shù)。說明:減法為目的操作數(shù)減去源操作數(shù)、除法為目的操作數(shù)除以源操作數(shù)。答:(1)堆棧型指令取指字節(jié)數(shù)取/存數(shù)字節(jié)數(shù)PUSH a 38PUSH b38ADD ;(a+b)112PUSH c38PUSH d38ADD ;(c+d) 112MUL ;(a+b)(c+d)112PUSH f38PUSH g3

13、8SUB ;(f-g)112DIV ;(a+b)(c+d) /(f-g)112POP X ;X(a+b)(c+d)/(f-g)38總字節(jié)數(shù)26116(2)累加器型 指令取指字節(jié)數(shù)取/存數(shù)字節(jié)數(shù)LOAD a34ADD b34STORE h ; hab34LOAD c34ADD d ; cd34MUL h ;(a+b)(c+d)34STORE h ; h(a+b)(c+d)34LOAD f34SUB g ;f-g34STORE i ; if-g34LOAD h ;讀被除數(shù)h34DIV i ;(a+b)(c+d)/(f-g)34STORE X ; X(a+b)(c+d)/(f-g)34總字節(jié)數(shù)395

14、2(3)寄存器寄存器型X(a+b)(c+d)/(f-g)指令取指字節(jié)數(shù)取/存數(shù)字節(jié)數(shù)LOAD R1 ,a34LOAD R2,b34ADD R1 ,R2 ;R1a +b10LOAD R2 ,c34LOAD R3,d34ADD R2 ,R3 ;R2c +d10MUL R1 ,R2 ;R1(a+b)(c+d)10LOAD R2 ,f34LOAD R3,g34SUB R2 ,R3 ;R2f-g10DIV R1 ,R2 ;R1(a+b)(c+d) /(f-g)10STORE X,R1 ;X(a+b)(c+d)/(f-g)34總字節(jié)數(shù)2628指令條數(shù)取指字節(jié)數(shù)取數(shù)/存數(shù)字節(jié)數(shù)需傳送總字節(jié)數(shù)堆棧型12261

15、16142累加器型13395291寄存器寄存器型12262854第三章1. 標(biāo)量流水的基本概念和分類;先行控制的概念。會計算采用順序方式和不同的重疊方式執(zhí)行指令時的指令執(zhí)行時間。2. 利用時空圖進(jìn)行標(biāo)量流水線的性能分析(吞吐率、加速比、效率)3. 非線性流水線的調(diào)度方法(基本調(diào)度方法和優(yōu)化調(diào)度方法)。4. 掌握流水線操作中全局相關(guān)(轉(zhuǎn)移指令引起的相關(guān))和局部相關(guān)(數(shù)據(jù)讀寫引起的相關(guān))問題的解決方法。幾種解決全局相關(guān)的預(yù)測算法的原理及實現(xiàn)。5. 向量流水線的特點。向量處理方式(橫向、縱向、縱橫向加工)。6. 增強(qiáng)向量處理性能的方法(并行處理技術(shù)、鏈接技術(shù))的應(yīng)用及向量程序的時間計算。7. 向量編

16、隊的方法,根據(jù)向量編隊計算性能參數(shù)的方法。8. 向量訪問步長,解決向量機(jī)的訪存沖突的方法。9. 向量處理性能的評估參數(shù)(Tvp、 R、n1/2、nv等)的定義。部分習(xí)題參考答案:3.9 解:for (i=2; i100; i=i+1)ai=bi+ai;/* s1 */ci+1=ai+di; /* s2 */ai-1=2*bi; /* s3 */bi+1=2*bi ;/* s4 */(1)在一次循環(huán)中存在的相關(guān): 真數(shù)據(jù)相關(guān):S1&S2:ai ai = bi + ai與ci+1 = ai + di 先寫后讀沒有輸出相關(guān)和反相關(guān)(2)展開循環(huán)后,可發(fā)現(xiàn)由于循環(huán)存在的相關(guān):展開循環(huán)兩次:ai = b

17、i + ai; /* s1 */ci+1 = ai + di; /* s2 */ai-1 = 2 * bi; /* s3 */bi+1 = 2 * bi; /* s4 */ai+1 = bi+1 + ai+1; /* s1*/ci+2 = ai+1 + di+1; /* s2*/ai = 2 * bi+1; /* s3*/bi+2 = 2 * bi+1; /* s4*/存在的相關(guān):真數(shù)據(jù)相關(guān)(先寫后讀):S1&S2:ai: ai = bi + ai 與 ci+1 = ai + di S1&S2:ai: ai = bi + ai 與 ci+1 = ai + di S4& S1: bi+1;bi+

18、1 = 2 * bi 與 ai+1 = bi+1 + ai+1 S4& S3: bi+1:bi+1 = 2 * bi 與 ai = 2 * bi+1 S4&S4: bi+1;bi+1 = 2 * bi 與 bi+2 = 2 * bi+1 反相關(guān)(先讀后寫):S1&S3:ai: ai = bi + ai 與ai = 2 * bi+1 S2&S3:ai:ci+1 = ai + di 與ai = 2 * bi+1輸出相關(guān)(先寫后寫):S1&S3: ai: ai = bi + ai 與ai = 2 * bi+1 3.14 解:適合于流水線工作的算法:先計算A1B1、A2B2、A3B3和A4B4;再計算

19、(A1B1)(A2B2)和(A3B3)(A4B4);最后求總的結(jié)果。完成該計算的時空圖,圖中陰影部分表示該段在工作。由圖可見,完成7個運算用了18個t,吞吐率為: 如果不用流水線,由于一次求積需3t,一次求和需5t,則產(chǎn)生上述7個結(jié)果共需(45+33)t =29t。所以加速比為: 該流水線的效率可由陰影區(qū)的面積和5個段總時空區(qū)的面積的比值求得: 3.17解:沒有控制相關(guān)時,流水線的平均CPI1存在控制相關(guān)時:無條件分支在第二個時鐘周期結(jié)束時就被解析出來,需要插入1個額外的stall;條件分支要到第3個時鐘周期結(jié)束時才能被解析出來,需要插入2個額外的stall。根據(jù)采用減少分支延遲的方法不同,所

20、得的加速比不同。(1)采用排空流水線的策略時,對無條件分支,有1個額外的stall;對于條件分支,有2個額外的stall:CPIA = 1+20%2+5%1 = 1.45 加速比S=CPIA/1 = 1.45(2)采用預(yù)測分支成功策略時,對無條件分支和成功的條件分支,有1個額外的stall,對于失敗的條件分支,有2個額外的stall(需作廢預(yù)取的成功分支指令):CPIA = 1+20%(60%1+40%2) +5%1 = 1.33 加速比S= CPIA /1 = 1.33(3)采用預(yù)測分支失敗策略時,對無條件分支,有1個額外的stall,對于成功的條件分支,有2個額外的stall,(需作廢預(yù)取

21、的失敗分支指令);對失敗的條件分支,由于預(yù)測失敗分支,因此分支指令相當(dāng)于一條普通指令,其目標(biāo)地址已經(jīng)由PC給出,流水線正常流動,不必等待,所以不需要延遲:CPIA = 1+20%(60%2 + 40%0) +5%1 = 1.29 加速比S= CPIA /1 = 1.29補(bǔ)充題已知有一個5段的流水線,其預(yù)約表如下: 時間功能段T1T2T3T4T5T6T7S1S2S3S4S51、試列出流水線的禁止表及原始沖突向量,畫出流水線的狀態(tài)圖,并選擇最佳的無沖突調(diào)度方案。2、按所選擇的調(diào)度方案,連續(xù)輸入6個任務(wù),畫出流水線的時空圖并求出流水線的最大吞吐率、實際吞吐率、加速比和效率。答:1、 禁止表 F1,3

22、,6,原始沖突向量 C()流水線狀態(tài)圖調(diào)度方案平均延遲時間2,53.52,2,534,54.54455最佳的無沖突調(diào)度方案為 2,2,5,2、 S5112233445566S4121323454656S3112233445566S2121323454656S11231243564561234567891011121314151617181920設(shè)每個功能段的時間為t流水線的最大吞吐率 Tpmax1/3t流水線的實際吞吐率 Tp6/20t0.3/t流水線的加速比:Sp67t/20t2. 1流水線的效率:E610/5*203/50.6=60%3.19 解:(1)設(shè)AB的中間結(jié)果放在V6中,(AB)

23、C的最后結(jié)果放在V7中,DE的中間結(jié)果放在V8中,(DE)F的最后結(jié)果放在V9中。具體實現(xiàn)參考下圖:通過時間應(yīng)該為前者(AB)C)通過的時間:T通過= (1+2+1)+(1+3+1) =9(拍)(2)在做完(AB)C之后,作(CD)E就不需要通過時間了。V6AB V7V6C V8DE V9V8F第四章1. 指令級并行的基本概念。2. 開發(fā)指令級并行常用的方法3. 超標(biāo)量、超流水、超長指令字的概念。4. 超長指令字的實現(xiàn)5. 循環(huán)展開和指令調(diào)度的基本方法部分習(xí)題參考答案:4.3分析:產(chǎn)生結(jié)果指令使用結(jié)果指令延遲時鐘周期數(shù)浮點計算另外的浮點計算3浮點計算浮點數(shù)據(jù)存操作(SD)2浮點數(shù)據(jù)取操作(LD

24、)浮點計算1浮點數(shù)據(jù)取操作(LD)浮點數(shù)據(jù)存操作(SD)0指令在流水線中執(zhí)行時需要的延遲:LOOP:L.DF0,0(R1) (空轉(zhuǎn))MUL.DF0,F0,F2L.DF4,0(R2)(空轉(zhuǎn))(空轉(zhuǎn))ADD.DF0,F0,F4(空轉(zhuǎn))(空轉(zhuǎn))S.DF0,0(R2)DSUBIR1,R1,#8DSUBIR2,R2,#8BNEZR1,LOOP(空轉(zhuǎn))解:將循環(huán)展開兩次,進(jìn)行指令調(diào)度,即可以消除延遲,其中增加寄存器F10、F14,對應(yīng)一次循環(huán)中的F0和F4.代碼如下:LOOP: L.D F0,0(R1)L.D F10,-8(R1)MUL.D F0,F(xiàn)0,F(xiàn)2MUL.D F10,F(xiàn)10,F(xiàn)2L.D F4,0

25、(R2)L.DF14,-8(R2)ADD.D F0,F(xiàn)0,F(xiàn)4ADD.DF10,F(xiàn)10,F(xiàn)14DSUBI R1,R1,#16S.D F0,0(R2)DSUBI R2,R2,#16BNEZ R1,LOOPS.D F10,8(R2)4.9 解:標(biāo)量流水處理機(jī)的時空圖:執(zhí)行完12條指令需T114t。超標(biāo)量流水處理機(jī)與超長指令字處理機(jī)的時空圖:超標(biāo)量流水處理機(jī)中,每一個時鐘周期同時啟動4條指令。執(zhí)行完12條指令需T25t,相對于標(biāo)量流水處理機(jī)的加速比為:超長指令字處理機(jī)中,每4條指令組成一條長指令,共形成3條長指令。執(zhí)行完12條指令需T35t,相對于標(biāo)量流水處理機(jī)的加速比為:超流水處理機(jī)的時空圖:超流

26、水處理機(jī)中,每1/4個時鐘周期啟動一條指令。執(zhí)行完12條指令需T45.75t,相對于標(biāo)量流水處理機(jī)的加速比為:補(bǔ)充題設(shè)系統(tǒng)中有多個加法器,不存在加法器的資源沖突,有3條連續(xù)指令構(gòu)成的程序代碼段: ADD R1,R2,R4 ADD R2,R1,1 SUB R1,R4,R5請回答:(1) 分析代碼段中的存在的數(shù)據(jù)相關(guān);(2) 采用何種硬件技術(shù)可以解決這些數(shù)據(jù)相關(guān)?要求加以說明。答:I1 ADD R1,R2,R4I2 ADD R2,R1,1I3 SUB R1,R4,R5真數(shù)據(jù)相關(guān)RAW:I1與I2(R1) 先寫后讀名相關(guān)WAW:I1與I3(R1) 先寫后寫 反相關(guān)WAR:I1與I2(R2);I2與I

27、3(R1) 先讀后寫解決方法:(1)I1與I2關(guān)于R1的RAW相關(guān),可以用定向技術(shù)解決。(2)I1與I3關(guān)于R1的WAW相關(guān),I1與I2(R2);I2與I3(R1)的WAR,可以用寄存器換名技術(shù)解決。將R2,R1換名為R2,R1.解決結(jié)果:I1 ADD R1,R2,R4I2 ADD R2,R1,1I3 SUB R1,R4,R5第五章1. 存儲器層次結(jié)構(gòu)的概念;采用存儲器層次結(jié)構(gòu)的目的;程序局部性在存儲器層次結(jié)構(gòu)中的應(yīng)用。2. 設(shè)置Cache主存層次、主存輔存層次的目的;Cache主存層次、主存輔存層次實現(xiàn)手段的不同之處。3. 命中率(失效率)、平均訪問時間的概念和計算方法;如何利用速度、容量、

28、價格的關(guān)系設(shè)計存儲器層次結(jié)構(gòu)各級的參數(shù)。4. Cache的基本概念;主存Cache的三種地址映象方式及實現(xiàn)方法。能夠根據(jù)給定條件分析設(shè)計不同地址映象方式下,主存、Cache的地址和塊的映像關(guān)系。5. 各種替換算法的特點和實現(xiàn)方法;Cache的取算法和更新策略;Cache寫不命中時的調(diào)塊策略。6. 程序的執(zhí)行時間與Cache的性能的關(guān)系7. Cache的性能分析,失效率與塊大小、相聯(lián)度、容量之間的關(guān)系8. 提高主存帶寬的方法;并行存儲器的特點;高位交叉存取和低位交叉存取的特點和實現(xiàn)方法。能夠通過計算分析采用多體交叉技術(shù)后增加的存儲器帶寬和計算機(jī)性能的提高情況。部分習(xí)題參考答案:補(bǔ)充題 某采用組相

29、聯(lián)映像方式的Cache存儲系統(tǒng)中,主存由M0M7共8塊組成,Cache由C0C3共4塊組成。Cache分為2組,每組2塊。設(shè)在某程序的執(zhí)行過程中,訪存的主存塊地址流為:M6、M2、M4、M1、M4、M6、M3、M4、M0、M5、M3、M7,主存中的內(nèi)容在程序開始時未裝入Cache。設(shè)Cache采用LRU替換算法。(1) 列表寫出程序執(zhí)行過程中Cache中各塊的調(diào)入、替換和命中情況。(2) 計算該程序執(zhí)行過程中訪問Cache的命中率。答:主存塊M0、M2、M4、M6映射到Cache的0組中的C0、C1上主存塊M1、M3、M5、M7映射到Cache的1組中的C2、C3上 采用LRU替換算法時Cac

30、he中各塊使用情況:時刻123456789101112主存塊號M6M2M4M1M4M6M3M4M0M5M3M7C066*4444*4*44*4*4*4*C122*2*2*666*0000C21111*1*1*55*7*C33333*33調(diào)入調(diào)入替換調(diào)入命中替換調(diào)入命中替換替換命中替換Cache的命中率:H3/121/40.25 5.10 解:(1)根據(jù)題意,約75%的訪存為取指令。因此,分離Cache的總體失效率為:(75%0.39%)(25%4.82%)1.4975%; 容量為64KB的混合Cache的失效率略低一些,只有1.35%。 (2)平均訪存時間公式可以分為指令訪問和數(shù)據(jù)訪問兩部分:

31、 平均訪存時間指令所占的百分比(讀命中時間讀失效率失效開銷)數(shù)據(jù)所占的百分比(數(shù)據(jù)命中時間數(shù)據(jù)失效率失效開銷) 所以,兩種結(jié)構(gòu)的平均訪存時間分別為: 分離Cache的平均訪存時間75%(10.39%50)25%(14.82%50)(75%1.195)(25%3.41)0.89625+0.85251.74875 混合Cache的平均訪存時間75%(11.35%50)25%(111.35%50)(75%1.675)(25%2.675)1.256250.668751.925因此,盡管分離Cache的實際失效率比混合Cache的高,但其平均訪存時間反而較低。分離Cache提供了兩個端口,消除了結(jié)構(gòu)相關(guān)

32、。5.11 解:平均訪問時間命中時間失效率失效開銷平均訪問時間1-路=2.0+1.4% *80=3.12ns平均訪問時間2-路=2.0*(1+10%)+1.0% *80=3.0ns兩路組相聯(lián)的平均訪問時間比較低CPUtime=(CPU執(zhí)行+存儲等待周期)*時鐘周期CPU time=IC(CPI執(zhí)行+總失效次數(shù)/指令總數(shù)*失效開銷)*時鐘周期=IC(CPI執(zhí)行*時鐘周期)+(每條指令的訪存次數(shù)*失效率*失效開銷*時鐘周期)CPU time 1-way=IC(2.0*2+1.2*0.014*80)5.344ICCPU time 2-way=IC(2.2*2+1.2*0.01*80)5.36IC相對

33、性能比:5.36/5.344=1.003和平均訪存時間的比較結(jié)果相反,從CPU時間的角度看,直接映像Cache的平均性能好一些。5.12解:(1)寫直達(dá)cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,更新cache和主存,訪問主存1次(主存每次只能讀或?qū)懸粋€字)。訪問失效,有兩種情況:讀失效,將主存中的塊調(diào)入cache中,訪問主存2次(一個主存塊為兩個字);寫失效,采用按寫分配,即當(dāng)Cache寫不命中時,先把所寫單元所在的塊從主存調(diào)入Cache,然后再寫入Cache。 訪問主存次數(shù):將所寫的塊調(diào)入cache,訪問主存2次,寫直達(dá),寫入Cache的同時要將修改的數(shù)據(jù)寫入主存,再訪問主

34、存1次,共3次。寫直達(dá),cache與主存信息一致,主存塊調(diào)入cache時,不用考慮塊的寫回。根據(jù)上述分析,各操作占總讀寫操作的比例和訪存次數(shù)如下表:訪問命中訪問類型某操作占總讀寫操作的比例訪存次數(shù)Y讀95%75%71.25% (75%是讀操作)0Y寫95%25%23.75% (25%是寫操作)1N讀5%75%3.75%2N寫5%25%1.25%3根據(jù)上表可得一次訪存請求后,真正的平均訪存次數(shù):平均訪存次數(shù)(71.25%0)+( 23.75%1)+( 3.75%2)+ (1.25%3) 0.35次CPU發(fā)出訪存請求的速率為109字/s,即帶寬為109字/s,其中真正訪存的次數(shù)是0.35109次,

35、 已用帶寬所占的比例0.35109/109 35.0%(2)寫回法cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,不訪問主存。寫回法cache訪問失效,無論讀寫,均需從主存調(diào)塊,同時要考慮被修改過的塊被替換時,需要寫回主存,存在兩種情況:讀失效,將主存中的塊調(diào)入cache中,同時要考慮Cache塊被替換時寫回主存的情況:讀失效的概率:5%75%=3.75%,在任何時候,Cache中有30的塊被修改過,70%塊沒有被修改過,是干凈的。替換時,對于70%的干凈塊,直接調(diào)塊,訪存2次;對于30%的臟塊,需將cache塊寫回主存后,再調(diào)塊,訪存4次。寫失效:采用按寫分配,即當(dāng)Cache寫不

36、命中時,先把所寫單元所在的塊從主存調(diào)入Cache,然后再寫入Cache。寫失效的概率:5%25%=1.25%,替換時,對于70%的干凈塊,從主存直接調(diào)塊,訪存2次;對于30%的臟塊,臟cache塊寫回主存訪存2次,再從主存調(diào)塊,訪存2次,共訪存4次。根據(jù)上述分析,訪問Cache不命中時各操作占總讀寫操作的比例和訪存次數(shù)如下表:訪問命中訪問類型塊為臟某操作占總讀寫操作的比例訪存次數(shù)Y讀X95%75%71.25% (75%是讀操作)0Y寫X95%25%23.75% (25%是寫操作)0N讀N(干凈)5%75%70%2.625%2N讀Y(臟)5%75%30%1.125%4N寫N(干凈)5%25%70

37、%0.875%2N寫Y(臟)5%25%30%0.375%4根據(jù)上表可得一次訪存請求后,真正的平均訪存次數(shù):平均訪存次數(shù)71.25023.75%02.625%21.125%40.875%2+0.375%40.13次 已用帶寬所占的比例0.13109/109 13.0%第六章1. I/O系統(tǒng)的特點;I/O系統(tǒng)對計算機(jī)系統(tǒng)性能的影響,利用加速比進(jìn)行量化比較。2. 通道的概念;帶有通道的I/O系統(tǒng)的結(jié)構(gòu);通道的工作過程。字節(jié)多路通道、選擇通道、數(shù)組多路通道的特點;根據(jù)給定條件進(jìn)行通道流量分析和主存頻率計算。部分習(xí)題參考答案:6.5解:本題要求計算通道的吞吐率,而且機(jī)器有一個多路通道,這就有兩種可能:字

38、節(jié)多路通道和數(shù)組多路通道。因為如果將多路通道組織成數(shù)組多路通道,某個時刻通道只能為一臺設(shè)備傳送數(shù)據(jù),所以它的傳輸率是所有設(shè)備的傳輸率的最大值,而如果將它組織成字節(jié)多路通道,該通道的最大傳輸率就是所有設(shè)備的傳輸率之和。所以在本題中,從性能上考慮,應(yīng)組織成字節(jié)多路通道形式。所以此類通道的最大傳輸率為:(1)fBYTEfif打印機(jī)傳輸率2f讀卡機(jī)傳輸率2f終端傳輸率1025.6KBps (i1.14)(2)兩個選擇通道連接的設(shè)備相同,所以只要計算其中一個通道的傳輸率既可。因為磁盤機(jī)的傳輸率大于磁帶機(jī)。所以此類通道的傳輸率為: max800,200800KBps所以本系統(tǒng)的最大數(shù)據(jù)傳輸率為: f系統(tǒng)280025.61625.6KBps。6.8解:(1)通道實際流量為(2)由于通道的最大流量等于實際工作流量,即有可得,通道的工作周期Ts+TD = 5s。補(bǔ)充題有8臺外設(shè)的數(shù)據(jù)傳輸率分別如下表所示。設(shè)備號12345678數(shù)據(jù)傳輸速率(B/ms)5002401007550401410現(xiàn)要設(shè)計一種通道,其設(shè)備選擇時間TS2s,數(shù)據(jù)傳輸時間TD2s。請回答:(1) 如果按字節(jié)多路通道設(shè)計,該通道的最大流量是多少?如果希望從8臺設(shè)備中至少選擇4臺外設(shè)同時連接到該通道上,而且盡可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論