版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1.7 某臺(tái)主頻為400MHz的計(jì)算機(jī)執(zhí)行標(biāo)準(zhǔn)測(cè)試程序,程序中指令類型、執(zhí)行數(shù)量和平均時(shí)鐘周期數(shù)如下:指令類型指令執(zhí)行數(shù)量平均時(shí)鐘周期數(shù)整數(shù) 45000 1數(shù)據(jù)傳送 75000 2浮點(diǎn) 8000 4分支 1500 2求該計(jì)算機(jī)的有效CPI、MIPS和程序執(zhí)行時(shí)間。解:(1)CPI (45000×175000×28000×41500×2) / 1295001.776(2)MIPS速率f/ CPI 400/1.776 225.225MIPS(3)程序執(zhí)行時(shí)間= (45000×175000×28000×41500×2)4
2、00=575s1.9 將計(jì)算機(jī)系統(tǒng)中某一功能的處理速度加快10倍,但該功能的處理時(shí)間僅為整個(gè)系統(tǒng)運(yùn)行時(shí)間的40%,則采用此增強(qiáng)功能方法后,能使整個(gè)系統(tǒng)的性能提高多少?解:由題可知: 可改進(jìn)比例Fe=40% = 0.4 部件加速比Se = 10根據(jù) 1.10 計(jì)算機(jī)系統(tǒng)中有三個(gè)部件可以改進(jìn),這三個(gè)部件的部件加速比為:部件加速比1=30; 部件加速比2=20; 部件加速比3=10(1)如果部件1和部件2的可改進(jìn)比例均為30%,那么當(dāng)部件3的可改進(jìn)比例為多少時(shí),系統(tǒng)加速比才可以達(dá)到10?(2)如果三個(gè)部件的可改進(jìn)比例分別為30%、30%和20%,三個(gè)部件同時(shí)改進(jìn),那么系統(tǒng)中不可加速部分的執(zhí)行時(shí)間在總
3、執(zhí)行時(shí)間中占的比例是多少?解:(1)在多個(gè)部件可改進(jìn)情況下,Amdahl定理的擴(kuò)展: 已知S130,S220,S310,Sn10,F(xiàn)10.3,F(xiàn)20.3,得:得F30.36,即部件3的可改進(jìn)比例為36%。(2)設(shè)系統(tǒng)改進(jìn)前的執(zhí)行時(shí)間為T,則3個(gè)部件改進(jìn)前的執(zhí)行時(shí)間為:(0.3+0.3+0.2)T = 0.8T,不可改進(jìn)部分的執(zhí)行時(shí)間為=0.2T。已知3個(gè)部件改進(jìn)后的加速比分別為S130,S220,S310,因此3個(gè)部件改進(jìn)后的執(zhí)行時(shí)間為: 改進(jìn)后整個(gè)系統(tǒng)的執(zhí)行時(shí)間為:Tn = 0.045T+0.2T = 0.245T那么系統(tǒng)中不可改進(jìn)部分的執(zhí)行時(shí)間在總執(zhí)行時(shí)間中占的比例是: 0.2/0.245
4、=81.6%1.11假設(shè)浮點(diǎn)數(shù)指令FP指令的比例為30%,其中浮點(diǎn)數(shù)平方根FPSQR占全部指令的比例為4%,F(xiàn)P操作的CPI為5,F(xiàn)PSQR操作的CPI為20,其他指令的平均CPI為1.25。解:改進(jìn)前: CPI = 5 × 30% + 1.25 × (1 - 30%) = 2.375設(shè)除FPSQR外其余指令的平均CPI為X則 2.375 = 20 × 4% + (1 - 4%)X ,解出X = 1.640625方案1:CPI1 = 3 × 4% + 1.640625 × (1 - 4%) = 1.695方案2:CPI2 = 3 ×
5、30% + 1.25 × (1 - 30%) = 1.7752.11解:01110.570.130430.220.050.060.070.130.020.010.010.020.041011110.090.220.3500000ADDCLASUBJMPJOMSTOCILSTPSHR01指令 頻度pi 操作碼使用哈夫曼編碼 操作碼長(zhǎng)度li ADD0.43 0 1 CLA0.22 1 0 2 SUB0.13 1 1 0 3JMP0.07 1 1 1 0 0 5 JOM0.06 1 1 1 0 15STO0.05 1 1 1 1 05CIL0.02 1 1 1 1 1 06SHR0.011
6、 1 1 1 1 1 07STP0.011 1 1 1 1 1 1 7L=0.43x1+0.22x2+0.13x3+0.07x5+0.06x5+0.05x5+0.02x6+0.01x7+0.01x7 =2.422.12 解:二地址指令的結(jié)構(gòu)是 (4位操作碼OP),(6位地址碼A1),(6位地址碼A2)。一地址指令的結(jié)構(gòu)是 (10位操作碼OP),(6位地址碼A)。二地址指令,最多共16條二地址指令。每少一條二地址指令,則多26條一地址指令,所以一地址指令最多有(16-A)*26條3.5在一臺(tái)單流水線多操作部件的處理機(jī)上執(zhí)行下面的程序,每條指令的取指令、指令譯碼需要一個(gè)時(shí)鐘周期,MOVE、ADD和
7、MUL操作分別需要2個(gè)、3個(gè)和4個(gè)時(shí)鐘周期,每個(gè)操作都在第一個(gè)時(shí)鐘周期從通用寄存器中讀操作數(shù),在最后一個(gè)時(shí)鐘周期把運(yùn)算結(jié)果寫到通用寄存器中。k: MOVE R1,R0 ;R1 (R0)k+1: MUL R0,R2,R1 ;R0 (R2)×(R1)k+2: ADD R0,R2,R3 ;R0 (R2)+(R3)畫出指令執(zhí)行過程的流水線時(shí)空?qǐng)D,并計(jì)算完成這3條指令共需要多少個(gè)時(shí)鐘周期?解: 在程序?qū)嶋H執(zhí)行過程中,二種數(shù)據(jù)相關(guān)會(huì)引起流水線停頓。一是“先寫后讀”相關(guān),k指令對(duì)R1的寫在程序執(zhí)行開始后的第四個(gè)時(shí)鐘;k+1指令對(duì)R1的讀對(duì)指令本身是第三個(gè)時(shí)鐘,但k+1指令比k指令晚一個(gè)時(shí)鐘進(jìn)入流水
8、線,則在程序執(zhí)行開始后的第四個(gè)時(shí)鐘要讀R1。不能在同一時(shí)鐘周期內(nèi)讀寫同一寄存器,因此k+1指令應(yīng)推遲一個(gè)時(shí)鐘進(jìn)入流水線,產(chǎn)生了流水線停頓。二是“寫寫”相關(guān),k+1指令對(duì)R0的寫對(duì)指令本身是第六個(gè)時(shí)鐘,而要求該指令進(jìn)入流水線應(yīng)在程序執(zhí)行開始后的第三個(gè)時(shí)鐘,所以對(duì)R0的寫是在程序執(zhí)行開始后的第八個(gè)時(shí)鐘。k+2指令對(duì)R0的寫對(duì)指令本身是第五個(gè)時(shí)鐘,而k+2指令比k+1指令晚一個(gè)時(shí)鐘進(jìn)入流水線,則在程序執(zhí)行開始后的第四個(gè)時(shí)鐘,所以對(duì)R0的寫是在程序執(zhí)行開始后的第八個(gè)時(shí)鐘。不能在同一時(shí)鐘周期內(nèi)寫寫同一寄存器,因此k+2指令應(yīng)推遲一個(gè)時(shí)鐘進(jìn)入流水線,產(chǎn)生了流水線停頓。另外,可分析“先讀后寫”相關(guān)不會(huì)產(chǎn)生流
9、水線的停頓。該指令流水線由六個(gè)功能段取指、譯碼、取數(shù)、運(yùn)一、運(yùn)二和存數(shù)等組成,則程序指令執(zhí)行過程的流水線時(shí)空?qǐng)D如下圖所示。若3條指令順序流動(dòng),共需要9個(gè)時(shí)鐘周期。 空間存數(shù) K存數(shù) K+1存數(shù) K+2存數(shù) 運(yùn)二 K+1運(yùn)二 運(yùn)一 K+1運(yùn)一 K+2運(yùn)一 取數(shù) K取數(shù) K+1取數(shù) K+2取數(shù) 譯碼 K譯碼 K+1譯碼 K+2譯碼 取指 K取指 K+1取指 K+2取指 時(shí)間 0 1 2 3 4 5 6 7 8 93.6有一指令流水線如下所示(1) 求連續(xù)輸入10條指令,該流水線的實(shí)際吞吐率和效率;(2) 該流水線的“瓶頸”在哪一段?請(qǐng)采取兩種不同的措施消除此“瓶頸”。對(duì)于你所給出的兩種新的流水線,
10、連續(xù)輸入10條指令時(shí),其實(shí)際吞吐率和效率各是多少?解:(1)(2)瓶頸在3、4段。n 變成八級(jí)流水線(細(xì)分)n 重復(fù)設(shè)置部件123-13-24-14-24-34-43.7有一個(gè)流水線由4段組成,其中每當(dāng)流經(jīng)第3段時(shí),總要在該段循環(huán)一次,然后才能流到第4段。如果每段經(jīng)過一次所需要的時(shí)間都是,問:(1) 當(dāng)在流水線的輸入端連續(xù)地每時(shí)間輸入任務(wù)時(shí),該流水線會(huì)發(fā)生什么情況?(2) 此流水線的最大吞吐率為多少?如果每輸入一個(gè)任務(wù),連續(xù)處理10個(gè)任務(wù)時(shí)的實(shí)際吞吐率和效率是多少?(3) 當(dāng)每段時(shí)間不變時(shí),如何提高該流水線的吞吐率?仍連續(xù)處理10個(gè)任務(wù)時(shí),其吞吐率提高多少?解:(1)會(huì)發(fā)生流水線阻塞情況。第1
11、個(gè)任務(wù)S1S2S3S3S4第2個(gè)任務(wù)S1S2stallS3S3S4第3個(gè)任務(wù)S1S2stallstallS3S3S4第4個(gè)任務(wù)S1S2stallstallstallS3S3S4(2)(3)重復(fù)設(shè)置部件吞吐率提高倍數(shù)1.643.8 有一條靜態(tài)多功能流水線由5段組成,加法用1、3、4、5段,乘法用1、2、5段,第3段的時(shí)間為2t,其余各段的時(shí)間均為t,而且流水線的輸出可以直接返回輸入端或暫存于相應(yīng)的流水寄存器中?,F(xiàn)要在該流水線上計(jì)算 ,畫出其時(shí)空?qǐng)D,并計(jì)算其吞吐率、加速比和效率。解:首先,應(yīng)選擇適合于流水線工作的算法。對(duì)于本題,應(yīng)先計(jì)算A1B1、A2B2、A3B3和A4B4;再計(jì)算(A1B1) &
12、#215;(A2B2)和(A3B3) ×(A4B4);然后求總的結(jié)果。其次,畫出完成該計(jì)算的時(shí)空?qǐng)D,如圖所示,圖中陰影部分表示該段在工作。由圖可見,它在18個(gè)t時(shí)間中,給出了7個(gè)結(jié)果。所以吞吐率為: 如果不用流水線,由于一次求積需3t,一次求和需5t,則產(chǎn)生上述7個(gè)結(jié)果共需(4×5+3×3)t =29t。所以加速比為: 該流水線的效率可由陰影區(qū)的面積和5個(gè)段總時(shí)空區(qū)的面積的比值求得: 3.8 有一條動(dòng)態(tài)多功能流水線由5段組成,加法用1、3、4、5段,乘法用1、2、5段,第2段的時(shí)間為2t,其余各段時(shí)間均為t,而且流水線的輸出可以直接返回輸入端或暫存于相應(yīng)的流水寄存
13、器中。若在該流水線上計(jì)算: 試計(jì)算其吞吐率、加速比和效率。解由圖可見,它在18個(gè)t時(shí)間中,給出了7個(gè)結(jié)果。所以吞吐率為: 如果不用流水線,由于一次求積需4t,一次求和需4t,則產(chǎn)生上述7個(gè)結(jié)果共需(4×4+3×4)t =28t。所以加速比為: 該流水線的效率可由陰影區(qū)的面積和5個(gè)段總時(shí)空區(qū)的面積的比值求得: 4.5 在CRAY-1機(jī)器上,按照鏈接方式執(zhí)行下述4條向量指令(括號(hào)中給出了相應(yīng)功能部件的執(zhí)行時(shí)間),如果向量寄存器和功能部件之間的數(shù)據(jù)傳送需要1拍,試求此鏈接流水線的通過時(shí)間是多少拍?如果向量長(zhǎng)度為64,則需多少拍才能得到全部結(jié)果?V0存儲(chǔ)器(從存儲(chǔ)器中取數(shù):7拍)V
14、2V0+V1(向量加:3拍)V3V2<A3(按(A3)左移:4拍)V5V3V4(向量邏輯乘:2拍)解:通過時(shí)間就是每條向量指令的第一個(gè)操作數(shù)執(zhí)行完畢需要的時(shí)間,也就是各功能流水線由空到滿的時(shí)間,在流水線充滿之后,向量中后繼操作數(shù)繼續(xù)以流水方式執(zhí)行,直到整組向量執(zhí)行完畢。T通過(1+7+1)+(1+3+1)+(1+4+1)+(1+2+1)=24(拍) T總共T通過+(64-1)=24+6387拍4.6 T通過(1+7+1)+(1+3+1)+(1+5+1)+(1+2+1)+(1+7+1)=34(拍) T總共T通過+(64-1)=63+3497拍4.7= ×某機(jī)有16個(gè)向量寄存器,其
15、中V0V5中分別放有向量A、B、C、D、E、F,向量長(zhǎng)度均為8,向量各元素均為浮點(diǎn)數(shù);處理部件采用二個(gè)單功能流水線,加法功能部件時(shí)間為2拍,乘法功能部件時(shí)間為3拍。用類似Cray 1的鏈接技術(shù),先計(jì)算(A+B)*C,在流水線不停流的情況下,接著計(jì)算(D+E)*F。 = D × 解答:(1) (A+B)*C 可用以下2條指令完成:V0A+BV1V0*C流水線流過時(shí)間為(1+2+1) + (1+3+1) = 9拍(2) 實(shí)際吞吐率為 =26.7MFLOPS4.8分段開采LV V1, Rb ;取向量B
16、MULTVS V2,V1,F(xiàn)s ;向量和標(biāo)量相乘SV Ra,V2 ;存向量三條指令三個(gè)編隊(duì)T200=4x(15+Tstart)+200x3=660+(4xTstart)Tstart=12+7+12=31T200=660+4x31=7844.9解:Cray Y-MP/8的峰值性能為: R = (1+1)×8/(6x10-3 )= 16 = 2667MFLOPS5.8. 假設(shè)有一條長(zhǎng)流水線,僅僅對(duì)條件轉(zhuǎn)移指令使用分支目標(biāo)緩沖。假設(shè)分支預(yù)測(cè)錯(cuò)誤的開銷為4個(gè)時(shí)鐘周期,緩沖不命中的開銷為3個(gè)時(shí)鐘周期。假設(shè):命中率為90%,預(yù)測(cè)精度為90%,分支頻率為15%,沒有分支的基本CPI為1。求程序執(zhí)行
17、的CPI。相對(duì)于采用固定的2個(gè)時(shí)鐘周期延遲的分支處理,哪種方法程序執(zhí)行速度更快?解:(1)程序執(zhí)行的CPI = 沒有分支的基本CPI(1) + 分支帶來的額外開銷分支帶來的額外開銷是指在分支指令中,緩沖命中但預(yù)測(cè)錯(cuò)誤帶來的開銷與緩沖沒有命中帶來的開銷之和。分支帶來的額外開銷= 15% * (90%命中×10%預(yù)測(cè)錯(cuò)誤×4 + 10不命中×3)= 0.099所以,程序執(zhí)行的CPI 1 0.099 = 1.099(2)采用固定的2 個(gè)時(shí)鐘周期延遲的分支處理CPI = 1 + 15%×2 = 1.3由(1)(2)可知分支目標(biāo)緩沖方法執(zhí)行速度快。5.9. 假設(shè)分
18、支目標(biāo)緩沖的命中率為90%,程序中無條件轉(zhuǎn)移指令的比例為5%,沒有無條件轉(zhuǎn)移指令的程序CPI值為1。假設(shè)分支目標(biāo)緩沖中包含分支目標(biāo)指令,允許無條件轉(zhuǎn)移指令進(jìn)入分支目標(biāo)緩沖,則程序的CPI值為多少?假設(shè)原來的CPI=1.1 參考答案: 解:設(shè)每條無條件轉(zhuǎn)移指令的延遲為x,則有:15%×x1.1 x2當(dāng)分支目標(biāo)緩沖命中時(shí),無條件轉(zhuǎn)移指令的延遲為0。所以 程序的CPI 1 2 × 5% ×(1 90%) 1.017.8. 假設(shè)對(duì)指令Cache的訪問占全部訪問的75%;而對(duì)數(shù)據(jù)Cache的訪問占全部訪問的25%。Cache的命中時(shí)間為1個(gè)時(shí)鐘周期,不命中開銷為50 個(gè)時(shí)鐘
19、周期,在混合Cache中一次load或store操作訪問Cache的命中時(shí)間都要增加一個(gè)時(shí)鐘周期,32KB的指令Cache的不命中率為0.15%,32KB的數(shù)據(jù)Cache的不命中率為3.77%,64KB的混合Cache的不命中率為0.95%。又假設(shè)采用寫直達(dá)策略,且有一個(gè)寫緩沖器,并且忽略寫緩沖器引起的等待。試問指令Cache和數(shù)據(jù)Cache容量均為32KB的分離Cache和容量為64KB的混合Cache相比,哪種Cache的不命中率更低??jī)煞N情況下平均訪存時(shí)間各是多少?參考答案:解:(1)根據(jù)題意,約75%的訪存為取指令,25%的訪存為數(shù)據(jù)。因此,分離Cache的總體不命中率為:(75%
20、215;0.15%)(25%×3.77%)1.055%; 容量為64KB的混合Cache的不命中率略低一些,只有0.95%。 (2)平均訪存時(shí)間公式可以分為指令訪問和數(shù)據(jù)訪問兩部分: 平均訪存時(shí)間指令所占的百分比×(讀命中時(shí)間讀不命中率×不命中開銷) 數(shù)據(jù)所占的百分比×(數(shù)據(jù)命中時(shí)間數(shù)據(jù)不命中率×不命中開銷) 所以,兩種結(jié)構(gòu)的平均訪存時(shí)間分別為: 分離Cache的平均訪存時(shí)間75%×(10.15%×50)25%×(13.77%×50)(75%×1.075)(25%×2.885)1.52
21、75 因?yàn)榛旌螩ache讀數(shù)據(jù)的都要增加1個(gè)時(shí)鐘周期所以混合Cache的平均訪存時(shí)間75%×(10.95%×50)25%×(110.95%×50)(75%×1.475)(25%×2.475)1.725因此,盡管分離Cache的實(shí)際不命中率比混合Cache的高,但其平均訪存時(shí)間反而較低。分離Cache提供了兩個(gè)端口,消除了結(jié)構(gòu)相關(guān)。7.9 假設(shè)在3000次訪存中,第一級(jí)Cache不命中110次,第二級(jí)Cache不命中55次。試問:在這種情況下,該Cache系統(tǒng)的局部不命中率和全局不命中率各是多少? 解:局部不命中率 = 該級(jí)Cache的
22、不命中次數(shù)/到達(dá)該級(jí)Cache的訪存次數(shù)。 局部不命中率L1 = 110/3000 = 0.0367,不命中率L2 = 55/110 = 0.50。 全局不命中率L1 = 不命中率L1 = 0.0367, 全局不命中率L2 = 不命中率L1×不命中率L2 = 0.0367×0.50 = 0.0184。7.10 給定以下的假設(shè),試計(jì)算直接映象Cache和兩路組相聯(lián)Cache的平均訪問時(shí)間以及CPU的性能。由計(jì)算結(jié)果能得出什么結(jié)論?(1)理想Cache情況下的CPI為2.0,時(shí)鐘周期為2ns,平均每條指令訪存1.2次;(2)兩者Cache容量均為64KB,塊大小都是32字節(jié);(
23、3)組相聯(lián)Cache中的多路選擇器使CPU的時(shí)鐘周期增加了10;(4)這兩種Cache的不命中開銷都是80ns;(5)命中時(shí)間為1個(gè)時(shí)鐘周期;(6)64KB直接映象Cache的不命中率為1.4,64KB兩路組相聯(lián)Cache的不命中率為1.0。解: 平均訪問時(shí)間命中時(shí)間不命中率×不命中開銷平均訪問時(shí)間1-路=2.0+1.4% *80=3.12ns平均訪問時(shí)間2-路=2.0*(1+10%)+1.0% *80=3.0ns兩路組相聯(lián)的平均訪問時(shí)間比較低CPUtime=(CPU執(zhí)行+存儲(chǔ)等待周期)*時(shí)鐘周期CPU time=IC(CPI執(zhí)行+總不命中次數(shù)/指令總數(shù)*不命中開銷) *時(shí)鐘周期=I
24、C(CPI執(zhí)行*時(shí)鐘周期)+(每條指令的訪存次數(shù)*不命中率*不命中開銷*時(shí)鐘周期)CPU time 1-way=IC(2.0*2+1.2*0.014*80)5.344ICCPU time 2-way=IC(2.2*2+1.2*0.01*80)5.36IC相對(duì)性能比:5.36/5.344=1.003直接映象cache的訪問速度比兩路組相聯(lián)cache要快1.04倍,而兩路組相聯(lián)Cache的平均性能比直接映象cache要高1.003倍。因此這里選擇兩路組相聯(lián)7.14 假設(shè)一臺(tái)計(jì)算機(jī)具有以下特性:(1) 95的訪存在Cache中命中;(2) 塊大小為兩個(gè)字,且不命中時(shí)整個(gè)塊被調(diào)入;(3) CPU發(fā)出訪
25、存請(qǐng)求的速率為109字/s;(4) 25的訪存為寫訪問;(5) 存儲(chǔ)器的最大流量為109字/s(包括讀和寫);(6) 主存每次只能讀或?qū)懸粋€(gè)字;(7) 在任何時(shí)候,Cache中有30的塊被修改過;(8) 寫不命中時(shí),Cache采用按寫分配法?,F(xiàn)欲給該計(jì)算機(jī)增添一臺(tái)外設(shè),為此首先想知道主存的頻帶已用了多少。試對(duì)于以下兩種情況計(jì)算主存頻帶的平均使用比例。(1) 寫直達(dá)Cache;(2) 寫回法Cache。解:采用按寫分配(1)寫直達(dá)cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,更新cache和主存,訪問主存一次。訪問不命中,有兩種情況:讀不命中,將主存中的塊調(diào)入cache中,訪問主存
26、兩次;寫不命中,將要寫的塊調(diào)入cache,訪問主存兩次,再將修改的數(shù)據(jù)寫入cache和主存,訪問主存一次,共三次。上述分析如下表所示。訪問命中訪問類型頻率訪存次數(shù)Y讀95%*75%=71.3%0Y寫95%*25%=23.8%1N讀5%*75%=3.8%2N寫5%*25%=1.3%3一次訪存請(qǐng)求最后真正的平均訪存次數(shù)=(71.3%*0)+(23.8%*1)+(3.8%*2)+(1.3%*3)0.35已用帶寬=35.0%(2)寫回法cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,不訪問主存。采用寫回法,只有當(dāng)修改的cache塊被換出時(shí),才寫入主存;訪問不命中,有一個(gè)塊將被換出,這也有兩
27、種情況:如果被替換的塊沒有修改過,將主存中的塊調(diào)入cache塊中,訪問主存兩次;如果被替換的塊修改過,則首先將修改的塊寫入主存,需要訪問主存兩次;然后將主存中的塊調(diào)入cache塊中,需要訪問主存兩次,共四次訪問主存。訪問命中塊為臟頻率訪存次數(shù)YN95%*70%=66.5%0YY95%*30%=28.5%0NN5%*70%=3.5%2NY5%*30%=1.5%4所以:一次訪存請(qǐng)求最后真正的平均訪存次數(shù)=66.5*028.5%*0+3.5%*2+1.5%*4=0.13已用帶寬13%9.2(1)由Cube3(X3X2X1X0)= X3X2X1X0Cube3(0110)=1110 即處理器14連接到處
28、理器6令Cube3(X3X2X1X0)=0110 ,得X3X2X1X0=1110Cube3(0110)=1110 即處理器14連接到處理器6所以處理器14和6雙向互連(2) 由=(0101)即處理器5連接到處理器6令=(0110)得X3X2X1X0=0011所以處理器5和6連,3和5連(3) 由=(0110)即處理器6連接到處理器6所以處理器6和6雙向互連(4) 由=(1010)即處理器10連接到處理器6令=(0110)得X3X2X1X0=1010所以處理器6和10雙向互連9.9(1)(a)由Cube2(X4X3X2X1X0)= X3X3X2X1X0Cube2(12)= Cube2(01100
29、)=01000 即處理器8連接到處理器12 (b) 由 即處理器16連接到處理器(C) 由 即處理器4連接到處理器28(d)即處理器9連接到處理器8(e) 即處理器7連接到處理器28(2)2n個(gè)節(jié)點(diǎn)的直徑為2n-1,從5號(hào)到7號(hào),最短經(jīng)過6步00101 00100 01000 01001 10010 10011 00111(3)循環(huán)移數(shù)網(wǎng)絡(luò)的節(jié)點(diǎn)度d=2n-1,直徑為n/2網(wǎng)絡(luò)直徑是3,節(jié)點(diǎn)度是9,與2號(hào)最遠(yuǎn)的是13,15,21,23號(hào)處理器9.11 0123456789ABCDEF4組4元32107654BA98FEDC2組8元45670123CDEF89AB1組16元BA98FEDC321
30、076540000 -1011Cube0+ Cube1+ Cube310.6. 一臺(tái)32個(gè)處理器的計(jì)算機(jī),對(duì)遠(yuǎn)程存儲(chǔ)器訪問時(shí)間為400ns。除了通信以外,假設(shè)計(jì)算中的訪問均命中局部存儲(chǔ)器。當(dāng)發(fā)出一個(gè)遠(yuǎn)程請(qǐng)求時(shí),本處理器掛起。處理器時(shí)鐘時(shí)間為1GHz,如果指令基本的IPC為2(設(shè)所有訪存均命中Cache),求在沒有遠(yuǎn)程訪問的狀態(tài)下與有0.2%的指令需要遠(yuǎn)程訪問的狀態(tài)下,前者比后者快多少?解:沒有遠(yuǎn)程訪問時(shí),機(jī)器的CPI為 1/基本IPC=1/2=0.5 有0.2%遠(yuǎn)程訪問的機(jī)器的實(shí)際CPI為 CPI基本CPI遠(yuǎn)程訪問率×遠(yuǎn)程訪問開銷 0.50.2%×遠(yuǎn)程訪問開銷遠(yuǎn)程訪問開銷為
31、 :遠(yuǎn)程訪問時(shí)間/時(shí)鐘周期時(shí)間400 ns/1 ns400個(gè)時(shí)鐘周期 CPI0.50.2%×4001.3 因此在沒有遠(yuǎn)程訪問的情況下的計(jì)算機(jī)速度是有0.2%遠(yuǎn)程訪問的計(jì)算機(jī)速度的1.3/0.5=2.6倍。7.11 在偽相聯(lián)中,假設(shè)在直接映象位置沒有發(fā)現(xiàn)匹配,而在另一個(gè)位置才找到數(shù)據(jù)(偽命中)時(shí),不對(duì)這兩個(gè)位置的數(shù)據(jù)進(jìn)行交換。這時(shí)只需要1個(gè)額外的周期。假設(shè)不命中開銷為50個(gè)時(shí)鐘周期,2KB直接映象Cache的不命中率為9.8%,2路組相聯(lián)的不命中率為7.6%;128KB直接映象Cache的不命中率為1.0%,2路組相聯(lián)的不命中率為0.7%。(1) 推導(dǎo)出平均訪存時(shí)間的公式。(2) 利用
32、(1)中得到的公式,對(duì)于2KBCache和128KBCache,計(jì)算偽相聯(lián)的平均訪存時(shí)間。解:不管作了何種改進(jìn),不命中開銷相同。不管是否交換內(nèi)容,在同一“偽相聯(lián)”組中的兩塊都是用同一個(gè)索引得到的,因此不命中率相同,即:不命中率偽相聯(lián)不命中率2路。偽相聯(lián)cache的命中時(shí)間等于直接映象cache的命中時(shí)間加上偽相聯(lián)查找過程中的命中時(shí)間*該命中所需的額外開銷。命中時(shí)間偽相聯(lián)命中時(shí)間1路偽命中率偽相聯(lián)×1交換或不交換內(nèi)容,偽相聯(lián)的命中率都是由于在第一次不命中時(shí),將地址取反,再在第二次查找?guī)淼摹R虼?偽命中率偽相聯(lián)命中率2路命中率1路(1不命中率2路)(1不命中率1路)不命中率1路不命中率
33、2路。交換內(nèi)容需要增加偽相聯(lián)的額外開銷。平均訪存時(shí)間偽相聯(lián)命中時(shí)間1路(不命中率1路不命中率2路)×1不命中率2路×不命中開銷1路將題設(shè)中的數(shù)據(jù)帶入計(jì)算,得到:平均訪存時(shí)間2Kb=1+(0.098-0.076)*1+(0.076 *50 ) =4.822平均訪存時(shí)間128Kb=1+(0.010-0.007)*1+(0.007 *50 ) =1.353顯然是128KB的偽相聯(lián)Cache要快一些。7.12 假設(shè)采用理想存儲(chǔ)器系統(tǒng)時(shí)的基本CPI是1.5,主存延遲是40個(gè)時(shí)鐘周期;傳輸速率為4字節(jié)/時(shí)鐘周期,且Cache中50%的塊是修改過的。每個(gè)塊中有32字節(jié),20%的指令是數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度年福建省高校教師資格證之高等教育心理學(xué)題庫(kù)附答案(典型題)
- 2024年度山西省高校教師資格證之高等教育法規(guī)能力檢測(cè)試卷A卷附答案
- 2024年度年福建省高校教師資格證之高等教育學(xué)考前自測(cè)題及答案
- 四年級(jí)數(shù)學(xué)(四則混合運(yùn)算帶括號(hào))計(jì)算題專項(xiàng)練習(xí)與答案
- 北京版英語(yǔ)小學(xué)五年級(jí)上學(xué)期期末試題與參考答案(2024年)
- 2024年股東專項(xiàng)資金墊付協(xié)議樣本
- 2024年市場(chǎng)代銷業(yè)務(wù)協(xié)議參考樣本
- 2024煤礦作業(yè)綜合運(yùn)營(yíng)承包協(xié)議
- 2024年規(guī)范化藥品招標(biāo)協(xié)議范例
- 2024裝修項(xiàng)目訂金協(xié)議范書
- 各省中國(guó)鐵路限公司2024招聘(目前38183人)高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 杭州本級(jí)公共租賃住房資格續(xù)審申請(qǐng)表Ⅴ
- 建筑垃圾外運(yùn)施工方案
- 上海市青浦區(qū)上海五浦匯實(shí)驗(yàn)學(xué)?!?2024-2025學(xué)年上學(xué)期六年級(jí)數(shù)學(xué)期中試卷(無答案)
- 大學(xué)實(shí)訓(xùn)室虛擬仿真平臺(tái)網(wǎng)絡(luò)VR實(shí)訓(xùn)室方案(建筑學(xué)科)
- 體育賽事組織與執(zhí)行手冊(cè)
- 2024年擴(kuò)大“司機(jī)之家”覆蓋范圍工作策劃方案
- 課內(nèi)閱讀(專項(xiàng)訓(xùn)練)-2024-2025學(xué)年統(tǒng)編版語(yǔ)文四年級(jí)上冊(cè)
- 2024-2025學(xué)年高二英語(yǔ)選擇性必修第二冊(cè)(譯林版)UNIT 4 Grammar and usage教學(xué)課件
- 2024二十屆三中全會(huì)知識(shí)競(jìng)賽題庫(kù)及答案
- 消化系統(tǒng)常見疾病課件(完美版)
評(píng)論
0/150
提交評(píng)論