計算機系統(tǒng)結構41PPT學習教案_第1頁
計算機系統(tǒng)結構41PPT學習教案_第2頁
計算機系統(tǒng)結構41PPT學習教案_第3頁
計算機系統(tǒng)結構41PPT學習教案_第4頁
計算機系統(tǒng)結構41PPT學習教案_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、會計學1 計算機系統(tǒng)結構計算機系統(tǒng)結構41 2 第1頁/共44頁 3 第2頁/共44頁 4 nn 算叫做向量處理向量處理。相應指令叫向向 量指令量指令。 第3頁/共44頁 5 考察向量計算表達式: C(I)A(I5)B(I)I10,11,12,1000 (1)使用FORTRAN語言,循環(huán)部分為: DO40I10,1000 40C(I)A(I5)B(I) 一般機器上可用下列指令序列實現(xiàn) I=10 100LOADA(I+5) LOADB(I) ADDC(I),A(I),B(I) INCREMENTII+1 IFI=1000,GOTO100 STOP 第4頁/共44頁 6 (2)在具有向量數據表示的

2、機器中可用如下指令實現(xiàn) C(10 1000) A(105 10005)B(10 1000) 向量指令的基本格式 參加運算的每個向量都需指明其基地址、位移量和向量長度。 第5頁/共44頁 7 分析分析向量向量計算計算 Y=a X+ Z 用向量處理機處理用向量處理機處理 LD F0 a ; a裝入裝入F0 LV V1 M(X) ;X裝入裝入V1 MULV V2 , F0 ,V1 ; V2 =a X LV V3 , M(Y) ;Y裝入裝入V3 ADDV V4 , V3, V2 ; 向量加向量加 SV M(Y) , V4 ;存;存 V4 第6頁/共44頁 8 基本思想是把兩個向量的對應分量進行計算,產

3、生一 個結果向量?;灸J奖硎緸橄铝行问?C=A+B 按向量運算中各計算相繼的次序,歸結為3種方法種方法: (1)橫向處理橫向處理:計算按行的方式行的方式從左至右橫向進行,逐 個求向量中的每個分量。 (2)縱向處理縱向處理:計算按列的方式列的方式自上而下縱向地進行。 (3)縱橫處理:縱橫處理:又稱分組處理,上述兩種方法的結合, 即組內采用縱向處理,組間采用橫向處理。 第7頁/共44頁 9 (1)橫向處理:按以下表達式計算每個分量: d1a1(b1c1) d2a2(b2c2) : dNaN(bNcN) 采用流水方式計算時,每個向量加、乘運算中 都會發(fā)生數據相關。 計算一個分量要進行2次乘法和加法

4、功能的轉移。 共出現(xiàn)N次數據相關、2N次功能轉換。 橫向處理:不適合于向量流水處理 缺點 DA(BC) 第8頁/共44頁 10 用向量指令,相當于: KBC DKA DA(BC) 縱向處理:適合于向量流水線處理機, 第9頁/共44頁 11 當向量長度N超過向量寄存器限度時,需分組處理。 縱橫方法適合于寄存器-寄存器工作的向量處理機。 第10頁/共44頁 12 第11頁/共44頁 13 存儲器存儲器-存儲器結構存儲器結構框框圖:向量中對應分量的能并發(fā) 訪問,計算結果能并行地保存。 需要的帶寬是一般存儲器的3倍:一個時鐘周期內讀 出兩個操作數并寫回一個結果。 第12頁/共44頁 14 為滿足運算器

5、帶寬的要求,存儲器可采用多個存儲 器模塊組成的結構方式。如圖4.1(b)。 運算器與主存間有3條相互獨立的數據通路,數據 通路可并行工作,但一個存儲器模塊在同一時刻只 能為一個數據通路服務。 第13頁/共44頁 15 例如, A、B所對應的分量若在 同一個存儲器模塊,就不能同時 讀取,計算的中間結果也不能存 放在正“忙”的存儲器模塊中。 第14頁/共44頁 16 時鐘周期0,有兩個存儲模塊同時工作; 時鐘周期1、2、3、4,5,各有4個存儲模塊同時工作; 時鐘周期6(7)時,有5或6個存儲模塊同時工作。 實際中,數據存放并非理想,如RAi和RBi存放Mi中。 如何實現(xiàn)無沖突訪問? 第15頁/共

6、44頁 17 在運算流水線的輸入端和輸出端分別增加一個可變延遲緩沖 器。即可實現(xiàn)無沖突訪問。 假設向量A的輸入延遲兩個時鐘周期,輸出延遲4個時鐘周期 。所有向量都從模塊M0開始規(guī)則存放,分析向量計算的時空的時空 圖圖 第16頁/共44頁 18 1)假設一個存取周期等于兩個時鐘周期 2)A的輸入延遲兩個時鐘周期 3)輸出延遲4個時鐘周期 第17頁/共44頁 19 水線內部加緩沖器以消除內部沖突 的思想是一致的。 第18頁/共44頁 20 第19頁/共44頁 21 組成及標量和向量操作: 流水部件由向量部件、浮點部件、標量部件和和地 址運算部件組成。共12個。 指令緩沖器:由256個16位寄存器組

7、成,存放預取 指令。主要程序段可留在其中。內循環(huán)指令可全部放 在其中,不必到主存去反復取指令。大大減少取指次 數。 第20頁/共44頁 22 CRAY-1向量處理機簡介 第21頁/共44頁 23 第22頁/共44頁 24 n- 存儲系統(tǒng)結構設計思想是一致的。 即使操作數離處理器盡可能近, 使處理器處于忙碌狀態(tài)。 第23頁/共44頁 25 存儲器層次結構 隨著處理器速度、存儲器容量和級數增加,存儲器效率? 計算機系統(tǒng)的高功耗、低效率及存儲頸問題突出 第24頁/共44頁 26 第25頁/共44頁 27 12個功能部件都是獨立的,只要滿足一定約束條件,可并行工作。 約束條件為:1.無向量寄存器使用沖

8、突;2.無功能部件使用沖突。 第26頁/共44頁 28 第27頁/共44頁 29 第28頁/共44頁 30 寫后讀的數據相關性寫后讀的數據相關性,加快向量指 令序列執(zhí)行速度。 n鏈接技術鏈接技術是流水線定向技術的發(fā)展。 第29頁/共44頁 31 MULV VV2,V3 ; V V2V3 1、2條指令可并行執(zhí)行:無寄存器和功能部件沖 突。 第3條指令與前兩條指令均能鏈接。 1、2條指令執(zhí)行時間和寄存器長度必須相同 第30頁/共44頁 32 處理機自動檢測每一條向量指令是否與前一條指令形成鏈接。 若滿足鏈接條件,便啟動本指令工作而形成鏈接。 數據進(出)每個功能部件,包括存器,需1個時鐘周期。 L

9、VV3,M(A);V3A ADDVV2,V0,V1;V2V0V1 MULVV,V2,V3;VV2V3 第31頁/共44頁 33 如 鏈接條件問題 LVV3,M(A);V3A ADDVV2,V0,V1;V2V0V1 MULVV,V2,V3;VV2V3 第32頁/共44頁 34 假定,一個程序段有以下三個向量操作:假定,一個程序段有以下三個向量操作: V3 A V2 V0 + + V1 V4 V2 * * V3 +1 +1 +1+1 +1 數據進出每個功能部件,需1個時鐘周期 向量在加法部件的執(zhí)行時間為(1+6+1)+N-1 鏈接后執(zhí)行時間增加? (1+7+1) 第33頁/共44頁 35 第34頁/共44頁 36 度計算出循環(huán)的次數。 第35頁/共44頁 37 第36頁/共44頁 38 前三種技術措施都是在單處理機結構的向量計算機上實現(xiàn)的。 為了有效地提高向量處理性能,新型向量機可采用多處理 機體系結構。 下圖是CRAYX-MP的結構框圖,它由4個CPU組成。CPU的 結構同CRAY-1向量處理機相似。 第37頁/共44頁 39 到發(fā)揮。 第38頁/共44頁 40

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論