講義參考成果_第1頁
講義參考成果_第2頁
講義參考成果_第3頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一、Lecture25MemoryLatencyToleranceII:Prefetching1、ToleratingMemoryLatency 適用于普通內(nèi) 模預(yù)取不規(guī) 不規(guī)則的不能預(yù)取的緩存缺失,;需要大量的硬件資源長時間延遲RunaheadRunaheadExecution:一種獲得器水平的并行度大指令窗口好處的技runaheadINV和下降當(dāng)原來的缺失返回,Runahead2、RunaheadProblem:DependentCacheMissesRunahead執(zhí)行不能并行化依賴缺失如果這種限制能被理想的克服,Runahead25%ParallelizingDependentCache理念:runaheadL2HowL2-miss地址(指針)=AVD負(fù)載,負(fù)載值是被預(yù)測的。預(yù)測值=有效地址-AVD。TraversalAddressLeafAddressIdentifyingAddressLoadsinWhat預(yù)取什么地址。i****ii我們?nèi)绾沃涝擃A(yù)取:*基于過去的模式預(yù)測iii預(yù)取算法確定預(yù)取。When何時啟動預(yù)取的請求。*預(yù)取太早:預(yù)取的數(shù)據(jù)可能不會在被使用之前移出器*prefetcherPrefetcher*使其更積極:盡量保持遙遙領(lǐng)先的處理器的流(硬件*早些時候移動預(yù)取指令代碼(軟件Where在哪里預(yù)提取數(shù)據(jù)。+簡單的設(shè)計,——可以有用的需求數(shù)據(jù)(緩存污染+數(shù)據(jù)保護(hù)需求從緩存預(yù)?。]有污染——更復(fù)雜的系統(tǒng)設(shè)計——何時預(yù)取緩沖器(并行與串行緩存———L2,L1將預(yù)取緩存中的數(shù)據(jù)在哪里L(fēng)RUprefetcher放置在哪里L(fēng)1L1L2一個更完整的模式+—Prefetcher需要檢查的請How軟件、硬件、execution-based、合作。*工作很常規(guī)的基于數(shù)組的模式。問題——預(yù)取指令占用處理/*預(yù)取多早?確定這是——預(yù)取距離取決于硬件實現(xiàn)(內(nèi)存延遲、緩存大小、時間之間的循環(huán)迭代)便——在代碼減少精度(分支機構(gòu))*需要“特殊”ISA預(yù)取指令31視為預(yù)取(r310)PowerPCdcbt(數(shù)據(jù)緩存塊接觸)指令—— 行為,專門的硬件觀察load/store模式和預(yù)取 Execution-based一個“線程”是主程序執(zhí)行預(yù)取數(shù)據(jù);可以通過軟件/4、Prefetcher準(zhǔn)確性(使用預(yù)取/發(fā)送預(yù)取覆蓋(預(yù)取的缺失/所有缺失及時性(準(zhǔn)時預(yù)取/使用預(yù)取Prefetcheraggressivenessaggressivenessprefetcher類型。對于大多數(shù)硬件預(yù)取器:Prefetchdistance:領(lǐng)先于需求流多少;Prefetchdegree:每次有多少預(yù)取。 Prefetching&EmergingMemoryTechnologies1、Execution-based預(yù)取投機線程:Pre-executed程序塊可以被認(rèn)為是一個“線程**在一個單獨的硬件線程上下文(想想細(xì)粒度多線程iv如何構(gòu)建投機線程:*基于軟件的修剪和“產(chǎn)生”*基于硬件的修剪和“產(chǎn)生”v投機的線程*避免等待/停止和/*獲得成功,*純粹的投機,2、EmergingMemoryTheMainMemory需要主存容量、帶寬、QoSDRAMDRAM在電容器(charge-based內(nèi)存),電容器必須大到足以可靠感應(yīng)晶體管應(yīng)足夠大以保證低泄漏和高保留時間。擴展超出40-35nm是具有 的。DRAM能力、成本和能源/功耗規(guī)模需衡。 iDRAMSystem-DRAMDRAM架構(gòu)、接口功能;更好的廢物管理(有效利用率)。ii關(guān)鍵問題解決:*****Enableemergingmemorytechnologiestoeliminate/minimizeDRAM內(nèi)存技術(shù)似乎更可伸縮(和非易失性HybridMemory3、SolveThe(1):使DRAM和控制器更智新接口、功能架構(gòu):system-DRAM消除或最小化:DRAM;重新思考內(nèi)存和Embraceit:heterogeneous-reliability容錯數(shù)據(jù)映射到不可靠的部分存4、Chargevs.ResistiveChargeMemories(如:內(nèi)存、DRAM、閃光燈):通過捕獲電荷寫入數(shù)據(jù);通過檢測電壓V數(shù)據(jù)。Limits:的電荷和控可靠的感應(yīng)電荷單元大小減少變得/dt寫入數(shù)據(jù);通過檢測電阻R數(shù)據(jù)5、EmergingResistiveMemoryPCM:注入電流來改變材料的階段,電阻由相位決定。PCM是電阻:高阻(0),低電阻(1),PCM單元可以可靠和快速的切換狀態(tài)。相變材料(硫族化物玻璃)中存在兩種狀態(tài)重置:TmeltDRAM,Flash*需要電流脈沖,*9nm(2022(也是*20nm(IBMJRDRaoux+,2008)iiDRAM由于大電阻范圍一個單元可以多個字iii85c>10iv不需要刷新,磁隧道結(jié)*參考層:*自由層:a

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論