下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、存儲(chǔ)器架構(gòu)對(duì)系統(tǒng)性能的影響上網(wǎng)時(shí)間:2006年03月06日凰打印版回推薦給同仁區(qū)項(xiàng)送杳詢存儲(chǔ)器技術(shù)的發(fā)展使存儲(chǔ)器系統(tǒng)的性能得到提高,盡管峰值速率依然是存儲(chǔ)器技術(shù)最重要的參數(shù)之一,但 其它結(jié)構(gòu)參數(shù)也極大地影響存儲(chǔ)器系統(tǒng)的性能。本文將重點(diǎn)介紹存儲(chǔ)器架構(gòu)對(duì)系統(tǒng)性能的影響。存儲(chǔ)器技術(shù)大多數(shù)根據(jù)其運(yùn)行速度來(lái)命名。例如,PC100 SDRAM器件是指數(shù)據(jù)速率為100MHz的存儲(chǔ)技 術(shù),PC133則表示數(shù)據(jù)速率為133MHz,等等。盡管這種命名的習(xí)慣隨著時(shí)間發(fā)展而變化,但通常還是能 給潛在買家提供關(guān)于存儲(chǔ)器運(yùn)行速度的信息。事實(shí)上,今天的主流存儲(chǔ)技術(shù)都是按照其峰值數(shù)據(jù)速率來(lái)命 名的,這將繼續(xù)成為評(píng)估存儲(chǔ)系統(tǒng)性
2、能的要素之一。不過(guò),在實(shí)際系統(tǒng)中,沒(méi)有存儲(chǔ)器能完全工作在其峰 值速率下。從寫命令轉(zhuǎn)換到讀命令,在某個(gè)時(shí)間訪問(wèn)某個(gè)地址,以及刷新數(shù)據(jù)等操作都要求數(shù)據(jù)總線在一定時(shí)間內(nèi)保 持休止?fàn)顟B(tài),這樣就不能充分利用存儲(chǔ)器通道。此外,寬并行總線和DRAM內(nèi)核預(yù)取都經(jīng)常導(dǎo)致不必要的 大數(shù)據(jù)量存取。在指定的時(shí)間段內(nèi),存儲(chǔ)器控制器能存取的有用數(shù)據(jù)稱為有效數(shù)據(jù)速率,這很大程度上取 決于系統(tǒng)的特定應(yīng)用。有效數(shù)據(jù)速率隨著時(shí)間而變化,常低于峰值數(shù)據(jù)速率。在某些系統(tǒng)中,有效數(shù)據(jù)速 率可下降到峰值速率的10%以下。表1:每百周期發(fā)生兩個(gè)總線轉(zhuǎn)換時(shí)的有效數(shù)據(jù)速率和峰值數(shù)據(jù)速率。通常,這些系 統(tǒng)受益于那 些能產(chǎn)生更 高有效數(shù)據(jù) 速率的
3、存儲(chǔ) 器技術(shù)的變 化。在CPU方 面存在類似 的現(xiàn)象,最近 幾年諸如AMD和Transmeta 等 公司已經(jīng)指出,在測(cè)量基于CPU的系統(tǒng)的性能時(shí),時(shí)鐘頻率不是唯一的要素。存儲(chǔ)器技術(shù)已經(jīng)很成熟,峰 值速率和有效數(shù)據(jù)速率或許并不比以前匹配的更好。盡管峰值速率依然是存儲(chǔ)器技術(shù)最重要的參數(shù)之一, 但其他結(jié)構(gòu)參數(shù)也可以極大地影響存儲(chǔ)器系統(tǒng)的性能。影響有效數(shù)據(jù)速率的參數(shù)有幾類影響有效數(shù)據(jù)速率的參數(shù),其一是導(dǎo)致數(shù)據(jù)總線進(jìn)入若干周期的停止?fàn)顟B(tài)。在這類參數(shù)中,總線轉(zhuǎn) 換、行周期時(shí)間、CAS延時(shí)以及RAS到CAS的延時(shí)(tRCD)引發(fā)系統(tǒng)結(jié)構(gòu)中的大部分延遲問(wèn)題??偩€轉(zhuǎn)換本身會(huì)在數(shù)據(jù)通道上產(chǎn)生非常長(zhǎng)的停止時(shí)間。以G
4、DDR3系統(tǒng)為例,該系統(tǒng)對(duì)存儲(chǔ)器的開(kāi)放頁(yè)不 斷寫入數(shù)據(jù)。在這期間,存儲(chǔ)器系統(tǒng)的有效數(shù)據(jù)速率與其峰值速率相當(dāng)。不過(guò),假設(shè)100個(gè)時(shí)鐘周期中, 存儲(chǔ)器控制器從讀轉(zhuǎn)換到寫。由于這個(gè)轉(zhuǎn)換需要6個(gè)時(shí)鐘周期,有效的數(shù)據(jù)速率下降到峰值速率的94%。在這100個(gè)時(shí)鐘周期中,如果存儲(chǔ)器控制器將總線從寫轉(zhuǎn)換到讀的話,將會(huì)丟失更多的時(shí)鐘周期。這種存儲(chǔ)器技術(shù)在從寫轉(zhuǎn)換到讀時(shí)需要15個(gè)空閑周期,這會(huì)將有效數(shù)據(jù)速率進(jìn)一步降低到峰值速率的79%。表1 顯示出針幾種高性能存儲(chǔ)器技術(shù)類似的計(jì)算結(jié)果。顯然,所有的存儲(chǔ)器技術(shù)并不相同。需要很多總線轉(zhuǎn)換的系統(tǒng)設(shè)計(jì)師可以選用諸如XDR、RDRAM或者 DDR2這些更高效的技術(shù)來(lái)提升性能
5、。另一方面,如果系統(tǒng)能將處理事務(wù)分組成非常長(zhǎng)的讀寫序列,那么 總線轉(zhuǎn)換對(duì)有效帶寬的影響最小。不過(guò),其他的增加延遲現(xiàn)象,例如盛bank)沖突會(huì)降低有效帶寬,對(duì)性能 產(chǎn)生負(fù)面影響。DRAM技術(shù)要求庫(kù)的頁(yè)或行在存取之前開(kāi)放。一旦開(kāi)放,在一個(gè)最小周期時(shí)間,即行周期時(shí)間(tRC)結(jié)束之 前,同一個(gè)庫(kù)中的不同頁(yè)不能開(kāi)放。對(duì)存儲(chǔ)器開(kāi)放庫(kù)的不同頁(yè)存取被稱為分頁(yè)遺漏,這會(huì)導(dǎo)致與任何tRC 間隔未滿足部分相關(guān)的延遲。對(duì)于還沒(méi)有開(kāi)放足夠周期以滿足tRC間隙的庫(kù)而言,分頁(yè)遺漏被稱為庫(kù)沖突。 而tRC決定了庫(kù)沖突延遲時(shí)間的長(zhǎng)短,在給定的DRAM上可用的庫(kù)數(shù)量直接影響庫(kù)沖突產(chǎn)生的頻率。大多數(shù)存儲(chǔ)器 技術(shù)有4個(gè)或 者8個(gè)庫(kù)
6、,在 數(shù)十個(gè)時(shí)鐘周 期具有tRC 值。在隨機(jī)負(fù) 載情況下,那 些具有8個(gè)庫(kù) 的內(nèi)核比具有 4個(gè)庫(kù)的內(nèi)核所發(fā)生的庫(kù)沖表2:不同存儲(chǔ)技術(shù)的總峰值帶寬以及控制器管腳數(shù)的總線帶寬。突更少。盡管tRC與庫(kù)數(shù)量之間的相互影響很復(fù)雜,但是其累計(jì)影響可用多種方法量化。存儲(chǔ)器讀事務(wù)處理 考慮三種簡(jiǎn)單的存儲(chǔ)器讀事務(wù)處理情況。第一種情況,存儲(chǔ)器控制器發(fā)出每個(gè)事務(wù)處理,該事務(wù)處理與前 一個(gè)事務(wù)處理產(chǎn)生一個(gè)庫(kù)沖突??刂破鞅仨氃诖蜷_(kāi)一個(gè)頁(yè)和打開(kāi)后續(xù)頁(yè)之間等待一個(gè)tRC時(shí)間,這樣增加 了與頁(yè)循環(huán)相關(guān)的最大延遲時(shí)間。在這種情況下的有效數(shù)據(jù)速率很大程度上決定于I/O,并主要受限于 DRAM內(nèi)核電路。最大的庫(kù)沖突頻率將有效帶寬削
7、減到當(dāng)前最高端存儲(chǔ)器技術(shù)峰值的20%到30%。在第二種情況下,每個(gè)事務(wù)處理都以隨機(jī)產(chǎn)生的地址為目標(biāo)。此時(shí),產(chǎn)生庫(kù)沖突的機(jī)會(huì)取決于很多因素, 包括tRC和存儲(chǔ)器內(nèi)核中庫(kù)數(shù)量之間的相互作用。tRC值越小,開(kāi)放頁(yè)循環(huán)地越快,導(dǎo)致庫(kù)沖突的損失越 小。此外,存儲(chǔ)器技術(shù)具有的庫(kù)越多,隨機(jī)地址存取庫(kù)沖突的機(jī)率就越小。第三種情況,每個(gè)事務(wù)處理就是一次頁(yè)命中,在開(kāi)放頁(yè)中尋址不同的列地址??刂破鞑槐卦L問(wèn)關(guān)閉頁(yè),允 許完全利用總線,這樣就得到一種理想的情況,即有效數(shù)據(jù)速率等于峰值速率。第一種和第三種情況都涉及到簡(jiǎn)單的計(jì)算,隨機(jī)情況受其他的特性影響,這些特性沒(méi)有包括在DRAM或者 存儲(chǔ)器接口中。存儲(chǔ)器控制器仲裁和排隊(duì)
8、會(huì)極大地改善庫(kù)沖突頻率,因?yàn)楦锌赡艹霈F(xiàn)不產(chǎn)生沖突的事務(wù) 處理,而不是那些導(dǎo)致庫(kù)沖突的事務(wù)處理。然而,增加存儲(chǔ)器隊(duì)列深度未必增加不同存儲(chǔ)器技術(shù)之間的相對(duì)有效數(shù)據(jù)速率。例如,即使增加存儲(chǔ)器控 制隊(duì)列深度,XDR的有效數(shù)據(jù)速率也比GDDR3高20%。存在這種增量主要是因?yàn)閄DR具有更高的庫(kù)數(shù) 量以及更低的tRC值。一般而言,更短的tRC間隔、更多的庫(kù)數(shù)量以及更大的控制器隊(duì)列能產(chǎn)生更高的有 效帶寬。實(shí)際上,很多效率限制現(xiàn)象是與行存取粒度相關(guān)的問(wèn)題。tRC約束本質(zhì)上要求存儲(chǔ)器控制器從新開(kāi)放的行 中存取一定量的數(shù)據(jù),以確保數(shù)據(jù)管線保持充滿。事實(shí)上,為保持?jǐn)?shù)據(jù)總線無(wú)中斷地運(yùn)行,在開(kāi)放一個(gè)行 之后,只須讀取
9、很少量的數(shù)據(jù),即使不需要額外的數(shù)據(jù)。另外一種減少存儲(chǔ)器系統(tǒng)有效帶寬的主要特性被歸類到列存取粒度范疇,它規(guī)定了每次讀寫操作必須傳輸 的數(shù)據(jù)量。與之相反,行存取粒度規(guī)定每個(gè)行激活(一般指每個(gè)RAS的CAS操作)需要多少單獨(dú)的讀寫操作。 列存取粒度對(duì)有效數(shù)據(jù)速率具有不易于量化的巨大影響。因?yàn)樗?guī)定一個(gè)讀或?qū)懖僮髦行枰獋鬏數(shù)淖钚?shù) 據(jù)量,列存取粒度給那些一次只需要很少數(shù)據(jù)量的系統(tǒng)帶來(lái)了問(wèn)題。例如,一個(gè)需要來(lái)自兩列各8字節(jié)的 16字節(jié)存取粒度系統(tǒng),必須讀取總共32字節(jié)以存取兩個(gè)位置。因?yàn)橹恍枰?2個(gè)字節(jié)中的16個(gè)字節(jié),系 統(tǒng)的有效數(shù)據(jù)速率降低到峰值速率的50%??偩€帶寬和脈沖時(shí)間長(zhǎng)度這兩個(gè)結(jié)構(gòu)參數(shù)規(guī)定了
10、存儲(chǔ)器系統(tǒng)的 存取粒度??偩€帶寬是指 連接存儲(chǔ)器控 制器和存儲(chǔ)器 件之間的數(shù)據(jù) 線數(shù)量。它設(shè) 定最小的存取 粒度,因?yàn)閷?duì) 于一個(gè)指定的 存儲(chǔ)器事務(wù)處 理,每條數(shù)據(jù)存儲(chǔ)器技術(shù)忌數(shù)據(jù)速率總線帶竟存取粒虞XDR6.4GH2l28Gbps1珈320字節(jié)RDRAM128Gbps640640字節(jié)GDDR3 1.6GHz128Gbps64032。字節(jié)DDR2 7MHzl28Gbps1,536花8字節(jié)線必須至少傳表3:目前主流存儲(chǔ)技術(shù)的存取粒度和總線帶寬值。遞一個(gè)數(shù)據(jù) 位。而脈沖時(shí)間長(zhǎng)度則規(guī)定對(duì)于指定的事務(wù)處理,每條數(shù)據(jù)線必須傳遞的位數(shù)量。每個(gè)事務(wù)處理中的每條 數(shù)據(jù)線只傳一個(gè)數(shù)據(jù)位的存儲(chǔ)技術(shù),其脈沖時(shí)間長(zhǎng)度為
11、1??偟牧写嫒×6群芎?jiǎn)單:列存取粒度=總線寬度 x脈沖時(shí)間長(zhǎng)度。很多系統(tǒng)架構(gòu)僅僅通過(guò)增加DRAM器件和存儲(chǔ)總線帶寬就能增加存儲(chǔ)系統(tǒng)的可用帶寬。畢竟,如果4個(gè) 400MHz數(shù)據(jù)速率的連接可實(shí)現(xiàn)1.6GHz的總峰值帶寬,那么8個(gè)連接將得到3.2GHz。增加一個(gè)DRAM器 件,電路板上的連線以及ASIC的管腳就會(huì)增多,總峰值帶寬相應(yīng)地倍增。首要的是,架構(gòu)師希望完全利用峰值帶寬,這已經(jīng)達(dá)到他們通過(guò)物理設(shè)計(jì)存儲(chǔ)器總線所能達(dá)到的最大值。 具有256位甚或512位存儲(chǔ)總線的圖形控制器已并不鮮見(jiàn),這種控制器需要1,000個(gè),甚至更多的管腳。 封裝設(shè)計(jì)師、ASIC底層規(guī)劃工程師以及電路板設(shè)計(jì)工程師不能找到采用便
12、宜的、商業(yè)上可行的方法來(lái)對(duì)這 么多信號(hào)進(jìn)行布線的硅片區(qū)域。僅僅增加總線寬度來(lái)獲得更高的峰值數(shù)據(jù)速率,會(huì)導(dǎo)致因?yàn)榱写嫒×6认?制而降低有效帶寬。假設(shè)某個(gè)特定存儲(chǔ)技術(shù)的脈沖時(shí)間長(zhǎng)度等于1,對(duì)于一個(gè)存儲(chǔ)器處理,512位寬系統(tǒng)的存取粒度為512位(或 者64字節(jié))。如果控制器只需要一小段數(shù)據(jù),那么剩下的數(shù)據(jù)就被浪費(fèi)掉,這就降低了系統(tǒng)的有效數(shù)據(jù)速 率。例如,只需要存儲(chǔ)系統(tǒng)32字節(jié)數(shù)據(jù)的控制器將浪費(fèi)剩余的32字節(jié),進(jìn)而導(dǎo)致有效的數(shù)據(jù)速率等于50% 的峰值速率。這些計(jì)算都假定脈沖時(shí)間長(zhǎng)度為1。隨著存儲(chǔ)器接口數(shù)據(jù)速率增加的趨勢(shì),大多數(shù)新技術(shù)的 最低脈沖時(shí)間長(zhǎng)度都大于1。內(nèi)核預(yù)取一種稱為內(nèi)核預(yù)取的功能主要負(fù)責(zé)增
13、加最小的脈沖時(shí)間長(zhǎng)度。DRAM內(nèi)核電路不能跟上I/O電路速度的速 增。由于數(shù)據(jù)不能再連續(xù)地從內(nèi)核中取出以確??刂破餍枨?,內(nèi)核通常為I/O提供比DRAM總線寬度更大 的數(shù)據(jù)集。本質(zhì)上,內(nèi)核傳輸足夠的數(shù)據(jù)到接口電路,或者從接口電路傳輸足夠的數(shù)據(jù),以使接口電路保持足夠長(zhǎng)時(shí) 間的繁忙狀態(tài),以便讓內(nèi)核準(zhǔn)備下一個(gè)操作。例如,假設(shè)DRAM內(nèi)核每個(gè)納秒才能對(duì)操作響應(yīng)一次。不過(guò), 接口可以支持每納秒兩位的數(shù)據(jù)速率。DRAM內(nèi)核每次操作取兩個(gè)數(shù)據(jù)位,而不是一個(gè)數(shù)據(jù)位,因而不必浪費(fèi)接口一半的容量。在接口傳輸數(shù)據(jù) 之后,內(nèi)核已經(jīng)準(zhǔn)備好響應(yīng)下一個(gè)請(qǐng)求,而不需增加延時(shí)。增加的內(nèi)核預(yù)取導(dǎo)致最小脈沖時(shí)間長(zhǎng)度增加為 2,這將直接影響列存取粒度。對(duì)于每個(gè)增加到總線寬度的額外信號(hào),存儲(chǔ)器接口將傳輸兩個(gè)額外的數(shù)據(jù)位。因此具有最小脈沖時(shí)間長(zhǎng)度 為2的512位寬的存儲(chǔ)系統(tǒng),其取粒度為1,024位(128字節(jié))。很多系統(tǒng)對(duì)最小存取粒度的問(wèn)題并不敏感, 因?yàn)樗鼈兇鎯?chǔ)大量的數(shù)據(jù)。不過(guò),某些系統(tǒng)依賴存儲(chǔ)器系統(tǒng)提供小的數(shù)據(jù)單元,并獲益于更窄、更有效的 存儲(chǔ)器技術(shù)。本文小結(jié)隨著存儲(chǔ)技術(shù)向峰值數(shù)據(jù)速率發(fā)展,有效的數(shù)據(jù)速率變的越來(lái)越重要。在選擇存儲(chǔ)器時(shí),設(shè)計(jì)師必須深入
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 湖北省麻城市集美學(xué)校初中體育《短跑技術(shù)-終點(diǎn)沖刺跑》教學(xué)實(shí)錄
- 機(jī)構(gòu)會(huì)員合同范例
- 2025年廣安貨運(yùn)從業(yè)資格證模擬考
- 電力審計(jì)合同范例
- 中國(guó) 并購(gòu)合同范例
- 2025年新疆貨運(yùn)從業(yè)資格證考試模擬題及答案解析
- 電路設(shè)計(jì)要求合同范例
- 客戶購(gòu)買隱形車衣合同范例
- 2025年南昌貨運(yùn)從業(yè)資格證考試答案大全及答案
- 臨時(shí)簡(jiǎn)易合同范例
- 職業(yè)生涯規(guī)劃成品
- 期末模擬卷01(全國(guó)適用)-【中職專用】高二語(yǔ)文上學(xué)期職業(yè)模塊期末模擬卷(解析版)
- 漏洞修復(fù)策略優(yōu)化
- 手術(shù)安全培訓(xùn)
- 司機(jī)聘用協(xié)議書與司機(jī)聘用合同
- 汽車吊安全教育培訓(xùn)
- 浙江省寧波市慈溪市2023-2024學(xué)年高二上學(xué)期期末考試 物理 含解析
- 2024七年級(jí)數(shù)學(xué)上冊(cè)第4章相交線與平等線項(xiàng)目學(xué)習(xí)2包裝中的智慧習(xí)題課件新版華東師大版
- 2024湖南田漢大劇院事業(yè)單位招聘若干人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2024年部門年終總結(jié)
- 碼頭安全生產(chǎn)知識(shí)培訓(xùn)
評(píng)論
0/150
提交評(píng)論