版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、一斡改進(jìn)的OpenMP Guided調(diào)0 I4 I5 . CaAfF4.1訂5M Wi.* hAIr* 號(hào)bnfl舄.cw 編Xf* 4 Nit f A 2,bflrrMwH*4WA . ItiMRi.!sr rs十啊,n 他細(xì)1a acAtMtsraAMKa U9Mfz 嶺/”良, * fl KV*Hr NRB e a arR #Wy J*丨舁航*ll*L N LtfaW*XWMrw.MfBKXA 4 HxitnwiiBte tniiN ti. ean m s t;啊厲H) ) 4ny4XAf ear .! A WHAAV4Vat #*-r I9-maiflt. CtMBit尺0 MH】Wr
2、wIMA斤Ml a*9MW. OAftMIt W I R . R 您wi 4、Hniivm , *”. tM9M0arrAM y u,WAAfUIHIIItMCgr v磯鼻 v K4AM-9A4A f.! .8M tlAS * * fW b ! * * atfc dl taai H.- .葉仕 * *-4 e*o Ul H rnMlWWr 4 w mmw “ m &t t.Ae INVE .UT4 I r yikhH:Ur葉11-* 餌VMMWlf wn *K*題著*Ail l| q 1 hMH*NV4* f h AIJ -r - hi*即 4 JLMUhMn-IBB-UBift Li
3、 !* Vl * qiA4 IM4 Ui| n Fit P N N3I J(IM. Cft A 理 Hft* * ? 41!. i.-rf IK- I I.丄,.鼻即 iu. nnii4tanhf.4 寧 W電起H4I II建詡殲山 If ffl】皐片陽(yáng)片矗 1 、鼻 晉HCI M m W *V If FII1 F R4 沖. i I- * KplfediB A h:-taL4M 陽(yáng) H 曾希 亠科第齊轉(zhuǎn)轉(zhuǎn) H d 4 g| fM|i Kflrt t勺 iMIAlifiH!:!. ITltFH 1 Wil 144 * fl Hfi 増 crflipH4-SHkr.il:*vw n :* 4 H
4、 W *鬥 Mil啊葉 備?!癶 M. f lift II-11A* A tipr ”詩(shī)HP!耳爲(wèi)*-W3 H4 JtB IlH*i. ktlA f-1* ik-fiichl 賣和 w IU0*1*旳 Pl|UrH|卯和“百耳屮序(AH lAi rrIKM.i I 1 MN. mm* tw N 2 It!A-I JI 屮 fl v t ,-* 4t * V rfit k 4h H t SrVJfl 卜用 IE AJ taTKn: tw = E HflKABi J1 H _kTTiTT: i ”i *ff-rfe-*i L1 HL Fwre 111 * l4種改進(jìn)的 O嚴(yán) nMP Guided
5、調(diào)度策略研究表 4 AdjointCon片上的測(cè)試結(jié)果 單位:秒果(單位:秒) 涮度策略118 2dynamic10 178 182 21471 910 6 14 8蒯度策略8s talk0iv.1028 4 4528矗2線程數(shù) 315A9 394.2394.14 23 6l7n657n6 37n765 4 14 l 3914l4 514l 4 8i50 目 l ed1 0gu i ded 5828 人 328 人 l 28 人 327942894.2l94.160 guideVl1 0 guideVl,501 Wguided 10 iw guided5 0 mw g,uide &10
6、 mw gufle & 5010 4 116115 16 1 6 28574 28573 1 4 3 1 91 4 31 0 9 5 5 7 9 5 7 3 7 1 8 0 7 1 89 表 5 Matrix Mu1tip1 icatio n在曙光機(jī)上的測(cè)試結(jié) 果(單位:秒)表 8 Adjoint Con vo1utio n 在 IEM刀片上的測(cè)試 結(jié)果(單位:秒州艘策略 6 5 5 552 3 3 8 3 7 4 1 4 7 4 9 7 4 9 4 3 3 3 3 3 3 5 3 8 4 9 4 9 8 4 5 4331 3436324949sta1k10 1 1 5 4 2 91
7、5 4 8 0 1 5 4 4 0 1 5 4 4 9 1 5 4 4 2 1 5 4 6 9 1 5 3 9 2 1 5 4 2 9 2 1 58 67矗 98 7 721 7矗 0011矗 05 11矗 36 7 73 7 7 7 54蒯 度策略 1160 s1a1ifJ ic.10 153152152 152 152 2 7 8 7 880 7 9 79 7 7 7 47 4 3 565 55 3 5 6 55 5 55 4 5 4 線程數(shù)4 線程數(shù)3 8 5 9 95 5 95 3 55 3 9 85 9 38 6 4 7 5 675 6 64 6 80 23 8 5 73 8 4 9
8、3 8 4 96 78 06 8 0 0 3 8 943 9 0 45 3 76 53 7 4 547 37 4 7 4 94 4 42 4 3 5 5 4 4 4 3 4 6 4 6 dv1mm, fM1amic0 fM1am ic 5 0 dynamic.50 guided 10 guided 50 1*w_g,uided 10 gnideV1.10 gnideV1.50 1 圻 137 i 磯_ guided,10 t 磯_ guideV1 50 1W_ guide & 5 06 3在舊 M刀片上的測(cè)試結(jié)果 表 9 Matrix Mu1tip1icati on 在 1EM刀片上的
9、測(cè)試 結(jié)果(單位:秒) 劉于每一個(gè)循環(huán)結(jié)構(gòu),我們均采用 和曙光服 務(wù)器相同的調(diào)度策略進(jìn)行了測(cè)試測(cè)試過(guò)程中,采用了 1 至 4個(gè)線程,測(cè)試結(jié)果分別如表 6表 9 所示。表 6 Mande1brot 州發(fā)策略 112 03 8 sta1k:,10 dvnamif 1 0 1 2 0 3 5 1 2 0 4 0 1 2 0 3 7120 33 120 37 120 34 120 36 線程數(shù) 2 6 00 0 5 9 9 94 9 9 9 6 0 7 2 6 0 1 2 6 0 7 2 6 0 7 6 6 0 7 2 3 4 0 5 3 4 0 5 7 4 0 5 8 4 0 5 7 4 0 6 2
10、 4 0 5 3 4 0 53 4 0 8 9 4 3 0 4 9 30 ”30 3 6 Set 在 IEM刀片上的測(cè)試結(jié)果 單位:秒)dvtmmiV:50 3 0 撕 3 0粥 3 1 12 州艘策略 12087 sta1ic,10 dvtmmiV.10dvtmmiV.50 2103】207972079220794207 94 208 58 20865 2 線程數(shù) 3169 35 7027 69 36 6 9 4 2 1 4 9 5 4 1 4 9 4 4 1 1 3 6 6 1 1 3 74 4 1 3 3 3 3 5 2 6 3 5 2 0 4 5 2 0 4 gnided.10 gni
11、ded.50 1512】1 0 5 2 3 1 0 4.0 4 1 0 4 0 5 1 5 n96 15n 9 2 3 3 2 4 1 3 32 3 t磯 _gui(1e &10 t 磯guide & 50 3 0 4 9 3 1 0 76.4 實(shí)驗(yàn)結(jié)果分析 從表 2表 9 可以看 m,不同的凋度策略和chunksize參數(shù)在曙光服務(wù)器和 IEM刀片上對(duì)性 能的影響基本相同對(duì)于四個(gè)測(cè)試程序,默認(rèn)的 gnidefL10 1fn771fn969 2 4 69 2 5 3 guided,50 nen guide &10 nen guided,50一種改進(jìn)的 O嚴(yán) nMP Gu
12、ided 調(diào)度策略研究 static調(diào)度性能都 是最差的。對(duì)于dynamic、guided和 new guided 凋度,chunksize參數(shù)對(duì)調(diào) 度性能的影響比較小。 MS 程序是一個(gè)不規(guī)則的循 環(huán)結(jié)構(gòu)。從表 2和表 6 可以看出dynamic調(diào)度和(static,1 0)進(jìn)行一次凋度的開(kāi)銷往往并不相同,編譯器在為 線程分配迭代塊時(shí),一股首 先鎖住所有線程共享的任務(wù)隊(duì)列,然后在臨界區(qū)(criticalsecti on)計(jì)算需要分配的迭代塊大小,并更新任務(wù)隊(duì)列,最 后解鎖dynami c調(diào)度采用的是 OpenMP制導(dǎo)訂調(diào)度可以獲得較好的性能,其次是 newguided調(diào)度策略如圖 3 所示,
13、 MS 程序的迭代可以分 為前面、中間和后 面三個(gè)部分。其中,在前面部 分和后面部分的迭代中,每次迭代的計(jì)算量都很 小,而中間部分的迭代的計(jì)算量都特別大對(duì)于 這樣的循環(huán)結(jié)構(gòu),guided和 默認(rèn)的 static調(diào)度都 會(huì)導(dǎo)致獲得中問(wèn)那部分迭代的線程 T作量非常 句中的 chunksize參數(shù)來(lái)直接指定迭代塊大小,而guided凋度則需要在每次調(diào)度時(shí)計(jì)算迭代塊 大小。也就是說(shuō)dynamic調(diào)度對(duì)應(yīng)的臨界區(qū)代 碼 量少于 guided調(diào)度的臨界區(qū)代碼量。例如在OMPi 編譯中,dynamic調(diào)度對(duì)應(yīng)的臨界區(qū)代碼為 2 行,而 guided調(diào)度對(duì)應(yīng)的臨界區(qū)代碼為 8 行兇此,執(zhí)行一次 dynamic
14、調(diào)度的開(kāi)銷要少于執(zhí)行一次 guided調(diào)度的開(kāi)銷。但是,guided調(diào)度每次 分配的迭代塊多于 dynamic,斟此,對(duì)于同一個(gè)程序,采用 guided 策略的調(diào)度次數(shù)要少于策略 對(duì)于表 1中 的例子,采用dynamic策略需要進(jìn)行 20 次調(diào)度,而采用 guided策 略只需要 10 次調(diào)度。 如果綜合考慮一次調(diào)度的額外開(kāi)銷和調(diào)度次數(shù),dynamic 凋度和 guided 的總額外開(kāi)銷近乎相似。從表 3、表 5、表 7、表 9中的測(cè)試結(jié)果可以看出, 對(duì)遞增結(jié)構(gòu)的 CP程序和規(guī)則的 MM 程序采用dynamic、guided和 new guided調(diào)度時(shí)的性能差不多。大,而其它線程的 1 作量
15、非常小,從而導(dǎo)致嚴(yán)重 的負(fù)載不半衡。dynamic調(diào)度和 (static,1 0)調(diào)度會(huì)將計(jì)算量大的迭代和計(jì)算量小的迭代均勻 地分配 給各個(gè)線程,兇此可以獲得較好的調(diào)度性 能。這兩個(gè)凋度策略的區(qū)別在于(st atic,10)在進(jìn)入循環(huán)前就將所有迭代分配完畢,而 dynamic調(diào)度則是在一個(gè)線程執(zhí)行完當(dāng)前迭代塊后冉給 它分配下一個(gè)迭代塊。 論文8的研 究指出:如果計(jì)算負(fù)載是隨迭 代變量增大而減小的,則應(yīng)避免使用指數(shù)調(diào)度,兇為它的前幾個(gè)子塊大小都很大,可能導(dǎo)致負(fù)載不均衡?!睆谋?8的測(cè)試結(jié)果可以看 m,遞減結(jié)構(gòu)的 AC 程序采用(static,10)、dynamic 和 ne w guided 調(diào)
16、度時(shí)能夠獲得最佳性能,而采用guided調(diào)度策略時(shí)性能較差。這一點(diǎn)與論文8】 的結(jié)論一致、對(duì)于遞減循環(huán)結(jié)構(gòu),計(jì)算負(fù)載隨著 迭 代變量增大而減小,而 guided策略劃分的迭代 塊大小也是由大變小,且呈 指數(shù)下降兇此,對(duì) 于遞減循環(huán)結(jié)構(gòu)采用 guided 調(diào)度會(huì)導(dǎo)致前面的 迭代塊計(jì) 算量非常大,而后面的迭代塊計(jì)算量非 常小,從而引起負(fù)載不半衡、在曙光服務(wù) 器上.當(dāng)線程數(shù)大于 3時(shí),隨著線程數(shù)的增加,AC 程 序的執(zhí)行時(shí)間沒(méi)有繼續(xù)減 少、這是丨_【于 AC 程序 訪問(wèn)存儲(chǔ)單元時(shí)具有一定的不規(guī)則性,當(dāng)線程進(jìn) 一 步增多時(shí),存儲(chǔ)訪問(wèn)的局部件被破壞了 論文8采用調(diào)度次數(shù)來(lái)衡量?jī)凑{(diào)度產(chǎn) 生的額外開(kāi)銷,認(rèn)為
17、對(duì)遞增結(jié)構(gòu)的循環(huán),應(yīng)避免使 綜合表 2表 9 的測(cè)試結(jié)果可以看出,在 OpenMP 程序中采用 dynamic策略和(static,10)策略的調(diào)度性能比較好。new guided策略劉 guided策略 進(jìn)行了改進(jìn),調(diào)度性能介于 guided和dynamic之間、由于 static調(diào)度在編譯期就決定了各個(gè)處理器的迭代塊大小,兇此無(wú)法根據(jù)程序運(yùn) 行時(shí) 處理器的負(fù)載動(dòng)態(tài)調(diào)整此外,當(dāng)調(diào)度非規(guī) 則循環(huán)結(jié)構(gòu)或者處理器件能不一致時(shí),static 調(diào)度很容易 m 現(xiàn)負(fù)載不半衡。如在表 3、表 4、表 5 中,(static,l 0)策略的調(diào)度性能就比 dynamic和 guided策略的凋度性能差。綜合前
18、面的分析, 我們可以認(rèn)為,在大部分的情況下dynamic 策略都能獲得最好的調(diào)度性能。7 總結(jié)及以后的工作隨著多核處理器的問(wèn)世,多 線程程序設(shè)計(jì)已 經(jīng)成為一個(gè)不可回避的問(wèn)題。在采用 OpenMP編用靜態(tài)調(diào)度策略和分塊大小較大的動(dòng)態(tài)凋度策 略、”但是,在實(shí)際的編譯器中,不同調(diào)度策略一種改進(jìn)的 O嚴(yán) nMP Guided 調(diào)度策略研究 程時(shí),調(diào)度策略和參數(shù)的 選擇列于一個(gè)OpenMP 程序的性能具有一定的影響,但選擇恰當(dāng)?shù)恼{(diào)度策略和參數(shù)往往跟具體的運(yùn)行環(huán)境和循環(huán)結(jié)構(gòu)有關(guān)?,F(xiàn)有的研究 I作(如文獻(xiàn)1和8)都表明, 對(duì)于遞減型的循環(huán)結(jié)構(gòu),采用 guided調(diào)度策略 時(shí)存在嚴(yán)重的負(fù)載不均衡問(wèn)題。本文借鑒
19、論文7】的 ix閌度策略,對(duì)循環(huán)結(jié)構(gòu)的前5 0%的迭代采用static閱度, 后面50%的迭代采用guided調(diào)度, 從而改進(jìn)了OpenMP標(biāo)準(zhǔn)所指定的 guided調(diào)度策略。此外,針對(duì)不同的循環(huán)結(jié)構(gòu),我們?cè)诓煌?多核處理器上對(duì)不同的調(diào)度策略進(jìn)行測(cè)試和 分析。本文的進(jìn)一步 I 作可以研究 d 調(diào)度策略在機(jī) 群 OpenMP系統(tǒng)中的應(yīng) 用、 9 876 Clusters Proceedings on of the 2001 IEEE International Confere nce Cluster Cmnputing,2001 Shih,Chao T ungTseng on Wen Chun
20、g Shian Shyong Sch eduling Proceedings Parallel and Yang,P ing I ParallelPC Chen, LoopAHyhrid Sch eme of HeterogeneousInternational ClustersontheSixthConference Distribute d Computing Applications and Technologi es.2 0 0 5 Chao TungYang.Shun Chyi 017 Ch ang AParallel Loop PC and Self Scheduli ng Cln
21、sters Extremelyof Heterogeneous Science Jo/iTnal Inforrnaton Engineering,2004,20 (2),pp:263 273 Shaineem Akhter.Jason Roberts多核程 J設(shè)計(jì)技術(shù) pp:李寶峰等譯北 京電子 T 業(yè)出版社,2007 1 4 7 -1 5 1 VVDimakopoulos.E Leontiadis and GTzounlas.A portabl e C compiler for OpenMP V 2 0 of the 5th Eur opeanIn:Proceedings Workshop on OpenM P.Aachen. Germany,2003,pp:5 1 110賴建新胡長(zhǎng)軍等 OpenMP任務(wù)調(diào)度開(kāi)銷及負(fù)載均 衡分析計(jì)算機(jī) T程.200
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 深圳股權(quán)轉(zhuǎn)讓合同(2025年版)4篇
- 商場(chǎng)LED顯示屏租賃合同(二零二五年)
- 二零二五年度國(guó)際法學(xué)與留學(xué)項(xiàng)目合同3篇
- 2025年度個(gè)人一手房買賣合同環(huán)保標(biāo)準(zhǔn)范本4篇
- 2025版戶外休閑場(chǎng)所草皮采購(gòu)與租賃合同3篇
- 2025年智能家居系統(tǒng)產(chǎn)品銷售激勵(lì)協(xié)議書2篇
- 2025版團(tuán)購(gòu)樓房指標(biāo)轉(zhuǎn)讓與房地產(chǎn)咨詢代理合同3篇
- 2025版智能防蚊紗窗研發(fā)與銷售合作協(xié)議3篇
- 2025年度個(gè)人投資分紅收據(jù)模板制作服務(wù)協(xié)議4篇
- 2025年度互聯(lián)網(wǎng)金融服務(wù)提供商合作協(xié)議范本4篇
- 骨髓穿刺課件
- 鄉(xiāng)村治理中正式制度與非正式制度的關(guān)系解析
- 2024版義務(wù)教育小學(xué)數(shù)學(xué)課程標(biāo)準(zhǔn)
- 智能護(hù)理:人工智能助力的醫(yī)療創(chuàng)新
- 國(guó)家中小學(xué)智慧教育平臺(tái)培訓(xùn)專題講座
- 5G+教育5G技術(shù)在智慧校園教育專網(wǎng)系統(tǒng)的應(yīng)用
- VI設(shè)計(jì)輔助圖形設(shè)計(jì)
- 淺談小學(xué)勞動(dòng)教育的開(kāi)展與探究 論文
- 2023年全國(guó)4月高等教育自學(xué)考試管理學(xué)原理00054試題及答案新編
- 河北省大學(xué)生調(diào)研河北社會(huì)調(diào)查活動(dòng)項(xiàng)目申請(qǐng)書
- JJG 921-2021環(huán)境振動(dòng)分析儀
評(píng)論
0/150
提交評(píng)論