南開大學(xué)20秋《并行程序設(shè)計(jì)》在線作業(yè)-1(參考答案)_第1頁
南開大學(xué)20秋《并行程序設(shè)計(jì)》在線作業(yè)-1(參考答案)_第2頁
南開大學(xué)20秋《并行程序設(shè)計(jì)》在線作業(yè)-1(參考答案)_第3頁
南開大學(xué)20秋《并行程序設(shè)計(jì)》在線作業(yè)-1(參考答案)_第4頁
南開大學(xué)20秋《并行程序設(shè)計(jì)》在線作業(yè)-1(參考答案)_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1.SSE指令移動單精度浮點(diǎn)數(shù),不能實(shí)現(xiàn)()。A.將64位數(shù)據(jù)移動到SSE寄存器高位B.將64位數(shù)據(jù)移動到SSE寄存器低位C.將32位數(shù)據(jù)移動到SSE寄存器指定位置D.在兩個(gè)SSE寄存器高/低64位間移動答案:C.以下超級計(jì)算機(jī)中,()不是SIMD架構(gòu)。A.CDCSTAR-100B.757C.銀河D.天河1號答案:D.下列指令集中()不是SIMD指令集。A.SSEB.NeonC.AVXD.EMT64答案:D4.SSE寄存器A和B中元素分別為A1A2A3A4和B1B2B3B4(均為由低到高),則執(zhí)行C=blend(A,B,0x05)后,C中元素為()。A.A1A2B3B4B.B1B2A3A4C.A1B2A3B4D.B1A2B3A4答案:D5.以下哪條不是推動并行計(jì)算發(fā)展的因素?()A.存儲是系統(tǒng)瓶頸B.單CPU發(fā)展已能滿足應(yīng)用需求C.利用標(biāo)準(zhǔn)硬件構(gòu)造并行機(jī)令升級容易D.編程環(huán)境標(biāo)準(zhǔn)化逐步發(fā)展答案:B6.在使用互斥量之前必須對其進(jìn)行()。A.初始化B.加鎖C.解鎖D.銷毀答案:A.全球500強(qiáng)超算在CPU、網(wǎng)絡(luò)等硬件上越來越體現(xiàn)出采用()的趨勢。A.特殊硬件.通用硬件C.非公開硬件D.廉價(jià)硬件答案:B8.有大量分支指令的程序不適合下面哪種體系結(jié)構(gòu)上進(jìn)行并行化?()A.SISDB.SIMDC.SPMDD.MIMD答案:B.Pthread不支持()。A.創(chuàng)建并發(fā)執(zhí)行線程B.同步C.非顯式通信D.自動并行化答案:D10.在超市的顧客購買商品記錄中統(tǒng)計(jì)一些商品組合的購買頻率,將購買頻率(商品組合)劃分給不同進(jìn)程,這是一種劃分()的數(shù)據(jù)并行策略。A.輸入數(shù)據(jù)B.中間結(jié)果C.輸出數(shù)據(jù)D.臨時(shí)數(shù)據(jù)答案:C11.當(dāng)處理器數(shù)量不變時(shí),隨著問題規(guī)模增大,加速比()。A.所有算法都增大B.所有算法都減小C.代價(jià)最優(yōu)算法都增大D.代價(jià)最優(yōu)算法都減小答案:C12.兩個(gè)矩陣相乘,若矩陣總規(guī)模小于cache大小,則優(yōu)化訪存的最佳方法是()。A.先將兩個(gè)矩陣讀入cache再進(jìn)行乘法B.先轉(zhuǎn)置第一個(gè)矩陣再進(jìn)行乘法C.先轉(zhuǎn)置第二個(gè)矩陣再進(jìn)行乘法D.以上皆錯(cuò)答案:A13.關(guān)于消息傳遞編程的特點(diǎn),以下說法正確的是()。A.與共享內(nèi)存一樣有競爭條件B.編程簡單C.需程序員考慮局部性D.無需考慮進(jìn)程間通信答案:C14.編譯器編譯OpenMP并行循環(huán)時(shí),會自動生成一些代碼,其中不包括()。A.創(chuàng)建和管理線程代碼B.循環(huán)劃分給線程的代碼C.找出數(shù)據(jù)依賴的代碼D.線程同步的代碼答案:C15.n個(gè)數(shù)求和的問題,使用n個(gè)處理器的并行算法達(dá)到了logn的運(yùn)行時(shí)間,則算法()。A.肯定不是代價(jià)最優(yōu)B.肯定是代價(jià)最優(yōu)C.不確定是否代價(jià)最優(yōu)D.以上皆錯(cuò)答案:A16.任務(wù)依賴圖中權(quán)重之和最長的路徑稱為()。A.最大任務(wù)B.關(guān)鍵路徑C.平均并發(fā)度D.最短路徑答案:B17.將起泡排序程序改寫為奇偶轉(zhuǎn)置排序,關(guān)于其兩層循環(huán)是否存在數(shù)據(jù)依賴,下面說法正確的是()。A.外層存在,內(nèi)層不存在B.外層不存在,內(nèi)層存在C.兩層都不存在D.兩層都存在答案:A18.在下面問題中,SIMD并行最不適合()。A.向量加法B.向量中元素排序C.矩陣向量乘法D.矩陣加法答案:B19.OpenMP編譯指示是以()開頭的。A.“#include”B.“#ifdef”C.“#pragam”D.“#else”答案:C20.一個(gè)SSE寄存器可容納()個(gè)短整型數(shù)。A.2B.4C.8D.16答案:C21.當(dāng)前并行軟件面臨的主要挑戰(zhàn)不包括()。A.能耗B.伸縮性C.研發(fā)周期D.可靠性答案:C22.創(chuàng)建線程時(shí),我們通過()將線程號分別傳遞給每個(gè)線程。A.全局變量B.局部變量C.動態(tài)分配變量D.pthread_create的“線程函數(shù)參數(shù)”參數(shù)答案:D23.利用cacheline一次讀取多個(gè)數(shù)據(jù)字的機(jī)制優(yōu)化程序訪存性能,其機(jī)理是()。A.降低了訪存延遲B.隱藏了訪存延遲C.利用了cache空間局部性D.利用了cache時(shí)間局部性答案:C24.R*=1.3;G+=1.8;B+=1.2;X*=1.1,此程序片段可進(jìn)行SIMD并行化嗎?()A.不可以B.可以C.不確定D.以上皆錯(cuò)答案:A25.SSEintrinsics_mm_loadu_ps命令的功能是()。A.對齊向量讀取單精度浮點(diǎn)數(shù)B.未對齊向量讀取單精度浮點(diǎn)數(shù)C.對齊向量讀取雙精度浮點(diǎn)數(shù)D.未對齊向量讀取雙精度浮點(diǎn)數(shù)答案:B26.互斥量是一種()同步機(jī)制。A.一元狀態(tài)B.二元狀態(tài)C.多元狀態(tài)D.以上皆錯(cuò)答案:C.AVX是()平臺的SIMD架構(gòu)。A.x86B.POWERC.SPARCD.ARM答案:A.除了用于解決競爭條件外,互斥量還可用于()。A.解決共享資源競爭的問題B.解決并發(fā)度低的問題C.解決通信開銷大的問題D.解決負(fù)載不均的問題答案:A29.在分布式內(nèi)存架構(gòu)編程中,進(jìn)程間不能()。A.進(jìn)行通信B.進(jìn)行同步C.發(fā)送和接收消息D.通過讀寫變量交換數(shù)據(jù)答案:D30.關(guān)于OpenMP循環(huán)并行程序的編寫,下列說法中不正確的是()。A.程序員無需編寫線程創(chuàng)建和管理代碼B.程序員無需編寫循環(huán)劃分代碼C.程序員需指出哪個(gè)循環(huán)應(yīng)并行D.程序員需編寫線程同步代碼答案:D31.限制CPU內(nèi)流水線深度的因素包括()。A.指令復(fù)雜程度B.分支預(yù)測性能C.CPU核心數(shù)D.CPUcache大小答案:B32.SSE數(shù)據(jù)移動指令分類不包括()。A.對齊傳輸B.未對齊傳輸C.標(biāo)量傳輸D.緩存?zhèn)鬏敶鸢福篋.將t個(gè)線程的局部結(jié)果匯總,可采用遞歸分解并行進(jìn)行,即,兩兩匯總,中間結(jié)果繼續(xù)兩兩匯總,直到剩下唯一的最終結(jié)果,其時(shí)間復(fù)雜度為()。A.。⑴B.O(logt)C.O(t)D.O(tlogt)答案:B.一個(gè)SSE寄存器可容納()個(gè)雙精度浮點(diǎn)數(shù)。A.2B.4C.8D.16答案:A35.對這樣的循環(huán)for(i=0;i<100;i+=1)A[i+0]=A[i+0]+B[i+0];進(jìn)行向量化,基本技術(shù)手段是()。A.循環(huán)劃分B.循環(huán)消除C.循環(huán)展開D.以上皆錯(cuò)答案:C36.在128位的SIMD寄存器中,我們不能保存()。A.16個(gè)8位整數(shù)B.8個(gè)16位短整型C.4個(gè)32位整型D.16個(gè)字符的字符串答案:D.floata[64];for(i=0;i<60;i+=4)Va=a[i+2:i+5];系統(tǒng)向量化訪存是按16字節(jié)對齊的,則此向量化程序每個(gè)循環(huán)步產(chǎn)生()個(gè)內(nèi)存訪問操作。A.1B.2C.3D.4答案:B.兩個(gè)n*n的矩陣相乘,將所有Z2個(gè)乘法計(jì)算劃分給不同進(jìn)程,再將對應(yīng)某行某列的n個(gè)乘法結(jié)果累加得到結(jié)果矩陣對應(yīng)元素,這是一種劃分的數(shù)據(jù)并行。A.輸入數(shù)據(jù)B.中間結(jié)果C.輸出數(shù)據(jù)D.臨時(shí)數(shù)據(jù)答案:B39.忙等待方法解決競爭條件的思路是()。A.令CPU一直處于忙碌狀態(tài)無法產(chǎn)生競爭條件B.令存在數(shù)據(jù)依賴的內(nèi)存操作充分并行C.強(qiáng)制多線程進(jìn)入臨界區(qū)的順序來將存在數(shù)據(jù)依賴內(nèi)存操作串行化D.以上皆錯(cuò)答案:C40.SSE的blend指令的8位二進(jìn)制整數(shù)參數(shù)被用做8個(gè)掩碼imm8[0:7],若imm8[j]=0則表示()。A.將第一個(gè)源寄存器的第j個(gè)元素放在目標(biāo)寄存器位置0B.將第二個(gè)源寄存器的第j個(gè)元素放在目標(biāo)寄存器位置0C.將第一個(gè)源寄存器的第j個(gè)元素放在目標(biāo)寄存器位置jD.將第二個(gè)源寄存器的第j個(gè)元素放在目標(biāo)寄存器位置j答案:C.CUDA線程層次中不包括()。A.KernelB.GridC.BlockD.Thread答案:A.將寄存器設(shè)置為4個(gè)單精度浮點(diǎn)數(shù)0.0的SSEintrinsics指令是()。A._mm_set_psB._mm_set1_ssC._mm_setzero_ssD._mm_setzero_ps答案:D.floata[64];for(i=0;i<64;i+=4)Va=a[i:i+3];此向量化程序內(nèi)存訪問完全對齊,每個(gè)循環(huán)步恰好是一次對齊的內(nèi)存訪問,則該系統(tǒng)向量化訪存是按()字節(jié)對齊。A.8B.16C.32D.64答案:B.對單精度浮點(diǎn)計(jì)算,AVX最高實(shí)現(xiàn)()路并行。A.2B.4C.8D.16答案:C.MPI默認(rèn)點(diǎn)對點(diǎn)通信模式是()。A.阻塞的B.非阻塞的C.對等的D.主從的答案:A.以下()是MPI基本原語。A.MPI_barrierB.MPI_Comm_numprocsC.MPI_Comm_rankD.MPI_Comm_Send答案:C.在SSEintrinsics程序中雙精度浮點(diǎn)數(shù)數(shù)據(jù)類型是()。A._m128B._m128fC._m128dD._m128i答案:C.在對互斥量進(jìn)行解鎖時(shí),還會執(zhí)行()操作。A.互斥量初始化B.互斥量銷毀C.喚醒阻塞線程D.以上皆

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論