




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
圖形處理單元3D引擎的關(guān)鍵模塊01簡介片段測試單元虛擬仿真與原型驗(yàn)證清除和累積操作單元混合和邏輯操作單元目錄03050204基本信息圖形處理單元是指3D引擎的關(guān)鍵模塊。本模塊處理的命令可分為配置信息命令、堆棧操作命令、清除緩沖區(qū)命令、累積緩沖區(qū)命令、片段數(shù)據(jù)和非本單元使用的命令6種。所以將本模塊劃分成6個(gè)部分來實(shí)現(xiàn),如“CAC模塊”所示。命令解析部分負(fù)責(zé)命令的初步解析和分派,配置信息部分負(fù)責(zé)配置信息命令的解析和保存,堆棧操作部分負(fù)責(zé)堆棧操作命令的解析和參數(shù)的存取,清除部分負(fù)責(zé)清除緩沖區(qū)命令的解析和清除處理,累積部分負(fù)責(zé)累積緩沖區(qū)命令的解析和累積操作,讀數(shù)據(jù)部分負(fù)責(zé)本模塊和后續(xù)模塊所需目標(biāo)信息的讀取,發(fā)送部分負(fù)責(zé)發(fā)送處理好的數(shù)據(jù)和非本單元處理的命令。簡介簡介在多元化應(yīng)用需求的推動下,半導(dǎo)體制造工藝水平飛速發(fā)展,計(jì)算機(jī)系統(tǒng)的功能和性能極大地豐富和提高。圖形處理器(GraphicProcessingUnit,GPU)作為計(jì)算機(jī)顯示系統(tǒng)的核心,具有強(qiáng)大的數(shù)據(jù)計(jì)算能力,以硬件加速器的形式實(shí)現(xiàn)了二維/三維(TwoDimension/ThreeDimension,2D/3D)圖形處理、圖像處理和顯示控制等功能,將通用CPU從復(fù)雜的圖形算法和繪制中解放出來,已經(jīng)成為幾乎所有類型計(jì)算機(jī)系統(tǒng)的標(biāo)準(zhǔn)配置。片段處理單元(FragmentOperationUnit,F(xiàn)OU)是GPU3D引擎的關(guān)鍵模塊,處于3D圖形流水線的末端,承擔(dān)著合并和輸出圖形的任務(wù)。更為重要的是,F(xiàn)OU決定了實(shí)現(xiàn)3D圖形特殊顯示效果的能力,例如,圖形的透明效果、抗鋸齒處理、布告板技術(shù)、景深效果、運(yùn)動模糊等技術(shù)均需要FOU的支持。在高端GPU中,集成FOU的數(shù)量越來越多,并以陣列方式加速對海量圖元片段的處理??梢?,F(xiàn)OU是GPU中不可或缺的關(guān)鍵模塊,具有重要的研究價(jià)值和實(shí)用意義
。清除和累積操作單元清除和累積操作單元本模塊處理的命令可分為配置信息命令、堆棧操作命令、清除緩沖區(qū)命令、累積緩沖區(qū)命令、片段數(shù)據(jù)和非本單元使用的命令6種。所以將本模塊劃分成6個(gè)部分來實(shí)現(xiàn),如“CAC模塊”所示。命令解析部分負(fù)責(zé)命令的初步解析和分派,配置信息部分負(fù)責(zé)配置信息命令的解析和保存,堆棧操作部分負(fù)責(zé)堆棧操作命令的解析和參數(shù)的存取,清除部分負(fù)責(zé)清除緩沖區(qū)命令的解析和清除處理,累積部分負(fù)責(zé)累積緩沖區(qū)命令的解析和累積操作,讀數(shù)據(jù)部分負(fù)責(zé)本模塊和后續(xù)模塊所需目標(biāo)信息的讀取,發(fā)送部分負(fù)責(zé)發(fā)送處理好的數(shù)據(jù)和非本單元處理的命令。配置信息命令由命令解析電路發(fā)送到配置信息部分,配置信息電路對相應(yīng)的參數(shù)解析并將信息保存到配置寄存器中供其他操作使用;堆棧操作命令由命令解析電路發(fā)送到堆棧操作部分,堆棧操作電路接收到堆棧操作命令后,會進(jìn)行配置信息的保存(壓棧)或讀取(出棧);清除操作命令由命令解析電路發(fā)送到清除部分,由清除操作電路產(chǎn)生寫緩沖區(qū)的坐標(biāo)和數(shù)據(jù),并將數(shù)據(jù)發(fā)送出去;累積操作命令由命令解析電路發(fā)送到累積操作部分,由累積操作電路產(chǎn)生新的坐標(biāo)和數(shù)據(jù),并將數(shù)據(jù)發(fā)送出去;當(dāng)命令解析部分接收到片段數(shù)據(jù)時(shí),若后續(xù)模塊的處理需要目標(biāo)片段值,則發(fā)送到讀數(shù)據(jù)部分讀取目標(biāo)片段,否則將命令直接發(fā)送;不是本單元所需的命令將其直接發(fā)送出去。以上所有的數(shù)據(jù)和命令最終都由發(fā)送部分傳送到下一級流水線單元
。片段測試單元片段測試單元本單元將接收到的命令分流成兩部分,一部分進(jìn)行配置信息相關(guān)的操作,另一部分進(jìn)行測試處理。這兩部分?jǐn)?shù)據(jù)最終都將會以命令的形式發(fā)送出去。另外,在參數(shù)配置的過程中會出現(xiàn)對配置信息的堆棧操作。將片段測試的處理劃分為輸入選擇、配置參數(shù)、片上存儲、測試處理和輸出控制5個(gè)功能模塊。輸入選擇模塊負(fù)責(zé)對收到命令的初步譯碼,把命令分流成兩路,一路進(jìn)行片段測試處理,另一路進(jìn)行參數(shù)配置。同時(shí),為了確保命令的順序執(zhí)行,當(dāng)且僅當(dāng)后續(xù)各模塊都空閑時(shí)本模塊才會接收新的命令。配置參數(shù)模塊會對接收到的命令進(jìn)行進(jìn)一步的解析,進(jìn)行兩方面的處理。一方面提取命令中攜帶的配置信息保存到配置參數(shù)寄存器中;另一方面當(dāng)接收到壓棧命令時(shí),將相應(yīng)配置參數(shù)寄存器中的配置信息存儲到片上存儲中,當(dāng)接收到出棧命令時(shí),讀取片上存儲中的數(shù)據(jù),更新配置參數(shù)寄存器。測試處理模塊會根據(jù)配置參數(shù)設(shè)置的處理環(huán)境對輸入的圖形片段進(jìn)行測試,并將測試結(jié)果與輸入信息同時(shí)發(fā)送到輸出控制模塊。本模塊會對片段進(jìn)行裁剪測試、alpha測試、深度測試和模板測試,另外在使用模板測試時(shí),會根據(jù)模板測試和深度測試的結(jié)果更新模板緩沖區(qū)中對應(yīng)位置的模板值。經(jīng)過分流處理的兩路命令在輸出控制模塊選擇輸出?;旌虾瓦壿嫴僮鲉卧旌虾瓦壿嫴僮鲉卧灸K中的混合操作是對源片段的顏色和目標(biāo)片段的顏色進(jìn)行算數(shù)運(yùn)算得到最終顏色。首先需要運(yùn)用乘法運(yùn)算采用混合因子對顏色成分進(jìn)行縮放,然后再將源成分和目標(biāo)成分進(jìn)行混合。為了提高電路的處理速度,將乘法運(yùn)算和混合分步處理,采用流水的方式實(shí)現(xiàn),首先進(jìn)行乘法運(yùn)算(混合1),然后進(jìn)行混合運(yùn)算(混合2)。由于邏輯操作和屏蔽緩沖區(qū)的實(shí)現(xiàn)均是一些邏輯運(yùn)算,可以采用組合電路實(shí)現(xiàn),在數(shù)據(jù)輸出控制部分完成。據(jù)此,將BDLM單元的設(shè)計(jì)劃分為5個(gè)單獨(dú)的模塊,分別是命令解析模塊、RAM模塊、混合1模塊、混合2模塊和輸出控制模塊。其中混合1模塊和混合2模塊分步實(shí)現(xiàn)混合操作的功能。各模塊之間的連接關(guān)系和本單元總體結(jié)構(gòu)“BDLM模塊”。命令解析模塊提取并保存命令中的配置信息,并在接收到堆棧操作命令時(shí)對配置信息進(jìn)行保存和更新。當(dāng)接收到需要處理的片段信息時(shí),將配置信息和片段信息同時(shí)發(fā)送到相應(yīng)的處理電路。圖形片段數(shù)據(jù)依次經(jīng)過混合1和混合2電路的處理完成混合操作。首先完成混合操作中的乘法運(yùn)算,根據(jù)混合方式將源片段和目標(biāo)像素分別乘以對應(yīng)的混合因子,得出新的顏色值。然后根據(jù)混合方式將新的源片段和目標(biāo)像素的顏色值進(jìn)行加、減、取最大值或最小值,得到新的源片段值?;旌喜僮骱笮律傻钠沃翟谳敵隹刂颇K完成邏輯操作和屏蔽處理。至此,所有的數(shù)據(jù)處理完畢,生成的像素、深度和模板值即為最終要寫入幀緩存的數(shù)據(jù)。片段處理單元寫入幀緩存的數(shù)據(jù)寬度是128b,而處理產(chǎn)生的數(shù)據(jù)寬度是32b,所以對幀緩存的一次寫操作能夠裝載4個(gè)數(shù)據(jù)。虛擬仿真與原型驗(yàn)證虛擬仿真與原型驗(yàn)證一方面,構(gòu)建了虛擬仿真平臺,并采用CadenceNCVerilog仿真工具進(jìn)行功能驗(yàn)證,將輸出結(jié)果保存成圖片。另一方面,基于XilinxVertex6XC6VLX760FPGA構(gòu)件原型系統(tǒng),并對FOU進(jìn)行原型驗(yàn)證。采用XilinxISE工具對設(shè)計(jì)進(jìn)行綜合,F(xiàn)OU的工作頻率達(dá)到180MHz。另外,為了評估ASIC實(shí)現(xiàn)時(shí)的性能,基于SMIC65nmCMOS工藝下,采用SynopsysDesign-Compiler對設(shè)計(jì)進(jìn)行綜合,電路工作頻率達(dá)到300MHz,大于GPU芯片工作頻率270MHz的設(shè)計(jì)要求,能夠滿足應(yīng)用需求。為了能全面地對FOU的功能進(jìn)行驗(yàn)證,將FPGA原型驗(yàn)證結(jié)果與虛擬仿真平臺輸出的結(jié)果和在Windows下用MicrosoftVisualStudio2008軟件運(yùn)行OpenGL函數(shù)編寫的C++程序所得的圖形進(jìn)行對比。在清除緩沖區(qū)的測試中將顏色緩沖區(qū)的清除值設(shè)置為灰色(0.5,0.5,0.5,0.5),則整個(gè)屏幕顯示為灰色。累積操作首先采用GL_ACCUM累積模式,value值設(shè)置為3.5,對圖形進(jìn)行操作,然后采用GL_RETURN操作模式,value值設(shè)置為1.0,將累積操作的結(jié)果返回到顏色緩沖區(qū)進(jìn)行顯示。不同像素顏色成分經(jīng)過累積操作之后使圖形顯示不同的層次,這就是圖形景深效果的基本原理。將裁剪框設(shè)置為圖中白色部分,繪制三角形和矩形框,使三角形全部落在裁剪框之中,矩形框全部落在裁剪框之外。經(jīng)過裁剪測試后只有三角形顯示出來。alpha
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度供暖供氣設(shè)施施工安全協(xié)議
- 二零二五年度鋼材現(xiàn)貨交易居間服務(wù)協(xié)議
- 2025年度電子商務(wù)合伙拆伙協(xié)議終止協(xié)議
- 2025年度離職解除勞動合同模板:傳媒廣告行業(yè)員工離職流程
- 會計(jì)財(cái)務(wù)審計(jì)作業(yè)指導(dǎo)書
- 公司股權(quán)購買協(xié)議詳細(xì)版
- 金融服務(wù)個(gè)人風(fēng)險(xiǎn)免責(zé)聲明
- 《數(shù)學(xué)思維訓(xùn)練課程:數(shù)形結(jié)合學(xué)習(xí)指導(dǎo)》
- 肉類銷售代理合同
- 關(guān)于項(xiàng)目進(jìn)度管理的解決方案
- 2021年劍橋國際少兒英語KidsBox2文本
- 金蝶云星辰初級考試題庫
- GM/T 0107-2021智能IC卡密鑰管理系統(tǒng)基本技術(shù)要求
- GB/T 6967-2009工程結(jié)構(gòu)用中、高強(qiáng)度不銹鋼鑄件
- 部編版七年級下冊語文第一單元課件
- 2023年山東省青島市統(tǒng)招專升本管理學(xué)自考真題(含答案)
- 文化產(chǎn)業(yè)政策與法規(guī)課件
- 人教版八年級下冊生物全冊教案完整版教學(xué)設(shè)計(jì)含教學(xué)反思
- 無人機(jī)警用方向應(yīng)用簡介課件
- 《思想道德修養(yǎng)與法律基礎(chǔ)》說課(獲獎版)課件
- 幼兒園中班居家安全教案
評論
0/150
提交評論