



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
【W(wǎng)ord版本下載可任意編輯】網(wǎng)絡的嵌入式IP可視電話設計方案(3)使用軟件流水。
在編譯時,使用-o2選項和-o3選項,編譯器可對循環(huán)代碼實現(xiàn)軟件流水。為填滿軟件流水線,軟件流水構造需要執(zhí)行的循環(huán)迭代次數(shù)稱為循環(huán)次數(shù)。循環(huán)總數(shù)小于循環(huán)次數(shù)時,執(zhí)行不流水形式循環(huán);循環(huán)總數(shù)大于循環(huán)次數(shù)時,執(zhí)行軟件流水形式循環(huán)??梢允褂?ms選項,使編譯器根據(jù)循環(huán)次數(shù)僅產(chǎn)生一種循環(huán)形式;可使用-o3和-pm選項,使優(yōu)化器訪問整個程序,了解循環(huán)次數(shù)信息;使用-nassert內(nèi)聯(lián)函數(shù),防止冗余循環(huán)產(chǎn)生;使用-mh選項,消除軟件流水循環(huán)的排空,從而減小代碼尺寸。
由于在嵌套循環(huán)中編譯器僅對里面的循環(huán)執(zhí)行軟件流水,因此對于執(zhí)行周期很少的內(nèi)循環(huán)開展循環(huán)展開,對外循環(huán)開展軟件流水。
使用軟件流水應當注意的問題:盡管軟件流水循環(huán)可以包含內(nèi)聯(lián)函數(shù),但不能包含函數(shù)調(diào)用;在循環(huán)中不使用break語句;循環(huán)控制變量不能與循環(huán)體內(nèi)的語句有關;如果循環(huán)體內(nèi)復雜的條件代碼需要超過5個條件存放器或者32個以上存放器,則這個循環(huán)不可開展軟件流水。
(4)片內(nèi)存儲器的分配及DMA技術的運用。
DM643內(nèi)部有16KB的程序緩存、16KB的數(shù)據(jù)緩存和256KB的程序數(shù)據(jù)共享二級緩存,遠小于執(zhí)行程序和待處理圖像數(shù)據(jù),不可能將程序和圖像數(shù)據(jù)都在片內(nèi)RAM中緩存,因此合理地配置和使用存儲空間,對系統(tǒng)整體效率影響很大。
提高算法程序執(zhí)行速度的關鍵是使循環(huán)代碼和要訪問的數(shù)據(jù)在第1次訪問之后全部發(fā)生L1P和L1D命中。循環(huán)代碼占的空間很小,執(zhí)行過之后,完全可以全部在L1P中緩存,因此,不用考慮代碼如何在存儲器中存放,主要問題是圖像數(shù)據(jù)的存放。
由于L1D采取LRU(LeastRecentlyUsed)分配機制,因此對于小于等于16KB的連續(xù)存放的數(shù)據(jù)塊可完全在L1D中命中。以解碼過程為例,IDCT和運動補償模塊都是以宏塊為單位開展運算的,IDCT數(shù)據(jù)類型為short型,運動補償中的預測幀和當前幀的數(shù)據(jù)類型為unsignedchar型。計算一個宏塊(420格式)的IDCT和運動補償要訪問的數(shù)據(jù)大小共需1536字節(jié),運動補償?shù)臄?shù)據(jù)包括預測宏塊和當前宏塊的數(shù)據(jù),實際解碼中以6個宏塊(10KB)作為1次處理對象。待處理的數(shù)據(jù)要從外部存儲器搬到L2中連續(xù)的存儲空間,可利用EDMA與CPU并行工作的特點,采取Ping??Pong技術,使CPU在處理Ping空間數(shù)據(jù)的同時,由EDMA將下次要處理的數(shù)據(jù)搬到Pong空間中;當CPU處理Pong空間數(shù)據(jù)時,再由EDMA將Ping空間已處理好的數(shù)據(jù)搬回外部存儲器,并將下次要處理的數(shù)據(jù)搬到Ping空間,這樣就可到達CPU的計算能力。Ping、Pong空間各占用的大小為20KB,兩個總共約40KB.L2中的剩余空間分出64KB留給數(shù)據(jù)空間,用于解碼中常用的解碼表、量化步長、輸入壓縮碼流緩沖區(qū)和輸出碼流緩沖區(qū)等。64KB的程序空間用于存儲H.264算法中的運動預測、運動補償和中斷服務程序等關鍵代碼。L2其余部分配置為Cache,操作與L1D類似。
2.2編寫線性匯編代碼
為了提高代碼性能,對影響處理速度的關鍵C代碼段可以用線性匯編重新編寫。線性匯編代碼類似于匯編代碼,不同的是線性匯編代碼中不需要給出匯編代碼必須指出的所有信息(如所使用的存放器、指令的并行與否、指令的延遲周期和指令使用的功能單元等),匯編優(yōu)化器會根據(jù)代碼的情況確定這些信息。當然,如果能夠事先確定一些信息(如循環(huán)的執(zhí)行次數(shù)、存儲區(qū)的地址等),則編寫的線性匯編代碼的效率更高。具體的優(yōu)化措施如下:
①使用偽指令向匯編優(yōu)化器提供較為詳細的信息。
②畫出指令的相關圖,根據(jù)相關圖合理分配邏輯單元,限度地保證指令的并行執(zhí)行。
③充分使用C64xDSP提供的強大包處理指令處理數(shù)據(jù)(包處理指令可同時處理2個l6位數(shù)據(jù)和4個8位數(shù)據(jù))。本系統(tǒng)中使用了AVGU4、MIN2、MAX2、SPACKU4、PACK2、D0TP2、D0TPN2和UNPKLU4等指令。C64xDSP還提供了STDW(STNDW)、LDDW(LDNDW)指令,可存取連續(xù)的64位數(shù)據(jù)??衫肔DDW指令,將作1次行變換所需數(shù)據(jù)1次取來,并將處理后的結(jié)果利用STDW指令存好。這樣大大縮短了代碼長度,提高了代碼效率。
④利用ScheduleTable確定循環(huán)的重復間隔,合理安排功能單元,開展軟件的流水。
⑤對于兩重循環(huán)嵌套,可將內(nèi)層循環(huán)展開為外層循環(huán)內(nèi)部的條件指令。這樣可減小由內(nèi)層循環(huán)所帶來的循環(huán)前后的prolog和epilog的開銷。
3性能分析
設計、調(diào)試好硬件系統(tǒng),并在DM643上對整個系統(tǒng)軟件開展設計和優(yōu)化后,視/音頻編/解碼的處理速度及系統(tǒng)功能得到了很大提高。IP可視電話基本做到話音清晰并實時傳輸,在網(wǎng)絡速度為30kbps以上時能實現(xiàn)CIF圖像25~30幀/s,并可以音唇同步。
結(jié)語
該系統(tǒng)能在一顆DM643芯片上實現(xiàn)網(wǎng)絡可視電話的幾
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 國際結(jié)算流動資金貸款合同樣本
- 鞋類定制加工合同范本
- 農(nóng)村集體土地承包合同版
- 試驗檢測技術服務合同模板
- 電力調(diào)度合同協(xié)議
- 化工原料采購合同格式范本
- 新建住房分期付款合同
- 甲乙丙三方租賃合同補充協(xié)議
- 搬家行業(yè)安全生產(chǎn)與事故預防考核試卷
- 危險品倉儲安全操作規(guī)程優(yōu)化考核試卷
- 2024中考英語1500詞匯默寫匯總表練習(含答案)
- 2024屆高三英語作文復習寫作專項讀后續(xù)寫:幫我修車的墨西哥一家人(人性之光)任務單學案
- 2022年四川省綿陽市中考語文真題
- 麥琪的禮物全面英文詳細介紹
- 使用智能手機教程文檔
- 數(shù)字資產(chǎn)培訓課件
- (醫(yī)院安全生產(chǎn)培訓)課件
- 大檔案盒正面、側(cè)面標簽模板
- 幼兒園優(yōu)質(zhì)公開課:中班數(shù)學《到艾比家做客》課件
- 部編人教版歷史八年級下冊《三大改造》省優(yōu)質(zhì)課一等獎教案
- 水輪機調(diào)速器現(xiàn)場調(diào)試
評論
0/150
提交評論