版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
精品文檔-下載后可編輯基于FPGA的快速并行FFT及其在空間太陽望遠(yuǎn)鏡圖像鎖定系...-基礎(chǔ)電子空間太陽望遠(yuǎn)鏡項(xiàng)目是我國太陽物理學(xué)家為了實(shí)現(xiàn)對太陽的高分辨率觀測而提出的科學(xué)計(jì)劃。它可以得到空間分辨率為0.1″的向量磁圖和0.5″的X射線圖像,實(shí)現(xiàn)這樣高的觀測精度的前提就是采用高精度的姿態(tài)控制系統(tǒng)和高精度的相關(guān)跟蹤系統(tǒng)。從整個系統(tǒng)來看,相關(guān)運(yùn)算所需的時間成為限制系統(tǒng)性能能否提高的一個重要環(huán)節(jié)。目前,國際國內(nèi)相關(guān)計(jì)算比較通用的實(shí)現(xiàn)方法有兩種:用高速DSP或者專用(FFT)處理芯片。用DSP完成相關(guān)計(jì)算(關(guān)鍵是FFT)受到航天級DSP性能的限制,現(xiàn)有的航天級DSP(如ADSP21020)計(jì)算一個32×32點(diǎn)8bit的二維FFT所用時間需要1.5ms以上,遠(yuǎn)遠(yuǎn)不能滿足系統(tǒng)設(shè)計(jì)要求;而現(xiàn)有的FFT處理芯片在處理速度、系統(tǒng)兼容性、抗輻射能力等方面不能滿足空間太陽望遠(yuǎn)鏡所提出的要求。為克服這一矛盾,本文利用FPGA資源豐富、易于實(shí)現(xiàn)并行流水的特點(diǎn)設(shè)計(jì)專用的FFT處理芯片來完成復(fù)雜的、大量的數(shù)據(jù)處理;并通過在運(yùn)算中作溢出監(jiān)測來保證定點(diǎn)運(yùn)算的精度,從而大大縮短系統(tǒng)的響應(yīng)時間,將極大地提高空間太陽望遠(yuǎn)鏡的在軌實(shí)時圖像處理能力;同時由于FPGA具有抗輻射能力可以提高系統(tǒng)的可靠性,其在航天遙測遙感和星載高速數(shù)據(jù)處理等方面將有廣泛的應(yīng)用前景。1算法構(gòu)成1.1FFT算法選擇提高FFT速度的兩個主要途徑是采用流水結(jié)構(gòu)和并行運(yùn)算1。采用高基數(shù)結(jié)構(gòu)也可以提高速度,只是用FPGA實(shí)現(xiàn)時必須綜合考慮系統(tǒng)要求、結(jié)構(gòu)特點(diǎn)及片內(nèi)資源。針對本系統(tǒng)自身特點(diǎn),這里按時間抽選算法進(jìn)行分析。由于32不滿足N=4m,所以32點(diǎn)FFT算法不能采用基-4FFT運(yùn)算。當(dāng)詳細(xì)分析基-2蝶形圖時,有些蝶形運(yùn)算并不需要做乘法,例如W=1W=-J等2;對于32點(diǎn)DIT-FFT,一共80個蝶形運(yùn)算,這種結(jié)構(gòu)就有46個,極大地降低了運(yùn)算復(fù)雜度。在一維FFT計(jì)算效率提高的基礎(chǔ)上對二維FFT采用常用的行列算法3,綜合各項(xiàng)指標(biāo)本系統(tǒng)采用基-2DIT行列算法。1.2算術(shù)運(yùn)算方案本系統(tǒng)是針對32×32點(diǎn)16bit的二維圖像進(jìn)行快速傅里葉變換(FFT),設(shè)計(jì)要求運(yùn)算在0.5ms之內(nèi)完成,所以采用定點(diǎn)運(yùn)算更符合系統(tǒng)對時間的要求。對于定點(diǎn)運(yùn)算,必須用定比例的方法防止溢出,即必須解決動態(tài)范圍問題。下面對其進(jìn)行理論分析:若xn是一N點(diǎn)序列,其DFT為XK,由Parseval定理得4由式1可知變換結(jié)果的均方值是輸入序列均方值的N倍??紤]基-2算法的第m級蝶形運(yùn)算,用Xmi、Xmj表示原來的復(fù)數(shù),則新的一對復(fù)數(shù)Xm+1i、Xm+1j為:Xm+1i=Xmi+Xmj×W(2)Xm+1j=Xmi-Xmj×W其中,W為旋轉(zhuǎn)因子。首先,考慮復(fù)數(shù)的均方根值。由(2)式可得:因此,從均方根意義來看,數(shù)值(實(shí)數(shù)或復(fù)數(shù))每級都增加倍。其次,再考慮復(fù)數(shù)的模。由(2)式可以證明[5]:max|Xmi||Xmj|≤max|Xm+1i||Xm+1j|≤2max|Xmi||Xmj|(4)因此,復(fù)數(shù)數(shù)組的模是非減的。所以,對于DIT-FFT,其每的蝶形運(yùn)算之后數(shù)值都會增加1+≈2.414倍。在每運(yùn)算完成之后,須將結(jié)果右移2bits以滿足要求。2系統(tǒng)實(shí)現(xiàn)系統(tǒng)原理如圖1所示,整個FFT運(yùn)算處理單元分為三部分:存儲單元(兩個輸入/運(yùn)算存儲器、一個輸出存儲器及旋轉(zhuǎn)因子存儲器)、蝶形運(yùn)算單元、地址產(chǎn)生器。2.1存儲器本系統(tǒng)實(shí)時接收前端CCD相機(jī)的圖像。為保證CCD相機(jī)采集圖像的準(zhǔn)確率,圖像的每一行、每一幀之間都必須有一定的時間間隔,故采用兩個存儲單元作為輸入數(shù)據(jù)和中間數(shù)據(jù)的暫存單元(如圖1所示),以節(jié)省時間實(shí)現(xiàn)實(shí)時處理。當(dāng)系統(tǒng)工作時,將圖像存入存儲器、計(jì)算上采集的圖像、將存儲器中的結(jié)果輸出,這三個工作同時進(jìn)行,用簡單的流水方式減少存儲數(shù)據(jù)所需的時間。旋轉(zhuǎn)因子則預(yù)先存儲在器件的內(nèi)置ROM中。根據(jù)級數(shù)不同選用不同的因子。2.2蝶形運(yùn)算單元一個基-2蝶形運(yùn)算由一個復(fù)乘和兩個復(fù)加(減)組成,采用完全并行運(yùn)算,進(jìn)一步分解為四個實(shí)數(shù)乘法,六個實(shí)數(shù)加(減)法,分三級并行完成,加上前后輸入輸出的數(shù)據(jù)鎖存,共需要6個時鐘周期。32點(diǎn)的FFT需要16×5=80個基-2的蝶形運(yùn)算,一幅圖像一共是32行32列,不考慮不需要做乘法的蝶形運(yùn)算,一路串行共需要6×80×32×2=30720個時鐘周期,采用頻率為10MHz的時鐘,即為3ms。對于蝶形運(yùn)算的、第二級都可以由不帶乘法器的蝶形結(jié)構(gòu)來實(shí)現(xiàn)同步并行運(yùn)算,每一個蝶形運(yùn)算加上前后的數(shù)據(jù)鎖存僅需4個時鐘周期即可完成;對于第三、第四、第五級,由于帶乘法器和不帶乘法器的兩種蝶形運(yùn)算結(jié)構(gòu)同時存在,必須加入等待時間才可以實(shí)現(xiàn)嚴(yán)格同步。同時由于各級計(jì)算時間不同,所以不能實(shí)現(xiàn)深度流水。因此,采用多路并行及部分流水,在時間上即可滿足系統(tǒng)要求。上面討論了當(dāng)運(yùn)算從轉(zhuǎn)到另時,序列中數(shù)值的幅度一般會增大。因而,運(yùn)算方法是在內(nèi)循環(huán)中作溢出監(jiān)測。如果沒有溢出,則計(jì)算照常進(jìn)行;若有溢出,則把產(chǎn)生溢出的數(shù)據(jù)右移,一直到?jīng)]有溢出為止。記錄下移位的次數(shù)(0、1或2),并把整個序列右移同樣位數(shù),移位總數(shù)進(jìn)行累計(jì),累計(jì)數(shù)的負(fù)值作為2的冪,由此得出終序列的總的比例因子。比例因子s由下式定義67:根據(jù)公式(6),FFT的終結(jié)果要除以比例因子。式中xn為原始數(shù)據(jù),Xk為除以比例因子之前的結(jié)果,X′k為終結(jié)果,1/s為比例因子的倒數(shù)。如圖2所示,對于一個基-2蝶形單元,當(dāng)從存儲器中讀取的Bbit輸入數(shù)據(jù)進(jìn)入蝶形運(yùn)算單元PE1后,經(jīng)過乘法運(yùn)算(MU1)乘以旋轉(zhuǎn)因子,數(shù)據(jù)變?yōu)椋拢娄兀猓椋簦缓笞骷樱p)法,得到蝶形運(yùn)算結(jié)果B+Bω+1bit。為防止溢出,進(jìn)行移位操作。M1、M2為比例選擇器,根據(jù)不同的級數(shù),選擇不同的比例因子。,輸出數(shù)據(jù)再放回到存儲器中。3FPGA器件選擇本設(shè)計(jì)采用XILINX公司的VERTEX系列XCV300-4HQ240芯片。該芯片有豐富的可配置邏輯模塊CLBs(ConfigurableLogicBlocks)、大量的觸發(fā)器以及內(nèi)置的不占系統(tǒng)資源的塊RAM。系統(tǒng)工作頻率可達(dá)200MHz,兼容多種接口標(biāo)準(zhǔn),有相應(yīng)的航天級產(chǎn)品,是目前市場上為數(shù)不多的能達(dá)到此項(xiàng)要求的高性能可編程邏輯器件。VERTEX系列器件的一個顯著特點(diǎn)是內(nèi)置的延遲鎖相環(huán)DLL(Delay-LockedLoop)它可以減少時鐘傳輸?shù)乃p,每一個DLL可以驅(qū)動兩個全局時鐘信號。DLL可以倍頻,或者1.5、2、2.5、3、4、5、8以及16分頻。VERTEX系列器件內(nèi)部的4-輸入查找表LUTs(Look-UpTables)也具有多種功能:可以作為16×1bit的同步RAM,而且一個塊(Slice)中的兩個LUTs可以組合成一個16×2bit或者一個32×1bit的同步RAM或者一個16×1bit的同步多口RAM。另外,LUTs還可作為一個16bit的移位寄存器使用,該寄存器用來獲取高速或者突發(fā)數(shù)據(jù)非常理想,特別適用于數(shù)字圖像處理中的數(shù)據(jù)存儲8。本設(shè)計(jì)充分利用了VERTEX器件的LUTs替代觸發(fā)器和基本門電路搭建乘法器和加法器這兩個顯著的結(jié)構(gòu)特點(diǎn),節(jié)省大量觸發(fā)器資源,避免了缺少觸發(fā)器而LUTs大量剩余的尷尬;增加了器件利用率、布通率,降低布線延遲。由于本系統(tǒng)終用于空間太陽望遠(yuǎn)鏡,所以板上時鐘頻率不可超過20MHz。但基于地面測試的需要,特利用DLL對外部時鐘信號進(jìn)行了倍頻,以提高芯片內(nèi)部的運(yùn)行速度。本設(shè)計(jì)利用FPGA易于實(shí)現(xiàn)并行運(yùn)算的特點(diǎn)實(shí)現(xiàn)專用的FFT處理芯片,解決了在軌實(shí)時大數(shù)據(jù)量圖像處理與航天級DSP運(yùn)算速
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 從傳統(tǒng)到現(xiàn)代室內(nèi)花園的歷史變遷
- 會計(jì)職稱考試《初級會計(jì)實(shí)務(wù)》試題與解析
- 信息技術(shù)在小學(xué)教育中的應(yīng)用
- 2023-2024學(xué)年廣東省深圳市南海中學(xué)八年級上學(xué)期期中數(shù)學(xué)試題及答案
- 兒童文學(xué)在小學(xué)生閱讀能力培養(yǎng)中的作用
- 2021屆河南省南陽市高三上學(xué)期期末地理試題(解析版)
- 創(chuàng)新學(xué)生健康教育模式提升健康素養(yǎng)
- 兒童家具表面清潔與保養(yǎng)全攻略
- 農(nóng)行科技發(fā)展與合規(guī)文化同步推進(jìn)策略
- 創(chuàng)新教育在小學(xué)生數(shù)學(xué)邏輯思維培養(yǎng)中的應(yīng)用
- 手機(jī)音腔設(shè)計(jì)指南
- 某機(jī)械廠降壓變電所的電氣設(shè)計(jì)參考(電氣工程課程設(shè)計(jì))
- 鋼結(jié)構(gòu)基本原理試習(xí)題及答案
- 同分異構(gòu)現(xiàn)象和同分異構(gòu)體
- 公安局輔警人員登記表
- 賽事活動閉幕式及頒獎儀式流程及執(zhí)行腳本
- (完整word版)網(wǎng)絡(luò)優(yōu)化測試報(bào)告
- 《金字塔原理》
- 無機(jī)材料科學(xué)基礎(chǔ)教程(第二版)課后答案
- 第《6》章層壓成型工藝
- 海船工作時間表及休息記錄表
評論
0/150
提交評論