基于處理器的去方塊濾波器的實(shí)現(xiàn)及優(yōu)化

上傳人：1*** IP屬地：山東上傳時(shí)間：2023-09-03 格式：DOCX 頁數(shù)：5 大小：63.93KB 積分：6 舉報(bào) 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于處理器的去方塊濾波器的實(shí)現(xiàn)及優(yōu)化引言在已有的基于塊的視頻編解碼系統(tǒng)中，當(dāng)碼率較低時(shí)都存在方塊效應(yīng)，新的視頻編碼標(biāo)準(zhǔn) 陰亦是如此。產(chǎn)生這種方塊效應(yīng)的主要原因有兩個(gè)：一是由于對(duì)變換后的殘差系數(shù)進(jìn)行的基于塊的整數(shù)變換后，以大的量化步長(zhǎng)對(duì)變換系數(shù)進(jìn)行量化會(huì)使得解碼后的重建圖像的方塊邊緣出現(xiàn)不連續(xù)；二是在運(yùn)動(dòng)補(bǔ)償中插值運(yùn)算引起的誤差使得編解碼器反變換后的重建圖像會(huì)出現(xiàn)方塊效應(yīng)。如果不進(jìn)行處理，方塊效應(yīng)還會(huì)隨著重構(gòu)幀積累下去，從而嚴(yán)重地影響圖像的質(zhì)量和壓縮效率。為了解決這一問題，財(cái)?shù)娜シ綁K濾波技術(shù)采用較為復(fù)雜的自適應(yīng)濾波器來有效地去除這種方塊效應(yīng)。因此，如何在實(shí)時(shí)視頻解碼中優(yōu)化去方塊濾波算法，降低計(jì)算復(fù)雜度，提高重建圖像質(zhì)量，就成了解碼的一個(gè)關(guān)鍵問題。22去方塊濾波濾波原理大的量化步長(zhǎng)會(huì)造成相對(duì)較大的量化誤差，這就可能將原來相鄰塊“接壤”處像素間灰度的連續(xù)化變成了“臺(tái)階”變化，主觀上就有”偽邊緣”的方塊效應(yīng)。去方塊效應(yīng)的方法就是在保持圖像總能量不變的條件下，把這些臺(tái)階狀的階躍灰度變化重新復(fù)原成臺(tái)階很小或者近似連續(xù)的灰度變化，同時(shí)還必須盡量減少對(duì)真實(shí)圖像邊緣的損傷。自適應(yīng)濾波過程在中4去方塊濾波器是按照16X16像素的宏塊為單位順序進(jìn)行的，在宏塊中按照每個(gè)4X4子塊之間的邊緣以先垂直后水平的順序進(jìn)行，從而對(duì)整個(gè)重建圖像中的所有邊緣圖像邊緣除外進(jìn)行濾波。具體的邊緣示意圖如圖1所示。對(duì)于16X16像素的亮度宏塊，共有4條垂直邊緣，4條水平邊緣，每條邊緣又分為16條像素邊緣。而對(duì)應(yīng)8X8像素的色度宏塊有垂直邊緣和水平邊緣各條，每條邊緣分為8條像素邊緣。像素邊緣是進(jìn)行濾波的基本單元。圖】16x16像素宏塊內(nèi)圖像邊繚1.2.濾1波器在兩個(gè)層次上的自適應(yīng)性中的去方塊濾波所以有較好的濾波效果，是由于它在以下兩個(gè)層次上的自適應(yīng)性。1濾波器在4X4子塊級(jí)別的自適應(yīng)性濾波是基于各個(gè)子塊中的像素邊緣進(jìn)行的，通過對(duì)每一條像素邊緣定義一個(gè)參數(shù)邊緣強(qiáng)度來自適應(yīng)地調(diào)節(jié)濾波的強(qiáng)弱和涉及的像素點(diǎn)。色度塊的像素邊緣強(qiáng)度與相應(yīng)的亮度像素邊緣強(qiáng)度相同。假設(shè)和為兩個(gè)相鄰的4X4子塊，其中的像素邊緣強(qiáng)度通過圖的步驟獲得。的值越大，則對(duì)相應(yīng)的邊緣兩側(cè)進(jìn)行的濾波越強(qiáng)，這是根據(jù)產(chǎn)生方塊效應(yīng)的原因來設(shè)定的，如采用幀內(nèi)預(yù)測(cè)模式的子塊的方塊現(xiàn)象較明顯，則對(duì)該子塊中的對(duì)應(yīng)邊緣設(shè)定較大的像素邊緣強(qiáng)度值來進(jìn)行強(qiáng)濾波。濾波器在像素點(diǎn)級(jí)別上的白適應(yīng)性正確區(qū)分由于量化誤差、運(yùn)動(dòng)補(bǔ)償產(chǎn)生的虛假邊緣和圖像中的真實(shí)邊界才能得到好的濾波效果。通常，真實(shí)邊界兩側(cè)的像素梯度差值要比虛假邊界兩側(cè)的像素梯度差值大，因此，濾波器通過對(duì)邊緣兩側(cè)像素點(diǎn)的灰度值的梯度差值設(shè)定門限a、對(duì)同一側(cè)的相鄰像素點(diǎn)的灰度值的梯度差值設(shè)定門限P來進(jìn)行真?zhèn)芜吔绲呐卸?。a和B的值主要與量化步長(zhǎng)有關(guān)，當(dāng)量化步長(zhǎng)大時(shí)，量化誤差也大，方塊效應(yīng)就明顯，易產(chǎn)生虛假邊界，因此門限值隨之變大，放寬濾波條件。反之，量化步長(zhǎng)小時(shí)門限值也變小，體現(xiàn)了自適應(yīng)性。采樣點(diǎn)的設(shè)置見圖3。若條件都滿足，則進(jìn)開始濾波。!pi；苗由『叫曲QIj加i也

j'"*博就地?fù)?/p>

hPfl-QDIJPi-印IV0:-QO1中:

a根米坡間的門眼聿代表境內(nèi)的口限

圖3得誄灌像素示意圖除了這兩種自適應(yīng)性，還可以通過設(shè)置位于片級(jí)的系數(shù) 、來調(diào)整濾波的強(qiáng)度。例如當(dāng)傳輸碼率較低時(shí)，方塊效應(yīng)較明顯，接收端想要主觀質(zhì)量相對(duì)較好的圖像，則編碼端可通過設(shè)置位于片頭信息中的濾波偏移量、為正值，以此增大a和p來加強(qiáng)濾波，通過去除方塊效應(yīng)來提高圖像主觀質(zhì)量?；蛘邔?duì)于高分辨率的圖像，可以通過傳送負(fù)值偏移來減弱濾波，盡量保持圖像的細(xì)節(jié)。依據(jù)各像素邊緣值對(duì)相鄰的像素濾波若當(dāng)前像素邊緣符合濾波條件，則根據(jù)其相應(yīng)的值選取對(duì)應(yīng)的濾波器進(jìn)行濾波并且進(jìn)行適當(dāng)?shù)募羟胁僮鳎苑乐箞D像的模糊當(dāng)值是，，時(shí)，采用一個(gè)抽頭的線性濾波器，對(duì)輸入的、、、進(jìn)行濾波調(diào)整得到新的、，如果內(nèi)部有虛假邊界，則進(jìn)一步調(diào)整、的值。當(dāng)值是時(shí)，則對(duì)應(yīng)的是采用幀內(nèi)編碼模式的宏塊邊緣，應(yīng)采用較強(qiáng)的濾波以達(dá)到增強(qiáng)圖像質(zhì)量的目的。對(duì)于亮度分量，若條件 ?a》成立，則選擇拙頭濾波器對(duì)、進(jìn)行濾波，使用較強(qiáng)的抽頭濾波器對(duì)進(jìn)行濾波；若條件不成立，則只使用較弱的抽頭濾波器對(duì)進(jìn)行濾波，而、的值保持不變。對(duì)于色度分量，若上述條件滿足，則對(duì)進(jìn)行抽頭濾波，若條件不滿足，則所有的像素值都不修改。對(duì)、、的濾波操作與、、的濾波操作相同。的5特3點(diǎn)3和結(jié)構(gòu)我們的去方塊濾波是在公司的處理器上實(shí)現(xiàn)的。系列主要具有以下特點(diǎn)：高度并行的計(jì)算單元。系列體系架構(gòu)的核心是數(shù)據(jù)算術(shù)單元）包括個(gè)位的乘法累加器）個(gè)位的算術(shù)邏輯單元）個(gè)位單桶形的移位器，個(gè)位視頻。每個(gè) 能在單一時(shí)鐘周期內(nèi)對(duì)個(gè)獨(dú)立的數(shù)據(jù)操作數(shù)執(zhí)行位乘位的乘法運(yùn)算。位的可累加個(gè)位的數(shù)字或者個(gè)位的數(shù)字。這種體系架構(gòu)可靈活地進(jìn)行值、位、位的數(shù)據(jù)運(yùn)算。動(dòng)態(tài)電源管理。處理器可以通過改變電壓和工作頻率，消耗比其他更少的功耗。系列體系架構(gòu)的允許電壓和頻率獨(dú)立調(diào)整，使得每一項(xiàng)任務(wù)的消耗能量最小，在性能和功耗間有較好的平衡，適合實(shí)時(shí)視頻編／解碼器的開發(fā)，特別是對(duì)功耗有嚴(yán)格要求的實(shí)時(shí)運(yùn)動(dòng)視頻處理。高性能的地址產(chǎn)生器。具有個(gè) 數(shù)據(jù)地址產(chǎn)生器）用于產(chǎn)生支持高級(jí) 濾波運(yùn)算的地址的復(fù)合裝入或存儲(chǔ)單元。支持位倒序?qū)ぶ泛脱h(huán)緩沖以及其他多種尋址方式，提高了編程的靈活性。分層結(jié)構(gòu)的內(nèi)存。分層結(jié)構(gòu)的內(nèi)存縮短了內(nèi)核對(duì)內(nèi)存的訪問時(shí)間，以獲得最大的數(shù)據(jù)吞吐量、較少的延遲和縮短的處理空載時(shí)間。特有的視頻操作指令。提供適合離散余弦變換）霍夫曼編碼等視頻壓縮標(biāo)準(zhǔn)中常用的操作指令，這些視頻指令還消除了主處理器與一個(gè)獨(dú)立的視頻編解碼器之間的復(fù)雜和易混和通信問題。這些特點(diǎn)有助于為終端應(yīng)用縮短產(chǎn)品上市時(shí)間，同時(shí)降低了系統(tǒng)的總體成本。我們使用的可以實(shí)現(xiàn) 的持續(xù)工作，具有：的統(tǒng)一尋址空間；的指令指令存儲(chǔ)器，其中可配置成路的聯(lián)合 c個(gè) 的數(shù)據(jù)存儲(chǔ)器，其中一半可配置為 c集成豐富的外圍設(shè)備和接口?；诘?去方塊濾波優(yōu)化實(shí)現(xiàn)去方塊濾波器在優(yōu)化實(shí)現(xiàn)主要分為系統(tǒng)級(jí)別的優(yōu)化、算法級(jí)別的優(yōu)化、匯編級(jí)別的優(yōu)化個(gè)級(jí)別。系統(tǒng)級(jí)別的優(yōu)化打開平臺(tái)中編譯器的優(yōu)化選項(xiàng)并將優(yōu)化速度設(shè)置為最快，打開開關(guān)自動(dòng)內(nèi)聯(lián)開關(guān)以及開關(guān)優(yōu)化過程開關(guān)）通過以上的一些設(shè)置充分發(fā)揮的硬件性能。算法級(jí)別的優(yōu)化將參考模型中的去方塊濾波部分進(jìn)行適當(dāng)?shù)南到y(tǒng)修改，移植到原有的基于的基本擋次的解碼器中，并通過圖像序列對(duì)其進(jìn)行耗時(shí)分析。選用碼率為 /左右的、、、序列，去方塊濾波所耗費(fèi)的時(shí)鐘周期約為 ? 0即使在經(jīng)過系統(tǒng)優(yōu)化后，計(jì)算復(fù)雜度仍然相當(dāng)大，效率很低，對(duì)于處理器的持續(xù)工作頻率是相當(dāng)大的負(fù)擔(dān)。通過分析中去方塊濾波程序，其效率低下的主要原因是：、）算法中的函數(shù)邏輯關(guān)系復(fù)雜，判斷、跳轉(zhuǎn)、函數(shù)調(diào)用等情況特別多；最耗時(shí)的部分，即函數(shù)循環(huán)的內(nèi)部存在大量的重復(fù)計(jì)算，造成計(jì)算復(fù)雜度劇增；算法中用到的不少數(shù)據(jù)，例如運(yùn)動(dòng)矢量、圖像的亮度和色度數(shù)據(jù)等存放在速度較慢的片外中，但在濾波過程中的頻繁調(diào)用，使數(shù)據(jù)搬運(yùn)時(shí)間劇增。針對(duì)耗時(shí)的原因，對(duì)算法進(jìn)行了以下改進(jìn)：.將1原程序中復(fù)雜的函數(shù)及循環(huán)簡(jiǎn)單化指令長(zhǎng)度和運(yùn)算速度是相互制約的，往往將代碼通過條件判斷可以進(jìn)行高度精簡(jiǎn)，但由于增加了機(jī)器的判斷工作量而使得速度變慢；反之，將代碼中的判斷去除，程序進(jìn)行展開，往往可以減少耗費(fèi)的指令周期，但代碼長(zhǎng)度會(huì)增加。中的去方塊濾波代碼較短，將其中的函數(shù)間關(guān)系簡(jiǎn)單化，以代碼長(zhǎng)度增加換取執(zhí)行速度的增加。對(duì)于系統(tǒng)運(yùn)行最耗時(shí)的循環(huán)體，采取適當(dāng)改寫循環(huán)形式、多重循環(huán)體展開等方法有效地減少運(yùn)算的復(fù)雜度。此外，減少調(diào)用函數(shù)次數(shù)，改寫語句也是有效的優(yōu)化手段。去2除參考代碼中的大量冗余代碼和重復(fù)計(jì)算因?yàn)槭褂玫膮⒖即a是中的去方塊濾波模塊，該模塊可以對(duì) 的各種擋次和級(jí)別的碼流進(jìn)行濾波，而解碼器是基于基本擋次的，僅僅涉及到幀、幀的濾波操作，因此可以將參考代碼中的關(guān)于幀、/幀、場(chǎng)模式和幀場(chǎng)自適應(yīng)模式的相關(guān)濾波部分去除。繁調(diào)用片外數(shù)據(jù)的時(shí)間，提高了運(yùn)行速度；另一方面通過對(duì)待濾波宏塊的細(xì)分，減少了參考代碼中的判斷引起的流水線中斷，也在一定程度上提升了程序速度。匯編級(jí)別的優(yōu)化處理器的內(nèi)核支持或語言，但由系統(tǒng)自動(dòng)將程序翻譯成匯編語言效率比較低下，因此對(duì)一些系統(tǒng)調(diào)用比較頻繁、耗時(shí)較多的模塊，可以用人工將其轉(zhuǎn)化成高效率的匯編語言來提高運(yùn)行速度。主要通過以下幾個(gè)方面來提高程序的速度：以寄存器變量代替局部變量。在語言中，子程序和函數(shù)中往往使用局部變量來暫時(shí)存放數(shù)據(jù)。當(dāng)程序運(yùn)行時(shí)，編譯器為聲明的所有局部變量開辟臨時(shí)內(nèi)存空間，對(duì)于局部變量的存取操作都涉及到內(nèi)存的存取，而內(nèi)存訪問的速度相對(duì)于寄存器訪問是很慢的。因此，可以利用系統(tǒng)中的數(shù)據(jù)寄存器、指針寄存器來替代僅僅起暫存作用的局部變量，從而大大節(jié)省系統(tǒng)訪問內(nèi)存帶來的時(shí)間延遲。但由于系統(tǒng)中的寄存器數(shù)量對(duì)于局部變量來說相當(dāng)有限，因此必須合理高效地使用寄存器。以硬件循環(huán)代替軟件循環(huán)。軟件循環(huán)是指在或等循環(huán)的開始或結(jié)尾處設(shè)置判斷條件來控制循環(huán)的開始、繼續(xù)、結(jié)束。軟件循環(huán)的條件判斷指令會(huì)動(dòng)態(tài)地選擇分支，一旦發(fā)生跳轉(zhuǎn)，會(huì)阻塞流水線，而保持流水線的暢通是保持高效運(yùn)行的關(guān)鍵因素。處理器有專用的硬件支持兩級(jí)嵌套的零開銷硬件循環(huán)，這種方式不需要判斷條件轉(zhuǎn)移，硬件根據(jù)預(yù)定的循環(huán)次數(shù)自動(dòng)執(zhí)行循環(huán)并結(jié)束循環(huán)，從而保證了流水線的暢通，提高速度。充分利用數(shù)據(jù)總線寬度。外部數(shù)據(jù)總線寬度位，一次可存取字節(jié)。因此，充分利用數(shù)據(jù)總訪問寬度，特別在操作大量數(shù)據(jù)時(shí)，保持一次存取4字節(jié)，可減少指令周期數(shù)，從而提高執(zhí)行速度。高效使用并行指令和向量指令。并行指令和向量指令是系列的一大特點(diǎn)。通過對(duì)并行指令的使用，可以充分發(fā)揮處理器的系統(tǒng)結(jié)構(gòu)的優(yōu)點(diǎn)及硬件資源的并行處理能力，減少指令數(shù)，從而提高程序執(zhí)行效率。往往通過對(duì)程序的合理安排可以做到使用條并行指令來替代2條或3條非并行指令。向量指令則充分利用指令寬度，同時(shí)對(duì)多個(gè)數(shù)據(jù)流進(jìn)行相同操作，如要進(jìn)行2個(gè)16位的算術(shù)或移位操作，完全可以通過個(gè)位的向量指令來實(shí)現(xiàn)，從而以個(gè)時(shí)鐘周期來實(shí)現(xiàn)原來個(gè)周期的工作。例如就用個(gè)指令周期同時(shí)實(shí)現(xiàn)個(gè)16位數(shù)據(jù)的求絕對(duì)值操作。合理配置數(shù)據(jù)存儲(chǔ)空間。限于片內(nèi)和片外數(shù)據(jù)存儲(chǔ)空間的訪問速度和容量特點(diǎn)，片內(nèi)空間存取速度快但容量很小，而片外空間較大但訪問速度慢，因此，合理地分配數(shù)據(jù)存放位置對(duì)于提高程序的運(yùn)行速度是十分關(guān)鍵的。對(duì)于使用頻率高的數(shù)據(jù)盡量放在片內(nèi)空間中，而不常用的數(shù)據(jù)放在片外空間中。若要存取位于片外的數(shù)據(jù)時(shí)，應(yīng)將待存取的數(shù)據(jù)盡量安排成連續(xù)分布，一次將大塊的片外數(shù)據(jù)讀進(jìn)片內(nèi)緩存，避免頻繁讀取片外數(shù)據(jù)帶來的時(shí)間浪費(fèi)。

優(yōu)化實(shí)現(xiàn)的結(jié)果測(cè)試優(yōu)化效果的方法是將參考代碼中的去方塊濾波程序模塊加到原有的解碼器中進(jìn)行測(cè)試，并與經(jīng)過系統(tǒng)、算法、匯編個(gè)級(jí)別優(yōu)化e測(cè)試數(shù)據(jù)見表e測(cè)試數(shù)據(jù)見表兼I在方塊逮該枳塊優(yōu)就商后的冏期比較閏到苫林口㈤禧下二^逋二,優(yōu)正一

￥門即之初閏到苫林口㈤禧下二^逋二,優(yōu)正一

￥門即之初底」的：彘SW<205,72t509,30).TNAl4*ilr.rij25 4：I N訃JMM傲1：4防口即總陽州 f￡ft鼻白L-優(yōu)化心~憂itii丁 "'植舊；f信看1 2 I — . IT -蛔工&*1.相I 137,7^.324 1 .S2S,216,?12 標(biāo)5.知明040 7.12Iia.4W.W2 I J6S,<M6,fl25 乎R.&lO/M ft5573H.4?6,237 J15,3㈢465 1.66:覺蟲困 2.^.953.33(1 亂噴由表可以看出，與未優(yōu)化前的中的程序代碼相比，經(jīng)過優(yōu)化后的去方塊濾波匯編模塊效率提高了倍左右5結(jié)束語本文通過系統(tǒng)、算法及匯編個(gè)級(jí)別優(yōu)化實(shí)現(xiàn)了中的去方塊濾波功能，特別是通過改進(jìn)去方塊濾波的實(shí)現(xiàn)算法，對(duì)待濾波的宏塊進(jìn)行分類以及充分地利用并行指令、向量指令等匯編級(jí)別的優(yōu)化手段，取得了較好的優(yōu)化效果。優(yōu)化實(shí)現(xiàn)的去方塊濾波

人人文庫(kù)> 全部分類> 應(yīng)用文書 > 研究報(bào)告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于處理器的去方塊濾波器的實(shí)現(xiàn)及優(yōu)化

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

基于處理器的去方塊濾波器的實(shí)現(xiàn)及優(yōu)化

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔