通信工程應(yīng)用技術(shù)-多媒體信息處理-運(yùn)動(dòng)估計(jì)算法

上傳人：2*** IP屬地：貴州上傳時(shí)間：2022-10-03 格式：DOCX 頁(yè)數(shù)：52 大小：489.20KB 積分：20 舉報(bào) 版權(quán)申訴

通信工程應(yīng)用技術(shù)-多媒體信息處理-運(yùn)動(dòng)估計(jì)算法_第2頁(yè)

通信工程應(yīng)用技術(shù)-多媒體信息處理-運(yùn)動(dòng)估計(jì)算法_第3頁(yè)

通信工程應(yīng)用技術(shù)-多媒體信息處理-運(yùn)動(dòng)估計(jì)算法_第4頁(yè)

通信工程應(yīng)用技術(shù)-多媒體信息處理-運(yùn)動(dòng)估計(jì)算法_第5頁(yè)

已閱讀5頁(yè)，還剩47頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、武漢理工大學(xué)通信工程應(yīng)用技術(shù)課程設(shè)計(jì)說(shuō)明書摘要運(yùn)動(dòng)估計(jì)算法是是視頻壓縮編編碼的核心算算法之一，通通常也是編碼碼器中計(jì)算量量最大的環(huán)節(jié)節(jié)。在視頻編編碼和處理系系統(tǒng)中，運(yùn)動(dòng)動(dòng)估計(jì)和運(yùn)動(dòng)動(dòng)補(bǔ)償技術(shù)對(duì)對(duì)降低視頻序序列時(shí)間冗余余度、提高編編碼效率起著著非常關(guān)鍵的的作用。運(yùn)動(dòng)動(dòng)估計(jì)的準(zhǔn)確確程度將直接接決定視頻編編碼器的編碼碼效率。它極極大地消除了了視頻序列的的幀間相關(guān)性性。高質(zhì)量的的運(yùn)動(dòng)估計(jì)算算法是高效視視頻編碼的前前提和基礎(chǔ)，因因此分析和研研究快速運(yùn)動(dòng)動(dòng)估計(jì)算法，提提高編碼器速速度是非常必必要的，運(yùn)動(dòng)動(dòng)估計(jì)算法采采用某一匹配配準(zhǔn)則在搜索索區(qū)域內(nèi)搜索索最佳匹配點(diǎn)點(diǎn)獲得運(yùn)動(dòng)矢矢量。不同的搜索方法法在搜索最

2、佳佳匹配點(diǎn)上采采用了不同的的搜索策略，通通常的搜索算算法主要有全全搜索法、三三步搜索法、新新三步搜索法法、菱形搜索索法等搜索方方法。目前的的各種搜索算算法都試圖在在搜索速度和和精度之間取取得最好的折折衷。本次課課程設(shè)計(jì)設(shè)計(jì)計(jì)視頻壓縮系系統(tǒng)中的運(yùn)動(dòng)動(dòng)估計(jì)算法用用全搜索法和和三步法，并并比較二種方方法的搜索點(diǎn)點(diǎn)和每幀的峰峰值信噪比。關(guān)鍵字：視頻壓壓縮；運(yùn)功估估計(jì)；全搜索索；三步法AbstracctMotion estimmationn algoorithmmis onne of the ccorealgorrithm of viideocomprressioon codding,compuutat

3、ioonis offtenthe llargesstpart ofthe eencodeer.In thhe viddeo cooding and pprocesssing systeem,motioon esttimatiion annd mottion ccompennsatioon tecchnoloogy tooreducce thee reduundanccy of videoo sequuence time,improove thhe codding eefficiiencypplays a verry impportannt rolle.The aaccuraacy off mo

4、tiion esstimattion ddirecttlyaffeccts thhe effficienncy off the videoo codeer.It grreatlyyelimiinatess the interr frammecorreelatioon.Higgh quaalitymotioon esttimatiion allgoritthmis thhe bassis annd preerequiisite forefficcient videoo codiing,so thheanalyysis aand reesearcch offast motioon esttimat

5、iionalgorrithm,it iss neceessaryy toimproove thhe enccoder speedd,motioon esttimatiion ussingamatchhing ccriterrionin thhe seaarch aarea iinthe bbest mmatchiing poointto obbtain the mmotionn vecttoralggorithhm.The diffferennt seaarch mmethoddsin thhesearcch forr the bestmatchhingpointt withhdiffeere

6、nt searcch strrategiies,globaal seaarch,threee stepp searrch,threee stepp searrch,diamoond seearchmethoodand ssearchhmethood istthe maainsearcch alggorithhmusuallly. Variooussearcch alggorithhmsare ccurrenntlytryinng to getthe bbest ccomproomisebetweeenspeedd and preciision of seearch. The coursse d

7、essign oof dessign iin thee videeo commpresssion ssystemm withh fulll searrch mootion estimmationn algoorithmm methhod annd thrree-sttep meethod, and compaare thhe twoo methhods oof seaarch ppointss and peak signaal to noisee ratiio of each framee.Keywordds: Viideo ccompreessionn; Motiion esstimatti

8、on;FS; TSS武漢理工大學(xué)通信工程應(yīng)用技術(shù)課程設(shè)計(jì)說(shuō)明書1 設(shè)計(jì)任務(wù)1.1 設(shè)計(jì)目目的通信工程應(yīng)用技技術(shù)課程設(shè)計(jì)計(jì)是通信工程程等專業(yè)的重重要專業(yè)實(shí)踐踐環(huán)節(jié)，目的的是培養(yǎng)學(xué)生生科學(xué)理論結(jié)結(jié)合實(shí)際工程程的能力。通通過(guò)該課程設(shè)設(shè)計(jì)，要求學(xué)學(xué)生應(yīng)用多門門專業(yè)基礎(chǔ)課課知識(shí)：如線線性電子線路路、非線性電電子線路、EEDA技術(shù)、DDSP技術(shù)、MMATLABB、C語(yǔ)言程程序設(shè)計(jì)、信信號(hào)與系統(tǒng)、電電子測(cè)量、通通信原理等，結(jié)結(jié)合實(shí)驗(yàn)中心心的實(shí)驗(yàn)設(shè)備備，設(shè)計(jì)現(xiàn)代代數(shù)字通信系系統(tǒng)中的組成成部分方案及及實(shí)驗(yàn)驗(yàn)證。1.2 設(shè)計(jì)要要求本課程設(shè)計(jì)要求求學(xué)生理解一一般電子系統(tǒng)統(tǒng)的基本工作作原理，掌握握系統(tǒng)的性能能指標(biāo)的含

9、義義和計(jì)算方法法，得到仿真真和實(shí)測(cè)結(jié)果果。本組題目為多媒媒體信息處理理，要求設(shè)計(jì)計(jì)視頻壓縮系系統(tǒng)中的運(yùn)動(dòng)動(dòng)估計(jì)算法：全搜索法（FFS: Fuull Seearch）和和三步法(TTSS: TThree Step Searcch)，比較較二種方法的的搜索點(diǎn)和每每幀的峰值信信噪比（PSSNR： ppeak ssignall to nnoise ratioo）。要求完成以下下任務(wù)：1）編制算法代代碼；2）對(duì)視頻進(jìn)行行運(yùn)動(dòng)估計(jì)；3）計(jì)算PSNNR。2 視頻壓縮介介紹2.1 視頻壓壓縮技術(shù)發(fā)展展概況及國(guó)際際標(biāo)準(zhǔn)視頻壓縮編碼開(kāi)開(kāi)始于19770年美國(guó)貝貝爾實(shí)驗(yàn)室中中第一部電話話的出現(xiàn)。傳傳統(tǒng)的壓縮編編碼是建

10、立在在香農(nóng)信息論論基礎(chǔ)上的：1948 年香農(nóng)的經(jīng)經(jīng)典論文通信的數(shù)學(xué)學(xué)原理首次提出并并建立了信息息率失真函數(shù)數(shù)概念，19959 年，香香農(nóng)進(jìn)一步確確立了碼率失失真理論，奠奠定了信息編編碼的理論基基礎(chǔ)。主要的的編碼方法有有預(yù)測(cè)編碼、變變換編碼和統(tǒng)統(tǒng)計(jì)編碼，稱稱為三大經(jīng)典典編碼方法。這這類方法以經(jīng)經(jīng)典的集合論論為基礎(chǔ)，用用統(tǒng)計(jì)概率模模型來(lái)描述信信源，但它未未考慮信息接接受者的主觀觀特性、主觀觀意義及事件件本身的具體體含義、重要要程度和可能能導(dǎo)致的后果果。為了更好地促進(jìn)進(jìn)互操作性，視視頻壓縮編解解碼開(kāi)始進(jìn)入入標(biāo)準(zhǔn)化階段段。目前，制制定標(biāo)準(zhǔn)的組組織包括國(guó)際際電信聯(lián)盟（IITU）、美美國(guó) AMSSI 委員

11、會(huì)會(huì)電信委員會(huì)會(huì)、電信工業(yè)業(yè)聯(lián)合會(huì)（TTIA）、歐歐洲電信標(biāo)準(zhǔn)準(zhǔn)機(jī)構(gòu)（ETTSI）、日日本電信技術(shù)術(shù)委員會(huì)（TTIC）、美美國(guó)電器電子子工程師學(xué)會(huì)會(huì)（IEEEE）和國(guó)際標(biāo)標(biāo)準(zhǔn)化組織（IISO）等。隨著產(chǎn)業(yè)化活動(dòng)動(dòng)的進(jìn)一步開(kāi)開(kāi)展，國(guó)際標(biāo)標(biāo)準(zhǔn)化組織于于 19988 年成立了了運(yùn)動(dòng)圖像壓壓縮編碼組織織 MPEGG。MPEGG 專家組主主要致力于運(yùn)運(yùn)動(dòng)圖像壓縮縮編碼標(biāo)準(zhǔn)的的制定。經(jīng)過(guò)過(guò)專家組不懈懈的努力，一一系列主要針針對(duì)視頻數(shù)據(jù)據(jù)的存儲(chǔ)、廣廣播電視和視視頻流的網(wǎng)絡(luò)絡(luò)傳輸?shù)葢?yīng)用用場(chǎng)合的視頻頻壓縮編碼國(guó)國(guó)際標(biāo)準(zhǔn)產(chǎn)生生了：MPEEG-1、MPEG-2、MPEGG-4、MPEGG-7。而由另一個(gè)國(guó)際際標(biāo)準(zhǔn)化

12、組織織 ITU 制定的標(biāo)準(zhǔn)準(zhǔn)主要是針對(duì)對(duì)實(shí)時(shí)視頻通通訊的應(yīng)用，如如視頻會(huì)議和和可視電話等等，它們以 H.26xx 命名，主主要有：H.261、H.263、H.2664。2003 年 3 月，由由 ITU-T 和 MMPEG 兩兩個(gè)專家組組組成的聯(lián)合視視頻專家組（JJVT）開(kāi)發(fā)發(fā)并公布的被被稱為ITUU-T的H.264協(xié)議議或ISO/IEC的MMPEG-44的高級(jí)視頻頻編碼部分是是目前最新的的視頻編碼標(biāo)標(biāo)準(zhǔn)。為了降降低碼率，獲獲得盡可能更更好的圖像質(zhì)質(zhì)量，H.2264 標(biāo)準(zhǔn)準(zhǔn)吸取了 MMPEG-44 的長(zhǎng)處，克克服了以前標(biāo)標(biāo)準(zhǔn)的弱點(diǎn)，具具有更高的壓壓縮比、更好好的信道適應(yīng)應(yīng)性。這些視視頻壓縮編碼

13、碼國(guó)際標(biāo)準(zhǔn)的的制定很好地地促進(jìn)了視頻頻壓縮編碼技技術(shù)和相關(guān)的的多媒體通信信技術(shù)的發(fā)展展。2.2視頻壓縮縮中的主要研研究?jī)?nèi)容視頻圖像中存在在冗余信息，即相關(guān)性。主主要的冗余信信息有空間冗冗余信息和時(shí)時(shí)間冗余信息息?？臻g冗余余信息是指在在一幀圖像中中像素之間的的相關(guān)性。一一幀圖像中，相鄰或相近近的像素，其灰度值或或色度分量的的值總是很相相近，相鄰像素之之間存在很強(qiáng)強(qiáng)的相關(guān)性。而而相鄰幀之間間的時(shí)間間隔隔是由幀率決決定的。幀率率越大，相鄰幀之間間的時(shí)間間隔隔就越小，一般是幾十十毫秒。在這這樣短的時(shí)間間內(nèi)，大部分被拍拍攝的對(duì)象都都是靜止不動(dòng)動(dòng)或只有很小小的移動(dòng)，因此視頻序序列中存在時(shí)時(shí)間上的冗余余信息

14、。視頻頻壓縮主要就就是從時(shí)域、空空域兩方面去去除冗余信息息。(1) 去時(shí)域域冗余視頻圖像是沿時(shí)時(shí)間軸方向的的一個(gè)幀序列列，其幀間圖像像相關(guān)性很強(qiáng)強(qiáng)。具體表現(xiàn)現(xiàn)為兩幀有很多靜止圖圖像其數(shù)據(jù)是是不變的。實(shí)實(shí)現(xiàn)幀間編碼碼的方法是運(yùn)運(yùn)動(dòng)估計(jì)和運(yùn)運(yùn)動(dòng)補(bǔ)償。其原理是利用幀幀間的時(shí)間相相關(guān)性，減小時(shí)間冗冗余度。幀間間編碼可以減減小冗余度，這是因?yàn)閮蓛蓭g有很很大的相似性性。將前后兩兩幀相減(移移動(dòng)物體作相相應(yīng)位移)得得到的誤差作作編碼所需比比特要比直接接進(jìn)行幀內(nèi)編編碼所需的比比特少，幀間差值集集中在零附近近,可以用短短的碼字傳送送。(2)去空間冗冗余視頻圖像的幀內(nèi)內(nèi)數(shù)據(jù)和預(yù)測(cè)測(cè)的幀間誤差差數(shù)據(jù)，都有很高的

15、的空域冗余信信息。可用于于減少空域冗冗余信息的技技術(shù)很多，主要都是基基于塊的技術(shù)術(shù)。在基于塊塊的空間冗余余技術(shù)領(lǐng)域中中，變換編碼技技術(shù)是最常用用的方法，歸納起來(lái)，可分為三個(gè)個(gè)階段：正交變換、對(duì)對(duì)變換系數(shù)進(jìn)進(jìn)行量化、及及編碼三個(gè)階階段。正交變換：正交交變換是將空空域圖像信號(hào)號(hào)映射變換到到另一個(gè)正交交矢量空間如如頻域，產(chǎn)生一批變變換系數(shù)，然后對(duì)這些些變換系教進(jìn)進(jìn)行編碼處理理。最常用的的為DCT變變換，它與K-L最佳變換換壓縮性能和和誤差非常接接近，而且計(jì)算量量適中，又具有可分分離特性，還有快速算算法等特點(diǎn)，所以在圖像像數(shù)據(jù)壓縮中中，采用DCTT變換編碼的的方案很多。量化：變換后系系數(shù)的量化是是關(guān)鍵

16、的操作作，量化使變換換后的系數(shù)用用較少的位數(shù)數(shù)來(lái)表示，量化器結(jié)合合編碼才使大大部分?jǐn)?shù)據(jù)得得以壓縮。它它是不可逆的的，是有損的壓壓縮方法。編碼：量化后數(shù)數(shù)據(jù)在編碼后后輸出。將數(shù)數(shù)據(jù)有效統(tǒng)計(jì)計(jì)，消除編碼冗冗余，有效地壓縮縮數(shù)據(jù)量。2.3 視頻壓壓縮技術(shù)面臨臨的挑戰(zhàn)近年來(lái)，新的視視頻業(yè)務(wù)的興興起，如視頻頻會(huì)議、視頻頻點(diǎn)播、遠(yuǎn)程程監(jiān)控、遠(yuǎn)程程醫(yī)療等，對(duì)對(duì)視頻數(shù)據(jù)的的實(shí)時(shí)性傳輸輸和視頻質(zhì)量量提出了較之之以前更高的的要求，但互互聯(lián)網(wǎng)和無(wú)線線網(wǎng)固有的局局限性給視頻頻應(yīng)用業(yè)務(wù)帶帶來(lái)很大的問(wèn)問(wèn)題，也給視視頻數(shù)據(jù)壓縮縮技術(shù)提出了了更高的要求求。視頻數(shù)據(jù)據(jù)壓縮技術(shù)主主要面臨以下下幾個(gè)急需解解決的問(wèn)題：（1）視頻數(shù)據(jù)

17、據(jù)的高效壓縮縮問(wèn)題。雖然然網(wǎng)絡(luò)的發(fā)展展可使有效帶帶寬變的越來(lái)來(lái)越寬，但事事實(shí)上網(wǎng)絡(luò)用用戶數(shù)量的增增長(zhǎng)速度比有有效帶寬的增增長(zhǎng)速度快得得多，而且在在網(wǎng)絡(luò)上傳輸輸?shù)囊曨l信息息也日益增多多，因此視頻頻數(shù)據(jù)的有效效壓縮是目前前視頻數(shù)據(jù)壓壓縮技術(shù)面臨臨的一個(gè)必須須解決的問(wèn)題題。（2）能夠適應(yīng)應(yīng)網(wǎng)絡(luò)帶寬變變化和具備一一定的容錯(cuò)能能力。由于通通信子網(wǎng)的異異構(gòu)特性，使使得網(wǎng)絡(luò)帶寬寬波動(dòng)和傳輸輸錯(cuò)誤不可避避免，因此，對(duì)對(duì)視頻數(shù)據(jù)壓壓縮技術(shù)的要要求不再是單單純的追求某某一固定碼率率下的壓縮效效率，而是在在保證高壓縮縮效率的前提提下，要求壓壓縮后的視頻頻碼流能夠在在一定的帶寬寬范圍內(nèi)提供供較好的視頻頻質(zhì)量。同時(shí)，還

18、要要求在保證高高壓縮效率的的前提下，生生成的碼流具具有一定的容容錯(cuò)特性來(lái)抵抵抗傳輸錯(cuò)誤誤的影響。2.4 運(yùn)動(dòng)估估計(jì)在視頻壓壓縮中的重要要性視頻數(shù)據(jù)壓縮主主要通過(guò)三種種技術(shù)手段來(lái)來(lái)實(shí)現(xiàn)：利用用 DCT 變換和矢量量量化來(lái)消除除視頻幀內(nèi)空空間冗余；利利用熵編碼來(lái)來(lái)消除編碼冗冗余；利用運(yùn)運(yùn)動(dòng)估計(jì)來(lái)消消除幀間時(shí)間間冗余。而幀幀間時(shí)間冗余余度遠(yuǎn)大于幀幀內(nèi)空間冗余余度和編碼冗冗余度，因此此，運(yùn)動(dòng)估計(jì)計(jì)是視頻壓縮縮編碼系統(tǒng)中中非常重要的的模塊，它直直接影響到視視頻數(shù)據(jù)壓縮縮編碼的效率率和編碼質(zhì)量量。運(yùn)動(dòng)估計(jì)計(jì)的越準(zhǔn)確，編編碼的效率就就越高，解碼碼出來(lái)的視頻頻質(zhì)量就越好好。同時(shí)，運(yùn)運(yùn)動(dòng)估計(jì)的計(jì)計(jì)算復(fù)雜度在在整

19、個(gè)視頻數(shù)數(shù)據(jù)壓縮編碼碼系統(tǒng)中最大大，占整個(gè)系系統(tǒng)計(jì)算量的的 50%以上上。因此，運(yùn)運(yùn)動(dòng)估計(jì)性能能的好壞不僅僅很大程度上上決定了視頻頻圖像壓縮編編碼的質(zhì)量，還還根本性地決決定了整個(gè)視視頻壓縮編碼碼系統(tǒng)的實(shí)時(shí)時(shí)性能。研究究高效的運(yùn)動(dòng)動(dòng)估計(jì)算法對(duì)對(duì)提高視頻數(shù)數(shù)據(jù)壓縮編碼碼的效率有著著非常重要的的實(shí)際意義，是是解決目前視視頻數(shù)據(jù)的高高效壓縮問(wèn)題題的有效途徑徑。3 視頻壓縮系系統(tǒng)中的運(yùn)動(dòng)動(dòng)估計(jì)技術(shù)3.1 視頻壓壓縮系統(tǒng)的基基本框架本小節(jié)將對(duì)H.26x和MMPEG-xx系列視頻壓壓縮國(guó)際標(biāo)準(zhǔn)準(zhǔn)制定的視頻頻壓縮系統(tǒng)的的框架進(jìn)行提提煉，說(shuō)明視視頻壓縮系統(tǒng)統(tǒng)的一般性結(jié)結(jié)構(gòu)。一般地，人們把把H.26xx系列和MP

20、PEG-1、MMPEG-22稱為基于第第一代壓縮編編碼結(jié)構(gòu)的視視頻壓縮編碼碼標(biāo)準(zhǔn)。基于于“第一代壓壓縮編碼結(jié)構(gòu)構(gòu)”是指這些些編碼標(biāo)準(zhǔn)采采用的視頻壓壓縮編碼框架架都是由預(yù)測(cè)測(cè)編碼、變換換編碼、熵編編碼及運(yùn)動(dòng)補(bǔ)補(bǔ)償這四個(gè)模模塊組成的。對(duì)對(duì)視頻圖像的的壓縮編碼一一般有兩個(gè)部部分：一部分分是幀內(nèi)編碼碼，也就是 I 幀編碼碼，這部分的的編碼方式與與一般的靜止止圖像的編碼碼方式一樣，編編碼過(guò)程是先先將圖像幀進(jìn)進(jìn)行分塊離散散余弦變換（DDCT），然然后將 DCCT 系數(shù)量量化重排經(jīng)可可變長(zhǎng)編碼（VVLC）形成成碼流輸出；另一部分是是幀間編碼，即即P 幀和BB幀編碼，這這部分的編碼碼結(jié)構(gòu)比較復(fù)復(fù)雜，圖 33-

21、1 說(shuō)明了了幀間編碼的的基本過(guò)程。圖 3-1 幀幀間預(yù)測(cè)編碼碼模塊的一般般結(jié)構(gòu)當(dāng)圖像幀采用幀幀間編碼模式式時(shí)，輸入的的待編碼原始始圖像數(shù)據(jù)先先與經(jīng)運(yùn)動(dòng)估估計(jì)后的預(yù)測(cè)測(cè)圖像相減，產(chǎn)產(chǎn)生殘差圖像像，接著對(duì)殘殘差圖像進(jìn)行行 DCT 變換和量化化后經(jīng)熵編碼碼后形成編碼碼比特流輸出出；同時(shí)對(duì)由由運(yùn)動(dòng)估計(jì)得得到的運(yùn)動(dòng)矢矢量也要進(jìn)行行編碼形成碼碼流；這兩部部分的碼流組組合產(chǎn)生當(dāng)前前待壓縮圖像像幀的最后的的編碼比特流流。其中，PP 幀是參考考過(guò)去的 II 幀圖像或或者過(guò)去預(yù)測(cè)測(cè)得到的圖像像用運(yùn)動(dòng)補(bǔ)償償預(yù)測(cè)技術(shù)進(jìn)進(jìn)行編碼，這這些預(yù)測(cè)圖像像通常作為進(jìn)進(jìn)一步預(yù)測(cè)的的參考圖像，預(yù)預(yù)測(cè)圖像的編編碼效率較高高；而 B 幀

22、在預(yù)測(cè)時(shí)時(shí)，既可使用用前一幀圖像像作參考，也也可使用下一一幀圖像作參參考或同時(shí)使使用前后兩幀幀圖像作參考考圖像，即所所謂的雙向預(yù)預(yù)測(cè)，因此 B 幀的壓壓縮率最高，但但雙向預(yù)測(cè)圖圖像不再作為為預(yù)測(cè)的參考考圖像，這主主要是為了保保證比較好的的預(yù)測(cè)精度。解碼則是編碼的的逆過(guò)程。對(duì)對(duì)采用幀內(nèi)編編碼的 I 幀圖像，解解碼時(shí)碼流經(jīng)經(jīng)反量化、離離散余弦反變變換后直接輸輸出；對(duì)于采采用幀間編碼碼的 P 幀圖像像和 B 幀圖像像的解碼，則則需根據(jù)幀存存儲(chǔ)器中的參參考幀圖像和和當(dāng)前幀的運(yùn)運(yùn)動(dòng)矢量數(shù)據(jù)據(jù)，進(jìn)行運(yùn)動(dòng)動(dòng)補(bǔ)償，得到到當(dāng)前幀的預(yù)預(yù)測(cè)圖像，然然后與當(dāng)前幀幀的重建殘差差圖像相加后后輸出。綜上所述，目前前的視頻壓

23、縮縮編碼國(guó)際標(biāo)標(biāo)準(zhǔn)基本上都都是采用基于于DCT變換和和運(yùn)動(dòng)補(bǔ)償?shù)牡幕旌暇幋a框框架，利用DDCT變換去去除圖像空間間冗余，以運(yùn)運(yùn)動(dòng)估計(jì)與運(yùn)運(yùn)動(dòng)補(bǔ)償來(lái)去去除運(yùn)動(dòng)圖像像時(shí)間冗余，從從而達(dá)到壓縮縮圖像數(shù)據(jù)的的目的。I 幀圖像利用用圖像本身的的空間相關(guān)性性進(jìn)行壓縮，采采用基于 DDCT 的編編碼技術(shù)，編編碼不需要其其他幀作參考考圖像，反而而是要作為 P 幀和 B 幀圖像像的參考圖像像，其壓縮率率并不高，同同時(shí)為提供足足夠高的預(yù)測(cè)測(cè)精度，其壓壓縮比也不能能太高；視頻頻壓縮中更多多的是 P 幀和 B 幀圖像像編碼類型，運(yùn)運(yùn)動(dòng)估計(jì)與補(bǔ)補(bǔ)償技術(shù)正是是于消除 P 幀和 B 幀圖像像在時(shí)間上的的冗余，具有有比較高的

24、壓壓縮比彈性，這這部分是決定定視頻編碼系系統(tǒng)的壓縮效效率的關(guān)鍵環(huán)環(huán)節(jié)。不同的的視頻壓縮編編碼國(guó)際標(biāo)準(zhǔn)準(zhǔn)針對(duì)不同的的應(yīng)用，采取取不同的運(yùn)動(dòng)動(dòng)估計(jì)與補(bǔ)償償策略來(lái)提高高幀間編碼效效率，從而提提高視頻壓縮縮系統(tǒng)的整體體性能。3.2 運(yùn)動(dòng)估估計(jì)視頻序列在時(shí)間間域的冗余度度很大，因此此在視頻壓縮縮和視頻通信信中，不需要要將每一幀的的所有像素信信息傳輸?shù)浇饨獯a器端，而而只需要傳輸輸對(duì)象運(yùn)動(dòng)信信息，解碼器器即可根據(jù)前前一幀圖像和和運(yùn)動(dòng)信息更更新當(dāng)前幀，從從而達(dá)到壓縮縮的目的，這這種方法的關(guān)關(guān)鍵是確定運(yùn)運(yùn)動(dòng)信息，即即進(jìn)行運(yùn)動(dòng)估估計(jì)。視頻數(shù)數(shù)據(jù)壓縮主要要通過(guò)三種技技術(shù)手段來(lái)實(shí)實(shí)現(xiàn):利用DDCT變換和和矢量量化來(lái)來(lái)

25、消除視頻幀幀內(nèi)的空間冗冗余;利用熵熵編碼來(lái)消除除編碼冗余;利用運(yùn)動(dòng)估估計(jì)來(lái)消除幀幀間的時(shí)間冗冗余。運(yùn)動(dòng)估計(jì)是指在在參考幀中搜搜索一個(gè)與當(dāng)當(dāng)前幀圖像塊塊最相似的圖圖像塊，即最最佳匹配塊，搜搜索結(jié)果用運(yùn)運(yùn)動(dòng)向量來(lái)表表示。由于運(yùn)運(yùn)動(dòng)估計(jì)在整整個(gè)系統(tǒng)中的的計(jì)算復(fù)雜度度最大，因此此，如何提高高運(yùn)動(dòng)估計(jì)的的效率，是運(yùn)運(yùn)動(dòng)估計(jì)算法法的搜索過(guò)程程更健壯、更更快速、更高高效成為了視視頻編碼技術(shù)術(shù)研究的重點(diǎn)點(diǎn)。運(yùn)動(dòng)矢量量和經(jīng)過(guò)運(yùn)動(dòng)動(dòng)匹配后得到到的預(yù)測(cè)誤差差共同發(fā)送到到解碼端，在在解碼端按照照運(yùn)動(dòng)矢量指指明的位置，從從已經(jīng)解碼的的鄰近參考幀幀圖像中找到到相應(yīng)的塊或或宏塊，和預(yù)預(yù)測(cè)誤差相加加后就得到了了塊或宏塊在在當(dāng)

26、前幀中的的位置。通過(guò)過(guò)運(yùn)動(dòng)估計(jì)可可以去除幀間間冗余度，使使得視頻傳輸輸?shù)谋忍財(cái)?shù)大大為減少，因因此，運(yùn)動(dòng)估估計(jì)是視頻壓壓縮處理系統(tǒng)統(tǒng)中的一個(gè)重重要組成部分分。3.2.1 運(yùn)運(yùn)動(dòng)估計(jì)的基基本原理運(yùn)動(dòng)圖像多數(shù)情情況下只是其其中的很少一一部分圖像在在運(yùn)動(dòng)，同一一場(chǎng)景相鄰的的兩幀圖像之之間在內(nèi)容上上的差異不會(huì)會(huì)太大，也就就是說(shuō)相鄰兩兩幀，甚至是是相鄰數(shù)幀的的內(nèi)容有很多多是重復(fù)的。這這說(shuō)明相鄰的的圖像幀是相相關(guān)的，用香香農(nóng)的信息論論觀點(diǎn)解釋就就是運(yùn)動(dòng)圖像像存在數(shù)據(jù)冗冗余，即時(shí)間間冗余。一般般的視頻圖像像中都存在大大量的時(shí)間冗冗余。采用幀間預(yù)測(cè)編編碼可以顯著著去除時(shí)間域域上的冗余度度，提高壓縮縮比。如果將將

27、上一幀相同同空間位置處處的像素值作作為待編碼的的當(dāng)前幀的預(yù)預(yù)測(cè)值，這種種預(yù)測(cè)對(duì)圖像像中的靜止背背景部分將是是很有效的。但但是對(duì)于運(yùn)動(dòng)動(dòng)部分，這種種不考慮物體體運(yùn)動(dòng)的簡(jiǎn)單單的幀間預(yù)測(cè)測(cè)效果并不好好。運(yùn)動(dòng)估計(jì)計(jì)可以確定出出當(dāng)前幀的某某像素（或某某像素塊）是是從上一幀的的哪一個(gè)位置置移動(dòng)過(guò)來(lái)的的，獲得表示示它們相對(duì)位位移的運(yùn)動(dòng)矢矢量。有了運(yùn)運(yùn)動(dòng)矢量后，再再通過(guò)運(yùn)動(dòng)補(bǔ)補(bǔ)償?shù)玫剿鼈儌兊牟钪祲K。運(yùn)運(yùn)動(dòng)估計(jì)的精精度越高，差差值塊中的各各像素灰度值值也越小，甚甚至大部分都都為零，那么么用來(lái)表示差差值塊經(jīng) DDCT 變換換、量化和熵熵編碼后形成成的壓縮碼流流的比特位數(shù)數(shù)就越少，這這就達(dá)到了壓壓縮圖像數(shù)據(jù)據(jù)的目的

28、，而而且壓縮的空空間很大。3.2.2 運(yùn)運(yùn)動(dòng)估計(jì)技術(shù)術(shù)運(yùn)動(dòng)估計(jì)算法的的效率主要體體現(xiàn)在圖像質(zhì)質(zhì)量、壓縮碼碼率和搜索速速度三方面。運(yùn)運(yùn)動(dòng)估計(jì)越準(zhǔn)準(zhǔn)確，得到的的圖像質(zhì)量就就越高，視頻頻序列的比特特率就越低，運(yùn)運(yùn)動(dòng)估計(jì)中搜搜索速度越快快,就越有利利于視頻編碼碼系統(tǒng)的實(shí)時(shí)時(shí)應(yīng)用。提高高圖像質(zhì)量和和估計(jì)速度、降降低比特率是是運(yùn)動(dòng)估計(jì)算算法研究的目目標(biāo)。一般通通過(guò)研究初始始匹配點(diǎn)選擇擇、匹配準(zhǔn)則則、搜索策略略來(lái)提高運(yùn)動(dòng)動(dòng)估計(jì)算法的的效率。（1）初始匹配配點(diǎn)選擇a) 直接選取取參考幀對(duì)應(yīng)應(yīng)的（0，0）位置置這種方法簡(jiǎn)單，但但易陷入局部部最佳。如果果采用的算法法初始步長(zhǎng)太太大，而原點(diǎn)點(diǎn)又不是最優(yōu)優(yōu)點(diǎn)，有可能能

29、使快速搜索索跳出原點(diǎn)周周圍可能性比比較大的區(qū)域域而去搜索遠(yuǎn)遠(yuǎn)距離的點(diǎn)，導(dǎo)導(dǎo)致搜索方向向的不確定性性，故有可能能陷入局部最最優(yōu)。b) 選擇預(yù)測(cè)測(cè)的起點(diǎn)由于同一幀內(nèi)相相鄰塊之間的的空間相關(guān)性性和相鄰幀之之間很強(qiáng)的時(shí)時(shí)間相關(guān)性，許許多算法都利利用這種相關(guān)關(guān)性先對(duì)初始始搜索點(diǎn)進(jìn)行行預(yù)測(cè)，以預(yù)預(yù)測(cè)點(diǎn)作為搜搜索起點(diǎn)。實(shí)實(shí)驗(yàn)證明，預(yù)預(yù)測(cè)點(diǎn)越靠近近最佳匹配點(diǎn)點(diǎn)，運(yùn)動(dòng)矢量量的搜索次數(shù)數(shù)就越少。常用的幾種預(yù)測(cè)測(cè)初始搜索點(diǎn)點(diǎn)的方法有中中值預(yù)測(cè)法、相相鄰參考幀預(yù)預(yù)測(cè)及基于ASD值的初初始搜索點(diǎn)預(yù)預(yù)測(cè)。（2）匹配準(zhǔn)則則選取運(yùn)動(dòng)估計(jì)算法中中常用的匹配配準(zhǔn)則有三種種：最小絕對(duì)差差(MAD)，最小均方差差(MSE)和歸一化互

30、互相關(guān)函數(shù)(NCCF)。3.2.3搜索索范圍搜索區(qū)域最合適適的大小取決決于三個(gè)方面面：（1）每一幀的的清晰度：更更高的清晰度度要求更大的的搜索區(qū)域；（2）畫面的類類型：高速運(yùn)運(yùn)動(dòng)的畫面要要比低速運(yùn)動(dòng)動(dòng)的畫面更適適合采用大的的搜索區(qū)域；（3）可用的處處理資源：由由于大的搜索索區(qū)域帶來(lái)更更多的運(yùn)算比比較操作，因因此需要更多多的處理。因此，并不一定定搜索區(qū)域越越大就越合適適。當(dāng)搜索區(qū)區(qū)域加大時(shí)，運(yùn)運(yùn)動(dòng)估計(jì)的性性能得到了提提高，但是，需需要處理的運(yùn)運(yùn)算量也加大大了。因此選選擇搜索區(qū)域域的大小要根根據(jù)實(shí)際處理理的圖像來(lái)確確定。3.2.4 搜搜索策略搜索策略是否恰恰當(dāng)對(duì)運(yùn)動(dòng)估估計(jì)的準(zhǔn)確性性、運(yùn)動(dòng)估計(jì)計(jì)的

31、速度都有有很大影響。有有關(guān)搜索策略略的研究主要要是解決運(yùn)動(dòng)動(dòng)估計(jì)中存在在的運(yùn)算復(fù)雜雜度和搜索精精度這一矛盾盾。目前運(yùn)動(dòng)動(dòng)估計(jì)的搜索索方法很多，有有全搜索法（FS）、二維對(duì)數(shù)法（TDL）、三步法（TSS）、交叉法（CS）、新三步法（NTSS）、四步法（FSS）、菱形法（DS）和運(yùn)動(dòng)場(chǎng)自適應(yīng)搜索算法（MVFAST）等。搜索策略的改進(jìn)進(jìn)是指以減少少搜索窗內(nèi)的的參與匹配計(jì)計(jì)算的匹配塊塊數(shù)目來(lái)達(dá)到到加快搜索速速度的，但是是這在一定程程度上會(huì)降低低搜索精度。搜搜索窗在運(yùn)動(dòng)動(dòng)估計(jì)開(kāi)始后后一般是固定定的，搜索窗窗內(nèi)匹配塊的的總數(shù)目也就就固定下來(lái)了了，如果搜索索策略是對(duì)搜搜索窗內(nèi)的所所有匹配塊都都逐一計(jì)算匹匹配

32、差值，那那么此時(shí)的計(jì)計(jì)算量將達(dá)到到最大。一般般參與匹配計(jì)計(jì)算的匹配塊塊數(shù)目越少，運(yùn)運(yùn)算量越少，搜搜索速度當(dāng)然然也越快，但但是搜索精度度卻會(huì)降低，這這正是這種運(yùn)運(yùn)動(dòng)估計(jì)改進(jìn)進(jìn)方法的缺點(diǎn)點(diǎn)，搜索速度度和搜索精度度此時(shí)是相互互矛盾的。因因此如何設(shè)計(jì)計(jì)搜索策略，使使得在最大限限度地減少參參與匹配計(jì)算算的匹配塊數(shù)數(shù)目同時(shí)又能能夠保證足夠夠的搜索精度度，這是設(shè)計(jì)計(jì)此類方法的的關(guān)鍵所在。設(shè)計(jì)好的搜索策策略，要利用用運(yùn)動(dòng)矢量分分布的一般特特性。通常，運(yùn)運(yùn)動(dòng)矢量總是是高度集155中在搜索窗窗口的中心附附近，即中心心偏置特性，這這是因?yàn)樵趫D圖像序列中，靜靜止塊和緩慢慢運(yùn)動(dòng)塊占主主導(dǎo)地位。具具體來(lái)說(shuō)，運(yùn)運(yùn)動(dòng)矢量一般

33、般分布在以搜搜索窗口中心心為圓心，兩兩個(gè)像素間距距為半徑的范范圍內(nèi)，如圖圖3-4 所示。運(yùn)動(dòng)動(dòng)矢量的另一一個(gè)特性是時(shí)時(shí)空相關(guān)性，即即在視頻序列列圖像中，物物體的運(yùn)動(dòng)在在時(shí)間和空間間上具有很強(qiáng)強(qiáng)的相關(guān)性。在在基于塊的運(yùn)運(yùn)動(dòng)估計(jì)中，由由于物體運(yùn)動(dòng)動(dòng)是連續(xù)的，即即相鄰幀對(duì)應(yīng)應(yīng)位置塊的運(yùn)運(yùn)動(dòng)矢量具有有時(shí)間上的相相關(guān)性，同時(shí)時(shí)由于圖像中中對(duì)象和背景景都覆蓋相當(dāng)當(dāng)多的塊，且且屬于同一對(duì)對(duì)象或背景的的塊的運(yùn)動(dòng)場(chǎng)場(chǎng)也具有很大大的相似性，因因此可以利用用時(shí)間、空間間上的相鄰塊塊來(lái)預(yù)測(cè)當(dāng)前前塊的運(yùn)動(dòng)矢矢量的動(dòng)態(tài)范范圍，由此自自適應(yīng)的選擇擇、設(shè)計(jì)較理理想的搜索策策略。圖 3-4 運(yùn)運(yùn)動(dòng)矢量中心心偏移分布特特性示意圖

34、4 運(yùn)動(dòng)估計(jì)算算法分析在各種視頻編碼碼標(biāo)準(zhǔn)中，廣泛采用基基于塊匹配的的運(yùn)動(dòng)估計(jì)與與補(bǔ)償技術(shù)來(lái)來(lái)減少時(shí)間冗冗余。下面對(duì)對(duì)已有的一些些常用的基于于塊匹配法的的快速運(yùn)動(dòng)估估計(jì)算法進(jìn)行行簡(jiǎn)要討論和和分析。4.1 基于塊塊匹配的運(yùn)動(dòng)動(dòng)估計(jì)技術(shù)作為幀間壓縮模模塊的核心和和關(guān)鍵環(huán)節(jié)，運(yùn)運(yùn)動(dòng)估計(jì)技術(shù)術(shù)受到人們的的廣泛關(guān)注，出出現(xiàn)了多種研研究方案，主主要有光流方方程法、貝葉葉斯估計(jì)法、像像素遞歸法和和塊匹配法四四種。綜合考考慮計(jì)算復(fù)雜雜度和編碼效效率等因素，塊塊匹配法由于于簡(jiǎn)單、便于于 VLSII 實(shí)現(xiàn)，已已經(jīng)成為運(yùn)動(dòng)動(dòng)估計(jì)算法的的主流，各個(gè)個(gè)視頻壓縮國(guó)國(guó)際標(biāo)準(zhǔn)也都都采用塊匹配配法作為運(yùn)動(dòng)動(dòng)估計(jì)的解決決方案。4

35、.1.1 塊塊匹配運(yùn)動(dòng)估估計(jì)的基本原原理基于塊匹配法的的運(yùn)動(dòng)估計(jì)的的基本思想就就是將圖像序序列的每一幀幀分成許多互互不重疊的宏宏塊，并認(rèn)為為宏塊內(nèi)所有有像素的位移移量都相同，然后對(duì)于當(dāng)當(dāng)前幀中的每每一塊到前一一幀或后一幀幀某一給定搜搜索范圍內(nèi)根根據(jù)一定的匹匹配準(zhǔn)則找出出與當(dāng)前塊最最相似的塊，即即匹配塊，由由匹配塊與當(dāng)當(dāng)前塊的相對(duì)對(duì)位置計(jì)算出出運(yùn)動(dòng)位移，所所得運(yùn)動(dòng)位移移即為當(dāng)前塊塊的運(yùn)動(dòng)矢量量。利用搜索索得到的運(yùn)動(dòng)動(dòng)矢量在參考考幀上進(jìn)行運(yùn)運(yùn)動(dòng)補(bǔ)償，殘殘差值經(jīng) DDCT 變換換、量化、行行程編碼后與與運(yùn)動(dòng)矢量共共同經(jīng)熵編碼碼，然后以比比特流形式傳傳出去。圖 4-1 為塊匹配配運(yùn)動(dòng)估計(jì)基基本思想的示

36、示意圖。圖 4-1 塊塊匹配運(yùn)動(dòng)估估計(jì)基本思想想的示意圖4.1.2塊匹匹配法視頻編碼技術(shù)在在數(shù)字電視、高高清晰度電視視、可視電話話、會(huì)議電視視和多媒體視視頻通信服務(wù)務(wù)中起著至關(guān)關(guān)重要的作用用。在H.226x和MPEG這些些視頻壓縮國(guó)國(guó)際標(biāo)準(zhǔn)中視視頻系統(tǒng)編碼碼器的復(fù)雜性性最主要取決決于運(yùn)動(dòng)估計(jì)計(jì)。在視頻編碼過(guò)程程中把圖像分分割成有不同同運(yùn)動(dòng)的物體體是比較困難難的。通常采采用兩種比較較簡(jiǎn)單的方法法，一是把圖像像分成若干個(gè)個(gè)矩形塊，假定塊做平平移運(yùn)動(dòng)，對(duì)塊進(jìn)行匹匹配運(yùn)動(dòng)估計(jì)計(jì)。另一種方方法是對(duì)每個(gè)個(gè)象素的位移移進(jìn)行遞歸估估計(jì)。通常象象素的遞歸估估計(jì)的精度高高，對(duì)多運(yùn)動(dòng)畫畫面的適應(yīng)性性強(qiáng)，但它的跟蹤蹤

37、范圍小，實(shí)現(xiàn)復(fù)雜。塊塊匹配運(yùn)動(dòng)估估計(jì)雖然精度度較低，但它的位移移跟蹤能力強(qiáng)強(qiáng)，且容易實(shí)現(xiàn)現(xiàn)。由于受帶寬的限限制及實(shí)時(shí)視視頻回放的迫迫切需要，視頻編碼成成為許多圖像像通信應(yīng)用中中不可缺少的的過(guò)程，并且總是要要求很高的壓壓縮比。為此此，首先必須很很好地辨識(shí)視視頻序列中相相鄰幀間的相相關(guān)性，并消除所謂謂的時(shí)間冗余余。在各種視視頻編碼標(biāo)準(zhǔn)準(zhǔn)，如H.2611，H.2633，MPEG-1，MPEG-2及MPEG-4中，廣泛采用塊塊匹配運(yùn)動(dòng)估估計(jì)(Blooek Matchhing Algorrithm，BMA)與補(bǔ)補(bǔ)償技術(shù)來(lái)減減少時(shí)間冗余余。因此,發(fā)展快速且且精確的塊匹匹配運(yùn)動(dòng)估計(jì)計(jì)算法具有非非常重要的意意

38、義。塊匹配配法實(shí)現(xiàn)效果果主要取決于于三個(gè)因素：匹配準(zhǔn)則、搜搜索范圍和搜搜索方法。實(shí)用匹配準(zhǔn)則有有很多種，兩種常用的的塊匹配準(zhǔn)則則為絕對(duì)差值值和SAD以及絕對(duì)對(duì)方差和SSSE，和這里分別表表示當(dāng)前塊和和參考?jí)K圖像像。(i,jj)代表參考考?jí)K相對(duì)當(dāng)前前塊的位移。SAD對(duì)每個(gè)象素的算術(shù)平均即為平均差值和MAD，SSE對(duì)每個(gè)象素的算術(shù)平均即為平均方差MSE。選用SAD和MAD準(zhǔn)則可以避免乘法運(yùn)算，而SAD運(yùn)算量最小，便于硬件實(shí)現(xiàn)，所以用得最多。搜索范圍一般以以宏塊和塊為為單位，而搜索方式式是影響塊匹匹配法性能的的主要因素，也是運(yùn)動(dòng)估估計(jì)算法中的的關(guān)鍵技術(shù)。塊匹配原理如圖圖4-2所示，其基本思想想是將

39、當(dāng)前幀幀分成若干個(gè)個(gè)M*N大小相同的的塊(各類視頻壓壓縮標(biāo)準(zhǔn)中塊塊大小均為（16*16），對(duì)每一個(gè)塊塊(當(dāng)前塊)分別在參考考幀中的一定定區(qū)域(稱為搜索窗窗口)內(nèi)，假設(shè)當(dāng)前塊塊相對(duì)參考?jí)K塊最大位移為為d個(gè)象素，那么，參考幀內(nèi)與與當(dāng)前塊相對(duì)對(duì)應(yīng)的坐標(biāo)附附近N+2d范圍為搜搜索范圍。當(dāng)當(dāng)前塊按照一一定的匹配準(zhǔn)準(zhǔn)則在參考幀幀中搜索與之之最接近的塊塊(稱為預(yù)測(cè)塊塊)，預(yù)測(cè)塊與當(dāng)當(dāng)前塊間的位位移稱為運(yùn)動(dòng)動(dòng)矢量，它們的像素素間的差值稱稱為殘差塊，預(yù)測(cè)塊與當(dāng)當(dāng)前塊之間通通過(guò)匹配準(zhǔn)則則函數(shù)得到的的值稱為塊失失真度(BDDM)。這樣樣在已知參考考幀視頻數(shù)據(jù)據(jù)時(shí)，當(dāng)前幀中的的每一塊數(shù)據(jù)據(jù)都可用一個(gè)個(gè)殘差塊和一一運(yùn)動(dòng)

40、矢量來(lái)來(lái)表示，顯然，殘差塊和運(yùn)運(yùn)動(dòng)矢量的值值越小，越有利于壓壓縮。因此運(yùn)運(yùn)動(dòng)估計(jì)的主主要目標(biāo)就是是使預(yù)測(cè)塊與與當(dāng)前塊之間間的BDM和運(yùn)動(dòng)動(dòng)矢量的值盡盡量小，匹配誤差最最小的參考?jí)K塊所對(duì)應(yīng)的位位移就是所求求的運(yùn)動(dòng)矢量量。圖4-2塊匹配配方法4.1.3塊匹匹配運(yùn)動(dòng)估計(jì)計(jì)算法的研究究現(xiàn)狀目前，塊匹配運(yùn)運(yùn)動(dòng)估計(jì)算法法中搜索精度度最高的是全全搜索法（FFS），它對(duì)對(duì)搜索范圍內(nèi)內(nèi)的每一個(gè)像像素點(diǎn)進(jìn)行匹匹配運(yùn)算以得得到一個(gè)最優(yōu)優(yōu)的運(yùn)動(dòng)矢量量。但它的計(jì)計(jì)算復(fù)雜度很很高，不適合合實(shí)時(shí)應(yīng)用。為為此很多學(xué)者者提出了許多多快速算法。早早期的三步法法（TSS）、二二維對(duì)數(shù)法（TDL）、交叉法（CS）等，主要是通過(guò)限制搜

41、索點(diǎn)的數(shù)目來(lái)減少計(jì)算量。但它們?cè)诘谝徊剿阉鞑介L(zhǎng)較大，不利于估計(jì)較小的運(yùn)動(dòng)。動(dòng)態(tài)搜索窗調(diào)整法（DSWA）根據(jù)當(dāng)前結(jié)果動(dòng)態(tài)調(diào)整下一步搜索步長(zhǎng)的大小，算法性能在一定程度上有了改進(jìn)。新三步法（NTSS）、四步法（FSS）和基于塊的梯度下降法（BBGDS）等利用運(yùn)動(dòng)矢量中心偏移的分布特性，有效提高了塊匹配速度，減少了陷入局部極小的可能性，但它們都是以原點(diǎn)作為初始搜索中心，沒(méi)有根據(jù)塊之間的相關(guān)性提供運(yùn)動(dòng)矢量預(yù)測(cè)值。預(yù)測(cè)搜索法（PSA）、自適應(yīng)運(yùn)動(dòng)跟蹤法（AMTS）等利用相鄰塊的運(yùn)動(dòng)相關(guān)性選擇一個(gè)反映當(dāng)前運(yùn)動(dòng)趨勢(shì)的預(yù)測(cè)點(diǎn)作為初始搜索點(diǎn)，以提高搜索速度和預(yù)測(cè)的準(zhǔn)確性。1999年 10 月，菱形搜索法（DS）被

42、 MPEG-4 國(guó)際標(biāo)準(zhǔn)采納并收入驗(yàn)證模型（VM）。雖然DS 算法的綜合性能較其他算法優(yōu)越，但它不能根據(jù)圖像的內(nèi)容做出靈活處理?？焖龠\(yùn)動(dòng)估計(jì)算法的較新成果Ma 等提出的 MVFAST 算法和 Tourapis 等提出的PMVFAST 算法在 DS 算法的基礎(chǔ)上利用了視頻圖像運(yùn)動(dòng)間的相關(guān)性確定菱形搜索的起始點(diǎn)，并根據(jù)運(yùn)動(dòng)的劇烈程度自適應(yīng)選擇大小菱形搜索模式，因此在搜索速度和搜索精度方面都有進(jìn)一步的提高。4.2全搜索法法4.2.1全搜搜索法原理要得到最佳匹配配的運(yùn)動(dòng)矢量量，最簡(jiǎn)單的的方法是讓ii和j在（-d，d)范范圍內(nèi)逐加點(diǎn)點(diǎn)取值，在每每一點(diǎn)計(jì)算塊塊匹配誤差，然然后求出相應(yīng)應(yīng)的運(yùn)動(dòng)矢量量，這就是

43、全全搜索法。用用FS計(jì)算一一個(gè)運(yùn)動(dòng)矢量量需做次塊匹匹配?；贔FS的算法性性能很好，且硬件實(shí)現(xiàn)現(xiàn)簡(jiǎn)單、規(guī)則則，但是計(jì)算量量很龐大，需要很多處處理單元，在要求實(shí)時(shí)時(shí)編碼的情況況下難以適用用。FS算法描述如如下：從原點(diǎn)點(diǎn)出發(fā)，按順順時(shí)針螺旋方方向由近及遠(yuǎn)遠(yuǎn)，在逐個(gè)像像素處計(jì)算MMAD值，直直到遍歷搜索索范圍內(nèi)聽(tīng)有有的點(diǎn)，然后后在計(jì)算的所所有點(diǎn)的MAAD中找到最最小值，該點(diǎn)點(diǎn)所在位置即即對(duì)應(yīng)最佳運(yùn)運(yùn)動(dòng)矢量。FFS算法程序序流程圖如圖圖4-3所示。獲取圖像獲取圖像分成N*N大小的塊分成N*N大小的塊進(jìn)行塊匹配進(jìn)行塊匹配計(jì)算MSE計(jì)算MSE計(jì)算MAD計(jì)算MAD比較比較結(jié)束結(jié)束圖4-3 全搜搜索算法程序

44、序流程圖4.2.2 全全搜索法特點(diǎn)點(diǎn)全搜索具有以下下一些特點(diǎn)：1）對(duì)搜索區(qū)域域的所有位置置進(jìn)行窮盡搜搜索；2）精度最高計(jì)計(jì)算復(fù)雜，難難以實(shí)時(shí)處理理；3）必須研究相相應(yīng)的運(yùn)動(dòng)估估計(jì)快速算法法。4.3 三步搜搜索法4.3.1 三三步搜索法原原理由于FS的運(yùn)算算量十分龐大大,為減小運(yùn)運(yùn)算量,先后后提出了許多多快速算法,這些算法均均試圖構(gòu)造快快速逼近最佳佳匹配位置的的搜索路徑,以盡量減少少冗余的塊匹匹配。典型的的算法為TSSS,其搜索索過(guò)程如圖44-4所示,這里里d=7,它它是通過(guò)三步步搜索,逐步步減小搜索步步長(zhǎng)。每次搜搜索都是以上上一步的搜索索結(jié)果為中心心,進(jìn)行周圍圍一定步長(zhǎng)的的3*3像素素的搜索。

45、第第一步,以窗窗口中心為中中心,步長(zhǎng)為為4,進(jìn)行周周圍8個(gè)點(diǎn)搜搜索,根據(jù)匹匹配準(zhǔn)則得到到一個(gè)最佳匹匹配點(diǎn),共搜搜索了9個(gè)點(diǎn)點(diǎn);第二步,以上步最佳佳匹配點(diǎn)為中中心,步長(zhǎng)為為2,繼續(xù)搜搜索周圍8個(gè)個(gè)點(diǎn)得到匹配配點(diǎn),共搜索索了8個(gè)點(diǎn);第三步,同同上一步,只只是步長(zhǎng)為11,最后得到到的最佳匹配配點(diǎn)就是要得得到的運(yùn)動(dòng)估估計(jì)的點(diǎn),從從而得到運(yùn)動(dòng)動(dòng)矢量。進(jìn)行行圖像的預(yù)測(cè)測(cè)共進(jìn)行了225次塊匹配配,同樣情況況下,采用FFS則需做2225次塊匹匹配。一般地地,TSS的的運(yùn)算量為次次塊匹配。TTSS運(yùn)算時(shí)時(shí)間明顯減少少,性能比FFS有所下降降,但它在硬硬件上容易實(shí)實(shí)現(xiàn),是一種種很常用的快快速搜索算法法。4-4 三

46、步搜搜索法4.3.2 三三步法特點(diǎn)1）搜索范圍為為；2）搜索模板半半徑依次減半半；3）確定方向早早，容易陷入入局部。4.4 峰值信信噪比峰值信噪比（PPSNR）是是一個(gè)表示信信號(hào)最大可能能功率和影響響它的表示精精度的破壞性性噪聲功率的的比值的工程程術(shù)語(yǔ)。由于于許多信號(hào)都都有非常寬的的動(dòng)態(tài)范圍，峰峰值信噪比常常用對(duì)數(shù)分貝貝單位來(lái)表示示。PSNRR是“Peakk Signnal too Noisse Rattio”的縮縮寫。PSNNR是一般是是用于最大值值信號(hào)和背景景噪音之間的的一個(gè)工程項(xiàng)項(xiàng)目。通常在在經(jīng)過(guò)影像壓壓縮之后，輸輸出的影像通通常都會(huì)有某某種程度與原原始影像不一一樣。為了衡衡量經(jīng)過(guò)處理

47、理后的影像品品質(zhì)，我們通通常會(huì)參考PPSNR 值值來(lái)認(rèn)定某個(gè)個(gè)處理程序夠夠不夠令人滿滿意。PSNNR計(jì)算公式式如（4-44）、（4-5）：（44-4）（44-5）Peak 就是是指8 biits 表示示法的最大值值255。I(角標(biāo)n)指原始影影像第n個(gè)pixell 值，P(角標(biāo)n)指經(jīng)處理理后的影像第第n個(gè)pixell 值。PSNRR 的單位為為dB。所以PSNNR值越大，就就代表失真越越少。PSNR 是最最普遍，最廣廣泛使用的評(píng)評(píng)鑒畫質(zhì)的客客觀量測(cè)法，不不過(guò)許多實(shí)驗(yàn)驗(yàn)結(jié)果都顯示示，PSNRR 的分?jǐn)?shù)無(wú)無(wú)法和人眼看看到的視覺(jué)品品質(zhì)完全一致致，有可能 PSNR 較高者看起起來(lái)反而比 PSNR

48、較低者差。這這是因?yàn)槿搜垩鄣囊曈X(jué)對(duì)于于誤差的敏感感度并不是絕絕對(duì)的，其感感知結(jié)果會(huì)受受到許多因素素的影響而產(chǎn)產(chǎn)生變化（例例如：人眼對(duì)對(duì)空間頻率較較低的對(duì)比差差異敏感度較較高，人眼對(duì)對(duì)亮度對(duì)比差差異的敏感度度較色度高，人人眼對(duì)一個(gè)區(qū)區(qū)域的感知結(jié)結(jié)果會(huì)受到其其周圍鄰近區(qū)區(qū)域的影響）。5 仿真結(jié)果文中的仿真實(shí)驗(yàn)驗(yàn)在配置為IIntel(R) coore ii5 CPU HYPERLINK mailto:244302.4GHz 243002.4GGHz 2.4GHz，8GB內(nèi)存，Winndows88專業(yè)版的PC平臺(tái)臺(tái)下，使用MMatlabb 20111b作為仿真平平臺(tái)，參考圖圖像如5-1和5-2所示。

49、圖5-1 第一一幀參考圖像圖圖5-2 第二幀幀參考圖像5.1 全搜索索算法仿真結(jié)結(jié)果全搜索算法得到到的仿真結(jié)果果如圖5-3、5-4、5-5和5-6所示。圖5-3 幀間間差值圖圖5-4 預(yù)測(cè)誤誤差圖像圖5-5 全搜索法估估計(jì)得到的第第二幀圖像圖5.6 運(yùn)動(dòng)動(dòng)位移矢量圖圖5.2 三步搜搜索法仿真結(jié)結(jié)果三步搜索算法得得到的仿真結(jié)結(jié)果如圖5-7、5-8、5-9和5-10所示。圖5-7 幀間間差值圖5-8 預(yù)測(cè)誤差差圖像圖5-9 三步步搜索法估計(jì)計(jì)得到的第二二幀圖像圖5-10 運(yùn)運(yùn)動(dòng)位移矢量量圖5.3仿真結(jié)果果分析通過(guò)實(shí)驗(yàn)我們得得到各種各種種匹配算法的的Matlaab執(zhí)行時(shí)間間、重構(gòu)圖像像

50、和重構(gòu)圖像像的PSNRR值。Matllab執(zhí)行時(shí)時(shí)間反映了算算法的執(zhí)行效效率；圖像重重構(gòu)PSNRR反映了圖像像恢復(fù)的質(zhì)量量，反映了算算法的估算精精度。各種匹配算法的的Matlaab執(zhí)行時(shí)間間、重構(gòu)圖像像的PSNRR值如表5-1.表5-1 全搜搜索法與三步步搜索法比較較分析匹配算法Matlab運(yùn)運(yùn)行時(shí)間峰值信噪比PSSNR值全搜索法（FS）0.7199551 secconds31.88511三步搜索法（TTSS）0.3452447 secconds31.65333從表中分析和恢恢復(fù)出來(lái)的圖圖像看，全搜索匹配恢復(fù)效效果好，這與全搜索算法法對(duì)搜索范圍圍內(nèi)的每一個(gè)個(gè)象素點(diǎn)進(jìn)行行匹配運(yùn)算以以得到一個(gè)最最

51、優(yōu)的運(yùn)動(dòng)矢矢量有關(guān)，它它是全局最優(yōu)優(yōu)的。但它的的計(jì)算復(fù)雜度度太高，Matlabb運(yùn)行時(shí)間長(zhǎng)長(zhǎng)，不適合實(shí)實(shí)時(shí)應(yīng)用。三三步搜索法大大大節(jié)省了匹匹配計(jì)算量，但但是這是以犧犧牲計(jì)算精度度為前提的，我我們看到快速速算法的重構(gòu)構(gòu)圖像PSNNR值不如全全搜索大，實(shí)際恢恢復(fù)出來(lái)的圖圖像質(zhì)量也不不如全搜索在在細(xì)節(jié)上清晰晰，但肉眼幾幾乎不能分辨辨。在實(shí)際應(yīng)應(yīng)用中我們可可以采用快速速算法實(shí)現(xiàn)運(yùn)運(yùn)動(dòng)估計(jì)。6 心得體會(huì)通過(guò)本次設(shè)計(jì)視視頻壓縮系統(tǒng)統(tǒng)中的運(yùn)動(dòng)估估計(jì)算法的課程設(shè)計(jì)，讓讓我更深刻的的理解了多媒媒體信息的獲獲取、搜索和和保存的基本本方法?；谟趬K的運(yùn)動(dòng)估估計(jì)，是先將將視頻圖像分分成一個(gè)個(gè)規(guī)規(guī)則的圖像塊塊，然后對(duì)每

52、每個(gè)圖像塊估估計(jì)運(yùn)動(dòng)矢量量?；趬K的的運(yùn)動(dòng)估計(jì)和和運(yùn)動(dòng)補(bǔ)償已已經(jīng)廣泛應(yīng)用用于各種視頻頻壓縮編碼標(biāo)標(biāo)準(zhǔn)。因此，本本次課程設(shè)計(jì)計(jì)是非常有作作用的，讓我我們清醒的認(rèn)認(rèn)識(shí)到自己的的差距，我了了解了多媒體體處理的基本本原理。課程程設(shè)計(jì)中會(huì)遇遇到一些困難，但但在同學(xué)的幫幫助和自己思思考下最終解解決了問(wèn)題。所以以，本次課程程設(shè)計(jì)我個(gè)人人的收獲很大，也讓我知道自自己還在圖像像編程方面有有很多欠缺的的地方，不僅僅對(duì)均方誤差差(MSE)、絕對(duì)值誤誤差(MADD)更深的理理解，并且采采用全搜索塊塊匹配方法得得到所有宏塊塊的運(yùn)動(dòng)矢量量，同時(shí)還理理解了些多媒媒體信息處理理的基本原理理。自己很多多時(shí)候還是缺缺乏耐心，對(duì)對(duì)

53、于編程方面面欠缺信心，在編程調(diào)試方面仍需耐心，看懂原理的基礎(chǔ)上才能將程序編好。 7 參考文獻(xiàn)1 蔣曉悅悅，趙榮椿.幾種塊匹配配運(yùn)動(dòng)估計(jì)算算法的比較學(xué)學(xué)術(shù)期刊,220042 龔沛曾曾，李湘梅，等等.多媒體技技術(shù)及應(yīng)用.高等教育出出版.200093 張強(qiáng)，王王正林.精通通MATLAAB圖像處理理.電子工業(yè)業(yè)出版社.220124 黎洪松松. 數(shù)字視頻頻處理M. 北京郵郵電大學(xué)出版版社,200065 羅軍輝輝.MATTLAB7.0在圖像處處理中的應(yīng)用用.機(jī)械出版版社,200056 王家文文.MATTLAB7.0編程基礎(chǔ)礎(chǔ).機(jī)械出版社社,200557 鐘麟.MATLLAB仿真技技術(shù)與應(yīng)用教教程.國(guó)防工業(yè)

54、出出版社,200048 岡薩雷雷斯.數(shù)字圖像處處理(MATTLAB版).電子工業(yè)業(yè)出版社,2005相關(guān)程序以及材材料自己點(diǎn)擊擊以下連接下下載： HYPERLINK /s/1dD1hMMl http:/ss/1dD11hMMl附錄程序：全搜索法（FSS）：I1=imreead(CC:Useers軍忠忠Deskktop11111111111.bmp); %讀讀取第一幀圖圖像I1=rgb22gray(I1); %將第一幀幀圖像轉(zhuǎn)換為為灰度圖I2=imreead(CC:Useers軍忠忠Deskktop11111111112.bmp); I2=rgb22gray(I2);dm=7;I1=doubble

55、(I11);I2=doubble(I22);rownumm colnnum = sizee(I1);II=zeroos(rowwnum+22*dm,ccolnumm+2*dmm);II(dm+11:dm+rrownumm,dm+11:dm+ccolnumm)=I1;for i=11:dm II(i,dm+1:dm+colnuum)=III(dm+11,dm+11:dm+ccolnumm); II(rownuum+dm+i,dm+1:dm+colnuum)=III(dm+rrownumm,dm+11:dm+ccolnumm);endfor j=11:dm II(1:rowwnum+22*dm,j

56、j)=II(1:rowwnum+22*dm,ddm+1); II(1:rowwnum+22*dm,ccolnumm+dm+jj)=II(1:rowwnum+22*dm,ddm+collnum);end%下面進(jìn)行全搜搜索算法tic %開(kāi)始始運(yùn)行計(jì)時(shí)blocksiize=166;rowbloccks =rrownumm/bloccksizee;colbloccks =ccolnumm/bloccksizee;A=999999999999999999999999; %為了找找到最小的均均方誤差，AA用于設(shè)定一一個(gè)很大的初初值Eij=0;xrecordd=oness(16,116); %xreccor

57、d，yyrecorrd用于存放放匹配快的塊塊號(hào)，即運(yùn)動(dòng)動(dòng)矢量yrecordd=oness(16,116);diff=zeeros(2256,2556); %這幅圖的大大小為2566*256for x=00:(rowwblockks-1) %xx表示行中第第幾個(gè)子塊 roww=x*bllocksiize; ffor y=0:(coolbloccks-1) %y表示列中中第幾個(gè)子塊塊 col=y*bloocksizze; foor p=-dm:dmm for q=-dmm:dm %（p,q）表表示x,y對(duì)對(duì)應(yīng)子塊在前前一幀所的搜搜索位置 Eij=00; Eij=sum(ssum(II2(roww+

58、1:roow+bloocksizze,coll+1:cool+bloocksizze)-III(row+dm+p+1:roww+dm+pp+bloccksizee,col+dm+q+1:coll+dm+qq+bloccksizee).22)/(bblockssize22); if EijAA=Eij;xrecordd(x+1,y+1)=p;yrecordd(x+1,y+1)=q;end endendA=999999999999999999999;for mx=1:bloocksizze for nny=1:bblockssize diff(row+mmx,coll+ny)=I2(roow+mx

59、,col+nny)-III(row+mx+dmm+xreccord(xx+1,y+1),cool+ny+dm+yrrecordd(x+1,y+1); eend end end eend toc %結(jié)結(jié)束計(jì)時(shí)figure,imshoow(I1,);title(the ffirst framee);figure,imshoow(I2,);title(the ssecondd framme);IIII=I22-I1;figure,imshoow(IIIII,);title(幀間差值);figure,imshoow(difff,);title(DFD); for x=00:(rowwblockks-1

60、) row=x*bblockssize;for y=00:(collblockks-1) col=y*bblockssize; III(row+11:row+blockksize,col+11:col+blockksize)=II(rrow+dmm+xreccord(xx+1,y+1)+1:row+ddm+xreecord(x+1,yy+1)+bblockssize,ccol+dmm+yreccord(xx+1,y+1)+1:col+ddm+yreecord(x+1,yy+1)+bblockssize)+diff(row+11:row+blockksize,col+11:col+blockks

人人文庫(kù)> 全部分類> 行業(yè)資料 > 商業(yè)貿(mào)易

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

通信工程應(yīng)用技術(shù)-多媒體信息處理-運(yùn)動(dòng)估計(jì)算法

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

通信工程應(yīng)用技術(shù)-多媒體信息處理-運(yùn)動(dòng)估計(jì)算法

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔