一種基于卷積神經(jīng)網(wǎng)絡(luò)的VVC去壓縮偽影半盲方法_第1頁
一種基于卷積神經(jīng)網(wǎng)絡(luò)的VVC去壓縮偽影半盲方法_第2頁
一種基于卷積神經(jīng)網(wǎng)絡(luò)的VVC去壓縮偽影半盲方法_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

一種基于卷積神經(jīng)網(wǎng)絡(luò)的VVC去壓縮偽影半盲方法摘要:本文介紹了一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的VVC去壓縮偽影半盲方法。提出了使用CNN網(wǎng)絡(luò)進(jìn)行VVC解碼后的逆量化步驟,減小眾多圖像偽影。實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法在降低偽影方面的表現(xiàn)優(yōu)異,同時(shí)保持了高的壓縮比。此外,本文還討論了不同參數(shù)對(duì)該方法的影響。關(guān)鍵詞:VVC;壓縮偽影;半盲;卷積神經(jīng)網(wǎng)絡(luò);逆量化;引言:隨著圖像壓縮技術(shù)的不斷發(fā)展,VVC(VersatileVideoCoding)已經(jīng)成為了目前最先進(jìn)的視頻壓縮標(biāo)準(zhǔn)之一,相較于H.265(HEVC)具有更高的壓縮比和更好的視頻質(zhì)量。然而,VVC在進(jìn)行高比率壓縮時(shí),會(huì)出現(xiàn)一些壓縮偽影。這些偽影雖然在一定程度上緩解了壓縮過程中的碼率需求,但較大的誤差反過來卻會(huì)降低壓縮后的視覺質(zhì)量。為了減輕壓縮偽影對(duì)視覺質(zhì)量的影響,許多研究人員已經(jīng)提出了許多有用的算法。其中,半盲方法是受到了廣泛關(guān)注的方向。半盲方法的主要特點(diǎn)是結(jié)合了監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的思想,能夠通過一個(gè)假設(shè)模型對(duì)VVC去偽影進(jìn)行建模,并利用先驗(yàn)知識(shí)限制偽影的類型和范圍,從而減少偽影的數(shù)量和大小。雖然半盲方法在降低壓縮偽影方面已經(jīng)取得了一定的成果,但是目前的半盲方法存在一些不足之處。例如,模型計(jì)算過程復(fù)雜,速度較慢。為了克服這些缺點(diǎn),本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的VVC去壓縮偽影半盲方法。方法:1.使用CNN網(wǎng)絡(luò)進(jìn)行逆量化在VVC中,逆量化是解碼器中最重要的步驟之一。在逆量化步驟中,將量化系數(shù)轉(zhuǎn)換回其原始值,從而實(shí)現(xiàn)視頻的恢復(fù)。然而,由于數(shù)據(jù)編碼和解碼時(shí)的誤差,偽影錯(cuò)誤還會(huì)出現(xiàn)。因此,我們提出使用CNN網(wǎng)絡(luò)進(jìn)行逆量化,從而減少偽影的數(shù)量。2.半盲模型的設(shè)計(jì)為了有效地降低偽影,我們提出使用半盲模型。在半盲模型中,我們考慮了兩種類型的先驗(yàn)知識(shí):一種是TV先驗(yàn),另一種是HVS先驗(yàn)。TV先驗(yàn)是基于圖片結(jié)構(gòu)的,它假設(shè)偽影是由連續(xù)平面的折疊和彎曲造成的,并用一個(gè)小的梯度選擇算子來實(shí)現(xiàn)。HVS(HumanVisualSystem)先驗(yàn)是基于人眼對(duì)圖像盲點(diǎn)的感知機(jī)制,認(rèn)為偽影主要分布在圖像的周圍和邊緣等局部區(qū)域,因此在半盲模型中保持了HVS先驗(yàn)。3.損失函數(shù)的設(shè)計(jì)為了使CNN網(wǎng)絡(luò)能夠準(zhǔn)確地估計(jì)偽影,我們?cè)O(shè)計(jì)了一個(gè)新的損失函數(shù)。該損失函數(shù)由SNR損失和WGAN-GP損失組成。其中,SNR(Signal-to-NoiseRatio)損失用于度量重構(gòu)圖像的質(zhì)量,而WGAN-GP(WasserstainGANGradientPenalty)損失用于保持半盲模型的穩(wěn)定性。結(jié)果和討論:我們?cè)贙odak實(shí)驗(yàn)庫中的一些圖片上進(jìn)行了實(shí)驗(yàn),與其他一些方法進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明,我們的方法在降低偽影方面表現(xiàn)出色,SM-SNR和SM-SSIM指標(biāo)分別提高了0.6dB和0.05。在不同的參數(shù)下,我們進(jìn)一步分析了該方法的性能。圖像質(zhì)量的評(píng)估結(jié)果表明,在不同的參數(shù)下,我們的方法都表現(xiàn)良好,最優(yōu)參數(shù)是r=8時(shí)。此外,通過比較不同損失函數(shù)的性能,我們發(fā)現(xiàn)使用WGAN-GP損失的方法具有更好的表現(xiàn)。結(jié)論:本文提出了一種基于CNN網(wǎng)絡(luò)的VVC去壓縮偽影半盲方法,能夠克服傳統(tǒng)半盲方法的局限性。實(shí)驗(yàn)中結(jié)果表明了所提出的方法優(yōu)于其他方法,并且在不同的參數(shù)設(shè)置下都表現(xiàn)良好。這表明本文提出的方法是一種有效且實(shí)用的清除偽影的方法,可以在實(shí)際應(yīng)用中推廣使用。未來工作:為了進(jìn)一步提高該

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論