智能控制及其Matlab實(shí)現(xiàn)_第1頁
智能控制及其Matlab實(shí)現(xiàn)_第2頁
智能控制及其Matlab實(shí)現(xiàn)_第3頁
智能控制及其Matlab實(shí)現(xiàn)_第4頁
智能控制及其Matlab實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、智能控制及其MATLAB實(shí)現(xiàn) 題目: 基于BP神經(jīng)網(wǎng)絡(luò)的圖像壓縮實(shí)現(xiàn)方法 姓 名: 裴曉鵬 學(xué) 號: 2015510298 授課教師: 李國勇 所在院系: 信息工程學(xué)院 基于BP神經(jīng)網(wǎng)絡(luò)的圖像壓縮實(shí)現(xiàn)方法摘要 在當(dāng)今這個(gè)信息爆炸的時(shí)代,圖像傳輸和共享是一個(gè)很重要的環(huán)節(jié),但是圖像數(shù)據(jù)的海量性使其存儲和傳輸成為數(shù)字圖像處理領(lǐng)域的一大難題。研究發(fā)現(xiàn),一幅圖像之所以占據(jù)內(nèi)存大,是因?yàn)槌擞行畔⒁酝?,還有許多冗余信息和相干信息。也正是因?yàn)閳D像中存在著大量的冗余信息和相干信息,使得對圖像進(jìn)行壓縮,即去除圖像中的冗余信息和相干信息,只保留圖像中的有效特征信息變得可行。所謂圖像壓縮是指用較少的數(shù)據(jù)量對冗余信

2、息和相干信息進(jìn)行有效的表征或直接去除。壓縮圖像為數(shù)字圖像提供了一種有效的表示方法,同時(shí)緩解了系統(tǒng)的存儲和傳輸?shù)葔毫Γ谝欢ǔ潭壬夏軌驕p少圖像存儲量和減輕圖像傳輸?shù)呢?fù)擔(dān),也能實(shí)現(xiàn)快速傳輸和實(shí)時(shí)處理。本文在圖像壓縮原理及幾種常用的圖像壓縮方法的研究基礎(chǔ)上,采用BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像壓縮,能夠重構(gòu)出高質(zhì)量的圖像。在要求存儲量較少的同時(shí)還追求高質(zhì)量的重構(gòu)圖像的情況下,這種壓縮方法對數(shù)據(jù)的存儲和傳輸有一定的實(shí)踐指導(dǎo)作用。關(guān)鍵詞:圖像壓縮;快速傳輸;BP神經(jīng)網(wǎng)絡(luò)Image compression method based on BP neural networkAbstractToday informati

3、on explodes, the images transmission and sharing is an important part but the image data huge amounts make its storage and transport become a big problem in the field of digital image processing. The study found that an image is to occupy memory is big, because in addition to the valid information,

4、there are a lot of redundant information and irrelevant information. Is precisely because there are a lot of redundant information in the image and correlation information, make the image is compressed, which remove the redundant information in the image and correlation information, only keep the ef

5、fective feature information of images become feasible. Image compression refers to the use of less amount of data to the redundant information and coherent information for effective characterization or remove directly. Compressed image as the representation method of digital image provides an effect

6、ive, at the same time reduce the pressure on the system of storage and transmission, etc, to a certain extent, can reduce the image storage and reduce the burden of image transmission, also can realize fast transmission and real-time processing. Based on the principle of image compression and severa

7、l common image compression method based on the research of image compression is realized by using the BP neural network, to reconstruct the high quality images. In demanding less storage capacity but also the pursuit of high quality under the condition of reconstructed images, the compression method

8、 for data storage and transmission have certain practice guidance.Key words: Image compression; Rapid transmission; The BP neural network第一章 引言 在當(dāng)今充滿各種類型信息的時(shí)代,圖像是人類感知世界、表達(dá)信息、獲取信息和傳遞信息的重要工具之一。隨著人類對圖像信息需求量的不斷增加,龐大圖像數(shù)據(jù)量的獲取、存儲、傳輸以及傳播等都面臨著巨大的挑戰(zhàn)?,F(xiàn)實(shí)應(yīng)用中,一幅較大圖像數(shù)據(jù)的存儲通常需要占用比較大的內(nèi)存,而真正用來表征圖像本質(zhì)特征的數(shù)據(jù)往往相對較少,如果我們將整幅

9、圖像數(shù)據(jù)全部保存,將無形中占用和浪費(fèi)較大的內(nèi)存資源,假如我們只保存表征圖像的有效數(shù)據(jù),則能夠節(jié)約大量的存儲空間。因此,如何對圖像信號用少量的數(shù)據(jù)進(jìn)行有效表征以減少存儲空間和縮短傳輸時(shí)間已成為圖像處理領(lǐng)域的研究熱點(diǎn)之一。【1】研究發(fā)現(xiàn),一幅圖像之所以占據(jù)內(nèi)存大,是因?yàn)槌擞行畔⒁酝?,還有許多余信息和相干信息。通常把圖像中大量重復(fù)出現(xiàn)的這部分信息稱為冗余信息,對于那些可用其它信息表示的信息稱為相干信息,也正是因?yàn)閳D像中存在著大量的冗余信息和相干信息,使得對圖像進(jìn)行壓縮,即去除圖像中的冗余信息和相干信息,只保留圖像中的有效特征信息變得可行【2】。所謂圖像壓縮是指用較少的數(shù)據(jù)量對冗余信息和相干信息進(jìn)

10、行效的表征或直接去除。壓縮圖像為數(shù)字圖像提供了一種有效的表示方法,同時(shí)緩解了系統(tǒng)的存儲和傳輸?shù)葔毫Γ脖阌谟糜邢薜馁Y源查看和處理大量的圖像信息。 圖像壓縮技術(shù)歷經(jīng)50多年的不斷發(fā)展,目前已經(jīng)有一些比較成熟的方法。常用的圖像壓縮技術(shù)通常采用變換的方法來有效地去除圖像中的冗余信息?;谧儞Q編碼壓縮的方法,常用的主要有離散余弦變換(Discrete Cosine Transform, DCT)編碼81和離散小波變換(Discrete Wavelet Transform, DWT)編碼,“。DCT變換將空間域的圖像信號變換到頻域,使得信號能量集中在一起,能夠用少量的有效數(shù)據(jù)來表征原始圖像。由于DCT變

11、換基固定,并且能夠快速實(shí)現(xiàn),使其在許多圖像壓縮技術(shù)中采用。如JPEG,MPEG, H.26x和AVS等標(biāo)準(zhǔn)均采用了DCT變換技術(shù)。如今,通信網(wǎng)絡(luò)技術(shù)的發(fā)展、數(shù)字圖像的閱覽和圖像數(shù)據(jù)的傳輸不斷要求圖像壓縮方法能夠提供高質(zhì)量和高分辨率的解壓圖像,來滿足不同等級的需求,這些靈活性的要求往往與DCT的編碼結(jié)構(gòu)很難結(jié)合起來,有待相關(guān)研究者進(jìn)行更深入的研究【3】。 1974年,小波變換(Wavelet Transform, WT)理論出現(xiàn),極大地促進(jìn)了數(shù)據(jù)壓縮技術(shù)的進(jìn)一步發(fā)展【4】。小波變換和DCT變換類似,可以將圖像從空間域變換到頻域,使圖像按頻率能量分布更為集中;小波變換通過對圖像進(jìn)行多尺度分解,可以

12、獲得不同程度上的近似圖像信號。80年代末,Lu Jian等人就將小波變換應(yīng)用到圖像壓縮編碼中,其具體過程為:首先對圖像依據(jù)Mallat塔式快速小波變換算法進(jìn)行多尺度分解;然后對每級的小波系數(shù)進(jìn)行量化;再對量化后的小波系數(shù)進(jìn)行編碼處理,最終獲得壓縮圖像。隨著小波變換理論的不斷發(fā)展,其在圖像數(shù)據(jù)壓縮領(lǐng)域已經(jīng)被廣泛地應(yīng)用,如2002年提出的圖像壓縮編碼方法JPEG2000就是基于DWT的一種新的靜止圖像壓縮標(biāo)準(zhǔn)【5】。 1993年,MPEG-1正式成為視頻圖像壓縮標(biāo)準(zhǔn)(運(yùn)動圖像壓縮標(biāo)準(zhǔn))。MPEG-1主要面向數(shù)字存儲媒體,應(yīng)用于多媒體計(jì)算機(jī)、電子出版物以及交互式電視等領(lǐng)域。隨著數(shù)字圖像技術(shù)的不斷發(fā)展

13、,隨后的幾年中,陸續(xù)推出了MPEG-2, MPEG-4, MPEG-7等標(biāo)準(zhǔn)【6】。 圖像壓縮編碼方法已經(jīng)發(fā)展多年,并且日漸成熟,一系列的圖像壓縮標(biāo)準(zhǔn)也在不斷完善和發(fā)展,從靜止圖像壓縮標(biāo)準(zhǔn)JPEG到JPEG2000的發(fā)展使得圖像的壓縮比以及重構(gòu)圖像質(zhì)量都有很大的提升,尤其從動態(tài)圖像壓縮標(biāo)準(zhǔn)MPEG-X系列可以看出,基于圖像內(nèi)容信息的壓縮編碼方法將是圖像壓縮發(fā)展的趨勢【7】。 本文在闡述BP 神經(jīng)網(wǎng)絡(luò)的圖像壓縮原理基礎(chǔ)上,仿真實(shí)現(xiàn)了基于BP神經(jīng)網(wǎng)絡(luò)的靜態(tài)灰度圖像壓縮。第二章 人工神經(jīng)網(wǎng)絡(luò)簡介人工神經(jīng)網(wǎng)絡(luò)從生理學(xué)角度模擬人腦大量神經(jīng)元細(xì)胞的運(yùn)行機(jī)理,通過不斷對鏈接權(quán)值進(jìn)行修改,達(dá)到訓(xùn)練、模擬、預(yù)測

14、等目的。人工神經(jīng)網(wǎng)絡(luò)經(jīng)一段時(shí)間的低潮后,從 20 世紀(jì) 80 年代起,逐漸進(jìn)入熱潮,并衍生出多種網(wǎng)絡(luò)鏈接方式,在工程、勘探、圖像、預(yù)測等方面應(yīng)用廣泛【8】。1988年Hecht-Nielsen對人工神經(jīng)網(wǎng)絡(luò)定義如下“人工神經(jīng)網(wǎng)絡(luò)是一個(gè)并行、分布處理結(jié)構(gòu),它由處理單元及稱為連接的無向信號通道互連而成。這些處理單元具有局部內(nèi)存,并可以完成局部操作。每個(gè)處理單元有一個(gè)單一的輸出鏈接,這個(gè)輸出可根據(jù)需要被分支多個(gè)并行鏈接,且這些并行連接都輸出相同的信號,即相應(yīng)處理單元的信號及信號的大小不因分支的多少而變化。處理單元的輸出信號可以是任何需要的數(shù)學(xué)模型,每個(gè)處理單元進(jìn)行的操作必須是完全局部的。也就是說,它

15、必須僅僅依賴于經(jīng)過輸入連接到達(dá)處理單元的所有輸入信號的當(dāng)前值和儲存在處理單元局部的范圍值?!薄?】1986 年,Rumelhart和Mc Celland在 Parallel Distributed Processing一書中,提出 BP 學(xué)習(xí)算法。用得最廣泛的BP神經(jīng)網(wǎng)絡(luò)一般采用三層,即一輸入層,一隱層,一輸出層。BP算法訓(xùn)練時(shí),由工作信號正向傳播和誤差信號反向傳播組成;工作時(shí),采用訓(xùn)練好的權(quán)值進(jìn)行計(jì)算。 工作信號正向傳播。神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)在輸入層經(jīng)傳遞函數(shù)的計(jì)算,把結(jié)果傳向隱層;再經(jīng)隱層傳遞函數(shù)的計(jì)算,結(jié)果傳向輸出層,在輸出層產(chǎn)生輸出。在此過程中,網(wǎng)絡(luò)權(quán)值不變,算法計(jì)算因輸入、網(wǎng)絡(luò)權(quán)重、閾

16、值、傳遞函數(shù)等產(chǎn)生的輸出。 誤差信號反向傳播產(chǎn)生輸出結(jié)果后,根據(jù)輸出值和期望值之間的差異,把誤差回傳,根據(jù)不同的具體算法,從輸出層起,逐層調(diào)整網(wǎng)絡(luò)權(quán)值,至輸入層,目的是通過調(diào)整權(quán)值,使輸出的數(shù)據(jù)更接近期望值然后再進(jìn)行工作信號正向傳播,得出輸出層結(jié)果后,再調(diào)整網(wǎng)絡(luò)權(quán)值,如此循環(huán)。工作時(shí),采用經(jīng)多次調(diào)整的網(wǎng)絡(luò)權(quán)值,把輸入數(shù)據(jù)傳遞到輸出層,產(chǎn)生輸出。BP 網(wǎng)絡(luò)是目前發(fā)展較為成熟的神經(jīng)網(wǎng)絡(luò)模型之一,是一種利用非線性可微分函數(shù)進(jìn)行權(quán)值修正與調(diào)整的多層前饋人工神經(jīng)網(wǎng)絡(luò),能通過嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)理論進(jìn)行推理驗(yàn)證,在模式識別、函數(shù)逼近、數(shù)據(jù)壓縮等方面獲得了廣泛應(yīng)用與認(rèn)同。BP 網(wǎng)絡(luò)算法的主要特點(diǎn)是輸入信號正向傳遞,誤

17、差反向傳播。BP 網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練算法的實(shí)質(zhì)是把樣本集合的輸入輸問題變換為一個(gè)非線性優(yōu)化問題【10】。其網(wǎng)絡(luò)結(jié)構(gòu)分為輸入層、隱含層、輸出層等三層。一個(gè)典型的BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖1。圖1 一個(gè)典型的BP網(wǎng)絡(luò)模型結(jié)構(gòu)人腦在接受視覺感觀傳來的大量圖像信息后,能夠迅速做出反應(yīng),并在腦海中重現(xiàn)這些信息, 這不僅與人腦的巨大信息儲存能力有關(guān),還說明人腦具有較強(qiáng)的特征提取能力。人工神經(jīng)網(wǎng)絡(luò)雖然是人腦的簡單模擬和抽象,但具有許多與人腦相似的信息處理能力, 自然也具有較強(qiáng)的數(shù)據(jù)壓縮能力, 一些神經(jīng)網(wǎng)絡(luò)模型能直接提供數(shù)據(jù)壓縮就是一個(gè)很好的例子【11】。由于現(xiàn)實(shí)圖像內(nèi)容變化的隨機(jī)性,對圖像的分割以及平穩(wěn)區(qū)域與非平

18、穩(wěn)區(qū)域的數(shù)學(xué)描述還沒有找到一個(gè)有效的手段和方法,試圖用一種圖像模型來描述自然界千奇百怪的圖像是不現(xiàn)實(shí)的, 而人工神經(jīng)網(wǎng)絡(luò)在解決類似的黑箱上特別有效, 故可以用神經(jīng)學(xué)習(xí)圖像中規(guī)律性的東西, 通過神經(jīng)網(wǎng)絡(luò)自適應(yīng)機(jī)制, 如結(jié)構(gòu)自適應(yīng)、學(xué)習(xí)率參數(shù)的變化和連接權(quán)值的變化等進(jìn)行調(diào)整。因此, 可以利用神經(jīng)網(wǎng)絡(luò)的特點(diǎn)對圖像信息進(jìn)行有效的分解、表征和編碼, 從而取得傳統(tǒng)方法無法比擬的結(jié)果。這就是將人工神經(jīng)網(wǎng)絡(luò)用于圖像壓縮的基本思想和出發(fā)點(diǎn)。具體來講, 與傳統(tǒng)的圖像壓縮方法相比,人工神經(jīng)網(wǎng)絡(luò)具有如下一些優(yōu)勢:(1) 圖像信號的正交變換中,如果所選的基向量與圖像信號的協(xié)方差矩陣的特征向量接近, 則變換域內(nèi)圖像信號的

19、相關(guān)性將明顯下降,能量相對集中, 就能使圖像信號的帶寬得到較大壓縮, 此時(shí)的變換比較接近最佳線性變換(KLT)。對于隨機(jī)性很強(qiáng)的圖像信號來說,很難找到一種與不同統(tǒng)計(jì)特性的圖像信號完全匹配的變換, 因此變換矩陣中基向量的選擇不是固定的, 這就給最佳變換編碼的實(shí)現(xiàn)帶來了困難,而神經(jīng)網(wǎng)絡(luò)的強(qiáng)映射力和非線性特性, 使它可以學(xué)習(xí)具有相當(dāng)接近輸入信號特征空間基的能力,因此用來解決最佳變換的實(shí)現(xiàn)是很有效的【12】;(2) 神經(jīng)網(wǎng)絡(luò)中及其豐富的訓(xùn)練算法為設(shè)計(jì)高效的圖像壓縮編碼系統(tǒng)提供了新的途徑;(3) 大多數(shù)人工神經(jīng)網(wǎng)絡(luò)都具有相當(dāng)強(qiáng)的模式識別與模式分類能力, 這給圖像編碼方案中模式分類問題的解決提供了一個(gè)強(qiáng)有

20、力的工具;(4)神經(jīng)網(wǎng)絡(luò)有較強(qiáng)的容錯(cuò)性和聯(lián)想記憶功能,任何局部的損壞不會影響整體結(jié)果, 這一特性有助于對有噪圖像的數(shù)據(jù)壓縮及對壓縮后信息不全圖像的恢復(fù);(5)神經(jīng)網(wǎng)絡(luò)的大規(guī)模并行處理能力及分布式結(jié)構(gòu),為神經(jīng)網(wǎng)絡(luò)圖像編碼的實(shí)時(shí)實(shí)現(xiàn)創(chuàng)造了條件, 這也是將神經(jīng)網(wǎng)絡(luò)用于圖像編碼的優(yōu)勢所在。目前,將人工神經(jīng)網(wǎng)絡(luò)理論與技術(shù)引入圖像編碼領(lǐng)域的研究工作十分活躍,發(fā)展相當(dāng)快,基于人工神經(jīng)網(wǎng)絡(luò)模型的圖像編碼方法已涉足圖像編碼研究的很多方面, 所使用的神經(jīng)網(wǎng)絡(luò)模型已有近十種,對現(xiàn)有的神經(jīng)網(wǎng)絡(luò)圖像編碼方法進(jìn)行歸納、總結(jié), 有助于了解神經(jīng)網(wǎng)絡(luò)方法的發(fā)展方向,使已取得的成果系統(tǒng)化,使尚未解決的問題明確化【13】。不少神經(jīng)

21、網(wǎng)絡(luò)模型都有相當(dāng)強(qiáng)的數(shù)據(jù)壓縮能力,當(dāng)然,有些神經(jīng)網(wǎng)絡(luò)模型不能提供直接的數(shù)據(jù)壓縮, 而是間接參與數(shù)據(jù)壓縮。如果以用于圖像編碼的神經(jīng)網(wǎng)絡(luò)模型為主線, 對現(xiàn)有神經(jīng)網(wǎng)絡(luò)圖像編碼方法進(jìn)行分類, 一方面可了解哪些神經(jīng)網(wǎng)絡(luò)模型具有壓縮能力, 從而進(jìn)一步挖掘潛力, 另一方面可了解神經(jīng)網(wǎng)絡(luò)與圖像壓縮技術(shù)結(jié)合的途徑,從而探討其它模型的壓縮能力, 建立適合數(shù)據(jù)壓縮的新的模型, 在進(jìn)行歸類的過程中, 將那些常用的或者重要的神經(jīng)網(wǎng)絡(luò)模型和學(xué)習(xí)算法分別作為一個(gè)獨(dú)立的類別, 而將那些很少使用或新近提出的神經(jīng)網(wǎng)絡(luò)模型劃入其它類別, 按此原則, 目前用于圖像編碼的神經(jīng)網(wǎng)絡(luò)模型和學(xué)習(xí)算法主要有以下幾類:(1) 多層前饋神經(jīng)網(wǎng)絡(luò),

22、其學(xué)習(xí)算法為BP算法,所以又叫BP網(wǎng)絡(luò);(2) Kohonen 自組織神經(jīng)網(wǎng)絡(luò),包括頻率敏感競爭學(xué)習(xí)(FSCL)網(wǎng)絡(luò),其學(xué)習(xí)算法為自組織特征映射(SOFM)算法;(3) Hpfield 神經(jīng)網(wǎng)絡(luò);(4) 模擬退火(SA)學(xué)習(xí)算法;(5) 混合神經(jīng)網(wǎng)絡(luò)模型;(6) 其它神經(jīng)網(wǎng)絡(luò)模型,包括CPN,函數(shù)鏈神經(jīng)網(wǎng)絡(luò),Sophia 聯(lián)想神經(jīng)網(wǎng)絡(luò)(SANNET), 改進(jìn)的Hebbian 學(xué)習(xí)規(guī)則的系列應(yīng)用(SAMH)等。第三章 BP 神經(jīng)網(wǎng)絡(luò)的圖像壓縮原理數(shù)字圖像壓縮是以較少的比特?cái)?shù)有損或者無損地表示原來的像素矩陣的一種圖像處理技術(shù),其目的是減少圖像數(shù)據(jù)中的時(shí)間冗余、空間冗余、頻譜冗余等一種或多種冗余信息

23、而達(dá)到更加高效的存儲與傳輸數(shù)據(jù)。圖像壓縮系統(tǒng)無論采用什么具體的結(jié)構(gòu)或者技術(shù)方法,其基本過程卻是一致的,可概括為如圖2 所示的流程圖,包括編碼、量化、解碼等三個(gè)環(huán)節(jié)【14】。圖2 圖像壓縮基本流程從理論上講,編解碼問題可以歸納為映射與優(yōu)化問題,而人工神經(jīng)網(wǎng)絡(luò)從數(shù)學(xué)上分析就是實(shí)現(xiàn)了從輸入到輸出的一個(gè)非線性映射關(guān)系,并具有高度并行處理能力、較高的容錯(cuò)性與魯棒性。分析圖像壓縮的基本原理、環(huán)節(jié)與BP 的網(wǎng)絡(luò)結(jié)構(gòu)分布,可得出基于BP 網(wǎng)絡(luò)的圖像壓縮原理如圖3 所示。圖3 基于BP神經(jīng)網(wǎng)絡(luò)的圖像壓縮原理在BP 網(wǎng)絡(luò)中,輸入層到隱含層之間的映射關(guān)系相當(dāng)于編碼器,用于對圖像信號進(jìn)行線性或者非線性變換。而隱含層到

24、輸出層之間的映射關(guān)系相當(dāng)于解碼器,通過對壓縮后的信號數(shù)據(jù)進(jìn)行反變換以達(dá)到重建圖像數(shù)據(jù)。壓縮比率S= 輸入層神經(jīng)元節(jié)點(diǎn)數(shù)/ 隱含層神經(jīng)元節(jié)點(diǎn)數(shù)。BP 神經(jīng)網(wǎng)絡(luò)的輸入層與輸出層的神經(jīng)元節(jié)點(diǎn)數(shù)目從理論上應(yīng)該是一致的,而隱含層的神經(jīng)元數(shù)目比輸入輸出層地?cái)?shù)目要少的多。這樣理論上可通過調(diào)節(jié)隱含層神經(jīng)元節(jié)點(diǎn)數(shù)目可達(dá)到不同圖像壓縮比效果。BP網(wǎng)絡(luò)是目前最為常用的一種神經(jīng)網(wǎng)絡(luò)模型,它可以直接提供數(shù)據(jù)壓縮能力。最典型的例子是一種三層對稱的BP網(wǎng)絡(luò),包括輸入層、隱含層和輸出層,隱含層的節(jié)點(diǎn)數(shù)要少于輸入節(jié)點(diǎn)數(shù), 輸入節(jié)點(diǎn)數(shù)與輸出節(jié)點(diǎn)數(shù)相同, 整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)是完全對稱的。學(xué)習(xí)時(shí), 圖像數(shù)據(jù)既送到輸入層又送到輸出層作為教師

25、信號,所使用的學(xué)習(xí)算法為BP 算法。網(wǎng)絡(luò)訓(xùn)練好以后,輸入層到隱含層為網(wǎng)絡(luò)的編碼過程,對圖像數(shù)據(jù)進(jìn)行線性或者非線性變換, 從隱含層到輸出層為網(wǎng)絡(luò)的解碼過程,對經(jīng)過壓縮后的變換系數(shù)進(jìn)行線性或非線性反變換,恢復(fù)圖像的原始數(shù)據(jù)。這類方法稱為結(jié)構(gòu)壓縮法。N.Sonehara 等人1989 年探討了三層前饋神經(jīng)網(wǎng)絡(luò)的通用性與訓(xùn)練圖像數(shù)目以及迭代次數(shù)的關(guān)系,還探討了隱節(jié)點(diǎn)輸出值量化和初始權(quán)值的選擇對重建圖像質(zhì)量的影響,為了控制網(wǎng)絡(luò)規(guī)模,將圖像分成8×8的子塊, 每一子塊分別送到相應(yīng)的子網(wǎng)絡(luò)進(jìn)行并行處理, 因此學(xué)習(xí)速度相當(dāng)快,每學(xué)習(xí)一幅圖像僅一秒鐘。1990年,Z.He與H.Li將多層前饋神經(jīng)網(wǎng)絡(luò)用

26、于圖像非線性預(yù)測編碼,結(jié)果表明:神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的非線性預(yù)測器優(yōu)于線性預(yù)測器,網(wǎng)絡(luò)的抗噪性強(qiáng),通用性好。隨后,與張偉等人進(jìn)行了類似的研究,得出了相同的結(jié)論。BP 算法流程如圖4 所示。誤差反向傳播算法分為兩個(gè)階段:第一階段(正向傳播過程), 給出輸入信息通過輸入層經(jīng)隱含層逐層處理并計(jì)算每個(gè)單元的實(shí)際輸出值; 第二階段(反向傳播過程), 若在輸出層未能得到期望的輸出值,則逐層遞歸求期望輸出和實(shí)際輸出值的偏差(即誤差),以便根據(jù)此誤差調(diào)節(jié)權(quán)值。權(quán)值的實(shí)際改變可由權(quán)值誤差微商一個(gè)模式一個(gè)模式的計(jì)算出來,即它們可以在這組模式集上進(jìn)行累加【15】。圖4 BP算法流程圖誤差反向傳播算法的性能函數(shù)是均方誤差。對

27、單層的線性網(wǎng)絡(luò),誤差是網(wǎng)絡(luò)權(quán)值的顯式線性函數(shù),其相對于權(quán)值的導(dǎo)數(shù)較為容易求得。在具有非線性傳輸函數(shù)的多層網(wǎng)絡(luò)中,網(wǎng)絡(luò)權(quán)值和誤差的關(guān)系就更為復(fù)雜。為了計(jì)算導(dǎo)數(shù),需要使用微積分的鏈?zhǔn)椒▌t。采用BP算法的多層前饋網(wǎng)絡(luò)是至今為止應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò),在多層前饋網(wǎng)的應(yīng)用中, 以圖5 所示的單隱層網(wǎng)絡(luò)的應(yīng)用最為普遍【16】。一般習(xí)慣將單隱層前饋網(wǎng)稱為三層前饋網(wǎng), 所謂三層包括了輸入層、隱層和輸出層。圖5 三層BP網(wǎng)絡(luò)模型通常,圖像的數(shù)字編碼,其實(shí)質(zhì)是在一定質(zhì)量(信噪比要求或主觀評價(jià)得分)條件下, 以最少比特?cái)?shù)來表示(傳輸)一幅圖像。為了比較各種壓縮編碼效率,需定義表示其壓縮效率的壓縮比,通用的壓縮比可定

28、義為:壓縮比用于表示原始數(shù)據(jù)量與壓縮后存儲數(shù)據(jù)量之間的比值關(guān)系,衡量數(shù)據(jù)壓縮的程度。壓縮比越大丟棄的信息越多,重構(gòu)圖像質(zhì)量越差。壓縮比主要是用來評價(jià)圖像的壓縮性能,而另外還有一些評價(jià)重建圖像的質(zhì)量的性能參數(shù),如峰值信噪比( PSNR ),造成解壓后重構(gòu)圖像失真的就是壓縮過程中丟棄的那部分信息,這部分信息可以通過原始圖像與重構(gòu)圖像之間的函數(shù)關(guān)系來表示,PSNR能反映出這兩者間的關(guān)系。峰值信噪比定義為: 。本文的程序在附錄里有詳細(xì)說明,下面圖6展示了利用BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像壓縮的效果:圖表 6 圖像壓縮結(jié)果總結(jié)本次壓縮的峰值信噪比PSNR:33.8075,壓縮比:2.3136,壓縮效果明顯,重構(gòu)圖

29、像效果較好。但是它也有很多不完美的地方:(1) 己經(jīng)學(xué)習(xí)好的網(wǎng)絡(luò)的泛化問題,即能否逼近規(guī)律、能否正確處理大量沒有學(xué)習(xí)的樣本、是否有預(yù)測能力;(2) 基于BP 算法的網(wǎng)絡(luò)的誤差面有三個(gè)特點(diǎn):有很多局部最小的解; 存在一些平坦區(qū), 在此區(qū)內(nèi)誤差改變很??; 存在不少的局部最小點(diǎn), 在某些初值的條件下算法容易陷入局部最小點(diǎn)。由于第二和第三個(gè)缺點(diǎn), 造成網(wǎng)絡(luò)完全不能訓(xùn)練; 初始的隨機(jī)加權(quán)的大小, 對局部最小的影響很大; 訓(xùn)練步長的大小, 直接影響訓(xùn)練時(shí)間的長短, 其選擇沒有理論指導(dǎo)。(3) 學(xué)習(xí)算法的收斂速度緩慢, 且容易振蕩;(4) 網(wǎng)絡(luò)的隱含層節(jié)點(diǎn)的個(gè)數(shù)的選取尚缺少統(tǒng)一而完整的理論指導(dǎo)。針對這些問題

30、,將在以后的研究中進(jìn)行改進(jìn)。參考文獻(xiàn)1張旭峰.基于壓縮感知的圖像壓縮研究D.西北大學(xué),20152徐大衛(wèi).基于字典學(xué)習(xí)的高光譜圖像壓縮算法研究D.中國科學(xué)技術(shù)大學(xué),20153王丹楓.基于在線字典學(xué)習(xí)的高光譜圖像壓縮技術(shù)研究D.哈爾濱工業(yè)大學(xué),20154吳運(yùn)澤.基于小波變換的多級樹集合分裂圖像壓縮算法研究D.沈陽工業(yè)大學(xué),20155劉志翔.基于BP神經(jīng)網(wǎng)絡(luò)的汽車保險(xiǎn)需求預(yù)測研究D.暨南大學(xué),20156董程.基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的車牌識別算法的研究及仿真D.哈爾濱理工大學(xué),20157羅毅.基于BP神經(jīng)網(wǎng)絡(luò)與智能算法的股價(jià)預(yù)測方法研究D.深圳大學(xué),20158XiaoHong Han;Xiaoyan Xio

31、ng;Fu Duan.A new method for image segmentation based on BP neural network and gravitational search algorithm enhanced by cat chaotic mappingJ.Applied Intelligence,2015,No.49Xuewu Ji;Jian Wang;Youqun Zhao;Yahui Liu;Liguo Zang;Bo Li.Path planning and tracking for vehicle parallel parking based on prev

32、iew BP neural network PID controllerJ.Transactions of Tianjin University,2015,No.310Ximing You;Xuewu Cao.Study of Liquid Lithium Coolant Interaction Based on BP Neural Network Optimized by Genetic AlgorithmJ.Journal of Fusion Energy,2015,No.411Weikuan Jia;Dean Zhao;Tian Shen;Shifei Ding;Yuyan Zhao;C

33、hanli Hu.An optimized classification algorithm by BP neural network based on PLS and HCAJ.Applied Intelligence,2015,No.112Juncheng, Tao.Adaptive combination forecasting model for Chinas logistics freight volume based on an improved PSO-BP neural networkJ.Kybernetes: The International Journal of Syst

34、ems & Cybernetics,2015,No.413Woodworth, Joseph Thomas.Numerical Optimization Methods for Image Processing and Machine LearningD.UCLA,201614叢爽編著.面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用M.200915賀興華等編著.MATLAB 7.x圖像處理M.200616周潤景,張麗娜著.基于MATLAB的模糊與神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)M.2010附錄1程序代碼bp_imageCompress.m% bp_imageCompress.m% 基于BP神經(jīng)網(wǎng)絡(luò)的圖像壓縮%

35、 清理clcclear all% 壓縮率控制K=4;N=10;row=256;col=256;% 數(shù)據(jù)輸入% I=imread('lena.bmp');i=imread('tyut2.jpg');I=rgb2gray(i);%I灰度圖像% 統(tǒng)一將形狀轉(zhuǎn)為row*colI=imresize(I,row,col);% 圖像塊劃分,形成K2*N矩陣P=block_divide(I,K);% 歸一化P=double(P)/255;% 建立BP神經(jīng)網(wǎng)絡(luò)net=feedforwardnet(N,'trainlm');T=P;net.trainParam.go

36、al=0.001;net.trainParam.epochs=1000;ticnet=train(net,P,T);toc% 保存結(jié)果com.lw=net.lw2;com.b=net.b2;,len=size(P); % 訓(xùn)練樣本的個(gè)數(shù)com.d=zeros(N,len);for i=1:len com.d(:,i)=tansig(net.iw1*P(:,i)+net.b1);endminlw= min(com.lw(:);maxlw= max(com.lw(:);com.lw=(com.lw-minlw)/(maxlw-minlw);minb= min(com.b(:);maxb= max(

37、com.b(:);com.b=(com.b-minb)/(maxb-minb);maxd=max(com.d(:);mind=min(com.d(:);com.d=(com.d-mind)/(maxd-mind);com.lw=uint8(com.lw*63);com.b=uint8(com.b*63);com.d=uint8(com.d*63);save comp com minlw maxlw minb maxb maxd mindbp_imageRecon.m% bp_imageRecon.m% 清理clear,clcclose all% 載入數(shù)據(jù)col=256;row=256;% I=imread('lena.bmp');i=imread('tyut2.jpg');I=rgb2gray(i);%I灰度圖像I=imresize(I,row,col);load compcom.lw=double(com.lw)/63;com.b=double(com.b)/63;com.d=double(com.d)/63;com.lw=com.lw*(m

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論