




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
PAGE第PAGE第7頁(yè)XXXXXXXX學(xué)院畢
業(yè)
論
文題目:圖像壓縮技術(shù)的研究與實(shí)現(xiàn)學(xué)生姓名:XXX學(xué) 號(hào):XXXXXXX專
業(yè)
:軟件技術(shù)
班級(jí):XXXXXXXX指導(dǎo)教師:XXX二0一七年四月
目錄摘要 3Abstract 4前言 5第一章緒論 61.1圖像壓縮技術(shù)的發(fā)展現(xiàn)狀 61.2研究?jī)?nèi)容和目的 71.3論文結(jié)構(gòu)安排 7第二章圖像壓縮的理論分析 82.1圖像壓縮的可能性 82.2圖像壓縮原理 82.3圖像壓縮的理論基礎(chǔ) 9第三章常見無(wú)損壓縮方法基本原理 113.1圖像壓縮編碼的分類 113.2預(yù)測(cè)編碼 113.2.1系統(tǒng)框圖 123.2.2調(diào)制 133.3常見壓縮方法 163.3.1JPEG2000與JPEG的區(qū)別 163.3.2JPEG2000與JPEG的實(shí)驗(yàn)比較 18將彩色圖像轉(zhuǎn)化為灰度圖像 18基于離散余弦變換(DCT)實(shí)現(xiàn)圖像壓縮 203.3.3小波變換的分析: 23利用小波變換實(shí)現(xiàn)圖像壓縮 23二維小波分析壓縮圖像Matlab實(shí)現(xiàn) 263.3.4DCT和小波變換的圖像壓縮的比較 29第四章結(jié)論 32第五章總結(jié)與體會(huì) 33致謝 34參考文獻(xiàn) 35附錄1外文原文 37附錄2外文翻譯 47摘要圖像壓縮技術(shù)對(duì)于數(shù)字圖像信息在網(wǎng)絡(luò)上實(shí)現(xiàn)快速傳輸和實(shí)時(shí)處理具有重要的意義。本文介紹了當(dāng)前幾種最為重要的圖像壓縮算法:JPEG2000、分形圖像壓縮和小波變換圖像壓縮。其中主要研究了離散余弦變換壓縮和小波變換壓縮,并對(duì)兩種壓縮的前后數(shù)據(jù)進(jìn)行了對(duì)比,同時(shí)還分析了離散余弦變換壓縮和小波變換壓縮之間的差異。關(guān)鍵詞:圖像壓縮;JPEG2000;小波變換圖像壓縮;
AbstractImagecompressiontechniquesfordigitalimageinformationinInternetrapidtransmissionandreal-timeprocessinghasimportantsignificance.Thispaperintroducesseveralmostimportantimagecompressionalgorithm:JPEG2000,fractalimagecompressionandwaveletimagecompression.Onemajorresearchonthediscretecosinetransformcompressionandwaveletcompression,andtwokindsofdatacompressionandcomparison,thispaperalsoanalyzesthediscretecosinetransformcompressionandwaveletcompresseddifferences.Keyword:Imagecompression;JPEG2000;wavelettransformationimagecompression
前言近二十年來(lái),科學(xué)技術(shù)取得了飛速的發(fā)展。由計(jì)算機(jī)技術(shù)所帶來(lái)的信息革命使人類由工業(yè)化的社會(huì)進(jìn)入到了信息化的社會(huì)。多媒體技術(shù)和Internet互連網(wǎng)技術(shù)的廣泛應(yīng)用加速了全球高速公路的建設(shè),基于網(wǎng)絡(luò)的多媒體數(shù)據(jù)傳輸正改變著人類的生活方式??茖W(xué)實(shí)驗(yàn)表明,人類從外界獲取的知識(shí)之中,有80%以上都是通過(guò)視覺感知獲取的。眼睛獲取的是圖象信息,一幅圖勝過(guò)千言萬(wàn)語(yǔ),圖象信息是人類認(rèn)識(shí)世界及人類自身的重要源泉。圖象壓縮就是在沒有明顯失真的前提下,將圖象的位圖信息轉(zhuǎn)變成另外一種能將數(shù)據(jù)量縮減的表達(dá)形式。首先,盡管圖象中數(shù)據(jù)量很大,但數(shù)據(jù)之間不是完全獨(dú)立的,圖象中存在著各種各樣的相關(guān)性或冗余信息。即一部分?jǐn)?shù)據(jù)可以由另一部分?jǐn)?shù)據(jù)完全推算出來(lái)。其次,大部分圖象視頻信號(hào)的最終接收者都是人眼,而人類的視覺系統(tǒng)是一種高度復(fù)雜的系統(tǒng),它能從極為雜亂的圖象中抽象出有意義的信息,并以非常精練的形式反映給大腦。人眼對(duì)圖象中的不同部分的敏感程度是不同的,如果去除圖象中對(duì)人眼不敏感或意義不大的部分,對(duì)圖象的主觀質(zhì)量是不會(huì)有很大影響的。本文主要是利用離散余弦變換壓縮和小波變換壓縮對(duì)圖像進(jìn)行壓縮,并對(duì)比了圖像壓縮前后的數(shù)據(jù),同時(shí)也對(duì)比了離散余弦變換壓縮和小波變換壓縮之間的差異。并得出了自己對(duì)兩種不同壓縮的看法。第一章緒論1.1圖像壓縮技術(shù)的發(fā)展現(xiàn)狀基于分形的方法是近幾年來(lái)引起關(guān)注和爭(zhēng)議的一種圖像壓縮方法。對(duì)圖像壓縮而言,分形主要是利用自相似的特點(diǎn),通過(guò)迭代函數(shù)系統(tǒng)來(lái)實(shí)現(xiàn)壓縮。利用分形特征對(duì)圖像進(jìn)行描述和處理是很自然的。分形能取得更好的圖像質(zhì)量,當(dāng)然在較低壓縮比的情況下,JPEG是更好的選擇。分形壓縮方法計(jì)算量比較大,時(shí)間開銷長(zhǎng),因此加快分形壓縮方法的速度是當(dāng)前研究的熱點(diǎn)之一。小波變換(WaveletTransform)在頻率精度方面稍差一些,但在時(shí)間的分析能力上更好一些,而且可以對(duì)時(shí)間和頻率同時(shí)進(jìn)行分解,這是傳統(tǒng)傅立葉變換所做不到的。小波變換已經(jīng)開始應(yīng)用到圖像數(shù)據(jù)壓縮等領(lǐng)域,主要是采用離散小波變換。在某些情況下,小波變換更優(yōu)于DCT等其他正交變換。利用人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)進(jìn)行圖像壓縮是這個(gè)領(lǐng)域近幾年的又一研究熱點(diǎn),并且取得了積極的進(jìn)展。這是一種與視覺系統(tǒng)知識(shí)緊密相關(guān)的壓縮方法。ANN并分布的聯(lián)結(jié)機(jī)制與人的視覺系統(tǒng)有某些相似之處,利用此原理及其改進(jìn)的方法進(jìn)行圖像壓縮可獲得較好的效果。視頻壓縮標(biāo)準(zhǔn),從最初的H.261發(fā)展到現(xiàn)在盛行的MPEG-4,一直在不斷發(fā)展,而1997年7月誕生了MPEG.7,其標(biāo)題為“多媒體內(nèi)容描述接口”,編號(hào)為ISO/IECl5938。嚴(yán)格地說(shuō),MPEG.7不是一個(gè)壓縮標(biāo)準(zhǔn),它的主要目標(biāo)是對(duì)多媒體的信息內(nèi)容采用各種標(biāo)準(zhǔn)化的描述,以便進(jìn)行有效的查詢和檢索。它可獨(dú)立于其它MPEG標(biāo)準(zhǔn)使用,也可用來(lái)增強(qiáng)其它MPEG標(biāo)準(zhǔn)的功能。MPEG-7的應(yīng)用范圍很廣泛,既可應(yīng)用于存儲(chǔ)(在線或離線),也可用于流式應(yīng)用(如廣播、將模型加入等)。它將在數(shù)字圖書館(如圖像目錄、音樂(lè)字典)、多媒體名錄服務(wù)(如網(wǎng)頁(yè))、廣播媒體選擇(如無(wú)線電信道、TV信道)、多媒體編輯(個(gè)人電子新聞業(yè)務(wù),媒體寫作)等領(lǐng)域發(fā)揮重要作用。MPEG-21于2000年5月開始,其標(biāo)題為“多媒體框架”(MultimediaFramework),主要目標(biāo)是提供多媒體所需的不同技術(shù)之綜合。它將為網(wǎng)絡(luò)環(huán)境下的多媒體資源提供以下功能:內(nèi)容的創(chuàng)建、復(fù)制、分發(fā)、使用、表述,知識(shí)產(chǎn)權(quán)的管理與保護(hù),內(nèi)容的標(biāo)識(shí)與描述,金融管理,用戶秘密,終端與網(wǎng)絡(luò)資源提取,事件報(bào)告等。由于視頻壓縮標(biāo)準(zhǔn)在多媒體技術(shù)和產(chǎn)業(yè)中的特殊地位,世界各地眾多的公司、科研機(jī)構(gòu)和院校都投入了大量的人力、物力進(jìn)行標(biāo)準(zhǔn)的研究,試圖占領(lǐng)技術(shù)和產(chǎn)業(yè)的制高點(diǎn)。目前,在各種視頻壓縮編碼標(biāo)準(zhǔn)中,己注冊(cè)的專利多以千計(jì),而我國(guó)由于在數(shù)字圖像壓縮領(lǐng)域起步較晚,在標(biāo)準(zhǔn)的競(jìng)爭(zhēng)中處于不利地位。所以我們現(xiàn)今研究的重點(diǎn)是標(biāo)準(zhǔn)的研究。1.2研究?jī)?nèi)容和目的本文通過(guò)DCT和小波變換為基礎(chǔ)的壓縮方法,最大限度地減小圖像的冗余度,同時(shí)分析DCT和小波變換壓縮的實(shí)驗(yàn)結(jié)果,最后比較DCT和小波變換之間的差異。最后并得出了自己對(duì)兩種不同壓縮方法的看法和今后發(fā)展的前景。1.3論文結(jié)構(gòu)安排全文安排具體如下:第一章介紹圖像壓縮技術(shù)的發(fā)展現(xiàn)狀,第二章圖像壓縮的理論分析,第三章介紹離散余弦變換和小波變換壓縮的算法和壓縮前后數(shù)據(jù)的分析,第四章介紹了本次論文的結(jié)果分析和比較,第五章總結(jié)了整個(gè)畢業(yè)論文期間的感受和體會(huì)。
第二章圖像壓縮的理論分析由于圖像數(shù)據(jù)之間存在著一定的冗余,所以使得數(shù)據(jù)的壓縮成為可能。信息論的創(chuàng)始人香農(nóng)提出把數(shù)據(jù)看作是信息和冗余度的組合。所謂冗余度,是由于一副圖像的各像素之間存在著很大的相關(guān)性,可利用一些編碼的方法刪去它們,從而達(dá)到減少冗余、壓縮數(shù)據(jù)的目的。為了去掉數(shù)據(jù)中的冗余,常常要考慮信號(hào)源的統(tǒng)計(jì)特性,或建立信號(hào)源的統(tǒng)計(jì)模型。2.1圖像壓縮的可能性圖像可以壓縮,是因?yàn)閳D像中存在大量的冗余信息,圖像的冗余包括以下幾種【1】:(1)空間冗余:像素點(diǎn)之間的相關(guān)性。(2)時(shí)間冗余:活動(dòng)圖像的兩個(gè)連續(xù)幀之間的冗余。(3)信息熵冗余:?jiǎn)挝恍畔⒘看笥谄潇亍?4)結(jié)構(gòu)冗余;圖像的區(qū)域上存在非常強(qiáng)的紋理結(jié)構(gòu)。(5)知識(shí)冗余:有固定的結(jié)構(gòu),如人的頭像。(6)視覺冗余:某些圖像的失真是人眼不易覺察的。 2.2圖像壓縮原理去除多余數(shù)據(jù)。以數(shù)學(xué)的觀點(diǎn)來(lái)看,這一過(guò)程實(shí)際上就是將二維像素陣列變換為一個(gè)在統(tǒng)計(jì)上無(wú)關(guān)聯(lián)的數(shù)據(jù)集合圖像壓縮是指以較少的比特有損或無(wú)損地表示原來(lái)的像素矩陣的技術(shù),也稱圖像編碼。圖像數(shù)據(jù)之所以能被壓縮,就是因?yàn)閿?shù)據(jù)中存在著冗余。圖像數(shù)據(jù)的冗余主要表現(xiàn)為:圖像中相鄰像素間的相關(guān)性引起的空間冗余;圖像序列中不同幀之間存在相關(guān)性引起的時(shí)間冗余;不同彩色平面或頻譜帶的相關(guān)性引起的頻譜冗余。數(shù)據(jù)壓縮的目的就是通過(guò)去除這些數(shù)據(jù)冗余來(lái)減少表示數(shù)據(jù)所需的比特?cái)?shù)。由于圖像數(shù)據(jù)量的龐大,在存儲(chǔ)、傳輸、處理時(shí)非常困難,因此圖像數(shù)據(jù)的壓縮就顯得非常重要。信息時(shí)代帶來(lái)了“信息爆炸”,使數(shù)據(jù)量大增,因此,無(wú)論傳輸或存儲(chǔ)都需要對(duì)數(shù)據(jù)進(jìn)行有效的壓縮。在遙感技術(shù)中,各種航天探測(cè)器采用壓縮編碼技術(shù),將獲取的巨大信息送回地面。圖像壓縮是數(shù)據(jù)壓縮技術(shù)在數(shù)字圖像上的應(yīng)用,它的目的是減少圖像數(shù)據(jù)中的冗余信息從而用更加高效的格式存儲(chǔ)和傳輸數(shù)據(jù)。2.3圖像壓縮的理論基礎(chǔ)圖像壓縮的理論基礎(chǔ)是信息論。從信息論的角度來(lái)看,壓縮就是去掉信息中的冗余,即保留不確定的信息,去掉確定的信息(可推知的),也就是用一種更接近信息本質(zhì)的描述來(lái)代替原有冗余的描述。這個(gè)本質(zhì)的東西就是信息量(即不確定因素)【2】。信息論之父C.E.Shannon第一次用數(shù)學(xué)語(yǔ)言闡明了概率與信息冗余度的關(guān)系。在1948年發(fā)表的論文“通信的數(shù)學(xué)理論(AMathematicalTheoryofCommunication)”中,香農(nóng)指出,任何信息都存在冗余,冗余大小與信息中每個(gè)符號(hào)(數(shù)字、字母或單詞)的出現(xiàn)概率或者說(shuō)不確定性有關(guān)。依據(jù)信息論,設(shè)有一個(gè)無(wú)記憶的信源A,它產(chǎn)生消息托{a1},i=l,2,?,N的概率是已知的,記為P(a1),i=l,2,?,N,則信息量為:(2.1)可見越是不可能出現(xiàn)的消息,它的出現(xiàn)對(duì)信息的貢獻(xiàn)量越大。一個(gè)消息出現(xiàn)的可能性越小,其信息量就越多;而消息出現(xiàn)的可能性越大,其信息量就越少。信源的平均信息量稱為“熵”(entropy),即:上式取以2為底的對(duì)數(shù)時(shí),單位為比特(bit):熵達(dá)到最大的情況出現(xiàn)在信源各符號(hào)的出現(xiàn)概率相等時(shí),而信源此時(shí)提供最大可能的信源符號(hào)平均信息量。香農(nóng)信息論可以證明:信源熵是進(jìn)行無(wú)失真編碼的理論極限。低于此極限的無(wú)失真編碼方法是不存在的。而且可以證明,利用像素間的相關(guān)性,使用高階熵一定可以獲得更高的壓縮比。設(shè)βK為數(shù)字圖像第k個(gè)碼字CK的長(zhǎng)度(二進(jìn)制代碼的位數(shù))。其相應(yīng)出現(xiàn)的概率為PK,則該數(shù)字圖像所賦于的碼字平均長(zhǎng)度R為:在一般情況下,編碼效率往往用下列簡(jiǎn)單公式表示:式中H為信源熵,R為平均碼字長(zhǎng)度。根據(jù)信息論中的信源編碼理論,可以證明在R≥H條件下,總可以設(shè)計(jì)出某種無(wú)失真編碼方法。當(dāng)然如果編碼結(jié)果使R遠(yuǎn)大于H,表明這種編碼方法效率很低,占用比特?cái)?shù)太多。
第三章常見無(wú)損壓縮方法基本原理圖像編碼與壓縮從本質(zhì)上來(lái)說(shuō)是對(duì)要處理的圖像源數(shù)據(jù)按一定的規(guī)則進(jìn)行變換和組合,從而達(dá)到以盡可能少的代碼(符號(hào))來(lái)表示盡可能多的數(shù)據(jù)信息。壓縮通過(guò)編碼來(lái)實(shí)現(xiàn),或者說(shuō)編碼帶來(lái)壓縮的效果。所以,一般把此項(xiàng)處理稱之為壓縮編碼。3.1圖像壓縮編碼的分類圖像壓縮編碼的方法目前已有多種,其分類方法視出發(fā)點(diǎn)不同而有差異。據(jù)統(tǒng)計(jì),圖像壓縮編碼方法已多達(dá)30一40種。按壓縮技術(shù)所依據(jù)和使用的數(shù)學(xué)理論和計(jì)算方法進(jìn)行分類,可分為統(tǒng)計(jì)編碼(StatisticalCoding)、預(yù)測(cè)編碼(PredictiveCoding)和變換編碼(TransformCoding)大類;按壓縮過(guò)程的可逆性分為有損壓縮(熵壓縮EntropyCompression)和無(wú)損壓縮(冗余度壓縮RedundancyReduction)兩類【6】。按可逆性可分為兩大類:第一類壓縮過(guò)程是可逆的,也就是說(shuō),從壓縮后的圖像能夠完全恢復(fù)出原來(lái)的圖像,信息沒有任何丟失,稱為無(wú)損壓縮;第二類壓縮過(guò)程是不可逆的,無(wú)法完全恢復(fù)出原圖像,信息有一定的丟失,稱為有損壓縮。選擇哪一類壓縮,要折衷考慮,盡管我們希望能夠無(wú)損壓縮,但是通常有損壓縮的壓縮比比無(wú)損壓縮的高。3.2預(yù)測(cè)編碼預(yù)測(cè)編碼(predictivecoding)主要是減少了數(shù)據(jù)在時(shí)間和空間上的相關(guān)性,因而對(duì)于時(shí)間序列據(jù)有著廣泛的應(yīng)用價(jià)值。在數(shù)字通信系統(tǒng)中,例如語(yǔ)音的分析與合成、圖像的編碼與解碼,預(yù)測(cè)編碼已經(jīng)得到了廣泛的實(shí)際應(yīng)用。預(yù)測(cè)編碼是一種簡(jiǎn)單而且十分有效的數(shù)據(jù)壓縮方法,廣泛應(yīng)用于聲音,圖像等數(shù)據(jù)的壓縮。所謂預(yù)測(cè),就是根據(jù)已經(jīng)出現(xiàn)的數(shù)據(jù)樣本對(duì)將要出現(xiàn)的下一個(gè)數(shù)據(jù)的大小做出估計(jì)。由于聲音、圖像等數(shù)據(jù)具有嚴(yán)格平滑連續(xù)性,相鄰采樣點(diǎn)間數(shù)值變化往往不大,因此借助前面的若干個(gè)數(shù)據(jù)樣本往往可以較準(zhǔn)確地預(yù)測(cè)出當(dāng)前樣本的數(shù)值,預(yù)測(cè)的誤差一般都很小,如果我們不是直接對(duì)原始數(shù)據(jù)進(jìn)行編碼,而是先做預(yù)測(cè),然后僅對(duì)較小的預(yù)測(cè)誤差進(jìn)行編碼,這樣就可以減少碼長(zhǎng),達(dá)到壓縮效果,這就是預(yù)測(cè)編碼的基本思想[7]。3.2.1系統(tǒng)框圖一個(gè)基本的預(yù)測(cè)編碼系統(tǒng)示于圖3-1【8】。原始數(shù)據(jù)送入編碼單元,與預(yù)測(cè)器輸出的估值相減,得到預(yù)測(cè)誤差值,經(jīng)編碼器編碼(如啥夫曼編碼)后形成碼流進(jìn)行傳輸和存儲(chǔ)。解碼是首先恢復(fù)出預(yù)測(cè)誤差值,再和用與編碼器相同的預(yù)測(cè)器計(jì)算出的預(yù)測(cè)值相加,從而恢復(fù)出原始數(shù)據(jù)。圖3-1基本預(yù)測(cè)編碼/解碼系統(tǒng)
例如有一組數(shù)200,201,203,202,204,204,假設(shè)我們用前一個(gè)數(shù)據(jù)來(lái)預(yù)測(cè)后一個(gè)數(shù)據(jù),預(yù)測(cè)編碼的工作過(guò)程示于圖3-2。預(yù)測(cè)誤差,即原始數(shù)據(jù)真值與預(yù)測(cè)值之差分別為l,2,.1,2,O,?。圖3-2預(yù)測(cè)編碼原理示意圖如果采用二進(jìn)制對(duì)原始數(shù)據(jù)編碼,每個(gè)數(shù)據(jù)都需要8比特。預(yù)測(cè)編碼不是對(duì)原始數(shù)據(jù)編碼,而是對(duì)預(yù)測(cè)誤差編碼。由于預(yù)測(cè)誤差動(dòng)態(tài)范圍大大縮小,因此只用3比特就可以了,這就減少了碼長(zhǎng),達(dá)到了壓縮的目的。預(yù)測(cè)編碼系統(tǒng)圖像按行掃描進(jìn)行編碼。在掃到某一像素前,可以用此像素前面的一些像素值對(duì)其進(jìn)行預(yù)測(cè)估計(jì),然后與實(shí)際像素值進(jìn)行比較。即用實(shí)際值減去預(yù)測(cè)估計(jì)值得到差值信號(hào),再將此差值信號(hào)量化、編碼和傳輸。在接收端則用量化的差值信號(hào)重建圖像信號(hào)。預(yù)測(cè)編碼最簡(jiǎn)單的形式是△M調(diào)制系統(tǒng)。3.2.2調(diào)制增量調(diào)制也稱△調(diào)制【9】(deltamodulation,DM),它是一種預(yù)測(cè)編碼技術(shù),是PCM編碼的一種變形。PCM是對(duì)每個(gè)采樣信號(hào)的整個(gè)幅度進(jìn)行量化編碼,因此它具有對(duì)任意波形進(jìn)行編碼的能力。DM是對(duì)實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性進(jìn)行編碼,將極性變成“O”和“1”這兩種可能的取值之一。如果實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性為“正”,則用“1”表示;相反則用“O”表示,或者相反。由于DM編碼只需用l位碼對(duì)信號(hào)進(jìn)行編碼,所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。DM編碼基本原理框圖如圖3-3所示,其中上圖為編碼原理框圖,下圖為譯碼原理框圖。DM編碼器包括比較器、本地譯碼器和脈沖形成器三個(gè)部分。接收端譯碼器比較簡(jiǎn)單,它只有一個(gè)與編碼器中的本地譯碼一樣的譯碼器及一個(gè)視頻帶寬的低通濾波器。圖3-3DM編碼、譯碼原理圖DM編碼器實(shí)際上就是1bit編碼的預(yù)測(cè)編碼器。它用一位碼子來(lái)表示e(t),(3.1)式中f(t)為輸入視頻信號(hào),f(t)是f(t)的預(yù)測(cè)值。當(dāng)差值P(f)為一個(gè)正的增量時(shí)用“1”碼來(lái)表示,當(dāng)差值P(r)為一個(gè)負(fù)的增量時(shí)用“0”碼來(lái)表示。在收端,當(dāng)譯碼器收到“1”時(shí),信號(hào)則產(chǎn)生一個(gè)正跳變,收到“O”時(shí),則信號(hào)電壓產(chǎn)生一個(gè)負(fù)的跳變,由此即可實(shí)現(xiàn)譯碼。DM波形編碼的原理如圖3.4所示??v坐標(biāo)表示“模擬信號(hào)輸入幅度”,橫坐標(biāo)表示“編碼輸出”。用i表示采樣點(diǎn)的位置,x[i]表示在i點(diǎn)的編碼輸出。輸入信號(hào)的實(shí)際值用y[i]表示,輸入信號(hào)的預(yù)測(cè)值用y[i+1]=y[i]±△表示。假設(shè)采用均勻量化,量階的大小為△,在開始位置的輸入信號(hào)y[0]=0,預(yù)測(cè)值y[0]=0,編碼輸出x[0]=l?,F(xiàn)在讓我們看幾個(gè)采樣點(diǎn)的輸出。在采樣點(diǎn)i=l處,預(yù)測(cè)值y[1]=△,由于實(shí)際輸入信號(hào)大于預(yù)測(cè)值,因此x[1]=l;在采樣點(diǎn)i=4處,預(yù)測(cè)值y[4]=4△,同樣由于實(shí)際輸入信號(hào)大于預(yù)測(cè)值,因此x[4]=1;其他情況依此類推。從圖3-4中可以看到,在開始階段增量調(diào)制器的輸出不能保持跟蹤輸入信號(hào)的快速變化,這種現(xiàn)象就稱為增量調(diào)制器的“斜率過(guò)載”(slopeoverload)。一般來(lái)說(shuō),當(dāng)輸入信號(hào)的變化速度超過(guò)反饋回路輸出信號(hào)的最大變化速度時(shí),就會(huì)出現(xiàn)斜率過(guò)載。之所以會(huì)出現(xiàn)這種現(xiàn)象,主要是反饋回路輸出信號(hào)的最大變化速率受到量化階大小的限制,因?yàn)榱炕A的大小是固定的。從圖3-4中還可以看到,在輸入信號(hào)緩慢變化部分,即輸入信號(hào)與預(yù)測(cè)信號(hào)的差值接近零的區(qū)域,增量調(diào)制器的輸出出現(xiàn)隨機(jī)交變的“0”和“l(fā)”。這種現(xiàn)象稱為增量調(diào)制器的粒狀噪聲(granularnoise),這種噪聲是不可能消除的。圖3-4DM波形編碼示意圖在輸入信號(hào)變化快的區(qū)域,斜率過(guò)載是關(guān)心的焦點(diǎn),而在輸入信號(hào)變化慢的區(qū)域,關(guān)心的焦點(diǎn)是粒狀噪聲。為了盡可能避免出現(xiàn)斜率過(guò)載,就要加大量化階△,但這樣做又會(huì)加大粒狀噪聲;相反,如果要減小粒狀噪聲,就要減小量化階△,這又會(huì)使斜率過(guò)載更加嚴(yán)重。DM最普通的譯碼器就是一個(gè)RC積分電路。利用RC的充、放電即可實(shí)現(xiàn)譯碼。3.3常見壓縮方法香農(nóng)的率失真理論奠定了信源編碼的理論基礎(chǔ)。以此理論為依據(jù)可以得到數(shù)據(jù)壓縮的兩種基本途徑:一是改變了信源的概率分布,使其盡可能地非均勻,再用最佳編碼方法使平均碼長(zhǎng)逼近信源熵;二是信源的冗余度寓于信源符號(hào)間的相關(guān)性之中,去除它們之間的相關(guān)性,使之成為或近似成為不相干信源。圖像壓縮編碼有幾十種之多,并且涉及到很深的數(shù)學(xué)理論和推導(dǎo),在此只介紹幾種方法。3.3.1JPEG2000與JPEG的區(qū)別JPEG是JointPhotographicExpertsGroup的縮寫?!埃甹pg”、“.jpeg”是其最常用的圖像文件格式。聯(lián)合圖像專家組成立于l986年,1992年發(fā)布了JPEG的標(biāo)準(zhǔn)而在1994年獲得IS()109918—1的認(rèn)定。規(guī)定對(duì)靜止圖像進(jìn)行壓縮的建議性標(biāo)準(zhǔn),其目的是為了提供一個(gè)適用于連續(xù)色度圖像的壓縮標(biāo)準(zhǔn)。在編碼和解碼時(shí),JPEG使用離散余弦變換(DCT),并對(duì)圖像的分量從左到右,從上到下進(jìn)行掃描編碼。這種編碼方式在中、高比特率時(shí),可以得到質(zhì)量滿意的壓縮圖像,并且實(shí)現(xiàn)累進(jìn)傳輸。JPEG是一種有損壓縮格式,能夠?qū)D像壓縮在很小的儲(chǔ)存空間,圖像中重復(fù)或不重要的資料會(huì)被丟失,因此容易造成圖像數(shù)據(jù)的丟失。尤其是使用過(guò)高的壓縮比例,將使最終解壓縮后恢復(fù)的圖像質(zhì)量明顯降低。JPEG也是一種很靈活的格式,具有調(diào)節(jié)圖像質(zhì)量的功能,允許用不同壓縮比例對(duì)文件進(jìn)行壓縮,支持多種壓縮級(jí)別,壓縮比率通常在10:1到40:1之間,壓縮比越大,品質(zhì)就越低;相反地,壓縮比越小,品質(zhì)就越好。JPEG格式壓縮的主要是高頻信息,對(duì)色彩的信息保留較好,適合應(yīng)用于互聯(lián)網(wǎng),可減少圖像的傳輸時(shí)間,可以支持24bit真彩色,也普遍應(yīng)用于需要連續(xù)色調(diào)的圖像。JPEG2000是國(guó)際化標(biāo)準(zhǔn)組織(ISO)和國(guó)際電子技術(shù)聯(lián)盟(IEC)聯(lián)合推出的新一代靜止圖像壓縮標(biāo)準(zhǔn),自1997年開始起草,2000年12月國(guó)際標(biāo)準(zhǔn)(IS)正式發(fā)布,文檔代碼為ISO/IEC15444—1。JPEG2000是取代JPEG的下一代圖像壓縮標(biāo)準(zhǔn)。提供了許多新的特性,其中包括:①低碼率下的超級(jí)壓縮特性;②連續(xù)色調(diào)和二值圖像壓縮;③支持無(wú)損和有損壓縮④漸進(jìn)性傳輸;⑤感興趣區(qū)域編碼;⑥碼流的隨機(jī)訪問(wèn)和處理;⑦良好的容錯(cuò)性等等。JPEG2000與傳統(tǒng)JPEG最大的不同,在于放棄了JPEG所采用的以離散余弦轉(zhuǎn)換(DiscreteCosineTransform)為主的區(qū)塊編碼方式,而采用以小波轉(zhuǎn)換(Wavelettransform)為主的多解析編碼方式。小波轉(zhuǎn)換的主要目的是要將影像的頻率成分抽取出來(lái)JPEG2000的編碼、解碼過(guò)程圖3-5編解碼過(guò)程JPEG2000與JPEG的區(qū)別JPEG2000與JPEG最大的不同,在于它放棄了JPEG所采用的以離散余弦轉(zhuǎn)換(DiscreteCosineTransform)為主的區(qū)塊編碼方式,而改用以小波轉(zhuǎn)換(Wavelettransform)為主的多解析編碼方式。JPEG2000與JPEG的比較如圖3-6圖3-63.3.2JPEG2000與JPEG的實(shí)驗(yàn)比較將彩色圖像轉(zhuǎn)化為灰度圖像先讀取一張彩色的圖片22,然后用rgb2gray轉(zhuǎn)化灰度,最后顯示轉(zhuǎn)化過(guò)的灰度圖像,程序如下:I=imread('d:\我的文檔\桌面\22.jpg');J=rgb2gray(I);imshow(J)圖3-7彩色圖像圖3-8轉(zhuǎn)化后的灰度圖像如圖3-7和圖3-8所示,是將彩色圖像轉(zhuǎn)化為灰度圖像基于離散余弦變換(DCT)實(shí)現(xiàn)圖像壓縮程序:I=imread('cameraman.tif');imshow(I);title('原始圖像')disp('原始圖像大?。?)whos('I')I=im2double(I);%圖像類型存儲(chǔ)轉(zhuǎn)換,將圖像矩陣轉(zhuǎn)換成雙精度類型T=dctmtx(8);%離散余弦變換矩陣B=blkproc(I,[88],'P1*x*P2',T,T');mask=[1111000011100000110000001000000000000000000000000000000000000000];B2=blkproc(B,[88],'P1.*x',mask);I2=blkproc(B2,[88],'P1*x*P2',T',T);figure,imshow(I2);title('壓縮后的圖像')disp('壓縮圖像的大小:')whos('I2')程序運(yùn)行結(jié)果:圖3-9離散余弦變換壓縮前后的數(shù)據(jù)對(duì)比圖3-10離散余弦變換壓縮的原圖圖3-11離散余弦變換壓縮后的圖像程序的運(yùn)行結(jié)果如圖3-10和圖3-11所示。從運(yùn)行結(jié)果可以看出,DCT變換雖然可以得到良好的圖像質(zhì)量,但壓縮率并不大。3.3.3小波變換的分析:小波分解方法是一種窗口大小(即窗口面積)固定,但其形狀可改變,時(shí)間窗和頻率窗都可改變的時(shí)頻局域化分析方法,即在低頻部分具有較高的頻率分辨率和較低的時(shí)間分辨率,在高頻部分具有較高的時(shí)間分辨率和較低的頻率分辨率,所以被稱為“數(shù)學(xué)顯微鏡”。正是這種特性,使小波變換具有對(duì)信號(hào)的自適應(yīng)性。小波變換可以同時(shí)在時(shí)域和頻域上分析信號(hào)的局部特性。平方可積函數(shù)f(t)∈L2(R)的連續(xù)小波變換定義為其中,小波變換的核函數(shù)是母小波的時(shí)間平移b和尺度伸縮a的結(jié)果,<,>表示內(nèi)積運(yùn)算。小波變換的基本思想是用一族函數(shù)去表示或逼近一信號(hào),該族函數(shù)稱為小波函數(shù)系。它是通過(guò)一個(gè)小波母函數(shù)的伸縮和平移,產(chǎn)生其“子波”來(lái)構(gòu)成。圖像可以看做是二維矩陣。一般假設(shè)圖像矩陣的大小為MXN,那么每次小波變換后,圖像便分解為4個(gè)大小為原來(lái)尺寸1/4的子塊頻帶區(qū)域:LL頻帶,HL頻帶,LH頻帶和HH頻帶。分別包含了相應(yīng)頻帶的小波系數(shù),相當(dāng)于在水平方向和豎直方向上進(jìn)行隔點(diǎn)采樣。LL頻帶保持了原始圖像的內(nèi)容信息,圖像的能量集中于此頻帶。HL頻帶保持了圖像水平方向上的高頻邊緣信息。LH頻帶保持了圖像豎直方向上的高頻邊緣信息。HH頻帶保持了圖像在對(duì)角線方向上的高頻信息。進(jìn)行下一層小波變換時(shí),變換數(shù)據(jù)集中在LL頻帶上。利用小波變換實(shí)現(xiàn)圖像壓縮程序:clearallI=imread('cameraman.tif');imshow(I);%顯示圖像title('原始圖像')disp('原始圖像I的大小:');whos('I')I=im2double(I);[c,s]=wavedec2(I,2,'bior3.7');%對(duì)圖像用小波進(jìn)行層分解cal=appcoef2(c,s,'bior3.7',1);%提取小波分解結(jié)構(gòu)中的一層的低頻系數(shù)和高頻系數(shù)ch1=detcoef2('h',c,s,1);%提取二維水平方向細(xì)節(jié)系數(shù)cv1=detcoef2('v',c,s,1);%提取二維垂直方向細(xì)節(jié)系數(shù)cd1=detcoef2('d',c,s,1);%提取二維對(duì)角線方向細(xì)節(jié)系數(shù)ca1=appcoef2(c,s,'bior3.7',1);%保留小波分解第一層低頻信息ca1=wcodemat(ca1,440,'mat',0);%首先對(duì)第一層信息進(jìn)行量化編碼ca1=0.5*ca1;%改變圖像高度f(wàn)igure,image(ca1);%顯示壓縮后的圖象title('第一次壓縮后的圖像')disp('第一次壓縮圖像的大小為:')whos('ca1')ca2=appcoef2(c,s,'bior3.7',2);%保留小波分解第二層低頻信息進(jìn)行壓縮ca2=wcodemat(ca2,440,'mat',0);%首先對(duì)第二層信息進(jìn)行量化編碼ca2=0.25*ca2;%改變圖像高度f(wàn)igure,image(ca2);%顯示壓縮后的圖象title('第二次壓縮后的圖像')disp('第二次壓縮圖像的大小為:')whos('ca2')運(yùn)行結(jié)果:圖3-12小波變換壓縮前后數(shù)據(jù)圖3-13小波變換壓縮原圖圖3-14小波變換第一次壓縮后的圖像圖3-15小波變換第二次壓縮后的圖像將上述語(yǔ)句執(zhí)行后結(jié)果如圖3-12所示,實(shí)際上壓縮前圖像的大小為256X256個(gè)像素,所占空間65536字節(jié),第一次壓縮后的大小為135×135個(gè)像素,所占空間為145800字節(jié);而第二次壓縮后的大小為75X75個(gè)像素,所占空間為45000字節(jié)。其壓效效果顯而易見。可以看出,第一次壓縮是提取原始圖像中小波分解第一層的低頻信息,此時(shí)壓縮效果較好,壓縮比較??;第二次壓縮是提取第一層分解低頻部分的低頻部分(即第二層的低頻部分),其壓縮比較大,壓縮效果在視覺上也基本可以。二維小波分析壓縮圖像Matlab實(shí)現(xiàn)在本實(shí)驗(yàn)中采用的是較為經(jīng)典的實(shí)驗(yàn)圖像11頭像,該文件格式是“.jpg”的位圖文件,文件存放在D盤根目錄。我們運(yùn)用Matlab工具箱中的函數(shù)及相關(guān)語(yǔ)法得到如下程序:clearallI=imread('d:\我的文檔\桌面\11.jpg');imshow(I);%顯示圖像title('原始圖像')disp('原始圖像I的大小:');whos('I')I=im2double(I);[c,s]=wavedec2(I,2,'bior3.7');%對(duì)圖像用小波進(jìn)行層分解cal=appcoef2(c,s,'bior3.7',1);%提取小波分解結(jié)構(gòu)中的一層的低頻系數(shù)和高頻系數(shù)ch1=detcoef2('h',c,s,1);%提取二維水平方向細(xì)節(jié)系數(shù)cv1=detcoef2('v',c,s,1);%提取二維垂直方向細(xì)節(jié)系數(shù)cd1=detcoef2('d',c,s,1);%提取二維對(duì)角線方向細(xì)節(jié)系數(shù)ca1=appcoef2(c,s,'bior3.7',1);%保留小波分解第一層低頻信息ca1=wcodemat(ca1,440,'mat',0);%首先對(duì)第一層信息進(jìn)行量化編碼ca1=0.5*ca1;%改變圖像高度f(wàn)igure,image(ca1);%顯示壓縮后的圖象title('第一次壓縮后的圖像')disp('第一次壓縮圖像的大小為:')whos('ca1')ca2=appcoef2(c,s,'bior3.7',2);%保留小波分解第二層低頻信息進(jìn)行壓縮ca2=wcodemat(ca2,440,'mat',0);%首先對(duì)第二層信息進(jìn)行量化編碼ca2=0.25*ca2;%改變圖像高度f(wàn)igure,image(ca2);%顯示壓縮后的圖象title('第二次壓縮后的圖像')disp('第二次壓縮圖像的大小為:')whos('ca2')運(yùn)行結(jié)果:圖3-16小波變換壓縮前后的數(shù)據(jù)圖3-17小波變換壓縮的原圖圖3-18小波變換第一次壓縮的圖像圖3-19小波變換第二次壓縮后的圖像如圖3-16實(shí)際上壓縮前圖像的大小為240×240個(gè)像素,所占空間為57600字節(jié),第一次壓縮后的大小為127×127個(gè)像素,所占空間為129032字節(jié);而第二次壓縮后的大小為71X71個(gè)像素,所占空間為40328字節(jié)。其壓效效果顯而易見??梢钥闯?,第一次壓縮是提取原始圖像中小波分解第一層的低頻信息,此時(shí)壓縮效果較好,壓縮比較小;第二次壓縮是提取第一層分解低頻部分的低頻部分(即第二層的低頻部分),其壓縮比較大,壓縮效果在視覺上也基本可以。3.3.4DCT和小波變換的圖像壓縮的比較長(zhǎng)期以來(lái),人們對(duì)靜止圖像(包括活動(dòng)圖像一視頻)的壓縮編碼都是基于DCT變換編碼,這些基DCT變換的編碼算法也已成熟地應(yīng)用于各個(gè)方面的圖像壓縮。作為一種多分辨率分析方法,小波變換具有很好的時(shí)一頻或空一頻局部特性,特別適合按照人類視覺系統(tǒng)特性設(shè)計(jì)圖像壓縮編碼方案,也非常有利于圖像的分層傳輸。本文通過(guò)對(duì)圖像DCT和小波變換性能差別的研究。分析圖像壓縮算法應(yīng)當(dāng)從全面、系統(tǒng)觀點(diǎn)考慮,經(jīng)過(guò)靜止圖像的基于DCT和小波的編碼比較后,可知在圖像編碼中的主要因素是量化器和熵編碼器,而不是小波變換和DCT的差別。對(duì)于靜止的圖像來(lái)說(shuō),小波變換和DCT之間的差別很小,還不到1dB。相對(duì)于DCT域下的圖像壓縮,小波壓縮具有很大優(yōu)勢(shì)。小波變換能夠有效地應(yīng)用于圖像數(shù)據(jù)壓縮,從根本上說(shuō),其壓縮機(jī)理正是體現(xiàn)在小波變換對(duì)圖像的多頻段分解恰與人類覺系統(tǒng)的多頻率通道特性相吻合,從而使我們能夠從人類視覺的多通道處理特性上對(duì)圖像進(jìn)行相應(yīng)的壓縮處理。從形式上講,小波變換提供了一種有效的多層次結(jié)構(gòu)的圖像描述形式,能夠從整體上把握?qǐng)D像的結(jié)構(gòu),可以利用圖像中更大范圍內(nèi)的相關(guān)性,并使得圖像的統(tǒng)計(jì)特性變得相對(duì)簡(jiǎn)單化。而且對(duì)于一般的圖像,經(jīng)過(guò)小波壓縮后能夠得到很大的壓縮比,而且壓縮后的圖像畫面沒有大的失真。如果要改變壓縮比,只需要調(diào)整程序中子矩陣的大小即可。最后,小波壓縮的程序既簡(jiǎn)單又實(shí)用,更加方便于被廣泛利用。如圖3-20,離散余弦變換和小波變化壓縮前后數(shù)據(jù)對(duì)比,通過(guò)此圖可以很清楚看出兩種不同的變換壓縮前后的數(shù)據(jù)對(duì)比。離散余弦變換壓縮尺寸大小/字節(jié)程序運(yùn)行時(shí)間壓縮前圖像256x25665536壓縮后圖像256x2565242880.9060小波變換壓縮尺寸大小/字節(jié)程序運(yùn)行時(shí)間壓縮前圖像240x24057600第一次壓縮后圖像127x1271290320.4530第二次壓縮后圖像71x71403280.10903-20離散余弦變換和小波變化壓縮前后數(shù)據(jù)對(duì)比
第四章結(jié)論在許多應(yīng)用領(lǐng)域,都會(huì)用到數(shù)字圖像。由于數(shù)字圖像數(shù)據(jù)量大.因此就會(huì)面臨數(shù)字圖像信息進(jìn)行傳輸或存儲(chǔ)的問(wèn)題。想要在有限的存儲(chǔ)空間盡可能的存儲(chǔ)更多的圖像或者在有限的時(shí)間內(nèi)傳輸更多的圖像,這就涉及數(shù)字圖像的壓縮技術(shù)。圖像壓縮技術(shù)是圖像處理技術(shù)的重要分支之一,圖像壓縮技術(shù)的研究幾十年來(lái)取得了很多的成就。目前存在的圖像壓縮技術(shù)都各自有各自的優(yōu)點(diǎn)但也存在不足。本文在介紹了現(xiàn)有的幾種圖像壓縮技術(shù)的基礎(chǔ)上,詳細(xì)分析了DCT和小波變換壓縮,并對(duì)壓縮前后的數(shù)據(jù)和圖像進(jìn)行了對(duì)比,并得出了從全面、系統(tǒng)觀點(diǎn)考慮,經(jīng)過(guò)靜止圖像的基于DCT和小波的編碼比較后,可知在圖像編碼中的主要因素是量化器和熵編碼器,而不是小波變換和DCT的差別。從本文實(shí)驗(yàn)可以看出相對(duì)于DCT域下的圖像壓縮,小波壓縮具有很大優(yōu)勢(shì)。從根本上說(shuō),小波壓縮機(jī)理正是體現(xiàn)在小波變換對(duì)圖像的多頻段分解恰與人類覺系統(tǒng)的多頻率通道特性相吻合,從而使我們能夠從人類視覺的多通道處理特性上對(duì)圖像進(jìn)行相應(yīng)的壓縮處理。從形式上講,小波變換提供了一種有效的多層次結(jié)構(gòu)的圖像描述形式,能夠從整體上把握?qǐng)D像的結(jié)構(gòu),可以利用圖像中更大范圍內(nèi)的相關(guān)性,并使得圖像的統(tǒng)計(jì)特性變得相對(duì)簡(jiǎn)單化。而且對(duì)于一般的圖像,經(jīng)過(guò)小波壓縮后能夠得到很大的壓縮比,而且壓縮后的圖像畫面沒有大的失真。如果要改變壓縮比,只需要調(diào)整程序中子矩陣的大小即可。最后,小波壓縮的程序既簡(jiǎn)單又實(shí)用,更加方便于被廣泛利用。第五章總結(jié)與體會(huì)隨著畢業(yè)日子的到來(lái),畢業(yè)設(shè)計(jì)也接近了尾聲。經(jīng)過(guò)幾周的奮戰(zhàn)我的畢業(yè)設(shè)計(jì)終于完成了。在沒有做畢業(yè)設(shè)計(jì)以前覺得畢業(yè)設(shè)計(jì)只是對(duì)這幾年來(lái)所學(xué)知識(shí)的單純總結(jié),但是通過(guò)這次做畢業(yè)設(shè)計(jì)發(fā)現(xiàn)自己的看法有點(diǎn)太片面。畢業(yè)設(shè)計(jì)不僅是對(duì)前面所學(xué)知識(shí)的一種檢驗(yàn),而且也是對(duì)自己能力的一種提高。通過(guò)這次畢業(yè)設(shè)計(jì)使我明白了自己原來(lái)知識(shí)還比較欠缺。自己要學(xué)習(xí)的東西還太多,以前老是覺得自己什么東西都會(huì),什么東西都懂,有點(diǎn)眼高手低。通過(guò)這次畢業(yè)設(shè)計(jì),我才明白學(xué)習(xí)是一個(gè)長(zhǎng)期積累的過(guò)程,在以后的工作、生活中都應(yīng)該不斷的學(xué)習(xí),努力提高自己知識(shí)和綜合素質(zhì)。在這次畢業(yè)設(shè)計(jì)中也使我們的同學(xué)關(guān)系更進(jìn)一步了,同學(xué)之間互相幫助,有什么不懂的大家在一起商量,聽聽不同的看法對(duì)我們更好的理解知識(shí),所以在這里非常感謝幫助我的同學(xué)。我的心得也就這么多了,總之,不管學(xué)會(huì)的還是學(xué)不會(huì)的的確覺得困難比較多,真是萬(wàn)事開頭難,不知道如何入手。最后終于做完了有種如釋重負(fù)的感覺。此外,還得出一個(gè)結(jié)論:知識(shí)必須通過(guò)應(yīng)用才能實(shí)現(xiàn)其價(jià)值!有些東西以為學(xué)會(huì)了,但真正到用的時(shí)候才發(fā)現(xiàn)是兩回事,所以我認(rèn)為只有到真正會(huì)用的時(shí)候才是真的學(xué)會(huì)了。在此要感謝我的指導(dǎo)老師X軍對(duì)我悉心的指導(dǎo),感謝老師給我的幫助。在設(shè)計(jì)過(guò)程中,我通過(guò)查閱大量有關(guān)資料,與同學(xué)交流經(jīng)驗(yàn)和自學(xué),并向老師請(qǐng)教等方式,使自己學(xué)到了不少知識(shí),也經(jīng)歷了不少艱辛,但收獲同樣巨大。在整個(gè)設(shè)計(jì)中我懂得了許多東西,也培養(yǎng)了我獨(dú)立工作的能力,樹立了對(duì)自己工作能力的信心,相信會(huì)對(duì)今后的學(xué)習(xí)工作生活有非常重要的影響。而且大大提高了動(dòng)手的能力,使我充分體會(huì)到了在創(chuàng)造過(guò)程中探索的艱難和成功時(shí)的喜悅。雖然這個(gè)設(shè)計(jì)做的也不太好,但是在設(shè)計(jì)過(guò)程中所學(xué)到的東西是這次畢業(yè)設(shè)計(jì)的最大收獲和財(cái)富,使我終身受益。致謝本論文是在我的導(dǎo)師——XXX。在本文的工作期間X老師嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度、求實(shí)的治學(xué)作風(fēng)、對(duì)科學(xué)的執(zhí)著追求和大膽創(chuàng)新精神,令我深受感染并從中獲益匪淺:X老師對(duì)我的嚴(yán)格要求和熱誠(chéng)關(guān)懷使我無(wú)論在知識(shí)上還是實(shí)踐上都收獲頗多。在讀大學(xué)的四年時(shí)間里,在與X老師的每次座談與交流中,X老師強(qiáng)烈的事業(yè)心、循循善誘的教誨和對(duì)生活的真誠(chéng)感悟令我終生難以忘懷,成為我生命中永遠(yuǎn)的財(cái)富,激勵(lì)著我時(shí)刻奮發(fā)向上。在此,向我的導(dǎo)師一X老師,致以最崇的敬意和最衷心的感謝!此外,還要感謝我的室友,感謝我的大學(xué)生全班同學(xué),在這三年的共同生活中,是你們給了我太多的關(guān)心和支持。在此,請(qǐng)?jiān)试S我向每一位在我求學(xué)過(guò)程中遇到的老師、同學(xué)和朋友表示衷心的祝福和誠(chéng)摯的謝意!最后,我要把這篇論文獻(xiàn)給養(yǎng)育我的父母,感謝他們用博大的胸懷與深深的愛包容了我的一切優(yōu)點(diǎn)與缺點(diǎn),慷慨地送給我一個(gè)屬于我自己的空間,讓我伸展開雙臂,擁抱我想要的生活!三年的大學(xué)生生活即將過(guò)去,這段記載著激情、艱辛、歡笑與友誼的青春歲月將成為我永遠(yuǎn)的記憶。未來(lái)的日子里,我將更加奮發(fā)圖強(qiáng),決不辜負(fù)這么多曾給予我真誠(chéng)幫助的人們!
參考文獻(xiàn)[1]孫學(xué)巖,葉海建,韓玉坤.?dāng)?shù)字圖像壓縮原理及常用壓縮編碼方法.農(nóng)機(jī)化研究.2005.(3),128~130[2]張旭東.盧國(guó)棟,馮?。畧D像編碼基礎(chǔ)和小波壓縮技術(shù).清華大學(xué)出版杜.2004.3[3]張汗靈.MATLAB在圖像處理中的應(yīng)用.清華大學(xué)出版社.2006[4]王愛玲等.MATLABR2007圖像處理技術(shù)與應(yīng)用/MATLAB應(yīng)用技術(shù).電子工業(yè)出版社.2006[5]賀興華.MATLAB7.X圖像處理.人民郵電出版社.2006[6]彭天強(qiáng),郭志剛.基于DPCM與S+P變換的圖像無(wú)損壓縮.計(jì)算機(jī)工程與應(yīng)用.2005.(16);42~44[7]葉輕舟,林挺釗.基于FPGA的JPEG靜態(tài)圖像壓縮實(shí)現(xiàn).福建工程學(xué)院學(xué)報(bào).2005.3(3):216~219 [8]岡薩雷斯.?dāng)?shù)字圖像處理(第二版).電子工業(yè)出版社.2004.1[9]姚慶棟,畢厚杰,王兆華等.圖像編碼基礎(chǔ).2006.08[10]萬(wàn)永革.數(shù)字信號(hào)處理的MATLAB實(shí)現(xiàn).科學(xué)出版社.2007[11](美)恩格爾.數(shù)字信號(hào)處理.西安交通大學(xué)出版社.2002[12]樓順天等.MATLAB7.X程序設(shè)計(jì)語(yǔ)言(第二版).西安電子科技大學(xué)出版社.2007[13]高傳善等.數(shù)據(jù)通信與計(jì)算機(jī)網(wǎng)絡(luò).西安電子科技大學(xué)出版社.2001[14]叢玉良等.數(shù)字信號(hào)處理原理及其MATLAB實(shí)現(xiàn)(第2版).電子工業(yè)出版社.2009[15]高西全等.數(shù)字信號(hào)處理(第三版).西安電子科技大學(xué)出版社.2008[16]馮英俊等.小波和小波包算法和圖像壓縮.數(shù)理統(tǒng)計(jì)與管理.1999[17]姚慶棟,畢厚杰,王兆華等.圖像編碼基礎(chǔ).2006.08[18]TharnvichaiR.BoseT.RadenkovicM.MultiplierlesspredictorforDPCMofimages.Circuitsandsystems,2003.2[19]MielikainenJ.ToivanenP.ClusteredDPCMforthelosslesscompressionofhyperspectralimages.GeoscienceandRemoteSensing,2003.4[20]/view/893310.htm?fr=ala0_1_1附錄1外文原文Source:"the21stcenturyliteraturetheappliedundergraduateelectroniccommunicationseriesofpracticalteachingplanTheinformationandcommunicationengineeringspecialtyinEnglishch02_1.PDF120-124Ed:HanDingZhaoJuMin,etcTextA:AnIntroductiontoDigitalImageProcessing1.IntroductionDigitalimageprocessingremainsachallengingdomainofprogrammingforseveralreasons.Firsttheissueofdigitalimageprocessingappearedrelativelylateincomputerhistory.Ithadtowaitforthearrivalofthefirstgraphicaloperatingsystemstobecomeatruematter.Secondly,digitalimageprocessingrequiresthemostcarefuloptimizationsespeciallyforrealtimeapplications.Comparingimageprocessingandaudioprocessingisagoodwaytofixideas.Letusconsiderthenecessarymemorybandwidthforexaminingthepixelsofa320x240,32bitsbitmap,30timesasecond:10Mo/sec.Nowwiththesamequalitystandard,anaudiostereowaverealtimeprocessingneeds44100(samplespersecond)x2(bytespersampleperchannel)x2(channels)=176Ko/sec,whichis50timesless.Obviouslywewillnotbeabletousethesametechniquesforbothaudioandimagesignalprocessing.Finally,digitalimageprocessingisbydefinitionatwodimensionsdomain;thissomehowcomplicatesthingswhenelaboratingdigitalfilters.Wewillexploresomeoftheexistingmethodsusedtodealwithdigitalimagesstartingbyaverybasicapproachofcolorinterpretation.Asamoreadvancedlevelofinterpretationcomesthematrixconvolutionanddigitalfilters.Finally,wewillhaveanoverviewofsomeapplicationsofimageprocessing.Theaimofthisdocumentistogivethereaderalittleoverviewoftheexistingtechniquesindigitalimageprocessing.Wewillneitherpenetratedeepintotheory,norwillweinthecodingitself;wewillmoreconcentrateonthealgorithmsthemselves,themethods.Anyway,thisdocumentshouldbeusedasasourceofideasonly,andnotasasourceofcode.2.Asimpleapproachtoimageprocessing(1)Thecolordata:Vectorrepresentation①BitmapsTheoriginalandbasicwayofrepresentingadigitalcoloredimageinacomputer'smemoryisobviouslyabitmap.Abitmapisconstitutedofrowsofpixels,contractionofthewors“PictureElement”.Eachpixelhasaparticularvaluewhichdeterminesitsappearingcolor.ThisvalueisqualifiedbythreenumbersgivingthedecompositionofthecolorinthethreeprimarycolorsRed,GreenandBlue.Anycolorvisibletohumaneyecanberepresentedthisway.Thedecompositionofacolorinthethreeprimarycolorsisquantifiedbyanumberbetween0and255.Forexample,whitewillbecodedasR=255,G=255,B=255;blackwillbeknownas(R,G,B)=(0,0,0);andsay,brightpinkwillbe:(255,0,255).Inotherwords,animageisanenormoustwo-dimensionalarrayofcolorvalues,pixels,eachofthemcodedon3bytes,representingthethreeprimarycolors.Thisallowstheimagetocontainatotalof256×256×256=16.8milliondifferentcolors.ThistechniqueisalsoknownasRGBencoding,andisspecificallyadaptedtohumanvision.Withcamerasorothermeasureinstrumentswearecapableof“seeing”thousandsofother“colors”,inwhichcasestheRGBencodingisinappropriate.Therangeof0-255wasagreedfortwogoodreasons:Thefirstisthatthehumaneyeisnotsensibleenoughtomakethedifferencebetweenmorethan256levelsofintensity(1/256=0.39%)foracolor.Thatistosay,animagepresentedtoahumanobserverwillnotbeimprovedbyusingmorethan256levelsofgray(256shadesofgraybetweenblackandwhite).Therefore256seemsenoughquality.Thesecondreasonforthevalueof255isobviouslythatitisconvenientforcomputerstorage.Indeedonabyte,whichisthecomputer'smemoryunit,canbecodedupto256values.Asopposedtotheaudiosignalwhichiscodedinthetimedomain,theimagesignaliscodedinatwodimensionalspatialdomain.Therawimagedataismuchmorestraightforwardandeasytoanalyzethanthetemporaldomaindataoftheaudiosignal.Thisiswhywewillbeabletodolotsofstuffandfiltersforimageswithouttransformingthesourcedata,whilethiswouldhavebeentotallyimpossibleforaudiosignal.Thisfirstpartdealswiththesimpleeffectsandfiltersyoucancomputewithouttransformingthesourcedata,justbyanalyzingtherawimagesignalasitis.Thestandarddimensions,alsocalledresolution,forabitmapareabout500rowsby500columns.Thisistheresolutionencounteredinstandardanalogicaltelevisionandstandardcomputerapplications.Youcaneasilycalculatethememoryspaceabitmapofthissizewillrequire.Wehave500×500pixels,eachcodedonthreebytes,thismakes750Ko.Itmightnotseemenormouscomparedtothesizeofharddrives,butifyoumustdealwithanimageinrealtimethenprocessingthingsgettougher.Indeedrenderingimagesfluidlydemandsaminimumof30imagespersecond,therequiredbandwidthof10Mo/secisenormous.WewillseelaterthatthelimitationofdataaccessandtransferinRAMhasacrucialimportanceinimageprocessing,andsometimesithappenstobemuchmoreimportantthanlimitationofCPUcomputing,whichmayseemquitedifferentfromwhatonecanbeusedtoinoptimizationissues.Noticethat,withmoderncompressiontechniquessuchasJPEG2000,thetotalsizeoftheimagecanbeeasilyreducedby50timeswithoutlosingalotofquality,butthisisanothertopic.②Vectorrepresentationofcolorssee,na,sednesgrdecompositioonthethreeprimarycolors.Itsoundsobvioustoamathematiciantoimmediatelyinterpretcolorsasvectorsinathree-dimensionspacewhereeachaxisstandsforoneoftheprimarycolors.Thereforewewillbenefitofmostofthegeometricmathematicalconceptstodealwithourcolors,suchasnorms,scalarproduct,projection,rotationordistance.Thiswillbereallyinterestingforsomekindoffilterswewillseesoon.Figure1illustratesthisnewinterpretation:Figure1(2)Immediateapplicationtofilters①EdgeDetectionFromwhatwehavesaidbeforewecanquantifythebetweentwocolorsbycomputingthegeometricdistancebetweenthevectorsrepresentingthosetwocolors.LetsconsidertwocolorsC1=(R1,G1,B1)andC2=(R2,2,G2),thedistancebetweenthetwocolorsisgivenbytheformula:D,C2)(1R2)21+G2)2(1+B2)2 Thisleadsustoourfirstfilter:edgedetection.Theaimofedgedetectionistodeterminetheedgeofshapesinapictureandtobeabletodrawaresultbitmapwhereedgesareinwhiteonblackbackground(forexample).Theideaisverysimple;wegothroughtheimagepixelbypixelandcomparethecolorofeachpixeltoitsrightneighbor,andtoitsbottomneighbor.Ifoneofthesecomparisonresultsinatoobigdifferencethepixelstudiedispartofanedgeandshouldbeturnedtowhite,otherwiseitiskeptinblack.Thefactthatwecompareeachpixelwithitsbottomandrightneighborcomesfromthefactthatimagesareintwodimensions.Indeedifyouimagineanimagewithonlyalternativehorizontalstripesofredandblue,thealgorithmswouldn'tseetheedgesofthosestripesifitonlycomparedapixeltoitsrightneighbor.Thusthetwocomparisonsforeachpixelarenecessary.Thisalgorithmwastestedonseveralsourceimagesofdifferenttypesanditgivesfairlygoodresults.Itismainlylimitedinspeedbecauseoffrequentmemoryaccess.Thetwosquarerootscanberemovedeasilybysquaringthecomparison;however,thecolorextractionscannotbeimprovedveryeasily.Ifweconsiderthatthelongestoperationsarethegetpixelfunctionandputpixelfunctions,weobtainapolynomialcomplexityof4*N*M,whereNisthenumberofrowsandMthenumberofcolumns.Thisisnotreasonablyfastenoughtobecomputedinrealtime.Fora300×300×32imageIgetabout26transformspersecondonanAthlonXP1600+.Quiteslowindeed.Herearetheresultsofthealgorithmonanexampleimage:Afewwordsabouttheresultsofthisalgorithm:Noticethatthequalityoftheresultsdependsonthesharpnessofthesourceimage.Ifthesourceimageisverysharpedged,theresultwillreachperfection.Howeverifyouhaveaveryblurrysourceyoumightwanttomakeitpassthroughasharpnessfilterfirst,whichwewillstudylater.Anotherremark,youcanalsocompareeachpixelwithitssecondorthirdnearestneighborsontherightandonthebottominsteadofthenearestneighbors.Theedgeswillbethickerbutasomoreexactdependingonthesourceimage'ssharpness.Finallywewillseelateronthatthereisanotherwaytomakeedgedetectionwithmatrixconvolution.②ColorextractionTheotherimmediateapplicationofpixelcomparisoniscolorextraction.Insteadofcomparingeachpixelwithitsneighbors,wearegoingtocompareitwithagivencolorC1.ThisalgorithmwilltrytodetectalltheobjectsintheimagethatarecoloredwithC1.Thiswasquiteusefulforroboticsforexample.Itenablesyoutosearchonstreamingimagesforaparticularcolor.Youcanthenmakeyourobotgogetaredballforexample.Wewillcallthereferencecolor,theonewearelookingforintheimageC0=(R0,G0,B0).Onceagain,evenifthesquarerootcanbeeasilyremoveditdoesn'treallyimprovethespeedofthealgorithm.WhatreallyslowsdownthewholeloopistheNxMgetpixelaccessestomemoryandputpixel.Thisdeterminesthecomplexityofthisalgorithm:2xNxM,whereNandMarerespectivelythenumbersofrowsandcolumnsinthebitmap.Theeffectivespeedmeasuredonmycomputerisabout40transformspersecondona300x300x32sourcebitmap.JPEGimagecompressiontheory(一)JPEGcompressionisdividedintofourstepstoachieve:(1)ColormodeconversionandsamplingRGBcolorsystemisthemostcommonwaysthatcolor.JPEGusesaYCbCrcolorsystem.WanttouseJPEGcompressionmethoddealingwiththebasicfull-colorimages,RGBcolormodetofirstimagedataisconvertedtoYCbCrcolormodeldata.Yrepresentativeofbrightness,CbandCrrepresentsthehue,saturat
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園骨干教師年度工作計(jì)劃安排(目標(biāo)任務(wù)、主要措施)書5
- 2025年氣相色譜儀項(xiàng)目合作計(jì)劃書
- 2025年ZRO2陶瓷磨介項(xiàng)目發(fā)展計(jì)劃
- 2025年年中國(guó)食品飲料項(xiàng)目發(fā)展計(jì)劃
- 2025年全自動(dòng)金屬帶鋸床超精密加工機(jī)床項(xiàng)目發(fā)展計(jì)劃
- 股權(quán)轉(zhuǎn)讓居間服務(wù)合同范本(含股權(quán)轉(zhuǎn)讓限制條款)
- 基礎(chǔ)設(shè)施項(xiàng)目股權(quán)轉(zhuǎn)讓及融資合同
- 谷龍心理咨詢服務(wù)婚姻家庭關(guān)系咨詢合同
- 智能家居股東股份轉(zhuǎn)讓與智能家居生態(tài)鏈建設(shè)合同
- 遼寧省交通高等??茖W(xué)?!吨悄芗揖泳C合實(shí)訓(xùn)(四)》2023-2024學(xué)年第二學(xué)期期末試卷
- 九宮數(shù)獨(dú)200題(附答案全)
- 江西省宜春市袁州區(qū)2023-2024學(xué)年六年級(jí)下學(xué)期期末考試語(yǔ)文試卷
- A型肉毒素注射美容記錄
- 01467-土木工程力學(xué)(本)-國(guó)開機(jī)考參考資料
- 燈謎文化智慧樹知到期末考試答案2024年
- 物流責(zé)任保險(xiǎn)大綱
- 《汽車安全駕駛技術(shù)》夜間駕駛
- 《植物學(xué)》:莖課件
- 產(chǎn)婦入戶訪視培訓(xùn)課件
- 風(fēng)濕免疫疾病的心理咨詢和心理療法
- 出國(guó)勞務(wù)培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論