【矩陣分解理論在數(shù)字圖像處理中的應(yīng)用探究9000字(論文)】_第1頁
【矩陣分解理論在數(shù)字圖像處理中的應(yīng)用探究9000字(論文)】_第2頁
【矩陣分解理論在數(shù)字圖像處理中的應(yīng)用探究9000字(論文)】_第3頁
【矩陣分解理論在數(shù)字圖像處理中的應(yīng)用探究9000字(論文)】_第4頁
【矩陣分解理論在數(shù)字圖像處理中的應(yīng)用探究9000字(論文)】_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

矩陣分解理論在數(shù)字圖像處理中的應(yīng)用研究TOC\o"1-3"\h\u9408前言 515880一、矩陣的分解 67984(一)矩陣的和分解 625194(二)矩陣的積分解 623449(三)矩陣分塊 6678二、基于非負(fù)矩陣分解的圖像表示研究現(xiàn)狀 81061三、矩陣分解理論在數(shù)字圖像處理中的應(yīng)用 1320583(一)數(shù)字圖像處理簡介 136994(二)矩陣的奇異值分解原理 1414531矩陣的奇異值 1458122矩陣的奇異值分解( 147947(三)奇異值分解的圖像性質(zhì) 154278四、結(jié)語 17摘要:本文以矩陣與圖像處理的知識(shí)為基礎(chǔ),結(jié)合一些已有的圖像變換和圖像加密的方法,針對(duì)圖像變換和圖像加密的方法做一些深入的研究和改進(jìn),爭取能在圖像變換和圖像加密的方法上有所突破。關(guān)鍵詞:矩陣?yán)碚?;圖像處理;圖像加密前言在我們?nèi)祟惈@取的信息中,大約有60%的信息來源于視覺,而視覺所見的每一個(gè)靜態(tài)畫面都是一幅圖像?!耙环鶊D像勝過千言萬語(Apictureisworthathousandwords)",這個(gè)諺語說明圖像不僅具有直觀、生動(dòng)、信息量大等特點(diǎn),也反映出圖像在信息的傳播和獲取中發(fā)揮的巨大推動(dòng)作用。隨著圖像采集設(shè)備尤其是智能手機(jī)的廣泛普及,以及互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,人們可以隨時(shí)隨地的將其所見所歷捕捉到圖像中,然后通過一些流行的圖像分享網(wǎng)站和社交網(wǎng)站來分享它。據(jù)統(tǒng)計(jì),著名的圖像分享網(wǎng)站Flickr上傳圖像總數(shù)己經(jīng)超過60億幅,Instagram也超過10億幅,而社交網(wǎng)站Facebook和QQ空間,日均上傳的圖像數(shù)量都遠(yuǎn)遠(yuǎn)超過了1億幅。這些浩如煙海的圖像數(shù)據(jù)給實(shí)際的存儲(chǔ)、傳輸以及進(jìn)一步處理都造成了相當(dāng)大的困難。因此,如何根據(jù)圖像的內(nèi)在結(jié)構(gòu)和人類的視覺特性來探索高效的圖像表示方法,吸引了眾多研究者的目光。圖像表示是計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)領(lǐng)域中一個(gè)非常核心的問題,它在圖像分類和聚類、圖像檢索、人臉識(shí)別、目標(biāo)檢測、圖像去噪等應(yīng)用中起著非常關(guān)鍵的作用。一個(gè)好的圖像表示方法不僅能發(fā)現(xiàn)圖像潛在的數(shù)據(jù)結(jié)構(gòu),而且能有效的提高圖像進(jìn)一步處理的速度。傳統(tǒng)的圖像表示方法主要關(guān)注于如何提取圖像的全局特征,如,顏色、紋理和形狀等,然而,這些全局特征通常對(duì)圖像旋轉(zhuǎn)、圖像縮放以及光照變化反應(yīng)敏感。與之相比,局部特征,比如SIFT(ScaleInvariantFeatureTransform),LBP(LocalBinaryPattern)等,由于可以靈活地刻畫圖像的局部信息和細(xì)節(jié)內(nèi)容,進(jìn)而對(duì)圖像縮放、旋轉(zhuǎn)以及光照變化有著很強(qiáng)的魯棒性。因此,基于局部特征的圖像表示方法在最近幾年引起了廣泛關(guān)注,如BoW模型(Bag-of-Words),非負(fù)表示以及稀疏表示l等。這些方法通常是利用不同的數(shù)學(xué)表示模型,提出新的圖像表示方式,進(jìn)而可以表達(dá)更豐富的圖像語義內(nèi)容。同樣的,本文從矩陣分解的角度出發(fā),圍繞圖像表示方法中的矩陣非負(fù)分解和稀疏分解兩個(gè)重要的研究方向,展開了進(jìn)一步的相關(guān)研究。一、矩陣的分解矩陣分解運(yùn)用到了數(shù)學(xué)中的“分解”和“轉(zhuǎn)化”的思想.由于矩陣分解的多種情況,我們運(yùn)用分類討論的思想對(duì)其進(jìn)行歸類討論,大致可以分為三個(gè)方面,即和分解、積分解以及矩陣的分塊分解.(一)矩陣的和分解矩陣的和分解就是指把一個(gè)矩陣分解成有某些特定屬性的矩陣的和.解決矩陣的和分解問題,經(jīng)常用到的方法是利用構(gòu)造的思想對(duì)矩陣加以變形,定性地構(gòu)造出抽象的具體表達(dá)式來.(二)矩陣的積分解矩陣的積分解是指把一個(gè)矩陣分解成具有某些特定屬性的矩陣的積.解決矩陣的積分解問題,通常是利用構(gòu)造的思想,結(jié)合矩陣的變形和矩陣的某些結(jié)果,定性地構(gòu)造出抽象的目標(biāo)表達(dá)式.矩陣論中的矩陣分解主要是指矩陣的積分解,常見的矩陣積分解有正交三角分解、滿秩分解、奇異值分解等.(三)矩陣分塊常見的矩陣分解形式除了和分解和積分解之外還有矩陣的分塊,即把一個(gè)大矩陣看成由一些小矩陣組成,就如矩陣是由數(shù)組成的一樣.特別是在運(yùn)算中,把這些小矩陣當(dāng)作數(shù)來處理.矩陣的分塊是處理階數(shù)較高的矩陣時(shí)常用的方法,這過程中包含著降階的思想,即將高階矩陣的問題化為低階矩陣問題,它在求分塊矩陣的秩與逆時(shí)起到非常重要的作用.實(shí)現(xiàn)該形式的關(guān)鍵是:通過初等變換將原高階矩陣M化為“分塊上(或下)三角矩陣”,再由低階矩陣來處理問題。高等代數(shù)蘊(yùn)含的數(shù)學(xué)思想十分豐富,它們無不滲透到了矩陣的分解理論中,在矩陣的分解應(yīng)用中也有十分廣泛的應(yīng)用.文中僅僅介紹了幾種簡單的分解形式,還有很多分解方法如對(duì)角型、標(biāo)準(zhǔn)化等等.矩陣分解不僅在矩陣?yán)碚撝杏兄容^重要的地位,而且它還滲透到許多學(xué)科,是解決許多實(shí)際問題的有力工具.隨著計(jì)算機(jī)技術(shù)的發(fā)展,用計(jì)算機(jī)語言對(duì)各種分解形式進(jìn)行編程,給矩陣分解帶來了極大的方便.應(yīng)用矩陣的分解解決問題其技巧性、靈活性都很強(qiáng),要根據(jù)矩陣特點(diǎn)靈活選擇分解方法.需要說明的是這種處理問題的方法是值得注意的,當(dāng)發(fā)現(xiàn)用常規(guī)的方法處理問題比較繁瑣或無法解決時(shí)可嘗試這樣的方法,尋找合適的特征矩陣將原矩陣進(jìn)行分解.

二、基于非負(fù)矩陣分解的圖像表示研究現(xiàn)狀自然圖像和人臉圖像等圖像數(shù)據(jù)的數(shù)據(jù)矩陣往往具有很高的維度,其本質(zhì)在于處于該階段的信息加工具有被動(dòng)性以及缺乏先驗(yàn)知識(shí)的引導(dǎo)造成對(duì)圖像表示的顆粒過細(xì)。由此,圖像在進(jìn)一步的處理中會(huì)造成“維數(shù)災(zāi)難”問題,限制了對(duì)這些數(shù)據(jù)進(jìn)行大規(guī)模處理的可能。因此,我們需要找到這些數(shù)據(jù)的低維表示,而且所得到的低維表示應(yīng)該能夠很好描述圖像的潛在結(jié)構(gòu)。從這個(gè)角度出發(fā),矩陣的低秩分解方法,比如,Cholesky分解、奇異值分解(SingularValueDecomposition,簡稱為SVD)等方法,通常被用來尋找兩個(gè)或兩個(gè)以上的低維矩陣,它們的乘積是對(duì)原始數(shù)據(jù)矩陣的一個(gè)很好的近似估計(jì)。近年來,來自心理學(xué)和生理學(xué)上的證據(jù)表明,圖像的表示在人類大腦中可能是基于部件的(Parts-based)?;谶@個(gè)理論,Lee和Seung于1999年通過引入了非負(fù)性約束,提出了一種非負(fù)的矩陣分解方法(Non-negativeMatrixFactorization,簡稱為NMF),將數(shù)據(jù)矩陣分解為兩個(gè)非負(fù)的基于部件的基矩陣和對(duì)應(yīng)的編碼矩陣。由于非負(fù)約束只允許圖像通過部件的加法來重構(gòu)而不允許減法,因此NMF可以得到基于部件的圖像表示。例如,NMF可以將一幅人臉圖像,通過眼睛、鼻子、嘴巴以及其它臉部部位相加的線性組合構(gòu)成。而且,在許多現(xiàn)實(shí)生活的應(yīng)用中,數(shù)據(jù)的表示必須是非負(fù)的,比如一個(gè)文檔屬于某個(gè)特定主題的概率是非負(fù)的。從圖1.1的左半部分的非負(fù)矩陣分解示意圖中可以看出,非負(fù)矩陣分解將數(shù)據(jù)矩陣分解為兩個(gè)低秩的基矩陣和編碼矩陣,這兩個(gè)矩陣的乘積是對(duì)原始數(shù)據(jù)矩陣的一個(gè)很好的低秩估計(jì)?;贜MF得到的編碼矩陣就是圖像對(duì)應(yīng)的基于部件的表示,它在人臉識(shí)別和數(shù)據(jù)聚類等實(shí)際應(yīng)用中,顯示了比主成分分析(PrincipalComponentAnalysis,簡稱為PCA)rzs]和SVD等圖像表示方法更優(yōu)越的性能。2基于矩陣分解的圖像表示研究現(xiàn)狀事實(shí)上,非負(fù)矩陣分解有很長一段時(shí)期被稱為自形式曲線區(qū)分法(<SelfModelingCurveResolution)。該方法被用來處理在化學(xué)統(tǒng)計(jì)學(xué)中由連續(xù)曲線構(gòu)成的數(shù)據(jù)向量。直到上個(gè)世紀(jì)90年代中期,非負(fù)矩陣分解被Paatero和Tapper等人以正定矩陣分解(PositiveMatrixFactorization)的概念,正式的提了出來。具體為,該方法是一種在拜占庭算法(ByzantineAlgorithm)中有特定應(yīng)用的非負(fù)矩陣分解方法,它的局限性在于無法分析收斂性。為了克服這些缺點(diǎn),Lee和Seung提出了一種簡單而有效的非負(fù)矩陣分解(Non-negativeMatrixFactorization,簡稱為NMF)方法。它的基本思想是,利用兩個(gè)分解因子的更新公式,交替優(yōu)化的將輸入數(shù)據(jù)矩陣X分解為兩個(gè)非負(fù)的低維因子w和S(即,X=WST).更重要的是其突出強(qiáng)調(diào)了基于部件表示的潛在價(jià)值。經(jīng)過近幾年的研究和發(fā)展,NMF自身的屬性被更深入的探索。比如,基于Frobenius范數(shù)的NMF等價(jià)于松弛的K-means聚類,而基于KL散度(Divergence)的NMF是和概率潛在語義索引方法(ProbabilisticLatentSemanticIndexing)等價(jià)。依據(jù)一些研究者的統(tǒng)計(jì),現(xiàn)有的NMF算法可以粗略的分為四個(gè)大類:基本NMF、約束NMF.結(jié)構(gòu)化NMF和泛化NMF。在基本NMF算法中,研究者關(guān)注的焦點(diǎn)為:在只引入非負(fù)約束的條件下,如何找到在實(shí)際應(yīng)用中解決非負(fù)矩陣分解問題更有效和高效的方案。由于基本NMF問題是NP(NondeterministicPolynomial)困難的,并且很難通過理論推導(dǎo)變成凸問題。解決該問題的基本思想是,如何構(gòu)造合理的目標(biāo)函數(shù),來度量原始數(shù)據(jù)X和低秩估計(jì)WST之間的近似精度。Lee和Sueng在文[36]中提出了兩種基于Frobenius范數(shù)和KL散度構(gòu)造目標(biāo)函數(shù)的方法,該方法首先隨機(jī)初始化分解因子,然后通過采用類似于EM(ExpectationMaximization)算法中使用的求解策略去交替式地優(yōu)化分解因子,最后收斂得到一個(gè)局部最優(yōu)解。為了進(jìn)一步提高基于Frobenius范數(shù)的NMF算法效率,Stefan等人利用球面K-means對(duì)分解因子進(jìn)行初始化,但該方法可能會(huì)收斂到相對(duì)較差的局部最優(yōu)解。針對(duì)這一缺點(diǎn),Heiler和Schnorr成功利用凸二次規(guī)劃方法對(duì)分解因子進(jìn)行優(yōu)化求解,并且可以得到一個(gè)較為滿意的局部解,但其效率遠(yuǎn)低于前一方法。結(jié)合二次規(guī)劃方法,Sandier和Lindenbaum于2009年提出了基于EMD(EarthMover'sDistance)距離度量的NMF方法[[46]。該方法在處理紋理分類和人臉識(shí)別問題時(shí),與基于Frobenius范數(shù)的NMF的方法相比,會(huì)選擇更少的基來重構(gòu)圖像,因此達(dá)到了更好的性能。以上方法都是基于單個(gè)目標(biāo)函數(shù)的算法,Zdunek和Cichocki在文中提出了依據(jù)不同的設(shè)定參數(shù),來自由選擇不同的目標(biāo)函數(shù)的非負(fù)矩陣分解方法。雖然該方法有著更廣的實(shí)際應(yīng)用范圍,尤其是針對(duì)語音識(shí)別中的“雞尾酒會(huì)”問題,但其應(yīng)用難度與基于單個(gè)目標(biāo)函數(shù)的NMF算法相比相應(yīng)增加。約束NMF依據(jù)在基本的NMF框架中引入約束的不同,大致可以分為四個(gè)子類:稀疏NMF、正交NMF、判別NMF和流形NMF。原始的NMF得到的基于部件的圖像表示(即編碼因子S)通常是稀疏的,但由于它并沒有顯式的控制編碼因子的稀疏性,這個(gè)稀疏解是矩陣分解過程中的邊際效應(yīng),而不是預(yù)期的目標(biāo),因此在一些實(shí)際應(yīng)用中通過NMF得到圖像表示可能并不稀疏。為了解決這個(gè)問題,Gao和Church于2005提出了基于L2范數(shù)約束的NMF算法。具體的來說,L2約束是通過最小化圖像表示的能量來優(yōu)化稀疏性,因此可能會(huì)得到一定稀疏程度的解而非最稀疏解。為了克服這個(gè)缺點(diǎn),Hoyer提出了一種非負(fù)的稀疏編碼算法(Non-negativeSparseCoding,簡稱為NNSC,該方法通過引入一個(gè)L:范數(shù)和L1范數(shù)相結(jié)合的稀疏約束來控制稀疏性。由于L,范數(shù)約束的特性,NNSC算法可以得到最稀疏的圖像表示。正交NMF是將正交約束加于基W或編碼S上的非負(fù)矩陣分解方法。最早,Lee等人利用對(duì)基的正交性約束來最小化基向量之間的冗余,隨后Ding等人于2006年明確的提出了正交NMF的概念。在非負(fù)約束的條件下,正交性必然導(dǎo)致稀疏性。從這個(gè)意義上來說,正交NMF可以被看成是稀疏NMF的一個(gè)特例。從模式識(shí)別的角度來看,傳統(tǒng)的NMF算法是一種非監(jiān)督的方法。在許多實(shí)際的應(yīng)用中,如,文本分類和數(shù)據(jù)聚類,少量有標(biāo)簽的數(shù)據(jù)會(huì)有助于更好的學(xué)習(xí)和挖掘未標(biāo)記數(shù)據(jù)的潛在結(jié)構(gòu)。因此,為了在矩陣分解過程中進(jìn)一步利用數(shù)據(jù)的標(biāo)簽信息,判別NMF算法受到了研究者的廣泛關(guān)注。Wang等人率先提出了基于Fisher約束的監(jiān)督的非負(fù)矩陣分解方法,其在矩陣分解過程中通過最大化類間散度和類內(nèi)散度的比值,將監(jiān)督信息引入到圖像表示中。為了能夠有效地利用大量的未標(biāo)記數(shù)據(jù),Liu等人開發(fā)了一種半監(jiān)督的非負(fù)矩陣分解算法,該方法以硬編碼的方式,強(qiáng)制地將標(biāo)簽信息引入到圖像表示當(dāng)中。流形NMF算法關(guān)注的是,如何在矩陣分解過程中通過引入流形約束,以便挖掘原始數(shù)據(jù)固有的幾何結(jié)構(gòu)。具有代表性的文章有GNMF,GSNM.LLRNMF和等。這些工作都己經(jīng)證明,通過保持原始數(shù)據(jù)固有的幾何結(jié)構(gòu),新的數(shù)據(jù)表示性能會(huì)得到顯著的提高。事實(shí)上,以上這些不同的約束是具有互補(bǔ)性的。比如,實(shí)際應(yīng)用通常會(huì)考慮使用稀疏約束,GSNMF算法在引入流形約束的同時(shí)也結(jié)合了稀疏約束。為了有效地利用標(biāo)簽信息,MRDNMF也進(jìn)一步引入了判別約束。結(jié)構(gòu)化NMF算法的目的是為了得到具有特定屬性或結(jié)構(gòu)的圖像表示,粗略地可以將其分為三個(gè)子類:加權(quán)NMF、卷積NMF和Tri-NMF(NonnegativeMatrixTri-factorization)。區(qū)別于約束NMF,結(jié)構(gòu)化NMF不是通過引入額外的約束作為補(bǔ)償項(xiàng),而是直接修改標(biāo)準(zhǔn)的矩陣分解公式。加權(quán)NMF通常被用來突出不同基向量之間的相對(duì)重要性。比如,當(dāng)訓(xùn)練樣本中存在某類樣本數(shù)量遠(yuǎn)遠(yuǎn)多于其它類的情況時(shí),矩陣分解后得到的基就會(huì)存在很大的冗余,即,相較于樣本少的類,更多的基會(huì)反映樣本數(shù)量占優(yōu)的類的特性。針對(duì)這個(gè)問題,Guillamet等人提出了一種WNMF算法來學(xué)習(xí)緊湊和判別的基,其加權(quán)的方式是強(qiáng)制的使每一類樣本重構(gòu)誤差的權(quán)重與它在訓(xùn)練集中所占的比例成反比。但是,這種簡單的策略通常會(huì)導(dǎo)致算法收斂速度緩慢。為了提高收斂速度,Kim和Choi基于交替非負(fù)最小二乘算法和廣義EM算法,提出了一種相對(duì)快速和可縮放的加權(quán)NMF算法,該方法在減少計(jì)算復(fù)雜度的同時(shí)也提高了分類性能。卷積NMF的概念最早被Smaragdis提了出來,并且被成功地應(yīng)用于源分離(SourceSeparation)問題。這種方法是一種卷積版的基本NMF算法,主要用來分析連續(xù)性數(shù)據(jù)的潛在依賴性。從計(jì)算的角度來看,卷積NMF的優(yōu)化問題在求解時(shí)可以分解成一系列基本NMF問題。從某種意義上講,傳統(tǒng)的NMF算法屬于頻域分析法,而卷積NMF算法是一種時(shí)頻域分析方法。然而,該方法目前僅在音頻數(shù)據(jù)分析領(lǐng)域有成功應(yīng)用。Tri-NMF是將數(shù)據(jù)矩陣分解成為三個(gè)非負(fù)的因子矩陣分解方法。沒有任何額外約束的Tri-NMF算法在實(shí)際應(yīng)用中是沒有意義的,因?yàn)槠淇梢员缓喜⒊芍挥袃蓚€(gè)因子的基本NMF方法。在有約束的條件下,如,正交約束,Tri-NMF算法可以使數(shù)據(jù)矩陣在分解過程中具有更大的靈活性,進(jìn)一步可以得到擁有新特性的數(shù)據(jù)表示。泛化NMF算法是對(duì)傳統(tǒng)的NMF算法在廣義上做了進(jìn)一步擴(kuò)展,如,違背了非負(fù)約束、擴(kuò)展了數(shù)據(jù)類型或改變了分解模式等等,其大致可以歸納為四個(gè)子類:Semi-NMF、非負(fù)張量分解、非負(fù)矩陣集分解和核NMF。傳統(tǒng)的NMF要求輸入數(shù)據(jù)矩陣的每一個(gè)元素都必須是非負(fù)的,如果不滿足這個(gè)條件,分解的結(jié)果就不能保證得到非負(fù)的圖像表示。為了解決這個(gè)問題,Ding等人提出了一種對(duì)輸入數(shù)據(jù)的正負(fù)性不敏感的Senu-NMF的矩陣分解算法,該方法強(qiáng)制約束分解的編碼矩陣是非負(fù)的,而對(duì)基矩陣沒有限制。這種泛化后的NMF算法,可以廣泛地應(yīng)用于數(shù)據(jù)矩陣存在負(fù)元素的實(shí)際情況中。傳統(tǒng)的NMF方法在處理多路數(shù)據(jù)時(shí),通常會(huì)丟失數(shù)據(jù)原始的多路結(jié)構(gòu)。相比之下,非負(fù)張量分解(Non-negativeTensorFactorization)可以用來解決這個(gè)問題。事實(shí)上,NMF是n維的非負(fù)張量分解在n=2條件下的一個(gè)特例。而且,與傳統(tǒng)的NMF方法不同,非負(fù)張量分解通常在很弱的約束下,比如,增加張量的階數(shù),就會(huì)得到唯一解。但是,非負(fù)張量分解通常需要對(duì)原始的數(shù)據(jù)進(jìn)行量化處理,而這樣處理會(huì)丟失許多結(jié)構(gòu)信息。為了解決這個(gè)問題,Li和Zhang提出了一種非負(fù)矩陣集分解方法,其在不需要量化處理原始數(shù)據(jù)前提下,就可以直接對(duì)數(shù)據(jù)矩陣進(jìn)行分解。以上提到的NMF模型都是線性的,它們都不能很好的挖掘數(shù)據(jù)中存在的非線性結(jié)構(gòu),以至于在處理非線性可分?jǐn)?shù)據(jù)時(shí)無能為力。為了克服這一缺陷,基于核函數(shù)的非負(fù)矩陣分解方法(核NMF)應(yīng)運(yùn)而生。三、矩陣分解理論在數(shù)字圖像處理中的應(yīng)用(一)數(shù)字圖像處理簡介開宗明義,數(shù)字圖像處理就是用現(xiàn)代手段對(duì)圖像進(jìn)行處理。人們對(duì)數(shù)字圖像都應(yīng)該很熟悉。我們?cè)谟?jì)算機(jī)上看到的圖像,數(shù)碼相機(jī)拍到的圖像,雷達(dá)圖像,人體MRI圖像等等都屬于數(shù)字圖像。數(shù)字圖像處理是指用計(jì)算機(jī)對(duì)圖像進(jìn)行分析處理,以達(dá)到所需結(jié)果的技術(shù)。圖像處理的內(nèi)容十分廣泛,具體而言,可以分為:圖像獲取、圖像增強(qiáng)、圖像復(fù)原、圖像壓縮、圖像分割等。這些內(nèi)容都是基于矩陣的處理得到的。下面舉例介紹幾個(gè)重要的應(yīng)用。圖像獲取是圖像處理的第一步。圖像獲取有很多方法,最常用的方法就是用傳感器如數(shù)字?jǐn)z像機(jī)、掃描儀等設(shè)備得到。數(shù)字圖像處理的定義:我們可以將一幅圖像定義為一個(gè)二維函數(shù)f(x,y),這里x和y是空間坐標(biāo),在空間坐標(biāo)(x,y)上的幅值f稱為該點(diǎn)圖像的強(qiáng)度或灰度。對(duì)于數(shù)字圖像而言,x,y和幅值f都是有限的、離散的。這樣一幅圖像就可以用一個(gè)二維函數(shù)來表示。模擬圖像不利于計(jì)算機(jī)處理,所以我們常常將模擬圖像轉(zhuǎn)換為數(shù)字圖像。模擬圖像轉(zhuǎn)化為數(shù)字圖像的方式是:取樣和量化。我們將x,y坐標(biāo)值離散化稱為取樣,將幅度值f離散化稱之為量化。經(jīng)過取樣和量化的圖像是一幅數(shù)字圖像。數(shù)字圖像的質(zhì)量很大程度上取決于取樣和量化的取樣數(shù)和灰度級(jí)。取樣和量化的結(jié)果是一個(gè)實(shí)際的矩陣。這個(gè)矩陣可以表示為:更一般的矩陣表達(dá)方式為:圖像壓縮的數(shù)字圖像數(shù)據(jù)壓縮技術(shù)的應(yīng)用,其目的是減少圖像遺留在數(shù)據(jù)中的多余信息,使之得到更高效的格式存儲(chǔ)和傳輸數(shù)據(jù)??梢詫D象數(shù)據(jù)壓縮的原因在于,數(shù)據(jù)中還有多余的信息。圖像數(shù)據(jù)的冗余引起的在圖像中的空間冗余,時(shí)間冗余的存在下,在不同的幀中的圖像序列中,不同顏色的平面或光譜帶間的相關(guān)性引起的相鄰像素之間的相關(guān)性引起的頻譜冗余。圖像壓縮是有損數(shù)據(jù)壓縮可以是無損數(shù)據(jù)壓縮。無損圖像壓縮方法的行程長度編碼,熵編碼方法,如LZW,有損壓縮方式主要是變換編碼,諸如離散余弦變換(DCT)或小波變換,使傅立葉變換,量化和熵編碼方法壓縮和分形壓縮(分形壓縮)。(二)矩陣的奇異值分解原理1矩陣的奇異值設(shè)ACm×mr,r=rank(A),λi是AAH的特征值,μi是AHA的特征值,它們都是實(shí)數(shù)。且設(shè)λ1≥λ2≥…≥λr>λr+1=λr+2=…=λm=0μ1≥μ2≥…≥μr>μr+1=μr+2=…=μn=0則特征值λi與μi之間的關(guān)系為:λi=μi>0,(i=1,2,…,r)。設(shè)ACm×nr,AAH的正特征值λi,AHA的正特征值μi,稱αi=λi=,(i=1,2,…,r)是A的正奇異值,簡稱奇異值。若A是正規(guī)矩陣,則A的奇異值是A的非零特征向量的模長。2矩陣的奇異值分解(SVD)若ACm×nr,δ1≥δ2≥…≥δr是A的r個(gè)正奇異值,則存在m階酉矩陣U和n階酉矩陣V,滿足:其中,△=diag(δ1,δ2,…δr),△為奇異對(duì)角陣。U滿足UHAAHU是對(duì)角陣,V滿足VHAHAV是對(duì)角陣。U的第i列為A的對(duì)應(yīng)于δi奇異值對(duì)應(yīng)的左奇異向量,V的第i列為A的對(duì)應(yīng)于δi奇異值對(duì)應(yīng)的右奇異向量。它們的每一列均為單位向量,且各列之間相互正交。若ACm×nr,δ1≥δ2≥…≥δr是A的r個(gè)正奇異值,則總有次酉矩陣UrUm×rr,VrVn×rr滿足:A=Ur△VHr,其中△=diag(δ1,δ2,…δr)。奇異值分解是一種基于特征向量的矩陣變換方法。奇異值分解是現(xiàn)代數(shù)值的最基本和最重要的工具之一。(三)奇異值分解的圖像性質(zhì)每一ACm×n矩陣的奇異值(δ1,δ2,…,δr)是唯一的,它將矩陣數(shù)據(jù)的特征與分布很明顯的算了出來。一般來講,矩陣的奇異值的分解可以作這樣的一種理解:可以將矩陣ACm×n當(dāng)做是一種線性變換,它在根本上將m維空間的點(diǎn)映射到了n維的空間。ACm×n通過奇異值的分解之后,該線性變換被分割成3個(gè)部分,分別為U、△和V,其中U和V都是標(biāo)準(zhǔn)正交矩陣,因此它們相對(duì)應(yīng)的線性變換,就相當(dāng)于對(duì)m維和n維坐標(biāo)系中坐標(biāo)軸的旋轉(zhuǎn)變換。若A為數(shù)字圖像,則A可視為二維時(shí)頻信息,可將A的奇異值分解公式寫為:在當(dāng)中,ui與vi各為U與V的列矢量,δi為A的非零奇異值。因此上述公式所表示的數(shù)字圖像A可以看成是r個(gè)秩為1的子圖uivHi相加的結(jié)果,奇異值δi為權(quán)系數(shù)。所以Ai也表示時(shí)頻信息,對(duì)應(yīng)的ui和vi可分別視為頻率矢量和時(shí)間矢量,因此數(shù)字圖像A中的時(shí)頻信息就被分解到一系列由ui和vi構(gòu)成的視頻平面中。由矩陣范數(shù)理論,奇異值能與向量2-范數(shù)和矩陣Frobenious-范數(shù)(F-范數(shù))相聯(lián)系。λ1=‖A‖2=max(‖AX‖2/‖X‖2)若以F-范數(shù)的平方表示圖像的能量,則由矩陣奇異值分解的定義知:綜上所述,數(shù)字圖像A在被奇異值分解之后,它的紋理與幾何意義上的信息大多都集中在U、VH之中,而△中的奇異值通常代表了圖像的能量信息。性質(zhì)1:矩陣的奇異值代表著圖像的能量信息,因此它具有很高的穩(wěn)定性。設(shè)ACm×n,B=A+δ,δ是矩陣A擾動(dòng)矩陣的一個(gè)。A和B的非零奇異值分別記為:δ11≥δ12≥…≥δ1r和δ21≥δ22≥…≥δ2r。且r=rank(A),δ1是δ的最大奇異值。則有:|δ1i-δ2i|≤‖A-B‖2=‖δ‖2=δ1。通過上述闡述可以得知,圖像在被小的擾動(dòng)所干擾的時(shí)候,擾動(dòng)矩陣的最大奇異值一般情況下都大于圖像矩陣奇異值的變換。因此圖像奇異值的穩(wěn)定性能非常強(qiáng)。性質(zhì)2:矩陣的奇異值具有比例不變性。設(shè)ACm×n,矩陣A的奇異值為δi(i=1,2,…,r),r=rank(A),矩陣kA(k≠0)的奇異值為αi(i=1,2,…,r)。則有:|k|(δ1,δ2,…δr)=(α1,α2,…αr)。性質(zhì)3:矩陣的奇異值具有旋轉(zhuǎn)不變性。設(shè)ACm×n,矩陣A的奇異值為δi(i=1,2,…,r),r=rank(A)。若Ur是酉矩陣,則矩陣UrA的奇異值與矩陣A的奇異值相同。通常在F-范數(shù)意義之下,As是在空間Cm×ns(秩為s的m×n維矩陣構(gòu)成的線性空間)中A的一個(gè)將秩最佳逼近。因此可根據(jù)需要保留s(s<r)個(gè)大于某個(gè)閾值的δi而舍棄其余r-s個(gè)小于閾值的δi且保證兩幅圖像在某種意義下的近似。這就為奇異值特征矢量的降維和數(shù)據(jù)壓縮等應(yīng)用找到了依據(jù)。四、結(jié)語前面所有的討論都已經(jīng)表明,圖像壓縮通過奇異值來分解的辦法是有效的,具備很好的實(shí)用價(jià)值,不過還有很多有待改進(jìn)之處。劃分子塊的劃分方式上,通常采取更有效的方法來完成。例如,大型矩陣,隨機(jī)抽樣矩陣居較小的矩陣計(jì)算的小矩陣的奇異值,反復(fù)幾次,這些小的奇異值的原始矩陣奇異矩陣逼近。操作的速度的影響因素,是比較大的SVD變換操作,可以找到一個(gè)快速的奇異值分解的變換算法。此外,如果是已知的特征空間中的圖像矩陣的奇異值,一般認(rèn)為,較大的奇異值和其對(duì)應(yīng)的奇異向量表示的圖像信號(hào),而噪聲的小的奇異值反映在和它們相應(yīng)的奇異向量。選擇閾值低于閾值的奇異值被設(shè)置為0(截?cái)啵┦歉鶕?jù)一定的準(zhǔn)則,那么這些奇異值和奇異向量對(duì)應(yīng)的重構(gòu)圖像進(jìn)行去噪??紤]圖像局部平穩(wěn),奇異值分解的圖像塊消噪保持邊緣細(xì)節(jié),所以在一定程度上。如果你仔細(xì)看,SVD去噪有方向性。據(jù)SVD圖像的性質(zhì),圖像塊旋轉(zhuǎn)SVD去噪,圖像劃分成不同的塊,然后分別為每個(gè)圖像塊旋轉(zhuǎn)SVD的去噪,最后的總投資組合去噪圖像。因此,圖像的主觀質(zhì)量可能已大大提高。參考文獻(xiàn):[1]黃淑芹,徐勇,王平水.基于概率矩陣分解的用戶相似度計(jì)算方法及推薦應(yīng)用[J/OL].山東大學(xué)學(xué)報(bào)(理學(xué)版),:1-7(2017-10-31).[2]劉華鋒,景麗萍,于劍.融合社交信息的矩陣分解推薦方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論