基于matlab的語譜圖的顯示與分析及dct域數(shù)字-畢業(yè)論文_第1頁
基于matlab的語譜圖的顯示與分析及dct域數(shù)字-畢業(yè)論文_第2頁
基于matlab的語譜圖的顯示與分析及dct域數(shù)字-畢業(yè)論文_第3頁
基于matlab的語譜圖的顯示與分析及dct域數(shù)字-畢業(yè)論文_第4頁
基于matlab的語譜圖的顯示與分析及dct域數(shù)字-畢業(yè)論文_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第一章緒論1.1研究的背景及意義隨著時代的變遷和社會的發(fā)展,在這個物欲橫流的社會背景下,互聯(lián)網(wǎng)中傳播信息的媒介越來越多,如音視頻、圖像、數(shù)字圖書等種類日益繁多。21世紀(jì)初,一大批的以網(wǎng)絡(luò)視頻、電子圖書、商務(wù)辦公等新的服務(wù)和在線運(yùn)營為科研。商業(yè)等創(chuàng)造了無線的發(fā)展空間,新媒體的崛起給互聯(lián)網(wǎng)帶來了巨大的商機(jī)。但是在利益的驅(qū)使下,通過不正當(dāng)手段獲取和傳播未經(jīng)授權(quán)的數(shù)字產(chǎn)品的盜版者也異軍突起了。因此,為了維護(hù)版權(quán)所有者屬于他們的正當(dāng)利益,防止盜版等侵權(quán)事件屢屢發(fā)生,建立良好的知識產(chǎn)權(quán)保護(hù)制度迫在眉睫。與數(shù)字圖像、網(wǎng)絡(luò)視頻等傳播媒介的對嵌入水印的要求一樣,數(shù)字音頻水印技術(shù)同樣也是必須在保證了不損壞或破壞原有的音頻數(shù)據(jù)的情況下,通過對音頻數(shù)據(jù)特性的研究,采用利用一定的算法嵌入水印后,依然可以使得原始音頻數(shù)據(jù)具有一定魯棒性、不可感知性及可證明性等。與傳統(tǒng)的數(shù)字圖像水印技術(shù)和趨于日漸成熟的視頻水印技術(shù)相比,數(shù)字音頻水印技術(shù)將會是一個長期需要堅持不懈去努力的方向。一是因為人類聽覺系統(tǒng)(HAShumanauditorysystem)比較靈敏,對周圍的聲音長期處于接收狀態(tài)中,所以聽覺感官對存在改變的音頻數(shù)據(jù)有一定察覺,導(dǎo)致可以嵌入到音頻數(shù)據(jù)中的水印信息少之又少;二是互聯(lián)網(wǎng)上存在許多音頻編輯工具,可以對原始音頻的數(shù)據(jù)進(jìn)行不可控的修改,將導(dǎo)致著音頻數(shù)據(jù)的丟失,從而對嵌入了水印的原始音頻數(shù)據(jù)的起不到版權(quán)保護(hù)的作用。語音信號處理的工作的相關(guān)研究,可以追溯到20世紀(jì)50年代末,貝爾實驗室通過研究發(fā)明出了一臺將語音信號轉(zhuǎn)換成圖像顯示的語譜圖儀,從此為語音信號的研究與分析提供了極大的幫助。首先語譜圖的產(chǎn)生為數(shù)字音頻水印技術(shù)的發(fā)展奠定了夯實的基礎(chǔ)。其次,利用語音信號所產(chǎn)生的語譜圖,根據(jù)語譜圖的灰度及偽彩色顯示,通過分析出的關(guān)于語譜圖相關(guān)的特性,將運(yùn)用于數(shù)字圖像水印的算法也運(yùn)用到音頻數(shù)據(jù)當(dāng)中。最后,利用前人所研究出的關(guān)于圖像水印和信息隱藏的成果,結(jié)合音頻數(shù)據(jù)產(chǎn)生的語譜圖,將應(yīng)用于數(shù)字圖像水印的算法應(yīng)用到語譜圖上,相信只要堅持研究下去積極面對遇到的問題以及找尋解決方案,那么音頻數(shù)字水印領(lǐng)域?qū)泻艽蟮陌l(fā)展前景。1.2國內(nèi)外研究現(xiàn)狀分析關(guān)于語音研究分析表明,很早都多是從語音頻域和時域開始的,綜合其特點。語譜圖語音頻譜圖,一般是通過處理接收具有足夠長度的的時域信號就可以得到頻域圖,即針對語音數(shù)據(jù)的頻譜分析圖。可以理解為把語音復(fù)雜的表示過程用三維圖譜的分析出來,橫軸代表時間,縱軸代表頻率,坐標(biāo)點值代表語音數(shù)據(jù)能量,強(qiáng)度可以由平面的灰度表示強(qiáng)弱。通過分析語音的特征發(fā)現(xiàn)語譜圖可以為研究提供重要的工具。早期可以通過語普儀制作語譜圖,而現(xiàn)在隨著科技的發(fā)展,業(yè)內(nèi)人士可以通過計算機(jī)和數(shù)字信號處理等技術(shù)來顯示語譜圖,語譜圖能夠?qū)⒄Z音的許多特性淋淋盡致地呈現(xiàn)在人們眼前,通過研究語譜圖可以得出以下結(jié)論:語譜圖在語音識別、語音合成及編碼等方面的研究都具有重大意義。在1970-1979年中科院聲學(xué)所大張旗鼓的對進(jìn)行計算機(jī)語音方面等技術(shù)領(lǐng)域進(jìn)行了深入的研究,通過這幾年對語譜圖的深入研究得出來的經(jīng)驗。進(jìn)一步推動了語普圖在我國的發(fā)展。隨著科技的發(fā)展,水印技術(shù)在我國很多領(lǐng)域也受到了足夠的重視,已經(jīng)有很多專業(yè)人士投身于數(shù)字水印的技術(shù)研究,并且已經(jīng)成立了很多具有相當(dāng)實力的科研機(jī)構(gòu)投入到這一領(lǐng)域。自20世紀(jì)末12月召開了我國信息隱藏學(xué)術(shù)研討會之后,隨之又有各種相關(guān)數(shù)字水印的學(xué)術(shù)會議不斷召開,接著國家實施了各項計劃,并且國家相關(guān)單位也對數(shù)字水印技術(shù)提供了多項幫助,例如:項目資助。在國家的大力支持和幫助下,數(shù)字水印技術(shù)領(lǐng)域的學(xué)術(shù)研究水平幾乎可以與世界數(shù)字水印水平發(fā)達(dá)工具相提并論,相信在不久的將來肯定會投入實際應(yīng)用中??偟恼f來,因為數(shù)字水印的研究基礎(chǔ)是:計算機(jī)科學(xué)、密碼學(xué)、通信理論、算法設(shè)計和信號處理等。每個數(shù)字水印方案必將利用以上的多項技術(shù)來完成。隨著科技的發(fā)展,技術(shù)也會日新月異,在利用的過程中也會或多或少的存在著一些缺點。盡管人們都在大力探索發(fā)展和研究完善數(shù)字水印的深層次技術(shù),但從對數(shù)字水印發(fā)展技術(shù)現(xiàn)狀而言,數(shù)字水印技術(shù)還是存在著一些不足,沒有完全成熟,并不能完全駕馭。所以說,數(shù)字水印只能說是一門新興的技術(shù)領(lǐng)域?qū)W科。綜上所述:數(shù)字水印技術(shù)還不是特別的成熟,只是處在一個技術(shù)評估的時段。在這個時段,數(shù)字水印技術(shù)的深層技術(shù)并沒有完全被人們廣泛理解和應(yīng)用,同樣數(shù)字水印的高深技術(shù)問題還有很多沒有得到解決。音頻數(shù)字水印是數(shù)字水印的一個分支,是以音頻數(shù)據(jù)為載體的防偽及版權(quán)保護(hù)技術(shù)。數(shù)字水印是根據(jù)互聯(lián)網(wǎng)中傳播的數(shù)字媒體作品具有不確定性和存在一定的冗余數(shù)據(jù)的特征,將日期、圖像標(biāo)志等帶有標(biāo)志性的信息嵌入到原創(chuàng)作者的作品中,從而達(dá)到維護(hù)版權(quán)所有者的作品所有權(quán)和支配權(quán)的目的。這一操作不能影響宿主數(shù)據(jù)原先所具有的應(yīng)用價值,也不能改變原來數(shù)據(jù)量的大小。嵌入的水印信息可以通過技術(shù)軟件提取或檢測出來,如果水印信息嵌入到音頻數(shù)據(jù)上,則可以通過特殊的設(shè)備或軟件來檢測、提取水印信息。該技術(shù)在軍事通信,國家信息安全、數(shù)字化網(wǎng)絡(luò)等領(lǐng)域都具有研究發(fā)展的空間。1.3本文研究內(nèi)容和章節(jié)安排論文主要研究了語譜圖顯示的實現(xiàn)方法和基于DCT域數(shù)字圖像水印算法實現(xiàn),論文首先通過MATLAB編程實現(xiàn)了音頻數(shù)據(jù)生成寬帶語譜圖并對器灰度和彩色顯示作了對比分析。然后對于原始圖像通過DCT變換嵌入水印圖像,與原始圖像做分析比較,最后實時提取水印并對其質(zhì)量進(jìn)行評價。實驗結(jié)果表明語譜圖是語音信號處理中重要的一種工具,用于處理語音信號在圖像等領(lǐng)域的應(yīng)用具有十分重大的意義;證實DCT算法較好達(dá)到了數(shù)字圖像水印的魯棒性和不可見性之間的平衡。論文各章節(jié)具體安排如下:第一章語音信號處理及數(shù)字水印算法的研究背景和意義的闡述,以及對語譜圖和數(shù)字水印國內(nèi)外現(xiàn)狀的分析。第二章首先闡述語音信號的基本特征,然后介紹語音信號的產(chǎn)生、預(yù)處理,以及使用分幀加窗函數(shù)的作用。最后介紹了數(shù)字水印的特點,典型算法以及對數(shù)字水印算法的性能評價的基準(zhǔn)。第三章主要介紹語譜圖的實現(xiàn)過程以及各個過程的具體實施步驟主要包括六個部分:語音錄制,數(shù)據(jù)讀入程序,信號分幀加窗,能量密度譜計算,功率譜偽彩色顯示,語譜圖顯示及對結(jié)果分析。第四章主要介紹DCT數(shù)字水印算法的設(shè)計與實現(xiàn)過程,首先根據(jù)人眼對圖像的敏感程度確定水印嵌入位置對宿主圖像嵌入水?。蝗缓笸ㄟ^與原始圖像對比來檢測水印是否存在,進(jìn)而生成含有水印信息的二值圖像并對其質(zhì)量進(jìn)行評價。第五章總結(jié)主要概括了本課題進(jìn)行實驗結(jié)果的說明,其中存在許多需要解決及有待改進(jìn)的地方,通過對現(xiàn)有水印算法的設(shè)計與實現(xiàn),根據(jù)前人所研究成果進(jìn)一步對下一步的工作進(jìn)行了闡述。語言信號和圖像數(shù)字水印技術(shù)2.1概述語音的發(fā)音過程中,聲道通常都是處于運(yùn)動狀態(tài)的,因此它的共振峰特性也是時變的。不過這個時變過程比起振動過程來說要緩慢得多,因此一般可以假定它是短時平穩(wěn)的,每一時刻我們都可以用這時刻附近的一短段(例如15ms)語音信號分析得到一種頻譜?;贛ATLAB的語譜圖顯示與分析李富強(qiáng)2.2語言信號的預(yù)處理2.2.1預(yù)處理利用手機(jī)等通訊設(shè)備錄制一段聲音,經(jīng)過音頻剪輯軟件的去噪后,接下來就可以針對語音信號做一些預(yù)處理。本課題中預(yù)處理的步驟有以下兩個部分:預(yù)加重??梢院芊奖憧旖莸膲嚎s信號大致波動的范圍,排除一些外力因素的額干擾,一般可以通過一階數(shù)字濾波器來實現(xiàn)將語音信號信噪比提高。這個數(shù)字濾波器有6dB/倍頻程的提升特性,它的表達(dá)式為式(2.1):(2.1)式(2.1)中,值向1趨向,其取值范圍是0.94~0.97。由于人耳對語音高頻部分較為敏感,預(yù)加重還可以將語音高頻部分進(jìn)行加重,提高了實驗數(shù)據(jù)的準(zhǔn)確性。加窗處理。具體的加窗處理條件和分析將在下一小節(jié)詳細(xì)說明。開始對信號進(jìn)行預(yù)處理。信號的預(yù)處理過程有預(yù)加重、加窗處理等。預(yù)加重目的是有三點:一是提升高頻段,對語音高頻部分進(jìn)行加重,去除口唇輻射的影響,增加語音的高頻分辨率;二是使得該語音信號在整個頻段中保持頻譜平坦,方便進(jìn)行頻譜分析。還有就是預(yù)加重可以壓縮信號的動態(tài)范圍,提高其信噪比。在計算機(jī)中一般通過2.2.2窗函數(shù)的選擇在對語音信號進(jìn)行預(yù)加重、去噪等處理之后,接著開始借助MATLAB的窗函數(shù)對語音信號進(jìn)行分幀加窗操作。假設(shè)實驗中30ms~50ms內(nèi)語音信號平穩(wěn)。為了能夠快速的得到數(shù)據(jù)量小方便處理的語音信號幀,就要使用窗函數(shù)對該語音信號進(jìn)行加窗處理。窗函數(shù)緩緩地滑動,就將去噪操作之后的該段語音信號依次處理成短時語音幀信號。常用的窗函數(shù)都是矩形窗和漢明窗。矩形窗表達(dá)式:(2.2)漢明窗表達(dá)式:(2.3)首先我們需要合理的選擇合適的窗函數(shù),通過對這個窗函數(shù)所具有的一些短時參數(shù)特性的研究和討論,剖析出實驗所需要語音信號相對應(yīng)的基本性質(zhì)。在選擇漢明窗時所對比的矩形窗和漢明窗的參數(shù)數(shù)據(jù)如表2.1所示。表2.1矩形窗與漢明窗的比較窗類型旁瓣峰值主瓣寬度最小阻帶衰減矩形窗-134/N-21漢明窗-418/N-53由于漢明窗的第一個零值頻率位置比矩形窗要大一倍左右,且漢明窗的帶寬大約是同樣寬度矩形窗帶寬的兩倍。矩形窗的主瓣寬度小于漢明窗,具有較高的頻譜分辨率,但是矩形窗的旁瓣峰值較大,因此其頻譜容易泄露,丟失高頻成分,漢明窗比矩形窗顯得更平滑些,它的旁瓣急劇的發(fā)生變化??梢愿玫胤从承盘枙r頻特性。基于聲紋識別的身份確認(rèn)系統(tǒng)的研究白燕燕-《西安工業(yè)大學(xué)碩士論文》-2012-05-02(是否引證:否)綜上所述,根據(jù)短時語音信號是平穩(wěn)的,我們就可以通過MATLAB編程實現(xiàn)對原始錄制的一段語音信號進(jìn)行分幀加窗處理,這樣一來這段語音信號就被分成一小段的短信號幀,便于我們后續(xù)實驗進(jìn)行頻域變換操作,以達(dá)到提取語音信號其特征參數(shù)的目的。2.3數(shù)字水印2.3.1數(shù)字水印的概念數(shù)字水印是將含有一定信息量的數(shù)據(jù)嵌入到指定需要被證明或保護(hù)的宿主數(shù)據(jù)中,但是不改變宿主數(shù)據(jù)的外在體現(xiàn)且可以被繼續(xù)使用或傳播。數(shù)字水印是根據(jù)互聯(lián)網(wǎng)中傳播的數(shù)字媒體作品具有不確定性和存在一定的冗余數(shù)據(jù)的特征,將日期、圖像標(biāo)志等帶有標(biāo)志性的信息嵌入到原創(chuàng)作者的作品中,從而達(dá)到維護(hù)版權(quán)所有者的作品所有權(quán)和支配權(quán)的目的。它具有:安全性、可證明性、不可感知性、魯棒性的特點,主要運(yùn)用于版權(quán)保護(hù)、篡改提示、隱藏標(biāo)識,拷貝保護(hù)、數(shù)據(jù)隱藏和保密通訊。2.3.2數(shù)字水印的特點數(shù)字水印不僅僅要求一味的維護(hù)版權(quán)所有者起到知識產(chǎn)權(quán)的保護(hù)作用,還需要即使加入了版權(quán)保護(hù)的水印信息,該數(shù)字產(chǎn)品也能和未加水印時的一樣是可用的,并且應(yīng)該和宿主數(shù)據(jù)的一樣承載相同的應(yīng)用價值,即水印不會影響宿主數(shù)據(jù)的內(nèi)在主要結(jié)構(gòu)。然而,在不同的領(lǐng)域涉及的各種各樣的水印算法,都會為了不同的要求去追求更好的實現(xiàn)效果而不斷地進(jìn)行實驗。通常情況下認(rèn)為數(shù)字水印具有以下四個基本特點:安全性:安全性就是說數(shù)字水印的算法是公開的,但是算法實現(xiàn)過程中會選取的適當(dāng)用于加密的密鑰??勺C明性:從宿主數(shù)據(jù)產(chǎn)品中提取出的水印信息,是一串有效的信息數(shù)據(jù),可以通過該信息對數(shù)據(jù)產(chǎn)品的版權(quán)所有做出一定的判斷。不可感知性:嵌入在宿主數(shù)據(jù)中的水印信息應(yīng)該是不可見的,主觀上是說不能通過人眼直接觀察出水印相關(guān)信息,客觀上來看的話是指無法通過概率學(xué)或是統(tǒng)計學(xué)的計算得出水印信息。魯棒性:是指水印信息在宿主數(shù)據(jù)中無法被去除。也就是說任何破壞水印信息的動作都會導(dǎo)致原始數(shù)據(jù)無法實現(xiàn)和原來同樣的應(yīng)用價值,在對嵌入水印算法的分析時,只了解水印信息相關(guān)的部分參數(shù)也是幾乎無法完整的擦除水印信息。2.3.3數(shù)字水印系統(tǒng)的性能評價該評價標(biāo)準(zhǔn)是通過計算圖像之間的一些失真量度來測試圖片的質(zhì)量高低,計算較為簡單,可重復(fù)性較強(qiáng)。常用的評價失真度量方法,如平均絕對差分、均方誤差、峰值信噪比等。目前在圖像中的編碼壓縮比較流行的就是峰值信噪比(PSNR)和互相關(guān)系數(shù)(NC),其計算方法如(2.4)和(2.5)式。這里的MAX通常是圖像的灰度級,一般就是255了。W表示原始水印,大小為,表示提取的水印,大小為。(2.4)(2.5)語譜圖顯示與分析3.1語音的錄制用自己的筆記本電腦上自帶的錄音機(jī)或者其他通訊設(shè)備(比如說CoolEditPro或者手機(jī)自帶的錄音軟件)錄取人說話的聲音,本課題錄制的語音為“我是周華”。錄制完畢后格式需要做一定的處理,一般將其格式轉(zhuǎn)化wav格式的文件。通過查閱相關(guān)書籍,根據(jù)語譜圖的產(chǎn)生原理,本實驗進(jìn)行的前提條件是短時間(30ms~50ms)的語音信號是平緩的。本課題是在較為安靜的室內(nèi)環(huán)境下收集和選取的錄音。3.2數(shù)據(jù)讀入程序利用MATLAB編程實現(xiàn)語譜圖的顯示中實現(xiàn)語譜圖程序設(shè)計的流程圖如圖3.1所示。圖3.1語譜圖顯示與分析系統(tǒng)框架圖語音信號的收集完成后,首先要將錄制完畢的MP3格式的語音文件利用聲音格式轉(zhuǎn)換軟件(例如格式工廠)轉(zhuǎn)換成wav格式,接著使用wavread()函數(shù)對去噪后讀入程序的語音信號進(jìn)行采樣,本程序中選取的采樣頻率為44.1kHz,采樣點數(shù)為:1024個。本課題中運(yùn)用wavread函數(shù)的調(diào)用格式如下:[X,fw,nbits]=wavread(zhouhua.wav),zhouhua.wav為自己錄制的wav文件,返回的采樣值存放在向量X中,參數(shù)fw表示的是采樣頻率,本程序中為44.1kHz,參數(shù)nbits表示采樣位數(shù),本程序中為16位矢量量化采樣點。信號分幀加窗:分幀加窗函數(shù),本課題中采用的是hanning窗,根據(jù)要求還可選用hamming(N),其中N為窗長課題中N=1024個采樣點。課題中選擇幀長N=2048,幀移128。3.3能量密度譜計算能量譜也叫能量譜密度,單位是焦耳/Hz,針對能量有限的信號,能量信號的傅里葉變換絕對值的平方就是能量譜密度,即帕塞瓦爾定理。通過該偽彩色映射函數(shù)來生成彩色語譜圖P(n,k),能給人更好的視覺觀察從而得出較為準(zhǔn)確的結(jié)論。為得到理想的實驗效果,對編寫好的程序進(jìn)行的多次測試,得出了最佳的基準(zhǔn)電平值Base,最終得到了能給人更好視覺效果的語譜圖,并采用偽彩色模式進(jìn)行觀察。經(jīng)過上述的分析,我們可以得出控制語譜圖灰度顯示還是彩色顯示的操作主要是根據(jù)對基準(zhǔn)值Base判斷,大于基準(zhǔn)值Base時得出的就是彩色語譜圖了,就能更好的反應(yīng)該語音信號能量的分布情況。3.4相關(guān)MATLAB功能函數(shù)3.4.1用于短時頻譜分析的功能函數(shù)1)分幀加窗函數(shù):hanning(N)。其中參數(shù)N為窗長,在本實驗中即為分幀操作時選取的幀長。在信號處理中,窗函數(shù)是一種除在給定區(qū)間之外取值為0的實函數(shù)。本文所編寫的程序中所采用的是hanning窗。也可以選用其他窗,如方窗等。2)快速傅里葉變換函數(shù):fft(s)。參數(shù)s為加窗后的一幀信號。3)復(fù)數(shù)取共扼函數(shù):conj(z)。3.4.2偽彩色映射和語譜圖顯示的功能函數(shù)偽彩色映射函數(shù):colormap(MAP)。其中MAP是該函數(shù)方法中的一個參數(shù),默認(rèn)值為JET,當(dāng)MAP=colormap時獲得當(dāng)前的MAP,其中[000]表示黑色,[111]表示白色,[100]表示紅色,[.5.5.5]則表示灰色。2)頻譜圖顯示函數(shù):imagesc(t,f,L)。為了獲得語音信號的能量譜,對信號幀進(jìn)行短時的傅里葉變換后測試出合適的閥值,方便程序的調(diào)試,該函數(shù)中第一個參數(shù)t表示時間,第二個參數(shù)則f代表頻率,第三個參數(shù)L則是通過設(shè)置合適的閥值而計算出的彩色電平值。3.5語譜圖顯示及結(jié)果分析首先利用MATLAB的VOICE工具箱和M文件編寫程序,然后借助實現(xiàn)錄制好的語音“我叫周華”,運(yùn)行程序后的寬帶語譜圖灰度顯示結(jié)果如圖3.2所示。圖3.2語音“我叫周華”的寬帶語譜圖灰度顯示結(jié)果產(chǎn)生的關(guān)于“我叫周華”的寬帶語譜圖彩色顯示結(jié)果如圖3.3所示。圖3.3語音“我叫周華”的寬帶語譜圖彩色顯示結(jié)果從圖3.3中我們可以根據(jù)語譜圖的頻率分辨率,通過語音信號所具有的頻譜特性,利用偽彩色函數(shù)所顯示的彩色語譜圖所反映出來的語音信號的能量分布十分顯著,上圖中用其橫坐標(biāo)來表示時間,其縱坐標(biāo)則表示的是頻率,而圖上的時深時淺的彩色帶條紋澤表明了通過語譜圖時間分辨率的特性,顯示出較短時間的語音信號的頻譜,其顏色的深淺表示在某個時刻且確定的某個一定的頻率下,該語音信號的強(qiáng)度。圖3.3中幾條忽明忽暗的深黃色的條紋表示濁音,但是在一小段的濁音信號內(nèi),這些紋理圖形分布得較為稠密。圖中的寬帶語譜圖可以獲得較高的時間分辨率,反映頻譜的快速時變過程。寬帶灰度語譜圖上也因其灰度等級的不一樣,構(gòu)成了錯落有致的紋理,我們稱之為“聲紋”。在法律中常用到的錄音證據(jù),就是根據(jù)每個人有不同的聲紋來進(jìn)行鑒定的。所以,它也經(jīng)常在司法、安全等場合中屢試不爽。第四章DCT圖像水印算法設(shè)計及實現(xiàn)4.1概述目前流行的數(shù)字水印算法主要分為兩大類,分別為時域和空域兩種。由于空域中對語音或者圖像數(shù)據(jù)的影響因素較少,故我們采用離散余弦變換DCT(DiscreteCosineTransform)。離散余弦變換不僅僅應(yīng)用于圖像壓縮中,還適用于數(shù)字水印。在圖像水印算法中,DCT首先根據(jù)嵌入強(qiáng)度因子k的取值將宿主圖像分割成一個個Block,緊接著借助MATLAB中的函數(shù)dct2()再對每一個Block依次進(jìn)行DCT變換。4.2二維DCT的定義在數(shù)字圖像處理中使用的是二維DCT,對一副的圖像,離散余弦變換(DiscreteCosineTransform,簡稱DCT)變換對如式(4.1)所示(4.1)離散余弦逆變換(InverseDiscreteCosineTransform,簡稱IDCT)變換對如式(4.2)所示(4.2)式(4.1)與(4.2)中,本文采用離散余弦變換(DCT)設(shè)計實現(xiàn)數(shù)字水印的嵌入與提取的算法,主要基于以下幾個原因:首先分析圖像數(shù)據(jù)時,在頻域存在的干擾參數(shù)相較于時域較少,且干擾因素參數(shù)都相對集中;其次根據(jù)圖像的功率譜可以分析得出其信號的能量大部分是集中在為數(shù)不多的幾個變換系數(shù)上,如嵌入位置、嵌入強(qiáng)度因子k等。所以我們選取在宿主圖像的合適位置,選擇較佳的嵌入強(qiáng)度因子k,利用離散余弦變換(DCT)進(jìn)行水印的嵌入。4.3基于DCT域的圖像水印算法設(shè)計4.3.1水印與載體圖像的選取從水印的功能角度出發(fā),大致可以把水印分成兩種:一種是包括了記錄身份、版權(quán)等詳細(xì)內(nèi)容;而另一種則是利用概率函數(shù)所產(chǎn)生的偽隨機(jī)數(shù)來作為水印序列投入使用時只需檢測相應(yīng)的水印信息是否存在于宿主圖像中即可。然而,當(dāng)今主流中用于表現(xiàn)水印信息的方法參差不同,但是在現(xiàn)生活和理論研究中使用較多的還是這兩種:0-1比特序列水印與圖像水印。下面分別介紹兩種水印:(1)0-1比特序列水?。翰捎玫氖腔煦绗F(xiàn)象,這是在非線性動力系統(tǒng)中出現(xiàn)的確定性的、類隨機(jī)過程的過程,這種過程既非周期又不收斂,并且對初始值有極其敏感的依賴性。圖像水?。毫硪环N方法是使用圖像作為水印信息。本文中選取的是圖像水印中的二值圖像來作為本實驗中的水印圖像。之所以使用二值圖像,是由于其圖像的像素只有兩種顏色:黑和白,那么在計算機(jī)中就可以通過0和1來表示,可以更加方便的利用MATLAB的工具箱中的圖像讀入函數(shù),將二值圖像以矩陣的形式保存在二維數(shù)組中,以便于實驗的進(jìn)行。根據(jù)現(xiàn)實生活中通過拍照、美圖、PS的等媒體軟件我們時常接觸到圖像,如BMP、JPG、JIF等。其中有靜態(tài)圖像也有動態(tài)圖像,本課題談?wù)摰氖荁MP格式的靜態(tài)圖像。本課題選取的是BMP格式的512*512像素的“l(fā)ena”灰度圖像作為數(shù)字水印的宿主圖像,利用Windows7自帶的畫圖工具制作出實驗中所采用的帶有一定信息的水印圖像——定制為32*32像素的BMP格式的二值圖像。4.3.2水印的生成在本文中,我使用自制的32*32大小的BMP格式的二值灰度圖像作為水印圖像。其具體的生成方法為:首先,我們根據(jù)本次數(shù)字圖像水印實驗的需要來設(shè)定它的大小,并在制圖工具中做出該圖像,如在本文中的圖像水印為“西北師大”的靜態(tài)文字,其次將其大小設(shè)置為32*32并保存為1位(單色位圖)的BMP格式圖像。最后,我們用MATLAB工具中的工具函數(shù)將此圖像讀入,將其表示為與圖像一一對應(yīng)的二維數(shù)組。因此,根據(jù)本實驗的要求,此二維數(shù)組序列就對應(yīng)為本次實驗所需要的水印序列。4.3.3水印的嵌入位置選取在載體圖像與水印圖像都已經(jīng)選取好的情況下,接下來我們就是將水印圖像根據(jù)一種算法嵌入到載體圖像中去,即水印的嵌入。本文采用的算法為上文中提到的離散余弦變換(DCT)。在將載體圖像分塊之后,根據(jù)人眼的視覺特性我們知道利用DCT塊的區(qū)域特性來選擇相應(yīng)位置的系數(shù),據(jù)研究統(tǒng)計表明,人眼視覺去對圖像的低頻區(qū)域相對較為敏銳,若在圖像數(shù)據(jù)的低頻區(qū)域隱藏隱秘的水印信息反而達(dá)不到算法的實現(xiàn)后的預(yù)期效果,導(dǎo)致水印的不可見性降低;然而,圖像的高頻區(qū)域主要是運(yùn)用于圖像數(shù)據(jù)的壓縮,若在此處嵌入水印信息,隨著市面上的音頻剪輯軟件日益增多,對于嵌入水印的宿主圖像的魯棒性大大降低了。因此,為了兼顧水印信息的不可見性和魯棒性以及權(quán)衡水印在宿主圖像的隱蔽性,圖像數(shù)據(jù)的中頻區(qū)域才應(yīng)該是最合適的嵌入位置。本課題是通過修改圖像數(shù)據(jù)的中頻DCT系數(shù),并調(diào)整水印嵌入強(qiáng)度因子k的值,從而來實現(xiàn)水印的嵌入最終達(dá)到了信息隱藏的目的。4.3.4水印的檢測與提取水印的檢測通常是根據(jù)水印圖像的位圖和結(jié)構(gòu),以及宿主圖像嵌入水印時所采用的算法,主要是要知道在嵌入水印時選取嵌入的位置以及設(shè)置的一些比較主要的參數(shù)等重要的內(nèi)在信息,才可以比較完整地從載體圖像中檢測是否存在水印信息,決定著最終能否正確提取表示水印信息的圖像數(shù)據(jù)。當(dāng)然,采用不同的水印嵌入的算法就應(yīng)該采取不一樣的檢測水印信息和提取水印圖像的方案。對于檢測水印信息來說,主要有兩種方案:一是需要有原始載體圖像進(jìn)行對比檢測出水印信息;二是不需要原始圖像的盲檢測水印算法。本課題中所采用的方案是使用原始載體圖像進(jìn)行對比參照,從而提取出水印信息的水印檢測算法。該算法大致可以分成以下的三個步驟:首先將生成的已嵌入水印的宿主圖像讀入到二維數(shù)組I中,然后讀取未嵌入水印的原始圖像到二維數(shù)組W中,最后I與W進(jìn)行比對。根據(jù)嵌入強(qiáng)度因子k的取值,依次對嵌入水印圖像分塊成Block后,再對每個Block都進(jìn)行一次DCT逆變換。借助之前記錄的中頻區(qū)域為最佳嵌入位置,來進(jìn)一步分析在該嵌入水印圖像的每一個Block,通過判斷其中的水印序列值是“1”還是“0”,并存儲到相應(yīng)的二維數(shù)組中就可以完整的復(fù)原出二值水印圖像,從而達(dá)到提取水印的目的。4.4基于DCT域的圖像水印算法實現(xiàn)與分析4.4.1.水印的嵌入將二值圖像水印信息嵌入到載體圖像中,并通過在MATLAB系統(tǒng)中的具體實現(xiàn),將原始載體圖像和含有水印信息的載體圖像兩幅圖像進(jìn)行對比。在本次實驗中,我們根據(jù)嵌入強(qiáng)度因子k的取值不同,分別列出了其在不同嵌入強(qiáng)度下的原始圖像與含有水印圖像之間的對比圖。如圖4.1為當(dāng)嵌入強(qiáng)度k的取值不同時原始圖像與含水印圖像之間的對比圖。(a)原始圖像(b)k取8(c)k取12(d)k取14(d)k取16圖4.1k取不同值時原始圖像與嵌入水印圖像對比由圖4.1可知,利用MATLAB運(yùn)行嵌入水印的程序,隨著嵌入強(qiáng)度k的取值不斷增大,宿主圖像在嵌入水印后質(zhì)量進(jìn)一步在降低,逐漸開始出現(xiàn)若隱若現(xiàn)的斑紋及微小的突兀,即水印的不可見性越來越差。因此,本論文在所數(shù)字水印的嵌入時,因選取合適的k值,使其在滿足不可見性的前提下最大限度的增強(qiáng)魯棒性。4.4.2.水印的提取將水印嵌入到載體圖像后,我們應(yīng)該還能夠?qū)⑵鋸暮≥d體圖像中將水印提取出來。在下面的4.2中為在不同的嵌入強(qiáng)度下,對含水印的載體圖像不進(jìn)行任何的攻擊手段,直接提取數(shù)字水印圖片的提取水印與原始水印的對比圖:(a)水印圖像(b)k取8(c)k取12 (d)k取14(e)k取16圖4.2k取不同值時原始水印與提取水印對比下表為通過改變程序中嵌入強(qiáng)度因子k的取值,分別對psnr值和nc值進(jìn)行記錄,反映出對于不同k值提取出水印結(jié)果其質(zhì)量的評價與性能等級。表4.1直接提取水印時的性能評價嵌入強(qiáng)度k取值psnrnc提取水印等級844.98340.6757差1243.17570.9940良1442.63861優(yōu)169.12581優(yōu)30100根據(jù)上表中的數(shù)據(jù)信息分析和比較,我們可以得出以下結(jié)果:當(dāng)數(shù)字水印嵌入強(qiáng)度因子k>30時開始,水印無法成功嵌入原始圖像,自然就無法成功提取出水印信息,也不會存在兩圖像對比的峰值信噪比(PSNR)的數(shù)據(jù),當(dāng)然,也無法對提取的水印進(jìn)行合適的性能評價,所以如表4.1所示,當(dāng)k=30和k=100時,實驗數(shù)據(jù)并未錄入。但是當(dāng)嵌入強(qiáng)度因子k>14以后,通過與原始圖像進(jìn)行對比

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論