基于UCL的音頻數(shù)字水印嵌入技術(shù)研究_第1頁
基于UCL的音頻數(shù)字水印嵌入技術(shù)研究_第2頁
基于UCL的音頻數(shù)字水印嵌入技術(shù)研究_第3頁
基于UCL的音頻數(shù)字水印嵌入技術(shù)研究_第4頁
基于UCL的音頻數(shù)字水印嵌入技術(shù)研究_第5頁
已閱讀5頁,還剩116頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于UCL的音頻數(shù)字水印嵌入技術(shù)研究 Index:TP391 UDC00477 SouthwestUni versi ty ofScienceandTechnoIogy Master Thesi S Degree Researchon Audi0Watermarki Oigita ng Embeddi TechnoBasedonUCL ng ogy Grade2009 HeMe CandIdate Academjc iedforMaster DegreeAppI aI ComfllunIcatioRandnformatioR Speciity System AssociateProfessor

2、Xi Li Supervisor ng ng June1 2012 獨(dú)創(chuàng)性聲明 本人聲明所呈交的論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研 究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他 人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得西南科技大學(xué)或其它教育機(jī)構(gòu) 的學(xué)位或證書而使用過的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均 已在論文中作了明確的說明并表示了謝意。 簽名:組髓 日期:為似6f 關(guān)于論文使用和授權(quán)的說明 本人完全了解西南科技大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校有權(quán) 保留學(xué)位論文的復(fù)印件,允許該論文被查閱和借閱;學(xué)校可以公布該論文的全部 或部

3、分內(nèi)容,可以采用影印、縮印或其他復(fù)制手段保存論文。 保密的學(xué)位論文在解密后應(yīng)遵守此規(guī)定 簽名:艇簿 導(dǎo)師簽名:,神於 日期:w,、J I 西南科技大學(xué)碩士研究生學(xué)位論文 第l頁 摘 要 隨著網(wǎng)絡(luò)技術(shù)和音頻壓縮技術(shù)的飛速發(fā)展,音頻資源量每天都在不斷攀 升且其在網(wǎng)絡(luò)中承載的業(yè)務(wù)也越來越多元化,這直接導(dǎo)致了對(duì)海量音頻管理 難度的加大,究其原因是忽略了音頻資源內(nèi)容語義信息,從而導(dǎo)致了信息孤 島難于理解且相互分離。論文以音頻語義理解為基點(diǎn),以資源管理為目標(biāo), 主要圍繞其中的數(shù)字音頻分級(jí)管理和數(shù)字音頻安全傳輸管理兩方面展開研 究,并根據(jù)實(shí)際要求設(shè)計(jì)了較為全面的算法。論文主要研究?jī)?nèi)容如下: 1 針對(duì)網(wǎng)絡(luò)前端

4、音頻資源量大、難于管理的問韙,構(gòu)建了基于數(shù)據(jù)價(jià) 值的分級(jí)存儲(chǔ)管理 Hierarchical Storage 慮了影響數(shù)據(jù)價(jià)值的本征屬性和預(yù)測(cè)價(jià)值,然后將兩因素按一定的比例進(jìn)行 關(guān)聯(lián),使數(shù)據(jù)價(jià)值得到了精確的表示,進(jìn)而將音頻資源分為高低價(jià)值兩個(gè)等 級(jí),并將高價(jià)值數(shù)據(jù)作為優(yōu)先發(fā)送的數(shù)據(jù)集。實(shí)驗(yàn)仿真表明,當(dāng)遷移量占總 量的一半時(shí)。相比傳統(tǒng)的Cache緩存替換算法,本算法具有更高的遷移準(zhǔn)確 率。 Content 2 研究基于統(tǒng)一內(nèi)容定位 UniformLoeator,UCL 標(biāo)引的數(shù)字 水印音頻語義管理技術(shù),分析了基于分類語義的音頻數(shù)字水印算法。首先通 過全面分析音頻內(nèi)容特征,將它們進(jìn)行規(guī)劃整合形成完整

5、的語義標(biāo)引表。并 進(jìn)一步根據(jù)用途分類,形成分類語義信息,作為本算法待嵌入的水印信息。 然后將音頻特征點(diǎn)和特征段作為水印嵌入位置,根據(jù)心理聲學(xué)模型自適應(yīng)確 定水印嵌入強(qiáng)度,晟后利用本文提出的改進(jìn)的量化算法,根據(jù)各類語義水印 的特點(diǎn)嵌入到不同的位置上。用語義水印實(shí)現(xiàn)了語義信息與原始音頻信號(hào)的 一體化傳輸,并用高效的算法保證了語義水印的安全性和完整性,為水印的 后續(xù)應(yīng)用提供了前期保障。實(shí)驗(yàn)結(jié)果表明相較于其它同類算法。本算法的 水印容量是它們的數(shù)倍,同時(shí)在不可聽性和魯棒性這兩個(gè)性能指標(biāo)上也具有 明顯的優(yōu)勢(shì)。 關(guān)鍵詞:分級(jí)存儲(chǔ) 數(shù)據(jù)遷移策略 數(shù)據(jù)價(jià)值 數(shù)字音頻水印 分類語義水印 西南科技大學(xué)碩士研究生學(xué)

6、位論文 第|頁 Abstract Withthe ofnetwork andaudio rapiddevelopmenttechnology compression difficultto immenseamountof becomesmoreandmore technology,it manage audioresourcesbecauseare and more they increasingeverydaydelivering variableservicesThe ofsemanticcontent ofaudio ignorance management resources1cads

7、to and ofinformationsilosThis incomprehensionseparation dissertationis focusedonclassification and mainly managementsafety transmission of audioresourcesand managementdigital corresponding sametimeTheaimofthisdissertationisto are atthe algorithmsdesigned resourcesonthebasisofSemantic of efficientlym

8、anage understandingdigital audio Thisdissertation aHierarchical presents Storage basedOildatavalue tosolvethe thataudioresources algorithm aiming problem are andhardto inthewebfrontendIntrinsic and huge manage property valueofdataareconsidered and valuewhichaffects y predicted adequate associatedins

9、omeratioSOthatdatavaluecanbe Audio representedaccurately resourcesaredividedintotwo andlowvalue The classesi e,high respectively first resultsshow onewith valueistakenasthedatasetsent Experiment high thatthis hasa ratethantraditionalcache algorithmhigheraccuracy replacement when reaches50ofthewholed

10、ataresources algorithmsmigrationproportion Semantic ofaudioresourcesbasedonwatermark managementtechnique indexedUniformContentLocatoris studiedanda watermark by digital in foraudioresourcesbasedonclassifiedSemanticsis this agorithm proposed ofaudiocontentsare inorder paperFirstly,characteristics ana

11、lyzedthoroughly whichareusedto classifiedsemantic that semanticindexes produce complete semantic informationtotheir Callbe Theclassified accordingusages generated 1nformationls embeddedintoaudiomaterialsaswatermarkinformation and arecalculatedas and Secondly,featurepointssegments embeddingpositions

12、isderivedfrom model embeddingstrength psychoacousticThirdly,semantic areembeddedintodifferent totheirtraitsthe watermarks pointsaccording by inthisdissertation improvedquantizationalgorithmproposed Transmitting I 西南科技大學(xué)碩士研究生學(xué)位論文 第1 I頁 anditssemanticinformationwatermarkare audioinformation through or

13、iginal watermarkarc the realized and ofsemantic Safety integrity guaranteedby efficient which a for safeguardsubsequentapplications algorithmprovides resultsshowthatwatermarkofthis isseveral Experiment capacity algorithm times thattheotheronesofthesRnle the and larger class,andimperc。ptibility areal

14、so robust superior Hierarchical migration StorageManagement HSM ;data audio value;digital strategy;data semanticwatermark 西南科技大學(xué)碩士研究生掌位論文 第lV頁 西南科技大學(xué)碩士研究生學(xué)位論文 第V頁 334轉(zhuǎn)移量的仿真分析 3 4本章小結(jié) 4基于分類語義的數(shù)字音頻水印算法 41水印嵌入系統(tǒng)結(jié)構(gòu) 42音頻語義水印 42 1音頻語義標(biāo)引 42 2語義分類 423分類語義生成算法 43水印嵌入算法 43 1水印嵌入位置的確定 432水印嵌入量的確定 4 33水印嵌入過程 44

15、水印提取算法 4 5仿真結(jié)果與分析 45 1不可感知性 452魯棒性 453水印嵌入量 4 6本章小結(jié) 結(jié) 論 致 謝 參考文獻(xiàn) 攻讀學(xué)位期間發(fā)表的相關(guān)學(xué)術(shù)論文及研究成果 sj娟拍船蛇蝎蚰如礬弛弱w弱叭盯 西南科技大學(xué)碩士研究生學(xué)位論文 第1頁 1 緒論 1 1 課題的研究背景及童義 音樂與大眾生活息息相關(guān),是人們休閑娛樂的主要方式之一。隨著網(wǎng)絡(luò) 技術(shù)和音頻技術(shù)的快速發(fā)展,音頻資源日益增多形成了一個(gè)巨大的資源庫, 人們面臨的選擇也越來越豐富。根據(jù)2012年1月16日由CNNIC發(fā)布的第 29次中國(guó)互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告可知,2011年網(wǎng)絡(luò)音樂的使用率在網(wǎng) 2,網(wǎng)絡(luò)音頻的迅速發(fā)展使之成為當(dāng)前網(wǎng)絡(luò)

16、數(shù) 絡(luò)應(yīng)用中排名第三,高達(dá)75 據(jù)中不可忽視的中堅(jiān)力量。然而人們的滿意程度并沒有隨著信息量的增多而 提高,人們?cè)谙硎芫W(wǎng)絡(luò)技術(shù)帶來便利的同時(shí),不得不面對(duì)隨之而來的負(fù)面影 響一音頻管理越來越困難。具體表現(xiàn)在:音頻資源信息量大,包括各種格 式、各種派別、各種熱度的作品,當(dāng)搜索包含相同關(guān)鍵詞的音樂作品時(shí),出 來的結(jié)果可能會(huì)包含很多相關(guān)或不相關(guān)的資源,用戶不得不再次面臨更加精 確的選擇。音頻標(biāo)簽往往只有幾個(gè)關(guān)鍵字,非常局限,往往不能全面反映 音頻本身所要表達(dá)的內(nèi)容,用戶根據(jù)這些信息很難對(duì)音頻資源進(jìn)行有效的管 理。多媒體數(shù)字作品被盜版者大量復(fù)制和傳播并以此獲取暴利,嚴(yán)重?fù)p 害了版權(quán)所有者的利益。出現(xiàn)這些現(xiàn)

17、象的原因主要有咀下幾個(gè)方面:對(duì)于 某一固定群體來說,各類音頻資源被平等對(duì)待,沒有等級(jí)之分,即高熱度音 頻和低熱度音頻在網(wǎng)絡(luò)中擁有相同的地位,占有相同的資源,對(duì)用戶具有相 同的影響力。這與實(shí)際情況顯然是相違背的,對(duì)于群體用戶來說它們有其特 有的群體特征,如對(duì)某一類事物的偏愛:而對(duì)網(wǎng)絡(luò)音頻來說,它們也有其自 身的網(wǎng)絡(luò)特征,如某類音頻最近在網(wǎng)絡(luò)中點(diǎn)擊率很高。忽略對(duì)這些因素的考 慮,顯然在搜索資源時(shí)得不到準(zhǔn)確的、有針對(duì)性的結(jié)果。在網(wǎng)絡(luò)音頻管理 中忽略了信息內(nèi)容語義。目前音頻資源在網(wǎng)絡(luò)中是利用其底層特征來表現(xiàn)的, 底層特征屬于音頻的低層語義,它包括子帶周期、MFCC、過零率、短時(shí)平 均能量、熵、帶寬均值

18、等,這些特征是音頻固有的屬性,反應(yīng)音頻本征特性。 但是它與人類思維中的語義概念不是同一層面,無直接對(duì)應(yīng)關(guān)系,用戶無法 據(jù)此判斷該音頻是否所需信息。而信息內(nèi)容語義屬于音頻高層語義,它包含 了歌名、歌手、所屬流派等信息,這些與人類思維是相一致的,用戶可以直 接從中直觀地了解音頻內(nèi)容的相關(guān)信息。高層語義與音頻特征之間的語義鴻 溝直接導(dǎo)致信息難于理解和相互分離,從而無法用人類的思維進(jìn)行有效管理。 西南科技大學(xué)碩士研究生學(xué)位論文 第2頁 當(dāng)前數(shù)字音頻相關(guān)技術(shù)相當(dāng)成熟,如編輯、拼接等,使人們對(duì)音頻進(jìn)行各 種處理變得極其容易這對(duì)音頻資源的安全性造成了嚴(yán)重的威脅。 為了解決信息量大、利用率低問題,提出了分級(jí)存

19、儲(chǔ)的理念”,它根據(jù) 價(jià)值將數(shù)據(jù)分配到與之匹配的存儲(chǔ)設(shè)備中進(jìn)行分級(jí)管理。這不僅有效辨別了 數(shù)據(jù)的重要性,提高了信息利用率,同時(shí)節(jié)約了管理成本、提高了數(shù)據(jù)訪問 速度。分級(jí)準(zhǔn)確率的高低與否在于遷移策略” 包括價(jià)值評(píng)定模型和遷移條 件 的制定。目前數(shù)據(jù)遷移策略主要有基于存儲(chǔ)空間的高低水位法-,Cache 數(shù)據(jù)緩存替換算法”,和基于生命周期管理 Information LifecycleManagement ILM O?的數(shù)據(jù)遷移ww。在這些簟略中它們考慮的因素過于簡(jiǎn)單,且只考慮了 文件當(dāng)前的價(jià)值,沒有對(duì)文件遷移后的再利用價(jià)值作預(yù)測(cè),往往不能達(dá)到較 高的遷移精確度。 在音頻語義理解的研究進(jìn)程中相繼出現(xiàn)了

20、多媒體內(nèi)容描述接口 決海量資源與檢索難度之間的矛盾而提出的,通過對(duì)音頻內(nèi)容進(jìn)行標(biāo)準(zhǔn)化描 述,使用戶能快速有效地搜索感興趣的資源。盡管MPEG一7在某種程度上對(duì) 音頻內(nèi)容進(jìn)行了描述,但是卻沒有對(duì)它進(jìn)行語義理解,沒有站在用戶的角度 對(duì)其語義元素和字段進(jìn)行準(zhǔn)確的定義,因此,在一定程度上限制了它的應(yīng)用 一“”。MPEG21的出現(xiàn)是為了解決網(wǎng)絡(luò)透明傳輸、多媒體數(shù)據(jù)擴(kuò)展和重復(fù)利 用的難題。它提供了一系列的內(nèi)容服務(wù) 內(nèi)容創(chuàng)建、定級(jí)、傳輸?shù)?供用戶 之間相互作用。不過,MPEG一21只對(duì)描述框架進(jìn)行了定義,沒有對(duì)多媒體內(nèi) 容信息進(jìn)行語義理解和標(biāo)引”m“”。 針對(duì)多媒體信息安全問題,使用數(shù)字水印技術(shù)得到了很好的

21、解決。其基 本原理是在不影響聽覺質(zhì)量的前提下向原始音頻信號(hào)中加入特定的信息即水 印,通過這些信息實(shí)現(xiàn)版權(quán)保護(hù)、信息完整性認(rèn)證、內(nèi)容監(jiān)控、篡改拷貝檢 測(cè)等作用,是多媒體信息安全保障的有力技術(shù)手段。但目前的數(shù)字水印算法 中,嵌入的內(nèi)容較為單一,僅僅應(yīng)用在內(nèi)容認(rèn)證,版權(quán)判別等領(lǐng)域,而對(duì)嵌 入點(diǎn)的利用以及嵌入內(nèi)容的應(yīng)用沒有得到充分的挖掘。 因此,在開放、自由、共享的網(wǎng)絡(luò)環(huán)境下,如何吐陳納新,去除冗余信 息保留有用信息,根據(jù)用戶興趣行為建立信息分級(jí)管理機(jī)制;如何跨越“語 義鴻溝”,用人類的思維建立具有語義理解的、高效的統(tǒng)一內(nèi)容管理機(jī)制:如 何建立可靠的、可信的信息安全保護(hù)機(jī)制是亟待解決的問題。 西南科技

22、大學(xué)碩士研究生學(xué)位論文 第3頁 12國(guó)內(nèi)外研究現(xiàn)狀 1 2 1分級(jí)存儲(chǔ)管理 信息技術(shù)高度發(fā)達(dá),各種各樣的事物正以信息數(shù)據(jù)的形式存在著,充斥 著整個(gè)網(wǎng)絡(luò)和現(xiàn)實(shí)世界。尤其是對(duì)于企業(yè)用戶,信息更是它們耐以生存的寶 貴財(cái)富,所以信息的安全存儲(chǔ)和高效利用是它們一直都非常重視的問題。然 而面對(duì)呈幾何級(jí)數(shù)快速增長(zhǎng)的數(shù)據(jù),他們不得不面對(duì)數(shù)據(jù)在存儲(chǔ)管理上出現(xiàn) 的難題:存儲(chǔ)系統(tǒng)成本增加、管理更加復(fù)雜;數(shù)據(jù)存取的速度降低。分級(jí)存 儲(chǔ)管理技術(shù)的出現(xiàn)使得以上問題迎刃而解。數(shù)據(jù)分級(jí)存儲(chǔ)管理的基本思想是 在不同性能的存儲(chǔ)設(shè)備上以不同的存儲(chǔ)方式存放不同的數(shù)據(jù)。萁分級(jí)的主要 依據(jù)是數(shù)據(jù)的訪問量、訪問時(shí)間、重要性等性能指標(biāo)。重要

23、的數(shù)據(jù)放在高級(jí) 存儲(chǔ)設(shè)備中而不重要的數(shù)據(jù)放在低級(jí)的存儲(chǔ)設(shè)各中。在這個(gè)過程中,遷移 策略成為分級(jí)存儲(chǔ)的關(guān)鍵。根據(jù)制定的策略當(dāng)數(shù)據(jù)達(dá)到遷移觸發(fā)條件時(shí)即 可進(jìn)行遷移,最終實(shí)現(xiàn)分級(jí)。 目前數(shù)據(jù)遷移策略主要有基于存儲(chǔ)空間的高低水位法、Cache數(shù)據(jù)緩存 替換算法和基于生命周期管理ILM中的數(shù)據(jù)遷移。高低水位法預(yù)先設(shè)定存儲(chǔ) 的高水位和低水位,當(dāng)數(shù)據(jù)量達(dá)到高水位時(shí),將數(shù)據(jù)遷移至性能低的存儲(chǔ)層 中,直至低水位才停止“。這種方法以存儲(chǔ)設(shè)各為中心,根據(jù)其狀態(tài)遷移數(shù) 據(jù),忽略了數(shù)據(jù)自身的特性,因此無法使數(shù)據(jù)得到有效地利用,降低了系統(tǒng) 的性能。Cache緩存替換算法根據(jù)某種策略將存儲(chǔ)器中不再具有價(jià)值的文件 替換出去,

24、以釋放空間”。替換策略目前有很多種:如LRU”、SIZE、GDS、 LFU等?;谏芷诠芾淼臄?shù)據(jù)遷移是根據(jù)對(duì)數(shù)據(jù)價(jià)值的評(píng)定,分配與其 價(jià)值相適應(yīng)的存儲(chǔ)設(shè)備”1。數(shù)據(jù)價(jià)值的評(píng)定有基于數(shù)據(jù)塊的方法如文獻(xiàn) 算法和基于ILM的數(shù)據(jù)遷移都存在相似的不足:考慮的因素較為簡(jiǎn)單,盡管 都考慮了訪問時(shí)間和頻率,但有的為了便于計(jì)算而簡(jiǎn)化了用戶數(shù)量和文件大 小等重要因素,往往不能達(dá)到較高的精確度。 為了更加精確地定位用戶感興趣的內(nèi)容,同時(shí)也為了減小資源標(biāo)引的工 作量,本文正是利用分級(jí)存儲(chǔ)的思想來管理海量音頻,把它們分為高價(jià)值和 低價(jià)值兩個(gè)等級(jí)。將高價(jià)值的文件作為優(yōu)等資源優(yōu)先進(jìn)行語義標(biāo)引然后通過 廣播網(wǎng)絡(luò)進(jìn)行傳送

25、以備進(jìn)一步的應(yīng)用,而低價(jià)值資源則暫時(shí)不予應(yīng)用,除非 它隨著時(shí)間、訪問率以及其它因素的影響轉(zhuǎn)變成為高價(jià)值。而價(jià)值的評(píng)定方 法和對(duì)應(yīng)的閥值設(shè)置則是通過遷移策略來實(shí)現(xiàn)。針對(duì)上述遷移算法存在的缺 西南科技大學(xué)碩士研究生學(xué)位論文 第4頁 陷以及論文研究?jī)?nèi)容的實(shí)際需要,在第三章中提出了一種基于文件價(jià)值的高 效的遷移策略。 1 22語義標(biāo)引技術(shù) 在音頻資源的應(yīng)用范疇中,音頻資源標(biāo)引起到至關(guān)重要的作用。如音頻 分類、個(gè)性推薦系統(tǒng)、智能代理系統(tǒng)、音頻檢索、安全傳輸、版權(quán)保護(hù)等, 它們都是根據(jù)音頻資源的內(nèi)容標(biāo)引進(jìn)行各種具體操作。目前,音頻資源的內(nèi) 容標(biāo)引主要是通過音頻信號(hào)的底層特征來表示”,因?yàn)榈讓犹卣魇且纛l信號(hào)

26、 固有的屬性,它們可以通過直接對(duì)音頻信號(hào)進(jìn)行相應(yīng)的處理得到,所以便于 提取、表達(dá),因此,也更便于給音頻資源貼上標(biāo)簽。當(dāng)前,音頻底層特征主 要包括Mel倒譜系數(shù)、子帶能量比、能量分布曲線、短時(shí)平均能量、帶寬均 值、能量點(diǎn)、過零率等,根據(jù)音頻資源的具體應(yīng)用背景,貼上對(duì)應(yīng)的底層特 征即語義標(biāo)簽。JohnSaunders”在對(duì)商業(yè)電臺(tái)的廣播內(nèi)容的分類中,應(yīng)用過 Scheirerl”等人 零率和能量分布曲線這兩個(gè)特征;麻省理工學(xué)院 MIT 的Eric 通過提取音頻信號(hào)的頻譜流量、頻譜中心等十三種特種,經(jīng)過相互結(jié)合來區(qū) 分音樂和語音信號(hào)。目前,國(guó)內(nèi)外學(xué)者對(duì)音頻資源的高層特征也開展了一系 列的研究。音頻高層

27、特征是一種抽象的語義,但它更符合人類思維對(duì)大眾事 物的理解。具體包括音頻所表達(dá)的情感;音頻作品攜帶的版權(quán)信息如作曲者、 作詞者、出版者等;旋律、音色等。文獻(xiàn)26271通過分析音頻信號(hào)的特征, 然后以語義標(biāo)引的形式顯示了音頻所含的器樂信息。文獻(xiàn)28為了辨別音頻 信號(hào)所傳達(dá)的情感,應(yīng)用相關(guān)分析法來進(jìn)行信號(hào)處理。文獻(xiàn)【2930通過分析 音頻信號(hào)的節(jié)奏特征來識(shí)別音樂的流派。其中,節(jié)奏特征由信號(hào)的MFCC系 數(shù)來表示。文獻(xiàn)【31【32】33】通過對(duì)音頻資源進(jìn)行人工標(biāo)引形成了“social tags”,可以進(jìn)行檢索和分類等應(yīng)用。但人工標(biāo)引有其自身的缺陷:當(dāng)數(shù)據(jù) 量很小時(shí),人工方式可以實(shí)現(xiàn),但是當(dāng)數(shù)據(jù)量很大

28、時(shí),工作量非常大,用人 工標(biāo)引的方式顯然不現(xiàn)實(shí)。對(duì)于一樣的音樂作品不同的標(biāo)引者會(huì)有不同 的見解,且有時(shí)人們對(duì)音樂所表達(dá)的內(nèi)容情緒很難找到合適的文字去形容, 因此,人工標(biāo)引的方式很難形成統(tǒng)一的標(biāo)準(zhǔn)。文獻(xiàn)341重點(diǎn)研究了四個(gè)音樂 描述參數(shù),即音符、音高、起效時(shí)間、節(jié)奏。針對(duì)不同的參數(shù)設(shè)計(jì)了不同的 提取算法將它們提取出來,最后通過設(shè)計(jì)相應(yīng)的軟件,實(shí)現(xiàn)自動(dòng)標(biāo)引。 論文應(yīng)用UCL標(biāo)引技術(shù)對(duì)音頻內(nèi)容特征進(jìn)行標(biāo)引,通過全面分析音頻作 品內(nèi)容本身攜帶的信息,制定全面、詳細(xì)、準(zhǔn)確的語義標(biāo)引表。每首音樂對(duì) 應(yīng)一張標(biāo)引表,當(dāng)對(duì)音頻進(jìn)行管理時(shí),僅需查看表中的某些項(xiàng)進(jìn)行相應(yīng)的語 西南科技大學(xué)碩士研究生學(xué)位論文 第5頁

29、義計(jì)算即可達(dá)到管理的目的 1 23數(shù)字水印技術(shù) 數(shù)字水印技術(shù)是近幾年來國(guó)際學(xué)術(shù)界興起的一個(gè)前沿研究領(lǐng)域u“。它與 信息安全、信息隱藏、數(shù)據(jù)加密等均有密切的關(guān)系。尤其是作為加密技術(shù)的 補(bǔ)充,在多媒體信息的版權(quán)保護(hù)與完整性認(rèn)證方面得到迅猛的發(fā)展。數(shù)字水 印技術(shù)是通過一定的算法將一些秘密信息一水印直接嵌到多媒體的內(nèi)容當(dāng) 中,但不影響原內(nèi)容的價(jià)值和使用,井且不能被人的知覺系統(tǒng)覺察或注意到。 水印信息可以是無意義的隨機(jī)序列或是有意義的版權(quán)標(biāo)識(shí)、作者序列號(hào)、公 司標(biāo)志等,可以用來證明版權(quán)歸屬或跟蹤侵權(quán)行為等。隨著數(shù)字水印技術(shù)的 不斷發(fā)展,應(yīng)用范圍不斷擴(kuò)展,各種應(yīng)用需求不斷提高,數(shù)字水印技術(shù)已經(jīng) 滲透到許多

30、領(lǐng)域,如秘密通信、拷貝監(jiān)控、交易跟蹤、真?zhèn)舞b別、廣播監(jiān)控 等。水印的植入僅僅利用數(shù)字媒體的原始空間,并不增加額外的空間。數(shù) 字水印技術(shù)必須具有較強(qiáng)的魯棒性、安全性和透明性。 目前,音頻數(shù)字水印算法的研究主要集中在時(shí)域、頻域和壓縮域。時(shí)域 音頻水印算法是通過直接修改采樣點(diǎn)的值來實(shí)現(xiàn)水印的嵌入。典型算法包括 最不重要位水印算法 1eastsignificant 等。文獻(xiàn)371提出了一種改進(jìn)的LSB水印算法,該算法在水印嵌入位置的選 擇上較以往的算法更加合理,同時(shí)在水印信號(hào)的嵌入過程中修改采樣點(diǎn)值, 使得嵌入前后的樣點(diǎn)值差值最小,提高了水印的不可感知性,但魯棒性比較 差。文獻(xiàn)38】采用分布式方法,通

31、過新的LSB編碼算法實(shí)現(xiàn)將水印嵌入至LSB 較高層的功能,提高了算法的魯棒性和比特率。LSB算法簡(jiǎn)單易實(shí)現(xiàn),但是 對(duì)某些信號(hào)處理比較敏感,抗干擾能力差,穩(wěn)健性差,因此實(shí)用價(jià)值較小。 當(dāng)前頻域水印算法是數(shù)字水印領(lǐng)域的主流算法,它通過修改頻域系數(shù) 的方式來實(shí)現(xiàn)水印的嵌入。典型算法包括離散傅立葉變換 DFT u”n”、離散余 弦變換 DCT “、離散小波變換 DWT ”n”等。額域算法較時(shí)域算法具有以 下幾點(diǎn)顯著優(yōu)勢(shì):為確保水印信息的不可聽性,頻域中嵌入水印信號(hào)能量 可分布于原始音頻信號(hào)中時(shí)域的任何位置上。在水印編碼的實(shí)現(xiàn)過程中, 人們對(duì)音頻的聽覺處理特點(diǎn)使頻域具有更強(qiáng)的水印結(jié)合能力。文獻(xiàn)r45提出

32、 了DCT域自適應(yīng)量化算法,通過設(shè)計(jì)有效的量化規(guī)則和選擇臺(tái)適的量化步長(zhǎng) 將魯棒性水印和脆弱水印同時(shí)嵌入水印中。實(shí)驗(yàn)表明一種水印能抵抗防偽攻 擊,而另一種水印能抵抗常規(guī)信號(hào)處理。文獻(xiàn)f461提出了基于音頻特征的多 小波域水印算法,通過將音頻幀進(jìn)行分抽樣為兩個(gè)子音頻幀并分別將其變換 西南科技大學(xué)碩士研究生學(xué)位論文 第6頁 到多小波域。利用兩個(gè)子音頻幀在多小波域的能量來估計(jì)所嵌入水印的容量, 并根據(jù)它們的能量大小關(guān)系完成水印的嵌入。在保證聽覺質(zhì)量的同時(shí)提高了 水印的魯棒性。壓縮域水印算法的基本原理是將水印信息嵌入至壓縮位流或 對(duì)應(yīng)索引中。該類算法的主要缺點(diǎn)是編碼系統(tǒng)比較復(fù)雜,受格式化變化的限 制較大

33、。壓縮處理本身已經(jīng)過濾掉了很多冗余信息,所以再往里面添加水印 信息的難度較大。文獻(xiàn)47J提出了MP3steg壓縮域水印技術(shù)。文獻(xiàn)【48提出盲 檢測(cè)音頻水印技術(shù),該類技術(shù)直接作用于壓縮域中嵌入的水印。文獻(xiàn)49】采 用比特流比例因子的方法來完成水印的嵌入。結(jié)合上述三個(gè)域的水印算法, 壓縮域水印算法格式符臺(tái)當(dāng)前主流格式但是存在魯棒性差的問題,時(shí)域水印 算法實(shí)現(xiàn)簡(jiǎn)單但是不可聽性和魯棒性之間的矛盾得不到有效的解決。而頻域 水印算法在保證不可聽性和魯棒性得到有效的權(quán)衡的情況下,實(shí)現(xiàn)起來并不 復(fù)雜,因此論文第四章將采用頻域水印算法來實(shí)現(xiàn)分類語義水印的嵌入。 1 3課題來源 本課題來源于國(guó)家自然科學(xué)基金一新一

34、代廣播網(wǎng)的語義計(jì)算與內(nèi)容管理 機(jī)制研究 項(xiàng)目編號(hào):60902021 。 1 4論文主要研究?jī)?nèi)容和結(jié)構(gòu) 論文主要研究音頻資源管理問題,圍繞其中的音頻資源分級(jí)管理和安全 傳輸管理進(jìn)行深入研究。試圖解決音頻資源信息量大,難于管理的問題,提 高信息的利用價(jià)值:解決音頻資源缺乏語義標(biāo)識(shí)難于理解的問題,提高信息 的可解可讀性i解決音頻資源在網(wǎng)絡(luò)中的安全傳輸問題,提高信息的可信性。 通過建立易于理解的、高效的資源管理機(jī)制,更加有序的管理音頻資源,以 滿足用戶的需求。論文研究?jī)?nèi)容概況為以下三部分: 1 音頻資源分級(jí)存儲(chǔ)管理機(jī)制研究 在網(wǎng)絡(luò)前端,對(duì)音頻數(shù)據(jù)進(jìn)行分析進(jìn)而將數(shù)據(jù)分級(jí)管理把其中人們堆 常用的、最有價(jià)值

35、的、熱度最高的音頻篩選出來進(jìn)行優(yōu)先推送這不僅使尋 找資源時(shí)范圍縮小了,難度降低了,同時(shí)使存儲(chǔ)系統(tǒng)的成本降低了、管理簡(jiǎn) 化了,數(shù)據(jù)存取的速度也提高了。 2 音頻信息語義標(biāo)引規(guī)范及分類語義形成 在源端對(duì)大量音頻資源的內(nèi)容特征進(jìn)行分析、記錄和提取,找到音頻信 西南科技大學(xué)碩士研究生學(xué)位論文 第7頁 號(hào)共有的高層屬性,采用UCL技術(shù)將它們形成一個(gè)規(guī)范的、完整的音頻語義 描述框架。依據(jù)框架,可以對(duì)每個(gè)音頻貼上其對(duì)應(yīng)的語義標(biāo)簽。同時(shí),根據(jù) 接收端語義信息韻不同用途,將語義信息進(jìn)行分類,以便在源端對(duì)各類水印 進(jìn)行有針對(duì)性的嵌入。 3 措建音頻數(shù)字水印系統(tǒng) 搭建音頻數(shù)字水印系統(tǒng),結(jié)合原始音頻信號(hào)的特點(diǎn)將語義水

36、印嵌入其中 完成語義信息在網(wǎng)絡(luò)中的安全傳輸。利用載體音頻攜帶的語義水印,在保護(hù) 音頻版權(quán)的同時(shí),對(duì)音頻資源進(jìn)行管理,如音頻分類、檢索等。水印系統(tǒng)主 要依據(jù)這兩個(gè)方面的應(yīng)用,在算法設(shè)計(jì)時(shí),有針對(duì)性的考慮了相關(guān)細(xì)節(jié)。 論文總體結(jié)構(gòu)圖如圖11所示。 面盞 之蠢鄉(xiāng) 廠磊函磊 L _廠】圃 蘧i霉 b稃蕊手 國(guó)卜1 總體框架 Fl n g卜l MaiFramework 西南科技大學(xué)碩士研究生學(xué)位論文 第8頁 首先在網(wǎng)絡(luò)前端將音頻資源進(jìn)行分級(jí)管理,主要目的在于:降低資源標(biāo) 引工作量;提高資源利用率。本文的主旨是用語義信息管理音頻資源。那么 語義標(biāo)引是最基礎(chǔ)也是最重要的環(huán)節(jié)。音頻資源浩海如煙,若是將所有文件

37、 都進(jìn)行標(biāo)引,那么工作量將非常大。同時(shí)考慮這些資源的利用率問題,不同 的資源在網(wǎng)絡(luò)中的行為互不相同有的熱度高,有的熱度低,有的熱度甚至 為0,即它們從未被訪問過。且考慮到終端用戶的興趣行為,他們對(duì)眾多音 頻資源的興趣程度也是不一樣的,是具有選擇性的。也就是說,不是所有的 資源都能被利用或是被高效利用,那么,若是他們以平等的概率傳送至大眾, 無疑,總的利用率是很低的。因此我們僅需對(duì)海量資源中價(jià)值大、熱度高的 音頻進(jìn)行標(biāo)引,以各進(jìn)一步的管理應(yīng)用,不僅提高了資源利用率,同時(shí)減少 了標(biāo)引工作量。所以,我們首先在網(wǎng)絡(luò)前端采用分級(jí)存儲(chǔ)的思想將資源進(jìn)行 整合,根據(jù)資源的重要性、訪問頻率、保留時(shí)間、容量等指標(biāo)

38、將數(shù)據(jù)分為 高價(jià)值和低價(jià)值兩個(gè)等級(jí),進(jìn)而進(jìn)行分級(jí)存儲(chǔ)管理,并把高價(jià)值數(shù)據(jù)作為優(yōu) 先發(fā)送的數(shù)據(jù),然后提取出這些音頻資源的語義信息,將它們按用途分類, 并嵌入至原始載體中,形成含水印的音頻信息。然后把它1f推送至廣播信道 進(jìn)行傳輸。在接收端,從接收到的音頻資源中提取出語義信息,并進(jìn)行相關(guān) 的計(jì)算應(yīng)用到相關(guān)的領(lǐng)域。 根據(jù)研究?jī)?nèi)容論文一共分為四章,具體安排如下: 第一章主要分析了論文研究背景和意義,概述了分級(jí)存儲(chǔ)管理和數(shù)字音 頻水印的研究現(xiàn)狀。緒論中還介紹了課題的來源,最后對(duì)論文總體框架作了 簡(jiǎn)要的描述,并總結(jié)了論文的主要內(nèi)容。 第二章對(duì)文中涉及的兩大關(guān)鍵技術(shù)即分級(jí)存儲(chǔ)管理技術(shù)和音頻數(shù)字水印 技術(shù)作了詳細(xì)的全面的介紹。首先介紹了分級(jí)存儲(chǔ)理論的概念、基本模型及 優(yōu)缺點(diǎn),并根據(jù)論文的需要,闡述了分級(jí)存儲(chǔ)理論與論文研究?jī)?nèi)容的契合點(diǎn)。 然后分析了數(shù)字水印的模型、性能、常見的數(shù)字水印算法、常見攻擊方法和 評(píng)價(jià)標(biāo)準(zhǔn),以及它在文中的作用。 第三章提出了基于數(shù)據(jù)價(jià)值的分級(jí)存儲(chǔ)管理算法。首先介紹了算法的設(shè) 計(jì)思路以及總體模型。然后對(duì)算法中涉及的參數(shù)作了詳細(xì)的討論。最后通過 實(shí)驗(yàn)仿真討論了參數(shù)的取值問題,井進(jìn)一步與傳統(tǒng)算法作對(duì)比實(shí)驗(yàn),驗(yàn)證本 章算法的性能。 第四章提出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論