多媒體技術(shù)期末復(fù)習(xí)提要

上傳人：7*** IP屬地：湖北上傳時間：2022-04-19 格式：DOC 頁數(shù)：37 大小：107.50KB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩32頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、多媒體技術(shù)期末復(fù)習(xí)提要第一章多媒體技術(shù)概論復(fù)習(xí)內(nèi)容：1、多媒體、多媒體技術(shù)、多媒體系統(tǒng)媒體在計算機領(lǐng)域通常有兩種含義：一是指存儲信息的實體，如磁盤、光盤、磁帶、半導(dǎo)體存儲器等；二是指傳遞信息的載體，如數(shù)字、文字、聲音、圖形和圖像等。可見多媒體技術(shù)中的媒體是指后者。國際電話電報咨詢委員會CCITT（Consultative Committee on International Telephone and Telegraph，國際電信聯(lián)盟ITU的一個分會）把媒體分成5類： (1)感覺媒體（Perception Medium）：指直接作用于人的感覺器官，使人產(chǎn)生直接感覺的媒體。如引起聽覺反應(yīng)的聲音

2、，引起視覺反應(yīng)的圖像等。 (2)表示媒體（representation Medium）：指傳輸感覺媒體的中介媒體，即用于數(shù)據(jù)交換的編碼。如圖像編碼（JPEG、MPEG等）、文本編碼（ASCII碼、GB2312等）和聲音編碼等。 (3)表現(xiàn)媒體（Presentation Medium）：指進行信息輸入和輸出的媒體。如鍵盤、鼠標(biāo)、掃描儀、話筒、攝像機等為輸入媒體；顯示器、打印機、喇叭等為輸出媒體。 (4)存儲媒體（Storage Medium）：指用于存儲表示媒體的物理介質(zhì)。如硬盤、軟盤、磁盤、光盤、ROM及RAM等。 (5)傳輸媒體（Transmission Medium）：指傳輸表示媒體的物理

3、介質(zhì)。如電纜、光纜等。文本、聲音、圖形、圖像和動畫等是信息的載體，其中兩個或多于兩個的組合構(gòu)成了多媒體。多媒體的英文單詞是Multimedia，它由media和multi兩部分組成。一般理解為多種媒體的綜合。ITU對多媒體含義的描述是：使用計算機交互式綜合技術(shù)和數(shù)字通信網(wǎng)技術(shù)處理多種表示媒體-文本、圖形、圖像和聲音，使多種信息建立邏輯連接，集成為一個交互系統(tǒng)。多媒體系統(tǒng)是指利用計算機技術(shù)和數(shù)字通訊網(wǎng)技術(shù)來處理和控制多媒體信息的系統(tǒng)，如：CAI課件、視頻/音頻演示系統(tǒng)等。2、促進多媒體技術(shù)發(fā)展的關(guān)鍵技術(shù)（1）多媒體存儲與管理技術(shù)（2）多媒體的標(biāo)準(zhǔn)化技術(shù) （3）多媒體數(shù)據(jù)庫（4）數(shù)據(jù)壓

4、縮與編碼（5）多媒體通信（6）多媒體系統(tǒng)集成技術(shù)3、多媒體技術(shù)的特性主要有：集成性、實時性、交互性、高質(zhì)量4、多媒體系統(tǒng)的組成多媒體系統(tǒng)的基本構(gòu)成主要有：計算機硬件、多媒體計算機所配置的硬件（如壓縮、解壓縮專用芯片）、多媒體I/O控制及接口、多媒體的核心系統(tǒng)、多媒體創(chuàng)作系統(tǒng)和多媒體應(yīng)用系統(tǒng)。5、多媒體的技術(shù)研究與應(yīng)用開發(fā) 多媒體涉及的技術(shù)范圍很廣，技術(shù)很新、研究內(nèi)容很深，是多種學(xué)科和多種技術(shù)交叉的領(lǐng)域。目前，多媒體技術(shù)的研究和應(yīng)用開發(fā)主要在下列幾個方面：(1) 多媒體數(shù)據(jù)的表示技術(shù)(2) 多媒體創(chuàng)作和編輯工具(3) 多媒體數(shù)據(jù)的存儲技術(shù)(4) 多媒體的應(yīng)用開發(fā)第二章音頻信號及其處

5、理1、聲音信號的物理特征聲音信號主要的物理特征有：頻率、振幅、響度、音調(diào)、音色、和諧、不和諧等。頻率：信號的頻率是指信號每秒種變化的次數(shù)，波形中兩個連續(xù)波峰（或波谷）之間的距離稱為周期T，一秒鐘內(nèi)所出現(xiàn)的周期數(shù)目即為頻率，頻率的單位為赫茲（Hz）。頻率能反映出聲音的聲調(diào)，我們所聽到的聲音如果細尖表示頻率高，聲音粗低表示頻率低。聲音按照頻率分為三種類型：次聲、可聽聲、超聲。低于20Hz的聲音為次聲，或稱為亞音信號(subsonic)；可聽聲的聲音頻率范圍為2020000 Hz；高于20000 Hz的聲音為超聲，或稱超聲波(ultrasonic)信號。多媒體計算機中處理的聲音主要指可聽聲。一般

6、情況下人說話的話音信號的頻率范圍在3003000 Hz，稱為話音(speech)信號，在這種頻率范圍里感知的聲音幅度大約在0120 dB之間。振幅：聲音信號的另一個基本參數(shù)是振幅，它表示聲音信號的強弱。聲音信號的強度相差很大，從可以聽見的最弱聲到最強聲，其強度相差1萬億倍。聲音的強弱采用分貝作為量綱，區(qū)別兩個強度I和I0的分貝數(shù)（dB）是：聲音分貝數(shù) = 10*log(I/ I0 )在心理上，聲音有兩個最重要的量綱，即響度和音調(diào)，其他還有音色、和諧、不和諧等。由聲音的物理特性得知，聲音的振幅增加，聲音的響度也增加；頻率增高，音調(diào)則增高。幅度與響度之間的關(guān)系是非線性的，幅度加倍不等于響度加倍；頻

7、率與響度、音調(diào)之間也有關(guān)系，頻率的變化既影響響度也影響音調(diào)；它們的關(guān)系起決于它們出現(xiàn)的情景，即使是最簡單的物理量綱也要受神經(jīng)系統(tǒng)的綜合分析。例如，一個樂隊創(chuàng)造出豐富多彩的聽覺感受，一個精彩的報告給人們留下深刻的印象，而一些機器轟鳴聲和飛機的噪音使人煩躁不安。這些平時聽到的聲音感覺好壞不時響度和音調(diào)參數(shù)所能表達的，而是聲音心理學(xué)研究的問題。聲音的響度起決于幅度和頻率兩個因素，如果頻率不變，幅度高比幅度低的聲音信號要響些，如果幅度不變，甚高頻和甚低頻的聲音似乎比中頻聲音要柔弱的多。音頻的定義以及分類，聲音的三要素：l 音頻的頻率范圍在20Hz到20kHz之間。l 音頻這種聽覺媒體主要分為波形聲音、

8、語音和音樂。l 聲音的三要素指音調(diào)、音強和音色。2、模擬信號和數(shù)字信號我們把在時間和幅度上都是連續(xù)的信號稱為模擬信號。在某些特定的時刻對這種模擬信號進行測量叫做采樣(sampling)，由這些特定時刻采樣得到的信號稱為離散時間信號。采樣得到的幅值是無窮多個實數(shù)值中的一個，因此幅度還是連續(xù)的。如果把信號幅度取值的數(shù)目加以限定，這種由有限個數(shù)值組成的信號就稱為離散幅度信號。我們把時間和幅度都用離散的數(shù)字表示的信號就稱為數(shù)字信號。音頻信號的數(shù)字化處理過程：（1）選擇采樣頻率，進行采樣；（2）選擇分辨率，進行量化；（3）形成聲音文件。數(shù)字化實際上就是采樣和量化。如前所述，連續(xù)時間的離散化通過采樣來實現(xiàn)

9、，就是每隔相等的一小段時間采樣一次，這種采樣稱為均勻采樣(uniform sampling)；連續(xù)幅度的離散化通過量化(quantization)來實現(xiàn)，就是把信號的強度劃分成一小段一小段，如果幅度的劃分是等間隔的，就稱為線性量化，否則就稱為非線性量化。3、采樣定理采樣頻率的高低是根據(jù)奈奎斯特理論(Nyquist theory)和聲音信號本身的最高頻率決定的。奈奎斯特理論指出，采樣頻率不應(yīng)低于聲音信號最高頻率的兩倍，這樣就能把以數(shù)字表達的聲音還原成原來的聲音，這叫做無損數(shù)字化(lossless digitization)。采樣定律用公式表示為fs >= 2f 或者 Ts <= T/

10、2其中f為被采樣信號的最高頻率。如果不遵循采樣定理，則必然造成誤差，通常稱為混疊效應(yīng)。為了更好地防止混疊效應(yīng)，一是對信號進行濾波，濾除高頻成分，使信號的最高頻率限制在fmax之內(nèi)。其二是嚴(yán)格依據(jù)定理，以22fmax的頻率進行采樣。4采樣精度、采樣位數(shù)、聲道數(shù)采樣數(shù)據(jù)位數(shù)（Sampling Data）也稱量化精度，是指每個采樣點在A/D轉(zhuǎn)換后所表示的數(shù)據(jù)范圍。常用的采樣數(shù)據(jù)位數(shù)有：8bit，14bit，16bit。樣本大小是用每個聲音樣本的位數(shù)bit/s(即bps)表示的，它反映度量聲音波形幅度的精度。樣本位數(shù)的大小影響到聲音的質(zhì)量，位數(shù)越多，聲音的質(zhì)量越高，而需要的存儲空間也越多；位數(shù)越少，聲

11、音的質(zhì)量越低，需要的存儲空間越少。一個聲音文件的數(shù)據(jù)量可由下列公式推導(dǎo)出來：（采樣頻率*采樣數(shù)據(jù)位數(shù)*聲道數(shù)）/8 = 字節(jié)數(shù)/秒（B/s）如果對每個取樣的幅度值用R位二進制編碼（R比特）表示，就得到數(shù)字信號的傳輸速率或比特率I，I=fs*R(bit/s 或 b/s)當(dāng)信號帶寬給定從而fs已知且不變時，傳輸速率就簡單地由采樣位數(shù)R來確定。在有關(guān)編碼的文獻及書本中，比特率（或數(shù)碼率、碼率、速率、數(shù)據(jù)率）用來表示I和R，具體指哪一個從其量綱即可以確定，不會混淆。一般傳輸時多用I，存儲時多用R。5常見的音頻信號常見的音頻信號主要有：電話音頻信號、調(diào)頻調(diào)幅無線電廣播音頻信號和高保真的立體聲音頻信號。

12、由于其用途不同，這些音頻信號的帶寬也各不相同，而且在音響設(shè)備中，通常以帶寬來衡量聲音的質(zhì)量。圖2-05表示了這4種常見音頻信號的帶寬。數(shù)字激光唱盤（CD）FM無線電廣播AM無線電廣播電話10 20 50 200 3400 7k15k 20k圖2-05音頻信號的帶寬6質(zhì)量的評價聲音質(zhì)量的評價是一個很困難的問題，目前還在繼續(xù)研究的課題。前面介紹了用聲音信號的帶寬來衡量聲音的質(zhì)量，等級由高到低依次是DAT，CD，F(xiàn)M，AM和數(shù)字電話。此外，聲音質(zhì)量的度量還有兩種基本的方法：一種是客觀質(zhì)量度量，另一種是主觀質(zhì)量度量。評價語音質(zhì)量時，有時同時采取兩種方法評估，有時以主觀質(zhì)量度量為主。聲音客觀質(zhì)量的度量

13、主要用信噪比(signal to niose ratio，SNR)，峰值信噪比（PSNR）等。7音頻信號的標(biāo)準(zhǔn)和規(guī)范表2-04數(shù)字電話的編碼標(biāo)準(zhǔn)組織ISOCCITTGSMCTIANSA標(biāo) 準(zhǔn)G.711G.721G.728GSMGIA制定時間19921972198419921983198919891982傳輸率Kb/s1286432161384.82.4編碼算法PCMADPCMLD-CELPRPE-LTVSELPCELPLPC質(zhì) 量5.04.34.14.03.73.83.22.5使用場合CD長途電話網(wǎng)絡(luò)移動通信保密電話CCITT：國際電報電話咨詢委員會，GSM：歐洲移動通信專家組，CTIA：美

14、國移動通信標(biāo)準(zhǔn)，NSA：美國國家安全局。8、音頻文件大小的計算文件的字節(jié)數(shù)/每秒=采樣頻率（Hz）´采樣位數(shù)（位）´聲道數(shù)/89、常見的聲音文件格式，如：.WAV、.VOC、.MIDI文件10、 MIDI的含義、MIDI與數(shù)字化聲音的比較MIDI是樂器數(shù)字接口的英文縮寫，泛指數(shù)字音樂的國際標(biāo)準(zhǔn)，它是音樂與計算機結(jié)合的產(chǎn)物。MIDI信息實際上是樂譜的數(shù)字描述，這里樂譜完全由音符序列、定時以及被稱為合成音色的樂器定義組成。當(dāng)一組MIDI消息通過音樂合成器芯片演奏時，合成器就會解釋這些符號并產(chǎn)生音樂。選擇MIDI還是數(shù)字化聲音，要考慮計算機處理數(shù)字文件的能力，對回放硬件的控制能

15、力以及是否有語言對話的需要等方面因素。產(chǎn)生MIDI樂音的方法很多，現(xiàn)在用得較多的方法有兩種：一種是(frequency modulation，F(xiàn)M)合成法，另一種是樂音樣本合成法，也稱為波形表(Wavetable)合成法。11、波形聲音與MIDI音樂的比較MIDI消息實際上就是樂譜的數(shù)字表示。與波形聲音相比，MIDI數(shù)據(jù)不是聲音而是指令，因此它的數(shù)據(jù)量要比波形聲音少得多。如30分鐘的立體聲高品質(zhì)音樂，用波形文件無壓縮錄制，約需300MB的存儲空間；而同樣的MIDI數(shù)據(jù)，則只需200KB，兩者相差1500倍之多。另外，對MIDI的編輯很靈活，可以自由地改變曲調(diào)、音色等屬性，波形聲音就很難做到這一

16、點。波形聲音與設(shè)備無關(guān)，MIDI數(shù)據(jù)是與設(shè)備有關(guān)的，即MIDI音樂文件所產(chǎn)生的聲音與用來回放的特定的MIDI設(shè)備有關(guān)?？偟膩碚f，數(shù)字化聲音最重要的優(yōu)點是重放質(zhì)量的一致性、可靠性比較好，可自始至終保證質(zhì)量，而MIDI在這一點上則比較差。12、數(shù)據(jù)壓縮基礎(chǔ)信源信宿信源編碼信源解碼信道編碼信道解碼調(diào) 制傳輸通道解調(diào)信源編碼信道解碼信道噪聲圖2-2-1統(tǒng)一的數(shù)字傳輸系統(tǒng)模型圖中信源編碼和信源解碼即為本課程所要研究的內(nèi)容，統(tǒng)稱為信源解碼；而信道編碼和信道解碼統(tǒng)稱為信道編碼。信源解碼：主要解決有效性問題。通過對信源的壓縮、擾亂、加密等一系列處理，力求用最少的數(shù)碼傳遞最大的信息量，使信號更適

17、宜傳輸。信道編碼：主要解決可靠性問題。即盡量使處理過的信號在傳輸過程中不出錯或少出錯，即使出了錯也要能自動檢錯和盡量糾錯。如果信道編碼的糾錯能力足以保證對數(shù)字序列的無誤差解碼，則圖2-2-1中的信道編碼、解碼器（簡寫為Codec，即Coder+Decoder），調(diào)制、解調(diào)器（簡寫為Modem，即Modulator + Demodulator），以及實際的物理傳輸通道（模擬信道），有時集中成一個理想的方框，叫作無噪聲數(shù)字信道，如圖2-2-1中的虛線右邊部分。而模擬信道加上Modem構(gòu)成的方框，即為一個實際的數(shù)字信道。因此，從信息論角度看，信源編碼編碼的一個最主要的目的，就是要解決數(shù)據(jù)的壓縮問題，

18、它構(gòu)成了數(shù)據(jù)壓縮的理論基礎(chǔ)。13、數(shù)據(jù)壓縮及其必要性數(shù)據(jù)壓縮，就是以最少的數(shù)碼表示信源所發(fā)的信號，減少容納給定消息集合或數(shù)據(jù)采樣集合的信號空間。所謂信號空間即被壓縮的對象是指：1、物理空間，如硬盤、磁盤、磁帶等數(shù)據(jù)存儲介質(zhì)；2、時間空間，如傳輸給定消息集合所需要的時間；3、電磁頻譜區(qū)域，如為傳輸給定消息集合所要求的帶寬等。而數(shù)據(jù)壓縮的好處就在于：1、較快地傳輸各種信源（降低信道占有費用）-時間域的壓縮；2、在現(xiàn)有通信干線上開通更多的并行業(yè)務(wù)（如電視、傳真、可視電話等）-頻率域的壓縮；3、降低發(fā)射機功率-能量域的壓縮；4、緊縮數(shù)據(jù)存儲量（降低存儲費用）-空間域的壓縮。14、數(shù)據(jù)壓縮

19、技術(shù)的分類比較一致的分類方法，是將數(shù)據(jù)壓縮分為在某種程度上可逆的與實際上不可逆的兩類，這樣更能說明它們的本質(zhì)區(qū)別。1、可逆壓縮也叫作無失真編碼、無噪聲編碼（Noiseless Coding）、冗余度壓減（Redundancy reduction）、熵編碼（Entropy Coding）、數(shù)據(jù)緊縮（Data compaction）、信息保持編碼（Lossless，bit-preserving）,等等。2、不可逆壓縮又稱有失真（Lossy）編碼，信息論中叫熵壓縮（Entropy Compression）.15、實用的數(shù)據(jù)壓縮數(shù)據(jù)壓縮冗余度壓縮熵壓縮統(tǒng)計編碼霍夫曼編碼游程編碼二進制編碼LZW編

20、碼其它量化特征提取零記憶量化均勻量化馬克斯量化壓擴量化序列量化預(yù)測編碼分組量化直接映射變換編碼分析-合成增量調(diào)制線性預(yù)測非線性預(yù)測自適應(yīng)預(yù)測運動補償預(yù)測矢量量化神經(jīng)網(wǎng)絡(luò)方塊截尾KLTDCTDFTHAAR非正交編碼第三章語音編碼技術(shù)1、數(shù)據(jù)壓縮技術(shù)的三個重要指標(biāo) 這三個指標(biāo)是：壓縮前后所需的信息存儲量之比；壓縮算法；恢復(fù)效果。2、音頻信號的編碼方式大致分為三大類：（1）波形編碼，如PCM、APC、SDC、ATC（2）音源編譯碼器（分析合成方法），如LPC（3）混合編碼方法2、話音信號壓縮的主要依據(jù)音頻冗余主要表現(xiàn)為時域冗余度、頻域冗余度。一、時域信息冗余度l 幅度非均勻分布l 樣

21、本間的相關(guān)性l 周期之間的相關(guān)性l 基音之間的相關(guān)性l 靜止系數(shù)（話音間隙）l 長時自相關(guān)函數(shù) 二、頻域信息冗余度l 非均勻的長時功率譜密度l 語音特有的短時功率譜密度三、人的聽覺感知機理l 人的聽覺具有掩蓋效應(yīng)l 人耳對不同頻率聲音的敏感程度不同，對低頻率比較敏感l(wèi) 人耳對對語音信號的相位變化不敏感4、常見的語音編碼技術(shù)有：常見的音頻數(shù)據(jù)壓縮方法無損壓縮有損壓縮哈夫曼編碼算術(shù)編碼行程編碼波形編碼音源編碼混合編碼PCMDM、ADMDPCM、ADPCM子帶編碼失量編碼LPCMPE、RPE、CELP、MP-LPC5、 PCM由采樣和量化兩部分組成，量化有好幾種方法，但可歸納成兩類：一類

22、稱為均勻量化，另一類稱為非均勻量化（律壓擴(companding)算法，另一種稱為A律壓擴算法。）。采用的量化方法不同，量化后的數(shù)據(jù)量也就不同。因此，可以說量化也是一種壓縮數(shù)據(jù)的方法。、DM、ADM、DPCM、ADPCM6、 DM增量調(diào)制也稱調(diào)制(delta modulation，DM)，它是一種預(yù)測編碼技術(shù)，是PCM編碼的一種變形。PCM是對每個采樣信號的整個幅度進行量化編碼，因此它具有對任意波形進行編碼的能力；DM是對實際的采樣信號與預(yù)測的采樣信號之差的極性進行編碼，將極性變成“0”和“1”這兩種可能的取值之一。由于DM編碼只須用1位對話音信號進行編碼，所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。

23、 DM存在“斜率過載”(slope overload)和粒狀噪聲(granular noise)。7、自適應(yīng)增量調(diào)制(ADM) 為了對DM中出現(xiàn)的“斜率過載”和“粒狀噪聲”問題進行改進，從而提出了自適應(yīng)增量調(diào)制(ADM) 。使增量調(diào)制器的量化階能自適應(yīng)，也就是根據(jù)輸入信號斜率的變化自動調(diào)整量化階的大小，在檢測到斜率過載時開始增大量化階，而在輸入信號的斜率減小時降低量化階。8、自適應(yīng)脈沖編碼調(diào)制(adaptive pulse code modulation，APCM)是根據(jù)輸入信號幅度大小來改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時自適應(yīng)，即量化階的大小每隔幾個樣本就改變，也可以是音

24、節(jié)自適應(yīng)，即量化階的大小在較長時間周期里發(fā)生變化。改變量化階大小的方法有兩種：一種稱為前向自適應(yīng)(forward adaptation)，另一種稱為后向自適應(yīng)(backward adaptation)。9、差分脈沖編碼調(diào)制DPCM(differential pulse code modulation)是利用樣本與樣本之間存在的信息冗余度來進行編碼的一種數(shù)據(jù)壓縮技術(shù)。差分脈沖編碼調(diào)制的思想是，根據(jù)過去的樣本去估算(estimate)下一個樣本信號的幅度大小，這個值稱為預(yù)測值，然后對實際信號值與預(yù)測值之差進行量化編碼，從而就減少了表示每個樣本信號的位數(shù)。它與脈沖編碼調(diào)制(PCM)不同的是，PCM是

25、直接對采樣信號進行量化編碼，而DPCM是對實際信號值與預(yù)測值之差進行量化編碼，存儲或者傳送的是差值而不是幅度絕對值，這就降低了傳送或存儲的數(shù)據(jù)量。此外，它還能適應(yīng)大范圍變化的輸入信號。10、ADPCM是利用樣本與樣本之間的高度相關(guān)性和量化階自適應(yīng)來壓縮數(shù)據(jù)的一種波形編碼技術(shù)，CCITT為此制定了G.721推薦標(biāo)準(zhǔn)，這個標(biāo)準(zhǔn)叫做32 kb/s自適應(yīng)差分脈沖編碼調(diào)制32 kb/s Adaptive Differential Pulse Code Modulation7。CCITT推薦的G.721 ADPCM標(biāo)準(zhǔn)是一個代碼轉(zhuǎn)換系統(tǒng)。它使用ADPCM轉(zhuǎn)換技術(shù)，實現(xiàn)64 kb/s A律或律PCM速率和3

26、2 kb/s速率之間的相互轉(zhuǎn)換。11、重點了解DPCM系統(tǒng)原理圖中各個信號的含義，及主要處理的過程描述。第四章視頻信號處理1、圖像的屬性主要包括：分辨率、像素深度、圖像深度、真/偽彩色、圖像的表示法和種類等。其中分辨率又包括：顯示分辨率和圖像分辨率。2、位圖圖像、矢量圖形的概念；矢量圖與位圖比較位圖圖像（Bit-Map Image）是指在空間和亮度上已經(jīng)離散化的圖像。通常把一幅位圖圖像考慮為一個矩陣，矩陣中的一個元素（像素）對應(yīng)圖像的一個點，相應(yīng)的值表示該點的灰度或顏色等級。矢量圖形（Vector-Based Image）是用一個指令集合來描述的。這些指令用來描述圖中線條的形

27、狀、位置、顏色等各種屬性和參數(shù)。矢量圖與位圖比較，主要看空間和性能兩方面，一般說來，要看圖像的復(fù)雜程度，簡單的圖使用矢量圖描述好一些，復(fù)雜的圖使用位圖好一些。3、計算機中常用的顏色模型主要有紅綠藍（RGB）和色調(diào)-飽和度-亮度(hue-saturation-lightness，HSL)顏色模型。在HSL模型中，H定義顏色的波長，稱為色調(diào)；S定義顏色的強度(intensity)，表示顏色的深淺程度，稱為飽和度；L定義摻入的白光量，稱為亮度。4、稱為CMY模型由青色(Cyan)、品紅(Magenta)和黃色(Yellow)三基色組成，通常寫成CMY。用這種方法產(chǎn)生的顏色之所以稱為相減色。5、

28、目前采用的彩色空間變換有三種：YIQ, YUV和YCrCb。每一種彩色空間都產(chǎn)生一種亮度分量信號和兩種色度分量信號，而每一種變換使用的參數(shù)都是為了適應(yīng)某種類型的顯示設(shè)備。其中，YIQ適用于NTSC彩色電視制式，YUV適用于PAL和SECAM彩色電視制式，而YCrCb適用于計算機用的顯示器。6、 YUV表示法的重要性是它的亮度信號(Y)和色度信號(U、V)是相互獨立的，也就是Y信號分量構(gòu)成的黑白灰度圖與用U、V信號構(gòu)成的另外兩幅單色圖是相互獨立的。由于Y、U、V是獨立的，所以可以對這些單色圖分別進行編碼。此外，黑白電視能接收彩色電視信號也就是利用了YUV分量之間的獨立性。YUV表示法的另一個優(yōu)點

29、是可以利用人眼的特性來降低數(shù)字彩色圖像所需要的存儲容量。7、目前世界上現(xiàn)行的彩色電視制式有三種：NTSC制、PAL制和SECAM制。這里不包括高清晰度彩色電視HDTV (High-Definition television)。8、在彩色電視中，用Y、C1, C2彩色表示法分別表示亮度信號和兩個色差信號，C1，C2的含義與具體的應(yīng)用有關(guān)。在NTSC彩色電視制中，C1，C2分別表示I、Q兩個色差信號；在PAL彩色電視制中，C1，C2分別表示U、V兩個色差信號；在CCIR 601數(shù)字電視標(biāo)準(zhǔn)中，C1，C2分別表示Cr，Cb兩個色差信號。所謂色差是指基色信號中的三個分量信號(即R、G、B)與亮度信

30、號之差。在彩色電視中，使用Y、C1，C2有兩個重要優(yōu)點：Y和C1，C2是獨立的，因此彩色電視和黑白電視可以同時使用，Y分量可由黑白電視接收機直接使用而不需做任何進一步的處理；可以利用人的視覺特性來節(jié)省信號的帶寬和功率，通過選擇合適的顏色模型，可以使C1，C2的帶寬明顯低于Y的帶寬，而又不明顯影響重顯彩色圖像的觀看。因此，為了滿足兼容性的要求，彩色電視系統(tǒng)選擇了一個亮度信號和兩個色差信號，而不直接選擇三個基色信號進行發(fā)送和接收。9、彩色電視信號的類型主要有：復(fù)合電視信號、分量電視信號、S-Video信號。10、對色差信號使用的采樣頻率比對亮度信號使用的采樣頻率低，這種采樣就稱為圖像子采樣(su

31、bsampling)。這種壓縮方法的基本根據(jù)是人的視覺系統(tǒng)所具有的兩條特性，一、是人眼對色度信號的敏感程度比對亮度信號的敏感程度低，利用這個特性可以把圖像中表達顏色的信號去掉一些而使人不察覺；二、是人眼對圖像細節(jié)的分辨能力有一定的限度，利用這個特性可以把圖像中的高頻信號去掉而使人不易察覺。10、了解行程編碼的主要概念，熟悉掌握LZW編碼的編、譯碼過程。11、變化編碼的基本概念：變換編碼就是對圖象進行某種正交變換,并對變換后的數(shù)據(jù)進行編碼,從而達到壓縮數(shù)據(jù)的目的. 常見的正交變換有:傅立葉變換、哈爾變換、斜變換、正弦變換、余弦變換、K-L變換、小波變換等。從理論上講， K-L變換效果最佳

32、，但由于其只有求出輸入數(shù)據(jù)的相關(guān)矩陣和本征矢量，才能進行K-L變換，且沒有快速算法，實現(xiàn)復(fù)雜，因此，很少使用。正交變換的具有如下特性：Ø 熵保持Ø 能量保持Ø 去相關(guān)Ø 能量重新分布與集中11、詳細了解JPEG編碼和譯碼的主要步驟、及各個步驟的作用和理論依據(jù)。12、 DC和AC系數(shù)各有何特點，分別采用什么方法對它們進行數(shù)據(jù)壓縮。13、按照J(rèn)PEG中的要求，對DC和AC系數(shù)進行實際的編碼。14、掌握Huffman編碼過程。Huffman編碼體現(xiàn)了統(tǒng)計編碼的思想。它對于出現(xiàn)頻率大的符號用較少的位數(shù)來表示，而對于出現(xiàn)頻率小的符號用較多的位數(shù)來表示。其編

33、碼效率主要取決于需編碼的符號出現(xiàn)的概率分布，越集中則壓縮比越高。第五章動態(tài)圖像的處理1、動態(tài)圖像的特點：（1）數(shù)據(jù)量大（2）幀與幀之間存在大量的時間冗余信息（3）幀內(nèi)存在大量的空間冗余信息2、動態(tài)圖像的數(shù)據(jù)壓縮技術(shù)（1）幀內(nèi)有變換編碼、預(yù)測編碼、熵編碼等（2）幀間主要采用：幀間預(yù)測編碼和運動補償3、幀間差值的統(tǒng)計特性表明：一般動態(tài)圖像的幀間差值比較小，這種統(tǒng)計特性是幀間壓縮編碼的基本依據(jù)4、運動補償預(yù)測（Motion Compensation，簡寫)技術(shù)通常由以下幾個方面組成：l 首先把圖像分割為靜止的和運動的兩個部分，假設(shè)運動物體僅作平移。n 估計物體的位移值。n 用位移估值（即運動矢量motion vector)進行運動補償預(yù)測n 預(yù)測信息編碼。5、熟悉運動補償預(yù)測技術(shù)的基本原理，能解釋其運動補償預(yù)測編碼的系統(tǒng)框圖。量化器運動補

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多媒體技術(shù)期末復(fù)習(xí)提要

文檔簡介

溫馨提示

最新文檔

評論

多媒體技術(shù)期末復(fù)習(xí)提要

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔