多媒體技術(shù)期末復(fù)習(xí)提要_第1頁
多媒體技術(shù)期末復(fù)習(xí)提要_第2頁
多媒體技術(shù)期末復(fù)習(xí)提要_第3頁
多媒體技術(shù)期末復(fù)習(xí)提要_第4頁
多媒體技術(shù)期末復(fù)習(xí)提要_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、多媒體技術(shù)期末復(fù)習(xí)提要第一章多媒體技術(shù)概論復(fù)習(xí)內(nèi)容:1、 多媒體、多媒體技術(shù)、多媒體系統(tǒng)媒體在計算機領(lǐng)域通常有兩種含義:一是指存儲信息的實體,如磁盤、光盤、磁帶、半導(dǎo)體存儲器等;二是指傳遞信息的載體,如數(shù)字、文字、聲音、圖形和圖像等。可見多媒體技術(shù)中的媒體是指后者。國際電話電報咨詢委員會CCITT(Consultative Committee on International Telephone and Telegraph,國際電信聯(lián)盟ITU的一個分會)把媒體分成5類: (1)感覺媒體(Perception Medium):指直接作用于人的感覺器官,使人產(chǎn)生直接感覺的媒體。如引起聽覺反應(yīng)的聲音

2、,引起視覺反應(yīng)的圖像等。 (2)表示媒體(representation Medium):指傳輸感覺媒體的中介媒體,即用于數(shù)據(jù)交換的編碼。如圖像編碼(JPEG、MPEG等)、文本編碼(ASCII碼、GB2312等)和聲音編碼等。 (3)表現(xiàn)媒體(Presentation Medium):指進行信息輸入和輸出的媒體。如鍵盤、鼠標(biāo)、掃描儀、話筒、攝像機等為輸入媒體;顯示器、打印機、喇叭等為輸出媒體。 (4)存儲媒體(Storage Medium):指用于存儲表示媒體的物理介質(zhì)。如硬盤、軟盤、磁盤、光盤、ROM及RAM等。 (5)傳輸媒體(Transmission Medium):指傳輸表示媒體的物理

3、介質(zhì)。如電纜、光纜等。文本、聲音、圖形、圖像和動畫等是信息的載體,其中兩個或多于兩個的組合構(gòu)成了多媒體。多媒體的英文單詞是Multimedia,它由media和multi兩部分組成。一般理解為多種媒體的綜合。ITU對多媒體含義的描述是: 使用計算機交互式綜合技術(shù)和數(shù)字通信網(wǎng)技術(shù)處理多種表示媒體-文本、圖形、圖像和聲音,使多種信息建立邏輯連接,集成為一個交互系統(tǒng)。多媒體系統(tǒng)是指利用計算機技術(shù)和數(shù)字通訊網(wǎng)技術(shù)來處理和控制多媒體信息的系統(tǒng),如:CAI課件、視頻/音頻演示系統(tǒng)等。2、 促進多媒體技術(shù)發(fā)展的關(guān)鍵技術(shù)(1) 多媒體存儲與管理技術(shù)(2) 多媒體的標(biāo)準(zhǔn)化技術(shù) (3) 多媒體數(shù)據(jù)庫(4) 數(shù)據(jù)壓

4、縮與編碼 (5) 多媒體通信 (6) 多媒體系統(tǒng)集成技術(shù)3、 多媒體技術(shù)的特性主要有:集成性、實時性、交互性、高質(zhì)量4、 多媒體系統(tǒng)的組成多媒體系統(tǒng)的基本構(gòu)成主要有:計算機硬件、多媒體計算機所配置的硬件(如壓縮、解壓縮專用芯片)、多媒體I/O控制及接口、多媒體的核心系統(tǒng)、多媒體創(chuàng)作系統(tǒng)和多媒體應(yīng)用系統(tǒng)。5、多媒體的技術(shù)研究與應(yīng)用開發(fā) 多媒體涉及的技術(shù)范圍很廣,技術(shù)很新、研究內(nèi)容很深,是多種學(xué)科和多種技術(shù)交叉的領(lǐng)域。目前,多媒體技術(shù)的研究和應(yīng)用開發(fā)主要在下列幾個方面:(1) 多媒體數(shù)據(jù)的表示技術(shù)(2) 多媒體創(chuàng)作和編輯工具(3) 多媒體數(shù)據(jù)的存儲技術(shù)(4) 多媒體的應(yīng)用開發(fā)第二章 音頻信號及其處

5、理1、 聲音信號的物理特征 聲音信號主要的物理特征有:頻率、振幅、響度、音調(diào)、音色、和諧、不和諧等。頻率:信號的頻率是指信號每秒種變化的次數(shù),波形中兩個連續(xù)波峰(或波谷)之間的距離稱為周期T,一秒鐘內(nèi)所出現(xiàn)的周期數(shù)目即為頻率,頻率的單位為赫茲(Hz)。頻率能反映出聲音的聲調(diào),我們所聽到的聲音如果細尖表示頻率高,聲音粗低表示頻率低。聲音按照頻率分為三種類型:次聲、可聽聲、超聲。低于20Hz的聲音為次聲,或稱為亞音信號(subsonic);可聽聲的聲音頻率范圍為2020000 Hz;高于20000 Hz的聲音為超聲,或稱超聲波(ultrasonic)信號。多媒體計算機中處理的聲音主要指可聽聲。一般

6、情況下人說話的話音信號的頻率范圍在3003000 Hz,稱為話音(speech)信號,在這種頻率范圍里感知的聲音幅度大約在0120 dB之間。振幅:聲音信號的另一個基本參數(shù)是振幅,它表示聲音信號的強弱。聲音信號的強度相差很大,從可以聽見的最弱聲到最強聲,其強度相差1萬億倍。聲音的強弱采用分貝作為量綱,區(qū)別兩個強度I和I0的分貝數(shù)(dB)是:聲音分貝數(shù) = 10*log(I/ I0 )在心理上,聲音有兩個最重要的量綱,即響度和音調(diào),其他還有音色、和諧、不和諧等。由聲音的物理特性得知,聲音的振幅增加,聲音的響度也增加;頻率增高,音調(diào)則增高。幅度與響度之間的關(guān)系是非線性的,幅度加倍不等于響度加倍;頻

7、率與響度、音調(diào)之間也有關(guān)系,頻率的變化既影響響度也影響音調(diào);它們的關(guān)系起決于它們出現(xiàn)的情景,即使是最簡單的物理量綱也要受神經(jīng)系統(tǒng)的綜合分析。例如,一個樂隊創(chuàng)造出豐富多彩的聽覺感受,一個精彩的報告給人們留下深刻的印象,而一些機器轟鳴聲和飛機的噪音使人煩躁不安。這些平時聽到的聲音感覺好壞不時響度和音調(diào)參數(shù)所能表達的,而是聲音心理學(xué)研究的問題。聲音的響度起決于幅度和頻率兩個因素,如果頻率不變,幅度高比幅度低的聲音信號要響些,如果幅度不變,甚高頻和甚低頻的聲音似乎比中頻聲音要柔弱的多。音頻的定義以及分類,聲音的三要素:l 音頻的頻率范圍在20Hz到20kHz之間。l 音頻這種聽覺媒體主要分為波形聲音、

8、語音和音樂。l 聲音的三要素指音調(diào)、音強和音色。2、模擬信號和數(shù)字信號我們把在時間和幅度上都是連續(xù)的信號稱為模擬信號。在某些特定的時刻對這種模擬信號進行測量叫做采樣(sampling),由這些特定時刻采樣得到的信號稱為離散時間信號。采樣得到的幅值是無窮多個實數(shù)值中的一個,因此幅度還是連續(xù)的。如果把信號幅度取值的數(shù)目加以限定,這種由有限個數(shù)值組成的信號就稱為離散幅度信號。我們把時間和幅度都用離散的數(shù)字表示的信號就稱為數(shù)字信號。音頻信號的數(shù)字化處理過程:(1)選擇采樣頻率,進行采樣;(2)選擇分辨率,進行量化;(3)形成聲音文件。數(shù)字化實際上就是采樣和量化。如前所述,連續(xù)時間的離散化通過采樣來實現(xiàn)

9、,就是每隔相等的一小段時間采樣一次,這種采樣稱為均勻采樣(uniform sampling);連續(xù)幅度的離散化通過量化(quantization)來實現(xiàn),就是把信號的強度劃分成一小段一小段,如果幅度的劃分是等間隔的,就稱為線性量化,否則就稱為非線性量化。3、采樣定理采樣頻率的高低是根據(jù)奈奎斯特理論(Nyquist theory)和聲音信號本身的最高頻率決定的。奈奎斯特理論指出,采樣頻率不應(yīng)低于聲音信號最高頻率的兩倍,這樣就能把以數(shù)字表達的聲音還原成原來的聲音,這叫做無損數(shù)字化(lossless digitization)。采樣定律用公式表示為fs >= 2f 或者 Ts <= T/

10、2其中f為被采樣信號的最高頻率。如果不遵循采樣定理,則必然造成誤差,通常稱為混疊效應(yīng)。為了更好地防止混疊效應(yīng),一是對信號進行濾波,濾除高頻成分,使信號的最高頻率限制在fmax之內(nèi)。其二是嚴(yán)格依據(jù)定理,以22fmax的頻率進行采樣。4采樣精度、采樣位數(shù)、聲道數(shù)采樣數(shù)據(jù)位數(shù)(Sampling Data)也稱量化精度,是指每個采樣點在A/D轉(zhuǎn)換后所表示的數(shù)據(jù)范圍。常用的采樣數(shù)據(jù)位數(shù)有:8bit,14bit,16bit。樣本大小是用每個聲音樣本的位數(shù)bit/s(即bps)表示的,它反映度量聲音波形幅度的精度。樣本位數(shù)的大小影響到聲音的質(zhì)量,位數(shù)越多,聲音的質(zhì)量越高,而需要的存儲空間也越多;位數(shù)越少,聲

11、音的質(zhì)量越低,需要的存儲空間越少。一個聲音文件的數(shù)據(jù)量可由下列公式推導(dǎo)出來: (采樣頻率*采樣數(shù)據(jù)位數(shù)*聲道數(shù))/8 = 字節(jié)數(shù)/秒(B/s)如果對每個取樣的幅度值用R位二進制編碼(R比特)表示,就得到數(shù)字信號的傳輸速率或比特率I,I=fs*R(bit/s 或 b/s)當(dāng)信號帶寬給定從而fs已知且不變時,傳輸速率就簡單地由采樣位數(shù)R來確定。在有關(guān)編碼的文獻及書本中,比特率(或數(shù)碼率、碼率、速率、數(shù)據(jù)率)用來表示I和R,具體指哪一個從其量綱即可以確定,不會混淆。一般傳輸時多用I,存儲時多用R。5常見的音頻信號常見的音頻信號主要有:電話音頻信號、調(diào)頻調(diào)幅無線電廣播音頻信號和高保真的立體聲音頻信號。

12、由于其用途不同,這些音頻信號的帶寬也各不相同,而且在音響設(shè)備中,通常以帶寬來衡量聲音的質(zhì)量。圖2-05表示了這4種常見音頻信號的帶寬。數(shù)字激光唱盤(CD)FM無線電廣播AM無線電廣播電 話10 20 50 200 3400 7k15k 20k圖2-05音頻信號的帶寬6質(zhì)量的評價聲音質(zhì)量的評價是一個很困難的問題,目前還在繼續(xù)研究的課題。前面介紹了用聲音信號的帶寬來衡量聲音的質(zhì)量,等級由高到低依次是DAT,CD,F(xiàn)M,AM和數(shù)字電話。此外,聲音質(zhì)量的度量還有兩種基本的方法:一種是客觀質(zhì)量度量,另一種是主觀質(zhì)量度量。評價語音質(zhì)量時,有時同時采取兩種方法評估,有時以主觀質(zhì)量度量為主。聲音客觀質(zhì)量的度量

13、主要用信噪比(signal to niose ratio,SNR),峰值信噪比(PSNR)等。7音頻信號的標(biāo)準(zhǔn)和規(guī)范表2-04數(shù)字電話的編碼標(biāo)準(zhǔn)組 織ISOCCITTGSMCTIANSA標(biāo) 準(zhǔn)G.711G.721G.728GSMGIA制定時間19921972198419921983198919891982傳輸率Kb/s1286432161384.82.4編碼算法PCMADPCMLD-CELPRPE-LTVSELPCELPLPC質(zhì) 量5.04.34.14.03.73.83.22.5使用場合CD長途電話網(wǎng)絡(luò)移動通信保密電話CCITT:國際電報電話咨詢委員會,GSM:歐洲移動通信專家組,CTIA:美

14、國移動通信標(biāo)準(zhǔn),NSA:美國國家安全局。8、 音頻文件大小的計算文件的字節(jié)數(shù)/每秒=采樣頻率(Hz)´采樣位數(shù)(位)´聲道數(shù)/89、常見的聲音文件格式,如:.WAV、.VOC、.MIDI文件10、 MIDI的含義、MIDI與數(shù)字化聲音的比較MIDI是樂器數(shù)字接口的英文縮寫,泛指數(shù)字音樂的國際標(biāo)準(zhǔn),它是音樂與計算機結(jié)合的產(chǎn)物。MIDI信息實際上是樂譜的數(shù)字描述,這里樂譜完全由音符序列、定時以及被稱為合成音色的樂器定義組成。當(dāng)一組MIDI消息通過音樂合成器芯片演奏時,合成器就會解釋這些符號并產(chǎn)生音樂。選擇MIDI還是數(shù)字化聲音,要考慮計算機處理數(shù)字文件的能力,對回放硬件的控制能

15、力以及是否有語言對話的需要等方面因素。產(chǎn)生MIDI樂音的方法很多,現(xiàn)在用得較多的方法有兩種:一種是(frequency modulation,F(xiàn)M)合成法,另一種是樂音樣本合成法,也稱為波形表(Wavetable)合成法。11、波形聲音與MIDI音樂的比較MIDI消息實際上就是樂譜的數(shù)字表示。與波形聲音相比,MIDI數(shù)據(jù)不是聲音而是指令,因此它的數(shù)據(jù)量要比波形聲音少得多。如30分鐘的立體聲高品質(zhì)音樂,用波形文件無壓縮錄制,約需300MB的存儲空間;而同樣的MIDI數(shù)據(jù),則只需200KB,兩者相差1500倍之多。另外,對MIDI的編輯很靈活,可以自由地改變曲調(diào)、音色等屬性,波形聲音就很難做到這一

16、點。波形聲音與設(shè)備無關(guān),MIDI數(shù)據(jù)是與設(shè)備有關(guān)的,即MIDI音樂文件所產(chǎn)生的聲音與用來回放的特定的MIDI設(shè)備有關(guān)??偟膩碚f,數(shù)字化聲音最重要的優(yōu)點是重放質(zhì)量的一致性、可靠性比較好,可自始至終保證質(zhì)量,而MIDI在這一點上則比較差。12、數(shù)據(jù)壓縮基礎(chǔ)信源信宿信源編碼信源解碼信道編碼信道解碼調(diào) 制傳輸通道解 調(diào)信 源 編 碼信 道 解 碼信道噪 聲圖2-2-1統(tǒng)一的數(shù)字傳輸系統(tǒng)模型圖中信源編碼和信源解碼即為本課程所要研究的內(nèi)容,統(tǒng)稱為信源解碼;而信道編碼和信道解碼統(tǒng)稱為信道編碼。信源解碼:主要解決有效性問題。通過對信源的壓縮、擾亂、加密等一系列處理,力求用最少的數(shù)碼傳遞最大的信息量,使信號更適

17、宜傳輸。信道編碼:主要解決可靠性問題。即盡量使處理過的信號在傳輸過程中不出錯或少出錯,即使出了錯也要能自動檢錯和盡量糾錯。如果信道編碼的糾錯能力足以保證對數(shù)字序列的無誤差解碼,則圖2-2-1中的信道編碼、解碼器(簡寫為Codec,即Coder+Decoder),調(diào)制、解調(diào)器(簡寫為Modem,即Modulator + Demodulator),以及實際的物理傳輸通道(模擬信道),有時集中成一個理想的方框,叫作無噪聲數(shù)字信道,如圖2-2-1中的虛線右邊部分。而模擬信道加上Modem構(gòu)成的方框,即為一個實際的數(shù)字信道。因此,從信息論角度看,信源編碼編碼的一個最主要的目的,就是要解決數(shù)據(jù)的壓縮問題,

18、它構(gòu)成了數(shù)據(jù)壓縮的理論基礎(chǔ)。13、數(shù)據(jù)壓縮及其必要性數(shù)據(jù)壓縮,就是以最少的數(shù)碼表示信源所發(fā)的信號,減少容納給定消息集合或數(shù)據(jù)采樣集合的信號空間。所謂信號空間即被壓縮的對象是指:1、 物理空間,如硬盤、磁盤、磁帶等數(shù)據(jù)存儲介質(zhì);2、 時間空間,如傳輸給定消息集合所需要的時間;3、 電磁頻譜區(qū)域,如為傳輸給定消息集合所要求的帶寬等。而數(shù)據(jù)壓縮的好處就在于:1、 較快地傳輸各種信源(降低信道占有費用)-時間域的壓縮;2、 在現(xiàn)有通信干線上開通更多的并行業(yè)務(wù)(如電視、傳真、可視電話等)-頻率域的壓縮;3、 降低發(fā)射機功率-能量域的壓縮;4、 緊縮數(shù)據(jù)存儲量(降低存儲費用)-空間域的壓縮。14、數(shù)據(jù)壓縮

19、技術(shù)的分類比較一致的分類方法,是將數(shù)據(jù)壓縮分為在某種程度上可逆的與實際上不可逆的兩類,這樣更能說明它們的本質(zhì)區(qū)別。1、 可逆壓縮也叫作無失真編碼、無噪聲編碼(Noiseless Coding)、冗余度壓減(Redundancy reduction)、熵編碼(Entropy Coding)、數(shù)據(jù)緊縮(Data compaction)、信息保持編碼(Lossless,bit-preserving),等等。2、 不可逆壓縮又稱有失真(Lossy)編碼,信息論中叫熵壓縮(Entropy Compression).15、 實用的數(shù)據(jù)壓縮數(shù)據(jù)壓縮冗余度壓縮熵壓縮統(tǒng)計編碼霍夫曼編碼游程編碼二進制編碼LZW編

20、碼其它量 化特征提取零記憶量化均勻量化馬克斯量化壓擴量化序列量化預(yù)測編碼分組量化直接映射變換編碼分析-合成增量調(diào)制線性預(yù)測非線性預(yù)測自適應(yīng)預(yù)測運動補償預(yù)測矢量量化神經(jīng)網(wǎng)絡(luò)方塊截尾KLTDCTDFTHAAR非正交編碼第三章 語音編碼技術(shù)1、 數(shù)據(jù)壓縮技術(shù)的三個重要指標(biāo) 這三個指標(biāo)是:壓縮前后所需的信息存儲量之比;壓縮算法;恢復(fù)效果。2、音頻信號的編碼方式大致分為三大類:(1) 波形編碼,如PCM、APC、SDC、ATC(2) 音源編譯碼器(分析合成方法),如LPC(3) 混合編碼方法2、 話音信號壓縮的主要依據(jù)音頻冗余主要表現(xiàn)為時域冗余度、頻域冗余度。 一、時域信息冗余度l 幅度非均勻分布l 樣

21、本間的相關(guān)性l 周期之間的相關(guān)性l 基音之間的相關(guān)性l 靜止系數(shù)(話音間隙)l 長時自相關(guān)函數(shù)  二、頻域信息冗余度l 非均勻的長時功率譜密度l 語音特有的短時功率譜密度三、人的聽覺感知機理l 人的聽覺具有掩蓋效應(yīng)l 人耳對不同頻率聲音的敏感程度不同,對低頻率比較敏感l(wèi) 人耳對對語音信號的相位變化不敏感4、常見的語音編碼技術(shù)有:常見的音頻數(shù)據(jù)壓縮方法無損壓縮有損壓縮哈夫曼編碼算術(shù)編碼行程編碼波形編碼音源編碼混合編碼PCMDM、ADMDPCM、ADPCM子帶編碼失量編碼LPCMPE、RPE、CELP、MP-LPC5、 PCM由采樣和量化兩部分組成,量化有好幾種方法,但可歸納成兩類:一類

22、稱為均勻量化,另一類稱為非均勻量化(律壓擴(companding)算法,另一種稱為A律壓擴算法。)。采用的量化方法不同,量化后的數(shù)據(jù)量也就不同。因此,可以說量化也是一種壓縮數(shù)據(jù)的方法。、DM、ADM、DPCM、ADPCM6、 DM增量調(diào)制也稱調(diào)制(delta modulation,DM),它是一種預(yù)測編碼技術(shù),是PCM編碼的一種變形。PCM是對每個采樣信號的整個幅度進行量化編碼,因此它具有對任意波形進行編碼的能力;DM是對實際的采樣信號與預(yù)測的采樣信號之差的極性進行編碼,將極性變成“0”和“1”這兩種可能的取值之一。由于DM編碼只須用1位對話音信號進行編碼,所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。

23、 DM存在“斜率過載”(slope overload)和粒狀噪聲(granular noise)。7、自適應(yīng)增量調(diào)制(ADM) 為了對DM中出現(xiàn)的“斜率過載”和“粒狀噪聲”問題進行改進,從而提出了自適應(yīng)增量調(diào)制(ADM) 。使增量調(diào)制器的量化階能自適應(yīng),也就是根據(jù)輸入信號斜率的變化自動調(diào)整量化階的大小,在檢測到斜率過載時開始增大量化階,而在輸入信號的斜率減小時降低量化階。8、自適應(yīng)脈沖編碼調(diào)制(adaptive pulse code modulation,APCM)是根據(jù)輸入信號幅度大小來改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時自適應(yīng),即量化階的大小每隔幾個樣本就改變,也可以是音

24、節(jié)自適應(yīng),即量化階的大小在較長時間周期里發(fā)生變化。改變量化階大小的方法有兩種:一種稱為前向自適應(yīng)(forward adaptation),另一種稱為后向自適應(yīng)(backward adaptation)。9、差分脈沖編碼調(diào)制DPCM(differential pulse code modulation)是利用樣本與樣本之間存在的信息冗余度來進行編碼的一種數(shù)據(jù)壓縮技術(shù)。差分脈沖編碼調(diào)制的思想是,根據(jù)過去的樣本去估算(estimate)下一個樣本信號的幅度大小,這個值稱為預(yù)測值,然后對實際信號值與預(yù)測值之差進行量化編碼,從而就減少了表示每個樣本信號的位數(shù)。它與脈沖編碼調(diào)制(PCM)不同的是,PCM是

25、直接對采樣信號進行量化編碼,而DPCM是對實際信號值與預(yù)測值之差進行量化編碼,存儲或者傳送的是差值而不是幅度絕對值,這就降低了傳送或存儲的數(shù)據(jù)量。此外,它還能適應(yīng)大范圍變化的輸入信號。10、ADPCM是利用樣本與樣本之間的高度相關(guān)性和量化階自適應(yīng)來壓縮數(shù)據(jù)的一種波形編碼技術(shù),CCITT為此制定了G.721推薦標(biāo)準(zhǔn),這個標(biāo)準(zhǔn)叫做32 kb/s自適應(yīng)差分脈沖編碼調(diào)制32 kb/s Adaptive Differential Pulse Code Modulation7。CCITT推薦的G.721 ADPCM標(biāo)準(zhǔn)是一個代碼轉(zhuǎn)換系統(tǒng)。它使用ADPCM轉(zhuǎn)換技術(shù),實現(xiàn)64 kb/s A律或律PCM速率和3

26、2 kb/s速率之間的相互轉(zhuǎn)換。11、 重點了解DPCM系統(tǒng)原理圖中各個信號的含義,及主要處理的過程描述。第四章 視 頻 信 號 處 理1、 圖像的屬性主要包括:分辨率、像素深度、圖像深度、真/偽彩色、圖像的表示法和種類等。其中分辨率又包括:顯示分辨率和圖像分辨率。2、 位圖圖像、矢量圖形的概念;矢量圖與位圖比較位圖圖像(Bit-Map Image)是指在空間和亮度上已經(jīng)離散化的圖像。通常把一幅位圖圖像考慮為一個矩陣,矩陣中的一個元素(像素)對應(yīng)圖像的一個點,相應(yīng)的值表示該點的灰度或顏色等級。矢量圖形(Vector-Based Image)是用一個指令集合來描述的。這些指令用來描述圖中線條的形

27、狀、位置、顏色等各種屬性和參數(shù)。矢量圖與位圖比較,主要看空間和性能兩方面,一般說來,要看圖像的復(fù)雜程度,簡單的圖使用矢量圖描述好一些,復(fù)雜的圖使用位圖好一些。3、 計算機中常用的顏色模型主要有紅綠藍(RGB)和色調(diào)-飽和度-亮度(hue-saturation-lightness,HSL)顏色模型。在HSL模型中,H定義顏色的波長,稱為色調(diào);S定義顏色的強度(intensity),表示顏色的深淺程度,稱為飽和度;L定義摻入的白光量,稱為亮度。4、 稱為CMY模型由青色(Cyan)、品紅(Magenta)和黃色(Yellow)三基色組成,通常寫成CMY。用這種方法產(chǎn)生的顏色之所以稱為相減色。5、

28、目前采用的彩色空間變換有三種:YIQ, YUV和YCrCb。每一種彩色空間都產(chǎn)生一種亮度分量信號和兩種色度分量信號,而每一種變換使用的參數(shù)都是為了適應(yīng)某種類型的顯示設(shè)備。其中,YIQ適用于NTSC彩色電視制式,YUV適用于PAL和SECAM彩色電視制式,而YCrCb適用于計算機用的顯示器。6、 YUV表示法的重要性是它的亮度信號(Y)和色度信號(U、V)是相互獨立的,也就是Y信號分量構(gòu)成的黑白灰度圖與用U、V信號構(gòu)成的另外兩幅單色圖是相互獨立的。由于Y、U、V是獨立的,所以可以對這些單色圖分別進行編碼。此外,黑白電視能接收彩色電視信號也就是利用了YUV分量之間的獨立性。YUV表示法的另一個優(yōu)點

29、是可以利用人眼的特性來降低數(shù)字彩色圖像所需要的存儲容量。7、 目前世界上現(xiàn)行的彩色電視制式有三種:NTSC制、PAL制和SECAM制。這里不包括高清晰度彩色電視HDTV (High-Definition television)。8、 在彩色電視中,用Y、C1, C2彩色表示法分別表示亮度信號和兩個色差信號,C1,C2的含義與具體的應(yīng)用有關(guān)。在NTSC彩色電視制中,C1,C2分別表示I、Q兩個色差信號;在PAL彩色電視制中,C1,C2分別表示U、V兩個色差信號;在CCIR 601數(shù)字電視標(biāo)準(zhǔn)中,C1,C2分別表示Cr,Cb兩個色差信號。所謂色差是指基色信號中的三個分量信號(即R、G、B)與亮度信

30、號之差。在彩色電視中,使用Y、C1,C2有兩個重要優(yōu)點:Y和C1,C2是獨立的,因此彩色電視和黑白電視可以同時使用,Y分量可由黑白電視接收機直接使用而不需做任何進一步的處理;可以利用人的視覺特性來節(jié)省信號的帶寬和功率,通過選擇合適的顏色模型,可以使C1,C2的帶寬明顯低于Y的帶寬,而又不明顯影響重顯彩色圖像的觀看。因此,為了滿足兼容性的要求,彩色電視系統(tǒng)選擇了一個亮度信號和兩個色差信號,而不直接選擇三個基色信號進行發(fā)送和接收。9、 彩色電視信號的類型主要有:復(fù)合電視信號、分量電視信號、S-Video信號。10、對色差信號使用的采樣頻率比對亮度信號使用的采樣頻率低,這種采樣就稱為圖像子采樣(su

31、bsampling)。 這種壓縮方法的基本根據(jù)是人的視覺系統(tǒng)所具有的兩條特性, 一、是人眼對色度信號的敏感程度比對亮度信號的敏感程度低,利用這個特性可以把圖像中表達顏色的信號去掉一些而使人不察覺; 二、是人眼對圖像細節(jié)的分辨能力有一定的限度,利用這個特性可以把圖像中的高頻信號去掉而使人不易察覺。10、 了解行程編碼的主要概念,熟悉掌握LZW編碼的編、譯碼過程。11、變化編碼的基本概念:變換編碼就是對圖象進行某種正交變換,并對變換后的數(shù)據(jù)進行編碼,從而達到壓縮數(shù)據(jù)的目的. 常見的正交變換有:傅立葉變換、哈爾變換、斜變換、正弦變換、余弦變換、K-L變換、小波變換等。從理論上講, K-L變換效果最佳

32、,但由于其只有求出輸入數(shù)據(jù)的相關(guān)矩陣和本征矢量,才能進行K-L變換,且沒有快速算法,實現(xiàn)復(fù)雜,因此,很少使用。 正交變換的具有如下特性:Ø 熵保持Ø 能量保持Ø 去相關(guān)Ø 能量重新分布與集中11、 詳細了解JPEG編碼和譯碼的主要步驟、及各個步驟的作用和理論依據(jù)。12、 DC和AC系數(shù)各有何特點,分別采用什么方法對它們進行數(shù)據(jù)壓縮。13、 按照J(rèn)PEG中的要求,對DC和AC系數(shù)進行實際的編碼。14、 掌握Huffman編碼過程。Huffman編碼體現(xiàn)了統(tǒng)計編碼的思想。它對于出現(xiàn)頻率大的符號用較少的位數(shù)來表示,而對于出現(xiàn)頻率小的符號用較多的位數(shù)來表示。其編

33、碼效率主要取決于需編碼的符號出現(xiàn)的概率分布,越集中則壓縮比越高。第五章 動態(tài)圖像的處理1、 動態(tài)圖像的特點:(1) 數(shù)據(jù)量大(2) 幀與幀之間存在大量的時間冗余信息(3) 幀內(nèi)存在大量的空間冗余信息2、動態(tài)圖像的數(shù)據(jù)壓縮技術(shù)(1) 幀內(nèi)有變換編碼、預(yù)測編碼、熵編碼等(2) 幀間主要采用:幀間預(yù)測編碼和運動補償3、 幀間差值的統(tǒng)計特性表明:一般動態(tài)圖像的幀間差值比較小,這種統(tǒng)計特性是幀間壓縮編碼的基本依據(jù)4、 運動補償預(yù)測(Motion Compensation,簡寫)技術(shù)通常由以下幾個方面組成:l 首先把圖像分割為靜止的和運動的兩個部分,假設(shè)運動物體僅作平移。n 估計物體的位移值。n 用位移估值(即運動矢量motion vector)進行運動補償預(yù)測n 預(yù)測信息編碼。5、 熟悉運動補償預(yù)測技術(shù)的基本原理,能解釋其運動補償預(yù)測編碼的系統(tǒng)框圖。量化器運動補

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論