第七章多媒體技術(shù)_第1頁(yè)
第七章多媒體技術(shù)_第2頁(yè)
第七章多媒體技術(shù)_第3頁(yè)
第七章多媒體技術(shù)_第4頁(yè)
第七章多媒體技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩49頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第七章 多媒體技術(shù) 本章主要介紹多媒體計(jì)算機(jī)硬件與軟件方面的基礎(chǔ)知識(shí),以及計(jì)算機(jī)中音頻、圖像(t xin)等信息的獲取與處理、多媒體數(shù)據(jù)壓縮原理等方面的相關(guān)內(nèi)容。 共五十四頁(yè)7.1.1 多媒體計(jì)算機(jī)的概念(ginin)7.1 多媒體計(jì)算機(jī)技術(shù)(jsh)概述 從一般意義上講,在計(jì)算機(jī)或通訊領(lǐng)域,媒體是指信息的載體或者信息的存儲(chǔ)實(shí)體,信息載體包括數(shù)字、文字、聲音、圖形、圖像、視頻,信息的存儲(chǔ)實(shí)體包括磁盤(pán)、磁帶、光盤(pán)、U盤(pán)等。而就多媒體計(jì)算機(jī)而言,媒體則是指信息載體。 根據(jù)國(guó)際電信聯(lián)盟的定義,媒體可分為5種: 感覺(jué)媒體 表示媒體 顯示媒體 存儲(chǔ)媒體 傳輸媒體共五十四頁(yè)7.1 多媒體計(jì)算機(jī)技術(shù)(jsh

2、)概述2.為傳送和表達(dá)感覺(jué)(gnju)媒體而人為研究出來(lái)的媒體 (如ASCII、漢字、圖像、聲音、視頻編碼等)1.人類(lèi)通過(guò)感觀直接感知的信息 (文字、聲音、圖像等)3.輸入和輸出信息的媒體(如鍵盤(pán)、鼠標(biāo)、顯示器、打印機(jī)等)4.存儲(chǔ)表示媒體的介質(zhì) (軟盤(pán)、硬盤(pán)、光盤(pán)等)5. 傳輸信息的媒體。 (如光纖、電纜等)共五十四頁(yè) 多媒體:通常所指的多媒體就是文字、聲音、圖像、圖形、動(dòng)畫(huà)、視頻等各種( zhn)媒體在計(jì)算機(jī)統(tǒng)一管理下的有機(jī)結(jié)合。 7.1 多媒體計(jì)算機(jī)技術(shù)(jsh)概述 多媒體計(jì)算機(jī)技術(shù):計(jì)算機(jī)綜合處理多種媒體信息(文本、圖形、圖像、音頻、視頻和動(dòng)畫(huà)),使多種信息建立邏輯連接,集成為一個(gè)系統(tǒng)

3、且具有交互性。共五十四頁(yè) 1984年,Apple公司(n s)推出Machintosh圖形操作系統(tǒng)。 1985年,世界(shji)上第一臺(tái)多媒體計(jì)算機(jī)問(wèn)世。 1986年,推出光盤(pán)系統(tǒng)。 1990年,多媒體個(gè)人計(jì)算機(jī)協(xié)會(huì)制定MPC1標(biāo)準(zhǔn)。 1995年,Windows95操作系統(tǒng)問(wèn)世。Apple計(jì)算機(jī)(1984)Commodore Amiga系統(tǒng)7.1 多媒體計(jì)算機(jī)技術(shù)概述 7.1.2 多媒體技術(shù)的發(fā)展歷史共五十四頁(yè)7.1 多媒體計(jì)算機(jī)技術(shù)(jsh)概述 多媒體特點(diǎn)是: (1) 多樣性:多媒體不只處理一種媒體,而是綜合處理多種媒體,包括圖文聲像信息。 (2) 集成性:多媒體不是多種媒體簡(jiǎn)單的收集,

4、而是被有機(jī)地集成為系統(tǒng)。 (3) 交互性:多種媒體系統(tǒng)可以實(shí)現(xiàn)人機(jī)互動(dòng),用戶(yngh)可以根據(jù)需要來(lái)使用系統(tǒng)。7.1.3 多媒體技術(shù)的特點(diǎn)和關(guān)鍵技術(shù) 關(guān)鍵技術(shù),包括: 音頻視頻信號(hào)的獲取技術(shù) 多媒體數(shù)據(jù)的壓縮編碼和解碼技術(shù) 音頻視頻數(shù)據(jù)的實(shí)時(shí)處理和特技 音頻視頻數(shù)據(jù)的輸出技術(shù)共五十四頁(yè)多媒體信息的主要(zhyo)元素 1文本:包含字母、數(shù)字、漢字(Hnz)等基本元素。 2圖形:又稱矢量圖。通過(guò)計(jì)算而描述的矢量圖形多媒體多媒體多媒體如何從事多媒體教學(xué)各類(lèi)文字和符號(hào)1234 ABCD ???;共五十四頁(yè)多媒體信息的主要(zhyo)元素 3圖像(t xin):又稱位圖或像素圖。4. 動(dòng)畫(huà):采用編程或

5、動(dòng)畫(huà)軟件創(chuàng)作的連續(xù)畫(huà)面。用像素點(diǎn)描述的自然影像編程或動(dòng)畫(huà)制作軟件生成的畫(huà)面多畫(huà)面幀動(dòng)畫(huà)單畫(huà)面矢量動(dòng)畫(huà)共五十四頁(yè)多媒體信息的主要(zhyo)元素 5. 音頻:指人耳能聽(tīng)到的連續(xù)變化(binhu)的音波。6. 視頻:動(dòng)態(tài)的影視圖像。 數(shù)字音頻信號(hào)、壓縮音頻信號(hào) midi音頻 wav音頻 mp3壓縮音頻用電視攝像設(shè)備捕捉的實(shí)物場(chǎng)景音頻 + 視頻END共五十四頁(yè)7.1.4 多媒體技術(shù)的發(fā)展(fzhn)和應(yīng)用7.1 多媒體計(jì)算機(jī)技術(shù)(jsh)概述 形象教學(xué) 仿真工藝過(guò)程 模擬交互過(guò)程 電子教案、教學(xué) 網(wǎng)絡(luò)多媒體教學(xué)教育(形象教學(xué)、模擬展示)Internet國(guó)際互聯(lián)網(wǎng) 網(wǎng)絡(luò)多媒體技術(shù) 網(wǎng)絡(luò)遠(yuǎn)程診斷 網(wǎng)絡(luò)遠(yuǎn)

6、程操作 (手術(shù))醫(yī)療(遠(yuǎn)程診斷、遠(yuǎn)程手術(shù)) 生物形態(tài)模擬 生物智能模擬 人類(lèi)行為智能模擬人工智能模擬(生物、人類(lèi)智能模擬)商業(yè)廣告(特技合成、大型演示) 影視商業(yè)廣告 公共招貼廣告 大型顯示屏廣告 平面印刷廣告 電視/電影/卡通混編特技 三維成像模擬特技 演藝界MTV特技制作 仿真游戲、賭博游戲影視娛樂(lè)業(yè)(電影特技、變形效果)共五十四頁(yè)7.1 多媒體計(jì)算機(jī)技術(shù)(jsh)概述 (1) 多媒體技術(shù)智能化 把人工智能領(lǐng)域某些研究課題與多媒體計(jì)算機(jī)技術(shù)結(jié)合。 (2) 多媒體信息實(shí)時(shí)處理和壓縮編碼算法芯片化 把多媒體信息實(shí)時(shí)處理和壓縮編碼算法直接放置到CPU芯片中,從而大大改善(gishn)多媒體計(jì)算機(jī)

7、的性能指標(biāo)。 (3) 虛擬現(xiàn)實(shí)技術(shù) 是指運(yùn)用多種技術(shù)綜合形成一種模擬現(xiàn)實(shí)環(huán)境的人造環(huán)境,用戶在該環(huán)境中通過(guò)五官和大腦的親自體驗(yàn)并參與到該虛擬環(huán)境中,可以與之交互。讓用戶感覺(jué)到如同置身于真實(shí)世界一樣,它是多媒體技術(shù)的最高境界。 7.1.5 未來(lái)多媒體技術(shù)的發(fā)展共五十四頁(yè)7.2.1 多媒體計(jì)算機(jī)硬件(yn jin)系統(tǒng)7.2 多媒體計(jì)算機(jī)系統(tǒng)(xtng)共五十四頁(yè)7.2 多媒體計(jì)算機(jī)系統(tǒng)(xtng) (1) 基本硬件設(shè)備: 光盤(pán)存儲(chǔ)器 光盤(pán)存儲(chǔ)器由光盤(pán)和光盤(pán)驅(qū)動(dòng)器構(gòu)成。 音頻卡 又名“聲卡”,主要用于處理聲音,是多媒體計(jì)算機(jī)的基本配置。目前許多計(jì)算機(jī)的主板上都集成(j chn)了聲卡的功能,聲卡不

8、再以單獨(dú)形式存在。共五十四頁(yè)7.2 多媒體計(jì)算機(jī)系統(tǒng)(xtng) 聲卡的作用主要有: A/D(模/數(shù))轉(zhuǎn)換將作為模擬量的自然聲音轉(zhuǎn)化成數(shù)字化的聲音,然后(rnhu)以文件形式保存在計(jì)算機(jī)中。 D/A(數(shù)/模)轉(zhuǎn)換把數(shù)字化的聲音轉(zhuǎn)換成模擬量的自然聲音并輸出到聲音還原設(shè)備(例如耳機(jī)、有源音箱、音箱放大器等)中。 輸入、輸出功能利用聲卡的輸入/輸出端口可以將模擬信號(hào)引入聲卡并轉(zhuǎn)換成數(shù)字信號(hào);也可以將數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào)送到輸出端口驅(qū)動(dòng)音響設(shè)備發(fā)出聲音。7.6 音頻卡的基本原理共五十四頁(yè)聲卡的主要接口:總線(Bus) 線路輸入(Line in)話筒輸入(Mic in) 線路輸出(shch)(Line

9、 out)揚(yáng)聲器輸出(Speaker Out) 游戲棒/MIDI(Joystick/MIDI)7.2 多媒體計(jì)算機(jī)系統(tǒng)(xtng)共五十四頁(yè)聲卡與外部設(shè)備(wi b sh bi)的連接示意圖 音箱2、麥克風(fēng)輸入 3、揚(yáng)聲器輸出4、MIDI/操縱桿端口外部音頻設(shè)備麥克風(fēng)操縱桿MIDI聲音裝置1、線路輸入7.2 多媒體計(jì)算機(jī)系統(tǒng)(xtng) (1) 數(shù)字信號(hào)處理器DSP:聲卡的核心部件,用于管理聲音的輸入輸出以及音頻信號(hào)的模/數(shù)轉(zhuǎn)換和數(shù)/模轉(zhuǎn)換。 (2) 混音器:可以將幾個(gè)不同聲源進(jìn)行混合錄音。 (3) 音樂(lè)合成器:主要用于MIDI音樂(lè)文件的播放。聲卡中的關(guān)鍵部件共五十四頁(yè)7.2 多媒體計(jì)算機(jī)系統(tǒng)

10、(xtng) (2) 擴(kuò)展設(shè)備: 具有代表性的擴(kuò)展設(shè)備有:觸摸屏、視頻卡、掃描儀、數(shù)碼相機(jī)(sh m xin j)、數(shù)字?jǐn)z像機(jī)、各種彩色打印機(jī)、彩色投影儀等。 數(shù)碼照相機(jī)彩色掃描儀數(shù)碼攝像機(jī)觸 摸 屏彩色打印機(jī)共五十四頁(yè) 觸摸屏:屬于輸入設(shè)備(shbi),可通過(guò)手指直接觸及屏幕上的菜單、光標(biāo)、接鈕等。 系統(tǒng)主要(zhyo)由傳感器、控制部件、驅(qū)動(dòng)程序組成。 當(dāng)用手指或其它設(shè)備觸摸顯示器前面的觸摸屏?xí)r,所摸到的位置以坐標(biāo)形式被觸摸屏控制器檢測(cè)到,并通過(guò)接口送到CPU,從而確定用戶所輸入的信息。 觸摸檢測(cè)裝置觸摸屏控制卡驅(qū)動(dòng)程序電纜7.2 多媒體計(jì)算機(jī)系統(tǒng)共五十四頁(yè) 視頻卡:插在主機(jī)板的擴(kuò)展槽內(nèi),

11、可以對(duì)視頻信號(hào)進(jìn)行數(shù)字化轉(zhuǎn)換、編輯(binj)和處理,以及保存數(shù)字化文件。 通常使用的視頻采集卡可接收模擬視頻源的信號(hào)(如錄像機(jī)、電視機(jī)、LD影碟機(jī)等),并對(duì)該類(lèi)信號(hào)進(jìn)行數(shù)字化處理,然后再壓縮編碼成數(shù)字視頻信號(hào)。 此外(cwi),還有一種比較流行的視頻采集卡,我們稱之為IEEE1394數(shù)字視頻采集卡。它主要的作用是將數(shù)碼攝像機(jī)中存放在數(shù)碼攝像帶上的視頻數(shù)據(jù)傳送到電腦硬盤(pán)中,和模擬采集不同的是它在傳送數(shù)據(jù)的過(guò)程中沒(méi)有任何質(zhì)量損失。7.2 多媒體計(jì)算機(jī)系統(tǒng) 視頻卡數(shù)字視頻采集卡共五十四頁(yè) 掃描儀工作原理:把原件面朝下放在掃描儀的玻璃臺(tái)上,掃描儀內(nèi)發(fā)出光照射原件,反射光線經(jīng)光學(xué)鏡面導(dǎo)向后,照射到CC

12、D的光敏器件上。CCD將不同顏色光的強(qiáng)度轉(zhuǎn)換成等價(jià)的電信號(hào),再送到模數(shù)轉(zhuǎn)換器中轉(zhuǎn)換成代表每個(gè)像素色調(diào)或顏色的數(shù)字(shz)值。步進(jìn)電機(jī)驅(qū)動(dòng)掃描頭沿平臺(tái)作微增量運(yùn)動(dòng),每移動(dòng)一步,即獲得一行像素值。掃描樣張光電轉(zhuǎn)換器導(dǎo)軌光源數(shù)字信號(hào)輸出識(shí)別反射光線7.2 多媒體計(jì)算機(jī)系統(tǒng)(xtng) 掃描儀:是一種圖形輸入設(shè)備。配合適當(dāng)?shù)膽?yīng)用軟件后,掃描儀還可以進(jìn)行中、英文智能識(shí)別。 共五十四頁(yè) 數(shù)碼照相機(jī) 數(shù)碼相機(jī)采用CCD作為記錄圖像的介質(zhì),CCD實(shí)際上是一塊布滿光敏元件的感光板, 它通過(guò)光照(gungzho)的不同引起的電荷分布的不同來(lái)記錄被攝入的物體。7.2 多媒體計(jì)算機(jī)系統(tǒng)(xtng)1.光信號(hào)轉(zhuǎn)換成電

13、信號(hào)2.電信號(hào)再轉(zhuǎn)換成數(shù)字信號(hào)3.編碼、壓縮等處理4.保存壓縮數(shù)字圖像共五十四頁(yè) 1、 CCD和像素 CCD上的感光元件越多則(du z)像素就越多,像素越多則(du z)圖像越清晰。 2、存儲(chǔ)卡 數(shù)碼相機(jī)攝入的像片(xin pin)直接存儲(chǔ)在相機(jī)存儲(chǔ)卡中。 3、對(duì)焦和變焦 對(duì)焦,是指將透過(guò)鏡頭折射后的影像準(zhǔn)確投射到CCD感光板上,形成清晰的影像。 幾個(gè)技術(shù)指標(biāo)(簡(jiǎn)介)7.2 多媒體計(jì)算機(jī)系統(tǒng)共五十四頁(yè) 1.多媒體設(shè)備驅(qū)動(dòng)程序,用于在啟動(dòng)操作系統(tǒng)時(shí)把設(shè)備的狀態(tài)、型號(hào)、工作模式等信息提供給操作系統(tǒng),并駐留在內(nèi)存中供系統(tǒng)調(diào)用。 2.多媒體產(chǎn)品制作軟件,主要包括圖像、視頻、音頻的編輯制作。 3.多媒

14、體平臺(tái)軟件,用于多媒體素材的組合。 4.工具軟件,用于加工和處理數(shù)據(jù)(shj),如壓縮、加密等。 5.應(yīng)用軟件包括,Windows系統(tǒng)提供的多媒體軟件、動(dòng)畫(huà)播放軟件、聲音播放軟件、光盤(pán)刻錄軟件等。7.2 多媒體計(jì)算機(jī)系統(tǒng)(xtng)7.2.2 多媒體計(jì)算機(jī)軟件系統(tǒng)多媒體設(shè)備多媒體設(shè)備驅(qū)動(dòng)程序操作系統(tǒng)媒體制作軟件多媒體平臺(tái)軟件工具軟件應(yīng)用軟件共五十四頁(yè)7.3.1 數(shù)字音頻基本概念7.3 音頻信息的獲取(huq)和處理 聲音是一種機(jī)械振動(dòng)。模擬(mn)音頻技術(shù)把這種機(jī)械振動(dòng)轉(zhuǎn)換成電信號(hào),并以模擬(mn)電壓的幅度表示聲音強(qiáng)弱。次聲波人耳可聽(tīng)范圍超聲波20,000Hz 模擬音頻信號(hào):聲音波形在時(shí)間和

15、幅度上都是連續(xù)的,一般用不同的電壓表示。由于模擬音頻信號(hào)是連續(xù)的,所以不能由計(jì)算機(jī)直接處理。 數(shù)字音頻信號(hào):是把表示聲音強(qiáng)弱的模擬電壓用數(shù)字表示。共五十四頁(yè)7.3.2 音頻(ynpn)信息的數(shù)字化7.3 音頻信息的獲取(huq)和處理 模擬信號(hào)的數(shù)字化過(guò)程100101100011101 數(shù)字音頻信號(hào)是由模擬聲音經(jīng)采樣、量化和編碼得來(lái)的。其信號(hào)在時(shí)間和幅度上都用離散的數(shù)字序列表示。共五十四頁(yè)7.3 音頻信息的獲取(huq)和處理 其過(guò)程是每隔一個(gè)時(shí)間間隔在模擬聲音的波形上取一個(gè)幅度值,把時(shí)間上的連續(xù)信號(hào)變成時(shí)間上的離散信號(hào)。采樣頻率(pnl)是指計(jì)算機(jī)每秒鐘采集多少個(gè)聲音樣本。(1) 采樣 時(shí)間

16、上的離散 采樣頻率越高,單位時(shí)間所得到的振幅值就會(huì)越多,因而對(duì)于原聲音曲線的模擬也就越精確。 采樣頻率聲音信號(hào)最高頻率 2 奈奎斯特(Nyquist)采樣定理: 主流聲卡的采樣頻率一般可分為22.05KHz、44.1KHz、48KHz三個(gè)等級(jí),22.05只能達(dá)到FM廣播的聲質(zhì),44.1KHz則是理論上的CD音質(zhì)界限,48KHz則更加精確一些。共五十四頁(yè)7.3 音頻(ynpn)信息的獲取和處理 量化的過(guò)程(guchng)是將采樣后的信號(hào)按整個(gè)聲波的幅度劃分成有限個(gè)區(qū)段(量化間距) ,然后把落入某個(gè)間距內(nèi)的值歸為一類(lèi),并賦予相同的量化值。(2) 量化 幅度上的離散 失真在采樣過(guò)程中是不可避免的,從

17、下面兩幅圖我們可以直觀地看出,當(dāng)采用更高的采樣頻率、量化精度,就可以減少失真。但由此得到的數(shù)字音頻信號(hào)數(shù)據(jù)量也就越大。 共五十四頁(yè)7.3 音頻信息的獲取(huq)和處理 由于經(jīng)采樣和量化后的音頻信號(hào)數(shù)據(jù)量很大,所以一般要先對(duì)數(shù)字化的音頻信息進(jìn)行(jnxng)壓縮和編碼后再在計(jì)算機(jī)內(nèi)傳輸和存儲(chǔ)。在播放這些聲音時(shí),還需要經(jīng)解碼器將二進(jìn)制編碼恢復(fù)成原來(lái)的模擬聲音信號(hào)播放。(3) 編碼共五十四頁(yè)7.3 音頻信息(xnx)的獲取和處理 (1) WAV文件格式:來(lái)源于對(duì)聲音模擬(mn)波形采樣,量化、編碼。這種文件最大的缺點(diǎn)是占用存儲(chǔ)空間大。適用領(lǐng)域:音頻原始素材保存。該格式是通用音頻格式。 7.3.3

18、數(shù)字音頻文件格式 未壓縮的波形音頻文件WAV和CD音頻光盤(pán)的存儲(chǔ)容量計(jì)算如下: 存儲(chǔ)量=采樣頻率采樣量化位數(shù)聲道數(shù)時(shí)間/8 舉例:采樣頻率為44.1KHz,采樣數(shù)據(jù)量化位數(shù)(或稱采樣精度)為16位、雙聲道,一張60分鐘的CD唱片所占存儲(chǔ)容量為: (44.110001623600)/8=635040000(B) 606(M)共五十四頁(yè)7.3 音頻(ynpn)信息的獲取和處理 (2) MP3文件格式:采用1:101:20壓縮率制作的數(shù)字(shz)音頻文件。必須經(jīng)過(guò)解壓縮才能播放,數(shù)據(jù)量小。 (3) RA文件格式:最早的因特網(wǎng)流媒體音頻,音質(zhì)相對(duì)較差。特點(diǎn)是可在低的帶寬下在網(wǎng)上實(shí)時(shí)播放。 (4) W

19、MA文件格式:因特網(wǎng)流媒體音頻,用于在互聯(lián)網(wǎng)上播放的壓縮音頻文件。質(zhì)量?jī)?yōu)于RA。 (5) MID文件格式:是一種通過(guò)電子樂(lè)器彈奏,數(shù)字化合成的音頻文件,占用空間很小。 (6) APE文件格式:是一種音頻無(wú)損壓縮格式,可壓縮到傳統(tǒng)無(wú)損格式 WAV 文件的一半;而在音質(zhì)上超越一般的 MP3,達(dá)到和 CD 相同的音質(zhì)。 (7) AIF文件格式:Apple計(jì)算機(jī)的音頻文件格式。共五十四頁(yè)7.4.1 圖像(t xin)與圖形的區(qū)別7.4 圖像信息(xnx)的獲取和處理 圖像由像素構(gòu)成,像素是組成圖像最基本的元素,每個(gè)圖像點(diǎn)用若干個(gè)二進(jìn)制位進(jìn)行描述。圖像通常用于表現(xiàn)自然景觀、人物、動(dòng)物、植物等復(fù)雜的場(chǎng)景。

20、 圖形是由具有方向和長(zhǎng)度的矢量線段構(gòu)成。圖形使用坐標(biāo)、運(yùn)算關(guān)系以及顏色數(shù)據(jù)進(jìn)行描述,因此把圖形叫做“矢量圖”。圖形的數(shù)據(jù)量小,常用于表現(xiàn)直線、曲線以及由各種線段圍成的圖形,不適于描述色彩豐富、復(fù)雜的自然影像。 共五十四頁(yè)7.4.2 顏色(yns)的基本概念7.4 圖像(t xin)信息的獲取和處理 (1) 顏色的基本描述 彩色可用亮度、色調(diào)和飽和度來(lái)描述,人眼看到任意彩色光都是這三個(gè)特性的綜合效果。亮度是光作用于人眼時(shí)所引起的明亮程度的感覺(jué)。色調(diào)是反映的是顏色的種類(lèi)。飽和度是指顏色的純度,飽和度越深顏色越鮮明。亮度色調(diào)飽和度色彩的明暗程度顏色的種類(lèi)色彩的純度共五十四頁(yè)7.3 圖像信息的獲取(h

21、uq)和處理 RGB 電腦彩色RedBlueGreen0 255 灰階0 255 灰階0 255 灰階 自然界常見(jiàn)的各種彩色光都可以由紅(R)、綠(G)、藍(lán)(B)三種顏色光按不同比例相配而成,這就是色彩學(xué)中最基本(jbn)的原理三基色原理。 把三種基色光按不同比例結(jié)合時(shí)便產(chǎn)生一個(gè)完整的光譜,包含所有的色彩。通常稱之為相加混色。共五十四頁(yè)7.3 圖像信息(xnx)的獲取和處理(2) 顏色空間(kngjin)表示 RGB色彩空間:由紅、綠、藍(lán)3種顏色光按不同比例相配而成,主要用于計(jì)算機(jī)顯示。 CMY色彩空間:三基色是青、品紅和黃,簡(jiǎn)稱為CMY,適用于彩色印刷或彩色打印。 顏色通常用三個(gè)獨(dú)立的屬性來(lái)

22、描述,三個(gè)獨(dú)立的變量綜合就構(gòu)成了一個(gè)空間坐標(biāo),這就是顏色空間。顏色空間可分為兩大類(lèi):基色顏色空間(RGB、CMY等) 和色、亮分離顏色空間(YUV、HSL等)。共五十四頁(yè)7.3 圖像信息(xnx)的獲取和處理 YUV和YIQ色彩空間:適用于彩色電視系統(tǒng),其中Y表示亮度(lingd)信號(hào),UV表示色差信號(hào)。美國(guó)、日本采用YIQ彩色系統(tǒng),Y仍為亮度(lingd)信號(hào),IQ表示色差信號(hào)。 HSL色彩空間:H表示色調(diào),S表示顏色的飽和度,L表示光的亮度。采用YUV模型來(lái)表示彩色圖像共五十四頁(yè)7.4.3 圖像(t xin)信息的數(shù)字化7.4 圖像信息的獲取(huq)和處理 88 像素 1616像素 32

23、32像素 6464像素 (1) 采樣:圖像采樣就是對(duì)圖像在水平方向和垂直方向上等間隔地分割成矩形網(wǎng)狀結(jié)構(gòu),每個(gè)矩形網(wǎng)格稱為像素點(diǎn)。像素總數(shù)就是圖像的分辨率。 一幅圖像在用計(jì)算機(jī)進(jìn)行處理之前必須先轉(zhuǎn)化為數(shù)字形式。圖像數(shù)字化過(guò)程可分為采樣、量化和編碼。共五十四頁(yè)7.4 圖像(t xin)信息的獲取和處理 (2) 量化:是將采樣值劃分成各種等級(jí),用一定位數(shù)的二進(jìn)制數(shù)來(lái)表示采樣的值。量化位數(shù)越大,則越能真實(shí)(zhnsh)地反映原有圖像的顏色,但得到的數(shù)字圖像容量也越大。 在量化時(shí)表示量化的色彩值(或灰度值)所需的二進(jìn)制位數(shù)稱為量化字長(zhǎng)。一般可用8位、16位、24位或更高的量化字長(zhǎng)來(lái)表示圖像的顏色。 (

24、3) 編碼:圖像編碼是按一定的規(guī)則,將量化后的數(shù)據(jù)以二進(jìn)制形式存儲(chǔ)在文件中。32級(jí)灰度 8級(jí)灰度 2級(jí)灰度 顏色深度為8位的圖像顏色深度為24位的圖像共五十四頁(yè)7.4 圖像信息的獲取(huq)和處理 (1) 圖像分辨率 是指打印圖像時(shí),在每英寸上打印的像素?cái)?shù)。(圖像的像素大小是指位圖在高、寬兩個(gè)方向的像素?cái)?shù)相乘(xin chn)的結(jié)果。)7.4.4 圖像的屬性 (2) 顏色數(shù)量和深度 顏色深度是指在某一顏色系統(tǒng)中圖像的每個(gè)顏色所用的二進(jìn)制位數(shù),而顏色數(shù)量是指該顏色系統(tǒng)中共有多少種顏色。顏色深度顏色總數(shù)圖像名稱12單色圖像416索引16 色圖像8256索引256 色圖像1665536HIColo

25、r 圖像2416672216True Color 圖像共五十四頁(yè)7.4 圖像信息的獲取(huq)和處理 顏色深度小于24bit的圖像稱為索引彩色圖像,其像素顏色取自一個(gè)顏色查找表中最接近的顏色,這種方法顯示的顏色不是圖像本身真正的顏色,稱為偽彩色。 當(dāng)某個(gè)圖像的顏色深度達(dá)到或高于24bit時(shí),其顏色數(shù)量已經(jīng)足夠多,且圖像的色彩和表現(xiàn)力非常強(qiáng),基本上還原了自然影像,習(xí)慣上把這種圖像叫做“真彩色圖像”。 真彩色的每個(gè)像素的顏色由RGB基色分量的數(shù)值直接決定。每個(gè)基色分量占一個(gè)字節(jié),共有3個(gè)字節(jié)即24bit,可生成的顏色數(shù)為224=16777216,即1600萬(wàn)種顏色。 而32位真彩色是用其中的24

26、位描述(mio sh)顏色部分,另外8位記錄256級(jí)灰度,用以加強(qiáng)真彩色的質(zhì)量。共五十四頁(yè)7.3 圖像(t xin)信息的獲取和處理 對(duì)于同一幅數(shù)字圖像,采用(ciyng)不同的文件格式保存時(shí),其圖像數(shù)據(jù)量、色彩數(shù)量和表現(xiàn)力會(huì)有不同。7.4.5 數(shù)字圖像的文件格式與數(shù)據(jù)量 (1) 圖像文件的格式文件格式分辨率顏色深度(最大)說(shuō)明BMP 任意 32bit Windows用位圖,鮮艷、細(xì)膩、但尺寸大GIF 96dpi 8bit 256索引顏色,尺寸小,有小動(dòng)畫(huà)效果JPEG 任意 32bit JPEG壓縮文件,質(zhì)量高、尺寸小、略失真PSD 任意 24bit Photoshop專(zhuān)用,圖像細(xì)膩PCD 任

27、意 32bit Kodak照片CD文件TIFF 任意 24bit 通用圖像文件,用于掃描儀、OCR系統(tǒng)WMF 96dpi 24bit Windows的剪貼畫(huà)文件(矢量圖)共五十四頁(yè)7.3 圖像信息的獲取(huq)和處理 數(shù)據(jù)量大是圖像文件的顯著特點(diǎn)。一幅未經(jīng)壓縮的數(shù)字圖像數(shù)據(jù)量大小可按下列公式計(jì)算(j sun): 圖像數(shù)據(jù)量大小 = 像素總數(shù)圖像顏色深度8 例如:一幅 640480 ,256 色圖像為 64048088 = 307200 (字節(jié))(2) 圖像文件的數(shù)據(jù)量像素點(diǎn)個(gè)數(shù)256=28個(gè)不同的色彩,用 8位表示位轉(zhuǎn)換為字節(jié)共五十四頁(yè)7.4.6 圖像(t xin)信息的獲取方法7.4 圖像

28、(t xin)信息的獲取和處理掃描樣張光電轉(zhuǎn)換器數(shù)字信號(hào)輸出 (1) 使用數(shù)碼相機(jī)拍照 利用數(shù)碼相機(jī)或者數(shù)碼攝像機(jī)直接拍攝自然影像,是最簡(jiǎn)單的獲取圖像的手段。 (2) 使用掃描儀掃描 在掃描圖像時(shí),應(yīng)根據(jù)圖像的使用場(chǎng)合,選擇合適的掃描分辨率。分辨率越大,圖像的細(xì)節(jié)部分越清晰,但是圖像的數(shù)據(jù)量也會(huì)越大。 (3) 使用現(xiàn)成圖像 可從正式出版的圖片庫(kù)光盤(pán)或互聯(lián)網(wǎng)上獲得。 共五十四頁(yè)7.5.1 動(dòng)畫(huà)的概念(ginin)和發(fā)展歷史7.5 動(dòng)畫(huà)與視頻(shpn)信息掃描樣張光電轉(zhuǎn)換器數(shù)字信號(hào)輸出 動(dòng)畫(huà)由多幅畫(huà)面組成,當(dāng)畫(huà)面快速連續(xù)地播放時(shí),由于人類(lèi)眼睛存在“視覺(jué)滯留效應(yīng)”而產(chǎn)生動(dòng)感。所謂“視覺(jué)滯留效應(yīng)”是

29、指當(dāng)被觀察的物體消失后,物體仍在大腦視覺(jué)神經(jīng)中停留的時(shí)間約為1/24s。換句話說(shuō),如果每秒快速更換24個(gè)畫(huà)面或更多的畫(huà)面,那么,前一個(gè)畫(huà)面在腦海中消失之前,下一個(gè)畫(huà)面已經(jīng)映入眼簾,大腦感受的影像是連續(xù)的。共五十四頁(yè)7.5.2 電腦(dinno)動(dòng)畫(huà)7.5 動(dòng)畫(huà)與視頻(shpn)信息掃描樣張光電轉(zhuǎn)換器數(shù)字信號(hào)輸出 電腦動(dòng)畫(huà)有兩大類(lèi),一類(lèi)是幀動(dòng)畫(huà),另一類(lèi)是矢量動(dòng)畫(huà)。 幀動(dòng)畫(huà)以幀作為動(dòng)畫(huà)構(gòu)成的基本單位,很多幀組成一部動(dòng)畫(huà)片。幀動(dòng)畫(huà)借鑒傳統(tǒng)動(dòng)畫(huà)的概念,一幀對(duì)應(yīng)一個(gè)畫(huà)面,每幀的內(nèi)容不同。當(dāng)連續(xù)演播時(shí),形成動(dòng)畫(huà)視覺(jué)效果。 矢量動(dòng)畫(huà)是經(jīng)過(guò)電腦計(jì)算而生成的動(dòng)畫(huà),其畫(huà)面只有一幀,主要表現(xiàn)變化的圖形、線條、文字和

30、圖案。矢量動(dòng)畫(huà)通常采用編程或矢量動(dòng)畫(huà)制作軟件來(lái)完成。共五十四頁(yè)7.5.3 制作動(dòng)畫(huà)的設(shè)備(shbi)和軟件7.5 動(dòng)畫(huà)與視頻(shpn)信息掃描樣張光電轉(zhuǎn)換器數(shù)字信號(hào)輸出 制作動(dòng)畫(huà)應(yīng)盡可能采用高速CPU,足夠大的內(nèi)存容量,以及大的硬盤(pán)空間,制作三維動(dòng)畫(huà)時(shí)最好配置較高檔的顯示卡。 常用的動(dòng)畫(huà)制作軟件: Flash網(wǎng)頁(yè)動(dòng)畫(huà)軟件。 3D Studio Max三維造型和動(dòng)畫(huà)軟件。 共五十四頁(yè)7.5.4 視頻(shpn)處理7.5 動(dòng)畫(huà)與視頻(shpn)信息掃描樣張光電轉(zhuǎn)換器數(shù)字信號(hào)輸出 視頻與動(dòng)畫(huà)沒(méi)有本質(zhì)的區(qū)別。視頻來(lái)自于數(shù)碼攝像機(jī)拍攝和經(jīng)數(shù)字化的模擬攝像資料等,常用于表現(xiàn)真實(shí)場(chǎng)景。動(dòng)畫(huà)則是借助于編程

31、或動(dòng)畫(huà)制作軟件生成一系列景物畫(huà)面。 常用的視頻編輯軟件: Premiere視頻編輯軟件。 繪聲繪影視頻編輯軟件。 共五十四頁(yè)7.5.4 動(dòng)畫(huà)和視頻(shpn)常見(jiàn)的文件格式7.5 動(dòng)畫(huà)與視頻(shpn)信息掃描樣張光電轉(zhuǎn)換器數(shù)字信號(hào)輸出 (1) GIF格式:有兩種類(lèi)型,一種是固定畫(huà)面的圖像文件;另一種是多畫(huà)面動(dòng)畫(huà)文件,均采用256色。 (2) SWF格式:用Flash軟件制作的動(dòng)畫(huà)文件格式。該格式的動(dòng)畫(huà)主要在網(wǎng)絡(luò)上演播,特點(diǎn)是數(shù)據(jù)量小,動(dòng)畫(huà)流暢,但不能進(jìn)行修改和加工。 (3) AVI格式(標(biāo)準(zhǔn)):通用的視頻文件格式。兼容好、調(diào)用方便、圖像質(zhì)量好,但缺點(diǎn)是文件體積過(guò)于龐大。 (4) DV AVI

32、格式:數(shù)碼AVI格式。它不同于傳統(tǒng)AVI格式,數(shù)碼攝像機(jī)就是使用這種格式記錄視頻數(shù)據(jù)的。 (5) DivX格式:采用DivX編碼的AVI格式。它可把DVD視頻壓縮為原來(lái)的10%,質(zhì)量接近DVD視頻光盤(pán)的效果。經(jīng)壓縮后的視頻文件擴(kuò)展名也是.avi。共五十四頁(yè)7.5 動(dòng)畫(huà)與視頻(shpn)信息掃描(somio)樣張光電轉(zhuǎn)換器數(shù)字信號(hào)輸出 (6) MPEG格式:用MPEG算法壓縮得到的視頻文件。VCD是用MPEG-1格式壓縮的,DVD 則是用MPEG-2格式壓縮的。 (7) RM格式:視頻流媒體技術(shù)始創(chuàng)者。圖像質(zhì)量較差。特別適合帶寬較小的網(wǎng)絡(luò)用戶在網(wǎng)上實(shí)時(shí)觀看。 (8) RMVB格式:它是RM格式的

33、升級(jí)。它的文件大小比DivX影片減少了近45%,而視聽(tīng)覺(jué)效果與其相當(dāng)。 (9) ASF格式:微軟開(kāi)發(fā)的適合在網(wǎng)頁(yè)中插播的流格式視頻文件。 (10) WMV:也是微軟開(kāi)發(fā)的一種可在網(wǎng)上實(shí)時(shí)播放流格式視頻文件。效果好于ASF和RM格式的視頻文件。共五十四頁(yè)7.6.1 多媒體數(shù)據(jù)壓縮(sh j y su)概述7.6 多媒體數(shù)據(jù)壓縮(sh j y su) 圖像(30萬(wàn)像素,真彩色) (64048024)81024=900KB 視頻(PAL制式,每秒25幀) (90025)1024 22MB /s 聲音(采樣頻率44.1KHz, 16位量化,雙聲道)(44.11000162) 8 1024=172KB/s 嚴(yán)格意義上的數(shù)據(jù)壓縮起源于人們對(duì)概率的認(rèn)識(shí)。當(dāng)我們對(duì)文字信息進(jìn)行壓縮編碼時(shí),如果為出現(xiàn)概率較高的字母賦予較短的編碼,為出現(xiàn)概率較低的字母賦予較長(zhǎng)的編碼,總的編碼長(zhǎng)度就能縮短不少。 壓縮就是去掉信息中的冗余,即保留不確定的信息,去除確定的信息(可推知的)。 (1) 多媒體數(shù)據(jù)壓縮的必要性共五十四頁(yè)7.6 多媒體數(shù)據(jù)壓縮(sh j y su) 1.空間冗余圖像中的某個(gè)區(qū)域相鄰像素的顏色信息相同(xin tn),則該相鄰像素在數(shù)字化圖像中就表現(xiàn)為空間冗余。 2.時(shí)間冗余在一個(gè)圖像序列的兩幅相鄰圖像中,后一幅圖像與前一幅圖像之間有著較大的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論