




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章多媒體數(shù)據(jù)基礎(chǔ)2.1圖像信息處理基礎(chǔ)2.2視頻和動(dòng)畫信息處理基礎(chǔ)
2.3聲音信息處理基礎(chǔ)2.4多媒體數(shù)據(jù)的壓縮技術(shù)2.1.1圖像的基本概念
1、圖像。圖像一般是指自然界中的客觀景物通過某種系統(tǒng)的映射,使人們產(chǎn)生視覺感受。例如:照片、圖片等。在計(jì)算機(jī)中圖像是用像素點(diǎn)進(jìn)行描述,是一組數(shù)據(jù)的集合。有序排列的像素點(diǎn)表達(dá)了自然景物的形象和色彩,圖像的每個(gè)像點(diǎn)采用若干個(gè)二進(jìn)制位進(jìn)行描述,因此,圖像又叫做“位圖”,其形式如圖2-1所示。
2.1.1圖像的基本概念
2、圖形。圖形是計(jì)算機(jī)在平面直角坐標(biāo)系和空間坐標(biāo)系中,通過對運(yùn)算表達(dá)式進(jìn)行矢量運(yùn)算和對坐標(biāo)數(shù)據(jù)進(jìn)行描述而形成的運(yùn)算結(jié)果,由具有方向和長度的矢量線段構(gòu)成。圖形的描述是使用坐標(biāo)數(shù)據(jù)、運(yùn)算關(guān)系以及顏色描述數(shù)據(jù)。因此,圖形又叫做“矢量圖”,如圖2-2所示。
2.1.1圖像的基本概念
3、圖像的描述。描述一幅圖像主要有分辨率、像素深度、真/偽彩色等。圖像分辨率是指組成一幅圖像的像素密度的度量方法。度是指存儲(chǔ)每個(gè)像素所用的位數(shù),它也是用來度量圖像的分辨率。彩色是指在組成一幅彩色圖像的每個(gè)像素值中,有R,G,B三個(gè)基色分量,每個(gè)基色分量直接決定顯示設(shè)備的基色強(qiáng)度,這樣產(chǎn)生的彩色稱為真彩色。
2.1.2圖像文件格式1、BMP格式BMP是標(biāo)準(zhǔn)的Windows和OS/2的圖形圖像的基本位圖格式,是一種與設(shè)備無關(guān)的圖形文件格式,是Windows軟件推薦使用的一種格式。隨著Windows的普及,BMP已使用得相當(dāng)廣泛,Windows應(yīng)用程序PaintBrush便以此格式存取圖形文件。BMP文件有壓縮和非壓縮之分,壓縮方法采用行程長度編碼(run-lengthencoding,RLE),一般作為圖像資源使用的BMP文件都是不壓縮的。BMP支持黑白圖像、16色和256色的彩色圖像以及RGB真彩色圖像。
2.1.2圖像文件格式2、GIF文件格式GIF文件格式的全稱是圖形交換文件格式,GIF圖像最大不能超過64MB,顏色最多為256色(8位)。GIF格式是目前唯一僅使用LZW壓縮方法的主要圖像文件格式。GIF文件壓縮比較高,文件長度較小。GIF圖像有兩個(gè)主要的規(guī)范,即GIF87a和GIF89a,后者支持圖像內(nèi)的多畫面循環(huán)顯示,可以用來制作小型的動(dòng)畫,現(xiàn)在WWW上的許多微小動(dòng)畫就是用這種方法做成的。GIF格式已成為網(wǎng)絡(luò)上最流行的圖像文件格式之一。
2.1.2圖像文件格式3、JPG文件格式JPG文件格式是AppleMac機(jī)器上使用的一種圖像格式,這種格式的最大特點(diǎn)是文件非常小,而且可以調(diào)整壓縮比。由于JPG文件的壓縮比很高,非常適用于處理大量圖像的場合,也是現(xiàn)在WWW上最流行的圖像格式之一。但它是一種有損壓縮的編碼格式,是以犧牲圖像中某些信息為代價(jià)以換取較高的圖像壓縮比,一般不適合用來存儲(chǔ)原始圖像素材。
2.1.2圖像文件格式4、PCX文件格式PCX文件可以分為3類:各種單色PCX文件、不超過16種顏色的PCX文件和具有256色的PCX圖像文件。PCX格式是微機(jī)上使用最廣泛的圖像文件格式之一,絕大多數(shù)圖像編輯軟件,如:PhotoStyle,CorelDRAW和Windows中的畫筆等均能處理這種格式。而且各種掃描儀得到的圖像均能存儲(chǔ)為PCX格式的文件。PCX文件格式使用行程長度編碼(RLE/RLC)方法進(jìn)行壓縮,壓縮比適中,壓縮和解壓縮速度快,適用于一般軟件的使用。
2.1.2圖像文件格式5、TIF文件格式TIF格式圖像的顏色可以從單色到RGB真彩色,其格式非常靈活,適合于所有圖像應(yīng)用領(lǐng)域。TIF文件分成壓縮和非壓縮兩大類,非壓縮的TIF文件獨(dú)立于軟硬件,使用較廣泛,但壓縮文件要復(fù)雜得多。由于非壓縮的TIF文件具有良好的兼容性,壓縮的TIF文件在存儲(chǔ)時(shí)又有很大的選擇余地,所有這種格式是許多圖像應(yīng)用軟件所支持的主要文件格式之一。2.1.2圖像文件格式6、PCD格式PCD格式是Kodak公司的PhotoCD專用存儲(chǔ)格式,一般都存在CD-ROM上,讀取PCD文件要用Kodak公司的專門軟件。PCD文件中含有從專業(yè)攝影照片到普通顯示使用的多種分辨率的圖像,所以都非常大。由于PhotoCD的應(yīng)用非常廣,許多圖像處理軟件都可以將PCD文件轉(zhuǎn)換成其他標(biāo)準(zhǔn)圖像文件。
2.1.2圖像文件格式7、WMF文件格式WMF文件格式是一種比較特殊的文件格式,可以說是位圖和矢量圖的一種混合體,在桌面出版領(lǐng)域應(yīng)用十分廣泛,許多剪貼圖片集中的圖像就是以這種格式存儲(chǔ)的。
2.1.3圖像文件的存儲(chǔ)1、圖像文件的數(shù)據(jù)表示在計(jì)算機(jī)中,有矢量圖和點(diǎn)位圖兩種類型的圖。矢量圖是用數(shù)學(xué)方法描述的一系列點(diǎn)、線、弧和其他幾何形狀,因此存放這種圖使用的格式稱為矢量圖格式,存儲(chǔ)的數(shù)據(jù)主要是繪制圖形的數(shù)學(xué)描述;點(diǎn)位圖也稱光柵圖(rastergraphics),這種圖是由像素點(diǎn)組成的,如圖2-4(b),因此存放這種圖使用的格式稱為點(diǎn)位圖格式,存儲(chǔ)的數(shù)據(jù)是描述像素的數(shù)值。
2.1.3圖像文件的存儲(chǔ)2、圖像文件的長度圖像文件的長度是指存儲(chǔ)整幅圖像所需要的磁盤字節(jié)數(shù),計(jì)算公式是:圖像文件長度尺寸(字節(jié)數(shù))=圖像分辨率×顏色深度÷8例如:有一幅未經(jīng)壓縮的圖像,它的圖像分辨率是400×300,其顏色深度是24,則這個(gè)文件的長度400×300×24÷8=360000(字節(jié)),這就是圖像文件的存儲(chǔ)長度。如果對圖像文件進(jìn)行壓縮處理,可以大幅度地減少圖像文件所占用的存儲(chǔ)空間。
2.2.1視頻和動(dòng)畫的基本概念
1、動(dòng)畫動(dòng)畫就是利用具有連續(xù)性內(nèi)容的靜止畫面,一幅接著一幅高速地呈現(xiàn)在人們的視野之中。動(dòng)畫利用了人類眼睛的“視覺暫留效應(yīng)”,人在看物體時(shí),物體在大腦視覺神經(jīng)中的滯留時(shí)間約為(1/24)秒。如果每秒更換24或更多的畫面,那么,前一個(gè)畫面在人腦中消失之前,下一個(gè)畫面就進(jìn)入人腦,使人們感覺到動(dòng)態(tài)的變化效果。傳統(tǒng)的動(dòng)畫制作過程相當(dāng)復(fù)雜,隨著計(jì)算機(jī)技術(shù)的發(fā)展,人們開始用計(jì)算機(jī)進(jìn)行動(dòng)畫的創(chuàng)作,并稱其為計(jì)算機(jī)動(dòng)畫。2.2.1視頻和動(dòng)畫的基本概念
2、視頻視頻也是將一幅幅獨(dú)立圖像組成的序列按照一定的速率連續(xù)播放,利用視覺暫留現(xiàn)象在人的眼前呈現(xiàn)出連續(xù)運(yùn)動(dòng)的畫面。因此,動(dòng)畫與視頻從視覺角度看應(yīng)該是一樣的。其實(shí),劃分動(dòng)畫與視頻的依據(jù)應(yīng)該是生成它們的手段,如果利用攝像機(jī)進(jìn)行現(xiàn)場拍攝而獲得的信息為視頻文件,利用工具軟件人為創(chuàng)造出來的動(dòng)作序列組成的文件稱為動(dòng)畫。與靜止圖像相比,視頻媒體是一組運(yùn)行圖像,其速率為25幀/秒或30幀/秒。幀是構(gòu)成視頻信息的基本單元。
2.2.2視頻和動(dòng)畫文件格式1、AVI文件格式AVI文件格式是VideoforWindows所使用的文件格式,其擴(kuò)展名為AVI。它采用了Intel公司的Indeo視頻有損壓縮技術(shù)把視頻和音頻信號(hào)混合交錯(cuò)地存放在一個(gè)文件中,較好地解決了音頻信息與視頻信息的同步問題,是目前較為流行的視頻文件格式。AVI文件使用的壓縮方法有多種,主要使用有損壓縮方法。通常采用純軟件的壓縮和還原手段。
2.2.2視頻和動(dòng)畫文件格式2、MOV文件格式MOV文件格式是QuickTimeforWindows所使用的視頻文件格式。和AVI文件相同,MOV文件也使用了Intel公司的Indeo視頻壓縮技術(shù)把視頻和音頻信號(hào)混合交錯(cuò)在一起,但具體實(shí)現(xiàn)不同。一般認(rèn)為MOV文件圖像較AVI好,但這只是相對而言,因?yàn)椴煌姹镜腁VI和MOV文件的畫面質(zhì)量是很難進(jìn)行比較的。
2.2.2視頻和動(dòng)畫文件格式3、MPG格式MPG文件是最新的數(shù)字視頻標(biāo)準(zhǔn)文件,也稱為系統(tǒng)文件或隔行數(shù)據(jù)流,是采用MPEG方法進(jìn)行壓縮的全運(yùn)動(dòng)視頻圖像。許多視頻處理軟件都支持該文件格式。在一定條件下,可在1024*768的分辨率下以每秒24,25或30幀的速度播放128000種顏色的全運(yùn)動(dòng)視頻圖像和同步CD音質(zhì)的伴音。
2.2.2視頻和動(dòng)畫文件格式4、DAT格式DAT是VideoCD或KaraokeCD(即卡拉OKCD,為面向大眾化消費(fèi)的另一種CD標(biāo)準(zhǔn)),DAT文件是VCD專用的視頻文件格式,也是基于MPEG壓縮/解壓縮技術(shù)的視頻文件格式。當(dāng)計(jì)算機(jī)配備視霸卡或軟解壓程序后,可利用計(jì)算機(jī)對該格式的文件進(jìn)行播放。
2.2.3視頻和動(dòng)畫文件的存儲(chǔ)
多媒體中的一幅640×480的256色彩圖像所占的數(shù)據(jù)量為300kB;動(dòng)態(tài)視頻要求每秒播放25~30幀圖像,因而以640×480的窗口播放256色彩色視頻圖像、具CD音質(zhì)的立體聲,就要求每秒處理約9MB的數(shù)據(jù),即使采用一片容量為650MB的CD-ROM盤也僅能存儲(chǔ)約75.6秒的視頻圖像,因此,動(dòng)畫和視頻文件的壓縮是十分必要的。
2.3.1聲音的基本概念
聲音是通過空氣傳播的一種連續(xù)的波,叫聲波。聲音信號(hào)的三個(gè)基本參數(shù)是頻率、幅度和音色。信號(hào)的頻率是指信號(hào)每秒鐘變化的次數(shù),用Hz表示。人的聽覺能夠聽到的聲音頻率范圍是20Hz~20KHz,因此,在多媒體技術(shù)中,處理的信號(hào)主要是音頻信號(hào),它的頻率范圍為20Hz~20KHz。幅度又稱為響度,即聲音的大小,它取決于聲波振幅的大小。音色是由混入基音的泛音所決定的,每個(gè)基音又都有其固有的頻率和不同音強(qiáng)的泛音,從而使得每個(gè)聲音具有特殊的音色效果。2.3.2聲音文件的格式和分類1、WAV文件WAV文件也稱為波形文件,是Windows所使用的標(biāo)準(zhǔn)數(shù)字音頻,文件的擴(kuò)展名是WAV。它是對實(shí)際聲音進(jìn)行采樣所得到的數(shù)據(jù)。波形文件最大的缺點(diǎn)就是文件太大,不適合長時(shí)間記錄聲音。例如,同樣半小時(shí)的立體聲音樂,MIDI文件只有200KB左右,而WAV文件則要差不多300MB。由于波形文件記錄的是聲音的數(shù)字化數(shù)據(jù),所以可用一些聲音工具軟件對其進(jìn)行處理,如加快或放慢放音速度,對聲音進(jìn)行重新組合等。2.3.2聲音文件的格式和分類2、MIDI音樂MIDI音樂是(樂器數(shù)字接口)的縮寫,MIDI文件的擴(kuò)展名為MID。與波形文件不同,MIDI文件不對音樂進(jìn)行采樣,而是對音樂的每個(gè)音符記錄為一個(gè)數(shù)字,所以與波形文件相比文件要小得多,可以滿足長時(shí)間音樂的需要。此外,MIDI只能記錄標(biāo)準(zhǔn)所規(guī)定的有限種樂器的組合,而且回放質(zhì)量受到聲音卡的合成芯片的限制。近年來,國外流行的聲卡普遍采用波表法進(jìn)行音樂合成,使MIDI的音樂質(zhì)量大大提高。
2.3.2聲音文件的格式和分類3、CD-DA是數(shù)字音頻(CcmpactDiscDigitalAudio)的英文縮寫,即大家日常使用的CD唱片,專業(yè)術(shù)語把它稱為紅皮書標(biāo)準(zhǔn)音頻,它是一種數(shù)字化的聲音。以16位,44.1kHz頻率進(jìn)行采樣,幾乎可以達(dá)到完全再現(xiàn)原始聲音的效果。在每一張CD唱片上能存放長達(dá)72min的高質(zhì)量的音樂。利用Windows98的“CD播放器”和“媒體播放機(jī)”都可以播放CD音樂。CD音樂不是以磁盤文件方式保存的,因此不能隨便將其中一段音樂復(fù)制到其他地方,這樣,使得CD音樂的使用范圍變得比較狹窄。
2.3.2聲音文件的格式和分類4、MP3音樂隨著計(jì)算機(jī)網(wǎng)絡(luò)的普及和發(fā)展,MP3格式的音樂越來越受到人們的歡迎。因?yàn)檫@是一種壓縮格式的聲音文件,音質(zhì)好,數(shù)據(jù)量小是它的最大優(yōu)點(diǎn)。MP3是一種數(shù)據(jù)音頻壓縮標(biāo)準(zhǔn)方法,它的全稱是MPEG-Layer3,是VCD影像壓縮標(biāo)準(zhǔn)MPEG的一個(gè)組成部分。用該標(biāo)準(zhǔn)制作儲(chǔ)存的音樂就是MP3音樂。因?yàn)镸P3是經(jīng)過壓縮產(chǎn)生的文件,因此需要一套MP3播放軟件進(jìn)行還原。2.3.3聲音文件的存儲(chǔ)聲音文件的存儲(chǔ)量可用下式計(jì)算:
存儲(chǔ)量(KB)=(采樣頻率KHZ×采樣位數(shù)bit×聲道數(shù)×?xí)r間秒)/82.4.1多媒體數(shù)據(jù)冗余的產(chǎn)生1、冗余的基本概念
冗余是指信息存在的各種性質(zhì)的多余度。通常,圖像數(shù)據(jù)和語音數(shù)據(jù)的冗余很大。例如,廣播員讀文稿時(shí)每分鐘約讀180字,一個(gè)漢字占兩字節(jié),那么可以把所讀漢字的文本數(shù)據(jù)量折算為360字節(jié);但如果對語音直接錄音采樣,則一秒鐘的數(shù)據(jù)量為64Kb相當(dāng)于8000B,則一分鐘的數(shù)據(jù)量是480000B,也就是說語音數(shù)據(jù)有1000多倍的文本數(shù)據(jù)冗余。同樣,有些圖像也存在著很大的冗余。可見,如何壓縮圖像和語音數(shù)據(jù)中的冗余是多媒體應(yīng)用的主要任務(wù)之一。
2.4.1多媒體數(shù)據(jù)冗余的產(chǎn)生2、數(shù)據(jù)冗余的種類大多數(shù)信息中或多或少在存在著各種性質(zhì)的多余度,在數(shù)字化后會(huì)表現(xiàn)為各種形式的數(shù)據(jù)冗余。數(shù)據(jù)冗余的類別可分為以下幾種。(1)空間冗余規(guī)則物體和規(guī)則背景的表面物理特性都具有相關(guān)性,數(shù)字化后表現(xiàn)為數(shù)據(jù)冗余。2.4.1多媒體數(shù)據(jù)冗余的產(chǎn)生
(2)時(shí)間冗余序列圖像(如電視圖像和運(yùn)動(dòng)圖像)和語音數(shù)據(jù)的前后有著很強(qiáng)的相關(guān)性,經(jīng)常包含著冗余。在播出該序列圖像時(shí),時(shí)間發(fā)生了推移,但若干幅畫面的同一部位沒有變化,變化的只是其中某些地方,這就形成了時(shí)間冗余。空間冗余和時(shí)間冗余是把圖像信號(hào)看作概率信號(hào)時(shí)所反映出的統(tǒng)計(jì)特性,因此,這兩種冗余也被稱為統(tǒng)計(jì)冗余。
2.4.1多媒體數(shù)據(jù)冗余的產(chǎn)生(3)結(jié)構(gòu)冗余數(shù)字化圖像中的物體表面紋理等結(jié)構(gòu)往往存在著冗余,這種冗余稱為結(jié)構(gòu)冗余。當(dāng)一幅圖有很強(qiáng)的結(jié)構(gòu)特性,紋理和影像色調(diào)等與物體表面結(jié)構(gòu)有一定的規(guī)則時(shí),其結(jié)構(gòu)冗余很大。
2.4.1多媒體數(shù)據(jù)冗余的產(chǎn)生
(4)知識(shí)冗余由圖像的記錄方式與人對圖像的知識(shí)差異所產(chǎn)生的冗余稱為知識(shí)冗余。人對許多圖像的理解與某些基礎(chǔ)知識(shí)有很大的相關(guān)性。例如,人臉的圖像有固定的結(jié)構(gòu),這類結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到。但計(jì)算機(jī)存儲(chǔ)圖像時(shí)還得把一個(gè)個(gè)像素信息存入,這就是知識(shí)冗余。
2.4.1多媒體數(shù)據(jù)冗余的產(chǎn)生
(5)視覺冗余人類的視覺系統(tǒng)對于圖像的注意是非均勻和非線性的,它并不能感知圖像的所有變化。當(dāng)某些變化不能被視覺所感知,則忽略這些變化,我們?nèi)哉J(rèn)為圖像是完好的。人類視覺系統(tǒng)的一般分辨能力估計(jì)為26灰度等級(jí),而一般圖像的量化采用28灰度等級(jí),這樣的冗余稱為視覺冗余。
2.4.1多媒體數(shù)據(jù)冗余的產(chǎn)生(6)編碼冗余編碼冗余又稱信息熵冗余。信息熵指一組數(shù)據(jù)攜帶的平均信息量。這里的信息量是指從N個(gè)不相等可能事件中選出一個(gè)事件所需要的信息度量,即在N個(gè)事件中辨識(shí)一個(gè)特定事件的過程中需要提問的最少次數(shù)(=log2N比特)。將信息源所有可能事件的信息量進(jìn)行平均,得到的信息平均量稱為信息熵。
2.4.2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 彩妝化妝品購銷合同
- 噴泉維修施工合同
- 廠房門窗工程承包合同
- 網(wǎng)絡(luò)安全行業(yè)風(fēng)險(xiǎn)防范實(shí)戰(zhàn)指南
- 天津汽車抵押借款合同
- 保證金質(zhì)押擔(dān)保合同
- 藥物治療了嗎復(fù)習(xí)試題及答案
- 略讀實(shí)踐課《昆蟲備忘錄》公開課一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)
- 公園噴灌安裝合同范本
- 承包沙場勞務(wù)合同范本
- 2024年韶關(guān)學(xué)院輔導(dǎo)員考試真題
- 2025年衢州龍游經(jīng)濟(jì)開發(fā)區(qū)下屬國資公司招聘筆試參考題庫含答案解析
- 【北師大高二上】北京市部分學(xué)校2021-2022學(xué)年上學(xué)期高二期中英語試題分類匯編:閱讀表達(dá)專題
- GB 30720-2025燃?xì)庠罹吣苄薅ㄖ导澳苄У燃?jí)
- 小學(xué)生金融知識(shí)進(jìn)校園
- 2024年寧夏電力投資集團(tuán)招聘筆試真題
- 飛利浦超聲基礎(chǔ)培訓(xùn)
- 大學(xué)生創(chuàng)新創(chuàng)業(yè)演講稿
- 養(yǎng)老床位建設(shè)服務(wù)方案(技術(shù)方案)
- 《學(xué)打結(jié)做毽子》教學(xué)課件
- 語文-湖南省長郡二十校聯(lián)盟2025屆新高考教學(xué)教研聯(lián)盟高三第一次聯(lián)考(長郡二十校一聯(lián))試題和答案
評(píng)論
0/150
提交評(píng)論