《多媒體軟件設(shè)計(jì)技術(shù)》課件第2章

上傳人：1*** IP屬地：廣東上傳時間：2025-01-11 格式：PPT 頁數(shù)：147 大?。?.48MB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩142頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2.1多媒體應(yīng)用開發(fā)技術(shù)2.2多媒體技術(shù)標(biāo)準(zhǔn)2.3常見的多媒體文件格式本章小結(jié)練習(xí)二2.1.1數(shù)字圖像和圖像技術(shù)

人們通常認(rèn)為，圖形和圖像是沒有什么區(qū)別的。但在計(jì)算機(jī)處理領(lǐng)域，它們是兩個既有本質(zhì)區(qū)別又有密切聯(lián)系的概念。從本質(zhì)上講，圖形和圖像是計(jì)算機(jī)對處理對象的不同描述方式，它們分別有各自的特點(diǎn)和適用范圍，在一定的條件下也可以相互轉(zhuǎn)化。區(qū)別圖形和圖像的概念，深刻理解其內(nèi)在的聯(lián)系，對圖形和圖像的計(jì)算機(jī)處理和各種文件格式之間的轉(zhuǎn)化有著重要的意義。2.1多媒體應(yīng)用開發(fā)技術(shù)

1．圖形和圖像的區(qū)別

圖形是指由外部輪廓線條構(gòu)成的矢量圖，一般指用計(jì)算機(jī)繪制(draw)的畫面，如直線、圓、圓弧、矩形、任意曲線和圖表等，有時還要使用實(shí)心或有等級變化和色彩填充的區(qū)域，如CorelDraw產(chǎn)生的CDR文件，以及AutoCAD產(chǎn)生的DWG、DXF文件。矢量圖的特點(diǎn)是：通常文件量較小，描述的對象可以任意縮放而不會失真，從根本上講，它是由數(shù)學(xué)坐標(biāo)和公式來描述的，但一般只能描述輪廓不是非常復(fù)雜、色彩不是很豐富的對象，如幾何圖形、工程圖紙等，否則文件量將變得很大，而效果卻不理想。矢量圖形用一組指令集合來描述圖形的內(nèi)容，如圖2-1所示。這些指令用來描述構(gòu)成該圖形的所有直線、圓、圓弧、矩形、曲線等圖元的位置、維數(shù)和形狀。在屏幕上顯示矢量圖形時，要有專門的軟件將描述圖形的指令轉(zhuǎn)換成在屏幕上顯示的形狀和顏色。用于產(chǎn)生和編輯矢量圖形的程序通常稱為Draw程序，這種程序可以產(chǎn)生和操作矢量圖形的各個成分，并能對矢量圖形進(jìn)行移動、縮放、旋轉(zhuǎn)和扭曲等變換，使用矢量圖形的一個很大優(yōu)點(diǎn)就是容易進(jìn)行這類變換。但是，用矢量圖形格式表示復(fù)雜圖像(如人物或風(fēng)景照片)的開銷太大，因此矢量圖形主要用于表示線框型的圖畫、工程制圖、美術(shù)字等。絕大多數(shù)CAD和3D造型軟件使用矢量圖形作為基本的圖形存儲格式。

圖像是指由攝像機(jī)或掃描儀等輸入設(shè)備捕捉實(shí)際場景畫面而產(chǎn)生的數(shù)字圖像，并存儲在計(jì)算機(jī)中的數(shù)字信息。它是由許多點(diǎn)陣而構(gòu)成的點(diǎn)位圖，用以描述圖像中各像素點(diǎn)的強(qiáng)度與顏色(其在特定的領(lǐng)域有時也稱光柵圖)，如Windows畫筆所產(chǎn)生的bmp。它的特點(diǎn)是：文件存儲量較大，所描述的對象會因?yàn)榭s放而損失細(xì)節(jié)或產(chǎn)生“鋸齒”。它本質(zhì)上是將對象以一定的分辨率分解后，再將每一個點(diǎn)的色彩信息進(jìn)行數(shù)字化描述。圖2-1圖形文件格式點(diǎn)位圖適合于表現(xiàn)含有大量細(xì)節(jié)(如明暗變化、復(fù)雜的場景和輪廓、色彩非常豐富等)的畫面，如照片、繪畫，并可直接、快速地在屏幕上顯示出來。點(diǎn)位圖占用存儲空間較大，一般需要進(jìn)行數(shù)據(jù)壓縮。為了便于位圖的存儲和交流，產(chǎn)生了種類繁多的圖像文件格式，常見的有PCX、BMP、DIB、PIC、GIF、TGA、JPG和TIFF等。

圖像的重要參數(shù)是色彩深度和分辨率，它們直接影響位圖的顯示質(zhì)量。位圖中每點(diǎn)的色彩深度可分為二色、灰度、256色、真彩等格式。如果用若干位表示位圖中像素的顏色信息，則這些位的個數(shù)就稱為色彩深度。深度為1的圖像只能有兩種顏色(通常為黑色和白色，但也可以是另外兩種色調(diào)或顏色)，通常稱為單色圖像。深度為4的圖像可以有16種顏色，深度為8的圖像可表示256種顏色。配備標(biāo)準(zhǔn)VGA顯示的普通微機(jī)在640×480分辨率下可顯示16種顏色的位圖圖像，在320×200分辨率下可顯示256種顏色；SuperVGA卡可支持在1024×768(甚至更高)分辨率下顯示256種顏色，一些高檔顯示卡在640×480分辨率下支持24位16772216種顏色的真彩色顯示。

分辨率有屏幕分辨率、圖像分辨率及像素分辨率三個不同概念。屏幕分辨率是顯示屏幕上的最大顯示區(qū)域，即水平與垂直方向的像素個數(shù)。屏幕分辨率與顯示模式有關(guān)，例如，標(biāo)準(zhǔn)VGA圖形卡的最高屏幕分辨率為640像素(水平)×480像素(垂直)。圖像分辨率指數(shù)字圖像的尺寸，即水平與垂直方向的像素個數(shù)。圖像分辨率與屏幕分辨率可能不同，例如，若圖像分辨率為320×240，屏幕分辨率為640×480，則該圖像在屏幕上顯示時只占據(jù)屏幕的1/4。圖像分辨率與屏幕分辨率相同時，顯示的圖像正好占滿整個屏幕區(qū)域；圖像分辨率大于屏幕分辨率時，屏幕上只能顯示出圖像的一部分。位圖圖像所需的存儲空間可用下面的公式計(jì)算：其中，高度和寬度分別是圖像垂直和水平方向上的像素個數(shù)；深度是存儲圖像像素點(diǎn)顏色信息的位數(shù)。例如，一幅640×480的256色原始圖像(未壓縮)的數(shù)據(jù)量為：(640像素×480像素×8位)/8=307200個字節(jié)。通過輸入設(shè)備得到的圖像一般需要進(jìn)行編輯、加工處理，才能成為合乎需要的圖像文件。多數(shù)圖像編輯軟件(如PaintBrush、PhotoStyler和DrawPerfect等)都能對位圖文件及相應(yīng)的調(diào)色板文件進(jìn)行常規(guī)性加工和編輯，這些軟件的功能和使用方法基本相同。一些圖像處理軟件(如CorelDraw或PhotoShop等)可進(jìn)行更復(fù)雜的處理(如圖像濾波、特技效果、進(jìn)行有損壓縮等)，適當(dāng)使用可得到更清晰的圖像或使圖像具有某種特殊效果。

多媒體應(yīng)用中所需的數(shù)字圖像可以通過多種途徑獲得，如直接購置存儲在CD-ROM光盤、磁盤或磁帶上的數(shù)字化圖像庫；利用圖像編輯軟件自行創(chuàng)建；利用彩色掃描儀將照片或藝術(shù)作品掃描后得到數(shù)字圖像；利用攝像機(jī)捕獲實(shí)時圖像等。

2．圖形和圖像的轉(zhuǎn)化

圖形和圖像在一定的條件下是可以轉(zhuǎn)化的。這種轉(zhuǎn)化可以從兩個方面來說明：第一是對象和輸入/輸出設(shè)備之間的硬轉(zhuǎn)化；第二是對象文件格式之間的軟轉(zhuǎn)化。

1)圖形和圖像的硬轉(zhuǎn)化

我們先來分析對象的輸入過程。比如，我們有一張工程圖紙，一般認(rèn)為它是圖形，其實(shí)，在它被輸入計(jì)算機(jī)以前還不能稱它為圖形或圖像，當(dāng)用掃描儀將它輸入Photoshop后，它就變成圖像信息了(因?yàn)檫@時是點(diǎn)位圖)；當(dāng)用數(shù)字化儀將它輸入到AutoCAD后，它就變成圖形信息了(因?yàn)檫@時是向量圖)。也就是說，同一個對象既可以被作為圖形處理，也可以被作為圖像處理。到底哪種過程更有效，要看被處理的對象性質(zhì)和要達(dá)到的處理結(jié)果，以上的工程圖紙應(yīng)作為圖形處理更合理。當(dāng)然，我們可以先將工程圖紙用掃描儀掃進(jìn)計(jì)算機(jī)，變成圖像信息，再用一定的軟件(如CorelTrace和PhotoShop的輪廓跟蹤)人工或自動地勾勒出它的輪廓，這個過程稱為向量化(也就是圖像轉(zhuǎn)化為圖形的過程)。這個過程必然會丟失許多細(xì)節(jié)，所以通常適用于工程繪圖領(lǐng)域。如果我們手頭拿著一張照片，顯然，用掃描儀把它輸入計(jì)算機(jī)作為圖像處理比較合適，當(dāng)然，我們也不反對你一定要用數(shù)字化儀來一點(diǎn)點(diǎn)輸入這張照片，但事實(shí)上這幾乎不可能，除非你只想得到它的大致輪廓。下面再來分析對象的輸出過程。假設(shè)我們用AutoCAD作好了一張圖，較合理的方法是用繪圖機(jī)將它輸出，但是也可以用打印機(jī)將它輸出，這時計(jì)算機(jī)必須先將圖形(向量圖)轉(zhuǎn)化為打印機(jī)的掃描線，這個過程稱為光柵化(點(diǎn)陣化)，從本質(zhì)上講，這是圖形轉(zhuǎn)化為圖像的過程。再假設(shè)我們用Photoshop作好一張圖，較合理的方法是用打印機(jī)將它輸出，這樣可以得到較多的層次和細(xì)節(jié)，如果一定要用繪圖機(jī)輸出，就必然會丟失許多圖像的細(xì)節(jié)。

2)圖形和圖像的軟轉(zhuǎn)化

了解了以上對象和輸入/輸出設(shè)備之間的硬轉(zhuǎn)化，就比較容易理解具體應(yīng)用軟件中的對象文件格式之間的轉(zhuǎn)化。像CorelDraw，它幾乎提供了所有文件格式之間的轉(zhuǎn)化。但千萬不要認(rèn)為，可以轉(zhuǎn)化就可以隨意互換，事實(shí)上許多轉(zhuǎn)化是不可逆的，轉(zhuǎn)化的次數(shù)越多，丟失的信息就越多，特別是在圖形和圖像之間的轉(zhuǎn)化。比如有一個BMP的圖像文件，當(dāng)我們將它轉(zhuǎn)化為GIF、TIFF等格式的時候問題還不大，但如果將它轉(zhuǎn)化為DXF等格式時就丟失了許多的細(xì)節(jié)，甚至像一個方塊中間的填充色塊，都將用幾根線條來代替。另一方面，將一個AutoCAD的DWG文件轉(zhuǎn)化為DXF的時候問題還不大，但如果將它轉(zhuǎn)化為BMP、TIFF、GIF的時候，就要注意幾個非常重要的參數(shù)，一個是分辨率，另一個是色彩數(shù)。這兩個參數(shù)決定了最終圖像文件的大小和它的使用價值。隨著圖形和圖像處理技術(shù)的發(fā)展，也出現(xiàn)了一些非常著名而優(yōu)秀的文件格式，如Adobe公司的EPS格式，它就是一種兼并圖形和圖像的各自優(yōu)點(diǎn)的文件格式；另外像PDF格式，它看似圖像文件，但它可以被解釋為不同的分辨率。總之，各種不同的文件格式從本質(zhì)上講，是在對不同性質(zhì)的處理對象或同一對象的不同處理側(cè)重采用一種最為科學(xué)合理和方便的描述方法。我們應(yīng)該根據(jù)自己的處理對象的特點(diǎn)來選擇(或?qū)⑵滢D(zhuǎn)化為)相應(yīng)的文件格式，以及選擇相應(yīng)的輸入/輸出設(shè)備。2.1.2多媒體數(shù)字音頻技術(shù)

多媒體數(shù)字音頻包括波形音頻和MIDI(樂器數(shù)字接口，如圖2-2所示)。波形音頻一般用來重現(xiàn)語言和其他音樂聲音。要在電腦中得到波形音頻數(shù)據(jù)，必須用一個A/D轉(zhuǎn)換器把模擬音頻信號轉(zhuǎn)換成數(shù)字音頻信號，因此，波型音頻需要大量存儲空間來真實(shí)地重現(xiàn)聲音。而MIDI是由符號來表示音樂聲音的，所以它對存儲空間的要求要比波形音頻少幾個數(shù)

量級，并且允許更大的編輯靈活性。它的聲音質(zhì)量主要與合成器有關(guān)，而與MIDI數(shù)據(jù)本身無關(guān)。圖2-2MIDI播放器多媒體技術(shù)中的一種重要媒體來自音頻，包括語音、音響和音樂。音頻的作用是直接通過講話表達(dá)信息，制造某種效果和氣氛，演奏樂曲等。

音頻技術(shù)發(fā)展比較成熟，其商品化產(chǎn)品(如數(shù)字音響)已投入使用。音頻技術(shù)主要包括數(shù)字化及語音處理、合成、識別等方面。音頻數(shù)字化是目前比較成熟的技術(shù)，數(shù)字音響和多媒體聲卡都是利用這項(xiàng)技術(shù)設(shè)計(jì)的。數(shù)字音響由于采用了數(shù)字化音頻，因而獲得了非常理想的聲響效果，迅速取代了傳統(tǒng)模擬方式的音響。音頻數(shù)字化就是將模擬的(連續(xù)的)聲音波形數(shù)字化(離散化)，以便利用數(shù)字計(jì)算機(jī)進(jìn)行處理的過程，其主要包括采樣和量化兩個方面。相應(yīng)地，數(shù)字化音頻的質(zhì)量取決于采樣頻率和量化位數(shù)這兩個重要參數(shù)。采樣頻率是指對聲音波形每秒進(jìn)行采樣的次數(shù)。人耳聽覺的頻率上限在20?kHz左右，根據(jù)采樣理論，為了保證聲音不失真，采樣頻率應(yīng)在40?kHz左右。經(jīng)常使用的采樣頻率有11.025?kHz、22.05?kHz和44.l?kHz等。采樣頻率應(yīng)在40?kHz左右。經(jīng)常使用的采樣頻率有11.025?kHz、22.05?kHz和44.l?kHz等。采樣頻率越高，聲音失真越小，音頻數(shù)據(jù)量越大。量化數(shù)據(jù)位數(shù)(也稱量化級)是每個采樣點(diǎn)能夠表示的數(shù)據(jù)范圍，經(jīng)常采用的有8位、12位和16位。例如，8位量化級表示每個采樣點(diǎn)可以表示256個

(0～255)不同量化值，而16位量化級則可表示65536個不同量化值。量化位數(shù)越高，音質(zhì)越好，數(shù)據(jù)量也越大。音頻數(shù)字化的采樣頻率和量化級越高，結(jié)果越接近原始聲音，但記錄數(shù)字聲音所需的存儲空間也隨之增加。可以用下面的公式估算聲音數(shù)字化后每秒所需的存儲量(假定不經(jīng)壓縮)：若采用雙聲道錄音，則存儲量再增加一倍。例如，數(shù)字激光唱盤(CD-DA，紅皮書標(biāo)準(zhǔn))的標(biāo)準(zhǔn)采樣頻率為44.1?kHz，量化位數(shù)為16位立體聲，可以幾乎無失真地播出頻率高達(dá)22?kHz的聲音，這也是人類所能聽到的最高頻率聲音。激光唱盤播放一分鐘音樂需要的存儲量為反映音頻數(shù)字化質(zhì)量的另一個因素是通道(或聲道)個數(shù)。記錄聲音時，如果每次生成一個聲波數(shù)據(jù)，則稱為單聲道；每次生成兩個聲波數(shù)據(jù)，則稱為立體聲(雙聲道)，立體聲更能反映人的聽覺感受。

除了上述因素外，音頻數(shù)字化的質(zhì)量還受其他一些因素(如揚(yáng)聲器的質(zhì)量等)的影響。

數(shù)字音頻數(shù)據(jù)的獲取可以通過多種途徑來實(shí)現(xiàn)，如利用市場上已有的數(shù)字式音樂或音響產(chǎn)品，自己錄制，需高質(zhì)量音頻時可租用專門的錄音設(shè)備進(jìn)行錄制。原始音頻數(shù)據(jù)一般需進(jìn)行編輯加工后才能使用，通過編輯可以實(shí)現(xiàn)各種聲音混合以及消除或降低聲音中的畸變等。一般的音頻編輯軟件(如WaveEdit等)都具有設(shè)置音量、漸強(qiáng)漸弱處理及多通道的混合等常用功能。多媒體應(yīng)用中音頻數(shù)據(jù)的另一個重要來源是樂器數(shù)字接口(MIDI，MusicalInstrumentDigitalInterface)文件。國際電子樂器生產(chǎn)廠家達(dá)成有關(guān)協(xié)議，并于1988年正式提交給MIDI制造商協(xié)會，使MIDI成為數(shù)字音樂的一個國際標(biāo)準(zhǔn)。MIDI標(biāo)準(zhǔn)規(guī)定了電子樂器與計(jì)算機(jī)連接的電纜硬件以及電子樂器之間、樂器與計(jì)算機(jī)之間傳送數(shù)據(jù)的通信協(xié)議等規(guī)范。MIDI標(biāo)準(zhǔn)使不同廠家生產(chǎn)的電子合成樂器可以互相發(fā)送和接收音樂數(shù)據(jù)。隨著MIDI標(biāo)準(zhǔn)的施行，計(jì)算機(jī)成為電子合成樂器間的控制環(huán)節(jié)，市場上出現(xiàn)了大量可進(jìn)行記錄、存儲、編輯和播放樂譜(音符表或音符序列)的計(jì)算機(jī)軟件。使用高級語言(如C、Basic或Fortran)編程，根據(jù)特定的作曲算法也可生成ASCII樂譜，并翻譯為在合成器上進(jìn)行演奏的序列文件。音頻處理主要集中在音頻壓縮上，最新的語音壓縮算法可將原始聲音數(shù)據(jù)壓縮為原數(shù)據(jù)量的1/6～1/8。語音合成是指將普通正文合成為語音，國內(nèi)外一些語音合成系統(tǒng)的水平已達(dá)到實(shí)用階段，特別是漢語語音合成研究近年來有了突飛猛進(jìn)的發(fā)展。音頻技術(shù)中難度最大、最具應(yīng)用前景的當(dāng)屬語音識別。語音識別目前仍處于實(shí)驗(yàn)研究階段，雖有少量產(chǎn)品問世，但距實(shí)用尚有一定的距離。然而，其潛在的商業(yè)應(yīng)用前景使之成為音頻技術(shù)研究關(guān)注的熱點(diǎn)之一。2.1.3多媒體數(shù)字視頻技術(shù)

多媒體數(shù)字視頻技術(shù)(如圖2-3所示)的發(fā)展歷史雖然不長，但應(yīng)用范圍已經(jīng)非常廣泛，與最新的MPEG壓縮技術(shù)相結(jié)合的家電—計(jì)算機(jī)一體化產(chǎn)品已受到空前的重視并已迅速進(jìn)入市場。世界各地使用的視頻標(biāo)準(zhǔn)不完全相同，主要有NTSC和PAL兩種標(biāo)準(zhǔn)(或制式)。美國、加拿大和日本等國使用NTSC標(biāo)準(zhǔn)，NTSC標(biāo)準(zhǔn)為30幀每秒，525行每幀。我國及歐洲大部分國家采用PAL制式，PAL標(biāo)準(zhǔn)為25幀每秒，625行每幀。圖2-3多媒體視頻技術(shù)多媒體數(shù)字視頻技術(shù)包括視頻信號數(shù)字化和視頻編碼兩個方面。與音頻數(shù)字化一樣，視頻信號數(shù)字化的目的是將模擬視頻信號經(jīng)模數(shù)轉(zhuǎn)換和彩色空間變換等過程，轉(zhuǎn)換成數(shù)字計(jì)算機(jī)可以顯示和處理的數(shù)字信號。視頻編碼是將數(shù)字化視頻信號經(jīng)編碼成為電視信號，從而可以錄制到錄像帶上或在電視上播放。對于不同的應(yīng)用環(huán)境有不同的技術(shù)可以采用，從低檔的游戲機(jī)到電視臺廣播級的視頻編碼技術(shù)，均已基本成熟。視頻技術(shù)的最近發(fā)展趨勢之一是與多媒體計(jì)算機(jī)密切相關(guān)的高清晰度電視(HDTV)。2.1.4多媒體動畫技術(shù)

動畫提供了靜態(tài)圖形缺少的瞬間交叉的運(yùn)動景象，是一種可感覺到運(yùn)動的相對時間、位置、方向和速度的動態(tài)媒體。

動畫(如圖2-4所示)不僅具有電影的優(yōu)美、寫實(shí)、大眾化的效果，而且可以把人們的視覺引向一些客觀不存在或者難以實(shí)現(xiàn)的世界中。傳統(tǒng)動畫的制作過程相當(dāng)復(fù)雜，諸如規(guī)劃，設(shè)計(jì)故事情節(jié)，設(shè)計(jì)場景和演員動作，設(shè)計(jì)語言蹤跡，設(shè)計(jì)關(guān)鍵畫幀和中間畫幀，復(fù)制到色片上，最后描線、上色、檢查、編輯，整個過程消耗的人力、物力和資金往往是很驚人的。圖2-4多媒體動畫電腦動畫已有30多年的歷史，早期由于軟/硬件水平的限制而進(jìn)展緩慢。動畫的創(chuàng)作方法是基于數(shù)學(xué)公式的，由某種算法產(chǎn)生一系列作品。目前主要通過計(jì)算機(jī)軟件，為動畫創(chuàng)作提供一個人機(jī)交互的環(huán)境。基于知識的動畫創(chuàng)作系統(tǒng)也已問世，它能代替人的部分低層次的有規(guī)律的思維。本質(zhì)上，動畫創(chuàng)作是一種形象思維活動，對形象思維的研究將從理論上為動畫創(chuàng)作提供一種清晰的模型。目前的動畫創(chuàng)作環(huán)境可以制作水平較高的動畫片，如美國電影《侏羅紀(jì)公園》(JurassicPark)就是因?yàn)檫\(yùn)用了大量的電腦動畫而創(chuàng)造了空前的票房紀(jì)錄。電腦動畫的硬件環(huán)境主要由高性能計(jì)算機(jī)(加圖形卡等選件)及輸入/輸出設(shè)備組成。常用的輸入設(shè)備有掃描儀和攝像機(jī)，輸出設(shè)備視載體而定，載體有錄像帶、光盤及膠片等。電腦動畫制作采用一行一行編程的方法是不可取的，購買一套動畫電腦軟件是事半功倍的好辦法。針對不同的機(jī)型，可以選擇不同的軟件，如Wavefront、Alias、Softimages和3DStudio等動畫軟件。電腦動畫制作過程不同于傳統(tǒng)動畫制作。根據(jù)劇情需要，首先應(yīng)在計(jì)算機(jī)中生成一個真實(shí)的三維物體(選型)，再對物體進(jìn)行光照著色(真實(shí)感設(shè)計(jì))，然后使物體動起來(動畫設(shè)置)，最后對運(yùn)動物體進(jìn)行拍照以生成圖像(圖像生成)，制成錄像帶。利用動畫軟件制作動畫，可采用直接在屏幕上交互設(shè)計(jì)和編程設(shè)計(jì)兩種方法。輸入設(shè)備掃描儀和攝像機(jī)的使用對具體造型幫助很大，有時這二者混合使用可使動畫制作更快、更好。利用動畫軟件本身提供的內(nèi)部語言或高級語言及與動畫軟件連接的接口來實(shí)現(xiàn)編程動畫設(shè)計(jì)已在科學(xué)計(jì)算可視化中得到較好的應(yīng)用。

電腦動畫的基礎(chǔ)是計(jì)算機(jī)圖形學(xué)中的三維造型和真實(shí)感顯示，同時綜合了圖形生成技術(shù)、運(yùn)動控制原理、視頻顯示技術(shù)、視覺生理學(xué)、生物學(xué)、機(jī)器人學(xué)、人工智能、物理和藝術(shù)等多個領(lǐng)域的理論和方法，為了成功創(chuàng)作動畫，需要掌握這些當(dāng)代先進(jìn)技術(shù)。目前，電腦動畫創(chuàng)作環(huán)境還只處于輔助動畫設(shè)計(jì)階段，它是一個訓(xùn)練有素的動畫師創(chuàng)作的輔助工具。電腦動畫的目標(biāo)是使一系列二維或三維物體組成的圖像幀連續(xù)變化，運(yùn)動控制完全自動化和智能化，最終與可視化技術(shù)、多媒體技術(shù)融合在一起。實(shí)現(xiàn)虛擬現(xiàn)實(shí)的境界是電腦動畫的發(fā)展方向。

目前，電腦動畫物體模型的建立(造型)一般采用曲面造型方法。非均勻有理B樣條曲面(NURBS)被認(rèn)為是目前最好的造型方法，它造型簡單方便，曲面間自動達(dá)到位置；切矢、曲率均連續(xù)，不必特意拼接各部分，易于局部修改，不影響整體效果，具有高階導(dǎo)數(shù)等良好的數(shù)學(xué)性質(zhì)，可以隨意表示大多數(shù)復(fù)雜的物體外形。具體造型時，靈活應(yīng)用軟件提供的外設(shè)輸入、編程和掌握創(chuàng)建屏幕上直接交互的造型技術(shù)是動畫師的基本功，如靈活應(yīng)用旋轉(zhuǎn)面、直紋面、邊界線定義的曲面、掃描面、n邊面、過渡面、曲面上繪曲線、曲面的交并差、裁剪曲面等工具。

物體模型是一種線框形式，只有通用光和色的渲染才能產(chǎn)生自然界中常見的真實(shí)物體，這在動畫中稱為真實(shí)感設(shè)計(jì)。真實(shí)感設(shè)計(jì)包括三方面內(nèi)容：光源、光照模型和表面質(zhì)感。光源有點(diǎn)源、線源、面光源、聚光燈、平行光、環(huán)境光以及霧、閃電、雷、雨等特殊效果，同時還要考慮光色、亮度、衰減規(guī)律、幾何特性等。光照模型除一般的反射、折射、透射外，還可分為局部光照模型、整體光照模型、光源模型。表面質(zhì)感也稱紋理，有顏色紋理和幾何紋理之別，它們可以使物體表面具有某種材料特性。電腦動畫軟件一般提供數(shù)十種紋理，有時還可形成多層紋理。

使靜止的物體產(chǎn)生運(yùn)動稱為動畫設(shè)置。運(yùn)動物體不僅表現(xiàn)為幾何位置改變，還帶來光、色、背景、受力、碰撞以及物體本身的形變。當(dāng)前使用的方法有關(guān)鍵幀法、運(yùn)動路徑法、物體變形法、運(yùn)動中心與物體局部動畫、動力學(xué)仿真、運(yùn)動學(xué)和反運(yùn)動模擬、光照模型、紋理的動畫以及動畫編輯。對于由骨骼帶動其他部分一起運(yùn)動的物體，如人、機(jī)器人、多節(jié)體的柔體，也是動畫設(shè)計(jì)中一個重要組成部分，這部分動畫設(shè)計(jì)的自動化程度可以達(dá)到較高水平。圖像生成有點(diǎn)類似于照相機(jī)的作用，對于制作動畫，同樣存在著推、拉、搖、移、變焦等過程。電腦動畫成像是經(jīng)過計(jì)算機(jī)計(jì)算物體表面的各種光效果來實(shí)現(xiàn)的。光線投影法只計(jì)算物體表面受到光源直接照射后一次產(chǎn)生的光的反射和透視，不計(jì)算光產(chǎn)生的折射現(xiàn)象，其特點(diǎn)是產(chǎn)生圖像的速度快，但質(zhì)量不高。光線跟蹤法是反向跟蹤光線的方法，它從視點(diǎn)(人眼，攝像機(jī))出發(fā)，找到射入視點(diǎn)的各光線束，反向跟蹤每條射線，計(jì)算各交點(diǎn)的反射、折射和透視，直至射線離開場景或光束衰減到規(guī)定的強(qiáng)度以下。這里還要考慮場景的環(huán)境漫反射、光的漫反射、光的鏡面漫反射、光的規(guī)則透射、光的漫透射等多種現(xiàn)象。因此，它是一種計(jì)算量很大、生成圖像質(zhì)量很高的方法。

動畫已從一種純娛樂媒體發(fā)展成闡述人們想法的最有力的方法之一。電腦上的動畫制作軟件(如3DS)可使人們對其結(jié)果進(jìn)行大量控制(格式、顏色、照明光線和透視)，而不必顧及實(shí)際自然規(guī)律。因此，用它可建立能精確說明問題的圖像。

目前電腦動畫主要用在電視電影動畫制作、電視廣告、輔助教學(xué)、飛行器模擬訓(xùn)練、指揮調(diào)度演習(xí)、工業(yè)實(shí)時控制仿真、模擬產(chǎn)品實(shí)驗(yàn)、醫(yī)療診斷、電子游戲等方面。2.1.5超文本與超媒體技術(shù)

超文本(Hypertext)思想的提出可以追溯到半個世紀(jì)以前，但真正實(shí)現(xiàn)并付之實(shí)用只是近幾年的事。目前，國外的一些大公司、大學(xué)和研究機(jī)構(gòu)推出了多種商品化超文本系統(tǒng)，國內(nèi)的研究機(jī)構(gòu)和大學(xué)也研制出了幾種超文本系統(tǒng)并已投入運(yùn)行。通常我們閱讀小說時，是一頁一頁地往下讀，與之對應(yīng)的電子書籍，在計(jì)算機(jī)屏幕上也是一屏一屏往下讀，這是一種順序方式。如果我們要研究這部小說，或者讀的是百科全書、牛津大辭典、論文集等，顯然不能按照上述順序方式線性地往下讀。例如，某讀者看到作者名時，想查閱作者的國籍、專長、其他著作、研究成果、學(xué)術(shù)地位、主要觀點(diǎn)等；另一位讀者對作者比較了解，讀到作者名時只是一晃而過。上述讀書行為中有兩個重要特點(diǎn)：其一是書中的信息(指一個名詞，一句話，一段文章等)有腳注，而且腳注中還可以有腳注，逐步深入；其二是讀書方式千差萬別，這種差別不僅表現(xiàn)在不同的讀者身上，還表現(xiàn)在同一讀者在不同時間讀同一本書上。用科學(xué)的觀點(diǎn)看，帶腳注的讀書方式更符合人類的思維方式，即聯(lián)想記憶的方式。為了說明超文本的思想，我們來做一個實(shí)驗(yàn)，任務(wù)是在計(jì)算機(jī)中對一本書進(jìn)行腳注。方法是：第一步把書分成一些章節(jié)，每個章節(jié)都有主題，為了便于查詢，需要賦予一些標(biāo)志；第二步把每個章節(jié)中需要腳注的信息點(diǎn)檢出來；第三步完成第二步中信息點(diǎn)的腳注，同時賦予標(biāo)志；第四步把腳注中的信息點(diǎn)檢出來，再做腳注，即重復(fù)第二步、第三步的工作，直至所有的信息點(diǎn)被注釋完畢；第五步編制一套程序，實(shí)現(xiàn)按讀者的需要進(jìn)行聯(lián)想閱讀。這樣組織起來的電子書籍，其讀書方式既可以順序讀，也可以聯(lián)想讀。也許甲讀者在讀到“太陽”一詞后其路徑是：太陽—星星—射電天文學(xué)—黑洞—愛因斯坦—法西斯……；乙讀者可能的途徑是：太陽—東方紅—毛澤東—長沙—白沙井……。同一本書對于讀者甲和乙，似乎變成完全不同的兩本書，而且這本書無所謂第一頁和最后一頁，存在的只是信息和信息之間的聯(lián)系，這種聯(lián)系是網(wǎng)絡(luò)狀的、非線性的，而不是我們常見的線性的、順序的。文本信息由線性、順序的發(fā)展為非線性、網(wǎng)絡(luò)型的，在習(xí)慣上被稱為超文本。在超文本系統(tǒng)中，前面所述第一步中的章節(jié)可以稱為結(jié)點(diǎn)，第三步中的腳注也可以稱為結(jié)點(diǎn)。結(jié)點(diǎn)一般具有一個特定的主題，對于超文本中最簡單的情況——順序文本文件(小說)，其結(jié)點(diǎn)可以是一個主題，一個章節(jié)，也可以是一個頁面。結(jié)點(diǎn)在超文本中主要用來存儲信息，它是一個基本要素。

在超文本系統(tǒng)中，從結(jié)點(diǎn)中某個信息點(diǎn)查找某腳注是由鏈來完成的。鏈?zhǔn)浅谋局械诙€基本要素，鏈一般是有向的，它從源結(jié)點(diǎn)的內(nèi)部出發(fā)指向整個目標(biāo)結(jié)點(diǎn)。把一個超文本系統(tǒng)的結(jié)點(diǎn)和鏈繪制成一張圖，從數(shù)據(jù)結(jié)構(gòu)角度看它是一張有向圖，有時也稱其為網(wǎng)絡(luò)。讀者的讀書過程就是由源結(jié)點(diǎn)順著某個鏈遷移到另一個結(jié)點(diǎn)的過程，鏈?zhǔn)浅谋鞠到y(tǒng)的靈魂。

圖2-5是超文本網(wǎng)絡(luò)結(jié)構(gòu)示意圖，圖中共有a～f6個結(jié)點(diǎn)(頁面)，帶箭頭的直線為超文本的鏈，它從結(jié)點(diǎn)內(nèi)部出發(fā)，指向另一個結(jié)點(diǎn)。每個結(jié)點(diǎn)的出鍵和入鍵是不相同的。若結(jié)點(diǎn)出、入鍵數(shù)目總和為零，則該結(jié)點(diǎn)永遠(yuǎn)不能被訪問和使用，該結(jié)點(diǎn)也不屬于該超文本系統(tǒng)。若某結(jié)點(diǎn)只有出鍵，則它帶有頭的性質(zhì)；若某結(jié)點(diǎn)只有入鍵，則它帶有尾和陷阱的性質(zhì)；顯然在超文本系統(tǒng)中，還存在著回路的可能性，從語義角度看，這是一種循環(huán)腳注現(xiàn)象。圖2-5超文本網(wǎng)絡(luò)結(jié)構(gòu)示意圖文本信息由線性方式上升到網(wǎng)絡(luò)方式，其管理方式發(fā)生了根本的變化，超文本的名字也由此而來。超文本作為一種信息管理技術(shù)，隨著信息種類的增加，如多媒體技術(shù)的發(fā)展，聲、像信息表示的引入，超文本名稱自然延伸為超媒體(Hypermedia)。在超媒體技術(shù)中，結(jié)點(diǎn)發(fā)展分為三大類：表現(xiàn)類(文本、圖形、圖像、聲音、視頻、混合、按鈕等)、組織類(目錄、索引)和推理類(對象、規(guī)則)。鏈也發(fā)展為三大類：基本結(jié)構(gòu)鏈(基本、交叉索引)、組織鏈(索引)和推理鏈(Is-a、Has-a，蘊(yùn)含、執(zhí)行)等。超媒體系統(tǒng)與一般的紙介質(zhì)文獻(xiàn)相比，其優(yōu)點(diǎn)是查詢速度快，結(jié)點(diǎn)信息由文本發(fā)展到聲音、圖像、動畫、視頻、計(jì)算機(jī)程序，結(jié)點(diǎn)和鏈的更新(印刷品是不能更新的)，使之產(chǎn)生了新的組織結(jié)構(gòu)。當(dāng)超媒體網(wǎng)絡(luò)結(jié)點(diǎn)很多時，由于其使用的靈活性，會產(chǎn)生“迷路”現(xiàn)象(即用戶需要做某一事件，但找不到該事件結(jié)點(diǎn))。

1．超文本

超文本是一種新型的信息管理技術(shù)，它以結(jié)點(diǎn)為單位組織信息，在結(jié)點(diǎn)與結(jié)點(diǎn)之間通過表示它們之間關(guān)系的鏈加以連接，構(gòu)成表達(dá)特定內(nèi)容的信息網(wǎng)絡(luò)。超文本組織信息的方式與人類的聯(lián)想記憶方式有相似之處，從而可以更有效地表達(dá)和處理信息。

使用Windows系統(tǒng)的讀者對其頗具特色的幫助系統(tǒng)一定有很深的印象，這個系統(tǒng)就是用超文本方式組織的。在Windows環(huán)境下，利用Microsoft的對象鏈接和嵌入技術(shù)(OLE)，可方便地將許多程序甚至是普通文本變成具有超媒體功能的系統(tǒng)。超文本與傳統(tǒng)的文本有很大的區(qū)別。傳統(tǒng)文本，無論是普通書籍還是計(jì)算機(jī)的文本文件，都是用線性方式加以組織的，讀者在閱讀時，必須一頁一頁順序閱讀，幾乎沒有選擇的余地。超文本是一個非線性的網(wǎng)狀結(jié)構(gòu)，讀者在閱讀時不必像讀一般文章那樣按順序閱讀，可以根據(jù)實(shí)際需要，利用超文本機(jī)制提供的聯(lián)想式查詢能力，迅速找到自己感興趣的內(nèi)容和有關(guān)信息(想像一下你從一本百科全書中查找某個術(shù)語含義的過程)。制作超文本的過程就是將有關(guān)素材按其內(nèi)在的聯(lián)系劃分成不同層次、不同關(guān)系的思想單元，然后用超文本著作工具(絕大多數(shù)多媒體創(chuàng)作工具支持超文本寫作)將這些思想單元組成一個網(wǎng)狀結(jié)構(gòu)。超文本一般采用“控制按鈕”的方式組織接口。

超文本(和后面介紹的超媒體)包含結(jié)點(diǎn)、鏈和網(wǎng)絡(luò)三個基本要素。

1)結(jié)點(diǎn)(node)

結(jié)點(diǎn)是表達(dá)信息的基本單位。如果每個結(jié)點(diǎn)只表示文本信息，則是原始意義下的超文本。結(jié)點(diǎn)所表示的信息不僅可以是文本，也可以是圖形、圖像、音頻、視頻、動畫，甚至是一段計(jì)算機(jī)程序。結(jié)點(diǎn)中所包含的最小信息單位，如一幅圖像、一段文字、一個按鍵等，依不同情形分別稱為“點(diǎn)”(point)和“域”(field)。不同的超文本系統(tǒng)中結(jié)點(diǎn)的表示方法乃至名稱都有所區(qū)別。例如，在Hypercard中，結(jié)點(diǎn)稱為卡片，每個卡片由字段、按鍵和圖像組成，字段用來記錄字符串、數(shù)字等數(shù)據(jù)，按鍵表示用Hypercard的寫作語言Hypertalk所寫成的程序，用鼠標(biāo)選擇了卡片上的按鍵后，就執(zhí)行相應(yīng)的程序。這些字段、按鍵和圖像等就是構(gòu)成卡片的點(diǎn)和域。一般采用兩種方式顯示結(jié)點(diǎn)中的信息：一種是依據(jù)結(jié)點(diǎn)的某種次序順序顯示；另一種是以窗口的形式顯示，這時結(jié)點(diǎn)和窗口是一一對應(yīng)的，屏幕上可能有若干個不同尺寸的重疊窗口，每個窗口分別顯示一個結(jié)點(diǎn)。

2)鏈(Link)

超文本中使用鏈將結(jié)點(diǎn)連接起來，以表示被連接的各結(jié)點(diǎn)之間的關(guān)系。一般來說，結(jié)點(diǎn)間有索引鏈和結(jié)構(gòu)鏈兩種連接方法。

索引鏈實(shí)現(xiàn)結(jié)點(diǎn)中點(diǎn)、域之間的連接，通過索引鏈可實(shí)施對相關(guān)信息的查找及交叉參考。一個鏈的起始端稱為鏈源，是索引的引出處，通過它可以訪問另一個結(jié)點(diǎn)。在超文本系統(tǒng)中，鏈源的表現(xiàn)形式很多，如對鏈源的標(biāo)識符以斜體、粗體、彩色、加下劃線或加邊框等形式顯示；也可以是一個圖符、圖像或控制按鈕等。鏈的末端稱為目標(biāo)端，是索引的目標(biāo)。鏈的起始端和末端通常都是結(jié)點(diǎn)中的點(diǎn)或域。應(yīng)該注意到，兩個結(jié)點(diǎn)之間的鏈可能不止一個，因此，它們可能分別是某個鏈的起始端和末端，只有這樣才能做到兩個結(jié)點(diǎn)信息內(nèi)容的交叉參考。

結(jié)構(gòu)鏈對層次性信息進(jìn)行操作，即它所連接的是處于不同層次的父子結(jié)點(diǎn)，比如，將一個結(jié)點(diǎn)中的某個點(diǎn)與另一個結(jié)點(diǎn)連接。這種連接方法在超文本網(wǎng)絡(luò)中形成了樹狀子網(wǎng)。

除上述兩種連接方法外，在超文本中還經(jīng)常使用一種隱形鏈——關(guān)鍵字鏈?？捎媒Y(jié)點(diǎn)的標(biāo)識或?qū)傩宰鳛殛P(guān)鍵字，也可以將鏈本身作為關(guān)鍵字。以關(guān)鍵字訪問結(jié)點(diǎn)可能有多個匹配。

3)網(wǎng)絡(luò)(Network)

超文本中由結(jié)點(diǎn)和鏈構(gòu)成的網(wǎng)絡(luò)是一個有向圖，這種有向圖與人工智能中的語義網(wǎng)有相似之處。語義網(wǎng)是一種知識表示方法，其中結(jié)點(diǎn)表示概念，而結(jié)點(diǎn)之間的弧表示兩個概念之間的關(guān)系。

超文本中的結(jié)點(diǎn)可以看做是對單一概念或思想的表達(dá)，而結(jié)點(diǎn)之間的鏈則表示概念或思想之間的語義關(guān)系。從這個觀點(diǎn)看，超文本也可以看做是一種知識組織和表達(dá)方法，與人工智能范疇的知識工程不同的是，后者致力于建立知識的表示，以便于機(jī)器推理；而超文本知識表達(dá)的目的是將各種思想、概念組合到一起，便于瀏覽，而不考慮機(jī)器推理。一個超文本系統(tǒng)通常具備以下基本特性：

●所管理的信息是一些單元(信息塊)，這些單元在不同的系統(tǒng)中被分別稱為結(jié)點(diǎn)(nodes)、結(jié)點(diǎn)卡(nodecards)、幀面(frames)或頁(pages)等；

●信息單元之間通過鏈(link)連接在一起，系統(tǒng)提供面向窗口或鼠標(biāo)的用戶界面跟蹤鏈路，使用戶在結(jié)點(diǎn)中航行(navigation)時不至迷失方向；

●系統(tǒng)具有檢索(retieval)能力；

●允許用戶在信息單元上作注釋(annotation)或自由添加鏈路。

2．超媒體

超文本與多媒體的融合產(chǎn)生了超媒體。事實(shí)上，超媒體的原文Hypermedia就是超文本Hypertext和多媒體Multimedia的結(jié)合詞。簡單地講，允許超文本的信息結(jié)點(diǎn)存儲多媒體信息(圖形、圖像、音頻、視頻、動畫和程序)，并使用與超文本類似的機(jī)制進(jìn)行組織和管理，就構(gòu)成了超媒體。但在實(shí)際中，管理和組織多媒體信息比單純的文本信息復(fù)雜得多，所以要將超文本的知識表示方法與多媒體對文本、圖形、圖像、音頻、視頻、動畫等信息的存儲和處理技術(shù)相結(jié)合。前面提到，現(xiàn)在已經(jīng)很難區(qū)分超文本、超媒體和多媒體，特別是當(dāng)前嚴(yán)格意義下的超文本系統(tǒng)已經(jīng)很少見(在某些場合，如一些DOS應(yīng)用軟件的幫助功能中還可以見到)?？偟膩碇v，多媒體的含義更廣一些，而超媒體強(qiáng)調(diào)的是對多種媒體信息的組織、管理，面向?qū)@些信息的檢索和瀏覽。超媒體技術(shù)廣泛應(yīng)用于各種信息查詢系統(tǒng)，如教學(xué)、信息檢索、字典和參考資料、商品介紹展示、旅游和購物指南、交互式娛樂等。2.1.6光存儲技術(shù)

光存儲介質(zhì)與磁存儲介質(zhì)有不少相似的地方，例如，它們都可以用盤、帶或卡的形式出現(xiàn)，在用途和性能方面也有相似的地方。光存儲介質(zhì)與磁存儲介質(zhì)之間的本質(zhì)區(qū)別在于后者使用磁技術(shù)，而前者使用光技術(shù)。光存儲技術(shù)通過光學(xué)的方法讀出(有時也包括寫入)數(shù)據(jù)，由于使用的光源基本上是激光(也用過其他光源)，因此又稱為激光存儲。

1．光存儲的基本原理

一個物理單元之所以能存儲數(shù)據(jù)，是因?yàn)樗哪撤N性質(zhì)能夠發(fā)生變化，并以此反映出所存儲的數(shù)據(jù)。通過識別這種性質(zhì)上的變化就可以讀出其中存儲的數(shù)據(jù)，而用某種編碼方法改變物理單元的性質(zhì)，則可將數(shù)據(jù)寫入該介質(zhì)中。

光學(xué)存儲用激光束以光學(xué)方式讀取記錄在塑料圓盤上的信號坑，其單位面積的記錄密度可達(dá)到700KB/mm2，而且進(jìn)一步提高的潛力尚大，是目前使用的所有數(shù)據(jù)存儲介質(zhì)中記錄密度最高的。

2．光存儲介質(zhì)的分類

光存儲介質(zhì)根據(jù)其存儲體的外形和大小進(jìn)行分類(如盤、帶和卡等)。圖2-6清晰地顯示了光存儲介質(zhì)的發(fā)展過程。目前最常見的光存儲介質(zhì)有5.25英寸和4.75英寸光盤，后者的尺寸與標(biāo)準(zhǔn)激光唱盤大小相同，已經(jīng)被采納為CD-ROM光盤的標(biāo)準(zhǔn)尺寸。一種更小的3.5英寸的光盤標(biāo)準(zhǔn)也已頒布，但尚不普及。圖2-6光存儲技術(shù)演變也可以根據(jù)記錄方法對光存儲介質(zhì)進(jìn)行分類。第一種記錄方法稱為WORM(即一次寫多次讀)，實(shí)質(zhì)是存儲單元的狀態(tài)一旦改變就不能恢復(fù)到原來的狀態(tài)，因而寫操作不可逆；重復(fù)讀的次數(shù)盡管不是無限的，但一般都能保證使用數(shù)十年以上。第二種記錄方法稱為ROM(即只讀存儲)，在多媒體技術(shù)中應(yīng)用的光學(xué)只讀存儲器主要指CD-ROM光盤(CD-ROMTitles)。激光視盤也是一種常見的只讀光盤，最初用于記錄影片數(shù)據(jù)(模擬數(shù)據(jù))。視盤與CD-ROM光盤在原理和結(jié)構(gòu)上很相似，尺寸一般為12英寸或8英寸。2.2.1JPEG——靜止圖像壓縮標(biāo)準(zhǔn)

國際標(biāo)準(zhǔn)化組織(ISO)和國際電報電話咨詢委員會(CCITT)聯(lián)合成立的專家組JPEG(JointPhotographicExpertsGroup)經(jīng)過五年艱苦細(xì)致的工作后，于1991年3月提出了ISOCDIO918號建議草案：多灰度靜止圖像的數(shù)字壓縮編碼(通常簡稱為JPEG標(biāo)準(zhǔn))。這是一個適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。2.2多媒體技術(shù)標(biāo)準(zhǔn)它包括基于DPCM(差分脈沖編碼調(diào)制)的無損壓縮編碼，基于DCT(離散余弦變換)和Huffman編碼的有損壓縮算法兩個部分。前者不會產(chǎn)生失真，但壓縮比很??；后一種算法進(jìn)行圖像壓縮時信息雖有損失但壓縮比可以很大，例如壓縮20倍左右時，人眼基本上看不出失真。JPEG標(biāo)準(zhǔn)實(shí)際上有三個范疇：

(1)基本順序過程(BaselineSequentialProcesses)：實(shí)現(xiàn)有損圖像壓縮，重建圖像質(zhì)量達(dá)到人眼難以觀察出來的要求。其采用的是8×8像素自適應(yīng)DCT算法、量化及Huffman型的熵編碼器。

(2)基于DCT的擴(kuò)展過程(ExtendedDCTBasedProcess)：使用累進(jìn)工作方式，采用自適應(yīng)算術(shù)編碼過程。

(3)無失真過程(LosslesssProcess)：采用預(yù)測編碼及Huffman編碼(或算術(shù)編碼)，可保證重建圖像數(shù)據(jù)與原始圖像數(shù)據(jù)完全相同。

基本順序過程是JPEG最基本的壓縮過程，符合JPEG標(biāo)準(zhǔn)的硬軟件編碼/解碼器都必須支持和實(shí)現(xiàn)這個過程。另兩個過程是可選擴(kuò)展，對一些特定的應(yīng)用項(xiàng)目有很大的實(shí)用價值。

1．JPEG算法

基本JPEG的編碼算法可分成三個步驟：①通過離散余弦變換(DCT)去除數(shù)據(jù)冗余；②使用量化表對DCT系數(shù)進(jìn)行量化(量化表是根據(jù)人類視覺系統(tǒng)和壓縮圖像類型的特點(diǎn)進(jìn)行優(yōu)化的量化系數(shù)矩陣)；③對量化后的DCT系數(shù)進(jìn)行編碼使其熵達(dá)到最小，熵編碼采用Huffman可變字長編碼。

JPEG的解碼過程如圖2-7所示。圖2-7JPEG標(biāo)準(zhǔn)解碼過程

2．離散余弦變換

JPEG采用8×8子塊的二維離散余弦變換算法。在編碼器的輸入端，把原始圖像(對彩色圖像是每個顏色成分)順序地分割成一系列8×8的子塊。在8×8圖像塊中，像素值一般變化較平緩，因此具有較低的空間頻率。實(shí)施三維8×8離散余弦變換可以將圖像塊的能量集中在極少數(shù)幾個系數(shù)上，其他系數(shù)的值與這些系數(shù)相比，絕對值要小得多。與Fourier變換類似，對于高度相關(guān)的圖像數(shù)據(jù)進(jìn)行這樣變換的效果是使能量高度集中，便于后續(xù)的壓縮處理。

3．量化

為了達(dá)到壓縮數(shù)據(jù)的目的，對DCT系數(shù)需作量化處理。量化的作用是在保持一定質(zhì)量的前提下，丟棄圖像中對視覺效果影響不大的信息。量化是多對一映射，是造成DCT編碼信息損失的根源。JPEG標(biāo)準(zhǔn)中采用線性均勻量化器，量化過程為對64個DCT系數(shù)除以量化步長并四舍五入取整，量化步長由量化表決定。量化表元素因DCT系數(shù)位置和彩色分量的不同而取不同值。量化表為8×8矩陣，與DCT變換系數(shù)一一對應(yīng)。量化表一般由用戶規(guī)定(JPEG標(biāo)準(zhǔn)中給出了參考值)，并作為編碼器的一個輸入。量化表中的元素為1～255之間的任意整數(shù)，其值規(guī)定了所對應(yīng)DCT系數(shù)的量化步長。DCT變換系數(shù)除以量化表中對應(yīng)位置的量化步長并舍入小數(shù)部分后，大多數(shù)變?yōu)榱?，從而達(dá)到了壓縮的目的。

4．游程編碼

64個變換數(shù)經(jīng)量化后，左上角系數(shù)是直流分量(DC系數(shù))，即空間域中64個圖像采樣值的均值。相鄰8×8塊之間的DC系數(shù)一般有很強(qiáng)的相關(guān)性，JPEG標(biāo)準(zhǔn)對DC系數(shù)采用DPCM編碼(差分編碼)方法，即對相鄰像素塊之間的L系數(shù)的差值進(jìn)行編碼。其余63個交流分量(AC系數(shù))使用游程編碼，從左上角開始沿對角線方向，以Z字形(Zig-Zag)進(jìn)行掃描直至結(jié)束。

量化后的AC系數(shù)通常會有許多零值，以Z字形路徑進(jìn)行游程編碼有效地增加了連續(xù)出現(xiàn)的零值個數(shù)。

5．熵編碼

為了進(jìn)一步壓縮數(shù)據(jù)，可對DC碼和AC行程編碼的碼字再作基于統(tǒng)計(jì)特性的熵編碼。JPEG標(biāo)準(zhǔn)建議使用的熵編碼方法有Huffman編碼和自適應(yīng)二進(jìn)制算術(shù)編碼。2.2.2MPEG——運(yùn)動圖像壓縮編碼

MPEG(MovingPicturesExpertsGroup)是ISO/IEC/JTC/SC2/WG11的一個小組，它兼顧了JPEG標(biāo)準(zhǔn)和CCITT專家組的H.261標(biāo)準(zhǔn)，于1990年形成標(biāo)準(zhǔn)草案。MPEG標(biāo)準(zhǔn)分成兩個階段：第一個階段(MPEG-1)是針對傳輸速率為1～1.5?Mb/s的普通電視質(zhì)量的視頻信號的壓縮；第二個階段(MPEG-2)則是針對30幀每秒的720×572分辨率的視頻信號進(jìn)行壓縮，在擴(kuò)展模式下，MPEG-2可以對分辨率達(dá)1440×152的高清晰度電視(HDTV)的信號進(jìn)行壓縮。

MPEG算法除了對單幅圖像進(jìn)行編碼外，還利用圖像序列的相關(guān)特性去除幀間圖像冗余，大大提高了視頻圖像的壓縮比，在保持較高的圖像視覺效果的前提下，壓縮比可以達(dá)到60～100倍左右。MPEG壓縮算法復(fù)雜，計(jì)算量大，其實(shí)現(xiàn)一般需要專門的硬件支持。

MPEG標(biāo)準(zhǔn)有三個組成部分：MPEG視頻，MPEG音頻，視頻與音頻的同步。MPEG視頻是MPEG標(biāo)準(zhǔn)的核心。為滿足高壓縮比和隨機(jī)訪問兩方面的要求，MPEG采用預(yù)測和插補(bǔ)兩種幀間編碼技術(shù)。MPEG視頻壓縮算法中包含兩種基本技術(shù)：一種是基于16×16子塊的運(yùn)動補(bǔ)償技術(shù)，用來減少幀序列的時域冗余；另一種是基于DCT的壓縮，用于減少幀序列的空域冗余，在幀內(nèi)壓縮及幀間預(yù)測中均使用了DCT變換。運(yùn)動補(bǔ)償算法是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法之一。

1．運(yùn)動補(bǔ)償預(yù)測

幀序列的相鄰畫面之間的運(yùn)動部分具有連續(xù)性，即當(dāng)前畫面上的圖像可以看成是前面某時刻畫面上圖像的位移，位移的幅度值和方向在畫面各處可以不同。利用運(yùn)動位移信息與前面某時刻的圖像對當(dāng)前畫面圖像進(jìn)行預(yù)測的方法，稱為前向預(yù)測；反之，根據(jù)某時刻的圖像與位移信息預(yù)測該時刻之前的圖像，稱為后向預(yù)測。

MPEG的運(yùn)動補(bǔ)償預(yù)測方法將畫面分成若干16×16的子圖像塊(稱為補(bǔ)償單元或宏塊)，并根據(jù)一定的條件分別進(jìn)行幀內(nèi)預(yù)測、前向預(yù)測、后向預(yù)測及平均預(yù)測。

2．運(yùn)動補(bǔ)償插值

以插補(bǔ)方法補(bǔ)償運(yùn)動信息是提高視頻壓縮比的最有效措施之一。在時域中，插補(bǔ)運(yùn)動補(bǔ)償是一種多分辨率壓縮技術(shù)。例如，以l/15秒或1/10秒時間間隔選取參考子圖,對時域較低分辨率子圖進(jìn)行編碼，通過低分辨子圖及反映運(yùn)動趨勢的附加校正信息(運(yùn)動矢量)進(jìn)行插值，可得到滿分辨率(幀率1/30秒)的視頻信號。插值運(yùn)動補(bǔ)償也稱為雙向預(yù)測，因?yàn)樗壤昧饲懊鎺男畔?，又利用了后面幀的信息?.2.3H.26X——視頻通信編碼標(biāo)準(zhǔn)

電視電話/會議電視的建議標(biāo)準(zhǔn)H.261常稱為P×64K標(biāo)準(zhǔn)，其中P是取值為1～30的可變參數(shù)。P=1或2時支持四分之一中間格式(QCIF，QuarterCmmonIntermediaFormat)的幀率較低的視頻電話傳輸；P≥6時支持通用中間格式(CIF，CommonIntermediateFormat)的幀率較高的電視會議數(shù)據(jù)傳輸。P×64K視頻壓縮算法也是一種混合編碼方案，即基于DCT的變換編碼和帶有運(yùn)動預(yù)測差分脈沖編碼調(diào)制(IDPCM)的預(yù)測編碼方法的混合。在低傳輸速率時(P=1或2，即64b/s或128?Kb/s)，除QCIF外還可使用亞幀(Sub-frame)技術(shù)，即每間隔一幀(或數(shù)幀)處理一幀，壓縮比可高達(dá)50∶1左右。圖像壓縮技術(shù)、視頻技術(shù)與網(wǎng)絡(luò)技術(shù)相結(jié)合的應(yīng)用前景十分可觀，如遠(yuǎn)程圖像傳輸系統(tǒng)、動態(tài)視頻傳輸——可視電話、電視會議系統(tǒng)等已經(jīng)商品化，MPEG標(biāo)準(zhǔn)與視頻技術(shù)相結(jié)合的產(chǎn)物——家用數(shù)字視盤等已進(jìn)入市場?？梢灶A(yù)計(jì)，這些技術(shù)和產(chǎn)品的發(fā)展將對社會的進(jìn)步產(chǎn)生重大影響。

壓縮技術(shù)也是多媒體技術(shù)中的關(guān)鍵問題，目前已有以下標(biāo)準(zhǔn)：

●?JPEG(JointPhotographicExpertsGroup)標(biāo)準(zhǔn)：適用于連續(xù)色調(diào)、多級灰度、彩色/單色靜止圖像壓縮。●?H.261標(biāo)準(zhǔn)：主要用于視頻電話和視頻電視會議。H.261編碼/解碼模型與MPEG的模型類似，包括5個階段：①運(yùn)動補(bǔ)償預(yù)測；②DCT轉(zhuǎn)換；③有失真量化；④DC系數(shù)的編碼以AC系數(shù)的行程編碼；⑤熵編碼。H.261標(biāo)準(zhǔn)的壓縮算法與MPEG的有較多的相同處，區(qū)別只是在于前者覆蓋較寬的信道頻帶，而后者是基于較窄的頻帶上傳輸?！?H.264標(biāo)準(zhǔn)：是DPCM加變換編碼的混合編碼模式。它采用“回歸基本”的簡潔設(shè)計(jì)，設(shè)有眾多的選項(xiàng)，可獲得比H.263++好得多的壓縮性能；加強(qiáng)了對各種信道的適應(yīng)能力，采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法，有利于對誤碼和丟包的處理；應(yīng)用目標(biāo)范圍較寬，以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求。它集中了以往標(biāo)準(zhǔn)的優(yōu)點(diǎn)，并吸收了標(biāo)準(zhǔn)制定中積累的經(jīng)驗(yàn)。與H.263v2(H.263+)或MPEG-4簡單類(SimpleProfile)相比，H.264在使用與上述編碼方法類似的最佳編碼器時，在大多數(shù)碼率下最多可節(jié)省50%的碼率。H.264在所有碼率下都能持續(xù)提供較高的視頻質(zhì)量。

H.264能工作在低延時模式以適應(yīng)實(shí)時通信的應(yīng)用(如視頻會議)，同時又能很好地工作在沒有延時限制的應(yīng)用中，如視頻存儲和以服務(wù)器為基礎(chǔ)的視頻流式應(yīng)用。H.264提供包傳輸網(wǎng)中處理包丟失所需的工具，以及在易誤碼的無線網(wǎng)中處理比特誤碼的工具。

●?MPEG-1標(biāo)準(zhǔn)：制定于1992年，是為工業(yè)級標(biāo)準(zhǔn)而設(shè)計(jì)的，可適用于不同帶寬的設(shè)備，如CD-ROM、Video-CD、CD-R等；主要針對1.5?Mb/s以下數(shù)據(jù)傳輸率的數(shù)字存儲媒質(zhì)運(yùn)動圖像及其伴音編碼的國際標(biāo)準(zhǔn)；每秒播放30幀，CD音質(zhì)，質(zhì)量與VHS(家用視頻系統(tǒng))相當(dāng)?！馦PEG-2標(biāo)準(zhǔn)：制定于1994年，設(shè)計(jì)目標(biāo)是高級工業(yè)標(biāo)準(zhǔn)的圖像質(zhì)量以及更高的傳輸率，它追求的是CCIR601建議的圖像質(zhì)量DVB、HDTV和DVD等制定的3～10?Mb/s的運(yùn)動圖像及其伴音的編碼標(biāo)準(zhǔn)，與MPEG-1兼容，適用于1.5～60?Mb/s甚至更高的編碼范圍。定名為MPEG-2AAC(AdvancedAudioCoding)的標(biāo)準(zhǔn)完成于1997年，經(jīng)BBC(U.K.)和NHK(Japan)使用、測試表明，已達(dá)到最優(yōu)化ITU-R601推薦的分辨率，并且對于低比特率的多聲道編碼能提供相當(dāng)高的聲音質(zhì)量。●?MPEG-4標(biāo)準(zhǔn)：主要應(yīng)用于視頻電話(VideoPhone)、視頻郵件(VideoEmail)和電子新聞(ElectronicNews)等；與MPEG-1和MPEG-2相比，它對于傳輸速率要求較低。MPEG-4利用很窄的帶寬，通過幀重建技術(shù)來壓縮和傳輸數(shù)據(jù)，以求利用最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。MPEG-4的另一個特點(diǎn)是更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控，這是第一個具有交互性的動態(tài)圖像標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)于1998年正式推出?！馦PEG-7標(biāo)準(zhǔn)：1996年10月，MPEG提出的一個新的稱之為多媒體內(nèi)容描述接口(MultimediaContentDescriptionInterface)的概念，即MPEG-7。MPEG-7的目標(biāo)是建立一套視聽特征的量化標(biāo)準(zhǔn)描述器及其結(jié)構(gòu)，以及這些描述器之間的關(guān)系，這些描述器稱之為描述方案(DS，DescriptionSchemes)；同時，MPEG-7也建立了一套標(biāo)準(zhǔn)化的語言——描述定義語言(DDL，DescriptionDefinitionLanguage)，用以說明描述方案，保證其被廣泛采用的擴(kuò)展性和較長的生命周期。人們可以檢索和索引同MPEG-7數(shù)據(jù)相聯(lián)系的視聽材料，這些標(biāo)準(zhǔn)可以是靜態(tài)的圖片、圖形、3D模型、聲音、言語、視頻和這些元素所組成的多媒體描述信息?！?MPEG-21標(biāo)準(zhǔn)：于1999年10月在墨爾本會議上被提出，稱為多媒體框架(MultimediaFramework)。MPEG-21的目標(biāo)是要為多媒體信息的用戶提供透明而有效的電子交易和使用環(huán)境，是一個針對實(shí)現(xiàn)具有知識產(chǎn)權(quán)管理和保護(hù)能力的數(shù)字多媒體內(nèi)容的技術(shù)標(biāo)準(zhǔn)。

計(jì)算技術(shù)、網(wǎng)絡(luò)通信技術(shù)、存儲壓縮技術(shù)的發(fā)展，大大推動了多媒體技術(shù)的發(fā)展。2.3.1圖形圖像文件格式

1．BMP文件

BMP(BitMaP)文件格式是Windows本身的位圖文件格式。所謂本身，是指Windows內(nèi)部存儲位圖即采用這種格式。一個.BMP格式的文件通常有.BMP的擴(kuò)展名，但有一些是以?.RLE為擴(kuò)展名的，RLE的意思是行程長度編碼(RunLengthEncoding)。這樣的文件意味著其使用的數(shù)據(jù)壓縮方法是?.BMP格式文件支持的兩種RLE方法中的一種。2.3常見的多媒體文件格式圖2-8多媒體常見文件格式

BMP文件可用每像素1、4、8、16或24位來編碼顏色信息，這個位數(shù)稱做圖像的顏色深度，它決定了圖像所含的最大顏色數(shù)。一幅1?bpp(位每像素，bitperpixel)的圖像只能有兩種顏色，而一幅24?bpp的圖像可以有超過16兆種不同的顏色。下面以256色(也就是?8?bpp)位圖為例，說明了一個典型.BMP文件的結(jié)構(gòu)。BMP文件包含四個主要的部分：一個位圖文件頭，一個位圖信息頭，一個色表和位圖數(shù)據(jù)本身。位圖文件頭包含關(guān)于這個位圖文件的信息，如從哪里開始是位圖數(shù)據(jù)的定位信息；位圖信息頭含有關(guān)于這幅圖像的信息，如圖像的寬度和高度(以像素為單位)；色表中有圖像顏色的RGB值。對顯示卡來說，如果它不能一次顯示超過256種顏色，則讀取和顯示.BMP文件的程序能夠把這些RGB值轉(zhuǎn)換到顯示卡的調(diào)色板來產(chǎn)生準(zhǔn)確的顏色。

BMP文件的位圖數(shù)據(jù)格式依賴于編碼每個像素顏色所用的位數(shù)。對于一個256色的圖像來說，每個像素占用文件中位圖數(shù)據(jù)部分的一個字節(jié)。像素的值不是RGB顏色值，而是文件中色表的一個索引。所以，在色表中如果第一個R/G/B值是255/0/0，那么像素值為0表示它是鮮紅色。像素值按從左到右的順序存儲，通常從最后一行開始。所以，在一個256色的文件中，位圖數(shù)據(jù)中第一個字節(jié)就是圖像左下角的像素的顏色索引，第二個就是它右邊的那個像素的顏色索引。如果位圖數(shù)據(jù)中每行的字節(jié)數(shù)是奇數(shù)，則要在每行都加一個附加的字節(jié)來調(diào)整位圖數(shù)據(jù)邊界為16位的整數(shù)倍。并不是所有的BMP文件結(jié)構(gòu)都像上面所述的那樣，例如16?bpp和24?bpp文件就沒有色表；像素值直接表示RGB值，另外，文件私有部分的內(nèi)部存儲格式也是可以變化的。例如，在16和256色?.BMP文件中的位圖數(shù)據(jù)采用RLE算法來壓縮，這種算法用顏色加像素個數(shù)來取代一串顏色相同的序列，而且，Windows還支持OS/2下的?.BMP文件，盡管它使用了不同的位圖信息頭和色表格式。

2．PCX文件

PCX是在PC上成為位圖文件存儲標(biāo)準(zhǔn)的第一種圖像文件格式。它最早出現(xiàn)在Zsoft公司的Paintbrush軟件包中，在20世紀(jì)80年代早期授權(quán)給微軟與其產(chǎn)品捆綁發(fā)行，而后轉(zhuǎn)變?yōu)镸icrosoftPaintbrush，并成為Windows的一部分。雖然使用這種格式的人在減少，但這種帶有?.PCX擴(kuò)展名的文件在今天仍是十分常見的。

PCX文件分為三部分：PCX文件頭、位圖數(shù)據(jù)和一個可選的色表。文件頭長達(dá)128個字節(jié)，分為幾個域，包括圖像的尺寸和每個像素顏色的編碼位數(shù)。位圖數(shù)據(jù)用一種簡單的RLE算法壓縮，最后的可選色表有256個RGB值。PCX格式最初是為CGA和EGA來設(shè)計(jì)的，后來經(jīng)過修改也支持VGA和真彩色顯示卡，現(xiàn)在PCX圖像可以用1?bpp、4?bpp、

8?bpp或24?pp來對顏色數(shù)據(jù)進(jìn)行編碼。

3．TIFF文件

PCX格式是所有位圖文件格式中最簡單的，而TIFF(TaggedImageFileFormat)則是最難的一種。

TIFF文件含有?.TIF的擴(kuò)展名。它以8字節(jié)長的圖像文件頭開始(IFH)，這個文件頭中最重要的成員是一個指向名為圖像文件目錄(IFD)的數(shù)據(jù)結(jié)構(gòu)的指針。

IFD是一個名為標(biāo)記(tag)的用于區(qū)分一個或多個可變長度數(shù)據(jù)塊的表，標(biāo)記中含有關(guān)于圖像的信息。TIFF文件格式定義70多種不同類型的標(biāo)記，有的用來存放以像素為單位的圖像寬度和高度，有的用來存放色表(如果需要的話)，當(dāng)然還必須有用來存放位圖數(shù)據(jù)的標(biāo)記。一個TIFF格式的文件完全由它的標(biāo)記所決定，而且這種文件結(jié)構(gòu)極易擴(kuò)展，因?yàn)樵谝郊右恍┨卣鲿r只需增加一些額外的標(biāo)記。究竟是什么使TIFF文件如此復(fù)雜？一方面，要編寫一種能夠識別所有不同標(biāo)記的軟件非常困難。大多數(shù)TIFF的閱讀程序只能識別一部分標(biāo)記，所以會出現(xiàn)這種情況：有時一個應(yīng)用程序創(chuàng)建的TIFF文件，另一個應(yīng)用程序卻不能使用。創(chuàng)建TIFF文件的程序還可能會在文件中加一些只有它自己認(rèn)識的標(biāo)記，雖然TIFF的閱讀程序可以跳過那些它們不認(rèn)得的標(biāo)記，但這樣做總是有可能影響到圖像的質(zhì)量。另一方面，一個TIFF文件可以包含多個圖像，每個圖像都有自己的IFD和一系列標(biāo)記。TIFF文件中的位圖數(shù)據(jù)可能會用好幾種方法來壓縮，所以一個完備的TIFF閱讀程序應(yīng)該有RLE解壓縮程序、LZW解壓縮程序和其他一些算法的解壓縮程序。然而更糟的是，使用LZW的解碼必須得到Unisys公司的同意，且通常是需要付版稅的。所以，即使是一些相當(dāng)不錯的TIFF閱讀程序，在它們遇到LZW算法壓縮的圖像時也是無能為力的。

盡管TIFF是那么的復(fù)雜，但仍是一種最好的跨平臺格式。因?yàn)樗浅ｌ`活，無論在視覺上還是其他方面，都能把任何圖像編碼成二進(jìn)制形式而不丟失任何屬性。

4．GIF文件

當(dāng)許多圖像方面的權(quán)威一想到LZW的時候，他們也會想到GIF(GraphicsInterchangeFormat)，這是一種常用的跨平臺的位圖文件格式，最初為CompuServe公司所創(chuàng)。GIF文件通常帶有?.GIF的擴(kuò)展名，而且在CompuSeve上大量存在。

GIF文件的結(jié)構(gòu)取決于它屬于哪一個版本，目前的兩種版本分別是GIF87a和GIF89a，前者較簡單。無論是哪個版本，它都以一個長13字節(jié)的文件頭開始，文件頭中包含判定此文件是?GIF文件的標(biāo)記、版本號和其他一些信息。如果這個文件只有一幅圖像，則文件頭后緊跟一個全局色表來定義圖像中的顏色。如果含有多幅圖像(GIF和TIFF格式一樣，允許在一個文件里編碼多個圖像)，那么全局色表就被各個圖像自帶的局部色表所替代。在GIF87a文件中，文件頭和全局色表之后是圖像，它可能會是頭尾相接的一串圖像中的第一個。每個圖像由三部分組成：一個10字節(jié)長的圖像描述，一個可選的局部色表和位圖數(shù)據(jù)。為有效利用空間，位圖數(shù)據(jù)用LZW算法來壓縮。

GIF89a結(jié)構(gòu)與GIF87a類似，但它還包括可選的擴(kuò)展塊用來存放每個圖像的附加信息。GIF89a詳細(xì)定義了四種擴(kuò)展塊：圖像控制擴(kuò)展塊，用來描述圖像怎樣被顯示(例如，顯示是應(yīng)該像一個透明物去覆蓋上一個圖像，還是簡單地替換它)；簡單文本擴(kuò)展塊，包含顯示在圖像中的文本；注釋擴(kuò)展塊，以ASCII文本形式存放注釋；應(yīng)用擴(kuò)展塊，存放生成該文件的應(yīng)用程序的私有數(shù)據(jù)。這些擴(kuò)展塊可以出現(xiàn)在文件中全局色表的任何地方。

GIF最顯著的優(yōu)點(diǎn)是：使用廣泛和緊密性。但它有兩個弱點(diǎn)：一個是用GIF格式存放的文件最多只能含有256種顏色；另一個可能更重要，就是那些使用了GIF格式的軟件開發(fā)者必須征得CompuServe的同意，他們每賣出一個拷貝都要向CompuServe付版稅。這個政策是CompuServe仿效Unisys公司做出的，它抑制了那些程序員在其圖像應(yīng)用程序中支持GIF文件。

5．PNG文件

PNG(PortableNetworkGraphic，發(fā)音做ping)文件格式是作為GIF的替代品開發(fā)的，它能夠避免使用GIF文件所遇到的常見問題。它從GIF那里繼承了許多特征，而且支持真彩色圖像。更重要的是，在壓縮位圖數(shù)據(jù)時，它采用了一種頗受好評的LZ77算法的一個變種，LZ77則是LZW的前身，而且可以免費(fèi)使用。由于篇幅所限，在這里就不花時間來具體討論P(yáng)NG格式了。

6．JPEG文件

JPEG文件格式最初由C-CubeMicrosystems推出，是為了提供一種存儲深度位像素的有效方法，例如對于照片掃描，其顏色很多而且差別細(xì)微(有時也不細(xì)微)。JPEG使用一種有損壓縮算法，有損壓縮雖然犧牲了一部分的圖像數(shù)據(jù)(但這種損失很小以至于人們很難察覺)，但可以得到較高的壓縮率。無損壓縮算法能在解壓后準(zhǔn)確再現(xiàn)壓縮前的圖像，但壓縮率較低。

JPEG圖像壓縮是一個復(fù)雜的過程，經(jīng)常需要專門的硬件來支持。首先，圖像以像素為單位分成8×8的塊。然后，每個塊分三個步驟被壓縮：第一步使用DCT(DiscreteCosineTransform)離散余弦變換把8×8的像素矩陣變成8×8的頻率(也就是顏色改變的速度)矩陣；第二步對頻率矩陣中的值用量化矩陣進(jìn)行量化，濾掉那些總體上對圖像不重要的部分；第三步，也就是最后一步，對量化后的頻率矩陣使用無損壓縮。因?yàn)楸涣炕蟮念l率矩陣缺了許多高頻信息，所以通常能被壓縮到一半甚至更少。

無損壓縮一般不能壓縮真正的照片圖像，所以50%的壓縮率已是相當(dāng)不錯了。但另一方面，無損壓縮能把一些圖像文件尺寸減少90%，這樣的圖像文件就不適合用JPEG來

壓縮。

JPEG的有損部分產(chǎn)生在第二步，量化矩陣的值越高，從圖像中丟掉的信息就越多，從而壓縮率就越高，同時圖像的質(zhì)量就越差。在JPEG壓縮時可以選擇一個量化因子，這個因子的值決定了量化矩陣中的數(shù)值。理想的量化因子要在壓縮率和圖像質(zhì)量間達(dá)到平衡，所以對不同的圖像要選擇不同的量化因子，通常要經(jīng)過若干次嘗試后方可確定。

7．PSD、PDD文件

PSD、PDD是PhotoShop的專用圖像文件格式。

8．EPS文件

CorelDraw、FreeHand等軟件均支持EPS格式，它屬于矢量圖格式，輸出質(zhì)量非常高。

9．Targa文件

Targa文件格式簡稱TGA格式，是由Truevision公司設(shè)計(jì)的，可支持任意大小的圖像。專業(yè)圖形用戶經(jīng)常使用TGA點(diǎn)陣格式來保存具有真實(shí)感的三維有光源圖像。

10．WMF文件

WMF文件只使用在Windows中，它實(shí)際上保存的不是點(diǎn)陣信息，而是函數(shù)調(diào)用信息。它將圖像保存為一系列GDI(圖形設(shè)備接口)的函數(shù)調(diào)用，在恢復(fù)時，應(yīng)用程序執(zhí)行源文件(即執(zhí)行一個個函數(shù)調(diào)用)，在輸出設(shè)備上畫出圖像。WMF文件具有設(shè)備無關(guān)性、文件結(jié)構(gòu)好等特點(diǎn)，但是解碼復(fù)雜，其效率比較低。

隨著計(jì)算機(jī)技術(shù)的繼續(xù)發(fā)展，圖形圖像文件將不斷地改進(jìn)、完善，將來必定會出現(xiàn)更好的、效率更高的圖形圖像文件。2.3.2音頻文件格式

音頻文件通常分為兩類：聲音文件和MIDI文件。聲音文件指的是通過聲音錄入設(shè)備錄制的原始聲音，直接記錄了真實(shí)聲音的二進(jìn)制采樣數(shù)據(jù)，通常文件較大；而MIDI文件則是一種音樂演奏指令序列，相當(dāng)于樂譜，可以利用聲音輸出設(shè)備或與計(jì)算機(jī)相連的電子樂器進(jìn)行演奏，由于不包含聲音數(shù)據(jù)，其文件尺寸較小。

1．聲音文件

數(shù)字音頻同CD音樂一樣，是將真實(shí)的數(shù)字信號保存起來，播放時通過聲卡將信號恢復(fù)成悅耳的聲音。然而，這樣存儲聲音信息所產(chǎn)生的聲音文件是相當(dāng)龐大的，因此，絕大多數(shù)聲音文件采用了不同的音頻壓縮算法，在基本保持聲音質(zhì)量不變的情況下盡可能獲得更小的文件。

1)?Wave文件——.WAV

Wave格式是Microsoft公司開發(fā)的一種聲音文件格式，它符合RIFF(ResourceInterchangeFileFormat)文件規(guī)范，用于保存Windows平臺的音頻信息資源，被Windows平臺及其應(yīng)用程序所廣泛支持。Wave格式支持MSADPCM、CCITTALaw、CCITTμLaw和其他壓縮算法，支持多種音頻位數(shù)、采樣頻率和聲道，是PC機(jī)上最為流行的聲音文件格式，但其文件尺寸較大，多用于存儲簡短的聲音片斷。

2)?AIFF文件——.AIF/.AIFF

AIFF是音頻交換文件格式(AudioInterchangeFileFormat)的英文縮寫，是蘋果公司開發(fā)的一種聲音文件格式，被Macintosh平臺及其應(yīng)用程序所支持，NetscapeNavigator瀏覽器中的LiveAudio也支持AIFF格式，SGI及其他專業(yè)音頻軟件包也同樣支持這種格式。AIFF支持ACE2、ACE8、MAC3和MAC6壓縮，支持16位44.1?kHz立體聲。

3)?Audio文件——.AU

Audio文件是SunMicrosystems公司推出的一種經(jīng)過壓縮的數(shù)字聲音格式，是Internet中常用的聲音文件格式，NetscapeNavigator瀏覽器中的LiveAudio也支持Audio格式的聲音文件。

4)?Sound文件——.SND

Sound文件是NextComputer公司推出的數(shù)字聲音文件格式，支持壓縮。

5)?Voice文件——.VOC

Voice文件是CreativeLabs(創(chuàng)新公司)開發(fā)的聲音文件格式，多用于保存CreativeSoundBlaster(創(chuàng)新聲霸)系列聲卡所采集的聲音數(shù)據(jù)，被Windows平臺和DOS平臺所支持，支持CCITTALaw和CCITTμLaw等壓縮算法。

6)?MPEG文件——.MP1/.MP2/.MP3

這里的MPEG文件格式指的是MPEG標(biāo)準(zhǔn)中的音頻部分，即MPEG音頻層(MPEGAudioLayer)。MPEG音頻文件的壓縮是一種有損壓縮，根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度的不同可分為三層(MPEGAudioLayer1/2/3)，分別對應(yīng)MP1、MP2和MP3這三種聲音文件。MPEG音頻編碼具有很高的壓縮率，MP1和MP2的壓縮率分別為4∶1和6∶1～8∶1，而MP3的壓縮率則高達(dá)10∶1～12∶1。也就是說，一分鐘CD音質(zhì)的音樂，未經(jīng)壓縮需要10?MB存儲空間，而經(jīng)過MP3壓縮編碼后只有1?MB左右，同時其音質(zhì)基本保持不失真。因此，目前使用最多的是MP3文件格式。

7)?RealAudio文件——.RA/.RM/.RAM

RealAudio文件是RealNetworks公司開發(fā)的一種新型流式音頻(StreamingAudio)文件格式，它包含在RealNetworks公司所制定的音頻、視頻壓縮規(guī)范RealMedia中，主要用于在低速率的廣域網(wǎng)上實(shí)時傳輸音頻信息。網(wǎng)絡(luò)連接速率不同，則客戶端所獲得的聲音質(zhì)量也不盡相同：對于14.4?Kb/s的網(wǎng)絡(luò)連接，可獲得調(diào)幅(AM)質(zhì)量的音質(zhì)；對于28.8?Kb/s的連接，可以達(dá)到廣播級的聲音質(zhì)量；如果擁有ISDN或更快的線路連接，則可獲得CD音質(zhì)的聲音。

2．MIDI文件——.MID/.RMI

MIDI是樂器數(shù)字接口(MusicalInstrumentDigitalInterface)的英文縮寫，是數(shù)字音樂/電子合成樂器的統(tǒng)一國際標(biāo)準(zhǔn)。它定義了計(jì)算機(jī)音樂程序、合成器及其他電子設(shè)備交換音樂信號的方式，還規(guī)定了不同廠家的電子樂器與計(jì)算機(jī)連接的電纜和硬件及設(shè)備間數(shù)據(jù)傳輸?shù)膮f(xié)議，可用于為不同樂器創(chuàng)建數(shù)字聲音，可以模擬大提琴、小提琴、鋼琴等常見樂

器。在MIDI文件中，只包含產(chǎn)生某種聲音的指令，這些指令包括使用什么MIDI設(shè)備的音色、聲音的強(qiáng)弱、聲音持續(xù)多長時間等，計(jì)算機(jī)將這些指令發(fā)送給聲卡，聲卡按照指令

將聲音合成出來，MIDI聲音在重放時可以有不同的效果，這取決于音樂合成器的質(zhì)量。相對于保存真實(shí)采樣數(shù)據(jù)的聲音文件，MIDI文件顯得更加緊湊，其文件通常比聲音文件小

得多。

3．模塊文件——.MOD/.S3M/.XM/.MTM/.FAR

/.KAR/.IT

模塊(Module)格式是一種已經(jīng)存在了很長時間的聲音記錄方式，它同時具有MIDI與數(shù)字音頻的共同特性。模塊文件中既包括如何演奏樂器的指令，又

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《多媒體軟件設(shè)計(jì)技術(shù)》課件第2章

文檔簡介

溫馨提示

最新文檔

評論

《多媒體軟件設(shè)計(jì)技術(shù)》課件第2章

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔