




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2.1多媒體應(yīng)用開發(fā)技術(shù)2.2多媒體技術(shù)標(biāo)準(zhǔn)2.3常見的多媒體文件格式本章小結(jié)練習(xí)二2.1.1數(shù)字圖像和圖像技術(shù)
人們通常認(rèn)為,圖形和圖像是沒有什么區(qū)別的。但在計(jì)算機(jī)處理領(lǐng)域,它們是兩個既有本質(zhì)區(qū)別又有密切聯(lián)系的概念。從本質(zhì)上講,圖形和圖像是計(jì)算機(jī)對處理對象的不同描述方式,它們分別有各自的特點(diǎn)和適用范圍,在一定的條件下也可以相互轉(zhuǎn)化。區(qū)別圖形和圖像的概念,深刻理解其內(nèi)在的聯(lián)系,對圖形和圖像的計(jì)算機(jī)處理和各種文件格式之間的轉(zhuǎn)化有著重要的意義。2.1多媒體應(yīng)用開發(fā)技術(shù)
1.圖形和圖像的區(qū)別
圖形是指由外部輪廓線條構(gòu)成的矢量圖,一般指用計(jì)算機(jī)繪制(draw)的畫面,如直線、圓、圓弧、矩形、任意曲線和圖表等,有時還要使用實(shí)心或有等級變化和色彩填充的區(qū)域,如CorelDraw產(chǎn)生的CDR文件,以及AutoCAD產(chǎn)生的DWG、DXF文件。矢量圖的特點(diǎn)是:通常文件量較小,描述的對象可以任意縮放而不會失真,從根本上講,它是由數(shù)學(xué)坐標(biāo)和公式來描述的,但一般只能描述輪廓不是非常復(fù)雜、色彩不是很豐富的對象,如幾何圖形、工程圖紙等,否則文件量將變得很大,而效果卻不理想。矢量圖形用一組指令集合來描述圖形的內(nèi)容,如圖2-1所示。這些指令用來描述構(gòu)成該圖形的所有直線、圓、圓弧、矩形、曲線等圖元的位置、維數(shù)和形狀。在屏幕上顯示矢量圖形時,要有專門的軟件將描述圖形的指令轉(zhuǎn)換成在屏幕上顯示的形狀和顏色。用于產(chǎn)生和編輯矢量圖形的程序通常稱為Draw程序,這種程序可以產(chǎn)生和操作矢量圖形的各個成分,并能對矢量圖形進(jìn)行移動、縮放、旋轉(zhuǎn)和扭曲等變換,使用矢量圖形的一個很大優(yōu)點(diǎn)就是容易進(jìn)行這類變換。但是,用矢量圖形格式表示復(fù)雜圖像(如人物或風(fēng)景照片)的開銷太大,因此矢量圖形主要用于表示線框型的圖畫、工程制圖、美術(shù)字等。絕大多數(shù)CAD和3D造型軟件使用矢量圖形作為基本的圖形存儲格式。
圖像是指由攝像機(jī)或掃描儀等輸入設(shè)備捕捉實(shí)際場景畫面而產(chǎn)生的數(shù)字圖像,并存儲在計(jì)算機(jī)中的數(shù)字信息。它是由許多點(diǎn)陣而構(gòu)成的點(diǎn)位圖,用以描述圖像中各像素點(diǎn)的強(qiáng)度與顏色(其在特定的領(lǐng)域有時也稱光柵圖),如Windows畫筆所產(chǎn)生的bmp。它的特點(diǎn)是:文件存儲量較大,所描述的對象會因?yàn)榭s放而損失細(xì)節(jié)或產(chǎn)生“鋸齒”。它本質(zhì)上是將對象以一定的分辨率分解后,再將每一個點(diǎn)的色彩信息進(jìn)行數(shù)字化描述。圖2-1圖形文件格式點(diǎn)位圖適合于表現(xiàn)含有大量細(xì)節(jié)(如明暗變化、復(fù)雜的場景和輪廓、色彩非常豐富等)的畫面,如照片、繪畫,并可直接、快速地在屏幕上顯示出來。點(diǎn)位圖占用存儲空間較大,一般需要進(jìn)行數(shù)據(jù)壓縮。為了便于位圖的存儲和交流,產(chǎn)生了種類繁多的圖像文件格式,常見的有PCX、BMP、DIB、PIC、GIF、TGA、JPG和TIFF等。
圖像的重要參數(shù)是色彩深度和分辨率,它們直接影響位圖的顯示質(zhì)量。位圖中每點(diǎn)的色彩深度可分為二色、灰度、256色、真彩等格式。如果用若干位表示位圖中像素的顏色信息,則這些位的個數(shù)就稱為色彩深度。深度為1的圖像只能有兩種顏色(通常為黑色和白色,但也可以是另外兩種色調(diào)或顏色),通常稱為單色圖像。深度為4的圖像可以有16種顏色,深度為8的圖像可表示256種顏色。配備標(biāo)準(zhǔn)VGA顯示的普通微機(jī)在640×480分辨率下可顯示16種顏色的位圖圖像,在320×200分辨率下可顯示256種顏色;SuperVGA卡可支持在1024×768(甚至更高)分辨率下顯示256種顏色,一些高檔顯示卡在640×480分辨率下支持24位16772216種顏色的真彩色顯示。
分辨率有屏幕分辨率、圖像分辨率及像素分辨率三個不同概念。屏幕分辨率是顯示屏幕上的最大顯示區(qū)域,即水平與垂直方向的像素個數(shù)。屏幕分辨率與顯示模式有關(guān),例如,標(biāo)準(zhǔn)VGA圖形卡的最高屏幕分辨率為640像素(水平)×480像素(垂直)。圖像分辨率指數(shù)字圖像的尺寸,即水平與垂直方向的像素個數(shù)。圖像分辨率與屏幕分辨率可能不同,例如,若圖像分辨率為320×240,屏幕分辨率為640×480,則該圖像在屏幕上顯示時只占據(jù)屏幕的1/4。圖像分辨率與屏幕分辨率相同時,顯示的圖像正好占滿整個屏幕區(qū)域;圖像分辨率大于屏幕分辨率時,屏幕上只能顯示出圖像的一部分。位圖圖像所需的存儲空間可用下面的公式計(jì)算:其中,高度和寬度分別是圖像垂直和水平方向上的像素個數(shù);深度是存儲圖像像素點(diǎn)顏色信息的位數(shù)。例如,一幅640×480的256色原始圖像(未壓縮)的數(shù)據(jù)量為:(640像素×480像素×8位)/8=307200個字節(jié)。通過輸入設(shè)備得到的圖像一般需要進(jìn)行編輯、加工處理,才能成為合乎需要的圖像文件。多數(shù)圖像編輯軟件(如PaintBrush、PhotoStyler和DrawPerfect等)都能對位圖文件及相應(yīng)的調(diào)色板文件進(jìn)行常規(guī)性加工和編輯,這些軟件的功能和使用方法基本相同。一些圖像處理軟件(如CorelDraw或PhotoShop等)可進(jìn)行更復(fù)雜的處理(如圖像濾波、特技效果、進(jìn)行有損壓縮等),適當(dāng)使用可得到更清晰的圖像或使圖像具有某種特殊效果。
多媒體應(yīng)用中所需的數(shù)字圖像可以通過多種途徑獲得,如直接購置存儲在CD-ROM光盤、磁盤或磁帶上的數(shù)字化圖像庫;利用圖像編輯軟件自行創(chuàng)建;利用彩色掃描儀將照片或藝術(shù)作品掃描后得到數(shù)字圖像;利用攝像機(jī)捕獲實(shí)時圖像等。
2.圖形和圖像的轉(zhuǎn)化
圖形和圖像在一定的條件下是可以轉(zhuǎn)化的。這種轉(zhuǎn)化可以從兩個方面來說明:第一是對象和輸入/輸出設(shè)備之間的硬轉(zhuǎn)化;第二是對象文件格式之間的軟轉(zhuǎn)化。
1)圖形和圖像的硬轉(zhuǎn)化
我們先來分析對象的輸入過程。比如,我們有一張工程圖紙,一般認(rèn)為它是圖形,其實(shí),在它被輸入計(jì)算機(jī)以前還不能稱它為圖形或圖像,當(dāng)用掃描儀將它輸入Photoshop后,它就變成圖像信息了(因?yàn)檫@時是點(diǎn)位圖);當(dāng)用數(shù)字化儀將它輸入到AutoCAD后,它就變成圖形信息了(因?yàn)檫@時是向量圖)。也就是說,同一個對象既可以被作為圖形處理,也可以被作為圖像處理。到底哪種過程更有效,要看被處理的對象性質(zhì)和要達(dá)到的處理結(jié)果,以上的工程圖紙應(yīng)作為圖形處理更合理。當(dāng)然,我們可以先將工程圖紙用掃描儀掃進(jìn)計(jì)算機(jī),變成圖像信息,再用一定的軟件(如CorelTrace和PhotoShop的輪廓跟蹤)人工或自動地勾勒出它的輪廓,這個過程稱為向量化(也就是圖像轉(zhuǎn)化為圖形的過程)。這個過程必然會丟失許多細(xì)節(jié),所以通常適用于工程繪圖領(lǐng)域。如果我們手頭拿著一張照片,顯然,用掃描儀把它輸入計(jì)算機(jī)作為圖像處理比較合適,當(dāng)然,我們也不反對你一定要用數(shù)字化儀來一點(diǎn)點(diǎn)輸入這張照片,但事實(shí)上這幾乎不可能,除非你只想得到它的大致輪廓。下面再來分析對象的輸出過程。假設(shè)我們用AutoCAD作好了一張圖,較合理的方法是用繪圖機(jī)將它輸出,但是也可以用打印機(jī)將它輸出,這時計(jì)算機(jī)必須先將圖形(向量圖)轉(zhuǎn)化為打印機(jī)的掃描線,這個過程稱為光柵化(點(diǎn)陣化),從本質(zhì)上講,這是圖形轉(zhuǎn)化為圖像的過程。再假設(shè)我們用Photoshop作好一張圖,較合理的方法是用打印機(jī)將它輸出,這樣可以得到較多的層次和細(xì)節(jié),如果一定要用繪圖機(jī)輸出,就必然會丟失許多圖像的細(xì)節(jié)。
2)圖形和圖像的軟轉(zhuǎn)化
了解了以上對象和輸入/輸出設(shè)備之間的硬轉(zhuǎn)化,就比較容易理解具體應(yīng)用軟件中的對象文件格式之間的轉(zhuǎn)化。像CorelDraw,它幾乎提供了所有文件格式之間的轉(zhuǎn)化。但千萬不要認(rèn)為,可以轉(zhuǎn)化就可以隨意互換,事實(shí)上許多轉(zhuǎn)化是不可逆的,轉(zhuǎn)化的次數(shù)越多,丟失的信息就越多,特別是在圖形和圖像之間的轉(zhuǎn)化。比如有一個BMP的圖像文件,當(dāng)我們將它轉(zhuǎn)化為GIF、TIFF等格式的時候問題還不大,但如果將它轉(zhuǎn)化為DXF等格式時就丟失了許多的細(xì)節(jié),甚至像一個方塊中間的填充色塊,都將用幾根線條來代替。另一方面,將一個AutoCAD的DWG文件轉(zhuǎn)化為DXF的時候問題還不大,但如果將它轉(zhuǎn)化為BMP、TIFF、GIF的時候,就要注意幾個非常重要的參數(shù),一個是分辨率,另一個是色彩數(shù)。這兩個參數(shù)決定了最終圖像文件的大小和它的使用價值。隨著圖形和圖像處理技術(shù)的發(fā)展,也出現(xiàn)了一些非常著名而優(yōu)秀的文件格式,如Adobe公司的EPS格式,它就是一種兼并圖形和圖像的各自優(yōu)點(diǎn)的文件格式;另外像PDF格式,它看似圖像文件,但它可以被解釋為不同的分辨率。總之,各種不同的文件格式從本質(zhì)上講,是在對不同性質(zhì)的處理對象或同一對象的不同處理側(cè)重采用一種最為科學(xué)合理和方便的描述方法。我們應(yīng)該根據(jù)自己的處理對象的特點(diǎn)來選擇(或?qū)⑵滢D(zhuǎn)化為)相應(yīng)的文件格式,以及選擇相應(yīng)的輸入/輸出設(shè)備。2.1.2多媒體數(shù)字音頻技術(shù)
多媒體數(shù)字音頻包括波形音頻和MIDI(樂器數(shù)字接口,如圖2-2所示)。波形音頻一般用來重現(xiàn)語言和其他音樂聲音。要在電腦中得到波形音頻數(shù)據(jù),必須用一個A/D轉(zhuǎn)換器把模擬音頻信號轉(zhuǎn)換成數(shù)字音頻信號,因此,波型音頻需要大量存儲空間來真實(shí)地重現(xiàn)聲音。而MIDI是由符號來表示音樂聲音的,所以它對存儲空間的要求要比波形音頻少幾個數(shù)
量級,并且允許更大的編輯靈活性。它的聲音質(zhì)量主要與合成器有關(guān),而與MIDI數(shù)據(jù)本身無關(guān)。圖2-2MIDI播放器多媒體技術(shù)中的一種重要媒體來自音頻,包括語音、音響和音樂。音頻的作用是直接通過講話表達(dá)信息,制造某種效果和氣氛,演奏樂曲等。
音頻技術(shù)發(fā)展比較成熟,其商品化產(chǎn)品(如數(shù)字音響)已投入使用。音頻技術(shù)主要包括數(shù)字化及語音處理、合成、識別等方面。音頻數(shù)字化是目前比較成熟的技術(shù),數(shù)字音響和多媒體聲卡都是利用這項(xiàng)技術(shù)設(shè)計(jì)的。數(shù)字音響由于采用了數(shù)字化音頻,因而獲得了非常理想的聲響效果,迅速取代了傳統(tǒng)模擬方式的音響。音頻數(shù)字化就是將模擬的(連續(xù)的)聲音波形數(shù)字化(離散化),以便利用數(shù)字計(jì)算機(jī)進(jìn)行處理的過程,其主要包括采樣和量化兩個方面。相應(yīng)地,數(shù)字化音頻的質(zhì)量取決于采樣頻率和量化位數(shù)這兩個重要參數(shù)。采樣頻率是指對聲音波形每秒進(jìn)行采樣的次數(shù)。人耳聽覺的頻率上限在20?kHz左右,根據(jù)采樣理論,為了保證聲音不失真,采樣頻率應(yīng)在40?kHz左右。經(jīng)常使用的采樣頻率有11.025?kHz、22.05?kHz和44.l?kHz等。采樣頻率應(yīng)在40?kHz左右。經(jīng)常使用的采樣頻率有11.025?kHz、22.05?kHz和44.l?kHz等。采樣頻率越高,聲音失真越小,音頻數(shù)據(jù)量越大。量化數(shù)據(jù)位數(shù)(也稱量化級)是每個采樣點(diǎn)能夠表示的數(shù)據(jù)范圍,經(jīng)常采用的有8位、12位和16位。例如,8位量化級表示每個采樣點(diǎn)可以表示256個
(0~255)不同量化值,而16位量化級則可表示65536個不同量化值。量化位數(shù)越高,音質(zhì)越好,數(shù)據(jù)量也越大。音頻數(shù)字化的采樣頻率和量化級越高,結(jié)果越接近原始聲音,但記錄數(shù)字聲音所需的存儲空間也隨之增加。可以用下面的公式估算聲音數(shù)字化后每秒所需的存儲量(假定不經(jīng)壓縮):若采用雙聲道錄音,則存儲量再增加一倍。例如,數(shù)字激光唱盤(CD-DA,紅皮書標(biāo)準(zhǔn))的標(biāo)準(zhǔn)采樣頻率為44.1?kHz,量化位數(shù)為16位立體聲,可以幾乎無失真地播出頻率高達(dá)22?kHz的聲音,這也是人類所能聽到的最高頻率聲音。激光唱盤播放一分鐘音樂需要的存儲量為反映音頻數(shù)字化質(zhì)量的另一個因素是通道(或聲道)個數(shù)。記錄聲音時,如果每次生成一個聲波數(shù)據(jù),則稱為單聲道;每次生成兩個聲波數(shù)據(jù),則稱為立體聲(雙聲道),立體聲更能反映人的聽覺感受。
除了上述因素外,音頻數(shù)字化的質(zhì)量還受其他一些因素(如揚(yáng)聲器的質(zhì)量等)的影響。
數(shù)字音頻數(shù)據(jù)的獲取可以通過多種途徑來實(shí)現(xiàn),如利用市場上已有的數(shù)字式音樂或音響產(chǎn)品,自己錄制,需高質(zhì)量音頻時可租用專門的錄音設(shè)備進(jìn)行錄制。原始音頻數(shù)據(jù)一般需進(jìn)行編輯加工后才能使用,通過編輯可以實(shí)現(xiàn)各種聲音混合以及消除或降低聲音中的畸變等。一般的音頻編輯軟件(如WaveEdit等)都具有設(shè)置音量、漸強(qiáng)漸弱處理及多通道的混合等常用功能。多媒體應(yīng)用中音頻數(shù)據(jù)的另一個重要來源是樂器數(shù)字接口(MIDI,MusicalInstrumentDigitalInterface)文件。國際電子樂器生產(chǎn)廠家達(dá)成有關(guān)協(xié)議,并于1988年正式提交給MIDI制造商協(xié)會,使MIDI成為數(shù)字音樂的一個國際標(biāo)準(zhǔn)。MIDI標(biāo)準(zhǔn)規(guī)定了電子樂器與計(jì)算機(jī)連接的電纜硬件以及電子樂器之間、樂器與計(jì)算機(jī)之間傳送數(shù)據(jù)的通信協(xié)議等規(guī)范。MIDI標(biāo)準(zhǔn)使不同廠家生產(chǎn)的電子合成樂器可以互相發(fā)送和接收音樂數(shù)據(jù)。隨著MIDI標(biāo)準(zhǔn)的施行,計(jì)算機(jī)成為電子合成樂器間的控制環(huán)節(jié),市場上出現(xiàn)了大量可進(jìn)行記錄、存儲、編輯和播放樂譜(音符表或音符序列)的計(jì)算機(jī)軟件。使用高級語言(如C、Basic或Fortran)編程,根據(jù)特定的作曲算法也可生成ASCII樂譜,并翻譯為在合成器上進(jìn)行演奏的序列文件。音頻處理主要集中在音頻壓縮上,最新的語音壓縮算法可將原始聲音數(shù)據(jù)壓縮為原數(shù)據(jù)量的1/6~1/8。語音合成是指將普通正文合成為語音,國內(nèi)外一些語音合成系統(tǒng)的水平已達(dá)到實(shí)用階段,特別是漢語語音合成研究近年來有了突飛猛進(jìn)的發(fā)展。音頻技術(shù)中難度最大、最具應(yīng)用前景的當(dāng)屬語音識別。語音識別目前仍處于實(shí)驗(yàn)研究階段,雖有少量產(chǎn)品問世,但距實(shí)用尚有一定的距離。然而,其潛在的商業(yè)應(yīng)用前景使之成為音頻技術(shù)研究關(guān)注的熱點(diǎn)之一。2.1.3多媒體數(shù)字視頻技術(shù)
多媒體數(shù)字視頻技術(shù)(如圖2-3所示)的發(fā)展歷史雖然不長,但應(yīng)用范圍已經(jīng)非常廣泛,與最新的MPEG壓縮技術(shù)相結(jié)合的家電—計(jì)算機(jī)一體化產(chǎn)品已受到空前的重視并已迅速進(jìn)入市場。世界各地使用的視頻標(biāo)準(zhǔn)不完全相同,主要有NTSC和PAL兩種標(biāo)準(zhǔn)(或制式)。美國、加拿大和日本等國使用NTSC標(biāo)準(zhǔn),NTSC標(biāo)準(zhǔn)為30幀每秒,525行每幀。我國及歐洲大部分國家采用PAL制式,PAL標(biāo)準(zhǔn)為25幀每秒,625行每幀。圖2-3多媒體視頻技術(shù)多媒體數(shù)字視頻技術(shù)包括視頻信號數(shù)字化和視頻編碼兩個方面。與音頻數(shù)字化一樣,視頻信號數(shù)字化的目的是將模擬視頻信號經(jīng)模數(shù)轉(zhuǎn)換和彩色空間變換等過程,轉(zhuǎn)換成數(shù)字計(jì)算機(jī)可以顯示和處理的數(shù)字信號。視頻編碼是將數(shù)字化視頻信號經(jīng)編碼成為電視信號,從而可以錄制到錄像帶上或在電視上播放。對于不同的應(yīng)用環(huán)境有不同的技術(shù)可以采用,從低檔的游戲機(jī)到電視臺廣播級的視頻編碼技術(shù),均已基本成熟。視頻技術(shù)的最近發(fā)展趨勢之一是與多媒體計(jì)算機(jī)密切相關(guān)的高清晰度電視(HDTV)。2.1.4多媒體動畫技術(shù)
動畫提供了靜態(tài)圖形缺少的瞬間交叉的運(yùn)動景象,是一種可感覺到運(yùn)動的相對時間、位置、方向和速度的動態(tài)媒體。
動畫(如圖2-4所示)不僅具有電影的優(yōu)美、寫實(shí)、大眾化的效果,而且可以把人們的視覺引向一些客觀不存在或者難以實(shí)現(xiàn)的世界中。傳統(tǒng)動畫的制作過程相當(dāng)復(fù)雜,諸如規(guī)劃,設(shè)計(jì)故事情節(jié),設(shè)計(jì)場景和演員動作,設(shè)計(jì)語言蹤跡,設(shè)計(jì)關(guān)鍵畫幀和中間畫幀,復(fù)制到色片上,最后描線、上色、檢查、編輯,整個過程消耗的人力、物力和資金往往是很驚人的。圖2-4多媒體動畫電腦動畫已有30多年的歷史,早期由于軟/硬件水平的限制而進(jìn)展緩慢。動畫的創(chuàng)作方法是基于數(shù)學(xué)公式的,由某種算法產(chǎn)生一系列作品。目前主要通過計(jì)算機(jī)軟件,為動畫創(chuàng)作提供一個人機(jī)交互的環(huán)境。基于知識的動畫創(chuàng)作系統(tǒng)也已問世,它能代替人的部分低層次的有規(guī)律的思維。本質(zhì)上,動畫創(chuàng)作是一種形象思維活動,對形象思維的研究將從理論上為動畫創(chuàng)作提供一種清晰的模型。目前的動畫創(chuàng)作環(huán)境可以制作水平較高的動畫片,如美國電影《侏羅紀(jì)公園》(JurassicPark)就是因?yàn)檫\(yùn)用了大量的電腦動畫而創(chuàng)造了空前的票房紀(jì)錄。電腦動畫的硬件環(huán)境主要由高性能計(jì)算機(jī)(加圖形卡等選件)及輸入/輸出設(shè)備組成。常用的輸入設(shè)備有掃描儀和攝像機(jī),輸出設(shè)備視載體而定,載體有錄像帶、光盤及膠片等。電腦動畫制作采用一行一行編程的方法是不可取的,購買一套動畫電腦軟件是事半功倍的好辦法。針對不同的機(jī)型,可以選擇不同的軟件,如Wavefront、Alias、Softimages和3DStudio等動畫軟件。電腦動畫制作過程不同于傳統(tǒng)動畫制作。根據(jù)劇情需要,首先應(yīng)在計(jì)算機(jī)中生成一個真實(shí)的三維物體(選型),再對物體進(jìn)行光照著色(真實(shí)感設(shè)計(jì)),然后使物體動起來(動畫設(shè)置),最后對運(yùn)動物體進(jìn)行拍照以生成圖像(圖像生成),制成錄像帶。利用動畫軟件制作動畫,可采用直接在屏幕上交互設(shè)計(jì)和編程設(shè)計(jì)兩種方法。輸入設(shè)備掃描儀和攝像機(jī)的使用對具體造型幫助很大,有時這二者混合使用可使動畫制作更快、更好。利用動畫軟件本身提供的內(nèi)部語言或高級語言及與動畫軟件連接的接口來實(shí)現(xiàn)編程動畫設(shè)計(jì)已在科學(xué)計(jì)算可視化中得到較好的應(yīng)用。
電腦動畫的基礎(chǔ)是計(jì)算機(jī)圖形學(xué)中的三維造型和真實(shí)感顯示,同時綜合了圖形生成技術(shù)、運(yùn)動控制原理、視頻顯示技術(shù)、視覺生理學(xué)、生物學(xué)、機(jī)器人學(xué)、人工智能、物理和藝術(shù)等多個領(lǐng)域的理論和方法,為了成功創(chuàng)作動畫,需要掌握這些當(dāng)代先進(jìn)技術(shù)。目前,電腦動畫創(chuàng)作環(huán)境還只處于輔助動畫設(shè)計(jì)階段,它是一個訓(xùn)練有素的動畫師創(chuàng)作的輔助工具。電腦動畫的目標(biāo)是使一系列二維或三維物體組成的圖像幀連續(xù)變化,運(yùn)動控制完全自動化和智能化,最終與可視化技術(shù)、多媒體技術(shù)融合在一起。實(shí)現(xiàn)虛擬現(xiàn)實(shí)的境界是電腦動畫的發(fā)展方向。
目前,電腦動畫物體模型的建立(造型)一般采用曲面造型方法。非均勻有理B樣條曲面(NURBS)被認(rèn)為是目前最好的造型方法,它造型簡單方便,曲面間自動達(dá)到位置;切矢、曲率均連續(xù),不必特意拼接各部分,易于局部修改,不影響整體效果,具有高階導(dǎo)數(shù)等良好的數(shù)學(xué)性質(zhì),可以隨意表示大多數(shù)復(fù)雜的物體外形。具體造型時,靈活應(yīng)用軟件提供的外設(shè)輸入、編程和掌握創(chuàng)建屏幕上直接交互的造型技術(shù)是動畫師的基本功,如靈活應(yīng)用旋轉(zhuǎn)面、直紋面、邊界線定義的曲面、掃描面、n邊面、過渡面、曲面上繪曲線、曲面的交并差、裁剪曲面等工具。
物體模型是一種線框形式,只有通用光和色的渲染才能產(chǎn)生自然界中常見的真實(shí)物體,這在動畫中稱為真實(shí)感設(shè)計(jì)。真實(shí)感設(shè)計(jì)包括三方面內(nèi)容:光源、光照模型和表面質(zhì)感。光源有點(diǎn)源、線源、面光源、聚光燈、平行光、環(huán)境光以及霧、閃電、雷、雨等特殊效果,同時還要考慮光色、亮度、衰減規(guī)律、幾何特性等。光照模型除一般的反射、折射、透射外,還可分為局部光照模型、整體光照模型、光源模型。表面質(zhì)感也稱紋理,有顏色紋理和幾何紋理之別,它們可以使物體表面具有某種材料特性。電腦動畫軟件一般提供數(shù)十種紋理,有時還可形成多層紋理。
使靜止的物體產(chǎn)生運(yùn)動稱為動畫設(shè)置。運(yùn)動物體不僅表現(xiàn)為幾何位置改變,還帶來光、色、背景、受力、碰撞以及物體本身的形變。當(dāng)前使用的方法有關(guān)鍵幀法、運(yùn)動路徑法、物體變形法、運(yùn)動中心與物體局部動畫、動力學(xué)仿真、運(yùn)動學(xué)和反運(yùn)動模擬、光照模型、紋理的動畫以及動畫編輯。對于由骨骼帶動其他部分一起運(yùn)動的物體,如人、機(jī)器人、多節(jié)體的柔體,也是動畫設(shè)計(jì)中一個重要組成部分,這部分動畫設(shè)計(jì)的自動化程度可以達(dá)到較高水平。圖像生成有點(diǎn)類似于照相機(jī)的作用,對于制作動畫,同樣存在著推、拉、搖、移、變焦等過程。電腦動畫成像是經(jīng)過計(jì)算機(jī)計(jì)算物體表面的各種光效果來實(shí)現(xiàn)的。光線投影法只計(jì)算物體表面受到光源直接照射后一次產(chǎn)生的光的反射和透視,不計(jì)算光產(chǎn)生的折射現(xiàn)象,其特點(diǎn)是產(chǎn)生圖像的速度快,但質(zhì)量不高。光線跟蹤法是反向跟蹤光線的方法,它從視點(diǎn)(人眼,攝像機(jī))出發(fā),找到射入視點(diǎn)的各光線束,反向跟蹤每條射線,計(jì)算各交點(diǎn)的反射、折射和透視,直至射線離開場景或光束衰減到規(guī)定的強(qiáng)度以下。這里還要考慮場景的環(huán)境漫反射、光的漫反射、光的鏡面漫反射、光的規(guī)則透射、光的漫透射等多種現(xiàn)象。因此,它是一種計(jì)算量很大、生成圖像質(zhì)量很高的方法。
動畫已從一種純娛樂媒體發(fā)展成闡述人們想法的最有力的方法之一。電腦上的動畫制作軟件(如3DS)可使人們對其結(jié)果進(jìn)行大量控制(格式、顏色、照明光線和透視),而不必顧及實(shí)際自然規(guī)律。因此,用它可建立能精確說明問題的圖像。
目前電腦動畫主要用在電視電影動畫制作、電視廣告、輔助教學(xué)、飛行器模擬訓(xùn)練、指揮調(diào)度演習(xí)、工業(yè)實(shí)時控制仿真、模擬產(chǎn)品實(shí)驗(yàn)、醫(yī)療診斷、電子游戲等方面。2.1.5超文本與超媒體技術(shù)
超文本(Hypertext)思想的提出可以追溯到半個世紀(jì)以前,但真正實(shí)現(xiàn)并付之實(shí)用只是近幾年的事。目前,國外的一些大公司、大學(xué)和研究機(jī)構(gòu)推出了多種商品化超文本系統(tǒng),國內(nèi)的研究機(jī)構(gòu)和大學(xué)也研制出了幾種超文本系統(tǒng)并已投入運(yùn)行。通常我們閱讀小說時,是一頁一頁地往下讀,與之對應(yīng)的電子書籍,在計(jì)算機(jī)屏幕上也是一屏一屏往下讀,這是一種順序方式。如果我們要研究這部小說,或者讀的是百科全書、牛津大辭典、論文集等,顯然不能按照上述順序方式線性地往下讀。例如,某讀者看到作者名時,想查閱作者的國籍、專長、其他著作、研究成果、學(xué)術(shù)地位、主要觀點(diǎn)等;另一位讀者對作者比較了解,讀到作者名時只是一晃而過。上述讀書行為中有兩個重要特點(diǎn):其一是書中的信息(指一個名詞,一句話,一段文章等)有腳注,而且腳注中還可以有腳注,逐步深入;其二是讀書方式千差萬別,這種差別不僅表現(xiàn)在不同的讀者身上,還表現(xiàn)在同一讀者在不同時間讀同一本書上。用科學(xué)的觀點(diǎn)看,帶腳注的讀書方式更符合人類的思維方式,即聯(lián)想記憶的方式。為了說明超文本的思想,我們來做一個實(shí)驗(yàn),任務(wù)是在計(jì)算機(jī)中對一本書進(jìn)行腳注。方法是:第一步把書分成一些章節(jié),每個章節(jié)都有主題,為了便于查詢,需要賦予一些標(biāo)志;第二步把每個章節(jié)中需要腳注的信息點(diǎn)檢出來;第三步完成第二步中信息點(diǎn)的腳注,同時賦予標(biāo)志;第四步把腳注中的信息點(diǎn)檢出來,再做腳注,即重復(fù)第二步、第三步的工作,直至所有的信息點(diǎn)被注釋完畢;第五步編制一套程序,實(shí)現(xiàn)按讀者的需要進(jìn)行聯(lián)想閱讀。這樣組織起來的電子書籍,其讀書方式既可以順序讀,也可以聯(lián)想讀。也許甲讀者在讀到“太陽”一詞后其路徑是:太陽—星星—射電天文學(xué)—黑洞—愛因斯坦—法西斯……;乙讀者可能的途徑是:太陽—東方紅—毛澤東—長沙—白沙井……。同一本書對于讀者甲和乙,似乎變成完全不同的兩本書,而且這本書無所謂第一頁和最后一頁,存在的只是信息和信息之間的聯(lián)系,這種聯(lián)系是網(wǎng)絡(luò)狀的、非線性的,而不是我們常見的線性的、順序的。文本信息由線性、順序的發(fā)展為非線性、網(wǎng)絡(luò)型的,在習(xí)慣上被稱為超文本。在超文本系統(tǒng)中,前面所述第一步中的章節(jié)可以稱為結(jié)點(diǎn),第三步中的腳注也可以稱為結(jié)點(diǎn)。結(jié)點(diǎn)一般具有一個特定的主題,對于超文本中最簡單的情況——順序文本文件(小說),其結(jié)點(diǎn)可以是一個主題,一個章節(jié),也可以是一個頁面。結(jié)點(diǎn)在超文本中主要用來存儲信息,它是一個基本要素。
在超文本系統(tǒng)中,從結(jié)點(diǎn)中某個信息點(diǎn)查找某腳注是由鏈來完成的。鏈?zhǔn)浅谋局械诙€基本要素,鏈一般是有向的,它從源結(jié)點(diǎn)的內(nèi)部出發(fā)指向整個目標(biāo)結(jié)點(diǎn)。把一個超文本系統(tǒng)的結(jié)點(diǎn)和鏈繪制成一張圖,從數(shù)據(jù)結(jié)構(gòu)角度看它是一張有向圖,有時也稱其為網(wǎng)絡(luò)。讀者的讀書過程就是由源結(jié)點(diǎn)順著某個鏈遷移到另一個結(jié)點(diǎn)的過程,鏈?zhǔn)浅谋鞠到y(tǒng)的靈魂。
圖2-5是超文本網(wǎng)絡(luò)結(jié)構(gòu)示意圖,圖中共有a~f6個結(jié)點(diǎn)(頁面),帶箭頭的直線為超文本的鏈,它從結(jié)點(diǎn)內(nèi)部出發(fā),指向另一個結(jié)點(diǎn)。每個結(jié)點(diǎn)的出鍵和入鍵是不相同的。若結(jié)點(diǎn)出、入鍵數(shù)目總和為零,則該結(jié)點(diǎn)永遠(yuǎn)不能被訪問和使用,該結(jié)點(diǎn)也不屬于該超文本系統(tǒng)。若某結(jié)點(diǎn)只有出鍵,則它帶有頭的性質(zhì);若某結(jié)點(diǎn)只有入鍵,則它帶有尾和陷阱的性質(zhì);顯然在超文本系統(tǒng)中,還存在著回路的可能性,從語義角度看,這是一種循環(huán)腳注現(xiàn)象。圖2-5超文本網(wǎng)絡(luò)結(jié)構(gòu)示意圖文本信息由線性方式上升到網(wǎng)絡(luò)方式,其管理方式發(fā)生了根本的變化,超文本的名字也由此而來。超文本作為一種信息管理技術(shù),隨著信息種類的增加,如多媒體技術(shù)的發(fā)展,聲、像信息表示的引入,超文本名稱自然延伸為超媒體(Hypermedia)。在超媒體技術(shù)中,結(jié)點(diǎn)發(fā)展分為三大類:表現(xiàn)類(文本、圖形、圖像、聲音、視頻、混合、按鈕等)、組織類(目錄、索引)和推理類(對象、規(guī)則)。鏈也發(fā)展為三大類:基本結(jié)構(gòu)鏈(基本、交叉索引)、組織鏈(索引)和推理鏈(Is-a、Has-a,蘊(yùn)含、執(zhí)行)等。超媒體系統(tǒng)與一般的紙介質(zhì)文獻(xiàn)相比,其優(yōu)點(diǎn)是查詢速度快,結(jié)點(diǎn)信息由文本發(fā)展到聲音、圖像、動畫、視頻、計(jì)算機(jī)程序,結(jié)點(diǎn)和鏈的更新(印刷品是不能更新的),使之產(chǎn)生了新的組織結(jié)構(gòu)。當(dāng)超媒體網(wǎng)絡(luò)結(jié)點(diǎn)很多時,由于其使用的靈活性,會產(chǎn)生“迷路”現(xiàn)象(即用戶需要做某一事件,但找不到該事件結(jié)點(diǎn))。
1.超文本
超文本是一種新型的信息管理技術(shù),它以結(jié)點(diǎn)為單位組織信息,在結(jié)點(diǎn)與結(jié)點(diǎn)之間通過表示它們之間關(guān)系的鏈加以連接,構(gòu)成表達(dá)特定內(nèi)容的信息網(wǎng)絡(luò)。超文本組織信息的方式與人類的聯(lián)想記憶方式有相似之處,從而可以更有效地表達(dá)和處理信息。
使用Windows系統(tǒng)的讀者對其頗具特色的幫助系統(tǒng)一定有很深的印象,這個系統(tǒng)就是用超文本方式組織的。在Windows環(huán)境下,利用Microsoft的對象鏈接和嵌入技術(shù)(OLE),可方便地將許多程序甚至是普通文本變成具有超媒體功能的系統(tǒng)。超文本與傳統(tǒng)的文本有很大的區(qū)別。傳統(tǒng)文本,無論是普通書籍還是計(jì)算機(jī)的文本文件,都是用線性方式加以組織的,讀者在閱讀時,必須一頁一頁順序閱讀,幾乎沒有選擇的余地。超文本是一個非線性的網(wǎng)狀結(jié)構(gòu),讀者在閱讀時不必像讀一般文章那樣按順序閱讀,可以根據(jù)實(shí)際需要,利用超文本機(jī)制提供的聯(lián)想式查詢能力,迅速找到自己感興趣的內(nèi)容和有關(guān)信息(想像一下你從一本百科全書中查找某個術(shù)語含義的過程)。制作超文本的過程就是將有關(guān)素材按其內(nèi)在的聯(lián)系劃分成不同層次、不同關(guān)系的思想單元,然后用超文本著作工具(絕大多數(shù)多媒體創(chuàng)作工具支持超文本寫作)將這些思想單元組成一個網(wǎng)狀結(jié)構(gòu)。超文本一般采用“控制按鈕”的方式組織接口。
超文本(和后面介紹的超媒體)包含結(jié)點(diǎn)、鏈和網(wǎng)絡(luò)三個基本要素。
1)結(jié)點(diǎn)(node)
結(jié)點(diǎn)是表達(dá)信息的基本單位。如果每個結(jié)點(diǎn)只表示文本信息,則是原始意義下的超文本。結(jié)點(diǎn)所表示的信息不僅可以是文本,也可以是圖形、圖像、音頻、視頻、動畫,甚至是一段計(jì)算機(jī)程序。結(jié)點(diǎn)中所包含的最小信息單位,如一幅圖像、一段文字、一個按鍵等,依不同情形分別稱為“點(diǎn)”(point)和“域”(field)。不同的超文本系統(tǒng)中結(jié)點(diǎn)的表示方法乃至名稱都有所區(qū)別。例如,在Hypercard中,結(jié)點(diǎn)稱為卡片,每個卡片由字段、按鍵和圖像組成,字段用來記錄字符串、數(shù)字等數(shù)據(jù),按鍵表示用Hypercard的寫作語言Hypertalk所寫成的程序,用鼠標(biāo)選擇了卡片上的按鍵后,就執(zhí)行相應(yīng)的程序。這些字段、按鍵和圖像等就是構(gòu)成卡片的點(diǎn)和域。一般采用兩種方式顯示結(jié)點(diǎn)中的信息:一種是依據(jù)結(jié)點(diǎn)的某種次序順序顯示;另一種是以窗口的形式顯示,這時結(jié)點(diǎn)和窗口是一一對應(yīng)的,屏幕上可能有若干個不同尺寸的重疊窗口,每個窗口分別顯示一個結(jié)點(diǎn)。
2)鏈(Link)
超文本中使用鏈將結(jié)點(diǎn)連接起來,以表示被連接的各結(jié)點(diǎn)之間的關(guān)系。一般來說,結(jié)點(diǎn)間有索引鏈和結(jié)構(gòu)鏈兩種連接方法。
索引鏈實(shí)現(xiàn)結(jié)點(diǎn)中點(diǎn)、域之間的連接,通過索引鏈可實(shí)施對相關(guān)信息的查找及交叉參考。一個鏈的起始端稱為鏈源,是索引的引出處,通過它可以訪問另一個結(jié)點(diǎn)。在超文本系統(tǒng)中,鏈源的表現(xiàn)形式很多,如對鏈源的標(biāo)識符以斜體、粗體、彩色、加下劃線或加邊框等形式顯示;也可以是一個圖符、圖像或控制按鈕等。鏈的末端稱為目標(biāo)端,是索引的目標(biāo)。鏈的起始端和末端通常都是結(jié)點(diǎn)中的點(diǎn)或域。應(yīng)該注意到,兩個結(jié)點(diǎn)之間的鏈可能不止一個,因此,它們可能分別是某個鏈的起始端和末端,只有這樣才能做到兩個結(jié)點(diǎn)信息內(nèi)容的交叉參考。
結(jié)構(gòu)鏈對層次性信息進(jìn)行操作,即它所連接的是處于不同層次的父子結(jié)點(diǎn),比如,將一個結(jié)點(diǎn)中的某個點(diǎn)與另一個結(jié)點(diǎn)連接。這種連接方法在超文本網(wǎng)絡(luò)中形成了樹狀子網(wǎng)。
除上述兩種連接方法外,在超文本中還經(jīng)常使用一種隱形鏈——關(guān)鍵字鏈??捎媒Y(jié)點(diǎn)的標(biāo)識或?qū)傩宰鳛殛P(guān)鍵字,也可以將鏈本身作為關(guān)鍵字。以關(guān)鍵字訪問結(jié)點(diǎn)可能有多個匹配。
3)網(wǎng)絡(luò)(Network)
超文本中由結(jié)點(diǎn)和鏈構(gòu)成的網(wǎng)絡(luò)是一個有向圖,這種有向圖與人工智能中的語義網(wǎng)有相似之處。語義網(wǎng)是一種知識表示方法,其中結(jié)點(diǎn)表示概念,而結(jié)點(diǎn)之間的弧表示兩個概念之間的關(guān)系。
超文本中的結(jié)點(diǎn)可以看做是對單一概念或思想的表達(dá),而結(jié)點(diǎn)之間的鏈則表示概念或思想之間的語義關(guān)系。從這個觀點(diǎn)看,超文本也可以看做是一種知識組織和表達(dá)方法,與人工智能范疇的知識工程不同的是,后者致力于建立知識的表示,以便于機(jī)器推理;而超文本知識表達(dá)的目的是將各種思想、概念組合到一起,便于瀏覽,而不考慮機(jī)器推理。一個超文本系統(tǒng)通常具備以下基本特性:
●所管理的信息是一些單元(信息塊),這些單元在不同的系統(tǒng)中被分別稱為結(jié)點(diǎn)(nodes)、結(jié)點(diǎn)卡(nodecards)、幀面(frames)或頁(pages)等;
●信息單元之間通過鏈(link)連接在一起,系統(tǒng)提供面向窗口或鼠標(biāo)的用戶界面跟蹤鏈路,使用戶在結(jié)點(diǎn)中航行(navigation)時不至迷失方向;
●系統(tǒng)具有檢索(retieval)能力;
●允許用戶在信息單元上作注釋(annotation)或自由添加鏈路。
2.超媒體
超文本與多媒體的融合產(chǎn)生了超媒體。事實(shí)上,超媒體的原文Hypermedia就是超文本Hypertext和多媒體Multimedia的結(jié)合詞。簡單地講,允許超文本的信息結(jié)點(diǎn)存儲多媒體信息(圖形、圖像、音頻、視頻、動畫和程序),并使用與超文本類似的機(jī)制進(jìn)行組織和管理,就構(gòu)成了超媒體。但在實(shí)際中,管理和組織多媒體信息比單純的文本信息復(fù)雜得多,所以要將超文本的知識表示方法與多媒體對文本、圖形、圖像、音頻、視頻、動畫等信息的存儲和處理技術(shù)相結(jié)合。前面提到,現(xiàn)在已經(jīng)很難區(qū)分超文本、超媒體和多媒體,特別是當(dāng)前嚴(yán)格意義下的超文本系統(tǒng)已經(jīng)很少見(在某些場合,如一些DOS應(yīng)用軟件的幫助功能中還可以見到)??偟膩碇v,多媒體的含義更廣一些,而超媒體強(qiáng)調(diào)的是對多種媒體信息的組織、管理,面向?qū)@些信息的檢索和瀏覽。超媒體技術(shù)廣泛應(yīng)用于各種信息查詢系統(tǒng),如教學(xué)、信息檢索、字典和參考資料、商品介紹展示、旅游和購物指南、交互式娛樂等。2.1.6光存儲技術(shù)
光存儲介質(zhì)與磁存儲介質(zhì)有不少相似的地方,例如,它們都可以用盤、帶或卡的形式出現(xiàn),在用途和性能方面也有相似的地方。光存儲介質(zhì)與磁存儲介質(zhì)之間的本質(zhì)區(qū)別在于后者使用磁技術(shù),而前者使用光技術(shù)。光存儲技術(shù)通過光學(xué)的方法讀出(有時也包括寫入)數(shù)據(jù),由于使用的光源基本上是激光(也用過其他光源),因此又稱為激光存儲。
1.光存儲的基本原理
一個物理單元之所以能存儲數(shù)據(jù),是因?yàn)樗哪撤N性質(zhì)能夠發(fā)生變化,并以此反映出所存儲的數(shù)據(jù)。通過識別這種性質(zhì)上的變化就可以讀出其中存儲的數(shù)據(jù),而用某種編碼方法改變物理單元的性質(zhì),則可將數(shù)據(jù)寫入該介質(zhì)中。
光學(xué)存儲用激光束以光學(xué)方式讀取記錄在塑料圓盤上的信號坑,其單位面積的記錄密度可達(dá)到700KB/mm2,而且進(jìn)一步提高的潛力尚大,是目前使用的所有數(shù)據(jù)存儲介質(zhì)中記錄密度最高的。
2.光存儲介質(zhì)的分類
光存儲介質(zhì)根據(jù)其存儲體的外形和大小進(jìn)行分類(如盤、帶和卡等)。圖2-6清晰地顯示了光存儲介質(zhì)的發(fā)展過程。目前最常見的光存儲介質(zhì)有5.25英寸和4.75英寸光盤,后者的尺寸與標(biāo)準(zhǔn)激光唱盤大小相同,已經(jīng)被采納為CD-ROM光盤的標(biāo)準(zhǔn)尺寸。一種更小的3.5英寸的光盤標(biāo)準(zhǔn)也已頒布,但尚不普及。圖2-6光存儲技術(shù)演變也可以根據(jù)記錄方法對光存儲介質(zhì)進(jìn)行分類。第一種記錄方法稱為WORM(即一次寫多次讀),實(shí)質(zhì)是存儲單元的狀態(tài)一旦改變就不能恢復(fù)到原來的狀態(tài),因而寫操作不可逆;重復(fù)讀的次數(shù)盡管不是無限的,但一般都能保證使用數(shù)十年以上。第二種記錄方法稱為ROM(即只讀存儲),在多媒體技術(shù)中應(yīng)用的光學(xué)只讀存儲器主要指CD-ROM光盤(CD-ROMTitles)。激光視盤也是一種常見的只讀光盤,最初用于記錄影片數(shù)據(jù)(模擬數(shù)據(jù))。視盤與CD-ROM光盤在原理和結(jié)構(gòu)上很相似,尺寸一般為12英寸或8英寸。2.2.1JPEG——靜止圖像壓縮標(biāo)準(zhǔn)
國際標(biāo)準(zhǔn)化組織(ISO)和國際電報電話咨詢委員會(CCITT)聯(lián)合成立的專家組JPEG(JointPhotographicExpertsGroup)經(jīng)過五年艱苦細(xì)致的工作后,于1991年3月提出了ISOCDIO918號建議草案:多灰度靜止圖像的數(shù)字壓縮編碼(通常簡稱為JPEG標(biāo)準(zhǔn))。這是一個適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。2.2多媒體技術(shù)標(biāo)準(zhǔn)它包括基于DPCM(差分脈沖編碼調(diào)制)的無損壓縮編碼,基于DCT(離散余弦變換)和Huffman編碼的有損壓縮算法兩個部分。前者不會產(chǎn)生失真,但壓縮比很??;后一種算法進(jìn)行圖像壓縮時信息雖有損失但壓縮比可以很大,例如壓縮20倍左右時,人眼基本上看不出失真。JPEG標(biāo)準(zhǔn)實(shí)際上有三個范疇:
(1)基本順序過程(BaselineSequentialProcesses):實(shí)現(xiàn)有損圖像壓縮,重建圖像質(zhì)量達(dá)到人眼難以觀察出來的要求。其采用的是8×8像素自適應(yīng)DCT算法、量化及Huffman型的熵編碼器。
(2)基于DCT的擴(kuò)展過程(ExtendedDCTBasedProcess):使用累進(jìn)工作方式,采用自適應(yīng)算術(shù)編碼過程。
(3)無失真過程(LosslesssProcess):采用預(yù)測編碼及Huffman編碼(或算術(shù)編碼),可保證重建圖像數(shù)據(jù)與原始圖像數(shù)據(jù)完全相同。
基本順序過程是JPEG最基本的壓縮過程,符合JPEG標(biāo)準(zhǔn)的硬軟件編碼/解碼器都必須支持和實(shí)現(xiàn)這個過程。另兩個過程是可選擴(kuò)展,對一些特定的應(yīng)用項(xiàng)目有很大的實(shí)用價值。
1.JPEG算法
基本JPEG的編碼算法可分成三個步驟:①通過離散余弦變換(DCT)去除數(shù)據(jù)冗余;②使用量化表對DCT系數(shù)進(jìn)行量化(量化表是根據(jù)人類視覺系統(tǒng)和壓縮圖像類型的特點(diǎn)進(jìn)行優(yōu)化的量化系數(shù)矩陣);③對量化后的DCT系數(shù)進(jìn)行編碼使其熵達(dá)到最小,熵編碼采用Huffman可變字長編碼。
JPEG的解碼過程如圖2-7所示。圖2-7JPEG標(biāo)準(zhǔn)解碼過程
2.離散余弦變換
JPEG采用8×8子塊的二維離散余弦變換算法。在編碼器的輸入端,把原始圖像(對彩色圖像是每個顏色成分)順序地分割成一系列8×8的子塊。在8×8圖像塊中,像素值一般變化較平緩,因此具有較低的空間頻率。實(shí)施三維8×8離散余弦變換可以將圖像塊的能量集中在極少數(shù)幾個系數(shù)上,其他系數(shù)的值與這些系數(shù)相比,絕對值要小得多。與Fourier變換類似,對于高度相關(guān)的圖像數(shù)據(jù)進(jìn)行這樣變換的效果是使能量高度集中,便于后續(xù)的壓縮處理。
3.量化
為了達(dá)到壓縮數(shù)據(jù)的目的,對DCT系數(shù)需作量化處理。量化的作用是在保持一定質(zhì)量的前提下,丟棄圖像中對視覺效果影響不大的信息。量化是多對一映射,是造成DCT編碼信息損失的根源。JPEG標(biāo)準(zhǔn)中采用線性均勻量化器,量化過程為對64個DCT系數(shù)除以量化步長并四舍五入取整,量化步長由量化表決定。量化表元素因DCT系數(shù)位置和彩色分量的不同而取不同值。量化表為8×8矩陣,與DCT變換系數(shù)一一對應(yīng)。量化表一般由用戶規(guī)定(JPEG標(biāo)準(zhǔn)中給出了參考值),并作為編碼器的一個輸入。量化表中的元素為1~255之間的任意整數(shù),其值規(guī)定了所對應(yīng)DCT系數(shù)的量化步長。DCT變換系數(shù)除以量化表中對應(yīng)位置的量化步長并舍入小數(shù)部分后,大多數(shù)變?yōu)榱?,從而達(dá)到了壓縮的目的。
4.游程編碼
64個變換數(shù)經(jīng)量化后,左上角系數(shù)是直流分量(DC系數(shù)),即空間域中64個圖像采樣值的均值。相鄰8×8塊之間的DC系數(shù)一般有很強(qiáng)的相關(guān)性,JPEG標(biāo)準(zhǔn)對DC系數(shù)采用DPCM編碼(差分編碼)方法,即對相鄰像素塊之間的L系數(shù)的差值進(jìn)行編碼。其余63個交流分量(AC系數(shù))使用游程編碼,從左上角開始沿對角線方向,以Z字形(Zig-Zag)進(jìn)行掃描直至結(jié)束。
量化后的AC系數(shù)通常會有許多零值,以Z字形路徑進(jìn)行游程編碼有效地增加了連續(xù)出現(xiàn)的零值個數(shù)。
5.熵編碼
為了進(jìn)一步壓縮數(shù)據(jù),可對DC碼和AC行程編碼的碼字再作基于統(tǒng)計(jì)特性的熵編碼。JPEG標(biāo)準(zhǔn)建議使用的熵編碼方法有Huffman編碼和自適應(yīng)二進(jìn)制算術(shù)編碼。2.2.2MPEG——運(yùn)動圖像壓縮編碼
MPEG(MovingPicturesExpertsGroup)是ISO/IEC/JTC/SC2/WG11的一個小組,它兼顧了JPEG標(biāo)準(zhǔn)和CCITT專家組的H.261標(biāo)準(zhǔn),于1990年形成標(biāo)準(zhǔn)草案。MPEG標(biāo)準(zhǔn)分成兩個階段:第一個階段(MPEG-1)是針對傳輸速率為1~1.5?Mb/s的普通電視質(zhì)量的視頻信號的壓縮;第二個階段(MPEG-2)則是針對30幀每秒的720×572分辨率的視頻信號進(jìn)行壓縮,在擴(kuò)展模式下,MPEG-2可以對分辨率達(dá)1440×152的高清晰度電視(HDTV)的信號進(jìn)行壓縮。
MPEG算法除了對單幅圖像進(jìn)行編碼外,還利用圖像序列的相關(guān)特性去除幀間圖像冗余,大大提高了視頻圖像的壓縮比,在保持較高的圖像視覺效果的前提下,壓縮比可以達(dá)到60~100倍左右。MPEG壓縮算法復(fù)雜,計(jì)算量大,其實(shí)現(xiàn)一般需要專門的硬件支持。
MPEG標(biāo)準(zhǔn)有三個組成部分:MPEG視頻,MPEG音頻,視頻與音頻的同步。MPEG視頻是MPEG標(biāo)準(zhǔn)的核心。為滿足高壓縮比和隨機(jī)訪問兩方面的要求,MPEG采用預(yù)測和插補(bǔ)兩種幀間編碼技術(shù)。MPEG視頻壓縮算法中包含兩種基本技術(shù):一種是基于16×16子塊的運(yùn)動補(bǔ)償技術(shù),用來減少幀序列的時域冗余;另一種是基于DCT的壓縮,用于減少幀序列的空域冗余,在幀內(nèi)壓縮及幀間預(yù)測中均使用了DCT變換。運(yùn)動補(bǔ)償算法是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法之一。
1.運(yùn)動補(bǔ)償預(yù)測
幀序列的相鄰畫面之間的運(yùn)動部分具有連續(xù)性,即當(dāng)前畫面上的圖像可以看成是前面某時刻畫面上圖像的位移,位移的幅度值和方向在畫面各處可以不同。利用運(yùn)動位移信息與前面某時刻的圖像對當(dāng)前畫面圖像進(jìn)行預(yù)測的方法,稱為前向預(yù)測;反之,根據(jù)某時刻的圖像與位移信息預(yù)測該時刻之前的圖像,稱為后向預(yù)測。
MPEG的運(yùn)動補(bǔ)償預(yù)測方法將畫面分成若干16×16的子圖像塊(稱為補(bǔ)償單元或宏塊),并根據(jù)一定的條件分別進(jìn)行幀內(nèi)預(yù)測、前向預(yù)測、后向預(yù)測及平均預(yù)測。
2.運(yùn)動補(bǔ)償插值
以插補(bǔ)方法補(bǔ)償運(yùn)動信息是提高視頻壓縮比的最有效措施之一。在時域中,插補(bǔ)運(yùn)動補(bǔ)償是一種多分辨率壓縮技術(shù)。例如,以l/15秒或1/10秒時間間隔選取參考子圖,對時域較低分辨率子圖進(jìn)行編碼,通過低分辨子圖及反映運(yùn)動趨勢的附加校正信息(運(yùn)動矢量)進(jìn)行插值,可得到滿分辨率(幀率1/30秒)的視頻信號。插值運(yùn)動補(bǔ)償也稱為雙向預(yù)測,因?yàn)樗壤昧饲懊鎺男畔?,又利用了后面幀的信息?.2.3H.26X——視頻通信編碼標(biāo)準(zhǔn)
電視電話/會議電視的建議標(biāo)準(zhǔn)H.261常稱為P×64K標(biāo)準(zhǔn),其中P是取值為1~30的可變參數(shù)。P=1或2時支持四分之一中間格式(QCIF,QuarterCmmonIntermediaFormat)的幀率較低的視頻電話傳輸;P≥6時支持通用中間格式(CIF,CommonIntermediateFormat)的幀率較高的電視會議數(shù)據(jù)傳輸。P×64K視頻壓縮算法也是一種混合編碼方案,即基于DCT的變換編碼和帶有運(yùn)動預(yù)測差分脈沖編碼調(diào)制(IDPCM)的預(yù)測編碼方法的混合。在低傳輸速率時(P=1或2,即64b/s或128?Kb/s),除QCIF外還可使用亞幀(Sub-frame)技術(shù),即每間隔一幀(或數(shù)幀)處理一幀,壓縮比可高達(dá)50∶1左右。圖像壓縮技術(shù)、視頻技術(shù)與網(wǎng)絡(luò)技術(shù)相結(jié)合的應(yīng)用前景十分可觀,如遠(yuǎn)程圖像傳輸系統(tǒng)、動態(tài)視頻傳輸——可視電話、電視會議系統(tǒng)等已經(jīng)商品化,MPEG標(biāo)準(zhǔn)與視頻技術(shù)相結(jié)合的產(chǎn)物——家用數(shù)字視盤等已進(jìn)入市場??梢灶A(yù)計(jì),這些技術(shù)和產(chǎn)品的發(fā)展將對社會的進(jìn)步產(chǎn)生重大影響。
壓縮技術(shù)也是多媒體技術(shù)中的關(guān)鍵問題,目前已有以下標(biāo)準(zhǔn):
●?JPEG(JointPhotographicExpertsGroup)標(biāo)準(zhǔn):適用于連續(xù)色調(diào)、多級灰度、彩色/單色靜止圖像壓縮。●?H.261標(biāo)準(zhǔn):主要用于視頻電話和視頻電視會議。H.261編碼/解碼模型與MPEG的模型類似,包括5個階段:①運(yùn)動補(bǔ)償預(yù)測;②DCT轉(zhuǎn)換;③有失真量化;④DC系數(shù)的編碼以AC系數(shù)的行程編碼;⑤熵編碼。H.261標(biāo)準(zhǔn)的壓縮算法與MPEG的有較多的相同處,區(qū)別只是在于前者覆蓋較寬的信道頻帶,而后者是基于較窄的頻帶上傳輸?!?H.264標(biāo)準(zhǔn):是DPCM加變換編碼的混合編碼模式。它采用“回歸基本”的簡潔設(shè)計(jì),設(shè)有眾多的選項(xiàng),可獲得比H.263++好得多的壓縮性能;加強(qiáng)了對各種信道的適應(yīng)能力,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法,有利于對誤碼和丟包的處理;應(yīng)用目標(biāo)范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求。它集中了以往標(biāo)準(zhǔn)的優(yōu)點(diǎn),并吸收了標(biāo)準(zhǔn)制定中積累的經(jīng)驗(yàn)。與H.263v2(H.263+)或MPEG-4簡單類(SimpleProfile)相比,H.264在使用與上述編碼方法類似的最佳編碼器時,在大多數(shù)碼率下最多可節(jié)省50%的碼率。H.264在所有碼率下都能持續(xù)提供較高的視頻質(zhì)量。
H.264能工作在低延時模式以適應(yīng)實(shí)時通信的應(yīng)用(如視頻會議),同時又能很好地工作在沒有延時限制的應(yīng)用中,如視頻存儲和以服務(wù)器為基礎(chǔ)的視頻流式應(yīng)用。H.264提供包傳輸網(wǎng)中處理包丟失所需的工具,以及在易誤碼的無線網(wǎng)中處理比特誤碼的工具。
●?MPEG-1標(biāo)準(zhǔn):制定于1992年,是為工業(yè)級標(biāo)準(zhǔn)而設(shè)計(jì)的,可適用于不同帶寬的設(shè)備,如CD-ROM、Video-CD、CD-R等;主要針對1.5?Mb/s以下數(shù)據(jù)傳輸率的數(shù)字存儲媒質(zhì)運(yùn)動圖像及其伴音編碼的國際標(biāo)準(zhǔn);每秒播放30幀,CD音質(zhì),質(zhì)量與VHS(家用視頻系統(tǒng))相當(dāng)?!馦PEG-2標(biāo)準(zhǔn):制定于1994年,設(shè)計(jì)目標(biāo)是高級工業(yè)標(biāo)準(zhǔn)的圖像質(zhì)量以及更高的傳輸率,它追求的是CCIR601建議的圖像質(zhì)量DVB、HDTV和DVD等制定的3~10?Mb/s的運(yùn)動圖像及其伴音的編碼標(biāo)準(zhǔn),與MPEG-1兼容,適用于1.5~60?Mb/s甚至更高的編碼范圍。定名為MPEG-2AAC(AdvancedAudioCoding)的標(biāo)準(zhǔn)完成于1997年,經(jīng)BBC(U.K.)和NHK(Japan)使用、測試表明,已達(dá)到最優(yōu)化ITU-R601推薦的分辨率,并且對于低比特率的多聲道編碼能提供相當(dāng)高的聲音質(zhì)量。●?MPEG-4標(biāo)準(zhǔn):主要應(yīng)用于視頻電話(VideoPhone)、視頻郵件(VideoEmail)和電子新聞(ElectronicNews)等;與MPEG-1和MPEG-2相比,它對于傳輸速率要求較低。MPEG-4利用很窄的帶寬,通過幀重建技術(shù)來壓縮和傳輸數(shù)據(jù),以求利用最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。MPEG-4的另一個特點(diǎn)是更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控,這是第一個具有交互性的動態(tài)圖像標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)于1998年正式推出?!馦PEG-7標(biāo)準(zhǔn):1996年10月,MPEG提出的一個新的稱之為多媒體內(nèi)容描述接口(MultimediaContentDescriptionInterface)的概念,即MPEG-7。MPEG-7的目標(biāo)是建立一套視聽特征的量化標(biāo)準(zhǔn)描述器及其結(jié)構(gòu),以及這些描述器之間的關(guān)系,這些描述器稱之為描述方案(DS,DescriptionSchemes);同時,MPEG-7也建立了一套標(biāo)準(zhǔn)化的語言——描述定義語言(DDL,DescriptionDefinitionLanguage),用以說明描述方案,保證其被廣泛采用的擴(kuò)展性和較長的生命周期。人們可以檢索和索引同MPEG-7數(shù)據(jù)相聯(lián)系的視聽材料,這些標(biāo)準(zhǔn)可以是靜態(tài)的圖片、圖形、3D模型、聲音、言語、視頻和這些元素所組成的多媒體描述信息?!?MPEG-21標(biāo)準(zhǔn):于1999年10月在墨爾本會議上被提出,稱為多媒體框架(MultimediaFramework)。MPEG-21的目標(biāo)是要為多媒體信息的用戶提供透明而有效的電子交易和使用環(huán)境,是一個針對實(shí)現(xiàn)具有知識產(chǎn)權(quán)管理和保護(hù)能力的數(shù)字多媒體內(nèi)容的技術(shù)標(biāo)準(zhǔn)。
計(jì)算技術(shù)、網(wǎng)絡(luò)通信技術(shù)、存儲壓縮技術(shù)的發(fā)展,大大推動了多媒體技術(shù)的發(fā)展。2.3.1圖形圖像文件格式
1.BMP文件
BMP(BitMaP)文件格式是Windows本身的位圖文件格式。所謂本身,是指Windows內(nèi)部存儲位圖即采用這種格式。一個.BMP格式的文件通常有.BMP的擴(kuò)展名,但有一些是以?.RLE為擴(kuò)展名的,RLE的意思是行程長度編碼(RunLengthEncoding)。這樣的文件意味著其使用的數(shù)據(jù)壓縮方法是?.BMP格式文件支持的兩種RLE方法中的一種。2.3常見的多媒體文件格式圖2-8多媒體常見文件格式
BMP文件可用每像素1、4、8、16或24位來編碼顏色信息,這個位數(shù)稱做圖像的顏色深度,它決定了圖像所含的最大顏色數(shù)。一幅1?bpp(位每像素,bitperpixel)的圖像只能有兩種顏色,而一幅24?bpp的圖像可以有超過16兆種不同的顏色。下面以256色(也就是?8?bpp)位圖為例,說明了一個典型.BMP文件的結(jié)構(gòu)。BMP文件包含四個主要的部分:一個位圖文件頭,一個位圖信息頭,一個色表和位圖數(shù)據(jù)本身。位圖文件頭包含關(guān)于這個位圖文件的信息,如從哪里開始是位圖數(shù)據(jù)的定位信息;位圖信息頭含有關(guān)于這幅圖像的信息,如圖像的寬度和高度(以像素為單位);色表中有圖像顏色的RGB值。對顯示卡來說,如果它不能一次顯示超過256種顏色,則讀取和顯示.BMP文件的程序能夠把這些RGB值轉(zhuǎn)換到顯示卡的調(diào)色板來產(chǎn)生準(zhǔn)確的顏色。
BMP文件的位圖數(shù)據(jù)格式依賴于編碼每個像素顏色所用的位數(shù)。對于一個256色的圖像來說,每個像素占用文件中位圖數(shù)據(jù)部分的一個字節(jié)。像素的值不是RGB顏色值,而是文件中色表的一個索引。所以,在色表中如果第一個R/G/B值是255/0/0,那么像素值為0表示它是鮮紅色。像素值按從左到右的順序存儲,通常從最后一行開始。所以,在一個256色的文件中,位圖數(shù)據(jù)中第一個字節(jié)就是圖像左下角的像素的顏色索引,第二個就是它右邊的那個像素的顏色索引。如果位圖數(shù)據(jù)中每行的字節(jié)數(shù)是奇數(shù),則要在每行都加一個附加的字節(jié)來調(diào)整位圖數(shù)據(jù)邊界為16位的整數(shù)倍。并不是所有的BMP文件結(jié)構(gòu)都像上面所述的那樣,例如16?bpp和24?bpp文件就沒有色表;像素值直接表示RGB值,另外,文件私有部分的內(nèi)部存儲格式也是可以變化的。例如,在16和256色?.BMP文件中的位圖數(shù)據(jù)采用RLE算法來壓縮,這種算法用顏色加像素個數(shù)來取代一串顏色相同的序列,而且,Windows還支持OS/2下的?.BMP文件,盡管它使用了不同的位圖信息頭和色表格式。
2.PCX文件
PCX是在PC上成為位圖文件存儲標(biāo)準(zhǔn)的第一種圖像文件格式。它最早出現(xiàn)在Zsoft公司的Paintbrush軟件包中,在20世紀(jì)80年代早期授權(quán)給微軟與其產(chǎn)品捆綁發(fā)行,而后轉(zhuǎn)變?yōu)镸icrosoftPaintbrush,并成為Windows的一部分。雖然使用這種格式的人在減少,但這種帶有?.PCX擴(kuò)展名的文件在今天仍是十分常見的。
PCX文件分為三部分:PCX文件頭、位圖數(shù)據(jù)和一個可選的色表。文件頭長達(dá)128個字節(jié),分為幾個域,包括圖像的尺寸和每個像素顏色的編碼位數(shù)。位圖數(shù)據(jù)用一種簡單的RLE算法壓縮,最后的可選色表有256個RGB值。PCX格式最初是為CGA和EGA來設(shè)計(jì)的,后來經(jīng)過修改也支持VGA和真彩色顯示卡,現(xiàn)在PCX圖像可以用1?bpp、4?bpp、
8?bpp或24?pp來對顏色數(shù)據(jù)進(jìn)行編碼。
3.TIFF文件
PCX格式是所有位圖文件格式中最簡單的,而TIFF(TaggedImageFileFormat)則是最難的一種。
TIFF文件含有?.TIF的擴(kuò)展名。它以8字節(jié)長的圖像文件頭開始(IFH),這個文件頭中最重要的成員是一個指向名為圖像文件目錄(IFD)的數(shù)據(jù)結(jié)構(gòu)的指針。
IFD是一個名為標(biāo)記(tag)的用于區(qū)分一個或多個可變長度數(shù)據(jù)塊的表,標(biāo)記中含有關(guān)于圖像的信息。TIFF文件格式定義70多種不同類型的標(biāo)記,有的用來存放以像素為單位的圖像寬度和高度,有的用來存放色表(如果需要的話),當(dāng)然還必須有用來存放位圖數(shù)據(jù)的標(biāo)記。一個TIFF格式的文件完全由它的標(biāo)記所決定,而且這種文件結(jié)構(gòu)極易擴(kuò)展,因?yàn)樵谝郊右恍┨卣鲿r只需增加一些額外的標(biāo)記。究竟是什么使TIFF文件如此復(fù)雜?一方面,要編寫一種能夠識別所有不同標(biāo)記的軟件非常困難。大多數(shù)TIFF的閱讀程序只能識別一部分標(biāo)記,所以會出現(xiàn)這種情況:有時一個應(yīng)用程序創(chuàng)建的TIFF文件,另一個應(yīng)用程序卻不能使用。創(chuàng)建TIFF文件的程序還可能會在文件中加一些只有它自己認(rèn)識的標(biāo)記,雖然TIFF的閱讀程序可以跳過那些它們不認(rèn)得的標(biāo)記,但這樣做總是有可能影響到圖像的質(zhì)量。另一方面,一個TIFF文件可以包含多個圖像,每個圖像都有自己的IFD和一系列標(biāo)記。TIFF文件中的位圖數(shù)據(jù)可能會用好幾種方法來壓縮,所以一個完備的TIFF閱讀程序應(yīng)該有RLE解壓縮程序、LZW解壓縮程序和其他一些算法的解壓縮程序。然而更糟的是,使用LZW的解碼必須得到Unisys公司的同意,且通常是需要付版稅的。所以,即使是一些相當(dāng)不錯的TIFF閱讀程序,在它們遇到LZW算法壓縮的圖像時也是無能為力的。
盡管TIFF是那么的復(fù)雜,但仍是一種最好的跨平臺格式。因?yàn)樗浅l`活,無論在視覺上還是其他方面,都能把任何圖像編碼成二進(jìn)制形式而不丟失任何屬性。
4.GIF文件
當(dāng)許多圖像方面的權(quán)威一想到LZW的時候,他們也會想到GIF(GraphicsInterchangeFormat),這是一種常用的跨平臺的位圖文件格式,最初為CompuServe公司所創(chuàng)。GIF文件通常帶有?.GIF的擴(kuò)展名,而且在CompuSeve上大量存在。
GIF文件的結(jié)構(gòu)取決于它屬于哪一個版本,目前的兩種版本分別是GIF87a和GIF89a,前者較簡單。無論是哪個版本,它都以一個長13字節(jié)的文件頭開始,文件頭中包含判定此文件是?GIF文件的標(biāo)記、版本號和其他一些信息。如果這個文件只有一幅圖像,則文件頭后緊跟一個全局色表來定義圖像中的顏色。如果含有多幅圖像(GIF和TIFF格式一樣,允許在一個文件里編碼多個圖像),那么全局色表就被各個圖像自帶的局部色表所替代。在GIF87a文件中,文件頭和全局色表之后是圖像,它可能會是頭尾相接的一串圖像中的第一個。每個圖像由三部分組成:一個10字節(jié)長的圖像描述,一個可選的局部色表和位圖數(shù)據(jù)。為有效利用空間,位圖數(shù)據(jù)用LZW算法來壓縮。
GIF89a結(jié)構(gòu)與GIF87a類似,但它還包括可選的擴(kuò)展塊用來存放每個圖像的附加信息。GIF89a詳細(xì)定義了四種擴(kuò)展塊:圖像控制擴(kuò)展塊,用來描述圖像怎樣被顯示(例如,顯示是應(yīng)該像一個透明物去覆蓋上一個圖像,還是簡單地替換它);簡單文本擴(kuò)展塊,包含顯示在圖像中的文本;注釋擴(kuò)展塊,以ASCII文本形式存放注釋;應(yīng)用擴(kuò)展塊,存放生成該文件的應(yīng)用程序的私有數(shù)據(jù)。這些擴(kuò)展塊可以出現(xiàn)在文件中全局色表的任何地方。
GIF最顯著的優(yōu)點(diǎn)是:使用廣泛和緊密性。但它有兩個弱點(diǎn):一個是用GIF格式存放的文件最多只能含有256種顏色;另一個可能更重要,就是那些使用了GIF格式的軟件開發(fā)者必須征得CompuServe的同意,他們每賣出一個拷貝都要向CompuServe付版稅。這個政策是CompuServe仿效Unisys公司做出的,它抑制了那些程序員在其圖像應(yīng)用程序中支持GIF文件。
5.PNG文件
PNG(PortableNetworkGraphic,發(fā)音做ping)文件格式是作為GIF的替代品開發(fā)的,它能夠避免使用GIF文件所遇到的常見問題。它從GIF那里繼承了許多特征,而且支持真彩色圖像。更重要的是,在壓縮位圖數(shù)據(jù)時,它采用了一種頗受好評的LZ77算法的一個變種,LZ77則是LZW的前身,而且可以免費(fèi)使用。由于篇幅所限,在這里就不花時間來具體討論P(yáng)NG格式了。
6.JPEG文件
JPEG文件格式最初由C-CubeMicrosystems推出,是為了提供一種存儲深度位像素的有效方法,例如對于照片掃描,其顏色很多而且差別細(xì)微(有時也不細(xì)微)。JPEG使用一種有損壓縮算法,有損壓縮雖然犧牲了一部分的圖像數(shù)據(jù)(但這種損失很小以至于人們很難察覺),但可以得到較高的壓縮率。無損壓縮算法能在解壓后準(zhǔn)確再現(xiàn)壓縮前的圖像,但壓縮率較低。
JPEG圖像壓縮是一個復(fù)雜的過程,經(jīng)常需要專門的硬件來支持。首先,圖像以像素為單位分成8×8的塊。然后,每個塊分三個步驟被壓縮:第一步使用DCT(DiscreteCosineTransform)離散余弦變換把8×8的像素矩陣變成8×8的頻率(也就是顏色改變的速度)矩陣;第二步對頻率矩陣中的值用量化矩陣進(jìn)行量化,濾掉那些總體上對圖像不重要的部分;第三步,也就是最后一步,對量化后的頻率矩陣使用無損壓縮。因?yàn)楸涣炕蟮念l率矩陣缺了許多高頻信息,所以通常能被壓縮到一半甚至更少。
無損壓縮一般不能壓縮真正的照片圖像,所以50%的壓縮率已是相當(dāng)不錯了。但另一方面,無損壓縮能把一些圖像文件尺寸減少90%,這樣的圖像文件就不適合用JPEG來
壓縮。
JPEG的有損部分產(chǎn)生在第二步,量化矩陣的值越高,從圖像中丟掉的信息就越多,從而壓縮率就越高,同時圖像的質(zhì)量就越差。在JPEG壓縮時可以選擇一個量化因子,這個因子的值決定了量化矩陣中的數(shù)值。理想的量化因子要在壓縮率和圖像質(zhì)量間達(dá)到平衡,所以對不同的圖像要選擇不同的量化因子,通常要經(jīng)過若干次嘗試后方可確定。
7.PSD、PDD文件
PSD、PDD是PhotoShop的專用圖像文件格式。
8.EPS文件
CorelDraw、FreeHand等軟件均支持EPS格式,它屬于矢量圖格式,輸出質(zhì)量非常高。
9.Targa文件
Targa文件格式簡稱TGA格式,是由Truevision公司設(shè)計(jì)的,可支持任意大小的圖像。專業(yè)圖形用戶經(jīng)常使用TGA點(diǎn)陣格式來保存具有真實(shí)感的三維有光源圖像。
10.WMF文件
WMF文件只使用在Windows中,它實(shí)際上保存的不是點(diǎn)陣信息,而是函數(shù)調(diào)用信息。它將圖像保存為一系列GDI(圖形設(shè)備接口)的函數(shù)調(diào)用,在恢復(fù)時,應(yīng)用程序執(zhí)行源文件(即執(zhí)行一個個函數(shù)調(diào)用),在輸出設(shè)備上畫出圖像。WMF文件具有設(shè)備無關(guān)性、文件結(jié)構(gòu)好等特點(diǎn),但是解碼復(fù)雜,其效率比較低。
隨著計(jì)算機(jī)技術(shù)的繼續(xù)發(fā)展,圖形圖像文件將不斷地改進(jìn)、完善,將來必定會出現(xiàn)更好的、效率更高的圖形圖像文件。2.3.2音頻文件格式
音頻文件通常分為兩類:聲音文件和MIDI文件。聲音文件指的是通過聲音錄入設(shè)備錄制的原始聲音,直接記錄了真實(shí)聲音的二進(jìn)制采樣數(shù)據(jù),通常文件較大;而MIDI文件則是一種音樂演奏指令序列,相當(dāng)于樂譜,可以利用聲音輸出設(shè)備或與計(jì)算機(jī)相連的電子樂器進(jìn)行演奏,由于不包含聲音數(shù)據(jù),其文件尺寸較小。
1.聲音文件
數(shù)字音頻同CD音樂一樣,是將真實(shí)的數(shù)字信號保存起來,播放時通過聲卡將信號恢復(fù)成悅耳的聲音。然而,這樣存儲聲音信息所產(chǎn)生的聲音文件是相當(dāng)龐大的,因此,絕大多數(shù)聲音文件采用了不同的音頻壓縮算法,在基本保持聲音質(zhì)量不變的情況下盡可能獲得更小的文件。
1)?Wave文件——.WAV
Wave格式是Microsoft公司開發(fā)的一種聲音文件格式,它符合RIFF(ResourceInterchangeFileFormat)文件規(guī)范,用于保存Windows平臺的音頻信息資源,被Windows平臺及其應(yīng)用程序所廣泛支持。Wave格式支持MSADPCM、CCITTALaw、CCITTμLaw和其他壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,是PC機(jī)上最為流行的聲音文件格式,但其文件尺寸較大,多用于存儲簡短的聲音片斷。
2)?AIFF文件——.AIF/.AIFF
AIFF是音頻交換文件格式(AudioInterchangeFileFormat)的英文縮寫,是蘋果公司開發(fā)的一種聲音文件格式,被Macintosh平臺及其應(yīng)用程序所支持,NetscapeNavigator瀏覽器中的LiveAudio也支持AIFF格式,SGI及其他專業(yè)音頻軟件包也同樣支持這種格式。AIFF支持ACE2、ACE8、MAC3和MAC6壓縮,支持16位44.1?kHz立體聲。
3)?Audio文件——.AU
Audio文件是SunMicrosystems公司推出的一種經(jīng)過壓縮的數(shù)字聲音格式,是Internet中常用的聲音文件格式,NetscapeNavigator瀏覽器中的LiveAudio也支持Audio格式的聲音文件。
4)?Sound文件——.SND
Sound文件是NextComputer公司推出的數(shù)字聲音文件格式,支持壓縮。
5)?Voice文件——.VOC
Voice文件是CreativeLabs(創(chuàng)新公司)開發(fā)的聲音文件格式,多用于保存CreativeSoundBlaster(創(chuàng)新聲霸)系列聲卡所采集的聲音數(shù)據(jù),被Windows平臺和DOS平臺所支持,支持CCITTALaw和CCITTμLaw等壓縮算法。
6)?MPEG文件——.MP1/.MP2/.MP3
這里的MPEG文件格式指的是MPEG標(biāo)準(zhǔn)中的音頻部分,即MPEG音頻層(MPEGAudioLayer)。MPEG音頻文件的壓縮是一種有損壓縮,根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度的不同可分為三層(MPEGAudioLayer1/2/3),分別對應(yīng)MP1、MP2和MP3這三種聲音文件。MPEG音頻編碼具有很高的壓縮率,MP1和MP2的壓縮率分別為4∶1和6∶1~8∶1,而MP3的壓縮率則高達(dá)10∶1~12∶1。也就是說,一分鐘CD音質(zhì)的音樂,未經(jīng)壓縮需要10?MB存儲空間,而經(jīng)過MP3壓縮編碼后只有1?MB左右,同時其音質(zhì)基本保持不失真。因此,目前使用最多的是MP3文件格式。
7)?RealAudio文件——.RA/.RM/.RAM
RealAudio文件是RealNetworks公司開發(fā)的一種新型流式音頻(StreamingAudio)文件格式,它包含在RealNetworks公司所制定的音頻、視頻壓縮規(guī)范RealMedia中,主要用于在低速率的廣域網(wǎng)上實(shí)時傳輸音頻信息。網(wǎng)絡(luò)連接速率不同,則客戶端所獲得的聲音質(zhì)量也不盡相同:對于14.4?Kb/s的網(wǎng)絡(luò)連接,可獲得調(diào)幅(AM)質(zhì)量的音質(zhì);對于28.8?Kb/s的連接,可以達(dá)到廣播級的聲音質(zhì)量;如果擁有ISDN或更快的線路連接,則可獲得CD音質(zhì)的聲音。
2.MIDI文件——.MID/.RMI
MIDI是樂器數(shù)字接口(MusicalInstrumentDigitalInterface)的英文縮寫,是數(shù)字音樂/電子合成樂器的統(tǒng)一國際標(biāo)準(zhǔn)。它定義了計(jì)算機(jī)音樂程序、合成器及其他電子設(shè)備交換音樂信號的方式,還規(guī)定了不同廠家的電子樂器與計(jì)算機(jī)連接的電纜和硬件及設(shè)備間數(shù)據(jù)傳輸?shù)膮f(xié)議,可用于為不同樂器創(chuàng)建數(shù)字聲音,可以模擬大提琴、小提琴、鋼琴等常見樂
器。在MIDI文件中,只包含產(chǎn)生某種聲音的指令,這些指令包括使用什么MIDI設(shè)備的音色、聲音的強(qiáng)弱、聲音持續(xù)多長時間等,計(jì)算機(jī)將這些指令發(fā)送給聲卡,聲卡按照指令
將聲音合成出來,MIDI聲音在重放時可以有不同的效果,這取決于音樂合成器的質(zhì)量。相對于保存真實(shí)采樣數(shù)據(jù)的聲音文件,MIDI文件顯得更加緊湊,其文件通常比聲音文件小
得多。
3.模塊文件——.MOD/.S3M/.XM/.MTM/.FAR
/.KAR/.IT
模塊(Module)格式是一種已經(jīng)存在了很長時間的聲音記錄方式,它同時具有MIDI與數(shù)字音頻的共同特性。模塊文件中既包括如何演奏樂器的指令,又
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 白酒定制產(chǎn)品合同協(xié)議
- 電纜回收搬運(yùn)合同協(xié)議
- 特殊奶粉轉(zhuǎn)讓協(xié)議合同
- 甲乙雙方用油協(xié)議合同
- 甲方租賃儀器合同協(xié)議
- 甘肅建筑外架合同協(xié)議
- 電子商務(wù)運(yùn)營合同協(xié)議
- 電子配件供貨合同協(xié)議
- 甲醇采購技術(shù)協(xié)議合同書
- 玻璃泥輪銷售合同協(xié)議
- 【2021部編版語文】-三年級下冊第七單元教材解讀--PPT課件
- DB 33-T 1015-2021居住建筑節(jié)能設(shè)計(jì)標(biāo)準(zhǔn)(高清正版)
- 鋼結(jié)構(gòu)門式剛架廠房設(shè)計(jì)土木工程畢業(yè)設(shè)計(jì)
- 橙色黑板風(fēng)小學(xué)生知識產(chǎn)權(quán)科普PPT模板
- 中國供銷合作社標(biāo)識使用手冊課件
- 幼兒園兒歌100首
- Q∕CR 9218-2015 鐵路隧道監(jiān)控量測技術(shù)規(guī)程
- 甲狀腺解剖及正常超聲切面ppt課件
- 易學(xué)書籍大全291本
- 上海市城市地下空間建設(shè)用地審批及房地產(chǎn)登記試行規(guī)定
- 蠕墨鑄鐵項(xiàng)目可行性研究報告寫作范文
評論
0/150
提交評論