版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第6章計(jì)算機(jī)多媒體基礎(chǔ)6.1多媒體技術(shù)概述6.2多媒體創(chuàng)作工具介紹6.3圖像的基礎(chǔ)知識(shí)6.4聲音的基礎(chǔ)知識(shí)6.5視頻的基礎(chǔ)知識(shí) 6.1多媒體技術(shù)概述
6.1.1多媒體的有關(guān)概念
1.媒體(Medium)
媒體又常常稱為媒介,是日常生活和工作中經(jīng)常用到的詞匯,如我們經(jīng)常把報(bào)紙、廣播、電視等稱為新聞媒體,報(bào)紙通過(guò)文字、廣播通過(guò)聲音、電視通過(guò)圖像和聲音來(lái)傳送信息。我們把傳播信息的載體稱為媒體。媒體有兩層含義:一是指承載信息所使用的符號(hào)系統(tǒng),如文本、圖形、圖像、音頻、視頻、動(dòng)畫等,媒體呈現(xiàn)時(shí)采用的符號(hào)系統(tǒng)將決定媒體的信息表達(dá)功能;二是指存儲(chǔ)、加工和傳遞信息的實(shí)體,如書本、掛圖、投影片、錄像帶、計(jì)算機(jī)以及相關(guān)的播放、處理設(shè)備等。
多媒體計(jì)算機(jī)中所說(shuō)的媒體是指前者,即計(jì)算機(jī)不僅能處理文字、數(shù)值之類的信息,還能處理聲音、圖形、電視圖像等各種不同形式的信息。
2.多媒體(Multimedia)
關(guān)于“多媒體”概念的標(biāo)準(zhǔn)定義目前還沒(méi)有統(tǒng)一,“多媒體”一詞譯自英文Multimedia,這是一個(gè)合成詞,即由Multiple(多種)和Media(媒體)兩個(gè)單詞組成的合成詞,所以一般理解為“多種媒體的綜合”。
在計(jì)算機(jī)信息處理領(lǐng)域中,所謂多媒體是指計(jì)算機(jī)與人進(jìn)行交流的多種媒體信息,包括文本、圖形、圖像、聲音、動(dòng)畫、視頻等信息。文本:指以文字和各種專用符號(hào)表達(dá)信息的形式。它是現(xiàn)實(shí)生活中使用最多的一種信息存儲(chǔ)和傳遞方式,用文本表達(dá)信息給人以充分的想象空間。
圖形:一般指矢量圖,如幾何圖形、統(tǒng)計(jì)圖、工程圖等。
圖像:通常指位圖,它是多媒體軟件中最重要的信息表現(xiàn)形式之一,決定了一個(gè)多媒體軟件的視覺(jué)效果。
聲音:是多媒體中最容易被人感知的媒體形式,聲音的格式主要有波形聲音(WAVE)和樂(lè)器聲音(MIDI)兩種。
動(dòng)畫:指表現(xiàn)連續(xù)動(dòng)作的圖形或圖像,如縮放、旋轉(zhuǎn)、淡入淡出等。實(shí)際上動(dòng)畫是由一些表現(xiàn)連續(xù)動(dòng)作的幀構(gòu)成的。目前最典型的動(dòng)畫形式就是Flash動(dòng)畫、GIF動(dòng)畫。
視頻:指活動(dòng)的影像,例如電影、電視、VCD等都屬于視頻。視頻文件的主要格式有AVI、MPEG、MOV等。
3.多媒體技術(shù)(MultimediaTechnology)
多媒體技術(shù)不是各種信息媒體的簡(jiǎn)單復(fù)合,它是一種將文本、圖形、圖像、聲音、動(dòng)畫、視頻等形式的信息結(jié)合在一起,并通過(guò)計(jì)算機(jī)進(jìn)行綜合處理和控制,能支持完成一系列交互式操作的信息技術(shù)。概括地說(shuō),多媒體技術(shù)是利用計(jì)算機(jī)對(duì)文本、圖形、圖像、聲音、動(dòng)畫、視頻等多種信息綜合處理、建立邏輯關(guān)系和人機(jī)交互作用的技術(shù)。
多媒體技術(shù)有以下幾個(gè)主要特點(diǎn):
(1)多樣性:指信息載體的多樣化,包括文本、圖形、圖像、視頻、語(yǔ)音等多種媒體信息。
(2)集成性:能夠以計(jì)算機(jī)為中心綜合處理多種信息媒體,包括信息媒體的獲取、存儲(chǔ)、組織與合成。
(3)交互性:指用戶可以與計(jì)算機(jī)的多種信息媒體進(jìn)行交互操作,從而為用戶提供更加有效地控制和使用信息的手段。
(4)實(shí)時(shí)性:指當(dāng)用戶給出操作命令時(shí),馬上會(huì)得到相應(yīng)的多媒體反饋信息。實(shí)時(shí)多媒體分布系統(tǒng)把計(jì)算機(jī)的交互性、通信的分布性和電視的真實(shí)性有機(jī)地結(jié)合在一起。
(5)數(shù)字化:指多媒體中的各種媒體都是以數(shù)字形式存放在計(jì)算機(jī)中。
總之,多媒體技術(shù)是一門基于計(jì)算機(jī)技術(shù)的,包括數(shù)字信號(hào)的處理技術(shù)、音頻和視頻技術(shù)、多媒體計(jì)算機(jī)系統(tǒng)(硬件和軟件)技術(shù)、多媒體通信技術(shù)、圖像壓縮技術(shù)、人工智能和模式識(shí)別等的綜合技術(shù)。
4.多媒體計(jì)算機(jī)(MultimediaComputer)
多媒體計(jì)算機(jī)是能夠?qū)β曇?、圖像、視頻等多媒體信息進(jìn)行綜合處理的計(jì)算機(jī)。多媒體計(jì)算機(jī)一般指多媒體個(gè)人計(jì)算機(jī)(MPC),目前來(lái)說(shuō),普通個(gè)人計(jì)算機(jī)都具有多媒體處理功能,只是在配置上增加一些相關(guān)的外設(shè)即可。
多媒體計(jì)算機(jī)的基本構(gòu)成如下:
主機(jī):即PC。
視頻、音頻輸入設(shè)備:包括攝像機(jī)、話筒、錄音機(jī)等。
視頻、音頻輸出設(shè)備:包括電視機(jī)、投影儀、揚(yáng)聲器、立體聲耳機(jī)等。
功能卡:包括視頻卡、聲卡、顯卡、網(wǎng)卡等。
存儲(chǔ)設(shè)備:包括CD-ROM、磁盤驅(qū)動(dòng)器、刻錄機(jī)等。
交互設(shè)備:包括鍵盤、鼠標(biāo)等。
軟件:包括操作系統(tǒng)、各種硬件驅(qū)動(dòng)程序和各種應(yīng)用程序。圖6-1多媒體計(jì)算機(jī)構(gòu)成示意圖6.1.2多媒體技術(shù)的應(yīng)用
1.家庭娛樂(lè)
數(shù)字影視和娛樂(lè)工具已進(jìn)入我們的生活,例如,家庭有線電視可以通過(guò)增加機(jī)頂盒和鋪設(shè)高速光纖電纜,將單向有線電視改造成為雙向交互電視系統(tǒng)。這樣用戶看電視時(shí)就可以使用點(diǎn)播、選擇等方式隨心所欲地找到自己想看的節(jié)目。
另外,游戲是多媒體一個(gè)重要的應(yīng)用領(lǐng)域,運(yùn)用了三維動(dòng)畫、虛擬現(xiàn)實(shí)等先進(jìn)多媒體技術(shù)的游戲軟件變得更加豐富多彩,給日常生活帶來(lái)了更多的樂(lè)趣?,F(xiàn)在的大型網(wǎng)絡(luò)游戲幾乎都運(yùn)用了多媒體技術(shù),情節(jié)生動(dòng)、聲情并茂。此外,在網(wǎng)絡(luò)上看電影、聽(tīng)音樂(lè)、視頻聊天等都屬于多媒體技術(shù)的具體應(yīng)用。
2.教育培訓(xùn)
教育培訓(xùn)是多媒體技術(shù)最有前途的應(yīng)用領(lǐng)域之一,世界各國(guó)的教育學(xué)家們正努力研究用先進(jìn)的多媒體技術(shù)改進(jìn)教學(xué)與培訓(xùn)。以多媒體計(jì)算機(jī)為核心的現(xiàn)代教育技術(shù)使教學(xué)變得豐富多彩,并引發(fā)教育的深層次改革。計(jì)算機(jī)多媒體教學(xué)已在較大范圍內(nèi)替代了基于黑板的教學(xué)方式,利用多媒體技術(shù)編制的教學(xué)課件、測(cè)試和考試課件能創(chuàng)造出圖文并茂、繪聲繪色、生動(dòng)逼真的教學(xué)環(huán)境和交互式學(xué)習(xí)方式,從而大大激發(fā)學(xué)生的學(xué)習(xí)積極性和主動(dòng)性,提高教學(xué)質(zhì)量。另外,在行業(yè)培訓(xùn)方面,用于軍事、體育、醫(yī)學(xué)和駕駛等方面的多媒體培訓(xùn)系統(tǒng)不僅提供了生動(dòng)的場(chǎng)景,而且能夠設(shè)置各種復(fù)雜環(huán)境,非常有利于培訓(xùn)的進(jìn)行。
3.商業(yè)應(yīng)用
多媒體技術(shù)的商業(yè)應(yīng)用很廣泛,它不僅給我們的日常生活帶來(lái)了無(wú)限的便利和輕松,而且也給廣大的商家?guī)?lái)了巨大的利潤(rùn)。例如,產(chǎn)品展示、企業(yè)宣傳片、電視廣告等多媒體作品在進(jìn)行企業(yè)與產(chǎn)品推廣的同時(shí),為商家贏得了商機(jī)。
此外,還有一些便民性質(zhì)的多媒體查詢系統(tǒng),在提高企業(yè)服務(wù)質(zhì)量等方面起到了積極的作用。例如,醫(yī)院、交通、電信、商業(yè)等部門可以將公共信息都存放在多媒體系統(tǒng)中,向公眾提供多媒體咨詢服務(wù),用戶可通過(guò)觸摸屏進(jìn)行操作,查詢到所需的多媒體信息資料。
4.電子出版物
國(guó)家新聞出版總署規(guī)定:電子出版物是指以數(shù)字代碼方式將圖、文、聲、像等信息存儲(chǔ)在磁、光、電介質(zhì)上,通過(guò)計(jì)算機(jī)或類似設(shè)備閱讀使用,并可復(fù)制發(fā)行的大眾傳播媒體。從內(nèi)容上劃分,電子出版物可分為電子圖書、辭書手冊(cè)、文檔資料、報(bào)刊雜志、教育培訓(xùn)、娛樂(lè)游戲、宣傳廣告、信息咨詢和簡(jiǎn)報(bào)等多種類型,例如,圖書所附帶的多媒體教學(xué)光盤實(shí)際上就是一種電子出版物。
多媒體電子出版物是一種存儲(chǔ)在光盤、磁盤上的電子圖書,它具有存儲(chǔ)容量大、媒體種類多、攜帶方便、檢索迅速、可長(zhǎng)期保存、價(jià)格低廉等優(yōu)點(diǎn)。
5.廣播電視、通信領(lǐng)域
計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、通信技術(shù)和多媒體技術(shù)結(jié)合是現(xiàn)代通信發(fā)展的必然要求。多媒體通信技術(shù)可以把電話、電視、圖文傳真、音響、攝像機(jī)等各類電子產(chǎn)品與計(jì)算機(jī)融為一體,完成多媒體信息的網(wǎng)絡(luò)傳輸、音頻播放和視頻顯示。目前,多媒體技術(shù)在廣播電視、通信領(lǐng)域的應(yīng)用已經(jīng)取得許多新進(jìn)展,多媒體會(huì)議系統(tǒng)、多媒體交互電視系統(tǒng)、多媒體電話、遠(yuǎn)程教學(xué)系統(tǒng)和公共信息查詢等一系列應(yīng)用正在改變著我們的生活。
6.其他領(lǐng)域中的應(yīng)用
多媒體技術(shù)在辦公自動(dòng)化方面主要體現(xiàn)在對(duì)聲音和圖像的處理上。采用語(yǔ)音自動(dòng)識(shí)別系統(tǒng)可以將語(yǔ)言轉(zhuǎn)換成相應(yīng)的文字,同時(shí)又可以將文字翻譯成語(yǔ)音。通過(guò)OCR(OpticalCharacterRecognition,光學(xué)字符識(shí)別)系統(tǒng)可以自動(dòng)輸入手寫文字并以文字的格式存儲(chǔ)。
利用多媒體技術(shù)可以進(jìn)行多媒體測(cè)試,如心理測(cè)試、健康測(cè)試、設(shè)備測(cè)試、環(huán)境測(cè)試和系統(tǒng)測(cè)試等;還可以進(jìn)行輔助設(shè)計(jì)、網(wǎng)絡(luò)會(huì)議、虛擬現(xiàn)實(shí)等。另外,多媒體技術(shù)在工農(nóng)業(yè)生產(chǎn)、旅游業(yè)、軍事、航空航天等領(lǐng)域也有廣泛應(yīng)用。目前,多媒體技術(shù)正朝著高分辨率、高速度、操作簡(jiǎn)單、智能化和標(biāo)準(zhǔn)化的方向發(fā)展,它將集娛樂(lè)、教學(xué)、通信、商務(wù)等功能于一體。從多媒體發(fā)展前景上看,家庭教育和個(gè)人娛樂(lè)是目前國(guó)際多媒體市場(chǎng)的主流,隨著科學(xué)技術(shù)水平的不斷提高和社會(huì)需求的不斷增長(zhǎng),多媒體技術(shù)的覆蓋范圍和應(yīng)用領(lǐng)域?qū)?huì)繼續(xù)擴(kuò)大。6.1.3多媒體技術(shù)的發(fā)展
多媒體技術(shù)是不斷發(fā)展和不斷完善的。如今,多媒體技術(shù)的發(fā)展已成為信息技術(shù)發(fā)展的重要組成部分。并不是有了計(jì)算機(jī)以后就產(chǎn)生了多媒體技術(shù),多媒體技術(shù)的發(fā)展是從第四代計(jì)算機(jī)開(kāi)始的。
20世紀(jì)50年代誕生的計(jì)算機(jī),只能識(shí)別0、1組合的二進(jìn)制代碼,后來(lái)逐漸發(fā)展成能處理文本和簡(jiǎn)單幾何圖形的計(jì)算機(jī)系統(tǒng),并具備了處理復(fù)雜信息的技術(shù)潛力。
1972年,第一款8008處理器問(wèn)世,標(biāo)志著第四代計(jì)算機(jī)的誕生。這時(shí)的計(jì)算機(jī)已經(jīng)有了揚(yáng)聲器,能夠發(fā)出嘟嘟聲,例如,用戶按錯(cuò)了某個(gè)鍵時(shí),系統(tǒng)就會(huì)發(fā)出警告聲音。這時(shí)內(nèi)置的PC揚(yáng)聲器雖然簡(jiǎn)陋,但是卻為多媒體技術(shù)的發(fā)展奠定了基礎(chǔ)。
1984年,美國(guó)App1e公司在研制蘋果計(jì)算機(jī)時(shí),為了改善人機(jī)交互界面,引入了位圖(Bitmap)的概念來(lái)對(duì)圖形進(jìn)行處理,創(chuàng)造性地使用了圖形窗口界面,標(biāo)志著計(jì)算機(jī)多媒體時(shí)代的到來(lái)。
1985年,微軟公司推出了多窗口圖形操作環(huán)境——Windows操作系統(tǒng)。同年,美國(guó)Commodore個(gè)人計(jì)算機(jī)公司率先推出世界上第一臺(tái)多媒體計(jì)算機(jī)系統(tǒng)。
1987年,創(chuàng)新音樂(lè)系統(tǒng)(C/MS)出現(xiàn),這是第一塊被眾多音樂(lè)軟件支持的音效合成卡,它的出現(xiàn)標(biāo)志著計(jì)算機(jī)具備了音頻處理能力,也標(biāo)志著多媒體技術(shù)的發(fā)展進(jìn)入了一個(gè)嶄新的階段。
1988年,MPEG(運(yùn)動(dòng)專家小組)的建立進(jìn)一步推動(dòng)了多媒體技術(shù)的發(fā)展。自從MPEG建立到今天已經(jīng)十多年了,在這十多年中,多媒體技術(shù)的發(fā)展速度是驚人的,其中,硬件、軟件的多媒體功能都得到了飛速的發(fā)展。
1990年,由微軟公司聯(lián)合一些主要的個(gè)人計(jì)算機(jī)廠商組成了多媒體個(gè)人計(jì)算機(jī)市場(chǎng)聯(lián)盟,簡(jiǎn)稱MPC聯(lián)盟。建立聯(lián)盟的主要目的是建立多媒體個(gè)人計(jì)算機(jī)(MPC)的技術(shù)規(guī)范。它規(guī)定多媒體個(gè)人計(jì)算機(jī)的最低配置為:80386SX/16MHz的CPU,2MB的RAM和640×480像素16色的圖形顯示,特別是它規(guī)定了1X的CD-ROM和8位的聲卡,強(qiáng)調(diào)了多媒體計(jì)算機(jī)的基本組成要求。
1993年,由IBM和Intel等數(shù)十家軟硬件公司組成了多媒體個(gè)人計(jì)算機(jī)市場(chǎng)協(xié)會(huì)(MPMC),發(fā)布了MPC2.0技術(shù)規(guī)范,提高了對(duì)CPU和RAM的配置要求,對(duì)聲卡的配置要求達(dá)到了16位,對(duì)CD-ROM的速度要求也提高了一倍,圖形顯示達(dá)到65536色。隨后,MPMC相繼推出了MPC3.0技術(shù)規(guī)范和MPC4.0技術(shù)規(guī)范,對(duì)多媒體個(gè)人計(jì)算機(jī)的最低配置要求不斷提升,并且采用Windows95操作系統(tǒng)作為支持,形成了較完善的多媒體個(gè)人計(jì)算機(jī)系統(tǒng)。
多媒體技術(shù)的發(fā)展是一個(gè)復(fù)雜的過(guò)程,其中,既有硬件對(duì)多媒體技術(shù)的支持,也有軟件對(duì)多媒體技術(shù)的擴(kuò)展。但是總的來(lái)說(shuō),多媒體技術(shù)的發(fā)展主要遵循了兩條主線:一是視頻技術(shù)的發(fā)展;二是音頻技術(shù)的發(fā)展。多媒體計(jì)算機(jī)的關(guān)鍵技術(shù)是多媒體數(shù)據(jù)的壓縮編碼和譯碼技術(shù)。目前廣泛使用的國(guó)際技術(shù)規(guī)范包括靜態(tài)圖像的壓縮編碼標(biāo)準(zhǔn)JPEG、運(yùn)動(dòng)圖像的壓縮編碼系列標(biāo)準(zhǔn)MPEG和面向可視電話與電視會(huì)議系統(tǒng)的視頻壓縮標(biāo)準(zhǔn)H.26X等,此外,還有音頻的壓縮編碼、CD-ROM和DVD存儲(chǔ)編碼等技術(shù)規(guī)范。
6.2多媒體創(chuàng)作工具介紹
6.2.1素材處理軟件
在創(chuàng)作多媒體作品時(shí)會(huì)使用到大量的素材,如文字素材、圖像素材、聲音素材、視頻素材等,所以要學(xué)會(huì)對(duì)這些素材的處理。
1.文字素材的處理
在多媒體信息載體中,文字是最重要的一種信息傳播媒介。無(wú)論計(jì)算機(jī)技術(shù)發(fā)展到何種程度,文字依然是最重要的載體,因此,幾乎所有的應(yīng)用軟件都有文字處理功能。如果多媒體作品對(duì)文字的要求不高,那么,多媒體創(chuàng)作軟件本身就可以完成文字的錄入、編輯。如果要對(duì)文字進(jìn)行編輯與藝術(shù)加工,則要借助專業(yè)的文字處理軟件Word或WPS等。
2.圖像素材的處理
在多媒體作品中,圖像素材占據(jù)了很大的比例。處理圖像素材是制作多媒體作品之前的一項(xiàng)關(guān)鍵工作,主要分為兩大類:一是多媒體作品的界面設(shè)計(jì);二是多媒體內(nèi)容中出現(xiàn)的圖像。
設(shè)計(jì)多媒體作品的界面時(shí),要處理主界面與次界面中的背景圖像,還要制作藝術(shù)字、導(dǎo)航按鈕等,而對(duì)于多媒體作品中的圖像,主要是裁剪、調(diào)色、改變圖像大小等。目前對(duì)于圖像素材處理,最實(shí)用的軟件是Photoshop。
Photoshop是美國(guó)Adobe公司開(kāi)發(fā)的專業(yè)圖像處理軟件,是目前功能最強(qiáng)大、用戶最多的圖像編輯軟件,它提供了色彩調(diào)整、圖像修飾和各種濾鏡效果等功能。利用其強(qiáng)大的圖像編輯工具,可以有效地對(duì)圖像進(jìn)行處理、創(chuàng)意或者制作。
1990年,Photoshop版本1.0正式發(fā)行。1997年,Photoshop4.0版本發(fā)行,力挫所有競(jìng)爭(zhēng)對(duì)手,正式開(kāi)啟了全球Photoshop時(shí)代;2003年,Adobe將Photoshop8.0更名為PhotoshopCS。目前的最新版本是PhotoshopCS6,即Photoshop13.0。
Photoshop的應(yīng)用領(lǐng)域很廣泛,它已經(jīng)成為圖像處理領(lǐng)域中的行業(yè)標(biāo)準(zhǔn),在廣告設(shè)計(jì)、多媒體界面制作、網(wǎng)頁(yè)設(shè)計(jì)、數(shù)碼攝影、印刷出版等方面都有涉及。
3.聲音素材的處理
創(chuàng)作多媒體作品時(shí)經(jīng)常要用到音效、配音、背景音樂(lè)等。聲音的格式很多,如基于PC系統(tǒng)的WAV、MIDI格式,基于MAC系統(tǒng)的SND、AIF格式,這些格式之間經(jīng)常需要轉(zhuǎn)換,因此,聲音素材的采集整理需要更多軟件的支持。
音頻編輯軟件很多,用戶可以選擇一款適合自己的。
(1)?CreativeWaveStudio“錄音大師”:它是CreativeTechnology公司SoundBlasterAWE64聲卡附帶的音頻編輯軟件。在Windows環(huán)境下它可以錄制、播放和編輯8位和16位的波形音樂(lè)。
(2)?CakeWalk:是TwelveToneSystem公司開(kāi)發(fā)的音樂(lè)編輯軟件,利用它可以創(chuàng)作出具有專業(yè)水平的“計(jì)算機(jī)音樂(lè)”。
(3)?GoldWave:是GoldWave公司出品的一個(gè)聲音編輯軟件,體積小巧、功能強(qiáng)大,可以對(duì)音樂(lè)進(jìn)行播放、錄制、編輯以及轉(zhuǎn)換格式等處理。它支持的音頻格式很多,包括WAV、OGG、VOC、AIF、AFC、SND、MP3、VOX、AVI、MOV、APE等,并且可以從CD、VCD或DVD以及其他視頻文件中提取聲音,內(nèi)含豐富的音頻處理特效。
4.動(dòng)畫素材的處理
多媒體作品中使用的動(dòng)畫主要有兩種:二維動(dòng)畫和三維動(dòng)畫。通常情況下,比較普及的二維動(dòng)畫軟件是Flash,而三維動(dòng)畫軟件是3DSmax。當(dāng)然也可以使用一些小型的制作工具,如Swish、Cool3D等。
Flash前身是FutureWave公司開(kāi)發(fā)的FutureSplashAnimator,是一個(gè)基于矢量的動(dòng)畫制作軟件。1996年被Macromedia收購(gòu)后定名為Flash,由于其本身的獨(dú)特優(yōu)勢(shì),很快成為主流網(wǎng)絡(luò)動(dòng)畫制作軟件。2007年被Adobe公司收購(gòu)并進(jìn)行后續(xù)開(kāi)發(fā),目前最新版本是AdobeFlashCS6。由于越來(lái)越強(qiáng)大的AS功能,F(xiàn)lash不僅在二維動(dòng)畫制作方面表現(xiàn)突出,也常常用來(lái)開(kāi)發(fā)多媒體項(xiàng)目,所以Flash既是一個(gè)動(dòng)畫制作軟件,也是一個(gè)多媒體開(kāi)發(fā)工具。
3DSmax是目前世界上應(yīng)用最廣泛的三維建模、動(dòng)畫、渲染軟件,完全滿足制作高質(zhì)量的三維動(dòng)畫的需要。
3DSmax的前身是基于DOS操作系統(tǒng)的3DStudio系列軟件,是Discreet公司開(kāi)發(fā)的(后被Autodesk公司合并)基于PC操作系統(tǒng)的三維動(dòng)畫渲染和制作軟件。它的出現(xiàn)降低了CG制作的門檻,使得普通用戶也可以參與動(dòng)畫的制作。在多媒體制作領(lǐng)域,該軟件主要用來(lái)制作片頭、工業(yè)生產(chǎn)的過(guò)程模擬、商品模型等。
5.視頻素材的處理
視頻以其生動(dòng)、活潑、直觀的特點(diǎn),在多媒體系統(tǒng)中得到了廣泛的應(yīng)用,并扮演著極其重要的角色。例如制作企業(yè)的多媒體宣傳片、產(chǎn)品推廣宣傳片等要用到大量的視頻文件,常用的視頻素材是AVI、MOV和MPG格式的視頻文件。視頻處理軟件主要有AdobePremiere和會(huì)聲會(huì)影。
AdobePremiere是Adobe公司推出的一個(gè)功能十分強(qiáng)大的處理影視作品的視頻和音頻編輯軟件。目前最新版本為AdobePremiereProCS6,廣泛應(yīng)用于廣告制作和電視節(jié)目制作中。它可以完成視頻素材的組織與管理、剪輯處理、制作千變?nèi)f化的過(guò)渡效果與濾鏡效果、創(chuàng)建字幕、實(shí)現(xiàn)音頻與視頻的分離與合成等。
會(huì)聲會(huì)影是美國(guó)友立公司推出的一款非常著名的視頻編輯軟件,具有圖像抓取和編修功能,是操作簡(jiǎn)單、功能強(qiáng)悍的DV、HDV影片剪輯軟件,它支持各類編碼,包括音頻和視頻編碼。會(huì)聲會(huì)影不僅符合家庭或個(gè)人所需,甚至可以挑戰(zhàn)專業(yè)級(jí)的影片剪輯軟件,在國(guó)內(nèi)的普及度較高,會(huì)聲會(huì)影適合普通大眾使用,界面簡(jiǎn)潔明快,上手容易。6.2.2多媒體開(kāi)發(fā)軟件
1.Director
Director是Macromedia公司推出的一款交互式多媒體項(xiàng)目集成開(kāi)發(fā)工具,具有強(qiáng)大的面向?qū)ο箝_(kāi)發(fā)能力,用戶可以根據(jù)需要將圖片、聲音、三維動(dòng)畫、視頻電影、數(shù)據(jù)庫(kù)訪問(wèn)、Internet鏈接等技術(shù)集成在一個(gè)作品中,從而制作出復(fù)雜的多媒體交互程序,廣泛應(yīng)用于多媒體光盤、教學(xué)/匯報(bào)課件、觸摸屏軟件、網(wǎng)絡(luò)電影、網(wǎng)絡(luò)交互式多媒體查詢系統(tǒng)、企業(yè)多媒體形象展示、游戲和屏幕保護(hù)程序等的開(kāi)發(fā)制作。
1989年,Macromedia推出Director1.0,時(shí)過(guò)兩年,升級(jí)到Director2.0,加入了Lingo語(yǔ)言,使Director具有了交互功能。隨著版本的不斷升級(jí),Director的功能越來(lái)越強(qiáng)大,不僅可以使用Xtra外部模塊來(lái)擴(kuò)展Director的功能,而且Lingo的功能也逐步強(qiáng)大,幾乎可以完成各種編程要求。2005年Adobe收購(gòu)了Macromedia公司,3年后推出了Director11.0,擁有更富彈性、更易使用的創(chuàng)作環(huán)境,利用它可以創(chuàng)作出更強(qiáng)大的交互式程序、三維虛擬游戲等多媒體作品,目前的最新版本是Director12.0。
Director具有以下特點(diǎn):
(1)提供了專業(yè)的編輯環(huán)境,高級(jí)的調(diào)試工具以及方便易用的屬性面板,使得Director的操作簡(jiǎn)單方便,大大提高了開(kāi)發(fā)的效率。
(2)支持廣泛的媒體類型,包括多種圖像格式以及QuickTime、AVI、MP3、WAV、AIFF、高級(jí)圖像合成、動(dòng)畫、同步和聲音播放效果等40多種媒體類型。
(3)強(qiáng)大的交互功能使創(chuàng)作者可以隨心所欲地開(kāi)發(fā)多媒體項(xiàng)目,不熟悉編程的用戶可以通過(guò)拖放預(yù)設(shè)的Behavior完成交互的制作,而程序員則可以通過(guò)Lingo制作出更復(fù)雜的交互效果、數(shù)據(jù)跟蹤及二維和三維動(dòng)畫效果。
(4)?Director獨(dú)有的Shockwave3D引擎可以輕松地創(chuàng)建互動(dòng)的三維空間,實(shí)現(xiàn)虛擬現(xiàn)實(shí),制作交互的三維游戲,提供引人入勝的用戶體驗(yàn)。
(5)可擴(kuò)展性強(qiáng)。Director采用了Xtra體系結(jié)構(gòu),可以為Director添加無(wú)限的自定義特性和功能。
2.Authorware
Authorware是Macromedia公司開(kāi)發(fā)的多媒體制作工具。它是一種解釋型、基于流程的多媒體制作軟件,被用于創(chuàng)建互動(dòng)的程序,其中整合了聲音、文本、圖形、簡(jiǎn)單動(dòng)畫以及數(shù)字電影,是一款非常優(yōu)秀的多媒體創(chuàng)作軟件,易學(xué)易用,創(chuàng)作出來(lái)的作品效果好,非常適合初學(xué)多媒體創(chuàng)作的用戶使用。但是,遺憾的是2005年Adobe收購(gòu)Macromedia公司以后,停止了Authorware的升級(jí)與開(kāi)發(fā),但是仍然有很多Authorware愛(ài)好者使用該軟件開(kāi)發(fā)多媒體作品、匯報(bào)演示、教學(xué)課件等。
Authorware具有以下特點(diǎn):
(1)具備強(qiáng)大的集成能力。Authorware的優(yōu)勢(shì)在于支持多種格式的多媒體元素,可以將文本、圖形圖像、動(dòng)畫、視頻、聲音等多媒體素材集成到一起,并以特有的方式進(jìn)行合理的組織安排,最終以適當(dāng)?shù)男问綄⒏鞣N素材交互地表現(xiàn)出來(lái),形成一個(gè)交互性強(qiáng)、富有表現(xiàn)力的作品。
(2)具備強(qiáng)大的交互能力。Authorware具有強(qiáng)大的人機(jī)交互性,提供了按鈕、熱區(qū)域、熱對(duì)象、目標(biāo)區(qū)、下拉菜單、條件、文本輸入、按鍵、重試限制、時(shí)間限制、事件等11種交互方式,基本上可以滿足用戶的不同需要。同時(shí),為了加強(qiáng)程序的交互性,Authorware還提供了許多與交互方式有關(guān)的系統(tǒng)變量和函數(shù)。
(3)具備直觀易用的開(kāi)發(fā)界面。Authorware的工作環(huán)境中提供了一個(gè)非常直觀的“設(shè)計(jì)窗口”,窗口中有一條貫穿上下的直線,稱為“流程線”,流程線上的圖標(biāo)稱為“設(shè)計(jì)圖標(biāo)”。用戶在流程線上按照一定的規(guī)則將設(shè)計(jì)圖標(biāo)組合起來(lái),然后對(duì)設(shè)計(jì)圖標(biāo)的屬性加以適當(dāng)?shù)脑O(shè)置,就可以實(shí)現(xiàn)多媒體的整合功能,這是Authorware的一個(gè)主要特點(diǎn),是其他軟件不具備的。
(4)具備高效開(kāi)發(fā)模塊。Authorware允許將以前的開(kāi)發(fā)成果以模塊或庫(kù)的形式保存下來(lái)反復(fù)使用,這樣便于分工合作,避免大量的重復(fù)勞動(dòng)。同時(shí),Authorware還提供了一種智能化的設(shè)計(jì)模板——知識(shí)對(duì)象,開(kāi)發(fā)者可以根據(jù)需要選用不同的知識(shí)對(duì)象,完成特定的多媒體功能,大大提高了工作效率。
(5)強(qiáng)大的數(shù)據(jù)處理與編程能力。Authorware雖然是可視化編程環(huán)境,但是它提供了豐富的變量與函數(shù),而且還允許用戶自定義變量與函數(shù),以完成復(fù)雜的數(shù)據(jù)運(yùn)算。另外,它支持開(kāi)放式數(shù)據(jù)庫(kù)的連接、ActiveX技術(shù)、JavaScript技術(shù)等,可擴(kuò)展性極強(qiáng)。因此,正確運(yùn)用Authorware的腳本語(yǔ)言,可以開(kāi)發(fā)出專業(yè)多媒體應(yīng)用程序。
3.其他工具
除了前面介紹的兩個(gè)比較流行的工具外,還有一些其他的可用于多媒體開(kāi)發(fā)的工具,如Flash、PowerPoint等。
前面已經(jīng)介紹過(guò)Flash,它是目前最專業(yè)的網(wǎng)絡(luò)動(dòng)畫軟件之一。近幾年,隨著軟件功能的不斷增強(qiáng),特別是AS3.0的出現(xiàn),大大加強(qiáng)了其編程能力,被廣泛地應(yīng)用在多媒體開(kāi)發(fā)、課件制作等領(lǐng)域。
PowerPoint是微軟公司Office中的成員之一,主要用于制作演示文稿、電子講義等,是一款簡(jiǎn)單易學(xué)的多媒體軟件,可以用來(lái)制作要求不高的演示類多媒體項(xiàng)目。
Dreamweaver是目前最流行的站點(diǎn)開(kāi)發(fā)與制作工具,能夠處理多種媒體信息,可以用于開(kāi)發(fā)基于Web頁(yè)的媒體作品。
6.3圖像的基礎(chǔ)知識(shí)
6.3.1位圖與矢量圖
1.位圖
位圖又稱為“柵格圖或點(diǎn)陣圖”,由描述圖像的各個(gè)像素點(diǎn)的明暗強(qiáng)度與顏色的位數(shù)集合組成,工作方式類似于在畫布上作畫。將圖像放大到一定的程度,就會(huì)發(fā)現(xiàn)它是由一個(gè)個(gè)小柵格組成的,這些小柵格稱為像素,像素是圖像中最基本的元素,位圖圖像的大小與質(zhì)量取決于圖像中像素的多少。Photoshop編輯的圖像就是位圖,處理位圖時(shí),實(shí)際上是編輯像素而不是圖像本身。因此,在表現(xiàn)圖像中的陰影和色彩的細(xì)微變化方面或者進(jìn)行一些特殊效果處理時(shí),位圖是最佳的選擇,但是位圖的清晰度與其分辨率有關(guān),所以,利用Photoshop處理圖像時(shí),要根據(jù)實(shí)際情況設(shè)置分辨率,否則圖像中將出現(xiàn)鋸齒邊緣,甚至?xí)z漏圖像的細(xì)節(jié),如圖6-2所示。
圖6-2位圖
2.矢量圖
矢量圖由一些幾何圖形,如點(diǎn)、線、矩形、多邊形、圓和弧線等元素組成,在計(jì)算機(jī)中記錄了這些幾何圖形的形狀參數(shù)與屬性參數(shù),這些參數(shù)值決定了圖形應(yīng)如何顯示在屏幕上。例如:一個(gè)圓可以表示成圓心在(x1,y1)上,半徑為r的圖形;一個(gè)矩形可以通過(guò)指定左上角的坐標(biāo)(x1,y1)和右下角的坐標(biāo)(x2,y2)的四邊形來(lái)表示;線條可以用一個(gè)端點(diǎn)的坐標(biāo)(x1,y1)和另一個(gè)端點(diǎn)的坐標(biāo)(x2,y2)的連線來(lái)表示。當(dāng)然還可以為每種元素再加上一些屬性,如邊框線的寬度、顏色,邊框線是實(shí)線還是虛線,中間填充什么顏色等;然后把這些元素的代數(shù)式和它們的屬性作為文件存盤,就生成了所謂的矢量圖(也叫向量圖),所以矢量圖文件相對(duì)比較小,而且圖形顏色的多少與文件大小基本無(wú)關(guān)。矢量圖可以按任意分辨率進(jìn)行打印,而不會(huì)丟失細(xì)節(jié)或降低清晰度。因此,矢量圖形最適合表現(xiàn)醒目的圖形。由于矢量圖沒(méi)有精度的概念,因而任意縮放圖形都不會(huì)出現(xiàn)鋸齒,如圖6-3所示。圖6-3矢量圖6.3.2圖像文件的屬性
1.分辨率
在位圖中,圖像的分辨率是指單位長(zhǎng)度上的像素?cái)?shù),習(xí)慣上用每英寸中的像素?cái)?shù)來(lái)表示(即pixelsperinch,ppi)。相同尺寸的圖像,分辨率越高,單位長(zhǎng)度上的像素?cái)?shù)越多,圖像越清晰;分辨率越低,單位長(zhǎng)度上的像素?cái)?shù)越少,圖像越粗糙。例如,分辨率為72ppi時(shí),1×1英寸的圖像總共包含5184個(gè)像素(72像素寬×72像素高=5184)。同樣是1×1英寸,但分辨率為300ppi的圖像總共包含90000個(gè)像素,所以高分辨率的圖像通常比低分辨率的圖像表現(xiàn)出更精細(xì)的顏色變化。這里介紹的是圖像的分辨率。實(shí)際上,分辨率是一個(gè)很綜合的概念,還代表著輸入、輸出或者顯示設(shè)備的清晰度等級(jí)。我們?cè)谔幚韴D像時(shí),涉及到顯示器的分辨率、圖像的分辨率和打印機(jī)的分辨率三個(gè)方面。
顯示器的分辨率是指在顯示器屏幕上單位長(zhǎng)度顯示的像素?cái)?shù)。通常顯示器的分辨率是96ppi。在Photoshop中,圖像的像素是直接轉(zhuǎn)換為顯示器的像素的。因此,96ppi、1×1厘米的圖像在顯示器上顯示為原大??;但是192ppi、1×1厘米的圖像在顯示器上則顯示為2×2厘米。打印機(jī)的分辨率是指輸出圖像時(shí)單位長(zhǎng)度上的油墨點(diǎn)數(shù),通常以dpi表示。打印機(jī)的分辨率決定了輸出圖像的質(zhì)量。
一般地,圖像的質(zhì)量取決于圖像自身的分辨率及打印機(jī)的分辨率,而與顯示器的分辨率無(wú)關(guān)。
2.顏色深度
顏色深度也稱做位深,是指表示一個(gè)像素所需的二進(jìn)制數(shù)的位數(shù),以比特(bit)作為單位。顏色深度一般寫成2的n次方,n代表位數(shù),反映了構(gòu)成圖像顏色的總數(shù)目,位數(shù)越高,圖像的顏色越豐富。當(dāng)用1位二進(jìn)制數(shù)表示像素時(shí),即單色(黑白)圖像,這時(shí)只有黑色、白色兩種顏色,如圖6-4所示;當(dāng)用8位二進(jìn)制數(shù)表示像素時(shí),即灰度圖像,它可以由0~255不同灰度值來(lái)表示圖像的灰階,如圖6-5所示;當(dāng)位數(shù)達(dá)到24位時(shí),可以表現(xiàn)出1680萬(wàn)種顏色。一般認(rèn)為當(dāng)采用24位色彩深度時(shí)就已經(jīng)達(dá)到人眼分辨能力的極限,因此24位顏色也稱為“真彩色”。圖6-4黑白圖像圖6-5灰度圖像
3.圖像文件大小
計(jì)算機(jī)以字節(jié)(byte)為單位表示圖像文件的大小,數(shù)據(jù)量大是圖像數(shù)據(jù)的顯著特點(diǎn),即使使用壓縮算法存儲(chǔ)的文件格式,數(shù)據(jù)量也是相當(dāng)大的,圖像文件的大小與圖像所表現(xiàn)的內(nèi)容無(wú)關(guān),與圖像的尺寸、分辨率、顏色數(shù)量等文件格式有關(guān)。
一般地,圖像文件越大,所占用的計(jì)算機(jī)資源就越多,處理速度就越慢。6.3.3顏色模式
1.RGB顏色模式
RGB顏色模式是基于光色的一種顏色模式,所有發(fā)光體都是基于該模式工作的,例如,電視機(jī)、電腦顯示器、幻燈片等都是基于RGB模式來(lái)還原自然界的色彩。
在該模式下,R代表Red(紅色),G代表Green(綠色),B代表Blue(藍(lán)色),這三種顏色就是光的三原色,每一種顏色都有256個(gè)亮度級(jí)別,所以三種顏色通過(guò)不同比例的疊加就能形成約1680萬(wàn)種顏色(真彩色),幾乎可以得到大自然中所有的色彩。
通俗地理解RGB模式,可以把它想象成紅、綠、藍(lán)三盞燈,當(dāng)它們的光相互疊加的時(shí)候,就會(huì)產(chǎn)生不同的色彩,如圖6-6所示,并且每盞燈有256個(gè)亮度級(jí)別,當(dāng)值為0時(shí)表示“燈”關(guān)掉,當(dāng)值為255時(shí)表示“燈”最亮。圖6-6RGB模型圖6-7CMYK模型
2.CMYK顏色模式
CMYK顏色模式是針對(duì)印刷的一種顏色模式。印刷需要油墨,所以CMYK模式對(duì)應(yīng)的媒介是油墨(顏料)。在印刷時(shí),通過(guò)洋紅(Magenta)、黃色(Yellow)、青色(Cyan)三原色油墨進(jìn)行不同配比的混合,可以產(chǎn)生非常豐富的顏色信息,我們使用從0至100%的濃淡來(lái)控制。從理論上來(lái)說(shuō),只需要C、M、Y三種油墨就足夠了,它們?nèi)齻€(gè)100%地混合在一起就應(yīng)該得到黑色。但是由于目前制造工藝還不能造出高純度的油墨,所以C、M、Y混合后的結(jié)果實(shí)際是一種暗紅色。因此,為了滿足印刷的需要,單獨(dú)生產(chǎn)了一種專門的黑墨(Black),這就構(gòu)成了CMYK印刷4分色,如圖6-7所示。
3.HSB顏色模式
HSB顏色模式是一種從視覺(jué)的角度定義的顏色模式?;谌祟悓?duì)色彩的感覺(jué),HSB模型描述顏色的三個(gè)特征將色彩分為H(Hue,色相)、S(Saturation,飽和度)和B(Brightness,亮度)三個(gè)要素。色相即顏色的名稱,是指光經(jīng)過(guò)折射或反射后產(chǎn)生的單色光譜,即純色,它組成了可見(jiàn)光譜,并用360°的色輪來(lái)表現(xiàn);飽和度指顏色的純度或鮮濁度,表示色相中彩色成分所占的比例,用0~100%的百分比來(lái)度量;亮度指顏色的相對(duì)明暗程度,通常以0~100%的百分比來(lái)度量。
4.索引顏色模式
索引顏色模式最多使用256種顏色,當(dāng)將圖像轉(zhuǎn)換為索引顏色模式時(shí),通常會(huì)構(gòu)建一個(gè)調(diào)色板存放并索引圖像中的顏色。如果原圖像中的一種顏色沒(méi)有出現(xiàn)在調(diào)色板中,程序會(huì)選取已有顏色中最相近的顏色或使用已有顏色來(lái)模擬該種顏色。
在索引顏色模式下,通過(guò)限制調(diào)色板中顏色的數(shù)目可以減小文件大小,同時(shí)保持視覺(jué)上的品質(zhì)不變。在網(wǎng)頁(yè)中常常需要使用索引模式的圖像。6.3.4常見(jiàn)的圖像文件格式
1.JPEG格式
JPEG是JointPhotographicExpertsGroup(聯(lián)合圖像專家組)的縮寫,文件后輟名為.jpg或.jpeg,是使用最廣泛的圖像格式,是一種有損壓縮格式,能夠?qū)D像壓縮在很小的儲(chǔ)存空間內(nèi),壓縮技術(shù)十分優(yōu)越,可以用最少的磁盤空間得到較好的圖象質(zhì)量。但是要注意,使用過(guò)高的壓縮比例將會(huì)影響圖像的質(zhì)量,如果追求高品質(zhì)圖像,不宜采用過(guò)高的壓縮比例。
JPEG是一種很靈活的圖像格式,具有調(diào)節(jié)圖像質(zhì)量的功能,允許用不同的壓縮比例對(duì)圖像文件進(jìn)行壓縮,支持多種壓縮級(jí)別,壓縮比率通常在10:1到40:1之間。壓縮比越大,品質(zhì)就越低;相反地,壓縮比越小,品質(zhì)就越好。
在Photoshop中以JPEG格式儲(chǔ)存時(shí),提供了13個(gè)壓縮級(jí)別,以0~12表示。其中0級(jí)壓縮比最高,圖像品質(zhì)最差;即使采用細(xì)節(jié)幾乎無(wú)損的12級(jí)質(zhì)量保存時(shí),壓縮比也可達(dá)5:1。一幅大小為4.28Mb的BMP格式的圖像,采用JPEG格式保存時(shí),其大小僅為178Kb,壓縮比達(dá)到24:1。正是由于采用JPEG格式壓縮有損圖像質(zhì)量,所以我們?cè)诒4鍶PEG格式的圖像時(shí),需要在圖像質(zhì)量和文件尺寸之間尋找平衡點(diǎn)。
2.PSD格式
PSD是Photoshop圖像處理軟件的專用文件格式,文件擴(kuò)展名是.psd,可以支持圖層、通道、蒙版和不同色彩模式的各種圖像特征,是一種非壓縮的原始文件保存格式,所以占據(jù)的磁盤空間較大。掃描儀不能直接生成該種格式的文件。PSD文件有時(shí)容量會(huì)很大,但由于可以保留所有原始信息,在圖像處理中對(duì)于尚未制作完成的圖像,選用PSD格式保存是最佳的選擇。
現(xiàn)在,F(xiàn)lash、Director等多媒體軟件開(kāi)始支持PSD格式圖像的導(dǎo)入,這為軟件之間的配合工作提供了極大的方便。
3.PNG格式
PNG是PortableNetworkGraphics(可移植性網(wǎng)絡(luò)圖像)的縮寫,是網(wǎng)絡(luò)上接受的最新圖像文件格式。PNG能夠提供長(zhǎng)度比GIF小30%的無(wú)損壓縮圖像文件,同時(shí)提供24位和48位真彩色圖像,并且PNG格式的圖像支持背景透明,這為制作多媒體與網(wǎng)頁(yè)中的導(dǎo)航按鈕、標(biāo)題圖片等提供了非常好的支持,既可以保證圖像顏色的層次,又能夠做到背景透明。
由于PNG比較新,所以目前并不是所有的程序都支持這種格式,但Photoshop可以處理PNG圖像文件,也可以用PNG圖像文件格式進(jìn)行存儲(chǔ)。
4.BMP格式
BMP格式是Windows最早支持的位圖格式,文件幾乎不壓縮,占用磁盤空間較大,它的顏色存儲(chǔ)格式有1位、4位、8位及24位。該格式仍然是當(dāng)今應(yīng)用比較廣泛的一種格式,但由于其文件尺寸比較大,所以多應(yīng)用在單機(jī)上,不受網(wǎng)絡(luò)歡迎。
5.AI格式
AI格式是Adobe公司開(kāi)發(fā)的矢量圖象處理軟件Illustrator所使用的文件格式,也是當(dāng)今最流行的矢量圖像格式之一,廣泛應(yīng)用于印刷出版業(yè)等?,F(xiàn)已成為業(yè)界矢量圖的標(biāo)準(zhǔn),幾乎所有的圖形軟件都能導(dǎo)入AI格式。它的優(yōu)點(diǎn)是占用硬盤空間小,打開(kāi)速度快,方便格式轉(zhuǎn)換。
6.CDR格式
CDR格式是繪圖軟件CorelDRAW的專用圖形文件格式。由于CorelDRAW是矢量圖形繪制軟件,所以CDR可以記錄文件的屬性、位置和分頁(yè)等。但它在兼容度上比較差,其他圖像編輯軟件打不開(kāi)此類文件。
6.4聲音的基礎(chǔ)知識(shí)
6.4.1聲音的定義
聲音是因物體的振動(dòng)而產(chǎn)生的一種物理現(xiàn)象,振動(dòng)使物體周圍的空氣繞動(dòng)而形成聲波,聲波以空氣為媒介傳入人們的耳朵,于是人們就聽(tīng)到了聲音。因此,從物理上講,聲音是一種波。用物理學(xué)的方法分析,描述聲音特征的物理量有聲波的振幅(Amplitude)、周期(Period)和頻率(Frequency),因?yàn)轭l率和周期互為倒數(shù),所以,一般只用振幅和頻率兩個(gè)參數(shù)來(lái)描述聲音。
頻率反映聲音的高低,振幅反映聲音的大小。聲音中含有高頻成分越多,音調(diào)就越高,也就是越尖;反之則越低。聲音的振幅越大,聲音則越大,反之則越小。
需要指出的是,現(xiàn)實(shí)世界的聲音不是由某個(gè)頻率或某幾個(gè)頻率組成的,而是由許多不同頻率、不同振幅的正弦波疊加而成。6.4.2聲音的分類
聲音的分類有多種標(biāo)準(zhǔn),根據(jù)客觀需要可有以下三種分類標(biāo)準(zhǔn)。
(1)按頻率劃分,可分為亞音頻、音頻、超音頻和過(guò)音頻。頻率分類的意義主要是為了區(qū)分音頻聲音和非音頻聲音。
亞音頻(Infrasound):0Hz~20Hz。
音頻(Audio):20Hz~20kHz。
超音頻(Ultrasound):20kHz~1GHz。
過(guò)音頻(Hypersound):1GHz~1THz。
(2)按原始聲源劃分,可分為語(yǔ)音、樂(lè)音和聲響。按發(fā)出聲音的聲源分類,是為了針對(duì)不同類型的聲音使用不同的采樣頻率進(jìn)行數(shù)字化處理和依據(jù)它們產(chǎn)生的方法和特點(diǎn)采取不同的識(shí)別、合成和編碼方法。
語(yǔ)音:指人類為表達(dá)思想和感情而發(fā)出的聲音。
樂(lè)音:彈奏樂(lè)器時(shí)樂(lè)器發(fā)出的聲音。
聲響:除語(yǔ)音和樂(lè)音之外的所有聲音,如風(fēng)聲、雨聲和雷聲等自然界或物體發(fā)出的聲音。
(3)按存儲(chǔ)形式劃分,可分為模擬聲音和數(shù)字聲音。
模擬聲音:對(duì)聲源發(fā)出的聲音采用模擬方式進(jìn)行存儲(chǔ),通常采用電磁信號(hào)對(duì)聲音波形進(jìn)行模擬記錄,如用錄音帶錄制的聲音。
數(shù)字聲音:對(duì)聲源發(fā)出的聲音采用數(shù)字化處理,用0、1表示聲音的數(shù)據(jù)流或者是計(jì)算機(jī)合成的語(yǔ)音和音樂(lè)。6.4.3聲音的數(shù)字化
人們平時(shí)聽(tīng)到的聲音是典型的連續(xù)信號(hào),不僅在時(shí)間上是連續(xù)的,在幅度上也是連續(xù)的。我們把時(shí)間和幅度上都連續(xù)的信號(hào)稱為模擬信號(hào),由于計(jì)算機(jī)只能處理數(shù)字信息,所以聲音進(jìn)入計(jì)算機(jī)的第一步就是數(shù)字化,從技術(shù)上來(lái)說(shuō),就是將連續(xù)的模擬聲音信息通過(guò)模/數(shù)轉(zhuǎn)換器(A/D)轉(zhuǎn)換為計(jì)算機(jī)可以處理的數(shù)字信息。
數(shù)字化聲音的具體原理是:輸入模擬聲音信號(hào),然后按照固定的時(shí)間間隔獲取模擬聲音信號(hào)的振幅值,再將獲取的振幅值用若干二進(jìn)制數(shù)表示,從而將模擬聲音信號(hào)變成數(shù)字聲音信號(hào)。衡量聲音數(shù)字化的質(zhì)量有以下三個(gè)指標(biāo)。
(1)采樣頻率。
采樣頻率是指每秒鐘對(duì)模擬信號(hào)采取樣本的次數(shù)。采樣頻率越高,聲音的質(zhì)量也就越好。在多媒體技術(shù)中通常采用三種音頻采樣頻率:11kHz、22kHz和44kHz。一般在允許失真條件下,盡可能將采樣頻率選低些,以減少數(shù)據(jù)量。
常用的音頻采樣頻率和適用情況如下:
8kHz——適用于語(yǔ)音采樣,能達(dá)到電話語(yǔ)音音質(zhì)標(biāo)準(zhǔn)的要求;
11kHz——可用于對(duì)語(yǔ)音和最高頻率不超過(guò)5kHz的聲音采樣,能達(dá)到電話語(yǔ)音音質(zhì)標(biāo)準(zhǔn)以上,但不及調(diào)幅廣播的音質(zhì)要求;
16kHz和22kHz——適用于對(duì)最高頻率在10kHz以下的聲音采樣,能達(dá)到調(diào)幅廣播(FM)的音質(zhì)標(biāo)準(zhǔn);
44kHz和48kHz——主要用于對(duì)音樂(lè)采樣,可以達(dá)到激光唱盤的音質(zhì)標(biāo)準(zhǔn);對(duì)最高頻率在20kHz以下的聲音,一般采用44kHz的采樣頻率,可以減少對(duì)數(shù)字聲音的存儲(chǔ)開(kāi)銷。
(2)量化位數(shù)。
量化位數(shù)是指在采集聲音時(shí)使用多少二進(jìn)制位來(lái)存儲(chǔ)數(shù)字聲音信號(hào)。這個(gè)數(shù)值越大,分辨率就越高,錄制和回放的聲音就越真實(shí)。量化位數(shù)客觀地反映了數(shù)字聲音信號(hào)對(duì)輸入聲音信號(hào)描述的準(zhǔn)確程度。目前常用的有8位、12位和16位三種,位數(shù)越多,音質(zhì)越好,但存儲(chǔ)的數(shù)據(jù)量也越大。
(3)聲道數(shù)。
聲道數(shù)包括單聲道和雙聲道(立體聲)兩種。6.4.4常見(jiàn)聲音文件格式
1.WAV格式
WAV格式是微軟公司開(kāi)發(fā)的一種聲音文件格式,是最早的數(shù)字音頻格式,被Windows平臺(tái)及其應(yīng)用程序廣泛支持。
WAV格式存放的是模擬聲音波形經(jīng)數(shù)字化采樣、量化和編碼后得到的音頻數(shù)據(jù),原本由聲音波形而來(lái),所以WAV文件又稱波形文件。WAV文件對(duì)聲源類型的包容性強(qiáng),只要是聲音波形,不管是語(yǔ)音、樂(lè)音還是各種各樣的聲響,甚至于噪音都可以用WAV格式記錄并重放。
WAV格式采用44kHz的采樣頻率,16位量化位數(shù),因此WAV的音質(zhì)與CD相差無(wú)幾,但WAV格式對(duì)存儲(chǔ)空間需求太大不便于交流和傳播。
2.MP3格式
MP3的全稱是MovingPictureExpertsGroupAudioLayerIII。簡(jiǎn)單地說(shuō),MP3就是一種音頻壓縮技術(shù),由于這種壓縮方式的全稱叫MPEGAudioLayer3,所以人們把它簡(jiǎn)稱為MP3,從本質(zhì)上講仍是波形文件。MP3是利用MPEGAudioLayer3技術(shù),將音樂(lè)以1:10甚至1:12的壓縮率壓縮成容量較小的文件。換句話說(shuō),能夠在音質(zhì)丟失很小的情況下把文件壓縮到更小的程度。
正是因?yàn)镸P3體積小、音質(zhì)高的特點(diǎn)使得MP3格式成為網(wǎng)上音樂(lè)的代名詞。每分鐘MP3格式的音樂(lè)只有1MB左右大小。與一般聲音壓縮編碼方案不同,MP3主要是從人類聽(tīng)覺(jué)心理和生理學(xué)模型出發(fā)研究出的一套壓縮比高、聲音壓縮品質(zhì)又能保持很好的壓縮編碼方案。
3.WMA格式
WMA的全稱是WindowsMediaAudio,是微軟力推的一種音頻格式。WMA格式以減少數(shù)據(jù)流量但保持音質(zhì)的方法來(lái)達(dá)到更高的壓縮目的,其壓縮率一般可以達(dá)到1:18,生成的文件大小只有相應(yīng)MP3文件的一半。此外,WMA還可以通過(guò)DRM(DigitalRightsManagement)方案加入防止拷貝,或者限制播放時(shí)間和播放次數(shù),甚至是播放機(jī)器的限制,可以有力地防止盜版。
4.MIDI格式
MIDI的含義是樂(lè)器數(shù)字接口(MusicalInstrumentDigitalInterface),它本來(lái)是由全球的數(shù)字電子樂(lè)器制造商建立起來(lái)的一個(gè)通信標(biāo)準(zhǔn),以規(guī)定計(jì)算機(jī)音樂(lè)程序、電子合成器和其他電子設(shè)備之間交換信息與控制信號(hào)的方法。
MIDI文件記錄的是MIDI消息,它不是數(shù)字化后得到的波形聲音數(shù)據(jù),而是一系列指令。在MIDI文件中,包含著音符、定時(shí)和多達(dá)16個(gè)通道的演奏定義。每個(gè)通道的演奏音符又包括鍵、通道號(hào)、音長(zhǎng)、音量和力度等信息。顯然,MIDI文件記錄的是一些描述樂(lè)曲如何演奏的指令而非樂(lè)曲本身。
與波形聲音文件相比,同樣演奏長(zhǎng)度的MIDI音樂(lè)文件比波形音樂(lè)文件所需的存儲(chǔ)空間要少很多。例如,同樣30分鐘的立體聲音樂(lè),MIDI文件大約只需200kB,而波形文件大約要300MB。MIDI格式的文件一般用.mid作為文件擴(kuò)展名。
6.5視頻的基礎(chǔ)知識(shí)
6.5.1視頻的定義與分類
視頻(Video)是由一幅幅單獨(dú)的畫面(稱為幀F(xiàn)rame)序列組成,這些畫面以一定的速率(幀率fps,即每秒播放幀的數(shù)目)連續(xù)地投射在屏幕上,與連續(xù)的音頻信息在時(shí)間上同步,使觀察者具有對(duì)象或場(chǎng)景在運(yùn)動(dòng)的感覺(jué)。所以就其本質(zhì)而言,視頻是內(nèi)容隨時(shí)間變化的一組動(dòng)態(tài)圖像,所以視頻又叫運(yùn)動(dòng)圖像或活動(dòng)圖像。
在視頻文件中,一幀就是一幅靜態(tài)畫面,快速連續(xù)地顯示幀就會(huì)形成運(yùn)動(dòng)的圖像,每秒鐘顯示幀數(shù)越多,所顯示的動(dòng)作就會(huì)越流暢。根據(jù)實(shí)驗(yàn),人們發(fā)現(xiàn)要想看到連續(xù)不閃爍的畫面,幀與幀之間的時(shí)間間隔最少要達(dá)到二十四分之一秒。
視頻與圖像是兩個(gè)既有聯(lián)系又有區(qū)別的概念:靜止的圖片稱為圖像(Image),運(yùn)動(dòng)的圖像稱為視頻(Video)。視頻與圖像兩者的信號(hào)源不同,視頻的輸入是攝像機(jī)、錄像機(jī)、影碟機(jī)以及可以輸出連續(xù)圖像信號(hào)的設(shè)備;圖像的輸入靠掃描儀、數(shù)碼相機(jī)等設(shè)備。
按照視頻的存儲(chǔ)和處理方式不同,視頻可分為模擬視頻和數(shù)字視頻兩大類。
(1)模擬視頻。
模擬視頻(AnalogVideo)屬于傳統(tǒng)的電視視頻信號(hào)的范疇,模擬視頻信號(hào)是基于模擬技術(shù)以及圖像顯示的國(guó)際標(biāo)準(zhǔn)來(lái)產(chǎn)生視頻畫面的。早期視頻的記錄、存儲(chǔ)和傳輸都采用模擬方式,例如在電視上所見(jiàn)到的視頻圖像,它是以一種模擬電信號(hào)的形式來(lái)記錄的,并依靠模擬調(diào)幅的手段在空間傳播,再用盒式磁帶錄像機(jī)將其作為模擬信號(hào)存放在磁帶上。模擬視頻具有如下特點(diǎn):
以模擬電信號(hào)的形式來(lái)記錄信息。
依靠模擬調(diào)幅的手段在空間傳播。
使用磁帶錄像機(jī)將視頻作為模擬信號(hào)存放在磁帶上。
模擬視頻不適合網(wǎng)絡(luò)傳輸,在傳輸效率方面先天不足,而且圖像隨時(shí)間和頻道的衰減較大,不便于分類、檢索和編輯。
(2)數(shù)字視頻。
數(shù)字視頻(DigitalVideo)是對(duì)模擬視頻信號(hào)進(jìn)行數(shù)字化后的產(chǎn)物,它是基于數(shù)字技術(shù)記錄視頻信息的。模擬視頻可以通過(guò)視頻采集卡將模擬視頻信號(hào)進(jìn)行A/D(模/數(shù))轉(zhuǎn)換,這個(gè)轉(zhuǎn)換過(guò)程就是視頻捕捉(或采集)過(guò)程,將轉(zhuǎn)換后的信號(hào)采用數(shù)字壓縮技術(shù)存入計(jì)算機(jī)磁盤中就成為數(shù)字視頻。數(shù)字視頻具有如下特點(diǎn):
數(shù)字視頻可以不失真地進(jìn)行無(wú)數(shù)次復(fù)制。
數(shù)字視頻便于長(zhǎng)時(shí)間的存放而不會(huì)有任何的質(zhì)量降低。
可以對(duì)數(shù)字視頻進(jìn)行非線性編輯,并可增加特技效果等。
數(shù)字視頻數(shù)據(jù)量大,在存儲(chǔ)與傳輸?shù)倪^(guò)程必須進(jìn)行壓縮編碼。6.5.2數(shù)字視頻壓縮標(biāo)準(zhǔn)
未壓縮的數(shù)字視頻數(shù)據(jù)量是非常大的,因而需要采用有效的途徑對(duì)其進(jìn)行壓縮。人們從視頻數(shù)據(jù)的冗余可能出發(fā),分析研究出一系列編碼壓縮算法,其方法可分為幀內(nèi)壓縮和幀間壓縮兩種。
與音頻壓縮編碼相類似,為了使圖像信息系統(tǒng)及設(shè)備具有普遍的交互操作性,一些相關(guān)的國(guó)際化組織先后審議制定了一系列有關(guān)圖像編碼的標(biāo)準(zhǔn),其中MPEG系列標(biāo)準(zhǔn)由運(yùn)動(dòng)圖像專家組(MovingPictureExpertsGroup)制定。
MPEG系列標(biāo)準(zhǔn)包含MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21等5個(gè)具體標(biāo)準(zhǔn),每種編碼都有各自的目標(biāo)問(wèn)題和特點(diǎn)。
1.MPEG-1
MPEG-1標(biāo)準(zhǔn)于1988年5月提出,1992年11月形成國(guó)際標(biāo)準(zhǔn)。它的設(shè)計(jì)思想是在1~1.5Mb/s的低帶寬條件下提供盡可能高的圖像質(zhì)量(包括音頻,以下所指圖像均包括音頻)。這是世界上第一個(gè)用于運(yùn)動(dòng)圖像及其伴音的編碼標(biāo)準(zhǔn),主要應(yīng)用于VCD,圖像尺寸為352像素?×?288像素,標(biāo)準(zhǔn)帶寬為1.2Mb/s,每秒30幀。
2.MPEG-2
MPEG-2發(fā)布于1994年,設(shè)計(jì)目標(biāo)是高級(jí)工業(yè)標(biāo)準(zhǔn)的圖象質(zhì)量以及更高的傳輸率,能提供的傳輸率在3~10Mb/s之間,其在NTSC制式下的分辨率可達(dá)720像素×486像素,MPEG-2可提供廣播級(jí)的視頻和CD級(jí)的音質(zhì)。MPEG-2的音頻編碼可提供左、右、中及兩個(gè)環(huán)繞聲道,以及一個(gè)加重低音聲道和多達(dá)7個(gè)伴音聲道。
由于MPEG-2在設(shè)計(jì)時(shí)的巧妙處理。使得大多數(shù)MPEG-2解碼器也可播放MPEG-1格式的數(shù)據(jù),如VCD。MPEG-2除了作為DVD的指定標(biāo)準(zhǔn)外,還可用于為廣播、有線電視網(wǎng)、電纜網(wǎng)絡(luò)以及衛(wèi)星直播提供廣播級(jí)的數(shù)字視頻。
3.MPEG-4
MPEG-4標(biāo)準(zhǔn)于1993年提出,1998年發(fā)布。MPEG-4是為了播放流式媒體的高質(zhì)量視頻而專門設(shè)計(jì)的,它可利用很窄的帶寬,通過(guò)幀重建技術(shù)壓縮和傳輸數(shù)據(jù),以求使用最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。
該標(biāo)準(zhǔn)是一種基于對(duì)象的視音頻編碼標(biāo)準(zhǔn)。MPEG-4
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年房地產(chǎn)經(jīng)紀(jì)服務(wù)合同范本大全3篇
- 9 生物與非生物 教學(xué)實(shí)錄-2023-2024學(xué)年科學(xué)四年級(jí)下冊(cè)冀人版
- 2024年中國(guó)鹽漬豬大腸頭梢子市場(chǎng)調(diào)查研究報(bào)告
- 2024至2030年中國(guó)地層清洗劑行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024年標(biāo)準(zhǔn)化小學(xué)食堂經(jīng)營(yíng)承包合同版B版
- 2024年中國(guó)熱毒清片市場(chǎng)調(diào)查研究報(bào)告
- 2024年中國(guó)便攜式調(diào)光硅箱市場(chǎng)調(diào)查研究報(bào)告
- 2024年度水利局行政執(zhí)法委托合同(含培訓(xùn))3篇
- 2024年度綠色環(huán)保技術(shù)研發(fā)與應(yīng)用投標(biāo)邀請(qǐng)函范文3篇
- 臨沂大學(xué)《生物芯片技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 數(shù)學(xué)名詞中英文詞匯表
- 甲醇-水精餾填料塔的設(shè)計(jì)
- 吹風(fēng)機(jī)成品過(guò)程質(zhì)量控制檢查指引
- 中介人合作協(xié)議(模版)
- 財(cái)務(wù)管理制度-家電行業(yè)
- 班主任工作滿意度測(cè)評(píng)表
- 德國(guó)WMF壓力鍋使用手冊(cè)
- 瀝青路面施工監(jiān)理工作細(xì)則
- 《尋找消失的爸爸》(圖形)
- 《孤獨(dú)癥兒童-行為管理策略及行為治療課程》讀后總結(jié)
- 人教版八年級(jí)上冊(cè)英語(yǔ)單詞表默寫版(直接打印)
評(píng)論
0/150
提交評(píng)論