計算機(jī)網(wǎng)絡(luò)與多媒體課件-第4章_第1頁
計算機(jī)網(wǎng)絡(luò)與多媒體課件-第4章_第2頁
計算機(jī)網(wǎng)絡(luò)與多媒體課件-第4章_第3頁
計算機(jī)網(wǎng)絡(luò)與多媒體課件-第4章_第4頁
計算機(jī)網(wǎng)絡(luò)與多媒體課件-第4章_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第4章多媒體音視頻技術(shù)4.1數(shù)字視頻基礎(chǔ)4.2數(shù)字視頻的采集與處理4.3視頻新技術(shù)簡介4.4數(shù)字音頻技術(shù)本章小結(jié)

思考與設(shè)計

4.1數(shù)字視頻基礎(chǔ)

4.1.1視頻的基本概念

1.視頻的定義視頻是指連續(xù)隨時間變化的一組圖像,也稱為運(yùn)動圖像或活動圖像。由于人的眼睛存在一種視覺殘留現(xiàn)象,即物體的映像在眼睛的視網(wǎng)膜上會保留大約0.1秒的短暫時間。因此,只要將一系列連續(xù)的圖像以足夠快的速度播放,人眼就會覺得畫面是連續(xù)活動的。

Video:Video一詞(源自于拉丁語的“我看見”)通常指各種動態(tài)影像的儲存格式,例如:數(shù)位視頻格式,包括DVD、QuickTime與MPEG-4,以及類比的錄像帶,包括VHS與Betamax。

幀:幀是一個完整且獨立的窗口視圖,作為要播放的視圖序列的一個組成部分。

幀速率:幀速率為每秒播放的幀數(shù),兩幅連續(xù)幀之間的播放時間間隔即延時通常是恒定的。

2.視頻的分類

按照處理方式不同,視頻可以分為模擬視頻和數(shù)字視頻兩種。

1)模擬視頻

模擬視頻是用于記錄視頻圖像和聲音,并隨時間連續(xù)變化的電磁信號。早期的視頻都是采用模擬方式存儲、處理和傳輸?shù)?。但模擬視頻在復(fù)制、傳輸?shù)确矫娲嬖诓蛔悖膊焕诜诸?、檢索和編輯。

2)數(shù)字視頻

數(shù)字視頻是將模擬視頻信號進(jìn)行數(shù)字化處理后得到的視頻信號。數(shù)字視頻與模擬視頻相比在存儲、復(fù)制、編輯、檢索和傳輸?shù)确矫嬗兄豢杀葦M的優(yōu)勢。數(shù)字化后的視頻具有便于編輯處理,有利于視頻再現(xiàn),便于分類和檢索的優(yōu)點。

4.1.2視頻信號的可視表示

縱橫比是視頻寬與高的比例關(guān)系,如圖4-1所示。傳統(tǒng)視頻都采用寬比高為4∶3的比例,如我們常用的600?×?480、800?×?600、1024?×?768等屏幕分辨率。

圖4-1視頻的縱橫比

視頻能以交錯掃描或循序掃描來傳送。交錯掃描是早年廣播技術(shù)不發(fā)達(dá)、帶寬甚低時用來改善畫質(zhì)的方法,NTSC、PAL與SECAM皆為交錯掃描格式。在循序掃描系統(tǒng)當(dāng)中,每次畫面更新時都會刷新所有的掃描線。

視頻分辨率,即各種電視規(guī)格分辨率比較視頻的畫面大小稱為“分辨率”。數(shù)位視頻以像素為度量單位,而類比視頻以水平掃描線數(shù)量為度量單位。

4.1.3模擬電視制式與信號類型

1.模擬電視制式

NTSC(全國電視系統(tǒng)委員會制式):基于調(diào)幅技術(shù),30幀/秒,525線,美國、日本使用。

PAL(逐行倒相制式):基于調(diào)幅技術(shù),25幀/秒,625線,中國、西歐使用。

SECAM(順序與存儲彩色電視系統(tǒng)):基于調(diào)頻技術(shù),25幀/秒,625線,法國、東歐使用。

2.模擬視頻信號類型

(1)高頻或射頻信號:電視節(jié)目的信號在空中傳輸前,必須被調(diào)制成高頻或射頻信號,每個信號占用一個頻道,以防止多路節(jié)目互相干擾。傳統(tǒng)無線電視、有線電視都是使用這種信號進(jìn)行傳輸?shù)摹?/p>

(2)復(fù)合視頻信號:它是將電視信號中的亮度、色差和同步信號復(fù)合而成的單一信號,即將全電視信號分離出伴音后的信號。這種信號的帶寬較低,一般只有水平240線左右的分辨率。

(3)分量視頻信號:它將視頻中的每個基色分量,如RGB、YUV或YIQ分別作為獨立的信號進(jìn)行傳送。

(4)

S-Video信號:它是一種兩分量視頻信號,將亮度和色度信號分為兩路進(jìn)行傳送,是復(fù)合信號和分量信號之間的一種折中方案。由于減少了色度和亮度信號的相互干擾,S-Video信號的水平分辨率可達(dá)420線,比復(fù)合信號的效果要好得多。

如圖4-2所示,為各類視頻信號線實例圖。

圖4-2視頻信號線分類

4.1.4視頻的數(shù)字化

視頻數(shù)字化是指以一定的速度對模擬視頻信號進(jìn)行采樣、量化等處理生成數(shù)字信號的過程,該過程主要包括色彩空間的轉(zhuǎn)換、光柵掃描的轉(zhuǎn)換以及分辨率的統(tǒng)一等。

模擬視頻數(shù)字化的方法主要有復(fù)合數(shù)字化和分量數(shù)字化兩種,目前使用得較多的是后一種。分量數(shù)字化法先把復(fù)合視頻信號中的亮度和色度分離,得到Y(jié)UV或YIQ分量,然后用三個模/數(shù)(A/D)轉(zhuǎn)換器對三個分量分別進(jìn)行數(shù)字化處理,最后再轉(zhuǎn)換成RGB空間。

電視圖像的數(shù)字化通常有以下兩種:

(1)先從復(fù)合彩色電視圖像中分離出彩色分量,如YUV、YIQ、RGB,然后用三個A/D轉(zhuǎn)換器分別對之進(jìn)行數(shù)字化處理。

(2)用一個高速A/D轉(zhuǎn)換器對彩色信號進(jìn)行數(shù)字化處理,然后在數(shù)字域中進(jìn)行分離,獲得分量數(shù)據(jù)。

4.1.5視頻編碼技術(shù)標(biāo)準(zhǔn)

由于視頻數(shù)字化后的數(shù)據(jù)量十分巨大,因此必須對數(shù)字視頻進(jìn)行壓縮編碼,所以視頻編碼技術(shù)也稱為視頻壓縮技術(shù)。目前最常用的視頻編碼標(biāo)準(zhǔn)是MPEG和H.26x標(biāo)準(zhǔn)兩大類。

1.MPEG標(biāo)準(zhǔn)

MPEG的全稱是MovingPictureExpertsGroup(運(yùn)動圖像專家組),是國際標(biāo)準(zhǔn)化組織(ISO)和國際電工委員會(IEC)建立的聯(lián)合技術(shù)委員會1(JTC1)的第29分委員會(SC29)的第11工作組。

2.H.26x標(biāo)準(zhǔn)

H.26x標(biāo)準(zhǔn)是指由國際電信同盟遠(yuǎn)程通信標(biāo)準(zhǔn)化組(ITU-T)制定的一系列視頻編碼標(biāo)準(zhǔn),該組織的前身是國際電報與電話咨詢委員會(CCITT)。H.26x主要應(yīng)用于實時視頻通信領(lǐng)域,包括H.261、H.262、H.263和H.264等標(biāo)準(zhǔn),其中H.262標(biāo)準(zhǔn)等同于MPEG-2標(biāo)準(zhǔn),H.264標(biāo)準(zhǔn)則被納入了MPEG-4標(biāo)準(zhǔn)的第10部分。

4.1.6常見視頻文件格式

1.蘋果公司的MOV

QuickTime制定了其稱做QuickTimeMovie的多媒體文件格式。它的跨平臺能力是毋庸置疑的,目前QuickTimeMovie格式正日趨普及。

2.微軟的AVI

AVI文件格式是從微軟公司W(wǎng)IN3.1就開始出現(xiàn)的生命力不息的舊視頻格式,采用的是音頻視頻交錯技術(shù)。其算法具有可伸縮性,兼容好、調(diào)用方便、圖像質(zhì)量好,但是文件體積過于龐大。

3.RealNetwork公司的RM

RM是RealNetworks公司所制定的視頻壓縮規(guī)范RealMedia中的一種。RealMedia是目前Internet上最流行的跨平臺的客戶/服務(wù)器結(jié)構(gòu)多媒體應(yīng)用標(biāo)準(zhǔn),其采用音頻/視頻流和同步回放技術(shù)實現(xiàn)了網(wǎng)上全帶寬的多媒體回放技術(shù)。在RealMedia規(guī)范中主要包括三類文件:RealAudio、RealVideo和RealFlash。

4.MPEG-4

MPEG-4采用最新視頻壓縮方案,有DivX和Microsoft兩個版本。DivX的制作者是一名國外的電腦玩家,而DivX其實是由Microsoft的MPEG-4視頻格式與MP3音頻格式結(jié)合而成的。

5.ASF

ASF是一種數(shù)據(jù)格式,最大優(yōu)點就是體積小,因此適合網(wǎng)絡(luò)傳輸,使用微軟公司的最新媒體播放器(MicrosoftWindowsMediaPlayer)可以直接播放該格式的文件。

6.WMV

WMV是Microsoft公司出品的視頻格式文件,希望用其取代QuickTime之類的技術(shù)標(biāo)準(zhǔn)以及WAV、AVI之類的文件擴(kuò)展名。

7.FLV

FLV流媒體格式是一種新的視頻格式,全稱為FlashVideo。由于它形成的文件極小、加載速度極快,使得網(wǎng)絡(luò)觀看視頻文件成為了可能。它的出現(xiàn)有效地解決了視頻文件導(dǎo)入Flash后,使導(dǎo)出的SWF文件體積龐大而不能在網(wǎng)絡(luò)上很好使用等缺點。

4.2數(shù)字視頻的采集與處理

4.2.1視頻采集系統(tǒng)

1.視頻的采集視頻采集是指通過視頻采集設(shè)備將模擬視頻轉(zhuǎn)換成數(shù)字視頻,并以數(shù)字視頻文件格式保存下來。一個視頻采集系統(tǒng)主要包括視頻信號源設(shè)備、視頻采集設(shè)備以及配置有大容量存儲設(shè)備和視頻處理軟件的高性能計算機(jī)系統(tǒng)。

2.視頻的采集過程

設(shè)置音頻和視頻源,將視頻源設(shè)備的視頻輸出與采集卡相連、音頻輸出與聲卡相連;準(zhǔn)備好多媒體計算機(jī)系統(tǒng)環(huán)境,啟動采集程序、預(yù)覽采集信號、設(shè)置采集參數(shù)后進(jìn)行采集;播放采集的視頻數(shù)據(jù),如果丟幀嚴(yán)重可以修改采集參數(shù)或優(yōu)化采集環(huán)境后重新采集,直到滿足要求;根據(jù)需要對采集的原始數(shù)據(jù)進(jìn)行簡單的編輯,如剪切掉起始處、結(jié)尾處和中間部分無用的視頻序列,減少存儲空間的占用。

4.2.2非線性編輯系統(tǒng)

非線性編輯系統(tǒng)是相對于傳統(tǒng)的使用磁帶和電影膠片的線性編輯系統(tǒng)而言的。由于傳統(tǒng)的線性編輯系統(tǒng)將視頻信號順序記錄在磁帶等介質(zhì)上,因此在編輯時也必須順序查找所需的視頻畫面。而非線性編輯系統(tǒng)將數(shù)字化的視音頻信號記錄在硬盤等介質(zhì)上,可以對任意一幀畫面進(jìn)行隨機(jī)讀取和存儲,從而可以實現(xiàn)編輯的非線性化。

非線性編輯系統(tǒng)將傳統(tǒng)的電視節(jié)目制作系統(tǒng)中的各種設(shè)備集成于一臺計算機(jī)內(nèi),利用非線性編輯軟件,如Premiere、Vegas等,對視頻圖像和聲音進(jìn)行編輯處理,再將編輯好的信號錄制在磁帶上。

與傳統(tǒng)的編輯系統(tǒng)相比,非線性編輯系統(tǒng)的設(shè)備更加小型化、功能集成度更高,可以任意地剪輯、修改、復(fù)制、調(diào)動畫面順序且都不會引起畫面質(zhì)量的下降,克服了傳統(tǒng)設(shè)備的致命弱點。隨著計算機(jī)技術(shù)的發(fā)展,非線性編輯系統(tǒng)的價格不斷下降,利用一臺多媒體計算機(jī)、一套視頻轉(zhuǎn)換卡和一套編輯軟件就可以組建一個初級的非線性編輯系統(tǒng)。

4.2.3常用視頻編輯處理軟件

常用的視頻編輯處理軟件Primere是Adobe公司開發(fā)的一種非線性視頻編輯軟件,它可以配合多種硬件對視頻進(jìn)行捕獲和輸出,能對視頻、聲音、動畫、圖像、文本等多種素材進(jìn)行編輯加工,并生成廣播級的影視文件。目前非專業(yè)人員常用的是Ulead公司開發(fā)的會聲會影(CorelVideoStudio)視頻編輯軟件(見視頻實驗部分),用戶可以利用截取、編輯、特效、覆疊、標(biāo)題、音頻與輸出等七大步驟,把影片、圖片、聲音等素材結(jié)合成視頻文件。最新版的會聲會影支持多種視頻格式以及多種攝影器材。

4.3視頻新技術(shù)簡介

4.3.1HD高清技術(shù)

HD高清是英文“HighDefinition”的中文縮寫形式,意思是“高分辨率”,共有四個含義:高清電視,高清設(shè)備,高清格式,高清電影。通常把物理分辨率達(dá)到720p以上的格式稱為高清,英文表述HighDefinition,簡稱HD。所謂全高清(FullHD),是指物理分辨率高達(dá)1920?×?1080的逐行掃描,即1080p高清,是目前頂級的高清規(guī)格。

1.HDTV

HDTV是High

DefinitionTelevision的簡稱,翻譯成中文是“高清晰度電視”的意思。HDTV技術(shù)源于DTV(DigitalTelevision)“數(shù)字電視”技術(shù),HDTV技術(shù)和DTV技術(shù)都是采用數(shù)字信號,而HDTV技術(shù)屬于DTV的最高標(biāo)準(zhǔn),擁有最佳的視頻、音頻效果。HDTV與當(dāng)前采用模擬信號傳輸?shù)膫鹘y(tǒng)電視系統(tǒng)不同,HDTV采用了數(shù)字信號傳輸。由于HDTV從電視節(jié)目的采集、制作到電視節(jié)目的傳輸,以及到用戶終端的接收全部實現(xiàn)了數(shù)字化,因此HDTV給我們帶來了極高的清晰度,分辨率最高可達(dá)1920?×?1080,幀率高達(dá)60fps,這些都是目前的DVD所無法比擬的。

高清標(biāo)準(zhǔn):美國的高清標(biāo)準(zhǔn)主要有兩種格式,分別為1280

×?720p/60和1920?×?1080

i/60;歐洲傾向于1920?×?1080i/50;其中以720p為最高格式,行頻支持為45?kHz,而1080?i/60

Hz的行頻支持只需33.75?kHz,1080?i/50

Hz的行頻要求就更低了,僅為28.125?kHz。我們經(jīng)??吹降腍DTV分辨率是1280?×?720和1920?×?1080,這對于如今的顯示器而言的確是不小的考驗,如果分辨率進(jìn)一步提高,那么將很難在現(xiàn)有的顯示器上獲得更加出色的畫質(zhì),因為此時的瓶頸在于顯示設(shè)備。

除了分辨率是HDTV的關(guān)鍵,編碼算法也是不可忽視的環(huán)節(jié)。HDTV基本可以分為MPEG2-TS、WMV-HD和H.264這三種算法,不同的編碼技術(shù)自然在壓縮比和畫質(zhì)方面有著區(qū)別。相對而言,MPEG2-TS的“壓縮比”較差,而WMV-HD和H.264更加先進(jìn)一些。而十分容易理解的是,“壓縮比”較差的編碼技術(shù)對于解碼環(huán)境的要求也比較低,也就是說在硬件設(shè)備方面的要求可以降低。

2.BD與HDDVD

BD(Blu-RayDisc),稱為藍(lán)光(Blu-ray)或藍(lán)光盤(Blu-rayDisc,縮寫為BD),利用波長較短(405?nm)的藍(lán)色激光讀取和寫入數(shù)據(jù),并因此而得名。而傳統(tǒng)DVD需要光頭發(fā)出紅色激光(波長為650?nm)來讀取或?qū)懭霐?shù)據(jù),通常來說波長越短的激光,能夠在單位面積上記錄或讀取更多的信息。

目前為止,藍(lán)光是最先進(jìn)的大容量光碟格式,BD激光技術(shù)的巨大進(jìn)步,使你能夠在一張單碟上存儲25~50?GB的文檔文件。這是現(xiàn)有(單碟)DVD的數(shù)倍。在速度上,藍(lán)光允許1到2倍或者說每秒4.5至9兆的記錄速度。

3.HDDVD

HDDVD是一種數(shù)字光儲存格式的藍(lán)色光束光碟產(chǎn)品,由HDDVD推廣協(xié)會負(fù)責(zé)制定及開發(fā)。HDDVD與其競爭對手藍(lán)光光碟相似,盤片均是和CD同樣大小(直徑為120毫米)的光學(xué)數(shù)字儲存媒介,使用405納米波長的藍(lán)光。HDDVD由東芝、NEC、三洋電機(jī)等企業(yè)組成的HDDVD推廣協(xié)會負(fù)責(zé)推廣,惠普(同時支持BD)、微軟及英特爾等相繼加入HDDVD陣營,而主流片廠環(huán)球影業(yè)亦是成員之一。

4.HDMI

高清晰度多媒體接口(HighDefinitionMultimediaInterface,HDMI)是一種數(shù)字化視頻/音頻接口技術(shù),是適合影像傳輸?shù)膶S眯蛿?shù)字化接口,其可同時傳送音頻和視頻信號,最高數(shù)據(jù)傳輸速度為5Gb/s。同時無需在信號傳送前進(jìn)行數(shù)/?;蛘吣?數(shù)轉(zhuǎn)換。HDMI可搭配寬帶數(shù)字內(nèi)容保護(hù)(HDCP),以防止具有著作權(quán)的影音內(nèi)容遭到未經(jīng)授權(quán)的復(fù)制。

5.HDMI高清線

高清晰度多媒體接口之間必須由HDMI高清線連接?,F(xiàn)根據(jù)HDMI標(biāo)準(zhǔn),高清線分為hdmi1.0、hdmi1.1、hdmi1.2、hdmi1.3、hdmi1.4。隨著技術(shù)的發(fā)展,1.0和1.1已經(jīng)淘汰了,現(xiàn)市面上多為1.2、1.3和1.4的線。但是只有1.4標(biāo)準(zhǔn)的HDMI線具有雙向傳輸能力。

6.高清技術(shù)常識

(1)高清電視機(jī)≠高清電視。高清電視機(jī)只是收視高清頻道的設(shè)備之一。用戶僅購買高清電視機(jī),并不能保證收視到高清頻道,因為收視高清頻道還需要一臺高清機(jī)頂盒。

(2)高清頻道≠標(biāo)清頻道。高清頻道是一種對現(xiàn)場的還原,具有革命性、顛覆性的視聽升級;標(biāo)清頻道是對公共頻道的延伸和補(bǔ)充,它的內(nèi)容更豐富、廣告更少??傊?,高清頻道與標(biāo)清頻道各有各的優(yōu)勢。高清電視機(jī)可以收視標(biāo)清頻道,但僅僅收視標(biāo)清頻道,是對高清電視機(jī)的浪費(fèi)。

(3)真正的高清電視?=?高清電視機(jī)?+?高清機(jī)頂盒?+?高清頻道。真正意義上的高清電視,必須具備高清電視機(jī)、高清機(jī)頂盒和高清頻道三個條件,三者缺一不可。用高清機(jī)頂盒接收信號,用高清電視機(jī)顯示出高清頻道的效果,才能看上真正的高清電視。

(4)真高清和偽高清的差別。真高清是指通過高清電視機(jī)和機(jī)頂盒等設(shè)備把有線網(wǎng)絡(luò)中傳輸?shù)母咔逡曇纛l信號如實的還原出來。

4.3.2IMAX技術(shù)

IMAX(即ImageMaximum的縮寫)是一種能夠放映比傳統(tǒng)膠片更大和更高解像度的電影放映系統(tǒng)。整套系統(tǒng)包括以IMAX規(guī)格攝制的影片拷貝、放映機(jī)、音響系統(tǒng)、銀幕等。標(biāo)準(zhǔn)的IMAX銀幕為22米寬、16米高,但完全可以在更大的銀幕上播放,而且迄今為止不斷有更大的IMAX銀幕出現(xiàn)。

IMAX會直接與導(dǎo)演團(tuán)隊合作,通過獨特的數(shù)字原底翻版技術(shù)(DMR)來銳化畫面、清除畫面顆粒和瑕疵、提升分辨率等,從而提升畫面質(zhì)量,并盡可能創(chuàng)造最優(yōu)的畫質(zhì)在世界上最好的投影系統(tǒng)中播放。這些技術(shù)僅僅是IMAX為了達(dá)到更高亮度、色彩飽和度和對比度的過程中的部分技術(shù),另外,還有在IMAX的數(shù)字原底翻版技術(shù)處理過程中,充分利用音響系統(tǒng)動態(tài)范圍的延展性對聲道進(jìn)行重新混制的技術(shù)。

IMAX的數(shù)字影院系統(tǒng)通過使用一整套的綜合IMAX專利技術(shù),讓觀眾在觀影的時候持續(xù)享有身臨其境之感。這種稱為IMAXExperience?(IMAX觀影體驗?)的體驗來自于以下幾種技術(shù)因素:

IMAX革命性的投影技術(shù),放映水晶般清晰的畫面;

IMAX強(qiáng)大的音響系統(tǒng),提供激光校準(zhǔn)的數(shù)字音響;

IMAX影院的幾何設(shè)計,最大限度拓寬觀影視野。

近期,IMAX宣布將于2013年底投放新一代數(shù)字技術(shù)。同現(xiàn)有的數(shù)字技術(shù)相比,新型IMAX數(shù)字激光投影設(shè)備將會呈現(xiàn)更為優(yōu)質(zhì)的亮度和清晰度、更廣闊的色域以及更為深邃的黑色,同時消耗的電量更少,耐用時間更長,此項技術(shù)的出現(xiàn)也將使能夠投射的屏幕寬度可以超過30米。IMAX的目標(biāo)是使人們有理由離開家庭娛樂設(shè)備,讓大家把去影院觀影當(dāng)成是不容錯過的盛事,并始終在探索的路上希望通過新方式來不斷提升觀眾的IMAX觀影體驗。無論是在技術(shù)上的進(jìn)步、影片上映時間的提前,還是包括向頂尖導(dǎo)演配備最尖端的IMAX攝像機(jī),都是為了讓它們能以超乎想象的方式表達(dá)出想要講述的故事。

4.4數(shù)字音頻技術(shù)

4.4.1數(shù)字音頻技術(shù)基本概念數(shù)字音頻是多媒體技術(shù)經(jīng)常采用的一種形式,它的主要表現(xiàn)形式是語音、自然聲和音樂。通過這些表現(xiàn)形式,能夠有力地烘托主題的氣氛,尤其對于自學(xué)型多媒體系統(tǒng)和多媒體廣告、視頻特技等領(lǐng)域,數(shù)字音頻技術(shù)顯得更加重要。

聲音是振動的波,是隨時間連續(xù)變化的物理量,聲音有3個重要指標(biāo):

振幅(Amplitude)——波的高低幅度,表示聲音的強(qiáng)弱。

周期(Period)——兩個相鄰波之間的時間長度。

頻率(Frequency)——每秒鐘振動的次數(shù),以Hz為單位。

人類一直被包圍在豐富多彩的聲音世界中,聲音是人類進(jìn)行交流和認(rèn)識自然的主要媒體形式,語音、音樂和自然之聲構(gòu)成了聲音的豐富內(nèi)涵。聲音有以下基本特點:

1.聲音的傳播方向

聲音依靠介質(zhì)的振動進(jìn)行傳播。聲源實際上是一個振動源,它使周圍的介質(zhì)(空氣、液體、固體)產(chǎn)生振動,并以波的形式進(jìn)行傳播,人耳如果感覺到這種傳播過來的振動,再反映到大腦,就意味著聽到了聲音。

2.聲音的三要素

聲音的三要素是音調(diào)、音色和音強(qiáng),就聽覺特性而言,這三者決定了聲音的質(zhì)量。

(1)音調(diào)——代表了聲音的高低。音調(diào)與頻率有關(guān),頻率越高,音調(diào)越高,反之亦然。

(2)音色——具有特色的聲音。聲音分純音和復(fù)音兩種類型。所謂純音,是指振幅和周期均為常數(shù)的聲音;復(fù)音則是具有不同頻率和振幅的混合音,大自然中的聲音大部分是復(fù)音。復(fù)音中的低頻音是“基音”,它是聲音的基調(diào),其他頻率音稱為諧音,也叫泛音。

(3)音強(qiáng)——聲音的強(qiáng)度,也叫響度,音量也是指音強(qiáng)。音強(qiáng)與聲波的振幅成正比,振幅越大,強(qiáng)度越大。CD音樂盤、MP3音樂以及其他形式的聲音強(qiáng)度是一定的,可以通過播放設(shè)備的音量控制改變聆聽的響度。

3.?dāng)?shù)字化聲音的特征

實際存儲中,人們需要將自然聲或其他種類的聲音轉(zhuǎn)換成待處理的標(biāo)準(zhǔn)數(shù)字音頻信號,這就是數(shù)字音頻的采樣,也是獲得數(shù)字化聲音的基本手段。數(shù)字化聲音有以下特征:

(1)采樣頻率。在一定的時間間隔內(nèi)采集的聲音樣本數(shù)被稱為采樣頻率。每個樣本是一個極小的聲音片段,它被轉(zhuǎn)換成二進(jìn)制數(shù)存儲,采樣次數(shù)和存儲聲音數(shù)據(jù)使用的二進(jìn)制位數(shù)直接影響還原聲音的質(zhì)量。采樣頻率越高,在一定的時間間隔內(nèi)采集的樣本數(shù)越多,音質(zhì)就越好。

(2)量化。采樣頻率只解決了音頻波形信號在時間坐標(biāo)(橫軸)上把一個波形切成若干等份的數(shù)字化問題,但是還是需要用某種數(shù)字化的方法來反映某一瞬間聲波幅度的大小(該值的大小影響音量的高低),于是就有了對聲波波形幅度的數(shù)字化表示的方法稱為“量化”?!傲炕背S昧炕粩?shù)來表示,它是指每個聲音的采樣點在計算機(jī)中用多少個二進(jìn)制位來存儲和表示。

(3)聲道數(shù)。聲音通道的個數(shù)稱為聲道數(shù),是指一次采樣所記錄產(chǎn)生的聲音波形個數(shù)。隨著聲道數(shù)的增加,占用的存儲容量將成倍增長。單聲道是產(chǎn)生一個聲音波形,只有單數(shù)據(jù)流;雙聲道(立體聲)是有左右聲道兩個數(shù)據(jù)流,產(chǎn)生兩個聲音波形;環(huán)繞立體聲有3個聲道。

(4)音頻文件數(shù)據(jù)量的計算。無論質(zhì)量如何,聲音的數(shù)據(jù)量都非常大。如不經(jīng)過壓縮,聲音的數(shù)據(jù)量的計算公式為:數(shù)據(jù)量?=?采樣頻率?×?量化位數(shù)?×?聲道數(shù)?×?持續(xù)時間/8。

4.4.2主要音頻文件格式

1.WAV文件

2.MP3格式

3.RM格式

4.WMA格式

5.AAC文件

6.OGG文件

7.APE文件

8.FLAC文件

9.MIDI文件

1.WAV文件

WAV文件又稱為波形文件。它是最基本的一種聲音格式,錄制簡單,幾乎所有的多媒體集成軟件都支持這種格式的聲音文件,這是它最大的優(yōu)點,其最大的缺點是數(shù)據(jù)量大。WAV格式是微軟公司開發(fā)的,它符合RIFF(ResourceInterchangeFileFormat)文件規(guī)范。

WAV文件的擴(kuò)展名是.wav。

2.MP3格式

MP3是一種數(shù)據(jù)音頻壓縮標(biāo)準(zhǔn)方法,全稱為MPEGLayer3,是VCD影像壓縮標(biāo)準(zhǔn)MPEG的一個組成部分,用該壓縮標(biāo)準(zhǔn)制作存儲的音樂就稱為MP3音樂。MP3音頻文件的壓縮是一種有損壓縮,能基本保持低音頻部分不失真,但MP3壓縮算法犧牲了聲音文件中12~16?kHz高音頻部分的質(zhì)量來減少文件存儲空間。

MP3文件的擴(kuò)展名是?.mp3。

3.RM格式

RM是RealMedia文件的簡稱,是Real公司開發(fā)的網(wǎng)絡(luò)流媒體文件格式。RM文件使用流媒體技術(shù)將連續(xù)的音頻分割成帶有順序標(biāo)記的數(shù)據(jù)包,這些數(shù)據(jù)包通過網(wǎng)絡(luò)進(jìn)行傳遞,接收的時候由接收方將這些數(shù)據(jù)包重新按順序組織起來播放。

RM文件的擴(kuò)展名是.rm。

4.WMA格式

WMA是WindowsMediaAudio的縮寫,是微軟公司力推的數(shù)字音樂格式,其最大的特點是具有版權(quán)保護(hù)功能,并且比MP3更強(qiáng)大的壓縮能力。WMA格式的可保護(hù)性極強(qiáng),甚至能限定播放機(jī)器、播放時間及播放次數(shù),這對于作為版權(quán)擁有者的唱片公司來說是一種相當(dāng)有用的壓縮技術(shù)。

WMA文件的擴(kuò)展名是?.wma。

5.AAC文件

AAC文件是采用MPEG-2AAC編碼標(biāo)準(zhǔn)的數(shù)字音頻文件,AAC的全稱是AdvancedAudioCoding(高級音頻編碼),它是MPEG-2標(biāo)準(zhǔn)中一種聲音感知編碼的標(biāo)準(zhǔn),也是利用人耳的聽覺特性來減少聲音數(shù)據(jù)量的,是一種有損壓縮方式。

AAC文件的擴(kuò)展名是?.aac。

6.OGG文件

OGG的全稱為OGGVobis,是一種完全免費(fèi)、開放和沒有專利限制的音頻壓縮格式。它支持多聲道,壓縮時采用的聲學(xué)模型比MP3更先進(jìn),支持可變編碼率(VBR)和平均編碼率(ABR)兩種編碼方式,可以在相對較低的數(shù)據(jù)率下實現(xiàn)比MP3更好的音質(zhì)。

OGG文件的擴(kuò)展名是?.ogg。

7.APE文件

APE是一種無損壓縮音頻格式,可以使用Monkey’sAudio這個軟件將WAVE文件壓縮為APE文件,壓縮率可達(dá)2∶1以上,并且能夠?qū)崟r解碼播放。由于是無損壓縮,將APE文件解壓縮后得到的WAVE文件可以與壓縮前的源文件完全一致,因此APE文件的音質(zhì)比MP3、AAC、WMA等有損壓縮格式要好得多。

APE文件的擴(kuò)展名是?.ape。

8.FLAC文件

FLAC的全稱為FreeLosslessAudioCodec,也是一種無損壓縮音頻格式,被編碼的聲音數(shù)據(jù)沒有信息損失。它是世界上第一個完全開放和免費(fèi)的無損音頻壓縮格式,因此使用該格式不受任何專利限制,目前已被大量的軟件和硬件產(chǎn)品所支持。

FLAC文件的擴(kuò)展名是?.flac。

9.MIDI文件

MIDI格式的聲音文件與前面介紹的幾種文件格式都不相同,它記錄的不是數(shù)字化的聲音波形數(shù)據(jù),而是一系列描述樂曲的符號指令(如按鍵、持續(xù)時間、音量、力度等),它占的存儲空間是所有聲音格式中最少的。MIDI文件的播放效果與硬件的關(guān)系很大,使用不同合成器合成的樂音差別很明顯。

MIDI文件的擴(kuò)展名一般為?.mid、.rml等。

4.4.3音頻編輯與處理

【例4.1】

CoolEdit錄制歌曲。

(1)插件安裝。安裝好CoolEditPro2.0中文版后,在軟件的安裝目錄下,新建一個“DX”文件夾,然后把所有插件都安裝到文件夾“DX”中。電腦錄歌必備的插件有:高音激勵器BBE、壓限效果器WaveC4、混響效果器Ultrafunk。插件安裝后,需要在軟件里面執(zhí)行“效果”→“刷新效果列表”操作,安裝的插件才會出現(xiàn)在軟件的“效果—DirectX”菜單下。

(2)錄音前的準(zhǔn)備。首先,把耳機(jī)作為監(jiān)聽音箱(就是說用耳機(jī)來聽伴奏音樂,若改用普通音箱,那么在錄音時會錄入伴奏音樂和人聲的混合聲音);接著,把麥克風(fēng)調(diào)試好。雙擊Windows右下角的“音量”圖標(biāo),打開“主音量”對話框,然后點擊“選項”→“屬性”菜單,調(diào)整錄音屬性。需要把“錄音”項打勾,并選中“麥克風(fēng)”一欄,其他的不要選擇,因為要錄的只是自己要唱的聲音。

(3)錄音界面。打開CoolEditPro2.0后,會自動建立一個新工程,界面如圖4-3所示。圖中,標(biāo)注1是多軌與單軌模式的切換按鈕;標(biāo)注2指錄音時要點亮“R”、“S”、“M”(分別代表“錄音狀態(tài)”、“獨奏”、“靜音”)中的“R”,表示將在該軌道中進(jìn)行錄音;標(biāo)注3是錄音鍵,點擊開始錄音(再點擊左上方的停止鍵可以結(jié)束錄音)。

圖4-3錄音界面

(4)噪音采樣。由于外部環(huán)境、電腦風(fēng)扇、麥克風(fēng)以及聲卡品質(zhì)等原因,會在聲音的錄制過程中產(chǎn)生噪音,并影響錄音質(zhì)量。因此,降噪處理是音頻的一個重要環(huán)節(jié),降噪處理首先需要對噪音進(jìn)行采樣,如圖4-4所示。

圖4-4噪音采樣

在第三軌處點亮R,點擊錄音鍵,不要出聲,先錄下一段10~20秒左右的空白噪音文件。進(jìn)入單軌模式,選擇“效果”→“噪音消除”→“降噪器”對話框,單擊“噪音采樣”按鈕,幾秒后出現(xiàn)噪聲樣本的圖樣,然后點擊“關(guān)閉”按鈕。噪音采樣結(jié)束后,噪音樣本信息已記錄進(jìn)軟件。切換回多軌模式并刪除第三軌中的噪音采樣文件,如圖4-5所示。

圖4-5噪音采樣文件

(5)導(dǎo)入伴奏音樂。右鍵單擊第一軌,選擇“插入”→“音頻文件”,導(dǎo)入伴奏音樂文件(最好選擇自己比較熟悉的歌曲,可以是mp3、wav等格式的音樂文件),如圖4-6所示。伴奏音樂可以從網(wǎng)上下載。

圖4-6導(dǎo)入伴奏音樂

(6)歌曲的跟唱錄制。準(zhǔn)備好歌

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論