《數(shù)字視頻處理及應(yīng)用》課件第1章_第1頁(yè)
《數(shù)字視頻處理及應(yīng)用》課件第1章_第2頁(yè)
《數(shù)字視頻處理及應(yīng)用》課件第1章_第3頁(yè)
《數(shù)字視頻處理及應(yīng)用》課件第1章_第4頁(yè)
《數(shù)字視頻處理及應(yīng)用》課件第1章_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1章數(shù)字視頻處理基礎(chǔ)1.1緒論1.2彩色空間1.3視頻表示1.4視頻模型1.5數(shù)字視頻格式1.6數(shù)字視頻質(zhì)量評(píng)價(jià)1.7本章小結(jié)

1.1緒論

隨著電子信息技術(shù)的發(fā)展,人們已經(jīng)能夠利用各種電子設(shè)備完成視頻信息的采集、編解碼、存儲(chǔ)、傳輸和處理等操作,為高效地分析和處理客觀世界提供了豐富的手段。

在視頻應(yīng)用系統(tǒng)中,數(shù)字視頻處理技術(shù)一直吸引著國(guó)內(nèi)外廣大科技人員,并已成為新的研究熱點(diǎn)。本節(jié)首先闡述數(shù)字視

頻處理的概念、組成及應(yīng)用,從而使讀者對(duì)數(shù)字視頻處理技術(shù)有一個(gè)基本的認(rèn)識(shí)。1.1.1數(shù)字視頻處理概述

視頻是一組在時(shí)間軸上有序排列的圖像,是二維圖像在一維時(shí)間軸上構(gòu)成的圖像序列,又稱為動(dòng)態(tài)圖像、活動(dòng)圖像或者運(yùn)動(dòng)圖像。它不僅包含靜止圖像所包含的內(nèi)容,還包含場(chǎng)景中目標(biāo)運(yùn)動(dòng)的信息和客觀世界隨時(shí)間變化的信息。電影、電視等都屬于視頻的范疇。早期的視頻主要是模擬的視頻信號(hào),如傳統(tǒng)的廣播電視信號(hào)就是一種典型的模擬視頻信號(hào),它由攝像機(jī)通過(guò)電子掃描將隨時(shí)間和空間變化的景物進(jìn)行光電轉(zhuǎn)換后,得到一維的時(shí)間函數(shù)的電信號(hào),其電平的高低反映了景物的色彩值。模擬視頻信號(hào)在傳輸、存儲(chǔ)、處理和交互操作等方面具有很大的局限性,為此,可以將視頻信號(hào)數(shù)字化,得到數(shù)字視頻信號(hào)。數(shù)字視頻信號(hào)便于傳輸、存儲(chǔ)、處理和加密,無(wú)噪聲累積,便于多媒體通信和設(shè)備的小型化。隨著數(shù)字電路和微電子技術(shù)的進(jìn)步,特別是超大規(guī)模集成電路的快速發(fā)展,數(shù)字視頻信號(hào)的優(yōu)點(diǎn)越來(lái)越突出,應(yīng)用越來(lái)越廣泛,例如高清晰度電視(HDTV)、多媒體、視頻會(huì)議、移動(dòng)視頻、監(jiān)控系統(tǒng)、醫(yī)療設(shè)備、航空航天、教育、電影等。數(shù)字視頻信號(hào)處理系統(tǒng)主要包括視頻信號(hào)的采集、數(shù)字化、視頻編解碼、存儲(chǔ)、處理、傳輸、回放等主要模塊。廣義地講,上述內(nèi)容都屬于數(shù)字視頻處理的范疇。與之相對(duì)應(yīng),狹義的數(shù)字視頻信號(hào)處理主要指對(duì)已數(shù)字化的視頻信號(hào)進(jìn)行某種特殊功能的分析和加工,如運(yùn)動(dòng)估計(jì)、視頻壓縮、運(yùn)動(dòng)對(duì)象分割、運(yùn)動(dòng)目標(biāo)跟蹤及動(dòng)態(tài)場(chǎng)景分析等。

數(shù)字視頻處理技術(shù)的發(fā)展歷史可大致分為初級(jí)階段、主流階段和高級(jí)階段。在初級(jí)階段,由于處理、存儲(chǔ)和傳輸能力的不足,計(jì)算機(jī)通常捕獲單幅視頻圖像,將其以指定的文件格式存儲(chǔ)起來(lái),再利用圖像處理技術(shù)進(jìn)行處理,將結(jié)果保存下來(lái)用于需要的各種場(chǎng)合。隨著計(jì)算機(jī)軟硬件性能的不斷提高,以及視頻采集設(shè)備、大容量存儲(chǔ)設(shè)備、視頻顯示設(shè)備等不斷升級(jí),最終使得視頻捕獲、存儲(chǔ)、播放在個(gè)人臺(tái)式機(jī)上成為可能。由此進(jìn)入數(shù)字視頻處理的主流階段,即模擬視頻不再是視頻處理的主流。這其中非常關(guān)鍵的是壓縮解壓縮(Codec)技術(shù)的成熟,壓縮可以極大地降低數(shù)據(jù)量(達(dá)數(shù)十上百倍)。

在高級(jí)階段,視音頻處理硬件與軟件技術(shù)高度發(fā)達(dá),這些都為數(shù)字視頻的流行起到了推動(dòng)作用。在這個(gè)階段,數(shù)字視頻被進(jìn)一步標(biāo)準(zhǔn)化,各種數(shù)字視頻處理的應(yīng)用不斷豐富,如智能視頻監(jiān)控、視頻增強(qiáng)、視頻濾波等。數(shù)字視頻處理的理論和技術(shù)成為研究的前沿和熱點(diǎn)。1.1.2數(shù)字視頻處理系統(tǒng)組成

一個(gè)基本數(shù)字視頻處理系統(tǒng)的構(gòu)成可用圖1-1來(lái)表示。圖中各模塊都有特定的功能,分別是輸入、輸出、存儲(chǔ)、通信、處理和分析。為完成各自的功能,每個(gè)模塊都需要一些特定的設(shè)備。圖1-1基本數(shù)字視頻處理系統(tǒng)的構(gòu)成

1.輸入模塊

視頻信號(hào)采集的常用工具包括錄像機(jī)或攝像機(jī)等。攝像機(jī)種類繁多,其工作的基本原理都是一樣的,即把光學(xué)圖像信號(hào)轉(zhuǎn)變?yōu)殡娦盘?hào),以便于存儲(chǔ)或傳輸。當(dāng)拍攝一個(gè)物體時(shí),此物體上反射的光被攝像機(jī)鏡頭收集,使其聚焦在攝像器件的受光面(如攝像機(jī)的靶面)上,再通過(guò)攝像器件把光信號(hào)轉(zhuǎn)變?yōu)殡娦盘?hào),即得到了“視頻信號(hào)”。

隨著電子技術(shù)的發(fā)展以及全球數(shù)字化進(jìn)程的推進(jìn),視頻的采集設(shè)備和采集方式有了很大的進(jìn)展,直接采集數(shù)字視頻的設(shè)備得到了廣泛的開(kāi)發(fā)和應(yīng)用。

2.輸出模塊

視頻輸出的主要功能是將經(jīng)過(guò)系統(tǒng)處理后的視頻圖像信號(hào)以用戶能感知的形式顯示出來(lái)。目前,常用的顯示設(shè)備有陰極射線熒光屏(CRT)、液晶顯示屏(LCD)、等離子體顯示屏(PDP)、場(chǎng)發(fā)射顯示板(FED)等。

在諸多顯示器中,陰極射線熒光屏的發(fā)展歷史最久,技術(shù)最成熟。液晶顯示屏的主要特點(diǎn)是高性能、彩色、高分辨率、快速、輕薄,但工藝復(fù)雜、成本高。等離子體顯示屏的主要特點(diǎn)是大屏幕、全彩色和視頻顯示,其主要應(yīng)用領(lǐng)域是公共場(chǎng)所信息顯示、廣告、電視和HDTV等。場(chǎng)發(fā)射顯示板被認(rèn)為是CRT的最好繼承者,具有CRT的優(yōu)點(diǎn),又克服了CRT體積笨重的缺點(diǎn),而且功耗較低,但其結(jié)構(gòu)復(fù)雜、封裝困難、壽命問(wèn)題還未解決,一旦壽命和制造問(wèn)題得到解決,FED將會(huì)成為新一代的顯示器。

3.存儲(chǔ)模塊

視頻數(shù)據(jù)量非常大,對(duì)存儲(chǔ)設(shè)備要求很高。視頻存儲(chǔ)設(shè)備分為內(nèi)置存儲(chǔ)和外置存儲(chǔ)兩大類,外置存儲(chǔ)又分為直連存儲(chǔ)和網(wǎng)絡(luò)存儲(chǔ)兩類。內(nèi)置存儲(chǔ)主要指本地存儲(chǔ),如光盤、磁盤、磁帶等各種存取器件。直連存儲(chǔ)依賴服務(wù)器主機(jī)操作系統(tǒng)進(jìn)行數(shù)據(jù)的IO讀寫和存儲(chǔ)維護(hù)管理,數(shù)據(jù)備份和恢復(fù)要求占用服務(wù)器主機(jī)資源(包括CPU、系統(tǒng)IO等),直連式存儲(chǔ)的數(shù)據(jù)量越大,備份和恢復(fù)的時(shí)間就越長(zhǎng),對(duì)服務(wù)器硬件的依賴和影響也就越大。網(wǎng)絡(luò)存儲(chǔ)可以分為NAS(NetworkAttachedStorage,網(wǎng)絡(luò)接入存儲(chǔ))和SAN(StorageAreaNetworks,存儲(chǔ)區(qū)域網(wǎng)絡(luò))。NAS用戶通過(guò)TCP/IP協(xié)議訪問(wèn)數(shù)據(jù),采用業(yè)界標(biāo)準(zhǔn)文件共享協(xié)議(如NFS、HTTP、CIFS)實(shí)現(xiàn)共享,使用同一個(gè)文件管理系統(tǒng)。SAN通過(guò)專用光纖通道交換機(jī)訪問(wèn)數(shù)據(jù),采用SCSI、FC-AL接口。

4.通信模塊

通信相當(dāng)于遠(yuǎn)端的存取操作。數(shù)字視頻數(shù)據(jù)量大,對(duì)通信傳輸網(wǎng)絡(luò)提出了很高的要求。在視頻通信發(fā)展初期,人們嘗試著用已有的各種通信網(wǎng)絡(luò)(普通電話網(wǎng)PSTN、綜合業(yè)務(wù)數(shù)字網(wǎng)ISDN、計(jì)算機(jī)局域網(wǎng)LAN等)作為數(shù)字視頻通信的支撐網(wǎng)絡(luò)。每種通信網(wǎng)絡(luò)均是為傳送特定的媒體而建設(shè)的,在提供數(shù)字視頻通信業(yè)務(wù)上各具特點(diǎn),同時(shí)也存在一些問(wèn)題。近十多年來(lái),通信、計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展與完善為視頻通信提供了物理上的保證。

5.處理和分析模塊

數(shù)字視頻處理是指根據(jù)人的要求對(duì)視頻圖像進(jìn)行某種處理,是視頻處理系統(tǒng)的核心和關(guān)鍵模塊,主要包括:

·在保證一定圖像質(zhì)量的前提下盡可能壓縮視頻圖像的數(shù)據(jù)量(即視頻壓縮)。由于視頻信號(hào)的數(shù)據(jù)量非常大,因此壓縮編碼技術(shù)是數(shù)字視頻處理中最為重要的一環(huán)。

·消除視頻信號(hào)產(chǎn)生、獲取和傳輸過(guò)程中引入的失真和干擾,使視頻信號(hào)盡可能逼真地重構(gòu)原始景物,如視頻濾波處理。

·根據(jù)主觀或客觀度量,盡可能地去除視頻中的無(wú)用信息而突出其主要信息,如視頻增強(qiáng)、視頻穩(wěn)像技術(shù)等。

·從視頻圖像中提取某些特征,以便對(duì)其進(jìn)行描述、分類和識(shí)別,如視頻分割、目標(biāo)檢測(cè)與跟蹤、視頻檢索等。1.1.3數(shù)字視頻處理的應(yīng)用

1.廣播電視中的應(yīng)用

廣播電視是視頻技術(shù)的傳統(tǒng)領(lǐng)域,早期的電視采用的是模擬視頻技術(shù),而數(shù)字視頻處理技術(shù)促進(jìn)了數(shù)字電視的開(kāi)發(fā)和使用。數(shù)字電視采用從節(jié)目攝制、編輯、制作、發(fā)射、傳輸、接收到節(jié)目顯示完全數(shù)字化的系統(tǒng),具有清晰度高、音頻效果好、抗干擾能力強(qiáng)、占用帶寬窄等優(yōu)點(diǎn)。數(shù)字視頻處理技術(shù)在廣播電視中的應(yīng)用主要包括:地面電視廣播、衛(wèi)星電視廣播、數(shù)字視頻廣播、衛(wèi)星電視直播、交互式電視、高清晰電視等。

2.通信領(lǐng)域中的應(yīng)用

視頻壓縮技術(shù)的發(fā)展,使得視頻信號(hào)的數(shù)碼率大大降低,而通信技術(shù)的發(fā)展又為視頻通信提供了所需的帶寬。這兩者的結(jié)合與發(fā)展,促發(fā)了視頻通信的革命。數(shù)字視頻處理技術(shù)在通信領(lǐng)域中的應(yīng)用包括視頻會(huì)議、可視電話、遠(yuǎn)程教育、遠(yuǎn)程醫(yī)療、視頻點(diǎn)播業(yè)務(wù)、移動(dòng)視頻業(yè)務(wù)、聯(lián)合計(jì)算機(jī)輔助設(shè)計(jì)、數(shù)字網(wǎng)絡(luò)圖書館、視頻監(jiān)控等。

3.計(jì)算機(jī)領(lǐng)域中的應(yīng)用

近年來(lái),由于多媒體技術(shù)的發(fā)展,視頻技術(shù)已廣泛應(yīng)用于計(jì)算機(jī)領(lǐng)域?,F(xiàn)在計(jì)算機(jī)幾乎都配置有視頻解壓縮卡、CD-ROM和視頻播放軟件,這種多媒體計(jì)算機(jī)集視頻畫面的真實(shí)性和計(jì)算機(jī)的交互性于一體,已成為當(dāng)前計(jì)算機(jī)領(lǐng)域的熱門話題。數(shù)字視頻處理技術(shù)在計(jì)算機(jī)領(lǐng)域的應(yīng)用主要包括多媒體計(jì)算機(jī)、視頻數(shù)據(jù)庫(kù)、交互式電視、三維圖形圖像、多媒體通信、動(dòng)畫設(shè)計(jì)與制作、視頻制作、虛擬顯示等。

4.其他領(lǐng)域中的應(yīng)用

在工業(yè)生產(chǎn)方面,流水線上機(jī)械零件的自動(dòng)檢測(cè)、分類、內(nèi)部結(jié)構(gòu)分析或裂縫檢測(cè)等,都可基于數(shù)字視頻處理技術(shù)實(shí)現(xiàn)。在智能交通方面的應(yīng)用包括車速、車型、車牌的識(shí)別,交通流量的監(jiān)視以及車載導(dǎo)航系統(tǒng)等。在體育方面,視頻圖像處理技術(shù)應(yīng)用于運(yùn)動(dòng)員動(dòng)作分析,能夠提高訓(xùn)練水平。此外,數(shù)字視頻處理技術(shù)在衛(wèi)星遙感、天氣預(yù)報(bào)、軍事、電子圖書館、電子新聞等方面都有廣泛的應(yīng)用。

1.2彩色空間

1.2.1色彩的形成

在自然界中,當(dāng)陽(yáng)光照射到不同的景物上時(shí),所呈現(xiàn)的色彩不同,這是因?yàn)椴煌木拔镌谔?yáng)光的照射下,反射(或透射)了可見(jiàn)光譜中的不同成分而吸收了其余部分,從而引起人眼的不同色彩視覺(jué)。例如,當(dāng)一張紙受到陽(yáng)光照射后,如果主要反射藍(lán)光譜成分,而吸收白光中的其他光譜成分,則引起藍(lán)光視覺(jué)效果,因此人們說(shuō)這是一張藍(lán)紙。可見(jiàn),色彩是與物體相關(guān)聯(lián)的,但是色彩并不只是物體本身的屬性,也不只是光本身的屬性,同一物體在不同光源照射下所呈現(xiàn)的色彩效果不同。例如當(dāng)綠光照射到藍(lán)紙上時(shí),這時(shí)的紙將呈現(xiàn)黑色??梢?jiàn)色彩的感知過(guò)程包括了光照、物體的反射和人眼的機(jī)能三方面的因素。色彩是一個(gè)心理物理學(xué)的概念,既包含主觀成分(人眼的視覺(jué)功能),又包含客觀成分(物體屬性與照明條件的綜合效果)。從視覺(jué)的角度描述色彩會(huì)用到亮度、色調(diào)和飽和度三個(gè)術(shù)語(yǔ)。亮度表示光的強(qiáng)弱;色度是指色彩的類別,如黃色、綠色、藍(lán)色等;飽和度則代表顏色的深淺程度,如淺紫色、粉紅色。當(dāng)然,在描述上述參數(shù)時(shí),還必須考慮照射光的光譜成分、物體表面反射系數(shù)的光譜特性以及人眼的光譜靈敏度三方面的影響。

色調(diào)與飽和度又合稱為色度,可見(jiàn)它既表示彩色光的顏色類別,又表示顏色的深淺程度。盡管不同波長(zhǎng)的光波所呈現(xiàn)的顏色不同,但存在這樣的現(xiàn)象:適當(dāng)比例的紅光和綠光混合,可以產(chǎn)生與黃單色光相同的彩色視覺(jué)效果,而日光也可以由紅、綠、藍(lán)三種不同波長(zhǎng)的單色光以適當(dāng)?shù)谋壤M合而成。實(shí)際上自然界中的任何一種顏色都能由這三種單色光混合而成,因而稱紅、綠、藍(lán)為三基色。人眼視網(wǎng)膜是由大量的光敏細(xì)胞組成的,按其形狀可分為桿狀細(xì)胞和錐狀細(xì)胞。桿狀細(xì)胞能夠起到感光作用,它對(duì)弱光的靈敏度要比錐狀細(xì)胞高。錐狀細(xì)胞只能在正常光照條件下才能產(chǎn)生視覺(jué)和色感。錐狀細(xì)胞又分別為紅敏細(xì)胞、綠敏細(xì)胞和藍(lán)敏細(xì)胞。紅光、綠光和藍(lán)光分別能夠激勵(lì)紅敏細(xì)胞、綠敏細(xì)胞和藍(lán)敏細(xì)胞。換句話說(shuō),當(dāng)紅光、綠光、藍(lán)光以適當(dāng)?shù)谋壤旌掀饋?lái)并同時(shí)作用在視網(wǎng)膜上時(shí),將分別激勵(lì)紅敏細(xì)胞、綠敏細(xì)胞和藍(lán)敏細(xì)胞,從而產(chǎn)生色彩感覺(jué)。這說(shuō)明自然界中任何一種色彩都可以通過(guò)紅、綠、藍(lán)三顏色混合而成,這三種顏色又稱為三基色。1.2.2彩色空間

1.RGB彩色空間

計(jì)算機(jī)彩色顯示器與彩色電視機(jī)都是采用R、G、B相加混色的原理,通過(guò)發(fā)射出三種不同強(qiáng)度的電子束,使屏幕內(nèi)側(cè)覆蓋的紅、綠、藍(lán)磷光材料發(fā)光而產(chǎn)生顏色,這種顏色的表示方法稱為RGB彩色空間表示。在多媒體計(jì)算機(jī)技術(shù)中,用得最多的是RGB彩色空間表示。根據(jù)三基色原理,用基色光單位來(lái)表示光的量,則在RGB彩色空間,任意色光F都可以用R、G、B三個(gè)不同分量的相加混合而成。

F=r[R]+g[G]+b[B](1-1)

RGB彩色空間可以用一個(gè)三維的立方體來(lái)描述,如圖1-2所示。自然界中任何一種色光都可由R、G、B三基色按不同的比例相加混合而成,當(dāng)三基色分量都為0時(shí)混合為黑色光;當(dāng)三基色分量都為1(最強(qiáng))時(shí)混合為白色光。任一顏色F都是這個(gè)立方體坐標(biāo)中的一點(diǎn),調(diào)整三色系數(shù)r、g、

b中的任一系數(shù)都會(huì)改變F的坐標(biāo)值,也即改變了F的顏色值。RGB彩色空間采用物理三基色表示,因而物理意義很清楚,適合彩色顯像管工作。然而這一體制并不適應(yīng)人的視覺(jué)特點(diǎn)。因而,產(chǎn)生了其他不同的彩色空間表示法。圖1-2RGB顏色空間

2.YUV彩色空間

用彩色攝像機(jī)來(lái)獲取圖像信息時(shí),攝像機(jī)把彩色圖像信號(hào)經(jīng)過(guò)分色棱鏡分成R0、G0、B0三個(gè)分量信號(hào),分別經(jīng)過(guò)放大和γ校正得到R、G、B,再經(jīng)過(guò)矩陣變換電路得到亮度信號(hào)Y和色差信號(hào)U、V,其中,亮度信號(hào)表示了單位面積上反射光線的強(qiáng)度,而色差信號(hào)(所謂色差信號(hào),就是指基色信號(hào)中的三個(gè)分量信號(hào)R、G、B與亮度信號(hào)之差)決定了彩色圖像信號(hào)的色調(diào)。最后發(fā)送端將Y、U、V三個(gè)信號(hào)進(jìn)行編碼,用同一信道發(fā)送出去,這就是在PAL彩色電視制式中使用的YUV彩色空間。YUV與RGB彩色空間變換的對(duì)應(yīng)關(guān)系如式(1-2)所示。(1-2)

YUV彩色空間的一個(gè)優(yōu)點(diǎn)是,它的亮度信號(hào)Y和色差信號(hào)U、V是相互獨(dú)立的,即Y信號(hào)分量構(gòu)成的黑白灰度圖與用U、V兩個(gè)色彩分量信號(hào)構(gòu)成的兩幅單色圖是相互獨(dú)立的。因?yàn)閅、U、V是獨(dú)立的,所以可以對(duì)這些單色圖分別進(jìn)行編碼。此外,利用Y、U、V之間的獨(dú)立性可解決彩色電視機(jī)與黑白電視機(jī)的兼容問(wèn)題。YUV表示法的另一個(gè)優(yōu)點(diǎn)是,可以利用人眼的視覺(jué)特性來(lái)降低數(shù)字彩色圖像的數(shù)據(jù)量。人眼對(duì)彩色圖像細(xì)節(jié)的分辨能力比對(duì)黑白圖像細(xì)節(jié)的分辨能力低得多,因此就可以降低彩色分量的分辨率而不會(huì)明顯影響圖像質(zhì)量,即可以把幾個(gè)相同像素不同的色彩值當(dāng)做相同的色彩值來(lái)處理(即大面積著色原理),從而減少了所需的數(shù)據(jù)量。在PAL彩色電視制式中,亮度信號(hào)的帶寬為4.43MHz,用以保證足夠的清晰度,而把色差信號(hào)的帶寬壓縮為1.3MHz,達(dá)到了減少帶寬的目的。在數(shù)字圖像處理的實(shí)際操作中,對(duì)亮度信號(hào)Y和色差信號(hào)U、V分別采用不同的采樣頻率。目前常用的Y、U、V采樣頻率的比例有4∶2∶2和4∶1∶1,當(dāng)然,根據(jù)要求的不同,還可以采用其他比例。例如要存儲(chǔ)R∶G∶B=8∶8∶8的彩色圖像,即R、G、B分量都用8比特表示,圖像的大小為640×480像素,那么所需要的存儲(chǔ)容量為640×480×3×8/8=921600字節(jié);如果用Y∶U∶V=4∶1∶1來(lái)表示同一幅彩色圖像,對(duì)于亮度信號(hào)Y,每個(gè)像素仍用8比特表示,而對(duì)于色差信號(hào)U、V,每4個(gè)像素用8比特表示,則存儲(chǔ)量變?yōu)?40×480×(8+4)/8=460800字節(jié),數(shù)據(jù)量減少了一半,但人眼察覺(jué)不出有明顯變化。

3.YIQ彩色空間

在NTSC彩色電視制式中可選用YIQ彩色空間,其中,Y表示亮度,I、Q是兩個(gè)彩色分量。I、Q與U、V是不相同的。人眼的彩色視覺(jué)特性表明,人眼對(duì)紅、黃之間顏色變化的分辨能力最強(qiáng);而對(duì)藍(lán)、紫之間顏色變化的分辨能力最弱。在YIQ彩色空間中,色彩信號(hào)I表示人眼最敏感的色軸,Q表示人眼最不敏感的色軸。在NTSC制式中,傳送人眼分辨能力較強(qiáng)的I信號(hào)時(shí),用較寬的頻帶(1.3~1.5MHz);而傳送人眼分辨能力較弱的Q信號(hào)時(shí),用較窄的頻帶(0.5MHz)。

YIQ與RGB彩色空間變換的對(duì)應(yīng)關(guān)系如式(1-3)所示。(1-3)

4.YCbCr彩色空間

YCbCr彩色空間是由ITU-R(國(guó)際電聯(lián)無(wú)線標(biāo)準(zhǔn)部,原國(guó)際無(wú)線電咨詢委員會(huì)CCIR)制定的彩色空間。按照CCIR601-2標(biāo)準(zhǔn),將非線性的RGB信號(hào)編碼成YCbCr,編碼過(guò)程開(kāi)始時(shí)先采用符合SMPTE-CRGB(它定義了三種熒光粉,即一種參考白光,應(yīng)用于演播室監(jiān)視器及電視接收機(jī)標(biāo)準(zhǔn)的RGB)的基色作為γ校正信號(hào)。非線性RGB信號(hào)很容易與一個(gè)常量矩陣相乘而得到亮度信號(hào)Y和兩個(gè)色差信號(hào)Cb、Cr

。YCbCr通常在圖像壓縮時(shí)作為彩色空間,而在通信中是一種非正式標(biāo)準(zhǔn)。YCbCr與RGB彩色空間變換的對(duì)應(yīng)關(guān)系如式(1-4)所示,可以看到:數(shù)字域中的彩色空間變換與模擬域中的彩色空間變換是不同的。(1-4)

1.3視頻表示

1.3.1視頻信息的特點(diǎn)

1.直觀性

人眼視覺(jué)所獲得的視頻信息具有直觀的特點(diǎn),與語(yǔ)音信息相比,由于視頻信息給人的印象更生動(dòng)、更深刻、更具體、更直接,所以視頻信息交流的效果也就更好。這是視頻通信的魅力所在。

2.確定性

“百聞不如一見(jiàn)”,即視頻信息是確定無(wú)疑的,是什么就是什么,不易與其他內(nèi)容相混淆,能保證信息傳遞的準(zhǔn)確性。而語(yǔ)音則由于方言、多義等原因可能會(huì)導(dǎo)致不同的理解。

3.高效性

人眼視覺(jué)是一個(gè)高度復(fù)雜的并行信息處理系統(tǒng),能并行快速地觀察一幅幅圖像的細(xì)節(jié),因此,獲取視頻信息的效率要比語(yǔ)音信息高得多。

4.廣泛性

人類接收的信息,約80%來(lái)自視覺(jué),即人們每天獲得的信息大部分是視覺(jué)信息。通常將人眼感覺(jué)到的客觀世界稱為景物。

5.高帶寬性

視頻信息的信息量大,視頻信號(hào)的帶寬高,使得對(duì)它的采集、處理、傳輸、存儲(chǔ)和顯示都提出了更高的要求。例如,一路PCM數(shù)字電話所需的帶寬為64kb/s,一路壓縮后的VCD質(zhì)量的數(shù)字電視要求1.5Mb/s,而一路高清晰度電視未壓縮的信息傳輸速率約為1Gb/s,壓縮后也要20Mb/s。顯然,這是為了獲得視頻信息的直觀性、確定性和高效性所需要付出的代價(jià)。1.3.2數(shù)字視頻表示

從外界所獲取的自然視頻場(chǎng)景屬于模擬視頻信號(hào),通??梢员硎緸闀r(shí)間與空間上的連續(xù)函數(shù)。所有信息在計(jì)算機(jī)內(nèi)部都是使用數(shù)字形式描述的,為便于對(duì)采集得到的視頻使用計(jì)算機(jī)進(jìn)行處理、存儲(chǔ)和傳輸,就必須將所獲取的模擬信號(hào)在時(shí)間和空間域中轉(zhuǎn)換為數(shù)字量,即視頻的數(shù)字化,其結(jié)果便是數(shù)字視頻(DigitalVideo)。模擬視頻的x、y坐標(biāo)及幅度值都是連續(xù)的,為把它轉(zhuǎn)換成數(shù)字形式,需要在坐標(biāo)和幅度上分別進(jìn)行采樣操作。數(shù)字化坐標(biāo)值稱為采樣,包括空間采樣和時(shí)間采樣;而數(shù)字化幅度值則稱為量化過(guò)程??臻g采樣以固定尺寸的正方形區(qū)域?yàn)閱挝?,采樣后每個(gè)區(qū)域使用一個(gè)固定量表示。圖像質(zhì)量直接受到采樣單元尺寸的影響:采樣單元尺寸越小,圖像分辨率越高,質(zhì)量也越好。除了在空間域內(nèi)進(jìn)行采樣,由于一個(gè)自然場(chǎng)景在時(shí)間上也是連續(xù)的,也需要在時(shí)間軸上以固定的間隔對(duì)模擬視頻信號(hào)進(jìn)行采樣,以生成不同的幀(Frame)。為了保證視頻的連續(xù)性,一般采樣時(shí)間需要小于1/20s。時(shí)間域采樣頻率越高,視頻也就越平滑,但也會(huì)使得視頻數(shù)字化后的數(shù)據(jù)量成倍增加。視頻場(chǎng)景空間與時(shí)間采樣示意圖如圖1-3所示。圖1-3視頻場(chǎng)景空間與時(shí)間采樣示意圖模擬視頻信號(hào)采樣后,得到在空間上和時(shí)間上離散的視頻信號(hào)。但是要實(shí)現(xiàn)視頻的完全數(shù)字化,還必須將采集到的視頻信號(hào)每一幀的幅值都轉(zhuǎn)化為能使用有限位數(shù)表示的數(shù)值,即量化。量化就是按照一定的規(guī)則對(duì)連續(xù)采樣值做近似表示,使得輸出的幅值為有限個(gè)比特。量化輸出的整數(shù)稱為量化級(jí),量化總是將一個(gè)范圍內(nèi)的輸入值量化為同一個(gè)輸出級(jí),所以量化必然會(huì)造成信息的損失,是一個(gè)不可逆的過(guò)程。數(shù)字視頻一般都表示為一個(gè)三維信號(hào)f(x,y,t)的形式,給定的t定義了某個(gè)時(shí)刻的一幀圖像,而x和y表示視頻幀中的行和列,標(biāo)識(shí)了圖像幀中點(diǎn)的空間位置,在該處的元素值也就是相應(yīng)的灰度值,這個(gè)點(diǎn)一般稱為圖像元素或像素(Pixel)。對(duì)于彩色圖像而言,要根據(jù)需要使用不同的顏色空間加以表示。通常在討論視頻信號(hào)處理的時(shí)候,更多地是以幀或圖像的形式進(jìn)行,直接將其表示為如下形式:

F(x,y)x=0,1,…,

M

y=0,1,…,N(1-5)這里采樣、量化后產(chǎn)生的數(shù)字圖像為M行N列,坐標(biāo)(x,y)為離散量。對(duì)于整幅圖像而言,采樣和量化的最終結(jié)果可以表示為一個(gè)二維矩陣,完整的M×N數(shù)字圖像可表示為(1-6)數(shù)字化過(guò)程中,假設(shè)離散灰度級(jí)是等間隔的,并且是區(qū)間[0,L-1]內(nèi)的整數(shù),離散灰度級(jí)L定義為L(zhǎng)=2k,存儲(chǔ)數(shù)字圖像所需比特?cái)?shù)B=M×N×k。當(dāng)一幅圖像有2k灰度級(jí)時(shí),通常稱該圖像是kbit圖像。例如一幅灰度圖像通常使用256個(gè)灰度級(jí)表示,也稱其為8bit圖像。1.3.3數(shù)字視頻的特點(diǎn)及應(yīng)用

模擬視頻在傳輸、存儲(chǔ)和交互等方面具有很大的局限性。例如,在普通模擬電視中,只有頻道選擇等簡(jiǎn)單功能;在盒式磁帶錄像機(jī)(VCR)中,只能進(jìn)行快速搜索和慢速重放等操作。模擬視頻的錄制、存儲(chǔ)非常不方便,且多次錄制、存儲(chǔ)時(shí)噪聲積累嚴(yán)重,傳輸時(shí)所疊加的噪聲(即使很小)很難消除和分開(kāi),對(duì)信道的線性特性要求較高,放大器的非線性會(huì)產(chǎn)生波形畸變;隨著傳輸距離的增加,噪聲積累越來(lái)越大,使模擬視頻信號(hào)的傳輸質(zhì)量惡化,微分增益、微分相位失真會(huì)帶來(lái)彩色失真;等等。與模擬視頻相比,數(shù)字視頻具有很多優(yōu)點(diǎn):便于傳輸和交換,便于多媒體通信,便于存儲(chǔ)、處理和加密,無(wú)噪聲積累,差錯(cuò)可控制,可通過(guò)壓縮編碼來(lái)降低數(shù)碼率,便于設(shè)備的小型化,信噪比高,穩(wěn)定可靠,交互能力強(qiáng)等。

隨著數(shù)字電路和微電子技術(shù)的進(jìn)步,特別是超大規(guī)模集成電路的快速發(fā)展,使得數(shù)字視頻的優(yōu)點(diǎn)變得越來(lái)越突出,應(yīng)用越來(lái)越廣泛。例如,高清晰度電視(HDTV)、多媒體、視頻會(huì)議、移動(dòng)視頻、監(jiān)視控制、醫(yī)療設(shè)備、航空航天、軍事、教育、電影等。

目前,數(shù)字視頻用于桌面和掌上的技術(shù)已經(jīng)成熟,也已成為消費(fèi)電子產(chǎn)業(yè)的支柱,例如,數(shù)字電視、數(shù)碼照相機(jī)和數(shù)碼攝像機(jī)等。數(shù)字視頻將會(huì)給計(jì)算機(jī)、通信和電子消費(fèi)等產(chǎn)業(yè)帶來(lái)一種革命性的“變化”。

1.4視頻模型

1.4.1照明模型

照明模型主要用于描述照明變化引起的視頻信號(hào)在時(shí)間上的變化。照明模型可分為光譜模型和幾何模型。光譜模型適用于多種彩色光源(或由不同彩色物體反射的間接光源),幾何模型適用于環(huán)境光源(照射物體時(shí)不會(huì)產(chǎn)生陰影)和點(diǎn)光源(例如聚光燈)。對(duì)每一種類型的光源,又可以分為局部照明模型和總體照明模型。局部照明模型假定照明光源與物體的位置無(wú)關(guān),總體照明模型要考慮物體間的影響(例如陰影等)。光源有兩種,即照明光源和反射光源。照明光源包括太陽(yáng)、燈泡等。照明光源的色彩感覺(jué)取決于光的波長(zhǎng)范圍。照明光源遵循相加規(guī)則。反射光源指能反射入射光的光源。當(dāng)一束光照射到物體上時(shí),一部分光被吸收,另一部分光被反射。反射光源的色彩感覺(jué)取決于入射光的光譜成分和被吸收的波長(zhǎng)范圍。反射光源遵循相減規(guī)則。在反射光中,鏡面反射可以用發(fā)亮的表面和鏡子觀察到,它只能顯示入射光的顏色,而不能顯示物體的顏色。漫反射在所有方向上都具有相同的光強(qiáng)分布。通常的表面既有漫反射也有鏡面反射,但只有漫反射才能顯示物體表面的顏色。反射光輻射強(qiáng)度的分布與入射光的光強(qiáng)fi(L,V,N,P,t,λ)和物體表面的反射系數(shù)r(L,V,N,P,t,λ)有關(guān),即

fr(L,V,N,P,t,λ)=r(L,V,N,P,t,λ)·fi(L,V,N,P,t,λ)

(1-7)

其中,P為物體表面的位置,L為照明方向,V為P點(diǎn)與攝像機(jī)焦點(diǎn)的觀測(cè)方向,N為點(diǎn)P處的表面法線矢量,λ為光的波長(zhǎng)。反射系數(shù)r(L,V,N,P,t,λ)為反射光的強(qiáng)度與入射光的強(qiáng)度之比。例如,假定照明方向L和觀測(cè)方向V固定不變,則式(1-7)可簡(jiǎn)化為

fr(N,P,t,λ)=r(N,P,t,λ)·fi(N,P,t,λ)

(1-8)當(dāng)只有環(huán)境光源fa(t,λ),且物體表面為漫反射時(shí),其反射光強(qiáng)度的分布為

fr(P,t,λ)=r(P,t,λ)·fa(t,λ)

(1-9)

當(dāng)只有點(diǎn)光源時(shí),對(duì)于局部照明模型和漫反射表面,物體表面上任意點(diǎn)P處的反射光強(qiáng)度取決于入射光方向L與該點(diǎn)處的表面法線N之間的夾角θ,即

fr(P,t,λ)=r(P,t,λ)·fp(t,λ)·cosθ

(1-10)

其中,fp(t,λ)為點(diǎn)光源的最大光強(qiáng),即光垂直于表面時(shí)的光強(qiáng)。

當(dāng)多個(gè)環(huán)境光源和點(diǎn)光源都存在時(shí),任意一點(diǎn)反射光強(qiáng)度的分布是該點(diǎn)對(duì)每個(gè)光源反射光強(qiáng)的疊加。1.4.2攝像機(jī)模型

攝像機(jī)模型描述真實(shí)場(chǎng)景中物體在攝像機(jī)成像圖像平面上的投影,即實(shí)現(xiàn)四維空間(X,Y,Z,t)到三維空間(x,y,t)的映射,有

f∶R→R3

(X,Y,Z,t)→(x,y,t)

(1-11)

其中,(X,Y,Z)為三維空間坐標(biāo)系(也稱為世界坐標(biāo)系);(x,y)為二維投影圖像平面。

1.透視投影

透視投影也稱為中心投影。以攝像機(jī)(如針孔攝像機(jī))為中心,觀察空間中的物體,可以獲得物體在二維圖像平面上的投影圖像,如圖1-4所示。其中,原點(diǎn)O為觀察點(diǎn)(或透視中心);OO'=F為焦距,表示觀察者與投影圖像平面之間的距離。從觀測(cè)點(diǎn)O觀測(cè)空間中物體上一特征點(diǎn)P(X,Y,Z),在投影圖像平面上有一投影點(diǎn)p(x,y)。觀測(cè)點(diǎn)O、物體上點(diǎn)P(X,Y,Z)和投影點(diǎn)p(x,y)在一條直線上。滿足x/F=x/Z,y/F=Y/Z(或x=F(X/Z),x=F(X/Z))的結(jié)構(gòu)稱為透視投影(或中心投影),即以觀察者為中心的投影模型。圖1-4透視投影

2.正交投影

當(dāng)物體距離攝像機(jī)很遠(yuǎn)時(shí),中心投影可用正交投影(也稱為平行投影)來(lái)近似,如圖1-5所示,即x=X,y=Y,或

其中,x、y為投影圖像的平面坐標(biāo)。(1-12)圖1-5正交投影

3.攝像機(jī)運(yùn)動(dòng)

攝像機(jī)的典型運(yùn)動(dòng)形式有跟(track,攝像機(jī)沿成像圖像平面的水平軸平移,包括左跟、右跟),吊(boom,攝像機(jī)沿成像圖像平面的垂直軸平移,包括上吊、下吊),搖(pan,攝像機(jī)繞垂直軸旋轉(zhuǎn),包括左搖、右搖),傾(tilt,攝像機(jī)繞水平軸旋轉(zhuǎn),包括上傾、下傾),滾(roll,攝像機(jī)繞光軸旋轉(zhuǎn)),變焦(攝像機(jī)改變其焦距)。

1)跟和吊

跟和吊是指攝像機(jī)沿世界坐標(biāo)系OXYZ的X軸和Y軸的平移。設(shè)攝像機(jī)的實(shí)際平移為TX

和TY,原攝像機(jī)坐標(biāo)中任意一點(diǎn)(X,Y,Z)的三維空間位置將變化到(X′,Y′,Z′),有x=F(X/Z),y=F(X/Z),

(1-13)利用x=F(X/Z),y=F(X/Z),可得到攝像機(jī)在成像圖像平面xO′y的二維空間位置變化,即(1-14)

2)搖和傾

搖和傾是指攝像機(jī)繞世界坐標(biāo)系OXYZ的X軸和Y軸旋轉(zhuǎn)。設(shè)攝像機(jī)繞X軸和Y軸的旋轉(zhuǎn)角分別為θX和θY,攝像機(jī)的新舊坐標(biāo)之間的變化關(guān)系為(1-15)其中,RX和RY分別為攝像機(jī)繞X軸和Y軸的旋轉(zhuǎn)矩陣,即(1-16)(1-17)當(dāng)旋轉(zhuǎn)角θX和θY均很小時(shí),有(1-18)

3)變焦

設(shè)F為攝像機(jī)變焦前的焦距,F(xiàn)′為攝像機(jī)變焦后的焦距,由x=F(X/Z),y=F(X/Z)可得(1-19)其中,μ=(F′/F)稱為變焦系數(shù)。

4)滾

滾是指攝像機(jī)繞Z軸旋轉(zhuǎn),即(1-20)當(dāng)攝像機(jī)繞Z軸的旋轉(zhuǎn)角θZ很小時(shí),有(1-21)1.4.3物體模型

1.形狀模型

一個(gè)三維物體的形狀由它所占據(jù)的三維空間來(lái)描述。通常由于人們不太關(guān)注物體的內(nèi)部,因此可用物體的表面來(lái)描述它的形狀。一般可采用三角形網(wǎng)格(即線框)的方法,三角形網(wǎng)格是用位于物體表面的控制點(diǎn)(頂點(diǎn))來(lái)構(gòu)建的。控制點(diǎn)的數(shù)量和位置取決于物體的形狀和三角形網(wǎng)格模型對(duì)物體形狀描述的精度。圖1-6給出了一個(gè)三角形網(wǎng)格的例子,其中控制點(diǎn)為Pi=Pi(Xi,Yi,Zi),不同的控制點(diǎn)形成了索引面。該例中有5個(gè)控制點(diǎn),構(gòu)成了分別由三個(gè)控制點(diǎn)(如控制點(diǎn)1,2,3)形成的三個(gè)控制面,其控制點(diǎn)表和索引面集分別如表1-1和表1-2所示。圖1-6表示物體表面的三角形網(wǎng)格

2.剛體運(yùn)動(dòng)模型

當(dāng)控制點(diǎn)不能被獨(dú)立地移動(dòng)和不能改變物體形狀時(shí),該物體就是剛性的;否則,就是柔性的。一個(gè)物體可以是剛性的或柔性的。

剛性物體在三維空間中的運(yùn)動(dòng)可以分解為圍繞通過(guò)原點(diǎn)的一個(gè)軸的旋轉(zhuǎn)和平移。在三維空間中,物體的旋轉(zhuǎn)可用一個(gè)3×3矩陣R來(lái)描述,平移可用一個(gè)3×1的列向量T來(lái)描述。R和T是描述剛性物體三維空間運(yùn)動(dòng)的重要參數(shù)。

假設(shè)在三維空間中一運(yùn)動(dòng)物體上的特征點(diǎn)為p,運(yùn)動(dòng)前(在t1時(shí)刻)的坐標(biāo)為p(x,y,z);運(yùn)動(dòng)后(在t2時(shí)刻)與相對(duì)應(yīng)的點(diǎn)p′的坐標(biāo)為p′(x′,y′,z′),運(yùn)動(dòng)前后應(yīng)滿足

其中,R為旋轉(zhuǎn)矩陣,定義為;T為平移

向量,定義,Δx、Δy、Δz分別為運(yùn)動(dòng)物體在x、

y、z三個(gè)方向上的平移量。

1.5數(shù)字視頻格式

1.5.1本地影像視頻

1.AVI格式

AVI(AudioVideoInter-leaved,音頻視頻交錯(cuò)格式)于1992年由Microsoft公司推出,伴隨Windows3.1一起被人們認(rèn)識(shí)和熟知。所謂音頻視頻交錯(cuò),就是可以將視頻和音頻交織在一起進(jìn)行同步播放。這種視頻格式的優(yōu)點(diǎn)是圖像質(zhì)量好,可以跨多個(gè)平臺(tái)使用,其缺點(diǎn)是占用空間太大,而且壓縮標(biāo)準(zhǔn)不統(tǒng)一。

AVI文件包含三部分:文件頭、數(shù)據(jù)塊和索引塊,如圖1-7所示。文件頭包括文件的通用信息、定義數(shù)據(jù)格式、所用的壓縮算法等參數(shù),構(gòu)成一個(gè)AVI文件的主要參數(shù)包括視像參數(shù)、伴音參數(shù)和壓縮參數(shù)等。數(shù)據(jù)塊包含實(shí)際數(shù)據(jù)流,即圖像和聲音序列數(shù)據(jù),這是文件的主體,也是決定文件容量的主要部分,視頻文件的容量等于該文件的數(shù)據(jù)率乘以該視頻播放的時(shí)間長(zhǎng)度。索引塊包括數(shù)據(jù)塊列表和它們?cè)谖募械奈恢?,以提供文件?nèi)數(shù)據(jù)的隨機(jī)存取能力。圖1-7AVI文件存儲(chǔ)格式在采集或獲取AVI文件時(shí),視像部分和伴音部分是分別采集的,只是它們通過(guò)采集程序的控制,自動(dòng)配合起來(lái)形成同步。從圖中也可以看出,在AVI文件中,視像和伴音是分別存儲(chǔ)的,因此可以把一段視頻中的視像與另一段視頻中的伴音組合在一起。AVI文件與WAV文件密切相關(guān),因?yàn)閃AV文件是AVI文件中伴音信號(hào)的來(lái)源。

有關(guān)壓縮的主要參數(shù)包括壓縮算法、圖像深度、壓縮質(zhì)量、關(guān)鍵幀等。同是AVI格式可以采用不同的壓縮算法;圖像深度即視頻中可以顯示的顏色數(shù);壓縮質(zhì)量常用百分?jǐn)?shù)表示,100%表示最佳效像壓縮;關(guān)鍵幀只有在使用幀間壓縮編碼(如幀間差值編碼)時(shí)才起作用,是其他幀壓縮時(shí)與之比較并產(chǎn)生差像的基準(zhǔn)。

2.MPEG格式

MPEG(MovingPictureExpertsGroup,活動(dòng)圖像專家組)成立于1988年,它的工作不僅局限于活動(dòng)圖像編碼,還把伴音與圖像的壓縮聯(lián)系在一起,并且根據(jù)不同的應(yīng)用場(chǎng)合,定義了不同的標(biāo)準(zhǔn)。

MPEG-1是1993年8月正式通過(guò)的技術(shù)標(biāo)準(zhǔn),其全稱為“適用于約1.5Mb/s以下數(shù)字存儲(chǔ)媒體的運(yùn)動(dòng)圖像及伴音的編碼”。這里所指的數(shù)字存儲(chǔ)媒體包括CD-ROM、DAT、硬盤、可寫光盤等。同時(shí)利用該標(biāo)準(zhǔn)也可以在1SDN或局域網(wǎng)中進(jìn)行遠(yuǎn)程通信。它的目的是把221Mb/s的NTSC圖像壓縮到1.2Mb/s,壓縮率為200∶1。它可對(duì)SIF標(biāo)準(zhǔn)分辨率(對(duì)于NTSC制為352×240;對(duì)于PAL制為352×288)的圖像進(jìn)行壓縮,傳輸速率為1.5Mb/s,每秒播放30幀,具有CD音質(zhì),質(zhì)量級(jí)別基本與VHS(廣播級(jí)錄像帶)相當(dāng)。MPEG-1的編碼速率最高可達(dá)4~5Mb/s,但隨著速率的提高,其解碼后的圖像質(zhì)量有所降低。使用MPEG-1壓縮算法可以把一部長(zhǎng)120min的電影壓縮到1.2GB左右。這種視頻格式的文件擴(kuò)展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盤中的.dat文件等。

MPEG-2是1994年11月發(fā)布的“活動(dòng)圖像及其伴音通用編碼”標(biāo)準(zhǔn),該標(biāo)準(zhǔn)可以應(yīng)用于2.048Mb/s~20Mb/s的各種速率和各種分辨率的應(yīng)用場(chǎng)合之中,如多媒體計(jì)算機(jī)、多媒體數(shù)據(jù)庫(kù)、多媒體通信、常規(guī)數(shù)字電視、高清晰度電視以及交互式電視等。MPEG-2格式主要應(yīng)用在DVD/SVCD的制作(壓縮)方面,同時(shí)在一些HDTV(高清晰電視廣播)和一些高要求的視頻編輯、處理上面也有相當(dāng)?shù)膽?yīng)用。MPEG-2能夠提供廣播級(jí)的視像和CD級(jí)的音質(zhì),其音頻編碼可提供左右中及兩個(gè)環(huán)繞聲道,以及一個(gè)加重低音聲道和多達(dá)7個(gè)伴音聲道。這種視頻格式的文件擴(kuò)展名包括.mpg、.mpe、.mpeg、.m2v及DVD光盤上的.vob文件等。MPEG-2兼容MPEG-1標(biāo)準(zhǔn),除了作為DVD的指定標(biāo)準(zhǔn)外,MPEG-2還可用于為廣播、有線電視網(wǎng)、電纜網(wǎng)絡(luò)以及衛(wèi)星直播提供廣播級(jí)的數(shù)字視頻。

1999年1月公布了MPEG-4標(biāo)準(zhǔn)的V1.0版本,同年12月公布了V2.0版本。該標(biāo)準(zhǔn)主要應(yīng)用于超低速系統(tǒng)之中,例如多媒體Internet、視頻會(huì)議和視頻電視等個(gè)人通信,交互式視頻游戲和多媒體郵件,基于網(wǎng)絡(luò)的數(shù)據(jù)業(yè)務(wù)、光盤等交互式存儲(chǔ)媒體,遠(yuǎn)程視頻監(jiān)視及無(wú)線多媒體通信,特別是它能夠滿足基于內(nèi)容的訪問(wèn)和檢索的多媒體應(yīng)用,且其編碼系統(tǒng)是開(kāi)放的,可隨時(shí)加入新的有效算法模塊。

3.MOV格式

MOV格式是由美國(guó)Apple公司開(kāi)發(fā)的一種視頻格式,可通用于MAC系統(tǒng)與PC平臺(tái),默認(rèn)的播放器是蘋果的QuickTimePlayer。MOV格式的視頻文件可以采用不壓縮或壓縮的方式,其壓縮算法包括Cinepak、IntelIndeoVideoR3.2和Video編碼,具有較高的壓縮比率和較完美的視頻清晰度,其最大的特點(diǎn)是跨平臺(tái)性,既能支持MacOS也能支持Windows系列。1.5.2網(wǎng)絡(luò)數(shù)字視頻

1.ASF格式

ASF(AdvancedStreamingFormat,高級(jí)流格式)是Microsoft為了和現(xiàn)在的Realplayer競(jìng)爭(zhēng)而發(fā)展出來(lái)的一種可以直接在網(wǎng)上觀看視頻節(jié)目的文件壓縮格式??梢灾苯邮褂肳indows自帶的播放器WindowsMediaPlayer對(duì)其進(jìn)行播放。由于它使用MPEG-4的壓縮算法,壓縮率和圖像的質(zhì)量都很不錯(cuò)。高壓縮率有利于視頻流的傳輸,但圖像質(zhì)量肯定會(huì)有損失,所以有時(shí)候ASF格式的畫面質(zhì)量不如VCD,但比同是視頻流格式的RAM格式要好。不過(guò),如果不考慮在網(wǎng)上傳播,選最好的質(zhì)量來(lái)壓縮文件的話,其生成的視頻文件比VCD(MPEG-1)好,但是,這樣就失去了ASF本來(lái)的發(fā)展初衷。

2.WMV格式

WMV(WindowsMediaVideo)也是Microsoft推出的一種采用獨(dú)立編碼方式并且可以直接在網(wǎng)上實(shí)時(shí)觀看視頻節(jié)目的文件壓縮格式。WMV格式的主要優(yōu)點(diǎn)包括相比MPEG、VOB格式同等畫質(zhì)時(shí)文件相對(duì)較小、本地或網(wǎng)絡(luò)回放、可擴(kuò)充的媒體類型、部件下載、可伸縮的媒體類型、流的優(yōu)先級(jí)化、多語(yǔ)言支持、環(huán)境獨(dú)立性、豐富的流間關(guān)系以及擴(kuò)展性。它是由ASF格式升級(jí)延伸來(lái)的,在同等視頻質(zhì)量下,WMV格式的體積非常小(RM格式也很小,是不同的技術(shù)相同的應(yīng)用),因此也很適合在網(wǎng)上播放和傳輸。

3.RM格式

RealNetworks公司制定的音頻/視頻壓縮規(guī)范,稱為RealMedia,可以使用RealPlayer或RealOnePlayer對(duì)符合RealMedia技術(shù)規(guī)范的網(wǎng)絡(luò)音頻/視頻資源進(jìn)行實(shí)況轉(zhuǎn)播,并且RealMed

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論