




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第三章 多媒體數(shù)據(jù)壓縮技術(shù)第一節(jié) 多媒體數(shù)據(jù)壓縮技術(shù)概述第二節(jié) 靜態(tài)圖像壓縮編碼國際標準JPEG第三節(jié) 運動圖像壓縮編碼國際標準MPEG第1頁,共66頁。一、多媒體數(shù)據(jù)壓縮編碼的必要性二、多媒體數(shù)據(jù)壓縮的可能性 三、數(shù)據(jù)壓縮技術(shù)的分類四、數(shù)據(jù)壓縮技術(shù)的性能指標第一節(jié) 多媒體數(shù)據(jù)壓縮技術(shù)概述第2頁,共66頁。 信息時代的重要特征是信息的數(shù)字化。 早期的計算機系統(tǒng)采用模擬方式表示信息,但存在著明顯的缺點: 經(jīng)常會產(chǎn)生噪音和信號丟失,并且在復制過程中逐步積累噪音和誤差。 模擬信號不適合數(shù)字計算機加工處理。一、多媒體數(shù)據(jù)壓縮編碼的必要性第3頁,共66頁。 數(shù)字化后未經(jīng)壓縮的視頻和音頻等媒體信息的數(shù)據(jù)量
2、是非常大的。 1.圖像數(shù)據(jù)量的大小可用下面的公式來計算: 圖像數(shù)據(jù)量圖像的總像素色彩深度8 (單位為Byte,簡寫為B) 例如,一幅640480、24位(bit)真彩色的圖像,其文件大小為:64048024 8 921.6KB一、多媒體數(shù)據(jù)壓縮編碼的必要性第4頁,共66頁。 2. 雙通道立體聲激光唱盤,采用脈沖碼調(diào)制采樣,采樣頻率為44.1KHz,采樣精度16位,其一秒鐘時間內(nèi)的采樣數(shù)據(jù)量為: 44.110001628176.4KB 一個650MB的CDROM,大約可存1小時的音樂。一、多媒體數(shù)據(jù)壓縮編碼的必要性第5頁,共66頁。 3. 對動態(tài)圖形和視頻圖像。例如對于彩色電視信號,設(shè)代表光強Y
3、的帶寬為4.2MHz、色彩I為1.5MHz和色飽和度Q為0.5MHz,采樣頻率2倍原始信號頻率,各分量均被數(shù)字量化為8位,從而1秒鐘電視信號的數(shù)據(jù)量為: (4.21.50.5)281000000812.3 MB一、多媒體數(shù)據(jù)壓縮編碼的必要性第6頁,共66頁。 容量為650MB的CDROM僅能存1分鐘的原始電視數(shù)據(jù)。若為高清晰度電視(HDTV)其1秒鐘數(shù)據(jù)量約為150MB (1.2Gbps8),一張CDROM還存不下5秒鐘的HDTV圖像。 巨大數(shù)字化信息的數(shù)據(jù)量對計算機存儲資源和網(wǎng)絡(luò)帶寬有很高的要求,解決的辦法就是要對視、音頻的數(shù)據(jù)進行大量的壓縮。播放時,傳輸少量被壓縮的數(shù)據(jù),接收后再對數(shù)據(jù)進行
4、解壓縮并復原。第7頁,共66頁。 1. 空間冗余 一幅圖像中一般都有連續(xù)的有規(guī)則物體和規(guī)則背景的顏色分布,使圖像數(shù)據(jù)在空間上表現(xiàn)出相關(guān)性,我們可以通過改變物體表面顏色的像素存儲方式來利用空間相關(guān)性,達到減少數(shù)據(jù)量的目的。例: 圖象中的“A”是一個規(guī)則物體。光的亮 度、飽和度及顏色都一樣,因此,數(shù)據(jù)A有很大的冗余。 二、多媒體數(shù)據(jù)壓縮的可能性第8頁,共66頁。 2. 時間冗余 圖像序列中的相鄰幀圖像往往包含相同的背景和移動物體,只不過移動物體所在的空間位置略有不同。我們把一幀圖像中的某物體或場景可以由其他幀圖像中的物體或場景進行處理后重構(gòu)出來,可以大大減少時間冗余。3. 結(jié)構(gòu)冗余 有些圖像從大體
5、上看存在著非常強的紋理結(jié)構(gòu),這些紋理具有較強的相似性稱此為結(jié)構(gòu)冗余。 如草席圖結(jié)構(gòu)上存在冗余。二、多媒體數(shù)據(jù)壓縮的可能性第9頁,共66頁。4. 知識冗余 有許多圖像的理解與某些基礎(chǔ)知識有相當大的相關(guān)性。這類規(guī)律性的結(jié)構(gòu)可由先驗知識和背景知識得到,我們稱此類冗余為知識冗余。 例:人臉的圖像有同樣的結(jié)構(gòu):嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中線上 5. 視覺冗余 人類視覺系統(tǒng)對圖像場的敏感性是非均勻和非線性的,人眼并不能察覺圖像場的所有變化,人類視覺系統(tǒng)的分辨能力約為64灰度等級,而一般圖像量化采用256灰度等級,這類冗余稱視覺冗余。二、多媒體數(shù)據(jù)壓縮的可能性第10頁,共66頁。6. 聽覺冗余
6、人耳對不同頻率的聲音的敏感性是不同的,并不能察覺所有頻率的變化,對某些頻率不必特別關(guān)注,因此存在聽覺冗余。 二、多媒體數(shù)據(jù)壓縮的可能性第11頁,共66頁。 根據(jù)多媒體數(shù)據(jù)冗余類型的不同,解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致、質(zhì)量有無損失來進行分類,壓縮方法可被分為有失真編碼和無失真編碼兩大類。 無失真壓縮法也稱無損壓縮,一般是利用數(shù)據(jù)的統(tǒng)計特性來進行數(shù)據(jù)壓縮,對數(shù)據(jù)流中出現(xiàn)的各種數(shù)據(jù)進行概率統(tǒng)計編碼,使得數(shù)據(jù)流經(jīng)壓縮后形成的代碼流總位數(shù)大大減少。無失真壓縮的特點是壓縮比較小,大約在2l至5l之間,主要用于文本數(shù)據(jù)、程序代碼和某些要求嚴格不丟失信息的環(huán)境中,常用的無失真壓縮編碼有如哈夫曼編碼等。三、
7、數(shù)據(jù)壓縮技術(shù)的分類第12頁,共66頁。三、數(shù)據(jù)壓縮技術(shù)的分類 有失真壓縮法也稱有損壓縮,允許一定程度的失真,會丟失一些人眼和人耳所不敏感的圖像或音頻信息,而且丟失的信息不可恢復,即解壓縮后并不能完全恢復成原來的數(shù)據(jù),但是根據(jù)人的視覺和聽覺的主觀評價是可以接受的,有失真壓縮法的冗余壓縮取決于初始信號的類型、前后的相關(guān)性、信號的語義內(nèi)容等,壓縮比可以從幾到幾百倍。常用的有失真壓縮編碼技術(shù)有預測編碼、變換編碼、模型編碼、混合編碼方法等。主要用于壓縮圖像、聲音等信息。第13頁,共66頁。 常用的圖像和視頻壓縮方法如圖2-1所示:哈夫曼編碼行程編碼算術(shù)編碼LZW編碼圖像和視頻壓縮方法DCT編碼小波變換子
8、帶編碼無失真壓縮有失真壓縮預測編碼變換編碼模型編碼運動補償混合編碼分形編碼JPEGMPEGH. 261三、數(shù)據(jù)壓縮技術(shù)的分類第14頁,共66頁。四、數(shù)據(jù)壓縮技術(shù)的性能指標 節(jié)省圖象或視頻的存儲容量,增加訪問速度,使數(shù)字視頻能在PC機上實現(xiàn),需要進行視頻和圖象的壓縮。 有三個關(guān)鍵參數(shù)評價一個壓縮系統(tǒng)壓縮比圖象質(zhì)量壓縮和解壓的速度 另外也必須考慮每個壓縮算法所需的硬件和軟件。第15頁,共66頁。 1壓縮比壓縮性能常常用壓縮比定義(輸入數(shù)據(jù)和輸出數(shù)據(jù)比)例:512480, 24bit/pixel(bpp)輸出15000byte 輸入737280byte 壓縮比737280/1500049第16頁,共
9、66頁。2圖象質(zhì)量壓縮方法: 無損壓縮 (圖象質(zhì)量不變)有損壓縮有損壓縮:失真情況很難量化,只能對測試的圖象進行估計。模擬圖象質(zhì)量的指標:信噪比、分辨率必須觀察實際圖象以后估計。第17頁,共66頁。3壓縮解壓速度在許多應(yīng)用中,壓縮和解壓可能不同時用,在不同的位置不同的系統(tǒng)中。所以,壓縮、解壓速度分別估計。靜態(tài)圖象中,壓縮速度沒有解壓速度嚴格;動態(tài)圖象中,壓縮、解壓速度都有要求,因為需實時地從攝像機或VCR中抓取動態(tài)視頻。第18頁,共66頁。4硬軟件系統(tǒng)有些壓縮解壓工作可用軟件實現(xiàn)。設(shè)計系統(tǒng)時必須充分考慮:算法復雜 壓縮解壓過程長算法簡單 壓縮效果差 目前有些特殊硬件可用于加速壓縮/解壓。 硬接
10、線系統(tǒng)速度快,但各種選擇在初始設(shè)計時已確定,一般不能更改。因此在設(shè)計硬接線壓縮/解壓系統(tǒng)時必須先將算法標準化。第19頁,共66頁。2.2 靜態(tài)圖像壓縮國際標準-JPEG 2.2.1靜態(tài)圖像壓縮編碼JPEG概況 2.2.2 JPEG壓縮編碼的基本系統(tǒng)(1) 數(shù)據(jù)塊準備(2) 離散余弦正變換DCT(3) 量化(4) DCT系數(shù)Z形掃描(5) DC系數(shù)編碼(6) AC系數(shù)編碼2.2.3 JPEG壓縮編碼的擴展系統(tǒng)第20頁,共66頁。2.2.1靜態(tài)圖像壓縮編碼JPEG概況 JPEG(Joint Photographic Experts Group) 是一個由 ISO和IEC兩個組織機構(gòu)聯(lián)合組成的一個專
11、家組,負責制定靜態(tài)的數(shù)字圖象數(shù)據(jù)壓縮編碼標準,因此又稱為JPEG標準。JPEG是一個適用范圍很廣的靜態(tài)圖象數(shù)據(jù)壓縮標準,適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標準。 第21頁,共66頁。 JPEG是國際上彩色、灰度、靜止圖像的第一個國際標準。用來在低分辨率到高分辨率的較寬范圍內(nèi)支持較高的圖像分辨率。它不僅適用于黑白、彩色照片和印刷圖片(高分辨率)等靜止圖像的壓縮,而且適用于傳送彩色傳真、電話會議、新聞圖片(低分辨率)的靜止圖像的壓縮,以及電視圖像序列的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮標準。2.2.1靜態(tài)圖像壓縮編碼JPEG概況第22頁,共66頁。2.2.1靜態(tài)圖像壓縮編碼JP
12、EG概況它滿足以下要求:(1)達到或接近當前壓縮比圖像保真度的技術(shù)水平,能覆蓋一個較寬的圖像質(zhì)量等級范圍,能得到“很好”到“極好”的評估,與原始圖像相比,人的視覺難以區(qū)分。(2)能適用于任何種類的連續(xù)色調(diào)的圖像,且長寬比都不受限制,同時也不受限于景物內(nèi)容、圖像的復雜程度和統(tǒng)計特性等。(3)計算機的復雜性是可控制的,其軟件可在各種CPU上完成,算法也可用硬件實現(xiàn)。(4)JPEG算法具有4種操作方式。第一,為順序編碼,每個圖像分量按從左到右,從上到下掃描,一次掃描完成編碼;第二,累進編碼,圖像編碼在多次掃描中完成,接收端收到圖像是一個由粗糙到清晰的過程;第三,無失真編碼;第四,分層編碼,對圖像按多
13、個分辨率編碼,接收端按其顯示分辨率有選擇地解碼。第23頁,共66頁。 變換編碼的基本思路: 1編碼時略去某些能量很小的高頻分量以降低碼率。 2變換編碼還可以根據(jù)人眼對不同頻率分量的敏感程度而對不同系數(shù)采用不同的量化臺階,以進一步提高壓縮比。 JPEG開發(fā)的壓縮編碼算法有三種工作方式: 1基本系統(tǒng)(單次掃描)。 2擴展系統(tǒng)(常采用累進編碼或分層編碼方式)。 3無損壓縮編碼。2.2.1靜態(tài)圖像壓縮編碼JPEG概況第24頁,共66頁。2.2.2 JPEG 壓縮編碼的基本系統(tǒng) 下面是一個基于離散余弦正變換DCT的有失真JPEG編碼的工作原理,圖2-11是基于DCT的JPEG編碼的過程框圖。 第25頁,
14、共66頁。2.2.2 JPEG 壓縮編碼的基本系統(tǒng) 順序編碼運行方式第26頁,共66頁。2.2.3 JPEG 壓縮編碼的擴展系統(tǒng) 1. 基于DCT的累進編碼運行方式累進編碼方式要掃描多次第27頁,共66頁。2.2.3 JPEG 壓縮編碼的擴展系統(tǒng)2. 分層編碼運行方式 水平方向和垂直方向分辨率以2的倍數(shù)因子下降(降低原始圖像的空間分辨率),導出若干低分辨率的原圖像,分層后再采用JPEG的壓縮編碼方法進行編碼,隨后以上重復步驟,直到圖像達到完整的分辨率編碼為止。第28頁,共66頁。2.2.3 JPEG 壓縮編碼的擴展系統(tǒng) 3. 無損壓縮預測編碼運行方式源圖像數(shù)據(jù)表說明預測器熵編碼器壓縮后圖像數(shù)據(jù)
15、第29頁,共66頁。無損壓縮預測編碼運行方式Px第30頁,共66頁。2.3 運動圖像壓縮編碼的國際標準MPEG 2.3.1運動圖像壓縮編碼MPEG概況 2.3.2 MPEG 標準簡介 2.3.3 MPEG 標準化算法幀間編碼技術(shù)運動補償技術(shù) 2.3.4 MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu) 2.3.5 MPEG音頻簡述第31頁,共66頁。MPEG本是Moving Pictures Experts Group,動態(tài)圖象專家組的英文縮寫,這個專家組始建于1988年,專門負責為CD建立視頻和音頻標準,其成員均為視頻、音頻及系統(tǒng)領(lǐng)域的技術(shù)專家。 對于今天我們所范指的MPEG-X版本,是指一組由ITU(Inter
16、national Telecommunications Union)和ISO(International Standards Organization)制定發(fā)布的視頻、音頻、數(shù)據(jù)的壓縮標準。 2.3.1運動圖像壓縮編碼MPEG概況第32頁,共66頁。2.3.1運動圖像壓縮編碼MPEG概況MPEG的締造者們原先打算開發(fā)四個版本:MPEG1-MPEG4,以適用于不同帶寬和數(shù)字影像質(zhì)量的要求。后由于MPEG3被放棄,所以現(xiàn)存只有三個版本的MPEG:MPEG-1,MPEG-2,MPEG-4??傮w來說,MPEG在三方面優(yōu)于其他壓縮/解壓縮方案。首先,它做為一個國際化的標準,MPEG具有很好的兼容性。其次
17、,MPEG能夠比其他算法提供更好的壓縮比,最高可達200:1。再次,MPEG在提供高壓縮比的同時,對數(shù)據(jù)的損失很小。第33頁,共66頁。2.3.1運動圖像壓縮編碼MPEG概況 MPEG專家組工作將整個過程分為三步: 要求 提出要求有雙重的目的:目標, 競爭的原則。 竟爭 提出了14個不同的方案。 集中 測試和評價,并綜合出一個最佳方案。第34頁,共66頁。2.3.2 MPEG 標準簡介MPEG標準有: MPEG-1:1992年正式發(fā)布的數(shù)字電視標準; MPEG-2:數(shù)字電視標準; MPEG-3:于1992年合并到高清晰度電視(HDTV)工作組; MPEG-4:1999年發(fā)布的多媒體應(yīng)用標準;
18、MPEG-7:多媒體內(nèi)容描述接口標準, 第35頁,共66頁?;顒訄D像專家組在91年11月提出了“用于數(shù)據(jù)速率大約高達1.5MB/s的數(shù)字存儲媒體的電視圖像和伴音編碼”,作為ISO11172號建議,于92年通過,習慣上通稱MPEG-1標準。此標準主要是針對當時具有這種數(shù)據(jù)輿率的CD-ROM開發(fā)的,用于在CD-ROM上存儲數(shù)字影視和上傳輸數(shù)字影。PAL制為352288pixel/frame25frame/sNTSC制為352240pixel/frame30frame/s 。1. MPEG1標準第36頁,共66頁。MPEG-1主要用于活動圖像的數(shù)字存儲,它包括MPEG-1系統(tǒng)、MPEG-1視頻、MP
19、EG-1音頻三個部分MPEG-1 系統(tǒng):將視頻信號及其伴音以可接收的重建質(zhì)量壓縮到約1.5MB/s的碼率,并復合成一個單一的MPEG位流,同時保證視頻和音頻的同步。MPEG-1視頻:用于滿足日益增長的多媒體存儲與表現(xiàn)的需要,即以一種通用格式在不同的數(shù)字存儲介質(zhì)如VCD、CD、DAT、硬盤和光盤中表示壓縮的視頻。該壓縮算法采用三個基本技術(shù):運動補償預測編碼、DCT技術(shù)和變字長編碼技術(shù)。MPEG-1音頻:規(guī)定聲音數(shù)據(jù)的編碼和解碼。1. MPEG1標準第37頁,共66頁。1. MPEG1 標準 設(shè)計目標是把每秒傳送30幀、分辨率為360240的亮度信號,分辨率為180120的色度信號的電視圖像壓縮成
20、數(shù)據(jù)率為1.2Mbps的編碼圖像。 MPEG1電視圖像的壓縮算法采用兩種基本壓縮技術(shù): 為減少時間冗余度,采用1616個像素組成的圖像塊的運動補償技術(shù)。 為了減少空間冗余度,采用88圖像化的DCT變換技術(shù)。第38頁,共66頁。1. MPEG1 標準 聲音壓縮編碼技術(shù)支持高壓縮的音頻數(shù)據(jù)流,其采樣率為48,44.l或22KHz,量化精度為16位的聲音壓縮(如CD-DA音頻1.4Mbps壓縮為0.192Mbps) 。 支持兩個聲道,可設(shè)置成單聲道(mono)、雙聲道(dual)或立體聲(stereo)。例如采用MPEG1算法可以把位速率降到 0.192 Mbps。 MPEG1系統(tǒng)采用多路復合技術(shù),
21、把數(shù)字電視圖像和聲音復合成單一數(shù)據(jù)位流,MPEG1的數(shù)據(jù)位流分成內(nèi)外兩層,外層為系統(tǒng)層,內(nèi)層為壓縮層。第39頁,共66頁。2. MPEG2 標準MPEG-2的標準號為ISO/IEC13818,標準名稱為“信息技術(shù)電視圖像和伴音信息通用編碼”。它是聲音和圖像信號數(shù)字化的基礎(chǔ)標準,將廣泛用于數(shù)字電視(包括HDTV)及數(shù)字聲音廣播、數(shù)字圖像與聲音信號的傳輸,多媒體等領(lǐng)域。MPEG-2標準是一個直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音編碼標準,MPEG-2視頻利用網(wǎng)絡(luò)提供的更高的寬帶來支持具有更高分辨率圖像的壓縮和更高的圖像質(zhì)量。第40頁,共66頁。 2. MPEG2 標準 設(shè)計目標是把以166Mbp
22、s速度傳送每秒30幀、幀分辨率為720572高分辨率的廣播級視頻圖像,壓縮后的傳送數(shù)據(jù)率約為3Mbps。 MPEG2標準是HDTV、DVD以及新型數(shù)字式交互有線網(wǎng)所采用的數(shù)字視頻壓縮標準。 MPEG2標準是MPEG1標準的擴充、豐富和完善,并與MPEG1標準相兼容。第41頁,共66頁。2. MPEG2 標準 MPEG2標準主要分為四部分: 第一部分:系統(tǒng)。 第二部分:視頻。 第三部分:音頻。 第四部分:一致性測試。 MPEG2標準使計算機處理全彩色、全屏幕、全動態(tài)的視頻圖像,同時也能使有線、無線、CDROM等傳輸和存儲介質(zhì)有效地傳送視頻圖像,并且具有CD的音質(zhì),使多媒體技術(shù)與通信和廣播等技術(shù)結(jié)
23、合起來。第42頁,共66頁。2. MPEG2 標準MPEG-2系統(tǒng):規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其他相關(guān)數(shù)據(jù)的同步性。MPEG-2視頻:定義了不同的功能檔次,每個檔次又分為幾個等級,來適應(yīng)不同應(yīng)用的要求,并保證數(shù)據(jù)的可交換性。目前共有5個檔次,依功能增強逐次為:簡單型、基本型、信噪比可調(diào)型、空間可調(diào)型、增強型。4個等級為: (1)低級(35228829.79,面向VCR并與MPEG-1兼容)。 (2)基本級( 72046029.79或72057625 ,面向NTSC制式的視頻廣播信號)。 (3)高1440級( 1400108030或1400115225 ,面向HDTV)。 (4)高級( 192
24、0108030或1920115225 ,面向HDTV)MPEG-2音頻:MPEG-2音頻的基本特性之一是與MPEG-1音頻向后兼容,并且支持5.1或7.1通道的環(huán)繞立體聲。第43頁,共66頁。3. MPEG4 標準 用來支持低比特率下的多媒體通信(公用電信網(wǎng)14.419.2Kbps),還支持用于通信、訪問和數(shù)字視聽數(shù)據(jù)處理的新方法。注重多媒體系統(tǒng)的交互性和靈活性,以最少量的數(shù)據(jù)、極低的音頻/視頻壓縮碼率來顯示建立精確的畫面,達到具有高效編碼、高效存儲與傳播以及可交互操作的特性。第44頁,共66頁。3. MPEG4 標準它是為視聽數(shù)據(jù)的編碼和交互播放開發(fā)算法和工具,是一個數(shù)據(jù)速率很低的多媒體通信
25、標準。其目標是要在異構(gòu)網(wǎng)絡(luò)環(huán)境下能夠高度可靠地工作,并且具有很強的交互功能。為此它引入了對象基表達的要領(lǐng),用來表達視聽對象(AVO),并擴充了編碼的數(shù)據(jù)類型,由自然數(shù)據(jù)對象擴展到計算機生成的合成數(shù)據(jù)對象,采用合成對象、自然對象混合編碼算法。在實現(xiàn)交互功能和重用對象中引入了組合,合成和編排等重要要領(lǐng) 第45頁,共66頁。4. MPEG7 標準 正式名稱為多媒體內(nèi)容描述接口。 MPEG7標準只規(guī)定信息內(nèi)容描述格式,而不規(guī)定如何從原始的多媒體資料中抽取內(nèi)容描述和查詢、檢索方法。MPEG7標準不針對特定的應(yīng)用領(lǐng)域,而是盡可能支持廣泛的應(yīng)用領(lǐng)域。第46頁,共66頁。下圖表示了MPEG-7的處理鏈(Pro
26、cessing Chain),這是高度抽象的方框圖。第47頁,共66頁。MPEG-7的應(yīng)用領(lǐng)域很廣,包括:數(shù)字圖書館。例如,圖像目錄、音樂詞典等。多媒體目錄服務(wù)。例如,黃頁等。廣播式媒體的選擇。例如,無線電頻道、TV頻道等。個人電子新聞服務(wù)、多媒體創(chuàng)作等。教育、娛樂、新聞、旅游、醫(yī)療和電子商務(wù)等。第48頁,共66頁。視頻壓縮算法用到了三項基本技術(shù): 幀間編碼技術(shù)和基于塊的運動補償技術(shù)。 空間壓縮(也稱為幀內(nèi)壓縮)JPEG技術(shù)。 熵編碼,使用Huffman編碼技術(shù)。MPEG標準所用的編碼模型與JPEG的編碼模型類似,分為5個階段: 幀間編碼和運動補償、變換編碼、量化、直流分量DC及交流分量AC的
27、編碼和熵編碼。2.3.3 MPEG 標準化算法第49頁,共66頁。1. 幀間編碼技術(shù) 利用的時間相關(guān)性可進一步消除視頻其相鄰幀之間具有冗余信息,提高壓縮比。 將圖像分成三種類型: 1. 參考幀(I) (JPEG編碼) 以自身圖像的相關(guān)性進行壓縮處理,必須要傳送。 2. 預測幀(P) 用前面的參考幀或預測幀作為參照圖像信息進行預測編碼,并可作為下一個預測幀(B幀圖像或P幀圖像)的參照圖像信息。但因此可能引起預測誤差。第50頁,共66頁。1. 幀間編碼技術(shù) 3. 雙向預測幀(B) 又稱插補幀,在預測時,既可以使用前面或后面的視頻幀(I參考幀,P預測幀)進行雙向預測,也可以同時使用前后兩個視頻幀進行
28、預測編碼,但本身不能作為下一個預測幀的參照圖像信息。(2001) 在編碼時,先對參考幀進行變換編碼,然后對預測幀進行編碼,再對兩者之間的雙向預測幀進行編碼,這個過程對隨后的下一個預測幀和雙向預測幀重復,直到完成所有幀的編碼為止。第51頁,共66頁。1. 幀間編碼技術(shù) 采用下述四種預測技術(shù): 幀內(nèi)編碼 前向預測 后向預測 雙向預測 圖3-20顯示一個典型的視頻圖像序列次序。 I B B P B B P B B P B B P B B I B B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 I幀和P幀間有兩個B幀每十五幀有一幅I幀圖像(0.5秒)第52
29、頁,共66頁。1. 幀間編碼技術(shù) 編碼器的輸出視頻圖像序列排列順序。1 4 2 3 7 5 6 10 8I P B B P B B P B9 13 11 12 16 14 15 B P B B I B B 發(fā)送端編碼器的輸出到接收端解碼器的輸入端,經(jīng)解碼器的輸出,又恢復為圖3-12編碼器輸入順序顯示。第53頁,共66頁。2. 運動補償技術(shù)(塊) 運動矢量選擇二維1616像素塊作為一個的運動矢量處理。 運動矢量又稱為宏塊,它有不同的類型: 可以是I幀內(nèi)型,F(xiàn)前向預測型、B后向預測型和A平均值(雙向預測)型。 概念: 當前圖像可看作是前一幀圖像位移后的結(jié)果,其位移的內(nèi)容包括運動方向和運動幅度。運動
30、補償方法是跟蹤畫面內(nèi)的運動情況并對其加以補償后,與當前的圖像宏塊值相減得到預測誤差,再進行編碼、傳送。第54頁,共66頁。2. 運動補償技術(shù)(塊) 討論預測器計算表達式,設(shè)前一參照幀為I0,后一參照幀為I2,當前幀為I1的示意圖,求預測值。 F前向 B后向第55頁,共66頁。2. 運動補償技術(shù)(塊) 表3-13給出了I幀內(nèi)塊、F前向預測塊、B后向預測塊和A平均值塊的預測器的計算表達式。 為當前幀I1的值,預測誤差I(lǐng)FBA第56頁,共66頁。 2.3.4 MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu) 圖像序列頭圖像組圖像組序列尾 圖像組圖像組頭圖象I、P、B圖象I、P、B圖像頭宏塊片宏塊片宏塊片頭宏塊宏塊1882
31、8838848858868888視頻序列層圖像組層宏塊片層宏塊層YCb Cr圖像層塊層幀間編碼運動補償JPEGMPEG2 視頻數(shù)據(jù)流的六層結(jié)構(gòu)圖第57頁,共66頁。視頻數(shù)據(jù)流之間的關(guān)系圖 圖像組層宏塊層88像素塊層 宏塊片層視頻序列層圖像層第58頁,共66頁。2.3.4 MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu) 1. 視頻序列層: 圖像序列頭包含了圖像寬度、高度、像素長寬比、幀率、位率、緩沖區(qū)尺寸、量化矩陣等信息。 2. 圖像組層: 圖像組頭包含時間代碼等信息,圖像組中的第一個圖像總是I圖像幀。 3. 圖像層: 由圖像頭及多個宏塊片構(gòu)成的。圖像頭包含該圖像的編碼類型及碼表選擇等信息。第59頁,共66頁。2.
32、3.4 MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu) 4. 宏塊片層: 宏塊片由宏塊片頭和多個連續(xù)的宏塊以及附加數(shù)據(jù)組成。 5. 宏塊層: MPEG算法中的基本編碼單元。它是圖像幀內(nèi)的一個1616像素的亮度信息和兩個88像素色差信號塊組成,附加數(shù)據(jù)包括宏塊的編號、宏塊的編碼類型、量化參數(shù)、運動矢量等信息。第60頁,共66頁。宏塊結(jié)構(gòu)有三種格式 411格式: 422格式:540123 Y Cb Cr46570123 Y Cb Cr 第61頁,共66頁。宏塊結(jié)構(gòu)有三種格式 444格式: 0 1 2 3 4 8 6 10 5 9 7 11 Y Cb Cr第62頁,共66頁。6. 塊 層 MPEG算法中最小的編碼單元,
33、它包含88像素,有三類圖像信息之一,亮度信號(Y)、色差信號(U/V)。 Y U V 1 2 3 4 5 6 88 88 第63頁,共66頁。2.3.5 MPEG 音頻簡述 MPEG音頻標準有以下特點: 1. 音頻信號采樣率可以是22KHz,44.1 KHz或48KHz。 2. 壓縮后的比特流可以按以下3種模式之一支持單聲道或雙聲道:(1) 提供給單音頻通道的單聲道模式。(2) 提供給兩個獨立的單音頻通道的雙單聲道模式。(3) 提供給立體聲通道的立體聲模式。第64頁,共66頁。2.3.5 MPEG 音頻簡述 3. 提供3個獨立的壓縮層次:(MP1,MP2,MP3)分為MPEG Layer1、M
34、PEG Layer2、MPEG Layer3,用戶可在復雜性和壓縮質(zhì)量之間權(quán)衡選擇。 (1) MPEG Layer1層最簡單,使用比特率384Kbps。(2) MPEG Layer2層的復雜度中等,使用比特率128Kbps左右,主要應(yīng)用于數(shù)字廣播的音頻編碼。(3) MPEG Layer3層最復雜,文件壓縮比12:1,使用比特率64Kbps,音質(zhì)好,適用于ISDN上的音頻傳輸。 4. 編碼后的比特流支持循環(huán)冗余校驗CRC。 5. 還支持在比特流中攜帶附加信息。第65頁,共66頁。1、不是井里沒有水,而是你挖的不夠深。不是成功來得慢,而是你努力的不夠多。2、孤單一人的時間使自己變得優(yōu)秀,給來的人一
35、個驚喜,也給自己一個好的交代。3、命運給你一個比別人低的起點是想告訴你,讓你用你的一生去奮斗出一個絕地反擊的故事,所以有什么理由不努力!4、心中沒有過分的貪求,自然苦就少??诶锊徽f多余的話,自然禍就少。腹內(nèi)的食物能減少,自然病就少。思緒中沒有過分欲,自然憂就少。大悲是無淚的,同樣大悟無言。緣來盡量要惜,緣盡就放。人生本來就空,對人家笑笑,對自己笑笑,笑著看天下,看日出日落,花謝花開,豈不自在,哪里來的塵埃!25、你不能拼爹的時候,你就只能去拼命!26、如果人生的旅程上沒有障礙,人還有什么可做的呢。27、我們無法選擇自己的出身,可是我們的未來是自己去改變的。勵志名言:比別人多一點執(zhí)著,你就會創(chuàng)造
36、奇跡28、偉人之所以偉大,是因為他與別人共處逆境時,別人失去了信心,他卻下決心實現(xiàn)自己的目標。29、人生就像一道漫長的階梯,任何人也無法逆向而行,只能在急促而繁忙的進程中,偶爾轉(zhuǎn)過頭來,回望自己留下的蹣跚腳印。30、時間,帶不走真正的朋友;歲月,留不住虛幻的擁有。時光轉(zhuǎn)換,體會到緣分善變;平淡無語,感受了人情冷暖。有心的人,不管你在與不在,都會惦念;無心的情,無論你好與不好,只是漠然。走過一段路,總能有一次領(lǐng)悟;經(jīng)歷一些事,才能看清一些人。31、我們無法選擇自己的出身,可是我們的未來是自己去改變的。32、命好不如習慣好。養(yǎng)成好習慣,一輩子受用不盡。33、比別人多一點執(zhí)著,你就會創(chuàng)造奇跡。50、
37、想像力比知識更重要。不是無知,而是對無知的無知,才是知的死亡。51、對于最有能力的領(lǐng)航人風浪總是格外的洶涌。52、思想如鉆子,必須集中在一點鉆下去才有力量。53、年少時,夢想在心中激揚迸進,勢不可擋,只是我們還沒學會去戰(zhàn)斗。經(jīng)過一番努力,我們終于學會了戰(zhàn)斗,卻已沒有了拼搏的勇氣。因此,我們轉(zhuǎn)向自身,攻擊自己,成為自己最大的敵人。54、最偉大的思想和行動往往需要最微不足道的開始。55、不積小流無以成江海,不積跬步無以至千里。56、遠大抱負始于高中,輝煌人生起于今日。57、理想的路總是為有信心的人預備著。58、抱最大的希望,為最大的努力,做最壞的打算。59、世上除了生死,都是小事。從今天開始,每天
38、微笑吧。60、一勤天下無難事,一懶天下皆難事。61、在清醒中孤獨,總好過于在喧囂人群中寂寞。62、心里的感覺總會是這樣,你越期待的會越行越遠,你越在乎的對你的傷害越大。63、彩虹風雨后,成功細節(jié)中。64、有些事你是繞不過去的,你現(xiàn)在逃避,你以后就會話十倍的精力去面對。65、只要有信心,就能在信念中行走。66、每天告訴自己一次,我真的很不錯。67、心中有理想 再累也快樂68、發(fā)光并非太陽的專利,你也可以發(fā)光。69、任何山都可以移動,只要把沙土一卡車一卡車運走即可。70、當你的希望一個個落空,你也要堅定,要沉著!71、生命太過短暫,今天放棄了明天不一定能得到。72、只要路是對的,就不怕路遠。73、
39、如果一個人愛你、特別在乎你,有一個表現(xiàn)是他還是有點怕你。74、先知三日,富貴十年。付諸行動,你就會得到力量。75、愛的力量大到可以使人忘記一切,卻又小到連一粒嫉妒的沙石也不能容納。1、這世上,沒有誰活得比誰容易,只是有人在呼天搶地,有人在默默努力。2、當熱誠變成習慣,恐懼和憂慮即無處容身。缺乏熱誠的人也沒有明確的目標。熱誠使想象的輪子轉(zhuǎn)動。一個人缺乏熱誠就象汽車沒有汽油。善于安排玩樂和工作,兩者保持熱誠,就是最快樂的人。熱誠使平凡的話題變得生動。3、起點低怕什么,大不了加倍努力。人生就像一場馬拉松比賽,拼的不是起點,而是堅持的耐力和成長的速度。只要努力不止,進步也會不止。4、如果你不相信努力和時光,那么時光第一個就會辜負你。不要去否定你的過去,也不要用你的過去牽扯你的未來。不是因為有希望才去努力,而是努力了,才能看到希望。5、人生每天都要笑,生活的下一秒發(fā)生什么,我們誰也不知道。所以,放下心里的糾結(jié),放下腦中的煩惱,放下生活的不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國白堊行業(yè)運行現(xiàn)狀及發(fā)展風險分析報告
- 2025-2030年中國電梯維修保養(yǎng)行業(yè)市場運營現(xiàn)狀及投資戰(zhàn)略研究報告
- 專業(yè)寫作字體使用權(quán)合同
- 白酒合作代理合同協(xié)議
- 文化產(chǎn)業(yè)投資與運營合同
- 針織衫銷售合同
- 私人教練聘任合同書樣本
- 企業(yè)員工聘用勞動合同(3篇)
- 貨物運輸合同委托付款范本
- 2025年企業(yè)合作策劃共贏經(jīng)營合同協(xié)議書樣本
- 實訓美容手術(shù)操作基本技術(shù)美容外科學概論講解
- 北京市北京第一零一中學2024-2025學年高三上學期統(tǒng)考三英語試題
- 2025年湖南食品藥品職業(yè)學院高職單招職業(yè)技能測試近5年常考版參考題庫含答案解析
- 2025年上半年北京市事業(yè)單位招聘易考易錯模擬試題(共500題)試卷后附參考答案
- 2025年泰山職業(yè)技術(shù)學院高職單招數(shù)學歷年(2016-2024)頻考點試題含答案解析
- 重慶市渝北區(qū)龍山小學-25版四年級寒假特色作業(yè)【課件】
- 煤礦重大災(zāi)害治理中長期規(guī)劃(防治煤塵爆炸、火災(zāi)事故)
- 2024年事業(yè)單位考試(綜合管理類A類)綜合應(yīng)用能力試題及解答參考
- 多智能體機器人系統(tǒng)控制及其應(yīng)用課件全套第1-8章多智能體機器人系統(tǒng)-異構(gòu)多智能體系統(tǒng)的協(xié)同控制和最優(yōu)控制
- TD/T 1044-2014 生產(chǎn)項目土地復墾驗收規(guī)程(正式版)
- 管理ABC-干嘉偉(美團網(wǎng)COO)
評論
0/150
提交評論