《數(shù)字視聽技術(shù)》課件第1章_第1頁
《數(shù)字視聽技術(shù)》課件第1章_第2頁
《數(shù)字視聽技術(shù)》課件第1章_第3頁
《數(shù)字視聽技術(shù)》課件第1章_第4頁
《數(shù)字視聽技術(shù)》課件第1章_第5頁
已閱讀5頁,還剩227頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.1數(shù)字視聽技術(shù)概述1.2信號(hào)的數(shù)字化1.3信號(hào)的調(diào)制與糾錯(cuò)1.4數(shù)據(jù)壓縮技術(shù)的標(biāo)準(zhǔn)1.5視頻數(shù)據(jù)壓縮技術(shù)1.6音頻數(shù)據(jù)壓縮技術(shù)技能訓(xùn)練項(xiàng)目1激光視盤機(jī)符號(hào)識(shí)別技能訓(xùn)練項(xiàng)目2激光視盤機(jī)與外圍設(shè)備的連接技能訓(xùn)練項(xiàng)目3激光視盤機(jī)的操作技能訓(xùn)練項(xiàng)目4激光視盤機(jī)的整機(jī)檢驗(yàn)本章小結(jié)思考題第1章數(shù)字視聽技術(shù)基礎(chǔ)

1.1數(shù)字視聽技術(shù)概述

數(shù)字視聽技術(shù)是指應(yīng)用數(shù)字編碼方式來描述和表達(dá)圖像、聲音等各種媒體信息,進(jìn)行存儲(chǔ)后借助于數(shù)字信號(hào)處理技術(shù)進(jìn)行處理,并通過音、視頻重放設(shè)備再現(xiàn)聲音和圖像信息的一門新興技術(shù)。視聽技術(shù)經(jīng)歷了一個(gè)從模擬到數(shù)字的發(fā)展過程,早期的錄音機(jī)、錄像機(jī)和電視機(jī)視聽產(chǎn)品,均為模擬式產(chǎn)品,從音、視頻信號(hào)的獲取、處理、存儲(chǔ)到輸出均采用模擬技術(shù)。隨著數(shù)字技術(shù)的發(fā)展,CD機(jī)、DVD機(jī)、數(shù)字?jǐn)z錄機(jī)、數(shù)字電視機(jī)等數(shù)字視聽產(chǎn)品已得到廣泛應(yīng)用。1.1.1數(shù)字視聽技術(shù)的發(fā)展

數(shù)字視聽技術(shù)的出現(xiàn),把人們帶入了一個(gè)圖像更清晰、聲音更逼真的領(lǐng)域。現(xiàn)代科技的飛速發(fā)展,使得視聽產(chǎn)品升級(jí)換代日新月異。數(shù)字視聽技術(shù)借助激光技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)、計(jì)算機(jī)技術(shù)及存儲(chǔ)技術(shù)的發(fā)展,其產(chǎn)品得到了長足的發(fā)展,使消費(fèi)者充分享受到數(shù)字視聽?zhēng)淼臉啡ぁD1-1表示數(shù)字視聽技術(shù)在不同技術(shù)應(yīng)用領(lǐng)域的主要產(chǎn)品類型。圖1-1數(shù)字視聽產(chǎn)品的應(yīng)用

1.激光視聽技術(shù)

激光英文名是Laser,即Lightamplificationbythestimulatedemissionofradiation的縮寫。激光技術(shù)應(yīng)用在數(shù)字視聽領(lǐng)域是基于其一個(gè)最重要的特點(diǎn),即激光可以聚焦成能量高度集中的極小光點(diǎn),這樣就可以在一張直徑僅為數(shù)厘米的光盤上以極高的密度記錄下經(jīng)壓縮編碼處理的數(shù)字音、視頻信息,并且讀取信號(hào)的激光頭與光盤沒有任何接觸,不會(huì)造成光盤磨損,有利于長久保存節(jié)目源。20世紀(jì)70年代后期,荷蘭飛利浦公司成功開發(fā)出光盤制造技術(shù),日本索尼公司在系統(tǒng)軟件方面也取得了較大突破,完善了數(shù)字音頻信號(hào)的編碼、解碼和糾錯(cuò)的系統(tǒng)軟件,解決了機(jī)械振動(dòng)、灰塵污染、碟面劃傷、制造缺陷等對(duì)光盤記錄和播放的影響,為激光視盤機(jī)大規(guī)模商業(yè)生產(chǎn)打下了一定基礎(chǔ)。

1980年,飛利浦、索尼、寶麗金等35個(gè)世界制造商就視盤機(jī)的信號(hào)記錄格式和光盤制造材料等技術(shù)規(guī)格達(dá)成了協(xié)議,形成了CD光盤國際標(biāo)準(zhǔn)。1982年飛利浦和索尼公司聯(lián)合開發(fā)制造了商用數(shù)字視盤機(jī),即CD-DA,簡(jiǎn)稱CD機(jī),主要用于記錄音樂節(jié)目。為滿足不同的需求,在CD機(jī)的基礎(chǔ)上不斷開發(fā)出新的品種,形成了CD系列產(chǎn)品。主要有CD-G、CD-ROM、CD-I、CD-R等,這一階段的產(chǎn)品采用的都是MPEG-1音、視頻編碼標(biāo)準(zhǔn)。

DVD光盤是DigitalVideoDisc(數(shù)字視頻光盤)的簡(jiǎn)稱,后來則稱為“DigitalVersatileDisc”,即“數(shù)字通用光盤”,它是在VCD視盤機(jī)基礎(chǔ)上發(fā)展起來的,將圖像和伴音信號(hào)記錄在CD大小的光盤上,使用了比CD激光頭波長更短的激光管,其信號(hào)記錄密度也大大高于CD盤片,其整機(jī)性能得到了很大的提高。

在畫面上,DVD采用MPEG-2解壓縮標(biāo)準(zhǔn)。比以往的VHS錄像和MPEG-1標(biāo)準(zhǔn)要清晰得多,VHS和MPEG-1壓縮標(biāo)準(zhǔn)的解析度最多達(dá)到240線,而MPEG-2解壓縮標(biāo)準(zhǔn)能達(dá)到500線以上,可與電影播放質(zhì)量相媲美。在音效上,DVD光盤可以提供杜比數(shù)碼環(huán)繞立體聲效果,就是DolbyAC-3-5.1聲道效果。DolbyAC-3-5.1是一種全數(shù)字化的音頻編碼技術(shù)。它提供6個(gè)完全獨(dú)立的聲道,即兩個(gè)全頻帶主聲道、兩個(gè)全頻帶環(huán)繞聲道、一個(gè)全頻帶中置聲道和一個(gè)1/10頻帶的重低音聲道。通過這6個(gè)聲道,使觀眾明顯感覺到電影院那種身臨其境的立體效果。近年來,DVD視盤機(jī)又有了新的發(fā)展,逐行DVD、高清DVD、藍(lán)光DVD等出現(xiàn)在人們的視野。2002年,由13家國際知名廠商聯(lián)合宣布成立藍(lán)光光盤組織(Blue-rayDiscFounders),宣布支持采用藍(lán)色激光DVD存儲(chǔ)技術(shù)制定出新的高密度DVD標(biāo)準(zhǔn)——Blue-rayDisc(BD)。現(xiàn)在所說的“藍(lán)光”、“藍(lán)光碟片”指的是Blue-ray和HDDVD的泛稱,因?yàn)閮烧叨际鞘褂盟{(lán)光波長的激光。Blue-ray是專指Sony和Phillips合作研發(fā)出的規(guī)格。HDDVD是東芝所說的HDDVD技術(shù)。Bluedisc和HDDVD都是基于藍(lán)色波段的激光頭,因此都可以稱為藍(lán)光,藍(lán)光是對(duì)下一代光盤載體的統(tǒng)稱。從技術(shù)層次看,雖然現(xiàn)在的DVD在存儲(chǔ)的密度及讀寫速度方面較之CD已經(jīng)有了長足的進(jìn)步,但DVD仍舊采用的是紅色激光波段進(jìn)行數(shù)據(jù)的讀取和刻寫,使得在光存儲(chǔ)的密度以及讀寫速度方面的提升受到了限制。而新一代的藍(lán)光DVD技術(shù)采用全新的藍(lán)色激光波段進(jìn)行工作,光盤存儲(chǔ)容量在原來的DVD的基礎(chǔ)上擴(kuò)大了將近5倍,使得存儲(chǔ)的容量有了很大的突破。

2.網(wǎng)絡(luò)視聽技術(shù)

近年來,隨著通信技術(shù)綜合化、數(shù)字化、智能化和個(gè)性化的發(fā)展,以及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的日益成熟,在網(wǎng)絡(luò)平臺(tái)上實(shí)現(xiàn)語音、數(shù)據(jù)和圖像傳輸?shù)榷喾N業(yè)務(wù)已經(jīng)成為通信行業(yè)發(fā)展的目標(biāo)和必然趨勢(shì)。數(shù)字視聽技術(shù)在電話網(wǎng)(包括固定和移動(dòng)電話網(wǎng))、廣電網(wǎng)、計(jì)算機(jī)網(wǎng)上的應(yīng)用取得了迅猛發(fā)展,得到了廣泛應(yīng)用,如視頻點(diǎn)播、在線影院、遠(yuǎn)程醫(yī)療、遠(yuǎn)程教育、交互式電視等,滿足各個(gè)行業(yè)網(wǎng)絡(luò)化發(fā)展的需要。隨著計(jì)算機(jī)性能和網(wǎng)絡(luò)通信技術(shù)的發(fā)展,人們開始借助于網(wǎng)絡(luò)瀏覽信息、交換數(shù)據(jù)和商業(yè)交易。而圖像、視頻等多媒體業(yè)務(wù)已逐漸成為信息處理領(lǐng)域中主要的信息媒體形式。因此下一代網(wǎng)絡(luò)(NGN)將語音、數(shù)據(jù)、視頻等多種業(yè)務(wù)集于一體,它是一個(gè)建立在IP技術(shù)基礎(chǔ)上的新型公共電信網(wǎng)絡(luò)。目前,下一代網(wǎng)絡(luò)還沒有完全投入運(yùn)行,所以互聯(lián)網(wǎng)就成為音、視頻傳輸?shù)闹匾侄巍?/p>

在網(wǎng)絡(luò)上以數(shù)據(jù)流的方式實(shí)時(shí)發(fā)布音頻、視頻多媒體內(nèi)容的媒體技術(shù)叫流媒體技術(shù),流媒體的技術(shù)應(yīng)用主要表現(xiàn)在如下幾個(gè)方面。

1)視頻點(diǎn)播

隨著計(jì)算機(jī)技術(shù)的發(fā)展,流媒體技術(shù)越來越廣泛地應(yīng)用于視頻點(diǎn)播(VOD)系統(tǒng)。VOD系統(tǒng)是指在用戶需要時(shí)隨時(shí)提供交互式的視頻服務(wù)業(yè)務(wù)。目前VOD技術(shù)逐漸趨于完善,并廣泛應(yīng)用于局域網(wǎng)及有線電視網(wǎng)。它能對(duì)單個(gè)用戶提供大量的影片、視頻節(jié)目、游戲、信息以及其他服務(wù),其區(qū)別于傳統(tǒng)視頻節(jié)目接收方式的交互性表現(xiàn)在主動(dòng)性和選擇性強(qiáng),用戶對(duì)通過網(wǎng)絡(luò)傳送來的節(jié)目擁有播放控制能力。流媒體的視頻直播應(yīng)用突破了網(wǎng)絡(luò)帶寬的限制,實(shí)現(xiàn)了在低帶寬環(huán)境下的高質(zhì)量影音傳輸,其中的智能流技術(shù)保證不同連接速率下的用戶可以得到不同質(zhì)量的影音效果。但音、視頻文件的大容量仍然阻礙了VOD技術(shù)的進(jìn)一步發(fā)展。由于服務(wù)器端不僅需要大容量的存儲(chǔ)系統(tǒng),同時(shí)還要承擔(dān)大量數(shù)據(jù)的傳輸,因而服務(wù)器根本無法支持大規(guī)模的點(diǎn)播。同時(shí),由于局域網(wǎng)中的視頻點(diǎn)播覆蓋范圍小,用戶也無法通過Internet等網(wǎng)絡(luò)媒介收聽或觀看局域網(wǎng)中的節(jié)目。

2)視頻會(huì)議

市場(chǎng)上采用流媒體技術(shù)作為核心技術(shù)的視頻會(huì)議系統(tǒng)并不占多數(shù)。視頻會(huì)議是流媒體技術(shù)的一個(gè)商業(yè)用途,采用流媒體格式傳送音、視頻文件,使用者不必等待整個(gè)影片傳送完畢就可以實(shí)時(shí)、連續(xù)地觀看,雖然在畫面質(zhì)量上有一些損失,但就一般的視頻會(huì)議來講,并不需要很高的圖像質(zhì)量。當(dāng)然,流媒體技術(shù)并不是視頻會(huì)議的必需選擇,但對(duì)視頻會(huì)議的發(fā)展起了重要的推動(dòng)作用。

通過流媒體進(jìn)行點(diǎn)對(duì)點(diǎn)的通信,最常見的就是可視電話。只要兩端都有一臺(tái)接入Internet的電腦和一個(gè)攝像頭,在世界任何地點(diǎn)都可以進(jìn)行音、視頻通信。此外,大型企業(yè)可以利用基于流媒體的視頻會(huì)議系統(tǒng)來組織跨地區(qū)的會(huì)議和討論。

3)遠(yuǎn)程教育

電腦的普及、多媒體技術(shù)的發(fā)展以及Internet的迅速崛起,給遠(yuǎn)程教育帶來了新的機(jī)遇。越來越多的遠(yuǎn)程教育網(wǎng)站開始采用流媒體作為主要的網(wǎng)絡(luò)教學(xué)方式。在遠(yuǎn)程教學(xué)過程中,最基本的要求就是將信息從教師端傳到遠(yuǎn)程的學(xué)生端,需要傳送的信息可能是多元的,如視頻、音頻、文本、圖片等。將這些信息從一端傳送到另一端是實(shí)現(xiàn)遠(yuǎn)程教學(xué)需要解決的問題,在當(dāng)前網(wǎng)絡(luò)帶寬的限制下,流媒體傳輸將是最佳選擇。學(xué)生在家通過一臺(tái)計(jì)算機(jī)、一條電話線、一個(gè)調(diào)制解調(diào)器就可以參加遠(yuǎn)程教學(xué)。教師也無需另外做準(zhǔn)備,授課的方法基本與傳統(tǒng)授課方法相同,只不過面對(duì)的是攝像頭和計(jì)算機(jī)而已。使用流媒體的VOD技術(shù)還可以進(jìn)行交互式教學(xué),達(dá)到因材施教的目的。像RealSystem、Flash、Shockwave等技術(shù)就經(jīng)常應(yīng)用到網(wǎng)絡(luò)教學(xué)中。學(xué)生可以通過網(wǎng)絡(luò)共享學(xué)習(xí)經(jīng)驗(yàn)。大型企業(yè)可以利用基于流媒體技術(shù)的遠(yuǎn)程教育對(duì)員工進(jìn)行培訓(xùn)。

4)?Internet直播

隨著寬帶網(wǎng)的不斷普及和流媒體技術(shù)的不斷發(fā)展。沖浪者能夠在Internet上直接收看體育賽事、商貿(mào)展覽等,廠商可以借助網(wǎng)上直播形式將自己的產(chǎn)品和活動(dòng)傳遍全世界。網(wǎng)絡(luò)帶寬問題的改善促進(jìn)了Internet直播的發(fā)展,Internet直播已經(jīng)從實(shí)驗(yàn)階段走向?qū)嵱?,并能夠提供較滿意的音、視頻效果。流媒體技術(shù)的發(fā)展,實(shí)現(xiàn)了在低帶寬環(huán)境下提供高質(zhì)量的音、視頻信息;保證不同連接速率下的用戶能夠得到不同質(zhì)量的音、視頻效果;減少服務(wù)器端的負(fù)荷,同時(shí)最大限度地節(jié)省帶寬。流媒體在Internet直播中充當(dāng)著重要角色。

5)全數(shù)字視頻網(wǎng)絡(luò)監(jiān)控系統(tǒng)

數(shù)字視頻壓縮技術(shù)已經(jīng)取得較大的進(jìn)展,MPEG-4、H.264等新的視頻壓縮格式使得在保證較高圖像質(zhì)量前提下的視頻碼率有效地減小到不足1Mb/s,甚至在不足100kb/s的帶寬下也能傳輸質(zhì)量很好的CIF幅面的全實(shí)時(shí)圖像。另外,網(wǎng)絡(luò)環(huán)境也取得了前所未有的進(jìn)展,ADSL、HFC等各種網(wǎng)絡(luò)接入方式迅速普及到各種用戶應(yīng)用領(lǐng)域,基于網(wǎng)絡(luò)的電視監(jiān)控系統(tǒng)已成為電視監(jiān)控系統(tǒng)實(shí)現(xiàn)方式的主流模式,無論系統(tǒng)大小,幾乎都以該系統(tǒng)是否有網(wǎng)絡(luò)接口作為評(píng)判系統(tǒng)是否具備了先進(jìn)性的依據(jù)之一。

3.其他新型視聽技術(shù)

1)?MP3與MP4

MP3(MPEG-1Layer3)是當(dāng)今較流行的一種音頻格式,全稱為MPEG(MPEG:MovingPictureExpertsGroup)AudioLayer3。它是基于MPEG-1第三層音頻(正式名稱11172-3)壓縮算法的一種(Layer3)。MP3是一種有損壓縮,它是基于人耳的聽覺特性來提高壓縮率的一種編碼算法。在基本上保持CD音質(zhì)的前提下,MP3的數(shù)據(jù)壓縮比高達(dá)1∶12,一首4分鐘的歌曲約3~5Mb,但音質(zhì)仍然相當(dāng)高。

MP4使用的是MPEG-2AAC技術(shù),AAC俗稱A2B或高級(jí)音頻編碼(AdvancedAudioCoding)。其中,MPEG-2是MPEG于1994年11月針對(duì)數(shù)碼電視(數(shù)碼影像)提出的。它的特點(diǎn)是音質(zhì)更加完美而壓縮比更大(1∶15)。MPEG-1支持采樣率為32kHz、44.1kHz和48kHz的單聲道及雙聲道編碼,而Layer3預(yù)設(shè)為32~320kb/s。MPEG-2則是對(duì)MPEG-1的向后兼容多聲道擴(kuò)展方案,它增加了一個(gè)“低頻擴(kuò)展”聲道,從而提升至5個(gè)聲道編碼,比特率的變化范圍增至1Mb/s。而MPEG-2AAC在采樣率為8~96kHz下提供了1~48個(gè)聲道可選范圍的高質(zhì)量音頻編碼。

MP4并不是MPEG-4或者M(jìn)PEGAudioLayer4。MPEG-4是一種多媒體應(yīng)用技術(shù)規(guī)范,它提供了交互使用圖像、多媒體的合成技術(shù),主要體現(xiàn)在范圍極廣的比特率下自然合成音頻的編碼和組合。它是一種開放型的技術(shù),用一種新規(guī)范包容了所有多媒體應(yīng)用技術(shù)。

2)多媒體計(jì)算機(jī)技術(shù)

多媒體計(jì)算機(jī)技術(shù)(MultimediaComputingTechnology)是指計(jì)算機(jī)綜合處理文本、圖形、圖像、視頻和音頻等多種媒體信息,使多種信息建立邏輯鏈接、集成為一個(gè)系統(tǒng)并具有交互性的技術(shù)。多媒體技術(shù)的基本特征是信息載體多樣性、集成性和交互性。人機(jī)相互交流是多媒體最大的特點(diǎn),沒有多媒體,對(duì)于電視、電影,你只能在一旁欣賞,而在多媒體上,你可以從圖形到顏色都予以修改,你可以參與其中,改變劇情,叫演員按照你的意思演出。要把一臺(tái)普通的計(jì)算機(jī)變成多媒體計(jì)算機(jī)要解決的關(guān)鍵技術(shù)是:①視頻、音頻信號(hào)獲取技術(shù);②多媒體數(shù)據(jù)壓縮編碼和解碼技術(shù);③視頻、音頻數(shù)據(jù)的實(shí)時(shí)處理和特技;④視頻、音頻數(shù)據(jù)的輸出技術(shù)。數(shù)字視聽技術(shù)在PC機(jī)應(yīng)用中主要有4個(gè)發(fā)展階段。第一階段,數(shù)字視頻、音頻只在一些特定的專業(yè)領(lǐng)域應(yīng)用。這主要是從事影視制作的專業(yè)人員利用計(jì)算機(jī)數(shù)字視頻進(jìn)行編輯、特殊效果處理等,這些功能僅是數(shù)字視頻的少部分,基本上代表了用最小的代價(jià)在硬件上完成數(shù)字編輯。第二階段,可以在計(jì)算機(jī)上看到視頻實(shí)時(shí)顯示,需要有外部視頻源。第三階段,數(shù)字音、視頻在專業(yè)領(lǐng)域的廣泛應(yīng)用??梢圆东@視頻序列,將視頻序列壓縮后存儲(chǔ)起來,隨時(shí)可以再播放。具體實(shí)現(xiàn)有兩種捕獲視頻序列的方法:—種是軟件方法,此法壓縮成本低,但所支持的視頻顯示窗口不能太大;另一種是硬件方法,此方法要比軟件方法的壓縮快得多,所支持的視頻窗口也可以較大,但成本較高。另外,此階段在標(biāo)準(zhǔn)化方面還不成熟,所以盡管存在許多視頻獲取方法,但不能保證獲取的視頻能在其他文件上使用。第四階段,數(shù)字音、視頻技術(shù)的標(biāo)準(zhǔn)化與大眾化。對(duì)數(shù)字視頻如何存成文件進(jìn)行了標(biāo)準(zhǔn)化,AVI(AudioVideoInterleaced)成為標(biāo)準(zhǔn)文件格式,數(shù)字視頻不再是特殊用途的工具了,加上壓縮/解壓技術(shù)運(yùn)用,使數(shù)字視頻文件存儲(chǔ)在PC系統(tǒng)成為可能并能在此基礎(chǔ)上進(jìn)行音、視頻文件的編輯和處理。多媒體技術(shù)使數(shù)字視聽技術(shù)、計(jì)算機(jī)技術(shù)和通信技術(shù)3大信息處理技術(shù)緊密地結(jié)合起來,為信息處理技術(shù)發(fā)展奠定了新的基石。1.1.2數(shù)字視聽設(shè)備的種類與特點(diǎn)

1.數(shù)字視聽設(shè)備的種類

1)激光視聽設(shè)備

激光視聽設(shè)備是采用光盤存儲(chǔ)數(shù)字音、視頻信息,通過激光讀取信息的數(shù)字設(shè)備,主要包括CD機(jī)、VCD機(jī)、DVD機(jī)等,新的產(chǎn)品有HDDVD(高清DVD)和藍(lán)光DVD。

2)網(wǎng)絡(luò)視聽設(shè)備

網(wǎng)絡(luò)視聽設(shè)備是利用通信網(wǎng)絡(luò)進(jìn)行圖像和聲音通信的數(shù)字設(shè)備,包括會(huì)議電視、可視電話、視頻點(diǎn)播、數(shù)字閉路電視以及Internet上的各項(xiàng)應(yīng)用等。

3)便攜式視聽設(shè)備

便攜式視聽設(shè)備是能夠隨身攜帶的數(shù)字視聽設(shè)備,目前在市場(chǎng)上普及的有MP3播放器和MP4播放器等。

2.?dāng)?shù)字視聽設(shè)備的特點(diǎn)

數(shù)字視聽設(shè)備與模擬視聽設(shè)備相比,具有如下幾個(gè)方面的特點(diǎn)。

1)數(shù)字化

數(shù)字技術(shù)在越來越多的音、視頻產(chǎn)品中應(yīng)用,模擬視聽產(chǎn)品已漸漸退出歷史舞臺(tái)。繼激光數(shù)字視聽產(chǎn)品取代原來的模擬錄音、錄像機(jī)后,我國電視數(shù)字化的進(jìn)程明顯加快,模擬信號(hào)向數(shù)字信號(hào)過渡全面展開。這不僅體現(xiàn)在單一數(shù)字設(shè)備的改進(jìn)和創(chuàng)新上,如出現(xiàn)了數(shù)字?jǐn)z像機(jī)、錄像機(jī)、特技機(jī)、切換臺(tái)等大批運(yùn)用數(shù)字技術(shù)的設(shè)備,而且大規(guī)模、整體性的數(shù)字系統(tǒng)也日趨完善,出現(xiàn)了全數(shù)字電視演播室、全數(shù)字電視轉(zhuǎn)播車、數(shù)字衛(wèi)星新聞采集(DSNC)轉(zhuǎn)播車等。這種數(shù)字化還正向全電視系統(tǒng)縱深發(fā)展,相繼出現(xiàn)了地面數(shù)字廣播(DVB-T)、數(shù)字衛(wèi)星直播用戶(DTH)等。

2)集成化

隨著數(shù)字電子技術(shù)的發(fā)展,一塊芯片上可以集成越來越多的音、視頻信號(hào)的處理功能,使產(chǎn)品的用途更廣,體積更小。

3)網(wǎng)絡(luò)化

現(xiàn)代的數(shù)字視聽產(chǎn)品不僅能提供高清晰度的圖像和高保真的聲音,而且還有多種用途,如點(diǎn)播節(jié)目、網(wǎng)上購物、網(wǎng)上銀行、網(wǎng)際漫游等,可以促進(jìn)電視、電腦、通信三者的融合,成為信息高速公路進(jìn)入家庭的捷徑。技術(shù)人員已經(jīng)擬定了一套適應(yīng)數(shù)字視聽產(chǎn)品相互連接的家庭網(wǎng)絡(luò)的基本格式。這套方案的確立,使未來家庭數(shù)字視聽產(chǎn)品之間可以實(shí)現(xiàn)相互控制操作。

4)個(gè)性化、人性化

數(shù)字視聽產(chǎn)品設(shè)計(jì)將突出個(gè)性化和人性化。激烈的競(jìng)爭(zhēng)促使生產(chǎn)者不斷對(duì)消費(fèi)市場(chǎng)進(jìn)行細(xì)分,推出滿足個(gè)性化需求的新技術(shù)、新產(chǎn)品,像大屏幕液晶電視、大容量快速存儲(chǔ)技術(shù)、技術(shù)含量高的數(shù)碼影像產(chǎn)品都更多地體現(xiàn)出人性化設(shè)計(jì)的特點(diǎn)。

1.2信號(hào)的數(shù)字化

1.2.1模擬信號(hào)與數(shù)字信號(hào)

1.模擬信號(hào)及其特點(diǎn)

模擬信號(hào)是指在時(shí)間軸上連續(xù)變化的信號(hào)。對(duì)于模擬信號(hào),可以通過相對(duì)應(yīng)的一些參數(shù)(如頻率、周期、幅度等)來描述其變化的情況。模擬信號(hào)雖具有變化直觀、形象等特點(diǎn),但容易受到干擾,而且其所表示的范圍較小,精度相對(duì)較低。

2.?dāng)?shù)字信號(hào)及其特點(diǎn)

數(shù)字信號(hào)是指用一系列數(shù)據(jù)組來表示的信號(hào),數(shù)字信號(hào)在時(shí)間軸上是離散的,而且表示數(shù)字信號(hào)幅度的數(shù)字量也是離散的。數(shù)字信號(hào)只有0或1兩種狀態(tài),因此,它具有抗干擾能力強(qiáng)、精度高、表示的動(dòng)態(tài)范圍寬、穩(wěn)定性高、便于存儲(chǔ)和變換等一系列優(yōu)點(diǎn)。

由于CD光盤上記錄的是數(shù)字化音頻信號(hào),VCD/DVD光盤上記錄的是數(shù)字化的音頻和視頻信息,因此,在將模擬的音頻和視頻信號(hào)記錄到光盤之前,必須對(duì)其進(jìn)行數(shù)字化處理。1.2.2音頻信號(hào)的數(shù)字化

將模擬的音頻信號(hào)變化為數(shù)字信號(hào),必須經(jīng)過采樣、量化和編碼3個(gè)主要過程。圖1-2是模擬信號(hào)數(shù)字化的過程示意圖。圖1-2模擬信號(hào)的數(shù)字化過程

1.采樣

采樣是將模擬信號(hào)變換為數(shù)字信號(hào)的第一步。所謂采樣,就是以一定的頻率在時(shí)間軸上對(duì)模擬信號(hào)離散地進(jìn)行取樣,用離散的樣本值代替原來連續(xù)的信號(hào)波形的過程。采樣時(shí),在一定的時(shí)間范圍內(nèi),采樣時(shí)間間隔越小,采樣點(diǎn)越多,因而采樣頻率等于采樣時(shí)間間隔的倒數(shù)。

在信號(hào)的數(shù)字化過程中,采樣頻率和每個(gè)時(shí)刻的采樣值非常重要,它們決定了波形的重放精度。采樣頻率越高,采樣的周期越短,丟失的信息就越少,經(jīng)過數(shù)字化處理后與原來信號(hào)間的誤差就越小,精度也越高。圖1-2(a)所示為采樣脈沖與模擬信號(hào)的關(guān)系示意圖。在實(shí)際應(yīng)用中,并不是無限地追求高精度,而是要求精度滿足要求就可以了。根據(jù)奈奎斯特采樣定理,只要采樣頻率大于或等于模擬信號(hào)中最高頻率的2倍,就可以不失真地恢復(fù)出原模擬信號(hào)。例如,音頻信號(hào)的最高頻率是20kHz,采樣頻率應(yīng)大于或等于40kHz。

在實(shí)際應(yīng)用中,為了能與數(shù)字式磁帶錄音機(jī)PCM處理器使用的采樣頻率(44.1kHz)兼容,在錄制CD時(shí),一般采用44.1kHz作為采樣頻率。

2.量化

由采樣獲得的信號(hào),雖然在時(shí)間上是離散的,但其在幅度上仍然是連續(xù)的信號(hào)。要把采樣保持后得到的信號(hào)在幅度上變換成離散的信號(hào),必須對(duì)其進(jìn)行量化處理。

所謂量化,是指將各個(gè)時(shí)刻波形的幅值(采樣值)用有限位的二進(jìn)制數(shù)來表示(1位二進(jìn)制數(shù)稱為1bit)的過程,實(shí)質(zhì)上是通過四舍五入的方法將每一個(gè)采樣值歸并到某一個(gè)相鄰整數(shù)的過程。如果用n位二進(jìn)制碼來表示一個(gè)量化級(jí)(或稱量化電平級(jí)數(shù)),則它所能夠表示的量化級(jí)的總數(shù)為

M?=?2n

這樣,當(dāng)選用4位二進(jìn)制數(shù)時(shí),它只能代表0~15共16個(gè)十進(jìn)制數(shù),用它來量化時(shí),就只能代表0~15個(gè)電壓值(等級(jí));若選用16位二進(jìn)制數(shù)時(shí),它可能代表0~65535共65536個(gè)十進(jìn)制數(shù),用它來量化時(shí),就可以代表0~65536個(gè)電壓值(等級(jí))。對(duì)CD中的音頻信號(hào),采用的量化位數(shù)為16,相應(yīng)音頻信號(hào)的動(dòng)態(tài)范圍理論上可達(dá)到

20lg216?=?96dB音頻信號(hào)的量化示意圖如圖1-2(b)、(c)所示。由圖1-2(b)、(c)可見,經(jīng)過量化處理后,量化值與采樣值之間產(chǎn)生了誤差。這種由于量化引起的輸入信號(hào)與輸出信號(hào)之間的誤差稱為量化誤差。

量化誤差對(duì)信號(hào)來說就是量化噪聲。量化噪聲的大小取決于量化級(jí)數(shù)的多少,即所使用的二進(jìn)制位數(shù)的多少。位數(shù)越多,量化等級(jí)越細(xì),量化噪聲就越小。通常,各種信號(hào)量化噪聲的信噪比(S/N)可表示為

(1-1)其中,b為量化位數(shù),m為由信號(hào)的統(tǒng)計(jì)性質(zhì)決定的常數(shù),對(duì)正弦信號(hào)m=3.01。由此可見,對(duì)一量化位數(shù)為16的正弦信號(hào),其信噪比接近98dB。

由于在CD系統(tǒng)中,對(duì)音頻信號(hào)的采樣頻率為44.1kHz,若量化位數(shù)為16,對(duì)立體聲音頻信號(hào)進(jìn)行數(shù)字化時(shí),每秒種要傳送的碼元數(shù)量,也就是碼率(或稱數(shù)據(jù)傳輸率)為

碼率?=?采樣頻率?×?量化位數(shù)?×?2?

=?44.1?×?16?×?2?=?1.4112Mb/s

若考慮到誤碼檢出和誤碼校正用碼的要求,還要增加20%~30%的冗余脈沖,則需傳送的碼率為2Mb/s,為此要求設(shè)備的帶寬必須在1~1.5MHz。

3.編碼

編碼是將已量化的各電平值用二進(jìn)制數(shù)來表示的過程。經(jīng)過編碼后,一個(gè)模擬信號(hào)就可以用一系列的二進(jìn)制數(shù)字來表示。信號(hào)的編碼示意圖如圖1-2(d)所示。

編碼后形成的二進(jìn)制碼為數(shù)字信號(hào),在電路中用脈沖的有無,即高電平“1”和低電平“0”來表示?!?”為有脈沖,“0”為無脈沖,這些脈沖的幅度和寬度均相等。由此形成的脈沖信號(hào)稱為脈沖編碼信號(hào),其過程用PCM(PulseCodeModulation)表示,即脈沖編碼調(diào)制。對(duì)于音頻信號(hào),數(shù)字信號(hào)的波形與圖1-2(d)中所示的波形會(huì)有所不同,它不完全在橫坐標(biāo)(即零電平)的上方,而是在零電平的上、下變化。因此,為了能夠正確表示在零電平上、下方的正、負(fù)數(shù),必須用二進(jìn)制數(shù)的補(bǔ)碼來表示。同時(shí),當(dāng)補(bǔ)碼的所有位均為0或均為1時(shí),它所代表的數(shù)值接近于零,這一特點(diǎn)對(duì)于防止系統(tǒng)故障是非常有利的。1.2.3視頻信號(hào)的數(shù)字化

1.視頻信號(hào)的特點(diǎn)

如前所述,音頻信號(hào)的頻率范圍為20Hz~20kHz,而且在此頻率范圍內(nèi)是連續(xù)變化的模擬信號(hào)。當(dāng)采樣頻率為44.1kHz,并采用16位的量化位數(shù)時(shí),其碼率為2Mb/s。

視頻信號(hào)與音頻信號(hào)相比,具有一些明顯的特點(diǎn)。首先,視頻信號(hào)是由亮度信號(hào)、色度信號(hào)、同步信號(hào)、消隱信號(hào)等組成的,頻率范圍為0~6MHz。其次,在視頻信號(hào)中,同步信號(hào)與消隱信號(hào)是固定不變的,而變化的亮度與色度信號(hào)位于消隱信號(hào)之間,這樣就使得亮度和色度信號(hào)被消隱信號(hào)分成一段一段的信號(hào),形成在時(shí)間軸上不連續(xù)的信號(hào)。為此,對(duì)視頻信號(hào)的數(shù)字化分為全信號(hào)數(shù)字化和分量數(shù)字化兩種基本方式。全信號(hào)數(shù)字化是指對(duì)復(fù)合全電視信號(hào)直接進(jìn)行數(shù)字化。這種方法相互間的干擾較大,而且當(dāng)電視制式不同時(shí),解碼方法也不同。

分量數(shù)字化是指對(duì)亮度信號(hào)Y、色差信號(hào)(R-Y)、(B-Y)分別進(jìn)行數(shù)字化,然后采取時(shí)分復(fù)用制進(jìn)行處理。這種方法可以避免反復(fù)編碼和解碼的過程,而且亮度信號(hào)與色差信號(hào)分開處理,相互間的影響較小,特別是可以將625/50制和525/60制統(tǒng)一起來,是目前普遍采取的方法。

2.視頻信號(hào)的采樣結(jié)構(gòu)與采樣頻率

1)采樣結(jié)構(gòu)

對(duì)于音頻信號(hào),由于其在時(shí)間軸上是連續(xù)的,因此,對(duì)采樣點(diǎn)的結(jié)構(gòu)沒有特殊的要求。但對(duì)于視頻信號(hào)來講,由于其在時(shí)間軸上并不是連續(xù)的,而且采用隔行掃描時(shí)奇數(shù)行與偶數(shù)行都存在半行結(jié)構(gòu),所以,在采樣時(shí)就存在著采樣點(diǎn)的分布問題。這是因?yàn)椋舨蓸宇l率不是行頻的整數(shù)倍,那么,采樣點(diǎn)就可能發(fā)生重合,使圖像的質(zhì)量下降。目前,對(duì)視頻信號(hào)數(shù)字化時(shí),都采用固定型正交采樣結(jié)構(gòu),采樣頻率為行頻的整數(shù)倍,而且使每一場(chǎng)中的采樣點(diǎn)都對(duì)齊且重合。

2)采樣頻率

根據(jù)奈奎斯特采樣定理,采樣頻率與信號(hào)帶寬有一定的關(guān)系。對(duì)于625/50制式,其掃描帶寬為5.8~6.0MHz;對(duì)于525/60制式,其掃描帶寬為5.6MHz。考慮到采樣后的混疊噪聲要足夠小,要求采樣頻率應(yīng)為被采樣信號(hào)的2.2~2.7倍。因此,對(duì)于PAL制,采樣頻率至少應(yīng)為12.72~13.2MHz。

另外,為了使625/50和525/60兩種掃描制式兼容,應(yīng)使用同一種采樣頻率。626/50和525/60的行頻分別為15625Hz和15734Hz,二者的最小公倍數(shù)為2.25MHz。綜上所述,亮度信號(hào)的采樣頻率應(yīng)大于13.2MHz,而且是2.25MHz的6倍,選13.5MHz。

在確定色差信號(hào)的采用頻率時(shí),考慮到色差信號(hào)CB、CR的帶寬小于2MHz,為了降低采樣后的混疊噪聲,保證采樣頻率為行頻的整數(shù)倍及制式的兼容性,色差信號(hào)的采樣頻率定為6.75MHz,為亮度信號(hào)采樣頻率的一半。而且,該頻率也是PAL制行頻的432倍,是NTSC制的429倍。

3)視頻信號(hào)的量化位數(shù)與碼率

被處理信號(hào)的信噪比與量化位數(shù)有著密切的關(guān)系,若被量化的信號(hào)是單極性信號(hào),則信噪比可由下式確定:

=

6n?+

10.8dB(1-2)

式中,n為量化位數(shù)。由此可見,隨著量化位數(shù)的增加,信噪比相應(yīng)得到提高,而且每增加一位,信噪比可提高6dB,但同時(shí)也會(huì)使電路的復(fù)雜性和設(shè)備的成本大大提高。綜合考慮,電視信號(hào)的量化位數(shù)一般取8位較為合理,此時(shí)的信噪比可達(dá)59dB。在分量數(shù)字化中,由于亮度信號(hào)的采樣頻率為13.5MHz,兩個(gè)色差信號(hào)的采樣頻率為6.75MHz,量化位數(shù)都是8bit,因此

碼率?=?13.5?×?8?+?6.75?×?8?×?2?=?216Mb/s

可見,視頻信號(hào)傳送的碼率要比音頻信號(hào)的碼率(2Mb/s)高出100倍以上。

4)電視信號(hào)的數(shù)字化標(biāo)準(zhǔn)

電視信號(hào)數(shù)字化標(biāo)準(zhǔn)有2∶1∶1、4∶2∶2和4∶4∶4等格式。DVD視盤機(jī)采用的是4∶2∶2標(biāo)準(zhǔn),圖像水平清晰度達(dá)500線,如表1-1所示。其采樣頻率為

Y∶CR∶CB=13.5MHz∶6.75MHz∶6.75MHz

如果將亮度信號(hào)和色差信號(hào)的采樣頻率都減少一倍,就構(gòu)成了2∶1∶1標(biāo)準(zhǔn),當(dāng)然每數(shù)字行的點(diǎn)數(shù)也要減少一倍,這就是VCD的標(biāo)準(zhǔn),其圖像水平清晰度可達(dá)250線。

5)視頻壓縮編碼

根據(jù)上述分析可知,即使按照2∶1∶1的低檔標(biāo)準(zhǔn)編碼的電視信號(hào),其傳輸碼率也將達(dá)到108Mb/s,要求帶寬高達(dá)100MHz。這樣,將給信號(hào)的存儲(chǔ)、錄放處理和傳輸?shù)葞砭薮蟮睦щy。利用頻帶壓縮編碼技術(shù)(也稱碼率壓縮)可在不降低圖像質(zhì)量的前提下降低碼率。頻帶壓縮的方法有3種,即同步信號(hào)去除、高效編碼和DCT編碼。

(1)同步信號(hào)去除。

由于電視信號(hào)在行場(chǎng)的逆程期間不攜帶圖像信息,因此,可以在傳輸過程中將其去除,而只傳送光柵可見部分的取樣點(diǎn),即只對(duì)有效行進(jìn)行數(shù)字化處理,處理完成后再嵌上行、場(chǎng)同步信號(hào)。這一方法在電視畫中畫技術(shù)中得到采用,可以減少17%的碼率。

(2)高效編碼。

高效編碼是利用人眼的視覺惰性和電視信號(hào)的統(tǒng)計(jì)特性來減少碼率的一種編碼方式。人眼的視覺惰性有兩個(gè)明顯的特點(diǎn):一是視覺檢測(cè)有一個(gè)門限值,低于該門限值的誤差不會(huì)被發(fā)覺;二是該門限值會(huì)隨著時(shí)間和空間圖像的內(nèi)容而變化。對(duì)于第一點(diǎn),在編碼時(shí),可以在視覺門限值較小的圖像部分將取樣頻率或量化位數(shù)取得高一些,而在視覺門限值較高的圖像部分,采用較低的取樣頻率或量化位數(shù),這樣,就可以在不降低圖像質(zhì)量的前提下降低傳送的碼率。對(duì)于第二個(gè)特點(diǎn),可對(duì)幀間變化快的運(yùn)動(dòng)圖像,適當(dāng)降低采樣頻率,此時(shí)雖然幀內(nèi)圖像的水平和垂直分辨率有所下降,但由于這種運(yùn)動(dòng)圖像的視覺門限值較高,所以不會(huì)被發(fā)覺;對(duì)于幀間變化較慢的靜止或慢運(yùn)動(dòng)圖像,因其視覺門限值較低,要求有較高的分辨率,不能降低其采樣頻率。為此,可采用每?jī)蓭瑐魉鸵淮危诳焖龠\(yùn)動(dòng)部分將幀內(nèi)頻率降低一半,這在視覺上不會(huì)感覺到圖像質(zhì)量的下降。

(3)?DCT編碼。

DCT(DiscreteCosineTransform)變換也稱離散余弦變換,它是一種數(shù)字編碼的變換方式。在正常情況下,大多數(shù)圖像信號(hào)中的低頻分量都要比高頻分量的幅度大,水平線和垂直線出現(xiàn)的幾率比斜線出現(xiàn)的幾率大。因此,可以采用DCT變換的方式,將取樣后的圖像樣值進(jìn)行變換,形成新的編碼序列,以獲得更高的編碼效率。

DCT變換是一種傅里葉變換。對(duì)于二維的電視圖像來講,對(duì)應(yīng)的二維DCT變換與反變換的表達(dá)式為

(1-3)

(1-4)其中,式(1-3)為DCT的正變換,它可以將像素的采樣值變換成頻率系數(shù);式(1-4)為DCT的逆變換,它可以將頻率系數(shù)還原成像素的采樣值。式中的x,y,u,v?=

0,1,2,…,7;

f?(x,y)是像素的位置函數(shù);F(u,v)是對(duì)應(yīng)于f?(x,y)中每個(gè)像素經(jīng)DCT變換后的系數(shù)函數(shù);C(u)、C(v)是常數(shù),當(dāng)u=v=0時(shí),C(u)

=?C(v)

=

1/,當(dāng)u和v不為零時(shí),C(u)

=?C(v)+=

1。當(dāng)u?=?v?=

0時(shí),式(1-3)可簡(jiǎn)化為

(1-5)式(1-5)表示64個(gè)像素點(diǎn)的平均值,相當(dāng)于直流分量。在進(jìn)行DCT變換時(shí),首先要將整幅圖像進(jìn)行分割,再橫向分成若干片,每片圖像再縱向切成若干個(gè)宏塊,如圖1-3所示。為便于理解,以圖1-3中像塊取4?×?4個(gè)像點(diǎn),每個(gè)像點(diǎn)量化位數(shù)為4的例子進(jìn)行說明。對(duì)每個(gè)宏塊,在水平方向上進(jìn)行4次取樣(4個(gè)像素點(diǎn)),垂直方向是4條掃描線,即每個(gè)宏塊中含有16個(gè)像素點(diǎn)。若對(duì)每個(gè)像素進(jìn)行量化和編碼,運(yùn)用DCT變換的方法,即可以將16個(gè)像點(diǎn)量化的數(shù)據(jù)從空間坐標(biāo)轉(zhuǎn)換成頻率坐標(biāo)分量,實(shí)際上就是將信號(hào)分解成若干頻率分量,然后用頻率的分量來表示。由圖1-3可見,數(shù)據(jù)經(jīng)過DCT變換后,將大多數(shù)像點(diǎn)中的低頻分量表示高值,并抽到坐標(biāo)的左上角,由于許多像點(diǎn)的亮度電平都相等,因此,高頻分量的值為零。這樣,大多數(shù)方塊中的數(shù)據(jù)將變成零,使數(shù)據(jù)量大大減少,從數(shù)據(jù)上說是起到了壓縮的效果。若畫面的亮度與色彩有明顯變化時(shí),量化后的高頻分量將增大,低頻分量則變小。但當(dāng)對(duì)頻率坐標(biāo)中的系數(shù)進(jìn)行量化處理后,大多數(shù)的高頻分量也變成了零,只剩下直流分量和低頻分量。此時(shí),若對(duì)這16個(gè)像點(diǎn)在數(shù)據(jù)排列上進(jìn)行“Z”字形掃描后編碼,則可使得編碼后的數(shù)據(jù)量大為減少,達(dá)到數(shù)據(jù)壓縮的目的。經(jīng)過這種處理后,再使用哈夫曼編碼,進(jìn)行一次量化運(yùn)算和編碼變成更簡(jiǎn)化的數(shù)字信號(hào)。圖1-3空間坐標(biāo)轉(zhuǎn)換為頻率坐標(biāo)(DCT變換)

1.3信號(hào)的調(diào)制與糾錯(cuò)

1.3.1記錄信號(hào)的調(diào)制

1.光盤信息的特點(diǎn)

在光盤上記錄的信號(hào),都是以微小的凹坑形式來代表數(shù)字“1”和“0”的。如果按照數(shù)據(jù)流直接以有無凹坑來記錄數(shù)據(jù),則最小凹坑尺寸等于記錄的1位數(shù)據(jù)。光盤可讀出的最小凹坑由聚焦光點(diǎn)的尺寸決定,這樣就可以直接刻錄信號(hào)并決定記錄密度。在實(shí)際應(yīng)用中,數(shù)據(jù)流信息是由數(shù)字“1”、“0”的某些組合構(gòu)成的,這樣,數(shù)據(jù)碼流連續(xù)為“0”和連續(xù)為“1”的情況是經(jīng)常出現(xiàn)的。在光盤錄制的數(shù)據(jù)中,若出現(xiàn)連續(xù)為“0”或連續(xù)為“1”的情況,不但會(huì)使得激光束的通斷頻率降低,造成光強(qiáng)不穩(wěn)定,也會(huì)使伺服電路的工作出現(xiàn)不正常現(xiàn)象。另外,如果數(shù)字連續(xù)出現(xiàn)為“0”的情況,有可能使DSP電路中的壓控振蕩器工作不正常。因此,在激光視盤機(jī)中,為了使伺服系統(tǒng)穩(wěn)定地工作,應(yīng)盡量減少信號(hào)的低頻分量和直流平均分量,并排除干擾,在信號(hào)記錄到光盤之前需要對(duì)其進(jìn)行調(diào)制。

2.光盤信息的調(diào)制與解調(diào)

由于CD/VCD和DVD光盤記錄數(shù)據(jù)密度等方面的不同,在CD/VCD視盤機(jī)中采用EFM(EighttoFourteenModulation)調(diào)制,而在DVD機(jī)中,對(duì)記錄的數(shù)據(jù)要進(jìn)行EFM+調(diào)制。

所謂EFM調(diào)制,就是把8位字長的字符調(diào)制成14位字長的字符。對(duì)16位的數(shù)據(jù),首先應(yīng)把它分為兩個(gè)8位的數(shù)據(jù)字分別送到8位—14位變換器,變成14位的通道位信號(hào),然后用通道位流在光盤上進(jìn)行記錄。其調(diào)制規(guī)則是:在PCM碼中,每對(duì)數(shù)碼的“1”之間至少要有兩個(gè)“0”碼,而至多不能超過10個(gè)“0”碼。EFM調(diào)制遵循3T~11T原則(T為1位信號(hào)所占用的時(shí)間)。在信號(hào)記錄和拾取過程中,由于數(shù)碼流是串行傳輸?shù)模@樣,當(dāng)一個(gè)14位的數(shù)碼以1結(jié)尾,而下一個(gè)14位的數(shù)碼又有可能以1開始時(shí),在這樣的兩組數(shù)碼的連接處便不能滿足3T~11T規(guī)則。為此,在每?jī)蓚€(gè)14位的數(shù)碼之間插入了3位的連接位。3位連接位的選擇可以是000、010、001這3種的任何一種,以保證EFM數(shù)據(jù)流中相鄰兩個(gè)數(shù)據(jù)間至少有兩個(gè)“0”位的存在。

EFM+調(diào)制與EFM調(diào)制一樣,仍然滿足3T~11T的信號(hào)坑長度原則,但在EFM+調(diào)制技術(shù)中不再需要EFM要求的3位連接碼。與每位字節(jié)(8位數(shù)字信號(hào))對(duì)應(yīng)的EFM+代碼只有16位,比EFM的17位通道碼縮短了16%,提高了光盤物理空間的利用率。

EFM解調(diào)是EFM調(diào)制的逆過程。在編碼過程中,需要對(duì)模擬信號(hào)進(jìn)行PCM編碼、

CIRC糾錯(cuò)、EFM調(diào)制等數(shù)字化處理,將數(shù)字信號(hào)記錄到光盤上。在解碼過程中,則要進(jìn)行EFM解調(diào)、反交錯(cuò)、D/A轉(zhuǎn)換等處理,才能還原出原來的模擬信號(hào)。

在進(jìn)行EFM解調(diào)時(shí),需要先將串行輸入的待解調(diào)信號(hào)進(jìn)行串/并轉(zhuǎn)換,然后對(duì)每個(gè)并行的14位數(shù)據(jù)進(jìn)行鎖存,再經(jīng)14位—8位譯碼器將其還原為8位數(shù)據(jù)信號(hào)。EFM+解調(diào)則是將16位數(shù)據(jù)還原為8位數(shù)據(jù)信號(hào)。1.3.2誤碼的檢測(cè)、糾錯(cuò)與補(bǔ)償

1.誤碼的檢測(cè)與糾錯(cuò)

對(duì)于以光盤為存儲(chǔ)媒體的CD/VCD/DVD視盤機(jī)來講,在原版制作、盤片制造、使用過程以及其他可能的原因下,很容易造成重放的數(shù)字信號(hào)出現(xiàn)誤碼現(xiàn)象,這樣勢(shì)必會(huì)引起重放的圖像和聲音出現(xiàn)不同的失真。既然在光盤的刻錄與重放過程中不可避免地會(huì)產(chǎn)生誤碼,這就要求對(duì)產(chǎn)生的誤碼進(jìn)行檢測(cè),并及時(shí)地進(jìn)行糾正。在對(duì)誤碼進(jìn)行糾錯(cuò)之前,首先應(yīng)識(shí)別信號(hào)中原有的誤碼及誤碼的位置,為此一般在原信息碼中以一定規(guī)則增加一個(gè)或幾個(gè)多余碼元,使原來信息碼中不相關(guān)的碼元變?yōu)橄嚓P(guān)。這樣,在信號(hào)的播放還原處理中,可以根據(jù)相應(yīng)的規(guī)則進(jìn)行誤碼校驗(yàn)。

目前常用的誤碼檢測(cè)與糾錯(cuò)方法一般有奇偶檢驗(yàn)法、循環(huán)冗余檢驗(yàn)(CyclicRedundancyCheck,CRC)法、交叉交織里德-索羅門碼(CrossInterleaveReed-solomonCode,CIRC)法、里德-索羅門乘積碼(Reed-SolomonProductCode,RSPC)法等。

1)奇偶校驗(yàn)法

奇偶校驗(yàn)法是一種最基本而簡(jiǎn)單有效的校驗(yàn)方法。利用奇偶校驗(yàn)法可以判斷一組數(shù)據(jù)碼中個(gè)別誤碼的所在位置。該方法的基本思想是根據(jù)字節(jié)中二進(jìn)制數(shù)位中的“1”和“0”的個(gè)數(shù)是奇數(shù)還是偶數(shù)來檢驗(yàn)是否有誤碼產(chǎn)生。具體實(shí)現(xiàn)時(shí),首先在信息位之外添加一位“1”或“0”,并使包括該位在內(nèi)的全體碼中的“1”的個(gè)數(shù)總是為奇數(shù)(或者為偶數(shù)),然后利用當(dāng)誤碼產(chǎn)生時(shí)奇偶發(fā)生顛倒的性質(zhì)來檢查出誤碼。對(duì)于利用奇偶校驗(yàn)法檢測(cè)出的誤碼,可采用縱橫奇偶校驗(yàn)法進(jìn)行糾錯(cuò)處理。奇偶校驗(yàn)法僅能對(duì)奇數(shù)個(gè)1或0發(fā)生誤碼有效。

2)循環(huán)冗余檢驗(yàn)法

循環(huán)冗余檢驗(yàn)法是一種比奇偶校驗(yàn)的檢錯(cuò)、糾錯(cuò)能力更強(qiáng)、更加行之有效的方法。它是以代數(shù)計(jì)算方法來分析碼的結(jié)構(gòu),然后再以代數(shù)運(yùn)算方法來設(shè)置檢驗(yàn)位。其過程比奇偶校驗(yàn)法復(fù)雜。

3)交叉交織里德-索羅門碼法

交織法是對(duì)付群誤碼的一種最基本的方法。這種方法在記錄時(shí)改變數(shù)字信號(hào)的順序,重放時(shí)再按照原來的順序重排。前者稱為交織,后者稱為去交織。經(jīng)過交織和去交織處理后,原來的誤碼也同時(shí)被分散開來,群誤碼也變成了隨機(jī)誤碼,然后再采用奇偶校驗(yàn)法糾錯(cuò)。

交叉交織里德-索羅門碼法是指在交織前和交織后的不同字組上都加上糾錯(cuò)碼,這樣就可在交織前和交織后各形成一個(gè)奇偶校驗(yàn)字,使得糾錯(cuò)能力進(jìn)一步增強(qiáng)。里德-索羅門碼由里德-索羅門發(fā)明,它至少設(shè)置兩個(gè)校驗(yàn)位,并且校驗(yàn)位和信息位按規(guī)定的算術(shù)模式運(yùn)算后產(chǎn)生至少兩個(gè)校正字。在記錄時(shí)校正字的值為0,在重放時(shí)根據(jù)校正字的值是否為0來判斷誤碼是否出現(xiàn),并經(jīng)過反運(yùn)算來決定誤碼的位置,以便加以糾錯(cuò)。該碼對(duì)隨機(jī)誤碼具有極強(qiáng)的糾錯(cuò)能力。

在CD/VCD中,采用的是CIRC(交叉交織里德-索羅門)糾錯(cuò)編碼方法,它是將交叉交織法與4階里德-索羅門碼進(jìn)行組合而進(jìn)行糾錯(cuò)的。這種糾錯(cuò)碼對(duì)于出現(xiàn)頻度很高的隨機(jī)誤碼,由里德-索羅門碼幾乎給予全部糾正;對(duì)于那些經(jīng)常出現(xiàn)但碼長較短的群誤碼,則由交叉交織來糾正;對(duì)偶爾出現(xiàn)的很長的群誤碼,則由另外的交織來解決。

CIRC糾錯(cuò)碼綜合了交織、延時(shí)交織、交叉交織及里德-索羅門碼等糾錯(cuò)技術(shù),不僅能糾錯(cuò)隨機(jī)誤碼,還對(duì)突發(fā)誤碼有特強(qiáng)的糾錯(cuò)能力。

在DVD中采用的是里德-索羅門乘積碼(RSPC)糾錯(cuò)編碼方式,它是在里德-索羅門編碼方法基礎(chǔ)上發(fā)展起來的一種新的糾錯(cuò)技術(shù)。實(shí)踐表明,即使糾錯(cuò)前的誤碼率為1%,經(jīng)RSPC糾錯(cuò)后也會(huì)下降到10-20以下,而在同樣條件下,CIRC糾錯(cuò)后誤碼率僅可達(dá)到10-6水平。

2.誤碼的補(bǔ)償

由于數(shù)字信號(hào)只有“0”和“1”兩種狀態(tài),因此,對(duì)信號(hào)在刻錄和重放時(shí)產(chǎn)生的個(gè)別誤碼被檢測(cè)出來后,就比較容易進(jìn)行糾正了,只要將原來誤碼的地方取反即可。若檢測(cè)出的某一位“1”為誤碼,則只需將該位變成“0”即可得到糾正。

在CD/VCD中采用的CIRC糾錯(cuò)技術(shù),雖然有很強(qiáng)的糾錯(cuò)能力,但也很難做到百分之百的糾正。為此,在數(shù)字系統(tǒng)中又采用了誤碼補(bǔ)償?shù)姆椒▽?duì)不能及時(shí)糾正的誤碼進(jìn)行進(jìn)一步控制。所謂誤碼補(bǔ)償,就是根據(jù)誤碼的前后關(guān)系推斷出原來的數(shù)據(jù),再進(jìn)行替換的方法。常用的誤碼補(bǔ)償方法有靜噪法、前值保持法和線性內(nèi)插法3種。

靜噪法也稱零值替代法,這種方法就是使誤碼位置的值恒為零。當(dāng)發(fā)生差錯(cuò)并被識(shí)別出來時(shí),使電路在出錯(cuò)的這一點(diǎn)上切斷揚(yáng)聲器的聲音信號(hào)和到顯像管的圖像信號(hào)。

前值保持就是當(dāng)發(fā)現(xiàn)有可疑的誤碼時(shí),用最靠近它的前一個(gè)數(shù)據(jù)字來代替它,由于音頻和視頻信號(hào)的相關(guān)性,補(bǔ)償后的數(shù)據(jù)誤差率將會(huì)大大降低。

線性內(nèi)插是指取出錯(cuò)前的一個(gè)數(shù)據(jù)字與出錯(cuò)后的一個(gè)數(shù)據(jù)字的平均值,并用該值代替這個(gè)出錯(cuò)的字。利用這種方法,可以得到更為精確的糾錯(cuò)。

1.4數(shù)據(jù)壓縮技術(shù)的標(biāo)準(zhǔn)

1.4.1數(shù)據(jù)壓縮技術(shù)的分類

由于在數(shù)據(jù)中間存在一定的冗余度,以及在數(shù)據(jù)之間存在一定的相關(guān)性,因此可對(duì)數(shù)據(jù)進(jìn)行適當(dāng)?shù)膲嚎s處理以解決數(shù)據(jù)傳輸過程中的存儲(chǔ)、傳輸帶寬等問題。數(shù)據(jù)壓縮分為無損壓縮與有損壓縮兩大類。無損壓縮是指對(duì)原始數(shù)據(jù)壓縮重構(gòu),重構(gòu)后得到的數(shù)據(jù)與原來的數(shù)據(jù)完全相同,這種壓縮方式的壓縮比一般較低,常用于對(duì)文本數(shù)據(jù)的壓縮;有損壓縮是指對(duì)原始數(shù)據(jù)壓縮重構(gòu),重構(gòu)后得到的數(shù)據(jù)與原來的數(shù)據(jù)有所不同,此壓縮方式的壓縮比較高,常用于對(duì)圖像、音頻和視頻信號(hào)的壓縮。

目前常用的數(shù)據(jù)壓縮標(biāo)準(zhǔn)主要有用于靜止圖像壓縮的JPEG系列標(biāo)準(zhǔn)、用于視頻和音頻通信的H.26X系列標(biāo)準(zhǔn)、用于音頻和視頻編碼的MPEG系列標(biāo)準(zhǔn)以及用于二值圖像編碼的JBIG標(biāo)準(zhǔn)等。1.4.2不同數(shù)據(jù)壓縮標(biāo)準(zhǔn)的特點(diǎn)

1.H.26X系列標(biāo)準(zhǔn)

H.26X系列主要針對(duì)低速率環(huán)境下的實(shí)時(shí)應(yīng)用設(shè)計(jì),特點(diǎn)是強(qiáng)調(diào)算法的簡(jiǎn)單性和實(shí)時(shí)性,適用于視頻會(huì)議和可視電話等實(shí)時(shí)交互的情況。其中,H.261和H.263是視頻會(huì)議和可視電話的主要視頻編碼標(biāo)準(zhǔn)。

1)?H.261視頻編碼標(biāo)準(zhǔn)

H.261是ITU-T為在綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)上開展雙向聲像業(yè)務(wù)(可視電話、視頻會(huì)議)而制定的,是最早的運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn),速率為64kb/s的整數(shù)倍。H.261采用預(yù)測(cè)編碼(DPCM)與離散余弦編碼(DCT)混合編碼方法,只對(duì)通用中間格式(CommonIntermediateFormat,CIF格式,亮、色信號(hào)的水平和垂直像素?cái)?shù)均為ITU-R601標(biāo)準(zhǔn)圖像的一半)和四分之一CIF格式(QuarterCIF)兩種圖像格式進(jìn)行處理,每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理。

2)?H.263視頻編碼標(biāo)準(zhǔn)

H.263是在H.261基礎(chǔ)上發(fā)展起來的,它是ITU-T為低于64kb/s的窄帶通信信道制定的視頻編碼標(biāo)準(zhǔn),其信源編碼算法的核心仍是H.261中的DPCM/DCT混合編碼方法,但做了一些改進(jìn)以提高性能和糾錯(cuò)能力。隨后出現(xiàn)的第二版(H.263+)及H.263++增加了許多選項(xiàng),使其具有更廣泛的適用性。H.263與H.261相比采用了半像素的運(yùn)動(dòng)補(bǔ)償,并增加了4種有效的壓縮編碼模式。

ITU-T在H.263發(fā)布后又修訂發(fā)布了H.263標(biāo)準(zhǔn)的版本2,非正式地命名為H.263+標(biāo)準(zhǔn)。它在保證原H.263標(biāo)準(zhǔn)核心句法和語義不變的基礎(chǔ)上,增加了若干選項(xiàng)以提高壓縮效率或改善某方面的功能。為提高壓縮效率,H.263+采用先進(jìn)的幀內(nèi)編碼模式;增強(qiáng)的PB幀模式改進(jìn)了H.263的不足,增強(qiáng)了幀間預(yù)測(cè)的效果;去塊效應(yīng)濾波器不僅提高了壓縮效率,而且提供重建圖像的主觀質(zhì)量。

H.263++?在H.263+?基礎(chǔ)上增加了3個(gè)選項(xiàng),主要是為了增強(qiáng)碼流在惡劣信道上的抗誤碼性能,同時(shí)為了提高增強(qiáng)編碼效率。這3個(gè)選項(xiàng)為:

選項(xiàng)U——增強(qiáng)型參考幀選擇,它能夠提供增強(qiáng)的編碼效率和信道錯(cuò)誤再生能力(特別是在包丟失的情形下),需要設(shè)計(jì)多緩沖區(qū)用于存儲(chǔ)多參考幀圖像。

選項(xiàng)V——數(shù)據(jù)分片,它能夠提供增強(qiáng)型的抗誤碼能力(特別是在傳輸過程中本地?cái)?shù)據(jù)被破壞的情況下),通過分離視頻碼流中DCT的系數(shù)頭和運(yùn)動(dòng)矢量數(shù)據(jù),采用可逆編碼方式保護(hù)運(yùn)動(dòng)矢量。選項(xiàng)W——在H.263+?的碼流中增加補(bǔ)充信息,保證增強(qiáng)型的反向兼容性,附加信息包括:指示采用的定點(diǎn)IDCT、圖像信息和信息類型、任意的二進(jìn)制數(shù)據(jù)、文本、重復(fù)的圖像頭、交替的場(chǎng)指示、稀疏的參考幀識(shí)別。

3)?H.264視頻編碼標(biāo)準(zhǔn)

H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標(biāo)準(zhǔn)。H.264與先期的視頻壓縮標(biāo)準(zhǔn)相比引入了很多先進(jìn)的技術(shù),包括4?×?4整數(shù)變換、空域內(nèi)的幀內(nèi)預(yù)測(cè)、1/4像素精度的運(yùn)動(dòng)估計(jì)、多參考幀與多種大小塊的幀間預(yù)測(cè)技術(shù)等。新技術(shù)帶來了較高的壓縮比,同時(shí)大大提高了算法的復(fù)雜度。

H.264的主要優(yōu)點(diǎn)不但體現(xiàn)在相同的重建圖像質(zhì)量下,比H.263+減小50%碼率,而且對(duì)信道時(shí)延的適應(yīng)性較強(qiáng),既可工作于低時(shí)延模式以滿足實(shí)時(shí)業(yè)務(wù)(如會(huì)議電視等),又可工作于無時(shí)延限制的場(chǎng)合(如視頻存儲(chǔ)等)。同時(shí)由于采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法,加強(qiáng)對(duì)誤碼和丟包的處理,可以提高網(wǎng)絡(luò)適應(yīng)性及解碼器的差錯(cuò)恢復(fù)能力。

2.JPEG系列標(biāo)準(zhǔn)

JPEG是聯(lián)合圖像專家組(JointPictureExpertGroup,JPEG)的英文縮寫,是國際標(biāo)準(zhǔn)化組織(ISO)和國際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合制定的靜態(tài)圖像的壓縮編碼標(biāo)準(zhǔn)。1986年由國際電報(bào)電話咨詢委員會(huì)和國際標(biāo)準(zhǔn)化組織兩個(gè)國際組織聯(lián)合成立了一個(gè)聯(lián)合專家小組,它是國際上彩色、灰度、靜止圖像的第一個(gè)國際標(biāo)準(zhǔn)。JPEG標(biāo)準(zhǔn)是一個(gè)適用范圍廣泛的通用標(biāo)準(zhǔn)。它不僅適用于靜態(tài)圖像的壓縮,而且電視圖像序列的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮標(biāo)準(zhǔn),1992年該標(biāo)準(zhǔn)正式成為國際標(biāo)準(zhǔn)。

JPEG標(biāo)準(zhǔn)的應(yīng)用目標(biāo)是為了給出一個(gè)適用于連續(xù)色調(diào)圖像的壓縮方法,使之滿足以下要求:

①壓縮比及圖像保真度可在較大的范圍內(nèi)調(diào)節(jié),供用戶選擇。

②可應(yīng)用于任何連續(xù)色調(diào)數(shù)字圖像,不限制圖像的內(nèi)容,即圖像的長寬比、景物內(nèi)容、圖像的復(fù)雜程度等。

③計(jì)算的復(fù)雜性是可控制的,其軟件可在各種CPU上完成,算法也可用硬件實(shí)現(xiàn)。

④?JPEG算法具有順序編碼、累進(jìn)編碼、無失真編碼和分層編碼等4種操作方式。

JPEG2000是新一代靜止圖像壓縮標(biāo)準(zhǔn),由聯(lián)合圖像專家組(JPEG)于2000年出臺(tái)。JPEG2000中主要采用了離散小波變換(DWT)與嵌入式可截?cái)鄡?yōu)化塊編碼(EBCOT)兩大核心技術(shù),與JPEG標(biāo)準(zhǔn)相比,它具有很多優(yōu)點(diǎn)。首先具有明顯高于JPEG的壓縮比,在低比特率時(shí)能獲得更好的視覺效果。另外,JPEG2000標(biāo)準(zhǔn)中新加入了對(duì)感興趣區(qū)域(ROI)的支持,也就是說它可以將使用者對(duì)于圖片中更關(guān)心或者更感興趣的某一區(qū)域以更高的比特率壓縮,從而強(qiáng)調(diào)更具價(jià)值的那部分圖像信息。

3.MPEG系列標(biāo)準(zhǔn)

MPEG是MovingPictureExpertsGroup的縮寫,即“活動(dòng)圖像專家組”,它是由ISO和IEC(國際電工委員會(huì))聯(lián)合組成的活動(dòng)圖像專家組織,所制定的標(biāo)準(zhǔn)是國際通用的標(biāo)準(zhǔn)。MPEG標(biāo)準(zhǔn)主要面向視頻信息的存儲(chǔ)和廣播,由視頻、音頻和系統(tǒng)3部分組成。針對(duì)不同的圖像質(zhì)量要求,MPEG標(biāo)準(zhǔn)還分為初級(jí)標(biāo)準(zhǔn)MPEG-1、通用標(biāo)準(zhǔn)MPEG-2、高壓縮率標(biāo)準(zhǔn)MPEG-4、多媒體描述接口標(biāo)準(zhǔn)MPEG-7和多媒體框架MPEG-21等。

MPEG-1標(biāo)準(zhǔn)是專為傳輸碼率在1.5Mb/s以下的數(shù)字記錄媒體制定的,如VCD、DAT、CD-ROM等。MPEG-2是MPEG-1的升級(jí)版本,是按照廣播電視圖像質(zhì)量的要求制定的,其傳輸碼率是MPEG-1的4倍,支持的帶寬范圍從2Mb/s到超過20Mb/s,它不僅適應(yīng)于廣播電視,也適應(yīng)于通信和數(shù)字存儲(chǔ)媒體等領(lǐng)域,而且還與MPEG-1標(biāo)準(zhǔn)有正向互換性。目前,MPEG-2標(biāo)準(zhǔn)在數(shù)字電視和DVD領(lǐng)域得到廣泛應(yīng)用。最新的MPEG-4是下一代全球多媒體標(biāo)準(zhǔn)。MPEG-4的傳輸速率在4800~6400b/s之間,分辨率為176?×?144,可以利用很窄的帶寬通過幀重建技術(shù)壓縮和傳輸數(shù)據(jù),從而能以最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。與MPEG-1和MPEG-2相比,MPEG-4更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控。它將在數(shù)字電視、動(dòng)態(tài)圖像、互聯(lián)網(wǎng)、實(shí)時(shí)多媒體監(jiān)控、移動(dòng)多媒體通信、Internet/Intranet上的視頻流與可視游戲、DVD上的交互多媒體應(yīng)用等方面獲得廣泛的應(yīng)用。

MPEG-7標(biāo)準(zhǔn)的正式名稱叫“多媒體描述接口”,并于2001年11月發(fā)布,是為了解決多媒體內(nèi)容的檢索問題。通過這個(gè)標(biāo)準(zhǔn),MPEG希望對(duì)以各種形式存儲(chǔ)的多媒體結(jié)構(gòu)有一個(gè)合理的描述,通過這個(gè)描述,用戶可以方便地根據(jù)內(nèi)容訪問多媒體信息。在MPEG-7體系下,用戶可以更加自由地訪問媒體。MPEG-7的目的在于提供一個(gè)標(biāo)準(zhǔn)化的核心技術(shù),以便描述多媒體環(huán)境下的視頻和音頻內(nèi)容,最終使視頻和音頻搜集像文本搜集一樣簡(jiǎn)單方便。MPEG-7的多媒體內(nèi)容描述功能對(duì)MPEG-1、MPEG-2、MPEG-4起到性能提高和功能擴(kuò)展的作用。

MPEG-21標(biāo)準(zhǔn)的正式名稱為“多媒體框架”,是一個(gè)支持通過異構(gòu)網(wǎng)絡(luò)和設(shè)備,使用戶透明方便地使用多媒體資源的標(biāo)準(zhǔn),其目的是建立一個(gè)交互的多媒體對(duì)象,實(shí)現(xiàn)多種業(yè)務(wù)模型,包括對(duì)版權(quán)和交易的自動(dòng)管理,對(duì)內(nèi)容使用者隱私的尊重等。MPEG-21提供了一種以高效、透明和可互操作的方式,在用戶間實(shí)現(xiàn)交換、接入、消費(fèi)、貿(mào)易和控制DI(theDigitalItem)的解決方案。

1.5視頻數(shù)據(jù)壓縮技術(shù)

1.5.1視頻數(shù)據(jù)的壓縮原理

1.圖像(視頻)信號(hào)壓縮的可能性

在通信與數(shù)字電視系統(tǒng)中,由于活動(dòng)圖像信號(hào)的數(shù)據(jù)量較大,在信號(hào)傳輸過程中占有的帶寬較寬,因此必須進(jìn)行壓縮處理。圖像信號(hào)之所以能夠進(jìn)行壓縮處理,主要基于以下幾個(gè)方面的原因。

1)圖像信號(hào)中存在冗余度

圖像信號(hào)中的冗余度主要存在于圖像信號(hào)的結(jié)構(gòu)和統(tǒng)計(jì)兩個(gè)方面。在電視圖像信號(hào)的結(jié)構(gòu)中,其在空間和時(shí)間上有很強(qiáng)的相關(guān)性,或者說,其幀內(nèi)與幀間存在很強(qiáng)的相關(guān)性,信號(hào)中的冗余度很大,可以對(duì)其進(jìn)行壓縮處理,而在解碼后這些冗余度還可以進(jìn)行不失真的恢復(fù)。

2)利用人眼的視覺特性

對(duì)于圖像信號(hào),可以利用人眼的視覺特性對(duì)圖像數(shù)據(jù)進(jìn)行壓縮,即在不被主觀感覺察覺的容限范圍內(nèi),盡量減少表示信號(hào)的精度,甚至忽略某些信息。例如,可以按照?qǐng)D像信號(hào)各部分的特點(diǎn)決定對(duì)它的采樣頻率和量化等級(jí),盡量做到在主觀視覺的容限之內(nèi)降低圖像信號(hào)的傳輸速率。

除此之外,也可以利用人眼對(duì)圖像信號(hào)中亮度信號(hào)敏感,而對(duì)色度信號(hào)不敏感的不同感覺,對(duì)圖像信號(hào)進(jìn)行壓縮處理。

3)有規(guī)律的重復(fù)信號(hào)可壓縮

視頻信號(hào)中的行、場(chǎng)同步,行、場(chǎng)消隱等周期重復(fù)信號(hào)占有相當(dāng)?shù)谋戎?,圖像信號(hào)僅存在于場(chǎng)掃描過程中每行掃描的正程期間。因此,可以對(duì)這類有規(guī)律的、重復(fù)的、固定不變的信號(hào)在編碼時(shí)按照某種方法進(jìn)行壓縮處理。

2.MPEG標(biāo)準(zhǔn)的圖像格式與參數(shù)

1)圖像的分割

通常,把一幅完整的圖像稱為一幀,每幀PAL制式和NTSC制式的電視信號(hào)分別由625行和525行組成,對(duì)應(yīng)的幀頻分別為25Hz和30Hz。為對(duì)圖像進(jìn)行數(shù)字化處理,必須首先對(duì)每幀圖像進(jìn)行分割,即將一幀圖像橫向切成若干條(PAL制式18條,NTSC制式15條),每一條稱為一片(slice);然后,再將每一片縱向切成22塊(PAL制式和NTSC制式),稱之為宏塊或大塊(macroblock)。這樣,在625行制中,每幀圖像分成8?×?22?

=?396個(gè)宏塊;在525行制中,每幀分成15?×?22?=?330個(gè)宏塊。在MPEG標(biāo)準(zhǔn)中,宏塊是對(duì)圖像處理的基本單元。在每個(gè)宏塊中的彩色圖像,又可以用一個(gè)亮度Y和兩個(gè)色差信號(hào)(CR、CB)來表示。根據(jù)大面積著色原理,在圖像的傳送過程中,亮度信號(hào)的清晰度遠(yuǎn)高于對(duì)色差信號(hào)的清晰度,因此,通常又把亮度宏塊平均分成4小塊。最后再將2個(gè)色差塊和4個(gè)亮度小塊(共6個(gè)塊)分成64個(gè)(8?×?8?=?64)像素小塊,每個(gè)像素對(duì)應(yīng)一個(gè)采樣點(diǎn),而一個(gè)宏塊中的色差信號(hào)采樣點(diǎn)與每一個(gè)小塊亮度信號(hào)的采樣點(diǎn)相同。像素是構(gòu)成圖像的最小單元,圖像的清晰度主要取決于像素的多少,像素越多,圖像分得越細(xì),清晰度就越高,反之越低。圖1-4是MPEG標(biāo)準(zhǔn)的圖像分割示意圖。在對(duì)圖像進(jìn)行數(shù)字處理時(shí),每個(gè)像素用8位二進(jìn)制數(shù)表示,這樣每個(gè)采樣點(diǎn)的亮度信號(hào)便可獲得28?=?256個(gè)等級(jí),具有足夠高的精度。但在量化過程中,也同樣會(huì)產(chǎn)生量化噪聲。對(duì)單極性的視頻信號(hào),其信噪比(S/N)可用公式(1-2)來表示。圖1-4圖像分割示意圖

2)圖像格式的基本參數(shù)

(1)視頻信號(hào)數(shù)據(jù)傳輸?shù)拇a率。

在視頻信號(hào)的數(shù)字化中,DVD采用4∶2∶2標(biāo)準(zhǔn),VCD采用2∶1∶1標(biāo)準(zhǔn)。前者的采樣頻率為

Y∶CR∶CB=13.5MHz∶6.75MHz∶6.75MHz

后者的采樣頻率為

Y∶CR∶CB=6.75MHz∶3.375MHz∶3.375MHz在4∶2∶2標(biāo)準(zhǔn)中,為使視頻信號(hào)有6MHz的帶寬,即約有500線的清晰度,相應(yīng)像素的規(guī)定為:625/50制時(shí)每行是864個(gè),525/60制時(shí)每行是858個(gè)。在數(shù)字電視中,為使625/50制和525/60制相兼容,國際標(biāo)準(zhǔn)定義了有效行,并規(guī)定有效行的亮度信號(hào)的像素都為720個(gè)。有效行是指亮度信號(hào)中的圖像信號(hào)部分有了圖像信號(hào),消隱信號(hào)和同步信號(hào)可以在后期編排上去。對(duì)每一幀圖像,625/50制的有效行為576行,525/60制的有效行為480行。這樣,對(duì)每一幀的亮度像素?cái)?shù),625/50制的為576?×?720,525制的為480×720,再加上兩個(gè)色差信號(hào)的像素(625/50制的為288?×?360?×?2,525/60制的為240?×?360

?×?2)。于是可得每秒鐘要傳輸?shù)南袼財(cái)?shù)為

(576?×?720?+?288?×?360?×?2)?×?25?=?15.552?×?106

(480?×?720?+?240?×?360?×?2)?×?30?=?15.552?×?106

由于每個(gè)像素用8位二進(jìn)制數(shù)表示,所以傳輸圖像數(shù)據(jù)的碼率為

碼率?=?像素傳輸速率?×?8位/像素

=?15.552?×?106像素/s?×?8位/像素

=?124.416Mb/s在2∶1∶1標(biāo)準(zhǔn)中,MPEG-1標(biāo)準(zhǔn)采用折半的方法,即按照廣播級(jí)標(biāo)準(zhǔn),將每一幀的有效行數(shù)和有效行的像素?cái)?shù)都取一半。通過同樣的分析可得到傳輸數(shù)據(jù)的碼率為

碼率?=?像素傳輸速率?×?8位/像素

=?(288?×?352?+?144?×?176?×?2)?×?25?×?8

=?30.41286Mb/s

(2)?MPEG視頻標(biāo)準(zhǔn)的圖像格式。

根據(jù)上述分析,MPEG-2與MPEG-1的圖像格式參數(shù)如表

1-2所示。

3)?3種幀

在MPEG視頻標(biāo)準(zhǔn)中,圖像壓縮基于圖像中的兩種特性:空間相關(guān)性和時(shí)間相關(guān)性。這兩種相關(guān)性使得圖像中存在大量的冗余信息。如果能將這些冗余信息去除,只保留少量非相關(guān)信息進(jìn)行傳輸,就可以大大節(jié)省傳輸頻帶。而接收機(jī)利用這些非相關(guān)信息,按照一定的解碼算法,可以在保證一定的圖像質(zhì)量的前提下恢復(fù)原始圖像。

按照MPEG標(biāo)準(zhǔn),活動(dòng)圖像的畫面可分為3種類型,分別稱為幀內(nèi)編碼幀(IntraCodedFrame,即I幀)、前向預(yù)測(cè)幀(PredictiveCodedFrame,即P幀)和雙向預(yù)測(cè)幀(BidirectionallyPredictiveCodedFrame,即B幀)。

I幀圖像采用幀內(nèi)編碼方式,即只利用單幀圖像內(nèi)的空間相關(guān)性,而沒有利用時(shí)間相關(guān)性。I幀使用幀內(nèi)壓縮,不使用運(yùn)動(dòng)補(bǔ)償,它以靜止圖像壓縮的方法(DCT編碼等)進(jìn)行處理。I幀與其前后相鄰的圖像之間具有獨(dú)立性,其壓縮信號(hào)不但全部記錄在光盤上,而且還是產(chǎn)生其他兩種幀圖像的基礎(chǔ)。I幀主要用于接收機(jī)的初始化和信道的獲取,以及節(jié)目的切換和插入,I幀圖像的壓縮倍數(shù)在3種幀中最小,數(shù)據(jù)量則是3種幀中最大的。I幀圖像是周期性出現(xiàn)在圖像序列中的,出現(xiàn)頻率可由編碼器選擇。

P幀圖像采用幀間編碼方式,即同時(shí)利用了空間和時(shí)間上的相關(guān)性。P幀圖像只采用前向時(shí)間預(yù)測(cè),只傳送與它前面I幀的差值信息(又稱預(yù)測(cè)差圖像),該差值信息可看成是運(yùn)動(dòng)圖像的變化部分,其數(shù)據(jù)量要比I幀少得多。如果P幀前面不是I幀而是P幀,同樣也可以由它前面的P幀獲得預(yù)測(cè)誤差而形成新的P幀信號(hào)。P幀的獲得如圖1-5(a)所示。

B幀圖像采用雙向時(shí)間預(yù)測(cè),它是根據(jù)其前面的I幀(或P幀)與后面的P幀來獲得預(yù)測(cè)誤差的。由于B幀傳送它前面的I幀(或P幀)與后面的P幀之間的預(yù)測(cè)誤差,因此可以大大提高壓縮倍數(shù)。B幀的信息量一般要比P幀少,其壓縮率在3種幀中是最大的。值得注意的是,由于B幀圖像采用了未來幀作為參考,因此MPEG-2編碼碼流中圖像幀的傳輸順序和顯示順序是不同的。在I幀和P幀或P幀與P幀之間一般可以插入兩個(gè)B幀,B幀的獲得如圖1-5(b)所示。圖1-5預(yù)測(cè)幀的獲得示意圖順便指出,每幀圖像輸入的順序是按照時(shí)間出現(xiàn)的順序即IBPBP或IBBPBP排列的。為了便于從I幀和P幀獲得B幀,以及解碼時(shí)便于從I、P幀插補(bǔ)到B幀,在編碼時(shí)首先應(yīng)對(duì)輸入圖像的幀進(jìn)行重排,使其順序變?yōu)镮PBPB或IPBBPB。

4)圖像數(shù)據(jù)的比特流分層格式

MPEG-1和MPEG-2的視頻結(jié)構(gòu)是相同的。為更好地表示編碼數(shù)據(jù),MPEG用句法對(duì)視頻數(shù)據(jù)規(guī)定了層次結(jié)構(gòu),共分為6個(gè)層次,自上到下分別是:圖像序列層、圖像組層(GOP)、圖像層、像條層(片層或宏塊條)、宏塊層和像塊層。

各層之間的關(guān)系如圖1-6所示。圖1-6圖像數(shù)據(jù)的層次第一層是像塊層,由8像素?×?8行的一組亮度成分或相應(yīng)的色差成分構(gòu)成,在編碼中它是DCT處理的基本單元。注意,亮度像塊顯示的圖像相當(dāng)于色度像塊形式圖像的1/4大小。

第二層是宏塊層,由16?×?16像素的亮度成分和對(duì)應(yīng)的兩個(gè)色度分量的8?×?8像素的成分構(gòu)成。一個(gè)宏塊有4個(gè)亮度像塊和2個(gè)色差像塊(CR、CB),這是進(jìn)行運(yùn)動(dòng)預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償?shù)膯卧?。在MPEG-1中圖像的色度格式是4∶2∶0,而在MPEG-2中圖像的色度格式還包括4∶2∶2和4∶4∶4格式,因此,一個(gè)宏塊又由許多8?×?8的塊組成。

3種格式的宏塊結(jié)構(gòu)如圖1-7所示,其中的4∶2∶0格式由6個(gè)塊組成,包括4個(gè)亮度塊和兩個(gè)色度塊;4∶2∶2格式由8個(gè)塊組成,包括4個(gè)亮度塊、兩個(gè)CB塊和兩個(gè)CR塊;4∶4∶4格式由12個(gè)塊組成,包括4個(gè)亮度塊、4個(gè)CB塊和4個(gè)CR塊。圖1-73種格式的宏塊結(jié)構(gòu)第三層是像條層,它是在一幀圖像中從左到右分割下來的完整的一條圖像,也是若干個(gè)宏塊的集合。在信號(hào)處理中,片是同步恢復(fù)單元。

第四層是圖像層(幀),它是由若干個(gè)片組成的一幅完整的圖像。這種圖像可以是幀內(nèi)編碼圖像(I圖像),也可以是預(yù)測(cè)編碼圖像(P圖像)。圖像層是構(gòu)成活動(dòng)圖像的基本單位,在信號(hào)處理中,它是基本的編碼單元。第五層是圖像組(幀組)層,它由幾幅編碼的圖像組成(PAL制為5幅,NTSC制為6幅),每個(gè)圖像組是視頻隨機(jī)存儲(chǔ)單元。

第六層是圖像序列層,它體現(xiàn)了連續(xù)圖像的比特流。用一個(gè)序列頭開始,包含一個(gè)或多個(gè)幀組,以一個(gè)序列尾碼結(jié)束。序列層是節(jié)目?jī)?nèi)容的隨機(jī)存儲(chǔ)單元。1.5.2MPEG視頻編/解碼原理

1.MPEG視頻編碼原理

MPEG算法既具有很高的壓縮比,又可以保持很好的圖像質(zhì)量,這單靠幀內(nèi)編碼是不能完全實(shí)現(xiàn)的。在MPEG壓縮編碼中,主要是通過DCT變換和運(yùn)動(dòng)預(yù)測(cè)技術(shù)來壓縮空間冗余和時(shí)間冗余的,即首先通過運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償去除圖像序列間的時(shí)間冗余,然后再通過DCT變換將差值信號(hào)的空間冗余去除,使系數(shù)能量集中在低頻部分,最后通過量化和可變字長編碼最終達(dá)到壓縮編碼的目的。

MPEG視頻編碼器的組成框圖如圖1-8所示,它主要由幀畫面的重新排列、運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)器、運(yùn)動(dòng)估計(jì)器、離散余弦變換器(DCT)、離散余弦反變換器(DCT-1)、量化自適應(yīng)器(Q)和逆量化器(Q-1)、幀存儲(chǔ)器、視頻緩存器等組成。這一框圖對(duì)MPEG-1與MPEG-2均適用。其主要區(qū)別在于MPEG-2采用了自適應(yīng)場(chǎng)/幀處理技術(shù),通過對(duì)物體運(yùn)動(dòng)特性和圖像細(xì)節(jié)的豐富程度做出判定來選擇場(chǎng)處理或幀處理,因此只需將MPEG-1視頻編碼器框圖中的“自適應(yīng)量化器”和“編碼統(tǒng)計(jì)處理”部分改為“編碼控制”即可。因?yàn)镻幀是由I幀獲得的,而B幀又是根據(jù)I幀(或P幀)和P幀獲得的,因此,在編碼時(shí)首先要對(duì)輸入的幀進(jìn)行重排,即把P幀排在B幀前面。例如,若幀重排前的順序是IBBPBP,則重排后的順序?yàn)镮PBBPB,這就是在編碼器內(nèi)幀的編碼順序。

運(yùn)動(dòng)補(bǔ)償是一種把現(xiàn)在的圖像部分看成是由前面的圖像及變動(dòng)的差值部分構(gòu)成的預(yù)測(cè)技術(shù),它是利用消去時(shí)間冗余度的部分來提高壓縮比的技術(shù)。運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)算法在宏塊級(jí)中分別進(jìn)行幀內(nèi)預(yù)測(cè)、前向預(yù)測(cè)、后向預(yù)測(cè)和平均預(yù)測(cè),與幀內(nèi)編碼相比,運(yùn)動(dòng)補(bǔ)償可改善壓縮比大約3倍。圖1-8視頻編碼器組成框圖具體的編碼過程如下所述。

1)?I幀編碼

當(dāng)輸入I幀時(shí),開關(guān)S1、S2、S4分別置于上方的位置,S3置于左側(cè),編碼器對(duì)I幀進(jìn)行編碼。具體編碼時(shí),首先進(jìn)行幀改組,即把圖像橫向切割成許多條(片),每片寬度為16個(gè)像素,再將第一條縱向切為每16個(gè)像素長的各個(gè)小段,這樣就得到16?×?16的像素構(gòu)成的塊,稱為宏塊。宏塊可以分成4部分,每一部分為8?×?8?=?64像素的區(qū)塊。對(duì)各宏塊進(jìn)行DCT變換后,空域中64個(gè)像素的亮度或色度數(shù)值就變換成頻域中的64個(gè)頻率系數(shù),其中高頻系數(shù)反映的是圖像細(xì)節(jié),直流成分代表圖像的平均亮度。變換后的頻率系數(shù)送量化自適應(yīng)器,并參

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論