《數(shù)字視聽技術(shù)》課件第1章

上傳人：1*** IP屬地：廣東上傳時(shí)間：2024-09-01 格式：PPT 頁數(shù)：232 大小：925.50KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩227頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.1數(shù)字視聽技術(shù)概述1.2信號(hào)的數(shù)字化1.3信號(hào)的調(diào)制與糾錯(cuò)1.4數(shù)據(jù)壓縮技術(shù)的標(biāo)準(zhǔn)1.5視頻數(shù)據(jù)壓縮技術(shù)1.6音頻數(shù)據(jù)壓縮技術(shù)技能訓(xùn)練項(xiàng)目1激光視盤機(jī)符號(hào)識(shí)別技能訓(xùn)練項(xiàng)目2激光視盤機(jī)與外圍設(shè)備的連接技能訓(xùn)練項(xiàng)目3激光視盤機(jī)的操作技能訓(xùn)練項(xiàng)目4激光視盤機(jī)的整機(jī)檢驗(yàn)本章小結(jié)思考題第1章數(shù)字視聽技術(shù)基礎(chǔ)

1.1數(shù)字視聽技術(shù)概述

數(shù)字視聽技術(shù)是指應(yīng)用數(shù)字編碼方式來描述和表達(dá)圖像、聲音等各種媒體信息，進(jìn)行存儲(chǔ)后借助于數(shù)字信號(hào)處理技術(shù)進(jìn)行處理，并通過音、視頻重放設(shè)備再現(xiàn)聲音和圖像信息的一門新興技術(shù)。視聽技術(shù)經(jīng)歷了一個(gè)從模擬到數(shù)字的發(fā)展過程，早期的錄音機(jī)、錄像機(jī)和電視機(jī)視聽產(chǎn)品，均為模擬式產(chǎn)品，從音、視頻信號(hào)的獲取、處理、存儲(chǔ)到輸出均采用模擬技術(shù)。隨著數(shù)字技術(shù)的發(fā)展，CD機(jī)、DVD機(jī)、數(shù)字?jǐn)z錄機(jī)、數(shù)字電視機(jī)等數(shù)字視聽產(chǎn)品已得到廣泛應(yīng)用。1.1.1數(shù)字視聽技術(shù)的發(fā)展

數(shù)字視聽技術(shù)的出現(xiàn)，把人們帶入了一個(gè)圖像更清晰、聲音更逼真的領(lǐng)域。現(xiàn)代科技的飛速發(fā)展，使得視聽產(chǎn)品升級(jí)換代日新月異。數(shù)字視聽技術(shù)借助激光技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)、計(jì)算機(jī)技術(shù)及存儲(chǔ)技術(shù)的發(fā)展，其產(chǎn)品得到了長足的發(fā)展，使消費(fèi)者充分享受到數(shù)字視聽?zhēng)淼臉啡ぁD1-1表示數(shù)字視聽技術(shù)在不同技術(shù)應(yīng)用領(lǐng)域的主要產(chǎn)品類型。圖1-1數(shù)字視聽產(chǎn)品的應(yīng)用

1.激光視聽技術(shù)

激光英文名是Laser，即Lightamplificationbythestimulatedemissionofradiation的縮寫。激光技術(shù)應(yīng)用在數(shù)字視聽領(lǐng)域是基于其一個(gè)最重要的特點(diǎn)，即激光可以聚焦成能量高度集中的極小光點(diǎn)，這樣就可以在一張直徑僅為數(shù)厘米的光盤上以極高的密度記錄下經(jīng)壓縮編碼處理的數(shù)字音、視頻信息，并且讀取信號(hào)的激光頭與光盤沒有任何接觸，不會(huì)造成光盤磨損，有利于長久保存節(jié)目源。20世紀(jì)70年代后期，荷蘭飛利浦公司成功開發(fā)出光盤制造技術(shù)，日本索尼公司在系統(tǒng)軟件方面也取得了較大突破，完善了數(shù)字音頻信號(hào)的編碼、解碼和糾錯(cuò)的系統(tǒng)軟件，解決了機(jī)械振動(dòng)、灰塵污染、碟面劃傷、制造缺陷等對(duì)光盤記錄和播放的影響，為激光視盤機(jī)大規(guī)模商業(yè)生產(chǎn)打下了一定基礎(chǔ)。

1980年，飛利浦、索尼、寶麗金等35個(gè)世界制造商就視盤機(jī)的信號(hào)記錄格式和光盤制造材料等技術(shù)規(guī)格達(dá)成了協(xié)議，形成了CD光盤國際標(biāo)準(zhǔn)。1982年飛利浦和索尼公司聯(lián)合開發(fā)制造了商用數(shù)字視盤機(jī)，即CD-DA，簡(jiǎn)稱CD機(jī)，主要用于記錄音樂節(jié)目。為滿足不同的需求，在CD機(jī)的基礎(chǔ)上不斷開發(fā)出新的品種，形成了CD系列產(chǎn)品。主要有CD-G、CD-ROM、CD-I、CD-R等，這一階段的產(chǎn)品采用的都是MPEG-1音、視頻編碼標(biāo)準(zhǔn)。

DVD光盤是DigitalVideoDisc(數(shù)字視頻光盤)的簡(jiǎn)稱，后來則稱為“DigitalVersatileDisc”，即“數(shù)字通用光盤”，它是在VCD視盤機(jī)基礎(chǔ)上發(fā)展起來的，將圖像和伴音信號(hào)記錄在CD大小的光盤上，使用了比CD激光頭波長更短的激光管，其信號(hào)記錄密度也大大高于CD盤片，其整機(jī)性能得到了很大的提高。

在畫面上，DVD采用MPEG-2解壓縮標(biāo)準(zhǔn)。比以往的VHS錄像和MPEG-1標(biāo)準(zhǔn)要清晰得多，VHS和MPEG-1壓縮標(biāo)準(zhǔn)的解析度最多達(dá)到240線，而MPEG-2解壓縮標(biāo)準(zhǔn)能達(dá)到500線以上，可與電影播放質(zhì)量相媲美。在音效上，DVD光盤可以提供杜比數(shù)碼環(huán)繞立體聲效果，就是DolbyAC-3-5.1聲道效果。DolbyAC-3-5.1是一種全數(shù)字化的音頻編碼技術(shù)。它提供6個(gè)完全獨(dú)立的聲道，即兩個(gè)全頻帶主聲道、兩個(gè)全頻帶環(huán)繞聲道、一個(gè)全頻帶中置聲道和一個(gè)1/10頻帶的重低音聲道。通過這6個(gè)聲道，使觀眾明顯感覺到電影院那種身臨其境的立體效果。近年來，DVD視盤機(jī)又有了新的發(fā)展，逐行DVD、高清DVD、藍(lán)光DVD等出現(xiàn)在人們的視野。2002年，由13家國際知名廠商聯(lián)合宣布成立藍(lán)光光盤組織(Blue-rayDiscFounders)，宣布支持采用藍(lán)色激光DVD存儲(chǔ)技術(shù)制定出新的高密度DVD標(biāo)準(zhǔn)——Blue-rayDisc(BD)。現(xiàn)在所說的“藍(lán)光”、“藍(lán)光碟片”指的是Blue-ray和HDDVD的泛稱，因?yàn)閮烧叨际鞘褂盟{(lán)光波長的激光。Blue-ray是專指Sony和Phillips合作研發(fā)出的規(guī)格。HDDVD是東芝所說的HDDVD技術(shù)。Bluedisc和HDDVD都是基于藍(lán)色波段的激光頭，因此都可以稱為藍(lán)光，藍(lán)光是對(duì)下一代光盤載體的統(tǒng)稱。從技術(shù)層次看，雖然現(xiàn)在的DVD在存儲(chǔ)的密度及讀寫速度方面較之CD已經(jīng)有了長足的進(jìn)步，但DVD仍舊采用的是紅色激光波段進(jìn)行數(shù)據(jù)的讀取和刻寫，使得在光存儲(chǔ)的密度以及讀寫速度方面的提升受到了限制。而新一代的藍(lán)光DVD技術(shù)采用全新的藍(lán)色激光波段進(jìn)行工作，光盤存儲(chǔ)容量在原來的DVD的基礎(chǔ)上擴(kuò)大了將近5倍，使得存儲(chǔ)的容量有了很大的突破。

2.網(wǎng)絡(luò)視聽技術(shù)

近年來，隨著通信技術(shù)綜合化、數(shù)字化、智能化和個(gè)性化的發(fā)展，以及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的日益成熟，在網(wǎng)絡(luò)平臺(tái)上實(shí)現(xiàn)語音、數(shù)據(jù)和圖像傳輸?shù)榷喾N業(yè)務(wù)已經(jīng)成為通信行業(yè)發(fā)展的目標(biāo)和必然趨勢(shì)。數(shù)字視聽技術(shù)在電話網(wǎng)(包括固定和移動(dòng)電話網(wǎng))、廣電網(wǎng)、計(jì)算機(jī)網(wǎng)上的應(yīng)用取得了迅猛發(fā)展，得到了廣泛應(yīng)用，如視頻點(diǎn)播、在線影院、遠(yuǎn)程醫(yī)療、遠(yuǎn)程教育、交互式電視等，滿足各個(gè)行業(yè)網(wǎng)絡(luò)化發(fā)展的需要。隨著計(jì)算機(jī)性能和網(wǎng)絡(luò)通信技術(shù)的發(fā)展，人們開始借助于網(wǎng)絡(luò)瀏覽信息、交換數(shù)據(jù)和商業(yè)交易。而圖像、視頻等多媒體業(yè)務(wù)已逐漸成為信息處理領(lǐng)域中主要的信息媒體形式。因此下一代網(wǎng)絡(luò)(NGN)將語音、數(shù)據(jù)、視頻等多種業(yè)務(wù)集于一體，它是一個(gè)建立在IP技術(shù)基礎(chǔ)上的新型公共電信網(wǎng)絡(luò)。目前，下一代網(wǎng)絡(luò)還沒有完全投入運(yùn)行，所以互聯(lián)網(wǎng)就成為音、視頻傳輸?shù)闹匾侄巍?/p>

在網(wǎng)絡(luò)上以數(shù)據(jù)流的方式實(shí)時(shí)發(fā)布音頻、視頻多媒體內(nèi)容的媒體技術(shù)叫流媒體技術(shù)，流媒體的技術(shù)應(yīng)用主要表現(xiàn)在如下幾個(gè)方面。

1)視頻點(diǎn)播

隨著計(jì)算機(jī)技術(shù)的發(fā)展，流媒體技術(shù)越來越廣泛地應(yīng)用于視頻點(diǎn)播(VOD)系統(tǒng)。VOD系統(tǒng)是指在用戶需要時(shí)隨時(shí)提供交互式的視頻服務(wù)業(yè)務(wù)。目前VOD技術(shù)逐漸趨于完善，并廣泛應(yīng)用于局域網(wǎng)及有線電視網(wǎng)。它能對(duì)單個(gè)用戶提供大量的影片、視頻節(jié)目、游戲、信息以及其他服務(wù)，其區(qū)別于傳統(tǒng)視頻節(jié)目接收方式的交互性表現(xiàn)在主動(dòng)性和選擇性強(qiáng)，用戶對(duì)通過網(wǎng)絡(luò)傳送來的節(jié)目擁有播放控制能力。流媒體的視頻直播應(yīng)用突破了網(wǎng)絡(luò)帶寬的限制，實(shí)現(xiàn)了在低帶寬環(huán)境下的高質(zhì)量影音傳輸，其中的智能流技術(shù)保證不同連接速率下的用戶可以得到不同質(zhì)量的影音效果。但音、視頻文件的大容量仍然阻礙了VOD技術(shù)的進(jìn)一步發(fā)展。由于服務(wù)器端不僅需要大容量的存儲(chǔ)系統(tǒng)，同時(shí)還要承擔(dān)大量數(shù)據(jù)的傳輸，因而服務(wù)器根本無法支持大規(guī)模的點(diǎn)播。同時(shí)，由于局域網(wǎng)中的視頻點(diǎn)播覆蓋范圍小，用戶也無法通過Internet等網(wǎng)絡(luò)媒介收聽或觀看局域網(wǎng)中的節(jié)目。

2)視頻會(huì)議

市場(chǎng)上采用流媒體技術(shù)作為核心技術(shù)的視頻會(huì)議系統(tǒng)并不占多數(shù)。視頻會(huì)議是流媒體技術(shù)的一個(gè)商業(yè)用途，采用流媒體格式傳送音、視頻文件，使用者不必等待整個(gè)影片傳送完畢就可以實(shí)時(shí)、連續(xù)地觀看，雖然在畫面質(zhì)量上有一些損失，但就一般的視頻會(huì)議來講，并不需要很高的圖像質(zhì)量。當(dāng)然，流媒體技術(shù)并不是視頻會(huì)議的必需選擇，但對(duì)視頻會(huì)議的發(fā)展起了重要的推動(dòng)作用。

通過流媒體進(jìn)行點(diǎn)對(duì)點(diǎn)的通信，最常見的就是可視電話。只要兩端都有一臺(tái)接入Internet的電腦和一個(gè)攝像頭，在世界任何地點(diǎn)都可以進(jìn)行音、視頻通信。此外，大型企業(yè)可以利用基于流媒體的視頻會(huì)議系統(tǒng)來組織跨地區(qū)的會(huì)議和討論。

3)遠(yuǎn)程教育

電腦的普及、多媒體技術(shù)的發(fā)展以及Internet的迅速崛起，給遠(yuǎn)程教育帶來了新的機(jī)遇。越來越多的遠(yuǎn)程教育網(wǎng)站開始采用流媒體作為主要的網(wǎng)絡(luò)教學(xué)方式。在遠(yuǎn)程教學(xué)過程中，最基本的要求就是將信息從教師端傳到遠(yuǎn)程的學(xué)生端，需要傳送的信息可能是多元的，如視頻、音頻、文本、圖片等。將這些信息從一端傳送到另一端是實(shí)現(xiàn)遠(yuǎn)程教學(xué)需要解決的問題，在當(dāng)前網(wǎng)絡(luò)帶寬的限制下，流媒體傳輸將是最佳選擇。學(xué)生在家通過一臺(tái)計(jì)算機(jī)、一條電話線、一個(gè)調(diào)制解調(diào)器就可以參加遠(yuǎn)程教學(xué)。教師也無需另外做準(zhǔn)備，授課的方法基本與傳統(tǒng)授課方法相同，只不過面對(duì)的是攝像頭和計(jì)算機(jī)而已。使用流媒體的VOD技術(shù)還可以進(jìn)行交互式教學(xué)，達(dá)到因材施教的目的。像RealSystem、Flash、Shockwave等技術(shù)就經(jīng)常應(yīng)用到網(wǎng)絡(luò)教學(xué)中。學(xué)生可以通過網(wǎng)絡(luò)共享學(xué)習(xí)經(jīng)驗(yàn)。大型企業(yè)可以利用基于流媒體技術(shù)的遠(yuǎn)程教育對(duì)員工進(jìn)行培訓(xùn)。

4)?Internet直播

隨著寬帶網(wǎng)的不斷普及和流媒體技術(shù)的不斷發(fā)展。沖浪者能夠在Internet上直接收看體育賽事、商貿(mào)展覽等，廠商可以借助網(wǎng)上直播形式將自己的產(chǎn)品和活動(dòng)傳遍全世界。網(wǎng)絡(luò)帶寬問題的改善促進(jìn)了Internet直播的發(fā)展，Internet直播已經(jīng)從實(shí)驗(yàn)階段走向?qū)嵱?，并能夠提供較滿意的音、視頻效果。流媒體技術(shù)的發(fā)展，實(shí)現(xiàn)了在低帶寬環(huán)境下提供高質(zhì)量的音、視頻信息；保證不同連接速率下的用戶能夠得到不同質(zhì)量的音、視頻效果；減少服務(wù)器端的負(fù)荷，同時(shí)最大限度地節(jié)省帶寬。流媒體在Internet直播中充當(dāng)著重要角色。

5)全數(shù)字視頻網(wǎng)絡(luò)監(jiān)控系統(tǒng)

數(shù)字視頻壓縮技術(shù)已經(jīng)取得較大的進(jìn)展，MPEG-4、H.264等新的視頻壓縮格式使得在保證較高圖像質(zhì)量前提下的視頻碼率有效地減小到不足1Mb/s，甚至在不足100kb/s的帶寬下也能傳輸質(zhì)量很好的CIF幅面的全實(shí)時(shí)圖像。另外，網(wǎng)絡(luò)環(huán)境也取得了前所未有的進(jìn)展，ADSL、HFC等各種網(wǎng)絡(luò)接入方式迅速普及到各種用戶應(yīng)用領(lǐng)域，基于網(wǎng)絡(luò)的電視監(jiān)控系統(tǒng)已成為電視監(jiān)控系統(tǒng)實(shí)現(xiàn)方式的主流模式，無論系統(tǒng)大小，幾乎都以該系統(tǒng)是否有網(wǎng)絡(luò)接口作為評(píng)判系統(tǒng)是否具備了先進(jìn)性的依據(jù)之一。

3.其他新型視聽技術(shù)

1)?MP3與MP4

MP3(MPEG-1Layer3)是當(dāng)今較流行的一種音頻格式，全稱為MPEG(MPEG：MovingPictureExpertsGroup)AudioLayer3。它是基于MPEG-1第三層音頻(正式名稱11172-3)壓縮算法的一種(Layer3)。MP3是一種有損壓縮，它是基于人耳的聽覺特性來提高壓縮率的一種編碼算法。在基本上保持CD音質(zhì)的前提下，MP3的數(shù)據(jù)壓縮比高達(dá)1∶12，一首4分鐘的歌曲約3～5Mb，但音質(zhì)仍然相當(dāng)高。

MP4使用的是MPEG-2AAC技術(shù)，AAC俗稱A2B或高級(jí)音頻編碼(AdvancedAudioCoding)。其中，MPEG-2是MPEG于1994年11月針對(duì)數(shù)碼電視(數(shù)碼影像)提出的。它的特點(diǎn)是音質(zhì)更加完美而壓縮比更大(1∶15)。MPEG-1支持采樣率為32kHz、44.1kHz和48kHz的單聲道及雙聲道編碼，而Layer3預(yù)設(shè)為32～320kb/s。MPEG-2則是對(duì)MPEG-1的向后兼容多聲道擴(kuò)展方案，它增加了一個(gè)“低頻擴(kuò)展”聲道，從而提升至5個(gè)聲道編碼，比特率的變化范圍增至1Mb/s。而MPEG-2AAC在采樣率為8～96kHz下提供了1～48個(gè)聲道可選范圍的高質(zhì)量音頻編碼。

MP4并不是MPEG-4或者M(jìn)PEGAudioLayer4。MPEG-4是一種多媒體應(yīng)用技術(shù)規(guī)范，它提供了交互使用圖像、多媒體的合成技術(shù)，主要體現(xiàn)在范圍極廣的比特率下自然合成音頻的編碼和組合。它是一種開放型的技術(shù)，用一種新規(guī)范包容了所有多媒體應(yīng)用技術(shù)。

2)多媒體計(jì)算機(jī)技術(shù)

多媒體計(jì)算機(jī)技術(shù)(MultimediaComputingTechnology)是指計(jì)算機(jī)綜合處理文本、圖形、圖像、視頻和音頻等多種媒體信息，使多種信息建立邏輯鏈接、集成為一個(gè)系統(tǒng)并具有交互性的技術(shù)。多媒體技術(shù)的基本特征是信息載體多樣性、集成性和交互性。人機(jī)相互交流是多媒體最大的特點(diǎn)，沒有多媒體，對(duì)于電視、電影，你只能在一旁欣賞，而在多媒體上，你可以從圖形到顏色都予以修改，你可以參與其中，改變劇情，叫演員按照你的意思演出。要把一臺(tái)普通的計(jì)算機(jī)變成多媒體計(jì)算機(jī)要解決的關(guān)鍵技術(shù)是：①視頻、音頻信號(hào)獲取技術(shù)；②多媒體數(shù)據(jù)壓縮編碼和解碼技術(shù)；③視頻、音頻數(shù)據(jù)的實(shí)時(shí)處理和特技；④視頻、音頻數(shù)據(jù)的輸出技術(shù)。數(shù)字視聽技術(shù)在PC機(jī)應(yīng)用中主要有4個(gè)發(fā)展階段。第一階段，數(shù)字視頻、音頻只在一些特定的專業(yè)領(lǐng)域應(yīng)用。這主要是從事影視制作的專業(yè)人員利用計(jì)算機(jī)數(shù)字視頻進(jìn)行編輯、特殊效果處理等，這些功能僅是數(shù)字視頻的少部分，基本上代表了用最小的代價(jià)在硬件上完成數(shù)字編輯。第二階段，可以在計(jì)算機(jī)上看到視頻實(shí)時(shí)顯示，需要有外部視頻源。第三階段，數(shù)字音、視頻在專業(yè)領(lǐng)域的廣泛應(yīng)用?？梢圆东@視頻序列，將視頻序列壓縮后存儲(chǔ)起來，隨時(shí)可以再播放。具體實(shí)現(xiàn)有兩種捕獲視頻序列的方法：—種是軟件方法，此法壓縮成本低，但所支持的視頻顯示窗口不能太大；另一種是硬件方法，此方法要比軟件方法的壓縮快得多，所支持的視頻窗口也可以較大，但成本較高。另外，此階段在標(biāo)準(zhǔn)化方面還不成熟，所以盡管存在許多視頻獲取方法，但不能保證獲取的視頻能在其他文件上使用。第四階段，數(shù)字音、視頻技術(shù)的標(biāo)準(zhǔn)化與大眾化。對(duì)數(shù)字視頻如何存成文件進(jìn)行了標(biāo)準(zhǔn)化，AVI(AudioVideoInterleaced)成為標(biāo)準(zhǔn)文件格式，數(shù)字視頻不再是特殊用途的工具了，加上壓縮/解壓技術(shù)運(yùn)用，使數(shù)字視頻文件存儲(chǔ)在PC系統(tǒng)成為可能并能在此基礎(chǔ)上進(jìn)行音、視頻文件的編輯和處理。多媒體技術(shù)使數(shù)字視聽技術(shù)、計(jì)算機(jī)技術(shù)和通信技術(shù)3大信息處理技術(shù)緊密地結(jié)合起來，為信息處理技術(shù)發(fā)展奠定了新的基石。1.1.2數(shù)字視聽設(shè)備的種類與特點(diǎn)

1.數(shù)字視聽設(shè)備的種類

1)激光視聽設(shè)備

激光視聽設(shè)備是采用光盤存儲(chǔ)數(shù)字音、視頻信息，通過激光讀取信息的數(shù)字設(shè)備，主要包括CD機(jī)、VCD機(jī)、DVD機(jī)等，新的產(chǎn)品有HDDVD(高清DVD)和藍(lán)光DVD。

2)網(wǎng)絡(luò)視聽設(shè)備

網(wǎng)絡(luò)視聽設(shè)備是利用通信網(wǎng)絡(luò)進(jìn)行圖像和聲音通信的數(shù)字設(shè)備，包括會(huì)議電視、可視電話、視頻點(diǎn)播、數(shù)字閉路電視以及Internet上的各項(xiàng)應(yīng)用等。

3)便攜式視聽設(shè)備

便攜式視聽設(shè)備是能夠隨身攜帶的數(shù)字視聽設(shè)備，目前在市場(chǎng)上普及的有MP3播放器和MP4播放器等。

2．?dāng)?shù)字視聽設(shè)備的特點(diǎn)

數(shù)字視聽設(shè)備與模擬視聽設(shè)備相比，具有如下幾個(gè)方面的特點(diǎn)。

1)數(shù)字化

數(shù)字技術(shù)在越來越多的音、視頻產(chǎn)品中應(yīng)用，模擬視聽產(chǎn)品已漸漸退出歷史舞臺(tái)。繼激光數(shù)字視聽產(chǎn)品取代原來的模擬錄音、錄像機(jī)后，我國電視數(shù)字化的進(jìn)程明顯加快，模擬信號(hào)向數(shù)字信號(hào)過渡全面展開。這不僅體現(xiàn)在單一數(shù)字設(shè)備的改進(jìn)和創(chuàng)新上，如出現(xiàn)了數(shù)字?jǐn)z像機(jī)、錄像機(jī)、特技機(jī)、切換臺(tái)等大批運(yùn)用數(shù)字技術(shù)的設(shè)備，而且大規(guī)模、整體性的數(shù)字系統(tǒng)也日趨完善，出現(xiàn)了全數(shù)字電視演播室、全數(shù)字電視轉(zhuǎn)播車、數(shù)字衛(wèi)星新聞采集(DSNC)轉(zhuǎn)播車等。這種數(shù)字化還正向全電視系統(tǒng)縱深發(fā)展，相繼出現(xiàn)了地面數(shù)字廣播(DVB-T)、數(shù)字衛(wèi)星直播用戶(DTH)等。

2)集成化

隨著數(shù)字電子技術(shù)的發(fā)展，一塊芯片上可以集成越來越多的音、視頻信號(hào)的處理功能，使產(chǎn)品的用途更廣，體積更小。

3)網(wǎng)絡(luò)化

現(xiàn)代的數(shù)字視聽產(chǎn)品不僅能提供高清晰度的圖像和高保真的聲音，而且還有多種用途，如點(diǎn)播節(jié)目、網(wǎng)上購物、網(wǎng)上銀行、網(wǎng)際漫游等，可以促進(jìn)電視、電腦、通信三者的融合，成為信息高速公路進(jìn)入家庭的捷徑。技術(shù)人員已經(jīng)擬定了一套適應(yīng)數(shù)字視聽產(chǎn)品相互連接的家庭網(wǎng)絡(luò)的基本格式。這套方案的確立，使未來家庭數(shù)字視聽產(chǎn)品之間可以實(shí)現(xiàn)相互控制操作。

4)個(gè)性化、人性化

數(shù)字視聽產(chǎn)品設(shè)計(jì)將突出個(gè)性化和人性化。激烈的競(jìng)爭(zhēng)促使生產(chǎn)者不斷對(duì)消費(fèi)市場(chǎng)進(jìn)行細(xì)分，推出滿足個(gè)性化需求的新技術(shù)、新產(chǎn)品，像大屏幕液晶電視、大容量快速存儲(chǔ)技術(shù)、技術(shù)含量高的數(shù)碼影像產(chǎn)品都更多地體現(xiàn)出人性化設(shè)計(jì)的特點(diǎn)。

1.2信號(hào)的數(shù)字化

1.2.1模擬信號(hào)與數(shù)字信號(hào)

1．模擬信號(hào)及其特點(diǎn)

模擬信號(hào)是指在時(shí)間軸上連續(xù)變化的信號(hào)。對(duì)于模擬信號(hào)，可以通過相對(duì)應(yīng)的一些參數(shù)(如頻率、周期、幅度等)來描述其變化的情況。模擬信號(hào)雖具有變化直觀、形象等特點(diǎn)，但容易受到干擾，而且其所表示的范圍較小，精度相對(duì)較低。

2．?dāng)?shù)字信號(hào)及其特點(diǎn)

數(shù)字信號(hào)是指用一系列數(shù)據(jù)組來表示的信號(hào)，數(shù)字信號(hào)在時(shí)間軸上是離散的，而且表示數(shù)字信號(hào)幅度的數(shù)字量也是離散的。數(shù)字信號(hào)只有0或1兩種狀態(tài)，因此，它具有抗干擾能力強(qiáng)、精度高、表示的動(dòng)態(tài)范圍寬、穩(wěn)定性高、便于存儲(chǔ)和變換等一系列優(yōu)點(diǎn)。

由于CD光盤上記錄的是數(shù)字化音頻信號(hào)，VCD/DVD光盤上記錄的是數(shù)字化的音頻和視頻信息，因此，在將模擬的音頻和視頻信號(hào)記錄到光盤之前，必須對(duì)其進(jìn)行數(shù)字化處理。1.2.2音頻信號(hào)的數(shù)字化

將模擬的音頻信號(hào)變化為數(shù)字信號(hào)，必須經(jīng)過采樣、量化和編碼3個(gè)主要過程。圖1-2是模擬信號(hào)數(shù)字化的過程示意圖。圖1-2模擬信號(hào)的數(shù)字化過程

1．采樣

采樣是將模擬信號(hào)變換為數(shù)字信號(hào)的第一步。所謂采樣，就是以一定的頻率在時(shí)間軸上對(duì)模擬信號(hào)離散地進(jìn)行取樣，用離散的樣本值代替原來連續(xù)的信號(hào)波形的過程。采樣時(shí)，在一定的時(shí)間范圍內(nèi)，采樣時(shí)間間隔越小，采樣點(diǎn)越多，因而采樣頻率等于采樣時(shí)間間隔的倒數(shù)。

在信號(hào)的數(shù)字化過程中，采樣頻率和每個(gè)時(shí)刻的采樣值非常重要，它們決定了波形的重放精度。采樣頻率越高，采樣的周期越短，丟失的信息就越少，經(jīng)過數(shù)字化處理后與原來信號(hào)間的誤差就越小，精度也越高。圖1-2(a)所示為采樣脈沖與模擬信號(hào)的關(guān)系示意圖。在實(shí)際應(yīng)用中，并不是無限地追求高精度，而是要求精度滿足要求就可以了。根據(jù)奈奎斯特采樣定理，只要采樣頻率大于或等于模擬信號(hào)中最高頻率的2倍，就可以不失真地恢復(fù)出原模擬信號(hào)。例如，音頻信號(hào)的最高頻率是20kHz，采樣頻率應(yīng)大于或等于40kHz。

在實(shí)際應(yīng)用中，為了能與數(shù)字式磁帶錄音機(jī)PCM處理器使用的采樣頻率(44.1kHz)兼容，在錄制CD時(shí)，一般采用44.1kHz作為采樣頻率。

2．量化

由采樣獲得的信號(hào)，雖然在時(shí)間上是離散的，但其在幅度上仍然是連續(xù)的信號(hào)。要把采樣保持后得到的信號(hào)在幅度上變換成離散的信號(hào)，必須對(duì)其進(jìn)行量化處理。

所謂量化，是指將各個(gè)時(shí)刻波形的幅值(采樣值)用有限位的二進(jìn)制數(shù)來表示(1位二進(jìn)制數(shù)稱為1bit)的過程，實(shí)質(zhì)上是通過四舍五入的方法將每一個(gè)采樣值歸并到某一個(gè)相鄰整數(shù)的過程。如果用n位二進(jìn)制碼來表示一個(gè)量化級(jí)(或稱量化電平級(jí)數(shù))，則它所能夠表示的量化級(jí)的總數(shù)為

M?=?2n

這樣，當(dāng)選用4位二進(jìn)制數(shù)時(shí)，它只能代表0～15共16個(gè)十進(jìn)制數(shù)，用它來量化時(shí)，就只能代表0～15個(gè)電壓值(等級(jí))；若選用16位二進(jìn)制數(shù)時(shí)，它可能代表0～65535共65536個(gè)十進(jìn)制數(shù)，用它來量化時(shí)，就可以代表0～65536個(gè)電壓值(等級(jí))。對(duì)CD中的音頻信號(hào)，采用的量化位數(shù)為16，相應(yīng)音頻信號(hào)的動(dòng)態(tài)范圍理論上可達(dá)到

20lg216?=?96dB音頻信號(hào)的量化示意圖如圖1-2(b)、(c)所示。由圖1-2(b)、(c)可見，經(jīng)過量化處理后，量化值與采樣值之間產(chǎn)生了誤差。這種由于量化引起的輸入信號(hào)與輸出信號(hào)之間的誤差稱為量化誤差。

量化誤差對(duì)信號(hào)來說就是量化噪聲。量化噪聲的大小取決于量化級(jí)數(shù)的多少，即所使用的二進(jìn)制位數(shù)的多少。位數(shù)越多，量化等級(jí)越細(xì)，量化噪聲就越小。通常，各種信號(hào)量化噪聲的信噪比(S/N)可表示為

(1-1)其中，b為量化位數(shù)，m為由信號(hào)的統(tǒng)計(jì)性質(zhì)決定的常數(shù)，對(duì)正弦信號(hào)m=3.01。由此可見，對(duì)一量化位數(shù)為16的正弦信號(hào)，其信噪比接近98dB。

由于在CD系統(tǒng)中，對(duì)音頻信號(hào)的采樣頻率為44.1kHz，若量化位數(shù)為16，對(duì)立體聲音頻信號(hào)進(jìn)行數(shù)字化時(shí)，每秒種要傳送的碼元數(shù)量，也就是碼率(或稱數(shù)據(jù)傳輸率)為

碼率?=?采樣頻率?×?量化位數(shù)?×?2?

=?44.1?×?16?×?2?=?1.4112Mb/s

若考慮到誤碼檢出和誤碼校正用碼的要求，還要增加20%～30%的冗余脈沖，則需傳送的碼率為2Mb/s，為此要求設(shè)備的帶寬必須在1～1.5MHz。

3．編碼

編碼是將已量化的各電平值用二進(jìn)制數(shù)來表示的過程。經(jīng)過編碼后，一個(gè)模擬信號(hào)就可以用一系列的二進(jìn)制數(shù)字來表示。信號(hào)的編碼示意圖如圖1-2(d)所示。

編碼后形成的二進(jìn)制碼為數(shù)字信號(hào)，在電路中用脈沖的有無，即高電平“1”和低電平“0”來表示?！?”為有脈沖，“0”為無脈沖，這些脈沖的幅度和寬度均相等。由此形成的脈沖信號(hào)稱為脈沖編碼信號(hào)，其過程用PCM(PulseCodeModulation)表示，即脈沖編碼調(diào)制。對(duì)于音頻信號(hào)，數(shù)字信號(hào)的波形與圖1-2(d)中所示的波形會(huì)有所不同，它不完全在橫坐標(biāo)(即零電平)的上方，而是在零電平的上、下變化。因此，為了能夠正確表示在零電平上、下方的正、負(fù)數(shù)，必須用二進(jìn)制數(shù)的補(bǔ)碼來表示。同時(shí)，當(dāng)補(bǔ)碼的所有位均為0或均為1時(shí)，它所代表的數(shù)值接近于零，這一特點(diǎn)對(duì)于防止系統(tǒng)故障是非常有利的。1.2.3視頻信號(hào)的數(shù)字化

1．視頻信號(hào)的特點(diǎn)

如前所述，音頻信號(hào)的頻率范圍為20Hz～20kHz，而且在此頻率范圍內(nèi)是連續(xù)變化的模擬信號(hào)。當(dāng)采樣頻率為44.1kHz，并采用16位的量化位數(shù)時(shí)，其碼率為2Mb/s。

視頻信號(hào)與音頻信號(hào)相比，具有一些明顯的特點(diǎn)。首先，視頻信號(hào)是由亮度信號(hào)、色度信號(hào)、同步信號(hào)、消隱信號(hào)等組成的，頻率范圍為0～6MHz。其次，在視頻信號(hào)中，同步信號(hào)與消隱信號(hào)是固定不變的，而變化的亮度與色度信號(hào)位于消隱信號(hào)之間，這樣就使得亮度和色度信號(hào)被消隱信號(hào)分成一段一段的信號(hào)，形成在時(shí)間軸上不連續(xù)的信號(hào)。為此，對(duì)視頻信號(hào)的數(shù)字化分為全信號(hào)數(shù)字化和分量數(shù)字化兩種基本方式。全信號(hào)數(shù)字化是指對(duì)復(fù)合全電視信號(hào)直接進(jìn)行數(shù)字化。這種方法相互間的干擾較大，而且當(dāng)電視制式不同時(shí)，解碼方法也不同。

分量數(shù)字化是指對(duì)亮度信號(hào)Y、色差信號(hào)(R-Y)、(B-Y)分別進(jìn)行數(shù)字化，然后采取時(shí)分復(fù)用制進(jìn)行處理。這種方法可以避免反復(fù)編碼和解碼的過程，而且亮度信號(hào)與色差信號(hào)分開處理，相互間的影響較小，特別是可以將625/50制和525/60制統(tǒng)一起來，是目前普遍采取的方法。

2．視頻信號(hào)的采樣結(jié)構(gòu)與采樣頻率

1)采樣結(jié)構(gòu)

對(duì)于音頻信號(hào)，由于其在時(shí)間軸上是連續(xù)的，因此，對(duì)采樣點(diǎn)的結(jié)構(gòu)沒有特殊的要求。但對(duì)于視頻信號(hào)來講，由于其在時(shí)間軸上并不是連續(xù)的，而且采用隔行掃描時(shí)奇數(shù)行與偶數(shù)行都存在半行結(jié)構(gòu)，所以，在采樣時(shí)就存在著采樣點(diǎn)的分布問題。這是因?yàn)椋舨蓸宇l率不是行頻的整數(shù)倍，那么，采樣點(diǎn)就可能發(fā)生重合，使圖像的質(zhì)量下降。目前，對(duì)視頻信號(hào)數(shù)字化時(shí)，都采用固定型正交采樣結(jié)構(gòu)，采樣頻率為行頻的整數(shù)倍，而且使每一場(chǎng)中的采樣點(diǎn)都對(duì)齊且重合。

2)采樣頻率

根據(jù)奈奎斯特采樣定理，采樣頻率與信號(hào)帶寬有一定的關(guān)系。對(duì)于625/50制式，其掃描帶寬為5.8～6.0MHz；對(duì)于525/60制式，其掃描帶寬為5.6MHz。考慮到采樣后的混疊噪聲要足夠小，要求采樣頻率應(yīng)為被采樣信號(hào)的2.2～2.7倍。因此，對(duì)于PAL制，采樣頻率至少應(yīng)為12.72～13.2MHz。

另外，為了使625/50和525/60兩種掃描制式兼容，應(yīng)使用同一種采樣頻率。626/50和525/60的行頻分別為15625Hz和15734Hz，二者的最小公倍數(shù)為2.25MHz。綜上所述，亮度信號(hào)的采樣頻率應(yīng)大于13.2MHz，而且是2.25MHz的6倍，選13.5MHz。

在確定色差信號(hào)的采用頻率時(shí)，考慮到色差信號(hào)CB、CR的帶寬小于2MHz，為了降低采樣后的混疊噪聲，保證采樣頻率為行頻的整數(shù)倍及制式的兼容性，色差信號(hào)的采樣頻率定為6.75MHz，為亮度信號(hào)采樣頻率的一半。而且，該頻率也是PAL制行頻的432倍，是NTSC制的429倍。

3)視頻信號(hào)的量化位數(shù)與碼率

被處理信號(hào)的信噪比與量化位數(shù)有著密切的關(guān)系，若被量化的信號(hào)是單極性信號(hào)，則信噪比可由下式確定：

6n?+

10.8dB(1-2)

式中，n為量化位數(shù)。由此可見，隨著量化位數(shù)的增加，信噪比相應(yīng)得到提高，而且每增加一位，信噪比可提高6dB，但同時(shí)也會(huì)使電路的復(fù)雜性和設(shè)備的成本大大提高。綜合考慮，電視信號(hào)的量化位數(shù)一般取8位較為合理，此時(shí)的信噪比可達(dá)59dB。在分量數(shù)字化中，由于亮度信號(hào)的采樣頻率為13.5MHz，兩個(gè)色差信號(hào)的采樣頻率為6.75MHz，量化位數(shù)都是8bit，因此

碼率?=?13.5?×?8?+?6.75?×?8?×?2?=?216Mb/s

可見，視頻信號(hào)傳送的碼率要比音頻信號(hào)的碼率(2Mb/s)高出100倍以上。

4)電視信號(hào)的數(shù)字化標(biāo)準(zhǔn)

電視信號(hào)數(shù)字化標(biāo)準(zhǔn)有2∶1∶1、4∶2∶2和4∶4∶4等格式。DVD視盤機(jī)采用的是4∶2∶2標(biāo)準(zhǔn)，圖像水平清晰度達(dá)500線，如表1-1所示。其采樣頻率為

Y∶CR∶CB=13.5MHz∶6.75MHz∶6.75MHz

如果將亮度信號(hào)和色差信號(hào)的采樣頻率都減少一倍，就構(gòu)成了2∶1∶1標(biāo)準(zhǔn)，當(dāng)然每數(shù)字行的點(diǎn)數(shù)也要減少一倍，這就是VCD的標(biāo)準(zhǔn)，其圖像水平清晰度可達(dá)250線。

5)視頻壓縮編碼

根據(jù)上述分析可知，即使按照2∶1∶1的低檔標(biāo)準(zhǔn)編碼的電視信號(hào)，其傳輸碼率也將達(dá)到108Mb/s，要求帶寬高達(dá)100MHz。這樣，將給信號(hào)的存儲(chǔ)、錄放處理和傳輸?shù)葞砭薮蟮睦щy。利用頻帶壓縮編碼技術(shù)(也稱碼率壓縮)可在不降低圖像質(zhì)量的前提下降低碼率。頻帶壓縮的方法有3種，即同步信號(hào)去除、高效編碼和DCT編碼。

(1)同步信號(hào)去除。

由于電視信號(hào)在行場(chǎng)的逆程期間不攜帶圖像信息，因此，可以在傳輸過程中將其去除，而只傳送光柵可見部分的取樣點(diǎn)，即只對(duì)有效行進(jìn)行數(shù)字化處理，處理完成后再嵌上行、場(chǎng)同步信號(hào)。這一方法在電視畫中畫技術(shù)中得到采用，可以減少17%的碼率。

(2)高效編碼。

高效編碼是利用人眼的視覺惰性和電視信號(hào)的統(tǒng)計(jì)特性來減少碼率的一種編碼方式。人眼的視覺惰性有兩個(gè)明顯的特點(diǎn)：一是視覺檢測(cè)有一個(gè)門限值，低于該門限值的誤差不會(huì)被發(fā)覺；二是該門限值會(huì)隨著時(shí)間和空間圖像的內(nèi)容而變化。對(duì)于第一點(diǎn)，在編碼時(shí)，可以在視覺門限值較小的圖像部分將取樣頻率或量化位數(shù)取得高一些，而在視覺門限值較高的圖像部分，采用較低的取樣頻率或量化位數(shù)，這樣，就可以在不降低圖像質(zhì)量的前提下降低傳送的碼率。對(duì)于第二個(gè)特點(diǎn)，可對(duì)幀間變化快的運(yùn)動(dòng)圖像，適當(dāng)降低采樣頻率，此時(shí)雖然幀內(nèi)圖像的水平和垂直分辨率有所下降，但由于這種運(yùn)動(dòng)圖像的視覺門限值較高，所以不會(huì)被發(fā)覺；對(duì)于幀間變化較慢的靜止或慢運(yùn)動(dòng)圖像，因其視覺門限值較低，要求有較高的分辨率，不能降低其采樣頻率。為此，可采用每?jī)蓭瑐魉鸵淮危诳焖龠\(yùn)動(dòng)部分將幀內(nèi)頻率降低一半，這在視覺上不會(huì)感覺到圖像質(zhì)量的下降。

(3)?DCT編碼。

DCT(DiscreteCosineTransform)變換也稱離散余弦變換，它是一種數(shù)字編碼的變換方式。在正常情況下，大多數(shù)圖像信號(hào)中的低頻分量都要比高頻分量的幅度大，水平線和垂直線出現(xiàn)的幾率比斜線出現(xiàn)的幾率大。因此，可以采用DCT變換的方式，將取樣后的圖像樣值進(jìn)行變換，形成新的編碼序列，以獲得更高的編碼效率。

DCT變換是一種傅里葉變換。對(duì)于二維的電視圖像來講，對(duì)應(yīng)的二維DCT變換與反變換的表達(dá)式為

(1-3)

(1-4)其中，式(1-3)為DCT的正變換，它可以將像素的采樣值變換成頻率系數(shù)；式(1-4)為DCT的逆變換，它可以將頻率系數(shù)還原成像素的采樣值。式中的x，y，u，v?=

0，1，2，…，7；

f?(x，y)是像素的位置函數(shù)；F(u，v)是對(duì)應(yīng)于f?(x，y)中每個(gè)像素經(jīng)DCT變換后的系數(shù)函數(shù)；C(u)、C(v)是常數(shù)，當(dāng)u=v=0時(shí)，C(u)

=?C(v)

1/，當(dāng)u和v不為零時(shí)，C(u)

=?C(v)＋=

1。當(dāng)u?=?v?=

0時(shí)，式(1-3)可簡(jiǎn)化為

(1-5)式(1-5)表示64個(gè)像素點(diǎn)的平均值，相當(dāng)于直流分量。在進(jìn)行DCT變換時(shí)，首先要將整幅圖像進(jìn)行分割，再橫向分成若干片，每片圖像再縱向切成若干個(gè)宏塊，如圖1-3所示。為便于理解，以圖1-3中像塊取4?×?4個(gè)像點(diǎn)，每個(gè)像點(diǎn)量化位數(shù)為4的例子進(jìn)行說明。對(duì)每個(gè)宏塊，在水平方向上進(jìn)行4次取樣(4個(gè)像素點(diǎn))，垂直方向是4條掃描線，即每個(gè)宏塊中含有16個(gè)像素點(diǎn)。若對(duì)每個(gè)像素進(jìn)行量化和編碼，運(yùn)用DCT變換的方法，即可以將16個(gè)像點(diǎn)量化的數(shù)據(jù)從空間坐標(biāo)轉(zhuǎn)換成頻率坐標(biāo)分量，實(shí)際上就是將信號(hào)分解成若干頻率分量，然后用頻率的分量來表示。由圖1-3可見，數(shù)據(jù)經(jīng)過DCT變換后，將大多數(shù)像點(diǎn)中的低頻分量表示高值，并抽到坐標(biāo)的左上角，由于許多像點(diǎn)的亮度電平都相等，因此，高頻分量的值為零。這樣，大多數(shù)方塊中的數(shù)據(jù)將變成零，使數(shù)據(jù)量大大減少，從數(shù)據(jù)上說是起到了壓縮的效果。若畫面的亮度與色彩有明顯變化時(shí)，量化后的高頻分量將增大，低頻分量則變小。但當(dāng)對(duì)頻率坐標(biāo)中的系數(shù)進(jìn)行量化處理后，大多數(shù)的高頻分量也變成了零，只剩下直流分量和低頻分量。此時(shí)，若對(duì)這16個(gè)像點(diǎn)在數(shù)據(jù)排列上進(jìn)行“Z”字形掃描后編碼，則可使得編碼后的數(shù)據(jù)量大為減少，達(dá)到數(shù)據(jù)壓縮的目的。經(jīng)過這種處理后，再使用哈夫曼編碼，進(jìn)行一次量化運(yùn)算和編碼變成更簡(jiǎn)化的數(shù)字信號(hào)。圖1-3空間坐標(biāo)轉(zhuǎn)換為頻率坐標(biāo)(DCT變換)

1.3信號(hào)的調(diào)制與糾錯(cuò)

1.3.1記錄信號(hào)的調(diào)制

1．光盤信息的特點(diǎn)

在光盤上記錄的信號(hào)，都是以微小的凹坑形式來代表數(shù)字“1”和“0”的。如果按照數(shù)據(jù)流直接以有無凹坑來記錄數(shù)據(jù)，則最小凹坑尺寸等于記錄的1位數(shù)據(jù)。光盤可讀出的最小凹坑由聚焦光點(diǎn)的尺寸決定，這樣就可以直接刻錄信號(hào)并決定記錄密度。在實(shí)際應(yīng)用中，數(shù)據(jù)流信息是由數(shù)字“1”、“0”的某些組合構(gòu)成的，這樣，數(shù)據(jù)碼流連續(xù)為“0”和連續(xù)為“1”的情況是經(jīng)常出現(xiàn)的。在光盤錄制的數(shù)據(jù)中，若出現(xiàn)連續(xù)為“0”或連續(xù)為“1”的情況，不但會(huì)使得激光束的通斷頻率降低，造成光強(qiáng)不穩(wěn)定，也會(huì)使伺服電路的工作出現(xiàn)不正常現(xiàn)象。另外，如果數(shù)字連續(xù)出現(xiàn)為“0”的情況，有可能使DSP電路中的壓控振蕩器工作不正常。因此，在激光視盤機(jī)中，為了使伺服系統(tǒng)穩(wěn)定地工作，應(yīng)盡量減少信號(hào)的低頻分量和直流平均分量，并排除干擾，在信號(hào)記錄到光盤之前需要對(duì)其進(jìn)行調(diào)制。

2．光盤信息的調(diào)制與解調(diào)

由于CD/VCD和DVD光盤記錄數(shù)據(jù)密度等方面的不同，在CD/VCD視盤機(jī)中采用EFM(EighttoFourteenModulation)調(diào)制，而在DVD機(jī)中，對(duì)記錄的數(shù)據(jù)要進(jìn)行EFM+調(diào)制。

所謂EFM調(diào)制，就是把8位字長的字符調(diào)制成14位字長的字符。對(duì)16位的數(shù)據(jù)，首先應(yīng)把它分為兩個(gè)8位的數(shù)據(jù)字分別送到8位—14位變換器，變成14位的通道位信號(hào)，然后用通道位流在光盤上進(jìn)行記錄。其調(diào)制規(guī)則是：在PCM碼中，每對(duì)數(shù)碼的“1”之間至少要有兩個(gè)“0”碼，而至多不能超過10個(gè)“0”碼。EFM調(diào)制遵循3T～11T原則(T為1位信號(hào)所占用的時(shí)間)。在信號(hào)記錄和拾取過程中，由于數(shù)碼流是串行傳輸?shù)模@樣，當(dāng)一個(gè)14位的數(shù)碼以1結(jié)尾，而下一個(gè)14位的數(shù)碼又有可能以1開始時(shí)，在這樣的兩組數(shù)碼的連接處便不能滿足3T～11T規(guī)則。為此，在每?jī)蓚€(gè)14位的數(shù)碼之間插入了3位的連接位。3位連接位的選擇可以是000、010、001這3種的任何一種，以保證EFM數(shù)據(jù)流中相鄰兩個(gè)數(shù)據(jù)間至少有兩個(gè)“0”位的存在。

EFM+調(diào)制與EFM調(diào)制一樣，仍然滿足3T～11T的信號(hào)坑長度原則，但在EFM+調(diào)制技術(shù)中不再需要EFM要求的3位連接碼。與每位字節(jié)(8位數(shù)字信號(hào))對(duì)應(yīng)的EFM+代碼只有16位，比EFM的17位通道碼縮短了16%，提高了光盤物理空間的利用率。

EFM解調(diào)是EFM調(diào)制的逆過程。在編碼過程中，需要對(duì)模擬信號(hào)進(jìn)行PCM編碼、

CIRC糾錯(cuò)、EFM調(diào)制等數(shù)字化處理，將數(shù)字信號(hào)記錄到光盤上。在解碼過程中，則要進(jìn)行EFM解調(diào)、反交錯(cuò)、D/A轉(zhuǎn)換等處理，才能還原出原來的模擬信號(hào)。

在進(jìn)行EFM解調(diào)時(shí)，需要先將串行輸入的待解調(diào)信號(hào)進(jìn)行串/并轉(zhuǎn)換，然后對(duì)每個(gè)并行的14位數(shù)據(jù)進(jìn)行鎖存，再經(jīng)14位—8位譯碼器將其還原為8位數(shù)據(jù)信號(hào)。EFM+解調(diào)則是將16位數(shù)據(jù)還原為8位數(shù)據(jù)信號(hào)。1.3.2誤碼的檢測(cè)、糾錯(cuò)與補(bǔ)償

1．誤碼的檢測(cè)與糾錯(cuò)

對(duì)于以光盤為存儲(chǔ)媒體的CD/VCD/DVD視盤機(jī)來講，在原版制作、盤片制造、使用過程以及其他可能的原因下，很容易造成重放的數(shù)字信號(hào)出現(xiàn)誤碼現(xiàn)象，這樣勢(shì)必會(huì)引起重放的圖像和聲音出現(xiàn)不同的失真。既然在光盤的刻錄與重放過程中不可避免地會(huì)產(chǎn)生誤碼，這就要求對(duì)產(chǎn)生的誤碼進(jìn)行檢測(cè)，并及時(shí)地進(jìn)行糾正。在對(duì)誤碼進(jìn)行糾錯(cuò)之前，首先應(yīng)識(shí)別信號(hào)中原有的誤碼及誤碼的位置，為此一般在原信息碼中以一定規(guī)則增加一個(gè)或幾個(gè)多余碼元，使原來信息碼中不相關(guān)的碼元變?yōu)橄嚓P(guān)。這樣，在信號(hào)的播放還原處理中，可以根據(jù)相應(yīng)的規(guī)則進(jìn)行誤碼校驗(yàn)。

目前常用的誤碼檢測(cè)與糾錯(cuò)方法一般有奇偶檢驗(yàn)法、循環(huán)冗余檢驗(yàn)(CyclicRedundancyCheck，CRC)法、交叉交織里德-索羅門碼(CrossInterleaveReed-solomonCode，CIRC)法、里德-索羅門乘積碼(Reed-SolomonProductCode，RSPC)法等。

1)奇偶校驗(yàn)法

奇偶校驗(yàn)法是一種最基本而簡(jiǎn)單有效的校驗(yàn)方法。利用奇偶校驗(yàn)法可以判斷一組數(shù)據(jù)碼中個(gè)別誤碼的所在位置。該方法的基本思想是根據(jù)字節(jié)中二進(jìn)制數(shù)位中的“1”和“0”的個(gè)數(shù)是奇數(shù)還是偶數(shù)來檢驗(yàn)是否有誤碼產(chǎn)生。具體實(shí)現(xiàn)時(shí)，首先在信息位之外添加一位“1”或“0”，并使包括該位在內(nèi)的全體碼中的“1”的個(gè)數(shù)總是為奇數(shù)(或者為偶數(shù))，然后利用當(dāng)誤碼產(chǎn)生時(shí)奇偶發(fā)生顛倒的性質(zhì)來檢查出誤碼。對(duì)于利用奇偶校驗(yàn)法檢測(cè)出的誤碼，可采用縱橫奇偶校驗(yàn)法進(jìn)行糾錯(cuò)處理。奇偶校驗(yàn)法僅能對(duì)奇數(shù)個(gè)1或0發(fā)生誤碼有效。

2)循環(huán)冗余檢驗(yàn)法

循環(huán)冗余檢驗(yàn)法是一種比奇偶校驗(yàn)的檢錯(cuò)、糾錯(cuò)能力更強(qiáng)、更加行之有效的方法。它是以代數(shù)計(jì)算方法來分析碼的結(jié)構(gòu)，然后再以代數(shù)運(yùn)算方法來設(shè)置檢驗(yàn)位。其過程比奇偶校驗(yàn)法復(fù)雜。

3)交叉交織里德-索羅門碼法

交織法是對(duì)付群誤碼的一種最基本的方法。這種方法在記錄時(shí)改變數(shù)字信號(hào)的順序，重放時(shí)再按照原來的順序重排。前者稱為交織，后者稱為去交織。經(jīng)過交織和去交織處理后，原來的誤碼也同時(shí)被分散開來，群誤碼也變成了隨機(jī)誤碼，然后再采用奇偶校驗(yàn)法糾錯(cuò)。

交叉交織里德-索羅門碼法是指在交織前和交織后的不同字組上都加上糾錯(cuò)碼，這樣就可在交織前和交織后各形成一個(gè)奇偶校驗(yàn)字，使得糾錯(cuò)能力進(jìn)一步增強(qiáng)。里德-索羅門碼由里德-索羅門發(fā)明，它至少設(shè)置兩個(gè)校驗(yàn)位，并且校驗(yàn)位和信息位按規(guī)定的算術(shù)模式運(yùn)算后產(chǎn)生至少兩個(gè)校正字。在記錄時(shí)校正字的值為0，在重放時(shí)根據(jù)校正字的值是否為0來判斷誤碼是否出現(xiàn)，并經(jīng)過反運(yùn)算來決定誤碼的位置，以便加以糾錯(cuò)。該碼對(duì)隨機(jī)誤碼具有極強(qiáng)的糾錯(cuò)能力。

在CD/VCD中，采用的是CIRC(交叉交織里德-索羅門)糾錯(cuò)編碼方法，它是將交叉交織法與4階里德-索羅門碼進(jìn)行組合而進(jìn)行糾錯(cuò)的。這種糾錯(cuò)碼對(duì)于出現(xiàn)頻度很高的隨機(jī)誤碼，由里德-索羅門碼幾乎給予全部糾正；對(duì)于那些經(jīng)常出現(xiàn)但碼長較短的群誤碼，則由交叉交織來糾正；對(duì)偶爾出現(xiàn)的很長的群誤碼，則由另外的交織來解決。

CIRC糾錯(cuò)碼綜合了交織、延時(shí)交織、交叉交織及里德-索羅門碼等糾錯(cuò)技術(shù)，不僅能糾錯(cuò)隨機(jī)誤碼，還對(duì)突發(fā)誤碼有特強(qiáng)的糾錯(cuò)能力。

在DVD中采用的是里德-索羅門乘積碼(RSPC)糾錯(cuò)編碼方式，它是在里德-索羅門編碼方法基礎(chǔ)上發(fā)展起來的一種新的糾錯(cuò)技術(shù)。實(shí)踐表明，即使糾錯(cuò)前的誤碼率為1%，經(jīng)RSPC糾錯(cuò)后也會(huì)下降到10-20以下，而在同樣條件下，CIRC糾錯(cuò)后誤碼率僅可達(dá)到10-6水平。

2．誤碼的補(bǔ)償

由于數(shù)字信號(hào)只有“0”和“1”兩種狀態(tài)，因此，對(duì)信號(hào)在刻錄和重放時(shí)產(chǎn)生的個(gè)別誤碼被檢測(cè)出來后，就比較容易進(jìn)行糾正了，只要將原來誤碼的地方取反即可。若檢測(cè)出的某一位“1”為誤碼，則只需將該位變成“0”即可得到糾正。

在CD/VCD中采用的CIRC糾錯(cuò)技術(shù)，雖然有很強(qiáng)的糾錯(cuò)能力，但也很難做到百分之百的糾正。為此，在數(shù)字系統(tǒng)中又采用了誤碼補(bǔ)償?shù)姆椒▽?duì)不能及時(shí)糾正的誤碼進(jìn)行進(jìn)一步控制。所謂誤碼補(bǔ)償，就是根據(jù)誤碼的前后關(guān)系推斷出原來的數(shù)據(jù)，再進(jìn)行替換的方法。常用的誤碼補(bǔ)償方法有靜噪法、前值保持法和線性內(nèi)插法3種。

靜噪法也稱零值替代法，這種方法就是使誤碼位置的值恒為零。當(dāng)發(fā)生差錯(cuò)并被識(shí)別出來時(shí)，使電路在出錯(cuò)的這一點(diǎn)上切斷揚(yáng)聲器的聲音信號(hào)和到顯像管的圖像信號(hào)。

前值保持就是當(dāng)發(fā)現(xiàn)有可疑的誤碼時(shí)，用最靠近它的前一個(gè)數(shù)據(jù)字來代替它，由于音頻和視頻信號(hào)的相關(guān)性，補(bǔ)償后的數(shù)據(jù)誤差率將會(huì)大大降低。

線性內(nèi)插是指取出錯(cuò)前的一個(gè)數(shù)據(jù)字與出錯(cuò)后的一個(gè)數(shù)據(jù)字的平均值，并用該值代替這個(gè)出錯(cuò)的字。利用這種方法，可以得到更為精確的糾錯(cuò)。

1.4數(shù)據(jù)壓縮技術(shù)的標(biāo)準(zhǔn)

1.4.1數(shù)據(jù)壓縮技術(shù)的分類

由于在數(shù)據(jù)中間存在一定的冗余度，以及在數(shù)據(jù)之間存在一定的相關(guān)性，因此可對(duì)數(shù)據(jù)進(jìn)行適當(dāng)?shù)膲嚎s處理以解決數(shù)據(jù)傳輸過程中的存儲(chǔ)、傳輸帶寬等問題。數(shù)據(jù)壓縮分為無損壓縮與有損壓縮兩大類。無損壓縮是指對(duì)原始數(shù)據(jù)壓縮重構(gòu)，重構(gòu)后得到的數(shù)據(jù)與原來的數(shù)據(jù)完全相同，這種壓縮方式的壓縮比一般較低，常用于對(duì)文本數(shù)據(jù)的壓縮；有損壓縮是指對(duì)原始數(shù)據(jù)壓縮重構(gòu)，重構(gòu)后得到的數(shù)據(jù)與原來的數(shù)據(jù)有所不同，此壓縮方式的壓縮比較高，常用于對(duì)圖像、音頻和視頻信號(hào)的壓縮。

目前常用的數(shù)據(jù)壓縮標(biāo)準(zhǔn)主要有用于靜止圖像壓縮的JPEG系列標(biāo)準(zhǔn)、用于視頻和音頻通信的H.26X系列標(biāo)準(zhǔn)、用于音頻和視頻編碼的MPEG系列標(biāo)準(zhǔn)以及用于二值圖像編碼的JBIG標(biāo)準(zhǔn)等。1.4.2不同數(shù)據(jù)壓縮標(biāo)準(zhǔn)的特點(diǎn)

1．H.26X系列標(biāo)準(zhǔn)

H.26X系列主要針對(duì)低速率環(huán)境下的實(shí)時(shí)應(yīng)用設(shè)計(jì)，特點(diǎn)是強(qiáng)調(diào)算法的簡(jiǎn)單性和實(shí)時(shí)性，適用于視頻會(huì)議和可視電話等實(shí)時(shí)交互的情況。其中，H.261和H.263是視頻會(huì)議和可視電話的主要視頻編碼標(biāo)準(zhǔn)。

1)?H.261視頻編碼標(biāo)準(zhǔn)

H.261是ITU-T為在綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)上開展雙向聲像業(yè)務(wù)(可視電話、視頻會(huì)議)而制定的，是最早的運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)，速率為64kb/s的整數(shù)倍。H.261采用預(yù)測(cè)編碼(DPCM)與離散余弦編碼(DCT)混合編碼方法，只對(duì)通用中間格式(CommonIntermediateFormat，CIF格式，亮、色信號(hào)的水平和垂直像素?cái)?shù)均為ITU-R601標(biāo)準(zhǔn)圖像的一半)和四分之一CIF格式(QuarterCIF)兩種圖像格式進(jìn)行處理，每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理。

2)?H.263視頻編碼標(biāo)準(zhǔn)

H.263是在H.261基礎(chǔ)上發(fā)展起來的，它是ITU-T為低于64kb/s的窄帶通信信道制定的視頻編碼標(biāo)準(zhǔn)，其信源編碼算法的核心仍是H.261中的DPCM/DCT混合編碼方法，但做了一些改進(jìn)以提高性能和糾錯(cuò)能力。隨后出現(xiàn)的第二版(H.263+)及H.263++增加了許多選項(xiàng)，使其具有更廣泛的適用性。H.263與H.261相比采用了半像素的運(yùn)動(dòng)補(bǔ)償，并增加了4種有效的壓縮編碼模式。

ITU-T在H.263發(fā)布后又修訂發(fā)布了H.263標(biāo)準(zhǔn)的版本2，非正式地命名為H.263+標(biāo)準(zhǔn)。它在保證原H.263標(biāo)準(zhǔn)核心句法和語義不變的基礎(chǔ)上，增加了若干選項(xiàng)以提高壓縮效率或改善某方面的功能。為提高壓縮效率，H.263+采用先進(jìn)的幀內(nèi)編碼模式；增強(qiáng)的PB幀模式改進(jìn)了H.263的不足，增強(qiáng)了幀間預(yù)測(cè)的效果；去塊效應(yīng)濾波器不僅提高了壓縮效率，而且提供重建圖像的主觀質(zhì)量。

H.263++?在H.263+?基礎(chǔ)上增加了3個(gè)選項(xiàng)，主要是為了增強(qiáng)碼流在惡劣信道上的抗誤碼性能，同時(shí)為了提高增強(qiáng)編碼效率。這3個(gè)選項(xiàng)為：

選項(xiàng)U——增強(qiáng)型參考幀選擇，它能夠提供增強(qiáng)的編碼效率和信道錯(cuò)誤再生能力(特別是在包丟失的情形下)，需要設(shè)計(jì)多緩沖區(qū)用于存儲(chǔ)多參考幀圖像。

選項(xiàng)V——數(shù)據(jù)分片，它能夠提供增強(qiáng)型的抗誤碼能力(特別是在傳輸過程中本地?cái)?shù)據(jù)被破壞的情況下)，通過分離視頻碼流中DCT的系數(shù)頭和運(yùn)動(dòng)矢量數(shù)據(jù)，采用可逆編碼方式保護(hù)運(yùn)動(dòng)矢量。選項(xiàng)W——在H.263+?的碼流中增加補(bǔ)充信息，保證增強(qiáng)型的反向兼容性，附加信息包括：指示采用的定點(diǎn)IDCT、圖像信息和信息類型、任意的二進(jìn)制數(shù)據(jù)、文本、重復(fù)的圖像頭、交替的場(chǎng)指示、稀疏的參考幀識(shí)別。

3)?H.264視頻編碼標(biāo)準(zhǔn)

H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標(biāo)準(zhǔn)。H.264與先期的視頻壓縮標(biāo)準(zhǔn)相比引入了很多先進(jìn)的技術(shù)，包括4?×?4整數(shù)變換、空域內(nèi)的幀內(nèi)預(yù)測(cè)、1/4像素精度的運(yùn)動(dòng)估計(jì)、多參考幀與多種大小塊的幀間預(yù)測(cè)技術(shù)等。新技術(shù)帶來了較高的壓縮比，同時(shí)大大提高了算法的復(fù)雜度。

H.264的主要優(yōu)點(diǎn)不但體現(xiàn)在相同的重建圖像質(zhì)量下，比H.263+減小50%碼率，而且對(duì)信道時(shí)延的適應(yīng)性較強(qiáng)，既可工作于低時(shí)延模式以滿足實(shí)時(shí)業(yè)務(wù)(如會(huì)議電視等)，又可工作于無時(shí)延限制的場(chǎng)合(如視頻存儲(chǔ)等)。同時(shí)由于采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法，加強(qiáng)對(duì)誤碼和丟包的處理，可以提高網(wǎng)絡(luò)適應(yīng)性及解碼器的差錯(cuò)恢復(fù)能力。

2．JPEG系列標(biāo)準(zhǔn)

JPEG是聯(lián)合圖像專家組(JointPictureExpertGroup，JPEG)的英文縮寫，是國際標(biāo)準(zhǔn)化組織(ISO)和國際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合制定的靜態(tài)圖像的壓縮編碼標(biāo)準(zhǔn)。1986年由國際電報(bào)電話咨詢委員會(huì)和國際標(biāo)準(zhǔn)化組織兩個(gè)國際組織聯(lián)合成立了一個(gè)聯(lián)合專家小組，它是國際上彩色、灰度、靜止圖像的第一個(gè)國際標(biāo)準(zhǔn)。JPEG標(biāo)準(zhǔn)是一個(gè)適用范圍廣泛的通用標(biāo)準(zhǔn)。它不僅適用于靜態(tài)圖像的壓縮，而且電視圖像序列的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮標(biāo)準(zhǔn)，1992年該標(biāo)準(zhǔn)正式成為國際標(biāo)準(zhǔn)。

JPEG標(biāo)準(zhǔn)的應(yīng)用目標(biāo)是為了給出一個(gè)適用于連續(xù)色調(diào)圖像的壓縮方法，使之滿足以下要求：

①壓縮比及圖像保真度可在較大的范圍內(nèi)調(diào)節(jié)，供用戶選擇。

②可應(yīng)用于任何連續(xù)色調(diào)數(shù)字圖像，不限制圖像的內(nèi)容,即圖像的長寬比、景物內(nèi)容、圖像的復(fù)雜程度等。

③計(jì)算的復(fù)雜性是可控制的，其軟件可在各種CPU上完成，算法也可用硬件實(shí)現(xiàn)。

④?JPEG算法具有順序編碼、累進(jìn)編碼、無失真編碼和分層編碼等4種操作方式。

JPEG2000是新一代靜止圖像壓縮標(biāo)準(zhǔn)，由聯(lián)合圖像專家組(JPEG)于2000年出臺(tái)。JPEG2000中主要采用了離散小波變換(DWT)與嵌入式可截?cái)鄡?yōu)化塊編碼(EBCOT)兩大核心技術(shù)，與JPEG標(biāo)準(zhǔn)相比，它具有很多優(yōu)點(diǎn)。首先具有明顯高于JPEG的壓縮比，在低比特率時(shí)能獲得更好的視覺效果。另外，JPEG2000標(biāo)準(zhǔn)中新加入了對(duì)感興趣區(qū)域(ROI)的支持，也就是說它可以將使用者對(duì)于圖片中更關(guān)心或者更感興趣的某一區(qū)域以更高的比特率壓縮，從而強(qiáng)調(diào)更具價(jià)值的那部分圖像信息。

3．MPEG系列標(biāo)準(zhǔn)

MPEG是MovingPictureExpertsGroup的縮寫，即“活動(dòng)圖像專家組”，它是由ISO和IEC(國際電工委員會(huì))聯(lián)合組成的活動(dòng)圖像專家組織，所制定的標(biāo)準(zhǔn)是國際通用的標(biāo)準(zhǔn)。MPEG標(biāo)準(zhǔn)主要面向視頻信息的存儲(chǔ)和廣播，由視頻、音頻和系統(tǒng)3部分組成。針對(duì)不同的圖像質(zhì)量要求，MPEG標(biāo)準(zhǔn)還分為初級(jí)標(biāo)準(zhǔn)MPEG-1、通用標(biāo)準(zhǔn)MPEG-2、高壓縮率標(biāo)準(zhǔn)MPEG-4、多媒體描述接口標(biāo)準(zhǔn)MPEG-7和多媒體框架MPEG-21等。

MPEG-1標(biāo)準(zhǔn)是專為傳輸碼率在1.5Mb/s以下的數(shù)字記錄媒體制定的，如VCD、DAT、CD-ROM等。MPEG-2是MPEG-1的升級(jí)版本，是按照廣播電視圖像質(zhì)量的要求制定的，其傳輸碼率是MPEG-1的4倍，支持的帶寬范圍從2Mb/s到超過20Mb/s，它不僅適應(yīng)于廣播電視，也適應(yīng)于通信和數(shù)字存儲(chǔ)媒體等領(lǐng)域，而且還與MPEG-1標(biāo)準(zhǔn)有正向互換性。目前，MPEG-2標(biāo)準(zhǔn)在數(shù)字電視和DVD領(lǐng)域得到廣泛應(yīng)用。最新的MPEG-4是下一代全球多媒體標(biāo)準(zhǔn)。MPEG-4的傳輸速率在4800～6400b/s之間，分辨率為176?×?144，可以利用很窄的帶寬通過幀重建技術(shù)壓縮和傳輸數(shù)據(jù)，從而能以最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。與MPEG-1和MPEG-2相比，MPEG-4更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控。它將在數(shù)字電視、動(dòng)態(tài)圖像、互聯(lián)網(wǎng)、實(shí)時(shí)多媒體監(jiān)控、移動(dòng)多媒體通信、Internet/Intranet上的視頻流與可視游戲、DVD上的交互多媒體應(yīng)用等方面獲得廣泛的應(yīng)用。

MPEG-7標(biāo)準(zhǔn)的正式名稱叫“多媒體描述接口”，并于2001年11月發(fā)布，是為了解決多媒體內(nèi)容的檢索問題。通過這個(gè)標(biāo)準(zhǔn)，MPEG希望對(duì)以各種形式存儲(chǔ)的多媒體結(jié)構(gòu)有一個(gè)合理的描述，通過這個(gè)描述，用戶可以方便地根據(jù)內(nèi)容訪問多媒體信息。在MPEG-7體系下，用戶可以更加自由地訪問媒體。MPEG-7的目的在于提供一個(gè)標(biāo)準(zhǔn)化的核心技術(shù)，以便描述多媒體環(huán)境下的視頻和音頻內(nèi)容，最終使視頻和音頻搜集像文本搜集一樣簡(jiǎn)單方便。MPEG-7的多媒體內(nèi)容描述功能對(duì)MPEG-1、MPEG-2、MPEG-4起到性能提高和功能擴(kuò)展的作用。

MPEG-21標(biāo)準(zhǔn)的正式名稱為“多媒體框架”，是一個(gè)支持通過異構(gòu)網(wǎng)絡(luò)和設(shè)備，使用戶透明方便地使用多媒體資源的標(biāo)準(zhǔn)，其目的是建立一個(gè)交互的多媒體對(duì)象，實(shí)現(xiàn)多種業(yè)務(wù)模型，包括對(duì)版權(quán)和交易的自動(dòng)管理，對(duì)內(nèi)容使用者隱私的尊重等。MPEG-21提供了一種以高效、透明和可互操作的方式，在用戶間實(shí)現(xiàn)交換、接入、消費(fèi)、貿(mào)易和控制DI(theDigitalItem)的解決方案。

1.5視頻數(shù)據(jù)壓縮技術(shù)

1.5.1視頻數(shù)據(jù)的壓縮原理

1．圖像(視頻)信號(hào)壓縮的可能性

在通信與數(shù)字電視系統(tǒng)中，由于活動(dòng)圖像信號(hào)的數(shù)據(jù)量較大，在信號(hào)傳輸過程中占有的帶寬較寬，因此必須進(jìn)行壓縮處理。圖像信號(hào)之所以能夠進(jìn)行壓縮處理，主要基于以下幾個(gè)方面的原因。

1)圖像信號(hào)中存在冗余度

圖像信號(hào)中的冗余度主要存在于圖像信號(hào)的結(jié)構(gòu)和統(tǒng)計(jì)兩個(gè)方面。在電視圖像信號(hào)的結(jié)構(gòu)中，其在空間和時(shí)間上有很強(qiáng)的相關(guān)性，或者說，其幀內(nèi)與幀間存在很強(qiáng)的相關(guān)性，信號(hào)中的冗余度很大，可以對(duì)其進(jìn)行壓縮處理，而在解碼后這些冗余度還可以進(jìn)行不失真的恢復(fù)。

2)利用人眼的視覺特性

對(duì)于圖像信號(hào)，可以利用人眼的視覺特性對(duì)圖像數(shù)據(jù)進(jìn)行壓縮，即在不被主觀感覺察覺的容限范圍內(nèi)，盡量減少表示信號(hào)的精度，甚至忽略某些信息。例如，可以按照?qǐng)D像信號(hào)各部分的特點(diǎn)決定對(duì)它的采樣頻率和量化等級(jí)，盡量做到在主觀視覺的容限之內(nèi)降低圖像信號(hào)的傳輸速率。

除此之外，也可以利用人眼對(duì)圖像信號(hào)中亮度信號(hào)敏感，而對(duì)色度信號(hào)不敏感的不同感覺，對(duì)圖像信號(hào)進(jìn)行壓縮處理。

3)有規(guī)律的重復(fù)信號(hào)可壓縮

視頻信號(hào)中的行、場(chǎng)同步，行、場(chǎng)消隱等周期重復(fù)信號(hào)占有相當(dāng)?shù)谋戎?，圖像信號(hào)僅存在于場(chǎng)掃描過程中每行掃描的正程期間。因此，可以對(duì)這類有規(guī)律的、重復(fù)的、固定不變的信號(hào)在編碼時(shí)按照某種方法進(jìn)行壓縮處理。

2．MPEG標(biāo)準(zhǔn)的圖像格式與參數(shù)

1)圖像的分割

通常，把一幅完整的圖像稱為一幀，每幀PAL制式和NTSC制式的電視信號(hào)分別由625行和525行組成，對(duì)應(yīng)的幀頻分別為25Hz和30Hz。為對(duì)圖像進(jìn)行數(shù)字化處理，必須首先對(duì)每幀圖像進(jìn)行分割，即將一幀圖像橫向切成若干條(PAL制式18條，NTSC制式15條)，每一條稱為一片(slice)；然后，再將每一片縱向切成22塊(PAL制式和NTSC制式)，稱之為宏塊或大塊(macroblock)。這樣，在625行制中，每幀圖像分成8?×?22?

=?396個(gè)宏塊；在525行制中，每幀分成15?×?22?=?330個(gè)宏塊。在MPEG標(biāo)準(zhǔn)中，宏塊是對(duì)圖像處理的基本單元。在每個(gè)宏塊中的彩色圖像，又可以用一個(gè)亮度Y和兩個(gè)色差信號(hào)(CR、CB)來表示。根據(jù)大面積著色原理，在圖像的傳送過程中，亮度信號(hào)的清晰度遠(yuǎn)高于對(duì)色差信號(hào)的清晰度，因此，通常又把亮度宏塊平均分成4小塊。最后再將2個(gè)色差塊和4個(gè)亮度小塊(共6個(gè)塊)分成64個(gè)(8?×?8?=?64)像素小塊，每個(gè)像素對(duì)應(yīng)一個(gè)采樣點(diǎn)，而一個(gè)宏塊中的色差信號(hào)采樣點(diǎn)與每一個(gè)小塊亮度信號(hào)的采樣點(diǎn)相同。像素是構(gòu)成圖像的最小單元，圖像的清晰度主要取決于像素的多少，像素越多，圖像分得越細(xì)，清晰度就越高，反之越低。圖1-4是MPEG標(biāo)準(zhǔn)的圖像分割示意圖。在對(duì)圖像進(jìn)行數(shù)字處理時(shí)，每個(gè)像素用8位二進(jìn)制數(shù)表示，這樣每個(gè)采樣點(diǎn)的亮度信號(hào)便可獲得28?=?256個(gè)等級(jí)，具有足夠高的精度。但在量化過程中，也同樣會(huì)產(chǎn)生量化噪聲。對(duì)單極性的視頻信號(hào)，其信噪比(S/N)可用公式(1-2)來表示。圖1-4圖像分割示意圖

2)圖像格式的基本參數(shù)

(1)視頻信號(hào)數(shù)據(jù)傳輸?shù)拇a率。

在視頻信號(hào)的數(shù)字化中，DVD采用4∶2∶2標(biāo)準(zhǔn)，VCD采用2∶1∶1標(biāo)準(zhǔn)。前者的采樣頻率為

Y∶CR∶CB=13.5MHz∶6.75MHz∶6.75MHz

后者的采樣頻率為

Y∶CR∶CB=6.75MHz∶3.375MHz∶3.375MHz在4∶2∶2標(biāo)準(zhǔn)中，為使視頻信號(hào)有6MHz的帶寬，即約有500線的清晰度，相應(yīng)像素的規(guī)定為：625/50制時(shí)每行是864個(gè)，525/60制時(shí)每行是858個(gè)。在數(shù)字電視中，為使625/50制和525/60制相兼容，國際標(biāo)準(zhǔn)定義了有效行，并規(guī)定有效行的亮度信號(hào)的像素都為720個(gè)。有效行是指亮度信號(hào)中的圖像信號(hào)部分有了圖像信號(hào)，消隱信號(hào)和同步信號(hào)可以在后期編排上去。對(duì)每一幀圖像，625/50制的有效行為576行，525/60制的有效行為480行。這樣，對(duì)每一幀的亮度像素?cái)?shù)，625/50制的為576?×?720，525制的為480×720，再加上兩個(gè)色差信號(hào)的像素(625/50制的為288?×?360?×?2，525/60制的為240?×?360

?×?2)。于是可得每秒鐘要傳輸?shù)南袼財(cái)?shù)為

(576?×?720?+?288?×?360?×?2)?×?25?=?15.552?×?106

或

(480?×?720?+?240?×?360?×?2)?×?30?=?15.552?×?106

由于每個(gè)像素用8位二進(jìn)制數(shù)表示，所以傳輸圖像數(shù)據(jù)的碼率為

碼率?=?像素傳輸速率?×?8位/像素

=?15.552?×?106像素/s?×?8位/像素

=?124.416Mb/s在2∶1∶1標(biāo)準(zhǔn)中，MPEG-1標(biāo)準(zhǔn)采用折半的方法，即按照廣播級(jí)標(biāo)準(zhǔn)，將每一幀的有效行數(shù)和有效行的像素?cái)?shù)都取一半。通過同樣的分析可得到傳輸數(shù)據(jù)的碼率為

碼率?=?像素傳輸速率?×?8位/像素

=?(288?×?352?+?144?×?176?×?2)?×?25?×?8

=?30.41286Mb/s

(2)?MPEG視頻標(biāo)準(zhǔn)的圖像格式。

根據(jù)上述分析，MPEG-2與MPEG-1的圖像格式參數(shù)如表

1-2所示。

3)?3種幀

在MPEG視頻標(biāo)準(zhǔn)中，圖像壓縮基于圖像中的兩種特性：空間相關(guān)性和時(shí)間相關(guān)性。這兩種相關(guān)性使得圖像中存在大量的冗余信息。如果能將這些冗余信息去除，只保留少量非相關(guān)信息進(jìn)行傳輸，就可以大大節(jié)省傳輸頻帶。而接收機(jī)利用這些非相關(guān)信息，按照一定的解碼算法，可以在保證一定的圖像質(zhì)量的前提下恢復(fù)原始圖像。

按照MPEG標(biāo)準(zhǔn)，活動(dòng)圖像的畫面可分為3種類型，分別稱為幀內(nèi)編碼幀(IntraCodedFrame，即I幀)、前向預(yù)測(cè)幀(PredictiveCodedFrame，即P幀)和雙向預(yù)測(cè)幀(BidirectionallyPredictiveCodedFrame，即B幀)。

I幀圖像采用幀內(nèi)編碼方式，即只利用單幀圖像內(nèi)的空間相關(guān)性，而沒有利用時(shí)間相關(guān)性。I幀使用幀內(nèi)壓縮，不使用運(yùn)動(dòng)補(bǔ)償，它以靜止圖像壓縮的方法(DCT編碼等)進(jìn)行處理。I幀與其前后相鄰的圖像之間具有獨(dú)立性，其壓縮信號(hào)不但全部記錄在光盤上，而且還是產(chǎn)生其他兩種幀圖像的基礎(chǔ)。I幀主要用于接收機(jī)的初始化和信道的獲取，以及節(jié)目的切換和插入，I幀圖像的壓縮倍數(shù)在3種幀中最小，數(shù)據(jù)量則是3種幀中最大的。I幀圖像是周期性出現(xiàn)在圖像序列中的，出現(xiàn)頻率可由編碼器選擇。

P幀圖像采用幀間編碼方式，即同時(shí)利用了空間和時(shí)間上的相關(guān)性。P幀圖像只采用前向時(shí)間預(yù)測(cè)，只傳送與它前面I幀的差值信息(又稱預(yù)測(cè)差圖像)，該差值信息可看成是運(yùn)動(dòng)圖像的變化部分，其數(shù)據(jù)量要比I幀少得多。如果P幀前面不是I幀而是P幀，同樣也可以由它前面的P幀獲得預(yù)測(cè)誤差而形成新的P幀信號(hào)。P幀的獲得如圖1-5(a)所示。

B幀圖像采用雙向時(shí)間預(yù)測(cè)，它是根據(jù)其前面的I幀(或P幀)與后面的P幀來獲得預(yù)測(cè)誤差的。由于B幀傳送它前面的I幀(或P幀)與后面的P幀之間的預(yù)測(cè)誤差，因此可以大大提高壓縮倍數(shù)。B幀的信息量一般要比P幀少，其壓縮率在3種幀中是最大的。值得注意的是，由于B幀圖像采用了未來幀作為參考，因此MPEG-2編碼碼流中圖像幀的傳輸順序和顯示順序是不同的。在I幀和P幀或P幀與P幀之間一般可以插入兩個(gè)B幀，B幀的獲得如圖1-5(b)所示。圖1-5預(yù)測(cè)幀的獲得示意圖順便指出，每幀圖像輸入的順序是按照時(shí)間出現(xiàn)的順序即IBPBP或IBBPBP排列的。為了便于從I幀和P幀獲得B幀，以及解碼時(shí)便于從I、P幀插補(bǔ)到B幀，在編碼時(shí)首先應(yīng)對(duì)輸入圖像的幀進(jìn)行重排，使其順序變?yōu)镮PBPB或IPBBPB。

4)圖像數(shù)據(jù)的比特流分層格式

MPEG-1和MPEG-2的視頻結(jié)構(gòu)是相同的。為更好地表示編碼數(shù)據(jù)，MPEG用句法對(duì)視頻數(shù)據(jù)規(guī)定了層次結(jié)構(gòu)，共分為6個(gè)層次，自上到下分別是：圖像序列層、圖像組層(GOP)、圖像層、像條層(片層或宏塊條)、宏塊層和像塊層。

各層之間的關(guān)系如圖1-6所示。圖1-6圖像數(shù)據(jù)的層次第一層是像塊層，由8像素?×?8行的一組亮度成分或相應(yīng)的色差成分構(gòu)成，在編碼中它是DCT處理的基本單元。注意，亮度像塊顯示的圖像相當(dāng)于色度像塊形式圖像的1/4大小。

第二層是宏塊層，由16?×?16像素的亮度成分和對(duì)應(yīng)的兩個(gè)色度分量的8?×?8像素的成分構(gòu)成。一個(gè)宏塊有4個(gè)亮度像塊和2個(gè)色差像塊(CR、CB)，這是進(jìn)行運(yùn)動(dòng)預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償?shù)膯卧?。在MPEG-1中圖像的色度格式是4∶2∶0，而在MPEG-2中圖像的色度格式還包括4∶2∶2和4∶4∶4格式，因此，一個(gè)宏塊又由許多8?×?8的塊組成。

3種格式的宏塊結(jié)構(gòu)如圖1-7所示，其中的4∶2∶0格式由6個(gè)塊組成，包括4個(gè)亮度塊和兩個(gè)色度塊；4∶2∶2格式由8個(gè)塊組成，包括4個(gè)亮度塊、兩個(gè)CB塊和兩個(gè)CR塊；4∶4∶4格式由12個(gè)塊組成，包括4個(gè)亮度塊、4個(gè)CB塊和4個(gè)CR塊。圖1-73種格式的宏塊結(jié)構(gòu)第三層是像條層，它是在一幀圖像中從左到右分割下來的完整的一條圖像，也是若干個(gè)宏塊的集合。在信號(hào)處理中，片是同步恢復(fù)單元。

第四層是圖像層(幀)，它是由若干個(gè)片組成的一幅完整的圖像。這種圖像可以是幀內(nèi)編碼圖像(I圖像)，也可以是預(yù)測(cè)編碼圖像(P圖像)。圖像層是構(gòu)成活動(dòng)圖像的基本單位，在信號(hào)處理中，它是基本的編碼單元。第五層是圖像組(幀組)層，它由幾幅編碼的圖像組成(PAL制為5幅，NTSC制為6幅)，每個(gè)圖像組是視頻隨機(jī)存儲(chǔ)單元。

第六層是圖像序列層，它體現(xiàn)了連續(xù)圖像的比特流。用一個(gè)序列頭開始，包含一個(gè)或多個(gè)幀組，以一個(gè)序列尾碼結(jié)束。序列層是節(jié)目?jī)?nèi)容的隨機(jī)存儲(chǔ)單元。1.5.2MPEG視頻編/解碼原理

1．MPEG視頻編碼原理

MPEG算法既具有很高的壓縮比，又可以保持很好的圖像質(zhì)量，這單靠幀內(nèi)編碼是不能完全實(shí)現(xiàn)的。在MPEG壓縮編碼中，主要是通過DCT變換和運(yùn)動(dòng)預(yù)測(cè)技術(shù)來壓縮空間冗余和時(shí)間冗余的，即首先通過運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償去除圖像序列間的時(shí)間冗余，然后再通過DCT變換將差值信號(hào)的空間冗余去除，使系數(shù)能量集中在低頻部分，最后通過量化和可變字長編碼最終達(dá)到壓縮編碼的目的。

MPEG視頻編碼器的組成框圖如圖1-8所示，它主要由幀畫面的重新排列、運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)器、運(yùn)動(dòng)估計(jì)器、離散余弦變換器(DCT)、離散余弦反變換器(DCT-1)、量化自適應(yīng)器(Q)和逆量化器(Q-1)、幀存儲(chǔ)器、視頻緩存器等組成。這一框圖對(duì)MPEG-1與MPEG-2均適用。其主要區(qū)別在于MPEG-2采用了自適應(yīng)場(chǎng)/幀處理技術(shù)，通過對(duì)物體運(yùn)動(dòng)特性和圖像細(xì)節(jié)的豐富程度做出判定來選擇場(chǎng)處理或幀處理，因此只需將MPEG-1視頻編碼器框圖中的“自適應(yīng)量化器”和“編碼統(tǒng)計(jì)處理”部分改為“編碼控制”即可。因?yàn)镻幀是由I幀獲得的，而B幀又是根據(jù)I幀(或P幀)和P幀獲得的，因此，在編碼時(shí)首先要對(duì)輸入的幀進(jìn)行重排，即把P幀排在B幀前面。例如，若幀重排前的順序是IBBPBP，則重排后的順序?yàn)镮PBBPB，這就是在編碼器內(nèi)幀的編碼順序。

運(yùn)動(dòng)補(bǔ)償是一種把現(xiàn)在的圖像部分看成是由前面的圖像及變動(dòng)的差值部分構(gòu)成的預(yù)測(cè)技術(shù)，它是利用消去時(shí)間冗余度的部分來提高壓縮比的技術(shù)。運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)算法在宏塊級(jí)中分別進(jìn)行幀內(nèi)預(yù)測(cè)、前向預(yù)測(cè)、后向預(yù)測(cè)和平均預(yù)測(cè)，與幀內(nèi)編碼相比，運(yùn)動(dòng)補(bǔ)償可改善壓縮比大約3倍。圖1-8視頻編碼器組成框圖具體的編碼過程如下所述。

1)?I幀編碼

當(dāng)輸入I幀時(shí)，開關(guān)S1、S2、S4分別置于上方的位置，S3置于左側(cè)，編碼器對(duì)I幀進(jìn)行編碼。具體編碼時(shí)，首先進(jìn)行幀改組，即把圖像橫向切割成許多條(片)，每片寬度為16個(gè)像素，再將第一條縱向切為每16個(gè)像素長的各個(gè)小段，這樣就得到16?×?16的像素構(gòu)成的塊，稱為宏塊。宏塊可以分成4部分，每一部分為8?×?8?=?64像素的區(qū)塊。對(duì)各宏塊進(jìn)行DCT變換后，空域中64個(gè)像素的亮度或色度數(shù)值就變換成頻域中的64個(gè)頻率系數(shù)，其中高頻系數(shù)反映的是圖像細(xì)節(jié)，直流成分代表圖像的平均亮度。變換后的頻率系數(shù)送量化自適應(yīng)器，并參

人人文庫> 全部分類> 教育資料 > 中學(xué)教育

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《數(shù)字視聽技術(shù)》課件第1章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《數(shù)字視聽技術(shù)》課件第1章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔