第六講.視頻及圖像處理技術_第1頁
第六講.視頻及圖像處理技術_第2頁
第六講.視頻及圖像處理技術_第3頁
第六講.視頻及圖像處理技術_第4頁
第六講.視頻及圖像處理技術_第5頁
已閱讀5頁,還剩122頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

課程內(nèi)容視頻及圖像處理技術概述視頻壓縮技術概述多媒體數(shù)據(jù)庫概述多媒體網(wǎng)絡通信技術概述1夏榆濱,xiayb@82338017關于本課的特點面寬:數(shù)學算法、軟件系統(tǒng)、計算機硬件、網(wǎng)絡技術、數(shù)據(jù)庫技術,心理學……學習的思路:系統(tǒng)的視角理解各個知識點的關系,掌握關鍵概念和理論。科研方法:宏觀定位與理清思路,理解具體問題,進行調(diào)查分析,仔細學習與深入研究第6章

視頻及圖像處理技術概述4術語說明:標準計算機術語--參考國家科學技術名稱審定委員會推薦術語標準用法非標準用法圖像(image)圖象像素象素視像/數(shù)字電視圖像(video)視頻圖象,視頻聲音(audio)音頻本課程中仍會使用“視頻”、“音頻”這樣的詞語

由于非標準用法已經(jīng)廣泛流傳,所以,考慮到理解和學習相關參考資料的問題5主要內(nèi)容:6.1視頻的基本概念6.2視頻技術的應用6.3顏色6.4視頻分類與處理6.5數(shù)字圖像處理與機器視覺技術簡介66.1視頻的基本概念多媒體數(shù)據(jù)聲音文字圖像視頻(視像)……8視頻是一個重要信息來源:人獲取的信息約有85%來自眼睛,10%來自耳朵,其余5%來自其它器官96.1視頻的基本概念顏色圖像時變圖像106.1視頻的基本概念(續(xù))視頻(video):是一種隨時間變化的圖像這種時變圖像是一種時-空(顏色)密度模式(spatial-temporalintensitypattern)可以表示為s(x,y,t),其中(x,y)是空間變量,t是時間變量(x,y)t116.1視頻的基本概念(續(xù))數(shù)字視頻:視頻圖像成分的離散化或序列化(便于計算機處理)采樣:連續(xù)坐標的離散化量化:顏色強度數(shù)值的離散化圖像數(shù)字圖像離散化序列圖像數(shù)字視頻離散化126.1視頻的基本概念(續(xù))例,視頻圖像離散化:

空間采樣:

1024*768

象素Pixel

分辨率Resolution

幅值量化:

256級,28級,8bit,

灰度級Greylevel

幀率:

30幀/秒136.1視頻的基本概念(續(xù))原始波形采樣頻率采樣數(shù)據(jù)重建波形關于采樣頻率的選?。鹤銐蚋叩牟蓸宇l率146.1視頻的基本概念(續(xù))原始波形采樣頻率采樣數(shù)據(jù)重建波形???過低的采樣頻率生活實例:迪斯科舞廳的身影。聲帶震動觀察。電影汽車輪子變慢、停轉甚至倒轉?!?5166.1視頻的基本概念(續(xù))一維信號電壓流量txy二維圖像二維采樣定理(Nyguist準則)

采樣頻率需高于或等于信號最高頻率的2倍采樣頻率對數(shù)字視頻效果的影響幀圖像精細度運動效果17186.1視頻的基本概念(續(xù))圖像顏色數(shù):一幅位圖圖像中最多能使用的顏色數(shù)二值圖(亮,暗兩值)灰度圖(2n)如n=8,則256個灰度彩色圖

(2nx2nx

2n)如16,777,216種顏色196.1視頻的基本概念(續(xù))分辨率:640×480分辨率:80×60分辨率206.2視頻技術的應用216.2視頻技術的應用電子信息產(chǎn)品

數(shù)字音視頻產(chǎn)業(yè)是電子信息產(chǎn)業(yè)的重要組成部分,滿足人們工作和生活中的視聽需要,其產(chǎn)值約占信息產(chǎn)業(yè)產(chǎn)值的三分之一。有預測說,數(shù)字視音頻產(chǎn)業(yè)年產(chǎn)值2010年:達到1.5萬億元226.2視頻技術的應用(續(xù))廣播電視方面的應用形式電視廣播(地面、衛(wèi)星)有線電視(CATV:CommunityAntennaTV)數(shù)字視頻廣播(DVB:DigitalVideoBroadcast)交互式電視(ITV:InteractiveTV)高清晰度電視(HDTV:HighDefinitionTV)……236.2視頻技術的應用(續(xù))通信方面的應用形式可視電話(Videophone):3G手機視頻會議(Videoconferencing)視頻點播(VOD:VideoOnDemand)視頻數(shù)據(jù)庫246.2視頻技術的應用(續(xù))個人生活與娛樂方面的應用形式錄象節(jié)目VCD(VideoCompactDisk)DVD(DigitalVersatileDisk)電視購物家庭攝象視頻游戲256.2視頻技術的應用(續(xù))音視頻編碼音視頻解碼加擾加密解擾解密物理介質上的信號傳輸調(diào)制發(fā)射解調(diào)接收……原始無壓縮節(jié)目……《信源編碼標準》……壓縮數(shù)據(jù)包……《信道標準》演播室拍攝、錄制、編輯接收機顯示、交互、………數(shù)字電視……行業(yè)標準國際/國家標準26顏色圖像時變視頻視頻技術中的關鍵概念-----顏色搞清楚彩色空間表示以及它們之間的轉換,是彩色圖形、靜態(tài)圖像、動態(tài)圖像(視頻)處理算法的基礎276.3顏色286.3顏色顏色的概念某一景物的顏色,是在特定光源照射下,所反射的某些可見光譜成份在人眼所引起的視覺效果,稱彩色視覺(colorvision)或者彩色感。要點一:是人眼主觀和客觀光源及其反射、吸收相結合所引起的生理—物理過程要點二:通常是建立在太陽光源基礎上的296.3顏色(續(xù))太陽光中顏色的組成-----太陽光譜1672年牛頓用三棱鏡將太陽光(白光)分解成紅、橙、黃、綠、青、藍、紫(品紅)順序排列漸變的彩帶,這種現(xiàn)象稱作色散(dispersion)306.3顏色(續(xù))顏色與光的(物理)本質顏色是對光的彩色感,光是由光波組成的,光波則是一種具有一定頻率范圍的電磁輻射??梢姽獠l率范圍:380nm~780nm316.3顏色(續(xù))(物理概念上的)單色光定義只具有單一波長的色光或者所占波譜寬度小于5nm的色光,稱作單色光326.3顏色(續(xù))顏色與光波波長的關系-----生理-物理一定波長的光與某種顏色感相對應;相同顏色感對應于一定波長范圍的光,即色對光波的反映關系并不是單一的。色光名稱紫藍青綠黃綠黃橙紅波長范圍(nm)380-430430-470470-500500-530530-560560-590590-620620-780336.3顏色(續(xù))AM短波TVFM雷達波780nm 380nm346.3顏色(續(xù))國際照明委員會(CIE)對顏色的描述顏色的三要素色調(diào)(hue):彩色的感覺,反映顏色的種類。色調(diào)與光波的波長有關,不同的波長反映不同的顏色感。飽和度(saturation):顏色的純度/深淺/濃淡,即摻入白光的程度,摻入白光多,飽和度就低,反之飽和度就高。白光的飽和度為0。亮度(brightness):顏色作用于人眼所引起的明暗視覺程度。對于色調(diào)和飽和度固定的光而言,當其全部能量增強時,亮度增加,因此亮度與光功率有關。人眼的視覺包括光覺和色覺,也就是亮度視覺和彩色視覺356.3顏色(續(xù))36顏色在視頻技術中的應用關鍵

-----人工顏色生成的基礎同色異譜現(xiàn)象相加混色RGB三基色原理空間混色效應時間混色效應相減混色6.3顏色(續(xù))376.3顏色(續(xù))同色異譜現(xiàn)象:由不同的光譜成分混合出相同顏色的現(xiàn)象,稱為同色異譜如波長在500-530nm范圍的光譜,能引起“相同的綠色感”,故彩色感與波長不是單值關系此外,如果用波長540nm的綠光和700nm的紅光按照一定比例混合,同時作用于人眼時,可以得到相當于580nm的黃光色感;此時,眼感分辨不出是單色黃光,還是由紅、綠兩種光混合而成的黃光。386.3顏色(續(xù))生理學實驗證明,人眼中存在三種錐體,大體上相當于紅、綠、藍三基色接收器。感光細胞(photoreceptorcells):1.桿狀細胞(rod):單色夜視2.錐狀細胞(cone):彩色視覺紅(red)綠(green)藍(blue)396.3顏色(續(xù))406.3顏色(續(xù))同色異譜的應用同色異譜現(xiàn)象為人工仿造自然界彩色提供了理論依據(jù),人們可以用少數(shù)幾種顏色的混合色來代替光譜色,同樣可以還原出自然景物的色彩。例如,RGB三基色原理、空間混色、時間混色、CMYK相減混色416.3顏色(續(xù))同色異譜現(xiàn)象的生理學依據(jù)人眼中存在三種(紅、綠、藍)錐體,對不同光譜成分有時具有相似的色感。426.3顏色(續(xù))基色(primarycolor)基色是指互為獨立的單色,任一基色都不能由其他兩種基色混合產(chǎn)生(類似空間的基向量)。RGB三基色(tri-chrominanceprimary)原理三基色是根據(jù)人眼對彩色視覺的大量實驗證明,選擇紅色、綠色和藍色這三種相互獨立的基色,按照不同比例組合,可以配出的大部分顏色與自然界的色彩相符,能引起人眼各種不同的彩色感。同樣絕大多數(shù)顏色也可以分解成紅綠藍三種色光。436.3顏色(續(xù))三基色圖446.3顏色(續(xù))空間混色效應(effectofspace-mixedcolor)空間混色效應的現(xiàn)象:當兩種或者多種顏色細節(jié)(細點或者細線)在空間排列足夠近時,即,人在一定距離以外觀看,對顏色細節(jié)的分辨角小到一定范圍時,人眼就分辨不出各自不同的顏色,而是幾種顏色的混合彩色感。生理依據(jù):人眼空間分辨能力有限??臻g混色效應的應用:此效應是大部分視頻顯示設備的工作基礎456.3顏色(續(xù))空間混色效應示例CRT/LCD…466.3顏色(續(xù))時間混色效應(effectoftime-mixedcolor)現(xiàn)象:將三種基色光,按時間順序輪流投射到同一表面上,只要輪換速度足夠快,將會產(chǎn)生相加混色的類似效果。生理依據(jù):視覺殘留特性。應用:DLP476.3顏色(續(xù))以1顆1024*768的XGA等級DMD來說,約9平方公分左右,厚度不超過0.5公分,不過,這塊小小的DMD卻包含了1024*768個16*16微米的鏡子,這些鏡子利用角度的差異(±10度)來表示開或關的狀態(tài),每塊DMD都有對應的動態(tài)隨機記憶體SRAM,用以記憶并處理每塊鏡子的偏向角度,除了開關的單純2元變化外,還能在±10度之間這20度的差距內(nèi),變化出256段的角度。新的DLP投影機有采用三片DLP合成的方式形成彩色影像486.3顏色(續(xù))CMYK相減混色當三種基本顏色等量相減時得到黑色;等量黃色(Y)和品紅(M)相減而青色(C)為0時,得到紅色(R);等量青色(C)和品紅(M)相減而黃色(Y)為0時,得到藍色(B);等量黃色(Y)和青色(C)相減而品紅(M)為0時,得到綠色(G)。

依據(jù):濾掉某種顏色的光應用:印刷496.3顏色(續(xù))顏色空間的概念:是表示(定義)顏色的一種數(shù)學方法。此空間中的一個位置代表一種顏色。人:使用--色調(diào)、飽和度和亮度(Hue,SaturationandBrightness)來描述顏色;顯示設備:使用--紅、綠和藍(Red,GreenandBlue)熒光粉的發(fā)光量來描述顏色;打印與印刷:使用--青色、品色、黃色(和黑色)(Cyan,Magenta,Yellow(andBlack))的反射與吸收量來描述產(chǎn)生的顏色。顏色空間坐標:通常用三個參數(shù)(三維坐標)來描述。506.3顏色(續(xù))RGB顏色空間根據(jù)三基色原理,任意給定的彩色光F的配色可以用如下關系式表達為:F=r[R]+g[G]+b[B]其中系數(shù)r、g、b稱為(絕對)三色系數(shù)(tri-colorcoefficient)或者三色坐標值(tri-colorcoordinatevalue)[R]、[G]、[B]表示各個基色的單位量516.3顏色(續(xù))RGB顏色空間(CIE1931RGB)國際照明委員會(CIE)規(guī)定把波長為700nm,光通量為1光瓦(680lm,流明)的紅光作為一個紅基色單位,用1[R]表示;把波長為546.1nm,光通量為4.5907光瓦的綠光作為一個綠基色單位,用1[G]表示;把波長為435.8nm,光通量為0.0601光瓦的藍光作為一個藍基色單位,用1[B]表示。這樣,F(xiàn)E白=1[R]+1[G]+1[B]依據(jù):人眼對同樣光通量的三種基色的感覺強弱不同。52三色刺激值RGB顏色匹配曲線536.3顏色(續(xù))r-g色度圖(1)為了方便,將RGB基色制公式作歸一化處理: (r+g+b=1)

對于每種色光來說,只要RGB三個分量中的兩個確定了,余下的分量自然是確定的。(事實上,顏色是由r、g、b的比例確定)于是,得到一個二維的r-g

標準色度圖(見下一頁)546.3顏色(續(xù))r-g色度圖(2)556.3顏色(續(xù))x-y標準色度圖(CIE1931XYZ/xyY)(1)按照r-g色度圖,會出現(xiàn)負參數(shù),這對相加合成顏色的計算不利所以將r-g色度圖進行變換、歸一、投影,得到x-y標準色度圖X 0.489989 0.310008 0.2 RY = 0.176962 0.812400 0.01 GZ 0.000000 0.010000 0.99 B

X Y Z X+Y+Z X+Y+Z

X+Y+Zx=y=z=566.3顏色(續(xù))576.3顏色(續(xù))x-y標準色度圖(1)所有可見光波長作用于人眼引起色感的光譜色,都在舌形曲線上,這條曲線叫做譜色曲線或者光譜軌跡舌形曲線上的譜色光,飽和度為100%;而白色E點的色飽和度為0;舌形曲線內(nèi)各點越靠近譜色曲線,色飽和度越高(色越濃);越靠近E點,色飽和度越低(色越淡)586.3顏色(續(xù))x-y標準色度圖(2)譜色曲線上任意一點和中間E點的連線稱作等色調(diào)線(equi-colorhueline),即該線上各點色調(diào)均相同,但線上各點色飽和度不同,越靠近中點E,飽和度越低,反之越高596.3顏色(續(xù))x-y標準色度圖(3)當在舌形曲線內(nèi)任取三點作基色時,由此三基色所作三角形,其所混合的全部彩色都應包括在三角形內(nèi)由圖可見,使用相加混合色法,只能夠表示三角形區(qū)域內(nèi)部的顏色,對于三角形外部區(qū)域的顏色,主要是飽和度較高的藍綠色光和黃單色光則不能表示606.3顏色(續(xù))其它顏色空間(1)電視顏色空間:減少色度圖中色差與感知的非線性,實現(xiàn)黑白圖像與彩色圖像相對獨立,亮度和色彩單獨編碼可以降低色彩編碼數(shù)據(jù)量。YUV顏色空間(用于多種制式電視信號),如下所示亮度Y=0.30R+0.59G+0.11B色差U=R-Y,V=B-Y色差感知較均勻一般可以通過如下數(shù)據(jù)實例求得不同的轉換矩陣:采用的白光光源: D65(illuminatesD)(xn,yn)=(*,*)采用的基色坐標:

R:(xr,yr,zr)=(*,*,*) G:(xg,yg

,zg)=(*,*,*) B:(xb,yb,zb)=(*,*,*)616.3顏色(續(xù))其它顏色空間(1)電視顏色空間:減少色度圖中色差與感知的非線性,實現(xiàn)黑白圖像與彩色圖像相對獨立,亮度和色彩單獨編碼可以降低色彩編碼數(shù)據(jù)量。YIQ顏色空間(用于NTSC制式電視信號)亮度Y同PAL制式I=0.60R+0.28G-0.32B,Q=0.21R-0.52G+0.31B考慮了人眼分辨紅黃之間顏色變化能力最強,而分辨藍紫之間顏色變化能力最弱的視覺特性Y’CbCr/Y’Cb’Cr’顏色空間(用于數(shù)字電視)由YUV顏色空間派生而來Y’定義為[16,235]范圍內(nèi)的8位二進制數(shù)據(jù)Cb’和Cr’定義為[16,240]范圍內(nèi)的8位二進制數(shù)據(jù)626.3顏色(續(xù))其它顏色空間(2)HSI顏色空間直接使用顏色三要素色調(diào)H(hue)飽和度S(saturation)光強度I(intensity)HSI顏色立體圖636.3顏色(續(xù))646.4視頻分類和處理656.4視頻分類和處理1884年,德國人P.G.尼普科夫發(fā)明了可實現(xiàn)機械電視的掃描盤。1897年德國人K.F.布勞恩發(fā)明了陰極射線管。1925年英國的J.L.貝爾德表演了實用的機械掃描電視。1930年左右英國、前蘇聯(lián)等國家進行了機械電視的廣播。1933年美國的V.K.茲沃賴金發(fā)明了光電攝像管,可以把光圖像變成電信號,為真正的電子電視奠定了基礎。1936年貝爾德電視公司在英國開始了電子方式的黑白電視廣播,從此開始了電子電視的時代。1954年美國正式開播NTSC兼容制彩色電視。1967年前聯(lián)邦德國正式廣播PAL兼容制彩色電視,同年,法國和前蘇聯(lián)開播了SECAM兼容制彩色電視。從20世紀90年代開始,出現(xiàn)了數(shù)字電視廣播標準,如歐洲的DVB系統(tǒng)、美國的ATSC系統(tǒng)、日本的ISDB系統(tǒng)等。66古董機型671939年的GEHM1711929年的Semivisor

6869本節(jié)主要內(nèi)容視頻的一般分類:模擬視頻(AnalogVideo)數(shù)字視頻(DigitalVideo)視頻的處理方式:錄制(Record)、編輯(Edit)存儲(Store)、傳輸(Transfer)回放(Playback)檢索(Retrieve)706.4.1模擬視頻什么是模擬視頻?以模擬電信號的形式來記錄視像依靠模擬調(diào)幅的手段在空間傳播視像使用盒式磁帶錄象機將視頻作為模擬信號記錄存放在磁帶上7模擬視頻信號模擬視頻信號的形成方法模擬視頻信號f(t)是一維時間變量的電信號它是通過對s(x,y,t)在時間坐標t、水平分量x和垂直分量y上采樣得到的周期性地采樣稱之為掃描(scanning)最常用的掃描方法是逐行掃描(progressivescanning)隔行掃描(interlacedscanning)7模擬視頻信號(續(xù))對“一幅畫面”的掃描采樣結果形成幀(frame)逐行掃描一次一幀隔行掃描每幀需要掃描兩次,稱作奇數(shù)場和偶數(shù)場(field)A到B為一行,B到C為水平回掃,D到E和F到A為垂直回掃隔行掃描:心理視覺研究表明如果顯示的刷新率大于50次/秒,人眼就感覺不到閃爍。為了在較低的傳輸帶寬下降低閃爍,電視系統(tǒng)采用了隔行掃描。737模擬視頻信號(續(xù))視頻信號的幾個重要參數(shù)垂直清晰度水平線數(shù)目(行/幀)寬高比掃描方式幀率場率顏色模型例如,625行/幀,隔行掃描,2場/幀,312.5行/場,YUV模型7576777模擬視頻標準分量模擬視頻(CAV)每個分量都是一個單獨的單色視頻信號有較好的色彩再現(xiàn)(相對于復合模擬視頻而言)三個分量(R、G、B)完全同步三倍以上的帶寬79復合視頻(Compositevideo)將色度信號加載到亮度信號上合成為一個單獨信號,占用單倍帶寬傳輸;在復原顏色時作分離操作會產(chǎn)生色調(diào)(Hue)和飽和度(Saturation)誤差。模擬視頻標準(續(xù))屏蔽地線信號線S-video(Y/Cvideo)是前面兩種的折衷,將色度(chrominance)信號組合后加上亮度(luminance)信號共兩個信號參與傳輸,一條用于亮度信號,另一條用于色度信號,這兩個信號稱為Y/C信號。有如下優(yōu)點:減少亮度和色度之間的交叉干擾。不需要使用梳狀濾波器來分離亮度信號和色度信號,這樣就可提高亮度信號的帶寬。模擬視頻標準(續(xù))屏蔽地線Y地線C地線C線Y線8081PAL(逐行倒相PhaseAlternationLine-by-line):德國德律風根公司在1962年提出,主要用于西歐和中國。隔行掃描,每幀625行,25幀/秒,2場/幀,312.5行/場高寬比:4:3顏色模型:YUV(YCbCr)加上音頻信號,占用帶寬8MHz模擬視頻標準(續(xù))82NTSC(NationalTelevisionSystemsCommittee)確立于1952年,主要用于北美和日本隔行掃描,每幀525行,每場262.5行,60場/秒寬高比4:3垂直清晰度為340行/幀水平清晰度為452象素/行顏色模型:YIQ加上音頻信號,占用帶寬6MHz或者4.2MHz模擬視頻標準(續(xù))83SECAM(System

ElectroniqueColorAvecMemoire)1967年開始相繼采用,主要用于法國和東歐其它指標同PAL,只有加載彩色信號的方法不同逐行依次傳遞色度信號(R-Y)和(B-Y)按時分原則,在同一時間內(nèi)在傳輸信道內(nèi)只有一個信號存在,以免發(fā)生互串模擬視頻標準(續(xù))8模擬視頻標準(續(xù))三種現(xiàn)存彩電制式的主要特點比較對重顯彩色圖像來看,NTSC最好,PAL其次,SECAM第三NTSC傳輸系統(tǒng)設備要求高,但是接收機的成本最低;SECAM和PAL接收機成本較高85色彩復原的要求根據(jù)三基色的基本原理,一種顏色可以用R、G、B三個彩色分量按一定的比例混合得到。但要精確地復顯自然景物中的彩色確是相當困難的??茖W家們對人的彩色視覺特性經(jīng)過長期研究后發(fā)現(xiàn),在重顯自然景物彩色過程中,并不一定要恢復原景物輻射的所有光波成分,而重要的是獲得與原景物相同的彩色感覺。彩色電視圖像重現(xiàn)過程86用彩色攝象機攝取景物時,先把自然景物的彩色分解為R、G、B分量,處理并傳輸,最后重顯自然景物彩色。彩色電視圖像重現(xiàn)過程(續(xù))8788在彩色電視中的信號組成:用Y、C1,C2彩色表示法分別表示亮度信號和兩個顏色信號

線性組合可以構造出各種不同的彩色空間來表示景物的顏色。C1,C2的含義與具體的應用有關:NTSC:C1,C2分別表示I、Q兩個色差信號。PAL:C1,C2分別表示U、V兩個色差信號。CCIR601:C1,C2分別表示Cb,Cr兩個色差信號。彩色電視圖像重現(xiàn)過程(續(xù))89色差物理意義:指基色信號中的三個分量信號(即R、G、B)與亮度信號之差,色度信號應僅包含色度信息,而不包含亮度信號。彩色電視圖像重現(xiàn)過程(續(xù))90在彩色電視中,使用Y、C1,C2的兩個重要優(yōu)點:

Y和C1,C2是獨立的,因此彩色電視和黑白電視可以同時使用,Y分量可由黑白電視接收機直接使用而不需做任何進一步的處理。

可以利用人的視覺特性來節(jié)省信號的帶寬和功率,通過選擇合適的色度表示法,可以使C1,C2的帶寬明顯低于Y的帶寬,而又不明顯影響重顯彩色圖象的觀看。彩色電視圖像重現(xiàn)過程(續(xù))9分量視頻的重現(xiàn)過程:

LCD投影機同步電路校正R校正G校正B采樣電路采樣電路采樣電路LCD2LCD1LCD39分量視頻的重現(xiàn)過程:LCD投影機(續(xù))9分量視頻的重現(xiàn)過程:

LCD投影機(續(xù))9分量視頻的重現(xiàn)過程:

LCD投影機(續(xù))9LCD投影機彩色視頻重現(xiàn)(續(xù))966.4.2數(shù)字視頻數(shù)字視頻的特點使用彩色信號的分量表示方法:YCbCr、YUV、YIQ或RGB,有效避免復合編碼造成的虛象易于處理:可直接進行隨機存儲、檢索、復制、編輯、通過矩陣變換(例如:YCbCr

XYZ

RGB…)實現(xiàn)不同設備的相同彩色感再現(xiàn)。傳輸穩(wěn)定,抗干擾能力強,不失真交互能力強,集成各種視頻應用按照需要和傳輸能力改變圖像質量/傳輸速率需要大容量存儲和高傳輸帶寬,因此必須進行數(shù)字視頻壓縮9數(shù)字視頻標準在不同的行業(yè)對視頻有不同的標準,但是隨著數(shù)字視頻通信的出現(xiàn),橫貫所有行業(yè)的標準化進程已經(jīng)開始在計算機行業(yè),定義了標準的顯示分辨率在廣播電視行業(yè),有數(shù)字化演播室標準在通信行業(yè)已經(jīng)建立了標準的網(wǎng)絡協(xié)議9數(shù)字視頻標準(續(xù))計算機行業(yè)的視頻顯示分辨率標準由視頻電子標準協(xié)會(VESA)制定VGA:640象素/行*480行TARGA:512象素/行*480行SVGA:1024象素/行*768行,1280象素/行*1024行這些模式的圖像刷新率為72幀/秒9數(shù)字視頻標準(續(xù))數(shù)字視頻通信演播標準ITU-RBT.601(舊:CCIR601)參數(shù)ITU-RBT.601

525/60NTSCITU-RBT.601

625/60PAL/SECAMH.261CIF(通用中間格式)H.261QCIF(1/4通用中間格式)像素/行Lum(Y)Chroma(U,V)(858)720(429)360(864)720(432)360(352)360(176)180(176)180(88)90行/圖像Lum(Y)Chroma(U,V)48048057657628814414472隔行掃描2:12:11:1場率605030,15,10,7.5寬高比4:3100數(shù)字視頻標準(續(xù))圖像/視頻壓縮國際標準標準應用CCITTG3/G4(ITU-TSS)二值圖像(傳真機)JBIG二值圖像(中間色調(diào))JPEG用于連續(xù)靜止圖像的壓縮H.261P64kbit/s碼率的視頻壓縮。P=1,2,…,32。如:視頻會議系統(tǒng)H.263低于64kbit/s碼率的視頻壓縮。如:基于PSTN和窄帶無線通訊網(wǎng)的可視電話系統(tǒng)MPEG-15Mbit/s碼率的視頻壓縮。如:多媒體和VHS質量的廣播電視MPEG-2幾兆到幾十兆碼率的視頻壓縮。如:常規(guī)電視和高清晰度電視MPEG-4低于64bit/s和高于64bit/s到幾兆的視頻壓縮。如:窄帶可視電話和交互式視頻通信…………10數(shù)字視頻標準(續(xù))其它通用的視頻格式視頻格式公司DVI,IndeoIntelCorp.QuickTimeAppleComputerCD-IPhilipsConsumerElectronisPhotoCDEastmanKodakCompanyCDTVCommodoreElectronicsRealMediaRealNetworksWindowsMediaMicrosoftCorp.JPEG2000HDPhoto:微軟在2006年推出這種圖片格式,當時取名叫WindowsMediaPhoto,11月改名為HDPhoto。H.264AVS---中國數(shù)字視頻標準(續(xù))10模擬視頻數(shù)字化數(shù)字化方法將彩色復合視頻模擬信號(彩色全電視信號)分解成YCbCr、YUV、YIQ、RGB,然后用3個A/D轉換器分別對它們進行數(shù)字化。高速A/D轉換彩色復合視頻信號數(shù)字化,在數(shù)字域中分離產(chǎn)生YCbCr、YUV、YIQ、RGB。掃描與采樣(ScanningandSampling)視頻圖像在空間水平分量上的離散化或者,視頻信號在時間分量上的離散化量化(Quantization)視頻圖像顏色值的離散化編碼(Encoding)使用指定的比特數(shù)對量化值進行編碼10410模擬視頻數(shù)字化(續(xù))掃描與采樣(ScanningandSampling)根據(jù)奈奎斯特(Naquist)定理,采樣頻率高于二倍最大信號頻率。(參見前面所講)因此:最好先進行低通濾波除去噪聲(高頻成分),然后以足夠的采樣頻率在每條水平掃描線上等間隔地(離散化)提取視頻圖像的值。10模擬視頻數(shù)字化(續(xù))量化(Quantization)采樣后的視頻圖像在空間上形成離散像素陣列;而每個像素值仍是連續(xù)的,因此需經(jīng)過量化轉換為離散值(指定區(qū)間的有限個整數(shù)值)。均勻量化將像素值等間隔地分層量化;非均勻量化將像素值非等間隔地分層量化。模擬值與量化值之間的誤差稱為量化誤差(error),量化誤差在亮度平坦區(qū)域看起來呈顆粒狀,稱為顆粒噪聲。量化精度越細(整數(shù)值區(qū)間越大),量化噪聲越小,但需以增加電平數(shù)(碼率)為代價。10模擬視頻數(shù)字化(續(xù))矢量量化(VectorQuantization)量化除了上述的標量量化(ScalarQuantization)外,還可以采用矢量量化VQ(VectorQuantization)將離散像素陣列的每K個像素一組,形成K維空間的一個矢量后對其量化,最著名的是LBG法(Linde,Buzo,Gray)。10模擬視頻數(shù)字化(續(xù))編碼(Encoding)在保證一定質量例如信噪比(SNR:SignaltoNoiseRatio)的前提下以最少的比特數(shù)表示視頻圖像的量化值對于標量量化而言,通常先進行PCM(PulseCodeModulation)或者DPCM(DifferentialPCM)編碼其信噪比與量化比特數(shù)的關系為:當每像素的編碼比特數(shù)增加/減少1時,信噪比約增加/減少6dB除了信噪比評價準則外,更重要的是進行主觀評價測試(SubjectiveEvaluationTest)10模擬視頻數(shù)字化(續(xù))最佳量化最佳量化的目標是采用最少的編碼比特數(shù)達到最小量化誤差設計最佳量化器有兩種指標:量化誤差的均方差值最小的客觀準則;根據(jù)人眼視覺特性的主觀準則。1106.4.3視頻技術視頻采集(videoacquisition)視頻存儲(videostorage)視頻傳輸(videotransmission)數(shù)字視頻處理(digitalvideoprocessing)1116.4.3視頻技術(續(xù))視頻采集(videoacquisition)

彩色電視攝像機要求能夠攝取彩色景物的光圖像信息,經(jīng)過復雜電路處理,產(chǎn)生相應的彩色圖像電信號,根據(jù)采用攝像器件不同來分可以分為攝像管型和固體掃描型兩種電視攝像管(八十年代以前使用)在高度真空的玻璃泡中裝有一個光電變換靶,景物圖像經(jīng)過透鏡組投射到光電靶上,產(chǎn)生電荷像,然后通過裝在管內(nèi)的電子槍發(fā)出的電子束掃描整個圖像轉變成電信號金屬氧化物半導體光電轉換面陣器件:將圖像轉化為電信號,不需要電子束掃描,使電視攝像器件由真空化走向固體化,大大地縮小了電視攝像機的尺寸電荷耦合器件(CCD:ChargeCoupledDevice)CCDCMOS器件互補性氧化金屬半導體112CCD圖像傳感器中,對每個像素,光落在一個光電二極管上,光電二極管生成與落在上面的光的數(shù)量直接成比例的電荷。電荷傳送寄存器(CTR)中捕獲形成的電荷,然后傳送到讀數(shù)位移寄存器中

113CMOS圖像傳感器中,在每個光電二極管旁邊進行電荷處理。每個像素可以直接尋址,因此可以使用一個簡單的x-y尋址方案獲得定時和讀數(shù)114CMOS(ComplementaryMetal-OxideSemiconductor)互補性氧化金屬半導體CCD(ChargeCoupledDevice)電荷藕合器件CMOS感光器件的攝像頭反應快、低耗能CCD攝像頭反映稍慢、耗電稍大,但是成像質量更好

1156.4.3視頻技術(續(xù))視頻存儲(videostorage)無論是模擬視頻還是數(shù)字視頻,其常用的存儲介質都可以分成磁存儲介質和光存儲介質。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論