版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)字圖像處理數(shù)字圖像處理一、模擬圖像處理包括光學(xué)圖像處理和電子圖像處理(電子光學(xué)處理)光學(xué)方法是圖像處理發(fā)展的起源,1946年法國的Duffienx提出傅立葉光學(xué),1964年美國密執(zhí)安大學(xué)的A.Vanderlugt制成空間濾頻器光學(xué)處理具有處理速度快(可實時和并行處理,如電視模擬圖像處理可達(dá)25幀/秒或30幀/秒)、信息量大、分辨率高、經(jīng)濟等優(yōu)點模擬圖像處理的缺點是精度差、靈活性差,器件具有專用性,并且缺乏判斷分析能力,不具備非線性處理能力趨勢:將光學(xué)處理和計算機相結(jié)合的方法,如利用光學(xué)方法對圖像進行傅立葉變換,再用計算機對頻譜分析一、模擬圖像處理包括光學(xué)圖像處理和電子圖像處理(電子光學(xué)處理二、數(shù)字圖像處理將圖像轉(zhuǎn)換成一個數(shù)據(jù)矩陣存放在圖像存儲器中,然后再利用數(shù)字計算機,或其它的大規(guī)模集成數(shù)字器件(如DSP),對圖像信息進行數(shù)字運算或處理,以提高圖像的質(zhì)量或達(dá)到人們所預(yù)期的其它效果優(yōu)點:精度高、處理內(nèi)容豐富、可以進行復(fù)雜的非線性處理,處理方式靈活,同樣的圖像硬件系統(tǒng),在改變軟件之后可以用于其它完全不同的任務(wù)缺點:由于目前計算機性能的限制,數(shù)字圖像處理的速度有限,對于一些有實時性要求的任務(wù),必須利用DSP加速或構(gòu)建專用系統(tǒng)二、數(shù)字圖像處理將圖像轉(zhuǎn)換成一個數(shù)據(jù)矩陣存放在圖像存儲器中,廣義的數(shù)字圖像處理是指從圖像獲取到圖像信息輸出的全過程,即圖像處理系統(tǒng)與計算機應(yīng)用相關(guān)的設(shè)備圖像處理相關(guān)的方法有效軟件的實現(xiàn)圖像處理軟件的應(yīng)用圖像信息在計算機中的表示圖像數(shù)據(jù)庫及檢索圖像信息應(yīng)用等狹義的數(shù)字圖像處理僅指其中對圖像信息進行處理廣義的數(shù)字圖像處理是指從圖像獲取到圖像信息輸出的全過程,即圖廣義圖像處理圖像信息獲取,即獲取研究對象的圖像,并轉(zhuǎn)換成數(shù)字信號,以便于計算機或其它數(shù)字設(shè)備處理研究重點:圖像成像設(shè)備和數(shù)字化設(shè)備圖像信息的存儲圖像存儲設(shè)備,以及圖像存儲的格式、圖像壓縮標(biāo)準(zhǔn)以及圖像數(shù)據(jù)庫技術(shù)等圖像信息的傳送,包括內(nèi)部傳送與遠(yuǎn)距離傳送內(nèi)部傳送多采用DMA(DirectMemoryAccess);遠(yuǎn)距離傳送圖像壓縮技術(shù),減少占用帶寬圖像信息處理,即狹義的圖像處理利用計算機可以實現(xiàn)的算法圖像的輸出與顯示,即為人或計算機提供便于理解以及識別的圖像軟拷貝與硬拷貝兩種形式廣義圖像處理圖像信息獲取,即獲取研究對象的圖像,并轉(zhuǎn)換成數(shù)字狹義的計算機圖像處理(一)幾何處理坐標(biāo)變換:圖像的放大與縮小、旋轉(zhuǎn)、移動圖像畸變校正幾何特征計算等算術(shù)與邏輯運算圖像的加減乘除,與或非等運算此類運算既簡單有效,又是其它處理的基礎(chǔ)圖像增強根據(jù)任務(wù)目標(biāo)突出圖像中感興趣的信息,消除干擾,改善圖像的視覺效果或增強便于機器識別的信息此三項是圖像預(yù)處理中常涉及的內(nèi)容狹義的計算機圖像處理(一)幾何處理狹義的計算機圖像處理(二)圖像復(fù)原根據(jù)圖像退化模型,消除退化因素,恢復(fù)原始的圖像。如散焦是造成圖像模糊的一個重要的因素,而散焦模型可以通過實驗數(shù)據(jù)和理論分析獲得,利用逆濾波就可以消除散焦圖像編碼研究壓縮圖像數(shù)據(jù)的方法,需要研究并利用圖像的冗余特征,如統(tǒng)計冗余、生理視覺冗余、知識冗余等圖像分割根據(jù)圖像的某些特征將圖像劃分為不同的區(qū)域,以便于對圖像中的物體或目標(biāo)進行分析與識別。如“機動車視覺系統(tǒng)”中根據(jù)圖像中的灰度信息分割白色導(dǎo)引線和路面狹義的計算機圖像處理(二)圖像復(fù)原狹義的計算機圖像處理(三)圖像重建前面六個研究方面輸入的是圖像,而圖像重建輸入的是非圖像信息,如數(shù)據(jù)、公式等,輸出為圖像。主要有卷積反投影法等。常用于醫(yī)學(xué)設(shè)備,CT等圖像模式識別在圖像分割的基礎(chǔ)上提取特征,對圖像中的內(nèi)容進行判決分類圖像分析與理解在圖像模式識別的基礎(chǔ)上進一步發(fā)展,根據(jù)圖像局部內(nèi)容之間的關(guān)系,利用有關(guān)知識進行推理與聯(lián)想,對圖像中所表現(xiàn)的內(nèi)容進行理解狹義的計算機圖像處理(三)圖像重建課程介紹教材
《圖像處理和分析基礎(chǔ)》,高等教育出版社,2004課程介紹教材課程介紹參考資料李叔梁譯.岡薩雷斯.?dāng)?shù)字圖像處理.1981
KennethR.Castleman.DigitalImageProcessing.1998陳彩廷譯.羅森菲爾德.?dāng)?shù)字圖像分析.1987吳健康.?dāng)?shù)字圖像分析.1989
R.C.Gonzalez,R.E.Woods.DigitalImageProcessing,Addison-Wesley,ReadingMA,1992課程介紹參考資料課程介紹主要參考資料
ComputerVisionGraphicsandImageProcessing
IEEETrans.PatternAnalysis&MachineIntelligence
PatternRecognition
PatternRecognitionLetter
ImageandVisionComputing模式識別與人工智能、中國圖像圖形學(xué)報計算機學(xué)報、自動化學(xué)報課程介紹主要參考資料第一章圖像技術(shù)基礎(chǔ)1.1圖像和像素1.2圖像技術(shù)及分類1.3圖像表示1.4圖像顯示1.5圖像存儲與格式1.6*視覺基礎(chǔ)1.7*顏色視覺和色度學(xué)第一章圖像技術(shù)基礎(chǔ)1.1圖像和像素1.1圖像圖像(image)
在一般的意義下,可以認(rèn)為一幅圖像就是一個東西的一個表示,它包含了所表示物體的相關(guān)描述信息,出現(xiàn)形式多種多樣可視的和不可視的;抽象的和實際的;適于和不適于計算機處理的1.1圖像圖像(image)一、按照圖像的存在形式分(1)物理圖像
(physicalimages)--物質(zhì)或能量的實際分布可見的圖像(visibleimage):人眼可以看到并接受的圖像圖片
(picture),包括照片
(photograph)、圖
(drawings指用線條畫成的)和畫
(paintings),圖片等價于圖像,也就是說picture經(jīng)常和image一詞混用光圖像
(opticalimages),即用透鏡、光柵和全息術(shù)產(chǎn)生的圖像,如熒幕、屏幕上出現(xiàn)的影像。光(學(xué))圖像是光強度的空間分布不可見的圖像:如溫度、壓力、高度以及人口密度等的分布圖一、按照圖像的存在形式分(1)物理圖像(physical
(2)抽象圖像即數(shù)學(xué)圖像,包括連續(xù)函數(shù)和離散函數(shù)離散函數(shù)圖像就是計算機可以處理的形式物理圖像必須要變成離散函數(shù)才能被計算機處理(2)抽象圖像二、按照圖像的色彩特性分彩色圖像,又稱為多光譜圖像圖像上的每個點有多于一個的局部特征彩色電視中重現(xiàn)的三基色圖像,每個像素點就需要有紅、綠、藍(lán)三個基色的三個亮度值表示。遙感圖像可以提供多達(dá)7個不同通道的信息黑白圖像,又稱灰度圖像、亮度圖像、單色圖像等每個像素點只有一個亮度值黑白照片黑白電視畫面二、按照圖像的色彩特性分彩色圖像,又稱為多光譜圖像三、按照圖像的光譜特性分可見光圖像紅外光圖像雷達(dá)圖像聲吶圖像三、按照圖像的光譜特性分可見光圖像四、按照圖像的時間特性分靜止圖像不隨時間變化的圖像,如各類圖片動態(tài)圖像隨時間變化的圖像,如電視和電影畫面四、按照圖像的時間特性分靜止圖像物體objects圖像images不可見的物理圖像Non-visiblephysicalimage數(shù)學(xué)函數(shù)Mathematicalfunction連續(xù)函數(shù)continuous離散函數(shù)Discrete(digitalimage)可見的圖像Visibleimage光圖像Opticalimage圖片pictures照片photograph圖drawing畫paintingsTypesofimages圖像的類型物體objects圖像images不可見的物理圖像數(shù)學(xué)函數(shù)M圖像信息的分類三類符號信息景物信息情緒信息圖像信息的分類三類圖像信息——(1)符號信息一般是用文字、符號、圖形等表示的具體的或抽象的事物電路圖、機械圖、打印的文件等,它們中包含有規(guī)則、含義明確的符號,這些圖像一般用二值圖像表示就足夠了,因為符號的顏色不提供新的有效信息,對圖像的理解沒有幫助地圖中也包含大量符號,但需要關(guān)注顏色信息,因為它們都有確定的物理含義,如藍(lán)色一般表示濕地,綠色的深淺也表明了海拔高度圖像信息——(1)符號信息一般是用文字、符號、圖形等表示的具圖像信息——(2)景物信息是一種能夠使人產(chǎn)生主觀感覺,但不取決于人本身的客觀場景中包含的信息。景物信息內(nèi)容豐富,較難以表達(dá),只有在明確目標(biāo)的前提下,才能得到正確處理如衛(wèi)星云圖中蘊含著氣旋信息,氣旋的位置與強度是一種客觀存在圖像信息——(2)景物信息是一種能夠使人產(chǎn)生主觀感覺,但不取圖像信息——(3)情緒信息依賴于觀察者,如藝術(shù)圖片的效果就與觀看者本身的生理、心理、修養(yǎng)有很大的關(guān)系,此類信息無法刻畫圖像信息——(3)情緒信息依賴于觀察者,如藝術(shù)圖片的效果就與1.2圖像技術(shù)及分類圖像工程圖像處理圖像分析圖像理解采集獲取存儲重建變換濾波增強恢復(fù)編碼壓縮數(shù)字水印信息隱藏邊緣檢測圖像分割目標(biāo)表達(dá)描述測量圖像匹配融合3D表示重構(gòu)場景恢復(fù)解釋推理圖像視頻檢索顏色形狀紋理空間運動分析目標(biāo)檢測提取跟蹤識別1.2圖像技術(shù)及分類圖像工程圖像處理圖像分析圖像理解采集變幾個學(xué)科之間的關(guān)系圖像處理(低級,像素):圖像
圖像圖像分析(中級,目標(biāo)):圖像數(shù)據(jù)圖像理解(高級,符號):數(shù)據(jù)、符號場景模式識別:圖像符號計算機圖形學(xué)(ComputerGraphics):數(shù)據(jù)圖像,用計算機將由概念或數(shù)學(xué)模型表示的物體(不是實物)進行處理,并顯示成圖像計算機視覺(ComputerVision):圖像場景,研究模擬人眼功能的理解自然景物的系統(tǒng)數(shù)字成像(DigitalImaging):更廣義的一個概念,涵蓋任何用計算機來操作(manipulate)與圖像有關(guān)數(shù)據(jù)的技術(shù),包括計算機圖形學(xué)、計算機視覺、數(shù)字圖像處理與分析幾個學(xué)科之間的關(guān)系圖像處理(低級,像素):圖像圖像不斷拓展的應(yīng)用領(lǐng)域遙感(RemoteSensing)
生物醫(yī)學(xué)(Physic)
文件處理(FileManipulation)科學(xué)研究(ScienceResearch)
工業(yè)檢測(IndustryCheck)
機器人視覺(RobotVision)軍事(MilitaryAffairs)公安(PublicSecurity)其他不斷拓展的應(yīng)用領(lǐng)域遙感(RemoteSensing)公安(PublicSecurity)身份辨識監(jiān)控不開箱檢查鑒定公安(PublicSecurity)身份辨識身份的生物識別技術(shù)眼睛虹膜、視網(wǎng)膜手掌指紋語音面孔、臉部血管簽名基因氣味身份的生物識別技術(shù)眼睛虹膜、視網(wǎng)膜眼睛:最可靠的身份證虹膜:纖維組織,有250以上的特征點每個虹膜的可識別特征可以得到512字節(jié)的資料,稱為虹膜代碼不同人眼的虹膜的60%左右的紋路是相同的,40%是不同的兩人同一只眼虹膜特征相同的概率是十萬分之一,兩眼相同的概率是一千億萬分之一視網(wǎng)膜:血管構(gòu)造也具有唯一性和穩(wěn)定性的特點,可能還更為有效(可獲得400個特征點眼睛:最可靠的身份證虹膜:纖維組織,有250以上的特征點人眼虹膜識別系統(tǒng)人眼虹膜識別系統(tǒng)手掌識別一種最為快捷方便的方法識別手掌的幾何特征手掌放在錄入頭表面后,由紅外相機獲取圖像。然后對手掌的整體形狀、手指和關(guān)節(jié)的形狀和長度進行測量,從而得到手掌的特征點準(zhǔn)確度不是很高,不能對手掌的其它特征,比如掌紋、傷疤進行分析可利用的特征點約20~50個手掌識別一種最為快捷方便的方法指紋:最成熟的識別技術(shù)從可靠性說,人與人之間,擁有相同指紋的概率為十億分之一每個指紋的特征點很多,“節(jié)點”,也就是指紋紋路的分叉、終止或打圈處的坐標(biāo)位置。通常,手指上有70個節(jié)點,他們同時具有7種以上的唯一的特征。根據(jù)美國聯(lián)邦調(diào)查局的研究,在可以用軟件識別的節(jié)點中,最多有7個或8個相同點進行指紋識別時,首先用指紋讀取設(shè)備獲得指紋的圖像,然后對原始圖像進行初步處理,使得更清晰。指紋識別軟件在指紋上找到節(jié)點,并轉(zhuǎn)換成特定的數(shù)據(jù)。最后,通過模糊比較的方法,把這些數(shù)據(jù)與數(shù)據(jù)庫中的指紋數(shù)據(jù)進行比較,得到匹配結(jié)果最新進展,與指紋的深度信息融合,進一步提高了識別的可靠性和數(shù)據(jù)的獨特性指紋:最成熟的識別技術(shù)從可靠性說,人與人之間,擁有相同指紋的七年級數(shù)學(xué)上冊第4章直線與角檢測卷課件新版滬科版1213人臉識別:最友好、直接的系統(tǒng)人臉檢測(FaceDetection)人臉表征(FaceRepresentation)人臉鑒別(FaceIdentification):即人臉識別表情分析(FacialExpressionAnalysis)物理分類(PhysicalClassification)人臉檢測與定位特征提取人臉識別輸入圖像輸出結(jié)果人臉自動識別系統(tǒng)構(gòu)成人臉識別:最友好、直接的系統(tǒng)人臉檢測(FaceDetec七年級數(shù)學(xué)上冊第4章直線與角檢測卷課件新版滬科版1213筆跡識別:友善的生物識別技術(shù)專用簽名輸入板,用戶在板上留下自己的簽名,識別過程幾乎瞬間完成簽名力學(xué)辨識,建立在其簽名時的力度上的。關(guān)鍵在于區(qū)分出不同的簽名部分,那些是習(xí)慣性的,那些是每次簽名是都不同的。這個系統(tǒng)主要對每個人簽名時筆的移動進行動態(tài)分析,如速度的變化、運筆的壓力、方向和筆劃的長度等,而不是簽名的圖像本身簽名識別的可靠性不是很高筆跡識別:友善的生物識別技術(shù)專用簽名輸入板,用戶在板上留下1.3圖像表示一、圖像的連續(xù)模型1.3圖像表示1、基本的連續(xù)模型圖像可以用灰度級G在x,y二維空間的連續(xù)變換來描述,即g(x,y)。時間序列圖像的描述為:g1(x,y),g2(x,y),…,gt(x,y)}或g(x,y,t)圖像處理
f(x,y)=S[g(x,y)] (1)式(1)中S可以是有意施加的某種處理方法,也可以是圖像系統(tǒng)中導(dǎo)致圖像退化的原因。
G(x,y)=S-1[f(x,y)] (2)式(2)是圖像復(fù)原的基本模型Sg(x,y)f(x,y)圖像處理的基本框圖1、基本的連續(xù)模型圖像可以用灰度級G在x,y二維空間的連續(xù)變2、照明反射模型f(x,y)=i(x,y)r(x,y)其中0
i(x,y)Bm,0r(x,y)1i(x,y)照射分量,r(x,y)反射分量,Bm最大光照強度gmin
g
gmax,gmin=iminrmin,gmax=imaxrmax
[gmin,gmax]是圖像灰度范圍該模型常用于同態(tài)濾波,計算機圖形:真實感模型2、照明反射模型f(x,y)=i(x,y)r(x,y)噪聲的模型噪聲的特征噪聲的來源噪聲模型噪聲的模型噪聲的特征(1)噪聲的特征圖像信號f(x,y)噪聲n(x,y),隨機性的,可以用隨機過程來描述。一般常用統(tǒng)計特征來描述,如均值、方差、相關(guān)函數(shù)等均值E[n(x,y)]反映噪聲的直流分量均方值E{n2(x,y)}反映噪聲的總功率均方差E{(n(x,y)-E[n(x,y)])2}描述噪聲的交流功率均值的平方[E{n(x,y)}]2,表示噪聲的直流功率(1)噪聲的特征圖像信號f(x,y)(2)噪聲的來源外部噪聲從處理系統(tǒng)外來的影響,如電磁波干擾內(nèi)部噪聲(1)由光和電的基本性質(zhì)引起的噪聲(2)機械運動產(chǎn)生的噪聲(3)元器件材料本身的缺陷帶來的噪聲(4)系統(tǒng)內(nèi)部電路噪聲(2)噪聲的來源外部噪聲噪聲分類從統(tǒng)計觀點看平穩(wěn)噪聲凡是統(tǒng)計特征不隨時間變化的;非平穩(wěn)噪聲統(tǒng)計特征隨時間變化的。從噪聲幅度分布的統(tǒng)計來看其密度函數(shù)有高斯型、瑞利型等,分別稱為高斯噪聲和瑞利噪聲。按噪聲頻譜形狀命名的,如頻譜均勻分布的噪聲稱為白噪聲,頻譜與頻率成反比的稱為1/f噪聲,頻譜與頻率平方成正比的稱為三角噪聲噪聲分類從統(tǒng)計觀點看(3)噪聲的模型加法性噪聲g(x,y)=f(x,y)+n(x,y)乘法噪聲g(x,y)=f(x,y)[1+n(x,y)]=f(x,y)+f(x,y)n(x,y)(3)噪聲的模型加法性噪聲二、離散模型二、離散模型數(shù)字圖像處理的幾個基本術(shù)語數(shù)字化(digitizing)將一幅圖像從其原來的形式轉(zhuǎn)換為數(shù)字形式的處理過程,包括“掃描”、“采樣”與“量化”三個步驟通常將“掃描”合并到“采樣”階段,合并為兩個過程數(shù)字圖像處理的幾個基本術(shù)語數(shù)字化(digitizing)掃描(scanning)將一個數(shù)學(xué)虛擬網(wǎng)格覆蓋在一幅圖像上,圖像的平面空間被離散化成一個個的有序的格子(格子的形式可以有多種形式,通常易于物理實現(xiàn)的是矩形,且每個格子完全相同),然后按照格子的排列順序依次讀取圖像的信息,此讀取過程稱為“掃描”。在掃描過程中被讀取的小塊圖像稱為圖像元素(pictureelement),簡稱像素(pixel),它的描述包括空間坐標(biāo)以及圖像信息兩個部分。不太嚴(yán)格的情況下,掃描也可以用作數(shù)字化的等價詞。矩形掃描網(wǎng)格常稱為光柵(raster)掃描(scanning)將一個數(shù)學(xué)虛擬網(wǎng)格覆蓋在一幅圖像上,圖像數(shù)字化采樣列采樣行圖片像素行間隔采樣列間隔灰階黑灰白0128255物理圖像19643灰度像素數(shù)字圖像物理圖像及其對應(yīng)的數(shù)字圖像圖像數(shù)字化采樣列采樣行圖片像素行間隔采樣列間隔灰階黑灰白01采樣(sampling)在一幅圖像的每個像素位置上測量灰度值。采樣通常是由一個圖像傳感元件完成,它將每個像素處的亮度轉(zhuǎn)換成與其成正比的電壓值。采樣完成圖像空間的數(shù)字化,在CCD攝像機中,是由一個個感光單元實現(xiàn)的。圖像數(shù)字化時必須遵守“采樣定理”,才能保證圖像可恢復(fù)奈奎斯準(zhǔn)則:采樣頻率必須需大于等于被采樣信號的最大頻率的2倍采樣(sampling)在一幅圖像的每個像素位置上測量灰度值量化(quantization)將采樣時測量的灰度值轉(zhuǎn)化成整數(shù)表示由于數(shù)字計算機只能處理數(shù)字,因此必須將連續(xù)的測量值轉(zhuǎn)化為離散的整數(shù)。因此在圖像傳感器后面,經(jīng)常跟隨一個電子線路的模數(shù)轉(zhuǎn)換器(ADC),將電壓值轉(zhuǎn)化成一個整數(shù)經(jīng)過數(shù)字化得到一幅圖像的數(shù)字表示,即數(shù)字圖像f(x,y),f(x,y)以及x、y都是整數(shù)量化(quantization)將采樣時測量的灰度值轉(zhuǎn)化成整幾個重要概念1、處理:讓某個事物受到一個過程的作用2、過程(process):指能導(dǎo)致某個所期望目標(biāo)的一系列的動作或操作3、數(shù)字圖像處理:對一個物體的數(shù)字表示施加一系列的操作,以得到所期望的結(jié)果4、數(shù)字圖像的限制性定義:一個被采樣和量化后的二維函數(shù)(該二維函數(shù)由光學(xué)方法產(chǎn)生),采用等距離矩形網(wǎng)格采樣,對幅度進行等間隔量化一幅數(shù)字圖像是一個被量化的采樣數(shù)值的二維矩陣幾個重要概念1、處理:讓某個事物受到一個過程的作用6、顯示(display):由一幅數(shù)字圖像生成一可見的、直觀的圖像“回放”、“圖像重建”、“硬拷貝”、“圖像記錄”顯示設(shè)備有暫時的、永久的兩類10、對比度(contrast):一幅圖像中灰度反差的大小11、噪聲(noise):加性的或乘法性的污染12、采樣密度(samplingdensity):圖像上單位長度包含的采樣點數(shù)像素間距(pixelspacing)=1/采樣密度6、顯示(display):由一幅數(shù)字圖像生成一可見的、直觀13、放大率(magnification):圖像中物體與其所對應(yīng)的景物中物體的比例關(guān)系14、運算(operation):注意運算前后圖像之間的對應(yīng)關(guān)系(1)全局運算:對整幅圖像同時處理(2)點運算:由對應(yīng)點決定(3)局部運算:由中心像素周圍的有關(guān)像素決定13、放大率(magnification):圖像中物體與其所數(shù)字圖像,數(shù)字化(1)連續(xù)畫面空間坐標(biāo)離散化—采樣方形、三角形、正六角形點陣等(2)采樣點(像素)幅值(實數(shù))取整——量化均勻、非均勻/矢量、標(biāo)量采樣點陣數(shù)字圖像,數(shù)字化(1)連續(xù)畫面空間坐標(biāo)離散化—采樣采樣點陣1、圖像的均勻采樣
y|
x|
xy1、圖像的均勻采樣y|x|xy二維采樣定理Nyquist采樣定理對于二維有限帶寬信號fc(x,y),如果其二維傅立葉變換只在|u|
Uc,|v|
Vc的范圍內(nèi)不為零,那么采樣間隔必須滿足
x1/2Uc,
y1/2Vc這樣才能保證信號可以重構(gòu)二維采樣定理Nyquist采樣定理對于二維有限帶寬信號fc(2、圖像的量化量化的準(zhǔn)則是:若fi
f
<
fi+1則g=gig1
g0
g2
gN-1
0f0f1f2
fN-1fNfg
量化過程2、圖像的量化量化的準(zhǔn)則是:若g1g0g2gN-10量化誤差量化誤差量化失真由量化誤差產(chǎn)生的圖像失真最優(yōu)量化器——量化均方誤差最小非線性量化誤差量化誤差非均勻采樣和量化非均勻采樣灰度級變化大區(qū)域精確采樣,平滑區(qū)域粗采樣非均勻量化灰度級變化劇烈處,人眼分辨力差,邊界附近較少灰度級;平緩區(qū)域較多灰度級,避免假輪廓非均勻采樣和量化非均勻采樣3、數(shù)字圖像的表示數(shù)字圖像,矩陣元素:像元圖像元素:像素電視圖像:512
512
128一般圖像:256
256
643、數(shù)字圖像的表示數(shù)字圖像,矩陣元素:像元數(shù)字圖像舉例yOxg(x,y)數(shù)字圖像舉例yOxg(x,y)矩陣上圖中g(shù)(x,y)既可以表示整幅圖像,也可以表示x行y列交點處的圖像的像素值,g(x,y)的值都是整數(shù)圖像的數(shù)據(jù)量(bit)b=M×N×k圖像清晰度(可分辨的細(xì)節(jié)的程度)取決于N和
k。N小,檢測板效應(yīng);
k小,假輪廓矩陣上圖中g(shù)(x,y)既可以表示整幅圖像,也可以表示x行y列只改變灰度級:8、16、32、64、128、256只改變灰度級:8、16、32、64、128、256只改變空間分辨率512、256、128、64、32、16只改變空間分辨率512、256、128、64、32、16鄰域四鄰域?qū)青徲虬肃徲蜞徲蛩泥徲蛩泥徲蚺c八鄰域從數(shù)字圖像中抽取對稱鄰域半徑=
x=y點+的四鄰域(a)半徑=
x=y點+的八鄰域(b)四鄰域與八鄰域從數(shù)字圖像中抽取對稱鄰域半徑=x=y點+連通性4-連通8-連通m-連通近鄰與通路連通域4-連通域8-連通域連通性4-連通像素間距離 歐氏距離(DE):[(x-s)2+(y-t)2]1/2 城區(qū)距離(D4):|x-s|+|y-t| 棋盤距離(D8):max(|x-s|,|y-t|)像素間距離1.4圖像顯示圖像顯示圖像顯示設(shè)備:顯示器,打印設(shè)備等半調(diào)輸出半調(diào)輸出示例抖動技術(shù)1.4圖像顯示圖像顯示1.5圖像存儲與格式圖像存儲存儲量單位:比特(bit)
字節(jié)B(8bit)千字節(jié)KB(103B)
兆MB(106B)吉GB(109B)太TB(1012B)1.5圖像存儲與格式圖像存儲存儲器示例快速存儲器聯(lián)機存儲器數(shù)據(jù)庫存儲器圖像數(shù)據(jù)存儲格式矢量形式光柵形式存儲器示例圖像文件格式BMP格式GIF格式TIFF格式JPEG格式圖像文件格式常見圖像存儲格式英文名稱類型說明Bit-Mappedformat*.BMPMicrosoftWindows標(biāo)準(zhǔn)格式Graphicalinterchangeformat*.GIFCompuSever圖形格式Taggedimagefileformat*.TIFDOS,UNIX及Macintosh圖像Jointphotographicexpertsgroup*.JPG國際壓縮標(biāo)準(zhǔn),JPEG,JPEG2000EncapsulatedPostScript*.EPS出版業(yè)使用格式常見圖像存儲格式英文名稱類型說明Bit-Mappedfo1.6*視覺基礎(chǔ)視覺生理/視覺特性/視覺模型視覺基礎(chǔ)/視覺應(yīng)用它們與圖像研究的關(guān)系見下圖1.6*視覺基礎(chǔ)視覺生理/視覺特性/視覺模型視覺研究與圖像的關(guān)系視覺研究基礎(chǔ)研究視覺心理現(xiàn)象法則(心理學(xué))視覺信息加工機理(生理學(xué))應(yīng)用研究視環(huán)境的改善和視機能應(yīng)用(照明工程學(xué)、人類工程學(xué))圖像改善和評價(圖像工程)模擬視覺機能的信息處理(信息工程、人工智能心理測定模擬技術(shù)視覺研究與圖像的關(guān)系視覺研究基礎(chǔ)研究視覺心理現(xiàn)象法則視覺信息1、圖像質(zhì)量評價與視覺心理對圖像質(zhì)量的最終評價是由人的感覺器官和心理狀態(tài)來決定的。與圖像內(nèi)容以及觀察者的心理因素有關(guān)從圖像信息傳輸角度出發(fā),圖像系統(tǒng)評價的真正尺度應(yīng)該是發(fā)出信息者的意圖為接收信息者所理解的程度,而不是對發(fā)出信息者發(fā)出的圖像象素信息集合的簡單接收1、圖像質(zhì)量評價與視覺心理對圖像質(zhì)量的最終評價是由人的感覺器2、畫面組成和視覺心理視野——指眼球不動時所能見到的范圍如果把注視點作為中心,可見的范圍上方約65°,下方約75°,左右視角約為104°(現(xiàn)在的電視畫面約占7°~8°),但視力好的部位僅限于中央2°~3°左右為了適應(yīng)大的畫面和立體景象的機理,眼球必須轉(zhuǎn)動使視線移動中心視力分辨率強,可以進行圖像細(xì)節(jié)的認(rèn)識周邊視力分辨率差,可以將視目標(biāo)特征部分檢出,利用檢出的目標(biāo)圖像特征去控制眼球運動另外周邊視可以認(rèn)識圖像的全貌,而中心視只能認(rèn)識圖像的一小部分要產(chǎn)生充分的臨場感,畫面尺寸應(yīng)該產(chǎn)生30°以上視野,如寬銀幕電影2、畫面組成和視覺心理視野——指眼球不動時所能見到的范圍3、視覺的時空頻率分析影響圖像銳度的主要因素。視覺神經(jīng)具有的Mach效應(yīng)和Roca—Sulzer微分效應(yīng),中樞神經(jīng)的Craik-Obrien積分效應(yīng)等是視覺信息處理的基礎(chǔ),因此可以將視覺特性和圖像處理結(jié)合起來研究空間分辨力人眼對空間景物細(xì)節(jié)的分辨能力有限,對黑白圖像約為一度時間分辨力對亮度的響應(yīng)有時延和殘留,因而對景物亮度的變化也有分辨力,過快的變化無法分辨視覺惰性。當(dāng)離散畫面的重復(fù)頻率不低于24Hz時,可形成連續(xù)畫面的感覺,即人眼不能分辨相鄰兩幅畫面間的差別,而低于24Hz時,有閃爍感3、視覺的時空頻率分析影響圖像銳度的主要因素。視覺神經(jīng)具有的4、視覺的時空頻率分析人眼對畫面靜止部分的分辨率高于活動部分對靜止部分減少時間分辨率,而對活動部分減少空間分辨率,可以達(dá)到數(shù)據(jù)壓縮的效果。幅度分辨力人眼對景物亮度層次的分辨力也有限,過小的亮度差別無法分辨。對彩色圖像的色調(diào)和飽和度的分辨力人的視覺對彩色細(xì)節(jié)的分辨力要比亮度細(xì)節(jié)差,在國際無線電咨詢委員會(ITU-R,原CCIR)601標(biāo)準(zhǔn)中,就利用了這種特性,將色差信號的空間分辨率減半,仍可以得到非常好的圖像質(zhì)量。對立體圖像的景深分辨力等4、視覺的時空頻率分析人眼對畫面靜止部分的分辨率高于活動部分5、視覺生理和模型的研究視覺生理指視覺信息的產(chǎn)生部分——視細(xì)胞(圖像信息感受器)和其它神經(jīng)細(xì)胞以及大腦高級中樞的神經(jīng)系統(tǒng)的信息產(chǎn)生、傳輸和處理的機理插入單個細(xì)胞的微小電極側(cè)抑制現(xiàn)象、馬赫效應(yīng)等對大腦高級神經(jīng)中樞的“思考過程”才剛起步5、視覺生理和模型的研究視覺生理人類視覺機制今后的研究方向從基礎(chǔ)研究逐步轉(zhuǎn)到和圖像相關(guān)的視覺綜合化、體系化的研究搞清決定圖像質(zhì)量的主觀因素,做出其總的結(jié)構(gòu)模型找出人腦真正接收信息的容量,大腦有效接收圖像的顯示方式弄清圖像信源和信宿的結(jié)構(gòu),建立起包括人的因素在內(nèi)的信息論研究視覺和其它感覺的相乘作用,即視覺和其它感覺的互相影響開發(fā)自組織作用的綜合研究,進一步建立發(fā)展“思考過程”研究視覺和行為的關(guān)系人類視覺機制今后的研究方向從基礎(chǔ)研究逐步轉(zhuǎn)到和圖像相關(guān)的視覺人類視覺感知過程人眼結(jié)構(gòu)眼睛中圖像的形成視覺特性人類視覺感知過程人眼結(jié)構(gòu)人眼的結(jié)構(gòu)視覺生理特點對圖像處理方法的影響很大人眼的結(jié)構(gòu)視覺生理特點對圖像錐狀(cone)視覺:白晝視覺,色彩桿狀(rod)視覺:夜視覺,低照度敏感視錐細(xì)胞和視桿細(xì)胞在視網(wǎng)膜上的分布錐狀(cone)視覺:白晝視覺,色彩眼睛中圖像的形成成像的幾何原理視覺信息的產(chǎn)生視覺信息的傳遞視覺信息的加工處理眼睛中圖像的形成成像的幾何原理(1)成像的幾何原理當(dāng)晶狀體的折射能力由最小變到最大時,晶狀體的聚焦中心與視網(wǎng)膜之間的距離由17mm縮小到14mm。當(dāng)眼睛聚焦到遠(yuǎn)于3m的物體時,晶狀體的折射能力最弱,當(dāng)聚焦到非常近的物體時,其折射能力最強用眼睛觀察樹的光學(xué)表示法,C點為晶狀體的光學(xué)中心(1)成像的幾何原理當(dāng)晶狀體的折射能力由最小變到最大時,晶狀成像尺寸計算觀測者看一個距離100m,高15m的樹:設(shè)x表示視網(wǎng)膜上形成的圖像的大小,單位mm,則有15/100=x/17,x=2.55mm成像尺寸計算觀測者看一個距離100m,高15m的樹:設(shè)x表示(2)視覺信息的產(chǎn)生光—化—電過程色覺理論主要有兩種三色學(xué)三種視色素,對光的影響峰值分別在紅、綠、藍(lán)區(qū),綜合后形成色覺信息四色學(xué)說三對視色素(白-黑,紅-綠,黃-藍(lán)),它們的組合響應(yīng)產(chǎn)生色覺信息(2)視覺信息的產(chǎn)生光—化—電過程人類感光細(xì)胞的敏感曲線三種不同頻率響應(yīng)的錐,各對紅、綠、藍(lán)具有最強的響應(yīng),彩色的識別功能400450500550600650700100806040200藍(lán)綠紅波長(nm)光吸收特性%人類感光細(xì)胞的敏感曲線三種不同頻率響應(yīng)的錐,各對紅、綠、藍(lán)具(3)視覺信息的傳遞眼球內(nèi)眼球外(3)視覺信息的傳遞眼球內(nèi)(4)視覺信息的加工處理簡單型細(xì)胞檢測圖像的明暗邊界和線條的位置和方向,復(fù)雜型細(xì)胞對直線和邊界的運動方向敏感,低級超復(fù)雜型細(xì)胞檢測直線和邊界的長度、寬度,而高級超復(fù)雜型細(xì)胞可以檢測曲線和邊緣曲度等(4)視覺信息的加工處理簡單型細(xì)胞視覺特性亮度適應(yīng)與鑒別分辨力對比靈敏度同時對比效應(yīng)閾值效應(yīng)和掩蓋效應(yīng)視覺運動特性視覺空間頻率特性視覺時間頻率特性視覺特性亮度適應(yīng)與鑒別主觀亮度感受特性主觀亮度感受特性分辨力在不同的亮度適應(yīng)級,人眼的分辨力不同,如圖所示,I是背景光強,
I是光強的變化,稱log(I/I)為韋伯比,表示光強分辨力光強分辨力的典型韋伯比分辨力在不同的亮度適應(yīng)級,人眼的分辨力不同,如圖所示,I是對比靈敏度II+
I
I/I強度I2%具有恒定背景的對比靈敏度對比靈敏度II+II/I強度I2%具有恒定背景的對比靈敏同時對比效應(yīng)心理學(xué)實驗表明,人眼感受到的亮度不是光強的簡單函數(shù),如馬赫帶效應(yīng)和同時對比效應(yīng)強度I
I/II0I+
II2%具有可變背景的對比靈敏度同時對比效應(yīng)心理學(xué)實驗表明,人眼感受到的亮度不是光強的簡單函馬赫帶效應(yīng)馬赫帶效應(yīng)同時對比效應(yīng)同時對比效應(yīng)視覺閾值效應(yīng)和掩蓋效應(yīng)視覺閾值正好可以被看到的刺激(干擾或失真)值,它是一個統(tǒng)計值,在圖像質(zhì)量的主觀評價中有廣泛的應(yīng)用掩蓋效應(yīng)視覺閾值隨圖像內(nèi)容的變化而變化,在平坦區(qū)閾值低,對失真也敏感;在邊緣和紋理區(qū),視覺存在掩蓋效應(yīng),對失真不敏感視覺閾值效應(yīng)和掩蓋效應(yīng)視覺閾值視覺運動特性周邊視力對圖像中運動變化部分很靈敏,有特征抽取作用,從而控制眼肌轉(zhuǎn)動視軸,使視力集中對準(zhǔn)這些部位,以便看清其細(xì)節(jié)電視眼球標(biāo)記攝像機(televisioneye-markercamera)試驗視覺運動特性周邊視力對圖像中運動變化部分很靈敏,有特征抽取作視覺空間頻率特性亮暗在空間上作正弦變化的條紋圖案,物理對比度和感覺對比度之比隨空間頻率變化而變化的曲線,稱為調(diào)制傳遞函數(shù)MTF(ModulationTransferFunction)對比靈敏度100010010110100典型MTF曲線空間頻率/cdeg-1視覺空間頻率特性亮暗在空間上作正弦變化的條紋圖案,物理對比度閃爍對MTF的影響閃爍頻率為1HZ閃爍頻率為6HZ閃爍頻率為16HZ閃爍頻率為20HZ對比靈敏度300100301030.3131030空間頻率/cdeg-1閃爍對MTF的影響閃爍頻率為1HZ對3000.31視覺時間頻率特性125102050Hz視覺閾值0.01
0.1時間頻率特性時間頻率/Hz視覺時間頻率特性125視覺的簡單數(shù)學(xué)模型亮度視覺模型彩色視覺模型視覺的簡單數(shù)學(xué)模型亮度視覺模型1、亮度視覺模型
輸入圖像Ii(x,y)光學(xué)系統(tǒng)H(
x,
y)輸出圖像Io(x,y)線性光學(xué)系統(tǒng)光學(xué)系統(tǒng)的調(diào)制傳遞函數(shù)MTF
1、亮度視覺模型輸入圖像光學(xué)系統(tǒng)輸出圖像線性光學(xué)系統(tǒng)光學(xué)系神經(jīng)信號光接受器對數(shù)線性系統(tǒng)黑白視覺對數(shù)模型簡單的黑白視覺對數(shù)模型神經(jīng)信號光接受器對數(shù)線性系統(tǒng)黑白視覺對數(shù)模型簡單的黑白視覺對號數(shù)-2-4側(cè)抑制結(jié)構(gòu)…………LOGa1LOGanLOGa2
網(wǎng)膜信號感受器加權(quán)因子LOGa1LOGa0LOGan視覺信息的融合號數(shù)-2-4側(cè)抑制結(jié)構(gòu)…………LOGa1LOGanLOGa2inout|H2(Wx,Wy)|
|H1(Wx,Wy)|H1(Wx,Wy)H2(Wx,Wy)H3(Wx,Wy)光感受器線性系統(tǒng)線性系統(tǒng)線性系統(tǒng)非線性網(wǎng)絡(luò)|H3(Wx,Wy)|黑白視覺擴展模型inout|H2(Wx,Wy)||H1(Wx,Wy)|Thomas—Young三色假說
g3g1g2d3d2d1e3e1e2線性系統(tǒng)-黃綠色視錐感受器藍(lán)色視錐感受器綠色視錐感受器LOGLOGLOG+
-+
H2(Wx,Wy)H1(Wx,Wy)H3(Wx,Wy)神經(jīng)信號彩色視覺模型2、彩色視覺模型Thomas—Young三色假說g3g1g2d3d2d1e彩色響應(yīng)在上圖模型中,e1、e2、e3代表視網(wǎng)膜三個具有S1(
)、S2(
)、S3(
)譜靈敏度的感受器,其輸出分別為C(
)為入射光譜的能量分布函數(shù)彩色響應(yīng)在上圖模型中,e1、e2、e3代表視網(wǎng)膜三個具有S1彩色信息融合e1、e2、e3經(jīng)對數(shù)傳遞后合并為d1、d2、d3并輸出:彩色信息融合e1、e2、e3經(jīng)對數(shù)傳遞后合并為d1、d2、d波長(nm)S1(
)S2(
)S3(
)相對靈敏度1.00.50450500550600650根據(jù)Konig數(shù)據(jù)得到的視網(wǎng)膜錐狀細(xì)胞的色譜靈敏度曲線色譜靈敏度曲線波長(nm)S1()S2()S3()相1.0450彩色視覺擴展型模型線性系統(tǒng)-++-黃綠色視錐感受器藍(lán)色視錐感受器綠色視錐感受器HE2(Wx,Wy)HE1(Wx,Wy)HE3(Wx,Wy)非線性網(wǎng)絡(luò)非線性網(wǎng)絡(luò)非線性網(wǎng)絡(luò)
HL2(Wx,Wy)HL1(Wx,Wy)HL3(Wx,Wy)神經(jīng)信號彩色視覺擴展型模型線性系統(tǒng)-++-黃綠色視錐感受器藍(lán)色視錐感1.7*顏色視覺和色度學(xué)3個基本顏色——紅(R,red)、綠(G,green)和藍(lán)(B,blue)國際照明委員會(CIE),1931年規(guī)定3種基本色的波長為R:700nm,G:546.1nm,B:435.8nm1.7*顏色視覺和色度學(xué)3個基本顏色——紅(R,red)三色系統(tǒng)利用3基色疊加可產(chǎn)生光的3補色:品紅(M,magenta,即紅加藍(lán))、藍(lán)綠(C,cyan,即綠加藍(lán))、黃(Y,yellow,即紅加綠)。按一定的比例混合3基色或?qū)?個補色與相對的基色混合就可以產(chǎn)生白色。光的混合滿足加色定理彩色加法系統(tǒng)(左)與減法系統(tǒng)(右)三色系統(tǒng)利用3基色疊加可產(chǎn)生光的3補色:品紅(M,mage顏色特征區(qū)分顏色通常用3種基本特性:輝度(又常用亮度、明度)色調(diào)飽和度色調(diào)和飽和度合起來稱為色度。顏色可以用輝度和色度共同表示顏色特征區(qū)分顏色通常用3種基本特性:坐標(biāo)系顏色還可以用色品值r、g、b(相對色系數(shù))表示,定義如下,為組成某種顏色所需的紅、綠、藍(lán)的量稱為3個刺激量,分別用R、G、B表示:[C]=r[R]+g[G]+b[B]其中坐標(biāo)系顏色還可以用色品值r、g、b(相對色系數(shù))表示,定義如彩色匹配規(guī)則任何彩色可以用不多于三個基色配成混合色的光亮度等于各分量亮度之和人眼不能分解混合彩色的各個分量在某一亮度等級上的彩色匹配可適用于較寬的亮度范圍彩色相加定律:若一彩色C1與彩色C2相匹配(同樣彩色感覺),而彩色C’1與彩色C’2相混合的彩色匹配,可以如下表示[C1]=[C2],即C1彩色與C2彩色相匹配
1[C1]+
2
[C2],即一混合色包含1份的[C1]和
2份的[C2]彩色相加定律表示為若
[C1]=[C2],
[C’1]=[C’2]
則
1[C1]+
2
[C2]=
1[C’1]+
2
[C’2]彩色匹配規(guī)則任何彩色可以用不多于三個基色配成彩色匹配彩色相減:當(dāng)C1、C2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度木工行業(yè)展會策劃與執(zhí)行分包合同4篇
- 二零二五年度辦公樓綠化帶養(yǎng)護與清潔合同3篇
- 2025年產(chǎn)權(quán)激勵轉(zhuǎn)讓合同
- 2025版門窗產(chǎn)品進出口貿(mào)易合同范本7篇
- 2025年住宿服務(wù)預(yù)付款合同
- 2025版模具采購合同與模具租賃合作協(xié)議4篇
- 2025年土地測繪勘測合同范本
- 2025年度南京市二手房購房合同(附裝修改造協(xié)議)4篇
- 2025年分期合同簽訂書籍
- 2025版創(chuàng)業(yè)孵化器創(chuàng)業(yè)培訓(xùn)班合作協(xié)議合同范本4篇
- (完整版)高考英語詞匯3500詞(精校版)
- 我的家鄉(xiāng)瓊海
- (2025)專業(yè)技術(shù)人員繼續(xù)教育公需課題庫(附含答案)
- 《互聯(lián)網(wǎng)現(xiàn)狀和發(fā)展》課件
- 【MOOC】計算機組成原理-電子科技大學(xué) 中國大學(xué)慕課MOOC答案
- 2024年上海健康醫(yī)學(xué)院單招職業(yè)適應(yīng)性測試題庫及答案解析
- 2024年湖北省武漢市中考語文適應(yīng)性試卷
- 非新生兒破傷風(fēng)診療規(guī)范(2024年版)解讀
- 2024-2030年電炒鍋項目融資商業(yè)計劃書
- EDIFIER漫步者S880使用說明書
- 上海市華東師大二附中2025屆高二數(shù)學(xué)第一學(xué)期期末統(tǒng)考試題含解析
評論
0/150
提交評論