數(shù)字圖像處理基礎(chǔ)_第1頁
數(shù)字圖像處理基礎(chǔ)_第2頁
數(shù)字圖像處理基礎(chǔ)_第3頁
數(shù)字圖像處理基礎(chǔ)_第4頁
數(shù)字圖像處理基礎(chǔ)_第5頁
已閱讀5頁,還剩222頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1北京航空航天大學(xué)儀器科學(xué)與光電工程學(xué)院School of Instrumentation Science & Optoelectronics Engineering數(shù)字圖像處理Digital Image Processing2第二章 數(shù)字圖像處理基礎(chǔ)要想成功,就必須弄清基礎(chǔ)問題。 亞里士多德 3本章的主要目的-數(shù)字圖像處理的一些基本概念 2.1節(jié)簡(jiǎn)述人類視覺系統(tǒng)的機(jī)理。 2.2節(jié)討論光、電磁波譜的其他分量及它們的成像特點(diǎn)。 2.3節(jié)討論成像傳感器及怎樣使用它們產(chǎn)生數(shù)字圖像。 2.4節(jié)介紹均勻圖像取樣及灰度量化的概念。 2.5節(jié)介紹像素間的各種基本關(guān)系。 2.6節(jié)介紹本書用到的主要數(shù)學(xué)工具。4

2、2.1 視覺感知要素52.1.1 人眼的基本構(gòu)造角膜虹膜睫狀肌睫狀小帶視軸玻璃體中央凹盲點(diǎn)視網(wǎng)膜神經(jīng)和鞘脈絡(luò)膜鞏膜晶狀體前房睫狀體6上圖顯示了人眼的一個(gè)簡(jiǎn)化水平剖面。眼睛的形狀近似為一個(gè)球體,其平均直徑約為20mm。有三層薄膜包圍著眼睛:1、角膜與鞏膜外殼;2、脈絡(luò)膜;3、視網(wǎng)膜。1、角膜是一種硬而透明的組織,覆蓋著眼睛的前表面。2、鞏膜與角膜相連,鞏膜是一層包圍著眼球其余部分的不透明的膜。 73、脈絡(luò)膜位于鞏膜的正下方。 4、脈絡(luò)膜的最前面分為睫狀體和虹膜。 5、虹膜的收縮和擴(kuò)張控制著進(jìn)入眼睛的進(jìn)光量。虹膜中間的開口(瞳孔)的直徑是可變的,范圍大約在28mm。6、晶狀體由同心的纖維細(xì)胞層組成

3、,并由附在睫狀體上的纖維懸掛著。87、眼睛最里面的膜是視網(wǎng)膜,它布滿了整個(gè)后部的內(nèi)壁。當(dāng)眼睛適當(dāng)?shù)鼐劢箷r(shí),來自眼睛外部物體的光在視網(wǎng)膜上成像。由視網(wǎng)膜表面分布的不連續(xù)的光感受器提供了圖案視覺。有兩類光感受器:錐狀體和桿狀體。9每只眼睛中的錐狀體數(shù)量在600-700萬之間。它們主要位于視網(wǎng)膜的中間部分,稱之為中央凹,且對(duì)顏色高度敏感。通過這些錐狀體,人可以充分地分辨圖像細(xì)節(jié)。錐狀體視覺稱為白晝視覺或亮視覺。10桿狀體的數(shù)量更多:約有7500-15000萬個(gè)桿狀體分布在視網(wǎng)膜表面。桿狀體用來給出視野內(nèi)的一般的總體圖像。它們沒有彩色感覺,而對(duì)低照明度敏感。桿狀體視覺稱為暗視覺或微光視覺。 11視網(wǎng)膜

4、桿狀體和錐狀體的分布盲點(diǎn)桿狀體(夜視覺)錐狀體(白晝視覺)中央凹12中央凹本身是視網(wǎng)膜中直徑約為1.5mm的圓形凹坑。我們可以把中央凹看成是大小為1.5mm1.5mm的方形傳感器陣列。在視網(wǎng)膜這一區(qū)域中,錐狀體的密度大約為15萬個(gè)/mm2。基于這一近似,眼睛中最高敏感區(qū)域中央凹的錐狀體數(shù)量約為33.7萬個(gè)。從自然分辨能力的角度看,恰好與一個(gè)中等分辨率的電荷耦合元件CCD成像芯片具有的元素?cái)?shù)量相當(dāng),接收器陣列不大于5mm5mm。 13頂尖學(xué)術(shù)期刊Cell2019年2月21日新出爐的一期,封面格外吸引人的“眼球”:我們?nèi)祟惖囊晃淮笮值苷劬珪?huì)神地“看”著什么人類的視覺出類拔萃,比如我們能夠閱讀,分

5、辨人臉。這些功能可不簡(jiǎn)單,需要視覺能夠分辨極細(xì)微的差異,并能迅速對(duì)焦。高清視覺全得歸功于視網(wǎng)膜中間一個(gè)極小的特殊區(qū)域中央凹,也就是眼底黃斑的中心。中央凹的直徑不到1.5毫米,面積只占視網(wǎng)膜的不到1%,但大腦獲得的視覺信息卻有50%來自這里。14中央凹的特殊,還不僅是因?yàn)橐暰€的“焦點(diǎn)”落在此處提供清晰影像,只有部分靈長類生物進(jìn)化出了這個(gè)結(jié)構(gòu),比如人類。中央凹處的細(xì)胞檢測(cè)到表達(dá)與外周不一樣的基因。非常有意思的是,這些基因的表達(dá)和中央凹獨(dú)特的視覺信息處理極為相關(guān),科學(xué)家們相信,可能這才是中央凹功能特殊的原因。15162.1.2 人眼的成像過程在普通照相機(jī)中,鏡頭有固定的焦距,各種距離的聚焦是通過改變

6、鏡頭和成像平面間的距離實(shí)現(xiàn)的,CCD成像芯片放置在成像平面上。在人眼中,則與此相反。晶狀體和成像區(qū)域(視網(wǎng)膜)之間的距離是固定的,實(shí)現(xiàn)正確聚焦的焦距是通過改變晶狀體的形狀來得到的,睫狀體中的纖維可實(shí)現(xiàn)這一功能,在遠(yuǎn)離或接近目標(biāo)物時(shí)纖維會(huì)分別變扁或加厚晶狀體。17如何得到一幅在視網(wǎng)膜上形成的圖像的尺度?h表示視網(wǎng)膜圖像中物體的高度h=2.55mm18視網(wǎng)膜圖像主要聚焦在中央凹區(qū)域。然后,光接收器的相對(duì)刺激作用產(chǎn)生感知,把輻射能轉(zhuǎn)變?yōu)殡娒}沖,最后由大腦解碼。復(fù)旦Nature Communications“人工視網(wǎng)膜”來了,幫助恢復(fù)小鼠視覺失明的原因有很多,不過其中之一就是視網(wǎng)膜的視錐和視桿細(xì)胞發(fā)生

7、了病變,無法順利使光信號(hào)轉(zhuǎn)變?yōu)殡娦盘?hào)。這些光感受器細(xì)胞如果不能行使正常的功能,即使眼睛的其他部分都是健康的,也不能夠產(chǎn)生有質(zhì)量的視覺。19視網(wǎng)膜中的光感受器一旦損傷或退變,由于不能自行修復(fù),往往會(huì)導(dǎo)致失明。如果能夠使用人工光感受器來替代原有的視網(wǎng)膜功能,對(duì)于黃斑變性等疾病的患者來說,將是巨大的希望。來自復(fù)旦大學(xué)的研究團(tuán)隊(duì)開發(fā)了一種“人工視網(wǎng)膜”,這是一種光敏感的納米線陣列感受器。研究人員將之植入失明小鼠的眼底,成功使得小鼠的視覺得到了恢復(fù)。20相關(guān)研究題為Nanowire arrays restore vision in blind mice,2018年3月6日發(fā)表在Nature Commun

8、ications上。這種光感受器使用的是金/氧化鈦納米線陣列,陣列由二氧化鈦納米線組成,上面用金納米顆粒修飾。21研究人員將這種“人工視網(wǎng)膜”植入了小鼠的眼底。當(dāng)接收光照射時(shí),小鼠的瞳孔會(huì)縮小,視網(wǎng)膜中的神經(jīng)節(jié)細(xì)胞恢復(fù)了對(duì)光的響應(yīng)。神經(jīng)節(jié)細(xì)胞能把視覺信號(hào)經(jīng)視神經(jīng)向大腦視覺中樞傳遞。這是由于納米線陣列吸收光線后,產(chǎn)生光電壓并觸發(fā)附近神經(jīng)元的電活動(dòng),從而恢復(fù)小鼠對(duì)光的敏感性。22這種納米線光感受器有效地替代了原有視網(wǎng)膜中的視桿細(xì)胞和視錐細(xì)胞,因而,在植入后能夠觀察到視覺中樞的神經(jīng)元也恢復(fù)了對(duì)光的響應(yīng),同時(shí),瞳孔對(duì)光的反射也有所改善。這種新一代可植入人工光感受器為黃斑變性等視網(wǎng)膜疾病提供了一個(gè)新的治

9、療選擇:通過人工光感受器的植入,幫助患者恢復(fù)對(duì)視覺的響應(yīng)。23具有光響應(yīng)、可植入視網(wǎng)膜的納米線陣列恢復(fù)盲小鼠視覺24中國科大在實(shí)現(xiàn)動(dòng)物裸眼紅外圖像視覺上取得進(jìn)展中國科學(xué)技術(shù)大學(xué)生命科學(xué)與醫(yī)學(xué)部與美國馬薩諸塞州州立大學(xué)醫(yī)學(xué)院合作,結(jié)合視覺神經(jīng)生物醫(yī)學(xué)與創(chuàng)新納米技術(shù),首次實(shí)現(xiàn)動(dòng)物裸眼紅外光感知和紅外圖像視覺能力。該研究成果于2019年2月28日在線發(fā)表于國際頂級(jí)期刊Cell上,并被Cell雜志選為本期唯一科普視頻進(jìn)行重點(diǎn)推廣。25能被我們眼睛感受的可見光只占電磁波譜里很小的一部分,這是由眼睛視網(wǎng)膜里感光細(xì)胞中的感光蛋白所固有的物理化學(xué)特性所決定的。在生物進(jìn)化歷程中,沒有出現(xiàn)任何基于感光蛋白的,能夠

10、感知超過700nm的紅外光的動(dòng)物感光細(xì)胞,更無法在大腦中形成紅外光圖像視覺。26為解決上述問題并發(fā)展裸眼無源紅外視覺拓展技術(shù),嘗試?yán)靡环N可吸收紅外光發(fā)出可見光的上轉(zhuǎn)換納米材料,導(dǎo)入動(dòng)物視網(wǎng)膜中以實(shí)現(xiàn)紅外視覺感知。在視網(wǎng)膜下腔注射pbUCNP納米顆粒的小鼠不僅獲得感知紅外線的能力,還可以分辨復(fù)雜的紅外圖像。在獲得紅外視覺的同時(shí),小鼠的可見光視覺沒有受到影響。27這項(xiàng)技術(shù)不僅能賦予我們超級(jí)視覺能力,通過開發(fā)具有不同吸收和發(fā)射光譜參數(shù)的納米材料,還有可能輔助修復(fù)視覺感知波譜缺陷相關(guān)疾病,例如紅色色盲。28292.1.3 亮度適應(yīng)和辨別因?yàn)閿?shù)字圖像作為離散的灰度集來顯示,所以眼睛對(duì)不同亮度級(jí)別之間的

11、辨別能力在顯示圖像處理結(jié)果中是一個(gè)重要的考慮因素。 30人的視覺系統(tǒng)能夠適應(yīng)的光強(qiáng)度級(jí)別范圍是很寬的從暗閾值到強(qiáng)閃光約有1010個(gè)量級(jí)。實(shí)驗(yàn)數(shù)據(jù)指出,主觀亮度(即由人的視覺系統(tǒng)感知的亮度)是進(jìn)入人眼的光強(qiáng)的對(duì)數(shù)函數(shù)。31光強(qiáng)度與主觀亮度的關(guān)系曲線光強(qiáng)的對(duì)數(shù)亮視覺暗閾值強(qiáng)閃光 主觀亮度 適應(yīng)范圍暗視覺32感知亮度不是簡(jiǎn)單的強(qiáng)度的函數(shù) 視覺系統(tǒng)往往會(huì)在不同強(qiáng)度區(qū)域的邊界處出現(xiàn)“下沖”或“上沖”現(xiàn)象。 馬赫帶:厄恩斯特馬赫于1865年首次描述了這一現(xiàn)象。 33感知區(qū)域的亮度并不簡(jiǎn)單地取決于其強(qiáng)度。 所有的中心方塊都有相同的強(qiáng)度,但是當(dāng)背景變亮?xí)r,它們就逐漸變暗。34在錯(cuò)覺中,眼睛填充了不存在的信息或

12、者錯(cuò)誤地感知了物體的幾何特點(diǎn)。 352.2 光和電磁波譜36電磁波譜37電磁波譜及可見光譜彩色光的電磁能譜跨越0.43m(紫色)-0.79m(紅色)的范圍。38人眼感受顏色的性質(zhì)人感受物體的顏色由物體反射光的性質(zhì)決定。以所有可見波長相對(duì)平衡地反射光的物體,對(duì)觀察者而言是白色的。一個(gè)物體在可見光譜的有限范圍內(nèi)反射時(shí)會(huì)呈現(xiàn)各種顏色色調(diào)。例如,綠色物體反射波長范圍為500570nm的光,而吸收其它波長的大部分能量。39沒有顏色的光稱為單色光或無色光。單色光的唯一屬性是它的強(qiáng)度或大小。單色光的強(qiáng)度:黑色灰色白色。從黑到白的單色光的度量值范圍通常稱為灰度級(jí),而單色圖像常稱為灰度圖像。40描述彩色光源的質(zhì)

13、量的三個(gè)量有三個(gè)基本量用于描述彩色光源的質(zhì)量:發(fā)光強(qiáng)度、光通量和亮度:發(fā)光強(qiáng)度:是從光源流出能量的總量,通常用瓦特(W)來度量。流明數(shù)(lm):用流明數(shù)度量的光通量給出觀察者從光源感受到的能量。(例如遠(yuǎn)紅外光譜感受不到)亮度:是光感知的主觀描繪子,它實(shí)際上不能度量。它具體體現(xiàn)了強(qiáng)度的無色概念,是描述彩色感覺的參數(shù)之一。 41 原理上,如果可以開發(fā)出一種傳感器來檢測(cè)由一種電磁波譜發(fā)射的能量,那么我們就可以在該波段上對(duì)感興趣的事件成像。但要注意的一點(diǎn)是,要求“看到”一個(gè)物體的電磁波的波長必須小于等于物體的尺寸。42圖像成像的途徑與方式成像以電磁波發(fā)射的能量為基礎(chǔ);物體反射的聲波也可用于形成超聲波圖

14、像;電子顯微鏡的電子束成像; 用于圖形與可視化的合成圖像。432.3 圖像感知和獲取44我們感興趣的多數(shù)圖像都是由“照射”源和形成圖像的“場(chǎng)景”元素對(duì)光能的反射或吸收而產(chǎn)生的。照射可以由電磁波譜的能源引起。場(chǎng)景元素可能是熟悉的物體,也可以是分子、沉積巖或人類的大腦。 45依賴光源的特性,照射被物體反射或透射。第一類例子是從平坦表面反射。第二類例子是為了產(chǎn)生一幅X射線照片,讓X射線透過病人的身體。46將照射能量變換為數(shù)字圖像的傳感器配置:通過將對(duì)特殊類型檢測(cè)能源(電磁波譜的某個(gè)譜段)敏感的傳感器材料相組合,把輸入能源轉(zhuǎn)變?yōu)殡妷骸]敵鲭妷翰ㄐ问莻鞲衅鞯捻憫?yīng),通過把傳感器響應(yīng)數(shù)字化,從每一個(gè)傳感器得

15、到一個(gè)數(shù)字量。472009年度諾貝爾物理學(xué)獎(jiǎng)2009年度諾貝爾物理學(xué)獎(jiǎng)授予:美國科學(xué)家威拉德S博伊爾(Willard S. Boyle)和喬治E史密斯(George E. Smith)CCD(Charge Coupled Device)電荷耦合器件圖像傳感器48威拉德S博伊爾和喬治E史密斯因?yàn)?969年發(fā)明了成像半導(dǎo)體電路電荷藕合器件圖像傳感器CCD獲此殊榮。這一發(fā)明使得數(shù)碼相機(jī)、帶有攝像頭的手機(jī)等電子設(shè)備風(fēng)靡全球,人類已經(jīng)進(jìn)入了全民數(shù)碼影像的時(shí)代,每一個(gè)人都可以隨時(shí)、隨地、隨意地用影像記錄每一瞬間。49CCD圖像傳感器的發(fā)明,實(shí)際上是應(yīng)用愛因斯坦有關(guān)光電效應(yīng)理論的結(jié)果,即光照射到某些物質(zhì)上,

16、能夠引起物質(zhì)的電性質(zhì)發(fā)生變化。但是從理論到實(shí)踐,道路卻并不平坦??茖W(xué)家遇到的最大挑戰(zhàn),在于如何在很短的時(shí)間內(nèi),將每一個(gè)點(diǎn)上因?yàn)楣庹斩a(chǎn)生改變的大量電信號(hào)采集并且辨別出來。50經(jīng)過多次試驗(yàn),博伊爾和史密斯終于解決了上述難題。他們采用一種高感光度的半導(dǎo)體材料,將光線照射導(dǎo)致的電信號(hào)變化轉(zhuǎn)換成數(shù)字信號(hào)。它革新了攝影術(shù),使得光可以被電子化地記錄下來,取代了膠片。這一數(shù)字形式極大地方便了對(duì)圖像的處理和發(fā)送。51圖像傳感器的基本原理成像物鏡將外界照明光照射下的(或自身發(fā)光的)景物成像在物鏡的像面上,形成二維空間的光強(qiáng)分布(光學(xué)圖像)。能夠?qū)⒍S光強(qiáng)分布的光學(xué)圖像轉(zhuǎn)變成一維時(shí)序電信號(hào)的傳感器稱為圖像傳感器。

17、 52 2.3.1 使用單個(gè)圖像傳感器獲取圖像53單個(gè)傳感器通過運(yùn)動(dòng)來生成二維圖像 膠片轉(zhuǎn)動(dòng)線性運(yùn)動(dòng)膠片每旋轉(zhuǎn)一個(gè)增量且傳感器完整地從左向右線性移動(dòng)一次,輸出一行圖像。單個(gè)傳感器542.3.2 使用條帶圖像傳感器獲取圖像平板掃描儀航空成像55使用一個(gè)線性傳感器帶獲取圖像 每線性運(yùn)動(dòng)一個(gè)增量,輸出圖像的一行線性運(yùn)動(dòng)傳感器條帶成像區(qū)域56使用一個(gè)環(huán)形傳感器帶獲取圖像:醫(yī)學(xué)和工業(yè)計(jì)算機(jī)軸向斷層(CAT)成像的基礎(chǔ) Computerized Tomography計(jì)算機(jī)化X射線軸向分層成像 Magnetic Resonance Imaging 核磁共振成像 Positron Emission compu

18、ted Tomography 正電子發(fā)射斷層成像 57以圓環(huán)形方式安裝的傳感器帶用于醫(yī)學(xué)和工業(yè)成像,以得到三維物體的剖面(“切片”)圖像。傳感器的輸出必須由重建算法處理,重建算法的目的是把感知數(shù)據(jù)轉(zhuǎn)換為有意義的剖面圖像。582.3.3 使用圖像傳感器陣列獲取圖像每個(gè)傳感器單元的響應(yīng)正比于投射到傳感器表面的光能總量。59固體自掃描圖像傳感器固體自掃描圖像傳感器是20世紀(jì)70年代發(fā)展起來的新型圖像傳感器件,如面陣CCD器件,CMOS圖像傳感器件等。CCD器件按其感光單元的排列方式分為線陣CCD和面陣CCD兩類。60這類器件本身具有自掃描功能,例如面陣CCD固體攝像器件的光敏面能夠?qū)⒊上裼谄渖系墓鈱W(xué)

19、圖像轉(zhuǎn)換成電荷密度分布的電荷圖像。電荷圖像在驅(qū)動(dòng)脈沖的作用下按照一定的規(guī)則一行行地輸出,形成圖像信號(hào)。61線陣CCD結(jié)構(gòu)簡(jiǎn)單,成本較低??梢酝瑫r(shí)儲(chǔ)存一行電視信號(hào)。由于其單排感光單元的數(shù)目可以做得很多,在同等測(cè)量精度的前提下,其測(cè)量范圍可以做的較大。并且由于線陣CCD實(shí)時(shí)傳輸光電轉(zhuǎn)換信號(hào)和自掃描速度快、頻率響應(yīng)高,能夠?qū)崿F(xiàn)動(dòng)態(tài)測(cè)量,并能在低照度下工作。62所以線陣CCD廣泛地應(yīng)用在產(chǎn)品尺寸測(cè)量和分類、非接觸尺寸測(cè)量、條形碼等許多領(lǐng)域。 線陣CCD的優(yōu)點(diǎn)是一維像元數(shù)可以做得很多,而且像元尺寸比較靈活,幀幅數(shù)高,特別適用于一維動(dòng)態(tài)目標(biāo)的測(cè)量。63面陣CCD對(duì)于面陣CCD來說,應(yīng)用面較廣,如面積、形狀

20、、尺寸、位置,甚至溫度等的測(cè)量。面陣CCD的優(yōu)點(diǎn)是可以獲取二維圖像信息,測(cè)量圖像直觀。缺點(diǎn)是像元總數(shù)多,而每行的像元數(shù)一般較線陣少,幀幅率受到限制。64由于生產(chǎn)技術(shù)的制約,單個(gè)面陣CCD的面積很難達(dá)到一般工業(yè)測(cè)量對(duì)視場(chǎng)的需求。線陣CCD的優(yōu)點(diǎn)是分辨力高,價(jià)格低廉,但要用線陣CCD獲取二維圖像,必須配以掃描運(yùn)動(dòng),而且為了能確定圖像每一像素點(diǎn)在被測(cè)件上的對(duì)應(yīng)位置,必須配以光柵等器件以記錄線陣CCD每一掃描行的坐標(biāo)。65加拿大達(dá)爾薩(DALSA)公司 IT-P1-4096線陣CCD傳感器彩色線陣CCD圖像傳感器分辨率:4096像元尺寸:10m10m幀頻:4通道,23.7fps時(shí)鐘:425MHz動(dòng)態(tài)范

21、圍:70dB66加拿大達(dá)爾薩(DALSA)公司 FTF4052M/C全幀面陣CCD傳感器黑白/彩色全幀CCD圖像傳感器分辨率:40085344像元尺寸:9m9m幀頻:4通道,3.6fps時(shí)鐘:425MHz動(dòng)態(tài)范圍:72dB,線性67輸出數(shù)字圖像CCD成像芯片的圖像平面場(chǎng)景光源成像系統(tǒng)數(shù)字圖像獲取過程682.3.4 簡(jiǎn)單的圖像形成模型我們用形如f(x,y)的二維函數(shù)來表示圖像。在空間坐標(biāo)(x,y)處,f的值或幅度是一個(gè)正的標(biāo)量,其物理意義由圖像源決定。當(dāng)一幅圖像由物理過程產(chǎn)生時(shí),其亮度值正比于物理源(如電磁波)所輻射的能量。因此,f(x,y)一定是非零的和有限的,即 0f(x,y)69函數(shù)f(x

22、,y)可由兩個(gè)分量來表征:(1) 入射到被觀察場(chǎng)景的光源照射總量;(2) 場(chǎng)景中物體所反射的光照總量。這兩個(gè)分量分別稱為入射分量和反射分量,且分別表示為i(x,y)和r(x,y)。兩個(gè)函數(shù)作為一個(gè)乘積合并形成f(x,y)。70對(duì)于X射線成像,用透射系數(shù)代替反射函數(shù)。 71令單色圖像在任何坐標(biāo)(x0,y0)處的強(qiáng)度(灰度)表示為l=f(x0,y0),則l的取值范圍為Lminl Lmax。區(qū)間Lmin, Lmax稱為灰度級(jí)(或強(qiáng)度級(jí))。實(shí)際情況下常常令該區(qū)間為0, L-1,其中l(wèi)=0為黑色,l=L-1為白色。所有中間值是從黑色到白色之間變化的灰度色調(diào)。72計(jì)算機(jī)圖像處理所使用的數(shù)字圖像函數(shù)通常表示

23、成矩陣的形式,因而其坐標(biāo)是整數(shù)。圖像函數(shù)的定義域是平面的一個(gè)區(qū)域 R。 其中xm, yn表示最大的圖像坐標(biāo)。732.4 圖像取樣和量化74各種獲取圖像的方法的目的是就是從感知的數(shù)據(jù)生成數(shù)字圖像。多數(shù)傳感器的輸出是連續(xù)的電壓波形,這些波形的幅度和空間特性都與感知的物理現(xiàn)象有關(guān)。為了產(chǎn)生一幅數(shù)字圖像,我們需要把連續(xù)的感知數(shù)據(jù)轉(zhuǎn)換為數(shù)字形式。這種轉(zhuǎn)換包括兩種處理:取樣和量化。752.4.1 取樣和量化的基本概念為了用計(jì)算機(jī)來處理圖像,圖像必須用適當(dāng)?shù)碾x散數(shù)據(jù)結(jié)構(gòu)來表達(dá),例如,矩陣。傳感器獲取的圖像是平面上兩個(gè)坐標(biāo)的連續(xù)函數(shù)f(x,y)。圖像數(shù)字化是指將f(x,y)采樣(sampled)為一個(gè)M行N列

24、的矩陣。76圖像量化(quantization)給每個(gè)連續(xù)的樣本數(shù)值f一個(gè)整數(shù)數(shù)字。圖像函數(shù)f(x,y)的連續(xù)范圍被劃分為K個(gè)區(qū)間。采樣及量化越精細(xì)(即M,N,K越大),對(duì)連續(xù)函數(shù)的近似就越好。77一幅圖像的x和y坐標(biāo)及幅度可能都是連續(xù)的。為將它轉(zhuǎn)換為數(shù)字形式,必須在坐標(biāo)上和幅度上都進(jìn)行取樣操作。對(duì)坐標(biāo)值進(jìn)行數(shù)字化稱為取樣,對(duì)幅值數(shù)字化稱為量化。 78有兩個(gè)與圖像采樣有關(guān)的問題需要確定:其一是采樣的間隔,即相鄰兩個(gè)采樣圖像點(diǎn)的距離,其二是采樣點(diǎn)的幾何排列(采樣?xùn)鸥瘢?9一、采樣一個(gè)連續(xù)的圖像函數(shù)f(x,y)可以用平面上離散的柵格點(diǎn)來采樣。圖像的采樣點(diǎn)是:x=ix,y=jy,i=0, , M-

25、1,j=0, , N-1。兩個(gè)相鄰的采樣點(diǎn)在x軸上相差x,在y軸上相差y。距離x和y為(x或y軸上的)采樣間隔(sampling interval)。80采樣的矩陣f(ix, jy)構(gòu)成了離散圖像。規(guī)格化柵格上的理想采樣s(x,y)可以用一組狄拉克分布來表示:81采樣后的圖像fs(x,y)是連續(xù)圖像函數(shù)f(x,y)和采樣函數(shù)s(x,y)的乘積:公式中的狄拉克分布組合可以看作是周期為x和y的周期函數(shù)并展開為傅立葉級(jí)數(shù)。828384在圖像分析中Shannon采樣定理的一個(gè)簡(jiǎn)單的物理解釋是:設(shè)已知圖像中感興趣的最小細(xì)節(jié)的尺寸,采樣間隔應(yīng)該比它的一半要小。在實(shí)際的數(shù)字轉(zhuǎn)換器中采樣函數(shù)不是狄拉克分布,而

26、是有限沖擊函數(shù)。85一個(gè)連續(xù)圖像在采樣點(diǎn)處被數(shù)字化。這些采樣點(diǎn)是在平面上排列的,稱它們之間的幾何關(guān)系為柵格。柵格一般是方的。因此數(shù)字圖像是一個(gè)數(shù)據(jù)結(jié)構(gòu),通常是矩陣。86柵格中一個(gè)無限小的采樣點(diǎn)對(duì)應(yīng)數(shù)字化圖像中的一個(gè)像元或稱像素(pixel);全體像素覆蓋了整個(gè)圖像,實(shí)際的數(shù)字轉(zhuǎn)換器捕捉的像素具有有限的尺寸,這是因?yàn)椴蓸雍瘮?shù)不是一組理想的狄拉克沖激,而是一組有限沖激。87從圖像分析的角度看,像素是不能再分割的一個(gè)單位。我們也常用一個(gè)“點(diǎn)”來指一個(gè)像素。88不同采樣分辨率情況下的圖像89從低分辨率圖像重采樣成高分辨圖像90二、量化在圖像處理中,采樣的圖像數(shù)值fs(ix, jy)用一個(gè)數(shù)字來表示。將

27、圖像函數(shù)的連續(xù)數(shù)值(亮度)轉(zhuǎn)變?yōu)槠鋽?shù)字等價(jià)量的過程是量化(quantization) 。為了使人能夠覺察出圖像的細(xì)微變化,量化的級(jí)別要足夠的高。91大部分?jǐn)?shù)字圖像處理儀器都采用L個(gè)等間隔的量化方式。如果用k位來表示像素亮度的數(shù)值,那么亮度階就是L=2k。92通常采用每個(gè)像素8位的表示方式,也有采用6位或4位。二值化圖像,可以用1位來表示像素。有時(shí)也使用12位或更多位來表示一個(gè)像素。數(shù)字圖像的質(zhì)量取決于取樣和量化中所用的取樣數(shù)和灰度級(jí)。93 取樣數(shù)字化坐標(biāo) 量化數(shù)字化幅度值94連續(xù)圖像投影到傳感器陣列 圖像取樣和量化的結(jié)果32256灰度級(jí)的灰度斜坡9596256, 128, 64, 32灰度級(jí)的

28、圖像9716, 8, 4, 2灰度級(jí)的圖像1比特8比特的圖像98992.4.2 數(shù)字圖像表示有三種基本方法表示f(x,y):用兩個(gè)坐標(biāo)軸決定空間位置,第三個(gè)坐標(biāo)是以兩個(gè)空間變量x和y為函數(shù)的f值(灰度值);顯示f(x,y)出現(xiàn)在監(jiān)視器或照片上的情況;將f(x,y)的數(shù)值簡(jiǎn)單地顯示為一個(gè)陣列(矩陣)。100畫為表面圖形的圖像顯示為可視灰度陣列的圖像顯示為二維數(shù)值陣列的圖像101圖像的MN的數(shù)值陣列表示圖像的矩陣表示102數(shù)字圖像的原點(diǎn)位于左上角,其中正x軸向下延伸,正y軸向右延伸。這種方便的表示基于這樣的事實(shí):許多圖像顯示(譬如電視顯示器)掃描都是從左上角開始掃描第一行,然后向下移動(dòng)一行,繼續(xù)逐

29、行掃描。更重要的事實(shí)是矩陣的第一個(gè)元素按慣例應(yīng)在陣列的左上角。因此,將f(x,y)的原點(diǎn)選擇在左上角于數(shù)學(xué)上是講得通的。103原點(diǎn)在左上角,縱坐標(biāo)垂直向下,橫坐標(biāo)水平向右。104數(shù)字化過程要求針對(duì)M值、N值和離散灰度級(jí)數(shù)L做出判定:M和N:必須取正整數(shù);L:L2k 105圖像系統(tǒng)的動(dòng)態(tài)范圍 圖像系統(tǒng)的動(dòng)態(tài)范圍定義為系統(tǒng)中最大可度量灰度與最小可檢測(cè)灰度之比。作為一條規(guī)則,上限取決于飽和度,下限取決于噪聲?;旧希瑒?dòng)態(tài)范圍由系統(tǒng)能表示的最低和最高灰度級(jí)來確定。因此,也是圖像具有的動(dòng)態(tài)范圍。 106飽和度是指超過這個(gè)值的灰度級(jí)將被剪切掉這樣的一個(gè)最高值(注意整個(gè)飽和區(qū)域具有恒定的高灰度級(jí)) 噪聲10

30、7圖像的對(duì)比度 我們定義一幅圖像中最高和最低灰度級(jí)間的灰度差為對(duì)比度。當(dāng)一幅圖像中像素可感知的數(shù)值有高的動(dòng)態(tài)范圍時(shí),那么我們認(rèn)為該圖像具有高的對(duì)比度。相反,具有低動(dòng)態(tài)范圍的圖像就很呆滯,看上去像沖淡了灰度。 108低對(duì)比度高對(duì)比度109低對(duì)比度高對(duì)比度110存儲(chǔ)數(shù)字圖像所需的比特?cái)?shù)存儲(chǔ)數(shù)字圖像所需的比特?cái)?shù)b為:當(dāng)M=N時(shí),該式變?yōu)椋合卤碇酗@示了N和k取不同值時(shí)需要用來存貯方形圖像的比特?cái)?shù)。括號(hào)中的數(shù)字表示對(duì)應(yīng)于每個(gè)k值的灰度級(jí)數(shù)。111存儲(chǔ)不同大小和不同灰度級(jí)圖像所需的比特?cái)?shù)N和k取不同值時(shí)存儲(chǔ)所需的比特?cái)?shù),L是灰度級(jí)數(shù)。當(dāng)一幅圖像有L=2k個(gè)灰度級(jí)時(shí),實(shí)際上通常稱該圖像為一幅“k比特圖像”。

31、 1122.4.3 空間和灰度分辨率空間分辨率是圖像中可辨別的最小細(xì)節(jié)的度量。在數(shù)量上,空間分辮率可以有很多方法來說明。其中每單位距離線對(duì)數(shù)和每單位距離點(diǎn)數(shù)(像素?cái)?shù))是最通用的度量。假設(shè)我們用交替的黑色和白色垂直線來構(gòu)造一幅圖形,其中線寬為W個(gè)單位(W可以小于1)。線對(duì)的寬度就是2W,每單位距離有1/2W個(gè)線對(duì)。例如,如果一條線的寬度是0.1mm,每單位距離(mm)就有5個(gè)線對(duì)。廣泛使用的圖像分辨率的定義是每單位距離可分辨的最大線對(duì)數(shù)量(譬如每毫米100個(gè)線對(duì))。113每單位距離點(diǎn)數(shù)是印刷和出版業(yè)中常用的圖像分辨率的度量。在美國,這一度量通常使用每英寸點(diǎn)數(shù)(dot per inch, dpi)

32、來表示。例如,報(bào)紙用75 dpi的分辨率來印刷,雜志是133 dpi,光鮮的小冊(cè)子是175 dpi,書頁是以2044 dpi印刷的。114灰度分辮率是指在灰度級(jí)中可分辨的最小變化?;谟布紤],正如前一節(jié)中提到的那樣,灰度級(jí)數(shù)通常是2的整數(shù)次冪。最通用的是2的8次冪=256個(gè)灰度級(jí)。不像空間分辨率必須以每單位距離為基礎(chǔ)才有意義,而灰度分辨率指的則是用于量化灰度的比特?cái)?shù)。例如,通常說一幅被量化為256級(jí)的圖像有8比特的灰度分辨率。 115降低空間分辨率的典型效果1250 dpi300 dpi150 dpi72 dpi116具有少量細(xì)節(jié)的圖像 具有中等程度細(xì)節(jié)的圖像 具有大量細(xì)節(jié)的圖像 研究N和k

33、之間的關(guān)系:三類圖像的典型等偏愛曲線。位于等偏愛曲線上的點(diǎn)對(duì)應(yīng)于有相等的主觀判定質(zhì)量的圖像。等偏愛曲線:人為主觀感受到的圖像的質(zhì)量1172.4.4 圖像內(nèi)插內(nèi)插是在諸如放大、收縮、旋轉(zhuǎn)和幾何校正等任務(wù)中廣泛應(yīng)用的基本工具。 從根本上看,內(nèi)插是用已知數(shù)據(jù)來估計(jì)未知位置的數(shù)值的處理。 118幾何變換的目的幾何變換可以消除圖像獲取時(shí)所出現(xiàn)的幾何變形。如果我們需要匹配同一物體的兩幅不同的圖像,也需要用到幾何變換。幾何失真的形成119幾何失真的校正120幾何失真的校正121122圖像的桶形和枕形畸變桶形畸變正常圖像枕形畸變123幾何變換包括的兩個(gè)步驟空間變換:對(duì)圖像平面上的像素進(jìn)行重新排列以恢復(fù)原空間關(guān)

34、系;灰度插值:對(duì)空間變換后的像素賦予相應(yīng)的灰度值以恢復(fù)原位置的灰度值。124一、空間變換設(shè)原圖像為f(x,y),受到幾何形變的影響變成g(x,y),這里(x,y)表示失真圖像的坐標(biāo),它已不是原坐標(biāo)(x,y)了。上述變化在一般情況下可表示為:其中s(x,y)和t(x,y)代表產(chǎn)生幾何失真圖像的兩個(gè)空間變換函數(shù)。125最簡(jiǎn)單的情況是線性失真:對(duì)一般的非線性二次失真:如果知道s(x,y)和t(x,y)的解析表達(dá),就可以通過反變換來恢復(fù)圖像。126在實(shí)際中通常不知道解析表達(dá),為此需要在恢復(fù)過程的輸入圖(失真圖)和輸出圖(校正圖)上找一些其位置確切知道的點(diǎn)(稱為約束對(duì)應(yīng)點(diǎn)),然后利用這些點(diǎn)根據(jù)失真模型計(jì)

35、算出失真函數(shù)中的各個(gè)系數(shù),從而建立兩幅圖像間其它像素空間位置的對(duì)應(yīng)關(guān)系。127下圖中給出了一個(gè)在失真圖上的四邊形區(qū)域和在校正圖上與其對(duì)應(yīng)的四邊形區(qū)域。這兩個(gè)四邊形的頂點(diǎn)可作為對(duì)應(yīng)點(diǎn)。設(shè)在四邊形區(qū)域內(nèi)的幾何失真過程可用一對(duì)雙線性等式表示。(是一般非線性二次失真的一種特例)128失真圖校正圖兩個(gè)四邊形區(qū)域共有4組(8個(gè))已知對(duì)應(yīng)點(diǎn),所以上面兩式中的8個(gè)系數(shù)可以全部求得。129二、灰度插值的兩種方案下圖中左邊是理想的原始不失真圖,右邊是實(shí)際采集的失真圖。幾何校正就是要把失真圖恢復(fù)成原始圖。原始的不失真圖實(shí)際采集的失真圖原始圖失真圖130由圖可見,由于失真,原始圖中整數(shù)坐標(biāo)點(diǎn)(x,y)映射到失真圖中的

36、非整數(shù)坐標(biāo)點(diǎn)(x,y),而該點(diǎn)的灰度值是沒有定義的。前面討論的空間變換可將應(yīng)在原圖(x,y)處的(x,y)點(diǎn)變換回原圖(x,y)處?,F(xiàn)在要做的是估計(jì)點(diǎn)(x,y)的灰度值以賦給原圖(x,y)處的像素。131前向映射和后向映射的定義灰度插值在實(shí)現(xiàn)時(shí)可以有兩種方案:前向映射:把實(shí)際采集的失真圖像的像素灰度賦給原始的不失真圖像的像素。例如,如果一個(gè)失真圖像的像素映射到不失真圖像四個(gè)像素之間(非整數(shù)點(diǎn)),則將失真圖像素的灰度根據(jù)插值算法分配給不失真的那4個(gè)像素。132前向映射實(shí)際采集的失真圖原始的不失真圖原始圖失真圖133后向映射:把灰度從原始的不失真圖像中映射到實(shí)際采集的失真圖像上。例如,如果一個(gè)不失

37、真圖像的像素映射到失真圖的四個(gè)像素之間(非整數(shù)點(diǎn)),則先根據(jù)灰度插值算法計(jì)算出該位置的灰度,再將其映射到不失真圖像的對(duì)應(yīng)像素。134后向映射實(shí)際采集的失真圖原始的不失真圖失真圖原始圖135前向映射和后向映射的比較前向映射:(失真圖像不失真圖像)由于在前向映射中,有一定數(shù)量的失真圖像的像素有可能會(huì)映射到不失真圖像之外,所以有些計(jì)算方面的浪費(fèi)。另外,不失真圖像中的許多像素的最后灰度是由許多失真圖像像素的貢獻(xiàn)之和決定的,這也需要較多的尋址。136后向映射:(不失真圖像失真圖像)相對(duì)來說,后向映射效率比較高。不失真圖像是逐個(gè)像素得到的,每個(gè)像素的灰度值是由進(jìn)一步的插值確定的,所以后向映射在實(shí)際中用得更

38、廣泛。被許多空間變換的商業(yè)實(shí)現(xiàn)所采用,例如MATLAB。 137三、灰度插值的計(jì)算對(duì)灰度插值的計(jì)算方法有多種。最近鄰插值;雙線性插值;三次線性插值。1381、最近鄰插值最近鄰插值就是將離(x,y)點(diǎn)最近的像素的灰度值作為(x,y)點(diǎn)的灰度值賦給原圖(x,y)處的像素。計(jì)算量小,但不夠精確。原始的不失真圖實(shí)際采集的失真圖理想圖失真圖1392、雙線性插值為了提高精度,可采用雙線性插值。它利用點(diǎn)(x,y)的四個(gè)最近鄰像素的灰度值來計(jì)算(x,y)點(diǎn)處的灰度值。設(shè)(x,y)點(diǎn)的四個(gè)最近鄰像素為A、B、C、D。其坐標(biāo)分別為(i, j), (i+1, j), (i, j+1), (i+1, j+1)。其灰度

39、值分別為g(A)、g(B)、g(C)、g(D)。140141將雙線性插值的思路推廣,只利用(x,y)點(diǎn)的任意3個(gè)不共線的近鄰像素的灰度值就可計(jì)算(x,y)點(diǎn)處的灰度值。1423、三次線性插值如果需要更高的精度,還可以采用三次線性插值方法。它利用點(diǎn)(x,y)的16個(gè)最近鄰像素的灰度值,根據(jù)下面的方法計(jì)算點(diǎn)(x,y)處的灰度值。設(shè)點(diǎn)(x,y)的16個(gè)最近鄰像素為:A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P,則計(jì)算點(diǎn)(x,y)的插值公式為:商業(yè)圖像編輯程序的標(biāo)準(zhǔn)內(nèi)插方法,例如Adobe Photoshop和Corel Photopaint。143其中

40、g()表示相應(yīng)16個(gè)最近鄰像素的灰度值。Wx為橫坐標(biāo)插值的加權(quán)值,Wy為縱坐標(biāo)插值的加權(quán)值,分別計(jì)算如下:144如果g()的橫坐標(biāo)值與x的差值dx小于1(即B, C, F, G, J, K, N, O),則:如果g()的橫坐標(biāo)值與x的差值dx大于1(即A, D, E, H, I, L, M, P),則:145如果g()的縱坐標(biāo)值與y的差值dy小于1(即E, F, G, H, I, J, K, L),則:如果g()的縱坐標(biāo)值與y的差值dy大于1(即A, B, C, D, M, N, O, P),則:146復(fù)雜的幾何變換可以通過將圖像分解為更小的矩形子圖像來近似。對(duì)于每個(gè)子圖像可以用對(duì)應(yīng)的像素對(duì)來

41、估計(jì)一個(gè)簡(jiǎn)單的幾何變換。這樣幾何變換就可以在每個(gè)子圖像中分別修復(fù)了。147最近鄰插值雙線性插值雙三次插值由213162像素放大到36922812像素由426324像素放大到36922812像素148字母T的300 dpi圖像旋轉(zhuǎn)21 最近鄰插值 雙線性插值 雙三次插值 1492.5 像素間的一些基本關(guān)系150一幅數(shù)字圖像由有限大小的像素組成,像素反映圖像特定位置處的亮度信息。通常像素按照矩陣采樣?xùn)鸥癫贾谩N覀冇脙删S矩陣來表示這樣的數(shù)字圖像。矩陣的元素是整數(shù),對(duì)應(yīng)于亮度范圍的量化級(jí)別。1512.5.1 像素間的鄰域關(guān)系鄰域 4-鄰域 D-鄰域 8-鄰域 1524鄰域:像素p(x,y)的4鄰域是(

42、x+1, y),(x 1, y),(x, y+1),(x, y 1)。記為N4(p) 。D鄰域:像素p(x,y)的D鄰域是(x+1, y+1),(x+1, y1),(x1, y+1),(x1, y1)。 記為ND(p)。1538鄰域:像素p(x,y)的4個(gè)4-鄰域近鄰像素加上4個(gè)對(duì)角鄰域像素合起來構(gòu)成p的8-鄰域,記為N8(p)。1541552.5.2 像素間的鄰接和連通(一)像素的鄰接:兩個(gè)像素鄰接的兩個(gè)必要條件是:兩個(gè)像素的位置在空間上是否接觸;兩個(gè)像素的灰度值是否滿足某個(gè)特定的相似性準(zhǔn)則(例如它們的灰度值相等,或在同一個(gè)灰度值集合V中取值)。156令V是用于定義鄰接性的灰度值集合。在二值

43、圖像中,如果把具有1值的像素歸入鄰接的,則V=1。在灰度圖像中,概念是一樣的,但是集合V一般包括更多的元素。157例如,對(duì)于具有可能的灰度值在0到255范圍內(nèi)的像素的鄰接性,集合V可能是這256個(gè)值的任何一個(gè)子集??紤]三種類型的鄰接性,p, q為特殊像素。4-鄰接、8-鄰接、m-鄰接(混合鄰接)。1584-鄰接的定義:如果q在集合N4(p)中,則具有V中數(shù)值的兩個(gè)像素p和q是4-鄰接的。1598-鄰接的定義:如果q在集合N8(p)中,則具有V中數(shù)值的兩個(gè)像素p和q是8-鄰接的。160m-鄰接(混合鄰接)的定義:對(duì)于具有V中數(shù)值的兩個(gè)像素p和q,如果滿足條件1或者條件2:q在集合N4(p)中;q

44、在集合ND(p)中;并且N4(q)N4(p)中沒有來自V中數(shù)值的像素。注意:和兩個(gè)條件必須同時(shí)滿足。161m鄰接非m-鄰接滿足以上1或者2兩個(gè)條件之一,則稱具有V中數(shù)值的這兩個(gè)像素q和p是m-鄰接的,即4-鄰接和D-鄰接的混合鄰接,消除了8鄰接的二義性。162 8鄰接像素m-鄰接像素像素的排列163(三)像素的連通:在像素鄰接的基礎(chǔ)上,可進(jìn)一步討論和定義像素的連通。像素鄰接可以看作是像素連通的一種特例。為討論連通先來定義兩個(gè)像素間的通路。164從具有坐標(biāo)(x,y)的像素p,到具有坐標(biāo)(s, t)的像素q的通路是特定像素序列,其坐標(biāo)為:(x0, y0), (x1, y1), . , (xn, y

45、n)其中(x0,y0)=(x, y) 和 (xn, yn)=(s, t),(xi, yi) 鄰接于(xi-1, yi-1),1in,n是通路的長度。165可以由鄰接類型定義4-通路、8-通路和m-通路。4-通路8-通路m-通路166令S是圖像中的一個(gè)像素子集。如果S的全部像素之間存在一個(gè)通路,則可以說兩個(gè)像素p和q在S中是連通的。對(duì)于S中的任何像素p,S中連通到該像素p的像素集稱為S的連通分量。如果S中僅有一個(gè)連通分量,則集合S稱為連通集??紤]S是否是連通集?167關(guān)于連通集概念:如圖所示的一個(gè)圖像子集S,如果按照四鄰接定義,那么包括2個(gè)連通分量,因此S不是一個(gè)連通集;但是如果按照8鄰接定義,

46、就只包括1個(gè)連通分量,因此S是連通集。(連通集是對(duì)圖像子集來講的)1682.5.3 區(qū)域、邊界和邊緣令R是圖像中的一個(gè)像素子集。如果R是連通集,則稱R為一個(gè)區(qū)域。區(qū)域的概念使用了“連通性”的概念。因此,我們可以說區(qū)域是彼此連通的像素的集合。兩個(gè)區(qū)域,如果它們聯(lián)合形成一個(gè)連通集,則區(qū)域Ri和Rj稱為鄰接區(qū)域。定義區(qū)域鄰接時(shí),考慮4鄰接,8鄰接和m-鄰接。169考慮兩個(gè)圖像子集S1和S2,對(duì)于V=1,問題?確定S1和S2是: 4鄰接; 8鄰接; m-鄰接。170假設(shè)一幅圖像包括有K個(gè)不連接的區(qū)域,即Rk, k=1,2,K,且它們都不接觸圖像的邊界。令Ru代表所有K個(gè)區(qū)域的并集,并且令(Ru)c代表

47、其補(bǔ)集。我們稱Ru中的所有點(diǎn)為圖像的前景,而稱(Ru)c中的所有點(diǎn)為圖像的背景。171區(qū)域R的邊界是它自身的一個(gè)像素集合,其中的每個(gè)點(diǎn)具有一個(gè)或更多個(gè)不在R中的鄰點(diǎn),即邊界是區(qū)域的界限上的點(diǎn)的集合。邊界點(diǎn)之一172前述定義有時(shí)更加具體的稱為區(qū)域的內(nèi)邊界,以便與其外邊界相區(qū)分。外邊界對(duì)應(yīng)于背景邊界。在開發(fā)追蹤邊界的算法時(shí)這一區(qū)別很重要。為了保證結(jié)果形成一個(gè)閉合的通路,通常是沿著外邊界來追蹤邊界。173邊界追蹤算法-尋找外邊界1值區(qū)域的內(nèi)邊界是該區(qū)域本身,這一邊界并不滿足閉合通路的定義。1值區(qū)域的外邊界形成了一個(gè)圍繞該區(qū)域的閉合通路。基于4鄰域和8鄰域的內(nèi)、外邊界174175基于4鄰域的內(nèi)邊界基于

48、4鄰域的外邊界176基于8鄰域的內(nèi)邊界基于8鄰域的外邊界177邊緣(edge)是更深一步的概念。它是一個(gè)像素和其直接鄰域的局部性質(zhì),它是一個(gè)有大小和方向的矢量。邊界是與區(qū)域有關(guān)的全局概念,而邊緣表示圖像函數(shù)的局部性質(zhì)。178邊緣是由具有某些超過預(yù)先設(shè)定的閾值的導(dǎo)數(shù)值的像素形成的。邊緣的概念就是基于在進(jìn)行灰度級(jí)度量時(shí)不連續(xù)點(diǎn)的“局部”概念。可以把邊緣點(diǎn)連接成邊緣線段。邊緣和邊界吻合的一個(gè)例外是二值圖像的情況。微積分學(xué)中用導(dǎo)數(shù)描述連續(xù)函數(shù)的變化。圖像函數(shù)依賴于兩個(gè)變量,即圖像平面的坐標(biāo)。因此,描述邊緣的檢測(cè)算子使用偏導(dǎo)數(shù)。圖像函數(shù)的變化可以用指向圖像函數(shù)最大增長方向的梯度來表示。179邊緣的幅值是

49、梯度的幅值,邊緣方向是梯度方向旋轉(zhuǎn)-90的方向。梯度方向是函數(shù)最大增長的方向。在圖像分析中,邊緣一般用于尋找區(qū)域的邊界。梯度方向(與邊緣方向垂直)上的邊緣剖面對(duì)于邊緣具有典型性。180181182在2D圖像中,沿一定方向上剖面的4個(gè)參數(shù)進(jìn)行邊緣模型化位置:邊緣最大灰度變化處;斜率:邊緣在其朝向上的傾斜程度;均值:分屬邊緣兩邊像素的灰度均值;幅度:邊緣兩邊灰度均值間的差(反映了不連續(xù)或局部突變的程度)。183描述邊緣的4個(gè)參數(shù)1841852.5.4 像素之間的距離像素之間距離函數(shù)的定義:歐氏距離;D4距離(城市距離);D8距離(棋盤距離)。186給定3個(gè)像素p,q,r,坐標(biāo)分別為(x, y),(

50、s, t),(u, v),如果下列條件滿足的話,稱函數(shù)D是距離函數(shù)或度量。187距離總是正的(兩像素相同,距離為零)。距離與起、終點(diǎn)無關(guān)。兩像素最短距離沿直線。188歐氏距離p和q之間的歐基里德距離定義為:這個(gè)距離,是具有與(x,y)距離小于等于某個(gè)值r的那些像素,或是包含在以(x,y)為圓心以r為半徑的圓環(huán)中的那些點(diǎn)。189D4距離(城市距離)城區(qū)(city-block)距離:具有與(x, y)距離小于等于某個(gè)值 r 的那些像素形成一個(gè)菱形。例如距點(diǎn)(x, y)的D4距離小于等于2的像素形成下列輪廓。 190具有D4=1的像素是(x, y)的4-鄰域:191D8距離(棋盤距離)棋盤(ches

51、sboard)距離:具有D8=1的像素是(x,y)的8-鄰域。D8距離小于r的像素圍成一個(gè)矩形。192歐氏距離=5D4距離=7D8距離=4pqpqpq193p和q之間的D4和D8距離與任何通路無關(guān),通路可能存在于各點(diǎn)之間,因?yàn)檫@些距離僅與點(diǎn)的坐標(biāo)有關(guān)。然而,如果選擇m-鄰接,則兩點(diǎn)間的Dm距離由點(diǎn)間最短的通路定義。在這種情況下,兩像素間的距離將依賴于沿通路的像素值以及它們的鄰點(diǎn)值。194考慮值為1的像素鄰接,V=1 ??紤]一下p到p4的m通路長度。1952.6 數(shù)字圖像處理中所用數(shù)學(xué)工具196目的介紹在本書中所用的各種數(shù)學(xué)工具;通過把它們用于各種基本圖像處理任務(wù)來介紹如何使用這些工具。 1972.6.1 陣列與矩陣操作包含一幅或多幅圖像的陣列操作是以逐像素為基礎(chǔ)執(zhí)行的。圖像可以等價(jià)地被看成是矩陣。圖像間的操作是用矩陣?yán)碚搱?zhí)行的。陣列與矩陣操作間的區(qū)別必須搞清楚。 198本書采用陣列相乘考慮下面的22圖像:和 陣列相乘矩陣相乘199我們假設(shè)陣列操作貫穿全書:當(dāng)對(duì)一幅圖像的求冪時(shí),意味著每個(gè)像素

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論