版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第7章數(shù)字圖像處理的應用與發(fā)展7.1指紋識別技術7.1.1概述生物識別技術(BiometricIdentificationTechnology)是利用人體生物特征進行身份認證的一種技術。由于每個人的生物特征都有與其他人不同的唯一性和在一定時期內不變的穩(wěn)定性,不易偽造和假冒,所以利用生物識別技術進行身份認定,安全,可靠,準確。常見的生物識別技術主要有指紋、臉形、虹膜、視網膜、手寫體、聲音、掌紋、手形和臉部熱譜圖9種,指紋識別是生物識別技術
的一種。迄今為止,最為人們所關注、最為成熟的生物識別技術就是指紋識別。指紋識別技術7.1.2指紋識別系統(tǒng)分類自動指紋識別系統(tǒng)的工作模式可以分為2類:驗證模式(verification)和辨識模式(identification)。驗證就是通過把一個現(xiàn)場采集到的指紋與一個已經登記的指紋進行一對一的比對(onetoonematching),來確認身份的過程。驗證過程如圖1所示。辨識則是把現(xiàn)場采集到的指紋同指紋數(shù)據(jù)庫中的指紋逐一對比,從中找出與現(xiàn)場指紋相匹配的指紋。這也叫做“一對多匹配(one
to
many
matching)”。指紋辨識過程如圖2所示。指紋識別技術圖1指紋驗證過程指紋識別技術圖2指紋辨識過程7.1.3指紋識別系統(tǒng)工作原理一般來講,自動指紋識別算法體系大致由指紋圖
像采集、指紋圖像預處理、特征提取、指紋分類和指紋比對幾個部分組成。如圖所示。指紋識別系統(tǒng)工作原理1.指紋圖像采集較早出現(xiàn)的活體指紋采集設備是光電式的。后來出現(xiàn)的電容式和電感式的采集設備。到目前為止,光學采集頭提供了更加可靠的解決方案。通過改進原來的光學取像技術,新一代的光學指紋采集器更是以無可挑剔的性能與非常低的價格使電容方案相形見絀。光學技術需要一個光源從棱鏡反射到按在取像采集頭上的手指,光線照亮指紋從而采集到指紋。光學取像設備依據(jù)的是光的全反射原理(FTIR)。指紋識別系統(tǒng)工作原理2.預處理通常,指紋采集器采集到的指紋是低質量的,存在的噪聲較多。通過預處理,將采集到的指紋灰度圖像通過預濾波、方向圖計算、基于方向圖的濾波、二值化、細化等操作轉化為單像素寬的脊線線條二值圖像,基于此二值圖像對指紋的中心參考點,以及細節(jié)特征點特征等進行提取。指紋預處理的一般過程如圖所示。指紋識別系統(tǒng)工作原理3.特征提取指紋的特征點分為全局特征(如奇異點、中心點)和局部特征(指紋細節(jié)點)。在考慮局部特征的情況下,英國的E.R.Herry認為,在比對時只要
13個特征點重合,就可以確認是同一個指紋。指紋的細節(jié)特征可以有150種之多,但這些特征出現(xiàn)的概率并不相等,很多特征是極其罕見的。一般在自動指紋識別技術中只使用兩種細節(jié)特征:紋線端點與分叉點。紋線端點指的是紋線突然結束的位置,而紋線分叉點則是紋線突然一分為二的位置。大量統(tǒng)計結果和實際應用證明,這兩類特征點在指紋中出現(xiàn)的機會最多、最穩(wěn)定,而且比較容易獲取。指紋識別系統(tǒng)工作原理4.指紋分類指紋分類的主要目的是方便大容量指紋庫的管理,減小搜索空間,加速指紋匹配過程。指紋分類技術越完善,能夠劃分的類型越細,樣本數(shù)據(jù)庫每個類別中所包含的樣本數(shù)量就會越少,對一次識別任務來講,需要比對的次數(shù)和時間開銷就會越少。在大部分研究中,指紋一般分為漩渦型(whorl)、左環(huán)型(left
loop)、右環(huán)型(right
loop)、拱型(arch)、尖拱型(tentedarch)5類。對于要求嚴格的指紋識別系統(tǒng),僅按此分類是不夠的,還需要進一步更加細致地分類。指紋識別系統(tǒng)工作原理5.指紋比對指紋比對是通過對2枚指紋的比較確定它們是否同源的過程,即2枚指紋是否來源于同一手指。指紋比對主要是依靠比較2枚指紋的局部紋線特征和相互關系決定指紋的唯一性。細節(jié)特征的集合形成一個拓撲結構,指紋比對的過程實際就是2個拓撲結構的匹配問題。由于采集過程中的變形、特征點定位的偏差、真正特征點的缺失和偽特征點的存在等問題,即使是2枚同源的指紋,所獲得的特征信息也不可能完全一樣,指紋比對的過程必然是一個模糊匹配問題。指紋識別系統(tǒng)工作原理6.可靠性問題計算機處理指紋圖像時,只是涉及了指紋有限的信息,而且比對算法不是精確的匹配,因此其結果不能保證100%準確。指紋識別系統(tǒng)的重要衡量標志是識別率,它主要由2部分組成:拒判率(FRR,false
reject
rate)和誤判率(FAR,false
accept
rate)。右圖的ROC(Receiver
Operating
Curve)曲線給出
FAR和FRR之間的關系。7.1.4指紋識別模塊算法1.預處理指紋的特征是指指紋脊線的某種構型,如端點、分叉等。為了提取這些特征,必須先把灰度的指紋圖處理為二值線型圖,此過程即指紋圖像預處理。圖像預處理是指紋自動識別過程的第一步,它的好壞直接影響指紋識別的效果。圖像預處理通常包括增強、分割、細化等幾個步驟。增強是通過平滑、銳化、灰度修正等手段,改善圖像的視覺效果;分割則是把圖像劃分為若干個區(qū)域,分別對應不同的物理實體;細化則是把分割后的圖像轉為只有一個像素點寬度的線型圖,以便提取特征。在預處理過程中,必須保證盡可能不出現(xiàn)偽特征,并盡量保持其真實特征不受損失。指紋識別模塊算法2.方向濾波算法指紋圖像獲取時,由于噪音及壓力等的不同影響,將會導致2種破壞紋線的情況:斷裂及叉連。這2種干擾必須清除,否則會造成假的特征點,影響指紋的識別。為了消除干擾及增強紋線,針對指紋紋線具有較強方向性的特點,可以采用方向濾波算法對其進行增強,為此必須利用指紋圖上各個像素點上的局部方向性。指紋識別模塊算法(1)方向圖的獲取方向圖是用每個像素點的方向來表示指紋圖像。像素點的方向是指其灰度值保持連續(xù)性的方向,可以根據(jù)像素點鄰域中的灰度分布判斷,反映了指紋圖上紋線的方向。如圖所示設定8個方向,各方向之間夾角為π/8,以1~8
表示。指紋識別模塊算法每個像素點上方向值的判定是在其
N×N鄰域窗口中得到的。鄰域窗口的尺寸并無嚴格限定,但其取值與圖像的分辨率直接有關。如果鄰域取得過小,則難以從其中的灰度分布得出正確的方向性;若取得過大,則在紋線曲率較大的區(qū)域窗口內紋線方向不一致,會對以后的濾波操作造成不良影響。一般可取N為1~2個紋線周期。實驗中取N=9,該9×9鄰域窗口如圖所示。指紋識別模塊算法分別求出沿各個方向的灰度變化式中, 代表與d
垂直的方向,即=(d+4)mod8
;f(i,j)是點p(i,j)的灰度值;ik是d方向上的第k點;fdk(ik,jk),fk(ik,jk)分別是點pdk與p
k的灰度值。點p(i,j)的方向應該是Sd取值最小、S
取值最大的方向。指紋識別模塊算法(2)方向圖的平滑算法方向圖求出后,由于紋線中的毛刺、背景中的細小污點等影響,會存在一定的噪音,需要對其進行平滑。方向圖平滑的基本思想是,指紋紋線的走向是連續(xù)變化的,鄰近像點上的方向不應該有突然的大角度轉折。平滑也是在窗口中進行的,窗口中心像點上的平滑結果由窗口中各像素點方向值及其分布確定。指紋識別模塊算法(3)方向濾波器的設計在得到指紋的方向圖后,可以根據(jù)每個像素點的方向值利用方向濾波器對指紋進行濾波,以消除噪音,增強紋線,提高脊和谷之間的反差。濾波器設計原則如下所述。①濾波器模板的尺寸要合適。模板過小難以達到良好的去噪音、清晰化效果;模板過大則可能在紋線曲率較大處破壞紋線構型。一般取模
板邊長為1~1.5個紋線周期。②模板邊長為奇數(shù),模板關于其朝向軸及朝向垂直方向軸均為對稱③為提高脊、谷之間的灰度反差,達到邊緣銳化的效果,模板應設計為在垂直于朝向方向上,中央部分系數(shù)為正,兩邊系數(shù)為負。④濾波結果應與原圖的平均灰度無關,因此模板中所有系數(shù)的代數(shù)和應為0。指紋識別模塊算法3.局域自適應二值化算法以上所得的是增強后的256級灰度圖像,需要將其進一步二值化。二值化指紋圖像是將灰度圖像變成0、1兩個灰度級的圖像,前景點(指紋脊線)取作1,背景點取作0,以把指紋脊線提取出來,便于后續(xù)處理。根據(jù)指紋圖中脊線與谷線寬度大致相等的特點,即二值化后黑白像素的個數(shù)應大致相同,采用局部域值自適應算法。把指紋圖分成w×w(w為一個紋線周期)的子
塊,在每一子塊內計算灰度均值f(i,j)為子塊內(i,j)的灰度值。在該塊內若某一點的灰度值f(i,j)>AV,則j)=1;若f(i,j)≤AV,則f(i
,j)=0。對每一塊都進行這樣的處理,可得到指的二值圖像。指紋識別模塊算法4.二值化后的去噪由于灰度去噪的不完全及二值化過程又可能引入噪音,所以對二值化后的指紋圖像還需要進行一次二值濾波去噪,目的是去除或減弱圖像中的噪音,增強圖像中有意義的部分。這一過程可以填補二值化后紋線上的孔洞,或者刪除模式上的“毛刺”和孤立的值為1的像素,即包括填充和刪除2個算法。指紋識別模塊算法(1)填充填充算法把同時滿足以下條件的像素p值取為1。@
p為0像素;@
p的4鄰域中有3個以上的鄰點為1像素。下圖示出了填充算法的一個實例。指紋識別模塊算法(2)刪除刪除算法把同時滿足以下條件的像素p值取為0。@
p為1像素;@
(p1+p2+p3)(p5+p6+p7)
+
(p3+p4+p5)
(p7+p8+p1)
=
0;@
p不是端點。左圖示出了刪除過程的一個實例。圖中p1~p8(值為0或1)定義如右圖所示。經過去噪后,有效地清除了原二值圖中的大部分孔洞和“毛刺”。指紋識別模塊算法4.細化及細化后的去噪處理細化是圖像分析、信息壓縮、特征提取和模式識別常用的基本
技術,它使圖像的每條紋線都變?yōu)閱蜗袼貙挼摹包c線”,且細化后的紋線近似處于原圖的“中軸”。細化過程中,在判斷是否刪除一個前景像素點時,需要考慮其
3×3鄰域中除其自身外的8個像素點中的連接成分數(shù)。如果此連接成分數(shù)為1,則說明刪除當前像素點不會改變原圖的連通性;若大于1,則改變了原圖的連通性。令Nc為p的8鄰域中的連接成分數(shù),則其由序列p1p2p3p4p5p6p7p8p1中0→1變化的次數(shù)可以得到。指紋識別模塊算法這里采用逐層迭代算法。本算法把一次迭代分作兩次掃描,細化過程中由周邊向中間逐層細化,使細化結果位于原圖的“中軸”。令BN為3×3窗口內目標像素的個數(shù),BN=∑Pi,2次掃描中需滿足下面條件。@
2≤BN≤6(排除p為端點和內部像點的情況);@
若已標記pi視為1時,有Nc=1(保證刪除當前像素不會改變原圖的連通性);@
p的值是1(保證p為前景點);@
當p3或p5已標記時,若視p3、p5為0,依然有Nc=1(保證寬度為2的線條只刪除一層像點,避免其斷開)。指紋識別模塊算法本細化算法重復執(zhí)行2個步驟。步驟1從左到右,從上到下順序掃描圖像,對同時滿足以上條件的像素,如果p1p3p7=0且p1p5p7=0,則將其作上標記;步驟2從左到右,從上到下順序掃描圖像,對同時滿足以上條件的像素,如果p1p3p5=0且p3p5p7=0,則將其作上標記。當掃描完整幅圖像后,去掉作了標記的像素。重復步驟1、2操作,直至得到單位寬度的線條為止。經過此細化算法處理后,得到單像素寬的8連通的指紋圖像。經上述處理后的圖像有利于特征提取。7.1.5指紋特征提取和比對1.指紋的特征提取和剪枝由細化所得的指紋點線圖,很容易找到指紋的細節(jié)特征:端點和分叉點,記錄這些特征的位置、類型和方向。因為指紋預處理的不完善性,在細化后的紋線圖中總存在或多或少的偽特征點。因此有必要對這些粗篩選出的特征進行剪枝,以達到去偽存真的目的。細節(jié)特征剪枝的標準主要依賴于以下3個條件。@特征點到邊緣的距離;@細節(jié)特征間的距離和角度關系;@指紋脊線和細節(jié)特征的空間分布。根據(jù)以上3個條件組合各種特征剪枝的標準,凡符合標準的特征點刪除,其余的給予保留。指紋特征提取和比對2.指紋的比對在進行指紋比對之前,一定要存在指紋數(shù)據(jù)庫。建立指紋數(shù)據(jù)庫,一般要采集同一枚指紋的3~5個樣本。對于待匹配的指紋圖像,經預處理和特征提取后,形成一個坐標鏈碼記錄,根據(jù)這些特征的相互位置關系與指紋數(shù)據(jù)庫中的樣本做圖形匹配,得到最終的識別結果。右圖展示了指紋原始圖像經增強、分割和細化后的效果。7.2車輛牌照識別技術7.2.1概述智能交通系統(tǒng)(ITS)是21世紀世界道路交通管理體系的模式和
發(fā)展方向。智能交通系統(tǒng)應用人工智能技術、GPS(全球定位系
統(tǒng))和網絡通信技術、檢測技術、電子收費技術等革新道路交通,試圖有效地調整交通需求,提高道路通行能力,改善服務水平,減少環(huán)境污染和油料損耗,增加交通安全。汽車牌照自動識別系統(tǒng)是智能交通系統(tǒng)的關鍵技術之一,是在交通監(jiān)控的基礎上,引入了計算機信息管理技術,采用了先進的圖像處理、模式識別和人工智能技術,通過對圖像的采集和處理,獲得更多的信息,從而達到更高的智能化管理程度。車輛牌照識別技術近年來,汽車牌照智能識別的技術發(fā)展很快,就其識別基礎而言,主要可以分為間接法和直接法2種。間接法是基于IC卡(即無線電頻率鑒別),或者是基于條碼的識別;直接法是基于圖像的汽車牌照識別。間接法是將車牌的信息存儲在IC卡或條碼中。利用IC卡技術進行汽車牌照的識別,是在每輛汽車上安裝一個微型電子信號接收和發(fā)射裝置即IC卡,通過卡內存儲的信息辨識出汽車的車牌號碼和其他相關內容。條形碼技術雖然具有識別速度快、準確度高、可靠性強以及成本較低等優(yōu)點,但是對于掃描器要求很高基于圖像的車牌識別技術屬于直接法。直接法一般有圖像處理技術、傳統(tǒng)模式識別技術及人工神經網絡技術。它是一種無源型汽車牌照智能識別方法。車輛牌照識別技術與間接法識別系統(tǒng)相比①直接法系統(tǒng)節(jié)省了設備安置及大量資金,從而提高了經濟效益。②由于采用了先進的計算機應用技術,可提高識別速度,較好地解決實時性問題。③它是根據(jù)圖像進行識別,所以通過人的參與可以解決系統(tǒng)中的識別錯誤,而其他方法是難以與人交互的。7.2.2車輛牌照識別系統(tǒng)的結構車牌識別(LPR,LicensePlateRecognition)技術的任務是處理、分析攝取的汽車圖像,實現(xiàn)車牌號碼的自動識別。典型的車輛牌照識別系統(tǒng)是由圖像采集系統(tǒng)、中央處理器、識別系統(tǒng)組成,一般還要連接相應的數(shù)據(jù)庫以完成特定的功能。下圖顯示了車牌識別系統(tǒng)的結構框圖。車輛牌照識別系統(tǒng)的結構整套系統(tǒng)實際是一種硬件和軟件的集成。在硬件上,它需要集成可控照明燈、鏡頭、圖像采集模塊、數(shù)字信號處理器、存儲器、通信模塊、單片機等;在軟件上,它需要包括車牌定位、車牌字符分割、車牌字符識別算法。車牌識別系統(tǒng)的硬件是整個系統(tǒng)中的一個十分關鍵的組成部分,它決定了軟件所攝的圖像的質量。它主要是基于2大關鍵技術:光電耦合器件和數(shù)字信號處理器。其中前者用于采集車輛圖像;后者用于運行算法。車輛牌照識別系統(tǒng)的結構車牌識別過程大體可分為4個步驟:圖像預處理、車牌定位和分割、車牌字符的分割和車牌字符識別。而這4個步驟又可以歸結為2大部分,即車牌分割和車牌字符識別。如圖所示。7.2.3預處理為了便于車牌的分割和識別,攝像機攝下的原始圖像應具有適當?shù)牧炼群蛯Ρ榷?。但攝像時的光照條件、牌照的整潔程度、攝像機的狀態(tài)(焦距、角度和鏡頭的光學畸變),以及車速的不穩(wěn)定等因素都會不同程度地影響圖像效果,出現(xiàn)圖像模糊、歪斜或缺損,車牌字符邊界模糊、細節(jié)不清、筆畫斷開、粗細不均等現(xiàn)像,從而影響車牌區(qū)域分割與字符識別的工作,所以識別之前需要對原始圖像進行預處理。預處理工作包括以下4個方面。消除模糊。圖像去噪。圖像增強。水平校正。7.2.4牌照定位牌照定位的主要目的是在預處理后的灰度圖像中確定牌照的具體位置,并將包含牌照字符的子圖像從整個圖像中劃分出來,供字符識別系統(tǒng)
識別。車牌的定位方法主要有3種。基于邊緣監(jiān)測的車牌定位方法基于水平方向灰度變化的車牌定位方法基于彩色特征的車牌定位方法方法(2)要比方法(1)的效果好,速度快,漏檢率低,但不能夠準確地定位車牌的邊界,很難與背景文字、車燈等同樣灰度變化明顯的區(qū)域區(qū)分開。另外,在車牌定位中還有其他多種方法,如形態(tài)濾波法、模糊C類算法、模糊聚類法及神經網絡法等。7.2.5字符的分割在分割之前首先對圖像進行針對性的處理,即要對圖像進行二值化處理,它的實質是將圖像中的每個像素按一定規(guī)則進行分類,也就是將圖像轉化成只有2個等級(黑,白)的二值圖像。經過牌照字符圖像的二值化,得到的是一個只包含牌照字符的水平條形區(qū)域。為了進行字符識別,需要將牌照字符從二值化圖像中分割出來。字符分割可采用垂直投影法。由于字符塊在垂直方向上的投影必然在字符間的間隙處取得局部最小值,因此字符的正確分割位置應該在上述最小值附近,并且這個位置應滿足車牌的字符書寫格式、字符尺寸限制和其他一些條件。7.2.6車牌字符識別車牌字符識別目前最常用的方法是基于模板匹配和神經網絡的方法。模板匹配方法是一種經典的模式識別方法,首先對待識字符進行二值化,并歸一化為模版的大小,最后選最佳匹配作為分類結果。模版匹配方法的缺點是抗干擾力差,識別率低,任何有關光照、字符清晰度和大小的變化都會影響模板匹配的正確率。用神經網絡進行字符識別,主要有2種方法。首先對待識別字符進行特征提取,然后用所獲得的特征訓練神經網絡。這種網絡的識別效果與字符特征的提取有關,而字符的特征提取往往比較耗時。充分利用神經網絡的特點,直接把待處理圖像輸入網絡,由網絡自動實現(xiàn)特征提取直至識別。這種網絡互聯(lián)較多,待處理信息量大。車牌字符識別下面給出一個字符識別的實例,采用先提取字符特征,然后根據(jù)字符的特征矩陣構建神經網絡,再用理想樣本訓練神經網絡,最終實現(xiàn)對字符的識別。神經網絡的方法具有抗噪聲、容錯、自適應、自學習能力強等優(yōu)點;融預處理和識別于一體,而且識別速度快,因而受到人們的廣泛重視,在車輛牌照識別系統(tǒng)技術中也得到了廣泛應用。其識別原理如圖所示。車牌字符識別1.字符識別的預處理為了神經網絡識別的進行,識別前要對單個字符進行預處理。在上一步字符分割的基礎上,得到二值化的單一字符圖像,如下圖所示。車牌字符識別由于各種因素的影響,得到的分割圖像的邊緣是不太平滑的,有時甚至可能出現(xiàn)筆畫斷裂的可能。為了盡可能好地提取字符特
征,提高神經網絡的識別準確率,需要對得到的二值化圖像進行
邊緣處理,去掉邊緣上突出的點,補上凹陷的點。這里用形態(tài)學處理中的腐蝕和膨脹操作,首先對圖像進行先膨脹再腐蝕的處理,補充凹陷的點;然后再進行先腐蝕再膨脹的處理,去掉凸出的點。經過以上操作,圖像邊緣更加平滑,這樣可以使圖像壓縮時得到更好的效果,如圖所示。車牌字符識別為了減少特征矩陣大小,要對得到的圖像做尺寸的壓縮,這里選擇將圖像壓縮為17像素×8像素的圖像,由于壓縮比例比較大(原始圖像為136像素×64像素,壓縮到17像素×8像素,壓縮為原始圖像的1/8),所以得到的特征圖像個別字符形變比較嚴重,下圖所示為壓縮后的效果。車牌字符識別2.特征編碼構造一個高性能的識別系統(tǒng),最重要的是如何選擇一個有效的特征。特征是從原始數(shù)據(jù)中提取出來的與分類最相關的信息,這些信息使類內差距極小化,類間差距極大化。這里選取圖像的灰度特征編碼方式。要選取圖像的灰度特征,就要考慮到特征量的維數(shù)與識別的準確率的要求,將字符歸一化為17像素×8像素點陣圖,按每個像素位為0或1,形成網絡的136個輸入特征值。如下圖所示。得到的特征圖像是二值圖像,對應一個元素為0和1的17像素×8像素的特征矩陣,然后是對特征圖像編碼。編碼規(guī)則是,按照從左至右、從上到下的順序,依次掃描整個特征矩陣,將每一行的0和
1轉換成一個136像素×1像素的特征列。將每一個字符都進行編碼后,順序送入已經訓練好的神經網絡識別,識別結果最后以文本格式輸出。車牌字符識別車牌字符識別3.BP(Error
Back
Propagation)神經網絡的構建(1)構造輸入樣本庫對于每一個樣本分別按灰度提取特征構造特征矢量。構造方法如下。①對于字符的灰度特征,分別按從左到右,從上到下的掃描順序把136個像素點的灰度值排列成136行×1列的一個列矢量;②把所有36個字符按順序分別構成136行×1列的列矢量,然后把它們排列起來,構成一個136行×36列的矩陣。應盡可能多的采集汽車圖像,提取車牌部分,切分出車牌字符,按上面步驟構造出更多的136行×36列矩陣作為神經網絡的訓練樣
本庫。車牌字符識別構造輸出樣本庫對于輸出樣本,要構造一個36行×36列的一個矩陣,要求矩陣的每一列的36個元素中只有一個位置為
l,其余的值為
0。在用神經網絡進行文字識別時。網絡的輸出端輸出一個只有36個元素的輸出向量,這36個元素也只有一位為1。網絡訓練訓練的目的就是通過在梯度的方向上不斷地調整網絡的權值和閾值使網絡的誤差平方和最小,針對本文所述網絡,訓練的目的就是要使其將輸出向量中正確的位置設置為1,其余位置全為0。為了使網絡對輸入向量有一定的容錯能力,最好的辦法是先用理想的信號對網絡進行訓練,直到其平方和誤差足夠小。7.3圖像型火災探測技術7.3.1概述當前室內火災報警技術已經比較成熟。通過對光、煙、濕度等參考量加以判斷,然后直接實施滅火措施,進行斷電、噴水等并報警。而對于室外的或大面積的監(jiān)控對象(如高層建筑、船舶碼頭、油庫、大型倉庫等),相對來說可以使用的探測方式較少,利用圖像進行火災監(jiān)控是目前主要的研究方向。由于圖形包含的數(shù)據(jù)量很大,所以首先需要對圖像進行預處理,通常包括圖像增強、濾波、細化等幾個方面。然后對圖像進行分割。分割的目的是把圖像空間分成一些有意義的區(qū)域,可以逐像素為基礎去研究圖像分割,也可以利用在指定區(qū)域中的某些圖像信息去分割。分割可以建立在相似性和非連續(xù)性2個基本概念上,其目的就是為下一步的圖像識別打下堅實的基礎。7.3.2火災圖像的分割處理所謂圖像分割是指將圖像中具有特殊含義的不同區(qū)域分開,這些區(qū)域是互不相交的,每一個區(qū)域都滿足特定區(qū)域的一致性。均勻性一般是指同一區(qū)域內的像素點之間的灰度值差異較小或灰度值的變化較緩慢。圖像分割方法很多,其中最常用的圖像分割方法是將圖像分成不同的等級,然后用設置灰度門限的方法確定有意義的區(qū)域或欲分割的物體的邊界,這種方法也稱為閾值分割法。火災圖像的分割處理1.二維最大熵閾值法圖像分割技術要從復雜的景物中分辨出目標并將其提取出來,閾值的選取是圖像分割技術的關鍵。如果閾值選得過高,則過多的目標點將被誤歸為背景;閾值選得過低,則會出現(xiàn)相反的情況,這將影響分割后圖像中的目標大小和形狀,甚至會使目標丟失。從最近幾年有關的文獻資料看,最大熵閾值法是一種頗受關注的方法。熵定義為火災圖像的分割處理式中p(x)是隨機變量x的概率密度函數(shù)。對于數(shù)字圖像,x可以是灰度、區(qū)域灰度、梯度等特征。根據(jù)最大熵大批量,用灰度
的一維熵求取閾值就是選擇一個閾值,使圖像用這個閾值分割出
的2部分的一階灰度統(tǒng)計的信息量最大,即一維熵最大。一維最
大熵閾值法基于圖像的原始直方圖,僅僅利用了點灰度信息而未
充分利用圖像的空間信息,當信噪比降低時,分割效果并不理想。
Abutaleb提出的二維最大熵閾值法,利用圖像中各像素的點灰度及其區(qū)域灰度均值生成二維直方圖,并以此為依據(jù)選取最佳閾值,其原理如所述。火災圖像的分割處理若原始灰度圖像的灰度級為L,則原始圖像中的每一個像素都對應于一個點灰度——區(qū)域灰度均值對,設fij為圖像中點灰度為i及其區(qū)域灰度均值為j的像素點數(shù),pij為點灰度——區(qū)域灰度對(i,j)發(fā)生的概率,即pij=fij/(N×N),是該圖像的關于點灰度——區(qū)域灰度均值的二維直方圖。右圖是一幅海上目標圖像的二維直方圖的
XOY平面圖,點灰度——區(qū)域灰度均值對(i,j)的概率高峰主要分布在平面XOY的對角線附近,并且在總體上呈現(xiàn)出雙峰和唯一波谷的狀態(tài)。偏離平面XOY對角線的坐標處,峰的高度急劇下降,這部分所反映的是圖像中的噪聲點、邊緣點?;馂膱D像的分割處理沿對角線分布的A區(qū)和B區(qū)分別代表目標和背景,遠離對角線的C區(qū)和D區(qū)代表邊界和噪聲,所以應該在A區(qū)和B區(qū)上用點灰度——區(qū)域灰度均值二維最大熵法確定最佳閾值,使真正代表目標和背景的信息量最大。定義離散二維熵如下則A區(qū)和B區(qū)的二維熵分別為火災圖像的分割處理熵的判別函數(shù)定義為選取的最佳閾值向量(, )滿足上式就是二維最大熵的表達式?;馂膱D像的分割處理2.區(qū)域生長法分割圖像分割的目的是要把一幅圖像劃分成一些小區(qū)域,對于這個問題的最直接的方法是把一幅圖像分成滿足某種判據(jù)的區(qū)域;也就是說,把點組成區(qū)域。與此相對應,數(shù)字圖像處理中存在一種分割區(qū)域的方法稱為區(qū)域生長或區(qū)域生成。假定區(qū)域的數(shù)目,以及在每個區(qū)域中單個點的位置已知,則可推導出一種算法。從一個已知點開始,加上與已知點相似的鄰
近點形成一個區(qū)域。這個相似性準則可以是灰度級、顏色、幾何
形狀、梯度或其他特性。相似性的測度可以由所確定的閾值判定?;馂膱D像的分割處理3.最大方差自動取閾法最大方差自動取閾法一直被認為是閾值自動選取方法的最優(yōu)方法。該方法計算簡單,在一定條件下不受圖像對比度與亮度變化的影
響,因而在許多圖像處理系統(tǒng)中得到了廣泛的應用。下圖所示為包含有2類區(qū)域的某個圖像的灰度直方圖,設t為分離2區(qū)域的閾值?;馂膱D像的分割處理由直方圖經統(tǒng)計可得被t分離后的區(qū)域1和區(qū)域2占整幅圖像的面積比為區(qū)域1面積比:θ1區(qū)域2面積比:θ2整幅圖像的平均灰度:
μ區(qū)域1的平均灰度:區(qū)域2的平均灰度:μ1μ2整幅圖像平均灰度與區(qū)域1和區(qū)域2平均灰度值之間的關系為μ=μ1θ1+μ2θ2火災圖像的分割處理同一區(qū)域常常具有灰度相似特性,而不同區(qū)域之間則表現(xiàn)為明顯的灰度差異,當被閾值t分離的兩個區(qū)域間灰度差較大時,兩個區(qū)域的平均灰度μ1、μ2與整幅圖像平均灰度μ之差也較大,區(qū)域間的方差就是描述這種差異的有效參數(shù),其表達式為經數(shù)學推導,區(qū)域間方差可表示為火災圖像的分割處理被分割的2區(qū)域間方差達最大時,是2區(qū)域的最佳分離狀態(tài),由此確定閾定值T,如上圖所示。以最大方差決定閾值不需要人為設定其他參數(shù),是一種自動選擇閾值的方法,它不僅適用于2個區(qū)域的單閾值選擇,也可擴展到多區(qū)域的多閾值選擇中。7.3.3火災圖像識別火災中的燃燒過程是一個典型不穩(wěn)定過程。由于可燃物、幾何條件、環(huán)境和氣候的影響,火災燃燒過程要比一般動力裝置中的燃燒過程更為復雜。同時,火災現(xiàn)場存在各種干擾因素,如陽光、照明燈等。圖像型火災探測方法立足于早期火災圖像的基本特性,可以排除各種干擾,使火災探測快速、可靠。在早期火災階段,由于火焰從無到有,是一個發(fā)生發(fā)展的過程。這個階段火焰的圖像特征就更加明顯。早期火災火焰是非定
常的,不同時刻火焰的形狀、面積、輻射強度等都在變化。抓住
火災的這些特點可以為火災的識別打下良好的基礎。圖像型火災
探測中的圖像處理是動態(tài)圖像的連續(xù)處理,對圖像上的每個目標,根據(jù)一定的算法確定它們同前一幀中目標的匹配關系,從而得到
各個目標的邊界變化規(guī)律。火災圖像識別1.火焰面積增長判據(jù)火災早期是整個火災過程的重要環(huán)節(jié)。所謂火災早期,從安全的觀點來看,它是指轟燃發(fā)生前的階段。火災的早期特性描述參量通常包括:①熱釋放速率;②煙氣釋放量及成分分析;③火焰影像面積;④煙氣毒性分析;⑤熔點和滴點?;鹧嫘螤钍腔鹧娴闹匾卣髦唬湓跀z像機中的影像即可稱為火焰影像。由于其影像灰度值固定在某個閾值范圍內,因此首先利用分割方法獲得火焰目標,然后掃描火災窗口以獲得的像素點數(shù)目的多少描述火焰的影像面積。在圖像處理中,面積是通過取閾值后統(tǒng)計圖像的亮點(灰度值大于閾值)數(shù)實現(xiàn)的。當其他高溫物體向著攝像頭移動,或者是從視野處移入時,探測到的目標面積也會逐漸增大,極容易造成干擾,致使系統(tǒng)產生誤報警?;馂膱D像識別2.火焰的邊緣變化分析早期火災的火焰是一種不穩(wěn)定且不斷發(fā)展的火焰,圖像型火災探測系統(tǒng)正是通過對早期火災火焰特有的形狀及輻射特征進行識別的。不穩(wěn)定火焰本身有很多尖角,火焰邊緣抖動時一個明顯的表現(xiàn)就是火焰的尖角數(shù)目呈現(xiàn)無規(guī)則的跳動。由此,基于“邊緣抖動”的火災判據(jù)——尖角判據(jù)得以研究。實現(xiàn)尖角判據(jù)的核心問題有尖角的識別;如何確定尖角跳動的閾值,即找出早期火災火焰與其他發(fā)光物體尖角跳動的區(qū)別?;馂膱D像識別(1)尖角的識別判別尖角的過程為分割、特征提取、識別。①分割。分割的目的是把目標圖像從背景中分離出來。②邊緣增強與提取。對分割后的圖像進行邊緣增強,將真實輪廓勾勒出來,可大大減少數(shù)據(jù)量,便于進行進一步的處理。③特征點的提取和尖角的判別。提取的目標特征主要是幾何形狀特性,即目標的高度、寬度、體態(tài)比及面積等,由于火焰的識別是一種動態(tài)的目標識別,每一個幾何形狀特征都沒有固定的值,而只能給出一個合適的范圍。④特征點首先應該是它的頂點。對火焰尖角來說,頂點是局部的極值點,尖角的頂點可能是多個點,則都取為特征點?;馂膱D像識別(2)尖角的比較和尖角判據(jù)的檢驗課本表7.2記錄了早期火災火焰和其他干擾情況下的尖角數(shù)目。數(shù)據(jù)均取自每一序列的連續(xù)5幀圖像,取數(shù)據(jù)時遵循一個前提,即
該目標的變化特征滿足面積連續(xù)增大判據(jù)。針對表7.2的試驗結果可以得到以下結論。①火災火焰的尖角數(shù)目隨著時間推移呈現(xiàn)不規(guī)則變化的規(guī)律。②水銀燈、蠟燭等干擾物體即使向著攝像頭方向運動,其尖角數(shù)目也基本不變?;馂膱D像識別3.
火焰的形體變化分析對人的視覺系統(tǒng)而言,物體的形狀是一個賴以分辨和識別的重要特征。用計算機圖像處理和分析系統(tǒng)對目標提取形狀特征的過程就稱為形狀和結構分析。形狀和結構分析的結果有2種形式,一種是數(shù)字特征,主要包
括幾何特征(如面積、周長、距離、凸性等)、統(tǒng)計特性(投影等)和拓撲性質(如連通性、歐拉數(shù)等);另一種是由字符串和圖等所表示的句法語言,這種句法語言既可刻畫某一目標不同部分間的相互關系,又可描述不同目標間的關系,從而可對含有復雜目標的景物圖像進行描繪,為識別打下基礎?;馂膱D像識別(1)火焰圖像的矩特性矩是一種基于區(qū)域內部的數(shù)字特征,對于給定的二維連續(xù)函數(shù)f(x,y),其pq階距可表示為對于一幅灰度圖像f(x,y)來說,其pq階距為從矩出發(fā)可定義幾個數(shù)字特征,即質心、中心矩、Hu矩組、扁度等;從火焰識別的角度出發(fā),采用了火焰圖像的質心和中心矩特性?;馂膱D像識別(2)火焰圖像的形狀的相似特性圖像的相似性描繪通常要借助于與已知描繪子的相似度進行,這種方法可以在任何復雜的程度上建立相應的相似性測度。它可以比較2個簡單的像素,也可以比較2個或2個以上的景物。圖像相似性通常包括距離測度、相關性和結構相似性。一般來說,結構相似性難以實現(xiàn)公式化,可以用作相似測度的典型結構描述子,包括線段的長度、線段之間的角度、亮度特性、區(qū)域的面積,以及在一幅圖像中一個區(qū)域相對于另外一個區(qū)域的位置等。7.3.4仿真及結果1.圖像預處理(1)灰度變換一般成像系統(tǒng)只具有一定的亮度響應范圍,常出現(xiàn)對比度不足的弊病,使人眼觀看圖像時視覺效果很差;另外,在某些情況下,需要將圖像的灰度級整個范圍或者其中某一段擴展或壓縮到記錄器件輸入灰度級動態(tài)范圍之內。對比度調整前后的圖像及其直方圖如圖7.22所示。仿真及結果(2)直方圖修正①直方圖均衡化原始圖像及直方圖與直方圖均勻化后的圖像及直方圖,如圖7.23所示。②直方圖規(guī)定化。原始圖像及其直方圖與直方圖規(guī)定化后的圖像及直方圖,如圖7.24所示。③圖像的平滑。對圖像進行低通濾波和中值濾波的效果圖,如圖7.25所示。④圖像的銳化。圖像在傳輸和變換過程中會受到各種干擾而退化,比較典型的就是圖像模糊。圖像銳化的目的就是使邊緣和輪廓線模糊的圖像變得清晰,并使其細節(jié)清晰,如圖7.26和7.27所示。仿真及結果圖7.22對比度調整前后的圖像及其直方圖仿真及結果圖7.23原始圖像及直方圖與直方圖均勻化后的圖像及直方圖仿真及結果圖7.24原始圖像及直方圖與直方圖規(guī)定化后的圖像及直方圖仿真及結果圖7.25對圖像進行低通濾波和中值濾波仿真及結果圖7.26Sobel算子對圖像銳化結果仿真及結果圖7.27拉氏算子對圖像銳化結果仿真及結果2.圖像分割與特征提取利用邊緣檢測方法的檢測效果,如圖所示。仿真及結果3.灰度閾值分法利用灰度閾值分割法截取分割后的圖像,如圖所示。7.4數(shù)字圖像水印技術7.4.1概述計算機技術的快速發(fā)展和計算機網絡的普及加速了媒體的數(shù)字化進程,使數(shù)字媒體如數(shù)字文本、數(shù)字圖像、數(shù)字視頻和數(shù)字音頻等的制作、發(fā)布、傳播、獲取和復制變得更加容易。在當今的信息社會,數(shù)字媒體正在取代傳統(tǒng)媒體改變人們日常生活的很多方面,因而具有十分重要的地位。在數(shù)字媒體給社會帶來進步、改善人們日常生活和工作的同時,數(shù)字媒體的非法篡改、復制和盜版現(xiàn)象也非常普遍,嚴重阻礙了媒體數(shù)字化進程和數(shù)字媒體的正常合法使用。因此,對數(shù)字媒體進行合法保護,如有效阻止非法篡改、非法復制、盜版跟蹤和版權保護,以及維護數(shù)字媒體所有者和消費者的合法利益變得十分迫切。概述數(shù)字水印技術是目前信息安全領域研究的前沿方向,彌補了傳統(tǒng)加密技術的不足,為數(shù)字媒體的版權保護和合法使用提供了一種新的解決思路,引起了人們的廣泛關注。數(shù)字水印技術的基本思想是將具有版權保護、防拷貝、防篡改和產品跟蹤等作用的數(shù)字信息作為水印信號嵌入到圖像、文本、視頻和音頻等數(shù)字媒體中,并且在需要時,能夠通過一定的檢測或提取方法檢測或提取出水印信息,以此作為判斷數(shù)字媒體的版權歸屬和跟蹤起訴非法侵權的證據(jù)。為判斷媒體的版權歸屬和跟蹤起訴非法侵權的證據(jù)。數(shù)字水印為多媒體數(shù)據(jù)文件在認證、防偽、防篡改、保障數(shù)據(jù)安全和完整性等方面提供了有效的技術手段。數(shù)字水印研究成果主要應用于媒體所有權的版權認定和保護、防止非法拷貝、盜版跟蹤、基于內容的真?zhèn)舞b別、隱蔽通信及其對抗,以及多語言電影系統(tǒng)和電影分級這幾個方面。7.4.2數(shù)字圖像水印的特性和分類數(shù)字水印的特性數(shù)字水印特性與其具體應用密切相關,不同用途和類型的數(shù)字水印具有不同的特性要求。魯棒性。指水印信號在經歷多種無意或有意的信號處理后,仍能保持其完整性,或仍能被準確鑒別的特性。可能的信號處理過程包括信道噪聲濾波、數(shù)/模與模/數(shù)轉換、重采樣、剪切、位移、尺度變化,以及有損壓縮編碼等。知覺透明性。數(shù)字水印的嵌入不應引起數(shù)字作品的視覺/聽覺質量下降,即不向原始載體數(shù)據(jù)中引入任何可知覺的附加數(shù)據(jù)。內嵌信息量(水印的位率)。數(shù)字水印應該能夠包含相當?shù)臄?shù)據(jù)容量,以滿足多樣化的要求。數(shù)字圖像水印的特性和分類安全性。水印嵌入過程(嵌入方法和水印結構)應該是秘密的,嵌入的數(shù)字水印是統(tǒng)計上不可檢測的,非授權用戶無法檢測和破壞水印。實現(xiàn)復雜度低。數(shù)字水印算法應該容易實現(xiàn),在某些應用場合(如視頻水印)下,甚至要求水印算法的實現(xiàn)滿足實時性要求??勺C明性。數(shù)字水印所攜帶的信息能夠被唯一地、確定地鑒別,從而能夠為已經得到版權保護的信息產品提供完全和可靠的所有權歸屬證明的證據(jù)。數(shù)字圖像水印的特性和分類數(shù)字水印的分類按水印所附載的媒體分類,分為圖像水印、音頻水印、視頻水印、文本水印,以及用于三維網格模型的網格水印等。按水印的特性分類,分為魯棒數(shù)字水印和脆弱數(shù)字水印。魯棒數(shù)字水印要求嵌入的水印能夠抵抗各種有意或無意的攻擊;脆弱水印主要用于完整性保護,要求對信號的改動敏感,人們根據(jù)脆弱水印的狀態(tài)可以判斷數(shù)據(jù)是否被篡改過。按水印的主觀形式分類,分為可見數(shù)字水印和隱形數(shù)字水印兩種。更準確地說,應該是可覺察數(shù)字水印和不可覺察數(shù)字水印。數(shù)字圖像水印的特性和分類按水印的檢測過程分類,分為有源提取水印和無源提取水印。有源提取水印在檢測過程中需要原始數(shù)據(jù);無源提取水印只需要密鑰,不需要原始數(shù)據(jù)。按數(shù)字水印的嵌入位置分類,分為時(空)域數(shù)字水印、頻域數(shù)字水印和時/頻混合域數(shù)字水印3種。按數(shù)字水印的內容分類,分為有意義水印和無意義水印。有意義水印是指水印本身也是某個數(shù)字圖像(如商標圖像)或數(shù)字音頻片段的編碼;無意義水印則只對應于一個序列號。7.4.3數(shù)字水印原理無論哪種水印應用都離不開水印算法的設計。不同媒體的水印算法設計都基本相同,即水印媒體的制作過程基本相同,包含水印生成、水印嵌入、水印攻擊和水印提取及驗證4個方面。1.水印生成數(shù)字水印結構不僅影響水印算法的復雜性,而且對水印的魯棒性也有影響。數(shù)字水印按表現(xiàn)形式可分為一維水印和二維水印,一維水
印有偽隨機序列、產品所有者
ID
號、產品序列號和文
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版房地產買賣合同模板
- 2024年港口疏浚及堤壩修建合同3篇
- 勞動合同書電子版
- 水甲苯精餾塔課程設計
- 插班課程設計案例分析
- 管道課程設計小結
- 航空物流課程設計
- 航天研學課程設計
- 烘焙網絡營銷課程設計
- 機械小車課程設計
- 礦業(yè)公司規(guī)章制度匯編
- 《高低壓配電室施工工藝標準》
- 2024年太陽能光伏組件高空清洗作業(yè)人員安全保障合同3篇
- 大學學業(yè)規(guī)劃講座
- 《國家課程建設》課件
- 新教科版小學1-6年級科學需做實驗目錄
- 2024年貴州貴陽市貴安新區(qū)產業(yè)發(fā)展控股集團有限公司招聘筆試參考題庫含答案解析
- 美國RAZ分級讀物目錄整理
- 全口義齒-印模與模型-課件PPT
- 地方課程六年級上冊
- 中科院大連化物所模板PPT課件
評論
0/150
提交評論