基于形狀特征的葉片識別_第1頁
基于形狀特征的葉片識別_第2頁
基于形狀特征的葉片識別_第3頁
基于形狀特征的葉片識別_第4頁
基于形狀特征的葉片識別_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基于形狀特征的葉片識別

1植物的分類研究在所有地球生物中,植物與人類和環(huán)境之間是最密切相關(guān)的。大量的植物維持著地球大氣中氧氣和二氧化碳的平衡,植物也是人類生產(chǎn)和生活所必需的資源。但近些年來人類的各種生產(chǎn)活動嚴重地破壞了生態(tài)環(huán)境,從而造成植物在數(shù)量上的減少甚至物種上的滅絕。值得慶幸的是,人類已經(jīng)意識到這一危機,從而漸漸開始邁出了保護植物的步伐。對植物進行分類研究是對其進行保護的第一步也是很重要的一步,但由于人類認知能力有限以及地球上數(shù)量眾多的植物種類,要做到準確和快速地識別手中的植物是非常困難的。隨著近些年來計算機技術(shù)的不斷發(fā)展,圖像處理與識別技術(shù)在農(nóng)業(yè)中也得到了一定的應(yīng)用,因此可以考慮使用圖像處理技術(shù)、模式識別技術(shù)且輔助以計算機圖像獲取設(shè)備實現(xiàn)對植物的快速識別。從植物分類的角度來看,識別一種植物最直接有效和最簡單的方法就是從它的葉片著手,而且葉片也是比較容易采集到的,通常在植物學里葉片的形狀、顏色和脈絡(luò)都可以拿來作為分類依據(jù),而我們則把重點放在提取葉片的形狀特征作為識別依據(jù)上。利用我們提出的移動中心超球分類器對提取的特征進行分類,可以實現(xiàn)對部分葉片的快速和成功的識別。2圖像預(yù)處理整個葉片圖像識別的流程如圖1所示。首先我們把采集到的葉片通過數(shù)碼相機或者掃描儀制成數(shù)字圖像,然后對圖像進行預(yù)處理,這其中主要包括閾值分割、形態(tài)學處理和輪廓提取三個環(huán)節(jié),接下來利用提取出來的輪廓計算葉片形狀特征,并使用移動中心超球分類器對特征進行分類進而識別出葉片所屬種類。2.1基于迭代閾值選擇法在這里分割的目的是為了把葉片與其背景分開并形成二值圖像,以便于其后進行的輪廓提取和形狀特征的計算。由于不同種類葉片的顏色并不一樣,因此在轉(zhuǎn)成灰度圖像后很難用一個統(tǒng)一的灰度門限進行分割,因此我們必須針對每一幅圖像計算其灰度門限。根據(jù)對葉片圖像灰度直方圖的觀察,我們發(fā)現(xiàn)葉片與背景的灰度級存在著明顯的差異,根據(jù)這一特點我們選擇了計算較為方便的迭代閾值選擇法來計算灰度門限,具體步驟如下:(1)求出整幅圖像的最大灰度值和最小灰度值,分別記為Gmax和Gmin,令初始灰度門限;(2)根據(jù)灰度門限Tk將圖像分割為前景和背景,分別求出兩者的平均灰度值Z1和Z2;(4)若Tk=Tk+1,則Tk即為灰度門限,否則到第(2)步,繼續(xù)迭代計算。2.2圖像的二值化處理迭代法可以很好地完成二值分割工作,但我們也發(fā)現(xiàn)某些植物葉片可能遭受過蟲子的侵蝕(圖2(a)),從而在分割后的葉片目標內(nèi)部存在小的孔洞(圖2(b)),影響輪廓的提取,因此這部分圖像在二值化后需要進一步處理,為了保持葉片圖像的形狀特性以及邊緣的清晰,我們使用了數(shù)學形態(tài)學里的閉運算,即先進行膨脹運算,再進行腐蝕運算,這樣經(jīng)過一次或兩次處理后就消除了葉片內(nèi)部的小孔洞(圖2(c))。同時在實驗中我們發(fā)現(xiàn)葉片的葉柄由于長度參差不齊,對形狀特征的提取會造成一定的影響從而影響識別率,因此必須在二值化后的圖像里消除葉片的葉柄,這里可以使用形態(tài)學處理中的開運算,即先進行腐蝕運算,再進行膨脹運算,圖2(d)即為消除葉柄后的二值化葉片圖像。2.3輪廓跟蹤算法由于葉片的輪廓是葉片自身的象素子集,且輪廓同樣含有豐富的形態(tài)信息,通過輪廓來計算形狀特征比通過葉片本身來說計算量要小一些,在大批量的葉片樣本處理情況下更是明顯節(jié)約了時間,因此需要進一步提取葉片的輪廓,我們采用了輪廓跟蹤法來找出輪廓。可以看到分割后的圖像里葉片目標是由1象素構(gòu)成的,因此需要尋找由1象素構(gòu)成的輪廓點,對于1象素點我們考慮跟蹤其8個方向的鄰域,同時采用弗里曼鏈碼法對找到的輪廓點進行編碼。具體跟蹤算法步驟如下:(1)按照從上到下,從左到右的順序掃描圖像,得到的第一個象素值為1的點定為起始點,如果找不到起始點則算法結(jié)束;(2)按逆時針順序從當前點右邊開始搜索其8個方向的鄰域點,如果找到一個未曾搜索過的1象素點,并且該點上下左右4個方向含有0象素點,則把當前點置為該鄰域點,記錄下相應(yīng)的鏈碼值,重復(fù)該過程直到找到初始點。圖2(e)顯示了對圖2(d)中葉片輪廓的跟蹤結(jié)果。3幾何特征和hu不變矩通常可用于植物葉片分類的圖像特征有很多,比如形狀特征、顏色特征和紋理特征等,根據(jù)植物分類的相關(guān)理論,葉片的形狀特征是判斷葉片所屬種類的最重要和最有效的依據(jù),因此我們首先考慮提取葉片的幾何形狀特征用于分類。根據(jù)我們采集的葉片來看,不同種類葉片的形狀存在著較大的差異,即使是同一種葉片其大小比例也可能有所不同,這樣周長、面積,縱軸長、橫軸長等常用的絕對值特征就不太適合作為分類依據(jù),應(yīng)該考慮使用一些相對值特征,在這里我們可以利用葉片輪廓得到一些形狀描述(圖2(f)所示),包括最小包圍盒(boundingbox)、凸包(convexhull)、外切圓(excircle)和內(nèi)切圓(inscribedcircle)等,并通過它們計算得到了8項相對值幾何特征:縱橫軸比、矩形度、面積凹凸比、周長凹凸比、球狀性、圓形度、偏心率、形狀參數(shù)。(1)縱橫軸比(AspectRatio)是葉片最小包圍盒的長寬比值:(2)矩形度(Rectangularity)是葉片面積與葉片最小包圍盒面積的比值:(3)面積凹凸比(AreaConvexity)是葉片面積與葉片凸包面積的比值:(4)周長凹凸比(PerimeterConvexity)是葉片周長與葉片凸包周長的比值:(5)球狀性(Sphericity)是葉片面積與葉片凸包周長的計算值:(6)圓形度(Circularity)是葉片內(nèi)切圓半徑與外切圓半徑的比值:(7)偏心率(Eccentricity)是葉片自身長軸與短軸的比值:(8)形狀參數(shù)(FormFactor)是葉片面積和周長的計算值:以上8項幾何特征都具有旋轉(zhuǎn)、平移和尺度不變性,這些特性對于葉片識別來說是非常重要的,表1即為圖2(d)中葉片的8項幾何特征數(shù)值。除了幾何特征外,圖像矩由于具有天然的旋轉(zhuǎn)、平移和尺度不變性,也被廣泛地應(yīng)用在圖像識別領(lǐng)域里,因此我們另外加入了M.K.Hu提出的7項Hu不變矩作為識別特征,在這里我們采用了Chen提出的改進矩算法來計算這7項Hu不變矩,算法如下:Chen的p+q級改進矩定義為:同樣中心距μpq也可以近似計算為:為了得到尺度不變性μpq可進一步正則化為:其中正則化因子γ=p+q+1。利用正則化后的中心距ηpq我們就可計算出7個Hu不變矩,計算公式如下:表2為圖2(d)中葉片以及對其旋轉(zhuǎn)45°和縮小1倍后的7項Hu不變矩數(shù)值。這樣對于每片葉片我們采用其8項幾何特征和7項Hu不變矩作為分類特征,這15項特征均不隨著葉片目標旋轉(zhuǎn)、平移和尺度變化而變化。從表1和表2的數(shù)據(jù)可以看到一些特征在數(shù)量級上存在著較大的差異,比如縱橫比和不變矩-3就相差4個數(shù)量級,而不變矩-1和不變矩-7之間更差著10個數(shù)量級,因此需要對各項特征進行歸一化,我們使用公式(14)把各項特征值都歸一化到范圍里。其中E為特征值,Emax為所有葉片樣本數(shù)據(jù)中該項特征的最大值,Emin為所有葉片樣本數(shù)據(jù)中該項特征的最小值。4基于多個超球的擬合高維空間由于葉片樣本數(shù)量和我們選擇的分類特征數(shù)目都比較多,這樣在特征空間里特征向量的數(shù)量和維數(shù)都非常高,因此需要選用一種合理的分類器,既能保證較高的識別率也要盡量減少存儲空間和計算時間,基于此我們提出了一種移動中心超球分類法,它是一種對參考樣本進行壓縮的方法,通過對樣本數(shù)據(jù)的壓縮處理,有效地減少了存儲空間和計算時間,而且對識別正確率沒有影響。它的基本思想是用超球來代表一簇點,我們知道一個樣本在高維空間中就是一個點,一個類別就是對應(yīng)于空間中的一個點集,因此我們可以運用一系列超球來擬合這些點所在的高維空間。該算法大體思想是對每種樣本用若干個超球去逼近,并移動超球的中心同時努力擴大超球的半徑使其包含盡可能多的樣本點,從而減少存儲的超球數(shù)量,最終實現(xiàn)用多個超球包含樣本空間中所有的樣本點。下面以一類樣本點為例介紹移動中心超球分類器的訓練步驟:(1)初始化超球標記k=1,將所有樣本點放到一個集合里;(2)在集合里面找到一個離集合內(nèi)所有點的均值最近的點作為第k個超球的初始中心點s;(3)找到其他類里離中心點s最近的點,定義其到中心點距離為它類最近距離,記為d1;(4)我們在以s為中心點d1為半徑的超球里找到本類中離s最遠的點,定義其到s距離為本類最遠距離,記為d2;(6)在距中心點s最近的m個點里找在它類最近點的方向的反方向上的點,如果找到則把該點作為新的中心點并轉(zhuǎn)第(4)步,否則繼續(xù)下一步;(7)將集合里被超球所包圍的點從集合里去掉,如果集合內(nèi)還有點則k=k+1,轉(zhuǎn)第(2)步;否則去除掉那些被其它超球所包括的冗余超球,訓練結(jié)束。舉個例子,假設(shè)某一類里有40個樣本點,經(jīng)過訓練后可以用4個超球來覆蓋原有40個樣本點,這樣需要存儲的對象只有原來的,而識別時間也可以大大地縮短。在識別的時候,我們以待識別樣本點到超球外表面的距離為判斷依據(jù),判斷準則為:其中k表示訓練結(jié)束得到的超球總數(shù),di表示待識別樣本點到第i個超球的歐氏距離,ri表示第i個超球的半徑,I即為與待識別樣本點距離最近的超球所在類的標記(如果待識別樣本點正好位于一個超球的內(nèi)部,那么它到該超球外表面的距離為負值)。5測試時待識別樣本點與各超球外表面距離的關(guān)系我們選取了銀杏葉片、廣玉蘭葉片、桂花葉片、海桐葉片等20種植物葉片(圖3)來測試移動中心超球分類器的性能,每類葉片采集20個樣本,其中隨機選取15個作訓練樣本,剩余5個作測試樣本,試驗配置為:P42.4G主頻,80G硬盤,256M內(nèi)存。圖4為訓練結(jié)束時各超球的半徑,從圖中橫坐標的下標可以看出一共得到了60個超球。圖5為以某片銀杏葉片做測試時待識別樣本點與各超球外表面的距離,可以看到該點與第18個超球的外表面距離最近,而該超球正好覆蓋的是一部分銀杏葉片的樣本點。同時我們也用同一批數(shù)據(jù)對最近鄰分類器、4-近鄰分類器以及BP神經(jīng)網(wǎng)絡(luò)(輸入節(jié)點數(shù)為15,隱層節(jié)點數(shù)為12,輸出節(jié)點數(shù)為20)進行了測試,表3列出了四種分類器的訓練時間、識別時間、存儲空間和平均識別率。從表3中我們可以看到訓練過的移動中心超球分類器在識別時間上要比最近鄰分類器和4-近鄰分類器短,并且前者的存儲向量數(shù)比后面兩者要小得多,而識別率只比后兩者有微弱的下降。雖然移動中心超球分類器需要訓練而其它兩種不需要,但當對于一個具有龐大樣本數(shù)量的工程而言,可以看出由于識別時間和存儲空間上的優(yōu)勢,移動中心超球分類器是一個更好的選擇。與BP神經(jīng)網(wǎng)絡(luò)對比可以看出BP網(wǎng)絡(luò)基本上不需要什么存儲空間,識別時間也比較短,但訓練時間卻比移動中心超球分類器長很多,而且隨著樣本數(shù)量的增加,BP網(wǎng)絡(luò)收斂速度會非常慢,同時有可能會陷入局部極小,因此移動中心超球分類器可能更加適合于實際情況下的應(yīng)用。6中心超球分類器在這篇文章里我們提出了提取葉片的形狀特征并且結(jié)合一種新的移動中心超球分類器對葉片進行識別的方法。文中介紹的方法已經(jīng)成功地

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論