基于卷積神經(jīng)網(wǎng)絡的深度線段分類算法_第1頁
基于卷積神經(jīng)網(wǎng)絡的深度線段分類算法_第2頁
基于卷積神經(jīng)網(wǎng)絡的深度線段分類算法_第3頁
基于卷積神經(jīng)網(wǎng)絡的深度線段分類算法_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 基于卷積神經(jīng)網(wǎng)絡的深度線段分類算法 摘要:為解決單目圖像中冗余像素點不利于深度神經(jīng)網(wǎng)絡快速完成深度信息檢測的問題,提出一種基于卷積神經(jīng)網(wǎng)絡的深度線段分類算法。對 - 數(shù)據(jù)集使用線段檢測算法進行線段檢測得到原始圖像的線段特征圖。通過數(shù)據(jù)預處理結合深度數(shù)據(jù)得到表征深度信息的線段集合及其標簽,提出適用于線段特征的卷積神經(jīng)網(wǎng)絡,實現(xiàn)單目圖像中深度線段的分類。本論文從不同方面闡述基于卷積神經(jīng)網(wǎng)絡的深度線段分類算法,希望為研究卷積神經(jīng)網(wǎng)絡的專家和學者提供理論參考依據(jù)。關鍵詞:卷積神經(jīng)網(wǎng)絡;深度線段分類;算法將圖像某種特征屬性歸類到預先設定的類別中是圖像分類的主要依據(jù),圖像分類涉及到特征提取與分類算法兩大

2、塊。傳統(tǒng)的圖像分類算法過于依賴人的經(jīng)驗,但由于圖像信息具有不可描述性和復雜性,以及人類感知的高層語義信息與圖像的底層表達特征之間存在巨大落差,導致了傳統(tǒng)算法的局限性。以卷積神經(jīng)網(wǎng)絡算法為核心的深度學習,不需要依賴人工經(jīng)驗進行手動設計特征提取,通過有監(jiān)督學習合理地改變網(wǎng)絡深度完成特征學習,從而得到更加全面直接的圖像類別信息,繼而更加精確地對圖像進行分類識別。1深度卷積神經(jīng)網(wǎng)絡依靠人工經(jīng)驗提取樣本的特征數(shù)據(jù)是淺層模型的思想所在,因此特征數(shù)據(jù)的提取決定了整個圖像分類算法的復雜度和精確度。比較典型的淺層機器學習有最大熵法、邏輯回歸、隨機森林(rf)、boosting等,這些算法為了對淺層模型進行研究,

3、需要不斷地人工對樣本數(shù)據(jù)進行反復摸索,同時由于淺層學習輸入層和輸出層之間只含有較低的模型層數(shù),不能很好地解決非線性問題,研究進度受人的主觀因素影響大,具有不可擴展性。卷積神經(jīng)網(wǎng)絡由卷積層和池化層交替疊加構成9.由上層特征圖和卷積核通過卷積運算得到的特征圖構成了卷積層;對每個特征圖進行尺度縮小即對特征圖進行下采樣就是池化。卷積神經(jīng)網(wǎng)絡模型(cnn)如圖 1所示:圖 1 卷積神經(jīng)網(wǎng)絡模型圖 1 中,c1、c2 為兩個卷積層,s1、s2 為兩個池化層,黑白交替的方框則代表提取到的類型各異的特征圖.每個池化層前面都連接一個卷積層,卷積層通過對上一層輸出圖像進行卷積濾波;池化層則對特征數(shù)據(jù)進行下采樣.最

4、終輸出層(output)連接分類器,輸出不同類型分類的概率,概率最大對應的 label則為圖像分類結果。2數(shù)據(jù)預處理算法2.1線段過濾算法首先利用直線檢測算法對圖像進行線段特征提取,圖像中深度信息顯著的線段占有較小比例,會造成嚴重的數(shù)據(jù)不均衡問題。針對該問題設計圖像中的線段過濾算法是非常有必要的, 線段的特性主要有長度、角度、粗細等信息、經(jīng)試驗對比將線段長度作為設計線段過濾算法的主要因素。線段過濾算法如下:(1)對于每一張圖像經(jīng)過線段檢測算法提取到所有的線段特征 ();()計算圖像的高和寬,初始指定線段保留數(shù)目為 ;()當()的長度大于 時,根據(jù)端點數(shù)值計算每條線段的長度;() 對于線段端點值

5、超過圖像像素邊界值的點,使用像素邊界值進行替換;()將計算出的所有線段長度數(shù)值進行從大到小排序;()選擇長度數(shù)值排在前名的線段;()不斷優(yōu)化值,直至結果最優(yōu),送入網(wǎng)絡作為輸入;2.2數(shù)據(jù)標簽制作算法由于提取到的線段坐標為浮點數(shù),而原始的深度信息是根據(jù)圖像像素值進行對應保存的,且再深度信息的采集中丟失了許多幾何特征信息。所以原始圖像與深度圖像不能得到完全的對應,線段特征與深度信息的一致性就更加困難了,對線段的每個端點劃定一個2 c 2的矩形區(qū)域。將兩個端點對應矩形區(qū)域內求取 1組相對深度值,將這 組數(shù)值進行比較選取相對深度最大的值作為該條線段的相對深度。由于在數(shù)據(jù)集中含有室內、室外等不同場景。每

6、幅圖像的深度數(shù)據(jù)范圍不同,如臥室和道路又極大的深度范圍差異,故不能定義一個全局深度閾值來劃分深度線段和非深度線段。在本研究中,首先計算每幅圖像的深度數(shù)據(jù)平均值再根據(jù)試驗結果分配權重設定閾值定義標簽。2.3線段檢測方法() 是直線檢測常用的算法之一,其原理是像素合并與誤差控制, 在直線檢測過程中,該算法首先計算每一個像素與水平線的夾角,對其進行偽排序。 合并這個場里方向近似相同的像素。這樣可以得到一系列候選區(qū)域,這些候選區(qū)域被稱為線段候選區(qū)域, 每一個線段候選區(qū)域其實就是一組像素,作為直線段的候選區(qū)域,對于每個直線段候選區(qū)域。我們可以觀察它的最小外接矩形,當這一組像素構成的區(qū)域比較細長時,那么這

7、組像素更加可能是直線段。線段候選區(qū)域中若一個像素的水平線夾角角度與最小外接矩形的主方向的角度差在容忍度一定范圍內,這個點就是同性點, 統(tǒng)計最小外接矩形內的所有像素數(shù)和同性點點數(shù),用來判定這個線段候選區(qū)域是否是一個直線段, 然后根據(jù)目標的幾何特征設計快速算法以快速確定疑似目標區(qū)域??傊矸e神經(jīng)網(wǎng)絡模型可以有效改善深度估計問題中現(xiàn)有深度學習算法不能得到精確邊界問題。該模型可對深度線段進行分類, 分辨出清晰的物體邊界。 在- 數(shù)據(jù)集上進行了線段卷積試驗。結果表明在200條線段的圖像中深度線段分類準確度達到了73.50。該模型可以有效檢測出深度線段。根據(jù)線段分類的結果加強深度圖像的邊界信息,有利于更好的完成圖像深度信息檢測任務。參考文獻:1基于成長型神經(jīng)網(wǎng)絡以線段為基元的曲線重建j. 王世東,張佑生,王煥寶.工程圖學學報.2010(06)2基于圖像分割的線段檢測方法j. 張博,沈希忠.上海應用技術學院學報(自然科學版).2014(04)3線段提取在高分辨率遙感圖像建筑物識別中的應用j. 汪行,陳學佺,金敏.計算機輔助設計與圖形學學報.2005(05)4線段樹在程序設計中的應用j. 林盛華.大眾科技.2005(04)5如何求一組線段的交點j. 羅光宣,曉海.電腦愛好者.2001(16)6線段的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論