《高空間分辨率遙感影像建筑物識別研究(論文)》_第1頁
《高空間分辨率遙感影像建筑物識別研究(論文)》_第2頁
《高空間分辨率遙感影像建筑物識別研究(論文)》_第3頁
《高空間分辨率遙感影像建筑物識別研究(論文)》_第4頁
《高空間分辨率遙感影像建筑物識別研究(論文)》_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

高空間分辨率遙感影像建筑物識別方法研究第一章緒論 第一章緒論1.1研究背景和意義中國是世界上的人口最多的國家,現(xiàn)階段,城市建設(shè)飛速發(fā)展,城市發(fā)展帶動了整個社會經(jīng)濟發(fā)展,城市建設(shè)成為現(xiàn)代化建設(shè)的重要核心。國家大力推進城市化建設(shè),而建筑物是城市的組成成分之一。城市建設(shè)的規(guī)劃、決策與管理都離不開對一個區(qū)域的建筑物了解。建筑物的GIS數(shù)據(jù)反映出某個地區(qū)的經(jīng)濟發(fā)展程度和某些資源集中程度,準確、及時地掌握城市建筑物變化信息能夠更好地建設(shè)數(shù)字城市和智慧城市,所以這與提取城市建筑物信息密切相關(guān)[1]。而遙感技術(shù)就提供了必要的手段。早在上世紀60年代,我國的遙感技術(shù)便開始立項研究,以軍事領(lǐng)域為主。其后隨著計算機時代的到來,遙感技術(shù)逐漸拓展到其他領(lǐng)域,同時與其他技術(shù)相結(jié)合共同為工業(yè)生產(chǎn)服務。這一時期我國研究人員對遙感技術(shù)的研究較為廣泛且深入,而且十多年的研究進程之后,我國遙感影像的成像質(zhì)量有了很大提高,包括時間、空間以及光譜等諸多元素的分辨率都得到了很大程度上的提高,為后來空間尺度上的高分辨率遙感圖像識別技術(shù)的發(fā)展提供了良好的研究基礎(chǔ)[2]。目前來看,隨著我國對遙感技術(shù)的研究愈發(fā)深入和細化,高空間分辨率遙感影像的使用場景愈發(fā)集中,主要以高空的建筑物識別為主,其中衛(wèi)星圖像的空間分辨率已提高到0.6m,而航空遙感數(shù)字圖像的分辨率則高達0.1m。光譜分辨率高達3-4nm[3],這為遙感檢測和識別建筑物提供了良好的數(shù)據(jù)基礎(chǔ)。最近幾年,隨著深度學習的逐漸發(fā)展,遙感領(lǐng)域的諸多技術(shù)都有與深度學習相互融合的空間,其中目標檢測識別和實例分割等方面的技術(shù)在與深度學習的技術(shù)融合過程中尤為突出,深度學習神經(jīng)網(wǎng)絡的引入給了傳統(tǒng)遙感領(lǐng)域諸多技術(shù)帶來了更為高效的信息識別功能,大大降低了人工是被成本,從而提高特征識別效率,并可以同時準確和有效地采集數(shù)據(jù),這是發(fā)展高分遙感應用學科的一大步。1.2建筑物提取方法研究現(xiàn)狀上世紀80年代,隨著計算機技術(shù)的進一步發(fā)展,遙感影像逐漸在各個領(lǐng)域嶄露頭角,其中建筑物提取領(lǐng)域的作用尤為突出[4]。其后的幾十年發(fā)展時間里面,國內(nèi)外學者在建筑物提取的方法研究上產(chǎn)出的成果愈發(fā)豐富,90年代,建筑物提取在我國學界受到廣泛的重視,并被認為是未來圖像處理領(lǐng)域的研究熱點以及建筑識別技術(shù)發(fā)展的首要任務[5]。一般來說,從使用構(gòu)成上來看,按照影像信息提取技術(shù)的主要途徑構(gòu)成可以大致分為人工提取、半自動提取、自動提取這三個層次,在計算機的輔助下,人工提取的輔助路徑逐漸邊緣化,而自動提取和半自動提取的圖像識別方式逐漸成為研究主流,而且相較于人工提取過程中較大的偶然性偏差,計算機輔助下的自動化研究技術(shù)能夠更快速、精確地提取建筑識別效率,從而實現(xiàn)高分辨率遙感影像在技術(shù)和應用上的突破。建筑物的識別和精確定位是人口估計,城市規(guī)劃等諸多用途的主要信息來源之一。在建筑物提取方法的研究中,大量學者針對不同的地表特征進行了總結(jié)性的概括,例如,文獻[6]將建筑物提取方法劃分為使用圖像空間特征,協(xié)助完成建筑物提取方法,并使用面向?qū)ο蟮姆椒▉硗瓿山ㄖ锏奶崛》椒?,使用建筑物索引來完成建筑物的提取方法。文獻[5,7]將建筑物的提取方法分為多尺度分割提取方法,同時基于邊角和角點檢測和匹配的提取方法,進行新理論和方法的組合。參考文獻[4]將建筑物的提取方法分為三類:基于區(qū)域分割的方法,使用輔助知識的方法以及基于線和角檢測和匹配的方法。在總結(jié)現(xiàn)有提取方法的基礎(chǔ)上,結(jié)合遙感圖像處理領(lǐng)域的特點,采用多尺度分割提取方法提取建筑物。高空間分辨率遙感圖像分割方法分為基于邊緣檢測的分割方法,圖像分割結(jié)合特定的數(shù)學理論和工具可以被認為是這些分割方法的進一步推廣和發(fā)展[34]。本文的研究方向是與人工神經(jīng)網(wǎng)絡的融合研究。自1980年代以來,人工神經(jīng)網(wǎng)絡一直是科學界的重點研究項目,而且作為人工智能的重要分支之一,人工神經(jīng)網(wǎng)絡還是連接傳統(tǒng)技術(shù)和人工智能的重要溝通渠道,可以說在機器學習領(lǐng)域,人工神經(jīng)網(wǎng)絡構(gòu)成了深度學習的主要通道。目前來看,在深度學習領(lǐng)域最為熱門的研究課題無疑為計算機視覺的交互應用研究,從研究成果來看,與深度學習融合之后的傳統(tǒng)識別圖像技術(shù)可以在圖像分類、目標檢測、語義分割等等各個方面進行瓶頸上的突破。一般來說,計算機視覺任務的研究和應用是逐級遞增的,即在實際識別過程中遵循一套基本的運算邏輯,首先對圖像中的數(shù)據(jù)集進行初步的分類,其次分別識別目標的具體內(nèi)容以及具體方位。在諸多識別方法中,F(xiàn)asterR-CNN算法是早期一種較為成熟的方式,該方法中的語義分割功能相較于傳統(tǒng)的識別方式能夠在目標檢測分類上變得更加精確,但是從另一個角度來看,F(xiàn)asterR-CNN算法在實例分割功能的發(fā)揮上具備一定的拓展空間。為此經(jīng)過一定的研究,MaskR-CNN算法被正式提出,相對于FasterR-CNN算法的局限性,MaskR-CNN算法能夠?qū)崿F(xiàn)全景分割的功能,即語義分割和實例分割的結(jié)合,相對于實例分割在背景處理上的略微不足,MaskR-CNN算法能夠很好地對目標圖片中的物體以及背景進行全方位的檢測和分割,本文也正是以MaskR-CNN算法為基礎(chǔ)對建筑物進行對象化識別。深度學習的概念與高分辨率遙感影像對建筑物的提取相結(jié)合,以實現(xiàn)影像識別的自動化,目前,主要的深度學習模型包括卷積神經(jīng)網(wǎng)絡(CNN),遞歸神經(jīng)網(wǎng)絡(RNN),深度置信網(wǎng)絡(DBN)和其他模型[18]。1989年,Leom等人結(jié)合反向傳播算法來實現(xiàn)第一個卷積神經(jīng)網(wǎng)絡[35],同時使用CNN進行手寫數(shù)字識別證明了深度神經(jīng)網(wǎng)絡用于圖像識別的可行性。其后隨著深度學習的進一步發(fā)展,卷積神經(jīng)網(wǎng)絡模型已廣泛應用于各個領(lǐng)域。目前來看,卷積神經(jīng)網(wǎng)絡又分為四個模型:R-CNN,F(xiàn)astR-CNN,F(xiàn)asterR-CNN和MaskR-CNN。每個模型都基于先前模型進行了不同的優(yōu)化。其中,MaskR-CNN作為在FasterR-CNN技術(shù)上的進一步研究陳,其通過向FasterR-CNN添加一個分支來進行像素級分割,同時將給定的卷積神經(jīng)網(wǎng)絡特征映射作為輸入,其中像素屬于該對象的所有位置用1表示,其他位置則用0表示,這就是二進制掩碼。當掩碼生成之后,MaskR-CNN算法便可以將RoIAlign與來自FasterR-CNN的分類和邊界框相結(jié)合,從而實現(xiàn)更為精確的分割。其后大量學者研究了基于卷積神經(jīng)網(wǎng)絡模型的建筑物提取方法,并總結(jié)了以下經(jīng)驗:黃冰晶[7]使用學習向量量法LVQ神經(jīng)網(wǎng)絡來識別和提取建筑物,然后將特征向量提取出來,加以對建筑物的大部分信息進行覆蓋,該方法的突出特點就是拜托了以往對建筑物的信息單因素提取局限性,在提取效率上更高。普恒[8]基于改進的MaskR-CNN目標識別算法,用于高分辨率遙感城市典型特征對象識別方法,以更好地識別典型城市特征和建筑物。改進的MaskR-CNN算法針對這三種類型的功能實現(xiàn)了最高的整體準確性和召回率;高揚[9]在卷積神經(jīng)網(wǎng)絡VGG16模型的基礎(chǔ)上調(diào)整了原始模型的結(jié)構(gòu),加深了模型的深度,減少了模型卷積層的卷積核數(shù),改進后的模型大大縮短了訓練時間,能夠更為準確地自動提取建筑物。經(jīng)過大量學者對建筑物提取方法的研究后,卷積神經(jīng)網(wǎng)絡模型被應用的更加成熟,也證明了在深度學習的基礎(chǔ)上,改進優(yōu)化了提取高空間分辨率遙感影像建筑物的方法,使其精度更高,提取更充分,克服了很多缺陷。經(jīng)過不斷地深度學習,本文利用MaskR-CNN算法對建筑物進行識別的方法,提供了一套可供參考的研究思路。1.3研究目標與內(nèi)容本文將面向深度學習的高空間分辨率遙感影像與基于MaskR-CNN卷積神經(jīng)網(wǎng)絡模型的技術(shù)相結(jié)合的方法,以將建筑物提取面向?qū)嶋H應用為方針,建立高空間分辨率遙感影像建筑物對象化識別的方法及技術(shù)流程。本文在研究內(nèi)容上主要從以下幾個方面進行展開:(1)高空間分辨率遙感影像建筑物的預處理方法研究。通過資料的查詢燈方式對高空間遙感影像數(shù)據(jù)的處理方式進行學習和借鑒,為本文的技術(shù)路線確定一定的知識基礎(chǔ)。(2)高空間分辨率遙感影像建筑物對象化識別方法研究。深入學習MaskR-CNN以及相關(guān)算法,理清各算法之間的關(guān)聯(lián)和使用效果,通過對不同的算法進行橫向?qū)Ρ?,最后MaskR-CNN算法構(gòu)建卷積神經(jīng)網(wǎng)絡模型,并應用于建筑物對象化識別技術(shù)流程。本文采用基于MaskR-CNN卷積神經(jīng)網(wǎng)絡模型的技術(shù)將高空間分辨率遙感影像深度學習與深度學習相結(jié)合的方法,以建筑物提取為實際應用為原則,進一步研究建筑物提取。建立了高空間分辨率遙感影像建筑目標識別的方法和技術(shù)過程。研究內(nèi)容包括以下兩個方面:(1)研究具有高空間分辨率遙感影像的建筑物的預處理方法。通過對高分辨率圖像數(shù)據(jù)進行圖像融合,圖像成幀,線性拉伸和圖像濾波等預處理步驟,提取并增強相關(guān)信息以校正原始圖像中的幾何和輻射畸變,即通過圖像獲取過程。校正畸變,畸變,模糊和噪聲,以獲得在幾何形狀和輻射方面盡可能真實的圖像,這為使用高空間分辨率遙感圖像進行建筑物識別提供了數(shù)據(jù)基礎(chǔ)。(2)高空間分辨率遙感影像建筑物目標識別方法研究。了解MaskR-CNN模型原理和相關(guān)算法,并總結(jié)使用該模型的建筑物提取方法。1.4論文組織結(jié)構(gòu)第一章為緒論。首先簡要介紹了高空間分辨率遙感影像建筑目標識別的研究背景意義以及目前關(guān)于高空間分辨率遙感影像建筑目標識別技術(shù)的發(fā)展現(xiàn)狀和發(fā)展起源。并并簡要介紹本文的研究內(nèi)容和框架。第二章為方法介紹,主要介紹高分辨率空間遙感影像的預處理方法。通過對高分圖像數(shù)據(jù)進行預處理,為后續(xù)的機器學習提供了數(shù)據(jù)基礎(chǔ)。第三章為高空間分辨率遙感影像建筑物目標識別方法研究。首先介紹深度學習遙感影像識別方法,其后介紹了基于MaskR-CNN的高分辨率空間遙感影像建筑物目標識別方法和技術(shù)過程。第四章為結(jié)論與展望。對本文的討論內(nèi)容進行初步總結(jié)并進行未來的展望。第二章面向深度學習的高空間分辨率遙感影像預處理方法研究2.1概述遙感圖像和普通數(shù)字圖像之間存在差異,主要在于信號記錄的方式不同,一般來說通的數(shù)字圖像是由紅色,綠色和藍色三個波段組成三維陣列構(gòu)成基本數(shù)字信號,而遙感圖像則以物體的分布記錄作為其基礎(chǔ)坐標進行空間上的表述,較為常見的坐標為波長和空間坐標,即以下表達式(2-1)。(2-1)相對于傳統(tǒng)的數(shù)字圖像來說,影響遙感圖像成型的因素更多,而且環(huán)境要求更為復雜,可以說在實際過程中不可避免地導致采集圖像信息的畸變和失真。而且由于拍攝條件的顯示,往往圖像分析識別精度低,為了保證后續(xù)識別過程的準確性,往往需要對采集圖像信號進行一定的預處理,以校正原始圖像中的幾何畸變和輻射畸變,主要技術(shù)路線如圖2-1所示。2.2面向高空間分辨率遙感影像建筑物對象化識別的影像預處理方法影像融合(1)實驗數(shù)據(jù)本文中用于圖像預處理的實驗數(shù)據(jù)是WordView-2衛(wèi)星在2011年拍攝的美國首都華盛頓特區(qū)的圖像,中心位于北緯38°91′和西經(jīng)77°01′,覆蓋了177平方千米。多光譜圖像中有8個光譜帶,分別是紅色,綠色,藍色,黃色,紅色邊緣,海岸,近紅外1,近紅外2。預處理方法包括圖像融合,圖像濾波等。每個步驟中使用的特定方法在下面的每個小節(jié)中進行說明。(2)實驗方法遙感圖像融合是一種以生成高分辨率多光譜圖像的圖像處理技術(shù),其具有多光譜特征[21]。在實際處理過程中,為了使融合圖像的保真度更高,往往需要借助一定的人力進行主管判斷,Gram-Schmidt融合算法正是判斷的重要依據(jù)之一,其主要步驟包括以下四個步驟[22]:1)從低分辨率光譜帶復制全色帶;2)Gram-Schmidt變換全色波段和光譜波段;3)用變換后的第一個波段替換具有高空間分辨率的全色波段;4)進行平移銳化后,應用Gram-Schmidt逆變換形成頻譜帶。該算法有兩個優(yōu)點:首先其可以同時處理多頻段數(shù)量的圖像信息,其次在該方法的處理過程中能夠保證較高的信息準確性,整個融合過程如圖2-2所示[19]。(3)實驗結(jié)果與分析在該實驗中,執(zhí)行了高分辨率圖像的多波段數(shù)據(jù)和全色數(shù)據(jù)的Gram-SchmidtPanSharpening融合。由于多光譜圖像數(shù)據(jù)具有豐富的光譜特征,全色圖像數(shù)據(jù)具有豐富的空間分辨率,因此圖像融合的功能是使處理后的圖像具有多光譜圖像的豐富光譜特征和較高的光譜分辨率,首先選擇多光譜數(shù)據(jù),然后選擇全色數(shù)據(jù)。圖2-3是圖像融合實驗的效果圖??梢钥闯?,融合后的圖像具有較好的視覺效果。影像濾波(1)實驗方法圖像濾波是在盡可能保證圖像細節(jié)特征的前提下,達到去燥及優(yōu)化邊緣輪廓的效果,圖像濾波有很多方法,如均值濾波、中值濾波、高斯濾波等多個濾波處理。為了更好的減輕地物識別的難度,提高識別的精度,本文結(jié)合不同濾波的特點優(yōu)勢,采用高斯濾波。楊嬌(2014)利用小波變換技術(shù)完成了影像的多分辨率融合。余鐘(2014)應用形態(tài)學濾波算法成功地將影像分解成紋理層和背景層。雖然以上兩種方式在實際運用過程中有較好的效果,但是考慮到算法本身的成本以及空間域頻域誤差,綜合分析直轄本文以高斯低通濾波器作為主要的處理方式,常見的集中處理方式分析如下:1)高斯函數(shù)可以形成在頻域中具有平滑性能的低通濾波器,其可以通過在頻域上乘積來實現(xiàn),從而可以有效地消除噪聲。2)均值濾波在每個像素周圍使用8個像素進行均值運算,但是無法有效消除噪音,還切還會對原有的信息進行一定的削弱。3)中值濾波用點區(qū)域窗口中所有像素的灰度值的中位數(shù)代替圖像中每個像素的灰度值,因此只能消除孤立的噪聲點,但是相應的邊緣將更加模糊。4)均值漂移濾波的邊緣保留效果更好,但是容易引起圖像過度模糊。5)雙邊濾波器具有良好的邊緣保持效果,但是由于保留了太多的高頻信息,因此無法有效地去除高頻噪聲。高斯濾波是一種線性平滑濾波器,其通過指定大小的矩陣模板掃描圖像中的每個像素,并為加權(quán)平均計算矩陣中的每個像素。最后,由模板確定的區(qū)域中像素的加權(quán)平均灰度值用于替換模板的中心像素的值。有以下兩個高斯表達式(2-2),(2-3)。一維高斯分布(2-2)二維高斯分布(2-3)(2)實驗結(jié)論與分析在執(zhí)行高斯濾波操作時,首先打開工具箱-“濾波器”-“卷積和形態(tài)”工具,選擇濾波類型,設(shè)置卷積參數(shù),選擇卷積濾波進行變換大小。具體操作界面如下圖(2-4)實驗對話框所示,圖(2-5)高斯濾波效果圖。圖(2-4)實驗對話框線性拉伸(1)實驗方法用于圖像增強的常見處理方法之一是線性拉伸。遙感圖像包含有關(guān)各種物體的反射率和輻射線大小以及分布的信息,因此以一定間隔收集遙感圖像不能充分利用灰色空間,從而導致圖像對比度較低。針對這種情況,線性拉伸圖像處理方法算法簡單,可以有效提高圖像對比度,提高圖像中不同物體的特征。在本文中,使用16位TIFF圖像執(zhí)行2%-98%的最大和最小拉伸[37],將16位圖像量化為8位,處理可以獲得更好的視覺效果,從而使后續(xù)處理和分析更加方便。數(shù)學表達式如下(2-2)。(2-2)(2)實驗結(jié)果與分析上一節(jié)中的過濾結(jié)果從2%線性擴展到98%,以增強圖像功能。比較拉伸前的以下圖像(2-6)圖像和拉伸后的圖像(2-7)圖像:圖(2-6)拉伸前影像圖圖(2-7)拉伸后影像圖影像分幅(1)實驗方法圖像分割是指將整個圖像研究區(qū)域切成幾個小圖像,以方便數(shù)據(jù)存儲和處理。本文采用按照指定網(wǎng)格尺寸進行裁剪的方法對融合的高空間分辨率遙感影像進行分割,將大尺寸影像分為500*500指定大小的多個遙感影像。具體的分割方法是使用ArcGIS的柵格分割工具SplitRaster,將輸出柵格尺寸設(shè)置為500*500,最后輸出統(tǒng)一尺寸的TIFF圖像。(2)實驗結(jié)果與分析在本實驗中,使用ArcGIS分割圖像。首先,選擇像素的高度和像素的寬度為500*500的固定大小,行和列的數(shù)量為16*16,并選擇坐標系作為地理投影坐標部門WGS_1984_UTM_Zone_10N。然后選擇圖像的建筑區(qū)域的網(wǎng)格并刪除非建筑區(qū)域的網(wǎng)格。是圖像分割的結(jié)果。樣本庫制作(1)實驗方法在深度學習技術(shù)的訓練樣本中,目標樣本的提取是必不可少且非常重要的部分,相對于以上諸多步驟來說,樣本庫制作同樣是圖像預處理之后的必要步驟之一。以上的方法大都對圖像進行一定的處理,從而進行某些信息的抑制以及突出,樣本庫制作更多地是對之前所處理的信息,從特征,特征和位置信息等方面進行一定的收集、對比記錄,一般來說,樣本庫的生產(chǎn)使用開源工具Labelme手動提取目標要素樣本。作為一種圖像標簽工具,Labelme可用于在圖像上標記各種類型的圖形、線段和點,而且可以支持不同圖形的標簽,該方法顯示在下面的圖2-9中的樣本構(gòu)建方法的技術(shù)流程圖中。更加突出地表手機信息的特征和真實情況,并提取特征樣本并生成相應的Json文件。最后,通過Json文件生成要素屬性。(2)實驗結(jié)果與分析下面的圖2-10是建筑物示例數(shù)據(jù)的示例。由于圖像的大比例尺和小面積等特點,在提取建筑樣本的過程中需要注意以下幾個方面:1)圖像中植被,陰影遮擋部分比較清晰,在提取地表建筑物信息的額時候可以避免大面積的陰影,從而確保地面物體的完整幾何特征,提高建筑物識別性別的準確性和真實性。2)拍攝圖像時出現(xiàn)角度問題。既有斜視又有高架建筑物,建筑物的特征信息還包括斜視的外觀。3)在視覺解釋中,一些建筑物彼此獨立存在,此時需要視覺識別來分別提取這些建筑物。4)提取建筑物時,矢量線應與建筑物的邊界重合,以使間隙緊密且不暴露間隙。2.3本章小結(jié)本章以WorldView-2的高空間分辨率遙感影像為數(shù)據(jù)源,并對影像預處理方法進行了詳細的介紹,同時對樣品庫生產(chǎn)的完整過程進行闡述。由于原始的全色和多光譜圖像無法直接使用,因此需要進行圖像預處理才能執(zhí)行深度學習算法,另外為了充分利用原始圖像的特征信息,還需要對數(shù)據(jù)進行圖像預處理。在預處理過程中,首先是通過圖像融合的方法獲得高分辨率的真彩色遙感圖像,然后進行高斯低通濾波以進行圖像增強,接著使用2%-98%最大和最小線性拉伸Stretch將16位圖像量化為8位并改善了圖像對比度。最后,將圖像構(gòu)圖并裁剪為尺寸為500*500的多個小尺寸和固定尺寸圖像,同時獲得實驗圖像集。一般來說,預處理后的圖像集用于制作樣本庫,并獲得輸入樣本所需的屬性文件。

第三章高空間分辨率遙感影像建筑物識別方法研究3.1深度學習遙感影像識別方法概述在遙感領(lǐng)域研究方面,遙感圖像的分類與識別是極為重要的一個環(huán)節(jié),對其規(guī)律和現(xiàn)象的研究成為半個世紀以來的研究重點,中間產(chǎn)生的各種算法而言,主要可以大致分為有監(jiān)督分類和非監(jiān)督分類這兩種[39]。而如今隨著技術(shù)的發(fā)展和實際應用場景的復雜化,傳統(tǒng)的算法已然無法滿足新時代的使用需求,為此在大數(shù)據(jù)技術(shù)發(fā)展的當下,借助于計算運用和傳統(tǒng)算法額融合可以在很大程度上對傳統(tǒng)算法進行研究方向和功能實現(xiàn)上的拓展,同時這也是研究人員在深度學習領(lǐng)域的研究重點,諸多研究成果表示,深度學習在圖像識別領(lǐng)域的可擴展性和良好的性能。通常,將深度學習用于遙感圖像識別時,該過程可以簡單地概括以下步驟[16]:1)確定訓練樣本數(shù)據(jù)。2)解釋訓練樣本數(shù)據(jù)。3)確定深度學習功能的輸入特征的表示方法。4)確定要學習的功能以及相應學習算法使用的深度學習算法,同時使用在步驟2中準備的樣本數(shù)據(jù),輸入要運行的深度學習算法。5)完成設(shè)計。3.2MaskR-CNN算法3.2.1MaskR-CNN神經(jīng)網(wǎng)絡識別方法簡介隨著基于區(qū)域建議的檢測網(wǎng)絡的發(fā)展,MaskR-CNN算法在目標分割,目標檢測和人體關(guān)鍵點檢測方面取得了非常好的成績,因此,本文選擇MaskR-CNN作為高分辨率遙感城市目標識別的基本方法。相對于其他技術(shù),作為FasterR-CNN的擴展和優(yōu)化,MaskR-CNN算法在實際識別過程中可以較為靈活地擴展到多任務處理,同時對多個任務進行實時檢測。目標檢測的主要步驟如圖3-1所示。FasterR-CNN算法主要解決區(qū)域提議網(wǎng)絡(RPN)和特征提取網(wǎng)絡共享的問題,MaskR-CNN基于FasterR-CNN算法,主要對三個方面進行了優(yōu)化和擴展:1)增強了特征提取網(wǎng)絡,實現(xiàn)了特征提取表達能力更強,可以挖掘多尺度信息,適用于多尺度遙感圖像的特征提??;2)在目標檢測中添加與分類和定位層平行的遮罩全連接層分支,同時進行目標檢測3)使用RoIAlign層代替原始的RoIPooling層,提取的特征與輸入圖像特征精確對齊,從而提高了識別準確性。在本文中,使用卷積神經(jīng)網(wǎng)絡MaskR-CNN算法對高得分圖像中相同類型特征的不同實例的個體實例進行對象化。目標檢測的主要步驟如圖3-1所示。3.2.2MaskR-CNN算法介紹MaskR-CNN模型的整體框架如圖3-2所示。其原理主要分為三個階段,簡要描述如下:在第一階段,使用卷積網(wǎng)絡提取整個圖像上的特征。在第二階段,區(qū)域提議網(wǎng)絡提出候選目標邊界框。第三階段,RoIAlign圖層用于從每個候選框提取特征,預測類別,邊界偏移細化以及并行輸出二進制掩碼以進行分類。在從ResNet到FPN的基本網(wǎng)絡過程中,很容易優(yōu)化網(wǎng)絡深度以提高準確性;此外由于FRN是金字塔特征結(jié)構(gòu),具備融合低層特征和深層特征,其可以在一定程度上提取更精確的位置和其他特征信息。區(qū)域網(wǎng)絡RPN的功能是為目標定位幀生成區(qū)域建議候選幀。對于RolAlign層,使用線性差異圖像縮放算法將提取的特征與輸入準確對齊;提取并降低卷積層輸出結(jié)果的維數(shù)。隨著對目標檢測任務的需求不斷增長,雖然在目標分割技術(shù)上的算法發(fā)展較為迅速,但是從實際角度來看,目標分割方法的發(fā)展仍然存在瓶頸。這個問題主要體現(xiàn)在兩個方面,一是方向性問題;其次,精度問題。本文之所以選擇MaskR-CNN作為建筑物檢測算法的基本算法,是因為MaskR-CNN算法很好地解決了上述問題:(1)采用語義分割方法解決方向問題;(2)使用物體識別技術(shù)解決邊界框的精度問題。MaskR-CNN是基于FasterR-CNN的擴展形式。相對于FasterR-CNN技術(shù)來說,MaskR-CNN更容易進行內(nèi)容拓展,MaskR-CNN算法的一般網(wǎng)絡框架如下圖3-3所示:圖3-3MaskR-CNN算法的網(wǎng)絡框架結(jié)構(gòu)圖MaskR-CNN算法的步驟:(1)首先輸入要處理的圖片,進行預處理;然后,將其輸入到預先訓練的神經(jīng)網(wǎng)絡中以獲得相應的特征圖。(2)為特征圖中的每個點設(shè)置預定數(shù)量的ROI;(3)將這些候選ROI發(fā)送到RPN網(wǎng)絡進行二進制分類和BB回歸以濾除候選ROI的一部分;(4)對剩余的這些ROI進行ROIAlign操作;(5)最后,對這些ROI進行分類。MaskR-CNN使用ROIAlign優(yōu)化RoIPooling池引起的空間位置不對準問題,并引入了一種新的插值方法,首先通過雙線性插值到14*14,然后再池化到7*7,而后者沒有使用量化運算,使用線性插值算法[13-14]。RoIPooling區(qū)域提議是檢測原始圖像的興趣區(qū)域,然后使用RoIPooling查找由卷積生成的特征圖的相應特征檢測塊。為了保證結(jié)果的真實性,RoIAlign不會對計算結(jié)果進行四舍五入,而是通過雙線性插值來確定原始圖像感興趣區(qū)域中每個點的特征值,最終執(zhí)行合并等操作以提高精度。。圖3-4ROIAlign原理示意圖如圖3-4所示,實線框被映射到特征圖上的ROI區(qū)域。需要在ROI區(qū)域執(zhí)合并操作。首先將ROI區(qū)域劃分為四個2*2區(qū)域,然后在每個小區(qū)域中選擇4個采樣點和最靠近采樣點的4個特征點,通過雙線性插值法獲得每個采樣點的像素值;最終計算每個單元格的MaxPooling,使用的反向傳播計算公式3-1如下[75]:(3-1)其中,表示經(jīng)過池化后第r個區(qū)域的第j個坐標點,i(r,j)表示點所對應的原圖像點坐標,和分別表示橫縱坐標的梯度。每個網(wǎng)格可以定義為一個bin,且每個bin的大小為,判斷第(i,j)的特征信息的公式3-2為:(3-2)其中,表示輸出了個分數(shù)圖,原來感興趣區(qū)域的左上角坐標用表示,n表示bin重的像素總個數(shù),表示網(wǎng)絡參數(shù)。則對于每個感興趣區(qū)域ROI可以得到公式3-3:(3-3)平均得分的主要作用是對每個ROI進行投票,對應計算公式3-4如下:(3-4)損失函數(shù)中定義為平均二值交叉熵損失函數(shù),且對應計算公式3-5如下:(3-5)由其定義可知,對于第i(1≤i≤c)個類別的ROI中僅與第i個有關(guān),對于每一個ROI,mask分支有維度的輸出,其對K個大小為的mask進行編碼。對應一個屬于GT中的第k類的ROI,僅僅在第k個mask上面有定義,我們定義的允許網(wǎng)絡為每一類生成一個mask,同時在選擇輸出的mask步驟中,很大程度上依賴于分類分支所預測的類別標簽,其后將分類和mask生成分解開來。經(jīng)驗表明,通過對每個Class對應一個Mask可以在很大程度上提升實例分割的效果作用。圖(3-5)多任務Loss原理圖如圖3-5中所示首先得到預測分類為k的mask特征,然后把mask區(qū)域映射成大小的mask區(qū)域特征,最后計算該區(qū)域的平均二值交叉損失熵。3.2.3基于MaskR-CNN模型高空間分辨率遙感影像建筑物對象化識別技術(shù)流程對于本論文研究的城市建筑物提取存在一套完整的結(jié)構(gòu)體系,首先將高空間分辨率遙感影像數(shù)據(jù)進行預處理,實現(xiàn)影像特征物的增強,達到自動、快速、精確的提取地物的目的,然后構(gòu)建樣本數(shù)據(jù),完成樣本庫的制作,為接下來的卷積神經(jīng)網(wǎng)絡MaskR-CNN高空間分辨率遙感影像建筑物對象化識別的實驗打下基礎(chǔ)。最后是利用訓練好的卷積神經(jīng)網(wǎng)絡MaskR-CNN模型對影像進行建筑物對象化識別。完整技術(shù)流程圖如下圖(3-6)。3.2本章小結(jié)本章詳細的介紹了卷積神經(jīng)網(wǎng)絡MaskR-CNN的原理算法及完成目標檢測的技術(shù)流程。對卷積神經(jīng)網(wǎng)絡MaskR-CNN模型總體框架進行每個結(jié)構(gòu)的描述,包括其功能、目的等。卷積神經(jīng)網(wǎng)絡MaskR-CNN能在有效檢測目標的同時進行實例分割,本章描述了其三個原理階段。最后對基于MaskR-CNN模型高空間分辨率遙感影像建筑物對象化識別進行技術(shù)流程的描述。

第四章結(jié)論與展望4.1結(jié)論近年來,人工神經(jīng)網(wǎng)絡發(fā)展迅速,其中神經(jīng)網(wǎng)絡技術(shù)已逐漸成為一種廣泛有效的技術(shù),不少領(lǐng)域的研究人員正試圖在傳統(tǒng)的研究領(lǐng)域逐漸融入人工神經(jīng)網(wǎng)絡技術(shù),其中圖像識別領(lǐng)域的研究成果相對較為突出,在一定程度上證明了人工神經(jīng)網(wǎng)絡技術(shù)于圖象識別技術(shù)的融合可行性以及較大的發(fā)展空間。據(jù)此本文在整合國內(nèi)外圖像建筑物提取的研究基礎(chǔ)上將人工神經(jīng)網(wǎng)絡的優(yōu)勢與遙感相結(jié)合,建立一種基于MaskR-CNN算法的高分辨力遙感圖像建筑物識別的圖像處理技術(shù),并分別對其進行闡述和介紹。通過對高空間分辨率遙感圖像進行預處理,并建立人工樣本庫,為建筑物識別實驗提供了數(shù)據(jù)基礎(chǔ)。(1)具有高分遙感的圖像預處理和人工樣本數(shù)據(jù)庫:以高斯低通濾波為主要方式,在轉(zhuǎn)換過程中確保圖像質(zhì)量并增強圖像中特征的特征,并提高了模型識別的準確性。(2)介紹了基于深度學習的空間分辨率遙感圖像目標識別方法。(3)介紹了使用MaskR-CNN目標識別的算法和原理、功能和目的。4.2展望本文結(jié)合大量研究文獻,首先介紹基于MaskR-CNN模型的高空間分辨率遙感影像目標識別方法,可以預見的是,隨著深度學習技術(shù)與識別技術(shù)的進一步結(jié)合,在以下諸多方面都有較為明確的技術(shù)進展:(1)首先是模型識別性能,尤其是在圖像的邊緣精細分割上,以提高模型的識別精度,并保留更完整的邊緣信息。(2)提高樣本庫建設(shè)效率。深度學習技術(shù)的發(fā)展和使用在很大程度上依賴于大數(shù)據(jù)的運用,但是需要注意的是,大數(shù)據(jù)的應用過程總難免會產(chǎn)生一定的錯誤,未來在技術(shù)融合方面可以在監(jiān)管方面進行一定的建設(shè),同時不斷訓練模型以提高模型效率。參考文獻[1]張永飛.基于高分辨率影像面向?qū)ο蟮慕ㄖ镄畔⑻崛D].安徽理工大學,2018:27-31[2]李德仁.論21世紀遙感與GIS的發(fā)展[J].武漢大學學報,2003(2):127-131[3]宮鵬.黎夏,徐冰.高分辨率影像解譯理論與應用方法中的一些研究問題[J].遙感學報,2006(1):1-5[4]嚴巖.高空間分辨率遙感影像建筑物提取研究綜述[J].數(shù)字技術(shù)與應用,2012(7):75-76,78[5]張慶云,趙東.高空間分辨率遙感影像建筑物提取方法綜述[J].測繪與空間地理信息,2015(4):74-78[6]黃小兵.高分辨率遙感影像建筑物提取方法研究[D].西安科技大學,2014:25-36[7]黃冰晶.高分辨率遙感影像建筑物提取研究[D].昆明理工大學,2018:17-21[8]普恒.高分遙感城市典型地物對象化識別方法研究[D].北京建筑大學,2019:41-67[9]高揚.基于卷積神經(jīng)網(wǎng)絡的高分辨率遙感影像建筑物提取[D].南京大學,2018:75-85[10]孫寧.面向高空間分辨率遙感影像的建筑物目標識別方法與研究[D].浙江大學,2010:64-83[11]林雨準.面向?qū)ο蟮母叻直媛蔬b感影像建筑物提取和變化檢測技術(shù)研究[D].戰(zhàn)略支援部隊信息工程大學,2018:77-89[12]HintonGE,OsinderoS,etal.Afastlearningalgorithmfordeepbeliefnets[J].Neuralcomputation,2006,18(7):1527-1554[13]王斌,范冬林.深度學習在遙感影像分類與識別中的研究進展綜述[J].測繪通報,2019(02):99-102+136.[14]李丹.基于深度學習的目標檢測綜述[J].科技經(jīng)濟導刊,2019,27(13):1-2+31[15]高常鑫,桑農(nóng).基于深度學習的高分辨率遙感影像目標檢測[J].測繪通報,2014(S1):108-111[16]韓敏.基于神經(jīng)網(wǎng)絡的監(jiān)督和半監(jiān)督學習方法與遙感圖像智能解譯[M].北京中國水利水電出版社,2015:41-64[17]王斌,范冬林.深度學習在遙感影像分類與識別中的研究進展綜述[J].測繪通報,2019(02):99-102+136.[18]潘昕.遙感影像建筑物提取與深度學習[D].北京建筑大學,2018:85-96[19]趙忠明,孟瑜等.遙感圖像處理[M].北京,科學出版社2014:11-32[20]韋玉春,湯國安.遙感數(shù)字圖像處理教程[M].北京,科學出版社2015:56-68[21]李聰,崔希民,王強,等.WorldView-2遙感影像融合方法研究[J].黑龍江工程學院學報,2014,28(6):17-20.[22]李存軍,劉良云等.兩種高保真遙感影像融合方法比較[J].中國圖象圖形學報,2004,9(11):1376-1385.[23]GirshickR,DonahueJ,etal.RichFeatureHierarchiesforAccurateObjectDetectionandSemanticSegmentation,2014[C].:72-94[24]ChenMa,LiChen,JunhaiYong.AUR-CNN:EncodingexpertpriorknowledgeintoR-CNNforactionunitdetection[J].Neurocomputing,2019,355.[25]姚群力,胡顯等.深度卷積神經(jīng)網(wǎng)絡在目標檢測中的研究進展[J].計算機工程與應用,2018,54(17):1-9.[26]RenS,HeK,etal.FasterR-CNN:TowardsReal-TimeObjectDetectionwithRegionProposalNetworks[J].IEEETransactionsonPatternAnalysis

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論