基于深度學習技術的湖北釘螺視覺識別模型的建立及訓練策略評價_第1頁
基于深度學習技術的湖北釘螺視覺識別模型的建立及訓練策略評價_第2頁
基于深度學習技術的湖北釘螺視覺識別模型的建立及訓練策略評價_第3頁
基于深度學習技術的湖北釘螺視覺識別模型的建立及訓練策略評價_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于深度學習技術的湖北釘螺視覺識別模型的建立及訓練策略評價

近年來,人工智能(deepedge)和機械學習(machinery)技術發(fā)展迅速,提高了計算機視覺識別的精度。湖北釘螺(Oncomelaniahupensis,以下簡稱“釘螺”)是日本血吸蟲的唯一中間宿主,控制釘螺是阻斷血吸蟲病傳播的重要措施之一本研究采用深度學習技術建立釘螺視覺智能識別模型,并應用于現(xiàn)場釘螺圖像識別,采用“數(shù)據(jù)增強+遷移學習”優(yōu)化的訓練策略提高圖像識別準確性,從而為精準和智能化釘螺調查提供一種新技術。內容和方法1螺類圖像標注目前國內缺少標準可靠的釘螺及相似螺類圖像數(shù)據(jù)集,為保證數(shù)據(jù)代表性和多樣性,本研究通過現(xiàn)場采集和互聯(lián)網(wǎng)抓取等方式建立數(shù)據(jù)集。現(xiàn)場采集以江蘇省作為研究現(xiàn)場,根據(jù)釘螺分布規(guī)律標準數(shù)據(jù)集標注由多位血吸蟲病防治領域專家完成。根據(jù)螺殼長度、縱肋、旋向、殼色、殼口、唇脊和厴等形態(tài)特征鑒定螺種是“釘螺”還是“非釘螺”,隨后將鑒定結果對照真實樣本編號進行復核。為確保數(shù)據(jù)標簽的有效性和準確性,對采集到的圖像數(shù)據(jù)進行嚴格篩選,對篩選后的圖像利用開源圖像標注軟件labelImg(/tzutalin/labelImg)進行標注(表1),累計標注螺類圖像2614幅。將標注后的螺類圖像通過邊緣填充圖像處理方法調整為正方形,通過大小縮放將圖像分辨率統(tǒng)一調整為500像素×500像素。本研究將釘螺數(shù)據(jù)集劃分為訓練集和測試集兩部分,其中訓練集用于對模型權重進行迭代更新,達到最優(yōu)識別效果;測試集用于從訓練集中優(yōu)選模型獲得實際測試運行的模擬效果。2方法2.1alneulalp4算法卷積神經(jīng)網(wǎng)絡(convolutionalneuralnetworks,CNN)作為深度學習技術的重要分支發(fā)展迅速式中,m為輸入的螺類圖像數(shù),1(y2.2基于遷移學習的釘螺圖像數(shù)據(jù)集模型訓練策略優(yōu)化采用“數(shù)據(jù)增強+遷移學習”。數(shù)據(jù)增強通過給每一個圖像增加多個副本,進而大幅度增加訓練樣本量。本研究采用水平鏡像、垂直翻轉、隨機裁剪、隨機亮度調節(jié)、隨機對比度調節(jié)、隨機旋轉、隨機放大、隨機變形、隨機遮擋等增強方式擴增數(shù)據(jù)集。遷移學習是將一個任務上預訓練好的CNN模型通過參數(shù)調整使其適用于一個新任務(圖1),主要步驟:(1)利用在ImageNet大型圖像數(shù)據(jù)集上預訓練Inception-ResNet-V2模型,采用遷移學習訓練策略,將預訓練模型卷積模塊學習到的圖像底層特征遷移到釘螺視覺智能識別模型的任務中作為初始化參數(shù);(2)將提取到的特征圖作為輸入對智能識別模型進行訓練,并且將預訓練網(wǎng)絡最后一層全連接層的輸出替換為本研究釘螺圖像數(shù)據(jù)集的類別數(shù),即“是”和“非”2種類別數(shù);(3)在已建立的螺類圖像數(shù)據(jù)集上完成模型訓練。2.3模型學習性能調整本研究采用TensorFlow-GPU1.15軟件為深度學習框架,Python3.5為編程語言,PyCharm2018.2.2(CommunityEdition)為集成開發(fā)環(huán)境,初始學習率設置為0.001。后續(xù)過程對學習率采用等間隔調節(jié)策略,每10輪迭代后學習率調整為當前學習率為1/10。優(yōu)化器參數(shù)用來更新和計算影響模型訓練和模型輸出的網(wǎng)絡參數(shù),使其逼近或達到最優(yōu)值。本研究優(yōu)化器采用自適應矩估計(adaptivemomentestimation,Adam)算法2.4模型識別性能評估混淆矩陣(confusionmatrix)是機器學習模型評價中可視化表格,混淆矩陣的每一列代表了預測類別,每一列總數(shù)表示預測為該類別數(shù)據(jù)的數(shù)目;每一行代表了數(shù)據(jù)的真實歸屬類別,每一行數(shù)據(jù)總數(shù)表示該類別的數(shù)據(jù)實例的數(shù)目(表2)模型二分類準確性評價指標有精確率(precision,P)、特異性(specificity,SP)、敏感性(sensitivity,SE)、F1值(F1score)、準確率(accuracy,ACC)、約登指數(shù)(Youdenindex,γ)、受試者工作特征(ROC)曲線下面積(areaundertheROCcurve,AUC)評估模型性能。計算公式如下:精確率指預測為正類的樣本中,實際為正類的占比。計算公式:敏感性指實際為正類的樣本中,正確預測為正類的占比。計算公式:特異性指實際為負類的樣本中,正確預測為負類的占比。計算公式:F1值指模型精確率和敏感性的加權平均,該綜合評價指標取值范圍0~1。計算公式:準確率指所有樣本被正確預測的占比,它能夠綜合反映在識別能力研究中獲得釘螺和非釘螺的正確判斷的比例。計算公式:約登指數(shù)對敏感性及特異性賦予相同權重,與準確率相比,在一定程度上糾正了釘螺與非釘螺構成比例對綜合評價的影響。取值范圍0~1,其值越大表明模型避免漏檢和誤判的能力越強。計算公式:AUC被廣泛用于醫(yī)學與公共衛(wèi)生領域的模型評價,AUC在90%以上時說明判斷結果有較高準確性,在70%~90%時有一定準確性,50%~70%時有較低準確性。2.5統(tǒng)計方法所有數(shù)據(jù)均采用SPSS26.0軟件進行統(tǒng)計分析。繪制ROC曲線,采用χ結果1不同輪數(shù)時3組訓練策略下結果隨著訓練輪數(shù)增加,3組不同訓練策略下的模型在訓練集上的準確率呈整體上升趨勢、損失值呈整體下降趨勢。其中在第3組訓練策略下,模型初始第1輪訓練時準確率最高(31.54%)、損失值最小(1.95);隨著訓練輪數(shù)增加,曲線收斂速度最快,曲線波動最小。當訓練輪數(shù)到100時,準確率升高到平臺期,達98.17%;損失值降低到平臺期,達0.11。相比另外2組訓練策略,第3組訓練策略下的模型能夠很好擬合該數(shù)據(jù)集,泛化能力良好(圖2、3)。2在不同的培訓策略下,研究了聚螺釘?shù)淖R別結果三種訓練策略下,模型識別釘螺的敏感性(χ2=15.875,P<0.001)、特異性(χ釘螺視覺智能識別模型的構建近年來,隨著計算機數(shù)據(jù)處理能力的增強,結合計算機視覺的機器學習技術逐漸被應用于寄生蟲病防治研究領域,并且取得一定成果本研究探索了基于深度學習技術構建釘螺視覺智能識別模型,并將其應用于現(xiàn)場釘螺樣本圖像識別。訓練集結果顯示,隨著訓練輪數(shù)增加,在“遷移學習+數(shù)據(jù)增強”訓練策略下,模型在訓練100輪后釘螺識別準確率達到98.17%、損失值降到0.11,較好擬合了螺類數(shù)據(jù)集,泛化能力優(yōu)于其他兩種訓練策略。測試集結果顯示,模型識別釘螺精確率、敏感性、特異性均超過90%,準確率、約登指數(shù)、F1值等綜合評價指標也在90%左右,AUC為0.94,表明基于深度學習技術的釘螺視覺智能識別模型對釘螺和非釘螺的綜合識別能力較好。受時間和空間限制,現(xiàn)場釘螺及4種相似螺圖像的大量采集工作有一定難度。由于深度學習結構復雜、參數(shù)眾多,且模型訓練需要大規(guī)模數(shù)據(jù),這對模型的訓練和應用帶來了困難。近年來,“遷移學習”已成為解決該問題的有效學習范式,其可一定程度緩解對大規(guī)模數(shù)據(jù)標注的依賴并大幅提高學習效果數(shù)據(jù)增強是克服由于訓練過程中目標樣本數(shù)據(jù)不足,導致深度學習方法陷入過擬合問題的有效手段之一本研究尚存在一定局限性:(1)本研究釘螺樣本采集地區(qū)局限于江蘇省內,不能代表全國其他地區(qū)樣本圖像識別能力;(2)本研究建立了二分類釘螺識別模型,僅能分類識別“釘螺”或“非釘螺”,不能細分類識別出是哪一類釘螺亞種或哪一種非釘螺類的相似螺。今后將進一步擴大釘螺及相似螺樣本采集范圍、進一步優(yōu)化智能模型的細分類識別能力,從而提高模型的應用范圍綜上,本研究首次建立了基于深度學習技術的日本血吸蟲中間宿主湖北釘螺視覺智能識別模型,通過對螺類數(shù)據(jù)集的多次訓練和測試,實現(xiàn)了對釘螺圖像的準確識別。通過“數(shù)據(jù)增強+遷移學習”優(yōu)化的訓練策略提高了模型識別釘螺的準確性,為釘螺調查新技術和新方法研究提供新思路,而構建的螺類圖像分類數(shù)據(jù)集亦為后續(xù)研究其他寄生蟲宿主螺類識別提供了數(shù)據(jù)基礎。Softmax分類器是輸出層的基礎,利用螺類特征圖中的特征預測圖片屬于某種螺類的概率。該分類器在多分類過程中使用,多個神經(jīng)細胞的輸出映射到(0,1)區(qū)間,形成一個概率。在全連接層輸入的特征矩陣接收到后,其輸出為輸入所對應的每個類別上的概率。通過這一過程

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論