



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于深度學(xué)習技術(shù)的湖北釘螺視覺識別模型的建立及訓(xùn)練策略評價
近年來,人工智能(deepedge)和機械學(xué)習(machinery)技術(shù)發(fā)展迅速,提高了計算機視覺識別的精度。湖北釘螺(Oncomelaniahupensis,以下簡稱“釘螺”)是日本血吸蟲的唯一中間宿主,控制釘螺是阻斷血吸蟲病傳播的重要措施之一本研究采用深度學(xué)習技術(shù)建立釘螺視覺智能識別模型,并應(yīng)用于現(xiàn)場釘螺圖像識別,采用“數(shù)據(jù)增強+遷移學(xué)習”優(yōu)化的訓(xùn)練策略提高圖像識別準確性,從而為精準和智能化釘螺調(diào)查提供一種新技術(shù)。內(nèi)容和方法1螺類圖像標注目前國內(nèi)缺少標準可靠的釘螺及相似螺類圖像數(shù)據(jù)集,為保證數(shù)據(jù)代表性和多樣性,本研究通過現(xiàn)場采集和互聯(lián)網(wǎng)抓取等方式建立數(shù)據(jù)集?,F(xiàn)場采集以江蘇省作為研究現(xiàn)場,根據(jù)釘螺分布規(guī)律標準數(shù)據(jù)集標注由多位血吸蟲病防治領(lǐng)域?qū)<彝瓿?。根?jù)螺殼長度、縱肋、旋向、殼色、殼口、唇脊和厴等形態(tài)特征鑒定螺種是“釘螺”還是“非釘螺”,隨后將鑒定結(jié)果對照真實樣本編號進行復(fù)核。為確保數(shù)據(jù)標簽的有效性和準確性,對采集到的圖像數(shù)據(jù)進行嚴格篩選,對篩選后的圖像利用開源圖像標注軟件labelImg(/tzutalin/labelImg)進行標注(表1),累計標注螺類圖像2614幅。將標注后的螺類圖像通過邊緣填充圖像處理方法調(diào)整為正方形,通過大小縮放將圖像分辨率統(tǒng)一調(diào)整為500像素×500像素。本研究將釘螺數(shù)據(jù)集劃分為訓(xùn)練集和測試集兩部分,其中訓(xùn)練集用于對模型權(quán)重進行迭代更新,達到最優(yōu)識別效果;測試集用于從訓(xùn)練集中優(yōu)選模型獲得實際測試運行的模擬效果。2方法2.1alneulalp4算法卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetworks,CNN)作為深度學(xué)習技術(shù)的重要分支發(fā)展迅速式中,m為輸入的螺類圖像數(shù),1(y2.2基于遷移學(xué)習的釘螺圖像數(shù)據(jù)集模型訓(xùn)練策略優(yōu)化采用“數(shù)據(jù)增強+遷移學(xué)習”。數(shù)據(jù)增強通過給每一個圖像增加多個副本,進而大幅度增加訓(xùn)練樣本量。本研究采用水平鏡像、垂直翻轉(zhuǎn)、隨機裁剪、隨機亮度調(diào)節(jié)、隨機對比度調(diào)節(jié)、隨機旋轉(zhuǎn)、隨機放大、隨機變形、隨機遮擋等增強方式擴增數(shù)據(jù)集。遷移學(xué)習是將一個任務(wù)上預(yù)訓(xùn)練好的CNN模型通過參數(shù)調(diào)整使其適用于一個新任務(wù)(圖1),主要步驟:(1)利用在ImageNet大型圖像數(shù)據(jù)集上預(yù)訓(xùn)練Inception-ResNet-V2模型,采用遷移學(xué)習訓(xùn)練策略,將預(yù)訓(xùn)練模型卷積模塊學(xué)習到的圖像底層特征遷移到釘螺視覺智能識別模型的任務(wù)中作為初始化參數(shù);(2)將提取到的特征圖作為輸入對智能識別模型進行訓(xùn)練,并且將預(yù)訓(xùn)練網(wǎng)絡(luò)最后一層全連接層的輸出替換為本研究釘螺圖像數(shù)據(jù)集的類別數(shù),即“是”和“非”2種類別數(shù);(3)在已建立的螺類圖像數(shù)據(jù)集上完成模型訓(xùn)練。2.3模型學(xué)習性能調(diào)整本研究采用TensorFlow-GPU1.15軟件為深度學(xué)習框架,Python3.5為編程語言,PyCharm2018.2.2(CommunityEdition)為集成開發(fā)環(huán)境,初始學(xué)習率設(shè)置為0.001。后續(xù)過程對學(xué)習率采用等間隔調(diào)節(jié)策略,每10輪迭代后學(xué)習率調(diào)整為當前學(xué)習率為1/10。優(yōu)化器參數(shù)用來更新和計算影響模型訓(xùn)練和模型輸出的網(wǎng)絡(luò)參數(shù),使其逼近或達到最優(yōu)值。本研究優(yōu)化器采用自適應(yīng)矩估計(adaptivemomentestimation,Adam)算法2.4模型識別性能評估混淆矩陣(confusionmatrix)是機器學(xué)習模型評價中可視化表格,混淆矩陣的每一列代表了預(yù)測類別,每一列總數(shù)表示預(yù)測為該類別數(shù)據(jù)的數(shù)目;每一行代表了數(shù)據(jù)的真實歸屬類別,每一行數(shù)據(jù)總數(shù)表示該類別的數(shù)據(jù)實例的數(shù)目(表2)模型二分類準確性評價指標有精確率(precision,P)、特異性(specificity,SP)、敏感性(sensitivity,SE)、F1值(F1score)、準確率(accuracy,ACC)、約登指數(shù)(Youdenindex,γ)、受試者工作特征(ROC)曲線下面積(areaundertheROCcurve,AUC)評估模型性能。計算公式如下:精確率指預(yù)測為正類的樣本中,實際為正類的占比。計算公式:敏感性指實際為正類的樣本中,正確預(yù)測為正類的占比。計算公式:特異性指實際為負類的樣本中,正確預(yù)測為負類的占比。計算公式:F1值指模型精確率和敏感性的加權(quán)平均,該綜合評價指標取值范圍0~1。計算公式:準確率指所有樣本被正確預(yù)測的占比,它能夠綜合反映在識別能力研究中獲得釘螺和非釘螺的正確判斷的比例。計算公式:約登指數(shù)對敏感性及特異性賦予相同權(quán)重,與準確率相比,在一定程度上糾正了釘螺與非釘螺構(gòu)成比例對綜合評價的影響。取值范圍0~1,其值越大表明模型避免漏檢和誤判的能力越強。計算公式:AUC被廣泛用于醫(yī)學(xué)與公共衛(wèi)生領(lǐng)域的模型評價,AUC在90%以上時說明判斷結(jié)果有較高準確性,在70%~90%時有一定準確性,50%~70%時有較低準確性。2.5統(tǒng)計方法所有數(shù)據(jù)均采用SPSS26.0軟件進行統(tǒng)計分析。繪制ROC曲線,采用χ結(jié)果1不同輪數(shù)時3組訓(xùn)練策略下結(jié)果隨著訓(xùn)練輪數(shù)增加,3組不同訓(xùn)練策略下的模型在訓(xùn)練集上的準確率呈整體上升趨勢、損失值呈整體下降趨勢。其中在第3組訓(xùn)練策略下,模型初始第1輪訓(xùn)練時準確率最高(31.54%)、損失值最小(1.95);隨著訓(xùn)練輪數(shù)增加,曲線收斂速度最快,曲線波動最小。當訓(xùn)練輪數(shù)到100時,準確率升高到平臺期,達98.17%;損失值降低到平臺期,達0.11。相比另外2組訓(xùn)練策略,第3組訓(xùn)練策略下的模型能夠很好擬合該數(shù)據(jù)集,泛化能力良好(圖2、3)。2在不同的培訓(xùn)策略下,研究了聚螺釘?shù)淖R別結(jié)果三種訓(xùn)練策略下,模型識別釘螺的敏感性(χ2=15.875,P<0.001)、特異性(χ釘螺視覺智能識別模型的構(gòu)建近年來,隨著計算機數(shù)據(jù)處理能力的增強,結(jié)合計算機視覺的機器學(xué)習技術(shù)逐漸被應(yīng)用于寄生蟲病防治研究領(lǐng)域,并且取得一定成果本研究探索了基于深度學(xué)習技術(shù)構(gòu)建釘螺視覺智能識別模型,并將其應(yīng)用于現(xiàn)場釘螺樣本圖像識別。訓(xùn)練集結(jié)果顯示,隨著訓(xùn)練輪數(shù)增加,在“遷移學(xué)習+數(shù)據(jù)增強”訓(xùn)練策略下,模型在訓(xùn)練100輪后釘螺識別準確率達到98.17%、損失值降到0.11,較好擬合了螺類數(shù)據(jù)集,泛化能力優(yōu)于其他兩種訓(xùn)練策略。測試集結(jié)果顯示,模型識別釘螺精確率、敏感性、特異性均超過90%,準確率、約登指數(shù)、F1值等綜合評價指標也在90%左右,AUC為0.94,表明基于深度學(xué)習技術(shù)的釘螺視覺智能識別模型對釘螺和非釘螺的綜合識別能力較好。受時間和空間限制,現(xiàn)場釘螺及4種相似螺圖像的大量采集工作有一定難度。由于深度學(xué)習結(jié)構(gòu)復(fù)雜、參數(shù)眾多,且模型訓(xùn)練需要大規(guī)模數(shù)據(jù),這對模型的訓(xùn)練和應(yīng)用帶來了困難。近年來,“遷移學(xué)習”已成為解決該問題的有效學(xué)習范式,其可一定程度緩解對大規(guī)模數(shù)據(jù)標注的依賴并大幅提高學(xué)習效果數(shù)據(jù)增強是克服由于訓(xùn)練過程中目標樣本數(shù)據(jù)不足,導(dǎo)致深度學(xué)習方法陷入過擬合問題的有效手段之一本研究尚存在一定局限性:(1)本研究釘螺樣本采集地區(qū)局限于江蘇省內(nèi),不能代表全國其他地區(qū)樣本圖像識別能力;(2)本研究建立了二分類釘螺識別模型,僅能分類識別“釘螺”或“非釘螺”,不能細分類識別出是哪一類釘螺亞種或哪一種非釘螺類的相似螺。今后將進一步擴大釘螺及相似螺樣本采集范圍、進一步優(yōu)化智能模型的細分類識別能力,從而提高模型的應(yīng)用范圍綜上,本研究首次建立了基于深度學(xué)習技術(shù)的日本血吸蟲中間宿主湖北釘螺視覺智能識別模型,通過對螺類數(shù)據(jù)集的多次訓(xùn)練和測試,實現(xiàn)了對釘螺圖像的準確識別。通過“數(shù)據(jù)增強+遷移學(xué)習”優(yōu)化的訓(xùn)練策略提高了模型識別釘螺的準確性,為釘螺調(diào)查新技術(shù)和新方法研究提供新思路,而構(gòu)建的螺類圖像分類數(shù)據(jù)集亦為后續(xù)研究其他寄生蟲宿主螺類識別提供了數(shù)據(jù)基礎(chǔ)。Softmax分類器是輸出層的基礎(chǔ),利用螺類特征圖中的特征預(yù)測圖片屬于某種螺類的概率。該分類器在多分類過程中使用,多個神經(jīng)細胞的輸出映射到(0,1)區(qū)間,形成一個概率。在全連接層輸入的特征矩陣接收到后,其輸出為輸入所對應(yīng)的每個類別上的概率。通過這一過程
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 職場溝通策略試題及答案
- 2025【電子組件外協(xié)加工合同書】電子組件外協(xié)加工
- 湖北省2025屆九師聯(lián)盟核心模擬卷(下)(樣卷)語文試題及答案
- 2025二手住宅購房合同
- 優(yōu)化體育師資隊伍建設(shè)方案
- 推動創(chuàng)新驅(qū)動的現(xiàn)代產(chǎn)業(yè)體系建設(shè)方案
- 鄭州市某中學(xué)體育看臺及維修項目競爭性磋商文件
- 考生必看古代文學(xué)史試題及答案
- 南充文化旅游職業(yè)學(xué)院《汽車構(gòu)造發(fā)動機》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年貴州省黔南州甕安縣達標名校校初三4月月考英語試題含答案
- 汽車制造與試驗技術(shù)專業(yè)(現(xiàn)代學(xué)徒制)2022級人才培養(yǎng)方案(高職)
- 課程培訓(xùn)合作協(xié)議(3篇)
- 鋁合金型材噴涂前處理技術(shù)優(yōu)化
- 有機化學(xué)課件(李景寧主編)第1章-緒論
- 公務(wù)員職務(wù)與及職級并行規(guī)定課件
- 智能電網(wǎng)電力負荷調(diào)控系統(tǒng)項目環(huán)境影響評估報告
- 處理突發(fā)事件流程圖
- 酒店住宿水單標準模板
- 污水排放檢查記錄表格模板
- 煤炭采礦煤礦PPT模板
- 第十二講 建設(shè)社會主義生態(tài)文明PPT習概論2023優(yōu)化版教學(xué)課件
評論
0/150
提交評論