![基于深度學(xué)習(xí)VGG模型的寵物分類方法設(shè)計_第1頁](http://file4.renrendoc.com/view12/M08/34/3D/wKhkGWdWPgaAY7DLAAHB08aFYAU454.jpg)
![基于深度學(xué)習(xí)VGG模型的寵物分類方法設(shè)計_第2頁](http://file4.renrendoc.com/view12/M08/34/3D/wKhkGWdWPgaAY7DLAAHB08aFYAU4542.jpg)
![基于深度學(xué)習(xí)VGG模型的寵物分類方法設(shè)計_第3頁](http://file4.renrendoc.com/view12/M08/34/3D/wKhkGWdWPgaAY7DLAAHB08aFYAU4543.jpg)
![基于深度學(xué)習(xí)VGG模型的寵物分類方法設(shè)計_第4頁](http://file4.renrendoc.com/view12/M08/34/3D/wKhkGWdWPgaAY7DLAAHB08aFYAU4544.jpg)
![基于深度學(xué)習(xí)VGG模型的寵物分類方法設(shè)計_第5頁](http://file4.renrendoc.com/view12/M08/34/3D/wKhkGWdWPgaAY7DLAAHB08aFYAU4545.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
目錄
1引言............................................................................................................................1
1.1項目背景......................................................................................................1
1.2Python發(fā)展簡介.............................................................................................1
1.2.1VGG技術(shù)簡介........................................................................................2
1.2.2Pycharm簡介........................................................................................2
1.2.3Python第三方庫簡介..........................................................................3
2需求分析....................................................................................................................3
2.1可行性分析..................................................................................................3
2.2數(shù)據(jù)采集功能分析......................................................................................4
2.3關(guān)鍵技術(shù)分析..............................................................................................5
2.3.1VGG網(wǎng)絡(luò)結(jié)構(gòu)簡介..................................................................................5
2.3.2torch技術(shù)分析......................................................................................5
2.3.3torchvision技術(shù)分析...............................................................................5
2.1.4VGG算法原理...........................................................................................6
3數(shù)據(jù)集準(zhǔn)備................................................................................................................6
3.1數(shù)據(jù)采集......................................................................................................6
3.2數(shù)據(jù)集獲取分析..........................................................................................7
3.3數(shù)據(jù)集獲取實現(xiàn)..........................................................................................8
4數(shù)據(jù)可視化與數(shù)據(jù)集預(yù)處理....................................................................................9
4.1數(shù)據(jù)預(yù)處理..................................................................................................9
4.2導(dǎo)入相關(guān)庫..................................................................................................9
4.3讀取訓(xùn)練集,驗證集與測試集................................................................10
4.4數(shù)據(jù)集可視化................................................................................................12
5模型構(gòu)建及評估分析..............................................................................................12
5.1模網(wǎng)絡(luò)型結(jié)構(gòu)................................................................................................12
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
5.1.1創(chuàng)建模型.............................................................................................13
5.2模型編譯....................................................................................................14
5.2.1優(yōu)化器設(shè)置.........................................................................................14
5.2.2損失函數(shù)設(shè)置.....................................................................................14
5.2.3模型訓(xùn)練設(shè)置.....................................................................................15
5.2.4學(xué)習(xí)率調(diào)優(yōu).........................................................................................15
5.2.5batch_size設(shè)置................................................................................16
5.3模型部署....................................................................................................16
5.3.1系統(tǒng)前端部署.....................................................................................16
5.3.2系統(tǒng)前端.............................................................................................17
6小結(jié)..........................................................................................................................18
參考資料.........................................................................................................................19
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
基于深度學(xué)習(xí)VGG模型的寵物分類方法設(shè)計
1引言
在現(xiàn)代社會中,養(yǎng)寵物已成為一種越來越普遍的生活方式。隨著人們養(yǎng)寵
物的數(shù)量和種類的不斷增多,對寵物的分類和識別的需求也日益增加。傳統(tǒng)的
寵物分辨方法主要基于視覺特征和手工特征來進行分類,但其中存在很多不足
之處,如分類準(zhǔn)確度較低、計算量大、特征提取不全面等。因此,本文基于深
度學(xué)習(xí)中的VGG16模型進行,提出了一種新的寵物分類方法。通過這種方法,
可以更加準(zhǔn)確地判斷出寵物的種類,同時,將寵物照片分為多個類別,能夠更
好地滿足人們對不同寵物種類的識別需求。通過對該方法的實驗結(jié)果分析,證
明了其效果的有效性和優(yōu)越性,對解決寵物分類問題具有一定的參考價值。
1.1項目背景
隨著人們生活水平的提高,越來越多的人選擇養(yǎng)寵物??梢哉f,現(xiàn)代社會
中已經(jīng)有很多人將養(yǎng)寵物當(dāng)做一種生活方式,而一些寵物愛好者更是對自己養(yǎng)
的寵物感到無限的喜愛和珍惜。然而,對于寵物的分類和識別來說,傳統(tǒng)的方
法主要基于視覺特征和手工特征對寵物進行分類,但這些方法存在很多不足之
處。例如,在分類準(zhǔn)確度方面,手動提取特征的過程中很難捕捉到寵物照片中
的一些細(xì)節(jié)信息和差異性,因此會導(dǎo)致分類準(zhǔn)確度相對較低。此外,在計算量、
特征提取維度等方面也存在一定的問題。
為了解決這些問題,深度學(xué)習(xí)技術(shù)應(yīng)運而生。深度學(xué)習(xí)技術(shù)在圖像識別、分類
等方面顯示出驚人的優(yōu)勢,吸引了越來越多人的關(guān)注。其中,VGG16模型作為經(jīng)
典的卷積神經(jīng)網(wǎng)絡(luò)模型,擁有深層的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可以有效地提取圖像
特征,因此被廣泛應(yīng)用于圖像分類和識別領(lǐng)域。同時,基于深度學(xué)習(xí)的寵物分
類方法也在其中逐漸受到關(guān)注。本項目的背景就是基于以上的需求和現(xiàn)狀,探
索基于深度學(xué)習(xí)VGG模型的寵物分類方法,使得在寵物分類與識別方面,能夠
得到更加準(zhǔn)確、快速、高效的識別結(jié)果,為人們的寵物生活帶來更多實際價值。
開發(fā)環(huán)境與工具
1.2Python發(fā)展簡介
Python是一門功能強大、易于學(xué)習(xí)和高效的編程語言。該語言的歷史可以
追溯到1991年,當(dāng)時由GuidovanRossum創(chuàng)造,旨在提供一個易于理解和
1
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
使用的編程語言,適用于腳本開發(fā)。隨著時間的推移,Python2.x版本和
Python3.x版本陸續(xù)推出,Python2.x版本持續(xù)了很長時間,直到2010年
左右才逐漸向Python3.x轉(zhuǎn)變。Python3.x版本采用了一些新特性和不向
后兼容的變化,修復(fù)了Python2.x語言本身的一些問題。在過去幾年中,Python
的應(yīng)用領(lǐng)域不斷擴大,包括數(shù)據(jù)分析、科學(xué)計算、web開發(fā)、機器學(xué)習(xí)和自動化
測試等。除了其易于學(xué)習(xí)和高效的特點之外,Python還擁有極其豐富的第三方
庫和工具,使得Python編程變得更加容易和快速。Python的發(fā)展還可以追溯到
它的開源社區(qū)。它非常開放和友好,有數(shù)百萬的活躍開發(fā)者一起為持續(xù)開發(fā)和
維護Python語言生態(tài)系統(tǒng)。Python正在成為最流行的編程語言之一,并在未來
繼續(xù)發(fā)展和壯大。。
1.2.1VGG技術(shù)簡介
VGG全稱是VisualGeometryGroup,因為是由Oxford的VisualGeometry
Group提出的。AlexNet問世之后,很多學(xué)者通過改進AlexNet的網(wǎng)絡(luò)結(jié)構(gòu)來提
高自己的準(zhǔn)確率,主要有兩個方向:小卷積核和多尺度。而VGG的作者們則選
擇了另外一個方向,即加深網(wǎng)絡(luò)深度。
二、網(wǎng)絡(luò)架構(gòu)
卷積網(wǎng)絡(luò)的輸入是224*224的RGB圖像,整個網(wǎng)絡(luò)的組成是非常格式化的,
基本上都用的是3*3的卷積核以及2*2的maxpooling,少部分網(wǎng)絡(luò)加入了1
*1的卷積核。因為想要體現(xiàn)出“上下左右中”的概念,3*3的卷積核已經(jīng)是最
小的尺寸了。
1.2.2Pycharm簡介
PyCharm是一種由JetBrains開發(fā)的Python開發(fā)環(huán)境,旨在改善開發(fā)者的
工作流程。它提供了一套完整的工具,可以幫助您更快地編寫代碼,更快地找
到和修復(fù)錯誤,更快地測試代碼以及更快地部署應(yīng)用程序。PyCharm的主要特點
包括:智能代碼補全,語法高亮,調(diào)試,代碼重構(gòu),單元測試,版本控制,可
視化接口,自動部署以及更多。它不僅可以幫助您更容易地編碼,還可以幫助
您更好地管理和維護您的代碼。它支持多種Python解釋器,可以與多種數(shù)據(jù)庫
和Web服務(wù)器進行集成。PyCharm是一款功能強大的Python集成開發(fā)環(huán)境,可
以幫助您更有效地完成開發(fā)任務(wù)。
2
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
1.2.3Python第三方庫簡介
Python擁有豐富的第三方庫,這些庫提供了豐富的功能和工具,使Python
編程變得更加簡單和高效。下面是一些最受歡迎和常用的Python第三方庫:
NumPy:NumPy被廣泛用于科學(xué)計算、數(shù)據(jù)分析和機器學(xué)習(xí)等領(lǐng)域,它為
Python提供了一種高性能的多維數(shù)組對象,以及處理這些數(shù)組的各種函數(shù)。
NumPy旨在提供與MATLAB相似的使用體驗。
Pandas:Pandas是用于數(shù)據(jù)分析的Python庫。Pandas支持處理包括時間
序列和結(jié)構(gòu)化數(shù)據(jù)在內(nèi)的各種形式的數(shù)據(jù)。它是一個強大的、高效的數(shù)據(jù)操作
庫,經(jīng)常被用于數(shù)據(jù)科學(xué)領(lǐng)域。
SciPy:SciPy是用于科學(xué)計算的Python庫。它提供了許多有用的科學(xué)計算
工具,如最小二乘回歸、傅里葉變換和信號處理等。SciPy還包含了許多其他的
子函數(shù)和子模塊,涵蓋了線性代數(shù)、數(shù)值積分、優(yōu)化等眾多方面。
Matplotlib:Matplotlib是一個用于數(shù)據(jù)可視化的Python庫。它可以用來創(chuàng)建
各種圖表和可視化效果,比如折線圖、柱狀圖、散點圖等。Matplotlib非常適
合在數(shù)據(jù)科學(xué)和機器學(xué)習(xí)領(lǐng)域中使用。
TensorFlow:TensorFlow是一個基于數(shù)據(jù)流編程的開源機器學(xué)習(xí)框架,由
Google開發(fā)和維護。TensorFlow提供了非常方便的接口,用于處理大型神經(jīng)網(wǎng)
絡(luò)和訓(xùn)練數(shù)據(jù)。
Keras:Keras是一個專注于構(gòu)建和訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的高層Python庫。
Keras易于使用,而且兼容多種深度學(xué)習(xí)框架,包括TensorFlow和Theano。
Requests:Requests是一個Python庫,用于簡化HTTP請求。Requests是
一種流行的Python庫,用于處理網(wǎng)路請求和響應(yīng),包括GET、POST請求等等。
這些Python第三方庫代表了Python編程中最流行和實用的工具。它們可以幫
助Python程序員更加有效地實現(xiàn)各種任務(wù)和項目。
2需求分析
2.1可行性分析
1.技術(shù)可行性
深度學(xué)習(xí)技術(shù)的發(fā)展:近年來,深度學(xué)習(xí)技術(shù)得到了快速的發(fā)展和應(yīng)用,
尤其是在計算機視覺領(lǐng)域,如圖像分類、物體檢測和語義分割等方面的應(yīng)用。
3
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
基于深度學(xué)習(xí)技術(shù)的VGG模型已在圖像分類領(lǐng)域得到了廣泛的應(yīng)用,并且已經(jīng)
證明其在識別不同品種寵物方面具有較高準(zhǔn)確率和泛化能力。
數(shù)據(jù)集的可獲取性:隨著數(shù)字化時代的到來,收集和整理大型數(shù)據(jù)集變得
更加容易,特別是在寵物圖片方面。現(xiàn)在,一些公共數(shù)據(jù)集,如ImageNet和
COCO,已經(jīng)廣泛被用于圖像分類應(yīng)用中。此外,使用網(wǎng)絡(luò)爬蟲收集寵物圖片數(shù)
據(jù)集也已經(jīng)成為了一種常用的手段。
現(xiàn)有技術(shù)的成熟度:基于深度學(xué)習(xí)的圖像分類技術(shù)已經(jīng)得到了較好的發(fā)展
和應(yīng)用,并且許多成熟的工具和框架,如TensorFlow、PyTorch、Keras等,都
提供了易用性較高的接口和開源代碼,使其更易于快速開發(fā)和部署。
綜上所述,基于深度學(xué)習(xí)VGG模型的寵物分類方法設(shè)計具有較高的技術(shù)可行性,
對于實際應(yīng)用提供了很好的幫助。
2.項目可行性
寵物行業(yè)的需求和市場空間:隨著人們對寵物的熱愛和需求增加,寵物行
業(yè)正在快速發(fā)展,具有廣闊的應(yīng)用市場空間。而自動分類技術(shù)的應(yīng)用,則將極
大地提高工作效率和服務(wù)質(zhì)量,為企業(yè)帶來更多的商業(yè)機會。
寵物圖像數(shù)據(jù)的公開易得:目前有很多公開的寵物圖像數(shù)據(jù)庫,如ImageNet、
COCO等,這些數(shù)據(jù)庫中包含了各種不同種類的寵物圖像數(shù)據(jù),對于該項目的數(shù)
據(jù)采集提供了便利條件。
現(xiàn)有技術(shù)的證明和應(yīng)用案例:基于深度學(xué)習(xí)VGG模型的寵物分類方法已經(jīng)
在很多實際場景中得到了應(yīng)用,并取得了不錯的分類效果。例如,某些寵物社
交軟件、寵物商城等平臺,均采用了自動分類技術(shù),提高用戶體驗和服務(wù)質(zhì)量。
如前所述,深度學(xué)習(xí)技術(shù)在圖像分類領(lǐng)域已經(jīng)得到了廣泛的應(yīng)用,尤其是
基于VGG模型的圖像分類方法。因此,該項目的可行性也比較高。
2.2數(shù)據(jù)采集功能分析
此次項目的數(shù)據(jù)集來源于kaggle,對采集到的寵物圖片進行初步篩選和清
洗,去除不合格的圖片。對采集到的寵物圖片進行標(biāo)注并保存相關(guān)信息,將所
有采集到的圖片隨機分成訓(xùn)練集、驗證集和測試集三部分,訓(xùn)練集用于模型的
訓(xùn)練,驗證集用于調(diào)整模型參數(shù),測試集用于評估最終模型的精確度。
在實際操作中,需要考慮到數(shù)據(jù)采集過程可能出現(xiàn)的各種問題,如圖片質(zhì)
量不佳、數(shù)據(jù)不均衡等,以確保模型最終可以準(zhǔn)確地對寵物進行分類識別。
4
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
2.3關(guān)鍵技術(shù)分析
2.3.1VGG模型
VGG模型是一種深度卷積神經(jīng)網(wǎng)絡(luò),由KarenSimonyan和Andrew
Zisserman在2014年提出。VGG模型的核心思想就是使用非常小的卷積核
(3*3),并且始終使用相同數(shù)量的過濾器(filter)和池化層,從而實現(xiàn)網(wǎng)絡(luò)
結(jié)構(gòu)的簡單化。VGG模型在ImageNet挑戰(zhàn)賽上取得了很好的成績,證明了其在
圖像識別領(lǐng)域具有強大的能力。
VGG模型包含多個卷積層和全連接層,其中卷積層采用3×3大小的卷積核,
并進行多次堆疊。通過不斷地堆疊卷積層,可以獲取越來越多的復(fù)雜特征,并
獲得更高的準(zhǔn)確率。VGG模型中最常見的版本是VGG-16和VGG-19,其中VGG-16
包含16個卷積層和3個全連接層,VGG-19包含19個卷積層和3個全連接層。
VGG模型的一個優(yōu)點是可以通過遷移學(xué)習(xí)來加快訓(xùn)練速度。由于該模型已經(jīng)
在大規(guī)模圖像數(shù)據(jù)集上進行了訓(xùn)練,因此可以將其用于其他圖像識別任務(wù)中,
只需要微調(diào)一些參數(shù)即可獲得比較好的識別結(jié)果。
2.3.2torch技術(shù)分析
torch主要以張量為基本數(shù)據(jù)結(jié)構(gòu),支持多種數(shù)值類型的張量,包括浮點數(shù)
型、整數(shù)型、布爾型等。其提供了一系列基本操作,如加、減、乘、除、矩陣
乘法等,可以方便地實現(xiàn)向量、矩陣和張量之間的運算。此外,torch還提供了
眾多高級運算,如卷積、池化、循環(huán)神經(jīng)網(wǎng)絡(luò)等,使得開發(fā)者可以便捷地構(gòu)建
復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型。
總之,torch是一個功能豐富、易于使用、高效并且可擴展的機器學(xué)習(xí)框架,
適用于各種深度學(xué)習(xí)任務(wù)以及科學(xué)計算和數(shù)據(jù)分析領(lǐng)域。
2.3.3torchvision技術(shù)分析
torchvision提供了常用的圖像數(shù)據(jù)集加載的接口,如MNIST、CIFAR、
ImageNet等。同時,它還提供了一些常用的圖像處理工具,比如對圖像進行裁
剪、縮放、旋轉(zhuǎn)、反轉(zhuǎn)等變換操作,使圖像能夠更好地適應(yīng)不同場景下的使用
需求。
torchvision在可視化方面也提供了豐富的工具和接口,能夠方便地進行圖
像和模型的可視化,幫助用戶更好地理解和優(yōu)化計算機視覺任務(wù)的結(jié)果。
總之,torchvision是一個非常實用且便捷的計算機視覺處理工具,它涵蓋
5
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
了數(shù)據(jù)處理、數(shù)據(jù)增強、預(yù)訓(xùn)模型、模型設(shè)計和可視化等多個方向,為深度學(xué)
習(xí)計算機視覺任務(wù)提供了重要的支持。
2.1.4VGG算法原理
VGG16一般采用基于隨機梯度下降(StochasticGradientDescent,SGD)
的反向傳播算法,通過最小化交叉熵?fù)p失函數(shù)來優(yōu)化模型參數(shù)。在訓(xùn)練過程中,
可以使用數(shù)據(jù)增強、正則化、dropout等技術(shù)來提高模型的泛化能力和魯棒性。
在本文中,大多數(shù)未知數(shù)的梯度求解都是很容易的。也就是我們只要循環(huán)
求解下式即可。
VGG公式(圖2-1):
圖2-1算法公式
3數(shù)據(jù)集準(zhǔn)備
3.1數(shù)據(jù)采集
首先進入MicrosoftEdge瀏覽器,找到搜索引擎并且搜索百度照片,進
入官網(wǎng)輸入關(guān)鍵字:寵物圖片.
頁面如下:
6
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖3-1數(shù)據(jù)網(wǎng)址頁面
按F12調(diào)出開發(fā)者工具,刷新頁面,如圖3-2。利用全局搜索工具定位所需
數(shù)據(jù)位置,點擊開發(fā)者工具按Ctrl+f查找jpg圖片。
圖3-2數(shù)據(jù)鏈接頁面
3.2數(shù)據(jù)集獲取分析
右鍵以后選擇檢查,調(diào)出網(wǎng)頁后臺,利用全局搜索工具中搜索關(guān)鍵詞,如
“貓”、“狗”,“兔子”等jpg或者png圖片位置鏈接。接下來我們分析他
是以什么形式的數(shù)據(jù)存放的。顯然這是一個jpg或者png數(shù)據(jù)。
于是我們就可以利用python爬蟲來獲取寵物的數(shù)據(jù)。
7
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖3-3獲取數(shù)據(jù)頁面
3.3數(shù)據(jù)集獲取實現(xiàn)
創(chuàng)建html.py進行爬取,代碼如圖:
圖3-4代碼展示圖
下圖為讀取相關(guān)數(shù)據(jù)集圖片
圖3-5文件夾展示圖
8
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖3-6數(shù)據(jù)集展示圖
可以看到,我們獲取了25,000張寵物的圖像。此文件夾中的每個圖像都
有標(biāo)簽作為文件名的一部分。測試文件夾包含12,500張圖像,根據(jù)數(shù)字ID命
名。對于測試集中的每個圖像,預(yù)測其是什么寵物
4數(shù)據(jù)可視化與數(shù)據(jù)集預(yù)處理
4.1數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理是指將數(shù)據(jù)轉(zhuǎn)換成易于理解和解釋的圖形形式,以便更好地理
解數(shù)據(jù)中的特征和模式。在寵物分類問題中,可以通過繪制每個類別的圖片樣
本來了解不同類別之間的差異。此外,還可以通過繪制圖像的像素分布和直方
圖來檢查數(shù)據(jù)是否存在偏斜或異常值,這對模型的表現(xiàn)會有影響。
數(shù)據(jù)集預(yù)處理非常重要,因為它可以減少原始數(shù)據(jù)中的噪聲和冗余信息。
同時,這些預(yù)處理步驟還能使我們更好地理解數(shù)據(jù),并減少由于噪聲和冗
余信息導(dǎo)致的過擬合現(xiàn)象。
4.2導(dǎo)入相關(guān)庫
導(dǎo)入torch等系列相關(guān)庫對數(shù)據(jù)進行處理操作,如下圖所示
9
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖4-1導(dǎo)入相關(guān)庫
4.3讀取訓(xùn)練集,驗證集與測試集
1.數(shù)據(jù)集預(yù)處理
讀取寵物圖像數(shù)據(jù)集,并把每張圖片轉(zhuǎn)換為相同的大?。ㄈ?24*224)和格
式(如RGB),同時進行歸一化處理。
圖4-2圖片大小處理代碼
10
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖4-3圖片大小處理效果圖
2.驗證集
讀取驗證集
圖4-4驗證集代碼圖
3.測試集
讀取驗證集
圖4-5測試集代碼圖
4.劃分展示:
11
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖4-6劃分代碼圖
4.4數(shù)據(jù)集可視化
使用Python中的Matplotlib庫。該庫可以用來繪制各種類型的圖表,例
如條形圖、餅圖、折線圖和散點圖等。
將分類模型訓(xùn)練得到的分類結(jié)果導(dǎo)出為一個CSV文件,然后使用Python讀
取該文件并將其轉(zhuǎn)換為一個pandasdataframe對象。接著,利用pandas的
groupby函數(shù)對寵物類別進行分組,統(tǒng)計不同類別的寵物數(shù)量,并將結(jié)果繪制成
一個條形圖。
可視化效果
圖4-7可視化內(nèi)容
5模型構(gòu)建及評估分析
5.1網(wǎng)絡(luò)模型結(jié)構(gòu)
VGG網(wǎng)絡(luò)架構(gòu):
小卷積核:相比AlexNet,將卷積核全部替換為3×33\times33×3,極
12
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
少用了1×11\times11×1;
小池化層:相比AlexNe,3×33\times33×3的池化核全部換為2×2
2\times22×2的池化核;
層數(shù)更深:VGG16為例,3→64→126→256→5123\to64\to
126\to256\to5123→64→126→256→512,卷積核專注于擴大通道數(shù),3個通
道的特征經(jīng)過經(jīng)過卷積層的提取擴散到了512個通道;
特征圖更窄:VGG16為例,224→112→56→28→14→7224\to
112\to56\to28\to14\to7224→112→56→28→14→7,池化層專注于縮小寬和
高;
全連接轉(zhuǎn)1×11\times11×1卷積:測試階段可以接收任意寬或高為的
輸入。如下(圖5.1-1)
圖5-1網(wǎng)絡(luò)模型結(jié)構(gòu)圖
5.1.1創(chuàng)建模型
模型部分,我們使用pytorch封裝好的vgg模型,并且對其進行微調(diào),因
為原始的vgg16模型是預(yù)測1000個類別,而我們的任務(wù)只有貓和狗,兔子等幾
個類別,所以將最后一層的輸出調(diào)整為4。在訓(xùn)練的時候使用前面預(yù)訓(xùn)練模型,
這樣子加快模型的收斂,而且效果奇佳。
模型代碼
13
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖5-2結(jié)構(gòu)模型
5.2模型編譯
5.2.1優(yōu)化器設(shè)置
優(yōu)化器使用了SGD,學(xué)習(xí)率初始值為0.001,動量為0.9。同時,scheduler
設(shè)置為每7個epochs學(xué)習(xí)率下降0.1倍,以便模型更好地學(xué)習(xí)特征。
圖5-3優(yōu)化器設(shè)置
5.2.2損失函數(shù)設(shè)置
交叉熵?fù)p失函數(shù)是深度學(xué)習(xí)中非常常用的損失函數(shù)之一,它能夠有效地
衡量模型輸出的預(yù)測值與真實值之間的差異。在VGG模型中,輸出層通常使
14
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
用softmax作為激活函數(shù),將輸出結(jié)果轉(zhuǎn)化為分類概率。假設(shè)有C個類別,
輸出層的輸出為一個C維向量,其中每一維表示為一個類別的預(yù)測概率。真
實的標(biāo)簽y是一個C維的向量,其中只有一個元素為1,表示其屬于一個類
別,其他元素均為0。
圖5-4損失函數(shù)設(shè)置
5.2.3模型訓(xùn)練設(shè)置
使用PyTorch提供的訓(xùn)練循環(huán),設(shè)定合理的超參數(shù)如學(xué)習(xí)率、訓(xùn)練輪數(shù)、
批大小等,按照每個批次訓(xùn)練模型,優(yōu)化模型的損失函數(shù),使用驗證集進行模
型評估,保存該次訓(xùn)練的最優(yōu)模型。
圖5-5模型訓(xùn)練設(shè)置
5.2.4學(xué)習(xí)率調(diào)優(yōu)
將學(xué)習(xí)率設(shè)置為0.001。
15
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖5-6學(xué)習(xí)率
5.2.5batch_size設(shè)置
將batch_size設(shè)置為256,以及一些參數(shù)的設(shè)置。
圖5-7batch_size設(shè)置
5.3模型部署
5.3.1系統(tǒng)前端部署
首先,確定系統(tǒng)所包含的功能模塊。上傳寵物照片、展示分類結(jié)果、查看
歷史記錄、分享等功能。設(shè)計系統(tǒng)主題和配色方案,以保證整個系統(tǒng)的視覺效
果協(xié)調(diào)統(tǒng)一。采用響應(yīng)式布局,根據(jù)不同的設(shè)備自適應(yīng)調(diào)整頁面布局,以保證
用戶在不同設(shè)備上的訪問體驗一致。對于上傳寵物照片的功能模塊,可以采用
上傳組件實現(xiàn)。對于分類結(jié)果展示的模塊,可以采用數(shù)據(jù)可視化技術(shù),以文字
的方式將結(jié)果直觀地展現(xiàn)出來。在系統(tǒng)前端設(shè)計完成后,充分測試和優(yōu)化,確
保系統(tǒng)性能穩(wěn)定和用戶體驗流暢。
圖5-8前端設(shè)計代碼展示
16
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
5.3.2系統(tǒng)前端
本系統(tǒng)基于深度學(xué)習(xí)VGG模型,旨在通過圖像識別技術(shù)為用戶提供寵物分
類服務(wù)。用戶只需上傳一張寵物照片,系統(tǒng)便能夠自動判斷出該寵物的品種。
采用resnet50損失值和準(zhǔn)確率,準(zhǔn)確率在85%以上。
以下是系統(tǒng)前端設(shè)計的效果圖:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 木工裝修合同
- 保健按摩店裝修合同監(jiān)管費
- 水利行業(yè)水資源管理與水生態(tài)修復(fù)方案
- 專利代理合同書年
- 三農(nóng)村社會組織創(chuàng)新發(fā)展方案
- 留學(xué)服務(wù)合同
- 品牌營銷策略及市場分析作業(yè)指導(dǎo)書
- 數(shù)字化工廠設(shè)計與實施作業(yè)指導(dǎo)書
- 旅游景點智能化管理系統(tǒng)的設(shè)計與實施計劃書
- 三農(nóng)地區(qū)基礎(chǔ)設(shè)施建設(shè)規(guī)劃方案
- 島津氣相色譜培訓(xùn)
- 2024年03月四川農(nóng)村商業(yè)聯(lián)合銀行信息科技部2024年校園招考300名工作人員筆試歷年參考題庫附帶答案詳解
- 睡眠專業(yè)知識培訓(xùn)課件
- 臨床思維能力培養(yǎng)
- 人教版高中物理必修第三冊第十章靜電場中的能量10-1電勢能和電勢練習(xí)含答案
- 《工程勘察設(shè)計收費標(biāo)準(zhǔn)》(2002年修訂本)
- 中國宗教文化 中國古代宗教文化的特點及現(xiàn)代意義
- 2024年四川省巴中市級事業(yè)單位選聘15人歷年高頻難、易錯點練習(xí)500題附帶答案詳解
- 演出經(jīng)紀(jì)人培訓(xùn)
- 蓋房四鄰簽字協(xié)議書范文
- 2024年新人教版七年級上冊數(shù)學(xué)教學(xué)課件 第六章 幾何圖形初步 數(shù)學(xué)活動
評論
0/150
提交評論