




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、首先使用的貓狗分類圖像一共25000張,貓狗分別有12500張,我們先來簡單的瞅瞅都是一些什么圖片。我們從下載文件里可以看到有兩個文件夾:train和test,分別用于訓(xùn)練和測試。以train為例,打開文件夾可以看到非常多的小貓圖片,圖片名字從0.jpg一直編碼到9999.jpg,一共有10000張圖片用于訓(xùn)練。而test中的小貓只有2500張。仔細(xì)看小貓,可以發(fā)現(xiàn)它們姿態(tài)不一,有的站著,有的瞇著眼睛,有的甚至和其他可識別物體比如桶、人混在一起。同時,小貓們的圖片尺寸也不一致,有的是豎放的長方形,有的是橫放的長方形,但我們最終需要是合理尺寸的正方形。小狗的圖片也類似,在這里就不重復(fù)了。貓狗分類
2、之后設(shè)置卷積神經(jīng)網(wǎng)絡(luò)處理大小為 (28, 28, 1) 的輸入張量,我們向第一層傳入?yún)?shù) input_shape=(28, 28, 1) 來完成此設(shè)置??梢钥吹?,每個 Conv2D 層和 MaxPooling2D 層的輸出都是一個形狀為(height, width,channels) 的 3D 張量。寬度和高度兩個維度的尺寸通常會隨著網(wǎng)絡(luò)加深而變小。通道數(shù)量由傳入 Conv2D 層的第一個參數(shù)所控制(32 或64)。下一步是將最后的輸出張量大小為 (3, 3, 64) 輸入到一個密集連接分類器網(wǎng)絡(luò)中,即 Dense 層的堆疊,你已經(jīng)很熟悉了。這些分類器可以處理1D 向量,而當(dāng)前的輸出是 3D
3、張量。卷積神經(jīng)網(wǎng)絡(luò)具有以下兩個性質(zhì):卷積神經(jīng)網(wǎng)絡(luò)學(xué)到的模式具有平移不變性(translation invariant)。卷積神經(jīng)網(wǎng)絡(luò)在圖像,它可以在任何地方識別這個模式,對于密集連接網(wǎng)絡(luò)來說,如果模式出現(xiàn)在新的位置,它只能重新學(xué)習(xí)這個模式。這使得卷積神經(jīng)網(wǎng)絡(luò)在處理圖像時可以高效利用數(shù)據(jù)(因?yàn)橐曈X世界從根本上具有平移不變性),它只需要更少的訓(xùn)練樣本就可以學(xué)到具有泛化能力的數(shù)據(jù)表示。卷積神經(jīng)網(wǎng)絡(luò)可以學(xué)到模式的空間層次結(jié)構(gòu)(spatial hierarchies ofpatterns)第一個卷積層將學(xué)習(xí)較小的局部模式(比如邊緣),第二個卷積層將學(xué)習(xí)由第一層特征組成的更大的模式,以此類推。這使得卷積神
4、經(jīng)網(wǎng)絡(luò)可以有效地學(xué)習(xí)越來越復(fù)雜、越來越抽象的視覺概念(因?yàn)橐曈X世界從根本上具有空間層次結(jié)構(gòu))。對于包含兩個空間軸(高度和寬度)和一個深度軸(也叫通道軸)的 3D張量,其卷積也叫特征圖(feature map)。對于 RGB 圖像,深度軸的維度大小等于 3,因?yàn)閳D像有 3 個顏色通道:紅色、綠色和藍(lán)色。對于黑白圖像(比如 MNIST 數(shù)字圖像),深度等于 1(表示灰度等級)。卷積運(yùn)算從輸入特征圖中提取圖塊,并對所有這些圖塊應(yīng)用相同的變換,生成輸出特征圖(outputfeature map)。該輸出特征圖仍是一個 3D 張量,具有寬度和高度,其深度可以任意取值,因?yàn)檩敵錾疃仁菍拥膮?shù),深度軸的不同
5、通道不再像 RGB 輸入那樣代表特定顏色,而是代表過濾器(filter)。從這些圖像中都能看出過擬合的特征。訓(xùn)練精度隨著時間線性增加,直到接近 100%,而驗(yàn)證精度則停留在 70%72%。驗(yàn)證損失僅在 5 輪后就達(dá)到最小值,然后保持不變,而訓(xùn)練損失則一直線性下降,直到接近于 0。因?yàn)橛?xùn)練樣本相對較少(2000 個),所以過擬合是你最關(guān)心的問題。前面已經(jīng)介紹過幾種降低過擬合的技巧,比如 dropout 和權(quán)重衰減(L2 正則化)?,F(xiàn)在我們將使用一種針對于計算機(jī)視覺領(lǐng)域的新方法,在用深度學(xué)習(xí)模型處理圖像時幾乎都會用到這種方法,它就是數(shù)據(jù)增強(qiáng)(data )在編譯和訓(xùn)練模型之前,一定要“凍結(jié)”卷積基。凍結(jié)()一個 Dense 層是隨機(jī)初始化的, 項(xiàng)目要解決的問題是使用12500張貓和12500張狗的12500張未見過的圖像中 多。最后,在多次調(diào)試中,好多錯誤也改正了,也對貓狗分類有了新的認(rèn)識,貓狗分類只是起點(diǎn),其實(shí)并不復(fù)雜,以后的路還有很長,遇到錯誤要贏難而上,只而不能才會能。代碼部分: = = = = = = =# = # = # = # = # = # = # = # = # = # =i= = =i = = =i = = =i= = =i = = =i = = = = = = = = + #= = = = x=x=+i=0 =i1i%4 = = =
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 房屋租賃付定金合同
- 獨(dú)家代理合同(20篇)
- 酒店服務(wù)標(biāo)準(zhǔn)化建設(shè)合作協(xié)議
- 軟件開發(fā)委托服務(wù)合同
- 食品安全檢測認(rèn)證服務(wù)合同
- 藝術(shù)品交易鑒賞期免責(zé)合同協(xié)議
- 手房租賃買賣合同
- 工程施工中止合同書
- 環(huán)保工程承包施工合同
- 夫妻債務(wù)協(xié)議書有效
- 扶梯人行道檢驗(yàn)驗(yàn)收作業(yè)指導(dǎo)書
- GB/T 20308-2020產(chǎn)品幾何技術(shù)規(guī)范(GPS)矩陣模型
- 男孩女孩動起來健康運(yùn)動知識PPT模板
- 體育原理課件
- 鐵路道岔知識課件
- 自考公共關(guān)系學(xué)課件
- 森林害蟲防治方法課件
- 各種el34名膽電子管評測
- 超分子化學(xué)-杯芳烴課件
- 北郵工程數(shù)學(xué)期末試卷B卷
- 超長結(jié)構(gòu)及大體積混凝土專項(xiàng)施工方案
評論
0/150
提交評論