下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 融合主成分分析與并行混合的卷積神經(jīng)網(wǎng)絡 馬文楷摘要:針對卷積神經(jīng)網(wǎng)絡在小樣本易產(chǎn)生過擬合,性能較差等問題,提出融合主成分分析(principal component analysis, pca)與并行混合的卷積神經(jīng)網(wǎng)絡(pca parallel mixing cnn, pca-pmcnn)模型。該模型首先利用主成分
2、分析非監(jiān)督預訓練初始化卷積神經(jīng)網(wǎng)絡,學習得到含有訓練數(shù)據(jù)統(tǒng)計特性的初始濾波器集合,以解決首層濾波器集無法充分訓練的問題;其次,引入局部對比度標準化概念及概率最大化采樣規(guī)則,以減小下采樣對特征的損失,增強特征描述的魯棒性;最后,采用線性修正函數(shù)(rectified linear units, relu)代替非線性激活函數(shù),以保證特征稀疏,提高訓練效率。實驗結果表明該模型對行人目標具有較好的識別率,對行人重疊、姿態(tài)變化、復雜背景等具有較好的魯棒性。關鍵詞:卷積神經(jīng)網(wǎng)絡;主成分分析;局部對比度標準化;概率最大化下采樣;并行混合tp391 :a :1009-3044(2018)25-0199-02co
3、nvolution neural network combining principal component analysis and parallel mixingma wen-kai(school of information engineering, jiangxi university of science and technology, ganzhou 341000, china)abstract: convolution neural network is prone to overfitting and poor performa本文來自于www.zz-news.comnce i
4、n small samples, we proposed a convolution neural network model combining principal component analysis and parallel mixing. the model first initializes the convolution neural network with the principal component analysis unsupervised pre training, and learns the initial filter set containing the sta
5、tistical characteristics of the training data to solve the problem that the first layer filter sets can not be fully trained; then, the concept of local contrast normalization and probability maximization sampling rule are introduced to reduce the loss of feature and enhance the robustness of featur
6、e description; finally, rectified linear units (relu) is used to replace the nonlinear activation function to ensure sparse features and improve training efficiency. the experimental results show that the model has better recognition rate for pedestrian targets, and is robust to pedestrian overlap,
7、attitude change and complex background.key words: convolution neural network; principal component analysis; local contrast standardization; probability maximization sampling; parallel mixing人工神經(jīng)網(wǎng)絡過多的參數(shù)設置,加劇了過擬合情況的發(fā)生;網(wǎng)絡深度設計過深,易造成梯度發(fā)散,使得網(wǎng)絡模型的解極易陷入局部最優(yōu)。與人工神經(jīng)網(wǎng)絡相比,深度cnn特征具有魯邦性強、抗旋轉以及對光照變化不敏感等優(yōu)點。lenet5通過共
8、享權值以及下采樣層,減少了網(wǎng)絡參數(shù),降低了特征維數(shù),但網(wǎng)絡深度較淺,分類效率與識別能力有待提高。alex-net增加了卷積神經(jīng)網(wǎng)絡模型的深度,并擴充了神經(jīng)網(wǎng)絡模型中卷積核數(shù)量;文獻1通過線性修正單元(rectified linear unit, relu)來加速梯度收斂速率文獻2采用全連接聚類以增強對圖像中的非一致性動態(tài)模糊的魯棒性。文獻3采用dropout層,增加樣本訓練的隨機性,防止過擬合。1 本文算法1.1 主成分分析非監(jiān)督預訓練卷積神經(jīng)網(wǎng)絡的輸入為n張大小為m×本文來自于www.zz-news.comn的圖像,卷積濾波器的大小為k1×k2。獲得圖像ii的圖像塊數(shù)據(jù)x
9、i,則主成分分析學習到初始化卷積神經(jīng)網(wǎng)絡的濾波器組w1l可表示為:w1l=mk1k2qlxxt (1)主成分分析非監(jiān)督訓練能夠提取輸入圖像局部塊的主成分信息,這些信息能夠最大限度地代表圖像的局部特征。1.2 并行混合cnn模型人類通過雙目視神經(jīng)來觀察客觀世界,雙目視神經(jīng)獲取的視覺信息通過膝狀體和信息混合以供大腦分析。將同幅圖像采用不同的編碼形式輸入到深度學習網(wǎng)絡中,神經(jīng)網(wǎng)絡通過學習能夠獲取到不同維度的特征信息,因此,本文提出了并行混合cnn模型,兩條cnn數(shù)據(jù)流分別使用不同的輸入數(shù)據(jù),以增強對圖像特征的描述力,如圖1所示。2 實驗環(huán)境與結果分析在caltech256公開數(shù)據(jù)集上進行測試實驗。訓
10、練caltech256數(shù)據(jù)集時,dropout ratio參數(shù)為0.5;初始學習率為0.005,采用多項式減小的方法控制學習率,其減小冪值為0.5;將batch size設置為20,;迭代次數(shù)設置為20萬次。表1列出了caltech256數(shù)據(jù)集上不同深度網(wǎng)絡模型的分類精度,可以看出,pmcnn的分類精度在top1上也有了提高。3 結論本文結合人類視覺原理,融合主成分分析與并行混合的神經(jīng)網(wǎng)絡結構,提出pca-pmcnn模型,在提高圖像分類精度的同時,保證網(wǎng)絡更具有魯棒性;進行局部對比度標準化,對數(shù)據(jù)中存在噪聲的目標圖像魯棒性更強,從而保證卷積神經(jīng)網(wǎng)絡對復雜背景有更強的魯棒性;引入概率最大化下采樣
11、的方法,既能提高圖像特征的抗干擾能力,又能減少圖像信息的損失,提高圖像信息的利用率能有效避免訓練陷入局部最優(yōu),使特征更加稀疏;在公開數(shù)據(jù)集上的實驗表明,本文模型在保證網(wǎng)絡深度的基礎上,設置多條特征數(shù)據(jù)流進行信息混合,提高特征的可判別能力。參考文獻:1 ren s, he k, girshick r, et al. faster r-cnn: towards real-time object detection with region proposal networksj. ieee transactions on pattern analysis & machine intelligence, 2015, 39(6):1137-1149.2 ballester p, araujo r m. on the performance of googlenet and alexnet applied to sketchesc/ thirtieth aaai conference on artificial intel
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年武漢車都建設投資有限公司招聘筆試參考題庫含答案解析
- 2025年度電子產(chǎn)品分期購買與售后服務合同
- 2025年度人事代理與員工薪酬福利調整服務協(xié)議3篇
- 2025年高新技術企業(yè)授權合同簽訂委托書規(guī)范3篇
- 2025版新能源汽車租賃與智能交通控制系統(tǒng)合作框架協(xié)議3篇
- 2025年全球及中國垂直旋轉模塊行業(yè)頭部企業(yè)市場占有率及排名調研報告
- 2025年全球及中國TGV玻璃芯基材行業(yè)頭部企業(yè)市場占有率及排名調研報告
- 2025版城市更新項目土地使用權作價出資合作協(xié)議3篇
- 二零二五年度成都市二手房交易合同范本 正版官方規(guī)范修訂3篇
- 二零二五年度車隊運輸保險合作協(xié)議3篇
- 商務部發(fā)布《中國再生資源回收行業(yè)發(fā)展報告(2024)》
- 廣東省佛山市2025屆高三高中教學質量檢測 (一)化學試題(含答案)
- 2025年福建新華發(fā)行(集團)限責任公司校園招聘高頻重點提升(共500題)附帶答案詳解
- 人教版【初中數(shù)學】知識點總結-全面+九年級上冊數(shù)學全冊教案
- 四川省成都市青羊區(qū)成都市石室聯(lián)合中學2023-2024學年七上期末數(shù)學試題(解析版)
- 咨詢公司績效工資分配實施方案
- 2024-2025學年人教版七年級英語上冊各單元重點句子
- 2025新人教版英語七年級下單詞表
- 公司結算資金管理制度
- 2024年小學語文教師基本功測試卷(有答案)
- 未成年入職免責協(xié)議書
評論
0/150
提交評論