版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、文檔可能無法思考全面,請瀏覽后下載! 淺析人工智能中的圖像識別技術(shù)本文從網(wǎng)絡(luò)收集而來,上傳到平臺為了幫到更多的人,如果您需要使用本文檔,請點擊下載按鈕下載本文檔(有償下載),另外祝您生活愉快,工作順利,萬事如意!10 / 10圖像識別技術(shù)是信息時代的一門重要的技術(shù),其產(chǎn)生目的是為了讓計算機代替人類去處理大量的物理信息。隨著計算機技術(shù)的發(fā)展,人類對圖像識別技術(shù)的認識越來越深刻。圖像識別技術(shù)的過程分為信息的獲取、預處理、特征抽取和選擇、分類器設(shè)計和分類決策。文章簡單分析了圖像識別技術(shù)的引入、其技術(shù)原理以及模式識別等,之后介紹了神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)和非線性降維的圖像識別技術(shù)及圖像識別技術(shù)的應用。從
2、中可以總結(jié)出圖像處理技術(shù)的應用廣泛,人類的生活將無法離開圖像識別技術(shù),研究圖像識別技術(shù)具有重大意義。1 圖像識別技術(shù)的引入圖像識別是人工智能科技的一個重要領(lǐng)域。圖像識別的發(fā)展經(jīng)歷了三個階段:文字識別、數(shù)字圖像處理與識別、物體識別。圖像識別,顧名思義,就是對圖像做出各種處理、分析,最終識別我們所要研究的目標。今天所指的圖像識別并不僅僅是用人類的肉眼,而是借助計算機技術(shù)進行識別。雖然人類的識別能力很強大,但是對于高速發(fā)展的社會,人類自身識別能力已經(jīng)滿足不了我們的需求,于是就產(chǎn)生了基于計算機的圖像識別技術(shù)。這就像人類研究生物細胞,完全靠肉眼觀察細胞是不現(xiàn)實的,這樣自然就產(chǎn)生了顯微鏡等用于精確觀測的儀
3、器。通常一個領(lǐng)域有固有技術(shù)無法解決的需求時,就會產(chǎn)生相應的新技術(shù)。圖像識別技術(shù)也是如此,此技術(shù)的產(chǎn)生就是為了讓計算機代替人類去處理大量的物理信息,解決人類無法識別或者識別率特別低的信息。 圖像識別技術(shù)原理其實,圖像識別技術(shù)背后的原理并不是很難,只是其要處理的信息比較繁瑣。計算機的任何處理技術(shù)都不是憑空產(chǎn)生的,它都是學者們從生活實踐中得到啟發(fā)而利用程序?qū)⑵淠M實現(xiàn)的。計算機的圖像識別技術(shù)和人類的圖像識別在原理上并沒有本質(zhì)的區(qū)別,只是機器缺少人類在感覺與視覺差上的影響罷了。人類的圖像識別也不單單是憑借整個圖像存儲在腦海中的記憶來識別的,我們識別圖像都是依靠圖像所具有的本身特征而先將這些圖像分了類,
4、然后通過各個類別所具有的特征將圖像識別出來的,只是很多時候我們沒有意識到這一點。當看到一張圖片時,我們的大腦會迅速感應到是否見過此圖片或與其相似的圖片。其實在“看到”與“感應到”的中間經(jīng)歷了一個迅速識別過程,這個識別的過程和搜索有些類似。在這個過程中,我們的大腦會根據(jù)存儲記憶中已經(jīng)分好的類別進行識別,查看是否有與該圖像具有相同或類似特征的存儲記憶,從而識別出是否見過該圖像。機器的圖像識別技術(shù)也是如此,通過分類并提取重要特征而排除多余的信息來識別圖像。機器所提取出的這些特征有時會非常明顯,有時又是很普通,這在很大的程度上影響了機器識別的速率??傊?,在計算機的視覺識別中,圖像的內(nèi)容通常是用圖像特征
5、進行描述。 模式識別模式識別是人工智能和信息科學的重要組成部分。模式識別是指對表示事物或現(xiàn)象的不同形式的信息做分析和處理從而得到一個對事物或現(xiàn)象做出描述、辨認和分類等的過程。計算機的圖像識別技術(shù)就是模擬人類的圖像識別過程。在圖像識別的過程中進行模式識別是必不可少的。模式識別原本是人類的一項基本智能。但隨著計算機的發(fā)展和人工智能的興起,人類本身的模式識別已經(jīng)滿足不了生活的需要,于是人類就希望用計算機來代替或擴展人類的部分腦力勞動。這樣計算機的模式識別就產(chǎn)生了。簡單地說,模式識別就是對數(shù)據(jù)進行分類,它是一門與數(shù)學緊密結(jié)合的科學,其中所用的思想大部分是概率與統(tǒng)計。模式識別主要分為三種:統(tǒng)計模式識別、
6、句法模式識別、模糊模式識別。2 圖像識別技術(shù)的過程既然計算機的圖像識別技術(shù)與人類的圖像識別原理相同,那它們的過程也是大同小異的。圖像識別技術(shù)的過程分以下幾步:信息的獲取、預處理、特征抽取和選擇、分類器設(shè)計和分類決策。信息的獲取是指通過傳感器,將光或聲音等信息轉(zhuǎn)化為電信息。也就是獲取研究對象的基本信息并通過某種方法將其轉(zhuǎn)變?yōu)闄C器能夠認識的信息。預處理主要是指圖像處理中的去噪、平滑、變換等的操作,從而加強圖像的重要特征。特征抽取和選擇是指在模式識別中,需要進行特征的抽取和選擇。簡單的理解就是我們所研究的圖像是各式各樣的,如果要利用某種方法將它們區(qū)分開,就要通過這些圖像所具有的本身特征來識別,而獲取
7、這些特征的過程就是特征抽取。在特征抽取中所得到的特征也許對此次識別并不都是有用的,這個時候就要提取有用的特征,這就是特征的選擇。特征抽取和選擇在圖像識別過程中是非常關(guān)鍵的技術(shù)之一,所以對這一步的理解是圖像識別的重點。分類器設(shè)計是指通過訓練而得到一種識別規(guī)則,通過此識別規(guī)則可以得到一種特征分類,使圖像識別技術(shù)能夠得到高識別率。分類決策是指在特征空間中對被識別對象進行分類,從而更好地識別所研究的對象具體屬于哪一類。3 圖像識別技術(shù)的分析隨著計算機技術(shù)的迅速發(fā)展和科技的不斷進步,圖像識別技術(shù)已經(jīng)在眾多領(lǐng)域中得到了應用。2015年2月15日新浪科技發(fā)布一條新聞:“微軟最近公布了一篇關(guān)于圖像識別的研究論
8、文,在一項圖像識別的基準測試中,電腦系統(tǒng)識別能力已經(jīng)超越了人類。人類在歸類數(shù)據(jù)庫Image Net中的圖像識別錯誤率為%,而微軟研究小組的這個深度學習系統(tǒng)可以達到%的錯誤率?!睆倪@則新聞中我們可以看出圖像識別技術(shù)在圖像識別方面已經(jīng)有要超越人類的圖像識別能力的趨勢。這也說明未來圖像識別技術(shù)有更大的研究意義與潛力。而且,計算機在很多方面確實具有人類所無法超越的優(yōu)勢,也正是因為這樣,圖像識別技術(shù)才能為人類社會帶來更多的應用。神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)神經(jīng)網(wǎng)絡(luò)圖像識別技術(shù)是一種比較新型的圖像識別技術(shù),是在傳統(tǒng)的圖像識別方法和基礎(chǔ)上融合神經(jīng)網(wǎng)絡(luò)算法的一種圖像識別方法。這里的神經(jīng)網(wǎng)絡(luò)是指人工神經(jīng)網(wǎng)絡(luò),也就是說
9、這種神經(jīng)網(wǎng)絡(luò)并不是動物本身所具有的真正的神經(jīng)網(wǎng)絡(luò),而是人類模仿動物神經(jīng)網(wǎng)絡(luò)后人工生成的。在神經(jīng)網(wǎng)絡(luò)圖像識別技術(shù)中,遺傳算法與BP網(wǎng)絡(luò)相融合的神經(jīng)網(wǎng)絡(luò)圖像識別模型是非常經(jīng)典的,在很多領(lǐng)域都有它的應用。在圖像識別系統(tǒng)中利用神經(jīng)網(wǎng)絡(luò)系統(tǒng),一般會先提取圖像的特征,再利用圖像所具有的特征映射到神經(jīng)網(wǎng)絡(luò)進行圖像識別分類。以汽車拍照自動識別技術(shù)為例,當汽車通過的時候,汽車自身具有的檢測設(shè)備會有所感應。此時檢測設(shè)備就會啟用圖像采集裝置來獲取汽車正反面的圖像。獲取了圖像后必須將圖像上傳到計算機進行保存以便識別。最后車牌定位模塊就會提取車牌信息,對車牌上的字符進行識別并顯示最終的結(jié)果。在對車牌上的字符進行識別的過
10、程中就用到了基于模板匹配算法和基于人工神經(jīng)網(wǎng)絡(luò)算法。非線性降維的圖像識別技術(shù)計算機的圖像識別技術(shù)是一個異常高維的識別技術(shù)。不管圖像本身的分辨率如何,其產(chǎn)生的數(shù)據(jù)經(jīng)常是多維性的,這給計算機的識別帶來了非常大的困難。想讓計算機具有高效地識別能力,最直接有效的方法就是降維。降維分為線性降維和非線性降維。例如主成分分析(PCA)和線性奇異分析(LDA)等就是常見的線性降維方法,它們的特點是簡單、易于理解。但是通過線性降維處理的是整體的數(shù)據(jù)集合,所求的是整個數(shù)據(jù)集合的最優(yōu)低維投影。經(jīng)過驗證,這種線性的降維策略計算復雜度高而且占用相對較多的時間和空間,因此就產(chǎn)生了基于非線性降維的圖像識別技術(shù),它是一種極其
11、有效的非線性特征提取方法。此技術(shù)可以發(fā)現(xiàn)圖像的非線性結(jié)構(gòu)而且可以在不破壞其本征結(jié)構(gòu)的基礎(chǔ)上對其進行降維,使計算機的圖像識別在盡量低的維度上進行,這樣就提高了識別速率。例如人臉圖像識別系統(tǒng)所需的維數(shù)通常很高,其復雜度之高對計算機來說無疑是巨大的“災難”。由于在高維度空間中人臉圖像的不均勻分布,使得人類可以通過非線性降維技術(shù)來得到分布緊湊的人臉圖像,從而提高人臉識別技術(shù)的高效性。 圖像識別技術(shù)的應用及前景計算機的圖像識別技術(shù)在公共安全、生物、工業(yè)、農(nóng)業(yè)、交通、醫(yī)療等很多領(lǐng)域都有應用。例如交通方面的車牌識別系統(tǒng);公共安全方面的人臉識別技術(shù)、指紋識別技術(shù);農(nóng)業(yè)方面的種子識別技術(shù)、食品品質(zhì)檢測技術(shù);醫(yī)學方面的心電圖識別技術(shù)等。隨著計算機技術(shù)的不斷發(fā)展,圖像識別技術(shù)也在不斷地優(yōu)化,其算法也在不斷地改進。圖像是人類獲取和交換信息的主要來源,因此與圖像相關(guān)的圖像識別技術(shù)必定也是未來的研究重點。以后計算機的圖像識別技術(shù)很有可能在更多的領(lǐng)域嶄露頭角,它的應用前景也是不可限量的,人類的生活也將更加離不開圖像識別技術(shù)。4 總結(jié)圖像識別技術(shù)雖然是剛興起的技術(shù),但其應用已是相當廣泛。并且,圖像識別技術(shù)也在不斷地成長,隨著科技的不斷進步,人類對圖像識別技術(shù)的認識也會更加深刻。未來圖像識別技術(shù)將會更加強大,更加智能地出現(xiàn)在我們的生活中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 35613-2024綠色產(chǎn)品評價紙和紙制品
- 期中拔高測試(第1-4單元)(試題)(含答案)2024-2025學年六年級上冊數(shù)學人教版
- 2024年度云南省高校教師資格證之高等教育法規(guī)模擬考試試卷A卷含答案
- 2024年度上海市高校教師資格證之高等教育法規(guī)題庫綜合試卷B卷附答案
- 阜陽師范大學《自然科學專題》2022-2023學年第一學期期末試卷
- 阜陽師范大學《美國文學》2022-2023學年第一學期期末試卷
- 粵教版三年級科學上冊全冊教案(廣東)
- 蘇州市2024-2025學年五年級上學期11月期中調(diào)研數(shù)學試卷二(有答案)
- 福建師范大學協(xié)和學院《學前兒童保育學》2021-2022學年第一學期期末試卷
- 福建師范大學《中小學教學名師論壇》2022-2023學年第一學期期末試卷
- 充電樁建設(shè)項目質(zhì)量管理方案
- 中醫(yī)養(yǎng)生秋季養(yǎng)生
- 《信息安全技術(shù)數(shù)據(jù)安全能力成熟度模型》
- 建筑材料采購投標方案(技術(shù)標)
- 職業(yè)技能考評員培訓
- 當前臺海局勢分析課件
- JavaScript-基礎(chǔ)階段測筆試試題(含答案)
- 2024中國傳媒產(chǎn)業(yè)
- 施工現(xiàn)場臨時用電安全技術(shù)規(guī)范JGJ46-2005
- 圖解2023《鑄牢中華民族共同體意識》課件
- 2024年麻疹ppt課件完整版x
評論
0/150
提交評論