版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
圖像分析的應用領域一、人臉識別二、指紋識別三、光學字符識別四、手寫識別1/19一人臉識別廣義的人臉識別實際包括構建人臉識別系統(tǒng)的一系列相關技術,包括人臉圖像采集、人臉定位、人臉識別預處理、身份確認以及身份查找等;而狹義的人臉識別特指通過人臉進行身份確認或者身份查找的技術或系統(tǒng)。人臉識別是一項熱門的計算機技術研究領域,它屬于生物特征識別技術,是對生物體(一般特指人)本身的生物特征來區(qū)分生物體個體。生物特征識別技術所研究的生物特征包括臉、指紋、手掌紋、虹膜、視網(wǎng)膜、聲音(語音)、體形、個人習慣(例如敲擊鍵盤的力度和頻率、簽字)等,相應的識別技術就有人臉識別、指紋識別、掌紋識別、虹膜識別、視網(wǎng)膜識別、語音識別(用語音識別可以進行身份識別,也可以進行語音內(nèi)容的識別,只有前者屬于生物特征識別技術)、體形識別、鍵盤敲擊識別、簽字識別等。2/19一人臉識別(1)人臉識別的優(yōu)勢人臉識別的優(yōu)勢在于其自然性和不被被測個體察覺的特點。所謂自然性,是指該識別方式同人類(甚至其他生物)進行個體識別時所利用的生物特征相同(人類也是通過觀察比較人臉區(qū)分和確認身份的)。另外具有自然性的識別還有語音識別、體形識別等,而指紋識別、虹膜識別等都不具有自然性,因為人類或者其他生物并不通過此類生物特征區(qū)別個體。不被察覺的特點對于一種識別方法也很重要,這會使該識別方法不令人反感,并且因為不容易引起人的注意而不容易被欺騙。人臉識別具有這方面的特點,它完全利用可見光獲取人臉圖像信息,而不同于指紋識別或者虹膜識別,需要利用電子壓力傳感器采集指紋,或者利用紅外線采集虹膜圖像,這些特殊的采集方式很容易被人察覺,從而更有可能被偽裝欺騙。3/19一人臉識別(2)技術困難雖然人臉識別有很多其他識別無法比擬的優(yōu)點,但是它本身也存在許多困難。人臉識別被認為是生物特征識別領域甚至人工智能領域最困難的研究課題之一。人臉識別的困難主要是人臉作為生物特征的特點所帶來的。人臉在視覺上的特點是:不同個體之間的區(qū)別不大,所有的人臉的結構都相似,甚至人臉器官的結構外形都很相似。這樣的特點對于利用人臉進行檢測區(qū)域定位是有利的,但是對于利用人臉區(qū)分人類個體是不利的。人臉的外形很不穩(wěn)定,人可以通過臉部的變化產(chǎn)生很多表情,而在不同觀察角度,人臉的視覺圖像也相差很大,另外,人臉識別還受光照條件(例如白天和夜晚,室內(nèi)和室外等)、人臉的很多遮蓋物(例如口罩、墨鏡、頭發(fā)、胡須等)、年齡、拍攝的姿態(tài)角度等多方面因素的影響。4/19一人臉識別(3)技術細節(jié)一般來說,人臉識別過程包括圖像攝取、人臉定位、圖像預處理、以及人臉識別(身份確認或者身份查找)。系統(tǒng)輸入一般是一張或者一系列含有未確定身份的人臉圖像,以及人臉數(shù)據(jù)庫中的若干已知身份的人臉圖象或者相應的編碼,而其輸出則是一系列相似度得分,表明待識別的人臉的身份。目前人臉識別的算法可以分類為:基于人臉特征點的識別算法(feature-basedrecognitionalgorithms);基于整幅人臉圖像的識別算法(appearance-basedrecognitionalgorithms);基于模板的識別算法(template-basedrecognitionalgorithms);利用神經(jīng)網(wǎng)絡進行識別的算法(recognitionalgorithmsusingneuralnetwork);利用支持向量機進行識別的算法(recognitionalgorithmsusingSVM)。5/19一人臉識別(4)發(fā)展與應用人臉識別系統(tǒng)的研究始于20世紀60年代,80年代后隨著計算機技術和光學成像技術的發(fā)展得到提高,而真正進入初級的應用階段則在90年后期,并且以美國、德國和日本的技術實現(xiàn)為主。人臉識別系統(tǒng)成功的關鍵在于是否擁有尖端的核心算法,并使識別結果具有實用化的識別率和識別速度。人臉識別系統(tǒng)集成了人工智能、機器識別、機器學習、模型理論、專家系統(tǒng)、視頻圖像處理等多種專業(yè)技術,同時需結合中間值處理的理論與實現(xiàn),是生物特征識別的最新應用,其核心技術的實現(xiàn),展現(xiàn)了弱人工智能向強人工智能的轉化。6/19一人臉識別人臉識別的應用主要有:門禁系統(tǒng):受安全保護的地區(qū)可以通過人臉識別辨識試圖進入者的身份,比如監(jiān)獄、看守所、小區(qū)、學校等;攝像監(jiān)視系統(tǒng):在例如銀行、機場、體育場、商場、超級市場等公共場所對人群進行監(jiān)視,以達到身份識別的目的,例如在機場安裝監(jiān)視系統(tǒng)以防止恐怖分子登機;網(wǎng)絡應用:利用人臉識別輔助信用卡網(wǎng)絡支付,以防止非信用卡的擁有者使用信用卡,社保支付防止冒領等;學生考勤系統(tǒng):香港及澳門的中、小學已開始將智能卡配合人臉識別來為學生進行每天的出席點名記錄;相機:新型的數(shù)碼相機已內(nèi)建人臉識別功能以輔助拍攝人物時對焦;智能手機:解鎖手機、識別使用者。7/19二指紋識別指紋識別技術是一種生物識別技術,指紋識別系統(tǒng)是一套包括指紋圖像獲取、處理、特征提取和比對等模塊的模式識別系統(tǒng)。常用于需要人員身份確認的場所,如門禁系統(tǒng)、考勤系統(tǒng)、筆記本電腦、銀行內(nèi)部處理、銀行支付等。指紋是靈長類手指末端指腹上由凹凸的皮膚所形成的紋路,也可指這些紋路在物體上印下的印痕。紋路的細節(jié)特征點有起點、終點、結合點和分叉點。由于每個人的指紋并不相同,同一人的不同手指的指紋也不一樣,指紋識別就是通過比較這些細節(jié)特征的區(qū)別來進行鑒別。8/19二指紋識別(1)歷史指紋由于具有個體差異性及穩(wěn)定性,早在中國古代便用于身份確認,當時人們以指紋或手印畫押。在西方,1890年代以后警察逐漸將指紋作為辨認罪犯的方法之一。1960年代隨著電腦技術的發(fā)展,美國聯(lián)邦調(diào)查局和法國巴黎警察局等開始研究電腦指紋識別技術。1990年代用于個人身份鑒別的自動指紋識別系統(tǒng)開發(fā)完成并推廣應用。9/19二指紋識別(2)分析步驟指紋識別系統(tǒng)通常包括以下幾部分:圖像獲?。和ㄟ^專門的指紋采集或掃描儀、數(shù)字相機、智能手機等獲取指紋圖像。根據(jù)采集指紋面積大體可以分為滾動捺印指紋和平面捺印指紋,公安行業(yè)普遍采用滾動捺印指紋;圖像壓縮:將指紋數(shù)據(jù)庫的圖像經(jīng)過壓縮后存儲,主要方法為轉換為JPEG、WSQ、EZW等文件。目的是減少存儲空間。其中,EZW被列入中國公安部刑偵領域指紋圖像壓縮的國家標準;圖像處理:指紋區(qū)域檢測、圖像質(zhì)量判斷、方向圖和頻率估計、圖像增強、指紋圖像二值化和細化等;指紋形態(tài)和細節(jié)特征提?。韩@取指紋特征并提取交下一步分析。指紋形態(tài)特征包括中心(上、下)和三角點(左、右)等,細節(jié)特征點主要包括紋線的起點、終點、結合點和分叉點;指紋比對:對比兩個以上指紋以分析是否為同一指紋來源。10/19二指紋識別(3)指紋識別技術的應用領域疑犯指紋對比;電腦使用者身份確認;兒童指紋數(shù)據(jù)庫。11/19三光學字符識別光學字符識別(OpticalCharacterRecognition,OCR)是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程。OCR的概念是在1929年由德國科學家Tausheck最先提出來,并申請了專利。后來美國科學家Handel也提出了利用技術對文字進行識別的想法。中國最早的OCR商業(yè)應用是由科學家王慶人教授在南開大學開發(fā)出來的,并在美國市場投入商業(yè)使用。12/19三光學字符識別OCR的識別過程:①圖像輸入、圖像預處理:對于不同的圖像格式,有著不同的存儲格式,不同的壓縮方式,目前有OpenCV、CxImage等開源項目。圖像預處理主要包括二值化,噪聲去除,傾斜校正等;②噪聲去除:對于不同的文檔,對噪聲的定義可以不同,根據(jù)噪聲的特征進行去噪;③傾斜校正:由于一般的用戶在拍照文檔時都比較隨意,因此拍照出來的圖片不可避免的產(chǎn)生傾斜,這就需要文字識別軟件進行較正;④版面分析:將文檔圖片分段落,分行的過程就叫做版面分析,由于實際文檔的多樣性、復雜性,因此,目前還沒有一個固定的,最優(yōu)的切割模型;13/19三光學字符識別⑤字符切割:由于拍照條件的限制,經(jīng)常造成字符粘連,斷筆,因此極大限制了識別系統(tǒng)的性能。⑥字符識別:早期的方式有模板匹配,后來以特征提取為主,由于文字的位移、筆畫的粗細、斷筆、粘連、旋轉等因素的影響,極大影響特征的提取的難度;⑦版面還原:人們希望識別后的文字,仍然像原文檔圖片那樣排列著,段落不變,位置不變,順序不變地輸出到Word文檔、PDF文檔等,這一過程就叫做版面還原;⑧后處理、校對:根據(jù)特定的語言上下文的關系,對識別結果進行校正,就是后處理。14/19四手寫識別手寫識別(Handwritingrecognition)是計算機在紙、照片、觸摸屏或其他設備中接收并識別人手寫的文字等信息的技術,主要應用于光學字符識別技術(OCR)。15/19四手寫識別(1)離線手寫識別離線手寫識別主要應用在打印出來的文字識別上,涉及到將圖像中的文本自動轉換成是計算機可以使用的字符代碼。離線手寫識別是比較困難的,因為不同的人有不同的書寫風格。減少識別錯誤的技術常常使用縮小識別范圍,例如郵政編碼只包含1~9的數(shù)字,識別這種數(shù)字可以減少錯誤的可能。主要應用的技術有:指定特定的字符范圍、識別字符的專有特點等。16/19四手寫識別(2)在線手寫識別從硬件方面來說,早在20世紀80年代,就有人提出在商業(yè)產(chǎn)品中將手寫體識別作為鍵盤輸入的一種替代方式。雖然公眾已經(jīng)習慣將手寫識別看作一種輸入方式,但在臺式電腦或筆記本電腦中并沒有得到廣泛的使用。鍵盤仍被普遍認為是速度更快,更可靠輸入方式。截至2006年,已有許多掌上型電腦提供手寫輸入,但精確度仍是一個問題,有的人還認為屏幕鍵盤更有效率。在線手寫識別可以分解為幾個通用的步驟:預處理;特征的提??;分離出字符。預處理的目的是摒棄無關的輸入數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《服務外包作業(yè)》課件
- 園藝機械碳排放研究-洞察分析
- 網(wǎng)絡入侵防御系統(tǒng)研究-洞察分析
- 脫附吸附平衡模型-洞察分析
- 《期合理化提報內(nèi)容》課件
- 醫(yī)保產(chǎn)品市場拓展-洞察分析
- 醫(yī)生定期考核簡易程序述職報告范文(10篇)
- 淘寶店鋪流量分析-洞察分析
- 體育品牌的社會影響-洞察分析
- 吃低保的24種病申請書范文(9篇)
- 20567-5納稅籌劃-教案及講稿
- 部編版三年級上冊作文評價表
- 2019MATLAB-Simulink電力系統(tǒng)建模與仿真第2版
- 繪本故事:睡睡鎮(zhèn)
- 新疆維吾爾喀什地區(qū)2023-2024學年四年級數(shù)學第一學期期末質(zhì)量檢測試題含答案
- BMW銷售流程培訓教材課件
- 全年籃球訓練計劃表
- Unit 5 Humans and nature Lesson 1 A sea story 課件-2023-2024學年高中英語北師大版(2019)必修第二冊
- 煤炭入股合伙人協(xié)議書
- 優(yōu)秀項目監(jiān)理部評選材料
- 新時代核心英語教程3 電子版
評論
0/150
提交評論