第二講 計算機視覺_第1頁
第二講 計算機視覺_第2頁
第二講 計算機視覺_第3頁
第二講 計算機視覺_第4頁
第二講 計算機視覺_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

計算機視覺

computervision課程設置:計算機視覺視覺基礎底層處理中層處理高層處理視覺基礎理論:神經生理學、認知科學;色度學、光學;射影幾何、矩陣理論。圖像處理:空域圖像處理;頻域圖像處理;圖像特征提取。圖像分割;相機標定;深度估計;

運動估計。三維重建;目標識別。智能機器:能夠模擬人類的功能,感知外部世界并有效解決人所能解決問題的系統(tǒng)。在人類的感知器官中,視覺獲取的信息量最大,大約80%,因此對于發(fā)展智能機器而言,賦予機器以人類視覺功能是十分重要的。計算機視覺:研究用計算機來模擬生物外顯或宏觀視覺功能的技術學科。計算機視覺的任務是用圖像創(chuàng)建或恢復現(xiàn)實世界模型,然后認知現(xiàn)實世界。具體來說,讓計算機具有對周圍世界的空間物體進行傳感、抽象、判斷的能力,從而達到識別、理解的目的。

1.計算機視覺的意義2.視覺的過程2.視覺的過程2.視覺的過程2.視覺的過程2.視覺的過程2.視覺的過程計算機視覺過程分為三個階段特征提取和區(qū)域分割基于輪廓,紋理,顏色…建模與模式表達基于各種物體的抽象化模型描述和理解基于景物的結構知識2.視覺的過程底層處理中層處理高層處理知識少多恢復場景的深度、表面法線方向、輪廓等有關場景的2.5維信息,并在此基礎上恢復物體的完整三維圖,建立物體三維描述.根據(jù)機器預先存貯的模型知識以及形狀、色彩等特征,對于圖像中各種物體進行識別,確定它們用于哪一類物體.建立各個圖像中物體的拓撲關系圖,給出圖像所反映景物的結構描述.體系結構(systemarchitecture),涉及一系列相關的課題,并行結構、分層結構、信息流結構、拓撲結構以及從設計到實現(xiàn)的途徑.3.計算機視覺的研究內容圖像多義性:三維場景被投影為二維圖像,深度和不可見部分的信息被丟失,因而會出現(xiàn)不同形狀的三維物體投影在圖像平面上產生相同圖像的問題.另外,在不同角度獲取同一物體的圖像會有很大的差異.環(huán)境因素影響:場景中的諸多因素,包括照明、物體形狀、表面顏色、攝像機以及空間關系變化都會對成像有影響.知識導引:同樣的圖像在不同的知識導引下,將會產生不同的識別結果.大量數(shù)據(jù):灰度圖像,彩色圖像,深度圖像的信息量十分巨大,巨大的數(shù)據(jù)量需要很大的存貯空間,同時不易實現(xiàn)快速處理.4.視覺面臨的困難上世紀50年代,從統(tǒng)計模式識別開始,主要集中在二維圖像分析與識別,主要應用包括字符識別、工件表面檢測等等。上世紀60年代,拓展到三維結構,對物體的形狀,物體的空間關系進行描述。通過對積木世界的研究,引出了邊緣、角點等特征提取,圖像明暗、紋理、運動以及成像幾何等研究工作。上世紀70年代,Marr計算視覺理論,建立一個十分重要的理論框架。5.計算機視覺的發(fā)展(before1970s)5.計算機視覺的發(fā)展(after1970s)Marr視覺計算理論——三種層次計算理論,主要解決視覺系統(tǒng)的計算目的和策略是什么?輸入輸出是什么?用什么策略根據(jù)系統(tǒng)的輸入求出輸出?該層次的任務就是研究如何建立輸入輸出之間的約束和關系。表示和算法,解決輸入輸出信息如何來表示?如何實現(xiàn)計算理論所對應的功能的算法?以及如何由一種表示轉換成另一種表示?硬件實現(xiàn),就是具體的計算裝置和一些細節(jié)配置5.計算機視覺的發(fā)展(1982)5.計算機視覺的發(fā)展(1990s)(a)factorization-based

structurefrommotion(TomasiandKanade1992),(b)densestereomatching

(Boykov,Veksler,andZabih2001),(c)multi-viewreconstruction(SeitzandDyer1999)

(d)facetracking(Matthews,Xiao,andBaker2007),(e)imagesegmentation

(Belongie,Fowlkes,Chungetal.2002)(f)facerecognition(Turkand

Pentland1991a).5.計算機視覺的發(fā)展(2000s)(a)imagestitching:merging

differentviews(SzeliskiandShum1997)(b)exposurebracketing:merging

differentexposures;(c)morphing:blendingbetweentwophotographs(Gomes,Darsa,Costa

etal.1999(d)turningacollectionofphotographsintoa3D

model(Sinha,Steedly,Szeliskietal.2008)圖像處理:圖像處理通常是把一幅圖像變換成另外一幅圖像,也就是說,圖像處理系統(tǒng)的輸入是圖像,輸出仍然是圖像,信息恢復任務則留給人來完成計算機圖形學:通過幾何基元,如線、圓和自由曲面,來生成圖像,它在可視化(Visualization)和虛擬現(xiàn)實(VirtualReality)中起著很重要的作用.計算機視覺正好是解決相反的問題,即從圖像中估計幾何基元和其它特征.因此,計算機圖形學屬于圖像綜合,計算機視覺屬于圖像分析.模式識別:模式一般指一類事物區(qū)別于其它事物所具有的共同特征。6.計算機視覺與其它學科領域的關系人工智能(AI):涉及到智能系統(tǒng)的設計和智能計算的研究.在經過圖像處理和圖像特征提取過程后,接下來要用人工智能方法對場景特征進行表示,并分析和理解場景.人工智能有三個過程:感知、認知和行動..神經生理學與認知科學:將人類視覺作為主要的研究對象.計算機視覺中已有的許多方法與人類視覺極為相似.許多計算機視覺研究者對研究人類視覺計算模型比研究計算機視覺系統(tǒng)更感興趣,希望計算機視覺更加自然化,更加接近生物視覺計算機視覺與其它學科領域的關系

零件識別與定位產品檢驗移動機器人導航遙感圖像分析醫(yī)學圖像分析安全鑒別、監(jiān)視與跟蹤國防系統(tǒng)(目標自動識別ATR與目標跟蹤)其它(體育、考古、動畫)7.計算機視覺的應用Sojourner火星車前部圖,中部的兩個小突出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。