計(jì)算機(jī)視覺概況_第1頁
計(jì)算機(jī)視覺概況_第2頁
計(jì)算機(jī)視覺概況_第3頁
計(jì)算機(jī)視覺概況_第4頁
計(jì)算機(jī)視覺概況_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

計(jì)算機(jī)視覺概況孟春嬋測試計(jì)量技術(shù)及儀器一、定義

計(jì)算機(jī)視覺是用計(jì)算機(jī)來模擬人的視覺機(jī)理獲取和處理信息的能力。計(jì)算機(jī)視覺是使用計(jì)算機(jī)及相關(guān)設(shè)備對生物視覺的一種模擬。它的主要任務(wù)就是通過對采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場景的三維信息,就像人類和許多其他類生物每天所做的那樣。計(jì)算機(jī)視覺要達(dá)到的基本目的至少有三個:

1.根據(jù)一幅或多幅二維投影圖象計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;

2.根據(jù)一幅或多幅二維投影圖象計(jì)算出目標(biāo)物體的運(yùn)動參數(shù);

3.根據(jù)一幅或多幅二維投影圖象計(jì)算出目標(biāo)物體的表面物理特性;

要達(dá)到的最終目的是實(shí)現(xiàn)對于三維景物世界的理解,即實(shí)現(xiàn)人的視覺系統(tǒng)的某些功能。

計(jì)算機(jī)視覺研究的本質(zhì)問題——利用二維投影圖象來重構(gòu)三維物體的可視部分。計(jì)算機(jī)視覺既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個富有挑戰(zhàn)性重要研究領(lǐng)域。計(jì)算機(jī)視覺是一門綜合性的學(xué)科,它已經(jīng)吸引了來自各個學(xué)科的研究者參加到對它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。

二、計(jì)算機(jī)視覺的研究方法與內(nèi)容1、交叉學(xué)科涉及幾何(射影幾何、空間解析幾何)、線性代數(shù)、概率、隨機(jī)過程、優(yōu)化方法、信息論、生理學(xué)、心理學(xué)、光學(xué)、熱力學(xué)等2、主要方法從簡化世界出發(fā)(早期的主要手段)恢復(fù)精確三維形狀3、研究內(nèi)容立體視覺、運(yùn)動視覺、ShapefromX、高層表示與推理、視覺學(xué)習(xí)、主動視覺三、視覺系統(tǒng)

計(jì)算機(jī)視覺系統(tǒng)的結(jié)構(gòu)形式很大程度上依賴于其具體應(yīng)用方向。有些是獨(dú)立工作的,用于解決具體的測量或檢測問題;也有些作為某個大型復(fù)雜系統(tǒng)的組成部分出現(xiàn),比如和機(jī)械控制系統(tǒng),數(shù)據(jù)庫系統(tǒng),人機(jī)接口設(shè)備協(xié)同工作。計(jì)算機(jī)視覺系統(tǒng)的具體實(shí)現(xiàn)方法同時也由其功能決定——是預(yù)先固定的抑或是在運(yùn)行過程中自動學(xué)習(xí)調(diào)整。盡管如此,有些功能卻幾乎是每個計(jì)算機(jī)系統(tǒng)都需要具備的:

1、圖像獲取一幅數(shù)字圖像是由一個或多個圖像感知器產(chǎn)生,這里的感知器可以是各種光敏攝像機(jī),包括遙感設(shè)備,X射線斷層攝影儀,雷達(dá),超聲波接收器等。去絕不與同的感知器,產(chǎn)生的圖片可以是普通的二維圖像,三維圖組或者一個圖像序列。圖片的像素值往往對應(yīng)于光在一個或多個光譜段上的強(qiáng)度(灰度圖或彩色圖),但也可以是相關(guān)的各種物理數(shù)據(jù),如聲波,電磁波或核磁共振的深度,吸收度或反射度。

2、預(yù)處理在對圖像實(shí)施具體的計(jì)算機(jī)視覺方法來提取某種特定的信息前,一種或一些預(yù)處理往往被采用來使圖像滿足后繼方法的要求。例如:二次取樣保證圖像坐標(biāo)的正確;平滑去噪來濾除感知器引入的設(shè)備噪聲;提高對比度來保證實(shí)現(xiàn)相關(guān)信息可以被檢測到;調(diào)整尺度空間使圖像結(jié)構(gòu)適合局部應(yīng)用。3、特征提取從圖像中提取各種復(fù)雜度的特征。例如:線、邊緣提??;局部化的特征點(diǎn)檢測如邊角檢測,斑點(diǎn)檢測;更復(fù)雜的特征可能與圖像中的紋理形狀或運(yùn)動有關(guān)。4、檢測分割在圖像處理過程中,有時會需要對圖像進(jìn)行分割來提取有價值的用于后繼處理的部分,例如:篩選特征點(diǎn);分割一或多幅圖片中含有特定目標(biāo)的部分。5、高級處理到了這一步,數(shù)據(jù)往往具有很小的數(shù)量,例如圖像中經(jīng)先前處理被認(rèn)為含有目標(biāo)物體的部分。這時的處理包括:驗(yàn)證得到的數(shù)據(jù)是否符合前提要求;估測特定系數(shù),比如目標(biāo)的姿態(tài),體積;對目標(biāo)進(jìn)行分類。四、主要研究的問題比如簡單幾何圖形識別,人臉識別,印刷或手寫文件識別或者車輛識別。1、識別一個計(jì)算機(jī)視覺,圖像處理和機(jī)器視覺所共有的經(jīng)典問題便是判定一組圖像數(shù)據(jù)中是否包含某個特定的物體,圖像特征或運(yùn)動狀態(tài)。2、運(yùn)動基于序列圖像的對物體運(yùn)動的監(jiān)測包含多種類型,諸如:自體運(yùn)動:監(jiān)測攝像機(jī)的三維剛性運(yùn)動。圖像跟蹤:跟蹤運(yùn)動的物體。3、場景重建給定一個場景的二或多幅圖像或者一段錄像,場景重建尋求為該場景建立一個計(jì)算機(jī)模型/三維模型。最簡單的情況便是生成一組三維空間中的點(diǎn)。更復(fù)雜的情況下會建立起完整的三維表面模型。4、圖像恢復(fù)圖像恢復(fù)的目標(biāo)在于移除圖像中的噪聲,例如儀器噪聲,模糊等。五、視覺系統(tǒng)研究的三個層次計(jì)算機(jī)視覺就是用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段,由計(jì)算機(jī)來代替大腦完成處理和解釋。計(jì)算機(jī)視覺的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。1、計(jì)算理論層次信息處理的計(jì)算理論,研究的是對什么信息進(jìn)行計(jì)算和為什么要進(jìn)行這些計(jì)算。2、表達(dá)與算法層次

研究的是如何進(jìn)行所要求的計(jì)算,也就是要設(shè)計(jì)特定的算法,能把某種實(shí)體或某幾類信息表達(dá)清楚的形式化系統(tǒng)。

3、硬件實(shí)現(xiàn)層次

研究完成某一特定算法的計(jì)算機(jī)構(gòu)。六、視覺信息處理的三個階段

按視覺信息的表示,可將視覺信息處理分為三個階段:1、初始簡圖檢測亮度的變化,表示并分析局部的幾何結(jié)構(gòu),以及檢測光源、強(qiáng)光部和透明度等照明效應(yīng)等,這一步得到的表示稱為初始簡圖。未處理的初始簡圖:邊緣、線、點(diǎn)等,基元圖完全的初始簡圖:對原始的基元進(jìn)行選擇、聚合和概括等過程來構(gòu)成更大、更為抽象的標(biāo)記。2、2.5維簡圖建立包括表面朝向,觀察者的距離,以及朝向

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論