論計算機視覺的應用與發(fā)展_第1頁
論計算機視覺的應用與發(fā)展_第2頁
論計算機視覺的應用與發(fā)展_第3頁
論計算機視覺的應用與發(fā)展_第4頁
論計算機視覺的應用與發(fā)展_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上論計算機視覺的應用與發(fā)展摘要:計算機視覺學是自二十世紀六十年代中期迅速發(fā)展起來的一門新學科。計算機視覺是使用計算機及相關(guān)設(shè)備對生物視覺的一種模擬。它的主要任務就是通過對采集的圖片或視頻進行處理以獲得相應場景的三維信息,就像人類和許多其他類生物每天所做的那樣。由于算機視覺學在工農(nóng)業(yè)生產(chǎn)、地質(zhì)學、天文學、氣象學、醫(yī)學及軍事并學等領(lǐng)域有著極大的潛在應用價值,所以它在國際上越來越受人重視。本文簡要地介紹了計算機視覺學的研究內(nèi)容,它同附近學科的關(guān)系,計算機視覺研究中面臨的技術(shù)難點以及計算機視覺學的歷史,現(xiàn)狀和研究動向。關(guān)鍵字:計算機 視覺 圖像 應用Abstract:Compu

2、ter vision is a new rapidly developed subject since the 1960s medium-term. Computer vision is used for an analog of biological vision with computers and related equipments. Its main task is obtaining corresponding scene 3-d information by collecting the picture or video processed, just like humans a

3、nd many other creature do every day. Because of computer vision has a great potential application value in industrial and agricultural production, geology, astronomy, meteorology, the medicine and the military and other fields,so it is becoming more and more attention in the world. This paper briefl

4、y introduced the study content of computer vision,its relationship with nearby subjects, the technical difficulties that computer vision research is facing and computer visions history, present situation and research trend.Key words:computer vision pictures application1 緒論計算機視覺既是工程領(lǐng)域,也是科學領(lǐng)域中的一個富有挑戰(zhàn)性

5、重要研究領(lǐng)域。計算機視覺是一門綜合性的學科,它已經(jīng)吸引了來自各個學科的研究者參加到對它的研究之中。其中包括和工程、物理學、應用數(shù)學和統(tǒng)計學,神經(jīng)生理學和等。計算機視覺學所研究的對象,簡單地說就是研究如何讓計算機通過圖象傳感器或其它光傳感器來感知、分析和理解周圍環(huán)境。人類感知外界環(huán)境主要通過視覺,聽覺和觸覺等四大感覺系統(tǒng)。其中視覺系統(tǒng)是最復雜的。人類從外界獲得的信息中視覺信號量最大。模仿人類的視覺系統(tǒng),計算機視覺系統(tǒng)中信息的處理和分析大致可以分成兩個階段:圖象處理階段又稱視覺處理中的低水平和中水平階段;圖象分析、理解階段又稱視覺處理中的高水平處理階段。在圖象處理階段,計算機對圖象信息進行一系列的

6、加工處理,這主要是:1、校正成象過程中系統(tǒng)引進的光度學和幾何學的畸變,抑制和去除成象過程中引進的噪聲統(tǒng)稱為圖象的恢復。2、從圖象信息如亮度分布信息中提取諸如邊沿信息,深度信息圖象點沿軸方向的尺度,表面三維傾斜方向信息等反映客觀景物特征的信息。3、根據(jù)抽取的特征信息把反映三維客體的各個圖象基元,如輪廓、線條、紋理、邊緣、邊界、物體的各個面等從圖象中分離出來,并且建立起各個基元之間的拓樸學上的和幾何學上的關(guān)系稱之基元的分割和關(guān)系的確定。在圖象分析和理解階段,計算機根據(jù)事先存貯在數(shù)據(jù)庫中的預知識模型,識別出各個基元或某些基元組合所代表的客觀世界中的某些實體稱之為模型匹配以及根據(jù)圖象中各基元之間的關(guān)系

7、在預知識的指導下得出圖象所代表的實際景物的含義,得出圖象的解釋或描述。必須強調(diào),預知識在視覺系統(tǒng)中起著相當重要的作用。在預知識庫中存放著各種實際可能遇到的物體的知識模型,和實際景物中各種物體之間的約束關(guān)系。計算機的作用是根據(jù)被分析的圖象中的各基元及其關(guān)系,利用預知識作為指導,通過匹配,搜索和推理等手段,最終得到對圖象的描述。在整個過程中預知識時刻提供處理的樣板和證據(jù)。每一步的處理結(jié)果隨時同預知識進行對比。有時,處理的中間結(jié)果和最終結(jié)果還要饋送給預知識庫作為知識的更新和積累。2圖像分割研究圖像分割是圖像處理與機器視覺的基本問題之一。其要點是:把圖像劃分成若干互不交迭區(qū)域的集合。這些區(qū)域要么對當前

8、的任務有意義,要么有助于說明它們與實際物體或物體的某些部分之間的對應關(guān)系。圖像分割的應用十分廣泛,幾乎出現(xiàn)在有關(guān)圖像處理的所有領(lǐng)域,并涉及各種類型的圖像。例如,在遙感應中,合成孔徑雷達圖像中目標的分割;遙感云圖中不同云系和背景分布的分割;在交通圖像分析中,把車輛目標從背景中分割出來。在這些應用中,分割通常是為了進一步對圖像進行分析、識別、壓縮編碼,分割的準確性直接影響后續(xù)任務的有效性。一般來講,分割出的區(qū)域需同時滿足均勻性和連通性的條件。其中均勻性是指在該區(qū)域中的所有象素點都滿足基于灰度、紋理、彩色等特征的某種相似性準則;連通性是指在該區(qū)域內(nèi)存在任意兩點的路徑。盡管圖像處理和機器視覺界的研究者

9、們?yōu)榇烁冻隽碎L期的努力,符合以上兩點的通用性分割仍面臨著巨大的困難;大部分研究成果都是針對某一類型圖像、某一具體應用的分割。可以概括為以下內(nèi)容。2.1數(shù)據(jù)驅(qū)動的分割常見的數(shù)據(jù)驅(qū)動分割包括基于邊緣檢測的分割、基于區(qū)域的分割、邊緣與區(qū)域相結(jié)合的分割等。對于基于邊緣檢測的分割,其基本思想是先檢測圖像中的邊緣點,再按一定策略連接成輪廓,從而構(gòu)成分割區(qū)域。難點在于邊緣檢測時抗噪聲性能和檢測精度的矛盾,若提高檢測精度,則噪聲產(chǎn)生的偽邊緣會導致不合理的輪廓;若提高抗噪聲性能,則會產(chǎn)生輪廓漏檢和位置偏差。為此,人們提出各種多尺度邊緣檢測方法,根據(jù)實際問題設(shè)計多尺度邊緣信息的結(jié)合方案,以較好地兼顧抗噪聲性能和檢

10、測精度?;趨^(qū)域的分割的基本思想是根據(jù)圖像數(shù)據(jù)的特征將圖像空間劃分成不同的區(qū)域。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。方法有閾值法、區(qū)域生長法、聚類法、松弛法等。邊緣檢測能夠獲得灰度或彩色值的局部變化強度,區(qū)域分割能夠檢測特征的相似性與均勻性。將兩者結(jié)合起來,通過邊緣點的限制,避免區(qū)域的過分割;同時通過區(qū)域分割補充漏檢的邊緣,使輪廓更加完整。例如,先進行邊緣檢測與連接,再比較相鄰區(qū)域的特征(灰度均值、方差),若相近則合并;對原始圖像分別進行邊緣檢測和區(qū)域生長,獲得邊緣圖和區(qū)域片段圖后,再按一定的準則融合,得到最終分割結(jié)果。2.2模型驅(qū)動的分割常見的

11、模型驅(qū)動分割包括基于動態(tài)輪廓(Snakes)模型、組合優(yōu)化模型、目標幾何與統(tǒng)計模型。Snakes模型用于描述分割目標的動態(tài)輪廓。由于其能量函數(shù)采用積分運算,具有較好的抗噪聲性,對目標的局部模糊也不敏感,因而適用性很廣。但這種分割方法容易收斂到局部最優(yōu),因此要求初始輪廓應盡可能靠近真實輪廓。近年來對通用分割方法的研究傾向于將分割看作一個組合優(yōu)化問題,并采用一系列優(yōu)化策略完成圖像分割任務。主要思路是在分割定義的約束條件之外,根據(jù)具體任務再定義一個優(yōu)化目標函數(shù),所求分割的解就是該目標函數(shù)在約束條件下的全局最優(yōu)解。以組合優(yōu)化的觀點處理分割問題,主要是利用一個目標函數(shù)綜合表示分割的各種要求和約束,將分割

12、變?yōu)槟繕撕瘮?shù)的優(yōu)化求解。由于目標函數(shù)通常是一個多變量函數(shù),可采用隨機優(yōu)化方法。基于目標幾何與統(tǒng)計模型的分割是將目標分割與識別集成在一起的方法,常稱作目標檢測或提取。基本思想是將有關(guān)目標的幾何與統(tǒng)計知識表示成模型,將分割與識別變?yōu)槠ヅ浠虮O(jiān)督分類。常用的模型有模板、特征矢量模型、基于連接的模型等。這種分割方法能夠同時完成部分或全部識別任務,具有較高的效率。然而由于成像條件變化,實際圖像中的目標往往與模型有一定的區(qū)別,需要面對誤檢與漏檢的矛盾,匹配時的搜索步驟也頗為費時。2.3圖像分割的半自動方法從人工參與程度來看,圖像分割可分為人工、半自動、自動等三種類型。其中人工分割完全由操作者利用鼠標勾畫出分

13、割區(qū)域的輪廓,費時費力,且容易受操作者主觀因素的影響,重復性差。自動分割不需人機交互,但適應性差,很難實現(xiàn)對一批圖像同時獲得滿意的分割效果。半自動分割將人機交互與自動分割相結(jié)合,能夠適應不同的圖像和需求,且有效降低計算復雜度。目前半自動分割中人機交互的方式有:勾畫目標的大致輪廓,構(gòu)成自動分割的初始化;根據(jù)特定的圖像和任務調(diào)整算法參數(shù);在分割過程中加入人工交互節(jié)等??傊?從實用化的角度看,自動分割仍是長期努力的方向。目前更為現(xiàn)實的是在自動分割前或分割過程中加入人機交互的半自動分割。其發(fā)展方向為盡可能少和簡便的人機交互??梢?圖像分割是圖像處理和機器視覺必不可少的重要環(huán)節(jié),也是圖像理論發(fā)展的瓶頸之

14、一。隨著計算機速度與容量的快速進展,圖像處理與機器視覺實用化系統(tǒng)碩果累累。例如,基于內(nèi)容的圖像檢索系統(tǒng)、智能監(jiān)視系統(tǒng)、視覺引導的智能交通系統(tǒng)、手寫體字符/人臉/指紋/虹膜識別系統(tǒng)等。然而有關(guān)的理論研究并沒有取得突破性進展。3視覺技術(shù)的研究人類很多研究都是以延伸人類能力為目的的,早期的工作是在體力上延伸,計算機發(fā)明以來,就拓展到對人類腦力和感知能力的延伸上。對人類視覺感知能力的計算機模擬導致了計算機視覺的產(chǎn)生。計算機視覺也經(jīng)常被稱為圖像理解,是指研究完成一項任務所需的視覺信息及如何從圖像中獲取這些信息的研究領(lǐng)域。其基本目的有三個:(1)根據(jù)一幅或多幅二維投影圖像計算出觀察點到目標物體的距離;(2

15、)根據(jù)一幅或多幅二維投影圖像計算出觀察點到目標物體的運動參數(shù);(3)根據(jù)一幅或多幅二維投影圖像計算出觀察點到目標物體的表面物理特性。要達到的最終目的是實現(xiàn)對于三維景物世界的理解,即實現(xiàn)人的視覺系統(tǒng)的某些功能。也就是利用二維投影圖像來重構(gòu)三維物體的可視部分。3.1計算機視覺研究的對象與方法3.1.1以模型世界為主要對象的視覺基本方法研究這個階段以Roberts的開創(chuàng)性工作為標志。在Roberts的工作中引入了三維物體與二維成像的關(guān)系,采用了一些簡單的邊緣特征提取方法并引入了組合線段的方法。這些早期的工作對視覺的發(fā)展起了促進作用,但對于稍微復雜的景物便難于奏效。為他對三維關(guān)系的分析僅僅是靠簡單的邊

16、緣線段的約束關(guān)系,并沒有充分考慮人類或其他動物視覺系統(tǒng)感知三維空間關(guān)系的方式。3.1.2以計算理論為核心的視覺模型研究20世紀70年代開始,對計算機視覺的研究進入更為理性化的階段,主要集中于各種本征特性的恢復,包括三維形狀、運動、光源等的恢復。主要出發(fā)點是從生理學、光學和射影幾何的方法出發(fā),研究成像及其逆問題。在這一階段中,以Marr為代表的一些研究者提出了以表示為核心、以算法為中間轉(zhuǎn)換過程的一般性視覺處理模型。在其理論中強調(diào)表示的重要性以及從不同層次上去研究信息處理問題,在計算理論和算法實現(xiàn)上又特別強調(diào)計算理論的重要性。在三維信息的感知方面,根據(jù)人類感知深度的不同提出了一系列Shapefro

17、mX的方法。3.2計算機視覺的應用領(lǐng)域計算機視覺的應用領(lǐng)域主要包括對照片、視頻資料如航空照片、衛(wèi)星照片、視頻片段等的解釋、精確制導、移動機器人視覺導航、醫(yī)學輔助診斷、工業(yè)機器人的手眼系統(tǒng)、地圖繪制、物體三維形狀分析與識別及智能人機接口等。早期進行數(shù)字圖像處理的目的之一就是要通過采用數(shù)字技術(shù)提高照片的質(zhì)量,輔助進行航空照片和衛(wèi)星照片的讀取判別與分類。由于需要判讀的照片數(shù)量很多,于是希望有自動的視覺系統(tǒng)進行判讀解釋,在這樣的背景下,產(chǎn)生了許多航空照片和衛(wèi)星照片判讀系統(tǒng)與方法。自動判讀的進一步應用就是直接確定目標的性質(zhì),進行實時的自動分類,并與制導系統(tǒng)相結(jié)合。目前常用的制導方式包括激光制導、電視制導

18、和圖像制導,在導彈系統(tǒng)中常常將慣性制導與圖像制導結(jié)合,利用圖像進行精確的末制導。工業(yè)機器人的手眼系統(tǒng)是計算機視覺應用最為成功的領(lǐng)域之一,由于工業(yè)現(xiàn)場的諸多因素,如光照條件、成像方向均是可控的,因此使得問題大為簡化,有利于構(gòu)成實際的系統(tǒng)。與工業(yè)機器人不同,對于移動機器人而言,由于它具有行為能力,于是就必須解決行為規(guī)劃問題,即是對環(huán)境的了解。隨著移動式機器人的發(fā)展,越來越多地要求提供視覺能力,包括道路跟蹤、回避障礙、特定目標識別等。目前移動機器人視覺系統(tǒng)研究仍處于實驗階段,大多采用遙控和遠視方法。在醫(yī)學上采用的圖像處理技術(shù)大致包括壓縮、存儲、傳輸和自動/輔助分類判讀,此外還可用于醫(yī)生的輔助訓練手段

19、。與計算機視覺相關(guān)的工作包括分類、判讀和快速三維結(jié)構(gòu)的重建等方面。長期以來,地圖繪制是一件耗費人力、物力和時間的工作。以往的做法是人工測量,現(xiàn)在更多的是利用航測加上立體視覺中恢復三維形狀的方法繪制地圖,大大提高了地圖繪制的效率。同時,通用物體三維形狀分析與識別一直是計算機視覺的重要研究目標,并在景物的特征提取、表示、知識的存儲、檢索以及匹配識別等方面都取得了一定的進展,構(gòu)成了一些用于三維景物分析的系統(tǒng)。近年來,基于生物特征(biometrics)的鑒別技術(shù)得到了廣泛重視,主要集中在對人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺信息有關(guān)。與生物特征識別密切相關(guān)的另一個重要應用是用于構(gòu)成智能

20、人機接口?,F(xiàn)在計算機與人的交流還是機械式的,計算機無法識別用戶的真實身份,除鍵盤、鼠標外,其他輸入手段還不成熟。利用計算機視覺技術(shù)可以使計算機檢測到用戶是否存在、鑒別用戶身份、識別用戶的體勢(如點頭、搖頭)。此外,這種人機交互方式還可推廣到一切需要人機交互的場合,如入口安全控制、過境人員的驗放等。4對計算機視覺研究的認識計算機視覺研究經(jīng)歷了近40年的過程,仍面臨許多問題。主要由于這一方向是多學科的交叉與結(jié)合,同時視覺是一個涉及生理、心理的復雜過程,不僅與眼睛有關(guān),還和大腦的推理、學習有關(guān)。研究計算機視覺的目的是要實現(xiàn)對人類視覺的模擬和延伸。對于人類而言,視覺是一個輕而易舉的功能,對機器卻不同。視覺過程很難用類似于問題求解的方法符號化。隨著計算機科學領(lǐng)域中對定量研究的重視,這種狀況會得到改善。在計算機視覺的研究過程中,應考慮將功能模擬與認知模擬相結(jié)合。人類延伸其他能力的過程中,功能模擬起到了主要作用,但視覺是涉及心理和生理兩方面的過程,因此必須在功能模擬的同時重視認知模擬。計算理論的進步與感知手段的改進有助于計算機視覺的研究。在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論