計算機視覺調(diào)研報告_第1頁
計算機視覺調(diào)研報告_第2頁
計算機視覺調(diào)研報告_第3頁
計算機視覺調(diào)研報告_第4頁
計算機視覺調(diào)研報告_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

計算機視覺調(diào)研匯報摘要:在信息時代高速發(fā)達的今天,計算機視覺作為計算機科學的一種分支,也在人們平常生活中也得到廣泛的應用,給人們的生活帶來許多的便利,增進了科學技術的發(fā)展,本文是重要簡介一下計算機視覺的發(fā)展、在工農(nóng)業(yè)以及其他行業(yè)的應用,還簡要簡介了該技術在今天所面臨的某些問題。關鍵詞:計算機視覺;發(fā)展;應用;面臨的問題;1.概述計算機視覺就是一門研究怎樣使機器學會看的技術,簡言之,就是使用視覺傳感器或者計算機模擬人眼視覺的基本功能,即通過這種技術可以實現(xiàn)對外在世界實際場景的感知、采集、處理以及解釋理解等功能。此類技術的研究初衷是采集、感知有關環(huán)境的圖像,定位、辨識詳細目的,確認有關目的的排列分布組合、構造特點和有關目的間的關系,從而可以對外在世界里的實際場景和目的做出故意義的識別和判斷;并且在今天計算機視覺是人工智能領域最熱門的研究課題之一,它和專家系統(tǒng)、自然語言理解已成為人工智能最活躍的三大領域。盡管它還是一門年輕的學科,還沒有形成完整的理論體系,在諸多方面它處理問題的措施還是一種技巧,但它是實現(xiàn)工業(yè)生產(chǎn)高度自動化、機器人智能化、自主車導航、目的跟蹤,以及多種工業(yè)檢測、醫(yī)療和軍事應用的關鍵內(nèi)容之一,也是實現(xiàn)第五代智能機的關鍵原因之一。因此對于計算機視覺的研究是非常故意義的,成熟的計算機視覺技術對人類的發(fā)展會有相稱大的增進作用。計算機視覺的發(fā)展計算機視覺是在20世紀50年代從記錄模式識別開始的,重要集中在二維圖像分析和識別上。20世紀60年代MIT的Roberts通過計算機程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維構造,并對物體形狀及物體的空間關系進行描述。Roberts的研究工作開創(chuàng)了以理解三維場景為目的的三維計算機視覺的研究。20世紀70年代中期麻省理工學院人工智能試驗室正式開設“計算機視覺”課程,由國際著名學者B.K.P.Horn專家講授。DavidMarr專家于1973年應邀在MIT·AI試驗室領導一種以博士生為主體的研究小組,1977年提出了不一樣于積木世界”分析措施的計算視覺理論該理論,稱為馬爾(Marr)視覺理論,他認為視覺可分為三個階段,第一階段是初期視覺,其目的是抽取觀測者周圍景物表面的物理特性,第二階段是二維半簡圖或本征圖象;是在以觀測者為中心的坐標系中描述表面的多種特性,根據(jù)這些描述可以重建物體邊界、按表而和體積分割景物,但在以觀測者為中心的坐標系中只能得到可見表面的描述,得不到遮擋表面的描述,故稱二維半簡圖;第三階段是三維模ICU、視覺信息處理的最終一種層次,是用二維半簡圖中得到的表面信息建立合用于視覺識別的三維形狀描述,這個描述應當與觀測者的視角無關,也就是在以物體為中心的坐標系中,以多種符號關系和幾何構造描述物體的三維構造和空間關系。該理論在20世紀80年代成為計算機視覺研究領域中的一種十分重要的理論框架。到20世紀80年代中期計算機視覺獲得了蓬勃發(fā)展,新概念、新措施、新理論不停涌現(xiàn)例如,基于感知特證群的物體識別理論框架,積極視覺理論框架,視覺集成理論框架等。并且自80年代以來,計算機視覺的研究已經(jīng)試驗室走向實際應用的發(fā)展階段。而計算機水平的飛速提高以及人工智能、并行處理和神經(jīng)元網(wǎng)絡等學科的發(fā)展,更增進了計算機視覺系統(tǒng)的實用化和涉足許多復雜視覺過程的研究。目前,計算機視覺技術正在廣泛的應用于幾何計算、計算機圖形學、圖像處理、機器人學等多種領域中。計算機視覺的應用在網(wǎng)絡和信息時代非常發(fā)達的今天,計算機技術也在不停的發(fā)展與完善,使得它在人們的現(xiàn)實生活中飾演的角色也越來越多,并且該技術的應用的領域也越來越廣,它所體現(xiàn)出來的價值也越來越高。下面就簡樸的分析該技術在各個方面的應用,在簡介它在各個方面的應用之前簡要的引入某些計算機圖像處理的措施,由于計算機視覺的處理技術重要依賴于圖像的處理措施。3.1計算機視覺圖像處理措施3.1.1圖像變換圖像變換是許多圖像處理與分析技術的基礎,為了有效迅速地對圖像進行處理和分析,常需要將原定義在圖像空間的圖像以某種形式轉換到另某些空間,并運用在這些空間的特有性質以便地進行一定的加工,最終再轉換回圖像空間以得到所需的效果。3.1.2圖像增強圖像增強目的是對圖像進行加工,以得到對詳細應用來說視覺效果更“好”更“有用”的圖像,從主線上說并沒有圖像增強的通用原則,觀測者是某種增強技術優(yōu)劣的最終判斷者,由于視覺檢查和評價是相稱主觀的過程,所謂“好圖像”的定義在比較增強算法性能中實際上是非常多變不定的。3.1.3圖像恢復圖像恢復也稱圖像還原,就是盡量地減少或者清除數(shù)字圖像在獲取過程中的降質,恢復被退化圖像的本來面貌,從而改善圖像質量。3.1.4圖像編碼圖像編碼也稱圖像壓縮,圖像數(shù)據(jù)量是非常巨大,無論傳播或存儲需要對圖像數(shù)據(jù)進行有效的壓縮,壓縮數(shù)據(jù)量的重要措施是肖除冗余數(shù)據(jù),對圖像進行存儲、處理和傳播等之前進行,而在這之后需要將壓縮了的圖像解壓縮以重建原始圖像或其近似圖像。3.1.5圖像邊緣銳化圖像邊緣銳化處王里重要是加強圖像中的輪廓邊緣和細節(jié),形成完整的物體邊界,到達將物體從圖像中分離出來或將表達同一物體表面的區(qū)域檢測出來的目的。3.1.6圖像分割圖像分割是指把一幅圖像提成不一樣的區(qū)域。這些區(qū)域要么對目前的任務故意義,要么有助于闡明它們與實際物體或物體的某些部分之間的對應關系,一般來講,分割出的區(qū)域需同步滿足均勻均勻性和連通性的條件。3.1.7圖像識別圖像識別是運用計算機識別出圖像中的目的分類,用機器智能替代人的智能,目前用于圖像識別的措施重要分為決策理論和構造措施。圖像通過處理后輸出圖像的質量得到相稱程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進行分析、處理和識別。3.2計算機視覺技術在工業(yè)領域的應用研究近年來,伴隨計算機集成制造系統(tǒng)的推廣和應用,計算機視覺的應用已從國防工業(yè)轉向民用工業(yè),并且目前被廣泛應用于電子、汽車、木材、紡織、包裝和航空等工業(yè)領域之中,之因此可以得到廣泛應用,是由于它易于同設計信息和加工控制信息集成,具有不與被檢測表面接觸、檢測速度快、抗干擾能力強等長處;并且它可以保證產(chǎn)品質量,提高生產(chǎn)率,解放人力,減少生成成本。.3.2.1產(chǎn)品形位尺寸檢查計算機視覺在制造業(yè)中一般是檢查產(chǎn)品的尺寸與否在容許的范圍內(nèi)或產(chǎn)品與否有對的形狀。此類檢查措施重要波及到被檢產(chǎn)品二維或三維的幾何特性,例如表面形狀、位置、圓度等特性,也就是空間特性的檢查。3.2.2產(chǎn)品表面質量檢查通過計算機視覺對產(chǎn)品表面凹陷、劃痕、裂紋以及磨損進行檢查或對表面、粗糙度和紋理進行檢測,從而對產(chǎn)品進行有效的評估或分級。3.2.3產(chǎn)品零部件缺失檢測在生產(chǎn)線上,通過計算機視覺能精確地檢查產(chǎn)品與否丟失零部件(螺釘、鉚釘?shù)龋┗驒z查產(chǎn)品與否混有外物、雜質。3.2.4零部件文字標識識別與檢測文字識別技術在工業(yè)自動化生產(chǎn)中有許多成功的應用實例。序列號作為零部件的唯一身份標志,一般打印在電子元器件、集成電路板、大型工件成品的外表面上,由數(shù)字、字母和中文等構成(以數(shù)字和字母居多)。這些字符標號或編碼,如采用人工方式用眼睛對這些字符進行觀測識別,將不能滿足高效率生產(chǎn)自動化的規(guī)定。由于字符在工件上的位置諸多時候都不便于人眼觀測;人眼疲勞原因的作用也會使檢測成果不能從主線上得到保證,有些狀況下甚至不能進行對的識別。3.2.5視覺伺服系統(tǒng)計算機視覺技術應用于機器人領域,為機器人建立視覺系統(tǒng),使得機器人能更靈活、更自主地適應所處的環(huán)境,以滿足柔性生產(chǎn)中自動定位、裝配、搬運和自動焊接的需要。3.3計算機視覺技術在農(nóng)業(yè)領域的應用研究計算機視覺技術在農(nóng)業(yè)上的應用研究,起始于20世紀70年代末期,重要應用于植物種類的鑒別、農(nóng)產(chǎn)品品質檢測與分級等。伴隨計算機軟硬件技術、圖形圖像處理技術的迅猛發(fā)展,它在農(nóng)業(yè)上的應用研究有了較大的突破,在農(nóng)業(yè)領域的生產(chǎn)前、生產(chǎn)中、收獲時和產(chǎn)后的各個環(huán)節(jié)中,均可以運用計算機視覺技術來實現(xiàn)這些農(nóng)業(yè)生產(chǎn)的視覺化。計算機視覺在產(chǎn)前的應用重要是檢查種子質量;在產(chǎn)中的應用包括田間雜草識別、植物生長信息的監(jiān)測、病蟲害的監(jiān)視和營養(yǎng)脅迫診斷等方面;在農(nóng)作物收獲時的應用重要體目前農(nóng)業(yè)機器人的研制與開發(fā)上;在產(chǎn)后的應用包括水果分級和農(nóng)產(chǎn)品的加工等。3.3.1在產(chǎn)前的應用計算機視覺技術在產(chǎn)前的應用重要是檢查農(nóng)作物種子質量,其檢測措施有:凈度圖像分析、種子發(fā)芽圖像分析、品種鑒定的圖像分析和種子活力的漫射光測定。3.3.2在產(chǎn)中的應用雜草的識別是根據(jù)雜草的不一樣的種類可以采用光譜分析法、顏色分析法、紋理分析法或外形分析法,確定農(nóng)產(chǎn)品中雜草密度和種類狀況;運用計算機視覺技術對設施農(nóng)業(yè)中動植物生長進行監(jiān)測,不僅可以檢測設施內(nèi)植物的葉面積、莖桿直徑、葉柄夾角等外部生長參數(shù),還可以根據(jù)果實表面顏色鑒別其成熟度,以及作物缺水缺肥等狀況;3.3.3在產(chǎn)后的應用通過圖像獲取設備獲取農(nóng)產(chǎn)品圖像,對圖像進行去噪、分割處理后,可以從獲取的圖像中得到豐富的參數(shù)和數(shù)據(jù)信息。針對圖像特性參數(shù)與農(nóng)業(yè)產(chǎn)品的外部物理參數(shù)(例如顏色、形狀或大小等)不用人眼依次測定對象便可對其進行質量鑒別、篩選和分類,并且和人工檢查相比具有效率高、識別率高、原則統(tǒng)一的長處,因此計算機視覺技術動植物和農(nóng)產(chǎn)品等生物體的自動化檢測篩選系統(tǒng)中得到廣泛的使用。3.4計算機視覺技術在其他領域的應用研究3.4.1計算機視覺技術在醫(yī)學領域的應用研究X-CT、放射性同位素掃描、B型超聲、核磁共振成像,是現(xiàn)代醫(yī)學的四大成像技術。B超檢測系統(tǒng)通過有規(guī)律的發(fā)射超聲波,接受從人體發(fā)射回來的聲音信號,形成灰度聲圖像線密度值。將計算機視覺技術應用于臨床醫(yī)學,可以精確的診斷出患者的狀況,從而提高精確性,防止誤診等現(xiàn)象。3.4.2計算機視覺技術在公安工作中的應用指紋識別、人像識別是視覺技術應用在公安工作中所獲得的突出成果。將現(xiàn)場搜集到的指紋錄入計算機,提取指紋特性后再和指紋庫里的指紋進行比對,就可以提供破案的線索。指紋識別也可用于出入海關的身份檢查及指紋密碼鎖等方面,指紋印鑒已用于銀行業(yè)。計算機人像組合技術可以根據(jù)目擊者的描述,由計算機用不一樣的人面像部件組合出嫌疑人的人面像協(xié)助破案。在公安刑偵中還應用了模糊圖像復原技術對犯罪現(xiàn)場的模糊圖像進行復原處理。4.對計算機視覺技術發(fā)展的認識與人體視覺系統(tǒng)相比,目前的計算機視覺系統(tǒng)無論從功能上來說還是從可靠性上來說都還很不健全,可以說仍處在很不成熟的階段。原因是計算機視覺系統(tǒng)的研究過程面臨著一系列技術上的難點:1.由于系統(tǒng)內(nèi)部的和外界的多種干擾原因如噪聲,物體表面的光學不均勻性,不理想的照明條件引起的陰影干擾,表面輝點及背干擾等,使得視覺系統(tǒng)中的圖象處理階段就很難得到滿意的和可靠的成果,例如,至今尚無統(tǒng)一的措施來對付雖然是并不復雜的但帶有曲面的物體的圖象,使得處理后能得到完整的輪廓線。真基元的丟失和假基元的增生有時是無法防止的。這就給后階段的分析帶來了很大的困難。當然,運用強的預知識作為指導,可以改善各階段處理的效果,不過這樣做就意味著犧牲系統(tǒng)的通用性;2.計算機視覺系統(tǒng)在分析和理解景物時,必須要在一幅或多幅平面圖象中提取了維特性信息—深度信息或表面傾斜信息。這并不是一件簡樸的事情。應運而生一系列技術,如體視學,從運動圖象重建物體的三維構造,從幾種剪影恢復物體的三維信息等技術都是用來處理這一問題的。不過,上述這些技術都碰到了一種十分棘手的問題,就是怎樣在具有灰度失真,幾何失真(包括透視、旋轉、標尺變換等失真)和干擾的狀況下求取兩幅和多幅圖象之間的對應特性(對應問題有時稱匹配問題或套準問題)。遺憾的是,至今尚無可靠的通用的求取對應特性的措施,尤其在圖間失真和干擾比較嚴重的場所。運用照度學的信息可以從單幅圖象得到深度信息,不過,必須對物體表面的光學特性作出嚴格的均勻性假定,對于照明條件也要作出嚴格的假定。這就同真實世界的狀況相差很遠。在景物分析中除了得到三維信息的困難外,在現(xiàn)實世界里,物體間互相遮擋,物體自身各部位間的遮擋,使得圖象分拆愈加復雜化了。目前對諸如積木世界等簡樸狀況可以通過可見部分的信息有效地借助推理推得被遮擋部分的信息,不過這必須要有足夠的預知識作為指導。一般的遮擋問題尚無有效措施處理。3.預知識的體現(xiàn)、獲取、寄存、更新和檢索是很復雜的。人類的視覺系統(tǒng)具有驚人的分析理解能力。那怕是一種學令前的小朋友,就能從一群人的照片中不費力地找出他所熟識的人來。給一種成人看一張航空攝影照片,雖然他從未去過那個地方,他也能指給你看那一部分是城區(qū),那兒是山脈,那兒是海岸線。人之因此具有高超的視覺分析和理解能力,是同人的大腦中已經(jīng)積累的大量知識有關的。人是怎樣精選、獲取、更新視覺知識,以及怎樣運用這些知識來分析景物的,至今還遠未研究透徹。4.實際工程上的困難。對于一幅經(jīng)典的辨別率為30003000的航空攝影照片,用一種最簡樸的33算子對其進行一次卷積操作,就要進行相稱于次的乘法運算。對于每秒能進行50萬次乘法運算的計算機(速度已屬中等)得花200秒!對一幅或多幅圖象進行處理分析其運算量不知要比這積卷積操作大多少倍,所花的計算時間之長是可想而知的。然而實用的系統(tǒng)必須要實時地進行分析處理。這就迫使圖象系統(tǒng)的設計專家們放棄老式的序貫計算技術而采用并行處理技術。這實際上是以硬件的規(guī)模擴大來換取處理速度的提高。不過硬件的規(guī)模擴大并非無限制的。硬件規(guī)模擴大不僅大大地增長了費用并且增長體積和能量消耗。但在諸多應用場所,留給視覺系統(tǒng)的空間和提供應它的電能都是有限的,如活動的機器人的視覺系統(tǒng)就是那樣。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論