




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1/22 word 計(jì)算機(jī)視覺現(xiàn)狀與應(yīng)用開展研究1.1計(jì)算機(jī)視覺技術(shù)是什么5視覺技術(shù)的原理52/22 word word 3/22摘要計(jì)算機(jī)視覺技術(shù)集數(shù)字圖像處理、數(shù)字信號(hào)處理、光學(xué)、物理學(xué)、幾何學(xué)、應(yīng)用數(shù)學(xué)、模式識(shí)別7XA.工智能等知識(shí)于一體.其應(yīng)用已經(jīng)涉與到計(jì)算幾何、計(jì)算機(jī)圖形學(xué)、圖像處理、機(jī)器人學(xué)等領(lǐng)域。文中簡要地回顧了計(jì)算機(jī)視覺技術(shù)的開展史。利用工業(yè)攝像鏡頭替代目視作為傳感器,通過圖像采集。圖像處理,圖像識(shí)別等一系列操作。達(dá)到在線對(duì)包裝產(chǎn)品進(jìn)展標(biāo)簽檢測的目圖像處理視覺系統(tǒng)圖像識(shí)別檢測標(biāo)簽4/22緒論計(jì)算機(jī)視覺系統(tǒng)一般有光源、攝像機(jī)、采集卡與PC軟件系統(tǒng)等組成,可以完成圖像的采集與處理、目標(biāo)的識(shí)別功能,視覺系統(tǒng)的結(jié)構(gòu)一般是從系統(tǒng)的模計(jì)算機(jī)視覺既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個(gè)富有挑戰(zhàn)性重要研究領(lǐng)域。計(jì)算機(jī)視覺是一門綜合性的學(xué)科,它已經(jīng)吸引了來自各個(gè)學(xué)科的研究者參加到對(duì)它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號(hào)處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。計(jì)算機(jī)視覺學(xué)所研究的對(duì)象,簡單地說就是研究如何讓計(jì)算機(jī)通過圖象傳感器或其它光傳感器來感知、分析和理解周圍環(huán)境。人類感知外界環(huán)境主要通過視覺,聽覺和觸覺等四大感覺系統(tǒng)。其中視覺系統(tǒng)是最復(fù)雜的。人類從外界獲得的信息中視覺信號(hào)量最大。模仿人類的視覺系統(tǒng),計(jì)算機(jī)視覺系統(tǒng)某某息的處理和分析大致可以分成兩解階段又稱視覺處理中的高水平處理階段。在圖象分析和理解階段,計(jì)算機(jī)根據(jù)事先存貯在數(shù)據(jù)庫中的預(yù)知識(shí)模型,識(shí)別出各個(gè)基元或某些基元組合所代表的客觀世界中的某些實(shí)體稱之為模型匹配以與根據(jù)圖象中各基元之間的關(guān)系在預(yù)知識(shí)的指導(dǎo)下得出圖象所代表的實(shí)際景物的含義,得出圖象的解釋或描述。各種實(shí)際可能遇到的物體的知識(shí)模型,和實(shí)際景物中各種物體之間的約束關(guān)系。計(jì)算機(jī)的作用是根據(jù)被分析的圖象中的各基元與其關(guān)系,利用預(yù)知識(shí)作為指導(dǎo),通匹配,搜索和推理等手段,最終得到對(duì)圖象的描述。在整個(gè)過程中預(yù)知識(shí)時(shí)刻提供處理的樣板和證據(jù)。每一步的處理結(jié)果隨時(shí)同預(yù)知識(shí)進(jìn)展比照。有時(shí),處理的中間結(jié)果和最終結(jié)果還要饋送給預(yù)知識(shí)庫作為知識(shí)的更新和積累。5/22 word 第一章概述的學(xué)科。更準(zhǔn)確點(diǎn)說,它是利用攝像機(jī)和電腦代替人眼使得計(jì)算機(jī)擁有類似于人類的那種對(duì)目標(biāo)進(jìn)展分割、分類、識(shí)別、跟蹤、判別決策的功能。計(jì)算機(jī)視覺是使用計(jì)算機(jī)與相關(guān)設(shè)備對(duì)生物視覺的一種模擬,是人工智能領(lǐng)域的一個(gè)重要局部,它的研究目標(biāo)是使計(jì)算機(jī)具有通過二維圖像認(rèn)知三維環(huán)境信息的能力。計(jì)算機(jī)視覺是以圖象處理技術(shù)、信號(hào)處理技術(shù)、概率統(tǒng)計(jì)分析、計(jì)算幾何、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)理論和計(jì)算機(jī)信息處理技術(shù)等為根底,通過計(jì)算機(jī)分析與處理視覺信息。作為一個(gè)新興學(xué)科,計(jì)算機(jī)視覺是通過對(duì)相關(guān)的理論和技術(shù)進(jìn)展研究,從而試圖建立從圖像或多維數(shù)據(jù)中獲取“信息〞的人工智能系統(tǒng)。計(jì)算機(jī)視覺是一門綜合性的學(xué)科,它已經(jīng)吸引了來自各個(gè)學(xué)科的研究者參加到對(duì)它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號(hào)處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。計(jì)算機(jī)視覺也是當(dāng)前計(jì)算機(jī)科學(xué)中統(tǒng)計(jì)推斷,統(tǒng)計(jì)學(xué)習(xí)等學(xué)科密切相關(guān),近年來,與計(jì)算機(jī)圖形學(xué),三維表現(xiàn)等學(xué)科也發(fā)生了很強(qiáng)的聯(lián)系。目前,計(jì)算機(jī)視覺技術(shù)已經(jīng)應(yīng)用在制造業(yè)、工業(yè)檢驗(yàn)、文檔分析、醫(yī)療診計(jì)算機(jī)視覺技術(shù)的原理計(jì)算機(jī)視覺就是用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段,由計(jì)算機(jī)來代替大腦完成處理和解釋。計(jì)算機(jī)視覺的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。要經(jīng)過長期的努力才能達(dá)到的目標(biāo)。因此,在實(shí)現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺系統(tǒng),這個(gè)系統(tǒng)能依據(jù)視覺敏感和反應(yīng)的某種程度的智能完成一定的任務(wù)。例如,計(jì)算機(jī)視覺的一個(gè)重要應(yīng)用領(lǐng)域就是自主車輛的視覺導(dǎo)航,還沒們努力的研究目標(biāo)是實(shí)現(xiàn)在高速公路上具有道路跟蹤能力,可防止與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。這里要指出的一點(diǎn)是在計(jì)算機(jī)視覺系統(tǒng)中計(jì)算機(jī)起6/22 word 代替人腦的作用,但并不意味著計(jì)算機(jī)必須按人類視覺的方法完成視覺信息的處理。計(jì)算機(jī)視覺可以而且應(yīng)該根據(jù)計(jì)算機(jī)系統(tǒng)的特點(diǎn)來進(jìn)展視覺信息的處理。但是,人類視覺系統(tǒng)是迄今為止,人們所知道的功能最強(qiáng)大和完善的視覺系統(tǒng)。如在以下的章節(jié)中會(huì)看到的那樣,對(duì)人類視覺處理機(jī)制的研究將給計(jì)算機(jī)視覺的研究提供啟發(fā)和指導(dǎo)。因此,用計(jì)算機(jī)信息處理的方法研究人類視覺的機(jī)理,建立人類視覺的計(jì)算理論,也是一個(gè)非常重要和信人感興趣的研究領(lǐng)7/22 word 第二章計(jì)算機(jī)視覺技術(shù)的開展展中在二維圖像分析和識(shí)別上,如光學(xué)字符識(shí)別.工件外表、顯微圖片和航空?qǐng)D出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對(duì)物體形狀與物體的智能(AI)實(shí)驗(yàn)室正式開設(shè)“機(jī)器視覺〞(MachineVision)課程,由國際著名學(xué)者走向?qū)嶋H應(yīng)用的開展階段。而計(jì)算機(jī)工業(yè)水平的飛速提高以與人工智能、并行處理和神經(jīng)元網(wǎng)絡(luò)等學(xué)科的開展,更促進(jìn)了計(jì)算機(jī)視覺系統(tǒng)的實(shí)用化和涉足許多復(fù)雜視覺過程的研究。目前,計(jì)算機(jī)視覺技術(shù)正在廣泛的應(yīng)用于計(jì)算幾何、計(jì)算機(jī)圖形學(xué)、圖像處理、機(jī)器人學(xué)等多個(gè)領(lǐng)域中。一臺(tái)計(jì)算機(jī),現(xiàn)在增加到70%。計(jì)算機(jī)視覺(puterv|si0n一)詞最早出現(xiàn)在人工智能X疇的一個(gè)新領(lǐng)域。它也是以圖像處理、模式識(shí)別、計(jì)算機(jī)技術(shù)和生理學(xué)心理學(xué)為根底的信息處理科學(xué)中的一個(gè)重要分支。計(jì)算機(jī)視覺技術(shù)集數(shù)字圖像處理、數(shù)字信號(hào)處理、光學(xué)、物理學(xué)、幾何學(xué)、應(yīng)用數(shù)學(xué)、模式識(shí)別與人工智能等知識(shí)于一體,其應(yīng)用已經(jīng)涉與到計(jì)算幾何、計(jì)算機(jī)圖形學(xué)、圖像處理、機(jī)器人學(xué)等領(lǐng)域。計(jì)算機(jī)視覺既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個(gè)富有戰(zhàn)性重要研究領(lǐng)域。計(jì)算機(jī)視覺研究的目標(biāo)有兩個(gè):一個(gè)是開發(fā)從輸入的圖像數(shù)據(jù)自動(dòng)構(gòu)造場去作人類難以達(dá)到或根本無法達(dá)到的工作。當(dāng)前,計(jì)算機(jī)視覺也是人工智能與機(jī)器人科學(xué)中頗為活躍的和卓有成效的熱門研究課題。視覺理解是計(jì)算機(jī)視覺系統(tǒng)的一個(gè)重要處理環(huán)節(jié),當(dāng)前,具有視黨反應(yīng)功能的機(jī)器人已能代替人完成各種復(fù)雜的任務(wù),如:產(chǎn)品的自動(dòng)裝配、焊接和檢8/22 word 這種賦予機(jī)器以類似人的視覺信息處理能力并為人類自身服務(wù)的美好愿望在一定X圍或特定任務(wù)下已局部地成為現(xiàn)實(shí)。今天,計(jì)算機(jī)視覺的應(yīng)用已滲透到機(jī)器人、天文、地理、醫(yī)學(xué)、化學(xué)、物理等宏觀與微觀世界的各個(gè)研究領(lǐng)域。有人預(yù)言,計(jì)算機(jī)視覺是實(shí)現(xiàn)智能機(jī)器人和第五代計(jì)算機(jī)的關(guān)鍵因素之一。計(jì)算機(jī)視覺是一個(gè)復(fù)雜的處理過程,景物理解與景物分析是其處理要點(diǎn)之一。用機(jī)器實(shí)現(xiàn)景物理解必須將輸入的圖像和預(yù)先存入的有關(guān)物體結(jié)構(gòu)和環(huán)境約束知識(shí)進(jìn)展交互作用,建立明確而有意義的描述理解。這種過程可歸結(jié)為從一幅圖像中提取景物信息,完成某些計(jì)算,在不同階段的理解過程引入相關(guān)的目前,三維物體與景物分析工作的重點(diǎn)在三維物體與自然景物的識(shí)Ⅱ與分析Mart理且要從計(jì)算理論、算法描述與硬件實(shí)現(xiàn)三個(gè)方面去實(shí)現(xiàn)三個(gè)層次的工作。三維點(diǎn)在于把視覺看成一個(gè)過程,它從外部世界的圖像逐步產(chǎn)生對(duì)景物的三個(gè)層次:a)初始簡圖——這是根本意義的灰度變動(dòng)的局部幾何性質(zhì),以線條勾畫出b)二維半簡圖——該圖主要描述物體可視面的外表方向和觀察點(diǎn)到外表的距離}c)三維模型表示——這是物體形狀的全部而清晰的描述。有人認(rèn)為,信息的獲取圖像預(yù)處理、分割、描述、識(shí)別理解等幾步工作。1965年,L.Roberts關(guān)于“三維物體的感知〞一文提出了幾種獲取三維信息的根本方法。這些根本方法至今還被計(jì)算機(jī)視覺研究領(lǐng)域普遍采用。目前,獲取視覺信息的主要方法有主動(dòng)法和被動(dòng)法兩大類,主動(dòng)法需要對(duì)測試物體參加特殊的人造光源其中包括:三角光法、結(jié)構(gòu)光法和飛行時(shí)間法。三角光法類似三角測量法,此法需逐點(diǎn)測量,費(fèi)時(shí)較多。結(jié)構(gòu)光法是把結(jié)構(gòu)的圖像投影到被淵物體外表,由于該物體外表的取向不同,標(biāo)準(zhǔn)圖案會(huì)產(chǎn)生畸變,利用這畸變可算出物體外表的三維坐標(biāo)。標(biāo)準(zhǔn)圖像一般用細(xì)線、方格等。這種方法最早由日本學(xué)者以雷達(dá)原理為根底的方法。這種方法可直接測得物體外表距離而獲得三維信9/22 word 息,它不涉與圖像處理問題。具體實(shí)現(xiàn)可采用激光雷達(dá)或超聲雷達(dá),超聲雷達(dá)的缺點(diǎn)是聚焦比擬困難,但是處理方法比擬簡單。被動(dòng)法是在自然光條件下獲得三維信息的方法。其中包括:體視法、陰影恢復(fù)形狀法、由運(yùn)動(dòng)恢復(fù)形狀法、紋理恢復(fù)形狀和灰度體視法等。體視法與人的視覺原理有許多相似之處,由不同位置上的攝像機(jī)獲取兩幅(或多幅)圖像,根據(jù)三角測量原理,利用立體圖像中的對(duì)應(yīng)點(diǎn)的視差計(jì)算出景物的三維信息。因此,兩幅圖像的匹配是體視法的關(guān)鍵。早期的匹配主要基于區(qū)域的灰度相關(guān)計(jì)算,現(xiàn)代方法如此側(cè)重于特征匹配。因而,只能獲得稀疏的特征信息,要用各種內(nèi)插法獲取整幅圖像的三維信息。體視法表現(xiàn)了Marr教授的理論精髓。形狀分析法是根據(jù)圖像中灰度陰影分布、物體的運(yùn)動(dòng)、紋理結(jié)構(gòu)等信息分析計(jì)算景物的三維信息。運(yùn)動(dòng)序列圖像分析法是依靠物體或攝像機(jī)運(yùn)動(dòng)時(shí)得到多幅序列圖像,通過對(duì)三維運(yùn)動(dòng)參數(shù)的計(jì)算分析獲取三維信息。此方法根本屬于形狀分析法,它在計(jì)算機(jī)視覺研究中較受重視,已成為一個(gè)重要分支??傊?,三維信息獲取是計(jì)算機(jī)視覺研究的根底,也是目前非?;钴S的課題之一。無論在理論上還是實(shí)踐上都有舉足輕重的作用三維信息獲取中的重要環(huán)節(jié)——三維定標(biāo)系統(tǒng)研究也是極受重視的課題。為提高定標(biāo)的精度曾做了大量的研究工作,提出了不少算法。2.2計(jì)算機(jī)視覺現(xiàn)狀計(jì)算機(jī)視覺領(lǐng)域的突出特點(diǎn)是其多樣性與不完善性。這一領(lǐng)域的先驅(qū)可追理諸如圖像這樣的大規(guī)模數(shù)據(jù)時(shí),計(jì)算機(jī)視覺才得到了正式的關(guān)注和開展。然而這些開展往往起源于其他不同領(lǐng)域的需要,因而何謂“計(jì)算機(jī)視覺問題〞始終沒有得到正式定義,很自然地,“計(jì)算機(jī)視覺問題〞應(yīng)當(dāng)被如何解決也沒有成型盡管如此,人們已開始掌握局部解決具體計(jì)算機(jī)視覺任務(wù)的方法,可惜這被廣泛地應(yīng)用于不同場合。對(duì)這些方法的應(yīng)用通常作為某些解決復(fù)雜問題的大規(guī)模系統(tǒng)的一個(gè)組成局多數(shù)實(shí)際應(yīng)用當(dāng)中,計(jì)算機(jī)被預(yù)設(shè)為解決特定的任務(wù),然而基于機(jī)器學(xué)習(xí)的方。10/22 word 人工智能所研究的一個(gè)主要問題是:如何讓系統(tǒng)具備“計(jì)劃〞和“決策能力〞?從而使之完成特定的技術(shù)動(dòng)作〔例如:移動(dòng)一個(gè)機(jī)器人通過某種特定環(huán)境〕。這一問題便與計(jì)算機(jī)視覺問題息息相關(guān)。在這里,計(jì)算機(jī)視覺系統(tǒng)作為一常被看作人工智能與計(jì)算機(jī)科學(xué)的一個(gè)分支。物理是與計(jì)算機(jī)視覺有著重要聯(lián)系的另一領(lǐng)域。計(jì)算機(jī)視覺關(guān)注的目標(biāo)在于充分理解電磁波——主要是可見光與紅外線局部——遇到物體外表被反射所形成的圖像,而這一過程便是基于光學(xué)物理和固態(tài)物理,一些尖端的圖像感知系統(tǒng)甚至?xí)?yīng)用到量子力學(xué)理論,來解析影像所表示的真實(shí)世界。同時(shí),物理學(xué)中的很多測量難題也可以通過計(jì)算機(jī)視覺得到解決,例如流體運(yùn)動(dòng)。也由此,計(jì)算機(jī)視覺同樣可以被看作是物理學(xué)的拓展。另一個(gè)具有重要意義的領(lǐng)域是神經(jīng)生物學(xué),尤其是其中生物視覺系統(tǒng)的局在整個(gè)20世紀(jì)中,人類對(duì)各種動(dòng)物的眼睛、神經(jīng)元、以與與視覺刺激相關(guān)的腦部組織都進(jìn)展了廣泛研究,這些研究得出了一些有關(guān)“天然的〞視覺系統(tǒng)如人們試圖建立人工系統(tǒng),使之在不同的復(fù)雜程度上模擬生物的視覺運(yùn)作。同時(shí)計(jì)算機(jī)視覺領(lǐng)域中,一些基于機(jī)器學(xué)習(xí)的方法也有參考局部生物機(jī)制。計(jì)算機(jī)視覺的另一個(gè)相關(guān)領(lǐng)域是信號(hào)處理。很多有關(guān)單元變量信號(hào)的處理方法,尤其是對(duì)時(shí)變信號(hào)的處理,都可以很自然的被擴(kuò)展為計(jì)算機(jī)視覺中對(duì)二元變量信號(hào)或者多元變量信號(hào)的處理方法。但由于圖像數(shù)據(jù)的特有屬性,很多計(jì)算機(jī)視覺中開展起來的方法,在單元信號(hào)的處理方法中卻找不到對(duì)應(yīng)版本。這類方法的一個(gè)主要特征,便是他們的非線性以與圖像信息的多維性,以上二點(diǎn)作為計(jì)算機(jī)視覺的一局部,在信號(hào)處理學(xué)中形成了一個(gè)特殊的研究方向。除了上面提到的領(lǐng)域,很多研究課題同樣可被當(dāng)作純粹的數(shù)學(xué)問題。例如何使既有方法通過各種軟硬件實(shí)現(xiàn),或說如何對(duì)這些方法加以修改,而使之獲得合理的執(zhí)行速度而又不損失足夠精度,是現(xiàn)今電腦視覺領(lǐng)域的主要課11/22 word 第三章計(jì)算機(jī)視覺技術(shù)的應(yīng)用智能計(jì)算機(jī)不但使計(jì)算機(jī)更便于為人們所使用,同時(shí)如果用這樣的計(jì)算機(jī)來控制各種自動(dòng)化裝置特別是智能機(jī)器人,就可以使這些自動(dòng)化系統(tǒng)和智能機(jī)器人具有適應(yīng)環(huán)境,和自主作出決策的能力。這就可以在各種場合取代人的繁重工作,或代替人到各種危險(xiǎn)和惡劣環(huán)境中完成任務(wù)。應(yīng)用X圍從任務(wù),比如工業(yè)機(jī)器視覺系統(tǒng),比方說,檢查瓶子上的生產(chǎn)線加速通過,研究為人工智能和計(jì)算機(jī)或機(jī)器人,可以理解他們周圍的世界。計(jì)算機(jī)視覺和機(jī)器視覺領(lǐng)域有顯著的重疊。計(jì)算機(jī)視覺涉與的被用于許多領(lǐng)域自動(dòng)化圖像分析的核心技術(shù)。機(jī)器視覺通常指的是結(jié)合自動(dòng)圖像分析與其他方法和技術(shù),以提供自動(dòng)檢測和機(jī)器人指導(dǎo)在工業(yè)應(yīng)用中的一個(gè)過程。在許多計(jì)算機(jī)視覺應(yīng)用中,計(jì)算機(jī)被預(yù)編程,以解決特定的任務(wù),但基于學(xué)習(xí)的方法現(xiàn)在于系統(tǒng):〔1〕控制過程,比其中最突出的應(yīng)用領(lǐng)域是醫(yī)療計(jì)算機(jī)視覺和醫(yī)學(xué)圖像處理。這個(gè)區(qū)域的特征的信息從圖像數(shù)據(jù)中提取用于使患者的醫(yī)療診斷的目的。通常,圖像數(shù)據(jù)是息,可以從這樣的圖像數(shù)據(jù)中提取的一個(gè)例子是檢測的腫瘤,動(dòng)脈粥樣硬化或其他惡性變化。它也可以是器官的尺寸,血流量等。這種應(yīng)用領(lǐng)域還支持通過提供新的信息,醫(yī)學(xué)研究的測量例如,對(duì)腦的結(jié)構(gòu),或約醫(yī)學(xué)治療的質(zhì)量。計(jì)算機(jī)視覺在醫(yī)療領(lǐng)域的應(yīng)用還包括增強(qiáng)是由人類的解釋,例如超聲圖像或X射線圖像,以降低噪聲的影響的圖像。第二個(gè)應(yīng)用程序區(qū)域中的計(jì)算機(jī)視覺是在工業(yè),有時(shí)也被稱為機(jī)器視覺,在那里信息被提取為支撐的制造工序的目的。一個(gè)例子是質(zhì)量控制,其中的信息或最終產(chǎn)品被以找到缺陷自動(dòng)檢測。另一個(gè)例子是,被拾取的位置和細(xì)節(jié)取12/22 word 向測量由機(jī)器人臂。機(jī)器視覺也被大量用于農(nóng)業(yè)的過程,從散裝材料,這個(gè)過程被稱為去除不想要的東西,食物的光學(xué)分揀。軍事上的應(yīng)用很可能是計(jì)算機(jī)視覺最大的地區(qū)之一。最明顯的例子是探測敵方士兵或車輛和導(dǎo)彈制導(dǎo)。更先進(jìn)的系統(tǒng)為導(dǎo)彈制導(dǎo)發(fā)送導(dǎo)彈的區(qū)域,而不是一個(gè)特定的目標(biāo),并且當(dāng)導(dǎo)彈到達(dá)基于本地獲取的圖像數(shù)據(jù)的區(qū)域的目標(biāo)做出選擇?,F(xiàn)代軍事概念,如“戰(zhàn)場感知〞,意味著各種傳感器,包括圖像傳感器,提供了豐富的有關(guān)作戰(zhàn)的場景,可用于支持戰(zhàn)略決策的信息。在這種情況下,數(shù)據(jù)的自動(dòng)處理,用于減少復(fù)雜性和融合來自多個(gè)傳感器的信息,以提高靠性。X同情況下的試驗(yàn)。完全自主的汽車通常使用計(jì)算機(jī)視覺進(jìn)展導(dǎo)航時(shí),即知道它障礙物警報(bào)系統(tǒng)中的汽車,以與用于飛行器的自主著陸系統(tǒng)。數(shù)家汽車制造商已經(jīng)證明了系統(tǒng)的汽車自動(dòng)駕駛,但該技術(shù)還沒有達(dá)到一定的水平,就可以投非接觸測試技術(shù)很多,特別值得一提的是視覺測試技術(shù)。現(xiàn)代視覺理論和技術(shù)的展,不僅在于模擬人眼能完成的功能,更重要的是它能完成人眼所不能勝任的工作,所以視覺技術(shù)作為當(dāng)今最新技術(shù),在電子、光學(xué)和計(jì)算機(jī)等技術(shù)不斷成熟和完門覺測試技術(shù)重點(diǎn)研究物體的幾何尺寸與物體的位置測量,如轎車白車身三維尺寸的開展很快,早在20世紀(jì)80年代,美國國家標(biāo)準(zhǔn)局就預(yù)計(jì),檢測任務(wù)的90%將由視多家公司躋身于視覺測試系統(tǒng)的經(jīng)營市場,可見視覺測試系統(tǒng)確實(shí)很有前途。在1999年10月的國際機(jī)床博覽會(huì)上已見到國外利用視覺檢測技術(shù)研制的儀器,如流動(dòng)式光學(xué)三坐標(biāo)測量機(jī)、高速高精度數(shù)字化掃描系統(tǒng)、非接觸式光學(xué)三坐標(biāo)測量機(jī)等先進(jìn)器。13/22 word 由于計(jì)算機(jī)視覺技術(shù)具有非接觸、獲得信息量大、作用距離遠(yuǎn)等特點(diǎn),特別是隨著計(jì)算機(jī)圖像處理技術(shù)的不斷開展,近幾十年來,它在工業(yè)、農(nóng)業(yè)、科學(xué)研究、軍事等方面都獲得了十分廣泛的應(yīng)用。下面主要介紹一下計(jì)算機(jī)視覺技術(shù)在工業(yè)檢測中的應(yīng)用概況。工業(yè)檢測:圖像識(shí)別技術(shù)在工業(yè)領(lǐng)域的應(yīng)用,主要用于能夠代替人眼的計(jì)算機(jī)系統(tǒng)。在高速、大批量、連續(xù)自動(dòng)化生產(chǎn)流水線,往往需要視覺系統(tǒng)進(jìn)展質(zhì)量檢查、零件辨識(shí)和尺寸測量;實(shí)際上,在興旺國家,幾乎任何產(chǎn)品的生產(chǎn),從半導(dǎo)體芯片到食品飲料,甚至人工鉆石,都越發(fā)依賴視覺系統(tǒng)的應(yīng)用,可以用于基于圖像處理技術(shù)的非接觸精細(xì)測量、產(chǎn)品外表質(zhì)量檢測與監(jiān)控、基于機(jī)器視覺的工業(yè)自動(dòng)化閉環(huán)控制、流水線產(chǎn)品外觀質(zhì)量檢測設(shè)備、復(fù)雜形狀非接觸精細(xì)測量設(shè)備。。石油:巖石圖像分析系統(tǒng),能夠分析含油數(shù)量等信息。通過擬分析,檢測紙幣的質(zhì)量,替代傳統(tǒng)的人眼區(qū)分的方法。交通:汽車車牌識(shí)別、高速公路收費(fèi)、違章闖紅燈檢測、交通管制系統(tǒng)術(shù),對(duì)拍攝的圖片進(jìn)展分析,提取出車牌號(hào),存儲(chǔ)在數(shù)據(jù)庫中,可以供管理人員進(jìn)展以建立商標(biāo)圖像庫,利用圖像檢索技術(shù),對(duì)新申請(qǐng)的商標(biāo)與圖像否設(shè)計(jì)相似或雷同。金相分析:金相圖像分析系統(tǒng)能對(duì)金屬或其它材料的基體組織、雜質(zhì)含量、組織成分等進(jìn)展準(zhǔn)確、客觀地分析,為產(chǎn)品質(zhì)量提供可靠的依據(jù)。瓶裝啤酒生產(chǎn)流水線檢測系統(tǒng):可以檢測啤酒是否達(dá)到標(biāo)準(zhǔn)的容量、啤酒整等。14/22 word 第四章計(jì)算機(jī)視覺技術(shù)的圖像處理方發(fā)計(jì)算機(jī)視覺系統(tǒng)中,視覺信息的處理技術(shù)主要依賴于圖像處理方法,它包括圖像增強(qiáng)、數(shù)據(jù)編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)展分析、處理和識(shí)別。圖像的增強(qiáng)用于調(diào)整圖像的比照度,突出圖像中的重要細(xì)節(jié),改善視覺質(zhì)量。通常采用灰度直方圖修改技術(shù)進(jìn)展圖像增強(qiáng)。圖像的灰度直方圖是表示一幅圖像灰度分布情況的統(tǒng)計(jì)特性圖表,與比照度嚴(yán)密相連。通過灰度直方圖的形狀,能判斷該圖像的清晰度和黑白比照度。如果獲得一幅圖像的直方圖效果不理想,可以通過直方圖均衡化處理技術(shù)作適當(dāng)修改,即把一幅灰度概率分布圖像中的像素灰度作某種映射變換,使它變成一幅具有均勻灰度概率分布的新圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。眾所周知,實(shí)際獲得的陶像在形成、傳輸、接收和處理的過程中,不可防止地存在著外部干擾和內(nèi)部干擾,如光電轉(zhuǎn)換過程中敏感元件靈敏度的不均勻性、數(shù)字化過程的量化噪聲、傳輸過程中的誤差以與人為因素等.均會(huì)使圖像變質(zhì)。因此,去除噪聲,恢復(fù)原始圖像是圖像處理中的一個(gè)重要內(nèi)容。圖像的數(shù)據(jù)編碼和傳輸數(shù)字圖像的數(shù)據(jù)量是相當(dāng)龐大的,一幅512。512個(gè)像素的數(shù)字圖像的數(shù)據(jù)比特/秒。高信道速率意味瞢高投資,也意味著普與難度的增加,因此。傳輸過程中,對(duì)圖像數(shù)據(jù)進(jìn)展壓縮顯得非常重要。數(shù)據(jù)的壓縮主要通過圖像數(shù)據(jù)的編霄和變換壓縮完成。圖像數(shù)據(jù)編碼一般采用預(yù)測編碼.即將圖像數(shù)據(jù)的空間15/22 word 變化規(guī)律和序列變化規(guī)律用一個(gè)預(yù)測公式表示.如果知道了,某一像素的前面各相鄰像素值之后.可以用公式預(yù)測該像素值。該方法可將一幅圖像的數(shù)據(jù)壓縮到為數(shù)不多的幾十個(gè)特傳輸,在接收端再變換回去即可。邊緣銳化圖像邊緣銳化處理主要是加強(qiáng)圖像中的輪廓邊緣和細(xì)節(jié),形成完整的物體邊界.達(dá)到將物體從圖像中別離出來或?qū)⒈硎就晃矬w外表的區(qū)域檢測出來的目的。它是早期視覺理論和算法中的根本問題.也是中期和后期視覺成敗的重圖像分割是將圖像分成假如干局部,每一局部對(duì)應(yīng)于某一物體外表.在進(jìn)展分割時(shí).每一局部的灰度或紋理符合某一種均勻測度度量。某本質(zhì)是將像素進(jìn)展分類。分類的依據(jù)是像素的灰度值、顏色、頻譜特性、空間特性或紋理特性等。圖像分割是圖像處理技術(shù)的根本方法之一,應(yīng)用于諸如染色體分類、景物理解系統(tǒng)、機(jī)器視覺等方面。圖像分割主要有兩種方法:一是鑒于度量宅問的灰度閭值分割法。它是根據(jù)圖像灰度直方圖來決定圖像空間域像素聚類。二是空間域區(qū)域增長分割方法。它是對(duì)在某種意義上(如灰度級(jí)、組織、梯度等)具有相似性質(zhì)的像素連通集構(gòu)成分割區(qū)域,該方法有很好的分割效果,但缺點(diǎn)是運(yùn)算復(fù)雜.處理速度慢。常見的數(shù)據(jù)驅(qū)動(dòng)分割包括基于邊緣檢測的分割、基于區(qū)域的分割、邊緣與區(qū)域相結(jié)合的分割等。對(duì)于基于邊緣檢測的分割,其根本思想是先檢測圖像中的噪性能和檢測精度的矛盾,假如提高檢測精度,如此噪聲產(chǎn)生的偽邊緣會(huì)導(dǎo)致不合理的輪廓;假如提高抗噪聲性能,如此會(huì)產(chǎn)生輪廓漏檢和位置偏差。為此,人們提好地兼顧抗噪聲性能和檢測精度?;趨^(qū)域的分割的根本思想是根據(jù)圖像數(shù)據(jù)的特征將圖像空間劃分成不同換得到的特征。方法有閾值法、區(qū)域生長法、聚類法、松弛法等。16/22 word 邊緣檢測能夠獲得灰度或彩色值的局部變化強(qiáng)度,區(qū)域分割能夠檢測特征的相似性與均勻性。將兩者結(jié)合起來,通過邊緣點(diǎn)的限制,防止區(qū)域的過分割;同時(shí)通過區(qū)域分割補(bǔ)充漏檢的邊緣,使輪廓更加完整。例如,先進(jìn)展邊緣檢測與連接,再比擬相鄰區(qū)域的特征(灰度均值、方差),假如相近如此合并;對(duì)原始圖像分別進(jìn)展邊緣檢測和區(qū)域生長,獲得邊緣圖和區(qū)域片段圖后,再按一定的準(zhǔn)如此融合,得果。采用積分運(yùn)算,具有較好的抗噪聲性,對(duì)目標(biāo)的局部模糊也不敏感,因而適用性很廣。但這種分割方法容易收斂到局部最優(yōu),因此要求初始輪廓應(yīng)盡可能靠近真實(shí)近年來對(duì)通用分割方法的研究傾向于將分割看作一個(gè)組合優(yōu)化問題,并采用一系列優(yōu)化策略完成圖像分割任務(wù)。主要思路是在分割定義的約束條件之外,根據(jù)具體任務(wù)再定義一個(gè)優(yōu)化目標(biāo)函數(shù),所求分割的解就是該目標(biāo)函數(shù)在約束條件下的全局最優(yōu)解。以組合優(yōu)化的觀點(diǎn)處理分割問題,主要是利用一個(gè)目標(biāo)函數(shù)綜合表示分割的各種要求和約束,將分割變?yōu)槟繕?biāo)函數(shù)的優(yōu)化求解。由于目標(biāo)函數(shù)通常是一個(gè)多變量函數(shù),可采用隨機(jī)優(yōu)化方法?;谀繕?biāo)幾何與統(tǒng)計(jì)模型的分割是將目標(biāo)分割與識(shí)別集成在一起的方法,常稱作目標(biāo)檢測或提取。根本思想是將有關(guān)目標(biāo)的幾何與統(tǒng)計(jì)知識(shí)表示成模型,將分割與識(shí)別變?yōu)槠ヅ浠虮O(jiān)視分類。常用的模型有模板、特征矢量模型、基于連接的模型等。這種分割方法能夠同時(shí)完成局部或全部識(shí)別任務(wù),具有較高的效率。然而由于成像條件變化,實(shí)際圖像中的目標(biāo)往往與模型有一定的區(qū)別,需要面中人工分割完全由操作者利用鼠標(biāo)勾畫出分割區(qū)域的輪廓,費(fèi)時(shí)費(fèi)力,且容易受操作者主觀因素的影響,重復(fù)性差。自動(dòng)分割不需人機(jī)交互,但適應(yīng)性差,很難實(shí)現(xiàn)對(duì)一批圖像同時(shí)獲得滿意的分割效果。半自動(dòng)分割將人機(jī)交互與自動(dòng)分割相結(jié)合,能夠適應(yīng)不同的圖像和需求,且有效降低計(jì)算復(fù)雜度。目前半自動(dòng)分割中人機(jī)交互的方式有:勾畫目標(biāo)的大致輪廓,構(gòu)成自動(dòng)分割的初始化;根據(jù)特定的圖像和任務(wù)調(diào)整算法參數(shù);在分割過程中參加人工交互節(jié)等??傊?從實(shí)用化的角度看,自動(dòng)分割仍是長期努力的方向。目前更為現(xiàn)實(shí)的是在自動(dòng)分割前或分割過程中17/22 word 參加人機(jī)交互的半自動(dòng)分割。其開展方向?yàn)楸M可能少和簡便的人機(jī)交互??梢?圖像分割是圖像處理和機(jī)器視覺必不可少的重要環(huán)節(jié),也是圖像理論開展的瓶頸之一。隨著計(jì)算機(jī)速度與容量的快速進(jìn)展,圖像處理與機(jī)器視覺實(shí)用化系統(tǒng)碩果累累。例如,基于內(nèi)容的圖像檢索系統(tǒng)、智能監(jiān)視系統(tǒng)、視覺引導(dǎo)的智能交通系統(tǒng)、手寫體字符/人臉/指紋/虹膜識(shí)別系統(tǒng)等。然而有關(guān)的理論研究并沒有取得圖像的識(shí)別過程實(shí)際上可以看作是一個(gè)標(biāo)記過程,即利用識(shí)別算法來區(qū)分統(tǒng)必須完成的一個(gè)任務(wù)。按照網(wǎng)像識(shí)別從易到難.町分為i類問題?第一類識(shí)別問題中.圖像中的像素表達(dá)了某一物體的某種特定信息。第二類問題中,待識(shí)維圖等.得出被測物體的三維表示。這里存著如何將隱含的三維信息提取出來的問題.當(dāng)是今研究的熱點(diǎn)。目前用于圖像識(shí)別的方法主要分為決策理論和結(jié)構(gòu)方法。決策理論方法的根底是決策函數(shù),利用它對(duì)模式向量進(jìn)展分類識(shí)別.是以定時(shí)描述(如統(tǒng)計(jì)紋理)為根底的:結(jié)構(gòu)方法的核心是將物體分解成』'模式或模式基元,而不同的物體結(jié)構(gòu)有不同的基元串(或稱字符串),通過對(duì)未知物體利用給定的模式基元求出編碼邊界,得到字符串,冉根據(jù)字符串判斷它的屬類。這是一種依賴于符號(hào)描述被測物體之間關(guān)系的方法。視覺技術(shù)的研究多研究都是以延伸人類能力為目的的,早期的工作是在體力上延伸,計(jì)的計(jì)算機(jī)模擬導(dǎo)致了計(jì)算機(jī)視覺的產(chǎn)生。計(jì)算機(jī)視覺也經(jīng)常被稱為圖像理解,是指研究完成一項(xiàng)任務(wù)所需的視覺信息與如何從圖像中獲取這些信息的研究領(lǐng)域。其根本目的有三個(gè):到目標(biāo)物體的距離;點(diǎn)到目標(biāo)物體的運(yùn)動(dòng)參數(shù);(3)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的外表物理特性。要達(dá)到的最終目的是實(shí)現(xiàn)對(duì)于三維景物世界的理解,即實(shí)現(xiàn)人的視覺系統(tǒng)的某些功能。也就是利用二維投影圖像來重構(gòu)三維物體的可視局部。18/22 word 物體與二維成像的關(guān)系,采用了一些簡單的邊緣特征提取方法并引入了組合線段的方法。這些早期的工作對(duì)視覺的開展起了促進(jìn)作用,但對(duì)于稍微復(fù)雜的景物便為他對(duì)三維關(guān)系的分析僅僅是靠簡單的邊緣線段的約束關(guān)系,并沒有充分考慮人類或其他動(dòng)物視覺系統(tǒng)感知三維空間關(guān)系的方式。以計(jì)算理論為核心的視覺模型研究于各種本征特性的恢復(fù),包括三維形狀、運(yùn)動(dòng)、光源等的恢復(fù)。主要出發(fā)點(diǎn)是從生理學(xué)、光學(xué)和射影幾何的方法出發(fā),研究成像與其逆問題。在這一階段中,以Marr為代表的一些研究者提出了以表示為核心、以算法為中間轉(zhuǎn)換過程的一般性視覺處理模型。在其理論中強(qiáng)調(diào)表示的重要性以與從不同層次上去研究信息處理問題,在計(jì)算理論和算法實(shí)現(xiàn)上又特別強(qiáng)調(diào)計(jì)算理論的重要性。在三維信息計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域主要包括對(duì)照片、視頻資料如航空照片、衛(wèi)星照片、視頻片段等的解釋、準(zhǔn)確制導(dǎo)、移動(dòng)機(jī)器人視覺導(dǎo)航、醫(yī)學(xué)輔助診斷、工業(yè)機(jī)器人的手眼系統(tǒng)、地圖繪制、物體三維形狀分析與識(shí)別與智能人機(jī)接口早期進(jìn)展數(shù)字圖像處理的目的之一就是要通過采用數(shù)字技術(shù)提高照片的質(zhì)很多,于是希望有自動(dòng)的視覺系統(tǒng)進(jìn)展判讀解釋,在這樣的背景下,產(chǎn)生了許多航空照片和衛(wèi)星照片判讀系統(tǒng)與方法。自動(dòng)判讀的進(jìn)一步應(yīng)用就是直接確定目標(biāo)激光制導(dǎo)、電視制導(dǎo)和圖像制導(dǎo),在導(dǎo)彈系統(tǒng)中常常將慣性制導(dǎo)與圖像制導(dǎo)結(jié)合,利確的末制導(dǎo)。機(jī)器人的手眼系統(tǒng)是計(jì)算機(jī)視覺應(yīng)用最為成功的領(lǐng)域之一,由于工業(yè)現(xiàn)場的諸多因素,如光照條件、成像方向均是可控的,因此使得問題大為簡化,有利19/22 word 越來越多地要求提供視覺能力,包括道路跟蹤、回避障礙、特定目標(biāo)識(shí)別等。目在醫(yī)學(xué)上采用的圖像處理技術(shù)大致包括壓縮、存儲(chǔ)、傳輸和自動(dòng)/輔助分類判讀,此外還可用于醫(yī)生的輔助訓(xùn)練手段。與計(jì)算機(jī)視覺相關(guān)的工作包括分類、判讀和快速三維結(jié)構(gòu)的重建等方面。長期以來,地圖繪制是一件消耗人力、物力和時(shí)間的工作。以往的做法是人工測量,現(xiàn)在更多的是利用航測加上立體視覺中恢復(fù)三維形狀的方法繪制地圖,大大提高了地圖繪制的效率。同時(shí),通用物體三維形狀分析與識(shí)別一直是計(jì)算機(jī)視覺的重要研究目標(biāo),并在景物的特征提取、表人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺信息有關(guān)。與生物特征識(shí)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)療用品行業(yè)市場準(zhǔn)入政策考核試卷
- 光纜行業(yè)供應(yīng)鏈管理考核試卷
- 成人高等教育材料力學(xué)與工程應(yīng)用考核試卷
- 壓力敏感合成材料制造技術(shù)與應(yīng)用考核試卷
- 機(jī)織服裝國際貿(mào)易法規(guī)與慣例考核試卷
- 數(shù)字內(nèi)容版權(quán)監(jiān)測與維權(quán)策略考核試卷
- 青島沃爾沃購車合同范本
- 中介渠道合作合同范本
- 藝人標(biāo)準(zhǔn)解約合同范本
- 酒店訂制家具合同范本
- GB/T 1346-2024水泥標(biāo)準(zhǔn)稠度用水量、凝結(jié)時(shí)間與安定性檢驗(yàn)方法
- 2025年江蘇信息職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試近5年常考版參考題庫含答案解析
- 易制毒化學(xué)品理論考試試題及答案
- 2024年煙臺(tái)汽車工程職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 2024年江西旅游商貿(mào)職業(yè)學(xué)院高職單招語文歷年參考題庫含答案解析
- IIT臨床醫(yī)學(xué)項(xiàng)目管理
- 藥品網(wǎng)絡(luò)交易服務(wù)三方平臺(tái)質(zhì)量管理體系文件-B2B平臺(tái)(完整版)
- 《森林調(diào)查技術(shù)》課件(上)
- 環(huán)衛(wèi)車輛操作及維護(hù)培訓(xùn)方案
- 醫(yī)療器械質(zhì)量負(fù)責(zé)人崗位職責(zé)
- 湘陰縣易聚餐飲有限公司部門備用金業(yè)務(wù)財(cái)務(wù)融合流程設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論