人工智能通識(shí)教程 第2版 課件 第9、10章 機(jī)器人技術(shù)、計(jì)算機(jī)視覺(jué)_第1頁(yè)
人工智能通識(shí)教程 第2版 課件 第9、10章 機(jī)器人技術(shù)、計(jì)算機(jī)視覺(jué)_第2頁(yè)
人工智能通識(shí)教程 第2版 課件 第9、10章 機(jī)器人技術(shù)、計(jì)算機(jī)視覺(jué)_第3頁(yè)
人工智能通識(shí)教程 第2版 課件 第9、10章 機(jī)器人技術(shù)、計(jì)算機(jī)視覺(jué)_第4頁(yè)
人工智能通識(shí)教程 第2版 課件 第9、10章 機(jī)器人技術(shù)、計(jì)算機(jī)視覺(jué)_第5頁(yè)
已閱讀5頁(yè),還剩167頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2版人工智能通識(shí)教程第9章周蘇教授QQ:81505050機(jī)器人技術(shù)導(dǎo)讀案例:劃時(shí)代的阿波羅計(jì)劃從萊特兄弟的第一架飛機(jī)到阿波羅計(jì)劃將人類送上月球并安全返回地球花了50年時(shí)間。同樣,從數(shù)字計(jì)算機(jī)的發(fā)明到深藍(lán)擊敗人類國(guó)際象棋世界冠軍也花了50年。人們意識(shí)到,建立人形機(jī)器人足球隊(duì)需要大致相當(dāng)?shù)臅r(shí)間及很大范圍內(nèi)研究人員的極大努力,這個(gè)目標(biāo)是不能在短期內(nèi)完成的。01什么是包容體系結(jié)構(gòu)02包容體系結(jié)構(gòu)的實(shí)現(xiàn)03機(jī)器感知04機(jī)器人的概念目錄/CONTENTS05機(jī)器人的技術(shù)問(wèn)題機(jī)器人是一種能夠半自主或全自主工作的智能機(jī)器,具有感知、決策、執(zhí)行等基本特征。機(jī)器人能夠通過(guò)編程和自動(dòng)控制來(lái)執(zhí)行諸如作業(yè)或移動(dòng)等任務(wù),可以輔助甚至替代人類完成危險(xiǎn)、繁重、復(fù)雜的工作,提高工作效率與質(zhì)量,服務(wù)人類生活,擴(kuò)大或延伸人的活動(dòng)及能力范圍。第9章機(jī)器人技術(shù)如今,機(jī)器人學(xué)早就超出了科學(xué)幻想的領(lǐng)域,并在工業(yè)自動(dòng)化、醫(yī)療、太空探索等領(lǐng)域發(fā)揮著重要作用。軟件機(jī)器人模擬器不但簡(jiǎn)化了機(jī)器人工程師的開(kāi)發(fā)工作,還為研究人工智能算法和機(jī)器學(xué)習(xí)提供了工具。第9章機(jī)器人技術(shù)PART01什么是包容體系結(jié)構(gòu)在傳統(tǒng)的計(jì)算機(jī)編程中,程序員必須盡力考慮所有可能遇到的情況并一一規(guī)定應(yīng)對(duì)策略。無(wú)論創(chuàng)建何種規(guī)模的程序,一半以上的工作(軟件測(cè)試)都在于找到那些處理錯(cuò)誤的案例,并修改代碼來(lái)糾正它們。9.1什么是包容體系結(jié)構(gòu)幾十年來(lái),人們發(fā)明了許多工具來(lái)使編程更加有效并降低錯(cuò)誤發(fā)生的概率。與1946年計(jì)算機(jī)剛問(wèn)世時(shí)相比,編程無(wú)疑更加高效,但仍避免不了大量錯(cuò)誤的存在。不論使用何種工具,程序員在編寫(xiě)程序時(shí)每百行間還是會(huì)產(chǎn)生數(shù)量大致相同的錯(cuò)誤。這些錯(cuò)誤不僅出現(xiàn)在程序本身及所使用的數(shù)據(jù)中,更存在于任務(wù)的具體規(guī)定中。倘若利用邏輯、規(guī)則和框架編寫(xiě)通用的人工智能程序,那么程序必定十分龐大,并且漏洞百出。9.1什么是包容體系結(jié)構(gòu)1986年,約翰·希爾勒進(jìn)行了一項(xiàng)名為“中文房間”的思維實(shí)驗(yàn),來(lái)證明能夠操控符號(hào)的計(jì)算機(jī)即使模擬得再真實(shí),也根本無(wú)法理解它所處的這個(gè)現(xiàn)實(shí)世界。一位只懂英語(yǔ)的人在一個(gè)房間中,這個(gè)房間除了門(mén)上有一個(gè)小窗口之外,全部都是封閉的。他隨身帶著一本關(guān)于中文翻譯的書(shū)。房間里還有足夠的稿紙、鉛筆和櫥柜。9.1.1所謂“中文房間”寫(xiě)著中文的紙片通過(guò)小窗口被送入房間中,房間中的人可以用他的書(shū)來(lái)翻譯這些文字并用中文回復(fù),他的回答可以是完全正確的。這樣,房間里的人可以讓任何房間外的人以為他會(huì)說(shuō)流利的中文……圖9-5中文房間9.1.1所謂“中文房間”被測(cè)試者代表計(jì)算機(jī),他所經(jīng)歷的也正是計(jì)算機(jī)的工作內(nèi)容,即遵循規(guī)則,操控符號(hào)。所以說(shuō),就算計(jì)算機(jī)技術(shù)無(wú)比先進(jìn),看上去已經(jīng)能用語(yǔ)言自然與人交流,但是它們?nèi)匀粺o(wú)法真正懂得語(yǔ)言本身。中文房間實(shí)驗(yàn)驗(yàn)證的假設(shè)就是看起來(lái)完全智能的計(jì)算機(jī)程序其實(shí)根本不理解自身所處理的各種信息。這個(gè)實(shí)驗(yàn)否定了“圖靈測(cè)試”的可靠性,并且還說(shuō)明了人工智能所能達(dá)到的極限,包括機(jī)器學(xué)習(xí)和潛在的人工智能的可能性。從本質(zhì)上說(shuō),計(jì)算機(jī)永遠(yuǎn)只是被限定在操作字符上,AI最多也只能做到不懂裝懂。9.1.1所謂“中文房間”機(jī)器人這個(gè)詞目前還沒(méi)有被普遍接受的定義。我們可以認(rèn)為一個(gè)機(jī)器人由三個(gè)部分組成:(1)一個(gè)傳感器集合;(2)一個(gè)定義機(jī)器人的行為的程序;(3)一個(gè)傳動(dòng)器和受動(dòng)器集合。9.1.2傳統(tǒng)機(jī)器人學(xué)在傳統(tǒng)的機(jī)器人學(xué)中,機(jī)器人擁有一個(gè)中央“大腦”,負(fù)責(zé)構(gòu)建并維護(hù)環(huán)境“地圖”,然后根據(jù)地圖制定計(jì)劃。首先,機(jī)器人的傳感器(例如接觸傳感器、光線傳感器和超聲波傳感器)從它的環(huán)境中獲得信息。機(jī)器人的大腦將傳感器收集的所有信息組合起來(lái)并更新它的環(huán)境地圖。然后,機(jī)器人決定運(yùn)動(dòng)的路線,它通過(guò)傳動(dòng)器和受動(dòng)器執(zhí)行動(dòng)作。傳動(dòng)器基本上是一些發(fā)動(dòng)機(jī),它們連接到受動(dòng)器,受動(dòng)器包括輪子和機(jī)械臂等,它與機(jī)器人的環(huán)境交互。傳動(dòng)器這個(gè)詞也常常用來(lái)泛指?jìng)鲃?dòng)器或受動(dòng)器。9.1.2傳統(tǒng)機(jī)器人學(xué)簡(jiǎn)單地說(shuō),傳統(tǒng)的機(jī)器人接收來(lái)自傳感器(可能有多個(gè)傳感器)的輸入,組合傳感器信息,更新環(huán)境地圖,根據(jù)它當(dāng)前掌握的環(huán)境視圖制定計(jì)劃,最后執(zhí)行動(dòng)作。但是,這種方法是有問(wèn)題的。問(wèn)題之一是它需要進(jìn)行大量計(jì)算。另外,因?yàn)橥獠凯h(huán)境總是在變化,所以很難讓環(huán)境地圖符合最新情況。一些生物(比如昆蟲(chóng))不掌握外部世界的地圖,甚至沒(méi)有記憶,但是它們卻活得非常自在;模仿它們會(huì)不會(huì)更好呢?這些問(wèn)題引出了一種新型的機(jī)器人學(xué),稱為基于行為的機(jī)器人學(xué)(behavior-basedrobotics,BBR),它在當(dāng)今的機(jī)器人實(shí)驗(yàn)室中占主要地位。9.1.2傳統(tǒng)機(jī)器人學(xué)可以使用包容體系結(jié)構(gòu)來(lái)實(shí)現(xiàn)BBR。希爾勒認(rèn)為,“中文房間”實(shí)驗(yàn)證明了能夠操控符號(hào)的程序不具備自主意識(shí)。自該論斷發(fā)布以來(lái),眾說(shuō)紛紜,各方抨擊和辯護(hù)的聲音不斷。不過(guò),它確實(shí)減緩了純粹基于邏輯的人工智能研究,轉(zhuǎn)而傾向于支持建立擺脫符號(hào)操控的系統(tǒng)。其中一個(gè)極端嘗試就是包容體系結(jié)構(gòu),強(qiáng)調(diào)完全避免符號(hào)的使用,不是用龐大的框架數(shù)據(jù)庫(kù)來(lái)模擬世界,而是關(guān)注直接感受世界。9.1.3建立包容體系結(jié)構(gòu)1986年麻省理工學(xué)院人工智能實(shí)驗(yàn)室的領(lǐng)導(dǎo)者羅德尼·布魯克斯在文章“大象不下棋”中提出了包容體系結(jié)構(gòu):基于行為的機(jī)器人依賴于一組獨(dú)立的簡(jiǎn)單的行為。行為的定義包括觸發(fā)它們的條件(常常是一個(gè)傳感器讀數(shù))和采取的動(dòng)作(常常涉及一個(gè)受動(dòng)器)。一個(gè)行為建立在其他行為之上。當(dāng)兩個(gè)行為發(fā)生沖突時(shí),一個(gè)中央仲裁器決定哪個(gè)行為應(yīng)該優(yōu)先。機(jī)器人的總體行為是突然的,但BBR的效果好于其部分之和,較高層行為包容較低層行為。9.1.3建立包容體系結(jié)構(gòu)包容體系結(jié)構(gòu)不是一個(gè)只關(guān)注隱藏在數(shù)據(jù)中心中的文本的程序,而是實(shí)實(shí)在在的物理機(jī)器人,利用不同設(shè)備(傳感器)來(lái)感知世界,并通過(guò)其他設(shè)備(傳動(dòng)器)來(lái)操控行動(dòng)。羅德尼·布魯克斯曾說(shuō)道:“這個(gè)世界就是描述它自己最好的模型,它總是最新的,它總是包括了需要研究的所有細(xì)節(jié)。訣竅在于正確地、足夠頻繁地感知它。”這就是情境或具身人工智能,也被許多人看做至關(guān)重要的一項(xiàng)創(chuàng)造,因?yàn)樗軌蚪仐夶嫶髷?shù)據(jù)庫(kù)的智能系統(tǒng),而事實(shí)已經(jīng)證明要建立龐大數(shù)據(jù)庫(kù)是非常困難的。9.1.3建立包容體系結(jié)構(gòu)包容體系結(jié)構(gòu)建立在多層獨(dú)立行為模塊的基礎(chǔ)上。每個(gè)行為模塊都是一個(gè)簡(jiǎn)單程序,從傳感器那里接收信息,再將指令傳遞給傳動(dòng)器。層級(jí)更高的行為可以阻止低層行為的運(yùn)作。情境或具身人工智能這兩個(gè)術(shù)語(yǔ)的概念稍有不同。情境人工智能是實(shí)實(shí)在在放置于真實(shí)環(huán)境中的,具身人工智能則擁有物理實(shí)體。前者暗示其本身必須與非理性環(huán)境進(jìn)行交互,后者則是利用非理想的傳感器和傳動(dòng)器完成交互。當(dāng)然在實(shí)際操作中,二者是不可分割的。9.1.3建立包容體系結(jié)構(gòu)PART02包容體系結(jié)構(gòu)的實(shí)現(xiàn)包容體系結(jié)構(gòu)令人信服地解釋了低等動(dòng)物的行為,例如,蟑螂等昆蟲(chóng)和蝸牛等無(wú)脊椎動(dòng)物。利用該結(jié)構(gòu)創(chuàng)建的機(jī)器人編程是固定的。如果想要完成其他任務(wù)則需要再建立一個(gè)新的機(jī)器人。這與人腦運(yùn)作的方式不同,隨著年齡的增長(zhǎng)和閱歷的增加,我們的大腦同樣也在成長(zhǎng)和改變,但并不是所有的動(dòng)物都有像人腦一樣復(fù)雜的大腦。9.2包容體系結(jié)構(gòu)的實(shí)現(xiàn)對(duì)許多機(jī)器人來(lái)說(shuō),這種程度的智能剛好合適。比如,智能真空吸塵器只需要以最有效的方式覆蓋整個(gè)地板面積,而不會(huì)在運(yùn)行過(guò)程中被可能出現(xiàn)的障礙物干擾。在更加智能的機(jī)器人的最底層系統(tǒng)中,包容體系結(jié)構(gòu)同樣適用,即用來(lái)執(zhí)行反射。有物體接近眼睛時(shí)我們會(huì)眨眼,觸碰到扎手的東西時(shí)我們會(huì)快速把手收回來(lái),這兩種行為發(fā)生得太快,根本無(wú)法涉及意識(shí)思考。9.2包容體系結(jié)構(gòu)的實(shí)現(xiàn)事實(shí)上,條件反射不一定關(guān)乎大腦。醫(yī)生輕敲膝蓋,觀察小腿前踢反應(yīng),這時(shí)信號(hào)僅從膝蓋上傳至脊柱再重新傳回肌肉,尤其對(duì)于機(jī)器人而言,如果運(yùn)行太多軟件,思考時(shí)間就會(huì)相對(duì)較長(zhǎng)。編寫(xiě)條件反射程序可以幫助我們創(chuàng)建兼顧環(huán)境和智能的機(jī)器人。

圖9-6五指靈巧手機(jī)器人9.2包容體系結(jié)構(gòu)的實(shí)現(xiàn)這可能為今后繼續(xù)發(fā)展提供了一種新的途徑,因?yàn)榘蒹w系結(jié)構(gòu)已經(jīng)成功再現(xiàn)了昆蟲(chóng)、條件反射等行為,但它還未曾展示出更高水平的邏輯推理能力,無(wú)法處理語(yǔ)言或高水平學(xué)習(xí)等問(wèn)題。無(wú)疑,它是一塊重要的拼圖,但還不能解開(kāi)所有的謎題。9.2包容體系結(jié)構(gòu)的實(shí)現(xiàn)利用包容體系結(jié)構(gòu)技術(shù)創(chuàng)建的第一個(gè)機(jī)器人名叫艾倫,它具備三層行為模塊。最底層模塊通過(guò)聲納探測(cè)物體位置并遠(yuǎn)離物體來(lái)避開(kāi)障礙物。在孤身一人時(shí),它將保持靜止,一旦有物體靠近就立刻跑開(kāi)。物體靠得越近,閃避的推動(dòng)力越大。中間一層對(duì)行為做出了修改,機(jī)器人每十秒會(huì)朝一個(gè)隨機(jī)方向移動(dòng)。最高層利用聲吶找尋遠(yuǎn)離機(jī)器人所處位置的點(diǎn),并調(diào)整路徑朝該點(diǎn)前進(jìn)。作為一個(gè)實(shí)驗(yàn),艾倫成功展示了包容結(jié)構(gòu)技術(shù)。但就機(jī)器人本身來(lái)說(shuō),從一個(gè)地方到另一個(gè)地方漫無(wú)目的的移動(dòng)確實(shí)沒(méi)有什么成就可言。9.2.1艾倫機(jī)器人赫伯特,這是利用包容體系結(jié)構(gòu)創(chuàng)建的第三個(gè)機(jī)器人,它擁有24個(gè)八位微處理器,能夠運(yùn)行40個(gè)獨(dú)立行為。赫伯特在麻省理工學(xué)院人工智能實(shí)驗(yàn)室中漫步,尋找空飲料罐,再將它們統(tǒng)一帶回,理論上供回收利用。實(shí)驗(yàn)室的學(xué)生會(huì)將空罐子丟在地上,罐子的大小形狀全部統(tǒng)一,并且都是豎直放置,這些條件都讓目的易拉罐變得更容易被識(shí)別和收集。。9.2.2赫伯特機(jī)器人赫伯特沒(méi)有存儲(chǔ)器,無(wú)法設(shè)計(jì)在實(shí)驗(yàn)室中行走的路徑。除此之外,它的所有行為都不曾與任何人溝通,全靠從傳感器接收輸入信息再控制傳動(dòng)器作為輸出。例如,當(dāng)它的手臂伸展出去時(shí),手指會(huì)置于易拉罐的兩側(cè),隨即握緊。但這并不是軟件控制的結(jié)果,而是因?yàn)槭种钢g的紅外光束被切斷了。與之類似,由于已經(jīng)抓住了罐子,手臂就將收回。9.2.2赫伯特機(jī)器人與嚴(yán)格執(zhí)行規(guī)則和計(jì)劃的機(jī)器人相比,赫伯特能夠更加靈活地采取應(yīng)對(duì)措施。例如,它正在過(guò)道上向下滾動(dòng),有人遞給它一個(gè)空罐子,它也會(huì)立刻抓住罐子送往回收基地,但這一舉動(dòng)并不會(huì)打擾它的搜尋過(guò)程,它合上手掌是因?yàn)橐呀?jīng)抓住了罐子,它的下一步行動(dòng)就是直接回到基地雨不是繼續(xù)盲目搜索。9.2.2赫伯特機(jī)器人雖然不具備存儲(chǔ)器的機(jī)器人似乎無(wú)法進(jìn)行多項(xiàng)有用的任務(wù),但研究人員正致力于開(kāi)發(fā)解決這類局限的方法。托托機(jī)器人能夠在真實(shí)環(huán)境中漫步并制作地圖,其繪制的地圖不是數(shù)據(jù)結(jié)構(gòu)模式而是一組地標(biāo)。9.2.3托托機(jī)器人地標(biāo)在被發(fā)現(xiàn)后就會(huì)產(chǎn)生相應(yīng)行為,托托可以通過(guò)激活與某地相關(guān)的行為回到該地。這一行為不斷重復(fù),持續(xù)發(fā)送信息激活最接近的其他行為。隨著激活的持續(xù)進(jìn)行,與機(jī)器人當(dāng)前位置相關(guān)的行為遲早會(huì)被激活。最早開(kāi)啟激活的信息將經(jīng)過(guò)次數(shù)最少的地標(biāo)行為到達(dá)目的地,由此選擇最優(yōu)路徑。機(jī)器人將朝著激活信號(hào)來(lái)源的地標(biāo)方向移動(dòng)。在到達(dá)目的地后又將接收到新的激活信號(hào),再繼續(xù)朝著新信號(hào)指示方向前進(jìn)。最終,它將經(jīng)由地標(biāo)間的最短路徑到達(dá)指定位置。9.2.3托托機(jī)器人機(jī)器人判定地標(biāo)的方式與人類不同,人類可能會(huì)將某些辦公室房門(mén)、盆栽植物或是大型打印機(jī)認(rèn)做地標(biāo),而計(jì)算機(jī)則是根據(jù)自身行為進(jìn)行判斷,是否緊鄰走廊、是否靠墻這些都會(huì)成為計(jì)算機(jī)的考慮因素。托托機(jī)器人只能探索一小塊區(qū)域并且根據(jù)指令回到特定位置,而更加復(fù)雜的機(jī)器人則能夠?qū)⒌貥?biāo)與活動(dòng)及事件聯(lián)系起來(lái),并在某些情況下主動(dòng)回到特定位置。太陽(yáng)能機(jī)器人可以確定光線充足的區(qū)域,并在電量低時(shí)回到該區(qū)域。收集易拉罐的機(jī)器人則可以記住學(xué)生們最容易丟罐子的地方。9.2.3托托機(jī)器人PART03機(jī)器感知機(jī)器感知是指能夠使用傳感器所輸入的資料(如照相機(jī)、麥克風(fēng)、聲納以及其他的特殊傳感器)然后推斷世界的狀態(tài)。計(jì)算機(jī)視覺(jué)能夠分析影像輸入,另外還有語(yǔ)音識(shí)別、人臉辨識(shí)和物體辨識(shí)。9.3機(jī)器感知機(jī)器感知是一連串復(fù)雜程序所組成的大規(guī)模信息處理系統(tǒng),信息通常由很多常規(guī)傳感器采集,經(jīng)過(guò)這些程序的處理后,會(huì)得到一些非基本感官能得到的結(jié)果。機(jī)器感知研究如何用機(jī)器或計(jì)算機(jī)模擬、延伸和擴(kuò)展人的感知或認(rèn)知能力,包括:機(jī)器視覺(jué)、機(jī)器聽(tīng)覺(jué)、機(jī)器觸覺(jué)……如:計(jì)算機(jī)視覺(jué)、模式(文字、圖像、聲音等)、識(shí)別、自然語(yǔ)言理解……都是人工智能領(lǐng)域的重要研究?jī)?nèi)容,也是在機(jī)器感知或機(jī)器認(rèn)知方面高智能水平的計(jì)算機(jī)應(yīng)用。9.3機(jī)器感知如果機(jī)器感知技術(shù)將來(lái)能夠得到正確運(yùn)用,智能交通詳細(xì)數(shù)據(jù)采集系統(tǒng)的研發(fā),科學(xué)系統(tǒng)的分析、改造現(xiàn)有的交通管理體系,對(duì)緩解城市交通難題有極大幫助。利用逼真的三維數(shù)字模型展示人口密集的商業(yè)區(qū)、重要文物古跡旅游點(diǎn)等,以不同的觀測(cè)視角,為安全設(shè)施的位置部署,提早預(yù)防和對(duì)突發(fā)事件的及時(shí)處理等情況,為維系社會(huì)公共安全提供保障。9.3機(jī)器感知機(jī)器智能研究如何提高機(jī)器應(yīng)用的智能水平,把機(jī)器用得更聰明。這里,“機(jī)器”主要指計(jì)算機(jī)、自動(dòng)化裝置、通信設(shè)備等。人工智能專家系統(tǒng),就是用計(jì)算機(jī)去模擬、延伸和擴(kuò)展專家的智能,基于專家的知識(shí)和經(jīng)驗(yàn),可以求解專業(yè)性問(wèn)題的、具有人工智能的計(jì)算機(jī)應(yīng)用系統(tǒng)。如:醫(yī)療診斷專家系統(tǒng),故障診斷專家系統(tǒng)等。智能機(jī)器則是研究如何設(shè)計(jì)和制造具有更高智能水平的機(jī)器。特別是,設(shè)計(jì)和制造更聰明的計(jì)算機(jī)?9.3.1機(jī)器智能與智能機(jī)器機(jī)器思維,具體地說(shuō)是計(jì)算機(jī)思維,如專家系統(tǒng)、機(jī)器學(xué)習(xí)、計(jì)算機(jī)下棋、計(jì)算機(jī)作曲、計(jì)算機(jī)繪畫(huà)、計(jì)算機(jī)輔助設(shè)計(jì)、計(jì)算機(jī)證明定理、計(jì)算機(jī)自動(dòng)編程等。思維機(jī)器,或者說(shuō)是會(huì)思維的機(jī)器?,F(xiàn)在的計(jì)算機(jī)是一種不會(huì)思維的機(jī)器。但是,現(xiàn)有的計(jì)算機(jī)可以在人腦的指揮和控制下,輔助人腦進(jìn)行思維活動(dòng)和腦力勞動(dòng),如:醫(yī)療診斷、化學(xué)分析、知識(shí)推理、定理證明、產(chǎn)品設(shè)計(jì)……實(shí)現(xiàn)某些腦力勞動(dòng)自動(dòng)化或半自動(dòng)化。從這種觀點(diǎn)也可以說(shuō),目前的計(jì)算機(jī)具有某些思維能力,只不過(guò)現(xiàn)有電腦的智能水平還不高。所以,需要研究更聰明的、思維能力更強(qiáng)的智能電腦或腦模型。9.3.2機(jī)器思維與思維機(jī)器感知機(jī)器或認(rèn)知機(jī)器,研制具有人工感知或人工認(rèn)知能力的機(jī)器。包括:視覺(jué)機(jī)器、聽(tīng)覺(jué)機(jī)器、觸覺(jué)機(jī)器……如:文字識(shí)別機(jī)、感知機(jī)、認(rèn)知機(jī)、工程感覺(jué)裝置、智能儀表等。9.3.2機(jī)器思維與思維機(jī)器機(jī)器行為或計(jì)算機(jī)行為研究如何用機(jī)器去模擬、延伸、擴(kuò)展人的智能行為,如:自然語(yǔ)言生成用計(jì)算機(jī)等模擬人說(shuō)話的行為;機(jī)器人行動(dòng)規(guī)劃模擬人的動(dòng)作行為;倒立擺智能控制模擬雜技演員的平衡控制行為;機(jī)器人的協(xié)調(diào)控制模擬人的運(yùn)動(dòng)協(xié)調(diào)控制行為;工業(yè)窯爐的智能模糊控制模擬窯爐工人的生產(chǎn)控制操作行為;軋鋼機(jī)的神經(jīng)網(wǎng)絡(luò)控制模擬操作工人對(duì)軋鋼機(jī)的控制行為……9.3.3機(jī)器行為與行為機(jī)器行為機(jī)器指具有人工智能行為的機(jī)器,或者說(shuō),能模擬、延伸與擴(kuò)展人的智能行為的機(jī)器。例如:智能機(jī)械手、機(jī)器人、操作機(jī);自然語(yǔ)言生成器;智能控制器,如專家控制器、神經(jīng)控制器、模糊控制器……這些智能機(jī)器或智能控制器,具有類似于人的智能行為的某些特性,如自適應(yīng)、自學(xué)習(xí)、自組織、自協(xié)調(diào)、自尋優(yōu)……因而,能夠適應(yīng)工作環(huán)境的條件的變化,通過(guò)學(xué)習(xí)改進(jìn)性能,根據(jù)需求改變結(jié)構(gòu),相互配合、協(xié)同工作,自行尋找最優(yōu)工作狀態(tài)。9.3.3機(jī)器行為與行為機(jī)器PART04機(jī)器人的概念機(jī)器人是“自動(dòng)執(zhí)行工作的機(jī)器裝置”,是高級(jí)整合控制論、機(jī)械電子、計(jì)算機(jī)、材料和仿生學(xué)的產(chǎn)物,在工業(yè)、醫(yī)學(xué)、農(nóng)業(yè)、建筑業(yè)甚至軍事等領(lǐng)域中均有重要用途。它既可以接受人類指揮,又可以運(yùn)行預(yù)先編排的程序,也可以根據(jù)以人工智能技術(shù)制定的原則綱領(lǐng)行動(dòng)。機(jī)器人的任務(wù)是協(xié)助或取代人類工作的工作,例如生產(chǎn)業(yè)、建筑業(yè)或是危險(xiǎn)的工作。9.4機(jī)器人的概念隨著工業(yè)自動(dòng)化和計(jì)算機(jī)技術(shù)的發(fā)展,機(jī)器人開(kāi)始進(jìn)入大量生產(chǎn)和實(shí)際應(yīng)用階段。爾后由于自動(dòng)裝備海洋開(kāi)發(fā)空間探索等實(shí)際問(wèn)題的需要,對(duì)機(jī)器人的智能水平提出了更高的要求。特別是危險(xiǎn)環(huán)境,人們難以勝任的場(chǎng)合更迫切需要機(jī)器人,從而推動(dòng)了智能機(jī)器人的研究。9.4機(jī)器人的概念機(jī)器人的發(fā)展歷史要比人們想象的更豐富、更悠久。歷史上最早的機(jī)器人例如隋煬帝命工匠按照柳抃形象所營(yíng)造的木偶機(jī)器人,施有機(jī)關(guān),有坐、起、拜、伏等能力。也許第一個(gè)被人們接受的機(jī)械代表作是1574年制造的斯特拉斯堡鑄鐵公雞。每天中午它會(huì)張開(kāi)喙,伸出舌頭,拍打翅膀,展開(kāi)羽毛,抬起頭并啼鳴3次。這只公雞一直服務(wù)到1789年。在20世紀(jì),人們建造了許多成功的機(jī)器人系統(tǒng)。20世紀(jì)80年代,在工廠和工業(yè)環(huán)境中,機(jī)器人開(kāi)始變得司空見(jiàn)慣。9.4.1機(jī)器人的發(fā)展控制論領(lǐng)域被視為人工智能的早期先驅(qū),是在生物和人造系統(tǒng)中對(duì)通信和控制過(guò)程進(jìn)行研究和比較。麻省理工學(xué)院的諾伯特·維納為定義這個(gè)領(lǐng)域做出了貢獻(xiàn),并進(jìn)行了開(kāi)創(chuàng)性的研究。這個(gè)領(lǐng)域?qū)?lái)自神經(jīng)科學(xué)和生物學(xué)與來(lái)自工程學(xué)的理論和原理結(jié)合起來(lái),目的是在動(dòng)物和機(jī)器中找到共同的屬性和原理。馬特里指出:“控制論的一個(gè)關(guān)鍵概念側(cè)重于機(jī)械或有機(jī)體與環(huán)境之間的耦合、結(jié)合和相互作用?!边@種相互作用相當(dāng)復(fù)雜。她將機(jī)器人定義為:“存在于物質(zhì)世界中的自治系統(tǒng),可以感知其環(huán)境,并可以采取行動(dòng),實(shí)現(xiàn)一些目標(biāo)”。9.4.1機(jī)器人的發(fā)展1949年,為了模仿自然生命,英國(guó)科學(xué)家格雷·沃爾特設(shè)計(jì)制作了一對(duì)名叫埃爾默和埃莉斯的機(jī)器人,因?yàn)樗麄兊耐庑魏鸵苿?dòng)速度都類似于自然界的爬行龜,也稱為機(jī)器龜。這是公認(rèn)最早的真正意義上的移動(dòng)式機(jī)器人。9.4.1機(jī)器人的發(fā)展沃爾特機(jī)器人與之前的機(jī)器人不同,它們以不可預(yù)知的方式行事,能夠做出反應(yīng),在其環(huán)境中能夠避免重復(fù)的行為?!盀觚敗庇?個(gè)輪子和一個(gè)硬塑料外殼組成。兩個(gè)輪子用于前進(jìn)和后退,而第三個(gè)輪子用于轉(zhuǎn)向。它的“感官”非常簡(jiǎn)單,僅由一個(gè)可以感受到光的光電池和作為觸摸傳感器的表面電觸點(diǎn)組成。光電池提供了電源,外殼提供了一定程度的保護(hù),可防止物理?yè)p壞。有了這些簡(jiǎn)單的組件和其他幾個(gè)組件,沃爾特的“能夠思維的機(jī)器”能夠表現(xiàn)出如下的行為:找光;朝著光前進(jìn);遠(yuǎn)離明亮的光;轉(zhuǎn)動(dòng)和前進(jìn)以避免障礙;給電池充電。9.4.1機(jī)器人的發(fā)展自機(jī)器人誕生之日起,人們就不斷地嘗試著說(shuō)明到底什么是機(jī)器人。隨著機(jī)器人技術(shù)的飛速發(fā)展,機(jī)器人所涵蓋的內(nèi)容越來(lái)越豐富。從應(yīng)用環(huán)境出發(fā),機(jī)器人專家將機(jī)器人分為兩大類,即制造環(huán)境下的工業(yè)機(jī)器人和非制造環(huán)境下的服務(wù)與仿人型機(jī)器人(特種機(jī)器人)。所謂工業(yè)機(jī)器人就是面向工業(yè)領(lǐng)域的多關(guān)節(jié)機(jī)械手或多自由度機(jī)器人,而特種機(jī)器人則是除工業(yè)機(jī)器人之外的、用于非制造業(yè)并服務(wù)于人類的各種先進(jìn)機(jī)器人。9.4.1機(jī)器人的發(fā)展國(guó)際上對(duì)機(jī)器人的概念已經(jīng)逐漸趨近一致。一般來(lái)說(shuō),人們都可以接受這種說(shuō)法,即機(jī)器人是靠自身動(dòng)力和控制能力來(lái)實(shí)現(xiàn)各種功能的一種機(jī)器。聯(lián)合國(guó)標(biāo)準(zhǔn)化組織采納了美國(guó)機(jī)器人協(xié)會(huì)給機(jī)器人下的定義:“一種可編程和多功能的操作機(jī);或是為了執(zhí)行不同的任務(wù)而具有可用電腦改變和可編程動(dòng)作的專門(mén)系統(tǒng)?!?.4.2機(jī)器人“三原則”中國(guó)科學(xué)家對(duì)機(jī)器人的定義是:“機(jī)器人是一種自動(dòng)化的機(jī)器,所不同的是這種機(jī)器具備一些與人或生物相似的智能能力,如感知能力、規(guī)劃能力、動(dòng)作能力和協(xié)同能力,是一種具有高度靈活性的自動(dòng)化機(jī)器。”在研究和開(kāi)發(fā)未知及不確定環(huán)境下作業(yè)的機(jī)器人的過(guò)程中,人們逐步認(rèn)識(shí)到機(jī)器人技術(shù)的本質(zhì)是感知、決策、行動(dòng)和交互技術(shù)的結(jié)合。9.4.2機(jī)器人“三原則”機(jī)器人學(xué)的研究推動(dòng)了許多人工智能思想的發(fā)展,有一些技術(shù)可在人工智能研究中用來(lái)建立世界狀態(tài)的模型和描述世界狀態(tài)變化的過(guò)程。關(guān)于機(jī)器人動(dòng)作規(guī)劃生成和規(guī)劃監(jiān)督執(zhí)行等問(wèn)題的研究,推動(dòng)了規(guī)劃方法的發(fā)展。此外,由于機(jī)器人是一個(gè)綜合性的課題,除機(jī)械手和步行機(jī)構(gòu)外,還要研究機(jī)器視覺(jué)、觸覺(jué)、聽(tīng)覺(jué)等信感技術(shù)以及機(jī)器人語(yǔ)言和智能控制軟件等??梢钥闯鲞@是一個(gè)設(shè)計(jì)精密機(jī)械信息傳感技術(shù)、人工智能方法、智能控制以及生物工程等學(xué)科的綜合技術(shù),這一研究有利于促進(jìn)各學(xué)科的相互結(jié)合,并大大推動(dòng)人工智能技術(shù)的發(fā)展。9.4.2機(jī)器人“三原則”為了防止機(jī)器人傷害人類,1942年,科幻小說(shuō)家艾薩克·阿西莫夫在小說(shuō)《鋼洞》中提出了“機(jī)器人三原則”:(1)機(jī)器人不得傷害人類,不得看到人類受到傷害而袖手旁觀。(2)機(jī)器人必須服從人類給予的命令,除非這種命令與第一原則相沖突。(3)只要與第一或第二原則沒(méi)有沖突,機(jī)器人就必須保護(hù)自己的生存。這是給機(jī)器人賦予的倫理性綱領(lǐng)。幾十年過(guò)去了,機(jī)器人學(xué)術(shù)界一直將這三條原則作為機(jī)器人開(kāi)發(fā)的準(zhǔn)則。9.4.2機(jī)器人“三原則”P(pán)ART05機(jī)器人的技術(shù)問(wèn)題開(kāi)發(fā)機(jī)器人涉及的技術(shù)問(wèn)題極其紛雜,在某種程度上,這取決于人們實(shí)現(xiàn)精致復(fù)雜的機(jī)器人功能的雄心。從本質(zhì)上講,機(jī)器人方面的工作是問(wèn)題求解的綜合形式。機(jī)器人的早期歷史著重于運(yùn)動(dòng)和視覺(jué)(稱為機(jī)器視覺(jué))。計(jì)算幾何和規(guī)劃問(wèn)題是與其緊密結(jié)合的學(xué)科。在過(guò)去幾十年中,隨著如語(yǔ)言學(xué)、神經(jīng)網(wǎng)絡(luò)和模糊邏輯等領(lǐng)域成為機(jī)器人技術(shù)的研究與進(jìn)步的一個(gè)不可分割的部分,機(jī)器人學(xué)習(xí)的可能性變得更加現(xiàn)實(shí)。9.5機(jī)器人的技術(shù)問(wèn)題在1967年日本召開(kāi)的第一屆機(jī)器人學(xué)術(shù)會(huì)議上,就提出了兩個(gè)有代表性的定義。一是森政弘與合田周平提出的:“機(jī)器人是一種具有移動(dòng)性、個(gè)體性、智能性、通用性、半機(jī)械半人性、自動(dòng)性、奴隸性等7個(gè)特征的柔性機(jī)器”。從這一定義出發(fā),森政弘又提出了用自動(dòng)性、智能性、個(gè)體性、半機(jī)械半人性、作業(yè)性、通用性、信息性、柔性、有限性、移動(dòng)性等10個(gè)特性來(lái)表示機(jī)器人的形象。9.5.1機(jī)器人的組成另一個(gè)是加藤一郎提出的具有如下3個(gè)條件的機(jī)器稱為機(jī)器人:(1)具有腦、手、腳等三要素的個(gè)體;(2)具有非接觸傳感器(用眼、耳接受遠(yuǎn)方信息)和接觸傳感器;(3)具有平衡覺(jué)和固有覺(jué)的傳感器。9.5.1機(jī)器人的組成可以說(shuō)機(jī)器人就是具有生物功能的實(shí)際空間運(yùn)行工具,可以代替人類完成一些危險(xiǎn)或難以進(jìn)行的勞作、任務(wù)等。機(jī)器人能力的評(píng)價(jià)標(biāo)準(zhǔn)包括:智能,指感覺(jué)和感知,包括記憶、運(yùn)算、比較、鑒別、判斷、決策、學(xué)習(xí)和邏輯推理等;機(jī)能,指變通性、通用性或空間占有性等;物理能,指力、速度、可靠性、聯(lián)用性和壽命等。9.5.1機(jī)器人的組成機(jī)器人一般由執(zhí)行機(jī)構(gòu)、驅(qū)動(dòng)裝置、檢測(cè)裝置和控制系統(tǒng)和復(fù)雜機(jī)械等組成。圖9-9機(jī)器人的結(jié)構(gòu)9.5.1機(jī)器人的組成(1)執(zhí)行機(jī)構(gòu)。即機(jī)器人本體,其臂部一般采用空間開(kāi)鏈連桿機(jī)構(gòu),其中的運(yùn)動(dòng)副(轉(zhuǎn)動(dòng)副或移動(dòng)副)常稱為關(guān)節(jié),關(guān)節(jié)個(gè)數(shù)通常即為機(jī)器人的自由度數(shù)。根據(jù)關(guān)節(jié)配置型式和運(yùn)動(dòng)坐標(biāo)形式的不同,機(jī)器人執(zhí)行機(jī)構(gòu)可分為直角坐標(biāo)式、圓柱坐標(biāo)式、極坐標(biāo)式和關(guān)節(jié)坐標(biāo)式等類型。出于擬人化的考慮,常將機(jī)器人本體的有關(guān)部位分別稱為基座、腰部、臂部、腕部、手部(夾持器或末端執(zhí)行器)和行走部(對(duì)于移動(dòng)機(jī)器人)等。9.5.1機(jī)器人的組成(2)驅(qū)動(dòng)裝置。是驅(qū)使執(zhí)行機(jī)構(gòu)運(yùn)動(dòng)的機(jī)構(gòu),按照控制系統(tǒng)發(fā)出的指令信號(hào),借助于動(dòng)力元件使機(jī)器人進(jìn)行動(dòng)作。它輸入的是電信號(hào),輸出的是線、角位移量。機(jī)器人使用的驅(qū)動(dòng)裝置主要是電力驅(qū)動(dòng)裝置,如步進(jìn)電機(jī)、伺服電機(jī)等,此外也有采用液壓、氣動(dòng)等驅(qū)動(dòng)裝置。9.5.1機(jī)器人的組成(3)檢測(cè)裝置。是實(shí)時(shí)檢測(cè)機(jī)器人的運(yùn)動(dòng)及工作情況,根據(jù)需要反饋給控制系統(tǒng),與設(shè)定信息進(jìn)行比較后,對(duì)執(zhí)行機(jī)構(gòu)進(jìn)行調(diào)整,以保證機(jī)器人的動(dòng)作符合預(yù)定的要求。作為檢測(cè)裝置的傳感器大致可以分為兩類:一類是內(nèi)部信息傳感器,用于檢測(cè)機(jī)器人各部分的內(nèi)部狀況,如各關(guān)節(jié)的位置、速度、加速度等,并將所測(cè)得的信息作為反饋信號(hào)送至控制器,形成閉環(huán)控制。9.5.1機(jī)器人的組成一類是外部信息傳感器,用于獲取有關(guān)機(jī)器人的作業(yè)對(duì)象及外界環(huán)境等方面的信息,以使機(jī)器人的動(dòng)作能適應(yīng)外界情況的變化,使之達(dá)到更高層次的自動(dòng)化,甚至使機(jī)器人具有某種“感覺(jué)”,向智能化發(fā)展,例如視覺(jué)、聲覺(jué)等外部傳感器給出工作對(duì)象、工作環(huán)境的有關(guān)信息,利用這些信息構(gòu)成一個(gè)大的反饋回路,從而將大大提高機(jī)器人的工作精度。9.5.1機(jī)器人的組成(4)控制系統(tǒng)。一種是集中式控制,即機(jī)器人的全部控制由一臺(tái)微型計(jì)算機(jī)完成。另一種是分散(級(jí))式控制,即采用多臺(tái)微機(jī)來(lái)分擔(dān)機(jī)器人的控制,如當(dāng)采用上、下兩級(jí)微機(jī)共同完成機(jī)器人的控制時(shí),主機(jī)常用于負(fù)責(zé)系統(tǒng)的管理、通訊、運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)計(jì)算,并向下級(jí)微機(jī)發(fā)送指令信息;作為下級(jí)從機(jī),各關(guān)節(jié)分別對(duì)應(yīng)一個(gè)CPU,進(jìn)行插補(bǔ)運(yùn)算和伺服控制處理,實(shí)現(xiàn)給定的運(yùn)動(dòng),并向主機(jī)反饋信息。根據(jù)作業(yè)任務(wù)要求的不同,機(jī)器人的控制方式又可分為點(diǎn)位控制、連續(xù)軌跡控制和力(力矩)控制。9.5.1機(jī)器人的組成值得注意的是,機(jī)器人電力供應(yīng)與人類之間存在一些重要的類比。人類需要食物和水來(lái)為身體運(yùn)動(dòng)和大腦功能提供能量。目前,機(jī)器人的大腦并不發(fā)達(dá),因此需要?jiǎng)恿ΓㄍǔS呻姵靥峁┻M(jìn)行運(yùn)動(dòng)和操作。現(xiàn)在思考,當(dāng)“電源”快沒(méi)電了(即當(dāng)我們餓了或需要休息時(shí))會(huì)發(fā)生什么。我們不能做出好的決定,犯錯(cuò)誤,表現(xiàn)得很差或很奇怪。機(jī)器人也會(huì)發(fā)生同樣的事情。因此,它們的供電必須是獨(dú)立的,受保護(hù)和有效的,并且應(yīng)該可以平穩(wěn)降級(jí)。也就是說(shuō),機(jī)器人應(yīng)該能夠自主地補(bǔ)充自己的電源,而不會(huì)完全崩潰。9.5.1機(jī)器人的組成末端執(zhí)行器使機(jī)器人身上的任何設(shè)備可以對(duì)環(huán)境做出反應(yīng)。在機(jī)器人世界中,它們可能是手臂、腿或輪子,即可以對(duì)環(huán)境產(chǎn)生影響的任何機(jī)器人組件。驅(qū)動(dòng)器是一種機(jī)械裝置,允許末端執(zhí)行器執(zhí)行其任務(wù)。驅(qū)動(dòng)器可以包括電動(dòng)機(jī)、液壓或氣動(dòng)缸以及溫度敏感或化學(xué)敏感的材料。這樣的執(zhí)行器可以用于激活輪子、手臂、夾子、腿和其他效應(yīng)器。驅(qū)動(dòng)器可以是無(wú)源的,也可以是有源的。雖然所有執(zhí)行器都需要能量,但是有些可能是無(wú)源的需要直接的動(dòng)力來(lái)操作,而其他可能是無(wú)源的使用物理運(yùn)動(dòng)規(guī)律來(lái)保存能量。9.5.1機(jī)器人的組成最常見(jiàn)的執(zhí)行器是電動(dòng)機(jī),但也可以是使用流體壓力的液壓、使用空氣壓力的氣動(dòng)、光反應(yīng)性材料(對(duì)光做出響應(yīng))、化學(xué)反應(yīng)性材料、熱反應(yīng)性材料或壓電材料(通常為晶體,按下或彈起時(shí)產(chǎn)生電荷的材料。9.5.1機(jī)器人的組成運(yùn)動(dòng)學(xué)是關(guān)于機(jī)械系統(tǒng)運(yùn)行的最基礎(chǔ)研究。在移動(dòng)機(jī)器人領(lǐng)域,這是一種自下而上的技術(shù),涉及物理、力學(xué)、軟件和控制領(lǐng)域。像這樣的情況,這種機(jī)器人技術(shù)每時(shí)每刻都需要軟件來(lái)控制硬件,因此這種系統(tǒng)很快就變得相當(dāng)復(fù)雜。無(wú)論你是想讓機(jī)器人踢足球,還是登上月球,或是在海面下工作,最根本的問(wèn)題都是運(yùn)動(dòng)。機(jī)器人如何移動(dòng)?它的功能是什么?9.5.2機(jī)器人的運(yùn)動(dòng)典型的執(zhí)行器是:·輪子用于滾動(dòng)。·腿可以走路、爬行、跑步、爬坡和跳躍?!な直塾糜谧ノ?、搖擺和攀爬?!こ岚蛴糜陲w行?!つ_蹼用于游泳。9.5.2機(jī)器人的運(yùn)動(dòng)在機(jī)器人領(lǐng)域中,一個(gè)常見(jiàn)的概念是物體運(yùn)動(dòng)度,這是表達(dá)機(jī)器人可用的各種運(yùn)動(dòng)類型的方法。例如,考慮直升機(jī)的運(yùn)動(dòng)自由度(稱為平移自由度)。一般來(lái)說(shuō),有6個(gè)自由度(DOF)可以描述直升機(jī)可能的原地轉(zhuǎn)圈、俯仰和偏航運(yùn)動(dòng)。圖9-10一架直升機(jī)及其自由度9.5.2機(jī)器人的運(yùn)動(dòng)原地轉(zhuǎn)圈意味著從一側(cè)轉(zhuǎn)到另一側(cè),俯仰意味著向上或向下傾斜,偏航意味著左轉(zhuǎn)或右轉(zhuǎn)。像汽車(chē)(或直升機(jī)在地面上)一樣的物體只有3個(gè)自由度(DOF)(沒(méi)有垂直運(yùn)動(dòng)),但是只有兩個(gè)自由度可控。也就是說(shuō),地面上的汽車(chē)通過(guò)車(chē)輪只能前后移動(dòng),并通過(guò)其方向盤(pán)向左或向右轉(zhuǎn)。如果一輛汽車(chē)可以直接向左或向右移動(dòng)(比如說(shuō)使其每個(gè)車(chē)輪轉(zhuǎn)動(dòng)90°),那么這將增加另一個(gè)自由度。9.5.2機(jī)器人的運(yùn)動(dòng)由于機(jī)器人運(yùn)動(dòng)更加復(fù)雜,例如手臂或腿試圖在不同方向上移動(dòng)(如在人類的手臂中有肌腱套),因此自由度的數(shù)量是個(gè)重要問(wèn)題。一旦開(kāi)始考慮運(yùn)動(dòng),就必須考慮穩(wěn)定性。對(duì)于人和機(jī)器人還有重心的概念,這是我們走路地面上方的一個(gè)點(diǎn),它使我們?cè)谧呗返牡孛嫔戏侥軌虮3制胶狻V匦奶鸵馕吨覀冊(cè)诘孛嫔贤闲星斑M(jìn),重心太高則意味著不穩(wěn)定。與這個(gè)概念緊密聯(lián)系的是支持多邊形的概念。這是支持機(jī)器人加強(qiáng)穩(wěn)定性平臺(tái)。9.5.2機(jī)器人的運(yùn)動(dòng)人類也有這樣的支持平臺(tái),只是我們通常沒(méi)有意識(shí)到,它就在我們軀干中的某個(gè)位置。對(duì)于機(jī)器人,當(dāng)它有更多的腿時(shí),也就是有3條、4條或6條腿時(shí),問(wèn)題通常不大。9.5.2機(jī)器人的運(yùn)動(dòng)三大機(jī)器人系統(tǒng)大狗、亞美尼亞和Cog,每個(gè)項(xiàng)目都代表了20世紀(jì)晚期以來(lái),科學(xué)家數(shù)十年來(lái)的重大努力。每個(gè)項(xiàng)目都解決了在機(jī)器人技術(shù)領(lǐng)域出現(xiàn)的復(fù)雜而細(xì)致的技術(shù)問(wèn)題。大狗主要關(guān)注運(yùn)動(dòng)和重載運(yùn)輸,特別用于軍事領(lǐng)域;亞美尼亞展現(xiàn)了運(yùn)動(dòng)的各個(gè)方面,強(qiáng)調(diào)了人類元素,即了解人類如何移動(dòng);Cog更多的是思考,這種思考區(qū)分了人類與其他生物,被視為人類所特有的。圖9-11機(jī)器人大狗9.5.3機(jī)器人大狗1992年馬克·雷伯特與他人一起創(chuàng)辦了創(chuàng)立波士頓動(dòng)力學(xué)工程公司,他首先開(kāi)發(fā)了全球第一個(gè)能自我平衡的跳躍機(jī)器人,之后公司獲得了美國(guó)國(guó)防部的合作,國(guó)防部投資幾千萬(wàn)元用于機(jī)器人的研究,雖然當(dāng)時(shí)美國(guó)國(guó)防部還想不出這些機(jī)器人你能干什么,但是認(rèn)為這個(gè)技術(shù)未來(lái)是有用的。這也印證了商業(yè)模式是做出來(lái)的道理。當(dāng)時(shí),很多機(jī)器人行走緩慢,平衡很差,雷伯特模仿生物學(xué)運(yùn)動(dòng)原理,使機(jī)器保持動(dòng)態(tài)穩(wěn)定。與真的動(dòng)物一樣,雷伯特機(jī)器人移動(dòng)迅速且平穩(wěn)。9.5.3機(jī)器人大狗2005年,波士頓動(dòng)力公司的專家創(chuàng)造了四腿機(jī)器人大狗。這個(gè)項(xiàng)目是由美國(guó)國(guó)防高級(jí)研究計(jì)劃局資助的,源自國(guó)防部為軍隊(duì)開(kāi)發(fā)新技術(shù)的任務(wù)。2012年,大狗機(jī)器人升級(jí),可跟隨主人行進(jìn)20英里。2015年,美軍開(kāi)始測(cè)試這種具有高機(jī)動(dòng)能力的四足仿生機(jī)器人的試驗(yàn)場(chǎng),開(kāi)始試驗(yàn)這款機(jī)器人與士兵協(xié)同作戰(zhàn)的性能?!按蠊贰睓C(jī)器人的動(dòng)力來(lái)自一部帶有液壓系統(tǒng)的汽油發(fā)動(dòng)機(jī),它的四條腿完全模仿動(dòng)物的四肢設(shè)計(jì),內(nèi)部安裝有特制的減震裝置。機(jī)器人的長(zhǎng)度為1米,高70厘米,重量為75千克,從外形上看,它基本上相當(dāng)于一條真正的大狗。9.5.3機(jī)器人大狗“大狗”機(jī)器人的內(nèi)部安裝有一臺(tái)計(jì)算機(jī),可根據(jù)環(huán)境的變化調(diào)整行進(jìn)姿態(tài)。而大量的傳感器則能夠保障操作人員實(shí)時(shí)地跟蹤“大狗”的位置并監(jiān)測(cè)其系統(tǒng)狀況。這種機(jī)器人的行進(jìn)速度可達(dá)到7千米/小時(shí),能夠攀越35度的斜坡。它可攜帶重量超過(guò)150千克的武器和其他物資?!按蠊贰奔纯梢宰孕醒刂A(yù)先設(shè)定的簡(jiǎn)單路線行進(jìn),也可以進(jìn)行遠(yuǎn)程控制。9.5.3機(jī)器人大狗第2版人工智能通識(shí)教程第10章周蘇教授QQ:81505050計(jì)算機(jī)視覺(jué)導(dǎo)讀案例:谷歌大腦的誕生谷歌大腦是“GoogleX實(shí)驗(yàn)室”的一個(gè)研究項(xiàng)目,是谷歌在人工智能領(lǐng)域開(kāi)發(fā)出的一款模擬人腦的軟件,這個(gè)軟件具備自我學(xué)習(xí)功能。GoogleX部門(mén)的科學(xué)家們通過(guò)將1.6萬(wàn)臺(tái)電腦的處理器相連接建造出了這個(gè)全球?yàn)閿?shù)不多的最大中樞網(wǎng)絡(luò)系統(tǒng)。谷歌的一個(gè)研究團(tuán)隊(duì)發(fā)布了有史以來(lái)最高分辨率的動(dòng)物大腦連接圖——半腦連接組,這是重建的首個(gè)突觸級(jí)連接組。該模型追蹤了果蠅大腦中約25000個(gè)神經(jīng)元的2000萬(wàn)個(gè)突觸,它們可以被分成數(shù)千種不同的細(xì)胞類型,橫跨大腦的幾個(gè)區(qū)域。01模式識(shí)別02圖像識(shí)別03計(jì)算機(jī)視覺(jué)技術(shù)04智能圖像處理技術(shù)目錄/CONTENTS05計(jì)算機(jī)視覺(jué)典型功能06計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用計(jì)算機(jī)視覺(jué)是一門(mén)研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說(shuō),就是指用攝影機(jī)、照相機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等的機(jī)器的視覺(jué),并進(jìn)一步做圖形處理,使之成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像。第10章計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取“信息”的人工智能系統(tǒng)。這里所指的信息,是指可以用來(lái)幫助做“決定”的內(nèi)容。因?yàn)楦兄梢钥醋魇菑母泄傩盘?hào)中提取信息,所以計(jì)算機(jī)視覺(jué)也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中“感知”的科學(xué)。第10章計(jì)算機(jī)視覺(jué)PART01模式識(shí)別模式識(shí)別原本是人類的一項(xiàng)基本智能,是指對(duì)表征事物或現(xiàn)象的不同形式(數(shù)值、文字和邏輯關(guān)系)的信息做分析和處理,從而得到一個(gè)對(duì)事物或現(xiàn)象做出描述、辨認(rèn)和分類等的過(guò)程。隨著計(jì)算機(jī)技術(shù)發(fā)展和人工智能的興起,人類自身的模式識(shí)別已經(jīng)滿足不了社會(huì)發(fā)展的需要,于是就希望用計(jì)算機(jī)來(lái)代替或擴(kuò)展人類的部分腦力勞動(dòng)。這樣,模擬人類圖像識(shí)別過(guò)程(圖10-3)的計(jì)算機(jī)圖像識(shí)別技術(shù)就產(chǎn)生了。模式識(shí)別與數(shù)學(xué)關(guān)系緊密,其思想方法與概率統(tǒng)計(jì)、心理學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、生物學(xué)、控制論等學(xué)科都有關(guān)系。10.1模式識(shí)別

圖10-3模式識(shí)別過(guò)程10.1模式識(shí)別模式識(shí)別的內(nèi)容包括文字識(shí)別、圖像識(shí)別、語(yǔ)音識(shí)別和生物識(shí)別等。從處理問(wèn)題的性質(zhì)和解決問(wèn)題的方法等角度來(lái)看,模式識(shí)別可分為抽象和具體兩種形式。前者如意識(shí)、思想、議論等,屬于概念識(shí)別研究的范疇。而這里所指的模式識(shí)別主要是對(duì)語(yǔ)音波形、地震波、心電圖、腦電圖、圖片、照片、文字、符號(hào)、生物傳感器等對(duì)象的具體模式進(jìn)行辨識(shí)。要實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)必須有圖像處理的幫助,而圖像處理依賴于模式識(shí)別過(guò)程的有效運(yùn)用。10.1模式識(shí)別模式識(shí)別研究主要集中在兩方面,一是研究生物體(包括人)是如何感知對(duì)象的,屬于認(rèn)識(shí)科學(xué)的范疇,二是在給定的任務(wù)下,如何用計(jì)算機(jī)實(shí)現(xiàn)模式識(shí)別的理論和方法。應(yīng)用計(jì)算機(jī)對(duì)一組事件或過(guò)程進(jìn)行辨識(shí)和分類,所識(shí)別的事件或過(guò)程可以是文字、聲音、圖像等具體對(duì)象,也可以是狀態(tài)、程度等抽象對(duì)象。這些對(duì)象與數(shù)字形式的信息相區(qū)別,稱為模式信息。10.1模式識(shí)別PART02圖像識(shí)別圖像識(shí)別,是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)象,它是深度學(xué)習(xí)算法的一種應(yīng)用實(shí)踐。圖像識(shí)別技術(shù)一般分為人臉識(shí)別與商品識(shí)別,人臉識(shí)別主要用在安全檢查、身份核驗(yàn)與移動(dòng)支付中;商品識(shí)別主要用在商品流通過(guò)程中,特別是無(wú)人貨架、智能零售等無(wú)人零售領(lǐng)域。另外,在地理學(xué)中,圖像識(shí)別也指將遙感圖像進(jìn)行分類的技術(shù)。圖像識(shí)別的方法主要有三種:統(tǒng)計(jì)模式識(shí)別、結(jié)構(gòu)模式識(shí)別和模糊模式識(shí)別。10.2圖像識(shí)別人類擁有記憶和“高明”的識(shí)別系統(tǒng),比如告訴你面前的一只動(dòng)物是“貓”,以后你再看到貓,一樣可以認(rèn)出來(lái)。圖形刺激作用于感覺(jué)器官,人們辨認(rèn)出它是以前見(jiàn)過(guò)的某一圖形的過(guò)程,叫圖像再認(rèn)。在圖像識(shí)別中,既要有當(dāng)時(shí)進(jìn)入感官的信息,也要有記憶中存儲(chǔ)的信息。只有通過(guò)存儲(chǔ)的信息與當(dāng)前的信息進(jìn)行比較的加工過(guò)程,才能實(shí)現(xiàn)對(duì)圖像的再認(rèn)。10.2.1人類的圖像識(shí)別能力人的圖像識(shí)別能力是很強(qiáng)的。圖像距離的改變或圖像在感覺(jué)器官上作用位置的改變,都會(huì)造成圖像在視網(wǎng)膜上的大小和形狀的改變。即使在這種情況下,人們?nèi)匀豢梢哉J(rèn)出他們過(guò)去知覺(jué)過(guò)的圖像。甚至圖像識(shí)別可以不受感覺(jué)通道的限制。例如,人可以用眼看字,當(dāng)別人在他背上寫(xiě)字時(shí),他也可以認(rèn)出這個(gè)字來(lái)。10.2.1人類的圖像識(shí)別能力人類是通過(guò)眼睛接收到光源反射,“看”到自己眼前的事物,但是很多內(nèi)容元素人們可能并不在乎;就像曾經(jīng)與你擦肩而過(guò)的一個(gè)人,如果你再次看到并不一定會(huì)記得他。然而,人工智能會(huì)記住它見(jiàn)過(guò)的任何人、任何事物。例如人類覺(jué)得很簡(jiǎn)單的黃黑相間條紋,如果問(wèn)問(wèn)人工智能系統(tǒng),它給出的答案也許是“99%的概率是校車(chē)”。對(duì)于圖10-4,人工智能系統(tǒng)雖不能看出這是一條戴著墨西哥帽的吉娃娃狗,但起碼能識(shí)別出這是一條戴著寬邊帽的狗。

圖10-4識(shí)別戴著墨西哥帽的吉娃娃狗10.2.1人類的圖像識(shí)別能力懷俄明大學(xué)進(jìn)化人工智能實(shí)驗(yàn)室的一項(xiàng)研究表明,人工智能未必總是那么靈光,也會(huì)把這些隨機(jī)生成的簡(jiǎn)單圖像當(dāng)成了鸚鵡、乒乓球拍或者蝴蝶。當(dāng)研究人員把這個(gè)研究結(jié)果提交給神經(jīng)信息處理系統(tǒng)大會(huì)討論時(shí),專家形成了涇渭分明的兩派意見(jiàn)。一組人領(lǐng)域經(jīng)驗(yàn)豐富,他們認(rèn)為這個(gè)結(jié)果是完全可以理解的;另一組人則對(duì)研究結(jié)果感到困惑,至少在一開(kāi)始對(duì)強(qiáng)大的人工智能算法卻把結(jié)果完全弄錯(cuò)感到驚訝。10.2.1人類的圖像識(shí)別能力圖像識(shí)別以圖像的主要特征為基礎(chǔ)。每個(gè)圖像都有它的特征,如字母A有個(gè)尖,P有個(gè)圈、而Y的中心有個(gè)銳角等。對(duì)圖像識(shí)別時(shí)眼動(dòng)的研究表明,人們的視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且,眼睛的掃描路線也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。由此可見(jiàn),在圖像識(shí)別過(guò)程中,知覺(jué)機(jī)制必須排除輸入的多余信息,抽出關(guān)鍵信息。同時(shí),在大腦里必定有一個(gè)負(fù)責(zé)整合信息的機(jī)制,它能把分階段獲得的信息整理成一個(gè)完整的知覺(jué)映像。10.2.2圖像識(shí)別的基礎(chǔ)人類對(duì)復(fù)雜圖像的識(shí)別往往要通過(guò)不同層次的信息加工才能實(shí)現(xiàn)。對(duì)于熟悉的圖形,由于掌握了它的主要特征,會(huì)把它當(dāng)作一個(gè)單元來(lái)識(shí)別,而不再注意它的細(xì)節(jié)。這種由孤立單元材料組成的整體單位叫做組塊,每一個(gè)組塊是同時(shí)被感知的。在文字材料的識(shí)別中,人們不僅可以把一個(gè)漢字的筆劃或偏旁等單元組成一個(gè)組塊,而且能把經(jīng)常在一起出現(xiàn)的字或詞組成組塊單位來(lái)加以識(shí)別。10.2.2圖像識(shí)別的基礎(chǔ)事實(shí)上,基于計(jì)算機(jī)視覺(jué)的圖像檢索也可以分為類似文本搜索引擎的三個(gè)步驟:提取特征、建立索引以及查詢。在計(jì)算機(jī)視覺(jué)識(shí)別系統(tǒng)中,圖像內(nèi)容通常用圖像特征進(jìn)行描述。舉例:圖片線條特征提取后高層特征的逐層構(gòu)建,其中展示了不同層提取到了不同的特征。第一層是一些簡(jiǎn)單的線條顏色等(圖10-5)。10.2.2圖像識(shí)別的基礎(chǔ)

圖10-5圖像特征提取的第1層和3層10.2.2圖像識(shí)別的基礎(chǔ)第二層是不同線條組成的簡(jiǎn)單形狀。第三層是簡(jiǎn)單形狀組成的簡(jiǎn)單圖案。第四層是在第三層基礎(chǔ)上面構(gòu)建了部分狗臉的輪廓等更復(fù)雜的特征(圖10-6)。第五層是又增加了部分復(fù)雜性的輪廓,比如人臉等。10.2.2圖像識(shí)別的基礎(chǔ)圖10-6圖像特征提取的第4層和第5層10.2.2圖像識(shí)別的基礎(chǔ)為了編制模擬人類圖像識(shí)別活動(dòng)的計(jì)算機(jī)程序,人們提出了不同的圖像識(shí)別模型。例如,模板匹配模型認(rèn)為,識(shí)別某個(gè)圖像,過(guò)去的經(jīng)驗(yàn)中有這個(gè)圖像的記憶模式,叫做模板。當(dāng)前的刺激如果與大腦中的某個(gè)模板相匹配,這個(gè)圖像就被識(shí)別了。事實(shí)上人不僅能識(shí)別與腦中的模板完全一致的圖像,也能識(shí)別與模板不完全一致的圖像。例如,人們不僅能識(shí)別某一個(gè)具體的字母A,也能識(shí)別印刷體的、手寫(xiě)體的、方向不正、大小不同的各種字母A。同時(shí),人能識(shí)別的圖像是大量的,如果所識(shí)別的每一個(gè)圖像在腦中都有一個(gè)相應(yīng)的模板,這是不可能的。10.2.3圖形識(shí)別的模型為了解決模板匹配模型存在的問(wèn)題,格式塔心理學(xué)家又提出了一個(gè)原型匹配模型。這種模型認(rèn)為,在長(zhǎng)時(shí)記憶中存儲(chǔ)的并不是所要識(shí)別的無(wú)數(shù)個(gè)模板,而是圖像的某些“相似性”。從圖像中抽象出來(lái)的“相似性”作為原型,拿它來(lái)檢驗(yàn)所要識(shí)別的圖像。如果找到一個(gè)相似的原型,這個(gè)圖像就被識(shí)別了。這種模型從神經(jīng)上和記憶探尋的過(guò)程來(lái)看,都比模板匹配模型更適宜,而且還能說(shuō)明對(duì)一些不規(guī)則的,但某些方面與原型相似的圖像的識(shí)別。10.2.3圖形識(shí)別的模型但是,這種模型沒(méi)有說(shuō)明人是怎樣對(duì)相似的刺激進(jìn)行辨別和加工的,它也難以在計(jì)算機(jī)程序中得到實(shí)現(xiàn)。因此又有人提出了一個(gè)更復(fù)雜的模型——“泛魔”識(shí)別模型,又稱“萬(wàn)鬼堂”,它是一種具體的特征分析模型:第一層:印象鬼,對(duì)外部刺激編碼形成刺激映像;第二層:特征鬼,進(jìn)行特征分解;第三層:認(rèn)知鬼,監(jiān)視特征鬼的反應(yīng),綜合各種特征并作出反應(yīng);第四層:決策鬼,根據(jù)認(rèn)知鬼的反應(yīng)做出決策,識(shí)別模式。10.2.3圖形識(shí)別的模型在一般工業(yè)使用中,采用工業(yè)相機(jī)拍攝圖片,然后利用軟件根據(jù)圖片灰階差做處理后識(shí)別出有用信息。10.2.3圖形識(shí)別的模型圖像識(shí)別的發(fā)展經(jīng)歷了三個(gè)階段:文字識(shí)別:研究開(kāi)始于1950年。一般是識(shí)別字母、數(shù)字和符號(hào),從印刷文字識(shí)別到手寫(xiě)文字識(shí)別,應(yīng)用非常廣泛。數(shù)字圖像處理和識(shí)別:研究開(kāi)始于1965年。數(shù)字圖像與模擬圖像相比具有存儲(chǔ)和傳輸方便、可壓縮、傳輸過(guò)程中不易失真、處理方便等巨大優(yōu)勢(shì),為圖像識(shí)別技術(shù)的發(fā)展提供了強(qiáng)大動(dòng)力。物體識(shí)別:主要是指對(duì)三維世界的客體及環(huán)境的感知和認(rèn)識(shí),屬于高級(jí)計(jì)算機(jī)視覺(jué)范疇。它是以數(shù)字圖像處理與識(shí)別為基礎(chǔ),結(jié)合了多學(xué)科的研究方向,其研究成果被廣泛應(yīng)用在各種工業(yè)及機(jī)器人探測(cè)上。10.2.3圖形識(shí)別的模型神經(jīng)網(wǎng)絡(luò)圖像識(shí)別技術(shù)是在傳統(tǒng)的圖像識(shí)別方法基礎(chǔ)上了融合神經(jīng)網(wǎng)絡(luò)算法的一種圖像識(shí)別方法。在神經(jīng)網(wǎng)絡(luò)圖像識(shí)別技術(shù)中,遺傳算法與BP(backpropagation,反向傳播)網(wǎng)絡(luò)相融合的神經(jīng)網(wǎng)絡(luò)圖像識(shí)別模型非常經(jīng)典,在很多領(lǐng)域都有它的應(yīng)用。BP網(wǎng)絡(luò)是1986年由科學(xué)家魯梅爾哈特和麥克萊蘭提出的概念,是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)。在圖像識(shí)別系統(tǒng)中利用神經(jīng)網(wǎng)絡(luò)系統(tǒng),一般會(huì)先提取圖像的特征,再利用圖像所具有的特征映射到神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像識(shí)別分類。10.2.4神經(jīng)網(wǎng)絡(luò)圖像識(shí)別以汽車(chē)拍照自動(dòng)識(shí)別技術(shù)為例,當(dāng)汽車(chē)通過(guò)的時(shí)候,汽車(chē)自身具有的檢測(cè)設(shè)備會(huì)有所感應(yīng)。此時(shí)檢測(cè)設(shè)備就會(huì)啟用圖像采集裝置來(lái)獲取汽車(chē)正反面的圖像。獲取圖像后上傳到計(jì)算機(jī)進(jìn)行保存以便識(shí)別。車(chē)牌定位模塊提取車(chē)牌信息,對(duì)車(chē)牌上的字符進(jìn)行識(shí)別并顯示最終的結(jié)果。在對(duì)車(chē)牌上的字符進(jìn)行識(shí)別時(shí)就用到了基于模板匹配算法和基于人工神經(jīng)網(wǎng)絡(luò)算法。10.2.4神經(jīng)網(wǎng)絡(luò)圖像識(shí)別PART03計(jì)算機(jī)視覺(jué)技術(shù)計(jì)算機(jī)視覺(jué)技術(shù)是計(jì)算機(jī)模擬人類的視覺(jué)過(guò)程,具有感受環(huán)境的能力和人類視覺(jué)功能的技術(shù)。圖像處理、人工智能和模式識(shí)別等技術(shù)的綜合。10.3計(jì)算機(jī)視覺(jué)技術(shù)機(jī)器視覺(jué)是人工智能領(lǐng)域中發(fā)展迅速的一個(gè)重要分支,正處于不斷突破、走向成熟的階段。一般認(rèn)為,機(jī)器視覺(jué)“是通過(guò)光學(xué)裝置和非接觸傳感器自動(dòng)地接受和處理一個(gè)真實(shí)場(chǎng)景的圖像,通過(guò)分析圖像獲得所需信息或用于控制機(jī)器運(yùn)動(dòng)的裝置”。10.3.1什么是機(jī)器視覺(jué)具有智能圖像處理功能的機(jī)器視覺(jué),相當(dāng)于人們?cè)谫x予機(jī)器智能的同時(shí)為機(jī)器按上了眼睛,使機(jī)器能夠“看得見(jiàn)”“看得準(zhǔn)”,可替代甚至勝過(guò)人眼做測(cè)量和判斷,使得機(jī)器視覺(jué)系統(tǒng)可以實(shí)現(xiàn)高分辨率和高速度的控制。而且,機(jī)器視覺(jué)系統(tǒng)與被檢測(cè)對(duì)象無(wú)接觸,安全可靠。圖10-7圖像處理與模式識(shí)別應(yīng)用于指紋識(shí)別10.3.1什么是機(jī)器視覺(jué)機(jī)器視覺(jué)的起源可追溯到20世紀(jì)60年代美國(guó)學(xué)者L.R.羅伯茲對(duì)多面體積木世界的圖像處理研究,70年代麻省理工學(xué)院(MIT)人工智能實(shí)驗(yàn)室“機(jī)器視覺(jué)”課程的開(kāi)設(shè)。到80年代,全球性機(jī)器視覺(jué)研究熱潮開(kāi)始興起,出現(xiàn)了一些基于機(jī)器視覺(jué)的應(yīng)用系統(tǒng)。90年代以后,隨著計(jì)算機(jī)和半導(dǎo)體技術(shù)的飛速發(fā)展,機(jī)器視覺(jué)的理論和應(yīng)用得到進(jìn)一步發(fā)展。10.3.1什么是機(jī)器視覺(jué)進(jìn)入21世紀(jì)后,機(jī)器視覺(jué)技術(shù)的發(fā)展速度更快,已經(jīng)大規(guī)模地應(yīng)用于多個(gè)領(lǐng)域,如智能制造、智能交通、醫(yī)療衛(wèi)生、安防監(jiān)控等領(lǐng)域。常見(jiàn)機(jī)器視覺(jué)系統(tǒng)主要分為兩類,一類是基于計(jì)算機(jī)的,如工控機(jī)或PC,另一類是更加緊湊的嵌入式設(shè)備。典型的基于工控機(jī)的機(jī)器視覺(jué)系統(tǒng)主要包括:光學(xué)系統(tǒng),攝像機(jī)和工控機(jī)(包含圖像采集、圖像處理和分析、控制/通信)等單元(圖10-8)。機(jī)器視覺(jué)系統(tǒng)對(duì)核心的圖像處理要求算法準(zhǔn)確、快捷和穩(wěn)定,同時(shí)還要求系統(tǒng)的實(shí)現(xiàn)成本低,升級(jí)換代方便。10.3.1什么是機(jī)器視覺(jué)

圖10-8機(jī)器視覺(jué)系統(tǒng)10.3.1什么是機(jī)器視覺(jué)視覺(jué)是各個(gè)應(yīng)用領(lǐng)域,如制造業(yè)、檢驗(yàn)、文檔分析、醫(yī)療診斷和軍事等領(lǐng)域中各種智能/自主系統(tǒng)中不可分割的一部分。由于它的重要性,一些先進(jìn)國(guó)家把對(duì)計(jì)算機(jī)視覺(jué)的研究列為對(duì)經(jīng)濟(jì)和科學(xué)有廣泛影響的科學(xué)和工程中的重大挑戰(zhàn)。圖10-9計(jì)算機(jī)視覺(jué)的相關(guān)領(lǐng)域10.3.2定義計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)開(kāi)始于60年代初,基本研究中的許多重要進(jìn)展是在80年代取得的。從圖像處理和模式識(shí)別發(fā)展起來(lái)的計(jì)算機(jī)視覺(jué),是使用計(jì)算機(jī)及相關(guān)設(shè)備來(lái)模擬人的視覺(jué)機(jī)理獲取和處理信息的能力。它所面臨的挑戰(zhàn)是要為計(jì)算機(jī)和機(jī)器人開(kāi)發(fā)具有與人類水平相當(dāng)?shù)囊曈X(jué)能力。機(jī)器視覺(jué)需要把圖像信號(hào)、紋理和顏色建模、幾何處理和推理以及物體建模等所有這些處理都緊密地集成在一起。10.3.2定義計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)要達(dá)到的基本目的包括:(1)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;(2)根據(jù)一幅或多幅二維投影圖像計(jì)算出目標(biāo)物體的運(yùn)動(dòng)參數(shù);(3)根據(jù)一幅或多幅二維投影圖像計(jì)算出目標(biāo)物體的表面物理特性;(4)根據(jù)多幅二維投影圖像恢復(fù)出更大空間區(qū)域的投影圖像。10.3.2定義計(jì)算機(jī)視覺(jué)人工智能所研究的一個(gè)主要問(wèn)題是:如何讓系統(tǒng)具備“計(jì)劃”和“決策能力”,從而使之完成特定的技術(shù)動(dòng)作(例如:移動(dòng)一個(gè)機(jī)器人通過(guò)某種特定環(huán)境)。在這里,計(jì)算機(jī)視覺(jué)系統(tǒng)作為一個(gè)感知器,為決策提供信息。10.3.2定義計(jì)算機(jī)視覺(jué)為了達(dá)到計(jì)算機(jī)視覺(jué)的目的,有兩種技術(shù)途徑可以考慮。第一種是仿生學(xué)方法,即從分析人類視覺(jué)的過(guò)程入手,利用大自然提供給我們的最好參考系——人類視覺(jué)系統(tǒng),建立起視覺(jué)過(guò)程的計(jì)算模型,然后用計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)之。第二種是工程方法,即脫離人類視覺(jué)系統(tǒng)的約束,利用一切可行和實(shí)用的技術(shù)手段實(shí)現(xiàn)視覺(jué)功能。此方法的一般做法是,將人類視覺(jué)系統(tǒng)作為一個(gè)黑盒子對(duì)待,實(shí)現(xiàn)時(shí)只關(guān)心對(duì)于某種輸入,視覺(jué)系統(tǒng)將給出何種輸出。10.3.2定義計(jì)算機(jī)視覺(jué)這兩種方法理論上都是可行的,但面臨的困難是,人類視覺(jué)系統(tǒng)對(duì)應(yīng)某種輸入的輸出到底是什么,這是無(wú)法直接測(cè)得的。而且由于人的智能活動(dòng)是一個(gè)多功能系統(tǒng)綜合作用的結(jié)果,即使是得到了一個(gè)輸入輸出對(duì),也很難肯定它是僅由當(dāng)前的輸入視覺(jué)刺激所產(chǎn)生的響應(yīng),而不是一個(gè)與歷史狀態(tài)綜合作用的結(jié)果。10.3.2定義計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)領(lǐng)域有顯著的重疊。計(jì)算機(jī)視覺(jué)涉及被用于許多領(lǐng)域自動(dòng)化圖像分析的核心技術(shù)。機(jī)器視覺(jué)通常指的是結(jié)合自動(dòng)圖像分析與其他方法和技術(shù),以提供自動(dòng)檢測(cè)和機(jī)器人指導(dǎo),實(shí)現(xiàn)在工業(yè)應(yīng)用中的一個(gè)過(guò)程。在許多計(jì)算機(jī)視覺(jué)應(yīng)用中,計(jì)算機(jī)被預(yù)編程,以解決特定的任務(wù),但基于學(xué)習(xí)的方法現(xiàn)在正變得越來(lái)越普遍。10.3.3計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)的區(qū)別一般認(rèn)為,計(jì)算機(jī)就是機(jī)器的一種,那么,計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)有什么區(qū)別呢?(1)定義不同。計(jì)算機(jī)視覺(jué)是一門(mén)研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說(shuō),是指用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等機(jī)器視覺(jué),并進(jìn)一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像。10.3.3計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)的區(qū)別機(jī)器視覺(jué)系統(tǒng)通過(guò)機(jī)器視覺(jué)產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來(lái)控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。10.3.3計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)的區(qū)別(2)原理不同。計(jì)算機(jī)視覺(jué)是用各種成像系統(tǒng)代替視覺(jué)器官作為輸入敏感手段,由計(jì)算機(jī)來(lái)代替大腦完成處理和解釋。計(jì)算機(jī)視覺(jué)的最終研究目標(biāo)就是使計(jì)算機(jī)能像人那樣通過(guò)視覺(jué)觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。這是一個(gè)需要經(jīng)過(guò)長(zhǎng)期的努力才能達(dá)到的目標(biāo)。因此,在實(shí)現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺(jué)系統(tǒng),這個(gè)系統(tǒng)能依據(jù)視覺(jué)敏感和反饋的某種程度的智能完成一定的任務(wù)。例如,計(jì)算機(jī)視覺(jué)的一個(gè)重要應(yīng)用領(lǐng)域就是自主車(chē)輛的視覺(jué)導(dǎo)航,還沒(méi)有條件實(shí)現(xiàn)象人那樣能識(shí)別和理解任何環(huán)境,完成自主導(dǎo)航的系統(tǒng)。10.3.3計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)的區(qū)別人們努力的研究目標(biāo)是實(shí)現(xiàn)在高速公路上具有道路跟蹤能力,可避免與前方車(chē)輛碰撞的視覺(jué)輔助駕駛系統(tǒng)。在計(jì)算機(jī)視覺(jué)系統(tǒng)中計(jì)算機(jī)起代替人腦的作用,但并不意味著計(jì)算機(jī)必須按人類視覺(jué)的方法完成視覺(jué)信息的處理。計(jì)算機(jī)視覺(jué)可以而且應(yīng)該根據(jù)計(jì)算機(jī)系統(tǒng)的特點(diǎn)來(lái)進(jìn)行視覺(jué)信息的處理。人類的視覺(jué)系統(tǒng)是迄今為止人們所知道的功能最強(qiáng)大和完善的視覺(jué)系統(tǒng),對(duì)人類視覺(jué)處理機(jī)制的研究將給計(jì)算機(jī)視覺(jué)的研究提供啟發(fā)和指導(dǎo)。10.3.3計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)的區(qū)別因此,用計(jì)算機(jī)信息處理的方法研究人類視覺(jué)的機(jī)理,建立人類視覺(jué)的計(jì)算理論,也是一個(gè)非常重要和令人感興趣的研究領(lǐng)域。這方面的研究被稱為計(jì)算視覺(jué),是計(jì)算機(jī)視覺(jué)中的一個(gè)重要研究領(lǐng)域。10.3.3計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)的區(qū)別機(jī)器視覺(jué)的檢測(cè)系統(tǒng)采用CCD(電荷耦合元件)照相機(jī)將被檢測(cè)的目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào),圖像處理系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,如面積、數(shù)量、位置、長(zhǎng)度,再根據(jù)預(yù)設(shè)的允許度和其他條件輸出結(jié)果,包括尺寸、角度、個(gè)數(shù)、合格/不合格、有/無(wú)等,實(shí)現(xiàn)自動(dòng)識(shí)別功能。10.3.3計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)的區(qū)別PART04智能圖像處理技術(shù)智能圖像處理是指一類基于計(jì)算機(jī)的自適應(yīng)于各種應(yīng)用場(chǎng)合的圖像處理和分析技術(shù),本身是一個(gè)獨(dú)立的理論和技術(shù)領(lǐng)域,但同時(shí)又是機(jī)器視覺(jué)中的一項(xiàng)十分重要的技術(shù)支撐。10.4智能圖像處理技術(shù)圖像處理一般指數(shù)字圖像處理。數(shù)字圖像是指用數(shù)字?jǐn)z像機(jī)、掃描儀等設(shè)備經(jīng)過(guò)采樣和數(shù)字化得到的一個(gè)大的二維數(shù)組,該數(shù)組的元素稱為像素,其值為一整數(shù),稱為灰度值。圖像處理技術(shù)的主要內(nèi)容包括圖像壓縮,增強(qiáng)和復(fù)原,匹配、描述和識(shí)別3個(gè)部分。常見(jiàn)的處理有圖像數(shù)字化、圖像編碼、圖像增強(qiáng)、圖像復(fù)原、圖像分割和圖像分析等。機(jī)器視覺(jué)的圖像處理系統(tǒng)對(duì)現(xiàn)場(chǎng)的數(shù)字圖像信號(hào)按照具體的應(yīng)用要求進(jìn)行運(yùn)算和分析,根據(jù)獲得的處理結(jié)果來(lái)控制現(xiàn)場(chǎng)設(shè)備的動(dòng)作。10.4智能圖像處理技術(shù)圖像采集就是從工作現(xiàn)場(chǎng)獲取場(chǎng)景圖像的過(guò)程,是機(jī)器視覺(jué)的第一步,采集工具大多為CCD或CMOS照相機(jī)或攝像機(jī)。照相機(jī)采集的是單幅圖像,攝像機(jī)可以采集連續(xù)的現(xiàn)場(chǎng)圖像。就一幅圖像而言,它實(shí)際上是三維場(chǎng)景在二維圖像平面上的投影,圖像中某一點(diǎn)的彩色(亮度和色度)是場(chǎng)景中對(duì)應(yīng)點(diǎn)彩色的反映。這就是我們可以用采集圖像來(lái)替代真實(shí)場(chǎng)景的依據(jù)所在。10.4.1圖像采集如果相機(jī)是模擬信號(hào)輸出,需要將模擬圖像信號(hào)數(shù)字化后送給計(jì)算機(jī)(包括嵌入式系統(tǒng))處理?,F(xiàn)在大部分相機(jī)都可直接輸出數(shù)字圖像信號(hào)。不僅如此,現(xiàn)在相機(jī)的數(shù)字輸出接口也是標(biāo)準(zhǔn)化的,如USB、VGA、1394、HDMI、WiFi、BlueTooth接口等,可以直接送入計(jì)算機(jī)進(jìn)行處理,后續(xù)的圖像處理工作往往是由計(jì)算機(jī)或嵌入式系統(tǒng)以軟件的方式進(jìn)行。10.4.1圖像采集對(duì)于采集到的數(shù)字化現(xiàn)場(chǎng)圖像,由于受到設(shè)備和環(huán)境因素的影響,往往會(huì)受到不同程度的干擾,如噪聲、幾何形變、彩色失調(diào)等,為此必須對(duì)采集圖像進(jìn)行預(yù)處理。常見(jiàn)的預(yù)處理包括噪聲消除、幾何校正、直方圖均衡等處理。使用時(shí)域或頻域?yàn)V波的方法來(lái)消除圖像中的噪聲;采用幾何變換的辦法來(lái)校正圖像的幾何失真;采用直方圖均衡、同態(tài)濾波等方法來(lái)減輕圖像的彩色偏離??傊ㄟ^(guò)這一系列的圖像預(yù)處理技術(shù),對(duì)采集圖像進(jìn)行“加工”,為機(jī)器視覺(jué)應(yīng)用提供“更好”“更有用”的圖像。10.4.2圖像預(yù)處理所謂圖像分割,就是按照應(yīng)用要求,把圖像分成各具特征的區(qū)域,從中提取出感興趣目標(biāo)。在圖像中常見(jiàn)的特征有灰度、彩色、紋理、邊緣、角點(diǎn)等。例如,對(duì)汽車(chē)裝配流水線圖像進(jìn)行分割,分成背景區(qū)域和工件區(qū)域,提供給后續(xù)處理單元對(duì)工件安裝部分的處理。10.4.3圖像分割圖像分割是圖像處理中的一項(xiàng)關(guān)鍵技術(shù),其研究一直都受到人們的高度重視,借助于各種理論提出了數(shù)以千計(jì)的圖像分割算法,例如閾值、邊緣檢測(cè)、區(qū)域提取、結(jié)合特定理論工具等。從圖像的類型來(lái)分,有灰度圖像、彩色圖像和紋理圖像等分割。早在1965年就有人提出了檢測(cè)邊緣算子,使得邊緣檢測(cè)產(chǎn)生了不少經(jīng)典算法。隨著基于直方圖和小波變換的圖像分割方法的研究計(jì)算技術(shù)、VLSI技術(shù)的迅速發(fā)展,有關(guān)圖像處理方面的研究已經(jīng)取得了很大的進(jìn)展。近年來(lái),人們利用基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法進(jìn)行圖像分割,其性能勝過(guò)傳統(tǒng)算法。10.4.3圖像分割在制造或安防等行業(yè),機(jī)器視覺(jué)都離不開(kāi)對(duì)輸入圖像的目標(biāo)(又稱特征)進(jìn)行識(shí)別和分類處理,以便在此基礎(chǔ)上完成后續(xù)的判斷和操作。識(shí)別和分類技術(shù)有很多相同的地方,常常在目標(biāo)識(shí)別完成后,目標(biāo)的類別也就明確了。圖像識(shí)別技術(shù)正在跨越傳統(tǒng)方法,形成以神經(jīng)網(wǎng)絡(luò)為主流的智能化圖像識(shí)別方法,如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、回歸神經(jīng)網(wǎng)絡(luò)(RNN)等一類性能優(yōu)越的方法。

圖10-10目標(biāo)(特征)識(shí)別10.4.4目標(biāo)識(shí)別和分類在智能制造中,最常見(jiàn)的工作就是對(duì)目標(biāo)工件進(jìn)行安裝,但是在安裝前往往需要先對(duì)目標(biāo)進(jìn)行定位,安裝后還需對(duì)目標(biāo)進(jìn)行測(cè)量。安裝和測(cè)量都需要保持較高的精度和速度,如毫米級(jí)精度(甚至更?。?,毫秒級(jí)速度。這種高精度、高速度的定位和測(cè)量,倚靠通常的機(jī)械或人工的方法是難以辦到的。在機(jī)器視覺(jué)中,采用圖像處理的辦法,對(duì)安裝現(xiàn)場(chǎng)圖像進(jìn)行處理,按照目標(biāo)和圖像之間的復(fù)雜映射關(guān)系進(jìn)行處理,從而快速精準(zhǔn)地完成定位和測(cè)量任務(wù)。10.4.5目標(biāo)定位和測(cè)量圖像處理中的運(yùn)動(dòng)目標(biāo)檢測(cè)和跟蹤,就是實(shí)時(shí)檢測(cè)攝像機(jī)捕獲的場(chǎng)景圖像中是否有運(yùn)動(dòng)目標(biāo),并預(yù)測(cè)它下一步的運(yùn)動(dòng)方向和趨勢(shì),即跟蹤。并及時(shí)將這些運(yùn)動(dòng)數(shù)據(jù)提交給后續(xù)的分析和控制處理,形成相應(yīng)的控制動(dòng)作。圖像采集一般使用單個(gè)攝像機(jī),如果需要也可以使用兩個(gè)攝像機(jī),模仿人的雙目視覺(jué)而獲得場(chǎng)景的立體信息,這樣更加有利于目標(biāo)檢測(cè)和跟蹤處理。10.4.6目標(biāo)檢測(cè)和跟蹤PART05計(jì)算機(jī)視覺(jué)系統(tǒng)典型功能計(jì)算機(jī)視覺(jué)系統(tǒng)的結(jié)構(gòu)形式在很大程度上依賴其應(yīng)用方向。有些是獨(dú)立工作的,解決具體的測(cè)量或檢測(cè)問(wèn)題,有些作為某個(gè)大型復(fù)雜系統(tǒng)的一部分,比如和機(jī)械控制系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)、人機(jī)接口設(shè)備協(xié)同工作。計(jì)算機(jī)視覺(jué)系統(tǒng)中的有些功能幾乎是每個(gè)系統(tǒng)都需要具備的。

圖10-11計(jì)算機(jī)視覺(jué)(檢測(cè))系統(tǒng)組成10.5計(jì)算機(jī)視覺(jué)系統(tǒng)典型功能計(jì)算機(jī)視覺(jué)系統(tǒng)的一些關(guān)鍵要素包括:·光源布局影響大,需審慎考量?!ふ_選擇鏡組,考量倍率、空間、尺寸、失真等?!みx擇合適的攝影機(jī)(CCD),考量其功能、規(guī)格、穩(wěn)定性、耐用型等?!ひ曈X(jué)軟件的開(kāi)發(fā)依賴經(jīng)驗(yàn)累積,要多嘗試、思考問(wèn)題的解決途徑?!ひ詣?chuàng)造精度的不斷提升,縮短處理時(shí)間為最終目標(biāo)。10.5計(jì)算機(jī)視覺(jué)系統(tǒng)典型功能(1)圖像獲取。一幅數(shù)字圖像是由一個(gè)或多個(gè)圖像感知器產(chǎn)生,感知器可以是各種光敏攝像機(jī),包括遙感設(shè)備、X射線斷層攝影儀、雷達(dá)、超聲波接收器等。取決于不同的感知器,產(chǎn)生的圖片可以是普通的二維圖像、三維圖組或者一個(gè)圖像序列。圖片的像素值往往對(duì)應(yīng)于光在一個(gè)或多個(gè)光譜段上的強(qiáng)度(灰度圖或彩色圖),但也可以是相關(guān)的各種物理數(shù)據(jù),如聲波、電磁波或核磁共振的深度、吸收度或反射度。。10.5計(jì)算機(jī)視覺(jué)系統(tǒng)典型功能(2)預(yù)處理。在對(duì)圖像實(shí)施具體的計(jì)算機(jī)視覺(jué)方法來(lái)提取某種特定的信息之前,往往采用一種或一些預(yù)處理來(lái)使圖像滿足后繼方法的要求。例如:·二次取樣保證圖像坐標(biāo)的正確;·平滑去噪來(lái)濾除感知器引入的設(shè)備噪聲;·提高對(duì)比度來(lái)保證實(shí)現(xiàn)相關(guān)信息可以被檢測(cè)到;·調(diào)整尺度空間使圖像結(jié)構(gòu)適合局部應(yīng)用。10.5計(jì)算機(jī)視覺(jué)系統(tǒng)典型功能(3)特征提取。從圖像中提取各種復(fù)雜度的特征。例如:·線,邊緣提??;·局部化的特征點(diǎn)檢測(cè)如邊角檢測(cè),斑點(diǎn)檢測(cè);·更復(fù)雜的特征可能與圖像中的紋理形狀或運(yùn)動(dòng)有關(guān)。(4)檢測(cè)分割。在處理過(guò)程中,有時(shí)會(huì)需要對(duì)圖像進(jìn)行分割來(lái)提取有價(jià)值的用于后繼處理的部分,例如篩選特征點(diǎn);分割一或多幅圖片中含有特定目標(biāo)的部分。10.5計(jì)算機(jī)視覺(jué)系統(tǒng)典型功能(5)高級(jí)處理。到了這一步,數(shù)據(jù)的數(shù)量就不多了,例如圖像中只有經(jīng)先前處理被認(rèn)為含有目標(biāo)物體的部分。這時(shí)的處理包括:·驗(yàn)證得到的數(shù)據(jù)是否符合前提要求;·估測(cè)特定系數(shù),比如目標(biāo)的姿態(tài),體積;·對(duì)目標(biāo)進(jìn)行分類。高級(jí)處理有理解圖像內(nèi)容的含義,是計(jì)算機(jī)視覺(jué)中的高階處理,主要是在圖像分割的基礎(chǔ)上再經(jīng)行對(duì)分割出的圖像塊進(jìn)行理解,例如進(jìn)行識(shí)別等操作。10.5計(jì)算機(jī)視覺(jué)系統(tǒng)典型功能PART06計(jì)算機(jī)視覺(jué)系統(tǒng)的應(yīng)用圖像是人類獲取和交換信息的主要來(lái)源,因此與圖像相關(guān)的圖像識(shí)別技術(shù)必定也是未來(lái)的研究重點(diǎn)。計(jì)算機(jī)的圖像識(shí)別技術(shù)在公共安全、生物、工業(yè)、農(nóng)業(yè)、交通、醫(yī)療等很多領(lǐng)域都有應(yīng)用。例如交通方面的車(chē)牌識(shí)別系統(tǒng),安全方面的人臉識(shí)別技術(shù)、指紋識(shí)別技術(shù),農(nóng)業(yè)方面的種子識(shí)別技術(shù)、食品品質(zhì)檢測(cè)技術(shù),醫(yī)學(xué)方面的心電圖識(shí)別技術(shù)等。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,圖像識(shí)別技術(shù)也在不斷地優(yōu)化,其算法也在不斷地改進(jìn)。10.6計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用計(jì)算機(jī)視覺(jué)應(yīng)用的實(shí)例包括:(1)控制過(guò)程,比如一個(gè)工業(yè)機(jī)器人;(2)導(dǎo)航,例如通過(guò)自主汽車(chē)或移動(dòng)機(jī)器人;(3)檢測(cè)事件,如對(duì)視頻監(jiān)控和人數(shù)統(tǒng)計(jì);(4)組織信息,例如對(duì)于圖像和圖像序列的索引數(shù)據(jù)庫(kù);(5)造型對(duì)象或環(huán)境,如醫(yī)學(xué)圖像分析系統(tǒng)或地形模型;(6)相互作用,例如當(dāng)輸入到一個(gè)裝置,用于計(jì)算機(jī)人的交互;10.6計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用(7)自動(dòng)檢測(cè),例如制造業(yè)的應(yīng)用程序;(8)自動(dòng)汽車(chē)駕駛;(9)生物識(shí)別技術(shù),例如人臉識(shí)別。10.6計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用最突出的應(yīng)用領(lǐng)域是醫(yī)療計(jì)算機(jī)視覺(jué)和醫(yī)學(xué)圖像處理。這個(gè)領(lǐng)域的特征信息從圖像數(shù)據(jù)中提取用于針對(duì)患者進(jìn)行醫(yī)療診斷。通常,圖像數(shù)據(jù)是在顯示顯微鏡圖像、X射線圖像、血管造影圖像、超聲圖像和斷層圖像,例如檢測(cè)腫瘤、動(dòng)脈粥樣硬化或其他惡性變化,也可以是器官的尺寸,血流量等,還支持提供醫(yī)學(xué)研究的測(cè)量。計(jì)算機(jī)視覺(jué)在醫(yī)療領(lǐng)域的應(yīng)用還包括增強(qiáng)人類的感知能力,例如超聲圖像或X射線圖像,以降低受噪聲影響的圖像。10.6計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用第二個(gè)重要應(yīng)用領(lǐng)域是工業(yè),即機(jī)器視覺(jué)。信息被提取用于支撐制造工序。一個(gè)例子是質(zhì)量控制,其中的信息或最終產(chǎn)品被自動(dòng)檢測(cè)。機(jī)器視覺(jué)也被大量用于農(nóng)業(yè)。10.6計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用軍事上的應(yīng)用很可能是計(jì)算機(jī)視覺(jué)最大的地區(qū)之一。最明顯的例子是探測(cè)敵方士兵或車(chē)輛和導(dǎo)彈制導(dǎo)。更先進(jìn)的系統(tǒng)為導(dǎo)彈制導(dǎo)發(fā)送導(dǎo)彈的區(qū)域,而不是一個(gè)特定的目標(biāo),并且當(dāng)導(dǎo)彈到達(dá)基于本地獲取的圖像數(shù)據(jù)的區(qū)域的目標(biāo)做出選擇。現(xiàn)代軍事概念,如“戰(zhàn)場(chǎng)感知”,意味著各種傳感器,包括圖像傳感器,提供了豐富的有關(guān)作戰(zhàn)的場(chǎng)景,可用于支持戰(zhàn)略決策的信息。在這種情況下,數(shù)據(jù)的自動(dòng)處理,用于減少?gòu)?fù)雜性和融合來(lái)自多個(gè)傳感器的信息,以提高可靠性。10.6計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用一個(gè)較新的應(yīng)用領(lǐng)域是自主交通,其中包括潛水裝置、陸上車(chē)輛(帶輪子,如轎車(chē)或卡車(chē))、高空作業(yè)車(chē)和無(wú)人機(jī)。完全獨(dú)立的自主化水平,通常使用計(jì)算機(jī)視覺(jué)進(jìn)行導(dǎo)航,即知道它在哪里,用于指定的生產(chǎn)環(huán)境(地圖)或檢測(cè)障礙物,它也可以被用于檢測(cè)特定任務(wù)的特定事件,例如尋找森林火災(zāi)。應(yīng)用領(lǐng)域還包括支持視覺(jué)特效制作的電影和廣播,例如,攝像頭跟蹤(運(yùn)動(dòng)匹配)、監(jiān)視等。10.6計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用機(jī)器視覺(jué)的應(yīng)用主要體現(xiàn)在半導(dǎo)體及電子行業(yè),其中大概40%~50%都集中在半導(dǎo)體行業(yè)。

圖10-12半導(dǎo)體領(lǐng)域的機(jī)器視覺(jué)應(yīng)用10.6.1機(jī)器視覺(jué)的行業(yè)應(yīng)用具體如PCB印刷電路:各類生產(chǎn)印刷電路板組裝技術(shù)、設(shè)備;單、雙面、多層線路板,覆銅板及所需的材料及輔料;輔助設(shè)施以及耗材、油墨、藥水藥劑、配件;電子封裝技術(shù)與設(shè)備;絲網(wǎng)印刷設(shè)備及絲網(wǎng)周邊材料等。SMT表面貼裝:SMT工藝與設(shè)備、焊接設(shè)備、測(cè)試儀器、返修設(shè)備及各種輔助工具及配件、SMT材料、貼片劑、膠粘劑、焊劑、焊料及防氧化油、焊膏、清洗劑等;再流焊機(jī)、波峰焊機(jī)及自動(dòng)化生產(chǎn)線設(shè)備。電子生產(chǎn)加工設(shè)備:電子元件制造設(shè)備、半導(dǎo)體及集成電路制造設(shè)備、元器件成型設(shè)備、電子工模具。10.6.1機(jī)器視覺(jué)的行業(yè)應(yīng)用機(jī)器視覺(jué)系統(tǒng)還在質(zhì)量檢測(cè)的各個(gè)方面已經(jīng)得到了廣泛的應(yīng)用,并且其產(chǎn)品在應(yīng)用中占據(jù)著舉足輕重的地位。隨著經(jīng)濟(jì)水平的提高,3D機(jī)器視覺(jué)也開(kāi)始進(jìn)入人們的視野,它可用于水果和蔬菜、木材、化妝品、烘焙食品、電子組件和醫(yī)藥產(chǎn)品的評(píng)級(jí),可以提高合格產(chǎn)品的生產(chǎn)能力,在生產(chǎn)過(guò)程的早期就報(bào)廢劣質(zhì)產(chǎn)品,從而減少了浪費(fèi)節(jié)約成本。這種功能非常適合用于高度、形狀、數(shù)量甚至色彩等產(chǎn)品屬性的成像。10.6.1機(jī)器視覺(jué)的行業(yè)應(yīng)用在行業(yè)應(yīng)用方面,主要有制藥、包裝、電子、汽車(chē)制造、半導(dǎo)體、紡織、煙草、交通、物流等行業(yè),用機(jī)器視覺(jué)技術(shù)取代人工,可以提供生產(chǎn)效率和產(chǎn)品質(zhì)量。例如在物流行業(yè),可以使用機(jī)器視覺(jué)技術(shù)進(jìn)行快遞的分揀分類,不會(huì)出現(xiàn)大多快遞公司人工進(jìn)行分揀,減少物品的損壞率,可以提高分揀效率,減少人工勞動(dòng)。10.6.1機(jī)器視覺(jué)的行業(yè)應(yīng)用機(jī)器視覺(jué)的應(yīng)用主要有檢測(cè)和機(jī)器人視覺(jué)兩個(gè)方面:(1)檢測(cè):又分為高精度定量檢測(cè)(例如顯微照片的細(xì)胞分類、機(jī)械零部件的尺寸和位置測(cè)量)和不用量器的定性或半定量檢測(cè)(例如產(chǎn)品外觀檢查、裝配線上的零部件識(shí)別定位、缺

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論