智能機器人原理與應用 課件 第10-12章 智能機器人的前沿 AI技術、家庭智能空間服務機器人系統(tǒng)、家庭智能空間服務機器人環(huán)境功能區(qū)認知_第1頁
智能機器人原理與應用 課件 第10-12章 智能機器人的前沿 AI技術、家庭智能空間服務機器人系統(tǒng)、家庭智能空間服務機器人環(huán)境功能區(qū)認知_第2頁
智能機器人原理與應用 課件 第10-12章 智能機器人的前沿 AI技術、家庭智能空間服務機器人系統(tǒng)、家庭智能空間服務機器人環(huán)境功能區(qū)認知_第3頁
智能機器人原理與應用 課件 第10-12章 智能機器人的前沿 AI技術、家庭智能空間服務機器人系統(tǒng)、家庭智能空間服務機器人環(huán)境功能區(qū)認知_第4頁
智能機器人原理與應用 課件 第10-12章 智能機器人的前沿 AI技術、家庭智能空間服務機器人系統(tǒng)、家庭智能空間服務機器人環(huán)境功能區(qū)認知_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

北京信息科技大學自動化學院智能機器人原理與應用“智能檢測技術與模式識別”研究所北京信息科技大學自動化學院課程《智能機器人原理與應用》第十章智能機器人的前沿AI技術“人工智能”的概念第一次提出是在1956年的達特茅斯人工智能研究會議上。當時的科學家主要討論了計算機科學領域尚未解決的問題,期待通過模擬人類大腦的運行解決一些特定領域的具體問題。首次提出了把利用計算機進行的復雜信息處理稱為“人工智能”(artificial

intelligence),簡稱AI。簡言之,人工智能是研究開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的技術科學,其主要目標是使人工智能機器能夠勝任那些需要人類智能才能完成的專業(yè)工作。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.1新一代人工智能技術

人工智能的發(fā)展一共經(jīng)歷了3次浪潮,如圖所示。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.1新一代人工智能技術

人工智能的發(fā)展一共經(jīng)歷了3次浪潮,如圖所示。AI的第1次浪潮。第1次浪潮與圖靈和他在1950年提出的“圖靈測試”緊密相關。1966年MIT的教授Weizenbaum發(fā)明了一個可以和人對話的小程序———Eliza,轟動世界。AI的第2次浪潮。第2次浪潮出現(xiàn)在1980—1990年代,語音識別是最具代表性的幾項突破性進展之一。AI的第3次浪潮。第3次浪潮始于2006年,很大程度上歸功于深度學習的實用化進程。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.2機器人智能化在人工智能的加持下,智能化機器人應運而生。機器人的外延及邊界已被擴大數(shù)倍,新物種的誕生及傳統(tǒng)設備的智能化將共同驅動“機器人”產(chǎn)業(yè)以十倍及百倍速度增長。人工智能技術帶給機器人質的改變,主要在于以下兩個方面:10.2.1機器人是人工智能的實體化(1)智能化大幅提升。(2)智能化場景適用性提升。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.2機器人智能化智能化是逐步讓機器人具有自主智能,其發(fā)展路徑從學習單一任務開始,舉一反三,逐步達到與環(huán)境動態(tài)交互的主動學習,最終實現(xiàn)自我進化的高級智能。人工智能主要解決機器人智能化所需要的算法和技術,具體包括以下3方面要素。10.2.2機器人智能化三要素1.感知要素機器人的感覺器官用來認識周圍環(huán)境狀態(tài)以及和外界環(huán)境進行交互,包括能感知視覺、接近、距離等的非接觸型傳感器和能感知力、壓覺、觸覺等的接觸型傳感器等。2.決策要素決策要素也稱為思考要素,根據(jù)傳感器收集的數(shù)據(jù)思考出采用什么樣的動作。智能機器人的決策要素是3個要素中的關鍵,包括判斷、邏輯分析、理解等方面的智力活動。3.控制要素控制要素也稱為運動要素,是對外界做出反應性動作.北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習機器人發(fā)展的趨勢是人工智能化,深度學習是智能機器人的前沿技術,也是機器學習領域的新課題。深度學習可以簡單理解為多層的神經(jīng)網(wǎng)絡模型,這里簡約介紹幾種典型的神經(jīng)網(wǎng)絡架構。10.3.1深度學習在感知機的基礎上,研究人員提出一種新的網(wǎng)絡結構———CNN。CNN的本質是一種采用監(jiān)督方式訓練的面向兩維形狀不變性識別的特定多層感知機,每層由多個二維平面組成,而每個平面由多個獨立神經(jīng)元組成,專門用來處理具有類似網(wǎng)格結構的數(shù)據(jù)的神經(jīng)網(wǎng)絡。如圖所示,CNN的結構大致可以分為3層:卷積層、池化層和全連接層。1.卷積神經(jīng)網(wǎng)絡CNN北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習1)卷積層卷積層依賴于卷積計算,通過卷積運算可以提取輸入圖像的特征,使得原始信號的某些特征增強,并且在一定程度上降低噪聲。利用不同卷積算子對圖像進行濾波,得到顯著的邊緣特征。10.3.1深度學習2)池化層池化層的原理是對圖像進行下采樣,在減少數(shù)據(jù)處理量的同時保留有用信息。因此池化層的主要作用是在語義上把相似的特征合并起來,具有一定程度的位移、尺度、形變的魯棒性,可以消除輸入圖像的部分畸變與位移等的影響。3)全連接層全連接層采用softmax全連接,得到的激活值即卷積神經(jīng)網(wǎng)絡提取到的圖片特征。卷積后得到多組特征,池化后會對特征進行聚合。卷積池化的多次疊加自動提取圖片中的低級、中級、高級特征,實現(xiàn)對圖片的高精度分類。1.卷積神經(jīng)網(wǎng)絡CNN北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.1深度學習VGG是牛津大學科學工程系計算機視覺組(visualgeometrygroup)2014年提出的。在其發(fā)表的論文中,一共提及4種不同深度層數(shù)的卷積神經(jīng)網(wǎng)絡,分別是VGG11、VGG13、VGG16和VGG19。這幾種網(wǎng)絡結構除了網(wǎng)絡深度,本質并沒有什么區(qū)別,增加網(wǎng)絡的深度能夠在一定程度上影響網(wǎng)絡的最終性能。在VGG網(wǎng)絡中,通過使用多個較小卷積核(3×3)的卷積層可以替代一個卷積核較大的卷積層,這也是VGG系列網(wǎng)絡的一大特色之一。使用小卷積核不僅可以減少參數(shù),還可以進一步增加網(wǎng)絡的擬合能力。更深的層數(shù)和逐漸遞增的通道數(shù),也使得VGG網(wǎng)絡可以從數(shù)據(jù)中獲取更多的信息。2.卷積神經(jīng)網(wǎng)絡VGG北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.1深度學習3.殘差神經(jīng)網(wǎng)絡ResNetResNet中最重要的結構就是殘差塊,是由多個卷積層相互連接形成的。形成的每一個殘差塊相互連接,每個殘差塊利用了恒等跳躍式連接的方式。如圖所示輸入直接來自給定的圖像數(shù)據(jù),然后用于訓練每個殘差塊中的網(wǎng)絡結構,這也被稱為恒等映射。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.1深度學習3.殘差神經(jīng)網(wǎng)絡ResNet傳統(tǒng)的卷積網(wǎng)絡或全連接網(wǎng)絡在信息傳遞時或多或少會存在信息丟失、損耗等問題,還有導致梯度消失或者梯度爆炸,導致很深的網(wǎng)絡無法訓練。ResNet在一定程度上解決了這個問題,通過直接將輸入信息繞道傳到輸出保護信息的完整性,整個網(wǎng)絡只需要學習輸入、輸出差別的那一部分,簡化學習目標和難度。可見,ResNet的結構可以極快地加速神經(jīng)網(wǎng)絡的訓練,模型的準確率也有較大的提升。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.1深度學習4.YOLO算法YOLO算法是經(jīng)典的目標檢測算法之一,隨著算法的改進,版本也從YOLOV1逐漸演變到了YOLOV7。最經(jīng)典的YOLOV1是典型的端到端目標檢測算法,采用卷積神經(jīng)網(wǎng)絡提取特征,主干特征提取網(wǎng)絡的基礎是GooLeNet,與其他目標檢測算法不同的是,它使用劃分網(wǎng)格的策略來對目標進行檢測。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.1深度學習4.YOLO算法如圖10.5所示,YOLOV1的檢測流程如下北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.1深度學習4.YOLO算法(1)劃分網(wǎng)格。將原圖像劃分為7×7的網(wǎng)格。(2)生成預測框。每個網(wǎng)格生成2個邊界預測框和置信度信息,進行物體的框定和分類,一共有98個邊界預測框。(3)置信度計算。計算每個預測框的置信度信息。(4)去除重復框。通過非極大值抑制得到最后的預測框。置信度包含預測框中含有目標的可能性和預測框的準確度。假設YOLOV1算法可以檢測出n種類別的目標,則該單元格中檢測出的目標屬于n個分類的置信度概率可以表示為Pr(classi|object)。各個邊界框類別的置信度如下所示:1)YOLOV1算法流程式中,Pr(classi)*IoU是置信度,而IoU是預測框和實際框的交并比。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.1深度學習4.YOLO算法(1)執(zhí)行速度快。由于YOLOV1算法的流程比較簡單,執(zhí)行檢測任務時,不需要提取輸入內容的候選區(qū)域,因此與其他目標檢測算法相比,執(zhí)行速度很快,基本能達到40到50fps。而在V1算法的基礎上進行輕量化處理的FastYOLO算法,其檢測速度甚至能達到標準YOLOV1算法的3倍以上。(2)準確率高。當輸入的圖片中待檢測目標與背景相近時,不會將背景誤檢成目標,背景誤檢率比較低;除此之外,其他目標檢測算法是基于滑動窗口的,每個滑動窗口的大小不一,無法在整體上對輸入圖片進行檢測,而YOLOV1支持輸入整張圖片,無須采用滑動窗口的方式,所以極少會出現(xiàn)將背景誤檢為目標的情況,因此檢測的準確度較高。(3)泛化能力強。檢測比較抽象的圖片時,例如國畫、油畫等畫作,能夠很好地學習目標的概化特征,降低檢測的錯誤率。因此,YOLO系列算法具有優(yōu)秀的檢測速度和通用性。2)YOLO算法的優(yōu)勢北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.2生成式對抗網(wǎng)絡GAN2014年,蘭·吉德費羅等人首次提出生成式對抗網(wǎng)絡(generative

adversarial

nets,GAN),通過生成器和判別器互相競爭對抗來生成數(shù)據(jù),引起學術界的關注。經(jīng)理論與工程驗證,GAN網(wǎng)絡在圖像、文本、音頻等領域具有廣泛的適用性。GAN的基本結構如圖所示,它由一個生成模型(generative

model,G)和一個判別模型(discriminative

model,D)構成。生成模型可以看作一個樣本生成器,通過輸入一個隨機噪聲Z并且模仿真實數(shù)據(jù)樣本的分布,盡可能使生成的假樣本擁有與真實樣本一致的概率分布。判別模型用來判別輸入的樣本是否為真實樣本,輸出值為0或1,相當于一個二分類過程。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.2生成式對抗網(wǎng)絡GAN訓練GAN網(wǎng)絡相當于動態(tài)博弈過程,通過交替訓練GAN的生成模型與判別模型不斷地調整參數(shù),最終使判別器無法判別生成器的輸出結果是否為真,達到使生成器生成以假亂真數(shù)據(jù)樣本的目的。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.3強化學習2016年,DeepMind公司主要基于強化學習算法研發(fā)的AlphaGo程序擊敗人類頂尖的職業(yè)圍棋選手這一消息震驚了全世界。強化學習方法起源于動物心理學的相關原理,模仿人類和動物學習的試錯機制,是一種通過與環(huán)境交互,從學習狀態(tài)到行為的映射關系,以獲得最大累積期望回報的方法。狀態(tài)到行為的映射關系也即策略,表示在各個狀態(tài)下智能體采取的行為或行為概率。強化學習最大的特點是在與環(huán)境的交互中進行學習。在與環(huán)境的互動中,智能體根據(jù)它們獲得的獎勵和懲罰不斷學習,以更好地適應環(huán)境。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.3強化學習強化學習的核心思想是試錯機制,即讓智能體在與環(huán)境的交互過程中不斷學習和反饋,以獲得最大的累計獎勵。通常可以使用馬爾可夫決策過程對RL問題建模,表示為一個五元組(S,P,A,R,γ),其中S代表一個有限的狀態(tài)集合,A代表一個動作集合,P代表一個狀態(tài)轉移概率矩陣,R代表一個回報函數(shù),γ代表一個折扣因子,具體的學習過程如圖所示。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.3強化學習為了獲得環(huán)境反饋給智能體的最大獎勵,智能體根據(jù)環(huán)境的即時狀態(tài)St選擇并執(zhí)行它認為的最優(yōu)動作At。環(huán)境接受動作At后,以一定概率轉移到下一狀態(tài)St+1,并把一個獎勵Rt反饋給智能體,智能體根據(jù)獎勵Rt和當前狀態(tài)St+1選擇下一個動作。而t時刻的累計獎勵R就是即時獎勵Rt與后續(xù)所有可能采取的動作和導致的環(huán)境狀態(tài)的價值之和。由于距離當前狀態(tài)越遠,不確定性越高,需要乘以一個折扣因子γ來調整未來的每個即時獎勵對于累計獎勵的影響。累計獎勵公式R表示如下:北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.3強化學習如果Agent的某個行為策略導致環(huán)境對Agent正的獎賞(reward),則Agent以后采取這個行為策略的趨勢會加強。反之,若某個行為策略導致了負的獎賞,那么Agent此后采取這個動作的趨勢會減弱。人工智能的目標是賦予機器像人一樣思考的能力。更進一步,希望創(chuàng)造出像人類一樣具有自我意識和思考的人工智能。強化學習與監(jiān)督學習的不同之處在于,監(jiān)督學習涉及以執(zhí)行任務的正確動作集的形式向代理提供反饋。相比之下,強化學習使用獎勵和懲罰作為積極和消極行為的信號,它可以從自己的經(jīng)驗和行為中學習,對機器人自己創(chuàng)建一個高效的自適應控制系統(tǒng)至關重要。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.4遷移學習遷移學習主要是運用已有的知識對不同但相關領域的問題進行求解,從根本上放寬了傳統(tǒng)機器學習的基本假設。它打破了傳統(tǒng)機器學習對測試數(shù)據(jù)與訓練數(shù)據(jù)必須同分布的要求,是一種跨領域、跨任務的學習方法。遷移學習可以使訓練過程中的時間成本和計算資源大大降低,獲得了廣泛的關注和應用。遷移學習的基本思路是從一個或多個源領域(sourcedomain)任務中抽取知識和經(jīng)驗,然后應用到一個目標領域(targetdomain)中去。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.4遷移學習假設一個有標簽的數(shù)據(jù)集為其中,xi為數(shù)據(jù)集中的第i個樣本,yi為其標簽。定義χ為描述樣本X的特征空間,P(X)為X的邊緣概率分布,X的特征空間表示為定義γ為描述標簽Y的標簽空間,f(X)=P(Y|X)為條件概率分布,Y的標簽空間表示為在遷移學習中,定義域D被定義為由樣本的特征空間及其邊緣概率分布的集合,即D={χ,P(X)};任務T被定義為由標簽的標簽空間及目標預測函數(shù)的集合,即T={γ,ft(·)}。對于給定源域Ds和對應的任務Ts,給定目標域Dt和對應任務Tt,遷移學習旨在Ds≠Dt或Ts≠Tt的條件下,通過在源域Ds和源任務Ts獲得的知識來幫助模型解決在目標域Dt上的目標任務Tt的預測函數(shù)ft(·),使得ft(·)在目標域Dt上擁有最小的預測誤差。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.4遷移學習遷移學習的過程如圖所示。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.4遷移學習根據(jù)領域、任務及數(shù)據(jù)監(jiān)督性的不同,遷移學習可以劃分為4個不同的類別?,F(xiàn)有的遷移學習研究大多都建立在源域和目標域相似度較高的全局約束下。盡管整個源域數(shù)據(jù)不能直接被用到目標域數(shù)據(jù)里,但還是可能在源域中找到一些可以重新被用到目標域中的數(shù)據(jù)?;趯嵗倪w移學習方法根據(jù)一定的權重生成規(guī)則,對相同或相似的數(shù)據(jù)樣本調整權重,進行重用,遷移學習后的預測效果更準確。1.基于實例的遷移學習北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.4遷移學習根據(jù)領域、任務及數(shù)據(jù)監(jiān)督性的不同,遷移學習可以劃分為4個不同的類別。基于特征的遷移學習方法是指通過特征變換的方式進行遷移,來減少源域和目標域之間的差距。在機器學習的訓練過程中,篩選出一些好的有代表性的特征,通過特征變換把源域和目標域的特征變換到同樣的空間,使這個空間中源域和目標域的數(shù)據(jù)具有相同的分布,然后利用傳統(tǒng)的機器學習進行分類和預測研究。2.基于特征的遷移學習北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.4遷移學習根據(jù)領域、任務及數(shù)據(jù)監(jiān)督性的不同,遷移學習可以劃分為4個不同的類別。假設源域任務模型和目標域任務模型之間可以共享一些參數(shù),或者共享模型超參數(shù)的先驗分布,基于模型的遷移學習方法就是將源域任務模型可以共享的參數(shù)遷移到新的目標域任務的模型上。在機器學習訓練中,這種方法可以節(jié)省大量的時間成本和計算資源,使訓練過程更高效、更快捷。3.基于模型的遷移學習北京信息科技大學自動化學院課程《智能機器人原理與應用》10.3機器學習10.3.4遷移學習根據(jù)領域、任務及數(shù)據(jù)監(jiān)督性的不同,遷移學習可以劃分為4個不同的類別?;陉P系的遷移學習方法重點關注源域和目標域樣本之間的關系,利用源域中的邏輯網(wǎng)絡將相似的關系進行遷移,比如生物病毒傳播到計算機病毒傳播的遷移,師生關系到上司下屬關系的遷移。統(tǒng)計關系學習是基于關系的遷移學習方法的主要技術。4.基于關系的遷移學習北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術智能交互是人與機器之間使用某種對話語言,以一定的交互方式,為完成確定任務的人與機器之間的交換過程。整個交互系統(tǒng)中從接入用戶的輸入信息開始,包括語音、表情、手勢等多模態(tài)信息。我們在對話系統(tǒng)中對輸入的信息進行理解,通過這個對話部分以后產(chǎn)生輸出,最后用文字、合成語音或行為展現(xiàn)出來。目前,新型的人機交互方式主要有語音交互、姿勢交互、觸摸交互、視線跟蹤與輸入交互、腦機交互、肌電交互、表情交互、虛擬現(xiàn)實和增強現(xiàn)實以及多通道交互等。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術語音交互是讓機器能夠聽懂人說話,并根據(jù)人的話語執(zhí)行相應的命令。語言是人類最重要的交流方式,如果機器能與人進行語音交互,將使人們享受到更加輕松、自然的交互體驗。語音交互的關鍵技術主要包括語音識別、語音合成和語義理解。語音識別對用戶的語言進行特征分析,將其轉化為相應的文本或計算機系統(tǒng)可識別的命令;語音合成將文本轉換成機器合成的語音;語義理解技術是,從語音識別輸出的文本中獲取語義信息從而理解用戶的意圖。10.4.1語音交互北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術姿勢交互是通過穿戴/移動式傳感技術或計算機視覺技術對人體各個部位的狀態(tài)和動作進行檢測和識別。穿戴/移動式傳感技術通過各種傳感設備主要感知以下3類信息:形狀變化、平移及旋轉運動、方位與距離。計算機視覺技術則是通過各種波長的電磁波來感知軀體動作。利用穿戴/移動式傳感技術實現(xiàn)姿勢交互是一種主動感知,其精度較高,但附屬感、侵入性較強。利用計算機視覺技術實現(xiàn)姿勢交互是一種被動感知,不需要穿戴額外的設備,交互體驗更加自然,但對動作和姿勢的識別精度略遜一籌。10.4.2姿勢交互北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術姿勢交互方式利用人的姿勢行為主要分為以下幾類:10.4.2姿勢交互(1)手部與手臂姿勢交互。五指和手臂的運動最精細復雜。(2)頭部姿勢交互。頭部姿勢包括“空間姿勢”和“移動姿勢”。(3)全身姿勢交互。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術觸覺是人們感知物理世界的重要方式。人全身的皮膚上處處有能感知溫度、濕度、壓力、震動、痛覺等多種感覺的觸覺感覺細胞,它們在指尖上的分布尤為密集,所以人們的手指觸覺非常敏感,在很多情況下幾乎可以替代視覺和聽覺。因此觸摸式交互界面在人機交互領域大有可為。觸摸界面是一種“能把數(shù)字信息結合于日常的實體物件與物理環(huán)境中,從而實現(xiàn)對真實物理世界的增強”的用戶界面。具體而言,就是用戶通過物理操控(如傾斜、擠壓、搖晃等)進行輸入,系統(tǒng)感知到用戶輸入后,以改變某物件物理形態(tài)(如顯示、收縮、震動等)的方式為用戶提供反饋。10.4.3觸摸交互不同種類觸摸屏性能對比。P228北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術人們觀察外部世界時,眼睛總是與其他人體活動自然協(xié)調地工作,并且眼動所需的認知負荷很低,人眼的注視包含著當前的任務狀況以及人的內部狀態(tài)等信息,因此眼注視是一種非常好的能使人機對話變得簡便、自然的候選輸入通道。眼動測量方法經(jīng)歷了早期的直接觀察法、主觀感知法,后來發(fā)展為瞳孔—角膜反射向量法、眼電圖法、虹膜—鞏膜邊緣法、角膜反射法、雙普金野象法、接觸鏡法等。10.4.4視線跟蹤與輸入北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術目前,根據(jù)用戶眼動信息發(fā)揮的不同作用和特點,眼動交互技術可分為視線反饋技術、視線點擊技術和視線輸入技術。(1)基于自然眼動信息的視線反饋技術。視線反饋技術指的是一種基于視線眼動信息,通過反饋來促進視覺操作績效的交互技術。(2)基于視線操作的視線點擊技術。用于點擊操作的眼控技術主要是通過收集顯示屏上用戶注視點的坐標,再結合其他用戶行為來代替?zhèn)鹘y(tǒng)鼠標部分功能的交互技術。(3)利用視線行為進行輸入的視線輸入技術。眼控技術的另一種重要用途是視線輸入技術,它在用戶對特定輸入規(guī)則進行學習的基礎上,結合計算機的識別和編碼,將視線移動的軌跡序列或一定的停留時間編譯為輸入特定字符的指令,即利用視線動作完成數(shù)字字母等字符的輸入任務。10.4.4視線跟蹤與輸入北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術腦機交互是人機交互的重要方向,依靠人的腦波信號直接識別翻譯成為機器的指令。顯然,這是一種直接的人機交互方式,將會對人機交互方式產(chǎn)生革命性的影響。10.4.5腦機交互腦機交互的實現(xiàn)有賴于腦功能的研究。腦功能的研究手段可分為以下幾類。(1)侵入式腦功能研究。就是把電極植入到腦內,形成皮質腦電圖。(2)非侵入式腦功能研究。一種非侵入式MEG(腦磁信號)設備,體量通常較大。另一種非侵入式設備是利用EEG(腦電)信號,特點是設備非常小,非常便宜,可以做成便攜式裝置,實用性很好。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術通過腦電識別,人們可以探索人腦,發(fā)現(xiàn)感知認知機理,解釋邏輯推理過程,提供有效的人工智能研究手段和技術途徑。如圖所示,腦機接口技術使用在頭皮或皮層神經(jīng)元記錄的腦電活動,并把它轉化為對外界的控制信號。10.4.5腦機交互腦電信號直接反映人腦的活動和認知特性,可以做情緒、疾病的監(jiān)測和腦機交互。它的應用領域和前景非常廣闊,比如在人工智能領域,它可以探索人腦活動和認知規(guī)律,在腦機交互上也可以幫助殘疾人來控制輪椅等設備。在情緒監(jiān)測上可以感知人的工作狀態(tài)、壓力和焦慮等。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術另一方面,腦電信號分析研究目前仍存在不少問題。主要包括以下幾點10.4.5腦機交互(1)腦電信號的識別性能。腦電信號的信噪比非常低,因此識別準確率和計算復雜度通常難以滿足實際應用需求。在研究中需要發(fā)現(xiàn)新的視覺驅動與腦電信號的相關性,即低信噪比腦電信號下的高準確識別理論。(2)腦電信號的降噪方法。目前,針對腦電信號多通道、強噪聲特點的有效降噪方法和分類理論尚不完善。(3)腦電信號的多通道鑒別分析。針對腦電信號的多通道鑒別分析,現(xiàn)有分類模型和相關通道選擇問題的思路尚不十分有效,缺乏理論性支持。在研究中,需要尋找和探索更有效的基于思維的腦機交互范式,探索基于人視覺感知機理的計算模型。(4)腦機接口系統(tǒng)模式相對單一。研究中需要解決面向多種范式的思維腦控技術。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術生肌電一體化是近年來快速發(fā)展的前沿科學技術,它通過生物體運動執(zhí)行系統(tǒng),感知系統(tǒng),控制系統(tǒng)等與機電裝置(機構、傳感器、控制器等)的功能集成,使生物體或機電裝備的功能得到延伸。生肌電一體化機器人與普通機器人相比,最大的特點就是將“固定在人體上的機器”發(fā)展為神經(jīng)系統(tǒng)直接控制的運動功能替代裝置,由人的神經(jīng)電生理信號來控制假肢的行動。10.4.6肌電交互人體的任何一個動作都是由多組肌群在神經(jīng)系統(tǒng)的支配下相互協(xié)調、共同完成的。肌肉組織運動時會產(chǎn)生微弱的(mV級)電位變化,肌肉的活動信息不但能反映關節(jié)的伸屈狀態(tài)和伸屈強度,還能反映動作過程中肢體的形狀和位置等信息。可見,獲取肌電信號變化是感知人體動作的重要方式,這可以由安裝在相應肌群皮膚表面的表面肌電傳感器來完成。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術目前,表情交互研究主要針對靜態(tài)圖像、圖像序列或視頻中的二維、三維或四維數(shù)據(jù)提出大量的表情識別算法。除對人臉的6種基本表情以及中性表情的分析識別外,還有一些關于疼痛、微表情等的識別,這大大促進了表情識別在醫(yī)學、心理學及助老助殘上的應用。10.4.7表情交互表情交互是指從給定的人臉靜態(tài)圖像或動態(tài)視頻序列中分離出特定的表情狀態(tài),從而確定被識別對象的心理情緒,實現(xiàn)對表情的理解與識別,實現(xiàn)更優(yōu)的人機交互。這種技術的重要性在于,人類在日常交流中,人臉表情可傳遞高達55%的信息。計算機對人類表情的識別和分析能夠改善人際交流,尤其對殘障人士的信息表達與理解具有重要意義。表情交互通常需要對面部表情進行追蹤、編碼、識別。其中,面部表情的識別是最關鍵的一步。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術虛擬現(xiàn)實技術是20世紀末興起的一門嶄新的綜合性信息技術,它融合了數(shù)字圖像處理、計算機圖形學、多媒體技術、傳感器技術等多個信息技術分支,大大推進了計算機技術的發(fā)展。虛擬現(xiàn)實技術有3個特性,即沉浸感(immersion),交互性(interaction),思維構想性(imagination)。10.4.8虛擬現(xiàn)實和增強現(xiàn)實虛擬現(xiàn)實技術是一種綜合應用各種技術制造逼真的人工模擬環(huán)境,并有效模擬人在自然環(huán)境中的各種感知系統(tǒng)行為的高級人機交互技術。虛擬現(xiàn)實技術利用計算機生成三維視、聽、觸覺等感覺,使人通過適當裝置,以虛擬的方式來體驗,并和所虛擬的世界進行交互作用。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術(1)桌面式虛擬現(xiàn)實系統(tǒng)(desktopVR)。桌面式虛擬現(xiàn)實系統(tǒng)用電腦屏幕呈現(xiàn)三維虛擬環(huán)境,通過鼠標、手柄等進行交互。使用者可能因受到現(xiàn)實環(huán)境的干擾而缺乏沉浸體驗,但由于成本相對較低,應用廣泛。(2)完全沉浸式虛擬現(xiàn)實系統(tǒng)(fully-immersiveVR)。完全沉浸式虛擬現(xiàn)實系統(tǒng)需要佩戴沉浸式的輸出設備(如頭盔、具有力反饋的機械手臂等),以及頭部、身體的追蹤裝置,從而確保其身體運動和環(huán)境反饋之間的精確匹配??梢詫⑹褂谜叩囊曈X、聽覺與外界隔離,排除外界干擾,全身心投入虛擬世界中。(3)分布式虛擬現(xiàn)實系統(tǒng)(distributedVR)。分布式虛擬現(xiàn)實系統(tǒng)將分散的虛擬現(xiàn)實系統(tǒng)通過網(wǎng)絡聯(lián)結起來,采用協(xié)調一致的結構、標準、協(xié)議和數(shù)據(jù)庫,形成一個在時間和空間上互相耦合的虛擬合成環(huán)境,參與者之間可以自由交互和協(xié)同工作。10.4.8虛擬現(xiàn)實和增強現(xiàn)實虛擬現(xiàn)實技術主要包括以下3種類型。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術10.4.8虛擬現(xiàn)實和增強現(xiàn)實增強現(xiàn)實技術是一項高新科技技術,通過立體顯示、傳感器、二維碼、3D建模等技術充分調動用戶的參與意識與互動思維,把現(xiàn)實世界與虛擬世界有機結合起來,營造出似真似幻的曼妙時空。增強現(xiàn)實的技術主要包括顯示技術、識別技術、立體成像技術、傳感技術等。就顯示技術而言,則主要分為頭盔式和非頭盔式兩種。就頭盔式而言,依據(jù)影像呈現(xiàn)方式的不同,又可分為屏幕式與光學反射式。屏幕式頭盔顯示和光學反射式顯示技術的區(qū)別P232北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術10.4.8虛擬現(xiàn)實和增強現(xiàn)實與主流的屏幕顯示技術相比,另外一個進展迅速的技術類型是全息影像(holography)。它是一種在真正意義上實現(xiàn)360°影像表達的技術,即從任意角度觀看都會得到真實的立體效果。這種技術從最初的靜態(tài)影像呈現(xiàn),如身份證照片、防偽標示等,進化到如今的實時性、動態(tài)性、體積感等多種特性。從技術實現(xiàn)的方式而言,既有大型投影群的參與,也能見到微型投影器的身影。此外,透明面板的發(fā)明也帶給人們極大的想象空間,即把屏幕的光學折射特性應用到極致,透過屏幕可以看清后邊的真實世界,使裸眼3D產(chǎn)生的虛擬空間與真實世界更容易疊合,而不借助攝像頭進行影像的捕捉。這既避免了光學反射式投影影像的對焦虛化,更避免了頭盔式屏幕顯示的影像質量的畫質損失,因而是一種極具前景的增強現(xiàn)實技術。北京信息科技大學自動化學院課程《智能機器人原理與應用》10.4智能交互技術10.4.9多通道交互從生物意義上說,人體在生活場景中的經(jīng)歷可以歸結為各種生理器官的相互協(xié)作,主要有耳朵、皮膚、眼睛、鼻子、舌頭等,與此對應便產(chǎn)生了多通道。多通道人機交互是指利用兩種或多種通道的感知方式來進行交互,包括聽覺、觸覺、視覺、嗅覺、味覺等;多通道交互技術綜合使用三維交互技術、語音識別與合成技術、自然語言理解技術、視線跟蹤技術、姿勢輸入技術、觸覺、力顯示等新的交互通道、設備和交互技術,使用戶可通過多通道,以自然、并行、協(xié)作的方式進行人機對話,融合來自不同通道的精確的和不精確的輸入,以捕捉用戶的交互意圖,提高人機交互的自然性和高效性,最終達到以人為中心的交互方式?!爸悄軝z測技術與模式識別”研究所問答互動環(huán)節(jié)北京信息科技大學自動化學院智能機器人原理與應用“智能檢測技術與模式識別”研究所11家庭智能空間服務機器人系統(tǒng)智能空間是一種新的人機交互協(xié)作的復雜系統(tǒng),它通過普適傳感器網(wǎng)絡,把大量的多模態(tài)傳感器和帶有嵌入式處理器的計算、信息設備相互連接起來,從而將計算智能分布和嵌入到環(huán)境與日常工具中,以滿足各種特定需要[7]。與服務機器人研究的最終目的一致,智能空間研究也是為了提高人的生活質量;從技術層面上看,將智能空間技術與服務機器人技術結合起來,可以實現(xiàn)兩者優(yōu)勢的互補[8]:一方面,服務機器人只需與智能空間建立通信即可隨時隨地感知整個家庭環(huán)境,擺脫了必須集各種傳感器于一身的束縛;另一方面,服務機器人的引入大大提高了智能空間感知與執(zhí)行的主動性??梢姡悄芸臻g服務機器人的研究,是服務機器人技術與智能空間技術的完美結合,是不同于兩者的各自獨立發(fā)展,卻可以同時進行的另一條道路,其研究也必將豐富機器人和智能空間領域的相關理論。11.1家庭智能空間服務機器人系統(tǒng)介紹11.1.1家庭服務機器人1.家庭服務機器人研究尚不成熟當前的家庭服務機器人研究和應用遠遠沒有達到我們的期望,這其中一部分原因是當前對服務機器人本身,包括智能、自主等方面的研究還不成熟:首先,機器人的智能程度較為低下,目前機器人的服務功能往往是通過使用者預先對機器人設置定時啟動,或通過遙控等設備發(fā)出指令為絕對前提,機器人缺乏主動智能;其次,機器人感知和自主運動能力尚待提高,為機器人本體配備更多的感知設備,難以從根本上解決機器人全局范圍內有效信息的感知問題,反而導致了成本和計算開銷的增加。因此,機器人進入家庭作業(yè)仍受到很大的限制,其基本功能如定位、導航和物體識別等仍是最具有挑戰(zhàn)性的課題。11.1家庭智能空間服務機器人系統(tǒng)介紹11.1.1家庭服務機器人2.家庭服務任務的難度眾所周知,家庭服務機器人面對的是整個家庭環(huán)境及其中的各種目標,不同于工業(yè)現(xiàn)場固定和可編程的環(huán)境,其復雜性具體表現(xiàn)為以下幾個方面。(1)機器人工作環(huán)境為較為擁擠、混雜的家庭環(huán)境,且動態(tài)性較高;(2)家庭目標種類繁多特征各異,部分目標具有較強的移動性并在家庭環(huán)境進出;(3)家庭環(huán)境和目標相輔相承,融為一體,并無明確界限可分。由于上述因素的影響,造成了家庭環(huán)境及其中目標的多而混雜、異質性和動態(tài)性,在此情況下,傳統(tǒng)的只適合在特定條件、特定場合下完成簡單任務的工作模式和處理方法將不能滿足家庭服務機器人任務的需要。11.1家庭智能空間服務機器人系統(tǒng)介紹11.1.2智能空間1.智能空間的特點近年來,伴隨計算機、信息和網(wǎng)絡技術的飛速發(fā)展,出現(xiàn)了基于普適計算理論的智能空間技術,它是一種新的復雜系統(tǒng),通過普適傳感器網(wǎng)絡,把大量的多模態(tài)傳感器安裝在室內的多個位置,并將其與帶有嵌入式處理器的計算設備進行互連,從而將計算智能分布和嵌入到附有唯一識別標簽的環(huán)境與日常目標中,以實現(xiàn)對環(huán)境及其中目標的隨時、隨地感知,滿足各種特定任務的需要。可見,智能空間既可以提供對其所在環(huán)境的精確觀測信息,同時又具備高效快速的信息處理能力。11.1家庭智能空間服務機器人系統(tǒng)介紹11.1.2智能空間2.智能空間的應用前景智能空間技術旨在建立一個以人為中心的充滿計算和通信能力的空間,讓計算機參與到日?;顒又校褂脩裟芟衽c其他人一樣與計算機系統(tǒng)發(fā)生交互,從而隨時隨地、透明地獲得人性化的服務。從普適計算的角度來看,智能空間是普適計算理論研究的理想實驗平臺,同時作為一種集成化系統(tǒng),智能空間也具有十分重要的應用價值,在智能交通、應急反應、機器人等領域顯示出廣泛的應用前景。11.1家庭智能空間服務機器人系統(tǒng)介紹11.1.3家庭智能空間服務機器人系統(tǒng)構建背景1.家庭智能空間服務機器人系統(tǒng)的理念家庭智能空間服務機器人系統(tǒng)的建立主要是通過在室內環(huán)境布撒各種信息檢測傳感器、用于數(shù)據(jù)處理和信息服務的計算主機、人-機交互的觸摸顯示器界面、網(wǎng)絡系統(tǒng)以及數(shù)據(jù)庫等軟硬件設施,從而將室內家庭環(huán)境改造為遍布觀測和處理能力的信息空間,為服務機器人提供海量信息的環(huán)境信息,并通過無線傳輸方式與機器人交互,輔助機器人實現(xiàn)準確導航、精確定位等工作,進而完成抓取、運送、整理家具和物品等各種家庭服務任務。11.1家庭智能空間服務機器人系統(tǒng)介紹11.1.3家庭智能空間服務機器人系統(tǒng)構建背景2.家庭智能空間服務機器人系統(tǒng)的系統(tǒng)構成圖11.1給出了一種以攝像機為節(jié)點構建智能空間傳感器網(wǎng)絡的家庭智能空間服務機器人系統(tǒng)示意圖。本章的研究同樣是基于攝像機節(jié)點來構建智能空間傳感器網(wǎng)絡。攝像機1攝像機N智能空間攝像機網(wǎng)絡智能空間主機ZigBeeZigBee操作目標服務對象攝像頭圖11.1家庭智能空間服務機器人系統(tǒng)構成11.2機器人同步定位、傳感器網(wǎng)絡標定與環(huán)境建圖眾所周知,機器人定位、傳感器網(wǎng)絡標定與環(huán)境建圖是物聯(lián)網(wǎng)機器人系統(tǒng)中三個相互耦合的基本問題,其有效解決是物聯(lián)網(wǎng)機器人系統(tǒng)提供高效智能服務的前提。本節(jié)提出了物聯(lián)網(wǎng)機器人系統(tǒng)同時機器人定位、傳感器網(wǎng)絡標定與環(huán)境建圖的概念,通過分析三者之間的耦合關系,給出同時定位、標定與建圖問題的聯(lián)合條件概率表示,基于貝葉斯公式和馬爾科夫特性將其分解為若干可解項,并借鑒Rao-Blackwellized粒子濾波的思想分別求解。首先,聯(lián)合傳感器網(wǎng)絡對機器人的觀測、機器人對已定位環(huán)境特征的觀測以及機器人自身控制量設計了位姿粒子的采樣提議分布和權值更新公式;其次,聯(lián)合傳感器網(wǎng)絡對機器人運動軌跡及已定位環(huán)境特征的觀測設計了傳感器網(wǎng)絡標定的遞推公式;然后,聯(lián)合傳感器網(wǎng)絡和機器人對(已定位或新發(fā)現(xiàn))環(huán)境特征的觀測設計環(huán)境建圖的遞推公式。給出了完整的同時定位、標定與建圖算法,并通過仿真實驗驗證了該算法的有效性。11.2機器人同步定位、傳感器網(wǎng)絡標定與環(huán)境建圖11.2.1問題簡化作為人們日常生活和工作的重要場所,家庭或辦公室環(huán)境的布局結構往往較為復雜,且其中目標種類繁多、特征各異并具有不同程度的動態(tài)特性。為方便分析,不妨將物聯(lián)網(wǎng)機器人系統(tǒng)進行合理簡化。首先建立機器人坐標系:以標識色塊的中心為坐標系原點,z軸方向垂直標識色塊向上,x軸方向為機器人前進方向,y軸方向由右手法則確定。假定機械手基座坐標系、PTZ云臺坐標系在機器人坐標系下的位姿均已離線標定。以初始建圖時刻的機器人坐標系作為世界坐標系,由于機器人運行在平行于地面的二維平面,不妨假設任意時刻機器人在世界坐標系z軸的投影始終為零。此外,環(huán)境目標往往分布在三維空間中,故本文將整個環(huán)境描述為世界坐標系下包含環(huán)境布局及其中目標的三維特征地圖,并通過機器人和傳感器網(wǎng)絡的實時交互來聯(lián)合構建并共同維護該地圖。11.2機器人同步定位、傳感器網(wǎng)絡標定與環(huán)境建圖11.2.2模型求解從概率的觀點看,物聯(lián)網(wǎng)機器人系統(tǒng)同時定位、標定與建圖問題可以用概率密度來表示,即在已知機器人控制輸入序列、機器人對N個環(huán)境目標的觀測序列、傳感器網(wǎng)絡M個節(jié)點對機器人的觀測序列,以及傳感器網(wǎng)絡M個節(jié)點對N個環(huán)境特征的觀測序列的條件下,求解傳感器網(wǎng)絡M個節(jié)點的參數(shù)、機器人位姿、以及N個目標所構成地圖的聯(lián)合后驗概率估計問題?;赗ao-Blackwellized粒子濾波的思想,機器人運動軌跡的遞歸估計由粒子濾波器完成,各粒子對應傳感器網(wǎng)絡參數(shù)估計和特征地圖估計均由擴展Kalman濾波器完成。11.2機器人同步定位、傳感器網(wǎng)絡標定與環(huán)境建圖11.2.3算法描述通過前面的分解,并采用Rao-Blackwellized粒子濾波思想,在t時刻,物聯(lián)網(wǎng)機器人系統(tǒng)同時定位、標定與建圖問題的求解算法如下:Step1.基于粒子濾波的機器人定位(1)機器人位姿估計:采樣機器人位姿粒子;(2)位姿粒子權值計算:計算各位姿粒子的權值,歸一化;(3)計算有效粒子數(shù),進行粒子重采樣;Step2.傳感器節(jié)點標定環(huán)節(jié):基于EKF估計傳感器節(jié)點的位姿參數(shù)(1)預測更新;(2)根據(jù)傳感器節(jié)點對機器人觀測的觀測更新;(3)根據(jù)傳感器節(jié)點對已定位環(huán)境特征觀測的觀測更新;Step3.環(huán)境特征建圖環(huán)節(jié):基于EKF估計環(huán)境特征的位置:(1)預測更新:(2)根據(jù)機器人對環(huán)境特征觀測的觀測更新;(3)根據(jù)傳感器節(jié)點對環(huán)境特征觀測的觀測更新。11.2機器人同步定位、傳感器網(wǎng)絡標定與環(huán)境建圖11.2.3算法復雜度分析同時定位、標定與建圖問題的本質是多傳感器信息融合意義下的狀態(tài)估計問題。本文方法采用序貫方式融合兩類觀測信息進行狀態(tài)的觀測更新,針對每一類觀測,當同時存在多個該類觀測時,仍然采用序貫方式加以融合,如對于步驟Step2.(2)的觀測更新,當存在多個傳感器節(jié)點對機器人的觀測時,采用序貫方式融合多傳感器節(jié)點的觀測信息,同樣策略應用于步驟Step2.(3)、Step3.(2)和Step3.(3)中存在多個同類觀測的情形。假定物聯(lián)網(wǎng)機器人系統(tǒng)中包含一個移動機器人和一個由M個節(jié)點構成的傳感器網(wǎng)絡,且環(huán)境中包含N個特征點,本文算法中粒子個數(shù)選為K,在極端情形下,即各傳感器節(jié)點始終可以觀測到機器人和所有環(huán)境特征點,且機器人在任意時刻也都可以觀測到所有環(huán)境特征點時,本文算法所要融合的數(shù)據(jù)量最大,通過算法分析可知此情況下算法循環(huán)次數(shù)為K(M(N+1)+N(M+1)),或者說,本算法在最壞情況下的時間復雜度為O(KMN)。11.2機器人同步定位、傳感器網(wǎng)絡標定與環(huán)境建圖11.2.4實驗測試TimBailey提供了SLAM的matlab仿真程序和一個200m×200m的數(shù)據(jù)集,在此基礎上作如下改動:在地圖中隨機添加landmark和waypoint數(shù)據(jù),其位置如圖11.2所示;機器人初始位置在原點處、方向朝左;控制周期為0.025s;機器人能夠得到距離和方位的觀測信息,觀測范圍為其前方半徑為30m的半球區(qū)域,觀測采樣周期0.2s,觀測噪聲的協(xié)方差矩陣為diag{0.01.0.01},運動速率3m/s,運動噪聲的協(xié)方差diag{0.09,(3o)2},實驗中所用到粒子濾波的采樣粒子數(shù)均取為100。圖11.2環(huán)境特征、傳感器節(jié)點和機器人運行路徑示意圖11.2機器人同步定位、傳感器網(wǎng)絡標定與環(huán)境建圖11.2.4實驗結果分析第一組仿真實驗進行機器人定位精度對比,分別采用EKF-SLAM、FastSLAM2.0與本文的物聯(lián)網(wǎng)機器人系統(tǒng)U-SLAM(ubiquitousrobotsystemSLAM,U-SLAM)方法進行對比,三類方法各運行50次,得到的機器人位置誤差的數(shù)學期望和方差如圖11.3所示,角度誤差的數(shù)學期望和方差如圖11.4所示??梢钥闯?,傳統(tǒng)的SLAM方法中,EKF-SLAM算法僅利用機器人運動模型進行位姿估計而沒有考慮對環(huán)境的觀測信息,得到的定位誤差較大;FastSLAM2.0算法由于充分考慮機器人觀測信息,定位精度較高,但由于傳感器隨機器人運動,導致這兩種傳統(tǒng)SLAM方法都存在定位誤差隨運動時間明顯增大的缺陷。而對于本文U-SLAM,由于傳感器網(wǎng)絡各節(jié)點獨立于機器人,解除了觀測與機器人運動之間的數(shù)據(jù)耦合,在明顯提高機器人位姿估計精度的同時,估計的穩(wěn)定性也有大幅改善。圖11.4機器人角度誤差對比圖11.3機器人位置誤差對比11.2機器人同步定位、傳感器網(wǎng)絡標定與環(huán)境建圖11.2.4實驗結果分析第二組仿真實驗進行傳感器網(wǎng)絡標定精度對比,分別對僅依據(jù)運動方程的機器人位姿、依據(jù)FastSLAM2.0的機器人位姿,以及本文的物聯(lián)網(wǎng)機器人系統(tǒng)U-SLAM中聯(lián)合機器人位姿與環(huán)境特征這三類傳感器網(wǎng)絡標定方法進行對比,三類方法各運行50次,得到的傳感器網(wǎng)絡標定誤差的數(shù)學期望和方差如圖11.5所示??梢钥闯觯瑑H依據(jù)運動方程的方法,機器人位姿估計誤差隨運動距離增加迅速,得到的標定結果誤差很大,難以滿足要求;依據(jù)FastSLAM2.0算法能夠有效減少機器人位姿估計誤差,從而提高了節(jié)點標定的精度,但由于僅考慮了節(jié)點對機器人的觀測,產(chǎn)生的標定誤差仍然較高。而對于本文U-SLAM,傳感器網(wǎng)絡各節(jié)點標定、機器人位姿估計相對獨立,解除了觀測與機器人運動之間的數(shù)據(jù)耦合,在明顯提高機器人位姿估計精度的同時,傳感器節(jié)點標定的精度和穩(wěn)定性也得到了大幅改善。圖11.5傳感器網(wǎng)絡標定誤差對比11.2機器人同步定位、傳感器網(wǎng)絡標定與環(huán)境建圖11.2.4實驗結果分析第三組仿真實驗進行環(huán)境建圖精度對比,分別對僅依據(jù)運動方程的機器人位姿、FastSLAM2.0的機器人位姿,以及本文的物聯(lián)網(wǎng)機器人系統(tǒng)U-SLAM中聯(lián)合機器人位姿與環(huán)境特征這三類環(huán)境建圖方法進行對比,三類方法各運行50次,得到的傳感器網(wǎng)絡標定誤差的數(shù)學期望和方差如圖11.6所示。可以看出,僅依據(jù)運動方程的方法,機器人位姿估計誤差隨運動距離增加迅速,導致建圖誤差很大,難以滿足要求;依據(jù)FastSLAM2.0算法能夠有效減少機器人位姿估計誤差,從而提高了建圖的精度,但由于僅考慮了節(jié)點對機器人的觀測,產(chǎn)生的標定誤差仍然較高。而對于本文U-SLAM,機器人位姿估計、傳感器網(wǎng)絡各節(jié)點標定和環(huán)境建圖相對獨立,環(huán)境建圖的精度和穩(wěn)定性得到了大幅提高。圖11.6環(huán)境特征建圖誤差對比11.2機器人同步定位、傳感器網(wǎng)絡標定與環(huán)境建圖11.2.4實驗結果分析第四組仿真實驗進行動態(tài)環(huán)境下的機器人定位精度對比。在第30時,將經(jīng)過機器人定位的目標從處移動到未建圖區(qū)域處,機器人在第36時刻重新發(fā)現(xiàn)該目標,假定機器人并未發(fā)現(xiàn)目標的變動,利用傳統(tǒng)的SLAM算法進行目標數(shù)據(jù)關聯(lián)并根據(jù)先前獲取的信息自定位,得到的位置和角度誤差分別如圖11.7和圖11.8所示??梢钥闯觯捎肊KF-SLAM、UKF-SLAM和FastSLAM2.0算法得到錯誤定位,其原因在于此三種算法在定位環(huán)節(jié)中融合了機器人的觀測信息,但機器人感知范圍有限而未察覺目標變動,仍以先前獲取的位置和當前觀測來推算當前位姿,從而導致定位錯誤。對于FastSLAM1.0算法,機器人定位只根據(jù)自身控制信息完成,未融合觀測信息從而避免受動態(tài)環(huán)境的影響。而對于本文U-SLAM,通過傳感器網(wǎng)絡監(jiān)測動態(tài)環(huán)境特征的變化,并將其告知移動機器人,避免了動態(tài)路標對機器人定位的影響,并獲得了比FastSLAM1.0更高的定位精度。圖11.8機器人角度誤差對比圖11.7機器人位置誤差對比北京信息科技大學自動化學院“智能檢測技術與模式識別”研究所問答互動環(huán)節(jié)智能機器人原理與應用“智能檢測技術與模式識別”研究所12家庭智能空間服務機器人環(huán)境功能區(qū)認知室內功能區(qū)是指根據(jù)房屋的使用功能和各共有建筑部位的服務范圍而劃分的區(qū)域.服務機器人室內功能區(qū)認知旨在建立一種人機共融式的功能區(qū)認知框架,機器人通過視覺系統(tǒng)將室內功能區(qū)場景圖像捕捉到大腦,經(jīng)由預先學習的認知框架加以分析,得到該場景圖像的深層功能屬性,這一過程與人類場景認知機理類似.本章提出了基于CLM(無碼本模型)的家庭服務機器人室內功能區(qū)分類方法.首先,采用SURF(加速魯棒特征)提取算法獲得底層特征;其次,考慮到本文采用的室內功能區(qū)數(shù)據(jù)集背景噪聲特點,去除背景雜波的濾除過程,提高運算效率;最后,采用改進的SVM作為分類器,較現(xiàn)有CLM方法更加簡潔高效,適用于較低配置的機器人.12.1功能區(qū)認知的系統(tǒng)框架不同于詞袋模型通過學習碼本統(tǒng)計局部特征分布并對描述符進行編碼的方法(如圖12.1所示),CLM模型直接用描述符表示圖像,無需預先訓練碼本和隨后的編碼,具有規(guī)避詞袋模型上述限制的優(yōu)勢。此外,本章從底層特征與分類器兩方面進行了優(yōu)化改進。圖12.1詞袋模型與CLM模型構建過程及對比基于CLM的家庭服務機器人室內服務環(huán)境分類方法主要分為特征提取、離線構建圖像表示模型和在線分類檢測3個階段。特征提取階段:以室內環(huán)境的灰度圖像作為輸入,計算SURF特征描述子,獲得不同場景類別的特征描述。離線構建圖像表示模型階段:考慮到構建碼本的局限性,本文采用無碼本的CLM替代詞袋模型構建室內功能區(qū)的表示模型。首先,構建單高斯模型的圖像表示;然后,使用一個有效的兩步度量方法匹配高斯模型,并引入2個重要參數(shù)改進所使用的距離度量公式;最后,采用改進的SVM學習方法,進行室內功能區(qū)的分類。在線檢測階段:將一組新的圖像作為測試集,通過與訓練的圖像模型匹配,對測試集圖像進行分類,通過分類精度判斷模型的有效性和實用性。12.1功能區(qū)認知的系統(tǒng)框架12.2功能區(qū)圖像模型構建12.2.1提取圖像特征描述符即使同類別的2張室內功能區(qū)圖像之間也會存在拍攝角度、光照變化、尺度大小等方面的差異,從而影響分類判別的精度.SURF算法是一種圖像局部特征計算方法,基于物體上的一些局部外觀的興趣點而生成,對方向旋轉、亮度變化、尺度縮放具有不變性,對視角偏移、仿射變換、噪聲雜波也具有一定的穩(wěn)定性.SURF算法在保留了SIFT算法的優(yōu)良性能的基礎上,特征更為精簡,在降低算法復雜度的同時提高了計算效率.12.2功能區(qū)圖像模型構建12.2.1提取圖像特征描述符基于SURF算法的功能區(qū)特征提取算法具體如下:輸入:室內功能區(qū)的灰度圖像.輸出:室內功能區(qū)的64維SURF特征矩陣.步驟1:對輸入圖像進行高斯濾波,得到濾波后圖像,繼而分別求各個方向上的2階導數(shù).步驟2:構造圖像的Hessian.步驟3:通過對每個像素的Hessian矩陣求行列式的值,得到每個像素點的近似表示,遍歷每個像素的Hessian矩陣,得到圖像的響應圖像.步驟4:改變參數(shù)值,得到不同尺度下的高斯平滑圖像,形成高斯金字塔.步驟5:對某一像素點,得到鄰域內的極值,記為鄰域內的特征點.步驟6:選取主方向,然后把正方形框分為16個子區(qū)域,在每個子區(qū)域內統(tǒng)計水平方向和垂直方向(相對主方向而言)的Haar小波特征,得到64維的圖像特征向量..12.2功能區(qū)圖像模型構建12.2.2分類器的選擇本文通過采用對數(shù)-歐氏計算框架,得到了基于線性空間的高斯模型匹配度量公式,故可以采用線性分類器對數(shù)據(jù)進行分類.常見的線性分類器有邏輯回歸、SVM、感知機、K均值法等.將SVM分類器用于本文中功能區(qū)分類具有如下優(yōu)勢:(1)SVM以結構化風險最小為優(yōu)化目標,相較于其他幾種分類器具有更強的泛化能力;(2)家庭服務機器人的應用場景主要為室內,功能區(qū)樣本集種類有限,而SVM在少量的支持向量的基礎上確定的分類超平面,其受樣本數(shù)量的影響較小,具有很好的魯棒性;(3)本文采用CLM構建的室內功能區(qū)表示模型,相較于傳統(tǒng)基于碼本的表示方法維度較高,SVM提供了一種規(guī)避高維空間復雜性問題的思路,即直接用此空間的內積函數(shù)(核函數(shù)),結合在線性可分情況下的求解方法,直接求解高維空間的決策問題.基于上述考慮,故本章采用SVM作為最終的分類器.12.2.3室內功能區(qū)建模算法輸入:5種室內功能區(qū)的灰度級圖像.輸出:室內功能區(qū)表示模型.步驟1:在5種室內功能區(qū)的灰度級圖像上計算SURF特征描述子;步驟2:運用空間金字塔匹配方法,將功能區(qū)圖像分成一些規(guī)則的區(qū)域;步驟3:在每個區(qū)域上,運用最大似然法,聯(lián)合平均向量和協(xié)方差矩陣,構建一個單高斯模型,并引入

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論