智能機(jī)器人原理與應(yīng)用 課件 第10章 智能機(jī)器人的前沿 AI技術(shù)_第1頁(yè)
智能機(jī)器人原理與應(yīng)用 課件 第10章 智能機(jī)器人的前沿 AI技術(shù)_第2頁(yè)
智能機(jī)器人原理與應(yīng)用 課件 第10章 智能機(jī)器人的前沿 AI技術(shù)_第3頁(yè)
智能機(jī)器人原理與應(yīng)用 課件 第10章 智能機(jī)器人的前沿 AI技術(shù)_第4頁(yè)
智能機(jī)器人原理與應(yīng)用 課件 第10章 智能機(jī)器人的前沿 AI技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

北京信息科技大學(xué)自動(dòng)化學(xué)院智能機(jī)器人原理與應(yīng)用“智能檢測(cè)技術(shù)與模式識(shí)別”研究所北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》第十章智能機(jī)器人的前沿AI技術(shù)“人工智能”的概念第一次提出是在1956年的達(dá)特茅斯人工智能研究會(huì)議上。當(dāng)時(shí)的科學(xué)家主要討論了計(jì)算機(jī)科學(xué)領(lǐng)域尚未解決的問(wèn)題,期待通過(guò)模擬人類大腦的運(yùn)行解決一些特定領(lǐng)域的具體問(wèn)題。首次提出了把利用計(jì)算機(jī)進(jìn)行的復(fù)雜信息處理稱為“人工智能”(artificial

intelligence),簡(jiǎn)稱AI。簡(jiǎn)言之,人工智能是研究開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的技術(shù)科學(xué),其主要目標(biāo)是使人工智能機(jī)器能夠勝任那些需要人類智能才能完成的專業(yè)工作。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.1新一代人工智能技術(shù)

人工智能的發(fā)展一共經(jīng)歷了3次浪潮,如圖所示。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.1新一代人工智能技術(shù)

人工智能的發(fā)展一共經(jīng)歷了3次浪潮,如圖所示。AI的第1次浪潮。第1次浪潮與圖靈和他在1950年提出的“圖靈測(cè)試”緊密相關(guān)。1966年MIT的教授Weizenbaum發(fā)明了一個(gè)可以和人對(duì)話的小程序———Eliza,轟動(dòng)世界。AI的第2次浪潮。第2次浪潮出現(xiàn)在1980—1990年代,語(yǔ)音識(shí)別是最具代表性的幾項(xiàng)突破性進(jìn)展之一。AI的第3次浪潮。第3次浪潮始于2006年,很大程度上歸功于深度學(xué)習(xí)的實(shí)用化進(jìn)程。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.2機(jī)器人智能化在人工智能的加持下,智能化機(jī)器人應(yīng)運(yùn)而生。機(jī)器人的外延及邊界已被擴(kuò)大數(shù)倍,新物種的誕生及傳統(tǒng)設(shè)備的智能化將共同驅(qū)動(dòng)“機(jī)器人”產(chǎn)業(yè)以十倍及百倍速度增長(zhǎng)。人工智能技術(shù)帶給機(jī)器人質(zhì)的改變,主要在于以下兩個(gè)方面:10.2.1機(jī)器人是人工智能的實(shí)體化(1)智能化大幅提升。(2)智能化場(chǎng)景適用性提升。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.2機(jī)器人智能化智能化是逐步讓機(jī)器人具有自主智能,其發(fā)展路徑從學(xué)習(xí)單一任務(wù)開(kāi)始,舉一反三,逐步達(dá)到與環(huán)境動(dòng)態(tài)交互的主動(dòng)學(xué)習(xí),最終實(shí)現(xiàn)自我進(jìn)化的高級(jí)智能。人工智能主要解決機(jī)器人智能化所需要的算法和技術(shù),具體包括以下3方面要素。10.2.2機(jī)器人智能化三要素1.感知要素機(jī)器人的感覺(jué)器官用來(lái)認(rèn)識(shí)周?chē)h(huán)境狀態(tài)以及和外界環(huán)境進(jìn)行交互,包括能感知視覺(jué)、接近、距離等的非接觸型傳感器和能感知力、壓覺(jué)、觸覺(jué)等的接觸型傳感器等。2.決策要素決策要素也稱為思考要素,根據(jù)傳感器收集的數(shù)據(jù)思考出采用什么樣的動(dòng)作。智能機(jī)器人的決策要素是3個(gè)要素中的關(guān)鍵,包括判斷、邏輯分析、理解等方面的智力活動(dòng)。3.控制要素控制要素也稱為運(yùn)動(dòng)要素,是對(duì)外界做出反應(yīng)性動(dòng)作.北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)機(jī)器人發(fā)展的趨勢(shì)是人工智能化,深度學(xué)習(xí)是智能機(jī)器人的前沿技術(shù),也是機(jī)器學(xué)習(xí)領(lǐng)域的新課題。深度學(xué)習(xí)可以簡(jiǎn)單理解為多層的神經(jīng)網(wǎng)絡(luò)模型,這里簡(jiǎn)約介紹幾種典型的神經(jīng)網(wǎng)絡(luò)架構(gòu)。10.3.1深度學(xué)習(xí)在感知機(jī)的基礎(chǔ)上,研究人員提出一種新的網(wǎng)絡(luò)結(jié)構(gòu)———CNN。CNN的本質(zhì)是一種采用監(jiān)督方式訓(xùn)練的面向兩維形狀不變性識(shí)別的特定多層感知機(jī),每層由多個(gè)二維平面組成,而每個(gè)平面由多個(gè)獨(dú)立神經(jīng)元組成,專門(mén)用來(lái)處理具有類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。如圖所示,CNN的結(jié)構(gòu)大致可以分為3層:卷積層、池化層和全連接層。1.卷積神經(jīng)網(wǎng)絡(luò)CNN北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)1)卷積層卷積層依賴于卷積計(jì)算,通過(guò)卷積運(yùn)算可以提取輸入圖像的特征,使得原始信號(hào)的某些特征增強(qiáng),并且在一定程度上降低噪聲。利用不同卷積算子對(duì)圖像進(jìn)行濾波,得到顯著的邊緣特征。10.3.1深度學(xué)習(xí)2)池化層池化層的原理是對(duì)圖像進(jìn)行下采樣,在減少數(shù)據(jù)處理量的同時(shí)保留有用信息。因此池化層的主要作用是在語(yǔ)義上把相似的特征合并起來(lái),具有一定程度的位移、尺度、形變的魯棒性,可以消除輸入圖像的部分畸變與位移等的影響。3)全連接層全連接層采用softmax全連接,得到的激活值即卷積神經(jīng)網(wǎng)絡(luò)提取到的圖片特征。卷積后得到多組特征,池化后會(huì)對(duì)特征進(jìn)行聚合。卷積池化的多次疊加自動(dòng)提取圖片中的低級(jí)、中級(jí)、高級(jí)特征,實(shí)現(xiàn)對(duì)圖片的高精度分類。1.卷積神經(jīng)網(wǎng)絡(luò)CNN北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)VGG是牛津大學(xué)科學(xué)工程系計(jì)算機(jī)視覺(jué)組(visualgeometrygroup)2014年提出的。在其發(fā)表的論文中,一共提及4種不同深度層數(shù)的卷積神經(jīng)網(wǎng)絡(luò),分別是VGG11、VGG13、VGG16和VGG19。這幾種網(wǎng)絡(luò)結(jié)構(gòu)除了網(wǎng)絡(luò)深度,本質(zhì)并沒(méi)有什么區(qū)別,增加網(wǎng)絡(luò)的深度能夠在一定程度上影響網(wǎng)絡(luò)的最終性能。在VGG網(wǎng)絡(luò)中,通過(guò)使用多個(gè)較小卷積核(3×3)的卷積層可以替代一個(gè)卷積核較大的卷積層,這也是VGG系列網(wǎng)絡(luò)的一大特色之一。使用小卷積核不僅可以減少參數(shù),還可以進(jìn)一步增加網(wǎng)絡(luò)的擬合能力。更深的層數(shù)和逐漸遞增的通道數(shù),也使得VGG網(wǎng)絡(luò)可以從數(shù)據(jù)中獲取更多的信息。2.卷積神經(jīng)網(wǎng)絡(luò)VGG北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)3.殘差神經(jīng)網(wǎng)絡(luò)ResNetResNet中最重要的結(jié)構(gòu)就是殘差塊,是由多個(gè)卷積層相互連接形成的。形成的每一個(gè)殘差塊相互連接,每個(gè)殘差塊利用了恒等跳躍式連接的方式。如圖所示輸入直接來(lái)自給定的圖像數(shù)據(jù),然后用于訓(xùn)練每個(gè)殘差塊中的網(wǎng)絡(luò)結(jié)構(gòu),這也被稱為恒等映射。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)3.殘差神經(jīng)網(wǎng)絡(luò)ResNet傳統(tǒng)的卷積網(wǎng)絡(luò)或全連接網(wǎng)絡(luò)在信息傳遞時(shí)或多或少會(huì)存在信息丟失、損耗等問(wèn)題,還有導(dǎo)致梯度消失或者梯度爆炸,導(dǎo)致很深的網(wǎng)絡(luò)無(wú)法訓(xùn)練。ResNet在一定程度上解決了這個(gè)問(wèn)題,通過(guò)直接將輸入信息繞道傳到輸出保護(hù)信息的完整性,整個(gè)網(wǎng)絡(luò)只需要學(xué)習(xí)輸入、輸出差別的那一部分,簡(jiǎn)化學(xué)習(xí)目標(biāo)和難度??梢?jiàn),ResNet的結(jié)構(gòu)可以極快地加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,模型的準(zhǔn)確率也有較大的提升。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法YOLO算法是經(jīng)典的目標(biāo)檢測(cè)算法之一,隨著算法的改進(jìn),版本也從YOLOV1逐漸演變到了YOLOV7。最經(jīng)典的YOLOV1是典型的端到端目標(biāo)檢測(cè)算法,采用卷積神經(jīng)網(wǎng)絡(luò)提取特征,主干特征提取網(wǎng)絡(luò)的基礎(chǔ)是GooLeNet,與其他目標(biāo)檢測(cè)算法不同的是,它使用劃分網(wǎng)格的策略來(lái)對(duì)目標(biāo)進(jìn)行檢測(cè)。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法如圖10.5所示,YOLOV1的檢測(cè)流程如下北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法(1)劃分網(wǎng)格。將原圖像劃分為7×7的網(wǎng)格。(2)生成預(yù)測(cè)框。每個(gè)網(wǎng)格生成2個(gè)邊界預(yù)測(cè)框和置信度信息,進(jìn)行物體的框定和分類,一共有98個(gè)邊界預(yù)測(cè)框。(3)置信度計(jì)算。計(jì)算每個(gè)預(yù)測(cè)框的置信度信息。(4)去除重復(fù)框。通過(guò)非極大值抑制得到最后的預(yù)測(cè)框。置信度包含預(yù)測(cè)框中含有目標(biāo)的可能性和預(yù)測(cè)框的準(zhǔn)確度。假設(shè)YOLOV1算法可以檢測(cè)出n種類別的目標(biāo),則該單元格中檢測(cè)出的目標(biāo)屬于n個(gè)分類的置信度概率可以表示為Pr(classi|object)。各個(gè)邊界框類別的置信度如下所示:1)YOLOV1算法流程式中,Pr(classi)*IoU是置信度,而IoU是預(yù)測(cè)框和實(shí)際框的交并比。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法(1)執(zhí)行速度快。由于YOLOV1算法的流程比較簡(jiǎn)單,執(zhí)行檢測(cè)任務(wù)時(shí),不需要提取輸入內(nèi)容的候選區(qū)域,因此與其他目標(biāo)檢測(cè)算法相比,執(zhí)行速度很快,基本能達(dá)到40到50fps。而在V1算法的基礎(chǔ)上進(jìn)行輕量化處理的FastYOLO算法,其檢測(cè)速度甚至能達(dá)到標(biāo)準(zhǔn)YOLOV1算法的3倍以上。(2)準(zhǔn)確率高。當(dāng)輸入的圖片中待檢測(cè)目標(biāo)與背景相近時(shí),不會(huì)將背景誤檢成目標(biāo),背景誤檢率比較低;除此之外,其他目標(biāo)檢測(cè)算法是基于滑動(dòng)窗口的,每個(gè)滑動(dòng)窗口的大小不一,無(wú)法在整體上對(duì)輸入圖片進(jìn)行檢測(cè),而YOLOV1支持輸入整張圖片,無(wú)須采用滑動(dòng)窗口的方式,所以極少會(huì)出現(xiàn)將背景誤檢為目標(biāo)的情況,因此檢測(cè)的準(zhǔn)確度較高。(3)泛化能力強(qiáng)。檢測(cè)比較抽象的圖片時(shí),例如國(guó)畫(huà)、油畫(huà)等畫(huà)作,能夠很好地學(xué)習(xí)目標(biāo)的概化特征,降低檢測(cè)的錯(cuò)誤率。因此,YOLO系列算法具有優(yōu)秀的檢測(cè)速度和通用性。2)YOLO算法的優(yōu)勢(shì)北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.2生成式對(duì)抗網(wǎng)絡(luò)GAN2014年,蘭·吉德費(fèi)羅等人首次提出生成式對(duì)抗網(wǎng)絡(luò)(generative

adversarial

nets,GAN),通過(guò)生成器和判別器互相競(jìng)爭(zhēng)對(duì)抗來(lái)生成數(shù)據(jù),引起學(xué)術(shù)界的關(guān)注。經(jīng)理論與工程驗(yàn)證,GAN網(wǎng)絡(luò)在圖像、文本、音頻等領(lǐng)域具有廣泛的適用性。GAN的基本結(jié)構(gòu)如圖所示,它由一個(gè)生成模型(generative

model,G)和一個(gè)判別模型(discriminative

model,D)構(gòu)成。生成模型可以看作一個(gè)樣本生成器,通過(guò)輸入一個(gè)隨機(jī)噪聲Z并且模仿真實(shí)數(shù)據(jù)樣本的分布,盡可能使生成的假樣本擁有與真實(shí)樣本一致的概率分布。判別模型用來(lái)判別輸入的樣本是否為真實(shí)樣本,輸出值為0或1,相當(dāng)于一個(gè)二分類過(guò)程。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.2生成式對(duì)抗網(wǎng)絡(luò)GAN訓(xùn)練GAN網(wǎng)絡(luò)相當(dāng)于動(dòng)態(tài)博弈過(guò)程,通過(guò)交替訓(xùn)練GAN的生成模型與判別模型不斷地調(diào)整參數(shù),最終使判別器無(wú)法判別生成器的輸出結(jié)果是否為真,達(dá)到使生成器生成以假亂真數(shù)據(jù)樣本的目的。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)2016年,DeepMind公司主要基于強(qiáng)化學(xué)習(xí)算法研發(fā)的AlphaGo程序擊敗人類頂尖的職業(yè)圍棋選手這一消息震驚了全世界。強(qiáng)化學(xué)習(xí)方法起源于動(dòng)物心理學(xué)的相關(guān)原理,模仿人類和動(dòng)物學(xué)習(xí)的試錯(cuò)機(jī)制,是一種通過(guò)與環(huán)境交互,從學(xué)習(xí)狀態(tài)到行為的映射關(guān)系,以獲得最大累積期望回報(bào)的方法。狀態(tài)到行為的映射關(guān)系也即策略,表示在各個(gè)狀態(tài)下智能體采取的行為或行為概率。強(qiáng)化學(xué)習(xí)最大的特點(diǎn)是在與環(huán)境的交互中進(jìn)行學(xué)習(xí)。在與環(huán)境的互動(dòng)中,智能體根據(jù)它們獲得的獎(jiǎng)勵(lì)和懲罰不斷學(xué)習(xí),以更好地適應(yīng)環(huán)境。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)的核心思想是試錯(cuò)機(jī)制,即讓智能體在與環(huán)境的交互過(guò)程中不斷學(xué)習(xí)和反饋,以獲得最大的累計(jì)獎(jiǎng)勵(lì)。通常可以使用馬爾可夫決策過(guò)程對(duì)RL問(wèn)題建模,表示為一個(gè)五元組(S,P,A,R,γ),其中S代表一個(gè)有限的狀態(tài)集合,A代表一個(gè)動(dòng)作集合,P代表一個(gè)狀態(tài)轉(zhuǎn)移概率矩陣,R代表一個(gè)回報(bào)函數(shù),γ代表一個(gè)折扣因子,具體的學(xué)習(xí)過(guò)程如圖所示。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)為了獲得環(huán)境反饋給智能體的最大獎(jiǎng)勵(lì),智能體根據(jù)環(huán)境的即時(shí)狀態(tài)St選擇并執(zhí)行它認(rèn)為的最優(yōu)動(dòng)作At。環(huán)境接受動(dòng)作At后,以一定概率轉(zhuǎn)移到下一狀態(tài)St+1,并把一個(gè)獎(jiǎng)勵(lì)Rt反饋給智能體,智能體根據(jù)獎(jiǎng)勵(lì)Rt和當(dāng)前狀態(tài)St+1選擇下一個(gè)動(dòng)作。而t時(shí)刻的累計(jì)獎(jiǎng)勵(lì)R就是即時(shí)獎(jiǎng)勵(lì)Rt與后續(xù)所有可能采取的動(dòng)作和導(dǎo)致的環(huán)境狀態(tài)的價(jià)值之和。由于距離當(dāng)前狀態(tài)越遠(yuǎn),不確定性越高,需要乘以一個(gè)折扣因子γ來(lái)調(diào)整未來(lái)的每個(gè)即時(shí)獎(jiǎng)勵(lì)對(duì)于累計(jì)獎(jiǎng)勵(lì)的影響。累計(jì)獎(jiǎng)勵(lì)公式R表示如下:北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)如果Agent的某個(gè)行為策略導(dǎo)致環(huán)境對(duì)Agent正的獎(jiǎng)賞(reward),則Agent以后采取這個(gè)行為策略的趨勢(shì)會(huì)加強(qiáng)。反之,若某個(gè)行為策略導(dǎo)致了負(fù)的獎(jiǎng)賞,那么Agent此后采取這個(gè)動(dòng)作的趨勢(shì)會(huì)減弱。人工智能的目標(biāo)是賦予機(jī)器像人一樣思考的能力。更進(jìn)一步,希望創(chuàng)造出像人類一樣具有自我意識(shí)和思考的人工智能。強(qiáng)化學(xué)習(xí)與監(jiān)督學(xué)習(xí)的不同之處在于,監(jiān)督學(xué)習(xí)涉及以執(zhí)行任務(wù)的正確動(dòng)作集的形式向代理提供反饋。相比之下,強(qiáng)化學(xué)習(xí)使用獎(jiǎng)勵(lì)和懲罰作為積極和消極行為的信號(hào),它可以從自己的經(jīng)驗(yàn)和行為中學(xué)習(xí),對(duì)機(jī)器人自己創(chuàng)建一個(gè)高效的自適應(yīng)控制系統(tǒng)至關(guān)重要。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)遷移學(xué)習(xí)主要是運(yùn)用已有的知識(shí)對(duì)不同但相關(guān)領(lǐng)域的問(wèn)題進(jìn)行求解,從根本上放寬了傳統(tǒng)機(jī)器學(xué)習(xí)的基本假設(shè)。它打破了傳統(tǒng)機(jī)器學(xué)習(xí)對(duì)測(cè)試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)必須同分布的要求,是一種跨領(lǐng)域、跨任務(wù)的學(xué)習(xí)方法。遷移學(xué)習(xí)可以使訓(xùn)練過(guò)程中的時(shí)間成本和計(jì)算資源大大降低,獲得了廣泛的關(guān)注和應(yīng)用。遷移學(xué)習(xí)的基本思路是從一個(gè)或多個(gè)源領(lǐng)域(sourcedomain)任務(wù)中抽取知識(shí)和經(jīng)驗(yàn),然后應(yīng)用到一個(gè)目標(biāo)領(lǐng)域(targetdomain)中去。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)假設(shè)一個(gè)有標(biāo)簽的數(shù)據(jù)集為其中,xi為數(shù)據(jù)集中的第i個(gè)樣本,yi為其標(biāo)簽。定義χ為描述樣本X的特征空間,P(X)為X的邊緣概率分布,X的特征空間表示為定義γ為描述標(biāo)簽Y的標(biāo)簽空間,f(X)=P(Y|X)為條件概率分布,Y的標(biāo)簽空間表示為在遷移學(xué)習(xí)中,定義域D被定義為由樣本的特征空間及其邊緣概率分布的集合,即D={χ,P(X)};任務(wù)T被定義為由標(biāo)簽的標(biāo)簽空間及目標(biāo)預(yù)測(cè)函數(shù)的集合,即T={γ,ft(·)}。對(duì)于給定源域Ds和對(duì)應(yīng)的任務(wù)Ts,給定目標(biāo)域Dt和對(duì)應(yīng)任務(wù)Tt,遷移學(xué)習(xí)旨在Ds≠Dt或Ts≠Tt的條件下,通過(guò)在源域Ds和源任務(wù)Ts獲得的知識(shí)來(lái)幫助模型解決在目標(biāo)域Dt上的目標(biāo)任務(wù)Tt的預(yù)測(cè)函數(shù)ft(·),使得ft(·)在目標(biāo)域Dt上擁有最小的預(yù)測(cè)誤差。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)遷移學(xué)習(xí)的過(guò)程如圖所示。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個(gè)不同的類別?,F(xiàn)有的遷移學(xué)習(xí)研究大多都建立在源域和目標(biāo)域相似度較高的全局約束下。盡管整個(gè)源域數(shù)據(jù)不能直接被用到目標(biāo)域數(shù)據(jù)里,但還是可能在源域中找到一些可以重新被用到目標(biāo)域中的數(shù)據(jù)?;趯?shí)例的遷移學(xué)習(xí)方法根據(jù)一定的權(quán)重生成規(guī)則,對(duì)相同或相似的數(shù)據(jù)樣本調(diào)整權(quán)重,進(jìn)行重用,遷移學(xué)習(xí)后的預(yù)測(cè)效果更準(zhǔn)確。1.基于實(shí)例的遷移學(xué)習(xí)北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個(gè)不同的類別?;谔卣鞯倪w移學(xué)習(xí)方法是指通過(guò)特征變換的方式進(jìn)行遷移,來(lái)減少源域和目標(biāo)域之間的差距。在機(jī)器學(xué)習(xí)的訓(xùn)練過(guò)程中,篩選出一些好的有代表性的特征,通過(guò)特征變換把源域和目標(biāo)域的特征變換到同樣的空間,使這個(gè)空間中源域和目標(biāo)域的數(shù)據(jù)具有相同的分布,然后利用傳統(tǒng)的機(jī)器學(xué)習(xí)進(jìn)行分類和預(yù)測(cè)研究。2.基于特征的遷移學(xué)習(xí)北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個(gè)不同的類別。假設(shè)源域任務(wù)模型和目標(biāo)域任務(wù)模型之間可以共享一些參數(shù),或者共享模型超參數(shù)的先驗(yàn)分布,基于模型的遷移學(xué)習(xí)方法就是將源域任務(wù)模型可以共享的參數(shù)遷移到新的目標(biāo)域任務(wù)的模型上。在機(jī)器學(xué)習(xí)訓(xùn)練中,這種方法可以節(jié)省大量的時(shí)間成本和計(jì)算資源,使訓(xùn)練過(guò)程更高效、更快捷。3.基于模型的遷移學(xué)習(xí)北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個(gè)不同的類別。基于關(guān)系的遷移學(xué)習(xí)方法重點(diǎn)關(guān)注源域和目標(biāo)域樣本之間的關(guān)系,利用源域中的邏輯網(wǎng)絡(luò)將相似的關(guān)系進(jìn)行遷移,比如生物病毒傳播到計(jì)算機(jī)病毒傳播的遷移,師生關(guān)系到上司下屬關(guān)系的遷移。統(tǒng)計(jì)關(guān)系學(xué)習(xí)是基于關(guān)系的遷移學(xué)習(xí)方法的主要技術(shù)。4.基于關(guān)系的遷移學(xué)習(xí)北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)智能交互是人與機(jī)器之間使用某種對(duì)話語(yǔ)言,以一定的交互方式,為完成確定任務(wù)的人與機(jī)器之間的交換過(guò)程。整個(gè)交互系統(tǒng)中從接入用戶的輸入信息開(kāi)始,包括語(yǔ)音、表情、手勢(shì)等多模態(tài)信息。我們?cè)趯?duì)話系統(tǒng)中對(duì)輸入的信息進(jìn)行理解,通過(guò)這個(gè)對(duì)話部分以后產(chǎn)生輸出,最后用文字、合成語(yǔ)音或行為展現(xiàn)出來(lái)。目前,新型的人機(jī)交互方式主要有語(yǔ)音交互、姿勢(shì)交互、觸摸交互、視線跟蹤與輸入交互、腦機(jī)交互、肌電交互、表情交互、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)以及多通道交互等。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)語(yǔ)音交互是讓機(jī)器能夠聽(tīng)懂人說(shuō)話,并根據(jù)人的話語(yǔ)執(zhí)行相應(yīng)的命令。語(yǔ)言是人類最重要的交流方式,如果機(jī)器能與人進(jìn)行語(yǔ)音交互,將使人們享受到更加輕松、自然的交互體驗(yàn)。語(yǔ)音交互的關(guān)鍵技術(shù)主要包括語(yǔ)音識(shí)別、語(yǔ)音合成和語(yǔ)義理解。語(yǔ)音識(shí)別對(duì)用戶的語(yǔ)言進(jìn)行特征分析,將其轉(zhuǎn)化為相應(yīng)的文本或計(jì)算機(jī)系統(tǒng)可識(shí)別的命令;語(yǔ)音合成將文本轉(zhuǎn)換成機(jī)器合成的語(yǔ)音;語(yǔ)義理解技術(shù)是,從語(yǔ)音識(shí)別輸出的文本中獲取語(yǔ)義信息從而理解用戶的意圖。10.4.1語(yǔ)音交互北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)姿勢(shì)交互是通過(guò)穿戴/移動(dòng)式傳感技術(shù)或計(jì)算機(jī)視覺(jué)技術(shù)對(duì)人體各個(gè)部位的狀態(tài)和動(dòng)作進(jìn)行檢測(cè)和識(shí)別。穿戴/移動(dòng)式傳感技術(shù)通過(guò)各種傳感設(shè)備主要感知以下3類信息:形狀變化、平移及旋轉(zhuǎn)運(yùn)動(dòng)、方位與距離。計(jì)算機(jī)視覺(jué)技術(shù)則是通過(guò)各種波長(zhǎng)的電磁波來(lái)感知軀體動(dòng)作。利用穿戴/移動(dòng)式傳感技術(shù)實(shí)現(xiàn)姿勢(shì)交互是一種主動(dòng)感知,其精度較高,但附屬感、侵入性較強(qiáng)。利用計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)姿勢(shì)交互是一種被動(dòng)感知,不需要穿戴額外的設(shè)備,交互體驗(yàn)更加自然,但對(duì)動(dòng)作和姿勢(shì)的識(shí)別精度略遜一籌。10.4.2姿勢(shì)交互北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)姿勢(shì)交互方式利用人的姿勢(shì)行為主要分為以下幾類:10.4.2姿勢(shì)交互(1)手部與手臂姿勢(shì)交互。五指和手臂的運(yùn)動(dòng)最精細(xì)復(fù)雜。(2)頭部姿勢(shì)交互。頭部姿勢(shì)包括“空間姿勢(shì)”和“移動(dòng)姿勢(shì)”。(3)全身姿勢(shì)交互。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)觸覺(jué)是人們感知物理世界的重要方式。人全身的皮膚上處處有能感知溫度、濕度、壓力、震動(dòng)、痛覺(jué)等多種感覺(jué)的觸覺(jué)感覺(jué)細(xì)胞,它們?cè)谥讣馍系姆植加葹槊芗?所以人們的手指觸覺(jué)非常敏感,在很多情況下幾乎可以替代視覺(jué)和聽(tīng)覺(jué)。因此觸摸式交互界面在人機(jī)交互領(lǐng)域大有可為。觸摸界面是一種“能把數(shù)字信息結(jié)合于日常的實(shí)體物件與物理環(huán)境中,從而實(shí)現(xiàn)對(duì)真實(shí)物理世界的增強(qiáng)”的用戶界面。具體而言,就是用戶通過(guò)物理操控(如傾斜、擠壓、搖晃等)進(jìn)行輸入,系統(tǒng)感知到用戶輸入后,以改變某物件物理形態(tài)(如顯示、收縮、震動(dòng)等)的方式為用戶提供反饋。10.4.3觸摸交互不同種類觸摸屏性能對(duì)比。P228北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)人們觀察外部世界時(shí),眼睛總是與其他人體活動(dòng)自然協(xié)調(diào)地工作,并且眼動(dòng)所需的認(rèn)知負(fù)荷很低,人眼的注視包含著當(dāng)前的任務(wù)狀況以及人的內(nèi)部狀態(tài)等信息,因此眼注視是一種非常好的能使人機(jī)對(duì)話變得簡(jiǎn)便、自然的候選輸入通道。眼動(dòng)測(cè)量方法經(jīng)歷了早期的直接觀察法、主觀感知法,后來(lái)發(fā)展為瞳孔—角膜反射向量法、眼電圖法、虹膜—鞏膜邊緣法、角膜反射法、雙普金野象法、接觸鏡法等。10.4.4視線跟蹤與輸入北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)目前,根據(jù)用戶眼動(dòng)信息發(fā)揮的不同作用和特點(diǎn),眼動(dòng)交互技術(shù)可分為視線反饋技術(shù)、視線點(diǎn)擊技術(shù)和視線輸入技術(shù)。(1)基于自然眼動(dòng)信息的視線反饋技術(shù)。視線反饋技術(shù)指的是一種基于視線眼動(dòng)信息,通過(guò)反饋來(lái)促進(jìn)視覺(jué)操作績(jī)效的交互技術(shù)。(2)基于視線操作的視線點(diǎn)擊技術(shù)。用于點(diǎn)擊操作的眼控技術(shù)主要是通過(guò)收集顯示屏上用戶注視點(diǎn)的坐標(biāo),再結(jié)合其他用戶行為來(lái)代替?zhèn)鹘y(tǒng)鼠標(biāo)部分功能的交互技術(shù)。(3)利用視線行為進(jìn)行輸入的視線輸入技術(shù)。眼控技術(shù)的另一種重要用途是視線輸入技術(shù),它在用戶對(duì)特定輸入規(guī)則進(jìn)行學(xué)習(xí)的基礎(chǔ)上,結(jié)合計(jì)算機(jī)的識(shí)別和編碼,將視線移動(dòng)的軌跡序列或一定的停留時(shí)間編譯為輸入特定字符的指令,即利用視線動(dòng)作完成數(shù)字字母等字符的輸入任務(wù)。10.4.4視線跟蹤與輸入北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)腦機(jī)交互是人機(jī)交互的重要方向,依靠人的腦波信號(hào)直接識(shí)別翻譯成為機(jī)器的指令。顯然,這是一種直接的人機(jī)交互方式,將會(huì)對(duì)人機(jī)交互方式產(chǎn)生革命性的影響。10.4.5腦機(jī)交互腦機(jī)交互的實(shí)現(xiàn)有賴于腦功能的研究。腦功能的研究手段可分為以下幾類。(1)侵入式腦功能研究。就是把電極植入到腦內(nèi),形成皮質(zhì)腦電圖。(2)非侵入式腦功能研究。一種非侵入式MEG(腦磁信號(hào))設(shè)備,體量通常較大。另一種非侵入式設(shè)備是利用EEG(腦電)信號(hào),特點(diǎn)是設(shè)備非常小,非常便宜,可以做成便攜式裝置,實(shí)用性很好。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)通過(guò)腦電識(shí)別,人們可以探索人腦,發(fā)現(xiàn)感知認(rèn)知機(jī)理,解釋邏輯推理過(guò)程,提供有效的人工智能研究手段和技術(shù)途徑。如圖所示,腦機(jī)接口技術(shù)使用在頭皮或皮層神經(jīng)元記錄的腦電活動(dòng),并把它轉(zhuǎn)化為對(duì)外界的控制信號(hào)。10.4.5腦機(jī)交互腦電信號(hào)直接反映人腦的活動(dòng)和認(rèn)知特性,可以做情緒、疾病的監(jiān)測(cè)和腦機(jī)交互。它的應(yīng)用領(lǐng)域和前景非常廣闊,比如在人工智能領(lǐng)域,它可以探索人腦活動(dòng)和認(rèn)知規(guī)律,在腦機(jī)交互上也可以幫助殘疾人來(lái)控制輪椅等設(shè)備。在情緒監(jiān)測(cè)上可以感知人的工作狀態(tài)、壓力和焦慮等。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)另一方面,腦電信號(hào)分析研究目前仍存在不少問(wèn)題。主要包括以下幾點(diǎn)10.4.5腦機(jī)交互(1)腦電信號(hào)的識(shí)別性能。腦電信號(hào)的信噪比非常低,因此識(shí)別準(zhǔn)確率和計(jì)算復(fù)雜度通常難以滿足實(shí)際應(yīng)用需求。在研究中需要發(fā)現(xiàn)新的視覺(jué)驅(qū)動(dòng)與腦電信號(hào)的相關(guān)性,即低信噪比腦電信號(hào)下的高準(zhǔn)確識(shí)別理論。(2)腦電信號(hào)的降噪方法。目前,針對(duì)腦電信號(hào)多通道、強(qiáng)噪聲特點(diǎn)的有效降噪方法和分類理論尚不完善。(3)腦電信號(hào)的多通道鑒別分析。針對(duì)腦電信號(hào)的多通道鑒別分析,現(xiàn)有分類模型和相關(guān)通道選擇問(wèn)題的思路尚不十分有效,缺乏理論性支持。在研究中,需要尋找和探索更有效的基于思維的腦機(jī)交互范式,探索基于人視覺(jué)感知機(jī)理的計(jì)算模型。(4)腦機(jī)接口系統(tǒng)模式相對(duì)單一。研究中需要解決面向多種范式的思維腦控技術(shù)。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)生肌電一體化是近年來(lái)快速發(fā)展的前沿科學(xué)技術(shù),它通過(guò)生物體運(yùn)動(dòng)執(zhí)行系統(tǒng),感知系統(tǒng),控制系統(tǒng)等與機(jī)電裝置(機(jī)構(gòu)、傳感器、控制器等)的功能集成,使生物體或機(jī)電裝備的功能得到延伸。生肌電一體化機(jī)器人與普通機(jī)器人相比,最大的特點(diǎn)就是將“固定在人體上的機(jī)器”發(fā)展為神經(jīng)系統(tǒng)直接控制的運(yùn)動(dòng)功能替代裝置,由人的神經(jīng)電生理信號(hào)來(lái)控制假肢的行動(dòng)。10.4.6肌電交互人體的任何一個(gè)動(dòng)作都是由多組肌群在神經(jīng)系統(tǒng)的支配下相互協(xié)調(diào)、共同完成的。肌肉組織運(yùn)動(dòng)時(shí)會(huì)產(chǎn)生微弱的(mV級(jí))電位變化,肌肉的活動(dòng)信息不但能反映關(guān)節(jié)的伸屈狀態(tài)和伸屈強(qiáng)度,還能反映動(dòng)作過(guò)程中肢體的形狀和位置等信息。可見(jiàn),獲取肌電信號(hào)變化是感知人體動(dòng)作的重要方式,這可以由安裝在相應(yīng)肌群皮膚表面的表面肌電傳感器來(lái)完成。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)目前,表情交互研究主要針對(duì)靜態(tài)圖像、圖像序列或視頻中的二維、三維或四維數(shù)據(jù)提出大量的表情識(shí)別算法。除對(duì)人臉的6種基本表情以及中性表情的分析識(shí)別外,還有一些關(guān)于疼痛、微表情等的識(shí)別,這大大促進(jìn)了表情識(shí)別在醫(yī)學(xué)、心理學(xué)及助老助殘上的應(yīng)用。10.4.7表情交互表情交互是指從給定的人臉靜態(tài)圖像或動(dòng)態(tài)視頻序列中分離出特定的表情狀態(tài),從而確定被識(shí)別對(duì)象的心理情緒,實(shí)現(xiàn)對(duì)表情的理解與識(shí)別,實(shí)現(xiàn)更優(yōu)的人機(jī)交互。這種技術(shù)的重要性在于,人類在日常交流中,人臉表情可傳遞高達(dá)55%的信息。計(jì)算機(jī)對(duì)人類表情的識(shí)別和分析能夠改善人際交流,尤其對(duì)殘障人士的信息表達(dá)與理解具有重要意義。表情交互通常需要對(duì)面部表情進(jìn)行追蹤、編碼、識(shí)別。其中,面部表情的識(shí)別是最關(guān)鍵的一步。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)虛擬現(xiàn)實(shí)技術(shù)是20世紀(jì)末興起的一門(mén)嶄新的綜合性信息技術(shù),它融合了數(shù)字圖像處理、計(jì)算機(jī)圖形學(xué)、多媒體技術(shù)、傳感器技術(shù)等多個(gè)信息技術(shù)分支,大大推進(jìn)了計(jì)算機(jī)技術(shù)的發(fā)展。虛擬現(xiàn)實(shí)技術(shù)有3個(gè)特性,即沉浸感(immersion),交互性(interaction),思維構(gòu)想性(imagination)。10.4.8虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)虛擬現(xiàn)實(shí)技術(shù)是一種綜合應(yīng)用各種技術(shù)制造逼真的人工模擬環(huán)境,并有效模擬人在自然環(huán)境中的各種感知系統(tǒng)行為的高級(jí)人機(jī)交互技術(shù)。虛擬現(xiàn)實(shí)技術(shù)利用計(jì)算機(jī)生成三維視、聽(tīng)、觸覺(jué)等感覺(jué),使人通過(guò)適當(dāng)裝置,以虛擬的方式來(lái)體驗(yàn),并和所虛擬的世界進(jìn)行交互作用。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)(1)桌面式虛擬現(xiàn)實(shí)系統(tǒng)(desktopVR)。桌面式虛擬現(xiàn)實(shí)系統(tǒng)用電腦屏幕呈現(xiàn)三維虛擬環(huán)境,通過(guò)鼠標(biāo)、手柄等進(jìn)行交互。使用者可能因受到現(xiàn)實(shí)環(huán)境的干擾而缺乏沉浸體驗(yàn),但由于成本相對(duì)較低,應(yīng)用廣泛。(2)完全沉浸式虛擬現(xiàn)實(shí)系統(tǒng)(fully-immersiveVR)。完全沉浸式虛擬現(xiàn)實(shí)系統(tǒng)需要佩戴沉浸式的輸出設(shè)備(如頭盔、具有力反饋的機(jī)械手

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論