移動機(jī)器人原理與技術(shù) 課件 第9、10章 移動機(jī)器人的通信系統(tǒng)、移動機(jī)器人ROS系統(tǒng)_第1頁
移動機(jī)器人原理與技術(shù) 課件 第9、10章 移動機(jī)器人的通信系統(tǒng)、移動機(jī)器人ROS系統(tǒng)_第2頁
移動機(jī)器人原理與技術(shù) 課件 第9、10章 移動機(jī)器人的通信系統(tǒng)、移動機(jī)器人ROS系統(tǒng)_第3頁
移動機(jī)器人原理與技術(shù) 課件 第9、10章 移動機(jī)器人的通信系統(tǒng)、移動機(jī)器人ROS系統(tǒng)_第4頁
移動機(jī)器人原理與技術(shù) 課件 第9、10章 移動機(jī)器人的通信系統(tǒng)、移動機(jī)器人ROS系統(tǒng)_第5頁
已閱讀5頁,還剩278頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

移動機(jī)器人技術(shù)原理與應(yīng)用第九章

移動機(jī)器人的通信系統(tǒng)多機(jī)器人系統(tǒng)多任務(wù)及優(yōu)化分配方法移動多機(jī)器人編隊與路徑規(guī)劃方法9.1多機(jī)器人系統(tǒng)簡介9.29.3多移動機(jī)器人圍捕9.49.1多機(jī)器人系統(tǒng)簡介由多個機(jī)器人組成并可以通過彼此信息交互,能夠利用專門算法協(xié)作完成特定工作的系統(tǒng),一般稱為多機(jī)器人系統(tǒng)(Multi-RobotSystems,MRS)。多機(jī)器人系統(tǒng)的機(jī)器人在硬件組成和智能算法設(shè)計的投入上大多劣于設(shè)計為獨(dú)立完成工作的機(jī)器人,但設(shè)計多機(jī)器人系統(tǒng)的初衷卻是為了完成個體機(jī)器人不能夠完成的工作,希望利用量與協(xié)作的優(yōu)勢在具體任務(wù)中接替?zhèn)€體機(jī)器人工作。9.1.1多機(jī)器人系統(tǒng)分類按照多機(jī)器人系統(tǒng)是否具有移動能力可主要分為固定式多機(jī)器人系統(tǒng)(多機(jī)械臂)、可移動多機(jī)器人系統(tǒng)和混合多機(jī)器人系統(tǒng);同樣按照機(jī)器人的對應(yīng)運(yùn)動空間,可以按照三維和二維空間運(yùn)動進(jìn)行直觀分類。1.按移動能力分類(1)固定式多機(jī)器人系統(tǒng)固定式多機(jī)器人系統(tǒng),近年來在工業(yè)生產(chǎn)車間大量的出現(xiàn),其中雙臂機(jī)器人常常用于模擬人類,完成協(xié)同搬運(yùn)、傳遞、甚至是手術(shù)等工作。固定式多機(jī)器人系統(tǒng)大多共存在9.1.1多機(jī)器人系統(tǒng)分類一個較小的空間范圍,利用多個機(jī)械臂前端相同或不同的操作機(jī)構(gòu)完成任務(wù),其中已經(jīng)獲得廣泛應(yīng)用的如點(diǎn)焊多機(jī)器人系統(tǒng)。在汽車的生產(chǎn)流水線中,有非常多的環(huán)節(jié)需要多機(jī)械臂協(xié)作完成,其中點(diǎn)焊工藝環(huán)節(jié),存在4000-5000個焊點(diǎn),因此,車身焊接質(zhì)量的優(yōu)劣以及焊接效率的高低對整車的制造起著決定性的作用。所以,點(diǎn)焊生產(chǎn)流程是以一種典型的多機(jī)械臂的協(xié)作需求環(huán)境,多機(jī)器人系統(tǒng)設(shè)計需要綜合考慮焊點(diǎn)分配、焊接路徑、機(jī)器人可達(dá)性及避免碰撞等因9.1.1多機(jī)器人系統(tǒng)分類素,對白車身側(cè)圍點(diǎn)焊多機(jī)器人協(xié)調(diào)焊接進(jìn)行路徑規(guī)劃,以實(shí)現(xiàn)多機(jī)人焊點(diǎn)任務(wù)均勻分配和單機(jī)器人焊接路徑最優(yōu)的焊接要求,提高生產(chǎn)效率。點(diǎn)焊多機(jī)器人系統(tǒng)9.1.1多機(jī)器人系統(tǒng)分類類似人類雙臂通過協(xié)同操作將單臂不能完成的工作完成,這也是多機(jī)械臂結(jié)構(gòu)的多機(jī)器人系統(tǒng)的應(yīng)用場景。雙臂協(xié)同機(jī)械臂操作示意的生產(chǎn)過程,描述了較為常見的多固定式機(jī)器人協(xié)同協(xié)系統(tǒng),這種系統(tǒng)的存在除能夠完成單臂無法完成的搬運(yùn)工作外,還能完成對目標(biāo)物體位姿的調(diào)整,特別是存在不穩(wěn)定外部環(huán)境時,多機(jī)械臂系統(tǒng)的協(xié)同可以保障搬運(yùn)工作局部的穩(wěn)定,這類系統(tǒng)在空、天環(huán)境經(jīng)常被應(yīng)用于保持物體的姿態(tài),提供下一步裝配、修理的基礎(chǔ)。9.1.1多機(jī)器人系統(tǒng)分類雙臂協(xié)同機(jī)械臂操作示意圖9.1.1多機(jī)器人系統(tǒng)分類雙IIWAR800機(jī)械臂協(xié)同搬運(yùn)應(yīng)用右圖是一款輕型多機(jī)械裝配機(jī)器人,其被使用在了國際空間站的ROKVISS任務(wù)實(shí)驗中,借助兩個庫卡7自由度帶有關(guān)節(jié)扭矩傳感器的IIWAR800機(jī)械臂的協(xié)同操作,完成在空間站中的物體裝配。協(xié)同搬運(yùn)多機(jī)械臂系統(tǒng)對于動態(tài)操作環(huán)境,具有良好的可靠性保障。9.1.1多機(jī)器人系統(tǒng)分類上圖中的雙臂機(jī)器人系統(tǒng),展示了裝配過程中對于多機(jī)器人系統(tǒng)的需求。裝配過程本身就是一個需要多方協(xié)調(diào),并將目標(biāo)物確定在一定范圍內(nèi),裝配器件與被裝配器件保持相對靜態(tài)的過程。所以,多機(jī)械臂系統(tǒng)在裝配工業(yè)環(huán)境中有較多的應(yīng)用,在汽車整裝車間、水下無人管道維修以及太空維修作業(yè)等替代了大量的人工工作。其最大的特征在于通過多個機(jī)械臂之間的協(xié)調(diào),保證裝配工作空間的相對穩(wěn)定。9.1.1多機(jī)器人系統(tǒng)分類(2)移動多機(jī)器人系統(tǒng)移動多機(jī)器人系統(tǒng)一般由幾個至幾十個移動機(jī)器人組成,其可以是由異構(gòu)的移動機(jī)器人組成,但基本特征在于系統(tǒng)中機(jī)器人均可按照指令合作完成對象任務(wù),系統(tǒng)中各個機(jī)器人的基本信息,如:位置、速度、方向、目標(biāo)、能量等能夠進(jìn)行交互,且整體系統(tǒng)的控制方案均以多機(jī)器人交互信息作為決策參考依據(jù)。移動式多機(jī)器人按照其行動決策發(fā)出方式又可分為集中式、分布式和混合式。9.1.1多機(jī)器人系統(tǒng)分類1)集中式控制移動多機(jī)器人系統(tǒng)在早期的多機(jī)器人控制方式設(shè)計時,采用集中式控制,各個機(jī)器人將自身當(dāng)前狀態(tài)按照固定通信協(xié)議模式上傳至中央處理服務(wù)器。圖中所示為集中式控制方式的機(jī)器人系統(tǒng),雖然系統(tǒng)各個機(jī)器人也存在通信的可能,但是下一時刻任務(wù)命令的決策來源于中央處理服務(wù)對各機(jī)器人狀態(tài)的評估,很明顯,當(dāng)機(jī)器人數(shù)量、狀態(tài)或是執(zhí)行任務(wù)類型的增多,對中央服務(wù)器的計算能力效率提出較高的要求,更加重要的是采用集9.1.1多機(jī)器人系統(tǒng)分類中式控制方式,需要機(jī)器人與中央服務(wù)器之間具有良好的通信保證,這就制約了這種控制方式的應(yīng)用場景。集中式控制方式9.1.1多機(jī)器人系統(tǒng)分類2)分布式控制移動多機(jī)器人系統(tǒng)分布式多機(jī)器人系統(tǒng)能充分利用機(jī)器人的數(shù)據(jù)處理資源,分擔(dān)中央處理機(jī)的壓力,在靈活性、容錯性方面具有很大優(yōu)勢,分布式控制最大的優(yōu)勢在于,系統(tǒng)每個機(jī)器人作為一個獨(dú)立的個體感知環(huán)境,機(jī)器人采用的自身搭載的控制策略,結(jié)合區(qū)域內(nèi)有信息交互的機(jī)器人狀態(tài)和調(diào)整自身狀態(tài),在自身搭載的MCU中完成自己路徑規(guī)劃、沖突消解、避障等動態(tài)行為,從而降低計算系統(tǒng)的復(fù)雜度,較集中式控制方式能夠在現(xiàn)響應(yīng)的實(shí)時性具有優(yōu)勢。9.1.1多機(jī)器人系統(tǒng)分類每個移動機(jī)器人均可以按照自身搭載的控制方法完成任務(wù),也可以根據(jù)所系統(tǒng)內(nèi)不同機(jī)器人的狀態(tài)、任務(wù)等完成沖突消解、協(xié)同SLAM等任務(wù)。異構(gòu)分布式移動多機(jī)器人系統(tǒng)9.1.1多機(jī)器人系統(tǒng)分類3)混合式多機(jī)器人系統(tǒng)可以結(jié)合移動平臺的靈活性和固定平臺穩(wěn)定性,組成具有混合結(jié)構(gòu)的多機(jī)器人系統(tǒng),其所能完成的任務(wù)、效率以及穩(wěn)定性將大大的超過了固定式或移動式機(jī)器人的能力范圍,但控制過程更加復(fù)雜。圖中描述了一個分布式的移動多平臺機(jī)械臂協(xié)作系統(tǒng),該設(shè)計中將一個不能夠被單一機(jī)器人搬運(yùn)的物體,采用多機(jī)器人系統(tǒng)協(xié)作進(jìn)行搬運(yùn)完成,該過程包含了協(xié)同操作,目標(biāo)跟蹤,區(qū)域覆蓋等技術(shù)環(huán)節(jié)。9.1.1多機(jī)器人系統(tǒng)分類3)混合式多機(jī)器人系統(tǒng)混合式多機(jī)器人平臺示意圖9.1.1多機(jī)器人系統(tǒng)分類2.根據(jù)多機(jī)器人運(yùn)動空間分類(1)以三維控制為主的多機(jī)器人系統(tǒng)多四旋翼組成燈光展示9.1.1多機(jī)器人系統(tǒng)分類(1)以三維控制為主的多機(jī)器人系統(tǒng)單一的四旋翼控制可以依靠人類完成,但是多機(jī)器人、群體機(jī)器人系統(tǒng)一定是需要按照事先設(shè)定好的程序完成。完成的主要功能是讓不同集合的四旋翼懸停在指定高度,利用不同高度的機(jī)器人形成二維或三維空間,簡單講就是利用四旋翼能夠懸停的特征在空中構(gòu)建出一個類似LED點(diǎn)陣的框架,然后通過調(diào)節(jié)四旋翼上的燈光形成不同的圖樣。9.1.1多機(jī)器人系統(tǒng)分類(1)以三維控制為主的多機(jī)器人系統(tǒng)對于群集四旋翼系統(tǒng),其設(shè)計目的重點(diǎn)并不在于機(jī)器人之間的合作,或者說各個四旋翼之間并不會因為彼此位置關(guān)系的變化而受影響或影響其它個體的行為。按照協(xié)同規(guī)則將多機(jī)器人作為一個整體進(jìn)行控制并完成任務(wù),才是多機(jī)器人控制系統(tǒng)設(shè)計更為關(guān)心的。但是,對于空中機(jī)器人其首要解決的是自身穩(wěn)定問題,特別是其運(yùn)動過程需要持續(xù)的動力支持,這對控制系統(tǒng)提出較高的要求。9.1.1多機(jī)器人系統(tǒng)分類(1)以三維控制為主的多機(jī)器人系統(tǒng)以三維空間作為應(yīng)用空間的多機(jī)器人系統(tǒng),還有目標(biāo)為水下的應(yīng)用環(huán)境,與空中環(huán)境不同在于,水下環(huán)境能夠提供機(jī)器人一個無動力條件下較穩(wěn)定的靜止?fàn)顟B(tài),因此,根據(jù)不同任務(wù)在不同的水下器具上增加智能設(shè)備,使其能夠自主跟隨或按照需求進(jìn)行編隊、局部通信、組網(wǎng)等方式形成多水下機(jī)器人系統(tǒng),相對單個水下機(jī)器人,多機(jī)器人系統(tǒng)能夠在特定的任務(wù)中展現(xiàn)出極強(qiáng)的優(yōu)勢,整體工作范圍得到了擴(kuò)大,整個系統(tǒng)的魯棒性得到了提升。9.1.1多機(jī)器人系統(tǒng)分類(2)二維空間特征的多機(jī)器人系統(tǒng)二維空間特征的一般將在平面運(yùn)動的多機(jī)器人系統(tǒng)認(rèn)為是二維特征的多機(jī)器人系統(tǒng),這其中主要包括了:輪式機(jī)器人、履帶式機(jī)器人、仿生動物足類機(jī)器人等。這些機(jī)器人本體的運(yùn)動空間是相似的,但是其結(jié)構(gòu)差別較大。結(jié)構(gòu)差別主要取決于該機(jī)器人使用的地形環(huán)境,如輪式機(jī)器人,常用于鋪裝或較為平坦的道路,承載較低的物品常用于倉儲、物流的分類、園區(qū)的巡邏、變電站的無人值守與監(jiān)測等;履帶式機(jī)器人,常見用于草地、沙地等輪式結(jié)構(gòu)容易9.1.1多機(jī)器人系統(tǒng)分類被阻礙的場地,履帶式結(jié)構(gòu)移動機(jī)器人承載能力較輪式機(jī)器人大,能耗也大,常見的有拆彈、武器搭載、工程機(jī)械搭載等場景;仿生動物足類機(jī)器人,根據(jù)其仿生對象的不同足類數(shù)目也不盡相同,近年常見的有Bostonpower的雙足類人、四足機(jī)器狗、六組螞蟻、八足蜘蛛等等,其主要優(yōu)越性表現(xiàn)在不規(guī)則地形的運(yùn)動,以及更加類似智能生物的外形結(jié)構(gòu),并且一部分類型機(jī)器人如機(jī)器狗,已經(jīng)在美軍的阿富汗戰(zhàn)爭中使用,用于武器搬運(yùn)、戰(zhàn)地守護(hù)以及通信中繼、組網(wǎng)等。9.1.2多機(jī)器人系統(tǒng)任務(wù)分類根據(jù)執(zhí)行任務(wù)內(nèi)容的不同,多機(jī)器人系統(tǒng)任務(wù)分為:多機(jī)器人裝配、多機(jī)器人焊接、多機(jī)器人編隊、多機(jī)器人圍捕、多機(jī)器人協(xié)同SLAM、多機(jī)器人協(xié)同避障等。1.按照是否存在空間任務(wù)沖突分類(1)無空間沖突任務(wù)以多機(jī)器人系統(tǒng)的裝配任務(wù)為例,大致分為兩種,一是并行關(guān)系,系統(tǒng)中每個機(jī)器人只關(guān)心自己負(fù)責(zé)的工作內(nèi)容,兩兩機(jī)器人之間的工作沒有前后時序關(guān)系,不需要機(jī)器人之間的直接配合,這種工作方式又常常稱為并聯(lián)機(jī)器人。9.1.2多機(jī)器人系統(tǒng)任務(wù)分類

Delta并聯(lián)機(jī)器人操作示意圖9.1.2多機(jī)器人系統(tǒng)任務(wù)分類二是需要協(xié)同作業(yè),這種協(xié)同內(nèi)容又可以分為空間共享協(xié)同和工作內(nèi)容協(xié)同。工作內(nèi)容協(xié)同,以組裝過程為例,主要是需要兩個或兩個以上的機(jī)械臂,對裝配本體和裝配零件提供一個相對穩(wěn)定的作業(yè)狀態(tài),相對于并行多機(jī)器人系統(tǒng)優(yōu)勢在于,一個被裝配本體能夠在一個穩(wěn)定的空間內(nèi)被多次旋轉(zhuǎn)、平移,配合另一個機(jī)械臂操作完成一輪裝配任務(wù),這種方式可以有效減少被裝配本體的移動。9.1.2多機(jī)器人系統(tǒng)任務(wù)分類陜汽集團(tuán)車廂焊接車間多機(jī)器人操作9.1.2多機(jī)器人系統(tǒng)任務(wù)分類(2)存在空間沖突的多機(jī)器人任務(wù)多機(jī)器人焊接工作是一個非常有特點(diǎn)的存在操作空間沖突的任務(wù),下圖所示動態(tài)調(diào)整操作序列的多機(jī)器人無碰撞運(yùn)動規(guī)劃,是針對車體焊接問題進(jìn)行多機(jī)械臂協(xié)同控制的范例。說明了多機(jī)器人在共享工作空間內(nèi)協(xié)調(diào)工作,能有效地提高生產(chǎn)效率和減少空間資源占據(jù),但同樣存在多機(jī)器人互斥工作區(qū)域沖突的問題。所以多機(jī)器人局部空間共享與工作區(qū)、工作端軌跡互斥是該類多機(jī)器人任務(wù)的基本特征。9.1.2多機(jī)器人系統(tǒng)任務(wù)分類多機(jī)器人共享空間任務(wù)特征示意圖9.1.2多機(jī)器人系統(tǒng)任務(wù)分類2.按照多機(jī)器人系統(tǒng)中的任務(wù)分配需求分類(1)靜態(tài)任務(wù)分配靜態(tài)任務(wù)主要出現(xiàn)在:系統(tǒng)第一次上線情況,及在任務(wù)分配初始時刻所有工位均處于未分配狀態(tài),機(jī)器人處于空閑狀態(tài);或是車間中某臺機(jī)器進(jìn)行檢修,首次加入到車間生產(chǎn)系統(tǒng)中時,該并條機(jī)整機(jī)工位均處于未分配狀態(tài)。則任務(wù)分配決策過程中,每個機(jī)器人根據(jù)目標(biāo)函數(shù)值,選擇最適合自己的任務(wù),如果有機(jī)器人選擇了相同的任務(wù),則它們之間呈現(xiàn)協(xié)作關(guān)系。任務(wù)執(zhí)行時,由于每個智能機(jī)器人9.1.2多機(jī)器人系統(tǒng)任務(wù)分類被認(rèn)為單獨(dú)完成任務(wù)的能力有限,因此,每個機(jī)器人在時刻t只能選擇一個任務(wù)T執(zhí)行,每個任務(wù)需要由多個機(jī)器人協(xié)作且機(jī)器人處于空閑狀態(tài)才能響應(yīng)任務(wù)的請求。(2)動態(tài)任務(wù)分配在實(shí)際生產(chǎn)中存在動態(tài)情況發(fā)生時,定義動態(tài)情況為系統(tǒng)中某一時刻t有新任務(wù)的產(chǎn)生或任務(wù)丟失事件發(fā)生時,環(huán)境的動態(tài)變化會導(dǎo)致任務(wù)完成的代價發(fā)生變化,從而導(dǎo)致目標(biāo)函數(shù)值的變化,故系統(tǒng)需要根據(jù)機(jī)器人的能力約束和目標(biāo)值,盡量在不改變原期望的結(jié)果的情況下快速尋找最9.1.2多機(jī)器人系統(tǒng)任務(wù)分類優(yōu)調(diào)整策略。這就要求將一組任務(wù)分配給一組機(jī)器人的同時,要將能力約束與任務(wù)調(diào)度結(jié)合起來,在約束條件中建立和時間有關(guān)的目標(biāo)函數(shù)找到一組任務(wù)的最優(yōu)分配給一個機(jī)器人子集,該子集將負(fù)責(zé)完成任務(wù)。3.按照機(jī)器人對任務(wù)的執(zhí)行情況分類(1)緊耦合型任務(wù)緊耦合型任務(wù)是指在系統(tǒng)中一個任務(wù)的完成需要多個機(jī)器人相互協(xié)作,且任務(wù)不能被分解。9.1.2多機(jī)器人系統(tǒng)任務(wù)分類系統(tǒng)中如果任務(wù)完成所需的機(jī)器人中有一個不能參與或出現(xiàn)故障,則任務(wù)將不能被完成。(2)松耦合型任務(wù)松耦合型任務(wù)是指在多機(jī)器人系統(tǒng)中,機(jī)器人個體之間在沒有緊密通信的情況下能夠單獨(dú)完成某項任務(wù)。一般情況下一個任務(wù)是可被分解的,這個任務(wù)的子任務(wù)可以交給具有任務(wù)執(zhí)行能力的個體單獨(dú)完成。9.2多機(jī)器人系統(tǒng)多任務(wù)及優(yōu)化分配方法任務(wù)的實(shí)時、合理分配是多機(jī)器人系統(tǒng)高效率運(yùn)行的必要條件,但當(dāng)環(huán)境中目標(biāo)較多且任務(wù)并非單一時,快速的尋找多機(jī)器人的多任務(wù)分配的最優(yōu)值對于尋優(yōu)模型具有較大的挑戰(zhàn)。任務(wù)分配問題可以簡單的概括為用一致的策略將不同的機(jī)器人分配給相應(yīng)的任務(wù),或為一組給定的任務(wù)和機(jī)器人分配合理的目標(biāo)。機(jī)器人的任務(wù)執(zhí)行獲利與消耗的數(shù)學(xué)抽象,通過任務(wù)執(zhí)行特征,定義多機(jī)器人的收益值模型,將尋求收益值模型的最優(yōu)值用于多機(jī)器人-多任務(wù)的分配中。9.2.1多機(jī)器人系統(tǒng)任務(wù)描述多機(jī)器人-多目標(biāo)-多任務(wù)問題的求解,可以理解為t時刻將r個機(jī)器人分配到k個期望的目標(biāo)位置執(zhí)行n個存在的任務(wù),即存在一個r×k×n三維任務(wù)求解集合,當(dāng)目標(biāo)、任務(wù)數(shù)增長時,用于工作的機(jī)器人數(shù)量隨之增長,造成待求解集合的數(shù)據(jù)成級數(shù)倍增長。1.目標(biāo)集與任務(wù)集為了多機(jī)器人的收益值模型具有良好的普適性,不限定特定目標(biāo),將目標(biāo)特征進(jìn)行數(shù)字化表達(dá)。并對于同一目標(biāo)存在有限種類任務(wù)需要執(zhí)行,則t時刻包含k個目標(biāo)集合可表示為:9.2.1多機(jī)器人系統(tǒng)任務(wù)描述多機(jī)器人-多目標(biāo)-多任務(wù)問題的求解,可以理解為t時刻將r個機(jī)器人分配到k個期望的目標(biāo)位置執(zhí)行n個存在的任務(wù),即存在一個r×k×n三維任務(wù)求解集合,當(dāng)目標(biāo)、任務(wù)數(shù)增長時,用于工作的機(jī)器人數(shù)量隨之增長,造成待求解集合的數(shù)據(jù)成級數(shù)倍增長。1.目標(biāo)集與任務(wù)集為了多機(jī)器人的收益值模型具有良好的普適性,不限定特定目標(biāo),將目標(biāo)特征進(jìn)行數(shù)字化表達(dá)。9.2.1多機(jī)器人系統(tǒng)任務(wù)描述對于同一目標(biāo)存在有限種類任務(wù)需要執(zhí)行,則t時刻包含k個目標(biāo)集合可表示為:對于第o個目標(biāo)可能存在需要被執(zhí)行的任務(wù)種類描述為:t時刻全局任務(wù)集合如下所示,存在k×n個任務(wù)需求:9.2.1多機(jī)器人系統(tǒng)任務(wù)描述對于具體的第o個目標(biāo)的第j個任務(wù),存在的基本任務(wù)特征進(jìn)行以下定義:任務(wù)位置特征

,任務(wù)響應(yīng)需求位置,與任務(wù)被執(zhí)行位置一致,其位置特征不隨時間變化;任務(wù)價值權(quán)值

,代表當(dāng)前第o個目標(biāo)第j個任務(wù)被執(zhí)行的價值;待優(yōu)先級特征

,假設(shè)任務(wù)響應(yīng)等待時間越長被響應(yīng)優(yōu)先級越高,目的使等待時間長的任務(wù)可以優(yōu)先被響應(yīng)。9.2.1多機(jī)器人系統(tǒng)任務(wù)描述等待時間由上一時刻機(jī)器人組完成任務(wù)時間確定,如下:分別是t時刻獲得分配的機(jī)器人i在上一時刻t-1完成工作的操作時間和運(yùn)動時間表達(dá)式,vi是第i個機(jī)器人的速度。2.多任務(wù)與機(jī)器人收益模型消耗,,表示t時刻第i個機(jī)器人執(zhí)行第o個目標(biāo)第j個任務(wù)時付出的消耗,例如電量耗費(fèi),根據(jù)與分配任務(wù)的距離關(guān)系可以具體量化為:9.2.1多機(jī)器人系統(tǒng)任務(wù)描述是第i個機(jī)器人當(dāng)前電量,

,

是機(jī)器人t時刻位置

與分配到第o個目標(biāo)第j個任務(wù)坐標(biāo)之間電量使用值和曼哈頓距離,單位米,距離可具體表示為:任務(wù)價值,對于任務(wù)來說,等待被執(zhí)行時間越長具有較高優(yōu)先級,與機(jī)器人執(zhí)行相距距離越短具有較高優(yōu)先級,即價值越高。9.2.1多機(jī)器人系統(tǒng)任務(wù)描述收益,

表示t時刻第i個機(jī)器人執(zhí)行第o個目標(biāo)的第j個任務(wù)時獲得的收益,對于存在最大延遲時間限制Dlim的收益值計算:對于機(jī)器人i對應(yīng)目標(biāo)-任務(wù)集合存在一個收益矩陣Hi(t),表達(dá)如下:9.2.1多機(jī)器人系統(tǒng)任務(wù)描述對于單一機(jī)器人i下一時刻的誘導(dǎo)執(zhí)行位,選擇收益值最大。對于第i機(jī)器人需要對任務(wù)集進(jìn)行遍歷計算其收益值矩陣,獲得最優(yōu)值作為誘導(dǎo)位單機(jī)器人多任務(wù)尋優(yōu)示意圖9.2.1多機(jī)器人系統(tǒng)任務(wù)描述3.多任務(wù)與多機(jī)器人全局收益模型面向隨機(jī)變化的多任務(wù)需求,多機(jī)器人系統(tǒng)收益全局尋優(yōu)過程中,需要考察以下問題:(1)難以解決同一任務(wù)多個機(jī)器人的收益值相等,以及同一機(jī)器人,多個任務(wù)收益相同的情況;(2)有“無放回尋優(yōu)”風(fēng)險,即當(dāng)一個機(jī)器人將某任務(wù)取走,任務(wù)集中不再有該任務(wù)用于其它機(jī)器人最優(yōu)收益評價,造成任務(wù)的局部最優(yōu)值與全局最優(yōu)值不統(tǒng)一。9.2.1多機(jī)器人系統(tǒng)任務(wù)描述(3)多個個體機(jī)器人的最優(yōu)求和,不能證明在“無放回尋優(yōu)”的多機(jī)器人多任務(wù)分配過程中是全局最優(yōu)的。需要進(jìn)行所有任務(wù)的分配收益評價,獲取全局最優(yōu)值。首先,在t時刻,我們將機(jī)器人集合與多目標(biāo)-多任務(wù)集合可能存在的收益值放入同一個全局收益值矩陣中。全局收益矩陣的子矩陣數(shù)為r個,與t時刻能夠進(jìn)行工作的機(jī)器人數(shù)量相同。9.2.1多機(jī)器人系統(tǒng)任務(wù)描述每次對每個收益子矩陣取一個收益值,進(jìn)行和值計算,則可組成全局收益值遍歷矩陣A(All)如下所示:收益值的獲取為保證目標(biāo)任務(wù)被執(zhí)行的唯一性。則獲得全局最優(yōu)值(GO,GlobalOptimum):9.2.1多機(jī)器人系統(tǒng)任務(wù)描述通過上式可獲得全局最優(yōu)評價條件下的個體機(jī)器人取值,

,即對應(yīng)全局最優(yōu)第m個子收益矩陣,角標(biāo)表示,第i個機(jī)器人執(zhí)行第o個目標(biāo)的第j個任務(wù)。通過上述多任務(wù)-移動多機(jī)器人全局收益模型的建立,則可以根據(jù)具體的應(yīng)用對象,結(jié)合不同的任務(wù)分配尋優(yōu)方法求解多機(jī)器人系統(tǒng)的多任務(wù)最優(yōu)分配結(jié)果。9.2.1多機(jī)器人系統(tǒng)任務(wù)描述多機(jī)器人多任務(wù)尋優(yōu)示意圖9.2.2多機(jī)器人系統(tǒng)任務(wù)分配方法多機(jī)器人系統(tǒng)首要解決的問題是:在有限的時間內(nèi),目標(biāo)任務(wù)分配集合能夠被提供多機(jī)器人群集合所響應(yīng)并執(zhí)行,并希望在短時間內(nèi)獲得多任務(wù)集合的分配結(jié)果最優(yōu)分配。對此,現(xiàn)有相關(guān)研究工作主要分為集中式任務(wù)分配方法和分散式任務(wù)分配方法。集中式方法中要求機(jī)器人擁有系統(tǒng)的全局信息,中央控制系統(tǒng)計算最優(yōu)或者接近最優(yōu)的決策,使多機(jī)器人系統(tǒng)效率最大化。9.2.2多機(jī)器人系統(tǒng)任務(wù)分配方法在分散式分配方法中,每個機(jī)器人都需要做出自己的決策,這使得系統(tǒng)靈活性和魯棒性更好。機(jī)器人之間可以相互協(xié)作,使系統(tǒng)的效率最大化。協(xié)商是分布式機(jī)器人相互合作的有效方式。但是一個機(jī)器人只能協(xié)商一次。如果一個機(jī)器人想要參與另一個協(xié)商,需要離線并重新編程以調(diào)整新的協(xié)商協(xié)議,即機(jī)器人不是獨(dú)立于協(xié)議的。然而,不同的環(huán)境中,機(jī)器人往往需要與不同的團(tuán)隊成員完成不同的工作。9.2.2多機(jī)器人系統(tǒng)任務(wù)分配方法現(xiàn)有的分布式任務(wù)分配方法主要有三種類型:基于優(yōu)化的、基于市場和博弈論。1.基于優(yōu)化的方法根據(jù)在每個迭代步都存在矩陣等待最優(yōu)分配求解,為了能夠相對更優(yōu)的解決方案,學(xué)者們利用分布式計算、群集智能等,提出了多種優(yōu)化模型和算法。雖然基于優(yōu)化的方法具有良好的探索性和廣泛的應(yīng)用領(lǐng)域,但很難設(shè)計出合適的局部決策規(guī)則。大多數(shù)基于優(yōu)化的方法都用于集中式任務(wù)分配。9.2.2多機(jī)器人系統(tǒng)任務(wù)分配方法2.基于市場的方法拍賣算法是一種典型的基于市場的方法,它是一個迭代過程,其中比較多個機(jī)器人的出價以確定最佳報價,最后的交易由出價最高的獲得。雖然基于市場的方法具有良好的魯棒性和可擴(kuò)展性,但也存在一些缺陷。如①缺乏有效的個體控制策略實(shí)際方法;②引入必要的談判和懲罰方案時表現(xiàn)不佳。9.2.2多機(jī)器人系統(tǒng)任務(wù)分配方法3.基于博弈的方法從是否存在外部權(quán)威來執(zhí)行規(guī)則的角度來看,博弈可以分為合作博弈和非合作博弈。在合作博弈中,首先將特征聯(lián)盟形成博弈,利用收益和損耗關(guān)系用于解決多自主機(jī)器人之間的任務(wù)分配問題。該方法需要考慮博弈者雙方的利益,在兩者之間達(dá)到一個均衡狀態(tài),就很難達(dá)到全局最優(yōu)或近似全局最優(yōu)。利用博弈論解決多機(jī)器人動態(tài)任務(wù)分配,需要解決兩個關(guān)鍵問題:①博弈模型效率低下;②學(xué)習(xí)算法缺乏實(shí)時性和全局優(yōu)化能力。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用1.移動多機(jī)器人需求描述移動多機(jī)器人系統(tǒng)常常用于處理多目標(biāo)和多任務(wù)(MRMOT),無論是已經(jīng)普及應(yīng)用的智能倉儲,還是根據(jù)特定工藝流程的進(jìn)行研發(fā)車間移動多機(jī)器人系統(tǒng),都需要對其所需求的多任務(wù)、多目標(biāo)進(jìn)行模型的建立。紡織廠車間的生產(chǎn)方式是具有明顯多機(jī)器人系統(tǒng)需求的場景,因此以紡織生產(chǎn)車間為描述環(huán)境,進(jìn)而根據(jù)實(shí)際的應(yīng)用場景進(jìn)行分配方法的優(yōu)化研究。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用2.車間多目標(biāo)多任務(wù)的模型描述以紡織廠精梳車間為例,精梳車間機(jī)器人搬運(yùn)過程中的任務(wù)分配是指在某一并條機(jī)在對上一棉卷加工完成之后,有下一個任務(wù)加工需求但工位空缺時,哪一個機(jī)器人去響應(yīng)任務(wù)的號召將精梳機(jī)加工完成的棉卷從精梳機(jī)搬運(yùn)到并條機(jī)相應(yīng)工位。具體針對下圖精梳車間工藝流程中虛線框中部分的任務(wù)分配,以并條機(jī)工位作為任務(wù)對象,棉卷作為搬運(yùn)對象。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用精梳車間工藝流程圖傳統(tǒng)紡織車間需要人工判斷并使用推車進(jìn)行棉卷的轉(zhuǎn)運(yùn)和上料。并條機(jī)端M有四個工作點(diǎn)位M1,M2,M3,M4需要同時換料,在給并條機(jī)的上料之前需要等待精梳機(jī)加工的完成,會造成取料延誤,同時,工人就近取料也易造成遠(yuǎn)處并條機(jī)的等待延誤時間。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用將實(shí)際車間生產(chǎn)環(huán)境構(gòu)造為如圖所示的多機(jī)器人隨機(jī)分布的精梳機(jī)車間示意圖,每一個機(jī)器人只有負(fù)載一個棉卷的能力,只要并條機(jī)某一工位有任務(wù)需求則機(jī)器人就能夠響應(yīng),使得各工位之間獨(dú)立運(yùn)行,換料時間互不等待。所以針對工序特征,將每個工作點(diǎn)位獨(dú)立作為供料對象,存在條并卷機(jī)8臺,工作點(diǎn)位8個/臺,充電位1個,棉卷供給機(jī)1臺,替代人工的機(jī)器人若干。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用精梳車間機(jī)器分布和車間任務(wù)抽象簡化圖具體的紡織生產(chǎn)過程中的任務(wù)環(huán)境抽象簡化為如下圖所示,圖中紅色方框表示生產(chǎn)工位,T1~Tn代表存在n個任務(wù)需求(即任務(wù)分布情況),黑色圓點(diǎn)表示具有簡單思維判斷的智能移動機(jī)器人。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用3.機(jī)器人及任務(wù)抽象描述由于多任務(wù)的完成需要移動機(jī)器人具有彼此合作、協(xié)調(diào)和談判的能力,移動機(jī)器人需要進(jìn)行自身判斷和信息共享,在紡織品生產(chǎn)系統(tǒng)中,可將執(zhí)行搬運(yùn)工作的移動機(jī)器人抽象成一個具有簡單邏輯判斷的機(jī)器人Agent。同時,由于從精梳機(jī)上下料的棉卷在厚度上存在一定的差異,并且任意兩個并條機(jī)的不同工作點(diǎn)在工作完成時間上的不同步,因此,對于順序執(zhí)行和分配僅存在于車間內(nèi)機(jī)器首次開車工作時,任務(wù)的產(chǎn)生是隨機(jī)的、個體任務(wù)9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用3.機(jī)器人及任務(wù)抽象描述產(chǎn)生時的機(jī)器人個體狀態(tài)也是隨機(jī)的,因此,類紡織車間棉卷搬運(yùn)任務(wù)分配問題是一個動態(tài)決策問題。隨時間的變化而變化,包括環(huán)境變化,因此從實(shí)現(xiàn)的角度來看,可以看作是三個基本對象:時間、任務(wù)環(huán)境狀態(tài)信息和機(jī)器人之間的交互,所以該問題符合在時間上迭代求解。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用4.基于博弈論算法的多任務(wù)分配方法實(shí)現(xiàn)(1)工位任務(wù)狀態(tài)描述在某一時刻t工位任務(wù)Ti的狀態(tài)用函數(shù)描述,該函數(shù)中posi表示任務(wù)的位置坐標(biāo)信息;

時表示生產(chǎn)過程中t時刻Ti對機(jī)器人有任務(wù)請求,

時表示生產(chǎn)過程中t時刻Ti對機(jī)器人無任務(wù)請求;

表示t時刻任務(wù)Ti被某一機(jī)器人執(zhí)行后,該機(jī)器人所能得到的收益。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用(2)機(jī)器人狀態(tài)在t時刻機(jī)器人Aj的狀態(tài)用函數(shù)描述,該函數(shù)中

是機(jī)器人Aj在t時刻的位置坐標(biāo)信息;

表示機(jī)器人Aj在t時刻相應(yīng)的能量存儲值;vj是機(jī)器人Aj的速度值;

是t時刻機(jī)器人Aj任務(wù)分配狀態(tài)矩陣。

表示在t時刻將目標(biāo)任務(wù)Ti分配給了機(jī)器人Aj;

表示未將目標(biāo)任務(wù)分配給Aj,即機(jī)器人Aj處于無9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用任務(wù)的空閑狀態(tài)。機(jī)器人間的信息交互能力用con表示,con為n×n的矩陣,其元素conij表示機(jī)器人之間的通信網(wǎng)絡(luò)連接強(qiáng)度,

其中1表示強(qiáng)連接,0表示無連接。t時刻機(jī)器人Aj完成Ti任務(wù)的能力:公式中F是阻力常量,Pi是執(zhí)行任務(wù)Ti所需的距離代價。任務(wù)分配映射關(guān)系:,Si是對任務(wù)Ti特定的任務(wù)集合。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用(3)目標(biāo)函數(shù)某一時刻進(jìn)行多任務(wù)分配,其目的是計算該時刻多個任務(wù)的完成收益,尋找全局收益最大化的分配,要求該時刻各個機(jī)器人全局消耗最優(yōu),任務(wù)收益最大。目標(biāo)效用函數(shù)的定義如下:

表示對完成任務(wù)Ti所形成的機(jī)器人集合。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用(4)面向移動多機(jī)器人的多任務(wù)分配算法以往在全連接網(wǎng)絡(luò)中,每次迭代中只選擇一個機(jī)器人(領(lǐng)導(dǎo)者)來做出決策。而本章中提出的分布式的決策算法,將紡織車間搬運(yùn)機(jī)器人任務(wù)分配問題轉(zhuǎn)化為一個博弈事件,建立一個針對特定任務(wù)無需領(lǐng)導(dǎo)機(jī)制的機(jī)器人集合決策框架,當(dāng)有任務(wù)需求時,其中每一個機(jī)器人會根據(jù)自己的狀態(tài)加入一個集合。1)決策過程機(jī)器人尋找一個任務(wù)工位時,需要進(jìn)行博弈分析選擇策9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用略。系統(tǒng)初始時,定義每個機(jī)器人Aj以無序的方式移動,對于任務(wù)Ti用集合

表示機(jī)器人對該任務(wù)的偏好關(guān)系。那么對于機(jī)器人Aj來說,lij描述了它相對于任務(wù)Ti的偏好關(guān)系。偏好關(guān)系用符號‘

’和‘

’表示,機(jī)器人Aj的偏好關(guān)系可以根據(jù)任務(wù)收益從

中導(dǎo)出。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用2)納什穩(wěn)定性分區(qū)的建立對機(jī)器人建立不相交分區(qū)

,如果對于任意一個機(jī)器人

,存在

,

。則稱這個分區(qū)

是Nash穩(wěn)定的。即在Nash穩(wěn)定分區(qū)中,與其他任何集合相比,每一個機(jī)器人都更傾向于其當(dāng)前所在的集合。每個機(jī)器人在該分區(qū)內(nèi)無需任何形式的信息和通信技術(shù),任何機(jī)器人不得單方面偏離其目前的決定,系統(tǒng)保持一種穩(wěn)定狀態(tài)。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用3)決策結(jié)果決策結(jié)果:在機(jī)器人尋找強(qiáng)偏好任務(wù)的決策過程中Nash均衡理論決定任務(wù)的最終分配結(jié)果。Nash穩(wěn)定分區(qū)一旦建立,任意一個機(jī)器人都不可能在其他機(jī)器人任務(wù)完成策略不變時,單方面改變?nèi)蝿?wù)完成策略增加其整體收益。即對任務(wù)目標(biāo)生成了一種最優(yōu)策略組合。4)對不確定性問題的適應(yīng)將紡織車間多機(jī)器人系統(tǒng)的不確定性主要?dú)w結(jié)為機(jī)器的機(jī)械故障、搬運(yùn)機(jī)器人的動作輸出故障、噪音所造成的9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用通信的不確定性和傳感器的不確定性。當(dāng)前主要考慮車間環(huán)境下的多任務(wù)分配問題,在任務(wù)分配過程中機(jī)器人只對任務(wù)需求作響應(yīng),即任務(wù)層面的協(xié)調(diào),而不考慮多機(jī)器人運(yùn)動控制層面的協(xié)同,所以搬運(yùn)機(jī)器人動作輸出的不確定性和傳感器所造成的運(yùn)動上的不確定性不在本章考慮范圍;機(jī)械故障所造成的工位停工,任務(wù)需求中止,屬于任務(wù)動態(tài)的發(fā)生;另外由于任務(wù)分配很難保證每個機(jī)器人之間能夠強(qiáng)通信連接,因此我們將噪音所造成的通信的不確定性和傳感器信息感知的不確定性歸結(jié)9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用為通信失效,而針對通信失效的問題,本章多機(jī)器人博弈的分布式智能算法中,以局部信息廣播的形式做個體信息的交互,對通信具備很好的自適應(yīng)能力,具體在模型中體現(xiàn)為每個機(jī)器人只需根據(jù)自己的目標(biāo)效用函數(shù)maxA選擇加入任務(wù)分區(qū)

,只需將自己的決策狀態(tài)dij廣播出去,而其他機(jī)器人只根據(jù)自身所獲得的局部信息State(t)做出決策。并同時影響其相鄰機(jī)器人。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用本章任務(wù)分配算法流程圖9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用5)仿真實(shí)驗與結(jié)果分析I.實(shí)驗環(huán)境描述根據(jù)實(shí)際生產(chǎn)需求,本章實(shí)驗中的任務(wù)為緊耦合型任務(wù),即每個任務(wù)的完成需要多個機(jī)器人的合作,要求將m個機(jī)器人合理地分配給n個工位的任務(wù),任務(wù)的分配決策過程應(yīng)該由機(jī)器人以分布式、自組織的方式完成。II.數(shù)據(jù)初始化及實(shí)驗流程算法實(shí)現(xiàn)過程及結(jié)果:本實(shí)驗在MATLABR2016a上實(shí)現(xiàn)。實(shí)驗結(jié)果如下圖,結(jié)果圖描述用于任務(wù)(n=6)分配的多個9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用機(jī)器人(m=60)的分布式?jīng)Q策過程,任務(wù)分布在1000*1000的范圍,機(jī)器人分布在800*800的范圍內(nèi)。

(a)

(b)9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用

(c)

(d)9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用

(e)

(f)9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用

(g)

(h)任務(wù)分配迭代完成過程:(a)迭代第79次,(b)迭代第139次,(c)迭代第189次,(d)迭代第331次,(e)迭代第597次,(f)迭代第682次,(g)迭代第771次,(h)迭代第804次9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用上圖描述了用于任務(wù)(n=6)分配的多個機(jī)器人(m=60)的分布式?jīng)Q策過程,任務(wù)分布在1000*1000的范圍,機(jī)器人分布在800*800的范圍內(nèi)。圓表示機(jī)器人,正方形則為任務(wù),圓之間的線代表機(jī)器人的通信網(wǎng)絡(luò)。黃色機(jī)器人屬于執(zhí)行黃色任務(wù)(黃色方框?qū)?yīng)任務(wù)t4)的集合。初始時刻機(jī)器人針對任務(wù)需求決策處于隨機(jī)狀態(tài),隨著時間的推移,算法迭代,機(jī)器人之間以局部交互的方式做出對任務(wù)的臨時決策。最終經(jīng)過804次算法迭代之后,各機(jī)器人集合形成Nash穩(wěn)定分區(qū),系統(tǒng)得到穩(wěn)定的決策結(jié)果。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用III.實(shí)驗結(jié)果及分析為驗證算法針對不同任務(wù)的完成效率,首先進(jìn)行了弱通信網(wǎng)絡(luò)強(qiáng)度下不同任務(wù)需求數(shù)量下任務(wù)分配結(jié)果的比較,完成了如下機(jī)器人個數(shù)m=60,任務(wù)個數(shù)分別為n=5,6,7,8狀態(tài)下的任務(wù)分配。以算法迭代次數(shù)作為性能評價依據(jù),在相同執(zhí)行機(jī)器人數(shù)量下,任務(wù)n=5,6,7,8時任務(wù)分配完成算法迭代次數(shù)分別為722,748,767,758。可以看出在弱通信網(wǎng)絡(luò)強(qiáng)度狀態(tài)下任務(wù)的增加對本章任務(wù)分配決策的完成效率影響并不顯著。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用

(a)

(b)9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用

(a)

(b)相同數(shù)量機(jī)器人在不同任務(wù)數(shù)量下的完成結(jié)果:(a)任務(wù)數(shù)n=5,(b)任務(wù)數(shù)n=6,(c)任務(wù)數(shù)n=7,(d)任務(wù)數(shù)n=89.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用不同數(shù)量級m,n下算法迭代性能結(jié)果9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用分別取任務(wù)數(shù)n=4,5,6,7,8的不同數(shù)量級機(jī)器人的任務(wù)分配完成性能實(shí)驗。針對緊耦合型任務(wù)中機(jī)器人數(shù)量m略多于任務(wù)數(shù)量n時算法均能快速迭代完成分配。在表結(jié)果中觀察每一行實(shí)驗數(shù)據(jù),不論機(jī)器人數(shù)量m的值取多少,對于任務(wù)數(shù)n=4、5、6、7、8算法迭代結(jié)果比較接近,不存在明顯異常情況,那么同樣可以得到如前述結(jié)果,即本章算法在同一數(shù)量級機(jī)器人情況下,每一行中任務(wù)的增加對決策的完成效率影響并不顯著。9.2.3移動多機(jī)器人系統(tǒng)任務(wù)分配

優(yōu)化方法及應(yīng)用但是,從表數(shù)據(jù)也可看出,隨著機(jī)器人數(shù)量的增加,算法中機(jī)器人需要更多的信息交互,因此算法迭代次數(shù)也會隨之增加。當(dāng)n=4,m=120時、n=5,m=130時、n=6,7,8,m=135時在有限的空間內(nèi)機(jī)器人數(shù)量達(dá)到飽和,此時,當(dāng)機(jī)器人數(shù)量繼續(xù)增加算法無法完成任務(wù)的分配。9.3移動多機(jī)器人編隊與路徑規(guī)劃方法任務(wù)的高效執(zhí)行需要多機(jī)器人間有效的協(xié)同,而多機(jī)器人的一致性編隊控制是解決多機(jī)器人協(xié)同的重要手段,需要多個機(jī)器人組成的團(tuán)隊在向目標(biāo)區(qū)域運(yùn)動的過程中,個體之間保持特定的幾何形態(tài),能夠躲避環(huán)境中的障礙物,使得大規(guī)模多機(jī)器人的運(yùn)動控制問題得到簡化。另一方面多機(jī)器人的編隊控制既可以解決在任務(wù)獲得之后,機(jī)器人集合在完成各自任務(wù)的過程中由于空間資源的競爭而發(fā)生的沖突;同時,又可以使多機(jī)器人在時間和空間上協(xié)調(diào)一致。9.3.1移動多機(jī)器人編隊與隊形保持1.多機(jī)器人編隊的基本方法編隊控制多個移動機(jī)器人,按照特定的要求保持個體之間的幾何關(guān)系,對比單獨(dú)控制移動機(jī)器人這種方式能夠高效的控制多機(jī)器人系統(tǒng)躲避靜或動態(tài)障礙物到達(dá)目的地并且由于機(jī)器人的編隊行進(jìn),其路徑選擇較多條機(jī)器人規(guī)劃路徑簡單、行進(jìn)過程的動作統(tǒng)一可以簡化協(xié)同控制的方案。對于多機(jī)器人的編隊控制方向的研究按照采用的方法可以分為:虛擬結(jié)構(gòu)法、基于行為的啟發(fā)式方法、領(lǐng)航-跟隨方法以及基于圖論的方法等。9.3.1移動多機(jī)器人編隊與隊形保持1.多機(jī)器人編隊的基本方法(1)虛擬結(jié)構(gòu)法:虛擬結(jié)構(gòu)法的思想是將整個編隊系統(tǒng)看作一個整體,也就是一個虛擬的剛性結(jié)構(gòu),而編隊的每個成員都看作剛性結(jié)構(gòu)中相對固定的一點(diǎn)。當(dāng)隊形進(jìn)行運(yùn)動時,就是整個編隊跟蹤一虛擬點(diǎn)的問題。相對于領(lǐng)導(dǎo)跟隨者,因為虛擬結(jié)構(gòu)法不存在領(lǐng)航者,而且可以將編隊帶來的誤差引入到系統(tǒng)中,所以可取得較高的控制精度。9.3.1移動多機(jī)器人編隊與隊形保持1.多機(jī)器人編隊的基本方法(2)基于行為的啟發(fā)式方法:基于行為法就是將多機(jī)器人編隊行為分成幾個小的動作,每個小的動作都有自己的目標(biāo)控制器,而且每個動作的輸出又可以當(dāng)作輸入輸送到其他動作的控制器中。通過這樣一系列的行為交互,最終實(shí)現(xiàn)編隊控制的任務(wù)。基于行為法的核心在于如何設(shè)計并選取有效的一系列行為實(shí)現(xiàn)多機(jī)器人編隊任務(wù)。9.3.1移動多機(jī)器人編隊與隊形保持1.多機(jī)器人編隊的基本方法(3)領(lǐng)航-跟隨方法:領(lǐng)導(dǎo)跟隨者就是從多機(jī)器人中選出一個作為領(lǐng)航者,而編隊中剩余的其他機(jī)器人就作為跟隨者緊跟領(lǐng)航者航行。該策略的關(guān)鍵在于它將編隊與軌跡位置的偏差進(jìn)行變換。(4)基于圖論法:由于多機(jī)器人編隊控制在執(zhí)行任務(wù)過程中具有相當(dāng)?shù)囊?guī)模,所以結(jié)構(gòu)是至關(guān)重要的。當(dāng)多機(jī)器人由于通信、控制的原因而形成了網(wǎng)絡(luò)結(jié)構(gòu),那么就必須通過數(shù)學(xué)中的圖論將此網(wǎng)絡(luò)結(jié)構(gòu)建模成圖的形式。9.3.1移動多機(jī)器人編隊與隊形保持2.移動多機(jī)器人編隊的基本隊形多機(jī)器人編隊的基本隊形有三角形、直線形、星形、還有五個機(jī)器人組成的多邊形這幾種對稱的形狀。移動多機(jī)器人編隊基本隊形9.3.2一致性編隊模型及實(shí)現(xiàn)1.基于領(lǐng)航-跟隨方法的移動多機(jī)器人編隊模型(1)基于圖論的移動多機(jī)器人模型利用圖論基本概念對移動多機(jī)器人系統(tǒng)定義:對于n個機(jī)器人集合R={r1,r2,…,ri…,rn},定義δ=(G,E,O)為n階的加權(quán)有向圖,節(jié)點(diǎn)集合O={o1,o2,…,on},有向的邊E和加權(quán)鄰接矩陣的集合G=(gij)n×n。該網(wǎng)絡(luò)中的有向邊緣Eij由有序節(jié)點(diǎn)對(oi,oj)表示。從節(jié)點(diǎn)oi到節(jié)點(diǎn)oj在g中的有向路徑是有向網(wǎng)絡(luò)中的一個邊緣序列(oi,oj)。9.3.2一致性編隊模型及實(shí)現(xiàn)(1)基于圖論的移動多機(jī)器人模型為描述節(jié)點(diǎn)與邊之間的聯(lián)系,引入鄰接矩陣A,表示節(jié)點(diǎn)之間(或機(jī)器人與其相鄰機(jī)器人之間)的信息連通性。A中元素aij的取值如下:L=D-A表示拓?fù)鋱D的拉普拉斯矩陣,該矩陣特征值0出現(xiàn)的個數(shù)就是圖連通區(qū)域的個數(shù),獲得矩陣

是一個對角矩陣,該矩陣由鄰接矩陣A轉(zhuǎn)換獲得,將A矩陣的每列元素相加,并將每列元素對應(yīng)的和值放在矩陣的對角線對應(yīng)位置上得到程度矩陣D。9.3.2一致性編隊模型及實(shí)現(xiàn)(1)基于圖論的移動多機(jī)器人模型包含n個機(jī)器人的編隊系統(tǒng),機(jī)器人i的二階動力學(xué)模型可如下公式所示:t與t+1表示當(dāng)前和下一時刻的時間關(guān)系,pi(t)、pi(t+1)分別表示機(jī)器人i在二維空間的位置,vi(t)、vi(t+1)表示機(jī)器人i的二維速度向量,ui(t)為機(jī)器人i輸入控制量,T為采樣周期。9.3.2一致性編隊模型及實(shí)現(xiàn)(2)基于領(lǐng)航-跟隨方法的移動多機(jī)器人編隊為達(dá)到領(lǐng)航-跟隨思想,在常規(guī)編隊一致性控制率上加入跟隨者與領(lǐng)航者的預(yù)期相對間隔誤差,使得跟隨者跟隨領(lǐng)航者運(yùn)動且編隊可以達(dá)成預(yù)期的隊形運(yùn)動。機(jī)器人i的輸入控制量如下式所示:

、

下標(biāo)分別表示leader的t時刻的位置和速度。9.3.2一致性編隊模型及實(shí)現(xiàn)移動機(jī)器人n=5時的通信拓?fù)浣Y(jié)構(gòu)圖圖中采用運(yùn)算量較低的通信拓?fù)浣Y(jié)構(gòu),以編隊存在5個機(jī)器人為例,領(lǐng)航者標(biāo)記為leader,跟隨機(jī)器人i可以進(jìn)行編號,編號數(shù)字隨機(jī)器人數(shù)量變化。這種結(jié)構(gòu)保證在有限數(shù)量的多機(jī)器人集合中,計算量較小,每個跟隨者的位置、速度與領(lǐng)航者或旁側(cè)跟隨機(jī)器人相統(tǒng)一,有助于保持隊形。9.3.2一致性編隊模型及實(shí)現(xiàn)(2)基于領(lǐng)航-跟隨方法的移動多機(jī)器人編隊編隊領(lǐng)航者(t+1)時刻的速度,在速度限制以內(nèi),由其與目標(biāo)點(diǎn)t時刻的距離

(角標(biāo)obj表示目標(biāo))和角度θ決定,根據(jù)角度θ獲得領(lǐng)航者在x,y軸速度分量,α系數(shù)受機(jī)器人加速度,電量,跟隨者合力等影響。領(lǐng)航者初始速度

,vmax為機(jī)器人運(yùn)動的速度限制值。9.3.2一致性編隊模型及實(shí)現(xiàn)2.基于編隊一致性的彈簧避障模型靜態(tài)障礙物特征在于空間位置不變,在編隊向目標(biāo)點(diǎn)運(yùn)動過程中,將根據(jù)與障礙物之間的距離改變編隊的形態(tài)、速度等。(1)虛擬彈簧力模型將編隊與障礙物之間的距離關(guān)系映射為彈簧力,且由于障礙物為空間固定位置,所以編隊運(yùn)行中,可以定義機(jī)器人彈簧力與離障礙物的距離成正比。9.3.2一致性編隊模型及實(shí)現(xiàn)建立在x,y軸彈簧力fx(t),fy(t)與機(jī)器人、障礙物位置距離關(guān)系如下式所示:dleader_obs(t)為t時刻leader與obstacle間的距離(角標(biāo)obs表示目障礙物位置),dij(t)為t時刻機(jī)器人間的距離,(dleader_obs(t))3與(dij(t))3中冪取值表示彈性系數(shù),實(shí)驗發(fā)現(xiàn)取3次冪效果最佳,上角標(biāo)x,y表示該值在x,y軸上的分量9.3.2一致性編隊模型及實(shí)現(xiàn)(2)領(lǐng)航者避障編隊在運(yùn)動過程中,首先是領(lǐng)航者避障,領(lǐng)航者的避障速度與彈簧虛擬力的大小和初始速度有關(guān),在x,y方向的運(yùn)行速度如下:

分別為領(lǐng)航者在x,y方向上的避障速度(角標(biāo)a表示機(jī)器人正在避障)。9.3.2一致性編隊模型及實(shí)現(xiàn)(3)跟隨者避障在編隊運(yùn)動過程中,跟隨者跟隨領(lǐng)航者向目標(biāo)點(diǎn)運(yùn)動。在跟隨者避障過程中,需要考慮與領(lǐng)航者的一致性、虛擬彈簧力的影響、領(lǐng)航者的速度等,機(jī)器人i在x,y方向的運(yùn)行速度為:

分別為跟隨者i在x,y方向上的避障速度。9.3.2一致性編隊模型及實(shí)現(xiàn)(4)編隊一致性為保證在編隊運(yùn)動過程中的一致性,跟隨者根據(jù)機(jī)器人之間的位置誤差改變速度使得跟隨機(jī)器人i與領(lǐng)航者趨于一致,模型為:

分別為跟隨者在x,y方向上的與領(lǐng)航者達(dá)成一致性運(yùn)動時的速度,Es為領(lǐng)航者與跟隨者以及跟隨者之間的位置誤差。φ為機(jī)器人i位置誤差與x軸的夾角。9.3.2一致性編隊模型及實(shí)現(xiàn)(5)動態(tài)速度限制函數(shù)機(jī)器人速度、加速度過容高易導(dǎo)致機(jī)器人出現(xiàn)偏離編隊的情況,甚至難以回歸,但是如果對速度、加速度進(jìn)行定值限制,容易降低編隊和個體機(jī)器人的靈活性,為能夠平衡兩種情況,在編隊運(yùn)動中加入動態(tài)速度限制函數(shù):9.3.2一致性編隊模型及實(shí)現(xiàn)(5)動態(tài)速度限制函數(shù)

表示機(jī)器人i在t+1時刻的加速度,與該機(jī)器人距離誤差增加或減小的趨勢相關(guān),如距離誤差是增加趨勢,則ε為正值且與增加趨勢正相關(guān),加速度在下一時刻增加,反之ε為負(fù)值與距離誤差減小趨勢正相關(guān);上式保證了機(jī)器人在不超過速度限制的情況下與距離誤差變化趨勢同步變化,并以縮小距離誤差為指引。9.3.2一致性編隊模型及實(shí)現(xiàn)3.多機(jī)器人編隊算法實(shí)現(xiàn)(1)實(shí)驗構(gòu)造及數(shù)據(jù)初始化實(shí)驗物理環(huán)境為有限的二維區(qū)域,大小為30×30m2。分別構(gòu)造存在靜態(tài)、動態(tài)障礙物的仿真環(huán)境,在此環(huán)境下構(gòu)造實(shí)驗和數(shù)據(jù)初始化。仿真實(shí)驗中,定義機(jī)器人是同種類型,具備基本的導(dǎo)航、避障、通信等功能,領(lǐng)航者有且僅有1個。9.3.2一致性編隊模型及實(shí)現(xiàn)(1)實(shí)驗構(gòu)造及數(shù)據(jù)初始化數(shù)據(jù)初始化編隊中的機(jī)器人數(shù)量,n=[5,10,15,20],機(jī)器人初始位置(

)、動態(tài)障礙物初始位置(

)隨機(jī)獲得。跟隨者i,i=[1,19]分別根據(jù)實(shí)驗中不同機(jī)器人數(shù)量編號,其中障礙物長7m,寬1.6m,障礙物之間間隔4.5m,左下角的障礙物與原點(diǎn)間隔為4.5m,動態(tài)障礙物起點(diǎn)為(25,0)、(25,15),終點(diǎn)為(5,15)、(10,3)。9.3.2一致性編隊模型及實(shí)現(xiàn)不同實(shí)驗環(huán)境中參數(shù)初始化表9.3.2一致性編隊模型及實(shí)現(xiàn)(2)實(shí)驗結(jié)果及分析編隊系統(tǒng)的機(jī)器人數(shù)量超過20后,數(shù)據(jù)特征不明顯,所以實(shí)驗以編隊機(jī)器人數(shù)量為5、10、15、20個分別在無沖突、有沖突機(jī)器人仿真環(huán)境中進(jìn)行實(shí)驗并分析結(jié)果。1)無動態(tài)障礙物環(huán)境I編隊運(yùn)動軌跡分析9.3.2一致性編隊模型及實(shí)現(xiàn)

(a)n=5

(b)n=10無動態(tài)障礙物編隊運(yùn)動軌跡圖I編隊運(yùn)動軌跡分析9.3.2一致性編隊模型及實(shí)現(xiàn)

(c)n=15

(d)n=20無動態(tài)障礙物編隊運(yùn)動軌跡圖I編隊運(yùn)動軌跡分析9.3.2一致性編隊模型及實(shí)現(xiàn)I編隊運(yùn)動軌跡分析當(dāng)編隊中機(jī)器人數(shù)量增加后,領(lǐng)航者的路徑?jīng)]有發(fā)生變化,子圖(a),5機(jī)器人編隊機(jī)器人數(shù)量少,在編隊運(yùn)行中跟隨者都和領(lǐng)航者選擇了相同的通道到達(dá)終點(diǎn),子圖(b)、(c)、(d)中,10機(jī)器人、15機(jī)器人、20機(jī)器人編隊由于機(jī)器人數(shù)量的增加與車間過道較窄,所以編隊在運(yùn)動過程中,明顯存在機(jī)器人選擇其它不與領(lǐng)航者相同的路徑,做出了動態(tài)的改變,且是在保證路徑長度增加最少的情況下,完成越障后形成預(yù)期隊形到達(dá)終點(diǎn)。9.3.2一致性編隊模型及實(shí)現(xiàn)II領(lǐng)航者與跟隨者位置誤差

(a)n=5

(b)n=10無動態(tài)障礙物環(huán)境編隊運(yùn)動領(lǐng)航者與跟隨者位置誤差9.3.2一致性編隊模型及實(shí)現(xiàn)II領(lǐng)航者與跟隨者位置誤差

(c)n=15

(d)n=20無動態(tài)障礙物環(huán)境編隊運(yùn)動領(lǐng)航者與跟隨者位置誤差9.3.2一致性編隊模型及實(shí)現(xiàn)II領(lǐng)航者與跟隨者位置誤差跟隨者與領(lǐng)航者的位置誤差會隨編隊機(jī)器人數(shù)量增加而增加:10機(jī)器人最大誤差比5機(jī)器人的增加44.35%;15機(jī)器人最大誤差10機(jī)器人編隊增加44.25%;20機(jī)器人時最大誤差較15機(jī)器人編隊減少9.42%。出現(xiàn)最大誤差時間隨編隊機(jī)器人數(shù)量增長而提前,說明在有限空間內(nèi)機(jī)器人數(shù)量對于誤差的產(chǎn)生有較大影響。當(dāng)機(jī)器人數(shù)量增加,速度控制下的編隊機(jī)器人個體的速度保持是以擴(kuò)大路徑包線為代價的,路徑包線的擴(kuò)大帶來位置誤差的增加。9.3.2一致性編隊模型及實(shí)現(xiàn)2)存在動態(tài)障礙物的實(shí)驗環(huán)境在模擬環(huán)境中,增加兩個隨機(jī)運(yùn)動的同類機(jī)器人作為動態(tài)障礙物,分別對5、10、15、20個機(jī)器人組成的編隊進(jìn)行動態(tài)避障實(shí)驗。9.3.2一致性編隊模型及實(shí)現(xiàn)2)存在動態(tài)障礙物的實(shí)驗環(huán)境

(a)n=5

(b)n=10動態(tài)障礙物環(huán)境改進(jìn)模型編隊運(yùn)動軌跡圖9.3.2一致性編隊模型及實(shí)現(xiàn)2)存在動態(tài)障礙物的實(shí)驗環(huán)境

(c)n=15

(d)n=20動態(tài)障礙物環(huán)境改進(jìn)模型編隊運(yùn)動軌跡圖9.3.2一致性編隊模型及實(shí)現(xiàn)2)存在動態(tài)障礙物的實(shí)驗環(huán)境在不遇到障礙物時,跟隨者基本與領(lǐng)航者趨于一致,當(dāng)出現(xiàn)障礙物時,編隊的隊形會被影響,但是當(dāng)編隊與沖突錯過時,編隊會自行調(diào)整位置,跟隨者會快速調(diào)整與領(lǐng)航者趨于一致,最后安全到達(dá)終點(diǎn)。在有沖突機(jī)器人環(huán)境中,編隊也會因為機(jī)器人數(shù)量的增加而出現(xiàn)機(jī)器人路徑分岔的現(xiàn)象,這說明即使在動態(tài)障礙物環(huán)境中,編隊也會因為需要快速到達(dá)目的地而做出及時調(diào)整。9.3.2一致性編隊模型及實(shí)現(xiàn)I領(lǐng)航者與跟隨者位置誤差

(a)n=5

(b)n=10有動態(tài)障礙物環(huán)境改進(jìn)模型編隊運(yùn)動領(lǐng)航者與跟隨者位置誤差9.3.2一致性編隊模型及實(shí)現(xiàn)I領(lǐng)航者與跟隨者位置誤差

(c)n=15

(d)n=20有動態(tài)障礙物環(huán)境改進(jìn)模型編隊運(yùn)動領(lǐng)航者與跟隨者位置誤差9.3.2一致性編隊模型及實(shí)現(xiàn)I領(lǐng)航者與跟隨者位置誤差在動態(tài)障礙物環(huán)境中,動態(tài)障礙物對編隊運(yùn)動會有影響,但由于較早的信息共享,機(jī)器人編隊可以避免與動態(tài)障礙物發(fā)生正面沖突,但是由于編隊機(jī)器人改變了原本的軌跡,所以跟隨著與領(lǐng)航者誤差增加。在機(jī)器人數(shù)量增加的情況編隊跟隨者會因為車間過道較窄分岔,位置誤差會因為分岔而出現(xiàn)增加的情況,所以10機(jī)器人、15機(jī)器人、20機(jī)器人最大誤差較大。9.3.2一致性編隊模型及實(shí)現(xiàn)I領(lǐng)航者與跟隨者位置誤差結(jié)合各個機(jī)器人位置誤差曲線,在編隊即將到達(dá)終點(diǎn)時,誤差都在減小狀態(tài)且編隊隨機(jī)器人數(shù)量增加到達(dá)終點(diǎn)的時間都接近,證明了系統(tǒng)在動態(tài)障礙物環(huán)境的動態(tài)調(diào)節(jié)能力。運(yùn)動數(shù)據(jù)充分分享可以幫助編隊中機(jī)器人的運(yùn)動規(guī)劃的更加穩(wěn)定,將編隊機(jī)器人的運(yùn)動路徑控制在了可接受的范圍內(nèi)。9.4多移動機(jī)器人圍捕圍捕是指多個捕者組成團(tuán)隊圍捕一個逃跑者的情況。圍捕時圍捕者之間協(xié)作完成任務(wù)。多移動機(jī)器人圍捕,指在某一環(huán)境中存在某一或某些動態(tài)或是靜態(tài)的目標(biāo),環(huán)境中可能存在不規(guī)則形狀障礙物,要求多個移動機(jī)器人在當(dāng)前環(huán)境中發(fā)現(xiàn)并在一定時間內(nèi)呈一定形式的分布在目標(biāo)周圍,即完成圍捕。9.4多移動機(jī)器人圍捕多移動機(jī)器人圍捕問題主要研究:1.通過多個圍捕機(jī)器人追捕目標(biāo)機(jī)器人研究圍捕機(jī)器人之間協(xié)調(diào)合作問題,即在同一個目標(biāo)的前提下如何平衡系統(tǒng)收益與機(jī)器人個體收益,盡可能達(dá)到全局最優(yōu)。2.圍捕系統(tǒng)在進(jìn)行圍捕時如何分派相應(yīng)數(shù)量的機(jī)器人,這些機(jī)器人如何進(jìn)行組織,即研究圍捕任務(wù)最優(yōu)任務(wù)分配方法。3.研究自適應(yīng)學(xué)習(xí)算法使得圍捕系統(tǒng)在面對動態(tài)環(huán)境和任務(wù)時依然能夠有效地組織圍捕團(tuán)隊圍捕目標(biāo)。9.4.1多移動機(jī)器人圍捕流程多移動機(jī)器人圍捕流程要分為目標(biāo)搜索、目標(biāo)跟隨以及目標(biāo)包圍三個階段。開始執(zhí)行圍捕任務(wù)時,圍捕機(jī)器人群體以一定的搜索策略搜索實(shí)驗區(qū)域中的目標(biāo)機(jī)器人,在搜索過程中如果某個圍捕機(jī)器人發(fā)現(xiàn)了目標(biāo)機(jī)器人,就將估計的目標(biāo)機(jī)器人位置發(fā)送給其它圍捕機(jī)器人。其它圍捕機(jī)器人逐漸向目標(biāo)機(jī)器人靠近并形成一定的隊形。在其他圍捕機(jī)器人靠近目標(biāo)機(jī)器人的過程中,發(fā)現(xiàn)目標(biāo)機(jī)器人的圍捕機(jī)器人對目標(biāo)機(jī)器人進(jìn)行跟隨,防止丟失目標(biāo)機(jī)器人信息。9.4.1多移動機(jī)器人圍捕流程目標(biāo)搜索:目標(biāo)搜索是指多機(jī)器人在實(shí)驗區(qū)域找到目標(biāo)機(jī)器人的過程,搜索出目標(biāo)機(jī)器人是多機(jī)器人協(xié)作圍捕任務(wù)后續(xù)工作的前提。目標(biāo)跟隨:考慮到圍捕機(jī)器人發(fā)現(xiàn)目標(biāo)機(jī)器人的初期,目標(biāo)機(jī)器人周圍的圍捕機(jī)器人數(shù)量較少且目標(biāo)機(jī)器人具有一定的移動能力,不宜直接對其包圍。為了避免發(fā)現(xiàn)的目標(biāo)機(jī)器人從視野中丟失,此時以單個圍捕機(jī)器人對目標(biāo)機(jī)器人的跟隨為主。9.4.1多移動機(jī)器人圍捕流程為實(shí)現(xiàn)目標(biāo)跟隨的整個流程,圍捕機(jī)器人發(fā)現(xiàn)目標(biāo)機(jī)器人后,在視覺相機(jī)捕獲的視頻序列中便具有了目標(biāo)機(jī)器人的位置坐標(biāo)等相關(guān)信息。將目標(biāo)機(jī)器人在像素坐標(biāo)系下實(shí)際的位置坐標(biāo)與期望的位置坐標(biāo)比較,以兩者之間的差值調(diào)節(jié)圍捕機(jī)器人的線速度和角速度實(shí)現(xiàn)對目標(biāo)機(jī)器人的跟隨。目標(biāo)包圍:圍捕機(jī)器人群體到達(dá)目標(biāo)機(jī)器人附近后,首先組成一定的隊形包圍目標(biāo)機(jī)器人,然后押送目標(biāo)機(jī)器人使其無法在實(shí)驗區(qū)域隨意運(yùn)動,從而完成圍捕。9.4.2多移動機(jī)器人圍捕存在的一些問題圍捕問題存在下列一些問題:1.逃跑者采用一種高智能的逃跑方式一般的圍捕任務(wù)都是采用比較低智能的逃跑方式,只是簡單采用局部最優(yōu)逃跑方法即遠(yuǎn)離圍捕機(jī)器人,沒有考慮到全局逃跑最優(yōu)。設(shè)計一種高智能逃跑方式會使得圍捕問題變得更加困難和復(fù)雜。2.傳感器的不確定性機(jī)器人圍捕的時候,各機(jī)器人通信和定位都與傳感器有關(guān)系,而實(shí)際上傳感器只能保證探測點(diǎn)周圍的精確度,9.4.2多移動機(jī)器人圍捕存在的一些問題對很多不確定性問題不能保證。這需要建立一個不確定模型,對機(jī)器人當(dāng)前的位置信息進(jìn)行準(zhǔn)確的估計。3.非同等條件下的圍捕現(xiàn)在研究圍捕大多數(shù)都是考慮到圍捕機(jī)器人和逃跑機(jī)器人,條件相當(dāng)或者圍捕機(jī)器人比逃跑機(jī)器人具有優(yōu)勢性,在圍捕機(jī)器人相當(dāng)于逃跑機(jī)器人處于劣勢情況下的圍捕是一個有待解決的問題,比如說圍捕機(jī)器人相當(dāng)逃跑機(jī)器人,速度比較慢,視野范圍比較小,運(yùn)動的機(jī)會比較少的情況,這需要建立更復(fù)雜的模型。9.4.2多移動機(jī)器人圍捕存在的一些問題4.多個逃跑者的情況未知環(huán)境下存多個逃跑時的情況仍然需要進(jìn)研究,包括追捕者如何優(yōu)地形成圍捕聯(lián)盟,在盡量短的時間內(nèi)利用盡量少的總體能消耗將所有的逃跑者捕獲,這渉及到多機(jī)器人之間的聯(lián)盟及協(xié)商等問題。9.4.3多移動機(jī)器人圍捕方法1.領(lǐng)航-跟隨(leader-follower)方法leader-follower編隊方法要求在多個移動機(jī)器人中選擇一個機(jī)器人作為領(lǐng)航機(jī)器人,領(lǐng)航機(jī)器人跟蹤期望的參考路徑。其余跟隨機(jī)器人根據(jù)隊形和領(lǐng)航機(jī)器人保持相對距離和方向不變。9.4.3多移動機(jī)器人圍捕方法1.領(lǐng)航-跟隨(leader-follower)方法編隊控制方案為:對于有n個單體機(jī)器人執(zhí)行圍捕任務(wù)時,當(dāng)n個機(jī)器人到達(dá)以目標(biāo)物為中心,r為半徑的空間區(qū)域時,將離目標(biāo)物最近的機(jī)器人作為領(lǐng)航者,計劃生成以目標(biāo)物為中心的等邊n邊形,n個機(jī)器人位于等邊n邊形的n個角上。其余跟隨機(jī)器人根據(jù)自身位置和期望隊形,調(diào)整位置和角度,形成等邊n邊形,組成多邊形后,一起縮短多變形的距離,最終達(dá)到圍捕目標(biāo)物的目的。9.4.3多移動機(jī)器人圍捕方法1.領(lǐng)航-跟隨(leader-follower)方法多機(jī)器人圍捕系統(tǒng)編隊示意圖9.4.3多移動機(jī)器人圍捕方法1.領(lǐng)航-跟隨(leader-follower)方法上圖中,五角星代表目標(biāo)物。以5個機(jī)器人為例,將robort1作為領(lǐng)航者,構(gòu)建以目標(biāo)物為中心,robort1為一角的等邊五邊形,從而確定其余跟隨機(jī)器人的位置。當(dāng)形成等邊五角形后,同時朝目標(biāo)物前進(jìn),完成目標(biāo)物的圍捕。9.4.3多移動機(jī)器人圍捕方法1.領(lǐng)航-跟隨(leader-follower)方法多機(jī)器人編隊圍捕的路徑圖9.4.3多移動機(jī)器人圍捕方法1.領(lǐng)航-跟隨(leader-follower)方法上圖中的5個圍捕機(jī)器人進(jìn)入圍捕隊形之后,以目標(biāo)物為中心,以領(lǐng)隊者與目標(biāo)物的距離為基準(zhǔn),領(lǐng)隊者以與目標(biāo)者距離的連線為前進(jìn)方向,不斷拉近與目標(biāo)物的距離,跟隨者機(jī)器人也根據(jù)領(lǐng)隊者機(jī)器人的變化向目標(biāo)物靠近,直至多機(jī)器人群完全包圍住目標(biāo)者,視作此次圍捕工作成功。上圖顯示5個機(jī)器人組成的多機(jī)器人群完全包圍目標(biāo)物,此次圍捕任務(wù)成功。9.4.3多移動機(jī)器人圍捕方法2.基于模糊邏輯控制的自適應(yīng)算法多運(yùn)動機(jī)器人圍捕動態(tài)目標(biāo)過程示意圖9.4.3多移動機(jī)器人圍捕方法2.基于模糊邏輯控制的自適應(yīng)算法上圖中圍捕的目標(biāo)是兩個圍捕移動機(jī)器人和目標(biāo)移動機(jī)器人形成三點(diǎn)一線且以目標(biāo)移動機(jī)器人為中心,對目標(biāo)移動機(jī)器人進(jìn)行包圍,包圍形成后進(jìn)一步圍捕目標(biāo)使之無法運(yùn)動。圍捕機(jī)器人根據(jù)自身安裝的激光測距儀感知環(huán)境中隨機(jī)障礙的距離和方位,并根據(jù)避障規(guī)則進(jìn)行躲避。同時,根據(jù)仿真環(huán)境反饋的抓捕目標(biāo)的位置信息,通過遺傳算法規(guī)劃自己最優(yōu)的運(yùn)動軌跡來對目標(biāo)進(jìn)行合圍,圍捕機(jī)9.4.3多移動機(jī)器人圍捕方法2.基于模糊邏輯控制的自適應(yīng)算法器人運(yùn)動速度和角度都有遺傳算法來確定,當(dāng)目標(biāo)機(jī)器人在以圍捕機(jī)器人之間距離為直徑形成圓的圓心,圍捕機(jī)器人各自采用圓弧運(yùn)動完成對抓捕目標(biāo)的鉗形夾擊。為了能夠成功圍捕目標(biāo)機(jī)器人,追捕的多移動機(jī)器人須以一定形式將目標(biāo)機(jī)器人包圍住。圍捕策略:收縮包圍圈法,該策略就是當(dāng)多個機(jī)器人接近目標(biāo)后,形成一個包圍圈將目標(biāo)機(jī)器人圍在中間。但如果逃跑機(jī)器人采用的一種智能逃跑方式,該圍捕方法效果不是很理想。9.4.3多移動機(jī)器人圍捕方法3.基于狀態(tài)預(yù)測的強(qiáng)化學(xué)習(xí)方法強(qiáng)化學(xué)習(xí)是指從環(huán)境狀態(tài)到動作映射的學(xué)習(xí),以使動作從環(huán)境中獲得的累積獎賞值最大。它通常包括兩個方面:一是將強(qiáng)化學(xué)習(xí)作為一類問題;二是將它作為解決這一類問題的一種技術(shù)。如果將強(qiáng)化學(xué)習(xí)作為一類問題,目前的學(xué)習(xí)技術(shù)大致分成兩類:一類是采用統(tǒng)計的技術(shù)和動態(tài)規(guī)劃的方法來估計某一環(huán)境狀態(tài)下的動作獎賞值;另一類是通過對機(jī)器人的行為空間進(jìn)行搜索,以發(fā)現(xiàn)機(jī)器人最優(yōu)的行為。9.4.3多移動機(jī)器人圍捕方法3.基于狀態(tài)預(yù)測的強(qiáng)化學(xué)習(xí)方法狀態(tài)預(yù)測的基本原理:所謂狀態(tài)預(yù)測是指單個移動機(jī)器人根據(jù)自身及其它移動機(jī)器人當(dāng)前的狀態(tài),通過對其它移動機(jī)器人下一個時刻最有可能面臨的狀態(tài)進(jìn)行預(yù)測,來選擇自己最佳協(xié)作性能的動作,從而實(shí)現(xiàn)最佳的協(xié)作行為的過程。一個移動機(jī)器人在對其它機(jī)器人以往狀態(tài)觀測的基礎(chǔ)上,對它們下一個時刻的狀態(tài)進(jìn)行預(yù)測。根據(jù)一些預(yù)測的效果,可以用統(tǒng)計的方法建立出機(jī)器人動作選擇規(guī)律的數(shù)學(xué)模型。在多機(jī)器人圍捕的實(shí)驗中,任9.4.3多移動機(jī)器人圍捕方法3.基于狀態(tài)預(yù)測的強(qiáng)化學(xué)習(xí)方法意一個時刻任何一個機(jī)器人都無法準(zhǔn)確的知道其它機(jī)器人的動作,所以機(jī)器人無法選擇使系統(tǒng)狀態(tài)轉(zhuǎn)移其具有最佳性能的動作。因此,用狀態(tài)預(yù)測法和概率預(yù)測函數(shù)來降低強(qiáng)化學(xué)習(xí)算法的組合強(qiáng)度,并快速的實(shí)現(xiàn)機(jī)器人最優(yōu)動作的選擇策略。狀態(tài)預(yù)測常見的預(yù)測方法類型有等概率預(yù)測型,預(yù)測最大型,基于分布律假設(shè)檢驗的最大預(yù)測型。預(yù)測方法的選擇直接關(guān)系到預(yù)測的準(zhǔn)確性。9.4.3多移動機(jī)器人圍捕方法3.基于狀態(tài)預(yù)測的強(qiáng)化學(xué)習(xí)方法(1)概率預(yù)測型當(dāng)一個移動機(jī)器人預(yù)測其它機(jī)器狀態(tài)時,認(rèn)為它們動作集里的每個動作都有同樣的機(jī)會被執(zhí)行,在強(qiáng)化學(xué)習(xí)的過程中,每個移動機(jī)器人必須嘗試許多不同的序列,這種方法叫等概率預(yù)測型。(2)預(yù)測最大型在時刻,每一個狀態(tài)預(yù)測動作的概率值一致,為1/n,n為基本動作數(shù),對于其它移動機(jī)器人各個狀態(tài),預(yù)測時給9.4.3多移動機(jī)器人圍捕方法3.基于狀態(tài)預(yù)測的強(qiáng)化學(xué)習(xí)方法出預(yù)測概率值最大的動作,這種方法就叫預(yù)測最大型。(3)基于分布律假設(shè)檢驗的最大預(yù)測型在初始時刻,移動機(jī)器人的每個狀態(tài)對各動作預(yù)測的概率值一致,為1/n,(n為機(jī)器人的動作數(shù))在探索移動機(jī)器人協(xié)作過程中各個移動機(jī)器人的動作執(zhí)行情況,當(dāng)各自的動作達(dá)到一定數(shù)目吋,按照皮爾遜分布律假設(shè)檢驗修訂原預(yù)測概率。如果更新概率,則用若干步的頻率分布代竹。預(yù)測時選擇預(yù)測概率最大的動作,這中方法叫9.4.3多移動機(jī)器人圍捕方法3.基于狀態(tài)預(yù)測的強(qiáng)化學(xué)習(xí)方法基于分布律假設(shè)檢驗的最大預(yù)測型,簡稱分布律檢驗。狀態(tài)預(yù)測模塊對其它移動機(jī)器人在各自狀態(tài)下釆取的動作和相應(yīng)的狀態(tài)轉(zhuǎn)換歷史進(jìn)行觀測,得到狀態(tài)預(yù)測的方法,來對其它移動機(jī)器人在它們各自狀態(tài)下采取的當(dāng)前動作和狀態(tài)轉(zhuǎn)移結(jié)果進(jìn)行預(yù)測同時把這個預(yù)測結(jié)果提供給動作選擇模塊。隨著時間的推移,預(yù)測得到的經(jīng)驗慢慢積累,這時狀態(tài)預(yù)測機(jī)構(gòu)慢慢得到改善,預(yù)測結(jié)果也越來越準(zhǔn)確。移動機(jī)器人技術(shù)原理與應(yīng)用第十章

移動機(jī)器人ROS系統(tǒng)ROS總體框架ROS基本命令與功能包基于ROS的移動機(jī)器人功能仿真10.1ROS系統(tǒng)安裝10.210.310.4ROS中移動機(jī)器人技術(shù)相關(guān)應(yīng)用10.510.1

ROS系統(tǒng)安裝10.1.1Ubuntu系統(tǒng)簡介及安裝ROS一般安裝在Linux系統(tǒng)下,Ubuntu是Linux中最為常用的系統(tǒng),絕大多數(shù)ROS系統(tǒng)安裝在Ubuntu系統(tǒng)中。Ubuntu是一個以桌面應(yīng)用為主的Linux操作系統(tǒng),提供了一個健壯、功能豐富的計算環(huán)境,既適合家庭使用又適用于商業(yè)環(huán)境。Ubuntu幾乎包含了所有常用的應(yīng)用軟件:文字處理、電子郵件、軟件開發(fā)工具和Web服務(wù)等。用戶下載、使用、分享Ubuntu系統(tǒng),以及獲得技術(shù)支持與服務(wù),無需支付任何許可費(fèi)用。10.1.1

Ubuntu系統(tǒng)簡介及安裝Ubuntu系統(tǒng)的安裝對于電腦配置的要求并不嚴(yán)格,目前主流的PC都可以正常運(yùn)行。安裝系統(tǒng)的方式可以分為兩種,直接對硬盤分區(qū)后安裝和使用虛擬機(jī)安裝,對于對Ubuntu系統(tǒng)不是很了解的新手,推薦先使用虛擬機(jī)安裝Ubuntu,先進(jìn)行基礎(chǔ)的學(xué)習(xí),等對Ubuntu有足夠的認(rèn)識后進(jìn)行硬盤的安裝。接下來介紹如何通過虛擬機(jī)進(jìn)行Ubuntu系統(tǒng)的安裝:10.1.1

Ubuntu系統(tǒng)簡介及安裝1.安裝虛擬機(jī),虛擬機(jī)推薦使用VMwareWorkstation,可以直接登錄VMware官方下載,逐步安裝即可。VMware打開界面10.1.1

Ubuntu系統(tǒng)簡介及安裝2.Ubuntu系統(tǒng)鏡像可以直接在Ubuntu官網(wǎng)進(jìn)行系統(tǒng)鏡像的下載(/14.04/)。Ubuntu官網(wǎng)下載系統(tǒng)鏡像10.1.1

Ubuntu系統(tǒng)簡介及安裝3.打開VMware軟件,點(diǎn)擊創(chuàng)建新的虛擬機(jī),選擇典型。新建虛擬機(jī)向?qū)?0.1.1

Ubuntu系統(tǒng)簡介及安裝4.選擇稍后安裝系統(tǒng),創(chuàng)建一個空白硬盤。創(chuàng)建空白硬盤10.1.1

Ubuntu系統(tǒng)簡介及安裝5.客戶機(jī)操作系統(tǒng)選擇Linux(L),版本為Ubuntu64位。選擇客戶機(jī)操作系統(tǒng)10.1.1

Ubuntu系統(tǒng)簡介及安裝6.設(shè)置虛擬機(jī)名稱和安裝位置,然后點(diǎn)擊下一步。命名虛擬機(jī)10.1.1

Ubuntu系統(tǒng)簡介及安裝7.設(shè)置虛擬機(jī)的磁盤大小,并設(shè)置為單個文件。設(shè)置虛擬機(jī)磁盤容量10.1.1

Ubuntu系統(tǒng)簡介及安裝8.完成虛擬機(jī)創(chuàng)建。完成虛擬機(jī)的創(chuàng)建10.1.1

Ubuntu系統(tǒng)簡介及安裝9.虛擬機(jī)設(shè)置。編輯虛擬機(jī)設(shè)置10.1.1

Ubuntu系統(tǒng)簡介及安裝10.根據(jù)電腦配置,合理分配虛擬機(jī)的設(shè)置,內(nèi)存、處理器等。設(shè)置虛擬機(jī)的配置10.1.1

Ubuntu系統(tǒng)簡介及安裝11.在CD/DVD中使用下載好的ISO鏡像文件。加載映像文件10.1.1

Ubuntu系統(tǒng)簡介及安裝12.點(diǎn)擊開啟此虛擬機(jī),開始ubuntu的配置。開啟虛擬機(jī)10.1.1

Ubuntu系統(tǒng)簡介及安裝13.選擇語言,點(diǎn)擊安裝ubuntu。選擇語言進(jìn)行安裝10.1.1

Ubuntu系統(tǒng)簡介及安裝14.默認(rèn)進(jìn)行安裝。默認(rèn)進(jìn)行安裝10.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論