




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
文文獻綜述研究課題:機器人足球決策系統(tǒng)研究組員〔班級及學(xué)號〕:熊匯韜(3班10)羅運真研究課題:機器人足球決策系統(tǒng)研究組員〔班級及學(xué)號〕:熊匯韜(3班10)羅運真(3班15)趙大帥(2班24)彭晗(2班23)唐昊(2班21)游斌(2班19)楊荃月(2班28)機器人足球比賽是近年來在國際上迅速開展起來的國際對抗活動。它是人工智能領(lǐng)域與機器人研究領(lǐng)域的根底研究課程,是一個極富挑戰(zhàn)性的研究工程。機器人足球比賽對研究多智能體的合作與競爭理論具有重要的實踐與指導(dǎo)意義。而在機器人足球比賽中,決策系統(tǒng)根據(jù)視覺系統(tǒng)提供的機器人位姿和足球位置信息,進行快速準確的決策,是取得勝利的關(guān)鍵。本文以機器人系統(tǒng)的核心子系統(tǒng)決策子系統(tǒng)的開發(fā)為背景,主要介紹ROBOCUP〔機器人足球世界杯比賽〕機器人足球賽仿真技術(shù),關(guān)于機器人的根本動作、路徑規(guī)劃、決策能力的研究,研究行之有效的決策推理方法。對目前決策系統(tǒng)問題主要是實時性、準確性、適應(yīng)性和穩(wěn)定性。針對上述問題,開發(fā)了面向RoboCup小型組機器人足球比賽的決策系統(tǒng),重點解決了算法設(shè)計與系統(tǒng)特性之間的矛盾。關(guān)鍵詞:機器人足球;可視化編程;算法;決策;目錄TOC\o"1-3"\h\z\u19023一.介紹:423763二.系統(tǒng)分級6204271.視覺子系統(tǒng):7306032.決策子系統(tǒng):8158093.通訊子系統(tǒng):913425決策六步經(jīng)典方法推理模型912122三.系統(tǒng)核心決策模塊10125141.機器人足球比賽系統(tǒng)決策子系統(tǒng)的一般結(jié)構(gòu):10266122.產(chǎn)生式推理模型:1062553.決策編程的可視化11112274.決策系統(tǒng)各模塊分析1320781預(yù)處理模塊136116態(tài)勢分析與策略選擇模塊1324425隊型確定與角色分配模塊1314025目標位置確定模塊1425617運動軌跡規(guī)劃模塊1419058動作選擇模塊14295235.決策系統(tǒng)各模塊設(shè)計1412440輸入信息預(yù)處理模塊1411581態(tài)勢分析與策略選擇模塊1517761隊型確定與角色分配模塊164202目標位置確定模塊1731712運動軌跡規(guī)劃模塊1732507動作選擇模塊1825509四.決策層中KICK的智能算法20287781.基于倒腳踢球策略的模糊邏輯算法20193902.基于屢次踢球策略的遺傳算法2124324五.機器人路徑規(guī)劃典型方法22304291.柵格法:22138262.人工勢場法:2312664六.論述2525118七.總結(jié):2511397參考文獻26一.介紹:近年來,隨著計算機技術(shù)的開展,分布式人工智能〔DistributedArtificialIntelligence,DAI〕已經(jīng)成為人工智能領(lǐng)域的重要研究方向之一。分布式人工智能一般分為分布式問題求解和多Agent系統(tǒng)〔multi-agentsystem,簡稱MAS〕。其中,多Agent系統(tǒng)是分布式人工智能的一個重要領(lǐng)域。1.Agent:2.MAS:如上圖,通常足球機器人系統(tǒng)可以劃分為機器人本體子系統(tǒng)、通信子系統(tǒng)、視覺子系統(tǒng)和決策子系統(tǒng)四個局部,通過計算機視覺子系統(tǒng)閉環(huán)而構(gòu)成智能決策和控制系統(tǒng)。視覺子系統(tǒng)負責(zé)識別球和機器人,得到現(xiàn)場信息;通信子系統(tǒng)負責(zé)傳送現(xiàn)場獲得的信息和發(fā)送機器人車體的運動指令;機器人車體系統(tǒng)負責(zé)接收指令并驅(qū)動機器人車體運動;決策子系統(tǒng)那么根據(jù)現(xiàn)場信息推理計算從而得到機器人運動控制指令,由決策子系統(tǒng)組織機器人協(xié)作,做出適當?shù)膽?zhàn)術(shù)配合,是取得勝利的關(guān)鍵。足球機器人主要需要完成的根本行為有:原地旋轉(zhuǎn),直線運動,曲線運動。根本動作有:跑位和轉(zhuǎn)角、截球、踢球、射門、守門。當然,仿真平臺除了要提供和智能體相關(guān)這兩類接口外,還需要充當裁判功能,還必須提供相應(yīng)的接口和監(jiān)視器連接,以支持比照賽場地及場上所有參賽者的虛擬。另外,為了能夠更好的提供離線訓(xùn)練和在線學(xué)習(xí)的功能,仿真平臺還提供了教練接口(包括在線教練和離線教練)。一個完整的仿真比賽以CS/方式進行,如以下圖2一2所示。二.系統(tǒng)分級1.視覺子系統(tǒng):實時采集足球場地圖像,實時處理并辨識這些圖像,獲取場上己方隊員,對方隊員及足球位置信息傳給決策系統(tǒng)。2.決策子系統(tǒng):根據(jù)感知子系統(tǒng)獲得場上各類信息,利用智能體協(xié)作及對策理論,做出本組機器人行動決策,控制個機器人行為。機器人決策系統(tǒng)中,推理模型占有重要地位,為足球機器人決策系統(tǒng)設(shè)計提供整體思路指導(dǎo)。3.通訊子系統(tǒng):完成小車子系統(tǒng)、決策子系統(tǒng)、感知子系統(tǒng)間的信息交換。決策六步經(jīng)典方法推理模型第一步:場上信息預(yù)處理。第二步:攻守姿態(tài)分析和策略選擇。第三步:機器人的陣型確定和角色分配。第四步:目標位置確定和動作選擇。第五步:機器人運動軌跡規(guī)劃。第六步:機器人左右輪速確定。三.系統(tǒng)核心決策模塊1.機器人足球比賽系統(tǒng)決策子系統(tǒng)的一般結(jié)構(gòu):機器人足球控制決策系統(tǒng)中普遍采用了分層控制的結(jié)構(gòu)[6]。東北大學(xué)提出由信息預(yù)處理、態(tài)勢分析和策略選擇、隊形確定、角色分配、目標位姿確定和左右輪速確定等六個步驟組成的決策推理系統(tǒng),并運用到足球機器人決策系統(tǒng)設(shè)計中;中南大學(xué)提出過由協(xié)調(diào)層、運動規(guī)劃層和動作層組成的三層決策模型[7]。圖1是Mirosot機器人足球比賽決策子系統(tǒng)的一般結(jié)構(gòu)?,F(xiàn)場信息是視覺子系統(tǒng)對現(xiàn)場某周期信息識別的結(jié)果,包括球與雙方隊員的位姿等信息。推理模塊是根據(jù)視覺子系統(tǒng)傳遞來的現(xiàn)場信息,對場上的形式進行判斷和推理,并根據(jù)比賽決策庫產(chǎn)生相應(yīng)的下一周期的比賽決策。比賽決策確定了本方球員在下一周期的角色、任務(wù)以及執(zhí)行任務(wù)的位置。角色分配模塊確定每個隊員在某種策略下,下個周期的角色。動作模塊是根據(jù)每個機器人當前周期的角色與任務(wù)確定相應(yīng)的動作。根本的動作為踢球、射門、攔截、守門、避礙等。2.產(chǎn)生式推理模型:產(chǎn)生式推理與決策:首先選定某個策略,然后在此策略的根底上,生成一系列決策,從而形成決策庫。為方便推理,決策由前件與后件組成。前件也稱為產(chǎn)生式推理的條件,后件也稱為產(chǎn)生式推理的結(jié)果。決策的前件即產(chǎn)生式推理的條件由球的位置Ball_location、本方球門受威脅程度Danger、對方球員位置Opponent_location構(gòu)成;決策的后件即產(chǎn)生式推理的結(jié)果由本方球員的角色Role、任務(wù)Task以及執(zhí)行任務(wù)的位置Location構(gòu)成。用戶決策集與根底決策集:由于決策庫中的決策很多,用戶編制的決策庫可能不能包含全部的729條決策。當進行推理時,可能沒有相匹配的決策,此時會出現(xiàn)某個周期的推理中斷,影響比賽。為了防止種情況的發(fā)生,我們編寫了根本決策集。當進行推理時,先在用戶決策集中進行,當在用戶決策集中未找到相應(yīng)的決策時,再在根本決策集中推理。因此,我們把決策子系統(tǒng)的推理模型,修改為圖2所示。3.決策編程的可視化在客戶程序中定義了兩個結(jié)構(gòu)體類型:structdecision_result{unsignesdrole;unsignedtask;unsignedlocation_x;unsignedlocation_y;}structdecisiontype{unsignedball_location_x;unsignedball_location_y;unsigneddanger;unsignedopponent_location;structdecision_resultrole[3];}利用structdecisiontype結(jié)構(gòu)體類型的變量,可以存儲界面中輸入的決策數(shù)據(jù),從而把決策存儲于決策庫中。在進行比賽時,翻開用戶決策庫,從決策庫中傳入決策進行推理。當用戶決策庫沒有對應(yīng)的決策時,從根本決策庫選擇相應(yīng)的決策進行推理??梢暬绦?可以實現(xiàn)新建決策集、翻開決策集、關(guān)閉決策集、添加決策、刪除決策、顯示某條或全部決策、刪除決策集等功能。只要理解輸入界面中各個因素中的數(shù)字代碼的含義就可以編制覆蓋各個決策的決策庫。比賽時,將此決策庫與客戶程序的決策子系統(tǒng)連接,就能夠進行比賽了。決策系統(tǒng)推理模型采用六步推理模型。按照推理步驟,依次為信息預(yù)處理、態(tài)勢分析與決策、隊型確定與角色分配、目標位置確定、運動軌跡規(guī)劃和動作選擇。該決策推理模型的輸入是視覺系統(tǒng)獲得的機器人位姿和足球位置信息,輸出是本隊機器人的控制信息。4.決策系統(tǒng)各模塊分析4.1預(yù)處理模塊對視覺系統(tǒng)輸入的機器人位姿信息、足球位置信息和比賽信息進行預(yù)處理,計算出決策使用的目標相對距離、角度信息和比賽參考信息。4.2態(tài)勢分析與策略選擇模塊根據(jù)預(yù)處理模塊輸出的信息,判斷進攻防守態(tài)勢,判斷依據(jù)可以是足球的位置、持球方、機器人的位姿。根據(jù)已經(jīng)判斷的信息,結(jié)合比賽信息,例如比分、剩余時間,對手強弱等,從策略庫中選取進攻防守策略,例如全攻全守策略、區(qū)域進攻防守策略、強攻強守策略等。4.3隊型確定與角色分配模塊根據(jù)選擇的策略,在隊型庫中選取進攻防守隊型,例如1-3-1、1-2-2、1-1-3等。在確定隊型后,可以對應(yīng)隊型進行角色分配。一般角色定義有守門員、主攻、副攻、主守、副守。4.4目標位置確定模塊機器人足球是在動態(tài)環(huán)境下完成,機器人必須能夠確定下一個目標位置,來完成指定的動作。4.5運動軌跡規(guī)劃模塊機器人運動到目標位置的路徑有很多種,或者在運動過程中會遇到障礙,選擇一個最優(yōu)路徑那么屬于路徑規(guī)劃。4.6動作選擇模塊根據(jù)決策信息,在不同層次動作庫中選擇動作,按照一定的動作命令格式,構(gòu)造成命令,命令包括機器人左右輪速、動作方向、動作角度、動作距離等參數(shù)信息。通過通信系統(tǒng)發(fā)送到機器人的控制系統(tǒng),控制系統(tǒng)完成命令解釋,控制機器人按照上層決策完成動作。5.決策系統(tǒng)各模塊設(shè)計5.1輸入信息預(yù)處理模塊輸入信息預(yù)處理模塊采用向量計算的方法,所有的輸入信息是以向量的形式描述的,定義一個向量計算類完成所有需要的向量計算。定義1維和2維結(jié)構(gòu)數(shù)組保存計算結(jié)果,結(jié)構(gòu)包括距離和角度域。為提高計算速度和減少計算量,提出基于數(shù)組對稱性的存儲訪問方法和基于按需的首次訪問計算方法。基于數(shù)組對稱性的存儲訪問方法思想:因為數(shù)組下標為機器人編號,所以必然造成數(shù)據(jù)的對稱性,對于距離方向無關(guān)量是一致,對于例如角度方向相關(guān)量是相反的。在存儲上選擇左下角或者右上角,訪問上根據(jù)數(shù)組下標判斷正負符號?;诎葱璧氖状卧L問計算方法思想:如果全部計算所有數(shù)據(jù),計算量過大,實際也并不需要那么多數(shù)據(jù),這樣影響系統(tǒng)效率??梢愿鶕?jù)需要,如果沒有計算過,那么先計算,再訪問,否那么直接訪問,這樣可以大大降低計算量,提高系統(tǒng)效率。5.2態(tài)勢分析與策略選擇模塊在態(tài)勢分析與策略選擇模塊采用決策樹和多參考因素系數(shù)加權(quán)求和的分析方法,其思想為:決策條件為持球方、機器人對足球位姿最優(yōu)、足球所在區(qū)域、比賽信息等,決策判斷優(yōu)先級可以靜態(tài)設(shè)置,也可以動態(tài)調(diào)整。對于態(tài)勢分析可以以判斷方式按照一定優(yōu)先級逐層局部判斷,或者同時考慮所有條件,對各條件分配一定的權(quán)重,然后進行系數(shù)加權(quán)求和運算,求得最優(yōu)解。對于策略選擇事先需要定義策略庫,可以靜態(tài)或者動態(tài)進行策略選擇。靜態(tài)策略選擇是事先設(shè)定態(tài)勢與策略映射關(guān)系,比賽過程不調(diào)整。動態(tài)策略選擇是根據(jù)比賽情況,動態(tài)調(diào)整態(tài)勢與策略的映射關(guān)系,映射的動態(tài)建立可以參照態(tài)勢分析同樣的算法。決策樹分析方法例如:足球區(qū)域判斷y持球方判斷y目標位姿判斷y比賽信息參考y策略。多參考因素系數(shù)加權(quán)求和分析方法數(shù)學(xué)模型:完成多參考因素系數(shù)加權(quán)求和計算。其中:S為態(tài)勢和,N為參考因素總數(shù),F(i)為參考因素i系數(shù),G(i)為參考因素i權(quán)重。函數(shù)F和函數(shù)G可以通過實驗測試獲得。D=M(s)完成態(tài)勢與策略的映射。其中M為從態(tài)勢分析到策略選擇的映射關(guān)系。M映射可以通過實驗測試建立。5.3隊型確定與角色分配模塊按照選擇的策略與隊型的映射關(guān)系,在隊型庫中確定一個隊型,映射關(guān)系的建立可以是靜態(tài)設(shè)置好的,也可以是根據(jù)比賽情況動態(tài)設(shè)置的。每個機器人在一個隊型中充當一個角色,在角色分配上,按照主副分配原那么,先分配主角色,然后根據(jù)主角色特征,分配副角色。主角色分配參考原那么同態(tài)勢分析與策略選擇模塊。副角色分配原那么還需考慮主角色分配特征。例如距離主角色盡量近,距離對方盡量遠,不要影響主角色功能發(fā)揮,最大程度輔助主角色功能發(fā)揮等。角色分配可以是靜態(tài)的,也可以是動態(tài)的,除一些極限情況,例如守門員角色分配,一般角色分配都是動態(tài)的,時刻都可能發(fā)生角色交換,在有利于該角色情況下可以保持該角色一段時間,在不利于該角色情況下,發(fā)生角色交換(即使是守門員角色)。5.4目標位置確定模塊目標位置確定模塊采用決策樹的分析方法,其思想為:根據(jù)機器人的角色、位姿、球門和場地信息進行判斷,確定目標點。例如,作為主攻的機器人可以選擇盡量靠近對方球門,根據(jù)機器人的位姿,可以直接快速完成攻門的一點。作為副攻的機器人要根據(jù)主攻機器人進行跑位,選擇盡量靠近主攻機器人,靠近、面向球門,不要阻擋主攻機器人的進攻路線,遠離防守機器人的一點。作為主守的機器人可以根據(jù)自身和足球位置,選擇可以截斷進攻路線,盯人、封堵射門角度的一點。作為副守的機器人可以根據(jù)主守機器人進行跑位,選擇最大程度封堵角度,阻擋進攻路線,靠近面向?qū)Ψ綑C器人的一點。對于守門員的機器人,由于足球運動速度很快,一般守門員機器人只活動在球門附近,根據(jù)足球的位置水平跑位,盡量封堵角度,在特殊情況下,可以直接選擇足球位置為目標點,這樣必須進行角色轉(zhuǎn)換,由另一個機器人作為守門員。5.5運動軌跡規(guī)劃模塊運動軌跡規(guī)劃模塊采用改良的12點加權(quán)求和分析方法。12點加權(quán)求和分析方法思想(圖2):以機器人的位置為圓心,按一定的半徑畫一個圓,以時鐘刻度的方式選12個點。其中半徑的選取應(yīng)該以機器人速度乘以一幀圖像處理的時間間隔。參考因素包括障礙系數(shù)、邊界系數(shù)、距離系數(shù)、角度系數(shù)、前方系數(shù)。障礙系數(shù)主要考慮避障問題,邊界系數(shù)主要考慮邊界處理,距離系數(shù)、角度系數(shù)、前方系數(shù)主要考慮進攻防守效率。根據(jù)進攻和防守態(tài)勢,分別計算各點的進攻系數(shù)和防守系數(shù)。表示形式為各系數(shù)的加權(quán)求和,如果忽略某個系數(shù),可以使該系數(shù)為零。得到最優(yōu)解的點與機器人位置點來確定機器人運動方向。此算法的局限性為:(1)沒有根據(jù)角色進行區(qū)分。(2)全部計算12個點,無謂判斷點多,計算量大。(3)沒有必要均勻分配12點,可以根據(jù)機器人與目標點連線,確定一個角度范圍,再根據(jù)角度間隔分配判斷點。改良算法思想為:可以在確定角色后,根據(jù)角色,選取一個角度判斷范圍,然后設(shè)定一個角度變化間隔,確定幾個判斷點,進行加權(quán)求和判斷。角度范圍、角度間隔需要根據(jù)角色靜態(tài)設(shè)置或者動態(tài)調(diào)整。5.6動作選擇模塊動作選擇模塊采用動作分層設(shè)計的思想。算法思想為:應(yīng)用面向?qū)ο蟮姆椒?將足球機器人的動作分為根底動作、技術(shù)動作、戰(zhàn)術(shù)動作、組合動作四類。根底動作包括到定點動作、轉(zhuǎn)角動作、移動動作等。技術(shù)動作包括射門動作、防守動作、盯人防守動作和邊界球處理動作、傳球到頂點動作等。組合動作包括避障礙到定點動作,守門員動作等。戰(zhàn)術(shù)動作包括一傳一射動作、底線傳中射門動作等。動作的設(shè)計和實現(xiàn)與機器人本體的硬件密切相關(guān),反映到機器人就是左右輪速確實定。在動作的選擇上,要根據(jù)機器人角色、采用的策略、實際比賽信息來合理選擇動作,確定機器人本體的線速度、角速度、動作時間、位移等參數(shù),按照通信子系統(tǒng)定義好的命令格式構(gòu)造命令,然后將格式化后的命令發(fā)送到機器人。例如,主攻機器人在有利射門的條件下,應(yīng)該選擇直接射門的動作,否那么應(yīng)該選擇傳球動作。副攻機器人應(yīng)該選擇轉(zhuǎn)角動作、移動動作調(diào)整自己到有利進攻的位姿,輔助主攻機器人進攻。主守機器人應(yīng)該采用封堵進攻機器人路線和角度、截球等動作,尤其在球門前,調(diào)整好位態(tài),防止烏龍球,選擇動作的原那么就是盡快將球踢出防守區(qū)域。副守機器人應(yīng)該選擇轉(zhuǎn)角動作、移動動作等調(diào)整自己到有利防守的位態(tài),輔助主守機器人和守門員機器人防守,擴大防守面積。守門員應(yīng)該選擇轉(zhuǎn)角動作、移動動作,最大程度封堵進攻角度,選擇動作的原那么是根據(jù)足球的位置,快速精確的移動轉(zhuǎn)角,不要輕易棄門出擊。在一些特殊情況,例如在場地邊界、場地四角可以采用掃球動作。也可以設(shè)計一些典型的條件,采用組合的動作,到達機器人之間的配合。四.決策層中KICK的智能算法1.基于倒腳踢球策略的模糊邏輯算法一個KICK難以把球調(diào)整到目標方向,此時需要一系列的KICK,把球的方向不斷調(diào)整,這類似一個旋轉(zhuǎn)加速的過程,直到調(diào)整到目標方向為止,然后踢出。此時,采用倒腳踢球策略,具體過程見圖3。圖中,d為目標速度,r為實際速度。圖3倒腳踢球策略顯然,對于任意初速度和目標速度,這樣的可選擇的KICK路線數(shù)量極大,相應(yīng)地,搜索空間極為龐大。此時,需要有一個評價值作為搜索的向?qū)?,尋找一個最優(yōu)的KICK序列。由于球的初速度和球相對于球員的距離是影響KICK重要參數(shù),采用初速度和相對距離作為輸入,經(jīng)過模糊化、模糊推理和解模糊等運算,得到一個評價值cost,同時結(jié)合A*搜索方法,可以得到一個最優(yōu)的KICK序列,以此到達預(yù)期的目標速度和方向。經(jīng)實驗說明:用10個球員進行測試,平均踢球次數(shù)為38次,踢一個球的平均周期數(shù)為3.5,速度平均誤差為0.34m/s,方向平均誤差為0.5度,失敗的平均次數(shù)為0。由此可見,利用模糊邏輯算法,結(jié)合專家的先驗知識建立規(guī)那么庫,能成功地描述一個cost值,然后結(jié)合一種啟發(fā)式搜索算法可以很好地規(guī)劃出一條最優(yōu)的KICK路線。2.基于屢次踢球策略的遺傳算法屢次踢球策略類似于倒腳踢球策略,就是沿切線方向不斷地把球踢向球員自身,以使球傳到所需的方向,然后再踢出去。用以下公式計算踢球的角度θ:θ=ab+α*vdist*δt+θθ=cos-1(rp+rb)/d+90-tan-1〔ε/(d’sinθ2)〕d’=d+α*vdist*δt此處,d是球員到球的距離,δt是仿真周期,ab是相對角度,rp和rb代表球員和球的半徑,vdist是SoccerServer提供的參數(shù)DistChng,tan-1項主要是為了防止球和隊員互相碰撞。在式子中,α和ε是常量,兩者的結(jié)合決定了轉(zhuǎn)球動作完成的好壞。采用α和ε作為個體進行編碼;選取球連續(xù)轉(zhuǎn)過的總的角度作為適應(yīng)度,通過遺傳算法選取個體,群體大小取為1000,進行10代運算后,群體最好的個體參數(shù)為:α=1.68、ε=0.44、fitness=1430。由此意味著采用此參數(shù)的球員能使球圍繞自己連續(xù)轉(zhuǎn)3圈以上,假設(shè)用人工進行的調(diào)整的參數(shù)幾乎不能做到這一點。五.機器人路徑規(guī)劃典型方法1.柵格法:柵格法[.wE.Howdne1968年]是在靜態(tài)路徑規(guī)劃中避障過程搜索最優(yōu)路徑的常見方法。將工作區(qū)域劃分成NxM個方格,每個方格的面積比一個機器人所占的面積略大。用狀態(tài)空間法表示機器人的信息,對機器人的位置進行n個周期的預(yù)測,將兩個相鄰周期的預(yù)測位置連成直線,假設(shè)直線與某方格接觸,那么認為覆蓋了該方格的12/以上面積,對應(yīng)的二維數(shù)組分量置1,其余數(shù)組分量置0。最優(yōu)路徑的搜索就是在空的方格內(nèi)尋找連通路徑。如下圖。通過仿真實驗可以看出,在動態(tài)的未知環(huán)境下的機器人足球比賽中,對障礙物先進行位置預(yù)測,在一定時間T內(nèi)可把障礙物看作是靜態(tài)的,用柵格法搜索最優(yōu)路徑。把靜態(tài)柵格法結(jié)合預(yù)測算法后得到的方法稱為動態(tài)柵格法,在全局路徑規(guī)劃上能取得較好的策略性。雖然動態(tài)柵格法在搜索路徑中具有全局性、策略表現(xiàn)力強的優(yōu)點,但動態(tài)柵格法是在動態(tài)過程中將某個時間段T內(nèi)的片段看作靜態(tài)狀況而進行路徑搜索。丁的選取決定了搜索的效果是否良好:2取得太大,那么預(yù)測的空間很大,容易導(dǎo)致搜索失敗;2取得太小,那么不能預(yù)測出機器人的可能位置,搜索出的路徑無效。2.人工勢場法:人工勢場法[atibandKrohg.Khatibalo]研究機器人手臂在笛卡爾空間中如何直接由任務(wù)相關(guān)的參數(shù)、運動、受力來控制其運動。把問題看成使系統(tǒng)狀態(tài)由給定的初始狀態(tài)轉(zhuǎn)移到理想的目標狀態(tài),而防止狀態(tài)空間中的禁止區(qū)域。并引入了一個重要的概念:廣義勢場,不僅考慮位置,也考慮速度。人工勢場法是將機器人在周圍環(huán)境中的運動,設(shè)計成在一種勢場中運動,是對機器人運行環(huán)境的一種抽象描述,機器人在場中具有一定的抽象勢能,勢場的源有兩類:斥力極和引力極。機器人不希望進入的區(qū)域和障礙物屬干斥力極;目標及機器人系統(tǒng)建議通過的區(qū)域為引力極。在極的周圍由一定的算法產(chǎn)生相應(yīng)的勢,在任何一點的勢為兩極在該點產(chǎn)生的勢之和。通過搜索勢函數(shù)的下降方向來尋找從初始位置到達目標位置的無碰撞路徑。整個機器人足球比賽場地被虛擬成一個有力存在的場地,把力分為引力和斥力,根據(jù)比賽的進行,場上隊員位置會發(fā)生變化,因而整個力場中各局部的受力情況也會發(fā)生變化,因此決策系統(tǒng)就可以根據(jù)場上的這種變化去實時的控制足球機器人的運動情況。具體而言,即首先建立斥力場和引力場,如圖4.6所示。在機器人的周圍,分布著環(huán)狀的虛擬力場,用環(huán)帶的寬度和環(huán)的斥力系數(shù)來表示環(huán)的參數(shù),各個機器人之間表現(xiàn)為排斥力,通過設(shè)置各環(huán)的參數(shù)可以調(diào)整隊員周圍的力場。這樣做有兩個目的:在雙方機器人因為爭球而發(fā)生碰撞時,可以在一定程度上起到緩沖作用,以減少對機器人本身機械結(jié)構(gòu)的損壞;在追逐爭球時可以平滑的繞過對方球員,到達實時避障,奪得先機的效果。在人工勢場方法路徑規(guī)劃中,把雙方機器人和小球看成可自由移動的質(zhì)點。六.論述Agent是近年來計算機科學(xué)領(lǐng)域中的一個重要概念,這一概念已被廣泛應(yīng)用于人工智能、分布式計算等領(lǐng)域,為分布開放系統(tǒng)的分析、設(shè)計和實現(xiàn)提供了一個嶄新的途徑,未來的工作將在原有的代碼根底上,增加新的策略的分析和實現(xiàn),構(gòu)造角色更明確的Agent,使機器人球員具有學(xué)習(xí)、協(xié)調(diào)及協(xié)作的能力,使研究更加接近MAS理論的定義。而在機器人足球比賽的成績關(guān)鍵在于決策,。本文將決策各局部進行分解研究并通過對各種算法和規(guī)劃方式的可視化研究,實現(xiàn)對機器人足球決策層面的理解。從實際角度出發(fā),介紹機器人足球決策軟件與硬件系統(tǒng)的設(shè)計實現(xiàn)方案,描述了系統(tǒng)的軟件結(jié)構(gòu)和設(shè)計思想,以及一系列的方法概述,對應(yīng)用和現(xiàn)有的一些算法的總結(jié)。對于各種算法和方法的理論研究,都有一定的局限性和針對性,但是大都比擬容易實現(xiàn),實用和科學(xué)。七.總結(jié):RoboCup是研究動態(tài)不可預(yù)測環(huán)境中的多智能體系統(tǒng)的典型平臺。在RoboCup仿真比賽中,機器人整體團隊協(xié)作和局部對抗規(guī)劃都是比賽成功的關(guān)鍵。通過
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 陜西鐵路工程職業(yè)技術(shù)學(xué)院《日語入門》2023-2024學(xué)年第二學(xué)期期末試卷
- 如何講創(chuàng)新創(chuàng)業(yè)
- 如何提高員工對安全事項的認知和意識
- 感音性神經(jīng)聾護理查房
- 保潔開荒協(xié)議合同標準文本
- 與派遣員工解除合同范例
- 代工合同代工合同標準文本
- ktv營銷經(jīng)理聘用合同標準文本
- 強化心肺復(fù)蘇操作規(guī)范
- 2025年度最高額抵押合同
- 零基礎(chǔ)的住宅和城市設(shè)計智慧樹知到答案章節(jié)測試2023年同濟大學(xué)
- 小婉管樂小品《遇人不贖》臺詞劇本手稿
- 血液形態(tài)學(xué)圖譜考核(ISO15189現(xiàn)場考核)
- 太平哨水利樞紐引水式水電站設(shè)計
- YC/T 425-2011煙用紙張尺寸的測定非接觸式光學(xué)法
- GB/T 6109.2-2008漆包圓繞組線第2部分:155級聚酯漆包銅圓線
- GB/T 17747.1-2011天然氣壓縮因子的計算第1部分:導(dǎo)論和指南
- 2023年金鑰匙科技初三化學(xué)CESL活動競賽決賽試題及答案
- GB∕T 21489-2018 散糧汽車卸車裝置
- 2022自考審計學(xué)復(fù)習(xí)資料
- 2021營養(yǎng)健康介紹膳食指南PPT模板
評論
0/150
提交評論