版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
智能駕駛路徑規(guī)劃與決策技術(shù)導言路徑規(guī)劃與決策模塊是自動駕駛系統(tǒng)中最核心的模塊之一(另外三個核心模塊是:定位、感知和控制),其承接環(huán)境感知與定位模塊,下啟車輛控制模塊。規(guī)劃與決策可分為路由尋徑、行為決策、運動規(guī)劃三部分。其中定位與感知模塊提供定導航地圖、導航路徑、當前定位點、車輛狀態(tài)(包括:位置、速度、加速度、底盤)、周邊目標的感知及預測信息(如交通標志和障礙物等);然后路徑規(guī)劃與決策模塊獲得信息后由路由尋徑輸出全局導航路徑,行為決策判斷車輛是否跟車、在遇到交通燈和行人時的等待避讓、以及路口和其他車輛的交互通過,最后通過運動規(guī)劃模塊計算出可供控制模塊執(zhí)行的一條帶速度信息的行駛路徑;最終將控制信息輸入車輛控制模塊控制車輛。項目五智能駕駛路徑規(guī)劃與決策技術(shù)學習目標1.知識目標:(1)了解全局路徑規(guī)劃與局部路徑規(guī)劃定義;(2)了解行為決策基本模型類別;(2)理解路徑規(guī)劃算法、行為決策方法特點;(3)掌握Apollo路徑規(guī)劃與速度規(guī)劃技術(shù);2.技能目標:(1)分析路徑規(guī)劃算法、行為決策方法特點;(2)掌握路徑規(guī)劃算法、行為決策設計步驟;(3)掌握Apollo路徑規(guī)劃與速度規(guī)劃方法3.素質(zhì)目標:(1)培養(yǎng)學生職業(yè)素養(yǎng)(2)培養(yǎng)獨立思考能力和問題分析能力(3)提高團隊協(xié)作意識項目五智能駕駛路徑規(guī)劃與決策技術(shù)任務5.1路徑規(guī)劃技術(shù)5.2.1全局路徑規(guī)劃與局部路徑規(guī)劃1)全局路徑規(guī)劃
全局路徑規(guī)劃作用的地圖范圍較廣,一般是靜態(tài)環(huán)境下的規(guī)劃。車輛需要從起點開始規(guī)劃出一條滿足約束的無碰撞路徑,具有目標導航能力。但該方法不能對道路信息實時更新,所以智能駕駛車輛在行駛過程會受到局部環(huán)境的不確定性影響,會遇到各種各樣不可預測的情況,因此智能駕駛車輛在行駛的過程中還需要局部路徑規(guī)劃進行輔助。2)局部路徑規(guī)劃
局部路徑規(guī)劃主要針對的是動態(tài)環(huán)境下的路徑規(guī)劃,起到避障作用,在車輛無法按照全局規(guī)劃路徑行駛時,通過對智能駕駛車輛周圍局部環(huán)境信息的感知,利用局部路徑規(guī)劃,在全局路徑的基礎上,規(guī)劃出一段局部的無碰撞理想路徑,保證在躲過障礙物后仍舊能夠按照全局規(guī)劃路徑繼續(xù)行駛。任務5.1路徑規(guī)劃技術(shù)5.2.2路徑規(guī)劃算法1)對車輛行駛路線進行函數(shù)化描述的規(guī)劃方法
該方法使用函數(shù)曲線描述車輛的行駛軌跡,主要用于實現(xiàn)軌跡規(guī)劃。常用于描述軌跡的函數(shù)模型主要有圓弧曲線模型、正弦曲線模型、螺旋曲線模型,B樣條曲線模型、基于多項式的曲線模型、基于正反梯形加速度的曲線模型等?;趫A弧-直線-圓弧的平行泊車路徑規(guī)劃示意圖任務5.1路徑規(guī)劃技術(shù)5.2.2路徑規(guī)劃算法2)基于采樣的規(guī)劃方法
基于采樣的規(guī)劃算法通常在起始點與目標點之間進行隨機采樣,獲取候選目標點并對目標點進行連接構(gòu)成路徑備選集,剔除掉無法通過碰撞檢測的備選路徑,將剩余路徑中曲率最優(yōu)的路徑作為規(guī)劃的最終結(jié)果。典型的算法有概率路線圖法(PRM,ProbabilisticRoadmapMethod),快速隨機樹法(RRT,Rapid-explorationRandomTree)。概率路線圖法(PRM)流程概率路線圖法是最早研究的概率完備型路徑規(guī)劃算法,其核心思想是在狀態(tài)空間中隨機撒點,依據(jù)一定規(guī)則將候選點連接形成線路,利用搜索的算法對候選線路進行搜索,若可搜索到安全可行的路線,選擇其中最短的路線作為路徑規(guī)劃的結(jié)果,若搜索不到,則增加隨機點的個數(shù)再進行上述操作,直至得到可行性結(jié)果。該方法可保證能夠獲得規(guī)劃結(jié)果,但算法具有較大隨機性,難以保證生成路徑的一致性,且規(guī)劃的結(jié)果與最優(yōu)解之間往往有較大差距。1.生成隨機點2.在隨機點之間生成路徑3.輸出路徑規(guī)劃結(jié)果任務5.1路徑規(guī)劃技術(shù)5.2.2路徑規(guī)劃算法快速隨機樹法快速隨機樹法借鑒了概率路線圖的思想,將當前節(jié)點視為根節(jié)點,通過采樣得到枝葉點的位置,依據(jù)各種規(guī)則生成節(jié)點之間的連接線,將節(jié)點擴展形成樹狀路線圖,并對擴展部分進行碰撞檢測,搜索到枝葉點即視為取得有效路徑,基本步驟為:1)起點作為一顆種子,從它開始生長枝丫;2)在車輛所處的空間中,生成一個隨機點A;3)在樹上找到距離A點最近的那個點;4)朝著A點的方向生長,如果沒有碰到障礙物就把生長后的樹枝和端點添加到樹上,5)重復步驟2)-步驟4),直至搜索到目標點??焖匐S機樹法的缺點很明顯,例如:RRT得到的路徑一般質(zhì)量都不是很好,例如可能包含棱角,不夠光滑;通常也遠離最優(yōu)路徑;難以在有狹窄通道的環(huán)境找到路徑。因為狹窄通道面積小,被碰到的概率低,找到路徑需要的時間要看運氣。任務5.1路徑規(guī)劃技術(shù)5.2.2路徑規(guī)劃算法3)圖搜索法
圖搜索法的基本思想是首先對搜索空間進行離散化處理,使用柵格地圖描述無人駕駛車輛外部周圍環(huán)境,制作包含障礙物信息的柵格地圖。在柵格地圖中一般是對周圍環(huán)境進行二值處理,如圖所示,障礙物為黑色區(qū)域用“1”表示,無障礙為白色區(qū)域用“0”表示。路徑規(guī)劃問題即可視為由無人駕駛車輛所在柵格至目標柵格的搜索問題。根據(jù)各個柵格的代價值不同,可通過尋找最小代價的柵格并進行迭代處理得到最終的規(guī)劃路徑。常用的算法有Dijkstra算法、A*算法、D*算法等。格柵圖任務5.1路徑規(guī)劃技術(shù)5.2.2路徑規(guī)劃算法Dijkstr算法是常見的最短路徑搜索算法,其使用廣度優(yōu)先搜索用以解決賦權(quán)有向或無向圖的最短路徑問題。以起始點為中心向外不斷擴展,直到終點為止,計算從該節(jié)點到其他所有節(jié)點的最短路徑,是一種單源最短路徑算法。算法可獲得全局代價最小的結(jié)果,其問題是節(jié)點過多,拓撲圖復雜,算法的搜索效率比較低,計算復雜度高,實時性較差。Dijkstr算法步驟如下:1)假設源點到所有點的距離矩陣為dis[x],初始化源點的dis[1]=0,其余節(jié)點的dis=∞;2)將節(jié)點分為個組,一個標記組,一個未標記組,首先將源點加入標記組,并遍歷源點的出邊并計算距離dis;3)找出一個未被標記的、dis[k]最小的節(jié)點k并加入標記組。遍歷節(jié)點k的所有出邊,計算距離dis;4)重復步驟3),直到所有節(jié)點均被加入標記組。Dijkstr算法步驟任務5.1路徑規(guī)劃技術(shù)5.2.2路徑規(guī)劃算法A*算法及D*算法均在Dijkstar算法的基礎上衍生而來。A*算法應用極為廣泛,算法增加了估價函數(shù),優(yōu)先搜索終點方向的節(jié)點,提高了搜索效率。A*算法關(guān)鍵是代價函數(shù),包括實際代價和估計代價,用來計算每一個節(jié)點的優(yōu)先級別:
f(n)=g(n)+h(n)其中,g(n)是該節(jié)點距離起點的實際代價,h(n)是該節(jié)點距離終點的估計代價,h(n)是啟發(fā)式搜索的關(guān)鍵,其設定可以調(diào)節(jié)算法的速度和精度,最終的f(n)是節(jié)點代價函數(shù),表示每個節(jié)點的綜合優(yōu)先級。由于增加了啟發(fā)函數(shù)h(n),保證最短路的搜索方向朝著終點,搜索具有一定目的性,搜索效率要優(yōu)于Dijksar算法,當h(n)為0時,A*算法就變成了廣度優(yōu)先搜索算法。任務5.1路徑規(guī)劃技術(shù)5.2.2路徑規(guī)劃算法A*算法基本步驟為:1)把起點加入Openlist;2)重復如下過程:a)遍歷Openlist,查找F值最小的節(jié)點移到Closelist,把它作為當前要處理的節(jié)點。b)判斷當前方格的8個相鄰方格的每一個方格,若為Unreachalbe或者已在Closelist中則忽略。否則做如下操作。c)如果它不在Openlist中,把它加入Openlist,并且把當前方格設置為它的父親,記錄該方格的F,G和H值。d)如果它已經(jīng)在Openlist中,檢查這條路徑(即經(jīng)由當前方格到達它那里)是否更好,用G值作參考。更小的G值表示這是更好的路徑。如果是這樣,把它的父親設置為當前方格,并重新計算它的G和F值。3)直到Openlist為空,從終點開始,每個方格沿著父節(jié)點移動直至起點,這就是最優(yōu)路徑,任務5.1路徑規(guī)劃技術(shù)5.2.2路徑規(guī)劃算法4)圖基于優(yōu)化的方法
基于優(yōu)化的路徑規(guī)劃算法其核心思想是通過約束條件的限制及優(yōu)化指標的設計,對最優(yōu)行駛軌跡進行計算。常用的基于優(yōu)化的算法主要有人工勢場法、模型預測控制方法(MPC)、基于數(shù)值優(yōu)化的方法等。人工勢能場法將場的概念引入路徑規(guī)劃中,將智能駕駛車輛所處交通環(huán)境視為行車勢能場,類似于物理學中電子在電場中的運動。其中,對于智能駕駛車輛而言,障礙物產(chǎn)生的場為斥力場,目標點產(chǎn)生的場為引力場,力場的一階倒數(shù)可視為智能駕駛車輛所受的力的作用。在這種虛擬的力的作用下,無人駕駛車輛朝著目標點運動并在運動的過程中因受到障礙物的推動而遠離障礙物。此過程類似于下山的過程,虛擬力的方向與場的梯度下降最快的方向一致。人工勢場法易于數(shù)學表達,規(guī)劃出來的路徑安全平滑無死點,其算法簡單、具有很小的計算量、易于實現(xiàn)底層的實時控制,保證了實時性,但當無人駕駛車輛受到的引力和斥力相等時,人工勢場方法容易發(fā)生鎖死,如圖所示,此外當目標點距離障礙物很近時,被困在局部最優(yōu)解上,出現(xiàn)目標不可達的情況。任務5.1路徑規(guī)劃技術(shù)5.2.2路徑規(guī)劃算法4)圖基于優(yōu)化的方法模型預測控制方法(MPC)基本思想是:依據(jù)系統(tǒng)的機理或者數(shù)據(jù)進行建模,將其作為預測模型,根據(jù)傳感器網(wǎng)絡測量到的系統(tǒng)當前狀態(tài)量以及對目標函數(shù)求解得到的未來控制量,依據(jù)預測模型進行預測系統(tǒng)未來輸出量。在每一個控制周期中,求得最優(yōu)控制輸入量將其作用到被控平臺,然后根據(jù)當前被控平臺的實際狀態(tài),重新預測系統(tǒng)的未來輸出量,循環(huán)往復,在線優(yōu)化求解,進而構(gòu)成一個完整的閉環(huán)結(jié)構(gòu)體系。在研究模型預測控制時,存在三個重要的架構(gòu)來支撐該理論,即建立預測模型、滾動優(yōu)化求解和反饋校正。1)建立預測模型模型預測控制需要一個可以完整描述系統(tǒng)動態(tài)變化過程的數(shù)學機理模型,這個模型的作用是能根據(jù)系統(tǒng)當前信息和未來的預測控制輸入,預測系統(tǒng)未來輸出,因此這個模型稱為預測模型。一般地,系統(tǒng)未來控制輸入用來改變系統(tǒng)未來預測輸出,使其最大限度接近參考輸出的最優(yōu)控制輸入量。2)在線滾動優(yōu)化求解預測控制中所研究的優(yōu)化問題與一般離散化最優(yōu)控制策略是大相徑庭,不是采用一個不變的全局最優(yōu)目標,而是采用滾動式的有限時域優(yōu)化策略。在每一采樣時刻,根據(jù)該時刻的優(yōu)化性能指標,求解該時刻起有限時段的最優(yōu)控制率。計算得到的控制作用序列也只有當前值是實際執(zhí)行的,在下一個采樣時刻又重新求取最優(yōu)控制率。也就是說,優(yōu)化過程不是一次離線完成的,而是反復在線進行的。采用有限時域的預測是因為實際控制過程中存在模型失配、時變和外部干擾等不確定因素,使基于模型的預測不可能準確地與實際被控過程相符。通過滾動優(yōu)化策略,能及時彌補這種不確定性,始終在實際的基礎上建立新的優(yōu)化目標,兼顧了對未來有限時域內(nèi)的理想優(yōu)化和實際不確定性的影響。這要比建立在理想條件下的傳統(tǒng)最優(yōu)控制更加實際和有效。任務5.1路徑規(guī)劃技術(shù)5.2.2路徑規(guī)劃算法4)圖基于優(yōu)化的方法3)反饋校正預測控制通過研究開環(huán)優(yōu)化問題,來控制閉環(huán)系統(tǒng)在未來時刻的狀態(tài)。在實際過程中,由于存在非線性、時變、模型失配和干擾等一系列不確定因素,這使基于預測模型的控制系統(tǒng)不可能完全準確地與實際機理相匹配。因此,在預測控制中,通過對系統(tǒng)輸出量的測量與參考軌跡進行比較,得出模型的預測誤差,再利用模型預測誤差以及在線滾動優(yōu)化求解的方式來校正預測輸出,從而得到更為準確的未來輸出量。模型預測控制思想的原理圖可表示為如圖所示,在整個系統(tǒng)的控制過程中,始終有一條期望的目標參考軌跡。模型預測控制原理圖任務5.2行為決策技術(shù)理論5.2.1行為決策基本模型1)有限狀態(tài)機模型
有限狀態(tài)機模型是一種規(guī)則模型,能夠清晰地抽象出自動駕駛車輛的決策過程,是最容易理解和進行可靠性驗證的模型,被廣泛應用。它通過構(gòu)建狀態(tài)遷移圖來描述不同的駕駛狀態(tài),以及狀態(tài)之間的轉(zhuǎn)移關(guān)系。但在復雜環(huán)境下,難以有效應對開放的道路環(huán)境。因此,目前主要使用分層有限狀態(tài)機作為智能駕駛的頂層模型,對智能駕駛的場景進行宏觀管理。2)決策樹模型
決策樹模型又叫行為樹模型主要根據(jù)環(huán)境的狀態(tài)對駕駛動作進行“預測”或“分類”,是一種預測模型。決策樹模型將駕駛狀態(tài)和控制邏輯存儲在樹結(jié)構(gòu)中,可通過預定義的規(guī)則或有監(jiān)督的學習來構(gòu)建樹結(jié)構(gòu)。但同樣難以解決狀態(tài)空間、行為空間爆炸的問題,難以應對交通環(huán)境中存在的不確定性因素。3)推理決策模型
推理決策模型主要建立“場景特征一駕駛動作”的映射關(guān)系。其中,場景特征主要指的是從環(huán)境中獲取的“場景”的“知識”,主要包括基于規(guī)則的推理系統(tǒng)、基于案例的推理系統(tǒng)和基于神經(jīng)網(wǎng)絡的映射模型等,其核心是場景知識的認知和映射關(guān)系的學習。通常端到端的深度學習模型都屬于該類模型,其適應性和可解釋性較差。4)基于價值的決策模型
根據(jù)最大效用理論,基于價值的決策模型的基本思想是:依據(jù)選擇準則,在多個備選方案中選擇出最優(yōu)的駕駛策略或動作。該類模型定義了效用(Utility)或價值(Value)函數(shù)來定量評估每個駕駛動作符合駕駛?cè)蝿漳繕说摹昂脡摹背潭?如是否符合安全性、舒適度、行車效率等。由于這一決策模型能夠根據(jù)最終的駕駛目標訓練出車輛的基本動作行為,因此能夠有效提取基礎行為、行車行為、交通行為等復雜行為之間的關(guān)聯(lián)關(guān)系,能夠較好地解決多個智能個體在復雜環(huán)境中的耦合行為決策。目前,基于價值的決策模型的主要研究方向是深度強化學習或多代理深度強化學習。任務5.2行為決策技術(shù)理論5.2.2行為決策方法
行為決策的目標主要是保證智能駕駛車輛可以像人類一樣產(chǎn)生安全的駕駛行為,滿足車輛的安全性能,遵守交通法規(guī)等原則。智能駕駛車輛的行為決策方法包括基于規(guī)則的行為決策方法和基于強化學習的行為決策方法。1)基于規(guī)則的行為決策方法智能駕駛車輛基于規(guī)則的行為決策方法是最常用的。如下圖所示,該方法主要是將智能駕駛車輛的運動行為進行劃分(全局路徑規(guī)劃層),根據(jù)當前任務路線、交通狀況,以及駕駛規(guī)則知識庫等建立行為規(guī)則庫,對不同的環(huán)境狀態(tài)進行行為決策邏輯推理,輸出駕駛行為,同時接收局部路徑規(guī)劃層反饋的當前行為執(zhí)行情況,并根據(jù)該反饋情況進行動態(tài)的實時調(diào)整。2)基于強化學習的行為決策方法
基于強化學習算法的行為決策方法主要是利用各種學習算法進行決策,利用智能駕駛車輛配備的各種傳感器感知周邊的環(huán)境信息,并將其傳遞給強化學習決策系統(tǒng),此時強化學習決策系統(tǒng)的作用就相當于人腦,對各類信息進行分析和處理,并結(jié)合經(jīng)驗來對智能駕駛車輛做出行為決策。任務5.2行為決策技術(shù)理論5.2.3基于規(guī)則的行為決策設計
基于規(guī)則的智能駕駛車輛,其行為決策層設計的核心思想是:利用分治原則,對智能駕駛車輛周邊的場景進行劃分。在每個場景中,獨立運用對應的規(guī)則計算智能駕駛車輛對每個場景中元素的決策行為,再將所有劃分的場景的決策進行綜合,得出一個綜合的總體行為決策。我們先引入幾個重要概念,即綜合行為決策(SyntheticDecision)、個體行為決策(IndividualDecision)、場景(Scenario)劃分構(gòu)建和系統(tǒng)設計。1)綜合行為決策綜合的行為決策代表智能駕駛車輛行為決策層面整體最高層的決策。例如,按照當前車道保持車距行駛,換道至左/右相鄰車道,立刻停車到某一停止線后等待;作為最高層的綜合決策,其所決策的指令狀態(tài)空間定義需要和下游的動作規(guī)劃協(xié)商一致,使得做出的綜合決策指令是下游可以直接用來執(zhí)行規(guī)劃路線軌跡的。為了便于下游直接執(zhí)行,綜合決策的指令集往往帶有具體的指令參數(shù)數(shù)據(jù)。右表中列出了一些綜合決策的指令集定義及其可能的參數(shù)數(shù)據(jù)。綜合決策參數(shù)行駛當前車道目的車道跟車當前車道跟車對象目的車道跟車距離轉(zhuǎn)彎當前車道目的車道轉(zhuǎn)彎屬性轉(zhuǎn)彎速度換道當前車道換道車道加速并道減速并道停車當前車道停車對象停車位置任務5.2行為決策技術(shù)理論2)個體行為決策
與綜合行為決策相對應的是個體行為決策。行為決策層面是所有信息匯聚的地方,最終的綜合行為決第必須是考慮了所有重要的信息元素后得出的。我們提出對所有重要行為決策層面的輸入個體都產(chǎn)生一個個體決策。這里的個體,可以是感知檢測到的正在路上行駛的車輛和行人,也可以是結(jié)合了地圖元素的抽象個體。例如,紅綠燈或者人行橫道對應的停止線等。事實上,最終的綜合決策是先經(jīng)過場景劃分產(chǎn)生出每個場景下的個體決策,之后綜合考慮歸納這些個體決策得出的。個體決策不僅是產(chǎn)生最終的綜合決策的元素,而且和綜合決策一起被傳遞給下游的動作規(guī)劃模塊。這種設計雖然傳遞了更多的數(shù)據(jù),但根據(jù)工業(yè)界的經(jīng)驗,傳遞作為底層決策元素的個體決策,能夠非常有效地幫助下層模塊更有效地實現(xiàn)路徑規(guī)劃。同時,當需要調(diào)試解決問題時,傳遞過來的個體決策能夠大大提高調(diào)試效率。右表列出了一些典型的個體決策及其可能的附帶參數(shù)數(shù)據(jù)。個體決策參數(shù)車輛跟車跟車對象跟車速度跟車距離停車停車對象停車距離超車超車對象超車距離超車時間讓行讓行對象讓行距離讓行時間行人停車停車對象停車距離躲避躲避對象躲避距離任務5.2行為決策技術(shù)理論3)場景構(gòu)建
個體決策的產(chǎn)生依賴于場景的構(gòu)建,這里可以將場景理解成一系列具有相對獨立意義的智能駕駛汽車周邊環(huán)境的劃分。對場景進行劃分,可以將智能駕駛汽車行為決策層面匯集的汽車周邊的不同類別的信息元素,聚類到不同的富有實際意義的場景實體中,在每個場景實體中,基于交通規(guī)則,并結(jié)合主車的意圖,可以計算出對于每個信息元素的個體決策,再通過一系列準則和必要的運算把這些個體決策最終綜合輸出給下游。類似前后方汽車和兩側(cè)車道,這些場景是基本的場景,有一些場景的基本元素本身就可以是這些基本場景。從以上內(nèi)容可以看出,場景定義是分層次的(Layered),每個層次中間的場景是獨立構(gòu)建的。其中,可以認為主車是最基本的底層場景,其他所有場景的構(gòu)建都需要先以智能駕駛汽車主車在哪里這一個基本場景為基礎。在此之上的第一層場景包括紅綠燈、前后方汽車,以及左右兩側(cè)車道、汽車等。路口場景是第二層的復合場景,其中的元素包括第一層的人行橫道、紅綠燈,以及主車等場景。結(jié)合這些場景,路口場景本身中的元素是汽車a和b。假設此時智能駕駛汽車的意圖是右轉(zhuǎn),路口紅燈可以右轉(zhuǎn)但由于沒有道路優(yōu)先權(quán)需要避讓其他汽車,此時如果感知發(fā)現(xiàn)一個行人在人行橫道的這個場景中橫穿馬路,那么結(jié)合所有這些場景元素和意圖,得到的最終指令是針對行人在人行橫道前停車的。任務5.2行為決策技術(shù)理論綜上所述,每個場景模塊利用自身的業(yè)務邏輯(BusinessLogic)來計算其不同元素個體的決策。通過場景的復合,以及最后對所有個體的綜合決策考慮,智能駕駛汽車得到的最終行為決策需要是最安全的決策。這里的一個問題是:會不會出現(xiàn)不同場景對同一個物體(如某個汽車)通過各自獨立的規(guī)則計算出矛盾的決策?從場景的劃分可以看出,本身一個物體出現(xiàn)在不同場景中的概率是很小的。事實上,這種場景劃分的方法本身就盡可能避免了這一情況的出現(xiàn)。即使這種矛盾出現(xiàn),在右圖所示的系統(tǒng)框架的中間層,也會對所有的個體決策進行匯總和安全無碰撞的驗證。
右圖為整個行為決策層面的框架和運行流程圖。任務5.2行為決策技術(shù)理論
一個馬爾可夫決策過程,由下面的五元組定義:(S,A,T,R,γ)。(1)S代表了智能駕駛車輛所處的有限的狀態(tài)空間。狀態(tài)空間的劃分可以結(jié)合智能駕駛汽車當前的位置及其在地圖上的場景進行設計。(2)A代表了智能駕駛汽車的行為決策空間,即智能駕駛汽車在任何狀態(tài)下的所有行為空間的集合。(3)T代表了狀態(tài)轉(zhuǎn)移函數(shù),是一個條件概率,代表了智能駕駛汽車在某個狀態(tài)和某個動作下,到達下一狀態(tài)的概率。(4)R代表了激勵函數(shù),智能駕駛車輛在某個動作下,從狀態(tài)1到狀態(tài)1'所得到的激勵。(5)γ代表了激勵的衰減因子,下一時刻的激勵便按照這個因子進行衰減,其含義是當前的激勵總是比未來的激勵重要。
智能駕駛汽車的行為決策層面需要解決的問題,在上述馬爾可夫決策過程(MDP)的定義下,可以正式描述為尋找一個最優(yōu)“策略”。在任意給定的狀態(tài)下,策略會決定產(chǎn)生一個對應的行為。當策略確定后,整個馬爾可夫決策過程中的行為可以看作一個馬爾可夫鏈。行為決策策略的選取目標是優(yōu)化從當前時間點開始到未來的累積激勵(如果激勵是隨機變量,則優(yōu)化累積激勵的期望)。
在馬爾可夫決策過程的基礎上,部分可觀察馬爾可夫決策過程考慮了環(huán)境的部分可觀察性,即智能體不能準確地得到所有的環(huán)境狀態(tài)。例如,智能駕駛車輛無法通過環(huán)境感知系統(tǒng)直接得到其他汽車的駕駛意圖等。部分可觀察馬爾可夫決策過程可以形式化地表示為一個六元組,其中狀態(tài)集合S、動作集合A、狀態(tài)轉(zhuǎn)移函數(shù)T和激勵函數(shù)R的定義與馬爾可夫決策過程相同,馬爾可夫決策過程所不具備的觀察集合和觀察函數(shù)用以描述環(huán)境狀態(tài)的部分可觀察性。5.2.4馬爾可夫決策過程任務5.2行為決策技術(shù)理論
當環(huán)境是部分可觀察時,智能駕駛車輛無法完全獲得自身所處的真實狀態(tài),只能估計在所有可能狀態(tài)上的概率分布。這種概率分布通常被稱為信念狀態(tài),是對目前環(huán)境狀態(tài)的概率估計,是對所有過去觀察、行動歷史的統(tǒng)計充分量。信念狀態(tài)的集合構(gòu)成一個信念空間。部分可觀察馬爾可夫決策過程可以看作在信念空間上的馬爾可夫決策過程。在基于部分馬爾可夫決策過程進行智能駕駛決策的過程中,決策模塊可以與環(huán)境交互并從感知模塊獲取觀察結(jié)果。基于馬爾可夫過程的決策模塊可以通過更新當前狀態(tài)的概率分布來更新其對真實狀態(tài)的信念。這使得基于部分馬爾可夫決策過程(POMDP)的決策模塊計算出的最佳行為可能考慮了讓智能駕駛車輛能更好地觀察周邊環(huán)境的行為,即某個時刻的決策結(jié)果可能是為了幫助智能駕駛車輛的感知模塊更好地感知周邊環(huán)境,這種考慮是為了使智能駕駛汽車對周邊環(huán)境有更好的觀察,從而能夠在未來做出更好的決策。
為了更好、更快地對未來的環(huán)境進行預測,估計每種行為的激勵,許多先進的部分馬爾可夫決策方法的求解犧牲了規(guī)劃的廣度,以使智能駕駛汽車能夠?qū)崿F(xiàn)實時的決策。兩類常見的近似求解方法包括:基于啟發(fā)式搜索沿著最有可能的信念狀態(tài)進擴展、對高度可能的狀態(tài)進行稀疏隨機抽樣或使用蒙特卡洛搜索技術(shù),這些近似求解部分馬爾可夫決策的方法已經(jīng)被證明可以和全面的求解方法一樣,求得最佳的決策策略。任務5.2行為決策技術(shù)理論5.2.1行為決策基本模型1)有限狀態(tài)機模型
有限狀態(tài)機模型是一種規(guī)則模型,能夠清晰地抽象出自動駕駛車輛的決策過程,是最容易理解和進行可靠性驗證的模型,被廣泛應用。它通過構(gòu)建狀態(tài)遷移圖來描述不同的駕駛狀態(tài),以及狀態(tài)之間的轉(zhuǎn)移關(guān)系。但在復雜環(huán)境下,難以有效應對開放的道路環(huán)境。因此,目前主要使用分層有限狀態(tài)機作為智能駕駛的頂層模型,對智能駕駛的場景進行宏觀管理。2)決策樹模型
決策樹模型又叫行為樹模型主要根據(jù)環(huán)境的狀態(tài)對駕駛動作進行“預測”或“分類”,是一種預測模型。決策樹模型將駕駛狀態(tài)和控制邏輯存儲在樹結(jié)構(gòu)中,可通過預定義的規(guī)則或有監(jiān)督的學習來構(gòu)建樹結(jié)構(gòu)。但同樣難以解決狀態(tài)空間、行為空間爆炸的問題,難以應對交通環(huán)境中存在的不確定性因素。3)推理決策模型
推理決策模型主要建立“場景特征一駕駛動作”的映射關(guān)系。其中,場景特征主要指的是從環(huán)境中獲取的“場景”的“知識”,主要包括基于規(guī)則的推理系統(tǒng)、基于案例的推理系統(tǒng)和基于神經(jīng)網(wǎng)絡的映射模型等,其核心是場景知識的認知和映射關(guān)系的學習。通常端到端的深度學習模型都屬于該類模型,其適應性和可解釋性較差。4)基于價值的決策模型
根據(jù)最大效用理論,基于價值的決策模型的基本思想是:依據(jù)選擇準則,在多個備選方案中選擇出最優(yōu)的駕駛策略或動作。該類模型定義了效用(Utility)或價值(Value)函數(shù)來定量評估每個駕駛動作符合駕駛?cè)蝿漳繕说摹昂脡摹背潭?如是否符合安全性、舒適度、行車效率等。由于這一決策模型能夠根據(jù)最終的駕駛目標訓練出車輛的基本動作行為,因此能夠有效提取基礎行為、行車行為、交通行為等復雜行為之間的關(guān)聯(lián)關(guān)系,能夠較好地解決多個智能個體在復雜環(huán)境中的耦合行為決策。目前,基于價值的決策模型的主要研究方向是深度強化學習或多代理深度強化學習。任務5.2行為決策技術(shù)理論5.2.2行為決策方法
行為決策的目標主要是保證智能駕駛車輛可以像人類一樣產(chǎn)生安全的駕駛行為,滿足車輛的安全性能,遵守交通法規(guī)等原則。智能駕駛車輛的行為決策方法包括基于規(guī)則的行為決策方法和基于強化學習的行為決策方法。1)基于規(guī)則的行為決策方法智能駕駛車輛基于規(guī)則的行為決策方法是最常用的。如下圖所示,該方法主要是將智能駕駛車輛的運動行為進行劃分(全局路徑規(guī)劃層),根據(jù)當前任務路線、交通狀況,以及駕駛規(guī)則知識庫等建立行為規(guī)則庫,對不同的環(huán)境狀態(tài)進行行為決策邏輯推理,輸出駕駛行為,同時接收局部路徑規(guī)劃層反饋的當前行為執(zhí)行情況,并根據(jù)該反饋情況進行動態(tài)的實時調(diào)整。2)基于強化學習的行為決策方法
基于強化學習算法的行為決策方法主要是利用各種學習算法進行決策,利用智能駕駛車輛配備的各種傳感器感知周邊的環(huán)境信息,并將其傳遞給強化學習決策系統(tǒng),此時強化學習決策系統(tǒng)的作用就相當于人腦,對各類信息進行分析和處理,并結(jié)合經(jīng)驗來對智能駕駛車輛做出行為決策。任務5.2行為決策技術(shù)理論5.2.3基于規(guī)則的行為決策設計
基于規(guī)則的智能駕駛車輛,其行為決策層設計的核心思想是:利用分治原則,對智能駕駛車輛周邊的場景進行劃分。在每個場景中,獨立運用對應的規(guī)則計算智能駕駛車輛對每個場景中元素的決策行為,再將所有劃分的場景的決策進行綜合,得出一個綜合的總體行為決策。我們先引入幾個重要概念,即綜合行為決策(SyntheticDecision)、個體行為決策(IndividualDecision)、場景(Scenario)劃分構(gòu)建和系統(tǒng)設計。1)綜合行為決策綜合的行為決策代表智能駕駛車輛行為決策層面整體最高層的決策。例如,按照當前車道保持車距行駛,換道至左/右相鄰車道,立刻停車到某一停止線后等待;作為最高層的綜合決策,其所決策的指令狀態(tài)空間定義需要和下游的動作規(guī)劃協(xié)商一致,使得做出的綜合決策指令是下游可以直接用來執(zhí)行規(guī)劃路線軌跡的。為了便于下游直接執(zhí)行,綜合決策的指令集往往帶有具體的指令參數(shù)數(shù)據(jù)。右表中列出了一些綜合決策的指令集定義及其可能的參數(shù)數(shù)據(jù)。綜合決策參數(shù)行駛當前車道目的車道跟車當前車道跟車對象目的車道跟車距離轉(zhuǎn)彎當前車道目的車道轉(zhuǎn)彎屬性轉(zhuǎn)彎速度換道當前車道換道車道加速并道減速并道停車當前車道停車對象停車位置任務5.2行為決策技術(shù)理論2)個體行為決策
與綜合行為決策相對應的是個體行為決策。行為決策層面是所有信息匯聚的地方,最終的綜合行為決第必須是考慮了所有重要的信息元素后得出的。我們提出對所有重要行為決策層面的輸入個體都產(chǎn)生一個個體決策。這里的個體,可以是感知檢測到的正在路上行駛的車輛和行人,也可以是結(jié)合了地圖元素的抽象個體。例如,紅綠燈或者人行橫道對應的停止線等。事實上,最終的綜合決策是先經(jīng)過場景劃分產(chǎn)生出每個場景下的個體決策,之后綜合考慮歸納這些個體決策得出的。個體決策不僅是產(chǎn)生最終的綜合決策的元素,而且和綜合決策一起被傳遞給下游的動作規(guī)劃模塊。這種設計雖然傳遞了更多的數(shù)據(jù),但根據(jù)工業(yè)界的經(jīng)驗,傳遞作為底層決策元素的個體決策,能夠非常有效地幫助下層模塊更有效地實現(xiàn)路徑規(guī)劃。同時,當需要調(diào)試解決問題時,傳遞過來的個體決策能夠大大提高調(diào)試效率。右表列出了一些典型的個體決策及其可能的附帶參數(shù)數(shù)據(jù)。個體決策參數(shù)車輛跟車跟車對象跟車速度跟車距離停車停車對象停車距離超車超車對象超車距離超車時間讓行讓行對象讓行距離讓行時間行人停車停車對象停車距離躲避躲避對象躲避距離任務5.2行為決策技術(shù)理論3)場景構(gòu)建
個體決策的產(chǎn)生依賴于場景的構(gòu)建,這里可以將場景理解成一系列具有相對獨立意義的智能駕駛汽車周邊環(huán)境的劃分。對場景進行劃分,可以將智能駕駛汽車行為決策層面匯集的汽車周邊的不同類別的信息元素,聚類到不同的富有實際意義的場景實體中,在每個場景實體中,基于交通規(guī)則,并結(jié)合主車的意圖,可以計算出對于每個信息元素的個體決策,再通過一系列準則和必要的運算把這些個體決策最終綜合輸出給下游。類似前后方汽車和兩側(cè)車道,這些場景是基本的場景,有一些場景的基本元素本身就可以是這些基本場景。從以上內(nèi)容可以看出,場景定義是分層次的(Layered),每個層次中間的場景是獨立構(gòu)建的。其中,可以認為主車是最基本的底層場景,其他所有場景的構(gòu)建都需要先以智能駕駛汽車主車在哪里這一個基本場景為基礎。在此之上的第一層場景包括紅綠燈、前后方汽車,以及左右兩側(cè)車道、汽車等。路口場景是第二層的復合場景,其中的元素包括第一層的人行橫道、紅綠燈,以及主車等場景。結(jié)合這些場景,路口場景本身中的元素是汽車a和b。假設此時智能駕駛汽車的意圖是右轉(zhuǎn),路口紅燈可以右轉(zhuǎn)但由于沒有道路優(yōu)先權(quán)需要避讓其他汽車,此時如果感知發(fā)現(xiàn)一個行人在人行橫道的這個場景中橫穿馬路,那么結(jié)合所有這些場景元素和意圖,得到的最終指令是針對行人在人行橫道前停車的。任務5.2行為決策技術(shù)理論綜上所述,每個場景模塊利用自身的業(yè)務邏輯(BusinessLogic)來計算其不同元素個體的決策。通過場景的復合,以及最后對所有個體的綜合決策考慮,智能駕駛汽車得到的最終行為決策需要是最安全的決策。這里的一個問題是:會不會出現(xiàn)不同場景對同一個物體(如某個汽車)通過各自獨立的規(guī)則計算出矛盾的決策?從場景的劃分可以看出,本身一個物體出現(xiàn)在不同場景中的概率是很小的。事實上,這種場景劃分的方法本身就盡可能避免了這一情況的出現(xiàn)。即使這種矛盾出現(xiàn),在右圖所示的系統(tǒng)框架的中間層,也會對所有的個體決策進行匯總和安全無碰撞的驗證。
右圖為整個行為決策層面的框架和運行流程圖。任務5.2行為決策技術(shù)理論
一個馬爾可夫決策過程,由下面的五元組定義:(S,A,T,R,γ)。(1)S代表了智能駕駛車輛所處的有限的狀態(tài)空間。狀態(tài)空間的劃分可以結(jié)合智能駕駛汽車當前的位置及其在地圖上的場景進行設計。(2)A代表了智能駕駛汽車的行為決策空間,即智能駕駛汽車在任何狀態(tài)下的所有行為空間的集合。(3)T代表了狀態(tài)轉(zhuǎn)移函數(shù),是一個條件概率,代表了智能駕駛汽車在某個狀態(tài)和某個動作下,到達下一狀態(tài)的概率。(4)R代表了激勵函數(shù),智能駕駛車輛在某個動作下,從狀態(tài)1到狀態(tài)1'所得到的激勵。(5)γ代表了激勵的衰減因子,下一時刻的激勵便按照這個因子進行衰減,其含義是當前的激勵總是比未來的激勵重要。
智能駕駛汽車的行為決策層面需要解決的問題,在上述馬爾可夫決策過程(MDP)的定義下,可以正式描述為尋找一個最優(yōu)“策略”。在任意給定的狀態(tài)下,策略會決定產(chǎn)生一個對應的行為。當策略確定后,整個馬爾可夫決策過程中的行為可以看作一個馬爾可夫鏈。行為決策策略的選取目標是優(yōu)化從當前時間點開始到未來的累積激勵(如果激勵是隨機變量,則優(yōu)化累積激勵的期望)。
在馬爾可夫決策過程的基礎上,部分可觀察馬爾可夫決策過程考慮了環(huán)境的部分可觀察性,即智能體不能準確地得到所有的環(huán)境狀態(tài)。例如,智能駕駛車輛無法通過環(huán)境感知系統(tǒng)直接得到其他汽車的駕駛意圖等。部分可觀察馬爾可夫決策過程可以形式化地表示為一個六元組,其中狀態(tài)集合S、動作集合A、狀態(tài)轉(zhuǎn)移函數(shù)T和激勵函數(shù)R的定義與馬爾可夫決策過程相同,馬爾可夫決策過程所不具備的觀察集合和觀察函數(shù)用以描述環(huán)境狀態(tài)的部分可觀察性。5.2.4馬爾可夫決策過程
智能駕駛的規(guī)劃和控制緊密聯(lián)系在一起。在智能駕駛汽車行駛之前,首先需要由規(guī)劃模塊規(guī)劃出一條具體的線路,然后交給控制模塊去執(zhí)行,控制汽車行駛。規(guī)劃模塊的職責是規(guī)劃出一條避開障礙物并且符合汽車動力學模型的路線,而控制模塊需要保證汽車一絲不茍的按照規(guī)劃的軌跡來行駛。5.3.1軌跡規(guī)劃概述任務5.3Apollo規(guī)劃與決策技術(shù)
Apollo智能駕駛系統(tǒng)規(guī)劃模塊負責整個車輛的駕駛決策,而駕駛決策需要根據(jù)當前所處的地理位置、周邊道路和交通情況來決定。規(guī)劃不直接控制車輛硬件,而是借助于控制模塊來完成。如圖5-1所示,對于預測模塊的上游模塊是:定位、地圖、導航、感知和預測模塊。控制模塊的上游是規(guī)劃模塊,它的下游模塊是底盤模塊,通過Canbus網(wǎng)絡與車輛的線控底盤通訊,實現(xiàn)智能駕駛控制。5.3.1軌跡規(guī)劃概述圖5-1Apollo整體軟件模塊任務5.3Apollo規(guī)劃與決策技術(shù)規(guī)劃是智能駕駛車輛為了某一目標而作出一些有目的性的決策過程,對于智能駕駛車輛而言,這個目標通常是指從出發(fā)地到達目的地,同時避免障礙物,并且不斷優(yōu)化駕駛軌跡和行為以保證乘客的安全舒適。規(guī)劃層通常又被細分為任務規(guī)劃(MissionPlanning)、行為規(guī)劃(BehavioralPlanning)和動作規(guī)劃(MotionPlanning)三層。Apollo平臺將決策和軌跡規(guī)劃兩個功能整合成為決策與規(guī)劃模塊,稱為Planning模塊,該模塊是Apollo自動駕駛系統(tǒng)中最核心的模塊之一(另外三個核心模塊是:定位、感知和控制)。Planning模塊的主要責任是:根據(jù)導航信息以及車輛的當前狀態(tài),在有限的時間范圍內(nèi),計算出一條合適的軌跡供車輛行駛。規(guī)劃模塊的目標大體有三類,一是安全,要避免所有的碰撞和任何可能的險情;二是高效,在合理的時間內(nèi)抵達終點/目的地;三是舒適,避免急轉(zhuǎn)/急剎等影響體感的行為,保證良好的乘坐體驗。5.3.1軌跡規(guī)劃概述任務5.3Apollo規(guī)劃與決策技術(shù)
Planning模塊的定義是接收原始/預處理的外界信息,根據(jù)無人車行駛的目的地,規(guī)劃無人車未來n秒的運動軌跡。如圖5-2所示,可以看到Planning模塊的輸入包括原始感知、定位、高精地圖、導航路線等信息,也有一些預處理過對于周圍障礙物的運動行為軌跡預測的信息,它輸出給車輛控制模塊,執(zhí)行左/右轉(zhuǎn)、剎車、油門等操作。Planning模塊的特點難點是接收離散的信息輸入,輸出必須是能用數(shù)學語言表達的連續(xù)運動軌跡。正因為此特點,Planning模塊分為兩部分,一部分是決策模塊,另外一部分運動軌跡規(guī)劃模塊。決策模塊對接上游比較發(fā)散的各種信息輸入,運動軌跡規(guī)劃模塊輸出非常具體的軌跡點。5.3.1軌跡規(guī)劃概述圖5-2Planning模塊框架任務5.3Apollo規(guī)劃與決策技術(shù)在Apollo平臺中,為了解決規(guī)劃問題,尤其是從降低計算的復雜性上,采取了對軌跡的路徑與速度規(guī)劃分離的方式。即先確定路徑,也就是軌跡的幾何形狀,然后在已知路徑的基礎上,計算速度分配。使用這種策略,將一個高維度的軌跡規(guī)劃問題,轉(zhuǎn)換成了兩個順序計算的低維度規(guī)劃問題:路徑規(guī)劃,借助中間變量路徑的累計長度s,先求解s映射到幾何形狀(x,y,θ,κ)的路徑函數(shù);速度規(guī)劃,再求解時間t,映射到中間變量s與v,a的速度函數(shù)。因此整個Planning模塊按照運行過程的話可以分為路徑規(guī)劃和速度規(guī)劃,如圖5-3所示。路徑規(guī)劃又分為路徑?jīng)Q策與路徑優(yōu)化,主要處理類似于所謂靜態(tài)管理,比如道路信息或者靜止、低速、行徑障礙物,通過路徑繞開這些障礙物。速度規(guī)劃又分為速度決策與速度優(yōu)化,主要考慮動態(tài)環(huán)境,比如高速行使的時候按照固定路徑走,前面有沒有車,或者旁邊車插進來,對于速度分配不一樣。5.3.1軌跡規(guī)劃概述任務5.3Apollo規(guī)劃與決策技術(shù)圖5-3Planning模塊組成路徑規(guī)劃的目標沿襲了規(guī)劃模塊的目標,分為安全、高效和舒適三類。安全是避讓復雜、擁擠環(huán)境下的諸多障礙物;高效是保證足夠的靈活性;舒適是遵守車輛運動學限制,保證路徑的平滑,幾何形狀的合理。具體如圖5-4(左圖)所示,如果前方有行人,按照綠色平滑軌跡無人車是可能走出來的。但是如圖5-4(右圖)的三條軌跡是不合理的。紅色軌跡離行人太近,不能保證安全;綠色軌跡偏保守,不能保證車輛靈活;紫色軌跡這種形態(tài)給給控制模塊,沿著這條路線走,其實是走不出來的,安全上存在隱患。5.3.2路徑規(guī)劃任務5.3Apollo規(guī)劃與決策技術(shù)圖5-4路徑規(guī)劃為了實現(xiàn)這些目標,需要考慮路徑規(guī)劃,將上游的離散輸入轉(zhuǎn)換為數(shù)學語言能夠表達的輸出,通常需要先建立參考系。在路徑規(guī)劃里面,通常使用弗萊納(Frenet)坐標系(如圖5-5所示),將當前車輛的運動狀態(tài)(x,y,θ,κ,v,a)做分解。使用Frenet坐標系的前提是具有一條光滑的指引線。一般情況下,將指引線理解為道路中心線,車輛在沒有障礙物情況下的理想運動路徑。光滑的指引線是指指引線的幾何屬性可以到曲率級別的光滑。指引線的光滑性至關(guān)重要,因為其直接決定了在Frenet坐標系下求得軌跡的平順性。5.3.2路徑規(guī)劃任務5.3Apollo規(guī)劃與決策技術(shù)圖5-5Frenet坐標系1路徑?jīng)Q策在給定一條光滑指引線上,按照車輛位置,將其投影到指引線上,以投射點為基礎,將地圖坐標系下當前車輛的運動狀態(tài)(x,y,θ,κ,v,a)進行分解,獲得沿著指引線方向的位置、速度、加速度,以及相對于指引線運動的位置、“速度”、“加速度”。打引號的原因是橫向的“速度”、“加速度”并非通常意義上位移對時間的一階/二階導數(shù),而是橫向位移對縱向位移的一階/二階導數(shù),它們描述了幾何形狀的變化趨勢。5.3.2路徑規(guī)劃任務5.3Apollo規(guī)劃與決策技術(shù)圖5-5Frenet坐標系1路徑?jīng)Q策在Frenet坐標系下做運動規(guī)劃的好處在于借助于指引線做運動分解,將高維度的規(guī)劃問題,轉(zhuǎn)換成了多個低維度的規(guī)劃問題,極大的降低了規(guī)劃的難度。另外一個好處在于方便理解場景,無論道路在地圖坐標系下的形狀與否,我們都能夠很好的理解道路上物體的運動關(guān)系。相較直接使用地圖坐標系下的坐標做分析,使用弗萊納坐標,能夠直觀的體現(xiàn)道路上不同物體的運動關(guān)系。路徑規(guī)劃的步驟:第一步生成光滑(曲率可導)的參考線,并以此構(gòu)建參考坐標系;第二步將主車的運動狀態(tài)投影到參考坐標系中;第三步將道路邊界、障礙物特征等信息投影到參考坐標系中;第四步Planning模塊根據(jù)道路邊界、交規(guī)、障礙物特征等作出大致的決策,如圖5-6所示。5.3.2路徑規(guī)劃任務5.3Apollo規(guī)劃與決策技術(shù)1路徑?jīng)Q策圖5-6路徑?jīng)Q策輸出
路徑?jīng)Q策之后,需要對路徑進行優(yōu)化。Apollo平臺中路徑優(yōu)化主要分為四個步驟。1)將連續(xù)性問題離散化。如圖5-7所示,以?s為間隔采樣,得到n個點。?s不能太大也不能太小,如果特別小在工程上影響速度,所以?s通常設置為0.5厘米。2)明確要滿足的約束條件。約束條件主要由三條:主車必須在道路邊界內(nèi),同時不能和障礙物有碰撞;根據(jù)當前狀態(tài),主車的橫向速度/加速度/加加速度有特定運動學限制;必須滿足基本的物理原理。5.3.2路徑規(guī)劃任務5.3Apollo規(guī)劃與決策技術(shù)2路徑優(yōu)化圖5-7連續(xù)性問題離散化
a.主車必須在道路邊界內(nèi),同時不能和障礙物有碰撞。5.3.2路徑規(guī)劃任務5.3Apollo規(guī)劃與決策技術(shù)2路徑優(yōu)化圖5-7連續(xù)性問題離散化b.根據(jù)當前狀態(tài),主車的橫向速度/加速度/加加速度有特定運動學限制。c.必須滿足基本的物理原理,將車輛橫向位置運動當作一個三階系統(tǒng),應用模型預測的方法求解二次規(guī)劃問題(三階泰勒級數(shù)展開)。5.3.2路徑規(guī)劃任務5.3Apollo規(guī)劃與決策技術(shù)2路
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 21478-2024船舶與海上技術(shù)海上環(huán)境保護溢油處理詞匯
- GB/T 33492-2024二手貨交易市場經(jīng)營管理規(guī)范
- 2024鋁合金材料研發(fā)與應用項目合同范本3篇
- 二零二五年度網(wǎng)絡安全事件應急處理與響應計劃合同2篇
- 二零二五版辦公場地租賃信息咨詢服務合同2篇
- 2024年高端設備采購與技術(shù)轉(zhuǎn)讓合同
- 2024水磨石新型裝飾材料研發(fā)與應用承包合同3篇
- 二零二五年度5人合伙人工智能教育培訓合同3篇
- 二零二五年度遺產(chǎn)分配與境外遺產(chǎn)繼承協(xié)議3篇
- 二零二五年度出租車承包合同標準條款3篇
- 深圳2024-2025學年度四年級第一學期期末數(shù)學試題
- 中考語文復習說話要得體
- 中風后認知障礙中醫(yī)臨床路徑
- 罌粟湯_朱氏集驗方卷十_方劑加減變化匯總
- 《我相信---楊培安》歌詞-勵志歌曲
- 做一個幸福班主任
- 初中班主任案例分析4篇
- 公司7s管理組織實施方案
- Q∕GDW 12147-2021 電網(wǎng)智能業(yè)務終端接入規(guī)范
- 仁愛英語單詞默寫本(全六冊)英譯漢
- 公園廣場綠地文化設施維修改造工程施工部署及進度計劃
評論
0/150
提交評論