![Agent結(jié)構(gòu)筆記JADE基礎(chǔ)知識_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-5/21/ee0d3d25-abd4-42e4-aff6-e96ce02a4676/ee0d3d25-abd4-42e4-aff6-e96ce02a46761.gif)
![Agent結(jié)構(gòu)筆記JADE基礎(chǔ)知識_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-5/21/ee0d3d25-abd4-42e4-aff6-e96ce02a4676/ee0d3d25-abd4-42e4-aff6-e96ce02a46762.gif)
![Agent結(jié)構(gòu)筆記JADE基礎(chǔ)知識_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-5/21/ee0d3d25-abd4-42e4-aff6-e96ce02a4676/ee0d3d25-abd4-42e4-aff6-e96ce02a46763.gif)
![Agent結(jié)構(gòu)筆記JADE基礎(chǔ)知識_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-5/21/ee0d3d25-abd4-42e4-aff6-e96ce02a4676/ee0d3d25-abd4-42e4-aff6-e96ce02a46764.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、Agent結(jié)構(gòu)筆記JADE基礎(chǔ)知識 1抽象結(jié)構(gòu) s為環(huán)境狀態(tài)集合 A為動作集合 Agent的行為可以表示為 S* - A也就是根據(jù)環(huán)境狀態(tài)集(可能考慮到歷史狀態(tài))決定動作 對于環(huán)境來說 env: SXA - P(S) P(S)表示S的幕集。整個式子表示Agent執(zhí)行動作以后可能是環(huán)境狀態(tài)的一個 子集。如果這個子集只有一個元素則環(huán)境是確定的,否則就是不確定的。 粗略的Agent結(jié)構(gòu)應(yīng)該至少包括兩個部分一一感知部分和動作部分。更細致一 2具體結(jié)構(gòu) 2. 1基于邏輯的結(jié)構(gòu) Agent用一些符號表示環(huán)境狀態(tài)和自身動作,決定動作的過程就是基于這些符 號做公式推導(dǎo)的過程。其中推導(dǎo)是根據(jù)自身已有的規(guī)則集。
2、具體來說,包括三個選擇動作的標準: ,如果根據(jù)規(guī)則集合,當前狀態(tài)能夠直接推導(dǎo)出某動作符號,則執(zhí)行該動作; ,如果上一條不滿足,根據(jù)規(guī)則,狀態(tài)不能推出不做某個動作,則執(zhí)行這個動 作; ,如果上面兩條都不能確定動作,則不執(zhí)行動作。 由于每次決策都要遍歷一次規(guī)則庫,所以基于邏輯的實現(xiàn)效率比較低。但是它 結(jié)構(gòu)簡潔、實現(xiàn)簡單且具有優(yōu)美的邏輯語義。 2. 2反應(yīng)式結(jié)構(gòu) 某些學者認為agent通過和環(huán)境的交互就可以產(chǎn)生理性行為而不需要進行復(fù)雜 的推理。于是便有了反應(yīng)式agento 它的結(jié)構(gòu)很簡單,就是根據(jù)當前的狀態(tài)決定下一步做什么,感覺是有點魯莽的 味道。行為集合是全序關(guān)系的,如果有多個動作都符合要求,那么
3、選擇優(yōu)先級最高 的執(zhí)行。 一個具體的例子就是火星探測車。車本身只有很簡單的兒個動作和決策過程, 但是在完成任務(wù)中卻顯示出很高的理性。 反應(yīng)式鷗ent的好處是簡單、經(jīng)濟、訃算開銷小、穩(wěn)定而優(yōu)雅。缺點是短視、 不能學習、不能很好應(yīng)對突發(fā)事件。 2. 3決策理論結(jié)構(gòu) ,決策理論,概率理論,實用理論 ,Decision theory = Probability Theory + Utility Theory 具體思想也就是在一個非確定環(huán)境中學習一個效用函數(shù),然后根據(jù)這個效用函 數(shù)通過實用推理決定在當前狀態(tài)如何行動。這個時候可以用增量學習 Reinforcement Learning, RL)來做學習。
4、 這個結(jié)構(gòu)的好處是: ,可以用增量學習來建立環(huán)境的模型。 壞處是 ,學要知道環(huán)境完全的概率模型和效用函數(shù); ,雖然馬爾可夫決策過程(MDP)建模能力很強,但是計算開銷卻很大。 2.4 BDI Agent 對于高度動態(tài)的環(huán)境,BDI模型是一個不錯的選擇。BDI模型主要核心是三個 集合。 ,B Belief,信念集。表示對環(huán)境的觀點。比如,相信努力學習就能取 得 好成績。 ,D Disire,愿望集。表示當前想達到的狀態(tài)。比如,我想取得好成 績。 ,I Intention,意圖集。表示目前要做事情。比如,我要努力學習。 Belief是直接山環(huán)境和當前的B確定的,Desire是根據(jù)B和I來定的,并且
5、 如果實現(xiàn)理想的條件還在就應(yīng)該堅持下去。Intention是根據(jù)B、D、I確定的,意 思是當前的意圖不能違背客觀環(huán)境,不能違背自己的理想,也不能違背之前的正確 決定。動作是由I直接推導(dǎo)出的。 環(huán)境會變,所以導(dǎo)致B會變。那么實現(xiàn)理想的條件可能會消失,那么這時就要 修正D和I,這就是一個慎思過程。于是根據(jù)慎思的頻繁程度可以將agent分為魯 莽型(Bold)和謹慎型(cautious)的。 意圖I應(yīng)該有優(yōu)先級的,可以使用用堆棧來存意圖。采用某意圖的時候push, 放棄或 完成的時候POP。抽象的意圖在底部,具體(可執(zhí)行)的意圖在頂部。 2. 5層次結(jié)構(gòu) 層次結(jié)構(gòu)是一種混合式結(jié)構(gòu),直觀的理解是,如果遇到一些常識性的狀態(tài),那 么直接用反應(yīng)式的方式處理就行了,如果遇到一些比較復(fù)雜的狀態(tài),則通過。層次 結(jié)構(gòu)分水平和垂直兩種。如下圖所示。 Layern Percepts Input pL企陶 2 Layer 1 * Action f Output Layern + 4 * Layer 2 *十 Layer 1 PerceptAction
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高鐵建設(shè)項目合作開發(fā)協(xié)議
- 農(nóng)業(yè)資源管理實務(wù)手冊
- 放射科醫(yī)生雇傭合同
- 養(yǎng)殖場轉(zhuǎn)讓協(xié)議合同
- 汽車融資租賃合同
- 2025年克孜勒蘇州道路客貨運輸從業(yè)資格證b2考試題庫
- 小學二年級下冊數(shù)學除法口算題專項訓練
- 2025年吉林貨運從業(yè)資格證考試題技巧及答案
- 2025年毫州貨運上崗證考試考哪些科目
- 電力系統(tǒng)集成合同(2篇)
- 膿包瘡護理查房
- 《信號工程施工》課件 項目一 信號圖紙識讀
- 設(shè)備日常維護及保養(yǎng)培訓
- 設(shè)計院個人年終總結(jié)
- 中石油高空作業(yè)施工方案
- 避孕藥具知識培訓
- 醫(yī)保違規(guī)檢討書
- 鋼結(jié)構(gòu)實習報告
- 2024年建房四鄰協(xié)議范本
- FTTR-H 全光組網(wǎng)解決方案裝維理論考試復(fù)習試題
- 2024年廣東佛山市中醫(yī)院三水醫(yī)院招聘61人歷年高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
評論
0/150
提交評論