![人工智能-博弈樹的搜索課件_第1頁](http://file4.renrendoc.com/view/96bd950685d72554b0dd999f84ceb8cc/96bd950685d72554b0dd999f84ceb8cc1.gif)
![人工智能-博弈樹的搜索課件_第2頁](http://file4.renrendoc.com/view/96bd950685d72554b0dd999f84ceb8cc/96bd950685d72554b0dd999f84ceb8cc2.gif)
![人工智能-博弈樹的搜索課件_第3頁](http://file4.renrendoc.com/view/96bd950685d72554b0dd999f84ceb8cc/96bd950685d72554b0dd999f84ceb8cc3.gif)
![人工智能-博弈樹的搜索課件_第4頁](http://file4.renrendoc.com/view/96bd950685d72554b0dd999f84ceb8cc/96bd950685d72554b0dd999f84ceb8cc4.gif)
![人工智能-博弈樹的搜索課件_第5頁](http://file4.renrendoc.com/view/96bd950685d72554b0dd999f84ceb8cc/96bd950685d72554b0dd999f84ceb8cc5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
人工智能-博弈樹的搜索20世紀(jì)60年代,研制出的西洋跳棋和國際象棋的博弈程序達(dá)到了大師級(jí)的水平。1958約翰?麥卡錫提出博弈樹搜索算法1997年,IBM公司研制的“深藍(lán)”國際象棋程序,采用博弈樹搜索算法,該程序戰(zhàn)勝了國際象棋世界冠軍卡斯帕羅夫。1.概述2人工智能-博弈樹的搜索正在與深藍(lán)下棋的卡斯帕羅夫3人工智能-博弈樹的搜索博弈問題特點(diǎn):雙人對(duì)弈,輪流走步。信息完備,雙方所得到的信息是一樣的。零和,即對(duì)一方有利的棋,對(duì)另一方肯定是不利的,不存在對(duì)雙方均有利或無利的棋。1.概述4人工智能-博弈樹的搜索博弈的特性兩個(gè)棋手交替地走棋;比賽的最終結(jié)果,是贏、輸和平局中的一種;可用圖搜索技術(shù)進(jìn)行,但效率很低;博弈的過程,是尋找置對(duì)手于必?cái)B(tài)的過程;雙方都無法干預(yù)對(duì)方的選擇。1.概述5人工智能-博弈樹的搜索2.Grundy博弈下棋的雙方是對(duì)立的,命名博弈的雙方,一方為“正方”,這類節(jié)點(diǎn)稱為“MAX”節(jié)點(diǎn);另一方為“反方”,這類節(jié)點(diǎn)稱為“MIN”節(jié)點(diǎn)。正方和反方是交替走步的,因此MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)會(huì)交替出現(xiàn)。6人工智能-博弈樹的搜索2.Grundy博弈Grundy博弈是一個(gè)分錢幣的游戲。有一堆數(shù)目為N的錢幣,由兩位選手輪流進(jìn)行分堆,要求每個(gè)選手每次只把其中某一堆分成數(shù)目不等的兩小堆。例如,選手甲把N分成兩堆后,輪到選手乙就可以挑其中一堆來分,如此進(jìn)行下去,直到有一位選手先無法把錢幣再分成不相等的兩堆時(shí)就得認(rèn)輸。7人工智能-博弈樹的搜索2.Grundy博弈設(shè)初始狀態(tài)為(7,MIN),建立問題的狀態(tài)空間圖,圖中所有終結(jié)點(diǎn)均表示該選手必輸?shù)那闆r,取勝方的目標(biāo)是設(shè)法使棋局發(fā)展為結(jié)束在對(duì)方走步時(shí)的終結(jié)點(diǎn)上。8人工智能-博弈樹的搜索MIN先走M(jìn)AX必勝2.Grundy博弈9人工智能-博弈樹的搜索結(jié)點(diǎn)A是MAX的搜索目標(biāo),而結(jié)點(diǎn)B,C則為MIN的搜索目標(biāo)。2.Grundy博弈10人工智能-博弈樹的搜索搜索策略要考慮的問題是:對(duì)MIN走步后的每一個(gè)MAX結(jié)點(diǎn),必須證明MAX對(duì)MIN可能走的每一個(gè)棋局對(duì)弈后能獲勝,即MAX必須考慮應(yīng)付MIN的所有招法,這是一個(gè)與的含意,因此含有MAX符號(hào)的結(jié)點(diǎn)可看成與結(jié)點(diǎn)。
2.Grundy博弈11人工智能-博弈樹的搜索對(duì)MAX走步后的每一個(gè)MIN結(jié)點(diǎn),只須證明MAX有一步能走贏就可以,即MAX只要考慮能走出一步棋使MIN無法招架就成,因此含有MIN符號(hào)的結(jié)點(diǎn)可看成或結(jié)點(diǎn)。2.Grundy博弈12人工智能-博弈樹的搜索對(duì)弈過程的搜索圖呈現(xiàn)出與或圖表示的形式。實(shí)現(xiàn)一種取勝的策略就是搜索一個(gè)解圖的問題,解圖就代表一種完整的博弈策略。2.Grundy博弈13人工智能-博弈樹的搜索中國象棋一盤棋平均走50步,總狀態(tài)數(shù)約為10的161次方。假設(shè)1毫微秒走一步,約需10的145次方年。結(jié)論:不可能窮舉。3.極小極大搜索過程14人工智能-博弈樹的搜索對(duì)各個(gè)局面進(jìn)行評(píng)估評(píng)估的目的:對(duì)后面的狀態(tài)提前進(jìn)行考慮,并且以各種狀態(tài)的評(píng)估值為基礎(chǔ)作出最好的走棋選擇。評(píng)估的方法:用評(píng)價(jià)函數(shù)對(duì)棋局進(jìn)行評(píng)估。贏的評(píng)估值設(shè)為+∞,輸?shù)脑u(píng)估值設(shè)為-∞,平局的評(píng)估值設(shè)為0。評(píng)估的標(biāo)準(zhǔn):由于下棋的雙方是對(duì)立的,只能選擇其中一方為評(píng)估的標(biāo)準(zhǔn)方。3.極小極大搜索過程15人工智能-博弈樹的搜索MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)命名博弈的雙方,一方為“正方”,對(duì)每個(gè)狀態(tài)的評(píng)估都是對(duì)應(yīng)于該方的輸贏的。例如,贏2個(gè),輸1個(gè)等,都是指正方的。正方每走一步,都在選擇使自己贏得更多的節(jié)點(diǎn),因此這類節(jié)點(diǎn)稱為“MAX”節(jié)點(diǎn);3.極小極大搜索過程16人工智能-博弈樹的搜索另一方為“反方”,對(duì)每個(gè)狀態(tài)的評(píng)估都是對(duì)應(yīng)于對(duì)手的輸贏的。例如,贏2個(gè),輸一個(gè),其實(shí)是指自己輸2個(gè),贏1個(gè)的。反方每走一步,都在選擇使對(duì)手輸?shù)酶嗟墓?jié)點(diǎn),因此這類節(jié)點(diǎn)稱為“MIN”節(jié)點(diǎn)。3.極小極大搜索過程17人工智能-博弈樹的搜索由于正方和反方是交替走步的,因此MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)會(huì)交替出現(xiàn)。3.極小極大搜索過程18人工智能-博弈樹的搜索正方(MAX節(jié)點(diǎn))從所有子節(jié)點(diǎn)中,選取具有最大評(píng)估值的節(jié)點(diǎn)。反方(MIN節(jié)點(diǎn))從其所有子節(jié)點(diǎn)中,選取具有最小評(píng)估值的節(jié)點(diǎn)。反復(fù)進(jìn)行這種選取,就可以得到雙方各個(gè)節(jié)點(diǎn)的評(píng)估值。這種確定棋步的方法,稱為極小極大搜索法。
3.極小極大搜索過程19人工智能-博弈樹的搜索3.極小極大搜索過程20人工智能-博弈樹的搜索5-333-3022-30-23541-30689-3MINMAX0MAXMIN3.極小極大搜索過程21人工智能-博弈樹的搜索015-333-3022-30-23541-30689-30-33-3-3-21-36-3031601MAXMINMAXMIN3.極小極大搜索過程22人工智能-博弈樹的搜索
在九宮格棋盤上,兩位選手輪流在棋盤上擺各自的棋子(每次一枚),誰先取得三線的結(jié)果就取勝。設(shè)程序方MAX的棋子用(×)表示,MAX先走。對(duì)手MIN的棋子用(o)表示。例如:3.極小極大搜索過程MIN取勝23人工智能-博弈樹的搜索
估計(jì)函數(shù)f(p)=(所有空格都放上MAX的棋子之后,MAX的三子成線數(shù))-(所有空格都放上MIN的棋子之后,MIN的三子成線的總數(shù))
若P是MAX獲勝的格局,則f(p)=+∞;若P是MIN獲勝的格局,則f(p)=-∞。3.極小極大搜索過程24人工智能-博弈樹的搜索3.極小極大搜索過程估計(jì)函數(shù)值f(p)=6-4=2估計(jì)函數(shù)f(p)=(所有空格都放上MAX的棋子之后,MAX的三子成線(行、列、對(duì)角)數(shù))-(所有空格都放上MIN的棋子之后,MIN的三子成線(行、列、對(duì)角)的總數(shù))當(dāng)前棋局f(p)=225人工智能-博弈樹的搜索3.極小極大搜索過程一字棋第一階段搜索樹26人工智能-博弈樹的搜索3.極小極大搜索過程一字棋第二階段搜索樹27人工智能-博弈樹的搜索3.極小極大搜索過程一字棋第三階段搜索樹28人工智能-博弈樹的搜索
設(shè)有一個(gè)擺放三個(gè)子的棋盤殘局,如下圖所示,〇和╳在結(jié)束前有三步棋可以走,而且設(shè)走第一步的是╳。這時(shí)存在著三個(gè)空格A,B,C,用博弈樹搜索算法判斷應(yīng)該把棋子放到哪一格內(nèi)。
AB╳╳╳〇〇C〇棋盤殘局舉例:3.極小極大搜索過程29人工智能-博弈樹的搜索AB╳╳╳〇〇C〇╳B╳╳╳〇〇C〇╳〇╳╳╳〇〇C〇╳B╳╳╳〇〇〇〇0A╳╳╳╳〇〇C〇〇╳╳╳╳〇〇C〇A╳╳╳╳〇〇〇〇AB╳╳╳〇〇╳〇〇B╳╳╳〇〇╳〇A〇╳╳╳〇〇╳〇-1-
0-
10-
-
0MAX節(jié)點(diǎn)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)3.極小極大搜索過程30人工智能-博弈樹的搜索
對(duì)于棋盤殘局中的╳來說,最好的選擇,是將╳放在C的位置上,這時(shí)可以導(dǎo)致平局局面。
3.極小極大搜索過程31人工智能-博弈樹的搜索-剪支法的引入在極小極大法中,必須求出所有終端節(jié)點(diǎn)的評(píng)估值,當(dāng)預(yù)先考慮的棋步比較多時(shí),計(jì)算量會(huì)大大增加。為了提高搜索的效率,引入了通過對(duì)評(píng)估值的上下限進(jìn)行估計(jì),從而減少需進(jìn)行評(píng)估的節(jié)點(diǎn)范圍的
-剪支法。4.-搜索過程32人工智能-博弈樹的搜索
作為正方出現(xiàn)的MAX節(jié)點(diǎn),假設(shè)它的MIN子節(jié)點(diǎn)有N個(gè),那么當(dāng)它的第一個(gè)MIN子節(jié)點(diǎn)的評(píng)估值為時(shí),則對(duì)于其它的子節(jié)點(diǎn),如果有高過的,就取那最高的值作為該MAX節(jié)點(diǎn)的評(píng)估值;如果沒有,則該MAX節(jié)點(diǎn)的評(píng)估值為。總之,該MAX節(jié)點(diǎn)的評(píng)估值不會(huì)低于,這個(gè)就稱為該MAX節(jié)點(diǎn)的評(píng)估下限值。4.-搜索過程
MAX節(jié)點(diǎn)的評(píng)估下限值
33人工智能-博弈樹的搜索MIN節(jié)點(diǎn)的評(píng)估上限值
作為反方出現(xiàn)的MIN節(jié)點(diǎn),假設(shè)它的MAX子節(jié)點(diǎn)有N個(gè),那么當(dāng)它的第一個(gè)MAX子節(jié)點(diǎn)的評(píng)估值為時(shí),則對(duì)于其它子節(jié)點(diǎn),如果有低于的,就取那個(gè)低于的值作為該MIN節(jié)點(diǎn)的評(píng)估值;如果沒有,則該MIN節(jié)點(diǎn)的評(píng)估值取。總之,該MIN節(jié)點(diǎn)的評(píng)估值不會(huì)高過,這個(gè)就稱為該MIN節(jié)點(diǎn)的評(píng)估上限值。4.-搜索過程34人工智能-博弈樹的搜索
剪支法
MAX節(jié)點(diǎn)
MIN節(jié)點(diǎn)=
剪支ABCD4.-搜索過程
設(shè)MAX節(jié)點(diǎn)的下限為,則其所有的MIN子節(jié)點(diǎn)中,其評(píng)估值的上限小于等于的節(jié)點(diǎn),其以下部分的搜索都可以停止了,即對(duì)這部分節(jié)點(diǎn)進(jìn)行了剪支。35人工智能-博弈樹的搜索
設(shè)MIN節(jié)點(diǎn)的上限為,則其所有的MAX子節(jié)點(diǎn)中,其評(píng)估值的下限大于等于的節(jié)點(diǎn),其以下部分的搜索都可以停止了,即對(duì)這部分節(jié)點(diǎn)進(jìn)行了剪支。MAX節(jié)點(diǎn)
MIN節(jié)點(diǎn)=
剪支ABCD4.-搜索過程
剪支法
36人工智能-博弈樹的搜索ABCDEFGHIJKLNOM4.-搜索過程MAX節(jié)點(diǎn)MAX節(jié)點(diǎn)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)3565216437人工智能-博弈樹的搜索MAX節(jié)點(diǎn)(5,
)35652164(6,
)(2,
)(-,5)(-,2)(5,
)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)
剪支
剪支ABCDEFGHIJKLNOMMAX節(jié)點(diǎn)4.-搜索過程38人工智能-博弈樹的搜索一字棋第一階段
-剪支方法4.-搜索過程39人工智能-博弈樹的搜索4.-搜索過程極大節(jié)點(diǎn)的下界為。極小節(jié)點(diǎn)的上界為。剪支的條件:后輩節(jié)點(diǎn)的值≤祖先節(jié)點(diǎn)的值時(shí),剪支后輩節(jié)點(diǎn)的值≥祖先節(jié)點(diǎn)的值時(shí),剪支簡記為:極小≤極大,剪支極大≥極小,剪支40人工智能-博弈樹的搜索4.-搜索過程86-31453-3503-3022-30-2309-300-303305411-31661abcdefghijkmnMAXMINMAXMIN41人工智能-博弈樹的搜索改進(jìn)方法
使用
-剪支技術(shù),當(dāng)不滿足剪支條件(即
)時(shí)或
值比
值大不了多少或極相近時(shí),這時(shí)也可以進(jìn)行剪支,以便有條件把搜索集中到會(huì)帶來更大效果的其他路徑上,這就是中止對(duì)效益不大的一些子樹的搜索,以提高搜索效率。
4.-搜索過程42人工智能-博弈樹的搜索
不嚴(yán)格限制搜索的深度。當(dāng)?shù)竭_(dá)深度限制時(shí),如出現(xiàn)博弈格局有可能發(fā)生較大變化時(shí),則應(yīng)多搜索幾層,使格局進(jìn)入較穩(wěn)定狀態(tài)后再中止,這樣可使倒推值計(jì)算的結(jié)果比較合理,避免考慮不充分產(chǎn)生的影響,這是等
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度國內(nèi)體育器材采購及租賃服務(wù)合同
- 2025年度辦公樓室內(nèi)外一體化裝修工程合同
- 農(nóng)田果園轉(zhuǎn)租合同范例
- 農(nóng)場注入資金合同范本
- 農(nóng)田修路流轉(zhuǎn)合同范例
- 出國勞務(wù)押金合同范本
- 建筑工程管理中供應(yīng)鏈管理的關(guān)鍵問題探討
- 供苗草坪合同范本
- 委托平面設(shè)計(jì)合同范本
- 五金加工合同范本
- 2025屆高考數(shù)學(xué)一輪專題重組卷第一部分專題十四立體幾何綜合文含解析
- 福建省泉州市南安市2024-2025學(xué)年九年級(jí)上學(xué)期期末考試語文試題(無答案)
- 2025年中國電子煙行業(yè)發(fā)展前景與投資戰(zhàn)略規(guī)劃分析報(bào)告
- 醫(yī)療器材申請(qǐng)物價(jià)流程
- 人教PEP版2025年春季小學(xué)英語三年級(jí)下冊教學(xué)計(jì)劃
- 2024年世界職業(yè)院校技能大賽高職組“市政管線(道)數(shù)字化施工組”賽項(xiàng)考試題庫
- 華為研發(fā)部門績效考核制度及方案
- CSC資助出國博士聯(lián)合培養(yǎng)研修計(jì)劃英文-research-plan
- 2025年蛇年年度營銷日歷營銷建議【2025營銷日歷】
- 攝影入門課程-攝影基礎(chǔ)與技巧全面解析
- 司法考試2024年知識(shí)點(diǎn)背誦版-民法
評(píng)論
0/150
提交評(píng)論