博弈論的基礎(chǔ)知識

上傳人：m*** IP屬地：天津上傳時間：2022-07-17 格式：DOC 頁數(shù)：19 大?。?1.50KB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩14頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、博弈論的基礎(chǔ)知識與應(yīng)用(轉(zhuǎn))基礎(chǔ)知識博弈論是一種獨特的處于各學科之間的研究人類行為的方法。與博弈論有關(guān)的學科包括數(shù)學、經(jīng)濟學以及其他社會科學和行為科學。博弈論(如同計算科學理論和許多其他的貢獻一樣)是由約翰.馮.諾伊曼(JohnvonNeumanr)創(chuàng)立的。博弈論領(lǐng)域第一本重要著作是諾伊曼與另一個偉大的數(shù)理經(jīng)濟學家奧斯卡.摩根斯坦(OskarMorgenstern)共同寫成的博弈論與經(jīng)濟行為(TheTheoryofGamesandEconomicBehavior)。當然，摩根斯坦把新古典經(jīng)濟學的思想帶入了合作中，但是諾伊曼也同樣意識到那些思想并對新古典經(jīng)濟學做出了其他的貢獻。一個科學的隱喻由于

2、諾伊曼的工作，在更廣闊的人類行為互動的范圍內(nèi)，“博弈”成為了一個科學的隱喻。在人類的互動行為中，結(jié)局依賴于兩個或更多的人們所采取的交互式的戰(zhàn)略，這些人們具有相反的動機或者最好的組合動機(mixedmotives)。在博弈論中常常討論的問題包括：當結(jié)局依賴于其他人所選擇的戰(zhàn)略以及信息是完全的時候，“理性地”選擇戰(zhàn)略意味著什么？在允許共同得益或者共同損失的“博弈”中，尋求合作以實現(xiàn)共同得益(或避免共同損失)是否“理性”？或者，采取侵略性的行動以尋求私人利益而不顧共同得益或共同損失，這是否是“理性”的？如果對2)的回答是“有時候是”，那么在什么樣的環(huán)境下侵略是理性的，在什么樣的情況下合作是理性的？在

3、特定情況下，正在持續(xù)的關(guān)系與單方退出這種關(guān)系是不同的嗎？在理性的自我主義者的行為互動中，合作的道德規(guī)則可以自然而然地出現(xiàn)嗎？在這些情況下，真正的人類行為與“理性”行為是否相符？如果不符，在那些方面不符？相對于“理性”，人們更傾向于合作？或者更傾向于侵略？抑或二者皆是？因而，博弈論研究的“博弈”包括：破產(chǎn)門口的野蠻人(BarbariansattheGate)網(wǎng)絡(luò)戰(zhàn)(BattleoftheNetworks)貨物出門，概不退換(CaveatEmptor)征召(Conscription)協(xié)調(diào)(Coordination)逃避(EscapeandEvasion)青蛙呼叫配偶(FrogsCallforMat

4、es)鷹鴿博弈(HawkversusDove)MutuallyAssuredDestruction多數(shù)決定原則(MajorityRule)MarketNiche共同防衛(wèi)(MutualDefense)囚徒困境(PrisonersDilem)ma補貼小商業(yè)SubsidizedSmallBusiness公共地悲劇TragedyoftheCommons最后通牒Ultimatum視頻系統(tǒng)協(xié)調(diào)VideoSystemCoordination理性新古典經(jīng)濟學與博弈論之間的關(guān)鍵鏈接就是理性。新古典經(jīng)濟學建基于這樣一個假設(shè)之上，即人類在其經(jīng)濟選擇行為中是絕對理性的。確切地說，這個假設(shè)意味著每個人在其所面臨的環(huán)境中

5、都會最大化自身的報酬利潤、收入或主觀利益。在資源配置研究中，上述假說服務(wù)于兩個目的：一是稍稍縮小可能發(fā)生事物的范圍；二是提供了一個衡量經(jīng)濟體制效率的標準。如果經(jīng)濟體制導致部分人的報酬減少，而又沒有對其他人產(chǎn)生更多的報償(寬泛地講就是成本大于收益)，那么在某些方面就產(chǎn)生了失誤。污染、漁業(yè)資源的過度開發(fā)、不恰當?shù)馁Y源用于研究(inadequateresourcescommittedtoresearc)h都是這類問題的例子。在新古典經(jīng)濟學中，理性的個人面臨特定的體制或制度，包括產(chǎn)權(quán)、貨幣和高度競爭的市場。這些是個人納入最大化報酬計算的許多“情況”之一。財產(chǎn)權(quán)利、貨幣經(jīng)濟以及理想化的競爭市場的隱含意義

6、是經(jīng)濟個體不需要考慮自己與其他經(jīng)濟個體的行為互動。他或她只需要考慮自己的境況和“市場條件”。但這導致了兩個問題：一是理論的范圍受到局限。只要競爭受到限制（但沒有壟斷）或者產(chǎn)權(quán)沒有完全界定，眾望所歸的新古典經(jīng)濟學理論就不適用了，并且新古典經(jīng)濟學也從未產(chǎn)生可接受的理論擴展以覆蓋上述情況。對于新古典經(jīng)學來說，決策是在貨幣經(jīng)濟之外做出的，這也是有問題的。博弈論正好面對上述問題：提供一個關(guān)于人們直接（而不是“通過市場”）互動的經(jīng)濟和戰(zhàn)略行為的理論。在博弈論中，“博弈”始終是針對人類社會嚴肅的互動行為的一個隱喻。博弈論也許是關(guān)于紙牌游戲或者棒球運動的理論，但卻不是關(guān)于象棋的理論，它是關(guān)于這樣一些嚴肅的互動

7、行為比如市場競爭、軍備競賽和環(huán)境污染的理論。只不過博弈論涉及這些問題的時候使用的是博弈的隱喻意義：在這些嚴肅的互動行為中，就象在游戲中一樣，個體的選擇實質(zhì)上是戰(zhàn)略選擇，行為互動的結(jié)局依賴于每個參與人所選擇的戰(zhàn)略。通過這樣的闡釋，研究“博弈”可以真正告訴我們關(guān)于嚴肅的互動行為的一些事情。但是，究竟會告訴我們多少？在新古典經(jīng)濟學理論中，理性地進行選擇就是要最大化自身的收益。在某種觀點看來，這是一個數(shù)學問題：在給定環(huán)境條件下選擇最大化報酬的行動。因而我們可以把理性的經(jīng)濟選擇當作一個數(shù)學問題的“解”。在博弈論中，情況就更復(fù)雜了。既然結(jié)局不僅依賴于自身的戰(zhàn)略和“市場”條件，也直接依賴于其他人所選擇的戰(zhàn)略

8、，但我們?nèi)匀豢梢园牙硇缘膽?zhàn)略選擇當作一個數(shù)學問題一一最大化行為互動中的決策制定者群體的報酬一一從而我們再次稱理性的結(jié)果是博弈的“解”。囚徒的困境博弈論近來的發(fā)展，特別是1994年諾貝爾紀念獎授予給三位博弈論理論家以及89歲高齡的塔克()在1995年1月的去世，喚起了人們對博弈論創(chuàng)立時的回憶。盡管博弈論可以追索到更早的時代，但其興起的關(guān)鍵時期是20世紀40年代。當然，博弈論與經(jīng)濟行為的出版是一個特別重要的臺階。但是，在某種程度上，塔克發(fā)明的“囚徒困境”例子更為重要。這個可以在一頁紙上求解出來的例子在20世紀下半葉的社會科學中可能是最具影響的一頁。這個杰出的創(chuàng)見并不是出自研究論文，而出自于課堂。正

9、如S.J.Hagenmayer在費城調(diào)查者(PhiladelphiaInquirer)(“AlbertW.Tucker,89,FamedMathematician,“Thursday,Feb.2,1995,書寫到7)“在1950年，作為訪問教授，塔克在斯坦福大學向由心理學家組成的聽眾發(fā)表演說的時候，創(chuàng)造了囚徒困境來說明分析某些類型博弈的困難。塔克的簡單解釋導致了后來大量的文獻。這些文獻來自不同的領(lǐng)域，比如哲學、倫理學、生物學、社會學、政治科學、經(jīng)濟學，當然還有博弈論?！鼻敉嚼Ь巢┺乃耸菑倪@樣一個小故事開始的：兩個夜賊，鮑伯(Bob)和艾爾(Al)，在行竊現(xiàn)場附近被抓獲并被警方隔離拷問。每個夜

10、賊都必須選擇是否坦白和揭發(fā)對方。如果兩個賊都不坦白，他們都將被判刑一年。如果每個賊都坦白并揭發(fā)對方，他們都將在監(jiān)獄中度過10年。但是，如果一個賊坦白并揭發(fā)對方，而另一個賊不坦白，那么與警方合作的賊將被釋放而另一個賊將在監(jiān)獄中度過20年。在這個例子中的戰(zhàn)略是：坦白與不坦白。贏利（payof）（實際上是處罰）是判刑。我們可以用“贏利表（payofftable）”簡潔地表達上述信息，這類贏利表已經(jīng)成為博弈論中很好的標準表達式。以下是囚徒困境博弈的贏利表。表2-1艾爾坦白不坦白鮑伯坦白10，100，20不坦白20，01，1這個表的讀法是這樣的：每個囚犯從兩個戰(zhàn)略中選擇一個。即，艾爾選擇一列，鮑伯選擇一

11、行。每個單元格的兩個數(shù)字告訴兩個囚犯相應(yīng)的戰(zhàn)略被選擇后的結(jié)果。逗號左邊的數(shù)字表示選擇行的人（鮑伯）的贏利，逗號右邊的數(shù)字表示選擇列的人（艾爾）的贏利。因此（先閱讀第一列），如果他們都選擇坦白，每人將判刑10年，但是如果艾爾坦白而鮑伯不坦白，鮑伯被判20年而艾爾將被釋放。那么：怎樣求解這個博弈？如果雙方都想使自己呆在監(jiān)獄的時間最短，他們選擇什么戰(zhàn)略是“理性的”？艾爾可能會做這樣的推理：“兩種事件可能發(fā)生：鮑伯要么坦白要么保持沉默。假定鮑伯坦白，我不坦白的話將被判20年，我也坦白的話則判10年。另一方面，如果鮑伯不坦白，我不坦白我被判刑1年，但在這種情況下，如果我坦白我可以被釋放。無論怎樣，我選擇

12、坦白都是最好的。因此，我將坦IIo但是鮑伯能夠而且大概也將做同樣的推理因此他們都將坦白并且都在監(jiān)獄呆10年。然而，如果他們“不理性”地行動，都保持沉默，他們都可以在1年后被釋放。占優(yōu)戰(zhàn)略(DominantStrategies)這里發(fā)生的情況是，兩個囚犯陷入了“占優(yōu)戰(zhàn)略均衡”。定義：占優(yōu)戰(zhàn)略讓博弈的參與人單獨地評估他面臨的戰(zhàn)略組合中的每一個戰(zhàn)略，并且，對于每一個組合，他從自己的所有戰(zhàn)略中選擇一個使他贏利最多的戰(zhàn)略。如果對于參與人面臨的每一個不同的戰(zhàn)略組合，參與人都選擇同一個戰(zhàn)略，這個被選擇的戰(zhàn)略就叫該參與人在博弈中的“占優(yōu)戰(zhàn)略”。定義：占優(yōu)戰(zhàn)略均衡在一個博弈中，如果每個參與人都有一個占優(yōu)戰(zhàn)略，且

13、每個參與人都采取占優(yōu)戰(zhàn)略，那么(占優(yōu))戰(zhàn)略組合及其相應(yīng)的贏利被認為是構(gòu)成了博弈的占優(yōu)戰(zhàn)略均衡。在囚犯困境博弈中，坦白是占優(yōu)戰(zhàn)略，當兩個囚犯都選擇坦白時，那就是占優(yōu)戰(zhàn)略均衡。囚犯困境中需要考慮的問題這個不同尋常的結(jié)果兩個囚犯出于自利的個體理性行動導致雙方情況變得更糟糕在現(xiàn)代社會科學中產(chǎn)生了廣泛的影響。因為在現(xiàn)代世界里有大量的行為互動與此極其相似，從軍備競賽到道路擁擠，以及漁業(yè)資源貧化污染和地下水資源的過度開發(fā)等，莫不如此。這些行為互動在細節(jié)上有很大差異，但卻如我們想象的一樣，個體理性給每個人帶來了更差的結(jié)果，囚犯困境暗示了它們的發(fā)展方向。這就是“囚犯困境”的威力所在。當然，我們也必須坦白地承認，

14、囚犯困境對于上述行為互動來說是只一個非常簡明扼要的概括如果你愿意，也可說它“不切實際”。囚犯困境也孕育了許多對其進行批評的論點，這些論點構(gòu)成了許多學術(shù)文獻的基礎(chǔ)：囚犯困境是二人博弈，但是這一思想的許多應(yīng)用場合是真正的多人行為互動。我們假定兩個囚犯之間沒有進行過溝通。如果他們能夠相互溝通并謀求協(xié)調(diào)戰(zhàn)略，我們有可能得到不同的結(jié)局。在囚犯困境中，兩個囚犯僅博弈一次。重復(fù)的博弈行為可以導致大相徑庭的結(jié)果。導致占優(yōu)戰(zhàn)略均衡的推理也許是強制進行的，但它并不是推導出問題的唯一方式。也許它根本就不是最理性的答案。一個信息技術(shù)的例子博弈論提供了一個很有發(fā)展前途的方法去理解各類戰(zhàn)略問題，囚犯困境及其他類似例子的簡

15、明和威力使它們有了一個自然而然的起點。但是在更為復(fù)雜和現(xiàn)實的應(yīng)用中，常常有一些我們必須考慮的沖突。怎樣從一個簡化的博弈轉(zhuǎn)移到更現(xiàn)實的博弈模型？現(xiàn)在讓我們來看一個真實世界的戰(zhàn)略思考的例子：選擇信息系統(tǒng)。這個例子中，參與人是：一個正在考慮選擇新的內(nèi)部電郵系統(tǒng)(internale-mailsystem)或內(nèi)部互聯(lián)網(wǎng)系統(tǒng)(intranetsystem)的公司,以及一個正在考慮制造它們的供應(yīng)商。兩個選擇是：建立技術(shù)先進的系統(tǒng)，或者建立一個功能簡單的一般系統(tǒng)。我們假定更先進的系統(tǒng)真的能夠提供更多的功能，的能夠提供更多的功能，因此兩個參與人的贏利，用戶支付給供應(yīng)商的凈額如表3-1所示。表3-1供應(yīng)商先進一般

16、的凈額如表3-1所示。表3-1供應(yīng)商先進一般用戶先進一般20，200，00，05，5我們發(fā)現(xiàn)，如果建立先進系統(tǒng)，兩個參與者的凈收入都將更好。我們不是宣稱現(xiàn)實永遠如此！我們僅僅是假設(shè)在這個特定的決策下是如此)。可能發(fā)生的最糟糕的情況是一個參與者確定先進系統(tǒng)而另一個參與者卻堅持一般系統(tǒng)。在這樣的情況下將沒有交易，大家也就沒有贏利。為了在一起工作，供應(yīng)商和用戶必須具有一個相容的標準，既然標準的選擇即戰(zhàn)略選擇，那么他們的戰(zhàn)略必須相互吻合。盡管第一眼看上去這很象囚犯困境博弈，但它實際上是更復(fù)雜的博弈。我們將逐一探討幾個復(fù)雜的方面：仔細看一看，我們發(fā)現(xiàn)這個博弈沒有占優(yōu)戰(zhàn)略。每個參與人的最優(yōu)戰(zhàn)略依賴于對方所

17、采取的戰(zhàn)略。因而，我們需要一個新的可以容納這種復(fù)雜性的博弈均衡概念。當沒有占優(yōu)戰(zhàn)略時，我們通常用一個叫做“納什均衡”(NashEquilibrium)的概念來稱呼均衡。納什均衡是根據(jù)諾貝爾獎得主納什來命名得。納什均衡是一個非常美妙簡單的思想：給定其他參與人所選擇的戰(zhàn)略，每個參與人都選擇最優(yōu)戰(zhàn)略，我們將得到納什均衡。例如，如果用戶選擇先進系統(tǒng)，那么供應(yīng)商最好也選擇先進系統(tǒng)。于是(先進，先進)就是一個納什均衡。但是，請留意，如果用戶選擇一般系統(tǒng)，那么供應(yīng)商最好也選擇一般系統(tǒng)。這里存在兩個納什均衡！究竟哪一個會被選擇呢？看起來選擇先進系統(tǒng)是更好的，因此它可能更容易出現(xiàn)，但是如果每個參與人都認為對方陷

18、在一般系統(tǒng)恰如陷入泥土中的手杖之一段那么雙方選擇一般系統(tǒng)將是最好的。假定對方是一根陷入泥土的手杖，雙方都會正確選擇的。這是一類非常危險的經(jīng)典博弈，叫做“協(xié)調(diào)博弈”(coordinationgame我們已經(jīng)學習到的是，相容標準選擇是協(xié)調(diào)博弈。我們假定贏利是確定而且大家都知道的。在現(xiàn)實世界，每一個戰(zhàn)略決策都有風險針對先進系統(tǒng)的決策可能比針對一般系統(tǒng)的決策具有更大的風險。因而，要使例子完全現(xiàn)實化，我們還需要考慮參與人對風險的主觀態(tài)度，考慮他們的“風險規(guī)避”(riskadversion)。在這個例子中我們不做這樣的嘗試，但是我們必須把這些記在腦海里。在例子中我們假定贏利是以貨幣計量的。因而，我們不僅不

19、考慮風險規(guī)避，而且沒有考慮無法用貨幣來計量的主觀收益或損失。經(jīng)濟學家有辦法用貨幣項目來測度主觀收益有時候他們確實這樣做不過，我們將跨過這個問題并假定所有的報酬或懲罰都已經(jīng)貨幣計量化，并且在用戶與供應(yīng)商之間可以進行轉(zhuǎn)移，反之亦然?，F(xiàn)實中，信息系統(tǒng)的選擇可能包括兩個以上的參與人，至少在長期是如此用戶可能在幾個供應(yīng)商之間選擇，而供應(yīng)商也可以有很多客戶。這使得協(xié)調(diào)問題更難以解決。例如，假設(shè)“beta”是先進系統(tǒng)而“VHS是一般系統(tǒng)，假設(shè)90%的市場使用“VHS。那么盡管“beta”是更好的系統(tǒng)，但仍將被“VHS接管。許多經(jīng)濟學家，博弈理論家和其他人相信，這是某種技術(shù)標準獲得支配地位的原因。(Macin

20、tosh機正在譜寫這樣的篇章。你是否能想到其他的象beta與VHS的例子？)另外，例子中用戶和供應(yīng)商不能坐下來等待并觀察對方采取什么行動他們可以坐下來商量，并達成協(xié)議。事實上，他們的確這樣做，因為用戶支付給供應(yīng)商的金額在此之前我們忽略了這個戰(zhàn)略決策也必須達成協(xié)議。換句話說，與囚犯困境不同，這是一個合作博弈(cooperativegames),而不是非合作博弈(noncoorperativegame)。在一方面，這將使協(xié)調(diào)標準的問題變得容易，至少在短期如此；在另一面，合作博弈需要不同的方法去求解。零和博弈從塔克發(fā)明“囚犯困境”開始，博弈論業(yè)已受到廣泛關(guān)注。但是絕大多數(shù)早期的工作主要聚焦在一種特殊

21、的博弈上：零和博弈(Zero-sumGmes)。在早期的工作中，諾伊曼做出了一個驚人的發(fā)現(xiàn)。他發(fā)現(xiàn)，如果玩紙牌的人最大化其報酬，他們采取欺騙來達到目的。并且，更一般地，在很多博弈中支付是不可預(yù)知的。當然，這在本質(zhì)上并無新意棒球投擲手早在諾伊曼寫出混合戰(zhàn)略前就知道投擲角度變換的球了。但是諾伊曼發(fā)現(xiàn)的更多。他發(fā)現(xiàn)了一個明確而又獨特的問題：在這類沒有市場、價格、產(chǎn)權(quán)和其他制度的博弈中，我如何最大化自己的收益？這個問題是對新古典經(jīng)濟學絕對理性概念的一個主要擴展。不過諾伊曼為他的發(fā)現(xiàn)付出了代價。代價就是極端簡化的假定：諾伊曼的發(fā)現(xiàn)僅能用于零和博弈。例如，考慮一個叫“賭便士”（matchingpennie

22、s）的小孩游戲。在這個博弈中，兩個參與人同意一個是“Even（偶數(shù)）”一個是“Odd（奇數(shù)）”。每個人同時出示一個便士，每個參與人可以展示便士的正面或反面。如果兩人展示出同一面，Even將贏得Odd的便士，反之如果他們展示出不同的幣面，則Odd將贏得Even的硬幣。下面是該博弈的贏利表（表4-1）表4-1Even正面反面Even正面反面Odd正面反面1，-1-1，1-1，11，-1如果我們加總每單元格的贏利，我們會得到1-1=0。這就是“零和博弈”定義：零和博弈如果我們加總博弈的贏得和虧損，把虧損記為負數(shù)，我們發(fā)現(xiàn)每一個選定戰(zhàn)略的組合之支付加總之和為0，這個博弈就是“零和博弈”。用非正式的語言

23、講，一個零和博弈即一方所得為另一方所失的博弈。注意定義中要求每個戰(zhàn)略組合的支付總和為0。如果有一個戰(zhàn)略組合的支付加總不為0，這個博弈就不是零和博弈。另一個例子這里有另外一個零和博弈的例子。它是一個非常簡單的價格競爭模型。象奧古斯汀古諾(AugustinCournot,1840)那樣，我們考慮兩個賣礦泉水的公司。每個公司在每一時期有$5000的固定成本，不管他們是否銷售。我們隨機地稱這兩個公司為畢雷礦泉水和阿波里羅礦泉飲料。這兩個公司在同一個市場競爭，并且每個企業(yè)必須選擇高價格(每瓶$2)或者低價格(每瓶$1)。以下是博弈規(guī)則：在$2的價格上，可以出售5000瓶獲得總收益$10000。在$1的價

24、格上，可以出售10000瓶獲得總收益$10000。如果兩個公司選擇同樣的價格，它們平分銷售額。如果一個公司選擇更高的價格，那么價格較低的公司得到全部的銷售量而價格高的公司一瓶也售不出去。贏利即利潤收益減去$5000的固定成本。以下是兩個公司的贏利表(表4-2)。表4-2畢雷礦泉水阿波里羅$10，05000，-5000$2-5000，50000，0(自己檢查一下，這是一個零和博弈)。對于二人零和博弈，存$1$2在一個清楚的解的概念。博弈的解就是最大化準則即，每個參與人選擇最大化其最小贏利的戰(zhàn)略。在這個博弈中，阿波里羅在價格$1下的最小贏利為0，在價格$2下最小贏利為-5000，因此$1最大化其最

25、小贏利。同樣的推理適用于畢雷礦泉水，因此它們都將選擇$1的價格。以下是最大化解背后的推理：阿波里羅知道任何情況下它所會失去的就是畢雷所得到的；所以無論她采取何種戰(zhàn)略，畢雷將選擇使行中支付最小化的戰(zhàn)略。反過來，畢雷剛好進行相反的推理。解：最大化準則對于二人零和博弈，選擇最大化其最小贏利的戰(zhàn)略對于每一個參與者來說都是理性的，雙方最大化其最小贏利的戰(zhàn)略對子和贏利對子就是“博弈的解”?；旌蠎?zhàn)略(MixedStrategy)現(xiàn)在讓我們回顧一下“賭便士”博弈。這個博弈似乎沒有確定的解。最小的贏利在兩個戰(zhàn)略下是相同的：-1。但是這不是全部的故事。這個博弈可以有超過兩個的戰(zhàn)略。作為正面、反面兩個明顯戰(zhàn)略的補充

26、，參與人可以一定的概率隨機選擇提供正面或反面，使其戰(zhàn)略“隨機化”。這樣的隨機戰(zhàn)略叫做“混合戰(zhàn)略”。兩個顯戰(zhàn)略，正面或背面，叫做“純戰(zhàn)略(purestrategies)”古老的堆物博弈有一種很有意思的游戲不知道你玩兒過沒有，就是有物體若干堆，可以是火柴棍或是圍棋子等等均可。兩個人輪流從堆中取物體若干，規(guī)定最后取光物體者取勝。這是我國民間很古老的一個游戲，別看這游戲極其簡單，卻蘊含著深刻的數(shù)學原理。下面我們來分析一下要如何才能夠取勝。（一）巴什博奕（BashGame）：只有一堆n個物品，兩個人輪流從這堆物品中取物，規(guī)定每次至少取一個，最多取m個。最后取光者得勝。顯然，如果n=m+1，那么由于一次最

27、多只能取m個，所以，無論先取者拿走多少個，后取者都能夠一次拿走剩余的物品，后者取勝。因此我們發(fā)現(xiàn)了如何取勝的法則：如果n=（m+1）葉s,（r為任意自然數(shù)，sm）,那么先取者要拿走s個物品，如果后取者拿走k（m）個，那么先取者再拿走m+1-k個，結(jié)果剩下（m+1）（r-1）個，以后保持這樣的取法，那么先取者肯定獲勝?？傊?要保持給對手留下（m+1）的倍數(shù),就能最后獲勝。這個游戲還可以有一種變相的玩法：兩個人輪流報數(shù),每次至少報一個,最多報十個,誰能報到100者勝。（二）威佐夫博奕（WythoffGame）:有兩堆各若干個物品，兩個人輪流從某一堆或同時從兩堆中取同樣多的物品,規(guī)定每次至少取一個,

28、多者不限,最后取光者得勝。這種情況下是頗為復(fù)雜的。我們用（ak,bk）（akak-1，而bk=ak+kak-1+k-1=bk-1ak-1。所以性質(zhì)1。成立。2。任意操作都可將奇異局勢變?yōu)榉瞧娈惥謩?。事實上，若只改變奇異局勢（ak,bk）的某一個分量，那么另一個分量不可能在其他奇異局勢中，所以必然是非奇異局勢。如果使（ak，bk）的兩個分量同時減少,則由于其差不變,且不可能是其他奇異局勢的差,因此也是非奇異局勢。3。采用適當?shù)姆椒?可以將非奇異局勢變?yōu)槠娈惥謩?。假設(shè)面對的局勢是（a,b），若b=a，則同時從兩堆中取走a個物體，就變?yōu)榱似娈惥謩荩?，0）；如果a=ak，bbk，那么，取走b-bk個

29、物體，即變?yōu)槠娈惥謩荩蝗绻鸻=ak，bak，b=ak+k,則從第一堆中拿走多余的數(shù)量a-ak即可；如果aak，b=ak+k,分兩種情況，第一種，a=aj（jk）,從第二堆里面拿走b-bj即可；第二種，a=bj（jk）,從第二堆里面拿走b-aj即可。從如上性質(zhì)可知，兩個人如果都采用正確操作，那么面對非奇異局勢，先拿者必勝；反之，則后拿者取勝。那么任給一個局勢（a,b），怎樣判斷它是不是奇異局勢呢？我們有如下公式：ak=k（1+V5）/2,bk=ak+k（k=0,1,2,.,n方括號表示取整函數(shù)）奇妙的是其中出現(xiàn)了黃金分割數(shù)（1+V5）/2=1。618.,因此，由ak,bk組成的矩形近似為黃金矩形

30、，由于2/（1+V5）=（V5-1）/2,可以先求出j=a（V5-1）/2,若a=j（1+V5）/2,那么a=aj,bj=aj+j,若不等于，那么a=aj+1,bj+1=aj+1+j+1，若都不是，那么就不是奇異局勢。然后再按照上述法則進行,一定會遇到奇異局勢。（三）尼姆博奕（NimmGame）:有三堆各若干個物品，兩個人輪流從某一堆取任意多的物品,規(guī)定每次至少取一個,多者不限,最后取光者得勝。這種情況最有意思,它與二進制有密切關(guān)系,我們用（a，b，c）表示某種局勢，首先（0，0，0）顯然是奇異局勢，無論誰面對奇異局勢，都必然失敗。第二種奇異局勢是（0,n，n），只要與對手拿走一樣多的物品，最

31、后都將導致（0，0，0）。仔細分析一下，（1，2，3）也是奇異局勢，無論對手如何拿，接下來都可以變?yōu)椋?，n，n）的情形。計算機算法里面有一種叫做按位模2加，也叫做異或的運算，我們用符號（+）表示這種運算，先看（1，2，3）的按位模2加的結(jié)果:1=二進制012=二進制103=二進制11（+）0=二進制00（注意不進位）對于奇異局勢（0,n，n）也一樣，結(jié)果也是0。任何奇異局勢（a，b，c）都有a（+）b（+）c=0。如果我們面對的是一個非奇異局勢（a,b，c），要如何變?yōu)槠娈惥謩菽兀考僭O(shè)ab(1,8,9)奇異局勢乙:(1,8,9)-(1,8,4)甲:(1,8,4)-(1,5,4)奇異局勢乙:(

32、1,5,4)-(1,4,4)甲:(1,4,4)-(0,4,4)奇異局勢乙:(0,4,4)-(0,4,2)甲:(0.4,2)-(0,2,2)奇異局勢乙:(0,2,2)-(0,2,1)甲:(0,2,1)-(0,1,1)奇異局勢乙:(0,1,1)-(0,1,0)甲:(0,1,0)-(0,0,0)奇異局勢甲勝。不會用博弈論害死了關(guān)羽有人認為當時蜀國與魏、吳結(jié)怨很深,而荊州位于魏和吳夾擊之中,必然失守,諸葛亮應(yīng)該認識到這一點,但還是讓關(guān)羽留守荊州,因此關(guān)羽之死諸葛亮應(yīng)負一部分責任。筆者持不同的看法,從博弈論的角度論證關(guān)羽之死責任不在諸葛亮,而在于關(guān)羽自己不會用博弈論。正因為荊州位于魏和吳的夾擊之中,時時

33、處于不穩(wěn)定之中,才有劉備不遠千里去攻取西川,爭取一個穩(wěn)固的根據(jù)地。因此說守衛(wèi)荊州確實是一件難事,但并不是說肯定失守。我們可以建立一個博弈模型來進行考慮。當時的實力分析：（1）魏、吳單獨和關(guān)羽交鋒。魏、吳單獨和關(guān)羽比處于下風或至少勢均力敵（從關(guān)羽和曹操的交戰(zhàn)中可以看出這一點），任何一方和關(guān)羽力拼必然損兵折將，另一方則可趁虛而入，不僅能夠取得荊州大部分地區(qū)，還避免了和關(guān)羽正面交鋒的損失。設(shè)此時單獨作戰(zhàn)收益為X，因為單獨作戰(zhàn)，另一方會偷襲，從而自己得不到荊州，有X0。（2）雙方都對關(guān)羽作戰(zhàn)，則關(guān)羽首尾不能兼顧，關(guān)羽必敗。但此時魏吳也會有一定的損失，取勝后為拼搶共同勝利的果實荊州，雙方也會再起戰(zhàn)事，因此此時的收益必定不如本方不戰(zhàn)而偷襲所得的收益，設(shè)此時雙方的收益各為Y2（0Y2Y1）。（3）雙方都不對關(guān)羽力拼，則偷襲不會成功，魏吳

人人文庫> 全部分類> 行業(yè)資料 > 機電工程

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論的基礎(chǔ)知識

文檔簡介

溫馨提示

最新文檔

評論

博弈論的基礎(chǔ)知識

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔