已閱讀5頁,還剩147頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1 博弈論 第二章完全信息靜態(tài)博弈 2 前言 完全信息靜態(tài)博弈 各博弈方同時決策 且所有博弈方對各方得益都了解的博弈 完全信息靜態(tài)博弈是非合作博弈中最基本的類型 囚徒困境 齊威王田忌賽馬 猜硬幣 石頭剪子布 古諾產(chǎn)量決策都屬于完全信息靜態(tài)博弈 博弈有兩種表述方法 1 策略型表述 適合表示靜態(tài)博弈 2 擴展型 博弈樹 表述 適合表示動態(tài)博弈 3 本章主要內(nèi)容 2 1基本分析思路和方法2 2納什均衡2 3無限策略博弈分析和反應函數(shù)2 4混合策略和混合策略納什均衡2 5納什均衡的存在性2 6納什均衡的選擇和分析方法擴展 4 2 1基本分析思路和方法 2 1 1上策均衡2 1 2嚴格下策反復消去法2 1 3劃線法2 1 4箭頭法 5 2 1 1上策均衡 上策 Dominantstrategy 在某個博弈中 如果不管其他博弈方選擇什么策略 一博弈方的某個策略給他帶來的得益始終高于其他 所有 策略 至少不低于其他策略 上策均衡 Dominant strategyEquilibrium 如果一個博弈的某個策略組合中的所有策略都是各個博弈方各自的上策 那么這個策略組合肯定是所有博弈方都愿意選擇的 必然是該博弈比較穩(wěn)定的結(jié)果 我們稱這樣的策略組合為該博弈的一個上策均衡 6 2 1 1上策均衡 因為上策均衡反映了所有博弈方的絕對偏好 因此非常穩(wěn)定 跟據(jù)上策均衡可以對博弈結(jié)果做出最肯定的預測 進行博弈分析時 首先判斷各個博弈方是否都有上策 是否存在上策均衡 7 2 1 1上策均衡 例1 囚徒困境對于囚徒1 策略 坦白 的得益向量為 5 0 策略 不坦白 的得益向量為 8 1 顯然 5 0 8 1 所以 坦白 對于囚徒1來說是一個上策 8 2 1 1上策均衡 同理 對于囚徒2 策略 坦白 的得益向量為 策略不坦白的得益向量為 顯然 所以 坦白 對于囚徒2來說是一個上策 那么 坦白 坦白 就是該博弈的一個上策均衡 這種策略的組合是穩(wěn)定的 9 2 1 1上策均衡 例2 市場競爭中典型的囚徒困境現(xiàn)象之一寡頭1 低價 150 70 高價 100 20 寡頭2 低價 150 70 高價 100 20 低價均為兩個博弈者的上策 上策均衡即為 低價 低價 10 2 1 1上策均衡 上策均衡不是普遍存在的 需要雙方都存在上策 有些博弈就是不存在上策 如 猜硬幣博弈博弈的參與人都不存在上策 博弈也就不存在所謂的上策均衡 11 2 1 2嚴格下策反復消去法 嚴格下策反復消去法思路和原理 嚴格下策 StrictlyDominatedStrategy 不管其他博弈方的策略如何變化 一個博弈方的某種策略給他帶來的得益 總是比另一種或另一些策略給他帶來的得益要小 則稱前一種策略為相對于后一種或一些策略的一個 嚴格下策 嚴格下策是理性博弈方都不會去選擇的策略 可以消去 對于嚴格下策的消去過程 可以在同一博弈方的策略空間中反復運用 也可以在各個博弈方的策略空間上交叉運用 只要有就可以消去 不必計較消去的順序與過程 12 例1 無上策 無上策均衡 用嚴格下策反復削去法 博弈方一 2 1 2嚴格下策反復消去法 博弈方二 對博弈方二 明顯地 右 的得益向量 1 0 中 的得益向量 3 2 所以博弈方二絕對不會選擇 右 13 2 1 2嚴格下策反復消去法 例2 智豬博弈 第一步 博弈描述與假設有兩頭非常聰明的豬 一大一小 共同生活在一個豬圈里 豬圈的一端有一個踏板 踏板連著開放飼料的機關(guān) 只要踏一下 在豬圈的另外一端的食槽就會出現(xiàn)10個單位食物 任何一頭豬去踏這個踏板都會付出相當于2個單位食物的成本 每只豬都可以選擇 踏 或 不踏 踏板 大豬比小豬吃得快 兩頭豬跑得一樣快 食槽 10 大豬 小豬 踏板 14 2 1 2嚴格下策反復消去法 第二步 要素分析 1 局中人 大豬 小豬 2 策略集合 均為 踏 不踏 3 行為順序 同時決策 4 得益 見下頁分析 15 2 1 2嚴格下策反復消去法 踏 需要豬跑一個折返 不踏 的豬只需要在食槽旁等食 情況1 一起跑去踏 一起折返 一起吃 大豬吃8 小豬吃2 情況2 大豬踏 小豬等 大豬踏完往回跑的時候 小豬趁機多吃2 大豬只能吃6單位 小豬可以吃4單位 情況3 小豬踏 大豬等 小豬踏完往回跑的時候 大豬趁機把10單位的食物都吃了 小豬白跑吃不到食物 情況4 都不踏 都忍著 沒有食物吃 食槽 10 大豬 小豬 踏板 16 2 1 2嚴格下策反復消去法 減去2單位 踏 的成本后 兩頭豬在各種情形下的得益 情況一 同時踏 大豬8 2 6 小豬2 2 0 情況二 大豬踏 小豬等候 大豬6 2 4 小豬4 情況三 小豬踏 大豬等候 大豬10 小豬0 2 2 情況四 都不踏 無食物無成本 大豬0 小豬0 兩頭豬的得益矩陣 見上方 17 2 1 2嚴格下策反復消去法 第三步 分析求解最終穩(wěn)定的策略組合為 大豬 踏 小豬 不踏 第四步 結(jié)構(gòu)分析 模型簡單 18 2 1 2嚴格下策反復消去法 第五步 啟示 結(jié)論與建議現(xiàn)實中某些 搭便車 現(xiàn)象的博弈解釋 這種現(xiàn)象 主要是由于局中人對某項事物或工作的效用有很大差異 具有大效用的局中人有時不得不付出更多的勞動 而對于這項事物或工作持可有可無態(tài)度的局中人往往就 搭便車 其他現(xiàn)象 團隊合作等 問題 如何解決 作業(yè)題1 19 2 1 2嚴格下策反復消去法 關(guān)于作業(yè) 請手寫 勿打印 別著急寫 不急著交 等課程基本結(jié)束以后 要前后聯(lián)系課程內(nèi)容 寫出結(jié)論就可以 不必復雜的公式與推導 不必正規(guī)的陳述 沒有什么格式要求 只需要寫出對這個問題的看法 自己想到的解決方案 里面用到了那些博弈思想就可以了 20 2 1 2嚴格下策反復消去法 練習一 博弈方1沒有嚴格下策 從博弈方2開始 博弈的得益結(jié)構(gòu)發(fā)生改變 下策可能就出現(xiàn)了 21 2 1 3劃線法 與上策分析法的情形類似 大部分博弈是不存在嚴格下策的 雖然與上策均衡分析法相比 嚴格下策反復消去法適應更多情況 但是仍然不能夠滿足博弈分析的要求 我們需要一種更普遍適用的博弈分析方法 劃線法 22 2 1 3劃線法 劃線法的思路和方法先找出自己針對其他博弈方每種策略或策略組合的最佳策略 即找最佳對策 這種最佳策略可能不唯一 然后在此基礎上 通過對其他博弈方策略選擇的判斷 包括對其他博弈方對自己策略判斷的判斷等 我知道 對方知道我會選擇某個策略的判斷 預測可能結(jié)果和確定自己的最優(yōu)策略 23 2 1 3劃線法 例1 24 2 1 3劃線法 例2 囚徒困境 25 2 1 3劃線法 例3 猜硬幣博弈 此博弈不存在確定性結(jié)果 沒有策略組合是雙方同時愿意接受的 我們不能預測這個博弈的結(jié)果 26 例4 夫妻之爭 現(xiàn)實中的例子 兩人同時出發(fā)到不同地方匯合 企業(yè)之間關(guān)聯(lián)產(chǎn)品技術(shù)和規(guī)格等方面的合作也是類似博弈 2 1 3劃線法 27 2 1 3劃線法 夫妻之爭有兩個具有穩(wěn)定性的結(jié)果 哪一個結(jié)果出現(xiàn)都是合理的 具體選擇哪一個不得而知 但是 我們可以猜測到 這個博弈的結(jié)果會受到夫妻在家庭中的實際地位的影響 如果在家庭中 丈夫是強勢的 那么 最后博弈的結(jié)果很可能是夫婦一起看足球 如果妻子是強勢的 那么很可能夫婦二人一起看時裝 28 例5 公共資源的過度使用 公共地悲劇 現(xiàn)實生活中的例子 如免費校園網(wǎng)絡的使用 免費道路的使用 解決辦法 消除或減弱公共物品的性質(zhì) 如收費 發(fā)許可等 2 1 3劃線法 29 2 1 4箭頭法 箭頭法思路與方法利用策略組合的穩(wěn)定性和局中人的策略選擇 動機 為思路 對博弈模型的結(jié)果進行分析和預測 30 2 1 4箭頭法 例1 囚徒困境從任意一個策略組合開始分析 這里從 不坦白 不坦白 這個策略組合開始 博弈參與人得益的提高是改變策略的動機 由囚徒1開始分析 31 2 1 4箭頭法 例2 夫妻之爭 32 2 1 4箭頭法 例3 猜硬幣博弈 33 2 1 4箭頭法 例4 公共地的悲劇 34 2 1 4箭頭法 箭頭有進無出的策略組合 表明此時博弈局中人已經(jīng)沒有改變策略的動機 即博弈方再改變策略已經(jīng)不能帶來得益的提高 因此 箭頭有進無出的策略組合是穩(wěn)定的策略組合 箭頭法可以清晰地表明局中人改變行為決策的 動機 即得益 payoff 的提高 但如果博弈過于復雜 得益矩陣過于繁瑣 箭頭法的可用性就不強了 35 2 2納什均衡 2 2 1納什均衡的定義2 2 2納什均衡的一致預測性質(zhì)2 2 3納什均衡與嚴格下策反復消去法 36 2 2 1納什均衡的定義 博弈 博弈方的策略空間和得益的一般表示法 G表示一個博弈 n個博弈方 S1 S2 Sn表示每個博弈方的可選策略集合 稱為策略空間 Sij Si表示博弈方i的第j個策略 博弈方i的得益用ui表示 ui是各博弈方策略的多元函數(shù) n個博弈方的博弈G S1 S2 Sn u1 u2 un 37 2 2 1納什均衡的定義 納什均衡 NashEquilibrium 定義在博弈中 如果由各個博弈方的某一個策略組成的某個策略組合中 任一博弈方i的策略s i 都是對其余各個博弈方的組合的最佳對策 也即對任意都成立 則稱為G的一個納什均衡直白地說 NE就是一組最優(yōu)策略的組合 是每個參與人都不想改變自身決策的一種策略組合和穩(wěn)定狀態(tài) 38 2 2 2納什均衡的一致預測性質(zhì) 一致預測 如果所有博弈方都預測一個特定的博弈結(jié)果會出現(xiàn) 那么所有的博弈方都不會利用該預測或者這種預測能力來選擇與預測結(jié)果不一致的策略 簡單說 沒有哪個博弈方有偏離這個預測結(jié)構(gòu)的愿望 因此這個預測結(jié)果最終真會成為博弈的結(jié)果 一致 的含義 各博弈方的實際行為選擇與他們的預測一致 而不是不同博弈方的預測相同 無差異 只有納什均衡才具有一致預測的性質(zhì) 一致預測性是納什均衡的本質(zhì)屬性 一致預測并不意味著一定能準確預測 因為有多重均衡 會有不一致的可能 39 2 2 3納什均衡與嚴格下策反復消去法 上策均衡與納什均衡的關(guān)系 上策均衡包含在納什均衡范圍之內(nèi) 上策均衡肯定是納什均衡 納什均衡不一定是上策均衡 上策均衡是比納什均衡更強 穩(wěn)定性更高的均衡概念 首先考察是否存在上策均衡 如不存在上策均衡再尋找納什均衡 劃線法是在可以用得益矩陣表示的博弈中尋找納什均衡的有效方法 40 2 2 3納什均衡與嚴格下策反復消去法 納什均衡與嚴格下策反復消去法的關(guān)系 命題2 1在n個博弈方的博弈中 如果嚴格下策反復削去法排除了除之外的所有策略組合 那么一定是該博弈的納什均衡 命題2 2在n個博弈方的博弈中 如果是G的一個納什均衡 那么嚴格下策反復消去法一定不會將它削去 41 2 2 3納什均衡與嚴格下策反復消去法 命題2 1和命題2 2保證了嚴格下策反復消去法和納什均衡分析之間的相容性 保證了在進行納什均衡分析之前先通過嚴格下策反復消去法簡化博弈是可行的 42 2 3無限策略博弈分析和反應函數(shù) 2 3 1古諾的寡頭模型2 3 2反應函數(shù)2 3 3伯特蘭德寡頭模型2 3 4公共資源問題2 3 5反應函數(shù)的問題和局限性 43 2 3無限策略博弈分析和反應函數(shù) 我們前面所討論的分析和求解博弈模型的方法 劃線法 箭頭法的適用范圍 只是可通過策略之間進行兩兩比較分析的有限策略博弈 但是對于無限多種可選策略博弈時是不適用的 我們需要使用新的方法來尋找這類博弈納什均衡的求法 44 2 3 1古諾的寡頭模型 1838 Cournot 第一步 模型描述與假設 模型描述 兩個廠商占領(lǐng)某種產(chǎn)品的市場 形成寡頭壟斷的市場結(jié)構(gòu) 兩寡頭廠商通過決策自己的產(chǎn)量來實現(xiàn)自身利潤最大化 假設條件 假定兩個寡頭廠商生產(chǎn)同質(zhì)產(chǎn)品 兩廠商的產(chǎn)品可完全替代 產(chǎn)量可無限分割 不必取整 1 市場總產(chǎn)量 Q q1 q2 2 市場出清價格 P P Q 8 Q 3 邊際成本 c1 c2 2 且無固定成本 4 兩廠商同時決定各自的產(chǎn)量 45 2 3 1古諾的寡頭模型 第二步 博弈模型要素分析 1 博弈方 廠商1 廠商2 2 策略空間 選擇各自產(chǎn)量q1 q2 3 博弈的順序 廠商1和廠商2同時決策 4 得益 各自的利潤u1 u2 廠商利潤 收益 成本 雙方的得益 利潤 均取決于雙方的策略 產(chǎn)量 46 2 3 1古諾的寡頭模型 第三步 均衡求解 本博弈中的兩博弈方都有無限多種可選策略 因而 無法用得益矩陣表示該博弈 納什均衡的概念還是適用的 即只要兩博弈方的一個策略組合 q1 q2 滿足其中的q1 和q2 是博弈雙方都沒有動機改變的策略 從而形成穩(wěn)定狀態(tài) 或互為對方最佳策略的最優(yōu)對策 從而在互相影響的局勢下實現(xiàn)自身得益最大化 那么這個策略組合就構(gòu)成一個納什均衡 理性的博弈方 廠商 將會分別選擇這兩個產(chǎn)量 47 2 3 1古諾的寡頭模型 如果策略組合是本博弈的納什均衡 那么必須是最大值問題的解 即 是博弈方都沒有動機改變的策略組合 實現(xiàn)了在相互影響的情況下 博弈方自身得益最大化 因此該策略組合具有穩(wěn)定性 48 2 3 1古諾的寡頭模型 求兩個廠商利潤函數(shù)的一階偏導數(shù) 并令兩個一階偏導數(shù)都為0 可得 即產(chǎn)量組合 2 2 為該博弈的納什均衡 49 2 3 1古諾的寡頭模型 第四步 模型結(jié)構(gòu)分析 古諾寡頭博弈納什均衡狀態(tài)下的市場信息 1 商品總產(chǎn)量 Q q1 q2 2 2 4 2 商品市場出清價格 P 8 q1 q2 8 4 4 3 雙方各自的利潤 u1 u2 4 4 兩廠商利潤總和 u1 u2 4 4 8 50 2 3 1古諾的寡頭模型 效率分析 個體理性與集體理性的比較 1 從兩廠商總體利益最大化的角度出發(fā) 則廠商1和廠商2的總利潤 2 總體利潤函數(shù)求對Q的一階偏導數(shù) 并令一階偏導數(shù)為0 51 2 3 1古諾的寡頭模型 共同利益最大化的集體理性 與 兩廠商獨立決策 追求自身而不是共同利益最大化的個體理性 的博弈結(jié)果相比 集體理性 的總產(chǎn)量較小 38 也就是說 如果兩廠商更多考慮合作 聯(lián)合起來決定產(chǎn)量 先定出使總利益最大的產(chǎn)量后 各自生產(chǎn)一半 1 5單位 則各自分享的利益為4 5 比只考慮自身利益的獨立決策行為得到的利益要高 52 2 3 1古諾的寡頭模型 當然 在兩個廠商缺少有力合作機制的時候 這種聯(lián)合通常是很難實現(xiàn)的 即使實現(xiàn) 常常也是不穩(wěn)定的 因為每個博弈方都會有破壞這種合作的動機 從下面的分析我們就可以看到這種現(xiàn)象 53 2 3 1古諾的寡頭模型 兩寡頭間的囚徒困境博弈 1 博弈方 廠商1 廠商2 2 策略 廠商1 突破1 5的平分合作產(chǎn)量 不突破1 5的平分合作產(chǎn)量 廠商2 突破1 5的平分合作產(chǎn)量 不突破1 5的平分合作產(chǎn)量 54 2 3 1古諾的寡頭模型 3 得益情形1 雙方都不突破平分的合作總產(chǎn)量 1 5 平分 9 的總利潤 此時 q1 q2 1 5 u1 u2 4 5 情形2 廠商1私自突破平分合作產(chǎn)量 1 5 達到自身利益最大化產(chǎn)量 2 廠商2渾然不知 仍然生產(chǎn) 1 5 的平分合作產(chǎn)量 此時 q1 2 q2 1 5 Q 3 5 P 8 Q 8 3 5 4 5u1 4 5 2 2 5 u2 4 5 2 1 5 3 75 55 2 3 1古諾的寡頭模型 情形3 廠商2私自突破平分合作產(chǎn)量 1 5 達到自身利益最大化產(chǎn)量 2 廠商1渾然不知 仍然生產(chǎn) 1 5 的平分合作產(chǎn)量 此時 q2 2 q1 1 5 Q 3 5 P 8 Q 8 3 5 4 5u2 4 5 2 2 5 u1 4 5 2 1 5 3 75情形4 雙方都突破平分的合作產(chǎn)量1 5 各自生產(chǎn)使自身利益最大化的產(chǎn)量2 此時 q1 q2 2 u1 u2 4 56 2 3 1古諾的寡頭模型 這樣 這個兩寡頭間的囚徒困境博弈就可以使用如下的博弈矩陣表示 57 2 3 1古諾的寡頭模型 從上面的模型分析我們可以知道 每個博弈方都有動機破壞合作的產(chǎn)量 以獲得更高的個人收益 這將會使總體利益最大化的合作策略組合 不突破 不突破 變得不穩(wěn)定 難以實現(xiàn) 或即使實現(xiàn) 也難以維持 古諾模型在現(xiàn)實經(jīng)濟中的最好例子之一 如石油輸出國組織的限額和突破問題 58 2 3 2反應函數(shù) 古諾模型的納什均衡也可以通過劃線法思路的推廣來分析與求解 劃線法的思路是先找出每個博弈方針對其他博弈方所有策略 或策略組合 的最佳策略 然后再找出相互構(gòu)成最佳對策的各博弈方策略組成的策略組合 在無限策略的古諾模型中 其他博弈方的策略有無限多種 因此 各個博弈方的最佳對策也有無限種 它們之間往往構(gòu)成一種連續(xù)函數(shù)關(guān)系 59 2 3 2反應函數(shù) 廠商1 對于廠商2的任意產(chǎn)量q2 廠商1的最佳對策q1 就是使自己在廠商2生產(chǎn)q2情況下最大化自身利潤的那個產(chǎn)量 即q1是最大化問題 的解 廠商2 與廠商1的情形完全相同 廠商2的對策q2是最大化問題 的解 60 2 3 2反應函數(shù) 分別對廠商1和廠商2的效用表達式求廠商決策變量q1 q2的一階偏導數(shù) 并令一階偏導數(shù)為0 得到q1 R q2 和q2 R q1 61 2 3 2反應函數(shù) q1 R q2 表示 對于廠商2的每一個可能的產(chǎn)量 廠商1的最佳對策產(chǎn)量的計算公式 它是廠商2產(chǎn)量的一個連續(xù)函數(shù) 我們稱這個連續(xù)函數(shù)為廠商1對廠商2的一個 反應函數(shù) 同樣 q2 R q1 表示 對于廠商1的每一個可能的產(chǎn)量 廠商2的最佳對策產(chǎn)量的計算公式 它是廠商1產(chǎn)量的一個連續(xù)函數(shù) 我們稱這個連續(xù)函數(shù)為廠商2對廠商1的一個 反應函數(shù) 所謂 反應函數(shù) 簡單地說 就是針對其他博弈參與人策略的一個最佳的策略函數(shù) 使用的是劃線法的思想 62 2 3 2反應函數(shù) 古諾模型的反應函數(shù) 3 0 0 3 0 6 6 0 2 2 63 2 3 2反應函數(shù) 從上頁的反應函數(shù)曲線中我們可以做出如下分析 1 首先分析廠商1的反應曲線R1 q2 當廠商2選擇0產(chǎn)量時 即q2 0 廠商1的最佳反應為3 即q1 3 這正是實現(xiàn)市場總利益最大的產(chǎn)量 廠商1獨自得到市場的總體利益 當廠商2的產(chǎn)量達到6時 廠商1被迫選擇0產(chǎn)量 因為此時廠商1堅持生產(chǎn)已經(jīng)無利可圖 2 其次分析廠商2的反應曲線R2 q1 與廠商1反應曲線分析是完全相同的 64 2 3 2反應函數(shù) 3 兩條反應函數(shù)曲線的交點是 2 2 是由相互對對方的最佳反應產(chǎn)量構(gòu)成的產(chǎn)量組合 是納什均衡 4 2 2 點以外的其他點都僅僅是一方對另一方的最佳反應 而不是 相互 的最佳反應 這與納什均衡的定義是一致的 65 2 3 3伯特蘭德寡頭模型 1883 背景與假設伯特蘭德寡頭模型是價格博弈 古諾寡頭模型是產(chǎn)量博弈 寡頭間生產(chǎn)的產(chǎn)品不同質(zhì) 具有一定的可替代性 因此即使某個寡頭廠商的產(chǎn)品價格較高也會有銷售 這里仍只考慮兩寡頭的情形 66 2 3 3伯特蘭德寡頭模型 寡頭1與寡頭2各自的需求函數(shù)為 其中d1 d2 0是兩廠商產(chǎn)品的替代系數(shù) 假設廠商生產(chǎn)無固定成本 邊際成本為c1 c2 兩廠商同時決定價格 67 2 3 3伯特蘭德寡頭模型 博弈要素分析 1 博弈方 廠商1 廠商2 2 策略 廠商1與廠商2決定自身產(chǎn)品的價格P1 P2 3 順序 同時決策 4 得益 各自的利潤u1 u2 68 2 3 3伯特蘭德寡頭模型 博弈雙方的得益 69 2 3 3伯特蘭德寡頭模型 從自身效用最大化角度求廠商1和廠商2的反應函數(shù)對于廠商1 求如下最大化問題的解 求廠商1利潤函數(shù)對于廠商1的決策變量q1的一階偏導數(shù) 并令其為0 70 2 3 3伯特蘭德寡頭模型 同理 可求得廠商2的反應函數(shù)綜上 兩廠商對對方策略 價格 的反應函數(shù) 71 2 3 3伯特蘭德寡頭模型 求解納什均衡即求兩個反應函數(shù)的交點 也就是解方程組 過程略 72 2 3 3伯特蘭德寡頭模型 納什均衡多寡頭情形的納什均衡的求解 技術(shù)上就是求n個反應函數(shù)的交點 實例 彩電價格戰(zhàn) 囚徒困境的另一個實例 73 2 3 4公共資源問題 公共資源無獨立所有權(quán) 公眾可以自由利用的自然資源或人類生產(chǎn)的供大眾免費使用的設施 休謨 DavidHume 1739 74 2 3 4公共資源問題 公共草地放牧問題博弈要素分析 1 博弈方 n個農(nóng)戶 2 策略空間 農(nóng)戶可能選擇的養(yǎng)羊數(shù)qi 3 順序 同時決策 4 農(nóng)戶的得益 其中V Q 表示羊只的單位產(chǎn)出 c表示農(nóng)戶養(yǎng)殖每只羊的成本 這里假設c是個常數(shù) 75 2 3 4公共資源問題 這里一個重要的假設就是每只羊的產(chǎn)出是羊只總數(shù)Q的減函數(shù) 這是因為如果羊太多 那么牧草等養(yǎng)殖資源不足 就會造成羊的質(zhì)量下降 76 2 3 4公共資源問題 為了使討論比較簡單和能夠得到直觀的結(jié)論 我們假設 1 農(nóng)戶數(shù) n 3 2 單位羊只養(yǎng)殖成本 c 4 3 單位羊只產(chǎn)出函數(shù) 4 那么3個博弈方 即3個農(nóng)戶的得益為 收入 成本 77 2 3 4公共資源問題 使用得益最大化思想分別求出三個農(nóng)戶各自對其他兩個農(nóng)戶策略的反應函數(shù)農(nóng)戶1 效用函數(shù)對q1求偏導數(shù) 并令偏導數(shù)為0 78 2 3 4公共資源問題 最終三個反應函數(shù)為 三個反應函數(shù)的交點即為納什均衡 79 2 3 4公共資源問題 總體利益最大的情況與個體理性決策進行比較 個體理性 80 2 3 4公共資源問題 結(jié)論過度放牧 資源浪費 農(nóng)戶沒有獲得更好的效益 這也是一類囚徒困境問題 81 2 3 4公共資源問題 這個例子再一次證明了納什均衡 或者說非合作博弈的結(jié)果可能是低效率的 公共資源悲劇的現(xiàn)實例子 冬蟲草 和田玉 公共網(wǎng)絡 公共交通 防護林的保護 公共設施問題 公共設施搭便車者總是比提供者合算的 公共設施供給不足 公共資源利用 公共設施提供 政府的組織 協(xié)調(diào)和制約是非常必要的 82 2 3 5反應函數(shù)的問題和局限性 在許多博弈中 博弈方的策略是有限且非連續(xù)時 其得益函數(shù)不是連續(xù)可導函數(shù) 無法求得反應函數(shù) 從而不能通過解方程組的方法求得納什均衡 83 圖b 圖a 2 3 5反應函數(shù)的問題和局限性 即使得益函數(shù)可以求導 也可能各博弈方的得益函數(shù)比較復雜 因此各自的反應函數(shù)也比較復雜 并不總能保證各博弈方的反應函數(shù)有交點 圖a 特別是不能保證有唯一的交點 圖b 84 2 4混合策略和混合策略納什均衡 2 4 1嚴格競爭博弈和混合策略的引進2 4 2多重均衡博弈和混合策略2 4 3混合策略和嚴格下策反復消去法2 4 4混合策略反應函數(shù) 85 嚴格競爭博弈 各博弈方的利益和偏好始終不一致 在通常策略上沒有納什均衡的博弈問題猜硬幣博弈純 確定性 策略下 沒有納什均衡 但博弈方仍不能隨意決策 2 4 1嚴格競爭博弈和混合策略的引進 86 2 4 1嚴格競爭博弈和混合策略的引進 首先 對蓋硬幣方進行分析 這個博弈中各博弈方?jīng)Q策的第一個原則 自己的策略選擇不能預先被另一方知道或猜測到 否則 對方就會利用這點來選擇策略 從而在博弈中獲勝 其次 自己選擇策略要避免規(guī)律性 選擇策略如果出現(xiàn)規(guī)律性 比如一次正面 一次反面 一次正面 那么對方也會利用這個規(guī)律獲勝 更進一步 如果蓋硬幣方已經(jīng)使用隨機策略 隨機地選擇蓋正面或反面 但總體上出某個策略的概率更大 那么對方仍然會有機可乘 87 2 4 1嚴格競爭博弈和混合策略的引進 因此 如果蓋硬幣方以1 2的概率隨機選擇自身的策略 那么對方就無法從選擇策略的偏好中占得任何便宜 也就是說 博弈方必須保證自身策略選擇的隨機性 以及重視各個策略的概率分布 以防止其他博弈方猜到自己的策略 或利用自己對策略選擇的偏好獲利 88 2 4 1嚴格競爭博弈和混合策略的引進 混合策略 MixedStrategies 一套出招的隨機概率 在博弈G S1 S2 Sn u1 u2 un 中 博弈方i的策略空間為Si Si1 Sik 則博弈方i以概率分布pi pi1 pik 隨機在其k個可選策略中選擇的 策略 稱為 混合策略 其中0 pik 1對j 1 2 k都成立 且pi1 pik 1 純 確定性 策略也可以看作混合策略 即選擇相應純策略的概率為1 選擇其余純策略的概率為0的混合策略 混合策略可以看作純策略的擴展 如果給一個博弈的每個博弈方的純策略空間賦予不同的概率分布 就形成了不同的混合策略 89 2 4 1嚴格競爭博弈和混合策略的引進 混合策略擴展博弈 純策略空間si1 si2 概率分布Pi1 pi11 pi12 Pi2 pi21 pi22 Pi 新 純策略si1 pi11si1 pi12si2 si2 pi21si1 pi22si2 si 90 2 4 1嚴格競爭博弈和混合策略的引進 當博弈方在這個 新產(chǎn)生 的混合策略空間中的選擇看作一個博弈時 原博弈的混合策略就成了后面這個擴展出來的博弈的純策略 擴展出來的博弈可稱為原博弈的混合策略擴展博弈 91 2 4 1嚴格競爭博弈和混合策略的引進 混合策略納什均衡博弈從純策略向混合策略擴展后 納什均衡的概念仍然是成立的 其實質(zhì)是沒有改變的 納什均衡意味著任何博弈方單獨改變自己的策略 或者隨機選擇各個純策略的概率分布 都不能給自己增加任何利益 如果確實是一個嚴格意義上的混合策略組合 即未退化為純策略組合 構(gòu)成一個納什均衡 則稱為一個 混合策略納什均衡 92 2 4 1嚴格競爭博弈和混合策略的引進 博弈方1的混合策略 隨機選擇A B的概率PA和PB 一定要使博弈方2選C和選D的期望得益相等 即 這樣 博弈方1的策略選擇就不會讓博弈方2有任何 傾向性 博弈方2就不可能通過博弈方1的選擇偏好獲利 博弈方2選擇C和D無差異 博弈方2 博弈方1 93 2 4 1嚴格競爭博弈和混合策略的引進 博弈方2的混合策略 隨機選擇C D的概率PC和PD 一定要使博弈方1選A和選B的期望得益相等 即 這樣的話 博弈方2的策略選擇就不會讓博弈方1有任何 傾向性 94 2 4 1嚴格競爭博弈和混合策略的引進 求解混合策略納什均衡 該博弈的混合策略納什均衡為 95 2 4 1嚴格競爭博弈和混合策略的引進 博弈方1和博弈方2的期望得益 96 2 4 1嚴格競爭博弈和混合策略的引進 綜上所述 該博弈的混合策略納什均衡為 博弈方1在均衡狀態(tài)下的期望得益為2 6 博弈方2在均衡狀態(tài)下的期望得益為2 6 97 齊威王田忌賽馬 2 4 1嚴格競爭博弈和混合策略的引進 田忌 齊威王 得益矩陣 PaPbPcPdPePf PgPhPiPjPkPl 98 2 4 1嚴格競爭博弈和混合策略的引進 齊威王的混合策略一定要使田忌選g h i j k l的期望得益相等 這樣的話 齊威王的策略選擇就不會讓田忌有任何 傾向性 從而使田忌從中占到便宜 則有 令 99 2 4 1嚴格競爭博弈和混合策略的引進 同理 田忌也會選擇使得齊威王各種策略期望收益相等的混合策略 令 解得 令 解得 100 2 4 1嚴格競爭博弈和混合策略的引進 在上述混合策略下 齊威王的期望得益為1 田忌的期望得益為 1 即多次進行這樣的賽馬 齊威王平均每次能贏田忌一千斤銅 這是因為齊威王三匹馬的總體實力略勝于田忌三匹馬的總體實力的緣故 101 小偷和守衛(wèi)的博弈 澤爾騰 1996 上海 在純策略下 不存在納什均衡 使用圖解法求混合策略納什均衡 2 4 1嚴格競爭博弈和混合策略的引進 守衛(wèi)睡的期望得益S D S 1 pt D pt守衛(wèi)不睡的期望得益 0 pt 0 S 1 pt 0 102 2 4 1嚴格競爭博弈和混合策略的引進 首先討論小偷 偷 與 不偷 兩種策略概率的確定 守衛(wèi)得益 睡 小偷偷的概率 S 0 1 D 橫軸表示小偷 偷 的概率Pt 分布在0 1之間 不偷 的概率則為1 Pt 縱軸反映對應于小偷 偷 的不同概率 守衛(wèi)選擇 睡 的期望收益 圖中S D連線 S D S 1 pt D pt 當小偷 偷 的概率大于pt 時 守衛(wèi) 睡 的期望得益小于 不睡 的得益0 因此他肯定百分之百選擇 不睡 從而小偷偷一次被抓一次 103 2 4 1嚴格競爭博弈和混合策略的引進 當小偷 偷 的概率大于pt 時 守衛(wèi) 睡 的期望得益小于 不睡 的期望得益0 因此他肯定百分之百選擇 不睡 從而小偷 偷 一次被抓一次 當小偷 偷 的概率小于pt 時 守衛(wèi) 睡 的期望得益大于 不睡 的得益0 因此他肯定百分之百選擇 睡 從而小偷偷竊會得益 只要 偷 的概率不大于pt 的概率 小偷都會得益 因此膽子越來越大 會逐漸提高偷竊概率 直到pt 均衡點是pt 偷 1 pt 不偷 此時守衛(wèi) 睡 與 不睡 的期望收益均為0 104 2 4 1嚴格競爭博弈和混合策略的引進 小偷得益 偷 守衛(wèi)睡的概率 0 1 V P P V V pg P 1 pg 其次討論守衛(wèi) 睡 與 不睡 兩種策略概率的確定 當守衛(wèi) 睡 的概率大于pg 時 小偷 偷 的期望得益大于 不偷 的得益0 因此他肯定百分之百選擇 偷 105 2 4 1嚴格競爭博弈和混合策略的引進 當守衛(wèi) 睡 的概率大于pg 時 小偷 偷 的期望得益大于 不偷 的期望得益0 因此他肯定百分之百選擇 偷 當守衛(wèi) 睡 的概率小于pg 時 小偷 偷 的期望得益小于 不偷 的期望得益0 因此他肯定百分之百選擇 不偷 只要守衛(wèi) 睡 的概率不大于pg 小偷就不會偷竊 因此守衛(wèi)的膽子越來越大 會逐漸提高 睡 的概率 直到pg 均衡點是pg 睡 1 pg 不睡 此時小偷 偷 與 不偷 的期望收益均為0 106 激勵的悖論 守衛(wèi)得益 睡 小偷偷的概率 S 0 1 D D S D S 1 pt D pt 1 加重對守衛(wèi)的處罰 D增加 短期中的效果是使守衛(wèi)真正盡職 睡 的期望收益為負 守衛(wèi)短期內(nèi)會選擇 不睡 在長期中并不能使守衛(wèi)更盡職 pg 并不會下降 但會降低盜竊發(fā)生的概率 pt 會下降 即加重對守衛(wèi)的處罰不會對守衛(wèi)的工作態(tài)度產(chǎn)生長期影響 反而會間接降低小偷偷竊的概率 2 4 1嚴格競爭博弈和混合策略的引進 107 2 4 1嚴格競爭博弈和混合策略的引進 激勵的悖論 小偷得益 偷 守衛(wèi)睡的概率 0 1 V P P P V V pg P 1 pg 2 加重對小偷的處罰 短期內(nèi)能抑制盜竊發(fā)生率 偷 期望收益短期內(nèi)為負數(shù) 小偷短期內(nèi)會選擇 不偷 長期并不能降低盜竊發(fā)生率 pt 并不會改變 但會使守衛(wèi)更多的偷懶 pg 會上升 108 夫妻之爭的混合策略納什均衡妻子的概率選擇 使丈夫選擇兩種策略的期望得益相同 2 4 2多重均衡博弈和混合策略 109 丈夫的概率選擇 使妻子選擇兩種策略的期望得益相同妻子的期望得益丈夫的期望得益 2 4 2多重均衡博弈和混合策略 110 2 4 2多重均衡博弈和混合策略 我們發(fā)現(xiàn) 在夫妻之爭博弈中 雙方進行溝通交流 一方遷就另一方的結(jié)果要比上面分析的混合策略納什均衡結(jié)果要好 因為相互遷就的純策略納什均衡最少會使得丈夫或妻子得到1的確定收益 這要大于混合策略均衡時的期望收益0 75 111 制式問題零配件匹配偏好問題 廠商1偏好 2 2 均衡 而廠商2偏好于 1 3 2 4 2多重均衡博弈和混合策略 112 2 4 2多重均衡博弈和混合策略 混合策略納什均衡為 廠商1 0 4 0 6 期望收益 0 664廠商2 0 67 0 33 期望收益 1 296 相互協(xié)商達成的純策略的得益也是要大于混合策略均衡下的期望收益 113 市場機會博弈 過程請同學們自己完成 2 4 2多重均衡博弈和混合策略 廠商1 2 3 1 3 期望收益 0廠商2 2 3 1 3 期望收益 0 114 2 4 3混合策略和嚴格下策反復消去法 在包括混合策略的情況下 嚴格下策反復消去法的結(jié)論仍然成立 1 任何博弈方不會采用嚴格下策 不管它們是純策略還是混合策略 2 嚴格下策反復消去法不會消去任何納什均衡 包括純策略納什均衡和混合策略納什均衡 3 如果經(jīng)過反復消去后留下的策略組合是惟一的 那么一定是納什均衡 115 2 4 3混合策略和嚴格下策反復消去法 博弈方2采用純策略L時 博弈方1用上述混合策略的期望得益為 博弈方2采用純策略R時 博弈方1用上述混合策略的期望得益為 博弈方2采用混合策略 q 1 q 時 博弈方1用上述混合策略的期望得益為 博弈方1采取混合策略 以概率 1 2 1 2 0 選擇 U M D 時 與這個混合策略相比 D一定是博弈方1的嚴格下策 116 2 4 3混合策略和嚴格下策反復消去法 因此 不管博弈方2采用哪種策略 包括所有可能得純策略和所有混合策略 對應q的所有可能值 博弈方1采用 1 2 1 2 0 的期望收益始終為3 2 都要大于采用D策略時得到的確定性得益1 由于我們假設博弈方是風險中性的 D相對于混合策略 1 2 1 2 0 是嚴格下策 117 2 4 3混合策略和嚴格下策反復消去法 需要注意的是 并不是包括混合策略以后 博弈中一定會存在可以先行削去的純策略嚴格下策 如將博弈的得益修改為 D就不再是嚴格下策 1 3 2 2 沒有嚴格的優(yōu)劣 118 2 4 4混合策略反應函數(shù) 反應函數(shù)即一博弈方對另一博弈方每種可能的決策內(nèi)容的最佳反應決策構(gòu)成的函數(shù) 在純策略的范疇內(nèi) 反應函數(shù)是各博弈方選擇的純策略對其他博弈方純策略的反應 在混合策略的范疇內(nèi) 博弈方的決策內(nèi)容為選擇概率分布 反應函數(shù)就是一方對另一方的概率分布的反應 同樣也是一定的概率分布 119 2 4 4混合策略反應函數(shù) 猜硬幣博弈 正反蓋硬幣方 r 1 r 猜硬幣方 q 1 q qU 蓋反 r 1即對方猜正面的概率小 我蓋正面有便宜 所以我傾向于蓋正面 故r 1 我總蓋正面 q 1 2時 U 蓋反 U 蓋正 r任意q 1 2時 U 蓋正 U 蓋反 r 0 r1 2時 U 猜正 U 猜反 q 1 r q 0 1 2 1 r R1 q 1 2 1 q R2 r 對方猜正面的概率 對方蓋正面的概率 混和策略NE蓋 1 2 1 2 猜 1 2 1 2 120 2 4 4混合策略反應函數(shù) 夫妻之爭分析妻子 對丈夫的混合策略 q 1 q 的對策分析 1 妻子選擇 宮心計 的期望收益U C 3q 0 1 q 3q 2 妻子選擇 世界杯 的期望收益U F 0q 1 1 q 1 q因此 當q1 4時 r 1 1 r 0 丈夫的分析同妻子 121 2 4 4混合策略反應函數(shù) 分析丈夫 對妻子的混合策略 r 1 r 的對策分析 1 丈夫選擇 宮心計 的期望收益U C 1r 0 1 r r 2 丈夫選擇 世界杯 的期望收益U F 0r 3 1 r 3 3r因此 當r3 4時 q 1 1 q 0 122 2 4 4混合策略反應函數(shù) 夫妻之爭 宮心計世界杯妻子 r 1 r 丈夫 q 1 q 妻子 qU C r 0q 1 4時 U F U C r取 0 1 任意值 q 1 4時 U C U F r 1 丈夫 rU C q 0r 3 4時 U F U C q取 0 1 任意值 r 3 4時 U C U F q 1 0 1 4 r 3 4 1 q 1 r R1 q q R2 r 純策略NE1 世界杯 世界杯 純策略NE1 宮心計 宮心計 混和策略NE妻 3 4 1 4 丈 1 4 3 4 123 2 5納什均衡的存在性 納什定理 Nash1950 在一個有n個博弈方的博弈G S1 Sn u1 un 中 如果n是有限的 其Si都是有限集 對i 1 2 n 則該博弈至少存在一個納什均衡 但可能包括混合策略納什均衡 每一個有限博弈都至少有一個混合策略納什均衡定理證明 不動點定理 納什定理的意義 NE存在的普遍性 一致預測 成為博弈問題分析方法 124 2 6納什均衡的選擇和分析方法擴展 納什均衡是博弈問題最基本的分析概念 是均衡分析概念的基礎 但納什均衡分析并不一定能徹底解決一個博弈問題 因為納什均衡的存在性不等于惟一性 在許多博弈中納什均衡是不惟一的 而且不同的納什均衡相之間也沒有明顯的優(yōu)劣關(guān)系 從而博弈方的選擇會遇到困難 夫妻之爭博弈就是這樣的一個典型例子 125 2 6納什均衡的選擇和分析方法擴展 即使一個博弈的幾個納什均衡之間存在優(yōu)劣關(guān)系 帕累托效率意義上的 也不能保證博弈方一定會選擇較優(yōu)的納什均衡 風險 破壞者 串通 的存在 使得博弈結(jié)果無法用納什均衡加以解釋 因此對有些博弈問題僅僅進行納什均衡分析是不夠的 必須在納什均衡分析的基礎上再作進一步的深入分析 126 2 6納什均衡的選擇和分析方法擴展 2 6 1帕累托和風險上策均衡 帕累托上策均衡 風險上策均衡2 6 2聚點和相關(guān)均衡 聚點均衡 相關(guān)均衡2 6 3共謀和防共謀均衡 多人博弈中的共謀問題 防共謀均衡 127 2 6 1帕累托和風險上策均衡 帕累托上策均衡 依據(jù)帕累托效率意義上的優(yōu)劣關(guān)系 某一個納什均衡給所有博弈方帶來的利益都大于其他所有納什均衡會帶來的利益 博弈方選擇的傾向性是一致的 兩個純策略納什均衡 戰(zhàn)爭 戰(zhàn)爭 和平 和平 在帕累托效率意義上 和平 和平 明顯較好 構(gòu)成一個帕累托上策均衡 如果兩國的決策者都是理性的 那么兩個國家之間就不應該會發(fā)生戰(zhàn)爭 128 2 6 1帕累托和風險上策均衡 風險上策均衡 如果所有博弈方在預計其他博弈方采用兩種納什均衡的策略的概率相同時 都偏愛其中某一納什均衡 則該納什均衡就是一個風險上策均衡 明顯地 U L 為帕累托上策均衡 但是選擇這個NE對雙方都有很大風險 一旦對方偏離這個均衡 那么自身的得益損失是非常大的 相對于這種高風險 D R 就有了相對優(yōu)勢 129 2 6 1帕累托和風險上策均衡 混合策略納什均衡 混合策略納什均衡是博弈方使得對方行為選擇無差異時 自身行為的概率分布 博弈方1 令博弈方2選擇L與R無差異博弈方2 令博弈方1選擇U與D無差異 130 2 6 1帕累托和風險上策均衡 檢查博弈方的策略偏好 博弈方1的混合策略 PU和PD 與博弈方2策略L與R的偏好性 當PU1 8時 有U L U R 即此時博弈方2對策略R具有偏好 131 2 6 1帕累托和風險上策均衡 檢查博弈方的策略偏好 博弈方2的混合策略 PL和PR 與博弈方1策略U與D的偏好性 當PL1 8時 有U U U D 即博弈方2對策略D具有偏好 132 2 6 1帕累托和風險上策均衡 如果博弈方1傾向于策略D的隨機概率大于12 5 那么博弈方2的R策略相對于帕累托均衡策略L就具有期望得益上的優(yōu)勢 因此博弈方2偏好于R 如果博弈方2傾向于R的隨機概率大于12 5 那么博弈方1的D策略相對于帕累托均衡策略D就具有期望得益上的優(yōu)勢 因此博弈方1偏好于D 133 2 6 1帕累托和風險上策均衡 總結(jié) 偏離的概率要求小于1 8 12 5 才能保證帕累托上策均衡 U L 可以實現(xiàn) 這比較不保險 一旦對方偏離帕累托上策均衡的概率大于12 5 如果自己不改變帕累托上策均衡的策略 那么很有可能獲得0收益 風險很大 所以 在收益相差不是很大的情況下 D R 相對于 U L 具有風險上的較大優(yōu)勢 D R 就是一個風險上策均衡 說白了 一方 不靠譜 使得另一方選擇更加保險的策略 134 2 6 1帕累托和風險上策均衡 獵鹿博弈 詳細分析如上例 請同學們自行完成 獵鹿有風險捕兔有保障 其中一種簡單情況 假如另一方選擇獵鹿和抓兔的概率都是1 2 那么 獵鹿 的期望收益僅為2 5 小于抓兔子的確定性收益3 因此 兔子 兔子 就是這個博弈的一個風險上策均衡 獵人1獵鹿 獵人2獵鹿 135 2 6 1帕累托和風險上策均衡 博弈方對風險上策均衡的選擇傾向 有一種自我強化的機制 當部分或所有博弈方選擇風險上策均衡的可能性增強時 都擔心對方偏離帕累托上策均衡 任一博弈方選擇帕累托上策均衡策略的期望得益都會進一步變小 這就使各博弈方更傾向于選擇風險上策均衡 從而形成一種選擇風險上策均衡的正反饋機制 使其出現(xiàn)的機會越來越大 合作難 多人合作更難 136 2 6 2聚點和相關(guān)均衡 1 聚點均衡人們的決策選擇受心理 習慣 文化 環(huán)境等多種因素影響 體現(xiàn)出這些因素的納什均衡 就稱為聚點均衡 137 2 6 2聚點和相關(guān)均衡 例1 報時博弈 1 博弈參與人 博弈方1 博弈方2 2 策略 雙方選擇0點到24點的任意時間報時 無限 3 順序 同時 4 得益 2人報時間相同 獲得100元 報時不同 獲得0元 選擇整點后 即聚點 雖然不能保證雙方的選擇一致 但至少能大大提高雙方選擇一致的概率 138 2 6 2聚點和相關(guān)均衡 聚點均衡 在多重納什均衡的博弈中 雙方同時選擇一個聚點構(gòu)成的納什均衡稱為 聚點均衡 139 2 6 2聚點和相關(guān)均衡 例2 城市博弈上海 南京 長春 哈爾濱 兩人將以上四個城市分成兩組 如果兩人的分組相同 獲得100元 中國人 通常會 上海 南京 長春 哈爾濱 按南方和北方城市的特征分組 地理常識 產(chǎn)生聚點 140 2 6 2聚點和相關(guān)均衡 聚點均衡首先是納什均衡 是多重納什均衡中比較容易被選擇的納什均衡 聚點均衡是利用博弈規(guī)則以外的特定信息選擇的均衡 文化背景中的習慣或規(guī)范 共同的知識或者其他各種特征都可能是聚點均衡的依據(jù) 141 2 6 2聚點和相關(guān)均衡 2 相關(guān)均衡人們在現(xiàn)實中遇到選擇困難時 特別是在長期中反復遇到相似的選擇難題時 通常會通過收集更多的信息 形成特定的機制和規(guī)則 也就是某種形式的制度安排等主動尋找出路 142 2 6 2聚點和相關(guān)均衡 相關(guān)均衡例子 存在三個納什均衡 其中 兩個是純策略均衡 U L D R 一個是混合策略均衡 1 2 1 2 1 2 1 2 純策略均衡雖然都能使雙方得到6單位的得益總和 但是個人得益差距很大 很難形成自然妥協(xié) 聚點 不適用 若采用混合策略納什均衡
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合伙做美甲合同范例
- 裝修聯(lián)營施工合同范例
- 標準住宅出售合同范例
- 工地用車合同范例
- 品牌tvc制作合同范例
- 賠償維修合同范例
- 林園出租轉(zhuǎn)讓合同范例
- 商品價格波動合同范例
- 廠商共贏合同范例
- 樓宇自控調(diào)試合同范例
- 三叉神經(jīng)痛診斷及手術(shù)治療
- 合同解除補充協(xié)議
- 第三章-船舶建造工程報價
- 浙江省溫州市2023-2024學年六年級上學期期末科學試卷(含答案)3
- 2022-2023學年廣東省廣州市番禺區(qū)祈福英語實驗學校七年級(上)期末英語試卷
- 警察小學生安全教育講座
- 高中技術(shù)《第四章控制和設計》單元自測題
- 駕駛證學法減分(學法免分)試題和答案(50題完整版)1650
- 四色安全風險空間分布圖設計原則和要求
- 2024重慶空港貴賓服務有限公司招聘筆試沖刺題(帶答案解析)
- 工作平臺梁格體系鋼結(jié)構(gòu)課程設計
評論
0/150
提交評論