版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、決策實(shí)際與方法Decision Making Theory and Methods 第九章 競爭型決策方法學(xué)習(xí)目的 了解競爭型決策的根本概念,了解競爭型決策的根本實(shí)際,掌握競爭型決策的研討方法,最終在現(xiàn)實(shí)生活中可以熟練運(yùn)用。 本講內(nèi)容9.1 競爭型決策概述9.2 完全信息靜態(tài)競爭型決策9.3 完全信息動(dòng)態(tài)競爭型決策9.4 不完全信息靜態(tài)競爭型決策9.5 不完全信息動(dòng)態(tài)競爭型決策 本章第1節(jié)從競爭型決策的景象、競爭型決策的要素、競爭型決策的分類三個(gè)方面對(duì)競爭型決策的根本概念進(jìn)展引見,2-5節(jié)詳細(xì)研討完全信息靜態(tài)競爭型決策、完全信息動(dòng)態(tài)競爭型決策、不完全信息靜態(tài)競爭型決策、不完全信息動(dòng)態(tài)競爭型決策
2、這4種競爭型決策方法。 經(jīng)過本章的引見可以讓讀者對(duì)競爭型決策有一個(gè)全面的了解,并可以在現(xiàn)實(shí)生活中運(yùn)用競爭型決策的實(shí)際和方法。9.1 競爭型決策概述 競爭型決策是研討理性的決策者如何在競爭的情況下做出決策的實(shí)際,詳細(xì)講就是研討當(dāng)決策主體的行為在發(fā)生直接的相互作用時(shí),人們?nèi)绾芜M(jìn)展決策以及這種決策的平衡問題。 競爭型決策問題,不是僅僅局限于站在某個(gè)決策方的立場上去找針對(duì)其他方的決策,而是從廣義的角度分析在決策過程中決策主體之間相互制約、相互作用的規(guī)律,用以指點(diǎn)各決策方的合理決策。 此外,競爭型決策研討的決策問題是包括開場、過程和結(jié)果的整個(gè)決策過程。 1.“囚徒姿態(tài) “囚徒姿態(tài)講的是警方拘捕兩個(gè)同案犯
3、罪嫌疑人囚徒后,為防其相互間串供,而將兩人分別拘押、隔離審問時(shí),兩疑犯所面臨的認(rèn)罪戰(zhàn)略選擇的問題。擺在兩疑犯面前的選擇有兩種:坦率或不坦率。 按照通常的政策,坦率從寬,抗拒從嚴(yán)。 所以,假設(shè)兩人均坦率,那么可從輕處置,分別判刑5年;假設(shè)兩人中有一人坦率而另一人拒不坦率,那么坦率者可免于處分,而拒不坦率者,將從重懲罰被判10年;當(dāng)然,假設(shè)兩人均不交代,而警方手中又無足夠的證據(jù)可以指控犯罪嫌疑人,那么他們只能夠被按妨礙公務(wù)罪被判被判1年。 9.1 競爭型決策概述9.1.1 競爭型決策的景象 假設(shè)用-1,-5,-10分別表示犯罪嫌疑人被判1年、5年、10年的收益,用0表示犯罪嫌疑人被釋放的收益,那么
4、可以用一個(gè)矩陣將這個(gè)競爭型決策問題表示出來,如圖9-1-1。9.1 競爭型決策概述 圖9-1-1中囚徒1、囚徒2代表本競爭型決策中的兩個(gè)競爭參與者,由于這兩個(gè)囚徒被隔分開,其中任何一人在選擇戰(zhàn)略時(shí)都不能夠知道另一人的選擇,因此可以把他們的決策看作是同時(shí)進(jìn)展的。 矩陣中的每個(gè)元素都是由兩個(gè)數(shù)字組成的數(shù)組,表示在所處行、列代表的兩個(gè)競爭方所選戰(zhàn)略的組合下雙方各自的收益,其中第一個(gè)數(shù)字為囚徒1 的收益,第二個(gè)數(shù)字為囚徒2的收益。對(duì)兩個(gè)競爭方來講,各自都有兩種可選擇的戰(zhàn)略,但各方的收益不僅取決于本人的戰(zhàn)略選擇,也取決于另一方的對(duì)應(yīng)選擇。因此,各競爭方雖然無法知道另一方的選擇,但是他必需先權(quán)衡對(duì)方的不同
5、戰(zhàn)略選擇對(duì)本人利益的不同影響,然后,做出本人的最正確選擇。9.1 競爭型決策概述 可以看出:兩囚徒?jīng)Q策時(shí)都以本人的最大利益為目的,結(jié)果是無法實(shí)現(xiàn)最大利益甚至較大利益。因此囚徒姿態(tài)反映了一個(gè)很深化的問題,即個(gè)體理性與集體理性之間的矛盾,即從個(gè)體利益出發(fā)的行為往往不能實(shí)現(xiàn)集體的最大利益;用經(jīng)濟(jì)學(xué)的術(shù)語講,該競爭中存在帕累托改良的時(shí)機(jī),而個(gè)體理性選擇的結(jié)果并非帕累托最優(yōu),不符合集體理性的要求,囚徒因此墮入了理性的姿態(tài)。這個(gè)問題在社會(huì)經(jīng)濟(jì)活動(dòng)中具有很大的普遍性。比如,在市場經(jīng)濟(jì)體制下,每個(gè)人或組織僅思索本身利益最大化的結(jié)果不一定是資源配置效果的帕累托最優(yōu),存在著參與者利益都改良的能夠性卻無法利用,通常
6、稱這種情況為“市場失靈。9.1 競爭型決策概述2.“田忌賽馬 春秋戰(zhàn)國時(shí)期齊威王經(jīng)常約手下大將田忌與他賽馬。賽馬的規(guī)那么是這樣的:每次雙方各出三匹馬,一對(duì)一競賽三場,每一場的敗者要輸一千金給勝者。齊威王的三匹馬和田忌的三匹馬按實(shí)力都可分為上 中、下三等。由于齊威王的上、中、下三匹馬都分別比田忌的上、中、下三匹馬略勝一籌,因此田忌每次都是連輸三場,要輸?shù)羧Ы?。后來田忌的謀士孫臏知道這一情況后,給田忌出了個(gè)主意,即讓田忌不要用本人的上馬去對(duì)抗齊威王的上馬,而是用下馬對(duì)抗齊威王的上馬,上馬那么去對(duì)抗齊威王的中馬,中馬去對(duì)抗齊威王的下馬。這樣,雖然第一場田忌必?cái)o疑,但后兩場田忌卻都能取勝,二勝一負(fù)
7、,田忌反而能贏齊威王一千金。 9.1 競爭型決策概述 假設(shè)這個(gè)故事到這里就終了了,那它還只是一個(gè)一方面運(yùn)用戰(zhàn)略的較為簡單的問題,由于在賽馬的齊威王和田忌兩方中,只需田忌一方認(rèn)識(shí)到戰(zhàn)略的重要性,在安排馬的出場次序方面運(yùn)用戰(zhàn)略,而齊威王一方卻沒有充分運(yùn)用戰(zhàn)略來應(yīng)對(duì)田忌的戰(zhàn)略,顯然還構(gòu)不成一個(gè)雙人競爭的問題。這里為闡明問題,無妨假設(shè)齊威王覺察田忌在運(yùn)用計(jì)謀,明白了本人為什么輸金的緣由而及時(shí)地調(diào)整了本人的對(duì)策。這樣,齊威王與田忌的賽馬也就成了一個(gè)具有戰(zhàn)略依存特征的決策競賽,構(gòu)成了一個(gè)典型的競爭型決策問題。這個(gè)重新設(shè)定的齊威王與田忌賽馬的競爭型決策問題可以用競爭型決策的術(shù)語表示如下: 1該競爭型決策中有
8、兩個(gè)競爭參與者,即齊威王和田忌。9.1 競爭型決策概述2兩競爭參與者可選擇的戰(zhàn)略即為各自馬的出場次序,由于三匹馬的陳列次序共有6種,因此雙方各有6種可選擇的戰(zhàn)略,如圖9-1-2。9.1 競爭型決策概述 3根據(jù)前面的討論,假設(shè)雙方在決策之前都不能預(yù)先知道對(duì)方的決策,因此可以看作是同時(shí)選擇戰(zhàn)略的,而且決策選擇沒有先后次序的關(guān)系。 4假設(shè)把贏一千金記成收益為1,輸一千金記成收益為-1,那么兩競爭參與者在各種戰(zhàn)略組合下的收益如圖9-1-2收益矩陣中數(shù)組元素所示,每個(gè)數(shù)組表示兩競爭參與者在對(duì)應(yīng)行列代表的雙方戰(zhàn)略下各自的收益,其中前一個(gè)數(shù)字表示齊威王的收益,后一個(gè)數(shù)字表示田忌的收益。 由圖9-1-2可以看
9、到,假設(shè)按照嚴(yán)厲的競爭型決策問題的假設(shè)來重新安排這一游戲的話,齊威王只需把從戰(zhàn)略集合中選擇戰(zhàn)略的順序不斷改動(dòng),不讓田忌掌握戰(zhàn)略規(guī)律,齊威王的勝率顯然要高于田忌。9.1 競爭型決策概述9.1 競爭型決策概述9.1.2 競爭型決策的要素 一個(gè)正式的競爭型決策包括以下幾個(gè)要素:競爭的參與者、各競爭方可選擇的全部行為或戰(zhàn)略的集合、競爭的支付、競爭方的信息、競爭的次序、結(jié)果和平衡等。 1.競爭型決策的參與者 競爭型決策的參與者是指競爭中獨(dú)立決策、獨(dú)立承當(dāng)結(jié)果的決策主體,他們能夠是自然人,也能夠是各種社會(huì)組織。參與者的劃分規(guī)范是看他們能否一致決策、一致行動(dòng)、一致承當(dāng)結(jié)果等,即通常將利益一致的參與者作為一個(gè)
10、競爭方,而不是看數(shù)量的多寡抑或規(guī)模的大小。普通地,記競爭方為 ,即共有n個(gè)競爭方。9.1 競爭型決策概述2.戰(zhàn)略的集合 戰(zhàn)略是指每個(gè)競爭方在進(jìn)展決策時(shí)同時(shí)或先后,一次或多次可以選擇的方法、做法等。戰(zhàn)略有純戰(zhàn)略和混合戰(zhàn)略之分。純戰(zhàn)略是指每個(gè)競爭方在競爭中可以選擇采用的行動(dòng)方案?;旌蠎?zhàn)略是在純戰(zhàn)略空間上的一種概率分布,表示競爭方實(shí)踐競爭時(shí)根據(jù)這種概率分布在純戰(zhàn)略空間隨機(jī)選擇并加以實(shí)施的戰(zhàn)略。 9.1 競爭型決策概述 記競爭方 的戰(zhàn)略為 , 為競爭方 可選擇的戰(zhàn)略組成的戰(zhàn)略集合,又稱戰(zhàn)略空間,那么 。如囚徒姿態(tài)中,兩競爭方的戰(zhàn)略空間均為 坦率,不坦率。N個(gè)局中人各選擇一個(gè)戰(zhàn)略構(gòu)成的向量 ,稱為戰(zhàn)略組
11、合,囚徒姿態(tài)中s=坦率,坦率為囚徒1、2的戰(zhàn)略組合。9.1 競爭型決策概述3.競爭方的支付 競爭方的支付即每個(gè)競爭方從各種戰(zhàn)略組合中獲得的收益的成效,它是戰(zhàn)略組合s的函數(shù),所以也被稱為支付函數(shù)。記競爭方 的支付函數(shù)為 。如囚徒姿態(tài)中的囚徒1、2對(duì)應(yīng)s=坦率,坦率的支付為 。4.競爭方的信息 信息是競爭方有關(guān)競爭的知識(shí),如有關(guān)其他競爭方的戰(zhàn)略、收益等知識(shí)。競爭中競爭方掌握信息的多少是影響其戰(zhàn)略選擇的一個(gè)重要要素,直接關(guān)系到?jīng)Q策的準(zhǔn)確性。競爭方應(yīng)盡能夠多地搜集有關(guān)競爭的信息,從而在采取戰(zhàn)略進(jìn)展決策時(shí)掌握自動(dòng)。9.1 競爭型決策概述5.競爭的次序 規(guī)定一個(gè)競爭型決策就必需規(guī)定其中的次序,不同的次序必
12、然是不同的競爭型決策,即使其他方面都一樣。6.結(jié)果和平衡 結(jié)果指競爭型決策中競爭方的行動(dòng)所產(chǎn)生的每一能夠情形。而平衡是指一切競爭方的最優(yōu)戰(zhàn)略的組合,記為 其中, 為第 個(gè)競爭方在平衡的情況下的最優(yōu)戰(zhàn)略,即第個(gè)競爭方在思索其他競爭方戰(zhàn)略選擇的情況下,有針對(duì)性地選擇最大化本人支付的戰(zhàn)略。9.1 競爭型決策概述9.1.3 競爭型決策的分類 按競爭型決策中參與人數(shù)目的多少,將競爭型決策分為單人競爭型決策、兩人競爭型決策和多人競爭型決策。根據(jù)各競爭方可選戰(zhàn)略數(shù)量的多少,將競爭型決策分為有限競爭型決策和無限競爭型決策。按參與競爭型決策的各個(gè)競爭方從競爭中所獲得的利益的總和,可將競爭型決謀劃分為零和競爭型決
13、策、常和競爭型決策和變和競爭型決策。9.1 競爭型決策概述 按參與人行動(dòng)的先后順序,競爭型決策可以分為靜態(tài)競爭型決策和動(dòng)態(tài)競爭型決策。根據(jù)參與人所掌握的信息可以把競爭型決策分為完全信息競爭型決策和不完全信息競爭型決策。把參與人行動(dòng)順序和掌握的信息結(jié)合起來劃分,可以得到四種類型的競爭型決策,即:完全信息靜態(tài)競爭型決策、完全信息動(dòng)態(tài)競爭型決策、不完全信息靜態(tài)競爭型決策、不完全信息動(dòng)態(tài)競爭型決策。 9.2 完全信息靜態(tài)競爭型決策9.2.1 競爭型決策的規(guī)范式表述 完全信息靜態(tài)競爭型決策是指各競爭方同時(shí)決策,且一切競爭方對(duì)各方支付都了解的競爭型決策。在競爭型決策論中從靜態(tài)中籠統(tǒng)出的最根本要素構(gòu)成的模型
14、描畫就是規(guī)范型。在競爭型決策的規(guī)范式表述中,普通包括如下根本要素: 競爭型決策的參與者; 競爭方可選擇的全部行為或戰(zhàn)略的集合; 針對(duì)一切參與者能夠選擇的戰(zhàn)略組合,每一個(gè)參與者獲得的收益。9.2 完全信息靜態(tài)競爭型決策 對(duì)各競爭方從1到n排序,設(shè)其中任一個(gè)參與者的序號(hào)為 ,令 代表參與者 的戰(zhàn)略空間,其中任一特定的戰(zhàn)略記為 ,那么 。令 表示每一個(gè)參與者選定一個(gè)戰(zhàn)略構(gòu)成的戰(zhàn)略組合,令 表示第 參與者的收益。綜合上述內(nèi)容,對(duì)競爭型決策進(jìn)展如下定義。 9.2 完全信息靜態(tài)競爭型決策 定義9.2.1 在一個(gè)n人競爭型決策的規(guī)范式表述中,參與者的戰(zhàn)略空間分別為 ,收益函數(shù)分別為,那么表示此競爭型決策。
15、9.2 完全信息靜態(tài)競爭型決策9.2.2 納什平衡 納什平衡指的是一種戰(zhàn)略組合,這種戰(zhàn)略組合由一切參與人的最優(yōu)戰(zhàn)略組成,也就是說,在給定他人戰(zhàn)略的情況下,沒有任何單個(gè)參與人有積極性選擇其他戰(zhàn)略,從而沒有任何人有積極性突破這種平衡。9.2 完全信息靜態(tài)競爭型決策定義9.2.2 在競爭型決策 中,假設(shè)戰(zhàn)略組合 中任一競爭方 的戰(zhàn)略 都是對(duì)其他競爭方的戰(zhàn)略組合 的最正確對(duì)策,也即 對(duì)恣意 都成立,那么稱 為 的一個(gè)“納什平衡。 納什平衡有強(qiáng)弱之分,以上是弱納什平衡,也是最常用的納什平衡概念。強(qiáng)納什平衡是指每個(gè)競爭方對(duì)于對(duì)手的戰(zhàn)略有獨(dú)一的最正確反響,即 為嚴(yán)厲納什平衡,當(dāng)且僅當(dāng)對(duì)一切 ,一切其他 ,均
16、有9.2 完全信息靜態(tài)競爭型決策9.2 完全信息靜態(tài)競爭型決策 納什平衡的意義在于,它是關(guān)于競爭型決策結(jié)局的一致性預(yù)測假設(shè)一切競爭方預(yù)測一個(gè)特定的納什平衡會(huì)出現(xiàn),那么這種平衡就會(huì)出現(xiàn),預(yù)測之間沒有矛盾,不會(huì)由于有競爭方以為不符合本人的利益要求而失敗只需納什平衡才干使每個(gè)競爭方均認(rèn)可這種結(jié)局,而且他們均知道其他競爭方也認(rèn)可這種結(jié)局,而非納什平衡的結(jié)局并非一致性預(yù)測。 9.2 完全信息靜態(tài)競爭型決策9.2.3 兩人有限零和競爭型決策 1. 兩人有限零和競爭型決策模型 假設(shè)用 和 表示兩人有限零和競爭的兩個(gè)劇中人,并設(shè)他們的戰(zhàn)略集分別為 和 ,由于在任一局勢中兩個(gè)局中人得失之和總是等于零,也就是說假
17、設(shè)對(duì)于局勢 ,局中人 的收入為 ,那么局中人 的收入為 ,局中人 的支付矩陣可記作9.2 完全信息靜態(tài)競爭型決策 根據(jù)局中人 的支付矩陣 ,結(jié)合競爭型決策的普通式表述 ,我們可將這種競爭型決策記作 。9.2 完全信息靜態(tài)競爭型決策2. 最優(yōu)純戰(zhàn)略與納什平衡 定義9.2.3 對(duì)于競爭型決策 ,假設(shè)應(yīng)的 分別為局中人 的最優(yōu)純戰(zhàn)略,稱 那么稱支付元素 對(duì) 為競爭型決策 的鞍點(diǎn),稱 為競爭型決策 的競爭型決策值。9.2 完全信息靜態(tài)競爭型決策 不難驗(yàn)證鞍點(diǎn) 是競爭型決策 的納什平衡,鞍點(diǎn)又稱純戰(zhàn)略納什平衡。兩人有限零和競爭型決策存在鞍點(diǎn)的充要條件是支付矩陣中存在一個(gè)元素 使對(duì)一切 ,總有。9.2 完
18、全信息靜態(tài)競爭型決策3. 最優(yōu)混合戰(zhàn)略與納什平衡 設(shè)競爭型決策 ,令 分別為局中人 在各自的戰(zhàn)略集 中選擇戰(zhàn)略的概率,那么稱分別為局中人 的一個(gè)混合戰(zhàn)略9.2 完全信息靜態(tài)競爭型決策 為局中人 的期望所得, 為 的期望所得, 而 的競爭型決策的混合局勢 又記 分別為局中人 的混合戰(zhàn)略集合。9.2 完全信息靜態(tài)競爭型決策定義9.2.4 假設(shè) 那么稱 分別為局中人 的最優(yōu)混合戰(zhàn)略,稱 為 的最優(yōu)混合局勢,稱 為競爭方 的期望所得。 9.2 完全信息靜態(tài)競爭型決策4. 最優(yōu)混合戰(zhàn)略的求解方法 競爭型決策 有混合意義下的解的充要條件是:存在 及數(shù)滿足以下兩個(gè)不等式組:9.2 完全信息靜態(tài)競爭型決策 設(shè)
19、 否那么令 ,那么 一定可大于零。令 ,那么不等式組等價(jià)于下面的線性規(guī)劃:9.2 完全信息靜態(tài)競爭型決策 同理,令 ,問題2就變?yōu)榫€性規(guī)劃4:9.2 完全信息靜態(tài)競爭型決策9.2.4 運(yùn)用舉例 例9-2-3 市場進(jìn)入阻遏競爭型決策。一種市場上存在一個(gè)壟斷企業(yè),另一個(gè)企業(yè)希望進(jìn)入這一市場,壟斷者為了堅(jiān)持本人的位置需求對(duì)進(jìn)入者進(jìn)展阻遏。在這種競爭型決策中,進(jìn)入者有兩種戰(zhàn)略可以選擇:“進(jìn)入與“不進(jìn)入;壟斷者也有兩種戰(zhàn)略:“容忍與“還擊。他們的支付函數(shù)用以下雙變量矩陣表示,如圖9-2-2。9.2 完全信息靜態(tài)競爭型決策9.2 完全信息靜態(tài)競爭型決策例9-2- 4 產(chǎn)量決策的古諾模型 消費(fèi)同質(zhì)產(chǎn)品的兩個(gè)
20、企業(yè)同時(shí)選擇各自的產(chǎn)量 ,單位本錢均為常數(shù)市場需求決議價(jià)錢 為了求解其中的納什平衡,需求求得每個(gè)局中人對(duì)另一個(gè)局中人戰(zhàn)略的最優(yōu)反響對(duì)于局中人I來說,他的利潤為 對(duì) 求導(dǎo)可得到利潤最大化的一階條件為9.2 完全信息靜態(tài)競爭型決策 這一函數(shù)決議了面對(duì)局中人2的每種戰(zhàn)略時(shí)局中人1的最優(yōu)反響,稱之為局中人1的最優(yōu)反響函數(shù)。類似地,可得到局中人2利潤最大化的一階條件聯(lián)立兩式,求解得到納什平衡9.2 完全信息靜態(tài)競爭型決策 假設(shè)市場上存在n個(gè)廠商,每個(gè)廠商的單位本錢都是常數(shù)c,市場需求為 ,那么經(jīng)過同樣推理可知,局中人對(duì)其他局中人戰(zhàn)略組合的最優(yōu)反響函數(shù)可表示為這里對(duì)n個(gè)最優(yōu)反響函數(shù)聯(lián)立求解就可以得到納什平
21、衡 對(duì) 有9.2 完全信息靜態(tài)競爭型決策 例9-2-5 假設(shè)有n個(gè)人共同擁有的一個(gè)公共牧場,每個(gè)人要決議本人放牧羊的數(shù)目 ,總的羊數(shù)因此為 。購買和照看1只羊的本錢為常數(shù)c。設(shè)每只羊的價(jià)值為 ,隨著羊的添加,草地會(huì)越來越擁堵,食物也會(huì)更緊張,因此會(huì)呵斥羊的價(jià)值下降。另一方面,羊的供應(yīng)添加也會(huì)呵斥羊的價(jià)值下降,所以有 。 在這種設(shè)定下,局中人的利潤函數(shù)為9.2 完全信息靜態(tài)競爭型決策最優(yōu)化的一階條件為 納什平衡總羊數(shù) 需求滿足的條件社會(huì)最優(yōu)的放牧程度 為使總利潤 最大的羊數(shù),滿足9.3 完全信息動(dòng)態(tài)競爭型決策9.3.1 競爭型決策的擴(kuò)展式表述 競爭型決策的擴(kuò)展式表述包括以下要素:1參與人集合:i
22、=1,n,此外,我們將用N代表虛擬參與人“自然;2參與人的行動(dòng)次序:誰在什么時(shí)候行動(dòng);3參與人的行動(dòng)空間:在每次行動(dòng)時(shí),參與人有些什么選擇;4參與人的信息集:每次行動(dòng)時(shí),參與人知道些 什么;5參與人的支付函數(shù):在行動(dòng)終了之后,每個(gè)參與人得到些什么支付是一切行動(dòng)的函數(shù);6外惹事件即自然的選擇的概率分布。9.3 完全信息動(dòng)態(tài)競爭型決策9.3.2 擴(kuò)展式競爭型決策的納什平衡1. 戰(zhàn)略與行為戰(zhàn)略 記 為局中人 信息集的集合,局中人 全部可選行動(dòng)構(gòu)成的集合為 。這樣,局中人 的純戰(zhàn)略可定義為映射 ,對(duì)一切 有 。局中人 的純戰(zhàn)略空間 為這樣的 的集合,也就相當(dāng)于各個(gè)處的行動(dòng)空間的笛卡爾乘積,即 。擴(kuò)展型
23、競爭型決策中的納什平衡為這樣的戰(zhàn)略組合 ,其中每個(gè)局中人 的戰(zhàn)略 是在它的對(duì)手的戰(zhàn)略 給定的情況下最大化本人的期望支付。 9.3 完全信息動(dòng)態(tài)競爭型決策 行為戰(zhàn)略的正式定義為:記 為 上的概率分布,局中人 的行為戰(zhàn)略 的笛卡爾乘積 的元素。這樣,行為戰(zhàn)略在每一個(gè) 處的行動(dòng)上確定了一種概率分布,而且各信息集對(duì)應(yīng)的各個(gè)概率分布彼此獨(dú)立。行為戰(zhàn)略組合 構(gòu)成在結(jié)局上的概率分布,從而可以得到每個(gè)局中人的期望支付函數(shù),這樣,就可以按照以上純戰(zhàn)略情形中一樣的方式定義行為戰(zhàn)略納什平衡。9.3 完全信息動(dòng)態(tài)競爭型決策2. 擴(kuò)展型競爭型決策和戰(zhàn)略型競爭型決策的關(guān)系 將擴(kuò)展型競爭型決策用戰(zhàn)略型競爭型決策的方式表現(xiàn),
24、如圖9-3-1。圖9-3-1中局中人2的純戰(zhàn)略由局中人2的兩個(gè)節(jié)點(diǎn)處的行動(dòng)選擇組合而成由左至右。9.3 完全信息動(dòng)態(tài)競爭型決策9.3.3 子競爭型決策完美平衡 1. 子競爭型決策完美平衡的定義 定義9.3.1 擴(kuò)展型競爭型決策 的子競爭型決策 由 中的一個(gè)決策節(jié)點(diǎn)與它的一切后續(xù)節(jié)點(diǎn)組成,具有性質(zhì):假設(shè) 子競爭型決策的信息集與支付函數(shù)均來自于原競爭型決策,即 中 的屬于同一信息集,當(dāng)且僅當(dāng)它們在原競爭型決策中屬于同一信息集,子競爭型決策的支付函數(shù)就是原競爭型決策支付函數(shù)適用于子競爭型決策的部分。9.3 完全信息動(dòng)態(tài)競爭型決策定義9.3.2 擴(kuò)展型競爭型決策的行為戰(zhàn)略組合 為子競爭型決策完美平衡的
25、條件是,它在任何子競爭型決策上都給出納什平衡。9.3 完全信息動(dòng)態(tài)競爭型決策2. 用逆向歸納法求解子競爭型決策完美平衡 從以位置在最后的決策節(jié)點(diǎn)為起點(diǎn)的子競爭型決策開場,求出對(duì)應(yīng)的局中人的最正確選擇,然后在這種選擇給定的情況下,倒推至該節(jié)點(diǎn)的前一個(gè)節(jié)點(diǎn)求出相應(yīng)局中人的最正確選擇,然后再向前倒推,直至初始節(jié)點(diǎn)。 9.3 完全信息動(dòng)態(tài)競爭型決策 例9-3-1 斯特克爾伯格競爭 消費(fèi)同質(zhì)產(chǎn)品的兩個(gè)企業(yè)同時(shí)選擇各自的產(chǎn)量 ,單位本錢均為常數(shù) 市場需求價(jià)錢 。不過如今假設(shè)局中人1先行動(dòng),局中人2察看到1的產(chǎn)量再?zèng)Q議本人的選擇。9.3 完全信息動(dòng)態(tài)競爭型決策 從局中人1選定任何一種產(chǎn)量后開場的子競爭型決策
26、中獨(dú)一的局中人是局中人2,因此納什平衡就退化為局中人2此時(shí)的最優(yōu)選擇。 得到局中人1需求思索的是以下的最大化問題: 9.3 完全信息動(dòng)態(tài)競爭型決策 此時(shí)最優(yōu)戰(zhàn)略顯然是 ,由此得到局中人2的最優(yōu)選擇為 ,這就是子競爭型決策完美平衡。相應(yīng)的平衡支付為 , ,局中人1獲得了比古諾競爭中更高的利潤,這完全是由于先行動(dòng)帶來的益處,也就是先行優(yōu)勢。9.4 不完全信息靜態(tài)競爭型決策 9.4.1 概念 不完全信息競爭型決策實(shí)際中的不完全信息專指一種競爭型決策局勢中局中人對(duì)其他局中人與該種競爭型決策局勢有關(guān)的事前信息了解不充分,而不是競爭型決策中產(chǎn)生的與局中人實(shí)踐戰(zhàn)略選擇有關(guān)的信息。 豪爾紹尼將這種由不完全信息
27、引發(fā)的復(fù)雜判別問題稱為“遞階期望,從初始的判別出發(fā)會(huì)構(gòu)成越來越高階的判別問題。為理處理這種怪圈,需求引入一種特定的分析機(jī)制,以思想上可以接受而且技術(shù)上可以處置的方式對(duì)不完全信息帶來的競爭型決策問題進(jìn)展描畫與處置,這就是豪爾紹尼轉(zhuǎn)換。9.4 不完全信息靜態(tài)競爭型決策例9-4-1 市場進(jìn)入競爭型決策 一個(gè)行業(yè)有兩個(gè)相關(guān)企業(yè),一個(gè)是壟斷者局中人1,有一個(gè)是潛在的進(jìn)入者局中人2。局中人1決議能否建立一個(gè)新工廠,而同時(shí)局中人2決議能否進(jìn)入這一行業(yè)。其中存在著不完全信息,劇中人2不知道局中人1的建廠本錢是3還是1,而局中人1知道本人的本錢。這樣構(gòu)成的不完全信息競爭型決策局勢如圖9-4-19.4 不完全信息
28、靜態(tài)競爭型決策9.4 不完全信息靜態(tài)競爭型決策9.4.2 豪爾紹尼轉(zhuǎn)換 在例9-4-1局中人1具有兩種能夠類型,“高建廠本錢與“低建廠本錢,而局中人2沒有私有信息。假設(shè)概率模型為,局中人1類型為“高本錢的概率為0.4,為“低本錢的概率為0.6.那么原來的不完全信息競爭型決策轉(zhuǎn)換如圖9-4-2所示的不完美信息的完全信息競爭型決策。9.4 不完全信息靜態(tài)競爭型決策 在圖9-4-2中 表示“進(jìn)入戰(zhàn)略, 表示不進(jìn)入戰(zhàn)略自然局中人首先根據(jù)概率機(jī)制決議局中人1建廠本錢是高還是9.4 不完全信息靜態(tài)競爭型決策 低,局中人1知道這一信息,也就是說知道本人的實(shí)踐類型,然后局中人2在不知道局中人1實(shí)踐類型也不知道
29、局中人1戰(zhàn)略選擇的情況下決議能否進(jìn)入市場,這是一種特殊的不完美信息競爭型決策。 在豪爾紹尼轉(zhuǎn)換將不完全信息競爭型決策轉(zhuǎn)化為不完美信息的完全信息競爭型決策后,就可以利用完全信息競爭型決策的處置方法,得到的平衡概念為納什平衡在不完全信息下的推行貝葉斯平衡。9.4 不完全信息靜態(tài)競爭型決策9.4.3 貝葉斯平衡 定義9.4.1 局中人具有類型 ,戰(zhàn)略 及支付函數(shù) ,類型上先驗(yàn)分布為 的不完全信息競爭型決策中的純戰(zhàn)略貝葉斯平衡是一種“擴(kuò)展競爭型決策的納什平衡,這種擴(kuò)展競爭型決策中每個(gè)局中人的純戰(zhàn)略空間是由 到 的映射的集合 。9.4 不完全信息靜態(tài)競爭型決策 另一種等價(jià)方式的定義方式為:貝葉斯平衡是一
30、種與類型有關(guān)的戰(zhàn)略組合 ,其中 每個(gè)局中人在給定本人類型 和其他局中人戰(zhàn)略 的情況下最大化本人的期望成效函數(shù),即9.4 不完全信息靜態(tài)競爭型決策9.4.4 貝葉斯平衡實(shí)例 例9-4-2 不完全信息古諾競爭 將根本古諾競爭模型擴(kuò)展到不完全信息情形。假設(shè)企業(yè)2對(duì)企業(yè)1的消費(fèi)本錢不完全了解,僅知道一半能夠?yàn)楦弑惧X ,一半能夠?yàn)榈捅惧X ,企業(yè)2的單位本錢為 。根據(jù)貝葉斯轉(zhuǎn)換方式,假設(shè)這一概率判別為公共信息。 局中人1知道本人的真實(shí)類型,因此他的最優(yōu)反響函數(shù)為:9.4 不完全信息靜態(tài)競爭型決策高本錢時(shí) 低本錢時(shí)局中人2的期望利潤為: 使之最大化的一階條件給出局中人2的反響函數(shù):9.4 不完全信息靜態(tài)競爭
31、型決策聯(lián)立求解可得貝葉斯平衡為: 顯然,當(dāng) 時(shí),貝葉斯平衡退化為完全信息時(shí)的納什平衡。 9.5 不完全信息動(dòng)態(tài)競爭型決策定義9.5.1 信號(hào)競爭型決策的完美貝葉斯平衡為一種戰(zhàn)略組合 和后驗(yàn)信心 ,滿足:假設(shè) 那么 為 上的恣意概率分布。9.5 不完全信息動(dòng)態(tài)競爭型決策9.5.2 完美貝葉斯平衡 設(shè)有個(gè) 局中人,局中人 的類型為 為局中人 關(guān)于其他局中人類型的先驗(yàn)信心。局中人 的純戰(zhàn)略為 為信息集 上局中人 觀測到的其他局中人的行動(dòng)組合,為由 限定的對(duì)應(yīng)行動(dòng)組合, 為觀測到 時(shí)構(gòu)成的對(duì)其他局中人類型的后驗(yàn)信心, 為局中人 為類型 時(shí)得到的支付。9.5 不完全信息動(dòng)態(tài)競爭型決策定義9.5.2 完美
32、貝葉斯平衡 貝葉斯平衡是一種戰(zhàn)略組合 與一種后驗(yàn)概率組合 ,滿足:P對(duì)于一切的局中人 ,在每個(gè)信息集 ,B 由先驗(yàn)概率 、所觀測的 和最優(yōu)戰(zhàn)略 經(jīng)過貝葉斯法那么構(gòu)成。9.5 不完全信息動(dòng)態(tài)競爭型決策 9.5.3 完美貝葉斯平衡舉例 聲明競爭型決策主要研討在有私人信息、信息不對(duì)稱的情況下,人們經(jīng)過口頭或書面的聲明傳送信息的問題。聲明競爭型決策普通是不完全信息競爭型決策,也就是動(dòng)態(tài)貝葉斯競爭型決策。 1. 聲明競爭型決策 設(shè)競爭型決策中的聲明方有兩種能夠的類型 ,行為方有兩種能夠的行為 ,并且知對(duì)于兩種不同類型的聲明方,行為方采取兩種不同行為時(shí)雙方的得益如圖9-5-1。9.5 不完全信息動(dòng)態(tài)競爭型
33、決策 從雙方的得益可以看出: 類型的聲明方和 類型的聲明方偏好行為方的不同行為。 類型的偏好類型的偏好 類型的偏好 。行為方在聲明方是 類型和 類型時(shí)也分別偏好 和 。因此兩個(gè)競爭方的偏好具有完全的一致性 , 。9.5 不完全信息動(dòng)態(tài)競爭型決策 假設(shè)模型中的得益情況發(fā)生某種變化,例如變成圖9-5-2中的情況。 在不同類型聲明方的偏好一樣,而行為方在聲明方的類型不同時(shí)偏好不同的競爭型決策中,聲明是不能夠有效傳送信息的。9.5 不完全信息動(dòng)態(tài)競爭型決策 在聲明競爭型決策中聲明能有效傳送信息的三個(gè)必要條件:1不同類型的聲明方必需偏好行為方的不同行為。2對(duì)應(yīng)聲明方的不同類型,行為方必需偏好不同的行為。3行為方的偏好必需與聲明方的偏好具有一致性。9.5 不完全信息動(dòng)態(tài)競爭型決策2. 離散型聲明競爭型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《奶制品培訓(xùn)資料》課件
- 《小王子英文》課件
- 《企業(yè)管理概論》課件
- 2024年雷電頌教案
- 尖子生家長會(huì)發(fā)言稿
- 單位管理制度匯編大合集【人員管理篇】十篇
- 單位管理制度合并匯編職工管理
- 單位管理制度分享大全【職員管理篇】
- 單位管理制度范文大合集人力資源管理十篇
- 單位管理制度范例合集【職工管理】十篇
- 酒精依賴綜合征的護(hù)理
- DL-T 380-2010接地降阻材料技術(shù)條件
- 限期交貨保證書模板
- 安防設(shè)備更新改造項(xiàng)目可行性研究報(bào)告-超長期國債
- 2024過敏性休克搶救指南(2024)課件干貨分享
- 2024年紀(jì)委監(jiān)委招聘筆試必背試題庫500題(含答案)
- 【發(fā)動(dòng)機(jī)曲軸數(shù)控加工工藝過程卡片的設(shè)計(jì)7800字(論文)】
- 中藥破壁飲片文稿專家講座
- 2025年高考語文備考之名著閱讀《鄉(xiāng)土中國》重要概念解釋一覽表
- JG197-2006 預(yù)應(yīng)力混凝土空心方樁
- 醫(yī)院護(hù)理培訓(xùn)課件:《安全注射》
評(píng)論
0/150
提交評(píng)論