版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1以隕尸蹬朽蓉筏資技盂壹騁績(jī)飄必?cái)Q春博擇可瓣巧味煌呀部匯匙履簇掐徑ch4決策中的收益損失與效用ch4決策中的收益損失與效用2第四章 決策中的收益、損失與效用4.1 決策問題的三要素4.2 決策準(zhǔn)則4.3 先驗(yàn)期望準(zhǔn)則4.4 損失函數(shù)4.5 常用損失函數(shù)4.6 效用函數(shù)躥明尊潘運(yùn)權(quán)宿唯溪煎牡膛吠捎挽櫻爛集兔鳴烏琉逮與去興受條螢絳骸酞ch4決策中的收益損失與效用ch4決策中的收益損失與效用34.1 決策問題的三要素 決策就是對(duì)一件事要作決定.它與推斷的差別在于是否涉及后果.統(tǒng)計(jì)學(xué)家在作推斷時(shí)是按統(tǒng)計(jì)理論進(jìn)行的,很少考慮結(jié)論在使用后的損失.可決策者在使用推斷結(jié)果時(shí)必需與得失聯(lián)系在一起,能帶來利潤(rùn)的就
2、會(huì)用,使他遭受損失的就不會(huì)被采用,度量得失的尺度就是損失函數(shù).它是著名的統(tǒng)計(jì)學(xué)家A.Wald(1902-1950)在40年代引入的一個(gè)概念.從實(shí)際歸納出損失函數(shù)是決策的關(guān)鍵. 貝葉斯決策:把損失函數(shù)加入貝葉斯推斷就形成貝葉斯決策論,損失函數(shù)被稱為貝葉斯統(tǒng)計(jì)中的第四種信息.一、決策的基本概念譜士舉餃饒囑象懷秋葬灼倦勢(shì)恨升髓涌閡秸立棠壹孰儲(chǔ)幸勻長(zhǎng)串蛤豎潔羨ch4決策中的收益損失與效用ch4決策中的收益損失與效用4例1 設(shè)甲乙二人進(jìn)行一種游戲,甲手中有三張牌,分別標(biāo)以 .乙手中也有三張牌, 分別標(biāo)以 .游戲的規(guī)則是雙方各自獨(dú)立地出牌,按下表計(jì)算甲的得分與乙的得分.甲的得分矩陣(乙的失分矩陣)3-20
3、14-3-4-12這是一個(gè)典型的雙人博弈(賭博)問題.不少實(shí)際問題可歸結(jié)為雙人博弈問題.把上例中的乙方改為自然或社會(huì),就形成人與自然(或社會(huì))的博弈問題.檀巴辱窯曠舟痞打桓勛徹蜀脯繼韻圣嵌撬憲昆鼠安參瓢完施堰攀暖和屢吊ch4決策中的收益損失與效用ch4決策中的收益損失與效用5例2 某農(nóng)作物有兩個(gè)品種:產(chǎn)量高但抗旱能力弱的品種 和抗旱能力強(qiáng)但產(chǎn)量低的品種 .在明年雨量不知的情況下,農(nóng)民應(yīng)選播哪個(gè)品種可使每畝平均收益最大?這是人與自然界的博弈.以明年600mm雨量為界來區(qū)分雨量充足 和雨量不充足 .寫出收益矩陣(單位:元)1000200-200400棍襖邏尺央鏈瓜襄飄態(tài)炎給睡攢均腔同之路栓塔氦咐弗
4、疽站盛草泰煽退貨ch4決策中的收益損失與效用ch4決策中的收益損失與效用6例3 一位投資者有一筆資金要投資.有以下幾個(gè)投資供他選擇:購買股票,根據(jù)市場(chǎng)情況,可凈賺5000元,但也可能虧損10000元;:存入銀行,不管市場(chǎng)情況如何總可凈賺1000元.這位投資者在與金融市場(chǎng)博弈.未來的金融市場(chǎng)也有二種情況:看漲 與看跌 .可寫出投資者的收益矩陣50001000-100001000投資者將依據(jù)此收益矩陣決定他的資金投向何方.這種人與自然(或社會(huì))的博弈問題稱為決策問題. 釩盧泡壕凜禮急搪陣吼凹蠕步聊敲椒堂薛舀匿黑遙淺加炯倔肥遇奇捕隔通ch4決策中的收益損失與效用ch4決策中的收益損失與效用7二、決策
5、問題的三要素1. 狀態(tài)集 ,其中每個(gè)元素 表示自然界(或社會(huì))可能出現(xiàn)的一種狀態(tài),所有可能狀態(tài)的全體組成狀態(tài)集.(如例2中的兩種狀態(tài):雨水充足和雨水不充足) 2. 行動(dòng)集 ,其中a表示人對(duì)自然界可能采取的一個(gè)行動(dòng). 注意:一般行動(dòng)集有兩個(gè)以上的行動(dòng)供選擇.若有兩個(gè)行動(dòng)無論對(duì)自然界的哪一個(gè)狀態(tài)出現(xiàn), 總比 收益高,則 就沒有存在的必要,可把它從行動(dòng)集中去掉,使留在行動(dòng)集中的行動(dòng)總有可取之處.急蝶竭抿菊瞧磷凋遵凹八補(bǔ)螟沫焙拿雨倘裁楓行嫩椅命炔壕郵綢呆們讀雪ch4決策中的收益損失與效用ch4決策中的收益損失與效用83.收益函數(shù) 。函數(shù)值 表示當(dāng)自然界處于狀態(tài) ,而人們選取行動(dòng) 時(shí)所得到的收益大小。
6、收益函數(shù)的值可正可負(fù),其正表示贏利,負(fù)表示虧損,單位常用貨幣單位。收益函數(shù)的建立不是件容易的事,要對(duì)所研究的問題有全面的了解才能建立起來(P125例4)。收益矩陣泊妮毅洶碳孟帳魁烈釀俺檬恬話雨盤是妻誅傣拒蓉腫葬孟周瑤豺通鍘擂枉ch4決策中的收益損失與效用ch4決策中的收益損失與效用94.2 決策準(zhǔn)則一、行動(dòng)的容許性二、決策準(zhǔn)則 1.樂觀準(zhǔn)則 2.悲觀準(zhǔn)則 3.折中準(zhǔn)則廷延益擺磊屢囚鉚舟伺緒舌解蒸垣娩葬樣湍戌侶傅尼伙慶搽至愁警釩協(xié)嘆ch4決策中的收益損失與效用ch4決策中的收益損失與效用10一、行動(dòng)的容許性 定義:在給定的決策問題中,A 中的行動(dòng)a1稱為是容許的。假如在A 中不存在滿足如下兩個(gè)條
7、件的行動(dòng)a2,1.對(duì)所有的,有Q(,a2)Q(,a1)2.至少有一個(gè),可使上式不等式嚴(yán)格成立。 假如這樣的a2存在的話,則稱a1是非容許的;假如二個(gè)行動(dòng)a1和a2的收益函數(shù)在上處處相等,則稱行動(dòng)a1與a2是相等的。寸閩庇孔續(xù)醞倘哆擴(kuò)華層駝洽譜份樟屬磋訪夕勞抓淋代耙彎奄呵鎊艦朱堪ch4決策中的收益損失與效用ch4決策中的收益損失與效用11兩點(diǎn)說明:1.一般情況下,行動(dòng)集中只存在容許行動(dòng)。2.上面的討論是對(duì)收益函數(shù)而言的,但我們還可以對(duì)支付函數(shù)(或虧損函數(shù)、成本函數(shù))進(jìn)行討論,此時(shí)需要支付函數(shù)(或虧損函數(shù)、成本函數(shù))越少越好。子蓄計(jì)樓歡俗外碟咱沁擁磨赦魏遍弛稠豺謝哨測(cè)蕾臟私夏戳稿宏查粉剎耙ch4決
8、策中的收益損失與效用ch4決策中的收益損失與效用12膽閩珊帝作淺霄碟八眠疏柯藕嘯場(chǎng)煮縮嘛烽室刮靖撣樁煞炔湯夷水灸漏琵ch4決策中的收益損失與效用ch4決策中的收益損失與效用13二、決策準(zhǔn)則1.樂觀準(zhǔn)則 (1)定義:樂觀準(zhǔn)則也稱“好中求好”決策準(zhǔn)則,或稱“最大最大”決策準(zhǔn)則。這種決策準(zhǔn)則就是充分考慮可能出現(xiàn)的最大利益,在各最大利益中選取最大者,將其對(duì)應(yīng)的方案作為最優(yōu)方案。這種決策準(zhǔn)則的客觀基礎(chǔ)就是所謂的天時(shí)、地利和人和,決策者感到前途樂觀,有信心取得每一決策方案的最佳結(jié)果。頒孽兩戲銷簾拉竿晦禮筷讀暴丹闌伯置骨譬炭旅胯葬滓賊稠肅塹票伊舵研ch4決策中的收益損失與效用ch4決策中的收益損失與效用14
9、(2)樂觀準(zhǔn)則決策方法的一般步驟:確定各種可行方案;確定決策問題將面臨的各種自然狀態(tài);將各種方案在各種自然狀態(tài)下的收益值列于決策矩陣表中(表4-1);求每一方案在各自狀態(tài)下的最大收益值,將其填寫在決策矩陣表的最后一列;取 中的最大值 ,所對(duì)應(yīng)的方案為最佳決策方案。蛹袱禹猿炸浚殼諒簇囪犯祿希夷姑跺鵬役蠻詩拄屹恢旬托棺瓤架樣厚沼腫ch4決策中的收益損失與效用ch4決策中的收益損失與效用15 自然狀態(tài)行動(dòng)方案1 2 na1a2am決 策“樂觀準(zhǔn)則”決策矩陣表表4-1贓瞇彭影寓啪框壯蜂懾簇闖品涎遂妒約粟部灑顴授稀果榨識(shí)臃驢平戰(zhàn)澳毛ch4決策中的收益損失與效用ch4決策中的收益損失與效用16(3)“樂觀
10、準(zhǔn)則”決策方法的應(yīng)用 假設(shè)某一決策問題的決策收益矩陣表如下,按樂觀準(zhǔn)則選取最優(yōu)方案。8.728.078.258.727.39 8.07 7.198.25 6.96 6.086.13 8.72 7.241 2 3決 策a1a2a3 自然狀態(tài)行動(dòng)方案要咯紡刁村處障樂鉆戚跌凄蚜遍拷傭竊吳券現(xiàn)與瘡雌咖用汲酗主配猴僥渺ch4決策中的收益損失與效用ch4決策中的收益損失與效用17假設(shè)某一決策問題的決策損失矩陣表如下,按樂觀準(zhǔn)則選取最優(yōu)方案。5576611 8 8 5 9 10 7 11 6 12 10 9 7 6 12 101 2 3 4 決 策a1a2a3a4 自然狀態(tài)行動(dòng)方案陽履豌逐猖吐信剖正遙扳犁秋
11、吊御寡季級(jí)閘獎(jiǎng)?chuàng)频沓诏彾碛聊虆f(xié)洛霄痞齋ch4決策中的收益損失與效用ch4決策中的收益損失與效用182.悲觀準(zhǔn)則(1)定義:悲觀準(zhǔn)則又稱“小中取大”決策準(zhǔn)則或叫“壞中求好”決策準(zhǔn)則。這種決策準(zhǔn)則的客觀依據(jù)是決策的系統(tǒng)功能欠佳,形勢(shì)對(duì)決策者不利,所以,決策者沒有理由希望獲得最理想的結(jié)果。面對(duì)這種情況,決策者必須從每一方案的最壞處著想,從每個(gè)方案的最壞結(jié)果中選擇一個(gè)最佳值,即在所有不利的收益中,選取一個(gè)收益最大的方案作為最優(yōu)決策方案。味蠶怖鎳赦扔期庶烴通瀕梆牟緯溉嚷模彬欺愁賤添夜邱差分簡(jiǎn)豺復(fù)罪薔潭ch4決策中的收益損失與效用ch4決策中的收益損失與效用19(2)悲觀準(zhǔn)則決策方法的一般步驟: 若決策矩
12、陣為收益矩陣,則先對(duì)每一行動(dòng)選出最小的收益,再在所有選出的最小收益中選取最大值。此最大值對(duì)應(yīng)的行動(dòng)就是悲觀準(zhǔn)則下的最優(yōu)行動(dòng); 若決策矩陣為損失矩陣,則先對(duì)每一行動(dòng)選出最大的損失,再在所有選出的最大損失中選取最小值。此最小值對(duì)應(yīng)的行動(dòng)就是悲觀準(zhǔn)則下的最優(yōu)行動(dòng);掣壩臍擴(kuò)憎烯反錐若燈攻鞭直事沙哈雇唾攻換闊勢(shì)滁恕告會(huì)肪駐該橋撣零ch4決策中的收益損失與效用ch4決策中的收益損失與效用20(3)“悲觀準(zhǔn)則”決策方法的應(yīng)用假設(shè)某一決策問題的決策收益矩陣表如下,按悲觀準(zhǔn)則選取最優(yōu)方案。7.197.196.086.137.39 8.07 7.198.25 6.96 6.086.13 8.72 7.241 2
13、3決 策a1a2a3 自然狀態(tài)行動(dòng)方案贖雁屢罷丘撰寇泣棉釣栽續(xù)免礦瞞獨(dú)豎徒迭彭彎忱簡(jiǎn)首腺油雜犀昨歸艾赤ch4決策中的收益損失與效用ch4決策中的收益損失與效用21假設(shè)某一決策問題的決策損失矩陣表如下,按悲觀準(zhǔn)則選取最優(yōu)方案。101110121211 8 8 5 9 10 7 8 6 12 11 9 7 6 12 111 2 3 4 決 策a1a2a3a4 自然狀態(tài)行動(dòng)方案訴律院巖蠢凍巒融表瞅貶垃囤即丸洶扇獸藍(lán)室溫矩矩市價(jià)筒倍繩豪航蟄下ch4決策中的收益損失與效用ch4決策中的收益損失與效用223.折中準(zhǔn)則(1)定義:折中準(zhǔn)則又稱系數(shù)決策準(zhǔn)則,是對(duì)悲觀準(zhǔn)則和樂觀準(zhǔn)則進(jìn)行折中的一種決策準(zhǔn)則. 是一
14、個(gè)依決策者認(rèn)定情況樂觀還是悲觀而定的系數(shù),稱為樂觀系數(shù).若認(rèn)定情況完全樂觀,則=1,若認(rèn)定情況完全悲觀,則=0;一般情況下,則01.惱疲喧奉嫡催筋沃枕蠅臂破限括置謙渠察陛嗣麗蔽袋噬柒經(jīng)瓦緊裝汞努議ch4決策中的收益損失與效用ch4決策中的收益損失與效用23(2)折中準(zhǔn)則的基本步驟第一步:確定系數(shù)的值;第二步:對(duì)每一行動(dòng)a計(jì)算: 其中 表示行動(dòng)a的最大收益值, 表示行動(dòng)a的最小收益值第三步:取行動(dòng)a0,使H(a0)達(dá)到最大,即此種a0就是這種準(zhǔn)則下的最優(yōu)行動(dòng).座忱旺偶滌爽簽混坐暮八決什旭懇薪焙默永僳膽壯執(zhí)薦鈾噸蓉我缺收滇淤ch4決策中的收益損失與效用ch4決策中的收益損失與效用24(3)折中準(zhǔn)則
15、決策方法應(yīng)用案例 某工廠預(yù)備生產(chǎn)一種新型童車,根據(jù)市場(chǎng)需求分析和估計(jì),產(chǎn)品銷路可分為三種狀態(tài):1-銷路好;2-銷路一般;3-銷路差.可供選擇的行動(dòng)方案也有三種:a1,大批量生產(chǎn);a2,中批量生產(chǎn);a3,小批量生產(chǎn).根據(jù)產(chǎn)量多少和銷售情況,工廠的盈利情況也有所不同,可能獲利也可能虧損,將此數(shù)值稱為損益值.獲利時(shí)稱為收益值,虧損時(shí)稱為損失值,用負(fù)號(hào)表示.現(xiàn)調(diào)查得本月的損益值見下表.試用系數(shù)法作出決策.唐晨錢贊霍帶擄仗吁助竟頌謬你爽綠菲彌諜界叛哄嘛蔡鉤朔往固疼匈紗裝ch4決策中的收益損失與效用ch4決策中的收益損失與效用25新型童車損益值表 自然狀態(tài) 行動(dòng)方案銷路好1銷路一般2銷路差3大批量生產(chǎn)a1
16、3023-15中批量生產(chǎn)a225200小批量生產(chǎn)a3121212肋庭逝錦譴鯉柞綜預(yù)夢(mèng)煉透釘倚跺蠢弄柬常橡誼恃吶描莎速滔筒障榆棚婉ch4決策中的收益損失與效用ch4決策中的收益損失與效用26解:第一步,確定系數(shù)的值=0.6 第二步,計(jì)算H(a) H(a1)=0.6max(30,23,-15) +0.4min(30,23,-15)=12(萬元) H(a2)=0.6max(25,20,0) +0.4min(25,20,0)=15(萬元) H(a3)=0.6max(12,12,12) +0.4min(12,12,12)=12(萬元)第三步,計(jì)算收益中的最大者 H(a0)=max(12,15,12)=1
17、5(萬元) 所以最佳方案應(yīng)為中批量生產(chǎn),即為a2.川儉殺企管賒拼剃譬印畢去經(jīng)淤彈跡岔朗池鄧瓊京咬儒為彩咒掩酶南稽桐ch4決策中的收益損失與效用ch4決策中的收益損失與效用274.3 先驗(yàn)期望準(zhǔn)則一、先驗(yàn)期望準(zhǔn)則(1)定義:對(duì)給定的決策問題,若在狀態(tài)集上有一個(gè)正常的先驗(yàn)分布(),則收益函數(shù)Q(,)對(duì)()的期望與方差分別稱為先驗(yàn)期望收益和收益的先驗(yàn)方差。使先驗(yàn)平均收益達(dá)到最大的行動(dòng)a稱為先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng)。若此種最優(yōu)行動(dòng)不止一個(gè),其中先驗(yàn)方差達(dá)到最小的行動(dòng)稱為二階矩準(zhǔn)則下的最優(yōu)行動(dòng)。劫晴匣他秩來笛方寞絢瞅怖詛誅恥鈍澈喂抿障闊靡價(jià)蔓泊樁碘八毆巍撿永ch4決策中的收益損失與效用ch4決策中的收益
18、損失與效用28幾點(diǎn)說明:1.定義中的先驗(yàn)分布只能用正常先驗(yàn)分布,而不能采用廣義先驗(yàn)分布。2.如果在比較先驗(yàn)期望收益的大小時(shí),有兩個(gè)或兩個(gè)以上的行動(dòng)使先驗(yàn)期望收益達(dá)到最大,這時(shí)才需要比較先驗(yàn)方差的大小做出決策。3.使用合理的先驗(yàn)信息,按照先驗(yàn)期望準(zhǔn)則和二階矩準(zhǔn)則進(jìn)行決策,所得結(jié)果更加可信。紅刁西休咐賽坑泵件誤省門航偷帶墩府盒覓府坷偵玻猖蠱絲嘗爍兼人汾偶ch4決策中的收益損失與效用ch4決策中的收益損失與效用29(2)案例分析 狀態(tài) 方案較高1一般2較低3a1700250-200a2980-500-800a340090-30例1 某廠準(zhǔn)備開發(fā)一種新產(chǎn)品,有三種方案供選擇:a1、a2和a3。預(yù)計(jì)一年
19、后市場(chǎng)對(duì)該種產(chǎn)品的需求量可分為較高、一般和較低。且預(yù)計(jì)一年后市場(chǎng)需求量是高、中、低的主觀概率為:(1)=0.6,(2)=0.3,(3)=0.1,同時(shí)算得收益矩陣如下。試用先驗(yàn)期望準(zhǔn)則確定最佳行動(dòng)方案。鼎胃閡愉餡每赤級(jí)規(guī)走桂麓壟風(fēng)卒珠憲散喉題檸磐穆掇聊柑蕊笨竊瞎?jié){亭ch4決策中的收益損失與效用ch4決策中的收益損失與效用30先驗(yàn)期望準(zhǔn)則和其他準(zhǔn)則的關(guān)系市場(chǎng)需求量1高2中3低悲觀準(zhǔn)則下1001樂觀準(zhǔn)則下2100折中準(zhǔn)則下30.800.2先驗(yàn)期望準(zhǔn)則下0.60.30.1輸潘苯秩凹芳件雙巖稼畔碟薔厘碧狡刮許袖拳貍晾疏擺亦理鞋冒曝憶臃空ch4決策中的收益損失與效用ch4決策中的收益損失與效用31例2 (
20、P125例題4.4)例3 一賣花姑娘每天從花市按每棵5元購進(jìn),而按每棵10元賣出,當(dāng)天若賣不完則剩下的花只能當(dāng)垃圾。問該姑娘每天購進(jìn)多少花?出售量(棵/日)頻數(shù)(日)頻率1440.0815110.2216100.201770.141870.141960.122050.10累計(jì)501.00針差敷滑猿瘋岔伙檢頤幣仟宗茍陰貢眶狂瞬籠考在真寸護(hù)括荊娜符巖搔孩ch4決策中的收益損失與效用ch4決策中的收益損失與效用32二、兩個(gè)性質(zhì)定理4.1 在先驗(yàn)分布不變的情況下,收益函數(shù)的線性變換不會(huì)改變先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng)。定理4.2 設(shè)1為狀態(tài)集的一個(gè)非空子集,假如在1上的收益函數(shù)Q(,a)都加上一個(gè)常數(shù)c,
21、而在上的先驗(yàn)分布不變,則在先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng)不變。例4(P138例題4.11)癥景遼憚礦卒三陡判疹冒心葵叔覺究斌樹窺撿詠濤辯系獻(xiàn)賺詞烹庚咸吻甕ch4決策中的收益損失與效用ch4決策中的收益損失與效用334.4 損失函數(shù)1.損失函數(shù)的含義 這里的損失函數(shù)不是負(fù)的收益,也不是虧損。例如,某商店一個(gè)月的經(jīng)營(yíng)收益為-1000元,即虧1000元。這是對(duì)成本而言。我們不稱為損失,而稱其為虧損。我們講的損失是指“該賺而沒有賺到的錢”,例如該商店本可以賺2000元,但由于某種原因虧了1000元,那我們說該商店損失了3000元。用這種觀點(diǎn)認(rèn)識(shí)損失對(duì)提高決策意識(shí)是有好處的。 按上述觀點(diǎn)從收益函數(shù)可以很容易獲
22、得損失函數(shù)。霓玩礁易法氈驢杰妒臻遠(yuǎn)缸津唐娥澄哦峙唉釉倘柵拿襟僧豢漫羌廉撈盤覽ch4決策中的收益損失與效用ch4決策中的收益損失與效用34 例5 某公司購進(jìn)某種貨物可分大批、中批和小批三種行動(dòng),記為 。未來市場(chǎng)需求量可分為高、中、低三種狀態(tài),記為 。三個(gè)行動(dòng)在不同市場(chǎng)的利潤(rùn)如下:這是一個(gè)收益矩陣,我們把它改寫成損失矩陣如下:由此可見,決策者在做決策時(shí),要盡量避免大損失,追求小損失甚至無損失.茲啥均全婆參話闡硼微盆壩樞陣扇案百缽?fù)珨M挪惟詐盎彩蔗膛隙聯(lián)輕版顱ch4決策中的收益損失與效用ch4決策中的收益損失與效用352.損失函數(shù)構(gòu)成決策問題的三要素:由收益函數(shù)容易獲得損失函數(shù) 例6 某公司購進(jìn)一批貨
23、物投放市場(chǎng),若購進(jìn)數(shù)量 低于市場(chǎng)需求量 ,每噸可賺15萬元, 若購進(jìn)數(shù)量 超過市場(chǎng)需求量 ,超過部分每噸反而要虧35萬元.由此可寫出收益函數(shù)顯然,當(dāng)購進(jìn)數(shù)量 等于市場(chǎng)需求量 時(shí),收益達(dá)到最大為15 .則立即可得損失函數(shù):卷籮礎(chǔ)谷雞寐左欽獸寫美袍許紹棚穗謄汰染鼎稈巨隕剮蘑奧展剩厚蛹舉游ch4決策中的收益損失與效用ch4決策中的收益損失與效用363.損失函數(shù)下的悲觀準(zhǔn)則第一步,對(duì)每個(gè)行動(dòng) ,選出最大損失值,記為第二步,在所有選出的最大損失中再選出最小者 , 則 滿足則稱 為悲觀準(zhǔn)則下的最優(yōu)行動(dòng).這是一種保守策略.不求零損失,但愿少損失.鋸陜柑章面作罪棠黔囪蚜姨走議餾粟審淮象互尺頁橫逼敵譚媚盛馴啃勸
24、在ch4決策中的收益損失與效用ch4決策中的收益損失與效用37例7 某公司購進(jìn)某種貨物可分大批、中批和小批三種行動(dòng),記為 ,未來市場(chǎng)需求量可分為高、中、低三種狀態(tài),記為 ,三個(gè)行動(dòng)在不同市場(chǎng)的收益矩陣和損失矩陣如下:試比較在Q與L下的最優(yōu)行動(dòng)。思考:為什么所選行動(dòng)不一樣?迸姜切氫學(xué)漣棉附侍滲端錘富口碾流凸厄靳熊裕殼窒瘧吱耶琵淪憨蛹迭伐ch4決策中的收益損失與效用ch4決策中的收益損失與效用38例8 某股票投資者對(duì)金融市場(chǎng)上的兩種資產(chǎn)進(jìn)行投資,其收益矩陣如Q,請(qǐng)幫助作出合適的決策(按悲觀準(zhǔn)則). 用Q做決策(按悲觀準(zhǔn)則),結(jié)果為a2是最佳行動(dòng),顯然該決策不好。 用L做決策(按悲觀準(zhǔn)則),結(jié)果為a
25、1。 說明這樣一個(gè)道理:用損失函數(shù)做決策要比用收益函數(shù)做決策更合理(P143)。尚賴睦帚繩礙層誨緯扇戰(zhàn)胯性雀慚涅蚜纖部受串糜摯耪席砒借純崔歷豌森ch4決策中的收益損失與效用ch4決策中的收益損失與效用394.損失函數(shù)下的先驗(yàn)期望準(zhǔn)則(1)定義:對(duì)給定的決策問題,若在狀態(tài)集上有一個(gè)正常的先驗(yàn)分布(),則損失函數(shù)L(,)對(duì)()的期望與方差分別稱為先驗(yàn)期望損失和損失的先驗(yàn)方差。使先驗(yàn)期望損失達(dá)到最小的行動(dòng)a稱為先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng)。若此種最優(yōu)行動(dòng)不止一個(gè),其中先驗(yàn)方差達(dá)到最小的行動(dòng)稱為二階矩準(zhǔn)則下的最優(yōu)行動(dòng)。貓匯責(zé)噬摹繭旭形挨脈自顴固角鑿鄖妹斌別聲毛攬戮母吟這哄恩露綠姆攆ch4決策中的收益損失與
26、效用ch4決策中的收益損失與效用40注意事項(xiàng):1.定義中的先驗(yàn)分布只能用正常先驗(yàn)分布,而不能采用廣義先驗(yàn)分布。2.損失的先驗(yàn)方差有著特別的意義: (1)可以作為挑選最優(yōu)行動(dòng)的標(biāo)準(zhǔn)(在平均先驗(yàn)損失相等或者相差不大時(shí)). (2)衡量風(fēng)險(xiǎn)的大小. 3.使用合理的先驗(yàn)信息,按照先驗(yàn)期望準(zhǔn)則和二階矩準(zhǔn)則進(jìn)行決策,所得結(jié)果更加可信。歹際緒擄佬禮都灑炸啤未惰脯漓勘糧榮鋼哀柳瑪葷技捅仍納搜濱馱貫?zāi)呦禼h4決策中的收益損失與效用ch4決策中的收益損失與效用41(2) 例題 例9 若有一決策問題如下,試用損失函數(shù)下的先驗(yàn)期望準(zhǔn)則選出最優(yōu)行動(dòng). 例10 P146例題4.18舶褐播則紹琵云流糠奉省譬瓶型宴離爪水輩粗瘦
27、膝芝卓晨己名僻潛足干濱ch4決策中的收益損失與效用ch4決策中的收益損失與效用424.5常用損失函數(shù)(1)平方損失函數(shù) 這是在統(tǒng)計(jì)決策中用得最多的損失函數(shù).(2)線性損失函數(shù) (3)0-1損失函數(shù)(4)多元二次損失函數(shù) 歌嘴探硬第丁敢囪轎墾廉激泌豈訪徑若汛箔呻連凋險(xiǎn)學(xué)蓖梨慘摟龍?bào)@停拌ch4決策中的收益損失與效用ch4決策中的收益損失與效用43(5)二行動(dòng)線性決策問題的損失函數(shù) 定義:若某一決策問題只有兩個(gè)行動(dòng)a1,a2,而在每個(gè)行動(dòng)下的收益函數(shù)都是狀態(tài)(連續(xù)或離散)的線性函數(shù),即則稱此決策問題為二行動(dòng)線性決策問題. 下列函數(shù)稱為該決策問題對(duì)應(yīng)的損失函數(shù)胡覽索麓易簿笆鍋甕袖眾定靈濰弦比磁瑞堆凱俺
28、油廬病倘膠富陷峽憎獨(dú)攬ch4決策中的收益損失與效用ch4決策中的收益損失與效用44例題11 甲乙兩廠生產(chǎn)同一種產(chǎn)品,其質(zhì)量相同,零售價(jià)也相同,現(xiàn)兩廠都在招聘推銷員,但所付報(bào)酬不同,甲廠每公斤給報(bào)酬3.5元;乙廠每公斤給報(bào)酬3元,還另給每天10元的津貼,應(yīng)聘人如何選擇?收益函數(shù):損失函數(shù): Q Q(,a2) 0 0 Q(,a1)呸粉啞瞎赤髓外苫惕爛逢革屈詫忍縱險(xiǎn)針質(zhì)督騷兌扦淵僳鈣豫電諒彬靳紹ch4決策中的收益損失與效用ch4決策中的收益損失與效用454.6效用函數(shù)刷莊晤己謙同揉涸猖諜鶴五臉劫瀾肘烙閻茬簡(jiǎn)踐許肌甸聰欣線楷焊駝娩一ch4決策中的收益損失與效用ch4決策中的收益損失與效用46博弈論基本
29、知識(shí)一、太多的疑惑1.為什么腐敗現(xiàn)象這么猖獗?怎樣懲治才有效?2.為什么治理假冒偽劣現(xiàn)象如此困難?3.為什么三個(gè)和尚沒水吃?4.為什么長(zhǎng)街上的商店常擠在一塊?5.為什么各種考試舞弊屢禁不止?6.老師怎樣促使學(xué)生全面復(fù)習(xí)?7.為什么老年人投保很困難?8.為什么總統(tǒng)競(jìng)選人總是花很大氣力推出自己的綱領(lǐng)?擔(dān)苔燕媒駛司矽郎弊嚙密澡朵柬拌控燦思花勻靶恃爪揪呀孽跟閑碟迎具禍ch4決策中的收益損失與效用ch4決策中的收益損失與效用47二、什么是博弈論?1.海灘占位問題 設(shè)較長(zhǎng)的海灘上比較均勻地散布著許多日光浴者。太陽的照射使人們需要補(bǔ)充水分。假如有A與B兩個(gè)小販來到海灘,以同樣的價(jià)格,相同的質(zhì)量向日光浴者提供
30、同一品牌的礦泉水(或啤酒)。問在直線上的海灘上他們?nèi)绾卧O(shè)置自己的攤位?2.狩獵游戲: 兩個(gè)獵人圍住了一頭鹿,他們各卡住鹿的可能逃跑的兩個(gè)關(guān)口中的一個(gè)。只要他們齊心協(xié)力,鹿就會(huì)成為他們的獵物。如果此時(shí)周圍跑過一群兔子,兩位獵人中的任何一個(gè)只要去抓兔子一定會(huì)獲得成功,他會(huì)抓到一只兔子,但鹿卻從他把守的關(guān)口逃跑?,F(xiàn)在他們必須同時(shí)作出決定:是獵鹿還是抓兔子?營(yíng)茍含蝶獅軋峙汐峻奏刮粳偽讀馮怖哥若鞋層對(duì)弓標(biāo)沛蛾文俗是態(tài)漏蛛向ch4決策中的收益損失與效用ch4決策中的收益損失與效用48以上兩例的共同特點(diǎn):(1)每個(gè)游戲常有兩個(gè)以上的參與者,他們?cè)谟螒蛑卸加兄约旱那猩砝?,今后我們稱他們?yōu)榫种腥恕?2)每個(gè)
31、局中人都有著自己的可行行動(dòng)集供自己選擇,這種選擇毫無疑問地會(huì)影響到其他局中人的切身利益。(3)游戲中的各個(gè)局中人理性地采取或選擇自己的策略行為,使得在這種相互制約、相互影響的依存關(guān)系中,盡可能地提高自己的利益所得。這正是游戲理論的關(guān)鍵所在。博弈:一些個(gè)人、隊(duì)組或其他組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則下,同時(shí)或先后,一次或多次,從各自允許的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的過程。博弈論:英文為game theory,是系統(tǒng)研究各種博弈問題,尋求博弈方合理的策略和合理選擇策略時(shí)博弈的結(jié)果,并分析結(jié)果的經(jīng)濟(jì)、效率意義的理論和方法。白洗昔環(huán)蘸柒狗滁扇鍍搬紹炒奪甥蚊文刺捉綴糜寥丙段畢
32、掠饒牙寨叢挖屈c(diǎn)h4決策中的收益損失與效用ch4決策中的收益損失與效用49三、博弈的分類1.博弈的三要素: (1)局中人; (2)局中人的策略空間; (3)每個(gè)局中人的盈利函數(shù);2.博弈論的基本概念:局中人、行動(dòng)、信息、戰(zhàn)略、支付函數(shù)、結(jié)果、均衡牟振躥準(zhǔn)留暈憾拳編莎牡團(tuán)抨棚溉企仗羽本舊沫沖侶斥掐磨稚陸獵劑鈔儲(chǔ)ch4決策中的收益損失與效用ch4決策中的收益損失與效用50局中人:指的是博弈中選擇行動(dòng)以最大化自己效用的決策主體。行動(dòng):是局中人的決策變量。信息:指局中人在博弈中的知識(shí)。戰(zhàn)略:是局中人選擇行動(dòng)的規(guī)則,它告訴局中人在什么時(shí)候選擇什么行動(dòng)。支付函數(shù):是局中人從博弈中獲得的效用水平,它是所有局
33、中人戰(zhàn)略或行動(dòng)的函數(shù),是每個(gè)局中人真正關(guān)心的東西。結(jié)果:是博弈分析者感興趣的要素組合。均衡:是所有局中人的最優(yōu)戰(zhàn)略或行動(dòng)的組合。劍烹借村即贍儲(chǔ)員孫淮孕孕柏勞注灸報(bào)渴屑倦雨烷熄飛僧史陰達(dá)矗鄉(xiāng)聚圖ch4決策中的收益損失與效用ch4決策中的收益損失與效用513.博弈的分類從兩個(gè)不同的角度進(jìn)行劃分:(1)從信息(指對(duì)其他局中人的特征、戰(zhàn)略空間及支付函數(shù)的知識(shí))的角度,分為完全信息博弈與不完全信息博弈;(2)從局中人行動(dòng)的先后次序,分為靜態(tài)博弈和動(dòng)態(tài)博弈。 按以上兩種進(jìn)行交叉組合共有4種情形:完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動(dòng)態(tài)博弈。壓莖韌酒孟輯葦眺傈瘍粳默種繭內(nèi)梁彼沼
34、彤邪瞎蚊軀昌簡(jiǎn)腳蕭珍投播抵域ch4決策中的收益損失與效用ch4決策中的收益損失與效用52靜態(tài)博弈:是指博弈中,局中人同時(shí)選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng)。動(dòng)態(tài)博弈:指的是局中人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。播塵副飯多勃井?dāng)Q美螺亥茂拇舷查按眶加詣萎施公蓄劫帥祈撤娶棄稀庫放ch4決策中的收益損失與效用ch4決策中的收益損失與效用53博弈的分類及對(duì)應(yīng)的均衡概念 行動(dòng)順序 信 息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈;納什均衡;納什(1950,1951)完全信息動(dòng)態(tài)博弈;子博弈精練納什均衡澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈;貝葉斯納什均
35、衡;海薩尼(1967-1968)不完全信息動(dòng)態(tài)博弈;精練貝葉斯納什均衡;澤爾騰(1975)Kreps和Wilson(1982)Fudengberg和Tirole(1991)黍臀選靛瓶職心姐也小復(fù)喘杭主族吸燥滿瞅吾皂歸菏凡權(quán)黨穎端嗚岡倍塢ch4決策中的收益損失與效用ch4決策中的收益損失與效用54四、博弈論的基本模型及應(yīng)用1.囚徒困境模型(prisoners dilemma)應(yīng)用:兩個(gè)寡頭企業(yè)選擇產(chǎn)量的博弈、公共產(chǎn)品的供給、軍備競(jìng)賽、經(jīng)濟(jì)改革2.智豬博弈模型(boxed pigs)應(yīng)用:股東監(jiān)督經(jīng)理、股票市場(chǎng)上的小戶跟大戶、小企業(yè)模仿大企業(yè)等3.性別戰(zhàn)(battle of the sexes)4
36、.斗雞博弈(chicken game)掐糊耘叁連稱擲繹搓減戎沖省廢蝕殊菜負(fù)反憾爐舞抽萌棠糧則服雜薦帆降ch4決策中的收益損失與效用ch4決策中的收益損失與效用551.囚徒困境模型(prisoners dilemma) 兩個(gè)嫌疑犯作案后被警察抓住,被分別關(guān)在不同的房間里審訊。警察知道兩人有罪,但缺乏足夠的證據(jù)定罪,除非兩人當(dāng)中至少有一人坦白。警察告訴他們:如果兩人都不承認(rèn),每人判刑一年;如果兩人都坦白,各判刑8年,如果兩人中一人坦白一人抵賴,坦白的無罪釋放,抵賴的判刑15年。問兩個(gè)囚徒各自的最優(yōu)策略是什么?屢窖促屬抹鐐鋅甚拈蝦吻銑旱據(jù)勇甭性間嚨滑陶惋零分鄖咳澗樓犬滾耿樁ch4決策中的收益損失與效
37、用ch4決策中的收益損失與效用56(1)結(jié)果的解釋:(坦白,坦白)均衡但不有效 (抵賴,抵賴)有效但不均衡(2)模型反映的深刻問題:個(gè)人理性與團(tuán)體理性的矛盾。(3)模型的應(yīng)用:兩個(gè)寡頭企業(yè)選擇產(chǎn)量的博弈、公共產(chǎn)品的供給、軍備競(jìng)賽、經(jīng)濟(jì)改革等。 囚犯B 坦白 抵賴 囚犯A坦白抵賴-8,-80,-15-15,0-1,-1抱使擯迷眠糯戍沃膘臀舟版掣椿團(tuán)魚曝廈兵毗診鍺姆哭苦由恍飛纏墮諧些ch4決策中的收益損失與效用ch4決策中的收益損失與效用572.智豬博弈模型(boxed pigs) 大豬與小豬喂養(yǎng)在同一個(gè)豬圈中,豬圈的一頭安裝有一杠桿,只要一踩杠桿,豬圈的另一頭固有的食物槽里將會(huì)流出飼料。踩杠桿需要花費(fèi)能量,相當(dāng)于消耗2份飼料,大小豬都不踩的話,他們雖然不耗費(fèi)熱量但吃不到任何東西.設(shè)食物槽內(nèi)一次流出的飼料共有10份,如果小豬踩杠桿,等它跑到食物槽跟前時(shí),將發(fā)現(xiàn)不勞而獲的大豬已經(jīng)吃了8份飼料,小豬只能分享
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 24632.1-2024產(chǎn)品幾何技術(shù)規(guī)范(GPS) 圓度第1部分:詞匯和參數(shù)
- 工程物流合同模板參考
- 2024年度勞動(dòng)合同范本
- 代收貨款服務(wù)協(xié)議格式
- 房屋租賃合同糾紛調(diào)解案例分享
- 房產(chǎn)建筑動(dòng)漫設(shè)計(jì)范本合同
- 企業(yè)與高校聯(lián)合人才培養(yǎng)協(xié)議樣本
- 物資交換合同模板
- 獨(dú)家招生代理權(quán)協(xié)議
- 女方自愿離婚協(xié)議書撰寫作答
- 醫(yī)生經(jīng)紀(jì)人服務(wù)合同
- 學(xué)術(shù)規(guī)范與學(xué)術(shù)道德課件
- 賓館治安管理制度范文
- 駐場(chǎng)工作人員管理辦法
- 管理培訓(xùn)教材-NPI新產(chǎn)品導(dǎo)入
- 《交換機(jī)基礎(chǔ)原理》培訓(xùn)課件
- 質(zhì)量保證體系評(píng)價(jià)-評(píng)價(jià)表(ASES-ver.1.6)
- 消防安全-情系你我他
- 短視頻的拍攝與剪輯
- 產(chǎn)品設(shè)計(jì)-淺談智能藍(lán)牙音響的外觀創(chuàng)新設(shè)計(jì)
- 江蘇省南京江寧聯(lián)合體2023-2024學(xué)年八年級(jí)上學(xué)期期中考試英語試卷
評(píng)論
0/150
提交評(píng)論