




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、1第三章第三章 貝葉斯估計貝葉斯估計3.1貝葉斯推斷方法貝葉斯推斷方法一一 、統(tǒng)計推斷中可用的三種信息、統(tǒng)計推斷中可用的三種信息 美籍波蘭統(tǒng)計學(xué)家耐美籍波蘭統(tǒng)計學(xué)家耐(E.L.Lehmann18941981)高度概括了在統(tǒng)計推斷中可用的三種信息:高度概括了在統(tǒng)計推斷中可用的三種信息: 1總體信息,即總體分布或所屬分布族給我們總體信息,即總體分布或所屬分布族給我們的信息。譬如的信息。譬如“總體是指數(shù)分布總體是指數(shù)分布”或或“總體是正總體是正態(tài)分布態(tài)分布”在統(tǒng)計推斷中都發(fā)揮重要作用,只要有在統(tǒng)計推斷中都發(fā)揮重要作用,只要有總體信息,就要想方設(shè)法在統(tǒng)計推斷中使用??傮w信息,就要想方設(shè)法在統(tǒng)計推斷中使
2、用。2樣本信息,即樣本提供我們的信息,這是任樣本信息,即樣本提供我們的信息,這是任一種統(tǒng)計推斷中都需要。一種統(tǒng)計推斷中都需要。23先驗信息,即在抽樣之前有關(guān)統(tǒng)計推斷的一些先驗信息,即在抽樣之前有關(guān)統(tǒng)計推斷的一些信息。譬如,在估計某產(chǎn)品的不合格率時,假如工信息。譬如,在估計某產(chǎn)品的不合格率時,假如工廠保存了過去抽檢這種產(chǎn)品質(zhì)量的資料,這些資料廠保存了過去抽檢這種產(chǎn)品質(zhì)量的資料,這些資料(包括歷史數(shù)據(jù))有時估計該產(chǎn)品的不合格率是有(包括歷史數(shù)據(jù))有時估計該產(chǎn)品的不合格率是有好處的。這些資料所提供的信息就是一種先驗信息。好處的。這些資料所提供的信息就是一種先驗信息。又如某工程師根據(jù)自己多年積累的經(jīng)驗
3、對正在設(shè)計又如某工程師根據(jù)自己多年積累的經(jīng)驗對正在設(shè)計的某種彩電的平均壽命所提供的估計也是一種先驗的某種彩電的平均壽命所提供的估計也是一種先驗信息。由于這種信息是在信息。由于這種信息是在“試驗之前試驗之前”就已有的,就已有的,故稱為先驗信息。故稱為先驗信息。以前所討論的點估計只使用前兩種信息,沒有使用以前所討論的點估計只使用前兩種信息,沒有使用先驗信息。假如能把收集到的先驗信息也利用起來,先驗信息。假如能把收集到的先驗信息也利用起來,那對我們進行統(tǒng)計推斷是有好處的。只用前兩種信那對我們進行統(tǒng)計推斷是有好處的。只用前兩種信息的統(tǒng)計學(xué)稱為經(jīng)典統(tǒng)計學(xué),三種信息都用的統(tǒng)計息的統(tǒng)計學(xué)稱為經(jīng)典統(tǒng)計學(xué),三種
4、信息都用的統(tǒng)計學(xué)稱為貝葉斯統(tǒng)計學(xué)。本節(jié)將簡要介紹貝葉斯統(tǒng)計學(xué)稱為貝葉斯統(tǒng)計學(xué)。本節(jié)將簡要介紹貝葉斯統(tǒng)計學(xué)中的點估計方法。學(xué)中的點估計方法。3二、貝葉斯公式的密度函數(shù)形式二、貝葉斯公式的密度函數(shù)形式貝葉斯統(tǒng)計學(xué)的基礎(chǔ)是著名的貝葉斯公式,它是英國貝葉斯統(tǒng)計學(xué)的基礎(chǔ)是著名的貝葉斯公式,它是英國學(xué)者貝葉斯(學(xué)者貝葉斯(T.R.Bayes17021761)在他死后二年發(fā)在他死后二年發(fā)表的一篇論文論歸納推理的一種方法中提出的。表的一篇論文論歸納推理的一種方法中提出的。經(jīng)過二百年的研究與應(yīng)用,貝葉斯的統(tǒng)計思想得到很經(jīng)過二百年的研究與應(yīng)用,貝葉斯的統(tǒng)計思想得到很大的發(fā)展,形成一個統(tǒng)計學(xué)派大的發(fā)展,形成一個統(tǒng)計
5、學(xué)派貝葉斯學(xué)派。為了紀(jì)貝葉斯學(xué)派。為了紀(jì)念他,英國歷史最悠久的統(tǒng)計雜志念他,英國歷史最悠久的統(tǒng)計雜志Biometrika在在1958年又全文刊登貝葉斯的這篇論文。年又全文刊登貝葉斯的這篇論文。初等概率論中的貝葉斯公式是用事件的概率形式給初等概率論中的貝葉斯公式是用事件的概率形式給出的??稍谪惾~斯統(tǒng)計學(xué)中應(yīng)用更多的是貝葉斯公出的??稍谪惾~斯統(tǒng)計學(xué)中應(yīng)用更多的是貝葉斯公式的密度函數(shù)形式。下面結(jié)合貝葉斯統(tǒng)計學(xué)的基本式的密度函數(shù)形式。下面結(jié)合貝葉斯統(tǒng)計學(xué)的基本觀點來引出其密度函數(shù)形式。貝葉斯統(tǒng)計學(xué)的基本觀點來引出其密度函數(shù)形式。貝葉斯統(tǒng)計學(xué)的基本觀點可以用下面三個觀點歸納出來。觀點可以用下面三個觀點歸
6、納出來。4假設(shè)假設(shè) 隨機變量隨機變量X有一個密度函數(shù)有一個密度函數(shù)p(x;),),其中其中是一個參數(shù),不同的是一個參數(shù),不同的對應(yīng)不同的密度函數(shù),對應(yīng)不同的密度函數(shù),故從貝葉斯觀點看,故從貝葉斯觀點看,p(x;)在給定在給定后是個條后是個條件密度函數(shù),因此記為件密度函數(shù),因此記為p(x)更恰當(dāng)一些。這更恰當(dāng)一些。這個條件密度能提供我們的有關(guān)的個條件密度能提供我們的有關(guān)的信息就是總體信息就是總體信息。信息。假設(shè)假設(shè) 當(dāng)給定當(dāng)給定后,從總體后,從總體p(x)中隨機抽取一中隨機抽取一個樣本個樣本X1,Xn,該樣本中含有該樣本中含有的有關(guān)信息。這的有關(guān)信息。這種信息就是樣本信息。種信息就是樣本信息。假
7、設(shè)假設(shè) 我們對參數(shù)我們對參數(shù)已經(jīng)積累了很多資料,經(jīng)過分析、已經(jīng)積累了很多資料,經(jīng)過分析、整理和加工,可以獲得一些有關(guān)整理和加工,可以獲得一些有關(guān)的有用信息,這種信的有用信息,這種信息就是先驗信息。參數(shù)息就是先驗信息。參數(shù)不是永遠(yuǎn)固定在一個值上,而不是永遠(yuǎn)固定在一個值上,而是一個事先不能確定的量。是一個事先不能確定的量。5從貝葉斯觀點來看,未知參數(shù)從貝葉斯觀點來看,未知參數(shù)是一個隨機變量。描是一個隨機變量。描述這個隨機變量的分布可從先驗信息中歸納出來,這述這個隨機變量的分布可從先驗信息中歸納出來,這個分布稱為先驗分布,其密度函數(shù)用個分布稱為先驗分布,其密度函數(shù)用()表示。表示。1 先驗分布先驗分
8、布定義定義3.1 將總體中的未知參數(shù)將總體中的未知參數(shù)看成一取值于看成一取值于的隨機變量,它有一概率分布,記為的隨機變量,它有一概率分布,記為(),),稱為稱為參數(shù)參數(shù)的先驗分布。的先驗分布。2 后驗分布后驗分布在貝葉斯統(tǒng)計學(xué)中,把以上的三種信息歸納起來的在貝葉斯統(tǒng)計學(xué)中,把以上的三種信息歸納起來的最好形式是在總體分布基礎(chǔ)上獲得的樣本最好形式是在總體分布基礎(chǔ)上獲得的樣本X1,Xn,和參數(shù)的聯(lián)合密度函數(shù)和參數(shù)的聯(lián)合密度函數(shù) 6)(),(),(11nnxxpxxp在這個聯(lián)合密度函數(shù)中。當(dāng)樣本在這個聯(lián)合密度函數(shù)中。當(dāng)樣本 給定之后,給定之后,未知的僅是參數(shù)未知的僅是參數(shù)了,我們關(guān)心的是樣本給定后,了
9、,我們關(guān)心的是樣本給定后,的條的條件密度函數(shù),依據(jù)密度的計算公式,容易獲得這個條件件密度函數(shù),依據(jù)密度的計算公式,容易獲得這個條件密度函數(shù)密度函數(shù)nXX,1dxxpxxpxxpxxpxxnnnnn)(),()(),(),(),(),(11111這就是貝葉斯公式的密度函數(shù)形式,這就是貝葉斯公式的密度函數(shù)形式,稱為稱為的的后驗密度函數(shù)后驗密度函數(shù),或,或后驗分布后驗分布。而。而 ),(1nxx dxxpxxpnn)(),(),(117是樣本的邊際分布,或稱樣本是樣本的邊際分布,或稱樣本 的無條的無條件分布,它的積分區(qū)域就是參數(shù)件分布,它的積分區(qū)域就是參數(shù)的取值范圍,隨的取值范圍,隨具體情況而定。具
10、體情況而定。nXX,1前面的分析總結(jié)如下:人們根據(jù)先驗信息對參數(shù)前面的分析總結(jié)如下:人們根據(jù)先驗信息對參數(shù)已有一個認(rèn)識,這個認(rèn)識就是先驗分布已有一個認(rèn)識,這個認(rèn)識就是先驗分布()。)。通過試驗,獲得樣本。從而對通過試驗,獲得樣本。從而對的先驗分布進行調(diào)的先驗分布進行調(diào)整,調(diào)整的方法就是使用上面的貝葉斯公式,調(diào)整整,調(diào)整的方法就是使用上面的貝葉斯公式,調(diào)整的結(jié)果就是后驗分布的結(jié)果就是后驗分布 。后驗分布是。后驗分布是三種信息的綜合。獲得后驗分布使人們對三種信息的綜合。獲得后驗分布使人們對的認(rèn)識的認(rèn)識又前進一步,可看出,獲得樣本的的效果是把又前進一步,可看出,獲得樣本的的效果是把我們我們對對的認(rèn)識
11、由的認(rèn)識由()調(diào)整到調(diào)整到 。所以。所以對對的統(tǒng)計推斷就應(yīng)建立在后驗分布的統(tǒng)計推斷就應(yīng)建立在后驗分布 的基礎(chǔ)上。的基礎(chǔ)上。),(1nxx ),(1nxx ),(1nxx 8例例1 設(shè)事件設(shè)事件A的概率為的概率為 ,即,即 。為了估。為了估計計 而作而作n次獨立觀察,其中事件次獨立觀察,其中事件A出現(xiàn)次數(shù)為出現(xiàn)次數(shù)為X,則有則有X服從二項分布服從二項分布 即即( )P A),(nb., 1 , 0,)1 ()(nxCxXPxnxxn如果此時我們對事件如果此時我們對事件A的發(fā)生沒有任何了解,對的發(fā)生沒有任何了解,對 的大小也沒有任何信息。在這種情況下,貝葉斯建議的大小也沒有任何信息。在這種情況下,
12、貝葉斯建議用區(qū)間(用區(qū)間(0,1)上的均勻分布作為的先驗分布。因為)上的均勻分布作為的先驗分布。因為它在(它在(0,1)上每一點都是機會均等的。這個建議被)上每一點都是機會均等的。這個建議被后人稱為貝葉斯假設(shè)。后人稱為貝葉斯假設(shè)。 others, 010 , 1)(9此式在定義域上與二項分布有區(qū)別。再計算此式在定義域上與二項分布有區(qū)別。再計算X的的邊際密度為邊際密度為10 , 1 , 0,)1 (,nxCxpxnxxn樣本樣本X與參數(shù)的聯(lián)合分布為與參數(shù)的聯(lián)合分布為nxnxnxCdxpxpxn, 1 , 0,)2() 1() 1(),()(1010 ,)1 () 1() 1()2()(xnxxn
13、xnx) 1, 1(xnxBeX即即10拉普拉斯計算過這個概率拉普拉斯計算過這個概率,研究男嬰的誕生比例是研究男嬰的誕生比例是否大于否大于0.5?如抽了如抽了251527個男嬰個男嬰,女嬰女嬰241945個個貝葉斯統(tǒng)計學(xué)首先要想方設(shè)法先去尋求貝葉斯統(tǒng)計學(xué)首先要想方設(shè)法先去尋求的先驗分布。的先驗分布。先驗分布的確定大致可分以下幾步:先驗分布的確定大致可分以下幾步:第一步,選一個適應(yīng)面較廣的分布族作先驗分布族,第一步,選一個適應(yīng)面較廣的分布族作先驗分布族,使它在數(shù)學(xué)處理上方便一些,這里我們選用使它在數(shù)學(xué)處理上方便一些,這里我們選用分布族分布族0, 0, 10 ,)1 ()()()()(11baba
14、baba11注:注: 作為作為的先驗分布族是恰當(dāng)?shù)?,從以下幾方面考慮:的先驗分布族是恰當(dāng)?shù)模瑥囊韵聨追矫婵紤]:1 參數(shù)參數(shù)是廢品率,它僅在(是廢品率,它僅在(0,1)上取值。因此,必)上取值。因此,必需用區(qū)間(需用區(qū)間(0,1)上的一個分布去擬合先驗信息。)上的一個分布去擬合先驗信息。分布正是這樣一個分布。分布正是這樣一個分布。0, 0,)()()(),(0, 0,)1 (),(!) 1(, 0,)(101101qpbaqpqpBqpdxxxqpBnnsdxexsqpxs2 分布含有兩個參數(shù)分布含有兩個參數(shù)a與與b,不同的不同的a與與b就對應(yīng)不同就對應(yīng)不同的先驗分布,因此這種分布的適應(yīng)面較大。
15、的先驗分布,因此這種分布的適應(yīng)面較大。123 樣本樣本X的分布為二項分布的分布為二項分布b(n,)時,假如時,假如的先的先驗分布為驗分布為分布,則用貝葉斯估計算得的后驗分布仍分布,則用貝葉斯估計算得的后驗分布仍然是然是分布,只是其中的參數(shù)不同。這樣的先驗分布分布,只是其中的參數(shù)不同。這樣的先驗分布(分布)稱為參數(shù)分布)稱為參數(shù)的共軛先驗分布。選擇共軛先驗的共軛先驗分布。選擇共軛先驗分布在處理數(shù)學(xué)問題上帶來不少方便。分布在處理數(shù)學(xué)問題上帶來不少方便。4 國內(nèi)外不少人使用國內(nèi)外不少人使用分布獲得成功。分布獲得成功。第二步,根據(jù)先驗信息在先驗分布族中選一個分布作第二步,根據(jù)先驗信息在先驗分布族中選一
16、個分布作為先驗分布,使它與先驗信息符合較好。利用為先驗分布,使它與先驗信息符合較好。利用的先驗的先驗信息去確定信息去確定分布中的兩個參數(shù)分布中的兩個參數(shù)a與與b。從文獻(xiàn)來看,確從文獻(xiàn)來看,確定定a與與b的方法很多。例如,如果能從先驗信息中較為的方法很多。例如,如果能從先驗信息中較為準(zhǔn)確地算得準(zhǔn)確地算得先驗平均和先驗方差,則可令其分別等于先驗平均和先驗方差,則可令其分別等于分布的期望與方差最后解出分布的期望與方差最后解出a與與b。1322) 1()(Sbabaabbaa)1 ()1 (22abSa如果從先驗信息獲得如果從先驗信息獲得則可解得則可解得a=3,b=12這意味著這意味著的先驗分布是參數(shù)
17、的先驗分布是參數(shù)a=3,b=12的的分布。分布。假如我們能從先驗信息中較為準(zhǔn)確地把握假如我們能從先驗信息中較為準(zhǔn)確地把握的兩個的兩個分位數(shù),如確定分位數(shù),如確定確定的確定的10分位數(shù)分位數(shù)0。1和和50的中的中位數(shù)位數(shù)0。5,那可以通過如下兩個方程來確定那可以通過如下兩個方程來確定a與與b。01. 0, 2 . 02S14.5.0)(,1.0)(5.01.000dd假如的信息較為豐富,譬如對此產(chǎn)品經(jīng)常進行抽樣假如的信息較為豐富,譬如對此產(chǎn)品經(jīng)常進行抽樣檢查,每次都對廢品率作出一個估計,把這些估計檢查,每次都對廢品率作出一個估計,把這些估計值看作的一些觀察值,再經(jīng)過整理,可用一個分布值看作的一些
18、觀察值,再經(jīng)過整理,可用一個分布去擬合它。去擬合它。假如關(guān)于的信息較少,甚至沒有什么有用的先驗假如關(guān)于的信息較少,甚至沒有什么有用的先驗信息,那可以用區(qū)間(信息,那可以用區(qū)間(0,1)上的均勻分布)上的均勻分布(a=b=1情況)。用均勻分布意味著我們對的各種情況)。用均勻分布意味著我們對的各種取值是取值是“同等對待的同等對待的”,是,是“機會均等的機會均等的”。15貝葉斯本人認(rèn)為,當(dāng)你對參數(shù)貝葉斯本人認(rèn)為,當(dāng)你對參數(shù)的認(rèn)識除了在有限區(qū)的認(rèn)識除了在有限區(qū)間(間(c,d)之外,其它毫無所知時,就可用區(qū)間(之外,其它毫無所知時,就可用區(qū)間(c,d)上的均勻分布作為上的均勻分布作為的先驗分布。這個看法
19、被后的先驗分布。這個看法被后人稱之為人稱之為“貝葉斯假設(shè)貝葉斯假設(shè)”。確定了先驗分布后,就可計算出后驗分布,過程如確定了先驗分布后,就可計算出后驗分布,過程如下:下:11( , )() ( )()(1)( ) ( )a xb n xp xp Xxnabxab x=0,1,n,01于是于是X的邊際分布為的邊際分布為 ., 1 , 0,)()()()()()(),()(10nxxnnbaxnbxababadxpxp16最后在給出最后在給出X=x的條件下,的條件下,的后驗密度為的后驗密度為10,)1 ()()()()(),()(11xxnbxanbaxpxpxxnbxa顯然這個后驗分布仍然是顯然這個
20、后驗分布仍然是分布,它的兩個參數(shù)分別分布,它的兩個參數(shù)分別是是a+x和和b+n-x。我們選后驗期望作為的貝葉斯估計,我們選后驗期望作為的貝葉斯估計,則則的貝葉斯估計為的貝葉斯估計為 nbaxadxB10)(與前面的極大似然估計是不同的。與前面的極大似然估計是不同的。 baaXEbaX)(),(17如果用(如果用(0,1)上的均勻作為)上的均勻作為的先驗分布,則的先驗分布,則的貝葉斯估計為的貝葉斯估計為 21nxB計算如下:計算如下: 10 ., 1 , 0,)1 ()()(),(nxCxXpxpxnxxn10 ,)1 () 1() 1()2()(),()()2() 1() 1()1 ()(10
21、 xxnxnxpxpxnxnxCdCxpxnxxnxnxxn后驗分布為后驗分布為 ) 1, 1(xnx18三、三、 常用的一些共軛先驗分布常用的一些共軛先驗分布對于一些常用的指數(shù)分布族,如果僅對其中的參數(shù)對于一些常用的指數(shù)分布族,如果僅對其中的參數(shù)感感興趣,下表列出了它們的共軛先驗分布及后驗期望。興趣,下表列出了它們的共軛先驗分布及后驗期望。分 布共 軛 先 驗 分 布后 驗 分 布 正態(tài)分布正態(tài)分布二項分布 分布 Poisson分布 分布(a,b)),(2N2222x),(pnb),(baaxabn)(1bxa),(2N19EX1 EX1 設(shè)設(shè)是一批產(chǎn)品的不合格率,已知它不是是一批產(chǎn)品的不合
22、格率,已知它不是0.10.1就是就是0.20.2,且其先驗分布為,且其先驗分布為(0.10.1)=0.7,=0.7,(0.20.2)=0.3=0.3假如從這批產(chǎn)品中隨機取假如從這批產(chǎn)品中隨機取8 8個進行檢查,發(fā)現(xiàn)有個進行檢查,發(fā)現(xiàn)有2 2個不合個不合格,求格,求的后驗分布。的后驗分布。解:解:3 . 07 . 02 . 01 . 0)1 ()2(6228PCXP542. 07 . 03 . 09 . 01 . 08 . 02 . 011)2 . 0()2 . 02() 1 . 0() 1 . 02() 1 . 0() 1 . 02()21 . 0(62286228CCPXPPXPPXPXP4
23、58. 0)21 . 0(1)22 . 0(XPXP458. 0542. 02 . 01 . 02PX 20EX2 設(shè)一卷磁帶上的缺陷數(shù)服從泊松分設(shè)一卷磁帶上的缺陷數(shù)服從泊松分布布P()其中其中可取可取1.0和和1.5中的一個中的一個,又設(shè)又設(shè)的先驗分布為的先驗分布為 (1.0)=0.4 (1.5)=0.6假如檢查一卷磁帶發(fā)現(xiàn)了假如檢查一卷磁帶發(fā)現(xiàn)了3個缺陷,求個缺陷,求的的后驗分布。后驗分布。21四、貝葉斯推斷(估計)四、貝葉斯推斷(估計)條件方法條件方法由于未知參數(shù)的后驗分布是集三種信息(總體、樣由于未知參數(shù)的后驗分布是集三種信息(總體、樣本和先驗)于一身,它包含了所有可供利用的信息。本和
24、先驗)于一身,它包含了所有可供利用的信息。故有關(guān)的參數(shù)估計和假設(shè)檢驗等統(tǒng)計推斷都按一定故有關(guān)的參數(shù)估計和假設(shè)檢驗等統(tǒng)計推斷都按一定方式從后驗分布提取信息,其提取方法與經(jīng)典統(tǒng)計方式從后驗分布提取信息,其提取方法與經(jīng)典統(tǒng)計推斷相比要簡單明確得多?;诤篁灧植嫉慕y(tǒng)計推推斷相比要簡單明確得多?;诤篁灧植嫉慕y(tǒng)計推斷就意味著只考慮已出現(xiàn)的數(shù)據(jù)(樣本觀察值)而斷就意味著只考慮已出現(xiàn)的數(shù)據(jù)(樣本觀察值)而認(rèn)為未出現(xiàn)的數(shù)據(jù)與推斷無關(guān),這一重要的觀點被認(rèn)為未出現(xiàn)的數(shù)據(jù)與推斷無關(guān),這一重要的觀點被稱為稱為“條件觀點條件觀點”,基于這種觀點提出的統(tǒng)計方法,基于這種觀點提出的統(tǒng)計方法被稱為條件方法。被稱為條件方法。2
25、2例如經(jīng)典統(tǒng)計學(xué)認(rèn)為參數(shù)的無偏估計應(yīng)滿足:例如經(jīng)典統(tǒng)計學(xué)認(rèn)為參數(shù)的無偏估計應(yīng)滿足:其中平均是對樣本空間中所有可能出現(xiàn)的樣本而求的,其中平均是對樣本空間中所有可能出現(xiàn)的樣本而求的,可實際中樣本空間中絕大多數(shù)樣本尚未出現(xiàn)過,而多可實際中樣本空間中絕大多數(shù)樣本尚未出現(xiàn)過,而多數(shù)從未出現(xiàn)的樣本也要參與平均是實際工作者難以理數(shù)從未出現(xiàn)的樣本也要參與平均是實際工作者難以理解的。故在貝葉斯推斷中不用無偏性,而條件方法是解的。故在貝葉斯推斷中不用無偏性,而條件方法是容易被實際工作者理解和接受容易被實際工作者理解和接受的。23估計估計1.1.貝葉斯估計貝葉斯估計 定義定義3.2 使后驗密度使后驗密度 達(dá)到最大的
26、值達(dá)到最大的值 稱為稱為最大后驗估計;后驗分布的中位數(shù)最大后驗估計;后驗分布的中位數(shù) 稱為后驗稱為后驗中位數(shù)估計;后驗分布的期望值中位數(shù)估計;后驗分布的期望值 稱為稱為 的后驗的后驗期望值估計,這三個估計都稱為貝葉斯估計,記期望值估計,這三個估計都稱為貝葉斯估計,記為為 。)( xMDMeEB),(pnB),(Be,),(xnxBenxnxEMD,21例例1 為估計不合格率為估計不合格率 ,今從一批產(chǎn)品中隨機抽取,今從一批產(chǎn)品中隨機抽取n件,其中不合格品數(shù)件,其中不合格品數(shù)X服從服從 ,一般選取,一般選取 為為 的先驗分布,設(shè)的先驗分布,設(shè) 已知,由共軛先驗分布可已知,由共軛先驗分布可知,知,
27、 的后驗分布為的后驗分布為可計算得:可計算得: 24選用貝葉斯假設(shè)選用貝葉斯假設(shè) ,則,則 121,nxnxEMD第一、在二項分布時,第一、在二項分布時, 的最大后驗估計就是經(jīng)典的最大后驗估計就是經(jīng)典統(tǒng)計中的極大似然估計,即統(tǒng)計中的極大似然估計,即 的極大似然估計就是的極大似然估計就是取特定的先驗分布下的貝葉斯估計。取特定的先驗分布下的貝葉斯估計。第二、第二、 的后驗期望值估計的后驗期望值估計 要比最大后驗估要比最大后驗估計計 更合適一些。更合適一些。 EMD第三、第三、 的后驗期望值估計要比最大后驗估計更合適一的后驗期望值估計要比最大后驗估計更合適一些。些。 表表2.1列出四個實驗結(jié)果列出四
28、個實驗結(jié)果,在試驗在試驗1與試驗與試驗2中中,“抽抽檢檢3個產(chǎn)品沒有一件不合格個產(chǎn)品沒有一件不合格”與抽檢與抽檢10個產(chǎn)品沒有一件個產(chǎn)品沒有一件是不合格是不合格”這兩件事在人們心目中留下的印象是不同這兩件事在人們心目中留下的印象是不同的。后者的質(zhì)量要比前者的質(zhì)量更信得過。的。后者的質(zhì)量要比前者的質(zhì)量更信得過。25試驗號試驗號樣本量樣本量n不合格不合格數(shù)數(shù)x13000.200210000.08333310.8004101010.91721nxEnxMD表表3.1 不合格率不合格率 的二種貝葉斯估計的比較的二種貝葉斯估計的比較26在試驗在試驗3和試驗和試驗4中,中,“抽檢抽檢3個產(chǎn)品全部不合格個產(chǎn)
29、品全部不合格”與與抽檢抽檢“10個產(chǎn)品全部不合格個產(chǎn)品全部不合格”也是有差別的。在實也是有差別的。在實際中,人們經(jīng)常選用后驗期望估計作為貝葉斯估計。際中,人們經(jīng)常選用后驗期望估計作為貝葉斯估計。2.2.貝葉斯估計的誤差貝葉斯估計的誤差 設(shè)設(shè) 是是 的一個貝葉斯估計,在樣本給定后,的一個貝葉斯估計,在樣本給定后, 是一是一個數(shù),在綜合各種信息后,個數(shù),在綜合各種信息后, 是按是按 取值,所以取值,所以評價一個貝葉斯估計的誤差的最好而又簡單的方式是評價一個貝葉斯估計的誤差的最好而又簡單的方式是用用對對 的后驗均方差或平方根來度量,定義如下:的后驗均方差或平方根來度量,定義如下:)(x2)()(xE
30、xMSE稱為稱為 的后驗均方差的后驗均方差,而其平方根稱為后驗標(biāo)準(zhǔn)差而其平方根稱為后驗標(biāo)準(zhǔn)差.)(x定義定義3.2 設(shè)參數(shù)設(shè)參數(shù)的后驗分布為的后驗分布為 ,貝葉斯估計為貝葉斯估計為 ,則則 的后驗期望的后驗期望 27當(dāng)當(dāng) 時時,則則,稱為后驗均方差稱為后驗均方差.后驗均方差與后驗方差有如下關(guān)系后驗均方差與后驗方差有如下關(guān)系: )(xEE)()()(2xVarExMSEExE222)()()()()()(EEExxxVarEExMSE這表明這表明,當(dāng)當(dāng) 時時,可使后驗均方差達(dá)到最小可使后驗均方差達(dá)到最小,實際中常取后驗均值作為實際中常取后驗均值作為 的貝葉斯估計值的貝葉斯估計值.E28例例2 設(shè)
31、一批產(chǎn)品的不合格率為設(shè)一批產(chǎn)品的不合格率為 ,檢查是一個一個進行檢查是一個一個進行,直到發(fā)現(xiàn)第一個不合格品為止直到發(fā)現(xiàn)第一個不合格品為止,若若X為發(fā)現(xiàn)第一個不合為發(fā)現(xiàn)第一個不合格品時已檢查的產(chǎn)品數(shù)格品時已檢查的產(chǎn)品數(shù),則則X服從幾何分布服從幾何分布,其分布列為其分布列為, 2 , 1,)1 ()(1xxXPx3 , 2 , 1,31)4(iiP2)41 (431)4, 3(iiiXP設(shè)設(shè) 的先驗分布為的先驗分布為 , 如今只獲得如今只獲得一個樣本觀察值一個樣本觀察值x=3,求求 的最大后驗估計的最大后驗估計,后驗期望后驗期望估計估計,并計算它的誤差并計算它的誤差.故聯(lián)合分布為故聯(lián)合分布為 X=
32、3的無條件概率為的無條件概率為(利用全概率公式利用全概率公式)29485)41(43)42(42)43(4131)3(222XP3 , 2 , 1,)41 (54)3()4, 3()34(2iiiXPiXPXiP故故或或 41 42 43 )34(XiP 209 208 203 可看出可看出, 的最大后驗估計的最大后驗估計 41MD4017)3(XEE160051)4017(8017)()()(222xExExVar的后驗方差為的后驗方差為161)401741 (160051)()()(22ExVarxMSEMD303.區(qū)間估計區(qū)間估計(可信區(qū)間可信區(qū)間) 對于區(qū)間估計問題對于區(qū)間估計問題,貝
33、葉斯方法具有處理方便和含義清貝葉斯方法具有處理方便和含義清晰的優(yōu)點晰的優(yōu)點,而經(jīng)典方法求置信區(qū)間常受到批評而經(jīng)典方法求置信區(qū)間常受到批評.定義定義3.3 參數(shù)參數(shù) 的后驗分布為的后驗分布為 ,對給定的樣對給定的樣本本 和概率和概率 ,若存在這樣的二個統(tǒng)計若存在這樣的二個統(tǒng)計量量 與與 ,使得使得)( xx) 10(1)(xLL)(xUU1)(xPUL則稱區(qū)間則稱區(qū)間 為參數(shù)的可信水平為為參數(shù)的可信水平為 貝葉斯貝葉斯可信區(qū)間可信區(qū)間,或簡稱為或簡稱為 的的 可信區(qū)間可信區(qū)間.而滿足而滿足,UL11311)(xPL的的 稱為稱為 的的 (單側(cè)單側(cè))可信下限可信下限. L11)(xPU滿足滿足 的
34、的 稱稱 為為 的的 (單側(cè)單側(cè))可信上限可信上限.U1這里的可信水平和可信區(qū)間與經(jīng)典統(tǒng)計中的置信水這里的可信水平和可信區(qū)間與經(jīng)典統(tǒng)計中的置信水平與置信區(qū)間雖是同類的概念平與置信區(qū)間雖是同類的概念,但兩者還是有本質(zhì)的但兩者還是有本質(zhì)的差別差別,主要表現(xiàn)在下面二點主要表現(xiàn)在下面二點:1. 在條件方法下在條件方法下,對給定的樣本對給定的樣本 和可信水平和可信水平 ,通過后驗分布可求得具體的可信區(qū)間通過后驗分布可求得具體的可信區(qū)間,譬如譬如, 的可信的可信水平為水平為0.9的可信區(qū)間是的可信區(qū)間是 ,這時我們可以寫出這時我們可以寫出x19 . 0)6 . 25 . 1 (xP6 . 2 , 5 .
35、1 32 2.在經(jīng)典統(tǒng)計中尋求置信區(qū)間有時是困難的在經(jīng)典統(tǒng)計中尋求置信區(qū)間有時是困難的,因為它因為它要設(shè)法構(gòu)造一個樞軸量要設(shè)法構(gòu)造一個樞軸量,使它的分布不含未知參數(shù)使它的分布不含未知參數(shù),這是一項技術(shù)性很強的工作這是一項技術(shù)性很強的工作.相比之下可信區(qū)間只要相比之下可信區(qū)間只要利用后驗分布利用后驗分布,不需要再去尋求另外的分布不需要再去尋求另外的分布, 可信區(qū)可信區(qū)間的尋求要簡單得多間的尋求要簡單得多.例例3 設(shè)設(shè) 是來自正態(tài)總體是來自正態(tài)總體 的一的一個樣本觀察值個樣本觀察值,其中其中 已知已知,若正態(tài)均值的先驗分布若正態(tài)均值的先驗分布取為取為 ,其中其中 與與 已知已知,則可求得則可求得
36、的后的后驗分布為驗分布為 ,由此獲得由此獲得 的的 可信區(qū)間可信區(qū)間nxxx,21),(2N2),(2N),(211N11)(21112111P33EX1 設(shè)隨機變量設(shè)隨機變量X的密度函數(shù)為的密度函數(shù)為(1)假如假如的先驗分布為的先驗分布為U(0,1),求求的后驗分布的后驗分布.(2)假如假如的先驗分布為的先驗分布為求求的后驗分布及后驗期望估計的后驗分布及后驗期望估計10 ,2)(2xxxp10 ,3)(21ln, 1,)1 ()() 1 (2xxxxxxxE21, 1,)1 (1)()2(xxxxE343、2貝葉斯決策方法貝葉斯決策方法決策就是對一件事作決定。它與推斷的差別在于是決策就是對一
37、件事作決定。它與推斷的差別在于是否涉及后果。統(tǒng)計學(xué)家在作推斷時是按統(tǒng)計理論進否涉及后果。統(tǒng)計學(xué)家在作推斷時是按統(tǒng)計理論進行的,但很少考慮結(jié)論在使用后的損失??蓻Q策者行的,但很少考慮結(jié)論在使用后的損失??蓻Q策者在使用推斷時必需與得失聯(lián)系在一起,能帶來利潤在使用推斷時必需與得失聯(lián)系在一起,能帶來利潤的就會使用,使他遭受損失的就不會采用,度量得的就會使用,使他遭受損失的就不會采用,度量得失的尺度就是損失函數(shù)。它是著名的統(tǒng)計學(xué)家失的尺度就是損失函數(shù)。它是著名的統(tǒng)計學(xué)家A.Wald(19021950)在)在40年代引入的一個概念。年代引入的一個概念。從實際歸納出損失函數(shù)是決策的關(guān)鍵。從實際歸納出損失函數(shù)
38、是決策的關(guān)鍵。貝葉斯決策:把損失函數(shù)加入貝葉斯推斷就形成貝葉斯決策:把損失函數(shù)加入貝葉斯推斷就形成貝葉斯決策論,損失函數(shù)被稱為貝葉斯統(tǒng)計中的第貝葉斯決策論,損失函數(shù)被稱為貝葉斯統(tǒng)計中的第四種信息。四種信息。35一、決策的基本概念一、決策的基本概念321,321,aaa 32 0 1 4341 2例例1 設(shè)甲乙二人進行一種游戲,甲手中有三張牌,設(shè)甲乙二人進行一種游戲,甲手中有三張牌,分別標(biāo)以分別標(biāo)以 。乙手中也有三張牌,分別標(biāo)。乙手中也有三張牌,分別標(biāo)以以 。游戲的規(guī)則是雙方各自獨立的出牌,。游戲的規(guī)則是雙方各自獨立的出牌,按下表計算甲的得分與乙的得分。按下表計算甲的得分與乙的得分。321aaa
39、32136這是一個典型的雙人博弈(賭博)問題。不少實際問這是一個典型的雙人博弈(賭博)問題。不少實際問題可歸納為雙人博弈問題。把上例中的乙方改為自然題可歸納為雙人博弈問題。把上例中的乙方改為自然或社會,就形成人與自然(或社會)的博弈問題?;蛏鐣托纬扇伺c自然(或社會)的博弈問題。例例2 農(nóng)作物有兩個品種:產(chǎn)量高但抗旱能力弱的農(nóng)作物有兩個品種:產(chǎn)量高但抗旱能力弱的品種品種 和抗旱能力強但產(chǎn)量低的品種和抗旱能力強但產(chǎn)量低的品種 。在明年雨量不知的情況下,農(nóng)民應(yīng)該選播哪個品在明年雨量不知的情況下,農(nóng)民應(yīng)該選播哪個品種可使每畝平均收益最大?這是人與自然界的博種可使每畝平均收益最大?這是人與自然界的博
40、弈。以明年弈。以明年60mm雨量為界來區(qū)分雨量充足雨量為界來區(qū)分雨量充足 和雨量不充足和雨量不充足 。寫出收益矩陣(單位:元)。寫出收益矩陣(單位:元)121221aa21aa100020010040037例例3 一位投資者有一筆資金要投資,有以下幾個一位投資者有一筆資金要投資,有以下幾個投資供他選擇:投資供他選擇:購買股票,根據(jù)市場情況,可凈賺購買股票,根據(jù)市場情況,可凈賺5000元,元,但可但可 能使他虧損能使他虧損10000元元存入銀行,不管市場情況如何總可凈賺存入銀行,不管市場情況如何總可凈賺1000元元:21aa212121aa這位投資者在金融市場博弈。未來的金融市場也有兩這位投資者
41、在金融市場博弈。未來的金融市場也有兩種情況:看漲種情況:看漲 與看跌與看跌 可寫出投資者的收益矩陣可寫出投資者的收益矩陣50001000-100001000投資者將依據(jù)收益矩陣決投資者將依據(jù)收益矩陣決定他的資金投向何方定他的資金投向何方這種人與自然(或社會)這種人與自然(或社會)的博弈問題稱為決策問題的博弈問題稱為決策問題38二、決策的三要素二、決策的三要素1a aA1 狀態(tài)集狀態(tài)集 ,其中每個元素,其中每個元素 表示自然表示自然界(或社會)可能出現(xiàn)的一種狀態(tài),所有可能狀界(或社會)可能出現(xiàn)的一種狀態(tài),所有可能狀態(tài)的全體組成狀態(tài)集。態(tài)的全體組成狀態(tài)集。2 行動集行動集 ,其中,其中a表示人對自
42、然界可能表示人對自然界可能采取的一個行動采取的一個行動一般行動集有兩個以上的行動可供選擇。若有兩一般行動集有兩個以上的行動可供選擇。若有兩個行動無論對自然界的哪一個狀態(tài)出現(xiàn),個行動無論對自然界的哪一個狀態(tài)出現(xiàn), 總總比比 收益高,則收益高,則 就沒有存在的必要,可把就沒有存在的必要,可把它從行動集中去掉,使留在行動集中的行動總有它從行動集中去掉,使留在行動集中的行動總有可取之處??扇≈?。22aa 393 收益函數(shù)收益函數(shù) ,函數(shù)值,函數(shù)值 表示表示當(dāng)自然界處于狀態(tài)當(dāng)自然界處于狀態(tài) ,而人們選取行動,而人們選取行動 時所時所得到的收益大小。得到的收益大小。收益函數(shù)的值可正可負(fù),若正表示盈利,負(fù)
43、表示虧收益函數(shù)的值可正可負(fù),若正表示盈利,負(fù)表示虧損,單位常用貨幣單位,收益函數(shù)的建立不是件容損,單位常用貨幣單位,收益函數(shù)的建立不是件容易的事,要對所研究的問題有全面的了解才能建立易的事,要對所研究的問題有全面的了解才能建立起來。收益矩陣起來。收益矩陣aQ,ijanmnnmmQQQQQQQQQQ212222111211,ijijQaQ40三、損失函數(shù)三、損失函數(shù)1、從收益到損失、從收益到損失為了統(tǒng)一處理,在決策中常用一個更為有效的概念:損為了統(tǒng)一處理,在決策中常用一個更為有效的概念:損失函數(shù)。在狀態(tài)集和行動集都為有限時用損失矩陣。失函數(shù)。在狀態(tài)集和行動集都為有限時用損失矩陣。這里的損失函數(shù)不
44、是負(fù)的收益,也不是虧損。例如,這里的損失函數(shù)不是負(fù)的收益,也不是虧損。例如,某商店一個月的經(jīng)營收益為某商店一個月的經(jīng)營收益為1000元,即虧元,即虧1000元。元。這是對成本而言。我們不能稱為損失,而稱其為虧損。這是對成本而言。我們不能稱為損失,而稱其為虧損。我們講的損失是指我們講的損失是指“該賺而沒有賺到的錢該賺而沒有賺到的錢”,例如該,例如該店本可以賺店本可以賺2000元,當(dāng)由于某種原因虧了元,當(dāng)由于某種原因虧了1000元,那元,那我們說該店損失了我們說該店損失了3000元。用這種觀點認(rèn)識損失對提元。用這種觀點認(rèn)識損失對提高決策意識是有好處的。高決策意識是有好處的。按上述觀點從收益函數(shù)可以
45、很容易獲得損失函數(shù)。按上述觀點從收益函數(shù)可以很容易獲得損失函數(shù)。41例例4 某公司購進某種貨物可分大批某公司購進某種貨物可分大批、中批和小批中批和小批三種行動,記為三種行動,記為 ,未來市場需求量,未來市場需求量可分為高可分為高、中中、低三種狀態(tài),記為低三種狀態(tài),記為 ,三個行動在不同的市場的利潤如下三個行動在不同的市場的利潤如下這是一個收益矩陣,我們把它改寫為損失矩陣如下:這是一個收益矩陣,我們把它改寫為損失矩陣如下:321,aaa18 . 07 . 22432610Q321,0481023.71.80L321,aaa422、損失函數(shù)、損失函數(shù)aQaQaLAa,max aLaA,構(gòu)成決策問題的三要素:構(gòu)成決策問題的三要素:由收益函數(shù)容易獲得損失函數(shù)由收益函數(shù)容易獲得損失函數(shù)例例5 某公司購進一批貨物投放市場,若購進數(shù)量某公司購進一批貨物投放市場,若購進數(shù)量a低低于市場需求量于市場需求量 ,每噸可賺,每噸可賺15萬元。若購進數(shù)量超萬元。若購進數(shù)量超過市場需求量過市場需求量 ,超過部分每噸反要虧損,超過部分每噸反
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- VB語言難點突破與試題及答案
- 網(wǎng)絡(luò)管理員考試的資源整合試題及答案
- 網(wǎng)絡(luò)管理員實施方案試題及答案總結(jié)
- 行政法在區(qū)域治理中的應(yīng)用探討試題及答案
- 2025年軟件設(shè)計師考試開發(fā)工具選擇指導(dǎo)試題及答案
- 2025年軟考成功重點及試題及答案
- 掌握程序調(diào)試與優(yōu)化技巧試題及答案
- 中標(biāo)合作協(xié)議書幾份
- 面試表現(xiàn)提升的自我訓(xùn)練計劃
- 信息處理技術(shù)員考試開卷題目及答案
- 2.6.2數(shù)列求和公開課一等獎?wù)n件省賽課獲獎?wù)n件
- 河南工業(yè)大學(xué)課件模板
- 公司道德和商業(yè)行為準(zhǔn)則
- DB4417-T 4-2022 地理標(biāo)志產(chǎn)品 陽江豆豉
- 【年產(chǎn)1000噸富硒沙棘果汁工藝生產(chǎn)設(shè)計16000字(論文)】
- 汽車維修合作協(xié)議書范本
- HG-T 4062-2023 波形擋邊輸送帶
- 牛背山巖桑坪生態(tài)旅游客運索道項目對大熊貓國家公園生態(tài)影響評價報告
- 乙狀結(jié)腸癌根治術(shù)手術(shù)
- 提水試驗過程及數(shù)據(jù)處理
- (正式版)SHT 3046-2024 石油化工立式圓筒形鋼制焊接儲罐設(shè)計規(guī)范
評論
0/150
提交評論