數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件_第1頁
數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件_第2頁
數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件_第3頁
數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件_第4頁
數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件_第5頁
已閱讀5頁,還剩203頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)理統(tǒng)計(jì)與隨機(jī)過程第七章主講教師:李學(xué)京北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院數(shù)理統(tǒng)計(jì)與隨機(jī)過程主講教師:李學(xué)京北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院1第七章:參數(shù)估計(jì)數(shù)理統(tǒng)計(jì)的任務(wù):

●總體分布類型的判斷;

●總體分布中未知參數(shù)的推斷(參數(shù)估計(jì)與

假設(shè)檢驗(yàn))。第七章:參數(shù)估計(jì)數(shù)理統(tǒng)計(jì)的任務(wù):2參數(shù)估計(jì)問題的一般提法設(shè)總體

X

的分布函數(shù)為

F(x,θ),其中θ為未知參數(shù)或參數(shù)向量,現(xiàn)從該總體中抽樣,得到樣本X1,X2,…,Xn.

依樣本對參數(shù)θ做出估計(jì),或估計(jì)參數(shù)θ的某個(gè)已知函數(shù)g(θ)。

這類問題稱為參數(shù)估計(jì)。參數(shù)估計(jì)包括:點(diǎn)估計(jì)和區(qū)間估計(jì)。參數(shù)估計(jì)問題的一般提法設(shè)總體X的分布函數(shù)為F(3稱該計(jì)算值為

μ

的一個(gè)點(diǎn)估計(jì)。為估計(jì)參數(shù)μ,需要構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量

T(

X1,X2,…,Xn),一旦當(dāng)有了樣本,就將樣本值代入到該統(tǒng)計(jì)量中,算出一個(gè)值作為

μ

的估計(jì),

4尋求估計(jì)量的方法1.矩估計(jì)法2.極大似然法3.最小二乘法4.貝葉斯方法

…我們僅介紹前面的兩種參數(shù)估計(jì)法。尋求估計(jì)量的方法1.矩估計(jì)法2.極大似然法3.最小二乘5其思想是:用同階、同類的樣本矩來估計(jì)總體矩。矩估計(jì)是基于“替換”思想建立起來的一種參數(shù)估計(jì)方法。最早由英國統(tǒng)計(jì)學(xué)家K.

皮爾遜

提出?!?.1矩估計(jì)其思想是:用同階、同類矩估計(jì)是基于“替換”6矩估計(jì)就是用相應(yīng)的樣本矩去估計(jì)總體矩。矩估計(jì)就是用相應(yīng)的樣本矩去估計(jì)總體矩。7設(shè)總體

X

的分布函數(shù)中含

k

個(gè)未知參數(shù)步驟一:記總體

X

m

階原點(diǎn)矩

E(Xm)為

am

,

m

=

1,2,…,k.am(1,2,…,k),

m=1,2,…,k.

一般地,am(m

=

1,2,

…,K)是總體分布中參數(shù)或參數(shù)向量(1,

2,

…,

k)

的函數(shù)。

故,am(m=1,

2,…,k)應(yīng)記成:設(shè)總體X的分布函數(shù)中含k個(gè)未知參數(shù)步驟一:記總體8步驟二:算出樣本的

m

階原點(diǎn)矩步驟三:令得到關(guān)于

1,2,…,k

的方程組(L≥k)。一般要求方程組(1)中有

k

個(gè)獨(dú)立方程。步驟二:算出樣本的m階原點(diǎn)矩步驟三:令得到關(guān)于9步驟四:解方程組(1),并記其解為這種參數(shù)估計(jì)法稱為參數(shù)的矩估計(jì)法,簡稱矩法。步驟四:解方程組(1),并記其解為這種參數(shù)10解:先求總體的期望例1:設(shè)總體

X

的概率密度為解:先求總體的期望例1:設(shè)總體X的概率密度為11由矩法,令樣本矩總體矩解得為α的矩估計(jì)。注意:要在參數(shù)上邊加上“^”,表示參數(shù)的估計(jì)。它是統(tǒng)計(jì)量。由矩法,令樣本矩總體矩解得為α的矩估計(jì)。注意:要在參數(shù)上邊12解:

先求總體的均值和

2

階原點(diǎn)矩。例2:設(shè)

X1,X2,…Xn是取自總體

X

的簡單樣本,X有概率密度函數(shù)解:先求總體的均值和2階原點(diǎn)矩。例2:設(shè)X1,X213數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件14用樣本矩估計(jì)總體矩得用樣本矩得15列出方程組:例3:設(shè)總體X的均值為,方差為2,求

和2的矩估計(jì)。解:由

列出方程組:例3:設(shè)總體X的均值為,方差為2,求和16故,均值,方差2的矩估計(jì)為求解,得故,均值,方差2的矩估計(jì)為求解,得17如:正態(tài)總體N(

,2)中

和2的矩估計(jì)為如:正態(tài)總體N(,2)中和2的矩估計(jì)為18又如:若總體X~U(a,b),求a,b的矩估計(jì)。解:列出方程組因

又如:若總體X~U(a,b),求a,b的矩估計(jì)。解19解上述方程組,得到

a,b

的矩估計(jì):解上述方程組,得到a,b的矩估計(jì):20

矩估計(jì)的優(yōu)點(diǎn)是:簡單易行,不需要事先知道總體是什么分布。

缺點(diǎn)是:當(dāng)總體的分布類型已知時(shí),未充分利用分布所提供的信息;此外,一般情形下,矩估計(jì)不具有唯一性。矩估計(jì)的優(yōu)點(diǎn)是:簡單易行,不需要事先知道總體21§7.2極大似然估計(jì)極大似然估計(jì)法是在總體的分布類型已知前提下,使用的一種參數(shù)估計(jì)法。該方法首先由德國數(shù)學(xué)家高斯于1821年提出,其后英國統(tǒng)計(jì)學(xué)家費(fèi)歇于1922年發(fā)現(xiàn)了這一方法,研究了方法的一些性質(zhì),并給出了求參數(shù)極大似然估計(jì)一般方法——極大似然估計(jì)原理?!?.2極大似然估計(jì)極大似然估計(jì)法是在22I.極大似然估計(jì)原理設(shè)總體

X

的分布

(連續(xù)型時(shí)為概率密度,離散型時(shí)為概率分布)

為f(x,

θ)

,X1,

X2,

…,Xn是抽自總體

X

的簡單樣本。于是,樣本的聯(lián)合概率函數(shù)(連續(xù)型時(shí)為聯(lián)合概率密度,離散型時(shí)為聯(lián)合概率分布)為被看作固定,但未知的參數(shù)視為變量I.極大似然估計(jì)原理設(shè)總體X的分布23將上式簡記為

L(θ),即稱L(θ)為θ的似然函數(shù)。視為變量視為固定值將上式簡記為L(θ),即稱L(θ)為θ的似然函數(shù)。視為變24假定我們觀測到一組樣本X1,X2,…,

Xn,要去估計(jì)未知參數(shù)θ

。稱為θ的極大似然估計(jì)(MLE)。一種直觀的想法是:哪個(gè)參數(shù)(多個(gè)參數(shù)時(shí)是哪組參數(shù))使得這組樣本出現(xiàn)的可能性(概率)最大,就用那個(gè)參數(shù)(或哪組參數(shù))作為參數(shù)的估計(jì)。這就是極大似然估計(jì)原理。即,如果θ可能變化空間,稱為參數(shù)空間。假定我們觀測到一組樣本X1,X2,…,25(4).在最大值點(diǎn)的表達(dá)式中,代入樣本值,就得參數(shù)θ的極大似然估計(jì)。II.求極大似然估計(jì)(MLE)的一般步驟.由總體分布導(dǎo)出樣本的聯(lián)合概率函數(shù)(連續(xù)型時(shí)為聯(lián)合概率密度,離散型時(shí)為聯(lián)合概率分布);(2).把樣本的聯(lián)合概率函數(shù)中的自變量看成已知常數(shù),參數(shù)θ看成自變量,得到似然函數(shù)L(θ);(3).求似然函數(shù)L(θ

)的最大值點(diǎn)(常常轉(zhuǎn)化為求lnL(θ)的最大值點(diǎn)),即θ的MLE;(4).在最大值點(diǎn)的表達(dá)式中,代入樣本值,II.26兩點(diǎn)說明:●求似然函數(shù)

L(θ)

的最大值點(diǎn),可應(yīng)用微積分中的技巧。由于

ln(x)

x

的增函數(shù),所以

lnL(θ)

L(θ)

在θ的同一點(diǎn)處達(dá)到各自的最大值。假定θ是一實(shí)數(shù),lnL(θ)是θ的一個(gè)可微函數(shù)。通過求解似然方程可以得到θ的MLE。兩點(diǎn)說明:●求似然函數(shù)L(θ)的最大值點(diǎn),可應(yīng)用微積27●用上述方法求參數(shù)的極大似然估計(jì)有時(shí)行不通,這時(shí)要用極大似然原理來求。若θ是向量,上述似然方程需用似然方程組代替。●用上述方法求參數(shù)的極大似然估計(jì)有時(shí)行不通,這時(shí)要用極大28III.下面舉例說明如何求參數(shù)的MLE例1:

設(shè)X1,X2,…,Xn是取自總體X~B(1,p)的一個(gè)樣本,求參數(shù)p

的極大似然估計(jì)。解:似然函數(shù)為III.下面舉例說明如何求參數(shù)的MLE例1:設(shè)X1,X29對數(shù)似然函數(shù)為:對

p

求導(dǎo),并令其等于零,得上式等價(jià)于對數(shù)似然函數(shù)為:對p求導(dǎo),并令其等于零,得上式等價(jià)于30解上述方程,得換成換成解上述方程,得換成換成31例2:求正態(tài)總體

N(,2)參數(shù)

2

的極大似然估計(jì)(注:我們把

2

看作一個(gè)參數(shù))。解:似然函數(shù)為對數(shù)似然函數(shù)為例2:求正態(tài)總體N(,2)參數(shù)和2的32似然方程組為由第一個(gè)方程,得到代入第二方程,得到似然方程組為由第一個(gè)方程,得到代入第二方程,得到33是L(,2)的最大值點(diǎn),即

2

的極大似然估計(jì)。下面驗(yàn)證:似然方程組的唯一解是似然函數(shù)的最大值點(diǎn)。是L(,34例3:設(shè)總體

X

服從泊松分布P(

),求參數(shù)的極大似然估計(jì)。解:由

X

的概率分布函數(shù)為得的似然函數(shù)例3:設(shè)總體X服從泊松分布P(),求參數(shù)的極大35似然方程為對數(shù)似然函數(shù)為其解為似然方程為對數(shù)似然函數(shù)為其解為36換成換成得的極大似然估計(jì)換成換成得的極大似然估計(jì)37例4:設(shè)

X

~U(a,b),求a,b的極大似然估計(jì)。

解:因所以例4:設(shè)X~U(a,b),求a,b的極大似然估38數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件39由上式看到:L(a,b)作為a和b的二元函數(shù)是不連續(xù)的,所以我們不能用似然方程組來求極大似然估計(jì),而必須從極大似然估計(jì)的定義出發(fā),求L(a,b)的最大值。由上式看到:L(a,b)作為a和b的二元函數(shù)是不連續(xù)40為使

L(a,b)

達(dá)到最大,b-a

應(yīng)該盡量地小。但

b不能小于max{x1,x2,…,xn}。否則,L(a,b)=0。類似地,a

不能大于min{x1,x2,…,xn}。因此,a

b

的極大似然估計(jì)為為使L(a,b)達(dá)到最大,b-a應(yīng)該盡量地小41解:似然函數(shù)為例5:設(shè)X1,X2,…,Xn是抽自總體

X

的一個(gè)樣本,X

有如下概率密度函數(shù)其中θ

>0為未知常數(shù)。求θ的極大似然估計(jì)。也可寫成解:似然函數(shù)為例5:設(shè)X1,X2,…,Xn是抽自總體42求導(dǎo)并令其導(dǎo)數(shù)等于零,得解上述方程,得求導(dǎo)并令其導(dǎo)數(shù)等于零,得解上述方程,得43

從前面兩節(jié)的討論中可以看到:●同一參數(shù)可以有幾種不同的估計(jì),這時(shí)就需要判斷采用哪一種估計(jì)為好的問題?!窳硪环矫妫瑢τ谕粋€(gè)參數(shù),用矩法和極大似然法即使得到的是同一個(gè)估計(jì),也存在衡量這個(gè)估計(jì)優(yōu)劣的問題。估計(jì)量的優(yōu)良性準(zhǔn)則就是:評價(jià)一個(gè)估計(jì)量“好”與“壞”的標(biāo)準(zhǔn)?!?.3估計(jì)量的優(yōu)良性準(zhǔn)則從前面兩節(jié)的討論中可以看到:§7.3估計(jì)量的優(yōu)良性準(zhǔn)44

設(shè)總體的分布參數(shù)為θ

,對一切可能的θ成立,則稱為的無偏估計(jì)。7.3.1無偏性對于樣本X1,X2,,Xn的不同取值,取不同的值

)。如果的均值等于θ,即簡記為是θ

的一個(gè)估計(jì)(注意!它是一個(gè)統(tǒng)計(jì)量,是隨機(jī)變量。設(shè)總體的分布參數(shù)為θ,對一切可能的θ成立,則稱為45參數(shù),有時(shí)可能估計(jì)偏高,有時(shí)可能偏低,但是平均來說它等于?!耙磺锌赡艿?/p>

”是指:在參數(shù)估計(jì)問題中,參數(shù)

一切可能的取值。我們之所以要求對一切可能的

都成立,是因?yàn)樵趨?shù)估計(jì)問題中,我們并不知道參數(shù)的真實(shí)取值。自然要求它在參數(shù)的一切可能取值的范圍內(nèi)都成立說明:無偏性的意義是:用估計(jì)量估計(jì)參數(shù),有時(shí)可能估計(jì)偏高,有時(shí)可能偏低,但是平均來說它等于46例1:設(shè)

X1,X2,…,Xn為抽自均值為的總體X的隨機(jī)樣本,考慮

的如下幾個(gè)估計(jì)量:例如:若指的是正態(tài)總體N(

,2)的均值,則其一切可能取值范圍是(-∞,∞)。若指的是方差2,則其一切可能取值范圍是(0,∞)。例1:設(shè)X1,X2,…,Xn為抽自均值為的總47數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件48

定理1:設(shè)總體

X

的均值為,方差為2,X1,X2,…,Xn

為來自總體

X的隨機(jī)樣本,記與分別為樣本均值與樣本方差,即

即樣本均值和樣本方差分別是

總體均值

和總體方差

的無偏估計(jì)。定理1:設(shè)總體X的均值為,方差為2,49證明:因?yàn)?/p>

X1,X2,…,Xn獨(dú)立同分布,且E(Xi

)=μ,所以另一方面,因證明:因?yàn)閄1,X2,…,Xn獨(dú)立同分布,且另一方50于是,有注意到于是,有注意到51前面兩節(jié)中,我們曾用矩法和極大似然法分別求得了正態(tài)總體N(μ

,σ2)中參數(shù)

σ2的估計(jì),均為很顯然,它不是

σ2

的無偏估計(jì)。這正是我們?yōu)槭裁匆獙⑵浞帜感拚秊閚-1,獲得樣本方差S2來估計(jì)

σ2

的理由。前面兩節(jié)中,我們曾用矩法和極大似然法分別求得52例2:求證:樣本標(biāo)準(zhǔn)差S不是總體標(biāo)準(zhǔn)差的無偏估計(jì)。證明:因

E(S2)=2,所以,D(S)+[E(S)]2=

2,由

D(S)>0,知

[E(S)]2=

2-D(S)<

2.所以,E(S)<.故,S

不是

的無偏估計(jì)。例2:求證:樣本標(biāo)準(zhǔn)差S不是總體標(biāo)準(zhǔn)差的無偏估計(jì)。53例3:設(shè)總體

X的

k階原點(diǎn)距為

ak=E(Xk),X1,X2,…,Xn是X的隨機(jī)樣本,樣本

k

階原點(diǎn)距為Ak,則Ak是ak的無偏估計(jì),k=1,2,…。證明:因X1,X2,…,Xn獨(dú)立,且與

X

同分布,故即,Ak是

ak的無偏估計(jì)。這就是人們?yōu)槭裁闯S脴颖?/p>

k

階矩估計(jì)總體

k

階矩的主要原因之一。例3:設(shè)總體X的k階原點(diǎn)距為ak=E(Xk),X1,54例4:設(shè)總體

X

服從參數(shù)為θ

的指數(shù)分布,即其概率密度函數(shù)為證明:設(shè)Z的分布函數(shù)為

FZ(z,θ),先求分布函數(shù),然后導(dǎo)出

Z

的概率密度函數(shù)及

E(nZ)。若

X1,X2,…,Xn是

X

的隨機(jī)樣本,記則

nZ

為θ

的無偏估計(jì)。

例4:設(shè)總體X服從參數(shù)為θ的指數(shù)分布,即其概率密度函數(shù)55因X1,X2,…,Xn獨(dú)立,且與

X

同分布,所以,對任意給定的

Z>0,有于是,E(Z)=θ/n,E(nZ)=θ,即

nZ

為θ

的無偏估計(jì)。

因X1,X2,…,Xn獨(dú)立,且與X同分布,所以,對任56

用估計(jì)量估計(jì),估計(jì)誤差7.3.2均方誤差準(zhǔn)則

是隨機(jī)變量,通常用其均值衡量估計(jì)誤差的大小。要注意:為了防止求均值時(shí)正、負(fù)誤差相互抵消,我們先將其平方后再求均值,并稱其為均方誤差,記成,即用估計(jì)量57

哪個(gè)估計(jì)的均方誤差小,就稱哪個(gè)估計(jì)比較優(yōu),這種判定估計(jì)優(yōu)劣的準(zhǔn)則為“均方誤差準(zhǔn)則”。注意:均方誤差可分解成兩部分:證明:哪個(gè)估計(jì)58上式表明,均方誤差由兩部分構(gòu)成:第一部分是估計(jì)量的方差,第二部分是估計(jì)量的偏差的平方和。

注意:如果一個(gè)估計(jì)量是無偏的,則第二部分是零,則有:

如果兩個(gè)估計(jì)都是無偏估計(jì),這時(shí)哪個(gè)估計(jì)的方差小,哪個(gè)估計(jì)就較優(yōu)。這種判定估計(jì)量優(yōu)劣的準(zhǔn)則稱為方差準(zhǔn)則。上式表明,均方誤差由兩部分構(gòu)成:第一部分是估計(jì)量的方59例5:設(shè)

X1,X2,…,Xn為抽自均值為

的總體,考慮

的如下兩個(gè)估計(jì)的優(yōu)劣:

我們看到:顯然兩個(gè)估計(jì)都是的無偏估計(jì)。計(jì)算二者的方差:例5:設(shè)X1,X2,…,Xn為抽自均值為的總60這表明:當(dāng)用樣本均值去估計(jì)總體均值時(shí),使用全樣本總比不使用全樣本要好。

這表明:當(dāng)用樣本均值去估計(jì)總體均值時(shí),使用全樣本總比不使用全61前面討論了參數(shù)的點(diǎn)估計(jì)。點(diǎn)估計(jì)就是利用樣本計(jì)算出的值

(即實(shí)軸上點(diǎn))來估計(jì)未知參數(shù)?!?.4區(qū)間估計(jì)其優(yōu)點(diǎn)是:可直地告訴人們“未知參數(shù)大致是多少”;缺點(diǎn)是:并未反映出估計(jì)的誤差范圍(精度)。故,在使用上還有不盡如人意之處。而區(qū)間估計(jì)正好彌補(bǔ)了點(diǎn)估計(jì)的這一不足之處。前面討論了參數(shù)的點(diǎn)估計(jì)。點(diǎn)估計(jì)就是利用樣本計(jì)62

例如:在估計(jì)正態(tài)總體均值

μ

的問題中,若根據(jù)一組實(shí)際樣本,得到

μ

的極大似然估計(jì)為

10.12。一個(gè)可以想到的估計(jì)辦法是:給出一個(gè)區(qū)間,并告訴人們該區(qū)間包含未知參數(shù)

μ

的可靠度(也稱置信系數(shù))。實(shí)際上,μ的真值可能大于10.12,也可能小于10.12。例如:在估計(jì)正態(tài)總體均值μ的問題中,63也就是說,給出一個(gè)區(qū)間,使我們能以一定的可靠度相信區(qū)間包含參數(shù)μ

。這里的“可靠度”是用概率來度量的,稱為置信系數(shù),常用表示也就是說,給出一個(gè)區(qū)間,使我們能以一定的可靠64置信系數(shù)的大小常根據(jù)實(shí)際需要來確定,通常取0.95或0.99,即

根據(jù)實(shí)際樣本,由給定的置信系數(shù),可求出一個(gè)盡可能短的區(qū)間,使置信系數(shù)的大小常根據(jù)實(shí)際需要來確定,通常取065

為確定置信區(qū)間,我們先回顧前面給出的隨機(jī)變量的上α分位點(diǎn)的概念。為確定置信區(qū)間,我們先回顧前面給出的隨機(jī)變量66數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件67數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件68書末附有χ2分布、t分布、F分布的上側(cè)分位數(shù)表可供使用。需要注意的地方在教材上均有說明?,F(xiàn)在回到尋找置信區(qū)間問題上來。書末附有χ2分布、t分布、F分布的上側(cè)分位69區(qū)間估計(jì)的定義定義1:區(qū)間估計(jì)的定義定義1:70實(shí)際應(yīng)用上,一般取

α=0.05或

0.01。實(shí)際應(yīng)用上,一般取α=0.05或0.01。71§7.5正態(tài)總體參數(shù)的區(qū)間估計(jì)根據(jù)基本定理(見定理6.4.1),知7.5.1單正態(tài)總體參數(shù)的區(qū)間估計(jì)§7.5正態(tài)總體參數(shù)的區(qū)間估計(jì)根據(jù)基本定理72數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件73也可簡記為于是,μ的置信區(qū)間為也可簡記為于是,μ的置信區(qū)間為74例1:

某廠生產(chǎn)的零件長度

X

服從

N(

,0.04),現(xiàn)從該廠生產(chǎn)的零件中隨機(jī)抽取6個(gè),長度測量值如下(單位:毫米):

14.6,15.l,14.9,14.8,15.2,15.1.求:μ的置信系數(shù)為0.95的區(qū)間估計(jì)。解:n=6,=0.05,z/2=z0.025=1.96,2=0.22

.所求置信區(qū)間為例1:某廠生產(chǎn)的零件長度X服從N(,0.0475當(dāng)方差未知時(shí),取●

μ

的區(qū)間估計(jì)當(dāng)方差未知時(shí),取●μ的區(qū)間估計(jì)76于是,μ的置信系數(shù)為1-α

的區(qū)間估計(jì)為也可簡記為于是,μ的置信系數(shù)為1-α的區(qū)間估計(jì)為也可簡記為77●

σ2

的區(qū)間估計(jì)●σ2的區(qū)間估計(jì)78例2:為估計(jì)一物體的重量μ,將其稱量10次,得到重量的測量值(單位:千克)如下:10.l,10.0,9.8,10.5,9.7,l0.l,9.9,10.2,10.3,9.9.設(shè)它們服從正態(tài)分布

N(,2)。求的置信系數(shù)為0.95的置信區(qū)間。例2:為估計(jì)一物體的重量μ,將其稱量10次,得到重量的測量值79解:

n=10,=0.05,t9(0.025)=2.2622,解:n=10,=0.05,t9(0.080例3(續(xù)例2):

求2的置信系數(shù)為0.95的置信區(qū)間。解:n=10,

=0.05,S2=0.0583,查附表得,

于是,例3(續(xù)例2):求2的置信系數(shù)為0.95的置信區(qū)間。解:817.5.2兩個(gè)正態(tài)總體的情況

在實(shí)際應(yīng)用中,我們經(jīng)常會遇到兩個(gè)正態(tài)總體均值差和方差之比的區(qū)間估計(jì)問題。于是,評價(jià)新技術(shù)的效果問題,就歸結(jié)為研究兩個(gè)正態(tài)總體均值之差

1-2

與與方差之比12/22的問題。例如:考察一項(xiàng)新技術(shù)對提高產(chǎn)品某項(xiàng)質(zhì)量指標(biāo)的作用,將實(shí)施新技術(shù)前產(chǎn)品質(zhì)量指標(biāo)看成正態(tài)總體

N(1,

12),實(shí)施新技術(shù)后產(chǎn)品質(zhì)量指標(biāo)看成正態(tài)總體

N(2,22)。7.5.2兩個(gè)正態(tài)總體的情況在實(shí)際應(yīng)用中,我們經(jīng)82

定理1:設(shè)

X1,X2,···,Xm是抽自正態(tài)總體X

的簡單樣本,X~N(1,12),樣本均值與樣本方差分別為Y1,Y2,···,

Yn是抽自正態(tài)總體

Y

的簡單樣本,Y

~N(2,22),樣本均值與樣本方差分別為I.兩個(gè)正態(tài)總體均值差的區(qū)間估計(jì)定理1:設(shè)X1,X2,···,Xm是83當(dāng)兩樣本相互獨(dú)立時(shí),有當(dāng)兩樣本相互獨(dú)立時(shí),有84證明:1).由基本定理(見定理6.4.1),知

故,(4)式成立;且二者相互獨(dú)立。證明:1).由基本定理(見定理6.4.1),知85且(6)式與(7)式中的隨機(jī)變量相互獨(dú)立。由t分布的定義,有且(6)式與(7)式中的隨機(jī)變量相互獨(dú)立。由t86N(0,1)χ

2m+n-2換形式~t

m+n-2

.

分母互換N(0,1)χ2m+n-2換形式~tm+n-2.87利用該定理,我們可以得到μ1-μ2

的置信系數(shù)為

1-α的置信區(qū)間。利用該定理,我們可以得到μ1-μ2的置信88例4

(比較棉花品種的優(yōu)劣):假設(shè)用甲、乙兩種棉花紡出的棉紗強(qiáng)度分別為

X~N(1,2.182)和Y~N(2,1.762)。試驗(yàn)者從這兩種棉紗中分別抽取樣本X1,X2,…,X200和Y1,Y2,…,Y100,樣本均值分別為:求1-2的置信系數(shù)為

0.95

的區(qū)間估計(jì)。

解:

1=2.18,2=1.76,m=200,n=100,=0.05,由(8)式,得

1-

2

的置信系數(shù)為

1-的置信區(qū)間為例4(比較棉花品種的優(yōu)劣):假設(shè)用甲、乙兩種棉花紡出的棉紗89例5:某公司利用兩條自動(dòng)化流水線灌裝礦泉水。設(shè)這兩條流水線所裝礦泉水的體積(單位:毫升)X~N(1,2)和

Y~N(2,2)?,F(xiàn)從生產(chǎn)線上分別抽取

X1,X2,…,X12

Y1,Y2,…,

Y17,樣本均值與樣本方差分別為:求

1-

2的置信系數(shù)為0.95的區(qū)間估計(jì)。解:m=12,n=17,=0.05,再由其他已知條件及(10)式,可算出例5:某公司利用兩條自動(dòng)化流水線灌裝礦泉水。設(shè)這兩條流水線所90查

t

分布表,得tm+n-2(α/2)=

t27(0.025)=2.05.再由(9)式,得

1-

2

的置信系數(shù)為

1-的置信區(qū)間

在這兩個(gè)例子中,

1-

2

的置信區(qū)間都包含了零,也就是說:

1可能大于

2,也可能小于

2。這時(shí)我們認(rèn)為二者沒有顯著差異。

查t分布表,得tm+n-2(α/2)=t2791II.兩個(gè)正態(tài)總體方差比的區(qū)間估計(jì)

定理2:設(shè)

X1,X2,···,Xm是抽自正態(tài)總體X

的簡單樣本,X~N(1,12),樣本均值與樣本方差分別為Y1,Y2,···,

Yn是抽自正態(tài)總體

Y

的簡單樣本,Y

~N(2,22),樣本均值與樣本方差為II.兩個(gè)正態(tài)總體方差比的區(qū)間估計(jì)定理2:92由定理2,易得到兩個(gè)正態(tài)總體方差之比的置信系數(shù)為1-α置信區(qū)間為:由定理2,易得到兩個(gè)正態(tài)總體方差之比93例5:研究機(jī)器A和機(jī)器B生產(chǎn)的鋼管的內(nèi)徑,隨機(jī)抽取A生產(chǎn)的鋼管18根,測得樣本方差0.34

(mm2);隨機(jī)抽取B生產(chǎn)的鋼管13根,測得樣本方差為0.29(mm2)。設(shè)兩樣本相互獨(dú)立,且機(jī)器A和機(jī)器B生產(chǎn)的鋼管的內(nèi)徑分別服從正態(tài)分布N(1,2)與

N(2,2)。求的置信水平為0.90的置信區(qū)間。

解:

由m=18,n=13,S12=0.34,S22=0.29,

=0.10及(11)式,得

的置信系數(shù)為

0.90

的置信區(qū)間為例5:研究機(jī)器A和機(jī)器B生產(chǎn)的鋼管的內(nèi)徑,隨機(jī)抽取A生產(chǎn)的94§7.6非正態(tài)總體的區(qū)間估計(jì)

前面兩節(jié)討論了正態(tài)總體分布參數(shù)的區(qū)間估計(jì)。但是在實(shí)際應(yīng)用中,我們有時(shí)不能判斷手中的數(shù)據(jù)是否服從正態(tài)分布,或者有足夠理由認(rèn)為它們不服從正態(tài)分布。這時(shí),只要樣本大小

n

比較大,總體均值

μ

的置信區(qū)間仍可用正態(tài)總體情形的公式或σ2已知時(shí)σ2未知時(shí)§7.6非正態(tài)總體的區(qū)間估計(jì)前面兩節(jié)討95所不同的是:這時(shí)的置信區(qū)間是近似的。

這是求一般總體均值的一種簡單有效的方法,其理論依據(jù)是中心極限定理,它要求樣本大小

n

比較大。因此,這個(gè)方法稱為大樣本方法。設(shè)總體均值為μ,方差為σ2,

X1,X2,…,Xn為來自總體的樣本。因?yàn)檫@些樣本獨(dú)立同分布的,根據(jù)中心極限定理,對充分大的n,下式近似成立所不同的是:這時(shí)的置信區(qū)間是近似的。這是求96因而,近似地有

于是,μ

的置信系數(shù)約為1-α的置信區(qū)間為當(dāng)σ2未知時(shí),用σ2的某個(gè)估計(jì),如

S2來代替,得到因而,近似地有于是,μ的置信系數(shù)約為1-α的置信區(qū)間97只要

n

很大,(2)式所提供的置信區(qū)間在應(yīng)用上是令人滿意的。

那么,n

究竟多大才算很大呢?

顯然,對于相同的

n

,(2)式所給出的置信區(qū)間的近似程度隨總體分布與正態(tài)分布的接近程度而變化,因此,理論上很難給出n很大的一個(gè)界限。但許多應(yīng)用實(shí)踐表明:當(dāng)n≥30時(shí),近似程度是可以接受的;當(dāng)n≥50時(shí),近似程度是很好的。只要n很大,(2)式所提供的置信區(qū)間在應(yīng)用上是令人滿意的98例1:某公司欲估計(jì)自己生產(chǎn)的電池壽命?,F(xiàn)從其產(chǎn)品中隨機(jī)抽取

50

只電池做壽命試驗(yàn)。這些電池壽命的平均值為

2.261

(單位:100小時(shí)),標(biāo)準(zhǔn)差

S=1.935。求該公司生產(chǎn)的電池平均壽命的置信系數(shù)為

95%

的置信區(qū)間。

解:查正態(tài)分布表,得zα/2=z0.025=1.96,由公式(2),得電池平均壽命的置信系數(shù)為

95%

的置信區(qū)間為例1:某公司欲估計(jì)自己生產(chǎn)的電池壽命?,F(xiàn)從其產(chǎn)品中隨機(jī)抽取99設(shè)事件

A

在一次試驗(yàn)中發(fā)生的概率為

p,現(xiàn)在做

n

次試驗(yàn),以Yn記事件

A

發(fā)生的次數(shù),則

Yn~B(n,p)。依中心極限定理,對充分大的

n,近似地有

7.6.1二項(xiàng)分布

(3)式是(1)式的特殊情形。設(shè)事件A在一次試驗(yàn)中發(fā)生的概率為p,100

(4)式就是二項(xiàng)分布參數(shù)

p

的置信系數(shù)約為1-α

的置信區(qū)間。例2:商品檢驗(yàn)部門隨機(jī)抽查了某公司生產(chǎn)的產(chǎn)品100件,發(fā)現(xiàn)其中合格產(chǎn)品為84件,試求該產(chǎn)品合格率的置信系數(shù)為0.95的置信區(qū)間。解:n=100,Yn=84,α

=0.05,zα/2=1.96,將這些結(jié)果代入到(4)式,得p的置信系數(shù)為0.95的近似置信區(qū)間為[0.77,0.91]。(4)式就是二項(xiàng)分布參數(shù)p的置信系數(shù)約為101例3:在環(huán)境保護(hù)問題中,飲水質(zhì)量研究占有重要地位,其中一項(xiàng)工作是檢查飲用水中是否存在某種類型的微生物。假設(shè)在隨機(jī)抽取的100份一定容積的水樣品中有20份含有這種類型的微生物。試求同樣容積的這種水含有這種微生物的概率

p

的置信系數(shù)為0.90的置信區(qū)間。解:n=100,Yn=20,α=0.10,zα/2=1.645,將這些結(jié)果代入到(4)式,得

p

的置信系數(shù)為0.90的近似置信區(qū)間為[0.134,0.226]。例3:在環(huán)境保護(hù)問題中,飲水質(zhì)量研究占有重要地位,其中1027.6.2泊松分布

設(shè)X1,X2,…,Xn為抽自具有泊松分布P(λ

)的總體的樣本,因?yàn)?/p>

E(X)=D(X)=

λ

,應(yīng)用(2)式,并用7.6.2泊松分布設(shè)X1,X2103例4:公共汽車站在一單位時(shí)間內(nèi)(如半小時(shí),或1小時(shí),或一天等)到達(dá)的乘客數(shù)服從泊松分布P(

λ

),對不同的車站,不同的僅是參數(shù)

λ

的取值不同。現(xiàn)對某城市某公共汽車站進(jìn)行100個(gè)單位時(shí)間的調(diào)查。這里單位時(shí)間是20分鐘。計(jì)算得到每

20

分鐘內(nèi)來到該車站的乘客數(shù)平均值為

15.2

人。試求參數(shù)

λ

的置信系數(shù)為95%的置信區(qū)間。

解:

n=100,α=0.05,zα

/2=1.96,將這些結(jié)果代入到(5)式,得λ

的置信系數(shù)為0.95的近似置信區(qū)間為[14.44,15.96]。例4:公共汽車站在一單位時(shí)間內(nèi)(如半小時(shí),或1小時(shí),或一104數(shù)理統(tǒng)計(jì)與隨機(jī)過程第七章主講教師:李學(xué)京北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院數(shù)理統(tǒng)計(jì)與隨機(jī)過程主講教師:李學(xué)京北京工業(yè)大學(xué)應(yīng)用數(shù)理學(xué)院105第七章:參數(shù)估計(jì)數(shù)理統(tǒng)計(jì)的任務(wù):

●總體分布類型的判斷;

●總體分布中未知參數(shù)的推斷(參數(shù)估計(jì)與

假設(shè)檢驗(yàn))。第七章:參數(shù)估計(jì)數(shù)理統(tǒng)計(jì)的任務(wù):106參數(shù)估計(jì)問題的一般提法設(shè)總體

X

的分布函數(shù)為

F(x,θ),其中θ為未知參數(shù)或參數(shù)向量,現(xiàn)從該總體中抽樣,得到樣本X1,X2,…,Xn.

依樣本對參數(shù)θ做出估計(jì),或估計(jì)參數(shù)θ的某個(gè)已知函數(shù)g(θ)。

這類問題稱為參數(shù)估計(jì)。參數(shù)估計(jì)包括:點(diǎn)估計(jì)和區(qū)間估計(jì)。參數(shù)估計(jì)問題的一般提法設(shè)總體X的分布函數(shù)為F(107稱該計(jì)算值為

μ

的一個(gè)點(diǎn)估計(jì)。為估計(jì)參數(shù)μ,需要構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量

T(

X1,X2,…,Xn),一旦當(dāng)有了樣本,就將樣本值代入到該統(tǒng)計(jì)量中,算出一個(gè)值作為

μ

的估計(jì),

108尋求估計(jì)量的方法1.矩估計(jì)法2.極大似然法3.最小二乘法4.貝葉斯方法

…我們僅介紹前面的兩種參數(shù)估計(jì)法。尋求估計(jì)量的方法1.矩估計(jì)法2.極大似然法3.最小二乘109其思想是:用同階、同類的樣本矩來估計(jì)總體矩。矩估計(jì)是基于“替換”思想建立起來的一種參數(shù)估計(jì)方法。最早由英國統(tǒng)計(jì)學(xué)家K.

皮爾遜

提出?!?.1矩估計(jì)其思想是:用同階、同類矩估計(jì)是基于“替換”110矩估計(jì)就是用相應(yīng)的樣本矩去估計(jì)總體矩。矩估計(jì)就是用相應(yīng)的樣本矩去估計(jì)總體矩。111設(shè)總體

X

的分布函數(shù)中含

k

個(gè)未知參數(shù)步驟一:記總體

X

m

階原點(diǎn)矩

E(Xm)為

am

,

m

=

1,2,…,k.am(1,2,…,k),

m=1,2,…,k.

一般地,am(m

=

1,2,

…,K)是總體分布中參數(shù)或參數(shù)向量(1,

2,

…,

k)

的函數(shù)。

故,am(m=1,

2,…,k)應(yīng)記成:設(shè)總體X的分布函數(shù)中含k個(gè)未知參數(shù)步驟一:記總體112步驟二:算出樣本的

m

階原點(diǎn)矩步驟三:令得到關(guān)于

1,2,…,k

的方程組(L≥k)。一般要求方程組(1)中有

k

個(gè)獨(dú)立方程。步驟二:算出樣本的m階原點(diǎn)矩步驟三:令得到關(guān)于113步驟四:解方程組(1),并記其解為這種參數(shù)估計(jì)法稱為參數(shù)的矩估計(jì)法,簡稱矩法。步驟四:解方程組(1),并記其解為這種參數(shù)114解:先求總體的期望例1:設(shè)總體

X

的概率密度為解:先求總體的期望例1:設(shè)總體X的概率密度為115由矩法,令樣本矩總體矩解得為α的矩估計(jì)。注意:要在參數(shù)上邊加上“^”,表示參數(shù)的估計(jì)。它是統(tǒng)計(jì)量。由矩法,令樣本矩總體矩解得為α的矩估計(jì)。注意:要在參數(shù)上邊116解:

先求總體的均值和

2

階原點(diǎn)矩。例2:設(shè)

X1,X2,…Xn是取自總體

X

的簡單樣本,X有概率密度函數(shù)解:先求總體的均值和2階原點(diǎn)矩。例2:設(shè)X1,X2117數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件118用樣本矩估計(jì)總體矩得用樣本矩得119列出方程組:例3:設(shè)總體X的均值為,方差為2,求

和2的矩估計(jì)。解:由

列出方程組:例3:設(shè)總體X的均值為,方差為2,求和120故,均值,方差2的矩估計(jì)為求解,得故,均值,方差2的矩估計(jì)為求解,得121如:正態(tài)總體N(

,2)中

和2的矩估計(jì)為如:正態(tài)總體N(,2)中和2的矩估計(jì)為122又如:若總體X~U(a,b),求a,b的矩估計(jì)。解:列出方程組因

又如:若總體X~U(a,b),求a,b的矩估計(jì)。解123解上述方程組,得到

a,b

的矩估計(jì):解上述方程組,得到a,b的矩估計(jì):124

矩估計(jì)的優(yōu)點(diǎn)是:簡單易行,不需要事先知道總體是什么分布。

缺點(diǎn)是:當(dāng)總體的分布類型已知時(shí),未充分利用分布所提供的信息;此外,一般情形下,矩估計(jì)不具有唯一性。矩估計(jì)的優(yōu)點(diǎn)是:簡單易行,不需要事先知道總體125§7.2極大似然估計(jì)極大似然估計(jì)法是在總體的分布類型已知前提下,使用的一種參數(shù)估計(jì)法。該方法首先由德國數(shù)學(xué)家高斯于1821年提出,其后英國統(tǒng)計(jì)學(xué)家費(fèi)歇于1922年發(fā)現(xiàn)了這一方法,研究了方法的一些性質(zhì),并給出了求參數(shù)極大似然估計(jì)一般方法——極大似然估計(jì)原理?!?.2極大似然估計(jì)極大似然估計(jì)法是在126I.極大似然估計(jì)原理設(shè)總體

X

的分布

(連續(xù)型時(shí)為概率密度,離散型時(shí)為概率分布)

為f(x,

θ)

,X1,

X2,

…,Xn是抽自總體

X

的簡單樣本。于是,樣本的聯(lián)合概率函數(shù)(連續(xù)型時(shí)為聯(lián)合概率密度,離散型時(shí)為聯(lián)合概率分布)為被看作固定,但未知的參數(shù)視為變量I.極大似然估計(jì)原理設(shè)總體X的分布127將上式簡記為

L(θ),即稱L(θ)為θ的似然函數(shù)。視為變量視為固定值將上式簡記為L(θ),即稱L(θ)為θ的似然函數(shù)。視為變128假定我們觀測到一組樣本X1,X2,…,

Xn,要去估計(jì)未知參數(shù)θ

。稱為θ的極大似然估計(jì)(MLE)。一種直觀的想法是:哪個(gè)參數(shù)(多個(gè)參數(shù)時(shí)是哪組參數(shù))使得這組樣本出現(xiàn)的可能性(概率)最大,就用那個(gè)參數(shù)(或哪組參數(shù))作為參數(shù)的估計(jì)。這就是極大似然估計(jì)原理。即,如果θ可能變化空間,稱為參數(shù)空間。假定我們觀測到一組樣本X1,X2,…,129(4).在最大值點(diǎn)的表達(dá)式中,代入樣本值,就得參數(shù)θ的極大似然估計(jì)。II.求極大似然估計(jì)(MLE)的一般步驟.由總體分布導(dǎo)出樣本的聯(lián)合概率函數(shù)(連續(xù)型時(shí)為聯(lián)合概率密度,離散型時(shí)為聯(lián)合概率分布);(2).把樣本的聯(lián)合概率函數(shù)中的自變量看成已知常數(shù),參數(shù)θ看成自變量,得到似然函數(shù)L(θ);(3).求似然函數(shù)L(θ

)的最大值點(diǎn)(常常轉(zhuǎn)化為求lnL(θ)的最大值點(diǎn)),即θ的MLE;(4).在最大值點(diǎn)的表達(dá)式中,代入樣本值,II.130兩點(diǎn)說明:●求似然函數(shù)

L(θ)

的最大值點(diǎn),可應(yīng)用微積分中的技巧。由于

ln(x)

x

的增函數(shù),所以

lnL(θ)

L(θ)

在θ的同一點(diǎn)處達(dá)到各自的最大值。假定θ是一實(shí)數(shù),lnL(θ)是θ的一個(gè)可微函數(shù)。通過求解似然方程可以得到θ的MLE。兩點(diǎn)說明:●求似然函數(shù)L(θ)的最大值點(diǎn),可應(yīng)用微積131●用上述方法求參數(shù)的極大似然估計(jì)有時(shí)行不通,這時(shí)要用極大似然原理來求。若θ是向量,上述似然方程需用似然方程組代替?!裼蒙鲜龇椒ㄇ髤?shù)的極大似然估計(jì)有時(shí)行不通,這時(shí)要用極大132III.下面舉例說明如何求參數(shù)的MLE例1:

設(shè)X1,X2,…,Xn是取自總體X~B(1,p)的一個(gè)樣本,求參數(shù)p

的極大似然估計(jì)。解:似然函數(shù)為III.下面舉例說明如何求參數(shù)的MLE例1:設(shè)X1,X133對數(shù)似然函數(shù)為:對

p

求導(dǎo),并令其等于零,得上式等價(jià)于對數(shù)似然函數(shù)為:對p求導(dǎo),并令其等于零,得上式等價(jià)于134解上述方程,得換成換成解上述方程,得換成換成135例2:求正態(tài)總體

N(,2)參數(shù)

2

的極大似然估計(jì)(注:我們把

2

看作一個(gè)參數(shù))。解:似然函數(shù)為對數(shù)似然函數(shù)為例2:求正態(tài)總體N(,2)參數(shù)和2的136似然方程組為由第一個(gè)方程,得到代入第二方程,得到似然方程組為由第一個(gè)方程,得到代入第二方程,得到137是L(,2)的最大值點(diǎn),即

2

的極大似然估計(jì)。下面驗(yàn)證:似然方程組的唯一解是似然函數(shù)的最大值點(diǎn)。是L(,138例3:設(shè)總體

X

服從泊松分布P(

),求參數(shù)的極大似然估計(jì)。解:由

X

的概率分布函數(shù)為得的似然函數(shù)例3:設(shè)總體X服從泊松分布P(),求參數(shù)的極大139似然方程為對數(shù)似然函數(shù)為其解為似然方程為對數(shù)似然函數(shù)為其解為140換成換成得的極大似然估計(jì)換成換成得的極大似然估計(jì)141例4:設(shè)

X

~U(a,b),求a,b的極大似然估計(jì)。

解:因所以例4:設(shè)X~U(a,b),求a,b的極大似然估142數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件143由上式看到:L(a,b)作為a和b的二元函數(shù)是不連續(xù)的,所以我們不能用似然方程組來求極大似然估計(jì),而必須從極大似然估計(jì)的定義出發(fā),求L(a,b)的最大值。由上式看到:L(a,b)作為a和b的二元函數(shù)是不連續(xù)144為使

L(a,b)

達(dá)到最大,b-a

應(yīng)該盡量地小。但

b不能小于max{x1,x2,…,xn}。否則,L(a,b)=0。類似地,a

不能大于min{x1,x2,…,xn}。因此,a

b

的極大似然估計(jì)為為使L(a,b)達(dá)到最大,b-a應(yīng)該盡量地小145解:似然函數(shù)為例5:設(shè)X1,X2,…,Xn是抽自總體

X

的一個(gè)樣本,X

有如下概率密度函數(shù)其中θ

>0為未知常數(shù)。求θ的極大似然估計(jì)。也可寫成解:似然函數(shù)為例5:設(shè)X1,X2,…,Xn是抽自總體146求導(dǎo)并令其導(dǎo)數(shù)等于零,得解上述方程,得求導(dǎo)并令其導(dǎo)數(shù)等于零,得解上述方程,得147

從前面兩節(jié)的討論中可以看到:●同一參數(shù)可以有幾種不同的估計(jì),這時(shí)就需要判斷采用哪一種估計(jì)為好的問題?!窳硪环矫妫瑢τ谕粋€(gè)參數(shù),用矩法和極大似然法即使得到的是同一個(gè)估計(jì),也存在衡量這個(gè)估計(jì)優(yōu)劣的問題。估計(jì)量的優(yōu)良性準(zhǔn)則就是:評價(jià)一個(gè)估計(jì)量“好”與“壞”的標(biāo)準(zhǔn)?!?.3估計(jì)量的優(yōu)良性準(zhǔn)則從前面兩節(jié)的討論中可以看到:§7.3估計(jì)量的優(yōu)良性準(zhǔn)148

設(shè)總體的分布參數(shù)為θ

,對一切可能的θ成立,則稱為的無偏估計(jì)。7.3.1無偏性對于樣本X1,X2,,Xn的不同取值,取不同的值

)。如果的均值等于θ,即簡記為是θ

的一個(gè)估計(jì)(注意!它是一個(gè)統(tǒng)計(jì)量,是隨機(jī)變量。設(shè)總體的分布參數(shù)為θ,對一切可能的θ成立,則稱為149參數(shù),有時(shí)可能估計(jì)偏高,有時(shí)可能偏低,但是平均來說它等于?!耙磺锌赡艿?/p>

”是指:在參數(shù)估計(jì)問題中,參數(shù)

一切可能的取值。我們之所以要求對一切可能的

都成立,是因?yàn)樵趨?shù)估計(jì)問題中,我們并不知道參數(shù)的真實(shí)取值。自然要求它在參數(shù)的一切可能取值的范圍內(nèi)都成立說明:無偏性的意義是:用估計(jì)量估計(jì)參數(shù),有時(shí)可能估計(jì)偏高,有時(shí)可能偏低,但是平均來說它等于150例1:設(shè)

X1,X2,…,Xn為抽自均值為的總體X的隨機(jī)樣本,考慮

的如下幾個(gè)估計(jì)量:例如:若指的是正態(tài)總體N(

,2)的均值,則其一切可能取值范圍是(-∞,∞)。若指的是方差2,則其一切可能取值范圍是(0,∞)。例1:設(shè)X1,X2,…,Xn為抽自均值為的總151數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件152

定理1:設(shè)總體

X

的均值為,方差為2,X1,X2,…,Xn

為來自總體

X的隨機(jī)樣本,記與分別為樣本均值與樣本方差,即

即樣本均值和樣本方差分別是

總體均值

和總體方差

的無偏估計(jì)。定理1:設(shè)總體X的均值為,方差為2,153證明:因?yàn)?/p>

X1,X2,…,Xn獨(dú)立同分布,且E(Xi

)=μ,所以另一方面,因證明:因?yàn)閄1,X2,…,Xn獨(dú)立同分布,且另一方154于是,有注意到于是,有注意到155前面兩節(jié)中,我們曾用矩法和極大似然法分別求得了正態(tài)總體N(μ

,σ2)中參數(shù)

σ2的估計(jì),均為很顯然,它不是

σ2

的無偏估計(jì)。這正是我們?yōu)槭裁匆獙⑵浞帜感拚秊閚-1,獲得樣本方差S2來估計(jì)

σ2

的理由。前面兩節(jié)中,我們曾用矩法和極大似然法分別求得156例2:求證:樣本標(biāo)準(zhǔn)差S不是總體標(biāo)準(zhǔn)差的無偏估計(jì)。證明:因

E(S2)=2,所以,D(S)+[E(S)]2=

2,由

D(S)>0,知

[E(S)]2=

2-D(S)<

2.所以,E(S)<.故,S

不是

的無偏估計(jì)。例2:求證:樣本標(biāo)準(zhǔn)差S不是總體標(biāo)準(zhǔn)差的無偏估計(jì)。157例3:設(shè)總體

X的

k階原點(diǎn)距為

ak=E(Xk),X1,X2,…,Xn是X的隨機(jī)樣本,樣本

k

階原點(diǎn)距為Ak,則Ak是ak的無偏估計(jì),k=1,2,…。證明:因X1,X2,…,Xn獨(dú)立,且與

X

同分布,故即,Ak是

ak的無偏估計(jì)。這就是人們?yōu)槭裁闯S脴颖?/p>

k

階矩估計(jì)總體

k

階矩的主要原因之一。例3:設(shè)總體X的k階原點(diǎn)距為ak=E(Xk),X1,158例4:設(shè)總體

X

服從參數(shù)為θ

的指數(shù)分布,即其概率密度函數(shù)為證明:設(shè)Z的分布函數(shù)為

FZ(z,θ),先求分布函數(shù),然后導(dǎo)出

Z

的概率密度函數(shù)及

E(nZ)。若

X1,X2,…,Xn是

X

的隨機(jī)樣本,記則

nZ

為θ

的無偏估計(jì)。

例4:設(shè)總體X服從參數(shù)為θ的指數(shù)分布,即其概率密度函數(shù)159因X1,X2,…,Xn獨(dú)立,且與

X

同分布,所以,對任意給定的

Z>0,有于是,E(Z)=θ/n,E(nZ)=θ,即

nZ

為θ

的無偏估計(jì)。

因X1,X2,…,Xn獨(dú)立,且與X同分布,所以,對任160

用估計(jì)量估計(jì),估計(jì)誤差7.3.2均方誤差準(zhǔn)則

是隨機(jī)變量,通常用其均值衡量估計(jì)誤差的大小。要注意:為了防止求均值時(shí)正、負(fù)誤差相互抵消,我們先將其平方后再求均值,并稱其為均方誤差,記成,即用估計(jì)量161

哪個(gè)估計(jì)的均方誤差小,就稱哪個(gè)估計(jì)比較優(yōu),這種判定估計(jì)優(yōu)劣的準(zhǔn)則為“均方誤差準(zhǔn)則”。注意:均方誤差可分解成兩部分:證明:哪個(gè)估計(jì)162上式表明,均方誤差由兩部分構(gòu)成:第一部分是估計(jì)量的方差,第二部分是估計(jì)量的偏差的平方和。

注意:如果一個(gè)估計(jì)量是無偏的,則第二部分是零,則有:

如果兩個(gè)估計(jì)都是無偏估計(jì),這時(shí)哪個(gè)估計(jì)的方差小,哪個(gè)估計(jì)就較優(yōu)。這種判定估計(jì)量優(yōu)劣的準(zhǔn)則稱為方差準(zhǔn)則。上式表明,均方誤差由兩部分構(gòu)成:第一部分是估計(jì)量的方163例5:設(shè)

X1,X2,…,Xn為抽自均值為

的總體,考慮

的如下兩個(gè)估計(jì)的優(yōu)劣:

我們看到:顯然兩個(gè)估計(jì)都是的無偏估計(jì)。計(jì)算二者的方差:例5:設(shè)X1,X2,…,Xn為抽自均值為的總164這表明:當(dāng)用樣本均值去估計(jì)總體均值時(shí),使用全樣本總比不使用全樣本要好。

這表明:當(dāng)用樣本均值去估計(jì)總體均值時(shí),使用全樣本總比不使用全165前面討論了參數(shù)的點(diǎn)估計(jì)。點(diǎn)估計(jì)就是利用樣本計(jì)算出的值

(即實(shí)軸上點(diǎn))來估計(jì)未知參數(shù)。§7.4區(qū)間估計(jì)其優(yōu)點(diǎn)是:可直地告訴人們“未知參數(shù)大致是多少”;缺點(diǎn)是:并未反映出估計(jì)的誤差范圍(精度)。故,在使用上還有不盡如人意之處。而區(qū)間估計(jì)正好彌補(bǔ)了點(diǎn)估計(jì)的這一不足之處。前面討論了參數(shù)的點(diǎn)估計(jì)。點(diǎn)估計(jì)就是利用樣本計(jì)166

例如:在估計(jì)正態(tài)總體均值

μ

的問題中,若根據(jù)一組實(shí)際樣本,得到

μ

的極大似然估計(jì)為

10.12。一個(gè)可以想到的估計(jì)辦法是:給出一個(gè)區(qū)間,并告訴人們該區(qū)間包含未知參數(shù)

μ

的可靠度(也稱置信系數(shù))。實(shí)際上,μ的真值可能大于10.12,也可能小于10.12。例如:在估計(jì)正態(tài)總體均值μ的問題中,167也就是說,給出一個(gè)區(qū)間,使我們能以一定的可靠度相信區(qū)間包含參數(shù)μ

。這里的“可靠度”是用概率來度量的,稱為置信系數(shù),常用表示也就是說,給出一個(gè)區(qū)間,使我們能以一定的可靠168置信系數(shù)的大小常根據(jù)實(shí)際需要來確定,通常取0.95或0.99,即

根據(jù)實(shí)際樣本,由給定的置信系數(shù),可求出一個(gè)盡可能短的區(qū)間,使置信系數(shù)的大小常根據(jù)實(shí)際需要來確定,通常取0169

為確定置信區(qū)間,我們先回顧前面給出的隨機(jī)變量的上α分位點(diǎn)的概念。為確定置信區(qū)間,我們先回顧前面給出的隨機(jī)變量170數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件171數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件172書末附有χ2分布、t分布、F分布的上側(cè)分位數(shù)表可供使用。需要注意的地方在教材上均有說明?,F(xiàn)在回到尋找置信區(qū)間問題上來。書末附有χ2分布、t分布、F分布的上側(cè)分位173區(qū)間估計(jì)的定義定義1:區(qū)間估計(jì)的定義定義1:174實(shí)際應(yīng)用上,一般取

α=0.05或

0.01。實(shí)際應(yīng)用上,一般取α=0.05或0.01。175§7.5正態(tài)總體參數(shù)的區(qū)間估計(jì)根據(jù)基本定理(見定理6.4.1),知7.5.1單正態(tài)總體參數(shù)的區(qū)間估計(jì)§7.5正態(tài)總體參數(shù)的區(qū)間估計(jì)根據(jù)基本定理176數(shù)理統(tǒng)計(jì)與隨機(jī)過程ch7課件177也可簡記為于是,μ的置信區(qū)間為也可簡記為于是,μ的置信區(qū)間為178例1:

某廠生產(chǎn)的零件長度

X

服從

N(

,0.04),現(xiàn)從該廠生產(chǎn)的零件中隨機(jī)抽取6個(gè),長度測量值如下(單位:毫米):

14.6,15.l,14.9,14.8,15.2,15.1.求:μ的置信系數(shù)為0.95的區(qū)間估計(jì)。解:n=6,=0.05,z/2=z0.025=1.96,2=0.22

.所求置信區(qū)間為例1:某廠生產(chǎn)的零件長度X服從N(,0.04179當(dāng)方差未知時(shí),取●

μ

的區(qū)間估計(jì)當(dāng)方差未知時(shí),取●μ的區(qū)間估計(jì)180于是,μ的置信系數(shù)為1-α

的區(qū)間估計(jì)為也可簡記為于是,μ的置信系數(shù)為1-α的區(qū)間估計(jì)為也可簡記為181●

σ2

的區(qū)間估計(jì)●σ2的區(qū)間估計(jì)182例2:為估計(jì)一物體的重量μ,將其稱量10次,得到重量的測量值(單位:千克)如下:10.l,10.0,9.8,10.5,9.7,l0.l,9.9,10.2,10.3,9.9.設(shè)它們服從正態(tài)分布

N(,2)。求的置信系數(shù)為0.95的置信區(qū)間。例2:為估計(jì)一物體的重量μ,將其稱量10次,得到重量的測量值183解:

n=10,=0.05,t9(0.025)=2.2622,解:n=10,=0.05,t9(0.0184例3(續(xù)例2):

求2的置信系數(shù)為0.95的置信區(qū)間。解:n=10,

=0.05,S2=0.0583,查附表得,

于是,例3(續(xù)例2):求2的置信系數(shù)為0.95的置信區(qū)間。解:1857.5.2兩個(gè)正態(tài)總體的情況

在實(shí)際應(yīng)用中,我們經(jīng)常會遇到兩個(gè)正態(tài)總體均值差和方差之比的區(qū)間估計(jì)問題。于是,評價(jià)新技術(shù)的效果問題,就歸結(jié)為研究兩個(gè)正態(tài)總體均值之差

1-2

與與方差之比12/22的問題。例如:考察一項(xiàng)新技術(shù)對提高產(chǎn)品某項(xiàng)質(zhì)量指標(biāo)的作用,將實(shí)施新技術(shù)前產(chǎn)品質(zhì)量指標(biāo)看成正態(tài)總體

N(1,

12),實(shí)施新技術(shù)后產(chǎn)品質(zhì)量指標(biāo)看成正態(tài)總體

N(2,22)。7.5.2兩個(gè)正態(tài)總體的情況在實(shí)際應(yīng)用中,我們經(jīng)186

定理1:設(shè)

X1,X2,···,Xm是抽自正態(tài)總體X

的簡單樣本,X~N(1,12),樣本均值與樣本方差分別為Y1,Y2,···,

Yn是抽自正態(tài)總體

Y

的簡單樣本,Y

~N(2,22),樣本均值與樣本方差分別為I.兩個(gè)正態(tài)總體均值差的區(qū)間估計(jì)定理1:設(shè)X1,X2,···,Xm是187當(dāng)兩樣本相互獨(dú)立時(shí),有當(dāng)兩樣本相互獨(dú)立時(shí),有188證明:1).由基本定理(見定理6.4.1),知

故,(4)式成立;且二者相互獨(dú)立。證明:1).由基本定理(見定理6.4.1),知189且(6)式與(7)式中的隨機(jī)變量相互獨(dú)立。由t分布的定義,有且(6)式與(7)式中的隨機(jī)變量相互獨(dú)立。由t190N(0,1)χ

2m+n-2換形式~t

m+n-2

.

分母互換N(0,1)χ2m+n-2換形式~tm+n-2.191利用該定理,我們可以得到μ1-μ2

的置信系數(shù)為

1-α的置信區(qū)間。利用該定理,我們可以得到μ1-μ2的置信192例4

(比較棉花品種的優(yōu)劣):假設(shè)用甲、乙兩種棉花紡出的棉紗強(qiáng)度分別為

X~N(1,2.182)和Y~N(2,1.762)。試驗(yàn)者從這兩種棉紗中分別抽取樣本X1,X2,…,X200和Y1,Y2,…,Y100,樣本均值分別為:求1-2的置信系數(shù)為

0.95

的區(qū)間估計(jì)。

解:

1=2.18,2=1.76,m=200,n=100,=0.05,由(8)式,得

1-

2

的置信系數(shù)為

1-的置信區(qū)間為例4(比較棉花品種的優(yōu)劣):假設(shè)用甲、乙兩種棉花紡出的棉紗193例5:某公司利用兩條自動(dòng)化流水線灌裝礦泉水。設(shè)這兩條流水線所裝礦泉水的體積(單位:毫升)X~N(1,2)和

Y~N(2,2)。現(xiàn)從生產(chǎn)線上分別抽取

X1,X2,…,X12

Y1,Y2,…,

Y17,樣本均值與樣本方差分別為:求

1-

2的置信系數(shù)為0.95的區(qū)間估計(jì)。解:m=12,n=17,=0.05,再由其他已知條件及(10)式,可算出例5:某公司利用兩條自動(dòng)化流水線灌裝礦泉水。設(shè)這兩條流水線所194查

t

分布表,得tm+n-2(α/2)=

t27(0.025

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論