第5章參數(shù)區(qū)間估計(jì)_第1頁(yè)
第5章參數(shù)區(qū)間估計(jì)_第2頁(yè)
第5章參數(shù)區(qū)間估計(jì)_第3頁(yè)
第5章參數(shù)區(qū)間估計(jì)_第4頁(yè)
第5章參數(shù)區(qū)間估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試驗(yàn)統(tǒng)計(jì)學(xué)第四章概率論與數(shù)理統(tǒng)計(jì)的基礎(chǔ)知識(shí)本課程使用區(qū)靖祥編著的《試驗(yàn)統(tǒng)計(jì)學(xué)》一書(shū)作為課本。全程為50學(xué)時(shí),占2學(xué)分。第二章常用的試驗(yàn)設(shè)計(jì)第三章試驗(yàn)數(shù)據(jù)的整理第五章參數(shù)區(qū)間估計(jì)第八章常用試驗(yàn)設(shè)計(jì)的資料分析第六章統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)第七章方差分析第九章直線(xiàn)相關(guān)與回歸第一章緒論第十章協(xié)方差分析作區(qū)間估計(jì)時(shí),通常計(jì)算兩尾概率,即區(qū)間外兩邊的概率各為顯著水準(zhǔn)

之半,區(qū)間內(nèi)的概率為置信度1-

。第五章參數(shù)區(qū)間估計(jì)上一章中討論了總體分布和抽樣總體的分布。所謂抽樣總體的分布是指在原總體的分布為已知的情況下,探討一些樣本統(tǒng)計(jì)量的概率分布。利用抽樣分布可以用一定的概率保證計(jì)算出某個(gè)樣本統(tǒng)計(jì)量出現(xiàn)的區(qū)間范圍。在這一章中,我們將這個(gè)問(wèn)題反過(guò)來(lái)討論,即利用樣本數(shù)據(jù),以抽樣總體的分布為理論基礎(chǔ),用一定的概率保證來(lái)計(jì)算出原總體中未知參數(shù)的區(qū)間范圍。這種具有一定概率保證的未知參數(shù)的估計(jì)區(qū)間稱(chēng)為置信區(qū)間,其最小值稱(chēng)為“下限”,最大值稱(chēng)為“上限”。常用的概率為95%和99%,即計(jì)算是95%置信區(qū)間和99%置信區(qū)間。也可按研究目的來(lái)決定具體采用的置信度。第五章參數(shù)區(qū)間估計(jì)第二節(jié)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間第一節(jié)總體平均數(shù)的置信區(qū)間第三節(jié)正態(tài)總體方差的置信區(qū)間

單個(gè)總體平均數(shù)的置信區(qū)間

成對(duì)法資料兩處理觀(guān)察差數(shù)總體均數(shù)的置信區(qū)間

兩個(gè)獨(dú)立樣本所來(lái)自的總體均數(shù)之差的置信區(qū)間

單個(gè)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間

兩個(gè)二項(xiàng)總體百分?jǐn)?shù)之差的置信區(qū)間

單個(gè)總體方差的置信區(qū)間

兩總體方差之比的置信區(qū)間

利用這些分布,可以計(jì)算出總體平均數(shù)

的置信區(qū)間。第一節(jié)總體平均數(shù)的置信區(qū)間

單個(gè)總體平均數(shù)的置信區(qū)間

若已知隨機(jī)變量X,并從X總體中抽取樣本容量

n

的樣本,那么,樣本平均數(shù)將服從總體平均數(shù)為,方差為的正態(tài)分布。

如果原來(lái)的X不服從正態(tài)分布,但已知它的總體平均數(shù)為

x,總體方差為,那么,只要樣本容量n足夠大,樣本平均數(shù)也將服從總體平均數(shù)為,方差為的正態(tài)分布。

若原總體的方差未知,可以用樣本方差代替s2計(jì)算,如果樣本容量為n,則樣本平均數(shù)的標(biāo)準(zhǔn)化離差將服從一個(gè)自由度為df

n-1的

t

分布。⑴正態(tài)分布資料并且總體方差已知或非正態(tài)分布資料大樣本并且方差已知例5.1已知某品種玉米的單株產(chǎn)量X服從正態(tài)分布N(

,

2),其中

未知,

=5g?,F(xiàn)從該總體隨機(jī)抽取一個(gè)大小為n=25的樣本,算得樣本平均數(shù)為35。問(wèn)該品種玉米的單株產(chǎn)量(即總體平均數(shù)

)有95%的可能落在什么區(qū)間?第一節(jié)總體平均數(shù)的置信區(qū)間

單個(gè)總體平均數(shù)的置信區(qū)間因?yàn)閷ⅰ?/p>

=5代入,于是得判定單株平均產(chǎn)量有95%可能落在(33.04g,36.96g)之間。

若要用99%的把握作判斷,要在附表3查得當(dāng)

=0.01時(shí)的u值(2.58),用它代入上式,重新計(jì)算。得:

P

(–2.58u2.58)=P

(32.42

37.58)。顯然,你要說(shuō)話(huà)更有把握,就要把區(qū)間擴(kuò)得寬些。33.043536.9695%

=0.0532.423537.5899%

=0.01再舉一個(gè)非正態(tài)資料的例子⑴正態(tài)分布資料并且總體方差已知或非正態(tài)分布資料大樣本并且方差已知第一節(jié)總體平均數(shù)的置信區(qū)間

單個(gè)總體平均數(shù)的置信區(qū)間將、

=3代入,于是得判定該鄉(xiāng)每戶(hù)平均人數(shù)

有95%可能落在(2.54,5.48)之間。例5.2

某鄉(xiāng)內(nèi)各戶(hù)人口數(shù)X的平均數(shù)

未知,標(biāo)準(zhǔn)差

=3。現(xiàn)從該鄉(xiāng)隨機(jī)調(diào)查36戶(hù),算得樣本平均數(shù)為,問(wèn)該鄉(xiāng)每戶(hù)人家的平均人口數(shù)

有95%可能落在什么區(qū)間?因?yàn)闃颖救萘縩=36>30,所以可以認(rèn)為平均人口數(shù)服從正態(tài)分布,并且,==3/6=0.5。于是有:這里順便介紹一下確定樣本容量的方法⑴正態(tài)分布資料并且總體方差已知或非正態(tài)分布資料大樣本并且方差已知第一節(jié)總體平均數(shù)的置信區(qū)間

單個(gè)總體平均數(shù)的置信區(qū)間例5.3某燈泡廠(chǎng)要抽樣檢驗(yàn)一批燈泡的壽命。根據(jù)以往的經(jīng)驗(yàn),燈泡壽命的標(biāo)準(zhǔn)差為

=6小時(shí)?,F(xiàn)要求調(diào)查的誤差范圍不超過(guò)±2小時(shí),置信度為95%,問(wèn)至少應(yīng)抽多大的樣本?;?。解不等式得如果燈泡的真實(shí)壽命為

,抽得大小為n的樣本,并算得樣本平均數(shù)為,那么,誤差范圍為。為了保證抽樣精確度,采用大樣本公式。即⑵原總體的方差未知第一節(jié)總體平均數(shù)的置信區(qū)間

單個(gè)總體平均數(shù)的置信區(qū)間例5.4從外地引進(jìn)一個(gè)小麥良種,它在本地的千粒重X的平均數(shù)和標(biāo)準(zhǔn)差都不知道。現(xiàn)種植了n=8個(gè)小區(qū),得其千粒重(單位:g)為:34.6、35.9、36.8、32.7、35.1、33.4、37.6、35.6。試求此品種千粒重的95%置信區(qū)間。這時(shí)用樣本方差s2代替總體方差

2,用

t

分布估計(jì)區(qū)間。n=8,當(dāng)df

=8-1=7時(shí),t0.05

=2.3646。將有關(guān)數(shù)值代入后,有:。95%置信區(qū)間為(33.84g,36.58g)。

成對(duì)法資料兩樣本觀(guān)察值差數(shù)總體均數(shù)的置信區(qū)間

如果原來(lái)的

D

服從平均數(shù)為

d,方差為的非正態(tài)分布,那么,只有當(dāng)

n

足夠大時(shí),其樣本平均數(shù)才服從平均數(shù)為,方差為的正態(tài)分布。如果原總體方差未知,可以用樣本方差

代替進(jìn)行計(jì)算,所得的樣本統(tǒng)計(jì)量將服從的

t

分布。

如果原來(lái)的

D

服從平均數(shù)為

d,方差為的正態(tài)分布,那么,大小為

n

的樣本的樣本平均數(shù)將服從平均數(shù)為,方差為的正態(tài)分布。大多數(shù)情況下,總體方差是不知道的。所以

t

分布應(yīng)用較多。下面舉出幾個(gè)這種抽樣分布的例子。

第一節(jié)總體平均數(shù)的置信區(qū)間第一節(jié)總體平均數(shù)的置信區(qū)間成對(duì)法資料兩樣本觀(guān)察值差數(shù)總體均數(shù)的置信區(qū)間例5.5

某藥廠(chǎng)研制出一種減肥藥,將其分發(fā)給20個(gè)肥胖志愿者試用。一療程后,測(cè)量他們的體重減少量,如上表所示。請(qǐng)據(jù)此資料估計(jì)服用了此藥物之后,肥胖患者體重的減少量有95%可能落在什么區(qū)間?當(dāng)df

=20-1=19時(shí),t0.05

=2.093。將有關(guān)數(shù)值代入后,有:。95%置信區(qū)間為(8.474kg,11.526kg)。第一節(jié)總體平均數(shù)的置信區(qū)間成對(duì)法資料兩樣本觀(guān)察值差數(shù)總體均數(shù)的置信區(qū)間例5.6兩種不同配方A和B制造的汽車(chē)輪胎15對(duì),分別安裝在15部汽車(chē)前軸的兩邊,進(jìn)行耐磨性能測(cè)驗(yàn)。經(jīng)五萬(wàn)公里行駛后,測(cè)量磨損的厚度,數(shù)據(jù)如上表所示。試求配方A與B磨損程度差數(shù)平均數(shù)的95%置信區(qū)間。當(dāng)df

=15-1=14時(shí),t0.05

=2.1448。將有關(guān)數(shù)值代入后,有:。95%置信區(qū)間為(-1.1087,0.1487

)。第一節(jié)總體平均數(shù)的置信區(qū)間成對(duì)法資料兩樣本觀(guān)察值差數(shù)總體均數(shù)的置信區(qū)間例5.7

為了比較某種新肥料與原肥料對(duì)棉花產(chǎn)量的影響,選土壤和其他條件都很相似的相鄰小區(qū)配成一對(duì),其中一小區(qū)施新肥料,另一小區(qū)施原肥料作對(duì)照,共設(shè)9次重復(fù)。產(chǎn)量結(jié)果如上表所示。試問(wèn)施用兩種肥料后產(chǎn)量之差的平均數(shù)有95%落在什么區(qū)間?當(dāng)df

=9-1=8時(shí),t0.05

=2.306。將有關(guān)數(shù)值代入后,有:。95%置信區(qū)間為(7.9888,14.4556

)。

兩個(gè)獨(dú)立樣本所來(lái)自的總體均數(shù)之差的置信區(qū)間第一節(jié)總體平均數(shù)的置信區(qū)間如果有兩個(gè)正態(tài)總體X1和X2?,F(xiàn)從第1個(gè)總體抽取一個(gè)大小為n1的樣本并算得樣本平均數(shù);又獨(dú)立地從第2個(gè)總體抽取一個(gè)大小為n2的樣本并算得樣本平均數(shù)。記樣本平均數(shù)之差將服從正態(tài)分布,其中總體平均數(shù)總體方差

可以將d標(biāo)準(zhǔn)化為。

利用此分布,可計(jì)算總體均數(shù)之差

1-

2

的置信區(qū)間。若、未知,但樣本足夠大,可以用和代替它們進(jìn)行計(jì)算,所得的標(biāo)準(zhǔn)化離差仍可視為服從正態(tài)分布。只要是大樣本,不管方差是否已知,都可用正態(tài)分布計(jì)算。

兩個(gè)獨(dú)立樣本所來(lái)自的總體均數(shù)之差的置信區(qū)間第一節(jié)總體平均數(shù)的置信區(qū)間兩個(gè)總體方差和已知的情況(大小樣本都行)例5.8

有兩個(gè)品種的肉雞,品種A八周齡時(shí)的體重X1服從正態(tài)分布,平均數(shù)

1未知,方差為=100g;品種B八周齡時(shí)的體重X2服從正態(tài)分布,平均數(shù)

2未知,方差為=80g?,F(xiàn)分別調(diào)查

n1=10只A雞和

n2=15只B雞,得=900g,=850g。問(wèn)有95%的把握說(shuō),兩品種肉雞的平均體重之差將落在什么區(qū)間?因?yàn)?/p>

將數(shù)據(jù)代入得的95%置信區(qū)間(42.3251,57.6749)。大樣本但總體方差未知,也類(lèi)似處理。這里就不必舉例了。因?yàn)榭梢哉J(rèn)為,于是可以將U式改寫(xiě)為

兩個(gè)獨(dú)立樣本所來(lái)自的總體均數(shù)之差的置信區(qū)間第一節(jié)總體平均數(shù)的置信區(qū)間小樣本、兩個(gè)總體方差和未知但可認(rèn)為再用兩個(gè)樣本方差和的加權(quán)平均值來(lái)代替

2進(jìn)行計(jì)算,于是得到統(tǒng)計(jì)量。此統(tǒng)計(jì)量服從df=n1+n2-2的t分布。

利用此分布,可計(jì)算總體均數(shù)之差

1-

2

的置信區(qū)間。例5.9調(diào)查某農(nóng)場(chǎng)每畝30萬(wàn)苗6塊和每畝35萬(wàn)苗的水稻田7塊,得每畝產(chǎn)量如表5.4所示(單位:kg)。假如兩種密度下水稻產(chǎn)量的變異程度相同,試求兩種密度水稻平均畝產(chǎn)差異的95%置信區(qū)間。n1=6,n2=7,df=n1+n2-2=11,

895,

875,,。因此當(dāng)df

=11時(shí),t

0.05=2.201,于是有此例中我們假設(shè)兩種種植密度下水稻產(chǎn)量的變異程度相等。至于在實(shí)際問(wèn)題如何確認(rèn)兩樣本所來(lái)自的總體方差是否相等的問(wèn)題留待本章第三節(jié)和下章第二節(jié)討論。因?yàn)椋荒芎喜⒎讲?,只好各算各的:用代替,用代替。于是有統(tǒng)計(jì)量它近似服從t分布,但自由度需要矯正,矯正公式為:

其中

兩個(gè)獨(dú)立樣本所來(lái)自的總體均數(shù)之差的置信區(qū)間根據(jù)數(shù)據(jù),可算得:當(dāng)df

=11時(shí),t0.05

=2.201。將有關(guān)數(shù)值代入后,于是有:第一節(jié)總體平均數(shù)的置信區(qū)間小樣本、兩個(gè)總體方差和未知但可認(rèn)為

利用此分布,可計(jì)算總體均數(shù)之差

1-

2

的置信區(qū)間。例5.10測(cè)定玉米品種A的蛋白質(zhì)含量(%)10次,得n1=10,;又測(cè)定另一玉米品種B的蛋白質(zhì)含量(%)8次,得。試求兩種玉米品種蛋白質(zhì)平均含量之差的95%置信區(qū)間。此例中我們假設(shè)兩種蛋白質(zhì)含量的變異程度不等。至于在實(shí)際問(wèn)題如何確認(rèn)兩樣本所來(lái)自的總體方差是否相等的問(wèn)題留待本章第三節(jié)和下章第二節(jié)討論。第二節(jié)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間在上一章討論從二項(xiàng)總體中抽樣時(shí)指出:在n次試驗(yàn)中,某事件出現(xiàn)的次數(shù)X將服從二項(xiàng)分布B

(n,p),并且,。如果改用樣本百分?jǐn)?shù)=X/n來(lái)表示,則,。此外,當(dāng)n很大,p(或q)接近1/2時(shí),=X/n近似服從

N(,),其中,。本節(jié)中,我們以這些抽樣分布為理論基礎(chǔ),通過(guò)樣本資料來(lái)求總體百分?jǐn)?shù)的置信區(qū)間。

單個(gè)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間第二節(jié)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間從原理上說(shuō),應(yīng)該按二項(xiàng)分布的函數(shù)公式計(jì)算例5.11某品種家蠶的卵在某地區(qū)的孵化率p未知?,F(xiàn)抽取大小為n=20的樣本,發(fā)現(xiàn)有18個(gè)卵能正常孵化。試求總體孵化率p的95%置信區(qū)間。課本附表4提供了二項(xiàng)分布百分率的95%和99%置信區(qū)間的上下限。

若記樣本百分率為,則。于是,所要求的置信區(qū)間應(yīng)該在95%的兩邊。即有

因?yàn)槠渲械膒不知道,沒(méi)有辦法直接用代數(shù)方法算出這個(gè)“?”。只能通過(guò)試探的方法,將不同的數(shù)字代入,算出其概率之和,直到所得的概率之和為95%為止。

本例中,n=20,x=18,n-

x=2。從附表4中可以查的其95%置信區(qū)間為(68.3%,93.8%)。

單個(gè)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間第二節(jié)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間當(dāng)n

較大,p

或q不太小時(shí),可用正態(tài)分布近似計(jì)算例5.12在使用某種方法保存花粉一段時(shí)間后,取n=100粒花粉進(jìn)行試驗(yàn),發(fā)現(xiàn)有60??梢哉0l(fā)芽。試求用這種方法保存花粉,其發(fā)芽率的95%置信區(qū)間。用正態(tài)分布近似計(jì)算的結(jié)果與用二項(xiàng)分布計(jì)算所得已經(jīng)相當(dāng)接近。查附表4得:發(fā)芽率p的95%置信區(qū)間為(49.7%,69.7%)。

因?qū)=100、和以及df=99時(shí)的t0.05=1.984代入,得

用正態(tài)近似計(jì)算:因?yàn)閜未知,用代替它來(lái)估計(jì)誤差,這時(shí)統(tǒng)計(jì)量服從自由度df=n-1的t分布,于是有:

單個(gè)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間第二節(jié)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間舉一個(gè)確定樣本容量n的例子。例5.13對(duì)于某種零件,過(guò)去質(zhì)量檢查的經(jīng)驗(yàn)表明合格率在97%左右。現(xiàn)要檢測(cè)一批零件,要求置信度為95%,調(diào)查誤差不允許超過(guò)2%,問(wèn)至少抽取多大的樣本。

為保證試驗(yàn)精確度,采用大樣本公式進(jìn)行計(jì)算,即有或

。要達(dá)到題目的要求,應(yīng)令解不等式得,因此起碼要抽取大小為n=280的樣本。

兩個(gè)二項(xiàng)總體百分?jǐn)?shù)之差的置信區(qū)間第二節(jié)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間如果從一個(gè)參數(shù)為p1的二項(xiàng)總體中抽取一個(gè)容量為n1的樣本,得樣本百分?jǐn)?shù);又獨(dú)立地從另一個(gè)參數(shù)為p2的二項(xiàng)總體中抽取一個(gè)容量為n2的樣本,得樣本百分?jǐn)?shù),則有統(tǒng)計(jì)量服從N

(0,1)。

若果p1、p2未知,在估計(jì)誤差時(shí)用和代替它們計(jì)算,則有統(tǒng)計(jì)量服從df=n1+n2-2的t分布。

當(dāng)樣本容量n較小或p很小時(shí),應(yīng)考慮連續(xù)型矯正。這時(shí),對(duì)于具較大值的x應(yīng)減少0.5,具較小值的x應(yīng)增加0.5。例如,如果,則統(tǒng)計(jì)量變成。

兩個(gè)二項(xiàng)總體百分?jǐn)?shù)之差的置信區(qū)間第二節(jié)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間例5.14

調(diào)查低洼地小麥n1=378株,發(fā)現(xiàn)有銹病x1=355株;調(diào)查高坡地小麥n2=396株,發(fā)現(xiàn)有銹病x2=346株。試求兩種地形中,銹病發(fā)病率之差的95%置信區(qū)間。設(shè)低洼地的發(fā)病率為p1,高坡地的發(fā)病率為p2。算得樣本發(fā)病率,。本例為大樣本,不用連續(xù)性矯正。因?yàn)閐f

=378+396-2=772,t0.05=1.96;于是有于是求得p1-p2的95%置信區(qū)間為(2.49%,10.61%)。

再舉一個(gè)小樣本的例子

兩個(gè)二項(xiàng)總體百分?jǐn)?shù)之差的置信區(qū)間第二節(jié)二項(xiàng)總體百分?jǐn)?shù)的置信區(qū)間例5.15用農(nóng)藥A處理25只美國(guó)蟑螂,結(jié)果死亡15只;用另一種農(nóng)藥B處理24只,結(jié)果死亡9只。試求兩種農(nóng)藥處理美國(guó)蟑螂的死亡率之差的95%置信區(qū)間。于是求得p1-p2的95%置信區(qū)間為(-9.57%,46.4%)。設(shè)用農(nóng)藥A處理的死亡率為p1,用農(nóng)藥B處理時(shí)為p2。算得樣本死亡率,。采用

t

分布和連續(xù)性矯正。因?yàn)閐f

=25+24-2=47,t0.05=2.01;并且因?yàn)?,大?xiàng)的x

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論