《統(tǒng)計學》第3章參數(shù)估計_第1頁
《統(tǒng)計學》第3章參數(shù)估計_第2頁
《統(tǒng)計學》第3章參數(shù)估計_第3頁
《統(tǒng)計學》第3章參數(shù)估計_第4頁
《統(tǒng)計學》第3章參數(shù)估計_第5頁
已閱讀5頁,還剩143頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1第第5章章 參數(shù)估計參數(shù)估計3. 1 參數(shù)估計概述參數(shù)估計概述 參數(shù)估計是統(tǒng)計推斷的基本方法之一。我們把刻劃總體X的某些特征的常數(shù)稱為參數(shù),最常用的參數(shù)是總體X的數(shù)學期望和方差。假如總體XN( ),則X的分布是由參數(shù)和2確定的,其中,=E(X),2 =D(X)。 2 , 在實際問題中,總體X的參數(shù)是未知的,例如紗廠細紗機上的斷頭次數(shù)XP(),如果求每只紗綻在某一時間間隔內斷頭的次數(shù)為K的概率,就需要先確定參數(shù),才能求出所求的概率。又如,燈泡廠生產(chǎn)的燈泡,由經(jīng)驗知其壽命XN( ),但是由于生產(chǎn)過程中各種隨機因素的影響,生產(chǎn)出來的燈泡的壽命是不一致的,為了保證燈泡的質量,必須進行抽樣檢查,根據(jù)樣

2、本所提供的信息,對總體X的分布做出估計,也即對參數(shù),2做出估計。這類問題稱為參數(shù)估計問題。 2 , 參數(shù)估計問題,就是要從樣本出發(fā)構造一些統(tǒng)計量作為總體某些參數(shù)的估計量,當取得一個樣本值時,就以相應的統(tǒng)計量的值作為總體參數(shù)的估計值。例如,常以統(tǒng)計量 作為總體數(shù)學期望的估計量。當要估計某批燈泡的平均壽命時,就從該批燈泡中隨機地抽取若干個,分別測出其壽命,以這些測量數(shù)據(jù)的平均值作為該批燈泡的平均壽命的估計值。 X 設總體X的分布函數(shù)的類型已知,但是其中有一個或多個參數(shù)未知,設X1,X2,X3,Xn為總體X的容量為n的樣本。參數(shù)估計就是討論如何由樣本X1,X2,X3,Xn提供的信息對未知參數(shù)作出估計

3、,以及討論如何建立一些準則對所作出的估計進行評價 。 一般是建立適當?shù)慕y(tǒng)計量 (X1,X2,X3,Xn),當樣本觀察值為x1,x2,x3,xn時,如果以 (x1,x2,x3,xn)作為總體分布中未知參數(shù)的估計值,這樣的估計方法叫做點估計,如果總體分布函數(shù)中有t個未知參數(shù),則要建立t個估計量作為t個未知參數(shù)的估計量。 參數(shù)估計的形式分為兩類:點估計和區(qū)間估計。由估計量的觀察值作為未知參數(shù)的估計值,這種作法稱為點估計或定值估計。而有時并不要求對參數(shù)作定值估計,只要求估計出未知參數(shù)的一個所在范圍,并指出參數(shù)被包含在該范圍的概率,這種方法稱為區(qū)間估計,進行參數(shù)估計并不一定要預先知道總體的分布類型。有時

4、,雖然未知總體的分布類型,但仍可對總體的某些數(shù)字特征作出估計。 3. 2 參數(shù)的點估計 點估計方法很多,本節(jié)介紹最常見的矩估計法和極大似然法。一、矩估計法 由大數(shù)定律可知,樣本分布函數(shù)依概率收斂于總體分布函數(shù),樣本均值依概率收斂于總體均值,我們自然會想到,是否能用有關的樣本矩來估計總體分布的相應矩呢?統(tǒng)計實踐表明,這個方法是可取的,這種用樣本矩來估計總體分布參數(shù)的方法稱為矩估計法,通常,用樣本 均值來估計總體的均值,用樣本方差S2來估計總體的方差。 X【例3.1】試用矩估計法對總體 XN( )的參數(shù),2作出估計。 2 ,解: 因E(X)=,D(X)=2設X1,X2,Xn為X的一個樣本,其 樣本

5、均值為,樣本方差為S2。 令E(X)= ,D(X)=S2,即得的估計量為 , 。 X22SX【例5.2】設X1,X2,Xn是取自總 體X的樣本,已知X的概率密度為: 其他 ,010 ,),(1XXXf) 1(試用矩估計法估計總體參數(shù) 。解: 由于 樣本均值為 ,令E(X)= ,得: , 從而總體 參數(shù)的矩估計為 ,其 中 。 1),()(dxXxfXEX 1XX1niiXnX11XX【例5.3】X1,X2,Xn為總體XB(N,P)的樣本,其中N,P為未知參數(shù),試用矩估計法估計參數(shù)N及P。 解: E(X)=NP D(X)=NP(1-P) 樣本均值與方差分別為 ,S2。 令 E(X)= D(X)=

6、S2 XX即 解得N、P的矩估計量為 ,其 中 , 。 2)1(SPNPXNPXSPSXXN2221niiXnX11niiXXnS122)(11二、極大似然估計法 先考察兩個簡單的例子。 【例3.4】某同學與一位男獵人一起外出打獵,只見一只野雞在前方竄過,只聽一聲槍響,野雞被他們兩人中某一位一槍命中,試推測這一發(fā)命中的子彈是誰打的,答案是簡單的,既然只發(fā)一槍且命中,而男獵人的命中的概率一般大于這位同學命中的概率,因此可以認為這一槍是男獵人射中的。 【例3.5】假定在一個箱子里放著黑、白兩種球共4只,且知道這兩種球的數(shù)目之比為13,但不知道究竟哪一種顏色的球多。 設黑球所占的比例為P,由上述假定

7、推知P僅可能取1/4和3/4這兩個值,現(xiàn)在采用有放回抽樣的方法,從箱子中隨機地抽取三個球,觀察到球的顏色為黑、白、黑,你會對箱子中的黑球數(shù)作出什么推斷呢?即你認為P的值是1/4,還是3/4? 直觀上覺得P=3/4(即箱子中黑球數(shù)為3)更可信,因為當P=1/4時抽到這樣一個具體樣本的概率為1/41/4 3/43/4 1/4=3/641/4=3/64,當P=3/4時,抽到這樣一個具體樣本的概率為3/43/4 1/41/4 3/4=9/643/4=9/64,由于9/643/649/643/64,因此在觀察到上述樣本中的三個球的顏色之后,覺得P=3/4更可信,即你傾向于認為箱子中放有三個黑球,這里體現(xiàn)

8、了極大似然法的基本思想。 現(xiàn)在我們來闡明極大似然法的基本原理。 設總體X的概率密度為 ,它只含一個未知參數(shù) (若X是離散型 ,表示概率 ),X1,X2,X3,Xn是取自X的樣本,x1, x2, x3, ,xn為樣本觀察值。X1,X2,X3,,Xn的聯(lián)合密度等于 ,顯然,對于樣本的 一組觀察值x1, x2, x3, ,xn,),(xf),(xfxXPniixf1),(它是 的函數(shù),記作 并稱為似然函數(shù) ),()(321nxxxxLLLniixf1),( 當 已知時,似然函數(shù)描述了樣本取得樣本觀察值x1, x2, x3,xn的可能性。同樣,當一組樣本觀察值取定時(即抽樣完成時),要問它最大可能取自

9、什么樣的總體(即總體的參數(shù) 應等于什么時的可能性最大),也要從似然函數(shù) 的極大化中求出相應的 值來,這個值就是 的一個估計值。于是,我們可以給出極大似然估計的定義。 )(LL 定義3. 1 設總體的概率密度為 ,其中 是未知參數(shù),x1,x2,xn為X的一組樣本觀察值。若能求得觀察值的某個函數(shù) ,使得似然函數(shù)取極大值,即 ,則稱 為 的一個極大似然估計值,其相應的統(tǒng)計量 ,稱為參數(shù) 的極大似然估計量。 ),(xf),(321nxxxx),(max),(2121nnxxxLxxxL),(21nxxx 由定義3.1可知,求總體參數(shù) 的極大似然估計值 的問題,就是求似然函數(shù) L( )的極大值問題。在L

10、( )可微時,要使L( )取極大值 必須滿足(3.1)從上式可解得 的極大似然估計值。 0ddL 由于lnL( )與L( )有相同的極值點,而且,求lnL( )的極值點更為容易,所以常用下式 (3. 2)來代替(3.1)式。方程(3.1)或(3.2)都稱為似然方程。 0)(lnLdd當似然函數(shù)包含多個參數(shù)時,即: ),(21nLLninixf121),( 若L關于各參數(shù)的偏導數(shù)存在,則 j的極大似然估計 一般可由方程組: 或 解得。上面方程組稱 為似然方程組。 ),(21njjxxx), 2 , 1(0),(21njLnj0),(ln21njL注意 上面的討論中,我們沒有提到似函數(shù) 取極大值的

11、充分條件,對于具體的函數(shù)可作驗證。 )(L 【例3.6】設總體X服從參數(shù)為 的泊松分布,求參數(shù) 的極大似然估計量。 解 設X1,X2,X3,Xn是來自X的樣本, 則 niixnnniixXeXeLi11) !(!)( niiXxnnL1) !(lnln)(ln 令 的極大似然估計量為 。 其中 為樣本均值。 0)(lnXnnLXX【例3.7】設總體XN ,其中 及 是未知參數(shù),如果取得樣本觀測值為x1, x2, ,xn,求參數(shù) 及 的極大似然估計值。 ),(2解: 似然函數(shù)為: nixieL12)(2221niixne122)(2121niixnnL122)(21ln2ln2ln 對 及 求偏

12、導數(shù),并讓它們等于零,得: niiniinxLxL123120)(1ln0)(1ln解此方程組,即得 及 的極大似然估計值為: xxnnii11Sxxnnii12)(1 【例3.8】設總體X服從均勻分布 ,求參數(shù) 與 的極大似然估計量 ,21U12解 設X1,X2,Xn是X的樣本,則 其它 , 0, 2 , 1,)(1),(211221nixLin)ln(),(ln1221 nL從而有 0),(ln12121nL0),ln(12221n顯然由此方程組解不出1與2,現(xiàn)利用定義求1與2的極大似然估計量,因為: 其它 , 0,)(1),(22111221nnxxxL其它 , 0,)(12)()2()

13、1(112nnxxx又 ,即 的極大似然估計量分別為 。nnnxx)(1)(1) 1 ()(12),(),()() 1 (21nxxLL21,)() 1 (,nxx在對總體參數(shù)做出估計時并非所有的估計量都是優(yōu)良的,從而產(chǎn)生了評價估計量是否優(yōu)良的標準。對于點估計量來說,一個好的估計量有如下三個標準: 1無偏性 如果樣本統(tǒng)計量的期望值等于該統(tǒng)計量所估計的總體參數(shù),則這個估計量叫做無偏估計量。這是一個好的估計量的一個重要條件。用樣本平均數(shù)作為總體平均數(shù)的點估計量,就符合這一要求。無偏性也就是沒有系統(tǒng)的偏差,它是從平均意義講的,即如果這種估計方法重復進行,則從估計量所獲得的平均數(shù)等于總體參數(shù)。顯然,如

14、果說一個估計量是無偏的,并不是保證用于單獨一次估計中沒有隨機性誤差,只是沒有系統(tǒng)性的偏差而已。若以代表被估計的總體參數(shù),代表的無偏估計量,則用數(shù)學式表示為: )(E 我們知道,總體參數(shù)中最重要的一個參數(shù)是總體平均數(shù) ,樣本平均數(shù) 是它的一個無偏估計量,即 。另外,樣本方差也是總體方差的無偏估計量。 X)(XE2一致性 當樣本容量n增大時,如果估計量越來越 接近總體參數(shù)的真值時,就稱這個估計量為一致估計量。估計量的一致性是從極限意義上講的,它適用于大樣本的情況。如果一個估計量是一致估計量,那么,采用大樣本就更加可靠。當然,在樣本容量n增大時,估計量的一致性會增強,但調查所需的人力、物力也相應增加

15、。 3有效性 有效性的概念是指估計量的離散程度。如果兩個估計量都是無偏的,其中方差較小的(對給定的樣本容量而言)就可認為相對來說是更有效的。嚴格地說,如果 和 是 的兩個無偏估計量,它們的相對有效性按下述比率決定:其中, 是較小的方差。 12212212以上這三個標準并不是孤立的,而應該聯(lián)系起來看。如果一個估計量滿足這三個標準,這個估計量就是一個好的估計量。數(shù)理統(tǒng)計已證明,用樣本平均數(shù)來估計總體平均數(shù)和用樣本比率來估計總體比率時,它們是無偏的,一致的和有效的。3. 3 參數(shù)的區(qū)間估計參數(shù)的區(qū)間估計一、區(qū)間估計的概念 對未知參數(shù)來說,我們除了關心它的點估計外,往往還希望估計出它的一個范圍,以及這

16、個范圍覆蓋參數(shù)真值的可靠程度,這種范圍通常用區(qū)間的形式給出,這種區(qū)間就叫參數(shù)的置信區(qū)間。 定義3. 2 設總體分布含有一個未知參數(shù), 若由樣本確定的兩個統(tǒng)計量(X1,X2,X3,Xn)與 (X1,X2,X3,Xn),對于給定數(shù)值 ,滿足 (3. 3) )10(1),(),(2121nnXXXXXXP 則稱隨機區(qū)間 為的一個 雙側置信區(qū)間, 稱為雙側置信下(上)限,1- 稱為置信水平或置信度。 ),()%1(100)((3.3)式表示置信區(qū)間 包含未知參數(shù) 真值的概率是1- ,若反復抽樣多次(每次樣本容量相等),每組樣本觀察值確定一個區(qū)間 ,每個這樣的區(qū)間或者包含 的真值,或者不包含 的真值,按

17、貝努利定理,在所有這些區(qū)間中,包含 真值的約占 ,不包含真值的僅占 左右。 ),(),()%1 (100%100 當 和 時, 稱為置信區(qū)間觀察值,也稱為置信區(qū)間。 ),(321nxxxx),(321nxxxx),( 在有些問題中,我們關心的是未知參數(shù)至少有多大(如設備元件使用的壽命),或不超過多大(如產(chǎn)品的次品率),因此下面給出單側置信區(qū)間的概念。 定義3.4 在定義3.3中,如果將(3.3)式改成 1),(1),(2121nnXXXPXXXP 則稱 或 為單側置信區(qū)間, 和 分別稱為單側置信下限與單側置信上限。 ),(21nxxx),(,(21nxxx 評價一個置信區(qū)間的好與壞有兩個標準,

18、一是精度,即 越小精度越高,也就越好。另一個是置信度,即 越大越好。我們當然希望 盡可能地小,同時希望 盡可能地大,但是當樣本容量n固定時,精度與置信度不可能同時提高。 PP 因為當精度提高時即 變小時,( )覆蓋真值 的可能性也變小,從而降低了置信度,相反,當置信度增大時, 必然也增大,從而降低了精度,在實際問題中,一般是根據(jù)實際問題的需要,先選定置信度為1- ,然后再通過增加樣本容量n提高精度。 (1)構造一個隨機變量g()(含待估計的未知參數(shù),分布已知); (2)給定置信水平 ,使 ; ) 10(11)(bgaP (3)從不等式 中解出 即 得的 置信區(qū)間 ; (4)將xi代替 中的xi

19、, 即得觀察區(qū)間。 bga)(21:1),(21),(21 假設總體XN( ),構造 與 的置信區(qū)間有重要的實用意義,而且有關結果是完滿的。 2,2一、均值的置信區(qū)間 從總體X中取樣本(X1,X2,Xn),設樣本值為(x1, x2, x3, ,xn) 由于 niinNXnX12),(1隨機變量很明顯,統(tǒng)計量Z的分布函數(shù)不依賴于未知參數(shù)。 ) 1 , 0 (/NnXZ 設已給定對的區(qū)間估計置信度為1- 令 為Z的雙側 點) 解不等式(關于 ): 得 12/2/ZZZP2/(Z2/2/ZZZnZXnZX2/2/ 從而所求的100(1- )%置信區(qū)間為 將樣本平均值 取其觀察值 ,則 100(1-

20、)%的置信區(qū)間為 ),(2/2/nZXnZXXniixnx11)(2/nZx【例3.9】某廠質量管理部門的負責人希望估計移交給接受部門的5500包原材料的平均重量,一個由250包原材料組成的隨機樣本所給出的平均值 =65千克??傮w標準差 =15千克。試構造總體未知的平均值的置信區(qū)間,假定95%的置信區(qū)間已能令人滿意,并假定總體為正態(tài)分布 x解:(1)樣本平均值=65千克 (2)由1- =0.95, /2=0.025,查標準正態(tài)分布表得 (3)寫出置信區(qū)間= = = (63. 14, 66. 86)96. 1025. 02/ ZZ)(2/nZx)2501596. 165(于是,我們有95%的把握

21、說總體平均值介于63.14和66.86千克之間。 注意 在很多情況下,我們遇到的總體為非正態(tài)分布,但中心極限定理告訴我們,當樣本容量n足夠大,無論總體服從什么分布,的柚樣分布將近似地服從正態(tài)分布,因此當樣本取自總體方差已知的非正態(tài)分布時,我們仍可以用 公式來近似求出總體平均值的置信區(qū)間。 x)(2/nZxn2 未知時,求的置信區(qū)間 n稍微留意上述求得的的置信區(qū)間,不難發(fā)現(xiàn)只有在 已知時方法才可行。如果 未知,則可用樣本方差S2代替總體方差 ,從而根據(jù)統(tǒng)計量: 2222t1/nTnSXTn對給定的置信水平1- ,令n可解得的1- 置信區(qū)間為12/2/tTtP) 1(2/nSntXn將 、S2分別

22、取其觀察值n則的1- 置信區(qū)間為X2121)(11,1niiniixxnsxnx) 1(2/nsntxn例3. 10 為了估計一分鐘一次廣告的平均費用,抽出了15電視臺的隨機樣本。樣本的 平 均 值 = 2 0 0 0 元 , 其 中 標 準 差S=1000元。假定所有被抽樣的這類電視臺服從正態(tài)分布,試構造總體平均值的95%的置信區(qū)間。x解:(1)樣本均值與方差分別為 =2000元,S=1000元 (2)由1- =0.95,得 /2=0.025, n-1=14,查t分布表,得 x14. 2)14() 1(025. 02/tntn(3)寫出置信區(qū)間:n顯然我們有95%的把握說明,總體平均數(shù)處在

23、1447.5元和2552.5元之間。 )15100014. 22000()(2/nStx= =(1447.5, 2552. 5)注意 當 未知但樣本容量n30,即大樣本時,可用標準正態(tài)分布近似地當作t分布。因此,在實際工作中,只有在小樣本的情況下,即樣本容量n30時,才應用t分布,而對于大樣本,則通常采用正態(tài)分布來構造總體平均數(shù)的置信區(qū)間。另外,根據(jù)中心極限定理,從非正態(tài)總體中抽樣時,只要能夠抽取大樣本,那么,樣本平均數(shù)的抽樣分布就會服從正態(tài)分布。這時,我們也就能夠用 來構造置信區(qū)間,但由于 是未 知的,因此,只能用 來構造置信區(qū)間。 )(2/nZx)(2/nSZx二、方差 2的置信區(qū)間n設X

24、1,X2,X3,Xn是總體XN( , 2)的一個樣本,其觀察值為x1,x2,x3,xn。因為在一般情況下,總體的均值是未知的,所以我們只討論均值 未知時,對 2的區(qū)間估計。要對 2進行區(qū)間估計,須考慮樣本方差S2,由 分布理論知隨機變量 ) 1() 1(2222nSn2n對于給定的置信水平1- 1- ,有 1)1() 1(22/222/1nnPn由此得 2的置信水平為1- 的置信區(qū)間為 n而 標準差的置信水平為1- 的置信區(qū)間是 ) 1(1,) 1() 1(22/1222/2nxSnnxSn) 1(1,) 1(122/122/nxSnnxSn例3.11 某制造廠的一名生產(chǎn)管理人員需要知道完成某

25、件工作所需的時間。為此他進行了一項研究,得出一個適于分析的31個觀察值組成的隨機樣本,從樣本數(shù)據(jù)算出的方差為0.3小時,試問: (1)構造方差 2的95%的置信區(qū)間(2)構造 的95%的置信區(qū)間 (3)構造置信區(qū)間時作了何種假定? 解:(1)S2=0.3,自由度= n-1 = 31-1=30 查 分布表得: 從而求得0.19162 0.5360 因此,我們有95%的把握說2落在0.1916和0.5360之間的范圍內。 979.46)30()30(2025. 022/791.16)30()30(2975. 022/12(2)其總體標準差的置信區(qū)間為: 0. 4377 30),可用S12,S22、

26、分別代替12、22 ,于是可用區(qū)間 作為1-2的近似的1- 置信區(qū)間。 )(2221212/21nSnSZXX3 未知時,求1-2的置信區(qū)間,則t分布理論知其中 22221)2(11)()(21212121nntnnSxxTw2) 1() 1(212222112nnSnSnSw 在給定的置信水平1- 的條件下,有 由此可得1-2的置信水平為1- 的置信區(qū)間 當 及Sw取樣本觀察值時,置信區(qū)間為 1)2() 2(212/212/nntTnntP)11)2(21212/21nnSnntXXw21,XX)11)2(21212/21nnSnntxxwn【例3.13】某銀行負責人想知道存戶存入兩家銀行的

27、錢數(shù),他從每一家銀行各抽選了一個由25個存戶組成的隨機樣本。樣本平均值如下:銀行A: =450元;銀行B: =325元。兩個總體均服從方差分別為A2=750和B2=850的正態(tài)分布。試構造A-B的95%的置信區(qū)間。 AxBxn解 由于兩個總體均服從正態(tài)分布,因此 也服從正態(tài)分布,從而計算總體均值之差的置信區(qū)間可用: 這個公式。 BAXX )(222/BBAABAnnZXX已知 12=750,22=850, =450, =325,所以所求的置信區(qū)間為: 這意味著有95%的把握認為總體均值之差在109.32元和140.68元之間。 : AxBx96. 1025. 02/ZZ68.140,32.10

28、9258502575096. 1325450n【例3.14】某工廠中有兩臺生產(chǎn)金屬棒的機器。一個隨機樣本由機器A生產(chǎn)的11根金屬棒組成,另一個隨機樣本由機器B生產(chǎn)的21根金屬棒組成。兩個樣本分別給出兩臺機器所生產(chǎn)金屬棒的長度數(shù)據(jù)如下:n =6. 10英寸, =5.95英寸,SA2=0.018, SB2 =0. 020。假定兩個總體近似服從正態(tài)分布,且總體方差相等,試構造A-B的95%的置信區(qū)間。 AxBxn解 019. 022111020. 0) 121(018. 0) 111(2) 1() 1(222BABBAAwnnSnSnS1- =95%, =0.05,查t分布表得t /2= t0.02

29、5(30)=2.042 所以所求置信區(qū)間為: =(0.05, 0.25) )211111019. 0042. 295. 510. 6(4兩個總體均不服從正態(tài)分布且方差未知 對于一般不服從正態(tài)分布的兩個總體,我們往往根據(jù)中心極限定理采用大樣本抽樣方法。如果兩個總體方差未知,就用S1和S2分別作為1和2的估計值,當n1和n2足夠大時,1-2的置信水平為1- 的近似置信區(qū)間為: )(2221212/21nSnSZXXn【例3.15】東大和西大兩所大學某學期期末英語考試采用同一試題,東大認為該校學生英語考試成績能比西大高出10分,為了證實這一說法,主管部門從兩校各抽取一個隨機樣本并得到如下數(shù)據(jù):n東=

30、75人,n西=80人, 東=78. 6分, 西=73.8 分,S東=8.2分,S西=7. 4分。試在95%的置信度下確定兩校平均分數(shù)之差的置信區(qū)間。 xx解: 分1- =0.95, =0. 025,查標準正態(tài)分布表得,從而其置信區(qū)間為:(78. 6 73. 8 1. 96 1. 26)=(2.3, 7.3) 226. 1804 . 7752 . 82222西西東東nSnS96. 1025. 02/ ZZ 因此,我們有95%的把握說東大、西大兩校英語考試成績之差在2.3分和7.3分之間。這一結果說明東大的平均成績確實高于西大,但并未高出10分。 二、二正態(tài)總體方差比的置信區(qū)間 n在實際工作中還常

31、常需要比較兩個總體的方差。例如,在選擇產(chǎn)品時,我們通常需要方差較小的產(chǎn)品,因為方差較小的產(chǎn)品的質量比較均勻。比較兩個總體方差的大小,可以將兩個方差相比,當兩個方差相等時其比值為1。但兩個總體方差12和22都是未知的,所以需要通過兩個樣本方差來加以比較推斷。 n設二正態(tài)總體XN (1,12)與YN (2,22),其中的參數(shù)均未知,它們相互獨立的兩個樣本的容量分別為n1, n2,樣本方差為S12與S22,現(xiàn)在求其方差比12/22的置信區(qū)間n由 分布理論知 2)1()1()1()1(22222221221211nSnnSnn從而 n于是,對給定的置信水平為1- ,有: ) 1, 1(/) 1/()

32、1() 1/() 1(2122212221222222121211nnFSSnSnnSnF1)1, 1() 1, 1(212/212/1nnFFnnFP所以 12/22的置信水平為1- 的置信區(qū)間為: (此處利用了公式: ) ) 1, 1(),1, 1(122/2221122/12221nnFSSnnFSS),(1),(12121nnFnnFn【例3.16】為了比較用兩種不同方法生產(chǎn)的某種產(chǎn)品的壽命,進行一項試驗。試驗中抽選了由方法1生產(chǎn)的16個產(chǎn)品組成一個隨機樣本,其方差為1200小時。又抽選了用方法2生產(chǎn)的21個產(chǎn)品組成另一個隨機樣本,得出的方差為800小時。試以95%的置信度估計12/2

33、2的置信區(qū)間 解:由于S12=1200,S22=800,S12 S223623. 076. 21)15,20(1) 1, 1(57. 2)20,15() 1, 1(025. 0212/1025. 0212/FnnFFnnF從而所求的置信區(qū)間為:即: 0.58 12/220.05,就要采用有限總體修正系數(shù),從而P的區(qū)間估計公式為: 1)1 (2/NnNnPPZPn【例3.17】某一大公司的人事處長希望知道本公司內專業(yè)不對口的職員究竟占多大比例。于是,他從2000名具有大專以上學歷的職員中隨機抽取了一個由150人組成的樣本進行研究,結果表明,其中有45人說他們從事的工作與所學專業(yè)不對口。試在95.

34、 5%的置信度下構造出專業(yè)不對口人員所占真正比例的置信區(qū)間。 n解:由于樣本容量很大,n=150, n =45/150=0.3, 和 都大于5,故可用正態(tài)分布逼近。但又由于抽樣比重 n ,n故需用有限總體修正系數(shù)計算Sp,則 PPn)1 (Pn05. 0075. 02000150Nn =(0.228, 0.372) 計算結果表明,我們有95. 5%的把握說,該公司具有大專以上學歷的人員中,有22.8%37.2%的 人專業(yè)不對口。 1)1 (2/NnNnPPZP120001502000150)3 .01 (3 .023 .0(二、兩個總體比例之差的區(qū)間估計 n為了估計兩個總體比例之差P1-P2,

35、我們可從每一個總體中各抽一個隨機樣本,并利用兩個樣本比例之差 。這樣就可以按通常的方式構造出一個區(qū)間的估計值。我們知道,當n1和n2都很大,即大樣本,而且總體比例不太接近0或1時,兩個獨立樣本 的抽樣分布近似服從正態(tài)分布,其平均值為P1-P2,標準差為: 21PP 21PP n因為P1和P2皆未知,所以標準差應通過下式來估計: 222111)1 ()1 (21nPPnPPPP222111)1 ()1 (21nPPnPPSPPn于是上述條件下P1-P2的100(1- )%的置信區(qū)間由下式給出: 2221112/21)1 ()1 ()(nPPnPPZPPn【例3.18】某企業(yè)有兩個車間,分別用A和

36、B表示。為了降低廢品率,該企業(yè)對車間B的工人首先進行業(yè)務培訓。3個月后,該企業(yè)負責人對兩個車間的產(chǎn)品質量進行了檢驗。從車間A抽取了200件產(chǎn)品,從車間B抽取了220件產(chǎn)品。查得廢品率A車間為 ,B車間為 ,試在95%的把握程度下,構造兩個廢品率之間的置信區(qū)間。 %15AP%3BPn解: BBBAAAPPnPPnPPSBA)1 ()1 (220)03. 01 (03. 0200)15. 01 (15. 00277. 0 nZ /2=Z0.025=1.96,從而其區(qū)間估計為:(0.15-0.03 1. 96 0. 0277)=(0.066, 0.174) 根據(jù)這一結果,我們有95%的把握說,車間A和車間B的廢品率之差為6. 6%17. 4%。這說明,車間B人員的業(yè)務培訓收到了效果。 n以上所舉的例子中,都假定樣本容量已定。在實際設計抽樣方案中有一個重要的問題,就是在特定的情況下,應該用多大的樣本?如果使用一個比需要大的樣本,就會浪費資料;如果樣本太小,就不能達到分析的目的。 事實上,決定樣本大小的因素有以下三點: (1)受總體方差2數(shù)值大小的影響??傮w方差大,抽樣誤差大,則應多抽一些樣本容量,反之,則可少抽一些。當然,當總體方差為0時,那么只需抽出其中一個就能代表總體。問題是實際工作中我們往往不知道總體方差,因而必

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論