吳喜之-統(tǒng)計學(xué)基本概念和方法-總體參數(shù)的區(qū)間估計_第1頁
吳喜之-統(tǒng)計學(xué)基本概念和方法-總體參數(shù)的區(qū)間估計_第2頁
吳喜之-統(tǒng)計學(xué)基本概念和方法-總體參數(shù)的區(qū)間估計_第3頁
吳喜之-統(tǒng)計學(xué)基本概念和方法-總體參數(shù)的區(qū)間估計_第4頁
吳喜之-統(tǒng)計學(xué)基本概念和方法-總體參數(shù)的區(qū)間估計_第5頁
已閱讀5頁,還剩56頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、總體均值的區(qū)間估計點估計的缺點:不能反映估計的誤差和精確程度區(qū)間估計:利用樣本統(tǒng)計量和抽樣分布估計總體參數(shù)的可能區(qū)間【例】CJW公司是一家專營體育設(shè)備和附件的公司,為了監(jiān)控公司的服務(wù)質(zhì)量,CJW公司每月都要隨即的抽取一個顧客樣本進行調(diào)查以了解顧客的滿意分數(shù)。根據(jù)以往的調(diào)查,滿意分數(shù)的標準差穩(wěn)定在20分左右。最近一次對100名顧客的抽樣顯示,滿意分數(shù)的樣本均值為82分,試建立總體滿意分數(shù)的區(qū)間。 抽樣誤差抽樣誤差抽樣誤差:一個無偏估計與其對應(yīng)的總體參數(shù)之差的絕對值。抽樣誤差 = (實際未知)總體均值的區(qū)間估計(大樣本n30)xx要進行區(qū)間估計,關(guān)鍵是將抽樣誤差 求解。若 已知,則區(qū)間可表示為:

2、此時,可以利用樣本均值的抽樣分布對抽樣誤差的大小進行描述。 上例中,已知,樣本容量n=100,總體標準差 ,根據(jù)中心極限定理可知,此時樣本均值服從均值為 ,標準差為 的正態(tài)分布。即:xxxxxx,20210020nx)2 ,82(2Nx 抽樣誤差的概率表述抽樣誤差的概率表述 由概率論可知, 服從標準正態(tài)分布,即,有以下關(guān)系式成立:一般稱, 為置信度,可靠程度等,反映估計結(jié)果的可信程度。若事先給定一個置信度,則可根據(jù)標準正態(tài)分布找到其對應(yīng)的臨界值 。進而計算抽樣誤差)2 ,82(2NxxxZ) 1 , 0( NZ1)(2ZxPx12ZxxZx2若,則查標準正態(tài)分布表可得,抽樣誤差 此時抽樣誤差的

3、意義可表述為:以樣本均值為中心的3.92的區(qū)間包含總體均值的概率是95%,或者說,樣本均值產(chǎn)生的抽樣誤差是3.92或更小的概率是0.95。 常用的置信度還有90%,95.45%,99.73%,他們對應(yīng)的臨界值分別為1.645,2和3,可以分別反映各自的估計區(qū)間所對應(yīng)的精確程度和把握程度。%95196. 12Z92. 32*96. 196. 12xxxZ 計算區(qū)間估計:計算區(qū)間估計: 在CJW公司的例子中,樣本均值產(chǎn)生的抽樣誤差是3.92或更小的概率是0.95。因此,可以構(gòu)建總體均值的區(qū)間為,由于,從一個總體中抽取到的樣本具有隨機性,在一次偶然的抽樣中,根據(jù)樣本均值計算所的區(qū)間并不總是可以包含總

4、體均值,它是與一定的概率相聯(lián)系的。如下圖所示:92.85,08.7892. 382,92. 382,xxxx已知時的大樣本情況x 的抽樣分布2x95%x的所有 的值3.923.923x1x x2 13.92x 基于的 區(qū)間23.92x 基于的 區(qū)間33.92x基于的區(qū)間(該區(qū)間不包含 ) 根據(jù)選擇的在 、 、 位置的樣本均值建立的區(qū)間1x x2 3x 上圖中,有95%的樣本均值落在陰影部分,這個區(qū)域的樣本均值3.92的區(qū)間能夠包含總體均值。 因此,總體均值的區(qū)間的含義為,我們有95%的把握認為,以樣本均值為中心的3.92的區(qū)間能夠包含總體均值。 通常,稱該區(qū)間為置信區(qū)間,其對應(yīng)的置信水平為 置

5、信區(qū)間的估計包含兩個部分:點估計和描述估計精確度的正負值。也將正負值稱為誤差邊際或極限誤差,反映樣本估計量與總體參數(shù)之間的最大誤差范圍。總結(jié):1已知時的大樣本下的區(qū)間估計nZx2值。的為側(cè)尾部中所提供的面積為在標準正態(tài)分布的右)為置信系數(shù);式中,(Z212Z 計算區(qū)間估計:計算區(qū)間估計: 在大多數(shù)的情況下,總體的標準差都是未知的。根據(jù)抽樣分布定理,在大樣本的情況下,可用樣本的標準差s作為總體標準差的點估計值,仍然采用上述區(qū)間估計的方法進行總體參數(shù)的估計。未知時的大樣本下的區(qū)間估計nZx2值。的為側(cè)尾部中所提供的面積為在標準正態(tài)分布的右)為置信系數(shù);式中,(Z212Z未知時的大樣本情況【例例 】

6、 斯泰特懷特保險公司每年都需對人壽保險單進行審查,現(xiàn)公司抽取36個壽保人作為一個簡單隨即樣本,得到關(guān)于、投保人年齡、保費數(shù)量、保險單的現(xiàn)金值、殘廢補償選擇等項目的資料。為了便于研究,某位經(jīng)理要求了解壽險投保人總體平均年齡的90%的區(qū)間估計。投保人年齡投保人年齡投保人年齡投保人年齡12345678932504024334445484410111213141516171847313639464539384519202122232425262727435436344823364228 2930313233343536343934354253284939上表是一個由36個投保人組成的簡單隨機樣本的年齡

7、數(shù)據(jù)。現(xiàn)求總體的平均年齡的區(qū)間估計。分析:區(qū)間估計包括兩個部分點估計和誤差邊際,只需分別求出即可到的總體的區(qū)間估計。解:已知(1)樣本的平均年齡(2)誤差邊際645. 1%901362Zn,(大樣本),5 .393636405032 nxxs2樣本標準差(未知)總體標準差nZx樣本標準差誤差邊際(3)90%的置信區(qū)間為39.5 2.13 即(37.37,41.63)歲。 注意注意(1)置信系數(shù)一般在抽樣之前確定(2)置信區(qū)間的長度(準確度)在置信度一定的情況下,與樣本容量的大小呈反方向變動,若要提高估計準確度,可以擴大樣本容量來達到。77. 71)(2nxxs13. 23677. 7*645.

8、 122nsZnZx 總體均值的區(qū)間估計:小樣本的情況在小樣本的情況下,樣本均值的抽樣分布依賴于總體的抽樣分布。我們討論總體服從正態(tài)分布的情況。t分布的圖形和標準正態(tài)分布的圖形類似,如下圖示:)(30nstxx分布服從未知總體標準差服從正態(tài)分布已知總體標準差小樣本0標準正態(tài)分布t分布(自由度為20)t分布(自由度為10)標準正態(tài)分布與t分布的比較在分布中,對于給定的置信度,同樣可以通過查表找到其對應(yīng)的臨界值 ,利用臨界值也可計算區(qū)間估計的誤差邊際因此,總體均值的區(qū)間估計在總體標準差未知的小樣本情況下可采用下式進行: 假定總體服從正態(tài)分布;2tnst22sxtn值。的供的面積為分布的右側(cè)尾部中所

9、提)的自由度為(為在為樣本的標準差;)為置信系數(shù);式中,(t2t1-n12ts【例例 】謝爾工業(yè)公司擬采用一項計算機輔助程序來培訓(xùn)公司的維修支援掌握及其維修的操作,以減少培訓(xùn)工人所需要的時間。為了評價這種培訓(xùn)方法,生產(chǎn)經(jīng)理需要對這種程序所需要的平均時間進行估計。以下是利用新方對名職員進行培訓(xùn)的培訓(xùn)天數(shù)資料。根據(jù)上述資料建立置信度為的總體均值的區(qū)間估計。(假定培訓(xùn)時間總體服從正態(tài)分布)。職員時間職員時間職員時間職員時間職員時間職員時間解:依題意,總體服從正態(tài)分布,(小樣本),此時總體方差未知??捎米杂啥葹椋╪-1)=14的t分布進行總體均值的區(qū)間估計。樣本平均數(shù)樣本標準差誤差邊際95%的置信區(qū)間

10、為87.531563554452 nxx82. 61473.6511)(2nxxs78. 31582. 6*145. 22nstx53.87 3.78 即(50.09,57.65)天。確定樣本容量確定樣本容量誤差邊際其計算需要已知若我們選擇了置信度由此,得到計算必要樣本容量的計算公式:nZx2。和樣本容量n,2Z2,1Z就可以確定2Zn在已知 和后,我們可以求出誤差邊際為任何數(shù)值時的樣本容量等于期望的誤差邊際。令E)(222222EZnEZnnZE【例例】在以前的一項研究美國租賃汽車花費的研究中發(fā)現(xiàn),租賃一輛中等大小的汽車,其花費范圍為,從加利福尼亞州的奧克蘭市的每天36美元到康涅狄格州的哈特

11、福德市的每天73.50美元不等,并且租金的標準差為9.65美元。假定進行該項研究的組織想進行一項新的研究,以估計美國當前總體平均日租賃中等大小汽車的支出。在設(shè)計該項新的研究時,項目主管指定對總體平均日租賃支出的估計誤差邊際為2美元,置信水平為95%。解:依題意,可得將以上結(jié)果取下一個整數(shù)(90)即為必要的樣本容量。2,65. 9,96. 1%,9512EZ43.89265. 996. 1)(2222222EZn 說明: 由于總體標準差 在大多數(shù)情況下 是未知的,可以有以下方法取得 的值。(1)使用有同樣或者類似單元的以前樣本的樣本標準差;(2)抽取一個預(yù)備樣本進行試驗性研究。用實驗性樣本的標準

12、差作為 的估計值。(3)運用對 值的判斷或者“最好的猜測”,例如,通??捎脴O差估計 的近似值??傮w比率的估計比率的抽樣分布數(shù)據(jù)的特點比率屬于點計數(shù)據(jù),這類數(shù)據(jù)的分布是非正態(tài)的。對這類數(shù)據(jù)的統(tǒng)計推斷有兩種方法,一般來說,當事物按性質(zhì)不同被劃分成兩類時,要用總體比率的推斷方法進行統(tǒng)計推斷;當事物被劃分為成兩類以上時,則用卡方檢驗法。由于這里假設(shè)事物按性質(zhì)不同分成兩類,所以其中的一類事物發(fā)生比率的抽樣分布屬于二項分布。假設(shè)有一個總體,這個總體中所包含的事件要么具有某種屬性,要么不具有某種屬性,其中具有某種屬性的事件出現(xiàn)的概率為,不具有某種屬性的事件出現(xiàn)的概率為q=1-。比率的抽樣分布現(xiàn)在從中隨機抽取

13、一個容量為n(n次重復(fù)試驗)的樣本,算得成功事件出現(xiàn)的比率:p1=X1/n (X表示成功事件出現(xiàn)的次數(shù))將樣本還回總體中,再從中隨機抽取一個容量為n的樣本,又可以算得一個成功事件出現(xiàn)的比率: p2=X2/n比率的抽樣分布經(jīng)過反復(fù)抽樣,就可以計算出許多樣本的p值,這些p值就形成了一個實驗性的比率的抽樣分布。這個分布的形態(tài)是二項分布。二項概率分布是進行總體比率統(tǒng)計推斷的理論依據(jù)。比率的標準誤比率抽樣分布的標準差,就是比率的標準誤當總體比率已知時:p表示比率的標準誤p表示總體比率q=1-pn表示樣本容量(試驗重復(fù)次數(shù))nqpnqpnnp當總體比率未知時,需要用樣本比率p=X/n作為總體比率p的點估計

14、。所以總體比率標準誤的估計量為:Sp表示比率標準誤的估計量p表示樣本的比率q=1-pn表示樣本容量(試驗重復(fù)次數(shù))npqsp比率的標準誤總體比率的區(qū)間估計以比率的抽樣分布為理論依據(jù),按一定的概率要求估計總體比率的所在范圍就叫做總體比率的區(qū)間估計。正態(tài)近似法當樣本容量n比較大,np和nq中較小的那個數(shù)等于或大于5時,二項分布已經(jīng)接近于正態(tài)分布,此時可以按照正態(tài)分布來估計總體比率0.95和0.99的置信區(qū)間(因為這種方法比較簡便),這種方法叫做正態(tài)近似法。 pppppZpqn正態(tài)近似法根據(jù)標準正態(tài)分布的規(guī)律,得知p(-1.96Z1.96)=0.95p(-2.58Z2.58)=0.99將 帶入上式

15、P(-1.96 1.96)=0.95P(p-1.96 p5因此,總體比率0.95的置信區(qū)間為:P(0.67-1.960.0332p0.67+1.960.0332)=0.95P(0.605p0.735)=0.95 0332.020033.067.0npqsp即在去年的高考中,北京理科生英語及格率有95%的可能在0.605至0.735之間,總體比率超出這個范圍的可能性只有5%。同理,總體比率0.99的置信區(qū)間為:P(0.67-2.580.0332p0.67+2.580.0332)=0.99P(0.584p0.756)=0.99即在去年的高考中,北京理科生英語及格率有99%的可能在0.584至0.7

16、56之間,總體比率超出這個范圍的可能性只有1%。兩個總體參數(shù)的區(qū)間估計兩個總體參數(shù)的區(qū)間估計總體參數(shù)總體參數(shù)符號表示符號表示樣本統(tǒng)計量樣本統(tǒng)計量均值之差比例之差方差比兩個總體均值之差的區(qū)間估計(獨立大樣本)兩個總體均值之差的估計(大樣本)1.假定條件兩個總體都服從正態(tài)分布,1、 2已知若不是正態(tài)分布, 可以用正態(tài)分布來近似(n130和n230)兩個樣本是獨立的隨機樣本2.使用正態(tài)分布統(tǒng)計量 z兩個總體均值之差的估計 (大樣本)1.1, 2已知時,兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為2.1、 2未知時,兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為兩個總體均值之差的估計(例

17、題分析)【例】某地區(qū)教育委員會想估計兩所中學(xué)的學(xué)生高考時的英語平均分數(shù)之差,為此在兩所中學(xué)獨立抽取兩個隨機樣本,有關(guān)數(shù)據(jù)如右表 。建立兩所中學(xué)高考英語平均分數(shù)之差95%的置信區(qū)間 兩個樣本的有關(guān)數(shù)據(jù)兩個樣本的有關(guān)數(shù)據(jù) 中學(xué)中學(xué)1中學(xué)中學(xué)2n1=46n1=33S1=5.8 S2=57.2861x782x兩個總體均值之差的估計(例題分析)解: 兩個總體均值之差在1-置信水平下的置信區(qū)間為 兩個總體均值之差的區(qū)間估計(獨立小樣本)兩個總體均值之差的估計(小樣本: 12 22 )1.假定條件兩個總體都服從正態(tài)分布兩個總體方差未知但相等:1=2兩個獨立的小樣本(n130和n230)2.總體方差的合并估計

18、量3.估計量x1-x2的抽樣標準差兩個總體均值之差的估計(小樣本: 1222 )1.兩個樣本均值之差的標準化兩個總體均值之差的估計(例題分析)【例例】為估計兩種方法組裝產(chǎn)品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12名工人,每個工人組裝一件產(chǎn)品所需的時間(分鐘)下如表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間兩個方法組裝產(chǎn)品所需的時間兩個方法組裝產(chǎn)品所需的時間 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.2

19、32.128.020.033.428.830.030.226.5兩個總體均值之差的估計(例題分析)解解: 根據(jù)樣本數(shù)據(jù)計算得兩個總體均值之差的估計(小樣本: 12 22 )1.假定條件兩個總體都服從正態(tài)分布兩個總體方差未知且不相等:12兩個獨立的小樣本(n130和n230)2.使用統(tǒng)計量兩個總體均值之差的估計(小樣本: 1222 )兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為自由度兩個總體均值之差的估計(例題分析)【例】沿用前例。假定第一種方法隨機安排12名工人,第二種方法隨機安排8名工人,即n1=12,n2=8 ,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差不相

20、等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間 兩個方法組裝產(chǎn)品所需的時間兩個方法組裝產(chǎn)品所需的時間 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.2兩個總體均值之差的估計(例題分析)解解: 根據(jù)樣本數(shù)據(jù)計算得 自由度為:兩個總體比例之差區(qū)間的估計1.假定條件兩個總體服從二項分布可以用正態(tài)分布來近似兩個樣本是獨立的2.兩個總體比例之差P1-P 2在1- 置信水平下的置信區(qū)間為兩個總體比例之差的區(qū)間估計兩個總體比例之差的估計(例題分析)【例例】在某個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論