第五章抽樣與參數(shù)估計11_第1頁
第五章抽樣與參數(shù)估計11_第2頁
第五章抽樣與參數(shù)估計11_第3頁
第五章抽樣與參數(shù)估計11_第4頁
第五章抽樣與參數(shù)估計11_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第 5 章 抽樣與參數(shù)估計5.1 抽樣與抽樣分布抽樣與抽樣分布5.2 參數(shù)估計的基本方法參數(shù)估計的基本方法 5.3 總體均值總體均值的區(qū)間估計的區(qū)間估計5.4 總體比例的總體比例的的區(qū)間估計的區(qū)間估計5.5 樣本容量的確定樣本容量的確定參數(shù)估計在統(tǒng)計方法中的地位參數(shù)估計參數(shù)估計假設(shè)檢驗假設(shè)檢驗 統(tǒng)計方法統(tǒng)計方法描述統(tǒng)計描述統(tǒng)計推斷統(tǒng)計推斷統(tǒng)計第第 5 章章 抽樣與參數(shù)估計抽樣與參數(shù)估計5.1.1 概率抽樣方法概率抽樣概率抽樣(probability sampling)也稱隨機(jī)抽樣也稱隨機(jī)抽樣特點特點按隨機(jī)原則抽取樣本抽取樣本時使每個單位都有一定的機(jī)會被抽中每個單位被抽中的概率是已知的,或是可以

2、計算出來的 簡單隨機(jī)抽樣簡單隨機(jī)抽樣(simple random sampling)定義:定義:從總體從總體N個單位中隨機(jī)地抽取個單位中隨機(jī)地抽取n個單個單位作為樣本,每個單位入抽樣本的概率是位作為樣本,每個單位入抽樣本的概率是相等的;也稱純隨機(jī)抽樣,最基本的抽樣相等的;也稱純隨機(jī)抽樣,最基本的抽樣方法,是其它抽樣方法的基礎(chǔ)方法,是其它抽樣方法的基礎(chǔ)特點特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標(biāo)量進(jìn)行估計比較方便可分為重復(fù)抽樣和不重復(fù)抽樣分層抽樣分層抽樣(stratified sampling)定義:定義:將總體的元素按某種特征或某種規(guī)則劃將總體的元素按某種特征或某種

3、規(guī)則劃分為若干個層,然后從各個層中獨立、隨機(jī)地分為若干個層,然后從各個層中獨立、隨機(jī)地抽取一定數(shù)量的元素組成樣本抽取一定數(shù)量的元素組成樣本優(yōu)點優(yōu)點除了可以對總體進(jìn)行估計,還可以對各層的子總體進(jìn)行估計分層抽樣通常可以按自然區(qū)域或行政區(qū)域進(jìn)行分層可以提高估計的精度樣本分布在各層內(nèi),從而使樣本在總體中的分布比較均勻系統(tǒng)抽樣系統(tǒng)抽樣(systematic sampling)定義:定義:將總體中的各元素按一定順序排列,將總體中的各元素按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個單位作為在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個單位作為初始單位,然后每隔一定的間隔抽取一個初始單位,然后每隔一定的間隔抽取一個元素,直至形

4、成樣本元素,直至形成樣本先從數(shù)字1到k之間隨機(jī)抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難整群抽樣整群抽樣(cluster sampling)定義:定義:將總體劃分為若干個群,抽樣時直將總體劃分為若干個群,抽樣時直接抽取群,然后對中選群中的所有單位全接抽取群,然后對中選群中的所有單位全部實施調(diào)查部實施調(diào)查特點特點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施缺點是估計的精度較差5.1.2 抽樣分布統(tǒng)計量統(tǒng)計量(statistic)設(shè)設(shè)X1,X2,Xn是從總體是從總體X中抽取的容量

5、為中抽取的容量為n的一個的一個樣本,如果由此樣本構(gòu)造一個函數(shù)樣本,如果由此樣本構(gòu)造一個函數(shù)T(X1,X2,Xn),不依賴于任何未知參數(shù),則稱函數(shù)不依賴于任何未知參數(shù),則稱函數(shù)T(X1,X2,Xn)是一個統(tǒng)計量是一個統(tǒng)計量l樣本均值、樣本比例、樣本方差等都是統(tǒng)計量樣本均值、樣本比例、樣本方差等都是統(tǒng)計量.),(),(,21212121的觀察值的觀察值計量計量是統(tǒng)是統(tǒng)則則是一個樣本的觀察值是一個樣本的觀察值的一個樣本的一個樣本是來自總體是來自總體設(shè)設(shè)nnnnXXgxxxgxxxXXXXX由于統(tǒng)計量依賴于樣本,而樣本又是隨機(jī)由于統(tǒng)計量依賴于樣本,而樣本又是隨機(jī)變量,故變量,故統(tǒng)計量也是隨機(jī)變量統(tǒng)計量

6、也是隨機(jī)變量,因而就有,因而就有一定的分布,稱這個分布為一定的分布,稱這個分布為“抽樣分布抽樣分布”。定義:定義:在重復(fù)選取容量為在重復(fù)選取容量為n的樣本時,由的樣本時,由每一個樣本算出的該統(tǒng)計量數(shù)值的相對頻每一個樣本算出的該統(tǒng)計量數(shù)值的相對頻數(shù)分布或概率分布數(shù)分布或概率分布 抽樣分布的結(jié)果來自容量相同的所有可能樣本抽樣分布 (sampling distribution)容量相同的所有可能樣本的樣本均值的概容量相同的所有可能樣本的樣本均值的概率分布率分布一種理論概率分布一種理論概率分布進(jìn)行推斷總體總體均值進(jìn)行推斷總體總體均值 的理論基礎(chǔ)的理論基礎(chǔ)樣本均值的抽樣分布樣本均值的數(shù)學(xué)期望樣本均值的數(shù)

7、學(xué)期望樣本均值的方差樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布(數(shù)學(xué)期望與方差)(XEnX22122NnNnX樣本均值的抽樣分布(例題分析)5 .21NxNii25. 1)(122NxNii樣本均值的抽樣分布 (例題分析)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第二個觀察值第一個第一個觀察值觀察值所有可能的所有可能的n = 2 的樣本的樣本(共共16個個)樣本均值的抽樣分布 (例題分析)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個

8、觀察值第二個觀察值第一第一個個觀察觀察值值16個樣本的均值個樣本的均值 (x)樣本均值的分布與總體分布的比較樣本均值的分布與總體分布的比較 (例題分析例題分析)5 . 2x625. 02x 定理定理 一一 設(shè)設(shè) X1, X2, , Xn 是來自正態(tài)總體是來自正態(tài)總體),(2 N的樣本,的樣本, 是樣本均值,則有是樣本均值,則有2( ,).XNnX01( , )XNn n取不同值時樣本取不同值時樣本均值均值 的分布的分布X請注意請注意 :2在在已已知知,可可用用本本定定理理),(2nNX 中心極限定理(central limit theorem)nx定理二:從均值為定理二:從均值為 ,方差為,方

9、差為 2的一個任意總體中抽取的一個任意總體中抽取容量為容量為n的樣本,當(dāng)?shù)臉颖荆?dāng)n充分大充分大時,樣本均值的抽樣分布時,樣本均值的抽樣分布近似服從均值為近似服從均值為、方差為、方差為2/n的正態(tài)分布的正態(tài)分布x中心極限定理 (central limit theorem)抽樣分布與總體分布的關(guān)系抽樣分布與總體分布的關(guān)系正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布樣本均值樣本均值正態(tài)分布正態(tài)分布樣本均值樣本均值正態(tài)分布正態(tài)分布樣本均值樣本均值非正態(tài)分布非正態(tài)分布總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可

10、表示為樣本比例的抽樣分布樣本比例的抽樣分布(比例比例proportion)NNNN101或011nnppnn或或樣本比例的數(shù)學(xué)期望樣本比例的數(shù)學(xué)期望樣本比例的方差樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布樣本比例的抽樣分布(數(shù)學(xué)期望與方差數(shù)學(xué)期望與方差)(PEnP)1 (21)1 (2NnNnP容量相同的所有可能樣本的樣本比例的概容量相同的所有可能樣本的樣本比例的概率分布率分布當(dāng)樣本容量很大時,樣本比例的抽樣分布當(dāng)樣本容量很大時,樣本比例的抽樣分布可用可用正態(tài)分布正態(tài)分布近似近似 一種理論概率分布一種理論概率分布推斷總體總體比例推斷總體總體比例 的理論基礎(chǔ)的理論基礎(chǔ)樣本比例的抽樣分布樣

11、本比例的抽樣分布定理四:當(dāng)定理四:當(dāng)np大于等于大于等于5時時,實際上,在大多數(shù)情況下,樣本容量都足夠滿實際上,在大多數(shù)情況下,樣本容量都足夠滿足該條件,因此,很多時候,我們直接用正態(tài)足該條件,因此,很多時候,我們直接用正態(tài)分布估計樣本比例的抽樣分布。分布估計樣本比例的抽樣分布。樣本比例的抽樣分布1()p N(,)n5.2.1 估計量與估計值總體算術(shù)平均數(shù)算術(shù)平均數(shù)中位數(shù)中位數(shù)x統(tǒng)計量統(tǒng)計量eM參數(shù)估計參數(shù)估計(parameter estimation) :用樣本統(tǒng)計量去估計總用樣本統(tǒng)計量去估計總體的參數(shù)體的參數(shù)()。其中,用來推斷總體參數(shù)的統(tǒng)計量稱為。其中,用來推斷總體參數(shù)的統(tǒng)計量稱為估計量

12、估計量(estimator) ()。 ?參數(shù)參數(shù)樣本平均數(shù)樣本平均數(shù) 是總體平均數(shù)的估計量是總體平均數(shù)的估計量樣本方差(或樣本標(biāo)準(zhǔn)差)樣本方差(或樣本標(biāo)準(zhǔn)差) 是是總體方差(或樣本標(biāo)準(zhǔn)差)的估計量總體方差(或樣本標(biāo)準(zhǔn)差)的估計量樣本比例樣本比例 為總體比例的估計量,其中為總體比例的估計量,其中 為樣本中具有規(guī)定特征的單位數(shù)為樣本中具有規(guī)定特征的單位數(shù)niixnx1122111niis( xx )n0n0npn常用的常用的估計量估計量l一個總體參數(shù)的估計量可以有多個一個總體參數(shù)的估計量可以有多個 。例如,在估計總。例如,在估計總體方差時,體方差時, 和和 都可以作為估計量。都可以作為估計量。nx

13、xnii12)(1)(12nxxnii估計值:估計值: 估計總體參數(shù)時計算出來的估計量的具體數(shù)值。估計總體參數(shù)時計算出來的估計量的具體數(shù)值。 例如要估計大學(xué)女生的平均身高,從中抽取的例如要估計大學(xué)女生的平均身高,從中抽取的100個個女生作為樣本,抽取的具體樣本計算的樣本平均身高是女生作為樣本,抽取的具體樣本計算的樣本平均身高是1.62米,這個米,這個1.62米就是一個估計值。米就是一個估計值。 5.2.2 點估計與區(qū)間估計點估計 (point estimate)定義:定義:用樣本的估計量的某個取值直接用樣本的估計量的某個取值直接作為總體參數(shù)的估計值作為總體參數(shù)的估計值例如:用樣本均值的某次抽樣

14、計算的具體數(shù)值直接作為總體均值的估計2. 特點:特點:能夠明確地估計總體參數(shù),但一般能夠明確地估計總體參數(shù),但一般該值不會等于總體參數(shù)的真值;該值不會等于總體參數(shù)的真值;沒有給沒有給出估計值接近總體參數(shù)程度的信息出估計值接近總體參數(shù)程度的信息區(qū)間估計區(qū)間估計 (interval estimate)在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個估計在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個估計區(qū)間,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到區(qū)間,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量體參數(shù)的接

15、近程度給出一個概率度量比如,某班級平均分?jǐn)?shù)在比如,某班級平均分?jǐn)?shù)在7585之間,置信水平是之間,置信水平是95% 區(qū)間估計的圖示xxzx2將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例,也稱置信度 表示為 (1 - 為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有 99%, 95%, 90%相應(yīng)的為0.01,0.05,0.10置信水平(confidence level) 由樣本估計量構(gòu)造出的總體參數(shù)在一定置信水平下的估計區(qū)間統(tǒng)計學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)

16、間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間稱為置信水平為95%的置信區(qū)間。同樣,其他置信水平的區(qū)間也可以用類似的方式進(jìn)行表述置信區(qū)間的理解(confidence interval)置信區(qū)間與置信水平的關(guān)系 xx5.3.1 正態(tài)總體、方差已知 或非正態(tài)總體、大樣本總體均值的區(qū)間估計總體均值的區(qū)間估計(正態(tài)總體、方差已知正態(tài)總體、方差已知或或非正態(tài)總體大樣本非正態(tài)總體大樣本)1.假定條件樣本來自正態(tài)分布的總體,且方差() 已知如果不是正態(tài)分布,可由正態(tài)分布來近似 (n 30)2.樣本均值的分布:)1 ,0( Nnxz)(22未知或nszxnzx總體均值的區(qū)間估計總體均值的區(qū)間估計 (正態(tài)總體

17、、方差已知或非正態(tài)總體大樣本正態(tài)總體、方差已知或非正態(tài)總體大樣本)25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3總體均值的區(qū)間估計總體均值的區(qū)間估計 (正態(tài)總體、方差已知或非正態(tài)總體大樣本正態(tài)總體、方差已知或非正態(tài)總體大樣本)28.109,44.10192.336.105251096.136.1052nzx36.105x總體均值的區(qū)間估計總體均值的區(qū)間估計 (正態(tài)

18、總體、方差已知或非正態(tài)總體大樣本正態(tài)總體、方差已知或非正態(tài)總體大樣本)36個投保人年齡的數(shù)據(jù)個投保人年齡的數(shù)據(jù) 233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計總體均值的區(qū)間估計 (正態(tài)總體、方差已知或非正態(tài)總體大樣本正態(tài)總體、方差已知或非正態(tài)總體大樣本)63.41,37.3713.25 .393677.7645.15 .392nszx5 .39x77. 7s5.3.2 正態(tài)總體、方差未知、小正態(tài)總體、方差未知、小樣本樣本總體均值的區(qū)間估計總體均值的區(qū)間估計(正態(tài)總體、方差未知、小

19、樣本正態(tài)總體、方差未知、小樣本)1. 假定條件樣本來自正態(tài)分布的總體,但方差() 未知且是小樣本 (n 30)2.定理四:)1(ntnsxtnstx2總體均值的區(qū)間估計總體均值的區(qū)間估計 (正態(tài)總體、方差未知、小樣本正態(tài)總體、方差未知、小樣本)16燈泡使用壽命的數(shù)據(jù)燈泡使用壽命的數(shù)據(jù) 1510152014801500145014801510152014801490153015101460146014701470總體均值的區(qū)間估計總體均值的區(qū)間估計 (正態(tài)總體、方差未知、小樣本正態(tài)總體、方差未知、小樣本)2 .1503, 8 .14762 .1314901677.24131.214902nstx

20、1490 x77.24s總體均值的區(qū)間估計總體均值的區(qū)間估計 (小結(jié)小結(jié))總體比例的區(qū)間估計總體比例的區(qū)間估計(一個總體比例一個總體比例)1.假定條件np和n(1-p)均應(yīng)該大于5,即樣本容量足夠大時可以由正態(tài)分布來近似2.樣本比例的抽樣分布:)1 ,0()1 (Nnpznppzp)-1 (2總體比例的區(qū)間估計(例題分析)%35.74%,65.55%35. 9%65100%)651%(6596. 1%65)1 (2nppzp什么是樣本容量的確定?什么是樣本容量的確定? 為了在已知的置信水平下,希望將為了在已知的置信水平下,希望將估計誤估計誤差(估計區(qū)間)差(估計區(qū)間)固定為某個具體數(shù)值(固定為某個具體數(shù)值(E)時,而必須抽取的樣本的容量。時,而必須抽取的樣本的容量。5.5.1 估計總體均值時樣本量的估計總體均值時樣本量的確定確定估計總體均值時樣本量估計總體均值時樣本量n為為樣本量樣本量n與總體方差與總體方差 2、估計誤差、估計誤差E、可靠性系數(shù)、可靠性系數(shù)Z或或t之間的關(guān)系為之間的關(guān)系為與總體方差成正比與總體方差成正比與估計誤差的平方成反比與估計誤差的平方成反比與可靠性系數(shù)成正比與可靠性系數(shù)成正比樣本量的圓整法則:當(dāng)計算出的樣本量不是整數(shù)時,樣本量的圓整法則:當(dāng)計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論