第三章 抽樣與抽樣分布_第1頁
第三章 抽樣與抽樣分布_第2頁
第三章 抽樣與抽樣分布_第3頁
第三章 抽樣與抽樣分布_第4頁
第三章 抽樣與抽樣分布_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第 3 章 抽樣與抽樣分布 3.1 常用的抽樣方法常用的抽樣方法 3.2 抽樣分布抽樣分布 3.3 中心極限定理的應(yīng)用中心極限定理的應(yīng)用3.1 常用的抽樣方法一、簡單隨機抽樣一、簡單隨機抽樣二、分層抽樣二、分層抽樣三、系統(tǒng)抽樣三、系統(tǒng)抽樣四、整群抽樣四、整群抽樣抽樣方法簡單隨機抽樣簡單隨機抽樣分層抽樣分層抽樣整群抽樣整群抽樣系統(tǒng)抽樣系統(tǒng)抽樣多階段抽樣多階段抽樣概率抽樣概率抽樣方便抽樣方便抽樣判斷抽樣判斷抽樣自愿樣本自愿樣本滾雪球抽樣滾雪球抽樣配額抽樣配額抽樣非概率抽樣非概率抽樣抽樣方式抽樣方式概率抽樣(probability sampling)1. 根據(jù)一個已知的概率來抽取樣本單位,也稱隨機抽

2、樣2. 特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的 當(dāng)用樣本對總體目標(biāo)量進行估計時,要考慮到每個樣本單位被抽中的概率簡單隨機抽樣(simple random sampling)1.從總體N個單位中隨機地抽取n個單位作為樣本,使得每一個容量的樣本都有相同的機會(概率)被抽中 2.抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣3.特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標(biāo)量進行估計比較方便4.局限性當(dāng)N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其他輔助信息以提高估計的效率分

3、層抽樣(stratified sampling)1. 將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本2. 優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進行估計,也可以對各層的目標(biāo)量進行估計系統(tǒng)抽樣(systematic sampling)1. 將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位2. 優(yōu)點:操作簡便,可提高估計的精度3. 缺點:對估計量方差

4、的估計比較困難整群抽樣(cluster sampling)1. 將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調(diào)查2. 特點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施缺點是估計的精度較差4.2 抽樣分布與中心極限定理一、抽樣分布的概念一、抽樣分布的概念二、樣本均值抽樣分布的形式二、樣本均值抽樣分布的形式三、樣本比例抽樣分布的形式三、樣本比例抽樣分布的形式四、中心極限定理四、中心極限定理抽樣分布的概念1.樣本統(tǒng)計量的概率分布,是一種理論分布 在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布 2.樣

5、本統(tǒng)計量樣本統(tǒng)計量是隨機變量樣本均值, 樣本比例,樣本方差等3.結(jié)果來自容量相同容量相同的所有所有可能樣本4.提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布 (sampling distribution)抽樣分布的形成過程 (sampling distribution) 每個隨機變量都有其概率分布。樣本統(tǒng)計量是一種隨機變量,它有若干可能取值(即可能樣本指標(biāo)數(shù)值),每個可能取值都有一定的可能性(即概率),從而形成它的概率分布,統(tǒng)計上稱為抽樣分布。簡言之,抽樣分布就是指樣本統(tǒng)計量的概率分布。樣本統(tǒng)計量是由n個隨機變量構(gòu)成的樣本的函數(shù),故抽樣分布屬于隨

6、機變量函數(shù)的分布。 將樣本平均數(shù)的全部可能取值及其出現(xiàn)的概率依次排列,就得到樣本平均數(shù)的抽樣分布。同理,可得到樣本比例的概率分布和樣本標(biāo)準(zhǔn)差的概率分布,對于抽樣分布,同樣可計算其均值和方差等數(shù)字特征來反映該分布的中心和離散趨勢。 當(dāng)總體的分布類型已知時,對于任一自然數(shù)n都能導(dǎo)出統(tǒng)計量 的分布的明顯表達式,這種方法稱為精確方法,所得分布稱為精確抽樣分布。它對樣本容量n較小的統(tǒng)計推斷問題特別有用,故又稱小樣本方法。目前,精確抽樣分布大多是在正態(tài)總體條件下得到的。 在大多數(shù)場合,精確抽樣分布不易求出或其表達式過于復(fù)雜而難以應(yīng)用,這時人們借助于極限定理,尋求在樣本容量n無限增大時統(tǒng)計量的極限分布。假如

7、此種分布能求得,那么當(dāng)n較大時,可用此極限分布當(dāng)作所求的抽樣分布的一種近似,這種方法稱為大樣本方法,這種極限分布常常稱為漸近分布。n,21 在抽樣推斷中,許多場合下統(tǒng)計量服從正態(tài)分布或以正態(tài)分布為漸近分布,所以正態(tài)分布是最常用的。此外, 分布、t分布、F分布等精確抽樣分布也起著重要作用。 1、 分布:設(shè) 是獨立同分布的隨機變量,且每個隨機變量都服從標(biāo)準(zhǔn)正態(tài)分布,即 ,則隨機變量 的分布稱作自由度為n的 分布,記為 。 22n,211 , 0 Ninii1222 n2分布密度為:分布密度為:2 分位數(shù)分布的上側(cè)為通常稱或 使,分布表,得可查,10對于給定的0 0 0 22122222221222

8、nnpdxfnenfnnn分布密度為:分布密度為:2 分位數(shù)分布的上側(cè)為通常稱或 使,分布表,得可查,10對于給定的0 0 0 22122222221222nnpdxfnenfnnn分布的性質(zhì)分布的性質(zhì)2 nnNnnnnn、nnnY2 , 于正態(tài)分布,n當(dāng) , 3則 , 相互獨立,分布具有可加性。若 , 22YV方差,YE則均值, , 122212212221212122分布趨分布的性質(zhì)分布的性質(zhì)2 nnNnnnnn、nnnY2 , 于正態(tài)分布,n當(dāng) , 3則 , 相互獨立,分布具有可加性。若 , 22YV方差,YE則均值, , 122212212221212122分布趨t分布分布 設(shè)隨機變量

9、X與Y相互獨立,而且XN(0,1),YX2(n),則稱隨機變量 服從自由度為n的t分布,記作t(n), 其分布密度為:XYXt 分位數(shù)分布的上側(cè)t稱為或 使分布表,得t,可 查10對于給定的t- 1221)(212ntnttpdttfntntnnntfntnt分布的性質(zhì) t分布具有如下性質(zhì): 。分布可用t時,30n當(dāng)布,所以,準(zhǔn)于分布t時,n當(dāng). 3)()(故有 對稱的,0t分布密度是關(guān)布2.t2)(n,2YV方差0tE分布的均值 . 11標(biāo)準(zhǔn)正態(tài)分布近似正態(tài)分標(biāo)趨近ntntnn,tF分布 設(shè)隨機變量X與Y相互獨立,而且分別服從自由度為n1,n2的X2分布,則 服從第一自由度為n1,第二自由度

10、為n2的F分布,記作:FF(n1,n2)分布密度為:21nYnXF 0 0 0 )1 ()()2()2()21()(22112221212111xxxnnxnnnnnxfnnnn樣本均值的抽樣分布1. 在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布2. 一種理論概率分布3. 推斷總體均值的理論基礎(chǔ)樣本均值的抽樣分布樣本均值的抽樣分布(例題分析)樣本均值的抽樣分布 (例題分析)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第二個觀察值第一個第一個觀察值觀察值所有可能的所有可能的n = 2 的樣本

11、(共的樣本(共16個)個)樣本均值的抽樣分布 (例題分析)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第二個觀察值第一個第一個觀察值觀察值16個樣本的均值(個樣本的均值(x)樣本均值的抽樣分布(數(shù)學(xué)期望與方差)樣本均值的分布與總體分布的比較 (例題分析)樣本比例的抽樣分布樣本比例的抽樣分布樣本比例的抽樣分布樣本比例的抽樣分布 比例是一個常用的統(tǒng)計指標(biāo),如產(chǎn)品的合格率、市場占有率、電視節(jié)目的收視率等等,總體中具有某種特征的單位占全部單位的比例稱作總體比例,記作P,樣本中具有此種特征的單位占全部樣本單位的比例,記為p。

12、 根據(jù)中心極限定理,當(dāng)n,二項分布趨近于正態(tài)分布。所以在大樣本下,若np和n(1p)皆大于5,樣本比例近似服從正態(tài)分布: nPPPNP1,由抽樣平均誤差的定義可知,重復(fù)抽樣由抽樣平均誤差的定義可知,重復(fù)抽樣和不重復(fù)抽樣條件下比例的抽樣平均誤和不重復(fù)抽樣條件下比例的抽樣平均誤差為:差為: 111NnNnpppnPPPVP方差的抽樣分布方差的抽樣分布 要用樣本方差推斷總體方差,也必須知道方差的抽樣分布。 在重復(fù)選取容量為n的樣本時,由樣本方差的所有可能取值形成的相對頻數(shù)分布,稱為樣本方差的抽樣分布。 統(tǒng)計證明,對于來自正態(tài)總體的簡單隨機樣本, 比值 221sn2x112222nxsnx中心極限定理樣本均值的抽樣分布與中心極限定理x中心極限定理(central limit theorem)中心極限定理 (central limit theorem)1. 樣本均值的數(shù)學(xué)期望2. 樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布(數(shù)學(xué)期望與方差)抽樣分布與總體分布的關(guān)系正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布正態(tài)分布正態(tài)分布正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布樣本均值的抽樣分布 總體方差已知時,不論是大樣本還是小樣本,樣本均值均為正態(tài)分布,2 x

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論