第五章 抽樣和抽樣分布_第1頁
第五章 抽樣和抽樣分布_第2頁
第五章 抽樣和抽樣分布_第3頁
第五章 抽樣和抽樣分布_第4頁
第五章 抽樣和抽樣分布_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、學(xué)習(xí)目的學(xué)習(xí)目的: 了解抽樣的概率抽樣方法;了解抽樣的概率抽樣方法;理解抽樣分布的意義;了解抽樣理解抽樣分布的意義;了解抽樣分布的形成過程;理解中心極限分布的形成過程;理解中心極限定理;理解抽樣分布的性質(zhì)。定理;理解抽樣分布的性質(zhì)。2022-3-241 第一節(jié)第一節(jié) 常用的抽樣方法常用的抽樣方法 第三節(jié)第三節(jié) 抽樣分布抽樣分布 第三節(jié)第三節(jié) 抽樣分布的性質(zhì)抽樣分布的性質(zhì)2022-3-242簡簡單單隨隨機(jī)機(jī)抽抽樣樣分分層層抽抽樣樣整整群群抽抽樣樣系系統(tǒng)統(tǒng)抽抽樣樣多多階階段段抽抽樣樣概概率率抽抽樣樣方方便便抽抽樣樣判判斷斷抽抽樣樣自自愿愿樣樣本本滾滾雪雪球球抽抽樣樣配配額額抽抽樣樣非非概概率率抽抽

2、樣樣抽抽樣樣方方式式2022-3-244根據(jù)一個(gè)已知的概率來抽取樣本單位,也根據(jù)一個(gè)已知的概率來抽取樣本單位,也稱隨機(jī)抽樣稱隨機(jī)抽樣特點(diǎn)特點(diǎn)按一定的概率以隨機(jī)原則抽取樣本按一定的概率以隨機(jī)原則抽取樣本抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中被抽中每個(gè)單位被抽中的概率是已知的,或是可每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來的以計(jì)算出來的 當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率慮到每個(gè)樣本單位被抽中的概率2022-3-2451.從總體從總體N個(gè)單位中隨機(jī)地抽取個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本,個(gè)

3、單位作為樣本,使使得每一個(gè)總體單位都有相同的機(jī)會(huì)得每一個(gè)總體單位都有相同的機(jī)會(huì)( (概率概率) )被抽中被抽中 2.抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣3.特點(diǎn)特點(diǎn)簡單、直觀,在簡單、直觀,在抽樣框抽樣框完整時(shí),可直接從中抽取樣本完整時(shí),可直接從中抽取樣本用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便4.4.局限性局限性當(dāng)當(dāng)N很大時(shí),不易構(gòu)造抽樣框很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒有利用其他輔助信息以提高估計(jì)的效率沒有利用其他輔助信息以提高估計(jì)的效率2022-

4、3-246將總體單位按某種特征或某種規(guī)則劃分為將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本地抽取樣本優(yōu)點(diǎn)優(yōu)點(diǎn)保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度而提高估計(jì)的精度組織實(shí)施調(diào)查方便組織實(shí)施調(diào)查方便既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì)的目標(biāo)量進(jìn)行估計(jì)2022-3-247將總體中的所有單位將總體中的所有單位(抽樣單位抽樣單位)按一定順按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作

5、為初始單位,然后按事先規(guī)定好的單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位規(guī)則確定其他樣本單位先從數(shù)字先從數(shù)字1到到k之間隨機(jī)抽取一個(gè)數(shù)字之間隨機(jī)抽取一個(gè)數(shù)字r作為作為初始單位,以后依次取初始單位,以后依次取r+k,r+2k等單位等單位優(yōu)點(diǎn):操作簡便,可提高估計(jì)的精度優(yōu)點(diǎn):操作簡便,可提高估計(jì)的精度缺點(diǎn):對(duì)估計(jì)量方差的估計(jì)比較困難缺點(diǎn):對(duì)估計(jì)量方差的估計(jì)比較困難2022-3-248將總體中若干個(gè)單位合并為組將總體中若干個(gè)單位合并為組(群群),抽樣時(shí)抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查全部實(shí)施調(diào)查特點(diǎn)特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡

6、化工作量抽樣時(shí)只需群的抽樣框,可簡化工作量調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差缺點(diǎn)是估計(jì)的精度較差2022-3-249 把握以下問題:把握以下問題: 1、概念;、概念; 2、抽樣框的形式;、抽樣框的形式; 3、對(duì)抽樣框的要求。、對(duì)抽樣框的要求。2022-3-2410 抽樣框:指包括全部抽樣單位的名單框架。抽樣框:指包括全部抽樣單位的名單框架。 調(diào)查目的確定后,總體隨之確定,總體又叫目調(diào)查目的確定后,總體隨之確定,總體又叫目標(biāo)總體,即理論上的抽樣范圍,與實(shí)際抽樣的標(biāo)總體,即理論上的抽樣范圍,與實(shí)際抽樣的總體范圍有時(shí)不

7、一致。此外抽樣單位可以是個(gè)總體范圍有時(shí)不一致。此外抽樣單位可以是個(gè)總體單位,也可以是若干總體單位的集合。如總體單位,也可以是若干總體單位的集合。如某省進(jìn)行農(nóng)戶收支調(diào)查,目標(biāo)總體是全省所有某省進(jìn)行農(nóng)戶收支調(diào)查,目標(biāo)總體是全省所有農(nóng)戶,抽樣單位可以是每個(gè)農(nóng)戶,也可以是每農(nóng)戶,抽樣單位可以是每個(gè)農(nóng)戶,也可以是每個(gè)鄉(xiāng)或村。所以,有目標(biāo)總體后還必須明確實(shí)個(gè)鄉(xiāng)或村。所以,有目標(biāo)總體后還必須明確實(shí)際進(jìn)行抽樣的總體范圍和抽樣單位。際進(jìn)行抽樣的總體范圍和抽樣單位。2022-3-2411 (1)名單抽樣框:列出全部總體單位的名錄)名單抽樣框:列出全部總體單位的名錄一覽表,如職工名單、企業(yè)名單等。一覽表,如職工名單

8、、企業(yè)名單等。 (2)區(qū)域抽樣框:按地理位置將總體范圍劃)區(qū)域抽樣框:按地理位置將總體范圍劃分為若干小區(qū)域,以小區(qū)域?yàn)槌闃訂挝?。如分為若干小區(qū)域,以小區(qū)域?yàn)槌闃訂挝?。如某市居民住房調(diào)查,將全市居民戶劃分為若某市居民住房調(diào)查,將全市居民戶劃分為若干街道或片區(qū)。(干街道或片區(qū)。(3)時(shí)間表抽樣框:將總體)時(shí)間表抽樣框:將總體全部單位按時(shí)間順序排列,把總體的時(shí)間過全部單位按時(shí)間順序排列,把總體的時(shí)間過程分為若干小的時(shí)間單位,以時(shí)間單位作為程分為若干小的時(shí)間單位,以時(shí)間單位作為抽樣單位。如對(duì)流水線上抽樣單位。如對(duì)流水線上24小時(shí)內(nèi)生產(chǎn)的產(chǎn)小時(shí)內(nèi)生產(chǎn)的產(chǎn)品進(jìn)行質(zhì)量抽檢。品進(jìn)行質(zhì)量抽檢。2022-3-24

9、12 (1)應(yīng)與目標(biāo)總體一致,即包括全部)應(yīng)與目標(biāo)總體一致,即包括全部總體單位,不重不漏,否則破壞隨機(jī)總體單位,不重不漏,否則破壞隨機(jī)原則。例如,對(duì)某市居民進(jìn)行抽查,原則。例如,對(duì)某市居民進(jìn)行抽查,以電話號(hào)碼本為抽樣框不科學(xué)。以電話號(hào)碼本為抽樣框不科學(xué)。 (2)盡可能利用與所研究變量高度相)盡可能利用與所研究變量高度相關(guān)的輔助變量的信息,設(shè)計(jì)最佳的抽關(guān)的輔助變量的信息,設(shè)計(jì)最佳的抽樣組織方式和抽樣估計(jì)方法。樣組織方式和抽樣估計(jì)方法。2022-3-2413抽樣分布的概念抽樣分布的概念樣本統(tǒng)計(jì)量的概率分布,樣本統(tǒng)計(jì)量的概率分布,是一種理論分布是一種理論分布在重復(fù)選取容量為在重復(fù)選取容量為n的樣本時(shí)

10、,由該統(tǒng)計(jì)量的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布的所有可能取值形成的相對(duì)頻數(shù)分布 隨機(jī)變量是樣本統(tǒng)計(jì)量隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值樣本均值, , 樣本比例,樣本方差等樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)提供了樣本統(tǒng)計(jì)量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)重要依據(jù) 2022-3-24162022-3-2417樣本均值的樣本均值的抽樣分布抽樣分布在重復(fù)選取容量為在重復(fù)選取容量為n的樣本時(shí),由樣的樣本時(shí),由樣本均值的所有可能取值形成的

11、相對(duì)頻本均值的所有可能取值形成的相對(duì)頻數(shù)分布數(shù)分布一種理論概率分布一種理論概率分布推斷總體均值推斷總體均值 的理論基礎(chǔ)的理論基礎(chǔ)2022-3-241925. 1)(122NxNii2022-3-24203,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第二個(gè)觀察值第一個(gè)第一個(gè)觀察值觀察值所有可能的所有可能的n = 2 的樣本(共的樣本(共16個(gè))個(gè))2022-3-24213.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第二個(gè)觀察值第一個(gè)第一個(gè)觀察

12、值觀察值16個(gè)樣本的均值(個(gè)樣本的均值(x)2022-3-24225 . 2x625. 02x2022-3-2423中心極限定理中心極限定理x5x50 x5 . 2x2022-3-2425nxx2022-3-24262022-3-2427 設(shè)總體共有設(shè)總體共有N個(gè)單位,其均值為個(gè)單位,其均值為 而樣本均值的方差與抽樣方法有關(guān):而樣本均值的方差與抽樣方法有關(guān):重復(fù)抽樣重復(fù)抽樣不重復(fù)抽樣不重復(fù)抽樣)(xE)( xEnx22122NnNnx2x2022-3-2428為樣本數(shù)目MnMxnixix222122625. 016)5 . 20 . 4()5 . 20 . 1 ()(5 . 2160 . 45

13、 . 10 . 11Mxniix2022-3-2429樣樣本本均均值值2022-3-2430樣本比率的樣本比率的抽樣分布抽樣分布設(shè)總體單位數(shù)為設(shè)總體單位數(shù)為N,具有某種屬性特征的單位數(shù)為,具有某種屬性特征的單位數(shù)為N0,不具有某種屬性特征的單位數(shù)為,不具有某種屬性特征的單位數(shù)為N1,則有,則有N0+N1=N, =N0/ N,N1/N=1- ,相應(yīng)的樣本比率,相應(yīng)的樣本比率用用p表示。表示。在重復(fù)抽選容量為在重復(fù)抽選容量為n的樣本時(shí),由樣本比率的所有可的樣本時(shí),由樣本比率的所有可能取值形成的相對(duì)頻數(shù)分布,稱為樣本比率的抽樣能取值形成的相對(duì)頻數(shù)分布,稱為樣本比率的抽樣分布。分布。P的抽樣分布是樣本

14、比率的抽樣分布是樣本比率p的所有可能值的概率分布。的所有可能值的概率分布。當(dāng)樣本容量很大時(shí),樣本比率當(dāng)樣本容量很大時(shí),樣本比率p的抽樣分布可用正態(tài)的抽樣分布可用正態(tài)分布近似。對(duì)于一個(gè)具體的樣本比率分布近似。對(duì)于一個(gè)具體的樣本比率p,若,若n(1-p)和和np均大于等于均大于等于5,就可以認(rèn)為樣本容量足夠大。,就可以認(rèn)為樣本容量足夠大。2022-3-2432樣本比率的數(shù)學(xué)期望樣本比率的數(shù)學(xué)期望樣本比率的方差樣本比率的方差 重復(fù)抽樣重復(fù)抽樣 不重復(fù)抽樣不重復(fù)抽樣)( pEnp12112NnNnp2022-3-2433樣樣本本比比率率2022-3-2434樣本方差的樣本方差的抽樣分布抽樣分布在在重復(fù)

15、抽選容量為重復(fù)抽選容量為n的樣本時(shí),由樣本方差的所的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布,稱為樣本方差有可能取值形成的相對(duì)頻數(shù)分布,稱為樣本方差的抽樣分布。的抽樣分布。對(duì)來自正態(tài)總體的簡單隨機(jī)樣本,比值對(duì)來自正態(tài)總體的簡單隨機(jī)樣本,比值 的抽樣分布服從自由度為(的抽樣分布服從自由度為(n-1)的)的 分布。即分布。即221sn2112222nsn2022-3-2436 分布具有如下性質(zhì)和特點(diǎn):分布具有如下性質(zhì)和特點(diǎn):(1)變量值始終為正。)變量值始終為正。(2)其分布形狀取決于其自由度)其分布形狀取決于其自由度n的大小,通常為的大小,通常為不對(duì)稱的右偏分布,但隨著自由度的增大逐漸不對(duì)稱的右偏分布,但隨著自由度的增大逐漸趨于對(duì)稱。趨于對(duì)稱。(3)(4)具有可加性。若)具有可加性。若U和和V為兩個(gè)獨(dú)立的分布隨機(jī)為兩個(gè)獨(dú)立的分布隨機(jī)變量,自由度分別為變量,自由度分別為n1和和n2,則,則U+V這一隨機(jī)變這一隨機(jī)變量服從自由度為(量服從自由度為(n1+n2)的)的 分布。分布。為自由度其中:,方差為:其期望為:nnDnE2)(22222022-3-2437正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布正態(tài)分布正態(tài)分布正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布2022-3-2438無無偏偏性性(unbi 無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于無偏性:估計(jì)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論