![多階段抽樣完整版本_第1頁](http://file4.renrendoc.com/view8/M01/3E/16/wKhkGWcckayAXwFzAADmNmNdSWY943.jpg)
![多階段抽樣完整版本_第2頁](http://file4.renrendoc.com/view8/M01/3E/16/wKhkGWcckayAXwFzAADmNmNdSWY9432.jpg)
![多階段抽樣完整版本_第3頁](http://file4.renrendoc.com/view8/M01/3E/16/wKhkGWcckayAXwFzAADmNmNdSWY9433.jpg)
![多階段抽樣完整版本_第4頁](http://file4.renrendoc.com/view8/M01/3E/16/wKhkGWcckayAXwFzAADmNmNdSWY9434.jpg)
![多階段抽樣完整版本_第5頁](http://file4.renrendoc.com/view8/M01/3E/16/wKhkGWcckayAXwFzAADmNmNdSWY9435.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第九章多階段抽樣第一節(jié)引言第二節(jié)初級單元大小相等的二階抽樣第三節(jié)初級單元大小不相等的二階抽樣第四節(jié)其他問題1精選可編輯ppt第一節(jié)概述一、概述二、多階段抽樣的定義及其與其他抽樣的關(guān)系二、多階段抽樣的特點和作用三、抽選方法與推斷原理2精選可編輯ppt一、引言采用整群抽樣的主要理由是整群樣本比較集中,實施便利,每個基本單元的調(diào)查費用較低。它的最大缺點是由于群內(nèi)小單元存在一定程度的相似性(群內(nèi)相關(guān)系數(shù)大于0),其抽樣誤差高于同樣樣本量的簡單隨機抽樣。事實上,在多數(shù)情形,特別是當(dāng)群的規(guī)模比較大時,確實沒有必要對群內(nèi)所有次級單元都進行調(diào)查。因此很自然地想到可以對每個被抽到的群中的次級單元再次進行抽樣。3精選可編輯ppt二、多階段抽樣的定義及其與其他抽樣的關(guān)系(一)二階段抽樣設(shè)總體由N個初級單元組成,每個初級單元又由若干二級(次級)單元組成,若在總體中按一定方法抽取n個初級單元,對每個被抽中的初級單元再抽取若干二級單元進行調(diào)查,則這種抽樣稱為二階抽樣,或二級抽樣(two-stagesampling)在二階抽樣中,全部抽樣是分兩步實施的:第一步是從總體中抽初級單元,稱為第一階抽樣;第二步是從每個被抽中的初級單元中抽二級單元,稱為第二階抽樣。4精選可編輯ppt如果每個二級單元又由更小的三級單元組成,那么第二階抽樣后,若對每個被抽中的二級單元中的三級單元再進行抽樣,則是三階抽樣。如果對每個被抽中的二級單元不再抽樣,調(diào)查其中每個三級單元,則稱為二階整群抽樣。以此類推,可定義更高階的多階抽樣(multi-stagesampling)或多階整群抽樣(multi-stageclustersampling)。5精選可編輯ppt(二)多階段抽樣與其他抽樣的關(guān)系整群抽樣可以看作是多階段抽樣的一種特殊情形,即最后一階抽樣是100%的抽樣。分層抽樣也可看作是多階抽樣的特例:此時每個初級單元即是層,第一階抽樣是100%抽樣,而層內(nèi)抽樣是第二階抽樣。當(dāng)然,層內(nèi)抽樣本身也可能是多階的。在多階段抽樣中,各階抽樣的方法可以采用簡單隨機抽樣,也可以采用放回或不放回的不等概抽樣,或者用系統(tǒng)抽樣。6精選可編輯ppt三、多階段抽樣的特點及作用1、實施方便,節(jié)省費用保持了整群抽樣的優(yōu)點,即由于樣本比較集中,便于調(diào)查、節(jié)省費用;.2、對抽中的次級單元進行再抽樣,提高了效率多階段抽樣能充分發(fā)揮抽樣的效率,克服了整群抽樣的缺點,即避免了對小單元過多調(diào)查造成的浪費。3、抽樣框編制得以簡化多階段抽樣是分階段實施的,因此抽樣框也可以分級進行準(zhǔn)備:在第一階抽樣中,僅需準(zhǔn)備總體中關(guān)于初級單元的抽樣框;在第二階抽樣中,僅需對那些被抽中的初級單元準(zhǔn)備二級單元的抽樣框。更高階的也是如此,每次只需要對被抽中的單元準(zhǔn)備下一級抽樣單元抽樣框。7精選可編輯ppt在社會經(jīng)濟調(diào)查中,多階抽樣常用于抽樣單元為各級行政單位的情況。例如,在一項全國性調(diào)查中,往往將省、地市、縣、街道(鄉(xiāng)、鎮(zhèn))、居(村)民委員會、居(村)民小組及住戶作為各級南樣單元。在此,采用多階段抽樣顯然十分方便。再如,在一個城市中,可以將區(qū)作為其中一級單元,也可直接將街道作為一級單元;可以將居委會作為街道下一級的單元,也可以將居民小組作為街道下一級的單元。8精選可編輯ppt4、多階段抽樣可用于散料的抽樣.所謂散料是指連續(xù)松散的不易區(qū)分為個體或抽樣單元的材料.如:礦石、煤、糧食、水泥、化肥等等。例如:對貯藏在倉庫中的小麥中農(nóng)藥殘留量的監(jiān)測.首先,從倉庫中抽若干麻袋然后,再從每個抽中的麻袋中的不同部位抽取一定數(shù)量的小麥樣品(稱為份樣)進行測試。9精選可編輯ppt三、抽選方法與推斷原理
多階段抽樣每一階段的抽樣可以相同,也可以不同,它通常與整群抽樣、分層抽樣、系統(tǒng)抽樣結(jié)合使用.實際工作中,多階段抽樣通常與整群抽樣結(jié)合使用,即前幾階是多階段抽樣,最后一階為整群抽樣。10精選可編輯ppt多階段抽樣時,抽樣是分步進行的,因此,討論估計量的均值及方差時需要分階段進行,則用到下面的性質(zhì):性質(zhì)1對于兩階段抽樣,有式中,E2、V2為在固定初級單元時對第二階抽樣求均值和方差;E1
、V1為對第一階抽樣求均值和方差.11精選可編輯ppt上述1式是顯然的。2式證明如下:12精選可編輯ppt性質(zhì)1可推廣到多階段抽樣的情形,如三階段抽樣:13精選可編輯ppt第二節(jié)初級單元大小相等的二階抽樣
一、符號二、總體均值的估計量及其性質(zhì)三、關(guān)于總體比例的估計14精選可編輯ppt引:本節(jié)先討論初級單元大小(即所包含的次級單元數(shù)目)相等情形的二階抽樣。此時兩階抽樣中的每一階都可采用簡單隨機抽樣:第一階抽樣從總體N個初級單元中抽取n個初級單元,第二階抽樣則是從每個被抽中的初級單元(設(shè)每個包含M個次級單元)中抽取m個次級單元。假定:在抽中的若干初級單元中作第二階抽樣是相互獨立地進行的。15精選可編輯ppt一、符號說明初級單元的個數(shù):N二級單元的個數(shù):M第一階段和第二階段的樣本量:n,m;第i個初級單元中第j個二級單元的觀測值:Yij(i=1,2,…N;j=1,2,…M)樣本中第i個初級單元中的第j個二級單元的觀測值:yij(i=1,2,…n;j=1,2,…m)第一階段和第二階段的抽樣比:16精選可編輯ppt總體和樣本中第i個初級單元按二級單元的平均值:總體和樣本按二級單元的平均值:17精選可編輯ppt總體和樣本初級單元間的方差:初級單元內(nèi)的方差:18精選可編輯ppt若記則有同理19精選可編輯ppt二、總體均值的估計量及其性質(zhì)性質(zhì)2如果二階抽樣中的每一階抽樣都是簡單隨機的,且對每個初級單元,第二階抽樣是相互獨立的,則對總體均值的無偏估計為:其方差為:方差的無偏估計為:20精選可編輯ppt估計量的方差由兩個分量組成:其中源由第一階抽樣的第一項主要取決于第一階抽樣的樣本量n與初級單元間的方差S12源由第二階抽樣的第二項主要取決于第二階抽樣的總樣本量mn與初級單元內(nèi)的方差S22在通常情況下,第一項占總方差的絕大部分,因此在固定次級單元樣本量mn的條件下,n愈大(m愈小),則方差就愈小。21精選可編輯ppt【例8.1】
欲調(diào)查4月份100家企業(yè)的某項指標(biāo),首先從100家企業(yè)中抽取了一個含有5家樣本企業(yè)的簡單隨機樣本,由于填報一個月的數(shù)據(jù)需要每天填寫流水帳,為了減輕樣本企業(yè)的負擔(dān),調(diào)查人員對這5家企業(yè)分別在調(diào)查月內(nèi)隨機抽取3天作為調(diào)查日,要求樣本企業(yè)只填寫這3天的流水帳.調(diào)查的結(jié)果如下,要求根據(jù)這些數(shù)據(jù)推算100家企業(yè)該指標(biāo)的總量,并給出估計的95%置信區(qū)間.22精選可編輯ppt5家企業(yè)的調(diào)查結(jié)果樣本企業(yè)第一日第二日第三日1575964238415035160634485349562555423精選可編輯ppt解:已知N=100,M=30,n=5,m=3f1=n/N=5/100=0.05,f2=m/M=3/30=0.10首先計算樣本初級單元的均值和方差:樣本企業(yè)16013243393583945075571924精選可編輯ppt25精選可編輯ppt置信區(qū)間:26精選可編輯ppt三、對總體的比例的估計總體中具有所研究特征的二級單元占全體二級單元數(shù)的比例為:式中:Ai為第i個初級單元中具有所研究特征的二級單元數(shù)。對總體比例P的估計是:式中:ai為第i個樣本初級單元中具有所研究特征的二級單元數(shù)。27精選可編輯ppt性質(zhì)3:對于二階抽樣,如果兩個階段都是簡單隨機抽樣,則有估計量p的方差為:V(p)的無偏估計為:28精選可編輯ppt類似于前面總體方差的表達形式,有:29精選可編輯ppt【例8.2】欲調(diào)查某個新小區(qū)居民戶家庭裝潢聘請專業(yè)裝潢公司的比例。在15個單元中隨機抽取了5個單元,在這5個單元中分別隨機抽取了4戶居民并進行了調(diào)查,對這20戶調(diào)查結(jié)果如下:樣本單元第一戶第二戶第三戶第四戶一棟A座是是否否二棟C座否是否否三棟C座否否否是四棟C座否否否否五棟B座是否否否要求:根據(jù)這些數(shù)據(jù)推算居民家庭裝潢聘請專業(yè)裝潢公司的比例。30精選可編輯ppt解:聘請專業(yè)裝潢公司的居民戶為“1”,否則記為“0”
N=15M=12n=5m=431精選可編輯ppt標(biāo)準(zhǔn)差為s(p)=0.081若以95%的概率估計居民戶裝潢聘請專業(yè)公司的比例在:32精選可編輯ppt第三節(jié)初級單元大小不等的二階抽樣一、一般說明及符號二、估計量及其性質(zhì)三、估計量是自加權(quán)的條件及對初級單元的PPS抽樣33精選可編輯ppt一、一般說明及記號與整群抽樣類似,當(dāng)初級單元大小不相等時的二階抽樣有兩種處理方法:一種是將初級單元按大小分層,使層內(nèi)的初級單元大小大致相同,從而可用上一節(jié)的方法處理。另一種方法是考慮用不等概率抽樣抽取初級單元。34精選可編輯ppt符號說明:總體中初級單元的個數(shù)以及第一階抽取的樣本量:N,n第i個初級單元中二級單元的個數(shù)Mi第i個初級單元中第二階抽樣的樣本量mi第i個初級單元中第j個二級單元的觀測值:Yij樣本中第i個初級單元中的第j個二級單元的觀測值:yij第一階和第二階的抽樣比:35精選可編輯ppt總體及樣本二級單元數(shù):總體及樣本指標(biāo)總和:總體及樣本第i個初級單元指標(biāo)總和:總體及樣本第i個初級單元按二級單元的平均值36精選可編輯ppt總體及樣本二級單元的平均值:初級單元間的方差:第i個初級單元二級單元間的方差:37精選可編輯ppt二、估計量及其性質(zhì)
(一)對初級單元進行簡單隨機抽樣
如果二階抽樣中每個階段都采用簡單隨機抽樣,并且每個初級單元中二級單元的抽樣是相互獨立的,則對總體總和的估計可以采用簡單估計,也可以采用比率估計。1.簡單估計量這個估計量是無偏的。并且當(dāng)f2i=mi/Mi對所有的二級單元都相等時,是自加權(quán)的。38精選可編輯ppt其方差為:其無偏估計為:其中:39精選可編輯ppt簡單估計盡管無偏,但效果一般并不好。其原因是當(dāng)Mi不相等時,Yi的差異很大,從而中的第一項的數(shù)值比較大,估計量的方差也就大。40精選可編輯ppt2.比率估計量為了減小方差,可以考慮將初級單元的大小Mi作為輔助變量,采用比率估計量對總體總和進行估計。對總體總和的比率估計量:這個比率估計量是有偏的,但隨著樣本量的增加,其偏倚將趨于0。41精選可編輯ppt其近似均方誤差為:因為的差異一般不會很大,因此,當(dāng)Mi相差很大時,
要比無偏估計量的方差小得多。其樣本估計為:式中:42精選可編輯ppt(二)對初級單元進行放回不等概抽樣對初級單元進行放回不等概抽樣時,對每個初級單元,設(shè)定一個概率Zi(),進行n次獨立放回抽樣,每次抽到第i個初級單元的概率為Zi,i=1,2,…N。第二階抽樣則是在每個被抽到的初級單元中以某種形式抽取mi個次級單元。若某個初級單元被重復(fù)抽中,則原來在第二階抽樣抽到的這些次級單元都被放回,然后重新抽取mi個次級單元。43精選可編輯ppt對于二階抽樣中總體總和Y的估計,一般是先對每個被抽中的初級單元i,利用第二階抽樣抽到的樣本,估計初級單元的總和Yi,然后再利用單階抽樣的結(jié)果進一步估計Y。具體地說,是先給出Yi的一個無偏估計,再利用Hansen-Hurwitz估計量對總體總和Y進行估計:由于是Yi的無偏估計,可以證明,是Y的無偏估計。44精選可編輯ppt的方差為:的無偏估計為:注:上面的討論中并沒有規(guī)定第二階的抽樣方式,且上式的方差估計量的形式與第二階抽樣的方式無關(guān)。45精選可編輯ppt如果希望是自加權(quán)的,由則要求:f0為總體中任意一個二級單元被抽中的概率如果f0事先確定,則:即第二階抽樣的抽樣比與zi成反比。46精選可編輯ppt當(dāng)估計量是自加權(quán)時,它的方差估計也有以下簡單的形式:其中:47精選可編輯ppt在實際應(yīng)用中,最重要也是最常用的情形是第一階抽樣對初級單元進行PPS抽樣,即令:若第二階抽樣是簡單隨機的,則此時總體總和Y的估計量簡化為:若進一步令mi=m,i=1,2…n,則估計量是自加權(quán)的,此時:其中:是對的無偏估計。48精選可編輯ppt此時的一個無偏估計為:49精選可編輯ppt采用二階抽樣方法抽10個樓層進行調(diào)查,第一階抽樣為放回的、按與每座建筑擁有的樓層數(shù)成比例的不等概抽樣抽取5座建筑,第二階按簡單隨機抽樣對每座建筑抽取兩個樓層。對10個樓層居民人數(shù)的調(diào)查如下:高層建筑ABCDEFGHIJ樓層12121615101610181620【例8.3】某小區(qū)有10座高層建筑,每座高層建筑有的樓層數(shù)如下:50精選可編輯ppt一階樣本序號12345居民數(shù)12,1815,1819,1316,1016,11要求:對小區(qū)總居民數(shù)進行估計,并給出估計的精度。解:n=5m=2M0=14551精選可編輯ppt估計量的方差:估計量的標(biāo)準(zhǔn)差:s=98.88
小區(qū)居民數(shù)為2146人,在置信度為95%時,估計的相對誤差為:52精選可編輯ppt(三)對初級單元進行不放回不等概抽樣
適用:初級單元進行不放回不等概抽樣,二級單元按簡單隨機抽樣總體總量Y的估計為霍維茨—湯普森估計:其方差估計為:53精選可編輯ppt如果n固定,V的估計也可以用:54精選可編輯ppt第四節(jié)其他問題
總樣本量nm可有兩種方法(二階抽樣):(1).根據(jù)調(diào)查費用確定(2).根據(jù)設(shè)計效應(yīng)確定:即用簡單隨機抽樣的樣本量乘以設(shè)計效應(yīng)deff.(1.3<deff<3之間)對于初級單元大小相等的二階抽樣,如何設(shè)計兩個階段落樣本量,即如何確定n和m是需要考慮的問題。由于影響精度的主要原因是初級單元之間的差異,因此多抽一些初級單元,少抽一些二級單元,但往往初級單元的調(diào)查費用比二級單元費用高。一般好的設(shè)計可以在調(diào)查總的費用一定的情況下,使估計的精度最高;或在一定的精度條件下,使調(diào)查費用最省,這就是最優(yōu)樣本量的配置或最優(yōu)抽樣比f1和f2的確定問題。55精選可編輯ppt考慮費用函數(shù)為最簡單的一種情形:C=c0+c1n+c2nmC0:為固定費用,如場租費等;
c1:每調(diào)查一個初級單元的費用
c2:每調(diào)查一個二級單元的費用另一方面,當(dāng)各初級單元大小都相等時,可寫為:
因此,在固定C下極小化,或固定V條件下極小化C,即可推導(dǎo)出m的最優(yōu)值mopt56精選可編輯ppt實際應(yīng)用中,m應(yīng)為整數(shù),但mopt往往不是整數(shù),令為mopt
的整數(shù)部分,則m的取值規(guī)則為:(1)當(dāng),則取(2)當(dāng),則取(3)當(dāng)或,則取m=M。求出m后,根據(jù)總費用函數(shù),就可以確定n,從而確定最優(yōu)抽樣比f1和f2.m的最優(yōu)值為:其中:57精選可編輯ppt【例8.4】p184若c1/c2=10,試確定最優(yōu)m、n。解:首先計算mopt由例8.1知:由本章附錄2知:58精選可編輯ppt由因此因為所以m=2其次計算nopt整理得nopt≈3.449,因而可取n=4.59精選可編輯ppt
二、三階及多階段抽樣(一)各級單元大小相等時的多階段抽樣1.三階抽樣總體初級單元
二級單元
三級
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年全球及中國臺式振動臺行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030全球監(jiān)視雷達系統(tǒng)行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國三重四級桿液質(zhì)聯(lián)用儀行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030全球可重復(fù)使用墊料氣囊行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球顏色分選系統(tǒng)行業(yè)調(diào)研及趨勢分析報告
- 2025標(biāo)準(zhǔn)的特約經(jīng)銷商合同
- 2025安徽省合肥市勞動合同范本
- 2025天津工業(yè)大學(xué)技術(shù)合同審批表
- 地產(chǎn)項目開發(fā)建設(shè)合同
- 房地產(chǎn)銷售代理合同樣本
- 走新型城鎮(zhèn)化道路-實現(xiàn)湘潭城鄉(xiāng)一體化發(fā)展
- 江蘇中國中煤能源集團有限公司江蘇分公司2025屆高校畢業(yè)生第二次招聘6人筆試歷年參考題庫附帶答案詳解
- 【語文】第23課《“蛟龍”探?!氛n件 2024-2025學(xué)年統(tǒng)編版語文七年級下冊
- 2024版冷水機組安裝合同
- 北師版七年級數(shù)學(xué)下冊第二章測試題及答案
- 【考試版】蘇教版2022-2023學(xué)年四年級數(shù)學(xué)下冊開學(xué)摸底考試卷(五)含答案與解析
- 血液透析個案護理兩篇
- 第八章 客戶關(guān)系管理
- 新版人教版高中英語選修一、選修二詞匯表
- 2022年河北邯鄲世紀(jì)建設(shè)投資集團有限公司招聘筆試試題及答案解析
- 萬物有靈且美(讀書心得)課件
評論
0/150
提交評論