第四章(整群抽樣)_第1頁(yè)
第四章(整群抽樣)_第2頁(yè)
第四章(整群抽樣)_第3頁(yè)
第四章(整群抽樣)_第4頁(yè)
第四章(整群抽樣)_第5頁(yè)
已閱讀5頁(yè),還剩45頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣調(diào)查課----整群抽樣單位:浙江財(cái)經(jīng)學(xué)院數(shù)統(tǒng)學(xué)院課程:抽樣調(diào)查課教師:張銳1編輯版pppt整群抽樣一、整群抽樣的基本概念二、群規(guī)模相等條件下的估計(jì)三、群規(guī)模不相等條件下的估計(jì)2編輯版pppt一、整群抽樣的基本概念問題的提出整群抽樣的定義整群抽樣的特點(diǎn)群的劃分群規(guī)模簡(jiǎn)介3編輯版pppt一個(gè)新建的居民區(qū)由近百幢居民樓組成,其中住戶總數(shù)達(dá)數(shù)千戶。欲用抽樣調(diào)查方法估計(jì)該居民區(qū)現(xiàn)有的電話擁有率。

a.一種是用簡(jiǎn)單隨機(jī)抽樣,抽取一定樣本量的住戶,譬如說共抽取n=250戶進(jìn)行調(diào)查,然后用簡(jiǎn)單估計(jì)方法對(duì)全居民區(qū)的電話擁有率進(jìn)行估計(jì)。

b.另一種方法是按一定方法抽取一定數(shù)量的居民樓,譬如說15幢或20幢樓,然后對(duì)這些樓中的每個(gè)住戶都進(jìn)行調(diào)查,根據(jù)調(diào)查結(jié)果來估計(jì)整個(gè)居民區(qū)的電話擁有率。實(shí)際問題的提出:4編輯版pppt

這兩種方法的根本差別是:抽樣單元不同。前者以住戶為抽樣單元,后者則以居民樓為抽樣單元。后一種抽樣方法稱為整群抽樣。

5編輯版ppptDef.1一般地說,如果總體中所有較小的基本單元可以以某種形式組成數(shù)量較少但規(guī)模較大的單元;或反過來說,每個(gè)“大”單元都由若干“小”單元組成,稱這些“大”單元為初級(jí)(抽樣)單元(primarysamplingunit),“小”單元為次級(jí)(抽樣)單元(secondarysamplingunit).Def.2

在總體中,按一定方式抽取n個(gè)初級(jí)單元,調(diào)查每個(gè)被抽中的初級(jí)單元中所包含的全部次級(jí)單元,這種抽樣方法稱為整群抽樣(clustersampling),也稱集團(tuán)抽樣。6編輯版pppt定義:整群抽樣是將總體劃分為若干群,然后以群為抽樣單元,從樣本中隨機(jī)抽取一部分群,對(duì)選中的群的所有基本單元進(jìn)行調(diào)查的一種抽樣技術(shù)。

這里的群(cluster)就是指初級(jí)單元,整群抽樣就是指將總體中的小單元整群整群地進(jìn)行抽群。在前面的例子中,居民樓就是群(初級(jí)單元),而住戶則是次級(jí)單元,對(duì)居民樓的抽樣就是一種對(duì)住戶的整群抽樣。整群抽樣的定義7編輯版pppt整群抽樣的特點(diǎn)1)

抽樣框的編制簡(jiǎn)單2)

實(shí)施便利,節(jié)省費(fèi)用3)

抽樣誤差相對(duì)比較大些發(fā)揮整群抽樣的優(yōu)勢(shì),因?yàn)槠涫r(shí)省力,每個(gè)單元的平均調(diào)查費(fèi)用比較少,故可通過增大樣本量的方法彌補(bǔ)精度的損失。8編輯版pppt

劃分群的標(biāo)準(zhǔn)總體方差=群間方差+群內(nèi)方差群內(nèi)方差群間方差

此消彼長(zhǎng)整群抽樣是對(duì)被抽中的群的群內(nèi)的每個(gè)單元進(jìn)行抽樣,因此群內(nèi)方差的影響很小,主要的誤差是由群間方差影響的。分群的標(biāo)準(zhǔn):使同一群內(nèi)各單元之間的差異大一些即群內(nèi)方差大些,群與群的差異盡可能的小些,即群間方差小些。9編輯版pppt群的規(guī)模群的規(guī)模指組成群的單元的數(shù)量。群的規(guī)模比較靈活,可大可小,規(guī)模大些,估計(jì)的精度差些,但是費(fèi)用省。規(guī)模小的,估計(jì)的精度可以提高但是費(fèi)用大。費(fèi)用與精度根據(jù)實(shí)際需要而定。10編輯版pppt群規(guī)模相等的整群抽樣一、群規(guī)模相等簡(jiǎn)介二、符號(hào)說明三、總體均值的估計(jì)及性質(zhì)四、估計(jì)量方差的估計(jì)五、設(shè)計(jì)效應(yīng)11編輯版pppt總體中的N個(gè)初級(jí)單元即群的大?。ㄈ簝?nèi)次級(jí)單元數(shù))都相等的情形。也就是,若總體有N個(gè)群時(shí),每個(gè)群中所包含的單元數(shù)為M相等時(shí),則稱群規(guī)模相等,在實(shí)際問題中,只要群的規(guī)模接近時(shí),也稱為群規(guī)模相等。這時(shí),對(duì)群的抽取一般采用簡(jiǎn)單隨機(jī)抽樣(無放回)。

一、群規(guī)模相等簡(jiǎn)介12編輯版pppt二、符號(hào)說明13編輯版pppt總體樣本14編輯版pppt三、總體均值的估計(jì)及性質(zhì)總體平均值的估計(jì)為:性質(zhì)1)的無偏估計(jì)建立如下盒子模型證明:15編輯版pppt……在這個(gè)新的盒子中有N個(gè)小盒子,每個(gè)小盒子中含元素(Yij,j=1,2,…,M),它們的平均數(shù)是,而全體的平均數(shù)恰好構(gòu)成盒子的平均數(shù)。16編輯版pppt我們的模型是從這N個(gè)小盒子中隨機(jī)無放回地抽取n個(gè),這n個(gè)小盒子相應(yīng)的平均數(shù)為而這n個(gè)的平均數(shù)恰好構(gòu)成樣本平均數(shù),總體均值,樣本均值,故樣本均值是總體均值的無偏估計(jì)。(為什么?)……17編輯版pppt?

四、估計(jì)量方差的估計(jì)18編輯版pppt根據(jù),的一個(gè)無偏估計(jì)是:在實(shí)際問題中,具有某種特性的次級(jí)單元在總體中所占的比例P的估計(jì)常用整群抽樣,不僅方便而且效率高,在各群大小相等的情況下,利用前面對(duì)的討論,推導(dǎo)出對(duì)P的估計(jì)量及其方差。19編輯版pppt五、設(shè)計(jì)效應(yīng)我們已經(jīng)研究了簡(jiǎn)單隨機(jī)抽樣和較復(fù)雜的分層抽樣、不等概率抽樣、整群抽樣,抽樣方法的不同會(huì)引起估計(jì)量精度的不同。之所以采用比較復(fù)雜的抽樣手段,目的無非是提高估計(jì)的效果。因此,看一個(gè)抽樣方案的效果究竟如何,一個(gè)比較好的辦法是將它與簡(jiǎn)單隨機(jī)抽樣在相同的樣本容量之下對(duì)精度作比較——這就是基什(Kish)在1965年提出的設(shè)計(jì)效應(yīng)(designeffect,簡(jiǎn)記為deff):Deff=(所考慮抽樣設(shè)計(jì)估計(jì)量的方差)/(相同樣本量下簡(jiǎn)單隨機(jī)抽樣估計(jì)量的方差)20編輯版pppt設(shè)計(jì)效應(yīng)值愈大,表明它的效率愈低。若deff>1,表明所考慮的抽樣設(shè)計(jì)的效率不如簡(jiǎn)單隨機(jī)抽樣;若deff<1,表明該抽樣設(shè)計(jì)的效率比簡(jiǎn)單隨機(jī)抽樣高。在整群抽樣中,我們?cè)谇懊嬉呀?jīng)指出:如何劃分群以及群的大小如何控制對(duì)于估計(jì)的精度都有影響,這就涉及到設(shè)計(jì)效應(yīng)。根據(jù)設(shè)計(jì)效應(yīng)的定義,考察在擁有NM個(gè)次級(jí)單元的總體中抽取容量為nM的簡(jiǎn)單隨機(jī)樣本,樣本均值的方差為:21編輯版pppt因此,群大小相等的整群抽樣的設(shè)計(jì)效應(yīng)為:上面結(jié)果意味著:按同樣的樣本量(以次級(jí)單元計(jì))整群抽樣的方差約為簡(jiǎn)單隨機(jī)抽樣的方差的倍。換句話說,為了獲得同樣的精度,整群抽樣的樣本量必須是簡(jiǎn)單隨機(jī)抽樣的樣本量的倍。22編輯版pppt群內(nèi)相關(guān)系數(shù)23編輯版pppt例6.1

在一次對(duì)某寄宿中學(xué)在校生零花錢的調(diào)查中,以宿舍為群進(jìn)行整群抽樣。每個(gè)宿舍有8名學(xué)生。用簡(jiǎn)單隨機(jī)抽樣在全部510間宿舍中抽取n=12間宿舍。全部96個(gè)學(xué)生上周每人零花錢及相關(guān)數(shù)據(jù)如下。1)

試估計(jì)生平均零花錢,并給出其95%的置信區(qū)間;2)

試估計(jì)群內(nèi)相關(guān)系數(shù)與設(shè)計(jì)效應(yīng)。3)如果是簡(jiǎn)單隨機(jī)抽樣,需要多少樣本?24編輯版pppti

240,187,162,185,206,197,154,173188.0027.19210,192,184,148,186,175,169,180180.5017.98149,168,145,130,170,144,125,167149.7517.32202,187,166,232,205,263,198,210207.8829.17210,285,308,198,264,275,183,231244.2545.20394,256,192,280,267,334,216,289278.5063.87192,121,172,165,152,224,195,241182.7538.77230,205,187,176,212,253,189,240211.5027.48274,208,195,307,264,258,210,309253.1344.52232,187,150,182,175,212,169,222191.1328.29342,294,267,309,258,198,244,286274.7543.70228,294,182,312,267,254,232,298258.3843.52

25編輯版pppt(1)解:已知N=510,n=12,M=8,f=n/N=0.0235故26編輯版pppt于是的置信度為95%的置信區(qū)間為也即27編輯版pppt(2)計(jì)算群內(nèi)相關(guān)系數(shù)與設(shè)計(jì)效應(yīng)解:由前已算出樣本群間方差而群內(nèi)方差為28編輯版pppt29編輯版pppt(3)若令為簡(jiǎn)單隨機(jī)抽樣的樣本量則即可達(dá)到整群抽樣96戶樣本量相同的估計(jì)精度30編輯版pppt群規(guī)模不相等的整群抽樣一、等概抽樣,簡(jiǎn)單估計(jì)二、等概抽樣,加權(quán)估計(jì)三、等概抽樣,比率估計(jì)四、例子31編輯版pppt對(duì)總體均值的估計(jì)為可以看出,的方差估計(jì)為等概抽樣,簡(jiǎn)單估計(jì)32編輯版pppt此法特點(diǎn)估計(jì)量是有偏的操作簡(jiǎn)便,易于掌握和使用適用條件,群之間的規(guī)模差異不大時(shí)

33編輯版pppt思路:以群規(guī)模Mi為權(quán)數(shù),得到群總和yi,進(jìn)而求得群總和均值,再除以群平均規(guī)模等概抽樣,加權(quán)估計(jì)34編輯版pppt估計(jì)公式為:若未知,可用樣本群平均規(guī)模代替35編輯版pppt總體總量Y的估計(jì)為總量估計(jì)的另一公式為36編輯版pppt估計(jì)量的方差為它的無偏估計(jì)為均值估計(jì)的方差為37編輯版pppt總體均值估計(jì)為這里輔助變量不是Xi而是群規(guī)模Mi總體總量估計(jì)為等概抽樣,比率估計(jì)38編輯版pppt估計(jì)量的方差分別是39編輯版pppt與的樣本估計(jì)分別是40編輯版pppt

41編輯版pppt背景:某縣有33個(gè)鄉(xiāng),726個(gè)村,該年度某種作物總種植面積30525畝,現(xiàn)采用等概抽樣隨機(jī)抽出10個(gè)鄉(xiāng),要求估計(jì)全縣總產(chǎn)量,計(jì)算抽樣誤差。調(diào)查資料如下:案例分析

42編輯版pppt樣本鄉(xiāng)編號(hào)村莊數(shù)Mi作物總產(chǎn)(鄉(xiāng))yi(萬公斤)種植面積(鄉(xiāng))xi(畝)123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合計(jì)209257.18940——43編輯版pppt分別采用幾種方法估計(jì)1、等概抽樣,簡(jiǎn)單估計(jì)44編輯版pppt評(píng)價(jià):方法雖簡(jiǎn)單,卻是有偏估計(jì)45編輯版pppt2、等概抽樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論