版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第七章整群抽樣clustersampling2本章要點
本章給出整群抽樣的定義,討論了群大小相等的整群抽樣方法及與之匹配的估計量、估計量的方差及方差的估計量。具體要求:①掌握群大小相等的情形下整群抽樣的簡單估計量及方差的無偏估計,了解群內(nèi)方差、群間方差概念及其對整群抽樣精度的影響,掌握群的劃分原則。②掌握估計總體比例的整群抽樣方法及簡單估計量。
3第一節(jié)抽樣方式4設(shè)想杭州市教育局想了解杭州中學(xué)生的體質(zhì)狀況。調(diào)查單位:杭州市每一個中學(xué)生簡單隨機抽樣或分層抽樣的抽樣框應(yīng)如何構(gòu)建?調(diào)查實施會有什么困難?有兩個困難:1)編制全體中學(xué)生的抽樣框,非常困難;2)樣本單位可能遍布全市,對如此分散的樣本逐個進行訪問,工作量非常大。但是如果在杭州地區(qū)按學(xué)校進行抽樣,在抽得的幾所學(xué)校中對該校所有中學(xué)生進行全面調(diào)查,抽樣框的編制和調(diào)查實施都大大簡化。。這就是整群抽樣。5
(一)定義
若總體可分為A個初級單位(稱為群),每個初級單位包含若干次級單位。按照某種方式從總體中抽取a個群,對這些群中的所有次級單位全部進行調(diào)查。
這種抽樣方式稱為整群抽樣。一、整群抽樣的定義及其實施理由6A=124個班樣本200人···整群抽樣圖示例:從全校124個班中隨機抽取a=5個班構(gòu)成樣本?!ぁぁ?在實際工作中,整群抽樣方法在社會經(jīng)濟、農(nóng)林牧業(yè)以及企業(yè)產(chǎn)品質(zhì)量檢驗中被廣泛采用。例如,人口調(diào)查、家計調(diào)查通常以居委會(村委會)或調(diào)查小區(qū)作為群進行抽樣;農(nóng)林牧業(yè)調(diào)查以地塊為群進行抽樣;工業(yè)產(chǎn)品質(zhì)量檢驗:在連續(xù)生產(chǎn)的產(chǎn)品線上每隔20小時抽取1小時生產(chǎn)的全部產(chǎn)品進行檢驗。8(二)實施整群抽樣的原因1、當(dāng)缺少調(diào)查單元的必要信息無法對其直接編制抽樣框?qū)嵤└怕食闃?,而由調(diào)查單元組成的群是現(xiàn)成的或者群很容易劃分、編制群抽樣框非常容易時,常采用整群抽樣。例如:對杭州中學(xué)生體質(zhì)狀況的調(diào)查,若以學(xué)校為單位進行整群抽樣,就大大簡化了抽樣框的編制。92、為了使調(diào)查實施便利、節(jié)省費用而采用整群抽樣。大規(guī)模調(diào)查中,調(diào)查單位的空間分布很廣,整群抽樣可使調(diào)查單位相對集中,調(diào)查實施較便利、節(jié)省費用。例如,城鎮(zhèn)居民家庭生活水平調(diào)查,一般以居委會為群進行整群抽樣調(diào)查。103、對某些由特殊結(jié)構(gòu)的群組成的總體實施整群抽樣,能使精度有較大提高。例如:人口統(tǒng)計中估計性別比例,一個家庭本身就具有一個性別結(jié)構(gòu),以家庭為群進行整群抽樣比直接對個人進行調(diào)查精度要高。11二、整群抽樣的特點1、群與群之間不重疊,總體的任何一個基本單位都必須且只能歸于某一群;2、整群抽樣是以群為單位的概率抽樣;3、群間是抽樣調(diào)查,對于被抽中的群內(nèi)是全面調(diào)查。整群抽樣的誤差取決于群間差異,而不受群內(nèi)差異的影響。劃分群時應(yīng)使“群間差異盡量小、群內(nèi)差異盡量大”。125、整群抽樣的缺點:由于調(diào)查單位比較集中、在總體中的分布不夠均勻,且群內(nèi)調(diào)查單位指標(biāo)值或多或少具有一定的正相關(guān)性,因此在樣本量相同的條件下,整群抽樣的精度可能不如簡單隨機抽樣高,尤其當(dāng)群間差異較大的時候。但由于平均單位調(diào)查費用較少,因此可以把節(jié)省的費用用來適當(dāng)擴大群樣本量以提高整群抽樣的精度。4、整群抽樣的最大優(yōu)點:便于組織實施,節(jié)省費用和時間。13思考:整群抽樣與分層抽樣都需要對總體進行劃分,劃分的原則有何區(qū)別?理由是什么?14群可以是自然形成的實體或現(xiàn)有的機構(gòu)、組織,如城鎮(zhèn)、企業(yè)、學(xué)校、街道等;也可以是人為劃分的單位,比如對職工分組、生產(chǎn)線的產(chǎn)品批次等。群的大小可以相等,也可能不等。三、群的劃分當(dāng)群需要通過人為劃分時,需考慮兩個問題:
一是如何定義群的組成,二是如何確定群的規(guī)模。15群的劃分原則1、如何定義群的組成基本出發(fā)點:群的組成應(yīng)有利于估計量精度盡可能高。群間差異盡量小、群內(nèi)差異盡量大使各群間盡量有相同或相近的結(jié)構(gòu),這樣群間差異就小,只抽少數(shù)群就可以很好地代表總體。16高高高…中中中…低低低…高…中…低…群1高…中…低…群2高…中…低…群1高…中…低…群A高…中…低…群2高…中…低…群a++++………=總體N高高…中中…低低…樣本n各群結(jié)構(gòu)相近,群間差異小群內(nèi)差異大樣本結(jié)構(gòu)與總體相近172、如何確定群的規(guī)模群的規(guī)模的選擇取決于精度與費用之間的平衡。群的規(guī)模大——調(diào)查費用比較節(jié)省但精度較低;群的規(guī)模小——精度較高但費用較多,需要在兩者間權(quán)衡。除了依靠實踐經(jīng)驗外,還可對假定的方差函數(shù)和費用函數(shù)在理論上進行最優(yōu)選擇。在正常情況下,群的規(guī)模不宜過大,對于規(guī)模很大的群,通常需要采用多階段抽樣。18
第二節(jié)群大小相等的整群抽樣
宿舍1宿舍2宿舍3宿舍4宿舍5宿舍6宿舍7宿舍8學(xué)生158911239911011112096學(xué)生28383891059910011580學(xué)生37479949813211611763學(xué)生482111109107879999130學(xué)生5661017912999107106105學(xué)生6876980901241051208675.0089.0095.67104.67108.50106.33112.8393.33125.60233.60299.07177.87287.5042.2772.57527.87例1:在一次對某寄宿中學(xué)在校生零花錢的調(diào)查中,以宿舍作為群進行整群抽樣。每個宿舍有6個學(xué)生。用簡單隨機抽樣在全部315間宿舍中抽取8間宿舍。每人每周零花錢數(shù)據(jù)如下表所示。試估計該學(xué)校平均每個學(xué)生每周的零花錢20總體有A群,每群都有M個調(diào)查單位,
總體容量為AM。從中簡單隨機抽取a群,樣本容量為aM,抽樣比f=a/A。一、記號及目標(biāo)量總體第i群第j個單元的指標(biāo)值:Yij21總體第i群的群總值總體總值總體第i群的群均值按群平均的總體均值按調(diào)查單位平均的總體均值群總值的平均數(shù)22總體總方差:總體群間方差定義為:總體群內(nèi)方差定義為:23三個方差之間的關(guān)系為:24樣本第i群的總值樣本第i群的均值按群平均的樣本均值按調(diào)查單位平均的樣本均值樣本第i群第j個單位指標(biāo)值yij樣本總值群總值的平均數(shù)25樣本總方差:樣本群間方差:樣本群內(nèi)方差:26樣本方差的關(guān)系式:由于群的選取是簡單隨機的,因此與分別是與的無偏估計
不是的無偏估計。27群規(guī)模相等時,對群的抽取為簡單隨機抽樣,將群總值Yi作為群的指標(biāo)值,則總體為:樣本為:二、估計量及其性質(zhì)281、總體均值的估計量29估計量方差的另一種計算:30例1:在一次對某寄宿中學(xué)在校生零花錢的調(diào)查中,以宿舍作為群進行整群抽樣。每個宿舍有6個學(xué)生。用簡單隨機抽樣在全部315間宿舍中抽取8間宿舍。每人每周零花錢數(shù)據(jù)如下頁表所示。
試估計該學(xué)校平均每個學(xué)生每周的零花錢,并給出置信度為95%的置信區(qū)間。31
宿舍1宿舍2宿舍3宿舍4宿舍5宿舍6宿舍7宿舍8學(xué)生158911239911011112096學(xué)生28383891059910011580學(xué)生37479949813211611763學(xué)生482111109107879999130學(xué)生5661017912999107106105學(xué)生6876980901241051208675.0089.0095.67104.67108.50106.33112.8393.33125.60233.60299.07177.87287.5042.2772.57527.8732解:2、總體總值的估計量34例2:為估計某海域的魚的總量,從整個海域內(nèi)的320個區(qū)域中隨機抽取20個區(qū)域作為樣本進行調(diào)查,每個區(qū)域中又包含5個基本區(qū)域。調(diào)查得數(shù)據(jù)如下(單位:噸):樣本群12345678魚量合計8.417.547.549.913.018.847.331.4樣本群910111213141516魚量合計39.917.37.730.018.314.050.824.0樣本群17181920魚量合計30.915.245.830.6yi估計整個海域的魚量并計算抽樣誤差。3536思考郵局欲估計每個家庭的平均訂報份數(shù),轄區(qū)內(nèi)共有4000戶,劃分為400個群,每群10戶,現(xiàn)隨機抽取4個群,取得資料如下:試估計平均每戶家庭的訂報份數(shù)及轄區(qū)總的訂報份數(shù),并計算估計量的方差。群各戶訂報數(shù)合計12341,2,1,3,3,2,1,4,1,11,3,2,2,3,1,4,1,1,22,1,1,1,1,3,2,1,3,11,1,3,2,1,5,1,2,3,11920162037若直接對調(diào)查單元進行簡單隨機抽樣
三、整群抽樣效果分析可見在相同的調(diào)查單元樣本量下,只有當(dāng)群間方差比總體方差小時,整群抽樣才優(yōu)于簡單隨機抽樣。38而總體方差與群內(nèi)方差、群間方差之間有如下關(guān)系:對于固定的總體,是常數(shù),故當(dāng)群內(nèi)方差增大時群間方差必然減小。因此群的劃分原則應(yīng)是使群內(nèi)差異盡可能大,群間差異盡可能小,以保證整群抽樣的效果。39對于例1,如果我們直接對所有學(xué)生采用簡單隨機抽樣抽取48人進行調(diào)查,將表1的數(shù)據(jù)視為樣本量為48的簡單隨機樣本,則
可見整群抽樣誤差比簡單隨機抽樣要大,原因在于宿舍間平均零花錢之間差異相對較大,401、群內(nèi)相關(guān)系數(shù)
群內(nèi)相關(guān)系數(shù)描述的是群內(nèi)成對個體單位之間的相關(guān)程度,表達為
四、群內(nèi)相關(guān)系數(shù)與設(shè)計效應(yīng)協(xié)方差方差41當(dāng)A大時上式可寫成若各群均值都相等,則群間方差為0,此時達到最小值
將用和代替,可得
所以取值于
若群內(nèi)各單位值都相等,群內(nèi)方差為0,ρ達到最大值1422、整群抽樣的設(shè)計效應(yīng)而相同樣本量下簡單隨機抽樣的方差為因此整群抽樣的設(shè)計效應(yīng)為43Deff何時>1,<1,=1?44相同樣本量的情況下,整群抽樣的估計量方差為簡單隨機抽樣的方差的倍。要想獲得相同的估計量方差,那么整群抽樣的樣本量必須是簡單隨機抽樣樣本量的倍。這個事實提供給我們確定整群抽樣的樣本量的重要思路!的另一個啟示:45在例1中,Deff=2.741,即要想達到與簡單隨機抽樣同樣的誤差,整群抽樣的樣本量應(yīng)為簡單隨機抽樣的2.741倍。樣本量的確定46實際調(diào)查中,群內(nèi)相關(guān)系數(shù)可由小規(guī)模試抽樣的樣本資料來估計47例3
對全國成年人身體尺寸測量,若以工作單位為現(xiàn)成的群,則這些單位一般不是等規(guī)模,可用平均大小比如人計算。通過少量樣本的試抽樣,得單位內(nèi)同性別人的群內(nèi)相關(guān)估計
。根據(jù)精度要求,簡單隨機抽樣需要樣本量為6147人,那么整群抽樣需要多少人才能達到同樣的估計精度?整群抽樣需要人數(shù)人約等于個群r48第三節(jié)估計總體比例的整群抽樣49
在估計總體比例時普遍采用整群抽樣,優(yōu)點如下:判斷一個單元是否具有某項特征的調(diào)查,調(diào)查費用很低,而組織、差旅費相對較大;整群抽樣可以大大節(jié)省組織、差旅費用,從而使總費用比較節(jié)??;由于比例總體的方差不超過0.25,群間方差一般也比較小,因此估計總體比例時采用整群抽樣能有較高的精度。對某些特殊結(jié)構(gòu)的群,整群抽樣甚至比直接對調(diào)查單元的簡單隨機抽樣有高得多的精度。一、問題的提出50設(shè)總體含A個群,每個群均含M個調(diào)查單元,定義
1,第i群第j調(diào)查單元具某特征,
=0,不具有某特征二、估計量及其性質(zhì)則總體第i群具有某特征的調(diào)查單元的總數(shù)及比例為:樣本第i群中具有某特征的調(diào)查單元數(shù)及群比例為51總體中具有某特征的調(diào)查單元的總數(shù)及總體比例為:樣本中具有某特征的調(diào)查單元數(shù)及樣本比例為Pi的均值52由于對群的抽取為簡單隨機抽樣,將群比例Pi作為群的指標(biāo)值,則總體為:
樣本為:srs53例:對某居民小區(qū)居民戶進行網(wǎng)絡(luò)使用情況的調(diào)查,以每個樓層(相當(dāng)于居民小組)為群進行整群抽樣。每個樓層都有8個住戶。用簡單隨機抽樣在全部510個樓層中抽取12個樓層。下表是12個樣本樓層使用網(wǎng)絡(luò)的住戶數(shù)及在樓層8戶中所占的比例的資料,試對該小區(qū)的網(wǎng)絡(luò)使用率進行估計。123456i789101112i4356340.50.3750.6250.750.3750.55264350.6250.250.750.50.3750.625上網(wǎng)戶數(shù)上網(wǎng)戶數(shù)占比占比54思考:汽車運輸公司抽樣檢查在用車輛中不安全輪胎的比例。在175輛車中隨機抽取了25輛,其不安全輪胎數(shù)如表所示。試估計該公司的汽車中不安全輪胎的比例及其方差。不安全輪胎的個數(shù)(個)汽車數(shù)量(輛)0123458723小結(jié)估計總體均值估計總體比例561.下面關(guān)于群內(nèi)相關(guān)系數(shù)的說法錯誤的是:A.若群內(nèi)各單元值都相等則
,此時
取最大值1B.若群內(nèi)方差與總體方差相等,則
,,此時表示分群是完全隨機的C.若
取負(fù)值,則整群抽樣的效果好于簡單隨機抽樣。D.若取正值,則整群抽樣的效果好于簡單隨機抽樣。思考與練習(xí):572.下面關(guān)于整群抽樣的說法,有哪些是正確的?()A.通常情況下抽樣誤差比較大B.整群抽樣可以看作為多階段抽樣的特殊情形,即最后一階抽樣是100%的抽樣C.調(diào)查相對比較集中,實施便利,節(jié)省費用D.整群抽樣的方差約為簡單隨機抽樣的方差的
倍E.為了獲得同樣的精度,整群抽樣的樣本量是簡單隨機抽樣的
倍。583.關(guān)于整群抽樣(群規(guī)模相等)的設(shè)計效應(yīng),下面說法正確的有()A.B.為了獲得同樣的精度,整群抽樣的樣本量是簡單隨機抽樣的
倍C.要提高整群抽樣的估計效率,可通過增大群內(nèi)相關(guān)系數(shù)來實現(xiàn)D.要提高整群抽樣估計效率,可通過增大群內(nèi)單元的差異實現(xiàn)E.整群抽樣的精度取決于群間方差,群間方差越大,則估計量的精度越高4、若欲調(diào)查某城市的豬肉人均消費量,討論下列情況下采用街道作為群的整群抽樣是否合適;如果不合適,你認(rèn)為應(yīng)采用什么抽樣方式好:(1)少數(shù)民族的居住比較集中;(2)少數(shù)民族比較均勻地分布在各條街道;(3)少數(shù)民族分散在各街道,但比重不同。60案例:全國成年人的體型尺寸測量的抽樣方案考慮到我國人口分布的現(xiàn)狀及人體測量的特點,在制定抽樣方案時應(yīng)對總體做必要的劃分,對每個子總體:成年男子、成年女子都采用分層整群抽樣。1、層的劃分及群的組成采用分層整群抽樣必須考慮到影響人的體型尺寸的因素,比如地域、年齡的影響,同時考慮到測量工作的方便。61(1)按地域分層多種歷史資料表明,中國人人體尺寸與地域的關(guān)系極為密切。參考有關(guān)資料,按人類學(xué)的觀點將全國各省市自治區(qū)分為6個自然區(qū)域。在同一區(qū)域中,有的由于地理、氣候、遺傳等因素影響,差別仍較大,因此再進一步根據(jù)幾種歷史資料中各省成年人平均身高資料,劃分為高、中上、中下及矮四檔。最終所有省區(qū)分為12個層,在抽樣時為了工作方便,在層內(nèi)選取一個或幾個?。ㄊ小⒆灾螀^(qū))進行測量。為了今后數(shù)據(jù)分析方便,在各層中采用按人口總數(shù)比例分配的方法。62表
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院裝修合同
- 2025企業(yè)合同信用管理制度
- 水泥采購合同范本
- 高管年薪制勞動合同范本
- 小型建筑安裝工程施工合同
- 2025南京市預(yù)拌混凝土買賣合同
- 購銷玉米合同玉米收購合同
- 2025標(biāo)準(zhǔn)的出租車承包合同
- 2025年粵教新版選修6地理上冊階段測試試卷含答案
- 2025年新世紀(jì)版必修二歷史下冊階段測試試卷
- 人教版《道德與法治》四年級下冊教材簡要分析課件
- 2023年MRI技術(shù)操作規(guī)范
- 辦公用品、易耗品供貨服務(wù)方案
- 自行聯(lián)系單位實習(xí)申請表
- 醫(yī)療廢物集中處置技術(shù)規(guī)范
- 媒介社會學(xué)備課
- 2023年檢驗檢測機構(gòu)質(zhì)量手冊(依據(jù)2023年版評審準(zhǔn)則編制)
- 三相分離器原理及操作
- 新教科版五年級下冊科學(xué)全冊每節(jié)課后練習(xí)+答案(共28份)
- 葫蘆島尚楚環(huán)??萍加邢薰踞t(yī)療廢物集中處置項目環(huán)評報告
- 全國物業(yè)管理項目經(jīng)理考試試題
評論
0/150
提交評論