




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
抽樣方法與樣本量估計張文斌2013.121A抽樣方法與樣本量估計張文斌1A為什么要抽樣抽樣:經(jīng)濟、有效,是科學的。2A為什么要抽樣抽樣:經(jīng)濟、有效,是科學的。2A抽樣方法創(chuàng)始人-蓋洛普喬治·蓋洛普(Gallup,GeorgeHorace,1901—1984,美國數(shù)學家)蓋洛普1925-1928年就讀愛荷華州立大學(文學學士、心理學碩士、新聞學博士)。他的博士論文題目是《應用客觀方法衡量讀者對報紙興趣的一種新技術》,這篇論文包含著后來發(fā)展為蓋洛普民意測驗和輿論統(tǒng)計的思想。1955年,蓋洛普在新澤西州的普林斯頓創(chuàng)立美國輿論研究所,正式舉辦有關政治和社會事業(yè)問題的各種全國性民意調(diào)查——包括對世界人民的態(tài)度、恐懼、希望、宗教信仰和風俗刁慣等的調(diào)查。這個研究所的成立,迅速使蓋洛普民意測驗具有了權威性,該研究所也稱為蓋洛普民意測驗所。3A抽樣方法創(chuàng)始人-蓋洛普喬治·蓋洛普(Gallup,Georg蓋洛普的成功4A蓋洛普的成功4A蓋洛普方法蓋洛普使用的民意調(diào)查方法是一種代表性抽樣調(diào)查方法,是他在從事新聞工作中發(fā)展起來的,根據(jù)對象的年齡、性別、教育程度、職業(yè)等標準,在全國各地區(qū)按比例選擇測驗對象,派調(diào)查員親自去調(diào)查訪問,根據(jù)統(tǒng)計測驗結果進行分析,做出說明。這種方法就是所謂的“定額抽樣法”,即將總體各單位按某些主要標識劃分類型后抽取比例樣本,是一種非概率抽樣。5A蓋洛普方法蓋洛普使用的民意調(diào)查方法是一種代表性抽樣調(diào)抽樣調(diào)查的特點特點1:抽取的樣本作為一個“代表團”來代表總體。而不是隨意挑選的個別單位代表總體。特點2:調(diào)查樣本一般按隨機的原則抽取,在總體中每個單位被抽取的機會相等。因此被抽中的單位在總體中是均勻分布的,不致出現(xiàn)傾向性誤差,代表性強。特點3:所抽取的調(diào)查樣本數(shù)量是根據(jù)誤差的要求并經(jīng)過科學的計算確定,在調(diào)查樣本的數(shù)量上有可靠保證。特點4:抽樣誤差在調(diào)查前就可以根據(jù)樣本量和總體中各單位之間的差異程度進行計算,并控制在允許范圍內(nèi),調(diào)查結果的準確程度較高。6A抽樣調(diào)查的特點特點1:抽取的樣本作為一個“代表團”來代表總體一、定義總體二、確定抽樣框架三、選擇抽樣技術四、確定樣本容量五、執(zhí)行抽樣過程抽樣設計過程7A一、定義總體抽樣設計過程7A抽樣調(diào)查的主要問題8A抽樣調(diào)查的主要問題8A抽樣誤差
抽樣調(diào)查目的是用樣本調(diào)查數(shù)據(jù)推斷總體。但任何樣本數(shù)據(jù)推斷總體,都不可能得到確切的總體真值。即存在抽樣誤差。抽樣調(diào)查理論基礎在于用樣本數(shù)據(jù)估計的總體值與總體真值之間的誤差,不會影響數(shù)據(jù)的使用和對問題的決策。9A抽樣誤差抽樣調(diào)查目的是用樣本調(diào)查數(shù)據(jù)推斷總體。但任何如何正確認識抽樣誤差?
調(diào)查數(shù)據(jù)存在著誤差是絕對的,而誤差的大小是相對的,其相對性取決于研究的問題和需要的決策。在抽樣方案設計時,需要對調(diào)查主要指標有一個誤差的要求,即樣本的抽樣誤差控制在什么范圍,使其調(diào)查數(shù)據(jù)的使用對分析和決策問題沒有影響或影響很小。這一誤差標準沒有統(tǒng)一的規(guī)定,取決于數(shù)據(jù)使用者分析問題與決策的要求。指標相對誤差很小,數(shù)據(jù)精度太高,樣本量需求量大;指標相對誤差很大,精度太低,對使用者來講數(shù)據(jù)不能用。10A如何正確認識抽樣誤差?調(diào)查數(shù)據(jù)存在著誤差是絕對的,而對抽樣誤差認識與使用的誤區(qū)
一些研究者甚至部分官員不愿意或不習慣接受數(shù)據(jù)的誤差范圍,一談到誤差,惟恐別人說數(shù)據(jù)不準,將數(shù)據(jù)誤差絕對。由于對數(shù)據(jù)誤差的認識存在著誤區(qū),在如何使用數(shù)據(jù)上也存在著誤區(qū)。抽樣調(diào)查的數(shù)據(jù)拿來就用,不談抽樣誤差和調(diào)查誤差,認為調(diào)查數(shù)據(jù)就是總體的真值。在進行工作政績考核或進行地區(qū)間的數(shù)據(jù)對比時,調(diào)查指標數(shù)據(jù)的高低變成了地區(qū)之間排隊、政績評比的依據(jù),忽視了對數(shù)據(jù)誤差的評估?,F(xiàn)有的調(diào)查數(shù)據(jù)不僅沒有正確地使用,反而還帶來地區(qū)之間數(shù)據(jù)高低的相互攀比,同時也影響了以后抽樣調(diào)查的數(shù)據(jù)質量。11A對抽樣誤差認識與使用的誤區(qū)一些研究者甚至部分官員不愿如何確定恰當?shù)某闃诱`差?有專家認為,抽樣調(diào)查估計值的相對誤差控制在10%以內(nèi),數(shù)據(jù)質量好,控制15%以內(nèi),數(shù)據(jù)質量較好,控制20%以內(nèi),數(shù)據(jù)可用。一些國家在進行國家級抽樣調(diào)查時,給出主要調(diào)查指標相對誤差應控制的范圍,規(guī)定了估計值的相對誤差超過30%不能公布。12A如何確定恰當?shù)某闃诱`差?有專家認為,抽樣調(diào)查估計值的案例1
某研究論文中按“病情和就診的先后順序分組”。因病人就診的先后順序往往暗示其病情不同,尤其是當病人的病情輕重難以判斷時若將先來就診者分在一組,后來就診者分在另一組,就不可避免的引入順序誤差(即一組病人的病情較另一組病人的病情重),從而得出錯誤結論。13A案例1某研究論文中按“病情和就診的先后順序分組”。案例2牛宏俐:設計600戶,實際只有435戶(原因是拒訪)胡瑞:按地區(qū)東中西(共6個縣)、按縣鄉(xiāng)衛(wèi)生機構(醫(yī)院1-2所,衛(wèi)生院10家),共抽取262人,按30%擴大樣本至360人。14A案例2牛宏俐:14A案例3
研究者用15個對象做試驗,先按藥物作用時間長短隨機均分成5組,每組3個對象;接著又按藥物的3種劑量將每組中的3個對象再均分成3個小組,每小組僅有1個對象。這個試驗研究中的樣本含量應當是15?還是1呢?15A案例3研究者用15個對象做試驗,先按藥物作用時間長常用的抽樣方法抽樣方法概率抽樣非概率抽樣單純系統(tǒng)分層整群方便滾雪球配額典型另外:不等概率抽樣方法(probabilityproportionaltosize,PPS)16A常用的抽樣方法抽樣方法概率抽樣非概率抽樣單純系統(tǒng)分層整群方便利抽樣以研究者或訪問者方便來選擇被訪者,通常被訪者由于碰巧在恰當?shù)臅r間正處在恰當?shù)牡攸c而被選中使用學生以及社會組織成員;醫(yī)院攔截患者;“街上的行人”訪談。優(yōu)點:便利抽樣在所有抽樣技術中成本最低、耗時最少,抽樣單位易于接近;缺點:不能代表總體。17A便利抽樣以研究者或訪問者方便來選擇配額抽樣配額抽樣可以被看成兩階段有約束的判斷抽樣第一階段,由確定總體中的個體的控制類別或者配額組成,配額確保了樣本的組成與總體的組成在特定特征方面相同;第二階段,樣本個體在便利或者判斷的基礎上被選擇出來缺點是:缺乏對總體的代表性,無法計算抽樣誤差;優(yōu)點是:低成本,為每個配額選擇個體對訪談人員而言較為容易。18A配額抽樣配額抽樣可以被看成兩階段有約束的判斷滾雪球抽樣通常是先選出一組最初的調(diào)查對象,通常是隨機選出的,在訪談之后,要求這些被訪者推薦一些屬于目標總體的其他人,根據(jù)這些推選出后面的被訪者。與隨機的方式相比,被推舉的人將具備與推薦人更為翔實的人口及心理特征。優(yōu)點是:主要目的是估計總體中非常稀少的某些特征。缺點是:這種方式非常耗時。19A滾雪球抽樣通常是先選出一組最初的調(diào)查對象,通常是概率抽樣與非概率抽樣間作抉擇決擇考慮方面有利于使用的條件非概率抽樣概率抽樣研究的性質探索性描述性抽樣誤差與非抽樣誤差的相對大小非抽樣誤差較大抽樣誤差較大總體的變異程度同質(低)異質(高)統(tǒng)計上的考慮不利有利操作上的考慮有利不利20A概率抽樣與非概率抽樣間作抉擇決擇考慮方面有利于使用的條件非概第四次衛(wèi)生服務調(diào)查(家庭健康調(diào)查)方法:多階段分層整群抽樣多階段:?。ㄖ陛犑校h(市、區(qū))→鄉(xiāng)(街道)→行政村(居委會)→戶分層:地理位置(東、中、西),城鄉(xiāng)結構(城市按大、中、??;農(nóng)村按經(jīng)濟因素分1、2、3、4類地區(qū)),家庭收入(5個等級)整群:抽查戶中每個成員都調(diào)查21A第四次衛(wèi)生服務調(diào)查(家庭健康調(diào)查)方法:多階段分層整群抽樣多第四次衛(wèi)生服務調(diào)查(家庭健康調(diào)查)戶的抽樣:1.編號:將樣本村(居委會)內(nèi)全部住戶按名單順序編號;2.按系統(tǒng)抽樣方法確定樣本戶抽樣間隔:國家樣本點抽樣間隔=本村(居委會)內(nèi)戶數(shù)/60(四舍五入。取整)西部擴點抽樣間隔=本村(居委會)內(nèi)戶數(shù)/33(四舍五入。取整);3.確定抽樣戶:隨機抽一張百元人民幣,取其后4位數(shù),該數(shù)除以抽樣間隔后的余數(shù)K(≠0)定位第一個抽樣戶,然后k值加抽樣間隔為第2個抽樣戶,以此類推。22A第四次衛(wèi)生服務調(diào)查(家庭健康調(diào)查)戶的抽樣:1.編號:將樣本抽樣結果94個縣市/470個鄉(xiāng)鎮(zhèn)(街道)/940個行政村(居委會)/56456戶/約18萬人23A抽樣結果94個縣市/470個鄉(xiāng)鎮(zhèn)(街道)/940個行政村(居第四次衛(wèi)生服務調(diào)查(醫(yī)務人員調(diào)查)24A第四次衛(wèi)生服務調(diào)查(醫(yī)務人員調(diào)查)24A(ChinaHealthandRetirementLongitudinalStudy,CHARLS)25A(ChinaHealthandRetirementL如何確定樣本量?26A如何確定樣本量?26A確定樣本容量的方法
樣本容量的確定通常是介于理論上的完善方案與實際的可行方案之間的一個折中方案。教條式方法成本基本法統(tǒng)計分析法27A確定樣本容量的方法樣本容量的確定通常是介于理論上的完教條主義方法任意方法也許基于經(jīng)驗,如總體的5%規(guī)則具有主觀性優(yōu)點:容易確定,簡單易行缺點:無效率、不經(jīng)濟28A教條主義方法任意方法也許基于經(jīng)驗,如總體的5%規(guī)則28A成本基礎法將成本作為確定樣本容量的基礎對于成本基礎法的區(qū)別很大;通常會忽視調(diào)查結果對管理決策的價值;確定樣本容量一個好的辦法是考慮成本與調(diào)研對于經(jīng)歷的價值之間的關系;29A成本基礎法將成本作為確定樣本容量的基礎29A統(tǒng)計分析法一些統(tǒng)計分析方法對最小樣本容量有要求如果要討論分類變量的影響,那么每一分類變量的樣本數(shù)應符合統(tǒng)計分析數(shù)的需要;要將每一類樣本或子集看成一個總體。30A統(tǒng)計分析法一些統(tǒng)計分析方法對最小樣本容量1.單純隨機抽樣(simplerandomsampling)(1)方法先對調(diào)查總體的全部觀察單位編號,然后隨機抽取一部分作為樣本(2)標準誤的計算31A1.單純隨機抽樣(simplerandomsamplin例14.1例1欲調(diào)查某農(nóng)村小學學生的蛔蟲感染率,該校有學生2000人,若取樣本例數(shù)100人,試作單純隨機抽樣設計。解:先將全校學生編號:0,1,2,3,…,1999;再用附表17隨機數(shù)字表,任意指定某行某列,比如第5行第9列,由此處開始,向右依次抄錄隨機數(shù)字100組,每組4個數(shù)字,凡后面出現(xiàn)與前面相同的數(shù)字棄去,如得0873,3732,0405,6930,1609,0588,…。凡首字≥8者減8,≥6者減6,≥4減4,≥2減2,依次得873,1732,405,930,1609,588,…。例232A例14.1例1欲調(diào)查某農(nóng)村小學學生的蛔蟲感染率,(3)單純隨機抽樣樣本含量估算①無限總體所需樣本量估計總體率時,若事件發(fā)生概率在0.2~0.8之間,則若事件發(fā)生的概率小于0.2或大于0.8時,由于事件發(fā)生數(shù)服從Poisson分布,用Poisson分布的逼近公式計算:估計總體均數(shù)時,②有限總體所需樣本量其中,N為有限總體量,n是上式(1)、(2)、(3)估計的結果。33A(3)單純隨機抽樣樣本含量估算①無限總體所需樣本量例3某醫(yī)院欲了解小學六年級學生的近視眼患病率,1998年試查患病率為8%,預計總體患病率約為10%,若取α=0.05,問需抽查多少小學生?例4某醫(yī)院擬用抽樣調(diào)查了解本地區(qū)健康成人血紅蛋白水平,要求誤差不超過0.2(g/L),據(jù)文獻報告,健康成人血紅蛋白的標準差為1.5(g/L),問需調(diào)查多少人(α=0.05)?34A例3某醫(yī)院欲了解小學六年級學生的近視眼患病率單純隨機抽樣的優(yōu)缺點1.均數(shù)和標準誤的計算簡便2.當總體例數(shù)較多時,對觀察單位編號不易操作35A單純隨機抽樣的優(yōu)缺點1.均數(shù)和標準誤的計算簡便35A2.系統(tǒng)抽樣(systematicsampling)(1)方法按照一定的順序,機械地每隔若干個單位抽取一個觀察單位的方法稱系統(tǒng)抽樣。做法是:先將總體觀察單位按某一順序號分成n個部分,再從第一部分隨機抽取第k號觀察單位,依次用相等間隔,從每一部分各抽取一個觀察單位組成樣本。(2)標準誤的計算系統(tǒng)抽樣誤差隨總體性質、抽樣的間隔大小而異,無專用的標準誤計算公式。一般情況下,它比單純隨機抽樣誤差小。有人認為可按單純隨機抽樣方法估計系統(tǒng)抽樣誤差。例5欲調(diào)查某社區(qū)貧血患病情況,該社區(qū)有居民1000人,按系統(tǒng)抽樣方法,抽取例數(shù)為100人的樣本。解:N=1000,n=100,間隔為1000/100=10,先在1~10之間隨機確定一個數(shù)字,比如7,然后每間隔10個觀察單位抽取一個,即7,17,27,…,997組成樣本。又稱機械抽樣或等距離抽樣36A2.系統(tǒng)抽樣(systematicsampling)(1系統(tǒng)抽樣的優(yōu)缺點1.系統(tǒng)抽樣簡便易行2.容易得到一個按比例分配的樣本3.抽樣誤差小于單純隨機抽樣4.容易產(chǎn)生系統(tǒng)誤差5.抽樣誤差的估計只是近似的(用單純隨機抽樣標準誤估計往往偏大)37A系統(tǒng)抽樣的優(yōu)缺點1.系統(tǒng)抽樣簡便易行37A3.整群抽樣(clustersampling)(1)方法先將總體按某種與研究指標無關的特征分為K個組,再從K個組中隨機抽取k個組,這k個組中的全部觀察值組成樣本(2)標準誤的估計38A3.整群抽樣(clustersampling)(1)方法(b)群內(nèi)觀察單位m相等例6某校有80個班級,各班學生50人,現(xiàn)用錫克試驗調(diào)查該校學生白喉易感率,隨機抽查了8個班的全部學生,其中陽性人數(shù)分別為12,17,12,15,21,20,21,18。試估計該校學生錫克試驗陽性率。解:(群內(nèi)觀察單位相等)各班的陽性率分別為:0.24,0.34,0.24,0.30,0.42,0.40,0.42,0.36總率p=(12+17+12+15+21+20+21+18)/(8×50)=0.3439A(b)群內(nèi)觀察單位m相等例6某校有80個班級,各班學生(3)整群抽樣樣本量估計40A(3)整群抽樣樣本量估計40A例7某市為了了解該市40歲以上人群高血壓患病率,擬對全市55個街區(qū)采用整群抽樣調(diào)查,隨機預查了2個街區(qū),第一街區(qū)調(diào)查了4180人,高血壓病人1060人,患病率為25.36%;第二個街區(qū)調(diào)查了4180人,高血壓病人720人,患病率為14.49%,問需調(diào)查幾個街區(qū)(α=0.05,δ=0.1)?41A例7某市為了了解該市40歲以上人群高血壓患病整群抽樣的優(yōu)缺點1.便于組織,適合大規(guī)模調(diào)查2.節(jié)省經(jīng)費3.容易控制調(diào)查質量4.抽樣誤差較單純隨機抽樣大42A整群抽樣的優(yōu)缺點1.便于組織,適合大規(guī)模調(diào)查42A4.分層抽樣(stratifiedsampling)(1)方法先將總體按對觀察指標影響較大的某種特征分成若干層,再從每層中隨機抽取一定量的觀察單位組成樣本。(2)標準誤的計算43A4.分層抽樣(stratifiedsampling)(1)(3)分層抽樣樣本量估計先估計樣本總量n:例8在12萬人口的居民區(qū)中調(diào)查某病患病率。居民區(qū)分4層,樣本總含量確定為1000人,請按比例分配法確定各層調(diào)查人數(shù)。再分配各層觀察
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人力資源咨詢顧問合同書
- 產(chǎn)品售后服務情況說明表
- 制造業(yè)企業(yè)知識產(chǎn)權保護策略研究
- 光纜遷移施工方案范本
- 橡膠跑道施工方案
- 涼山道路施工方案
- TCSMT YB011-2024 天然氣發(fā)熱量測量裝置測試技術規(guī)范
- 建筑工程人工費承包合同-@-1
- 物業(yè)地面處理方案
- 透水砼路面施工方案
- 精細化工工藝學-第1章緒論講解課件
- 仰拱棧橋計算
- 中醫(yī)婦科 月經(jīng)過多課件
- 2022年江西制造職業(yè)技術學院單招語文試題及答案解析
- 穆斯林太巴熱咳慶念詞文
- 商標一級授權書模板
- 軟硬結合板的設計制作與品質要求課件
- 民營醫(yī)院組織架構圖示
- 慢性心功能不全護理查房
- 初中 初二 物理 凸透鏡成像規(guī)律實驗(習題課) 教學設計
- 消防維保方案 (詳細完整版)
評論
0/150
提交評論