版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
抽樣調(diào)查設(shè)計(jì)中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院金勇進(jìn)抽樣調(diào)查設(shè)計(jì)課件1生活在調(diào)查中的現(xiàn)代人調(diào)查無(wú)所不在抽樣調(diào)查是應(yīng)用最廣泛的調(diào)查方式在國(guó)外,抽樣調(diào)查幾乎應(yīng)用于所有領(lǐng)域在國(guó)內(nèi),抽樣調(diào)查應(yīng)用發(fā)展迅速如人口變動(dòng)調(diào)查,勞動(dòng)力調(diào)查,社會(huì)問(wèn)題研究,電視收視率調(diào)查,滿意度調(diào)查,以及各種民意調(diào)查等。生活在調(diào)查中的現(xiàn)代人2調(diào)查能測(cè)準(zhǔn)嗎?也能,也不能??磶讉€(gè)相關(guān)的例子調(diào)查能測(cè)準(zhǔn)嗎?3全球性調(diào)查報(bào)告:中國(guó)人均性伴侶數(shù)全球排第一
“近日,2004年杜蕾斯全球性調(diào)查報(bào)告向社會(huì)發(fā)布。引人注目的是報(bào)告中顯示中國(guó)人的平均性伴侶數(shù)最多,為19.3人,遠(yuǎn)遠(yuǎn)高于全球的平均數(shù)10.5人;而中國(guó)人平均每年性生活的頻率卻只有90次,排全球倒數(shù)第7位,低于全球平均水平103次。同時(shí),報(bào)告還顯示中國(guó)首次接受性教育的年齡為13.7歲,最接近世界平均水平,然而卻只有22%的調(diào)查對(duì)象認(rèn)為青少年性教育由家人或監(jiān)護(hù)人完成。”資料來(lái)源:北京晨報(bào),2004年11月25日矛盾:為什么性伴侶最多,性頻率卻不高?首次接受性教育的年齡走低,卻不是由家長(zhǎng)來(lái)完成性教育任務(wù)?問(wèn)題在于,樣本是怎樣產(chǎn)生的?全球性調(diào)查報(bào)告:中國(guó)人均性伴侶數(shù)全球排第一4
傳統(tǒng)觀念被顛覆了嗎?雪兒·海蒂(ShereHite)在1987年出版的《女性與愛(ài)情:前進(jìn)中的文化之旅》一書中,給出了一些數(shù)據(jù):84%的女性“在情感上對(duì)兩性關(guān)系不滿意”(第804頁(yè))。70%的女性“在結(jié)婚五年或者更久后發(fā)生了婚外性關(guān)系”(第856頁(yè))。95%的女性“在戀愛(ài)時(shí)會(huì)因男友而出現(xiàn)情感及心理上的煩惱”(第81頁(yè))。84%的女性在與男友的戀愛(ài)中有屈尊感(第809頁(yè))。這本書遭到全美報(bào)刊及雜志文章的廣泛批評(píng)。例如,《時(shí)代周刊》的封面故事“后退,巴迪”里認(rèn)為海蒂的研究結(jié)論是“模糊的”、“沒(méi)有價(jià)值的”?!笆窃噲D顛覆人們傳統(tǒng)觀念中的女性”。資料來(lái)源:SharonL.Lohr2002,Sampling:DesignandAnalysis,中國(guó)統(tǒng)計(jì)出版社,P1傳統(tǒng)觀念被顛覆5上述調(diào)查結(jié)果都是被社會(huì)廣泛質(zhì)疑的。從技術(shù)層面講,被質(zhì)疑的一個(gè)重要原因是沒(méi)有說(shuō)明樣本的產(chǎn)生過(guò)程。成功的案例也有。如美國(guó)總統(tǒng)競(jìng)選的預(yù)測(cè)。上述調(diào)查結(jié)果都是被社會(huì)廣泛質(zhì)疑的。從技術(shù)層面6美國(guó)總統(tǒng)競(jìng)選預(yù)測(cè):民主黨候選人共和黨候選人實(shí)際1968漢佛萊(50%)尼克松(50%)尼(50.3%)1972尼克松(62%)尼(61.8%)1976卡特(51%)卡(51.1%)1980里根(52%)里(55.3%)1984里根(59%)里(59.2%)1988布什(56%)布(53.9%)
對(duì)人的評(píng)價(jià)比對(duì)物的評(píng)價(jià)要更困難抽樣調(diào)查設(shè)計(jì)課件7二.什么是好的調(diào)查策劃調(diào)查要有策劃,策劃的好,調(diào)查質(zhì)量就高。通過(guò)調(diào)查解決一些需要研究的問(wèn)題。例如,就企業(yè)而言1.存在的問(wèn)題或機(jī)會(huì)調(diào)查能否回答最高層次問(wèn)題策略價(jià)值2觀念創(chuàng)新最高層次策略價(jià)值1價(jià)值附加較高層次經(jīng)營(yíng)基本本體價(jià)值較低層次二.什么是好的調(diào)查策劃策略價(jià)值2觀念創(chuàng)新最高層次策略價(jià)值182.各種可能的決策如產(chǎn)品發(fā)展是擴(kuò)大規(guī)模,還是技術(shù)創(chuàng)新,還是發(fā)展銷售渠道?設(shè)計(jì)的內(nèi)容調(diào)查的目的,為什么要進(jìn)行這項(xiàng)調(diào)查調(diào)查的對(duì)象,明確被調(diào)查群體(研究總體的確定)調(diào)查的內(nèi)容,明確所需信息,需求應(yīng)當(dāng)是具體的而不是抽象的,通過(guò)調(diào)查問(wèn)卷反映調(diào)查的方式和手段:方式,抽樣?重點(diǎn)?全面?2.各種可能的決策9手段:什么手段采集數(shù)據(jù),面訪?電話調(diào)查?自填問(wèn)卷?實(shí)驗(yàn)?觀察?等。調(diào)查執(zhí)行:如何保證數(shù)據(jù)質(zhì)量?樣本量:樣本量多大?回答這樣一些問(wèn)題:為什么做這項(xiàng)調(diào)查?調(diào)查的價(jià)值有多大?費(fèi)用支持足夠嗎?這項(xiàng)調(diào)查值得做嗎?手段:什么手段采集數(shù)據(jù),面訪?電話調(diào)查?自填問(wèn)卷?實(shí)驗(yàn)?觀察10三.幾個(gè)關(guān)系1.概率抽樣和非概率抽樣概率抽樣的特點(diǎn)與價(jià)值隨機(jī)性,每個(gè)單位入樣概率已知隨機(jī)與隨便,隨機(jī)要有程序?qū)崿F(xiàn)隨機(jī)抽樣是抽樣方式中的“王冠”。三.幾個(gè)關(guān)系112.非概率抽樣如:方便選樣,有目的選樣,自愿樣本,配額樣本,滾雪球選樣等非概率抽樣的特點(diǎn)與價(jià)值不能只有海鮮,還要有白菜研究中的挑戰(zhàn):非概率樣本的推斷問(wèn)題2.非概率抽樣123.概率抽樣的幾個(gè)挑戰(zhàn)概率抽樣挑戰(zhàn)之一:目標(biāo)總體與抽樣總體總體與樣本目標(biāo)總體:要研究的總體抽樣總體:產(chǎn)生樣本的總體抽樣總體的具體體現(xiàn)——抽樣框良好抽樣框的標(biāo)志:關(guān)聯(lián),一對(duì)一聯(lián)接準(zhǔn)確,涵蓋狀況時(shí)效,信息是最新的3.概率抽樣的幾個(gè)挑戰(zhàn)13概率抽樣挑戰(zhàn)之二:抽樣誤差與非抽樣誤差抽樣誤差:抽樣隨機(jī)性帶來(lái)的,無(wú)法避免可以計(jì)算可以控制計(jì)算抽樣誤差的水平(誤差計(jì)算正確)可以體現(xiàn)設(shè)計(jì)人員的專業(yè)水平概率抽樣挑戰(zhàn)之二:抽樣誤差與非抽樣誤差14非抽樣誤差:什么是非抽樣誤差體現(xiàn)在以下幾個(gè)方面:抽樣框誤差回答誤差,無(wú)回答誤差,調(diào)查員誤差計(jì)量誤差非抽樣誤差特點(diǎn):難以測(cè)度,成因復(fù)雜非抽樣誤差的控制可以體現(xiàn)調(diào)查方的執(zhí)行能力非抽樣誤差:什么是非抽樣誤差15完美的調(diào)查是科學(xué)和藝術(shù)的結(jié)合科學(xué)體現(xiàn)在對(duì)抽樣誤差的把握藝術(shù)體現(xiàn)在對(duì)非抽樣誤差的掌控目前我國(guó)很多抽樣調(diào)查項(xiàng)目,科學(xué)性不足,藝術(shù)性欠缺。誤差的計(jì)算與控制是我們面臨的嚴(yán)重挑戰(zhàn)完美的調(diào)查是科學(xué)和藝術(shù)的結(jié)合16概率抽樣挑戰(zhàn)之三:平衡的藝術(shù)——精度與費(fèi)用之關(guān)系概率抽樣挑戰(zhàn)之三:平衡的藝術(shù)——精度17精度與費(fèi)用精度100%95%60%20%40%……..…………..費(fèi)用精度與費(fèi)用精度100%95%60%20%40%……..18概率抽樣挑戰(zhàn)之四:樣本量的“陷阱”
問(wèn)題一.估計(jì)精度越高越好嗎?簡(jiǎn)單隨機(jī)抽樣估計(jì)比例P的樣本量與誤差(當(dāng)P=0.5時(shí))樣本量誤差500.141000.105000.04510000.032對(duì)精度要求的判斷十分重要。為得到最小誤差而選擇最大樣本量不是好的選擇。概率抽樣挑戰(zhàn)之四:樣本量的“陷阱”19問(wèn)題二.樣本量與總體規(guī)模N有關(guān)嗎?例:簡(jiǎn)單隨機(jī)抽樣估計(jì)P,置信度95%,允許誤差5%,在P=0.5條件下總體規(guī)模(N)所需樣本量(n)5044100805002221000286500037010000385100000398100000040010000000400問(wèn)題二.樣本量與總體規(guī)模N有關(guān)嗎?20由此可知,在精度要求相同條件下,在北京市進(jìn)行一項(xiàng)調(diào)查和在全國(guó)進(jìn)行一項(xiàng)調(diào)查,樣本量的差別并不大。總體規(guī)模越大,進(jìn)行抽樣調(diào)查的效率越高。若分類、分區(qū)、分層分別進(jìn)行估計(jì)則另當(dāng)別論。由此可知,在精度要求相同條件下,在北京21四.常用抽樣方法1.簡(jiǎn)單隨機(jī)抽樣對(duì)總體不了解抽樣框資料沒(méi)有更多的輔助信息總體分布均勻與其他抽樣方式的結(jié)合四.常用抽樣方法222.分層抽樣總體單位之間存在明顯差異有進(jìn)行分層的輔助信息分層抽樣可以有效提高估計(jì)的效率好的分層應(yīng)該實(shí)現(xiàn):層數(shù)確定最優(yōu)層之間切點(diǎn)最優(yōu)各層樣本量的分配最優(yōu)2.分層抽樣233.系統(tǒng)抽樣便于操作便于審核(具有可重復(fù)性)在有些情況下可以提高估計(jì)的效率估計(jì)量方差計(jì)算復(fù)雜,可以采用不同的方法近似計(jì)算。3.系統(tǒng)抽樣244.整群抽樣構(gòu)造抽樣框容易調(diào)查成本低多以地域分群一般而言,整群抽樣估計(jì)效率會(huì)受到影響,對(duì)某些特定調(diào)查內(nèi)容,整群抽樣效率更高。4.整群抽樣255.多階段抽樣抽樣框構(gòu)造成本低節(jié)省人力、物力某些條件下可以滿足各級(jí)政府需要估計(jì)精度與階段多少有關(guān),所以階段劃分越少越好。5.多階段抽樣26五.關(guān)于調(diào)查方法調(diào)查方法有多種,如文檔調(diào)查,入戶調(diào)查,電話調(diào)查,郵寄調(diào)查,觀察法,實(shí)驗(yàn)法等。不同方法有不同特點(diǎn),如何選擇恰當(dāng)?shù)姆椒ǎ肯旅嬗袔讉€(gè)案例:
案例一:人口密度和人的行為的關(guān)系研究假說(shuō):人口密度過(guò)高可能產(chǎn)生負(fù)效應(yīng),引發(fā)犯罪和精神病五.關(guān)于調(diào)查方法27理論依據(jù):馬爾薩斯人口論,其論點(diǎn)有“人口過(guò)剩是貧困的主要原因”,“過(guò)剩人口會(huì)造成社會(huì)病態(tài)”。實(shí)證依據(jù):老鼠實(shí)驗(yàn),隨著實(shí)驗(yàn)籠里老鼠密度增高,老鼠表現(xiàn)煩躁不安,母鼠不愿看護(hù)自己幼鼠,搶食現(xiàn)象加劇,最后導(dǎo)致自相殘殺。需研究的問(wèn)題:這類現(xiàn)象在人類中是否存在?難點(diǎn):對(duì)人類無(wú)法使用象老鼠那樣進(jìn)行自相殘殺的實(shí)驗(yàn)。兩組設(shè)計(jì)人員分別提出了各自的方法?????理論依據(jù):馬爾薩斯人口論,其論點(diǎn)有“人口過(guò)剩是28組A:采用問(wèn)卷法,具體做法是1.確定房間面積,招聘應(yīng)試人員2.設(shè)計(jì)調(diào)查問(wèn)卷,反映受訪者心態(tài)變化,如是否喜歡新增加的陌生人,是否容忍活動(dòng)區(qū)域的減小3.剛開始是一人一間房,以后逐次增加,每增加新人,就回答一次問(wèn)題4.實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),高密度人群增加了人與人之間相互厭惡的傾向組A:采用問(wèn)卷法,具體做法是29組B:文檔調(diào)查,具體做法是1.按人口密度將分析區(qū)域劃出若干塊(實(shí)驗(yàn)區(qū)域?yàn)橹ゼ痈缡校?.查閱“芝加哥地方公眾記事錄”,里面有人口密度,犯罪率,精神病患者人數(shù)等寶貴資料存在的問(wèn)題,表象上看,人口密度和犯罪數(shù)量相關(guān)但人口密度和犯罪數(shù)量又與另外變量,如職業(yè)、種族、教育、收入等要素相關(guān),人口密度高的地方犯罪率高,但人口密度高的地方居住者的教育水平、收入水平偏低,黑人比例高,職業(yè)差。是職業(yè)、文化程度、收入水平影響犯罪率?還是人口密度影響犯罪率?組B:文檔調(diào)查,具體做法是30案例二壞血病的原因調(diào)查17世紀(jì)初,英國(guó)海軍患?jí)难”尘埃汉I系蹏?guó),壞血病的威脅,國(guó)防部進(jìn)行研究懷疑:維生素?cái)z入量少實(shí)驗(yàn)方法:四艘軍艦離港,一艘有橙汁供應(yīng),三艘沒(méi)有結(jié)果:有橙汁供應(yīng)水手身體狀況良好,沒(méi)有橙汁供應(yīng)水手開始成批生病結(jié)論:缺乏維生素?cái)z入是導(dǎo)致產(chǎn)生疾病的原因如何完善上述實(shí)驗(yàn)?案例二壞血病的原因調(diào)查31問(wèn)題一:患病原因可能是那三艘船上有導(dǎo)致生病的物質(zhì)問(wèn)題二:上有橙汁船的人可能就喜歡喝橙汁問(wèn)題三:上船之前水手身體狀況一樣嗎?問(wèn)題一:患病原因可能是那三艘船上有導(dǎo)致32實(shí)驗(yàn)法關(guān)鍵:分為實(shí)驗(yàn)組和對(duì)照組兩組其他情況相同,只有檢測(cè)因素(是否喝橙汁)不同。實(shí)驗(yàn)者在哪個(gè)組應(yīng)隨機(jī)產(chǎn)生。實(shí)驗(yàn)應(yīng)采用“雙盲”原則。如實(shí)驗(yàn)一種新藥療效,受試者不知道自己是在服藥還是服替代品,醫(yī)生也不應(yīng)知道受試者的分組情況。市場(chǎng)調(diào)查中很難嚴(yán)格控制其他因素,如想知道飲料顏色對(duì)銷量是否有影響,如何設(shè)計(jì)實(shí)驗(yàn)就是一個(gè)挑戰(zhàn)。實(shí)驗(yàn)法關(guān)鍵:分為實(shí)驗(yàn)組和對(duì)照組33案例三固體雞汁調(diào)查關(guān)鍵的一環(huán),產(chǎn)品的價(jià)格定位,面訪法問(wèn)卷中設(shè)計(jì)了四個(gè)問(wèn)題:1.請(qǐng)問(wèn)該種袋裝調(diào)料(100克)的價(jià)格為多少,您認(rèn)為是物有所值(較低價(jià)格)2.請(qǐng)問(wèn)該種袋裝調(diào)料價(jià)格低到什么程度,您將懷疑其質(zhì)量而不敢購(gòu)買(最低價(jià)格)3.請(qǐng)問(wèn)該種袋裝調(diào)料價(jià)格為多少,您認(rèn)為雖然偏高,但仍可能購(gòu)買(較高價(jià)格)案例三固體雞汁調(diào)查344.請(qǐng)問(wèn)該種袋裝調(diào)料價(jià)格高到什么程度,您肯定不買(最高價(jià)格)將調(diào)查結(jié)果統(tǒng)計(jì),將形成如下圖形4.請(qǐng)問(wèn)該種袋裝調(diào)料價(jià)格高到什么程度,您肯定不買35acdb問(wèn)題一
問(wèn)題二受訪者累積百分比圖2價(jià)格敏感度示意圖價(jià)格問(wèn)題三問(wèn)題四acdb問(wèn)題一問(wèn)題二受訪者累積百分比圖2價(jià)格敏感度示36形成a,b,c,d4個(gè)交叉點(diǎn)如果價(jià)格低于a點(diǎn),相當(dāng)多人會(huì)因?yàn)閮r(jià)格過(guò)低,懷疑其質(zhì)量而不敢購(gòu)買;如果價(jià)格高于b點(diǎn),也會(huì)有相當(dāng)多人因?yàn)閮r(jià)格過(guò)高而不去購(gòu)買;c,d是兩個(gè)均衡點(diǎn),在c點(diǎn)上認(rèn)為價(jià)格較高和價(jià)格較低的比例相同;在d點(diǎn)上認(rèn)為價(jià)格最高和價(jià)格最低的比例相同。形成a,b,c,d4個(gè)交叉點(diǎn)37定價(jià)的最后決策當(dāng)然需要考慮眾多要素,但調(diào)查結(jié)果無(wú)疑可以為決策提供參考依據(jù)。定價(jià)的最后決策當(dāng)然需要考慮眾多要素,38六.政府統(tǒng)計(jì)中需要研究的一些課題在政府統(tǒng)計(jì)中,抽樣調(diào)查需要研究一些問(wèn)題1.樣本輪換問(wèn)題涉及:輪換周期,輪換比例,輪換層次,輪換程序,數(shù)據(jù)的銜接等問(wèn)題。關(guān)于使用永久隨機(jī)數(shù)抽樣方法的討論《永久隨機(jī)數(shù)法樣本輪換初探》,統(tǒng)計(jì)教育,2004,2《不同樣本輪換方法的比較》,統(tǒng)計(jì)與預(yù)測(cè),2005,1六.政府統(tǒng)計(jì)中需要研究的一些課題392.抽樣調(diào)查滿足多層次需要問(wèn)題抽樣方法改進(jìn)的思路:層層抽樣追加樣本如何在估計(jì)方法上做文章“小區(qū)域”估計(jì)問(wèn)題《論抽樣調(diào)查中的域估計(jì)》,統(tǒng)計(jì)與決策2003,12《對(duì)抽樣調(diào)查解決多層次估計(jì)問(wèn)題的探討》,統(tǒng)計(jì)研究,2003,122.抽樣調(diào)查滿足多層次需要問(wèn)題403.抽樣調(diào)查后的數(shù)據(jù)分析盲目使用統(tǒng)計(jì)軟件的陷阱,抽樣方法與分析方法不對(duì)應(yīng)。例如權(quán)數(shù)的調(diào)整問(wèn)題抽樣估計(jì)中的權(quán)數(shù)調(diào)整《全國(guó)統(tǒng)計(jì)科學(xué)研討會(huì)學(xué)術(shù)論文集》2002,8多變量聯(lián)合加權(quán)應(yīng)用研究《統(tǒng)計(jì)理論、方法、應(yīng)用研究》2002.10《多變量與規(guī)模成比例概率抽樣的有關(guān)問(wèn)題》,統(tǒng)計(jì)與信息論壇,2004,1
3.抽樣調(diào)查后的數(shù)據(jù)分析414.數(shù)據(jù)的質(zhì)量——缺失數(shù)據(jù)問(wèn)題無(wú)回答,失真數(shù)據(jù)的剔除等處理缺失數(shù)據(jù)中輔助信息的利用《統(tǒng)計(jì)研究》1998,1不同插補(bǔ)方法的比較《數(shù)理統(tǒng)計(jì)與管理》2000,4缺失數(shù)據(jù)的偏差校正《數(shù)理統(tǒng)計(jì)與管理》2001,4缺失數(shù)據(jù)的加權(quán)調(diào)整《數(shù)理統(tǒng)計(jì)與管理》2001,5缺失數(shù)據(jù)的插補(bǔ)調(diào)整《數(shù)理統(tǒng)計(jì)與管理》2001,6處理無(wú)回答的校準(zhǔn)估計(jì)《統(tǒng)計(jì)研究》2002,6調(diào)查中缺失數(shù)據(jù)的統(tǒng)計(jì)處理,《市場(chǎng)統(tǒng)計(jì)與信息》2005,44.數(shù)據(jù)的質(zhì)量——缺失數(shù)據(jù)問(wèn)題42抽樣調(diào)查是科學(xué)和藝術(shù)的結(jié)合需要本本,但不能“本本主義”需要經(jīng)驗(yàn),但不能“經(jīng)驗(yàn)主義”抽樣調(diào)查是科學(xué)和藝術(shù)的結(jié)合43案例分析:極小信息情況下如何進(jìn)行樣本量分配案例分析:44調(diào)查目的:了解亞洲血統(tǒng)人口對(duì)某些問(wèn)題的看法,并和其他血統(tǒng)人口看法進(jìn)行對(duì)比分析。調(diào)查對(duì)象:美籍居民調(diào)查方式:電話調(diào)查,電話號(hào)碼需購(gòu)買樣本要求:Asian1200Hispanic600Non_H_B300NON_H_W600Total2700需要解決的問(wèn)題:購(gòu)買電話號(hào)碼數(shù)量及該數(shù)量在各地區(qū)的分配(回答率60%)。調(diào)查目的:了解亞洲血統(tǒng)人口對(duì)某些問(wèn)題的看法,并和其他血45
表1:美國(guó)不同地區(qū)亞洲血統(tǒng)人口所占比重(1)地區(qū)(2)人口數(shù)(3)地區(qū)人口比重(4)亞裔人數(shù)(5)=(4)/(2)亞裔比重S.F.7239590.28420715528.614Seattle5162590.2026081911.781L.A.88631643.47192556110.443N.Y.73225642.8685099556.964Chicago27837261.091029383.698Balance23510353692.08451022102.17total25531320810069086382.706(1)地區(qū)(2)人口數(shù)(3)地區(qū)人口比重(4)亞裔人數(shù)(5)46分析:如果樣本量按人口比例在全國(guó)各地區(qū)鋪開,所需要的電話號(hào)碼個(gè)數(shù)為:
如何充分利用各地區(qū)亞洲血統(tǒng)人口比重不同這個(gè)輔助信息?如果采用采用比重高的地區(qū)(如舊金山,28.614%),則但這已經(jīng)不是全國(guó)樣本。分析:如果樣本量按人口比例在全國(guó)各地區(qū)鋪開,所需要的電47
設(shè)計(jì):按前表資料,將全部地區(qū)劃分為6個(gè)域,于是要解決的問(wèn)題是在僅有有限的輔助信息(人口數(shù),戶數(shù),種族分類)條件下,如何在各域中分配樣本量,使得調(diào)查費(fèi)用盡可能少(即盡可能少地購(gòu)買電話號(hào)碼),同時(shí)保證樣本具有一定的代表性。為便于分析,將有關(guān)符號(hào)作如下說(shuō)明:N:Asian總戶數(shù),N=總戶數(shù)×Asian人口比重Nh:第h域中Asian戶數(shù)(h=1,2,…,6)Nh=第h域總?cè)藬?shù)×第h域Asian人口比重,則
抽樣調(diào)查設(shè)計(jì)課件48n:完成的Asian樣本戶數(shù),即n=1200nh:第h域完成的Asian樣本戶數(shù)Th:第h域需抽取的電話號(hào)碼數(shù)
ω:擴(kuò)張系數(shù)
ωh:第h層擴(kuò)張系數(shù)
n:完成的Asian樣本戶數(shù),即n=120049
Rh:第h域亞洲血統(tǒng)人口比重σ:研究變量總體標(biāo)準(zhǔn)差σh:研究變量第h域標(biāo)準(zhǔn)差,由于σ,σh未知,故假定σ=σh為求得各層樣本量的最優(yōu)分配方案,利用設(shè)計(jì)效應(yīng)(DesignEffect,簡(jiǎn)寫作Deff),結(jié)合樣本量的分配,設(shè)定一個(gè)目標(biāo)函數(shù)T×Deff,希望使其最小;再依前述條件設(shè)置約束s.t.,形成一個(gè)規(guī)劃問(wèn)題,即:min(T×Deff)s.t.0<nh≤Nh(i=1,2,…,6)
抽樣調(diào)查設(shè)計(jì)課件50
其中:由設(shè)計(jì)效應(yīng)定義有:
抽樣調(diào)查設(shè)計(jì)課件51于是:根據(jù)柯西不等式,容易推出按(Nh﹒√Rh)的比例分配Th,可使(P)的目標(biāo)函數(shù)達(dá)到最優(yōu)(忽略nh必須取整數(shù))。于是得到下表中的計(jì)算結(jié)果:
抽樣調(diào)查設(shè)計(jì)課件52
表2.應(yīng)抽樣本量Th和完成Asian樣本量nh單位:戶
(1)地區(qū)(2)總戶數(shù)(3)S.F.30558428.61446773.814115.32671.70Seattle23670211.7819571.04623.60333.84L.A.298955210.443100885.907248.743969.82N.Y.28194016.96451815.521127.753057.37Chicago10251743.6987289.89817.97810.08Balance845709972.170270377.285666.6251195.01Total919474102.706(7)486713.471120060037.83(4)Nh﹒√Rh=(2)×(Rh)3/2
(5)nh=1200×(4)÷(7)
(6)Th=(5)÷(0.6×Rh)
表2.應(yīng)抽樣本量Th和完成Asian樣本量nh53由表2知,T=60037.83,根據(jù)前面公式,可以計(jì)算出Deff=1.1404,故:T×Deff=60037.83×1.1404=68467.34在簡(jiǎn)單隨機(jī)抽樣條件下,T=1200/(0.02706×0.6=73910。利用有限信息進(jìn)行分區(qū)域后,在同樣估計(jì)精度條件下,所需抽取的樣本量減少了將近8%在這種抽樣分配方案下,其它血統(tǒng)人口的樣本量肯定可以滿足(驗(yàn)證略)。
由表2知,T=60037.83,根據(jù)前面公式,可以54
此外,還可以分析不同設(shè)計(jì)要求下各域所需要的樣本量。此案是把規(guī)劃方法引入抽樣設(shè)計(jì)。調(diào)查實(shí)踐中,特別是一次性的抽樣調(diào)查中,類似的信息量極小的情況是會(huì)經(jīng)常遇到的,對(duì)輔助信息充分有效的利用,以提高抽樣效率,是我們努力的方向。
抽樣調(diào)查設(shè)計(jì)課件55謝謝大家謝謝大家56抽樣調(diào)查設(shè)計(jì)中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院金勇進(jìn)抽樣調(diào)查設(shè)計(jì)課件57生活在調(diào)查中的現(xiàn)代人調(diào)查無(wú)所不在抽樣調(diào)查是應(yīng)用最廣泛的調(diào)查方式在國(guó)外,抽樣調(diào)查幾乎應(yīng)用于所有領(lǐng)域在國(guó)內(nèi),抽樣調(diào)查應(yīng)用發(fā)展迅速如人口變動(dòng)調(diào)查,勞動(dòng)力調(diào)查,社會(huì)問(wèn)題研究,電視收視率調(diào)查,滿意度調(diào)查,以及各種民意調(diào)查等。生活在調(diào)查中的現(xiàn)代人58調(diào)查能測(cè)準(zhǔn)嗎?也能,也不能??磶讉€(gè)相關(guān)的例子調(diào)查能測(cè)準(zhǔn)嗎?59全球性調(diào)查報(bào)告:中國(guó)人均性伴侶數(shù)全球排第一
“近日,2004年杜蕾斯全球性調(diào)查報(bào)告向社會(huì)發(fā)布。引人注目的是報(bào)告中顯示中國(guó)人的平均性伴侶數(shù)最多,為19.3人,遠(yuǎn)遠(yuǎn)高于全球的平均數(shù)10.5人;而中國(guó)人平均每年性生活的頻率卻只有90次,排全球倒數(shù)第7位,低于全球平均水平103次。同時(shí),報(bào)告還顯示中國(guó)首次接受性教育的年齡為13.7歲,最接近世界平均水平,然而卻只有22%的調(diào)查對(duì)象認(rèn)為青少年性教育由家人或監(jiān)護(hù)人完成?!辟Y料來(lái)源:北京晨報(bào),2004年11月25日矛盾:為什么性伴侶最多,性頻率卻不高?首次接受性教育的年齡走低,卻不是由家長(zhǎng)來(lái)完成性教育任務(wù)?問(wèn)題在于,樣本是怎樣產(chǎn)生的?全球性調(diào)查報(bào)告:中國(guó)人均性伴侶數(shù)全球排第一60
傳統(tǒng)觀念被顛覆了嗎?雪兒·海蒂(ShereHite)在1987年出版的《女性與愛(ài)情:前進(jìn)中的文化之旅》一書中,給出了一些數(shù)據(jù):84%的女性“在情感上對(duì)兩性關(guān)系不滿意”(第804頁(yè))。70%的女性“在結(jié)婚五年或者更久后發(fā)生了婚外性關(guān)系”(第856頁(yè))。95%的女性“在戀愛(ài)時(shí)會(huì)因男友而出現(xiàn)情感及心理上的煩惱”(第81頁(yè))。84%的女性在與男友的戀愛(ài)中有屈尊感(第809頁(yè))。這本書遭到全美報(bào)刊及雜志文章的廣泛批評(píng)。例如,《時(shí)代周刊》的封面故事“后退,巴迪”里認(rèn)為海蒂的研究結(jié)論是“模糊的”、“沒(méi)有價(jià)值的”?!笆窃噲D顛覆人們傳統(tǒng)觀念中的女性”。資料來(lái)源:SharonL.Lohr2002,Sampling:DesignandAnalysis,中國(guó)統(tǒng)計(jì)出版社,P1傳統(tǒng)觀念被顛覆61上述調(diào)查結(jié)果都是被社會(huì)廣泛質(zhì)疑的。從技術(shù)層面講,被質(zhì)疑的一個(gè)重要原因是沒(méi)有說(shuō)明樣本的產(chǎn)生過(guò)程。成功的案例也有。如美國(guó)總統(tǒng)競(jìng)選的預(yù)測(cè)。上述調(diào)查結(jié)果都是被社會(huì)廣泛質(zhì)疑的。從技術(shù)層面62美國(guó)總統(tǒng)競(jìng)選預(yù)測(cè):民主黨候選人共和黨候選人實(shí)際1968漢佛萊(50%)尼克松(50%)尼(50.3%)1972尼克松(62%)尼(61.8%)1976卡特(51%)卡(51.1%)1980里根(52%)里(55.3%)1984里根(59%)里(59.2%)1988布什(56%)布(53.9%)
對(duì)人的評(píng)價(jià)比對(duì)物的評(píng)價(jià)要更困難抽樣調(diào)查設(shè)計(jì)課件63二.什么是好的調(diào)查策劃調(diào)查要有策劃,策劃的好,調(diào)查質(zhì)量就高。通過(guò)調(diào)查解決一些需要研究的問(wèn)題。例如,就企業(yè)而言1.存在的問(wèn)題或機(jī)會(huì)調(diào)查能否回答最高層次問(wèn)題策略價(jià)值2觀念創(chuàng)新最高層次策略價(jià)值1價(jià)值附加較高層次經(jīng)營(yíng)基本本體價(jià)值較低層次二.什么是好的調(diào)查策劃策略價(jià)值2觀念創(chuàng)新最高層次策略價(jià)值1642.各種可能的決策如產(chǎn)品發(fā)展是擴(kuò)大規(guī)模,還是技術(shù)創(chuàng)新,還是發(fā)展銷售渠道?設(shè)計(jì)的內(nèi)容調(diào)查的目的,為什么要進(jìn)行這項(xiàng)調(diào)查調(diào)查的對(duì)象,明確被調(diào)查群體(研究總體的確定)調(diào)查的內(nèi)容,明確所需信息,需求應(yīng)當(dāng)是具體的而不是抽象的,通過(guò)調(diào)查問(wèn)卷反映調(diào)查的方式和手段:方式,抽樣?重點(diǎn)?全面?2.各種可能的決策65手段:什么手段采集數(shù)據(jù),面訪?電話調(diào)查?自填問(wèn)卷?實(shí)驗(yàn)?觀察?等。調(diào)查執(zhí)行:如何保證數(shù)據(jù)質(zhì)量?樣本量:樣本量多大?回答這樣一些問(wèn)題:為什么做這項(xiàng)調(diào)查?調(diào)查的價(jià)值有多大?費(fèi)用支持足夠嗎?這項(xiàng)調(diào)查值得做嗎?手段:什么手段采集數(shù)據(jù),面訪?電話調(diào)查?自填問(wèn)卷?實(shí)驗(yàn)?觀察66三.幾個(gè)關(guān)系1.概率抽樣和非概率抽樣概率抽樣的特點(diǎn)與價(jià)值隨機(jī)性,每個(gè)單位入樣概率已知隨機(jī)與隨便,隨機(jī)要有程序?qū)崿F(xiàn)隨機(jī)抽樣是抽樣方式中的“王冠”。三.幾個(gè)關(guān)系672.非概率抽樣如:方便選樣,有目的選樣,自愿樣本,配額樣本,滾雪球選樣等非概率抽樣的特點(diǎn)與價(jià)值不能只有海鮮,還要有白菜研究中的挑戰(zhàn):非概率樣本的推斷問(wèn)題2.非概率抽樣683.概率抽樣的幾個(gè)挑戰(zhàn)概率抽樣挑戰(zhàn)之一:目標(biāo)總體與抽樣總體總體與樣本目標(biāo)總體:要研究的總體抽樣總體:產(chǎn)生樣本的總體抽樣總體的具體體現(xiàn)——抽樣框良好抽樣框的標(biāo)志:關(guān)聯(lián),一對(duì)一聯(lián)接準(zhǔn)確,涵蓋狀況時(shí)效,信息是最新的3.概率抽樣的幾個(gè)挑戰(zhàn)69概率抽樣挑戰(zhàn)之二:抽樣誤差與非抽樣誤差抽樣誤差:抽樣隨機(jī)性帶來(lái)的,無(wú)法避免可以計(jì)算可以控制計(jì)算抽樣誤差的水平(誤差計(jì)算正確)可以體現(xiàn)設(shè)計(jì)人員的專業(yè)水平概率抽樣挑戰(zhàn)之二:抽樣誤差與非抽樣誤差70非抽樣誤差:什么是非抽樣誤差體現(xiàn)在以下幾個(gè)方面:抽樣框誤差回答誤差,無(wú)回答誤差,調(diào)查員誤差計(jì)量誤差非抽樣誤差特點(diǎn):難以測(cè)度,成因復(fù)雜非抽樣誤差的控制可以體現(xiàn)調(diào)查方的執(zhí)行能力非抽樣誤差:什么是非抽樣誤差71完美的調(diào)查是科學(xué)和藝術(shù)的結(jié)合科學(xué)體現(xiàn)在對(duì)抽樣誤差的把握藝術(shù)體現(xiàn)在對(duì)非抽樣誤差的掌控目前我國(guó)很多抽樣調(diào)查項(xiàng)目,科學(xué)性不足,藝術(shù)性欠缺。誤差的計(jì)算與控制是我們面臨的嚴(yán)重挑戰(zhàn)完美的調(diào)查是科學(xué)和藝術(shù)的結(jié)合72概率抽樣挑戰(zhàn)之三:平衡的藝術(shù)——精度與費(fèi)用之關(guān)系概率抽樣挑戰(zhàn)之三:平衡的藝術(shù)——精度73精度與費(fèi)用精度100%95%60%20%40%……..…………..費(fèi)用精度與費(fèi)用精度100%95%60%20%40%……..74概率抽樣挑戰(zhàn)之四:樣本量的“陷阱”
問(wèn)題一.估計(jì)精度越高越好嗎?簡(jiǎn)單隨機(jī)抽樣估計(jì)比例P的樣本量與誤差(當(dāng)P=0.5時(shí))樣本量誤差500.141000.105000.04510000.032對(duì)精度要求的判斷十分重要。為得到最小誤差而選擇最大樣本量不是好的選擇。概率抽樣挑戰(zhàn)之四:樣本量的“陷阱”75問(wèn)題二.樣本量與總體規(guī)模N有關(guān)嗎?例:簡(jiǎn)單隨機(jī)抽樣估計(jì)P,置信度95%,允許誤差5%,在P=0.5條件下總體規(guī)模(N)所需樣本量(n)5044100805002221000286500037010000385100000398100000040010000000400問(wèn)題二.樣本量與總體規(guī)模N有關(guān)嗎?76由此可知,在精度要求相同條件下,在北京市進(jìn)行一項(xiàng)調(diào)查和在全國(guó)進(jìn)行一項(xiàng)調(diào)查,樣本量的差別并不大??傮w規(guī)模越大,進(jìn)行抽樣調(diào)查的效率越高。若分類、分區(qū)、分層分別進(jìn)行估計(jì)則另當(dāng)別論。由此可知,在精度要求相同條件下,在北京77四.常用抽樣方法1.簡(jiǎn)單隨機(jī)抽樣對(duì)總體不了解抽樣框資料沒(méi)有更多的輔助信息總體分布均勻與其他抽樣方式的結(jié)合四.常用抽樣方法782.分層抽樣總體單位之間存在明顯差異有進(jìn)行分層的輔助信息分層抽樣可以有效提高估計(jì)的效率好的分層應(yīng)該實(shí)現(xiàn):層數(shù)確定最優(yōu)層之間切點(diǎn)最優(yōu)各層樣本量的分配最優(yōu)2.分層抽樣793.系統(tǒng)抽樣便于操作便于審核(具有可重復(fù)性)在有些情況下可以提高估計(jì)的效率估計(jì)量方差計(jì)算復(fù)雜,可以采用不同的方法近似計(jì)算。3.系統(tǒng)抽樣804.整群抽樣構(gòu)造抽樣框容易調(diào)查成本低多以地域分群一般而言,整群抽樣估計(jì)效率會(huì)受到影響,對(duì)某些特定調(diào)查內(nèi)容,整群抽樣效率更高。4.整群抽樣815.多階段抽樣抽樣框構(gòu)造成本低節(jié)省人力、物力某些條件下可以滿足各級(jí)政府需要估計(jì)精度與階段多少有關(guān),所以階段劃分越少越好。5.多階段抽樣82五.關(guān)于調(diào)查方法調(diào)查方法有多種,如文檔調(diào)查,入戶調(diào)查,電話調(diào)查,郵寄調(diào)查,觀察法,實(shí)驗(yàn)法等。不同方法有不同特點(diǎn),如何選擇恰當(dāng)?shù)姆椒ǎ肯旅嬗袔讉€(gè)案例:
案例一:人口密度和人的行為的關(guān)系研究假說(shuō):人口密度過(guò)高可能產(chǎn)生負(fù)效應(yīng),引發(fā)犯罪和精神病五.關(guān)于調(diào)查方法83理論依據(jù):馬爾薩斯人口論,其論點(diǎn)有“人口過(guò)剩是貧困的主要原因”,“過(guò)剩人口會(huì)造成社會(huì)病態(tài)”。實(shí)證依據(jù):老鼠實(shí)驗(yàn),隨著實(shí)驗(yàn)籠里老鼠密度增高,老鼠表現(xiàn)煩躁不安,母鼠不愿看護(hù)自己幼鼠,搶食現(xiàn)象加劇,最后導(dǎo)致自相殘殺。需研究的問(wèn)題:這類現(xiàn)象在人類中是否存在?難點(diǎn):對(duì)人類無(wú)法使用象老鼠那樣進(jìn)行自相殘殺的實(shí)驗(yàn)。兩組設(shè)計(jì)人員分別提出了各自的方法?????理論依據(jù):馬爾薩斯人口論,其論點(diǎn)有“人口過(guò)剩是84組A:采用問(wèn)卷法,具體做法是1.確定房間面積,招聘應(yīng)試人員2.設(shè)計(jì)調(diào)查問(wèn)卷,反映受訪者心態(tài)變化,如是否喜歡新增加的陌生人,是否容忍活動(dòng)區(qū)域的減小3.剛開始是一人一間房,以后逐次增加,每增加新人,就回答一次問(wèn)題4.實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),高密度人群增加了人與人之間相互厭惡的傾向組A:采用問(wèn)卷法,具體做法是85組B:文檔調(diào)查,具體做法是1.按人口密度將分析區(qū)域劃出若干塊(實(shí)驗(yàn)區(qū)域?yàn)橹ゼ痈缡校?.查閱“芝加哥地方公眾記事錄”,里面有人口密度,犯罪率,精神病患者人數(shù)等寶貴資料存在的問(wèn)題,表象上看,人口密度和犯罪數(shù)量相關(guān)但人口密度和犯罪數(shù)量又與另外變量,如職業(yè)、種族、教育、收入等要素相關(guān),人口密度高的地方犯罪率高,但人口密度高的地方居住者的教育水平、收入水平偏低,黑人比例高,職業(yè)差。是職業(yè)、文化程度、收入水平影響犯罪率?還是人口密度影響犯罪率?組B:文檔調(diào)查,具體做法是86案例二壞血病的原因調(diào)查17世紀(jì)初,英國(guó)海軍患?jí)难”尘埃汉I系蹏?guó),壞血病的威脅,國(guó)防部進(jìn)行研究懷疑:維生素?cái)z入量少實(shí)驗(yàn)方法:四艘軍艦離港,一艘有橙汁供應(yīng),三艘沒(méi)有結(jié)果:有橙汁供應(yīng)水手身體狀況良好,沒(méi)有橙汁供應(yīng)水手開始成批生病結(jié)論:缺乏維生素?cái)z入是導(dǎo)致產(chǎn)生疾病的原因如何完善上述實(shí)驗(yàn)?案例二壞血病的原因調(diào)查87問(wèn)題一:患病原因可能是那三艘船上有導(dǎo)致生病的物質(zhì)問(wèn)題二:上有橙汁船的人可能就喜歡喝橙汁問(wèn)題三:上船之前水手身體狀況一樣嗎?問(wèn)題一:患病原因可能是那三艘船上有導(dǎo)致88實(shí)驗(yàn)法關(guān)鍵:分為實(shí)驗(yàn)組和對(duì)照組兩組其他情況相同,只有檢測(cè)因素(是否喝橙汁)不同。實(shí)驗(yàn)者在哪個(gè)組應(yīng)隨機(jī)產(chǎn)生。實(shí)驗(yàn)應(yīng)采用“雙盲”原則。如實(shí)驗(yàn)一種新藥療效,受試者不知道自己是在服藥還是服替代品,醫(yī)生也不應(yīng)知道受試者的分組情況。市場(chǎng)調(diào)查中很難嚴(yán)格控制其他因素,如想知道飲料顏色對(duì)銷量是否有影響,如何設(shè)計(jì)實(shí)驗(yàn)就是一個(gè)挑戰(zhàn)。實(shí)驗(yàn)法關(guān)鍵:分為實(shí)驗(yàn)組和對(duì)照組89案例三固體雞汁調(diào)查關(guān)鍵的一環(huán),產(chǎn)品的價(jià)格定位,面訪法問(wèn)卷中設(shè)計(jì)了四個(gè)問(wèn)題:1.請(qǐng)問(wèn)該種袋裝調(diào)料(100克)的價(jià)格為多少,您認(rèn)為是物有所值(較低價(jià)格)2.請(qǐng)問(wèn)該種袋裝調(diào)料價(jià)格低到什么程度,您將懷疑其質(zhì)量而不敢購(gòu)買(最低價(jià)格)3.請(qǐng)問(wèn)該種袋裝調(diào)料價(jià)格為多少,您認(rèn)為雖然偏高,但仍可能購(gòu)買(較高價(jià)格)案例三固體雞汁調(diào)查904.請(qǐng)問(wèn)該種袋裝調(diào)料價(jià)格高到什么程度,您肯定不買(最高價(jià)格)將調(diào)查結(jié)果統(tǒng)計(jì),將形成如下圖形4.請(qǐng)問(wèn)該種袋裝調(diào)料價(jià)格高到什么程度,您肯定不買91acdb問(wèn)題一
問(wèn)題二受訪者累積百分比圖2價(jià)格敏感度示意圖價(jià)格問(wèn)題三問(wèn)題四acdb問(wèn)題一問(wèn)題二受訪者累積百分比圖2價(jià)格敏感度示92形成a,b,c,d4個(gè)交叉點(diǎn)如果價(jià)格低于a點(diǎn),相當(dāng)多人會(huì)因?yàn)閮r(jià)格過(guò)低,懷疑其質(zhì)量而不敢購(gòu)買;如果價(jià)格高于b點(diǎn),也會(huì)有相當(dāng)多人因?yàn)閮r(jià)格過(guò)高而不去購(gòu)買;c,d是兩個(gè)均衡點(diǎn),在c點(diǎn)上認(rèn)為價(jià)格較高和價(jià)格較低的比例相同;在d點(diǎn)上認(rèn)為價(jià)格最高和價(jià)格最低的比例相同。形成a,b,c,d4個(gè)交叉點(diǎn)93定價(jià)的最后決策當(dāng)然需要考慮眾多要素,但調(diào)查結(jié)果無(wú)疑可以為決策提供參考依據(jù)。定價(jià)的最后決策當(dāng)然需要考慮眾多要素,94六.政府統(tǒng)計(jì)中需要研究的一些課題在政府統(tǒng)計(jì)中,抽樣調(diào)查需要研究一些問(wèn)題1.樣本輪換問(wèn)題涉及:輪換周期,輪換比例,輪換層次,輪換程序,數(shù)據(jù)的銜接等問(wèn)題。關(guān)于使用永久隨機(jī)數(shù)抽樣方法的討論《永久隨機(jī)數(shù)法樣本輪換初探》,統(tǒng)計(jì)教育,2004,2《不同樣本輪換方法的比較》,統(tǒng)計(jì)與預(yù)測(cè),2005,1六.政府統(tǒng)計(jì)中需要研究的一些課題952.抽樣調(diào)查滿足多層次需要問(wèn)題抽樣方法改進(jìn)的思路:層層抽樣追加樣本如何在估計(jì)方法上做文章“小區(qū)域”估計(jì)問(wèn)題《論抽樣調(diào)查中的域估計(jì)》,統(tǒng)計(jì)與決策2003,12《對(duì)抽樣調(diào)查解決多層次估計(jì)問(wèn)題的探討》,統(tǒng)計(jì)研究,2003,122.抽樣調(diào)查滿足多層次需要問(wèn)題963.抽樣調(diào)查后的數(shù)據(jù)分析盲目使用統(tǒng)計(jì)軟件的陷阱,抽樣方法與分析方法不對(duì)應(yīng)。例如權(quán)數(shù)的調(diào)整問(wèn)題抽樣估計(jì)中的權(quán)數(shù)調(diào)整《全國(guó)統(tǒng)計(jì)科學(xué)研討會(huì)學(xué)術(shù)論文集》2002,8多變量聯(lián)合加權(quán)應(yīng)用研究《統(tǒng)計(jì)理論、方法、應(yīng)用研究》2002.10《多變量與規(guī)模成比例概率抽樣的有關(guān)問(wèn)題》,統(tǒng)計(jì)與信息論壇,2004,1
3.抽樣調(diào)查后的數(shù)據(jù)分析974.數(shù)據(jù)的質(zhì)量——缺失數(shù)據(jù)問(wèn)題無(wú)回答,失真數(shù)據(jù)的剔除等處理缺失數(shù)據(jù)中輔助信息的利用《統(tǒng)計(jì)研究》1998,1不同插補(bǔ)方法的比較《數(shù)理統(tǒng)計(jì)與管理》2000,4缺失數(shù)據(jù)的偏差校正《數(shù)理統(tǒng)計(jì)與管理》2001,4缺失數(shù)據(jù)的加權(quán)調(diào)整《數(shù)理統(tǒng)計(jì)與管理》2001,5缺失數(shù)據(jù)的插補(bǔ)調(diào)整《數(shù)理統(tǒng)計(jì)與管理》2001,6處理無(wú)回答的校準(zhǔn)估計(jì)《統(tǒng)計(jì)研究》2002,6調(diào)查中缺失數(shù)據(jù)的統(tǒng)計(jì)處理,《市場(chǎng)統(tǒng)計(jì)與信息》2005,44.數(shù)據(jù)的質(zhì)量——缺失數(shù)據(jù)問(wèn)題98抽樣調(diào)查是科學(xué)和藝術(shù)的結(jié)合需要本本,但不能“本本主義”需要經(jīng)驗(yàn),但不能“經(jīng)驗(yàn)主義”抽樣調(diào)查是科學(xué)和藝術(shù)的結(jié)合99案例分析:極小信息情況下如何進(jìn)行樣本量分配案例分析:100調(diào)查目的:了解亞洲血統(tǒng)人口對(duì)某些問(wèn)題的看法,并和其他血統(tǒng)人口看法進(jìn)行對(duì)比分析。調(diào)查對(duì)象:美籍居民調(diào)查方式:電話調(diào)查,電話號(hào)碼需購(gòu)買樣本要求:Asian1200Hispanic600Non_H_B300NON_H_W600Total2700需要解決的問(wèn)題:購(gòu)買電話號(hào)碼數(shù)量及該數(shù)量在各地區(qū)的分配(回答率60%)。調(diào)查目的:了解亞洲血統(tǒng)人口對(duì)某些問(wèn)題的看法,并和其他血101
表1:美國(guó)不同地區(qū)亞洲血統(tǒng)人口所占比重(1)地區(qū)(2)人口數(shù)(3)地區(qū)人口比重(4)亞裔人數(shù)(5)=(4)/(2)亞裔比重S.F.7239590.28420715528.614Seattle5162590.2026081911.781L.A.88631643.47192556110.443N.Y.73225642.8685099556.964Chicago27837261.091029383.698Balance23510353692.08451022102.17total25531320810069086382.706(1)地區(qū)(2)人口數(shù)(3)地區(qū)人口比重(4)亞裔人數(shù)(5)102分析:如果樣本量按人口比例在全國(guó)各地區(qū)鋪開,所需要的電話號(hào)碼個(gè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版裝修工程合同范本:合同生效與解除條件2篇
- 2024跨區(qū)域電網(wǎng)工程建設(shè)與運(yùn)營(yíng)管理合同
- 二零二五版家居行業(yè)導(dǎo)購(gòu)員聘用與考核合同3篇
- 二零二五年餐飲行業(yè)食堂承包合作協(xié)議范本3篇
- 二零二五版家庭住家保姆綜合能力培訓(xùn)聘用合同3篇
- 2025年度新能源出租車特許經(jīng)營(yíng)合同3篇
- 二零二五年度跨境電商進(jìn)口商品代理銷售合同9篇
- 二零二五年股權(quán)質(zhì)押貸款擔(dān)保合同3篇
- 二零二五按揭房離婚財(cái)產(chǎn)分割與子女監(jiān)護(hù)協(xié)議范本3篇
- 2024淘寶店鋪加盟合作協(xié)議范本3篇
- 患者跌倒墜床的應(yīng)急預(yù)案試題及答案
- GB/T 24128-2018塑料塑料防霉劑的防霉效果評(píng)估
- 福建省地方標(biāo)準(zhǔn)《先張法預(yù)應(yīng)力混凝土管樁基礎(chǔ)技術(shù)規(guī)程》DBJ13-2023
- 危險(xiǎn)作業(yè)監(jiān)護(hù)人員培訓(xùn)
- 職業(yè)病防治企業(yè)臺(tái)賬樣本
- 充電樁驗(yàn)收表
- 城市水環(huán)境新型污染物的去除新技術(shù)課件
- 中長(zhǎng)期貸款按實(shí)際投向統(tǒng)計(jì)統(tǒng)計(jì)制度
- 新媒體營(yíng)銷完整版教學(xué)課件最全ppt整套教程電子講義(最新)
- 鍋爐專業(yè)2020年防非停措施
- 中國(guó)鐵塔股份有限公司通信鐵塔、機(jī)房施工及驗(yàn)收規(guī)范(試行)
評(píng)論
0/150
提交評(píng)論