![抽樣調(diào)查-第11章調(diào)查中的非抽樣誤差課件_第1頁](http://file4.renrendoc.com/view/67a75c691153fd8f9b81a804ee14df5a/67a75c691153fd8f9b81a804ee14df5a1.gif)
![抽樣調(diào)查-第11章調(diào)查中的非抽樣誤差課件_第2頁](http://file4.renrendoc.com/view/67a75c691153fd8f9b81a804ee14df5a/67a75c691153fd8f9b81a804ee14df5a2.gif)
![抽樣調(diào)查-第11章調(diào)查中的非抽樣誤差課件_第3頁](http://file4.renrendoc.com/view/67a75c691153fd8f9b81a804ee14df5a/67a75c691153fd8f9b81a804ee14df5a3.gif)
![抽樣調(diào)查-第11章調(diào)查中的非抽樣誤差課件_第4頁](http://file4.renrendoc.com/view/67a75c691153fd8f9b81a804ee14df5a/67a75c691153fd8f9b81a804ee14df5a4.gif)
![抽樣調(diào)查-第11章調(diào)查中的非抽樣誤差課件_第5頁](http://file4.renrendoc.com/view/67a75c691153fd8f9b81a804ee14df5a/67a75c691153fd8f9b81a804ee14df5a5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第十一章調(diào)查中的非抽樣誤差§11.1引言
非抽樣誤差是指除抽樣誤差以外的,由于各種原因引起的誤差。在概率抽樣、非概率抽樣、其他全面調(diào)查和非全面調(diào)查已及普查中,非抽樣誤差都有可能存在。第十一章調(diào)查中的非抽樣誤差§11.1引言1同抽樣誤差相比,非抽樣誤差有如下特點:1、非抽樣誤差不是由于抽樣的隨機性帶來的,所以在抽樣調(diào)查中,它不可能隨著樣本量的增大而減??;2、在抽樣調(diào)查中,由于非抽樣誤差的影響,往往造成估計量的有偏;3、有些非抽樣誤差難以識別和測定。如抽樣框是不完善的,而調(diào)查設(shè)計人員并沒有意識到;4、有些非抽樣誤差成因復(fù)雜,對其研究不夠,因此,在很多時候非抽樣誤差比抽樣誤差造成的影響更嚴(yán)重,對此必須引起高度重視。同抽樣誤差相比,非抽樣誤差有如下特點:2根據(jù)非抽樣誤差的來源、性質(zhì)
可分為以下三類:(1)抽樣框誤差,即由不完善的抽樣框引起的誤差;(2)無回答誤差,即由于種種原因沒有從被調(diào)查單元獲得調(diào)查結(jié)果,造成調(diào)查數(shù)據(jù)的缺失;(3)計量誤差,即所獲得的調(diào)查數(shù)據(jù)與其真值之間不一致造成的誤差。根據(jù)非抽樣誤差的來源、性質(zhì)
可分為以下三類:(1)抽樣框誤3一、概念抽樣調(diào)查中的總體有兩個:目標(biāo)總體—調(diào)查研究對象的全體。抽樣總體—從中抽取樣本的總體。(即抽樣框)理想抽樣框的標(biāo)志是目標(biāo)總體和抽樣總體完全重合。否則抽樣框就是不完善的。§11.2抽樣框誤差一、概念§11.2抽樣框誤差4二、抽樣框誤差的類型及影響(1)抽樣框誤差的類型●丟失目標(biāo)總體單元?!癜悄繕?biāo)總體單元?!癯闃涌蛑械膯卧c目標(biāo)總體單元不一一對應(yīng)。(存在一對多或多對一的情況)●不正確的輔助信息。(如分層抽樣、不等概抽樣、比率估計和回歸估計等所需的輔助信息)二、抽樣框誤差的類型及影響(1)抽樣框誤差的類型5(2)對抽樣框誤差的基本認識●有些誤差來自構(gòu)成抽樣框資料本身,而不是由于抽樣設(shè)計的問題?!癯闃涌虼嬖诘膯栴},有些是不容易解決的。因此抽樣框的維護、抽樣框使用情況的不斷總結(jié)與研討,對于經(jīng)常性的調(diào)查項目來說是十分必要的?!癯闃涌虻牟煌晟撇⒉皇遣荒苁褂?。可以進行修補、調(diào)整。(2)對抽樣框誤差的基本認識6(3)抽樣框誤差的影響設(shè)目標(biāo)總體單元:N抽樣框中單元:N1抽樣框中丟失的單元:N0
N=N1+N0
■總體總量的估計總體總量的真值是:現(xiàn)從抽樣框中的N1個單元中采用簡單隨機抽樣抽出容量為n的一個樣本,由于n取自于N1對總體總量的估計為:(3)抽樣框誤差的影響現(xiàn)從抽樣框中的N1個單元中7顯然此時的估計是有偏的,偏倚為:這表明估計量低估了總體總量,令Y的相對偏倚可以寫為顯然此時的估計是有偏的,偏倚為:這表明估計量低估了總體總量,8由上式可知,總體總和的相對偏倚取決于
和■總體均值的估計在抽樣框存在丟失單元情況下,均值估計量為:此時估計量的偏倚為:的相對偏倚可以寫為:由上式可知,總體總和的相對偏倚取決于和■9由上式可以看出,如果丟失單元的均值與抽樣單元的均值相同,即,則估計量是目標(biāo)變量的無偏估計。反之,如果,偏倚狀況則隨著的變化而變化。由上式可以看出,如果丟失單元的均值與抽樣單10三、不完善抽樣框的使用抽樣框不完善并不是不能使用,因為構(gòu)造一個完善的抽樣框有時是非常困難的。使用不完善抽樣框時若能采用一些補救措施,有助于減小抽樣框誤差。主要采用以下三項補救措施:
●利用核查,掌握誤差情況,對不完善抽樣框進行調(diào)整;●事先制定一些規(guī)則,對發(fā)現(xiàn)的抽樣框問題進行現(xiàn)場處理;
●使用多個抽樣框進行抽樣。三、不完善抽樣框的使用抽樣框不完善并不11§11.3無回答誤差一、概念
無回答誤差是指在調(diào)查中由于各種原因,調(diào)查人員沒能夠從入選樣本的單元處獲得所需要的信息,由于數(shù)據(jù)缺失造成估計量的偏差。無回答誤差是一種重要的非抽樣誤差,這種現(xiàn)象十分普遍,對估計量的危害也比較大,所以國際上對這方面的討論一直比較熱烈,目前這種討論還在繼續(xù)?!?1.3無回答誤差一、概念12從無回答的內(nèi)容來看可分為:
單元無回答(被調(diào)查單元沒有參入或拒絕受調(diào)查,他們交的是一份白卷)
項目無回答
(被調(diào)查單元雖然接受了調(diào)查,但對其中的一些項目沒有回答)從無回答的內(nèi)容來看可分為:13從無回答的性質(zhì)來看可分為:
有意無回答(有意無回答常常與調(diào)查內(nèi)容有關(guān),如對調(diào)查內(nèi)容反感,或涉及個人隱私不愿意回答)
無意無回答
(無意無回答常常與調(diào)查內(nèi)容無關(guān),之所以無回答是因為被調(diào)查者生病或很忙,無法接受調(diào)查)從無回答的性質(zhì)來看可分為:14
有意無回答對數(shù)據(jù)質(zhì)量的影響很大,回答者和不回答者之間往往存在系統(tǒng)性差異。這種不回答不僅減少了有效樣本量,造成估計量方差增大,而且會帶來估計偏倚。
無意無回答可以看成是隨機的,這種不回答雖然會造成估計量方差增大,但通常認為不會帶來估計偏倚。
有意無回答對數(shù)據(jù)質(zhì)量的影響很大,回答者和15
二、無回答產(chǎn)生的原因及影響如果把采集數(shù)據(jù)的過程劃分為查找、接觸和采訪三個階段,三個階段都有可能出現(xiàn)無回答。1、查找階段調(diào)查人員無法找到被調(diào)查者,主要原因有地址不詳、被調(diào)查者搬遷、調(diào)查人員不熟悉地址;2、接觸階段被調(diào)查生病、對調(diào)查不感興趣或別的原因拒訪;3、采訪階段調(diào)查開始后被調(diào)查者對某些問題不愿提供答案、調(diào)查員由于粗心遺漏某些項目等二、無回答產(chǎn)生的原因及影響1、查找階段調(diào)查人員16無回答的影響:回答層(N1)總體(N)無回答層(N0)則總體均值為:回答層樣本(n1)總體樣本(n)
無回答層樣本(n0
)無回答的影響:則總體均值為:17根據(jù)回答層單元計算出的樣本均值為用作為總體真值得估計量,其偏倚為:偏倚相對偏倚由上式可以看出:無回答偏倚主要來自兩個方面:一個是回答層與無回答層之間的數(shù)量差異;一個是無回答率。根據(jù)回答層單元計算出的樣本均值為偏倚相對偏倚由18三、降低無回答的措施主要措施是預(yù)防,預(yù)防措施有:●問卷設(shè)計得具有吸引力;●注意適當(dāng)?shù)拈L度;●充分利用調(diào)查組織單位的權(quán)威性和影響力;●注意調(diào)查員的挑選;●做好調(diào)查員的培訓(xùn);●注意調(diào)查過程的監(jiān)控;●獎勵措施;●再次調(diào)查。三、降低無回答的措施主要措施是預(yù)防,預(yù)防措施有:19四、對存在無回答數(shù)據(jù)的調(diào)整
調(diào)查中無回答的情況總是難以避免,由于無回答造成數(shù)據(jù)不全,如果不加處理,就有可能造成估計量偏倚。下面介紹幾種數(shù)據(jù)調(diào)整的方法:
1、再抽樣調(diào)整在第一次無回答的單元中隨機抽取一個子樣本,通過更細致、更充分的工作,獲得該子樣本的數(shù)據(jù),作為整個無回答層的代表值。四、對存在無回答數(shù)據(jù)的調(diào)整調(diào)查中無回答的情20
2、加權(quán)調(diào)整
對存在無回答數(shù)據(jù)進行補救的另一種方法是采用加權(quán)調(diào)整。加權(quán)調(diào)整法是通過對調(diào)查中所獲得的回答數(shù)據(jù)使用加權(quán)因子,達到對數(shù)據(jù)的調(diào)整,減小由于無回答造成的估計偏倚。
3、相關(guān)推估法
相關(guān)推估法主要用于調(diào)查中的項目無回答,即調(diào)查單元不是完全拒絕調(diào)查,而是拒絕其中某些項目的調(diào)查。這時可以利用回答項目的信息對無回答數(shù)據(jù)進行推估。2、加權(quán)調(diào)整214、插補調(diào)整
在數(shù)據(jù)整理階段,利用調(diào)查結(jié)果,采用一定的方式,為無回答的缺失值確定一個合理的估計值,插補到原缺失數(shù)據(jù)的位置上。實際使用時,用得較多的是均值插補,其方法是:首先根據(jù)輔助信息將樣本分為若干組,是組內(nèi)各單元的主要特征相似。然后分別計算各組目標(biāo)變量Y的均值,將各組均值作為組內(nèi)所有缺失項的替補值4、插補調(diào)整22§11.4計量誤差
計量誤差是指由于種種原因,調(diào)查中所獲得的數(shù)據(jù)與真值不一致。計量誤差主要成因來自于以下幾個方面:
●設(shè)計誤差(設(shè)計方面原因造成計量誤差)
●被調(diào)查者誤差(被調(diào)查者提供的數(shù)據(jù)失真)
●調(diào)查者誤差(現(xiàn)場調(diào)查人員造成的誤差)●其他誤差(由于測量工具、編碼、錄入)§11.4計量誤差計量誤差是指由于種種23減少計量誤差的措施
減少計量誤差需要對調(diào)查全過程進行質(zhì)量監(jiān)控:(1)調(diào)查設(shè)計方面調(diào)查問卷設(shè)計出來后,應(yīng)組織有關(guān)人員對問卷進行討論。如果是大型調(diào)查活動,還要在正式調(diào)查之前進行預(yù)調(diào)查,在實踐中對問卷進行檢驗。(2)現(xiàn)場準(zhǔn)備方面在收集數(shù)據(jù)之前,需要做好準(zhǔn)備工作:招聘調(diào)查員;培訓(xùn)訪問員;編寫調(diào)查手冊。減少計量誤差的措施減少計量誤差需要對調(diào)查全24(3)調(diào)查結(jié)果審核方面審核是對調(diào)查質(zhì)量進行控制的一道重要的工序,也是減少計量誤差的有效方法。審核的目的是要保證調(diào)查所得數(shù)據(jù)的完整性、一致性和有效性。審核可以在調(diào)查過程中的任何階段進行:
收據(jù)數(shù)據(jù)時進行審核(調(diào)查員在調(diào)查進行過程中根據(jù)常識和經(jīng)驗,可以判斷出一些問題的答案是否屬于“可接受”范圍)
數(shù)據(jù)收集完畢后的審核(審核的重點是數(shù)據(jù)的一致性審核和離群值的檢測)(3)調(diào)查結(jié)果審核方面審核是對調(diào)查質(zhì)量進行控制25§11.5離群值的檢測和處理一、離群值的概念離群值是指調(diào)查數(shù)據(jù)集中的極端值,是指與其他數(shù)據(jù)明顯不一致的觀測值。離群值的出現(xiàn)可能有以下兩個原因:由于數(shù)據(jù)本身具有的差異性??雌饋碇档脩岩傻臇|西也許是真實的;由于被調(diào)查者回答數(shù)據(jù)有錯誤或調(diào)查人員記錄數(shù)據(jù)有錯誤。§11.5離群值的檢測和處理一、離群值的概念26二、離群值的確認
通常離群值的檢測是通過測量它們與數(shù)據(jù)中心的相對距離來辨認的。例如,若是要觀測的樣本數(shù)據(jù),m和s分別是側(cè)度數(shù)據(jù)集中趨勢和離散趨勢的指標(biāo),那么,離數(shù)據(jù)中心的相對距離可以定義為二、離群值的確認通常離群值的檢測是通過測量它27
如果越過了預(yù)先確定的偏離值,那么該觀測值就被認為是離群的。另外,離群值也可以通過下面的置信區(qū)間進行確認:式中和分別為根據(jù)預(yù)先確定的置信度得到的標(biāo)準(zhǔn)正態(tài)分布的上限和下限值。落在這個區(qū)間之外的觀測值被認為是離群值。
如果越過了預(yù)先確定的偏離值,那么28三、離群值的處理
如果在調(diào)查進行中發(fā)現(xiàn)離群值,就要及時處理,例如進行回訪核實,對錯誤進行更正。如果在調(diào)查完畢后的審核中發(fā)現(xiàn)離群值,通常對離群值采用插補處理,即將離群值剔除,然后使用插補法調(diào)整。如果在審核時沒有進行處理的離群值可以在估計的時候處理。估計時有以下三種方法處理離群值:三、離群值的處理如果在調(diào)查進行中發(fā)現(xiàn)離29
●改變數(shù)值
這種方法首先要將樣本數(shù)據(jù)按從大到小依次排序,然后再按下面的步驟計算:在簡單隨機抽樣中,總體總量Y的無偏估計公式為:式中,i表示樣本中第i個單元,s為所有樣本的集合.●改變數(shù)值式中,i表示樣本中第i個單元,s為所有樣30
若樣本數(shù)據(jù)中第k個最大值kth被認為是離群值,單側(cè)k次縮尾估計量就可以通過第n-k個最大值yn-k代替這些離群值,即●調(diào)整權(quán)重
處理離群值的另一種方法是降低離群值的權(quán)重,從而使它們的影響變小。例如,賦予離群值的權(quán)重為1,即離群值僅僅代表它自己而不代表其他總體單元。若樣本數(shù)據(jù)中第k個最大值kth被認為是離31
●選取穩(wěn)健估計量
在經(jīng)典的估計理論中,通常假定估計量服從正態(tài)分布,樣本均值和樣本方差估計量在正態(tài)分布的假設(shè)下也是最理想的。但是,這些估計量對離群值非常敏感。穩(wěn)健估計量則能克服這種局限性,例如中位數(shù)比均值更穩(wěn)定,四分位數(shù)比通常的方差估計量更穩(wěn)定。(第十一章結(jié)束)●選取穩(wěn)健估計量(第十一章結(jié)束)32第十一章調(diào)查中的非抽樣誤差§11.1引言
非抽樣誤差是指除抽樣誤差以外的,由于各種原因引起的誤差。在概率抽樣、非概率抽樣、其他全面調(diào)查和非全面調(diào)查已及普查中,非抽樣誤差都有可能存在。第十一章調(diào)查中的非抽樣誤差§11.1引言33同抽樣誤差相比,非抽樣誤差有如下特點:1、非抽樣誤差不是由于抽樣的隨機性帶來的,所以在抽樣調(diào)查中,它不可能隨著樣本量的增大而減小;2、在抽樣調(diào)查中,由于非抽樣誤差的影響,往往造成估計量的有偏;3、有些非抽樣誤差難以識別和測定。如抽樣框是不完善的,而調(diào)查設(shè)計人員并沒有意識到;4、有些非抽樣誤差成因復(fù)雜,對其研究不夠,因此,在很多時候非抽樣誤差比抽樣誤差造成的影響更嚴(yán)重,對此必須引起高度重視。同抽樣誤差相比,非抽樣誤差有如下特點:34根據(jù)非抽樣誤差的來源、性質(zhì)
可分為以下三類:(1)抽樣框誤差,即由不完善的抽樣框引起的誤差;(2)無回答誤差,即由于種種原因沒有從被調(diào)查單元獲得調(diào)查結(jié)果,造成調(diào)查數(shù)據(jù)的缺失;(3)計量誤差,即所獲得的調(diào)查數(shù)據(jù)與其真值之間不一致造成的誤差。根據(jù)非抽樣誤差的來源、性質(zhì)
可分為以下三類:(1)抽樣框誤35一、概念抽樣調(diào)查中的總體有兩個:目標(biāo)總體—調(diào)查研究對象的全體。抽樣總體—從中抽取樣本的總體。(即抽樣框)理想抽樣框的標(biāo)志是目標(biāo)總體和抽樣總體完全重合。否則抽樣框就是不完善的?!?1.2抽樣框誤差一、概念§11.2抽樣框誤差36二、抽樣框誤差的類型及影響(1)抽樣框誤差的類型●丟失目標(biāo)總體單元?!癜悄繕?biāo)總體單元?!癯闃涌蛑械膯卧c目標(biāo)總體單元不一一對應(yīng)。(存在一對多或多對一的情況)●不正確的輔助信息。(如分層抽樣、不等概抽樣、比率估計和回歸估計等所需的輔助信息)二、抽樣框誤差的類型及影響(1)抽樣框誤差的類型37(2)對抽樣框誤差的基本認識●有些誤差來自構(gòu)成抽樣框資料本身,而不是由于抽樣設(shè)計的問題?!癯闃涌虼嬖诘膯栴},有些是不容易解決的。因此抽樣框的維護、抽樣框使用情況的不斷總結(jié)與研討,對于經(jīng)常性的調(diào)查項目來說是十分必要的?!癯闃涌虻牟煌晟撇⒉皇遣荒苁褂?。可以進行修補、調(diào)整。(2)對抽樣框誤差的基本認識38(3)抽樣框誤差的影響設(shè)目標(biāo)總體單元:N抽樣框中單元:N1抽樣框中丟失的單元:N0
N=N1+N0
■總體總量的估計總體總量的真值是:現(xiàn)從抽樣框中的N1個單元中采用簡單隨機抽樣抽出容量為n的一個樣本,由于n取自于N1對總體總量的估計為:(3)抽樣框誤差的影響現(xiàn)從抽樣框中的N1個單元中39顯然此時的估計是有偏的,偏倚為:這表明估計量低估了總體總量,令Y的相對偏倚可以寫為顯然此時的估計是有偏的,偏倚為:這表明估計量低估了總體總量,40由上式可知,總體總和的相對偏倚取決于
和■總體均值的估計在抽樣框存在丟失單元情況下,均值估計量為:此時估計量的偏倚為:的相對偏倚可以寫為:由上式可知,總體總和的相對偏倚取決于和■41由上式可以看出,如果丟失單元的均值與抽樣單元的均值相同,即,則估計量是目標(biāo)變量的無偏估計。反之,如果,偏倚狀況則隨著的變化而變化。由上式可以看出,如果丟失單元的均值與抽樣單42三、不完善抽樣框的使用抽樣框不完善并不是不能使用,因為構(gòu)造一個完善的抽樣框有時是非常困難的。使用不完善抽樣框時若能采用一些補救措施,有助于減小抽樣框誤差。主要采用以下三項補救措施:
●利用核查,掌握誤差情況,對不完善抽樣框進行調(diào)整;●事先制定一些規(guī)則,對發(fā)現(xiàn)的抽樣框問題進行現(xiàn)場處理;
●使用多個抽樣框進行抽樣。三、不完善抽樣框的使用抽樣框不完善并不43§11.3無回答誤差一、概念
無回答誤差是指在調(diào)查中由于各種原因,調(diào)查人員沒能夠從入選樣本的單元處獲得所需要的信息,由于數(shù)據(jù)缺失造成估計量的偏差。無回答誤差是一種重要的非抽樣誤差,這種現(xiàn)象十分普遍,對估計量的危害也比較大,所以國際上對這方面的討論一直比較熱烈,目前這種討論還在繼續(xù)?!?1.3無回答誤差一、概念44從無回答的內(nèi)容來看可分為:
單元無回答(被調(diào)查單元沒有參入或拒絕受調(diào)查,他們交的是一份白卷)
項目無回答
(被調(diào)查單元雖然接受了調(diào)查,但對其中的一些項目沒有回答)從無回答的內(nèi)容來看可分為:45從無回答的性質(zhì)來看可分為:
有意無回答(有意無回答常常與調(diào)查內(nèi)容有關(guān),如對調(diào)查內(nèi)容反感,或涉及個人隱私不愿意回答)
無意無回答
(無意無回答常常與調(diào)查內(nèi)容無關(guān),之所以無回答是因為被調(diào)查者生病或很忙,無法接受調(diào)查)從無回答的性質(zhì)來看可分為:46
有意無回答對數(shù)據(jù)質(zhì)量的影響很大,回答者和不回答者之間往往存在系統(tǒng)性差異。這種不回答不僅減少了有效樣本量,造成估計量方差增大,而且會帶來估計偏倚。
無意無回答可以看成是隨機的,這種不回答雖然會造成估計量方差增大,但通常認為不會帶來估計偏倚。
有意無回答對數(shù)據(jù)質(zhì)量的影響很大,回答者和47
二、無回答產(chǎn)生的原因及影響如果把采集數(shù)據(jù)的過程劃分為查找、接觸和采訪三個階段,三個階段都有可能出現(xiàn)無回答。1、查找階段調(diào)查人員無法找到被調(diào)查者,主要原因有地址不詳、被調(diào)查者搬遷、調(diào)查人員不熟悉地址;2、接觸階段被調(diào)查生病、對調(diào)查不感興趣或別的原因拒訪;3、采訪階段調(diào)查開始后被調(diào)查者對某些問題不愿提供答案、調(diào)查員由于粗心遺漏某些項目等二、無回答產(chǎn)生的原因及影響1、查找階段調(diào)查人員48無回答的影響:回答層(N1)總體(N)無回答層(N0)則總體均值為:回答層樣本(n1)總體樣本(n)
無回答層樣本(n0
)無回答的影響:則總體均值為:49根據(jù)回答層單元計算出的樣本均值為用作為總體真值得估計量,其偏倚為:偏倚相對偏倚由上式可以看出:無回答偏倚主要來自兩個方面:一個是回答層與無回答層之間的數(shù)量差異;一個是無回答率。根據(jù)回答層單元計算出的樣本均值為偏倚相對偏倚由50三、降低無回答的措施主要措施是預(yù)防,預(yù)防措施有:●問卷設(shè)計得具有吸引力;●注意適當(dāng)?shù)拈L度;●充分利用調(diào)查組織單位的權(quán)威性和影響力;●注意調(diào)查員的挑選;●做好調(diào)查員的培訓(xùn);●注意調(diào)查過程的監(jiān)控;●獎勵措施;●再次調(diào)查。三、降低無回答的措施主要措施是預(yù)防,預(yù)防措施有:51四、對存在無回答數(shù)據(jù)的調(diào)整
調(diào)查中無回答的情況總是難以避免,由于無回答造成數(shù)據(jù)不全,如果不加處理,就有可能造成估計量偏倚。下面介紹幾種數(shù)據(jù)調(diào)整的方法:
1、再抽樣調(diào)整在第一次無回答的單元中隨機抽取一個子樣本,通過更細致、更充分的工作,獲得該子樣本的數(shù)據(jù),作為整個無回答層的代表值。四、對存在無回答數(shù)據(jù)的調(diào)整調(diào)查中無回答的情52
2、加權(quán)調(diào)整
對存在無回答數(shù)據(jù)進行補救的另一種方法是采用加權(quán)調(diào)整。加權(quán)調(diào)整法是通過對調(diào)查中所獲得的回答數(shù)據(jù)使用加權(quán)因子,達到對數(shù)據(jù)的調(diào)整,減小由于無回答造成的估計偏倚。
3、相關(guān)推估法
相關(guān)推估法主要用于調(diào)查中的項目無回答,即調(diào)查單元不是完全拒絕調(diào)查,而是拒絕其中某些項目的調(diào)查。這時可以利用回答項目的信息對無回答數(shù)據(jù)進行推估。2、加權(quán)調(diào)整534、插補調(diào)整
在數(shù)據(jù)整理階段,利用調(diào)查結(jié)果,采用一定的方式,為無回答的缺失值確定一個合理的估計值,插補到原缺失數(shù)據(jù)的位置上。實際使用時,用得較多的是均值插補,其方法是:首先根據(jù)輔助信息將樣本分為若干組,是組內(nèi)各單元的主要特征相似。然后分別計算各組目標(biāo)變量Y的均值,將各組均值作為組內(nèi)所有缺失項的替補值4、插補調(diào)整54§11.4計量誤差
計量誤差是指由于種種原因,調(diào)查中所獲得的數(shù)據(jù)與真值不一致。計量誤差主要成因來自于以下幾個方面:
●設(shè)計誤差(設(shè)計方面原因造成計量誤差)
●被調(diào)查者誤差(被調(diào)查者提供的數(shù)據(jù)失真)
●調(diào)查者誤差(現(xiàn)場調(diào)查人員造成的誤差)●其他誤差(由于測量工具、編碼、錄入)§11.4計量誤差計量誤差是指由于種種55減少計量誤差的措施
減少計量誤差需要對調(diào)查全過程進行質(zhì)量監(jiān)控:(1)調(diào)查設(shè)計方面調(diào)查問卷設(shè)計出來后,應(yīng)組織有關(guān)人員對問卷進行討論。如果是大型調(diào)查活動,還要在正式調(diào)查之前進行預(yù)調(diào)查,在實踐中對問卷進行檢驗。(2)現(xiàn)場準(zhǔn)備方面在收集數(shù)據(jù)之前,需要做好準(zhǔn)備工作:招聘調(diào)查員;培訓(xùn)訪問員;編寫調(diào)查手冊。減少計量誤差的措施減少計量誤差需要對調(diào)查全56(3)調(diào)查結(jié)果審核方面審核是對調(diào)查質(zhì)量進行控制的一道重要的工序,也是減少計量誤差的有效方法。審核的目的是要保證調(diào)查所得數(shù)據(jù)的完整性、一致性和有效性。審核可以在調(diào)查過程中的任何階段進行:
收據(jù)數(shù)據(jù)時進行審核(調(diào)查員在調(diào)查進行過程中根據(jù)常識和經(jīng)驗,可以判斷出一些問題的答案是否屬于“可接受”范圍)
數(shù)據(jù)收集完畢后的審核(審核的重點是數(shù)據(jù)的一致性審核和離群值的檢測)(3)調(diào)查結(jié)果審核方面審核是對調(diào)查質(zhì)量進行控制57§11.5離群值的檢測和處理一、離群值的概念離群值是指調(diào)查數(shù)據(jù)集中的極端值,是指與其他數(shù)據(jù)明顯不一致的觀測值。離群值的出現(xiàn)可能有以下兩個原因:由
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 不動產(chǎn)權(quán)益贈與合同模板
- 中美貿(mào)易合作框架合同
- 個人大額借款合同協(xié)議
- 中外物流運輸合同樣本
- 專利實施許可合同示范文
- 主機托管及域名解析合同范本
- 個人海外投資合同范本
- 一對一家教輔導(dǎo)合同
- 個人借款還款責(zé)任合同書
- 個人簡易貸款合同范本
- 電氣領(lǐng)域知識培訓(xùn)課件
- 山東省部分學(xué)校2024-2025學(xué)年高一上學(xué)期12月選科指導(dǎo)聯(lián)合測試地理試題( 含答案)
- 針對老年人的交通安全宣傳
- 2023年廣東省公務(wù)員錄用考試《行測》真題及答案解析
- 陜西省咸陽市2023-2024學(xué)年高一上學(xué)期期末考試 數(shù)學(xué) 含答案
- 新員工入職登記表模板表格(標(biāo)準(zhǔn)版)
- 天津市河北區(qū)2024-2025學(xué)年八年級上學(xué)期11月期中歷史試題(含答案)
- 初中數(shù)學(xué)幾何《將軍飲馬》模型題匯編含答案解析
- 小兒高熱驚厥課件
- 劉潤年度演講2024
- 陜西省2024年中考語文真題試卷【附答案】
評論
0/150
提交評論