第10章 非抽樣誤差_第1頁(yè)
第10章 非抽樣誤差_第2頁(yè)
第10章 非抽樣誤差_第3頁(yè)
第10章 非抽樣誤差_第4頁(yè)
第10章 非抽樣誤差_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Chap10

nonsamplingerror一、非抽樣誤差的來源

非抽樣誤差就是由抽樣誤差以外因素引起的,因樣本觀察數(shù)據(jù)非同質(zhì)、或殘缺、或不真實(shí)而產(chǎn)生的誤差。為了使非抽樣誤差問題簡(jiǎn)單化,我們可以按照抽樣調(diào)查的過程來考察其來源?!舫闃臃桨冈O(shè)計(jì)階段

◆數(shù)據(jù)收集階段

◆數(shù)據(jù)處理階段

抽樣誤差與非抽樣誤差非抽樣誤差的特點(diǎn)不隨樣本量增加而減少造成估計(jì)偏差難以測(cè)定與識(shí)別理論相對(duì)薄弱◆在抽樣方案設(shè)計(jì)階段,非抽樣誤差的來源:

(1)抽樣框的編制與準(zhǔn)備不夠充分完善;

(2)問卷設(shè)計(jì)不夠科學(xué)合理。

◆在數(shù)據(jù)收集階段,非抽樣誤差的來源:

(1)調(diào)查數(shù)據(jù)的殘缺(無回答);

(2)調(diào)查數(shù)據(jù)的錯(cuò)誤?!粼跀?shù)據(jù)處理階段,非抽樣誤差存在于對(duì)調(diào)查資料的整理、分組、計(jì)算、編碼和計(jì)算機(jī)錄入等過程中,是一種工作上的差錯(cuò)。

◆把上述三個(gè)階段的各種非抽樣誤差加以歸納,可以概括為框誤差、無回答誤差和計(jì)量誤差三類。

其中計(jì)量誤差包括抽樣方案設(shè)計(jì)階段有缺陷的問卷設(shè)計(jì)、數(shù)據(jù)收集階段有錯(cuò)誤的調(diào)查數(shù)據(jù)和數(shù)據(jù)處理階段工作上的差錯(cuò)所帶來的誤差,也就是調(diào)查性誤差。

二、非抽樣誤差的特點(diǎn)非特有性:為非抽樣調(diào)查所特有;

非一致性:使抽樣估計(jì)結(jié)果產(chǎn)生偏差,并且樣本越大產(chǎn)生偏差的可能性越大;難測(cè)定性:難以對(duì)其進(jìn)行描述和測(cè)定,具有很強(qiáng)的隱蔽性;難評(píng)價(jià)性:非抽樣誤差的存在使得對(duì)抽樣效果的評(píng)價(jià)與衡量復(fù)雜化;全過程性:存在于抽樣調(diào)查的所有階段。第一節(jié)無回答誤差

一、無回答誤差的成因

(一)無回答的含義

無回答(Nonresponse)是指未能取得所要搜集資料的一種現(xiàn)象,它包括兩種情況:個(gè)體無回答和項(xiàng)目無回答。個(gè)體無回答也稱全無回答,是指被調(diào)查者沒有接受調(diào)查、造成整張問卷出現(xiàn)空白的現(xiàn)象;項(xiàng)目無回答也稱部分無回答,是指被調(diào)查者回答了問卷中的部分調(diào)查項(xiàng)目未能回答其它調(diào)查項(xiàng)目的現(xiàn)象。不論是個(gè)體無回答還是項(xiàng)目無回答,都將導(dǎo)致調(diào)查數(shù)據(jù)殘缺不全,從而最終影響估計(jì)結(jié)果,降低估計(jì)精度或可靠程度。因無回答而造成的估計(jì)誤差,就稱為無回答誤差。

(二)無回答的成因1、遺漏了被調(diào)查者;2、被調(diào)查者地址不詳;3、調(diào)查內(nèi)容未達(dá)被調(diào)查者;4、被調(diào)查者拒絕回答;5、回答不準(zhǔn)確或不知如何回答;6、忘記回答。以上各種原因,有的屬于客觀性,有的則屬于主觀性;有的屬于有意識(shí),有的則屬于無意識(shí);有的屬于調(diào)查人員方,有的則屬于被調(diào)查者方。樣本單位回答狀況分類(2)明確單位(3)其它(不明確單位)(1)全部單位(4)合格單位(5)不合格單位(3A)估計(jì)的合格單位(3B)估計(jì)的不合格單位(6)回答單位(7)無回答單位(8)不存在的單位(9)暫時(shí)不合格單位(10)永久性不合格單位(12)其他回答者(11)拒答轉(zhuǎn)變者(13)拒答者(14)未征尋者(15)其它無回答者回答率的計(jì)算回答單位數(shù)/全部樣本數(shù)回答單位數(shù)/明確樣本數(shù)回答單位數(shù)/合格樣本數(shù)回答單位數(shù)/(合格樣本數(shù)-拒答數(shù))二、無回答誤差的統(tǒng)計(jì)影響

為了測(cè)定無回答對(duì)抽樣的影響,先把總體分為兩層:回答層與無回答層。

就調(diào)查項(xiàng)目而言,如果無回答不是故意造成的(即與調(diào)查內(nèi)容無直接關(guān)系),且無回答現(xiàn)象不集中于某類特殊單位組成的群體,那么就可以認(rèn)為這種無回答是由隨機(jī)因素引起的,這時(shí)無回答對(duì)抽樣的影響是因?qū)嶋H有效的樣本容量減少而使估計(jì)量方差增大,但卻不會(huì)造成估計(jì)量偏差。估計(jì)量方差增大的程度取決于無回答率。如果無回答是故意造成的(即與調(diào)查內(nèi)容直接有關(guān)),或無回答現(xiàn)象集中于某類特殊的群體,那么無回答層與回答層之間就存在明顯的非隨機(jī)性差異,這時(shí),無回答對(duì)抽樣效果的影響,除了會(huì)增加估計(jì)量方差外,還會(huì)帶來較嚴(yán)重的估計(jì)量偏差。二、無回答誤差的統(tǒng)計(jì)影響導(dǎo)致估計(jì)量估計(jì)偏差若無回答者與回答者在調(diào)查項(xiàng)目的數(shù)量特征上存在差異,這種無回答就會(huì)導(dǎo)致無回答偏差

降低估計(jì)效率無回答減少了實(shí)際調(diào)查的樣本數(shù)量,因而擴(kuò)大估計(jì)量的方差,導(dǎo)致估計(jì)效率降低

完全數(shù)據(jù)統(tǒng)計(jì)方法無法使用一般統(tǒng)計(jì)方法都適用于完整的矩陣數(shù)據(jù),無回答造成數(shù)據(jù)缺失,可能導(dǎo)致一些標(biāo)準(zhǔn)的完全數(shù)據(jù)統(tǒng)計(jì)方法不能直接用于數(shù)據(jù)分析。

如果在調(diào)查中出現(xiàn)個(gè)無回答、個(gè)有回答(+=),那么當(dāng)總體無回答層與回答層之間無差異時(shí),估計(jì)量方差就變?yōu)椋?/p>

=

從而估計(jì)量方差增大的量為:

===

其中==1-為樣本無回答率。

估計(jì)量方差增大的程度則為:

-1=

在這種情況下,為了達(dá)到抽樣方案所規(guī)定的抽樣估計(jì)效果,就需要增加樣本容量。如果總體無回答率為=,那么樣本容量應(yīng)該確定為=。

如果令=為總體回答率,+=1,總體中回答層與無回答層的均值分別為和,樣本中回答層的均值為,那么當(dāng)以來估計(jì)總體均值時(shí),就會(huì)有偏差為:E()-=-

=-(+)

=(-)

偏差率為:

=其中=為回答層均值與無回答層均值之比。不難發(fā)現(xiàn),越接近于1(即無回答率越高),越遠(yuǎn)離于1(即回答層與無回答層之間的均值差異越大),那么估計(jì)量的偏差就會(huì)越大,偏差率就會(huì)越高,估計(jì)結(jié)果就越不準(zhǔn)確、越不可信。

還要注意的一個(gè)問題是,雖然從理論上講無回答會(huì)使估計(jì)量方差增大(即>),但在實(shí)際上卻難以得到客觀的反映,因?yàn)槲覀兯苡?jì)算的只是(此處的是總體中的回答層方差,未知時(shí)要以樣本方差估計(jì))。這樣,與相比,當(dāng)>時(shí)就會(huì)高估,當(dāng)<時(shí)就會(huì)低估。與相比,則還有一個(gè)回答率的問題,因?yàn)?/p>

=

所以當(dāng)>時(shí)估計(jì)量方差高估,當(dāng)<時(shí)低估。如果>,那么當(dāng)=1時(shí),必然會(huì)有=,估計(jì)量方差低估或高估的現(xiàn)象也就自然會(huì)消除??梢姡岣呋卮鹇适窍裏o回答影響的關(guān)鍵所在。例Thomsen和Siring(1983)的報(bào)告展示了挪威統(tǒng)計(jì)局于1969年進(jìn)行的有關(guān)投票行為調(diào)查的結(jié)果。這次調(diào)查主要采取郵寄調(diào)查方式,并輔助以三次電話訪問,最終獲得9.9%的無回答率,這個(gè)數(shù)字通常被認(rèn)為是比較小的。那么無回答者與回答者是否存在差異呢?無回答者與選中樣本之間在投票率上的差異在年輕的年齡群體中體現(xiàn)得較為顯著。無回答原因不同投票率也不同。拒絕參與調(diào)查的人群的投票率為81%,由于不在家而沒能參與調(diào)查的人群的投票率為65%,因病未參與的人群則為55%。小于10%的無回答率就導(dǎo)致了對(duì)挪威投票率的高估??傮w20-24歲25-29歲30-49歲50-69歲70-79歲無回答者715956727874選中樣本888184909184投票率(%)HoltandElliot(1991)討論了英國(guó)關(guān)于無回答的一系列研究結(jié)果,并指出“較低的回答率與以下特征有關(guān):倫敦居民;無車家庭;單身;沒有子女的夫婦;老年人;離婚或鰥寡者;新英聯(lián)邦血統(tǒng);教育程度低;個(gè)體經(jīng)營(yíng)者”。三、無回答誤差的控制

(一)事前準(zhǔn)備充分,爭(zhēng)取盡量高的首

次回答率;(二)搞清無回答的原因,有針對(duì)性地

進(jìn)行復(fù)調(diào)查;

(三)必要時(shí),對(duì)無回答者進(jìn)行替換;(四)對(duì)于一些敏感性問題,可以采用隨

機(jī)化回答技術(shù)(沃納模型,西蒙斯模型,格林伯格模型等);(五)當(dāng)無回答不可避免時(shí),可采用一些專門技術(shù)來調(diào)整估計(jì)結(jié)果,以減少估計(jì)偏差。四、無回答的補(bǔ)救措施替代法漢森與赫維茨(HansenandHurwitz,1946)方法復(fù)制估算法加權(quán)調(diào)整法插補(bǔ)法1.替代法訪員可以在實(shí)際調(diào)查現(xiàn)場(chǎng)選擇一個(gè)替代單位或使用事先準(zhǔn)備的指定替代單位1975年密歇根州進(jìn)行的物品濫用情況調(diào)查(MichiganSurveyofSubstanceAbuse)就是為了估計(jì)在前一年內(nèi)使用過16類物品的人數(shù)。根據(jù)抽樣設(shè)計(jì),該調(diào)查采用分層多階段抽樣對(duì)2100個(gè)住戶進(jìn)行了訪問。對(duì)每一個(gè)住處都重復(fù)訪問3次,若仍沒有人則嘗試其右側(cè)的住戶,接下來再嘗試左側(cè)住戶。2.漢森與赫維茨(HansenandHurwitz,1946)方法。

這種方法是先對(duì)抽中的被調(diào)查者進(jìn)行郵寄(問卷)調(diào)查,然后從那些無回答者中抽選出一個(gè)子樣本進(jìn)行訪問調(diào)查并盡量取得完整資料,最后把郵寄調(diào)查結(jié)果與子樣本訪問調(diào)查結(jié)果綜合起來得出總體指標(biāo)的估計(jì)值。

這種方法的優(yōu)點(diǎn)是比多次復(fù)調(diào)查法節(jié)省費(fèi)用,且估計(jì)量無偏、估計(jì)精度容易掌握和控制,因此當(dāng)子樣本的個(gè)體資料能全部取得時(shí)比較適用。但所花的時(shí)間較長(zhǎng),且要保證取得子樣本的完整資料也不容易。3.復(fù)制估算法

這種方法是當(dāng)無回答出現(xiàn)時(shí),用其它已有的數(shù)據(jù)來頂替無回答的缺失數(shù)據(jù),進(jìn)而對(duì)總體作出估計(jì)。用來頂替的數(shù)據(jù)可以從同次調(diào)查的回答者數(shù)據(jù)中抽選,也可以從以前的同類調(diào)查數(shù)據(jù)中選取或推算而得。在實(shí)踐中最常用的是從同次調(diào)查已取得的數(shù)據(jù)中隨機(jī)抽取。復(fù)制估算法的特點(diǎn)是,當(dāng)頂替數(shù)據(jù)與無回答缺失數(shù)據(jù)充分接近時(shí)(這就要求與這兩者數(shù)據(jù)相對(duì)應(yīng)的單位來自于同一類別,具有相似的特征),能有效減少估計(jì)偏差,但卻會(huì)增大估計(jì)量方差(均方誤差)。因此,如果我們能對(duì)總體進(jìn)行分層且適當(dāng)增大樣本容量,那么復(fù)制估算法就能很好地解決無回答偏差問題,且保證有較高的估計(jì)精度。這種方法尤其適用于“項(xiàng)目無回答”。4.加權(quán)調(diào)整法

這種方法是通過一定的權(quán)數(shù)對(duì)調(diào)查中的回答數(shù)據(jù)進(jìn)行加權(quán)來達(dá)到對(duì)數(shù)據(jù)進(jìn)行調(diào)整、減少因無回答造成的估計(jì)偏差的目的。權(quán)數(shù)由調(diào)查中的回答概率來確定,一般是該概率的倒數(shù)。即回答概率大的賦予較小的權(quán),回答概率小的賦予較大的權(quán),從而使估計(jì)量的偏差得到一些糾正。具體的加權(quán)調(diào)整法又有PolitzSimmons調(diào)整法、加權(quán)組調(diào)整法和事后分層調(diào)整法等。加權(quán)法(weighting):

主要用于單位無回答這種方法假定無回答與受訪者/受查者在家的概率有關(guān)。設(shè)在調(diào)查時(shí)間中受訪者/受查者在家的頻率為,則在估計(jì)變量的總體均值時(shí),以作為回答概率的估計(jì)值,并使用其倒數(shù)來加權(quán)。關(guān)于加權(quán)的一些注意事項(xiàng)要求很高:即假定每一個(gè)加權(quán)單元中,回答者和無回答者是相似的,也就是說不管同一加權(quán)組中各單位的回答值是否相等,它們回答的可能性都相等。加權(quán)法可能會(huì)改進(jìn)估計(jì)量,但它并不能消除所有的無回答偏差。常用于處理單位無回答,而非項(xiàng)目無回答5.插補(bǔ)法(imputationmethod)適用于解決項(xiàng)目無回答問題對(duì)每個(gè)缺失值都尋找一個(gè)或多個(gè)盡可能與其類似的插補(bǔ)值。一般的插補(bǔ)模型可以表示為:

Z=f(X)+e式中,Z是插補(bǔ)值,X是無回答單位的輔助變量向量,f()是輔助數(shù)據(jù)的某一函數(shù),e是殘差。插補(bǔ)法的效率如何,取決于插補(bǔ)值與原無回答數(shù)據(jù)的相似程度。

插補(bǔ)法根據(jù)插補(bǔ)值是否包括殘差,插補(bǔ)法可分為確定性插補(bǔ)和隨機(jī)性插補(bǔ)。根據(jù)確定插補(bǔ)值時(shí)是否使用輔助變量,將插補(bǔ)法分為使用輔助變量插補(bǔ)法和不使用輔助變量插補(bǔ)法。使用輔助信息的插補(bǔ)法又可根據(jù)信息來源分為熱卡法和冷卡法。熱卡法(Hot-Deck)中的輔助信息來自當(dāng)前調(diào)查,冷卡法(Cold-Deck)中的輔助信息來自以前的同類調(diào)查或其它已有的關(guān)于無回答單位的相關(guān)資料。根據(jù)對(duì)每個(gè)缺失值的插補(bǔ)值的數(shù),插補(bǔ)法又可分為單一插補(bǔ)法(singleimputation)和多重插補(bǔ)法(multipleimputation)。演繹插補(bǔ)法(Deductiveimputation,DI)通過輔助資料的演繹,找出插補(bǔ)值,也是一種使用輔助變量的插補(bǔ)法。該輔助資料可能就來自本次調(diào)查,也可能來自其余調(diào)查或其他資料。冷卡法應(yīng)用較多。該方法對(duì)輔助信息的要求比較高,使用時(shí)要注意演繹方法的正確性。例如:沒有受到過任何犯罪侵害,因此暴力犯罪受害者一項(xiàng)也應(yīng)為0。在縱向調(diào)查中,如果一個(gè)女人在第1年和第3年訪問時(shí)都有2個(gè)孩子,而第2年的數(shù)據(jù)是缺失的,那么邏輯上的插補(bǔ)值就應(yīng)該是2。均值插補(bǔ)法(Meanimputation,MI)利用回答單位的項(xiàng)目均值作為無回答項(xiàng)目的插補(bǔ)值。總均值差補(bǔ)法(Meanimputationoverall,MO)分層均值差補(bǔ)法(Meanimputationwithinclasses,MC)方便實(shí)施,但會(huì)破壞分布,低估方差。適于點(diǎn)估計(jì)為了避免尖峰的出現(xiàn),可以采用隨機(jī)單元均值插補(bǔ)法。假設(shè)條件為:各單元中的缺失項(xiàng)目為完全隨機(jī)缺失(MCAR)。熱卡法(Hot-deckimputation)輔助信息來自同一樣本的插補(bǔ)方法按照輔助變量,將回答單位分成為若干的“插補(bǔ)層”,然后,對(duì)每一個(gè)無回答單位,依據(jù)其輔助變量值,從相對(duì)應(yīng)的“插補(bǔ)層”中尋找一個(gè)回答單位,以其變量值對(duì)無回答數(shù)據(jù)集進(jìn)行插補(bǔ)。順序性熱卡插補(bǔ)法、最近距離熱卡插補(bǔ)、以及組內(nèi)隨機(jī)替代法等回歸法通過建立y與輔助變量間的回歸方程來補(bǔ)入缺失的y值。優(yōu)點(diǎn):方法簡(jiǎn)單,對(duì)無回答的估計(jì)效果好,對(duì)每個(gè)被插補(bǔ)變量,可以利用不同的預(yù)測(cè)變量缺點(diǎn):如果沒有隨機(jī)誤差項(xiàng),可能導(dǎo)致高估;可能造成多重共線性;可能降低方差。第二節(jié)

抽樣框誤差抽樣框誤差:目標(biāo)總體與抽樣總體不一致目標(biāo)總體,即作為調(diào)查研究對(duì)象的全體抽樣總體,即從中抽選樣本的總體抽樣框誤差類型:

1.丟失目標(biāo)總體單元,威脅性較大。

2.包含非目標(biāo)總體單元。

3.復(fù)合聯(lián)接。這是指抽樣框中的單元與目標(biāo)總體單元不完全是一一對(duì)應(yīng)關(guān)系。例如一個(gè)門牌號(hào)內(nèi)居住兩戶或多戶家庭,一戶擁有兩處或多處住房。

4.不正確的輔助信息。二、抽樣框誤差的影響

(一)丟失單位的影響在假定不存在其他原因的抽樣框誤差時(shí),丟失單位對(duì)抽樣效果的影響主要取決于兩個(gè)方面:丟失單位的分布特征和丟失單位數(shù)所占的比重。其中,對(duì)總體均值的估計(jì)只與前者有關(guān),而對(duì)總體總值的估計(jì)則與兩者都有關(guān)。

(1)丟失單位是目標(biāo)總體中的一個(gè)隨機(jī)樣本,具有與目標(biāo)總體相同的期望與方差,則其對(duì)總體均值的估計(jì)影響不大,但對(duì)總體總值的估計(jì)會(huì)低估。(2)丟失的單位是特殊群體,不具有與目標(biāo)總體相同的期望與方差,那么對(duì)目標(biāo)總體總值、均值的估計(jì)會(huì)產(chǎn)生偏差。(二)包含異質(zhì)單位的影響

如果是目標(biāo)總體總值的估計(jì),則其估計(jì)量偏差和偏差率分別為:很顯然,這時(shí)的偏差或偏差率都是正的,即若抽樣框中包含了異質(zhì)單位必定會(huì)使目標(biāo)總體總值的估計(jì)偏高。

均值估計(jì)量方差會(huì)被高估或低估,總值估計(jì)量方差則一定是高估,即:

如果在調(diào)查中異質(zhì)單位可以被識(shí)別并被予以剔除的,可以把目標(biāo)總體看成抽樣框中的一個(gè)子總體或域。異質(zhì)單位的標(biāo)志值就取0。

在調(diào)查中剔除異質(zhì)單位會(huì)增加估計(jì)量的方差,原因在于它使實(shí)際的樣本容量變小了。三、抽樣框誤差的控制重在預(yù)防積極補(bǔ)救心理準(zhǔn)備

第三節(jié)計(jì)量誤差范圍廣,分類:設(shè)計(jì)誤差:?jiǎn)柧碓O(shè)計(jì),抽樣過程被調(diào)查者誤差:無意識(shí)誤差和有意識(shí)誤差調(diào)查者誤差其它誤差:測(cè)量工具,編碼,錄入等一、計(jì)量誤差的成因

計(jì)量誤差(ErrorsofMeasurement)是指樣本結(jié)果(如樣本均值,樣本方差)與實(shí)際情況(真實(shí)的樣本均值,樣本方差)不一致而產(chǎn)生的誤差。這種誤差可能存在于調(diào)查過程中,也可能存在于整理和計(jì)算過程中,主要就是任何調(diào)查都可能產(chǎn)生的調(diào)查性誤差。這種誤差是由人有意或無意所造成的,且會(huì)隨調(diào)查范圍的增大而增加產(chǎn)生的可能性。具體原因如下:

(一)因設(shè)計(jì)不完善引起的計(jì)量誤差;(二)調(diào)查員原因引起的計(jì)量誤差;

(三)被調(diào)查者原因引起的計(jì)量誤差;

(四)其他原因引起的計(jì)量誤差。

(一)因設(shè)計(jì)不完善引起的計(jì)量誤差

一是問卷設(shè)計(jì)不完善,包括用詞不準(zhǔn)確;問句具有誘導(dǎo)性或傾向性;問句排列順序欠妥;調(diào)查內(nèi)容不完整(尤其是缺了重要的項(xiàng)目);調(diào)查變量選擇有誤;問句的切入點(diǎn)不準(zhǔn)確;問句給被調(diào)查者預(yù)備的回答空間不合理;問句的語(yǔ)氣太軟或太強(qiáng);問卷的長(zhǎng)度太冗長(zhǎng)等原因。二是設(shè)計(jì)的抽樣程序有偏,使樣本結(jié)構(gòu)非隨機(jī)地與總體結(jié)構(gòu)不符。三是估計(jì)量的構(gòu)造有問題,主要是該加權(quán)的未加權(quán),不該加權(quán)的卻加權(quán),從而產(chǎn)生偏差。(二)調(diào)查員原因引起的計(jì)量誤差

一是調(diào)查員責(zé)任心不強(qiáng)、工作粗心,使觀察結(jié)果不準(zhǔn)或登記、填寫、計(jì)算發(fā)生差錯(cuò)。二是調(diào)查員在調(diào)查時(shí)偷工減料,不按規(guī)定操作,用其他數(shù)據(jù)來代替調(diào)查數(shù)據(jù)。三是調(diào)查員本身弄虛作假,由自己來偽造填寫調(diào)查表。四是調(diào)查員業(yè)務(wù)水平不夠高,在觀察或測(cè)量時(shí)難以搞準(zhǔn)數(shù)據(jù)。這些誤差成因,有的是無意識(shí)的,有的則是故意的。(三)被調(diào)查者原因引起的計(jì)量誤差

一是被調(diào)查者對(duì)調(diào)查內(nèi)容的理解(包括問句的含義等)有誤。二是被調(diào)查者對(duì)于需要回憶才能回答的問題,可能存在記憶差錯(cuò)。三是被調(diào)查者對(duì)于調(diào)查中的一些相似或者相近內(nèi)容無法準(zhǔn)確區(qū)分而出現(xiàn)回答差錯(cuò)。四是被調(diào)查者接受調(diào)查時(shí)心境不佳、身體不適、家中很忙或有急事和意外,使調(diào)查質(zhì)量受到影響。五是被調(diào)查者對(duì)調(diào)查不感興趣而敷衍了事。六是被調(diào)查者為了不讓他人知道實(shí)情而故意提供不真實(shí)的數(shù)據(jù)(有的夸大,如文化程度、高雅文化消費(fèi)支出、公益捐款及工作業(yè)績(jī)等;有的縮小,如收入、煙酒消費(fèi)量及工作過程等)。七是被調(diào)查者為了保持同一調(diào)查內(nèi)容在不同時(shí)間上的一致性或家庭成員回答口徑的一致性而提供相同但不真實(shí)的數(shù)據(jù)。

(四)其他原因引起的計(jì)量誤差如計(jì)量工具不準(zhǔn)確、計(jì)算機(jī)編碼及輸入錯(cuò)誤、資料整理中的歸類錯(cuò)誤等。

二、計(jì)量誤差的影響

計(jì)量誤差存在于調(diào)查單位之中。如果設(shè)為被觀測(cè)單位的真實(shí)值,為其觀測(cè)值,那么當(dāng)時(shí),就存在計(jì)量誤差,若以表示之,可得計(jì)量誤差模型為:

=+其中>0或<0。1、如果調(diào)查單位的計(jì)量誤差是隨機(jī)出現(xiàn)的,那么總正差與總負(fù)差大致相等,即E()=E(),也即E()=0

。這時(shí),計(jì)量誤差的存在不會(huì)改變估計(jì)量的偏差性,但會(huì)改變估計(jì)量方差的大小。設(shè)為總體均值,E()=,那么有:

=+=+2

()+E=E+E()+2E[

()]

由于E()=0,E()=E=V(),故

MSE()=V()+V()+2E[

()]其中E[

()]為調(diào)查單位計(jì)量誤差與真實(shí)離差之間的協(xié)方差。

當(dāng)樣本容量為時(shí),無計(jì)量誤差的總體均值估計(jì)量方差為:()=

有計(jì)量誤差的估計(jì)量方差(均方誤差)為:MSE()=(1

)即:MSE()=(

)+〔V()+2E[

()]

若2E[()]+V()<0,那么MSE()<V(),MSE()<(),即估計(jì)量方差被低估了。如果2E[()]+V()>0,那么MSE()>V(),MSE()>(),即估計(jì)量方差被高估了。不論是高估還是低估,估計(jì)效果都不能得到真實(shí)的反映。2、如果調(diào)查單位的計(jì)量誤差不是隨機(jī)出現(xiàn)、而是存在一定的系統(tǒng)性,那么就會(huì)正差大于負(fù)差,這時(shí)計(jì)量誤差就變成為估計(jì)量的計(jì)量偏差,即E

()E()=,從而計(jì)量誤差的存在既改變了估計(jì)量的偏差性,也改變了估計(jì)量方差的大小。在這種情況下,我們可以得到:

=E()+E()-uE=E+MSE()=V()+

其中V()為有計(jì)量誤差時(shí)的觀測(cè)值的估計(jì)量方差。注意到E()0,E()V(),可得:

()=V()+〔E()+2E[()]〕

如果>〔E()+2E[()]〕,則V()<(),估計(jì)量方差低估。如果相反,則估計(jì)量方差高估。非隨機(jī)性的計(jì)量誤差越嚴(yán)重,估計(jì)量方差低估或高估的程度就越強(qiáng)。三、計(jì)量誤差的控制(一)精心設(shè)計(jì);(二)對(duì)調(diào)查員要嚴(yán)格要求,精心挑選,加強(qiáng)培訓(xùn);(三)在每次調(diào)查中,都要對(duì)被調(diào)查者作耐心的宣傳說服工作;(四)加強(qiáng)統(tǒng)計(jì)執(zhí)法,規(guī)范統(tǒng)計(jì)調(diào)查活動(dòng);(五)要合理確定調(diào)查時(shí)間、調(diào)查方式和調(diào)查周期;(六)必要的檢查和調(diào)整;(七)控制計(jì)量工具或技術(shù)設(shè)備原因的誤差;(八

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論