常用的抽樣方法_第1頁
常用的抽樣方法_第2頁
常用的抽樣方法_第3頁
常用的抽樣方法_第4頁
常用的抽樣方法_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

常用的抽樣方法第1頁,共48頁。一、單純隨機抽樣(simplerandomsampling)

1、抽樣方法

根據(jù)研究目的選定總體,首先對總體中所有的觀察單位編號,遵循隨機原則,采用不放回抽取方法,從總體中隨機抽取一定數(shù)量觀察單位組成樣本。

具體方法

①隨機數(shù)字法

②抽簽法第2頁,共48頁。

2、優(yōu)缺點

①對所有觀察單位編號,當數(shù)量大時,有難度

②抽樣誤差的計算較方便第3頁,共48頁。

3、抽樣誤差的估計

有限總體與無限總體

總體類型均數(shù)標準誤率的標準誤

無限總體

有限總體

第4頁,共48頁。

二、系統(tǒng)抽樣(systematicsampling)

又稱等距/機械抽樣

1、抽樣方法

先將總體的觀察單位按某順序號等分成n個部分再從第一部分隨機抽第k號觀察單位,依次用相等間隔,機械地從每一部分各抽取一個觀察單位組成樣本。

第5頁,共48頁。

2、優(yōu)缺點

(1)抽樣方法簡便

(2)易得到一個按比例分配的樣本,抽樣誤差較小

(3)仍需對每個觀察單位編號

(4)當觀察單位按順序有周期趨勢或單調(diào)性趨勢時,產(chǎn)生明顯偏性第6頁,共48頁。

3、抽樣誤差

無固定的計算公式,常按單純隨機抽樣方法來計算,與總體的性質(zhì)和被抽樣個體間的間隔有關(guān)。第7頁,共48頁。三、整群抽樣(clustersampling)

1、抽樣方法

先將總體劃分為若干個“群”組,每個群包括若干個觀察單位,再隨機抽取n個群,被抽到的各群的全部觀察單位則組成樣本。第8頁,共48頁。

2、優(yōu)缺點

(1)在較大規(guī)模的現(xiàn)場調(diào)查中,易組織,較節(jié)省。

(2)若各群間的差異較大,該抽樣方法的誤差較大。

3、抽樣誤差

第9頁,共48頁。四、分層抽樣(stratifiedsampling)

1、抽樣方法

先將總體按某種特征分成若干層,再從每一層內(nèi)隨機抽取一定數(shù)量的觀察單位,合起來組成樣本。第10頁,共48頁。(1)按比例分配:按總體各層觀察單位數(shù)的多少分配

(2)最優(yōu)分配:按各層觀察單位數(shù)多少及其變異大小分配

第11頁,共48頁。

2、優(yōu)缺點

(1)在一定程度上控制了抽樣誤差,尤其是最優(yōu)分配法

(2)應(yīng)盡量使層內(nèi)差別小而層間差別大,以提高效率

(3)事先應(yīng)了解各層的總體含量,最優(yōu)分配還應(yīng)了解標準差第12頁,共48頁。多階段隨機抽樣第13頁,共48頁。

樣本含量的估計第14頁,共48頁。單純隨機抽樣

一、先決條件

1、容許誤差,預(yù)計樣本統(tǒng)計量與相應(yīng)總體參數(shù)的最大相差控制在什么范圍。常取可信區(qū)間長度一半。

2、所調(diào)查總體標準差,若不了解,須通過預(yù)試驗的標準差S或前人的資料作出估計;

3、第一類錯誤的概率

4、對有限總體抽樣時,還須了解總體觀察單位數(shù)。第15頁,共48頁。二、計算公式第16頁,共48頁。隨機應(yīng)答技術(shù)

RandomizedResponseTechniques(RRT)第17頁,共48頁。

敏感問題(sensitiveproblem)是指涉及個人(或單位)的隱私或利益的問題以及大多數(shù)人認為不便在公開場合表態(tài)或陳述的問題,在某些情況下,還包括一些違法犯罪的行為。

第18頁,共48頁。敏感問題的特點:一般是社會輿論導(dǎo)向所不認同的或反對的行為或觀點不同特征的人群有不同的敏感問題不同敏感問題在敏感程度上存在差異敏感問題的分類:屬性特征敏感問題數(shù)量特征敏感問題第19頁,共48頁。對于敏感性問題,若采用直接回答的形式,被調(diào)查者難免產(chǎn)生抵觸情緒,不愿據(jù)實回答,這樣導(dǎo)致調(diào)查數(shù)據(jù)失真、調(diào)查結(jié)果無效。因此尋求解決敏感性問題調(diào)查的有效方法至關(guān)重要。

第20頁,共48頁。隨機化回答是指在調(diào)查中使用特定的隨機化裝置,使得被調(diào)查者以預(yù)定的概率來回答敏感性問題。這一技術(shù)的宗旨就是最大限度地為被調(diào)查者保守秘密,從而取得被調(diào)查者的信任。RRT技術(shù)的基本原理在于當被調(diào)查者確信調(diào)查者及其他人無法從被調(diào)查者的回答中獲知他們的真實行為時,能更加真實地對敏感問題進行回答。并且RRT技術(shù)保護調(diào)查對象的個人隱私,能充分得到調(diào)查對象的配合,最終可顯著降低無應(yīng)答率和誤答率,得到高質(zhì)量的調(diào)查結(jié)果。

隨機應(yīng)答技術(shù)

RandomizedResponseTechniques(RRT)第21頁,共48頁。(一)沃納模型(Warnermodel)1965年由Warner提出的,其設(shè)計思想是向被調(diào)查者顯示兩個與敏感性問題(具有特征A)有關(guān),但完全對立的問題,讓調(diào)查者按預(yù)定的概率從中選一個回答,調(diào)查者無權(quán)過問被調(diào)查者回答的是哪一個問題,從而起到了為被調(diào)查者保密的效果。(二)西蒙斯模型1967年由西蒙斯提出的,其基本思想仍以沃納模型為基礎(chǔ),但有一些改進,它將沃納模型中與敏感性問題相對的具有特征A的問題改為一個與敏感性問題不相關(guān)的其它問題。(三)“隨機變量和”回答模型隨機化應(yīng)答模型第22頁,共48頁。一、隨機應(yīng)答技術(shù)的步驟

設(shè)計一對問題,使兩個問題的答案種數(shù)和編碼完全一致,應(yīng)答者隨機選取一個問題,將答案編碼選出,在答案上做出相應(yīng)的記號。由于答卷上沒有問題的編號,只有一套答案編碼,人們無從知曉應(yīng)答者回答的是哪一個問題,因而起到保密作用。

1.向應(yīng)答者提出一對問題第23頁,共48頁。

(1)兩個相關(guān)聯(lián)問題模式:

設(shè)計兩個相對立的陳述。

例如問題1:你曾經(jīng)吸過毒嗎?①是②否

問題2:你從未吸過毒嗎?①是②否

(2)兩個不相關(guān)聯(lián)問題模式:

第一陳述為敏感性問題,第二陳述是與第一陳述無關(guān)的非敏感性問題,可以得到確切的答案。

例如問題1:你曾經(jīng)吸過毒嗎?①是②否

問題2:你是工人嗎?①是②否第24頁,共48頁。2.設(shè)置一個隨機裝置進行調(diào)查

使用一個內(nèi)裝許多黑、白兩色小球的匣子,黑白球的比例接近1:1,但不等于1:1,例如可以是60%和40%?;旌暇鶆蚝?,被調(diào)查者從匣子中隨機摸取一球,摸取的是黑球還是白球只有被調(diào)查者知道。若摸取的是黑球,則回答第一個問題,否則,回答第二個問題。答卷上只有答案選擇,沒有題號,可按如下格式設(shè)計:“請將你的回答在相應(yīng)的編號處做上記號√:①是②否”。第25頁,共48頁。3.根據(jù)概率理論進行計算

(1)問題1:你曾經(jīng)吸過毒嗎?①是②否

問題2:你從未吸過毒嗎?①是②否

假設(shè)黑球所占的比例為P,白球所占的比例為1-P,應(yīng)答者中回答“是”的總比例為r,那么對第一個問題回答“是”的比例RA可以由下式推算:

r=PRA+(1-P)(1-RA)

RA=r-(1-P)/(2P-1)(1>P>0.50)第26頁,共48頁。

(2)問題1:你曾經(jīng)吸過毒嗎?①是②否

問題2:你是工人嗎?①是②否

假設(shè)回答者中工人占的比例為RU,則r與RA的關(guān)系為:

r=PRA+(1-P)RU

RA=r–(1-P)RU/P

第27頁,共48頁。例14-1:欲調(diào)查某地已婚育齡婦女有無婚前性行為的比例。

(1)先把這項技術(shù)的意義、性質(zhì)和方法,特別是其保密功能,坦誠地告訴調(diào)查對象,以取得理解、信任和合作。(2)問卷中設(shè)A、B兩個問題。(3)備有一個口袋,里面裝有黑白兩種顏色的球(也可用圍棋的黑子和白子),兩種球的比例不是1:1,例如可以是60%和40%。第28頁,共48頁。(4)調(diào)查對象在填寫答案前,先隨機抽取一個球(球的顏色對調(diào)查員保密),據(jù)球的顏色決定回答兩個問題中的哪一個。(5)由于調(diào)查員不知道某一對象抽取的球是什么顏色的,所以無法知道某一對象回答的是問題A還是問題B,也無法知道調(diào)查對象的“秘密”。(6)設(shè)立兩個問題:問題A:婚前有過性行為?回答:①是②否問題B:婚前沒有性行為?回答:①是②否第29頁,共48頁。(7)如果調(diào)查對象抽取的球是黑色的,則回答問題A;如果調(diào)查對象抽取的球是白色的,則回答問題B。(8)計算調(diào)查對象中婚前有性行為者的比例。第30頁,共48頁。若調(diào)查200人,回答“是”的比例為λ=0.48,第31頁,共48頁。第32頁,共48頁。二、估計比例用的3種改進模型1、模型I把問題B改為一個完全無關(guān)、答案為“是”的概率是已知值的問題將沃納模型中與敏感性問題相對的具有特征A的問題改為一個與敏感性問題不相關(guān)的其它問題。

BA第33頁,共48頁。例14-2:欲調(diào)查某地已婚育齡婦女有無婚前性行為的比例。問題A:婚前有過性行為?回答:①是②否

問題B:你生日(月+日)除以3余數(shù)是0嗎?回答:①是②否第34頁,共48頁。有無性行為第35頁,共48頁。

如果黑球比例為p=60%,同時回答問題A和B均為是的比例π=0.24,生日(月+日)除以3余數(shù)是0占π0=33.33%,則第36頁,共48頁。西蒙斯模型的不足之處(1)π是預(yù)先已知或待估計的值,π的估計偏差會增加估計方差。(2)要提高估計精度,應(yīng)增大P值和減小π值。但隨著P值的增大和π的減小,被調(diào)查者的疑慮會增加。第37頁,共48頁。2、模型II將模型I中設(shè)立無關(guān)聯(lián)問題B的方法改為兩套抽取球的裝置

優(yōu)點:對問題B回答“是”的概率不必是已知的。要求調(diào)查對象抽取兩次彩球和回答問題兩次。裝置中黑球的比例是P1和P2,有專家建議,兩者都不要取0或0.5,習慣k常取P2=1—P1。不論對于第一裝置還是對于第二裝量,摸到黑球者如實回答問題A,摸到白球者如實回答問題B。要求調(diào)查對象在兩次回答問題中不能有矛盾。

第38頁,共48頁。例14-3對于前面所說的調(diào)查婚前性行為的研究中,假定共480名調(diào)查對象。問題A:你在婚前有過性行為嗎?回答①是②否。問題B:你在這3天內(nèi)是吃過魚嗎?回答①是②否。第39頁,共48頁。第40頁,共48頁。第41頁,共48頁。課本上有誤第42頁,共48頁。第43頁,共48頁。兩次試驗?zāi)P偷闹饕毕?1)若對同一批被調(diào)查者試驗兩次,他們兩次回答的結(jié)果必具有相關(guān)性,從而破壞了模型的隨機性。但如果對兩批被調(diào)查者分別進行試驗,又不容易保證兩次的結(jié)構(gòu)具有相似性,從而產(chǎn)生較大誤差。(2)方差V(π)是兩次試驗產(chǎn)生的方差之和,在相同條件下,它比西蒙斯模型的方差要大得多。(3)P1和P2不能太接近。當p1=p2時,模型就沒有意義了。要減小方差V(π)

,就應(yīng)該增大P1而減小P2

,但當p1增得過大時,又會減少被調(diào)查者的配合。第44頁,共48頁。3.模型III

本方法的優(yōu)點是不需要設(shè)立非敏感問題。但是球的顏色要有3種(紅、黑、白)。每種球的比例是已知的(P3=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論