常用的抽樣方法

上傳人：r*** IP屬地：北京上傳時(shí)間：2024-10-28 格式：PPT 頁(yè)數(shù)：48 大小：4.53MB 積分：1.2 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩43頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

常用的抽樣方法第1頁(yè)，共48頁(yè)。一、單純隨機(jī)抽樣（simplerandomsampling）

1、抽樣方法

根據(jù)研究目的選定總體，首先對(duì)總體中所有的觀察單位編號(hào)，遵循隨機(jī)原則，采用不放回抽取方法，從總體中隨機(jī)抽取一定數(shù)量觀察單位組成樣本。

具體方法

①隨機(jī)數(shù)字法

②抽簽法第2頁(yè)，共48頁(yè)。

2、優(yōu)缺點(diǎn)

①對(duì)所有觀察單位編號(hào)，當(dāng)數(shù)量大時(shí)，有難度

②抽樣誤差的計(jì)算較方便第3頁(yè)，共48頁(yè)。

3、抽樣誤差的估計(jì)

有限總體與無(wú)限總體

總體類型均數(shù)標(biāo)準(zhǔn)誤率的標(biāo)準(zhǔn)誤

無(wú)限總體

有限總體

第4頁(yè)，共48頁(yè)。

二、系統(tǒng)抽樣（systematicsampling）

又稱等距/機(jī)械抽樣

1、抽樣方法

先將總體的觀察單位按某順序號(hào)等分成n個(gè)部分再?gòu)牡谝徊糠蛛S機(jī)抽第k號(hào)觀察單位，依次用相等間隔，機(jī)械地從每一部分各抽取一個(gè)觀察單位組成樣本。

第5頁(yè)，共48頁(yè)。

2、優(yōu)缺點(diǎn)

（1）抽樣方法簡(jiǎn)便

（2）易得到一個(gè)按比例分配的樣本，抽樣誤差較小

（3）仍需對(duì)每個(gè)觀察單位編號(hào)

（4）當(dāng)觀察單位按順序有周期趨勢(shì)或單調(diào)性趨勢(shì)時(shí)，產(chǎn)生明顯偏性第6頁(yè)，共48頁(yè)。

3、抽樣誤差

無(wú)固定的計(jì)算公式，常按單純隨機(jī)抽樣方法來(lái)計(jì)算，與總體的性質(zhì)和被抽樣個(gè)體間的間隔有關(guān)。第7頁(yè)，共48頁(yè)。三、整群抽樣（clustersampling）

1、抽樣方法

先將總體劃分為若干個(gè)“群”組，每個(gè)群包括若干個(gè)觀察單位，再隨機(jī)抽取n個(gè)群，被抽到的各群的全部觀察單位則組成樣本。第8頁(yè)，共48頁(yè)。

2、優(yōu)缺點(diǎn)

（1）在較大規(guī)模的現(xiàn)場(chǎng)調(diào)查中，易組織，較節(jié)省。

（2）若各群間的差異較大，該抽樣方法的誤差較大。

3、抽樣誤差

第9頁(yè)，共48頁(yè)。四、分層抽樣（stratifiedsampling）

1、抽樣方法

先將總體按某種特征分成若干層，再?gòu)拿恳粚觾?nèi)隨機(jī)抽取一定數(shù)量的觀察單位，合起來(lái)組成樣本。第10頁(yè)，共48頁(yè)。（1）按比例分配：按總體各層觀察單位數(shù)的多少分配

（2）最優(yōu)分配：按各層觀察單位數(shù)多少及其變異大小分配

第11頁(yè)，共48頁(yè)。

2、優(yōu)缺點(diǎn)

（1）在一定程度上控制了抽樣誤差，尤其是最優(yōu)分配法

（2）應(yīng)盡量使層內(nèi)差別小而層間差別大，以提高效率

（3）事先應(yīng)了解各層的總體含量，最優(yōu)分配還應(yīng)了解標(biāo)準(zhǔn)差第12頁(yè)，共48頁(yè)。多階段隨機(jī)抽樣第13頁(yè)，共48頁(yè)。

樣本含量的估計(jì)第14頁(yè)，共48頁(yè)。單純隨機(jī)抽樣

一、先決條件

1、容許誤差，預(yù)計(jì)樣本統(tǒng)計(jì)量與相應(yīng)總體參數(shù)的最大相差控制在什么范圍。常取可信區(qū)間長(zhǎng)度一半。

2、所調(diào)查總體標(biāo)準(zhǔn)差，若不了解，須通過預(yù)試驗(yàn)的標(biāo)準(zhǔn)差S或前人的資料作出估計(jì)；

3、第一類錯(cuò)誤的概率

4、對(duì)有限總體抽樣時(shí)，還須了解總體觀察單位數(shù)。第15頁(yè)，共48頁(yè)。二、計(jì)算公式第16頁(yè)，共48頁(yè)。隨機(jī)應(yīng)答技術(shù)

RandomizedResponseTechniques(RRT)第17頁(yè)，共48頁(yè)。

敏感問題(sensitiveproblem)是指涉及個(gè)人(或單位)的隱私或利益的問題以及大多數(shù)人認(rèn)為不便在公開場(chǎng)合表態(tài)或陳述的問題，在某些情況下，還包括一些違法犯罪的行為。

第18頁(yè)，共48頁(yè)。敏感問題的特點(diǎn)：一般是社會(huì)輿論導(dǎo)向所不認(rèn)同的或反對(duì)的行為或觀點(diǎn)不同特征的人群有不同的敏感問題不同敏感問題在敏感程度上存在差異敏感問題的分類：屬性特征敏感問題數(shù)量特征敏感問題第19頁(yè)，共48頁(yè)。對(duì)于敏感性問題，若采用直接回答的形式，被調(diào)查者難免產(chǎn)生抵觸情緒，不愿據(jù)實(shí)回答，這樣導(dǎo)致調(diào)查數(shù)據(jù)失真、調(diào)查結(jié)果無(wú)效。因此尋求解決敏感性問題調(diào)查的有效方法至關(guān)重要。

第20頁(yè)，共48頁(yè)。隨機(jī)化回答是指在調(diào)查中使用特定的隨機(jī)化裝置，使得被調(diào)查者以預(yù)定的概率來(lái)回答敏感性問題。這一技術(shù)的宗旨就是最大限度地為被調(diào)查者保守秘密，從而取得被調(diào)查者的信任。RRT技術(shù)的基本原理在于當(dāng)被調(diào)查者確信調(diào)查者及其他人無(wú)法從被調(diào)查者的回答中獲知他們的真實(shí)行為時(shí)，能更加真實(shí)地對(duì)敏感問題進(jìn)行回答。并且RRT技術(shù)保護(hù)調(diào)查對(duì)象的個(gè)人隱私，能充分得到調(diào)查對(duì)象的配合，最終可顯著降低無(wú)應(yīng)答率和誤答率，得到高質(zhì)量的調(diào)查結(jié)果。

隨機(jī)應(yīng)答技術(shù)

RandomizedResponseTechniques(RRT)第21頁(yè)，共48頁(yè)。(一)沃納模型(Warnermodel)1965年由Warner提出的，其設(shè)計(jì)思想是向被調(diào)查者顯示兩個(gè)與敏感性問題(具有特征A)有關(guān)，但完全對(duì)立的問題，讓調(diào)查者按預(yù)定的概率從中選一個(gè)回答，調(diào)查者無(wú)權(quán)過問被調(diào)查者回答的是哪一個(gè)問題，從而起到了為被調(diào)查者保密的效果。(二)西蒙斯模型1967年由西蒙斯提出的，其基本思想仍以沃納模型為基礎(chǔ)，但有一些改進(jìn)，它將沃納模型中與敏感性問題相對(duì)的具有特征A的問題改為一個(gè)與敏感性問題不相關(guān)的其它問題。(三)“隨機(jī)變量和”回答模型隨機(jī)化應(yīng)答模型第22頁(yè)，共48頁(yè)。一、隨機(jī)應(yīng)答技術(shù)的步驟

設(shè)計(jì)一對(duì)問題，使兩個(gè)問題的答案種數(shù)和編碼完全一致，應(yīng)答者隨機(jī)選取一個(gè)問題，將答案編碼選出，在答案上做出相應(yīng)的記號(hào)。由于答卷上沒有問題的編號(hào)，只有一套答案編碼，人們無(wú)從知曉應(yīng)答者回答的是哪一個(gè)問題，因而起到保密作用。

1．向應(yīng)答者提出一對(duì)問題第23頁(yè)，共48頁(yè)。

(1)兩個(gè)相關(guān)聯(lián)問題模式：

設(shè)計(jì)兩個(gè)相對(duì)立的陳述。

例如問題1：你曾經(jīng)吸過毒嗎?①是②否

問題2：你從未吸過毒嗎?①是②否

(2)兩個(gè)不相關(guān)聯(lián)問題模式：

第一陳述為敏感性問題，第二陳述是與第一陳述無(wú)關(guān)的非敏感性問題，可以得到確切的答案。

例如問題1：你曾經(jīng)吸過毒嗎?①是②否

問題2：你是工人嗎?①是②否第24頁(yè)，共48頁(yè)。2．設(shè)置一個(gè)隨機(jī)裝置進(jìn)行調(diào)查

使用一個(gè)內(nèi)裝許多黑、白兩色小球的匣子，黑白球的比例接近1：1，但不等于1：1，例如可以是60％和40％?；旌暇鶆蚝?，被調(diào)查者從匣子中隨機(jī)摸取一球，摸取的是黑球還是白球只有被調(diào)查者知道。若摸取的是黑球，則回答第一個(gè)問題，否則，回答第二個(gè)問題。答卷上只有答案選擇，沒有題號(hào)，可按如下格式設(shè)計(jì)：“請(qǐng)將你的回答在相應(yīng)的編號(hào)處做上記號(hào)√：①是②否”。第25頁(yè)，共48頁(yè)。3．根據(jù)概率理論進(jìn)行計(jì)算

(1)問題1：你曾經(jīng)吸過毒嗎?①是②否

問題2：你從未吸過毒嗎?①是②否

假設(shè)黑球所占的比例為P，白球所占的比例為1-P，應(yīng)答者中回答“是”的總比例為r，那么對(duì)第一個(gè)問題回答“是”的比例RA可以由下式推算：

r＝PRA+(1-P)(1-RA)

RA=r-(1-P)/(2P-1)(1＞P＞0.50)第26頁(yè)，共48頁(yè)。

(2)問題1：你曾經(jīng)吸過毒嗎?①是②否

問題2：你是工人嗎?①是②否

假設(shè)回答者中工人占的比例為RU，則r與RA的關(guān)系為：

r＝PRA+(1-P)RU

RA＝r–(1-P)RU/P

第27頁(yè)，共48頁(yè)。例14-1：欲調(diào)查某地已婚育齡婦女有無(wú)婚前性行為的比例。

(1)先把這項(xiàng)技術(shù)的意義、性質(zhì)和方法，特別是其保密功能，坦誠(chéng)地告訴調(diào)查對(duì)象，以取得理解、信任和合作。(2)問卷中設(shè)A、B兩個(gè)問題。(3)備有一個(gè)口袋，里面裝有黑白兩種顏色的球(也可用圍棋的黑子和白子)，兩種球的比例不是1：1，例如可以是60％和40％。第28頁(yè)，共48頁(yè)。(4)調(diào)查對(duì)象在填寫答案前，先隨機(jī)抽取一個(gè)球(球的顏色對(duì)調(diào)查員保密)，據(jù)球的顏色決定回答兩個(gè)問題中的哪一個(gè)。(5)由于調(diào)查員不知道某一對(duì)象抽取的球是什么顏色的，所以無(wú)法知道某一對(duì)象回答的是問題A還是問題B，也無(wú)法知道調(diào)查對(duì)象的“秘密”。(6)設(shè)立兩個(gè)問題：?jiǎn)栴}A：婚前有過性行為?回答：①是②否問題B：婚前沒有性行為?回答：①是②否第29頁(yè)，共48頁(yè)。(7)如果調(diào)查對(duì)象抽取的球是黑色的，則回答問題A；如果調(diào)查對(duì)象抽取的球是白色的，則回答問題B。(8)計(jì)算調(diào)查對(duì)象中婚前有性行為者的比例。第30頁(yè)，共48頁(yè)。若調(diào)查200人，回答“是”的比例為λ=0.48，第31頁(yè)，共48頁(yè)。第32頁(yè)，共48頁(yè)。二、估計(jì)比例用的3種改進(jìn)模型1、模型I把問題B改為一個(gè)完全無(wú)關(guān)、答案為“是”的概率是已知值的問題將沃納模型中與敏感性問題相對(duì)的具有特征A的問題改為一個(gè)與敏感性問題不相關(guān)的其它問題。

BA第33頁(yè)，共48頁(yè)。例14-２：欲調(diào)查某地已婚育齡婦女有無(wú)婚前性行為的比例。問題A：婚前有過性行為?回答：①是②否

問題B：你生日（月＋日）除以３余數(shù)是０嗎?回答：①是②否第34頁(yè)，共48頁(yè)。有無(wú)性行為第35頁(yè)，共48頁(yè)。

如果黑球比例為p=60%，同時(shí)回答問題A和B均為是的比例π=0.24，生日（月＋日）除以３余數(shù)是０占π0=33.33%，則第36頁(yè)，共48頁(yè)。西蒙斯模型的不足之處(1)π是預(yù)先已知或待估計(jì)的值，π的估計(jì)偏差會(huì)增加估計(jì)方差。(2)要提高估計(jì)精度，應(yīng)增大P值和減小π值。但隨著P值的增大和π的減小，被調(diào)查者的疑慮會(huì)增加。第37頁(yè)，共48頁(yè)。2、模型II將模型I中設(shè)立無(wú)關(guān)聯(lián)問題B的方法改為兩套抽取球的裝置

優(yōu)點(diǎn)：對(duì)問題B回答“是”的概率不必是已知的。要求調(diào)查對(duì)象抽取兩次彩球和回答問題兩次。裝置中黑球的比例是P1和P2，有專家建議，兩者都不要取0或0.5，習(xí)慣k常取P2=1—P1。不論對(duì)于第一裝置還是對(duì)于第二裝量，摸到黑球者如實(shí)回答問題A，摸到白球者如實(shí)回答問題B。要求調(diào)查對(duì)象在兩次回答問題中不能有矛盾。

第38頁(yè)，共48頁(yè)。例14-3對(duì)于前面所說(shuō)的調(diào)查婚前性行為的研究中，假定共480名調(diào)查對(duì)象。問題A：你在婚前有過性行為嗎?回答①是②否。問題B：你在這3天內(nèi)是吃過魚嗎?回答①是②否。第39頁(yè)，共48頁(yè)。第40頁(yè)，共48頁(yè)。第41頁(yè)，共48頁(yè)。課本上有誤第42頁(yè)，共48頁(yè)。第43頁(yè)，共48頁(yè)。兩次試驗(yàn)?zāi)Ｐ偷闹饕毕?1)若對(duì)同一批被調(diào)查者試驗(yàn)兩次，他們兩次回答的結(jié)果必具有相關(guān)性，從而破壞了模型的隨機(jī)性。但如果對(duì)兩批被調(diào)查者分別進(jìn)行試驗(yàn)，又不容易保證兩次的結(jié)構(gòu)具有相似性，從而產(chǎn)生較大誤差。(2)方差V(π)是兩次試驗(yàn)產(chǎn)生的方差之和，在相同條件下，它比西蒙斯模型的方差要大得多。(3)P1和P2不能太接近。當(dāng)p1=p2時(shí)，模型就沒有意義了。要減小方差V(π)

，就應(yīng)該增大P1而減小P2

，但當(dāng)p1增得過大時(shí)，又會(huì)減少被調(diào)查者的配合。第44頁(yè)，共48頁(yè)。3．模型III

本方法的優(yōu)點(diǎn)是不需要設(shè)立非敏感問題。但是球的顏色要有3種(紅、黑、白)。每種球的比例是已知的(P3＝

人人文庫(kù)> 全部分類> 應(yīng)用文書 > 產(chǎn)品手冊(cè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

常用的抽樣方法

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

常用的抽樣方法

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔