第六章 抽樣設(shè)計_第1頁
第六章 抽樣設(shè)計_第2頁
第六章 抽樣設(shè)計_第3頁
第六章 抽樣設(shè)計_第4頁
第六章 抽樣設(shè)計_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 第六章第六章 抽樣設(shè)計抽樣設(shè)計抽樣調(diào)查的基本概念抽樣調(diào)查的基本概念 隨機(jī)抽樣技術(shù)隨機(jī)抽樣技術(shù) 非隨機(jī)抽技術(shù)非隨機(jī)抽技術(shù) 抽樣中的誤差抽樣中的誤差有關(guān)抽樣設(shè)計的幾個問題有關(guān)抽樣設(shè)計的幾個問題入戶調(diào)查中入戶調(diào)查中KISHKISH表的運用表的運用12第一節(jié)第一節(jié)抽樣調(diào)查的基本概念抽樣調(diào)查的基本概念l市場調(diào)查以抽樣調(diào)查為主。l有關(guān)抽樣調(diào)查的基本概念已在抽樣技術(shù)一課中有專門介紹,本課程不重復(fù)介紹。3第二節(jié)第二節(jié) 隨機(jī)抽樣技術(shù)隨機(jī)抽樣技術(shù)l按照隨機(jī)原則抽取樣本。l樣本統(tǒng)計量的分布一般是可測的,可以用樣本統(tǒng)計量對總體參數(shù)進(jìn)行估計。l技術(shù)操作相對復(fù)雜,必須有完整的抽樣框。l成本較高,對抽樣設(shè)計人員的專業(yè)技術(shù)

2、要求較高。l詳細(xì)內(nèi)容見抽樣技術(shù)。4第三節(jié)第三節(jié) 非隨機(jī)抽非隨機(jī)抽樣樣技術(shù)技術(shù)l 非隨機(jī)抽樣是指抽樣時不遵循隨機(jī)原則,而是按照研究人員主觀判斷或僅按方便原則抽選樣本。l 市場調(diào)查中常用的非隨機(jī)抽樣技術(shù)有: l方便抽樣l判斷抽樣l配額抽樣l雪球抽樣l自愿樣本5一、方便抽樣一、方便抽樣l 也稱為偶遇抽樣、隨意抽樣l 根據(jù)調(diào)查者的方便與否來抽取樣本的一種方法。最典型的方法是攔截式調(diào)查。l 操作簡便,費用節(jié)省,但樣本代表性一般較差。不能據(jù)以推斷總體。l 不適合描述性研究和因果關(guān)系研究。l 適合于探索性研究,通過調(diào)查產(chǎn)生想法和假設(shè)。也可用于正式調(diào)查前的預(yù)調(diào)查。6二、判斷抽樣二、判斷抽樣l 也稱為目的抽樣。

3、l 研究人員憑主觀經(jīng)驗,從總體中選擇具有代表性樣本進(jìn)行調(diào)查。該方法的應(yīng)用前提是研究者必須對總體的有關(guān)特征有相當(dāng)深入的了解l 實施中有兩種方法:l 選擇最能代表普遍情況的調(diào)查對象,常以平均型或多數(shù)型為標(biāo)準(zhǔn)l 利用總體全面資料,按一定標(biāo)準(zhǔn)主觀選擇樣本。(如典型單位)l 特點l 在樣本量小及樣本不能分門別類挑選時有較大的優(yōu)越性l 判斷抽樣的目的多在于了解總體的數(shù)量特征和對問題的深入分析,而不是利用調(diào)查結(jié)果對總體參數(shù)進(jìn)行估計。l 調(diào)查結(jié)果與研究者的判斷水平、解釋能力等相關(guān),結(jié)果往往受到懷疑7三、配額抽樣三、配額抽樣l 先將總體分類,后在每類中用方便抽樣或判斷抽樣方法選取樣本單位。l 配額的方式有獨立控

4、制與交叉控制兩種。獨立控制是僅按一個變量來分配樣本,交叉控制是同時按照兩個變量交叉分配樣本。l 有獨立控制配額抽樣和交叉控制配的抽樣。l 獨立控制配額抽樣只用一個變量進(jìn)行配額l 交叉控制配額抽樣采用多個變量進(jìn)行配額8三、配額抽樣三、配額抽樣l 獨立控制配額抽樣之例:l 某項調(diào)查確定樣本量為200人,其中:男性70%,女性30%。請對抽樣進(jìn)行配額。性別性別比例比例人數(shù)人數(shù)男男70%140女女30%60合計合計100%2009三、配額抽樣三、配額抽樣l 交叉控制配額抽樣之例:l 某項調(diào)查確定樣本量為200人,其中男性70%,女性30%;農(nóng)村20%,城市80%。請對抽樣進(jìn)行配額。性別性別男性比例男性

5、比例(70%)男性男性人數(shù)人數(shù)女性比例女性比例(30%)女性女性人數(shù)人數(shù)地地區(qū)區(qū)農(nóng)村(農(nóng)村(20%)14%286%12城市(城市(80%)56%11224%48合計合計70%14030%6010四、雪球抽樣四、雪球抽樣l 是指先隨機(jī)選擇一些被訪者并對其實施訪問,再請他們提供另外一些屬于所研究目標(biāo)總體的調(diào)查對象,根據(jù)所形成的線索選擇此后的調(diào)查對象。l 雪球抽樣以若干個具有所需特征的人為最初的調(diào)查對象,然后依靠他們提供認(rèn)識的合格的調(diào)查對象,再由這些人提供第三批調(diào)查對象,依次類推,樣本如同滾雪球般由小變大。滾雪球抽樣多用于總體單位的信息不足或觀察性研究的情況。這種抽樣中有些分子最后仍無法找到,有些分

6、子被提供者漏而不提,兩者都可能造成誤差。11四、雪球抽樣四、雪球抽樣l 可以根據(jù)某些樣本特征對樣本進(jìn)行控制,適用尋找一些在總體中十分稀少的人物。l 如果總體不大,有時用不了幾次就會接近飽和狀況,即后來訪問的人再介紹的都是已經(jīng)訪問過的人。但是很可能最后仍有許多個體無法找到,還有些個體因某些原因被提供者故意漏掉不提,這兩者都可能具有某些值得注意的性質(zhì),因而可能產(chǎn)生偏誤,不能保證代表性。l 可以根據(jù)某些樣本特征對樣本進(jìn)行控制,適用尋找一些在總體中十分稀少的人物。12五、自愿樣本五、自愿樣本l 自愿樣本是由自愿接受調(diào)查的單位所組成的樣本。例如酒店房間中的顧客調(diào)查表,是由顧客自愿填答的;飛機(jī)上乘務(wù)員發(fā)放

7、的乘客調(diào)查表,由乘客自愿參與調(diào)查。網(wǎng)絡(luò)調(diào)查也是自愿參與的。l 自愿樣本集中于某些特定的群體,只有能夠接觸到調(diào)查問卷的人才有機(jī)會參與調(diào)查;構(gòu)成樣本的單位往往是對調(diào)查內(nèi)容感興趣的那一部分。導(dǎo)致樣本的代表性較差。l 組織方便,成本低廉,適合于了解特定群體的意見與看法。13第四節(jié)第四節(jié) 抽樣中的誤差抽樣中的誤差l 抽樣中的誤差包括抽樣誤差與非抽樣誤差。l 抽樣誤差是抽樣的隨機(jī)性造成的。一般用估計量的方差 或標(biāo)準(zhǔn)差 加以描述。l 抽樣誤差是可以估計和控制的。( )V( )S14第四節(jié)第四節(jié) 抽樣中的誤差抽樣中的誤差l 非抽樣誤差是指除抽樣誤差以外,其他原因引起的樣本統(tǒng)計量與總體真值之間的差異。l 非抽樣

8、誤差產(chǎn)生的原因主要是:15第五節(jié)第五節(jié) 有關(guān)抽樣設(shè)計的若干問題有關(guān)抽樣設(shè)計的若干問題l 抽樣精度的問題l 抽樣框誤差的問題l 樣本容量的確定問題l 抽樣方式的確定問題l 樣本輪換問題l 無回答問題l 敏感性問題16一、一、抽樣精度的問題抽樣精度的問題l 精度是相對的,是概率事件,沒有絕對的準(zhǔn)確。l 一項市場調(diào)查,需了解的指標(biāo)有多項,故在考慮精度時,應(yīng)多元化思考,對于比率值可以統(tǒng)一使用精度要求,對于均值則不同均值有不同精度要求。17二、抽樣框誤差的問題二、抽樣框誤差的問題l 總體與抽樣框之間的差異很小時,可以不考慮抽樣框誤差。l 若要處理抽樣框誤差,則可按下列辦法進(jìn)行:l按現(xiàn)有的抽樣框重新定義總

9、體l用加權(quán)的方法調(diào)整所搜集的資料18三、樣本容量的確定問題三、樣本容量的確定問題l在隨機(jī)抽樣中,樣本量的確定有規(guī)定的方法。l在非隨機(jī)抽樣中,樣本量一般根據(jù)經(jīng)驗和調(diào)查經(jīng)費的多少,主觀加以確定。l增加樣本量可以提高精度,但會增加費用。樣本量的確定要兼顧精度與費用?;驹瓌t是,在精度一定的條件下,費用最?。换蛟谫M用一定的條件下,精度最高。19四、抽樣方式的確定問題四、抽樣方式的確定問題l 考慮多種因素來確定方式,可以多方式相結(jié)合。l 抽樣方式的確定,主要應(yīng)該考慮的因素是:l對抽樣誤差大小的要求l調(diào)查對象本身的特點l人力、物力、經(jīng)費和時間要求20五、樣本輪換問題五、樣本輪換問題l 樣本老化、長期調(diào)查被

10、調(diào)查者的合作態(tài)度受影響,長期調(diào)查可能會影響被調(diào)查者的行為,此時需要輪換樣本。l 如何輪換,輪換多少,沒有理論上的說法,主要根據(jù)經(jīng)驗、需要、經(jīng)費、調(diào)查的組織實施等因素主觀確定。21六、無回答問題六、無回答問題l 不遇被到調(diào)查者、被調(diào)查者因客觀原因無法接受調(diào)查、被調(diào)查者拒絕調(diào)查等等,都導(dǎo)致無回答。l 對于由于隨機(jī)因素導(dǎo)致的無回答,會導(dǎo)致估計量的方差增大。對于非隨機(jī)因素導(dǎo)致的無回答,既可導(dǎo)致估計量的方差增大,也可導(dǎo)致估計偏差。22六、無回答問題六、無回答問題l 對于無回答,可采用三種辦法處理l 分清無回答原因,有針對性地進(jìn)行多次調(diào)查。l 對調(diào)查結(jié)果進(jìn)行估算;l 在無回答者中抽取樣本進(jìn)行再調(diào)查(二重抽

11、樣) 23七、敏感性問題七、敏感性問題l 敏感性問題是指在抽樣調(diào)查中,被調(diào)查的問題是屬于被調(diào)查人私人機(jī)密或不愿意如實回答的問題。l 如調(diào)查被調(diào)查者是否曾冒充顧客進(jìn)商店行竊,是否吸毒,個人儲蓄是多少等。l 這類涉及個人隱私或違法行為的敏感性問題,若采用直接問答的方式,被調(diào)查者往往會拒絕回答或故意作出錯誤的回答。這樣就破壞了數(shù)據(jù)的真實性,而且其破壞程度的大小無法度量。24八、八、隨機(jī)化回答技術(shù)隨機(jī)化回答技術(shù)l 為了得到敏感性問題的可靠的樣本數(shù)據(jù),則必須采用隨機(jī)化回答技術(shù)(Randomized response Technique ,簡稱RRT)。l 隨機(jī)化回答技術(shù)主要有以下特點:l 被調(diào)查者采取隨

12、機(jī)回答的方式,調(diào)查人員無法從被調(diào)查者的回答中得知對方是否具有某種特征。l 可以在一定程度上消除被調(diào)查者的顧慮,使他們參與調(diào)查,并提供真實情況。l 調(diào)查人員可以通過概率原理,運用隨機(jī)化回答結(jié)果,對總體參數(shù)進(jìn)行估計。 251 1、沃納隨機(jī)化回答模型、沃納隨機(jī)化回答模型l 由美國統(tǒng)計學(xué)家沃納(Warner)在20世紀(jì)60年代中期提出的。l 其基本思想是:為了調(diào)查某個敏感性問題,同時列出兩個對立的問題,被調(diào)查者從中隨機(jī)抽出一個來回答,回答只用“是”或“否”。調(diào)查人員并不知道其回答的是哪個問題,從而保護(hù)了被調(diào)查者的個人隱私,使其有可能提供真實回答。261 1、沃納隨機(jī)化回答模型、沃納隨機(jī)化回答模型l 某

13、市場工商管理部門發(fā)現(xiàn)個體戶中有漏稅現(xiàn)象,欲對個體戶漏稅人數(shù)的比例進(jìn)行抽樣調(diào)查,考慮到漏稅的個體戶不愿意承認(rèn)自己有漏稅為,故采用隨機(jī)化回答技術(shù)。l 運用沃納隨機(jī)化回答技術(shù)的過程如下:l 制作兩疊卡片,分別為制作兩疊卡片,分別為A類卡和類卡和B類卡類卡l A卡上寫著:卡上寫著:“我有過漏稅行為我有過漏稅行為”l B卡上寫著:卡上寫著:“我沒有漏稅行為我沒有漏稅行為”l A卡和卡和B卡的數(shù)量不能相等,并混合在一起調(diào)查人員給被調(diào)查者介卡的數(shù)量不能相等,并混合在一起調(diào)查人員給被調(diào)查者介紹這種調(diào)查的目的和要求,消除被調(diào)查者的顧慮。紹這種調(diào)查的目的和要求,消除被調(diào)查者的顧慮。271 1、沃納隨機(jī)化回答模型、

14、沃納隨機(jī)化回答模型l 由被調(diào)查者從盒子中隨機(jī)抽取一張卡片,并將卡片的正面對著自己,并給出“是”或“否”的回答l 調(diào)查者記錄下回答結(jié)果后,對該被調(diào)查者的調(diào)查即告調(diào)查結(jié)束l 再進(jìn)行下一個調(diào)查1 1、沃納隨機(jī)化回答模型、沃納隨機(jī)化回答模型P1PA1AA1A具有卡片具有卡片A A特征特征 具有卡片具有卡片B B特征特征 具有卡片具有卡片A A特征特征 具有卡片具有卡片B B特征特征 若將抽取卡片和進(jìn)行回答視為兩步,可用圖示表示這個程序:291 1、沃納隨機(jī)化回答模型、沃納隨機(jī)化回答模型l 定義:l P:卡片A的比例l 1-p:卡片B的比例l n :樣本量l :回答“是”的人數(shù)l :回答“否”的人數(shù)l

15、:總體中具有卡片A特征的人數(shù)的比例1nA2n301 1、沃納隨機(jī)化回答模型、沃納隨機(jī)化回答模型l 的估計公式l 點估計式111()()(21)21AnpPnp12p A311 1、沃納隨機(jī)化回答模型、沃納隨機(jī)化回答模型l 區(qū)間估計式l 的方差估計量l 區(qū)間估計式A2(1)(1)()(21)AAAppVnnp()AAzV321 1、沃納隨機(jī)化回答模型、沃納隨機(jī)化回答模型l 例:某調(diào)查機(jī)構(gòu)受市場工商管理部門的委托,采用沃納的隨機(jī)化回答模型對個體戶漏稅人數(shù)的比例進(jìn)行調(diào)查,設(shè)計了兩種卡片。A卡片的比例 p=3/4, 樣本容量n=200, 調(diào)查結(jié)果回答“是”的共有120人,試用95%的置信度估計漏稅人數(shù)

16、比例的置信區(qū)間。 331 1、沃納隨機(jī)化回答模型、沃納隨機(jī)化回答模型l 已知:l 解答:l 根據(jù)公式:13 / 4,200,120,1.96,pnnz111()()(21)21AnpPnp3111 2 04332 0 0221441 .20 .50 .7()()()341 1、沃納隨機(jī)化回答模型、沃納隨機(jī)化回答模型l 又:根據(jù)公式有:2(1)(1)()(21)AAAppVnnp233(1)0.7(10.7)443200200(21)40.001050.003750.0048351 1、沃納隨機(jī)化回答模型、沃納隨機(jī)化回答模型l l 故總體 的置信區(qū)間為:()0.71.960.00480.71.3

17、5zVAA0 .5 6 50 .8 3 5AA362 2、西蒙斯隨機(jī)化回答模型、西蒙斯隨機(jī)化回答模型l 西蒙斯模型是1967年由西蒙斯(Simmons)提出的。l 其設(shè)計思想仍是基于沃納的隨機(jī)化回答思想,只是在設(shè)計中用無關(guān)的問題Y代替了沃納模型中的敏感性問題A的對立問題。這有助于進(jìn)一步消除被調(diào)查者的顧慮。372 2、西蒙斯隨機(jī)化回答模型、西蒙斯隨機(jī)化回答模型l 例:學(xué)校有關(guān)部門要對學(xué)生期末考試中的舞弊行為進(jìn)行一次調(diào)查,了解學(xué)生作弊人數(shù)的比例。l 運用西蒙斯隨機(jī)化回答技術(shù)的過程如下:l 制作兩疊卡片,分別為A類卡和B類卡l A卡上寫著:“我在考試中作弊了”l B卡上寫著:“我上星期在圖書館借書了

18、”l A卡和B卡的數(shù)量可以相等,并混合在一起l 調(diào)查人員給被調(diào)查者介紹這種調(diào)查的目的和要求,消除被調(diào)查者的顧慮。382 2、西蒙斯隨機(jī)化回答模型、西蒙斯隨機(jī)化回答模型l 由被調(diào)查者從盒子中隨機(jī)抽取一張卡片,并將卡片的正面對著自己,并給出“是”或“否”的回答。l 調(diào)查者記錄下回答結(jié)果后,對該被調(diào)查者的調(diào)查即告調(diào)查結(jié)束。l 再進(jìn)行下一個調(diào)查。2 2、西蒙斯隨機(jī)化回答模型、西蒙斯隨機(jī)化回答模型P1PA1AB1B具有卡片具有卡片A A特征特征 不不具有卡片具有卡片A A特征特征 具有卡片具有卡片B B特征特征 不不具有卡片具有卡片B B特征特征 若將抽取卡片和進(jìn)行回答視為兩步,可用圖示表示這個程序:4

19、02 2、西蒙斯隨機(jī)化回答模型、西蒙斯隨機(jī)化回答模型l 定義:l :總體中具有卡片B特征的人數(shù)l 其他符號定義同前l(fā) 的估計公式l 點估計式BA1(1)BAnpnP 412 2、西蒙斯隨機(jī)化回答模型、西蒙斯隨機(jī)化回答模型l 區(qū)間估計式l 的方差估計量l 區(qū)間估計式A1121()1AnnVnpnn ()AAzV422 2、西蒙斯隨機(jī)化回答模型、西蒙斯隨機(jī)化回答模型l 例:學(xué)校有關(guān)部門欲對學(xué)生期末考試中的作弊情況進(jìn)行一次調(diào)查,采用西蒙斯隨機(jī)化回答模型??ㄆ珹的比p=1/2,n=200,調(diào)查結(jié)果回答“是”的人數(shù)為30人。試以95%的把握程度對作弊學(xué)生的比例進(jìn)行區(qū)間估計。432 2、西蒙斯隨機(jī)化回答模

20、型、西蒙斯隨機(jī)化回答模型l 已知:l 通過查閱圖書館記錄,得知上星期中借過書的學(xué)生比例為1/4,即l 根據(jù)公式得:1,200,3021pnn1/ 4B130111200240.0512(1)BAnpnP()442 2、西蒙斯隨機(jī)化回答模型、西蒙斯隨機(jī)化回答模型l 的方差估計量l 置信區(qū)間為: 1121303010.002551200200220021()1AnnVnpnn () ()( )A()z VAA0.051.960.002550.050.098453 3、使用隨機(jī)化回答技術(shù)應(yīng)注意的問題、使用隨機(jī)化回答技術(shù)應(yīng)注意的問題l 要求調(diào)查人員能充分理解這種方法。l 為了進(jìn)一步消除被調(diào)查者可能存在

21、的顧慮,應(yīng)當(dāng)允許被調(diào)查者在正式調(diào)查前檢查卡片,了解記錄方式,使其相信這種方法不是騙人的圈套。l 如果使用西蒙斯模型,要注意選擇無關(guān)的非敏感性問題。l 該技術(shù)的實際運用尚需進(jìn)一步研究。46第六節(jié)第六節(jié) 入戶調(diào)查中入戶調(diào)查中KISHKISH表的運用表的運用l KISH表是指由美國著名抽樣專家KISH創(chuàng)立的一種在確立了戶之后,如何選擇戶內(nèi)家庭成員的方法。它包括:家庭成員編號(最大值為8,假定家庭人口的最大數(shù)量)。成員名單,或者與接待者的關(guān)系。性別。年齡。樣本戶編號。47第六節(jié)第六節(jié) 入戶調(diào)查中入戶調(diào)查中KISHKISH表的運用表的運用家庭成員編號家庭成員編號姓名姓名性別性別年齡年齡 內(nèi)部樣本編號(尾

22、號)內(nèi)部樣本編號(尾號) 1 12 23 34 45 56 67 78 89 9 0 01 11 11 11 11 11 11 11 11 11 11 12 21 12 21 12 21 12 21 12 21 12 23 32 23 31 12 23 31 12 23 31 12 24 43 34 41 12 23 34 41 12 23 34 45 54 45 51 12 23 34 45 51 12 23 36 65 56 61 12 23 34 45 56 61 12 27 76 67 71 12 23 34 45 56 67 71 18 87 78 81 12 23 34 45 56 67 78 8數(shù)字規(guī)律?48第六節(jié)第六節(jié) 入戶調(diào)查中入戶調(diào)查中KISHKISH表的運用表的運用l確定該戶的符合調(diào)查要求的人口數(shù);l依照年齡由高到低,按家庭成員編號的順序?qū)懺诒淼南鄳?yīng)的位置上;l確定樣本戶的編號。通常的做法是:調(diào)查員調(diào)查的第一戶的編號為1,第二戶為2,依次類推。l樣本編號所在列,與家庭成員人口數(shù)行所對應(yīng)的數(shù)字為該戶成員年齡由大到小排列的編號,此編號對應(yīng)的人為抽樣樣本單位。49第六節(jié)第六節(jié) 入戶調(diào)查中入戶調(diào)查中KISHKISH表的運用表的運用l 某戶有5口人,年齡分別為69、67、38、32

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論