第四章抽樣調(diào)查_第1頁
第四章抽樣調(diào)查_第2頁
第四章抽樣調(diào)查_第3頁
第四章抽樣調(diào)查_第4頁
第四章抽樣調(diào)查_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章抽樣調(diào)查第一頁,共四十九頁,2022年,8月28日李景漢在1937年出版的《定縣社會概況調(diào)查》一書的自序中寫到:“定縣是中國1900余個縣中的一個縣,人口約四十萬眾,等于全國人口的千分之一??h內(nèi)的農(nóng)民生活、鄉(xiāng)村組織、農(nóng)業(yè)等情形可以相當?shù)卮碇袊霓r(nóng)村社會,尤其是華北的各情形。也可以大致說明全國農(nóng)村社會的縮影,有許多定縣的社會現(xiàn)象和問題也就是其他地方的現(xiàn)象和問題,吾人要繼續(xù)集中精神徹底地從事研究定縣的各種社會問題,求得解決的方案也即在此;因為不是單為定縣而研究,而是為全國而研究的?!钡诙?,共四十九頁,2022年,8月28日一、概念就是從調(diào)查對象的總體中抽取一部分單位作為樣本,并以對樣本進行調(diào)查的結(jié)果來推斷總體的方法。包括概率抽樣和非概率抽樣。第二次全國殘疾人抽樣調(diào)查第一節(jié)抽樣調(diào)查的基本原理與概念第三頁,共四十九頁,2022年,8月28日二、優(yōu)越性:調(diào)查費用低速度快應(yīng)用范圍廣可獲得內(nèi)容豐富的資料準確度高第四頁,共四十九頁,2022年,8月28日三、什么時候用:當事實上不可能進行或不必要進行普查時。當對具體調(diào)查的統(tǒng)計資料的正確性進行檢查和核對時,例如對于全國人口普查的統(tǒng)計資料可靠性進行檢查和評估。當需要對問題進行更全面、精密、深刻的探討時。第五頁,共四十九頁,2022年,8月28日四、優(yōu)越性成立的前提:部分包含與整體之中。更重要的是,部分和整體有同樣的特征、現(xiàn)象、關(guān)系和過程。部分能夠為研究者提供一個有關(guān)群體生活、群體態(tài)度、價值和意見的更為清晰的脈絡(luò)。第六頁,共四十九頁,2022年,8月28日抽樣調(diào)查成功的關(guān)鍵:樣本能夠代表總體,所謂代表也就是說,所選取的樣本從調(diào)查研究的總體特征來看,能再現(xiàn)總體的結(jié)構(gòu)?!叭绾闻袛嘁粋€樣本的誤差大小”“怎樣才能抽到一個有代表性的樣本”遵循隨機原則的概率抽樣可以保證抽選出一定代表性的樣本,并能夠通過計算估計樣本和總體間的誤差的大小以及這種估計的可信程度。這就給抽樣方法奠定了科學的基礎(chǔ),從而使抽樣調(diào)查成為宏觀社會研究的主要方法之一。第七頁,共四十九頁,2022年,8月28日五、抽樣的一般步驟:確定研究總體和調(diào)查總體選擇抽樣方法設(shè)計抽樣方案制定抽樣框設(shè)計和抽取樣本評估樣本和對總體進行估計(前提對總體有些了解)第八頁,共四十九頁,2022年,8月28日研究總體是在理論上明確界定的個體的集合體,它必須受幾個方面的限定:內(nèi)容、單位、范圍、時間。例如一項關(guān)于婦女生育率的研究,如果未加界定,婦女只是個模糊的整體,還不是研究總體,只有經(jīng)界定為“2005年年滿15-49歲的中國婦女”后,才成為可用于調(diào)查的研究總體。研究總體是在理論上明確定義的整體,但在實際中很難做到使符合這一定義的一切個體均能有機會被選入樣本,例如本例中西藏游牧區(qū)的婦女、在部隊服役、勞教、患病特別是患精神疾病的婦女等,雖然在理論上符合研究總體的定義,但實際上無法對其進行調(diào)查。實際上,樣本是從調(diào)查總體而非研究總體中抽取的。第九頁,共四十九頁,2022年,8月28日調(diào)查總體是研究者從中實際抽取調(diào)查樣本的個體的集合體,它往往是對研究總體的進一步界定,即對時間、范圍做更進一步規(guī)定,例如本例中的調(diào)查總體可界定為:2005年7月1日零點(除臺灣和西藏外)28個省市自治區(qū)15-49歲婦女,并且要將住在醫(yī)院、精神病院、監(jiān)獄、勞教所、軍隊中的婦女除外。一般地說,樣本只能推論調(diào)查總體而不是研究總體。第十頁,共四十九頁,2022年,8月28日抽樣框,又稱抽樣范疇,是從中抽取樣本的抽樣單位名單。在一次抽樣中,抽樣框的數(shù)目是與抽樣單位的層次相對應(yīng)的,上面例子中有三個層次的抽樣單位:鄉(xiāng)、村、家,則對樣的抽樣單位有三個:全部鄉(xiāng)的名單、鄉(xiāng)樣本中所有村組成的名單、村樣本中所有家庭的名單。第十一頁,共四十九頁,2022年,8月28日衡量樣本質(zhì)量的兩個標準準確性所謂準確性就是指樣本沒有偏差,偏差也稱系統(tǒng)誤差,有很多的原因,主要(1)抽樣程序上沒有嚴格遵循隨機原則;(2)無回答精確性精確性指的是抽樣誤差的大小。抽樣誤差是抽樣這種方法固有的誤差,是隨機誤差。第十二頁,共四十九頁,2022年,8月28日樣本的評估有兩個階段:正式調(diào)查前和調(diào)查后(這里闡述的是前者)目的是初步檢查樣本對于總體的代表性,以剔除那些偏差太大的樣本,重新抽樣。評估可以采取收集若干容易得到的資料,如年齡、性別、文化程度等作為樣本與總體之間的比較的方法。第十三頁,共四十九頁,2022年,8月28日六、樣本容量的確定1、對調(diào)查精確度的要求2、調(diào)查總體的規(guī)模大小3、調(diào)查總體內(nèi)部的異質(zhì)程度4、抽樣方法:分層最小、整群最大5、調(diào)查所擁有的人力、物力和時間第十四頁,共四十九頁,2022年,8月28日總體規(guī)模100人以下100-1000人1000—5000人5000—1萬人1萬人—10萬人10萬人以上樣本占總體比重50%以上50%—20%30%—10%15%—3%5%—1%1%以下經(jīng)驗確定樣本數(shù)的范圍第十五頁,共四十九頁,2022年,8月28日

第二節(jié)抽樣方法第十六頁,共四十九頁,2022年,8月28日抽樣方法:根據(jù)抽樣原則的不同,分為隨機抽樣和非隨機抽樣(概率抽樣與非概率抽樣)抽樣方法概率抽樣非概率抽樣簡單隨機抽樣系統(tǒng)抽樣分層抽樣整群抽樣多段抽樣偶遇抽樣定額抽樣判斷抽樣雪球抽樣第十七頁,共四十九頁,2022年,8月28日一、概率抽樣以概率論原理為基礎(chǔ),按照隨機原則抽取樣本的抽樣方法,即機會均等,即抽樣框中每一個抽樣單位都有被抽取的同等可能性。概率抽樣的一般程序:界定調(diào)查總體決定抽樣方法制定抽樣框?qū)嶋H抽取樣本評估樣本質(zhì)量第十八頁,共四十九頁,2022年,8月28日注意以下四點:(1)它要求被抽取樣本的總體的個體數(shù)有限;

(2)它是從總體中逐個進行抽?。?/p>

(3)它是一種不放回抽樣;簡單隨機抽樣是在特定總體中抽取樣本,總體中每一個體被抽取的可能性是等同的,而且任何個體之間彼此被抽取的機會是獨立的。如果用從個體數(shù)為N的總體中抽取一個容量為n的樣本,那么每個個體被抽取的概卒等于n/N。

一般地,設(shè)一個總體的個體數(shù)為N,如果通過逐個抽取的方法從中抽取一個樣本,且每次抽取時各個個體被抽到的概率相等,就稱這樣的抽樣為簡單隨機抽樣。1、簡單隨機抽樣或純隨機抽樣(4)它是一種等概率抽樣。第十九頁,共四十九頁,2022年,8月28日抽簽法簡單隨機抽樣的方法:隨機數(shù)表法1、抽簽法先將總體中的所有個體(共N個)編號(號碼可以從1到N),并把號碼寫在形狀、大小相同的號簽上(號簽可以用小球、卡片、紙條等制作),然后將這些號簽放在同一個箱子里,進行均勻攪拌。抽簽時,每次從中抽出1個號簽,連續(xù)抽取n次,就得到一個容量為n的樣本。對個體編號時,也可以利用已有的編號。例如學生的學號,座位號等。第二十頁,共四十九頁,2022年,8月28日2、用隨機數(shù)表法進行抽取隨機抽樣并不是隨意或隨便抽取,因為隨意或隨便抽取都會帶有主觀或客觀的影響因素(1)隨機數(shù)表是統(tǒng)計工作者用計算機生成的隨機數(shù),并保證表中的每個位置上的數(shù)字是等可能出現(xiàn)的。(2)隨機數(shù)表并不是唯一的,因此可以任選一個數(shù)作為開始,讀數(shù)的方向可以向左,也可以向右、向上、向下等等。(3)用隨機數(shù)表進行抽樣的步驟:將總體中個體編號;選定開始的數(shù)字;獲取樣本號碼。(4)由于隨機數(shù)表是等概率的,因此利用隨機數(shù)表抽取樣本保證了被抽取個體的概率是相等的。第二十一頁,共四十九頁,2022年,8月28日隨機數(shù)表法例下面舉例說明如何用隨機數(shù)表來抽取樣本。為了檢驗?zāi)撤N產(chǎn)品的質(zhì)量,決定從40件產(chǎn)品中抽取10件進行檢查,在利用隨機數(shù)表抽取這個樣本時,可以按下面的步驟進行:第一步,先將40件產(chǎn)品編號,可以編為00,01,02,38,39。第二步,在附錄1隨機數(shù)表中任選一個數(shù)作為開始,例如從第8行第9列的數(shù)5開始,為便于說明,我們將附錄1中的第6行至第10行摘錄如下。

第二十二頁,共四十九頁,2022年,8月28日

1622779439495443548217379323788735209643

8426349164844217533157245506887704744767

2176335025839212067663016378591695556719

9810507175128673580744395238793321123429

7864560782524207443815510013429966027954

5760863244094727965449174609629052847727

0802734328181807924544171658097983861962第二十三頁,共四十九頁,2022年,8月28日第三步,從選定的數(shù)5開始向右讀下去,得到一個兩位數(shù)字號碼59,由于59>39,將它去掉;繼續(xù)向右讀,得到16,將它取出;繼續(xù)下去,又得到19,10,12,07,39,38,33,21,隨后的兩位數(shù)字號碼是12,由于它在前面已經(jīng)取出,將它去掉,再繼續(xù)下去,得到34。至此,10個樣本號碼已經(jīng)取滿,于是,所要抽取的樣本號碼是16

19

10

12

07

39

38

33

21

34

注將總體中的N個個體編號時可以從0開始,例如N=100時編號可以是00,01,02,99,這樣總體中的所有個體均可用兩位數(shù)字號碼表示,便于運用隨機數(shù)表。第二十四頁,共四十九頁,2022年,8月28日注:當隨機地選定開始讀數(shù)的數(shù)后,讀數(shù)的方向可以向右,也可以向左、向上、向下等等。在上面每兩位、每兩位地讀數(shù)過程中,得到一串兩位數(shù)字號碼,在去掉其中不合要求和與前面重復(fù)的號碼后,其中依次出現(xiàn)的號碼可以看成是依次從總體中抽取的各個個體的號碼。由于隨機數(shù)表中每個位置上出現(xiàn)哪一個數(shù)字是等概率的,每次讀到哪一個兩位數(shù)字號碼,即從總體中抽到哪一個個體的號碼也是等概率的。因而利用隨機數(shù)表抽取樣本保證了各個個體被抽取的概率相等。第二十五頁,共四十九頁,2022年,8月28日簡單隨機抽樣優(yōu)點在抽樣過程中完全排除了主觀因素的干擾,而且簡單易行,只要有總體各單位名單就可進行缺點只適應(yīng)于總體單位數(shù)量不多的調(diào)查對象,如果總體單位數(shù)量很大,編制抽樣框的工作就十分復(fù)雜,甚至無法編制樣本代表性較差,抽樣誤差較大抽取的樣本可能比較分散或過于集中,這將給實際調(diào)查工作帶來許多困難。第二十六頁,共四十九頁,2022年,8月28日(1)一個禮堂有30排座位,每排有40個座位。一次報告會禮堂坐滿了聽眾。會后為聽取意見留下了座位號為20的30名聽眾進行座談。當總體的個數(shù)較多時,采用簡單隨機抽樣太麻煩,這時將總體分成均衡的部分,然后按照預(yù)先定出的規(guī)則,從每一部分中抽取1個個體,得到所需要的樣本,這種抽樣稱為系統(tǒng)抽樣(等距抽樣)。2.系統(tǒng)抽樣(等距抽樣)

第二十七頁,共四十九頁,2022年,8月28日系統(tǒng)抽樣的步驟為:(1)先編制抽樣框,將各抽樣單位按照一定標志排列編號(2)用總體單位除以樣本單位求得抽樣間隔(3)在第一抽樣間隔內(nèi)隨機抽取一個號碼作為第一個樣本(4)按照抽樣間隔等距抽樣,直到抽取最后一個樣本為止系統(tǒng)抽樣時,將總體中的個體均分后的每一段進行抽樣時,采用簡單隨機抽樣;系統(tǒng)抽樣每次抽樣時,總體中各個個體被抽取的概率也是相等的;如總體的個體數(shù)不能被樣本容量整除時,可以先用簡單隨機抽樣從總體中剔除幾個個體,然后再按系統(tǒng)抽樣進行。需要說明的是整個抽樣過程中每個個體被抽到的概率仍然相等。第二十八頁,共四十九頁,2022年,8月28日例如,為了了解參加某種知識競賽的1000名學生的成績,打算從中抽取一個容量為50的樣本。假定這1000名學生的編號是1,2,…,1000,由于50:1000=1:20,我們將總體均分成50個部分,其中每一部分包括20個個體,例如第1部分的個體編號是1,2,…,20。然后在第一部分隨機抽取一個號碼,這樣得到一個容量為50的樣本:

18,38,58,…,978,998在上面的抽樣中,由于在第1部分(個體編號1~20)中的起始號碼是隨機確定的,每個號碼被抽取的概率都等于0.05,所以在抽取第1部分的個體前,其他各部分中每個號碼被抽取的概率也都是0.05.就是說,在這個系統(tǒng)抽樣中,每個個體被抽到的概率都是0.05.第二十九頁,共四十九頁,2022年,8月28日練習:某學院共有3000名學生,要抽取一個容量為100的大學生樣本,請問如何抽???如果起抽號是12,那么最后一名被抽中的學生號碼是多少?第三十頁,共四十九頁,2022年,8月28日等距隨機抽樣優(yōu)點樣本在總體中分布比較均勻,具有較高的代表性,抽樣誤差小于簡單隨機抽樣,而其比較簡單易行,只要抽取了第一個樣本,整個樣本都確定了缺點調(diào)查總體單位數(shù)量不能太多,而且要有完整的登記冊,否則就難以進行。另外,使用這種方法要注意避免抽樣間隔與調(diào)查對象的周期性節(jié)奏相重合。第三十一頁,共四十九頁,2022年,8月28日3.分層抽樣(類型隨機抽樣)當已知總體由差異明顯的幾部分組成時,為了使樣本充分地反映總體的情況,常將總體分成幾部分,然后按照各部分所占的比例進行抽樣。其中所分成的各部分叫做層。由于分層抽樣的要求不同,各層的抽樣的樣本容量也不相同,所以,應(yīng)當按照實際情況,合理地將樣本容量分配到各個層,以確保抽樣的合理性,研究時可以根據(jù)不同的要求來分層抽樣。分層抽樣適用于總體由差異明顯的幾部分組成的情況,每一部分稱為層,在每一層中實行簡單隨機抽樣。這種方法較充分地利用了總體己有信息,是一種實用、操作性強的方法。分層抽樣的一個重要問題是一個總體如何分層。分層抽樣中分多少層,要視具體情況而定??偟脑瓌t是:層內(nèi)樣本的差異要小,而層與層之間的差異盡可能地大,否則將失去分層的意義。第三十二頁,共四十九頁,2022年,8月28日思考應(yīng)當以抽樣單位的何種特性作為分層的標準,也就是說,應(yīng)選用什么樣的變量作為分層變量呢?一般來說,用以分層的理想變量是在調(diào)查中要加以測量的變量!例如調(diào)查某廠職工購買書籍的平均冊數(shù),最好的分類變量是年購書總冊數(shù)。將職工分為買5本以上,5—10本,10—15本,15—20本,20本以上等五個層。問題?實際上我們是不可能按這樣的辦法分層的,怎么辦?選擇與調(diào)查中欲測量變量高度相關(guān)的變量,即對所要研究的變量有很大影響的因素!如上例,可選擇“教育水平”進行分層!第三十三頁,共四十九頁,2022年,8月28日分層的標準問題:以調(diào)查所要分析和研究的主要變量和相關(guān)變量為分層標準以保證各層內(nèi)同質(zhì)性強、層之間異質(zhì)性強的變量為分層標準以那些以有明顯層次區(qū)分的變量為分層標準分層的比例問題等比例分層不等比例分層第三十四頁,共四十九頁,2022年,8月28日分層抽樣的抽取步驟:(1)總體與樣本容量確定抽取的比例。(2)由分層情況,確定各層抽取的樣本數(shù)。(3)各層的抽取數(shù)之和應(yīng)等于樣本容量。(4)對于不能取整的數(shù),求其近似值。第三十五頁,共四十九頁,2022年,8月28日某廠進行一次有關(guān)職工家庭生活的抽樣調(diào)查。全廠職工1200名,其中男職工800名,女職工400名。要抽取150名作為調(diào)查對象。采用等比例分層抽樣的方法,請問男職工和女職工分別需要抽取幾名?層內(nèi)采取等距抽樣,將男女職工分別排序。在男職工中,若第一個樣本的起抽點是4好,第82個樣本的號碼是多少?在女職工中,若第一個樣本的起抽點是7號,問第50個樣本的號碼是多少?第三十六頁,共四十九頁,2022年,8月28日分層隨機抽樣優(yōu)點能夠在不增加樣本規(guī)模的情況下,降低抽樣誤差,提高抽樣的精度。便于對總體中不同層次進行單獨研究或比較研究缺點必須對總體各單位的情況有較多的了解,否則就無法科學的分類,而這一點在實際調(diào)查之前往往難以做到。第三十七頁,共四十九頁,2022年,8月28日

4、一個電視臺在因特網(wǎng)上就觀眾對其某一節(jié)目的喜愛程度進行調(diào)查,參加調(diào)查的總?cè)藬?shù)為12000人,其中持各種態(tài)度的人數(shù)如下所示:很喜愛喜愛一般不喜愛2400420038001600打算從中抽取60人進行詳細調(diào)查,如何抽???第三十八頁,共四十九頁,2022年,8月28日4.整群抽樣

先將總體按某種標準或方式劃分成或干個具有同一特征的子群體,并以這種子群體作為抽樣的單位;再用上面所提到的概率抽樣的方法從這些子群體中抽取若干個;最后將所抽出的子群體中的所有個體合在一起,構(gòu)成總體的一個樣本。

整群抽樣適合于異質(zhì)的子群體,而分層抽樣適合于同質(zhì)的子群體。整群抽樣分為等規(guī)模整群抽樣和不等規(guī)模整群抽樣,前者總體內(nèi)所有的群規(guī)模等相等,而后者總體內(nèi)各群大小不一。而我們在社會調(diào)查研究中,一般都遇到后一種情況。第三十九頁,共四十九頁,2022年,8月28日整群隨機抽樣優(yōu)點樣本單位比較集中,調(diào)查工作比較簡單,可節(jié)省人力、財力和時間缺點樣本分布不均勻,代表性差,與上述幾種抽樣方法相比較,在樣本數(shù)量相同的情況下,抽樣誤差較大。第四十頁,共四十九頁,2022年,8月28日5.多段抽樣

把抽樣分成幾個階段進行,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論