版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1/1第5章抽樣(8學(xué)時(shí))第一節(jié)抽樣的意義與作用一、抽樣的概念1.總體總體(population)通常與構(gòu)成它的元素共同定義:總體是構(gòu)成它的所有元素的集合,元素則是構(gòu)成總體的最基本單位。2.樣本樣本(sample)就是從總體中按一定方式抽取出的—部分元素的集合。或者說一個(gè)樣本就是總體的一個(gè)子集。3.抽樣明白了總體和樣本的概念,再來理解抽樣的概念就十分容易了。所謂抽樣(sampling),指的是從組成某個(gè)總體的所有元素的集合中,按一定的方式選擇或抽取一部分元素(即抽取總體的一個(gè)子集)的過程,或者說,抽樣是從總體中按一定方式選擇成抽取樣本的過程。4.抽樣單位抽樣單位(samplingunit)就是一次直接的抽樣所使用的基本單位。抽樣單位與構(gòu)成總體的元素有時(shí)是相同的,有時(shí)又是不同的。5.抽樣框抽樣框(samplingframe)又稱做抽樣X圍,它指的是一次直接抽樣時(shí)總體中所有抽樣單位的。6.參數(shù)值參數(shù)值(parameter)也稱為總體值,它是關(guān)于總體中某一變量的綜合描述,或者說是總體中所有元素的某種特征的綜合數(shù)量表現(xiàn)。在統(tǒng)計(jì)中最常見的總體值是某一變量的平均值,7.統(tǒng)計(jì)值統(tǒng)計(jì)值(statistic)也稱為樣本值,它是關(guān)于樣本中某一變量的綜合描述,或者說是樣本中所有元素的某種特征的綜合數(shù)量表現(xiàn)。樣本值是從樣本的所有元素中計(jì)算出來的,它是相應(yīng)的總體值的估計(jì)量。二、抽樣的作用在社會(huì)研究中,抽樣主要解決的是對(duì)象的選取問題,即如何從總體中選出一部分對(duì)象作為總體的代表的問題。本章一開始我們就說過,一項(xiàng)社會(huì)研究若能對(duì)總體中的全部個(gè)體都進(jìn)行了解,那當(dāng)然是很好的。但實(shí)際上廣大研究人員在時(shí)間、經(jīng)費(fèi)、人力等方面遇到難題,甚至陷入困境,從而不得不在龐大的總體與有限的時(shí)間、人力、經(jīng)費(fèi)這二者之間尋求平衡。以現(xiàn)代統(tǒng)計(jì)學(xué)和概率論為基礎(chǔ)的現(xiàn)代抽樣理論,以及不斷發(fā)展、不斷完善的各種抽樣方法.正好適應(yīng)了社會(huì)研究的發(fā)展和應(yīng)用的需要,成為社會(huì)研究知識(shí)體系中必不可少的一部分內(nèi)容??梢哉f,抽樣方法是架在研究者十分有限的人力、財(cái)力和時(shí)間與龐雜、廣闊、紛繁、多變的社會(huì)現(xiàn)象之間的一座橋梁。有了它的幫助,研究者可以方便地從較小的部分達(dá)到很大的整體。三、抽樣的類型根據(jù)抽取對(duì)象的具體方式,我們把抽樣分為各種不同的類型。從大的方面看,各種抽樣都可以歸為概率抽樣與非概率抽樣兩大類。這是兩種有著本質(zhì)區(qū)別的抽樣類型。本章的大部分內(nèi)容將主要涉及概率抽樣的方法,因?yàn)樗悄壳坝玫米疃?、也是最有用處的抽樣類型。而?duì)于非概率抽樣方法的介紹只占很小的篇幅。在概率抽樣與非概率抽樣兩大類中,還可細(xì)分出若干不同的形式,具體情況見圖5—1。簡(jiǎn)單隨機(jī)抽樣系統(tǒng)抽樣概率抽樣分層抽樣整群抽樣抽樣方法多段抽樣偶遇抽樣非概率抽樣判斷抽樣定額抽樣雪球抽樣圖5—1第二節(jié)概率抽樣的原理與程序一、概率抽樣的基本原理抽樣的最終目的在于通過對(duì)樣本的統(tǒng)計(jì)值的描述來相對(duì)準(zhǔn)確地勾畫出總體的面貌。概率抽樣的方法可以幫助我們實(shí)現(xiàn)這一目標(biāo),并量可以對(duì)這種勾畫的準(zhǔn)確程度作出估計(jì)。隨機(jī)抽取是這一過程的關(guān)鍵。所謂隨機(jī)抽取,就是保證總體中的每一個(gè)個(gè)體都有同等的機(jī)會(huì)入選樣本?;蛘哒f,總體中的每一個(gè)成員被抽中的概率相等(也即被抽中的機(jī)會(huì)相等)。而且,任何一個(gè)個(gè)體的人選與否,與其他個(gè)體毫不相關(guān),互不影響?;蛘哒f,每一個(gè)個(gè)體的抽取都是相互獨(dú)立的,是一種隨機(jī)事件。為了理解事件的隨機(jī)性與事件發(fā)生的概率之間的關(guān)系,最好的例子也許是投擲硬幣。二、抽樣的一般程序雖然不同的抽樣方法具有不同的操作要求,但它們通常都要經(jīng)歷這樣幾個(gè)步驟。1.界定總體界定總體就是在具體抽樣前,首先對(duì)從中抽取樣本的總體X圍與界限作明確的界定。這一方面是由抽樣的目的所決定的。因?yàn)槌闃与m然只對(duì)總體中的一部分個(gè)體實(shí)施,但其目的卻是為了描述和認(rèn)識(shí)總體的狀況與特征,是為了發(fā)現(xiàn)總體中存在的規(guī)律性,因此必須事先明確總體的X圍;另一方面,界定總體也是達(dá)到良好的抽樣效果的前提條件。如果不清楚明確地界定總體的X圍與界限,那么,即使采用嚴(yán)格的抽樣方法,也可能抽出總體嚴(yán)重缺乏代表性的樣本來。2.制定抽樣框這一步驟的任務(wù)就是依據(jù)已經(jīng)明確界定的總體X圍,收集總體中全部抽樣單位的,并通過對(duì)進(jìn)行統(tǒng)一編號(hào)來建立起供抽樣使用的抽樣框。需要注意的是,當(dāng)抽樣是分幾個(gè)階段、在幾個(gè)不同的抽樣層次上進(jìn)行時(shí),則要分別建立起幾個(gè)不同的抽樣框。3.決定抽樣方案從前面有關(guān)抽樣類型的介紹中,我們已經(jīng)了解到具體的抽樣方法有好幾種。而從后面對(duì)這些方法的介紹中我們將會(huì)看到.各種不同的抽樣方法都有自身的特點(diǎn)和適用X圍。因此,對(duì)于具有不向研究目的、不同X圍、不同對(duì)象和不同客觀條件的社會(huì)研究來說,所適用的抽樣方法也不一樣。這就需要我們?cè)诰唧w實(shí)施抽樣之前,依據(jù)研究的目的要求、依據(jù)各種抽樣方法的特點(diǎn),以及其他有關(guān)因素來決定具體采用哪種抽樣方法。除了抽樣方法的確定以外,還要根據(jù)要求確定樣本的規(guī)模以及主要目標(biāo)量的精確程度。4.實(shí)際抽取樣本實(shí)際抽取樣本的工作就是在上述幾個(gè)步驟的基礎(chǔ)上,嚴(yán)格按照所選定的抽樣方法,從抽樣框中抽取一個(gè)個(gè)的抽樣單位,構(gòu)成樣本。依據(jù)抽樣方法的不同,以及依據(jù)抽樣框是否可以事先得到等因素,實(shí)際的抽樣工作既可能在研究者到達(dá)實(shí)地之前就完成,也可能需要到達(dá)實(shí)地后才能完成。即既可能先抽好樣本,再下去直接對(duì)預(yù)先抽好的對(duì)象進(jìn)行調(diào)查或研究;也可能一邊抽取樣本一邊就開始調(diào)查或研究。5.評(píng)估樣本質(zhì)量一般情況下,樣本的抽出并不是抽樣過程的結(jié)束。完整的抽樣過程還應(yīng)包括樣本抽出后對(duì)樣本進(jìn)行的評(píng)估工作。所謂樣本評(píng)估,就是對(duì)樣本的質(zhì)量、代表性、偏差等等進(jìn)行初步的檢驗(yàn)和衡量,其目的是防止由于樣本的偏差過大而導(dǎo)致的失誤。評(píng)估樣本的基本方法是:將可得到的反映總體中某些重要特征及其分布的資料與樣本中的同類指標(biāo)的資料進(jìn)行對(duì)比。若二者之間的差別很小,則可認(rèn)為樣本的質(zhì)量較高,代表性較大;反之,若二者之間的差別十分明顯,那么樣本的質(zhì)量和代表性就一定不會(huì)很高。三、抽樣設(shè)計(jì)的原則(1)目的性原則是指在進(jìn)行抽樣方案設(shè)計(jì)時(shí),要以課題研究的總體方案和研究的目標(biāo)為依據(jù)。以研究的問題為出發(fā)點(diǎn),從最有利于研究資料的獲取,以及最符合研究的目的等因素來考慮抽樣方案和抽樣方法的設(shè)計(jì)。(2)可測(cè)性原則指的是抽樣設(shè)計(jì)能夠從樣本自身計(jì)算出有效的估計(jì)值或者抽樣變動(dòng)的近似值。在研究中通常用標(biāo)準(zhǔn)誤來表示。這是統(tǒng)計(jì)推斷必需的基礎(chǔ),是樣本結(jié)果與未知的總體值之間客觀、科學(xué)的橋梁。(3)可行性原則是指研究者所設(shè)計(jì)的抽樣方案必須在實(shí)踐上切實(shí)可行。它意味著研究者所設(shè)計(jì)的方案能夠預(yù)料實(shí)際抽樣過程中所可能出現(xiàn)的各種問題,井設(shè)計(jì)了處理這些問題的方法。由于在理論上設(shè)計(jì)抽樣方案和在實(shí)際中執(zhí)行這一方案是兩碼事,因而可行性是抽樣設(shè)計(jì)的一條重要標(biāo)準(zhǔn)。(4)經(jīng)濟(jì)性原則主要指的是抽樣方案的設(shè)計(jì)要與研究的可得資源相適應(yīng)。這種資源主要包括研究的經(jīng)費(fèi)、時(shí)間、人力等等。由于這四條標(biāo)準(zhǔn)相互之間存在著一定的制約關(guān)系,甚至?xí)嗷_突,因而在實(shí)際設(shè)計(jì)中,常常存在這樣的情況,即研究者很難設(shè)計(jì)出一個(gè)在上述四個(gè)原則上同時(shí)達(dá)到最大值的抽樣方案。在更多的情況下,實(shí)際的抽樣設(shè)計(jì)就成為研究者在這四條標(biāo)準(zhǔn)中進(jìn)行取舍和保持平衡的過程。第三節(jié)概率抽樣方法概率抽樣是按照概率原理進(jìn)行的,它要求樣本的抽取具有隨機(jī)性。下面我們就結(jié)合這些因素對(duì)常用的幾種概率抽樣方法逐一進(jìn)行介紹。一、簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣又稱純隨機(jī)抽樣,是概率抽樣的最基本形式。它是按等概率原則直接從含有N個(gè)元素的總體中隨機(jī)抽取n個(gè)元素組成樣本(N>n)。常用的辦法類似于抽簽,即把總體的每一個(gè)單位都編號(hào),將這些寫在一XX小紙條上.然后放入一容器如紙盒、口袋中,攪拌均勻后,從中任意抽取,直到抽夠預(yù)定的樣本數(shù)目。這樣,由抽中的所代表的元素組成的就是一個(gè)簡(jiǎn)單隨機(jī)樣本。對(duì)于總體元素很多的情形,我們則采用隨機(jī)數(shù)表來抽樣。我們書后就附有一X隨機(jī)數(shù)表,其中的數(shù)碼和排列都是隨機(jī)形成的,沒有任何—點(diǎn)規(guī)律性(故也稱為亂數(shù)表)。利用隨機(jī)數(shù)表進(jìn)行抽樣的具體步驟是:(1)先取得一份總體所有元素的(即抽樣框);(2)將總體中所有元素一一按順序編號(hào);(3)根據(jù)總體規(guī)模是幾位數(shù)來確定從隨機(jī)數(shù)表中選幾位數(shù)碼;(4)以總體的規(guī)模為標(biāo)準(zhǔn),對(duì)隨機(jī)數(shù)表中的數(shù)碼逐一進(jìn)行衡量并決定取舍;(5)根據(jù)樣本規(guī)模的要求選擇出足夠的數(shù)碼個(gè)數(shù);(6)依據(jù)從隨機(jī)數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對(duì)應(yīng)的元素。二、系統(tǒng)抽樣系統(tǒng)抽樣又稱等距抽樣或機(jī)械抽樣。它是把總體中的單位進(jìn)行編號(hào)排序后,再計(jì)算出某種間隔,然后按這一固定的間隔來抽取個(gè)體組成樣本的方法。它和簡(jiǎn)單抽樣一樣,需要有完整的抽樣框,是直接從總體中抽取個(gè)體,而無其他中間環(huán)節(jié)。系統(tǒng)抽樣的具體步驟是:(1)給總體中的每一個(gè)個(gè)體按順序編號(hào),制定出抽樣框。(2)計(jì)算出抽樣間距。計(jì)算方法是用總體的規(guī)模除以樣本的規(guī)模。假設(shè)總體規(guī)模為N,樣本規(guī)模為n,那么抽樣間距K就由下列公式求得;K(抽樣間距)=N(總體規(guī)模)/n(樣本規(guī)模)(3)在最前面的K個(gè)個(gè)體中,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取一個(gè)個(gè)體,記下這個(gè)個(gè)體的編號(hào)(假設(shè)所抽取的這個(gè)個(gè)體的編號(hào)為A),它稱做隨機(jī)的起點(diǎn)。(4)在抽樣框中,自A開始,每隔K個(gè)個(gè)體抽取一個(gè)個(gè)體,即所抽取個(gè)體的編號(hào)分別為A,A十K,A十2K,…,A十(n一1)K。(5)將這n個(gè)個(gè)體合起來,就構(gòu)成了該總體的一個(gè)樣本。值得注意的是,系統(tǒng)抽樣的一個(gè)十分重要的前提條件,是總體中個(gè)體的排列,相對(duì)于研究的變量來說,應(yīng)是隨機(jī)的,即不存在某種與研究變量相關(guān)的規(guī)則分布。因此,我們?cè)谑褂孟到y(tǒng)抽樣方法時(shí),一定要注意抽樣框的編制方法。特別要注意下列兩種情況:一是總體中,個(gè)體的排列具有某種次序上的先后、等級(jí)上的高低的情況。二是總體中,個(gè)體的排列上有與抽樣間隔相對(duì)應(yīng)的周期性分布的情況。無論是哪種情況,都不符合總體的全面情況,都是一個(gè)有著嚴(yán)重偏差的樣本。三、分層抽樣1.分層抽樣的概念分層抽樣又稱類型抽樣,它是先將總體中的所有單位按某種特征或標(biāo)志(如性別、年齡、職業(yè)或地域等)劃分成若干類型或?qū)哟?,然后再在各個(gè)類型或?qū)哟沃胁捎煤?jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣的辦法抽取一個(gè)子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。2.分層抽樣的優(yōu)點(diǎn)分層抽樣方法的一個(gè)優(yōu)點(diǎn),就是在不增加樣本規(guī)模的前提下降低抽樣誤差,提高抽樣的精度。另一個(gè)優(yōu)點(diǎn),就是非常使于了解總體內(nèi)不同層次的情況,以及對(duì)總體小不同的層次進(jìn)行單獨(dú)研究,或者進(jìn)行比較。3.分層抽樣的運(yùn)用在實(shí)際運(yùn)用分層抽樣的方法時(shí),研究者需要考慮下列兩個(gè)方面的問題:(1)分層的標(biāo)準(zhǔn)問題。同一個(gè)總體可以按照不同的標(biāo)準(zhǔn)進(jìn)行分層,或者說,根據(jù)不同的標(biāo)準(zhǔn)可以將一個(gè)總體分成不同的類別或?qū)哟巍D敲?,在?shí)際抽樣中究竟應(yīng)該按什么標(biāo)準(zhǔn)來分層呢?通常采用的原則有:第一.以所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。第二,以保證各層內(nèi)部同質(zhì)性強(qiáng)、各層之間異質(zhì)性強(qiáng)、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。第三,以那些已有明顯層次區(qū)分的變量作為分層變量。(2)分層的比例問題。分層抽樣中有按比例和不按比例分層兩種方法。按比例分層抽樣是指按各種類型或?qū)哟沃械膯挝粩?shù)目同總體單位數(shù)目間的比例來抽取子樣本的方法。采取按比例分層抽樣的方法,可以確保得到一個(gè)與總體結(jié)構(gòu)完全一樣的樣本。但是,在有些情況下,又不宜采用這種方法。例如,有時(shí)總體中有的類型或?qū)哟蔚膯挝粩?shù)目太少,若以按比例分層的方法抽樣,則有的層次在樣本中個(gè)案太少,個(gè)便于了解各個(gè)層次的情況,這時(shí)往往要采取不按比例抽樣的方法。四、整群抽樣整群抽樣與前幾種抽樣的最大差別在于,它的抽樣單位不是單獨(dú)的個(gè)體,而是成群的個(gè)體。它是從總體中隨機(jī)抽取—些小的群體,然后由所抽出的若干個(gè)小群體內(nèi)的所有元素構(gòu)成的樣本。這種小的群體可以是居民家庭、可以是學(xué)校中的班級(jí)、也可以是工廠中的車間、還可以是城市中的居委會(huì)等等。整群抽樣小對(duì)小群體的抽取可采用簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣或分層抽樣的方法。采取整群抽樣的方法,不僅可以簡(jiǎn)化抽樣的過程,更重要的是它可以降低收集資料的費(fèi)用,同時(shí)還能相對(duì)地?cái)U(kuò)大抽樣的應(yīng)用X圍。許多較大規(guī)模的社會(huì)研究往往從節(jié)省經(jīng)費(fèi)、人力以及從研究的可行性等方面考慮,而采用整群抽樣的方法。但是,應(yīng)該看到,整群抽樣所具有的簡(jiǎn)便易行、節(jié)省費(fèi)用的優(yōu)點(diǎn),是以其樣本的分布面不廣、樣本對(duì)總體的代表性相對(duì)較差等缺點(diǎn)為代價(jià)的。整群抽樣方法的運(yùn)用,尤其要與分層抽樣的方法相區(qū)別。當(dāng)某個(gè)總體是由若干個(gè)有著自然界限和區(qū)分的子群(或類別、層次)所組成,同時(shí),不同子群相互之間差別很大、而每個(gè)子群內(nèi)部的差異不大時(shí),則適合子分層抽樣的方法;反之,當(dāng)不同子群相互之間差別不大、而每個(gè)子群內(nèi)部的異質(zhì)性程度比較大時(shí),則特別適合采用整群抽樣的方法。五、多段抽樣多段抽樣又稱多級(jí)抽樣或分段抽樣,它是按抽樣元索的隸屬關(guān)系或?qū)哟侮P(guān)系.把抽樣過程分為幾個(gè)階段進(jìn)行。在社會(huì)研究中,當(dāng)總體的規(guī)模特別大,或者總體分布X圍特別廣時(shí),研究者一般采取多段抽樣的方法來抽取樣本。多段抽樣的具體做法是:先從總體中隨機(jī)抽取若干大群(組),然后再?gòu)倪@幾個(gè)大群(組)內(nèi)抽取幾個(gè)小群(組),這樣一層層抽下來,直至抽到最基本的抽樣元素為止。在運(yùn)用多段抽樣方法時(shí),有一點(diǎn)需要注意,就是要在類別和個(gè)體之間保持平衡。或者說,保持合適的比例。舉例來說,假設(shè)某市共有2.4萬名教師,他們分布在全市10個(gè)區(qū)的200所學(xué)校中?,F(xiàn)在要抽取一個(gè)由1200名教師組成的樣本。如果按照三階段抽樣的方法,我們就可以有下列各種不同的抽樣選擇(見表5-3)。表5-3第一階段第二階段第三階段方案1方案2方案3方案4方案5方案6方案7方案8方案9抽10個(gè)區(qū)抽2個(gè)區(qū)抽10個(gè)區(qū)抽8個(gè)區(qū)抽5個(gè)區(qū)抽4個(gè)區(qū)抽3個(gè)區(qū)抽2個(gè)區(qū)抽1個(gè)區(qū)每個(gè)區(qū)抽4所學(xué)校每個(gè)區(qū)抽20所學(xué)校每個(gè)區(qū)抽20所學(xué)校每個(gè)區(qū)抽15所學(xué)校每個(gè)區(qū)抽12所學(xué)校每個(gè)區(qū)抽10所學(xué)校每個(gè)區(qū)抽10所學(xué)校每個(gè)區(qū)抽10所學(xué)校每個(gè)區(qū)抽20所學(xué)校每所學(xué)校抽30名教師每所學(xué)校抽30名教師每所學(xué)校抽6名教師每所學(xué)校抽10名教師每所學(xué)校抽20名教師每所學(xué)校抽30名教師每所學(xué)校抽40名教師每所學(xué)校抽60名教師每所學(xué)校抽50名教師究竟該選擇哪一種抽樣方案呢?或者說,如何確定每一階段抽樣的單位數(shù)目呢?主要考慮的因素有兩方面:(1)各個(gè)抽樣階段中的子總體同質(zhì)性程度。同質(zhì)性程度越高的子總體,所抽的規(guī)模就應(yīng)相對(duì)小一點(diǎn);反之,則應(yīng)大一點(diǎn)。(2)要考慮研究各所擁有的人力和經(jīng)費(fèi)。一般來說,在其他條件不變的情況下,樣本所覆蓋的面越大,樣本的代表性也越大。因此,如果僅從這方面考慮,則“大的類別中抽取單元相對(duì)較多,而每一單元中抽取個(gè)體相對(duì)較少”的做法效果較好(即方案3最好,依次遞減,方案9最差)。但是,抽樣時(shí)我們還應(yīng)從實(shí)踐的角度來進(jìn)行衡量。抽的區(qū)越多、抽的學(xué)校越多,同時(shí)也意味著收集資料時(shí),調(diào)查員要奔波的X圍越廣、所需要的時(shí)間、經(jīng)費(fèi)越多。而這則是研究者往往最不愿意看到的。所以,如果從這方面來考慮,則“大的類別中相對(duì)較少,而每一類中抽取的個(gè)體相對(duì)較多”的做法效果較好(即方案9最好,依次遞減,方案3最差)。多段抽樣的方法適用于總體X圍特別大、對(duì)象的層次特別多的社會(huì)研究。第四節(jié)戶內(nèi)抽樣與PPS抽樣一、戶內(nèi)抽樣的方法當(dāng)研究者以家庭作為分析單位,以入戶訪談的方法收集資料,試圖研究城鄉(xiāng)家庭的結(jié)構(gòu)、關(guān)系、生活方式或其他內(nèi)容時(shí),他們往往采用多段抽樣的方法從某一市(縣)中抽取區(qū)(鄉(xiāng)),再?gòu)膮^(qū)(鄉(xiāng))中抽取街(村),從街(村)中抽取居委會(huì)(居民組),然后從居委會(huì)(居民組)中抽取家庭戶,最后從家庭戶中抽取一位成年人作為訪談對(duì)象。在這種研究中,我們不僅需要抽出家庭戶的樣本,同時(shí)還要進(jìn)行戶內(nèi)抽樣——從所抽中的每戶家庭中抽取一個(gè)成年人,以構(gòu)成訪談對(duì)象的樣本。在抽取家庭中的成年人之前的每個(gè)抽樣階段中,我們可以采用前面所介紹的某種方法來抽。而這最后一個(gè)階段的抽樣則可以采取一種被稱做“Kish選擇法”的方式進(jìn)行。根據(jù)這種方法,每戶家庭中所有的成年人(比如說18歲以上者)都具有同等的被選中的概率(機(jī)會(huì))。Kish從方法的具體做法是:研究者先將調(diào)查表分為(編號(hào)為)A、Bl、B2、C、D、E1、E2、F八種,每種表的數(shù)目分別占調(diào)查表總數(shù)的1/6、1/12、1/12、1/6、l/6、1/12、1/12、1/6。同時(shí),印制若干套(一套八種)“選擇卡”發(fā)給調(diào)查員,每人一套?!斑x擇卡”的形式如表5—4。表5-4Kish選擇表A式選擇表B1式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為123456或以上111111123456或以上111122B2式選擇表C式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為123456或以上111222123456或以上112233D式選擇表E1式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為123456或以上122344123456或以上123335E2式選擇表F式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為123456或以上122455123456或以上123456調(diào)查員首先要對(duì)每戶家庭中的成年人進(jìn)行排序和編號(hào),排序的方法是男性在前,女性在后;年紀(jì)大的在前,年紀(jì)小的在后,即最年長(zhǎng)的男性排第一,次年長(zhǎng)的男性排第二,以此類推;最年長(zhǎng)的女性排在最年幼男性后面,其他女性也按年紀(jì)從大到小接著排列,如表5—5。表5-5家庭內(nèi)成年人排序表序號(hào)年齡和性別特征12…nn+1n+2…n+m最年長(zhǎng)的男性次年長(zhǎng)的男性…最年幼的男性最年長(zhǎng)的女性次年長(zhǎng)的女性…最年幼的女性然后,調(diào)查員按照調(diào)查表上的編號(hào)找出編號(hào)相同的那種“選擇表”,根據(jù)家庭人口數(shù)目從“選擇表”中查出該選個(gè)體的序號(hào),最后對(duì)這一序號(hào)所對(duì)應(yīng)的那個(gè)家庭成員進(jìn)行訪談。比如,某家庭18歲以上的成年人共有四人:祖母、父親、母親、兒子。其排序則為:1.父親;2.兒子;3.祖母:4.母親。若調(diào)查表為A類,則抽取父親;若調(diào)查表為B2類,則抽取兒子;若調(diào)查表為D類,則應(yīng)抽取祖母,而調(diào)查表為F類時(shí),則就抽取母親。二、PPS抽樣以上所介紹的抽樣方法有一個(gè)共同的特點(diǎn):總體(或子總體)中的每一個(gè)元素都具有同等的被抽中的概率。如果總體中每個(gè)元素的“大小”基本相同,或者每一個(gè)元素在總體中的地位或重要性相差不多,則這種基于同等概率的抽樣是合適的。但當(dāng)元素的大小不同,或者元素在總體中的地位不同時(shí),則需要采用不等概率抽樣的方法。比如,從全市幾百家企業(yè)中抽取20家企業(yè)進(jìn)行調(diào)查時(shí),一個(gè)有著數(shù)萬職工的大型企業(yè)與一個(gè)只有一二百人的小企業(yè)所占的地位,顯然是很不一樣的。如果此時(shí)仍然采用等概率抽樣的方法,則樣本的代表性和精度都會(huì)比較差。而如果采用不等概率抽樣的方法,使大的企業(yè)入選樣本的概率大,小的企業(yè)入選樣本的概率小,這樣就可以大大提高估計(jì)的精度。社會(huì)研究中重要、也最常用的一種不等概率抽樣叫做“概率與元素的規(guī)模大小成比例的抽樣”,簡(jiǎn)稱PPS抽樣。第五節(jié)非概率抽樣方法在社會(huì)研究中,人們有時(shí)還采用非概率抽樣的辦法來選取樣本。非概率抽樣不是按照概率均等的原則,而是根據(jù)人們的主觀經(jīng)驗(yàn)或其他條件來抽取樣本。因而,其樣本的代表性往往較小,誤差有時(shí)相當(dāng)大,而且這種誤差又無法估計(jì)。所以,在大規(guī)模的正式研究中,一般很少用非概率抽樣,常常只是在探索性研究中采用。常用的非概率抽樣有以下幾種。一、偶遇抽樣偶遇抽樣又稱做方便抽樣或自然抽樣,是指研究者根據(jù)現(xiàn)實(shí)情況,以自己方便的形式抽取偶然遇到的人作為對(duì)象,或者僅僅選擇那些離得最近的、最容易找到的人作為對(duì)象。這種碰到誰就選誰的抽樣方法往往被有些人誤認(rèn)為就是隨機(jī)抽樣。僅從表面上看,二者的確有些相似,都排除了主觀因素的影響,純粹依靠客觀機(jī)遇來抽取對(duì)象、但二者有一個(gè)根本的差別,這就是偶遇抽樣沒有保證總體中的每一個(gè)成員都具有同等的被抽中的概率。那些最先被碰到的、員容易見到的、最方便找到的對(duì)象具啊比其他對(duì)象大得多的機(jī)會(huì)被抽中。正是這一點(diǎn)使我們不能依賴偶遇抽樣得到的樣本來推論總體。二、判斷抽樣判斷抽樣又稱立意抽樣,它是研究者根據(jù)研究的目標(biāo)和自己主觀的分析來選擇和確定研究對(duì)象的方法。這種抽樣首先要確定抽樣標(biāo)準(zhǔn)。由于標(biāo)準(zhǔn)的確定帶有較大的主觀性,所以,此法的運(yùn)用結(jié)果如何往往與研究者的理論修養(yǎng)、實(shí)際經(jīng)驗(yàn)以及對(duì)對(duì)象的熟悉程度有很大關(guān)系。判斷抽樣的主要優(yōu)點(diǎn)在于可以充分發(fā)揮研究人員的主觀能動(dòng)作用,特別是當(dāng)研究者對(duì)研究總體的情況比較熟悉、研究者的分析判斷能力較強(qiáng)、研究方法與技術(shù)十分熟練、研究的經(jīng)驗(yàn)比較豐富時(shí),采用這種方法往往十分方便。但是由于它仍然屬于一種非概率抽樣,所以,其所得樣本的代表性往往難以判斷。在實(shí)際中,這種抽樣多用于總體規(guī)模小、所涉及的X圍較窄、或時(shí)間、人力等條件有限而難以進(jìn)行大規(guī)模抽樣的情況。三、定額抽樣定額抽樣又稱做配額抽樣,它是一種比偶遇抽樣復(fù)雜一些的非概率抽樣方法。進(jìn)行定額抽樣時(shí),研究者要盡可能地依據(jù)那些有可能影響研究變量的因素來對(duì)總體分層,并找出具有各種不同特征的成員在總體中所占的比例,然后依據(jù)這種劃分以及各類成員的比例去選擇對(duì)象,使樣本中的成員在上述各種因素、各種特征方面的構(gòu)成及其在樣本中的比例都盡量接近總體。如果把各種因素或各種特征看作不同的變數(shù)的話,那么,定額抽樣實(shí)際上就是依據(jù)這些變數(shù)的組合。許多書中都談到定額抽樣與分層抽樣十分相似,或把定額抽樣稱為分層抽樣在非概率抽樣中的對(duì)應(yīng)詞。實(shí)際上,二者同樣具有本質(zhì)上的差別。二者雖然都依據(jù)某些特征對(duì)總體進(jìn)行分層,但二者的目的不同,抽樣方法也不同。四、雪球抽樣雪球抽樣是一種極特殊的抽樣方法。當(dāng)我們無法了解總體情況時(shí),可以從總體中少數(shù)成員入手,對(duì)他們進(jìn)行調(diào)查,向他們?cè)儐栠€知道哪些符合條件的人;再去找那些人并再詢問他們知道的人。如同滾雪球一樣,我們可以找到越來越多具有相同性質(zhì)的群體成員。如果總體不大,有時(shí)用不了幾次就會(huì)接近飽和狀況,即后訪問的人再介紹的都是已經(jīng)訪問過的人。第六節(jié)樣本規(guī)模與抽樣誤差一、樣本規(guī)模樣本規(guī)模又稱為樣本容量,它指的是樣本中所含個(gè)案的多少。確定樣本規(guī)模也是每一項(xiàng)具體的社會(huì)研究所必須解決的問題之一。統(tǒng)計(jì)學(xué)中通常以30為界,把樣本分為大樣本(30個(gè)個(gè)案及以上)和小樣本(30個(gè)個(gè)案以下)。之所以這樣區(qū)分,是因?yàn)楫?dāng)樣本規(guī)模大于30時(shí),其平均值的分布將接近于正態(tài)分布。從而許多統(tǒng)計(jì)學(xué)的公式就可以運(yùn)用,也可以用樣本的資料對(duì)總體進(jìn)行推論。但是,需要注意的是.30個(gè)個(gè)案的樣本對(duì)于社會(huì)研究來說卻常常是不夠的。統(tǒng)計(jì)學(xué)中的大樣本與社會(huì)研究中的大樣本并不是一回事。根據(jù)一些社會(huì)研究專家的看法,社會(huì)研究中的樣本規(guī)模至少不能少于100個(gè)個(gè)案。在95%的置信度條件下(t=1.96)計(jì)算出不同抽樣誤差所對(duì)應(yīng)的最小樣本量規(guī)模見表5-8(為計(jì)算簡(jiǎn)便,取t=2)。表5-895%置信水平下不同抽樣誤差所要求的樣本規(guī)模容許的抽樣誤差(%)樣本規(guī)模n容許的抽樣誤差(%)樣本規(guī)模n1.01.52.02.53.03.54.04.55.01000045002500160011008166254944005.56.06.57.07.58.08.59.09.510.0330277237204178156138123110100二、影響樣本規(guī)模確定的因素一般情況下,社會(huì)研究中樣本規(guī)模的確定主要受到以下四個(gè)方面因素的影響:(1)總體的規(guī)模;(2)估計(jì)的精確性要求;(3)總體的異質(zhì)性程度;(4)研究者所擁有的經(jīng)費(fèi)、人力和時(shí)間。1.總體的規(guī)模樣本規(guī)模與總體規(guī)模有關(guān),這不難理解。按一般的想法,總體越大時(shí),則樣本也要越大,這樣才能保證一定的精確度。但是,這種想法只在一定的程度上是正確的。當(dāng)總體規(guī)模大到一定程度時(shí),樣本規(guī)模的增加與它并不保持同等的增長(zhǎng)速度。在其他有關(guān)因素一定時(shí),樣本規(guī)模的增加速度大大低于總體規(guī)模的增加速度。換句話說,當(dāng)總體規(guī)模達(dá)到一定程度時(shí),樣本規(guī)模的改變量是很小的。2.抽樣的精確性抽樣的目的往往是要從樣本去推論總休。影響樣本規(guī)模確定的第二個(gè)因素,就與這種推論的可靠性和精確性密切相關(guān)。在社會(huì)研究中,我們用置信度與置信區(qū)間兩個(gè)概念來說明樣本規(guī)模與抽樣的可靠性及精確性之間的關(guān)系。置信度又稱為置信水平,它指的是總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)間中的把握性程度。一般來說,在其他條件一定的情況下,置信度越高,即推論的把握件越大,則所要求的樣本規(guī)模就越大。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 膿皰型銀屑病的臨床護(hù)理
- JJF(陜) 013-2019 微量總有機(jī)碳分析儀校準(zhǔn)規(guī)范
- 《解讀自由基》課件
- 北師大版不等式課件
- 大班級(jí)風(fēng)采展示活動(dòng)策劃計(jì)劃
- 摻混肥相關(guān)行業(yè)投資規(guī)劃報(bào)告
- 充換電站相關(guān)行業(yè)投資方案范本
- 割灌機(jī)相關(guān)行業(yè)投資方案
- 課程研究小組的組織與管理計(jì)劃
- 提高員工歸屬感的措施計(jì)劃
- 平安建設(shè) 培訓(xùn) 課件
- 森林火災(zāi)的風(fēng)險(xiǎn)評(píng)估與分級(jí)管理課件
- 2024年湖北省初中學(xué)業(yè)水平考試物理?化學(xué)試題
- 跨文化交流與國(guó)際視野培養(yǎng)
- 醫(yī)院檢驗(yàn)科院感知識(shí)
- 小學(xué)語文部編版六年級(jí)上冊(cè)詞語表《看拼音寫詞語》專項(xiàng)練習(xí)(附參考答案)
- 2024高血壓健康知識(shí)講座
- 保密與項(xiàng)目管理
- 11《百年孤獨(dú)》練習(xí)(含答案)統(tǒng)編版高中語文選擇性必修上冊(cè)
- 結(jié)直腸癌中西醫(yī)結(jié)合治療
- 京東物流部管理制度
評(píng)論
0/150
提交評(píng)論