四章節(jié)抽樣調(diào)查電子教案_第1頁
四章節(jié)抽樣調(diào)查電子教案_第2頁
四章節(jié)抽樣調(diào)查電子教案_第3頁
四章節(jié)抽樣調(diào)查電子教案_第4頁
四章節(jié)抽樣調(diào)查電子教案_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第四章抽樣調(diào)查抽樣與抽樣調(diào)查抽樣調(diào)查的優(yōu)越性抽樣的一般程序概率抽樣方法非概率抽樣方法樣本容量的確定一、抽樣與抽樣調(diào)查是一種選擇調(diào)查對象的程序和方法:從研究對象的整體中選出一部分代表加以調(diào)查研究,然后用所得結果推論和說明總體的特性。日常生活中的抽樣調(diào)查同質(zhì)性總體和異質(zhì)性總體抽樣的代表性問題概率論和數(shù)理統(tǒng)計學中理論證明:遵循隨機原則的概率抽樣可以保證抽選出有一定代表性的樣本,并能夠通過計算估計樣本與總體間誤差的大小以及這種估計的可信程度。

大數(shù)中心極限定理:在含有N個元素且平均數(shù)為,標準差為的總體中,抽取所有可能含有n個元素的樣本,則所有可能的樣本數(shù)目為。若用來分別表示這m個樣本的平均數(shù),那么樣本平均數(shù)的分布將是一個隨n越大越趨于具有平均數(shù)和標準差的正態(tài)分布。二、抽樣調(diào)查的必要性與優(yōu)越性必要性:1、現(xiàn)實生活中有些研究總體是不可能進行全面調(diào)查調(diào)查,如對產(chǎn)品的報廢性質(zhì)量檢查(汽車碰撞試驗等)。2、節(jié)約人力、物力,因為對有些研究總體來說,調(diào)查全體與只調(diào)查部分代表沒有太大區(qū)別。3、對其他調(diào)查方法所得的資料的可信性的檢驗,尤其是對普查資料的修正與補充,必須進行抽樣調(diào)查。三、常用的抽樣概念與術語

研究總體與調(diào)查總體

分析單位與抽樣單位

抽樣框(抽樣范疇)

參數(shù)值與統(tǒng)計值

抽樣誤差與系統(tǒng)誤差(非抽樣誤差)置信水平與置信區(qū)間四、抽樣的一般程序1、界定總體(1)對總體的基本構成單位,所包含的內(nèi)容以及空間與時間范圍等做出規(guī)定的過程,同時也是確定調(diào)查對象的總體的過程。(2)選擇的標準A、理論方面考慮B、實踐方面考慮達到目標:調(diào)查員在現(xiàn)場能夠毫不猶豫的確定一個可疑情況是否屬于調(diào)查總體。

2、

編制抽樣框

總體按抽樣單位劃分的各個部分,這些部分必須互不重疊而且能夠合成總體,然后毫不遺漏的編號排列成表,每個抽樣單位唯一的與表上的一個號碼對應,成為一個完整的抽樣一覽表。對于不同類型的總體,抽樣框的形式也有不同??梢岳矛F(xiàn)成的花名冊,或者人口普查資料等。當范圍太大,沒有現(xiàn)成的抽樣框時,就要編制一個新的抽樣框,一般需要花費巨大的人力、物力。在復雜多階段抽樣中,相應的各個階段都需要有抽樣框。

3、

決定抽樣方案——對于不同研究目的,不同調(diào)查范圍、對象和客觀條件的社會調(diào)查,需要選擇合適的抽樣方法。還要根據(jù)調(diào)查的要求確定樣本規(guī)模及主要目標量的精確程度。

4、實際抽取樣本——嚴格按照所選定的抽樣方法,從抽樣框中抽取一個個抽樣單位,構成調(diào)查樣本。

5、

評估樣本質(zhì)量

對樣本的質(zhì)量、代表性、偏差等進行初步的檢驗和衡量,其目的是防止由于樣本的偏差過大而導致的調(diào)查失誤?;痉椒ǎ簩⒖傻玫降目傮w有關的特征及其分布的資料與樣本中的同類指標進行對比,若二者差別很小,則樣本質(zhì)量較高,代表性較大,反之樣本質(zhì)量不高。對樣本的評估分為兩個階段:A、正式調(diào)查前,對抽出的樣本進行評估B、調(diào)查結束后,計算抽樣誤差由樣本統(tǒng)計值推論總體參數(shù)值等

五、抽樣的類型六、概率抽樣1、簡單隨機抽樣(純隨機抽樣)

(1)是最基本的隨機抽樣,也是最常見的類型。按隨機的原則直接從含有N個單位的總體中,抽出M個單位作為樣本進行調(diào)查。嚴格遵從了使每個單位有同等被抽中的原則。

(2)具體做法A、抽簽法——將總體中每個單位的名稱或號碼,逐個填寫在卡片或簽條上,再放入同一容器中,打亂次序,進行攪拌,然后從中抽取,直到抽夠預定的樣本數(shù)目。

可分為:重復抽樣、不重復抽樣。抽簽法的優(yōu)點是簡單易行,缺點是當總體的容量非常大時,費時、費力,又不方便。如果標號的簽攪拌得不均勻,會導致抽樣不公平。

B、隨機數(shù)表法對于總體元素較多的情形,采用隨機數(shù)表抽樣隨機數(shù)表的特點:隨機數(shù)表中的數(shù)碼和排列都是隨機形成的,沒有任何規(guī)律性(也稱亂數(shù)表)。隨機數(shù)表如下圖所示(截取部分)步驟:先取得一份調(diào)查總體所有元素的名單(即抽樣框);將總體中所有元素一一按順序編號;根據(jù)總體規(guī)模是幾位數(shù)來確定從隨機數(shù)表中選幾位數(shù)碼;以總體的規(guī)模為標準,對隨機數(shù)表中的數(shù)碼逐一進行衡量并決定取舍;根據(jù)樣本規(guī)模的要求選擇出足夠的數(shù)碼個數(shù);依據(jù)從隨機數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對應的元素。例:某總體共有3000人,需要從中抽取200人作為樣本進行調(diào)查,試用隨機數(shù)表法進行抽樣。(2)簡單隨機抽樣方法適用對象:總體單位數(shù)目不大,總體單位之間差異程度較小的情況。簡單隨機抽樣一般不單獨使用。

(3)優(yōu)點:最符合抽樣的隨機原則,簡便易行。缺點:適用范圍較小。

2、系統(tǒng)抽樣(等距抽樣或機械抽樣)

定義:先把總體單位進行編號排序,然后計算出某種間隔,再按這一固定間隔抽取個體的號碼組成樣本。方法步驟

將總體的所有個體按一定順序排號,前后排列,制定抽樣框;計算抽樣間距:K(抽樣間距)=N(總體規(guī)模)/n(樣本規(guī)模)在前面的K個個體中,用簡單隨機抽樣的方法抽取一個個體,設其序號為A;自A開始,每隔K個個體抽取一個個體,則陸續(xù)抽取的個體所在位置序號為A,A+K,A+2K,……,A+(n-1)K。若抽到最后,仍不足所需樣本時,可再回頭累積抽??;將這n個個體和起來,就構成了該總體的一個樣本。例:某大學有12000名學生,采用系統(tǒng)抽樣的方法抽取200名學生作為樣本。優(yōu)點

A、與簡單隨機抽樣相比,系統(tǒng)抽樣易于實施,工作較少

B、樣本在總體中分布更平均,抽樣誤差小于或至多等于簡單隨機抽樣,結果更精確。缺點

A、較適用于同質(zhì)性較高的群體:若總體內(nèi)不同類別之間所含個體數(shù)目相差過于懸殊時,采用此種方法樣本的代表性可能較差。

缺點

B、當總體的排列出現(xiàn)有規(guī)律的分布時,就會使系統(tǒng)的抽樣誤差很大,降低了樣本的代表性(a)個體排列具有次序先后,等級高低(b)個體排列的分布周期與抽樣間隔相對應解決方法:認真考察總體的排列情況與抽樣的距離,如果原有的排列次序可能導致抽樣失敗的話,就應打亂原有的排列次序或改用其他抽樣方法。3、分層抽樣定義:先將總體依照一種或幾種特征分為幾個子總體(類、群),每個子總體稱為一層,然后從每一層中隨機抽取一個子樣本,將它們合在一起即為總體的樣本,稱為分層樣本。例:企業(yè)有3000人,抽取150人進行抽樣調(diào)查。可按性別、年齡或者二者結合,或者按照工人、干部、技術人員的分層標準分層的標準研究者一般選擇與調(diào)查中欲測變量高度相關的變量,即:對所要研究的變量有很大影響因素的變量作為分層變量。突出總體的內(nèi)在結構特征,從而使得同層次內(nèi)同質(zhì)性強,層間異質(zhì)性強。具有實用性。例如以那些已有明顯層次區(qū)分的變量作為分層變量。

性別、年齡、文化程度、職業(yè)等分層類型——按各層子樣本容量分類按比例分層抽樣——指按各種類型或?qū)哟沃械膯挝粩?shù)目同總體單位數(shù)目間的比例來抽取子樣本的方法。例:某廠有工人600名,按性別分層男女比例5:1,抽取60名工人。不按比例分層抽樣(非等概率抽樣)——主要用于了解一些層所代表的子總體的情況,而不是總體情況。總體中的某種類型或?qū)哟蔚膯挝粩?shù)目太少,若以按比例分層抽樣的方法,則有的層次在樣本中個案太少,不便于了解各個層次的情況。注意:推斷總體時,則需要先對各層的數(shù)據(jù)資料進行加權處理,使數(shù)據(jù)資料恢復到總體中各層實際的比例結構,否則會導致推斷的偏誤。優(yōu)點當一個總體內(nèi)部分層明顯時,分層抽樣能夠克服簡單的缺點。了解總體的不同層次的情況。分層抽樣可以提高總體參數(shù)估計值的精確度。

4、整群抽樣定義:——將總體按照某種標準劃分為若干子群體,每個子群體為一個抽樣單位,用隨機的方法,抽取若干個子群體,將所有抽取的子群體合起來作為總體的樣本。與前幾種抽樣的最大差別就是抽樣單位不是單個的個體,而是成群的個體。

優(yōu)點

a、可以通過轉換抽樣單位,擴大抽樣的應用范圍。

b、可以節(jié)省人力、物力、財力。缺點:

a、樣本分布不均勻,樣本總體的代表性較差。

b、與其它抽樣相比,在樣本數(shù)相同時,抽樣誤差較大。有數(shù)據(jù)表明容量為800的整群抽樣在效率上相當于容量為500的簡單隨機抽樣。

與分層抽樣的異同點都是根據(jù)某種標準將總體分為若干個子群體。子群體的劃分原則不同。分層抽樣:層間異質(zhì)性強,層內(nèi)同質(zhì)性強。整群抽樣:反之。抽樣方式不同。分層抽樣:所有子群體均要抽取一個樣本,作為總體的一部分,即總體樣本在各層中均有分布。整群抽樣:將所有子群體作為樣本總體,抽取若干個子群體。適用范圍不同分層抽樣:適用于界質(zhì)分明的總體。整群抽樣:適用于界質(zhì)不清的總體。

特別注意在分析整群抽樣資料時,雖然抽樣誤差、統(tǒng)計推斷、假設檢驗比前幾種方法復雜,但在大規(guī)模、大范圍內(nèi)應用時,實施方便。5、多階段抽樣(多級抽樣)定義:多階段抽樣又稱多級抽樣或分段抽樣,它是按抽樣元素的隸屬關系或?qū)哟侮P系把抽樣過程分為幾個階段進行。在社會研究中,當總體的規(guī)模特別大,或者總體分布的范圍特別廣時,研究者一般采取多段抽樣的方法來抽取樣本。多段抽樣的具體做法是:先從總體中隨機抽取若干大群(組),然后再從這幾個大群(組)內(nèi)抽取幾個小群(組),這樣一層層抽下來,直至抽到最基本的抽樣元素為止。在運用多階段抽樣方法時,要在類別和個體之間保持平衡,或者保持合適的比例。例:假設某市共有2.4萬名教師,分布在10個區(qū)200所學校中,現(xiàn)抽取一個由1200名教師組成的樣本,按照三階段抽樣的方法,抽樣方案有:確定每一階段抽樣的單位數(shù)目時應考慮的因素:各個抽樣階段中的子總體同質(zhì)性程度。同質(zhì)性程度越高的子總體,所抽取的規(guī)模就應相對小一點;反之,則應大一點。各層子總體的人數(shù)。研究者所擁有的人力和經(jīng)費。一般來說,類別相對較多、每類中個體相對較少的做法效果較好。優(yōu)點

A、通過采用由高級抽樣單位過渡到低級抽樣單位的方法,解決了低級抽樣單位不易獲得抽樣框的問題,并可以使樣本的分布較為集中,大大降低了人力、物力、財力。適用于范圍大、總體對象多的社會調(diào)查。

B、多階段抽樣可在各階段抽樣時,根據(jù)具體情況,靈活選用不同的抽樣方法,可以綜合各種抽樣方法的優(yōu)點,提高樣本質(zhì)量。

缺點

A、由于每階段抽樣都會產(chǎn)生誤差,所以經(jīng)多階段抽樣得到的樣本誤差也相應增加。

B、解決方法:相對增加開頭階段的樣本數(shù),而適當減少最后階段的樣本數(shù)。

練習:假定某縣有20個鄉(xiāng)鎮(zhèn),每個鄉(xiāng)鎮(zhèn)平均有10個村委會,每個村委會平均有10個自然村,每個自然村平均有50戶。全縣共有200個村委會,2000個自然村、10萬戶。現(xiàn)決定采用多階段隨機抽樣方法對該縣計劃生育狀況按戶做5‰的抽樣調(diào)查,共抽取500戶,請設計抽樣方法。6、PPS抽樣(概率與元素規(guī)模大小成比例抽樣)(1)

實質(zhì)上是一種不等概率抽樣方法。

(2)適用于當每個元素在總體中的大小不同,或者在總體中的地位不同時,采用不等概率抽樣的方法,使得比例大或者在總體中的地位重要的的元素入選的概率大,比例小的或者在總體中的地位小的元素入選樣本的概率小,用以提高樣本代表性的方法。

(3)例:假設從全市100家不同規(guī)模的企業(yè)(總共20萬名職工)中,抽取1000名職工進行調(diào)查。

方案一:采用多階段抽樣的方法:先從100家企業(yè)隨機抽取20家企業(yè);再從20家企業(yè)中分別抽取50名職工(20*50=1000)構成樣本。100家企業(yè)的規(guī)模不同:最大的企業(yè)多達16000名職工,小的企業(yè)只有200名職工。這兩類企業(yè)中職工被抽中的概率不同:P大企業(yè)職工被抽中=(20/100)*(50/16000)=0.0625%P小企業(yè)職工被抽中=(20/100)*(50/200)=5%方案二:采用多階段抽樣的方法:先將各個元素排列起來;然后寫出他們的規(guī)模,計算他們的規(guī)模在總體規(guī)模中所占的比例;將他們的比例累計起來,并根據(jù)比例的累計數(shù)依次寫出每一元素所對應的選擇號碼范圍采用隨機抽樣的方法或系統(tǒng)抽樣的方法選擇號碼,號碼對應的元素入選作為第一階段的樣本;再從所選的樣本中進行第二階段抽樣村委會編號戶數(shù)占總戶數(shù)比例(%)累計比例(%)抽樣號碼等距抽樣選取的號碼入樣村委會和調(diào)查戶數(shù)合計4000村委會01200村委會02160村委會031440村委會04200村委會05120村委會06760村委會07320村委會08400村委會09280村委會10120

練習:某鄉(xiāng)鎮(zhèn)有10個居委會,共4000戶居民,每個村委會人數(shù)如下表所示。要選取200戶作為樣本,試用PPS抽樣的方法抽選樣本。七、非概率抽樣1、隨意抽樣(偶遇抽樣、方便抽樣)研究者在一定時間、一定環(huán)境里所遇到或接觸到的任均入選作為樣本的方法。街頭攔人法在有些調(diào)查中,調(diào)查過程對被調(diào)查者來說是不愉快的或是比較麻煩的,此時可以把那些自愿被調(diào)查的人作為樣本。優(yōu)點:方便、省力;缺點:樣本代表性差,有很大的偶然性

2、主觀抽樣(立意抽樣、判斷抽樣)

主觀的含義:a、研究者根據(jù)主觀判斷選取可以代表總體的個體作為樣本,即樣本的代表性取決于研究者對總體的了解程度和判斷能力;適用于在無法缺點總體邊界,或因調(diào)查者的時間和設備有限而無法進行概率抽樣時。b、有目的的選擇樣本。適用于:建立分類模型,在于發(fā)現(xiàn)問題,提出假設,不在于對總體作出估計。

3、定額抽樣(配額抽樣)

(1)是一種類似于分層抽樣的比例抽樣。按照調(diào)查對象的某種屬性或特征將總體中所有個體分為若干類或?qū)樱缓笤诟鲗又谐闃?,樣本中各層(類)所占的比例與他們在總體中所占的比例一樣。(2)與分層抽樣的區(qū)別:分層抽樣中各層樣本是隨機抽取的,而定額抽樣中,各層樣本是非隨機抽取的。

(3)

定額樣本的選擇也可以是基于屬性或特征(變量)的組合。

(4)定額抽樣假設:只要類型劃分的較細,那么同一個類型中的每一個個體都是同質(zhì)的,因而無需采用隨機抽樣方案;只要類型劃分合理且分配給各類的名額符合總體中各類人員的分布,那么樣本就可以準確的反映總體。

(5)假設在理論上成立,但實際實施過程很難做到。(6)原因:在分層時不能兼顧到總體的眾多屬性,而只考慮到幾種;有關總體分布變化的最新信息不易得到,其合理性很難保證。4、滾雪球抽樣(1)方法:先從幾個合適的調(diào)查對象開始,通過他們得到更多的調(diào)查對象,然后一步步擴大樣本范圍。(2)適用:當調(diào)查總體的個體信息不充分時,常采用此種方法。(3)局限性:最后仍有多個個體找不到,因某些原因故意漏而不提,產(chǎn)生遺漏。

八、樣本容量的確定(一)樣本容量:樣本內(nèi)所含個體數(shù)量的多少。在統(tǒng)計學中,有所謂大樣本、小樣本的區(qū)別和爭論,原因在于大樣本與小樣本的抽樣分布不同,因而需要采用不同的統(tǒng)計分析方法。一般認為30個以上稱為大樣本。社會統(tǒng)計研究中,則認為樣本規(guī)模超過100個才稱為大樣本資格。(二)計算方法:簡單隨機抽樣中推論總體平均數(shù)的樣本n其中:t:置信度所對應的臨界值 總體的標準差

e:抽樣誤差

推論總體成數(shù)(百分比)的樣本n計算公式其中:p:為總體成數(shù)或百分比,t、e含義同上注意:t值可以從標準正態(tài)分布表中查出;e是研究者根據(jù)需要事先確定的;總體標準差,或者總體成數(shù)或百分比常常難以得到,可采用下列變通的方法:利用前人所作的關于同一總體的普查或抽樣調(diào)查資料來計算或估計總體方差,由此得出推論總體均值的樣本規(guī)模;在計算推論總體成數(shù)(百分比)的樣本規(guī)模時,可以取p=1/2,p(1-p)=max,則,可保證n足夠大(三)影響樣本規(guī)模的確定因素1、總體的規(guī)模:當總體規(guī)模大到一定程度時,樣本規(guī)模的增加與它并不保持同等的增長速度;在其它有關因素一定時,樣本n的增加速度大大低于總體規(guī)模的增加速度;2、抽樣的精確性(1)置信度越低,推論的可靠性越大,則要求的n越大;(2)在其它條件一定的情況下,置信區(qū)間越小,即樣本統(tǒng)計值與總體參數(shù)值之間的誤差范圍越小,則n越大3、總體的異質(zhì)性程度(1)要達到同樣的精確度,在同質(zhì)性越強的總體中,則抽樣n小些;異質(zhì)性強的樣本,n大些。(2)總體中的大部分成員對某個問題的回答或選擇與小部分成員的回答或選擇不同時,則n小些;當選擇兩種不同的回答的成員比例相差無幾時,n大些4、研究者所擁有的經(jīng)費、人力和時間5、常見的經(jīng)驗樣本量:民意調(diào)查中:一般:1600-2000人,最多不超過3000人最重要的全國調(diào)查:15-20萬之間不同總體規(guī)模下的經(jīng)驗樣本量總體規(guī)模100以下100-10001000-50005000-1000010000-10萬10萬以上樣本占總體的比重50%以上50%-20%30%-10%15%-3%5%-1%1%以下九、抽樣誤差非抽樣誤差:人為操作失誤所致:如調(diào)查方案設計不甚合理、抽樣方法有違隨機原則、度量誤差、在調(diào)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論