第四章、抽樣課件_第1頁(yè)
第四章、抽樣課件_第2頁(yè)
第四章、抽樣課件_第3頁(yè)
第四章、抽樣課件_第4頁(yè)
第四章、抽樣課件_第5頁(yè)
已閱讀5頁(yè),還剩77頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章抽樣

總體抽取樣本推斷總體樣本第四章抽樣總體抽取樣本推斷總體樣本1第四章抽樣

1.抽樣的意義與作用

2.概率抽樣的原理與程序

3.概率抽樣方法

4.非概率抽樣方法

5.樣本規(guī)模與抽樣誤差第四章抽樣1.抽樣的意義與作用

2.概率抽樣的原理與程2一、抽樣的意義與作用1.抽樣的意義與作用

人們?cè)谘芯磕硞€(gè)自然現(xiàn)象或社會(huì)現(xiàn)象時(shí),往往會(huì)遇到不方便、不可能或不必要對(duì)所有的對(duì)象作調(diào)查的情況,于是從中抽取一部分對(duì)象作調(diào)查,這就是抽樣復(fù)雜的社會(huì)現(xiàn)象有限的研究資源

抽樣主要涉及和處理有關(guān)總體與部分之間的關(guān)系問(wèn)題。抽樣作為人們從部分認(rèn)識(shí)整體這一過(guò)程的關(guān)鍵環(huán)節(jié),其基本作用是向人們提供一種實(shí)現(xiàn)“由部分認(rèn)識(shí)總體”這一目標(biāo)的途徑和手段。抽樣一、抽樣的意義與作用1.抽樣的意義與作用抽樣3一、抽樣的意義與作用

1.抽樣的作用

抽樣是社會(huì)研究的主要內(nèi)容之一,也是社會(huì)調(diào)查的一個(gè)重要步驟。它與研究目的及研究?jī)?nèi)容緊密相關(guān)。它直接關(guān)系到資料的收集、整理與分析。它還涉及到整個(gè)研究的費(fèi)用以及應(yīng)用的范圍。抽樣是否科學(xué),直接關(guān)系到研究的成敗一、抽樣的意義與作用1.抽樣的作用4侯選人《LiteraryDigest》預(yù)測(cè)%選舉結(jié)果%羅斯福4362蘭頓5738

一個(gè)著名的案例——抽樣中的泰坦尼克事件1936年美國(guó)正從經(jīng)濟(jì)大恐慌中復(fù)蘇,全國(guó)仍有9百萬(wàn)人失業(yè).當(dāng)年的美國(guó)總統(tǒng)大選,由民主黨員羅斯福與共和黨員蘭登進(jìn)行角逐.《文學(xué)文摘》(LiteraryDigest)雜志對(duì)結(jié)果進(jìn)行了調(diào)查預(yù)測(cè).他們根據(jù)當(dāng)時(shí)的電話號(hào)碼簿及該雜志訂戶俱樂(lè)部會(huì)員名單,郵寄1千萬(wàn)份問(wèn)卷調(diào)查表,回收約240萬(wàn)份.工作人員獲得了大量的樣本,對(duì)此進(jìn)行了精確的計(jì)算,根據(jù)數(shù)據(jù)的整理分析結(jié)果,他們斷言:在總統(tǒng)選舉中,蘭登將以370∶161的優(yōu)勢(shì),即以57%比43%,領(lǐng)先14個(gè)百分點(diǎn)擊敗羅斯福.與之相反,一個(gè)名叫喬治?蓋洛普的人,對(duì)《文學(xué)文摘》調(diào)查結(jié)果的可信度提出質(zhì)疑.他也組織了抽樣調(diào)查,進(jìn)行民意測(cè)驗(yàn).他的預(yù)測(cè)與《文學(xué)文摘》截然相反,認(rèn)為羅斯福必勝無(wú)疑.結(jié)果,羅斯福以62%比38%壓倒性地大勝蘭登.這一結(jié)果使《文學(xué)文摘》銷聲匿跡,而蓋洛普則名聲大噪.侯選人《LiteraryDigest》預(yù)測(cè)%選舉結(jié)果%羅斯5年代候選人蓋洛普民意測(cè)驗(yàn)結(jié)果(%)總統(tǒng)選舉真實(shí)結(jié)果(%)蓋洛普誤差(%)2000布什48.047.9+0.11996克林頓52.049.2+2.81992克林頓49.043.3+5.71988老布什56.053.9+2.11984里根59.059.2-0.21980里根47.050.8-3.81976卡特48.050.1-2.11972尼克松62.061.8+0.21968尼克松43.043.5-0.51964約翰遜64.061.3+2.71960肯尼迪51.050.1+0.91956艾森豪威爾59.557.8+1.71952艾森豪威爾51.055.4-4.41948杜魯門44.549.5-5.01944羅斯福51.553.8-2.31940羅斯福52.055.0-3.01936羅斯福55.762.5-6.8從美國(guó)總統(tǒng)大選預(yù)測(cè)看抽樣的效率:

年代候選人蓋洛普民意測(cè)驗(yàn)結(jié)果(%)總統(tǒng)選舉真實(shí)結(jié)果(%)蓋洛6一、抽樣的意義與作用

2.抽樣的概念在我們的日常生活中經(jīng)常存在著抽樣。如抽血化驗(yàn),嘗試水溫,窺一斑而知全豹。抽樣(sampling)從組成某個(gè)總體的所有元素的集合中,按一定的方式選擇或抽取樣本的過(guò)程抽樣調(diào)查,就是從研究總體中抽取一部分代表加以調(diào)查研究,然后用所得結(jié)果推論和說(shuō)明總體的特性??傮w(population):構(gòu)成它的所有元素的集合樣本(sample)從總體中按一定方式抽取出的一部分元素的集合抽樣單位(samplingunit)一次直接的抽樣所使用的基本單位一、抽樣的意義與作用2.抽樣的概念7一、抽樣的意義與作用

抽樣框(samplingframe)抽樣范圍,指一次直接抽樣時(shí)總體中所有抽樣單位的名單參數(shù)值(parameter)是對(duì)總體中某一變量的綜合描述,或總體中所有元素某些特征的綜合數(shù)量表現(xiàn)。最常見(jiàn)的參數(shù)值是總體某一變量的平均值。統(tǒng)計(jì)值(statistic)是對(duì)樣本中某一變量的綜合描述,或樣本中所有元素某些特征的綜合數(shù)量表現(xiàn)。根據(jù)樣本計(jì)算出來(lái)的關(guān)于樣本變量的數(shù)量表現(xiàn)置信度(confidencelevel)總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)間內(nèi)的概率,或者說(shuō),是總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)間內(nèi)的把握性程度置信區(qū)間(confidenceintevalue)上述“某一區(qū)間”,就是置信區(qū)間一、抽樣的意義與作用抽樣框(samplingframe)8二、概率抽樣的原理與程序概率抽樣:(1)每一個(gè)體有同等機(jī)會(huì)被抽?。?)每一個(gè)體的抽取都是相互獨(dú)立的二、概率抽樣的原理與程序概率抽樣:9二、概率抽樣的原理與程序概率抽樣的邏輯

(1)同質(zhì)性和異質(zhì)性

如果研究總體是完全同質(zhì)的,抽樣就沒(méi)有必要;社會(huì)科學(xué)中的研究總體往往具有較強(qiáng)的異質(zhì)性;為了實(shí)現(xiàn)“通過(guò)部分認(rèn)識(shí)整體”,樣本應(yīng)該包含總體的各種差異特征。二、概率抽樣的原理與程序概率抽樣的邏輯10二、概率抽樣的原理與程序概率抽樣的邏輯

(2)無(wú)意識(shí)抽樣導(dǎo)致的偏差方便獲取的樣本:易得,但缺乏代表性;例如:如何獲取由100個(gè)學(xué)生構(gòu)成的樣本訪問(wèn)者的偏好影響樣本的代表性;例如:有意回避具有某些特征(“酷”,“冷”)的受訪者抽樣的地點(diǎn)影響樣本的代表性例如:圖書館門口訪問(wèn)二、概率抽樣的原理與程序概率抽樣的邏輯11二、概率抽樣的原理與程序概率抽樣的邏輯

(3)代表性和選擇的概率

如果總體中的每一個(gè)體都具有同等機(jī)會(huì)被選入樣本,那么從這一總體中抽取的樣本就能夠代表總體。概率抽樣的優(yōu)點(diǎn)

(1)樣本對(duì)總體更具代表性(相對(duì)其它類型抽樣)(2)可以對(duì)樣本的精確性和代表性作出估計(jì)二、概率抽樣的原理與程序概率抽樣的邏輯12二、概率抽樣的原理與程序總體分布、樣本分布、抽樣分布

當(dāng)樣本容量繼續(xù)增大,樣本平均數(shù)的分布會(huì)進(jìn)一步發(fā)生變化。這種變化趨勢(shì)是:平均數(shù)的范圍將逐步縮小(即底部越來(lái)越窄);相同的平均數(shù)會(huì)相應(yīng)增多;全部平均數(shù)的分布向總體平均數(shù)集中的趨勢(shì)也會(huì)越來(lái)越明顯.

二、概率抽樣的原理與程序總體分布、樣本分布、抽樣分布13總體分布(population

distribution)

總體分布:

總體中各元素的觀察值所形成的相對(duì)頻數(shù)(頻率)分布

分布通常是未知的(因?yàn)閹缀醯貌坏娇傮w所有觀察值)可以(根據(jù)理論分析)假定它服從某種分布

總體總體分布(populationdistribution)14

(sampledistribution)樣本分布也稱經(jīng)驗(yàn)分布,指一個(gè)樣本中各觀察值的形成的相對(duì)頻數(shù)(頻率)分布。當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布。樣本(sampledistribution)樣本分布也稱經(jīng)驗(yàn)15抽樣分布(samplingdistribution)抽樣分布:樣本統(tǒng)計(jì)量的概率分布,是一種理論分布。在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布樣本統(tǒng)計(jì)量是樣本的函數(shù),依據(jù)不同的樣本計(jì)算出來(lái)的值是不同的,所以統(tǒng)計(jì)量是隨機(jī)變量樣本均值,樣本比例,樣本方差等抽樣分布(samplingdistribution)抽樣分16樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布

樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所17總體分布、樣本均值的抽樣分布(例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)

,即總體單位數(shù)N=4。4

個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4

??傮w分布、總體的均值、方差及分布如下總體分布14230.1.2.3均值和方差總體分布、樣本均值的抽樣分布(例題分析)【例】設(shè)一個(gè)總體,含18

現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共19

計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(

)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.5計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.20樣本均值的分布與總體分布的比較

(例題分析)

=2.5σ2=1.25

的分布形式與原有總體和樣本容量n的大小有關(guān)14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x總體分布樣本均值的分布與總體分布的比較(例題分析)=2.21樣本均值的抽樣分布與中心極限定理

=50=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)樣本均值的抽樣分布與中心極限定理=50=10X總體22中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

330),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體x中心極限定理(centrallimittheorem23中心極限定理(centrallimittheorem)x的分布趨于正態(tài)分布的過(guò)程中心極限定理(centrallimittheorem)24抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣25樣本均值的數(shù)學(xué)期望樣本均值的方差(方差的概率意義在于刻畫了隨機(jī)變量取值的分散程度。方差越小,隨隨機(jī)變量的取值越集中在期望值附件。)

重復(fù)抽樣樣本均值的抽樣分布樣本均值的數(shù)學(xué)期望樣本均值的抽樣分布26抽樣的一般程序界定總體:對(duì)從中抽取樣本的總體范圍與界限作明確的界定制定抽樣框:依據(jù)已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并通過(guò)對(duì)名單進(jìn)行統(tǒng)一編號(hào)來(lái)建立起供抽樣使用的抽樣框決定抽樣方案:選擇抽樣方法,確定樣本規(guī)模實(shí)際抽取樣本:1.先抽好樣本,再調(diào)查2.一邊抽樣一邊調(diào)查評(píng)估樣本質(zhì)量:對(duì)樣本的質(zhì)量、代表性、偏差等進(jìn)行初步的檢驗(yàn)和衡量抽樣的一般程序界定總體:對(duì)從中抽取樣本的總體范圍與界限作明確27概率抽樣的方法抽樣的類型

偶遇抽樣判斷抽樣定額抽樣雪球抽樣簡(jiǎn)單隨機(jī)抽系統(tǒng)多層抽樣分層抽樣整群抽樣多段抽樣概率抽樣非概率抽樣抽樣類型概率抽樣的方法抽樣的類型偶遇抽樣簡(jiǎn)單隨機(jī)抽概率抽樣非概率抽樣28三、概率抽樣的方法

1.簡(jiǎn)單隨機(jī)抽樣:概率抽樣的最基本形式方法:1.總體較少:攪拌抽簽;2.總體較多:用隨機(jī)數(shù)表

3.利用EXCEL的randbetween(a,b)函數(shù)實(shí)現(xiàn)簡(jiǎn)單隨機(jī)抽樣三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣:29三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣概念:一般地,設(shè)一個(gè)總體的個(gè)體數(shù)為N,如果通過(guò)逐個(gè)不放回地抽取的方法從中抽取n(n≤N)個(gè)樣本,且每次抽取時(shí)各個(gè)個(gè)體被抽到的概率相等,就稱這樣的抽樣為簡(jiǎn)單隨機(jī)抽樣。要點(diǎn):它要求被抽取樣本的總體的個(gè)體數(shù)有限它是從總體中逐個(gè)進(jìn)行抽取它是一種不放回抽樣它是一種等概率抽樣用從個(gè)體數(shù)為N的總體中抽取一個(gè)容量為n的樣本,那么每個(gè)個(gè)體被抽取的概率等于三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣用從個(gè)體數(shù)為N的總體中抽取30三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣抽簽法(抓鬮法)將總體中的所有個(gè)體(共N個(gè))編號(hào)(號(hào)碼可以從1到N),并把號(hào)碼寫在形狀、大小相同的號(hào)簽上(號(hào)簽可以用小球、卡片、紙條等制作),然后將這些號(hào)簽放在同一個(gè)箱子里,進(jìn)行均勻攪拌。抽簽時(shí),每次從中抽出1個(gè)號(hào)簽,連續(xù)抽取n次,就得到一個(gè)容量為n的樣本。對(duì)個(gè)體編號(hào)時(shí),也可以利用已有的編號(hào)。例如學(xué)生的學(xué)號(hào),座位號(hào)等。三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣31三、概率抽樣的方法練習(xí)1.高二(21)班有53名同學(xué),現(xiàn)要從中抽取8名去參加一個(gè)座談會(huì),請(qǐng)寫出用抽簽法抽選的過(guò)程。2.假設(shè)一個(gè)總體有5個(gè)元素,分別記為a、b、c、d、e,采用抽簽法抽取一個(gè)容量為2的樣本,樣本共有多少個(gè)?為了考察某公司生產(chǎn)的250克袋裝牛奶的質(zhì)量是否達(dá)標(biāo),現(xiàn)從800袋牛奶中抽取60件產(chǎn)品進(jìn)行檢查.當(dāng)總體的個(gè)數(shù)較多時(shí),將總體“攪拌均勻”比較困難,抽簽法產(chǎn)生的樣本代表性差的可能性很大。三、概率抽樣的方法練習(xí)當(dāng)總體的個(gè)數(shù)較多時(shí),將總體“攪拌均勻”32三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣隨機(jī)數(shù)表法隨機(jī)數(shù)表是統(tǒng)計(jì)工作者用計(jì)算機(jī)生成的隨機(jī)數(shù),保證表中的每個(gè)位置上的數(shù)字是等可能出現(xiàn)的用隨機(jī)數(shù)表進(jìn)行抽樣的步驟:將總體中個(gè)體編號(hào);選定開(kāi)始的數(shù)字;獲取樣本號(hào)碼用隨機(jī)數(shù)表抽取樣本,可以任選一個(gè)數(shù)作為開(kāi)始,讀數(shù)的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于隨機(jī)數(shù)表是等概率的,因此利用隨機(jī)數(shù)表抽取樣本保證了被抽取個(gè)體的概率是相等的三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣33練習(xí)例:為了考察某公司生產(chǎn)底250克袋裝牛奶的質(zhì)量是否達(dá)標(biāo),現(xiàn)從800袋牛奶中抽取60件產(chǎn)品進(jìn)行檢查.S1,將800袋牛奶編號(hào),可以編為000,001,……,799;S2,在隨機(jī)數(shù)表中任意選一個(gè)數(shù),例如第8行第7列的數(shù)7;S3,從選定的數(shù)7開(kāi)始向右讀,得到一個(gè)三位數(shù),如果這個(gè)三位數(shù)在000~799范圍內(nèi),則取出,否則去掉;繼續(xù)向右讀,得下一個(gè)三位數(shù);依次下去,直到樣本的60個(gè)號(hào)碼全部取出.將總體中的個(gè)體編號(hào)時(shí)從000開(kāi)始,用意何在?當(dāng)隨機(jī)地選定開(kāi)始讀數(shù)的數(shù)后,讀數(shù)的方向只能向右嗎?三、概率抽樣的方法練習(xí)三、概率抽樣的方法34三、概率抽樣的方法練習(xí)將全班同學(xué)按學(xué)號(hào)編號(hào),制作相應(yīng)的卡片號(hào)簽,放入同一個(gè)箱子里均勻攪拌,從中抽出15個(gè)號(hào)簽,就相應(yīng)的15名學(xué)生對(duì)看足球比賽的喜愛(ài)程度(很喜愛(ài)、喜愛(ài)、一般、不喜愛(ài)、很不喜愛(ài))進(jìn)行調(diào)查。

上述問(wèn)題中抽取樣本的方法用隨機(jī)數(shù)表法來(lái)進(jìn)行!規(guī)則1:從269頁(yè)表中第3行第11列的兩位數(shù)開(kāi)始,依次向下讀數(shù),到頭后再轉(zhuǎn)向它左面的兩位數(shù)號(hào)碼,并向上讀數(shù),以此下去,直到取足樣本。規(guī)則2:從269頁(yè)表中第12行第10列的兩位數(shù)開(kāi)始,依次向左讀數(shù),到頭后再轉(zhuǎn)向它下面的兩位數(shù)號(hào)碼,并向右讀數(shù),以此下去,直到取足樣本。三、概率抽樣的方法練習(xí)35三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣利用EXCEL的randbetween(a,b)函數(shù)實(shí)現(xiàn)簡(jiǎn)單隨機(jī)抽樣例:某總體共3000人(四位數(shù)),需要從中抽取100人作為樣本進(jìn)行調(diào)查打開(kāi)EXCEL,用鼠標(biāo)左鍵點(diǎn)擊1A,點(diǎn)開(kāi)fx,出現(xiàn)一個(gè)對(duì)話框,在對(duì)話框的選擇類別這一欄中選擇“數(shù)學(xué)與三角函數(shù)”,在選擇函數(shù)這一欄中選擇randbetween,在randbetween后又出現(xiàn)對(duì)話框,在對(duì)話框的bottom欄填寫最小數(shù),在top欄填寫最大數(shù),鼠標(biāo)左鍵點(diǎn)擊確定,在1A欄出現(xiàn)一個(gè)隨機(jī)數(shù)字,下拉該欄到100A處就出現(xiàn)了100個(gè)隨機(jī)數(shù)字。三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣36三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣方法的優(yōu)缺點(diǎn)優(yōu)點(diǎn):可能產(chǎn)生代表性樣本缺點(diǎn):不容易做抽樣元素多,編號(hào)難必須能夠接觸到被選中的個(gè)體成分比例難三、概率抽樣的方法1.簡(jiǎn)單隨機(jī)抽樣37三、概率抽樣的方法

2.系統(tǒng)抽樣(等距抽樣或間隔抽樣)

定義:等距抽樣或機(jī)械抽樣,將總體的單位編號(hào)排序后,按照固定的間隔抽取個(gè)體組成樣本的方法。步驟:編號(hào)確定抽樣間距確定抽樣起點(diǎn)等間距抽樣三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣或間隔抽樣)38三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)舉例:一個(gè)禮堂有30排座位,每排有40個(gè)座位。一次報(bào)告會(huì)禮堂坐滿了聽(tīng)眾。會(huì)后為聽(tīng)取意見(jiàn),需要抽取30名聽(tīng)眾進(jìn)行座談,除了用簡(jiǎn)單隨機(jī)抽樣獲得樣本外,你能否設(shè)計(jì)其他的抽取樣本的方法?留下每排座位號(hào)為20的30名聽(tīng)眾進(jìn)行座談。注意:這種抽取樣本的方法與簡(jiǎn)單隨機(jī)抽樣有什么區(qū)別?你能說(shuō)出操作步驟嗎?三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)392.系統(tǒng)抽樣(等距抽樣)優(yōu)點(diǎn):簡(jiǎn)便易行條件:抽樣框里的元素應(yīng)該是隨機(jī)排列的.。三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)三、概率抽樣的方法40三、概率抽樣的方法注意1:系統(tǒng)抽樣的一個(gè)十分重要的前提條件,是總體中個(gè)體的排列,相對(duì)于研究的變量來(lái)說(shuō)是隨機(jī)的,即不存在某種與研究變量相關(guān)的規(guī)則分布。否則,系統(tǒng)抽樣的結(jié)果將會(huì)產(chǎn)生極大的偏差。例如:從總體2000戶家庭的社區(qū)中,抽取一個(gè)50戶家庭的樣本進(jìn)行調(diào)查消費(fèi)狀況的調(diào)查,而這2000戶家庭的名單是按每個(gè)家庭總收入的多少,由高到低的順序排列的。初始號(hào)碼為3和38,所抽樣本家庭平均收入有很大區(qū)別,消費(fèi)狀況也有很大區(qū)別。注意2:元素排列的周期性可能導(dǎo)致抽樣的重大偏差!例如:每個(gè)班級(jí)內(nèi)的50名學(xué)生按照學(xué)生成績(jī)的高低來(lái)排序,每個(gè)班抽取一名學(xué)生組成樣本,初始號(hào)碼為2和48號(hào),所抽樣本的平均成績(jī)差別很大三、概率抽樣的方法注意1:系統(tǒng)抽樣的一個(gè)十分重要的前提條件,41三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)下列抽樣不是系統(tǒng)抽樣的是()A、從標(biāo)有1~15號(hào)的15個(gè)球中,任選三個(gè)作為樣本,按從小號(hào)到大號(hào)排序,隨機(jī)選起點(diǎn)k,以后k+5,k+10(超過(guò)15則從1再數(shù)起)號(hào)入樣B、工廠生產(chǎn)的產(chǎn)品,用傳送帶將產(chǎn)品送入包裝車間前,檢驗(yàn)人員從傳送帶上每隔5分鐘抽一件產(chǎn)品進(jìn)行檢驗(yàn)C、搞某一市場(chǎng)調(diào)查,規(guī)定在商場(chǎng)門口隨機(jī)抽一個(gè)人進(jìn)行詢問(wèn)調(diào)查,直到調(diào)查到事先規(guī)定調(diào)查人數(shù)為止D、報(bào)告廳對(duì)與會(huì)聽(tīng)眾進(jìn)行進(jìn)行調(diào)查,通知每排(每排人數(shù)相等)座位號(hào)為14的觀眾留下來(lái)座談三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)42三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)應(yīng)用舉例某地區(qū)有3000名學(xué)生參加學(xué)科競(jìng)賽,現(xiàn)要從中抽取一個(gè)樣本對(duì)他們的成績(jī)進(jìn)行分析,每個(gè)學(xué)生被抽到的概率均為1/15,試確定樣本容量,并說(shuō)出抽樣步驟。設(shè)某校共有108名教師,為了支援西部的教育事業(yè),要從中隨機(jī)抽出16名教師組成暑期西部講師團(tuán)。請(qǐng)用系統(tǒng)抽樣方法選出講師團(tuán)成員。有人說(shuō),可以借用居民身份證號(hào)碼(18位)來(lái)進(jìn)行央視春晚的收視率調(diào)查:在1~999中抽出一個(gè)隨機(jī)數(shù),比如632,那么身份證后三位是632的觀眾就是要調(diào)查的對(duì)象。你覺(jué)得這樣所獲得的樣本有代表性嗎?三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)43系統(tǒng)抽樣的優(yōu)缺點(diǎn)如何改進(jìn)??jī)?yōu)點(diǎn):(1)簡(jiǎn)單易操作(2)當(dāng)對(duì)總體結(jié)構(gòu)有一定了解時(shí),充分利用已有的信息對(duì)總體中的個(gè)體進(jìn)行排隊(duì)后再抽樣,可提高抽樣效率(3)當(dāng)總體中的個(gè)體存在一種自然編號(hào)時(shí),采用系統(tǒng)抽樣比較方便缺點(diǎn):(4)當(dāng)在不了解樣本總體的情況下(如性別差異,經(jīng)濟(jì)基礎(chǔ),個(gè)人喜好,天氣因素等等),所抽出的樣本可能會(huì)有一定的偏差。系統(tǒng)抽樣的優(yōu)缺點(diǎn)如何改進(jìn)??jī)?yōu)點(diǎn):44三、概率抽樣的方法3.分層抽樣問(wèn)題情景:一個(gè)單位的職工有500人,其中不到35歲的有125人,35~49歲的有280人,50歲以上的有95人。為了了解該單位職工年齡與身體狀況的有關(guān)指標(biāo),從中抽取100名職工作為樣本,應(yīng)該怎樣抽取?三、概率抽樣的方法3.分層抽樣45三、概率抽樣的方法

3.分層抽樣

首先將總體中的所有單位按某種特征或標(biāo)志劃分成若干類型或?qū)哟危缓笤僭诟鱾€(gè)類型或?qū)哟沃胁捎煤?jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣的辦法抽取一個(gè)子樣本,最后將這些子樣本合起來(lái)構(gòu)成總體的樣本。三、概率抽樣的方法3.分層抽樣46三、概率抽樣的方法

三、概率抽樣的方法47分層抽樣的步驟1.總體與樣本容量確定抽取的比例。2.由分層情況,確定各層抽取的樣本數(shù)。3.各層的抽取數(shù)之和應(yīng)等于樣本容量。4.對(duì)于不能取整的數(shù),求其近似值。問(wèn)題:每個(gè)個(gè)體在整個(gè)抽樣過(guò)程中被抽取的概率是否相等?分層抽樣的步驟1.總體與樣本容量確定抽取的比例。問(wèn)題:每個(gè)個(gè)48三、概率抽樣的方法

3.分層抽樣優(yōu)點(diǎn):在不增加樣本規(guī)模的前提下降低抽樣誤差,提高抽樣精度,增大代表性。便于了解總體內(nèi)不同層次的情況,以及對(duì)總體中的不同層次進(jìn)行單獨(dú)研究或者進(jìn)行比較。缺點(diǎn):

對(duì)抽樣框的要求比較高,必須有分層的輔助信息;收集或編制抽樣框的費(fèi)用比較高;若調(diào)查變量與分層的變量不相關(guān),效率可能降低;三、概率抽樣的方法3.分層抽樣49三、概率抽樣的方法

3.分層抽樣分層的標(biāo)準(zhǔn)問(wèn)題以分析的主要變量或相關(guān)變量作為分層的標(biāo)準(zhǔn)保證各層內(nèi)部同質(zhì)性強(qiáng),各層之間異質(zhì)性強(qiáng)以已有明顯層次區(qū)分的變量作為分層變量分層的比例問(wèn)題按比例分層抽樣不按比例分層抽樣

三、概率抽樣的方法3.分層抽樣50

三、概率抽樣的方法分層抽樣舉例一個(gè)單位的職工有500人,其中不到35歲的有125人,35~49歲的有280人,50歲以上的有95人。為了了解該單位職工年齡與身體狀況的有關(guān)指標(biāo),從中抽取100名職工作為樣本,應(yīng)該怎樣抽?。拷猓撼槿∪藬?shù)與職工總數(shù)的比是100:500=1:5,

則各年齡段(層)的職工人數(shù)依次是125:280:95

=25:56:19,然后分別在各年齡段(層)運(yùn)用簡(jiǎn)單隨機(jī)抽樣方法抽取。答:在分層抽樣時(shí),不到35歲、35~49歲、50歲以上的三個(gè)年齡段分別抽取25人、56人和19人。三、概率抽樣的方法分層抽樣舉例51三、概率抽樣的方法練習(xí)1.某科研單位有科研人員160人,其中具有高級(jí)以上職稱的24人,中級(jí)職稱48人,其余均為初級(jí)以下職稱,現(xiàn)要抽取一個(gè)容量為20的樣本,試確定抽樣方法,并寫出抽樣過(guò)程.2.某市3個(gè)區(qū)共有高中學(xué)生20000人,且3個(gè)區(qū)的高中學(xué)生人數(shù)之比為2:3:5,現(xiàn)在要用分層抽樣的方法從所有學(xué)生中抽取一個(gè)容量為200的樣本,這3個(gè)區(qū)應(yīng)該分別抽取多少人?3.如果采用分層抽樣,從個(gè)體數(shù)為N的總體中,抽取一個(gè)容量為n的樣本,那么每個(gè)個(gè)體被抽到的概率等于()三、概率抽樣的方法練習(xí)524.下列屬于分層抽樣特點(diǎn)的是()A.從總體中逐個(gè)抽取B.將總體分成幾層,分層進(jìn)行抽取C.將總體分成幾部分,按事先確定的規(guī)則在各部分抽取D.將總體隨意分成幾部分,然后進(jìn)行隨機(jī)抽取5.某校高中生共有900人,其中高一年級(jí)300人,高二年級(jí)200人,高三年級(jí)400人,現(xiàn)采用分層抽樣抽取容量為45的樣本,那么高一,高二,高三各年級(jí)抽取人數(shù)分別為()A15,5,25B15,15,15C10,5,30D15,10,20三、概率抽樣的方法4.下列屬于分層抽樣特點(diǎn)的是()A15,53B6.某公司在A、B、C、D四個(gè)地區(qū)分別有150個(gè)、120個(gè)、180個(gè)和150個(gè)銷售點(diǎn),公司為了調(diào)查產(chǎn)品銷售情況,需從這600個(gè)銷售點(diǎn)中抽取容量為100的樣本,記這項(xiàng)調(diào)查為①;在C地區(qū)有20個(gè)特大型銷售點(diǎn),現(xiàn)從中抽取7個(gè)調(diào)查它的銷售收入和銷后服務(wù)情況,記這項(xiàng)調(diào)查為②;則完成①、②這兩項(xiàng)調(diào)查應(yīng)采取的抽樣方法依次為()A.分層抽樣法,系統(tǒng)抽樣法;B.分層抽樣法,簡(jiǎn)單隨機(jī)抽樣法;C.系統(tǒng)抽樣法,分層抽樣法;D.簡(jiǎn)單隨機(jī)抽樣法,分層抽樣法;三、概率抽樣的方法B6.某公司在A、B、C、D四個(gè)地區(qū)分別有150個(gè)、12547.在100個(gè)零件中,有一級(jí)品20個(gè),二級(jí)品30個(gè),其余為三級(jí)品,從中抽取20個(gè)作為樣本.(1)采用隨機(jī)抽樣法,將零件編號(hào)為00,01,…99.抽簽取出20個(gè);(2)采用系統(tǒng)抽樣法,將所有零件分成20組,每組5個(gè),然后每組中隨機(jī)抽取1個(gè);(3)采用分層抽樣法,從一級(jí)品中隨機(jī)抽取4個(gè),從二級(jí)品中隨機(jī)抽取6個(gè),從三級(jí)品中隨機(jī)抽取10個(gè),則下列說(shuō)法正確的是()A.不論用哪種抽樣方法,這100個(gè)零件中每個(gè)被抽到的概率都是1/5B.(1),(2)2種方法,這100個(gè)零件中每個(gè)被抽到的概率都是1/5;(3)并非如此C.(1),(3)2種方法,這100個(gè)零件中每個(gè)被抽到的概率都是1/5;(2)并非如此D.用不同的抽樣方法,這100個(gè)零件中每個(gè)被抽到的概率是各不相同的三、概率抽樣的方法7.在100個(gè)零件中,有一級(jí)品20個(gè),二級(jí)品30個(gè),其余為三558.某中學(xué)有學(xué)生2000名,高一、高二、高三的學(xué)生人數(shù)之比為5:3:2,現(xiàn)要抽取一個(gè)容量為200的樣本,則學(xué)生甲被抽到的概率是______________,

若高一學(xué)生抽取50人,則樣本的容量為_(kāi)_________.9.一個(gè)電視臺(tái)在因特網(wǎng)上就觀眾對(duì)其某一節(jié)目的喜愛(ài)程度進(jìn)行調(diào)查,參加調(diào)查的總?cè)藬?shù)為12000人,其中持各種態(tài)度的人數(shù)如下所示:很喜愛(ài)喜愛(ài)一般不喜愛(ài)2400420038001600打算從中抽取60人進(jìn)行詳細(xì)調(diào)查,如何抽取?三、概率抽樣的方法8.某中學(xué)有學(xué)生2000名,高一、高二、高三的學(xué)生人數(shù)之比為56三種抽樣方法的比較類別各自特點(diǎn)相互聯(lián)系適用范圍共同點(diǎn)簡(jiǎn)單隨機(jī)抽樣從總體中逐個(gè)抽取總體中的個(gè)體數(shù)較少抽樣過(guò)程中每個(gè)個(gè)體被抽取的概率相等系統(tǒng)抽樣將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣總體中的個(gè)體數(shù)較多分層抽樣將總體分成幾層,分層進(jìn)行抽取各層抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成簡(jiǎn)單隨機(jī)抽樣最簡(jiǎn)單,但是也是相對(duì)復(fù)雜的。系統(tǒng)抽樣操作簡(jiǎn)單,在有充分的總體信息的前提下,估計(jì)精度比隨機(jī)抽樣高,且操作、簡(jiǎn)單。分層抽樣由于已經(jīng)利用了總體信息,因此估計(jì)精度也比隨機(jī)簡(jiǎn)單抽樣要高。三種抽樣方法的比較類別各自特點(diǎn)相互聯(lián)系適用范圍共同點(diǎn)簡(jiǎn)單隨機(jī)57三、概率抽樣的方法

4.整群抽樣

將總體按某種標(biāo)準(zhǔn)劃分為一些子群體,每個(gè)子群為一個(gè)抽樣單位,用隨機(jī)方法從中抽若干子群,將抽出的子群中的所有個(gè)體結(jié)合起來(lái)構(gòu)成樣本。三、概率抽樣的方法4.整群抽樣58三、概率抽樣的方法

整群抽樣特點(diǎn):抽樣單位不是單個(gè)的個(gè)體,而是成群的個(gè)體優(yōu)缺點(diǎn):優(yōu)點(diǎn):不需要詳細(xì)的所有元素的名單,簡(jiǎn)單,費(fèi)用低缺點(diǎn):樣本的分布面不廣,代表性相對(duì)較差

整群抽樣和分層抽樣的比較:子群間異質(zhì)性強(qiáng),群內(nèi)同質(zhì)性強(qiáng)——分層抽樣子群間同質(zhì)性強(qiáng),群內(nèi)異質(zhì)性強(qiáng)——整群抽樣

三、概率抽樣的方法整群抽樣特點(diǎn):59三、概率抽樣的方法

5.多階段抽樣

按抽樣元素的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣分為幾個(gè)階段進(jìn)行。例1:大學(xué)——院系——班級(jí)——學(xué)生例2:城市——區(qū)——街道——居委會(huì)——家庭——個(gè)人特征:適用于范圍大、總體數(shù)量多的社會(huì)調(diào)查優(yōu)缺點(diǎn):優(yōu)點(diǎn):不需要總體的全部名單,各階段的抽樣單一般較少,容易操作缺點(diǎn):每一個(gè)階段都存在誤差,抽樣誤差可能較大應(yīng)對(duì)方法:盡量增加開(kāi)頭階段的樣本數(shù)適當(dāng)減少最后階段的樣本數(shù)

三、概率抽樣的方法5.多階段抽樣60三、概率抽樣的方法

6.PPS抽樣(概率與元素的規(guī)模大小成比例的抽樣)什么情況下要使用PPS抽樣:以上所介紹的抽樣方法有一個(gè)共同的特點(diǎn):總體(或子總體)中的每一個(gè)元素都具有同等的被抽中的概率。如果總體中每個(gè)元素的“大小”基本相同,或者每一個(gè)元素在總體中的地位或重要性相差不多,則這種基于同等概率的抽樣是合適的。但當(dāng)元素的大小不同,或者元素在總體中的地位不同時(shí),則需要采用不等概率抽樣的方法。三、概率抽樣的方法6.PPS抽樣(概率與元素的規(guī)模大小成比61三、概率抽樣的方法

如何進(jìn)行PPS抽樣?(P72)例:從全市100家不同規(guī)模的企業(yè)(共20萬(wàn)職工)中抽取1000名職工進(jìn)行調(diào)查100家企業(yè)抽取20家企業(yè),20家企業(yè)每家抽取50個(gè)工人,合計(jì)1000名職工20家企業(yè)抽取概論相同每個(gè)企業(yè)職工抽取的概論不同企業(yè)3每個(gè)職工抽取的概論=50/16000企業(yè)4每個(gè)職工抽取的概論=50/200三、概率抽樣的方法如何進(jìn)行PPS抽樣?(P72)62第四章、抽樣ppt課件63四、非概率抽樣方法

非概率抽樣:

又稱非隨機(jī)抽樣,就是調(diào)查者根據(jù)自己的方便或主觀判斷抽取樣本,這樣的抽樣方法不遵循概率均等的原則。常見(jiàn)的非概率抽樣方法:偶遇抽樣判斷抽樣定額抽樣滾雪球抽樣四、非概率抽樣方法非概率抽樣:64四、非概率抽樣方法

1.偶遇抽樣定義:方便抽樣或自然抽樣,指研究者根據(jù)現(xiàn)實(shí)情況,以自己方便的形式抽取偶然遇到的人作為對(duì)象,或者僅僅選擇那些離得最近、最容易找到的人作為對(duì)象。適用范圍可用于經(jīng)常性的市場(chǎng)調(diào)查;可用于正式市場(chǎng)調(diào)查之前的試驗(yàn)調(diào)查;任意調(diào)查適用于同質(zhì)總體。四、非概率抽樣方法1.偶遇抽樣651.偶遇抽樣優(yōu)點(diǎn):方便、靈活,簡(jiǎn)便易行,及時(shí)取得所需資料,節(jié)約時(shí)間和費(fèi)用成本低缺點(diǎn):樣本的代表性差、有很大的偶然性。例:1.在商場(chǎng)、碼頭等公共場(chǎng)所調(diào)查2.街頭攔截調(diào)查3.報(bào)刊的讀者調(diào)查四、非概率抽樣方法

1.偶遇抽樣四、非概率抽樣方法66四、非概率抽樣方法

判斷抽樣:

也叫立意抽樣,研究者根據(jù)自己的主觀判斷來(lái)抽選樣本,分為印象判斷抽樣和經(jīng)驗(yàn)判斷抽樣。印象判斷抽樣:純粹憑研究者的主觀印象抽樣經(jīng)驗(yàn)判斷抽樣:根據(jù)以往經(jīng)驗(yàn)和對(duì)調(diào)查對(duì)象的了解抽樣注意的問(wèn)題:判斷抽樣的關(guān)鍵是抽樣標(biāo)準(zhǔn)的確立,這種方法的運(yùn)用與研究者本人的因素比如理論修養(yǎng)、實(shí)踐經(jīng)驗(yàn)以及對(duì)調(diào)查對(duì)象的熟悉程度有關(guān)

四、非概率抽樣方法判斷抽樣:67四、非概率抽樣方法

判斷抽樣:適用場(chǎng)合:多用于無(wú)法確定總體邊界、或總體規(guī)模小、調(diào)查所涉及的范圍較窄,或調(diào)查時(shí)間、人力等條件有限而難以進(jìn)行大規(guī)模抽樣的情況。優(yōu)點(diǎn):可以充分發(fā)揮研究人員的主觀能動(dòng)作用。樣本是按照調(diào)查人員的需要來(lái)選定的,所以較好地滿足了特殊的調(diào)查需要。缺點(diǎn):如果調(diào)查人員在選取樣本時(shí)主觀判斷出現(xiàn)偏差,則判斷抽樣極易發(fā)生較大的抽樣誤差。樣本的代表性難以判斷,不能推論。四、非概率抽樣方法判斷抽樣:68四、非概率抽樣方法

3.定額抽樣

又稱配額抽樣,先根據(jù)總體各個(gè)組成部分所包含的抽樣單位的比例分配樣本數(shù)額,然后由調(diào)查者在各個(gè)組成部分內(nèi)根據(jù)配額的多少采用偶遇抽樣或判斷抽樣方法抽取樣本。四、非概率抽樣方法3.定額抽樣69四、非概率抽樣方法

定額抽樣

例:某高校有2000名學(xué)生,其中男生占60%,女生占40%;文科學(xué)生和理科學(xué)生各占50%;一年級(jí)學(xué)生占40%、二年級(jí)、三年級(jí)、四年級(jí)學(xué)牛分別占30%、20%和10%?,F(xiàn)在要用定額抽樣方法依上述3個(gè)變數(shù)抽取一個(gè)規(guī)模為100人的樣本。依據(jù)總體的構(gòu)成和樣本規(guī)模,我們可得到下列定額表

四、非概率抽樣方法定額抽樣70四、非概率抽樣方法

定額抽樣

定額抽樣與分層抽樣的區(qū)別在于,定額抽樣最后抽取樣本時(shí)所采用的方法是非隨機(jī)抽樣。配額抽樣的優(yōu)點(diǎn)

適用于設(shè)計(jì)調(diào)查者對(duì)總體的有關(guān)特征具有一定的了解而樣本數(shù)較多的情況下,實(shí)際上,配額抽樣屬于先“分層”(事先確定每層的樣本量)再“判斷”(在每層中以判斷抽樣的方法選取抽樣個(gè)體);費(fèi)用不高,易于實(shí)施,能滿足總體比例的要求。

配額抽樣的缺點(diǎn)

容易掩蓋不可忽略

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論