抽樣課件講義整理_第1頁
抽樣課件講義整理_第2頁
抽樣課件講義整理_第3頁
抽樣課件講義整理_第4頁
抽樣課件講義整理_第5頁
已閱讀5頁,還剩159頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第四章、抽樣(1)2022/10/31第四章抽樣(1)第四章、抽樣(1)2022/10/23第四章抽樣(1)1第四章抽樣

1.抽樣的意義與作用

2.概率抽樣的原理與程序

3.概率抽樣方法

4.非概率抽樣方法

5.樣本規(guī)模與抽樣誤差第四章抽樣(1)第四章抽樣1.抽樣的意義與作用

2.概率抽樣的原理與程2一、抽樣的意義與作用1.抽樣的意義與作用

人們在研究某個自然現(xiàn)象或社會現(xiàn)象時,往往會遇到不方便、不可能或不必要對所有的對象作調(diào)查的情況,于是從中抽取一部分對象作調(diào)查,這就是抽樣復(fù)雜的社會現(xiàn)象有限的研究資源

抽樣主要涉及和處理有關(guān)總體與部分之間的關(guān)系問題。抽樣作為人們從部分認(rèn)識整體這一過程的關(guān)鍵環(huán)節(jié),其基本作用是向人們提供一種實現(xiàn)“由部分認(rèn)識總體”這一目標(biāo)的途徑和手段。抽樣第四章抽樣(1)一、抽樣的意義與作用1.抽樣的意義與作用抽樣第四章抽樣(1)3一、抽樣的意義與作用

1.抽樣的作用

抽樣是社會研究的主要內(nèi)容之一,也是社會調(diào)查的一個重要步驟。它與研究目的及研究內(nèi)容緊密相關(guān)。它直接關(guān)系到資料的收集、整理與分析。它還涉及到整個研究的費用以及應(yīng)用的范圍。抽樣是否科學(xué),直接關(guān)系到研究的成敗第四章抽樣(1)一、抽樣的意義與作用1.抽樣的作用第四章抽樣(1)4侯選人《LiteraryDigest》預(yù)測%選舉結(jié)果%羅斯福4362蘭頓5738

一個著名的案例——抽樣中的泰坦尼克事件1936年美國正從經(jīng)濟大恐慌中復(fù)蘇,全國仍有9百萬人失業(yè).當(dāng)年的美國總統(tǒng)大選,由民主黨員羅斯福與共和黨員蘭登進行角逐.《文學(xué)文摘》(LiteraryDigest)雜志對結(jié)果進行了調(diào)查預(yù)測.他們根據(jù)當(dāng)時的電話號碼簿及該雜志訂戶俱樂部會員名單,郵寄1千萬份問卷調(diào)查表,回收約240萬份.工作人員獲得了大量的樣本,對此進行了精確的計算,根據(jù)數(shù)據(jù)的整理分析結(jié)果,他們斷言:在總統(tǒng)選舉中,蘭登將以370∶161的優(yōu)勢,即以57%比43%,領(lǐng)先14個百分點擊敗羅斯福.與之相反,一個名叫喬治?蓋洛普的人,對《文學(xué)文摘》調(diào)查結(jié)果的可信度提出質(zhì)疑.他也組織了抽樣調(diào)查,進行民意測驗.他的預(yù)測與《文學(xué)文摘》截然相反,認(rèn)為羅斯福必勝無疑.結(jié)果,羅斯福以62%比38%壓倒性地大勝蘭登.這一結(jié)果使《文學(xué)文摘》銷聲匿跡,而蓋洛普則名聲大噪.第四章抽樣(1)侯選人《LiteraryDigest》預(yù)測%選舉結(jié)果%羅斯5年代候選人蓋洛普民意測驗結(jié)果(%)總統(tǒng)選舉真實結(jié)果(%)蓋洛普誤差(%)2000布什48.047.9+0.11996克林頓52.049.2+2.81992克林頓49.043.3+5.71988老布什56.053.9+2.11984里根59.059.2-0.21980里根47.050.8-3.81976卡特48.050.1-2.11972尼克松62.061.8+0.21968尼克松43.043.5-0.51964約翰遜64.061.3+2.71960肯尼迪51.050.1+0.91956艾森豪威爾59.557.8+1.71952艾森豪威爾51.055.4-4.41948杜魯門44.549.5-5.01944羅斯福51.553.8-2.31940羅斯福52.055.0-3.01936羅斯福55.762.5-6.8從美國總統(tǒng)大選預(yù)測看抽樣的效率:

第四章抽樣(1)年代候選人蓋洛普民意測驗結(jié)果(%)總統(tǒng)選舉真實結(jié)果(%)蓋洛6一、抽樣的意義與作用

2.抽樣的概念在我們的日常生活中經(jīng)常存在著抽樣。如抽血化驗,嘗試水溫,窺一斑而知全豹。抽樣(sampling)從組成某個總體的所有元素的集合中,按一定的方式選擇或抽取樣本的過程抽樣調(diào)查,就是從研究總體中抽取一部分代表加以調(diào)查研究,然后用所得結(jié)果推論和說明總體的特性。總體(population):構(gòu)成它的所有元素的集合樣本(sample)從總體中按一定方式抽取出的一部分元素的集合抽樣單位(samplingunit)一次直接的抽樣所使用的基本單位第四章抽樣(1)一、抽樣的意義與作用2.抽樣的概念第四章抽樣(1)7一、抽樣的意義與作用

抽樣框(samplingframe)抽樣范圍,指一次直接抽樣時總體中所有抽樣單位的名單參數(shù)值(parameter)是對總體中某一變量的綜合描述,或總體中所有元素某些特征的綜合數(shù)量表現(xiàn)。最常見的參數(shù)值是總體某一變量的平均值。統(tǒng)計值(statistic)是對樣本中某一變量的綜合描述,或樣本中所有元素某些特征的綜合數(shù)量表現(xiàn)。根據(jù)樣本計算出來的關(guān)于樣本變量的數(shù)量表現(xiàn)置信度(confidencelevel)總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間內(nèi)的概率,或者說,是總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間內(nèi)的把握性程度置信區(qū)間(confidenceintevalue)上述“某一區(qū)間”,就是置信區(qū)間第四章抽樣(1)一、抽樣的意義與作用抽樣框(samplingframe)8二、概率抽樣的原理與程序概率抽樣:(1)每一個體有同等機會被抽?。?)每一個體的抽取都是相互獨立的第四章抽樣(1)二、概率抽樣的原理與程序概率抽樣:第四章抽樣(1)9二、概率抽樣的原理與程序概率抽樣的邏輯

(1)同質(zhì)性和異質(zhì)性

如果研究總體是完全同質(zhì)的,抽樣就沒有必要;社會科學(xué)中的研究總體往往具有較強的異質(zhì)性;為了實現(xiàn)“通過部分認(rèn)識整體”,樣本應(yīng)該包含總體的各種差異特征。第四章抽樣(1)二、概率抽樣的原理與程序概率抽樣的邏輯第四章抽樣(1)10二、概率抽樣的原理與程序概率抽樣的邏輯

(2)無意識抽樣導(dǎo)致的偏差方便獲取的樣本:易得,但缺乏代表性;例如:如何獲取由100個學(xué)生構(gòu)成的樣本訪問者的偏好影響樣本的代表性;例如:有意回避具有某些特征(“酷”,“冷”)的受訪者抽樣的地點影響樣本的代表性例如:圖書館門口訪問第四章抽樣(1)二、概率抽樣的原理與程序概率抽樣的邏輯第四章抽樣(1)11二、概率抽樣的原理與程序概率抽樣的邏輯

(3)代表性和選擇的概率

如果總體中的每一個體都具有同等機會被選入樣本,那么從這一總體中抽取的樣本就能夠代表總體。概率抽樣的優(yōu)點

(1)樣本對總體更具代表性(相對其它類型抽樣)(2)可以對樣本的精確性和代表性作出估計第四章抽樣(1)二、概率抽樣的原理與程序概率抽樣的邏輯第四章抽樣(1)12二、概率抽樣的原理與程序總體分布、樣本分布、抽樣分布

當(dāng)樣本容量繼續(xù)增大,樣本平均數(shù)的分布會進一步發(fā)生變化。這種變化趨勢是:平均數(shù)的范圍將逐步縮小(即底部越來越窄);相同的平均數(shù)會相應(yīng)增多;全部平均數(shù)的分布向總體平均數(shù)集中的趨勢也會越來越明顯.

第四章抽樣(1)二、概率抽樣的原理與程序總體分布、樣本分布、抽樣分布第四13總體分布(population

distribution)

總體分布:

總體中各元素的觀察值所形成的相對頻數(shù)(頻率)分布

分布通常是未知的(因為幾乎得不到總體所有觀察值)可以(根據(jù)理論分析)假定它服從某種分布

總體第四章抽樣(1)總體分布(populationdistribution)14

(sampledistribution)樣本分布也稱經(jīng)驗分布,指一個樣本中各觀察值的形成的相對頻數(shù)(頻率)分布。當(dāng)樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布。樣本第四章抽樣(1)(sampledistribution)樣本分布也稱經(jīng)驗15抽樣分布(samplingdistribution)抽樣分布:樣本統(tǒng)計量的概率分布,是一種理論分布。在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布樣本統(tǒng)計量是樣本的函數(shù),依據(jù)不同的樣本計算出來的值是不同的,所以統(tǒng)計量是隨機變量樣本均值,樣本比例,樣本方差等第四章抽樣(1)抽樣分布(samplingdistribution)抽樣分16樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布

第四章抽樣(1)樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時,由樣本均值的所17總體分布、樣本均值的抽樣分布(例題分析)【例】設(shè)一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為x1=1,x2=2,x3=3,x4=4

??傮w分布、總體的均值、方差及分布如下總體分布14230.1.2.3均值和方差第四章抽樣(1)總體分布、樣本均值的抽樣分布(例題分析)【例】設(shè)一個總體,含18

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)第四章抽樣(1)現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共19

計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(

)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.5第四章抽樣(1)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.20樣本均值的分布與總體分布的比較

(例題分析)

=2.5σ2=1.25

的分布形式與原有總體和樣本容量n的大小有關(guān)14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x總體分布第四章抽樣(1)樣本均值的分布與總體分布的比較(例題分析)=2.21樣本均值的抽樣分布與中心極限定理

=50=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)第四章抽樣(1)樣本均值的抽樣分布與中心極限定理=50=10X總體22中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(n

330),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x第四章抽樣(1)中心極限定理(centrallimittheorem23中心極限定理(centrallimittheorem)x的分布趨于正態(tài)分布的過程第四章抽樣(1)中心極限定理(centrallimittheorem)24抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布第四章抽樣(1)抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣25樣本均值的數(shù)學(xué)期望樣本均值的方差(方差的概率意義在于刻畫了隨機變量取值的分散程度。方差越小,隨隨機變量的取值越集中在期望值附件。)

重復(fù)抽樣樣本均值的抽樣分布第四章抽樣(1)樣本均值的數(shù)學(xué)期望樣本均值的抽樣分布第四章抽樣(1)26抽樣的一般程序界定總體:對從中抽取樣本的總體范圍與界限作明確的界定制定抽樣框:依據(jù)已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并通過對名單進行統(tǒng)一編號來建立起供抽樣使用的抽樣框決定抽樣方案:選擇抽樣方法,確定樣本規(guī)模實際抽取樣本:1.先抽好樣本,再調(diào)查2.一邊抽樣一邊調(diào)查評估樣本質(zhì)量:對樣本的質(zhì)量、代表性、偏差等進行初步的檢驗和衡量第四章抽樣(1)抽樣的一般程序界定總體:對從中抽取樣本的總體范圍與界限作明確27概率抽樣的方法抽樣的類型

偶遇抽樣判斷抽樣定額抽樣雪球抽樣簡單隨機抽系統(tǒng)多層抽樣分層抽樣整群抽樣多段抽樣概率抽樣非概率抽樣抽樣類型第四章抽樣(1)概率抽樣的方法抽樣的類型偶遇抽樣簡單隨機抽概率抽樣非概率抽樣28三、概率抽樣的方法

1.簡單隨機抽樣:概率抽樣的最基本形式方法:1.總體較少:攪拌抽簽;2.總體較多:用隨機數(shù)表見P269.表4-23.利用EXCEL的randbetween(a,b)函數(shù)實現(xiàn)簡單隨機抽樣第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣:第四章抽樣(1)29三、概率抽樣的方法1.簡單隨機抽樣概念:一般地,設(shè)一個總體的個體數(shù)為N,如果通過逐個不放回地抽取的方法從中抽取n(n≤N)個樣本,且每次抽取時各個個體被抽到的概率相等,就稱這樣的抽樣為簡單隨機抽樣。要點:它要求被抽取樣本的總體的個體數(shù)有限它是從總體中逐個進行抽取它是一種不放回抽樣它是一種等概率抽樣用從個體數(shù)為N的總體中抽取一個容量為n的樣本,那么每個個體被抽取的概率等于第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣用從個體數(shù)為N的總體中抽取30三、概率抽樣的方法1.簡單隨機抽樣抽簽法(抓鬮法)將總體中的所有個體(共N個)編號(號碼可以從1到N),并把號碼寫在形狀、大小相同的號簽上(號簽可以用小球、卡片、紙條等制作),然后將這些號簽放在同一個箱子里,進行均勻攪拌。抽簽時,每次從中抽出1個號簽,連續(xù)抽取n次,就得到一個容量為n的樣本。對個體編號時,也可以利用已有的編號。例如學(xué)生的學(xué)號,座位號等。第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣第四章抽樣(1)31三、概率抽樣的方法練習(xí)1.高二(21)班有53名同學(xué),現(xiàn)要從中抽取8名去參加一個座談會,請寫出用抽簽法抽選的過程。2.假設(shè)一個總體有5個元素,分別記為a、b、c、d、e,采用抽簽法抽取一個容量為2的樣本,樣本共有多少個?為了考察某公司生產(chǎn)的250克袋裝牛奶的質(zhì)量是否達標(biāo),現(xiàn)從800袋牛奶中抽取60件產(chǎn)品進行檢查.當(dāng)總體的個數(shù)較多時,將總體“攪拌均勻”比較困難,抽簽法產(chǎn)生的樣本代表性差的可能性很大。第四章抽樣(1)三、概率抽樣的方法練習(xí)當(dāng)總體的個數(shù)較多時,將總體“攪拌均勻”32三、概率抽樣的方法1.簡單隨機抽樣隨機數(shù)表法隨機數(shù)表是統(tǒng)計工作者用計算機生成的隨機數(shù),保證表中的每個位置上的數(shù)字是等可能出現(xiàn)的用隨機數(shù)表進行抽樣的步驟:將總體中個體編號;選定開始的數(shù)字;獲取樣本號碼用隨機數(shù)表抽取樣本,可以任選一個數(shù)作為開始,讀數(shù)的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于隨機數(shù)表是等概率的,因此利用隨機數(shù)表抽取樣本保證了被抽取個體的概率是相等的第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣第四章抽樣(1)33練習(xí)例:為了考察某公司生產(chǎn)底250克袋裝牛奶的質(zhì)量是否達標(biāo),現(xiàn)從800袋牛奶中抽取60件產(chǎn)品進行檢查.S1,將800袋牛奶編號,可以編為000,001,……,799;S2,在隨機數(shù)表中任意選一個數(shù),例如第8行第7列的數(shù)7;S3,從選定的數(shù)7開始向右讀,得到一個三位數(shù),如果這個三位數(shù)在000~799范圍內(nèi),則取出,否則去掉;繼續(xù)向右讀,得下一個三位數(shù);依次下去,直到樣本的60個號碼全部取出.將總體中的個體編號時從000開始,用意何在?當(dāng)隨機地選定開始讀數(shù)的數(shù)后,讀數(shù)的方向只能向右嗎?三、概率抽樣的方法第四章抽樣(1)練習(xí)三、概率抽樣的方法第四章抽樣(1)34三、概率抽樣的方法練習(xí)將全班同學(xué)按學(xué)號編號,制作相應(yīng)的卡片號簽,放入同一個箱子里均勻攪拌,從中抽出15個號簽,就相應(yīng)的15名學(xué)生對看足球比賽的喜愛程度(很喜愛、喜愛、一般、不喜愛、很不喜愛)進行調(diào)查。

上述問題中抽取樣本的方法用隨機數(shù)表法來進行!規(guī)則1:從269頁表中第3行第11列的兩位數(shù)開始,依次向下讀數(shù),到頭后再轉(zhuǎn)向它左面的兩位數(shù)號碼,并向上讀數(shù),以此下去,直到取足樣本。規(guī)則2:從269頁表中第12行第10列的兩位數(shù)開始,依次向左讀數(shù),到頭后再轉(zhuǎn)向它下面的兩位數(shù)號碼,并向右讀數(shù),以此下去,直到取足樣本。第四章抽樣(1)三、概率抽樣的方法練習(xí)第四章抽樣(1)35三、概率抽樣的方法1.簡單隨機抽樣利用EXCEL的randbetween(a,b)函數(shù)實現(xiàn)簡單隨機抽樣例:某總體共3000人(四位數(shù)),需要從中抽取100人作為樣本進行調(diào)查打開EXCEL,用鼠標(biāo)左鍵點擊1A,點開fx,出現(xiàn)一個對話框,在對話框的選擇類別這一欄中選擇“數(shù)學(xué)與三角函數(shù)”,在選擇函數(shù)這一欄中選擇randbetween,在randbetween后又出現(xiàn)對話框,在對話框的bottom欄填寫最小數(shù),在top欄填寫最大數(shù),鼠標(biāo)左鍵點擊確定,在1A欄出現(xiàn)一個隨機數(shù)字,下拉該欄到100A處就出現(xiàn)了100個隨機數(shù)字。第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣第四章抽樣(1)36三、概率抽樣的方法1.簡單隨機抽樣簡單隨機抽樣方法的優(yōu)缺點優(yōu)點:可能產(chǎn)生代表性樣本缺點:不容易做抽樣元素多,編號難必須能夠接觸到被選中的個體攪拌均勻不易第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣第四章抽樣(1)37三、概率抽樣的方法

2.系統(tǒng)抽樣(等距抽樣或間隔抽樣)

定義:等距抽樣或機械抽樣,將總體的單位編號排序后,按照固定的間隔抽取個體組成樣本的方法。步驟:編號確定抽樣間距確定抽樣起點等間距抽樣第四章抽樣(1)三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣或間隔抽樣)第四38三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)舉例:一個禮堂有30排座位,每排有40個座位。一次報告會禮堂坐滿了聽眾。會后為聽取意見,需要抽取30名聽眾進行座談,除了用簡單隨機抽樣獲得樣本外,你能否設(shè)計其他的抽取樣本的方法?留下每排座位號為20的30名聽眾進行座談。注意:這種抽取樣本的方法與簡單隨機抽樣有什么區(qū)別?你能說出操作步驟嗎?第四章抽樣(1)三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)第四章抽樣(1)392.系統(tǒng)抽樣(等距抽樣)優(yōu)點:簡便易行條件:抽樣框里的元素應(yīng)該是隨機排列的.。三、概率抽樣的方法第四章抽樣(1)2.系統(tǒng)抽樣(等距抽樣)三、概率抽樣的方法第四章抽樣(1)40三、概率抽樣的方法注意1:系統(tǒng)抽樣的一個十分重要的前提條件,是總體中個體的排列,相對于研究的變量來說是隨機的,即不存在某種與研究變量相關(guān)的規(guī)則分布。否則,系統(tǒng)抽樣的結(jié)果將會產(chǎn)生極大的偏差。例如:從總體2000戶家庭的社區(qū)中,抽取一個50戶家庭的樣本進行調(diào)查消費狀況的調(diào)查,而這2000戶家庭的名單是按每個家庭總收入的多少,由高到低的順序排列的。初始號碼為3和38,所抽樣本家庭平均收入有很大區(qū)別,消費狀況也有很大區(qū)別。注意2:元素排列的周期性可能導(dǎo)致抽樣的重大偏差!例如:每個班級內(nèi)的50名學(xué)生按照學(xué)生成績的高低來排序,每個班抽取一名學(xué)生組成樣本,初始號碼為2和48號,所抽樣本的平均成績差別很大第四章抽樣(1)三、概率抽樣的方法注意1:系統(tǒng)抽樣的一個十分重要的前提條件,41三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)以下抽樣方法的區(qū)別中,說法錯誤的是___

(A)4個人打牌時,將洗好的牌(52張)隨機確定一張牌為起始牌,然后按次序發(fā)牌,每人13張,這種抽樣方法屬于隨機抽樣(B)從標(biāo)號為1~15的15個球中,任選3個做為樣本,按從小到大排序,隨機選取起點號i0,以后選取i0+5,i0+10(超過5則從1數(shù)起),這種抽樣方法屬于系統(tǒng)抽樣(C)工廠生產(chǎn)某種產(chǎn)品,用傳送帶送入包裝車間,檢驗人員每隔五分鐘從傳送帶上抽一產(chǎn)品進行檢驗,這種抽樣方法屬于系統(tǒng)抽樣(D)電影院為調(diào)查觀眾某項指標(biāo),通知每排的座位號為8號的觀眾留下來,這種抽樣方法屬于系統(tǒng)抽樣第四章抽樣(1)三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)第四章抽樣(1)42三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)應(yīng)用舉例某地區(qū)有3000名學(xué)生參加學(xué)科競賽,現(xiàn)要從中抽取一個樣本對他們的成績進行分析,每個學(xué)生被抽到的概率均為1/15,試確定樣本容量,并說出抽樣步驟。設(shè)某校共有108名教師,為了支援西部的教育事業(yè),要從中隨機抽出16名教師組成暑期西部講師團。請用系統(tǒng)抽樣方法選出講師團成員。有人說,可以借用居民身份證號碼(18位)來進行央視春晚的收視率調(diào)查:在1~999中抽出一個隨機數(shù),比如632,那么身份證后三位是632的觀眾就是要調(diào)查的對象。你覺得這樣所獲得的樣本有代表性嗎?第四章抽樣(1)三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)第四章抽樣(1)43系統(tǒng)抽樣的優(yōu)缺點如何改進?優(yōu)點:(1)簡單易操作(2)當(dāng)對總體結(jié)構(gòu)有一定了解時,充分利用已有的信息對總體中的個體進行排隊后再抽樣,可提高抽樣效率(3)當(dāng)總體中的個體存在一種自然編號時,采用系統(tǒng)抽樣比較方便缺點:(4)當(dāng)在不了解樣本總體的情況下(如性別差異,經(jīng)濟基礎(chǔ),個人喜好,天氣因素等等),所抽出的樣本可能會有一定的偏差。第四章抽樣(1)系統(tǒng)抽樣的優(yōu)缺點如何改進?優(yōu)點:第四章抽樣(1)44三、概率抽樣的方法3.分層抽樣問題情景:一個單位的職工有500人,其中不到35歲的有125人,35~49歲的有280人,50歲以上的有95人。為了了解該單位職工年齡與身體狀況的有關(guān)指標(biāo),從中抽取100名職工作為樣本,應(yīng)該怎樣抽取?第四章抽樣(1)三、概率抽樣的方法3.分層抽樣第四章抽樣(1)45三、概率抽樣的方法

3.分層抽樣

首先將總體中的所有單位按某種特征或標(biāo)志劃分成若干類型或?qū)哟危缓笤僭诟鱾€類型或?qū)哟沃胁捎煤唵坞S機抽樣或系統(tǒng)抽樣的辦法抽取一個子樣本,最后將這些子樣本合起來構(gòu)成總體的樣本。第四章抽樣(1)三、概率抽樣的方法3.分層抽樣第四章抽樣(1)46三、概率抽樣的方法

第四章抽樣(1)三、概率抽樣的方法第四章抽樣(1)47分層抽樣的步驟1.總體與樣本容量確定抽取的比例。2.由分層情況,確定各層抽取的樣本數(shù)。3.各層的抽取數(shù)之和應(yīng)等于樣本容量。4.對于不能取整的數(shù),求其近似值。問題:每個個體在整個抽樣過程中被抽取的概率是否相等?第四章抽樣(1)分層抽樣的步驟1.總體與樣本容量確定抽取的比例。問題:每個個48三、概率抽樣的方法

3.分層抽樣優(yōu)點:在不增加樣本規(guī)模的前提下降低抽樣誤差,提高抽樣精度,增大代表性。便于了解總體內(nèi)不同層次的情況,以及對總體中的不同層次進行單獨研究或者進行比較。缺點:

對抽樣框的要求比較高,必須有分層的輔助信息;收集或編制抽樣框的費用比較高;若調(diào)查變量與分層的變量不相關(guān),效率可能降低;第四章抽樣(1)三、概率抽樣的方法3.分層抽樣第四章抽樣(1)49三、概率抽樣的方法

3.分層抽樣分層的標(biāo)準(zhǔn)問題以分析的主要變量或相關(guān)變量作為分層的標(biāo)準(zhǔn)保證各層內(nèi)部同質(zhì)性強,各層之間異質(zhì)性強以已有明顯層次區(qū)分的變量作為分層變量分層的比例問題按比例分層抽樣不按比例分層抽樣

第四章抽樣(1)三、概率抽樣的方法3.分層抽樣第四章抽樣(1)50

三、概率抽樣的方法分層抽樣舉例一個單位的職工有500人,其中不到35歲的有125人,35~49歲的有280人,50歲以上的有95人。為了了解該單位職工年齡與身體狀況的有關(guān)指標(biāo),從中抽取100名職工作為樣本,應(yīng)該怎樣抽取?解:抽取人數(shù)與職工總數(shù)的比是100:500=1:5,

則各年齡段(層)的職工人數(shù)依次是125:280:95

=25:56:19,然后分別在各年齡段(層)運用簡單隨機抽樣方法抽取。答:在分層抽樣時,不到35歲、35~49歲、50歲以上的三個年齡段分別抽取25人、56人和19人。第四章抽樣(1)三、概率抽樣的方法分層抽樣舉例第四章抽樣(1)51三、概率抽樣的方法練習(xí)1.某科研單位有科研人員160人,其中具有高級以上職稱的24人,中級職稱48人,其余均為初級以下職稱,現(xiàn)要抽取一個容量為20的樣本,試確定抽樣方法,并寫出抽樣過程.2.某市3個區(qū)共有高中學(xué)生20000人,且3個區(qū)的高中學(xué)生人數(shù)之比為2:3:5,現(xiàn)在要用分層抽樣的方法從所有學(xué)生中抽取一個容量為200的樣本,這3個區(qū)應(yīng)該分別抽取多少人?3.如果采用分層抽樣,從個體數(shù)為N的總體中,抽取一個容量為n的樣本,那么每個個體被抽到的概率等于()第四章抽樣(1)三、概率抽樣的方法練習(xí)第四章抽樣(1)524.下列屬于分層抽樣特點的是()A.從總體中逐個抽取B.將總體分成幾層,分層進行抽取C.將總體分成幾部分,按事先確定的規(guī)則在各部分抽取D.將總體隨意分成幾部分,然后進行隨機抽取5.某校高中生共有900人,其中高一年級300人,高二年級200人,高三年級400人,現(xiàn)采用分層抽樣抽取容量為45的樣本,那么高一,高二,高三各年級抽取人數(shù)分別為()A15,5,25B15,15,15C10,5,30D15,10,20三、概率抽樣的方法第四章抽樣(1)4.下列屬于分層抽樣特點的是()A15,53B6.某公司在A、B、C、D四個地區(qū)分別有150個、120個、180個和150個銷售點,公司為了調(diào)查產(chǎn)品銷售情況,需從這600個銷售點中抽取容量為100的樣本,記這項調(diào)查為①;在C地區(qū)有20個特大型銷售點,現(xiàn)從中抽取7個調(diào)查它的銷售收入和銷后服務(wù)情況,記這項調(diào)查為②;則完成①、②這兩項調(diào)查應(yīng)采取的抽樣方法依次為()A.分層抽樣法,系統(tǒng)抽樣法;B.分層抽樣法,簡單隨機抽樣法;C.系統(tǒng)抽樣法,分層抽樣法;D.簡單隨機抽樣法,分層抽樣法;三、概率抽樣的方法第四章抽樣(1)B6.某公司在A、B、C、D四個地區(qū)分別有150個、12547.在100個零件中,有一級品20個,二級品30個,其余為三級品,從中抽取20個作為樣本.(1)采用隨機抽樣法,將零件編號為00,01,…99.抽簽取出20個;(2)采用系統(tǒng)抽樣法,將所有零件分成20組,每組5個,然后每組中隨機抽取1個;(3)采用分層抽樣法,從一級品中隨機抽取4個,從二級品中隨機抽取6個,從三級品中隨機抽取10個,則下列說法正確的是()A.不論用哪種抽樣方法,這100個零件中每個被抽到的概率都是1/5B.(1),(2)2種方法,這100個零件中每個被抽到的概率都是1/5;(3)并非如此C.(1),(3)2種方法,這100個零件中每個被抽到的概率都是1/5;(2)并非如此D.用不同的抽樣方法,這100個零件中每個被抽到的概率是各不相同的三、概率抽樣的方法第四章抽樣(1)7.在100個零件中,有一級品20個,二級品30個,其余為三558.某中學(xué)有學(xué)生2000名,高一、高二、高三的學(xué)生人數(shù)之比為5:3:2,現(xiàn)要抽取一個容量為200的樣本,則學(xué)生甲被抽到的概率是______________,

若高一學(xué)生抽取50人,則樣本的容量為__________.9.一個電視臺在因特網(wǎng)上就觀眾對其某一節(jié)目的喜愛程度進行調(diào)查,參加調(diào)查的總?cè)藬?shù)為12000人,其中持各種態(tài)度的人數(shù)如下所示:很喜愛喜愛一般不喜愛2400420038001600打算從中抽取60人進行詳細(xì)調(diào)查,如何抽???三、概率抽樣的方法第四章抽樣(1)8.某中學(xué)有學(xué)生2000名,高一、高二、高三的學(xué)生人數(shù)之比為56三種抽樣方法的比較類別各自特點相互聯(lián)系適用范圍共同點簡單隨機抽樣從總體中逐個抽取總體中的個體數(shù)較少抽樣過程中每個個體被抽取的概率相等系統(tǒng)抽樣將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時采用簡單隨機抽樣總體中的個體數(shù)較多分層抽樣將總體分成幾層,分層進行抽取各層抽樣時采用簡單隨機抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成簡單隨機抽樣最簡單,但是也是相對復(fù)雜的。系統(tǒng)抽樣操作簡單,在有充分的總體信息的前提下,估計精度比隨機抽樣高,且操作、簡單。分層抽樣由于已經(jīng)利用了總體信息,因此估計精度也比隨機簡單抽樣要高。第四章抽樣(1)三種抽樣方法的比較類別各自特點相互聯(lián)系適用范圍共同點簡單隨機57三、概率抽樣的方法

4.整群抽樣

將總體按某種標(biāo)準(zhǔn)劃分為一些子群體,每個子群為一個抽樣單位,用隨機方法從中抽若干子群,將抽出的子群中的所有個體結(jié)合起來構(gòu)成樣本。第四章抽樣(1)三、概率抽樣的方法4.整群抽樣第四章抽樣(1)58三、概率抽樣的方法

整群抽樣特點:抽樣單位不是單個的個體,而是成群的個體優(yōu)缺點:優(yōu)點:不需要詳細(xì)的所有元素的名單,簡單,費用低缺點:樣本的分布面不廣,代表性相對較差

整群抽樣和分層抽樣的比較:子群間異質(zhì)性強,群內(nèi)同質(zhì)性強——分層抽樣子群間同質(zhì)性強,群內(nèi)異質(zhì)性強——整群抽樣

第四章抽樣(1)三、概率抽樣的方法整群抽樣特點:第四章抽樣(1)59三、概率抽樣的方法

5.多階段抽樣

按抽樣元素的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣分為幾個階段進行。例1:大學(xué)——院系——班級——學(xué)生例2:城市——區(qū)——街道——居委會——家庭——個人特征:適用于范圍大、總體數(shù)量多的社會調(diào)查優(yōu)缺點:優(yōu)點:不需要總體的全部名單,各階段的抽樣單一般較少,容易操作缺點:每一個階段都存在誤差,抽樣誤差可能較大應(yīng)對方法:盡量增加開頭階段的樣本數(shù)適當(dāng)減少最后階段的樣本數(shù)

第四章抽樣(1)三、概率抽樣的方法5.多階段抽樣第四章抽樣(1)60三、概率抽樣的方法

6.PPS抽樣(概率與元素的規(guī)模大小成比例的抽樣)什么情況下要使用PPS抽樣:以上所介紹的抽樣方法有一個共同的特點:總體(或子總體)中的每一個元素都具有同等的被抽中的概率。如果總體中每個元素的“大小”基本相同,或者每一個元素在總體中的地位或重要性相差不多,則這種基于同等概率的抽樣是合適的。但當(dāng)元素的大小不同,或者元素在總體中的地位不同時,則需要采用不等概率抽樣的方法。第四章抽樣(1)三、概率抽樣的方法6.PPS抽樣(概率與元素的規(guī)模大小成比61三、概率抽樣的方法

如何進行PPS抽樣?(P72)例:從全市100家不同規(guī)模的企業(yè)(共20萬職工)中抽取1000名職工進行調(diào)查100家企業(yè)抽取20家企業(yè),20家企業(yè)每家抽取50個工人,合計1000名職工20家企業(yè)抽取概論相同每個企業(yè)職工抽取的概論不同企業(yè)3每個職工抽取的概論=50/16000企業(yè)4每個職工抽取的概論=50/200第四章抽樣(1)三、概率抽樣的方法如何進行PPS抽樣?(P72)第四章抽62第四章抽樣(1)第四章抽樣(1)63四、非概率抽樣方法

非概率抽樣:

又稱非隨機抽樣,就是調(diào)查者根據(jù)自己的方便或主觀判斷抽取樣本,這樣的抽樣方法不遵循概率均等的原則。常見的非概率抽樣方法:偶遇抽樣判斷抽樣定額抽樣滾雪球抽樣第四章抽樣(1)四、非概率抽樣方法非概率抽樣:第四章抽樣(1)64四、非概率抽樣方法

1.偶遇抽樣定義:方便抽樣或自然抽樣,指研究者根據(jù)現(xiàn)實情況,以自己方便的形式抽取偶然遇到的人作為對象,或者僅僅選擇那些離得最近、最容易找到的人作為對象。適用范圍可用于經(jīng)常性的市場調(diào)查;可用于正式市場調(diào)查之前的試驗調(diào)查;任意調(diào)查適用于同質(zhì)總體。第四章抽樣(1)四、非概率抽樣方法1.偶遇抽樣第四章抽樣(1)651.偶遇抽樣優(yōu)點:方便、靈活,簡便易行,及時取得所需資料,節(jié)約時間和費用成本低缺點:樣本的代表性差、有很大的偶然性。例:1.在商場、碼頭等公共場所調(diào)查2.街頭攔截調(diào)查3.報刊的讀者調(diào)查四、非概率抽樣方法

第四章抽樣(1)1.偶遇抽樣四、非概率抽樣方法第四章抽樣(1)66四、非概率抽樣方法

判斷抽樣:

也叫立意抽樣,研究者根據(jù)自己的主觀判斷來抽選樣本,分為印象判斷抽樣和經(jīng)驗判斷抽樣。印象判斷抽樣:純粹憑研究者的主觀印象抽樣經(jīng)驗判斷抽樣:根據(jù)以往經(jīng)驗和對調(diào)查對象的了解抽樣注意的問題:判斷抽樣的關(guān)鍵是抽樣標(biāo)準(zhǔn)的確立,這種方法的運用與研究者本人的因素比如理論修養(yǎng)、實踐經(jīng)驗以及對調(diào)查對象的熟悉程度有關(guān)

第四章抽樣(1)四、非概率抽樣方法判斷抽樣:第四章抽樣(1)67四、非概率抽樣方法

判斷抽樣:適用場合:多用于無法確定總體邊界、或總體規(guī)模小、調(diào)查所涉及的范圍較窄,或調(diào)查時間、人力等條件有限而難以進行大規(guī)模抽樣的情況。優(yōu)點:可以充分發(fā)揮研究人員的主觀能動作用。樣本是按照調(diào)查人員的需要來選定的,所以較好地滿足了特殊的調(diào)查需要。缺點:如果調(diào)查人員在選取樣本時主觀判斷出現(xiàn)偏差,則判斷抽樣極易發(fā)生較大的抽樣誤差。樣本的代表性難以判斷,不能推論。第四章抽樣(1)四、非概率抽樣方法判斷抽樣:第四章抽樣(1)68四、非概率抽樣方法

3.定額抽樣

又稱配額抽樣,先根據(jù)總體各個組成部分所包含的抽樣單位的比例分配樣本數(shù)額,然后由調(diào)查者在各個組成部分內(nèi)根據(jù)配額的多少采用偶遇抽樣或判斷抽樣方法抽取樣本。第四章抽樣(1)四、非概率抽樣方法3.定額抽樣第四章抽樣(1)69四、非概率抽樣方法

定額抽樣

例:某高校有2000名學(xué)生,其中男生占60%,女生占40%;文科學(xué)生和理科學(xué)生各占50%;一年級學(xué)生占40%、二年級、三年級、四年級學(xué)牛分別占30%、20%和10%?,F(xiàn)在要用定額抽樣方法依上述3個變數(shù)抽取一個規(guī)模為100人的樣本。依據(jù)總體的構(gòu)成和樣本規(guī)模,我們可得到下列定額表

第四章抽樣(1)四、非概率抽樣方法定額抽樣第四章抽樣(1)70四、非概率抽樣方法

定額抽樣

定額抽樣與分層抽樣的區(qū)別在于,定額抽樣最后抽取樣本時所采用的方法是非隨機抽樣。配額抽樣的優(yōu)點

適用于設(shè)計調(diào)查者對總體的有關(guān)特征具有一定的了解而樣本數(shù)較多的情況下,實際上,配額抽樣屬于先“分層”(事先確定每層的樣本量)再“判斷”(在每層中以判斷抽樣的方法選取抽樣個體);費用不高,易于實施,能滿足總體比例的要求。

配額抽樣的缺點

容易掩蓋不可忽略的偏差第四章抽樣(1)四、非概率抽樣方法定額抽樣第四章抽樣(1)71四、非概率抽樣方法

滾雪球抽樣

當(dāng)無法了解總體時,可以從總體中少數(shù)成員入手,對他們進行調(diào)查,并進一步詢問還知道哪些符合條件的再進一步詢問。例:對球迷、戲迷的調(diào)查缺點:同質(zhì)性較強第四章抽樣(1)四、非概率抽樣方法滾雪球抽樣第四章抽樣(1)72四、非概率抽樣方法

非隨機抽樣抽選樣本的質(zhì)量,主要取決于調(diào)查者的主觀狀況和各種偶然因素。優(yōu)點:簡單、易行,可以獲得對調(diào)查對象的大致了解。缺點:代表性差,調(diào)查資料不能從數(shù)量上推斷總體。第四章抽樣(1)四、非概率抽樣方法非隨機抽樣抽選樣本的質(zhì)量,主要73五、樣本規(guī)模與抽樣誤差

樣本規(guī)模:又稱樣本容量,就是指樣本所含個案的數(shù)量。

確定樣本規(guī)模也是每一項具體的社會研究所必須解決的問題之一.統(tǒng)計學(xué)與社會研究的樣本統(tǒng)計學(xué)中通常以30為界,把樣本分為大樣本和小樣本.社會研究中的樣本規(guī)模至少不能少于100個個案,第四章抽樣(1)五、樣本規(guī)模與抽樣誤差樣本規(guī)模:又稱樣本容量,就是指樣本所74五、樣本規(guī)模與抽樣誤差

確定樣本規(guī)模需要考慮的因素:1.推斷的把握性與精確度;2.總體的規(guī)模;3.總體的異質(zhì)性程度;4.研究者所擁有的資源。

第四章抽樣(1)五、樣本規(guī)模與抽樣誤差確定樣本規(guī)模需要考慮的因素:第四章抽75五、樣本規(guī)模與抽樣誤差

1.推斷的把握性與精確度置信度:把握性置信區(qū)間:精確度

一般地說,在其他條件不變的情況下,置信度越高,即推斷的可靠程度越高,所要求的樣本規(guī)模就越大;置信區(qū)間越小,即樣本值與總體值之間誤差范圍越小,所要求的樣本規(guī)模就越大。

第四章抽樣(1)五、樣本規(guī)模與抽樣誤差1.推斷的把握性與精確度第四章抽樣(76五、樣本規(guī)模與抽樣誤差

不同允許誤差水平所需的最少樣本量

第四章抽樣(1)五、樣本規(guī)模與抽樣誤差不同允許誤差水平所需的最少樣本量第77五、樣本規(guī)模與抽樣誤差

2.總體的規(guī)模

在置信度和抽樣誤差不變的條件下,樣本規(guī)模是隨著總體規(guī)模的擴大而擴大,但樣本占總體的比重卻不斷縮小。當(dāng)總體規(guī)模大到一定程度時(例如100萬),樣本規(guī)模的增加對抽樣誤差的影響就微乎其微。例如:美國大選的民意調(diào)查中樣本通常不超過3000第四章抽樣(1)五、樣本規(guī)模與抽樣誤差2.總體的規(guī)模第四章抽樣(1)78五、樣本規(guī)模與抽樣誤差

總體規(guī)模與樣本規(guī)模的關(guān)系(置信度95%,抽樣誤差3%)

總體規(guī)模樣本規(guī)模樣本占總體的比重(%)100035035200046023300048016500055011100006006200006403.2500006501.31000006800.685000007000.14第四章抽樣(1)五、樣本規(guī)模與抽樣誤差總體規(guī)模與樣本規(guī)模的關(guān)系總體規(guī)模樣本79五、樣本規(guī)模與抽樣誤差

3.總體的異質(zhì)性程度;4.研究者所擁有的資源。第四章抽樣(1)五、樣本規(guī)模與抽樣誤差3.總體的異質(zhì)性程度;第四章抽樣(180五、樣本規(guī)模與抽樣誤差

經(jīng)驗確定樣本數(shù)的范圍總體規(guī)模100以下

100-1000

1000-5000

5000—1萬1萬—10萬10萬以上樣本所占比重50%以上

50—20%

30—10%

15—3%5—1%1%以下第四章抽樣(1)五、樣本規(guī)模與抽樣誤差經(jīng)驗確定樣本數(shù)的范圍總體規(guī)模1081演講完畢,謝謝聽講!再見,seeyouagain3rew2022/10/31第四章抽樣(1)演講完畢,謝謝聽講!再見,seeyouagain3rew82第四章、抽樣(1)2022/10/31第四章抽樣(1)第四章、抽樣(1)2022/10/23第四章抽樣(1)83第四章抽樣

1.抽樣的意義與作用

2.概率抽樣的原理與程序

3.概率抽樣方法

4.非概率抽樣方法

5.樣本規(guī)模與抽樣誤差第四章抽樣(1)第四章抽樣1.抽樣的意義與作用

2.概率抽樣的原理與程84一、抽樣的意義與作用1.抽樣的意義與作用

人們在研究某個自然現(xiàn)象或社會現(xiàn)象時,往往會遇到不方便、不可能或不必要對所有的對象作調(diào)查的情況,于是從中抽取一部分對象作調(diào)查,這就是抽樣復(fù)雜的社會現(xiàn)象有限的研究資源

抽樣主要涉及和處理有關(guān)總體與部分之間的關(guān)系問題。抽樣作為人們從部分認(rèn)識整體這一過程的關(guān)鍵環(huán)節(jié),其基本作用是向人們提供一種實現(xiàn)“由部分認(rèn)識總體”這一目標(biāo)的途徑和手段。抽樣第四章抽樣(1)一、抽樣的意義與作用1.抽樣的意義與作用抽樣第四章抽樣(1)85一、抽樣的意義與作用

1.抽樣的作用

抽樣是社會研究的主要內(nèi)容之一,也是社會調(diào)查的一個重要步驟。它與研究目的及研究內(nèi)容緊密相關(guān)。它直接關(guān)系到資料的收集、整理與分析。它還涉及到整個研究的費用以及應(yīng)用的范圍。抽樣是否科學(xué),直接關(guān)系到研究的成敗第四章抽樣(1)一、抽樣的意義與作用1.抽樣的作用第四章抽樣(1)86侯選人《LiteraryDigest》預(yù)測%選舉結(jié)果%羅斯福4362蘭頓5738

一個著名的案例——抽樣中的泰坦尼克事件1936年美國正從經(jīng)濟大恐慌中復(fù)蘇,全國仍有9百萬人失業(yè).當(dāng)年的美國總統(tǒng)大選,由民主黨員羅斯福與共和黨員蘭登進行角逐.《文學(xué)文摘》(LiteraryDigest)雜志對結(jié)果進行了調(diào)查預(yù)測.他們根據(jù)當(dāng)時的電話號碼簿及該雜志訂戶俱樂部會員名單,郵寄1千萬份問卷調(diào)查表,回收約240萬份.工作人員獲得了大量的樣本,對此進行了精確的計算,根據(jù)數(shù)據(jù)的整理分析結(jié)果,他們斷言:在總統(tǒng)選舉中,蘭登將以370∶161的優(yōu)勢,即以57%比43%,領(lǐng)先14個百分點擊敗羅斯福.與之相反,一個名叫喬治?蓋洛普的人,對《文學(xué)文摘》調(diào)查結(jié)果的可信度提出質(zhì)疑.他也組織了抽樣調(diào)查,進行民意測驗.他的預(yù)測與《文學(xué)文摘》截然相反,認(rèn)為羅斯福必勝無疑.結(jié)果,羅斯福以62%比38%壓倒性地大勝蘭登.這一結(jié)果使《文學(xué)文摘》銷聲匿跡,而蓋洛普則名聲大噪.第四章抽樣(1)侯選人《LiteraryDigest》預(yù)測%選舉結(jié)果%羅斯87年代候選人蓋洛普民意測驗結(jié)果(%)總統(tǒng)選舉真實結(jié)果(%)蓋洛普誤差(%)2000布什48.047.9+0.11996克林頓52.049.2+2.81992克林頓49.043.3+5.71988老布什56.053.9+2.11984里根59.059.2-0.21980里根47.050.8-3.81976卡特48.050.1-2.11972尼克松62.061.8+0.21968尼克松43.043.5-0.51964約翰遜64.061.3+2.71960肯尼迪51.050.1+0.91956艾森豪威爾59.557.8+1.71952艾森豪威爾51.055.4-4.41948杜魯門44.549.5-5.01944羅斯福51.553.8-2.31940羅斯福52.055.0-3.01936羅斯福55.762.5-6.8從美國總統(tǒng)大選預(yù)測看抽樣的效率:

第四章抽樣(1)年代候選人蓋洛普民意測驗結(jié)果(%)總統(tǒng)選舉真實結(jié)果(%)蓋洛88一、抽樣的意義與作用

2.抽樣的概念在我們的日常生活中經(jīng)常存在著抽樣。如抽血化驗,嘗試水溫,窺一斑而知全豹。抽樣(sampling)從組成某個總體的所有元素的集合中,按一定的方式選擇或抽取樣本的過程抽樣調(diào)查,就是從研究總體中抽取一部分代表加以調(diào)查研究,然后用所得結(jié)果推論和說明總體的特性。總體(population):構(gòu)成它的所有元素的集合樣本(sample)從總體中按一定方式抽取出的一部分元素的集合抽樣單位(samplingunit)一次直接的抽樣所使用的基本單位第四章抽樣(1)一、抽樣的意義與作用2.抽樣的概念第四章抽樣(1)89一、抽樣的意義與作用

抽樣框(samplingframe)抽樣范圍,指一次直接抽樣時總體中所有抽樣單位的名單參數(shù)值(parameter)是對總體中某一變量的綜合描述,或總體中所有元素某些特征的綜合數(shù)量表現(xiàn)。最常見的參數(shù)值是總體某一變量的平均值。統(tǒng)計值(statistic)是對樣本中某一變量的綜合描述,或樣本中所有元素某些特征的綜合數(shù)量表現(xiàn)。根據(jù)樣本計算出來的關(guān)于樣本變量的數(shù)量表現(xiàn)置信度(confidencelevel)總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間內(nèi)的概率,或者說,是總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間內(nèi)的把握性程度置信區(qū)間(confidenceintevalue)上述“某一區(qū)間”,就是置信區(qū)間第四章抽樣(1)一、抽樣的意義與作用抽樣框(samplingframe)90二、概率抽樣的原理與程序概率抽樣:(1)每一個體有同等機會被抽?。?)每一個體的抽取都是相互獨立的第四章抽樣(1)二、概率抽樣的原理與程序概率抽樣:第四章抽樣(1)91二、概率抽樣的原理與程序概率抽樣的邏輯

(1)同質(zhì)性和異質(zhì)性

如果研究總體是完全同質(zhì)的,抽樣就沒有必要;社會科學(xué)中的研究總體往往具有較強的異質(zhì)性;為了實現(xiàn)“通過部分認(rèn)識整體”,樣本應(yīng)該包含總體的各種差異特征。第四章抽樣(1)二、概率抽樣的原理與程序概率抽樣的邏輯第四章抽樣(1)92二、概率抽樣的原理與程序概率抽樣的邏輯

(2)無意識抽樣導(dǎo)致的偏差方便獲取的樣本:易得,但缺乏代表性;例如:如何獲取由100個學(xué)生構(gòu)成的樣本訪問者的偏好影響樣本的代表性;例如:有意回避具有某些特征(“酷”,“冷”)的受訪者抽樣的地點影響樣本的代表性例如:圖書館門口訪問第四章抽樣(1)二、概率抽樣的原理與程序概率抽樣的邏輯第四章抽樣(1)93二、概率抽樣的原理與程序概率抽樣的邏輯

(3)代表性和選擇的概率

如果總體中的每一個體都具有同等機會被選入樣本,那么從這一總體中抽取的樣本就能夠代表總體。概率抽樣的優(yōu)點

(1)樣本對總體更具代表性(相對其它類型抽樣)(2)可以對樣本的精確性和代表性作出估計第四章抽樣(1)二、概率抽樣的原理與程序概率抽樣的邏輯第四章抽樣(1)94二、概率抽樣的原理與程序總體分布、樣本分布、抽樣分布

當(dāng)樣本容量繼續(xù)增大,樣本平均數(shù)的分布會進一步發(fā)生變化。這種變化趨勢是:平均數(shù)的范圍將逐步縮小(即底部越來越窄);相同的平均數(shù)會相應(yīng)增多;全部平均數(shù)的分布向總體平均數(shù)集中的趨勢也會越來越明顯.

第四章抽樣(1)二、概率抽樣的原理與程序總體分布、樣本分布、抽樣分布第四95總體分布(population

distribution)

總體分布:

總體中各元素的觀察值所形成的相對頻數(shù)(頻率)分布

分布通常是未知的(因為幾乎得不到總體所有觀察值)可以(根據(jù)理論分析)假定它服從某種分布

總體第四章抽樣(1)總體分布(populationdistribution)96

(sampledistribution)樣本分布也稱經(jīng)驗分布,指一個樣本中各觀察值的形成的相對頻數(shù)(頻率)分布。當(dāng)樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布。樣本第四章抽樣(1)(sampledistribution)樣本分布也稱經(jīng)驗97抽樣分布(samplingdistribution)抽樣分布:樣本統(tǒng)計量的概率分布,是一種理論分布。在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布樣本統(tǒng)計量是樣本的函數(shù),依據(jù)不同的樣本計算出來的值是不同的,所以統(tǒng)計量是隨機變量樣本均值,樣本比例,樣本方差等第四章抽樣(1)抽樣分布(samplingdistribution)抽樣分98樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布

第四章抽樣(1)樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時,由樣本均值的所99總體分布、樣本均值的抽樣分布(例題分析)【例】設(shè)一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為x1=1,x2=2,x3=3,x4=4

??傮w分布、總體的均值、方差及分布如下總體分布14230.1.2.3均值和方差第四章抽樣(1)總體分布、樣本均值的抽樣分布(例題分析)【例】設(shè)一個總體,含100

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)第四章抽樣(1)現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共101

計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(

)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.5第四章抽樣(1)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.102樣本均值的分布與總體分布的比較

(例題分析)

=2.5σ2=1.25

的分布形式與原有總體和樣本容量n的大小有關(guān)14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x總體分布第四章抽樣(1)樣本均值的分布與總體分布的比較(例題分析)=2.103樣本均值的抽樣分布與中心極限定理

=50=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)第四章抽樣(1)樣本均值的抽樣分布與中心極限定理=50=10X總體104中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(n

330),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x第四章抽樣(1)中心極限定理(centrallimittheorem105中心極限定理(centrallimittheorem)x的分布趨于正態(tài)分布的過程第四章抽樣(1)中心極限定理(centrallimittheorem)106抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布第四章抽樣(1)抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣107樣本均值的數(shù)學(xué)期望樣本均值的方差(方差的概率意義在于刻畫了隨機變量取值的分散程度。方差越小,隨隨機變量的取值越集中在期望值附件。)

重復(fù)抽樣樣本均值的抽樣分布第四章抽樣(1)樣本均值的數(shù)學(xué)期望樣本均值的抽樣分布第四章抽樣(1)108抽樣的一般程序界定總體:對從中抽取樣本的總體范圍與界限作明確的界定制定抽樣框:依據(jù)已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并通過對名單進行統(tǒng)一編號來建立起供抽樣使用的抽樣框決定抽樣方案:選擇抽樣方法,確定樣本規(guī)模實際抽取樣本:1.先抽好樣本,再調(diào)查2.一邊抽樣一邊調(diào)查評估樣本質(zhì)量:對樣本的質(zhì)量、代表性、偏差等進行初步的檢驗和衡量第四章抽樣(1)抽樣的一般程序界定總體:對從中抽取樣本的總體范圍與界限作明確109概率抽樣的方法抽樣的類型

偶遇抽樣判斷抽樣定額抽樣雪球抽樣簡單隨機抽系統(tǒng)多層抽樣分層抽樣整群抽樣多段抽樣概率抽樣非概率抽樣抽樣類型第四章抽樣(1)概率抽樣的方法抽樣的類型偶遇抽樣簡單隨機抽概率抽樣非概率抽樣110三、概率抽樣的方法

1.簡單隨機抽樣:概率抽樣的最基本形式方法:1.總體較少:攪拌抽簽;2.總體較多:用隨機數(shù)表見P269.表4-23.利用EXCEL的randbetween(a,b)函數(shù)實現(xiàn)簡單隨機抽樣第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣:第四章抽樣(1)111三、概率抽樣的方法1.簡單隨機抽樣概念:一般地,設(shè)一個總體的個體數(shù)為N,如果通過逐個不放回地抽取的方法從中抽取n(n≤N)個樣本,且每次抽取時各個個體被抽到的概率相等,就稱這樣的抽樣為簡單隨機抽樣。要點:它要求被抽取樣本的總體的個體數(shù)有限它是從總體中逐個進行抽取它是一種不放回抽樣它是一種等概率抽樣用從個體數(shù)為N的總體中抽取一個容量為n的樣本,那么每個個體被抽取的概率等于第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣用從個體數(shù)為N的總體中抽取112三、概率抽樣的方法1.簡單隨機抽樣抽簽法(抓鬮法)將總體中的所有個體(共N個)編號(號碼可以從1到N),并把號碼寫在形狀、大小相同的號簽上(號簽可以用小球、卡片、紙條等制作),然后將這些號簽放在同一個箱子里,進行均勻攪拌。抽簽時,每次從中抽出1個號簽,連續(xù)抽取n次,就得到一個容量為n的樣本。對個體編號時,也可以利用已有的編號。例如學(xué)生的學(xué)號,座位號等。第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣第四章抽樣(1)113三、概率抽樣的方法練習(xí)1.高二(21)班有53名同學(xué),現(xiàn)要從中抽取8名去參加一個座談會,請寫出用抽簽法抽選的過程。2.假設(shè)一個總體有5個元素,分別記為a、b、c、d、e,采用抽簽法抽取一個容量為2的樣本,樣本共有多少個?為了考察某公司生產(chǎn)的250克袋裝牛奶的質(zhì)量是否達標(biāo),現(xiàn)從800袋牛奶中抽取60件產(chǎn)品進行檢查.當(dāng)總體的個數(shù)較多時,將總體“攪拌均勻”比較困難,抽簽法產(chǎn)生的樣本代表性差的可能性很大。第四章抽樣(1)三、概率抽樣的方法練習(xí)當(dāng)總體的個數(shù)較多時,將總體“攪拌均勻”114三、概率抽樣的方法1.簡單隨機抽樣隨機數(shù)表法隨機數(shù)表是統(tǒng)計工作者用計算機生成的隨機數(shù),保證表中的每個位置上的數(shù)字是等可能出現(xiàn)的用隨機數(shù)表進行抽樣的步驟:將總體中個體編號;選定開始的數(shù)字;獲取樣本號碼用隨機數(shù)表抽取樣本,可以任選一個數(shù)作為開始,讀數(shù)的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于隨機數(shù)表是等概率的,因此利用隨機數(shù)表抽取樣本保證了被抽取個體的概率是相等的第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣第四章抽樣(1)115練習(xí)例:為了考察某公司生產(chǎn)底250克袋裝牛奶的質(zhì)量是否達標(biāo),現(xiàn)從800袋牛奶中抽取60件產(chǎn)品進行檢查.S1,將800袋牛奶編號,可以編為000,001,……,799;S2,在隨機數(shù)表中任意選一個數(shù),例如第8行第7列的數(shù)7;S3,從選定的數(shù)7開始向右讀,得到一個三位數(shù),如果這個三位數(shù)在000~799范圍內(nèi),則取出,否則去掉;繼續(xù)向右讀,得下一個三位數(shù);依次下去,直到樣本的60個號碼全部取出.將總體中的個體編號時從000開始,用意何在?當(dāng)隨機地選定開始讀數(shù)的數(shù)后,讀數(shù)的方向只能向右嗎?三、概率抽樣的方法第四章抽樣(1)練習(xí)三、概率抽樣的方法第四章抽樣(1)116三、概率抽樣的方法練習(xí)將全班同學(xué)按學(xué)號編號,制作相應(yīng)的卡片號簽,放入同一個箱子里均勻攪拌,從中抽出15個號簽,就相應(yīng)的15名學(xué)生對看足球比賽的喜愛程度(很喜愛、喜愛、一般、不喜愛、很不喜愛)進行調(diào)查。

上述問題中抽取樣本的方法用隨機數(shù)表法來進行!規(guī)則1:從269頁表中第3行第11列的兩位數(shù)開始,依次向下讀數(shù),到頭后再轉(zhuǎn)向它左面的兩位數(shù)號碼,并向上讀數(shù),以此下去,直到取足樣本。規(guī)則2:從269頁表中第12行第10列的兩位數(shù)開始,依次向左讀數(shù),到頭后再轉(zhuǎn)向它下面的兩位數(shù)號碼,并向右讀數(shù),以此下去,直到取足樣本。第四章抽樣(1)三、概率抽樣的方法練習(xí)第四章抽樣(1)117三、概率抽樣的方法1.簡單隨機抽樣利用EXCEL的randbetween(a,b)函數(shù)實現(xiàn)簡單隨機抽樣例:某總體共3000人(四位數(shù)),需要從中抽取100人作為樣本進行調(diào)查打開EXCEL,用鼠標(biāo)左鍵點擊1A,點開fx,出現(xiàn)一個對話框,在對話框的選擇類別這一欄中選擇“數(shù)學(xué)與三角函數(shù)”,在選擇函數(shù)這一欄中選擇randbetween,在randbetween后又出現(xiàn)對話框,在對話框的bottom欄填寫最小數(shù),在top欄填寫最大數(shù),鼠標(biāo)左鍵點擊確定,在1A欄出現(xiàn)一個隨機數(shù)字,下拉該欄到100A處就出現(xiàn)了100個隨機數(shù)字。第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣第四章抽樣(1)118三、概率抽樣的方法1.簡單隨機抽樣簡單隨機抽樣方法的優(yōu)缺點優(yōu)點:可能產(chǎn)生代表性樣本缺點:不容易做抽樣元素多,編號難必須能夠接觸到被選中的個體攪拌均勻不易第四章抽樣(1)三、概率抽樣的方法1.簡單隨機抽樣第四章抽樣(1)119三、概率抽樣的方法

2.系統(tǒng)抽樣(等距抽樣或間隔抽樣)

定義:等距抽樣或機械抽樣,將總體的單位編號排序后,按照固定的間隔抽取個體組成樣本的方法。步驟:編號確定抽樣間距確定抽樣起點等間距抽樣第四章抽樣(1)三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣或間隔抽樣)第四120三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)舉例:一個禮堂有30排座位,每排有40個座位。一次報告會禮堂坐滿了聽眾。會后為聽取意見,需要抽取30名聽眾進行座談,除了用簡單隨機抽樣獲得樣本外,你能否設(shè)計其他的抽取樣本的方法?留下每排座位號為20的30名聽眾進行座談。注意:這種抽取樣本的方法與簡單隨機抽樣有什么區(qū)別?你能說出操作步驟嗎?第四章抽樣(1)三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)第四章抽樣(1)1212.系統(tǒng)抽樣(等距抽樣)優(yōu)點:簡便易行條件:抽樣框里的元素應(yīng)該是隨機排列的.。三、概率抽樣的方法第四章抽樣(1)2.系統(tǒng)抽樣(等距抽樣)三、概率抽樣的方法第四章抽樣(1)122三、概率抽樣的方法注意1:系統(tǒng)抽樣的一個十分重要的前提條件,是總體中個體的排列,相對于研究的變量來說是隨機的,即不存在某種與研究變量相關(guān)的規(guī)則分布。否則,系統(tǒng)抽樣的結(jié)果將會產(chǎn)生極大的偏差。例如:從總體2000戶家庭的社區(qū)中,抽取一個50戶家庭的樣本進行調(diào)查消費狀況的調(diào)查,而這2000戶家庭的名單是按每個家庭總收入的多少,由高到低的順序排列的。初始號碼為3和38,所抽樣本家庭平均收入有很大區(qū)別,消費狀況也有很大區(qū)別。注意2:元素排列的周期性可能導(dǎo)致抽樣的重大偏差!例如:每個班級內(nèi)的50名學(xué)生按照學(xué)生成績的高低來排序,每個班抽取一名學(xué)生組成樣本,初始號碼為2和48號,所抽樣本的平均成績差別很大第四章抽樣(1)三、概率抽樣的方法注意1:系統(tǒng)抽樣的一個十分重要的前提條件,123三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)以下抽樣方法的區(qū)別中,說法錯誤的是___

(A)4個人打牌時,將洗好的牌(52張)隨機確定一張牌為起始牌,然后按次序發(fā)牌,每人13張,這種抽樣方法屬于隨機抽樣(B)從標(biāo)號為1~15的15個球中,任選3個做為樣本,按從小到大排序,隨機選取起點號i0,以后選取i0+5,i0+10(超過5則從1數(shù)起),這種抽樣方法屬于系統(tǒng)抽樣(C)工廠生產(chǎn)某種產(chǎn)品,用傳送帶送入包裝車間,檢驗人員每隔五分鐘從傳送帶上抽一產(chǎn)品進行檢驗,這種抽樣方法屬于系統(tǒng)抽樣(D)電影院為調(diào)查觀眾某項指標(biāo),通知每排的座位號為8號的觀眾留下來,這種抽樣方法屬于系統(tǒng)抽樣第四章抽樣(1)三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)第四章抽樣(1)124三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)應(yīng)用舉例某地區(qū)有3000名學(xué)生參加學(xué)科競賽,現(xiàn)要從中抽取一個樣本對他們的成績進行分析,每個學(xué)生被抽到的概率均為1/15,試確定樣本容量,并說出抽樣步驟。設(shè)某校共有108名教師,為了支援西部的教育事業(yè),要從中隨機抽出16名教師組成暑期西部講師團。請用系統(tǒng)抽樣方法選出講師團成員。有人說,可以借用居民身份證號碼(18位)來進行央視春晚的收視率調(diào)查:在1~999中抽出一個隨機數(shù),比如632,那么身份證后三位是632的觀眾就是要調(diào)查的對象。你覺得這樣所獲得的樣本有代表性嗎?第四章抽樣(1)三、概率抽樣的方法2.系統(tǒng)抽樣(等距抽樣)第四章抽樣(1)125系統(tǒng)抽樣的優(yōu)缺點如何改進?優(yōu)點:(1)簡單易操作(2)當(dāng)對總體結(jié)構(gòu)有一定了解時,充分利用已有的信息對總體中的個體進行排隊后再抽樣,可提高抽樣效率(3)當(dāng)總體中的個體存在一種自然編號時,采用系統(tǒng)抽樣比較方便缺點:(4)當(dāng)在不了解樣本總體的情況下(如性別差異,經(jīng)濟基礎(chǔ),個人喜好,天氣因素等等),所抽出的樣本可能會有一定的偏差。第四章抽樣(1)系統(tǒng)抽樣的優(yōu)缺點如何改進?優(yōu)點:第四章抽樣(1)126三、概率抽樣的方法3.分層抽樣問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論