抽樣與母群體ppt課件_第1頁(yè)
抽樣與母群體ppt課件_第2頁(yè)
抽樣與母群體ppt課件_第3頁(yè)
抽樣與母群體ppt課件_第4頁(yè)
抽樣與母群體ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、抽樣與母群體(Samples and Populations) 各種抽樣方法 抽樣誤差 平均數(shù)抽樣分配 平均數(shù)抽樣誤差 信賴區(qū)間 t 分配 推估各種比例 摘要.前言因?yàn)樯鐣?huì)研討者是在有限的時(shí)間、精神、及經(jīng)濟(jì)資源的狀況下來(lái)進(jìn)行研討,她/他們極少能夠研討一個(gè)既存母群體內(nèi)的每一個(gè)成員。取而代之的,她/他們僅能研討樣本此一母群體中較少數(shù)目的個(gè)體(人)。經(jīng)由抽樣過(guò)程,社會(huì)研討者尋求從一個(gè)樣本(一個(gè)小群體)通則化(或概化)到整個(gè)母群體從這裏,樣本被抽取出來(lái)(一個(gè)大群體)。.隨機(jī)抽樣與非隨機(jī)抽樣社會(huì)研討者採(cǎi)取的抽樣方法,比起日常生活中所運(yùn)用的抽樣方法,往往考慮更為周詳且較具科學(xué)性。她/他們主要關(guān)切樣本對(duì)於整

2、個(gè)母群體而言能否具有足夠的代表性,並得以對(duì)母群體作出各種精確的通則。為了此類推論,研討者根據(jù)母群體中的任一成員能否具有同等機(jī)會(huì)被抽取出來(lái),以選取一種適當(dāng)?shù)某闃臃椒?。倘假設(shè)任何母群體成員均具有一種抽樣選擇的同等機(jī)會(huì),即是運(yùn)用一種隨機(jī)抽樣方法;否則,就是運(yùn)用非隨機(jī)抽樣方法。.各種抽樣方法(Sampling Methods)非隨機(jī)抽樣法(Nonrandom Samples)偶遇抽樣(accidental sampling)定額抽樣(quota sampling)判斷或立意抽樣(judgment or purposive sampling) 隨機(jī)抽樣法簡(jiǎn)單隨機(jī)抽樣(simple random samp

3、ling)系統(tǒng)抽樣(systematic sampling)分層抽樣(stratified sampling)結(jié)叢或多階段抽樣(cluster or multistage sampling).偶遇抽樣偶遇抽樣法乃是最普遍運(yùn)用的非隨機(jī)抽樣法,與我們?nèi)粘I钪械某闃映绦蜉^沒有差異,因?yàn)榇朔N抽樣方法完全建立在對(duì)於研討者來(lái)說(shuō),能否便利的想法之上。換言之,研討者僅僅包含最便利獲得的個(gè)案在她/他的樣本裏,並排除一切不方便獲得的樣本。.定額抽樣另外一種非隨機(jī)抽樣類型為定額抽樣法。在此一抽樣程序中,一個(gè)母群體的不同分類特徵,諸如年齡、性別、社會(huì)階級(jí)、或族群等,依比例被抽取出來(lái)根據(jù)它們?cè)诖艘荒溉后w中所佔(zhàn)的比例。

4、雖然性別或許在樣本中具有適當(dāng)?shù)拇硇?,但是其它的分類特徵如年齡或種族則沒有被顧及。定額抽樣法的不當(dāng)之處在於其對(duì)於各種要素控制的缺乏更甚於對(duì)於這些要素的定額設(shè)定。.判斷或立意抽樣第三種非隨機(jī)抽樣法為判斷或立意抽樣法。在此種抽樣類型中,邏輯、常識(shí)、或感覺判斷被用來(lái)選擇一個(gè)樣本,其代表一個(gè)較大的母群體。.隨機(jī)抽樣三個(gè)原則隨機(jī)抽樣包含以下三個(gè)原則:母體中的每一個(gè)成員都必須有同等機(jī)會(huì)成為樣本。換言之,抽樣架構(gòu)必須完好。母體中每一個(gè)成員被選中的機(jī)會(huì)必須是知的。我們必須確實(shí)知道我們所選擇母群體中任一位成員的機(jī)率,獨(dú)一方法是,在抽樣的每一個(gè)步驟中,知道有多少人是有資格被選出來(lái)的。一切被選擇的樣本應(yīng)該是彼此獨(dú)立

5、的(independent)。選擇母群體中任一位成員,不應(yīng)添加或減少另一位成員被選擇的機(jī)會(huì)。.簡(jiǎn)單隨機(jī)抽樣最根本的隨機(jī)抽樣法為簡(jiǎn)單隨機(jī)抽樣法。其能夠透過(guò)一種過(guò)程,例如現(xiàn)今極為熟習(xí)的技術(shù),將一切人的名字寫在紙條上並折疊好,放入一頂帽子裏,加以充分混合後,再抽出假設(shè)干名字。此一程序,讓母群體中任一成員具有同等抽樣選擇的機(jī)會(huì),因?yàn)槊恳粋€(gè)成員,且僅有一個(gè)成員,其名字會(huì)在紙條上。基於假設(shè)干緣由(包括研討者需求一個(gè)非常大的樣本時(shí)),社會(huì)研討者通常要抽取一個(gè)隨機(jī)樣本時(shí),並不是從帽子中來(lái)抽取名字。她/他們通常是運(yùn)用亂數(shù)表(table of random numbers)。.系統(tǒng)隨機(jī)抽樣一切隨機(jī)抽樣方法實(shí)際上都

6、是簡(jiǎn)單隨機(jī)抽樣變形。例如,系統(tǒng)隨機(jī)抽樣,在這裏,並不需求亂數(shù)表,因?yàn)槟溉后w一切成員的名單是被以固定的區(qū)間抽取出來(lái)。是以,運(yùn)用系統(tǒng)隨機(jī)抽樣,一個(gè)母群體中,每一個(gè)nth成員均包含在此一母群體的樣本中。系統(tǒng)隨機(jī)抽樣法的好處是不需求亂數(shù)表,其結(jié)果,此一方法比起簡(jiǎn)單隨機(jī)抽樣程序而言,較不費(fèi)時(shí),特別是從較大母群體中抽取樣本時(shí)。而其不利之處在於,系統(tǒng)隨機(jī)抽樣法假定了在母群體一切成員的名單上所處的位置不會(huì)影響到隨機(jī)性(randomness),假設(shè)此一假定沒有被嚴(yán)肅地對(duì)待,則其結(jié)果能夠會(huì)忽略某些母群體的成員,比起其他成員而言較不會(huì)被獲得。.分層抽樣分層抽樣法涉及到將母群體分成更多具同質(zhì)性的次團(tuán)體或階層(stra

7、ta),再?gòu)倪@些次團(tuán)體或階層中簡(jiǎn)單隨機(jī)抽取出樣本。階層化是建立在一個(gè)具同質(zhì)性的(homogeneous)團(tuán)體比起一個(gè)具異質(zhì)性的(heterogeneous)而言,祇需求一個(gè)較小的樣本。外表上而言,分層抽樣法與前面提及的定額抽樣法具有顯著的類似性,因?yàn)榇硕N程序通常需求以精確的比例來(lái)包含各種樣本的分類特徵它們是歸因於母群體。除了外表類似性外,定額與分層抽樣本質(zhì)上是不同的,因?yàn)槎~抽樣的成員是由調(diào)查者以任何方式抽取出來(lái),而分層抽樣的成員總是在一種隨機(jī)的基礎(chǔ)上而被選取出來(lái)。.結(jié)叢或多階段抽樣結(jié)叢或多階段抽樣法經(jīng)常是被用來(lái)減少大規(guī)模調(diào)查的本錢耗費(fèi)這類大規(guī)模調(diào)查需求訪員遊走於許多分散的地區(qū)。運(yùn)用結(jié)叢抽樣

8、法,至少會(huì)運(yùn)用到二個(gè)抽樣層級(jí):初級(jí)的抽樣單位或結(jié)叢,它們乃是良好劃分(well-delineated)的地理區(qū)域,在其中包含了母群體中所發(fā)現(xiàn)的各種分類特徵。在每一個(gè)結(jié)叢內(nèi)的樣本數(shù)目。.平均數(shù)抽樣分配(Sampling Distribution of Means)假設(shè)一個(gè)平均數(shù)為而標(biāo)準(zhǔn)差為的母體,其平均數(shù)的抽樣分配會(huì)有一個(gè)平均值,等於。也許有人接著會(huì)問,那抽樣分配的標(biāo)準(zhǔn)差呢?標(biāo)準(zhǔn)差在告訴我們不同的樣本之間變異的狀況,在只做一次抽樣時(shí),樣本的分?jǐn)?shù)與其平均數(shù)差異的情形稱為標(biāo)準(zhǔn)差,而當(dāng)我們進(jìn)行無(wú)限次抽樣時(shí),所得到的抽樣分配的一切平均數(shù),與這些平均數(shù)的平均的差異情形,即抽樣分配的標(biāo)準(zhǔn)差(請(qǐng)留意!這和標(biāo)準(zhǔn)

9、差的抽樣分配是不一樣的),會(huì)等於 ,其中N為樣本數(shù)。我們將此抽樣分配的標(biāo)準(zhǔn)差稱之為平均數(shù)之標(biāo)準(zhǔn)誤(standard error of the mean)。.另外,我們可以發(fā)現(xiàn)當(dāng)樣本數(shù)愈小時(shí),其平均數(shù)的抽樣分配則愈形擴(kuò)散,相反地,假設(shè)樣本數(shù)愈大時(shí),則平均數(shù)的抽樣分配則愈集中於抽樣分配之平均數(shù)附近。可是我們要留意的是,雖然樣本大小會(huì)改變抽樣分配的形狀,但是抽樣分配的平均數(shù)是不受樣本大小所影響的。 .平均數(shù)抽樣分配的特徵(Characteristics of a Sampling Distribution of Means)平均數(shù)抽樣分配有以下三個(gè)特徵:平均數(shù)抽樣分配近似於一個(gè)常態(tài)曲線一個(gè)平均數(shù)抽樣

10、分配的平均數(shù)(平均數(shù)的平均數(shù) the mean of means)等同於母群體的真正平均數(shù)一個(gè)平均數(shù)抽樣分配的標(biāo)準(zhǔn)差小於母群體的標(biāo)準(zhǔn)差上述平均數(shù)抽樣分配的特徵,即是為何能從樣本來(lái)對(duì)母群體作出可靠推論的才干之中心所在。.中央極限定理(central limit theorem)在抽樣分配的討論中,我們?cè)?jīng)提到抽樣分配的過(guò)程,我們發(fā)現(xiàn)當(dāng)樣本數(shù)愈大的時(shí)候,其分配的峰度也就愈尖,其尾端也就愈短,相反地,當(dāng)樣本數(shù)愈小的時(shí)候,其峰度較平,而尾端也就延伸得較廣。如此樣本大小會(huì)改變分配的狀態(tài),我們則稱之為中央極限定理(central limit theorem),我們將之應(yīng)用在描畫抽樣分配的狀態(tài),亦即當(dāng)我們從

11、母體中隨機(jī)抽出固定數(shù)目的樣本,不論母體的分配為何,當(dāng)樣本數(shù)愈大的時(shí)候,樣本平均數(shù)的抽樣分配會(huì)愈趨近常態(tài)分配,其抽樣分配的平均數(shù)會(huì)趨近於母體平均數(shù),其抽樣分配的標(biāo)準(zhǔn)誤約等於估計(jì)的標(biāo)準(zhǔn)差除以樣本數(shù)的平方根。換句話說(shuō),對(duì)任何平均數(shù)等於 和變異數(shù)等於 的母體而言,樣本平均數(shù)的分配是接近常態(tài)分配的,而這些平均數(shù)的平均( )等於,而其平均數(shù)的變異數(shù)( )則為 。.中央極限定理是一項(xiàng)數(shù)學(xué)上的定理,假設(shè)能滿足一些假設(shè),則可以幫助我們進(jìn)行統(tǒng)計(jì)的推論,要符合的三個(gè)假設(shè)是:假設(shè) 1:母體之平均數(shù)和變異數(shù)都是固定的。假設(shè) 2:抽樣必須是隨機(jī)的,母體中的每一個(gè)單位被抽中之機(jī)會(huì)都一樣。假設(shè) 3:每一次抽樣之樣本大小都必須

12、一樣。.平均數(shù)抽樣分配作為一個(gè)常態(tài)曲線(The Sampling Distribution of Means as a Normal Curve)在第五章中,我們學(xué)習(xí)到如何將一個(gè)原始分?jǐn)?shù)轉(zhuǎn)換成z分?jǐn)?shù),並可求出高於或低於此一原始分?jǐn)?shù)的面積比例。但是在本章中,我們所興趣的不在於求得與一個(gè)原始分?jǐn)?shù)分配相關(guān)聯(lián)的機(jī)率,我們將從事的是一個(gè)平均數(shù)的抽樣分配那些被我們從分?jǐn)?shù)的總母群體中隨機(jī)抽出並對(duì)這些平均數(shù)樣本作機(jī)率陳述。.平均數(shù)抽樣分配,求取z分?jǐn)?shù)公式如下:.平均數(shù)標(biāo)準(zhǔn)誤(Standard Error of the Mean)平均數(shù)標(biāo)準(zhǔn)誤,求法如下:借助於平均數(shù)標(biāo)準(zhǔn)誤,我們得已發(fā)現(xiàn)一切平均數(shù)的值之全距,在此

13、一全距中,母群體真正平均數(shù)能夠落在其上。我們也能夠推估母群體平均數(shù)確實(shí)地落在此一一切平均數(shù)的值之全距的機(jī)率(能夠性)。而此即為信賴水準(zhǔn)的概念。.信賴區(qū)間(Confidence Intervals)信賴區(qū)間的求算公式如下:.Confidence intervals for the mean with known population variance普通所謂95%的信賴區(qū)間估計(jì),乃是表示重複抽取樣本數(shù)為n的一切能夠樣本所建立的全部區(qū)間估計(jì)中,有95%的區(qū)間將會(huì)包含真正的母體平均數(shù),而僅有5%沒有包含母體平均數(shù)。但實(shí)際上我們通常僅抽取一個(gè)樣本,且u通常為未知,因此無(wú)法確切知道此樣天性否包含u,但我

14、們可以說(shuō)此區(qū)間有95%的機(jī)率會(huì)包含u.母體參數(shù):Mean = Variance =2每個(gè)區(qū)間=. t 分配倘假設(shè)我們更現(xiàn)實(shí)地思索,則我們知道母群體中變數(shù)的標(biāo)準(zhǔn)差()但卻不知道且須推估母群體的平均數(shù)(),這是沒有多大意義的。因?yàn)閮H有非常少數(shù)的情況下,母群體的標(biāo)準(zhǔn)差(且因此平均數(shù)的標(biāo)準(zhǔn)誤 )是知的。通常,我們不僅需求從一個(gè)樣本來(lái)推估母群體的平均數(shù),同時(shí)也需求從一樣的樣本來(lái)推估標(biāo)準(zhǔn)誤。在此一母群體的變異數(shù)或標(biāo)準(zhǔn)差未知的情況下,我們可以利用從樣本所得到的相關(guān)統(tǒng)計(jì)值來(lái)加以估計(jì)。惟此時(shí)不再運(yùn)用 z,而是運(yùn)用 t。.Characteristics of t distributiont分配是一群機(jī)率分配的組合,不同自在度對(duì)應(yīng)不同的t distribution的密度函數(shù),由於變異數(shù)較標(biāo)準(zhǔn)常態(tài)分配大,所以形狀較為矮胖。Standard nor

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論