樣本量的確定講課文檔_第1頁
樣本量的確定講課文檔_第2頁
樣本量的確定講課文檔_第3頁
樣本量的確定講課文檔_第4頁
樣本量的確定講課文檔_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

樣本量的確定現(xiàn)在一頁,總共八十八頁。本講主要內(nèi)容如何計算簡單隨機抽樣的樣本量確定如何實現(xiàn)分層抽樣中各層樣本單位數(shù)的分配現(xiàn)在二頁,總共八十八頁。樣本容量的確定樣本量=費用+精度(函數(shù))確定樣本容量,需要處理好預(yù)定的精度與現(xiàn)有經(jīng)費,同時也要考慮資源和時間等限制條件,最終的樣本量確定是在上述因素之間的權(quán)衡關(guān)系。

現(xiàn)在三頁,總共八十八頁。分層抽樣分配樣本的標(biāo)準(zhǔn)總的樣本容量事先確定估計值要求達(dá)到的精度預(yù)先給定現(xiàn)在四頁,總共八十八頁。影響調(diào)查樣本容量的因素調(diào)查估計值所希望達(dá)到的精度調(diào)查估計值所能允許的誤差。估計量的抽樣方差較小,估計值是精確的估計值的精度越高,所需的樣本容量就越大影響精度的因素也同樣影響著樣本容量的大小所研究指標(biāo)在總體中的變異程度總體的大小樣本設(shè)計和所使用的估計量無回答率現(xiàn)在五頁,總共八十八頁。

客戶提供的經(jīng)費能支持多大容量的樣本

整個調(diào)查持續(xù)的時間有多長

調(diào)查需要多少訪員

能招聘到的訪員有多少除了估計值的精度以外,調(diào)查實際操作的限制條件也許是影響樣本容量的最大因素?,F(xiàn)在六頁,總共八十八頁。1.給定精度水平下樣本容量的確定

樣本容量的大小與調(diào)查估計值所要求的精度緊密相關(guān)

數(shù)據(jù)是通過抽樣而不是普查收集的,就會產(chǎn)生抽樣誤差。精度是由抽樣方差來測量的。隨著樣本容量的增加,調(diào)查估計值的精度也會不斷提高。

現(xiàn)在七頁,總共八十八頁。標(biāo)準(zhǔn)誤差誤差界限變異系數(shù)抽樣方差的幾種計量方法抽樣調(diào)查中樣本容量的確定,也經(jīng)常會使用一種或多種這樣的計量方法來對精度進(jìn)行說明。現(xiàn)在八頁,總共八十八頁。非抽樣誤差非抽樣誤差會對調(diào)查估計值的精度產(chǎn)生顯著的影響非抽樣誤差的大小與樣本容量的大小卻沒有很大的關(guān)系確定樣本容量,就不必將這些誤差作為影響因素加以考慮為確保調(diào)查結(jié)果的準(zhǔn)確性,應(yīng)該消除非抽樣誤差,至少應(yīng)盡可能使之最小化現(xiàn)在九頁,總共八十八頁。由于我們將在某一給定誤差界限下,闡述樣本容量確定的過程,所以有必要復(fù)習(xí)一下置信區(qū)間的概念。對于具有正態(tài)分布的估計量來說,95%的置信區(qū)間意味著在同樣的條件下,反復(fù)抽樣100次所得的100個樣本中,有95個樣本的估計值所確定的區(qū)間包含總體真值,這個區(qū)間以樣本的估計值為中心,半徑為1.96倍的標(biāo)準(zhǔn)誤差。置信區(qū)間現(xiàn)在十頁,總共八十八頁。2.誤差界限誤差界限是標(biāo)準(zhǔn)誤差的倍數(shù)標(biāo)準(zhǔn)誤差是估計量抽樣方差的平方根乘數(shù)因子取決于在調(diào)查估計中所希望達(dá)到的置信水平(或稱置信度)現(xiàn)在十一頁,總共八十八頁。對于估計值t,在給定其標(biāo)準(zhǔn)誤差

t的情況下,置信區(qū)間的公式可以表示為:(t-z

tt+z

t)這里z

t是誤差界限,z是對應(yīng)于某一置信水平的標(biāo)準(zhǔn)正態(tài)分布的分位點值該z值可從標(biāo)準(zhǔn)正態(tài)分布表中查得,大多數(shù)統(tǒng)計學(xué)教材中都附有這樣的統(tǒng)計表現(xiàn)在十二頁,總共八十八頁。常用的z值包括對于90%的置信度,對應(yīng)的z值為1.64對于95%的置信度,對應(yīng)的z值為1.96對于99%的置信度,對應(yīng)的z值為2.56現(xiàn)在十三頁,總共八十八頁。3.多大的抽樣方差是可接受的調(diào)查估計值能容忍多大的不確定性?。常用的95%的置信度、±5%的誤差界限對我們的調(diào)查目標(biāo)是否適宜估計值是否需要更高(或更低)精度如果調(diào)查結(jié)果將用于進(jìn)行一項有重大意義或有較大風(fēng)險的決策,那么,估計值可能需要較高的精度;如果我們只是簡單地希望取得所研究總體某個特征的感性認(rèn)識,那么,稍低一點的精度就可以滿足要求了現(xiàn)在十四頁,總共八十八頁。多大抽樣方差是可以接受

是否需要對調(diào)查的子總體(或稱作域)進(jìn)行估計?調(diào)查結(jié)果可能需要包括一些細(xì)分的數(shù)據(jù)這些數(shù)據(jù)稱為子總體估計值(或域估計值)為使數(shù)據(jù)滿足調(diào)查要求,應(yīng)該確定合適的精度與調(diào)查估計值有關(guān)的抽樣方差有多大?現(xiàn)在十五頁,總共八十八頁。對于不同的子總體,對精度的要求可能有所不同

例如,在一次全國范圍的抽樣調(diào)查中,對國家層次的數(shù)據(jù),調(diào)查主辦者可能需要±3%的誤差界限;但對于省級層次的估計值,±5%的誤差界限可能就可以滿足要求;而對于省級以下層次的估計值,±10%的誤差界限可能就足夠了?,F(xiàn)在十六頁,總共八十八頁。在這種情況下,通常對每個研究域都進(jìn)行分層,并單獨計算各層的樣本容量將各個研究域中所有層的樣本容量相加,便得到了調(diào)查所需的總樣本容量現(xiàn)在十七頁,總共八十八頁。調(diào)查估計值有關(guān)的抽樣方差有多大為達(dá)到調(diào)查結(jié)果要求的精度,最小的調(diào)查估計值是什么?假設(shè)我們進(jìn)行比例估計。其中,一些指標(biāo)的比例可能是P=50%或更高,但是其它指標(biāo)的比例則可能較低,如P=5%或者P=10%事實上,P可以是P=0到P=1.0之間的任一數(shù)值。在確定調(diào)查估計值所需的精度時,應(yīng)該考慮當(dāng)某個既定精度達(dá)到時所得的最小估計值。如果最小的估計值是P=5%,那么誤差界限就應(yīng)該小于5%?,F(xiàn)在十八頁,總共八十八頁。例如:某公司決定,如果公司所在的地區(qū)中,至少有P=4%的人群對某一種產(chǎn)品存在需求,那么該公司就決定生產(chǎn)這種產(chǎn)品。因此,該公司的市場調(diào)研部準(zhǔn)備對當(dāng)?shù)氐木用褚豁椪{(diào)查,以便估計他們在這種產(chǎn)品上的消費需求。對于P=4%±5%水平左右的調(diào)查估計值就不太合適,應(yīng)規(guī)定更小的誤差界限,如小于或等于±0.01、±0.02等,這時候置信區(qū)間應(yīng)該是(0.05±0.01)或(0.05±0.02)?,F(xiàn)在十九頁,總共八十八頁。Table1樣本容量和在P=0.5時運用簡單隨機抽樣估計P值得到的誤差界限樣本容量誤差界限500.141000.105000.04510000.032現(xiàn)在二十頁,總共八十八頁。最佳的解決辦法不應(yīng)為追求最小的誤差界限而選擇最大可能的樣本可以接受一個較大的誤差界限,同時有效地利用現(xiàn)有資源在此基礎(chǔ)上,獲得具有相對較高精度的估計結(jié)果采用一個較小的樣本而不是大樣本而節(jié)省下來的費用,可以用來修正其它影響調(diào)查結(jié)果精度的因素例如減少無回答率(如回訪拒答者、實施小型的試點調(diào)查、培訓(xùn)訪員,等等),這樣做可能更有效率現(xiàn)在二十一頁,總共八十八頁。4.總體的變異程度

調(diào)查總體中,我們所研究的項目或指標(biāo),對于不同的個人、住戶或企業(yè),得到的估計結(jié)果可能會有很大的不同。雖然我們不能控制這種變異性,但它的大小卻影響到了給定精度水平下,研究項目所必需的樣本容量。

現(xiàn)在二十二頁,總共八十八頁。我們來看假設(shè)有一個首次開展的調(diào)查,試圖估計對某企業(yè)提供的服務(wù)持滿意態(tài)度的顧客比例。對“顧客滿意”這一指標(biāo),設(shè)置兩個可能的值:滿意或者不滿意。

現(xiàn)在二十三頁,總共八十八頁。表2列出了持滿意和不滿意態(tài)度的顧客可能占的比例的組合

1100%滿意0%滿意290%滿意10%滿意380%滿意20%滿意470%滿意30%滿意560%滿意40%滿意650%滿意50%滿意740%滿意60%滿意830%滿意70%滿意920%滿意80%滿意1010%滿意90%滿意110%滿意10%滿意現(xiàn)在二十四頁,總共八十八頁。要精確地測量總體中具有高度變異性或不經(jīng)常出現(xiàn)的特征是很困難的。要對這樣的變量提供精確的估計值,需要較大的樣本容量。當(dāng)研究的特征具有最大的變異程度時,調(diào)查需要的樣本容量也最大。對于只取兩個值的特征,則當(dāng)這兩個值在總體中以50—50的比例出現(xiàn)時,特征的變異程度最大。總體的變異程度

現(xiàn)在二十五頁,總共八十八頁。如果所研究特征的真實變異程度大于確定樣本容量時我們估計的變異程度,那么,調(diào)查估計值的精度就會低于期望的精度。相反,如果所研究特征的真實變異程度與我們所估計的變異程度相比要小,那么,與調(diào)查目標(biāo)所要求的估計值相比,抽樣調(diào)查得到的估計值會更加精確?,F(xiàn)在二十六頁,總共八十八頁。確保達(dá)到調(diào)查要求的精度對某一特征的總體變異程度進(jìn)行保守估計如果事先不知道調(diào)查中要測量特征變異程度的數(shù)據(jù),假定研究特征具有最大的變異程度對于只有兩個可能取值的變量,應(yīng)該假設(shè)總體中該變量的變異程度為兩個取值50—50平分。建議在計算所需樣本容量現(xiàn)在二十七頁,總共八十八頁。多個測量的指標(biāo)抽樣調(diào)查時,測量指標(biāo)(或稱項目,特征)通常不止一個,有時數(shù)目是很大的每個指標(biāo)的變異程度可能都不相同對某一指標(biāo)來說足夠大的樣本,對變異程度較大的另一個指標(biāo)來說可能就有些偏小為確保樣本容量對所有的研究指標(biāo)都足夠大,應(yīng)該根據(jù)具有最大變異程度或被認(rèn)為最重要的那個指標(biāo),確定樣本容量?,F(xiàn)在二十八頁,總共八十八頁。5.總體的大小總體所起的作用視它規(guī)模的大小而有所差異小規(guī)??傮w的大小將起重要作用對于中等規(guī)模的總體,其作用中等重要大總體的規(guī)模對樣本容量確定則不起作用在樣本容量確定的過程中現(xiàn)在二十九頁,總共八十八頁。表3:顯示了不同規(guī)模的總體在P=0.5時,使用簡單隨機抽樣,且以誤差界限為0.05、置信度為95%的標(biāo)準(zhǔn)估計P

所需的樣本容量總體規(guī)模所需的樣本量5044100805002221,0002865,00037010,000385100,0003981,000,00040010,000,000400現(xiàn)在三十頁,總共八十八頁。對于小規(guī)??傮w,通常必須調(diào)查較大比例的樣本,以取得所期望的精度。因此,實際操作中,對小規(guī)??傮w經(jīng)常采用普查而不是抽樣調(diào)查?,F(xiàn)在三十一頁,總共八十八頁。計算樣本容量時,通常假定采用的抽樣方式為簡單隨機抽樣(SRS)。所以,如果樣本容量計算公式假定為簡單隨機抽樣。6.樣本設(shè)計和估計量分層抽樣得到的估計值通常比相同規(guī)模的簡單隨機抽樣更精確,或者至少一樣精確。整群抽樣得到的估計值,其精度通常低于使用同一估計量進(jìn)行估計時的簡單隨機抽樣的估計值的精度現(xiàn)在三十二頁,總共八十八頁。設(shè)計效果因子一般來說,當(dāng)樣本容量的計算公式假定為簡單隨機抽樣SRS,但使用的是更復(fù)雜的選樣方式時,達(dá)到既定精度所需的樣本容量應(yīng)該乘以設(shè)計效果因子。設(shè)計效果=對于同樣規(guī)模的樣本容量,給定樣本設(shè)計下估計量的抽樣方差對簡單隨機抽樣估計量的抽樣方差的比率。對于簡單隨機抽樣設(shè)計,設(shè)計效果=1對于分層抽樣設(shè)計,設(shè)計效果

1

對于整群抽樣設(shè)計,設(shè)計效果1

現(xiàn)在三十三頁,總共八十八頁。7.回答率所有的調(diào)查都會遇到無回答的困擾即:由于某些原因,不能獲得被抽中樣本單位的信息當(dāng)一個被調(diào)查單位的所有或幾乎所有的數(shù)據(jù)都缺失時,我們就稱之為完全無回答(或稱單位無回答)某次調(diào)查的回答率是用調(diào)查得到的有效問卷數(shù)占預(yù)期樣本容量的一個百分比來表示的完全無回答會減少有效樣本的數(shù)量,從而會增加抽樣誤差,并進(jìn)而降低估計值的精度現(xiàn)在三十四頁,總共八十八頁。例如,如果初始樣本容量是400,而通過上述途徑估計的回答率為75%,那么選擇的樣本容量就應(yīng)該為:根據(jù)預(yù)計的回答率調(diào)整樣本容量現(xiàn)在三十五頁,總共八十八頁。一個最簡單的例子沒有無回答的簡單隨機抽樣樣本容量的計算公式簡單隨機抽樣下,通常使用誤差界限和估計量的標(biāo)準(zhǔn)誤來確定所需的樣本容量。

現(xiàn)在三十六頁,總共八十八頁。在無放回簡單隨機抽樣情況下總體均值估計量的標(biāo)準(zhǔn)誤差的表達(dá)式其中,S

是總體的標(biāo)準(zhǔn)差現(xiàn)在三十七頁,總共八十八頁。如果誤差界限設(shè)為e,那么:解n,得:這里Z是對應(yīng)于某一置信水平的標(biāo)準(zhǔn)正態(tài)分布的分位點值?,F(xiàn)在三十八頁,總共八十八頁。其中,總體方差S2是最不容易得到的,通常需要根據(jù)過去對類似總體所做的研究作近似計算。為確定n,需要知道期望的誤差界限e置信水平對應(yīng)的標(biāo)準(zhǔn)正態(tài)分布的分位點值Z總體規(guī)模N總體方差S2現(xiàn)在三十九頁,總共八十八頁。求比例樣本容量的確定下面用一個例子,說明估計比例問題時樣本容量的確定過程。在這一例子中,所需的精度是根據(jù)誤差界限確定的,所研究的指標(biāo)取兩個值,即P和1-P。

在這種情況下,對于大總體,且估計量服從正態(tài)分布時,P的總體方差為:現(xiàn)在四十頁,總共八十八頁。若總體真值已知,那么直接將它代入上面的等式就可以得到樣本容量若總體真值未知,而且也沒有以前的信息可以利用,那么可以P=0.5用,因為這時的方差最大,可以求得一個比較保守的樣本容量現(xiàn)在四十一頁,總共八十八頁。計算比例估計樣本容量的詳細(xì)步驟

先計算初始樣本容量,然后根據(jù)總體的大小、設(shè)計效果和回答率分別對它進(jìn)行調(diào)整,最后求得最終的樣本容量。現(xiàn)在四十二頁,總共八十八頁。第1步:計算初始樣本容量注意,公式(1)使用了有限總體校正因子n/N,對總體規(guī)模進(jìn)行校正。如果忽略這個因子,初始樣本容量n1就可以按下列公式計算:如果e

和P都不用比例表示,而用百分?jǐn)?shù)表示,

n1的計算公式同樣成立。現(xiàn)在四十三頁,總共八十八頁。第2步:使用下列等式對總體的大小進(jìn)行調(diào)整現(xiàn)在四十四頁,總共八十八頁。第3步:設(shè)計效果調(diào)整樣本容量如果樣本設(shè)計不是采用簡單隨機抽樣,那么可以使用下列公式,即用抽樣設(shè)計效果對樣本容量進(jìn)行調(diào)整:其中,是設(shè)計效果,并且有:在簡單隨機抽樣設(shè)計下,B=1,在分層抽樣設(shè)計下,B

1,在整群抽樣設(shè)計下,B1?,F(xiàn)在四十五頁,總共八十八頁。根據(jù)無回答再次進(jìn)行調(diào)整,以確定最終的樣本容量n其中,r=估計的回答率。第4步:無回答調(diào)整樣本容量現(xiàn)在四十六頁,總共八十八頁。樣本容量確定的例子下面用實例說明樣本容量的計算過程。例1.

某雜志出版商希望得到讀者對該雜志綜合滿意程度的估計值。通過郵寄調(diào)查,出版商可以聯(lián)系到所有的2500個訂戶。但是,由于時間的限制,出版商決定使用簡單隨機抽樣進(jìn)行電話調(diào)查。請問應(yīng)訪問多少個讀者?現(xiàn)在四十七頁,總共八十八頁。如果真實的總體比例落在總體比例的樣本估計值的

0.10范圍內(nèi),則該出版商將感到滿意。換句話說,誤差界限e為0.10。出版商希望調(diào)查估計值的置信度為95%,這就意味著20次抽樣中只有1次,所得的樣本估計值確定的置信區(qū)間不包含總體真值P,而且,Z=1.96。使用簡單隨機抽樣SRS。估計回答率為65%,即r=0.65。由于事先沒有關(guān)于顧客滿意度真實比例P的可利用的信息,因此,我們假定方差取最大的情況,即假設(shè)P=0.5。假設(shè)現(xiàn)在四十八頁,總共八十八頁。樣本容量的計算步驟第1步:計算初始樣本容量n1

注意,隨著P

趨向0.50,P(1-P)

的值將達(dá)到最大值,因此選擇P=0.5,可得到最保守的n1的估計值?,F(xiàn)在四十九頁,總共八十八頁。第2步:調(diào)整初始樣本容量將總體的大小這一影響樣本容量確定的因素也考慮進(jìn)來。 (記住,這一步只適于小規(guī)模總體以及中等規(guī)模的總體)現(xiàn)在五十頁,總共八十八頁。第3步:根據(jù)抽樣設(shè)計效果來調(diào)整樣本容量對這個例子來說,由于假設(shè)使用簡單隨機抽樣設(shè)計,所以取B=1?,F(xiàn)在五十一頁,總共八十八頁。第4步:根據(jù)無回答情況進(jìn)行調(diào)整確定最終的樣本容量n現(xiàn)在五十二頁,總共八十八頁。例2.現(xiàn)準(zhǔn)備實施一項民意調(diào)查,以決定贊成建立一個公園的居民的比例??傮w由所有在兩個城市和一個農(nóng)村地區(qū)居住的、年齡在18歲及以上的居民組成。通過從每個城市或農(nóng)村中各抽取一個簡單隨機樣本,可以得到一個分層隨機樣本。問每一層需要多大的樣本容量?現(xiàn)在五十三頁,總共八十八頁。總體的單位數(shù)為657,500總體在各層的分布情況如下:H層總體(Nh)1城市1400,0002城市2250,0003農(nóng)村地區(qū)7,500合計657,500所需要的樣本容量取決于調(diào)查對數(shù)據(jù)的具體要求,為此,可以考慮以下兩個方案?,F(xiàn)在五十四頁,總共八十八頁。方案一假設(shè)不需要得到各個層估計值的精度,而且如果整個地區(qū)的估計值達(dá)到95%的置信度、±5%的誤差界限,就認(rèn)為估計值足夠可靠了。由于沒有整個地區(qū)贊成建立省級公園居民比例的真值,所以我們假設(shè)P=0.5,預(yù)計回答率為50%。現(xiàn)在五十五頁,總共八十八頁。計算過程如下:第1步:計算初始樣本容量n現(xiàn)在五十六頁,總共八十八頁。第2步:計算初步修正的樣本容量n2(注意:如果

n1/N可以忽略不計,則可取n2=n1)現(xiàn)在五十七頁,總共八十八頁。第3步:根據(jù)設(shè)計效果,再次進(jìn)行調(diào)整n3對于分層隨機抽樣,通常

B<1。但這里,由于沒有可利用的B的估計值,因此,取B=1得到保守(即更大)的樣本容量。現(xiàn)在五十八頁,總共八十八頁。第4步:根據(jù)無回答情況確定最終的樣本容量n即根據(jù)該方案,調(diào)查所需的樣本容量為768?,F(xiàn)在五十九頁,總共八十八頁。方案二假設(shè)對每一層,都要求得到誤差界限為0.05、置信度為95%的估計結(jié)果,那么就需要單獨計算各層的樣本容量(即將每一層作為一個總體,估計調(diào)查所需的樣本容量)?,F(xiàn)在六十頁,總共八十八頁。計算之前,考慮到城市1和城市2是大總體,因而可以認(rèn)為,對它們來說,總體的大小對樣本容量的確定沒有影響。由此,如果第1、2層中的取值與案例1相同,就可以認(rèn)為這兩層需要的樣本容量都是768。然而,對于農(nóng)村地區(qū),由于總體是小規(guī)模的,因此總體的大小對該層樣本容量的確定會產(chǎn)生一定的影響?,F(xiàn)在六十一頁,總共八十八頁。計算步驟如下:城市1由于可以認(rèn)為所以現(xiàn)在六十二頁,總共八十八頁。城市2因為城市2也是一個大城市,所以,同樣可以忽略有限總體校正因子對樣本容量的影響:現(xiàn)在六十三頁,總共八十八頁。農(nóng)村地區(qū)因此,方案2所需的總樣本容量為768+768+732=2,268?,F(xiàn)在六十四頁,總共八十八頁。比較方案2的總樣本容量2,268和方案1的樣本容量768,可以發(fā)現(xiàn)方案2的樣本容量幾乎是方案1樣本容量的3倍之大。換句話說,如果僅僅需要得到包含所有層的整個總體的估計值,那么要求的樣本容量將大大小于需要分別對各層進(jìn)行估計時所需的樣本容量。因為對各層分別進(jìn)行估計時,需要確保使每一層的樣本容量都足夠大。兩種方案比較現(xiàn)在六十五頁,總共八十八頁。例2清楚地說明了要求對各研究域分別進(jìn)行估計時,審查每一層精度要求的重要性。但如果調(diào)查涉及到許多研究域,這一要求可能會使總的樣本容量顯著增大,并可能導(dǎo)致樣本容量超出調(diào)查研究者的預(yù)算和現(xiàn)有資源的承受能力。一般來說,要求估計的研究域越多,所需要的樣本容量也就越大。因此,可能需要在精度與費用之間進(jìn)行折衷,以保證估計的誤差在可接受的范圍之內(nèi)。通過增大每一層估計值的允許誤差,或合并其中兩個或多個域,就可以使精度和費用達(dá)成權(quán)衡。

現(xiàn)在六十六頁,總共八十八頁。分層抽樣的樣本分配決定分層抽樣效率的一個重要因素是樣本單位在層間的分配方式?,F(xiàn)在六十七頁,總共八十八頁。分層抽樣設(shè)計主要理由:使抽樣方案的效率高于簡單隨機抽樣或系統(tǒng)抽樣。確保對要進(jìn)行分析的特定研究域有足夠的樣本量,以便進(jìn)行分析。避免抽到一個“差的”樣本。

現(xiàn)在六十八頁,總共八十八頁。采用分層抽樣時,總體被分為同質(zhì)的、互不重疊的幾個子總體(層)。然后,在每一個層中獨立地抽取樣本。可以使用任何一種抽樣方法來對每個層進(jìn)行抽樣,從比較簡單的方法如簡單隨機抽樣、系統(tǒng)抽樣,到較復(fù)雜的方法如概率與大小成比例的抽樣(PPS)、整群抽樣、多階段抽樣或多相抽樣。

現(xiàn)在六十九頁,總共八十八頁。包含N個單位的總體,被分成大小分別為:

N1,N2,…,NL的L個互不重疊的子總體(層)。其中:N=N1+N2+…+NL。

從每層中分別獨立抽取一個樣本,各層內(nèi)樣本容量分別為nh(h=1,2,…,L)。

其中:n=n1+n2+…+nL?,F(xiàn)在七十頁,總共八十八頁。分層抽樣分配樣本的標(biāo)準(zhǔn)固定樣本容量:先確定總的樣本容量,然后再在層間分配樣本。固定變異系數(shù):先根據(jù)預(yù)定的精度,確定每層所需樣本容量,然后將各層的樣本容量加總得到總的樣本容量?,F(xiàn)在七十一頁,總共八十八頁。固定樣本容量第一步:確定總的樣本容量n第二步:計算分配給第h層的樣本比例ahah=nh/n0<ah<1且第三步:計算第h層的樣本容量

nh=nah現(xiàn)在七十二頁,總共八十八頁。給定變異系數(shù)C下總樣本容量n的計算Nh是第h層單位總數(shù)Sh2是第h層單位yi的真實方差C是Y的總體變異系數(shù)Y是總體總值的真值ah是分配給第h層的樣本比例現(xiàn)在七十三頁,總共八十八頁。分配方法按比例分配不按比例分配現(xiàn)在七十四頁,總共八十八頁。按比例分配每一層的樣本容量nh與該層的總體規(guī)模Nh的比例相同,即各層的抽樣比fh=nh/Nh是相同的,并等于總的抽樣比n/N。

層的規(guī)模越大,分配的樣本容量越就越多。現(xiàn)在七十五頁,總共八十八頁。例2方案1中,計算總樣本容量=768,按比例分配方法的各層樣本容量確定如下:第一步:計算各層的分配因子ah城市1城市2農(nóng)村現(xiàn)在七十六頁,總共八十八頁。第二步:計算各層樣本容量nh城市1城市2農(nóng)村現(xiàn)在七十七頁,總共八十八頁。h層層規(guī)模(Nh)ahnhfh1城市1400,0000.60844670.00122城市2250,0000.38022920.00123農(nóng)村地區(qū)7,5000.011490.0012合計657,50017680.0012各層抽樣比相等,均為0.0012,得到一個自加權(quán)的樣本設(shè)計?,F(xiàn)在七十八頁,總共八十八頁。不按比例分配采用不按比例分配方案時,各層之間的抽樣比不相同。

Y-比例分配平方根N-比例分配平方根Y-比例分配最優(yōu)分配內(nèi)曼最優(yōu)分配層方差相等最優(yōu)分配

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論