抽樣調(diào)查-第3章分層隨機(jī)抽樣課件_第1頁(yè)
抽樣調(diào)查-第3章分層隨機(jī)抽樣課件_第2頁(yè)
抽樣調(diào)查-第3章分層隨機(jī)抽樣課件_第3頁(yè)
抽樣調(diào)查-第3章分層隨機(jī)抽樣課件_第4頁(yè)
抽樣調(diào)查-第3章分層隨機(jī)抽樣課件_第5頁(yè)
已閱讀5頁(yè),還剩191頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

§3.1引言一、定義先將總體N個(gè)單元?jiǎng)澐殖蒐個(gè)互不重復(fù)的子總體,每個(gè)子總體稱為層,它們的大小分別為

然后,在每個(gè)層中獨(dú)立地進(jìn)行抽樣,稱為分層抽樣.§3.1引言一、定義先將總體N個(gè)單元?jiǎng)澐殖蒐個(gè)二、作用分層抽樣在實(shí)際工作中應(yīng)用的非常廣泛,主要是因?yàn)樗哂衅渌闃臃椒ㄋ鶝](méi)有的特點(diǎn):1.分層抽樣的抽樣效率較高,也就是說(shuō),分層抽樣的估計(jì)精度較高。2.分層抽樣不僅能對(duì)總體指標(biāo)進(jìn)行推算,而且能對(duì)各層指標(biāo)進(jìn)行推算。3.層內(nèi)抽樣方法可以不同,而且便于抽樣工作的組織。二、作用分層抽樣在實(shí)際工作中應(yīng)用的非常廣泛,主要是因?yàn)樗哂腥?、使用?chǎng)合在對(duì)分層進(jìn)行具體劃分時(shí),通??紤]如下原則:1.層內(nèi)單元具有相同性質(zhì),通常按調(diào)查對(duì)象的不同類型進(jìn)行劃分。2.盡可能使層內(nèi)單元的標(biāo)志值相近,層間單元的差異盡可能大。3.既按類型又按層內(nèi)單元標(biāo)志值相近的原則進(jìn)行多重分層,同時(shí)達(dá)到實(shí)現(xiàn)估計(jì)類值以及提高估計(jì)精度的目的。4.抽樣組織實(shí)施的方便,通常按行政管理機(jī)構(gòu)設(shè)置進(jìn)行分層。三、使用場(chǎng)合在對(duì)分層進(jìn)行具體劃分時(shí),通??紤]如下原則:1.層四、符號(hào)說(shuō)明我們用下標(biāo)h表示層號(hào)(h=1,2,……,L)。關(guān)于第h層的記號(hào)如下:?jiǎn)卧倲?shù):樣本單元數(shù):第i個(gè)單元標(biāo)志值(觀察值):四、符號(hào)說(shuō)明我們用下標(biāo)h表示層號(hào)單元總數(shù):樣本單元數(shù):第i單元權(quán)數(shù):總體均值:第L層總體方差:?jiǎn)卧獧?quán)數(shù):總體均值:第L層總體方差:抽樣比:樣本均值:第L層樣本方差:抽樣比:樣本均值:第L層樣本方差:§3.2簡(jiǎn)單估計(jì)量及其性質(zhì)一、總體均值的估計(jì)1.估計(jì)量的定義總體均值的估計(jì):=如果得到的是分層隨機(jī)樣本,則總體均值的簡(jiǎn)單估計(jì)為:§3.2簡(jiǎn)單估計(jì)量及其性質(zhì)一、總體均值的估計(jì)1.估計(jì)量的2.估計(jì)量的性質(zhì)性質(zhì)一

對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì)(h=1,2,……,L),則是的無(wú)偏估計(jì)。的方差為:V()=值得注意的是:只要對(duì)各層估計(jì)是無(wú)偏的,則對(duì)總體的估計(jì)也是無(wú)偏的。

因此,各層可以采用不同的抽樣方法,只要相應(yīng)的估計(jì)量是無(wú)偏的,則對(duì)整體的推算也是無(wú)偏的。2.估計(jì)量的性質(zhì)性質(zhì)一對(duì)于一般的分層抽樣,如果是的無(wú)偏性質(zhì)一的證明:由于對(duì)每一層有因此性質(zhì)一的證明:由于對(duì)每一層有因此性質(zhì)二

對(duì)于分層簡(jiǎn)單隨機(jī)抽樣,是的無(wú)偏估計(jì),的方差為:性質(zhì)二對(duì)于分層簡(jiǎn)單隨機(jī)抽樣,是的無(wú)偏估計(jì),的方差為:性質(zhì)二的證明:若各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,對(duì)每一層有由第二章性質(zhì)二得因此性質(zhì)二的證明:若各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,由第二章性質(zhì)二得因性質(zhì)三

對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為:性質(zhì)三對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為:性質(zhì)三的證明:對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,由第二章性質(zhì)三,得因此,的一個(gè)無(wú)偏估計(jì)為:性質(zhì)三的證明:對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行因此,的一個(gè)無(wú)偏二、總體總量的估計(jì)1.估計(jì)量的定義總體總量Y的估計(jì)為:如果得到的是分層隨機(jī)樣本,則總體總量Y的簡(jiǎn)單估計(jì)為:2.估計(jì)量的性質(zhì)由于與只差一個(gè)常數(shù),因此,與具有相同的性質(zhì)。二、總體總量的估計(jì)1.估計(jì)量的定義總體總量Y的性質(zhì)一

對(duì)于一般的分層隨機(jī)抽樣,如果是的無(wú)偏估計(jì),則是的無(wú)偏估計(jì),的方差為:性質(zhì)二

對(duì)于分層隨機(jī)抽樣,的方差為:=性質(zhì)一對(duì)于一般的分層隨機(jī)抽樣,如果是的無(wú)偏估計(jì),則是的=性質(zhì)三

對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為:【例3.1】

調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出,以居民戶為調(diào)查單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶劃分為4層,每層按簡(jiǎn)單隨機(jī)抽樣抽出10戶,調(diào)查獲得如下數(shù)據(jù)(單位:元)估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及估計(jì)的標(biāo)準(zhǔn)差。(數(shù)據(jù)見下表)=性質(zhì)三對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為:【例3.1】

樣本戶奶制品年消費(fèi)支出層居民戶總數(shù)樣本戶奶制品年消費(fèi)支出(元)1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025樣本戶奶制品由上表,N=2850,各層的層權(quán)及抽樣比為:),4,3,2,1(,10==hnh由上表,N=2850,各層的層權(quán)及抽樣比為:),4,3,2,各層樣本均值及樣本方差為:同理有各層樣本均值及樣本方差為:同理有因此,估計(jì)奶制品年消費(fèi)總支出為:估計(jì)量方差及標(biāo)準(zhǔn)差的樣本估計(jì)因此,估計(jì)奶制品年消費(fèi)總支出為:估計(jì)量方差及標(biāo)準(zhǔn)差的樣本估計(jì)三、總體比例的估計(jì)1.估計(jì)量的定義總體比例P的估計(jì)為:2.估計(jì)量的性質(zhì)如果定義第i個(gè)單元具有所考慮的特征;其他。(i=1,2,…,N)則對(duì)總體比例的估計(jì)類似對(duì)總體均值的估計(jì),這時(shí),與具有同樣的性質(zhì)。三、總體比例的估計(jì)1.估計(jì)量的定義總體比例P的估計(jì)為:2的無(wú)偏估計(jì)(h=1,2,…,L),則性質(zhì)一

對(duì)于一般的分層隨機(jī)抽樣,如果是P的無(wú)偏估計(jì)。的方差為:性質(zhì)二

對(duì)于分層隨機(jī)抽樣,是P的無(wú)偏估計(jì)。證明:注意到及因而的方差為:的無(wú)偏估計(jì)(h=1,2,…,L),則性質(zhì)一對(duì)于一般的性質(zhì)三

對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為V()性質(zhì)三對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為V()【例3.2】

在例3.1的調(diào)查中,同時(shí)調(diào)查了居民擁有家庭電腦的情況,獲得如下數(shù)據(jù)(單位:臺(tái)),如表3.2。估計(jì)該地區(qū)居民擁有家庭電腦的比例及估計(jì)的標(biāo)準(zhǔn)差。(數(shù)據(jù)見下表)【例3.2】在例3.1的調(diào)查中,同時(shí)調(diào)查了居民擁有家庭電腦

樣本戶擁有家庭電腦情況層居民戶總數(shù)樣本戶擁有家庭電腦情況12345678910120000010001002400010000001037501100001010415001000000000表3.2樣本戶擁有家解:由上表可得該地區(qū)居民擁有家庭電腦比例的估計(jì)為:估計(jì)量的方差為:解:由上表可得該地區(qū)居民擁有家庭電腦比例的估計(jì)為:估計(jì)量的方§3.3比率估計(jì)量及其性質(zhì)

將比率估計(jì)的思想和技術(shù)用于分層隨機(jī)樣本時(shí),對(duì)總體參數(shù)的估計(jì)有兩種途徑:一種是對(duì)每層樣本分別考慮比估計(jì)量,然后對(duì)各層的比估計(jì)量進(jìn)行加權(quán)平均,此時(shí)所得的估計(jì)量稱為分別估計(jì)(separateratioestimator);另一種是對(duì)比率的分子、分母分別加權(quán)計(jì)算出分層估計(jì)量,然后用對(duì)應(yīng)的估計(jì)量來(lái)構(gòu)造比估計(jì),這樣所得的估計(jì)量稱為聯(lián)合比估計(jì)(combinedratioestimator).§3.3比率估計(jì)量及其性質(zhì)將比率估計(jì)的思1.分別比率估計(jì)總體均值總體總量的分層比率估計(jì)為:總體均值:總體總量:層權(quán)L:層數(shù)為的比率估計(jì),為比率估計(jì)1.分別比率估計(jì)總體均值總體總量的分層比率估計(jì)為:總體均值:比率估計(jì)量的方差:式中,分別為第i層指標(biāo)Y,X的方差及相關(guān)系數(shù).

分別比率估計(jì)量要求每一層的樣本量都比較大,否則,偏倚可能比較大.比率估計(jì)量的方差:式中,分別為第i層指標(biāo)Y,X的方差及相關(guān)2.聯(lián)合比率估計(jì)(combinedratioestimator)總體均值:總體總量:式中:表示的無(wú)偏估計(jì);表示的無(wú)偏估計(jì).均方誤差為:2.聯(lián)合比率估計(jì)(combinedratioestima3.分別比率估計(jì)量與聯(lián)合比率估計(jì)量的比較一般而言,分別比率估計(jì)量的方差小于聯(lián)合比率估計(jì)量的方差。但當(dāng)每層的樣本量不太大時(shí),還是采用聯(lián)合比率估計(jì)量更可靠些,因?yàn)檫@時(shí)分別比率估計(jì)量的偏倚很大,從而使總的均方誤差增大。實(shí)際使用時(shí),如果各層的樣本量都較大,且有理由認(rèn)為各層的比率Rh差異較大,則分別比率估計(jì)優(yōu)于聯(lián)合比率估計(jì)。當(dāng)各層的樣本量不大,或各層比率Rh差異很小,則聯(lián)合比率估計(jì)更好些。3.分別比率估計(jì)量與聯(lián)合比率估計(jì)量的比較一般而言,分別比率估【例4.4】

某市1996年對(duì)950家港口生產(chǎn)單位完成的吞吐量進(jìn)行了調(diào)查,1997年欲對(duì)全市港口生產(chǎn)單位完成的吞吐量進(jìn)行調(diào)查。對(duì)港口生產(chǎn)單位按非國(guó)有(h=1)和國(guó)有(h=2)分為兩層,單位數(shù)分別為800家和150家,分別在兩層中調(diào)查了10家和15家港口生產(chǎn)單位,調(diào)查數(shù)據(jù)如下表,試計(jì)算1997年全市港口生產(chǎn)單位完成的吞吐量。1997年國(guó)有和非國(guó)有企業(yè)調(diào)查數(shù)據(jù)如下頁(yè)【例4.4】某市1996年對(duì)950家港口生產(chǎn)單位完成的19ixiyiixiyi19580149553022202102210320335938433604964120117423040051771805600651625325861000880730234977005608332286811001230927221597208231013797103103901147846512817650139191160141160107015735698ixiyiixiyi19580149553022202102(將上述數(shù)據(jù)計(jì)算的中間結(jié)果列于P77的表中)1.按分別比率估計(jì)量估計(jì)(將上述數(shù)據(jù)計(jì)算的中間結(jié)果列于P77的表中)1.按分別比率估2.按聯(lián)合比率估計(jì)量估計(jì)

按聯(lián)合比率估計(jì)量估計(jì)比按分別比率估計(jì)量估計(jì)要好一些!2.按聯(lián)合比率估計(jì)量估計(jì)按聯(lián)合比率估計(jì)量三、分別比率估計(jì)與聯(lián)合比率估計(jì)的比較具體情況分析參看教材P87三、分別比率估計(jì)與聯(lián)合比率估計(jì)的比較具體情況分析參看教材P8§3.4回歸估計(jì)量及其性質(zhì)

與比估計(jì)相似,將回歸估計(jì)的思想和技術(shù)用于分層隨機(jī)抽樣時(shí),同樣有兩種方法:一種是對(duì)每層樣本分別求取回歸估計(jì)量,然后對(duì)各層的回歸估計(jì)量進(jìn)行加權(quán)平均,此時(shí)所得的估計(jì)量稱為分別回歸估計(jì)(separateregressionestimator);

另一種是對(duì)兩個(gè)變量先分別計(jì)算出分層簡(jiǎn)單估計(jì)量然后再對(duì)它們的分層簡(jiǎn)單估計(jì)量來(lái)構(gòu)造回歸估計(jì),這時(shí)所得的估計(jì)量稱為聯(lián)合回歸估計(jì)(combinedregressionestimator).§3.4回歸估計(jì)量及其性質(zhì)與比估計(jì)相似,1.分別回歸估計(jì)(separateregressionestimator)總體均值的估計(jì):總體總量的估計(jì):1.分別回歸估計(jì)(separateregressione

當(dāng)各層的回歸系數(shù)為事先給定的常數(shù)時(shí),分別回歸估計(jì)量是無(wú)偏的。其方差為:其中是第h層的回歸系數(shù)當(dāng)各層的回歸系數(shù)為事先給定的常數(shù)時(shí),其方差為:其中并且當(dāng)時(shí),達(dá)到最小,即通常未知,可用回歸系數(shù)作為的估計(jì):并且當(dāng)時(shí),達(dá)到最小,即通常未知,可用回歸系數(shù)作為的估計(jì):注意(1)分別回歸估計(jì)量是有偏的,但當(dāng)每一層的樣本量都很大時(shí),估計(jì)的偏倚可以忽略,其方差近似為:(2)這里是子總體的回歸系數(shù),是子總體樣本的回歸系數(shù),前者是未知的,后者是可知的。注意(1)分別回歸估計(jì)量是有偏的,但當(dāng)每一層的樣(2)這方差的樣本估計(jì)值為:式中,

分別回歸估計(jì)量要求每一層的樣本量都較大,如果這個(gè)條件得不到滿足,則分別回歸估計(jì)量的偏倚可能很大,這時(shí),采用聯(lián)合回歸估計(jì)量更好些。方差的樣本估計(jì)值為:式中,分別回歸估計(jì)量要求每一層的樣本2.聯(lián)合回歸估計(jì)(combinedregressionestimator)總體均值的估計(jì):總體總量的估計(jì):式中,分別為的分層估計(jì)。是無(wú)偏的,其方差為:2.聯(lián)合回歸估計(jì)(combinedregression并且,只要β取時(shí),達(dá)到最小。當(dāng)回歸系數(shù)未知時(shí),取β為的樣本估計(jì):這時(shí),聯(lián)合回歸估計(jì)量是有偏的,但當(dāng)樣本量n較大時(shí),估計(jì)的偏倚可以忽略,其方差近似為:并且,只要β取時(shí),達(dá)到最小。當(dāng)回歸系數(shù)未知時(shí),取β為的樣本估方差的樣本估計(jì)為:方差的樣本估計(jì)為:分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較

當(dāng)回歸系數(shù)設(shè)定時(shí),分別回歸估計(jì)優(yōu)于聯(lián)合回歸估計(jì);當(dāng)回歸系數(shù)由樣本估計(jì)時(shí),如果各層的樣本量不太小,采用分別回歸估計(jì)為宜.

否則,采用聯(lián)合回歸估計(jì)為好!分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較當(dāng)回歸系數(shù)設(shè)定【例4.6】(續(xù)例4.4)利用回歸估計(jì)量估計(jì)該市港口生產(chǎn)單位1997年完成的吞吐量。解:樣本回歸系數(shù):h=1,非國(guó)有h=2,國(guó)有1.070170.856402則按分別回歸估計(jì)量估計(jì):(見P85)【例4.6】(續(xù)例4.4)利用回歸估計(jì)量估計(jì)該市港口生產(chǎn)單位按聯(lián)合回歸估計(jì)量估計(jì):(見教材P86)

從本題看,聯(lián)合回歸估計(jì)量比分別回歸估計(jì)量要優(yōu)一些!按聯(lián)合回歸估計(jì)量估計(jì):(見教材P86)從本題看,聯(lián)

分別比率估計(jì)、聯(lián)合比率估計(jì)、分別回歸估計(jì)和聯(lián)合回歸估計(jì)的比較(參看教材P96.【例3.3】)分別比率估計(jì)、聯(lián)合比率估計(jì)、分別回歸比率估計(jì)與回歸估計(jì)總結(jié):

在分層隨機(jī)抽樣中,當(dāng)有輔助變量信息可以利用時(shí),我們可以采用分別比率估計(jì)、聯(lián)合比率估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)方法。在選用這些估計(jì)量時(shí),要注意以下幾個(gè)問(wèn)題:1、比估計(jì)是有偏估計(jì)量,當(dāng)各層樣本量都較大時(shí)兩種比估計(jì)都近似無(wú)偏;當(dāng)某些層的樣本量不夠大,而總樣本量較大時(shí),聯(lián)合比率估計(jì)近似無(wú)偏。比率估計(jì)與回歸估計(jì)總結(jié):1、比估計(jì)是有偏估計(jì)量,當(dāng)各層樣本

2、在回歸估計(jì)中,若事先設(shè)定回歸系數(shù),其估計(jì)量無(wú)偏;若用樣本回歸系數(shù)作為回歸估計(jì)系數(shù),其估計(jì)量有偏,但在大樣本情況下近似無(wú)偏。

3、當(dāng)主要變量Y和輔助變量X高度相關(guān)時(shí),比率估計(jì)和回歸估計(jì)都是有效的,且能大幅度地提高估計(jì)精度。2、在回歸估計(jì)中,若事先設(shè)定回歸系數(shù),其估計(jì)量3、§3.3樣本量在各層的分配對(duì)于分層抽樣,當(dāng)總的樣本量一定時(shí),還需研究各層應(yīng)該分配多少樣本量的問(wèn)題,因?yàn)閷?duì)總體推算時(shí),估計(jì)量的方差與各層的方差有關(guān),還與各層所分配的樣本量有關(guān)。一、比例分配這里的比例分配指的是按各層單元數(shù)占總體單元數(shù)的比例,也就是按各層的層權(quán)進(jìn)行分配,這時(shí)對(duì)于分層抽樣,這時(shí)總體均值的估計(jì)是:§3.3樣本量在各層的分配對(duì)于分層抽樣,當(dāng)總的樣本量一定總體比例P的估計(jì)是:

這是因?yàn)榭傮w中的人一單元,不管它在哪一層,以同樣的概率入樣,因此按比例分配的分層隨機(jī)樣本,估計(jì)量的形式特別簡(jiǎn)單。這種樣本也稱為自加權(quán)的樣本。總體比例P的估計(jì)是:這是因?yàn)榭傮w中的人一抽樣調(diào)查-第3章分層隨機(jī)抽樣課件二、最優(yōu)分配1.最優(yōu)分配如果我們考慮簡(jiǎn)單線性費(fèi)用函數(shù),總費(fèi)用則最優(yōu)分配是:二、最優(yōu)分配1.最優(yōu)分配如果我們考慮簡(jiǎn)單線性費(fèi)用函數(shù),總費(fèi)用證明:作拉格朗日函數(shù),求條件極值:證明:作拉格朗日函數(shù),求條件極值:解得:由此得出下面的準(zhǔn)則:

如果某一層單元數(shù)較多,內(nèi)部差異較大,費(fèi)用比較省,則對(duì)這一層的樣本量要多分配些,解得:由此得出下面的準(zhǔn)則:如果某一層單元數(shù)較多2.Neyman(內(nèi)曼)分配對(duì)于分層隨機(jī)樣本,作為特例,如果每一層的費(fèi)用相同,即時(shí),最優(yōu)分配可簡(jiǎn)化為:這種分配稱為Neyman分配.這時(shí),達(dá)到最小。2.Neyman(內(nèi)曼)分配對(duì)于分層隨機(jī)樣本,作為特例,【例3.3】續(xù)例3.1如果樣本量仍為n=40,則按比例分配和Neyman分配時(shí),各層的樣本量應(yīng)為多少?(見#17)解:按比例分配時(shí),各層的樣本量為:即各層的樣本量分別為3,6,11,20.【例3.3】續(xù)例3.1如果樣本量仍為n=40,則按比例分對(duì)于Neyman分配,根據(jù)前面計(jì)算所得的各層權(quán)數(shù)和方差,得到:對(duì)于Neyman分配,根據(jù)前面計(jì)算所得的各層因此,按Neyman分配時(shí),各層應(yīng)分配的樣本量為:即各層的樣本量分別為3,7,23,7.因此,按Neyman分配時(shí),各層應(yīng)分配的樣本量為:即各層的樣【例3.5】某市有甲、乙兩個(gè)地區(qū),現(xiàn)進(jìn)行家庭收入的調(diào)查。令n=500,已知甲地區(qū)共有20000戶居民,乙地區(qū)共有50000戶居民;甲地區(qū)居民和乙地區(qū)居民年收入標(biāo)準(zhǔn)差估計(jì)分別為;同時(shí)對(duì)甲地和乙地每戶的平均抽樣費(fèi)用之比為2:3,請(qǐng)分別計(jì)算出甲地和乙地進(jìn)行比例分配、一般最優(yōu)分配(考慮費(fèi)用因素)以及內(nèi)曼分配(不考慮費(fèi)用因素)的樣本量?!窘狻扛鶕?jù)已知的數(shù)據(jù),通過(guò)計(jì)算整理可得下表:【例3.5】某市有甲、乙兩個(gè)地區(qū),現(xiàn)進(jìn)行家庭收入【解】根據(jù)已h1200000.285725002713.2857505.07632500000.7143200031428.5714823.7861總計(jì)700001.0000---------2141.85711328.8624關(guān)于樣本量分配的計(jì)算(1)比例分配。h1200000.285725002713.2857505.(2)一般最優(yōu)分配(2)一般最優(yōu)分配(3)內(nèi)曼分配(3)內(nèi)曼分配結(jié)果比較,對(duì)比上面三組結(jié)果可以發(fā)現(xiàn):●一般最優(yōu)分配在乙地所抽取的樣本量是最小的。這是因?yàn)橐话阕顑?yōu)分配考慮了費(fèi)用問(wèn)題,在乙地抽樣的單位平均費(fèi)用較高,所以最優(yōu)的原則應(yīng)是適當(dāng)增加甲地的樣本量,減少乙地的樣本量?!褚话阕顑?yōu)分配和內(nèi)曼分配在甲地的樣本量都比比例分配大,這是因?yàn)榧椎乜傮w的方差較大。為了保證估計(jì)量方差小,子總體方差大的就要多抽些樣本,否則就要少抽樣本。結(jié)果比較,對(duì)比上面三組結(jié)果可以發(fā)現(xiàn):3.某些層要求大于100%抽樣時(shí)的修正又比較大,則可能按最優(yōu)分配計(jì)算的這個(gè)層的樣按最優(yōu)分配時(shí),可能抽樣比較大,某個(gè)層的本量超過(guò)的情況.若出現(xiàn)這種情況,則對(duì)該層進(jìn)行不100%的抽樣,即3.某些層要求大于100%抽樣時(shí)的修正又比較大,則可能按最優(yōu)§3.4樣本量的確定(1)一般公式令其中已經(jīng)選定,于是當(dāng)方差V給定時(shí),有§3.4樣本量的確定(1)一般公式令其中已經(jīng)選定,于是當(dāng)?shù)玫酱_定樣本量的一般公式為:令則得到確定樣本量的一般公式為:令則(2)若按比例分配:將代入上式可得(2)若按比例分配:(3)內(nèi)曼分配:將代入上面兩式可得:(3)內(nèi)曼分配:(4)最優(yōu)分配:將代入上式可得:(4)最優(yōu)分配:即d:絕對(duì)誤差;r:相對(duì)誤差;t:標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)α分位數(shù);這時(shí),樣本量的一般形式可以表示為:如果估計(jì)精度是以誤差限的形式給出即d:絕對(duì)誤差;如果估計(jì)精度是以誤差限的形式給出

下面將分別給出比例分配、內(nèi)曼分配和最優(yōu)分配時(shí)的樣本量分配形式:下面將分別給出比例分配、內(nèi)曼分配和最(1)若按比例分配:將代入上式可得(1)若按比例分配:(2)當(dāng)按Neyman分配時(shí),(2)當(dāng)按Neyman分配時(shí),(3)最優(yōu)分配時(shí):將代入上式可得:(3)最優(yōu)分配時(shí):[例3.4](續(xù)例3.1)如果要求在95%置信度下,相對(duì)誤差不超過(guò)10%,則按比例分配和Neyman分配時(shí),總樣本量分別為多少?解:當(dāng)按比例分配時(shí):由前面的計(jì)算結(jié)果,可以得到各層的Whs2h。[例3.4](續(xù)例3.1)如果要求在95%置信度下,相對(duì)誤差在95%置信度時(shí),對(duì)應(yīng)的t=1.96,又因此得到由此可以得到對(duì)進(jìn)行修正,得到修正后的n在95%置信度時(shí),對(duì)應(yīng)的t=1.96,又因此得到由此可以2.最優(yōu)分配需要考慮費(fèi)用時(shí)的情形在最優(yōu)分配時(shí),如果考慮費(fèi)用為簡(jiǎn)單線性函數(shù)則由式(3.21)有:當(dāng)方差V給定時(shí),代入式(3.24)得到樣本量為:2.最優(yōu)分配需要考慮費(fèi)用時(shí)的情形在最優(yōu)分配時(shí),如果考慮費(fèi)用為§3.5分層時(shí)的若干問(wèn)題1.抽樣效果分析對(duì)于固定樣本量的情況,如果相對(duì)于1可以忽略,則式中,分別為分層隨機(jī)抽樣最優(yōu)分配、分層隨機(jī)抽樣按比例分配以及簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單估計(jì)的方差?!?.5分層時(shí)的若干問(wèn)題1.抽樣效果分析對(duì)于固定樣本量的二、層的劃分

既然分層抽樣比簡(jiǎn)單隨機(jī)抽樣效率高,那么如何構(gòu)造層,構(gòu)造多少層,才能使分層抽樣發(fā)揮其效率高的特點(diǎn)呢?這就涉及最優(yōu)分層和確定層數(shù)的問(wèn)題。二、層的劃分既然分層抽樣比簡(jiǎn)單隨機(jī)抽樣效率高(一)最優(yōu)分層為了提高抽樣效率,按調(diào)查目標(biāo)量進(jìn)行分層當(dāng)然是最好的,但我們?cè)谡{(diào)查前并不知道的值,因此分層只能通過(guò)與高度相關(guān)的輔助指標(biāo)來(lái)進(jìn)行.(見P56)(一)最優(yōu)分層為了提高抽樣效率,按調(diào)查目標(biāo)量(二)層的確定

當(dāng)分層是按自然層或單元類型劃分時(shí),層數(shù)是自然的,但當(dāng)遇到上述運(yùn)用累積平方根法進(jìn)行分層時(shí),就存在層數(shù)問(wèn)題。

在實(shí)際工作中,層數(shù)一般不超過(guò)六層。雖然增加層數(shù)可以提高估計(jì)精度,但在總費(fèi)用一定的條件下增加層數(shù)必然導(dǎo)致降低樣本量,這時(shí)就要考慮增加層數(shù)而降低樣本量在精度上是否合算。(二)層的確定當(dāng)分層是按自然層或單元類型劃分時(shí),三、事后分層我們一般在抽樣之前將總體中的所有單元分好層,但在實(shí)際工作中,有時(shí)沒(méi)有層的抽樣框,或總體特別大來(lái)不及事先分層等原因.這時(shí)我們又想采用分層抽樣,就可以采用事后分層.三、事后分層我們一般在抽樣之前

事后分層要注意的問(wèn)題(1)要求我們可以通過(guò)某種途徑知道各層的層大小或?qū)訖?quán);(2)層權(quán)與實(shí)際情況不能相差太大,否則不可能提高精度;(3)事后分層的層數(shù)不宜太多.事后分層要注意的問(wèn)題

事后分層的具體實(shí)施辦法先采用簡(jiǎn)單隨機(jī)抽樣的方法從總體中抽取一個(gè)樣本量為n的樣本,然后對(duì)樣本中的單元按某種特征進(jìn)行分層。假設(shè)在容量為n的樣本中,落入第h層的樣本單元數(shù)為,有,則此時(shí)對(duì)總體均值的事后分層估計(jì)為:事后分層的具體實(shí)施辦法這里,下標(biāo)“pst”表示事后分層;代表落入第h層的第i個(gè)樣本單元的指標(biāo)值。這里,下標(biāo)“pst”表示事后分層;

理論上,只要n充分大,事后分層估計(jì)量是無(wú)偏的。且它的方差有如下性質(zhì):理論上,只要n充分大,事后分層估計(jì)量是無(wú)偏的。且

由上式可以看出,第一項(xiàng)就是按比例分配分層抽樣估計(jì)量的方差,第二項(xiàng)表示因事后分層而非事先按比例分配分層引起的方差增加量。由此看出,只要樣本量足夠大,事后分層的精度與比例分配事先分層的精度相當(dāng)。由上式可以看出,第一項(xiàng)就是按比例分配分層抽

事后分層均值估計(jì)量的方差,可以用下面的式子來(lái)估計(jì):其中事后分層均值估計(jì)量的方差例3.7

某高校欲了解在校學(xué)生用于課外進(jìn)修(考證等)的開支,在全校8000名學(xué)生中抽出一個(gè)200人的簡(jiǎn)單隨機(jī)樣本.根據(jù)學(xué)生科的統(tǒng)計(jì),本科生人數(shù)為全校學(xué)生的70%,調(diào)查最近一個(gè)學(xué)期課外進(jìn)修支出(單位:元)的結(jié)果如下表.試估計(jì)全校學(xué)生用于課外進(jìn)修的平均支出.例3.7某高校欲了解在校學(xué)生用于課外進(jìn)修層層權(quán)樣本量樣本均值樣本標(biāo)準(zhǔn)差本科生0.7120253.4231.00研究生0.380329.4367.00合計(jì)1200283.8294.57在校學(xué)生課外進(jìn)修開支調(diào)查結(jié)果解:全校學(xué)生用于課外進(jìn)修的平均開支為:層層權(quán)樣本量樣本均值樣本標(biāo)準(zhǔn)差本科生0.7120253.42估計(jì)量的方差為:估計(jì)量的方差為:如果采用簡(jiǎn)單估計(jì),則估計(jì)的方差為:

很顯然,事后分層抽樣要比簡(jiǎn)單隨機(jī)抽樣的估計(jì)量精度要高!如果采用簡(jiǎn)單估計(jì),則估計(jì)的方差為:很顯然,事后分層抽思考題(教材P131,題3.7)

如果一個(gè)大的簡(jiǎn)單隨機(jī)樣本按類別分為6組,然后按層的實(shí)際大小重新進(jìn)行加權(quán),這一過(guò)程稱為事后分層,采用這種方法是由于(判斷以下說(shuō)法的對(duì)錯(cuò)):(1)它是比簡(jiǎn)單隨機(jī)抽樣產(chǎn)生更精確的結(jié)果;(2)它是比按比例分配產(chǎn)生更精確的結(jié)果;(3)它是比按最優(yōu)分配產(chǎn)生更精確的結(jié)果;(4)在抽樣時(shí)不能得到分層變量;(5)它的估計(jì)量的方差與真正按比例分層隨機(jī)抽樣的方差差不多。思考題(教材P131,題3.7)本章小結(jié)●分層抽樣技術(shù)在實(shí)際中應(yīng)用非常廣泛;●其優(yōu)點(diǎn)主要是便于組織管理且抽樣效率通常比簡(jiǎn)單隨機(jī)抽樣要高;●與簡(jiǎn)單隨機(jī)抽樣相比分層抽樣在抽樣之前需要對(duì)總體抽樣框進(jìn)行分層,這個(gè)過(guò)程有時(shí)是現(xiàn)成的,有時(shí)需要增加額外的工作量。本章小結(jié)●分層抽樣技術(shù)在實(shí)際本章作業(yè)(1)熟悉本章的證明;(2)思考書后習(xí)題3.1、習(xí)題3.2;(3)在作業(yè)本上完成書后習(xí)題3.3,習(xí)題3.4,習(xí)題3.5。(第三章結(jié)束)本章作業(yè)(1)熟悉本章的證明;(第三章結(jié)束)§3.1引言一、定義先將總體N個(gè)單元?jiǎng)澐殖蒐個(gè)互不重復(fù)的子總體,每個(gè)子總體稱為層,它們的大小分別為

然后,在每個(gè)層中獨(dú)立地進(jìn)行抽樣,稱為分層抽樣.§3.1引言一、定義先將總體N個(gè)單元?jiǎng)澐殖蒐個(gè)二、作用分層抽樣在實(shí)際工作中應(yīng)用的非常廣泛,主要是因?yàn)樗哂衅渌闃臃椒ㄋ鶝](méi)有的特點(diǎn):1.分層抽樣的抽樣效率較高,也就是說(shuō),分層抽樣的估計(jì)精度較高。2.分層抽樣不僅能對(duì)總體指標(biāo)進(jìn)行推算,而且能對(duì)各層指標(biāo)進(jìn)行推算。3.層內(nèi)抽樣方法可以不同,而且便于抽樣工作的組織。二、作用分層抽樣在實(shí)際工作中應(yīng)用的非常廣泛,主要是因?yàn)樗哂腥?、使用?chǎng)合在對(duì)分層進(jìn)行具體劃分時(shí),通??紤]如下原則:1.層內(nèi)單元具有相同性質(zhì),通常按調(diào)查對(duì)象的不同類型進(jìn)行劃分。2.盡可能使層內(nèi)單元的標(biāo)志值相近,層間單元的差異盡可能大。3.既按類型又按層內(nèi)單元標(biāo)志值相近的原則進(jìn)行多重分層,同時(shí)達(dá)到實(shí)現(xiàn)估計(jì)類值以及提高估計(jì)精度的目的。4.抽樣組織實(shí)施的方便,通常按行政管理機(jī)構(gòu)設(shè)置進(jìn)行分層。三、使用場(chǎng)合在對(duì)分層進(jìn)行具體劃分時(shí),通??紤]如下原則:1.層四、符號(hào)說(shuō)明我們用下標(biāo)h表示層號(hào)(h=1,2,……,L)。關(guān)于第h層的記號(hào)如下:?jiǎn)卧倲?shù):樣本單元數(shù):第i個(gè)單元標(biāo)志值(觀察值):四、符號(hào)說(shuō)明我們用下標(biāo)h表示層號(hào)單元總數(shù):樣本單元數(shù):第i單元權(quán)數(shù):總體均值:第L層總體方差:?jiǎn)卧獧?quán)數(shù):總體均值:第L層總體方差:抽樣比:樣本均值:第L層樣本方差:抽樣比:樣本均值:第L層樣本方差:§3.2簡(jiǎn)單估計(jì)量及其性質(zhì)一、總體均值的估計(jì)1.估計(jì)量的定義總體均值的估計(jì):=如果得到的是分層隨機(jī)樣本,則總體均值的簡(jiǎn)單估計(jì)為:§3.2簡(jiǎn)單估計(jì)量及其性質(zhì)一、總體均值的估計(jì)1.估計(jì)量的2.估計(jì)量的性質(zhì)性質(zhì)一

對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì)(h=1,2,……,L),則是的無(wú)偏估計(jì)。的方差為:V()=值得注意的是:只要對(duì)各層估計(jì)是無(wú)偏的,則對(duì)總體的估計(jì)也是無(wú)偏的。

因此,各層可以采用不同的抽樣方法,只要相應(yīng)的估計(jì)量是無(wú)偏的,則對(duì)整體的推算也是無(wú)偏的。2.估計(jì)量的性質(zhì)性質(zhì)一對(duì)于一般的分層抽樣,如果是的無(wú)偏性質(zhì)一的證明:由于對(duì)每一層有因此性質(zhì)一的證明:由于對(duì)每一層有因此性質(zhì)二

對(duì)于分層簡(jiǎn)單隨機(jī)抽樣,是的無(wú)偏估計(jì),的方差為:性質(zhì)二對(duì)于分層簡(jiǎn)單隨機(jī)抽樣,是的無(wú)偏估計(jì),的方差為:性質(zhì)二的證明:若各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,對(duì)每一層有由第二章性質(zhì)二得因此性質(zhì)二的證明:若各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,由第二章性質(zhì)二得因性質(zhì)三

對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為:性質(zhì)三對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為:性質(zhì)三的證明:對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,由第二章性質(zhì)三,得因此,的一個(gè)無(wú)偏估計(jì)為:性質(zhì)三的證明:對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行因此,的一個(gè)無(wú)偏二、總體總量的估計(jì)1.估計(jì)量的定義總體總量Y的估計(jì)為:如果得到的是分層隨機(jī)樣本,則總體總量Y的簡(jiǎn)單估計(jì)為:2.估計(jì)量的性質(zhì)由于與只差一個(gè)常數(shù),因此,與具有相同的性質(zhì)。二、總體總量的估計(jì)1.估計(jì)量的定義總體總量Y的性質(zhì)一

對(duì)于一般的分層隨機(jī)抽樣,如果是的無(wú)偏估計(jì),則是的無(wú)偏估計(jì),的方差為:性質(zhì)二

對(duì)于分層隨機(jī)抽樣,的方差為:=性質(zhì)一對(duì)于一般的分層隨機(jī)抽樣,如果是的無(wú)偏估計(jì),則是的=性質(zhì)三

對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為:【例3.1】

調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出,以居民戶為調(diào)查單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶劃分為4層,每層按簡(jiǎn)單隨機(jī)抽樣抽出10戶,調(diào)查獲得如下數(shù)據(jù)(單位:元)估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及估計(jì)的標(biāo)準(zhǔn)差。(數(shù)據(jù)見下表)=性質(zhì)三對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為:【例3.1】

樣本戶奶制品年消費(fèi)支出層居民戶總數(shù)樣本戶奶制品年消費(fèi)支出(元)1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025樣本戶奶制品由上表,N=2850,各層的層權(quán)及抽樣比為:),4,3,2,1(,10==hnh由上表,N=2850,各層的層權(quán)及抽樣比為:),4,3,2,各層樣本均值及樣本方差為:同理有各層樣本均值及樣本方差為:同理有因此,估計(jì)奶制品年消費(fèi)總支出為:估計(jì)量方差及標(biāo)準(zhǔn)差的樣本估計(jì)因此,估計(jì)奶制品年消費(fèi)總支出為:估計(jì)量方差及標(biāo)準(zhǔn)差的樣本估計(jì)三、總體比例的估計(jì)1.估計(jì)量的定義總體比例P的估計(jì)為:2.估計(jì)量的性質(zhì)如果定義第i個(gè)單元具有所考慮的特征;其他。(i=1,2,…,N)則對(duì)總體比例的估計(jì)類似對(duì)總體均值的估計(jì),這時(shí),與具有同樣的性質(zhì)。三、總體比例的估計(jì)1.估計(jì)量的定義總體比例P的估計(jì)為:2的無(wú)偏估計(jì)(h=1,2,…,L),則性質(zhì)一

對(duì)于一般的分層隨機(jī)抽樣,如果是P的無(wú)偏估計(jì)。的方差為:性質(zhì)二

對(duì)于分層隨機(jī)抽樣,是P的無(wú)偏估計(jì)。證明:注意到及因而的方差為:的無(wú)偏估計(jì)(h=1,2,…,L),則性質(zhì)一對(duì)于一般的性質(zhì)三

對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為V()性質(zhì)三對(duì)于分層隨機(jī)抽樣,的無(wú)偏估計(jì)為V()【例3.2】

在例3.1的調(diào)查中,同時(shí)調(diào)查了居民擁有家庭電腦的情況,獲得如下數(shù)據(jù)(單位:臺(tái)),如表3.2。估計(jì)該地區(qū)居民擁有家庭電腦的比例及估計(jì)的標(biāo)準(zhǔn)差。(數(shù)據(jù)見下表)【例3.2】在例3.1的調(diào)查中,同時(shí)調(diào)查了居民擁有家庭電腦

樣本戶擁有家庭電腦情況層居民戶總數(shù)樣本戶擁有家庭電腦情況12345678910120000010001002400010000001037501100001010415001000000000表3.2樣本戶擁有家解:由上表可得該地區(qū)居民擁有家庭電腦比例的估計(jì)為:估計(jì)量的方差為:解:由上表可得該地區(qū)居民擁有家庭電腦比例的估計(jì)為:估計(jì)量的方§3.3比率估計(jì)量及其性質(zhì)

將比率估計(jì)的思想和技術(shù)用于分層隨機(jī)樣本時(shí),對(duì)總體參數(shù)的估計(jì)有兩種途徑:一種是對(duì)每層樣本分別考慮比估計(jì)量,然后對(duì)各層的比估計(jì)量進(jìn)行加權(quán)平均,此時(shí)所得的估計(jì)量稱為分別估計(jì)(separateratioestimator);另一種是對(duì)比率的分子、分母分別加權(quán)計(jì)算出分層估計(jì)量,然后用對(duì)應(yīng)的估計(jì)量來(lái)構(gòu)造比估計(jì),這樣所得的估計(jì)量稱為聯(lián)合比估計(jì)(combinedratioestimator).§3.3比率估計(jì)量及其性質(zhì)將比率估計(jì)的思1.分別比率估計(jì)總體均值總體總量的分層比率估計(jì)為:總體均值:總體總量:層權(quán)L:層數(shù)為的比率估計(jì),為比率估計(jì)1.分別比率估計(jì)總體均值總體總量的分層比率估計(jì)為:總體均值:比率估計(jì)量的方差:式中,分別為第i層指標(biāo)Y,X的方差及相關(guān)系數(shù).

分別比率估計(jì)量要求每一層的樣本量都比較大,否則,偏倚可能比較大.比率估計(jì)量的方差:式中,分別為第i層指標(biāo)Y,X的方差及相關(guān)2.聯(lián)合比率估計(jì)(combinedratioestimator)總體均值:總體總量:式中:表示的無(wú)偏估計(jì);表示的無(wú)偏估計(jì).均方誤差為:2.聯(lián)合比率估計(jì)(combinedratioestima3.分別比率估計(jì)量與聯(lián)合比率估計(jì)量的比較一般而言,分別比率估計(jì)量的方差小于聯(lián)合比率估計(jì)量的方差。但當(dāng)每層的樣本量不太大時(shí),還是采用聯(lián)合比率估計(jì)量更可靠些,因?yàn)檫@時(shí)分別比率估計(jì)量的偏倚很大,從而使總的均方誤差增大。實(shí)際使用時(shí),如果各層的樣本量都較大,且有理由認(rèn)為各層的比率Rh差異較大,則分別比率估計(jì)優(yōu)于聯(lián)合比率估計(jì)。當(dāng)各層的樣本量不大,或各層比率Rh差異很小,則聯(lián)合比率估計(jì)更好些。3.分別比率估計(jì)量與聯(lián)合比率估計(jì)量的比較一般而言,分別比率估【例4.4】

某市1996年對(duì)950家港口生產(chǎn)單位完成的吞吐量進(jìn)行了調(diào)查,1997年欲對(duì)全市港口生產(chǎn)單位完成的吞吐量進(jìn)行調(diào)查。對(duì)港口生產(chǎn)單位按非國(guó)有(h=1)和國(guó)有(h=2)分為兩層,單位數(shù)分別為800家和150家,分別在兩層中調(diào)查了10家和15家港口生產(chǎn)單位,調(diào)查數(shù)據(jù)如下表,試計(jì)算1997年全市港口生產(chǎn)單位完成的吞吐量。1997年國(guó)有和非國(guó)有企業(yè)調(diào)查數(shù)據(jù)如下頁(yè)【例4.4】某市1996年對(duì)950家港口生產(chǎn)單位完成的19ixiyiixiyi19580149553022202102210320335938433604964120117423040051771805600651625325861000880730234977005608332286811001230927221597208231013797103103901147846512817650139191160141160107015735698ixiyiixiyi19580149553022202102(將上述數(shù)據(jù)計(jì)算的中間結(jié)果列于P77的表中)1.按分別比率估計(jì)量估計(jì)(將上述數(shù)據(jù)計(jì)算的中間結(jié)果列于P77的表中)1.按分別比率估2.按聯(lián)合比率估計(jì)量估計(jì)

按聯(lián)合比率估計(jì)量估計(jì)比按分別比率估計(jì)量估計(jì)要好一些!2.按聯(lián)合比率估計(jì)量估計(jì)按聯(lián)合比率估計(jì)量三、分別比率估計(jì)與聯(lián)合比率估計(jì)的比較具體情況分析參看教材P87三、分別比率估計(jì)與聯(lián)合比率估計(jì)的比較具體情況分析參看教材P8§3.4回歸估計(jì)量及其性質(zhì)

與比估計(jì)相似,將回歸估計(jì)的思想和技術(shù)用于分層隨機(jī)抽樣時(shí),同樣有兩種方法:一種是對(duì)每層樣本分別求取回歸估計(jì)量,然后對(duì)各層的回歸估計(jì)量進(jìn)行加權(quán)平均,此時(shí)所得的估計(jì)量稱為分別回歸估計(jì)(separateregressionestimator);

另一種是對(duì)兩個(gè)變量先分別計(jì)算出分層簡(jiǎn)單估計(jì)量然后再對(duì)它們的分層簡(jiǎn)單估計(jì)量來(lái)構(gòu)造回歸估計(jì),這時(shí)所得的估計(jì)量稱為聯(lián)合回歸估計(jì)(combinedregressionestimator).§3.4回歸估計(jì)量及其性質(zhì)與比估計(jì)相似,1.分別回歸估計(jì)(separateregressionestimator)總體均值的估計(jì):總體總量的估計(jì):1.分別回歸估計(jì)(separateregressione

當(dāng)各層的回歸系數(shù)為事先給定的常數(shù)時(shí),分別回歸估計(jì)量是無(wú)偏的。其方差為:其中是第h層的回歸系數(shù)當(dāng)各層的回歸系數(shù)為事先給定的常數(shù)時(shí),其方差為:其中并且當(dāng)時(shí),達(dá)到最小,即通常未知,可用回歸系數(shù)作為的估計(jì):并且當(dāng)時(shí),達(dá)到最小,即通常未知,可用回歸系數(shù)作為的估計(jì):注意(1)分別回歸估計(jì)量是有偏的,但當(dāng)每一層的樣本量都很大時(shí),估計(jì)的偏倚可以忽略,其方差近似為:(2)這里是子總體的回歸系數(shù),是子總體樣本的回歸系數(shù),前者是未知的,后者是可知的。注意(1)分別回歸估計(jì)量是有偏的,但當(dāng)每一層的樣(2)這方差的樣本估計(jì)值為:式中,

分別回歸估計(jì)量要求每一層的樣本量都較大,如果這個(gè)條件得不到滿足,則分別回歸估計(jì)量的偏倚可能很大,這時(shí),采用聯(lián)合回歸估計(jì)量更好些。方差的樣本估計(jì)值為:式中,分別回歸估計(jì)量要求每一層的樣本2.聯(lián)合回歸估計(jì)(combinedregressionestimator)總體均值的估計(jì):總體總量的估計(jì):式中,分別為的分層估計(jì)。是無(wú)偏的,其方差為:2.聯(lián)合回歸估計(jì)(combinedregression并且,只要β取時(shí),達(dá)到最小。當(dāng)回歸系數(shù)未知時(shí),取β為的樣本估計(jì):這時(shí),聯(lián)合回歸估計(jì)量是有偏的,但當(dāng)樣本量n較大時(shí),估計(jì)的偏倚可以忽略,其方差近似為:并且,只要β取時(shí),達(dá)到最小。當(dāng)回歸系數(shù)未知時(shí),取β為的樣本估方差的樣本估計(jì)為:方差的樣本估計(jì)為:分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較

當(dāng)回歸系數(shù)設(shè)定時(shí),分別回歸估計(jì)優(yōu)于聯(lián)合回歸估計(jì);當(dāng)回歸系數(shù)由樣本估計(jì)時(shí),如果各層的樣本量不太小,采用分別回歸估計(jì)為宜.

否則,采用聯(lián)合回歸估計(jì)為好!分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較當(dāng)回歸系數(shù)設(shè)定【例4.6】(續(xù)例4.4)利用回歸估計(jì)量估計(jì)該市港口生產(chǎn)單位1997年完成的吞吐量。解:樣本回歸系數(shù):h=1,非國(guó)有h=2,國(guó)有1.070170.856402則按分別回歸估計(jì)量估計(jì):(見P85)【例4.6】(續(xù)例4.4)利用回歸估計(jì)量估計(jì)該市港口生產(chǎn)單位按聯(lián)合回歸估計(jì)量估計(jì):(見教材P86)

從本題看,聯(lián)合回歸估計(jì)量比分別回歸估計(jì)量要優(yōu)一些!按聯(lián)合回歸估計(jì)量估計(jì):(見教材P86)從本題看,聯(lián)

分別比率估計(jì)、聯(lián)合比率估計(jì)、分別回歸估計(jì)和聯(lián)合回歸估計(jì)的比較(參看教材P96.【例3.3】)分別比率估計(jì)、聯(lián)合比率估計(jì)、分別回歸比率估計(jì)與回歸估計(jì)總結(jié):

在分層隨機(jī)抽樣中,當(dāng)有輔助變量信息可以利用時(shí),我們可以采用分別比率估計(jì)、聯(lián)合比率估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)方法。在選用這些估計(jì)量時(shí),要注意以下幾個(gè)問(wèn)題:1、比估計(jì)是有偏估計(jì)量,當(dāng)各層樣本量都較大時(shí)兩種比估計(jì)都近似無(wú)偏;當(dāng)某些層的樣本量不夠大,而總樣本量較大時(shí),聯(lián)合比率估計(jì)近似無(wú)偏。比率估計(jì)與回歸估計(jì)總結(jié):1、比估計(jì)是有偏估計(jì)量,當(dāng)各層樣本

2、在回歸估計(jì)中,若事先設(shè)定回歸系數(shù),其估計(jì)量無(wú)偏;若用樣本回歸系數(shù)作為回歸估計(jì)系數(shù),其估計(jì)量有偏,但在大樣本情況下近似無(wú)偏。

3、當(dāng)主要變量Y和輔助變量X高度相關(guān)時(shí),比率估計(jì)和回歸估計(jì)都是有效的,且能大幅度地提高估計(jì)精度。2、在回歸估計(jì)中,若事先設(shè)定回歸系數(shù),其估計(jì)量3、§3.3樣本量在各層的分配對(duì)于分層抽樣,當(dāng)總的樣本量一定時(shí),還需研究各層應(yīng)該分配多少樣本量的問(wèn)題,因?yàn)閷?duì)總體推算時(shí),估計(jì)量的方差與各層的方差有關(guān),還與各層所分配的樣本量有關(guān)。一、比例分配這里的比例分配指的是按各層單元數(shù)占總體單元數(shù)的比例,也就是按各層的層權(quán)進(jìn)行分配,這時(shí)對(duì)于分層抽樣,這時(shí)總體均值的估計(jì)是:§3.3樣本量在各層的分配對(duì)于分層抽樣,當(dāng)總的樣本量一定總體比例P的估計(jì)是:

這是因?yàn)榭傮w中的人一單元,不管它在哪一層,以同樣的概率入樣,因此按比例分配的分層隨機(jī)樣本,估計(jì)量的形式特別簡(jiǎn)單。這種樣本也稱為自加權(quán)的樣本??傮w比例P的估計(jì)是:這是因?yàn)榭傮w中的人一抽樣調(diào)查-第3章分層隨機(jī)抽樣課件二、最優(yōu)分配1.最優(yōu)分配如果我們考慮簡(jiǎn)單線性費(fèi)用函數(shù),總費(fèi)用則最優(yōu)分配是:二、最優(yōu)分配1.最優(yōu)分配如果我們考慮簡(jiǎn)單線性費(fèi)用函數(shù),總費(fèi)用證明:作拉格朗日函數(shù),求條件極值:證明:作拉格朗日函數(shù),求條件極值:解得:由此得出下面的準(zhǔn)則:

如果某一層單元數(shù)較多,內(nèi)部差異較大,費(fèi)用比較省,則對(duì)這一層的樣本量要多分配些,解得:由此得出下面的準(zhǔn)則:如果某一層單元數(shù)較多2.Neyman(內(nèi)曼)分配對(duì)于分層隨機(jī)樣本,作為特例,如果每一層的費(fèi)用相同,即時(shí),最優(yōu)分配可簡(jiǎn)化為:這種分配稱為Neyman分配.這時(shí),達(dá)到最小。2.Neyman(內(nèi)曼)分配對(duì)于分層隨機(jī)樣本,作為特例,【例3.3】續(xù)例3.1如果樣本量仍為n=40,則按比例分配和Neyman分配時(shí),各層的樣本量應(yīng)為多少?(見#17)解:按比例分配時(shí),各層的樣本量為:即各層的樣本量分別為3,6,11,20.【例3.3】續(xù)例3.1如果樣本量仍為n=40,則按比例分對(duì)于Neyman分配,根據(jù)前面計(jì)算所得的各層權(quán)數(shù)和方差,得到:對(duì)于Neyman分配,根據(jù)前面計(jì)算所得的各層因此,按Neyman分配時(shí),各層應(yīng)分配的樣本量為:即各層的樣本量分別為3,7,23,7.因此,按Neyman分配時(shí),各層應(yīng)分配的樣本量為:即各層的樣【例3.5】某市有甲、乙兩個(gè)地區(qū),現(xiàn)進(jìn)行家庭收入的調(diào)查。令n=500,已知甲地區(qū)共有20000戶居民,乙地區(qū)共有50000戶居民;甲地區(qū)居民和乙地區(qū)居民年收入標(biāo)準(zhǔn)差估計(jì)分別為;同時(shí)對(duì)甲地和乙地每戶的平均抽樣費(fèi)用之比為2:3,請(qǐng)分別計(jì)算出甲地和乙地進(jìn)行比例分配、一般最優(yōu)分配(考慮費(fèi)用因素)以及內(nèi)曼分配(不考慮費(fèi)用因素)的樣本量?!窘狻扛鶕?jù)已知的數(shù)據(jù),通過(guò)計(jì)算整理可得下表:【例3.5】某市有甲、乙兩個(gè)地區(qū),現(xiàn)進(jìn)行家庭收入【解】根據(jù)已h1200000.285725002713.2857505.07632500000.7143200031428.5714823.7861總計(jì)700001.0000---------2141.85711328.8624關(guān)于樣本量分配的計(jì)算(1)比例分配。h1200000.285725002713.2857505.(2)一般最優(yōu)分配(2)一般最優(yōu)分配(3)內(nèi)曼分配(3)內(nèi)曼分配結(jié)果比較,對(duì)比上面三組結(jié)果可以發(fā)現(xiàn):●一般最優(yōu)分配在乙地所抽取的樣本量是最小的。這是因?yàn)橐话阕顑?yōu)分配考慮了費(fèi)用問(wèn)題,在乙地抽樣的單位平均費(fèi)用較高,所以最優(yōu)的原則應(yīng)是適當(dāng)增加甲地的樣本量,減少乙地的樣本量?!褚话阕顑?yōu)分配和內(nèi)曼分配在甲地的樣本量都比比例分配大,這是因?yàn)榧椎乜傮w的方差較大。為了保證估計(jì)量方差小,子總體方差大的就要多抽些樣本,否則就要少抽樣本。結(jié)果比較,對(duì)比上面三組結(jié)果可以發(fā)現(xiàn):3.某些層要求大于100%抽樣時(shí)的修正又比較大,則可能按最優(yōu)分配計(jì)算的這個(gè)層的樣按最優(yōu)分配時(shí),可能抽樣比較大,某個(gè)層的本量超過(guò)的情況.若出現(xiàn)這種情況,則對(duì)該層進(jìn)行不100%的抽樣,即3.某些層要求大于100%抽樣時(shí)的修正又比較大,則可能按最優(yōu)§3.4樣本量的確定(1)一般公式令其中已經(jīng)選定,于是當(dāng)方差V給定時(shí),有§3.4樣本量的確定(1)一般公式令其中已經(jīng)選定,于是當(dāng)?shù)玫酱_定樣本量的一般公式為:令則得到確定樣本量的一般公式為:令則(2)若按比例分配:將代入上式可得(2)若按比例分配:(3)內(nèi)曼分配:將代入上面兩式可得:(3)內(nèi)曼分配:(4)最優(yōu)分配:將代入上式可得:(4)最優(yōu)分配:即d:絕對(duì)誤差;r:相對(duì)誤差;t:標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)α分位數(shù);這時(shí),樣本量的一般形式可以表示為:如果估計(jì)精度是以誤差限的形式給出即d:絕對(duì)誤差;如果估計(jì)精度是以誤差限的形式給出

下面將分別給出比例分配、內(nèi)曼分配和最優(yōu)分配時(shí)的樣本量分配形式:下面將分別給出比例分配、內(nèi)曼分配和最(1)若按比例分配:將代入上式可得(1)若按比例分配:(2)當(dāng)按Neyman分配時(shí),(2)當(dāng)按Neyman分配時(shí),(3)最優(yōu)分配時(shí):將代入上式可得:(3)最優(yōu)分配時(shí):[例3.4](續(xù)例3.1)如果要求在95%置信度下,相對(duì)誤差不超過(guò)10%,則按比例分配和Neyman分配時(shí),總樣本量分別為多少?解:當(dāng)按比例分配時(shí):由前面的計(jì)算結(jié)果,可以得到各層的Whs2h。[例3.4](續(xù)例3.1)如果要求在95%置信度下,相對(duì)誤差在95%置信度時(shí),對(duì)應(yīng)的t=1.96,又因此得到由此可以得到對(duì)進(jìn)行修正,得到修正后的n在95%置信度時(shí),對(duì)應(yīng)的t=1.96,又因此得到由此可以2.最優(yōu)分配需要考慮費(fèi)用時(shí)的情形在最優(yōu)分配時(shí),如果考慮費(fèi)用為簡(jiǎn)單線性函數(shù)則由式(3.21)有:當(dāng)方差V給定時(shí),代入式(3.24)得到樣本量為:2.最優(yōu)分配需要考慮費(fèi)用時(shí)的情形在最優(yōu)分配時(shí),如果考慮費(fèi)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論