平衡半樣本法_第1頁(yè)
平衡半樣本法_第2頁(yè)
平衡半樣本法_第3頁(yè)
平衡半樣本法_第4頁(yè)
平衡半樣本法_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、復(fù)雜樣本的方差估計(jì)平衡半樣本法平衡半樣本法在實(shí)際抽樣調(diào)查中,為了提高效率,常采用每層只抽兩個(gè)單元的分層抽樣。這時(shí)如果要采用前面介紹的隨機(jī)組方差估計(jì),則因?yàn)閮H僅只有兩個(gè)沒(méi)有共同單元的隨機(jī)組,將使得方差估計(jì)不夠穩(wěn)定。也就是說(shuō),由于這兩個(gè)隨機(jī)組的取法的偶然性,將會(huì)使得方差的估計(jì)值起伏比較大。本節(jié)將介紹解決這個(gè)問(wèn)題的平衡半樣本方法(balanced half-sample method)。半樣本半樣本假設(shè)對(duì)總體 ,采用分層隨機(jī)抽樣,每層有放回地簡(jiǎn)單隨機(jī)抽取2個(gè)單元, 設(shè)yh1和yh2是第h層的樣本觀測(cè)值(h=1,2,.,L),則總體均值 的無(wú)偏估計(jì)為:式中, 為層權(quán);1LkhNNY1LsthhhyW

2、yhhNWN122hhhyyy 的方差 的標(biāo)準(zhǔn)估計(jì)量為:式中,使用隨機(jī)組方法,因每層只抽取2個(gè)單元,所以只有2個(gè)獨(dú)立的隨機(jī)組(y11,y21,yt-1)和(y12,y22,yt-2)。此 時(shí) 的隨機(jī)組估計(jì)為:stystV y2 222111124LLsthhhhhhv yW sW d12hhhdyystVy222,21112 2 14stst astststav yyyyy式中,,111LsthhhyW y,221LsthhhyW y,1,212stststyyy這個(gè)估計(jì)量計(jì)算簡(jiǎn)單。但由于僅有一個(gè)自由度,其穩(wěn)定性比標(biāo)準(zhǔn)估計(jì)量 差。為了既保留隨機(jī)組估計(jì) 的簡(jiǎn)單性,又能保持標(biāo)準(zhǔn)估計(jì)量 的穩(wěn)定性,我

3、們引入半樣本方法,即從每層抽取一個(gè)單元形成半樣本,總共可能出現(xiàn) 個(gè)半樣本。由于不同半樣本中包含某些共同的單元,所以半樣本之間是彼此相關(guān)的。在這一點(diǎn)上,半樣本方法與隨機(jī)組方法存在本質(zhì)上的不同。stv y RGstvystv y2L 個(gè)統(tǒng)計(jì)量 的平均,即是 的無(wú)偏估計(jì)。然而,當(dāng)層數(shù)L較大時(shí),這個(gè)估計(jì)量的計(jì)算是不可行的。為了簡(jiǎn)化計(jì)算,一個(gè)很自然的想法是選擇一個(gè)小的半樣本子集,希望這個(gè)半樣本子集盡量保留所有的信息,這樣即可達(dá)到簡(jiǎn)化計(jì)算的目的,又能保證足夠的精度。2L2,st astyy22,112Lst astLayystV y假設(shè)這個(gè)半樣本子集包含k個(gè)半樣本,可以推算出下式:因此,如果所選擇的k個(gè)半

4、樣本對(duì)所有 ( =1,2,L)都滿足以下條件:2,11kkstst astavyyyk( )( )111()2LLkaasthhhhhhhhhav yWW d dk h hh那么, 就正好等于因此,我們說(shuō)這k個(gè)半樣本完全保留了 個(gè)半樣本所包含的關(guān)于的信息。滿足條件式的k組半樣本成為平衡半樣本。()()10kaakha kstv ystv y2LstV y(1)如何確定平衡半樣本呢?Plackett and Burman(1946)給出了k*k階政教矩陣(k為4的倍數(shù),為Hadamard矩陣)的方法。下表給出了4*4階矩陣,其中列表示層,行表示半樣本;在a行第h列的位置+1表示層h的第一個(gè)單元被

5、選入第a個(gè)半樣本,-1表示層h的第二個(gè)單元被選入第a個(gè)半樣本。按這種方式定義的半樣本即為平衡半樣本。01)()(khh,如果01)(kh半樣本層1234+1+1+1-1-1+1-1-1-1-1+1-1+1-1-1-1)(ihkLkh,01)(表具有以下性質(zhì),即除了最后一列外,每列之和均為零。也就是說(shuō),當(dāng)Lk時(shí)(k=4 or 8),有對(duì)一般的k的情形也是如此,即用Plackett and Burman方法構(gòu)造的正交矩陣在LL的條件下,我們有從而( )10kaha( ),111102kLkast asthhhahayyWd,11,kst astayy Lkk(2)這與將所有的 個(gè) 進(jìn)行平均所得的結(jié)

6、果完全一樣。我們稱同時(shí)滿足式(1)和式(2)兩個(gè)條件的半樣本為完全正交平衡(full orthogonal balance)半樣本。 2L,st ay在復(fù)雜分層抽樣方案中,層數(shù)L經(jīng)常很大,即使平衡半樣本方法已經(jīng)減少了半樣本數(shù),但由于k大于等于L的要求,所需計(jì)算量仍然龐大。這時(shí)可以設(shè)計(jì)k組部分平衡半樣本,具體方法如下。假設(shè)有L層,采用k組半樣本,k=4。但這里我們?nèi)=2,則4層分為2群,對(duì)包含第1層和第2層的第一群利用2階Hadamard矩陣構(gòu)造正交列,對(duì)包含第三層和第四層的第二群用同樣方法,見(jiàn)下表。半樣本層1234+1+1+1+1+1-1+1-1部分平衡半樣本的方差估計(jì)量雖然不如完全平衡半樣

7、本精確,但也是無(wú)偏的。BRRBRR用于多階段分層抽樣用于多階段分層抽樣 假設(shè)總體分為H個(gè)層,并且從每層中有放回的以不等概率抽取兩個(gè)初級(jí)抽樣單元。 利用向量 定義半樣本r:如果 則所有在該層的初級(jí)抽樣單元1的觀測(cè)值屬于半樣本r;如果 則所有在該層的初級(jí)抽樣單元2的觀測(cè)值屬于半樣本r。對(duì)于半樣本r創(chuàng)造一個(gè)新的權(quán)重列向量 :r1rh1rh rw 現(xiàn)在使用 代替w求半樣本r的估計(jì)量。對(duì)于全樣本,總體總量y的估計(jì)為 ;對(duì)于半樣本r,總體總量y的估計(jì)量為 如果 ,則 ,并且有 。由所學(xué)知識(shí)我們知道可以使用權(quán)重計(jì)算經(jīng)驗(yàn)分布函數(shù),這里我們使用半樣本計(jì)算經(jīng)驗(yàn)分布函數(shù)。 rwiiw yiriwyxyttiiiiw

8、 yw xriiiiiiwywx 20iirww 如果 是總體中位數(shù),則 可能定義為當(dāng) 時(shí)y的最小值,這時(shí) 可能定義為當(dāng) 時(shí)y的最小值。 對(duì)于任意統(tǒng)計(jì)量 ,我們定義 BBR也能夠用于估計(jì)統(tǒng)計(jì)量的協(xié)方差:如果 和 是目標(biāo)量,則 r XXYXXYkk1kkkv121)(kcckvk121)( 21)(ckkkvvvkckvk12*41)( 優(yōu)點(diǎn): 對(duì)于總體總量和分位數(shù)的平滑函數(shù)的方差估計(jì),BRR給出的方差估計(jì)近似等于由線性化方法得到的方差估計(jì)。與刀切法和自助法相比,BRR的計(jì)算量更少。 缺點(diǎn): 正如前面所定義的一樣,BRR要求每層只有兩個(gè)初級(jí)抽樣單元的設(shè)計(jì)。實(shí)際上,其經(jīng)常通過(guò)使用更復(fù)雜的平衡項(xiàng)擴(kuò)展

9、到其他抽樣設(shè)計(jì)中。當(dāng)每層總體數(shù)和各層基本抽樣單元數(shù)較小時(shí),BRR在有放回抽樣情況下所得到的方差估計(jì)和刀切法、自助法一樣偏大。為研究被調(diào)查者拒答情況,實(shí)施一項(xiàng)調(diào)查。抽樣方式為分層隨機(jī)抽樣,從三個(gè)城區(qū)中各自隨機(jī)抽取兩個(gè)居委會(huì),假設(shè)各層權(quán)重相同,調(diào)查結(jié)果見(jiàn)下表。試?yán)闷胶獍霕颖痉ü烙?jì)拒答率 的方差。R城區(qū)城區(qū)居委會(huì)(居委會(huì)(s1s1)居委會(huì)(居委會(huì)(s2s2)拒答戶數(shù)(y1)合格調(diào)查戶數(shù)(x1)拒答戶數(shù)(y2)合格調(diào)查戶數(shù)(x2)141150371492401493014833814538150總計(jì)119444105447解:由于各權(quán)重相同,拒答率的估計(jì)為:用完全平衡半樣本法估計(jì)拒答率 的方差,抽取

10、層數(shù)L=3,因?yàn)橐?,因此取k=4,平衡比一般的確定見(jiàn)表2.312131212240.2514891kkkkkkyyRxxRkL取各區(qū)第一個(gè)居委會(huì)形成第一個(gè)半樣本,該半樣本基期余集的拒答率的估計(jì)為:11213111121311190.2680444yyyRxxx12223211222321050.2349447cyyyRxxx取第一區(qū)的第二個(gè)居委會(huì),第二區(qū)的第一個(gè)居委會(huì)以及第三區(qū)的第二個(gè)居委會(huì)形成第二個(gè)半樣本,該半樣本及其余集的拒答率的估計(jì)為:12213221221321150.2567448yyyRxxx11223221122311090.2460443cyyyRxxx取第一層和第二層的第二個(gè)居委會(huì)以及第三層第一個(gè)居委會(huì)形成第三個(gè)半樣本,該半樣本及其余集的拒答率的估計(jì)為:12223231222321050.2376442yyyRxxx11213231121321190.2650449cyyyRxxx取第一層第一個(gè)居委會(huì)、第二層和第三層的第二個(gè)居委會(huì)形成第四個(gè)半樣本,該半樣本及其余集的拒答率的估計(jì)為:11223241122321090.2433448yyyRxxx12213

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論