版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、8/8不等概抽樣方法的應(yīng)用研究99統(tǒng)計(jì) 992137 石磊【內(nèi)容摘要】在抽樣調(diào)查中,不等概抽樣是一個(gè)重要的內(nèi)容,如一個(gè)地區(qū)商場(chǎng)銷售額總額的估計(jì),由于大商場(chǎng)與小商場(chǎng)的銷售額差異巨大,因此,大商場(chǎng)與小商場(chǎng)不能同等對(duì)待。這時(shí)使用不等概率抽樣方法可以很好的提高估計(jì)值得精度.在整群抽樣或多階抽樣中,常采用不等概抽樣,在實(shí)際問題中,很少采用一種抽樣方法,而常常采用是幾種抽樣方法有機(jī)結(jié)合,最常見的方案為多階不等概抽樣?!娟P(guān)鍵詞】不等概抽樣,PPS,S,二階段抽樣。【ABSTRT】In sape inetain, ample with unequl probabtis isonimportantonet,uh
2、 as one region mret sles muntestatinof tta value, Becaue emporuman litleles amont of aretdifeee nomous, o, he emorium and little mrket can put on anq foing. sethe ming wih uneual probbiliie ethod can ind improvementestmateprecin f desrvinvery at this oent Besies, verall to go on and wheampln, go whn
3、samig to a erain sidene f ity to om, o hav mo ry much he same residenesi uchapects aseconmy differet blk fcity this。 If u on ssample,otonl tuble, bt also he reision stimated s oo。【KY WR】samplin wth uneual rbabiltis PPSP twotge samping一、不等概抽樣的理論基礎(chǔ)(一)不等概抽樣的概念等概抽樣是指總體中的每個(gè)單元具有同樣的入樣概率的隨機(jī)抽樣.例如:分層隨機(jī)抽樣,層內(nèi)單元
4、是按簡(jiǎn)單隨機(jī)抽樣取得,各層內(nèi)的所有單元的入樣概率相同,因此分層隨機(jī)抽樣為等概隨機(jī)抽樣。而不等概隨機(jī)抽樣是指在抽樣前賦予總體每個(gè)單元一個(gè)不相同的入樣概率.由于所面對(duì)的總體有可能差異不大,也有可能差異非常大,當(dāng)總體單元之間差異不大時(shí),備單元具有一定的代表性。這時(shí)使用簡(jiǎn)單隨機(jī)抽樣得到的估計(jì)值是精確有效的。但是當(dāng)單元之間差異非常大時(shí),使用簡(jiǎn)單隨機(jī)抽樣抽出的樣本所估計(jì)的估計(jì)值誤差極大,這時(shí)有必要考慮使用不等概隨機(jī)抽樣方法,即賦予各單元一個(gè)不同的入樣概率,使大樣本的入樣概率大,小樣本的入樣概率小,從而提高估計(jì)量的估計(jì)精度。例如對(duì)全國各省的基礎(chǔ)建設(shè)總額進(jìn)行估計(jì)時(shí).由于全國30多個(gè)省直轄市經(jīng)濟(jì)發(fā)展情況以及經(jīng)濟(jì)
5、政策的互不相同。使得各省內(nèi)的基礎(chǔ)建設(shè)投資額互不相同,而且差距非常大.203年初各省得投資歷額中,最低的為吉林省0。14億元,最高的為廣東省為11792億元。如果抽樣時(shí)將廣東省和吉林省在抽樣時(shí),同等對(duì)待是不合理的。因此在抽樣時(shí)對(duì)樣本大的單元賦予一個(gè)較大的放樣概率,推算時(shí)給予一個(gè)較小的權(quán);對(duì)待一樣要較小的單元賦予一個(gè)較小的入樣概率,推算時(shí)賦予一個(gè)較小的權(quán);對(duì)待樣本較單元之間的差異,從而使估計(jì)值精確有效。(二)不等概抽樣的適用范圍實(shí)際工作中,在下列幾種情況下,則可以考慮使用不等概率抽樣:1、抽樣單元在總體中所占的地位不一致。2、調(diào)查的總體單元與抽樣總體單元不一致。例如某大型企業(yè)準(zhǔn)備對(duì)職工家庭情況進(jìn)行
6、調(diào)查,一種自然的方法是以人事部門的職工花名冊(cè)作為抽樣框進(jìn)行抽樣。該單位有少數(shù)和家庭兩名職工在該單位工用,如果對(duì)職工進(jìn)行簡(jiǎn)單隨機(jī)抽樣,則雙職工被抽中的概率大,而調(diào)查者希望對(duì)家庭進(jìn)行等概率抽樣。除了對(duì)抽樣者進(jìn)行整理,將雙職工家庭中的一名成員從抽樣框中拿掉以外,可以對(duì)職工采用不等概抽樣,一種做法是對(duì)每名職工記錄其家庭成員在該單位工作的人數(shù),然后對(duì)每名職工與人數(shù)成反比的概率進(jìn)行抽樣。3、不待概抽樣除了應(yīng)用與以上幾人方面,還廣泛的應(yīng)用于整群抽樣、多階抽樣中群初級(jí)單元大小相差較大的情形。不等概抽樣在以上條件使用時(shí)可以大大提高估計(jì)劃內(nèi)的精度,減少誤差,但使用它也有條件,就是必須要有說明每個(gè)單元規(guī)模大小的輔助
7、變量來確定每個(gè)單元入樣的概率. 馮土雍抽樣調(diào)查理論與方法1994年版二、不等概抽樣的種類及其估計(jì)量按抽樣要單元是否放回分為放回不等概抽樣與不放回不等概抽樣(一)放回不等概抽樣1、概念放回不等概抽樣中每個(gè)單元在每次抽中入樣的概率與其單元規(guī)模的大小成比例。這種抽樣為PS抽樣。、漢森赫維茨估計(jì)量對(duì)于放回不等概抽樣對(duì)總體總量Y的估計(jì):先設(shè)用表示某一個(gè)體I被中的概率對(duì)固定的親本容量n總體中每一個(gè)體以概率入選樣本,那么總量Y的估計(jì)值為 從估計(jì)值的計(jì)量公式看出,每一個(gè)樣本權(quán)數(shù)為該樣本被抽中概率的倒數(shù)。在權(quán)數(shù)不依賴于被抽中的樣本S的所有會(huì)計(jì)量中,是的唯一的線性無偏估計(jì)量。3、通過實(shí)例將放回不等概抽樣與簡(jiǎn)單隨機(jī)
8、抽樣進(jìn)行比較表一為全國003年12月份各地區(qū)固定資產(chǎn)投資完成情況,現(xiàn)在根據(jù)下表的資料運(yùn)用簡(jiǎn)單隨機(jī)抽樣和放回不等概抽樣兩種法來估計(jì)12月份基本建設(shè)總額.(各地區(qū)的總投資為輔助變量)地區(qū)投資額基本建設(shè)投資額北京860318。2天津41。7822。53河北1.2770遼寧1。865上海46.157。376江蘇28795.387浙江27550682福建1.243。9山東01644。161廣東2642117。9211廣西.82。61海南26。62.313山西8.465。9214內(nèi)蒙古.41.35吉林01416黑龍江21025安徽53。882141江西5053319河南2.128920湖北66。824。2
9、821湖南6。631.2422重慶63.8734。6223四川113。49474貴州40.421125云南45.272.982陜西2。7716。2927甘肅7.493.42青海3.242.429寧夏.80新疆14.77408合計(jì)136。44389.8資料來源:中國統(tǒng)計(jì)年鑒203(1)采用簡(jiǎn)單隨機(jī)抽樣估計(jì).從表格中隨機(jī)抽取7個(gè)數(shù)據(jù)進(jìn)行分析。被抽中的數(shù)據(jù)分別為:河北省、遼寧省、山東省、廣東省、廣西省、山西省、四川省. (2)使用PPS抽樣 用總投資額為輔助變量.使用代碼法進(jìn)行抽樣:先令M0=938相應(yīng)的單元大小Mi及其代碼數(shù)如下表:IMiMi0000累計(jì)Mi0000代碼10。46464614420
10、.06262447620。01111676636734.009191766747650。75475411876515160.181118126916990。15157200387480747143438754459.05255248704346410。513662354871623510。231236466623664661237137660364676603130.0446476604664714000065646655150.0033336886656668816.00116668966991.02782977670671802582587235987235190。013376723667
11、2034547717367772210.33280073804022.33380738180330586689807465240.2066688625.02342410886791026.04314930124270。03328292449282280.00717299923929290.06693909300。0766381930693合計(jì)0。9981然后從191中隨機(jī)抽取7個(gè)數(shù),被抽中的數(shù)分別為184、243、500、87、631、385、177則第6,19,10,24,1,1,號(hào)被抽中。用不等概抽樣大差與簡(jiǎn)單隨機(jī)抽樣方差相比 所以從此例中可以看出,使用PPS抽樣估計(jì)量的精度比隨機(jī)抽樣有非
12、常顯著的提高。(二)不放回不等概抽樣、概念不放回不等概抽樣時(shí)總體單元大小成比例的概率抽樣為抽樣,設(shè)每個(gè)單元抽樣概率為,對(duì)固定滿足如果每個(gè)單元入樣概率與大小或規(guī)模的度量i嚴(yán)格成正比例,這時(shí)的抽樣。2、估計(jì)量不放回不等概抽樣總體估計(jì)值為:如果P0(=1,2N)則是的無偏估計(jì),它的方差為從上式可以看出,要使方差小,總要對(duì)總體中每對(duì)(i,j),都接近于。為了達(dá)到這個(gè)目的,我們只要使(Yi/P)成為常數(shù),即(i/P)成比那么Y的估計(jì)量是精確的(是比例系數(shù))在這種情況下結(jié)果無論什么樣本,.這時(shí)方差為0,因此在對(duì)Y估計(jì)時(shí),所選擇的輔助變量X與Y近似成比例。三、不等概抽樣的二階段抽樣(一)不等概抽樣的二階段抽
13、樣方法是:第一階段:從規(guī)模為N的總體中抽選容量的樣本,在抽樣框中每一個(gè)體入選第一階段樣本的概率為P.有: 第二階段:定義H為類,C1、C,C,并使得這些類的最終入選概分別等于P(1)、P(2)、P(H),把一個(gè)階段樣本中的個(gè)體根據(jù)這些類加以區(qū)分;設(shè)第h類中有個(gè)個(gè)體,則有.然后在對(duì)每個(gè)類(h)的個(gè)個(gè)體中實(shí)施簡(jiǎn)單隨機(jī)抽樣,抽樣在每個(gè)類中相互獨(dú)立,其抽樣比率與事先提供的概率P(1)、P(2)、P(H)相適應(yīng)。每個(gè)個(gè)體入是一級(jí)樣本概率 入選二級(jí)樣本概率:為了確定P我們尋找與極大值對(duì)應(yīng)的類,假設(shè)是類1,則P=P()且n1=,對(duì)類h()有其中(1)與P(h)為調(diào)查初期確定的已知數(shù),是一個(gè)隨機(jī)數(shù),它的取值在
14、第一階段抽樣完成后才能知道。 (二)二階段不等概抽樣案例分析某國2002年金融統(tǒng)計(jì)資料,這項(xiàng)調(diào)查考慮了類住宅。類1 農(nóng)村和100000居民以下的城市單位信宅中的行政人員和農(nóng)民;類2 與類1同樣條件下其他社會(huì)專業(yè)人員類3 10000居民以上的城鎮(zhèn)單位中的行政人員和農(nóng)民;類 與類3同樣條件下和其他社會(huì)專業(yè)人員;類5 農(nóng)村或000居民以下的確良城市中的閑置住宅;類6 1000居民以上的城市中的閑置住宅;類7 農(nóng)村或000居民以下的城市中的第二住宅;類8 100居民以上的城市中的第二住宅;類9 新住宅。與第一類相比,所有類都是低代表性的.按順序,其最終選的概率如下: 在主樣本中,第一階段采取了等概率抽
15、樣:P=P(1)1/0,我們保留類中在第一階段被抽中的所有行政人員和農(nóng)民,即(300住戶)。我們剔除了:類2,5和里和10套住宅中的套,即類3里5套住宅中的3套,即;類4和6里5套住宅中的13套,即;類8里25套住宅中的24套,即。作為在單獨(dú)的一個(gè)階段中,新住宅從一個(gè)特殊的抽樣框中以1/2的比率直接抽取。由于()是隨機(jī)的,所以精度計(jì)算比較復(fù)雜。取決于第一階段的抽樣過程中的機(jī)遇,因此h本身也是隨機(jī)數(shù).所以,這種類型的抽樣調(diào)查要想事先知道每類中將要調(diào)查的個(gè)體數(shù)量,甚至最后的樣本容量是不可能的.這可能引起預(yù)算的某些問題.實(shí)踐中,調(diào)查人員是通過對(duì)“平均數(shù)的推理以及考慮每類占總體相應(yīng)的比例來估計(jì)最終樣本
16、容量的,這是一項(xiàng)很難對(duì)付的工作。事實(shí)上,如果()是隨機(jī)數(shù),那么,我們可以根據(jù)平均數(shù)的原理來推斷它的期望值,即:(總體中類h的規(guī)模)。設(shè):關(guān)于“2001年金融資產(chǎn)”調(diào)查,在第一階段抽樣后,和的期望值如下:其中,21000和15500分別是類1和類3的總規(guī)模估計(jì)數(shù)。 平均數(shù)估計(jì)的表達(dá)式是: 上述表達(dá)式中第一個(gè)求和是對(duì)個(gè)類進(jìn)行的,第二個(gè)求和號(hào)是對(duì)類h樣本的(nh)個(gè)體進(jìn)行的。這個(gè)公式對(duì)我們來說并不是新的,它只是霍維茨一湯普森估計(jì)量的一般形式。實(shí)際方差等于:(0).這里E(nh)是類h中最終樣本平均容量的期望,即方差右邊的第一項(xiàng)是事先分層抽樣的精度,其中h類的樣本容量為E(nh)。也就是說,如果二階段
17、抽樣能事先確定每個(gè)類中的樣本容量為E(n),那么,其精度恰好等于相應(yīng)的事先分層抽樣。與事先分層抽樣相比,二階段抽樣的精度損失是事先不能確定每類中的樣本容量而付出的代價(jià)。 我們也可以下列方式解釋這個(gè)“差異”:前面的均值估計(jì)量可表示如下: 王國明抽樣原理及其應(yīng)用1995年110 王國明抽樣原理及其應(yīng)用1995年110頁其中,是在二級(jí)樣本(Sh)中計(jì)算的均值,公式右邊的形式類似于分層抽樣中均值的估計(jì)量。但分層抽樣均值估計(jì)量中層的權(quán)數(shù)是已知的,即(NhN)。而二階段抽樣均值估計(jì)量中的權(quán)數(shù)()是未知的。比率()實(shí)際上是真實(shí)權(quán)數(shù)(h/)的一個(gè)無偏估計(jì).四、總結(jié):以上分別從理論與實(shí)例介紹了PPS、抽樣以及多階
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 教育領(lǐng)域的安全管理創(chuàng)新與實(shí)踐
- 科技助力乳腺疾病早期發(fā)現(xiàn)與干預(yù)
- 2025年度個(gè)人與企業(yè)租車合作保障協(xié)議3篇
- 2025版?zhèn)€人住宅電梯公寓租賃管理合同
- 2025年度個(gè)人貸款合同解除條件合同范本3篇
- 2025年度個(gè)人住房抵押貸款延期還款合同3篇
- 2025年度個(gè)人土地租賃合同范本7篇
- 學(xué)前兒童科技美術(shù)教育的政策支持與實(shí)施策略
- 2025年新型環(huán)保櫥柜銷售服務(wù)合同范本4篇
- 珠海廣東珠海市公安局交通警察支隊(duì)金灣大隊(duì)招聘輔警2人筆試歷年參考題庫附帶答案詳解
- 歷史-廣東省大灣區(qū)2025屆高三第一次模擬試卷和答案
- 天津市部分區(qū)2024-2025學(xué)年九年級(jí)(上)期末物理試卷(含答案)
- 保潔服務(wù)質(zhì)量與服務(wù)意識(shí)的培訓(xùn)
- 《景觀設(shè)計(jì)》課件
- 騰訊人力資源管理
- 2024年安徽省高校分類對(duì)口招生考試數(shù)學(xué)試卷真題
- 會(huì)所股東合作協(xié)議書范文范本
- 人教版(2024)七年級(jí)上冊(cè)英語期中復(fù)習(xí)單項(xiàng)選擇100題(含答案)
- 公婆贈(zèng)予兒媳婦的房產(chǎn)協(xié)議書(2篇)
- 矽塵對(duì)神經(jīng)系統(tǒng)的影響研究
- 海南省汽車租賃合同
評(píng)論
0/150
提交評(píng)論