版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2023/10/131第三章分層隨機(jī)抽樣
3.1概述3.2簡(jiǎn)單估計(jì)量及其性質(zhì)3.3比率估計(jì)量及其性質(zhì)3.4回歸估計(jì)量及其性質(zhì)3.5各層樣本量的分配3.6總樣本量的確定3.7分層抽樣的其他方面2023/10/132第一節(jié)概述
2023/10/133
定義3.3
分層隨機(jī)抽樣(stratifiedrandomsampling):如果每層中的抽樣都是獨(dú)立地按照簡(jiǎn)單隨機(jī)抽樣進(jìn)行的,那么這樣的分層抽樣稱為分層隨機(jī)抽樣,所得的樣本稱為分層隨機(jī)樣本(stratifiedrandomsample)。2023/10/1342023/10/135二、作用由于每層都進(jìn)行抽樣,這就可使樣本在總體中分布更加均勻,從而具有更好的代表性。由于抽樣在每一層中獨(dú)立進(jìn)行,所以一者允許各層選擇不同的適合本層的抽樣方法,二則可同時(shí)對(duì)各子總體(層)進(jìn)行參數(shù)估計(jì),而不單是對(duì)整個(gè)總體的參數(shù)進(jìn)行估計(jì)。由于各層的總體方差因單元之間差異小而肯定小于整個(gè)總體的方差,而抽樣精度與此成正比,所以分層抽樣可以提高參數(shù)估計(jì)的精度。三、符號(hào)2023/10/136所有總體參數(shù)的估計(jì)量都采用下標(biāo)“st”以示區(qū)別:2023/10/1372023/10/138第二節(jié)簡(jiǎn)單估計(jì)量及其性質(zhì)一、對(duì)總體均值的估計(jì)分層樣本,總體均值
的估計(jì)分層隨機(jī)樣本,總體均值
的簡(jiǎn)單估計(jì)
2023/10/139估計(jì)量的性質(zhì)
性質(zhì)1&2:對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì)(),則是的無(wú)偏估計(jì)。的方差為:只要對(duì)各層估計(jì)無(wú)偏,則總體估計(jì)也無(wú)偏。各層可以采用不同的抽樣方法,只要相應(yīng)的估計(jì)量是無(wú)偏的,則對(duì)總體的推算也是無(wú)偏的。2023/10/1310證明性質(zhì)1
由于對(duì)每一層有
因此,
估計(jì)量的方差
由于各層是獨(dú)立抽取的,因此上式第二項(xiàng)中的協(xié)方差全為0,從而有
2023/10/1311
性質(zhì)3:對(duì)于分層隨機(jī)抽樣,是的無(wú)偏估計(jì),的方差為:
2023/10/1312證明性質(zhì)3:
對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,對(duì)每一層有
因此,由性質(zhì)1,有
由第二章性質(zhì)2,得
因此
2023/10/1313
性質(zhì)4:對(duì)于分層隨機(jī)抽樣,的一個(gè)無(wú)偏估計(jì)為:
2023/10/1314證明性質(zhì)4:
對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,由第二章性質(zhì)3,得的無(wú)偏估計(jì)為:
因此,的一個(gè)無(wú)偏估計(jì)為:
2023/10/1315二、對(duì)總體總量的估計(jì)
總體總量
的估計(jì)為:
如果得到的是分層隨機(jī)樣本,則總體總量的簡(jiǎn)單估計(jì)為:
2023/10/13162.估計(jì)量的性質(zhì)性質(zhì)1:對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì),則是的無(wú)偏估計(jì)。的方差為:2023/10/1317性質(zhì)2:對(duì)于分層隨機(jī)抽樣,的方差為:2023/10/1318性質(zhì)3:對(duì)于分層隨機(jī)抽樣,的一個(gè)無(wú)偏估計(jì)為:
2023/10/1319例3.1
調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出,以居民戶為抽樣單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶劃分為4層,每層按簡(jiǎn)單隨機(jī)抽樣抽取10戶,調(diào)查獲得如下數(shù)據(jù)(單位:元),要估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及其95%的置信區(qū)間。層居民戶總數(shù)樣本戶奶制品年消費(fèi)支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050351502030251030252023/10/1320同理,求得:2023/10/1321
2023/10/1322
三、對(duì)總體比例的估計(jì)
總體比例P的估計(jì)為:
估計(jì)量的性質(zhì)
性質(zhì)1:對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì)(),則是的無(wú)偏估計(jì)。的方差為:2023/10/1323性質(zhì)2:對(duì)于分層隨機(jī)抽樣,是的無(wú)偏估計(jì),因而的方差為:
2023/10/1324
性質(zhì)3:對(duì)于分層隨機(jī)抽樣,的一個(gè)無(wú)偏估計(jì)為:第三節(jié)比率估計(jì)量及其性質(zhì)先“比”后“加權(quán)”,此時(shí)所得的估計(jì)量稱為分別比估計(jì)(separateratioestimator)先“加權(quán)”后“比”,這樣所得的估計(jì)量稱為聯(lián)合比估計(jì)(combinedratioestimator)2023/10/1325分別比估計(jì)定義3.4總體均值
和總體總量
的分別比估計(jì)為:2023/10/1326定理3.5對(duì)于分層隨機(jī)抽樣的分別比估計(jì),若各層的樣本量
都比較大,則有2023/10/1327證明根據(jù)比估計(jì)量的性質(zhì),當(dāng)
比較大時(shí),有2023/10/1328聯(lián)合比估計(jì)
2023/10/1329
2023/10/1330分別比估計(jì)與聯(lián)合比估計(jì)的比較2023/10/13311)當(dāng),即或
分別比估計(jì)的精度與聯(lián)合比估計(jì)的精度是一樣的。2)當(dāng),即,分別比估計(jì)的精度不低于聯(lián)合比估計(jì)的精度。3)當(dāng)且,這意味著分別比估計(jì)的精度要高于聯(lián)合比估計(jì)的精度。2023/10/13324)當(dāng)且,
或且,聯(lián)合比估計(jì)的精度要高于分別比估計(jì)的精度。5)當(dāng),即比估計(jì)量的方差小于簡(jiǎn)單估計(jì)量的方差時(shí),需視具體情況而定。
2023/10/1333第四節(jié)回歸估計(jì)量及其性質(zhì)與比估計(jì)相似,將回歸估計(jì)的思想與技術(shù)用于分層隨機(jī)樣本時(shí),同樣有兩種可行的辦法:先“回歸”后“加權(quán)”,此時(shí)所得的估計(jì)量稱為分別回歸估計(jì);先“加權(quán)”后“回歸”,這時(shí)所得的估計(jì)量稱為聯(lián)合回歸估計(jì)3.4.1分別回歸估計(jì)定義3.6
分別回歸估計(jì)是指在分層隨機(jī)抽樣中,先在每層中對(duì)層均值或?qū)涌偤妥龌貧w估計(jì),然后再對(duì)各層的回歸估計(jì)按總體層權(quán)進(jìn)行加權(quán)平均。
1.各層的回歸系數(shù)βh事先給定
2.不能事先設(shè)定各層的回歸系數(shù)βh
3.4.2聯(lián)合回歸估計(jì)1.當(dāng)β為事先設(shè)定的常數(shù)時(shí)2.當(dāng)回歸系數(shù)β不能事先設(shè)定時(shí)3.4.3分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較經(jīng)化簡(jiǎn)得:例3.3已知某公司一般職員(包括辦事員和保管人員)及高級(jí)管理(經(jīng)理)人員剛進(jìn)入公司時(shí)的工資總額,欲通過(guò)抽樣調(diào)查估計(jì)當(dāng)前該公司職員的工資總額Y。抽樣按照一般職員層與高管層進(jìn)行分層隨機(jī)抽取。一般職員層抽取n1=15名職員,高管層抽取n2=10名職員。同時(shí)還知道一般職員層人員總數(shù)N1=390名,該類職員進(jìn)入公司時(shí)工資總額為X1=5523965元;高管層人員總數(shù)N2=84名,該類職員進(jìn)入公司時(shí)工資總額為X2=2541660元。經(jīng)過(guò)分層隨機(jī)抽樣調(diào)查所得的數(shù)據(jù)如表3—5所示。請(qǐng)對(duì)上述數(shù)據(jù)分別按照分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)、聯(lián)合回歸估計(jì)以及差估計(jì)方法對(duì)該公司當(dāng)前職員工資總額Y做出估計(jì),同時(shí)計(jì)算出各個(gè)估計(jì)量的精度。
五種估計(jì)方法結(jié)果比較注意:此時(shí)的比估計(jì)和回歸估計(jì)(回歸系數(shù)采用樣本回歸系數(shù)進(jìn)行估計(jì))均為有偏估計(jì),并且考慮到各層的樣本量都不大,回歸估計(jì)的偏倚有可能更大,所以此時(shí)采用比估計(jì),特別是聯(lián)合比估計(jì)會(huì)更保險(xiǎn)。
而差估計(jì)雖然標(biāo)準(zhǔn)差相對(duì)較大,但它卻是無(wú)偏的,均方誤差并不一定大,所以仍然有采用的價(jià)值。3.4.4比率估計(jì)與回歸估計(jì)小結(jié)在分層隨機(jī)抽樣中,當(dāng)輔助變量可加以利用時(shí),為了提高估計(jì)量的精度,可以采用分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)等估計(jì)方法。在比估計(jì)中,當(dāng)各層樣本量都較大時(shí),分別比估計(jì)與聯(lián)合比估計(jì)近似無(wú)偏;當(dāng)某些層的樣本量不夠大,而總樣本量較大時(shí),聯(lián)合比估計(jì)近似無(wú)偏。在回歸估計(jì)中,少數(shù)情況下,回歸系數(shù)可以是事先設(shè)定的常數(shù),其估計(jì)量無(wú)偏;多數(shù)情況下,回歸系數(shù)需利用樣本回歸系數(shù)進(jìn)行估計(jì),其估計(jì)有偏,但在大樣本的情況下近似無(wú)偏。當(dāng)Y與X高度相關(guān)時(shí),分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)等估計(jì)等產(chǎn)生的估計(jì)量都是有效的。選擇估計(jì)方法,大致需遵循的原則在選擇估計(jì)方法時(shí),大致需遵循下面的原則:(1)由于分別估計(jì)(無(wú)論是分別比估計(jì)還是分別回歸估計(jì))要求各層的樣本量都比較大,所以當(dāng)某些層的樣本量不夠大時(shí),建議采用聯(lián)合估計(jì)(2)當(dāng)回歸系數(shù)需要由樣本進(jìn)行估計(jì)時(shí),回歸估計(jì)量是有偏的。在這種情況下,采取比估計(jì)尤其是聯(lián)合比估計(jì)也許更保險(xiǎn)(3)如果各層的樣本量都比較大,同時(shí)每層的比估計(jì)或回歸估計(jì)也比較有效(即ρh均比較大),而且各層的Rh之間(或βh之間)差異較大,則此時(shí)分別估計(jì)優(yōu)于聯(lián)合估計(jì),估計(jì)量的方差更小(4)如果各層的樣本量不大,而且各層的Rh之間(或βh之間)差異較小,則采用聯(lián)合估計(jì)較為適宜(5)如果各層的Rh之間(或βh之間)差別不是太大,而且并不是每層的樣本量都相當(dāng)大,則聯(lián)合估計(jì)可能更保險(xiǎn)一些如果各層的回歸系數(shù)都接近于1,則可以采用差估計(jì)。雖然有時(shí)差估計(jì)量的方差偏大,但由于它為無(wú)偏估計(jì)量,所以總的均方誤差不一定大2023/10/1361第五節(jié)各層樣本量的分配
確定樣本量:總的樣本量,各層樣本量估計(jì)量的方差不僅與各層的方差有關(guān),還和各層所分配的樣本量有關(guān)。實(shí)際工作中有不同的分配方法,可以按各層單元數(shù)占總體單元數(shù)的比例分配,也可以采用使估計(jì)量總方差達(dá)到最小、費(fèi)用最小。
2023/10/13622023/10/1363一、比例分配
按各層單元數(shù)占總體單元數(shù)的比例,也就是按各層的層權(quán)進(jìn)行分配.對(duì)于分層隨機(jī)抽樣,這時(shí)總體均值的估計(jì)是自加權(quán)2023/10/1364總體中的任一個(gè)單元,不管它在哪一個(gè)層,都以同樣的概率入樣,因此按比例分配的分層隨機(jī)樣本,估計(jì)量的形式特別簡(jiǎn)單。這種樣本也稱為自加權(quán)的樣本。總體比例的估計(jì)是
2023/10/1365二、最優(yōu)分配
(一)最優(yōu)分配在分層隨機(jī)抽樣中,如何將樣本量分配到各層,使得總費(fèi)用給定的條件下,估計(jì)量的方差達(dá)到最小,或給定估計(jì)量方差的條件下,使總費(fèi)用最小,能滿足這個(gè)條件的樣本量分配就是最優(yōu)分配。2023/10/13662023/10/13672023/10/1368定理3.7的證明對(duì)所有層成立時(shí),達(dá)到極小
常數(shù)2023/10/1369簡(jiǎn)單線性費(fèi)用函數(shù),總費(fèi)用由此得出下面的行為準(zhǔn)則,如果某一層·單元數(shù)較多·內(nèi)部差異較大·費(fèi)用比較省則對(duì)這一層的樣本量要多分配一些。2023/10/1370三Neyman(內(nèi)曼)最優(yōu)分配如果每層抽樣的費(fèi)用相同,最優(yōu)分配可簡(jiǎn)化為這種分配稱為Neyman分配。這時(shí),達(dá)到最小。
2023/10/1371例3.4
某市有甲、乙兩個(gè)地區(qū),現(xiàn)要進(jìn)行家庭收入的調(diào)查。令n=500,已知甲地區(qū)共有20000戶居民,乙地區(qū)共有50000戶居民;甲地居民和乙地居民年收入標(biāo)準(zhǔn)差估計(jì)分別為S1=2500,S2=2000;同時(shí)對(duì)甲地和乙地每戶的平均抽樣費(fèi)用之比為2∶3,請(qǐng)分別計(jì)算出在甲地和乙地進(jìn)行比例分配、一般最優(yōu)分配(考慮費(fèi)用因素)以及內(nèi)曼分配(不考慮費(fèi)用因素)的樣本量。2023/10/13722023/10/13732023/10/1374四、某些層要求大于100%抽樣時(shí)的修正
按最優(yōu)分配時(shí),有時(shí)抽樣比f(wàn)較大,某個(gè)層的又比較大,則可能出現(xiàn)按最優(yōu)分配計(jì)算的這個(gè)層的樣本量超過(guò)的情況。實(shí)際工作中,如果第k層出現(xiàn)這種情況,最優(yōu)分配是對(duì)這個(gè)層進(jìn)行100%的抽樣,即取,然后,將剩下的樣本量按最優(yōu)分配分到各層。
五、偏離最優(yōu)分配時(shí)對(duì)精度的影響2023/10/1375例3.62023/10/13762023/10/13772023/10/1378第六節(jié)總樣本量的確定
令當(dāng)方差給定時(shí)
2023/10/1379當(dāng)按比例分配時(shí),
實(shí)際工作中,n的計(jì)算可以分為兩步,先計(jì)算:然后進(jìn)行修正:
2023/10/1380當(dāng)按Neyman分配時(shí),
2023/10/13812、精度要求是以
的絕對(duì)誤差限d(在給定的置信水平1-α下)的形式給出的2023/10/13822023/10/13833.精度要求以
的相對(duì)誤差限r(nóng)(在給定的置信水平1-α下)的形式給出2023/10/13842023/10/1385例3.72023/10/13862023/10/13872023/10/13882023/10/1389二、總費(fèi)用給定時(shí)總樣本量的確定給定V時(shí)2023/10/1390給定C時(shí)2023/10/1391第七節(jié)分層抽樣的其他方面
一、多重分層定義當(dāng)調(diào)查指標(biāo)ψ與兩個(gè)或多個(gè)輔助變量x1,x2,…都存在相關(guān)關(guān)系時(shí),為了提高分層的效益,需要按每一個(gè)輔助變量進(jìn)行分層,通常的做法是先按最主要的變量分成大層,在大層中再按第二主要變量分成子層,從而形成交叉分層。當(dāng)存在多個(gè)分層變量時(shí),這種分層方式即稱為多重分層(multiplestratification)。對(duì)于多重分層,當(dāng)“子層”劃分好以后,就要考慮樣本量在各子層的分配問(wèn)題。最簡(jiǎn)單常用的樣本量分配方法是按照與每一子層大小成比例的原則進(jìn)行分配。在多重分層中,有時(shí)會(huì)出現(xiàn)這樣一個(gè)問(wèn)題:當(dāng)總樣本量n相對(duì)于子層總數(shù)RC不夠大時(shí),會(huì)出現(xiàn)某些子層分配不到樣本的情況。
若n<max(R,C),
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度智能廠房租賃合同編制規(guī)范3篇
- 二零二五年度網(wǎng)絡(luò)安全防護(hù)與保安服務(wù)合同
- 二零二五年度1022注冊(cè)工程師聘用合同(綠色建筑設(shè)計(jì)與施工)3篇
- 二零二五年度石材期貨交易與建筑石材戰(zhàn)略采購(gòu)合同3篇
- 二手房購(gòu)買合同書(shū)模板(2024版)
- 2025年度軟件開(kāi)發(fā)合同標(biāo)的詳細(xì)說(shuō)明5篇
- 專業(yè)液體化工品運(yùn)輸協(xié)議2024定制版版A版
- 專業(yè)項(xiàng)目融資策略咨詢服務(wù)協(xié)議典范版B版
- 2025年度私人家教服務(wù)合同書(shū):數(shù)學(xué)能力提升方案3篇
- 銅冶煉污染物檢測(cè)技術(shù)-洞察分析
- 2025年湖北武漢工程大學(xué)招聘6人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 【數(shù) 學(xué)】2024-2025學(xué)年北師大版數(shù)學(xué)七年級(jí)上冊(cè)期末能力提升卷
- GB/T 26846-2024電動(dòng)自行車用電動(dòng)機(jī)和控制器的引出線及接插件
- 遼寧省沈陽(yáng)市皇姑區(qū)2024-2025學(xué)年九年級(jí)上學(xué)期期末考試語(yǔ)文試題(含答案)
- 妊娠咳嗽的臨床特征
- 2024年金融理財(cái)-擔(dān)保公司考試近5年真題附答案
- 泰山產(chǎn)業(yè)領(lǐng)軍人才申報(bào)書(shū)
- 高中語(yǔ)文古代文學(xué)課件:先秦文學(xué)
- 人教版五年級(jí)上冊(cè)遞等式計(jì)算100道及答案
- 六年級(jí)-上學(xué)期-心理健康教育教案
- 行車組織題庫(kù)(199道)
評(píng)論
0/150
提交評(píng)論