抽樣技術(shù)(第5版)課件PPT課件第3章_第1頁(yè)
抽樣技術(shù)(第5版)課件PPT課件第3章_第2頁(yè)
抽樣技術(shù)(第5版)課件PPT課件第3章_第3頁(yè)
抽樣技術(shù)(第5版)課件PPT課件第3章_第4頁(yè)
抽樣技術(shù)(第5版)課件PPT課件第3章_第5頁(yè)
已閱讀5頁(yè),還剩94頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2023/10/131第三章分層隨機(jī)抽樣

3.1概述3.2簡(jiǎn)單估計(jì)量及其性質(zhì)3.3比率估計(jì)量及其性質(zhì)3.4回歸估計(jì)量及其性質(zhì)3.5各層樣本量的分配3.6總樣本量的確定3.7分層抽樣的其他方面2023/10/132第一節(jié)概述

2023/10/133

定義3.3

分層隨機(jī)抽樣(stratifiedrandomsampling):如果每層中的抽樣都是獨(dú)立地按照簡(jiǎn)單隨機(jī)抽樣進(jìn)行的,那么這樣的分層抽樣稱為分層隨機(jī)抽樣,所得的樣本稱為分層隨機(jī)樣本(stratifiedrandomsample)。2023/10/1342023/10/135二、作用由于每層都進(jìn)行抽樣,這就可使樣本在總體中分布更加均勻,從而具有更好的代表性。由于抽樣在每一層中獨(dú)立進(jìn)行,所以一者允許各層選擇不同的適合本層的抽樣方法,二則可同時(shí)對(duì)各子總體(層)進(jìn)行參數(shù)估計(jì),而不單是對(duì)整個(gè)總體的參數(shù)進(jìn)行估計(jì)。由于各層的總體方差因單元之間差異小而肯定小于整個(gè)總體的方差,而抽樣精度與此成正比,所以分層抽樣可以提高參數(shù)估計(jì)的精度。三、符號(hào)2023/10/136所有總體參數(shù)的估計(jì)量都采用下標(biāo)“st”以示區(qū)別:2023/10/1372023/10/138第二節(jié)簡(jiǎn)單估計(jì)量及其性質(zhì)一、對(duì)總體均值的估計(jì)分層樣本,總體均值

的估計(jì)分層隨機(jī)樣本,總體均值

的簡(jiǎn)單估計(jì)

2023/10/139估計(jì)量的性質(zhì)

性質(zhì)1&2:對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì)(),則是的無(wú)偏估計(jì)。的方差為:只要對(duì)各層估計(jì)無(wú)偏,則總體估計(jì)也無(wú)偏。各層可以采用不同的抽樣方法,只要相應(yīng)的估計(jì)量是無(wú)偏的,則對(duì)總體的推算也是無(wú)偏的。2023/10/1310證明性質(zhì)1

由于對(duì)每一層有

因此,

估計(jì)量的方差

由于各層是獨(dú)立抽取的,因此上式第二項(xiàng)中的協(xié)方差全為0,從而有

2023/10/1311

性質(zhì)3:對(duì)于分層隨機(jī)抽樣,是的無(wú)偏估計(jì),的方差為:

2023/10/1312證明性質(zhì)3:

對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,對(duì)每一層有

因此,由性質(zhì)1,有

由第二章性質(zhì)2,得

因此

2023/10/1313

性質(zhì)4:對(duì)于分層隨機(jī)抽樣,的一個(gè)無(wú)偏估計(jì)為:

2023/10/1314證明性質(zhì)4:

對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,由第二章性質(zhì)3,得的無(wú)偏估計(jì)為:

因此,的一個(gè)無(wú)偏估計(jì)為:

2023/10/1315二、對(duì)總體總量的估計(jì)

總體總量

的估計(jì)為:

如果得到的是分層隨機(jī)樣本,則總體總量的簡(jiǎn)單估計(jì)為:

2023/10/13162.估計(jì)量的性質(zhì)性質(zhì)1:對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì),則是的無(wú)偏估計(jì)。的方差為:2023/10/1317性質(zhì)2:對(duì)于分層隨機(jī)抽樣,的方差為:2023/10/1318性質(zhì)3:對(duì)于分層隨機(jī)抽樣,的一個(gè)無(wú)偏估計(jì)為:

2023/10/1319例3.1

調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出,以居民戶為抽樣單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶劃分為4層,每層按簡(jiǎn)單隨機(jī)抽樣抽取10戶,調(diào)查獲得如下數(shù)據(jù)(單位:元),要估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及其95%的置信區(qū)間。層居民戶總數(shù)樣本戶奶制品年消費(fèi)支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050351502030251030252023/10/1320同理,求得:2023/10/1321

2023/10/1322

三、對(duì)總體比例的估計(jì)

總體比例P的估計(jì)為:

估計(jì)量的性質(zhì)

性質(zhì)1:對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì)(),則是的無(wú)偏估計(jì)。的方差為:2023/10/1323性質(zhì)2:對(duì)于分層隨機(jī)抽樣,是的無(wú)偏估計(jì),因而的方差為:

2023/10/1324

性質(zhì)3:對(duì)于分層隨機(jī)抽樣,的一個(gè)無(wú)偏估計(jì)為:第三節(jié)比率估計(jì)量及其性質(zhì)先“比”后“加權(quán)”,此時(shí)所得的估計(jì)量稱為分別比估計(jì)(separateratioestimator)先“加權(quán)”后“比”,這樣所得的估計(jì)量稱為聯(lián)合比估計(jì)(combinedratioestimator)2023/10/1325分別比估計(jì)定義3.4總體均值

和總體總量

的分別比估計(jì)為:2023/10/1326定理3.5對(duì)于分層隨機(jī)抽樣的分別比估計(jì),若各層的樣本量

都比較大,則有2023/10/1327證明根據(jù)比估計(jì)量的性質(zhì),當(dāng)

比較大時(shí),有2023/10/1328聯(lián)合比估計(jì)

2023/10/1329

2023/10/1330分別比估計(jì)與聯(lián)合比估計(jì)的比較2023/10/13311)當(dāng),即或

分別比估計(jì)的精度與聯(lián)合比估計(jì)的精度是一樣的。2)當(dāng),即,分別比估計(jì)的精度不低于聯(lián)合比估計(jì)的精度。3)當(dāng)且,這意味著分別比估計(jì)的精度要高于聯(lián)合比估計(jì)的精度。2023/10/13324)當(dāng)且,

或且,聯(lián)合比估計(jì)的精度要高于分別比估計(jì)的精度。5)當(dāng),即比估計(jì)量的方差小于簡(jiǎn)單估計(jì)量的方差時(shí),需視具體情況而定。

2023/10/1333第四節(jié)回歸估計(jì)量及其性質(zhì)與比估計(jì)相似,將回歸估計(jì)的思想與技術(shù)用于分層隨機(jī)樣本時(shí),同樣有兩種可行的辦法:先“回歸”后“加權(quán)”,此時(shí)所得的估計(jì)量稱為分別回歸估計(jì);先“加權(quán)”后“回歸”,這時(shí)所得的估計(jì)量稱為聯(lián)合回歸估計(jì)3.4.1分別回歸估計(jì)定義3.6

分別回歸估計(jì)是指在分層隨機(jī)抽樣中,先在每層中對(duì)層均值或?qū)涌偤妥龌貧w估計(jì),然后再對(duì)各層的回歸估計(jì)按總體層權(quán)進(jìn)行加權(quán)平均。

1.各層的回歸系數(shù)βh事先給定

2.不能事先設(shè)定各層的回歸系數(shù)βh

3.4.2聯(lián)合回歸估計(jì)1.當(dāng)β為事先設(shè)定的常數(shù)時(shí)2.當(dāng)回歸系數(shù)β不能事先設(shè)定時(shí)3.4.3分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較經(jīng)化簡(jiǎn)得:例3.3已知某公司一般職員(包括辦事員和保管人員)及高級(jí)管理(經(jīng)理)人員剛進(jìn)入公司時(shí)的工資總額,欲通過(guò)抽樣調(diào)查估計(jì)當(dāng)前該公司職員的工資總額Y。抽樣按照一般職員層與高管層進(jìn)行分層隨機(jī)抽取。一般職員層抽取n1=15名職員,高管層抽取n2=10名職員。同時(shí)還知道一般職員層人員總數(shù)N1=390名,該類職員進(jìn)入公司時(shí)工資總額為X1=5523965元;高管層人員總數(shù)N2=84名,該類職員進(jìn)入公司時(shí)工資總額為X2=2541660元。經(jīng)過(guò)分層隨機(jī)抽樣調(diào)查所得的數(shù)據(jù)如表3—5所示。請(qǐng)對(duì)上述數(shù)據(jù)分別按照分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)、聯(lián)合回歸估計(jì)以及差估計(jì)方法對(duì)該公司當(dāng)前職員工資總額Y做出估計(jì),同時(shí)計(jì)算出各個(gè)估計(jì)量的精度。

五種估計(jì)方法結(jié)果比較注意:此時(shí)的比估計(jì)和回歸估計(jì)(回歸系數(shù)采用樣本回歸系數(shù)進(jìn)行估計(jì))均為有偏估計(jì),并且考慮到各層的樣本量都不大,回歸估計(jì)的偏倚有可能更大,所以此時(shí)采用比估計(jì),特別是聯(lián)合比估計(jì)會(huì)更保險(xiǎn)。

而差估計(jì)雖然標(biāo)準(zhǔn)差相對(duì)較大,但它卻是無(wú)偏的,均方誤差并不一定大,所以仍然有采用的價(jià)值。3.4.4比率估計(jì)與回歸估計(jì)小結(jié)在分層隨機(jī)抽樣中,當(dāng)輔助變量可加以利用時(shí),為了提高估計(jì)量的精度,可以采用分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)等估計(jì)方法。在比估計(jì)中,當(dāng)各層樣本量都較大時(shí),分別比估計(jì)與聯(lián)合比估計(jì)近似無(wú)偏;當(dāng)某些層的樣本量不夠大,而總樣本量較大時(shí),聯(lián)合比估計(jì)近似無(wú)偏。在回歸估計(jì)中,少數(shù)情況下,回歸系數(shù)可以是事先設(shè)定的常數(shù),其估計(jì)量無(wú)偏;多數(shù)情況下,回歸系數(shù)需利用樣本回歸系數(shù)進(jìn)行估計(jì),其估計(jì)有偏,但在大樣本的情況下近似無(wú)偏。當(dāng)Y與X高度相關(guān)時(shí),分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)等估計(jì)等產(chǎn)生的估計(jì)量都是有效的。選擇估計(jì)方法,大致需遵循的原則在選擇估計(jì)方法時(shí),大致需遵循下面的原則:(1)由于分別估計(jì)(無(wú)論是分別比估計(jì)還是分別回歸估計(jì))要求各層的樣本量都比較大,所以當(dāng)某些層的樣本量不夠大時(shí),建議采用聯(lián)合估計(jì)(2)當(dāng)回歸系數(shù)需要由樣本進(jìn)行估計(jì)時(shí),回歸估計(jì)量是有偏的。在這種情況下,采取比估計(jì)尤其是聯(lián)合比估計(jì)也許更保險(xiǎn)(3)如果各層的樣本量都比較大,同時(shí)每層的比估計(jì)或回歸估計(jì)也比較有效(即ρh均比較大),而且各層的Rh之間(或βh之間)差異較大,則此時(shí)分別估計(jì)優(yōu)于聯(lián)合估計(jì),估計(jì)量的方差更小(4)如果各層的樣本量不大,而且各層的Rh之間(或βh之間)差異較小,則采用聯(lián)合估計(jì)較為適宜(5)如果各層的Rh之間(或βh之間)差別不是太大,而且并不是每層的樣本量都相當(dāng)大,則聯(lián)合估計(jì)可能更保險(xiǎn)一些如果各層的回歸系數(shù)都接近于1,則可以采用差估計(jì)。雖然有時(shí)差估計(jì)量的方差偏大,但由于它為無(wú)偏估計(jì)量,所以總的均方誤差不一定大2023/10/1361第五節(jié)各層樣本量的分配

確定樣本量:總的樣本量,各層樣本量估計(jì)量的方差不僅與各層的方差有關(guān),還和各層所分配的樣本量有關(guān)。實(shí)際工作中有不同的分配方法,可以按各層單元數(shù)占總體單元數(shù)的比例分配,也可以采用使估計(jì)量總方差達(dá)到最小、費(fèi)用最小。

2023/10/13622023/10/1363一、比例分配

按各層單元數(shù)占總體單元數(shù)的比例,也就是按各層的層權(quán)進(jìn)行分配.對(duì)于分層隨機(jī)抽樣,這時(shí)總體均值的估計(jì)是自加權(quán)2023/10/1364總體中的任一個(gè)單元,不管它在哪一個(gè)層,都以同樣的概率入樣,因此按比例分配的分層隨機(jī)樣本,估計(jì)量的形式特別簡(jiǎn)單。這種樣本也稱為自加權(quán)的樣本。總體比例的估計(jì)是

2023/10/1365二、最優(yōu)分配

(一)最優(yōu)分配在分層隨機(jī)抽樣中,如何將樣本量分配到各層,使得總費(fèi)用給定的條件下,估計(jì)量的方差達(dá)到最小,或給定估計(jì)量方差的條件下,使總費(fèi)用最小,能滿足這個(gè)條件的樣本量分配就是最優(yōu)分配。2023/10/13662023/10/13672023/10/1368定理3.7的證明對(duì)所有層成立時(shí),達(dá)到極小

常數(shù)2023/10/1369簡(jiǎn)單線性費(fèi)用函數(shù),總費(fèi)用由此得出下面的行為準(zhǔn)則,如果某一層·單元數(shù)較多·內(nèi)部差異較大·費(fèi)用比較省則對(duì)這一層的樣本量要多分配一些。2023/10/1370三Neyman(內(nèi)曼)最優(yōu)分配如果每層抽樣的費(fèi)用相同,最優(yōu)分配可簡(jiǎn)化為這種分配稱為Neyman分配。這時(shí),達(dá)到最小。

2023/10/1371例3.4

某市有甲、乙兩個(gè)地區(qū),現(xiàn)要進(jìn)行家庭收入的調(diào)查。令n=500,已知甲地區(qū)共有20000戶居民,乙地區(qū)共有50000戶居民;甲地居民和乙地居民年收入標(biāo)準(zhǔn)差估計(jì)分別為S1=2500,S2=2000;同時(shí)對(duì)甲地和乙地每戶的平均抽樣費(fèi)用之比為2∶3,請(qǐng)分別計(jì)算出在甲地和乙地進(jìn)行比例分配、一般最優(yōu)分配(考慮費(fèi)用因素)以及內(nèi)曼分配(不考慮費(fèi)用因素)的樣本量。2023/10/13722023/10/13732023/10/1374四、某些層要求大于100%抽樣時(shí)的修正

按最優(yōu)分配時(shí),有時(shí)抽樣比f(wàn)較大,某個(gè)層的又比較大,則可能出現(xiàn)按最優(yōu)分配計(jì)算的這個(gè)層的樣本量超過(guò)的情況。實(shí)際工作中,如果第k層出現(xiàn)這種情況,最優(yōu)分配是對(duì)這個(gè)層進(jìn)行100%的抽樣,即取,然后,將剩下的樣本量按最優(yōu)分配分到各層。

五、偏離最優(yōu)分配時(shí)對(duì)精度的影響2023/10/1375例3.62023/10/13762023/10/13772023/10/1378第六節(jié)總樣本量的確定

令當(dāng)方差給定時(shí)

2023/10/1379當(dāng)按比例分配時(shí),

實(shí)際工作中,n的計(jì)算可以分為兩步,先計(jì)算:然后進(jìn)行修正:

2023/10/1380當(dāng)按Neyman分配時(shí),

2023/10/13812、精度要求是以

的絕對(duì)誤差限d(在給定的置信水平1-α下)的形式給出的2023/10/13822023/10/13833.精度要求以

的相對(duì)誤差限r(nóng)(在給定的置信水平1-α下)的形式給出2023/10/13842023/10/1385例3.72023/10/13862023/10/13872023/10/13882023/10/1389二、總費(fèi)用給定時(shí)總樣本量的確定給定V時(shí)2023/10/1390給定C時(shí)2023/10/1391第七節(jié)分層抽樣的其他方面

一、多重分層定義當(dāng)調(diào)查指標(biāo)ψ與兩個(gè)或多個(gè)輔助變量x1,x2,…都存在相關(guān)關(guān)系時(shí),為了提高分層的效益,需要按每一個(gè)輔助變量進(jìn)行分層,通常的做法是先按最主要的變量分成大層,在大層中再按第二主要變量分成子層,從而形成交叉分層。當(dāng)存在多個(gè)分層變量時(shí),這種分層方式即稱為多重分層(multiplestratification)。對(duì)于多重分層,當(dāng)“子層”劃分好以后,就要考慮樣本量在各子層的分配問(wèn)題。最簡(jiǎn)單常用的樣本量分配方法是按照與每一子層大小成比例的原則進(jìn)行分配。在多重分層中,有時(shí)會(huì)出現(xiàn)這樣一個(gè)問(wèn)題:當(dāng)總樣本量n相對(duì)于子層總數(shù)RC不夠大時(shí),會(huì)出現(xiàn)某些子層分配不到樣本的情況。

若n<max(R,C),

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論