抽樣技術(shù)(第5版)課件PPT課件第3章

上傳人：1*** IP屬地：湖北上傳時(shí)間：2023-10-14 格式：PPTX 頁(yè)數(shù)：99 大?。?.78MB 積分：6 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩94頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2023/10/131第三章分層隨機(jī)抽樣

3.1概述3.2簡(jiǎn)單估計(jì)量及其性質(zhì)3.3比率估計(jì)量及其性質(zhì)3.4回歸估計(jì)量及其性質(zhì)3.5各層樣本量的分配3.6總樣本量的確定3.7分層抽樣的其他方面2023/10/132第一節(jié)概述

2023/10/133

定義3.3

分層隨機(jī)抽樣（stratifiedrandomsampling）：如果每層中的抽樣都是獨(dú)立地按照簡(jiǎn)單隨機(jī)抽樣進(jìn)行的，那么這樣的分層抽樣稱為分層隨機(jī)抽樣，所得的樣本稱為分層隨機(jī)樣本（stratifiedrandomsample）。2023/10/1342023/10/135二、作用由于每層都進(jìn)行抽樣，這就可使樣本在總體中分布更加均勻，從而具有更好的代表性。由于抽樣在每一層中獨(dú)立進(jìn)行，所以一者允許各層選擇不同的適合本層的抽樣方法，二則可同時(shí)對(duì)各子總體（層）進(jìn)行參數(shù)估計(jì)，而不單是對(duì)整個(gè)總體的參數(shù)進(jìn)行估計(jì)。由于各層的總體方差因單元之間差異小而肯定小于整個(gè)總體的方差，而抽樣精度與此成正比，所以分層抽樣可以提高參數(shù)估計(jì)的精度。三、符號(hào)2023/10/136所有總體參數(shù)的估計(jì)量都采用下標(biāo)“st”以示區(qū)別：2023/10/1372023/10/138第二節(jié)簡(jiǎn)單估計(jì)量及其性質(zhì)一、對(duì)總體均值的估計(jì)分層樣本，總體均值

的估計(jì)分層隨機(jī)樣本，總體均值

的簡(jiǎn)單估計(jì)

2023/10/139估計(jì)量的性質(zhì)

性質(zhì)1&2：對(duì)于一般的分層抽樣，如果是的無(wú)偏估計(jì)（），則是的無(wú)偏估計(jì)。的方差為：只要對(duì)各層估計(jì)無(wú)偏，則總體估計(jì)也無(wú)偏。各層可以采用不同的抽樣方法，只要相應(yīng)的估計(jì)量是無(wú)偏的，則對(duì)總體的推算也是無(wú)偏的。2023/10/1310證明性質(zhì)1

由于對(duì)每一層有

因此，

估計(jì)量的方差

由于各層是獨(dú)立抽取的，因此上式第二項(xiàng)中的協(xié)方差全為0，從而有

2023/10/1311

性質(zhì)3：對(duì)于分層隨機(jī)抽樣，是的無(wú)偏估計(jì)，的方差為：

2023/10/1312證明性質(zhì)3：

對(duì)于分層隨機(jī)抽樣，各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣，對(duì)每一層有

因此，由性質(zhì)1，有

由第二章性質(zhì)2，得

因此

2023/10/1313

性質(zhì)4：對(duì)于分層隨機(jī)抽樣，的一個(gè)無(wú)偏估計(jì)為：

2023/10/1314證明性質(zhì)4：

對(duì)于分層隨機(jī)抽樣，各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣，由第二章性質(zhì)3,得的無(wú)偏估計(jì)為：

因此，的一個(gè)無(wú)偏估計(jì)為：

2023/10/1315二、對(duì)總體總量的估計(jì)

總體總量

的估計(jì)為：

如果得到的是分層隨機(jī)樣本，則總體總量的簡(jiǎn)單估計(jì)為：

2023/10/13162.估計(jì)量的性質(zhì)性質(zhì)1：對(duì)于一般的分層抽樣，如果是的無(wú)偏估計(jì)，則是的無(wú)偏估計(jì)。的方差為：2023/10/1317性質(zhì)2：對(duì)于分層隨機(jī)抽樣，的方差為：2023/10/1318性質(zhì)3：對(duì)于分層隨機(jī)抽樣，的一個(gè)無(wú)偏估計(jì)為：

2023/10/1319例3.1

調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出，以居民戶為抽樣單元，根據(jù)經(jīng)濟(jì)及收入水平將居民戶劃分為4層，每層按簡(jiǎn)單隨機(jī)抽樣抽取10戶，調(diào)查獲得如下數(shù)據(jù)（單位：元），要估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及其95%的置信區(qū)間。層居民戶總數(shù)樣本戶奶制品年消費(fèi)支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050351502030251030252023/10/1320同理，求得：2023/10/1321

2023/10/1322

三、對(duì)總體比例的估計(jì)

總體比例P的估計(jì)為：

估計(jì)量的性質(zhì)

性質(zhì)1：對(duì)于一般的分層抽樣，如果是的無(wú)偏估計(jì)（），則是的無(wú)偏估計(jì)。的方差為：2023/10/1323性質(zhì)2：對(duì)于分層隨機(jī)抽樣，是的無(wú)偏估計(jì)，因而的方差為：

2023/10/1324

性質(zhì)3：對(duì)于分層隨機(jī)抽樣，的一個(gè)無(wú)偏估計(jì)為：第三節(jié)比率估計(jì)量及其性質(zhì)先“比”后“加權(quán)”，此時(shí)所得的估計(jì)量稱為分別比估計(jì)（separateratioestimator）先“加權(quán)”后“比”，這樣所得的估計(jì)量稱為聯(lián)合比估計(jì)（combinedratioestimator）2023/10/1325分別比估計(jì)定義3.4總體均值

和總體總量

的分別比估計(jì)為：2023/10/1326定理3.5對(duì)于分層隨機(jī)抽樣的分別比估計(jì)，若各層的樣本量

都比較大，則有2023/10/1327證明根據(jù)比估計(jì)量的性質(zhì)，當(dāng)

比較大時(shí)，有2023/10/1328聯(lián)合比估計(jì)

2023/10/1329

2023/10/1330分別比估計(jì)與聯(lián)合比估計(jì)的比較2023/10/13311）當(dāng)，即或

分別比估計(jì)的精度與聯(lián)合比估計(jì)的精度是一樣的。2)當(dāng)，即，分別比估計(jì)的精度不低于聯(lián)合比估計(jì)的精度。3）當(dāng)且，這意味著分別比估計(jì)的精度要高于聯(lián)合比估計(jì)的精度。2023/10/13324）當(dāng)且，

或且，聯(lián)合比估計(jì)的精度要高于分別比估計(jì)的精度。5）當(dāng)，即比估計(jì)量的方差小于簡(jiǎn)單估計(jì)量的方差時(shí)，需視具體情況而定。

2023/10/1333第四節(jié)回歸估計(jì)量及其性質(zhì)與比估計(jì)相似，將回歸估計(jì)的思想與技術(shù)用于分層隨機(jī)樣本時(shí)，同樣有兩種可行的辦法:先“回歸”后“加權(quán)”,此時(shí)所得的估計(jì)量稱為分別回歸估計(jì)；先“加權(quán)”后“回歸”,這時(shí)所得的估計(jì)量稱為聯(lián)合回歸估計(jì)3.4.1分別回歸估計(jì)定義3.6

分別回歸估計(jì)是指在分層隨機(jī)抽樣中,先在每層中對(duì)層均值或?qū)涌偤妥龌貧w估計(jì),然后再對(duì)各層的回歸估計(jì)按總體層權(quán)進(jìn)行加權(quán)平均。

1.各層的回歸系數(shù)βh事先給定

2.不能事先設(shè)定各層的回歸系數(shù)βh

3.4.2聯(lián)合回歸估計(jì)1.當(dāng)β為事先設(shè)定的常數(shù)時(shí)2.當(dāng)回歸系數(shù)β不能事先設(shè)定時(shí)3.4.3分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較經(jīng)化簡(jiǎn)得：例3.3已知某公司一般職員(包括辦事員和保管人員)及高級(jí)管理(經(jīng)理)人員剛進(jìn)入公司時(shí)的工資總額,欲通過(guò)抽樣調(diào)查估計(jì)當(dāng)前該公司職員的工資總額Y。抽樣按照一般職員層與高管層進(jìn)行分層隨機(jī)抽取。一般職員層抽取n1=15名職員,高管層抽取n2=10名職員。同時(shí)還知道一般職員層人員總數(shù)N1=390名,該類職員進(jìn)入公司時(shí)工資總額為X1=5523965元;高管層人員總數(shù)N2=84名,該類職員進(jìn)入公司時(shí)工資總額為X2=2541660元。經(jīng)過(guò)分層隨機(jī)抽樣調(diào)查所得的數(shù)據(jù)如表3—5所示。請(qǐng)對(duì)上述數(shù)據(jù)分別按照分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)、聯(lián)合回歸估計(jì)以及差估計(jì)方法對(duì)該公司當(dāng)前職員工資總額Y做出估計(jì),同時(shí)計(jì)算出各個(gè)估計(jì)量的精度。

五種估計(jì)方法結(jié)果比較注意：此時(shí)的比估計(jì)和回歸估計(jì)(回歸系數(shù)采用樣本回歸系數(shù)進(jìn)行估計(jì))均為有偏估計(jì)，并且考慮到各層的樣本量都不大，回歸估計(jì)的偏倚有可能更大，所以此時(shí)采用比估計(jì)，特別是聯(lián)合比估計(jì)會(huì)更保險(xiǎn)。

而差估計(jì)雖然標(biāo)準(zhǔn)差相對(duì)較大，但它卻是無(wú)偏的，均方誤差并不一定大，所以仍然有采用的價(jià)值。3.4.4比率估計(jì)與回歸估計(jì)小結(jié)在分層隨機(jī)抽樣中，當(dāng)輔助變量可加以利用時(shí)，為了提高估計(jì)量的精度，可以采用分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)等估計(jì)方法。在比估計(jì)中，當(dāng)各層樣本量都較大時(shí)，分別比估計(jì)與聯(lián)合比估計(jì)近似無(wú)偏；當(dāng)某些層的樣本量不夠大，而總樣本量較大時(shí),聯(lián)合比估計(jì)近似無(wú)偏。在回歸估計(jì)中，少數(shù)情況下，回歸系數(shù)可以是事先設(shè)定的常數(shù),其估計(jì)量無(wú)偏；多數(shù)情況下，回歸系數(shù)需利用樣本回歸系數(shù)進(jìn)行估計(jì)，其估計(jì)有偏，但在大樣本的情況下近似無(wú)偏。當(dāng)Y與X高度相關(guān)時(shí),分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)等估計(jì)等產(chǎn)生的估計(jì)量都是有效的。選擇估計(jì)方法，大致需遵循的原則在選擇估計(jì)方法時(shí),大致需遵循下面的原則:(1)由于分別估計(jì)(無(wú)論是分別比估計(jì)還是分別回歸估計(jì))要求各層的樣本量都比較大,所以當(dāng)某些層的樣本量不夠大時(shí),建議采用聯(lián)合估計(jì)(2)當(dāng)回歸系數(shù)需要由樣本進(jìn)行估計(jì)時(shí)，回歸估計(jì)量是有偏的。在這種情況下，采取比估計(jì)尤其是聯(lián)合比估計(jì)也許更保險(xiǎn)(3)如果各層的樣本量都比較大,同時(shí)每層的比估計(jì)或回歸估計(jì)也比較有效（即ρh均比較大）,而且各層的Rh之間（或βh之間）差異較大,則此時(shí)分別估計(jì)優(yōu)于聯(lián)合估計(jì),估計(jì)量的方差更小(4)如果各層的樣本量不大,而且各層的Rh之間(或βh之間)差異較小,則采用聯(lián)合估計(jì)較為適宜(5)如果各層的Rh之間(或βh之間)差別不是太大,而且并不是每層的樣本量都相當(dāng)大,則聯(lián)合估計(jì)可能更保險(xiǎn)一些如果各層的回歸系數(shù)都接近于1,則可以采用差估計(jì)。雖然有時(shí)差估計(jì)量的方差偏大,但由于它為無(wú)偏估計(jì)量,所以總的均方誤差不一定大2023/10/1361第五節(jié)各層樣本量的分配

確定樣本量：總的樣本量，各層樣本量估計(jì)量的方差不僅與各層的方差有關(guān)，還和各層所分配的樣本量有關(guān)。實(shí)際工作中有不同的分配方法，可以按各層單元數(shù)占總體單元數(shù)的比例分配，也可以采用使估計(jì)量總方差達(dá)到最小、費(fèi)用最小。

2023/10/13622023/10/1363一、比例分配

按各層單元數(shù)占總體單元數(shù)的比例，也就是按各層的層權(quán)進(jìn)行分配.對(duì)于分層隨機(jī)抽樣，這時(shí)總體均值的估計(jì)是自加權(quán)2023/10/1364總體中的任一個(gè)單元，不管它在哪一個(gè)層，都以同樣的概率入樣，因此按比例分配的分層隨機(jī)樣本，估計(jì)量的形式特別簡(jiǎn)單。這種樣本也稱為自加權(quán)的樣本。總體比例的估計(jì)是

2023/10/1365二、最優(yōu)分配

（一）最優(yōu)分配在分層隨機(jī)抽樣中，如何將樣本量分配到各層，使得總費(fèi)用給定的條件下，估計(jì)量的方差達(dá)到最小，或給定估計(jì)量方差的條件下，使總費(fèi)用最小，能滿足這個(gè)條件的樣本量分配就是最優(yōu)分配。2023/10/13662023/10/13672023/10/1368定理3.7的證明對(duì)所有層成立時(shí)，達(dá)到極小

常數(shù)2023/10/1369簡(jiǎn)單線性費(fèi)用函數(shù)，總費(fèi)用由此得出下面的行為準(zhǔn)則，如果某一層·單元數(shù)較多·內(nèi)部差異較大·費(fèi)用比較省則對(duì)這一層的樣本量要多分配一些。2023/10/1370三Neyman（內(nèi)曼）最優(yōu)分配如果每層抽樣的費(fèi)用相同，最優(yōu)分配可簡(jiǎn)化為這種分配稱為Neyman分配。這時(shí)，達(dá)到最小。

2023/10/1371例3.4

某市有甲、乙兩個(gè)地區(qū),現(xiàn)要進(jìn)行家庭收入的調(diào)查。令n=500,已知甲地區(qū)共有20000戶居民,乙地區(qū)共有50000戶居民;甲地居民和乙地居民年收入標(biāo)準(zhǔn)差估計(jì)分別為S1=2500,S2=2000;同時(shí)對(duì)甲地和乙地每戶的平均抽樣費(fèi)用之比為2∶3,請(qǐng)分別計(jì)算出在甲地和乙地進(jìn)行比例分配、一般最優(yōu)分配(考慮費(fèi)用因素)以及內(nèi)曼分配(不考慮費(fèi)用因素)的樣本量。2023/10/13722023/10/13732023/10/1374四、某些層要求大于100%抽樣時(shí)的修正

按最優(yōu)分配時(shí)，有時(shí)抽樣比f(wàn)較大，某個(gè)層的又比較大，則可能出現(xiàn)按最優(yōu)分配計(jì)算的這個(gè)層的樣本量超過(guò)的情況。實(shí)際工作中，如果第k層出現(xiàn)這種情況，最優(yōu)分配是對(duì)這個(gè)層進(jìn)行100%的抽樣，即取，然后，將剩下的樣本量按最優(yōu)分配分到各層。

五、偏離最優(yōu)分配時(shí)對(duì)精度的影響2023/10/1375例3.62023/10/13762023/10/13772023/10/1378第六節(jié)總樣本量的確定

令當(dāng)方差給定時(shí)

2023/10/1379當(dāng)按比例分配時(shí)，

實(shí)際工作中，n的計(jì)算可以分為兩步，先計(jì)算：然后進(jìn)行修正：

2023/10/1380當(dāng)按Neyman分配時(shí)，

2023/10/13812、精度要求是以

的絕對(duì)誤差限d(在給定的置信水平1-α下)的形式給出的2023/10/13822023/10/13833.精度要求以

的相對(duì)誤差限r(nóng)(在給定的置信水平1-α下)的形式給出2023/10/13842023/10/1385例3.72023/10/13862023/10/13872023/10/13882023/10/1389二、總費(fèi)用給定時(shí)總樣本量的確定給定V時(shí)2023/10/1390給定C時(shí)2023/10/1391第七節(jié)分層抽樣的其他方面

一、多重分層定義當(dāng)調(diào)查指標(biāo)ψ與兩個(gè)或多個(gè)輔助變量x1,x2,…都存在相關(guān)關(guān)系時(shí),為了提高分層的效益,需要按每一個(gè)輔助變量進(jìn)行分層,通常的做法是先按最主要的變量分成大層,在大層中再按第二主要變量分成子層,從而形成交叉分層。當(dāng)存在多個(gè)分層變量時(shí),這種分層方式即稱為多重分層(multiplestratification)。對(duì)于多重分層,當(dāng)“子層”劃分好以后,就要考慮樣本量在各子層的分配問(wèn)題。最簡(jiǎn)單常用的樣本量分配方法是按照與每一子層大小成比例的原則進(jìn)行分配。在多重分層中,有時(shí)會(huì)出現(xiàn)這樣一個(gè)問(wèn)題:當(dāng)總樣本量n相對(duì)于子層總數(shù)RC不夠大時(shí),會(huì)出現(xiàn)某些子層分配不到樣本的情況。

若n<max(R,C),

人人文庫(kù)> 全部分類> 應(yīng)用文書(shū) > 作業(yè)報(bào)告

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

抽樣技術(shù)(第5版)課件PPT課件第3章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

抽樣技術(shù)(第5版)課件PPT課件第3章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔