抽樣技術-分層隨機抽樣概述(ppt-99頁)課件_第1頁
抽樣技術-分層隨機抽樣概述(ppt-99頁)課件_第2頁
抽樣技術-分層隨機抽樣概述(ppt-99頁)課件_第3頁
抽樣技術-分層隨機抽樣概述(ppt-99頁)課件_第4頁
抽樣技術-分層隨機抽樣概述(ppt-99頁)課件_第5頁
已閱讀5頁,還剩95頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2022/7/211第三章 分層隨機抽樣 3.1 概述3.2 簡單估計量及其性質3.3 比率估計量及其性質3.4 回歸估計量及其性質3.5 各層樣本量的分配3.6 總樣本量的確定3.7 分層抽樣的其他方面2022/7/212第一節(jié) 概述2022/7/213 定義3.3 分層隨機抽樣(stratified random sampling):如果每層中的抽樣都是獨立地按照簡單隨機抽樣進行的,那么這樣的分層抽樣稱為分層隨機抽樣,所得的樣本稱為分層隨機樣本(stratified random sample)。2022/7/2142022/7/215二、作用由于每層都進行抽樣,這就可使樣本在總體中分布更

2、加均勻,從而具有更好的代表性。由于抽樣在每一層中獨立進行,所以一者允許各層選擇不同的適合本層的抽樣方法,二則可同時對各子總體(層)進行參數估計,而不單是對整個總體的參數進行估計。由于各層的總體方差因單元之間差異小而肯定小于整個總體的方差,而抽樣精度與此成正比,所以分層抽樣可以提高參數估計的精度。三、符號2022/7/216所有總體參數的估計量都采用下標“st”以示區(qū)別:2022/7/2172022/7/218第二節(jié) 簡單估計量及其性質一、對總體均值的估計分層樣本,總體均值 的估計分層隨機樣本,總體均值 的簡單估計 2022/7/219估計量的性質 性質1&2:對于一般的分層抽樣,如果 是 的無

3、偏估計( ),則 是 的無偏估計。 的方差為:只要對各層估計無偏,則總體估計也無偏。各層可以采用不同的抽樣方法,只要相應的估計量是無偏的,則對總體的推算也是無偏的。2022/7/2110證明性質1 由于對每一層有 因此, 估計量的方差 由于各層是獨立抽取的,因此上式第二項中的協(xié)方差全為0,從而有 2022/7/2111 性質3:對于分層隨機抽樣, 是 的無偏估計, 的方差為: 2022/7/2112證明性質3: 對于分層隨機抽樣,各層獨立進行簡單隨機抽樣,對每一層有 因此,由性質1,有 由第二章性質2,得 因此 2022/7/2113 性質4:對于分層隨機抽樣, 的一個無偏估計為: 2022/

4、7/2114證明性質4: 對于分層隨機抽樣,各層獨立進行簡單隨機抽樣,由第二章性質3,得 的無偏估計為: 因此, 的一個無偏估計為: 2022/7/2115二、對總體總量的估計 總體總量 的估計為: 如果得到的是分層隨機樣本,則總體總量的簡單估計為: 2022/7/21162.估計量的性質性質1:對于一般的分層抽樣,如果是 的無偏估計,則 是 的無偏估計。 的方差為:2022/7/2117性質2:對于分層隨機抽樣, 的方差為:2022/7/2118性質3:對于分層隨機抽樣, 的一個無偏估計為: 2022/7/2119例3.1 調查某地區(qū)的居民奶制品年消費支出,以居民戶為抽樣單元,根據經濟及收入

5、水平將居民戶劃分為4層,每層按簡單隨機抽樣抽取10戶,調查獲得如下數據(單位:元),要估計該地區(qū)居民奶制品年消費總支出及其95%的置信區(qū)間。層居民戶總數樣本戶奶制品年消費支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050351502030251030252022/7/2120同理,求得:2022/7/21212022/7/2122 三、對總體比例的估計 總體比例P的估計為: 估計量的性質 性質1:對于一般的分層抽樣,如果 是 的無偏估計(

6、),則 是 的無偏估計。 的方差為:2022/7/2123性質2:對于分層隨機抽樣, 是 的無偏估計,因而 的方差為: 2022/7/2124 性質3:對于分層隨機抽樣, 的一個無偏估計為:第三節(jié) 比率估計量及其性質先“比”后“加權”,此時所得的估計量稱為分別比估計(separate ratio estimator)先 “加權”后“比”,這樣所得的估計量稱為聯(lián)合比估計(combined ratio estimator)2022/7/2125分別比估計定義3.4 總體均值 和總體總量 的分別比估計為:2022/7/2126定理3.5 對于分層隨機抽樣的分別比估計,若各層的樣本量 都比較大,則有2

7、022/7/2127證明根據比估計量的性質,當 比較大時,有2022/7/2128聯(lián)合比估計2022/7/21292022/7/2130分別比估計與聯(lián)合比估計的比較2022/7/21311)當 ,即 或 分別比估計的精度與聯(lián)合比估計的精度是一樣的。2)當 ,即 ,分別比估計的精度不低于聯(lián)合比估計的精度。3)當 且 ,這意味著分別比估計的精度要高于聯(lián)合比估計的精度。2022/7/21324)當 且 , 或 且 ,聯(lián)合比估計的精度要高于分別比估計的精度。5)當 ,即比估計量的方差小于簡單估計量的方差時,需視具體情況而定。 2022/7/2133第四節(jié) 回歸估計量及其性質與比估計相似,將回歸估計的思

8、想與技術用于分層隨機樣本時,同樣有兩種可行的辦法:先“回歸”后“加權”,此時所得的估計量稱為分別回歸估計;先“加權”后“回歸”,這時所得的估計量稱為聯(lián)合回歸估計3.4.1分別回歸估計定義3.6分別回歸估計是指在分層隨機抽樣中,先在每層中對層均值或層總和做回歸估計,然后再對各層的回歸估計按總體層權進行加權平均。1. 各層的回歸系數h事先給定 2.不能事先設定各層的回歸系數h3.4.2聯(lián)合回歸估計1.當為事先設定的常數時2.當回歸系數不能事先設定時3.4.3 分別回歸估計與聯(lián)合回歸估計的比較經化簡得:例3.3已知某公司一般職員(包括辦事員和保管人員)及高級管理(經理)人員剛進入公司時的工資總額,欲

9、通過抽樣調查估計當前該公司職員的工資總額Y。抽樣按照一般職員層與高管層進行分層隨機抽取。一般職員層抽取n1=15名職員,高管層抽取n2=10名職員。同時還知道一般職員層人員總數N1=390名,該類職員進入公司時工資總額為X1=5 523 965元;高管層人員總數N2=84名,該類職員進入公司時工資總額為X2=2 541 660元。經過分層隨機抽樣調查所得的數據如表35所示。請對上述數據分別按照分別比估計、聯(lián)合比估計、分別回歸估計、聯(lián)合回歸估計以及差估計方法對該公司當前職員工資總額Y做出估計,同時計算出各個估計量的精度。五種估計方法結果比較注意:此時的比估計和回歸估計(回歸系數采用樣本回歸系數進

10、行估計)均為有偏估計,并且考慮到各層的樣本量都不大,回歸估計的偏倚有可能更大,所以此時采用比估計,特別是聯(lián)合比估計會更保險。 而差估計雖然標準差相對較大,但它卻是無偏的,均方誤差并不一定大,所以仍然有采用的價值。3.4.4 比率估計與回歸估計小結在分層隨機抽樣中,當輔助變量可加以利用時,為了提高估計量的精度,可以采用分別比估計、聯(lián)合比估計、分別回歸估計以及聯(lián)合回歸估計等估計方法。在比估計中, 當各層樣本量都較大時,分別比估計與聯(lián)合比估計近似無偏;當某些層的樣本量不夠大,而總樣本量較大時,聯(lián)合比估計近似無偏。在回歸估計中,少數情況下,回歸系數可以是事先設定的常數,其估計量無偏;多數情況下,回歸系

11、數需利用樣本回歸系數進行估計,其估計有偏,但在大樣本的情況下近似無偏。當Y與X高度相關時,分別比估計、聯(lián)合比估計、分別回歸估計以及聯(lián)合回歸估計等估計等產生的估計量都是有效的。選擇估計方法,大致需遵循的原則在選擇估計方法時,大致需遵循下面的原則:(1)由于分別估計(無論是分別比估計還是分別回歸估計)要求各層的樣本量都比較大,所以當某些層的樣本量不夠大時,建議采用聯(lián)合估計(2)當回歸系數需要由樣本進行估計時,回歸估計量是有偏的。 在這種情況下,采取比估計尤其是聯(lián)合比估計也許更保險(3)如果各層的樣本量都比較大,同時每層的比估計或回歸估計也比較有效(即h均比較大),而且各層的Rh之間(或h之間)差異

12、較大,則此時分別估計優(yōu)于聯(lián)合估計,估計量的方差更小(4) 如果各層的樣本量不大,而且各層的Rh之間(或h之間)差異較小,則采用聯(lián)合估計較為適宜(5) 如果各層的Rh之間(或h之間)差別不是太大,而且并不是每層的樣本量都相當大,則聯(lián)合估計可能更保險一些如果各層的回歸系數都接近于1,則可以采用差估計。雖然有時差估計量的方差偏大,但由于它為無偏估計量,所以總的均方誤差不一定大2022/7/2161第五節(jié) 各層樣本量的分配 確定樣本量:總的樣本量,各層樣本量估計量的方差不僅與各層的方差有關,還和各層所分配的樣本量有關。實際工作中有不同的分配方法,可以按各層單元數占總體單元數的比例分配,也可以采用使估計

13、量總方差達到最小、費用最小。 2022/7/21622022/7/2163一、比例分配 按各層單元數占總體單元數的比例,也就是按各層的層權進行分配.對于分層隨機抽樣,這時總體均值的估計是自加權2022/7/2164總體中的任一個單元,不管它在哪一個層,都以同樣的概率入樣,因此按比例分配的分層隨機樣本,估計量的形式特別簡單。這種樣本也稱為自加權的樣本??傮w比例的估計是 2022/7/2165二、最優(yōu)分配 (一)最優(yōu)分配在分層隨機抽樣中,如何將樣本量分配到各層,使得總費用給定的條件下,估計量的方差達到最小,或給定估計量方差的條件下,使總費用最小,能滿足這個條件的樣本量分配就是最優(yōu)分配。2022/7

14、/21662022/7/21672022/7/2168定理3.7的證明對所有層成立時, 達到極小 常數2022/7/2169簡單線性費用函數,總費用由此得出下面的行為準則,如果某一層單元數較多內部差異較大費用比較省則對這一層的樣本量要多分配一些。2022/7/2170三 Neyman(內曼)最優(yōu)分配如果每層抽樣的費用相同,最優(yōu)分配可簡化為這種分配稱為Neyman分配。這時, 達到最小。 2022/7/2171例3.4 某市有甲、乙兩個地區(qū),現(xiàn)要進行家庭收入的調查。令n=500,已知甲地區(qū)共有20 000戶居民,乙地區(qū)共有50 000戶居民;甲地居民和乙地居民年收入標準差估計分別為S1=2 50

15、0,S2=2 000;同時對甲地和乙地每戶的平均抽樣費用之比為23,請分別計算出在甲地和乙地進行比例分配、一般最優(yōu)分配(考慮費用因素)以及內曼分配(不考慮費用因素)的樣本量。2022/7/21722022/7/21732022/7/2174四、某些層要求大于100%抽樣時的修正 按最優(yōu)分配時,有時抽樣比f較大,某個層的 又比較大,則可能出現(xiàn)按最優(yōu)分配計算的這個層的樣本量 超過 的情況。實際工作中,如果第 k 層出現(xiàn)這種情況,最優(yōu)分配是對這個層進行100%的抽樣,即取 ,然后,將剩下的樣本量 按最優(yōu)分配分到各層。 五、偏離最優(yōu)分配時對精度的影響2022/7/2175例3.62022/7/2176

16、2022/7/21772022/7/2178第六節(jié) 總樣本量的確定 令 當方差 給定時 2022/7/2179當按比例分配時, 實際工作中,n的計算可以分為兩步,先計算:然后進行修正: 2022/7/2180當按Neyman分配時, 2022/7/21812、精度要求是以 的絕對誤差限d(在給定的置信水平1-下)的形式給出的2022/7/21822022/7/21833.精度要求以 的相對誤差限r(在給定的置信水平1-下)的形式給出2022/7/21842022/7/2185例3.72022/7/21862022/7/21872022/7/21882022/7/2189二、總費用給定時總樣本量

17、的確定給定V時2022/7/2190給定C時2022/7/2191第七節(jié) 分層抽樣的其他方面 一、多重分層定義當調查指標與兩個或多個輔助變量x1,x2,都存在相關關系時,為了提高分層的效益,需要按每一個輔助變量進行分層,通常的做法是先按最主要的變量分成大層,在大層中再按第二主要變量分成子層,從而形成交叉分層。當存在多個分層變量時,這種分層方式即稱為多重分層(multiple stratification)。對于多重分層,當“子層”劃分好以后,就要考慮樣本量在各子層的分配問題。最簡單常用的樣本量分配方法是按照與每一子層大小成比例的原則進行分配。在多重分層中,有時會出現(xiàn)這樣一個問題:當總樣本量n相

18、對于子層總數RC不夠大時,會出現(xiàn)某些子層分配不到樣本的情況。 若nmax (R,C),則此時應當考慮重新確定分層變量或者不采用分層抽樣,否則這種分層的效益是很難保證的。 若nRC,同時還滿足nmax (R,C),就可以考慮用試驗設計的思想來進行樣本量的分配。2022/7/21922022/7/2193二、事后分層 實際工作中,有時進行事先分層會存在一定的困難各層的抽樣框無法得到幾個變量都適合于分層,要進行事先的交叉分層比較困難,并且我們并不需要交叉分層后每個子層的估計一個單位到底屬于哪一層要等到樣本數據收集到以后才知道總體規(guī)模N太大,事先分層太費事等事后分層技術要求層權Wh已知或者可以通過某種

19、途徑獲得,當層權Wh未知而需要進行估計時,應當確保層權的估計值與實際的層權相差甚小,否則將達不到提高估計量精度的目的。同時,在使用事后分層技術時還應該注意“事后層”的數目不宜太多。2022/7/2194事后分層的具體實施辦法2022/7/21952022/7/21962022/7/2197簡單隨機樣本,事后分層落到第層的樣本量nhnh固定并都大于0的條件下n足夠大時,為無偏估計2022/7/2198第一項就是按比例分配分層抽樣估計量的方差,第二項表示因事后分層而非事先按比例分配分層引起的方差增加量只要樣本量足夠大,事后分層的精度與按比例分配事先分層的精度相當2022/7/2199 如果樣本是按

20、某一個輔助指標分層后抽取的,只要這個事先分層抽樣是嚴格按比例分配進行的,則這個樣本是自加權的,總體中每個單元被抽中的概率相同,我們可以將這個樣本看作簡單隨機樣本,分別對其它指標進行事后分層估計。 (第14講)考場作文開拓文路能力分解層次(網友來稿)江蘇省鎮(zhèn)江中學 陳乃香說明:本系列稿共24講,20XX年1月6日開始在資源上連載【要義解說】文章主旨確立以后,就應該恰當地分解層次,使幾個層次構成一個有機的整體,形成一篇完整的文章。如何分解層次主要取決于表現(xiàn)主旨的需要?!静呗越庾x】一般說來,記人敘事的文章常按時間順序分解層次,寫景狀物的文章常按時間順序、空間順序分解層次;說明文根據說明對象的特點,可

21、按時間順序、空間順序或邏輯順序分解層次;議論文主要根據“提出問題分析問題解決問題”順序來分解層次。當然,分解層次不是一層不變的固定模式,而應該富于變化。文章的層次,也常常有些外在的形式:1小標題式。即圍繞話題把一篇文章劃分為幾個相對獨立的部分,再給它們加上一個簡潔、恰當的小標題。如世界改變了模樣四個小標題:壽命變“長”了、世界變“小”了、勞動變“輕”了、文明變“綠”了。 2序號式。序號式作文與小標題作文有相同的特點。序號可以是“一、二、三”,可以是“A、B、C”,也可以是“甲、乙、丙”從全文看,序號式干凈、明快;但從題目上看,卻看不出文章內容,只是標明了層次與部分。有時序號式作文,也適用于敘述

22、性文章,為故事情節(jié)的展開,提供了明晰的層次。 3總分式。如高考佳作人生也是一張答卷。開頭:“人生就是一張答卷。它上面有選擇題、填空題、判斷題和問答題,但它又不同于一般的答卷。一般的答卷用手來書寫,人生的答卷卻要用行動來書寫。”主體部分每段首句分別為:選擇題是對人生進行正確的取舍,填空題是充實自己的人生,判斷題是表明自己的人生態(tài)度,問答題是考驗自己解決問題的能力。這份“試卷”設計得合理而且實在,每個人的人生都是不同的,這就意味著這份人生試卷的“答案是豐富多彩的”。分解層次,應追求作文美學的三個價值取向:一要勻稱美。什么材料在前,什么材料在后,要合理安排;什么材料詳寫,什么材料略寫,要通盤考慮。自

23、然段是構成文章的基本單位,恰當劃分自然段,自然就成為分解層次的基本要求。該分段處就分段,不要老是開頭、正文、結尾“三段式”,這種老套的層次顯得呆板。二要波瀾美。文章內容應該有張有弛,有起有伏,如波如瀾。只有這樣才能使文章起伏錯落,一波三折,吸引讀者。三要圓合美。文章的開頭與結尾要遙相照應,把開頭描寫的事物或提出的問題,在結尾處用各種方式加以深化或回答,給人首尾圓合的感覺。【例文解剖】 話題:忙忙,不亦樂乎 忙,是人生中一個個步驟,每個人所忙的事務不同,但是不能是碌碌無為地白忙,要忙就忙得精彩,忙得不亦樂乎。 忙是問號。忙看似簡單,但其中卻大有學問。忙是人生中不可缺少的一部分,但是怎么才能忙出精

24、彩,忙得不亦樂乎,卻并不簡單。人生如同一張地圖,我們一直在自己的地圖上行走,時不時我們眼前就出現(xiàn)一個十字路口,我們該向哪兒,面對那縱軸橫軸相交的十字路口,我們該怎樣選擇?不急,靜下心來分析一下,選擇適合自己的坐標軸才是最重要的。忙就是如此,選擇自己該忙的才能忙得有意義。忙是問號,這個問號一直提醒我們要忙得有意義,忙得不亦樂乎。 忙是省略號。四季在有規(guī)律地進行著冷暖交替,大自然就一直按照這樣的規(guī)律不停地忙,人們亦如此。為自己找一個目標,為目標而不停地忙,讓這種忙一直忙下去。當目標已達成,那么再找一個目標,繼續(xù)這樣忙,就像省略號一樣,毫無休止地忙下去,翻開歷史的長卷,我們看到牛頓在忙著他的實驗;愛

25、迪生在忙著思考;徐霞客在忙著記載游玩;李時珍在忙著編寫本草綱目。再看那位以筆為刀槍的充滿著朝氣與力量的文學泰斗魯迅,他正忙著用他獨有的刀和槍在不停地奮斗。忙是省略號,確定了一個目標那么就一直忙下去吧!這樣的忙一定會忙出生命靈動的色彩。 忙是驚嘆號。世界上的人都在忙著自己的事,大自然亦如此,小蜜蜂在忙,以蜂蜜為回報。那么人呢?居里夫人的忙,以放射性元素的發(fā)現(xiàn)而得到了圓滿的休止符;愛因斯坦在忙,以相對論的問世而畫上了驚嘆號;李白的忙,以那豪放的詩歌而有了很大的成功;張衡的忙,因為那地動儀的問世而讓世人仰慕。每個人都應該有效率的忙,而不是整天碌碌無為地白忙。人生是有限的、短暫的,因此,每個人都應該在有限的生命里忙出屬于他的驚嘆號;都應在有限的生命里忙出他的人生精彩篇章。 忙是萬物、世界、人生中都不可缺少的一部分。作為這世上最高級動物的我們,我們在忙什么呢?我們要忙得有意義,有價值,我們要忙出屬于我

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論