抽樣調(diào)查ppt課件_第1頁
抽樣調(diào)查ppt課件_第2頁
抽樣調(diào)查ppt課件_第3頁
抽樣調(diào)查ppt課件_第4頁
抽樣調(diào)查ppt課件_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 前面討論的簡單隨機(jī)抽樣和分層抽樣,我們所關(guān)懷的參前面討論的簡單隨機(jī)抽樣和分層抽樣,我們所關(guān)懷的參數(shù)都是單目的的,給出的估計(jì)量也是線性方式。這一章我們數(shù)都是單目的的,給出的估計(jì)量也是線性方式。這一章我們將要討論比較復(fù)雜的情況,我們關(guān)懷的參數(shù)不再是單目的的將要討論比較復(fù)雜的情況,我們關(guān)懷的參數(shù)不再是單目的的而是兩個(gè)或兩個(gè)以上的目的。此時(shí),遇到的統(tǒng)計(jì)量不再是線而是兩個(gè)或兩個(gè)以上的目的。此時(shí),遇到的統(tǒng)計(jì)量不再是線性方式,往往呈現(xiàn)出非線性方式,比如兩個(gè)變量之比,或呈性方式,往往呈現(xiàn)出非線性方式,比如兩個(gè)變量之比,或呈現(xiàn)變量之間的回歸關(guān)系?,F(xiàn)變量之間的回歸關(guān)系。第六章第六章 比估計(jì)與回歸估計(jì)比估計(jì)與回歸

2、估計(jì) 所謂回歸關(guān)系就是變量之間的關(guān)系不是確定的,是帶有所謂回歸關(guān)系就是變量之間的關(guān)系不是確定的,是帶有隨機(jī)影響的。比如身高和體重的關(guān)系,身高添加時(shí),普通來隨機(jī)影響的。比如身高和體重的關(guān)系,身高添加時(shí),普通來說,體重也會(huì)添加,但又不能說一定如此。要確定身高和體說,體重也會(huì)添加,但又不能說一定如此。要確定身高和體重的關(guān)系,普通用回歸的方法。這類問題首先是由英國統(tǒng)計(jì)重的關(guān)系,普通用回歸的方法。這類問題首先是由英國統(tǒng)計(jì)學(xué)家高爾頓研討兒子的身高與父親身高關(guān)系時(shí)提出的,他發(fā)學(xué)家高爾頓研討兒子的身高與父親身高關(guān)系時(shí)提出的,他發(fā)現(xiàn)兒子的身高有回到家族平均身高的趨勢(shì),因此把所得關(guān)系現(xiàn)兒子的身高有回到家族平均身高

3、的趨勢(shì),因此把所得關(guān)系式稱為回歸方程,于是回歸的名詞就沿用下來了。式稱為回歸方程,于是回歸的名詞就沿用下來了。1 1 比估計(jì)及其性質(zhì)比估計(jì)及其性質(zhì) 設(shè)有一個(gè)二元變量的總體設(shè)有一個(gè)二元變量的總體 :(,)X Y1122(,),(,),(,)NNX YX YXY有有 4 個(gè)參數(shù)是我們所熟習(xí)的:個(gè)參數(shù)是我們所熟習(xí)的:XY、目的目的 的平均數(shù)的平均數(shù)XY、2211()1NXiiSXXN 2211()1NYiiSYYN 目的目的 的方差的方差XY、假設(shè)簡單隨機(jī)樣本為假設(shè)簡單隨機(jī)樣本為 ,那么,那么 及及 的估計(jì)為:的估計(jì)為:(,)(1,2, )iixyin (,)Cov X Y 在研討比估計(jì)之前,再引進(jìn)

4、一個(gè)新的參數(shù)在研討比估計(jì)之前,再引進(jìn)一個(gè)新的參數(shù)變量之間變量之間的協(xié)方差:的協(xié)方差:11(,)()()1NiiiCov X YXXYYN (5.1)XY、之間的相關(guān)系數(shù)定義為:之間的相關(guān)系數(shù)定義為:(,)()( )Cov X YVar XVar Y 1112211()()()()NiiiNNiiiiXXYYXXYY (5.2)11()()1nxyiiiSxxyyn (5.3)1112211()()()()niiinniiiixxyyxxyy (5.4)在討論比估計(jì)之前,先調(diào)查總體的兩個(gè)平均數(shù)之比,即在討論比估計(jì)之前,先調(diào)查總體的兩個(gè)平均數(shù)之比,即RYX 由于由于 分別是分別是 的無偏估計(jì),的無

5、偏估計(jì), 的估計(jì)自然定義為的估計(jì)自然定義為,x yX Y, ,RRy x 假設(shè)假設(shè) 或或 知,總體平均數(shù)知,總體平均數(shù) 與總體總和與總體總和 的比估計(jì)的比估計(jì)量定義為:量定義為:XXYYRyyyR XXXxx(5.5)RyyyR XXXxx(5.6)通常的比估計(jì)是指通常的比估計(jì)是指 (5.5) 式與式與 (5.6) 式,而式,而 那么稱為比值那么稱為比值 的的估計(jì)。估計(jì)。RR由由 (5.5) 式與式與 (5.6) 式可知,式可知, 與與 的習(xí)性主要依賴于估計(jì)量的習(xí)性主要依賴于估計(jì)量 ,因此在不少場所,我們常用,因此在不少場所,我們常用 來闡明。來闡明。RRRyRy 雖然雖然 分別是分別是 的無

6、偏估計(jì),由于的無偏估計(jì),由于 的非線性方式,因的非線性方式,因此此 關(guān)于關(guān)于 是有偏的,從而是有偏的,從而 關(guān)于關(guān)于 也是有偏的。也是有偏的。,x yX Y, ,RRR,RRyy ,Y Y一個(gè)合理的估計(jì)量,應(yīng)該隨著樣本容量一個(gè)合理的估計(jì)量,應(yīng)該隨著樣本容量 n 的添加,估計(jì)量的的添加,估計(jì)量的期望與參數(shù)之差應(yīng)該越來越小并漸漸趨于零,即期望與參數(shù)之差應(yīng)該越來越小并漸漸趨于零,即“漸近無偏漸近無偏比估計(jì)能否漸近無偏呢?比估計(jì)能否漸近無偏呢?利用利用Taylor展開式,有展開式,有將比估計(jì)將比估計(jì) 表示為:表示為:Ry x (1)yyRxXxXX 21yyxXxXRxXXX 21yxXxXXXX (

7、5.7)當(dāng)當(dāng) n 相當(dāng)大時(shí),相當(dāng)大時(shí), 與與 相當(dāng)接近,而相當(dāng)接近,而 是常數(shù),又是常數(shù),又 是是 的的無偏估計(jì),因此,本質(zhì)上無偏估計(jì),因此,本質(zhì)上 ,所以,所以 。xXXYy( )E RR Ry X (5.7)式的益處不單單通知我們式的益處不單單通知我們 這一現(xiàn)實(shí),而且告這一現(xiàn)實(shí),而且告訴了我們,當(dāng)訴了我們,當(dāng) n 相當(dāng)大時(shí),相當(dāng)大時(shí), ,闡明,闡明 可以表示成可以表示成 的平均數(shù),因此的平均數(shù),因此 的分布可近似正態(tài)分布的分布可近似正態(tài)分布( )E RR Ry X R(1,2, )iyXin R因此,可利用因此,可利用 近似規(guī)范正態(tài)分布獲得近似規(guī)范正態(tài)分布獲得 的置信區(qū)間的置信區(qū)間( )R

8、RVar R R而而22221( )(2)YXXYfVar RSR SRSnX (5.8)另外另外2221()(2)RYXXYfVar ySR SRSn (5.9)2222(1)()(2)RYXXYNfVar ySR SRSn (5.10)公式公式(5.8)、(5.9)、(5.10)為我們提供了為我們提供了 的估計(jì)量的方式。詳細(xì)計(jì)算時(shí),只需將的估計(jì)量的方式。詳細(xì)計(jì)算時(shí),只需將 分別換為分別換為 即可。我們將由此得到的估計(jì)量分別記為:即可。我們將由此得到的估計(jì)量分別記為:(),(),()RRVar R Var yVar y 22,XYXYSS SR22,XYXYss sR2)XYRs ( )v

9、R 22221(YXfsR snx 2221(YXfsR sn 2)XYRs ()Rv y 2222(1)(YXNfsR sn 2)XYRs ()Rv y 那么,那么, 的置信程度為的置信程度為 的置信區(qū)間分別為:的置信區(qū)間分別為:,R Y Y (1) 21()Ruv y Ry( , )21()Ruv y Ry21( )uv R R21( )uv R R( , )(5.11)21()Ruv y Ry ( , )21()Ruv y Ry 下面闡明比估計(jì)的優(yōu)點(diǎn)。主要針對(duì)下面闡明比估計(jì)的優(yōu)點(diǎn)。主要針對(duì) 與與 來闡明,由于來闡明,由于它們僅相差一個(gè)常數(shù)因子,因此,只需討論其中一個(gè)就可以。它們僅相差一個(gè)

10、常數(shù)因子,因此,只需討論其中一個(gè)就可以。RyRy 當(dāng)當(dāng) n 充分大時(shí),充分大時(shí),2221()(2)RYXXYfVar ySR SRSn 21( )YfVar ySn 而而欲使欲使 ,僅需,僅需()( )RVar yVar y 2220XXYR SRS或或2220XXYR SR S S 即即11222XXXYYYRSSXCSSYC (5.12) (5.12)闡明,假設(shè)變量闡明,假設(shè)變量X與與Y正相關(guān),且相關(guān)程度非常密正相關(guān),且相關(guān)程度非常密切的話,那么比估計(jì)的精度高于簡單隨機(jī)抽樣的精度。假設(shè)切的話,那么比估計(jì)的精度高于簡單隨機(jī)抽樣的精度。假設(shè)相關(guān)程度不那么親密相關(guān)程度不那么親密 ,此時(shí)知的,此時(shí)

11、知的X信息并信息并沒有較多地提供沒有較多地提供Y的信息,借助的信息,借助X來推斷來推斷 也許會(huì)也許會(huì)“幫倒忙幫倒忙假設(shè)假設(shè)X與與Y是負(fù)相關(guān),那么更不能采用比估計(jì)方法,此時(shí)應(yīng)采用是負(fù)相關(guān),那么更不能采用比估計(jì)方法,此時(shí)應(yīng)采用所謂乘積估計(jì),即:所謂乘積估計(jì),即:Y2XYCC 當(dāng)當(dāng) n 充分大時(shí),且滿足:充分大時(shí),且滿足:1122XXYYSXCSYC (5.14),ppxyxyyyNXX (5.13)成立成立()( )RVar yVar y 例例6.1 某縣小麥種植面積為某縣小麥種植面積為218756畝,分布在畝,分布在N=576個(gè)村,為個(gè)村,為估計(jì)全縣產(chǎn)量,隨機(jī)無放回地抽取估計(jì)全縣產(chǎn)量,隨機(jī)無放回

12、地抽取n=24個(gè)村,所得數(shù)據(jù)如下個(gè)村,所得數(shù)據(jù)如下123456789101112131415161718192021222324112.0129.1208.2158.5110.2123.3157.7154.298.7112.7125.560.3302361608444298349416428258347351158105.780.5163.098.7.8141.2152.5142.5.7153.293.0179.8308217492280378386428390376432261483i村村i村村()iy產(chǎn)量噸產(chǎn)量噸()iy產(chǎn)量噸產(chǎn)量噸()ix面積畝面積畝( )ix面面積積 畝畝每個(gè)村有兩個(gè)目

13、的:面積每個(gè)村有兩個(gè)目的:面積 和產(chǎn)量和產(chǎn)量 ,即:,即: ixiy(,)iixy經(jīng)計(jì)算可得:經(jīng)計(jì)算可得:364.625x 130.625y 21112.195xs 29498.505ys 3213.110 xys 218756X 218756379.7847576X 所以該縣平均畝產(chǎn)小麥估計(jì)為:所以該縣平均畝產(chǎn)小麥估計(jì)為:130.6250.358245()364.625yRx 噸噸 畝畝2187560.35824578368.2()RyXR 噸噸采用比估計(jì)可得采用比估計(jì)可得 和和 分別為:分別為:Ry ()Rv y 2222(1)(yxNfsR sn 2)xyRs ()Rv y 385080

14、 僅利用僅利用 數(shù)據(jù)估計(jì)該縣小麥總產(chǎn)量數(shù)據(jù)估計(jì)該縣小麥總產(chǎn)量 與估計(jì)量方差分別為:與估計(jì)量方差分別為:yY 576 130.62575240()yN y 噸噸22(1)( )14734359yNfv ysn 顯然,顯然, 的方差遠(yuǎn)遠(yuǎn)小于的方差遠(yuǎn)遠(yuǎn)小于 的方差。理由很清楚!小麥畝產(chǎn)的方差。理由很清楚!小麥畝產(chǎn)量與土地?fù)碛辛砍尸F(xiàn)正相關(guān),且相關(guān)程度相當(dāng)親密,因此,量與土地?fù)碛辛砍尸F(xiàn)正相關(guān),且相關(guān)程度相當(dāng)親密,因此,在抽樣調(diào)查中對(duì)每個(gè)村了解有關(guān)產(chǎn)量和土地畝數(shù),利用知在抽樣調(diào)查中對(duì)每個(gè)村了解有關(guān)產(chǎn)量和土地畝數(shù),利用知該縣土地的固有知數(shù),能比較準(zhǔn)確地推斷總產(chǎn)量?,F(xiàn)實(shí)上該縣土地的固有知數(shù),能比較準(zhǔn)確地推斷總

15、產(chǎn)量?,F(xiàn)實(shí)上在實(shí)踐操作中人們正是這樣去做的!在實(shí)踐操作中人們正是這樣去做的!Ry y 如今來求總產(chǎn)量的如今來求總產(chǎn)量的95的置信區(qū)間,首先的置信區(qū)間,首先置信區(qū)間為:置信區(qū)間為:21()Ruv y Ry ( , )21()Ruv y Ry ()620.55()Rv y 噸噸20.97511.96uu (77152,79584) 2 2 分層抽樣中的比估計(jì)分層抽樣中的比估計(jì)1、分別比估計(jì)、分別比估計(jì)(Separate Ratio Estimator) 設(shè)總體分為設(shè)總體分為 k 層,第層,第 h 層的樣本均值記為層的樣本均值記為 ,在該層,在該層中中 與與 的比估計(jì)記為的比估計(jì)記為 ,又記,又記

16、和和 為第為第 h 層中目的層中目的 的平均數(shù)與總和,的平均數(shù)與總和, 與與 分別為該層中分別為該層中 的方差的方差和協(xié)方差,假設(shè)和協(xié)方差,假設(shè) 換為換為 , 換為換為 ,那么顯然表示該層樣本,那么顯然表示該層樣本的方差和協(xié)方差。的方差和協(xié)方差。,hhyxhYhY ,RhRhyy hXhX X22,YhXhSSYXhS,Y XSs,Y X, y x我們可以得到有關(guān)總體我們可以得到有關(guān)總體 和和 的分別比估計(jì)為:的分別比估計(jì)為:YY 分層抽樣中的比估計(jì)有兩種:一是分層之后,先在各層分層抽樣中的比估計(jì)有兩種:一是分層之后,先在各層獲得比估計(jì),然后按層權(quán)平均得到總體參數(shù)估計(jì);二是先對(duì)獲得比估計(jì),然后

17、按層權(quán)平均得到總體參數(shù)估計(jì);二是先對(duì) 作分層估計(jì),然后再采用比估計(jì)方法。前者稱為分別比作分層估計(jì),然后再采用比估計(jì)方法。前者稱為分別比估計(jì),后者稱為結(jié)合比估計(jì)。估計(jì),后者稱為結(jié)合比估計(jì)。,Y X1111kkkhhRShRhhhhhhhhhyyyW yWXXxNx (5.15)11kkhRSRShRhhhhyyN yXyx (5.16)由上節(jié)可知,各層中的由上節(jié)可知,各層中的 是是 的漸近無偏估計(jì)量,因此的漸近無偏估計(jì)量,因此 是是 的漸近無偏估計(jì)量:的漸近無偏估計(jì)量:Rhy hY Y RSy 各層的抽樣又是獨(dú)立進(jìn)展的各層的抽樣又是獨(dú)立進(jìn)展的,根據(jù)根據(jù)(5.10)式式, 可以近似得到可以近似得到

18、 的方差或均方誤差,當(dāng)各個(gè)的方差或均方誤差,當(dāng)各個(gè) 都相當(dāng)大時(shí):都相當(dāng)大時(shí):RSy hn1()()kRSRhhE yE yY (5.17)()()RSRSMSE yVar y 22221(1)(2)khhYhhXhhYXhhhNfSR SR Sn (5.18)hhhYRX (5.17), (5.18)通知我們,即使每層通知我們,即使每層 相當(dāng)大,但假設(shè)層數(shù)相當(dāng)大,但假設(shè)層數(shù)k比較大,由于誤差的積累,比較大,由于誤差的積累, 產(chǎn)生的偏倚與誤差能夠相當(dāng)產(chǎn)生的偏倚與誤差能夠相當(dāng)大。大。hnRSy2、結(jié)合比估計(jì)、結(jié)合比估計(jì)(Combined Ratio Estimator)而而 的相應(yīng)結(jié)合比估計(jì)可以寫

19、成:的相應(yīng)結(jié)合比估計(jì)可以寫成:,Y Y 將將 分別進(jìn)展分層估計(jì),然后相比即得總體的兩個(gè)分別進(jìn)展分層估計(jì),然后相比即得總體的兩個(gè)目的平均數(shù)之比的估計(jì):目的平均數(shù)之比的估計(jì):,X YststcststyyRxx (5.19)stR ccstyyR XXx (5.20)stR cR cstyyNyXx (5.21) 為與分別比估計(jì)進(jìn)展比較,我們討論結(jié)合比估計(jì)的期為與分別比估計(jì)進(jìn)展比較,我們討論結(jié)合比估計(jì)的期望和方差。當(dāng)望和方差。當(dāng) n 相當(dāng)大時(shí),有相當(dāng)大時(shí),有()()RcRcMSE yVar y 22221(1)(2)khhYhXhYXhhhNfSR SR Sn (5.23)RY X 其中其中 為總

20、體的比值。為總體的比值。()R cEyY (5.22)(5.22)闡明,闡明, 是是 的漸近無偏估計(jì),的漸近無偏估計(jì),(5.23)與與(5.18)非常相非常相似,獨(dú)一不同的是在似,獨(dú)一不同的是在(5.18)中用的是各層的比值中用的是各層的比值 ,而,而(5.23)中用的是總體的比值中用的是總體的比值 。Rcy Y hRR3、分別比估計(jì)與結(jié)合比估計(jì)的比較、分別比估計(jì)與結(jié)合比估計(jì)的比較()()RcRsVar yVar y 22221(1)()2()khhhXhhYXhhhNfRRSRR Sn (5.24)22221(1)()2()()khhhXhhhYhXhhXhhhNfRRSRRS SR Sn

21、僅就總體總和進(jìn)展比較。假設(shè)各層的僅就總體總和進(jìn)展比較。假設(shè)各層的 相當(dāng)大,由相當(dāng)大,由(5.18)和和(5.23)可得:可得:hn當(dāng)對(duì)一切當(dāng)對(duì)一切 h 有有 時(shí),這兩種估計(jì)方差一樣,也就是說當(dāng)時(shí),這兩種估計(jì)方差一樣,也就是說當(dāng)分層對(duì)比值并無多大意義情況下,議論分別比估計(jì)與結(jié)合比分層對(duì)比值并無多大意義情況下,議論分別比估計(jì)與結(jié)合比估計(jì)孰優(yōu)孰劣曾經(jīng)無多大意義。估計(jì)孰優(yōu)孰劣曾經(jīng)無多大意義。hRR 然而,假設(shè)各層有本人的特征,然而,假設(shè)各層有本人的特征, 不能夠在每一層均等不能夠在每一層均等于于 ,此時(shí)倘假設(shè)對(duì)每一層來說,此時(shí)倘假設(shè)對(duì)每一層來說, 與與 之間的關(guān)系是比例之間的關(guān)系是比例關(guān)系,即關(guān)系,即

22、 ,此時(shí)此時(shí) ,于是,于是(5.24)式內(nèi)求式內(nèi)求和式內(nèi)每一項(xiàng)中括號(hào)內(nèi)第二部分等于零,這樣顯然有和式內(nèi)每一項(xiàng)中括號(hào)內(nèi)第二部分等于零,這樣顯然有hRRhiYhiXhihiYkX hYhhXhSR S ()()RcRsVar yVar y 即即“分別比估計(jì)比分別比估計(jì)比“結(jié)合比估計(jì)精度高一些。其實(shí),結(jié)合比估計(jì)精度高一些。其實(shí),只需比估計(jì)非常有效,即對(duì)一切只需比估計(jì)非常有效,即對(duì)一切 h , 時(shí),這時(shí),這一項(xiàng)值相對(duì)地就小,此時(shí)中括號(hào)中均以第一部分占主導(dǎo)位置,一項(xiàng)值相對(duì)地就小,此時(shí)中括號(hào)中均以第一部分占主導(dǎo)位置,仍有仍有()()RcRsVar yVar y 2hXYCC 當(dāng)然,有些層的當(dāng)然,有些層的

23、不是相當(dāng)大,這種場所分別比估計(jì)的偏倚不是相當(dāng)大,這種場所分別比估計(jì)的偏倚能夠很大而使總的均方誤差增大,于是我們寧可采用結(jié)合比能夠很大而使總的均方誤差增大,于是我們寧可采用結(jié)合比估計(jì)的方法。估計(jì)的方法。hn3 3 數(shù)值例子數(shù)值例子 例例6.2 某地域有某地域有976個(gè)自然村,根據(jù)該地域的地貌將各村所屬個(gè)自然村,根據(jù)該地域的地貌將各村所屬耕地劃為三種類型,各村按類型上報(bào)了耕地面積耕地劃為三種類型,各村按類型上報(bào)了耕地面積 (以畝計(jì)算以畝計(jì)算)為核實(shí)這些上報(bào)數(shù)據(jù),采用按比例分配的分層隨機(jī)抽樣方法為核實(shí)這些上報(bào)數(shù)據(jù),采用按比例分配的分層隨機(jī)抽樣方法在每一種類型中抽取假設(shè)干村進(jìn)展實(shí)測(cè)核實(shí),倘假設(shè)以在每一

24、種類型中抽取假設(shè)干村進(jìn)展實(shí)測(cè)核實(shí),倘假設(shè)以 X表示上表示上報(bào)數(shù)據(jù),以報(bào)數(shù)據(jù),以Y表示實(shí)測(cè)數(shù)據(jù)表示實(shí)測(cè)數(shù)據(jù),抽樣結(jié)果如下表抽樣結(jié)果如下表:1h 2h 3h iii1iy1ix2iy3iy2ix3ix123456789101241 858 9611132 934 838 621 647 654 8481174 945 88411131031 792 586 609 599 82712345671030 93110391101 941 561 930 885 996 805 995 831 545 807 652 627 974149912001254 527 585 74111301140 952

25、123456有關(guān)計(jì)算結(jié)果及其它數(shù)據(jù)如下表有關(guān)計(jì)算結(jié)果及其它數(shù)據(jù)如下表:hhNhWhX hnhyhxhhhyRx 2yhS2xhSyxhS976N 826800X 23n 933.6087y 847.7826x 1.101236yRx 257745yS 241146xS 43051yxS 1234272972520.43750.30430.25823672002516002080001076873.4000933.28571034.3333856.0000837.7143845.83331.0203271.1140861.22285742064.93331221.571121470.667457

26、10.88923294.90571846.96742055.66722692.42987713.867試對(duì)總體總和試對(duì)總體總和 (該地域?qū)嵺`耕地面積總和該地域?qū)嵺`耕地面積總和)用各種手法進(jìn)展用各種手法進(jìn)展估計(jì)估計(jì).Y (1)簡單隨機(jī)抽樣估計(jì)簡單隨機(jī)抽樣估計(jì) 由于分層抽樣是在各層按比例分配進(jìn)展的,因此可以將由于分層抽樣是在各層按比例分配進(jìn)展的,因此可以將23個(gè)村所得數(shù)據(jù)看作是從總體個(gè)村所得數(shù)據(jù)看作是從總體 976 個(gè)村中抽取的一個(gè)較合理個(gè)村中抽取的一個(gè)較合理的簡單隨機(jī)樣本,上表中最后一行的數(shù)據(jù)都是基于這樣的的簡單隨機(jī)樣本,上表中最后一行的數(shù)據(jù)都是基于這樣的“簡單隨機(jī)樣本而計(jì)算的。簡單隨機(jī)樣本而計(jì)

27、算的。976933.6087911202()yNy 畝畝為求精度,常用其規(guī)范差為求精度,常用其規(guī)范差()()()s yVar yNVar y 假設(shè)用假設(shè)用 ,那么有,那么有211( )()yVar ysnN 11()976()5774648324()23976s y 畝畝然而我們的這些數(shù)據(jù)畢竟是從分層抽樣而得到的,利用分層然而我們的這些數(shù)據(jù)畢竟是從分層抽樣而得到的,利用分層估計(jì)真正的簡單隨機(jī)抽樣的平均數(shù)的方差,可以借用一個(gè)近估計(jì)真正的簡單隨機(jī)抽樣的平均數(shù)的方差,可以借用一個(gè)近似公式用于按比例分配的分層抽樣情況也許更為準(zhǔn)確:似公式用于按比例分配的分層抽樣情況也許更為準(zhǔn)確:21( )()(1)ys

28、tNnnv ysv yn Nn 221111()(1)kyhyhhNnnsW sn NnnN (5.25)( )( )976( )48351()s yNv yv y 畝畝此時(shí)此時(shí)97623231( )5774523(9761)23v y 11()(0.4375 42064.9330.3043 31221.5710.2582 121470.667)23976 245.4235 兩種算法的差距并不大。兩種算法的差距并不大。(2)簡單隨機(jī)抽樣比估計(jì)簡單隨機(jī)抽樣比估計(jì)1.101236 826800910502()RyyXRXx 畝畝222(1)()(Ryxfs yNSR Sn 2)23095()xyR

29、S畝畝(3)分層隨機(jī)抽樣簡單估計(jì)分層隨機(jī)抽樣簡單估計(jì)1910780()ksthhhyN y 畝畝()()ststs yNv y 2111()khhhNW SnN 11976 ()(0.4375 42064.933 0.3043 31221.571 0.2582 121470.667)23976 48975( 畝)畝)(4)分層隨機(jī)抽樣分別比估計(jì)分層隨機(jī)抽樣分別比估計(jì)1kRSRShhhyN yRX 367200 1.020327251600 1.114086208000 1.222857 909322() 畝畝22221(1)()(khhRSyhhxhhhNfs ysR sn 2)hyxhR s

30、 15360() 畝畝(5)分層隨機(jī)抽樣結(jié)合比估計(jì)分層隨機(jī)抽樣結(jié)合比估計(jì)1ststcksthhhyyRxNx 9107801.1006908274631.100690 826800910050()RccyR X 畝畝22221(1)()(khhRcYhcxhhhNfs ySR sn 2)cyxhR s 15936() 畝畝 從以上五種情況的結(jié)果分析,兩種簡單估計(jì)的精度較差從以上五種情況的結(jié)果分析,兩種簡單估計(jì)的精度較差由于他們沒有充分利用知的由于他們沒有充分利用知的 及及 的信息,三種比估計(jì)由的信息,三種比估計(jì)由于利用了于利用了 的信息,顯然精度大大提高了。的信息,顯然精度大大提高了。X xX

31、 同時(shí)我們留意到分層隨機(jī)抽樣的兩種比估計(jì)比起簡單隨同時(shí)我們留意到分層隨機(jī)抽樣的兩種比估計(jì)比起簡單隨機(jī)抽樣的比估計(jì)效果略好一些,這是由于在實(shí)踐丈量中已分機(jī)抽樣的比估計(jì)效果略好一些,這是由于在實(shí)踐丈量中已分的三層確實(shí)有所區(qū)別。的三層確實(shí)有所區(qū)別。 最后我們指出,在分層隨機(jī)抽樣中,分別比估計(jì)與結(jié)合最后我們指出,在分層隨機(jī)抽樣中,分別比估計(jì)與結(jié)合比估計(jì)有著幾乎差不多的效果,這正是我們?cè)谡闹兴撌霰裙烙?jì)有著幾乎差不多的效果,這正是我們?cè)谡闹兴撌龅睦碛?,?dāng)每層抽樣容量的理由,當(dāng)每層抽樣容量 不很大時(shí),結(jié)合比估計(jì)不比分別不很大時(shí),結(jié)合比估計(jì)不比分別比估計(jì)來的差。比估計(jì)來的差。hn 一個(gè)有趣的現(xiàn)實(shí)是對(duì)于

32、一個(gè)有趣的現(xiàn)實(shí)是對(duì)于 的估計(jì),恰好三個(gè)比估計(jì)比起的估計(jì),恰好三個(gè)比估計(jì)比起兩個(gè)簡單估計(jì)要略低一些,由于隨機(jī)性,當(dāng)然我們不能指認(rèn)兩個(gè)簡單估計(jì)要略低一些,由于隨機(jī)性,當(dāng)然我們不能指認(rèn)究竟哪一個(gè)估計(jì)比較接近現(xiàn)實(shí),但是三種比估計(jì)統(tǒng)統(tǒng)略低會(huì)究竟哪一個(gè)估計(jì)比較接近現(xiàn)實(shí),但是三種比估計(jì)統(tǒng)統(tǒng)略低會(huì)使我們產(chǎn)生這樣一個(gè)想法:這能否會(huì)是由于比估計(jì)本身時(shí)有使我們產(chǎn)生這樣一個(gè)想法:這能否會(huì)是由于比估計(jì)本身時(shí)有偏性而引起的呢?對(duì)于上面詳細(xì)例子我們?nèi)狈Ω犝f它們偏偏性而引起的呢?對(duì)于上面詳細(xì)例子我們?nèi)狈Ω犝f它們偏小了些。但是比估計(jì)的有偏性卻在實(shí)際上是無法否認(rèn)的現(xiàn)實(shí)小了些。但是比估計(jì)的有偏性卻在實(shí)際上是無法否認(rèn)的現(xiàn)實(shí)調(diào)查任務(wù)者與統(tǒng)計(jì)學(xué)家不斷在設(shè)法盡力減少偏向,這稱為估調(diào)查任務(wù)者與統(tǒng)計(jì)學(xué)家不斷在設(shè)法盡力減少偏向,這稱為估計(jì)量的計(jì)量的“糾偏。糾偏。Y U1 U2 U3 U 4 U 5 U6XiYi0 1 3 5 8 101 3 11 18 29 461 對(duì)以下假設(shè)總體對(duì)以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論