




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Chap2簡單隨機抽樣
2.2簡單估計法(SE)
2.1定義與符號
抽
樣
調
查
2.5樣本量的確定
2.6其它相關問題
2.3比率估計量
2.4回歸估計量12/12/20221Chap2簡單隨機抽樣
2.2簡單估計法(SE)§2.1定義與符號一、定義與符號
(一)定義上述抽樣就稱為不放回簡單隨機抽樣
定義2.1:設有限總體共有N個單元,一次整批抽取n個單元使得每個單元被抽中的概率都相等,任何n個不同單元的組合(樣本)都有相同的概率被抽中,這種抽樣方法稱為簡單隨機抽樣法,所抽到的樣本為簡單隨機樣本。
12/12/20222§2.1定義與符號一、定義與符號(一)定義上述抽樣就稱
定義2.2:(在具體實施過程中,)從總體中逐個等概率抽取單元(每次抽取到尚未入樣的任何一個單元的概率都相等),直到抽滿n個為止。如果每次抽中一個單元,然后放回總體,重新抽取。這樣一個單元有可能被重復抽中,故又稱重復抽樣。12/12/20223定義2.2:(在具體實施過程中,)從總體中逐個等概率抽取單
定義2.3按照從總體的N個單元中抽取n個單元的所有可能不同的組合構造所有可能的CNn個樣本,從CNn個樣本隨機抽取一個樣本,使每個樣本被抽中的概率都等于1/CNn.上述三中定義其實是完全等價的,而定義2.2在實際中容易實施。12/12/20224定義2.3按照從總體的N個單元中抽取n個單元的所有可能不例2.1設總體有5個單元(1,2,3,4,5),按有放回簡單隨機抽樣的方式抽取容量為2的樣本,則所有可能樣本為個,如表2.1。
表2.1放回簡單隨機抽樣所有可能樣本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,512/12/20225例2.1設總體有5個單元(1,2,3,4,5),按有放回簡例2.2上述總體按不放回簡單隨機抽樣方式抽取容量為2的樣本,則所有可能樣本為個,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2不放回簡單隨機抽樣所有可能樣本12/12/20226例2.2上述總體按不放回簡單隨機抽樣方式抽取容量個,如表2(二)樣本分布與符號從總體抽樣單元。假設順序被抽中的樣本單元的號碼為(入樣號碼),則樣本為,稱為抽樣比(Samplingfraction)。中逐個不放回抽取n個作為隨機變量樣本有什么分布呢?12/12/20227(二)樣本分布與符號從總體抽樣單元。假設順序被抽中的樣本單元1y1,…yn同分布但不相互獨立,其共同分布列為2(yi,yj)的聯(lián)合分布列均同(y1,y2)12/12/202281y1,…yn同分布但不相互獨立,其共同分布列為2(表2.3符號總體參數樣本統(tǒng)計量12/12/20229表2.3符號總體參數樣本統(tǒng)計量12/10/20229二、抽樣方法(一)抽簽法
制作N個外形相同的簽,將它們充分混合,然后一次抽取n個簽,或一次抽取一個但不放回,抽取n次得到n個簽。則這n個簽上所對應號碼表示入樣的單元號。例如:某中學為了解學生身體素質的基本狀況,從全校N=1200人中抽取一個簡單樣本n=100人進行檢查。12/12/202210二、抽樣方法(一)抽簽法制作N個外形相同的簽,將它們充分混1隨機數表(二)隨機數法如上例,N=1200,則在表中隨機連續(xù)取四列,順序往下,選出前面100個不同(不放回抽樣)的0001~1200之間的數字。如果不夠100個,可隨機再取四列,同樣操作,直至抽取100個止。12/12/2022111隨機數表(二)隨機數法如上例,N=1200,則在表中隨機Simplerandomsampling12/12/202212Simplerandomsampling12/10/20Tableofrandomnumbers12/12/202213Tableofrandomnumbers12/10/22隨機數骰子隨機數骰子是由均勻材質制成的正20面體,每個面上刻有一個0~9的數字,且每個數字只出現在兩個面上。要產生一個m位數的隨機數(如m=4,N=1200),則將m(m=4)個顏色不同的骰子盒中,并規(guī)定每個顏色代表的位數,蓋上蓋子,充分搖動盒子后,打開讀出各色骰子的數字,即可得一個隨機數。重復上述過程,直至產生了n個滿足條件的隨機數。12/12/2022142隨機數骰子隨機數骰子是由均勻材質制成的正20面3利用統(tǒng)計軟件直接抽取法大部分統(tǒng)計軟件都有產生隨機數的功能,快捷方便。不過產生的是偽隨機數,有一定循環(huán)周期的。簡單介紹一下利用EXCEL產生隨機數的方法.
12/12/2022153利用統(tǒng)計軟件直接抽取法大部分統(tǒng)計軟件都有產生隨機數的功12/12/20221612/10/20221612/12/20221712/10/20221712/12/20221812/10/202218§2.2簡單估計法(SE)一、總體均值的估計(一)簡單估計定義
………………..(2.6)
(二)簡單估計量的性質引理2.1從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本,則總體中每個特定的單元入樣的概率為n/N,兩個特定單元入樣的概率為n(n-1)/N(N-1)。
12/12/202219§2.2簡單估計法(SE)一、總體均值的估計(一)簡單估
引理2.2從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本。若令:則:12/12/202220引理2.2從大小為N的總體中抽取一個樣本容量為n的簡單隨機(二)簡單估計量的性質
定理2.1上述簡單估計是無偏的,即
定理2.2上述簡單估計的方差(均方誤差)為:……….(2.12/2.18)
12/12/202221(二)簡單估計量的性質定理2.1上述簡單估計是無偏的,證明(P35證法1對稱證法):為0注意樣本分布12/12/202222證明(P35證法1對稱證法):為0注意樣本分布12/10/推論2.7的無偏估計為………..(2.25)
證明:只須說明樣本方差是總體方差的無偏估計即可。注意12/12/202223推論2.7的無偏估計為………..(2.25)證明:只須說明
例2.3從某個N=100的總體重抽取一個容量n=10的簡單隨機樣本,要估計總體平均水平,并給出置信度為95%的置信區(qū)間估計。如表2.4序號1234567891045204661508表2.4簡單隨機樣本指標
12/12/202224例2.3從某個N=100的總體重抽取一個容量n=10序號12/12/20222512/10/202225(三)有放回簡單隨機抽樣的簡單估計量由于故有放回抽樣的精度低于不放回抽樣的精度。12/12/202226(三)有放回簡單隨機抽樣的簡單估計量由于故有放回抽樣的精度低說明:1抽樣調查中的估計量與傳統(tǒng)數理統(tǒng)計中估計量的區(qū)別(見表2.5)表2.5抽樣理論與傳統(tǒng)數理統(tǒng)計關于樣本均值性質異同比較抽樣理論數理統(tǒng)計理論假設樣本之間不獨立,所以可能樣本最多個,欲估計總體特征為,當n=N時可以求出樣本之間獨立,所有可能樣本最多為無限多個;欲估計總體特征為總體(一般是隨機變量X)期望μ,一般不能通過樣本求出符號、定義期望方差12/12/202227說明:1抽樣調查中的估計量與傳統(tǒng)數理統(tǒng)計中估計量的區(qū)別(見2總體方差一般也是未知的,故計算估計量方差(估計)值時總是用樣本方差直接去估計它,因為該估計無偏,故這樣做相對是合理的。3
對于無限總體的簡單隨機抽樣(或有限總體有放回簡單抽樣)估計中由于N一般很大,
即從有限總體抽樣得到簡單隨機樣本均值得方差是從無限總體抽樣得的獨立樣本均值的方差的1-f倍,要小些,這意味著對同等樣本量,不放回簡單隨機抽樣的精度高于有放回的。由于樣本點不會重復,樣本量相同時所包含的有效樣本點更多,因此信息更多,效果當然好些。1-f又被稱為有限總體校正系數。12/12/2022282總體方差一般也是未知的,故計算估計量方差(估計)值時總是4樣本容量n越大,估計量方差越小。當樣本容量一定時,總體方差越大,估計量方差越大。由于總體方差是固定的,因此在簡單隨機抽樣的條件下,要提高估計量精度就只有增加樣本容量了。但增加樣本容量也會帶來計算量驟增和成本增加,所以是矛盾的一對,需要找到合適的平衡點。12/12/2022294樣本容量n越大,估計量方差越小。當樣本容量一定時,二、總體總量的估計(一)簡單估計量…………….(2.7)(二)估計量性質推論2.12.42.8
……….(2.13)…………….(2.19)…………….(2.26)12/12/202230二、總體總量的估計(一)簡單估計量…………….(2.7)(例2.4(續(xù)例2.3)估計總體總量,并給出置信度為95%條件下的估計相對誤差
。三、總體比例的估計將總體分為兩類,一類具有該特征的單元A個,另一類不具有該特征的單元N-A個。調查的目的是估計或A
若令則12/12/202231例2.4(續(xù)例2.3)估計總體總量,并給出置信度三、總體比例(一)估計量的定義(二)估計量性質推論2.22.52.9對于簡單隨機抽樣,p是P無偏估計。p的方差為
方差的無偏估計……(2.27)……(2.20)12/12/202232(一)估計量的定義(二)估計量性質推論2.22.52例2.5某超市開張一段時間后,為改進銷售服務環(huán)境,欲調查附近幾個小區(qū)居民到該超市購物的滿意度。該超市與附近一個小區(qū)的居委會取得聯(lián)系,在總體中按簡單隨機抽樣抽取了一個大小為n=200人的樣本。調查發(fā)現對購物表示滿意或基本滿意的居民有130人,估計對該超市購物環(huán)境持肯定態(tài)度的居民的比例,并在置信度95%條件下,給出估計的絕對誤差和置信區(qū)間,假設抽樣比可以忽略。12/12/202233例2.5某超市開張一段時間后,為改進銷售服務環(huán)境,12/10(2)樣本協(xié)方差是總體協(xié)方差的無偏估計.
(2.22,2.23)(2.29)考慮二維總體12/12/202234(2)樣本協(xié)方差是總體協(xié)方差的無偏估計.(2.22,2.2證明:仍采用對稱法(P40證法1)(1)注意樣本分布注意為012/12/202235證明:仍采用對稱法(P40證法1)(1)注意樣本分布注意為0(1)證法2:(構造性)展開12/12/202236(1)證法2:(構造性)展開12/10/202236(2)注意由(1)12/12/202237(2)注意由(1)12/10/202237一、概念與作用(一)概念比率(Ratio)與比例(Proportion)區(qū)別(二)作用§2.3比率估計量及其性質一種場合是待估的總體參數R是兩個變量比值。如人口密度,恩格爾系數等。
分子分母均為r.v.分子為r.v.12/12/202238一、概念與作用§2.3比率估計量及其性質一種場合是待估的總另一種應用場合,雖然待估的參數是某個研究變量的均值或總體總量,它本來可以通過樣本均值加以估計,但是為了提高估計的效率,它通過引進一個輔助變量xi,來計算比率,即再通過這一比率乘以總體已知的輔助變量均值或總量來達到估計的目的。12/12/202239另一種應用場合,雖然待估的參數是某個研究變量的均值或總體總量二、應用條件(1)輔助變量(auxiliaryvariable)資料易得或已知(2)輔助變量與目標變量之間存在高度相關性且相關性穩(wěn)定。(3)樣本量一般要求比較大三、簡單隨機抽樣下的比率估計12/12/202240二、應用條件(1)輔助變量(auxiliar(一)定義
比率估計量(ratioestimator)又稱比估計。(2.30)(2.31)12/12/202241(一)定義(2.30)(2.31)12/10/202(二)比率估計的性質引理2.3定理2.6推論2.1112/12/202242(二)比率估計的性質引理2.3定理2.6推論2.1112/1引理2.4證:當n充分大時12/12/202243引理2.4證:當n充分大時12/10/202243定理2.7推論2.1212/12/202244定理2.7推論2.1212/10/202244因而方差估計有兩種思路…(2.39)…(2.40)12/12/202245因而方差估計…(2.39)…(2.40)12/10/2022例2.6i123456均值XiYi011331151882910464.518表4.1假設的總體數據12/12/202246例2.6i123456均值Xi01358104.5表4.1解:i樣本簡單估計比率估計123456789101112131415均值1,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.7517.6864412/12/202247解:i樣本簡單估計比率估計11,22.01812/10/2012/12/20224812/10/202248解12/12/202249解12/10/202249例2.7(P51例2.4)
在二十世紀90年代初的一項工資研究中,人們發(fā)現IT行業(yè)中,從業(yè)者的現薪與起薪之間相關系數ρ高達0.88,已知某IT企業(yè)474名員工的評鑒起薪為17016.00元/年,現根據對100個按簡單隨機抽樣方式選出的員工現薪的調查結果,估計該企業(yè)員工的現薪平均水平。數據如下:,,12/12/202250例2.7(P51例2.4)在二十世紀90年代初的一項工資研解:簡單估計95%的置信區(qū)間比率估計95%的置信區(qū)間12/12/202251解:簡單估計95%的置信區(qū)間比率估計95%的置信例2.8某縣在對船舶月完成的貨運量進行調查,對運管部門登記的船舶臺帳進行整理后獲得注冊船舶2860艘,載重噸位154626噸。從2860艘船舶中抽取一個n=10的簡單隨機樣本。調查得到樣本船舶月完成的貨運量及其載重噸位如表4.2(單位:噸)要估計該縣船舶月完成貨運量1234578015001005376600100505010206789102170182314501581370120150802050表4.2樣本船舶貨運量及載重噸位數據12/12/202252例2.8某縣在對船舶月完成的貨運量進行調查,對運管部門登記的解12/12/202253解12/10/20225312/12/20225412/10/202254
(三)消除比率估計偏倚的方法12/12/202255(三)消除比率估計偏倚的方法12/10/202255
哈特利-羅斯(Hartley-Ross,1954)提出的估計量(2.51)于是可以令12/12/202256哈特利-羅斯(Hartley-Ross,1954)提出的估事實上:12/12/202257事實上:12/10/202257例2.9
12/12/202258例2.912/10/202258四、比率估計的效率≈1/212/12/202259四、比率估計的效率≈1/212/10/202259§2.4回歸估計量及其性質比率估計成為最優(yōu)線性估計的條件:(1)樣本點(yi,xi)形成過原點的直線(2)yi對直線的偏差與xi成比例12/12/202260§2.4回歸估計量及其性質比率估計成為最優(yōu)線性估計的條件一、回歸估計的定義二、β是已知常數時(記為β0)
定理2.8
12/12/202261一、回歸估計的定義二、β是已知常數時(記為β0)定理2.8Q:“β0取何值時,回歸估計量的精度最高,即最?。俊倍ɡ?.9:三、由樣本回歸系數計算得到
(2.56Y對X回歸系數)定理2.10這時的均值估計量是漸近無偏估計注意b并不是B的無偏估計12/12/202262Q:“β0取何值時,回歸估計量的精度最高,即最定理2.11
它的一個近似估計為:12/12/202263定理2.11它的一個近似估計為:12/10/202263例2.10續(xù)例2.812/12/202264例2.10續(xù)例2.812/10/202264四、精度比較1回歸估計總優(yōu)于簡單估計,除非ρ=0
2比率估計優(yōu)于簡單估計的條件
3回歸估計優(yōu)于比率估計的條件是五、多變量回歸估計(略)12/12/202265四、精度比較1回歸估計總優(yōu)于簡單估計,除非ρ=02比率估計§2.5樣本量的確定一、總體均值情形1給定標準誤差上限,求滿足條件的最小n
12/12/202266§2.5樣本量的確定一、總體均值情形1給定標準誤差上限
2給定絕對誤差上限及信度,求滿足條件的最小n有放回,不放回3給定相對誤差上限及信度,求滿足條件的最小n有放回不放回12/12/2022672給定絕對誤差上限及信度,求滿足條件的最小n有放回,不放4給定相對標準誤差上限γ,求滿足條件
的最小n.放回不放回例2.6在例2.3中,如果要求以95%的把握保證相對誤差不超過10%,樣本量應該取多少?12/12/2022684給定相對標準誤差上限γ,求滿足條件的最小n.放回不放回12/12/20226912/10/202269二、總體總量情形作業(yè)考慮各種情行的公式例欲估計一個農村的每月平均副業(yè)收入,已知該村共有1000戶農戶,月副業(yè)收入的標準差不超過300元。(1)現要求置信度為95%,估計每戶月副業(yè)收入的誤差不超過50元,應抽取多少戶作為樣本?(2)若每戶調查費用為15元,調查管理費用為800元,該項調查預計費用是多少?12/12/202270二、總體總量情形作業(yè)考慮各種情行的公式例欲估計一個農例如果上例目的是要估計全村1000戶一月的副業(yè)總收入,允許總量的誤差為40000,置信度為95%,應抽取多少樣本?
三、總體參數P的情形四、總體參數的預先估計12/12/202271例如果上例目的是要估計全村1000戶一月的副業(yè)三、總體參數(1)根據以往的經驗數據例如對同類問題獲得過一個樣本量n0為的簡單隨機樣本,并且已知在一定置信度下(比如95%),該調查對總體均值(或總量)估計的相對誤差上限為r0,則在相同的置信度下,如果希望本次調查的相對誤差上限為r,則在抽樣比可以忽略的情況下,可以近似地計算出本次調查所需的樣本量:作業(yè)證明上述結論12/12/202272(1)根據以往的經驗數據例如對同類問題獲得過一個樣本量n0(2)在正式調查前進行試點調查,根據試點調查的結果作出估計,或者采用兩步抽樣(3)沒有同類調查經驗,又不能進行預調查,則只能通過有經驗的專家作一些定性分析,對總體變異系數C(比較穩(wěn)定)作出估計。
(4)注意:針對總體參數為P時情形
當估計P<0.5,則選取較大的P,如若估計P為[0.3,0.4]則選取P為0.4當估計P>0.5,則選取較小的P,如若估計P為[0.6,0.8]則選取P為0.6若對P一無所知則取P=0.5。12/12/202273(2)在正式調查前進行試點調查,根據試點調查的(3)沒有同類例2.7某銷售公司希望了解全部3000家客戶對公司的滿意度,決定用電話調查一個簡單隨機樣本。這時銷售公司希望以95%的把握保證客戶滿意度比例P在樣本比例[p-10%,p+10%]范圍內,但對總體比例P無法給出一個大致范圍。這時調查多少個客戶,才能保證滿足要求?12/12/202274例2.7某銷售公司希望了解全部3000家客戶對公司的滿意度§2.6其它相關問題一、逆抽樣比例P是稀有事件的比例,一般P<0.2
事先給定一個正整數m,然后逐個隨機抽取樣本,n個單元。
直到抽到m個所考慮特征的單元為止,設共取了12/12/202275§2.6其它相關問題一、逆抽樣比例P是稀有事件的比例,一事實上利用負二項分布的分布列之和為112/12/202276事實上利用負二項分布的12/10/202276這樣給定了相對標準誤差后,就可以確定m
12/12/202277這樣給定了相對標準12/10/202277二、設計效應(Designeffect)(L.Kish)12/12/202278二、設計效應(Designeffect)(L.Kish)1通常的值因為總體方差未知而事先無法得知,此時需注意在經費允許的前提下,樣本量取值應堅持保守原則,盡量大一點,以便留有余地。例如后續(xù)的分層抽樣的deff<1,而取為1.實際上,我們在調查時無法保證在每個被抽中的樣本點上都能如愿地獲得有效信息。例如不是每個人都愿意接受訪問,也不是每個人都能按要求提供真是答案,尤其當問題涉及隱私或其它敏感內容時,所以必須考慮有效回答率。如估計有效回答率為r,則需再調整樣本量為n/r.12/12/202279通常的值因為總體方差未知而事先無法得知,此時需注意在經費允宏村12/12/202280宏村12/10/202280Chap2簡單隨機抽樣
2.2簡單估計法(SE)
2.1定義與符號
抽
樣
調
查
2.5樣本量的確定
2.6其它相關問題
2.3比率估計量
2.4回歸估計量12/12/202281Chap2簡單隨機抽樣
2.2簡單估計法(SE)§2.1定義與符號一、定義與符號
(一)定義上述抽樣就稱為不放回簡單隨機抽樣
定義2.1:設有限總體共有N個單元,一次整批抽取n個單元使得每個單元被抽中的概率都相等,任何n個不同單元的組合(樣本)都有相同的概率被抽中,這種抽樣方法稱為簡單隨機抽樣法,所抽到的樣本為簡單隨機樣本。
12/12/202282§2.1定義與符號一、定義與符號(一)定義上述抽樣就稱
定義2.2:(在具體實施過程中,)從總體中逐個等概率抽取單元(每次抽取到尚未入樣的任何一個單元的概率都相等),直到抽滿n個為止。如果每次抽中一個單元,然后放回總體,重新抽取。這樣一個單元有可能被重復抽中,故又稱重復抽樣。12/12/202283定義2.2:(在具體實施過程中,)從總體中逐個等概率抽取單
定義2.3按照從總體的N個單元中抽取n個單元的所有可能不同的組合構造所有可能的CNn個樣本,從CNn個樣本隨機抽取一個樣本,使每個樣本被抽中的概率都等于1/CNn.上述三中定義其實是完全等價的,而定義2.2在實際中容易實施。12/12/202284定義2.3按照從總體的N個單元中抽取n個單元的所有可能不例2.1設總體有5個單元(1,2,3,4,5),按有放回簡單隨機抽樣的方式抽取容量為2的樣本,則所有可能樣本為個,如表2.1。
表2.1放回簡單隨機抽樣所有可能樣本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,512/12/202285例2.1設總體有5個單元(1,2,3,4,5),按有放回簡例2.2上述總體按不放回簡單隨機抽樣方式抽取容量為2的樣本,則所有可能樣本為個,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2不放回簡單隨機抽樣所有可能樣本12/12/202286例2.2上述總體按不放回簡單隨機抽樣方式抽取容量個,如表2(二)樣本分布與符號從總體抽樣單元。假設順序被抽中的樣本單元的號碼為(入樣號碼),則樣本為,稱為抽樣比(Samplingfraction)。中逐個不放回抽取n個作為隨機變量樣本有什么分布呢?12/12/202287(二)樣本分布與符號從總體抽樣單元。假設順序被抽中的樣本單元1y1,…yn同分布但不相互獨立,其共同分布列為2(yi,yj)的聯(lián)合分布列均同(y1,y2)12/12/2022881y1,…yn同分布但不相互獨立,其共同分布列為2(表2.3符號總體參數樣本統(tǒng)計量12/12/202289表2.3符號總體參數樣本統(tǒng)計量12/10/20229二、抽樣方法(一)抽簽法
制作N個外形相同的簽,將它們充分混合,然后一次抽取n個簽,或一次抽取一個但不放回,抽取n次得到n個簽。則這n個簽上所對應號碼表示入樣的單元號。例如:某中學為了解學生身體素質的基本狀況,從全校N=1200人中抽取一個簡單樣本n=100人進行檢查。12/12/202290二、抽樣方法(一)抽簽法制作N個外形相同的簽,將它們充分混1隨機數表(二)隨機數法如上例,N=1200,則在表中隨機連續(xù)取四列,順序往下,選出前面100個不同(不放回抽樣)的0001~1200之間的數字。如果不夠100個,可隨機再取四列,同樣操作,直至抽取100個止。12/12/2022911隨機數表(二)隨機數法如上例,N=1200,則在表中隨機Simplerandomsampling12/12/202292Simplerandomsampling12/10/20Tableofrandomnumbers12/12/202293Tableofrandomnumbers12/10/22隨機數骰子隨機數骰子是由均勻材質制成的正20面體,每個面上刻有一個0~9的數字,且每個數字只出現在兩個面上。要產生一個m位數的隨機數(如m=4,N=1200),則將m(m=4)個顏色不同的骰子盒中,并規(guī)定每個顏色代表的位數,蓋上蓋子,充分搖動盒子后,打開讀出各色骰子的數字,即可得一個隨機數。重復上述過程,直至產生了n個滿足條件的隨機數。12/12/2022942隨機數骰子隨機數骰子是由均勻材質制成的正20面3利用統(tǒng)計軟件直接抽取法大部分統(tǒng)計軟件都有產生隨機數的功能,快捷方便。不過產生的是偽隨機數,有一定循環(huán)周期的。簡單介紹一下利用EXCEL產生隨機數的方法.
12/12/2022953利用統(tǒng)計軟件直接抽取法大部分統(tǒng)計軟件都有產生隨機數的功12/12/20229612/10/20221612/12/20229712/10/20221712/12/20229812/10/202218§2.2簡單估計法(SE)一、總體均值的估計(一)簡單估計定義
………………..(2.6)
(二)簡單估計量的性質引理2.1從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本,則總體中每個特定的單元入樣的概率為n/N,兩個特定單元入樣的概率為n(n-1)/N(N-1)。
12/12/202299§2.2簡單估計法(SE)一、總體均值的估計(一)簡單估
引理2.2從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本。若令:則:12/12/2022100引理2.2從大小為N的總體中抽取一個樣本容量為n的簡單隨機(二)簡單估計量的性質
定理2.1上述簡單估計是無偏的,即
定理2.2上述簡單估計的方差(均方誤差)為:……….(2.12/2.18)
12/12/2022101(二)簡單估計量的性質定理2.1上述簡單估計是無偏的,證明(P35證法1對稱證法):為0注意樣本分布12/12/2022102證明(P35證法1對稱證法):為0注意樣本分布12/10/推論2.7的無偏估計為………..(2.25)
證明:只須說明樣本方差是總體方差的無偏估計即可。注意12/12/2022103推論2.7的無偏估計為………..(2.25)證明:只須說明
例2.3從某個N=100的總體重抽取一個容量n=10的簡單隨機樣本,要估計總體平均水平,并給出置信度為95%的置信區(qū)間估計。如表2.4序號1234567891045204661508表2.4簡單隨機樣本指標
12/12/2022104例2.3從某個N=100的總體重抽取一個容量n=10序號12/12/202210512/10/202225(三)有放回簡單隨機抽樣的簡單估計量由于故有放回抽樣的精度低于不放回抽樣的精度。12/12/2022106(三)有放回簡單隨機抽樣的簡單估計量由于故有放回抽樣的精度低說明:1抽樣調查中的估計量與傳統(tǒng)數理統(tǒng)計中估計量的區(qū)別(見表2.5)表2.5抽樣理論與傳統(tǒng)數理統(tǒng)計關于樣本均值性質異同比較抽樣理論數理統(tǒng)計理論假設樣本之間不獨立,所以可能樣本最多個,欲估計總體特征為,當n=N時可以求出樣本之間獨立,所有可能樣本最多為無限多個;欲估計總體特征為總體(一般是隨機變量X)期望μ,一般不能通過樣本求出符號、定義期望方差12/12/2022107說明:1抽樣調查中的估計量與傳統(tǒng)數理統(tǒng)計中估計量的區(qū)別(見2總體方差一般也是未知的,故計算估計量方差(估計)值時總是用樣本方差直接去估計它,因為該估計無偏,故這樣做相對是合理的。3
對于無限總體的簡單隨機抽樣(或有限總體有放回簡單抽樣)估計中由于N一般很大,
即從有限總體抽樣得到簡單隨機樣本均值得方差是從無限總體抽樣得的獨立樣本均值的方差的1-f倍,要小些,這意味著對同等樣本量,不放回簡單隨機抽樣的精度高于有放回的。由于樣本點不會重復,樣本量相同時所包含的有效樣本點更多,因此信息更多,效果當然好些。1-f又被稱為有限總體校正系數。12/12/20221082總體方差一般也是未知的,故計算估計量方差(估計)值時總是4樣本容量n越大,估計量方差越小。當樣本容量一定時,總體方差越大,估計量方差越大。由于總體方差是固定的,因此在簡單隨機抽樣的條件下,要提高估計量精度就只有增加樣本容量了。但增加樣本容量也會帶來計算量驟增和成本增加,所以是矛盾的一對,需要找到合適的平衡點。12/12/20221094樣本容量n越大,估計量方差越小。當樣本容量一定時,二、總體總量的估計(一)簡單估計量…………….(2.7)(二)估計量性質推論2.12.42.8
……….(2.13)…………….(2.19)…………….(2.26)12/12/2022110二、總體總量的估計(一)簡單估計量…………….(2.7)(例2.4(續(xù)例2.3)估計總體總量,并給出置信度為95%條件下的估計相對誤差
。三、總體比例的估計將總體分為兩類,一類具有該特征的單元A個,另一類不具有該特征的單元N-A個。調查的目的是估計或A
若令則12/12/2022111例2.4(續(xù)例2.3)估計總體總量,并給出置信度三、總體比例(一)估計量的定義(二)估計量性質推論2.22.52.9對于簡單隨機抽樣,p是P無偏估計。p的方差為
方差的無偏估計……(2.27)……(2.20)12/12/2022112(一)估計量的定義(二)估計量性質推論2.22.52例2.5某超市開張一段時間后,為改進銷售服務環(huán)境,欲調查附近幾個小區(qū)居民到該超市購物的滿意度。該超市與附近一個小區(qū)的居委會取得聯(lián)系,在總體中按簡單隨機抽樣抽取了一個大小為n=200人的樣本。調查發(fā)現對購物表示滿意或基本滿意的居民有130人,估計對該超市購物環(huán)境持肯定態(tài)度的居民的比例,并在置信度95%條件下,給出估計的絕對誤差和置信區(qū)間,假設抽樣比可以忽略。12/12/2022113例2.5某超市開張一段時間后,為改進銷售服務環(huán)境,12/10(2)樣本協(xié)方差是總體協(xié)方差的無偏估計.
(2.22,2.23)(2.29)考慮二維總體12/12/2022114(2)樣本協(xié)方差是總體協(xié)方差的無偏估計.(2.22,2.2證明:仍采用對稱法(P40證法1)(1)注意樣本分布注意為012/12/2022115證明:仍采用對稱法(P40證法1)(1)注意樣本分布注意為0(1)證法2:(構造性)展開12/12/2022116(1)證法2:(構造性)展開12/10/202236(2)注意由(1)12/12/2022117(2)注意由(1)12/10/202237一、概念與作用(一)概念比率(Ratio)與比例(Proportion)區(qū)別(二)作用§2.3比率估計量及其性質一種場合是待估的總體參數R是兩個變量比值。如人口密度,恩格爾系數等。
分子分母均為r.v.分子為r.v.12/12/2022118一、概念與作用§2.3比率估計量及其性質一種場合是待估的總另一種應用場合,雖然待估的參數是某個研究變量的均值或總體總量,它本來可以通過樣本均值加以估計,但是為了提高估計的效率,它通過引進一個輔助變量xi,來計算比率,即再通過這一比率乘以總體已知的輔助變量均值或總量來達到估計的目的。12/12/2022119另一種應用場合,雖然待估的參數是某個研究變量的均值或總體總量二、應用條件(1)輔助變量(auxiliaryvariable)資料易得或已知(2)輔助變量與目標變量之間存在高度相關性且相關性穩(wěn)定。(3)樣本量一般要求比較大三、簡單隨機抽樣下的比率估計12/12/2022120二、應用條件(1)輔助變量(auxiliar(一)定義
比率估計量(ratioestimator)又稱比估計。(2.30)(2.31)12/12/2022121(一)定義(2.30)(2.31)12/10/202(二)比率估計的性質引理2.3定理2.6推論2.1112/12/2022122(二)比率估計的性質引理2.3定理2.6推論2.1112/1引理2.4證:當n充分大時12/12/2022123引理2.4證:當n充分大時12/10/202243定理2.7推論2.1212/12/2022124定理2.7推論2.1212/10/202244因而方差估計有兩種思路…(2.39)…(2.40)12/12/2022125因而方差估計…(2.39)…(2.40)12/10/2022例2.6i123456均值XiYi011331151882910464.518表4.1假設的總體數據12/12/2022126例2.6i123456均值Xi01358104.5表4.1解:i樣本簡單估計比率估計123456789101112131415均值1,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.7517.6864412/12/2022127解:i樣本簡單估計比率估計11,22.01812/10/2012/12/202212812/10/202248解12/12/2022129解12/10/202249例2.7(P51例2.4)
在二十世紀90年代初的一項工資研究中,人們發(fā)現IT行業(yè)中,從業(yè)者的現薪與起薪之間相關系數ρ高達0.88,已知某IT企業(yè)474名員工的評鑒起薪為17016.00元/年,現根據對100個按簡單隨機抽樣方式選出的員工現薪的調查結果,估計該企業(yè)員工的現薪平均水平。數據如下:,,12/12/2022130例2.7(P51例2.4)在二十世紀90年代初的一項工資研解:簡單估計95%的置信區(qū)間比率估計95%的置信區(qū)間12/12/2022131解:簡單估計95%的置信區(qū)間比率估計95%的置信例2.8某縣在對船舶月完成的貨運量進行調查,對運管部門登記的船舶臺帳進行整理后獲得注冊船舶2860艘,載重噸位154626噸。從2860艘船舶中抽取一個n=10的簡單隨機樣本。調查得到樣本船舶月完成的貨運量及其載重噸位如表4.2(單位:噸)要估計該縣船舶月完成貨運量1234578015001005376600100505010206789102170182314501581370120150802050表4.2樣本船舶貨運量及載重噸位數據12/12/2022132例2.8某縣在對船舶月完成的貨運量進行調查,對運管部門登記的解12/12/2022133解12/10/20225312/12/202213412/10/202254
(三)消除比率估計偏倚的方法12/12/2022135(三)消除比率估計偏倚的方法12/10/202255
哈特利-羅斯(Hartley-Ross,1954)提出的估計量(2.51)于是可以令12/12/2022136哈特利-羅斯(Hartley-Ross,1954)提出的估事實上:12/12/2022137事實上:12/10/202257例2.9
12/12/2022138例2.912/10/202258四、比率估計的效率≈1/212/12/2022139四、比率估計的效率≈1/212/10/202259§2.4回歸估計量及其性質比率估計成為最優(yōu)線性估計的條件:(1)樣本點(yi,xi)形成過原點的直線(2)yi對直線的偏差與xi成比例12/12/2022140§2.4回歸估計量及其性質比率估計成為最優(yōu)線性估計的條件一、回歸估計的定義二、β是已知常數時(記為β0)
定理2.8
12/12/2022141一、回歸估計的定義二、β是已知常數時(記為β0)定理2.8Q:“β0取何值時,回歸估計量的精度最高,即最?。俊倍ɡ?.9:三、由樣本回歸系數計算得到
(2.56Y對X回歸系數)定理2.10這時的均值估計量是漸近無偏估計注意b并不是B的無偏估計12/12/2022142Q:“β0取何值時,回歸估計量的精度最高,即最定理2.11
它的一個近似估計為:12/12/2022143定理2.11它的一個近似估計為:12/10/202263例2.10續(xù)例2.812/12/2022144例2.10續(xù)例2.812/10/202264四、精度比較1回歸估計總優(yōu)于簡單估計,除非ρ=0
2比率估計優(yōu)于簡單估計的條件
3回歸估計優(yōu)于比率估計的條件是五、多變量回歸估計(略)12/12/2022145四、精度比較1回歸估計總優(yōu)于簡單估計,除非ρ=02比率估計§2.5樣本量的確定一、總體均值情形1給定標準誤差上限,求滿足條件的最小n
12/12/2022146§2.5樣本量的確定一、總體均值情形1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 單位改造車棚合同范例
- 合作合同范本 英文
- 主播合同范本個人
- 化工藥劑供貨合同范本
- 公司內勤合同范本
- 合租廠房合同范本
- 醫(yī)院大型設備合同范例
- 單獨設計合同范例
- 送貨付款合同范本模板
- 吳中區(qū)解約合同范例
- (100題)2024時事政治考試題庫
- 新概念英語第二冊-Lesson18-同步習題含答案
- 中國兒童幽門螺桿菌感染診治專家共識2022
- 全國大學英語六級詞匯表
- 2024年3月江蘇海洋大學招考聘用專職輔導員和工作人員5人筆試參考題庫附帶答案詳解
- 垂線課件人教版數學七年級下冊
- 建設法規(guī)(全套課件)
- 東來順牛羊肉培訓
- 心衰患者的容量管理中國專家共識-共識解讀
- 外用激素合理使用
- H3C全系列產品visio圖標庫
評論
0/150
提交評論