




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Chap2簡單隨機抽樣
2.2簡單估計法(SE)
2.1定義與符號
抽
樣
調
查
2.5樣本量的確定
2.6其它相關問題
2.3比率估計量
2.4回歸估計量5/6/20231第一頁,共八十一頁。§2.1定義與符號一、定義與符號
(一)定義上述抽樣就稱為不放回簡單隨機抽樣
定義2.1:設有限總體共有N個單元,一次整批抽取n個單元使得每個單元被抽中的概率都相等,任何n個不同單元的組合(樣本)都有相同的概率被抽中,這種抽樣方法稱為簡單隨機抽樣法,所抽到的樣本為簡單隨機樣本。
5/6/20232第二頁,共八十一頁。
定義2.2:(在具體實施過程中,)從總體中逐個等概率抽取單元(每次抽取到尚未入樣的任何一個單元的概率都相等),直到抽滿n個為止。如果每次抽中一個單元,然后放回總體,重新抽取。這樣一個單元有可能被重復抽中,故又稱重復抽樣。5/6/20233第三頁,共八十一頁。
定義2.3按照從總體的N個單元中抽取n個單元的所有可能不同的組合構造所有可能的CNn個樣本,從CNn個樣本隨機抽取一個樣本,使每個樣本被抽中的概率都等于1/CNn.上述三中定義其實是完全等價的,而定義2.2在實際中容易實施。5/6/20234第四頁,共八十一頁。例2.1設總體有5個單元(1,2,3,4,5),按有放回簡單隨機抽樣的方式抽取容量為2的樣本,則所有可能樣本為個,如表2.1。
表2.1放回簡單隨機抽樣所有可能樣本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,55/6/20235第五頁,共八十一頁。例2.2上述總體按不放回簡單隨機抽樣方式抽取容量為2的樣本,則所有可能樣本為個,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2不放回簡單隨機抽樣所有可能樣本5/6/20236第六頁,共八十一頁。(二)樣本分布與符號從總體抽樣單元。假設順序被抽中的樣本單元的號碼為(入樣號碼),則樣本為,稱為抽樣比(Samplingfraction)。中逐個不放回抽取n個作為隨機變量樣本有什么分布呢?5/6/20237第七頁,共八十一頁。1y1,…yn同分布但不相互獨立,其共同分布列為2(yi,yj)的聯(lián)合分布列均同(y1,y2)5/6/20238第八頁,共八十一頁。表2.3符號總體參數(shù)樣本統(tǒng)計量5/6/20239第九頁,共八十一頁。二、抽樣方法(一)抽簽法
制作N個外形相同的簽,將它們充分混合,然后一次抽取n個簽,或一次抽取一個但不放回,抽取n次得到n個簽。則這n個簽上所對應號碼表示入樣的單元號。例如:某中學為了解學生身體素質的基本狀況,從全校N=1200人中抽取一個簡單樣本n=100人進行檢查。5/6/202310第十頁,共八十一頁。1隨機數(shù)表(二)隨機數(shù)法如上例,N=1200,則在表中隨機連續(xù)取四列,順序往下,選出前面100個不同(不放回抽樣)的0001~1200之間的數(shù)字。如果不夠100個,可隨機再取四列,同樣操作,直至抽取100個止。5/6/202311第十一頁,共八十一頁。Simplerandomsampling5/6/202312第十二頁,共八十一頁。Tableofrandomnumbers5/6/202313第十三頁,共八十一頁。2隨機數(shù)骰子隨機數(shù)骰子是由均勻材質制成的正20面體,每個面上刻有一個0~9的數(shù)字,且每個數(shù)字只出現(xiàn)在兩個面上。要產生一個m位數(shù)的隨機數(shù)(如m=4,N=1200),則將m(m=4)個顏色不同的骰子盒中,并規(guī)定每個顏色代表的位數(shù),蓋上蓋子,充分搖動盒子后,打開讀出各色骰子的數(shù)字,即可得一個隨機數(shù)。重復上述過程,直至產生了n個滿足條件的隨機數(shù)。5/6/202314第十四頁,共八十一頁。3利用統(tǒng)計軟件直接抽取法大部分統(tǒng)計軟件都有產生隨機數(shù)的功能,快捷方便。不過產生的是偽隨機數(shù),有一定循環(huán)周期的。簡單介紹一下利用EXCEL產生隨機數(shù)的方法.
5/6/202315第十五頁,共八十一頁。5/6/202316第十六頁,共八十一頁。5/6/202317第十七頁,共八十一頁。5/6/202318第十八頁,共八十一頁?!?.2簡單估計法(SE)一、總體均值的估計(一)簡單估計定義
………………..(2.6)
(二)簡單估計量的性質引理2.1從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本,則總體中每個特定的單元入樣的概率為n/N,兩個特定單元入樣的概率為n(n-1)/N(N-1)。
5/6/202319第十九頁,共八十一頁。
引理2.2從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本。若令:則:5/6/202320第二十頁,共八十一頁。(二)簡單估計量的性質
定理2.1上述簡單估計是無偏的,即
定理2.2上述簡單估計的方差(均方誤差)為:……….(2.12/2.18)
5/6/202321第二十一頁,共八十一頁。證明(P35證法1對稱證法):為0注意樣本分布5/6/202322第二十二頁,共八十一頁。推論2.7的無偏估計為………..(2.25)
證明:只須說明樣本方差是總體方差的無偏估計即可。注意5/6/202323第二十三頁,共八十一頁。
例2.3從某個N=100的總體重抽取一個容量n=10的簡單隨機樣本,要估計總體平均水平,并給出置信度為95%的置信區(qū)間估計。如表2.4序號1234567891045204661508表2.4簡單隨機樣本指標
5/6/202324第二十四頁,共八十一頁。5/6/202325第二十五頁,共八十一頁。(三)有放回簡單隨機抽樣的簡單估計量由于故有放回抽樣的精度低于不放回抽樣的精度。5/6/202326第二十六頁,共八十一頁。說明:1抽樣調查中的估計量與傳統(tǒng)數(shù)理統(tǒng)計中估計量的區(qū)別(見表2.5)表2.5抽樣理論與傳統(tǒng)數(shù)理統(tǒng)計關于樣本均值性質異同比較抽樣理論數(shù)理統(tǒng)計理論假設樣本之間不獨立,所以可能樣本最多個,欲估計總體特征為,當n=N時可以求出樣本之間獨立,所有可能樣本最多為無限多個;欲估計總體特征為總體(一般是隨機變量X)期望μ,一般不能通過樣本求出符號、定義期望方差5/6/202327第二十七頁,共八十一頁。2總體方差一般也是未知的,故計算估計量方差(估計)值時總是用樣本方差直接去估計它,因為該估計無偏,故這樣做相對是合理的。3
對于無限總體的簡單隨機抽樣(或有限總體有放回簡單抽樣)估計中由于N一般很大,
即從有限總體抽樣得到簡單隨機樣本均值得方差是從無限總體抽樣得的獨立樣本均值的方差的1-f倍,要小些,這意味著對同等樣本量,不放回簡單隨機抽樣的精度高于有放回的。由于樣本點不會重復,樣本量相同時所包含的有效樣本點更多,因此信息更多,效果當然好些。1-f又被稱為有限總體校正系數(shù)。5/6/202328第二十八頁,共八十一頁。4樣本容量n越大,估計量方差越小。當樣本容量一定時,總體方差越大,估計量方差越大。由于總體方差是固定的,因此在簡單隨機抽樣的條件下,要提高估計量精度就只有增加樣本容量了。但增加樣本容量也會帶來計算量驟增和成本增加,所以是矛盾的一對,需要找到合適的平衡點。5/6/202329第二十九頁,共八十一頁。二、總體總量的估計(一)簡單估計量…………….(2.7)(二)估計量性質推論2.12.42.8
……….(2.13)…………….(2.19)…………….(2.26)5/6/202330第三十頁,共八十一頁。例2.4(續(xù)例2.3)估計總體總量,并給出置信度為95%條件下的估計相對誤差
。三、總體比例的估計將總體分為兩類,一類具有該特征的單元A個,另一類不具有該特征的單元N-A個。調查的目的是估計或A
若令則5/6/202331第三十一頁,共八十一頁。(一)估計量的定義(二)估計量性質推論2.22.52.9對于簡單隨機抽樣,p是P無偏估計。p的方差為
方差的無偏估計……(2.27)……(2.20)5/6/202332第三十二頁,共八十一頁。例2.5某超市開張一段時間后,為改進銷售服務環(huán)境,欲調查附近幾個小區(qū)居民到該超市購物的滿意度。該超市與附近一個小區(qū)的居委會取得聯(lián)系,在總體中按簡單隨機抽樣抽取了一個大小為n=200人的樣本。調查發(fā)現(xiàn)對購物表示滿意或基本滿意的居民有130人,估計對該超市購物環(huán)境持肯定態(tài)度的居民的比例,并在置信度95%條件下,給出估計的絕對誤差和置信區(qū)間,假設抽樣比可以忽略。5/6/202333第三十三頁,共八十一頁。(2)樣本協(xié)方差是總體協(xié)方差的無偏估計.
(2.22,2.23)(2.29)考慮二維總體5/6/202334第三十四頁,共八十一頁。證明:仍采用對稱法(P40證法1)(1)注意樣本分布注意為05/6/202335第三十五頁,共八十一頁。(1)證法2:(構造性)展開5/6/202336第三十六頁,共八十一頁。(2)注意由(1)5/6/202337第三十七頁,共八十一頁。一、概念與作用(一)概念比率(Ratio)與比例(Proportion)區(qū)別(二)作用§2.3比率估計量及其性質一種場合是待估的總體參數(shù)R是兩個變量比值。如人口密度,恩格爾系數(shù)等。
分子分母均為r.v.分子為r.v.5/6/202338第三十八頁,共八十一頁。另一種應用場合,雖然待估的參數(shù)是某個研究變量的均值或總體總量,它本來可以通過樣本均值加以估計,但是為了提高估計的效率,它通過引進一個輔助變量xi,來計算比率,即再通過這一比率乘以總體已知的輔助變量均值或總量來達到估計的目的。5/6/202339第三十九頁,共八十一頁。二、應用條件(1)輔助變量(auxiliaryvariable)資料易得或已知(2)輔助變量與目標變量之間存在高度相關性且相關性穩(wěn)定。(3)樣本量一般要求比較大三、簡單隨機抽樣下的比率估計5/6/202340第四十頁,共八十一頁。(一)定義
比率估計量(ratioestimator)又稱比估計。(2.30)(2.31)5/6/202341第四十一頁,共八十一頁。(二)比率估計的性質引理2.3定理2.6推論2.115/6/202342第四十二頁,共八十一頁。引理2.4證:當n充分大時5/6/202343第四十三頁,共八十一頁。定理2.7推論2.125/6/202344第四十四頁,共八十一頁。因而方差估計有兩種思路…(2.39)…(2.40)5/6/202345第四十五頁,共八十一頁。例2.6i123456均值XiYi011331151882910464.518表4.1假設的總體數(shù)據(jù)5/6/202346第四十六頁,共八十一頁。解:i樣本簡單估計比率估計123456789101112131415均值1,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.7517.686445/6/202347第四十七頁,共八十一頁。5/6/202348第四十八頁,共八十一頁。解5/6/202349第四十九頁,共八十一頁。例2.7(P51例2.4)
在二十世紀90年代初的一項工資研究中,人們發(fā)現(xiàn)IT行業(yè)中,從業(yè)者的現(xiàn)薪與起薪之間相關系數(shù)ρ高達0.88,已知某IT企業(yè)474名員工的評鑒起薪為17016.00元/年,現(xiàn)根據(jù)對100個按簡單隨機抽樣方式選出的員工現(xiàn)薪的調查結果,估計該企業(yè)員工的現(xiàn)薪平均水平。數(shù)據(jù)如下:,,5/6/202350第五十頁,共八十一頁。解:簡單估計95%的置信區(qū)間比率估計95%的置信區(qū)間5/6/202351第五十一頁,共八十一頁。例2.8某縣在對船舶月完成的貨運量進行調查,對運管部門登記的船舶臺帳進行整理后獲得注冊船舶2860艘,載重噸位154626噸。從2860艘船舶中抽取一個n=10的簡單隨機樣本。調查得到樣本船舶月完成的貨運量及其載重噸位如表4.2(單位:噸)要估計該縣船舶月完成貨運量1234578015001005376600100505010206789102170182314501581370120150802050表4.2樣本船舶貨運量及載重噸位數(shù)據(jù)5/6/202352第五十二頁,共八十一頁。解5/6/202353第五十三頁,共八十一頁。5/6/202354第五十四頁,共八十一頁。
(三)消除比率估計偏倚的方法5/6/202355第五十五頁,共八十一頁。
哈特利-羅斯(Hartley-Ross,1954)提出的估計量(2.51)于是可以令5/6/202356第五十六頁,共八十一頁。事實上:5/6/202357第五十七頁,共八十一頁。例2.9
5/6/202358第五十八頁,共八十一頁。四、比率估計的效率≈1/25/6/202359第五十九頁,共八十一頁?!?.4回歸估計量及其性質比率估計成為最優(yōu)線性估計的條件:(1)樣本點(yi,xi)形成過原點的直線(2)yi對直線的偏差與xi成比例5/6/202360第六十頁,共八十一頁。一、回歸估計的定義二、β是已知常數(shù)時(記為β0)
定理2.8
5/6/202361第六十一頁,共八十一頁。Q:“β0取何值時,回歸估計量的精度最高,即最小?”定理2.9:三、由樣本回歸系數(shù)計算得到
(2.56Y對X回歸系數(shù))定理2.10這時的均值估計量是漸近無偏估計注意b并不是B的無偏估計5/6/202362第六十二頁,共八十一頁。定理2.11
它的一個近似估計為:5/6/202363第六十三頁,共八十一頁。例2.10續(xù)例2.85/6/202364第六十四頁,共八十一頁。四、精度比較1回歸估計總優(yōu)于簡單估計,除非ρ=0
2比率估計優(yōu)于簡單估計的條件
3回歸估計優(yōu)于比率估計的條件是五、多變量回歸估計(略)5/6/202365第六十五頁,共八十一頁。§2.5樣本量的確定一、總體均值情形1給定標準誤差上限,求滿足條件的最小n
5/6/202366第六十六頁,共八十一頁。
2給定絕對誤差上限及信度,求滿足條件的最小n有放回,不放回3給定相對誤差上限及信度,求滿足條件的最小n有放回不放回5/6/202367第六十七頁,共八十一頁。4給定相對標準誤差上限γ,求滿足條件
的最小n.放回不放回例2.6在例2.3中,如果要求以95%的把握保證相對誤差不超過10%,樣本量應該取多少?5/6/202368第六十八頁,共八十一頁。5/6/202369第六十九頁,共八十一頁。二、總體總量情形作業(yè)考慮各種情行的公式例欲估計一個農村的每月平均副業(yè)收入,已知該村共有1000戶農戶,月副業(yè)收入的標準差不超過300元。(1)現(xiàn)要求置信度為95%,估計每戶月副業(yè)收入的誤差不超過50元,應抽取多少戶作為樣本?(2)若每戶調查費用為15元,調查管理費用為800元,該項調查預計費用是多少?5/6/202370第七十頁,共八十一頁。例如果上例目的是要估計全村1000戶一月的副業(yè)總收入,允許總量的誤差為40000,置信度為95%,應抽取多少樣本?
三、總體參數(shù)P的情形四、總體參數(shù)的預先估計5/6/202371第七十一頁,共八十一頁。(1)根據(jù)以往的經驗數(shù)據(jù)例如對同類問題獲得過一個樣本量n0為的簡單隨機樣本,并且已知在一定置信度下(比如95%),該調查對總體均值(或總量)估計的相對誤差上限為r0,則在相同的置信度下,如果希望本次調查的相對誤差上限為r,則在抽樣比可以忽略的情況下,可以近似地計算出本次調查所需的樣本量:作業(yè)證明上述結論5/6/202372第七十二頁,共八十一頁。(2)在正式調查前進行試點調查,根據(jù)試點調查的結果作出估計,或者采用兩步抽樣(3)沒有同類調查經驗,又不能進行預調查,則只能通過有經驗的專家作一些定性分析,對總體變異系數(shù)C(比較穩(wěn)定)作出估計。
(4)注意:針對總體參數(shù)為P時情形
當估計P<0.5,則選取較大的P,如若估計P為[0.3,0.4]則選取P為0.4當估計P>0.5,則選取較小的P,如若估計P為[0.6,0.8]則選取P為0.6若對P一無所知則取P=0.5。5/6/202373第七十三頁,共八十一頁。例2.7某銷售公司希望了解全部3000家客戶對公司的滿意度,決定用電話調查一個簡單隨機樣本。這時銷售公司希望以95%的把握保證客戶滿意度比例P在樣本比例[p-10%,p+10%]范圍內,但對總體比例P無法給出一個大致范圍。這時調查多少個客戶,才能保證滿足要求?5/6/
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 吊頂購銷合同范本
- 各種文件合同范本
- 超齡人員勞務合同范本
- 配音演員合同范本
- 名創(chuàng)優(yōu)品合同范例
- 合伙企業(yè)分廠合同范本
- 代理小吃送貨合同范例
- 合同范本訂立下述合同
- 合伙加盟合同范本
- 廁所防水補漏合同范本
- 2025年安徽電氣工程職業(yè)技術學院單招職業(yè)技能測試題庫及答案1套
- 2025年房屋交易代持策劃協(xié)議書
- 課題申報參考:“四新”建設背景下教育創(chuàng)新與課程數(shù)字化實踐研究
- 2025年煙臺汽車工程職業(yè)學院高職單招職業(yè)適應性測試近5年常考版參考題庫含答案解析
- 2025年江蘇農牧科技職業(yè)學院高職單招職業(yè)技能測試近5年常考版參考題庫含答案解析
- 2024年長沙衛(wèi)生職業(yè)學院高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 2024年度國網營銷安全(用電檢查)安全準入客觀題備考試題庫(附答案)
- 2024年廣東省《輔警招聘考試必刷500題》考試題庫及答案【易錯題】
- 2025正規(guī)民政局離婚協(xié)議書
- 陜西、甘肅、青海、寧夏四省普通高中2024-2025學年學業(yè)水平選擇性考試適應性演練(含答案)
- 初中生物骨干教師研修培訓課件對當前我市初中生物課堂教學的再認識
評論
0/150
提交評論