抽樣調(diào)查-2簡(jiǎn)單隨機(jī)抽樣ppt課件_第1頁(yè)
抽樣調(diào)查-2簡(jiǎn)單隨機(jī)抽樣ppt課件_第2頁(yè)
抽樣調(diào)查-2簡(jiǎn)單隨機(jī)抽樣ppt課件_第3頁(yè)
抽樣調(diào)查-2簡(jiǎn)單隨機(jī)抽樣ppt課件_第4頁(yè)
抽樣調(diào)查-2簡(jiǎn)單隨機(jī)抽樣ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩75頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Chap 2 簡(jiǎn)單隨機(jī)抽樣2.2 簡(jiǎn)單估計(jì)法SE 2.1 定義與符號(hào)抽樣調(diào)查 2.5 樣本量確實(shí)定 2.6 其它相關(guān)問(wèn)題 2.3 比率估計(jì)量 2.4 回歸估計(jì)量.2.1 定義與符號(hào)一、定義與符號(hào) 一定義上述抽樣就稱為不放回簡(jiǎn)單隨機(jī)抽樣 定義2.1:設(shè)有限總體共有N個(gè)單元,一次整批抽取 n個(gè)單元 使得每個(gè)單元被抽中的概率都相等,任何 n個(gè)不同單元的組合樣本都有一樣的概率被抽中,這種抽樣方法稱為簡(jiǎn)單隨機(jī)抽樣法,所抽到的樣本為簡(jiǎn)單隨機(jī)樣本。 . 定義2.2:在詳細(xì)實(shí)施過(guò)程中,從總體中逐個(gè)等概率抽取單元每次抽取到尚未入樣的任何一個(gè)單元的概率都相等,直到抽滿 n個(gè)為止。假設(shè)每次抽中一個(gè)單元,然后放回總體

2、,重新抽取。這樣一個(gè)單元有能夠被反復(fù)抽中,故又稱反復(fù)抽樣。. 定義2.3 按照從總體的N個(gè)單元中抽取n個(gè)單元的一切能夠不同的組合構(gòu)造一切能夠的 CNn 個(gè)樣本,從CNn 個(gè)樣本隨機(jī)抽取一個(gè)樣本,使每個(gè)樣本被抽中的概率都等于 1/CNn.上述三中定義其實(shí)是完全等價(jià)的,而定義2.2在實(shí)踐中容易實(shí)施 。.例2.1 設(shè)總體有5個(gè)單元1,2,3,4,5,按有放回簡(jiǎn)單隨機(jī)抽樣的方式抽取容量為2的樣本,那么一切能夠樣本為個(gè),如表2.1。 表2.1 放回簡(jiǎn)單隨機(jī)抽樣一切能夠樣本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25

3、,35,45,5.例2.2 上述總體按不放回簡(jiǎn)單隨機(jī)抽樣方式抽取容量為2的樣本,那么一切能夠樣本為個(gè),如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2 不放回簡(jiǎn)單隨機(jī)抽樣一切能夠樣本.二樣本分布與符號(hào)從總體抽樣單元。假設(shè)順序被抽中的樣本單元的號(hào)碼為入樣號(hào)碼,那么樣本為,稱為抽樣比Sampling fraction。中逐個(gè)不放回抽取n個(gè)作為隨機(jī)變量樣本有什么分布呢?.1 y1,yn同分布但不相互獨(dú)立,其共同分布列為 2 ( yi, yj)的結(jié)合分布列均同(y1, y2 ).表2.3符號(hào)總體參數(shù)樣本統(tǒng)計(jì)量.二、抽樣方法一抽簽法 制造N個(gè)外形一樣的簽,將它們充分混合,

4、然后一次抽取n個(gè)簽,或一次抽取一個(gè)但不放回,抽取n次得到n個(gè)簽。那么這n個(gè)簽上所對(duì)應(yīng)號(hào)碼表示入樣的單元號(hào)。例如:某中學(xué)為了解學(xué)生身體素質(zhì)的根本情況,從全校N1200人中抽取一個(gè)簡(jiǎn)單樣本n100人進(jìn)展檢查。.1 隨機(jī)數(shù)表二隨機(jī)數(shù)法如上例,N1200,那么在表中隨機(jī)延續(xù)取四列,順序往下,選出前面100個(gè)不同不放回抽樣的00011200之間的數(shù)字。假設(shè)不夠100個(gè),可隨機(jī)再取四列,同樣操作,直至抽取100個(gè)止。 .Simple random sampling.Table of random numbers.2 隨機(jī)數(shù)骰子 隨機(jī)數(shù)骰子是由均勻材質(zhì)制成的正20面體,每個(gè)面上刻有一個(gè)09的數(shù)字,且每個(gè)數(shù)字

5、只出如今兩個(gè)面上。要產(chǎn)生一個(gè)m位數(shù)的隨機(jī)數(shù)如m4,N1200,那么將mm=4個(gè)顏色不同的骰子盒中,并規(guī)定每個(gè)顏色代表的位數(shù),蓋上蓋子,充分搖動(dòng)盒子后,翻開(kāi)讀出各色骰子的數(shù)字,即可得一個(gè)隨機(jī)數(shù)。反復(fù)上述過(guò)程,直至產(chǎn)生了n個(gè)滿足條件的隨機(jī)數(shù)。.3 利用統(tǒng)計(jì)軟件直接抽取法 大部分統(tǒng)計(jì)軟件都有產(chǎn)生隨機(jī)數(shù)的功能,快捷方便。不過(guò)產(chǎn)生的是偽隨機(jī)數(shù),有一定循環(huán)周期的。簡(jiǎn)單引見(jiàn)一下利用EXCEL產(chǎn)生隨機(jī)數(shù)的方法. .2.2 簡(jiǎn)單估計(jì)法SE一、總體均值的估計(jì)一簡(jiǎn)單估計(jì)定義 .(2.6) 二簡(jiǎn)單估計(jì)量的性質(zhì) 引理2.1 從大小為N的總體中抽取一個(gè)樣本容量為n的簡(jiǎn)單隨機(jī)樣本,那么總體中每個(gè)特定的單元入樣的概率為n/N

6、,兩個(gè)特定單元入樣的概率為nn1/NN-1。 . 引理2.2從大小為N的總體中抽取一個(gè)樣本容量為n的簡(jiǎn)單隨機(jī)樣本。假設(shè)令: 那么:.二簡(jiǎn)單估計(jì)量的性質(zhì) 定理2.1上述簡(jiǎn)單估計(jì)是無(wú)偏的,即 定理2.2 上述簡(jiǎn)單估計(jì)的方差均方誤差為:.(2.12/2.18) .證明P35證法1對(duì)稱證法: 為0留意樣本分布.推論2.7的無(wú)偏估計(jì)為.(2.25) 證明:只須闡明樣本方差是總體方差的無(wú)偏估計(jì)即可。 留意. 例2.3 從某個(gè)N100的總體重抽取一個(gè)容量n=10的簡(jiǎn)單隨機(jī)樣本,要估計(jì)總體平均程度,并給出置信度為95的置信區(qū)間估計(jì)。如表2.4序號(hào)1 2 3 4 5 6 7 8 9 104 5 2 0 4 6

7、6 15 0 8表2.4 簡(jiǎn)單隨機(jī)樣本目的 .三有放回簡(jiǎn)單隨機(jī)抽樣的簡(jiǎn)單估計(jì)量由于故有放回抽樣的精度低于不放回抽樣的精度。.闡明:1 抽樣調(diào)查中的估計(jì)量與傳統(tǒng)數(shù)理統(tǒng)計(jì)中估計(jì)量的區(qū)別見(jiàn)表2.5表2.5 抽樣實(shí)際與傳統(tǒng)數(shù)理統(tǒng)計(jì)關(guān)于樣本均值性質(zhì)異同比較抽樣理論數(shù)理統(tǒng)計(jì)理論假設(shè)樣本之間不獨(dú)立,所以可能樣本最多 個(gè),欲估計(jì)總體特征為 ,當(dāng)nN時(shí)可以求出樣本之間獨(dú)立,所有可能樣本最多為無(wú)限多個(gè);欲估計(jì)總體特征為總體(一般是隨機(jī)變量X)期望,一般不能通過(guò)樣本求出 符號(hào)、定義期望方差.2 總體方差普通也是未知的,故計(jì)算估計(jì)量方差估計(jì)值時(shí)總是用樣本方差直接去估計(jì)它,由于該估計(jì)無(wú)偏,故這樣做相對(duì)是合理的。 3 對(duì)

8、于無(wú)限總體的簡(jiǎn)單隨機(jī)抽樣或有限總體有放回簡(jiǎn)單抽樣估計(jì)中由于N普通很大, 即從有限總體抽樣得到簡(jiǎn)單隨機(jī)樣本均值得方差是從無(wú)限總體抽樣得的獨(dú)立樣本均值的方差的1f 倍,要小些,這意味著對(duì)同等樣本量,不放回簡(jiǎn)單隨機(jī)抽樣的精度高于有放回的。 由于樣本點(diǎn)不會(huì)反復(fù),樣本量一樣時(shí)所包含的有效樣本點(diǎn)更多,因此信息更多,效果當(dāng)然好些。 1f又被稱為有限總體校正系數(shù)。. 4樣本容量n越大,估計(jì)量方差越小。當(dāng)樣本容量一定時(shí),總體方差越大,估計(jì)量方差越大。由于總體方差是固定的,因此在簡(jiǎn)單隨機(jī)抽樣的條件下,要提高估計(jì)量精度就只需添加樣本容量了。但添加樣本容量也會(huì)帶來(lái)計(jì)算量驟增和本錢添加,所以是矛盾的一對(duì),需求找到適宜的

9、平衡點(diǎn)。.二、總體總量的估計(jì)一簡(jiǎn)單估計(jì)量.(2.7) 二估計(jì)量性質(zhì) 推論2.1 2.4 2.8 .(2.13) .(2.19) .(2.26) .例2.4續(xù)例2.3估計(jì)總體總量,并給出置信度為95條件下的估計(jì)相對(duì)誤差 。三、總體比例的估計(jì) 將總體分為兩類,一類具有該特征的單元A個(gè),另一類不具有該特征的單元NA個(gè) 。調(diào)查的目的是估計(jì)或A 假設(shè)令那么.一估計(jì)量的定義 二估計(jì)量性質(zhì) 推論2.2 2.5 2.9 對(duì)于簡(jiǎn)單隨機(jī)抽樣,p是P無(wú)偏估計(jì)。 p的方差為 方差的無(wú)偏估計(jì) (2.27) 2.20.例2.5某超市開(kāi)張一段時(shí)間后,為改良銷售效力環(huán)境,欲調(diào)查附近幾個(gè)小區(qū)居民到該超市購(gòu)物的稱心度。該超市與附

10、近一個(gè)小區(qū)的居委會(huì)獲得聯(lián)絡(luò),在總體中按簡(jiǎn)單隨機(jī)抽樣抽取了一個(gè)大小為n=200人的樣本。調(diào)查發(fā)現(xiàn)對(duì)購(gòu)物表示稱心或根本稱心的居民有130人,估計(jì)對(duì)該超市購(gòu)物環(huán)境持一定態(tài)度的居民的比例,并在置信度95%條件下,給出估計(jì)的絕對(duì)誤差和置信區(qū)間,假設(shè)抽樣比可以忽略。.2樣本協(xié)方差是總體協(xié)方差的無(wú)偏估計(jì). 2.22,2.23 2.29 思索二維總體.證明:仍采用對(duì)稱法P40證法11留意樣本分布留意為0. 1證法2: 構(gòu)造性展開(kāi).2留意由1.一、概念與作用 一概念 比率Ratio與比例Proportion區(qū)別 二作用2.3 比率估計(jì)量及其性質(zhì)一種場(chǎng)所是待估的總體參數(shù)R是兩個(gè)變量比值。如人口密度,恩格爾系數(shù)等。

11、 分子分母均為r.v.分子為r.v.另一種運(yùn)用場(chǎng)所,雖然待估的參數(shù)是某個(gè)研討變量的均值或總體總量,它本來(lái)可以經(jīng)過(guò)樣本均值加以估計(jì),但是為了提高估計(jì)的效率,它經(jīng)過(guò)引進(jìn)一個(gè)輔助變量xi ,來(lái)計(jì)算比率,即 再經(jīng)過(guò)這一比率乘以總體知的輔助變量均值或總量來(lái)到達(dá)估計(jì)的目的。 .二、運(yùn)用條件 1輔助變量auxiliary variable資料易得或知 2輔助變量與目的變量之間存在高度相關(guān)性且相關(guān) 性穩(wěn)定。 3樣本量普通要求比較大三、簡(jiǎn)單隨機(jī)抽樣下的比率估計(jì).一定義 比率估計(jì)量ratio estimator又稱比估計(jì)。 2.30 2.31 .二比率估計(jì)的性質(zhì)引理2.3定理2.6推論2.11.引理2.4證:當(dāng)n

12、充分大時(shí) .定理2.7推論2.12.因此方差估計(jì)有兩種思緒(2.39)(2.40).例2.6i123456均值XiYi011331151882910464.518表4.1 假設(shè)的總體數(shù)據(jù).解:i樣本簡(jiǎn)單估計(jì)比率估計(jì)123456789101112131415均值1,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518181817.116.87521.1515.7515.751620.045516.312516.363619.730816.26921

13、9.218.7517.68644.解.例2.7P51例2.4 在二十世紀(jì)90年代初的一項(xiàng)工資研討中,人們發(fā)現(xiàn)IT行業(yè)中,從業(yè)者的現(xiàn)薪與起薪之間相關(guān)系數(shù)高達(dá)0.88,知某IT企業(yè)474名員工的評(píng)鑒起薪為17 016.00元/年,現(xiàn)根據(jù)對(duì)100個(gè)按簡(jiǎn)單隨機(jī)抽樣方式選出的員工現(xiàn)薪的調(diào)查結(jié)果,估計(jì)該企業(yè)員工的現(xiàn)薪平均程度。數(shù)據(jù)如下:, , .解:簡(jiǎn)單估計(jì) 95的置信區(qū)間 比率估計(jì) 95的置信區(qū)間 .例2.8某縣在對(duì)船舶月完成的貨運(yùn)量進(jìn)展調(diào)查,對(duì)運(yùn)管部門登記的船舶臺(tái)帳進(jìn)展整理后獲得注冊(cè)船舶2 860艘,載重噸位154 626 噸。從2 860艘船舶中抽取一個(gè)n10的簡(jiǎn)單隨機(jī)樣本。調(diào)查得到樣本船舶月完成的

14、貨運(yùn)量及其載重噸位如表4.2單位:噸要估計(jì)該縣船舶月完成貨運(yùn)量 1234578015001005376600100505010206789102170182314501581370120150802050表4.2樣本船舶貨運(yùn)量及載重噸位數(shù)據(jù) . 解. 三消除比率估計(jì)偏倚的方法. 哈特利-羅斯Hartley-Ross,1954提出的估計(jì)量 (2.51) 于是可以令.現(xiàn)實(shí)上: .例2.9 .四、比率估計(jì)的效率1/2.2.4 回歸估計(jì)量及其性質(zhì)比率估計(jì)成為最優(yōu)線性估計(jì)的條件:1樣本點(diǎn)yi,xi構(gòu)成過(guò)原點(diǎn)的直線2yi對(duì)直線的偏向與xi成比例.一、回歸估計(jì)的定義二、是知常數(shù)時(shí)記為0 定理2.8 .Q:“

15、0取何值時(shí),回歸估計(jì)量的精度最高,即最 ???定理2.9:三、由樣本回歸系數(shù)計(jì)算得到 2.56 Y對(duì)X回歸系數(shù) 定理2.10 這時(shí)的均值估計(jì)量是漸近無(wú)偏估計(jì) 留意b并不是B的無(wú)偏估計(jì).定理2.11 它的一個(gè)近似估計(jì)為: .例2.10 續(xù)例2.8.四、精度比較1回歸估計(jì)總優(yōu)于簡(jiǎn)單估計(jì),除非=0 2比率估計(jì)優(yōu)于簡(jiǎn)單估計(jì)的條件 3回歸估計(jì)優(yōu)于比率估計(jì)的條件是 五、多變量回歸估計(jì)略 .2.5 樣本量確實(shí)定一、總體均值情形1 給定規(guī)范誤差上限,求滿足條件的最小n . 2 給定絕對(duì)誤差上限及信度,求滿足條件的最小n有放回,不放回 3 給定相對(duì)誤差上限及信度,求滿足條件的最小n有放回不放回 .給定相對(duì)規(guī)范誤差

16、上限 ,求滿足條件 的最小n.放回不放回例2.6 在例2.3中,假設(shè)要求以95%的把握保證相對(duì)誤差不超越10%,樣本量應(yīng)該取多少? .二、總體總量情形 作業(yè) 思索各種情行的公式例 欲估計(jì)一個(gè)鄉(xiāng)村的每月平均副業(yè)收入,知該村共有1000戶農(nóng)戶,月副業(yè)收入的規(guī)范差不超越300元。1現(xiàn)要求置信度為95%,估計(jì)每戶月副業(yè)收入的誤 差不超越50元,應(yīng)抽取多少戶作為樣本?2假設(shè)每戶調(diào)查費(fèi)用為15元,調(diào)查管理費(fèi)用為800元, 該項(xiàng)調(diào)查估計(jì)費(fèi)用是多少?.例 假設(shè)上例目的是要估計(jì)全村1000戶一月的副業(yè)總收入,允許總量的誤差為40000,置信度為95%,應(yīng)抽取多少樣本? 三、總體參數(shù)P的情形四、總體參數(shù)的預(yù)先估計(jì)

17、.1根據(jù)以往的閱歷數(shù)據(jù) 例如對(duì)同類問(wèn)題獲得過(guò)一個(gè)樣本量n0為的簡(jiǎn)單隨機(jī)樣本,并且知在一定置信度下比如95%,該調(diào)查對(duì)總體均值或總量估計(jì)的相對(duì)誤差上限為r0,那么在一樣的置信度下,假設(shè)希望本次調(diào)查的相對(duì)誤差上限為r,那么在抽樣比可以忽略的情況下,可以近似地計(jì)算出本次調(diào)查所需的樣本量: 作業(yè) 證明上述結(jié)論.2在正式調(diào)查前進(jìn)展試點(diǎn)調(diào)查,根據(jù)試點(diǎn)調(diào)查的 結(jié)果作出估計(jì),或者采用兩步抽樣 3沒(méi)有同類調(diào)查閱歷,又不能進(jìn)展預(yù)調(diào)查, 那么只能經(jīng)過(guò)有閱歷的專家作一些定性分析, 對(duì)總體變異系數(shù)C比較穩(wěn)定作出估計(jì)。 4留意:針對(duì)總體參數(shù)為 時(shí)情形 當(dāng)估計(jì)P0.5,那么選取較小的P,如假設(shè)估計(jì)P為0.6,0.8那么選取P為0.6 假設(shè)對(duì)P一無(wú)所知那么取P=0.5。.例2.7 某銷售公司希望了解全部3000家客戶對(duì)公司的稱心度,決議用調(diào)查一個(gè)簡(jiǎn)單隨機(jī)樣本。這時(shí)銷售公司希望以95的把握保證客戶稱心度比例P在樣本比例p10,p+10范圍內(nèi),但對(duì)總體比例P無(wú)法給出一個(gè)大致范圍。這時(shí)調(diào)查多少個(gè)客戶,才干保證滿足要求?.2.6 其它相關(guān)問(wèn)題一、逆抽樣比例P是稀有事件的比例,普通P0.2 事先給定一個(gè)正整數(shù)m,然后逐個(gè)隨機(jī)抽取樣本,n個(gè)單元。 直到抽到m個(gè)所思索特征的單元為止,設(shè)共取了. 現(xiàn)實(shí)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論