第五章參數(shù)統(tǒng)計(jì)_第1頁(yè)
第五章參數(shù)統(tǒng)計(jì)_第2頁(yè)
第五章參數(shù)統(tǒng)計(jì)_第3頁(yè)
第五章參數(shù)統(tǒng)計(jì)_第4頁(yè)
第五章參數(shù)統(tǒng)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩66頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

5第五章參數(shù)估計(jì)通過(guò)本章的學(xué)習(xí),我們應(yīng)該知道:統(tǒng)計(jì)推斷的基本問(wèn)題、概念與原理參數(shù)點(diǎn)估計(jì)的方法與評(píng)價(jià)正態(tài)總體均值的區(qū)間估計(jì)參數(shù)估計(jì)所需的樣本容量的確定Statistics統(tǒng)計(jì)抽樣推斷是統(tǒng)計(jì)學(xué)研究的重要內(nèi)容,包括兩大核心內(nèi)容:參數(shù)估計(jì)和假設(shè)檢驗(yàn)。兩者都是根據(jù)樣本資料,運(yùn)用科學(xué)的統(tǒng)計(jì)理論和方法對(duì)總體的參數(shù)進(jìn)行推斷。參數(shù)估計(jì)對(duì)所要研究的總體參數(shù),運(yùn)用某原理給出一個(gè)估計(jì)量或估計(jì)區(qū)間來(lái)假設(shè)檢驗(yàn)對(duì)提出的關(guān)于總體或總體參數(shù)的某個(gè)陳述進(jìn)行檢驗(yàn),判斷真?zhèn)谓y(tǒng)計(jì)推斷總體指標(biāo):參數(shù)(未知量)樣本總體指標(biāo):統(tǒng)計(jì)量(已知量)抽樣推斷學(xué)習(xí)參數(shù)估計(jì)和假設(shè)檢驗(yàn)要注意:1、明確要研究的問(wèn)題,并給出正確的提法2、確定合適的統(tǒng)計(jì)量3、樣本資料要有代表性4、參數(shù)統(tǒng)計(jì)與非參數(shù)統(tǒng)計(jì)方法的主要區(qū)別:前者已知總體的分布,只是分布中含有未知參數(shù),后者對(duì)總體的分布幾乎是未知的5、給出推斷結(jié)果的合理解釋1統(tǒng)計(jì)推斷的基本問(wèn)題和概念在統(tǒng)計(jì)學(xué)中,往往把所研究的問(wèn)題或現(xiàn)象視為隨機(jī)變量,有自己的概率分布。但絕大多數(shù)情況下,要研究的隨機(jī)現(xiàn)象(或變量)服從什么分布可能完全不知道,或者由于現(xiàn)象的某些事實(shí)而知道其服從什么類型的分布,比如正態(tài)分布、指數(shù)分布等,但不知道分布中所含的參數(shù)。怎樣才能知道一個(gè)隨機(jī)現(xiàn)象的分布或其參數(shù)呢?這正是統(tǒng)計(jì)推斷所要解決的基本問(wèn)題。如何根據(jù)觀測(cè)或試驗(yàn)所得到的有限信息對(duì)總體作出推斷,并同時(shí)指出所作的這種推斷有多大的可靠性(用概率表示),是統(tǒng)計(jì)推斷的基本問(wèn)題。抽樣推斷的作用(1)有些現(xiàn)象和事物不可能進(jìn)行全面調(diào)查,如對(duì)具有破壞性或消耗性的產(chǎn)品進(jìn)行質(zhì)量檢驗(yàn)如燈泡電視抗震食品質(zhì)量檢驗(yàn)人體白血球數(shù)量化驗(yàn)(2)有些總體理論上可以進(jìn)行全面調(diào)查,實(shí)際上辦不到如森林的樹(shù)木數(shù)量河流中的魚(yú)尾數(shù)污染狀況(3)抽樣調(diào)查可以節(jié)省人力費(fèi)用和實(shí)踐,而且比較靈活(4)有些狀況下,抽樣調(diào)查結(jié)果比全面調(diào)查準(zhǔn)確;可以用抽樣調(diào)查資料修正和補(bǔ)充全面調(diào)查資料如10年一次人口普查,中間的人口抽樣調(diào)查1%(5)利用抽樣推斷方法,可以對(duì)總體進(jìn)行假設(shè)檢驗(yàn),判斷真?zhèn)?,決定取舍

假如我們從總體中按機(jī)會(huì)均等的原則隨機(jī)地抽取n個(gè)個(gè)體,然后對(duì)這n個(gè)個(gè)體就我們關(guān)心的數(shù)值指標(biāo)X進(jìn)行觀測(cè),這一過(guò)程稱為隨機(jī)抽樣。這n個(gè)個(gè)體的數(shù)值指標(biāo)稱為一個(gè)樣本,它是一個(gè)隨機(jī)向量。在一次抽樣以后,觀測(cè)到的一組確定的值或數(shù)據(jù)稱為該樣本的觀測(cè)值或樣本數(shù)據(jù)。樣本所有可能觀測(cè)值的全體就構(gòu)成了樣本空間。

X是一個(gè)隨機(jī)變量,假設(shè)X的分布函數(shù)是F(x)。由于樣本中每一個(gè)個(gè)體都來(lái)自總體X,所以樣本中的任一個(gè)體的分布函數(shù)和總體相同,即的分布函數(shù)為一般用大寫(xiě)英文字母或希臘字母表示隨機(jī)變量,而用小寫(xiě)英文字母表示隨機(jī)變量的觀測(cè)值或數(shù)據(jù)簡(jiǎn)單隨機(jī)抽樣為了避免在抽樣時(shí)引入偏差,最簡(jiǎn)單、應(yīng)用很普遍的抽樣方法是簡(jiǎn)單隨機(jī)抽樣(也稱純隨機(jī)抽樣),它滿足以下兩個(gè)條件:

1、總體的每一個(gè)個(gè)體都有同等機(jī)會(huì)被選入樣本

2、樣本的分量是相互獨(dú)立的隨機(jī)變量,即樣本中任一個(gè)體的取值不影響其他個(gè)體的取值抽樣誤差1抽樣誤差(Samplingerror)

總體未知參數(shù)(或數(shù)字特征)和相應(yīng)的基于樣本的統(tǒng)計(jì)量之間的差異

數(shù)學(xué)表示:如何理解:

(1)抽樣誤差僅指抽樣的隨機(jī)性而產(chǎn)生的那部分代表性誤差

(2)抽樣誤差是實(shí)際誤差:即樣本指標(biāo)與總體指標(biāo)之差。這無(wú)法確知,并且隨著樣本的不同而變化抽樣誤差的影響因素:σ,n,抽樣方法等

影響抽樣誤差的因素總體各單位的差異程度(即標(biāo)準(zhǔn)差的大小):越大,抽樣誤差越大;樣本單位數(shù)的多少:越大,抽樣誤差越??;抽樣方法:不重復(fù)抽樣的抽樣誤差比重復(fù)抽樣的抽樣誤差??;統(tǒng)計(jì)量及其抽樣分布一、統(tǒng)計(jì)量定義

為什么引入統(tǒng)計(jì)量:樣本是我們進(jìn)行分析和推斷的起點(diǎn),但實(shí)際上我們并不直接用樣本進(jìn)行推斷,而需對(duì)樣本進(jìn)行“加工”和“提煉”,將分散于樣本中的信息集中起來(lái),為此引入統(tǒng)計(jì)量的概念。

統(tǒng)計(jì)量是不依賴于任何未知參數(shù)的樣本的可測(cè)函數(shù),它是一個(gè)隨機(jī)變量。它有自己的分布密度和分布函數(shù)。例如樣本均值和樣本方差是常見(jiàn)的統(tǒng)計(jì)量一般而言,統(tǒng)計(jì)量是隨機(jī)變量,它有自己的分布密度和分布函數(shù);統(tǒng)計(jì)量的分布稱為抽樣分布。由樣本推斷總體特征時(shí)要依據(jù)統(tǒng)計(jì)量的抽樣分布由于正態(tài)分布應(yīng)用十分普遍,我們將給出總體為正態(tài)分布的樣本均值和樣本方差的抽樣分布,它們是統(tǒng)計(jì)推斷的理論依據(jù)和基礎(chǔ)幾個(gè)常見(jiàn)的抽樣分布(一)2—分布1、定義:設(shè)n個(gè)相互獨(dú)立的隨機(jī)變量X1,X2,…,Xn,Xi~N(0,1),i=1,2,…,n則稱為自由度為n的2分布。n個(gè)相互獨(dú)立的服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量的平方和服從2(n)。2—分布的密度函數(shù)f(y)曲線2、性質(zhì)(1)(2)2分布的可加性X1,X2相互獨(dú)立,則X1+X2~2(n1+n2)例4(X1,X2,X3)為X的一個(gè)樣本求的分布。解因?yàn)?X1,X2,X3)為X的一個(gè)樣本則i=1,2,33、2分布表及有關(guān)計(jì)算(1)構(gòu)成P{2(n)>λ}=α,已知n,α可查表求得λ;(2)有關(guān)計(jì)算λ為2分布的α分位點(diǎn)α1、定義若X~N(0,1),Y~2(n),X與Y獨(dú)立,則t(n)稱為自由度為n的t—分布。(二)t—分布例

(X1,X2,X3)為X的一個(gè)樣本,求的分布i=1,2,3t(n)的概率密度為2、基本性質(zhì):(1)f(t)關(guān)于t=0(縱軸)對(duì)稱;(2)f(t)的極限為N(0,1)的密度函數(shù),即3、t分布表及有關(guān)計(jì)算(1)構(gòu)成:P{t(n)>λ}=α(2)有關(guān)計(jì)算P{t(n)>λ}=α

,λ=tα(n)α注:(三)F—分布1、定義若X~2(n1),Y~2(n2),X,Y獨(dú)立,則

稱為第一自由度為n1

,第二自由度為n2的F—分布,其概率密度為2、F分布表及有關(guān)計(jì)算(1)構(gòu)成:P{F(n1,n2)>λ}=α(2)有關(guān)計(jì)算P{F(n1,n2)>λ}=αλ=Fα(n1,n2)α例6(X1,X2,…,X5)為取自正態(tài)總體X~(0,σ2)的樣本,求統(tǒng)計(jì)量的分布解三、有關(guān)正態(tài)總體的幾個(gè)主要結(jié)果證明組合,故服從正態(tài)分布。1、若則是n

個(gè)獨(dú)立的正態(tài)隨機(jī)變量的線性2、設(shè)(X1,X2,…,Xn)是正態(tài)總體N(μ,σ2)的樣本,則(證明略)(1)(2)與S2獨(dú)立3、設(shè)(X1,X2,…,Xn)是正態(tài)總體N(μ,σ2)的樣本,則證明(X1,X2,…,Xn)是正態(tài)總體N(μ,σ2)的樣本,則由分布定理1、2可知與S2獨(dú)立且所以由t分布的定義,可知總體成數(shù)與樣本成數(shù)

總體成數(shù)(或比例)是指總體中具有某一特征的個(gè)體在總體中所占的比重,用表示

如果總體中的個(gè)體用表示,總體容量為N,則總體均值等于總體成數(shù)說(shuō)明:個(gè)體具有該特征賦值“1”,不具有賦“0”

總體方差為

樣本成數(shù)是指樣本中具有某一特征的個(gè)體在該樣本中所占的比重,用p表示設(shè)X1,X2,…,Xn是從該總體抽取的一個(gè)樣本,則

樣本均值就是樣本中具有該特征的個(gè)體數(shù)占樣本總數(shù)的百分比,即就是樣本成數(shù)p,

樣本方差為則未知參數(shù),這種問(wèn)題稱為參數(shù)估計(jì)問(wèn)題.在實(shí)際中我們經(jīng)常遇到這樣的問(wèn)題:總體的分布函數(shù)的形式為已知,是未知參數(shù).是的一個(gè)樣本,為相應(yīng)的一個(gè)樣本值.我們希望用樣本值去估計(jì)一、點(diǎn)估計(jì)問(wèn)題的提出在數(shù)理統(tǒng)計(jì)中稱統(tǒng)計(jì)量

點(diǎn)估計(jì)常用方法:矩估計(jì)和極大似然估計(jì)法.解決上述參數(shù)的點(diǎn)估計(jì)問(wèn)題的思路是:設(shè)法作出合理的估計(jì).的估計(jì)值.構(gòu)造一個(gè)合適的統(tǒng)計(jì)量,對(duì)為的估計(jì)量,的觀測(cè)值稱為矩估計(jì)法是由英國(guó)統(tǒng)計(jì)學(xué)家矩估計(jì)法的基本思想是用樣本的階原點(diǎn)矩去估計(jì)總體的階原點(diǎn)矩;皮爾遜(K.Pearson)在1894年提出.用樣本的階中心矩去估計(jì)總體并由此得到未知參數(shù)的估計(jì)量.矩估計(jì)法的k階中心矩設(shè)總體的分布函數(shù)為,是個(gè)待估計(jì)的未知參數(shù).設(shè)存在,對(duì)任意,現(xiàn)用樣本矩作為總體矩的估計(jì),即令這樣得到含個(gè)參數(shù)的個(gè)方程組,解該方程組得以作為參數(shù)的估計(jì)量.這種求出估計(jì)量的方法稱為矩估計(jì)法.求總體的均值和方差的矩估計(jì).解

設(shè)是總體的一個(gè)樣本,由于故令解得例極大似然估計(jì)作為一種點(diǎn)估計(jì)方法最初是由德國(guó)數(shù)學(xué)家高斯(Gauss)于1821年提出,英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)歇爾(R.A.Fisher)在1922年作了進(jìn)一步發(fā)展使之成為數(shù)理統(tǒng)計(jì)中最重要應(yīng)用最廣泛的方法之一.GaussFisher極大似然估計(jì)極大似然原理的直觀想法:在試驗(yàn)中概率最大的事件最有可能出現(xiàn).一個(gè)試驗(yàn)如有若干個(gè)

可能結(jié)果,若在一次試驗(yàn)中,結(jié)果出現(xiàn),則認(rèn)為出現(xiàn)的概率最大.極大似然估計(jì)法設(shè)總體的分布律為或分布密度為,其中是未知參數(shù),的分布律(或分布密度)為,當(dāng)給定樣本值后,

它只是參數(shù)的函數(shù),記為,即則稱為似然函數(shù),似然函數(shù)實(shí)質(zhì)上是樣本的分布律或分布密度.似然函數(shù)既然在一次試驗(yàn)中得到的樣本值,那么樣本取該樣本值的概率應(yīng)較大,所以選取使似然函數(shù)達(dá)到最大的參數(shù)值作為估計(jì)值,稱為極大似然估計(jì)法.是樣本的一個(gè)觀測(cè)值,設(shè)總體的分布律為的概率為則樣本設(shè)總體的分布密度(或分布律)為,其中為未知參數(shù).又設(shè)是總體的一個(gè)樣本值,如果似然函數(shù)在處達(dá)到最大,則稱分別為的極大似然估計(jì)量.由于與有相同的極大值點(diǎn).因此,為極大似然估計(jì)的必要條件為

稱它為似然方程,其中求極大似然估計(jì)量的一般步驟為:(1)求似然函數(shù);(2)求出及似然方程(3)解似然方程得到極大似然估計(jì)值

(4)最后得到極大似然估計(jì)量

設(shè)總體,求參數(shù)的極大似然估計(jì)量.解設(shè)是總體的樣本,其觀測(cè)值為,由總體,分布密度為例似然函數(shù)解似然方程得極大似然估計(jì)量為.兩種求點(diǎn)估計(jì)的方法:矩估計(jì)法極大似然估計(jì)法在統(tǒng)計(jì)問(wèn)題中往往先使用極大似然估計(jì)法,

在極大似然估計(jì)法使用不方便時(shí),再用矩估計(jì)法.內(nèi)容小結(jié)點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)設(shè)為待估計(jì)的總體參數(shù),為樣本統(tǒng)計(jì)量,則的優(yōu)良標(biāo)準(zhǔn)為:若,則稱為的無(wú)偏估計(jì)量指樣本指標(biāo)的均值應(yīng)等于被估計(jì)的總體指標(biāo)無(wú)偏性若,則稱為比更有效的估計(jì)量作為優(yōu)良的估計(jì)量,除了滿足無(wú)偏性的要求外,其方差應(yīng)比較小有效性指隨著樣本單位數(shù)的增大,樣本估計(jì)量將在概率意義下越來(lái)越接近于總體真實(shí)值一致性點(diǎn)估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn)若對(duì)于任意ε>0,有為的無(wú)偏、有效、一致估計(jì)量;為的無(wú)偏、有效、一致估計(jì)量;為的無(wú)偏、有效、一致估計(jì)量。數(shù)理統(tǒng)計(jì)可以證明:點(diǎn)估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn)3、正態(tài)總體均值的區(qū)間估計(jì)一.置信區(qū)間概念對(duì)于未知參數(shù),除了得到它的點(diǎn)估計(jì)外,我們還希望估計(jì)出一個(gè)范圍,并希望知道這個(gè)范圍包含參數(shù)真值的可信程度.這樣的范圍通常以區(qū)間的形式給出,而可信程度由概率給出.這種估計(jì)稱為區(qū)間估計(jì)或置信區(qū)間,以下先給出置信區(qū)間概念.定義

設(shè)為總體X的一個(gè)未知參數(shù),是預(yù)先給定一個(gè)數(shù),,是兩個(gè)估計(jì)量,如果

則稱隨機(jī)區(qū)間為未知參數(shù)的一個(gè)置信度為的置信區(qū)間(ConfidenceInterval).置信度也常稱為置信水平(confidencelevel)或置信系數(shù)(confidencecoefficient).通常取0.05,0.01,0.10,視具體需要而定.二.求區(qū)間估計(jì)的一般方法首先根據(jù)樣本尋找一個(gè)隨機(jī)變量(樞軸變量),使其分布完全已知.對(duì)給定的置信度,由T的分布確定兩個(gè)常數(shù)C1,C2使將事件表示為則即的置信度為的置信區(qū)間為.三.正態(tài)總體均值的區(qū)間估計(jì)

鑒于實(shí)際問(wèn)題中最常見(jiàn)的參數(shù)估計(jì)問(wèn)題多數(shù)是要求估計(jì)總體的均值和方差,且正態(tài)總體又是實(shí)際問(wèn)題中最常遇到的總體,因此,以下著重討論正態(tài)總體均值和方差的區(qū)間估計(jì).總體X~N

,μ

是未知參數(shù),現(xiàn)在我們分兩種情形討論μ的區(qū)間估計(jì)問(wèn)題從該總體X中抽取隨機(jī)樣本,并以作為μ=EX的點(diǎn)估計(jì),服從正態(tài)分布1.已知情形下μ的置信區(qū)間若是已知參數(shù),這時(shí)可選取樞軸變量~N(0,1)則對(duì)給定的置信度,存在,使

這里是標(biāo)準(zhǔn)正態(tài)分布的-上側(cè)分位數(shù),其值可查附表求得.將U的表示式代入上式可得

所以μ的置信度為的置信區(qū)間是

其長(zhǎng)度為

2.為未知情形下,μ的置信區(qū)間

若是未知參數(shù),則以的無(wú)偏估計(jì)代替,這時(shí)由于樞軸變量~所以對(duì)給定的置信度,存在使

這里的是自由度為n-1的t分布的-上側(cè)分位數(shù),它的值可查附表求得,將T代入可得因此有

所以μ的置信度為的置信區(qū)間是

其長(zhǎng)度為

需要說(shuō)明的是:置信區(qū)間公式中的,,在實(shí)際問(wèn)題中都是具體觀測(cè)值,計(jì)算時(shí)應(yīng)是.四.大樣本情形下總體均值的區(qū)間估計(jì).對(duì)一般的總體X,無(wú)論它服從什么分布,只要其均值μ=EX和方差σ2=DX都存在,我們便可以用增大樣本容量的辦法對(duì)其均值μ作區(qū)間估計(jì).根據(jù)中心極限定理,當(dāng)樣本容量n充分大時(shí),便近似服從正態(tài)分布.又因?yàn)?/p>

,所以

N(0,1)又因?yàn)闃颖径A中心矩Sn是σ的無(wú)偏估計(jì),當(dāng)n充分大時(shí),σ近似等于Sn,從而上式中以Sn代替σ,可得樞軸變量

N(0,1)對(duì)于指定的α∈(0,1),查附表可得到,使即故的置信度為的置信區(qū)間近似為

1.兩個(gè)正態(tài)總體均值差的區(qū)間估計(jì)設(shè)總體,總體,兩總體相互獨(dú)立.現(xiàn)從兩總體中各取一個(gè)容量分別為n1和n2的樣本,并記兩個(gè)樣本的均值、方差分別為和取作為的點(diǎn)估計(jì),顯然這個(gè)估計(jì)是無(wú)偏的,并且,有~N(0,1)于是可得的置信度為的置

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論