第八章參數(shù)估計(jì)_第1頁
第八章參數(shù)估計(jì)_第2頁
第八章參數(shù)估計(jì)_第3頁
第八章參數(shù)估計(jì)_第4頁
第八章參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第八章 參數(shù)估計(jì)參數(shù)估計(jì)點(diǎn)估計(jì)的概述點(diǎn)估計(jì)量的評選標(biāo)準(zhǔn)區(qū)間估計(jì)單側(cè)置信區(qū)間一致性有效性最大似然估計(jì)矩估計(jì)無偏性兩個正態(tài)總體的均值差和方差比區(qū)間估計(jì)一個正態(tài)總體均值和方差的區(qū)間估計(jì)統(tǒng)計(jì)推斷是數(shù)理統(tǒng)計(jì)的重要組成部分,它包括統(tǒng)計(jì)估計(jì)和假設(shè)檢驗(yàn)兩類基本問題.統(tǒng)計(jì)估計(jì)是根據(jù)樣本的信息對總體分布的概率特性(如分布類型、參數(shù)等)作出估計(jì),統(tǒng)計(jì)估計(jì)又分為參數(shù)估計(jì)和非參數(shù)估計(jì),本章只討論參數(shù)估計(jì)問題.在實(shí)際問題中,經(jīng)常遇到隨機(jī)變量(即總體)的分布函數(shù)的形式已知,但它的一個或者多個參數(shù)未知的情形,此時寫不出確切的概率密度函數(shù).若通過簡單隨機(jī)抽樣,得到總體的一個樣本觀測值,我們自然會想到利用這一組數(shù)據(jù)來估計(jì)這一個或

2、多個未知參數(shù).諸如此類,利用樣本去估計(jì)總體未知參數(shù)的問題,稱為參數(shù)估計(jì)問題.參數(shù)估計(jì)問題有兩類,分別是點(diǎn)估計(jì)和區(qū)間估計(jì).第一節(jié) 點(diǎn)估計(jì)的概述用一個數(shù)值估計(jì)某個參數(shù),這種估計(jì)就是點(diǎn)估計(jì).比方說我們要考察某醫(yī)院新出生嬰兒的男女比例,抽查了100個嬰兒,按后估計(jì)出這個比例值為0.83,這個比值就是“比例”這個未知數(shù)的點(diǎn)估計(jì)值.定義8.1 設(shè)總體的分布函數(shù)形式已知,其中是待估計(jì)的參數(shù),點(diǎn)估計(jì)問題就是利用樣本,構(gòu)造一個統(tǒng)計(jì)量來估計(jì),我們稱為的點(diǎn)估計(jì)量,它是一個隨機(jī)變量.將樣本觀測值代入估計(jì)量,就得到它的一個具體數(shù)值,這個數(shù)值稱為的點(diǎn)估計(jì)值.一、矩估計(jì)法矩估計(jì)法的基本思想是用樣本矩估計(jì)總體矩. 因?yàn)橛纱髷?shù)

3、定理知, 當(dāng)總體的階矩存在時,樣本的階矩依概率收斂于總體的階矩.我們假設(shè)總體的分布函數(shù)為,其中是待估參數(shù).若總體為連續(xù)型隨機(jī)變量,設(shè)密度函數(shù)為;若總體為離散型隨機(jī)變量,設(shè)分布律為.是來自總體的樣本.假設(shè)總體的1階至階原點(diǎn)矩都存在,則有(為連續(xù)型)或 (為離散型)(其中是所有可能取值的集合).一般來說,他們是的函數(shù).根據(jù)樣本矩依概率收斂于總體矩,樣本矩的連續(xù)函數(shù)依概率收斂于總體矩的連續(xù)函數(shù),我們可以用樣本矩作為總體矩的估計(jì)量,而樣本矩的連續(xù)函數(shù)作為總體矩的連續(xù)函數(shù)的估計(jì)量.即 得方程組 解得 稱為的矩估計(jì)量,這種方法稱為矩估計(jì)法.相應(yīng)的估計(jì)值稱為矩估計(jì)值,矩估計(jì)量與矩估計(jì)值統(tǒng)稱為矩估計(jì).例8.1

4、 設(shè)總體服從區(qū)間上的均勻分布,即密度函數(shù)為其中未知,是來自總體的樣本,求的矩估計(jì)量.解 令解之得的矩估計(jì)量為例8.2 設(shè)總體服從泊松分布,參數(shù)未知,是來自總體的一個樣本,求參數(shù)的矩估計(jì)量.解 總體的1階原點(diǎn)矩即數(shù)學(xué)期望為用樣本的1階原點(diǎn)矩(即樣本均值)代替總體的1階原點(diǎn)矩得方程所以的矩估計(jì)量為. 矩估計(jì)法的優(yōu)點(diǎn)是簡單易行,并不需要事先知道總體服從什么分布.缺點(diǎn)是當(dāng)總體類型已知時,沒有充分利用分布提供的信息.一般場合下,矩估計(jì)量不具有唯一性.其主要原因在于建立矩估計(jì)法方程時,選取那些總體矩用相應(yīng)樣本矩代替帶有一定的隨意性.二、最大似然估計(jì)法先通過一個例子了解一下最大似然估計(jì)的基本思想.某同學(xué)與一

5、位獵人一起去打獵,一只野兔從前方竄過, 只聽一聲槍響, 野兔應(yīng)聲倒下, 試猜測是誰打中的?由于只發(fā)一槍便打中,而獵人命中的概率一般大于這位同學(xué)命中的概率, 故一般會猜測這一槍是獵人射中的.這個例子所作的推斷已經(jīng)體現(xiàn)了最大似然法的基本思想 :一次試驗(yàn)就出現(xiàn)的事件有較大的概率.即在已經(jīng)得到實(shí)驗(yàn)結(jié)果的情況下, 應(yīng)該尋找使這個結(jié)果出現(xiàn)的可能性最大的那個作為的估計(jì).下面分別就離散型總體和連續(xù)型總體情形作具體討論.離散型總體的情形: 設(shè)總體的概率分布為其中為未知參數(shù).如果是取自總體的樣本,樣本的觀察值為,則樣本的聯(lián)合分布律對確定的樣本觀察值,上式是未知參數(shù)的函數(shù),記為,并稱其為似然函數(shù).連續(xù)型總體的情形:

6、 設(shè)總體X的概率密度為,其中為未知參數(shù),此時定義似然函數(shù).似然函數(shù)的值的大小意味著該樣本值出現(xiàn)的可能性的大小, 在已得到樣本值的情況下, 則應(yīng)該選擇使達(dá)到最大值的那個 作為的估計(jì). 這種求點(diǎn)估計(jì)的方法稱為最大似然估計(jì)法.定義8.2 若對任意給定的樣本值, 存在,使 則稱為的最大似然估計(jì)值.稱相應(yīng)的統(tǒng)計(jì)量為最大似然估計(jì)量. 它們統(tǒng)稱為的最大似然估計(jì).由定義可知,求參數(shù)的最大似然估計(jì)問題,就是求似然函數(shù)的最大值點(diǎn)的問題.因此可以對似然函數(shù)關(guān)于求導(dǎo).又由于和有相同的最大值點(diǎn),故只需求的最大值點(diǎn)即可.這樣往往會給計(jì)算帶來很大方便.在一般情況下, 在最大值點(diǎn)的一階偏導(dǎo)數(shù)為零,此時只需解最大似然方程組即可

7、得參數(shù)的最大似然估計(jì).例8.3 設(shè)隨機(jī)變量服從泊松分布,即分布律為.其中是未知參數(shù),求的最大似然估計(jì).解 設(shè)是樣本的一組觀測值.于是似然函數(shù)為兩邊取對數(shù)得對數(shù)似然函數(shù)為令解方程得從而得出最大似然估計(jì)為.例8.4 設(shè)是來自正態(tài)總體的樣本,其中是未知參數(shù).求的最大似然估計(jì).解 由已知得樣本的似然函數(shù)為兩邊取對數(shù)得分別關(guān)于和求偏導(dǎo)數(shù),得似然方程組解這一方程組得.由微積分知識易驗(yàn)證以上所求為和的最大似然估計(jì).由上例我們可以總結(jié)出求最大似然估計(jì)的一般步驟如下:(1) 寫出似然函數(shù);(2) 寫出對數(shù)似然函數(shù),及方程組;(3)解上述方程組得最大似然估計(jì)值.值得注意的是,通過取對數(shù)得到對數(shù)似然方程,進(jìn)而解對數(shù)

8、似然方程組求最大值點(diǎn)的方法并不總是有效的,因此應(yīng)該具體問題具體分析.例8.5設(shè)總體服從均勻分布,即概率密度函數(shù)為 求參數(shù)的最大似然估計(jì).解 設(shè)是來自總體的樣本,似然函數(shù)為顯然關(guān)于單調(diào),要使達(dá)到最大,就要使達(dá)到最小,由于所以的最大似然估計(jì)值為的最大似然估計(jì)量為. 習(xí)題8-1A組1.設(shè)總體的分布律為-102其中,求的矩估計(jì).2.一批燈泡的使用壽命的抽取樣本如下(單位:h): 1458, 1395, 1565, 1614, 1351, 1490, 1478, 1382, 1536, 1496試用矩估計(jì)法針對這批燈泡的平均壽命及壽命方差做出矩估計(jì). 3.設(shè)是來自總體的樣本,服從參數(shù)為的幾何分布,即的分

9、布律為其中未知,求的最大似然估計(jì).4.已知總體的密度函數(shù)為 求:(1)參數(shù)的矩估計(jì);(2)參數(shù)的最大似然估計(jì).B組1. 設(shè)總體的分布律為,未知.求的矩估計(jì)和最大似然估計(jì).2.設(shè)總體的密度函數(shù)為 求的最大似然估計(jì).3.已知總體是離散型隨機(jī)變量,的可能取值為0,1,2,且, (為未知參數(shù)).求:(1)的概率分布;(2)對抽取容量為10的樣本,其中5個取1,3個取2,2個取0.求的矩估計(jì)值和最大似然估計(jì)值.4.已知總體的密度函數(shù)為 是來自總體的樣本,.(1)求的期望(記);(2)求的矩估計(jì)量和最大似然估計(jì)量(3)利用上述結(jié)果求的最大似然估計(jì)量.第二節(jié)點(diǎn)估計(jì)量的評選標(biāo)準(zhǔn)對于總體的同一個未知參數(shù),由于采

10、用的估計(jì)方法不同,可能會產(chǎn)生多個不同的估計(jì)量.這就提出了一個問題,當(dāng)總體的同一個參數(shù)存在不同的估計(jì)量時,究竟采用哪一個更好?這涉及到用什么樣的標(biāo)準(zhǔn)來評價估計(jì)量的好壞問題,對此,我們介紹幾個常用的評價標(biāo)準(zhǔn):無偏性、有效性和一致性.一、無偏性在評價一個估計(jì)量的好壞時,我們當(dāng)然希望估計(jì)量與被估參數(shù)越接近越好,但估計(jì)量是一個隨機(jī)變量,它的取值隨樣本的觀測值而變,有時與被估參數(shù)的真值近些,有時遠(yuǎn)些,我們只能從平均意義上看估計(jì)量是否與被估參數(shù)盡量接近,最好是等于被估參數(shù).于是有無偏估計(jì)量的概念.定義8.3 設(shè)是未知參數(shù)的估計(jì)量,若對任意有,則稱是的無偏估計(jì)量.例8.6 設(shè)是來自總體的樣本,作為總體均值的估

11、計(jì)有, , ,試證,都是無偏估計(jì)量.證 因?yàn)橄嗷オ?dú)立且服從同一分布,故有由數(shù)學(xué)期望的性質(zhì)知因此,都是無偏估計(jì)量.由此可見一個未知數(shù)可以有多個不同的無偏估計(jì)量.例8.7 設(shè)總體的方差存在,試證樣本二階中心矩是總體方差的有偏估計(jì),而樣本方差是總體方差的無偏估計(jì).證明 所以是總體方差的有偏估計(jì).而 所以 即而樣本方差是總體方差的無偏估計(jì).二、有效性由例8.6可以看出一個參數(shù)的無偏估計(jì)量不是唯一的,假若參數(shù)有兩個無偏估計(jì)量和,我們認(rèn)為其觀測值更密集在參數(shù)真值附近的一個較為理想.由于方差是隨機(jī)變量取值與其數(shù)學(xué)期望的偏離程度的度量,所以無偏估計(jì)以方差小者為好.這就引出了評價估計(jì)量好壞的另一標(biāo)準(zhǔn)有效性. 定

12、義8.4 設(shè)和都是的無偏估計(jì)量,若對,有,且至少有一個使不等式嚴(yán)格成立,則稱比更有效.例8.8 在本節(jié)例8.6中,設(shè)總體的方差存在,試問,哪一個更有效?解 注意,此處利用了不等式得到了所以是三個估計(jì)量中最有效的估計(jì)量.三、一致性無偏性和有效性都是針對無偏估計(jì)而言的,且都是在樣本容量固定的前提下提出的.我們自然希望隨著樣本容量的增大,一個估計(jì)量的值穩(wěn)定于待估參數(shù)的真值.這樣,對一個好的估計(jì)量又有下面一致性的要求.定義8.4 設(shè)是的估計(jì)量,若對于任意,滿足對任意,有,則稱是的一致估計(jì)量.一致估計(jì)量的意義在于:只要樣本容量足夠大,就可以使一致估計(jì)量與參數(shù)真實(shí)值之間的差異大于的概率足夠地小,也就是估計(jì)

13、量可以用任意接近于的概率把參數(shù)真實(shí)值估計(jì)到任意的精度.一致性是點(diǎn)估計(jì)的大樣本性質(zhì),這種性質(zhì)是針對樣本容量而言,對于一個固定的樣本容量,一致性是無意義的.與此相對,無偏性和有效性的概念是對固定的樣本而言,不需要樣本容量趨于無窮,這種性質(zhì)也稱為“小樣本性質(zhì)”. 習(xí)題8-2A組1.設(shè)總體的階矩存在,是來自總體的樣本,證明:不管服從什么分布,是的無偏估計(jì)量.2.設(shè)總體的密度函數(shù)為 是來自總體的樣本.證明:樣本均值是的無偏估計(jì)量.3設(shè)是的無偏估計(jì),且有.證明:不是的無偏估計(jì).4. 是來自總體的樣本,其中未知,令,試證是的一致估計(jì)量.B組1. 是來自總體的樣本,設(shè).(1)確定常數(shù),使是的無偏估計(jì)量.(2)

14、確定常數(shù),使是的無偏估計(jì).2.設(shè)和是的兩個獨(dú)立的無偏估計(jì)量,假定,求常數(shù),使為的無偏估計(jì)量,并使得達(dá)到最小.3.設(shè)總體,總體,設(shè)是來自總體的樣本,是來自總體的樣本,兩樣本獨(dú)立.(1)求參數(shù)的一個無偏估計(jì).(2)證明:是的無偏估計(jì).4. 設(shè)是來自均勻總體的樣本,證明的最大似然估計(jì)滿足一致性要求.第三節(jié) 區(qū)間估計(jì)前面,我們討論了參數(shù)的點(diǎn)估計(jì),它是用樣本算得的一個估計(jì)值去估計(jì)未知參數(shù),這個估計(jì)值僅僅是未知參數(shù)的一個近似值,但其精度如何點(diǎn)估計(jì)本身不能回答.實(shí)際中,度量一個點(diǎn)估計(jì)的精度的最直觀的方法是給出一個未知參數(shù)的一個區(qū)間,這就是我們常常用到的參數(shù)的另一種估計(jì)形式:區(qū)間估計(jì).如估計(jì)某人的身高在之間,

15、估計(jì),某項(xiàng)費(fèi)用在之間等等.一、區(qū)間估計(jì)問題定義8.5 設(shè)總體的分布中含有一個未知參數(shù),和由樣本確定的兩個統(tǒng)計(jì)量.對給定的,如果對參數(shù)的任何值,都有 則稱隨機(jī)區(qū)間為參數(shù)的置信水平為的置信區(qū)間,分別稱為的雙側(cè)置信區(qū)間的置信下限和置信上限,稱為置信水平或置信度. 當(dāng)為連續(xù)型隨機(jī)變量時,對于給定的,我們總是可以按要求給出隨機(jī)區(qū)間,使得.而當(dāng)為離散型隨機(jī)變量時,對于給定,常常找不到區(qū)間,使得恰好為.此時我們?nèi)フ覅^(qū)間,使得至少為,且盡可能的接近.置信區(qū)間的含義:若反復(fù)抽樣多次(各次的樣本容量相等,均為),每一組樣本值確定一個區(qū)間,每個這樣的區(qū)間要么包含的真值,要么不包含的真值.按伯努利大數(shù)定理,在這么多的

16、區(qū)間中,包含真值的約占,不包含真值的約僅占.例如:若,反復(fù)抽樣1000次,則得到的1000個區(qū)間中,不包含真值的約為10個.在對參數(shù)作區(qū)間估計(jì)時,常提出以下兩個要求:(1)可信度高,即隨機(jī)區(qū)間要以很大的概率包含真值;(2)估計(jì)精度高,即要求區(qū)間的長度盡可能的小.而這兩個要求往往是矛盾的,區(qū)間估計(jì)的理論和方法的基本問題就是在已有的樣本信息下,找出較好的估計(jì)方法,以盡量提高可信度和精度.奈曼提出的原則是:先保證可信度,在這個前提下盡量提高精度.例8.9 設(shè)總體,已知,未知,是來自總體的樣本,求的置信水平為的置信區(qū)間.解 我們知道樣本均值是總體均值的無偏估計(jì)量,的取值大部分集中于附近,顯然以很大概率

17、包含的區(qū)間也應(yīng)包含,因此,我們從出發(fā),構(gòu)造的置信區(qū)間.又因?yàn)?8.1所以 即 其中是標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位點(diǎn)(如圖8.1),這樣我們得到了的置信水平為的置信區(qū)間 . 8.2 圖8.1由此,我們給出求未知參數(shù)的置信區(qū)間的具體做法如下:(1)尋找一個樣本和的函數(shù),使得的分布不依賴于和其他未知參數(shù),稱具有這種性質(zhì)的函數(shù)為樞軸量.(2)對于給定的置信水平,定出兩個常數(shù)使得 .將 變形為 ,即是的置信水平為的置信區(qū)間.需要注意的是,置信水平為的置信區(qū)間并不是唯一的.如例8.9中,如果取即,查表可得.于是,我們得到一個置信水平為0.95的置信區(qū)間 . 8.3 事實(shí)上,對于任意給定的,只要,記相應(yīng)的上側(cè)和分

18、位點(diǎn)分別為,則所確定的區(qū)間都是的置信水平為的置信區(qū)間.例如,得置信區(qū)間為 . 8.4 那么在眾多的區(qū)間中,我們應(yīng)該使用哪一個呢?注意到置信水平相同的區(qū)間的長度往往是不同的,例如區(qū)間8.3的長度為,區(qū)間8.4的長度為,根據(jù)我們對置信區(qū)間的要求,我們應(yīng)該在置信水平一定的前提下,選取區(qū)間長度最短的那一個區(qū)間.二、單個正態(tài)總體的區(qū)間估計(jì) 由于我們遇到的很多總體都是服從或是近似服從正態(tài)分布的,且很多統(tǒng)計(jì)量的極限分布也是正態(tài)分布,因此,我們專門介紹正態(tài)總體中的參數(shù)和的區(qū)間估計(jì).設(shè)已給定置信水平,是來自總體的樣本.和分別是樣本均值和樣本方差.1.均值的區(qū)間估計(jì)(1)已知時,由本節(jié)例1中的樞軸量已得到的一個置

19、信水平為的置信區(qū)間為. 8.5例8.10 對50名大學(xué)生的午餐費(fèi)進(jìn)行調(diào)查,得樣本均值為4.10元,假如總體的標(biāo)準(zhǔn)差為1.75元,求大學(xué)生的午餐費(fèi)的置信水平為0.95的置信區(qū)間.解 的置信區(qū)間為,.由8.5式得的置信水平為0.95的置信區(qū)間為 .(2)未知時,此時不能用8.2式給出的區(qū)間,因?yàn)槠渲泻形粗獏?shù).考慮到是的無偏估計(jì)量,因此將8.1式中的換成,有抽樣分布定理知 . 8.6 使用作為樞軸量可得(參見圖8.2) 圖8.2即 于是得到的一個置信水平為的置信區(qū)間為 . 8.7例8.11 為估計(jì)一物體的重量,用天平秤了5次,得結(jié)果(克):5.52, 5.48, 5.64, 5.51, 5.43

20、. 假定測量值是正態(tài)的,求的一個置信水平為0.95的置信區(qū)間.解 由已知 , 所以由8.7式得的一個置信水平為0.95的置信區(qū)間為 .2. 方差的區(qū)間估計(jì)根據(jù)實(shí)際問題的需要,只介紹未知的情況.是的無偏估計(jì)量,因此有抽樣分布定理知 . 8.8取作為樞軸量,即得(參見圖8.3) 圖8.3即 .這就得到方差的一個置信水平為的置信區(qū)間為.例8.12從某廠生產(chǎn)的滾珠中隨機(jī)抽取10個,測得滾珠的直徑(單位:mm)如下:14.6 15.0 14.7 15.1 14.9 14.8 15.0 15.1 15.2 14.8若滾珠直徑服從正態(tài)分布,若未知,求滾珠直徑方差的置信水平為95%的置信區(qū)間.解 未知,計(jì)算樣

21、本方差,置信水平,自由度,查表可得,.則方差的置信水平為95%的置信區(qū)間為 即(0.0177,0.1243).三、兩個正態(tài)總體的區(qū)間估計(jì)在實(shí)際中常遇到下面的問題:已知產(chǎn)品的某一質(zhì)量指標(biāo)服從正態(tài)分布,但由于原料、設(shè)備條件、工藝過程的改變等因素,引起總體均值、總體方差有所改變.我們需要知道這些變化有多大,這就需要考慮兩個正態(tài)總體均值差或方差比的估計(jì).設(shè)與分別來自于兩個相互獨(dú)立的正態(tài)總體和的樣本,分別是兩個樣本的均值和方差,給定置信水平.1.兩個總體均值的區(qū)間估計(jì)(1)和均已知因?yàn)?分別為和的無偏估計(jì),故是的無偏估計(jì).由于,且和相互獨(dú)立,所以繼而 取為樞軸量,即得到的一個置信水平為的置信區(qū)間為 8.

22、9(2) ,未知. 由上一章抽樣分布定理知 其中 取為樞軸量,可得的一個置信水平為的置信區(qū)間 8.10例8.13某工廠一條生產(chǎn)燈泡的流水線,在工藝改變前后分別抽檢若干件產(chǎn)品的壽命,得數(shù)據(jù)為 改變前:改變后:假定燈泡壽命服從正態(tài)分布,且工藝改變前后方差不變,試求工藝改變前后平均壽命之差的置信度為95%的置信區(qū)間. 解 所以由8.10式得的一個置信水平為0.95的置信區(qū)間為2.兩個總體方差比的區(qū)間估計(jì)我們僅討論和都未知的情況,由抽樣分布定理知 取為樞軸量得(如圖8.4) 圖8.4即 于是得到的一個置信水平為的置信區(qū)間 .例8.14兩個相互獨(dú)立的正態(tài)總體,各取樣本,求 的置信度為95% 的置信區(qū)間

23、.解 的置信區(qū)間為習(xí)題8-3A組1.設(shè)某種油漆的9個樣品,其干燥時間(以為單位)分別為: 6.0 5.7 5.8 6.5 7.0 6.3 5.6 6.1 5.0設(shè)干燥時間總體服從正態(tài)分布.(1)若由以往經(jīng)驗(yàn),求的置信水平為0.95的置信區(qū)間;(2)若未知,求的置信水平為0.95的置信區(qū)間.2. 用兩種工藝(或原料)A和B生產(chǎn)同一種橡膠制品為比較兩種工藝下產(chǎn)品的耐磨性,從兩種工藝的產(chǎn)品中各隨意抽取了若干件,測得如下數(shù)據(jù): 工藝 A:185.82, 175.10, 217.30, 213.86, 198.40工藝 B:152.10, 139.89, 121.50, 129.96, 154.82,

24、165.60 假設(shè)兩種工藝下產(chǎn)品的耐磨性和都服從正態(tài)分布: (1)建立的置信度為0.95置信區(qū)間;(2)建立的置信度為0.95置信區(qū)間.3.設(shè)某自動包裝機(jī)包裝洗衣粉,其重量服從正態(tài)分布,隨機(jī)抽查12袋,測得重量分別為:1001 1004 1003 997 999 10001004 1000 996 1002 998 999求這批洗衣粉重量方差和標(biāo)準(zhǔn)差的置信區(qū)間().4.某大學(xué)從A、B兩市招收的新生中分別抽5名、6名男生,測得身高值如下:A市:172 178 180.5 174 175B市:174 171 176.5 168 172.5 170 設(shè)兩市學(xué)生身高分別服從.求的置信水平為0.95的置

25、信區(qū)間.5. 為比較,兩種型號步槍子彈的槍口速度,隨機(jī)的取型號子彈10發(fā),得到槍口速度的平均值為,標(biāo)準(zhǔn)差為;隨機(jī)的取型號子彈20發(fā),得到槍口速度的平均值為,標(biāo)準(zhǔn)差為.假設(shè)兩總體都可認(rèn)為近似的服從正態(tài)分布,且方差相等.求兩總體均值差的一個置信水平為0.95的置信區(qū)間.B組1.一次等級考試,因急于評估試卷質(zhì)量,教師先隨機(jī)抽取36份試卷批改,平均分為72分,標(biāo)準(zhǔn)差13.2分,系主任要求在的可信度下,對全體考生的平均成績做一個區(qū)間估計(jì).2.某公司要對下一年職工醫(yī)療費(fèi)情況作個預(yù)算,通常醫(yī)療費(fèi)的標(biāo)準(zhǔn)差為120元.現(xiàn)要求在的置信度下,保證所估計(jì)的總體平均值在加減40元的范圍內(nèi).問應(yīng)該取多大的樣本?3.假定吸

26、煙者買煙的月支付近似服從正態(tài)分布,一機(jī)構(gòu)隨機(jī)抽取了容量為26的樣本進(jìn)行調(diào)查,得到樣本平均值為80元,樣本標(biāo)準(zhǔn)差為20元.試以的把握估計(jì)全部吸煙者月平均煙錢支出的置信區(qū)間.4.隨機(jī)地從A批導(dǎo)線中抽4根,又從B批導(dǎo)線中抽5根,測得電阻值為:A批導(dǎo)線:0.143 0.142 0.143 0137B批導(dǎo)線:0.140 0.142 0.136 0.138 0.140設(shè)測定數(shù)據(jù)分別來自分布,且樣本相互獨(dú)立.均未知,(1)未知時,求 的一個置信水平為0.95的置信區(qū)間. (2) 求方差比的置信水平為0.95的置信區(qū)間.第四節(jié) 單側(cè)置信區(qū)間前面介紹的置信區(qū)間中置信限都是雙側(cè)的,但在有些實(shí)際問題,人們所關(guān)心的只

27、是參數(shù)在一個方向的界限.例如對于設(shè)備、元件的使用壽命來說,平均壽命過長沒什么問題,過短就有問題了.這時,可將置信上限取為 +,而只著眼于置信下限,這樣求得的置信區(qū)間稱為單側(cè)置信區(qū)間.定義8.6 給定,若有樣本確定的統(tǒng)計(jì) ,對于任意滿足 稱隨機(jī)區(qū)間是的置信水平為的單側(cè)置信區(qū)間,稱為的置信水平為的單側(cè)置信下限. 又若統(tǒng)計(jì)量,對于任意滿足 稱隨機(jī)區(qū)間是的置信水平為的單側(cè)置信區(qū)間,稱為的置信水平為的單側(cè)置信上限.例8.15 設(shè)總體,均未知,設(shè)是來自總體的樣本.試求和的置信度為的單側(cè)置信區(qū)間.解 由有 即 于是得到的置信度為的單側(cè)置信區(qū)間 .的置信度為的單側(cè)置信下限為 .又由 有 即 于是得到的置信水平

28、為的單側(cè)置信區(qū)間.的置信水平為的單側(cè)置信上限為 .習(xí)題8-4A組1.設(shè)有某部門對所屬區(qū)域的職工家庭人均月收入進(jìn)行調(diào)查,現(xiàn)抽取20個家庭,所得的月平均收入(元),試以的置信度估計(jì)該區(qū)域職工家庭人均月收入的最低下限為多少?2.從汽車輪胎廠生產(chǎn)的某種輪胎中抽取10個樣品進(jìn)行磨損實(shí)驗(yàn),直到輪胎行駛的磨壞為止,測得他們的行駛路程(千米)如下: 41250, 41010, 42650, 38970, 40200 42550, 43500, 40400, 41870, 39800.設(shè)汽車輪胎行駛路程服從正態(tài)分布.求:的置信水平為95%的單側(cè)置信下限.3.設(shè)兩位化驗(yàn)員A、B獨(dú)立的對某種聚合物含氯量用相同的方法

29、各做10次測定,其測定值的方差分別為,.設(shè),分別為A、B所測定的測定值總體的方差,設(shè)總體均為正態(tài)分布,且兩樣本獨(dú)立.求方差比的置信水平為0.95的單側(cè)置信上限.B組1. 設(shè)總體服從指數(shù)分布,其密度函數(shù)為 其中未知.從總體中抽取一容量為的樣本.若已知. (1)求的置信水平為的單側(cè)置信下限;(2)某種元件的壽命(以小時計(jì)算)服從上述指數(shù)分布,現(xiàn)從中抽得以容量為16的樣本,測得樣本均值為5010(),試求元件的平均壽命的置信水平為0.90的單側(cè)置信下限.2. 松江A、B兩所大學(xué)某學(xué)期期末高等數(shù)學(xué)考試采用同一套題目,校認(rèn)為該校學(xué)生高數(shù)考試成績比校學(xué)生成績高10分以上。為了驗(yàn)證這個說法,主管部門從A校隨

30、機(jī)抽取75人作為樣本,測得其分?jǐn)?shù)平均值為78.6分,標(biāo)準(zhǔn)差為8.2分;B校抽取了80個同學(xué)作為隨機(jī)樣本,測得分?jǐn)?shù)平均值為73.8分,標(biāo)準(zhǔn)差為7.4分,試在99的把握下確定兩校平均分之差的置信區(qū)間,根據(jù)此置信區(qū)間主管部門能夠得到什么結(jié)論?第八章小結(jié)與案例選講參數(shù)估計(jì)分為點(diǎn)估計(jì)和區(qū)間估計(jì).點(diǎn)估計(jì)是適當(dāng)?shù)倪x取一個統(tǒng)計(jì)量作為未知參數(shù)的估計(jì).若已經(jīng)取得樣本,將樣本值代入估計(jì)量,就可以得到估計(jì)量的值,用估計(jì)量的值作為未知參數(shù)的近似值.本章介紹了兩種點(diǎn)估計(jì)法:矩估計(jì)法和最大似然估計(jì)法.矩估計(jì)法是以樣本矩作為總體矩的估計(jì)量,而以樣本矩的連續(xù)函數(shù)作為相應(yīng)的總體矩的連續(xù)函數(shù)的估計(jì)量,從而得到未知參數(shù)的估計(jì).最大似

31、然估計(jì)的基本思想:若已觀察到樣本的樣本值,因而取到這一樣本值的概率應(yīng)該是最大的,依此在未知參數(shù)的存在空間內(nèi)挑選未知參數(shù)使得取最大值,由此可得到未知參數(shù)的最大似然估計(jì).對于一個未知參數(shù)可以有多個估計(jì)量,因此自然引出比較估計(jì)量好壞的問題.本章我們給出評選估計(jì)量好壞的三個標(biāo)準(zhǔn):無偏性、有效性、一致性.點(diǎn)估計(jì)不能反映估計(jì)量的精度,為此我們引出了區(qū)間估計(jì).它的基本思想:預(yù)先給定置信水平,求出一個隨機(jī)區(qū)間,使得.意指“隨機(jī)區(qū)間包含未知參數(shù)”這一陳述的可信度為.本章還介紹了單側(cè)置信區(qū)間.在求矩估計(jì)量時,關(guān)鍵是總體矩的計(jì)算和樣本矩的代入. 總體矩的計(jì)算時用到了隨機(jī)變量的期望及隨機(jī)變量函數(shù)的期望.這就要求我們熟

32、練掌握期望的計(jì)算公式.樣本矩代入時一定是樣本原點(diǎn)矩代替總體原點(diǎn)矩,樣本中心矩代替總體中心距,不能混淆.在求最大似然估計(jì)時,當(dāng)似然函數(shù)對連續(xù)可導(dǎo)時,可由似然方程 求未知參數(shù)的最大似然估計(jì);當(dāng)似然函數(shù)對不是連續(xù)可導(dǎo)時可從函數(shù)的單調(diào)性求的最大似然估計(jì),這是容易被忽略的;更要注意的是,似然函數(shù)是的函數(shù),我們要選擇使得或者取最大值,而是已經(jīng)給出的觀測數(shù)據(jù),它是已知的數(shù)據(jù),不是選使使得或者取最大值.關(guān)鍵詞 矩估計(jì)量 最大似然估計(jì)量 估計(jì)量的評選標(biāo)準(zhǔn) 置信區(qū)間 樞軸量 單側(cè)置信上限 單側(cè)置信下限 單個正態(tài)總體均值、方差的置信區(qū)間 兩個正態(tài)總體均值差、方差比的置信區(qū)間案例分析:案例1 設(shè)有外形完全相同的兩個箱

33、子,甲箱子有99個白球,1個紅球,乙箱子有1個白球,99個紅球,現(xiàn)隨機(jī)的抽取一箱,并從該箱子中任取一個球,結(jié)果發(fā)現(xiàn)是白球,試推斷該球是來自哪個箱子的?分析:我們這里做的是統(tǒng)計(jì)推斷而不是邏輯推斷.所謂統(tǒng)計(jì)推斷,就是根據(jù)已知的部分?jǐn)?shù)據(jù)對總體的進(jìn)行估計(jì)的一種推斷方法.從部分推斷總體,必然伴隨著一定的犯錯誤的概率.因此從邏輯上認(rèn)起死理來,統(tǒng)計(jì)推斷似乎因?yàn)椴惶珖?yán)謹(jǐn)而被排斥在“科學(xué)推斷”之外了.但是在實(shí)際生活中,如果都要按照邏輯推斷來思考,那么將會給你的生活帶來很大的麻煩.比如出門,則難免會有一定的概率出一定的意外,因此所謂“安全回家”在邏輯上便不再是絕對可靠的,故而你只能選擇閉門不出.現(xiàn)在的問題是,僅僅

34、從取出的球是白球這一點(diǎn)是無法從邏輯上嚴(yán)格加以判定該箱究竟是甲箱還是乙箱的.但是如果現(xiàn)在一定要我們做出選擇,那么我們只能這樣來考慮:從箱中取出的球是白球這一點(diǎn)來看,甲箱和乙箱哪個看上去更像是真正從中取球的箱子?我們這樣來分析:如果該箱是甲箱則取得白球的概率為0.99;如果該箱是乙箱,則取得白球的概率0.01.因此,用“該箱是甲箱”來解釋所取的球是白球這一事件更有說服力一些,從而我們判定甲箱比乙箱更像一些.最后我們做出推斷,這球是從甲箱取出的.案例2 今天社會輿論調(diào)查在報(bào)紙和其他新聞媒介中已經(jīng)扮演了一個非常重要的角色,他們收集公眾對各種社會、政治和經(jīng)濟(jì)問題上的信息,出版摘要報(bào)告.這樣的輿論調(diào)查在民

35、主政治社會中能起到積極的作用.他們可以告訴政治領(lǐng)導(dǎo)人和官僚們什么是公眾的需要,什么是公眾的愛好.他們也向公眾報(bào)告新聞,通告公眾的想法,或許可幫助在某個重要的問題上明確表現(xiàn)公眾的觀點(diǎn).通常以某種特定的統(tǒng)計(jì)形式宣布公眾輿論調(diào)查的結(jié)果,同時需要一定的解釋.例如,播音員說:贊成總統(tǒng)外交政策的人占42%,正負(fù)誤差界限為4%.代替給出單個數(shù)字,這里播音員給出一個區(qū)間(42-4,42+4)=(38,46).這是如何得到的?如何解釋呢?假設(shè)所有美國成人中,實(shí)際贊成總統(tǒng)外交政策的比率為數(shù)值.為了了解的大小,必須接觸每一個美國成人,得到他們對“你贊成總統(tǒng)的外交政策嗎”這個問題的反映.如果必須要得到一個限時的、迅速

36、的答案,這是不可能的.最好的方法是求出一個接近的估計(jì)值.新聞媒介對某一數(shù)量的任意選擇的個體進(jìn)行電話采訪,得到他們的答案.如果接觸了數(shù)量為的個體,其中有個人回答贊成,則的估計(jì)值可為.當(dāng)然這樣的估計(jì)是有一定誤差的,因?yàn)槲覀兯〉膬H僅是某個集合中的樣本(美國成人中很小的一部分).如果接觸另外的個人,可能得到不同的估計(jì)值.如何求出估計(jì)值得誤差呢?基于兩個統(tǒng)計(jì)學(xué)家奈曼和阿皮爾森發(fā)展起來的理論,我們可以算出一個數(shù)字,使得的真實(shí)值以很高的概率,一般為95%(或99%),落于區(qū)間之內(nèi).也就是說,這個區(qū)間不包含真實(shí)值的概率僅為5%(或1%),這是小概率事件,在一次實(shí)驗(yàn)中幾乎不可能發(fā)生.第八章總復(fù)習(xí)題一、填空題1

37、. 總體,是來自總體的樣本,則的矩估計(jì)量為_,樣本的似然函數(shù)為_.2.是來自總體的樣本,則似然函數(shù)為_.3. 在進(jìn)行區(qū)間估計(jì)時,若要求的置信水平為95%,則其相應(yīng)的臨界值為_.4. 正態(tài)總體方差未知時,在小樣本條件下,總體均值在置信水平下的置信區(qū)間為_.5. 對于非正態(tài)總體,在大樣本條件下,總體均值在置信水平下的置信區(qū)間可以寫為_.二、選擇題1. 是來自總體的樣本,則可以作為的無偏估計(jì)量的是( )A B. C. D. 2.設(shè)是取自總體的樣本,則下面四個均值估計(jì)量( )最有效.A B.C D. 3.設(shè)總體,未知,設(shè)總體均值的置信度為的置信區(qū)間長度為,則和的關(guān)系為( )A. 增大,減小 B. 增大,增大C增大,不變 D. 和關(guān)系不確定4. 設(shè)總體,已知,現(xiàn)在以置信度估計(jì)總體均值,下列做法一定能使估計(jì)更精確的是( )A提高置信度,增加樣本容量B提高置信度,減少樣本容量C降低置信度,增加樣本容量D提高置信度,減少樣本容量5.一個95%的置信區(qū)間是指( )A.總體參數(shù)有95%的概率落在這一區(qū)間內(nèi)B.總體參數(shù)有5%的概率未落在這一區(qū)間內(nèi)C.在用同樣方法構(gòu)造的總體參數(shù)的多個區(qū)間中,有95%的區(qū)間包含該總體參數(shù)D.在用同樣方法構(gòu)造的總體參數(shù)的多個區(qū)間中,有95%的區(qū)間不包含該總體參數(shù)三、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論