六西格瑪數(shù)據(jù)分析技術(shù)4課件_第1頁
六西格瑪數(shù)據(jù)分析技術(shù)4課件_第2頁
六西格瑪數(shù)據(jù)分析技術(shù)4課件_第3頁
六西格瑪數(shù)據(jù)分析技術(shù)4課件_第4頁
六西格瑪數(shù)據(jù)分析技術(shù)4課件_第5頁
已閱讀5頁,還剩71頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

17十二月2022六西格瑪數(shù)據(jù)分析技術(shù)417十二月2022六西格瑪數(shù)據(jù)分析技術(shù)41第4章參數(shù)估計4.1參數(shù)估計的基本概念4.2總體均值和總體比例的區(qū)間估計4.3樣本容量的確定4.4兩總體均值之差的區(qū)間估計4.5兩總體比例之差的區(qū)間估計4.6正態(tài)總體方差的區(qū)間估計4.7兩個正態(tài)總體方差比的區(qū)間估計4.8有關(guān)區(qū)間估計的Minitab軟件實現(xiàn)小組討論與練習(xí)σσσσσσσσσ返回目錄2第4章參數(shù)估計4.1參數(shù)估計的基本概念σσσσσσ2本章目標(biāo)1.掌握參數(shù)估計的基本概念2.建立起在管理中運用參數(shù)估計的思想3.能運用Minitab實現(xiàn)各種區(qū)間估計的計算4.掌握樣本容量的確定方法5.能在管理實踐中運用參數(shù)估計方法返回目錄3本章目標(biāo)1.掌握參數(shù)估計的基本概念返回目錄334.1

參數(shù)估計的基本概念

參數(shù)估計有兩大類,一種叫點估計,一種叫區(qū)間估計點估計是利用樣本的信息對所感興趣的參數(shù)估計出一個數(shù)值區(qū)間估計包含了兩個數(shù)值,對應(yīng)著數(shù)軸上的一個區(qū)間,所以稱為區(qū)間估計點估計的方法最常用的有兩種:矩估計法極大似然估計法對一個估計優(yōu)良性的評價有一些相應(yīng)的評價準(zhǔn)則返回目錄44.1參數(shù)估計的基本概念參數(shù)估計有兩大類,一種叫點估4對總體參數(shù)的估計,人們最容易想到的方法就是矩估計法,即用樣本矩估計總體相應(yīng)的矩,用樣本矩的函數(shù)估計總體相應(yīng)矩的函數(shù)。矩是指以期望值為基礎(chǔ)而定義的數(shù)字特征,例如均值、方差、協(xié)方差等。最常用的矩估計有:用樣本均值估計總體均值,用樣本標(biāo)準(zhǔn)差估計總體標(biāo)準(zhǔn)差。例4-1.已知某種燈泡的壽命X~N(μ,σ2),其中μ,σ2均未知,今隨機(jī)抽取4只燈泡,測得壽命(單位:小時)為1502,1453,1367,1650。試估計μ,σ。矩估計法返回目錄5對總體參數(shù)的估計,人們最容易想到的方法就是矩估計法,即用樣本5矩估計法(續(xù))解:因為μ是全體燈泡的平均壽命,為樣本的平均壽命,很自然地會想到用去估計μ;同理用s去估計σ。由于例4-2.設(shè)樣本x1,x2,…,xn來自參數(shù)為λ的泊松分布。由于E(X)=D(X)=λ,因而與s2都可以作為λ的矩估計值。由例4-2可以看出E(X)=D(X)=λ,這表明總體均值與方差相等,但在實際問題中與s2不見得一樣,因而矩估計的結(jié)果不惟一。返回目錄6矩估計法(續(xù))解:因為μ是全體燈泡的平均壽命,為樣本的平均6極大似然估計

極大似然估計是利用總體的分布密度或概率分布的表達(dá)式及其樣本所提供的信息建立求未知參數(shù)估計量的一種方法。極大似然估計好多初學(xué)者覺得難以理解,我們用下面的說法幫助理解:在產(chǎn)品檢驗中,有說這批產(chǎn)品的次品率可能是1/10000,也有說次品率可能是1/100。如果你在這批產(chǎn)品中隨機(jī)抽取一件,竟然就是次品,自然應(yīng)當(dāng)認(rèn)為這批產(chǎn)品的次品率最有可能是1/100而不是1/10000。把這種考慮問題的方法一般化,就概括出極大似然估計方法。返回目錄7極大似然估計極大似然估計是利用總體的分布密度或概率分布的7極大似然估計(續(xù)1)

設(shè)總體X的分布已知,未知參數(shù)為θ,假定其分布密度族為f(x;θ);假設(shè)對總體X的n次觀測結(jié)果為(x1,x2,…,xn)。應(yīng)在一切θ中選取使樣本(X1,X2,…,Xn)落在點(x1,x2,…,xn)附近概率最大的作為未知參數(shù)θ真值的估計值,即選取使:其中稱為似然函數(shù),它是樣本的聯(lián)合概率密度函數(shù)。返回目錄8極大似然估計(續(xù)1)設(shè)總體X的分布已知,未知參數(shù)為θ,8極大似然估計(續(xù)2)

一般情況下,我們用求解似然方程的方法進(jìn)行極大似然估計,具體步驟是:1.由總體分布導(dǎo)出樣本的聯(lián)合概率密度;2.把樣本聯(lián)合概率密度中自變量x1,x2,…,xn看成已知常數(shù),而把參數(shù)看作變量,得到似然函數(shù);3.用微分原理求似然函數(shù)的最大值點;4.在最大值點的表達(dá)式中,代入樣本值就得參數(shù)的估計值??梢宰C明:若x1,x2,…,xn來自正態(tài)總體N(μ,σ2),則:返回目錄9極大似然估計(續(xù)2)一般情況下,我們用求解似然方程的方法9例4-3.設(shè)某種品牌的電視機(jī)的首次故障時間遵從指數(shù)分布f(t)=λe-λt,t>0,共測試了7臺電視機(jī),獲得相應(yīng)的首次故障時間(單位:萬小時)為:1.49,3.65,0.26,4.25,5.43,6.97,8.09求參數(shù)的λ估計值。解:樣本x1,x2,…,xn的聯(lián)合密度用均值來表示,就有:,將看作常數(shù),λ看作變量,可得似然函數(shù),進(jìn)而取對數(shù),求微商,解方程可得:對本例而言,就有:極大似然估計(續(xù)3)返回目錄10例4-3.設(shè)某種品牌的電視機(jī)的首次故障時間遵從指數(shù)分布f(t10點估計的優(yōu)良性準(zhǔn)則不同的參數(shù)估計方法,可得到不同的估計量,不同的估計量誰優(yōu)誰劣?我們有一些相應(yīng)的評價準(zhǔn)則。在6σ管理中,最常用的點估計優(yōu)良性準(zhǔn)則有兩個:一個是無偏性,另一個是有效性。無偏性:設(shè)是參數(shù)θ的一個估計量,如果,則稱是參數(shù)θ的無偏估計。無偏性實際上是指對于一個估計量,屢次變更數(shù)據(jù)反復(fù)求估計值時,估計值的平均與真值相一致,即盡管有時比θ大,有時比θ小,總的看來,它的“平均值”就是θ??梢宰C明:許多情況下,是μ的無偏估計,s是σ的無偏估計。然而,在正態(tài)分布中σ的極大似然估計就不是無偏估計。返回目錄11點估計的優(yōu)良性準(zhǔn)則不同的參數(shù)估計方法,可得到不同的估計量,不11有效性無偏性只考慮估計值的平均結(jié)果是否等于待估參數(shù)的真值,而不考慮每個估計值與待估參數(shù)真值之間偏差的大小和散布程度。實際問題的研究中,不僅希望估計是無偏的,更希望這些估計值的偏差盡可能地小。設(shè)都是參數(shù)θ的無偏估計量,如果且至少有一個,嚴(yán)格不等號成立,則稱比有效。設(shè)、x1都是μ的無偏估計,但樣本均值的方差為σ2/n,x1的方差為σ2,只要n>1,作為μ的估計值,比x1就更有效。返回目錄12有效性無偏性只考慮估計值的平均結(jié)果是否等于待估參數(shù)的真值,而12區(qū)間估計點估計沒有給出估計的精度和可靠程度,區(qū)間估計解決了這一問題。設(shè)θ是總體的一個待估參數(shù),從總體中獲得容量為n的樣本是x1,x2,…,xn,對給定的α(0<α<1),有統(tǒng)計量:θL=θL(x1,x2,…,xn)與θU=θU(x1,x2,…,xn)若對任意θ有P(θL≤θ≤θU)=1-α,則稱隨機(jī)區(qū)間[θL,θU]是θ的置信水平為1-α的置信區(qū)間。

θL與θU分別稱為1-α的置信下限與置信上限,α稱為顯著性水平。返回目錄13區(qū)間估計點估計沒有給出估計的精度和可靠程度,區(qū)間估計解決了這13區(qū)間估計(續(xù))置信區(qū)間的大小表達(dá)了區(qū)間估計的精確性,置信水平表達(dá)了區(qū)間估計的可靠性,1-α是區(qū)間估計的可靠概率;而顯著性水平α表達(dá)了區(qū)間估計的不可靠的概率。如果[θL,θU]是置信水平為0.95的置信區(qū)間,由于隨機(jī)區(qū)間[θL,θU]會隨樣本觀察值的不同而不同,它有時包含了參數(shù)θ,有時沒有包含θ,但是用這種方法作參數(shù)的區(qū)間估計時,100次中大約有95個區(qū)間能包含著參數(shù)θ,大約有5個區(qū)間沒能包含θ。在進(jìn)行區(qū)間估計時,必須同時考慮置信概率與置信區(qū)間兩個方面。即置信概率定的越大,則置信區(qū)間相應(yīng)也大。這兩者要結(jié)合考慮,才更為實際。返回目錄14區(qū)間估計(續(xù))置信區(qū)間的大小表達(dá)了區(qū)間估計的精確性,置信水平14總體均值的區(qū)間估計當(dāng)X~N(μ,σ2)時,x1,x2,…,xn是來自該正態(tài)總體的隨機(jī)樣本,。當(dāng)總體方差σ2已知時,μ的1-α置信區(qū)間為:

其中Z1-α/2是標(biāo)準(zhǔn)正態(tài)分布的1-α/2分位數(shù)。當(dāng)總體方差σ2未知時,σ用其s代替,用t分布,μ的1-α置信區(qū)間為:其中t1-α/2(n-1)表示是自由度為n-1的t分布的1-α/2分位數(shù)4.2總體均值和總體比例的區(qū)間估計返回目錄15總體均值的區(qū)間估計4.2總體均值和總體比例的區(qū)間估計15在統(tǒng)計推斷中常常會碰到自由度這一概念,不少人對這一概念不好理解。如果我們有10個數(shù),而且你知道了均值和其中的9個數(shù)的值,那么你就可以推出第10個數(shù)。讓10個人挑選10支不同顏色的鉛筆,只有9人有自由挑選的可能,因為當(dāng)這9人都挑好之后,你別無選擇!因此這個問題的自由度為9。自由度可以理解為在研究問題中,可以自由取值的數(shù)據(jù)的個數(shù)。關(guān)于自由度

返回目錄16關(guān)于自由度返回目錄1616例4-4.σ2已知時,μ的區(qū)間估計某種零件的長度遵從正態(tài)分布,從該批零件中隨機(jī)抽取9件,測得其平均長度為21.4mm。已知總體標(biāo)準(zhǔn)差σ=0.15mm,試建立該種零件平均長度的置信區(qū)間,給定的置信水平為0.95。解:已知X~N(μ,0.152)時,=2.14,n=9,1-α=0.95,α=0.05,查標(biāo)準(zhǔn)正態(tài)分布表可得1-α/2的分位數(shù),Z1-α/2=1.96;α=0.01時,Z1-α/2=2.58;α=0.10時,Z1-α/2=1.64。這是一些常用值,請讀者記住。

我們可以95%的概率保證這種零件的平均長度在(21.302,21.498)之間。返回目錄17例4-4.σ2已知時,μ的區(qū)間估計某種零件的長度遵從正態(tài)分布17例4-5.σ2未知時,μ的區(qū)間估計為了估計各省市電視臺在某黃金時間一分鐘廣告的平均費用,隨機(jī)調(diào)查了20個電視臺,他們每分鐘的廣告費=25000元,s=8000元。假定所有電視臺的廣告費近似遵從正態(tài)分布,試求總體均值95%的區(qū)間估計。解:這是總體方差σ2未知的情況。已知=25000,s=8000,n=20,α=0.05,則t1-α/2(n-1)=t0.975(19)=2.093;于是

從而,我們有95%的把握認(rèn)為所有省市電視臺在黃金時間播出的廣告一分鐘的平均費用在(21255.93,28744.07)之間。返回目錄18例4-5.σ2未知時,μ的區(qū)間估計為了估計各省市電視臺在某黃18n≥30時均值的區(qū)間估計前邊討論的是當(dāng)總體為正態(tài)分布時,μ的區(qū)間估計,然而總體不是正態(tài)分布時,如果樣本容量n超過30,則我們可根據(jù)中心極限定理知:仍近似遵從正態(tài)分布,因而仍可用正態(tài)分布總體時的均值μ的區(qū)間估計方法。例4-6.某航空公司在過去飛行記錄中,隨機(jī)抽取了225個航班,航班空位數(shù)的樣本均值=11.6,標(biāo)準(zhǔn)差=4.1,試求過去一年所有航班的平均空位數(shù)的置信區(qū)間。(α=0.10)解:所有航班空位數(shù)的分布未知,且總體標(biāo)準(zhǔn)差未知,但n=225,因而仍可用做區(qū)間估計。代入其具體數(shù)據(jù)得[11.15,12.05],也即該公司有90%的把握認(rèn)為過去的一年該公司的平均空位數(shù)在11.15到12.05之間。返回目錄19n≥30時均值的區(qū)間估計前邊討論的是當(dāng)總體為正態(tài)分布時,μ的19總體比例的區(qū)間估計我們常需要估計總體中具有某種特征的單位占總體全部單位的比例一批產(chǎn)品中,合格品的比例;顧客滿意度調(diào)查中,有意見顧客的比例等。記總體比例為p,樣本比例為??梢宰C明,當(dāng)樣本容量足夠大時,若np>5,n(1-p)>5,則可用正態(tài)分布去近似二項分布,因而有:因此由正態(tài)分布構(gòu)造總體比例p的置信區(qū)間為:返回目錄20總體比例的區(qū)間估計我們常需要估計總體中具有某種特征的單位占總20總體比例置信區(qū)間估計的例子例4-7.某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機(jī)抽選了200人組成一個樣本。訪問結(jié)果,有140人說他的離開是由于企業(yè)管理缺乏人性化。試對由于這種原因而離開企業(yè)的人員的真正比例進(jìn)行估計(α=0.05)。解:已知n=200,=0.7,=140>5,=60>5,Z1-α/2=1.96故該企業(yè)職工認(rèn)為企業(yè)管理缺乏人性化而離開的比例為63.6%~76.4%。返回目錄21總體比例置信區(qū)間估計的例子例4-7.某企業(yè)在一項關(guān)于職工流動214.3樣本容量的確定在研究實際問題時,需要自己動手設(shè)計調(diào)查方案,這時如何確定樣本容量大有學(xué)問。如果樣本量太大,必然費用增加;如果樣本量過小,估計誤差又會增大。這就看你需要什么樣的估計精度,即你想構(gòu)造多寬的估計區(qū)間?對于你所確定的置信區(qū)間,你想要多大的置信度?估計總體均值時,樣本容量的確定在總體均值的區(qū)間估計里,置信區(qū)間是:該區(qū)間估計的精度為

,是區(qū)間估計長度的一半。返回目錄224.3樣本容量的確定在研究實際問題時,需要自己動手設(shè)22樣本容量的確定(續(xù)1)如果我們希望估計值與其真實值之間的誤差或估計的精度在置信度(1-α)下不超過某一數(shù)值B(允許誤差),則可從下面的方程確定n。解之得:只要我們知道了Z1-α/2,σ和允許誤差,就可具體算出樣本容量n。如果算出的n不是整數(shù),就去超過該小數(shù)的最接近的整數(shù)即可。返回目錄23樣本容量的確定(續(xù)1)如果我們希望估計值與其真實值之間的返回23樣本容量的確定(續(xù)2)由樣本容量的確定公式,你可發(fā)現(xiàn)幾個量之間的一些關(guān)系:1.總體方差越大,必要的樣本容量n越大。2.必要樣本容量n反比例于允許誤差B。即在給定的置信水平下,允許誤差越大,樣本容量就可以越??;允許誤差越小,樣本容量就必須加大。3.必要樣本容量n與正態(tài)分布Z1-α/2分位數(shù)(也稱可靠性系數(shù))成正比。即:我們要求的可靠程度越高,樣本容量就應(yīng)越大;如果要求的可靠程度越低,樣本容量就可以小些。返回目錄24樣本容量的確定(續(xù)2)由樣本容量的確定公式24樣本容量的確定(續(xù)3)例4-8.某廣告公司想估計某類商場去年所花的廣告費平均有多少。經(jīng)驗表明,總體方差約為1800000。如置信度取95%,并要使估計值處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)取多大的樣本?解:已知σ2=1800000,α=0.05,Z1-α/2=1.96,B=500即這家廣告公司應(yīng)抽取28個商場作樣本。返回目錄25樣本容量的確定(續(xù)3)例4-8.某廣告公司想估計某類商場去年25樣本容量的確定(續(xù)4)估計總體比例時,樣本容量n的計算公式是:例4-9.某市場調(diào)查公司想估計某地區(qū)有數(shù)碼相機(jī)的家庭所占的比例。該公司希望對p的估計誤差不超過0.05,要求的可靠度為95%,應(yīng)取多大的樣本?沒有可利用的估計值。解:通常在此類問題研究中,無法得到值時,可以用=0.5計算。已知B=0.05,α=0.05,Z1-α/2=1.96,=0.5即抽取385戶調(diào)查,就可以95%的可靠度保證估計誤差不超過0.05。返回目錄26樣本容量的確定(續(xù)4)估計總體比例時,樣本容量n的計算公式是264.4兩個總體均值之差的區(qū)間估計某化工廠需要比較由兩個供應(yīng)商提供的原材料所帶來的產(chǎn)量,某企業(yè)質(zhì)量管理部的部長希望了解車間內(nèi)兩條生產(chǎn)線生產(chǎn)的燈泡平均壽命是否存在差異等。這些都是要對兩個總體均值之差作區(qū)間估計。兩個總體的方差已知情況下,兩總體均值差異μ1-μ2的區(qū)間估計:其中,分別為來自兩個總體的樣本均值,n1,n2為抽自兩總體的樣本容量,分別是兩總體的方差。只要樣本容量足夠大,對于總體分布是否正態(tài)都可適用。返回目錄274.4兩個總體均值之差的區(qū)間估計某化工廠需要比較由兩27兩個總體均值之差的估計案例例4-10.某企業(yè)質(zhì)量部部長希望了解企業(yè)兩條生產(chǎn)線生產(chǎn)的燈泡平均壽命是否存在差異。假定兩條生產(chǎn)線生產(chǎn)的燈泡的壽命均呈正態(tài)分布,方差分別為。隨機(jī)從兩條生產(chǎn)線生產(chǎn)的燈泡中各抽取20只和25只,測得平均壽命分別為1478小時和1456小時,在α=0.05時,求出兩條生產(chǎn)線生產(chǎn)的燈泡平均壽命差異的區(qū)間估計。解:

即μ1-μ2的95%的置信區(qū)間為(9.8,34.2)。返回目錄28兩個總體均值之差的估計案例例4-10.某企業(yè)質(zhì)量部部長希望了28兩個總體方差未知的情況兩個總體均遵從正態(tài)分布,且未知時,為了給出μ1-μ2的估計我們必須利用兩個樣本中關(guān)于σ2的信息聯(lián)合大體估計σ2,這個聯(lián)合估計量為:這時兩個總體均值之差μ1-μ2的1-α置信水平下的置信區(qū)間為:返回目錄29兩個總體方差未知的情況兩個總體均遵從29方差不等的情況當(dāng)兩個總體均遵從正態(tài)分布,,且方差未知時,自然用抽樣分布不遵從自由度為(n1+

n2-2)的t分布,而近似遵從自由度為f的t分布。f的計算公式為:這樣兩個總體均值之差μ1-μ2的1-α置信水平下的置信區(qū)間為:返回目錄30方差不等的情況當(dāng)兩個總體均遵從正態(tài)分布,304.5兩個總體比例之差的區(qū)間估計設(shè)兩個正態(tài)總體的比例分別為p1和p2,為了估計p1-p2,分別從兩個總體中各隨機(jī)抽取容量為n1和n2的兩個隨機(jī)樣本,并計算兩個樣本的比例,可以證明,p1-p2的置信度為1-α的置信區(qū)間為:返回目錄314.5兩個總體比例之差的區(qū)間估計設(shè)兩個正態(tài)總體的比例314.6正態(tài)總體方差的區(qū)間估計設(shè)x1,x2,…,xn來自均值為μ,方差為σ2的正態(tài)總體,μ、σ2均未知,則σ2的估計量為s2,且利用χ2(n-1)分布可以得到σ2的1-α置信區(qū)間為:其中分別是χ2(n-1)分布的1-α/2分位數(shù)與α/2分位數(shù)。返回目錄324.6正態(tài)總體方差的區(qū)間估計設(shè)x1,x2,…,xn32總體方差區(qū)間估計的案例例4-14.對某種金屬材料的10個樣品所組成的一個隨機(jī)樣本作抗拉強(qiáng)度試驗。從試驗數(shù)據(jù)算出方差為4,試求σ2的95%置信區(qū)間。解:設(shè)該種金屬材料的抗拉強(qiáng)度遵從正態(tài)分布,則此時σ2的置信度為95%的置信區(qū)間為:即[1.8925,13.3314],而標(biāo)準(zhǔn)差σ的95%的置信區(qū)間為:返回目錄33總體方差區(qū)間估計的案例例4-14.對某種金屬材料的10個樣品334.7兩個正態(tài)總體方差比的區(qū)間估計實際問題中,我們需要比較兩種測量工具的精度;比較兩個生產(chǎn)過程的穩(wěn)定性;比較兩個評委評分的變異性等等,這些都可轉(zhuǎn)化為兩個總體方差的比較??梢宰C明:置信度為1-α的的區(qū)間估計為:注意:F分布的分位數(shù)Fα(n1,n2)=1/F1-α(n2,n1),查表時有用。返回目錄344.7兩個正態(tài)總體方差比的區(qū)間估計實際問題中,我們需要344.8有關(guān)區(qū)間估計的Minitab軟件實現(xiàn)一.點估計的軟件實現(xiàn):1.例4-1的軟件實現(xiàn),輸入數(shù)據(jù)見表:2.點擊Stat——BasicStatistics——DisplayDescriptiveStatistics返回目錄354.8有關(guān)區(qū)間估計的Minitab軟件實現(xiàn)一.點估計的軟353.彈出如下對話框,選擇要分析的變量進(jìn)入Variables框中,點擊OK鍵,結(jié)果如下:均值,標(biāo)準(zhǔn)差:返回目錄363.彈出如下對話框,選擇要分析的變量進(jìn)入Variables框364.此外,還可以點擊Stat——BasicStatistics——StoreDescriptiveStatistics,彈出如下對話框:5.選擇變量后,點擊Statistics,彈出下面的復(fù)選框,可選擇你需要估計的參數(shù)值,點擊OK得到結(jié)果:返回目錄374.此外,還可以點擊Stat——BasicStatisti37比例的區(qū)間估計:方差之比的區(qū)間估計:二.均值及方差的區(qū)間估計:單樣本方差已知的均值區(qū)間估計:單樣本方差未知的均值區(qū)間估計:兩樣本均值之差的區(qū)間估計:返回目錄38比例的區(qū)間估計:方差之比的區(qū)間估計:二.均值及方差的區(qū)間估計3817十二月2022六西格瑪數(shù)據(jù)分析技術(shù)417十二月2022六西格瑪數(shù)據(jù)分析技術(shù)439第4章參數(shù)估計4.1參數(shù)估計的基本概念4.2總體均值和總體比例的區(qū)間估計4.3樣本容量的確定4.4兩總體均值之差的區(qū)間估計4.5兩總體比例之差的區(qū)間估計4.6正態(tài)總體方差的區(qū)間估計4.7兩個正態(tài)總體方差比的區(qū)間估計4.8有關(guān)區(qū)間估計的Minitab軟件實現(xiàn)小組討論與練習(xí)σσσσσσσσσ返回目錄40第4章參數(shù)估計4.1參數(shù)估計的基本概念σσσσσσ40本章目標(biāo)1.掌握參數(shù)估計的基本概念2.建立起在管理中運用參數(shù)估計的思想3.能運用Minitab實現(xiàn)各種區(qū)間估計的計算4.掌握樣本容量的確定方法5.能在管理實踐中運用參數(shù)估計方法返回目錄41本章目標(biāo)1.掌握參數(shù)估計的基本概念返回目錄3414.1

參數(shù)估計的基本概念

參數(shù)估計有兩大類,一種叫點估計,一種叫區(qū)間估計點估計是利用樣本的信息對所感興趣的參數(shù)估計出一個數(shù)值區(qū)間估計包含了兩個數(shù)值,對應(yīng)著數(shù)軸上的一個區(qū)間,所以稱為區(qū)間估計點估計的方法最常用的有兩種:矩估計法極大似然估計法對一個估計優(yōu)良性的評價有一些相應(yīng)的評價準(zhǔn)則返回目錄424.1參數(shù)估計的基本概念參數(shù)估計有兩大類,一種叫點估42對總體參數(shù)的估計,人們最容易想到的方法就是矩估計法,即用樣本矩估計總體相應(yīng)的矩,用樣本矩的函數(shù)估計總體相應(yīng)矩的函數(shù)。矩是指以期望值為基礎(chǔ)而定義的數(shù)字特征,例如均值、方差、協(xié)方差等。最常用的矩估計有:用樣本均值估計總體均值,用樣本標(biāo)準(zhǔn)差估計總體標(biāo)準(zhǔn)差。例4-1.已知某種燈泡的壽命X~N(μ,σ2),其中μ,σ2均未知,今隨機(jī)抽取4只燈泡,測得壽命(單位:小時)為1502,1453,1367,1650。試估計μ,σ。矩估計法返回目錄43對總體參數(shù)的估計,人們最容易想到的方法就是矩估計法,即用樣本43矩估計法(續(xù))解:因為μ是全體燈泡的平均壽命,為樣本的平均壽命,很自然地會想到用去估計μ;同理用s去估計σ。由于例4-2.設(shè)樣本x1,x2,…,xn來自參數(shù)為λ的泊松分布。由于E(X)=D(X)=λ,因而與s2都可以作為λ的矩估計值。由例4-2可以看出E(X)=D(X)=λ,這表明總體均值與方差相等,但在實際問題中與s2不見得一樣,因而矩估計的結(jié)果不惟一。返回目錄44矩估計法(續(xù))解:因為μ是全體燈泡的平均壽命,為樣本的平均44極大似然估計

極大似然估計是利用總體的分布密度或概率分布的表達(dá)式及其樣本所提供的信息建立求未知參數(shù)估計量的一種方法。極大似然估計好多初學(xué)者覺得難以理解,我們用下面的說法幫助理解:在產(chǎn)品檢驗中,有說這批產(chǎn)品的次品率可能是1/10000,也有說次品率可能是1/100。如果你在這批產(chǎn)品中隨機(jī)抽取一件,竟然就是次品,自然應(yīng)當(dāng)認(rèn)為這批產(chǎn)品的次品率最有可能是1/100而不是1/10000。把這種考慮問題的方法一般化,就概括出極大似然估計方法。返回目錄45極大似然估計極大似然估計是利用總體的分布密度或概率分布的45極大似然估計(續(xù)1)

設(shè)總體X的分布已知,未知參數(shù)為θ,假定其分布密度族為f(x;θ);假設(shè)對總體X的n次觀測結(jié)果為(x1,x2,…,xn)。應(yīng)在一切θ中選取使樣本(X1,X2,…,Xn)落在點(x1,x2,…,xn)附近概率最大的作為未知參數(shù)θ真值的估計值,即選取使:其中稱為似然函數(shù),它是樣本的聯(lián)合概率密度函數(shù)。返回目錄46極大似然估計(續(xù)1)設(shè)總體X的分布已知,未知參數(shù)為θ,46極大似然估計(續(xù)2)

一般情況下,我們用求解似然方程的方法進(jìn)行極大似然估計,具體步驟是:1.由總體分布導(dǎo)出樣本的聯(lián)合概率密度;2.把樣本聯(lián)合概率密度中自變量x1,x2,…,xn看成已知常數(shù),而把參數(shù)看作變量,得到似然函數(shù);3.用微分原理求似然函數(shù)的最大值點;4.在最大值點的表達(dá)式中,代入樣本值就得參數(shù)的估計值??梢宰C明:若x1,x2,…,xn來自正態(tài)總體N(μ,σ2),則:返回目錄47極大似然估計(續(xù)2)一般情況下,我們用求解似然方程的方法47例4-3.設(shè)某種品牌的電視機(jī)的首次故障時間遵從指數(shù)分布f(t)=λe-λt,t>0,共測試了7臺電視機(jī),獲得相應(yīng)的首次故障時間(單位:萬小時)為:1.49,3.65,0.26,4.25,5.43,6.97,8.09求參數(shù)的λ估計值。解:樣本x1,x2,…,xn的聯(lián)合密度用均值來表示,就有:,將看作常數(shù),λ看作變量,可得似然函數(shù),進(jìn)而取對數(shù),求微商,解方程可得:對本例而言,就有:極大似然估計(續(xù)3)返回目錄48例4-3.設(shè)某種品牌的電視機(jī)的首次故障時間遵從指數(shù)分布f(t48點估計的優(yōu)良性準(zhǔn)則不同的參數(shù)估計方法,可得到不同的估計量,不同的估計量誰優(yōu)誰劣?我們有一些相應(yīng)的評價準(zhǔn)則。在6σ管理中,最常用的點估計優(yōu)良性準(zhǔn)則有兩個:一個是無偏性,另一個是有效性。無偏性:設(shè)是參數(shù)θ的一個估計量,如果,則稱是參數(shù)θ的無偏估計。無偏性實際上是指對于一個估計量,屢次變更數(shù)據(jù)反復(fù)求估計值時,估計值的平均與真值相一致,即盡管有時比θ大,有時比θ小,總的看來,它的“平均值”就是θ??梢宰C明:許多情況下,是μ的無偏估計,s是σ的無偏估計。然而,在正態(tài)分布中σ的極大似然估計就不是無偏估計。返回目錄49點估計的優(yōu)良性準(zhǔn)則不同的參數(shù)估計方法,可得到不同的估計量,不49有效性無偏性只考慮估計值的平均結(jié)果是否等于待估參數(shù)的真值,而不考慮每個估計值與待估參數(shù)真值之間偏差的大小和散布程度。實際問題的研究中,不僅希望估計是無偏的,更希望這些估計值的偏差盡可能地小。設(shè)都是參數(shù)θ的無偏估計量,如果且至少有一個,嚴(yán)格不等號成立,則稱比有效。設(shè)、x1都是μ的無偏估計,但樣本均值的方差為σ2/n,x1的方差為σ2,只要n>1,作為μ的估計值,比x1就更有效。返回目錄50有效性無偏性只考慮估計值的平均結(jié)果是否等于待估參數(shù)的真值,而50區(qū)間估計點估計沒有給出估計的精度和可靠程度,區(qū)間估計解決了這一問題。設(shè)θ是總體的一個待估參數(shù),從總體中獲得容量為n的樣本是x1,x2,…,xn,對給定的α(0<α<1),有統(tǒng)計量:θL=θL(x1,x2,…,xn)與θU=θU(x1,x2,…,xn)若對任意θ有P(θL≤θ≤θU)=1-α,則稱隨機(jī)區(qū)間[θL,θU]是θ的置信水平為1-α的置信區(qū)間。

θL與θU分別稱為1-α的置信下限與置信上限,α稱為顯著性水平。返回目錄51區(qū)間估計點估計沒有給出估計的精度和可靠程度,區(qū)間估計解決了這51區(qū)間估計(續(xù))置信區(qū)間的大小表達(dá)了區(qū)間估計的精確性,置信水平表達(dá)了區(qū)間估計的可靠性,1-α是區(qū)間估計的可靠概率;而顯著性水平α表達(dá)了區(qū)間估計的不可靠的概率。如果[θL,θU]是置信水平為0.95的置信區(qū)間,由于隨機(jī)區(qū)間[θL,θU]會隨樣本觀察值的不同而不同,它有時包含了參數(shù)θ,有時沒有包含θ,但是用這種方法作參數(shù)的區(qū)間估計時,100次中大約有95個區(qū)間能包含著參數(shù)θ,大約有5個區(qū)間沒能包含θ。在進(jìn)行區(qū)間估計時,必須同時考慮置信概率與置信區(qū)間兩個方面。即置信概率定的越大,則置信區(qū)間相應(yīng)也大。這兩者要結(jié)合考慮,才更為實際。返回目錄52區(qū)間估計(續(xù))置信區(qū)間的大小表達(dá)了區(qū)間估計的精確性,置信水平52總體均值的區(qū)間估計當(dāng)X~N(μ,σ2)時,x1,x2,…,xn是來自該正態(tài)總體的隨機(jī)樣本,。當(dāng)總體方差σ2已知時,μ的1-α置信區(qū)間為:

其中Z1-α/2是標(biāo)準(zhǔn)正態(tài)分布的1-α/2分位數(shù)。當(dāng)總體方差σ2未知時,σ用其s代替,用t分布,μ的1-α置信區(qū)間為:其中t1-α/2(n-1)表示是自由度為n-1的t分布的1-α/2分位數(shù)4.2總體均值和總體比例的區(qū)間估計返回目錄53總體均值的區(qū)間估計4.2總體均值和總體比例的區(qū)間估計53在統(tǒng)計推斷中常常會碰到自由度這一概念,不少人對這一概念不好理解。如果我們有10個數(shù),而且你知道了均值和其中的9個數(shù)的值,那么你就可以推出第10個數(shù)。讓10個人挑選10支不同顏色的鉛筆,只有9人有自由挑選的可能,因為當(dāng)這9人都挑好之后,你別無選擇!因此這個問題的自由度為9。自由度可以理解為在研究問題中,可以自由取值的數(shù)據(jù)的個數(shù)。關(guān)于自由度

返回目錄54關(guān)于自由度返回目錄1654例4-4.σ2已知時,μ的區(qū)間估計某種零件的長度遵從正態(tài)分布,從該批零件中隨機(jī)抽取9件,測得其平均長度為21.4mm。已知總體標(biāo)準(zhǔn)差σ=0.15mm,試建立該種零件平均長度的置信區(qū)間,給定的置信水平為0.95。解:已知X~N(μ,0.152)時,=2.14,n=9,1-α=0.95,α=0.05,查標(biāo)準(zhǔn)正態(tài)分布表可得1-α/2的分位數(shù),Z1-α/2=1.96;α=0.01時,Z1-α/2=2.58;α=0.10時,Z1-α/2=1.64。這是一些常用值,請讀者記住。

我們可以95%的概率保證這種零件的平均長度在(21.302,21.498)之間。返回目錄55例4-4.σ2已知時,μ的區(qū)間估計某種零件的長度遵從正態(tài)分布55例4-5.σ2未知時,μ的區(qū)間估計為了估計各省市電視臺在某黃金時間一分鐘廣告的平均費用,隨機(jī)調(diào)查了20個電視臺,他們每分鐘的廣告費=25000元,s=8000元。假定所有電視臺的廣告費近似遵從正態(tài)分布,試求總體均值95%的區(qū)間估計。解:這是總體方差σ2未知的情況。已知=25000,s=8000,n=20,α=0.05,則t1-α/2(n-1)=t0.975(19)=2.093;于是

從而,我們有95%的把握認(rèn)為所有省市電視臺在黃金時間播出的廣告一分鐘的平均費用在(21255.93,28744.07)之間。返回目錄56例4-5.σ2未知時,μ的區(qū)間估計為了估計各省市電視臺在某黃56n≥30時均值的區(qū)間估計前邊討論的是當(dāng)總體為正態(tài)分布時,μ的區(qū)間估計,然而總體不是正態(tài)分布時,如果樣本容量n超過30,則我們可根據(jù)中心極限定理知:仍近似遵從正態(tài)分布,因而仍可用正態(tài)分布總體時的均值μ的區(qū)間估計方法。例4-6.某航空公司在過去飛行記錄中,隨機(jī)抽取了225個航班,航班空位數(shù)的樣本均值=11.6,標(biāo)準(zhǔn)差=4.1,試求過去一年所有航班的平均空位數(shù)的置信區(qū)間。(α=0.10)解:所有航班空位數(shù)的分布未知,且總體標(biāo)準(zhǔn)差未知,但n=225,因而仍可用做區(qū)間估計。代入其具體數(shù)據(jù)得[11.15,12.05],也即該公司有90%的把握認(rèn)為過去的一年該公司的平均空位數(shù)在11.15到12.05之間。返回目錄57n≥30時均值的區(qū)間估計前邊討論的是當(dāng)總體為正態(tài)分布時,μ的57總體比例的區(qū)間估計我們常需要估計總體中具有某種特征的單位占總體全部單位的比例一批產(chǎn)品中,合格品的比例;顧客滿意度調(diào)查中,有意見顧客的比例等。記總體比例為p,樣本比例為??梢宰C明,當(dāng)樣本容量足夠大時,若np>5,n(1-p)>5,則可用正態(tài)分布去近似二項分布,因而有:因此由正態(tài)分布構(gòu)造總體比例p的置信區(qū)間為:返回目錄58總體比例的區(qū)間估計我們常需要估計總體中具有某種特征的單位占總58總體比例置信區(qū)間估計的例子例4-7.某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機(jī)抽選了200人組成一個樣本。訪問結(jié)果,有140人說他的離開是由于企業(yè)管理缺乏人性化。試對由于這種原因而離開企業(yè)的人員的真正比例進(jìn)行估計(α=0.05)。解:已知n=200,=0.7,=140>5,=60>5,Z1-α/2=1.96故該企業(yè)職工認(rèn)為企業(yè)管理缺乏人性化而離開的比例為63.6%~76.4%。返回目錄59總體比例置信區(qū)間估計的例子例4-7.某企業(yè)在一項關(guān)于職工流動594.3樣本容量的確定在研究實際問題時,需要自己動手設(shè)計調(diào)查方案,這時如何確定樣本容量大有學(xué)問。如果樣本量太大,必然費用增加;如果樣本量過小,估計誤差又會增大。這就看你需要什么樣的估計精度,即你想構(gòu)造多寬的估計區(qū)間?對于你所確定的置信區(qū)間,你想要多大的置信度?估計總體均值時,樣本容量的確定在總體均值的區(qū)間估計里,置信區(qū)間是:該區(qū)間估計的精度為

,是區(qū)間估計長度的一半。返回目錄604.3樣本容量的確定在研究實際問題時,需要自己動手設(shè)60樣本容量的確定(續(xù)1)如果我們希望估計值與其真實值之間的誤差或估計的精度在置信度(1-α)下不超過某一數(shù)值B(允許誤差),則可從下面的方程確定n。解之得:只要我們知道了Z1-α/2,σ和允許誤差,就可具體算出樣本容量n。如果算出的n不是整數(shù),就去超過該小數(shù)的最接近的整數(shù)即可。返回目錄61樣本容量的確定(續(xù)1)如果我們希望估計值與其真實值之間的返回61樣本容量的確定(續(xù)2)由樣本容量的確定公式,你可發(fā)現(xiàn)幾個量之間的一些關(guān)系:1.總體方差越大,必要的樣本容量n越大。2.必要樣本容量n反比例于允許誤差B。即在給定的置信水平下,允許誤差越大,樣本容量就可以越??;允許誤差越小,樣本容量就必須加大。3.必要樣本容量n與正態(tài)分布Z1-α/2分位數(shù)(也稱可靠性系數(shù))成正比。即:我們要求的可靠程度越高,樣本容量就應(yīng)越大;如果要求的可靠程度越低,樣本容量就可以小些。返回目錄62樣本容量的確定(續(xù)2)由樣本容量的確定公式62樣本容量的確定(續(xù)3)例4-8.某廣告公司想估計某類商場去年所花的廣告費平均有多少。經(jīng)驗表明,總體方差約為1800000。如置信度取95%,并要使估計值處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)取多大的樣本?解:已知σ2=1800000,α=0.05,Z1-α/2=1.96,B=500即這家廣告公司應(yīng)抽取28個商場作樣本。返回目錄63樣本容量的確定(續(xù)3)例4-8.某廣告公司想估計某類商場去年63樣本容量的確定(續(xù)4)估計總體比例時,樣本容量n的計算公式是:例4-9.某市場調(diào)查公司想估計某地區(qū)有數(shù)碼相機(jī)的家庭所占的比例。該公司希望對p的估計誤差不超過0.05,要求的可靠度為95%,應(yīng)取多大的樣本?沒有可利用的估計值。解:通常在此類問題研究中,無法得到值時,可以用=0.5計算。已知B=0.05,α=0.05,Z1-α/2=1.96,=0.5即抽取385戶調(diào)查,就可以95%的可靠度保證估計誤差不超過0.05。返回目錄64樣本容量的確定(續(xù)4)估計總體比例時,樣本容量n的計算公式是644.4兩個總體均值之差的區(qū)間估計某化工廠需要比較由兩個供應(yīng)商提供的原材料所帶來的產(chǎn)量,某企業(yè)質(zhì)量管理部的部長希望了解車間內(nèi)兩條生產(chǎn)線生產(chǎn)的燈泡平均壽命是否存在差異等。這些都是要對兩個總體均值之差作區(qū)間估計。兩個總體的方差已知情況下,兩總體均值差異μ1-μ2的區(qū)間估計:其中,分別為來自兩個總體的樣本均值,n1,n2為抽自兩總體的樣本容量,分別是兩總體的方差。只要樣本容量足夠大,對于總體分布是否正態(tài)都可適用。返回目錄654.4兩個總體均值之差的區(qū)間估計某化工廠需要比較由兩65兩個總體均值之差的估計案例例4-10.某企業(yè)質(zhì)量部部長希望了解企業(yè)兩條生產(chǎn)線生產(chǎn)的燈泡平均壽命是否存在差異。假定兩條生產(chǎn)線生產(chǎn)的燈泡的壽命均呈正態(tài)分布,方差分別為。隨機(jī)從兩條生產(chǎn)線生產(chǎn)的燈泡中各抽取20只和25只,測得平均壽命分別為1478小時和1456小時,在α=0.05時,求出兩條生產(chǎn)線生產(chǎn)的燈泡平均壽命差異的區(qū)間估計。解:

即μ1-μ2的95%的置信區(qū)間為(9.8,34.2)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論