第八章 區(qū)間估計_第1頁
第八章 區(qū)間估計_第2頁
第八章 區(qū)間估計_第3頁
第八章 區(qū)間估計_第4頁
第八章 區(qū)間估計_第5頁
已閱讀5頁,還剩91頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

區(qū)間估計第八章區(qū)間估計第8

章置信區(qū)間估計1.區(qū)間估計的基本概念2.置信區(qū)間的基本概念3.總體均值的區(qū)間估計4.總體比例的區(qū)間估計5.樣本容量的確定學(xué)習(xí)目標(biāo)1.總體均值的區(qū)間估計2.總體比例的區(qū)間估計3.樣本容量的確定第一節(jié)區(qū)間估計

(intervalestimate)如前所述,點估計是用一個點(即一個數(shù))去估計未知參數(shù)。顧名思義,區(qū)間估計就是用一個區(qū)間去估計未知參數(shù),即把未知參數(shù)值估計在某兩個界限之間。例如,估計明年GDP增長在7%~8%之間,比說增長8%更容易讓人們相信,因為給出7%~8%已把可能出現(xiàn)的誤差考慮到了。所謂區(qū)間估計,就是在點估計的基礎(chǔ)上,用一個具有一定可靠程度的區(qū)間范圍來估計總體參數(shù)。區(qū)間估計

(intervalestimate)我們通過把點估計值減去和加上一個被稱為邊際誤差或極限誤差(估計誤差)的值,可以構(gòu)建總體參數(shù)的一個區(qū)間估計。形式如下:

點估計值±邊際誤差(極限誤差)邊際誤差或極限誤差是指以樣本統(tǒng)計量估計總體參數(shù)時所允許的最大誤差范圍。體現(xiàn)了估計精度的高低。邊際誤差的確定以及所構(gòu)造區(qū)間的可靠程度的分析就需要借助統(tǒng)計量的抽樣分布這方面的重要知識。區(qū)間估計

(intervalestimate)與點估計不同,進行區(qū)間估計時,根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量。下面以總體均值的區(qū)間估計為例來說明區(qū)間估計的基本原理。我們已經(jīng)知道,無論總體分布如何,在大樣本的條件下,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即,

x

~N(μ,σ2/n)區(qū)間估計的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x區(qū)間估計的圖示Z01.96-1.96Tm+=sXZX95%2.5%2.5%區(qū)間估計的圖示(未知)x1.96

x95%1.96

xx2±x1±x3±1.96

x1.96

x1.96

x邊際誤差(極限誤差)邊際誤差(極限誤差)區(qū)間估計

(intervalestimate)從同一總體按同一樣本容量可以抽取很多種樣本組合。由不同的樣本組合得到不同的樣本均值,每個樣本均值都可加減1.96x構(gòu)成一個區(qū)間。但這些區(qū)間并不是都能把總體均值包含在內(nèi)。只有在抽樣分布圖中處在陰影區(qū)域的任意一個樣本均值才能夠構(gòu)造一個包含總體均值在內(nèi)的區(qū)間。由于所有可能的樣本均值有95%處在陰影區(qū)域內(nèi),故樣本均值加減1.96x所形成的所有區(qū)間中也有95%的區(qū)間會包括總體均值在內(nèi)。一般地,如果將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,所有可能構(gòu)建的區(qū)間中能夠包含真實總體參數(shù)的區(qū)間個數(shù)占所有可能區(qū)間的比例稱為置信水平。也稱為置信度或置信系數(shù)。(前面的95%就是一個置信水平)一般來說,置信度可以用(1-α)×100%表示,其中α是區(qū)間估計的顯著性水平,是所有可能構(gòu)建的區(qū)間中不包含真實總體參數(shù)的區(qū)間個數(shù)占所有可能區(qū)間的比例。α的取值大小由實際問題確定。經(jīng)常取為0.01,0.05,0.10,相應(yīng)的常用置信水平為

99%,95%,90%。第二節(jié)置信水平

(confidencelevel)

置信區(qū)間是由樣本估計量構(gòu)造出的總體參數(shù)在一定置信水平下的估計區(qū)間。區(qū)間的最小值稱為置信下限,最大值稱為置信下限。如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間稱為置信水平為95%的置信區(qū)間。同樣,其他置信水平的區(qū)間也可以用類似的方式進行表述置信區(qū)間的表述

(confidenceinterval)總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個隨機區(qū)間,它會因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù)。實際估計時往往只抽取一個樣本,此時所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(比如95%)下的置信區(qū)間,這是一個特定區(qū)間,而不是一個隨機區(qū)間,所以無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值。我們只能希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個。置信區(qū)間的表述

(confidenceinterval)一個特定的區(qū)間總是“包含”或“絕對不包含”參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問題。置信水平只是告訴我們在多次估計得到的區(qū)間中大概有多少個區(qū)間包含了參數(shù)的真值,而不是針對所抽取的這個樣本所構(gòu)建的區(qū)間而言的。置信區(qū)間的表述

(confidenceinterval)影響區(qū)間寬度的因素1. 數(shù)據(jù)的離散程度,用來測度樣本容量,3. 置信水平(1-),影響

Z的大小置信水平與置信區(qū)間的關(guān)系

(區(qū)間估計的精度與可靠度的關(guān)系)第三節(jié)總體均值和總體比例

的區(qū)間估計一.總體均值的區(qū)間估計二.總體比例的區(qū)間估計樣本容量的確定總體均值的區(qū)間估計

總體均值的區(qū)間估計

(2已知)總體均值的置信區(qū)間

(2已知)1. 假定條件總體服從正態(tài)分布,且總體方差(2)已知如果不是正態(tài)分布,可以由正態(tài)分布來近似

(n

30)使用正態(tài)分布統(tǒng)計量Z總體均值在1-置信水平下的置信區(qū)間為

點估計區(qū)間估計總體均值的區(qū)間估計

(正態(tài)總體:實例)解:已知X~N(,0.152),x=2.14,n=9,1-=0.95,Z/2=1.96

總體均值的置信區(qū)間為我們可以95%的概率保證該種零件的平均長度在21.302~21.498mm之間【例】某種零件長度服從正態(tài)分布,從該批產(chǎn)品中隨機抽?。辜瑴y得其平均長度為21.4mm。已知總體標(biāo)準(zhǔn)差

=0.15mm,試建立該種零件平均長度的置信區(qū)間,給定置信水平為0.95??傮w均值的區(qū)間估計

(非正態(tài)總體:實例)解:已知x=26,=6,n=100,1-=0.95,Z/2=1.96我們可以95%的概率保證平均每天參加鍛煉的時間在24.824~27.176分鐘之間【例】某大學(xué)從該校學(xué)生中隨機抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時間為26分鐘。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間(已知總體方差為36小時)??傮w均值的區(qū)間估計

(2未知)總體均值的置信區(qū)間

(2未知)1. 假定條件總體方差(2)未知總體必須服從正態(tài)分布使用t分布統(tǒng)計量3.總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計

(實例)解:已知X~N(,2),x=50,s=8,n=25,1-=0.95,t/2=2.0639。我們可以95%的概率保證總體均值在46.69~53.30之間【例】從一個正態(tài)總體中抽取一個隨機樣本,n=25

,其均值`x=

50

,標(biāo)準(zhǔn)差s=8。建立總體均值m

的95%的置信區(qū)間??傮w均值區(qū)間估計小結(jié)

總體均值區(qū)間估計小結(jié)

總體均值區(qū)間估計小結(jié)

總體比例的區(qū)間估計總體比例的區(qū)間估計我們在實際工作中時常會碰到對總體比例的估計問題。例如:企業(yè)領(lǐng)導(dǎo)想知道本企業(yè)生產(chǎn)的產(chǎn)品中合格品率是多少?商店經(jīng)理想了解對他們服務(wù)滿意的顧客在全部顧客中所占的比率等等。想了解某人群中男女的比例是多少?想了解某產(chǎn)品的普及率是多少?民意調(diào)查中支持某候選人的比例是多少?總體比例的置信區(qū)間1. 假定條件總體服從二項分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計量Z3.總體比例P

的置信區(qū)間為總體比例的置信區(qū)間總體比例的置信區(qū)間

(實例)解:已知n=200,=0.7,n=140>5,n(1-)=60>5,=0.95,Z/2=1.96p

p

p

我們可以95%的概率保證該企業(yè)職工由于同管理人員不能融洽相處而離開的比例在63.6%~76.4%之間【例】某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機選取了200人組成一個樣本。在對其進行訪問時,有140人說他們離開該企業(yè)是由于同管理人員不能融洽相處。試對由于這種原因而離開該企業(yè)的人員的真正比例構(gòu)造95%的置信區(qū)間??傮w比例的置信區(qū)間總體方差的區(qū)間估計1. 估計一個總體的方差或標(biāo)準(zhǔn)差2. 假設(shè)總體服從正態(tài)分布總體方差

2

的點估計量為s2,且4.總體方差在1-置信水平下的置信區(qū)間為總體方差的區(qū)間估計

(圖示)221-2總體方差的1-的置信區(qū)間自由度為n-1的2總體方差的區(qū)間估計

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間25袋食品的重量112.5101.0103.0102.0100.5102.6107.5

95.0108.8115.6100.0123.5102.0101.6102.2116.6

95.4

97.8108.6105.0136.8102.8101.5

98.4

93.3總體方差的區(qū)間估計

(例題分析)解:已知n=25,1-=95%,根據(jù)樣本數(shù)據(jù)計算得

s2=93.21

2置信度為95%的置信區(qū)間為

該企業(yè)生產(chǎn)的食品總體重量標(biāo)準(zhǔn)差的的置信區(qū)間為7.54g~13.43g一個總體參數(shù)的區(qū)間估計

(小結(jié))樣本容量的確定樣本容量的確定前面的分析都是在給定的樣本容量和樣本數(shù)據(jù)下求置信區(qū)間。但在實際應(yīng)用中,應(yīng)當(dāng)在隨機抽樣前就確定所需要抽樣的樣本容量。抽取的樣本容量過大,雖然可以提高統(tǒng)計推斷的精度,但將增加不必要的人力、物力、費用和時間開支。如果抽取的樣本容量過小,則又會使統(tǒng)計推斷的誤差過大,推斷結(jié)果就達不到必要的精度要求。樣本容量的確定

由前面的論述,我們已知參數(shù)估計中的精度要求與可靠性要求常常是一對矛盾。但是,通過增加樣本容量N有可能降低枰相平均數(shù)的標(biāo)準(zhǔn)差,從而實現(xiàn)既保證一定的估計精度,又具有較高的置信度的目的,這時,需要考慮在給定的置信度與極限誤差的前提下,樣本容量N究竟取多大合適?確定樣本容量的原則:在滿足所需要置信度和允許誤差條件(置信區(qū)間的d值)下,確定所需要的最低樣本容量。估計總體均值時樣本容量的確定E估計總體均值時樣本容量的確定(一)總體方差已知,有放回的抽樣這時有:上式兩邊平方整理得(一)總體方差已知,不放回的抽樣這時有:上式兩邊平方整理得估計總體均值時樣本量的確定1。樣本量n與總體方差2、估計誤差E、可靠性系數(shù)Z或t之間的關(guān)系為與總體方差成正比與估計誤差的平方成反比與可靠性系數(shù)成正比估計總體均值時樣本量的確定樣本量的圓整法則:當(dāng)計算出的樣本量不是整數(shù)時,將小數(shù)點后面的數(shù)值一律進位成整數(shù),如24.68取25,24.32也取25等等樣本容量的確定

(實例)解:已知2=1800000,=0.05,Z/2=1.96,=500

應(yīng)抽取的樣本容量為【例】一家廣告公想估計某類商店去年所花的平均廣告費用有多少。經(jīng)驗表明,總體方差約為1800000元。如置信度取95%,并要使估計處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)抽多大的樣本?根據(jù)比例區(qū)間估計公式可得樣本容量n為估計總體比例時樣本容量的確定

p^其中:(一)有放回抽樣估計總體比例時樣本容量的確定(二)不放回抽樣使用上述公式應(yīng)注意的問題

1.計算樣本容量時,總體的方差與成數(shù)常常是未知的,這時可用有關(guān)資料替代:一是用歷史資料已有的方差與成數(shù)代替;二是在進行正式抽樣調(diào)查前進行幾次試驗性調(diào)查,用試驗中方差的最大值代替總本方差;三是比例方差在完全缺乏資料的情況下,用就比例方差的最大可能值0.25代替。使用上述公式應(yīng)注意的問題

2.如果進行一次抽樣調(diào)查,需要同時估計總體均值與比例,可用上面的公式同時度算出兩個樣本容量,取其中較大的結(jié)果,同時滿足兩方面的需要。3。上面公式計算結(jié)果如果帶小數(shù),這時樣本容量不按四舍五入法則取整數(shù),取比這個數(shù)大的最小整數(shù)代替。例如,計算得到n=56.03,那么樣本容量取57,而不是56。樣本容量的確定

(實例)【例】一家市場調(diào)研公司想估計某地區(qū)有彩色電視機的家庭所占的比例。該公司希望對比例p的估計誤差不超過0.05,要求的可靠程度為95%,應(yīng)抽多大容量的樣本(沒有可利用的p估計值)。解:

已知=0.05,=0.05,Z/2=1.96,當(dāng)p未知時用最大方差0.25代替^應(yīng)抽取的樣本容量為估計總體比例時樣本量的確定

(例題分析)【例】根據(jù)以往的生產(chǎn)統(tǒng)計,某種產(chǎn)品的合格率約為90%,現(xiàn)要求估計誤差為5%,在求95%的置信區(qū)間時,應(yīng)抽取多少個產(chǎn)品作為樣本?解:已知=90%,=0.05,z/2=1.96,E=5%

應(yīng)抽取的樣本量為

應(yīng)抽取139個產(chǎn)品作為樣本第四節(jié)兩個總體均值及兩個

總體比例之差估計一.兩個總體均值之差估計二.兩個總體比例之差估計兩個總體均值之差的估計兩個樣本均值之差的抽樣分布

m1s1總體1s2

m2總體2抽取簡單隨機樣樣本容量n1計算X1抽取簡單隨機樣樣本容量n2計算X2計算每一對樣本的X1-X2所有可能樣本的X1-X2m1-m2抽樣分布兩個總體均值之差的估計

(12、22

已知)1. 假定條件兩個樣本是獨立的隨機樣本兩個總體都服從正態(tài)分布若不是正態(tài)分布,可以用正態(tài)分布來近似(n130和n230)兩個獨立樣本均值之差的抽樣分布服從正態(tài)分布,其期望值為其標(biāo)準(zhǔn)誤差為兩個總體均值之差的估計

(12、22

已知)兩個總體均值之差1-2在1-置信水平下的置信區(qū)間為使用正態(tài)分布統(tǒng)計量Z兩個總體均值之差的估計

(實例)【例】一個銀行負(fù)責(zé)人想知道儲戶存入兩家銀行的錢數(shù)。他從兩家銀行各抽取了一個由25個儲戶組成的隨機樣本,樣本均值如下:銀行A:4500元;銀行B:3250元。設(shè)已知兩個總體服從方差分別為A2=2500和B2=3600的正態(tài)分布。試求A-B的區(qū)間估計(1)置信度為95%(2)置信度為99%BA兩個總體均值之差的估計

(計算結(jié)果)解:已知

XA~N(A,2500)

XB~N(B,3600)xA=4500,xB=3250,

A2=2500

B2=3600

nA=nB

=25(1)

A-B置信度為95%的置信區(qū)間為(2)

A-B置信度為99%的置信區(qū)間為兩個總體均值之差的估計

(12、22未知,但相等)假定條件兩個總體都服從正態(tài)分布12、12未知,但12=12總體方差2的聯(lián)合估計量為估計量x1-x2的標(biāo)準(zhǔn)差為兩個總體均值之差的估計

(12、22未知,但相等)使用t

分布統(tǒng)計量兩個總體均值之差1-2在1-置信水平下的置信區(qū)間為兩個總體均值之差的估計

(實例)【例】為比較兩位銀行職員為新顧客辦理個人結(jié)算賬目的平均時間長度,分別給兩位職員隨機安排了10位顧客,并記錄下為每位顧客辦理賬單所需的時間(單位:分鐘),相應(yīng)的樣本均值和方差分別為:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位職員辦理賬單所需時間均服從正態(tài)分布,且方差相等。試求兩位職員辦理賬單的服務(wù)時間之差的95%的區(qū)間估計。21兩個總體均值之差的估計

(計算結(jié)果)解:已知

X1~N(1,2)

X2~N(2,2)x1=22.2,x2=28.5,

s12=16.63s22=18.92

n1=n2=1012=121-2置信度為95%的置信區(qū)間為兩個總體均值之差的估計

(12

、22未知,且不相等)假定條件兩個總體都服從正態(tài)分布12、12未知,且1212使用的統(tǒng)計量為自由度兩個總體均值之差的估計

(12、22未知,且不相等)

兩個總體均值之差1-2在1-置信水平下的置信區(qū)間為兩個總體均值之差的估計

(續(xù)前例)【例】為比較兩位銀行職員為新顧客辦理個人結(jié)算賬目的平均時間長度,分別給兩位職員隨機安排了10位顧客,并記錄下了為每位顧客辦理賬單所需的時間(單位:分鐘),相應(yīng)的樣本均值和方差分別為:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位職員辦理賬單所需時間均服從正態(tài)分布,但方差不相等。試求兩位職員辦理賬單的服務(wù)時間之差的95%的區(qū)間估計。12兩個總體均值之差的估計

(計算結(jié)果)

自由度f為1-2置信度為95%的置信區(qū)間為解:已知

X1~N(1,2)

X2~N(2,2)x1=22.2,x2=28.5,

s12=16.63s22=18.92

n1=n2=101212兩個總體比例之差的估計1. 假定條件兩個總體是獨立的兩個總體服從二項分布可以用正態(tài)分布來近似2. 兩個總體比例之差P1-P2在1-置信水平下的置信區(qū)間為兩個總體比例之差的區(qū)間估計兩個總體比例之差的估計

(實例)【例】某飲料公司對其所做的報紙廣告在兩個城市的效果進行了比較,它們從兩個城市中分別隨機地調(diào)查了1000個成年人,其中看過廣告的比例分別為p1=0.18和p2=0.14。試求兩城市成年人中看過廣告的比例之差的95%的置信區(qū)間。^^綠色健康飲品兩個總體比例之差的估計

(計算結(jié)果)P1-P2置信度為95%的置信區(qū)間為解:已知

p1=0.18,p2=0.14,1-=0.95,n1=n2=1000^^我們有95%的把握估計兩城市成年人中看過該廣告的比例之差在0.79%~7.21%之間第五節(jié)正態(tài)總體方差及兩正

態(tài)總體方差比的估計一.正態(tài)總體方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論