第二章參數(shù)估計.ppt_第1頁
第二章參數(shù)估計.ppt_第2頁
第二章參數(shù)估計.ppt_第3頁
第二章參數(shù)估計.ppt_第4頁
第二章參數(shù)估計.ppt_第5頁
已閱讀5頁,還剩101頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章 參數(shù)估計,1、 參數(shù)估計的一般問題 2、 一個總體參數(shù)的區(qū)間估計 3、 兩個總體參數(shù)的區(qū)間估計 4、 樣本容量的確定,統(tǒng)計推斷的過程,第一節(jié) 參數(shù)估計的一般問題,1、估計量與估計值 2、點估計與區(qū)間估計 3、評價估計量的標準,估計量與估計值,估計量:用于估計總體參數(shù)的隨機變量 如樣本均值,樣本比例、樣本方差等 例如: 樣本均值就是總體均值 的一個估計量 參數(shù)用 表示,估計量用 表示 估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值 如果樣本均值 x =80,則80就是的估計值,估計量與估計值 (estimator & estimated value),點估計與區(qū)間估計,參數(shù)估計的方法,點估計

2、 (point estimate),用樣本的估計量的某個取值直接作為總體參數(shù)的估計值 例如:用樣本均值直接作為總體均值的估計;用兩個樣本均值之差直接作為總體均值之差的估計 無法給出估計值接近總體參數(shù)程度的信息 雖然在重復(fù)抽樣條件下,點估計的均值可望等于總體真值,但由于樣本是隨機的,抽出一個具體的樣本得到的估計值很可能不同于總體真值 一個點估計量的可靠性是由它的抽樣標準誤差來衡量的,這表明一個具體的點估計值無法給出估計的可靠性的度量,評價估計量的標準,無偏性(unbiasedness),無偏性:估計量抽樣分布的數(shù)學(xué)期望等于被 估計的總體參數(shù),有效性(efficiency),有效性:對同一總體參數(shù)

3、的兩個無偏點估計 量,有更小標準差的估計量更有效,一致性(consistency),一致性:隨著樣本容量的增大,估計量的 值越來越接近被估計的總體參數(shù),區(qū)間估計 (interval estimate),在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到 根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量 比如,某班級平均分數(shù)在7585之間,置信水平是95%,區(qū)間估計的圖示,將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平 表示為 (1 - 為是總體參數(shù)未在區(qū)間內(nèi)的比例 常用的置信水平值有 99%,

4、 95%, 90% 相應(yīng)的 為0.01,0.05,0.10,置信水平(confidence level),由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間 統(tǒng)計學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間 用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值 我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個 總體參數(shù)以一定的概率落在這一區(qū)間的表述是錯誤的,置信區(qū)間 (confidence interval),置信區(qū)間 (95%的置信區(qū)間),重復(fù)構(gòu)造出的20個

5、置信區(qū)間,點估計值,置信區(qū)間與置信水平,影響區(qū)間寬度的因素,總體數(shù)據(jù)的離散程度,用 來測度 樣本容量n, 置信水平 (1 - ),影響 z 的大小,第二節(jié) 一個總體參數(shù)的區(qū)間估計,1、總體均值的區(qū)間估計 2、總體比例的區(qū)間估計 3、總體方差的區(qū)間估計,一個總體參數(shù)的區(qū)間估計,總體均值的區(qū)間估計 (正態(tài)總體、已知,或非正態(tài)總體、大樣本),總體均值的區(qū)間估計(大樣本),1.假定條件 總體服從正態(tài)分布,且方差() 已知 如果不是正態(tài)分布,可由正態(tài)分布來近似 (n 30) 2. 使用正態(tài)分布統(tǒng)計量 z,總體均值 在1- 置信水平下的置信區(qū)間為,數(shù)據(jù)正態(tài)性的評估方法,數(shù)據(jù)正態(tài)性的評估方法,對數(shù)據(jù)畫出頻數(shù)

6、分布的直方圖或莖葉圖 若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與上面給出的正態(tài)曲線應(yīng)該相似 求出樣本數(shù)據(jù)的四分位差Qd和標準差s,然后計算比值Qd/s 。若數(shù)據(jù)近似服從正態(tài)分布,則有 Qd/s1.3 繪制正態(tài)概率圖,正態(tài)概率圖的繪制(normal probability plots), 正態(tài)概率圖可以在概率紙上繪制,也可以在普通紙上繪制。在普通紙上繪制正態(tài)概率圖的步驟 第1步:將樣本觀察值從小到大排列 第2步:求出樣本觀察值的標準正態(tài)分數(shù)zi 。標準正態(tài)分數(shù)滿足 第3步:將zi作為縱軸,xi作為橫軸,繪制圖形,即為 標準正態(tài)概率圖,正態(tài)概率圖的繪制 (例題分析),【例】一家電腦公 司連續(xù)10天的銷

7、售 額(單位:萬元)分 別為176,191, 214,,220,205, 192,201,190, 183,185。繪制正 態(tài)概率圖,判斷該 組數(shù)據(jù)是否服從正 態(tài)分布,正態(tài)概率圖的繪制 (例題分析),電腦公司銷售額的正態(tài)概率圖,正態(tài)概率圖的判斷,短尾分布:如果尾部比正常的短,則點所形成的圖形左邊朝直線上方彎曲,右邊朝直線下方彎曲如果傾斜向右看,圖形呈S型。表明數(shù)據(jù)比標準正態(tài)分布時候更加集中靠近均值。 長尾分布:如果尾部比正常的長,則點所形成的圖形左邊朝直線下方彎曲,右邊朝直線上方彎曲如果傾斜向右看,圖形呈倒S型。表明數(shù)據(jù)比標準正態(tài)分布時候有更多偏離的數(shù)據(jù)。一個雙峰分布也可能是這個形狀。,右偏態(tài)

8、分布:右偏態(tài)分布左邊尾部短,右邊尾部長。因此,點所形成的圖形與直線相比向上彎曲,或者說呈U型。把正態(tài)分布左邊截去,也會是這種形狀。 左偏態(tài)分布:左偏態(tài)分布左邊尾部長,右邊尾部短。因此,點所形成的圖形與直線相比向下彎曲。把正態(tài)分布右邊截去,也會是這種形狀。,總體均值的區(qū)間估計(例題分析),【 例 】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量(單位:g)如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標準差為10g。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%,總體

9、均值的區(qū)間估計(例題分析正態(tài)性評估),食品重量的正態(tài)概率圖,解:已知N(,102),n=25, 1- = 95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計算得: 。 由于是正態(tài)總體,且方差已知??傮w均值在1-置信水平下的置信區(qū)間為,該食品平均重量的置信區(qū)間為101.44g109.28g,統(tǒng)計函數(shù)CONFIDENCE,【例】一家保險公司收集到由36投保個人組成的隨機樣本,得到每個投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間,解:已知n=36, 1- = 90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計算得: , 總體均值在1- 置信水平下的置信區(qū)間為,投保人平均年齡的置信區(qū)間為37.

10、37歲41.63歲,總體均值的區(qū)間估計 (正態(tài)總體、未知、小樣本),總體均值的區(qū)間估計 (小樣本),1.假定條件 總體服從正態(tài)分布,但方差() 未知 小樣本 (n 30) 2. 使用 t 分布統(tǒng)計量,總體均值在1-置信水平下的置信區(qū)間為,t 分布, t 分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布,t 分布(用Excel生成t分布的臨界值表),將分布自由度df的值輸入到工作表的A列 將右尾概率的取值輸入到第1行 在B2單元格輸入公式“=TINV(B$1*$A2)”,然后將其向下、向右復(fù)制即可得,

11、t 分布(用Excel繪制t分布圖),第1步:在工作表的第1列A2:A62輸入一個等差數(shù)列,初始 值為“-3”,步長為“0.1”,終值為“3” 第2步:在單元格C1輸入t分布的自由度(如“20”) 第3步:在單元格B2輸入公式“=TDIST(-A2,$C$1,1)”,并將其 復(fù)制到B3:B32區(qū)域,在B33輸入公式 “=TDIST(A33,$C$1,1)”并將其復(fù)制到B34:B62區(qū)域 第4步:在單元格C3輸入公“=(B3-B2)*10”,并將其復(fù)制到C4 :C31區(qū)域,在單元格C32輸入公式“=(B32-B33)*10” 并將其復(fù)制到C33:C61區(qū)域 第5步:將A2:A62作為橫坐標,C2

12、:C62作為縱坐標,根據(jù) “圖表向?qū)А崩L制折線圖,t 分布(用Excel繪制t分布圖),總體均值的區(qū)間估計(例題分析),【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間,總體均值的區(qū)間估計(例題分析正態(tài)性評估),燈泡壽命的正態(tài)概率圖,總體均值的區(qū)間估計(例題分析),解:已知N(,2),n=16, 1- = 95%,t/2=2.131 根據(jù)樣本數(shù)據(jù)計算得: , 總體均值在1-置信水平下的置信區(qū)間為,該種燈泡平均使用壽命的置信區(qū)間為1476.8h1503.2h,總體比例的區(qū)間估計,總體比例的區(qū)間估計,1.假

13、定條件 總體服從二項分布 可以由正態(tài)分布來近似 使用正態(tài)分布統(tǒng)計量 z,3. 總體比例在1-置信水平下的置信區(qū)間為,總體比例的區(qū)間估計(例題分析),【例】某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間,解:已知 n=100,p65% , 1- = 95%,z/2=1.96,該城市下崗職工中女性比例的置信區(qū)間為55.65%74.35%,總體方差的區(qū)間估計,總體方差的區(qū)間估計,1.估計一個總體的方差或標準差 2.假設(shè)總體服從正態(tài)分布 3. 總體方差 2 的點估計量為s2,且,4. 總體方差在1-

14、 置信水平下的置信區(qū)間為,總體方差的區(qū)間估計(圖示),總體方差的區(qū)間估計(例題分析),【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間,總體方差的區(qū)間估計(例題分析),解:已知n25,1-95% ,根據(jù)樣本數(shù)據(jù)計算得 s2 =93.21 2置信度為95%的置信區(qū)間為,該企業(yè)生產(chǎn)的食品總體重量標準差的的置信區(qū) 間為7.54g13.43g,一個總體參數(shù)的區(qū)間估計(小結(jié)),未來觀察值的預(yù)測區(qū)間估計,未來觀察值的預(yù)測區(qū)間估計,預(yù)測隨機變量未來的觀察值,并希望求出各

15、某個未來觀察值的取值范圍,這個范圍就是對某個未來觀察值的預(yù)測區(qū)間估計 預(yù)測誤差的期望為, ,預(yù)測誤差的方差為 未來觀察值經(jīng)標準化后服從標準正態(tài)分布,當用樣本方差s2代替總體方差2后,則服從t分布 新觀察值95%的預(yù)測區(qū)間為,第三節(jié) 兩個總體參數(shù)的區(qū)間估計,1、 兩個總體均值之差的區(qū)間估計 2、 兩個總體比例之差的區(qū)間估計 3、 兩個總體方差比的區(qū)間估計,兩個總體參數(shù)的區(qū)間估計,兩個總體均值之差的區(qū)間估計(獨立大樣本),兩個總體均值之差的估計(大樣本),1.假定條件 兩個總體都服從正態(tài)分布,1 , 2已知 若不是正態(tài)分布, 可以用正態(tài)分布來近似(n130和n230) 兩個樣本是獨立的隨機樣本 2

16、. 使用正態(tài)分布統(tǒng)計量 z,兩個總體均值之差的估計 (大樣本),1.1, 2已知時,兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為,1 , 2未知時,兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為,兩個總體均值之差的估計(例題分析),【例】某地區(qū)教育管理部門想估計兩所中學(xué)的學(xué)生高考時的英語平均分數(shù)之差,為此在兩所中學(xué)獨立抽取兩個隨機樣本,有關(guān)數(shù)據(jù)如右表所示。建立兩所中學(xué)高考英語平均分數(shù)之差95%的置信區(qū)間,English,兩個總體均值之差的估計(例題分析),解: 兩個總體均值之差在1-置信水平下的置信區(qū)間為,兩所中學(xué)高考英語平均分數(shù)之差的置信區(qū)間為 5.03分10.97分,兩個總體

17、均值之差的區(qū)間估計(獨立小樣本),兩個總體均值之差的估計(小樣本: 12= 22 ),1.假定條件 兩個總體都服從正態(tài)分布 兩個總體方差未知但相等:1=2 兩個獨立的小樣本(n130和n230) 2. 總體方差的合并估計量,估計量x1-x2的抽樣標準差,兩個總體均值之差的估計(小樣本: 12=22 ),兩個樣本均值之差的標準化,兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為,例題分析,【例】為估計兩種方法組裝產(chǎn)品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12名工人,每個工人組裝一件產(chǎn)品所需的時間(單位:min) 如下表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差相等。試以95

18、%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間,兩個總體均值之差的估計(例題分析正態(tài)性評估),兩種方法組裝時間的正態(tài)概率圖,兩個總體均值之差的估計(例題分析),解: 根據(jù)樣本數(shù)據(jù)計算得 合并估計量為,兩種方法組裝產(chǎn)品所需平均時間之差的置信區(qū)間為 0.14min7.26min,兩個總體均值之差的估計(小樣本: 12 22 ),1.假定條件 兩個總體都服從正態(tài)分布 兩個總體方差未知且不相等:12 兩個獨立的小樣本(n130和n230) 2. 使用統(tǒng)計量,兩個總體均值之差的估計(小樣本: 1222 ),兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為,自由度,例題分析,【例】沿用前例

19、。假定第一種方法隨機安排12名工人,第二種方法隨機安排8名工人,即n1=12,n2=8 ,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間,兩個總體均值之差的估計(例題分析),解: 根據(jù)樣本數(shù)據(jù)計算得 自由度為,兩種方法組裝產(chǎn)品所需平均時間之差的置信區(qū)間為 0.192min9.058min,兩個總體均值之差的區(qū)間估計(匹配樣本),兩個總體均值之差的估計(匹配大樣本),假定條件 兩個匹配的大樣本(n1 30和n2 30) 兩個總體各觀察值的配對差服從正態(tài)分布 兩個總體均值之差d =1-2在1- 置信水平下的

20、置信區(qū)間為,兩個總體均值之差的估計(匹配小樣本),假定條件 兩個匹配的小樣本(n1 30和n2 30) 兩個總體各觀察值的配對差服從正態(tài)分布 兩個總體均值之差d=1-2在1- 置信水平下的置信區(qū)間為,兩個總體均值之差的估計(例題分析),【例】由10名學(xué)生組成一個隨機樣本,讓他們分別采用A和B兩套試卷進行測試,結(jié)果如右表 。試建立兩種試卷分數(shù)之差d=1-2 95%的置信區(qū)間,STATISTICS,兩個總體均值之差的估計(例題分析正態(tài)性評估),兩套試卷分數(shù)之差的正態(tài)概率圖,兩個總體均值之差的估計(例題分析),解: 根據(jù)樣本數(shù)據(jù)計算得,兩種試卷所產(chǎn)生的分數(shù)之差的置信區(qū)間為6.33分 15.67分,兩

21、個總體比例之差區(qū)間的估計,1.假定條件 兩個總體服從二項分布 可以用正態(tài)分布來近似 兩個樣本是獨立的 2.兩個總體比例之差1- 2在1- 置信水平下的置信區(qū)間為,兩個總體比例之差的區(qū)間估計,例題分析,【例】在某個電視節(jié)目的收視率調(diào)查中,農(nóng)村隨機調(diào)查了400人,有32%的人收看了該節(jié)目;城市隨機調(diào)查了500人,有45%的人收看了該節(jié)目。試以90%的置信水平估計城市與農(nóng)村收視率差別的置信區(qū)間,兩個總體比例之差的估計 (例題分析),解: 已知 n1=500 ,n2=400, p1=45%, p2=32%, 1- =95%, z/2=1.96 1- 2置信度為95%的置信區(qū)間為,城市與農(nóng)村收視率差值的

22、置信區(qū)間為6.68%19.32%,兩個總體方差比的區(qū)間估計,兩個總體方差比的區(qū)間估計,1.比較兩個總體的方差比 用兩個樣本的方差比來判斷 如果S12/ S22接近于1,說明兩個總體方差很接近 如果S12/ S22遠離1,說明兩個總體方差之間存在差異 總體方差比在1-置信水平下的置信區(qū)間為,兩個總體方差比的區(qū)間估計(圖示),兩個總體方差比的區(qū)間估計(例題分析),【例】為了研究男女學(xué)生在生活費支出(單位:元)上的差異,在某大學(xué)各隨機抽取25名男學(xué)生和25名女學(xué)生,得到下面的結(jié)果 男學(xué)生: 女學(xué)生: 試以90%置信水平估計男女學(xué)生生活費支出方差比的置信區(qū)間,兩個總體方差比的區(qū)間估計 (例題分析),解

23、:根據(jù)自由度 n1=25-1=24 ,n2=25-1=24,查得 F/2(24)=1.98, F1-/2(24)=1/1.98=0.505 12 /22置信度為90%的置信區(qū)間為,男女學(xué)生生活費支出方差比的置信區(qū)間為0.471.84,兩個總體參數(shù)的區(qū)間估計(小結(jié)),第四節(jié) 樣本容量的確定,1、 估計總體均值時樣本容量的確定 2、 估計總體比例時樣本容量的確定 3、 估計兩個總體均值之差時樣本容量的確定 4、 估計兩個總體比例之差時樣本容量的確定,估計總體均值時樣本容量的確定,估計總體均值時樣本容量n為 樣本容量n與總體方差 2、邊際誤差E、可靠性系數(shù)Z或t之間的關(guān)系為 與總體方差成正比 與邊際

24、誤差的平方成反比 與可靠性系數(shù)成正比 樣本容量的圓整法則:當計算出的樣本容量不是整數(shù)時,將小數(shù)點后面的數(shù)值一律進位成整數(shù),如24.68取25,24.32也取25等等,估計總體均值時樣本容量的確定,其中:,例題分析,【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標準差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?,例題分析,解: 已知 =2000,E=400, 1-=95%, z/2=1.96 應(yīng)抽取的樣本容量為,即應(yīng)抽取97人作為樣本,估計總體比例時樣本容量的確定,根據(jù)比例區(qū)間估計公式可得樣本容量n為,估計總體比例時樣本容量的確定,E的取值一般

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論