




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第7章參數估計
第7章參數估計
1補充:大數定律1.獨立同分布大數定律2.貝努里大數定律
補充:大數定律1.獨立同分布大數定2獨立同分布大數定律大數定律是闡述大量同類隨機現象的平均結果的穩(wěn)定性的一系列定理的總稱?!OX1,X2,…是獨立同分布的隨機變量序列,且存在有限的數學期望E(Xi)=μ和方差D(Xi
)=σ2(i=1,2,…),則對任意小的正數ε,有:
獨立同分布大數定律大數定律是闡述大量同類隨機現象的平均結果的3大數定律(續(xù))該大數定律表明:當n充分大時,相互獨立且服從同一分布的一系列隨機變量取值的算術平均數,與其數學期望μ的偏差小于任意小的正數概率接近于1。該定理給出了平均值具有穩(wěn)定性的科學描述,從而為使用樣本均值去估計總體均值(數學期望)提供了理論依據。大數定律(續(xù))該大數定律表明:當n充分大時,相互獨立且服從同4貝努里大數定律設m是n次獨立重復試驗中事件A發(fā)生的次數,p是每次試驗中事件A發(fā)生的概率,則對任意的ε>0,有:它表明,當重復試驗次數n充分大時,事件A發(fā)生的頻率m/n依概率收斂于每次事件A發(fā)生的概率闡明了頻率具有穩(wěn)定性,提供了用頻率估計概率的理論依據。貝努里大數定律設m是n次獨立重復試驗中事件A發(fā)生的次數,p是5案例一:
參數估計在企業(yè)市場規(guī)劃中應用例張先生是臺灣某集團的企劃部經理,在今年的規(guī)劃中,集團準備在某地新建一家新的零售商店。張先生目前正在做這方面的準備工作。其中有一項便是進行市場調查。在眾多考慮因素中,經過該地行人數量是要考慮的一個很重要的方面。張先生委托他人進行了兩個星期的觀察,得到每天經過該地人數如下:1544,1468,1399,1759,1526,1212,1256,1456,1553,1259,1469,1366,1197,1178將此數據作為樣本,商店開張后經過該地的人數作為總體。在95%的置信度下,能否知道每天經過此地的人數?案例一:
參數估計在企業(yè)市場規(guī)劃中應用例張先生是臺灣某集6
案例二:
參數估計在品牌認知度中應用例某食品廠準備上市一種新產品,并配合以相應的廣告宣傳,企業(yè)想通過調查孩子們對其品牌的認知情況來評估廣告的效用,以制定下一步的市場推廣計劃。他們在該地區(qū)隨機抽取350個小孩作訪問對象,進行兒童消費者行為與消費習慣調查,其中有一個問句是“你聽說過這個牌子嗎?”,在350個孩子中,有112個小孩的回答是“聽說過”。根據這個問句,可以分析這一消費群體對該品牌的認知情況。食品廠市場部經理要求,根據這些樣本,給定95%的置信度,估計該地區(qū)孩子認知該品牌的比例。
案例二:
參數估計在品牌認知度中應用例某食品廠準備上7第7章參數估計7.1參數估計的一般問題7.2一個總體參數的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.4樣本容量的確定第7章參數估計7.1參數估計的一般問題87.1參數估計的一般問題
7.1.1估計量和估計值7.1.2點估計和區(qū)間估計7.1.3
評價估計量的標準7.1參數估計的一般問題
7.1.1估計量和估計值97.1.1估計量和估計值估計量:用于估計總體參數的隨機變量如樣本均值,樣本比例、樣本方差等例如:樣本均值x
就是總體均值的一個估計量估計值:估計總體參數時計算出來的統(tǒng)計量的具體值如果樣本均值x
=80,則80就是的估計值7.1.1估計量和估計值估計量:用于估計總體參數的隨機107.1.2點估計和區(qū)間估計點估計用樣本的估計量直接作為總體參數的估計值例如:用樣本均值直接作為總體均值的估計例如:用樣本方差直接作為總體方差的估計例:某企業(yè)工人日產量進行抽樣調查,樣本人均日產量為35件,樣本優(yōu)質率為85%.按點估計,可推斷該企業(yè)總體人均日產量為35件,總體優(yōu)質品率為85%.優(yōu)點:簡單、具體明確缺點:沒有給出估計值接近總體參數的程度,也無法說明估計結果有多大的把握程度。7.1.2點估計和區(qū)間估計點估計11(一)常用的點估計量1.總體均值點估計量(樣本均值)2.總體方差與標準差點估計量(樣本方差與標準差)3.總體比率(成數)點估計量(樣本成數)(一)常用的點估計量1.總體均值點估計量(樣本均值)2.總體12(二)點估計的方法(1)極大似然估計(最大似然法)(二)點估計的方法(1)極大似然估計(最大似然法)13統(tǒng)計學第7講參數估計課件14(2)矩法矩就是隨機變量的各階數值特征。(2)矩法矩就是隨機變量的各階數值特征。15統(tǒng)計學第7講參數估計課件16矩估計法的具體做法如下:矩估計法的具體做法如下:17統(tǒng)計學第7講參數估計課件18區(qū)間估計區(qū)間估計:根據樣本統(tǒng)計量的抽樣分布對樣本統(tǒng)計量與總體參數的接近程度給出一個概率度量實質是在點估計的基礎上,給出總體參數估計的一個區(qū)間范圍,不僅可說明樣本統(tǒng)計量與總體參數的接近程度,而且能說明估計結果的把握程度。包括置信區(qū)間和置信水平兩個要素。例如:某班級平均分數在75~85之間,置信水平是95%
樣本統(tǒng)計量
(點估計)置信區(qū)間置信下限置信上限區(qū)間估計區(qū)間估計:根據樣本統(tǒng)計量的抽樣分布對樣本統(tǒng)計量與總體19置信區(qū)間和置信水平
由樣本統(tǒng)計量所構造的總體參數的估計區(qū)間稱為置信區(qū)間。最小值稱為置信下限,最大值稱為置信上限。[L,U]稱為總體參數的置信區(qū)間。(1-稱為置信水平,表示如果將構造置信區(qū)間的步驟重復多次,置信區(qū)間中包含總體參數的次數所占的比率。為顯著性水平,是總體參數未在區(qū)間內的比例,也稱風險值取值大小由實際問題確定。常用的為0.01,0.05,0.10,相應的置信水平值有99%,95%,90%置信區(qū)間和置信水平由樣本統(tǒng)計量所構造的總體參數的估計區(qū)間稱20由于作為總體參數,是固定不變的常數,它或在給出的區(qū)間[L,U]內,或在該區(qū)間外,概率只能是0或1,不可能是1-,怎樣解釋這個概率的含義?用[L,U]去框,估計結論或者正確或者錯誤,但是如果多次重復估計的話,則平均100次估計中,只有100次估計錯誤,有100(1-)估計正確。1-表示將構造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數真值的次數所占的比例。如何理解1-?由于作為總體參數,是固定不變的常數,它或在給出的區(qū)間[217.1.3
評價估計量的標準參數估計中,用來估計總體參數的統(tǒng)計量很多,到底選擇哪個統(tǒng)計量作為總體參數的估計量呢?這涉及估計量的評價標準。評價標準:無偏性,有效性,一致性7.1.3評價估計量的標準參數估計中,用來估計總體參數的統(tǒng)22無偏性估計量抽樣分布的數學期望等于被估計的總體參數,也就是樣本統(tǒng)計量的分布以總體參數真值為中心。P(
)BA無偏有偏無偏性估計量抽樣分布的數學期望等于被估計的總體參數23有效性對同一總體參數的兩個無偏點估計量,更小標準差的估計量更有效,如樣本平均數的方差比樣本中位數的方差要小,所以作為估計量,樣本平均數更有效BA
的抽樣分布
的抽樣分布P(
)有效性對同一總體參數的兩個無偏點估計量,更小標準差的估計量更24一致性
隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數。一個大樣本給出的估計量比一個小樣本給出的估計量更接近總體參數。(大數定理)AB較小的樣本容量較大的樣本容量P(
)一致性隨著樣本容量的增大,估計量的值越來越接近被估25第7章參數估計7.1參數估計的一般問題7.2一個總體參數的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.4樣本容量的確定第7章參數估計7.1參數估計的一般問題26總體參數2已知2未知大樣本小樣本,正態(tài)總體正態(tài)分布正態(tài)分布t分布7.2一個總體參數的區(qū)間估計大樣本小樣本正態(tài)總體總體參數2已知2未知大樣本小樣本,正態(tài)總體正態(tài)分布正態(tài)分27總體均值的區(qū)間估計
(2已知:正態(tài)總體,或非正態(tài)總體、大樣本)1. 假定條件方差(2)已知總體服從正態(tài)分布總體如果不是正態(tài)分布,可由正態(tài)分布來近似(n
30)使用標準正態(tài)分布統(tǒng)計量總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計
(2已知:正態(tài)總體,或非正態(tài)總體、大28公式推導公式推導29
(例題分析)【例】一家食品生產企業(yè)以生產袋裝食品為主,為對產品質量進行監(jiān)測,企業(yè)質檢部門經常要進行抽檢,以分析每袋重量是否符合要求?,F從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態(tài)分布,且總體標準差為10g。試估計該批產品平均重量的置信區(qū)間,置信水平為95%。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3
(例題分析)【例】一家食品生產企業(yè)以生產袋裝食品為主,30例題分析解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據樣本數據計算得:
總體均值在1-置信水平下的置信區(qū)間為在置信水平95%下,該食品平均重量的置信區(qū)間為101.44g~109.28g例題分析解:已知X~N(,102),n=25,1-=31總體均值的區(qū)間估計
(2未知、大樣本)實際計算時,所研究總體的標準差通常未知,可以用以往調查的總體標準差來代替,大樣本的時候也可以用樣本標準差來代替。使用正態(tài)分布統(tǒng)計量z
總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計
(2未知、大樣本)實際計算時,所研究32(例題分析)【例】一家保險公司收集到由36投保個人組成的隨機樣本,得到每個投保人的年齡(周歲)數據如下表。試建立投保人年齡90%的置信區(qū)間36個投保人年齡的數據233539273644364246433133425345544724342839364440394938344850343945484532(例題分析)【例】一家保險公司收集到由36投保個人組成的隨機33
(例題分析)解:已知n=36,1-=90%,z/2=1.645。根據樣本數據計算得:,
總體均值在1-置信水平下的置信區(qū)間為在置信水平90%下,投保人平均年齡的置信區(qū)間為37.37歲~41.63歲
(例題分析)解:已知n=36,1-=90%,z/34總體均值的區(qū)間估計
(2未知、正態(tài)總體、小樣本)1. 假定條件若總體服從正態(tài)分布,但方差(2)
未知則,樣本均值經過標準化以后的隨機變量服從自由度為(n-1)的t分布。
t分布統(tǒng)計量,用樣本標準差s代替總體標準差3.總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計
(2未知、正態(tài)總體、小樣本)1. 假35
(例題分析)【例】已知某種燈泡的壽命服從正態(tài)分布,現從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數據1510152014801500145014801510152014801490153015101460146014701470
(例題分析)【例】已知某種燈泡的壽命服從正態(tài)分布,現從一批36(例題分析)解:已知X~N(,2),n=16,1-=95%,t/2=2.131根據樣本數據計算得:,
總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8小時~1503.2小時(例題分析)解:已知X~N(,2),n=16,1-37總體平均數的置信區(qū)間表達式總體平均數的置信區(qū)間表38總體比率(成數)的區(qū)間估計1. 假定條件總體服從二項分布樣本n足夠大,一般大于30可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計量z3.總體比例P在1-置信水平下的置信區(qū)間為總體比率(成數)的區(qū)間估計1. 假定條件3.總體比例39
(例題分析)【例】某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%
(例題分析)【例】某城市想要估計下崗職工中女性所占的比例,40總體方差的區(qū)間估計1. 假定條件總體服從正態(tài)分布使用分布統(tǒng)計量3.總體方差在1-置信水平下的置信區(qū)間為~總體方差的區(qū)間估計1. 假定條件3.總體方差在1-41
(例題分析)【例】一家食品生產企業(yè)以生產袋裝食品為主,為對產品質量進行監(jiān)測,企業(yè)質檢部門經常要進行抽檢,以分析每袋重量是否符合要求?,F從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態(tài)分布,且總體標準差為10g。試以95%的置信水平建立該種食品重量方差的知心區(qū)間。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3
(例題分析)【例】一家食品生產企業(yè)以生產袋裝食品為主,42解:解:43區(qū)間估計的總結
1.總體均值的區(qū)間估計
2已知:正態(tài)總體,或非正態(tài)總體、大樣本
2未知:正態(tài)總體,或非正態(tài)總體、大樣本總體比例的區(qū)間估計總體方差的區(qū)間估計區(qū)間估計的總結
1.總體均值的區(qū)間估計44第7章參數估計7.1參數估計的一般問題7.2一個總體參數的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.4樣本容量的確定第7章參數估計7.1參數估計的一般問題457.3兩個總體參數的區(qū)間估計7.3.1兩個總體均值之差的區(qū)間估計7.3.2兩個總體比率之差的區(qū)間估計7.3.3兩個總體方差比的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.3.1兩個總體均值之467.3.1兩個總體均值之差的區(qū)間估計
1.獨立樣本(1)大樣本的估計方法假定條件:兩總體為正態(tài)分布或兩個大樣本7.3.1兩個總體均值之差的區(qū)間估計
1.獨立樣本47①兩個總體的方差和已知時兩總體均值之差
在1-置信水平下的置信區(qū)間為②兩個總體的方差和未知時兩總體均值之差
在1-置信水平下的置信區(qū)間為①兩個總體的方差和已知時48兩個樣本有關數據例:某地區(qū)教育委員會想估計兩所中學的學生高考時的英語平均分數之差,為此在兩所中學獨立地抽取兩個隨機樣本,有關數據如表所示。建立兩所中學高考英語平均分數之差在95%的置信區(qū)間。中學一中學二兩個樣本有關數據例:某地區(qū)教育委員會想估計兩所中學的學生高考49統(tǒng)計學第7講參數估計課件507.3.1兩個總體均值之差的區(qū)間估計
(2)小樣本的估計方法假定條件:兩總體均為正態(tài)分布兩個隨機樣本獨立的分別抽自兩總體①兩個總體的方差和已知時無論樣本大小兩總體均值之差
在1-置信水平下的置信區(qū)間為7.3.1兩個總體均值之差的區(qū)間估計
(2)小樣本的估計方51②兩個總體的方差和未知但相等時兩總體均值之差
在1-置信水平下的置信區(qū)間為②兩個總體的方差和未知但相等時52兩種方法組裝產品所需時間例.為估計兩種方法組裝產品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12個工人,每個工人組裝一件產品所需的時間(分)如下表。假定兩種方法組裝產品的時間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產品所需平均時間差值的置信區(qū)間。方法一方法二28.327.630.122.229.031.037.633.832.120.028.830.236.031.737.226.538.532.034.431.228.033.430.026.5兩種方法組裝產品所需時間例.為估計兩種方法組裝產品方法53統(tǒng)計學第7講參數估計課件54③兩個總體的方差和未知且不相等時條件:兩總體都是正態(tài)總體,而且兩總體均值之差
在1-置信水平下的置信區(qū)間為③兩個總體的方差和未知且不相等時55(4)兩個總體的方差和未知且不相等時條件:兩總體都是正態(tài)總體,而且兩總體均值之差
在1-置信水平下的置信區(qū)間為統(tǒng)計學第7講參數估計課件56兩種方法組裝產品所需時間例.為估計兩種方法組裝產品所需時間的差異,對方法一隨機安排12個工人,對方法二隨機安排8個工人,組裝一件產品所需的時間(分)如下表。假定兩種方法組裝產品的時間服從正態(tài)分布,方差不相等。試以95%的置信水平建立兩種方法組裝產品所需平均時間差值的置信區(qū)間。方法一方法二28.327.630.122.229.031.037.633.832.120.028.830.236.031.737.226.538.534.428.030.0兩種方法組裝產品所需時間例.為估計兩種方法組裝產品方法57統(tǒng)計學第7講參數估計課件587.3.1兩個總體均值之差的區(qū)間估計
2.匹配樣本(1)大樣本的估計方法7.3.1兩個總體均值之差的區(qū)間估計
2.匹配樣本597.3.1兩個總體均值之差的區(qū)間估計
2.匹配樣本(2)小樣本的估計方法7.3.1兩個總體均值之差的區(qū)間估計
2.匹配樣本6010名學生兩套試卷的得分例.由10名學生組成一個隨機樣本,讓他們分別采用A和B兩套試卷進行測定,結果如表所示。試以95%的置信水平建立兩種試卷平均分數差值的置信區(qū)間。試卷A試卷B差值d17871726344193726111489845591741764951-2768551687660169857781055391610名學生兩套試卷的得分例.由10名學生組成一個隨機樣61統(tǒng)計學第7講參數估計課件627.3兩個總體參數的區(qū)間估計7.3.1兩個總體均值之差的區(qū)間估計7.3.2兩個總體比率之差的區(qū)間估計7.3.3兩個總體方差比的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.3.1兩個總體均值之637.3.2兩個總體比率之差的區(qū)間估計獨立樣本:兩總體比率之差
在1-置信水平下的置信區(qū)間為7.3.2兩個總體比率之差的區(qū)間估計獨立樣本:64【例】在某個電視節(jié)目的收視率的調查中,在農村隨機調查了400人,有32%的人收看了該節(jié)目;在城市隨機調查了500人,有45%的人收看了該節(jié)目。試以95%的置信水平估計城市與農村收視率差別的置信區(qū)間?!纠吭谀硞€電視節(jié)目的收視率的調查中,在農村隨機調查了4657.3兩個總體參數的區(qū)間估計7.3.1兩個總體均值之差的區(qū)間估計7.3.2兩個總體比率之差的區(qū)間估計7.3.3兩個總體方差比的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.3.1兩個總體均值之667.3.3兩個總體方差比的區(qū)間估計兩個總體都為正態(tài)分布,由抽樣分布知兩總體方差之比
在1-置信水平下的置信區(qū)間為7.3.3兩個總體方差比的區(qū)間估計兩個總體都為正態(tài)分布,由67統(tǒng)計學第7講參數估計課件68參數估計方法小結參數估計方法小結69第7章參數估計7.1參數估計的一般問題7.2一個總體參數的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.4樣本容量的確定第7章參數估計7.1參數估計的一般問題707.4樣本容量的確定7.4.1確定樣本容量的意義7.4.2估計總體均值時樣本容量的確定7.4.3估計總體比率時樣本容量的確定7.4.4必要樣本容量的影響因素7.4樣本容量的確定7.4.1確定樣本容量的意義71樣本容量調查誤差調查費用小樣本容量節(jié)省費用但調查誤差大大樣本容量調查精度高但費用較大找出在規(guī)定誤差范圍內的最小樣本容量7.4.1確定樣本容量的意義找出在限定費用范圍內的最大樣本容量樣本容量調查誤差調查費用小樣本容量節(jié)省費用但調查誤差大大樣本72確定方法7.4.2估計總體均值時樣本容量的確定⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差?;騍通常未知。一般按以下方法確定其估計值:①過去的經驗數據;②試驗調查樣本的S。計算結果通常向上進位確7.4.2估計總體均值時樣本容量的確定⑴重復抽樣條件73⑵不重復抽樣條件下:確定方法7.4.2估計總體均值時樣本容量的確定⑵不重復抽樣條件下:確7.4.2估計總體均值時樣本容量74【例A】某食品廠要檢驗本月生產的10000袋某產品的重量,根據上月資料,這種產品每袋重量的標準差為25克。要求在95.45﹪的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應抽查多少袋產品?例題【例A】某食品廠要檢驗本月生產的10000袋某產品的重量,根75解:解:76
(例題分析)【例】擁有工商管理學士學位的大學畢業(yè)生年薪的標準差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望抽樣極限誤差為400元,應抽取多大的樣本容量?
(例題分析)【例】擁有工商管理學士學位的大學畢業(yè)生年薪的標77
(例題分析)解:
已知=2000,
=400,1-=95%,z/2=1.96
即應抽取97人作為樣本
(例題分析)解:已知=2000,=400,78確定方法⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。計算結果通常向上進位通常未知。一般按以下方法確定其估計值:①過去的經驗數據;②試驗調查樣本的;③取方差的最大值0.25(此時p=0.5)。7.4.3估計總體比率時樣本容量的確定確⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣79⑵不重復抽樣條件下:確定方法7.4.3估計總體比率時樣本容量的確定⑵不重復抽樣條件下:確7.4.3估計總體比率時樣本容量80【例B】某企業(yè)對一批總數為5000件的產品進行質量檢查,過去幾次同類調查所得的產品合格率為93﹪、95﹪、96﹪,為了使合格率的允許誤差不超過3﹪,在99.73﹪的概率保證程度下,應抽查多少件產品?【分析】因為共有三個過去的合格率的資料,為保證推斷的把握程度,應選其中方差最大者,即P=93﹪?!纠鼴】某企業(yè)對一批總數為5000件的產品進行質量檢查,過去81解:解:82
(例題分析)【例】根據以往的生產統(tǒng)計,某種產品的合格率約為90%,現要求抽樣允許誤差為5%,在求95%的置信區(qū)間時,應抽取多少個產品作為樣本?
解:已知P=90%,=0.05,z/2=1.96,=5%
應抽取的樣本容量為
應抽取139個產品作為樣本
(例題分析)【例】根據以往的生產統(tǒng)計,某種產品的合格率約為837.4.4必要樣本容量的影響因素總體方差的大??;允許誤差范圍的大??;置信水平;抽樣方法;重復抽樣條件下:不重復抽樣條件下:7.4.4必要樣本容量的影響因素總體方差的大??;重復抽樣84本章小結第7章參數估計7.1參數估計的一般問題7.2一個總體參數的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.4樣本容量的確定本章小結第7章參數估計85第7章參數估計
第7章參數估計
86補充:大數定律1.獨立同分布大數定律2.貝努里大數定律
補充:大數定律1.獨立同分布大數定87獨立同分布大數定律大數定律是闡述大量同類隨機現象的平均結果的穩(wěn)定性的一系列定理的總稱?!OX1,X2,…是獨立同分布的隨機變量序列,且存在有限的數學期望E(Xi)=μ和方差D(Xi
)=σ2(i=1,2,…),則對任意小的正數ε,有:
獨立同分布大數定律大數定律是闡述大量同類隨機現象的平均結果的88大數定律(續(xù))該大數定律表明:當n充分大時,相互獨立且服從同一分布的一系列隨機變量取值的算術平均數,與其數學期望μ的偏差小于任意小的正數概率接近于1。該定理給出了平均值具有穩(wěn)定性的科學描述,從而為使用樣本均值去估計總體均值(數學期望)提供了理論依據。大數定律(續(xù))該大數定律表明:當n充分大時,相互獨立且服從同89貝努里大數定律設m是n次獨立重復試驗中事件A發(fā)生的次數,p是每次試驗中事件A發(fā)生的概率,則對任意的ε>0,有:它表明,當重復試驗次數n充分大時,事件A發(fā)生的頻率m/n依概率收斂于每次事件A發(fā)生的概率闡明了頻率具有穩(wěn)定性,提供了用頻率估計概率的理論依據。貝努里大數定律設m是n次獨立重復試驗中事件A發(fā)生的次數,p是90案例一:
參數估計在企業(yè)市場規(guī)劃中應用例張先生是臺灣某集團的企劃部經理,在今年的規(guī)劃中,集團準備在某地新建一家新的零售商店。張先生目前正在做這方面的準備工作。其中有一項便是進行市場調查。在眾多考慮因素中,經過該地行人數量是要考慮的一個很重要的方面。張先生委托他人進行了兩個星期的觀察,得到每天經過該地人數如下:1544,1468,1399,1759,1526,1212,1256,1456,1553,1259,1469,1366,1197,1178將此數據作為樣本,商店開張后經過該地的人數作為總體。在95%的置信度下,能否知道每天經過此地的人數?案例一:
參數估計在企業(yè)市場規(guī)劃中應用例張先生是臺灣某集91
案例二:
參數估計在品牌認知度中應用例某食品廠準備上市一種新產品,并配合以相應的廣告宣傳,企業(yè)想通過調查孩子們對其品牌的認知情況來評估廣告的效用,以制定下一步的市場推廣計劃。他們在該地區(qū)隨機抽取350個小孩作訪問對象,進行兒童消費者行為與消費習慣調查,其中有一個問句是“你聽說過這個牌子嗎?”,在350個孩子中,有112個小孩的回答是“聽說過”。根據這個問句,可以分析這一消費群體對該品牌的認知情況。食品廠市場部經理要求,根據這些樣本,給定95%的置信度,估計該地區(qū)孩子認知該品牌的比例。
案例二:
參數估計在品牌認知度中應用例某食品廠準備上92第7章參數估計7.1參數估計的一般問題7.2一個總體參數的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.4樣本容量的確定第7章參數估計7.1參數估計的一般問題937.1參數估計的一般問題
7.1.1估計量和估計值7.1.2點估計和區(qū)間估計7.1.3
評價估計量的標準7.1參數估計的一般問題
7.1.1估計量和估計值947.1.1估計量和估計值估計量:用于估計總體參數的隨機變量如樣本均值,樣本比例、樣本方差等例如:樣本均值x
就是總體均值的一個估計量估計值:估計總體參數時計算出來的統(tǒng)計量的具體值如果樣本均值x
=80,則80就是的估計值7.1.1估計量和估計值估計量:用于估計總體參數的隨機957.1.2點估計和區(qū)間估計點估計用樣本的估計量直接作為總體參數的估計值例如:用樣本均值直接作為總體均值的估計例如:用樣本方差直接作為總體方差的估計例:某企業(yè)工人日產量進行抽樣調查,樣本人均日產量為35件,樣本優(yōu)質率為85%.按點估計,可推斷該企業(yè)總體人均日產量為35件,總體優(yōu)質品率為85%.優(yōu)點:簡單、具體明確缺點:沒有給出估計值接近總體參數的程度,也無法說明估計結果有多大的把握程度。7.1.2點估計和區(qū)間估計點估計96(一)常用的點估計量1.總體均值點估計量(樣本均值)2.總體方差與標準差點估計量(樣本方差與標準差)3.總體比率(成數)點估計量(樣本成數)(一)常用的點估計量1.總體均值點估計量(樣本均值)2.總體97(二)點估計的方法(1)極大似然估計(最大似然法)(二)點估計的方法(1)極大似然估計(最大似然法)98統(tǒng)計學第7講參數估計課件99(2)矩法矩就是隨機變量的各階數值特征。(2)矩法矩就是隨機變量的各階數值特征。100統(tǒng)計學第7講參數估計課件101矩估計法的具體做法如下:矩估計法的具體做法如下:102統(tǒng)計學第7講參數估計課件103區(qū)間估計區(qū)間估計:根據樣本統(tǒng)計量的抽樣分布對樣本統(tǒng)計量與總體參數的接近程度給出一個概率度量實質是在點估計的基礎上,給出總體參數估計的一個區(qū)間范圍,不僅可說明樣本統(tǒng)計量與總體參數的接近程度,而且能說明估計結果的把握程度。包括置信區(qū)間和置信水平兩個要素。例如:某班級平均分數在75~85之間,置信水平是95%
樣本統(tǒng)計量
(點估計)置信區(qū)間置信下限置信上限區(qū)間估計區(qū)間估計:根據樣本統(tǒng)計量的抽樣分布對樣本統(tǒng)計量與總體104置信區(qū)間和置信水平
由樣本統(tǒng)計量所構造的總體參數的估計區(qū)間稱為置信區(qū)間。最小值稱為置信下限,最大值稱為置信上限。[L,U]稱為總體參數的置信區(qū)間。(1-稱為置信水平,表示如果將構造置信區(qū)間的步驟重復多次,置信區(qū)間中包含總體參數的次數所占的比率。為顯著性水平,是總體參數未在區(qū)間內的比例,也稱風險值取值大小由實際問題確定。常用的為0.01,0.05,0.10,相應的置信水平值有99%,95%,90%置信區(qū)間和置信水平由樣本統(tǒng)計量所構造的總體參數的估計區(qū)間稱105由于作為總體參數,是固定不變的常數,它或在給出的區(qū)間[L,U]內,或在該區(qū)間外,概率只能是0或1,不可能是1-,怎樣解釋這個概率的含義?用[L,U]去框,估計結論或者正確或者錯誤,但是如果多次重復估計的話,則平均100次估計中,只有100次估計錯誤,有100(1-)估計正確。1-表示將構造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數真值的次數所占的比例。如何理解1-?由于作為總體參數,是固定不變的常數,它或在給出的區(qū)間[1067.1.3
評價估計量的標準參數估計中,用來估計總體參數的統(tǒng)計量很多,到底選擇哪個統(tǒng)計量作為總體參數的估計量呢?這涉及估計量的評價標準。評價標準:無偏性,有效性,一致性7.1.3評價估計量的標準參數估計中,用來估計總體參數的統(tǒng)107無偏性估計量抽樣分布的數學期望等于被估計的總體參數,也就是樣本統(tǒng)計量的分布以總體參數真值為中心。P(
)BA無偏有偏無偏性估計量抽樣分布的數學期望等于被估計的總體參數108有效性對同一總體參數的兩個無偏點估計量,更小標準差的估計量更有效,如樣本平均數的方差比樣本中位數的方差要小,所以作為估計量,樣本平均數更有效BA
的抽樣分布
的抽樣分布P(
)有效性對同一總體參數的兩個無偏點估計量,更小標準差的估計量更109一致性
隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數。一個大樣本給出的估計量比一個小樣本給出的估計量更接近總體參數。(大數定理)AB較小的樣本容量較大的樣本容量P(
)一致性隨著樣本容量的增大,估計量的值越來越接近被估110第7章參數估計7.1參數估計的一般問題7.2一個總體參數的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.4樣本容量的確定第7章參數估計7.1參數估計的一般問題111總體參數2已知2未知大樣本小樣本,正態(tài)總體正態(tài)分布正態(tài)分布t分布7.2一個總體參數的區(qū)間估計大樣本小樣本正態(tài)總體總體參數2已知2未知大樣本小樣本,正態(tài)總體正態(tài)分布正態(tài)分112總體均值的區(qū)間估計
(2已知:正態(tài)總體,或非正態(tài)總體、大樣本)1. 假定條件方差(2)已知總體服從正態(tài)分布總體如果不是正態(tài)分布,可由正態(tài)分布來近似(n
30)使用標準正態(tài)分布統(tǒng)計量總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計
(2已知:正態(tài)總體,或非正態(tài)總體、大113公式推導公式推導114
(例題分析)【例】一家食品生產企業(yè)以生產袋裝食品為主,為對產品質量進行監(jiān)測,企業(yè)質檢部門經常要進行抽檢,以分析每袋重量是否符合要求?,F從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態(tài)分布,且總體標準差為10g。試估計該批產品平均重量的置信區(qū)間,置信水平為95%。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3
(例題分析)【例】一家食品生產企業(yè)以生產袋裝食品為主,115例題分析解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據樣本數據計算得:
總體均值在1-置信水平下的置信區(qū)間為在置信水平95%下,該食品平均重量的置信區(qū)間為101.44g~109.28g例題分析解:已知X~N(,102),n=25,1-=116總體均值的區(qū)間估計
(2未知、大樣本)實際計算時,所研究總體的標準差通常未知,可以用以往調查的總體標準差來代替,大樣本的時候也可以用樣本標準差來代替。使用正態(tài)分布統(tǒng)計量z
總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計
(2未知、大樣本)實際計算時,所研究117(例題分析)【例】一家保險公司收集到由36投保個人組成的隨機樣本,得到每個投保人的年齡(周歲)數據如下表。試建立投保人年齡90%的置信區(qū)間36個投保人年齡的數據233539273644364246433133425345544724342839364440394938344850343945484532(例題分析)【例】一家保險公司收集到由36投保個人組成的隨機118
(例題分析)解:已知n=36,1-=90%,z/2=1.645。根據樣本數據計算得:,
總體均值在1-置信水平下的置信區(qū)間為在置信水平90%下,投保人平均年齡的置信區(qū)間為37.37歲~41.63歲
(例題分析)解:已知n=36,1-=90%,z/119總體均值的區(qū)間估計
(2未知、正態(tài)總體、小樣本)1. 假定條件若總體服從正態(tài)分布,但方差(2)
未知則,樣本均值經過標準化以后的隨機變量服從自由度為(n-1)的t分布。
t分布統(tǒng)計量,用樣本標準差s代替總體標準差3.總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計
(2未知、正態(tài)總體、小樣本)1. 假120
(例題分析)【例】已知某種燈泡的壽命服從正態(tài)分布,現從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數據1510152014801500145014801510152014801490153015101460146014701470
(例題分析)【例】已知某種燈泡的壽命服從正態(tài)分布,現從一批121(例題分析)解:已知X~N(,2),n=16,1-=95%,t/2=2.131根據樣本數據計算得:,
總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8小時~1503.2小時(例題分析)解:已知X~N(,2),n=16,1-122總體平均數的置信區(qū)間表達式總體平均數的置信區(qū)間表123總體比率(成數)的區(qū)間估計1. 假定條件總體服從二項分布樣本n足夠大,一般大于30可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計量z3.總體比例P在1-置信水平下的置信區(qū)間為總體比率(成數)的區(qū)間估計1. 假定條件3.總體比例124
(例題分析)【例】某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%
(例題分析)【例】某城市想要估計下崗職工中女性所占的比例,125總體方差的區(qū)間估計1. 假定條件總體服從正態(tài)分布使用分布統(tǒng)計量3.總體方差在1-置信水平下的置信區(qū)間為~總體方差的區(qū)間估計1. 假定條件3.總體方差在1-126
(例題分析)【例】一家食品生產企業(yè)以生產袋裝食品為主,為對產品質量進行監(jiān)測,企業(yè)質檢部門經常要進行抽檢,以分析每袋重量是否符合要求?,F從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態(tài)分布,且總體標準差為10g。試以95%的置信水平建立該種食品重量方差的知心區(qū)間。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3
(例題分析)【例】一家食品生產企業(yè)以生產袋裝食品為主,127解:解:128區(qū)間估計的總結
1.總體均值的區(qū)間估計
2已知:正態(tài)總體,或非正態(tài)總體、大樣本
2未知:正態(tài)總體,或非正態(tài)總體、大樣本總體比例的區(qū)間估計總體方差的區(qū)間估計區(qū)間估計的總結
1.總體均值的區(qū)間估計129第7章參數估計7.1參數估計的一般問題7.2一個總體參數的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.4樣本容量的確定第7章參數估計7.1參數估計的一般問題1307.3兩個總體參數的區(qū)間估計7.3.1兩個總體均值之差的區(qū)間估計7.3.2兩個總體比率之差的區(qū)間估計7.3.3兩個總體方差比的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.3.1兩個總體均值之1317.3.1兩個總體均值之差的區(qū)間估計
1.獨立樣本(1)大樣本的估計方法假定條件:兩總體為正態(tài)分布或兩個大樣本7.3.1兩個總體均值之差的區(qū)間估計
1.獨立樣本132①兩個總體的方差和已知時兩總體均值之差
在1-置信水平下的置信區(qū)間為②兩個總體的方差和未知時兩總體均值之差
在1-置信水平下的置信區(qū)間為①兩個總體的方差和已知時133兩個樣本有關數據例:某地區(qū)教育委員會想估計兩所中學的學生高考時的英語平均分數之差,為此在兩所中學獨立地抽取兩個隨機樣本,有關數據如表所示。建立兩所中學高考英語平均分數之差在95%的置信區(qū)間。中學一中學二兩個樣本有關數據例:某地區(qū)教育委員會想估計兩所中學的學生高考134統(tǒng)計學第7講參數估計課件1357.3.1兩個總體均值之差的區(qū)間估計
(2)小樣本的估計方法假定條件:兩總體均為正態(tài)分布兩個隨機樣本獨立的分別抽自兩總體①兩個總體的方差和已知時無論樣本大小兩總體均值之差
在1-置信水平下的置信區(qū)間為7.3.1兩個總體均值之差的區(qū)間估計
(2)小樣本的估計方136②兩個總體的方差和未知但相等時兩總體均值之差
在1-置信水平下的置信區(qū)間為②兩個總體的方差和未知但相等時137兩種方法組裝產品所需時間例.為估計兩種方法組裝產品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12個工人,每個工人組裝一件產品所需的時間(分)如下表。假定兩種方法組裝產品的時間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產品所需平均時間差值的置信區(qū)間。方法一方法二28.327.630.122.229.031.037.633.832.120.028.830.236.031.737.226.538.532.034.431.228.033.430.026.5兩種方法組裝產品所需時間例.為估計兩種方法組裝產品方法138統(tǒng)計學第7講參數估計課件139③兩個總體的方差和未知且不相等時條件:兩總體都是正態(tài)總體,而且兩總體均值之差
在1-置信水平下的置信區(qū)間為③兩個總體的方差和未知且不相等時140(4)兩個總體的方差和未知且不相等時條件:兩總體都是正態(tài)總體,而且兩總體均值之差
在1-置信水平下的置信區(qū)間為統(tǒng)計學第7講參數估計課件141兩種方法組裝產品所需時間例.為估計兩種方法組裝產品所需時間的差異,對方法一隨機安排12個工人,對方法二隨機安排8個工人,組裝一件產品所需的時間(分)如下表。假定兩種方法組裝產品的時間服從正態(tài)分布,方差不相等。試以95%的置信水平建立兩種方法組裝產品所需平均時間差值的置信區(qū)間。方法一方法二28.327.630.122.229.031.037.633.832.120.028.830.236.031.737.226.538.534.428.030.0兩種方法組裝產品所需時間例.為估計兩種方法組裝產品方法142統(tǒng)計學第7講參數估計課件1437.3.1兩個總體均值之差的區(qū)間估計
2.匹配樣本(1)大樣本的估計方法7.3.1兩個總體均值之差的區(qū)間估計
2.匹配樣本1447.3.1兩個總體均值之差的區(qū)間估計
2.匹配樣本(2)小樣本的估計方法7.3.1兩個總體均值之差的區(qū)間估計
2.匹配樣本14510名學生兩套試卷的得分例.由10名學生組成一個隨機樣本,讓他們分別采用A和B兩套試卷進行測定,結果如表所示。試以95%的置信水平建立兩種試卷平均分數差值的置信區(qū)間。試卷A試卷B差值d17871726344193726111489845591741764951-2768551687660169857781055391610名學生兩套試卷的得分例.由10名學生組成一個隨機樣146統(tǒng)計學第7講參數估計課件1477.3兩個總體參數的區(qū)間估計7.3.1兩個總體均值之差的區(qū)間估計7.3.2兩個總體比率之差的區(qū)間估計7.3.3兩個總體方差比的區(qū)間估計7.3兩個總體參數的區(qū)間估計7.3.1兩個總體均值之1487.3.2兩個總體比率之差的區(qū)間估計獨立樣本:兩總體比率之差
在1-置信水平下的置信區(qū)間為7.3.2兩個總體比率之差的區(qū)間估計獨立樣本:149【例】在某個電視節(jié)目的收視率的調查中,在農村隨機調查了400人,有32%的人收
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 北京企業(yè)人力合同范本
- 廠房裝修合同范本及報價
- 光伏人工合同范本
- 2025遼寧省建筑安全員B證考試題庫
- 鄉(xiāng)村土地規(guī)劃合同范本
- 2025吉林省安全員-C證(專職安全員)考試題庫
- 不出錢股協議合同范例
- 三年級口算題集1000道
- 單位財務借款合同范本
- 北京墻面防水采購合同范本
- (正式版)SHT 3227-2024 石油化工裝置固定水噴霧和水(泡沫)噴淋滅火系統(tǒng)技術標準
- 2024屆廣東省深圳市中考物理模擬試卷(一模)(附答案)
- 前庭功能鍛煉科普知識講座
- 供應鏈戰(zhàn)略布局與區(qū)域拓展案例
- 上海話培訓課件
- 注塑車間績效考核方案
- 初中英語閱讀理解專項練習26篇(含答案)
- 誦讀經典傳承文明課件
- 高中數學選擇性必修3 教材習題答案
- 北師大版二年級下冊數學第一單元 除法教案
- 2024年兒童托管行業(yè)分析報告及未來發(fā)展趨勢
評論
0/150
提交評論