版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第六章參數(shù)估計(jì)1本章主要內(nèi)容:第一節(jié)點(diǎn)估計(jì)第二節(jié)區(qū)間估計(jì)第三節(jié)樣本容量的確定2第一節(jié)點(diǎn)估計(jì)一、點(diǎn)估計(jì)的定義點(diǎn)估計(jì)就是根據(jù)總體參數(shù)與樣本統(tǒng)計(jì)量之間的內(nèi)在聯(lián)系,直接以樣本統(tǒng)計(jì)量作為相應(yīng)總體參數(shù)的估計(jì)量,點(diǎn)估計(jì)又稱為定值估計(jì)。在統(tǒng)計(jì)中經(jīng)常使用的點(diǎn)估計(jì)量有:等號表示用樣本統(tǒng)計(jì)量對應(yīng)總體參數(shù)估計(jì)量例6-1點(diǎn)估計(jì)的優(yōu)點(diǎn)—直接給出總體參數(shù)的估計(jì)值不足:不能提供估計(jì)誤差的信息因此,需要對用于點(diǎn)估計(jì)總體參數(shù)的樣本統(tǒng)計(jì)量進(jìn)行評價(jià)5點(diǎn)估計(jì)的評價(jià)標(biāo)準(zhǔn)無偏性
有效性
一致性無偏性(unbiasedness)無偏性:總體參數(shù)估計(jì)量的抽樣分布均值等于被估計(jì)的總體參數(shù)
P(
)BA無偏有偏7證明:樣本方差S2是總體方差σ2的無偏估計(jì)量,即E(S2)=σ2證:其中:例總體的均值8這就是為什么對總體方差進(jìn)行估計(jì)時(shí),樣本方差公式所除的不是樣本量n,而是n-1的原因。有效性(efficiency)有效性:對于兩個(gè)無偏估計(jì)量如果則說明估計(jì)量AB較小的抽樣分布較大的樣本量P(
)一致性(consistency)一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)大數(shù)定理AB較小的樣本容量較大的樣本容量P(
)由大數(shù)定理我們知道,樣本容量越大,該樣本中獲得的樣本平均數(shù)更容易符合無偏、有效且一致的要求;因?yàn)槌蓴?shù)是一個(gè)特殊的平均數(shù),該結(jié)論對成數(shù)估計(jì)也成立。第二節(jié)區(qū)間估計(jì)一、區(qū)間估計(jì)的含義區(qū)間估計(jì),是估計(jì)總體參數(shù)的區(qū)間范圍,并要求給出區(qū)間估計(jì)成立的概率值。設(shè)和都是兩個(gè)統(tǒng)計(jì)量(),分別作為總體參數(shù)區(qū)間估計(jì)的下限與上限,則要求:區(qū)間估計(jì)彌補(bǔ)了點(diǎn)估計(jì)只給出總體參數(shù)的具體估計(jì)值而沒有說明這個(gè)估計(jì)值的誤差、可靠性的不足區(qū)間估計(jì)中的α(0<α<1)是區(qū)間估計(jì)的顯著性水平,其取值大小由實(shí)際問題確定,經(jīng)常取1%、5%和10%;1-α稱為置信度或置信水平。因此,總體參數(shù)的估計(jì)區(qū)間也稱為置信區(qū)間,其中區(qū)間的最小值稱為置信下限,最大值稱為置信上限。區(qū)間估計(jì)的圖示
x95%的樣本
-1.96
x
+1.96
x99%的樣本
-2.58
x
+2.58
x90%的樣本
-1.65
x
+1.65
x17理解置信區(qū)間例如:抽取100個(gè)樣本,根據(jù)每一個(gè)樣本構(gòu)造一個(gè)置信區(qū)間。這樣,由100個(gè)樣本構(gòu)造的總體參數(shù)的100個(gè)置信區(qū)間中,有95%的區(qū)間包含了總體參數(shù)的真值,而5%則沒包含。這里,95%這個(gè)值稱為置信度,5%稱為顯著性水平。4-18樣本統(tǒng)計(jì)量
(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限4-19我們用95%的置信水平得到某班學(xué)生考試成績的置信區(qū)間為60-80分,如何理解?通常的理解:60-80區(qū)間以95%的概率包含全班同學(xué)平均成績的真值;或以95%的概率保證全班同學(xué)平均成績的真值落在60-80分之間。正確的理解:如果做了多次抽樣(如100次),大概有95次找到的區(qū)間包含真值,有5次找到的區(qū)間不包括真值。真值只有一個(gè),一個(gè)特定的區(qū)間“總是包含”或“絕對不包含”該真值。但是,用概率可以知道在多次抽樣得到的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值。20在實(shí)際問題中,進(jìn)行估計(jì)時(shí)往往只抽取一個(gè)樣本,此時(shí)所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平下的置信區(qū)間。由于該樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,而不再是隨機(jī)區(qū)間,所以無法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值。我們只是希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)。實(shí)際理解:我們有95%的信心相信該班同學(xué)的平均成績的真值落在(60,80)的區(qū)間使用一個(gè)較大的置信水平會(huì)得到一個(gè)比較寬的置信區(qū)間,而使用一個(gè)較大的樣本則會(huì)得到一個(gè)較準(zhǔn)確(較窄)的區(qū)間。直觀地說,較寬的區(qū)間會(huì)有更大的可能性包含參數(shù)但實(shí)際應(yīng)用中,過寬的區(qū)間往往沒有實(shí)際意義比如,天氣預(yù)報(bào)說“在一年內(nèi)會(huì)下一場雨”,雖然這很有把握,但有什么意義呢?另一方面,要求過于準(zhǔn)確(過窄)的區(qū)間同樣不一定有意義,因?yàn)檫^窄的區(qū)間雖然看上去很準(zhǔn)確,但把握性就會(huì)降低,除非無限制增加樣本量,而現(xiàn)實(shí)中樣本量總是有限的區(qū)間估計(jì)總是要給結(jié)論留點(diǎn)兒余地22區(qū)間估計(jì)的基本要素包括:樣本點(diǎn)估計(jì)值、抽樣極限誤差、估計(jì)的置信度樣本點(diǎn)估計(jì)值抽樣極限誤差:可允許的誤差范圍。抽樣估計(jì)的置信度。23注意:本教材所進(jìn)行的區(qū)間估計(jì)僅指對總體平均數(shù)或成數(shù)的區(qū)間估計(jì),并且在際計(jì)算過程中使用下面的式子。式中Δ是極限誤差。244-25區(qū)間估計(jì)的內(nèi)容
2
已知
2未知
均值方差比例置信區(qū)間二、平均數(shù)的區(qū)間估計(jì)1、正態(tài)總體、總體方差已知4-2728即通過移項(xiàng)轉(zhuǎn)化,可得總體均值μ在1-α置信水平下的置信區(qū)間為:臨界值也稱概率度抽樣平均誤差極限誤差△
注意:如果是非重復(fù)抽樣,對抽樣平均誤差的計(jì)算還要乘以修正系數(shù)置信區(qū)間29已知置信區(qū)間求置信度30通過臨界值去查標(biāo)準(zhǔn)正態(tài)分布,可得出上式的置信度是1-α。31極限誤差、抽樣平均誤差與概率度
三者關(guān)系:或者:總體均值的區(qū)間估計(jì)【例6-2】在某天生產(chǎn)的500袋食品中,按不重復(fù)抽樣方法隨機(jī)抽取25袋進(jìn)行檢查,測得平均每袋的重量為996g。已知該種袋裝食品的重量服從正態(tài)分布,且標(biāo)準(zhǔn)差為20g。試1、估計(jì)該種食品平均重量的置信區(qū)間,置信水平為95%。2、如果要求誤差不超過10克,置信度是多少?解:已知X~N(
,202),n=25,1-=95%,z
/2=1.96
總體均值
在1-
置信水平下的置信區(qū)間為置信度為99%當(dāng)總體服從正態(tài)分布但方差未知時(shí),可用樣本的標(biāo)準(zhǔn)差S代替總體標(biāo)準(zhǔn)差。這時(shí),樣本均值經(jīng)標(biāo)準(zhǔn)化處理后的隨機(jī)變量服從自由度為n-1的t分布:342.正態(tài)總體、總體方差未知(即
2未知)
t分布
t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布,一般當(dāng)n≥30時(shí),t分布的密度函數(shù)與標(biāo)準(zhǔn)正態(tài)分布非常接近Xt
分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)Z37
當(dāng)總體服從正態(tài)分布且方差(
2)已知,或者總體不是正態(tài)分布但為大樣本時(shí),樣本均值經(jīng)標(biāo)準(zhǔn)化處理后的隨機(jī)變量服從標(biāo)準(zhǔn)正態(tài)分布:38總體方差已知與未知的區(qū)間估計(jì)39注意:1、當(dāng)樣本數(shù)超過30時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布非常接近,這時(shí)候可以直接從標(biāo)準(zhǔn)正態(tài)分布表查臨界值;2、在總體方差未知時(shí),用樣本方差來代替總體方差,這時(shí),樣本方差的計(jì)算要除以n-1?!纠?-3】麥當(dāng)勞餐館在7星期內(nèi)抽查49位顧客的消費(fèi)額(元)如下,求在置信度90%的保證下,顧客平均消費(fèi)額的估計(jì)區(qū)間。15 24 38 26 30 42 1830 25 26 34 44 20 3524 26 34 48 18 28 4619 30 36 42 24 32 4536 21 47 26 28 31 4245 36 24 28 27 32 3647 53 22 24 32 46 264041例6-342
第二步:根據(jù)給定的置信度90%,查正態(tài)分布概率表得Z=1.64
第三步:計(jì)算極限誤差據(jù)此估計(jì),總體平均消費(fèi)額下限=總體平均消費(fèi)額上限=區(qū)間估計(jì):以90%的置信水平下,麥當(dāng)勞餐館顧客消費(fèi)額在29.8~34.2元之間。4-43
如果不是正態(tài)總體,或分布未知總體方差已知且是大樣本總體方差未知且是大樣本
此時(shí)不考慮小樣本情況因此,大樣本情況下,直接用標(biāo)準(zhǔn)正態(tài)分布求置信區(qū)間即可。成數(shù)指標(biāo)是一個(gè)特殊的平均數(shù)。所以,類似于總體平均數(shù)的區(qū)間估計(jì),總體成數(shù)的區(qū)間估計(jì)是:式中的成數(shù)抽樣平均誤差在重復(fù)抽樣條件下是:44(三)成數(shù)指標(biāo)的區(qū)間估計(jì)在不重復(fù)抽樣的條件下是:
在實(shí)踐中,由于總體成數(shù)常常未知,這時(shí),抽樣平均誤差公式中的總成數(shù)用樣本成數(shù)代替。454-46成數(shù)的區(qū)間估計(jì)由于總體的分布是(0,1)分布,只有在大樣本的情況下,才服從正態(tài)分布??傮w成數(shù)可以看成是一種特殊的平均數(shù),類似于總體平均數(shù)的區(qū)間估計(jì),總體成數(shù)的區(qū)間估計(jì)的上下限是:4-47注意:在實(shí)踐中,由于總體成數(shù)常常未知,這時(shí),抽樣平均誤差公式中的總體成數(shù)用樣本成數(shù)代替。大樣本的條件:np≥5且n(1-p)≥5,由于總體成數(shù)p通常未知,可以用樣本成數(shù)來近似判斷。48【例6-4】某工廠要估計(jì)一批總數(shù)5000件的產(chǎn)品的廢品率,于是隨機(jī)抽出400件產(chǎn)品進(jìn)行檢測,發(fā)現(xiàn)有32件廢品。試給出該批產(chǎn)品的廢品率的區(qū)間估計(jì)(置信度是90%)。49由于np=400×8%=32>5,屬于大樣本場合,這時(shí)候,臨界值可查標(biāo)準(zhǔn)正態(tài)分布表得到。查標(biāo)準(zhǔn)正態(tài)分布表得:解:n=400,N=5000,樣本廢品率P=32/400=8%。置信度1-α=90%,α=10%,α/2=5%。50因此,這批產(chǎn)品廢品率的區(qū)間估計(jì)是:即這批產(chǎn)品的廢品率在5.9%與10.1%之間。51四、樣本容量的確定極限誤差、概率度與抽樣平均誤差三者間的數(shù)量關(guān)系是:當(dāng)抽樣平均誤差保持不變時(shí),極限誤差與概率度兩者間關(guān)系是:Δ減?。ㄌ岣呔龋琙(概率度)也減小了。52因此,抽樣估計(jì)的精度與可靠性之間存在矛盾:(1)要提高精度(Δ減小),需以犧牲概率度(Z減小)為代價(jià);(2)要提高概率度(Z增大),又要以犧牲估計(jì)精度(Δ增大)為代價(jià)。在不變的情況下,這對矛盾是不可調(diào)和的。5354(一)估計(jì)總體均值時(shí)樣本容量的確定55【例6-5】某企業(yè)想估計(jì)其職工上個(gè)月上下班花在路途上的平均時(shí)間。經(jīng)驗(yàn)表明,總體標(biāo)準(zhǔn)差為4.3分鐘。以置信度95%的置信區(qū)間進(jìn)行估計(jì),并使估計(jì)值處在真正平均值附近1分鐘的誤差范圍之內(nèi)。該企業(yè)應(yīng)抽取多大的樣本?解:已知該企業(yè)至少應(yīng)該抽取72名職工作為樣本。例5657(二)估計(jì)成數(shù)時(shí)樣本容量的確定58(三)使用上述公式應(yīng)注意的問題1.計(jì)算樣本容量時(shí),一般總體的方差與成數(shù)都是未知的,可用有關(guān)資料替代:一是用歷史資料已有的方差與成數(shù)代替;二是在進(jìn)行正式抽樣調(diào)查前進(jìn)行幾次試驗(yàn)性調(diào)查,用試驗(yàn)中方差的最大值代替總體方差;三是成數(shù)方差在完全缺乏資料的情況下,就用成數(shù)方差的最大值0.25代替。592.如果進(jìn)行一次抽樣調(diào)查,同時(shí)估計(jì)總體均值與成數(shù),用上面的公式同時(shí)計(jì)算出兩個(gè)樣本容量,應(yīng)取其中最大的結(jié)果,同時(shí)滿足兩方面的需要。3.上面的公式計(jì)算結(jié)果如果帶小數(shù),這時(shí)樣本容量不按四舍五入法則取整數(shù),而是取比這個(gè)數(shù)大的最小整數(shù)代替。例如計(jì)算得到:n=56.3,那么,樣本容量取57,而不是56?!纠?-6】對企業(yè)產(chǎn)品合格率進(jìn)行抽樣調(diào)查,根據(jù)歷史上進(jìn)行的二次調(diào)查資料,合格率分別是15%和13%,這次調(diào)查要求誤差不超過5%,概率保證程度為95%,問至少要抽出多少產(chǎn)品作為樣本?6061
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度離婚協(xié)議書:男方孩子撫養(yǎng)權(quán)及子女監(jiān)護(hù)權(quán)交接與財(cái)產(chǎn)分割合同
- 二零二五年度兒童游樂場租院子合同書
- 二零二五年度股東合同解除及公司盈利預(yù)測協(xié)議
- 二零二五年度摩托車質(zhì)押租賃合同
- 2025年度海上石油平臺柴油運(yùn)輸及維護(hù)合同
- 二零二五年度航空燃油購銷及運(yùn)輸保障合同
- 二零二五年度智慧農(nóng)業(yè)觀光園租賃與運(yùn)營管理合同4篇
- 2025年度木雕工藝品制作木工勞務(wù)分包合同協(xié)議4篇
- 2025版專業(yè)攝影棚租賃合同及服務(wù)協(xié)議4篇
- 二零二五年度木材檢驗(yàn)與認(rèn)證服務(wù)合同-@-2
- 人教版八年級數(shù)學(xué)下冊舉一反三專題17.6勾股定理章末八大題型總結(jié)(培優(yōu)篇)(學(xué)生版+解析)
- 2024屆上海高考語文課內(nèi)古詩文背誦默寫篇目(精校版)
- DL-T5024-2020電力工程地基處理技術(shù)規(guī)程
- 2024年度-美團(tuán)新騎手入門培訓(xùn)
- 初中數(shù)學(xué)要背誦記憶知識點(diǎn)(概念+公式)
- 駕照體檢表完整版本
- 農(nóng)產(chǎn)品農(nóng)藥殘留檢測及風(fēng)險(xiǎn)評估
- 農(nóng)村高中思想政治課時(shí)政教育研究的中期報(bào)告
- 20100927-宣化上人《愣嚴(yán)咒句偈疏解》(簡體全)
- 4-熔化焊與熱切割作業(yè)基礎(chǔ)知識(一)
- 單元教學(xué)評一體化設(shè)計(jì)的探索與實(shí)踐以統(tǒng)編語文教材四年級下冊第一單元為例
評論
0/150
提交評論