




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第四章參數(shù)估計與假設檢驗
第一節(jié)參數(shù)估計的一般問題參數(shù)估計的意義何在?◆人們往往先假定某數(shù)據(jù)來自一個特定的總體族(比如正態(tài)分布族);◆而要確定是總體族的哪個成員(也就是其具體分布)則需要知道總體參數(shù)值(比如總體均值和總體方差);◆于是,人們希望用相應的樣本統(tǒng)計量(比如樣本均值和樣本方差)來估計出相應的總體參數(shù),從而能夠確定總體的分布形態(tài)。一、統(tǒng)計量、估計量、估計值
估計:根據(jù)現(xiàn)有信息對現(xiàn)實世界進行某種判斷。估計量:樣本的(不包含未知總體參數(shù)的)函數(shù)稱為統(tǒng)計量;用于估計總體參數(shù)的統(tǒng)計量稱為估計量(estimator,估計子),如用于估計總體參數(shù)的樣本均值、樣本比率(成數(shù))、樣本方差等。由于一個統(tǒng)計量對于不同的樣本取值不同,所以估計量也是隨機變量,并有其分布。第一節(jié)參數(shù)估計的一般問題估計值:如果樣本已經(jīng)得到,把數(shù)據(jù)帶入之后,估計量就有了一個數(shù)值,稱為該估計量的一個實現(xiàn)(realization)或取值,也稱為一個估計值(estimate)??梢?,統(tǒng)計量是樣本的函數(shù),是對樣本的一個變換。我們之所以進行這種變換,是希望用這個統(tǒng)計量去估計總體的某個參數(shù),或者實現(xiàn)我們的其他目的,比如要檢驗某一個假設。不過,在實際轉換的過程中,一般來說,會有一定的信息損失,也就是說,統(tǒng)計量包含的信息比原始樣本本身包含的信息要少。第一節(jié)參數(shù)估計的一般問題這樣,就可能出現(xiàn)兩種結果:
一種結果是,抓住了問題的實質(zhì),刪繁就簡,只丟掉了一些無關要旨的東西,保存了樣本中關于所要估計的總體參數(shù)的全部信息;另一種結果是,把樣本中關于所要估計的總體參數(shù)的信息喪失了或喪失很多,因此從這個統(tǒng)計量出發(fā)對總體參數(shù)進行推斷,還不如從樣本本身對總體進行推斷。如果這個統(tǒng)計量滿足第一種情況,我們就說它是充分統(tǒng)計量。第一節(jié)參數(shù)估計的一般問題二、點估計與區(qū)間估計點估計(pointestimation):用估計量的實現(xiàn)值來近似相應的總體參數(shù)。區(qū)間估計(intervalestimation):給出包括估計量在內(nèi)(有時是以估計量為中心)的一個區(qū)間;該區(qū)間被認為很可能包含總體參數(shù)。點估計給出一個數(shù)字,用起來很方便;而區(qū)間估計給出一個區(qū)間,說起來留有余地;不像點估計那么絕對。第一節(jié)參數(shù)估計的一般問題三、點估計用什么樣的估計量來估計參數(shù)呢?沒有限制。任何統(tǒng)計量,只要人們覺得合適就可以當成估計量。比如,一位專家來學校進行評估,想了解《概率論與數(shù)理統(tǒng)計》的考試情況,在食堂碰到你,問:你們班這門課的平均成績大概是多少?你說:不太清楚。他只好又問:那你考了多少?你說:38。第一節(jié)參數(shù)估計的一般問題三、點估計那么,什么樣的估計量才算合適呢?從理論上來說,一個合適的估計量至少要具備如下特點:
1、要能夠知道其概率分布;
2、要能夠根據(jù)現(xiàn)有條件算出估計量的值。那么,怎么樣比較不同估計量之間的好壞呢?第一節(jié)參數(shù)估計的一般問題1、無偏性(unbiasedness)
所謂無偏性,就是指我們所選定的估計量的數(shù)學期望等于被估計量,這時統(tǒng)計量的值才能在真實值上下擺動,從而保證用它來估計被估計參數(shù)在理論上沒有偏差。在統(tǒng)計中,人們一般不用樣本方差S2n來估計總體方差,正是因為用樣本方差S2n來估計總體方差是有偏(差)的,而用樣本修正方差S2n-1來估計總體方差是沒有偏(差)的。第一節(jié)參數(shù)估計的一般問題樣本修正方差的無偏性:一個統(tǒng)計實驗第一節(jié)參數(shù)估計的一般問題第一節(jié)參數(shù)估計的一般問題
2、一致性(consistency,相合性)
隨著樣本容量的增大,估計量越來越接近被估計的總體參數(shù)。即:
設為未知參數(shù)θ的估計量,當n→∞時,要求依概率收斂于θ,即第一節(jié)參數(shù)估計的一般問題
2、一致性(consistency)第一節(jié)參數(shù)估計的一般問題
3、有效性(efficiency)
若和均為的無偏估計,且,則稱無偏估計比更有效。若是的無偏估計的最有效者,即具有最小方差,則稱是的最小方差無偏估計。有效性要求估計量的方差要盡可能地小。第一節(jié)參數(shù)估計的一般問題四、區(qū)間估計(IntervalEstimation)
當描述一個人的體重時,你一般可能不會說這個人是76.35公斤,你會說這個人是七八十公斤,或者是在70公斤到80公斤之間。這個范圍就是區(qū)間估計的例子。第一節(jié)參數(shù)估計的一般問題置信度與置信區(qū)間:置信度的概念是大量重復抽樣時的一個漸近概念。類似于“我們目前得到的置信度為95%的置信區(qū)間以概率0.95覆蓋總體真值”的說法是錯誤的。實際上應該說“重復類似的抽樣所得到的大量區(qū)間中有大約95%的覆蓋總體真值(該真值可能永遠未知)。第一節(jié)參數(shù)估計的一般問題
這里的置信區(qū)間(如72,78)是固定的,而總體真值也是固定的值。因此只有兩種可能:或者該區(qū)間包含總體比例,或者不包含;這當中沒有任何概率可言。至于區(qū)間(72,78)是否覆蓋總體真值,除非一個不漏地調(diào)查所有的人,否則永遠也無法知道。第一節(jié)參數(shù)估計的一般問題一、總體方差已知時對總體均值進行區(qū)間估計例
CJW公司是一家專營體育設備和附件的郵購公司。該公司竭盡全力向顧客提供最優(yōu)質(zhì)的服務。為了監(jiān)控公司的服務質(zhì)量,CJW公司每月都要隨機地抽取一個郵購顧客的樣本,并與被抽到的樣本中的每個顧客進行聯(lián)系,詢問他們一系列有關CJW公司服務水平的問題,根據(jù)顧客給出的答案計算出該顧客的滿意分數(shù),這些分數(shù)的范圍從0分(可能的最差等級)到100分(可能的最好等級)。在此基礎上,公司進一步計算出滿意分數(shù)的樣本均值作為CJW公司所有顧客總體的滿意分數(shù)均值的點估計。第二節(jié)總體指標的區(qū)間估計
前面每個月的調(diào)查顯示:盡管各個月的樣本滿意分數(shù)的均值都有變化,但是,滿意分數(shù)的標準差卻穩(wěn)定在20分左右。因此,我們就假定總體的標準差為20分。最近,CJW公司對100名顧客進行了調(diào)查,結果表明:顧客滿意分數(shù)的樣本均值為82。試給出滿意分數(shù)總體均值的區(qū)間估計(置信度95%)。
解:根據(jù)題意可知,n=100,總體標準差σ=20,樣本均值為82。根據(jù)中心極限定理可知,。因此可反查標準正態(tài)分布表求解。第二節(jié)總體指標的區(qū)間估計第二節(jié)總體指標的區(qū)間估計
第二節(jié)總體指標的區(qū)間估計二、總體方差未知時對總體均值進行區(qū)間估計當總體服從正態(tài)分布、方差б2未知時,則用樣本方差代替б2。考慮到樣本方差S2的有偏性和樣本修正方差的無偏性,為提高推斷的準確性,用樣本修正方差S2n-1來代替б2進行估計。第二節(jié)總體指標的區(qū)間估計考察統(tǒng)計量
在T中,分子,分母。因此,T~t(n-1)。因此,要以95%的置信度求出μ的置信區(qū)間,只需借鑒б2已知的做法,反查t分布表,找到一個對稱區(qū)間[-t,t],使P(-t﹤T﹤t)=0.95即可。第二節(jié)總體指標的區(qū)間估計經(jīng)整理,總體均值μ的置信區(qū)間為:在大樣本情況下,也可以用正態(tài)分布代替t分布,也就是用Zα/2代替上式中的tα/2即可。第二節(jié)總體指標的區(qū)間估計
練習:下表是工商07級1班、2班某門課的考試成績。試根據(jù)該樣本數(shù)據(jù)求管理學院2007級學生該門課程成績均值的置信區(qū)間(置信度為95%)。第二節(jié)總體指標的區(qū)間估計
思考:如果這樣做正確的話,隱含的前提假設是什么?第二節(jié)總體指標的區(qū)間估計總體方差未知時對總體均值進行區(qū)間估計:當總體服從正態(tài)分布、方差б2未知時,則用樣本方差代替б2??紤]到樣本方差S2的有偏性和樣本修正方差的無偏性,為提高推斷的準確性,用樣本修正方差S2n-1來代替б2進行估計。
考慮:在這里,我們?yōu)槭裁匆印翱傮w服從正態(tài)分布”這個條件,要是總體不服從正態(tài)分布呢?會有什么問題?第二節(jié)總體指標的區(qū)間估計三、正態(tài)總體方差的區(qū)間估計
1、總體均值μ已知時的區(qū)間估計
2、總體均值μ未知時的區(qū)間估計第二節(jié)總體指標的區(qū)間估計
例從自動機床加工的零件中抽取10件,測得其長度為(單位:mm):12.5,12.12,12.01,12.28,12.09,12.03,12.01,12.11,12.06,12.14。設零件長度服從正態(tài)分布,求零件長度的方差的置信區(qū)間(置信度95%)。解:第二節(jié)總體指標的區(qū)間估計四、兩正態(tài)總體均值差的區(qū)間估計對于兩個相互獨立的正態(tài)總體N(μ1,σ12)、N(μ2,σ22),其樣本均值差
1、σ12、σ22都已知時μ1-μ2的區(qū)間估計
第二節(jié)總體指標的區(qū)間估計
2、σ12=σ22=σ2,但σ2未知時μ1-μ2的區(qū)間估計
第二節(jié)總體指標的區(qū)間估計
同理,在大樣本條件下,。因此,總體比例也可參照總體均值的方法進行估計。第二節(jié)總體指標的區(qū)間估計一、假設檢驗的基本思想第三節(jié)假設檢驗的一般問題一、假設檢驗的基本思想
參數(shù)估計和假設檢驗是統(tǒng)計推斷的兩種方法,只不過角度不同。假設檢驗的基本思路是:事先對總體參數(shù)或分布形式作出某種假設,然后利用樣本信息來判斷是否能推翻原假設。我認為該企業(yè)生產(chǎn)的零件的平均長度為4厘米!第三節(jié)假設檢驗的一般問題一、假設檢驗的基本思想假設檢驗的特點:
采用邏輯上的反證法;
依據(jù)統(tǒng)計上的小概率原理。第三節(jié)假設檢驗的一般問題
例:某廠生產(chǎn)一種標準件,其長度為4厘米,標準差為0.1厘米。進行工藝改革后,抽查了100個零件,測得樣本平均長度為3.94厘米。試以95%的把握程度,檢驗該廠進行工藝改革前后生產(chǎn)的標準件的長度是否發(fā)生了顯著變化。
解:1、區(qū)間估計的方法~Z(0,1);P(-1.96<<1.96)=0.95
即:-1.96<μ<+1.963.94-1.96×0.1/10<μ<3.94+1.96×0.1/10
計算得:3.9204<μ<3.9596
可見,工藝改革后該廠的標準件長度發(fā)生了顯著變化。第三節(jié)假設檢驗的一般問題
解:2、假設檢驗的方法假設工藝改革后標準件長度沒有明顯變化,也即μ=4厘米。應有:
即P(-1.96<<1.96)=0.95
此為小概率事件。小概率事件發(fā)生說明原假設是錯誤的,工藝改革前后標準件長度發(fā)生了顯著變化。第三節(jié)假設檢驗的一般問題二、假設檢驗的過程均值
X=20
總體
我認為人口的平均年齡是50歲1、提出假設
拒絕假設別無選擇3、作出決策
2、抽取隨機樣本
第三節(jié)假設檢驗的一般問題二、假設檢驗的過程假設檢驗的具體步驟:第一,提出原假設(nullhypothesis)和備擇假設(alternativehypothesis);第二,確定合適的檢驗統(tǒng)計量;第三,規(guī)定顯著性水平α;第四,根據(jù)數(shù)據(jù)計算檢驗統(tǒng)計量的實現(xiàn)值;第五,統(tǒng)計決策。第三節(jié)假設檢驗的一般問題原假設的設定原則:在假設檢驗中,一般要設立一個原假設(nullhypothesis);而設立該假設的動機主要是企圖利用人們掌握的反映現(xiàn)實世界的數(shù)據(jù)來找出假設和現(xiàn)實的矛盾,從而否定這個假設。也就是說,假設檢驗都是以否定原假設為目標。如否定不了,那就說明證據(jù)不足,無法否定原假設。但這不等于原假設正確,而是“沒有足夠證據(jù)拒絕原假設”,因此不能“接受原假設”。第三節(jié)假設檢驗的一般問題需要注意的問題:
1、零假設和備擇假設在我們設計的假設檢驗中并不對稱。檢驗統(tǒng)計量的分布是從零假設導出的。第三節(jié)假設檢驗的一般問題第三節(jié)假設檢驗的一般問題需要注意的問題:
2、多數(shù)軟件直接給出p值,而不給出α。p值(p-value)是在零假設下,檢驗統(tǒng)計量取其實現(xiàn)值及(沿著備擇假設的方向)更加極端值的概率。如果p值很小,意味著在零假設下小概率事件發(fā)生。給定p值有很多方便之處。比如α=0.05,而假定所得到的p值等于0.001。這時如果采用p值作為新的顯著性水平,即新的α=0.001,于是就可以說,在顯著性水平為0.001時,拒絕零假設。這樣,拒絕零假設時犯錯誤的概率實際只是α=0.001而不是原來的α=0.05。在這個意義上,p值又稱
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 康復醫(yī)療服務行業(yè)2025年市場供需平衡與需求增長研究報告
- 工業(yè)互聯(lián)網(wǎng)平臺區(qū)塊鏈智能合約安全風險預警與防范策略2025年研究
- 倉儲物流中心滅火系統(tǒng)施工技術方案
- 家居裝修行業(yè)售后服務計劃與保障措施
- 傳統(tǒng)行業(yè)如何利用區(qū)塊鏈提升業(yè)務效率
- 智能家居解決方案2025初步設計評估報告
- 當代藝術在數(shù)字時代的轉型-全面剖析
- 城市雨水排放系統(tǒng)檢測計劃
- 區(qū)塊鏈技術在化妝品產(chǎn)業(yè)中的創(chuàng)新應用與前景
- 2025七年級班主任班級管理創(chuàng)新計劃
- Unit5SectionB2a-2e閱讀課件人教版九年級英語全冊
- 小兒肺炎的護理
- 航道整治試卷A
- 腹腔鏡胃癌根治術護理教學查房
- 幼兒園優(yōu)質(zhì)公開課:中班科學《奇妙的紫甘藍汁》課件
- 地球物理勘探-第三章磁法勘探1
- 卡壓不銹鋼管的施工組織方案
- 2022山東大學出版社校園招聘16人上岸筆試歷年難、易錯點考題附帶參考答案與詳解
- Rexroth (博世力士樂)VFC 3610系列變頻器使用說明書
- DB32/T 4454-2023智慧化工園區(qū)建設規(guī)范
- 插齒機操作規(guī)程
評論
0/150
提交評論