第五章參數(shù)估計與假設(shè)檢驗_第1頁
第五章參數(shù)估計與假設(shè)檢驗_第2頁
第五章參數(shù)估計與假設(shè)檢驗_第3頁
第五章參數(shù)估計與假設(shè)檢驗_第4頁
第五章參數(shù)估計與假設(shè)檢驗_第5頁
已閱讀5頁,還剩100頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2023/2/41第五章參數(shù)估計與假設(shè)檢驗2023/2/42學(xué)習(xí)目標掌握估計量的優(yōu)良標準參數(shù)區(qū)間估計的思想與方法參數(shù)假設(shè)檢驗的臨界值法與P值法一定條件下,樣本容量確定的方法2023/2/43重點與難點參數(shù)區(qū)間估計的統(tǒng)計思想估計的可靠程度、平均誤差及極限誤差的關(guān)系臨界值檢驗法的統(tǒng)計思想P值的計算方法及其含義的理解參數(shù)抽樣檢驗中的兩類錯誤及其關(guān)系2023/2/44

第一節(jié)總體參數(shù)估計

一、點估計點估計的定義點估計量的優(yōu)良標準二、區(qū)間估計區(qū)間估計的定義總體均值的區(qū)間估計三、樣本容量的確定2023/2/45一、點估計參數(shù)估計按是否考慮估計誤差的大小及發(fā)生的概率,估計方法分為點估計和區(qū)間估計兩大類。(一)點估計的定義2023/2/46點估計就是根據(jù)總體參數(shù)與樣本統(tǒng)計量之間的內(nèi)在聯(lián)系,直接用作為總體相應(yīng)參數(shù)的估計量,用樣本統(tǒng)計量的某個取值作為總體參數(shù)的估計值。點估計不考慮估計誤差的大小,故不需確定估計量的概率分布。點估計的主要作用是尋找參數(shù)的估計量。點估計有很多具體方法,其中矩估計法、最大似然估計法是最經(jīng)典的方法。矩估計法是用樣本矩來估計總體矩的方法,如用樣本一階原點矩(樣本均值)估計總體一階原點矩(總體均值)。最大似然估計法是利用總體分布信息構(gòu)造出似然函數(shù),然后對似然函數(shù)求解,估計出總體參數(shù)的方法。2023/2/47(二)估計量的評價標準—無偏性

P(

)BA無偏有偏對于參數(shù),若有估計量滿足:,則稱為的無偏估計量。2023/2/48

(二)估計量的評價標準—有效性若有,且,則

相對來說,是的有效估計量。

AB

的抽樣分布的抽樣分布P(

)2023/2/49

(二)估計量的評價標準—一致性當任意給定時,有即當時,依概率收斂于,則稱為的一致估計量,具有一致性。對經(jīng)常使用的點估計量來說,可以證明,它們分別是總體的無偏、有效且滿足一致性要求的優(yōu)良估計量。(一)區(qū)間估計的含義(二)總體均值的區(qū)間估計(三)總體成數(shù)的區(qū)間估計(四)總體方差的區(qū)間估計二、區(qū)間估計2023/2/411(一)區(qū)間估計的含義在概率意義下計算參數(shù)的變化范圍,即區(qū)間估計中的兩個基本要求:置信度:表明估計結(jié)果的可靠性,我們自然希望隨機區(qū)間包含被估參數(shù)的概率越大越好,即隨機區(qū)間的平均長度越長越好。精確度:表明估計結(jié)果的誤差大小。我們自然希望包含被估計參數(shù)的隨機區(qū)間的平均長度越短越好。(一)區(qū)間估計的含義2023/2/412Neyman原則即在保證置信度的前提下,盡可能提高估計的精確度。區(qū)間估計中的一些概念(對于)置信區(qū)間:置信限:顯著性水平:置信水平:區(qū)間估計時應(yīng)考慮的一些具體問題,在對總體均值進行區(qū)間估計時,常常需要考慮總體是否為正態(tài)總體、總體方差是否已知、用于構(gòu)造估計量的樣本是大樣本(n≥30)還是小樣本(n<30)等幾種情況。正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件正態(tài)總體、總體方差未知、小樣本條件

(二)總體均值的區(qū)間估計2023/2/4141.正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件當總體服從正態(tài)分布時(已知),來自該總體的所有容量為n的樣本的均值也服從正態(tài)分布,的數(shù)學(xué)期望為,方差為,即

使用正態(tài)分布統(tǒng)計量z標準化

2023/2/415總體均值

在置信水平下的置信區(qū)間為

總體標準差未知時,可用樣本標準差代替1.正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件抽樣平均誤差抽樣極限誤差2023/2/4160臨界值-z值a/2

a/2

統(tǒng)計量1-置信水平1.正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件置信區(qū)間圖解2023/2/41790%的樣本-1.65+1.6599%的樣本-2.58+2.58

95%的樣本-1.96x+1.96xx1.正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件樣本均值分布圖2023/2/418【例】某審計人員對一家貨運公司8042張收款賬單進行抽樣,從而估計這批賬單的平均賬面金額,該審計人員隨機抽取100份賬單,得樣本平均賬面金額為500元,方差為100,給定顯著性水平,檢驗這批賬單的賬面金額均值的置信區(qū)間?!窘狻恳阎?,置信度,查標準正態(tài)分布表,得即有95%的把握認為區(qū)間(498.04,501.96)包含總體均值。1.正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件2.正態(tài)總體、總體方差未知、小樣本2023/2/419使用t分布統(tǒng)計量估計總體均值

總體均值在1-置信水平下的置信區(qū)間為重復(fù)抽樣

不重復(fù)抽樣2023/2/420【例】某時裝專賣店的管理人員想估計其顧客的平均年齡,隨機抽取了16位顧客進行調(diào)查,得到樣本均值歲,樣本標準差S=8歲。假定顧客的年齡近似服從正態(tài)分布,試求該店全部顧客平均年齡置信度為95%的置信區(qū)間。2.正態(tài)總體、總體方差未知、小樣本2023/2/421【解】因為總體X近似服從正態(tài)分布,未知且n=16,為小樣本,對進行區(qū)間估計須構(gòu)造t統(tǒng)計量。根據(jù),查t分布表得,故總體均值的95%的置信區(qū)間為:即有95%的把握估計顧客的平均年齡在(28,37)之中。2.正態(tài)總體、總體方差未知、小樣本2023/2/422(三)總體成數(shù)的區(qū)間估計在大樣本條件下(或大于等于5),有:

則可利用正態(tài)統(tǒng)計量估計總體成數(shù)的置信區(qū)間。版權(quán)所有BY統(tǒng)計學(xué)課程組(重復(fù)抽樣)(不重復(fù)抽樣)(重復(fù)抽樣)2023/2/423(三)總體成數(shù)的區(qū)間估計總體比例在1-置信水平下的置信區(qū)間為:重復(fù)抽樣時:不重復(fù)抽樣時:版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/424(三)總體成數(shù)的區(qū)間估計【例】一所大學(xué)的保健醫(yī)生想了解學(xué)生戴眼睛的成數(shù),隨機抽選100名學(xué)生,調(diào)查發(fā)現(xiàn)其中31名戴眼睛,試求全校學(xué)生戴眼鏡成數(shù)的置信度為90%的置信區(qū)間?!窘狻恳阎瑸榇髽颖?,由中心極限定理知:(三)總體成數(shù)的區(qū)間估計2023/2/425總體成數(shù)未知,樣本方差P代替,根據(jù),查標準正態(tài)概率分布表,得,則有即有90%的把握估計全校學(xué)生戴眼鏡的成數(shù)在(23.4%,38.6%)之間。2023/2/426(四)總體方差的區(qū)間估計估計一個總體的方差或標準差假設(shè)總體服從正態(tài)分布總體方差的點估計量為,且總體方差在1-置信水平下的置信區(qū)間為版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/427總體方差的區(qū)間估計(圖示)221-2總體方差1-的置信區(qū)間自由度為n-1的22023/2/428【例】假定A品牌25公斤袋裝大米的重量服從正態(tài)分布?,F(xiàn)隨機抽取13袋大米,測得重量分別為24.0、24.2、24.4、24.6、24.7、24.8、25.0、25.1、25.1、25.2、25.3、25.4、25.6公斤,試以95%的置信度估計該品牌袋裝大米重量的標準差。版權(quán)所有BY統(tǒng)計學(xué)課程組總體方差的區(qū)間估計(例題)2023/2/429【解】由于n-1=12,查自由度為12的分布表得:則有:由原始數(shù)據(jù)可計算得到,代入上式便有:

即以95%的置信度估計該品牌袋裝大米重量的標準差在0.34-0.79公斤之間。或總體方差的區(qū)間估計(例題)2023/2/430(五)單側(cè)置信區(qū)間在某些實際問題中,人們可能僅僅關(guān)心參數(shù)的下限或上限,就提出了單側(cè)置信區(qū)間的問題。單側(cè)置信區(qū)間就均值而言,有兩種表示,即:;單側(cè)置信區(qū)間就成數(shù)而言,有兩種表示,即:;單側(cè)置信區(qū)間就方差而言,有兩種表示,即:;將雙側(cè)置信區(qū)間的上限與下限對應(yīng)的分位值按或確定后,計算出下限或上限,即可獲得單側(cè)置信區(qū)間的估計。2023/2/431

(六)區(qū)間估計的基本步驟根據(jù)上述例子,區(qū)間估計的步驟可歸納為:依題意確定待估參數(shù);依題設(shè)條件構(gòu)造與待估參數(shù)相對應(yīng)的估計量;確定估計量的抽樣分布;依估計量的抽樣分布,由給定的置信度計算待估參數(shù)置信區(qū)間的上、下限。2023/2/432三、樣本容量的確定(一)問題的提出(二)處理問題的原則(三)樣本容量確定的方法從推斷來看,要達到估計所要求的精確程度,自然要求樣本容量越大越好;從抽樣來看,增大樣本容量,勢必增加人力、物力,從而導(dǎo)致調(diào)查成本增大,這無疑是不經(jīng)濟的做法。在抽樣推斷中,勢必要在統(tǒng)計推斷的精確度與調(diào)查成本這一對矛盾間進行權(quán)衡。(一)問題的提出2023/2/434(二)處理問題的原則從抽樣角度來看,處理推斷目標實現(xiàn)的精確度與調(diào)查成本間矛盾的原則是:在保證達到推斷目標的要求下,盡量使調(diào)查成本最低。從推斷角度來看,處理統(tǒng)計推斷精確度與調(diào)查成本間矛盾的原則是:在調(diào)查成本一定的情況下,盡量使推斷目標實現(xiàn)的效果好,即估計的精度更高。版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/435(三)樣本容量的確定(簡單隨機抽樣)在費用既定的條件下,從精度要求出發(fā),考慮樣本容量的大小??傮w要求是,抽樣極限誤差不能超過給定的允許誤差。樣本容量的確定,根據(jù)抽樣推斷的目的不同,有估計總體均值與估計總體成數(shù)時的不同的估計公式。2023/2/4361、估計總體均值時,樣本容量的確定抽樣極限誤差不能超過給定的允許誤差的要求,在置信水平的條件下,有:由于

或,將其代入上式有:(重復(fù)抽樣)(不重復(fù)抽樣)【例】一家塑料公司想估計其產(chǎn)品的平均抗拉強度,要求以95%的置信度使估計值在真值附近1公斤/平方厘米的范圍內(nèi)。問該公司應(yīng)抽多少個樣品?經(jīng)驗表明,的估計值可取12.25。1、估計總體均值時,樣本容量的確定2023/2/437【解】已知根據(jù)估計式有:

則該公司至少應(yīng)抽取48個樣品作試驗。2023/2/438版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/4382、估計總體成數(shù)時,樣本容量的確定抽樣極限誤差不能超過給定的允許誤差的要求,在置信水平的條件下,有:由于或,將其代入上式有:

(不重復(fù)抽樣)(重復(fù)抽樣)

2、估計總體成數(shù)時,樣本容量的確定【例】一家市場調(diào)查公司欲估計某地區(qū)有小汽車的家庭所占的比重。要求估計誤差不超過0.05,置信度取95%,問應(yīng)抽取多大容量的樣本?公司調(diào)查人員認為實際的比重不可能大于20%。2023/2/439【解】由于,故有,即該市場調(diào)查公司應(yīng)至少抽取246戶。2023/2/440

第二節(jié)總體參數(shù)檢驗一、假設(shè)檢驗的一般性問題二、幾種常用、具體的參數(shù)檢驗方法版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/441一、假設(shè)檢驗的一般性問題問題的提出解決問題的統(tǒng)計思想單、雙側(cè)檢驗問題統(tǒng)計結(jié)論的兩類錯誤如何確定原假設(shè)與備擇假設(shè)P值檢驗法統(tǒng)計檢驗的顯著性假設(shè)檢驗的步驟2023/2/442

1、問題的提出在許多情況下,總體的分布形式可能是已知的,總體參數(shù)卻是未知的,如果欲知道總體參數(shù)的取值狀態(tài),可對其進行參數(shù)估計;如果欲知道總體參數(shù)是否大于或小于某個假定或給定的值,如食品中農(nóng)藥殘留物是否超過標準等類似問題,可運用假設(shè)檢驗的方法進行推斷。實際上,假設(shè)檢驗是從另外一個角度對總體參數(shù)進行估計。2023/2/4432.假設(shè)的建立所謂假設(shè),就是對總體參數(shù)的具體數(shù)值所作的陳述。假設(shè)檢驗就是運用樣本信息判斷假設(shè)是否成立的過程。假設(shè)檢驗中需要建立原假設(shè)和備擇假設(shè)。原假設(shè)通常是研究者想搜集證據(jù)予以反對的假設(shè),也稱零假設(shè),用表示。備擇假設(shè)通常是研究者想搜集證據(jù)予以支持的假設(shè),也稱研究假設(shè)或替換假設(shè)、對立假設(shè),用表示。2023/2/4442.假設(shè)的建立原假設(shè)與備擇假設(shè)是對立的。在假設(shè)的命題中,需要使用數(shù)學(xué)關(guān)系符號“=,≠,≥,≤,>,<”。規(guī)定:=,≥或≤用在原假設(shè)上;≠,>或<用在備擇假設(shè)上。示例:2023/2/4452.假設(shè)的建立【例】一種零件的生產(chǎn)標準是直徑應(yīng)為10cm,為對生產(chǎn)過程進行控制,質(zhì)量監(jiān)測人員定期對一臺加工機床檢查,確定這臺機床生產(chǎn)的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過程不正常,必須進行調(diào)整。試陳述用來檢驗生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)?!窘狻浚貉芯空呦胧占C據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過程不正?!薄=⒌脑僭O(shè)和備擇假設(shè)為

H0:

10cmH1:

10cm2023/2/4462.假設(shè)的建立【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試陳述用于檢驗的原假設(shè)與備擇假設(shè)?!窘狻浚貉芯空叱闄z的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為

H0:

500H1:

<5002.假設(shè)的建立【例】一家研究機構(gòu)估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構(gòu)隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設(shè)與備擇假設(shè)。【解】研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設(shè)和備擇假設(shè)為:

2023/2/4483.假設(shè)檢驗的基本思想根據(jù)樣本信息對參數(shù)進行檢驗,采用的是一種判斷的方法。以正態(tài)總體的參數(shù)為例,若要判斷其是否等于某個給定的值,直觀的想法就是:首先依樣本構(gòu)造出一個能反映總體參數(shù)的統(tǒng)計量。通過第四章有關(guān)內(nèi)容的論述,我們知道,合適的統(tǒng)計量為樣本均值。由于我們對總體的情況并不了解,所以實際上可能是下列三種情況之一:顯然,在每一種情況下,樣本均值的分布都不同,現(xiàn)把的分布分別記為,如圖5.5所示:2023/2/449如此一來,對μ的檢驗問題就轉(zhuǎn)化為:要根據(jù)樣本信息來判斷樣本均值究竟來自圖5.5中的哪一個分布進而才能確定μ是多少。3.假設(shè)檢驗的基本思想圖5.5樣本均值分布示意圖3.假設(shè)檢驗的基本思想2023/2/450版權(quán)所有BY統(tǒng)計學(xué)課程組樣本均值為一隨機變量,取值于整個橫軸,故它來自圖5.5中任一分

布的可能性都是存在的。不難理解,可能性大小需用概率來描述,即要計算來自某分布的概率。

問題是:來自于哪一個分布的概率必須在確定的分布下才能計算。如

此,既然是問:是否等于某個給定值,那么,不妨就假設(shè)等于

該給定值,當這一假設(shè)成立時,用參數(shù)區(qū)間估計法,易計算出樣本均

值在一定概率下的可能范圍,即有2023/2/451版權(quán)所有BY統(tǒng)計學(xué)課程組從而:,如圖5.5中的區(qū)間如果樣本均值落在這個區(qū)間,則承認原來的假設(shè)是可以接受的,即等于給定值;反之,樣本均值落在區(qū)間之外,則否定這個假設(shè),即認為大于或小于。此例中,我們之所以接受原假設(shè),是因為樣本均值落在區(qū)間內(nèi)的概率為(1-α),有充分地把握;如果樣本均值落在區(qū)間外,則拒絕原假設(shè),這是因為樣本

均值落在區(qū)間外的概率α小,無充分的理由接受原假設(shè)。3.假設(shè)檢驗的基本思想2023/2/452我們將以很大的概率落在的區(qū)間稱為原假設(shè)

顯著性水平為的接受域;將以很小的概率落在的區(qū)間稱為原假設(shè)顯著性水平為的拒絕域;拒絕域與接受域之間臨界點根據(jù)估計量的分布特征、給定的顯著性水平、檢驗的類型查表獲得。通過比較檢驗統(tǒng)計量的值與原假設(shè)臨界值之間的大小,進而對原假設(shè)H0作決策的假設(shè)檢驗方法稱為臨界值檢驗法。3.假設(shè)檢驗的基本思想2023/2/4530臨界值臨界值a/2a/2樣本統(tǒng)計量拒絕H0拒絕H0置信水平3.假設(shè)檢驗的基本思想臨界值檢驗法示意圖(以雙側(cè)檢驗為例)2023/2/454上述的判斷實際上體現(xiàn)著反證法的思想。判斷的基礎(chǔ)是樣本信息,判斷的理論依據(jù)是小概率原理,即小概率事件在一次試驗(或抽樣)中幾乎不發(fā)生。直觀來想,在所做假設(shè)是正確的情況下,那么一次試驗(或抽樣)中人們期望的結(jié)果出現(xiàn)的概率應(yīng)該較大。然而現(xiàn)在的事實卻不是這樣的,期望的結(jié)果出現(xiàn)的概率不僅不大,反而很小,即所謂的小概率事件居然發(fā)生了,這就很不正常了,意味著一次試驗(或抽樣)中出現(xiàn)了出人意料的結(jié)果,也意味著給了我們做出否定原假設(shè)的充分證據(jù)??梢娂僭O(shè)檢驗的思想是從不利于原假設(shè)的角度來對原假設(shè)做決策的。3.假設(shè)檢驗的基本思想2023/2/455因此,當我們拒絕原假設(shè)時,并不意味著原假設(shè)一定是錯誤的,只是說概率意義下接受原假設(shè)的理由很不充分,而否定原假設(shè)的證據(jù)卻非常強。這與數(shù)學(xué)家“證明”某個結(jié)論的方式不同,而有點兒類似于法院里法官的判案方式。并且只要小概率α不等于零,對原假設(shè)做決策就可能錯判,存在做出錯誤選擇的風(fēng)險。3.假設(shè)檢驗的基本思想2023/2/4564.單、雙側(cè)檢驗問題備擇假設(shè)沒有特定的方向性,并含有符號“”的假設(shè)檢驗,稱為雙側(cè)檢驗或雙尾檢驗(two-tailedtest)

備擇假設(shè)具有特定的方向性,并含有符號“>”或“<”的假設(shè)檢驗,稱為單側(cè)檢驗或單尾檢驗(one-tailedtest)備擇假設(shè)的方向為“<”,稱為左側(cè)檢驗

備擇假設(shè)的方向為“>”,稱為右側(cè)檢驗

2023/2/457雙側(cè)檢驗與單側(cè)檢驗的假設(shè)形式

假設(shè)雙側(cè)檢驗單側(cè)檢驗左側(cè)檢驗右側(cè)檢驗原假設(shè)H0:μ

=μ0H0:μ

μ0H0:μ

μ0備擇假設(shè)H1:μ

≠μ0H1:

μ<μ0H1:μ>μ0注:研究者感興趣的是備擇假設(shè),單側(cè)假設(shè)的方向是按備擇假設(shè)的方向來說的。2023/2/4585.統(tǒng)計結(jié)論的兩類錯誤第Ⅰ類錯誤(棄真錯誤)原假設(shè)為真時拒絕原假設(shè)第Ⅰ類錯誤的概率記為,被稱為顯著性水平第Ⅱ類錯誤(納偽錯誤)原假設(shè)為假時未拒絕原假設(shè)第Ⅱ類錯誤的概率記為2023/2/459假設(shè)檢驗中的兩類錯誤的決策結(jié)果陪審團審判H0檢驗裁決實際情況決策實際情況無罪有罪H0為真H0為假無罪正確錯誤未拒絕H0正確決策第Ⅱ類錯誤(β

)有罪錯誤正確拒絕H0第Ⅰ類錯誤(α)正確決策2023/2/460

錯誤和錯誤的關(guān)系同時減少兩類錯誤惟一辦法增加樣本容量!和的關(guān)系就像翹翹板,小就大,大就小2023/2/461

5.統(tǒng)計結(jié)論的兩類錯誤

兩類錯誤的關(guān)系當其他條件不變時,α大則β??;反之,α小必導(dǎo)致β大。換句話說,在其他條件不變的情況下,要同時減小犯兩類錯誤的概率是不可能的。在規(guī)定的顯著性α下,單側(cè)檢驗犯第二類錯誤的可能性小于雙側(cè)檢驗。故統(tǒng)計檢驗中,凡能進行單側(cè)檢驗時就不做雙側(cè)檢驗,以便控制β。其他情況不變時,增加樣本容量n,β值將有效地的減小。其他情況不變,假設(shè)下的μ0與μ1之間的距離將直接影響β值。版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/462

5.統(tǒng)計結(jié)論的兩類錯誤兩類錯誤的控制原則通過以上分析,我們應(yīng)該在合適的α及β的要求下進行統(tǒng)計檢驗。通常α值控制在1%-5%之間,β值多控制在10%-30%之間。統(tǒng)計學(xué)家Neyman和Pearson提出的原則是:版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/4635.統(tǒng)計結(jié)論的兩類錯誤在控制犯第一類錯誤的概率α的條件下,使犯第二類錯誤的概率β盡量減小,其含義是:原假設(shè)要受到維護,使它不至于輕易被否定(因為假設(shè)檢驗時從不利于原假設(shè)的角度來對原假設(shè)作決策的);若檢驗結(jié)果否定了原假設(shè),則說明否定的理由是充分的;同時,犯第一類錯誤的概率α受到控制,亦即作出否定判斷的可靠程度(1-α)得到了保證。版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/4645.統(tǒng)計結(jié)論的兩類錯誤版權(quán)所有BY統(tǒng)計學(xué)課程組本書中的假設(shè)檢驗問題只對犯第一類錯誤的概率α加以限制,而不考慮犯第二類錯誤的概率β,這種方式的假設(shè)檢驗又稱為顯著性檢驗,犯第一類錯誤的概率α稱為顯著性水平,其取值通常需考慮:對原假設(shè)的信心,以及對原假設(shè)作出決策后可能造成的損失,實際運用中,α通常取一些標準化的值,如:0.01、0.05、0.10等。2023/2/465

6.P值檢驗法(概率值檢驗法)在原假設(shè)為真的條件下,檢驗統(tǒng)計量的觀察值大于或等于其計算值的概率雙側(cè)檢驗為分布中兩側(cè)面積的總和反映實際觀測到的數(shù)據(jù)與原假設(shè)之間不一致的程度被稱為觀察到的(或?qū)崪y的)顯著性水平?jīng)Q策規(guī)則:若p值<,拒絕版權(quán)所有BY統(tǒng)計學(xué)課程組6.P值檢驗法/

2/

2Z拒絕H0拒絕H00臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2P值1/2P值雙側(cè)檢驗的P值662023/2/42023/2/467

0臨界值a樣本統(tǒng)計量拒絕H0左側(cè)檢驗的P值置信水平計算出的樣本統(tǒng)計量P值6.P值檢驗法2023/2/4680臨界值a拒絕H0右側(cè)檢驗的P值1-置信水平計算出的樣本統(tǒng)計量P值6.P值檢驗法2023/2/469

6.P值檢驗法P值拒絕H0的力度一般認為P值的大小與拒絕H0的力度有如下的關(guān)系:如果P值小于:(1)0.10,有微弱的證據(jù)表明H0是應(yīng)拒絕的;(2)0.05,有顯著的證據(jù)表明H0是應(yīng)拒絕的;(3)0.01,有很強的證據(jù)表明H0是應(yīng)拒絕的;(4)0.001,有極強的證據(jù)表明H0是應(yīng)拒絕的。當P值小于事先設(shè)定的顯著性水平α?xí)r,就會認為概率如此小的事件居然發(fā)生了,很可能是原假設(shè)有問題,就應(yīng)該拒絕原假設(shè);否則,就只能接受原假設(shè)。版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/470

6.P值檢驗法P值檢驗法的決策規(guī)則為:若P值≤α,則拒絕H0,接受H1;若P值>α,則接受H0,拒絕H1。

版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/471

7.統(tǒng)計檢驗的顯著性“顯著”一詞的一般意思不是“重要的”,而是“非偶然”;但在同級檢驗中,該詞的意思是“只靠抽樣的隨機性不容易出現(xiàn)這樣的結(jié)果”,其中的“不容易”用顯著性水平來具體描述,可見顯著性水平是用來評估檢驗結(jié)果的顯著性的,拒絕原假設(shè),意指檢驗結(jié)果是顯著的;接受原假設(shè),意指檢驗結(jié)果是不顯著的。版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/472顯著性水平和拒絕域(雙側(cè)檢驗)0臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕H0拒絕H01-置信水平H0:μ=μ0,H1:μ≠μ02023/2/473顯著性水平和拒絕域(左側(cè)檢驗)

0臨界值a樣本統(tǒng)計量拒絕H01-置信水平H0:m

m0,H1:m

<m02023/2/474顯著性水平和拒絕域(右側(cè)檢驗)

0臨界值a樣本統(tǒng)計量拒絕H01-置信水平H0:m

m0,H1:m

>m02023/2/475

8.假設(shè)檢驗的步驟根據(jù)實際情況,建立原假設(shè)H0和備擇假設(shè)H1;根據(jù)備擇假設(shè)H1的設(shè)定情況,確定檢驗時單側(cè)檢驗還是雙側(cè)檢驗;確定樣本量和顯著性水平的大小;選擇一個合適的統(tǒng)計量做檢驗量,要求有兩個:一是與原假設(shè)H0有關(guān);二是能確定其抽樣分布;根據(jù)給定的顯著性水平α,在原假設(shè)H0成立時,通過查表得到H0的臨界值,給出H0的拒絕域;8.假設(shè)檢驗的步驟抽取樣本,收集數(shù)據(jù),并依樣本觀察值計算檢驗量w的值(用w’表示);根據(jù)w’計算原假設(shè)H0的P值;作出是否拒絕H0的決策。如果是用臨界值法進行檢驗,則不需要做第(7)步的工作,接受或拒絕原假設(shè)的規(guī)則是:若w’落入H0的拒絕域內(nèi),則拒絕H0。如果用P值法,則不需要做第(5)步的工作,接受或拒絕原假設(shè)的規(guī)則是:若P值小于認定的顯著性水平,則拒絕原假設(shè)。762023/2/42023/2/477

二、幾種常用的參數(shù)檢驗方法版權(quán)所有BY統(tǒng)計學(xué)課程組統(tǒng)計上假設(shè)檢驗的方法很多,若按檢驗量服從的分布來劃分,最基本的檢驗方法有四種,即Z檢驗(或U檢驗)、t檢驗法、檢驗法和F檢驗法??紤]到手工計算P值的麻煩,以及絕大部分統(tǒng)計軟件在輸出檢驗結(jié)果時都有P值,故這里主要介紹臨界值檢驗法。2023/2/478(一)Z檢驗法Z檢驗法是指以服從正態(tài)分布的統(tǒng)計量構(gòu)造檢驗統(tǒng)計量的檢驗方法。主要應(yīng)用場合:已知總體分布的方差時,對一個正態(tài)總體的均值或兩個正態(tài)總體均值的關(guān)系(均值之差)進行檢驗。大樣本下(n>50)只有輕微偏斜的非正態(tài)總體均值和成數(shù)檢驗。大樣本下未知總體方差時的均值和成數(shù)檢驗。版權(quán)所有BY統(tǒng)計學(xué)課程組2023/2/479假設(shè)形式:所構(gòu)造的檢驗量為:1.一個正態(tài)總體均值的檢驗應(yīng)用條件:正態(tài)總體,方差已知;或大樣本下的非正態(tài)總體;或大樣本下方差未知的正態(tài)總體2023/2/480版權(quán)所有BY統(tǒng)計學(xué)課程組【例5.7】完成生產(chǎn)線上某件工作的平均時間不少于15.5分鐘,標準差為3分鐘。隨機抽選的9名職工講授一中心方法,訓(xùn)練期結(jié)束后這9名職工完成此項工作的平均時間為13.5分鐘。這個結(jié)果是否說明用新方法所需時間比用老方法所需時間短?設(shè)α=0.05,并假定完成這項工作的時間服從正態(tài)分布。1.一個正態(tài)總體均值的檢驗1.一個正態(tài)總體均值的檢驗2023/2/481【解】根題意,要檢驗的假設(shè)為:H0:μ≥15.5,H1:μ<15.5由于總體服從正態(tài)分布且總體方差已知,所以選取檢驗統(tǒng)計量檢驗統(tǒng)計量的值為:

查表得Z0.05=1.65,由于Z<-Z0.05,所以拒絕原假設(shè)H0,說明用新方法所需時間明顯較短。2023/2/482假設(shè)形式:構(gòu)造檢驗統(tǒng)計量2.兩個正態(tài)總體均值之差的檢驗應(yīng)用條件:兩個正態(tài)總體,方差已知2023/2/483版權(quán)所有BY統(tǒng)計學(xué)課程組【例5.8】有兩種方法可用于制造某種產(chǎn)品。經(jīng)驗表明,這兩種方法生產(chǎn)的產(chǎn)品的抗拉強度都近似服從正態(tài)分布。方法1和方法2給出的標準差分別為3公斤和4公斤。從方法1和方法2生產(chǎn)的產(chǎn)品分別隨機抽取10個和14個,所得樣本均值分別為20公斤和17公斤。試問,這種方法生產(chǎn)的產(chǎn)品的平均抗拉強度是否不同(α=0.05)?

2.兩個正態(tài)總體均值之差的檢驗2.兩個正態(tài)總體均值之差的檢驗2023/2/484【解】按題意,建立假設(shè):H0:μ1=μ2,H1:μ1≠μ2由于兩個總體都近似服從正態(tài)分布,且總體方差已知,所以選取檢驗統(tǒng)計量:其觀測值為:查表得Z0.025=1.96,由于Z>Z0.025,所以拒絕原假設(shè)H0,即認為這兩種方法不能生產(chǎn)出抗拉強度相同的產(chǎn)品。2023/2/485假設(shè)形式構(gòu)造的檢驗統(tǒng)計量:3.大樣本下總體成數(shù)的檢驗應(yīng)用條件:總體服從二項分布,大樣本3.大樣本下總體成數(shù)的檢驗【例5.9】某公司負責(zé)人發(fā)現(xiàn)開出去的發(fā)票有大量筆誤,而且斷定這些發(fā)票中,錯誤的發(fā)票占20%以上。隨機抽取400張檢查,發(fā)現(xiàn)錯誤的發(fā)票有100張,即占25%,這是否可以證明負責(zé)人的判斷正確(α=0.05)?

3.大樣本下總體成數(shù)的檢驗2023/2/487【解】按題意建立假設(shè):選取檢驗統(tǒng)計量為:其觀測值為:查表得Z0.05=1.65,由于Z>Z0.05,所以拒絕H0,也即認為這些數(shù)據(jù)可以證明負責(zé)人的判斷是正確的。2023/2/488(二)t檢驗法t檢驗法是在未知總體方差而且小樣本時,對一個正態(tài)總體的均值或兩個正態(tài)總體均值的關(guān)系(均值之差)進行檢驗的方法。2023/2/489假設(shè)形式:所構(gòu)造的檢驗量1.一個正態(tài)總體均值的檢驗應(yīng)用條件:正態(tài)總體,方差未知,小樣本2023/2/490【例5.10】某汽車輪胎廠聲稱,該廠一等品輪胎的平均壽命在一定的重量和正常行駛條件下,高于25000公里的國家標準。廠家對一個由15個輪胎組成的隨機樣本進行試驗,得到的平均值和標準差分別為27000公里和5000公里。假定輪胎壽命近似服從正態(tài)分布,試問可否相信產(chǎn)品質(zhì)量同廠家所說的情況相符?(α=0.05)1.一個正態(tài)總體均值的檢驗1.一個正態(tài)總體均值的檢驗2023/2/491【解】依題意,建立假設(shè)H0:μ≤25000,H1:μ>25000由于總體近似服從正態(tài)分布,總體方差未知,且為小樣本;所以選取檢驗統(tǒng)計量:其觀測值為:查自由度為(n-1)=14的t分布表得t0.05(14)=1.7613,由于t<t0.05(14),所以只能接受H0。2.兩個正態(tài)總體均值之差的檢驗應(yīng)用條件:兩個總體均為正態(tài)總體,方差未知但相等,兩個小樣本2023/2/492假設(shè)形式

所構(gòu)造的檢驗量2.兩個正態(tài)總體均值之差的檢驗2023/2/493【例5.11】有甲、乙兩臺機床加工同樣的產(chǎn)品。從它們所生產(chǎn)的產(chǎn)品中分別抽取8件和6件。,假定兩個總體都服從正態(tài)分布,且方差相等,試問甲、乙兩臺機床加工的產(chǎn)品平均直徑有無顯著差異?(α=0.05)2.兩個正態(tài)總體均值之差的檢驗2023/2/494【解】按題意建立假設(shè):H0:μ1=μ2,H1:μ1≠μ2根據(jù)題意,選取檢驗統(tǒng)計量其觀測值為:查t分布表得t0.025(12)=2.1788。由于t<t0.025(12),所以接受H0,即甲、乙兩臺機床加工的產(chǎn)品平均直徑無顯著差異。2023/2/495

Z檢驗法與t檢驗法的總結(jié)綜上所述:Z檢驗法與t檢驗法都針對均值進行檢驗。正態(tài)分布總體下,已知總體方差時用Z檢驗法;未知總體方差且小樣本時用t檢驗法;非正態(tài)分布總體但大樣本下的均值或成數(shù)檢驗用Z檢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論