第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)_第1頁
第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)_第2頁
第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)_第3頁
第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)_第4頁
第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩100頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2023/2/41第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)2023/2/42學(xué)習(xí)目標(biāo)掌握估計(jì)量的優(yōu)良標(biāo)準(zhǔn)參數(shù)區(qū)間估計(jì)的思想與方法參數(shù)假設(shè)檢驗(yàn)的臨界值法與P值法一定條件下,樣本容量確定的方法2023/2/43重點(diǎn)與難點(diǎn)參數(shù)區(qū)間估計(jì)的統(tǒng)計(jì)思想估計(jì)的可靠程度、平均誤差及極限誤差的關(guān)系臨界值檢驗(yàn)法的統(tǒng)計(jì)思想P值的計(jì)算方法及其含義的理解參數(shù)抽樣檢驗(yàn)中的兩類錯(cuò)誤及其關(guān)系2023/2/44

第一節(jié)總體參數(shù)估計(jì)

一、點(diǎn)估計(jì)點(diǎn)估計(jì)的定義點(diǎn)估計(jì)量的優(yōu)良標(biāo)準(zhǔn)二、區(qū)間估計(jì)區(qū)間估計(jì)的定義總體均值的區(qū)間估計(jì)三、樣本容量的確定2023/2/45一、點(diǎn)估計(jì)參數(shù)估計(jì)按是否考慮估計(jì)誤差的大小及發(fā)生的概率,估計(jì)方法分為點(diǎn)估計(jì)和區(qū)間估計(jì)兩大類。(一)點(diǎn)估計(jì)的定義2023/2/46點(diǎn)估計(jì)就是根據(jù)總體參數(shù)與樣本統(tǒng)計(jì)量之間的內(nèi)在聯(lián)系,直接用作為總體相應(yīng)參數(shù)的估計(jì)量,用樣本統(tǒng)計(jì)量的某個(gè)取值作為總體參數(shù)的估計(jì)值。點(diǎn)估計(jì)不考慮估計(jì)誤差的大小,故不需確定估計(jì)量的概率分布。點(diǎn)估計(jì)的主要作用是尋找參數(shù)的估計(jì)量。點(diǎn)估計(jì)有很多具體方法,其中矩估計(jì)法、最大似然估計(jì)法是最經(jīng)典的方法。矩估計(jì)法是用樣本矩來估計(jì)總體矩的方法,如用樣本一階原點(diǎn)矩(樣本均值)估計(jì)總體一階原點(diǎn)矩(總體均值)。最大似然估計(jì)法是利用總體分布信息構(gòu)造出似然函數(shù),然后對似然函數(shù)求解,估計(jì)出總體參數(shù)的方法。2023/2/47(二)估計(jì)量的評價(jià)標(biāo)準(zhǔn)—無偏性

P(

)BA無偏有偏對于參數(shù),若有估計(jì)量滿足:,則稱為的無偏估計(jì)量。2023/2/48

(二)估計(jì)量的評價(jià)標(biāo)準(zhǔn)—有效性若有,且,則

相對來說,是的有效估計(jì)量。

AB

的抽樣分布的抽樣分布P(

)2023/2/49

(二)估計(jì)量的評價(jià)標(biāo)準(zhǔn)—一致性當(dāng)任意給定時(shí),有即當(dāng)時(shí),依概率收斂于,則稱為的一致估計(jì)量,具有一致性。對經(jīng)常使用的點(diǎn)估計(jì)量來說,可以證明,它們分別是總體的無偏、有效且滿足一致性要求的優(yōu)良估計(jì)量。(一)區(qū)間估計(jì)的含義(二)總體均值的區(qū)間估計(jì)(三)總體成數(shù)的區(qū)間估計(jì)(四)總體方差的區(qū)間估計(jì)二、區(qū)間估計(jì)2023/2/411(一)區(qū)間估計(jì)的含義在概率意義下計(jì)算參數(shù)的變化范圍,即區(qū)間估計(jì)中的兩個(gè)基本要求:置信度:表明估計(jì)結(jié)果的可靠性,我們自然希望隨機(jī)區(qū)間包含被估參數(shù)的概率越大越好,即隨機(jī)區(qū)間的平均長度越長越好。精確度:表明估計(jì)結(jié)果的誤差大小。我們自然希望包含被估計(jì)參數(shù)的隨機(jī)區(qū)間的平均長度越短越好。(一)區(qū)間估計(jì)的含義2023/2/412Neyman原則即在保證置信度的前提下,盡可能提高估計(jì)的精確度。區(qū)間估計(jì)中的一些概念(對于)置信區(qū)間:置信限:顯著性水平:置信水平:區(qū)間估計(jì)時(shí)應(yīng)考慮的一些具體問題,在對總體均值進(jìn)行區(qū)間估計(jì)時(shí),常常需要考慮總體是否為正態(tài)總體、總體方差是否已知、用于構(gòu)造估計(jì)量的樣本是大樣本(n≥30)還是小樣本(n<30)等幾種情況。正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件正態(tài)總體、總體方差未知、小樣本條件

(二)總體均值的區(qū)間估計(jì)2023/2/4141.正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件當(dāng)總體服從正態(tài)分布時(shí)(已知),來自該總體的所有容量為n的樣本的均值也服從正態(tài)分布,的數(shù)學(xué)期望為,方差為,即

使用正態(tài)分布統(tǒng)計(jì)量z標(biāo)準(zhǔn)化

2023/2/415總體均值

在置信水平下的置信區(qū)間為

總體標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差代替1.正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件抽樣平均誤差抽樣極限誤差2023/2/4160臨界值-z值a/2

a/2

統(tǒng)計(jì)量1-置信水平1.正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件置信區(qū)間圖解2023/2/41790%的樣本-1.65+1.6599%的樣本-2.58+2.58

95%的樣本-1.96x+1.96xx1.正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件樣本均值分布圖2023/2/418【例】某審計(jì)人員對一家貨運(yùn)公司8042張收款賬單進(jìn)行抽樣,從而估計(jì)這批賬單的平均賬面金額,該審計(jì)人員隨機(jī)抽取100份賬單,得樣本平均賬面金額為500元,方差為100,給定顯著性水平,檢驗(yàn)這批賬單的賬面金額均值的置信區(qū)間?!窘狻恳阎眯哦?,查標(biāo)準(zhǔn)正態(tài)分布表,得即有95%的把握認(rèn)為區(qū)間(498.04,501.96)包含總體均值。1.正態(tài)總體、總體方差已知;或非正態(tài)總體、大樣本條件2.正態(tài)總體、總體方差未知、小樣本2023/2/419使用t分布統(tǒng)計(jì)量估計(jì)總體均值

總體均值在1-置信水平下的置信區(qū)間為重復(fù)抽樣

不重復(fù)抽樣2023/2/420【例】某時(shí)裝專賣店的管理人員想估計(jì)其顧客的平均年齡,隨機(jī)抽取了16位顧客進(jìn)行調(diào)查,得到樣本均值歲,樣本標(biāo)準(zhǔn)差S=8歲。假定顧客的年齡近似服從正態(tài)分布,試求該店全部顧客平均年齡置信度為95%的置信區(qū)間。2.正態(tài)總體、總體方差未知、小樣本2023/2/421【解】因?yàn)榭傮wX近似服從正態(tài)分布,未知且n=16,為小樣本,對進(jìn)行區(qū)間估計(jì)須構(gòu)造t統(tǒng)計(jì)量。根據(jù),查t分布表得,故總體均值的95%的置信區(qū)間為:即有95%的把握估計(jì)顧客的平均年齡在(28,37)之中。2.正態(tài)總體、總體方差未知、小樣本2023/2/422(三)總體成數(shù)的區(qū)間估計(jì)在大樣本條件下(或大于等于5),有:

則可利用正態(tài)統(tǒng)計(jì)量估計(jì)總體成數(shù)的置信區(qū)間。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(重復(fù)抽樣)(不重復(fù)抽樣)(重復(fù)抽樣)2023/2/423(三)總體成數(shù)的區(qū)間估計(jì)總體比例在1-置信水平下的置信區(qū)間為:重復(fù)抽樣時(shí):不重復(fù)抽樣時(shí):版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/424(三)總體成數(shù)的區(qū)間估計(jì)【例】一所大學(xué)的保健醫(yī)生想了解學(xué)生戴眼睛的成數(shù),隨機(jī)抽選100名學(xué)生,調(diào)查發(fā)現(xiàn)其中31名戴眼睛,試求全校學(xué)生戴眼鏡成數(shù)的置信度為90%的置信區(qū)間。【解】已知,為大樣本,由中心極限定理知:(三)總體成數(shù)的區(qū)間估計(jì)2023/2/425總體成數(shù)未知,樣本方差P代替,根據(jù),查標(biāo)準(zhǔn)正態(tài)概率分布表,得,則有即有90%的把握估計(jì)全校學(xué)生戴眼鏡的成數(shù)在(23.4%,38.6%)之間。2023/2/426(四)總體方差的區(qū)間估計(jì)估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差假設(shè)總體服從正態(tài)分布總體方差的點(diǎn)估計(jì)量為,且總體方差在1-置信水平下的置信區(qū)間為版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/427總體方差的區(qū)間估計(jì)(圖示)221-2總體方差1-的置信區(qū)間自由度為n-1的22023/2/428【例】假定A品牌25公斤袋裝大米的重量服從正態(tài)分布。現(xiàn)隨機(jī)抽取13袋大米,測得重量分別為24.0、24.2、24.4、24.6、24.7、24.8、25.0、25.1、25.1、25.2、25.3、25.4、25.6公斤,試以95%的置信度估計(jì)該品牌袋裝大米重量的標(biāo)準(zhǔn)差。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組總體方差的區(qū)間估計(jì)(例題)2023/2/429【解】由于n-1=12,查自由度為12的分布表得:則有:由原始數(shù)據(jù)可計(jì)算得到,代入上式便有:

即以95%的置信度估計(jì)該品牌袋裝大米重量的標(biāo)準(zhǔn)差在0.34-0.79公斤之間。或總體方差的區(qū)間估計(jì)(例題)2023/2/430(五)單側(cè)置信區(qū)間在某些實(shí)際問題中,人們可能僅僅關(guān)心參數(shù)的下限或上限,就提出了單側(cè)置信區(qū)間的問題。單側(cè)置信區(qū)間就均值而言,有兩種表示,即:;單側(cè)置信區(qū)間就成數(shù)而言,有兩種表示,即:;單側(cè)置信區(qū)間就方差而言,有兩種表示,即:;將雙側(cè)置信區(qū)間的上限與下限對應(yīng)的分位值按或確定后,計(jì)算出下限或上限,即可獲得單側(cè)置信區(qū)間的估計(jì)。2023/2/431

(六)區(qū)間估計(jì)的基本步驟根據(jù)上述例子,區(qū)間估計(jì)的步驟可歸納為:依題意確定待估參數(shù);依題設(shè)條件構(gòu)造與待估參數(shù)相對應(yīng)的估計(jì)量;確定估計(jì)量的抽樣分布;依估計(jì)量的抽樣分布,由給定的置信度計(jì)算待估參數(shù)置信區(qū)間的上、下限。2023/2/432三、樣本容量的確定(一)問題的提出(二)處理問題的原則(三)樣本容量確定的方法從推斷來看,要達(dá)到估計(jì)所要求的精確程度,自然要求樣本容量越大越好;從抽樣來看,增大樣本容量,勢必增加人力、物力,從而導(dǎo)致調(diào)查成本增大,這無疑是不經(jīng)濟(jì)的做法。在抽樣推斷中,勢必要在統(tǒng)計(jì)推斷的精確度與調(diào)查成本這一對矛盾間進(jìn)行權(quán)衡。(一)問題的提出2023/2/434(二)處理問題的原則從抽樣角度來看,處理推斷目標(biāo)實(shí)現(xiàn)的精確度與調(diào)查成本間矛盾的原則是:在保證達(dá)到推斷目標(biāo)的要求下,盡量使調(diào)查成本最低。從推斷角度來看,處理統(tǒng)計(jì)推斷精確度與調(diào)查成本間矛盾的原則是:在調(diào)查成本一定的情況下,盡量使推斷目標(biāo)實(shí)現(xiàn)的效果好,即估計(jì)的精度更高。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/435(三)樣本容量的確定(簡單隨機(jī)抽樣)在費(fèi)用既定的條件下,從精度要求出發(fā),考慮樣本容量的大小。總體要求是,抽樣極限誤差不能超過給定的允許誤差。樣本容量的確定,根據(jù)抽樣推斷的目的不同,有估計(jì)總體均值與估計(jì)總體成數(shù)時(shí)的不同的估計(jì)公式。2023/2/4361、估計(jì)總體均值時(shí),樣本容量的確定抽樣極限誤差不能超過給定的允許誤差的要求,在置信水平的條件下,有:由于

或,將其代入上式有:(重復(fù)抽樣)(不重復(fù)抽樣)【例】一家塑料公司想估計(jì)其產(chǎn)品的平均抗拉強(qiáng)度,要求以95%的置信度使估計(jì)值在真值附近1公斤/平方厘米的范圍內(nèi)。問該公司應(yīng)抽多少個(gè)樣品?經(jīng)驗(yàn)表明,的估計(jì)值可取12.25。1、估計(jì)總體均值時(shí),樣本容量的確定2023/2/437【解】已知根據(jù)估計(jì)式有:

則該公司至少應(yīng)抽取48個(gè)樣品作試驗(yàn)。2023/2/438版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/4382、估計(jì)總體成數(shù)時(shí),樣本容量的確定抽樣極限誤差不能超過給定的允許誤差的要求,在置信水平的條件下,有:由于或,將其代入上式有:

(不重復(fù)抽樣)(重復(fù)抽樣)

2、估計(jì)總體成數(shù)時(shí),樣本容量的確定【例】一家市場調(diào)查公司欲估計(jì)某地區(qū)有小汽車的家庭所占的比重。要求估計(jì)誤差不超過0.05,置信度取95%,問應(yīng)抽取多大容量的樣本?公司調(diào)查人員認(rèn)為實(shí)際的比重不可能大于20%。2023/2/439【解】由于,故有,即該市場調(diào)查公司應(yīng)至少抽取246戶。2023/2/440

第二節(jié)總體參數(shù)檢驗(yàn)一、假設(shè)檢驗(yàn)的一般性問題二、幾種常用、具體的參數(shù)檢驗(yàn)方法版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/441一、假設(shè)檢驗(yàn)的一般性問題問題的提出解決問題的統(tǒng)計(jì)思想單、雙側(cè)檢驗(yàn)問題統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤如何確定原假設(shè)與備擇假設(shè)P值檢驗(yàn)法統(tǒng)計(jì)檢驗(yàn)的顯著性假設(shè)檢驗(yàn)的步驟2023/2/442

1、問題的提出在許多情況下,總體的分布形式可能是已知的,總體參數(shù)卻是未知的,如果欲知道總體參數(shù)的取值狀態(tài),可對其進(jìn)行參數(shù)估計(jì);如果欲知道總體參數(shù)是否大于或小于某個(gè)假定或給定的值,如食品中農(nóng)藥殘留物是否超過標(biāo)準(zhǔn)等類似問題,可運(yùn)用假設(shè)檢驗(yàn)的方法進(jìn)行推斷。實(shí)際上,假設(shè)檢驗(yàn)是從另外一個(gè)角度對總體參數(shù)進(jìn)行估計(jì)。2023/2/4432.假設(shè)的建立所謂假設(shè),就是對總體參數(shù)的具體數(shù)值所作的陳述。假設(shè)檢驗(yàn)就是運(yùn)用樣本信息判斷假設(shè)是否成立的過程。假設(shè)檢驗(yàn)中需要建立原假設(shè)和備擇假設(shè)。原假設(shè)通常是研究者想搜集證據(jù)予以反對的假設(shè),也稱零假設(shè),用表示。備擇假設(shè)通常是研究者想搜集證據(jù)予以支持的假設(shè),也稱研究假設(shè)或替換假設(shè)、對立假設(shè),用表示。2023/2/4442.假設(shè)的建立原假設(shè)與備擇假設(shè)是對立的。在假設(shè)的命題中,需要使用數(shù)學(xué)關(guān)系符號“=,≠,≥,≤,>,<”。規(guī)定:=,≥或≤用在原假設(shè)上;≠,>或<用在備擇假設(shè)上。示例:2023/2/4452.假設(shè)的建立【例】一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm,為對生產(chǎn)過程進(jìn)行控制,質(zhì)量監(jiān)測人員定期對一臺加工機(jī)床檢查,確定這臺機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過程不正常,必須進(jìn)行調(diào)整。試陳述用來檢驗(yàn)生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)。【解】:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過程不正?!薄=⒌脑僭O(shè)和備擇假設(shè)為

H0:

10cmH1:

10cm2023/2/4462.假設(shè)的建立【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗(yàn)證該產(chǎn)品制造商的說明是否屬實(shí)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)?!窘狻浚貉芯空叱闄z的意圖是傾向于證實(shí)這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為

H0:

500H1:

<5002.假設(shè)的建立【例】一家研究機(jī)構(gòu)估計(jì),某城市中家庭擁有汽車的比例超過30%。為驗(yàn)證這一估計(jì)是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)?!窘狻垦芯空呦胧占C據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設(shè)和備擇假設(shè)為:

2023/2/4483.假設(shè)檢驗(yàn)的基本思想根據(jù)樣本信息對參數(shù)進(jìn)行檢驗(yàn),采用的是一種判斷的方法。以正態(tài)總體的參數(shù)為例,若要判斷其是否等于某個(gè)給定的值,直觀的想法就是:首先依樣本構(gòu)造出一個(gè)能反映總體參數(shù)的統(tǒng)計(jì)量。通過第四章有關(guān)內(nèi)容的論述,我們知道,合適的統(tǒng)計(jì)量為樣本均值。由于我們對總體的情況并不了解,所以實(shí)際上可能是下列三種情況之一:顯然,在每一種情況下,樣本均值的分布都不同,現(xiàn)把的分布分別記為,如圖5.5所示:2023/2/449如此一來,對μ的檢驗(yàn)問題就轉(zhuǎn)化為:要根據(jù)樣本信息來判斷樣本均值究竟來自圖5.5中的哪一個(gè)分布進(jìn)而才能確定μ是多少。3.假設(shè)檢驗(yàn)的基本思想圖5.5樣本均值分布示意圖3.假設(shè)檢驗(yàn)的基本思想2023/2/450版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組樣本均值為一隨機(jī)變量,取值于整個(gè)橫軸,故它來自圖5.5中任一分

布的可能性都是存在的。不難理解,可能性大小需用概率來描述,即要計(jì)算來自某分布的概率。

問題是:來自于哪一個(gè)分布的概率必須在確定的分布下才能計(jì)算。如

此,既然是問:是否等于某個(gè)給定值,那么,不妨就假設(shè)等于

該給定值,當(dāng)這一假設(shè)成立時(shí),用參數(shù)區(qū)間估計(jì)法,易計(jì)算出樣本均

值在一定概率下的可能范圍,即有2023/2/451版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組從而:,如圖5.5中的區(qū)間如果樣本均值落在這個(gè)區(qū)間,則承認(rèn)原來的假設(shè)是可以接受的,即等于給定值;反之,樣本均值落在區(qū)間之外,則否定這個(gè)假設(shè),即認(rèn)為大于或小于。此例中,我們之所以接受原假設(shè),是因?yàn)闃颖揪德湓趨^(qū)間內(nèi)的概率為(1-α),有充分地把握;如果樣本均值落在區(qū)間外,則拒絕原假設(shè),這是因?yàn)闃颖?/p>

均值落在區(qū)間外的概率α小,無充分的理由接受原假設(shè)。3.假設(shè)檢驗(yàn)的基本思想2023/2/452我們將以很大的概率落在的區(qū)間稱為原假設(shè)

顯著性水平為的接受域;將以很小的概率落在的區(qū)間稱為原假設(shè)顯著性水平為的拒絕域;拒絕域與接受域之間臨界點(diǎn)根據(jù)估計(jì)量的分布特征、給定的顯著性水平、檢驗(yàn)的類型查表獲得。通過比較檢驗(yàn)統(tǒng)計(jì)量的值與原假設(shè)臨界值之間的大小,進(jìn)而對原假設(shè)H0作決策的假設(shè)檢驗(yàn)方法稱為臨界值檢驗(yàn)法。3.假設(shè)檢驗(yàn)的基本思想2023/2/4530臨界值臨界值a/2a/2樣本統(tǒng)計(jì)量拒絕H0拒絕H0置信水平3.假設(shè)檢驗(yàn)的基本思想臨界值檢驗(yàn)法示意圖(以雙側(cè)檢驗(yàn)為例)2023/2/454上述的判斷實(shí)際上體現(xiàn)著反證法的思想。判斷的基礎(chǔ)是樣本信息,判斷的理論依據(jù)是小概率原理,即小概率事件在一次試驗(yàn)(或抽樣)中幾乎不發(fā)生。直觀來想,在所做假設(shè)是正確的情況下,那么一次試驗(yàn)(或抽樣)中人們期望的結(jié)果出現(xiàn)的概率應(yīng)該較大。然而現(xiàn)在的事實(shí)卻不是這樣的,期望的結(jié)果出現(xiàn)的概率不僅不大,反而很小,即所謂的小概率事件居然發(fā)生了,這就很不正常了,意味著一次試驗(yàn)(或抽樣)中出現(xiàn)了出人意料的結(jié)果,也意味著給了我們做出否定原假設(shè)的充分證據(jù)??梢娂僭O(shè)檢驗(yàn)的思想是從不利于原假設(shè)的角度來對原假設(shè)做決策的。3.假設(shè)檢驗(yàn)的基本思想2023/2/455因此,當(dāng)我們拒絕原假設(shè)時(shí),并不意味著原假設(shè)一定是錯(cuò)誤的,只是說概率意義下接受原假設(shè)的理由很不充分,而否定原假設(shè)的證據(jù)卻非常強(qiáng)。這與數(shù)學(xué)家“證明”某個(gè)結(jié)論的方式不同,而有點(diǎn)兒類似于法院里法官的判案方式。并且只要小概率α不等于零,對原假設(shè)做決策就可能錯(cuò)判,存在做出錯(cuò)誤選擇的風(fēng)險(xiǎn)。3.假設(shè)檢驗(yàn)的基本思想2023/2/4564.單、雙側(cè)檢驗(yàn)問題備擇假設(shè)沒有特定的方向性,并含有符號“”的假設(shè)檢驗(yàn),稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailedtest)

備擇假設(shè)具有特定的方向性,并含有符號“>”或“<”的假設(shè)檢驗(yàn),稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)備擇假設(shè)的方向?yàn)椤?lt;”,稱為左側(cè)檢驗(yàn)

備擇假設(shè)的方向?yàn)椤?gt;”,稱為右側(cè)檢驗(yàn)

2023/2/457雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)的假設(shè)形式

假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)H0:μ

=μ0H0:μ

μ0H0:μ

μ0備擇假設(shè)H1:μ

≠μ0H1:

μ<μ0H1:μ>μ0注:研究者感興趣的是備擇假設(shè),單側(cè)假設(shè)的方向是按備擇假設(shè)的方向來說的。2023/2/4585.統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤第Ⅰ類錯(cuò)誤(棄真錯(cuò)誤)原假設(shè)為真時(shí)拒絕原假設(shè)第Ⅰ類錯(cuò)誤的概率記為,被稱為顯著性水平第Ⅱ類錯(cuò)誤(納偽錯(cuò)誤)原假設(shè)為假時(shí)未拒絕原假設(shè)第Ⅱ類錯(cuò)誤的概率記為2023/2/459假設(shè)檢驗(yàn)中的兩類錯(cuò)誤的決策結(jié)果陪審團(tuán)審判H0檢驗(yàn)裁決實(shí)際情況決策實(shí)際情況無罪有罪H0為真H0為假無罪正確錯(cuò)誤未拒絕H0正確決策第Ⅱ類錯(cuò)誤(β

)有罪錯(cuò)誤正確拒絕H0第Ⅰ類錯(cuò)誤(α)正確決策2023/2/460

錯(cuò)誤和錯(cuò)誤的關(guān)系同時(shí)減少兩類錯(cuò)誤惟一辦法增加樣本容量!和的關(guān)系就像翹翹板,小就大,大就小2023/2/461

5.統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤

兩類錯(cuò)誤的關(guān)系當(dāng)其他條件不變時(shí),α大則β??;反之,α小必導(dǎo)致β大。換句話說,在其他條件不變的情況下,要同時(shí)減小犯兩類錯(cuò)誤的概率是不可能的。在規(guī)定的顯著性α下,單側(cè)檢驗(yàn)犯第二類錯(cuò)誤的可能性小于雙側(cè)檢驗(yàn)。故統(tǒng)計(jì)檢驗(yàn)中,凡能進(jìn)行單側(cè)檢驗(yàn)時(shí)就不做雙側(cè)檢驗(yàn),以便控制β。其他情況不變時(shí),增加樣本容量n,β值將有效地的減小。其他情況不變,假設(shè)下的μ0與μ1之間的距離將直接影響β值。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/462

5.統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤兩類錯(cuò)誤的控制原則通過以上分析,我們應(yīng)該在合適的α及β的要求下進(jìn)行統(tǒng)計(jì)檢驗(yàn)。通常α值控制在1%-5%之間,β值多控制在10%-30%之間。統(tǒng)計(jì)學(xué)家Neyman和Pearson提出的原則是:版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/4635.統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤在控制犯第一類錯(cuò)誤的概率α的條件下,使犯第二類錯(cuò)誤的概率β盡量減小,其含義是:原假設(shè)要受到維護(hù),使它不至于輕易被否定(因?yàn)榧僭O(shè)檢驗(yàn)時(shí)從不利于原假設(shè)的角度來對原假設(shè)作決策的);若檢驗(yàn)結(jié)果否定了原假設(shè),則說明否定的理由是充分的;同時(shí),犯第一類錯(cuò)誤的概率α受到控制,亦即作出否定判斷的可靠程度(1-α)得到了保證。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/4645.統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組本書中的假設(shè)檢驗(yàn)問題只對犯第一類錯(cuò)誤的概率α加以限制,而不考慮犯第二類錯(cuò)誤的概率β,這種方式的假設(shè)檢驗(yàn)又稱為顯著性檢驗(yàn),犯第一類錯(cuò)誤的概率α稱為顯著性水平,其取值通常需考慮:對原假設(shè)的信心,以及對原假設(shè)作出決策后可能造成的損失,實(shí)際運(yùn)用中,α通常取一些標(biāo)準(zhǔn)化的值,如:0.01、0.05、0.10等。2023/2/465

6.P值檢驗(yàn)法(概率值檢驗(yàn)法)在原假設(shè)為真的條件下,檢驗(yàn)統(tǒng)計(jì)量的觀察值大于或等于其計(jì)算值的概率雙側(cè)檢驗(yàn)為分布中兩側(cè)面積的總和反映實(shí)際觀測到的數(shù)據(jù)與原假設(shè)之間不一致的程度被稱為觀察到的(或?qū)崪y的)顯著性水平?jīng)Q策規(guī)則:若p值<,拒絕版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組6.P值檢驗(yàn)法/

2/

2Z拒絕H0拒絕H00臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值雙側(cè)檢驗(yàn)的P值662023/2/42023/2/467

0臨界值a樣本統(tǒng)計(jì)量拒絕H0左側(cè)檢驗(yàn)的P值置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值6.P值檢驗(yàn)法2023/2/4680臨界值a拒絕H0右側(cè)檢驗(yàn)的P值1-置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值6.P值檢驗(yàn)法2023/2/469

6.P值檢驗(yàn)法P值拒絕H0的力度一般認(rèn)為P值的大小與拒絕H0的力度有如下的關(guān)系:如果P值小于:(1)0.10,有微弱的證據(jù)表明H0是應(yīng)拒絕的;(2)0.05,有顯著的證據(jù)表明H0是應(yīng)拒絕的;(3)0.01,有很強(qiáng)的證據(jù)表明H0是應(yīng)拒絕的;(4)0.001,有極強(qiáng)的證據(jù)表明H0是應(yīng)拒絕的。當(dāng)P值小于事先設(shè)定的顯著性水平α?xí)r,就會(huì)認(rèn)為概率如此小的事件居然發(fā)生了,很可能是原假設(shè)有問題,就應(yīng)該拒絕原假設(shè);否則,就只能接受原假設(shè)。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/470

6.P值檢驗(yàn)法P值檢驗(yàn)法的決策規(guī)則為:若P值≤α,則拒絕H0,接受H1;若P值>α,則接受H0,拒絕H1。

版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/471

7.統(tǒng)計(jì)檢驗(yàn)的顯著性“顯著”一詞的一般意思不是“重要的”,而是“非偶然”;但在同級檢驗(yàn)中,該詞的意思是“只靠抽樣的隨機(jī)性不容易出現(xiàn)這樣的結(jié)果”,其中的“不容易”用顯著性水平來具體描述,可見顯著性水平是用來評估檢驗(yàn)結(jié)果的顯著性的,拒絕原假設(shè),意指檢驗(yàn)結(jié)果是顯著的;接受原假設(shè),意指檢驗(yàn)結(jié)果是不顯著的。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/472顯著性水平和拒絕域(雙側(cè)檢驗(yàn))0臨界值臨界值a/2a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H01-置信水平H0:μ=μ0,H1:μ≠μ02023/2/473顯著性水平和拒絕域(左側(cè)檢驗(yàn))

0臨界值a樣本統(tǒng)計(jì)量拒絕H01-置信水平H0:m

m0,H1:m

<m02023/2/474顯著性水平和拒絕域(右側(cè)檢驗(yàn))

0臨界值a樣本統(tǒng)計(jì)量拒絕H01-置信水平H0:m

m0,H1:m

>m02023/2/475

8.假設(shè)檢驗(yàn)的步驟根據(jù)實(shí)際情況,建立原假設(shè)H0和備擇假設(shè)H1;根據(jù)備擇假設(shè)H1的設(shè)定情況,確定檢驗(yàn)時(shí)單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn);確定樣本量和顯著性水平的大小;選擇一個(gè)合適的統(tǒng)計(jì)量做檢驗(yàn)量,要求有兩個(gè):一是與原假設(shè)H0有關(guān);二是能確定其抽樣分布;根據(jù)給定的顯著性水平α,在原假設(shè)H0成立時(shí),通過查表得到H0的臨界值,給出H0的拒絕域;8.假設(shè)檢驗(yàn)的步驟抽取樣本,收集數(shù)據(jù),并依樣本觀察值計(jì)算檢驗(yàn)量w的值(用w’表示);根據(jù)w’計(jì)算原假設(shè)H0的P值;作出是否拒絕H0的決策。如果是用臨界值法進(jìn)行檢驗(yàn),則不需要做第(7)步的工作,接受或拒絕原假設(shè)的規(guī)則是:若w’落入H0的拒絕域內(nèi),則拒絕H0。如果用P值法,則不需要做第(5)步的工作,接受或拒絕原假設(shè)的規(guī)則是:若P值小于認(rèn)定的顯著性水平,則拒絕原假設(shè)。762023/2/42023/2/477

二、幾種常用的參數(shù)檢驗(yàn)方法版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組統(tǒng)計(jì)上假設(shè)檢驗(yàn)的方法很多,若按檢驗(yàn)量服從的分布來劃分,最基本的檢驗(yàn)方法有四種,即Z檢驗(yàn)(或U檢驗(yàn))、t檢驗(yàn)法、檢驗(yàn)法和F檢驗(yàn)法??紤]到手工計(jì)算P值的麻煩,以及絕大部分統(tǒng)計(jì)軟件在輸出檢驗(yàn)結(jié)果時(shí)都有P值,故這里主要介紹臨界值檢驗(yàn)法。2023/2/478(一)Z檢驗(yàn)法Z檢驗(yàn)法是指以服從正態(tài)分布的統(tǒng)計(jì)量構(gòu)造檢驗(yàn)統(tǒng)計(jì)量的檢驗(yàn)方法。主要應(yīng)用場合:已知總體分布的方差時(shí),對一個(gè)正態(tài)總體的均值或兩個(gè)正態(tài)總體均值的關(guān)系(均值之差)進(jìn)行檢驗(yàn)。大樣本下(n>50)只有輕微偏斜的非正態(tài)總體均值和成數(shù)檢驗(yàn)。大樣本下未知總體方差時(shí)的均值和成數(shù)檢驗(yàn)。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/479假設(shè)形式:所構(gòu)造的檢驗(yàn)量為:1.一個(gè)正態(tài)總體均值的檢驗(yàn)應(yīng)用條件:正態(tài)總體,方差已知;或大樣本下的非正態(tài)總體;或大樣本下方差未知的正態(tài)總體2023/2/480版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例5.7】完成生產(chǎn)線上某件工作的平均時(shí)間不少于15.5分鐘,標(biāo)準(zhǔn)差為3分鐘。隨機(jī)抽選的9名職工講授一中心方法,訓(xùn)練期結(jié)束后這9名職工完成此項(xiàng)工作的平均時(shí)間為13.5分鐘。這個(gè)結(jié)果是否說明用新方法所需時(shí)間比用老方法所需時(shí)間短?設(shè)α=0.05,并假定完成這項(xiàng)工作的時(shí)間服從正態(tài)分布。1.一個(gè)正態(tài)總體均值的檢驗(yàn)1.一個(gè)正態(tài)總體均值的檢驗(yàn)2023/2/481【解】根題意,要檢驗(yàn)的假設(shè)為:H0:μ≥15.5,H1:μ<15.5由于總體服從正態(tài)分布且總體方差已知,所以選取檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的值為:

查表得Z0.05=1.65,由于Z<-Z0.05,所以拒絕原假設(shè)H0,說明用新方法所需時(shí)間明顯較短。2023/2/482假設(shè)形式:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量2.兩個(gè)正態(tài)總體均值之差的檢驗(yàn)應(yīng)用條件:兩個(gè)正態(tài)總體,方差已知2023/2/483版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例5.8】有兩種方法可用于制造某種產(chǎn)品。經(jīng)驗(yàn)表明,這兩種方法生產(chǎn)的產(chǎn)品的抗拉強(qiáng)度都近似服從正態(tài)分布。方法1和方法2給出的標(biāo)準(zhǔn)差分別為3公斤和4公斤。從方法1和方法2生產(chǎn)的產(chǎn)品分別隨機(jī)抽取10個(gè)和14個(gè),所得樣本均值分別為20公斤和17公斤。試問,這種方法生產(chǎn)的產(chǎn)品的平均抗拉強(qiáng)度是否不同(α=0.05)?

2.兩個(gè)正態(tài)總體均值之差的檢驗(yàn)2.兩個(gè)正態(tài)總體均值之差的檢驗(yàn)2023/2/484【解】按題意,建立假設(shè):H0:μ1=μ2,H1:μ1≠μ2由于兩個(gè)總體都近似服從正態(tài)分布,且總體方差已知,所以選取檢驗(yàn)統(tǒng)計(jì)量:其觀測值為:查表得Z0.025=1.96,由于Z>Z0.025,所以拒絕原假設(shè)H0,即認(rèn)為這兩種方法不能生產(chǎn)出抗拉強(qiáng)度相同的產(chǎn)品。2023/2/485假設(shè)形式構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量:3.大樣本下總體成數(shù)的檢驗(yàn)應(yīng)用條件:總體服從二項(xiàng)分布,大樣本3.大樣本下總體成數(shù)的檢驗(yàn)【例5.9】某公司負(fù)責(zé)人發(fā)現(xiàn)開出去的發(fā)票有大量筆誤,而且斷定這些發(fā)票中,錯(cuò)誤的發(fā)票占20%以上。隨機(jī)抽取400張檢查,發(fā)現(xiàn)錯(cuò)誤的發(fā)票有100張,即占25%,這是否可以證明負(fù)責(zé)人的判斷正確(α=0.05)?

3.大樣本下總體成數(shù)的檢驗(yàn)2023/2/487【解】按題意建立假設(shè):選取檢驗(yàn)統(tǒng)計(jì)量為:其觀測值為:查表得Z0.05=1.65,由于Z>Z0.05,所以拒絕H0,也即認(rèn)為這些數(shù)據(jù)可以證明負(fù)責(zé)人的判斷是正確的。2023/2/488(二)t檢驗(yàn)法t檢驗(yàn)法是在未知總體方差而且小樣本時(shí),對一個(gè)正態(tài)總體的均值或兩個(gè)正態(tài)總體均值的關(guān)系(均值之差)進(jìn)行檢驗(yàn)的方法。2023/2/489假設(shè)形式:所構(gòu)造的檢驗(yàn)量1.一個(gè)正態(tài)總體均值的檢驗(yàn)應(yīng)用條件:正態(tài)總體,方差未知,小樣本2023/2/490【例5.10】某汽車輪胎廠聲稱,該廠一等品輪胎的平均壽命在一定的重量和正常行駛條件下,高于25000公里的國家標(biāo)準(zhǔn)。廠家對一個(gè)由15個(gè)輪胎組成的隨機(jī)樣本進(jìn)行試驗(yàn),得到的平均值和標(biāo)準(zhǔn)差分別為27000公里和5000公里。假定輪胎壽命近似服從正態(tài)分布,試問可否相信產(chǎn)品質(zhì)量同廠家所說的情況相符?(α=0.05)1.一個(gè)正態(tài)總體均值的檢驗(yàn)1.一個(gè)正態(tài)總體均值的檢驗(yàn)2023/2/491【解】依題意,建立假設(shè)H0:μ≤25000,H1:μ>25000由于總體近似服從正態(tài)分布,總體方差未知,且為小樣本;所以選取檢驗(yàn)統(tǒng)計(jì)量:其觀測值為:查自由度為(n-1)=14的t分布表得t0.05(14)=1.7613,由于t<t0.05(14),所以只能接受H0。2.兩個(gè)正態(tài)總體均值之差的檢驗(yàn)應(yīng)用條件:兩個(gè)總體均為正態(tài)總體,方差未知但相等,兩個(gè)小樣本2023/2/492假設(shè)形式

所構(gòu)造的檢驗(yàn)量2.兩個(gè)正態(tài)總體均值之差的檢驗(yàn)2023/2/493【例5.11】有甲、乙兩臺機(jī)床加工同樣的產(chǎn)品。從它們所生產(chǎn)的產(chǎn)品中分別抽取8件和6件。,假定兩個(gè)總體都服從正態(tài)分布,且方差相等,試問甲、乙兩臺機(jī)床加工的產(chǎn)品平均直徑有無顯著差異?(α=0.05)2.兩個(gè)正態(tài)總體均值之差的檢驗(yàn)2023/2/494【解】按題意建立假設(shè):H0:μ1=μ2,H1:μ1≠μ2根據(jù)題意,選取檢驗(yàn)統(tǒng)計(jì)量其觀測值為:查t分布表得t0.025(12)=2.1788。由于t<t0.025(12),所以接受H0,即甲、乙兩臺機(jī)床加工的產(chǎn)品平均直徑無顯著差異。2023/2/495

Z檢驗(yàn)法與t檢驗(yàn)法的總結(jié)綜上所述:Z檢驗(yàn)法與t檢驗(yàn)法都針對均值進(jìn)行檢驗(yàn)。正態(tài)分布總體下,已知總體方差時(shí)用Z檢驗(yàn)法;未知總體方差且小樣本時(shí)用t檢驗(yàn)法;非正態(tài)分布總體但大樣本下的均值或成數(shù)檢驗(yàn)用Z檢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論