第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)

上傳人：q*** IP屬地：湖北上傳時(shí)間：2023-02-05 格式：PPT 頁數(shù)：105 大?。?.10MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩100頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2023/2/41第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)2023/2/42學(xué)習(xí)目標(biāo)掌握估計(jì)量的優(yōu)良標(biāo)準(zhǔn)參數(shù)區(qū)間估計(jì)的思想與方法參數(shù)假設(shè)檢驗(yàn)的臨界值法與P值法一定條件下，樣本容量確定的方法2023/2/43重點(diǎn)與難點(diǎn)參數(shù)區(qū)間估計(jì)的統(tǒng)計(jì)思想估計(jì)的可靠程度、平均誤差及極限誤差的關(guān)系臨界值檢驗(yàn)法的統(tǒng)計(jì)思想P值的計(jì)算方法及其含義的理解參數(shù)抽樣檢驗(yàn)中的兩類錯(cuò)誤及其關(guān)系2023/2/44

第一節(jié)總體參數(shù)估計(jì)

一、點(diǎn)估計(jì)點(diǎn)估計(jì)的定義點(diǎn)估計(jì)量的優(yōu)良標(biāo)準(zhǔn)二、區(qū)間估計(jì)區(qū)間估計(jì)的定義總體均值的區(qū)間估計(jì)三、樣本容量的確定2023/2/45一、點(diǎn)估計(jì)參數(shù)估計(jì)按是否考慮估計(jì)誤差的大小及發(fā)生的概率，估計(jì)方法分為點(diǎn)估計(jì)和區(qū)間估計(jì)兩大類。（一）點(diǎn)估計(jì)的定義2023/2/46點(diǎn)估計(jì)就是根據(jù)總體參數(shù)與樣本統(tǒng)計(jì)量之間的內(nèi)在聯(lián)系，直接用作為總體相應(yīng)參數(shù)的估計(jì)量，用樣本統(tǒng)計(jì)量的某個(gè)取值作為總體參數(shù)的估計(jì)值。點(diǎn)估計(jì)不考慮估計(jì)誤差的大小，故不需確定估計(jì)量的概率分布。點(diǎn)估計(jì)的主要作用是尋找參數(shù)的估計(jì)量。點(diǎn)估計(jì)有很多具體方法，其中矩估計(jì)法、最大似然估計(jì)法是最經(jīng)典的方法。矩估計(jì)法是用樣本矩來估計(jì)總體矩的方法，如用樣本一階原點(diǎn)矩（樣本均值）估計(jì)總體一階原點(diǎn)矩（總體均值）。最大似然估計(jì)法是利用總體分布信息構(gòu)造出似然函數(shù)，然后對似然函數(shù)求解，估計(jì)出總體參數(shù)的方法。2023/2/47（二）估計(jì)量的評價(jià)標(biāo)準(zhǔn)—無偏性

)BA無偏有偏對于參數(shù)，若有估計(jì)量滿足：,則稱為的無偏估計(jì)量。2023/2/48

（二）估計(jì)量的評價(jià)標(biāo)準(zhǔn)—有效性若有，且，則

相對來說，是的有效估計(jì)量。

的抽樣分布的抽樣分布P(

)2023/2/49

（二）估計(jì)量的評價(jià)標(biāo)準(zhǔn)—一致性當(dāng)任意給定時(shí)，有即當(dāng)時(shí)，依概率收斂于,則稱為的一致估計(jì)量，具有一致性。對經(jīng)常使用的點(diǎn)估計(jì)量來說，可以證明，它們分別是總體的無偏、有效且滿足一致性要求的優(yōu)良估計(jì)量。（一）區(qū)間估計(jì)的含義（二）總體均值的區(qū)間估計(jì)（三）總體成數(shù)的區(qū)間估計(jì)（四）總體方差的區(qū)間估計(jì)二、區(qū)間估計(jì)2023/2/411（一）區(qū)間估計(jì)的含義在概率意義下計(jì)算參數(shù)的變化范圍，即區(qū)間估計(jì)中的兩個(gè)基本要求:置信度：表明估計(jì)結(jié)果的可靠性，我們自然希望隨機(jī)區(qū)間包含被估參數(shù)的概率越大越好，即隨機(jī)區(qū)間的平均長度越長越好。精確度：表明估計(jì)結(jié)果的誤差大小。我們自然希望包含被估計(jì)參數(shù)的隨機(jī)區(qū)間的平均長度越短越好。（一）區(qū)間估計(jì)的含義2023/2/412Neyman原則即在保證置信度的前提下，盡可能提高估計(jì)的精確度。區(qū)間估計(jì)中的一些概念（對于）置信區(qū)間：置信限：顯著性水平：置信水平：區(qū)間估計(jì)時(shí)應(yīng)考慮的一些具體問題,在對總體均值進(jìn)行區(qū)間估計(jì)時(shí)，常常需要考慮總體是否為正態(tài)總體、總體方差是否已知、用于構(gòu)造估計(jì)量的樣本是大樣本(n≥30)還是小樣本(n＜30)等幾種情況。正態(tài)總體、總體方差已知；或非正態(tài)總體、大樣本條件正態(tài)總體、總體方差未知、小樣本條件

(二)總體均值的區(qū)間估計(jì)2023/2/4141.正態(tài)總體、總體方差已知；或非正態(tài)總體、大樣本條件當(dāng)總體服從正態(tài)分布時(shí)(已知)，來自該總體的所有容量為n的樣本的均值也服從正態(tài)分布，的數(shù)學(xué)期望為，方差為，即

使用正態(tài)分布統(tǒng)計(jì)量z標(biāo)準(zhǔn)化

2023/2/415總體均值

在置信水平下的置信區(qū)間為

總體標(biāo)準(zhǔn)差未知時(shí)，可用樣本標(biāo)準(zhǔn)差代替1.正態(tài)總體、總體方差已知；或非正態(tài)總體、大樣本條件抽樣平均誤差抽樣極限誤差2023/2/4160臨界值-z值a/2

a/2

統(tǒng)計(jì)量1-置信水平1.正態(tài)總體、總體方差已知；或非正態(tài)總體、大樣本條件置信區(qū)間圖解2023/2/41790%的樣本-1.65+1.6599%的樣本-2.58+2.58

95%的樣本-1.96x+1.96xx1.正態(tài)總體、總體方差已知；或非正態(tài)總體、大樣本條件樣本均值分布圖2023/2/418【例】某審計(jì)人員對一家貨運(yùn)公司8042張收款賬單進(jìn)行抽樣，從而估計(jì)這批賬單的平均賬面金額，該審計(jì)人員隨機(jī)抽取100份賬單，得樣本平均賬面金額為500元，方差為100，給定顯著性水平，檢驗(yàn)這批賬單的賬面金額均值的置信區(qū)間?！窘狻恳阎眯哦?，查標(biāo)準(zhǔn)正態(tài)分布表，得即有95%的把握認(rèn)為區(qū)間（498.04，501.96）包含總體均值。1.正態(tài)總體、總體方差已知；或非正態(tài)總體、大樣本條件2.正態(tài)總體、總體方差未知、小樣本2023/2/419使用t分布統(tǒng)計(jì)量估計(jì)總體均值

總體均值在1-置信水平下的置信區(qū)間為重復(fù)抽樣

不重復(fù)抽樣2023/2/420【例】某時(shí)裝專賣店的管理人員想估計(jì)其顧客的平均年齡，隨機(jī)抽取了16位顧客進(jìn)行調(diào)查，得到樣本均值歲，樣本標(biāo)準(zhǔn)差S=8歲。假定顧客的年齡近似服從正態(tài)分布，試求該店全部顧客平均年齡置信度為95%的置信區(qū)間。2.正態(tài)總體、總體方差未知、小樣本2023/2/421【解】因?yàn)榭傮wX近似服從正態(tài)分布，未知且n=16，為小樣本，對進(jìn)行區(qū)間估計(jì)須構(gòu)造t統(tǒng)計(jì)量。根據(jù)，查t分布表得，故總體均值的95%的置信區(qū)間為：即有95%的把握估計(jì)顧客的平均年齡在（28，37）之中。2.正態(tài)總體、總體方差未知、小樣本2023/2/422(三)總體成數(shù)的區(qū)間估計(jì)在大樣本條件下（或大于等于5），有：

則可利用正態(tài)統(tǒng)計(jì)量估計(jì)總體成數(shù)的置信區(qū)間。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組（重復(fù)抽樣）（不重復(fù)抽樣）（重復(fù)抽樣）2023/2/423(三)總體成數(shù)的區(qū)間估計(jì)總體比例在1-置信水平下的置信區(qū)間為：重復(fù)抽樣時(shí)：不重復(fù)抽樣時(shí)：版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/424(三)總體成數(shù)的區(qū)間估計(jì)【例】一所大學(xué)的保健醫(yī)生想了解學(xué)生戴眼睛的成數(shù)，隨機(jī)抽選100名學(xué)生，調(diào)查發(fā)現(xiàn)其中31名戴眼睛，試求全校學(xué)生戴眼鏡成數(shù)的置信度為90%的置信區(qū)間?！窘狻恳阎瑸榇髽颖?，由中心極限定理知：(三)總體成數(shù)的區(qū)間估計(jì)2023/2/425總體成數(shù)未知，樣本方差P代替，根據(jù)，查標(biāo)準(zhǔn)正態(tài)概率分布表，得，則有即有90%的把握估計(jì)全校學(xué)生戴眼鏡的成數(shù)在（23.4%，38.6%）之間。2023/2/426(四)總體方差的區(qū)間估計(jì)估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差假設(shè)總體服從正態(tài)分布總體方差的點(diǎn)估計(jì)量為，且總體方差在1-置信水平下的置信區(qū)間為版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/427總體方差的區(qū)間估計(jì)(圖示)221-2總體方差1-的置信區(qū)間自由度為n-1的22023/2/428【例】假定A品牌25公斤袋裝大米的重量服從正態(tài)分布?，F(xiàn)隨機(jī)抽取13袋大米，測得重量分別為24.0、24.2、24.4、24.6、24.7、24.8、25.0、25.1、25.1、25.2、25.3、25.4、25.6公斤，試以95%的置信度估計(jì)該品牌袋裝大米重量的標(biāo)準(zhǔn)差。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組總體方差的區(qū)間估計(jì)(例題)2023/2/429【解】由于n-1=12，查自由度為12的分布表得：則有：由原始數(shù)據(jù)可計(jì)算得到，代入上式便有：

即以95%的置信度估計(jì)該品牌袋裝大米重量的標(biāo)準(zhǔn)差在0.34-0.79公斤之間?；蚩傮w方差的區(qū)間估計(jì)(例題)2023/2/430（五）單側(cè)置信區(qū)間在某些實(shí)際問題中，人們可能僅僅關(guān)心參數(shù)的下限或上限，就提出了單側(cè)置信區(qū)間的問題。單側(cè)置信區(qū)間就均值而言，有兩種表示，即：；單側(cè)置信區(qū)間就成數(shù)而言，有兩種表示，即：；單側(cè)置信區(qū)間就方差而言，有兩種表示，即：；將雙側(cè)置信區(qū)間的上限與下限對應(yīng)的分位值按或確定后，計(jì)算出下限或上限，即可獲得單側(cè)置信區(qū)間的估計(jì)。2023/2/431

（六）區(qū)間估計(jì)的基本步驟根據(jù)上述例子，區(qū)間估計(jì)的步驟可歸納為：依題意確定待估參數(shù)；依題設(shè)條件構(gòu)造與待估參數(shù)相對應(yīng)的估計(jì)量；確定估計(jì)量的抽樣分布；依估計(jì)量的抽樣分布，由給定的置信度計(jì)算待估參數(shù)置信區(qū)間的上、下限。2023/2/432三、樣本容量的確定（一）問題的提出（二）處理問題的原則（三）樣本容量確定的方法從推斷來看，要達(dá)到估計(jì)所要求的精確程度，自然要求樣本容量越大越好；從抽樣來看，增大樣本容量，勢必增加人力、物力，從而導(dǎo)致調(diào)查成本增大，這無疑是不經(jīng)濟(jì)的做法。在抽樣推斷中，勢必要在統(tǒng)計(jì)推斷的精確度與調(diào)查成本這一對矛盾間進(jìn)行權(quán)衡。（一）問題的提出2023/2/434（二）處理問題的原則從抽樣角度來看，處理推斷目標(biāo)實(shí)現(xiàn)的精確度與調(diào)查成本間矛盾的原則是：在保證達(dá)到推斷目標(biāo)的要求下，盡量使調(diào)查成本最低。從推斷角度來看，處理統(tǒng)計(jì)推斷精確度與調(diào)查成本間矛盾的原則是：在調(diào)查成本一定的情況下，盡量使推斷目標(biāo)實(shí)現(xiàn)的效果好，即估計(jì)的精度更高。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/435（三）樣本容量的確定（簡單隨機(jī)抽樣）在費(fèi)用既定的條件下，從精度要求出發(fā)，考慮樣本容量的大小?？傮w要求是，抽樣極限誤差不能超過給定的允許誤差。樣本容量的確定，根據(jù)抽樣推斷的目的不同，有估計(jì)總體均值與估計(jì)總體成數(shù)時(shí)的不同的估計(jì)公式。2023/2/4361、估計(jì)總體均值時(shí)，樣本容量的確定抽樣極限誤差不能超過給定的允許誤差的要求，在置信水平的條件下，有：由于

或，將其代入上式有：（重復(fù)抽樣）（不重復(fù)抽樣）【例】一家塑料公司想估計(jì)其產(chǎn)品的平均抗拉強(qiáng)度，要求以95%的置信度使估計(jì)值在真值附近1公斤/平方厘米的范圍內(nèi)。問該公司應(yīng)抽多少個(gè)樣品？經(jīng)驗(yàn)表明，的估計(jì)值可取12.25。1、估計(jì)總體均值時(shí)，樣本容量的確定2023/2/437【解】已知根據(jù)估計(jì)式有：

則該公司至少應(yīng)抽取48個(gè)樣品作試驗(yàn)。2023/2/438版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/4382、估計(jì)總體成數(shù)時(shí)，樣本容量的確定抽樣極限誤差不能超過給定的允許誤差的要求，在置信水平的條件下，有：由于或，將其代入上式有：

(不重復(fù)抽樣)(重復(fù)抽樣)

2、估計(jì)總體成數(shù)時(shí)，樣本容量的確定【例】一家市場調(diào)查公司欲估計(jì)某地區(qū)有小汽車的家庭所占的比重。要求估計(jì)誤差不超過0.05，置信度取95%，問應(yīng)抽取多大容量的樣本？公司調(diào)查人員認(rèn)為實(shí)際的比重不可能大于20%。2023/2/439【解】由于，故有，即該市場調(diào)查公司應(yīng)至少抽取246戶。2023/2/440

第二節(jié)總體參數(shù)檢驗(yàn)一、假設(shè)檢驗(yàn)的一般性問題二、幾種常用、具體的參數(shù)檢驗(yàn)方法版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/441一、假設(shè)檢驗(yàn)的一般性問題問題的提出解決問題的統(tǒng)計(jì)思想單、雙側(cè)檢驗(yàn)問題統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤如何確定原假設(shè)與備擇假設(shè)P值檢驗(yàn)法統(tǒng)計(jì)檢驗(yàn)的顯著性假設(shè)檢驗(yàn)的步驟2023/2/442

1、問題的提出在許多情況下，總體的分布形式可能是已知的，總體參數(shù)卻是未知的，如果欲知道總體參數(shù)的取值狀態(tài)，可對其進(jìn)行參數(shù)估計(jì)；如果欲知道總體參數(shù)是否大于或小于某個(gè)假定或給定的值，如食品中農(nóng)藥殘留物是否超過標(biāo)準(zhǔn)等類似問題，可運(yùn)用假設(shè)檢驗(yàn)的方法進(jìn)行推斷。實(shí)際上，假設(shè)檢驗(yàn)是從另外一個(gè)角度對總體參數(shù)進(jìn)行估計(jì)。2023/2/4432.假設(shè)的建立所謂假設(shè)，就是對總體參數(shù)的具體數(shù)值所作的陳述。假設(shè)檢驗(yàn)就是運(yùn)用樣本信息判斷假設(shè)是否成立的過程。假設(shè)檢驗(yàn)中需要建立原假設(shè)和備擇假設(shè)。原假設(shè)通常是研究者想搜集證據(jù)予以反對的假設(shè)，也稱零假設(shè)，用表示。備擇假設(shè)通常是研究者想搜集證據(jù)予以支持的假設(shè)，也稱研究假設(shè)或替換假設(shè)、對立假設(shè)，用表示。2023/2/4442.假設(shè)的建立原假設(shè)與備擇假設(shè)是對立的。在假設(shè)的命題中，需要使用數(shù)學(xué)關(guān)系符號“＝，≠，≥，≤，＞，＜”。規(guī)定：＝，≥或≤用在原假設(shè)上；≠，＞或＜用在備擇假設(shè)上。示例：2023/2/4452.假設(shè)的建立【例】一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm，為對生產(chǎn)過程進(jìn)行控制，質(zhì)量監(jiān)測人員定期對一臺加工機(jī)床檢查，確定這臺機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm，則表明生產(chǎn)過程不正常，必須進(jìn)行調(diào)整。試陳述用來檢驗(yàn)生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)。【解】：研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過程不正?！?。建立的原假設(shè)和備擇假設(shè)為

H0：

10cmH1：

10cm2023/2/4462.假設(shè)的建立【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱：平均凈含量不少于500克。從消費(fèi)者的利益出發(fā)，有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗(yàn)證該產(chǎn)品制造商的說明是否屬實(shí)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)。【解】：研究者抽檢的意圖是傾向于證實(shí)這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為

H0：

500H1：

<5002.假設(shè)的建立【例】一家研究機(jī)構(gòu)估計(jì)，某城市中家庭擁有汽車的比例超過30%。為驗(yàn)證這一估計(jì)是否正確，該研究機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)?！窘狻垦芯空呦胧占C據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設(shè)和備擇假設(shè)為:

2023/2/4483.假設(shè)檢驗(yàn)的基本思想根據(jù)樣本信息對參數(shù)進(jìn)行檢驗(yàn)，采用的是一種判斷的方法。以正態(tài)總體的參數(shù)為例，若要判斷其是否等于某個(gè)給定的值，直觀的想法就是：首先依樣本構(gòu)造出一個(gè)能反映總體參數(shù)的統(tǒng)計(jì)量。通過第四章有關(guān)內(nèi)容的論述，我們知道，合適的統(tǒng)計(jì)量為樣本均值。由于我們對總體的情況并不了解，所以實(shí)際上可能是下列三種情況之一：顯然，在每一種情況下，樣本均值的分布都不同，現(xiàn)把的分布分別記為,如圖5.5所示：2023/2/449如此一來，對μ的檢驗(yàn)問題就轉(zhuǎn)化為：要根據(jù)樣本信息來判斷樣本均值究竟來自圖5.5中的哪一個(gè)分布進(jìn)而才能確定μ是多少。3.假設(shè)檢驗(yàn)的基本思想圖5.5樣本均值分布示意圖3.假設(shè)檢驗(yàn)的基本思想2023/2/450版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組樣本均值為一隨機(jī)變量，取值于整個(gè)橫軸，故它來自圖5.5中任一分

布的可能性都是存在的。不難理解，可能性大小需用概率來描述，即要計(jì)算來自某分布的概率。

問題是：來自于哪一個(gè)分布的概率必須在確定的分布下才能計(jì)算。如

此，既然是問：是否等于某個(gè)給定值，那么，不妨就假設(shè)等于

該給定值，當(dāng)這一假設(shè)成立時(shí)，用參數(shù)區(qū)間估計(jì)法，易計(jì)算出樣本均

值在一定概率下的可能范圍，即有2023/2/451版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組從而：，如圖5.5中的區(qū)間如果樣本均值落在這個(gè)區(qū)間，則承認(rèn)原來的假設(shè)是可以接受的，即等于給定值；反之，樣本均值落在區(qū)間之外，則否定這個(gè)假設(shè)，即認(rèn)為大于或小于。此例中，我們之所以接受原假設(shè)，是因?yàn)闃颖揪德湓趨^(qū)間內(nèi)的概率為（1-α），有充分地把握；如果樣本均值落在區(qū)間外，則拒絕原假設(shè)，這是因?yàn)闃颖?/p>

均值落在區(qū)間外的概率α小，無充分的理由接受原假設(shè)。3.假設(shè)檢驗(yàn)的基本思想2023/2/452我們將以很大的概率落在的區(qū)間稱為原假設(shè)

顯著性水平為的接受域；將以很小的概率落在的區(qū)間稱為原假設(shè)顯著性水平為的拒絕域；拒絕域與接受域之間臨界點(diǎn)根據(jù)估計(jì)量的分布特征、給定的顯著性水平、檢驗(yàn)的類型查表獲得。通過比較檢驗(yàn)統(tǒng)計(jì)量的值與原假設(shè)臨界值之間的大小，進(jìn)而對原假設(shè)H0作決策的假設(shè)檢驗(yàn)方法稱為臨界值檢驗(yàn)法。3.假設(shè)檢驗(yàn)的基本思想2023/2/4530臨界值臨界值a/2a/2樣本統(tǒng)計(jì)量拒絕H0拒絕H0置信水平3.假設(shè)檢驗(yàn)的基本思想臨界值檢驗(yàn)法示意圖(以雙側(cè)檢驗(yàn)為例)2023/2/454上述的判斷實(shí)際上體現(xiàn)著反證法的思想。判斷的基礎(chǔ)是樣本信息，判斷的理論依據(jù)是小概率原理，即小概率事件在一次試驗(yàn)（或抽樣）中幾乎不發(fā)生。直觀來想，在所做假設(shè)是正確的情況下，那么一次試驗(yàn)（或抽樣）中人們期望的結(jié)果出現(xiàn)的概率應(yīng)該較大。然而現(xiàn)在的事實(shí)卻不是這樣的，期望的結(jié)果出現(xiàn)的概率不僅不大，反而很小，即所謂的小概率事件居然發(fā)生了，這就很不正常了，意味著一次試驗(yàn)（或抽樣）中出現(xiàn)了出人意料的結(jié)果，也意味著給了我們做出否定原假設(shè)的充分證據(jù)?？梢娂僭O(shè)檢驗(yàn)的思想是從不利于原假設(shè)的角度來對原假設(shè)做決策的。3.假設(shè)檢驗(yàn)的基本思想2023/2/455因此，當(dāng)我們拒絕原假設(shè)時(shí)，并不意味著原假設(shè)一定是錯(cuò)誤的，只是說概率意義下接受原假設(shè)的理由很不充分，而否定原假設(shè)的證據(jù)卻非常強(qiáng)。這與數(shù)學(xué)家“證明”某個(gè)結(jié)論的方式不同，而有點(diǎn)兒類似于法院里法官的判案方式。并且只要小概率α不等于零，對原假設(shè)做決策就可能錯(cuò)判，存在做出錯(cuò)誤選擇的風(fēng)險(xiǎn)。3.假設(shè)檢驗(yàn)的基本思想2023/2/4564.單、雙側(cè)檢驗(yàn)問題備擇假設(shè)沒有特定的方向性，并含有符號“”的假設(shè)檢驗(yàn)，稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailedtest)

備擇假設(shè)具有特定的方向性，并含有符號“>”或“<”的假設(shè)檢驗(yàn)，稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)備擇假設(shè)的方向?yàn)椤?lt;”，稱為左側(cè)檢驗(yàn)

備擇假設(shè)的方向?yàn)椤?gt;”，稱為右側(cè)檢驗(yàn)

2023/2/457雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)的假設(shè)形式

假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)H0:μ

=μ0H0:μ

μ0H0:μ

μ0備擇假設(shè)H1:μ

≠μ0H1:

μ<μ0H1:μ>μ0注：研究者感興趣的是備擇假設(shè)，單側(cè)假設(shè)的方向是按備擇假設(shè)的方向來說的。2023/2/4585.統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤第Ⅰ類錯(cuò)誤(棄真錯(cuò)誤)原假設(shè)為真時(shí)拒絕原假設(shè)第Ⅰ類錯(cuò)誤的概率記為，被稱為顯著性水平第Ⅱ類錯(cuò)誤(納偽錯(cuò)誤)原假設(shè)為假時(shí)未拒絕原假設(shè)第Ⅱ類錯(cuò)誤的概率記為2023/2/459假設(shè)檢驗(yàn)中的兩類錯(cuò)誤的決策結(jié)果陪審團(tuán)審判H0檢驗(yàn)裁決實(shí)際情況決策實(shí)際情況無罪有罪H0為真H0為假無罪正確錯(cuò)誤未拒絕H0正確決策第Ⅱ類錯(cuò)誤(β

)有罪錯(cuò)誤正確拒絕H0第Ⅰ類錯(cuò)誤(α)正確決策2023/2/460

錯(cuò)誤和錯(cuò)誤的關(guān)系同時(shí)減少兩類錯(cuò)誤惟一辦法增加樣本容量!和的關(guān)系就像翹翹板，小就大，大就小2023/2/461

5.統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤

兩類錯(cuò)誤的關(guān)系當(dāng)其他條件不變時(shí)，α大則β?。环粗?，α小必導(dǎo)致β大。換句話說，在其他條件不變的情況下，要同時(shí)減小犯兩類錯(cuò)誤的概率是不可能的。在規(guī)定的顯著性α下，單側(cè)檢驗(yàn)犯第二類錯(cuò)誤的可能性小于雙側(cè)檢驗(yàn)。故統(tǒng)計(jì)檢驗(yàn)中，凡能進(jìn)行單側(cè)檢驗(yàn)時(shí)就不做雙側(cè)檢驗(yàn)，以便控制β。其他情況不變時(shí)，增加樣本容量n,β值將有效地的減小。其他情況不變，假設(shè)下的μ0與μ1之間的距離將直接影響β值。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/462

5.統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤兩類錯(cuò)誤的控制原則通過以上分析，我們應(yīng)該在合適的α及β的要求下進(jìn)行統(tǒng)計(jì)檢驗(yàn)。通常α值控制在1%-5%之間，β值多控制在10%-30%之間。統(tǒng)計(jì)學(xué)家Neyman和Pearson提出的原則是：版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/4635.統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤在控制犯第一類錯(cuò)誤的概率α的條件下，使犯第二類錯(cuò)誤的概率β盡量減小，其含義是：原假設(shè)要受到維護(hù)，使它不至于輕易被否定（因?yàn)榧僭O(shè)檢驗(yàn)時(shí)從不利于原假設(shè)的角度來對原假設(shè)作決策的）；若檢驗(yàn)結(jié)果否定了原假設(shè)，則說明否定的理由是充分的；同時(shí)，犯第一類錯(cuò)誤的概率α受到控制，亦即作出否定判斷的可靠程度（1-α）得到了保證。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/4645.統(tǒng)計(jì)結(jié)論的兩類錯(cuò)誤版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組本書中的假設(shè)檢驗(yàn)問題只對犯第一類錯(cuò)誤的概率α加以限制，而不考慮犯第二類錯(cuò)誤的概率β，這種方式的假設(shè)檢驗(yàn)又稱為顯著性檢驗(yàn)，犯第一類錯(cuò)誤的概率α稱為顯著性水平，其取值通常需考慮：對原假設(shè)的信心，以及對原假設(shè)作出決策后可能造成的損失，實(shí)際運(yùn)用中，α通常取一些標(biāo)準(zhǔn)化的值，如：0.01、0.05、0.10等。2023/2/465

6.P值檢驗(yàn)法（概率值檢驗(yàn)法）在原假設(shè)為真的條件下，檢驗(yàn)統(tǒng)計(jì)量的觀察值大于或等于其計(jì)算值的概率雙側(cè)檢驗(yàn)為分布中兩側(cè)面積的總和反映實(shí)際觀測到的數(shù)據(jù)與原假設(shè)之間不一致的程度被稱為觀察到的(或?qū)崪y的)顯著性水平?jīng)Q策規(guī)則：若p值<,拒絕版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組6.P值檢驗(yàn)法/

2Z拒絕H0拒絕H00臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值雙側(cè)檢驗(yàn)的P值662023/2/42023/2/467

0臨界值a樣本統(tǒng)計(jì)量拒絕H0左側(cè)檢驗(yàn)的P值置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值6.P值檢驗(yàn)法2023/2/4680臨界值a拒絕H0右側(cè)檢驗(yàn)的P值1-置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值6.P值檢驗(yàn)法2023/2/469

6.P值檢驗(yàn)法P值拒絕H0的力度一般認(rèn)為P值的大小與拒絕H0的力度有如下的關(guān)系：如果P值小于：（1）0.10，有微弱的證據(jù)表明H0是應(yīng)拒絕的；（2）0.05，有顯著的證據(jù)表明H0是應(yīng)拒絕的；（3）0.01，有很強(qiáng)的證據(jù)表明H0是應(yīng)拒絕的；（4）0.001，有極強(qiáng)的證據(jù)表明H0是應(yīng)拒絕的。當(dāng)P值小于事先設(shè)定的顯著性水平α?xí)r，就會認(rèn)為概率如此小的事件居然發(fā)生了，很可能是原假設(shè)有問題，就應(yīng)該拒絕原假設(shè)；否則，就只能接受原假設(shè)。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/470

6.P值檢驗(yàn)法P值檢驗(yàn)法的決策規(guī)則為：若P值≤α,則拒絕H0，接受H1；若P值>α,則接受H0，拒絕H1。

版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/471

7.統(tǒng)計(jì)檢驗(yàn)的顯著性“顯著”一詞的一般意思不是“重要的”，而是“非偶然”；但在同級檢驗(yàn)中，該詞的意思是“只靠抽樣的隨機(jī)性不容易出現(xiàn)這樣的結(jié)果”，其中的“不容易”用顯著性水平來具體描述，可見顯著性水平是用來評估檢驗(yàn)結(jié)果的顯著性的，拒絕原假設(shè)，意指檢驗(yàn)結(jié)果是顯著的；接受原假設(shè)，意指檢驗(yàn)結(jié)果是不顯著的。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/472顯著性水平和拒絕域(雙側(cè)檢驗(yàn))0臨界值臨界值a/2a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H01-置信水平H0:μ=μ0，H1:μ≠μ02023/2/473顯著性水平和拒絕域(左側(cè)檢驗(yàn))

0臨界值a樣本統(tǒng)計(jì)量拒絕H01-置信水平H0:m

≥

m0，H1:m

＜m02023/2/474顯著性水平和拒絕域(右側(cè)檢驗(yàn))

0臨界值a樣本統(tǒng)計(jì)量拒絕H01-置信水平H0:m

≤

m0，H1:m

＞m02023/2/475

8.假設(shè)檢驗(yàn)的步驟根據(jù)實(shí)際情況，建立原假設(shè)H0和備擇假設(shè)H1；根據(jù)備擇假設(shè)H1的設(shè)定情況，確定檢驗(yàn)時(shí)單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)；確定樣本量和顯著性水平的大?。贿x擇一個(gè)合適的統(tǒng)計(jì)量做檢驗(yàn)量，要求有兩個(gè)：一是與原假設(shè)H0有關(guān)；二是能確定其抽樣分布；根據(jù)給定的顯著性水平α，在原假設(shè)H0成立時(shí)，通過查表得到H0的臨界值，給出H0的拒絕域；8.假設(shè)檢驗(yàn)的步驟抽取樣本，收集數(shù)據(jù)，并依樣本觀察值計(jì)算檢驗(yàn)量w的值（用w’表示）；根據(jù)w’計(jì)算原假設(shè)H0的P值；作出是否拒絕H0的決策。如果是用臨界值法進(jìn)行檢驗(yàn)，則不需要做第（7）步的工作，接受或拒絕原假設(shè)的規(guī)則是：若w’落入H0的拒絕域內(nèi)，則拒絕H0。如果用P值法，則不需要做第（5）步的工作，接受或拒絕原假設(shè)的規(guī)則是：若P值小于認(rèn)定的顯著性水平，則拒絕原假設(shè)。762023/2/42023/2/477

二、幾種常用的參數(shù)檢驗(yàn)方法版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組統(tǒng)計(jì)上假設(shè)檢驗(yàn)的方法很多，若按檢驗(yàn)量服從的分布來劃分，最基本的檢驗(yàn)方法有四種，即Z檢驗(yàn)（或U檢驗(yàn)）、t檢驗(yàn)法、檢驗(yàn)法和F檢驗(yàn)法。考慮到手工計(jì)算P值的麻煩，以及絕大部分統(tǒng)計(jì)軟件在輸出檢驗(yàn)結(jié)果時(shí)都有P值，故這里主要介紹臨界值檢驗(yàn)法。2023/2/478（一）Z檢驗(yàn)法Z檢驗(yàn)法是指以服從正態(tài)分布的統(tǒng)計(jì)量構(gòu)造檢驗(yàn)統(tǒng)計(jì)量的檢驗(yàn)方法。主要應(yīng)用場合：已知總體分布的方差時(shí)，對一個(gè)正態(tài)總體的均值或兩個(gè)正態(tài)總體均值的關(guān)系（均值之差）進(jìn)行檢驗(yàn)。大樣本下（n＞50)只有輕微偏斜的非正態(tài)總體均值和成數(shù)檢驗(yàn)。大樣本下未知總體方差時(shí)的均值和成數(shù)檢驗(yàn)。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2023/2/479假設(shè)形式:所構(gòu)造的檢驗(yàn)量為：1．一個(gè)正態(tài)總體均值的檢驗(yàn)應(yīng)用條件：正態(tài)總體，方差已知；或大樣本下的非正態(tài)總體；或大樣本下方差未知的正態(tài)總體2023/2/480版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例5.7】完成生產(chǎn)線上某件工作的平均時(shí)間不少于15.5分鐘，標(biāo)準(zhǔn)差為3分鐘。隨機(jī)抽選的9名職工講授一中心方法，訓(xùn)練期結(jié)束后這9名職工完成此項(xiàng)工作的平均時(shí)間為13.5分鐘。這個(gè)結(jié)果是否說明用新方法所需時(shí)間比用老方法所需時(shí)間短？設(shè)α=0.05，并假定完成這項(xiàng)工作的時(shí)間服從正態(tài)分布。1．一個(gè)正態(tài)總體均值的檢驗(yàn)1．一個(gè)正態(tài)總體均值的檢驗(yàn)2023/2/481【解】根題意，要檢驗(yàn)的假設(shè)為：H0:μ≥15.5，H1：μ<15.5由于總體服從正態(tài)分布且總體方差已知，所以選取檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的值為：

查表得Z0.05=1.65，由于Z<-Z0.05，所以拒絕原假設(shè)H0，說明用新方法所需時(shí)間明顯較短。2023/2/482假設(shè)形式:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量2．兩個(gè)正態(tài)總體均值之差的檢驗(yàn)應(yīng)用條件：兩個(gè)正態(tài)總體，方差已知2023/2/483版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例5.8】有兩種方法可用于制造某種產(chǎn)品。經(jīng)驗(yàn)表明，這兩種方法生產(chǎn)的產(chǎn)品的抗拉強(qiáng)度都近似服從正態(tài)分布。方法1和方法2給出的標(biāo)準(zhǔn)差分別為3公斤和4公斤。從方法1和方法2生產(chǎn)的產(chǎn)品分別隨機(jī)抽取10個(gè)和14個(gè)，所得樣本均值分別為20公斤和17公斤。試問，這種方法生產(chǎn)的產(chǎn)品的平均抗拉強(qiáng)度是否不同（α=0.05）？

2．兩個(gè)正態(tài)總體均值之差的檢驗(yàn)2．兩個(gè)正態(tài)總體均值之差的檢驗(yàn)2023/2/484【解】按題意，建立假設(shè)：H0:μ1=μ2,H1:μ1≠μ2由于兩個(gè)總體都近似服從正態(tài)分布，且總體方差已知，所以選取檢驗(yàn)統(tǒng)計(jì)量：其觀測值為：查表得Z0.025=1.96,由于Z>Z0.025,所以拒絕原假設(shè)H0，即認(rèn)為這兩種方法不能生產(chǎn)出抗拉強(qiáng)度相同的產(chǎn)品。2023/2/485假設(shè)形式構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量：3．大樣本下總體成數(shù)的檢驗(yàn)應(yīng)用條件：總體服從二項(xiàng)分布，大樣本3．大樣本下總體成數(shù)的檢驗(yàn)【例5.9】某公司負(fù)責(zé)人發(fā)現(xiàn)開出去的發(fā)票有大量筆誤，而且斷定這些發(fā)票中，錯(cuò)誤的發(fā)票占20%以上。隨機(jī)抽取400張檢查，發(fā)現(xiàn)錯(cuò)誤的發(fā)票有100張，即占25%，這是否可以證明負(fù)責(zé)人的判斷正確（α=0.05）？

3．大樣本下總體成數(shù)的檢驗(yàn)2023/2/487【解】按題意建立假設(shè)：選取檢驗(yàn)統(tǒng)計(jì)量為：其觀測值為：查表得Z0.05=1.65,由于Z>Z0.05，所以拒絕H0，也即認(rèn)為這些數(shù)據(jù)可以證明負(fù)責(zé)人的判斷是正確的。2023/2/488（二）t檢驗(yàn)法t檢驗(yàn)法是在未知總體方差而且小樣本時(shí)，對一個(gè)正態(tài)總體的均值或兩個(gè)正態(tài)總體均值的關(guān)系（均值之差）進(jìn)行檢驗(yàn)的方法。2023/2/489假設(shè)形式:所構(gòu)造的檢驗(yàn)量1．一個(gè)正態(tài)總體均值的檢驗(yàn)應(yīng)用條件：正態(tài)總體，方差未知，小樣本2023/2/490【例5.10】某汽車輪胎廠聲稱，該廠一等品輪胎的平均壽命在一定的重量和正常行駛條件下，高于25000公里的國家標(biāo)準(zhǔn)。廠家對一個(gè)由15個(gè)輪胎組成的隨機(jī)樣本進(jìn)行試驗(yàn)，得到的平均值和標(biāo)準(zhǔn)差分別為27000公里和5000公里。假定輪胎壽命近似服從正態(tài)分布，試問可否相信產(chǎn)品質(zhì)量同廠家所說的情況相符？（α=0.05）1．一個(gè)正態(tài)總體均值的檢驗(yàn)1．一個(gè)正態(tài)總體均值的檢驗(yàn)2023/2/491【解】依題意，建立假設(shè)H0:μ≤25000，H1:μ>25000由于總體近似服從正態(tài)分布，總體方差未知，且為小樣本；所以選取檢驗(yàn)統(tǒng)計(jì)量：其觀測值為：查自由度為（n-1）=14的t分布表得t0.05(14)=1.7613，由于t<t0.05(14)，所以只能接受H0。2．兩個(gè)正態(tài)總體均值之差的檢驗(yàn)應(yīng)用條件：兩個(gè)總體均為正態(tài)總體，方差未知但相等，兩個(gè)小樣本2023/2/492假設(shè)形式

所構(gòu)造的檢驗(yàn)量2．兩個(gè)正態(tài)總體均值之差的檢驗(yàn)2023/2/493【例5.11】有甲、乙兩臺機(jī)床加工同樣的產(chǎn)品。從它們所生產(chǎn)的產(chǎn)品中分別抽取8件和6件。，假定兩個(gè)總體都服從正態(tài)分布，且方差相等，試問甲、乙兩臺機(jī)床加工的產(chǎn)品平均直徑有無顯著差異？（α=0.05）2．兩個(gè)正態(tài)總體均值之差的檢驗(yàn)2023/2/494【解】按題意建立假設(shè)：H0:μ1=μ2,H1:μ1≠μ2根據(jù)題意，選取檢驗(yàn)統(tǒng)計(jì)量其觀測值為：查t分布表得t0.025(12)=2.1788。由于t<t0.025(12),所以接受H0，即甲、乙兩臺機(jī)床加工的產(chǎn)品平均直徑無顯著差異。2023/2/495

Z檢驗(yàn)法與t檢驗(yàn)法的總結(jié)綜上所述：Z檢驗(yàn)法與t檢驗(yàn)法都針對均值進(jìn)行檢驗(yàn)。正態(tài)分布總體下，已知總體方差時(shí)用Z檢驗(yàn)法；未知總體方差且小樣本時(shí)用t檢驗(yàn)法；非正態(tài)分布總體但大樣本下的均值或成數(shù)檢驗(yàn)用Z檢

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)

文檔簡介

溫馨提示

最新文檔

評論

第五章參數(shù)估計(jì)與假設(shè)檢驗(yàn)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔