第七章假設檢驗_第1頁
第七章假設檢驗_第2頁
第七章假設檢驗_第3頁
第七章假設檢驗_第4頁
第七章假設檢驗_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學第七章

假設檢驗第七章假設檢驗假設檢驗:

也稱顯著性檢驗。 是抽樣推斷中運用甚廣的一種統(tǒng)計推斷方法?;静襟E:對研究總體的參數(shù)或分布形式提出假設根據(jù)抽樣分布原理,利用樣本實際資料計算相關(guān)統(tǒng)計量的取值檢驗所作假設是否合理分類:參數(shù)假設檢驗,簡稱參數(shù)檢驗;非參數(shù)檢驗或者自由分布檢驗。第七章假設檢驗§1假設檢驗基本問題

§2一個總體參數(shù)的假設檢驗

§3兩個總體參數(shù)的假設檢驗

§1假設檢驗基本問題§1.1假設檢驗的基本原理§1.2假設檢驗的步驟

§1.3關(guān)于值

§1.4兩類錯誤

§1.5假設的建立問題

§1.1假設檢驗的基本原理統(tǒng)計思想:小概率原理反證法思想主要表現(xiàn):1、主要理論依據(jù)是“小概率事件在現(xiàn)實中是不可能發(fā)生的”這一概率思想。2、采用的邏輯推理方法是反證法?!?.2假設檢驗的步驟1.原假設與備擇假設原假設:待檢驗的假設,也稱為零假設。備擇假設:原假設的對立面,否定原假設后可供選擇的假設。

例:某種飲料包裝上注明“凈含量500ml”,是否可信?該假設可以表達為:其中,字母表示假設,下標0表示原假設,下標1表示備擇假設?!?.2假設檢驗的步驟零假設與備擇假設并不一定完全對稱。假設的形式:雙側(cè)檢驗:單側(cè)檢驗左側(cè)檢驗:(或者≥;)右側(cè)檢驗:(或者≤;)§1.2假設檢驗的步驟2.檢驗統(tǒng)計量檢驗使用的統(tǒng)計量稱為檢驗統(tǒng)計量檢驗統(tǒng)計量的構(gòu)造形式為:§1.2假設檢驗的步驟3.顯著性水平與臨界值

顯著性水平是為真卻被拒絕的概率,它也是假設檢驗統(tǒng)計思想中所指的小概率。給定了顯著件水平,可由統(tǒng)計量的概率分布確定其臨界值,臨界值將統(tǒng)計量的所有可能取值區(qū)間分為兩個互不相交的部分,即原假設的拒絕域和接受域?!?.2假設檢驗的步驟4.接受域與拒絕域接受域:使原假設不能被拒絕的統(tǒng)計量所在區(qū)域。拒絕域:使原假設能夠被拒絕的統(tǒng)計量所在區(qū)域。也稱否定域。這兩個區(qū)域是互補的關(guān)系,即檢驗統(tǒng)計量的實際值必落入且只能落入其中一個區(qū)域,它們之間的分界線即臨界值。對于不同形式的假設,的接受域和拒絕域不同?!?.2假設檢驗的步驟如果是只需判斷有無顯著差異的情況,則采用雙側(cè)檢驗。雙側(cè)檢驗的接受域為檢驗統(tǒng)計量分布曲線上兩臨界值之間的區(qū)域,而拒絕域分別位于兩端;§1.2假設檢驗的步驟左側(cè)檢驗右側(cè)檢驗左側(cè)檢驗的拒絕域位于接受域的左側(cè);右側(cè)檢驗的拒絕域位于接受域的右側(cè)。如果需要判斷參數(shù)是否偏大(偏小)的情況,則采取左側(cè)(右側(cè))檢驗?!?.2假設檢驗的步驟5.假設檢驗的具體步驟

(1)建立假設。(2)確定檢驗統(tǒng)計量,并確定該統(tǒng)計量的分布情況,然后依據(jù)樣本信息計算該檢驗統(tǒng)計量的實際值。(3)設定檢驗的顯著性水平,并確定臨界值。(4)將檢驗統(tǒng)計量的實際值與臨界值進行比較,做出是否拒絕原假設的決策。§1.3關(guān)于p值

值:當零假設為真時,所得到樣本觀察結(jié)果或更極端結(jié)果的概率。值越小,樣本觀測結(jié)果出現(xiàn)的可能性越小,拒絕原假設理由就越充分。值能夠反映出某一樣本觀測結(jié)果與原假設不一致的的精確程度。利用值進行假設檢驗的準則:將值與事先確定的檢驗顯著性水平進行比較,若值小于,小概率事件發(fā)生,拒絕原假設;若值大于,小概率事件未發(fā)生,不能拒絕原假設?!?.4兩類錯誤

進行假設檢驗時會犯兩種錯誤:①零假設正確卻被拒絕,稱之為“第I類錯誤”;②零假設不正確卻沒有被拒絕,稱之為“第II類錯誤”。

§1.4兩類錯誤犯第I類錯誤的概率記為,即前面提到的顯著性水平。犯第II類錯誤的概率記為。在一定樣本容量下,減少會引起增大,減少會引起的增大。假設檢驗中人們普遍執(zhí)行同一準則:

首先控制棄真錯誤(錯誤)?!?.5假設的建立問題實踐中一般采取“原假設處于被保護地位”的原則,即將沒有充分理由便不能拒絕的命題作為原假設,其對立面作為備擇假設。一般將已有的、固有的、經(jīng)驗的命題作為原假設,將想要證明成立的命題作為備擇假設,這樣做可以有效減小犯第一類錯誤的概率。§2一個總體參數(shù)的假設檢驗§2.1總體均值的假設檢驗

§2.2正態(tài)總體方差的假設檢驗§2.3總體比例的假設檢驗§2.1總體均值的假設檢驗§2.1.1

大樣本樣本均值的抽樣分布均為正態(tài)分布,其數(shù)學期望為總體均值,方差為,其中為總體方差。檢驗統(tǒng)計量服從標準正態(tài)分布,即:§2.1總體均值的假設檢驗根據(jù)檢驗統(tǒng)計量計算公式計算檢驗統(tǒng)計量樣本值,當顯著水平為時,查分布表:在雙側(cè)檢驗中,如果≥,則拒絕原假設;反之,則不能拒絕原假設。在左側(cè)檢驗中,如果,則拒絕原假設;反之,則不能拒絕原假設。在右側(cè)檢驗中,如果,則拒絕原假設;反之,則不能拒絕原假設。§2.1總體均值的假設檢驗【例7.1】某車間用一臺包裝機包裝成品食鹽,已知袋裝食鹽的凈重服從正態(tài)分布,且當機器正常時,其均值為0.5公斤,標準差為0.01公斤。某日開工后要檢驗包裝機是否正常運作,隨機抽取了40袋,稱得凈重如下(單位:公斤):請檢驗機器是否處于正常運作狀態(tài)?()§2.1總體均值的假設檢驗解:首先設立原假設與備擇假設:;已知該總體服從正態(tài)分布及總體的標準差,故本題可以采用檢驗。由題中樣本數(shù)據(jù)及已知條件得到:,,,,,本題屬于雙側(cè)檢驗,根據(jù)正態(tài)分布,有:不能拒絕原假設,即認為包裝機器運作正常。§2.1總體均值的假設檢驗§2.1.2

小樣本1.正態(tài)總體,已知

采用統(tǒng)計量對樣本均值進行檢驗

2.正態(tài)總體,未知

檢驗統(tǒng)計量服從自由度為()的分布,由于未知,一般用樣本標準差來代替總體標準差,即:

§2.1總體均值的假設檢驗對于給定的顯著性水平,查分布表:在雙側(cè)檢驗中,當時,拒絕原假設;反之,則不能拒絕原假設。在左側(cè)檢驗中,當時,拒絕原假設;反之,則不能拒絕原假設。在右側(cè)檢驗中,當時,拒絕原假設;反之,則不能拒絕原假設?!?.1總體均值的假設檢驗【例7.2】某燈具廠生產(chǎn)一種白熾燈泡,根據(jù)長期觀察,得知該燈泡使用壽命服從正態(tài)分布,平均使用時間為1500小時,標準差為10小時?,F(xiàn)準備采用新技術(shù)延長燈泡壽命,引用該生產(chǎn)技術(shù)后抽檢了16個燈泡進行試驗,使用壽命分別為:試以0.05的顯著性水平判斷該種新技術(shù)是否顯著提高燈泡的使用壽命?!?.1總體均值的假設檢驗解:顯然,本題屬于單側(cè)檢驗(右側(cè)檢驗),首先設立原假設與備擇假設:;由題中樣本數(shù)據(jù)及已知條件得到:,,,,檢驗統(tǒng)計量因此,拒絕原假設,即認為該種新技術(shù)顯著提高燈泡的使用壽命?!?.1總體均值的假設檢驗【例7.3】(續(xù)例7.1)若其它條件不變,但抽查樣本量減為10,且事先并不知道機器正常時的標準差信息。試檢驗機器是否處于正常運作狀態(tài)?()解:首先設立原假設與備擇假設:;由題中樣本數(shù)據(jù)及已知條件得到:,,,,因此,不能拒絕原假設,即不能認為包裝機器運作不正常?!?.2

正態(tài)總體方差的假設檢驗

檢驗方法——檢驗法。原假設形式為:雙側(cè)檢驗:;左側(cè)檢驗:;(或者≥;)右側(cè)檢驗:;(或者≤;)檢驗統(tǒng)計量為:其中,為樣本方差,為待檢驗的假設方差。§2.2

正態(tài)總體方差的假設檢驗對于給定的顯著性水平,查分布表:在雙側(cè)檢驗中,首先確定臨界值和,當或者時,拒絕原假設;反之,則不能拒絕原假設。在左側(cè)檢驗中,確定臨界值,當時,拒絕原假設;反之,則不能拒絕原假設。在右側(cè)檢驗中,確定臨界值,當時,拒絕原假設;反之,則不能拒絕原假設?!?.2

正態(tài)總體方差的假設檢驗【例7.4】根據(jù)某飲料廠長期生產(chǎn)資料可知:該廠飲料灌裝線灌裝的飲料凈含量服從正態(tài)分布,標準差為0.20ml。某天進行生產(chǎn)線檢查,從灌裝線上隨機抽取20瓶飲料,測得樣本標準差為0.35ml。試判斷該條灌裝線的波動與平日有無顯著差異?()解:本題為雙側(cè)檢驗,首先設立原假設與備擇假設:;根據(jù)條件已知:,,則檢驗統(tǒng)計量查分布表,由于,拒絕原假設,即該條灌裝線的波動與平日有顯著差異。§2.3總體比例的假設檢驗總體服從二項分布,樣本量足夠大且滿足時,比例的抽樣分布可用正態(tài)分布近似。

的數(shù)學期望為, 的方差為,樣本比例經(jīng)標準化后的隨機變量則服從標準正態(tài)分布,即

§2.3總體比例的假設檢驗檢驗未知的總體比例等于某一假設值設;(或;)檢驗統(tǒng)計量逼近正態(tài)分布,因未知的真實值,用樣本比例來代替,因此檢驗統(tǒng)計量調(diào)整為:

其中,為待檢驗的總體比例?!?.3總體比例的假設檢驗【例7.5】某研究機構(gòu)估計本市居民家庭的電腦擁有率為75%?,F(xiàn)隨機抽查了200個家庭,其中157個家庭擁有電腦。試問估計的該市居民家庭電腦擁有率是否可信?()解:首先根據(jù)題意建立原假設與備擇假設:;(),,,

不能拒絕原假設,即認為該研究機構(gòu)估計的該市居民家庭電腦擁有率是可信的。

§3兩個總體參數(shù)的假設檢驗

根據(jù)前提條件不同、檢驗目標不同等因素,兩總體參數(shù)假設檢驗的統(tǒng)計量選擇情況可以由下圖來示意:§3兩個總體參數(shù)的假設檢驗§3.1獨立樣本均值的假設檢驗§3.2兩獨立樣本方差的假設檢驗§3.3兩匹配樣本的假設檢驗§3.4兩獨立樣本比例之差的假設檢驗

§3.1獨立樣本均值的假設檢驗三種情形:原假設:或備擇假設:或基于這個假設下,分別討論各種情形下的檢驗過程?!?.1獨立樣本均值的假設檢驗1.、已知(檢驗法)檢驗統(tǒng)計量:

其中,、分別為兩個總體的樣本均值;、分別為兩個總體的方差;、分別為兩個總體的樣本量?!?.1獨立樣本均值的假設檢驗【例7.6】為比較甲、乙兩種降血糖藥物的藥效,將20名病情相仿的患者分成兩組,每組10人,設服藥后維持的藥效時間分別服從正態(tài)分布和,檢測數(shù)據(jù)如下(單位:小時),問兩種降血糖藥物的療效有無顯著差異?()§3.1獨立樣本均值的假設檢驗解:本題中、已知,且兩組樣本是獨立的。提出原假設與備擇假設:或或

已知:,,,,,,

計算得到檢驗統(tǒng)計量的樣本值:由于,不能拒絕原假設,即在顯著性水平條件下,甲藥物與乙藥物藥效時間均值之間無顯著性差異?!?.1獨立樣本均值的假設檢驗2.、未知,但(檢驗法)檢驗統(tǒng)計量:其中,、分別為兩個總體的樣本均值;、分別為兩個總體的樣本量;、分別為兩個總體的樣本方差?!?.1獨立樣本均值的假設檢驗【例7.7】若已知A、B兩種降血壓藥物維持的藥效時間服從正態(tài)分布和,其中具體值未知。問在顯著性水平下,這兩種降血壓藥物的療效時間有無顯著差異?§3.1獨立樣本均值的假設檢驗解:本題中、未知,但,且兩組樣本是獨立的。原假設與備擇假設不變,由于總體方差未知,所以選用統(tǒng)計量,由題中樣本數(shù)據(jù):,,,,,,計算得到檢驗統(tǒng)計量值:由于,因此不能拒絕原假設,即在顯著性水平條件下,A藥物與B藥物藥效時間均值之間無顯著性差異?!?.1獨立樣本均值的假設檢驗3.、未知,樣本量充分大(檢驗法)檢驗統(tǒng)計量:注:用樣本標準差來代替總體標準差。其中,、分別為兩個總體的樣本均值;、分別為兩個總體的樣本量;、分別為兩個總體的樣本方差?!?.1獨立樣本均值的假設檢驗4.、未知,小樣本(檢驗法)檢驗統(tǒng)計量:其中,、分別為兩個總體的樣本均值;、分別為兩個總體樣本量;、分別為兩個總體的樣本方差。§3.2兩獨立樣本方差的假設檢驗用于檢驗兩總體的某項指標波動幅度即方差是否相等,采用檢驗法,此類假設檢驗的原假設與備擇假設為:原假設:或者備擇假設:或者§3.2兩獨立樣本方差的假設檢驗檢驗兩個總體方差是否相等,選用統(tǒng)計量:其中,、分別為兩個總體的方差;、分別為兩個總體的樣本方差;、分別為兩個總體的樣本量。根據(jù)樣本數(shù)據(jù)計算檢驗統(tǒng)計量的值,其計算的基本公式為:§3.2兩獨立樣本方差的假設檢驗規(guī)定顯著性水平后,將與臨界點值相比較,根據(jù)比較結(jié)果進行決策:

在雙側(cè)檢驗中,若或者,則拒絕原假設,即兩個總體的方差存在顯著差異;反之,則不能拒絕原假設,即兩總體方差不存在顯著差異。在左側(cè)檢驗中,若,則拒絕原假設;反之,則不能拒絕原假設。在右側(cè)檢驗中,若,則拒絕原假設;反之,則不能拒絕原假設。§3.2兩獨立樣本方差的假設檢驗【例7.8】(續(xù)例7.7)樣本保持不變,問在顯著性水平下,這兩種降壓藥物療效時間的方差有無顯著差異?解:本題中兩組樣本試驗是獨立的,由題意,原假設與備擇假設為:或或由題中樣本數(shù)據(jù)及已知條件:,,,,計算得到檢驗統(tǒng)計量值:由于,因此不能拒絕原假設,即在顯著性水平條件下,A藥物與B藥物藥效時間方差之間無顯著性差異。§3.3

兩匹配樣本的假設檢驗

匹配樣本的檢驗的思想出發(fā)點在于對試驗前后樣本的差值情況進行檢驗,如果兩匹配總體均值不存在顯著差異,則匹配樣本之差的均值應該與零不存在顯著差異。下面以兩組匹配樣本、為例進行說明?!?.3

兩匹配樣本的假設檢驗假設兩匹配樣本均值分別為和。則:首先建立原假設與備擇假設:;對兩匹配總體進行差值處理,得到新總體:,設其均值為。則問題轉(zhuǎn)化為考察的均值檢驗問題,即原假設與備擇假設轉(zhuǎn)化為:;顯然,對兩匹配樣本進行差值處理后得到的:()是來自的一個樣本,接下來的分析與一個總體參數(shù)的均值檢驗基本相同?!?.3

兩匹配樣本的假設檢驗【例7.9】分別檢測10名癌癥患者化療前和化療后1毫升尿樣中的尿蛋白含量,得到數(shù)據(jù)如下(單位:mg/ml):試在的顯著性水平下,分析化療是否對病人尿蛋白含量有顯著影響?§3.3

兩匹配樣本的假設檢驗解:根據(jù)題意,首先確定原假設與備擇假設:;對原始數(shù)據(jù)進行差值處理,:()。得到兩匹配樣本的差值數(shù)據(jù):則問題轉(zhuǎn)化為考察的均值檢驗問題,即原假設與備擇假設轉(zhuǎn)化為:;§3.3

兩匹配樣本的假設檢驗根據(jù)差值數(shù)據(jù)及其他已知條件可以得到:,。采用檢驗統(tǒng)計量:由條件,得到:顯然,,因此拒絕原假設,即認為化療前后的尿蛋白含量均值不等,化療對病人尿蛋白含量有顯著影響作用。

§3.4

兩獨立樣本比例之差的假設檢驗§3.4.1

檢驗兩個總體比例是否相等檢驗兩總體比例是否相等等價于檢驗兩總體比例之差是否為零,因此,該類檢驗的原假設與備擇假設為:(或)(或)檢驗統(tǒng)計量為:

§3.4

兩獨立樣本比例之差的假設檢驗用公共比例來近似替代真實值,即:其中,和分別是在兩樣本中具有某種特征單位的個數(shù),和分別表示兩樣本量。因此,檢驗統(tǒng)計量就轉(zhuǎn)換為:其中,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論