統(tǒng)計學假設檢驗_第1頁
統(tǒng)計學假設檢驗_第2頁
統(tǒng)計學假設檢驗_第3頁
統(tǒng)計學假設檢驗_第4頁
統(tǒng)計學假設檢驗_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

假設檢驗-引例澳大利亞統(tǒng)計局公布的2010年第一季度失業(yè)率為6.1%。而RoyMorgan公司在調(diào)查了14656名18歲以上的居民以后得到的失業(yè)率為7.8%。你認為RoyMorgan的結果顯著高于統(tǒng)計局的數(shù)字嗎?教育部的數(shù)字表明,2012年大學畢業(yè)生的入職薪水平均值是3000元。杭州電子科技大學的畢業(yè)辦對畢業(yè)的學生進行追蹤,調(diào)查了80名學生,發(fā)現(xiàn)平均薪水為3300元。根據(jù)調(diào)查結果能否認為杭電學生的平均入職薪水高于全國平均水平?1假設檢驗的過程和思路

總體假設總體的平均薪水是3000判斷樣本均值是3300樣本2統(tǒng)計方法統(tǒng)計描述統(tǒng)計推斷參數(shù)估計假設檢驗點估計區(qū)間估計3假設檢驗(HypothesisTesting)也稱為顯著性檢驗,是事先作出一個關于總體參數(shù)的假設,然后利用樣本信息來判斷原假設是否合理,即判斷樣本信息與原假設是否有顯著差異,從而決定應接受或否定原假設的統(tǒng)計推斷方法。對總體作出的統(tǒng)計假設進行檢驗的方法依據(jù)是概率論中的“小概率事件實際不可能發(fā)生”原理。假設檢驗的基本原理4假設檢驗的基本原理

利用假設檢驗進行推斷的基本原理是:小概率事件在一次試驗中幾乎不會發(fā)生。如果對總體的某種假設是真實的(例如學生上課平均出勤率≥95%),那么不利于或不能支持這一假設的事件A(小概率事件,例如樣本出勤率=55%

)在一次試驗中幾乎不可能發(fā)生的;要是在一次試驗中A竟然發(fā)生了(樣本出勤率=55%),就有理由懷疑該假設的真實性,拒絕提出的假設。5基本原理統(tǒng)計學是通過假設檢驗的方法來解決上述問題的。假設檢驗和參數(shù)估計是統(tǒng)計推斷的兩個組成部分,它們都是利用樣本對總體進行某種推斷。參數(shù)估計是用樣本統(tǒng)計量估計總體參數(shù)的方法,總體參數(shù)在估計之前是未知的。假設檢驗則是先對總體提出一個假設,然后利用樣本信息去檢驗這個假設是否成立。6假設檢驗的一般問題假設檢驗的步驟假設檢驗中的小概率原理兩類錯誤雙側檢驗和單側檢驗7假設檢驗總體均值的假設檢驗總體比例的假設檢驗總體方差的假設檢驗s未知s已知大樣本小樣本兩個總體均值差的假設檢驗8假設檢驗的步驟根據(jù)問題要求提出

原假設(H0)和備擇假設(H1);確定適當?shù)臋z驗統(tǒng)計量及相應的抽樣分布;

計算檢驗統(tǒng)計量的值;選取顯著性水平,確定原假設的接受域和拒絕域;作出統(tǒng)計決策。9總體假設檢驗的過程抽取隨機樣本均值

X=20我認為人口的平均年齡是50歲提出假設

拒絕假設!

別無選擇.作出決策10什么是原假設與備擇假設原假設通常是研究者想收集證據(jù)予以反對的假設原假設,用H0表示,例如:H0:

μ=3000總是包含等號“=”,≥,≤。備擇假設通常是研究者想收集證據(jù)予以支持的假設;

與原假設對立。零假設,用H1表示,例如:H0:

μ≠3000總是包含等號“≠”,>,<。原假設和備擇假設是互斥的,它們中僅有一個正確;等號必須出現(xiàn)在原假設中把現(xiàn)狀(做出的聲明)作為原假設;或者說不能輕易否定的假設為原假設最常用的有三種情況:雙側檢驗、左側檢驗和右側檢驗。檢驗以“假定原假設為真”開始,如果得到矛盾說明備擇假設正確。原假設與備擇假設12舉例1一種零件的生產(chǎn)標準是直徑10cm,對生產(chǎn)過程進行監(jiān)控以確定零件加工是否符合要求。如果零件的平均直徑大于或者小于10cm,則表明生產(chǎn)過程不正常,必須調(diào)整。試陳述用于檢驗生產(chǎn)過程是否正常的原假設和備擇假設。設這臺機床生產(chǎn)的零件平均直徑為μ。

H0:μ

=10(生產(chǎn)過程正常)

H1:μ≠10(生產(chǎn)過程不正常)13舉例2某品牌洗發(fā)水在產(chǎn)品說明書中稱:平均凈含量不少于500ml。相關機構要通過抽檢其中一批產(chǎn)品來驗證是否屬實。試陳述用于檢驗的原假設和備擇假設。設該品牌洗發(fā)水的平均凈含量真值是μ。

如果μ<500,表明說明書的內(nèi)容不屬實。H0:μ

≥500(凈含量符合說明書)

H1:μ

<500(凈含量不符合說明書)14舉例3據(jù)阿里巴巴公司公布,杭州城市中家庭擁有汽車的比率超過50%。為驗證這一估計是否正確,某研究機構隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設和備擇假設。研究者想收集證據(jù)予以證明:比率不超過50%H0:p≥50%(比率超過50%)

H1:p<50%(比率不超過50%)15選擇檢驗統(tǒng)計量檢驗統(tǒng)計量是根據(jù)樣本觀測結果計算得到的,據(jù)以對原假設和備擇假設作出決策的某個統(tǒng)計量,不同的總體參數(shù)適用的檢驗統(tǒng)計量不同。假設檢驗中用到的檢驗統(tǒng)計量,都是標準化檢驗統(tǒng)計量,反應了點估計量與假設的總體參數(shù)相比,相差多少個標準差。對總體均值的檢驗,標準化檢驗統(tǒng)計量為:點估計量-假設值點估計量的抽樣標準差16均值檢驗中檢驗統(tǒng)計量的選擇總體正態(tài)?n≥30?σ2已知?否是是否否是實際中總體方差總是未知的,因而這是應用最多的公式根據(jù)中心極限定理得到的近似結果。

σ未知時用s來估計。增大n;數(shù)學變換等。規(guī)定顯著性水平,確定拒絕域顯著性水平α是一個概率值。原假設為真時,拒絕原假設的概率,是抽樣分布的拒絕域。拒絕域的面積隨α的減小而減小。常用的α

值為0.01,0.05,0.1由研究者事先確定。18雙側檢驗和單側檢驗假設檢驗分為雙側檢驗和單側檢驗。(一)雙側檢驗例1某機床廠加工一種零件,根據(jù)經(jīng)驗知道,該廠加工的零件的橢圓度漸近服從正態(tài)分布,其總體均值為0.081mm,總體標準差為0.025mm。今另換一臺新機床進行加工,取200個零件進行檢驗,得到橢圓度均值為0.076mm。試問新機床加工零件的橢圓度總體均值與以前有無顯著差異。19雙側檢驗

(顯著性水平與拒絕域)H0值樣本統(tǒng)計量置信水平臨界值臨界值a/2a/2

拒絕域拒絕域抽樣分布1-20㈡、單側檢驗單側檢驗分為左單側檢驗和右單側檢驗兩種。1、左單側檢驗例某批發(fā)商欲從廠家購進一批燈泡,根據(jù)合同規(guī)定,燈泡的使用壽命平均不低于1000小時。已知燈泡使用壽命服從正態(tài)分布,標準差為20小時。在總體中隨機抽取100個燈泡,得知樣本均值為960小時,批發(fā)商是否應該購買這批燈泡?解:提出假設:H0:μ≥1000H1:μ<1000

左單側檢驗圖示(α=0.05)。也可以把左單側檢驗稱為下限檢驗。21左側檢驗

(顯著性水平與拒絕域)樣本統(tǒng)計量H0值臨界值a拒絕域抽樣分布1-置信水平樣本統(tǒng)計量22右單側檢驗例3某種大量生產(chǎn)的袋裝食品,按規(guī)定每袋重量不得少于250克。現(xiàn)在從一批該種食品中任意抽取50袋,發(fā)現(xiàn)有6袋低于250克。如果規(guī)定不合格率超過5%,就不得出廠,這批食品能否出廠呢?解:原假設H0:μ≤5%

備擇假設H1:μ>5%右單側檢驗(α=0.05),也稱為上限檢驗23右側檢驗

(顯著性水平與拒絕域)樣本統(tǒng)計量H0值臨界值a拒絕域抽樣分布1-置信水平樣本統(tǒng)計量24H0:無罪假設檢驗中的兩類錯誤假設檢驗就好像一場審判過程統(tǒng)計檢驗過程正確正確錯誤錯誤25假設檢驗中的兩類錯誤不能同時降低兩類錯誤!對一定的樣本量n,不能同時減小犯這兩種錯誤的概率如果減小a錯誤,就會b增大錯誤的機會;如果減小b錯誤,則會增大a錯誤的概率。26第二節(jié)一個正態(tài)總體參數(shù)的檢驗總體均值的檢驗總體方差的檢驗總體比例的檢驗27一個總體參數(shù)的檢驗Z檢驗(單側和雙側)t檢驗(單側和雙側)Z檢驗(單側和雙側)

2檢驗(單側和雙側)均值一個總體比例方差28一、總體均值的檢驗

(檢驗統(tǒng)計量)總體是否已知?用樣本標準差S代替t檢驗小樣本容量n否是z檢驗

z檢驗大29一、總體方差已知的均值檢驗

1.雙側Z

檢驗假設條件:總體正態(tài),或

n

較大()步驟:⑴

⑵構造并計算檢驗統(tǒng)計量

⑶規(guī)定顯著性水平,查表得臨界值。

⑷進行決策。若樣本統(tǒng)計量則拒絕,否則接受。0臨界值臨界值a/2

a/2

拒絕H0拒絕H01-置信水平舉例某服裝品牌主管經(jīng)理估計會員的平均年齡是35歲,研究人員從2013年入會的新會員中隨機抽取40人,調(diào)查得到他們的年齡數(shù)據(jù)如下。試根據(jù)調(diào)查結果判斷主管經(jīng)理的估計是否準確?311.提出原假設和備選假設H0:

m=35;m表示總體會員的平均年齡,即總體會員的平均年齡與主管經(jīng)理估計的35歲沒有差異。備選假設可以表示為H1:

m≠35。原假設與備選假設互斥,檢驗結果二者必取其一。2.確定適當?shù)臋z驗統(tǒng)計量在具體問題中,選擇什么統(tǒng)計量,需要考慮:

總體方差已知還是未知?樣本是大樣本還是小樣本?在本例中,由于n=40>30是大樣本,近似服從正態(tài)分布,以樣本標準差代替總體標準差,所用的統(tǒng)計量是:323.選取顯著性水平,確定接受域和拒絕域接受域和拒絕域

本例為雙側檢驗,接受域:-1.96≤z≤1.96

拒絕域:z<-1.96或z>1.96臨界值臨界值接受域1

-4.作出統(tǒng)計決策在本例中,由于z=-3.455<-1.96,落在拒絕域內(nèi),所以拒絕原假設H0。結論:在a=0.05的顯著性水平下,抽樣結果的平均年齡顯著低于主管經(jīng)理的估計值,有理由認為經(jīng)理的估計不準確。二、2

未知大樣本均值的檢驗

(z檢驗)【例】某電子元件批量生產(chǎn)的質(zhì)量標準為平均使用壽命1200小時。某廠宣稱他們采用一種新工藝生產(chǎn)的元件質(zhì)量大大超過規(guī)定標準。為了進行驗證,隨機抽取了100件作為樣本,測得平均使用壽命1245小時,標準差300小時。能否說該廠生產(chǎn)的電子元件質(zhì)量顯著地高于規(guī)定標準?(=0.05)單側檢驗342

未知大樣本均值的檢驗

(z檢驗)H0:1200H1:>1200=0.05n=100檢驗統(tǒng)計量:在=0.05的水平上不能拒絕H0不能認為該廠生產(chǎn)的元件壽命顯著地高于1200小時決策:結論:Z0拒絕域0.051.645352

未知小樣本均值的檢驗

(例題分析)【例】某機器制造出的肥皂厚度為5cm,服從正態(tài)分布,今欲了解機器性能是否良好,隨機抽取10塊肥皂為樣本,測得平均厚度為5.3cm,標準差為0.3cm,試以0.05的顯著性水平檢驗機器性能良好的假設。雙側檢驗362

未知小樣本均值的檢驗

(t檢驗)H0:=5H1:

5=0.05df=10-1=9臨界值(s):檢驗統(tǒng)計量:在=0.05的水平上拒絕H0說明該機器的性能不好

決策:結論:t02.262-2.262.025拒絕H0拒絕H0.02537一個總體比例的檢驗假定條件有兩類結果總體服從二項分布可用正態(tài)分布來近似()比例檢驗的Z統(tǒng)計量p為假設的總體比例38一個總體比例的檢驗

(例題分析)【例】一項統(tǒng)計結果聲稱,某市老年人口(年齡在65歲以上)的比重為14.7%,該市老年人口研究會為了檢驗該項統(tǒng)計是否可靠,隨機抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上。調(diào)查結果是否支持該市老年人口比重為14.7%的看法?(=0.05)雙側檢驗39一個總體比例的檢驗

(例題分析)H0:p=14.7%H1:p

14.7%=0.05n=400檢驗統(tǒng)計量:在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論