假設(shè)檢驗(hypothesistesting)_第1頁
假設(shè)檢驗(hypothesistesting)_第2頁
假設(shè)檢驗(hypothesistesting)_第3頁
假設(shè)檢驗(hypothesistesting)_第4頁
假設(shè)檢驗(hypothesistesting)_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 也假設(shè)檢驗(hypothesistesting)轄囑第、方法演變:t檢驗、z檢驗、F檢驗、卡方檢驗,方差分析(ANOVA)概述假設(shè)檢驗是分析數(shù)據(jù)的一種方法?;卮鸫祟悊栴}:“隨機發(fā)生的事件的概率是多少?”另一方面的問題是:“我們從數(shù)據(jù)中發(fā)現(xiàn)的結(jié)果是真的嗎?”當問題是有關(guān)大的總體而只能得到總體的一個樣本時用假設(shè)檢驗。這種方法被用來回答在質(zhì)量改進中一系列重要的問題,如“我們在過程中所做的改變對產(chǎn)出創(chuàng)造了有意義的差別嗎?”或”顧客對場地A的滿意度是不是比其他場地高?”最常用的檢驗是:z檢驗、t檢驗、F檢驗、卡方(2)檢驗和方差分析。這些檢驗和其他的檢驗都是基于均值、方差、比例及其他統(tǒng)計量所形成的具有

2、常見模式的頻率分布。最有名的分布就是正態(tài)分布,它是:檢驗的基礎(chǔ)。t檢驗、F檢驗和卡方(2)檢驗是基于t分布、F分布和卡方分布。適用場合想知道一組或更多組數(shù)據(jù)的平均值、比例、方差或其他特征時;當結(jié)論是基于更大總體中所取得的樣本時。例如:想確定一個過程的均值或方差有否改變;想確定很多數(shù)據(jù)集的均值或方差是否不同:想確定兩組不同的數(shù)據(jù)集的比例是否不同;想確定真正的比例、均值或方差是否和一個定值相等(或大于或小于)。實施步驟假設(shè)檢驗的步驟由三部分組成:理解要解決的問題并安排檢驗(以下步驟13);數(shù)字計算通常由計算機完成(步驟4和步驟5);應(yīng)用數(shù)值結(jié)果到實際問題中(步驟6)。雖然計算機能處理數(shù)字,但理解假

3、沒檢驗隱含的觀念對第1部分和第3部分至關(guān)重要。如果第一次接觸假設(shè)檢驗,那么從看“注意事項”中的術(shù)語和定義開始。這些定義解釋了假設(shè)檢驗的慨念,然后再回來看這個步驟。本書不可能詳細地涉及假設(shè)檢驗。這個步驟是個綜述和快速參考。要得到更多的信息,查閱統(tǒng)計學(xué)參考書或請教統(tǒng)計學(xué)家。1確定要從數(shù)據(jù)中獲得的結(jié)論。選擇適當?shù)臋z驗方法。用哪種檢驗取決于檢驗的目的和數(shù)據(jù)的種類??梢杂帽?.7和表5.8概括的常用的假設(shè)檢驗,或者請教統(tǒng)計學(xué)家以得到幫助。2建立零假設(shè)和備擇假設(shè)。確定問題是屬于雙尾檢驗、左尾檢驗還是右尾檢驗。選擇顯著性水平。計算檢驗統(tǒng)計量,可借助計算機軟件。5用統(tǒng)計分布的統(tǒng)計表或計算機程序等來確定檢驗統(tǒng)計

4、量的P值。對于z檢驗可用表A.1正態(tài)曲線以下的曲線。6把P值與左尾或右尾檢驗的或者雙尾檢驗的/2作比較,如果P值較小,那么拒絕零假設(shè)并會得到備擇假設(shè)可能正確的結(jié)論。否則,不能拒絕零假設(shè),并得出沒有足夠證據(jù)支持備擇假設(shè)的結(jié)論。備擇步驟步驟14同上。然后:用統(tǒng)計表或計算機程序確定如下所示的檢驗統(tǒng)計量的臨界值和拒絕域。以z檢驗作為示例,對t檢驗、F檢驗或卡方檢驗,用統(tǒng)計量f、F或2來替換z。比較檢驗統(tǒng)計量和拒絕域。如果檢驗統(tǒng)計量值落在拒絕域內(nèi),拒絕零假設(shè),結(jié)論是備擇假已知樣本成對且樣本屋30樣本成對且樣本筮C30未知,樣本址n30寸(7:/沖1)丄(.扇呢、1較比例與給定值列方差分析(AOVA):咨

5、詢統(tǒng)計學(xué)家或查詢統(tǒng)計文獻旳和住已知,且樣本獨立比較二個或三午以上的均值。H.,4P2工檢驗土公式復(fù)雜、取決于與和比姥否相等用計算機軌件樣本獨立數(shù)據(jù)服從止態(tài)分布且6=cz=小和氐未知樣本雖?il或施VB0數(shù)據(jù)服從止態(tài)分布且樣本獨必m和匪未知樣本能如和住都婁3d,耳樣本獨立F=f/或分于自由度為i-l分母自由度為常一1遁k丘容=”lx/Csi/叭+Is表57均值、方差和比例的假設(shè)檢驗比較標準差與給定值6Hy70F-總體的實際均值朋假設(shè)的均值X樣本均值&總體的標椎方差S樣本的爵準差用樣本雖M自由度7!一總體的比例叭假設(shè)的比例價P樣本的比例2樣本量p扔和自的抑權(quán)平覽數(shù)據(jù)服從止態(tài)分布df=n1仃-恵體的

6、標準差甌假設(shè)的標準差s樣本茁標準差“樣本量df自由度/=跆矢d處的均值di的標準差-H樣本對的個數(shù)比較兩個標準差。耳6=化比較均值與給定的啓。且,中=輕疚未知樣本訊30,且數(shù)據(jù)服從正態(tài)分布2心一1比較兩個比例H,::mn對于其他情況或條件不瀚足以上所述的可咨詢統(tǒng)計專家或參考統(tǒng)計學(xué)書。比較兩者的剤值口樺本獨遼旦期望的頻率值說和?:一一VTTu(L樣本獨立且心和330數(shù)據(jù)服從正態(tài)分布狀1+?/也(1/0(-/乳1+1/也)71卩14?iptP= #a5.8分類數(shù)據(jù)的卡方假設(shè)檢驗卡方檢驗當數(shù)據(jù)是計數(shù)值(頻數(shù))且所有的024至少80%的折有這些檢驗都是右是檢驗比較不同組的不同種類的頻率分布(比例)各組

7、分布C比例)相同。確宦質(zhì)個變就相互獨立H):變星1和變量2相互獨立a,仝G_Ef另E所有單元格的相加首先構(gòu)建關(guān)聯(lián)表:變量1放于$行,變僮2放于&列。每個單元格:O單元格的寞際(觀測)值?C列的所有值:栢加的和扌R行的所有值相加的和;-V所有觀測僅的總和;E期望的單元格值,E=Cs比較応個比例H山嚴氏這是上面檢驗的特例,其中r=2且芒=2結(jié)果和兩個比例的宅檢臉相同擬合優(yōu)度:比較觀測的額率分布與期望的或理論上的分右觀測的分布和期望的分布相同?.(QFAX2=S瓦齦屋檢驗卷血和gV比罰或z-fl;2示例:t檢驗一家食品雜貨店從一供應(yīng)商處購買幾箱蘋果,每箱質(zhì)量為50磅(llb=0.455kg),固定價

8、格。供應(yīng)商保證每箱的平均質(zhì)量確實是50磅。產(chǎn)品小組隨機抽取10箱稱量。質(zhì)量分別為:50.l49.650.349.949.549.750.049.649.750.2雜貨店受騙沒有?統(tǒng)計上講,產(chǎn)品小組的問題是:“我們接受的蘋果箱的平均質(zhì)量少于50磅嗎?”零假設(shè)是“蘋果箱的平均質(zhì)量等于50磅”,備擇假設(shè)是“蘋果箱的平均質(zhì)量小于50磅”計劃用5%的顯著性水平。在表5.7中找均值與給定的值作比較的檢驗。s未知,樣本容量小于30個,假設(shè)箱子的質(zhì)量服從正態(tài)分布。因此用t檢驗。因為備擇假設(shè)是“小于”所以需要左尾檢驗。向在線計算器中輸入數(shù)據(jù)得到以下結(jié)果:樣本均值=49.86標準方差=0.28t=1.583P=0

9、.07因為P值大于0.05,所以不能拒絕零假設(shè),沒證據(jù)表明他們受騙。圖表5.99顯示了t分布,檢驗統(tǒng)計量t=1.583,曲線下這個值以外的區(qū)域是P=0.07。用備擇步驟,從t表中確定a=0.05,自由度為9,臨界值為ta=1.833。因為是左尾檢驗,a拒絕域是任何小于一1.833的z值。檢驗統(tǒng)計量為一1.583,沒有落在拒絕城,所以不拒絕零假設(shè)。圖表5.100顯示了t分面、臨界值、拒絕域和曲線下相等于a=0.05的區(qū)域。兩幅圖的比較表明兩個實施步驟如何以不同方式得到相同結(jié)論的過程。對左尾情況,只要檢驗統(tǒng)計量t大于臨界值t,曲線下t值左邊的區(qū)域即P值就比a大,a就是曲線下t左邊的區(qū)域。aa一家服

10、裝零售商想了解其提議的生產(chǎn)線的變化是否會在不同地區(qū)被同樣地接受。他們隨機挑選了750名顧客,描述了提議的新產(chǎn)品,然后讓顧客估計購買的可能性。他們按地理位置對數(shù)據(jù)分組,建立了五行、四列的關(guān)聯(lián)表,見圖表5.17的關(guān)聯(lián)表。布有差異”。選擇顯著性水平為5%,計算出自由度為df=12。大多卡方表按備擇步驟設(shè)計,可以查詢a或la,讀取臨界值。對a=0.05和df=12來說,2臨界值為21.026。如果檢驗統(tǒng)計量大于它就拒絕零假設(shè)。用電子制表軟件計算每一單元的E。E代表著零假設(shè)為真時的期望值,也就是每個地區(qū)的購買可能性分布和整體分布一樣時的期望值。接著計算每單元的(OE)2FE,加起來得到檢驗統(tǒng)計量2=22

11、.53,比臨界值21.026大,所以拒絕零假設(shè)。購買可能性分布隨區(qū)域而不同。這個檢驗等同于檢驗兩個變量是否獨立。結(jié)果表明地理區(qū)域和購買可能性兩個變量不獨立。已知顧客所在的地區(qū)就能預(yù)測他是否更有可能購買新生產(chǎn)線。A另一示例:卡方檢驗2相同的零售商計劃改變產(chǎn)品目錄的格式和風格并想了解新的格式是否會有效提高訂單。作為測試,他們隨機挑選顧客送出去200000本新春裝目錄冊,另外1800000本目錄冊是傳統(tǒng)版本。參考關(guān)聯(lián)表例子,用圖表5.18的2X2的關(guān)聯(lián)表來組織數(shù)據(jù)。卡方檢驗比較兩者的比例。零假設(shè)是“顧客從測試目錄和從標準目錄購買的比例相同?!睒藴誓夸洔y試目錄總計買34852497239824不買17

12、65148195028.1960176總計1S000002000002000000圉表5門82X21#形分析表示例選用5%的顯著性水平。比較比例,自由度就是1。a=0.05和df=1時,2臨界值為3.841,檢驗統(tǒng)計量2=278。因此拒絕零假設(shè),結(jié)論是顧客從新格式目錄和從舊目錄購買的比例顯著不同。注意事項和許多學(xué)科一樣,統(tǒng)計學(xué)有自己專門的語言表達常用的概念。以下是在實施步驟中常用的定義術(shù)語:檢驗:一種統(tǒng)計檢驗,如z檢驗、t檢驗、F檢驗或卡方檢驗。要知道選用哪種檢驗是實施步驟中最難的一部分,取決于數(shù)據(jù)的種類以及想從數(shù)據(jù)中得出結(jié)論的種類。假設(shè):陳述一事實,由檢驗證明或反駁。零假設(shè),H0:是想檢驗的

13、假沒,數(shù)據(jù)是隨機的。稱為“零”是因為通常(不總是)零假設(shè)意味著兩組數(shù)據(jù)中或從數(shù)據(jù)中計算的參數(shù)與給定的值之間沒有差異。備擇假設(shè),H。:如果零假設(shè)為假,備擇假設(shè)肯定為真。通常備擇假設(shè)暗含數(shù)據(jù)來自真實的影響而非隨機的。統(tǒng)計量:表征樣本數(shù)據(jù)某些方面的變量。平均數(shù)、均值、方差和比例都是統(tǒng)計量。檢驗統(tǒng)計量:用來檢驗零假設(shè)的統(tǒng)計量。對每種檢驗都有一個公式表達適當?shù)臋z驗統(tǒng)計量。這樣做如果零假設(shè)是真(數(shù)據(jù)隨機),統(tǒng)計量就來自一有名分布,如z檢驗的正態(tài)分布。雙尾、右尾、左尾:描述檢驗是否涉及頻率分布的雙側(cè)(雙尾)或只是單側(cè)。如果備擇假設(shè)表達式中包合工(不等于),需要雙尾檢驗。如果包含(小于)需要左尾檢差驗,包含(

14、大于),需要右尾檢驗??ǚ綑z驗通常是雙尾檢驗。P值:檢驗統(tǒng)計量在已知分布下隨機發(fā)生的概率。P值等于曲線下檢驗統(tǒng)計量以外的那個區(qū)域(見圖表5.99)。P值越小,越能肯定結(jié)果是真的,不只是隨機的。由于各種檢驗分布都很有名,這些概率能在表中或計算機程序中得到。顯著性水平,a:能確定結(jié)果是真的以前反映我們能多大程度確信結(jié)果不是隨機產(chǎn)生的數(shù)值。通常取1%、5%、10%(a=0.01、0.05、0.10)。例如:單側(cè)檢驗a=0.05,只要隨機得到的結(jié)果小于5%即PV0.05則可斷定結(jié)果為真。臨界值:概率正好等于a時的檢驗統(tǒng)計量的值。曲線尾部臨界值以外的區(qū)域面積等于a。對雙尾檢驗來說有兩個臨界值(見圖表5.

15、100),每一尾部一個,每個臨界值以外的區(qū)域都等于a/2。臨界值由表或計算機程序確定,記為土za或土za/2o拒絕域:如果檢驗統(tǒng)計量落在這個區(qū)域,零假設(shè)就被拒絕的頻率分布區(qū)域。對左尾檢驗來說,這些值位于小于臨界值的分布曲線尾部。對右尾檢驗而言,則位于大于臨界值的曲線尾部雙尾檢驗拒絕域包含兩頭。置信水平,(1a)。置信區(qū)間:事件隨機發(fā)生時以很大概率包含檢驗統(tǒng)計量的區(qū)間范圍。拒絕域是置信區(qū)間以外的區(qū)域。顯著水平、置信水平、置信區(qū)間之間的關(guān)系為:a=0.05,置信水平等于95%,則認為落在95%置信區(qū)間的值是最有可能單獨地隨機發(fā)生的,不能拒絕零假設(shè)。置信區(qū)間的定義講究技巧。95%置信區(qū)間不是分布所有

16、值的95%落在這一區(qū)間而是當一個值屬于這個分布時,基于樣本數(shù)據(jù)建立的所有區(qū)間95%地包含這個值。假設(shè)檢驗中,觀察檢驗分布曲線,計算位于圖形水平軸某處的檢驗統(tǒng)計量。如果曲線下檢驗統(tǒng)計量以外的區(qū)域P足夠?。ㄐ∮陲@著水平a),則此統(tǒng)計檢驗量可能就不服從這個分布。因為曲線是頻率分布,曲線任何部分以下的區(qū)域就是事件發(fā)生可能性的度量,標在水平軸上。這就是在曲線下區(qū)域能找到a和P值的原因。由于假設(shè)檢驗涉及樣本和概率,所以有可能得到錯誤的結(jié)論。第一類錯誤就是零假設(shè)為真而被拒絕(見圖表5.101)。第一類錯誤的概率是:顯著性水平a。在第二個例子中,有5%的可能性就是區(qū)域間分布差異確實是隨機的。第二類錯誤是零假設(shè)為假而沒有被拒絕。如果食品雜貨店真的在蘋果箱的重量上被欺騙則第二類錯誤發(fā)生。第二類錯誤的概率0的計算更復(fù)雜,超出本書討論范圍。不幸的是,“a越小,0越大。但是給定a,增加樣本容量,0將變小。因為第二類錯誤概率的存在,當零假設(shè)沒被拒絕時,不能得出備擇假設(shè)是錯的結(jié)論,只能說數(shù)據(jù)很多網(wǎng)站上有計算器,可以計算檢驗統(tǒng)計量和統(tǒng)計量、概率和臨界值。但是要知道采用哪種檢驗以治真正確馳第一類艇第二類錯俁正確躋論辭W#真民假支持圖何5釋結(jié),這類很重要類第誤例如:處理前、丿口相同樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論