第七章非參數(shù)檢驗詳解演示文稿_第1頁
第七章非參數(shù)檢驗詳解演示文稿_第2頁
第七章非參數(shù)檢驗詳解演示文稿_第3頁
第七章非參數(shù)檢驗詳解演示文稿_第4頁
第七章非參數(shù)檢驗詳解演示文稿_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第七章非參數(shù)檢驗詳解演示文稿現(xiàn)在是1頁\一共有78頁\編輯于星期五優(yōu)選第七章非參數(shù)檢驗現(xiàn)在是2頁\一共有78頁\編輯于星期五非參數(shù)檢驗非參數(shù)檢驗:(1)在總體分布未知或知道甚少的情況下,利用樣本數(shù)據(jù)對總體分布形態(tài)等進行推斷的方法。(2)推斷過程中不涉及有關(guān)總體分布的參數(shù)?,F(xiàn)在是3頁\一共有78頁\編輯于星期五7.1單樣本的非參數(shù)檢驗

1.目的:樣本來自總體的分布是否與某個已知的分布相吻合?—繪制樣本數(shù)據(jù)的直方圖、pp圖、QQ圖判斷—粗略—通過非參數(shù)檢驗—精確2.單樣本非參數(shù)檢驗(1)對單個總體的分布形態(tài)等進行推斷(2)方法:卡方檢驗、二項分布檢驗、K-S檢驗、變量值隨機性檢驗等。現(xiàn)在是4頁\一共有78頁\編輯于星期五總體分布的卡方檢驗1、基本思想的理論依據(jù):

如果從一個隨機變量X中隨機抽取若干個觀察樣本,這些觀察樣本落在X的k個互不相交的子集中的觀察頻數(shù)服從一個多項分布,這個多項分布當(dāng)k趨于無窮時近似服從卡方分布?;谶@一思想,對變量X總體分布的檢驗可從對各個觀察頻數(shù)的分析入手。現(xiàn)在是5頁\一共有78頁\編輯于星期五總體分布的卡方檢驗1.基本思想-吻合性檢驗(1)原假設(shè):樣本來自的總體分布與期望分布無顯著差異。變量值落入第i個子集中的理論概率為,相應(yīng)的期望頻率為現(xiàn)在是6頁\一共有78頁\編輯于星期五二.總體分布卡方檢驗的應(yīng)用實例:

SPSS總體分布的卡方檢驗對數(shù)據(jù)存放,需要定義一個存放變量值的SPSS變量和一個存放各變量值觀測頻數(shù)的變量,并指定該變量為加權(quán)變量?,F(xiàn)在是7頁\一共有78頁\編輯于星期五2.實現(xiàn)步驟[Analyze]-[NonparametricTests]-[Chi-Square]現(xiàn)在是8頁\一共有78頁\編輯于星期五(1)選定待檢驗的變量到[TestVariablelist](2)在[ExpectedRange]中確定參與分析的觀測值的范圍:[Getfromdata]:所有觀測數(shù)據(jù)都參與分析[usespecifiedrange]:只在該取值范圍內(nèi)的觀測數(shù)據(jù)才參與分析。(3)[Expectedvalues]給出各理論值[Allcategoriesequal]:所有子集的頻數(shù)都相同[value]:依次輸入值,通過[add]、[change]、[remove]進行增加、修改和刪除。(4)單擊Options按鈕,在Statistics欄中選擇輸出統(tǒng)計量。Descriptive復(fù)選項,指定輸出變量的均值、標(biāo)準(zhǔn)差、最大值、最小值、非缺失個體的數(shù)量。現(xiàn)在是9頁\一共有78頁\編輯于星期五Quartiles復(fù)選項,輸出四分位數(shù)。(2)MissingValues欄中選擇對缺失值的處理方式。Excludecasetest-by-test選項,將參與對比中的缺失值排除。Excludecaseslistwise選項,剔除任何變量中所有含缺失值的樣品。現(xiàn)在是10頁\一共有78頁\編輯于星期五3.應(yīng)用案例醫(yī)學(xué)研究表明心臟病人猝死人數(shù)與日期的關(guān)系為:一周內(nèi),星期一猝死者較多,其他日子基本相當(dāng),各天的比例近似為:2.8:1:1:1:1:1:1根據(jù)“心臟病猝死”數(shù)據(jù),推斷總體分布是否與理論分布相吻合。分析:利用總體分布卡方檢驗實現(xiàn)。現(xiàn)在是11頁\一共有78頁\編輯于星期五4.應(yīng)用練習(xí)擲一顆六面體300次,用數(shù)字型數(shù)據(jù)1、2、3、4、5、6分別代表六面的六個點,試問這顆六面體是否均勻。123456434956456641現(xiàn)在是12頁\一共有78頁\編輯于星期五二項分布檢驗在現(xiàn)實生活中有很多數(shù)據(jù)的取值是二值的,例如,人群可以分為男性和女性,產(chǎn)品可以分為合格和不合格,學(xué)生可以分為三好學(xué)生和非三好學(xué)生。通常將這樣的二值分別用1和0表示。如果進行n次相同的實驗,則出現(xiàn)兩類(1或0)的次數(shù)可以用離散型隨機變量來描述。如果隨機變量值為1代表成功,其概率設(shè)為p,則隨機變量值為0的概率q便等于1-p,則成功次數(shù)變量X的分布為二項分布?,F(xiàn)在是13頁\一共有78頁\編輯于星期五二項分布檢驗1.基本思想(1)通過樣本數(shù)據(jù)檢驗樣本來自的總體是否服從指定概率p的二項分布。(2)小樣本-精確檢驗:計算n次試驗中某類出現(xiàn)的次數(shù)小于等于x次的概率:大樣本-近似檢驗現(xiàn)在是14頁\一共有78頁\編輯于星期五2.實現(xiàn)步驟

[Analyze]-[NonparametricTests]-[Binomial]現(xiàn)在是15頁\一共有78頁\編輯于星期五(1)選定待檢驗的變量到[TestVariablelist](2)[definedichotomy]中指定如何分類[getfromdata]:檢驗變量為二值變量[cutpoint]:輸入具體數(shù)值,小于等于該值的為第一組,大于該組的為第二組(3)[Testproportion]:輸入二項分布的檢驗概率值現(xiàn)在是16頁\一共有78頁\編輯于星期五3.應(yīng)用案例利用“產(chǎn)品合格率”數(shù)據(jù),推斷該批產(chǎn)品的一級品率是否為90%。分析:產(chǎn)品合格與否屬于二值變量,可以通過二項分布檢驗實現(xiàn)。現(xiàn)在是17頁\一共有78頁\編輯于星期五3.應(yīng)用練習(xí)1.擲一枚硬幣31次,出現(xiàn)正面和反面在上的結(jié)果見下表,試問這枚硬幣是否均勻。2.根據(jù)居民儲蓄存款的數(shù)據(jù),分析儲戶對未來收入的看法,檢驗儲戶總體對收入持保守或悲觀態(tài)度的比例是否與0.4有顯著性差異。次12345678910111213141516面ABABBAAABBABBAAA次171819202122232425262728293031面BABBABBABABBABA現(xiàn)在是18頁\一共有78頁\編輯于星期五單樣本K-S檢驗1.基本思想(1)以俄羅斯數(shù)學(xué)家柯爾莫哥和斯米諾夫名字命名(2)利用樣本數(shù)據(jù)推斷樣本來自的總體是否服從某一理論分布,是一種擬合優(yōu)度的檢驗方法,適用于探索連續(xù)型隨機變量的分布(3)步驟①計算各樣本觀測值在理論分布中出現(xiàn)的理論累計概率值F(x)②計算各樣本觀測值的實際累計概率值S(x)③計算理論累計概率值與實際累計概率值的差D(x)④計算差值序列中最大絕對差值D現(xiàn)在是19頁\一共有78頁\編輯于星期五(4)原假設(shè)成立時:①小樣本下:D~kolmogorov分布②大樣本下:近似服從K(x)分布③SPSS僅給出大樣本下的和對應(yīng)的p值(5)決策①D統(tǒng)計量的p值<顯著性水平,拒絕原假設(shè),樣本來自的總體與指定分布有顯著差異②D統(tǒng)計量的p值>顯著性水平,不拒絕原假設(shè),樣本來自的總體與指定分布無顯著差異現(xiàn)在是20頁\一共有78頁\編輯于星期五2.實現(xiàn)步驟

[Analyze]-[NonparametricTests]-[1-sampleK-S]現(xiàn)在是21頁\一共有78頁\編輯于星期五(1)選定待檢驗的變量到[TestVariablelist](2)[Testdistribution]:選擇理論分布①[normal]:正態(tài)分布②[uniform]:均勻分布③[poisson]:泊松分布④[exponential]:指數(shù)分布現(xiàn)在是22頁\一共有78頁\編輯于星期五3.應(yīng)用案例利用“兒童身高”數(shù)據(jù)分析周歲兒童身高總體是否服從正態(tài)分布。分析:可以通過單樣本K-S檢驗實現(xiàn)?,F(xiàn)在是23頁\一共有78頁\編輯于星期五3.應(yīng)用練習(xí)1、利用存款儲蓄調(diào)查數(shù)據(jù),分析儲戶一次存款金額的總體是否服從正態(tài)分布,并結(jié)合存款金額的pp圖和qq圖來分析?,F(xiàn)在是24頁\一共有78頁\編輯于星期五7.1.4變量值隨機性檢驗1.基本思想(1)通過對樣本變量值的分析,實現(xiàn)對總體的變量值出現(xiàn)是否隨機進行檢驗。(2)原假設(shè):總體變量值出現(xiàn)是隨機的。①檢驗依據(jù):游程-樣本序列中連續(xù)出現(xiàn)相同的變量值的次數(shù)。②游程數(shù)太大或太小都表明變量值存在不隨機的現(xiàn)象現(xiàn)在是25頁\一共有78頁\編輯于星期五關(guān)于隨機性的游程檢驗(runtest)游程檢驗方法是檢驗一個取兩個值的變量的這兩個值的出現(xiàn)是否是隨機的。假定下面是由0和1組成的一個這種變量的樣本:0000111111001011100000000其中相同的0(或相同的1)在一起稱為一個游程(單獨的0或1也算)。這個數(shù)據(jù)中有4個0組成的游程和3個1組成的游程。一共是R=7個游程。其中0的個數(shù)為m=15,而1的個數(shù)為n=10。

現(xiàn)在是26頁\一共有78頁\編輯于星期五(3)檢驗統(tǒng)計量(4)決策:Z統(tǒng)計量的p值<顯著性水平,拒絕原假設(shè),變量值的出現(xiàn)不是隨機的。Z統(tǒng)計量的p值>顯著性水平,不拒絕原假設(shè),變量值的出現(xiàn)是隨機的?,F(xiàn)在是27頁\一共有78頁\編輯于星期五關(guān)于隨機性的游程檢驗(runtest)

例(run2.sav):從某裝瓶機出來的30盒化妝品的重量如下(單位克)當(dāng)然,游程檢驗并不僅僅用于只取兩個值的變量,它還可以用于某個連續(xù)變量的取值小于某個值及大于該值的個數(shù)(類似于0和1的個數(shù))是否隨機的問題??聪旅胬?。71.671.071.870.370.572.971.071.070.171.871.970.370.969.371.267.367.667.767.668.168.067.569.867.569.770.069.170.471.069.9為了看該裝瓶機是否工作正常,首先需要驗證是否大于和小于中位數(shù)的個數(shù)是否是隨機的(零假設(shè)為這種個數(shù)的出現(xiàn)是隨機的)。

現(xiàn)在是28頁\一共有78頁\編輯于星期五關(guān)于隨機性的游程檢驗(runtest)

如果把小于中位數(shù)的記為0,否則記為1,上面數(shù)據(jù)變成下面的0-1序列111111110111101000000000000110這就歸為上面的問題。當(dāng)然這里進行這種變換只是為了易于理解。實際計算時,用不著這種變換,計算機會自動處理這個問題的。直接利用這個數(shù)據(jù),通過SPSS,得到下面游程檢驗結(jié)果的輸出。

現(xiàn)在是29頁\一共有78頁\編輯于星期五2.實現(xiàn)步驟

[Analyze]-[NonparametricTests]-[Runs]現(xiàn)在是30頁\一共有78頁\編輯于星期五(1)選定待檢驗的變量到[TestVariablelist](2)[cutpoint]:計算游程數(shù)的分界值①[median]:樣本中位數(shù)為分界值②[mode]:樣本眾數(shù)為分界值③[mean]:樣本均值為分界值④[custom]:以用戶輸入的值為分界值,SPSS將小于該分界值的所有變量作為一組,大于或等于該分界值的所有變量作為一組,計算游程。現(xiàn)在是31頁\一共有78頁\編輯于星期五3.應(yīng)用案例利用“電纜數(shù)據(jù)”推斷耐壓設(shè)備的工作是否正常。分析:①若耐壓數(shù)據(jù)的變動是隨機的-則設(shè)備工作正常②若耐壓數(shù)據(jù)的變動不是隨機的-則設(shè)備工作存在不正常③可以通過變量值隨機性檢驗實現(xiàn)?,F(xiàn)在是32頁\一共有78頁\編輯于星期五4.應(yīng)用練習(xí)擲硬幣20次得到的實驗數(shù)據(jù),試問硬幣實驗是否是隨機的。11010001101011100110現(xiàn)在是33頁\一共有78頁\編輯于星期五7.2兩獨立樣本的非參數(shù)檢驗(1)獨立樣本:在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下所獲得的樣本。(2)推斷樣本來自的兩個總體的分布等是否存在顯著差異。(3)方法:曼-惠特尼U檢驗、K-S檢驗、W-W游程檢驗、極端反應(yīng)檢驗等?,F(xiàn)在是34頁\一共有78頁\編輯于星期五秩(rank)

非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢?一般來說,秩就是該數(shù)據(jù)按照升冪排列之后,每個觀測值的位置。例如我們有下面數(shù)據(jù).Xi159183178513719Ri75918426310這下面一行(記為Ri)就是上面一行數(shù)據(jù)Xi的秩。

現(xiàn)在是35頁\一共有78頁\編輯于星期五秩(rank)

利用秩的大小進行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢驗的優(yōu)點。多數(shù)非參數(shù)檢驗明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒有涉及秩的性質(zhì)。

現(xiàn)在是36頁\一共有78頁\編輯于星期五兩獨立樣本的曼-惠特尼U檢驗1.基本思想(1)原假設(shè):兩組獨立樣本來自的兩總體分布無顯著差異。(2)通過兩組樣本平均秩的研究實現(xiàn)推斷

秩-變量值排序的名次,變量值有幾個,對應(yīng)的秩便有幾個。(3)檢驗步驟①將兩組樣本混合并升序排列,得每個數(shù)據(jù)的秩②分別對樣本X和Y的秩求平均,得平均秩和③計算樣本X優(yōu)于樣本Y秩的個數(shù)和樣本Y優(yōu)于樣本X秩的個數(shù)④依據(jù)和計算WilcoxonW統(tǒng)計量和曼-惠特尼U統(tǒng)計量?,F(xiàn)在是37頁\一共有78頁\編輯于星期五WilcoxonW統(tǒng)計量:曼-惠特尼統(tǒng)計量U為:大樣本下,U近似服從正態(tài)分布現(xiàn)在是38頁\一共有78頁\編輯于星期五現(xiàn)在是39頁\一共有78頁\編輯于星期五兩獨立樣本的K-S檢驗1.基本思想(1)原假設(shè):兩組獨立樣本來自的兩總體的分布無顯著差異。(2)與單樣本K-S檢驗的基本思路大體一致,差別在于:以變量值的秩為分析對象,而非變量值本身。(3)檢驗步驟①將兩組樣本混合并按升序排列②分別計算兩組樣本秩的累計頻數(shù)和累計頻率③計算兩組累計頻率的差,得秩的差值序列及D統(tǒng)計量,④SPSS計算大樣本下的和對應(yīng)的p值(3)決策::拒絕原假設(shè),兩總體的分布有顯著差異:不拒絕原假設(shè),兩總體的分布無顯著差異

現(xiàn)在是40頁\一共有78頁\編輯于星期五2.k-s檢驗將兩樣本混合并按升序排序分別計算兩個樣本在相同點上的累計頻數(shù)和累計頻率兩個累計頻率相減.如果差距較小,則認(rèn)為兩總體分布無顯著差異應(yīng)保證有較大的樣本數(shù)現(xiàn)在是41頁\一共有78頁\編輯于星期五現(xiàn)在是42頁\一共有78頁\編輯于星期五兩獨立樣本的游程檢驗1.基本思想(1)原假設(shè):兩組獨立樣本來自的兩總體的分布無顯著差異。(2)檢驗步驟①將兩組樣本混合并按升序排列,組標(biāo)記值也隨之重新排列②計算組標(biāo)記值序列的游程數(shù),如果游程數(shù)較大,則說明是由于兩類樣本數(shù)據(jù)充分混合的結(jié)果,即:認(rèn)為兩總體分布無顯著差異.③根據(jù)游程數(shù)計算Z統(tǒng)計量,Z統(tǒng)計量近似服從正態(tài)分布(3)決策::拒絕原假設(shè),兩總體的分布有顯著差異:不拒絕原假設(shè),兩總體的分布無顯著差異現(xiàn)在是43頁\一共有78頁\編輯于星期五極端反應(yīng)檢驗1.基本思想(1)原假設(shè):兩獨立樣本來自的兩個總體的分布無顯著差異。(2)一組樣本為控制樣本,一組樣本為實驗樣本,看實驗樣本相對于控制樣本是否出現(xiàn)了極端反應(yīng)。(3)檢驗步驟①兩組樣本混合按升序排列②求控制樣本的最小秩和最大秩③計算跨度④為了消除樣本數(shù)據(jù)中的極端值,計算跨度前可按比例(通常5%)去除控制樣本中靠近兩端的樣本值,再求跨度,得截頭跨度⑤針對跨度或截頭跨度計算H統(tǒng)計量:現(xiàn)在是44頁\一共有78頁\編輯于星期五小樣本下,H服從Hollander分布,大樣本下,H近似服從正態(tài)分布(4)決策:①H統(tǒng)計量的p值<顯著性水平,拒絕原假設(shè),兩獨立樣本來自的總體分布存在顯著差異②H統(tǒng)計量的p值>顯著性水平,不拒絕原假設(shè),兩獨立樣本來自的總體分布不存在顯著差異現(xiàn)在是45頁\一共有78頁\編輯于星期五兩獨立樣本非參數(shù)檢驗的步驟[Analyze]-[NonparametricTests]-[2independentsamples](1)選擇待檢驗的變量到[Testvariablelist](2)[groupingvariable]:存放組標(biāo)志的變量,并通過[definegroups]給出兩組的標(biāo)志值。(3)[testtype]:選擇相應(yīng)的檢驗方法現(xiàn)在是46頁\一共有78頁\編輯于星期五現(xiàn)在是47頁\一共有78頁\編輯于星期五兩獨立樣本非參數(shù)檢驗的方法比較不同的分析方法對同批數(shù)據(jù)的分析,其結(jié)論可能不盡相同。一方面說明分析過程中對數(shù)據(jù)進行反復(fù)探索是極為必要的,另一方面也注意不同方法本身側(cè)重點的差異性。1、曼-惠特尼U檢驗注重對分布的中心位置(平均水平)作檢驗,實際上是檢驗:兩樣本所對應(yīng)的總體具有相同的中心位置(中位數(shù))。若不能明確兩總體分布的形狀是否相同,則不宜單獨使用此方法。2、K-S檢驗用于兩總體分布是否存在顯著差異性,對兩總體的全貌作檢查,即位置和分布形狀的差異性的檢驗。3、游程檢驗與K-S檢驗相似,也是對全貌作檢驗,但其功效不如K-S檢驗。4、極端反應(yīng)檢驗注重對分布范圍(變異程度)作檢驗,實際上是檢驗兩樣本所對應(yīng)的總體具有相同的分布范圍,要求樣本足夠大?,F(xiàn)在是48頁\一共有78頁\編輯于星期五應(yīng)用案例利用“使用壽命”數(shù)據(jù),判斷兩種工藝下產(chǎn)品的使用壽命的分布是否存在顯著差異,進而對兩個工藝的優(yōu)劣進行判斷。分析:兩個工藝產(chǎn)品的使用壽命可看作兩獨立樣本,可以通過曼-惠特尼U檢驗、K-S檢驗、W-W游程檢驗、極端反應(yīng)檢驗實現(xiàn)?,F(xiàn)在是49頁\一共有78頁\編輯于星期五應(yīng)用練習(xí)1、設(shè)有甲、乙兩種安眠藥,考慮比較它們的治療效果,獨立觀察20名患者。10人服甲藥,令10人服乙藥,睡眠延長的時數(shù)見下表。試問這兩種藥物的療效有無顯著性差異。2、利用居民儲蓄調(diào)查數(shù)據(jù),對城鎮(zhèn)和農(nóng)村儲戶的存款金額的分布進行比較分析。服甲藥睡眠延長時數(shù)1.90.81.10.10.14.45.51.64.63.4服乙藥睡眠延長時數(shù)0.7-1.6-0.2-1.2-0.13.43.70.80.02.0現(xiàn)在是50頁\一共有78頁\編輯于星期五7.3多獨立樣本的非參數(shù)檢驗1.通過分析多組獨立樣本數(shù)據(jù),推斷樣本來自的多個總體的中位數(shù)或分布是否存在顯著差異。2.方法:中位數(shù)檢驗、Kruskal-Wallis檢驗、Jonckheere-Terpstra檢驗?,F(xiàn)在是51頁\一共有78頁\編輯于星期五中位數(shù)檢驗1.基本思想(1)原假設(shè):多個獨立樣本來自的多個總體的中位數(shù)無顯著差異。(2)檢驗步驟①將多組樣本混合升序排列,求混合樣本的中位數(shù)②分別計算各組樣本中大于和小于中位數(shù)的樣本個數(shù),形成列聯(lián)表(p230表7-13)③利用卡方檢驗分析各組樣本來自的總體對中位數(shù)的分布是否一致?,F(xiàn)在是52頁\一共有78頁\編輯于星期五(3)決策①卡方統(tǒng)計量的p值<顯著性水平,拒絕原假設(shè),多個獨立樣本來自的多個總體的中位數(shù)存在顯著差異。②卡方統(tǒng)計量的p值>顯著性水平,不拒絕原假設(shè),多個獨立樣本來自的總體的中位數(shù)不存在顯著差異?,F(xiàn)在是53頁\一共有78頁\編輯于星期五多獨立樣本的Kruskal-Wallis檢驗1.基本思想(1)原假設(shè):多個獨立樣本來自的多個總體的分布無顯著差異。(2)是兩獨立樣本曼-惠特尼U檢驗的推廣(3)檢驗步驟①將多組樣本數(shù)據(jù)混合并升序排列,求各變量的秩②考察各組秩的均值是否有顯著差異③各組秩的差異借助方差分析:秩的變差分解為:組間差和組內(nèi)差

a若秩的總變差大部分可由組間差解釋,則各樣本組的總體分布存在顯著差異

b若秩的總變差大部分不能由組間差解釋,則各樣本組的總體分布無顯著差異現(xiàn)在是54頁\一共有78頁\編輯于星期五④構(gòu)造K-W統(tǒng)計量(4)決策:SPSS自動計算K-W統(tǒng)計量和對應(yīng)的p值

①p值<顯著性水平,拒絕原假設(shè),多個獨立樣本來自的多個總體分布存在顯著差異。

②p值>顯著性水平,不拒絕原假設(shè),多個獨立樣本來自的多個總體分布無顯著差異?,F(xiàn)在是55頁\一共有78頁\編輯于星期五多獨立樣本的Jonckheere-Terpstra檢驗1.基本思想(1)原假設(shè):多個獨立樣本來自的多個總體的分布無顯著差異(2)J-T統(tǒng)計量現(xiàn)在是56頁\一共有78頁\編輯于星期五(3)決策:SPSS自動計算J-T統(tǒng)計量,Z統(tǒng)計量和對應(yīng)的p值

①p值<顯著性水平,拒絕原假設(shè),多個獨立樣本來自的多個總體分布存在顯著差異;

②p值>顯著性水平,不拒絕原假設(shè),多個獨立樣本來自的多個總體分布無顯著差異?,F(xiàn)在是57頁\一共有78頁\編輯于星期五多獨立樣本非參數(shù)檢驗的步驟1.按規(guī)定的格式組織數(shù)據(jù):設(shè)置兩個變量分別存放樣本值和組標(biāo)記值2.菜單:[Analyze]-[NonparametricTests]-[Kindependentsamples](1)選擇待檢驗的變量到[Testvariablelist](2)[groupingvariable]:存放組標(biāo)志的變量,并通過[definegroups]給出標(biāo)志值的取值范圍。(3)[testtype]:選擇相應(yīng)的檢驗方法現(xiàn)在是58頁\一共有78頁\編輯于星期五現(xiàn)在是59頁\一共有78頁\編輯于星期五7.3.5應(yīng)用案例利用“多城市兒童身高”數(shù)據(jù),對北京、上海、成都、廣州四城市的周歲兒童身高進行比較分析,推斷四城市周歲兒童身高是否存在顯著差異。分析:(1)對身高分布無確切把握,涉及多個獨立樣本采采用多獨立樣非參數(shù)檢驗(2)分別用中位數(shù)檢驗、多獨立樣本的Kruskal-Wallis檢驗、多獨立樣本的Jonckheere-Terpstra檢驗實現(xiàn)?,F(xiàn)在是60頁\一共有78頁\編輯于星期五7.4兩配對樣本的非參數(shù)檢驗1.通過兩配對樣本推斷樣本來自的兩個總體的分布是否存在顯著差異。2.方法:McNemar檢驗、符號檢驗、Wilcoxon符號秩檢驗?,F(xiàn)在是61頁\一共有78頁\編輯于星期五兩配對樣本的McNemar檢驗1.基本思想(1)McNemar檢驗是一種變化顯著性檢驗,將研究對象自身作為對照者檢驗其“前后”的變化是否顯著。(2)原假設(shè):兩配對樣本來自的兩總體的分布無顯著差異。(3)分析的變量是二值變量,若不是二值變量,應(yīng)現(xiàn)將數(shù)據(jù)轉(zhuǎn)換后再使用。導(dǎo)致該方法的應(yīng)用范圍具有局限性。(4)McNemar檢驗采用二項分布檢驗方法,小樣本下計算二項分布的累計精確概率,大樣本下采用修正的Z統(tǒng)計量。(5)SPSS自動計算Z統(tǒng)計量和對應(yīng)的p值

①p值<顯著性水平,拒絕原假設(shè),兩配對樣本來自的兩總體分布存在顯著差異

②p值>顯著性水平,不拒絕原假設(shè),兩配對樣本來自的兩總體分布無顯著差異現(xiàn)在是62頁\一共有78頁\編輯于星期五兩配對樣本的符號檢驗1.基本思想(1)原假設(shè):兩配對樣本來自的兩總體的分布無顯著差異。(2)利用正負(fù)符號的個數(shù)實現(xiàn)檢驗。(3)檢驗步驟①分別用第二組樣本的各觀察值減第一組對應(yīng)樣本觀察值,差值為正記為+,差值為負(fù)記為-②將+的個數(shù)與-的個數(shù)進行比較:采用二項分布檢驗法,對正負(fù)符號變量進行單樣本二項分布檢驗。③小樣本下計算二項分布的累計精確概率,大樣本下采用修正的Z統(tǒng)計量(4)SPSS自動計算Z統(tǒng)計量和對應(yīng)的p值

①p值<顯著性水平,拒絕原假設(shè),兩配對樣本來自的兩總體分布存在顯著差異

②p值>顯著性水平,不拒絕原假設(shè),兩配對樣本來自的兩總體分布無顯著差異(4)缺陷:兩配對樣本的符號檢驗注重對變化方向的分析,只考慮了數(shù)據(jù)變化的性質(zhì),沒有考慮變化的幅度,對數(shù)據(jù)的利用不夠充分?,F(xiàn)在是63頁\一共有78頁\編輯于星期五兩配對樣本W(wǎng)ilcoxon符號秩檢驗1.基本思想(1)原假設(shè):兩配對樣本來自的兩總體的分布無顯著差異。(2)檢驗步驟①分別用第二組樣本的各觀察值減第一組對應(yīng)樣本觀察值,差值為正記為+,差值為負(fù)記為-,并保持差值數(shù)據(jù)②將差值變量按升序排列,并求差值變量的秩③分別計算正號秩總和負(fù)號秩總和④統(tǒng)計量現(xiàn)在是64頁\一共有78頁\編輯于星期五(3)決策:SPSS自動計算Z統(tǒng)計量和對應(yīng)的p值

①p值<顯著性水平,拒絕原假設(shè),兩配對樣本來自的兩總體分布存在顯著差異

②p值>顯著性水平,不拒絕原假設(shè),兩配對樣本來自的兩總體分布無顯著差異現(xiàn)在是65頁\一共有78頁\編輯于星期五兩配對樣本非參數(shù)檢驗的步驟1.按規(guī)定的格式組織數(shù)據(jù):設(shè)置兩個變量分別存放兩組樣本的樣本值2.菜單:[Analyze]-[NonparametricTests]-[2relatedsamples](1)選擇待檢驗的兩個配對變量到[Testpairslist](2)[testtype]:選擇相應(yīng)的檢驗方法現(xiàn)在是66頁\一共有78頁\編輯于星期五現(xiàn)在是67頁\一共有78頁\編輯于星期五應(yīng)用案例1.利用“統(tǒng)計學(xué)習(xí)”數(shù)據(jù),分析學(xué)生在學(xué)習(xí)“統(tǒng)計學(xué)”課程前后對統(tǒng)計學(xué)重要性的認(rèn)知程度是否發(fā)生了顯著改變。分析:(1)統(tǒng)計學(xué)習(xí)前后,屬于配對樣本(2)認(rèn)知程度屬二值變量(3)可以采用兩配對樣本McNemar檢驗現(xiàn)在是68頁\一共有78頁\編輯于星期五2.利用“訓(xùn)練成績”數(shù)據(jù),分析新訓(xùn)練方法是否有助于提高跳遠(yuǎn)運動員的成績。分析:(1)新訓(xùn)練方法使用前后,屬于配對樣本(2)可采用兩配對樣本的符號檢驗、兩配對樣本W(wǎng)ilcoxon符號秩檢驗實現(xiàn)?,F(xiàn)在是69頁\一共有78頁\編輯于星期五7.5多配對樣本的非參數(shù)檢驗1.通過多組配對樣本推斷樣本來自的多個總體的中位數(shù)或分布是否存在顯著差異。2.方法:Friedman檢驗、Cochra

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論