第14講非參數(shù)檢驗(續(xù))_第1頁
第14講非參數(shù)檢驗(續(xù))_第2頁
第14講非參數(shù)檢驗(續(xù))_第3頁
第14講非參數(shù)檢驗(續(xù))_第4頁
第14講非參數(shù)檢驗(續(xù))_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第第13章有序分類變量的統(tǒng)章有序分類變量的統(tǒng)計推斷計推斷非參數(shù)檢驗非參數(shù)檢驗 (續(xù))(續(xù))第第13章有序分類變量的統(tǒng)計推斷章有序分類變量的統(tǒng)計推斷非參數(shù)檢驗非參數(shù)檢驗 (續(xù))(續(xù))n13.4多個獨立樣本的非參數(shù)檢驗多個獨立樣本的非參數(shù)檢驗n13.5多個相關(guān)樣本的非參數(shù)檢驗多個相關(guān)樣本的非參數(shù)檢驗n13.6秩變換分析方法秩變換分析方法n13.7本章小結(jié)本章小結(jié) 13.4 多個獨立樣本的非參數(shù)檢驗多個獨立樣本的非參數(shù)檢驗n13.4.1 方法原理方法原理n13.4.2 分析實例分析實例n13.2.3 多個樣本的兩兩比較多個樣本的兩兩比較13.4.1 方法原理方法原理n多個獨立樣本的非參數(shù)檢驗是通過分

2、析多個獨立樣本的非參數(shù)檢驗是通過分析多組獨立樣本數(shù)據(jù),推斷總體的中位數(shù)多組獨立樣本數(shù)據(jù),推斷總體的中位數(shù)或者分布是否存在明顯的差異。或者分布是否存在明顯的差異。nSPSS提供的多獨立樣本非參數(shù)檢驗主要提供的多獨立樣本非參數(shù)檢驗主要有中位數(shù)檢驗有中位數(shù)檢驗(Median),Kruskal-Wallis檢驗,檢驗,Jonkheer-Terpstra檢驗。檢驗。13.4.1 方法原理方法原理n中位數(shù)檢驗可以通過對多獨立樣本中位數(shù)檢驗可以通過對多獨立樣本的分析,檢驗它們來自的總體的中的分析,檢驗它們來自的總體的中位數(shù)有無顯著差異。位數(shù)有無顯著差異。n其基本思想是如果各個總體中位數(shù)其基本思想是如果各個總

3、體中位數(shù)相同,那么每組樣本中,大于中位相同,那么每組樣本中,大于中位數(shù)和小于中位數(shù)的樣本個數(shù)應該大數(shù)和小于中位數(shù)的樣本個數(shù)應該大致相同。致相同。13.4.1 方法原理方法原理n中位數(shù)檢驗的基本步驟:中位數(shù)檢驗的基本步驟:q將樣本混合后按升序排序,得到混合樣本的中將樣本混合后按升序排序,得到混合樣本的中位數(shù)。位數(shù)。q分別計算每組樣本大于和小于這個混合中位數(shù)分別計算每組樣本大于和小于這個混合中位數(shù)的樣本的個數(shù),形成列聯(lián)表。的樣本的個數(shù),形成列聯(lián)表。q利用卡方檢驗法分析各組樣本來自的總體對于利用卡方檢驗法分析各組樣本來自的總體對于上述中位數(shù)的分布是否一致,顯然,如果各組上述中位數(shù)的分布是否一致,顯然

4、,如果各組樣本大于小于中位數(shù)的樣本基本相同,那么就樣本大于小于中位數(shù)的樣本基本相同,那么就認為有相同中位數(shù),否則就是顯著差異。認為有相同中位數(shù),否則就是顯著差異。13.4.1 方法原理方法原理n多獨立樣本的多獨立樣本的Kruskal-Wallis檢驗檢驗(克氏檢驗克氏檢驗)實質(zhì)是兩獨立樣本的曼實質(zhì)是兩獨立樣本的曼-惠特尼惠特尼U檢驗在多樣本總體下的推檢驗在多樣本總體下的推廣,也用于檢驗多個總體的分布是廣,也用于檢驗多個總體的分布是否存在顯著差異;否存在顯著差異;13.4.1 方法原理方法原理nKruskal-Wallis檢驗的基本步驟:檢驗的基本步驟:q首先,將多組樣本混合后按升序排序,計首先

5、,將多組樣本混合后按升序排序,計算各個樣本值的秩。算各個樣本值的秩。q考察各組變量秩的均值是否有顯著差異,考察各組變量秩的均值是否有顯著差異,如果多組樣本秩的均值沒有顯著差異,則如果多組樣本秩的均值沒有顯著差異,則可以認為是總體的分布沒有顯著差異,否可以認為是總體的分布沒有顯著差異,否則,就認為數(shù)據(jù)無法混合,認為總體有顯則,就認為數(shù)據(jù)無法混合,認為總體有顯著差異。著差異。13.4.1 方法原理方法原理nKruskal-Wallis檢驗的數(shù)學原理:檢驗的數(shù)學原理:n假定有假定有k個總體,先把從這個個總體,先把從這個k個總體個總體來的樣本混合起來排序,記各個總體來的樣本混合起來排序,記各個總體觀測

6、值的秩之和為觀測值的秩之和為Ri,i=1,k。顯然。顯然如果這些如果這些Ri很不相同,就可以認為它很不相同,就可以認為它們位置中心位置相同的零假設(shè)不妥們位置中心位置相同的零假設(shè)不妥(備備選假設(shè)為各個中心位置不全相等選假設(shè)為各個中心位置不全相等)。n記記N為各個樣本量之和為各個樣本量之和(總樣本量總樣本量).13.4.1 方法原理方法原理nKruskal-Wallis檢驗統(tǒng)計量為檢驗統(tǒng)計量為(R上面一杠上面一杠表示平均表示平均)n公式中公式中ni為第為第i個樣本量,在原假設(shè)成立個樣本量,在原假設(shè)成立時,當各組樣本數(shù)較大時,時,當各組樣本數(shù)較大時,H近似服從近似服從自由度為自由度為k-1的卡方分布

7、。的卡方分布。212112(1)123(1)(1)kiiiikiiiRHnRN NnRNN Nn13.4.1 方法原理方法原理nJonkheer-Terpstra檢驗的基本思想檢驗的基本思想與兩獨立樣本的曼與兩獨立樣本的曼-惠特尼惠特尼U檢驗類檢驗類似,也是計算一組樣本觀測值小于似,也是計算一組樣本觀測值小于其他組觀測值的個數(shù),以此來構(gòu)造其他組觀測值的個數(shù),以此來構(gòu)造統(tǒng)計量,進而計算統(tǒng)計量,進而計算p值,得到檢驗值,得到檢驗方法。方法。13.4.2 分析實例分析實例n例例13.3 某電信公司從某電信公司從3所大學招聘管理人所大學招聘管理人員,從而來源于員,從而來源于3所不同大學的雇員組成所不同

8、大學的雇員組成了了3個獨立的樣本。半年試用期滿了以后,個獨立的樣本。半年試用期滿了以后,人力資源部門對他們進行考核,并評出人力資源部門對他們進行考核,并評出了這些雇員的表現(xiàn)成績,人力資源部門了這些雇員的表現(xiàn)成績,人力資源部門想就此評價雇員的管理業(yè)績在想就此評價雇員的管理業(yè)績在3個總體間個總體間是否存在差異。是否存在差異。n數(shù)據(jù)見數(shù)據(jù)見npara3.sav13.4.2 分析實例分析實例nAnalyze Nonparametric Tests K independent Samples qTest Variable: score(考評成績)(考評成績)qGrouping:school(所畢業(yè)大學所

9、畢業(yè)大學)nMinimum:1,Maximum:3qTest type: Kruskal-Wallis13.4.2 分析實例分析實例13.4.2 分析實例分析實例n此表給出了此表給出了3所大學雇員表現(xiàn)的頻數(shù)和平所大學雇員表現(xiàn)的頻數(shù)和平均秩??梢钥闯龀煽冏畹偷氖蔷???梢钥闯龀煽冏畹偷氖茿大學畢業(yè)大學畢業(yè)的人員。的人員。RanksRanks65.83814.38711.5721所畢業(yè)大學A大學B大學C大學Total考評成績NMean Rank13.4.2 分析實例分析實例n由表可以看出由表可以看出p=0.0360.05,拒絕原假設(shè),拒絕原假設(shè),得出:畢業(yè)于得出:畢業(yè)于不同大學的雇不同大學的雇員在

10、管理工作員在管理工作上的業(yè)績表現(xiàn)上的業(yè)績表現(xiàn)存在顯著性差存在顯著性差異。異。Test StatisticsTest Statisticsa,ba,b6.6252.036Chi-SquaredfAsymp. Sig.考評成績Kruskal Wallis Testa. Grouping Variable: 所畢業(yè)大學b. 13.5 多個相關(guān)樣本的非參數(shù)檢驗多個相關(guān)樣本的非參數(shù)檢驗n13.5.1 Friedman檢驗檢驗n13.5.2 分析實例分析實例n13.5.4 Kendall協(xié)和系數(shù)檢驗與協(xié)和系數(shù)檢驗與Cochran檢驗檢驗13.5 多個相關(guān)樣本的非參數(shù)檢驗多個相關(guān)樣本的非參數(shù)檢驗n如果多個(

11、大于如果多個(大于2個)樣本是按某種或某個)樣本是按某種或某些條件匹配的,則屬于多個相關(guān)樣本的些條件匹配的,則屬于多個相關(guān)樣本的檢驗。檢驗。n例如,某藥治療吸蟲病患者,在治療前例如,某藥治療吸蟲病患者,在治療前和治療后一周、二周和四周測定和治療后一周、二周和四周測定7名患者名患者血清血清SGPT值的變化,以觀察該藥對肝功值的變化,以觀察該藥對肝功能的影響。結(jié)果見下表,問患者四個階能的影響。結(jié)果見下表,問患者四個階段的血清段的血清SGPT值有無不同?值有無不同?13.5 多個相關(guān)樣本的非參數(shù)檢驗多個相關(guān)樣本的非參數(shù)檢驗患者患者編號編號治治療療前前治療治療后一后一周周治療治療后二后二周周治療治療后

12、四后四周周1 16363 18818813813854542 29090 2382382202201441443 35454 300300838392924 44545 1401402132131001005 55454 17517515015036366 67272 30030016316390907 76464 2072071851858787n這里有四個樣本這里有四個樣本(治療前,治療后(治療前,治療后1、2、4周)周)n觀察的都是相同的觀察的都是相同的7為患者,故為為患者,故為4個個相關(guān)樣本相關(guān)樣本n問題相當于問題相當于4個總個總體的分布是否相同體的分布是否相同13.5 多個相關(guān)樣本的

13、非參數(shù)檢驗多個相關(guān)樣本的非參數(shù)檢驗n一般地,假定第一個因子有一般地,假定第一個因子有k個水平(稱為處個水平(稱為處理,理,treatment),第二個因子有),第二個因子有b個水平(稱個水平(稱為區(qū)組);因此一共有為區(qū)組);因此一共有kbkb個觀測值。個觀測值。n這里之所以稱一個因子為處理,是因為這是我這里之所以稱一個因子為處理,是因為這是我們想要看該因子各水平是否對試驗結(jié)果有顯著們想要看該因子各水平是否對試驗結(jié)果有顯著的不同(它的各個水平的觀測值也就是本節(jié)的的不同(它的各個水平的觀測值也就是本節(jié)的多個相關(guān)樣本)。多個相關(guān)樣本)。n而另一個因子稱為區(qū)組,不同的區(qū)組也可能對而另一個因子稱為區(qū)組,

14、不同的區(qū)組也可能對結(jié)果有影響。結(jié)果有影響。13.5.1 Friedman檢驗檢驗n有一種非參數(shù)方差分析方有一種非參數(shù)方差分析方法,稱為法,稱為Friedman (弗(弗里德曼)(兩因子)秩和里德曼)(兩因子)秩和檢驗,或檢驗,或Friedman方差方差分析。它適用于兩個因子分析。它適用于兩個因子的各種水平的組合都僅有的各種水平的組合都僅有一個觀測值的情況。一個觀測值的情況。n原假設(shè):原假設(shè):qH0:k個總體分布相同個總體分布相同處理處理區(qū)組區(qū)組Y1Y2 Yk1y11y12 y1k2y21y22 y2k byb1yb2 ybk13.5.1 Friedman檢驗檢驗n由于區(qū)組間的差異是各式各樣的,

15、只有同區(qū)組由于區(qū)組間的差異是各式各樣的,只有同區(qū)組的處理值的比較才有意義,一個觀察值的秩是的處理值的比較才有意義,一個觀察值的秩是在某一區(qū)組中的秩,而不是對所有數(shù)據(jù)而言的。在某一區(qū)組中的秩,而不是對所有數(shù)據(jù)而言的。n因此應當獨立地在每一個區(qū)組內(nèi)各自進行排秩因此應當獨立地在每一個區(qū)組內(nèi)各自進行排秩rij(按行排序),消除區(qū)組間的差異。(按行排序),消除區(qū)組間的差異。n這樣做的目的是在每個區(qū)組內(nèi)比較處理。例如這樣做的目的是在每個區(qū)組內(nèi)比較處理。例如, 同個年齡段中比較藥品的療效比不分年齡來比同個年齡段中比較藥品的療效比不分年齡來比較療效要合理;在同一個部位比較不同的材料較療效要合理;在同一個部位比

16、較不同的材料要比混合起來比較要合理等等。要比混合起來比較要合理等等。13.5.1 Friedman檢驗檢驗n在原假設(shè)成立時,右表在原假設(shè)成立時,右表中每一行的數(shù)據(jù)可以被中每一行的數(shù)據(jù)可以被看作同一個總體中抽取看作同一個總體中抽取的數(shù)字,從而每一行中的數(shù)字,從而每一行中各秩次出現(xiàn)應該是隨機各秩次出現(xiàn)應該是隨機的,這就導致各列的秩的,這就導致各列的秩和和Ri幾乎相等。此時幾乎相等。此時Ri之間差異較小。反之,之間差異較小。反之,如果如果差異較大,則如果如果差異較大,則認為原假設(shè)不成立。認為原假設(shè)不成立。處理處理區(qū)組區(qū)組Y1Y2 Yk1 r11r12 r1k2 r21r22 r2k b rb1rb2

17、 rbk合合計計R1R2 Rk13.5.1 Friedman檢驗檢驗n引進的引進的Friedman統(tǒng)計量統(tǒng)計量n秩總均值秩總均值=b(k+1)/2,第一個式子表明,第一個式子表明Ri的差異程度,如果各個處理很不一樣,的差異程度,如果各個處理很不一樣,和的平方就會很大,結(jié)果就顯著。和的平方就會很大,結(jié)果就顯著。n第二個公式是為了計算方便而導出的。第二個公式是為了計算方便而導出的。 大樣本時近似服從大樣本時近似服從k-1的卡方分布。的卡方分布。 221112(1)123 (1)(1)2(1)kkiiiib kQRRb kbk kbk k13.5.2分析實例分析實例n例例13.4 去污劑的制造商正在

18、測試一個新去污劑的制造商正在測試一個新產(chǎn)品的產(chǎn)品的4種不同配方的效果,其中一項測種不同配方的效果,其中一項測試是隨機地選取帶有不同污漬的織物為試是隨機地選取帶有不同污漬的織物為樣本來評價使用效果。在試驗中樣本來評價使用效果。在試驗中6種常見種常見的污漬類型作為的污漬類型作為“區(qū)組區(qū)組”,每個觀測值,每個觀測值代表了研究人員依據(jù)以下的標準在代表了研究人員依據(jù)以下的標準在110的范圍內(nèi)所作的主觀評價:的范圍內(nèi)所作的主觀評價:1=“差差”,3=“一般一般”,5=“好好”,7=“較好較好”,10=“很好很好”。n數(shù)據(jù)見數(shù)據(jù)見npara4.sav13.5.2分析實例分析實例nAnalyzeNonparametric Tests k related SamplesqTest Variables: a,b,c,d(配方(配方1-4)qTest type:Friedman TestTest StatisticsTest Statisticsa a68.5933.035N

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論