版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
統(tǒng)計學非參數(shù)檢驗演示文稿當前第1頁\共有91頁\編于星期四\7點方法的回顧單個因素(兩水平)的作用評價:兩組比較完全隨機設計下的單因素兩組比較匹配設計的兩組比較單個因素(多水平)的作用評價:多組比較完全隨機設計下的單因素多水平比較兩個因素的分析問題無交互作用、有交互作用當前第2頁\共有91頁\編于星期四\7點單因素兩組比較:t檢驗完全隨機兩組均數(shù)比較的t檢驗(獨立t檢驗)匹配設計下兩組均數(shù)比較的t檢驗(匹配t檢驗)單因素多組比較:方差分析完全隨機設計下的多組均數(shù)比較當前第3頁\共有91頁\編于星期四\7點局限性t檢驗獨立t檢驗要求:正態(tài)、方差相等(或不相等)、個體獨立匹配t檢驗要求:差值正態(tài)、個體獨立方差分析單因素多水平比較方差分析要求:正態(tài)、方差相等、個體獨立當前第4頁\共有91頁\編于星期四\7點未解決問題兩組性別結(jié)構(gòu)是否相同?療效用痊愈、顯效、有效、無效四級分類法進行評價時,兩組或多組如何比較?如何檢驗樣本數(shù)據(jù)來自的總體服從正態(tài)分布?總體不是正態(tài)分布,小樣本情況下,如何檢驗總體的集中趨勢?有6名歌手參加比賽,4名評委進行評判打分,推斷評委的評判標準是否一致……當前第5頁\共有91頁\編于星期四\7點參數(shù)檢驗:樣本被視為從分布族的某個參數(shù)族抽取出來的總體的代表,而未知的僅僅是總體分布具體的參數(shù)值推斷問題就轉(zhuǎn)化為對分布族的若干個未知參數(shù)的估計問題,用樣本對這些參數(shù)做出估計或者進行某種形式的假設檢驗,這類推斷方法稱為參數(shù)方法。當前第6頁\共有91頁\編于星期四\7點非參數(shù)檢驗(nonparametrictests)又稱為任意分布檢驗(distribution-freetest),它不考慮研究對象總體分布具體形式,也不對總體參數(shù)進行統(tǒng)計推斷僅僅依賴于數(shù)據(jù)觀測值的相對大小(秩)等,而是通過檢驗樣本所代表的總體分布形式是否一致來得出統(tǒng)計結(jié)論。當前第7頁\共有91頁\編于星期四\7點非參數(shù)統(tǒng)計的名字中的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關參數(shù);它被稱為“和分布無關”(distribution—free),是因為其推斷方法和總體分布無關;不應理解為與所有分布(例如有關秩的分布)無關.當前第8頁\共有91頁\編于星期四\7點對總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。假定較少不需要對總體參數(shù)的假定與參數(shù)結(jié)果接近針對幾乎所有類型的數(shù)據(jù)形態(tài)。容易計算在計算機盛行之前就已經(jīng)發(fā)展起來。非參數(shù)檢驗的優(yōu)點當前第9頁\共有91頁\編于星期四\7點可能會浪費一些信息特別當數(shù)據(jù)可以使用參數(shù)模型的時候大樣本手算相當麻煩一些表不易得到非參數(shù)檢驗的弱點當前第10頁\共有91頁\編于星期四\7點已知總體分布類型,對未知參數(shù)進行統(tǒng)計推斷依賴于特定分布類型,比較的是參數(shù)
參數(shù)檢驗(parametrictest)
非參數(shù)檢驗(nonparametrictest)對總體的分布類型不作嚴格要求不受分布類型的影響,比較的是總體分布位置優(yōu)點:方法簡便、易學易用,易于推廣使用、應用范圍廣;可用于參數(shù)檢驗難以處理的資料(如等級資料,或含數(shù)值“>50mg”等
)缺點:方法比較粗糙,對于符合參數(shù)檢驗條件者,采用非參數(shù)檢驗會損失部分信息,其檢驗效能較低;樣本含量較大時,兩者結(jié)論常相同當前第11頁\共有91頁\編于星期四\7點非參數(shù)檢驗的特點非參數(shù)檢驗不需要嚴格假設條件,因而比參數(shù)檢驗有更廣泛的適用面。非參數(shù)檢驗幾乎可以處理包括定類數(shù)據(jù)和定序數(shù)據(jù)在內(nèi)的所有類型的數(shù)據(jù),而參數(shù)檢驗通常只能用于定量數(shù)據(jù)的分析。在參數(shù)檢驗和非參數(shù)檢驗都可以使用的情況下,非參數(shù)檢驗的功效(power)要低于參數(shù)檢驗方法。當前第12頁\共有91頁\編于星期四\7點以下情況下應當首選非參數(shù)方法參數(shù)檢驗中的假設條件不滿足,從而無法應用。例如總體分布為偏態(tài)或分布形式未知,且樣本為小樣本時。檢驗中涉及的數(shù)據(jù)為定類或定序數(shù)據(jù)。所涉及的問題中并不包含參數(shù),如判斷某樣本是否來自正態(tài)分布等,判斷某樣本是否為隨機樣本。當前第13頁\共有91頁\編于星期四\7點常用的非參數(shù)檢驗方法用于單個樣本的c2擬合優(yōu)度檢驗、K-S擬合優(yōu)度檢驗、中位數(shù)的符號檢驗用于兩個匹配樣本的Wilcoxon符號秩檢驗用于兩個獨立樣本的Wlicoxon秩和檢驗用于多個獨立樣本的Kruskal-Wallis檢驗。當前第14頁\共有91頁\編于星期四\7點第六章非參數(shù)檢驗非參數(shù)檢驗概述非參數(shù)檢驗、特點及應用單樣本的非參數(shù)檢驗兩個樣本和多個樣本的非參數(shù)檢驗當前第15頁\共有91頁\編于星期四\7點單樣本的非參數(shù)檢驗c2擬合優(yōu)度檢驗K-S擬合優(yōu)度檢驗中位數(shù)的符號檢驗分類數(shù)據(jù)檢驗分布對中位數(shù)的推斷當前第16頁\共有91頁\編于星期四\7點c2統(tǒng)計量用來測定定類變量之間的相關程度c2統(tǒng)計量的分布與自由度有關;c2統(tǒng)計量描述了觀察值與期望值的接近程度當前第17頁\共有91頁\編于星期四\7點擬合優(yōu)度檢驗(goodnessoffittest)用c2統(tǒng)計量進行統(tǒng)計顯著性檢驗的重要內(nèi)容之一;依據(jù)總體分布狀況,計算出分類變量中各類別的期望頻數(shù),與分布的觀察頻數(shù)進行對比,判斷期望頻數(shù)與觀察頻數(shù)是否有顯著差異,從而達到對分類變量進行分析的目的。當前第18頁\共有91頁\編于星期四\7點1912年4月15日,豪華巨輪泰坦尼克號與冰山相撞沉沒。當時船上共有2208人,其中男性1738人,女性470人。海難發(fā)生后,幸存者共718人,其中男性374人,女性344人,以顯著性水平為0.1檢驗存活狀況與性別是否有關?當前第19頁\共有91頁\編于星期四\7點提出零假設和備擇假設H0:觀察頻數(shù)與期望頻數(shù)一致H1:觀察頻數(shù)與期望頻數(shù)不一致計算期望頻數(shù)男性的期望頻數(shù),女性為153人計量c2統(tǒng)計量查表(自由度為類別數(shù)-1)做出判斷:決絕原假設,認為存活狀況與性別顯著相關當前第20頁\共有91頁\編于星期四\7點一種飲料的容器材料可以選擇玻璃、塑料或者金屬。為了比較消費者對包裝材料的偏好,抽樣調(diào)查了120名消費者發(fā)現(xiàn),最喜歡玻璃、塑料和金屬容器的分別有55、25和40人。根據(jù)調(diào)查結(jié)果,能否認為消費者對3種材料的偏好程度是無差異的(顯著性水平a=0.05)?當前第21頁\共有91頁\編于星期四\7點分析如果消費者對3種材料的偏好程度是無差異的,也就是說消費者對材料的偏好服從均勻分布,則理論上來說,調(diào)查120名消費者,偏好每種材料的人數(shù)應該是相等的,也就是40人。各組觀測到的人數(shù)與理論人數(shù)(期望值)之間的差異應該都是由于抽樣的隨機性造成的,因此不應該太大。如果二者之間的差異特別大,則說明我們所作的假設(消費者對3種材料的偏好程度是無差異的)很可能不成立。當前第22頁\共有91頁\編于星期四\7點檢驗統(tǒng)計量k是樣本分類的個數(shù),表示實際觀察到的頻數(shù),表示理論頻數(shù)。觀察頻數(shù)與期望頻數(shù)越接近,則c2值越小。根據(jù)皮爾遜定理,當n充分大時,c2統(tǒng)計量漸近服從于k-1個自由度的c2分布。當前第23頁\共有91頁\編于星期四\7點軟件操作:數(shù)據(jù)錄入當前第24頁\共有91頁\編于星期四\7點軟件操作:方法設定選擇“分析”“非參數(shù)檢驗”“卡方”,在彈出的對話框中將“材料”設定為檢驗變量;單擊對話框中的“精確…”,選中彈出對話框中的“精確”,單擊“繼續(xù)”、“確定”當前第25頁\共有91頁\編于星期四\7點軟件操作:結(jié)果分析(1)觀察數(shù)期望數(shù)殘差1.005540.015.02.002540.0-15.03.004040.0.0總數(shù)120當前第26頁\共有91頁\編于星期四\7點軟件操作:結(jié)果分析(2)材料卡方11.250df2漸近顯著性.004精確顯著性.003點概率.000當前第27頁\共有91頁\編于星期四\7點結(jié)果分析(3)結(jié)論:計算出的c2統(tǒng)計量的值為11.250,自由度為2,相應的p值(漸近顯著性)為0.004,小于a=0.05。所以檢驗的結(jié)論是拒絕總體中消費者對3種材料的偏好程度無差異的零假設。當前第28頁\共有91頁\編于星期四\7點特別說明大樣本、每個單元中的期望頻數(shù)大于等于5時可以使用c2分布。小樣本時應該按照精確方法計算得到的p值得出結(jié)論。c2檢驗也可以按照同樣的思想對正態(tài)分布或者任何想象的其他分布進行檢驗,但主要用于對定性變量的檢驗。另外,c2檢驗也可以用于對兩個總體分布的比較。當前第29頁\共有91頁\編于星期四\7點單樣本的非參數(shù)檢驗c2擬合優(yōu)度檢驗對定類變量用c2統(tǒng)計量進行統(tǒng)計顯著性檢驗K-S擬合優(yōu)度檢驗中位數(shù)的符號檢驗檢驗分布當前第30頁\共有91頁\編于星期四\7點單樣本K-S檢驗檢驗總體分布是否為理論分布(正態(tài)、Possion、均勻、指數(shù))是以兩位蘇聯(lián)數(shù)學家Kolmogorov和Smirnov命名的,全稱為Kolmogorov-Smirnov檢驗。通過對兩個分布差異的分析確定能否認為樣本的觀察值來自所設定的理論分布總體。當前第31頁\共有91頁\編于星期四\7點定義,顯然若對每一個x值來說,如果經(jīng)驗分布函數(shù)與特定分布函數(shù)的擬合程度很高,則有理由認為樣本數(shù)據(jù)來自具有該理論分布的總體。檢驗統(tǒng)計量:根據(jù)檢驗統(tǒng)計量的精確分布或漸進分布,可以計算出假設檢驗的p值,從而得出檢驗的結(jié)論。當前第32頁\共有91頁\編于星期四\7點SPSSK-S檢驗中檢驗統(tǒng)計量Z的計算當前第33頁\共有91頁\編于星期四\7點SPSSK-S檢驗中p值的計算當前第34頁\共有91頁\編于星期四\7點有100名兒童每周看電視時間的數(shù)據(jù)(數(shù)據(jù)文件:電視時間.sav)。檢驗能否認為總體中兒童每周看電視的時間服從正態(tài)分布(顯著性水平a=0.05)。這里K-S檢驗的零假設和備擇假設為:H0:總體中兒童每周看電視的時間服從正態(tài)分布。H1:總體中兒童每周看電視的時間不服從正態(tài)分布。當前第35頁\共有91頁\編于星期四\7點當前第36頁\共有91頁\編于星期四\7點在SPSS軟件中打開數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗”“1樣本K-S”,在彈出的對話框中將“時間”設定為檢驗變量;檢驗分布為默認的“常規(guī)”(正態(tài)分布)。單擊“確定”當前第37頁\共有91頁\編于星期四\7點時間N100正態(tài)參數(shù)a,,b均值27.191標準差8.3728最極端差別絕對值.096正.096負-.039Kolmogorov-SmirnovZ.960漸近顯著性(雙側(cè)).315當前第38頁\共有91頁\編于星期四\7點檢驗結(jié)論相應的p值(漸近顯著性)為0.315。由于0.315大于0.05,所以在5%的顯著性水平下不能拒絕原假設,也就是說根據(jù)樣本數(shù)據(jù)不能認為總體分布是非正態(tài)的。注意這里并不能得出總體服從正態(tài)分布的嚴格結(jié)論??傮w服從正態(tài)分布的結(jié)論可能犯第二類錯誤(取偽錯誤),這個概率是未知的,在有些情況下可能會很大。當前第39頁\共有91頁\編于星期四\7點特別聲明在K-S檢驗中如果使用的是小樣本,則根據(jù)漸進分布計算p值的誤差會增大。這時應該通過相應的設定要求軟件輸出精確檢驗的p值,根據(jù)精確檢驗的p值得出檢驗結(jié)論。K-S檢驗也可以用于對兩個總體分布是否一致的檢驗。當前第40頁\共有91頁\編于星期四\7點單樣本的非參數(shù)檢驗c2擬合優(yōu)度檢驗對定類變量用c2統(tǒng)計量進行統(tǒng)計顯著性檢驗K-S擬合優(yōu)度檢驗檢驗總體分布形態(tài)中位數(shù)的符號檢驗對中位數(shù)的推斷當前第41頁\共有91頁\編于星期四\7點單樣本中位數(shù)的檢驗秩符號檢驗Wilcoxon符號秩檢驗當前第42頁\共有91頁\編于星期四\7點秩(rank)是指全部觀察值按某種順序排列的位序;通常是將數(shù)據(jù)按照升冪排列之后,每個觀測值的位置,秩次在一定程度上反映了等級的高低。下面一行Ri就是上面一行數(shù)據(jù)Xi的秩。當前第43頁\共有91頁\編于星期四\7點數(shù)據(jù)中有相同的數(shù)值,稱為結(jié)。結(jié)中數(shù)字的秩為它們所占位置的平均值Xi159173178513719Ri758.518.5426310當前第44頁\共有91頁\編于星期四\7點A組:-、、+、+、+、+、++、++、++、++、+++、+++
-±++++++++++++++++++
123456789101112
124.54.54.5
4.58.58.58.58.511.511.5平均秩次=(3+6)/2=4.5當前第45頁\共有91頁\編于星期四\7點利用秩的大小進行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢驗的優(yōu)點。多數(shù)非參數(shù)檢驗明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒有涉及秩的性質(zhì)。當前第46頁\共有91頁\編于星期四\7點符號檢驗(signtest)在非正態(tài)總體小樣本的情況下,如果要對總體分布的位置進行推斷,由于t檢驗不適用,也可使用符號檢驗的方法。在數(shù)據(jù)呈偏態(tài)分布的情況下,我們可能對總體的中位數(shù)更感興趣,希望對總體的中位數(shù)作出推斷,這時可以使用符號檢驗的方法。當前第47頁\共有91頁\編于星期四\7點例6.3在某地區(qū)隨機調(diào)查了60個家庭的月收入。(數(shù)據(jù)文件:家庭月收入.sav)。根據(jù)樣本數(shù)據(jù)能否認為總體中家庭月收入的中位數(shù)等于5000元(顯著性水平a=0.05)?當前第48頁\共有91頁\編于星期四\7點當前第49頁\共有91頁\編于星期四\7點符號檢驗的基本思想:每個數(shù)據(jù)都減去零假設中的中位數(shù),記錄其差值的符號。計算正、負符號的個數(shù)(差值為0的不計算在任何一個中)當原假設為真時二者應該很接近;若兩者相差太遠,就有理由拒絕原假設。當前第50頁\共有91頁\編于星期四\7點檢驗統(tǒng)計量原假設成立時,檢驗統(tǒng)計量S服從二項分布。根據(jù)二項分布計算得到p值,從而得出檢驗的結(jié)論。當正號和負號個數(shù)之和大于25時,可以按照正態(tài)分布進行近似計算。當前第51頁\共有91頁\編于星期四\7點例6.3在某地區(qū)隨機調(diào)查了60個家庭的月收入。(數(shù)據(jù)文件:家庭月收入.sav)。根據(jù)樣本數(shù)據(jù)能否認為總體中家庭月收入的中位數(shù)等于5000元(顯著性水平a=0.05)?當前第52頁\共有91頁\編于星期四\7點在SPSS中打開數(shù)據(jù)文件。為了對中位數(shù)進行檢驗,先在SPSS中生成一個新的變量Median,取值為5000:單擊“轉(zhuǎn)換”“計算變量”,在彈出的對話框中按照圖6-3進行設置,單擊確定。當前第53頁\共有91頁\編于星期四\7點選擇“分析”“非參數(shù)檢驗”“2個相關樣本”,在彈出的對話框中將“Median”和“家庭月收入”設定檢驗的一對變量;選中“符號檢驗”,取消選擇“Wilcoxon”,單擊“確定”
當前第54頁\共有91頁\編于星期四\7點當前第55頁\共有91頁\編于星期四\7點用正態(tài)分布進行近似計算時,Z統(tǒng)計量的值為-0.129,雙側(cè)檢驗的p值為0.897。由于p值大于0.05,檢驗的結(jié)論是不能拒絕原假設,即沒有充分證據(jù)證明中位數(shù)不等于5000。當前第56頁\共有91頁\編于星期四\7點特別聲明如果樣本量較小,則需要使用軟件輸出的精確檢驗的p值進行推斷在小樣本時,如果要求進行精確檢驗,SPSS會自動按照二項分布進行概率計算。當前第57頁\共有91頁\編于星期四\7點Wilcoxon符號秩檢驗符號檢驗只用到差值的符號,而對差值數(shù)值的大小未能考慮,因而失去了部分信息。Wilcoxon符號秩檢驗既考慮差值的符號,又考慮差值的大小,因此在所需的假設條件滿足時其功效比符號檢驗高。當前第58頁\共有91頁\編于星期四\7點Wilcoxon符號秩檢驗計算差值絕對值的秩。將差值絕對值從小到大排序,其位次就是的秩(rank),等于0值不參與排序。分別計算出差值序列中正數(shù)的秩和W+以及負數(shù)的秩和W-。顯然,如果零假設成立,W+與W-應該比較接近。如果二者過大或過小,則說明零假設不成立。將正數(shù)的秩和或者負數(shù)的秩作為檢驗統(tǒng)計量,根據(jù)其統(tǒng)計分布計算p值,從而可以得出檢驗的結(jié)論。前提假設:樣本點來自連續(xù)對稱總體分布當前第59頁\共有91頁\編于星期四\7點Wilcoxon符號秩檢驗計算,將其按照大小排序,得到的秩;把的正負號加到相應的秩上;計算計算檢驗統(tǒng)計量做出判斷,W太小時,決絕零假設當前第60頁\共有91頁\編于星期四\7點當前第61頁\共有91頁\編于星期四\7點第六章非參數(shù)檢驗非參數(shù)檢驗概述非參數(shù)檢驗、特點及應用單樣本的非參數(shù)檢驗c2擬合優(yōu)度檢驗、K-S檢驗、中位數(shù)的符號檢驗及Wilcoxon符號秩檢驗兩個樣本和多個樣本的非參數(shù)檢驗當前第62頁\共有91頁\編于星期四\7點兩個樣本和多個樣本的非參數(shù)檢驗兩個匹配樣本的Wilcoxon符號秩檢驗兩個獨立樣本的Wlicoxon秩和檢驗多個獨立樣本的Kruskal-Wallis檢驗當前第63頁\共有91頁\編于星期四\7點匹配樣本的非參數(shù)檢驗如果t檢驗的假設條件不滿足,t檢驗就不適用了。符號檢驗和Wilcoxon符號秩檢驗都可以用做替代的檢驗方法。用樣本數(shù)據(jù)中對應的數(shù)值相減得到新的序列:零假設:差值總體的中位數(shù)=0;備擇假設:差值總體的中位數(shù)≠0。當前第64頁\共有91頁\編于星期四\7點例6.4從實施適時管理(JIT)的企業(yè)中隨機抽取10家進行效益分析,得到它們在實施JIT前后三年的平均資產(chǎn)報酬率(數(shù)據(jù)文件:JIT管理.sav)。在5%的顯著性水平下企業(yè)在實施JIT前后的資產(chǎn)報酬率是否有顯著差異?當前第65頁\共有91頁\編于星期四\7點當前第66頁\共有91頁\編于星期四\7點在SPSS軟件中打開數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗”“2個相關樣本”,在彈出的對話框中將“JIT后”和“JIT前”設定檢驗的一對變量;選中“Wilcoxon”和“符號檢驗”。由于這里樣本量很小,我們要求進行精確檢驗:單擊對話框中的“精確…”,選中彈出對話框中的“精確”,單擊“繼續(xù)”、“確定”當前第67頁\共有91頁\編于星期四\7點符號檢驗結(jié)果(1)NJIT前-JIT后負差分a7正差分b3結(jié)c0總數(shù)10當前第68頁\共有91頁\編于星期四\7點符號檢驗結(jié)果(2)結(jié)論:不能拒絕零假設,沒有證據(jù)表明小于企業(yè)在實施JIT前后的資產(chǎn)報酬率有顯著變化JIT前-JIT后精確顯著性(雙側(cè)).344a精確顯著性(單側(cè)).172點概率.117當前第69頁\共有91頁\編于星期四\7點Wilcoxon符號秩檢驗結(jié)果(1)N秩均值秩和JIT前-JIT后負秩7a4.3630.50正秩3b8.1724.50結(jié)0c總數(shù)10當前第70頁\共有91頁\編于星期四\7點Wilcoxon符號秩檢驗結(jié)果(2)JIT前-JIT后Z-.307a漸近顯著性(雙側(cè)).759精確顯著性(雙側(cè)).787精確顯著性(單側(cè)).394點概率.020當前第71頁\共有91頁\編于星期四\7點兩個獨立樣本的Wlicoxon秩和檢驗在兩個獨立樣本的t檢驗不適用時,Wlicoxon秩和檢驗可以作為一種替代的非參數(shù)檢驗方法使用。這一檢驗可以用來對兩個總體的中位數(shù)進行檢驗。當前第72頁\共有91頁\編于星期四\7點基本原理如果兩個總體具有相似的分布形狀,并且中位數(shù)相同,那么由m個x、n個y組成的m十n=N個觀察值可以被看作來自同一總體的一個隨機樣本。將全部x和y從小到大排序確定每個數(shù)值的秩,然后計算m個x的秩的和Wx
、n個y的秩的和Wy
。由于抽樣的隨機性,x、y應較均勻地分布在混合排列的樣本中。如果零假設成立,在樣本量相同的情況下兩個秩和應該比較接近;樣本量不同的情況下平均秩和的平均秩應該比較接近。否則就說明兩個總體的中位數(shù)是不相等的。當前第73頁\共有91頁\編于星期四\7點由于對稱性,兩個秩和Wx、Wy都可以用作Wilcoxon秩和檢驗的檢驗統(tǒng)計量。SPSS軟件中使用的是平均秩較小的一組的秩和。統(tǒng)計量W的統(tǒng)計分布可以精確推導出來在樣本量較大時(m和n都不小于10)可以用正態(tài)分布來進行近似。得到p值之后,再通過比較p值和a的大小得出結(jié)論。當前第74頁\共有91頁\編于星期四\7點相關說明由于Wilcoxon秩和檢驗與Mann和Whitney提出的U檢驗完全等價,因此這種方法也被稱為Wlicoxon-Mann-Whitney檢驗,或者Mann-WhitneyU檢驗。在樣本量較小時,應當使用精確檢驗的結(jié)果嚴格來說用Wilcoxon秩和檢驗對中位數(shù)進行假設檢驗,需要假定兩個總體分布有類似的形狀才能得出可靠的結(jié)論。當前第75頁\共有91頁\編于星期四\7點例6.5已知某企業(yè)職工的收入調(diào)查中20名本科畢業(yè)生和15名研究生的月收入(元)(數(shù)據(jù)文件:本科研究生收入.sav),試比較本科生和研究生的收入水平(顯著性水平a=0.05)。當前第76頁\共有91頁\編于星期四\7點分析由于收入一般是右偏分布,因此不適合用t檢驗進行分析。我們用Wilcoxon秩和檢驗來比較兩個總體的中位數(shù)。檢驗的零假設和備擇假設如下:H0:本科和研究生月收入的中位數(shù)相等;H1:本科和研究生月收入的中位數(shù)不相等。當前第77頁\共有91頁\編于星期四\7點在SPSS軟件中打開數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗”“2個獨立樣本”,在彈出的對話框中將“月收入”設定為檢驗變量,“學歷”設定為分組變量,然后單擊“定義組”,按照“學歷”的取值進行設定,然后單擊“繼續(xù)”,檢驗類型使用默認“Mann-WhitneyU”,單擊“確定”
當前第78頁\共有91頁\編于星期四\7點結(jié)果分析:學歷N秩均值秩和月收入本科2013.55271.00研究生1523.93359.00總數(shù)35當前第79頁\共有91頁\編于星期四\7點根據(jù)精確檢驗的p值,在顯著性水平大于0.002時我們應該拒絕原假設,結(jié)論是本科與研究生的收入的中位數(shù)不相等。月收入Mann-WhitneyU61.000WilcoxonW271.000Z-2.967漸近顯著性(雙側(cè)).003精確顯著性[2*(單側(cè)顯著性)].002a當前第80頁\共有91頁\編于星期四\7點多個獨立樣本的Kruskal-Wallis檢驗Kruskal-Wallis檢驗是Wlicoxon秩和檢驗的推廣,用來對多個總體的中位數(shù)進行比較。在單因素方差分析模型不適用于所研究的問題時,Kruskal-Wallis往往是一種可以替代的非參數(shù)檢驗方法。當前第81頁\共有91頁\編于星期四\7點基本原理Kruskal-Wallis檢驗也是根據(jù)秩和來構(gòu)造檢驗統(tǒng)計量的。將所有樣本的數(shù)據(jù)合在一起,從小到大排序得到每個數(shù)值的秩,然后計算各樣本的秩和以及平均秩。如果各組沒有顯著性差異,則各組的平均秩應該趨于相等;如果各組的平均秩相差較大,則各組中位數(shù)有顯著性差異的可能性較大。當前第82頁\共有91頁\編于星期四\7點檢驗統(tǒng)計量當前第83頁\共有91頁\編于星期四\7點基本原理:當樣本組數(shù)k,每組樣本樣本容量ni不是很小時,檢驗統(tǒng)計量H的抽樣分布近似服從自由度為k-1的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 泰康協(xié)議存款合同的稅務影響
- 股權投資對賭協(xié)議范本
- 林木選購合同
- 降水井施工勞務外包合同
- 城市綠化花卉承包合同
- 以租代售設備合同樣本
- 購銷合同中的商業(yè)秘密保護
- 食堂承包經(jīng)營合同協(xié)議
- 教育咨詢服務網(wǎng)站建設協(xié)議
- 隨身護衛(wèi)人員管理服務合同
- 吉利NPDS流程和PPAP介紹
- 專題02:名著導讀-2022-2023學年八年級語文下學期期中專題復習(北京專用)
- 男朋友無償贈與車輛協(xié)議書怎么寫
- 高考語文新題型+“文學短評”相關寫作(真題+技法+練習)
- 汽車認識實訓課件
- 輪機工程材料18章總結(jié)
- 公路管理行業(yè)支撐性科研課題立項評審評分標準表
- 單招面試技巧范文
- GB/T 5195.1-2006螢石氟化鈣含量的測定
- (職高)高一語文期末測試題及答案解析
- 2023年自考傳播學概論試題及答案
評論
0/150
提交評論