非參數(shù)統(tǒng)計教學(xué)ppt課件(完整版)_第1頁
非參數(shù)統(tǒng)計教學(xué)ppt課件(完整版)_第2頁
非參數(shù)統(tǒng)計教學(xué)ppt課件(完整版)_第3頁
非參數(shù)統(tǒng)計教學(xué)ppt課件(完整版)_第4頁
非參數(shù)統(tǒng)計教學(xué)ppt課件(完整版)_第5頁
已閱讀5頁,還剩261頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第1章 導(dǎo) 言本章內(nèi)容:一、測量的層次二、統(tǒng)計檢驗基本思想回顧三、非參數(shù)統(tǒng)計方法四、經(jīng)驗分布函數(shù)五、大樣本近似時的連續(xù)性修正六、功效函數(shù)和檢驗的漸近相對效率一、測量的層次所謂測量,就是根據(jù)一定的法則,給事物或事件分配一定的數(shù)字或符號。數(shù)據(jù)屬于何種測量層次,決定該數(shù)據(jù)能夠使用何種類型的方法進(jìn)行分析。廣泛采用的測量層次為四種類型的尺度:定類尺度、定序尺度、定距尺度、定比尺度。測量時,無論哪一種測量層次,都必須具有完備性和互斥性。(不重不漏)(一)定類尺度定類尺度是按照事物的某些特征辨別和劃分的一種測量層次,也被稱作類別尺度、名義尺度。如性別、職業(yè)、民族等。定類尺度只能將事物分類,不能用以反映事物的

2、數(shù)量狀況。如性別這一變量,用“1”表示男性,“0”表示女性;職工對所從事的職業(yè)是否滿意,用“0”表示不滿意、用“1”表示滿意等,這里的“0”和“1”僅僅是人們賦予的識別標(biāo)志,并不說明事物的數(shù)量,有時也稱這樣的變量為虛擬變量。定類尺度是最低一個層次的測量,它只能進(jìn)行“=”或“”的邏輯運算。定類測量數(shù)據(jù)常用的描述統(tǒng)計量有:眾數(shù)、頻數(shù)、異眾比率等。(二)定序尺度定序尺度是按照事物的某種特征依大小、高低順序或級別進(jìn)行排列的一種測量層次,也稱作順序尺度、等級尺度。例如,測量職工的文化程度可以分為:碩士研究生及以上、本科、大專、中學(xué)及以下。定序尺度是比定類尺度高一層次的測量,它不僅能進(jìn)行“=”或“”的運算

3、,還能進(jìn)行“”、“”的運算。描述定序測量數(shù)據(jù)集中趨勢的統(tǒng)計量除了眾數(shù)還有中位數(shù),反映離散程度的除了異眾比率還有分位數(shù)。(三)定距尺度定距尺度是不僅能將事物區(qū)分類別和等級,還可以確定不同類別或等級之間的數(shù)量差別、間隔距離的一種測量層次,也稱作間隔尺度、區(qū)間尺度。例如,職工對自己職業(yè)的滿意程度測量,1分表示很不滿意,10分表示很滿意;對學(xué)生學(xué)習(xí)考試成績的測量,0表示試卷中沒有一個對的,100表示試卷中全部答對。定距尺度是一種定量的測量層次,它不僅能反映事物的類別和順序,而且能反映事物數(shù)量之間的距離。它是比定序尺度又高一層次的測量,不僅能進(jìn)行“=”和“”,“”和“”的運算,還能進(jìn)行“+”、 “-”的

4、運算。但是定距尺度沒有絕對“0”。例如,某門課程成績的百分制測量,0分不表示某考生沒有這門課方面的知識。甲考試成績?yōu)?0分,乙為85分,90-85=5分,只表明甲比乙在這門課考試成績中多5分,不能說明甲掌握的這方面知識是乙的大約1.06倍(90/85)。(四)定比尺度定比尺度是在定距尺度的基礎(chǔ)上增加絕對零點的一種測量層次,也稱作等比尺度、比率尺度。是否具有實際意義的零點存在,是定比尺度與定距尺度的唯一區(qū)別。例如對職工年齡的測量,“0”歲是絕對的,對所有人都一樣,若甲為40歲,乙為20歲,可知甲的年齡是乙的2倍。定比尺度由于有一絕對零點存在,因而比定距尺度更利于反映事物之間的比例或比率關(guān)系,是所

5、有測量層次中最高一層次的測量,不僅能進(jìn)行“”、“”,“”、“”,“+”、“-”的運算,而且能進(jìn)行“”、“”的運算。在定比測量中,除了使用定距測量數(shù)據(jù)所有描述性統(tǒng)計量,還有幾何平均數(shù)、變異系數(shù)等。(五)四種測量尺度的關(guān)系首先,這些測量尺度之間有著包含關(guān)系,即高一層次的測量總是包含低層次的測量。定序尺度包含了定類尺度所有運算性質(zhì),定距尺度包含了定序、定類尺度所有運算性質(zhì),而定比尺度則包含了所有測量層次的運算性質(zhì)。其次,四種測量尺度之間,低級的測量尺度往往能用較高級的測量尺度形式表示。例如,對學(xué)生考試成績的測量,進(jìn)行定類測量可分為及格、不及格:若將及格的成績高低排序,可分為優(yōu)、良、中、及格,這是定序

6、尺度;若再將各順序等級給出等級分,即按百分制測量,優(yōu):90分以上,良:80-90分,中:70-80分,及格:60-70分。數(shù)據(jù)的測量層次和數(shù)據(jù)中蘊含的信息相關(guān),對于相同的樣本容量,越高層次的測量,意味著數(shù)據(jù)中有越豐富的信息,往往可使用更加復(fù)雜的統(tǒng)計方法進(jìn)行分析。二、統(tǒng)計檢驗基本思想回顧 三、非參數(shù)統(tǒng)計方法非參數(shù)問題是指總體分布形式未知或雖已知卻不能用有限個參數(shù)刻畫的統(tǒng)計問題。當(dāng)總體分布不能由有限個實參數(shù)所刻劃或并不知曉總體分布或不關(guān)心總體分布時的統(tǒng)計方法,稱為非參數(shù)統(tǒng)計方法。非參數(shù)統(tǒng)計方法不依賴總體的具體分布形式,構(gòu)造的統(tǒng)計量以及估計常與具體分布無關(guān),故又稱非參數(shù)方法為自由分布方法。非參數(shù)統(tǒng)計

7、包含兩大方面的問題:一是較為經(jīng)典的以檢驗為主的統(tǒng)計推斷,如基于秩統(tǒng)計量的方法、列聯(lián)分析等 。另一方面是從無窮維的函數(shù)空間尋找恰當(dāng)?shù)目傮w分布或條件分布,如核密度估計、局部多項式回歸、樣條、可加模型等,這類方法與基于秩的方法有很大的不同,但同樣都不依賴于對總體分布所做的確定的假定、不依賴有限個參數(shù),被稱為現(xiàn)代非參數(shù)統(tǒng)計 。非參數(shù)檢驗在以下情形常為使用:待分析數(shù)據(jù)不滿足參數(shù)檢驗所要求的假定例如,非正態(tài)總體小樣本,t-檢驗不適用時,作為替代方法,可以采用非參數(shù)檢驗。僅由一些等級構(gòu)成的數(shù)據(jù)例如,消費者可能被問及對幾種不同商標(biāo)的飲料的喜歡程度,他們不能對每種商標(biāo)都指定一個數(shù)字來表示對該商標(biāo)的喜歡程度,卻能

8、將幾種商標(biāo)按喜歡的順序分成等級,如十分喜歡、比較喜歡、喜歡、不大喜歡、不喜歡等,無法采用參數(shù)檢驗,宜采用非參數(shù)檢驗。討論的問題中不包含參數(shù)例如,要判斷一個樣本是否為隨機樣本,采用非參數(shù)檢驗法是適當(dāng)?shù)?。測量層次數(shù)學(xué)性質(zhì)描述統(tǒng)計量適合的統(tǒng)計方法定類尺度眾數(shù)頻率列聯(lián)系數(shù)非參數(shù)方法定序尺度中位數(shù)分位數(shù)肯德爾秩相關(guān)系數(shù)斯皮爾曼秩相關(guān)系數(shù)定距尺度平均值方差皮爾遜相關(guān)系數(shù)參數(shù)和非參數(shù)方法定比尺度幾何均值標(biāo)準(zhǔn)差系數(shù)多重相關(guān)系數(shù)四、經(jīng)驗分布函數(shù)【例1.2】分別產(chǎn)生10、20、50、100個標(biāo)準(zhǔn)正態(tài)分布的隨機數(shù),比較不同樣本量經(jīng)驗分布函數(shù)與總體分布函數(shù)的差異。五、大樣本近似時的連續(xù)性修正問題的提出:在非參數(shù)統(tǒng)計中

9、,統(tǒng)計量的抽樣分布一般很難求,也有一些統(tǒng)計量沒有精確的分布;當(dāng)樣本量較大時,即使統(tǒng)計量有精確分布,計算量會很大,導(dǎo)致計算時間過長,此時需要利用統(tǒng)計量的漸近分布進(jìn)行大樣本近似,例如正態(tài)近似、卡方近似等。精確分布是離散分布,但是漸近分布是連續(xù)分布,兩者存在差異。六、功效函數(shù)和檢驗的漸近相對效率為了達(dá)到犯兩類錯誤的概率盡可能小,理論上可以尋找到合適的樣本量,盡可能滿足事先規(guī)定的犯第一類和第二類錯誤的概率。非參數(shù)檢驗的功效函數(shù)在大多數(shù)情況下都很難求出精確表達(dá)式,研究功效時,常將不同的檢驗做相對比較,比較的途徑基本兩條,一是對各種備擇假設(shè)做統(tǒng)計模擬,另一是求漸近相對效率。關(guān)于不同分布下各種檢驗的漸近相對

10、效率可參考孫山澤,非參數(shù)統(tǒng)計講義,北京大學(xué)出版社。第2章 單樣本非參數(shù)檢驗2.1 符號檢驗符號檢驗(Sign Test)是利用正,負(fù)號的數(shù)目對某種假設(shè)作出判定的非參數(shù)統(tǒng)計方法。本質(zhì)上而言,符號檢驗是基于二項分布構(gòu)造的檢驗方法,應(yīng)視為參數(shù)方法。但它與秩方法關(guān)系密切,所以作為最簡單的非參數(shù)檢驗也是合適的。2.1.1 普通的符號檢驗備擇假設(shè)備擇假設(shè)普通的符號檢驗p值計算方法:【例2.1】女性在對事物的看法上是否傾向于比男性保守?一些社會科學(xué)家對這樣的事實很感興趣,當(dāng)夫婦倆人有一個類似的觀點時,妻子可能比丈夫要保守。為了驗證這一事實是否成立,隨機選取了50對夫婦進(jìn)行調(diào)查。按預(yù)先制定的問題每人分別被詢問

11、,結(jié)果只有10對夫婦的看法傾向性差異較大,而其中9對夫婦的妻子確實比丈夫保守?!纠?.2】為了解顧客對咖啡、茶的喜好情況,在某商店隨機抽取15名顧客進(jìn)行調(diào)查,結(jié)果有12名顧客更喜歡茶,2名顧客更喜歡咖啡,1名對兩者同樣愛好。請問顧客對咖啡、茶的喜好是否有顯著差異?若有差異,是否更喜歡茶。注意:(1)本例的數(shù)據(jù)中,有一個樣本是對茶和咖啡同樣愛好,在非參數(shù)統(tǒng)計中經(jīng)常遇到。本例的處理方法是不考慮這個樣本。(2)p值什么時候可以被認(rèn)為充分小?一般來說,0.05作為一個標(biāo)準(zhǔn),如果p值小于0.05被認(rèn)為是一個小概率事件,本例和前一例都以顯著性水平0.05作為“小”的標(biāo)準(zhǔn),實際問題處理中可能會將p定得更小,

12、如0.01或者0.001,當(dāng)然有時也會將標(biāo)準(zhǔn)定為0.10,這時必須有充分理由認(rèn)為0.10是一個發(fā)生事件很小的概率。2.1.2 位置的符號檢驗【例2.3】生產(chǎn)過程是否需要調(diào)整?某企業(yè)生產(chǎn)一種鋼管,規(guī)定長度的中位數(shù)是10米?,F(xiàn)隨機地從正在生產(chǎn)的生產(chǎn)線上選取10根進(jìn)行測量,結(jié)果為:9.8, 10.1, 9.7, 9.9, 9.8, 10.0, 9.7, 10.0, 9.9, 9.8。請問生產(chǎn)過程是否需要調(diào)整?配對樣本位置的符號檢驗【例2.4】領(lǐng)導(dǎo)者的領(lǐng)導(dǎo)水平是否是可以訓(xùn)練的?為驗證領(lǐng)導(dǎo)水平是可以訓(xùn)練的,根據(jù)人的聰明程度、人品、受教育狀況等,隨機抽選出12個人配成6對,每對中有一人隨機選擇受訓(xùn),記作T

13、,另一人則不受訓(xùn)記作C。經(jīng)過一段時間后,按被設(shè)計好的問題評價他們的領(lǐng)導(dǎo)水平,結(jié)果如表2-2。編號T的評價(x)C的評價(y)x-y的符號11310+2197+33420+42438-54022+63915+表2-2 配對樣本評價表2.1.3 二項式檢驗和分位數(shù)檢驗檢驗統(tǒng)計量及其抽樣分布:備擇假設(shè)p值(精確方法)二項檢驗p值確定方法【例2.5】高中生晚自習(xí)是否應(yīng)延長時間?某高中每晚8:30結(jié)束晚自習(xí),有人建議應(yīng)延長至10:00。為作出決定,現(xiàn)對該高中學(xué)生做一調(diào)查,若學(xué)生中有25%以上說應(yīng)該延長晚自習(xí)時間,則延長時間。隨機選取18個學(xué)生進(jìn)行調(diào)查,有7個學(xué)生表示應(yīng)該延長晚自習(xí)時間。2. 分位數(shù)檢驗備

14、擇假設(shè)p值(精確方法)【例2.6】今天成年人的睡眠量是否少于5年前?5年前某地區(qū)的調(diào)查表明,成年人在每日24小時中的睡眠量中位數(shù)是7.5小時,每日睡眠量為6小時或少于6小時的占調(diào)查總數(shù)的5%,9小時和9小時以上的也占5%, 現(xiàn)對隨機抽取的8個普通成年人的調(diào)查結(jié)果為,每日24小時中睡眠量分為7.2, 8.3, 5.6, 7.4, 7.8, 5.2, 9.1, 5.8小時。2.2 Wilcoxon 符號秩檢驗Wilcoxon符號秩檢驗(Wilcoxon Signed Rank Test) 亦稱威爾科克森帶符號的等級檢驗。它是對符號檢驗的一種改進(jìn)。符號檢驗只利用關(guān)于樣本的差異方向上的信息,并未考慮差

15、別的大小。Wilcoxon符號秩檢驗彌補了符號檢驗的這點不足。下面的例子很能說明問題。【例2.7】設(shè)想請13個人品嘗了甲、乙兩種酒,評分結(jié)果見表2-5。品酒人12345678910111213甲55324150.560483945484652.24544乙353743.1553450.34346.15147.35546.544符號+-+-0此處得分差為甲得分減去乙得分。問甲乙哪種酒好?分析:如果僅看得分差的符號,12個非0符號中,只有2個+,利用符號檢驗不難得出乙種酒好的結(jié)論。但是進(jìn)一步思考會發(fā)現(xiàn),認(rèn)為“乙種酒好”的10人中,給出的得分其實相差無幾,而認(rèn)為“甲種酒”好的2人中,給出的得分是甲遠(yuǎn)

16、高于乙。這說明認(rèn)為“乙種酒好”的人心目中其實甲乙差不多,有可能是隨機因素造成了乙得分高。Wilcoxon符號秩檢驗在符號的基礎(chǔ)上進(jìn)一步考慮了差異的大小,以消除隨機性帶來的影響。2.2.1 位置的Wilcoxon符號秩檢驗1. 基本方法Wilcoxon符號秩檢驗p值的計算方法:備擇假設(shè)p值(精確方法)p值(正態(tài)近似方法)【例2.8】鑄件的機加工是否應(yīng)轉(zhuǎn)包出去? 某鋼鐵公司訂購了一批鑄件,在使用前需進(jìn)行機加工。這一任務(wù)可由公司承擔(dān),也可以轉(zhuǎn)包給他人。公司為減少加工費用,所確定原則是:若鑄件重量的中位數(shù)超過25公斤,就包出去;等于或小于25公斤則不轉(zhuǎn)包。從這批100件鑄件中隨機抽取8件進(jìn)行測量,每件

17、重量分別為:24.3,25.8,25.4,24.8,25.2,25.1,25.0,25.5。使用這些數(shù)據(jù),能否作出這批鑄件是否轉(zhuǎn)包的決定。編號重量差值D|D|D|的秩D的符號124.3-0.70.76-225.80.80.87+325.40.40.44+424.8-0.20.22.5-525.20.20.22.5+625.10.10.11+725.000825.50.50.55+例2.8秩計算的全部結(jié)果(平均秩法):在配對樣本中的應(yīng)用【例2.9】 新配方是否有助于防曬黑?某防曬霜制造者,欲了解一種新配方是否有助于防曬黑,對7個志愿者進(jìn)行了試驗。在每人脊椎一側(cè)涂原配方的防曬霜,另一側(cè)涂新配方的防

18、曬霜。背部在太陽下暴曬后,按預(yù)先給定的標(biāo)準(zhǔn)測定曬黑程度如下表。表中數(shù)值越大,表明曬黑程度越高。編號1234567原配方42513161445548新配方38533652334936得到p值為0.055。這個概率對于顯著性水平0.05來說剛剛不能拒絕原假設(shè)。2.3 游程檢驗1.游程的含義一個可以兩分的總體,如按性別區(qū)分的人群,按產(chǎn)品是否有缺陷區(qū)分的總體等等,隨機從中抽取一個樣本,樣本也可以分為兩類;類型和類型。若凡屬類型的給以符號A, 類型的給以符號B, 則當(dāng)樣本按某種順序排列(如按抽取時間先后排列)時,一個或者一個以上相同符號連續(xù)出現(xiàn)的段,就被稱作游程,也就是說,游程是在一個兩種類型符號的有序

19、排列中,相同符號連續(xù)出現(xiàn)的段。例如,將某售票處排隊等候購票的人按性別區(qū)分,男以A表示,女以B表示。按到來的時間先后觀測序列為:AABABB。在這個序列中,AA為一個游程,連續(xù)出現(xiàn)兩個A;跟隨它的符號B是一個游程;BB也是一個游程,領(lǐng)先于它的A也是一個游程。在這個序列中,A的游程有2個,B的游程也有2個,序列共有4個游程。每一個游程所包含符號的個數(shù),稱為游程的長度。如上面的序列中,有一個長度為2的A游程、一個長度為2的B游程,長度為1的A游程、B游程各有1個。2.基本方法隨機抽取一個樣本,觀測值按某種順序排列,如果研究所關(guān)心的問題是:被有序排列的兩種類型符號是否隨機排列,則可以建立雙側(cè)備擇,假設(shè)

20、組為:為了對假設(shè)作出判定,被收集的樣本數(shù)據(jù)僅需定類尺度測量,但要求進(jìn)行有意義的排序,按一定次序排列的樣本觀測值能夠被變換為兩種類型的符號。備擇假設(shè)p值(精確方法)U的右尾概率U的左尾概率U較小尾部概率的2倍備擇假設(shè)p值(正態(tài)近似)Z較小尾部概率的2倍【例2.10】 某旅游點該年氣溫偏差是否隨機?某旅游點該年二月份的氣溫,連續(xù)10天被記錄,每天的最高氣溫與歷史上同期最高氣溫平均值比較,高于均值記作A,低于均值記錄作B,結(jié)果10天的氣溫依次記錄為AABABBAAAB, 使用=0.05的顯著性水平,檢驗高溫的偏差是否隨機。得到p值為0.888。結(jié)果表明在0.05的水平上,不能拒絕氣溫偏差是隨機的原假

21、設(shè)。011101011101011101011111111111【例2.11】 從生產(chǎn)線上抽取產(chǎn)品檢驗,是否應(yīng)采用頻繁抽取小樣本的方法?在一個剛建成的制造廠內(nèi),質(zhì)量控制員需要設(shè)計一個抽樣方法,以保證質(zhì)量檢查的可靠。生產(chǎn)線上抽取的產(chǎn)品檢查結(jié)果可簡單地分為兩類:有毛病、無毛病,檢驗費用與受檢產(chǎn)品總數(shù)有關(guān),而與每次抽檢產(chǎn)品數(shù)量關(guān)系不大。一般來說,有毛病的產(chǎn)品似乎是成群的,則每天應(yīng)頻繁抽取小樣本,以保證估計可靠;若有毛病的產(chǎn)品隨機產(chǎn)生,則每天以間隔較長地抽取大樣本,就可以得到一個比較好的估計。現(xiàn)隨機抽取30個產(chǎn)品,有毛病的編碼為0, 好的編碼為1,按從生產(chǎn)線抽取順序排列(下面是按列的順序排),結(jié)果為1

22、. 基本方法2. 應(yīng)用(1)理論頻數(shù)完全已知【例2.12】某金融機構(gòu)的貸款償還類型有A、B、C、D四種,各種的預(yù)期償還率為80%、12%、7%和1%,在一段時間的觀察記錄中,A型按時償還的有380第,B型有69筆,C型有43筆,D型有8筆。問在5%顯著性水平上,這些結(jié)果與預(yù)期的是否一致?類型A380400-204001.00B69609811.35C43358641.83D85391.80合計5005005.98計算細(xì)節(jié):(2)理論頻數(shù)不完全已知【例2.13】從1500到1931年的432年間,每年爆發(fā)戰(zhàn)爭的次數(shù)可以看作一個隨機變量,椐統(tǒng)計這432年間共爆發(fā)了299次戰(zhàn)爭,具體數(shù)據(jù)如下表。戰(zhàn)爭

23、次數(shù)年數(shù)0223114224831544問戰(zhàn)爭爆發(fā)的次數(shù)是否近似服從泊松分布?如果原假設(shè)成立,則理論期望頻率為223216.220142149.6524851.7891511.94842.390第3章 兩樣本非參數(shù)檢驗本章內(nèi)容:3.1 兩個相關(guān)樣本的非參數(shù)檢驗3.2 兩個獨立樣本的非參數(shù)檢驗3.3 尺度檢驗3.1 兩個相關(guān)樣本的非參數(shù)檢驗兩個相關(guān)樣本的定義:若一次抽樣的測量結(jié)果影響另一次抽樣測量結(jié)果,則這種抽樣是相關(guān)的。例如,對照實驗得到的樣本就是相關(guān)樣本。在接受兩種不同訓(xùn)練方法的人員中,由于智力、接受能力、耐力等方面的不同,會導(dǎo)致不同處理的結(jié)果產(chǎn)生差異,這不是所要研究的問題,而是其它因素影響

24、產(chǎn)生的附加差異,這些其它影響因素也稱為混雜因素。這些因素在實施不同處理前必須排除。為獲取相關(guān)樣本,常應(yīng)用兩種方式。一是讓每一研究對象作為自身的對照者,另一是將研究對象兩兩配對,分別給每一對兩個成員以不同處理。3.1.1 兩個相關(guān)樣本的符號檢驗1. 基本方法配對是處理相關(guān)樣本的基本手段。如果關(guān)心的是某一總體中位數(shù)是否大于另一總體中位數(shù),則可建立單側(cè)備擇,假設(shè)組為2. 應(yīng)用【例3.1】教學(xué)參考資料對于指導(dǎo)學(xué)生自學(xué)是否有效?為幫助學(xué)生通過自學(xué)提高對知識的掌握,編輯了符合教學(xué)大綱的教學(xué)參考資料。針對某一概念的掌握進(jìn)行實驗,隨機選取15名學(xué)生,他們在使用參考資料之前的得分(5分制)如下表。學(xué)習(xí)參考資料后

25、,重新對這一概念進(jìn)行測試,得分也列在表中。檢驗這部參考資料是否促進(jìn)學(xué)生掌握知識。學(xué)生編號123456789101112131415第一次成績222233333323323第二次成績342323442443444編號編號編號124735135423483314253359211555435103516355331125171563212253.1.2 兩個相關(guān)樣本的Wilcoxon符號秩檢驗1. 基本方法兩個相關(guān)樣本的Wilcoxon符號秩檢驗也是用來檢驗配對樣本是否有顯著差異的方法。它不僅借助于兩個樣本差值的符號,而且利用差值的大小,因此它比符號檢驗有更精確的判斷。建立假設(shè)組,當(dāng)研究的問題僅關(guān)

26、心兩個總體的分布是否相同,或說兩個總體中位數(shù)是否相同時,采用雙側(cè)檢驗為2應(yīng)用【例3.3】幼兒園的生活對孩子的社會知識是否有影響?有人認(rèn)為兒童上幼兒園有助于其認(rèn)識社會,有人則認(rèn)為兒童在家一樣可以獲得社會知識。為了解它們是否存在顯著差異,對8個同性孿生兒童進(jìn)行實驗,隨機指定8對中一個上幼兒園,另一個則在家。經(jīng)過一段時間后,通過對他們的詢問,分別作出相應(yīng)的評價,評分越高,表明社會知識越多,結(jié)果見下表。配對編號12345678上幼兒園兒童7870678176728583在家兒童6258637780738278分析:雖然可以相信得分多的孩子比得分少的孩子社會知識要多,但由于是定距尺度測量,無絕對零值,因

27、此不能認(rèn)為得80分的孩子社會知識是得40分的孩子的2倍,也不能認(rèn)為80分與60分的社會知識之差一定是60分與50分之差的2倍。但是,可以肯定,80分與60分所代表的社會知識之差一定大于60分和50分之間的差。所以將分?jǐn)?shù)差值的絕對值排序是有意義的,這樣就有能夠運用Wilcoxon符號秩檢驗判定在家和上幼兒園對孩子的社會知識是否有顯著影響。3.2 兩個獨立樣本的非參數(shù)檢驗若第一次抽樣的所有樣本某一屬性的測量結(jié)果,不影響第二次抽樣的所有樣本同一屬性的測量結(jié)果,則這種抽樣是獨立的,得到的兩個樣本為獨立樣本。適用于獨立樣本的情況:樣本配對不當(dāng)、無法配對等,即不適宜視為相關(guān)樣本的情形。3.2.1 Mann

28、-Whitney-Wilcoxon檢驗Mann-Whitney-Wilcoxon檢驗,常譯為曼-惠特尼-維爾科克森檢驗,簡寫為M-W-W檢驗,亦稱Wilcoxon秩和檢驗。1. 基本方法若大部分的Y大于X 或大部分的X大于Y將不能證實這個有序的序列是一個隨機的混合,將拒絕X和Y來自一個相同總體的原假設(shè)?!纠?.4】一種藥物有效性的試驗,一組為試驗組,一組為對照組。試驗結(jié)果評分如下表:試驗組(X)81218對照組(Y)691113將表中評分按從小到大的順序排列,并注意哪一個評分為X組的,哪一個為Y組的,同時給出秩,結(jié)果如下:排序68911121318秩1234567組別YXYYXYX備擇假設(shè)p值

29、備擇假設(shè)p值 2. 應(yīng)用【例3.5】某種藥物對治療腫瘤是否有效?選擇9只白鼠,作為抗癌藥物篩選的對象,9只白鼠的基本條件相同,同時注射致癌物。然后隨機選取其中3只進(jìn)行抗癌藥物處理。腫瘤的重量是檢驗藥物有效性的一個指標(biāo)。經(jīng)過一個固定的時間周期后,將9只白鼠的腫瘤割除稱重,結(jié)果如下(重量單位是克)。 處理組(X):0.94, 1.56, 1.15 控制組(Y):1.20, 1.63, 2.26, 1.87, 2.20, 1.30 分析:若該種抗癌藥物有效,處理組白鼠腫瘤的重量應(yīng)該小于控制組的平均重量。由于這個試驗采用的是小樣本,且為兩個獨立樣本,數(shù)據(jù)測量為定比尺度,可運用Mann-Whitney-

30、Wilcoxon檢驗,建立的假設(shè)組為將腫瘤重量從小到大排序并計算秩和組別得到下表結(jié)果:腫瘤重量0.941.151.201.301.561.631.872.202.26秩123456789組別XXYYXYYYY3. 同分的處理【例3.6】問題按難易次序提問是否影響學(xué)生正確回答的能力?從心理學(xué)的角度看,按問題的難易程度順序提問會影響學(xué)生正確回答的能力,從而影響他們的總分?jǐn)?shù)。為檢驗這種觀點,隨機地將一班學(xué)生20人分成兩組,每組10人。設(shè)計一組問題,分成A和B卷,A卷是問題按從易到難的次序安排。B卷相反,從最難到最易。兩組學(xué)生分別回答A和B卷,考試被控制在完相同的條件下進(jìn)行,評分結(jié)果如下:A: 83,

31、 82, 84, 96, 90, 64, 91, 71, 75, 72B: 42, 61, 52, 78, 69, 81, 75, 78, 78, 65分析:這一問題可以考慮按考試分?jǐn)?shù)的中位數(shù)來研究。若兩組成績的中位數(shù)相等,提問的次序?qū)W(xué)生的成績無顯著影響,若中位數(shù)不相等則不能認(rèn)為沒有顯著影響。由于是小樣本,并且為兩個獨立樣本,因而可以運用M-W-W檢驗,這是一個單側(cè)檢驗,單側(cè)備擇應(yīng)是A組的成績平均高于B組。因為兩個樣本的觀測值數(shù)目相同,無論哪組都可以記作X。若以X代表A組。則假設(shè)組為4. 移位參數(shù)的Mann-Whitney-Wilcoxon檢驗3.2.2 Wald-Wolfowitz游程檢驗

32、Wald-Wolfowitz Runs Test常譯為沃爾德-沃爾福威茨連串檢驗或游程檢驗,簡寫為W-W串檢驗。1. 基本方法思想方法:分析合并樣本的游程。例如,觀察兩組學(xué)生的考試成績,將7個分?jǐn)?shù)排列成一個從小到大的序列如下:第一組(X)727863第二組(Y)65798285觀察X和Y出現(xiàn)的次序以確定游程數(shù)。序列中有4個游程,一個由來自X的63分構(gòu)成的游程,隨后是一個由來自Y的65分構(gòu)成的游程,再后是由來自X的兩個分?jǐn)?shù)72和78構(gòu)成的游程,最后是三個來自Y的分?jǐn)?shù)構(gòu)成的1個游程。排序63657278798285組別XYXXYYY可以用序列的游程數(shù)作為檢驗統(tǒng)計量,定義U為Wald-Wolfowi

33、tz檢驗的統(tǒng)計量U = 游程的總數(shù)目2. 應(yīng)用【例3.7】問題的提問順序是否對學(xué)生正確回答的能力有影響?沿用例3.6的資料,考察問題的提問順序是否對學(xué)生成績產(chǎn)生影響。分析:由于只考察問題從易到排序和從難到易排序是否會影響學(xué)生的成績,且相互獨立,因此可以用Wald-Wolfowitez游程檢驗。假設(shè)組為將試驗數(shù)據(jù)即學(xué)生考試成績從小到大排序得到下表:42526164656971727575YYYXYYXXXY78787881828384909196YYYYXXXXXX3.3 尺度檢驗尺度檢驗用于考察兩個總體的分散程度是否一致。在總體分布為正態(tài)分布時,尺度檢驗可以通過F檢驗完成。但是在實際中,總體的

34、正態(tài)性假設(shè)往往不能滿足,需要用適用范圍更廣的尺度檢驗。下面介紹兩種基于秩方法的尺度檢驗:安薩里-布拉德利(Ansari-Bradley)檢驗和平方秩檢驗。3.3.1 安薩里-布拉德利(Ansari-Bradley)檢驗1. 基本方法備擇假設(shè)p值計算方法(R語言命令)ansari.test(x,y,alternative=greater)ansari.test(x,y,alternative=less)ansari.test(x,y,alternative= two.sided)當(dāng)每個總體的樣本量都小于50個時,可以用精確檢驗,此時,數(shù)據(jù)有同分(打結(jié))對結(jié)果影響很小。當(dāng)每個總體的樣本量都大于50

35、時,可以用正態(tài)近似,只要在R命令中添加exact = F即可。此時,數(shù)據(jù)同分(打結(jié))需要調(diào)整,R語言在計算時會自動完成調(diào)整。2. 應(yīng)用【例3.8】兩個經(jīng)銷商的鉛錠重量是否有相同的可靠度?兩個經(jīng)銷商的鉛錠重量有相同的中位數(shù),但是懷疑第一個經(jīng)銷商的重量變化幅度比第二個的大。隨機抽取了兩個經(jīng)銷商的22個鉛錠如下表(單位:千克)。經(jīng)銷商115.41615.615.716.616.316.416.815.216.915.1經(jīng)銷商215.716.115.916.215.91615.816.116.316.515.53.3.2 平方秩檢驗Ansari-Bradley檢驗要求待檢驗的兩總體尺度參數(shù)(中位數(shù))相

36、等或已知。但是實際問題中,有時候這樣的要求不能滿足。此時要檢驗總體的分散程度可以選擇平方秩檢驗。1. 基本方法備擇假設(shè)p值計算(正態(tài)近似)Z的右尾概率Z的左尾概率Z的小尾概率的2倍2. 應(yīng)用【例3.9】已知有兩群人的心率數(shù)據(jù)如下,請問兩群人的心率波動大小是否相同?群體1:58, 76, 82, 74, 79, 65, 74, 86群體2:66, 74, 69, 76, 72, 73, 75, 67, 68分析:可以算出,兩個群體的平均心率分別是74.25和71.11,并且數(shù)據(jù)有同分,故采用正態(tài)近似的平方秩檢驗。第4章 多樣本非參數(shù)檢驗本章內(nèi)容:4.1 Cochran Q檢驗及多重比較4.2 F

37、riedman 檢驗及多重比較4.3 Kruskal-Wallis檢驗及多重比較4.1 Cochran Q檢驗及多重比較1. 基本方法為對假設(shè)作出判定,所分析的數(shù)據(jù)測量層次為定類尺度即可。獲得的數(shù)據(jù)可排成一個n行k列的表。例如教材例4.1中表4-1呈現(xiàn)的樣子。(1)檢驗的基本思想(2)多重比較具體可通過相關(guān)樣本符號檢驗實現(xiàn),或者M(jìn)cNemar檢驗實現(xiàn),其中后者是Cochran Q檢驗在兩樣本情形的特例。1(成功)0(失?。?(成功)0(失敗)McNemar檢驗的基本思想:檢驗統(tǒng)計量為在進(jìn)行多次兩兩配對檢驗時,需要對p值進(jìn)行調(diào)整,以防止犯第一類錯誤過大。調(diào)整p值的方法與方差分析中多重比較時采用的

38、調(diào)整方法相同。無論用符號檢驗還是用McNemar檢驗做多重比較,檢驗最終的p值都需要通過多重比較的調(diào)整方法算出。2. 應(yīng)用【例4.1】消費者對飲料的愛好是否存在顯著差異?某飲料經(jīng)銷商為決定經(jīng)營飲料的品種、數(shù)量,對消費者的愛好進(jìn)行了一次調(diào)查。隨機抽取18個消費者,請他們對四種飲料:奶茶、果茶、可樂、礦泉水的喜好作出評價,凡喜歡的記作1,不喜歡記作0。調(diào)查結(jié)果如教材表4-1(囿于篇幅不在此展示表格)。分析:在這個例子中,被調(diào)查的消費者是同一批人,所以是相關(guān)樣本。并且所有的數(shù)據(jù)都表示兩種結(jié)果,1代表“成功”(喜歡),0代表“失敗”(不喜歡)。對這種來自k個總體的二元響應(yīng)數(shù)據(jù)進(jìn)行差異性檢驗,可以選擇C

39、ochran Q檢驗。在R語言中,程序包RVAideMemoire中的函數(shù)cochran.qtest可以做Cochran Q檢驗,并且輸出基于配對符號檢驗的多重比較結(jié)果。輸出結(jié)果表明,p=0.914,對于顯著性水平0.05,p值足夠大。不能拒絕原假設(shè),即這個調(diào)查結(jié)果不足以推翻消費者對幾種飲料同樣喜歡的假設(shè)。從輸出結(jié)果還可以看到總體的比例估計,喜歡奶茶和果茶的比例都是0.444,喜歡可樂的比例為0.389,喜歡礦泉水的比例是0.333。從比例上看確實差不多。注:利用R程序包RVAideMemoire的cochran.qtest函數(shù)進(jìn)行檢驗,如果拒絕原假設(shè),則可以自動輸出基于符號檢驗的多重比較結(jié)果

40、,本例沒有輸出多重比較的原因是本例沒有拒絕原假設(shè)。【例4.2】三種不同教學(xué)方法的效果是否有顯著差異三種不同教學(xué)方法:網(wǎng)絡(luò)教學(xué)、課堂講授、課堂討論,對學(xué)生掌握知識的效果是否有所不同。為檢驗這一問題,抽選部分學(xué)生分為18組,每組3名匹配的學(xué)生,他們的有關(guān)情況類似。各組中3名學(xué)生被隨機地置于3種條件下,即隨機地指定接受某種教學(xué)方法。實施不同教學(xué)方法后進(jìn)行測驗,成績合格為有效,記作1; 成績不合格為無效,記作0。結(jié)果如教材表4-3。本例采用R語言兩種方法實現(xiàn)。方法1。采用R程序包RVAideMemoire的cochran.qtest函數(shù)進(jìn)行檢驗,并輸出基于符號檢驗的多重比較結(jié)果。輸出結(jié)果表明,p=0.

41、0015,對于顯著性水平0.01,這個p值足夠小,拒絕原假設(shè),即可以認(rèn)為,該調(diào)查說明三種教學(xué)方法的效果有顯著差異。方法2。采用程序包DescTools的CochranQTest函數(shù)完成檢驗,并用程序包rcompanion的pairwiseMcnemar完成基于McNemar檢驗的多重比較。輸出結(jié)果表明,p=0.0015,對于顯著性水平0.01,這個p值足夠小,拒絕原假設(shè),即可以認(rèn)為,該調(diào)查說明三種教學(xué)方法的效果有顯著差異。兩種方法的多重比較結(jié)果:樣本配對符號檢驗多重比較p值(BH調(diào)整)0.0340.0061.000樣本配對McNemar檢驗多重比較p值(BH調(diào)整)0.0340.0061.000

42、兩種方法的檢驗結(jié)果一致,在顯著性水平0.05下,網(wǎng)絡(luò)教學(xué)與課堂討論、網(wǎng)絡(luò)教學(xué)和課堂教學(xué)都有顯著不同,課堂教學(xué)和課堂討論效果差不多。這個結(jié)果與比例估計的結(jié)果也是吻合的。4.2 Friedman 檢驗及多重比較k個樣本是匹配的(相關(guān)樣本),實現(xiàn)匹配的方法與前面類似??梢允莐個條件下同一組受試者構(gòu)成,即受試對象作為自身的對照者,也可以將受試者分為n個組、每組均有k個匹配的受試者,隨機地將k個受試者置于k個條件之下形成。在不同受試者匹配的樣本中,應(yīng)盡量使不同受試者的有關(guān)因素匹配即相似。1. 基本方法(1)檢驗的基本思想與Cochran Q檢驗相似,F(xiàn)riedman檢驗也是用來檢驗各個樣本所得的結(jié)果在整

43、體上是否存在顯著差異。因此建立的也是雙側(cè)備擇,假設(shè)組為為對假設(shè)作出判定,所分析的數(shù)據(jù)應(yīng)是定序尺度測量。獲得的數(shù)據(jù)排成一個n行k列的表,如教材表4-5,行代表不同的受試者或匹配的受試小組,列代表各種條件。用方差分析的語言來講,就是因子的k個水平有n個區(qū)組。檢驗統(tǒng)計量:由于是定序尺度測量的數(shù)據(jù),因此,可以對每一行的觀測結(jié)果分別評秩,即評等級,等級1是最小的,依次排序,秩從1到k。(2)多重比較可以通過多種檢驗方法實現(xiàn)(例如配對的wilcoxon符號秩檢驗),并結(jié)合多重比較的p值調(diào)整方法得到最終的p值。本章采用基于Nemenyi檢驗和基于Conover檢驗實現(xiàn)多重比較。2. 應(yīng)用【例4.3】三種不同

44、教學(xué)方法的效果是否有顯著差異 三種不同教學(xué)方法同例4.2, 抽選的學(xué)生也分為18組,每組3名匹配的學(xué)生,其有關(guān)情況類似。各組中3名學(xué)生被隨機地安排接受某種教學(xué)方法。實施不同教學(xué)方法后,進(jìn)行測驗,按成績高低對3名匹配學(xué)生的成績排列等級即評秩,結(jié)果如教材表4-6。分析:這個問題與例4.2類似,也是檢驗三種教學(xué)方法的效果有無差異,因而應(yīng)建立雙側(cè)備擇,假設(shè)組為由于數(shù)據(jù)的測量已轉(zhuǎn)化為定序尺度,且是兩個以上相關(guān)樣本,可以采用Friedman檢驗??梢钥闯龅?5個觀測存在同分,R語言會自動對同分情況修正p值,利用R函數(shù)friedman.test即可。輸出結(jié)果表明,p=0.006。對于顯著性水平0.01,該值

45、足夠小。拒絕原假設(shè),說明三種教學(xué)方法的效果存在差異。三種教學(xué)方法的效果差異具體是誰和誰的差異?差異多大?需要進(jìn)一步通過多重比較分析得到。R程序包PMCMRplus中提供多種多重比較的函數(shù),這里介紹兩種:基于Nemenyi檢驗和基于Conover檢驗的多重比較。結(jié)果如下:樣本配對Nemenyi多重比較p值(BH調(diào)整)0.0270.0100.941樣本配對Conover多重比較p值(BH調(diào)整)0.0000.0000.3803. Kendall協(xié)同系數(shù)Kendall協(xié)同系數(shù)在理論上與Friedman檢驗完全等價,在應(yīng)用中,兩者的分析角度不一樣,可以互為補充。設(shè)對k個對象(總體)進(jìn)行n次評價,這種評價

46、可以是打分,可以是排序等。比如在例4.3中,相當(dāng)于n(=18)個學(xué)生(被動地)對k(=3)種教學(xué)方式進(jìn)行了打分。這樣就得到的數(shù)據(jù)形成n行k列的評價結(jié)果(n行k列的數(shù)據(jù)陣)。研究想知道,n次評價在多大程度上是一致的?如果n次評價是隨機的,沒有必要做進(jìn)一步分析。Kendall協(xié)同系數(shù)可以回答這個問題。可見,Kendall協(xié)同系數(shù)與Friedman檢驗是對同一個對象的兩種分析思路。沿用Friedman檢驗統(tǒng)計量中的記號,Kendall協(xié)同系數(shù)定義為W的取值在0到1之間,若W=0,則表明對k個對象的n次評價是完全隨機的;若W=1,則表明對k個對象的n次評價是完全一致的。如果出現(xiàn)同分,則與Friedma

47、n檢驗統(tǒng)計量的修正方式完全類似,修正的W為【例4.4】以例4.3用Kendall協(xié)同系數(shù)進(jìn)行分析。這個分析角度是從學(xué)生考試成績的角度分析3種教學(xué)方法的效果是否有顯著差異,如果學(xué)生考試成績對不同教學(xué)方法而言都有好有壞,呈現(xiàn)隨機性,則教學(xué)方法沒有顯著差異。否則,就是教學(xué)方法的效果有差異。R程序包DescTools中的KendallW函數(shù)可以輸出Kendall協(xié)同系數(shù)。例4.3的Kendall協(xié)同系數(shù)為0.287。關(guān)于Kendall協(xié)同系數(shù)大小與評價一致性的關(guān)系,有經(jīng)驗法則見下表。一致性強度弱中等強K=3K=5K=7K=9根據(jù)經(jīng)驗法則,學(xué)生的成績呈現(xiàn)較強的一致性,說明3種教學(xué)方法的教學(xué)效果是不一樣的

48、。Kendall協(xié)同系數(shù)的顯著性檢驗對例4.4進(jìn)行W的顯著性檢驗,得到p值為0.006,拒絕評價是隨機的原假設(shè),此結(jié)果與經(jīng)驗法則得到結(jié)論是一致的。4.3 Kruskal-Wallis檢驗及多重比較Kruskal-Wallis檢驗是適用于檢驗k個獨立樣本是否來自同一總體的非參數(shù)方法。Kruskal-Wallis檢驗亦有譯為克拉夏爾-瓦里斯檢驗,或簡稱為克氏檢驗。它是兩個獨立樣本Mann-Whitney-Wilcoxon檢驗的一種推廣。1. 基本方法(1)檢驗的基本思想注意,k個相關(guān)樣本情形是不能這么做的,因為合并后的樣本點將不再獨立,這是獨立樣本和相關(guān)樣本處理數(shù)據(jù)的本質(zhì)差異。對得到的單一樣本按從

49、小到大排序,將每一個觀測值給出一個等級即評秩,秩為整數(shù),從1到N。對于N個觀測值來說,平均秩是可以看出,H的分子是每個樣本實際等級和與期望等級和的偏差平方和,如果原假設(shè)為真,該H的值應(yīng)該傾向很小,如果H的值過大,就有理由懷疑原假設(shè)不真。p值的計算(2)多重比較檢驗統(tǒng)計量為2. 應(yīng)用【例4.5】四種不同類型治療的有效性是否有顯著不同 對于精神錯亂有4種不同的手段:電擊、心理療法,電擊加心理療法、無任何治療。為檢驗這幾種不同手段對精神錯亂治療的有效性是否有顯著不同,選取40個患者。他們在智力、品德、心理等因素方面相差不多。隨機地將40人分成4個組,每組10人。4個組分別接受不同方法的治療。一個周期

50、后,對每個患者相對改善程度進(jìn)行測量,依改善高低程度給40人分等級,等級1是改善的最高水平,依次排序,直至等級40是改善最小的水平。評秩結(jié)果如教材表4-10。分析:對任何一種方法判定其有效的標(biāo)志是患者分?jǐn)?shù)的中位數(shù),若4種方法效果差異不大,則各總體的中位數(shù)應(yīng)相等。為檢驗4種方法有效性是否有顯著差異,建立假設(shè)組為由于數(shù)據(jù)是定序尺度測量,有兩個以上獨立樣本,可以采用Kruskal-Wallis檢驗,R函數(shù)為kruskal.test。利用多重比較進(jìn)一步分析各種治療方法之間的具體差異,利用R程序包FSA中的dunnTest函數(shù)可以實現(xiàn)。多重比較結(jié)果整理如下表:療法配對p值(基于Dunn檢驗和BH法)3.

51、同分的處理多重比較的檢驗統(tǒng)計量也要作相應(yīng)的修正,修正后的檢驗統(tǒng)計量為【例4.6】三種不同教學(xué)方法的有效性是否有顯著差異 某大學(xué)制定三種不同的教學(xué)方法:大班講授、小班講授、小組討論。為檢驗三種方法對學(xué)生掌握知識的有效性是否有顯著相同,進(jìn)行了一次試驗。選取二年級大學(xué)生50名,隨機地分為三組,分別接受三種不同方法教學(xué)。由同一教師按不同方法分別講授同一方面的知識,規(guī)定的內(nèi)容講授完后,對學(xué)生進(jìn)行統(tǒng)一考試,成績?nèi)缃滩谋?-12。 分析:學(xué)生成績?yōu)槎ň喑叨葴y量,但為了避免作出某些假設(shè),以使結(jié)論更具普遍性,不準(zhǔn)備采用參數(shù)檢驗方法,而選用非參數(shù)檢驗。由于三種不同教學(xué)方法是獨立的,故應(yīng)采用k個獨立樣本的統(tǒng)計檢驗。

52、對于三組學(xué)生成績集中趨勢的一個很好的度量指標(biāo)是中位數(shù),成績由小到大排序給出等級,能夠采用Kruskal-Wallis檢驗。建立假設(shè)組為為采用Kruskal-Wallis檢驗對假設(shè)作出判定,將教材表4-12中的所有學(xué)生成績排序,最低分秩評為1,最高分秩評為50。由于50名學(xué)生中有不少是同分,需要用調(diào)整過后的檢驗統(tǒng)計量計算p值。R中函數(shù)kruskal.test可以自動計算出調(diào)整后的統(tǒng)計量值。雖然不能拒絕原假設(shè),但是p值離0.05相差不遠(yuǎn),可以做多重比較進(jìn)行更加細(xì)致的比較。結(jié)果整理如下表:教學(xué)方法配對p值(基于Dunn檢驗和BH法)從表可知,調(diào)整的p值都大于0.05,不能拒絕原假設(shè),表明數(shù)據(jù)無法拒絕

53、各種教學(xué)方法之間存在顯著差別,即三種教學(xué)方法的學(xué)生平均成績沒有顯著差異。第5章 非參數(shù)相關(guān)性度量本章內(nèi)容:5.1 斯皮爾曼(Spearman)秩相關(guān)5.2 肯德爾(Kendall)秩相關(guān)5.3 霍夫?。℉oeffding)獨立性檢驗5.1 斯皮爾曼(Spearman)秩相關(guān)秩相關(guān)(Rank Correlation) 也稱作級序相關(guān)或等級相關(guān),用于兩個至少是定序尺度測量的樣本間相關(guān)程度的測定。1. 基本方法X和Y的評秩完全相同(完全正相關(guān))X和Y的評秩完全相反(完全負(fù)相關(guān))X的秩Y的秩X的秩Y的秩111n222n-1n-1n-1n-12nnn1上面的式子取值在0到1之間。當(dāng)X和Y完全正相關(guān)時,取

54、值為0;當(dāng)X和Y完全負(fù)相關(guān)時,取值為1。當(dāng)數(shù)據(jù)沒有同分時,為了與皮爾遜相關(guān)相統(tǒng)一,定義斯皮爾曼秩相關(guān)系數(shù)為這樣定義可以讓R的取值從-1到+1。其中,R=1表明X和Y完全相關(guān),R=1為完全正相關(guān),R=-1為完全負(fù)相關(guān)。R越接近于1, 表明相關(guān)程度越高。反之,R越接近于零,表明相關(guān)程度越低,R=0為完全不相關(guān)。通過一些代數(shù)運算,可以得到這說明,斯皮爾曼秩相關(guān)系數(shù)本質(zhì)是用秩替換原始數(shù)據(jù)的皮爾遜相關(guān)系數(shù)。2. 應(yīng)用【例5.1】2位教授對本科畢業(yè)設(shè)計評分的相關(guān)分析。數(shù)據(jù)如下表:畢業(yè)生編號A教授B教授115223359496548664732871910710810分析:由于例5.1給出的數(shù)據(jù)為評分等級,

55、兩個定序數(shù)據(jù)間的相關(guān)程度測定可以采用斯皮爾曼秩相關(guān)系數(shù)。利用R語言的函數(shù)cor可直接算出需要的數(shù)值。結(jié)果表明R=0.32120.8, 兩位教授對10名本科生畢業(yè)設(shè)計評分的相關(guān)程度不高。注:斯皮爾曼秩相關(guān)系數(shù)不僅可以直接用等級來進(jìn)行計算,也可以將高于定序尺度測量的數(shù)據(jù)轉(zhuǎn)換為秩次進(jìn)行計算。其使用范圍比皮爾遜相關(guān)系數(shù)廣?!纠?.2】經(jīng)濟發(fā)展水平和衛(wèi)生水平之間的相關(guān)分析。 對某地區(qū)12個街道進(jìn)行調(diào)查,并對經(jīng)濟發(fā)展水平和衛(wèi)生水平按規(guī)定的標(biāo)準(zhǔn)打分,并按從小到大的順序排等級,得到評分的秩,評定結(jié)果如下表。街道編號經(jīng)濟水平及秩衛(wèi)生水平及秩街道編號經(jīng)濟水平及秩衛(wèi)生水平及秩18268697847807287978

56、6878477536016529805764498128810109411961257536411185885868910901112682703結(jié)果表明,R=0.8880.8,該地區(qū)的經(jīng)濟發(fā)展水平和衛(wèi)生水平存在著正相關(guān),相關(guān)程度較高,為88.8%。3. 同分的處理公式中,u是X中同分的觀測值數(shù)目,v是Y中同分的觀測值數(shù)目。【例5.3】經(jīng)濟發(fā)展水平和衛(wèi)生水平間的相關(guān)分析某地區(qū)對24個地區(qū)進(jìn)行調(diào)查,并對各地區(qū)的經(jīng)濟發(fā)展水平和衛(wèi)生水平按規(guī)定標(biāo)準(zhǔn)評分,結(jié)果如下表。地區(qū)編號經(jīng)濟水平衛(wèi)生水平地區(qū)編號經(jīng)濟水平衛(wèi)生水平192561368552907014676639071156559487761664585

57、816917615068068186054779621959438777020554597664214634107663224232117454233930126865243831利用R語言的函數(shù)輸出結(jié)果表明,R=0.84900.8,說明經(jīng)濟水平和衛(wèi)生水平之間存在較高的相關(guān)性。如果不對同分進(jìn)行修正,強行利用不修正的公式計算斯皮爾曼秩相關(guān)系數(shù)為0.8491。數(shù)值上與修正結(jié)果有細(xì)微差別,但也是大于0.8的。對比兩個R值可知,由于同分的觀測值數(shù)目占觀測值總數(shù)目的比例不是很大,因而校正后的R與校正前的R變化不大。校正前的R略大于校正后的R,這說明同分對R的影響雖然很小,但同分的影響是夸大R值。因此,在

58、X與Y中至少有一個存在大量同分時,應(yīng)進(jìn)行校正。4. 斯皮爾曼秩相關(guān)的顯著性檢驗對兩個樣本X和Y計算斯皮爾曼秩相關(guān)系數(shù)之后,可以根據(jù)相關(guān)系數(shù)的大小,推斷總體秩相關(guān)的方向,并用顯著性檢驗進(jìn)行回答。針對研究問題的不同,可以建立不同的假設(shè)組:為對假設(shè)作出判定,所需數(shù)據(jù)至少是定序尺度測量的。檢驗統(tǒng)計量就是斯皮爾曼秩相關(guān)的公式(有同分時用修正公式),p值為相應(yīng)情況的尾部概率。當(dāng)原假設(shè)為真且樣本量比較大時備擇假設(shè)精確p值正態(tài)近似p值R的右尾概率Z的右尾概率R的左尾概率Z的左尾概率R的小尾概率的2倍Z的小尾概率的2倍【例5.4】對例5.3作顯著性檢驗。5.2 肯德爾(Kendall)秩相關(guān)肯德爾秩相關(guān)與斯皮爾

59、曼秩相關(guān)一樣,也是用于兩個樣本相關(guān)程度的測量,要求數(shù)據(jù)至少是定序尺度的。它也是利用兩組秩次測定兩個樣本間相關(guān)程度的一種非參數(shù)統(tǒng)計方法。1. 基本方法例如,X、Y的秩分別為X:2, 4, 3, 5, 1; Y:3 ,4, 1, 5, 2。 將X的秩按從小到大順序排列后,則X和Y的秩則為下面的形式:X:1,2, 3, 4, 5;Y:2,3, 1, 4, 5。 稱秩的大小方向一致的對為協(xié)同(concordant)對或一致對。由于X的秩次已經(jīng)按自然順序由小到大排列,因此,X的觀測值每兩個之間都是一致對??疾靁的秩次情況,第一個秩為2,第二個為3,因為2小于3,是按自然順序增加,因此,這是一個一致對。再

60、考察2和1, 因為2大于1, 不是按自然順序增加排列,所以這是一個非一致對。依次考察下去,凡一致對記為+1分,非一致對記為-1分。Y的數(shù)對分?jǐn)?shù)總和2,318個+2個-2,1-12,412,513,1-13,413,511,411,514,51若以U表示Y的一致對數(shù)目,V表示Y的非一致對數(shù)目,則一致對評分與最大可能總評分之比為當(dāng)X和Y的順序完全一致時,上式的值為1;當(dāng)兩者順序完全相反時,上式值為0;當(dāng)X和Y之間的順序關(guān)系不確定時,該式取值在0和1之間。顯然,X和Y的這種順序關(guān)系反映出兩個總體之間的某種關(guān)聯(lián)性??系聽栔认嚓P(guān)系數(shù)定義為當(dāng)X和Y的順序關(guān)系完全一致時,T為1;順序關(guān)系完全相反時,T為-1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論