第七章相關和回歸_第1頁
第七章相關和回歸_第2頁
第七章相關和回歸_第3頁
第七章相關和回歸_第4頁
第七章相關和回歸_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第七章相關和回歸第一頁,共二十三頁,編輯于2023年,星期四第七章相關和回歸Spearman秩相關檢驗1235Kendall秩相關系數(shù)檢驗Theil非參數(shù)回歸和幾種穩(wěn)健回歸第二頁,共二十三頁,編輯于2023年,星期四一、適用范圍Spearman秩相關系數(shù)是最早、最著名評秩統(tǒng)計量,主要用于研究兩變量間的相關程度及其顯著性檢驗,其資料要求兩變量都至少是以定序尺度測量的。二、理論依據(jù)和方法1.理論依據(jù):Spearman秩相關系數(shù),用rs代表。是對容量為n的xi和yi的秩(i=1,2,…,n)進行相關性測量。如兩變量x與y完全正相關,則應有xi=yi;如完全負相關,應有x1=yn,x2=yn-1,…,xn=y1。Spearman秩相關系數(shù)通過di=xi—yi研究總的偏離程度。第一節(jié)Spearman秩相關第三頁,共二十三頁,編輯于2023年,星期四在計算相關系數(shù)時,直接研究di是不合適的,因為正的di與負的di相互抵消,因此采用∑di2,當di越大時,∑di2也越大。rs的計算公式為:(7.1)當∑di2為0時,rs=1,可認為兩個變量完全正相關。rs所量度的是兩個等級之間的聯(lián)系強度,rs處于+1和-1之間。第一節(jié)Spearman秩相關第四頁,共二十三頁,編輯于2023年,星期四2.顯著性檢驗假設組Ho:X和Y相互獨立(X和Y正或負相關)H1:X與Y相互不獨立(X與Y負或正相關)檢驗rs的顯著性,在小樣本情況下,即n從4到30時,可查附表13來檢驗。該表列出了在H0成立時相伴概率分別為a=0.05和a=0.01的rs值。這是一個單尾表適合用于檢驗單側(cè)假設。即當rs大于或等于表中臨界值時,拒絕Ho。第一節(jié)Spearman秩相關第五頁,共二十三頁,編輯于2023年,星期四在大樣本情況下,即n≥10時,在零假設成立時得到的rs的顯著性可用統(tǒng)計量t來檢驗:

t統(tǒng)計量近似服從df=n-2的T分布。如n很大時,即n≥30,還可用統(tǒng)計量Z來檢驗。近似服從正態(tài)分布。(7.2)3.耦合修正。兩變量的秩相等即耦合。這時用它們的平均秩作耦合項的秩。第一節(jié)Spearman秩相關第六頁,共二十三頁,編輯于2023年,星期四在耦合現(xiàn)象出現(xiàn)的比例不大時,可以忽略它們對rs的影響;但當其比例較大時,rs用下式來修正:(7.3)

式中,Tx=(t3-t)/12,t等于x變量中同一個秩的耦合數(shù);Ty=(t3-t)/12,t代表y變量中耦合的觀察數(shù)。第一節(jié)Spearman秩相關第七頁,共二十三頁,編輯于2023年,星期四三、檢驗步驟1.據(jù)題意,作正確假設;2.將變量X和Y的觀察值分別從1到n評秩,如觀察值相同,用平均秩代替。3.將兩樣本配對成(xi,yi),xi,yi分別代表兩變量的秩。4.定出di=xi-yi;算出∑di2。5.如無耦合現(xiàn)象或比例較小時,用公式(7.1)算出rs,如耦合現(xiàn)象比例較大,則用(7.3)公式計算rs。6.小樣本4≤n≤30時,查附表13;大樣本時,N≥30用公式(7.2)。第一節(jié)Spearman秩相關第八頁,共二十三頁,編輯于2023年,星期四四、例7.1(小樣本舉例)學習時間長短與學生考試成績間是否有關。調(diào)查某大學10個學生每周學習的時間與期末平均成績的資料如表7-1所示.解:假設H0:學習時間X與平均成績等級Y之間是相互獨立的;H1:學習時間X與平均成績等級Y之間是正相關。根據(jù)(9.22)式計算得到:取a=0.05的顯著性水平,樣本容量n=10,查附表13臨界值rs(n,a)=0.5515第一節(jié)Spearman秩相關第九頁,共二十三頁,編輯于2023年,星期四表7-1大學生的學習時間與期末成績調(diào)查表變量秩次di=xi-yidi2周學習時期末平均成績時間排秩成績等級(x)(y)(xi)(yi)248467.5-1.52.2517402.511.52.2520584400418487.50.50.25528510911238055004690910-1117552.53-0.50.25154812-1129827611合計9.00第一節(jié)Spearman秩相關第十頁,共二十三頁,編輯于2023年,星期四因為rs=0.946>0.5515(臨界值)故拒絕Ho假設,而接受H1假設,即學生的學習時間與學生的平均成績等級之間存在著正相關關系。這里變量x和y中都分別有一對存在耦合即t=2,所占比例不大,可以不必進行修正。但為說明方法,在此作一修正。用公式(7.3),首先要算出代入公式得:修正后比修正前略有減小。第一節(jié)Spearman秩相關第十一頁,共二十三頁,編輯于2023年,星期四例7.2(大樣本舉例)從一個大企業(yè)的生產(chǎn)線上抽出15名雇員組成一個隨機樣本,然后讓這些雇員的同事和管理人員根據(jù)他們對工作的興趣及合作精神分別對他們進行排序,結(jié)果列于表7-2,企業(yè)當局想知道同事和管理人員的看法是否正相關。解:假設Ho:同伴對雇員的等級評定與管理人員對雇員的等級評定間相互獨立;H1:同伴對雇員的等級評定與管理人員對雇員的等級評定正相關由(7.1)式算得rs=1-(6×148)/(15×(152-1))=0.7357查附表13得r15,0.05=0.446<rs。因此我們以0.05的顯著性水平否定零假設,作出“兩種等級正相關”的結(jié)論第一節(jié)Spearman秩相關第十二頁,共二十三頁,編輯于2023年,星期四這里n=15>10。我們也可用T統(tǒng)計量來檢驗。查T分布表當df=13,a=0.05時,臨界值ta/2=2.160,因t=3.92>ta/2,所以我們可以在a=0.05的顯著性水平上拒絕Ho,從而得出結(jié)論:同伴和管理人員對這15個雇員的評價正相關。第一節(jié)Spearman秩相關第十三頁,共二十三頁,編輯于2023年,星期四一、適用范圍肯德爾(Kendall)秩相關系數(shù)τ(讀為Tao)是測度兩組秩間的相關程度。二、理論依據(jù)和方法在容量為n的成對樣本(xi,yi)中,如果某對觀察值都比另一對觀察值大,則稱這兩對觀察值為一致對(協(xié)同)。如(1.3,2.2)和(1.6,2.7)就是一致對(用Nc表示在Cn2個可能對中一致對的數(shù)目);反之如果某對觀察值與另一對觀察值以相反的方向變化(即一個減少而另一個增加),我們稱之為非一致對,并用Nd表示在Cn2個可能對中非一致對(不協(xié)同)的數(shù)目。第二節(jié)Kendall相關檢驗第十四頁,共二十三頁,編輯于2023年,星期四如果兩對觀察值相等,就不能算是一致對,也不能算作非一致對??系聽栔认嚓P系數(shù)的計算公式為:

(7.4)如所有觀察值對都是一致對,則τ=1;如所有觀察值對都是非一致對,則τ=-1.在計算τ值時,可以將所有觀察對(xi,yi)按變量值xi的遞增次序排列,將與其對應的yi與后面的每一個yi比較,有多少對yi是按遞增次序排列的,就有多少個一致對;有多少對yi不是遞增次序排列,就有多少個非一致對。第二節(jié)Kendall相關檢驗第十五頁,共二十三頁,編輯于2023年,星期四例9.21:雙胞胎兒童間的智力相關程度分析。某幼兒園對9對雙胞胎的智力進行測驗,并按百分制打分。現(xiàn)將資料列示如表7-3:表7-3解:根據(jù)τ計算要求,首先將資料(xi,yi)按xi的遞增次序排列,并將計算結(jié)果列如表7-4所示:雙胞胎的對數(shù)編號(i)123456789先出生的兒童(xi)867768917071858763后出生的兒童(yi)887664966580817260第二節(jié)Kendall相關檢驗第十六頁,共二十三頁,編輯于2023年,星期四表7-4(xi,yi)(xi,yi)以下的一致對(xi,yi)以下的非一致對63,608068,647070,656071,803277,763185,812186,881187,721091,9600-Nc=31Nd=5第二節(jié)Kendall相關檢驗第十七頁,共二十三頁,編輯于2023年,星期四計算Kendall秩相關系數(shù)即雙胞胎兒童間的智力相關程度為0.722三、顯著性檢驗求出Nc和Nd后,用統(tǒng)計量T(T=Nc-Nd)檢驗下面的假設:Ho:X與Y是相互獨立的;H1:X與Y不是相互獨立的。(正相關或負相關)再根據(jù)樣本大小n和顯著水平a,可查附表14T的臨界值.如果T>W(wǎng)n(1-a)就接受正相關的備擇假設;如果T<Wn(a)就接受負相關的備擇假設。第二節(jié)Kendall相關檢驗第十八頁,共二十三頁,編輯于2023年,星期四上例中,T=Nc-Nd=31-5=26。又因n=9,a=0.05,查附表14,得出雙側(cè)檢驗的兩個臨界值為:W0.975=18,W0。025=-18而T=26>W(wǎng)0.975=18,因此以0.05的顯著水平拒絕Ho,接受X與Y之間存在正相關的備擇假設。四、耦合處理在觀察對(Xi,Yi)中有兩個或兩個以上的數(shù)值相等時,用平均秩來代替。這種情況只影響(7.4)式中的分母(7.5)其中Tx=Ty=1/2∑t(t-1),t為觀察對中有相同值X(Y)的數(shù)目.第二節(jié)Kendall相關檢驗第十九頁,共二十三頁,編輯于2023年,星期四五、大樣本檢驗當N>10時,τ遵從如下的正態(tài)分布:均值Uτ=0,標準差:所以正態(tài)變量:

上例中N=12于10,可用正態(tài)近似法計算.∵τ=0.822∴查正態(tài)分布表,當Z=3.72時大于1.96,所以拒絕Ho假設。而接受學生所花的學習時間與取得的學習成績之間存在相關的結(jié)論。第二節(jié)Kendall相關檢驗第二十頁,共二十三頁,編輯于2023年,星期四六、功效討論斯氏秩相關系數(shù)rs與肯氏秩相關系數(shù)τ之間對比,兩者采用兩種不同的方法計算相關系數(shù),所以即使用同樣的資料,也會得出不同的數(shù)值。在大多數(shù)情況下,斯氏的rs的絕對值比肯氏的τ的絕對值為大(不是所有的情況均如此)。但我們絕不能根據(jù)它們計算的數(shù)值不同,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論