![應(yīng)用統(tǒng)計學(xué)相關(guān)與回歸_第1頁](http://file4.renrendoc.com/view/fffea57c6cb9017aacdf52c345f61074/fffea57c6cb9017aacdf52c345f610741.gif)
![應(yīng)用統(tǒng)計學(xué)相關(guān)與回歸_第2頁](http://file4.renrendoc.com/view/fffea57c6cb9017aacdf52c345f61074/fffea57c6cb9017aacdf52c345f610742.gif)
![應(yīng)用統(tǒng)計學(xué)相關(guān)與回歸_第3頁](http://file4.renrendoc.com/view/fffea57c6cb9017aacdf52c345f61074/fffea57c6cb9017aacdf52c345f610743.gif)
![應(yīng)用統(tǒng)計學(xué)相關(guān)與回歸_第4頁](http://file4.renrendoc.com/view/fffea57c6cb9017aacdf52c345f61074/fffea57c6cb9017aacdf52c345f610744.gif)
![應(yīng)用統(tǒng)計學(xué)相關(guān)與回歸_第5頁](http://file4.renrendoc.com/view/fffea57c6cb9017aacdf52c345f61074/fffea57c6cb9017aacdf52c345f610745.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
應(yīng)用統(tǒng)計學(xué)相關(guān)與回歸第一頁,共四十三頁,2022年,8月28日
內(nèi)容提要相關(guān)分析簡介簡單相關(guān)分析偏相關(guān)分析Distance過程簡單回歸分析小結(jié)第二頁,共四十三頁,2022年,8月28日相關(guān)分析簡介
在醫(yī)學(xué)科學(xué)研究中,常常要分析兩個變量之間的關(guān)系,例如身高和體重、年齡和血壓、體溫和脈搏、藥物劑量和療效等問題,因此涉及到研究兩個變量的相互關(guān)系。這時就涉及到兩個變量之間的相關(guān)與回歸。第三頁,共四十三頁,2022年,8月28日積差相關(guān)系數(shù),又稱Pearson相關(guān)系數(shù):定量描述線性相關(guān)程度好壞的常用指標,只適用于兩變量呈線性相關(guān)時。特點:相關(guān)系數(shù)r
是一個無單位的量值,且-1<r<1;
r>0為正相關(guān),r<0為負相關(guān);
r越接近于1,說明相關(guān)性越好;越接近于0,相關(guān)性越差。Spearman等級相關(guān)系數(shù):當數(shù)據(jù)不滿足條件雙變量正態(tài)時。相關(guān)分析簡介
連續(xù)變量的相關(guān)指標(最常見)第四頁,共四十三頁,2022年,8月28日Gamma統(tǒng)計量:描述有序分類變量數(shù)據(jù)聯(lián)系強度的指標,以下指標都是基于Gamma統(tǒng)計量衍生出來的。Kendall‘sTau-b:反映兩個有序分類變量的一致性。Kendall‘sTau-c:對Kendall‘sTau-b進行了校正。相關(guān)分析簡介
有序變量的相關(guān)指標第五頁,共四十三頁,2022年,8月28日列聯(lián)系數(shù):基于2值得出PhiandCramer‘sV:也是基于2值得出Lambda系數(shù):用于反映自變量對因變量的預(yù)測效果不確定系數(shù)相關(guān)分析簡介
名義變量的相關(guān)指標第六頁,共四十三頁,2022年,8月28日EtaKappa值OR、RR等相關(guān)分析簡介
其他相關(guān)指標第七頁,共四十三頁,2022年,8月28日相關(guān)分析簡介
實際上,在Crosstabs過程的statistics子對話框中提供了非常整齊的相關(guān)分析指標體系,如左圖。第八頁,共四十三頁,2022年,8月28日
除了Crosstab過程的statistics子對話框外,SPSS還在statistics菜單的correlation中提供了幾個更專業(yè)的相關(guān)分析過程:Bivariate過程:最常用Partial過程:專門進行偏相關(guān)分析Distances過程:一般不單獨使用,而用于因子分析、聚類分析和多維尺度分析的預(yù)分析相關(guān)分析簡介第九頁,共四十三頁,2022年,8月28日
例1
某醫(yī)院研究某種代乳粉的營養(yǎng)價值是用大白鼠做試驗,得大鼠進食量和體重增量間的關(guān)系的原始數(shù)據(jù)如下,試分析兩者有無直線相關(guān)關(guān)系。(數(shù)據(jù)文件見corr.sav)動物編號12345678910進食量feed820780720867690787934679639820體重增量weight165158130180134167186145120158進食量和體重增量的數(shù)據(jù)簡單相關(guān)分析第十頁,共四十三頁,2022年,8月28日首先繪制散點圖,結(jié)果如下:簡單相關(guān)分析①兩變量間存在線性相關(guān)趨勢②沒有發(fā)現(xiàn)明顯的異常值第十一頁,共四十三頁,2022年,8月28日簡單相關(guān)分析第十二頁,共四十三頁,2022年,8月28日選入希望進行相關(guān)分析的變量選擇相關(guān)分析指標簡單相關(guān)分析第十三頁,共四十三頁,2022年,8月28日簡單相關(guān)分析結(jié)果分析Pearson相關(guān)系數(shù)為0.940,且具有統(tǒng)計學(xué)意義,表明feed和weight有非常密切的關(guān)系,隨著feed的增加,weight也隨之增加。第十四頁,共四十三頁,2022年,8月28日簡單相關(guān)分析
利用上述對話框可以計算秩相關(guān)系數(shù),即spearman相關(guān)系數(shù),對原始數(shù)據(jù)分布不作要求,利用兩變量的秩次關(guān)系作線性相關(guān)分析,適用范圍更廣,但效能也較低。第十五頁,共四十三頁,2022年,8月28日簡單相關(guān)分析結(jié)果分析
對上面的例子計算秩相關(guān)系數(shù)的結(jié)果顯示,秩相關(guān)系數(shù)為0.899,P值<0.001。第十六頁,共四十三頁,2022年,8月28日簡單相關(guān)分析
上述對話框可用于計算kendall’s等級相關(guān)系數(shù),適用于兩變量均為有序分類的情況。第十七頁,共四十三頁,2022年,8月28日簡單相關(guān)分析結(jié)果分析
對上面的例子計算等級相關(guān)系數(shù),結(jié)果顯示,等級相關(guān)系數(shù)為0.750,P值=0.003。注意本例并未違反計算積差相關(guān)系數(shù)的適用條件,這里僅僅是作為演示用。第十八頁,共四十三頁,2022年,8月28日
大家可以發(fā)現(xiàn),對相同的數(shù)據(jù),秩相關(guān)系數(shù)和等級相關(guān)系數(shù)的絕對值均比積差相關(guān)系數(shù)小,為什么?簡單相關(guān)分析
顯然,這是由于在秩變換或數(shù)據(jù)按有序分類處理時損失信息所導(dǎo)致的。第十九頁,共四十三頁,2022年,8月28日
前面介紹的相關(guān)分析是分析兩個計量資料間的關(guān)系,在計算積差相關(guān)系數(shù)、Spearman相關(guān)系數(shù)和Kendall’s相關(guān)系數(shù)的時候,都沒有考慮第三方的影響,這就導(dǎo)致可能對事物的解釋出現(xiàn)偏差。下面以一個例子對此作進一步的說明。偏相關(guān)分析第二十頁,共四十三頁,2022年,8月28日
例2
某地29名13歲男童身高(x1,cm)、體重(x2,kg)及肺活量的實測數(shù)據(jù)文件為partial.sav。試計算其簡單相關(guān)系數(shù)。當體重固定時,計算身高與肺活量的偏相關(guān)系數(shù),并做假設(shè)檢驗。偏相關(guān)分析第二十一頁,共四十三頁,2022年,8月28日偏相關(guān)分析第二十二頁,共四十三頁,2022年,8月28日偏相關(guān)分析選擇需要在偏相關(guān)分析時進行控制的變量。第二十三頁,共四十三頁,2022年,8月28日
選擇Zero-ordercorrelations復(fù)選框,則可以給出包括協(xié)變量在內(nèi)所有變量兩兩相關(guān)的系數(shù)陣。偏相關(guān)分析第二十四頁,共四十三頁,2022年,8月28日偏相關(guān)分析結(jié)果分析
可見,控制了體重的影響后,身高和肺活量之間的關(guān)系無統(tǒng)計學(xué)意義。包括協(xié)變量在內(nèi)所有變量兩兩相關(guān)的系數(shù)陣。第二十五頁,共四十三頁,2022年,8月28日Distance過程
簡單相關(guān)和偏相關(guān)有一個共同點,那就是對所分析的數(shù)據(jù)背景應(yīng)當有一定程度的了解。但有時會遇到一種情況,在分析之前對數(shù)據(jù)所代表的專業(yè)背景知識了解尚不充分,本身就屬于探索性的研究,這時往往就需要先對幾個指標或者案例的差異性、相似程度進行考察,以先對數(shù)據(jù)有一個初步的了解,然后再根據(jù)結(jié)果考慮如何進行深入的分析。第二十六頁,共四十三頁,2022年,8月28日
Distance過程用于計算記錄或變量間的距離(或相似程度),根據(jù)變量的不同類型可以有許多距離、相似程度測量指標供用戶選擇。但由于本模塊只是一個預(yù)分析過程,因此距離分析并不會給出常用的P值,而只給出距離大小,以供用戶自行判斷相似性。Distance過程第二十七頁,共四十三頁,2022年,8月28日
例3
某實驗室制作了一張基因芯片,上面一共檢測了上萬個基因,現(xiàn)在從數(shù)據(jù)庫中提取出7個基因的數(shù)據(jù),由于對這7個基因的生物學(xué)功能現(xiàn)在一無所知,因此首先想對其進行距離測量,看看哪幾個基因“距離”比較接近,然后可以通過臨床或?qū)嶒炇疫M一步驗證。(數(shù)據(jù)見distance.sav。)Distance過程第二十八頁,共四十三頁,2022年,8月28日Distance過程第二十九頁,共四十三頁,2022年,8月28日Distance過程注意選擇該項第三十頁,共四十三頁,2022年,8月28日Distance過程結(jié)果分析
可見,代號為CDK2AP1,TCEB1和IRF2三個基因比較接近,可以粗略的劃為一類,而FPGS,ELF3和GFRA2可以劃為另一類,而NFE2可能作為單獨一類,這樣就可以進一步研究了。第三十一頁,共四十三頁,2022年,8月28日
例4
仍以數(shù)據(jù)corr.sav為例,進一步作回歸分析,計算進食量與體重增量之間的回歸方程。
分析:
與相關(guān)分析類似,在回歸分析之前首先要考慮的問題是兩變量是否存在某種趨勢,通過前面的散點圖已經(jīng)得到了肯定的結(jié)論,因此直接進行回歸分析。簡單回歸分析第三十二頁,共四十三頁,2022年,8月28日繪制散點圖如下:簡單回歸分析①兩變量間存在線性相關(guān)趨勢②沒有發(fā)現(xiàn)明顯的異常值第三十三頁,共四十三頁,2022年,8月28日簡單回歸分析第三十四頁,共四十三頁,2022年,8月28日選擇應(yīng)變量選擇自變量簡單回歸分析第三十五頁,共四十三頁,2022年,8月28日簡單回歸分析結(jié)果分析
對各自變量納入模型情況的匯總,本例只有一個自變量。第三十六頁,共四十三頁,2022年,8月28日簡單回歸分析結(jié)果分析
對模型的簡單匯總,即對回歸方程擬合情況的描述。本例決定系數(shù)為0.883。第三十七頁,共四十三頁,2022年,8月28日簡單回歸分析結(jié)果分析
對模型進行方差分析的結(jié)果,說明模型具有統(tǒng)計學(xué)意義。第三十八頁,共四十三頁,2022年,8月28日最重要簡單回歸分析結(jié)果分析
給出了回歸方程中的常數(shù)項、回歸系數(shù)的估計值和檢驗結(jié)果,可寫出回歸方程如下:體重增量=-17.357+0.222×進食量第三十九頁,共四十三頁,2022年,8月28日小結(jié)
相關(guān)系數(shù)r表示兩變量間的直線相關(guān)程度,r值的范圍為-1~1。r為正表示X與Y之間為正相關(guān),r為負表示負相關(guān)。r接近于0表示兩變量間關(guān)系不密切。但r
有抽樣誤差,故算得相關(guān)系數(shù)之后,必須檢驗相應(yīng)的總體相關(guān)系數(shù)是否為0。第四十頁,共四十三頁,2022年,8月28日小結(jié)
研究中一般只涉及直線相關(guān)關(guān)系,但從理論上講,可以進行變量間的曲線相關(guān)分析;如果希望扣除其他變量的影響,可以進行偏相關(guān)分析;如果變量不滿足線性相關(guān)分析的適用條件,則可以進行Spearman秩相關(guān)分析。第四十一頁,共四十三頁,2022年,8月28日小結(jié)
①在意義和應(yīng)用上,回歸反映兩變量間的依存關(guān)系,相關(guān)反映兩變量間的相互關(guān)系。
②在資料要求上,相關(guān)要求X與Y都是隨機變量,而且服從雙變量正態(tài)分布,這種資料若進行回歸分析,一般稱為Ⅱ型回歸模型。而回歸要求應(yīng)變量Y是隨機變量,服從正態(tài)分布,自變量是固定的非隨機變量,建立的模型稱為Ⅰ型回歸模型。
相關(guān)與回歸既有區(qū)別又有聯(lián)系。第四十二頁,共四十三頁,2022年,8月28日
③相關(guān)系數(shù)和回歸系數(shù)的正負號相同,假設(shè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年實木類家具項目立項申請報告模式
- 2025年跨境電商產(chǎn)業(yè)園項目提案報告模范
- 2025年中介促成的辦公室租賃合同示例
- 2025年公司員工福利與激勵咨詢協(xié)議
- 市政綠化工程申請實施協(xié)議
- 2025年公路護欄維護保養(yǎng)合同范本
- 2025年倉儲調(diào)度員勞動合同范文
- 2025年供熱網(wǎng)絡(luò)運營維護服務(wù)合同示范文本
- 2025年農(nóng)藥使用與安全管理技術(shù)合作協(xié)議
- 2025年勞務(wù)派遣合同分析
- 安踏單店貨品管理資料課件
- 藥店信息處理與保密技巧
- 兩辦意見八硬措施煤礦安全生產(chǎn)條例宣貫學(xué)習課件
- 蒙曼品最美唐詩:全三冊
- 未成年法制安全教育課件
- 鋰電新能源項目融資計劃書
- 《體育與健康說課》課件
- 人教版化學(xué)九年級下冊同步練習:第九單元 溶液
- 眼保健和視覺健康
- 人教版六年級上冊數(shù)學(xué)數(shù)學(xué)期末應(yīng)用題訓(xùn)練(含簡單答案)
- 【基層版】中國房顫中心認證標準
評論
0/150
提交評論