版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二十一章典型相關(guān)分析canonical correlation Analysis兩個(gè)隨機(jī)變量?jī)蓚€(gè)隨機(jī)變量Y Y與與X X 簡(jiǎn)單相關(guān)系數(shù)簡(jiǎn)單相關(guān)系數(shù)一個(gè)隨機(jī)變量一個(gè)隨機(jī)變量Y Y與一組隨機(jī)變量與一組隨機(jī)變量X1, X2, Xp X1, X2, Xp 復(fù)相關(guān)系復(fù)相關(guān)系數(shù)數(shù)( (多重相關(guān)多重相關(guān)) )一組隨機(jī)變量一組隨機(jī)變量Y1Y1,Y2Y2,YqYq與另一組隨機(jī)變量與另一組隨機(jī)變量X1X1,X2X2,Xp Xp 典型相關(guān)系數(shù)典型相關(guān)系數(shù)典型相關(guān)是研究?jī)山M變量之間相關(guān)性的一典型相關(guān)是研究?jī)山M變量之間相關(guān)性的一種統(tǒng)計(jì)分析方法。也是一種降維技術(shù)。種統(tǒng)計(jì)分析方法。也是一種降維技術(shù)。由由Hotelling
2、 (1935, 1936)Hotelling (1935, 1936)最早提出,最早提出,Cooley and Lohnes (1971)Cooley and Lohnes (1971)、 Kshirsagar (1972)Kshirsagar (1972)和和 Mardia, Kent, Mardia, Kent, and Bibby (1979) and Bibby (1979) 推動(dòng)了它的應(yīng)用。推動(dòng)了它的應(yīng)用。第一節(jié)第一節(jié) 典型相關(guān)分析的根本思想典型相關(guān)分析的根本思想典型相關(guān)是簡(jiǎn)單相關(guān)、多重相關(guān)的推廣;或者說(shuō)簡(jiǎn)典型相關(guān)是簡(jiǎn)單相關(guān)、多重相關(guān)的推廣;或者說(shuō)簡(jiǎn)單相關(guān)系數(shù)、復(fù)相關(guān)系數(shù)是典型相關(guān)系
3、數(shù)的特例。單相關(guān)系數(shù)、復(fù)相關(guān)系數(shù)是典型相關(guān)系數(shù)的特例。例:搜集了某年某省男生例:搜集了某年某省男生(1922歲歲)的資料,欲研的資料,欲研究形態(tài)指標(biāo)與機(jī)能指標(biāo)間的相關(guān)性。究形態(tài)指標(biāo)與機(jī)能指標(biāo)間的相關(guān)性。 形態(tài)指標(biāo):身高、坐高、體重、胸圍、肩寬、盆骨形態(tài)指標(biāo):身高、坐高、體重、胸圍、肩寬、盆骨寬;寬; 機(jī)能指標(biāo):脈搏、收縮壓、舒張壓、肺活量。機(jī)能指標(biāo):脈搏、收縮壓、舒張壓、肺活量。典型相關(guān)分析示意圖典型相關(guān)分析示意圖 X1Y1Y2Y3Y4Y5X2X3X4X5X6XYU1U1U2U2U3U3U4U4U5U5V1V1V2V2V3V3V4V4V5V5CanRCanR1 1CanRCanR2 2CanR
4、CanR3 3CanRCanR4 4CanRCanR5 5典型相關(guān)分析典型相關(guān)分析(canonical correlation analysis) :為了研究?jī)山M變量之間的互相關(guān):為了研究?jī)山M變量之間的互相關(guān)系,分別從兩組變量中提取綜合變量為兩系,分別從兩組變量中提取綜合變量為兩個(gè)變量組中各變量的線性組合,并利用各個(gè)變量組中各變量的線性組合,并利用各綜合變量之間的相關(guān)性來(lái)反映兩組指標(biāo)之間綜合變量之間的相關(guān)性來(lái)反映兩組指標(biāo)之間整體相關(guān)性的一種多元統(tǒng)計(jì)分析方法。整體相關(guān)性的一種多元統(tǒng)計(jì)分析方法。第二節(jié)第二節(jié) 典型相關(guān)分析的數(shù)學(xué)模型典型相關(guān)分析的數(shù)學(xué)模型 設(shè)有兩組變量為設(shè)有兩組變量為X1,X2,Xp
5、X1,X2,Xp和和Y1,Y2,YqY1,Y2,Yq,采用主成分思想尋找綜合變量對(duì)即典型,采用主成分思想尋找綜合變量對(duì)即典型( (相關(guān)相關(guān)) )變量變量UiUi,ViVi:11221122ippiqqUa Xa Xa Xa XVb Yb Yb Yb Y8典型相關(guān)變量對(duì)與典型相關(guān)系數(shù):典型相關(guān)變量對(duì)與典型相關(guān)系數(shù):在典型相關(guān)分析中,分別從兩組原始變量中在典型相關(guān)分析中,分別從兩組原始變量中提取的能反映兩組原始變量間整體相關(guān)信息提取的能反映兩組原始變量間整體相關(guān)信息的綜合變量稱(chēng)為典型相關(guān)變量,典型相關(guān)變的綜合變量稱(chēng)為典型相關(guān)變量,典型相關(guān)變量是成對(duì)呈現(xiàn)的,并且是按其反映兩組原始量是成對(duì)呈現(xiàn)的,并且
6、是按其反映兩組原始變量間整體相關(guān)信息量的大小排序的,如變量間整體相關(guān)信息量的大小排序的,如U1U1、V1V1之間的相關(guān)系數(shù)最大,那么稱(chēng)之間的相關(guān)系數(shù)最大,那么稱(chēng)U1U1、V1 V1 為第為第一對(duì)典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱(chēng)一對(duì)典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱(chēng)為第一典型相關(guān)系數(shù),類(lèi)似地有第二對(duì),第為第一典型相關(guān)系數(shù),類(lèi)似地有第二對(duì),第三對(duì),三對(duì),第,第i i對(duì)典型變量和第二、第三,對(duì)典型變量和第二、第三,第第i i典型相關(guān)系數(shù)。典型相關(guān)系數(shù)。典型相關(guān)變量的性質(zhì):典型相關(guān)變量的性質(zhì): 1,1,(1)(,)( ,)0,0,2(,)0,131典型相關(guān)系數(shù)( )【除前面(i)個(gè)CanR之外的最大
7、者】、 的方差為ijijijiiijijCorr U UCorr V VijijijCorr U VijUV10即:即:同一組指標(biāo)的各典型變量同一組指標(biāo)的各典型變量(Ui與與Uj)j=1,2,i-1之間互不相關(guān);之間互不相關(guān);不同組指標(biāo)的典型變量不同組指標(biāo)的典型變量(Ui與與j)(ij)之間互不之間互不相關(guān);相關(guān);各典型變量各典型變量Ui與與j的方差均為;的方差均為;11第三節(jié)第三節(jié) 典型相關(guān)變量及典型相關(guān)系數(shù)的求法典型相關(guān)變量及典型相關(guān)系數(shù)的求法理解理解1.1.對(duì)各原始指標(biāo)數(shù)據(jù)進(jìn)展規(guī)范化。對(duì)各原始指標(biāo)數(shù)據(jù)進(jìn)展規(guī)范化。2.2.求出求出X X,Y Y的相關(guān)矩陣的相關(guān)矩陣XXXX,YYYY及及X
8、X與與Y Y的相關(guān)矩陣的相關(guān)矩陣XY XY 。3.3.求出所有非零根,進(jìn)而求得各典型相關(guān)系數(shù),并按大小順序求出所有非零根,進(jìn)而求得各典型相關(guān)系數(shù),并按大小順序排列。排列。4.4.取最大根取最大根11,進(jìn)而求得非零解,進(jìn)而求得非零解a1a1 (a11,a12 ,a1p (a11,a12 ,a1p ) ,) ,b1 b1 ( b11,b12 ,b1q ) ( b11,b12 ,b1q )5.5.寫(xiě)出第一對(duì)典型相關(guān)變量。寫(xiě)出第一對(duì)典型相關(guān)變量。6.6.求出第求出第i i對(duì)典型相關(guān)變量。對(duì)典型相關(guān)變量。121.0k111112211111 112211ppqqUa Xa Xa Xa XVb Yb Yb
9、 YbY11221 122iiiippiiiiiqqiUa Xa Xa Xa XVb Yb Yb YbY12第四節(jié)第四節(jié) 典型相關(guān)系數(shù)的假設(shè)檢驗(yàn)典型相關(guān)系數(shù)的假設(shè)檢驗(yàn) 假如前假如前m m個(gè)典型相關(guān)系數(shù)在水準(zhǔn)個(gè)典型相關(guān)系數(shù)在水準(zhǔn)下有統(tǒng)計(jì)學(xué)意義,而其下有統(tǒng)計(jì)學(xué)意義,而其余的典型相關(guān)系數(shù)都不具有統(tǒng)計(jì)學(xué)意義,那么可以認(rèn)為余的典型相關(guān)系數(shù)都不具有統(tǒng)計(jì)學(xué)意義,那么可以認(rèn)為m m對(duì)典型相關(guān)變量已經(jīng)把對(duì)典型相關(guān)變量已經(jīng)把X X與與Y Y之間存在的全部相關(guān)信息進(jìn)展之間存在的全部相關(guān)信息進(jìn)展了分解并提取出來(lái)了。了分解并提取出來(lái)了。 假如第一典型相關(guān)系數(shù)假如第一典型相關(guān)系數(shù)11無(wú)統(tǒng)計(jì)學(xué)意義,那么可認(rèn)為兩無(wú)統(tǒng)計(jì)學(xué)意義
10、,那么可認(rèn)為兩組指標(biāo)組指標(biāo)X X與與Y Y之間互不相關(guān),不能進(jìn)展典型相關(guān)分析。之間互不相關(guān),不能進(jìn)展典型相關(guān)分析。 在實(shí)際應(yīng)用中,通常只取第一對(duì)典型相關(guān)變量,因?yàn)榈谝辉趯?shí)際應(yīng)用中,通常只取第一對(duì)典型相關(guān)變量,因?yàn)榈谝粚?duì)相關(guān)變量的專(zhuān)業(yè)意義較為明顯,且足以表達(dá)兩組指標(biāo)間對(duì)相關(guān)變量的專(zhuān)業(yè)意義較為明顯,且足以表達(dá)兩組指標(biāo)間的相關(guān)性。的相關(guān)性。13第五節(jié)第五節(jié) 應(yīng)用實(shí)例應(yīng)用實(shí)例 例例21-1 21-1 為了討論小學(xué)生的生長(zhǎng)發(fā)育指標(biāo)與身體素質(zhì)的互為了討論小學(xué)生的生長(zhǎng)發(fā)育指標(biāo)與身體素質(zhì)的互相關(guān)系,某市對(duì)小學(xué)生的體質(zhì)進(jìn)展調(diào)查。先僅對(duì)相關(guān)系,某市對(duì)小學(xué)生的體質(zhì)進(jìn)展調(diào)查。先僅對(duì)8484例例1010歲歲男孩的四項(xiàng)生
11、長(zhǎng)發(fā)育指標(biāo):肺活量、身高、體重、胸圍與男孩的四項(xiàng)生長(zhǎng)發(fā)育指標(biāo):肺活量、身高、體重、胸圍與四項(xiàng)反映身體素質(zhì)的指標(biāo):四項(xiàng)反映身體素質(zhì)的指標(biāo):50m50m跑、跳高、跳遠(yuǎn)、實(shí)心球擲跑、跳高、跳遠(yuǎn)、實(shí)心球擲遠(yuǎn)進(jìn)展典型相關(guān)分析。遠(yuǎn)進(jìn)展典型相關(guān)分析。編號(hào)編號(hào)肺活量肺活量X1(L)身高身高X2(cm)體重體重X3(kg)胸圍胸圍X4(cm)50m50m跑跑Y1(s)跳高跳高Y2(cm)跳遠(yuǎn)跳遠(yuǎn)Y3(m)實(shí)心球擲實(shí)心球擲遠(yuǎn)遠(yuǎn)Y4(m)11210120.123.861.010.2662.012.7321210120.723.459.811.3681.922.7131040121.222.959.010.1671.
12、922.60831580136.632.367.210.3872.664.04842370147.438.873.010.8912.824.3814SPSS的實(shí)現(xiàn):的實(shí)現(xiàn):1.翻開(kāi)例翻開(kāi)例21-1SPSS數(shù)據(jù)文件數(shù)據(jù)文件2.通過(guò)通過(guò)FileNewDateSyntax翻開(kāi)一個(gè)空白文件,翻開(kāi)一個(gè)空白文件,再在其中鍵入下面命令行:再在其中鍵入下面命令行: include C:Program FilesSPSScanonical correlation.sps. cancorr set1=x1 to x4/ set2=y1 to y4/.3.再點(diǎn)擊一個(gè)向右的三角形圖標(biāo)再點(diǎn)擊一個(gè)向右的三角形圖標(biāo)(運(yùn)行目
13、前程序,運(yùn)行目前程序,Run current),就可以得到所需結(jié)果了。,就可以得到所需結(jié)果了。4.還可以把還可以把Syntax1.sps另以其他名字比如另以其他名字比如tv.sps存存入一個(gè)文件夾。下次使用時(shí)就可以通過(guò)入一個(gè)文件夾。下次使用時(shí)就可以通過(guò)FileOpenSyntax來(lái)翻開(kāi)這個(gè)文件了。來(lái)翻開(kāi)這個(gè)文件了。151.翻開(kāi)SPSS數(shù)據(jù)文件SPSSSPSS操作操作16SPSS操作2.編輯語(yǔ)法編輯語(yǔ)法17編輯語(yǔ)法窗口18結(jié)果結(jié)果各典型相關(guān)系數(shù)依次為:各典型相關(guān)系數(shù)依次為:1=0.886, 2=0.279, 3=0.279, 4=0.038。并由檢驗(yàn)可知,只要第一典型相。并由檢驗(yàn)可知,只要第一典
14、型相關(guān)系數(shù)有統(tǒng)計(jì)學(xué)意義。因而,只取第一對(duì)典型相關(guān)變量。關(guān)系數(shù)有統(tǒng)計(jì)學(xué)意義。因而,只取第一對(duì)典型相關(guān)變量。19原始的U典型相關(guān)變量原始的第一對(duì)典型相關(guān)變量為:原始的V典型相關(guān)變量11234112340.00040.0710.0320.1410.2130.0970.2610.627UXXXXVYYYY 原始的第一對(duì)典型相關(guān)變量為:20規(guī)范化的U典型相關(guān)變量規(guī)范化的V典型相關(guān)變量11234112340.1320.4360.1100.4800.1380.6610.0570.301UXXXXVYYYY 規(guī)范化的的第一對(duì)典型相關(guān)變量為:21 由規(guī)范化的典型相關(guān)變量可得:U1主要受X2和X4的影響,V1那么
15、在Y2和Y4上的權(quán)重較大。說(shuō)明個(gè)子較為高大的男孩在跳高和實(shí)心球擲遠(yuǎn)這兩個(gè)工程上的成果較好。 V第二組原始指標(biāo)第二組原始指標(biāo)50m跑Y1跳高Y2跳遠(yuǎn)Y3實(shí)心球Y4典型相關(guān)典型相關(guān)0.8860.886身高X2體重X3胸圍X4肺活量X1U第一組原始指標(biāo)第一組原始指標(biāo)0.4360.4800.6610.30122對(duì)應(yīng)分析23對(duì)應(yīng)分析:對(duì)應(yīng)分析:簡(jiǎn)單對(duì)應(yīng)分析:兩個(gè)分類(lèi)變量間的類(lèi)別聯(lián)絡(luò)簡(jiǎn)單對(duì)應(yīng)分析:兩個(gè)分類(lèi)變量間的類(lèi)別聯(lián)絡(luò)多重對(duì)應(yīng)分析:多個(gè)分類(lèi)變量間的類(lèi)別聯(lián)絡(luò)多重對(duì)應(yīng)分析:多個(gè)分類(lèi)變量間的類(lèi)別聯(lián)絡(luò)24表表1 3181 318例例COPDCOPD患者的患者的COPDCOPD分級(jí)與中醫(yī)證候分布分級(jí)與中醫(yī)證候分布COPDCOPD分級(jí)分級(jí)肺氣肺氣虛虛脾氣脾氣虛虛腎陽(yáng)腎陽(yáng)虛虛陰陽(yáng)陰陽(yáng)兩虛兩虛腎陰腎陰虛虛痰濁痰濁證證血瘀血瘀證證141412122 20 00 04 40 0aa494925254 40 02 211119 9bb26261715152 24 4171720201212141416167 75 57 72424例:某研究者為了研究COPD 病情分級(jí)與中醫(yī)證候之間的關(guān)系, 對(duì)318 例不同水平的COPD 患者進(jìn)展了中醫(yī)證候分布調(diào)查,結(jié)果見(jiàn)表1:25SummarySummary.447.200.878.87
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年特定區(qū)域獨(dú)家銷(xiāo)售代表合同版B版
- 城市物流園區(qū)停車(chē)場(chǎng)施工合同
- 隧道建設(shè)三方施工合同
- 臨時(shí)文化展覽館租賃合同
- 自行車(chē)店防火門(mén)安裝協(xié)議
- 農(nóng)村自建房屋協(xié)議
- 限時(shí)優(yōu)惠促銷(xiāo)二手房買(mǎi)賣(mài)合同
- 旅游景區(qū)供水井施工合同
- 城市公交站設(shè)施安全合同樣本
- 快遞公司配送司機(jī)勞動(dòng)合同
- 2025蛇年春節(jié)春聯(lián)對(duì)聯(lián)帶橫批(276副)
- 2025年中學(xué)德育工作計(jì)劃
- 2024年專(zhuān)業(yè)會(huì)務(wù)服務(wù)供應(yīng)與采購(gòu)協(xié)議版B版
- 中國(guó)上市公司ESG行動(dòng)報(bào)告
- 早產(chǎn)臨床防治指南(2024版)解讀
- 《電子煙知識(shí)培訓(xùn)》課件
- GB/T 30661.10-2024輪椅車(chē)座椅第10部分:體位支撐裝置的阻燃性要求和試驗(yàn)方法
- 馬克思主義中國(guó)化進(jìn)程與青年學(xué)生使命擔(dān)當(dāng)Ⅱ?qū)W習(xí)通超星期末考試答案章節(jié)答案2024年
- 自動(dòng)化生產(chǎn)線設(shè)備調(diào)試方案
- 2024-2030年中國(guó)醫(yī)藥冷鏈物流行業(yè)競(jìng)爭(zhēng)格局及投資模式研究報(bào)告
- 大數(shù)據(jù)+治理智慧樹(shù)知到期末考試答案章節(jié)答案2024年廣州大學(xué)
評(píng)論
0/150
提交評(píng)論