MATLAB實現(xiàn)主成分分析_第1頁
MATLAB實現(xiàn)主成分分析_第2頁
MATLAB實現(xiàn)主成分分析_第3頁
MATLAB實現(xiàn)主成分分析_第4頁
MATLAB實現(xiàn)主成分分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、利用Matlab編程實現(xiàn)主成分分析1.概述 Matlab語言是當今國際上科學界 (尤其是自動控制領(lǐng)域) 最具影響力、也是最有活力的軟件。它起源于矩陣運算,并已經(jīng)發(fā)展成一種高度集成的計算機語言。它提供了強大的科學運算、靈活的程序設計流程、高質(zhì)量的圖形可視化與界面設計、與其他程序和語言的便捷接口的功能。Matlab 語言在各國高校與研究單位起著重大的作用。主成分分析是把原來多個變量劃為少數(shù)幾個綜合指標的一種統(tǒng)計分析方法,從數(shù)學角度來看,這是一種降維處理技術(shù)。 計算相關(guān)系數(shù)矩陣 (1)在()式中,rij(i,j=1,2,p)為原變量的xi與xj之間的相關(guān)系數(shù),其計算公式為 (2)因為R是實對稱矩陣(

2、即rij=rji),所以只需計算上三角元素或下三角元素即可。 計算特征值與特征向量首先解特征方程,通常用雅可比法(Jacobi)求出特征值,并使其按大小順序排列,即;然后分別求出對應于特征值的特征向量。這里要求=1,即,其中表示向量的第j個分量。 計算主成分貢獻率及累計貢獻率主成分的貢獻率為累計貢獻率為一般取累計貢獻率達8595%的特征值所對應的第一、第二,第m(mp)個主成分。 計算主成分載荷其計算公式為 (3)得到各主成分的載荷以后,還可以按照()式進一步計算,得到各主成分的得分 (4)在軟件Matlab中實現(xiàn)主成分分析可以采取兩種方式實現(xiàn):一是通過編程來實現(xiàn);二是直接調(diào)用Matlab種自

3、帶程序?qū)崿F(xiàn)。下面主要主要介紹利用Matlab的矩陣計算功能編程實現(xiàn)主成分分析。 主函數(shù) 子函數(shù) 用總和標準化法標準化矩陣計算相關(guān)系數(shù)矩陣;計算特征值和特征向量;對主成分進行排序;計算各特征值貢獻率;挑選主成分(累計貢獻率大于85%),輸出主成分個數(shù);計算主成分載荷計算各主成分得分、綜合得分并排序讀入數(shù)據(jù)文件;調(diào)用以上三個函數(shù)并輸出結(jié)果%cwstd.m,用總和標準化法標準化矩陣function std=cwstd(vector)cwsum=sum(vector,1); %對列求和a,b=size(vector); %矩陣大小,a為行數(shù),b為列數(shù)for i=1:a for j=1:b std(i,

4、j)= vector(i,j)/cwsum(j); endendfunction result=cwfac(vector);fprintf(相關(guān)系數(shù)矩陣:n)std=CORRCOEF(vector) %計算相關(guān)系數(shù)矩陣fprintf(特征向量(vec)及特征值(val):n)vec,val=eig(std) %求特征值(val)及特征向量(vec)newval=diag(val) ;y,i=sort(newval) ; %對特征根進行排序,y為排序結(jié)果,i為索引fprintf(特征根排序:n)for z=1:length(y) newy(z)=y(length(y)+1-z);endfprin

5、tf(%gn,newy)rate=y/sum(y);fprintf(n貢獻率:n)newrate=newy/sum(newy)for k=length(y):-1:1 sumrate=sumrate+rate(k); newi(length(y)+1-k)=i(k); if sumrate0.85 break; end end %記下累積貢獻率大85%的特征值的序號放入newi中fprintf(主成分數(shù):%gnn,length(newi);fprintf(主成分載荷:n)for p=1:length(newi) for q=1:length(y) result(q,p)=sqrt(newval

6、(newi(p)*vec(q,newi(p); endend %計算載荷disp(result)%cwscore.m,計算得分function score=cwscore(vector1,vector2);sco=vector1*vector2;csum=sum(sco,2);newcsum,i=sort(-1*csum);newi,j=sort(i);fprintf(計算得分:n)score=sco,csum,j %得分矩陣:sco為各主成分得分;csum為綜合得分;j為排序結(jié)果 function print=cwprint(filename,a,b); %filename為文本文件文件名,

7、a為矩陣行數(shù)(樣本數(shù)),b為矩陣列數(shù)(變量指標數(shù))fid=fopen(filename,r)vector=fscanf(fid,%g,a b);fprintf(標準化結(jié)果如下:n)v1=cwstd(vector)result=cwfac(v1);cwscore(v1,result);中國大陸35個大城市某年的10項社會經(jīng)濟統(tǒng)計指標數(shù)據(jù)見下表。城 市名 稱年底總?cè)丝?萬人) 非農(nóng)業(yè)人口比(%) 農(nóng) 業(yè)總產(chǎn)值(萬元)工業(yè)總產(chǎn)值(萬元)客運總量(萬人)貨運總量(萬噸)地方財政預算內(nèi)收入(萬元)城鄉(xiāng)居民年底儲蓄余額(萬元)在崗職工人數(shù)(萬人)在崗職工工資總額(萬元)北 京118434271999970

8、620323455622790863268066465773301天 津 9150136226455023259263171128073113019312254343石 家 莊29186806885768292919113523487095875758877太 原23603827377501937118952032773943100654023呼和浩特 2365 343816 4522 3512 623105 7831 396 588309 337沈 陽 91 295 4185 826 7337 78215 412567 9199 016 9981 152 811大 連 61 879 7398

9、 426 38510 78019 187709 2277 556 796965 922長 春 81 853 2105 966 3434 8109 532357 0964 803 744884 447哈 爾 濱 72 663 8554 186 1236 7207 520481 4436 450 0201 309 151上 海1 42 069 01954 529 0986 40644 4854 318 50025 971 2005 605 445南 京 1989 19913 072 73714 26911 193664 2995 680 4721 357 861杭 州 61 414 73712 0

10、00 79617 88311 684449 5937 425 9671 180 947寧 波 71 428 23510 622 86622 21510 298501 7235 246 350824 034合 肥 4628 7642 514 1254 8931 517233 6281 622 931369 577福 州 32 152 2886 555 3518 8517 190467 5245 030 220680 607廈 門 5333 3745 751 1243 7282 570418 7582 108 331657 484南 昌 8688 2892 305 8813 6743 189167

11、 7142 640 460479 ,555濟 南 51 486 3026 285 8825 91511 775460 6904 126 970756 696青 島 32 382 32011 492 03613 40817 038658 4354 978 045961 704鄭 州 4677 4255 287 60110 4336 768387 2525 135 338696 848武 漢 91 211 2917 506 0859 79315 442604 6585 748 0551 314 766長 沙 71 146 3673 098 1798 7065 718323 6603 461 244

12、596 986廣 州 41 600 73823 348 13922 00723 8541 761 49920 401 8113 047 594深 圳 1299 66220 368 2958 7544 2741 847 9089 519 9001 890 338南 寧 4720 4861 149 6915 1303 293149 7002 190 918371 809海 口 444 815717 4615 3452 356115 1741 626 800198 138重 慶3 74 168 7808 585 52552 44125 124898,9129 090 9691 606 804成 都1

13、 1 935 5905 894 28940 14019 632561 1897 479 6841 200 671貴 陽 7362 0612 247 93415 7034 143197 9081 787 748419 681昆 明 5793 3563 605 7295 60412 042524 2164 127 900842 321西 安 4739 9053 665 94210 3119 766408 8965 863 980885 169蘭 州 5259 4442 940 8841 8324 749169 5402 641 568550 890西 寧 765 848711 3101 7461

14、46949 134855 051219 251銀 川 9171 603661 2262 1061 19374 758814 103178 621烏魯木齊 478 5131 847 2412 6689 041254 8702 365 508517 622 cwprint(cwbook.txt,35,10)fid =6數(shù)據(jù)標準化結(jié)果如下:v1 =0.0581 0.0356 0.0435 0.0680 0.0557 0.1112 0.1194 0.1184 0.0346 0.0354 0.0770 0.0089 0.0407 0.0139 0.0688 0.0234 0.0080 0.0047 0.

15、0139 0.0391 0.0056 0.0093 0.0053 0.0097 0.0263 0.0086 0.0028 0.0064 0.0064 0.0045 0.0062 0.0315 0.0375 0.0305 0.0198 0.0213 0.0253 0.0295 0.0443 0.0286 0.0295 0.0321 0.0431 0.0276 0.0628 0.0142 0.0610 0.0440 0.0488 0.1853 0.0176 0.1086 0.1848 0.1148 0.0250 0.0318 0.0233 0.0444 0.0391 0.0286 0.0250 0

16、.0152 0.0337 0.0361 0.0609 0.0251 0.0259 0.0327 0.0286 0.0344 0.0271 0.0185 0.0270 0.0105 0.0239 0.0140 0.0139 0.0056 0.0133 0.0025 0.0497 0.1428 0.0123 0.0983 0.0292 0.1437 0.0466 0.0199 0.0456 0.0200 0.1100 0.0479 0.0149 0.0220 0.0313 0.0244 0.0174 0.0125 0.0283 0.0238 0.0175 0.0259 0.0300 0.0213

17、0.0134 0.0062 0.0074 相關(guān)系數(shù)矩陣:std =1.0000 -0.3444 0.8425 0.3603 0.7390 0.6215 0.4039 0.4967 0.6761 -0.3444 -0.4750 -0.3539 0.1971 0.3571 0.2600 0.1570 0.8425 -0.4750 1.0000 0.3358 0.5891 0.5056 0.3236 0.4456 0.5575 0.3603 0.3096 0.3358 1.0000 0.1507 0.7664 0.9412 0.8480 0.7320 0.7390 -0.3539 0.5891 0.

18、1507 1.0000 0.4294 0.1971 0.3182 0.3893 0.6215 0.1971 0.5056 0.7664 0.4294 1.0000 0.8316 0.8966 0.9302 0.4039 0.3571 0.3236 0.9412 0.1971 0.8316 1.0000 0.9233 0.8376 0.4967 0.2600 0.4456 0.8480 0.6761 0.4689 0.3090 特征向量(vec):vec =-0.1367 0.2282 -0.2628 0.1939 0.6371 -0.2163 0.3176 -0.0329 -0.0217 0.

19、0009 0.0446 -0.1447 -0.4437 0.4058 -0.0522 -0.0280 0.2040 -0.0492 -0.5472 -0.4225 0.3440 0.3188 -0.4438 0.2401 0.0067 -0.4176 -0.2856 -0.2389 0.1926 -0.4915 -0.4189 0.2726 0.2065 0.3403 0.0404 0.1408 0.0896 0.0380 -0.1969 -0.0437 -0.0343 0.2360 0.2981 0.4739 0.5685 0.2358 0.1465 -0.1502 -0.2631 0.12

20、45 0.4879 -0.5707 0.1217 0.1761 0.0987 0.3550 0.3280 -0.7894 -0.1628 0.1925 0.2510 -0.0422 0.2694 0.0396 0.0456 0.1668 特征值(val)val =0.0039 0 0 0 0 0 0 0 0 00 0.0240 0 0 0 0 0 0 0 00 0 0.0307 0 0 0 0 0 0 0 0 0 0 0.0991 0 0 0 0 0 0 0 0 0 0 0.1232 0 0 0 0 0 0 0 0 0 0 0.2566 0 0 0 00 0 0 0 0 0 0.3207 0

21、0 00 0 0 0 0 0 0 0.5300 0 00 0 0 0 0 0 0 0 2.3514 00 0 0 特征根排序:各主成分貢獻率:newrate =第一、二主成分的載荷: 第一、二、三、四主成分的得分:score = 4 7 4 0 1 8, 1 843 427, 19 999 706, 20 323, 45 562, 2 790 863, 26 806 646, 410.80, 5 773 301 9, 1 501 136, 22 645 502, 3 259, 26 317, 1 128 073, 11 301 931, 202.68, 2 254 343 2, 2 918 6

22、80, 6 885 768, 2 929, 1 911, 352 348, 7 095 875, 95.60, 758 877 3, 236 038, 2 737 750, 1 937, 11 895, 203 277, 3 943 100, 88.65, 654 023 2, 365 343, 816 452, 2 351, 2 623, 105 783, 1 396 588, 42.11, 309 337 9, 1 295 418, 5 826 733, 7 782, 15 412, 567 919, 9 016 998, 135.45, 1 152 811 6, 1 879 739, 8

23、 426 385, 10 780, 19 187, 709 227, 7 556 796, 94.15, 965 922 8, 1 853 210, 5 966 343, 4 810, 9 532, 357 096, 4 803 744, 102.63, 884 447 7, 2 663 855, 4 186 123, 6 720, 7 520, 481 443, 6 450 020, 172.79, 1 309 1511 4, 2 069 019, 54 529 098, 6 406, 44 485, 4 318 500, 25 971 200, 336.84, 5 605 445 1, 9

24、89 199, 13 072 737, 14 269, 11 193, 664 299, 5 680 472, 113.81, 1 357 861 6, 1 414 737, 12 000 796, 17 883, 11 684, 449 593, 7 425 967, 96.90, 1 180 947 7, 1 428 235, 10 622 866, 22 215, 10 298, 501 723, 5 246 350, 62.15, 824 034 4, 628 764, 2 514 125, 4 893, 1 517, 233 628, 1 622 931, 47.27, 369 57

25、7 3, 2 152 288, 6 555 351, 8 851, 7 190, 467 524, 5 030 220, 69.59, 680 607 5, 333 374, 5 751 124, 3 728, 2 570, 418 758, 2 108 331, 46.93, 657 484 8, 688 289, 2 305 881, 3 674, 3 189, 167 714, 2 640 460, 62.08, 479 ,555 5, 1 486 302, 6 285 882, 5 915, 11 775, 460 690, 4 126 970, 83.31, 756 696 3, 2

26、 382 320, 11 492 036, 13 408, 17 038, 658 435, 4 978 045, 103.52, 961 704 4, 677 425, 5 287 601, 10 433, 6 768, 387 252, 5 135 338, 84.66, 696 848 9, 1 211 291, 7 506 085, 9 793, 15 442, 604 658, 5 748 055, 149.20, 1 314 766 7, 1 146 367, 3 098 179, 8 706, 5 718, 323 660, 3 461 244, 69.57, 596 986 4

27、, 1 600 738, 23 348 139, 22 007, 23 854, 1 761 499, 20 401 811, 182.81, 3 047 594 1, 299 662, 20 368 295, 8 754, 4 274, 1 847 908, 9 519 900, 91.26, 1 890 338 4, 720 486, 1 149 691, 5 130, 3 293, 149 700, 2 190 918, 45.09, 371 809 4, 44 815, 717 461, 5 345, 2 356, 115 174, 1 626 800, 19.01, 198 1383

28、 7, 4 168 780, 8 585 525, 52 441, 25 124, 898,912, 9 090 969, 223.73, 1 606 8041 003.56, 0.335, 1 935 590, 5 894 289, 40 140, 19 632, 561 189, 7 479 684, 132.89, 1 200 671 7, 362 061, 2 247 934, 15 703, 4 143, 197 908, 1 787 748, 55.28, 419 681 5, 793 356, 3 605 729, 5 604, 12 042, 524 216, 4 127 90

29、0, 88.11, 842 321 4, 739 905, 3 665 942, 10 311, 9 766, 408 896, 5 863 980, 114.01, 885 169 5, 259 444, 2 940 884, 1 832, 4 749, 169 540, 2 641 568, 65.83, 550 890 7, 65 848, 711 310, 1 746, 1 469, 49 134, 855 051, 27.21, 219 251 9, 171 603, 661 226, 2 106, 1 193, 74 758, 814 103, 23.72, 178 621 4,

30、78 513, 1 847 241, 2 668, 9 041, 254 870, 2 365 508, 55.27, 517 622另外再附上兩種主成分分析方法:第一種方法:用matlab的各個函數(shù)組合得到的結(jié)果:clc;clear;X=281110050;5 2120012;10 9101020;4 8 70062;31 2 20072;4 1 11000.5 1;5 1 110030;26 7 40062;p=mean(X); %每一列的平均值pq=repmat(p,8,1);b=std(X); %每一列的標準差bq=repmat(b,8,1);ding = (X-pq)./bq;%標準化矩陣dd =cov(ding);%協(xié)方差計算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論