matlab與應(yīng)用多元統(tǒng)計分析_第1頁
matlab與應(yīng)用多元統(tǒng)計分析_第2頁
matlab與應(yīng)用多元統(tǒng)計分析_第3頁
matlab與應(yīng)用多元統(tǒng)計分析_第4頁
matlab與應(yīng)用多元統(tǒng)計分析_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、多元統(tǒng)計分析中的應(yīng)用研究 ,摘要:許多實際問題往往需要對數(shù)據(jù)進(jìn)行統(tǒng)計分析,建立合適的統(tǒng)計模型,過去一般采用SAS 、SPSS軟件分析,本文給出 Matlab軟件在多元統(tǒng)計分析上的應(yīng)用, 主要介紹Matlab在聚類分析、判別分析、主成份分析上的應(yīng)用,文中均給以實例, 結(jié)果令人滿意。關(guān)鍵詞:Matlab軟件;聚類分析;主成份分析Research for application of Multivariate Statistical AnalysisAbstract:Many practice question sometimes need Statistical Analysis to data.

2、,and establish appropriate Statistical model SAS and SPSS software were commonly used in foretime ,this paper give the application of Matlab software in Multivariate Statistical Analysis,mostly introduce the application of Matlab software in priciple component analysis and cluster analysis and diffe

3、rentiate analysis.The example are given in writing and the result are satisfaction.Key words: Matlab software; cluster analysis; priciple component analysis0 引言 許多實際問題往往需要對數(shù)據(jù)進(jìn)行多元統(tǒng)計分析, 建立合適的模型, 在多元統(tǒng)計分析方面, 常用的軟件有SAS 、SPSS 、S-PLUS等 。我們在這里給出Matlab在多元統(tǒng)計分析上的應(yīng)用, 在較早的版本中, 統(tǒng)計功能不那么強(qiáng)大, 而在Matlab6.x版本中, 僅在統(tǒng)計工具中的

4、功能函數(shù)就達(dá)200多個, 功能 已 足 以 趕超任何其他專用的統(tǒng)計軟件,在應(yīng)用上Matlab具有其他軟件不可比擬的操作簡單,接口方便, 擴(kuò)充能力強(qiáng)等優(yōu)勢, 再加上Matlab的應(yīng)用范圍廣泛, 因此可以預(yù)見其在統(tǒng)計應(yīng)用上越來越占有極其重要的地位,下面用實例給出Matlab在聚類分析、主成份分析上的應(yīng)用。1 聚類分析 聚類分析法是一門多元統(tǒng)計分類法,其目的是把分類對象按一定規(guī)則分成若干類,所分成的類是根據(jù)數(shù)據(jù)本身的特征確定的。聚類分析法根據(jù)變量(或樣品或指標(biāo))的屬性或特征的相似性,用數(shù)學(xué)方法把他們逐步地劃類,最后得到一個能反映樣品之間或指標(biāo)之間親疏關(guān)系的客觀分類系統(tǒng)圖, 稱為譜系聚類圖。聚類分析的

5、步驟有:數(shù)據(jù)變換,計算個樣品的兩兩間的距離,先分為一類,在剩下的個樣品計算距離,按照不同距離最小的原則,增加分類的個數(shù),減少所需要分類的樣品的個數(shù),循環(huán)進(jìn)行下去,直到類的總個數(shù)為 時止。根據(jù)類之間的距離,畫出譜系聚類圖。我們對杭州所轄張家港市2005年七條河流中主要污染因子(指標(biāo))即CODmn,BOD5, 非離子氨,氨氮,揮發(fā)酚, 石油類共6個變量(資料見表1, 來源于張家港市2003年環(huán)境質(zhì)量報告書) ,進(jìn)行聚類分析。表1 港2005年七條河流主要污染因子河流CODmnBOD5非離子氮氨氮揮發(fā)酚石油類類型張家港河 二干河?xùn)|橫河 橫套河 四干河 華妙河 鹽鐵塘3.145.473.15.676.

6、816.214.878.419.574.319.549.057.088.9723.7826.4821.210.2316.1821.0526.5425.7923.7922.4820.8724.5631.5634.564.176.425.344.25.26.155.586.475.586.546.85.458.218.073131122我們利用Matlab6.5中的cluster命令實現(xiàn),具體程序如下3.145.473.15.676.816.214.878.419.574.319.549.057.088.9723.7826.4821.210.2316.1821.0526.5425.7923.792

7、2.4820.8724.5631.5634.564.176.425.344.25.26.155.586.475.586.546.85.458.218.07 x= n,m=size(x);Stdr=std(x);xx=x./stdr(ones(n,1),;); % 標(biāo)準(zhǔn)化變換y=pdist(xx); %計算各樣本間距離(這里為歐氏距離) z=linkage(y); %進(jìn)行聚類(這里為最短距離法)h=dendrogram(z); %畫聚類譜系圖t=cluster(z,3) % 將全部樣本分為3類find(t=2); %找出屬于第2類的樣品編號執(zhí)行后得到所要結(jié)果 聚類譜系圖見圖1t=3,1,3,1,

8、1,2,2 即全部樣本分為3類。結(jié)果見表1 從圖 1可以看出:七條河流中, 二干河、橫套河、四干河屬于一類, 污染較重, 主要是CODmn、BOD5超標(biāo)多; 華妙河、鹽鐵塘屬于一類, 污染一般, 主要是氨氮、石油類超標(biāo); 張家港河、東橫河屬于一類,污染較輕, 總的來說,各河流都存在不同程度的污染,因此全市應(yīng)對各河流嚴(yán)格監(jiān)督管理, 著力實施水污染防治工作, 太湖流域水污染源應(yīng)限期治理達(dá)標(biāo)排放, 鞏固水污染防治工作成果,加大投入,新建或改、 擴(kuò)建廢水治理工程, 確保達(dá)標(biāo)排放。 圖1 :聚類譜系圖 ,2 主成分分析 主成分分析是將多個指標(biāo)化為少數(shù)幾個綜合指標(biāo)的一種多元統(tǒng)計分析方法。對于實際工作中遇到

9、的多指標(biāo)系統(tǒng)評估問題,主成分分析可以將多個指標(biāo)綜合為單個指數(shù)的形式。主成分的計算步驟如下:第一步,原始數(shù)據(jù)零均值標(biāo)準(zhǔn)化。設(shè)每個指標(biāo)的樣本數(shù)據(jù)為xi,1,xi,2,Lxi,Nxi,1,xi,2,Lxi,N.作如下變換,令x'ij=(xij- x i)/Si(i=1,2,L,P; j=1,2,L,N)第二步,計算相關(guān)矩陣R=(rij),其中第三步,求矩陣R 的特征值i 與相應(yīng)的標(biāo)準(zhǔn)正交化的特征向量Ai。第四步,計算第j 個主成分yi 的貢獻(xiàn)率當(dāng)前q 個主成分(即新的綜合指標(biāo)) 的累積貢獻(xiàn)率超過85%時,就提取前q 個主成分作為評價指標(biāo),它們保持原始數(shù)據(jù)總信息量的85%以上。這里給出江蘇省生

10、態(tài)城市主成份分析實例城市環(huán)境生態(tài)化是城市發(fā)展的必然趁勢, 表現(xiàn)為社會、經(jīng)濟(jì)、環(huán)境與生態(tài)全方位的現(xiàn)代化水平, 一個符合生態(tài)規(guī)律的生態(tài)城市應(yīng)該是結(jié)構(gòu)合理、功能高效和關(guān)系協(xié)調(diào)的城市生態(tài)系統(tǒng)所謂結(jié)構(gòu)合理是指適度的人口密度, 合理的土地利用, 良好的環(huán)境質(zhì)量, 充足的綠地系統(tǒng), 完善的基礎(chǔ)設(shè)施, 有效的自然保護(hù)功能高效是指資源的優(yōu)化配置、物力的經(jīng)濟(jì)投入、人力的充分發(fā)揮、物流的暢通有序、信息流的快捷關(guān)系協(xié)調(diào)是指人和自然協(xié)調(diào)、社會關(guān)系協(xié)調(diào)、城鄉(xiāng)協(xié)調(diào)、資源利用和更新協(xié)調(diào)一個城市要實現(xiàn)生態(tài)城市的發(fā)展目標(biāo), 關(guān)鍵是在市場經(jīng)濟(jì)的體制下逐步改善城市的生態(tài)環(huán)境質(zhì)量, 防止生態(tài)環(huán)境質(zhì)量惡化, 因此, 對城市的生態(tài)環(huán)境水平

11、調(diào)查評價很有必要。我們對江蘇省十個城市的生態(tài)環(huán)境狀況進(jìn)行了調(diào)查, 得到生態(tài)環(huán)境指標(biāo)的指數(shù)值, 見表2?,F(xiàn)對生態(tài)環(huán)境水平分析和評價表2 指標(biāo)指數(shù)值我們利用Matlab6.5中的princomp命令實現(xiàn),具體程序如下x=xstdr=std(x); %求各變量標(biāo)準(zhǔn)差n,m=size(x);Sddsta=x./stdr(ones(n,1),:); % 標(biāo)準(zhǔn)化變換p,princ,egenvalue=princomp(sddata) %調(diào)用主成分分析程序P3=(:,1:3) %輸出前三個主成分系數(shù)sc=princ(:,1:3) %輸出前三個主成分得分egenvalue %輸出特征根per=100* ege

12、nvalue/sum(egenvalue) %輸出各個主成分貢獻(xiàn)率執(zhí)行后得到所要結(jié)果, 這里是前三個主成分、主成分得分、特征根即Egenvalue=3.8811,2.6407,1.0597, per=43.12,29.34,11.97這樣, 前三個主成分為Z1=-0.3677x1+0.3702x2+0.1364x3+0.4048x4+0.3355x5-0.1318x6+0.4236x7+0.4815x8-0.0643x9Z2=0.1442x1+0.2313x2-0.5299x3+0.1812x4-0.1601x5+0.5273x6+0.3116x7-0.0267x8+0.4589x9Z3=-0

13、.3282x1-0.3535x2+0.0498x3+0.0582x4+0.5664x5-0.0270x6-0.0958x7-0.2804x8+0.5933x9第一主成分貢獻(xiàn)率為43.12%,第二主成分貢獻(xiàn)率為29.34%, 第三主成分貢獻(xiàn)率為11.97%,前三個主成分累計貢獻(xiàn)率達(dá)84.24%如果按80%以上的信息量選取新因子, 則可以選取前三個新因子第一新因子Z1包含的信息量最大為43.12%, 它的主要代表變量為X8(城市文明)、X7(生產(chǎn)效率)、X4(城市綠化), 其權(quán)重系數(shù)分別為0.4815、0.4236、0.4048, 反映了這三個變量與生態(tài)環(huán)境水平密切相關(guān),第二新因子Z2包含的信息量

14、次之為29.34%, 它的主要代表變量為X3(地理結(jié)構(gòu))、X6(資源配置)、X9(可持續(xù)性), 其權(quán)重系數(shù)分別為0.5299、0.5273、0.4589, 第三新因子Z3包含的信息量為11.97%, 代表總量為X9(可持續(xù)性)、X5(物質(zhì)還原), 權(quán)重系數(shù)分別為0.5933、0.5664這些代表變量反映了各自對該新因子作用的大小, 它們是生態(tài)環(huán)境系統(tǒng)中最重要的影響因素。根據(jù)前三個主成分得分, 用其貢獻(xiàn)率加權(quán), 即得十個城市各自的總得分F=43.12%princ(:,1)+29.34% princ(:,2)+11.97% princ(:,3)=0.0970,-0.6069,-1.5170,1.1801,0.0640,-0.8178,-0.9562,1.1383,0.1107,1.3077根據(jù)總得分排序, 結(jié)果見表2參考文獻(xiàn)1 高惠璇. 應(yīng)用多元統(tǒng)計分析M . 北京:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論