改進(jìn)主成分分析方法在水質(zhì)污染評(píng)價(jià)中的應(yīng)用_第1頁
改進(jìn)主成分分析方法在水質(zhì)污染評(píng)價(jià)中的應(yīng)用_第2頁
改進(jìn)主成分分析方法在水質(zhì)污染評(píng)價(jià)中的應(yīng)用_第3頁
改進(jìn)主成分分析方法在水質(zhì)污染評(píng)價(jià)中的應(yīng)用_第4頁
改進(jìn)主成分分析方法在水質(zhì)污染評(píng)價(jià)中的應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

改進(jìn)主成分分析方法在水質(zhì)污染評(píng)價(jià)中的應(yīng)用

水環(huán)境評(píng)價(jià)是環(huán)境質(zhì)量評(píng)價(jià)的主要內(nèi)容。評(píng)價(jià)中常用的數(shù)學(xué)方法包括簡(jiǎn)單指數(shù)法、分類加權(quán)法、普通概率法和模糊法。由于水質(zhì)系統(tǒng)是由各種污染指標(biāo)變量組成的復(fù)雜系統(tǒng),各個(gè)因子之間具有不同程度的相關(guān)性,每一因子都只從某一方面反映水質(zhì)質(zhì)量,因此依據(jù)它們作綜合評(píng)價(jià)有一定的難度。主成分分析方法正是一種將多維因子納入同一系統(tǒng)進(jìn)行定量化研究,且理論比較完善的多元統(tǒng)計(jì)分析方法,在解決很多實(shí)際問題時(shí)已取得較好效果。在計(jì)算機(jī)軟硬件的支持下,將改進(jìn)后的主成分分析方法應(yīng)用于湖泊的水質(zhì)污染程度的綜合評(píng)價(jià)之中,計(jì)算簡(jiǎn)便,在可比性、定量定性分析結(jié)合程度、指標(biāo)權(quán)重選取等方面較其他方法有一定優(yōu)越性。1改進(jìn)的主成分分析1.1改進(jìn)的傳統(tǒng)主要部件評(píng)估方法1.1.1多個(gè)主成分的加權(quán)綜合對(duì)于一些與評(píng)價(jià)目標(biāo)成反比的指標(biāo),大多數(shù)文獻(xiàn)在計(jì)算中采用的正逆變換方法是倒數(shù)法,但采用這種方法對(duì)主成分評(píng)價(jià)結(jié)論是有一定影響的。對(duì)于只用第一主成分排序,這種影響相對(duì)小一些,因?yàn)榈谝恢鞒煞肿⒅孛總€(gè)變量的“大小”,正逆變換只是使相應(yīng)的權(quán)系數(shù)符號(hào)改變。但是多個(gè)主成分的加權(quán)綜合卻會(huì)受到很大的影響,原因是指標(biāo)正逆變換其實(shí)改變了Pearson線性相關(guān)系數(shù),從而特征根與特征向量也產(chǎn)主了變動(dòng),據(jù)其進(jìn)行的評(píng)價(jià)就可能出現(xiàn)變動(dòng)。也可以說,指標(biāo)正逆形式變動(dòng)對(duì)“形態(tài)因子”的影響很大。一個(gè)解決的辦法是將這些指標(biāo)進(jìn)行線性變換,即不改變?cè)嫉闹笜?biāo)變量之間的線性關(guān)系,對(duì)主成分綜合評(píng)價(jià)的結(jié)論也就不會(huì)產(chǎn)生影響??稍O(shè)線性變換函數(shù)為x′=a+bx,參數(shù)a、b通常根據(jù)兩個(gè)臨界點(diǎn)(即滿分點(diǎn)與不合格點(diǎn))的取值來確定,也可以選擇兩個(gè)比較有代表意義的指標(biāo)取值為參照系,利用兩點(diǎn)一線原則即可確定參數(shù)。1.1.2主成分分析傳統(tǒng)的主成分分析將標(biāo)準(zhǔn)化作為惟一的無量綱化方法,主成分都是表示成為標(biāo)準(zhǔn)化變量的加權(quán)算術(shù)平均值,這屬于線性主成分。當(dāng)原始變量之間呈現(xiàn)的是一種非線性關(guān)系時(shí),傳統(tǒng)主成分分析方法就不太合適。由于Pearson直線相關(guān)系數(shù)無法體現(xiàn)非線性相關(guān)關(guān)系,從而第一主成分的方差貢獻(xiàn)率將比較低,因此對(duì)于主成分分析法,也應(yīng)該考慮非線性的關(guān)系。具體的實(shí)施公式為:yi=lnxi-ˉlnxiyi=lnxi?lnxiˉˉˉˉˉˉ這樣,對(duì)數(shù)化后第一主成分可表示為:Ζ=a1(lnx1-ˉlnx1)+a2(lnx2-ˉlnx2)+ap(lnxp-ˉlnxp)=a1(lnx1-lnG1)+a2(lnx2-lnG2)+?+ap(lnxp-lnGp)=a1ln(x1/G1)+a2ln(x2/G2)+?+apln(xp/Gp)Z=a1(lnx1?lnx1ˉˉˉˉˉˉ)+a2(lnx2?lnx2ˉˉˉˉˉˉ)+ap(lnxp?lnxpˉˉˉˉˉˉ)=a1(lnx1?lnG1)+a2(lnx2?lnG2)+?+ap(lnxp?lnGp)=a1ln(x1/G1)+a2ln(x2/G2)+?+apln(xp/Gp)式中,Z是對(duì)原始變量幾何均值化的加權(quán)幾何平均;Gi為相應(yīng)的幾何平均值。對(duì)原始監(jiān)測(cè)數(shù)據(jù)進(jìn)行對(duì)數(shù)化預(yù)處理,從本質(zhì)上看,已不再是對(duì)原始數(shù)據(jù)進(jìn)行主成分分析,而是對(duì)“對(duì)數(shù)變換值”進(jìn)行主成分綜合評(píng)價(jià),或者說,它實(shí)質(zhì)上是一種非線性的綜合評(píng)價(jià)。如果說線性綜合評(píng)價(jià)屬于算術(shù)平均合成,則對(duì)數(shù)化預(yù)處理實(shí)質(zhì)上是“幾何平均合成模型”。1.1.3水學(xué)模型中的主成分是小方面的綜合評(píng)價(jià)文獻(xiàn)大多依據(jù)主成分的方差貢獻(xiàn)率的多少來選擇評(píng)價(jià)指標(biāo),例如當(dāng)?shù)谝恢鞒煞值姆讲钬暙I(xiàn)率大于80%時(shí),只采用第一主成分來進(jìn)行綜合評(píng)價(jià)即可;而當(dāng)?shù)谝恢鞒煞值姆讲钬暙I(xiàn)率小于80%時(shí),則需要按照貢獻(xiàn)率的大小,依次將前幾個(gè)主成分進(jìn)行線性加權(quán)綜合,使得方差貢獻(xiàn)率的總和超過80%。由于每一個(gè)主成分都代表了一個(gè)方向,一個(gè)與其他所有主成分正交的方向,所以多個(gè)主成分的正權(quán)線性平均的結(jié)果就是多個(gè)相互獨(dú)立的隨機(jī)變量線性組合。根據(jù)隨機(jī)變量線性組合的方差原理可知,這種組合由于兩兩相關(guān)系數(shù)為零而起不到使組合后的方差得以倍增的效果。根據(jù)主成分分析法的理論可以知道,第一主成分總是與各指標(biāo)大小有關(guān),通常稱之為“大小因子”,而水質(zhì)質(zhì)量的綜合評(píng)價(jià)正是一種“大小”評(píng)價(jià),因此第一主成分的評(píng)價(jià)意義是無可非議的,它所揭示的信息的確全部屬于評(píng)價(jià)信息。第二及更后面的主成分都是一些“形狀因子”,它們反映的是各個(gè)指標(biāo)集合中某些“特征信息”而不是“綜合評(píng)價(jià)信息”,其數(shù)值的大小一般不能代表評(píng)價(jià)對(duì)象的“好壞”或“高低”。因此將其他主成分也納入綜合評(píng)價(jià)值計(jì)算體系是很不合理的,其結(jié)果是對(duì)那些“具備某些特定特征”的指標(biāo)有利,而對(duì)那些不具備這種特征的指標(biāo)不利,這絕對(duì)不是綜合評(píng)價(jià)的本意。如果要反映這種特征,則干脆將全部主成分都計(jì)算在綜合評(píng)價(jià)值之內(nèi),這樣才是公平的,否則對(duì)有些指標(biāo)個(gè)體是很不公平的。因此本文主張選擇評(píng)價(jià)指標(biāo)要么只用第一主成分,要么就包括所有主成分,而不是只取前幾位的主成分以達(dá)到提高方差貢獻(xiàn)率的目的。一般說來,若第一主成分的方差貢獻(xiàn)率超過80%,它在較大程度上就全面綜合了各指標(biāo)的信息,這時(shí)可以考慮將第一主成分作為惟一評(píng)價(jià)指標(biāo)。因?yàn)樗亲钅軈^(qū)分原始樣本點(diǎn)的一個(gè)方向,其他任何線性組合的結(jié)果都不可能比這個(gè)主成分具有更大的區(qū)分度,在此情況下評(píng)價(jià)結(jié)果的置信度大于80%。在第一主成分貢獻(xiàn)率較低(低于80%)的情況下,第一主成分作為惟一評(píng)價(jià)指標(biāo)就不再合適了,應(yīng)采用所有主成分進(jìn)行評(píng)價(jià)以便提高評(píng)價(jià)結(jié)果的置信水平。此時(shí),可以逐個(gè)分析各個(gè)主成分所對(duì)應(yīng)的特征向量,當(dāng)原始各指標(biāo)對(duì)綜合指標(biāo)都為正指標(biāo)時(shí),特征向量ui中系數(shù)絕對(duì)值較大者應(yīng)有同樣的符號(hào)且都為正值。若系數(shù)絕對(duì)值較大者都為負(fù)值,也就是說該主成分與評(píng)價(jià)指數(shù)是負(fù)相關(guān)的,此時(shí)應(yīng)把相應(yīng)特征向量改向,使主成分成為-zi,再與其他主成分綜合。1.2前始數(shù)據(jù)的計(jì)算1)為了排除數(shù)量級(jí)和量綱不同帶來的影響,首先對(duì)原始指標(biāo)數(shù)據(jù)矩陣(xij)m×n進(jìn)行對(duì)數(shù)化處理:yij=lnxij-1nn∑k=1lnxik(1)yij=lnxij?1n∑k=1nlnxik(1)式中,xij為第i個(gè)分區(qū)第j個(gè)指標(biāo)的原始數(shù)據(jù)。2)根據(jù)對(duì)數(shù)化后的矩陣(yij)m×n,計(jì)算它的協(xié)方差矩陣S=(sij)n×n。3)計(jì)算矩陣S的特征值和特征向量。根據(jù)特征方程|s-λI|=0,計(jì)算特征根λi,并使其從大到小排列:λ1≥λ2≥…≥λp,同時(shí)可以得到對(duì)應(yīng)的特征向量u1,u2,…,up,它們標(biāo)準(zhǔn)正交,u1,u2,…,up為主軸。4)計(jì)算貢獻(xiàn)率ei:ei=λi/p∑i=1λi(2)ei=λi/∑i=1pλi(2)5)計(jì)算主成分Zi:Ζi=p∑i=1p∑j=1yijuii(3)Zi=∑i=1p∑j=1pyijuii(3)6)根據(jù)貢獻(xiàn)率e1的大小來進(jìn)行判斷:當(dāng)e1≥80%時(shí),直接用第一主成分來進(jìn)行綜合評(píng)價(jià)即可;當(dāng)e1<80%時(shí),對(duì)所有的t個(gè)主成分利用公式Ζ=t∑i=1eiziZ=∑i=1teizi進(jìn)行綜合評(píng)價(jià)分析。2湖北及全國生態(tài)城市類水環(huán)境綜合評(píng)價(jià)作為中國最大的城中湖,武漢市東湖的總體水質(zhì)為劣V類,但各個(gè)子湖具體的污染狀況又各不相同。為了制定東湖的環(huán)境規(guī)劃并進(jìn)行有針對(duì)性的治理,分別對(duì)各個(gè)子湖的水質(zhì)質(zhì)量進(jìn)行評(píng)價(jià)是有必要的。表1為2000年武漢市東湖的17個(gè)水質(zhì)指標(biāo)的監(jiān)測(cè)值,監(jiān)測(cè)點(diǎn)分別為各個(gè)子湖的湖心。由于溶解氧與湖泊水質(zhì)的污染程度呈反比,所以首先對(duì)溶解氧指標(biāo)值進(jìn)行線性變換,構(gòu)造一個(gè)變換函數(shù)x′=a+bx。根據(jù)地面水環(huán)境質(zhì)量標(biāo)準(zhǔn)GB3838-88,給Ⅱ類水(含溶解氧6mg/L)賦值為6,V類水(含溶解氧2mg/L)賦值為10,利用兩點(diǎn)一線原則可確定a=12,b=-1。變換后的溶解氧指標(biāo)與其余指標(biāo)一同構(gòu)成評(píng)價(jià)指標(biāo)矩陣(xij)5×17。將(xij)5×17利用公式(1)進(jìn)行對(duì)數(shù)變換得(yij)5×17,計(jì)算得出其協(xié)方差矩陣S的特征根和特征向量。最后根據(jù)公式(2)可得貢獻(xiàn)率。從表2可以看出,運(yùn)用改進(jìn)后的主成分分析法作水質(zhì)綜合評(píng)價(jià)與傳統(tǒng)主成分分析相比,第一主成分的貢獻(xiàn)率有了顯著的提高。且由特征向量u1可以得出東湖的主要污染指標(biāo)是氨氮、總磷和總氮,這與湖北省環(huán)保局在2000年的環(huán)境質(zhì)量公報(bào)中對(duì)武漢市內(nèi)湖的描述相一致。由式(3)計(jì)算可得各個(gè)子湖的污染主成分,由于第一主成分的貢獻(xiàn)率較低(e1<80%),所以應(yīng)該對(duì)所有主成分進(jìn)行加權(quán)綜合,計(jì)算得綜合主成分Z=[4.83922.77533.44595.79362.7634]T,其中,由于特征向量u2、u3中系數(shù)絕對(duì)值較大者為負(fù)值,z2、z3取負(fù)值。表3為利用改進(jìn)后的主成分分析法計(jì)算出的各個(gè)子湖的水污染主成分、綜合主成分及其排名。由排名先后可得出,東湖各子湖中污染較嚴(yán)重的為水果湖和廟湖,污染較輕的為湯菱湖和鷹窩湖。從各子湖的實(shí)際情況看,排名靠后的廟湖和水果湖正是位于生活和工業(yè)廢水排放嚴(yán)重的人口和工業(yè)稠密區(qū),排名居前的鷹窩湖和湯菱湖離工廠較遠(yuǎn),離風(fēng)景區(qū)較近。3企業(yè)主成分分析主成分分析法主要是對(duì)矩陣進(jìn)行操作與運(yùn)算,而MATLAB作為一種著名的線性系統(tǒng)分析工具,在矩陣運(yùn)算和數(shù)值分析等方面具有極強(qiáng)的功能。同時(shí),VisualBasic作為一種十分強(qiáng)大和有生命力的Windows編程語言,避開了C++編程過分繁瑣和抽象的缺點(diǎn),同時(shí)又能實(shí)現(xiàn)大多數(shù)Windows編程目的。MapObjects(簡(jiǎn)稱MO)是基于COM技術(shù)的地理信息系統(tǒng)控件,通過MO可較容易地完成以下功能:地圖的放大、縮小和漫游;通過SQL語句來選擇物體;對(duì)所選地圖元素的屬性進(jìn)行更新、查詢;繪制專題圖等等。利用MATLAB程序語言編程進(jìn)行計(jì)算,在VB中調(diào)用MATLAB就可以完成主成分分析中的計(jì)算過程。而同時(shí)VB和MO的結(jié)合被認(rèn)為是開發(fā)GIS應(yīng)用軟件的最佳選擇之一,通過這種方式開發(fā)的應(yīng)用程序具有高效無縫的系統(tǒng)集成、開發(fā)簡(jiǎn)捷、程序運(yùn)行占用內(nèi)存少等優(yōu)點(diǎn)。在VB開發(fā)環(huán)境下,在MATLAB6.5軟件中實(shí)現(xiàn)改進(jìn)后的主成分方法的各個(gè)分析步驟,利用MapObjects2.0控件完成東湖水質(zhì)污染圖的輸出,如圖1所示。圖1中,各個(gè)柱高分別代表各子湖中氨氮和總磷與它們?cè)赩類水中含量的比值(依據(jù)地面水環(huán)境質(zhì)量標(biāo)準(zhǔn)GB3838-88,V類水中氨氮的含量為0.2mg/L,總磷的含量為0.2mg/L)。利用東湖水體質(zhì)量綜合評(píng)價(jià)專題圖,可以直觀地了解東湖內(nèi)水體質(zhì)量的空間分布狀況,從而可為控制環(huán)境污染、治理重點(diǎn)污染源、進(jìn)行環(huán)境規(guī)劃以及搞好環(huán)境管理等提供科學(xué)依據(jù)。4改進(jìn)后的主成分法本文將主成分分析方法運(yùn)用在水質(zhì)綜合評(píng)價(jià)中,作了如下改進(jìn)。1)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論