空氣污染研究報(bào)告的主成分分析_第1頁
空氣污染研究報(bào)告的主成分分析_第2頁
空氣污染研究報(bào)告的主成分分析_第3頁
空氣污染研究報(bào)告的主成分分析_第4頁
空氣污染研究報(bào)告的主成分分析_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

空氣污染研究的主成分分析一、提出問題本文對(duì)于給定的*城市42天中午12點(diǎn)的空氣污染數(shù)據(jù)進(jìn)展主成分分析,主要解決以下幾個(gè)問題:分別用樣本協(xié)方差矩陣和樣本相關(guān)矩陣作主成分分析,比照二者的結(jié)果差異;對(duì)原始數(shù)據(jù)的變化選取三個(gè)或者更少的主成分反映,并對(duì)所選的主成分做出解釋。二、分析問題主成分分析旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)。在實(shí)際問題研究中,為了系統(tǒng)、全面地分析問題,我們必須考慮眾多影響因素。因?yàn)槊總€(gè)因素都在不同程度上反映了所研究問題的*些信息,并且指標(biāo)之間有一定的相關(guān)性,因而所得到的統(tǒng)計(jì)數(shù)據(jù)反映的信息在一定程度上有重疊。本文中所研究的問題變量較多,因此利用主成分分析法研究本問題,減少計(jì)算量和降低分析問題的復(fù)雜性。針對(duì)問題一,首先將數(shù)據(jù)標(biāo)準(zhǔn)化,計(jì)算樣本協(xié)方差矩陣和相關(guān)矩陣,然后分別計(jì)算樣本協(xié)方差矩陣和相關(guān)矩陣的特征值和特征向量,奉獻(xiàn)率和累計(jì)奉獻(xiàn)率,確定選取成分個(gè)數(shù),列出主成分方程并解釋主成分意義。針對(duì)問題二,考慮主成分的奉獻(xiàn)率,只要主成分的累計(jì)奉獻(xiàn)率到達(dá)80%,就可以反映原始數(shù)據(jù)的變化,并且對(duì)所選取的主成分做出解釋。三、模型假設(shè)1、影響污染程度的變量只有本文中所提到的變量;2、隨機(jī)選取的42天;3、題目中所提到的城市是平衡開展,政府對(duì)環(huán)境治理干預(yù)較小,即此城市的環(huán)境不會(huì)出現(xiàn)強(qiáng)烈波動(dòng);4、題目中所給的污染濃度及氣象參數(shù)有效,數(shù)據(jù)都準(zhǔn)確可靠,同時(shí)不考慮人為因素、檢測(cè)儀器準(zhǔn)確度不同等影響。四、符號(hào)說明符號(hào)符號(hào)含義樣本方差原始變量樣本主成分樣本協(xié)方差樣本相關(guān)矩陣樣本平均值協(xié)方差矩陣特征向量矩陣矩陣的特征值矩陣的特征向量信息提取率五、問題求解5.1協(xié)方差矩陣主成分分析設(shè)是的協(xié)方差矩陣,的特征值與正交化特征向量分別為及,且的第個(gè)主成分為 (1)根據(jù)已有數(shù)據(jù)計(jì)算得樣本的均值向量為根據(jù)協(xié)方差矩陣計(jì)算公式(2)代入數(shù)據(jù)可求得隨機(jī)變量相應(yīng)的樣本協(xié)方差矩陣為利用特征值計(jì)算公式代入數(shù)據(jù)可求得的特征值與對(duì)應(yīng)單位正交化特征向量分別為,,,,,,,利用第個(gè)主成分的奉獻(xiàn)率(3)及前個(gè)主成分的累計(jì)奉獻(xiàn)率(4)代入數(shù)據(jù)計(jì)算得的各標(biāo)準(zhǔn)化主成分的奉獻(xiàn)率及累計(jì)奉獻(xiàn)率〔如表1所示〕,可以看出,前三個(gè)標(biāo)準(zhǔn)化樣本的累計(jì)奉獻(xiàn)率已經(jīng)到達(dá)98.6968%,故只需提取前三個(gè)主成分即可:表1的各標(biāo)準(zhǔn)化主成分的奉獻(xiàn)率及累計(jì)奉獻(xiàn)率奉獻(xiàn)率(%)累計(jì)奉獻(xiàn)率〔%〕1304.257987.294887.2948228.27618.112795.4075311.46453.289398.696842.52430.724299.421051.27950.367199.788160.52870.151799.939870.20960.0601100.0000記主成分向量為由,知的前三個(gè)主成分分別為因此,用前三個(gè)主成分代替原來7個(gè)變量,信息損失量較小。進(jìn)一步由與的相關(guān)系數(shù)(5)計(jì)算出前三個(gè)主成分與各原始變量的相關(guān)系數(shù)如下表:主成分相主成分相關(guān)系數(shù)原變量0.10870.2576-0.0672-0.99940.0357-0.0014-0.1937-0.41810.46750.07400.06260.4111-0.1274-0.23690.9585-0.3521-0.9299-0.1041-0.0613-0.18240.4168由表可看出,與相關(guān)度較高,而由相關(guān)矩陣的主成分權(quán)重系數(shù)〔即特征向量中的各個(gè)值〕知,太陽輻射對(duì)空氣污染的影響最大;與相關(guān)度較高,由相關(guān)矩陣的主成分權(quán)重系數(shù)〔即特征向量中的各個(gè)值〕知,對(duì)空氣污染的影響較大;與相關(guān)度較高,同理,由相關(guān)矩陣的主成分權(quán)重系數(shù)〔即特征向量中的各個(gè)值〕知,對(duì)空氣污染的影響較大。考慮前三個(gè)主成分的奉獻(xiàn)率依次降低,得出結(jié)論:影響空氣污染的最重要因素為太陽輻射。由于的方差較大,第一主成分主要由變量控制,所以所得結(jié)論與實(shí)際不符。5.2樣本相關(guān)矩陣主成分分析利用標(biāo)準(zhǔn)化公式對(duì)原數(shù)據(jù)進(jìn)展標(biāo)準(zhǔn)化處理得到一組新的數(shù)據(jù):即令(6)其中為的平均值,為的方差。此時(shí),由于的協(xié)方差矩陣即為的相關(guān)矩陣其中(7)為的協(xié)方差。代入數(shù)據(jù)計(jì)算得到樣本相關(guān)矩陣為利用特征值計(jì)算公式代入數(shù)據(jù)可求得的特征值與單位正交化特征向量分別為利用第個(gè)主成分的奉獻(xiàn)率(8)及前個(gè)主成分的累計(jì)奉獻(xiàn)率(9)其中。計(jì)算的各標(biāo)準(zhǔn)化主成分的奉獻(xiàn)率及累計(jì)奉獻(xiàn)率〔如表3所示〕。表3的各標(biāo)準(zhǔn)化主成分的奉獻(xiàn)率及累計(jì)奉獻(xiàn)率奉獻(xiàn)率(%)累計(jì)奉獻(xiàn)率〔%〕12.336833.382433.382421.386019.799753.182131.204117.201270.383340.727110.387080.770350.65359.335690.105960.53677.667097.772970.15592.2271100.00可以看出,當(dāng)特征值大于1時(shí),提取前三個(gè)標(biāo)準(zhǔn)化樣本的累計(jì)奉獻(xiàn)率為70.3833%。記主成分向量為由,則的前三個(gè)主成分分別為由與的相關(guān)系數(shù)(10)計(jì)算出前三個(gè)主成分與各原始變量的相關(guān)系數(shù)如表:主成分相主成分相關(guān)系數(shù)原變量-0.36810.32550.69360.3145-0.62020.25020.8307-0.0046-0.14670.59270.5123-0.43730.74520.23050.23500.4922-0.67140.17450.48840.35530.6072由表4可看出,與、相關(guān)度較高,近似是7個(gè)變量的等權(quán)重之和,反映了空氣質(zhì)量的綜合指標(biāo),值越大,空氣質(zhì)量越差。與相關(guān)度較低,由相關(guān)矩陣的主成分權(quán)重系數(shù)〔即特征向量中的各個(gè)值〕知,CO對(duì)空氣污染指標(biāo)y2的影響較??;與、相關(guān)度較高,同理,由相關(guān)矩陣的主成分權(quán)重系數(shù)〔即特征向量中的各個(gè)值〕知,風(fēng)速和HC對(duì)空氣污染的影響較大。考慮前三個(gè)主成分的奉獻(xiàn)率之和到達(dá)70.3833%,因此綜合考慮來,和來評(píng)判影響空氣污染的重要指標(biāo)。5.3差異性從協(xié)方差矩陣出發(fā),對(duì)所有變量進(jìn)展主成分分析,何從相關(guān)矩陣出發(fā)做主成分分析,兩個(gè)方向得出的結(jié)果顯示,原變量在第一主成分和第二主成分中的相對(duì)重要性,由于標(biāo)準(zhǔn)化而有很大變化。從協(xié)方差矩陣的角度進(jìn)展主成分分析,所得第一主成分中,權(quán)重系數(shù)分別為-0.01、0.9922、0.941、-0.0047、0.0243、0.1124、0.0023,二重相對(duì)矩陣的角度進(jìn)展主成分分析,所得的第一主成分分析,權(quán)重系數(shù)為-0.238、0.2056、0.5511、0.3776、0.4980、0.3246、0.3194。兩者差距很大,并且在第二主成分中的兩個(gè)系數(shù)相差更遠(yuǎn)。因此,由協(xié)方差矩陣和相關(guān)矩陣所得的主成分一般是不同的。為了滿足樣本主成分累計(jì)奉獻(xiàn)率到達(dá)80%以上,從相關(guān)矩陣出發(fā)做的主成分分析應(yīng)保存4個(gè)主成分,而從協(xié)方差矩陣來看,只保存1個(gè)主成分即可。由此可知,用協(xié)方差矩陣進(jìn)展主成分分析更能簡(jiǎn)化運(yùn)算。本文中,由于設(shè)計(jì)的各變量的變化*圍差異不大,因此應(yīng)從先關(guān)矩陣出發(fā)求主成分比擬合理。近似是7個(gè)變量的等權(quán)重之和,反映了空氣質(zhì)量的綜合指標(biāo),值越大,空氣質(zhì)量越差。綜合考慮來,和來評(píng)判影響空氣污染的重要指標(biāo)。六、模型評(píng)價(jià)模型優(yōu)點(diǎn):用主成分分析方法能夠較好地提醒污染物于污染程度之間的關(guān)系;該模型所用工具較易操作;主成分分析法是從定量的角度出發(fā),充分利用全部數(shù)據(jù)當(dāng)中所包含的信息。所確定的指標(biāo)權(quán)數(shù)是基于數(shù)據(jù)分析而得到的指標(biāo)間的內(nèi)在構(gòu)造關(guān)系,具有較好的客觀性;能有效消除不相關(guān)指標(biāo)的影響,從而可進(jìn)展有針對(duì)性的定量化評(píng)價(jià);得到的綜合指標(biāo)之間相互獨(dú)立,不僅簡(jiǎn)化了評(píng)價(jià)系統(tǒng),還減少了信息的穿插和冗余。方法計(jì)算簡(jiǎn)便,數(shù)學(xué)物理意義明確,有較強(qiáng)的可操作性和一定的推廣應(yīng)用。模型缺點(diǎn):尚未考慮到其他變量的影響,存在預(yù)測(cè)誤差;該模型未給出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論