主成分分析法在地區(qū)綜合實(shí)力評價中的應(yīng)用_第1頁
主成分分析法在地區(qū)綜合實(shí)力評價中的應(yīng)用_第2頁
主成分分析法在地區(qū)綜合實(shí)力評價中的應(yīng)用_第3頁
主成分分析法在地區(qū)綜合實(shí)力評價中的應(yīng)用_第4頁
主成分分析法在地區(qū)綜合實(shí)力評價中的應(yīng)用_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第20卷 第6期2004年11月地理與地理信息科學(xué)GeographyandGeo-InformationScience主成分分析法在地區(qū)綜合實(shí)力評價中的應(yīng)用馮利華,馬未宇(浙江師范大學(xué)地理系,浙江金華321004)摘要:地區(qū)綜合實(shí)力反映一個地區(qū)社會經(jīng)濟(jì)系統(tǒng)的發(fā)展水平。主成分分析法能夠在保證原始數(shù)據(jù)信息損失最小的情況下,以少數(shù)的綜合變量取代原有的多維變量,使數(shù)據(jù)結(jié)構(gòu)大為簡化,并且客觀地確定權(quán)數(shù),避免了主觀隨意性,因而是地區(qū)綜合實(shí)力評價的一種有效方法。通過主成分分析,可以全方位地了解各個地區(qū)社會經(jīng)濟(jì)系統(tǒng)的發(fā)展水平及其差距。關(guān)鍵詞:地區(qū)綜合實(shí)力;指標(biāo);變量;數(shù)據(jù)信息;主成分分析中圖分類號:F224.

2、9 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-0504(2004)06-0073-03地區(qū)綜合實(shí)力是評價一個地區(qū)社會經(jīng)濟(jì)系統(tǒng)發(fā)展?fàn)顩r的重要指標(biāo)1,2。自1991年以來,為了對全國2000多個縣(市)的整體經(jīng)濟(jì)實(shí)力和社會發(fā)展?fàn)顩r進(jìn)行定量的檢驗(yàn)和排序,已多次進(jìn)行地區(qū)綜合實(shí)力的評價工作,并由此產(chǎn)生了歷屆的全國綜合實(shí)力百強(qiáng)縣。評價所選用的方法主要有等份計(jì)分法、模糊綜合評判法等,所選用的指標(biāo)涉及社會經(jīng)濟(jì)系統(tǒng)中生產(chǎn)、分配、交換、消費(fèi)等環(huán)節(jié),并且指標(biāo)數(shù)量還有不斷增加的趨勢,如從最初的12個,增加到22個,在全國社會發(fā)展總指數(shù)的計(jì)算中,指標(biāo)數(shù)量則增加到130多個。事實(shí)上,這些方法本身存在著明顯的缺陷,如等份計(jì)分法需

3、要對每個指標(biāo)人為地給定一個權(quán)數(shù),并且由于指標(biāo)數(shù)量多,無法突出主要指標(biāo)的作用,同時增加了評價工作量。除此以外,模糊綜合評判法采用取小取大的運(yùn)算法則,還會使大量的有用信息遺失,并且評價指標(biāo)越多,遺失的有用信息也越多,誤判的可能性越大。近年來,隨著多元統(tǒng)計(jì)方法的普及和應(yīng)用,主成分分析法也成為一種較新的評估方法3,4。它與前述方法有著不同的原理和特性,能夠在最大限度地保留原有信息的基礎(chǔ)上,對高維變量系統(tǒng)進(jìn)行最佳的綜合與簡化,并且能夠客觀地確定各個指標(biāo)的權(quán)數(shù),避免了主觀隨意性。為此,本文根據(jù)主成分分析法,對地區(qū)綜合實(shí)力進(jìn)行評價,以便客觀而準(zhǔn)確地衡量一個地區(qū)社會經(jīng)濟(jì)系統(tǒng)的發(fā)展水平。舍棄部分信息,以少數(shù)的綜

4、合變量取代原有的多維變量,這樣既抓住了主要矛盾,又簡化了評價工作。設(shè)原始變量為x1,x2, ,xn,主成分分析后得到的新變量(綜合變量)為z1,z2, ,zm,它們是x1,x2, ,xn的線性組合(m<n)。新變量z1,z2, ,zm構(gòu)成的坐標(biāo)系是原坐標(biāo)系經(jīng)平移和正交旋轉(zhuǎn)后得到的,稱z1,z2, ,zm構(gòu)成的空間為m維主超平面。在主超平面上,第一主成分z1對應(yīng)于數(shù)據(jù)變異(貢獻(xiàn)率e1)最大的方向,對于z2, ,zm,依次有e2 em。因此,z1是攜帶原始數(shù)據(jù)信息最多的一維變量,而m維主超平面是保留原始數(shù)據(jù)信息量最大的m維子空間。主成分分析法的步驟如下:(1)為了排除數(shù)量級和量綱不同帶來的影

5、響,首先對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理:x*ij=(xij-i)/ i (i=1,2, n;j=1,2, ,p)式中:xij為第i個指標(biāo)第j個分區(qū)的原始數(shù)據(jù),xi和 i分別為第i個指標(biāo)的樣本均值和標(biāo)準(zhǔn)差。(2)根據(jù)標(biāo)準(zhǔn)化數(shù)據(jù)表(x*ij)n!p,計(jì)算相關(guān)系數(shù)矩陣R=(rij)n!n,其中:rij=1n(x-i)(xkj-j)/ ijnk=1ki(3)計(jì)算R的特征值和特征向量。根據(jù)特征方程R- I=0,計(jì)算特征根 i,并使其從大到小排列: 1 2 n,同時可得對應(yīng)的特征向量u1,u2, ,un。它們標(biāo)準(zhǔn)正交,u1,u2, ,un稱為主軸。(4)計(jì)算貢獻(xiàn)率ei= i/j= i和累計(jì)貢獻(xiàn)率Ej= j/1j

6、=1i。i=1nnm1 主成分分析法主成分分析法旨在力保原始數(shù)據(jù)信息丟失最小的情況下,對高維變量空間進(jìn)行降維處理,即在保證原始數(shù)據(jù)信息損失最小的前提下,經(jīng)過線性變換和(5)計(jì)算主成分zj=j= uiix*ij。1i=1(6)綜合分析。一個m維主超平面究竟以多大的pn收稿日期:2004-04-02; 修訂日期:2004-08-05基金項(xiàng)目:浙江省自然科學(xué)基金資助項(xiàng)目(402034);浙江省金華市科技計(jì)劃項(xiàng)目(03-1-508):(),第74頁地理與地理信息科學(xué) 第20卷精度來近似代替原始變量系統(tǒng),才能確保盡可能多的(3)求解R的特征值 i(表1)和特征向量ui。第*原始數(shù)據(jù)信息?這可以通過求累計(jì)

7、貢獻(xiàn)率Ej來判斷。一主成分z1與各指標(biāo)的關(guān)系為:z1=-0 18x* 15x21+0*一般取Ej大于80%的最小m(m<n),則可得主超平-0 08x* 23x* 25x* 04x6+0 18x* 24x*3+04+05+07+08+面的維數(shù)m,從而可對m個主成分進(jìn)行綜合分析。*0 25x9+0 26x* 27x* 22x* 24x* 23x*10+011+012-013+014+*0 21x15-0 02x* 20x* 25x* 27x* 23x*16+017+018+019+020+*0 18x21+0 26x*22。2 地區(qū)綜合實(shí)力的評價實(shí)例地區(qū)綜合實(shí)力反映了一個地區(qū)整體的經(jīng)濟(jì)實(shí)力

8、和社會經(jīng)濟(jì)發(fā)展?fàn)顩r。因此,應(yīng)該全方位地從一個地區(qū)社會經(jīng)濟(jì)系統(tǒng)的各個領(lǐng)域去選擇指標(biāo)。在第三屆全國百強(qiáng)縣的評選中,選擇了22個指標(biāo):x1為人均耕地面積(hm);x2為有效灌溉面積占耕地面積的比重(%);x3為人均農(nóng)林牧漁業(yè)增加值(元);x4為勞均農(nóng)用機(jī)械總動力(W);x5為勞均農(nóng)村用電量(kWh);x6為每畝耕地化肥施用量(kg);x7為國內(nèi)生產(chǎn)總值(萬元);x8為地方財(cái)政收入(萬元);x9為人均國內(nèi)生產(chǎn)總值(元);x10為人均地方財(cái)政收入(元);x11為人均各項(xiàng)稅金(元);x12為社會勞動生產(chǎn)率(元);x13為農(nóng)業(yè)勞動力占全社會勞動力的比重(%);x14為第二、三產(chǎn)業(yè)增加值占國內(nèi)生產(chǎn)總值的比重(

9、%);x15為每百萬人中中學(xué)生數(shù)(人);x16為每個教師負(fù)擔(dān)學(xué)生數(shù)(人);x17為每萬人口擁有的醫(yī)院、衛(wèi)生院床位數(shù)(張);x18為農(nóng)業(yè)技術(shù)人員占農(nóng)業(yè)勞動力的比重(%);x19為人均儲蓄余額(元);x20為農(nóng)民人均純收入(元);x21為職工平均工資(元);x22為人均社會消費(fèi)品零售額(元)。前已述及,多指標(biāo)的綜合評價一方面增加了評價工作量,另一方面勢必淡化主要指標(biāo)的作用。為此,需要從現(xiàn)有指標(biāo)中精選出若干個有代表性的指標(biāo)。但人為地精選指標(biāo)難免帶有主觀隨意性,可能丟失部分有價值的原始信息。因此必須對所考慮的眾多指標(biāo),利用數(shù)理統(tǒng)計(jì)法,經(jīng)過正交化處理,使其成為少數(shù)幾個相互獨(dú)立的綜合指標(biāo),再根據(jù)這些指標(biāo)來

10、評價一個地區(qū)的綜合實(shí)力,而主成分分析法為實(shí)現(xiàn)這一思路提供了有效的數(shù)學(xué)方法。本文以金華市社會經(jīng)濟(jì)系統(tǒng)的22個指標(biāo)為例,來說明主成分分析法在地區(qū)綜合實(shí)力評價中的應(yīng)用。金華市位于浙江省的中部地區(qū),共有9個縣(市),分布在丘陵山地與河谷平原等不同的地貌單元內(nèi),社會經(jīng)濟(jì)系統(tǒng)的發(fā)展水平差異懸殊。(1)對9個縣(市)的22個指標(biāo)共198個數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化數(shù)據(jù)表(x*ij)(i=1,2, ,22;j=1,2, ,9)。(2)根據(jù)(x*ij)22!9,計(jì)算得到相關(guān)系數(shù)矩陣R=(rij!5-8(4)根據(jù) i可得貢獻(xiàn)率ei和累計(jì)貢獻(xiàn)率Ej(表1)。(5)計(jì)算得到主成分zj(表2)。表2中列出了第一、第

11、二、第三主成分。表1 特征值、貢獻(xiàn)率和累計(jì)貢獻(xiàn)率Table1 Characteristicvalues,contributionratesandaccumulativecontributionrates序號12345678累計(jì)貢獻(xiàn)率(%)表2 各縣(市)的主成分、綜合主成分及其排名Table2 Everycountrysprincipalcomponent,syntheticprincipalcomponentandplace序號123456789地區(qū)金華縣義烏市武義縣東陽市磐安縣蘭溪市永康市浦江縣市 區(qū)排名827495361(6)從表1可以看出,前8個特征值所對應(yīng)的累計(jì)貢獻(xiàn)率E8=100%,

12、也就是如果選用前8個主成分,它們所攜帶的數(shù)據(jù)信息已經(jīng)完全包括了原來22個變量所攜帶的數(shù)據(jù)信息,這就使數(shù)據(jù)結(jié)構(gòu)大為簡化。事實(shí)上,根據(jù)最小m的選取標(biāo)準(zhǔn)(Ej>80%),只要選用前3個主成分就夠了,因?yàn)榇藭r累計(jì)貢獻(xiàn)率E3=83 36%>80%,而損失的數(shù)據(jù)信息只占原信息的16 64%,使數(shù)據(jù)結(jié)構(gòu)更為簡化了。通過以上分析,根據(jù)主成分z1、z2、z3和對應(yīng)的客3觀權(quán)數(shù)e1、e2、e3之積z13=i= 1eizi計(jì)算,最后得到各縣(市)的綜合主成分z13及其排名(表2)。從表2可以看出,市區(qū)和義烏市的綜合實(shí)力最強(qiáng),分別排在第一和第二位,而位于丘陵山區(qū)的磐安縣的綜合實(shí)力最弱,排在最后一位。如果根

13、據(jù)前8個主成分來計(jì)算綜合主成分z18,那么由此而得到的各縣(市)第6期󰀁󰀁󰀁󰀁󰀁󰀁󰀁󰀁󰀁󰀁馮利華等:主成分分析法在地區(qū)綜合實(shí)力評價中的應(yīng)用第75頁明,主成分分析法利用少數(shù)幾個綜合變量就能夠代替眾多原始變量所攜帶的大部分?jǐn)?shù)據(jù)信息。根據(jù)表2的綜合主成分,參考有關(guān)等級分類方法,得到各縣(市)綜合主成分的分級標(biāo)準(zhǔn)(表3)。由表3可知,市區(qū)和義烏市的綜合實(shí)力最強(qiáng),永康市的綜合實(shí)力較強(qiáng),東陽市和蘭溪市的綜合實(shí)力中等,浦江縣、武義縣、金華縣的綜合實(shí)力

14、較弱,而磐安縣的綜合實(shí)力最弱。表3󰀁綜合主成分的分級標(biāo)準(zhǔn)Table3󰀁Classificationstandardofsyntheticprincipalcomponents序號12345綜合主成分z13綜合實(shí)力等級強(qiáng)較強(qiáng)中等較弱弱分信息,以少數(shù)的綜合變量取代原有的多維變量,使數(shù)據(jù)結(jié)構(gòu)大為簡化,并且客觀地確定權(quán)數(shù),避免了主觀隨意性,因而是地區(qū)綜合實(shí)力評價的一種簡單易行的有效方法。3)通過主成分分析,可以全方位地了解各個地區(qū)社會經(jīng)濟(jì)系統(tǒng)的發(fā)展水平及其差距,這不僅能為各級領(lǐng)導(dǎo)進(jìn)行科學(xué)管理和決策提供重要的信息,而且也能為理論工作者制定政策提供可靠的依據(jù)。4)地貌單元的

15、差異是金華市各縣(市)社會經(jīng)濟(jì)發(fā)展的主要限制因子,為此需要推出#移民下山等扶貧政策。參考文獻(xiàn):特征J.地理與地理信息科學(xué),2003,19(6):65-69.2󰀁劉慧.我國農(nóng)村發(fā)展地域差異及類型劃分J.地理與地理信息科學(xué),2002,18(4):71-75.3󰀁張超,楊秉庚.計(jì)量地理學(xué)基礎(chǔ)M.北京:高等教育出版社,1993.145-159.4󰀁任若恩,王惠文.多元統(tǒng)計(jì)數(shù)據(jù)分析M.北京:國防工業(yè)出版社,1997.92-110.2002J.ComputationalStatistics&DataAnalysis,2002,40(3):471-47

16、4.multivariatefamilialcorrelationmatrixJ.JournalofMultivariateAnaly sis,2002,82(2):457-470.earprincipalcomponentanalysisJ.StatisticsandComputing,2003,13(3):267-276.largemarginclassifiersJ.NeuralNetworks,2001,14(10):1447-1461.󰀁󰀁主成分分析法的結(jié)果表明,地貌單元的差異是金華市各縣(市)社會經(jīng)濟(jì)發(fā)展的主要限制因子,因?yàn)槠纸h、武義縣、金華縣的山

17、地面積占全縣面積的60%80%,而磐安縣的山地面積則占全縣面積的91%。為此,近年來市政府推出了#移民下山的扶貧政策,還在金華市的經(jīng)濟(jì)開發(fā)區(qū)內(nèi)特設(shè)了磐安經(jīng)濟(jì)開發(fā)小區(qū)(金磐開發(fā)區(qū)),這對增強(qiáng)地區(qū)綜合實(shí)力起到了積極而有效的作用。3󰀁結(jié)論根據(jù)上述分析,可以得到如下結(jié)論:1)在地區(qū)綜合實(shí)力的評價中,原有的等份計(jì)分法等具有人為給定權(quán)數(shù)、指標(biāo)數(shù)量多、評價工作量大等缺陷,因而有可能出現(xiàn)誤判。2)主成分分析法能夠在保證原始數(shù)據(jù)信息損失最小的情況下,經(jīng)過線性變換和舍棄部ApplicationofPrincipalComponentAnalysisinEvaluationofAreasCompre

18、hensiveStrengthFENGLi-hua,MAWei-yu(DepartmentofGeography,ZhejiangNormalUniversity,Jinhua321004,China)Abstract:Theareascomprehensivestrengthisusedtoindicatedevelopmentlevelofsocietyandeconomysystemofanarea.Theprincipalcomponentanalysismethodcansubstituteasmallnumbercomprehensivevariablefororiginalmultidimensionalvariable,andobviouslysimplifydatastructureinthepreconditionofminimizinglossoforiginaldatainformation.Theprincipalcomponentanalysiscanobjectivelygiveweighta

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論