




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、主成分分析和因子分析在評價區(qū)域經(jīng)濟(jì)發(fā)展水平中的應(yīng)用圃2007軍第9期現(xiàn)代管理科學(xué)名家觀察主成分分析和因子分析在評價區(qū)域經(jīng)濟(jì)發(fā)展水平中的應(yīng)用.賈萬敬伺建敏摘要文章從主成分分析、因于分析的發(fā)展過程、基本原理.應(yīng)用等方面出發(fā)來全面地介紹多元數(shù)據(jù)處理的主要方法.文章以江蘇省各地市經(jīng)濟(jì)發(fā)展水平為例,根據(jù)江蘇省各市2005年的國民經(jīng)濟(jì)主要統(tǒng)計指標(biāo),利用SPSS軟件處理的結(jié)果來說明上述方法在坪價江蘇省各地市的經(jīng)濟(jì)在展水平中的應(yīng)用.關(guān)鍵詞=主成分分析;因于分析;區(qū)域經(jīng)濟(jì)一、引言的,而協(xié)方差矩陣對劣點值相當(dāng)敏感,為了增強主成分分我國是一個經(jīng)濟(jì)與社會發(fā)展水平,資源與環(huán)境稟賦情析的穩(wěn)健性,對協(xié)方差進(jìn)行算法改進(jìn),從而
2、提高主成分分況在各區(qū)域間差異非常大的國家。自科學(xué)發(fā)展觀提出以析的穩(wěn)健性。來,區(qū)域經(jīng)濟(jì)協(xié)調(diào)發(fā)展的研究得到了充分的重視。要制訂主成分綜合評價應(yīng)用中也存在很大爭議,有的學(xué)者就出促進(jìn)區(qū)域經(jīng)濟(jì)協(xié)調(diào)發(fā)展的有效政策,首先,必需對區(qū)域提出了究竟應(yīng)選取多少個主成分來對樣本進(jìn)行排序的問經(jīng)濟(jì)發(fā)展的水平做出合理的評價,從中找出形成區(qū)域經(jīng)濟(jì)題。一般來說,主要有兩種觀點:一是只用第一主成分,英發(fā)展水平差異的關(guān)鍵因素。主成分分析和因子分析是多兀罔統(tǒng)計學(xué)家肯德爾認(rèn)為.第一主成分能夠最大限度地反映統(tǒng)計中十分常用的兩種方法,本文將著重介紹這兩種方法樣本間的差異,是概括指標(biāo)差異信息的最佳線性函數(shù)。因的基本原理、數(shù)學(xué)模型以便從根本上
3、揭示出這兩種方法的此,只能用第一主成分對樣本綜合排序。我國也有部分學(xué)區(qū)別。本文還將介紹主成分分析和因子分析的發(fā)展歷程和者持這種觀點,南開大學(xué)孟生旺老師從幾何投影角度闡應(yīng)用領(lǐng)域。結(jié)合江蘇省區(qū)域經(jīng)濟(jì)發(fā)展的現(xiàn)狀,選取反映明,在多指標(biāo)綜合評價中,只有第一主成分結(jié)合原始數(shù)據(jù)25年江蘇省13個地級市經(jīng)濟(jì)發(fā)展水平的12個主要統(tǒng)的信息最多,因而也就只能以第主成分值作為綜合評價計指標(biāo),運用因于分析方法對江蘇省各地級市的經(jīng)濟(jì)發(fā)展值才合理。另一種觀點則認(rèn)為,不僅要充分重視第主成的基本狀況進(jìn)行綜合評價。分,而且也要顧及其它主成分在綜合評價中所起的作用,二、分析方法簡介否則,損失的信息較多,有時甚至困歪曲樣本間的實際相
4、統(tǒng)計推斷的理論工作大多數(shù)都是基于總體為多元正對地位。提出的改進(jìn)辦法是:先技累積方差貢獻(xiàn)率不低于態(tài)的假定,然而在高于一維的情況r,要說明一組樣本來某個閥值(比如85%)的原則確定前幾個主成分,然后以每自多元正態(tài)總體是非常困難的,而且多個變量使用的測量個主成分各自的貢獻(xiàn)率為權(quán)數(shù)將選定主成分線性如l權(quán)求單位也可能各不相同或者變量間的數(shù)值大小相差很大。網(wǎng)和來綜合評價樣本的優(yōu)劣。此,要對多元數(shù)據(jù)進(jìn)行處理,通常將初始變量標(biāo)準(zhǔn)化。(2)主成分分析的原理。主成分分析是一種通過降維1.主成分分析。技術(shù)把多個變量把多個變量化為少數(shù)幾個主成分的統(tǒng)計(1)主成分綜什評價的產(chǎn)生和發(fā)展。主成分分析分析分析方法。這些主成分
5、能夠反映原始變量的絕大部分(Principle Component Analysis)的概念最早在1901年由皮信息,它們通常表示為原始變量的某種線形組合。當(dāng)原來爾遜(KarlPean;o川首先引人,對非隨機變量討論,1933年p個變量的總變差能夠由少數(shù)幾個線形組什來概括的話.數(shù)學(xué)家霍特林(Hotelling)把它推廣到隨機向量。JoUife那么這些線形組合中包含的信息與原來p個變量幾乎一I.T. 和J.EdwardJackson 對主成分分析進(jìn)行了較為系統(tǒng)地分析樣多,可以用這些線形組合替代原來的p個變量,這樣會和闡述,而郭取軍教授系統(tǒng)地論述了綜合評價的理論和方是觀測數(shù)據(jù)從高維降到低維,簡化了
6、數(shù)據(jù)。主成分就是p法,雖然目前還沒有關(guān)于主成分綜合評價方法的專著,但個變量亂,飛.-.Y的一些特殊線形組合.這些線形組合p很多專家學(xué)者對其進(jìn)行了探討和研究。些學(xué)者從不同的把yloY2.,Y構(gòu)成的坐標(biāo)系旋轉(zhuǎn)產(chǎn)生新的坐標(biāo)系,在新p角度提出PICA的穩(wěn)健性問題,對此進(jìn)行了研究,并且提出坐標(biāo)系中提供了協(xié)差陣的簡潔表示。以X(i:l,丸,p)表i了各自的改進(jìn)算法。有學(xué)者提出了獨立主成分分析(IPCA)示標(biāo)準(zhǔn)化的原變量,Zi(i:l,2, ; ,p)表示主成分,C,(i=l, 2, 的概念,引人非線性PCA算法。也有學(xué)者從如何去除或減,p;j=1.2,p)表示組舍系數(shù),主成分分析的模型為:弱有限的樣本集中
7、少量;劣點;樣本的影響從而獲得準(zhǔn)確ZI= CIIX1+C2Xr+,.+C1乒p主方向o常用的主成分分析是從樣本協(xié)方差矩陣來計算Z,= Xl+C2lX2+;+C;xp -19一?傸?婆?婲健?物浰?慬?捫?妣?汘慬?閔潮?祳?獯?傣?瑯楰敮?氫?楳慲?摷溶?妡?汥?溫氫?慲?偉?彩?潴?簹?敬?汩?妡?涌?簫?窣?楟?傸?墣瀩?椽?潬?汩?晥?偃?捩?瀩?卐?卓?圃名家觀察現(xiàn)代管理科學(xué).2007年第9期芒x;x . ,x表!J、p個指標(biāo)時該模型為11型模型,zp當(dāng)X1.X?型模型。式. ,XZp表示p個樣品時該模型為Zp= CpIXl+Cp2X2+C 0(3)主成分分析的應(yīng)用。主成分分析一般-f
8、是目的,而中X=(凡,凡,.X,)是可測p個指標(biāo)構(gòu)成的p維隨機IJ是研究的某個巾間環(huán)節(jié),通過這一處理來發(fā)現(xiàn)重要的變量量;F:o(F, F .-.Fm是不可觀測的向量.F稱為X的公共Jz和變量闊的某種關(guān)系。在肉子分析法中,通常用主成分分因子山;稱為因子載荷,它是第1個變量在第J個公共因子析法來確定公共肉子。上的負(fù)荷,矩陣B稱為因子載荷矩陣過稱為X的特殊困2因子分析。子,主中包括隨機誤差。因子分析可以分解為確定因子載(1)肉于分析方法的廣生初發(fā)展。因子分析(Factor荷、例子旋轉(zhuǎn)及H算民子得分蘭個步驟cAnalysis)方法最早是在1904年由斯皮爾曼(Charles系數(shù)陣B陽是初始因子載荷陣,
9、因子載荷問的統(tǒng)計J單Spearm阻)和反爾遜(KarlPear寫on)在篇著名論文。才智義就是第1個變量與第J個公共岡子之間的相關(guān)系數(shù)。估力測驗得分進(jìn)行統(tǒng)計分析中提出,之后被用于解決心理計B陽有多種方法,如主成分分析法、主軸因子法、最小二學(xué)和教育學(xué)方面的問題。由于這種方法計算量大,到了20乘法、極大似然法、a因于提取法等。其中主成分法應(yīng)用最世紀(jì)60年代得益于計算機的成用才有新的發(fā)展。R型因為廣泛,窗子分析與主成分分析并沒有原理上的實質(zhì)聯(lián)于分析認(rèn)為變量中存在一些不可觀測的共同因素同時對系,主要是外觀的聯(lián)系。因為用主成分法得到初始載荷陣原始變量產(chǎn)生影響,需要通過一定的方法提取;重要;的公B,=(e
10、,.y萬句,.y匯Cm),ej是R的特征根對共因子重要性;取決于因子對變量的影響程度,用二者應(yīng)的單位特征向量,它也是主成分分析系數(shù)陣C.第1個之間的相關(guān)系數(shù)(因子載荷)表示。根據(jù)變量與各因F的系數(shù)向量,所以B內(nèi)第i列系數(shù)向量與C阿第i行系數(shù)向;緊密;程度,把原始變量歸結(jié)到各因子中,通過這些;精量僅相差倍數(shù)匯c煉;的因子認(rèn)識復(fù)雜現(xiàn)象。因子分析的目的是用幾個不可用主成分法確定肉子載荷的方法比較簡單,但是這種觀測的隱變量來解釋原始變量間的協(xié)方差關(guān)系。方法所得到的特殊因子,氈之間并不相互獨立,因(2)因子分析的原理。因子分析是假定p個變量的變此,用主成分法確定因于載荷不完全符合因子橫型的假設(shè)異主要是一
11、些共同的因于引起的,希望用少數(shù)幾個公共因前提,也就是說所得的因子載荷并不完全正確G但是當(dāng)共子來解釋變量中的主要變化。由于樣本內(nèi)含樣品和指標(biāo)的同度較大時,特殊因于所引起的作用較小,因而特殊因子兩維性,因子分析分為R型和O型,前者是基于指標(biāo)的分之間的相關(guān)性所帶來的影響就幾乎可以忽略。由于滿足上析,而后者是基于樣品的分析。因子分析的數(shù)學(xué)模型(正交述模型的系數(shù)陣B陽不唯一,這成為園子載荷陣旋轉(zhuǎn)的理因子模型)為.論依據(jù)。一般情況下,初始因子載荷陣中各變量對因于的X,=huF,+ b12F2+;+btJm噸系數(shù)沒有靠近兩極數(shù)搞;0;和;1;,說明各變量在每個因于Xz=b;F,+ b;F計.+b;,F(xiàn)m+上
12、;分量;差4多,各因子并不;偏向;某些變量,這樣很難提煉公共因子的意義,因此要旋轉(zhuǎn)Bp_.改變它的坐標(biāo)旱,X,=b;F,+ b;F戶+b;F.+,使變量;偏向;不同的因子,并根據(jù)系數(shù)絕對值對變量歸類表12005年江蘇省各市國民經(jīng)濟(jì)主要統(tǒng)計指標(biāo)人均GDP 高新技術(shù)第氣產(chǎn)第二產(chǎn)城鎮(zhèn)固定地方財政規(guī)模以規(guī)模以上社會消費消費品第一產(chǎn)GDP 增長率產(chǎn)業(yè)產(chǎn)業(yè)產(chǎn)值業(yè)產(chǎn)值業(yè)產(chǎn)值資產(chǎn)投資總收人上工業(yè)工業(yè)利稅品零售總零售總(元/人)(%) 值(億元)(億元)(億元)增長率(億元)(億元)增加值總額額(億元)額增長(%) (億元)! (億元)率(骨)Y, YY, , Y, Y, YY, Y, , Y; 飛hyiY11
13、16.3 南京1 116.44 35538 510.17 961.68 I 365.39 I15.2 1 236.8 1 004.99 1 215 1 118 13.1 16.3 元錫890且I50964 421.8 1 15.1 1 695 1 060 353.1 384.77 824.1 14.8 l31241 6 15.7 徐州435.23 113 697 14.3 85.1 612.05 431.95 145.26 397.36 150.68 396.04 17.9 常州534.7 制4.0816.2 31 969 .42 161.84 15.1 79 220.45 6035.31 4
14、50.39 14.73600895-0.157 蘇州16.5 54165 1 233.76 718.1 2463.7 598.15 905.07 15.3 2 691.3 1256.32 16.9 南通16.2 370.69 19979 15171.19 564.53 163.01 536.41 .4 426.15 823.99 485.9 14.4 220.28 182,08 i 15.6 連古洶10362.04 14.2 201.52 161.09 56.28 96,09 32.81 14.9 淮安14.9 11 255 46.93 232.46 14.3 188.22 75.56 160
15、.86 73.66 198.62 255.75 14.4 15.6 鹽城264.27 12932 14.3 126,73 453,79 325.56 86.89 272.27 78.23 316.91 14.2 15,7 295.55 20389 272.07 15 518 117.03 388.76 102.38 306.89 318.22 14.3 揚鎮(zhèn)江州15.0 262.77 28241 324,97 118.42 360.44 97.71 241.39 15 512,01 283.29 16.6 15.7 218.69 334,82 112,94 323.39 107,8 233.8
16、1 15 479.8 249,6 13.9 問;尋首州尋遷12414.9 I .55 I 7568 14.6 6.15 112,5 25.83 56.88 14.27 109.5 163.25 15.4 -20 -?穰?印健?硬堲塰?攲?獎?夳奤夵夶妣失?夳奱獎?妡?慬敡慲?碣?檲?琵?祳牭獯?擾?楳慮溫?碣?抣?簳?灬?砽?榸?硬戱?抿?狋?噸?汥?碡?懶?采?浘?牬?勐?傸?扉歆?滅燊?洫?墡?彽?彬?捴慲?泐凐?采?潲汥?勐?墵?傸?.27年第9期現(xiàn)代管理科學(xué)名家觀察命名,最常用的旋轉(zhuǎn)方法是最大方差正交旋轉(zhuǎn)。驗?zāi)康氖谴_定所要求的數(shù)據(jù)是否取自多元正態(tài)分布的總(3)因子分析的應(yīng)用。近年來,隨
17、著現(xiàn)代高速電子計算體,若差異檢驗的F值顯著,表jJ所取的數(shù)據(jù)來自在態(tài)分機的出現(xiàn),人們將網(wǎng)子分析的理論成功地應(yīng)用于心理學(xué)布總體,可以做進(jìn)一步分析;KMO檢驗?zāi)康氖欠治鲇^測變會學(xué)、經(jīng)濟(jì)學(xué)、人口學(xué)、地質(zhì)學(xué),英三呈F巨-在化學(xué)和物理學(xué)中t也量之間的簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的相對大小來確定得到成1礦1功1地運用.這f使史得因于分析的理論和h法吏j川川豐富c該數(shù)據(jù)是否適合進(jìn)行因子分析,取值變化在0-1之間,若三、實證研究KMO過小,說明變量之間的相朵小能被其他變量解擇.進(jìn)本文選取25年江蘇省各地級市的12個國民經(jīng)濟(jì)行網(wǎng)子分析不適合。通過SPSS軟件計算得到以上數(shù)據(jù)的主要統(tǒng)計指標(biāo)(資料來源=江蘇省統(tǒng)計局,2
18、6),相關(guān)數(shù)據(jù)?art!ctt檢驗的F值等于0.000,表明所取的數(shù)據(jù)來自正態(tài)見表10利用SPSS統(tǒng)計軟件對表1的數(shù)據(jù)進(jìn)行處理,在因分布的總體;KMO檢驗值為0.726,肉此適合1世囚F分析e子分析的過程中使用主成分法提取公共因子。(注1表示本文使用SPSS13.0對數(shù)據(jù)進(jìn)行因子分析,采用主成分原始變量.X;表示標(biāo)準(zhǔn)化后的變量)法提取特征值大于1的主成分作為公共因子,得到方差最表2因于旋轉(zhuǎn)后的載荷矩陣、特征值貢獻(xiàn)豐和草計貢獻(xiàn)率太正交旋轉(zhuǎn)后的因子載荷矩陣、特征f莊、貢獻(xiàn)率和累計貢獻(xiàn)率。特征值大于1的前兩個公岡子的累計貢獻(xiàn)率已達(dá)到第-主因F第二主因子同哇乒)90.8%,可見提取2個因子后,它們反映
19、了原始變量的大0.020 0938 部分信息。從旋轉(zhuǎn)后的因于載荷矩陣可以得到12個原始GDP增K率-0.374 0.682 變量號這2個因子之間的表達(dá)式如下:高新技術(shù)產(chǎn)值0.153 0.953 X,= 0.938F,+0.020F, 第一產(chǎn)業(yè)產(chǎn)值0.976 0.158 X,=0.682F,-0.374F, 第二產(chǎn)業(yè)產(chǎn)值-0.041 0.976 第一產(chǎn)業(yè)產(chǎn)值增長率口.0930.949 X,=0.822F,-0.287F, 城市固定資產(chǎn)投資0.968 。.011從表2可以看出,第一主因于在規(guī)模以上工業(yè)利稅總地方財政總收入0.039 00996857 額、地方財政總收入、第二產(chǎn)業(yè)產(chǎn)值、第三產(chǎn)業(yè)產(chǎn)值等
20、指標(biāo)規(guī)模以上工業(yè)增加值0.188 上具有較大的載荷,這些指標(biāo)均反映r地區(qū)的經(jīng)濟(jì)總量,規(guī)模以上利稅總額0.989 0.094 因此可以將第一主因子命名為;經(jīng)濟(jì)總量因子;。而第二主社會消費品零售總額0.942 -D.173 因子在第三產(chǎn)業(yè)產(chǎn)值增長率上具有較大的載荷,這是反映社會消費品零售總額增長率-D.287 0.822 經(jīng)濟(jì)增長速度的指標(biāo),因此可以將第二主因子命名為;經(jīng)特征值9.553 1.248 濟(jì)增長速度因子飛從表三的綜合因子的分的數(shù)值來看,得貢獻(xiàn)率(%)797 10.401 分值大的三個地區(qū)為蘇州、南京、無錫,它們的綜合閔于得累計貢獻(xiàn)率(%)797 90.008 分值大于1,可見這三個地區(qū)
21、的經(jīng)濟(jì)發(fā)展水平居于前列,表3因于得分及綜合排在明顯好于其它地區(qū)的經(jīng)濟(jì)發(fā)展?fàn)顩r。而位于蘇北地區(qū)的宿!城市因子得分綜合因綜合排名l遷、淮安、連云港三個地區(qū),其綜合因子得分的分俏很低,子得分F, 說明它們的經(jīng)濟(jì)發(fā)展水平與蘇州、南京、無錫三個地區(qū)相02IF52 46 1.083 02 2 比要落后很多,屬于經(jīng)濟(jì)欠發(fā)達(dá)地區(qū),其它地民的經(jīng)濟(jì)發(fā)l南元錫京忙去;:0.83997 1.069 3 展處于居中水平。徐州0.081 13 -1.44534 -0.09525 6 參考文獻(xiàn)常州-D.1B 52 0.898 23! 0.003 38 1. Jean Boivin,Serena Ng. Are more data always 蘇州:寸2.27479 0.36344 2.05394 better for factor analysis? Journal of Economet?南通0.241 76 -0.517 88 0.15399 4 rics,2006, (132): 169-194. 連E港-0.794 12 -0.30379 -D.73746 11 2. Congde Lu,Chunmei Zhang, Taiyi Zhang, Wei 淮安-0.788 0.391 54 0.74272 12 Zha
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 肉雞養(yǎng)殖購銷合同樣本
- 建筑外墻清洗服務(wù)合同范本
- 合同終止通知書模板與合同范本
- 工程技術(shù)人才勞動合同書
- 應(yīng)收賬款質(zhì)押貸款合同
- 機動車維修服務(wù)合同標(biāo)準(zhǔn)范本
- 勞動合同簡化版合同模板
- 個人貸款合同還款計劃書范本大全
- 簡版?zhèn)€人商業(yè)空間租賃合同
- 集中隔離觀察點培訓(xùn)課件
- 2024年浙江紹興杭紹臨空示范區(qū)開發(fā)集團(tuán)有限公司招聘筆試真題
- 2025年體檢科醫(yī)療質(zhì)量控制工作計劃
- 2024年萍鄉(xiāng)衛(wèi)生職業(yè)學(xué)院單招職業(yè)適應(yīng)性測試題庫參考答案
- 飛行器小學(xué)生課件
- 無人機法律法規(guī)與安全飛行 第2版2-2 領(lǐng)空
- 《單片機應(yīng)用實訓(xùn)教程》課件第4章
- 應(yīng)急突發(fā)處置
- 2024年定融認(rèn)購協(xié)議合同范文
- 系統(tǒng)思維與系統(tǒng)決策:系統(tǒng)動力學(xué)(中央財經(jīng)大學(xué))知到智慧樹章節(jié)答案
- 貨車司機 合股 合同范例
- 2024數(shù)據(jù)中心綜合布線工程產(chǎn)品選用指南
評論
0/150
提交評論