主成分分析和因子分析在評價區(qū)域經(jīng)濟發(fā)展水平中的應(yīng)用_第1頁
主成分分析和因子分析在評價區(qū)域經(jīng)濟發(fā)展水平中的應(yīng)用_第2頁
主成分分析和因子分析在評價區(qū)域經(jīng)濟發(fā)展水平中的應(yīng)用_第3頁
主成分分析和因子分析在評價區(qū)域經(jīng)濟發(fā)展水平中的應(yīng)用_第4頁
主成分分析和因子分析在評價區(qū)域經(jīng)濟發(fā)展水平中的應(yīng)用_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、!塑!至箜!塑!塑垡笪堡型蘭主成分分析和因子分析曼魚塞翌窒在評價區(qū)域經(jīng)濟發(fā)展水平中的應(yīng)用賈萬敬何建敏摘要:文章從主成分分析、因子分析的發(fā)展過程、基本原理應(yīng)用等方面出發(fā)來全面地介紹多元數(shù)據(jù)處理的主要方法。文章以江蘇省各地市經(jīng)濟發(fā)展水平為例,根據(jù)江蘇省各市卑的國民經(jīng)濟主要統(tǒng)計指標,利用軟件赴理的結(jié)果來說明上述方法在評價江蘇省各地市的經(jīng)濟發(fā)展水平中的應(yīng)用。關(guān)鍵詞:主成分分析;因子分析;區(qū)域經(jīng)濟一、引言我國是一個經(jīng)濟與社會發(fā)展水平資源與環(huán)境稟賦情況在各區(qū)域間差異非常大的國家。自科學(xué)發(fā)展觀提出以來,區(qū)域經(jīng)濟協(xié)調(diào)發(fā)展的研究得到了充分的重視。要制訂出促進區(qū)域經(jīng)濟協(xié)調(diào)發(fā)展的有效政策,首先必需對區(qū)域經(jīng)濟發(fā)展的水

2、平做出合理的評價。從中找出形成區(qū)域經(jīng)濟發(fā)展水平差異的關(guān)鍵因素。主成分分析和因子分析是多元統(tǒng)計中十分常用的兩種方法,本文將著重介紹這兩種方法的基本原理、數(shù)學(xué)模型以便從根本上揭示出這兩種方法的區(qū)別。本文還將介紹主成分分析和因子分析的發(fā)展歷程和應(yīng)用領(lǐng)域。結(jié)臺江蘇省區(qū)域經(jīng)濟發(fā)展的現(xiàn)狀,選取反映年江蘇省個地級市經(jīng)濟發(fā)展水平的個主要統(tǒng)計指標。運用因子分析方法對江蘇省輯地級市的經(jīng)濟發(fā)展的基本狀況進行綜合評價。二、分析方法簡介統(tǒng)計推斷的理論工作大多數(shù)都是基于總體為多元正態(tài)的假定,然而在高于一維的情況下,要說明一組樣本來自多元正態(tài)總體是非常困難的,而且多個變量使用的測量單位也可能各不相同或者變量聞的數(shù)值大小相差

3、很大。因此,要對多元數(shù)據(jù)進行處理,通常將初始變量標準化。主成分分析。()主成分綜臺評價的產(chǎn)生和發(fā)展。主成分分析( )的概念最早在年由皮爾遜( )首先引人對非隨機變量討論,年數(shù)學(xué)家霍特林()把它推廣到隨機向量。和 對主成分分析進行了較為系統(tǒng)地分析和闡述,而郭軍教授系統(tǒng)地論述了綜合評價的理論和方法,雖然目前還沒有關(guān)于主成分綜合評價方法的專著但很多專家學(xué)者對其進行了探討和研究。一些學(xué)者不同的角度提出的穩(wěn)健性問題,對此進行了研究,并且提出了各自的改進算法。有學(xué)者提出丁獨立主成分分析()的概念,弓人非線性算法。也有學(xué)者從如何去除或減弱有限的樣本集中少量“劣點”樣本的影響從而獲得準確主方向。常用的主成分分

4、析是從樣本協(xié)方差矩陣來計算的而協(xié)方差矩陣對劣點值相當敏感,為了增強主成分分析的穩(wěn)健性,對協(xié)方差進行算法改進,從而提高主成分分析的穩(wěn)健性。主成分綜合評價應(yīng)用中也存在很大爭議,有的學(xué)者就提出了究竟應(yīng)選取多少個主成分來對樣本進行排序的問題。一般來說,主要有兩種觀點:一是只用第一主成分,英國統(tǒng)計學(xué)家肯德爾認為:第一主成分能夠最大限度地反映樣本間的差異是概括指標差異信息的晟佳線性函數(shù)。因此只能用第一主成分對樣本綜合排序。我國也有部分學(xué)者持這種觀點南開大學(xué)盂生旺老師從幾何投影角度闡明在多指標綜合評價中,只有第一主成分結(jié)合原始數(shù)據(jù)的信息最多,因而也就只能以第一主成分值作為綜合評價值才合理。另一種觀點則認為,

5、不僅要充分重視第一主成分而且也要顧及其它主成分在綜臺評價中所起的作用,否則損失的信息較多,有時甚至回歪曲樣本間的實際相對地位。提出的改進辦法是:先按累積方差貢獻率不低于某個棚值(比如)的原則確定前幾個主成分,然后以每個主成分各自的貢獻率為權(quán)數(shù)將選定主成分線性加權(quán)求和來綜合評價樣本的優(yōu)劣。()主成分分析的原理。主成分分析是一種通過降維技術(shù)把多個變量把多個變量化為少數(shù)幾個主成分的統(tǒng)計分析分析方法。這些主成分能夠反映原始變量的絕大部分信息,它們通常表示為原始變量的某種線形組臺。當原來個變量的總變差能夠由少數(shù)幾個線形組合來概括的話那么這些線形組合中包含的信息與原來個變量幾乎一樣多可以用這些線形組合替代

6、原來的個變量,這樣會是觀測數(shù)據(jù)從高維降到低維,簡化了數(shù)據(jù)。主成分就是個變量。:,的一些特殊線形組合,這些線形組合把,:,。構(gòu)成的坐標系旋轉(zhuǎn)產(chǎn)生新的坐標系,在新坐標系中提供了協(xié)差陣的簡潔表示。以(,)表示標準化的原變量,(,)表示主成分,(江,;,)表示組合系數(shù),主成分分析的模型為:汁冰磷。一!壘窒翌窒!塑垡笪翌型堂!堡翌!塑u65291X()主成分分析的應(yīng)用。主成分分析一般不是目的,而足研究的某個巾間環(huán)節(jié)通過這一處理來發(fā)現(xiàn)重要的變量和變量間的某種關(guān)系。在網(wǎng)于分析法中,通常用主成分分析法來確定公共網(wǎng)子。因子分析。()咼子分析方法的產(chǎn)生和發(fā)展。因子分析()方法最早是在年由斯皮爾曼()和皮爾遜( )

7、在一篇著名論文對智力測驗得分進行統(tǒng)計分析中提出,之后被用于解決心理學(xué)和教育學(xué)方面的問題。由于這種方法計算量大,到了世紀年代得益于計算機的應(yīng)用才有新的發(fā)展。型因子分析認為變量中存在一些不可觀測的共同因素同時對原始變量產(chǎn)生影響需要通過一定的方法提取“重要”的公共因子;“重要性”取決于困子對變量的影響程度,用二者之間的相關(guān)系數(shù)(因子載荷)表示。根據(jù)變量與各因子的“緊密”程度,把原始變量歸結(jié)到各因子中,通過這些“精煉”的因子認識復(fù)雜現(xiàn)象。因子分析的目的是用幾個不可觀測的隱變量來解釋原始變量間的協(xié)方差關(guān)系。()因子分析的原理。因子分析是假定個變量的變異主要是一些共同的因子引起的希望用少數(shù)幾個公共因子來解

8、釋變量中的主要變化。由于樣本內(nèi)含樣品和指標的兩維性,因子分析分為型和型,前者足基于指標的分析,而后者是基于樣品的分析。因子分析的數(shù)學(xué)模型(正交因子模型)為:是,口u8216X島當,。表示個指標時該模型為型模型,當,:,。表示個樣品時該模型為型模型。式中:(,。)是可測個指標構(gòu)成的維隨機向量;(,)是不可觀測的向量,稱為的公共因子;,稱為因于載荷,它是第個變量在第個公共因子上的負荷矩陣稱為因子載荷矩陣;稱為的特殊因子中包括隨機誤差。因于分析可以分解為確定因子載荷、園子旋轉(zhuǎn)及糾算因子得分三個步驟。系數(shù)陣帥是初始因子載荷陣,因子載荷,的統(tǒng)計意義就足第個變量與第個公共因子之間的相關(guān)系數(shù)。估計一有多種方

9、法,如主成分分析法、主軸因子法、晟小二乘法、極大似然法、因子提取法等。其主成分法應(yīng)用最為廣泛,因子分析與主成分分析并沒有原理上的實質(zhì)聯(lián)系主要是外觀的聯(lián)系。因為用主成分法得到初始載荷陣。(、。,、凡,一,、。),是的特征根凡。對應(yīng)的單位特征向量,它也是主成分分析系數(shù)陣啪。第個系數(shù)向量,所以曲第列系數(shù)向量與一第行系數(shù)向量僅相差倍數(shù)。用主成分法確定因子載荷的方法比較簡單,但是這種方法所得到的特殊因子。,島,毛之間并不相互獨立,因此用主成分法確定因子載荷不完全符合因子模型的假設(shè)前提,也就是說所得的因子載荷并不完全正確。但是當共同度較大時,特殊因子所引起的作用較小,因而特殊因子之間的相關(guān)性所帶來的影響就

10、幾乎可以忽略。由于滿足上述模型的系數(shù)陣帥不唯一,這成為因子載荷陣旋轉(zhuǎn)的理論依據(jù)。一般情況下,初始因子載荷陣中各變量對因子的系數(shù)沒有靠近兩極數(shù)值和,說明各變量在每個因子上“分量”差不多。備因子并不“偏向”某些變量這樣很難提煉公共困子的意義,因此要旋轉(zhuǎn)咖。改變它的坐標系,使變量“偏向”不同的因子,并根據(jù)系數(shù)絕對值對變量歸類袁年江蘇省各市國民經(jīng)濟主要統(tǒng)計指標人均高新技術(shù)第二產(chǎn)第產(chǎn)第三產(chǎn)城鎮(zhèn)固定地方財政規(guī)模以規(guī)模以上社會消費消費品增長率產(chǎn)業(yè)產(chǎn)業(yè)產(chǎn)值業(yè)產(chǎn)值 業(yè)產(chǎn)值資產(chǎn)投資總收入上工業(yè)工業(yè)利稅品零售總零售總(元人)()值(億元)(億元)(億元) 增長率(億元)(億元)增加值總額額(億元)額增長()(億元)

11、(億元)率(),】南京 無錫 徐州 常州 蘇州 南通 “連云港 淮安 。鹽城 揚州 鎮(zhèn)江 泰州 宿遷, 一?。褐馏?!塑!型垡篁堡登堂!墨量塑塹命名,最常爿的旋轉(zhuǎn)方法是最大方差正交旋轉(zhuǎn)。()因子分析的應(yīng)用。近年來隨著現(xiàn)代高速電子計算機的出現(xiàn),人們將因子分析的理論成功地應(yīng)用于心理學(xué)、社會學(xué)、經(jīng)濟學(xué)、人口學(xué)、地質(zhì)學(xué),甚至在化學(xué)和物理學(xué)中也得到成功地運用這使得因子分析的理論和方法更加豐富。三、實證研究本文選取年江封、省各地級市的個國民經(jīng)濟主要統(tǒng)計指標(資料來源:江蘇省統(tǒng)計局,),相關(guān)數(shù)據(jù)見袁。利用統(tǒng)計軟件對表的數(shù)據(jù)進行處理,在因子分析的過程中使用主成分法提取公共因子。(注:,表示原始變量,表示標準化后

12、的變量)表因子旋轉(zhuǎn)后的栽荷矩陣、特征值貢獻率和累計貢獻率驗?zāi)康氖谴_定所要求的數(shù)據(jù)是否取白多元正態(tài)分布的總體,若差異檢驗的值顯著,表示所取的數(shù)據(jù)來自正態(tài)分布總體可以做進一步分析;檢驗?zāi)康氖欠治鲇^測變量之間的簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的相對大小來確定該數(shù)據(jù)是否適臺進行因子分析取值變化在之間,若過小說明變量之間的榴天小能被其他變量解釋進行網(wǎng)子分析不適臺。通過軟件計算得到以上數(shù)據(jù)的檢驗的值等于表明所取的數(shù)據(jù)來自正態(tài)分布的總體;檢驗值為。因此適合做因子分析。本文使用 對數(shù)據(jù)進行因子分析,采用主成分法提取特征值大于的主成分作為公共因子,得到方差最大正交旋轉(zhuǎn)后的因子載荷矩陣、特征值、貢獻率和累計貢變量(:)第

13、一主因子第二主因子獻率。特征值大于的前兩個公因子的累計貢獻率已達到人均增率高新技術(shù)產(chǎn)值第二產(chǎn)業(yè)產(chǎn)值第三產(chǎn)業(yè)產(chǎn)值第三產(chǎn)業(yè)產(chǎn)值增長率一城市固定資產(chǎn)投資地方財政總收人規(guī)模以上工業(yè)增加值規(guī)模以上利稅總額社會消費品零售總額 ()??梢娞崛€因子后,它們反映了原始變量的大部分信息。從旋轉(zhuǎn)后的因子載荷矩陣可咀得到個原始變量與這個因子之間的表達式如下:廣 一從表可以看出,第一主因子在規(guī)模以上工業(yè)利稅總額、地方財政總收入、第二產(chǎn)業(yè)產(chǎn)值、第三產(chǎn)業(yè)產(chǎn)值等指標上具有較大的載荷,這些指標均反映地區(qū)的經(jīng)濟總量,因此可以將第一主因子命名為“經(jīng)濟總量因子”。而第二主社會消費品零售總額增妊率特征值【貢獻率()累計貢獻率()表因

14、子得分及綜合排名因子在第三產(chǎn)業(yè)產(chǎn)值增長率上具有較大的載荷這是反映經(jīng)濟增長速度的指標因此可以將第二主因子命名為“經(jīng)濟增長速度因子”。從表三的綜合因子的分的數(shù)值來看,得分值大的三個地區(qū)為蘇州、南京、無錫,它們的綜合網(wǎng)子得分值大于可見這三個地區(qū)的經(jīng)濟發(fā)展水平居于前列,明顯好于其它地區(qū)的經(jīng)濟發(fā)展狀況。而位于蘇北地區(qū)的宿城市因子得分綜合因綜合排名遷、淮安、連云港三個地區(qū),其綜合園子得分的分值很低,子得分說明它們的經(jīng)濟發(fā)展水平與蘇州、南京、無錫三個地區(qū)相南京 無錫 徐州】 常州 蘇州 “ 南通 一 連云港 淮安 】鹽城 揚州一 鎮(zhèn)江一 泰州一 宿遷一 因子分析要求原始變量之間有比較強的相關(guān)性,如果原始變量

15、之間不存在較強的相關(guān)關(guān)系那么就無法從中綜合出共同特征的少數(shù)因子來。因此,在作因子分析時。需要對原始變量做相關(guān)分析。數(shù)據(jù)處理系統(tǒng)提供和檢驗來判斷變量是否適合做因子分析:檢比要落后很多,屬于經(jīng)濟欠發(fā)達地區(qū),其它地膩的經(jīng)濟發(fā)展處于居中水平。參考文獻: , ,( ):, , ,葉其孝,沈永歡應(yīng)用數(shù)學(xué)手冊(第版)北京:科學(xué)出版社,重點項目:江蘇區(qū)域經(jīng)濟協(xié)調(diào)發(fā)展水平剝度與促進政策研究項目()。作者簡介:何建敏,東南大學(xué)經(jīng)濟管理學(xué)院教授、博士生導(dǎo)師;賈萬教,東南大學(xué)經(jīng)濟管理學(xué)院管理科學(xué)與工程碩士生。收稿日期:一主成分分析和因子分析在評價區(qū)域經(jīng)濟發(fā)展水平中的應(yīng)用作者:作者單位:刊名:英文刊名:年,卷(期):被引用次數(shù):參考文獻(3條)賈萬敬,何建敏東南大學(xué)經(jīng)濟管理學(xué)院現(xiàn)代管理科學(xué)MODERN MANAGEMENT SCIENCE2007(9)4次1.Jean Boivin.Serena Ng Are more data always better for factor analysis? 2006(132)2.Congde Lu.Chunmei Zhang.Taiyi Zhang.Wei Zhang Kernel based symmetrical principal componentanalysis for face 20063.葉其孝.沈永歡 應(yīng)用數(shù)學(xué)手冊 2006引證文獻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論