主成份分析因子分析畢業(yè)論文終稿_第1頁
主成份分析因子分析畢業(yè)論文終稿_第2頁
主成份分析因子分析畢業(yè)論文終稿_第3頁
主成份分析因子分析畢業(yè)論文終稿_第4頁
主成份分析因子分析畢業(yè)論文終稿_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、PAGE PAGE II 學(xué)科分類號 110 黑龍江科技大學(xué)本科學(xué)生畢業(yè)論文學(xué) 號院 (系)指導(dǎo)教師 20摘 要經(jīng)濟是指一個國家國民經(jīng)濟的總稱。我們要提高某地方人民的生活水平,要更好更快地發(fā)展某個地區(qū),就必須充分了解這個地區(qū)現(xiàn)有的經(jīng)濟發(fā)展?fàn)顩r。因此,現(xiàn)有的經(jīng)濟發(fā)展?fàn)顩r研究對將來的發(fā)展有著非常重要的指導(dǎo)意義。主成分分析也稱主分量分析,就是設(shè)法將原來指標(biāo)重新組合成一組新的互相無關(guān)的幾個綜合指標(biāo)來代替原來指標(biāo)。因子分析是主成分分析的推廣和發(fā)展,它也是將具有錯綜復(fù)雜關(guān)系的變量綜合為數(shù)量較少的幾個因子,以再現(xiàn)原始變量與因子的相互關(guān)系,同時根據(jù)不同因子還可以對變量進(jìn)行分類。主成分分析與因子分析都是多元分析

2、中處理降維的一種統(tǒng)計方法。本文通過學(xué)習(xí)與查閱相關(guān)資料找到黑龍江省個地級市的個具有代表性指標(biāo),運用統(tǒng)計分析軟件對這些指標(biāo)進(jìn)行主成分分析和因子分析得到特征值、方差貢獻(xiàn)率及公共因子等相關(guān)數(shù)據(jù)。并利用這些數(shù)據(jù)對個市經(jīng)濟水平劃分等級。關(guān)鍵詞 主成分分析 因子分析 經(jīng)濟 統(tǒng)計分析軟件 Abstract Economy refers to the floorboard of the national economy of a country. We will improve the level of a local peoples life, to somewhere better and faster d

3、evelopment, we must fully understand the current situation of economic development. Therefore, the existing research on the development of future economic development has a very important guiding significance.Principal component analysis (also called principal component analysis, is to try the origi

4、nal index combined into a new set of several comprehensive index instead of the original index has nothing to do with each other, at the same time, according to the actual need to recommend a few less comprehensive response as much as possible the original information of indicators. Is a generalizat

5、ion of the principal component analysis and factor analysis, it is also will have the intricate relationship between variables comprehensive to a small number of several factors, and to recreate the relationship of the original variables and factor, at the same time according to different factors ca

6、n also categorize variables,. Principal component analysis and factor analysis is a multivariate analysis of a statistical method of dealing with the dimension reduction. In this article, through learning and access to relevant data found nine representative indexes of 12 cities in heilongjiang prov

7、ince, using the SPSS statistical analysis software to the indicators of principal component analysis and factor analysis of the characteristic value, the variance contribution rate and public factor and related data. And using the data of 13 cities economic grade level.Key words Principal component

8、analysis Factor analysis Economic SPSS statistical analysis softwarPAGE VI目 錄 TOC o 1-3 h z u HYPERLINK l _Toc390087295 摘 要 PAGEREF _Toc390087295 h I HYPERLINK l _Toc390087296 Abstract PAGEREF _Toc390087296 h II HYPERLINK l _Toc390087297 第1章 緒 論 PAGEREF _Toc390087297 h 1 HYPERLINK l _Toc390087298 1.

9、1 選題的背景和提出 PAGEREF _Toc390087298 h 1 HYPERLINK l _Toc390087299 1.1.1 選題的背景 PAGEREF _Toc390087299 h 1 HYPERLINK l _Toc390087300 1.1.2 選題的提出 PAGEREF _Toc390087300 h 2 HYPERLINK l _Toc390087301 1.2 選題的意義和目的 PAGEREF _Toc390087301 h 3 HYPERLINK l _Toc390087302 1.2.1 選題的意義 PAGEREF _Toc390087302 h 3 HYPERL

10、INK l _Toc390087303 1.2.2 選題的目的 PAGEREF _Toc390087303 h 3 HYPERLINK l _Toc390087304 1.3 主成分分析和因子分析的發(fā)展及應(yīng)用 PAGEREF _Toc390087304 h 4 HYPERLINK l _Toc390087305 1.3.1 主成分分析的發(fā)展及應(yīng)用 PAGEREF _Toc390087305 h 4 HYPERLINK l _Toc390087306 1.3.2 因子分析的發(fā)展及應(yīng)用 PAGEREF _Toc390087306 h 4 HYPERLINK l _Toc390087307 1.4

11、本文主要研究內(nèi)容 PAGEREF _Toc390087307 h 5 HYPERLINK l _Toc390087308 第2章 主成分與因子分析 PAGEREF _Toc390087308 h 6 HYPERLINK l _Toc390087309 2.1 主成分分析的內(nèi)容 PAGEREF _Toc390087309 h 6 HYPERLINK l _Toc390087310 2.1.1 主成分分析原理和基本思想 PAGEREF _Toc390087310 h 6 HYPERLINK l _Toc390087311 2.1.2 主成分的幾何意義 PAGEREF _Toc390087311 h

12、 6 HYPERLINK l _Toc390087312 2.1.3 主成分分析的性質(zhì) PAGEREF _Toc390087312 h 8 HYPERLINK l _Toc390087313 2.2 主成分分析的求解方法和數(shù)學(xué)模型 PAGEREF _Toc390087313 h 8 HYPERLINK l _Toc390087314 2.3 主成分分析的基本步驟 PAGEREF _Toc390087314 h 11 HYPERLINK l _Toc390087315 2.4 因子分析的內(nèi)容 PAGEREF _Toc390087315 h 12 HYPERLINK l _Toc390087316

13、 2.4.1 因子分析原理和基本思想 PAGEREF _Toc390087316 h 12 HYPERLINK l _Toc390087317 2.4.2 因子分析的性質(zhì) PAGEREF _Toc390087317 h 13 HYPERLINK l _Toc390087318 2.5 因子分析的求解方法和數(shù)學(xué)模型 PAGEREF _Toc390087318 h 13 HYPERLINK l _Toc390087319 2.5.1 數(shù)學(xué)模型(正交因子模型) PAGEREF _Toc390087319 h 13 HYPERLINK l _Toc390087320 2.5.2 因子模型中公共因子,因

14、子載荷量的統(tǒng)計意義 PAGEREF _Toc390087320 h 14 HYPERLINK l _Toc390087321 2.5.3 因子旋轉(zhuǎn)與因子得分 PAGEREF _Toc390087321 h 15 HYPERLINK l _Toc390087322 2.6 計算步驟 PAGEREF _Toc390087322 h 16 HYPERLINK l _Toc390087323 第3章 主成分與因子分析在黑龍江省城市經(jīng)濟水平研究中的應(yīng)用 PAGEREF _Toc390087323 h 17 HYPERLINK l _Toc390087324 3.1主成分分析法 PAGEREF _Toc3

15、90087324 h 18 HYPERLINK l _Toc390087325 3.2 因子分析法 PAGEREF _Toc390087325 h 21 HYPERLINK l _Toc390087326 3.3 綜合評價結(jié)果分析 PAGEREF _Toc390087326 h 25 HYPERLINK l _Toc390087327 結(jié) 論 PAGEREF _Toc390087327 h 27 HYPERLINK l _Toc390087328 致 謝 PAGEREF _Toc390087328 h 28 HYPERLINK l _Toc390087329 參考文獻(xiàn) PAGEREF _Toc

16、390087329 h 29Contents TOC o 1-3 h z u HYPERLINK l _Toc390088799 Abstract PAGEREF _Toc390088799 h I HYPERLINK l _Toc390088800 Abstract PAGEREF _Toc390088800 h II HYPERLINK l _Toc390088801 Chapter 1 Introduction PAGEREF _Toc390088801 h 1 HYPERLINK l _Toc390088802 1.1 The background of the selected to

17、pic and put forward PAGEREF _Toc390088802 h 1 HYPERLINK l _Toc390088803 1.1.1 The background of the selected topic PAGEREF _Toc390088803 h 1 HYPERLINK l _Toc390088804 1.1.2 Topic selection is put forward PAGEREF _Toc390088804 h 2 HYPERLINK l _Toc390088805 1.2 Subject of meaning and purpose PAGEREF _

18、Toc390088805 h 3 HYPERLINK l _Toc390088806 1.2.1 The significance of topic selection PAGEREF _Toc390088806 h 3 HYPERLINK l _Toc390088807 1.1.2 The purpose of the topic PAGEREF _Toc390088807 h 3 HYPERLINK l _Toc390088808 1.3 The principal component analysis and factor analysis of the development and

19、application PAGEREF _Toc390088808 h 4 HYPERLINK l _Toc390088809 1.3.1 Principal component analysis of the development and application PAGEREF _Toc390088809 h 4 HYPERLINK l _Toc390088810 1.3.2 The development and application of factor analysis PAGEREF _Toc390088810 h 4 HYPERLINK l _Toc390088811 1.4 T

20、he main research contents in this paper PAGEREF _Toc390088811 h 5 HYPERLINK l _Toc390088812 Chapter 2 principal components and factor analysis PAGEREF _Toc390088812 h 6 HYPERLINK l _Toc390088813 2.1 The content of the principal component analysis PAGEREF _Toc390088813 h 6 HYPERLINK l _Toc390088814 2

21、.1.1 Principle of principal component analysis and basic ideas PAGEREF _Toc390088814 h 6 HYPERLINK l _Toc390088815 2.1.2 The geometric meaning of the principal component PAGEREF _Toc390088815 h 6 HYPERLINK l _Toc390088816 2.1.3 The nature of the principal component analysis PAGEREF _Toc390088816 h 8

22、 HYPERLINK l _Toc390088817 2.2 The principal component analysis method and mathematical model PAGEREF _Toc390088817 h 8 HYPERLINK l _Toc390088818 2.3 The basic steps of principal component analysis PAGEREF _Toc390088818 h 11 HYPERLINK l _Toc390088819 2.4 The content of the factor analysis PAGEREF _T

23、oc390088819 h 12 HYPERLINK l _Toc390088820 2.4.1 Factor analysis principle and basic ideas PAGEREF _Toc390088820 h 12 HYPERLINK l _Toc390088821 2.4.2 The nature of the factor analysis PAGEREF _Toc390088821 h 13 HYPERLINK l _Toc390088822 2.5 The method of calculating the factor analysis and mathemati

24、cal model PAGEREF _Toc390088822 h 13 HYPERLINK l _Toc390088823 2.5.1 Mathematical model (orthogonal factor model) PAGEREF _Toc390088823 h 13 HYPERLINK l _Toc390088824 2.5.2 Factor model of public factor, factor loading amount of statistical significance PAGEREF _Toc390088824 h 14 HYPERLINK l _Toc390

25、088825 2.5.3 Factor rotation and factor score PAGEREF _Toc390088825 h 15 HYPERLINK l _Toc390088826 2.6 Calculation steps PAGEREF _Toc390088826 h 16 HYPERLINK l _Toc390088827 Chapter 3 Principal component analysis and factor analysis in the application of urban economy in heilongjiang province PAGERE

26、F _Toc390088827 h 17 HYPERLINK l _Toc390088828 3.1 Principal component analysis PAGEREF _Toc390088828 h 18 HYPERLINK l _Toc390088829 3.2 The factor analysis method PAGEREF _Toc390088829 h 21 HYPERLINK l _Toc390088830 3.3 Comprehensive evaluation results PAGEREF _Toc390088830 h 25 HYPERLINK l _Toc390

27、088831 Conclusions PAGEREF _Toc390088831 h 27 HYPERLINK l _Toc390088832 Acknowledgements PAGEREF _Toc390088832 h 28 HYPERLINK l _Toc390088833 References PAGEREF _Toc390088833 h 29PAGE PAGE 31第1章 緒 論1.1 選題的背景和提出1.1.1 選題的背景經(jīng)濟的發(fā)展不僅僅意味著 HYPERLINK /view/338341.htm t _blank 國民經(jīng)濟規(guī)模的擴大,更意味著經(jīng)濟和 HYPERLINK /vi

28、ew/517282.htm t _blank 社會生活素質(zhì)的提高。所以,經(jīng)濟發(fā)展涉及的內(nèi)容比單純的 HYPERLINK /view/73375.htm t _blank 經(jīng)濟增長更為廣泛。 就現(xiàn)代經(jīng)濟而言,發(fā)展的含義十分豐富復(fù)雜。發(fā)展總是與發(fā)達(dá)、 HYPERLINK /view/143403.htm t _blank 工業(yè)化、 HYPERLINK /view/124658.htm t _blank 現(xiàn)代化、增長之間交替使用。 一般來說,經(jīng)濟發(fā)展包括三種含義1:第一種,經(jīng)濟量的增長,即一個 HYPERLINK /view/8426.htm t _blank 國家或地區(qū)產(chǎn)品和 HYPERLINK

29、/view/148928.htm t _blank 勞務(wù)的增加,它是經(jīng)濟發(fā)展的物質(zhì)基礎(chǔ);第二種, HYPERLINK /view/187174.htm t _blank 經(jīng)濟結(jié)構(gòu)的改善,即一個 HYPERLINK /view/8426.htm t _blank 國家或地區(qū)的技術(shù)、 HYPERLINK /view/61661.htm t _blank 產(chǎn)業(yè)結(jié)構(gòu)、收入分配、 HYPERLINK /view/245611.htm t _blank 消費結(jié)構(gòu)及 HYPERLINK /view/522382.htm t _blank 人口結(jié)構(gòu)等經(jīng)濟結(jié)構(gòu)的變化;第三種,經(jīng)濟質(zhì)量的完善和提升,即一個 HYP

30、ERLINK /view/8426.htm t _blank 國家或地區(qū) HYPERLINK /view/188272.htm t _blank 經(jīng)濟效益的提升、 HYPERLINK /view/629948.htm t _blank 經(jīng)濟穩(wěn)定程度、衛(wèi)生健康狀況的完善、自然環(huán)境和 HYPERLINK /view/30800.htm t _blank 生態(tài)平衡以及政治、文化和人的現(xiàn)代化進(jìn)程。在近10年加快改革開放的步伐中,我國地區(qū)之間的發(fā)展不平衡呈現(xiàn)了不斷的加劇局面。有調(diào)查顯示,目前中國城市與農(nóng)村發(fā)展差異化比較嚴(yán)重,在第九個五年計劃期間所統(tǒng)計到的數(shù)據(jù)顯示,中國農(nóng)業(yè)從業(yè)者的收入一直在下降,糧食產(chǎn)品

31、的價格也在下降,雖然收成增產(chǎn)了,但收入?yún)s不見增加,地方政府對城市經(jīng)濟發(fā)展的重視程度要遠(yuǎn)遠(yuǎn)大于農(nóng)業(yè)。除了造成了農(nóng)村經(jīng)濟發(fā)展失衡外,也促使了城市經(jīng)濟發(fā)展過程中貧富差距問題的深化,也使社會分配不公平現(xiàn)象得到劇增,更令社會當(dāng)中不穩(wěn)定的因素有所增加。除去城鄉(xiāng)發(fā)展不平衡,我國東中西部發(fā)展差距也較大,主要表現(xiàn)在以下兩方面:一是在資本存量方面:沿海地區(qū)由于開放得比較早,以鄉(xiāng)鎮(zhèn)企業(yè)為代表的民營經(jīng)濟迅速增長,資本大量累積;同時因為改革開放一系列優(yōu)惠政策的實施,成功地吸引了大量國外資本的輸入,這為沿海地區(qū)快速的經(jīng)濟增長提供了充足的資本投入。但是由于中西部地理位置和政策的影響資本存量都不及東部,而而還有愈演愈烈的趨勢

32、。二是科技投入方面:東部是優(yōu)勢地區(qū),據(jù)調(diào)查顯示1990年東部地區(qū)從事科技活動人數(shù)是中部地區(qū)的2倍,西部地區(qū)的3倍;迄今,東部此類人才數(shù)量增加到中部的2.5倍,西部的4倍。尤其是在2000年東部從事科技活動人員比上年激增48%,但中西部地區(qū)同期分別只增長了19%、32%。東部地區(qū)20世紀(jì)90年代以來加大了研發(fā)經(jīng)費投入力度,2000年東部研發(fā)經(jīng)費支出比上年增長了87%,到2010這一年經(jīng)費開支增加到2000年的2.4倍,而中西部地區(qū)研發(fā)經(jīng)費支出基本保持1.31的態(tài)勢,在1990到1999年增長較慢,2000年開始逐年穩(wěn)步增長,但從絕對數(shù)量來看遠(yuǎn)低于東部地區(qū)。經(jīng)濟發(fā)展不能以危害環(huán)境為代價,可持續(xù)發(fā)展

33、的要求是一個 HYPERLINK /view/8426.htm t _blank 國家或地區(qū)的發(fā)展不能影響其他國家或地區(qū)的發(fā)展,可持續(xù)性則意味著維持全人類福利的 HYPERLINK /view/9306.htm t _blank 自然資源基礎(chǔ),使 HYPERLINK /view/30803.htm t _blank 生態(tài)環(huán)境和經(jīng)濟社會 HYPERLINK /view/1646035.htm t _blank 協(xié)調(diào)全面地發(fā)展。了解我國各省市經(jīng)濟發(fā)展情況對推動我國經(jīng)濟發(fā)展有著重要作用,所以對各省經(jīng)濟的研究是很必要的。1.1.2 選題的提出黑龍江省位于中國東北部,是我國著名的老工業(yè)基地,2008年全

34、年實現(xiàn)地區(qū)生產(chǎn)總值(GDP)8310.0億元,在各省自治區(qū)中排名17位,按可比價格計算比上年增長11.8%,連續(xù)五年保持11.6%以上的增幅,整體經(jīng)濟繼續(xù)在較高的增長平臺運行。其中,第一產(chǎn)業(yè)增加了1089.1億元,增長8.2%;第二產(chǎn)業(yè)增加了4365.9億元,增長12.1%;第三產(chǎn)業(yè)增加了2855億元,增長12.4%。三次產(chǎn)業(yè)構(gòu)成為13.1:52.5:34.4。第一、二、三產(chǎn)業(yè)對GDP的增長貢獻(xiàn)率分別為7.8%、55.7%和36.5%。人均地區(qū)生產(chǎn)總值為21727元,增長11.7%。經(jīng)濟發(fā)展布局進(jìn)一步優(yōu)化。全年哈大齊工業(yè)走廊項目區(qū)實現(xiàn)工業(yè)總產(chǎn)值296.4億元,比上年增長37.6%;創(chuàng)造利稅46

35、.5億元,增長92.1%。全年完成固定資產(chǎn)投資投資117.8億元,增加241項新開工項目,新增入251戶區(qū)企業(yè),新增了182戶的投產(chǎn)企業(yè)。東部煤電化基地建設(shè)區(qū)充分挖掘和發(fā)揮電力、煤化工、冶金、建材原料、生物工程等產(chǎn)業(yè)的優(yōu)勢,堅持走新型工業(yè)化道路。東北亞經(jīng)濟貿(mào)易開發(fā)區(qū)積極主動推進(jìn)區(qū)域的經(jīng)濟貿(mào)易合作,打造了面向東北亞、亞歐大陸的經(jīng)濟貿(mào)易開發(fā)區(qū)。加快大小興安嶺生態(tài)功能保護(hù)區(qū)發(fā)展特色產(chǎn)業(yè)、生態(tài)產(chǎn)業(yè)等替代產(chǎn)業(yè),優(yōu)化產(chǎn)業(yè)結(jié)構(gòu),加快基礎(chǔ)設(shè)施建設(shè),努力形成以生態(tài)經(jīng)濟為主的產(chǎn)業(yè)格局。兩大平原農(nóng)業(yè)綜合開發(fā)試驗區(qū)主要抓好農(nóng)業(yè)基礎(chǔ)建設(shè)、農(nóng)業(yè)結(jié)構(gòu)調(diào)整,做大做強畜牧產(chǎn)業(yè),以大力推進(jìn)農(nóng)業(yè)標(biāo)準(zhǔn)化、規(guī)?;彤a(chǎn)業(yè)化經(jīng)營,致力于打

36、造銷售收入千億元以上龍頭企業(yè)集群,創(chuàng)出一批知名品牌。北國風(fēng)光特色旅游開發(fā)區(qū)積極開發(fā)具有國際性、地域性和市場競爭力較強的旅游精品和品牌。哈牡綏東對俄貿(mào)易加工區(qū)的對內(nèi)對外開放戰(zhàn)略升級逐步加快。增強了高新科技產(chǎn)業(yè)集中開發(fā)區(qū)發(fā)揮高新技術(shù)集聚效應(yīng),發(fā)展取得積極進(jìn)展的有服務(wù)外包產(chǎn)業(yè)、動漫基地。黑龍江省主要有12個地級市,這些城市的綜合發(fā)展是帶動周邊地區(qū)經(jīng)濟發(fā)展的重要動力。這些城市的發(fā)展?fàn)顩r直接關(guān)系到城市自身和周邊地區(qū)(尤其是小城鎮(zhèn))的進(jìn)步,對這些城市進(jìn)行分析評價,從而有效的根據(jù)城市的實際情況,采取促進(jìn)經(jīng)濟和社會發(fā)展的有效措施。對黑龍江省的經(jīng)濟研究的現(xiàn)況是沒有把這12個城市放在一起進(jìn)行多指標(biāo)綜合評價。而目前

37、國內(nèi)外關(guān)于多指標(biāo)綜合評價的方法很多,根據(jù)權(quán)重確定方法的不同,這些方法可大致分為兩類;一類是主觀賦權(quán)法,如層次分析法,德爾菲法等,多是采用綜合咨詢評分的定向方法,這類方法因受到人為因素的影響,往往會夸大或降低了某些指標(biāo)的作用,致使排序的結(jié)果不能完全真實地反應(yīng)事物間真實關(guān)系;另一類是客觀賦權(quán)法,即根據(jù)各指標(biāo)間的相關(guān)關(guān)系或各指標(biāo)值的變異程度來確定權(quán)數(shù),避免了人為因素帶來的偏差,如主成分分析法和因子分析法。1.2 選題的意義和目的1.2.1 選題的意義經(jīng)濟是指一個國家國民經(jīng)濟的總稱2。區(qū)域經(jīng)濟是在一定區(qū)域內(nèi)經(jīng)濟發(fā)展的內(nèi)部因素與外部條件相互影響而形成的綜合性經(jīng)濟概念,它受到該區(qū)域的自然條件、資源開發(fā)和利

38、用狀況、社會經(jīng)濟條件以及經(jīng)濟政策等各種因素的制約和影響。經(jīng)濟發(fā)展為一個國家擺脫貧困落后狀態(tài),走向經(jīng)濟和社會生活現(xiàn)代化的過程。區(qū)域經(jīng)濟發(fā)展不僅意味著該區(qū)域國民經(jīng)濟規(guī)模的擴大,更意味著經(jīng)濟和社會生活素質(zhì)的提高。我們要提高某地方人民的生活水平,要更好更快地發(fā)展某個地方,就必須充分了解這個地方現(xiàn)有的經(jīng)濟發(fā)展?fàn)顩r。因此,現(xiàn)有的經(jīng)濟發(fā)展?fàn)顩r研究對將來的發(fā)展有著非常重要的指導(dǎo)意義。1.2.2 選題的目的本文利用主成分分析和因子分析的方法對經(jīng)濟發(fā)展水平進(jìn)行綜合分析,按照城市的經(jīng)濟實力評價各城市的發(fā)展層次,認(rèn)識到城市之間競爭力的差異,城市經(jīng)濟發(fā)展的優(yōu)勢和劣勢,從而促進(jìn)各省經(jīng)濟全面、協(xié)調(diào)、共同發(fā)展。1.3 主成分

39、分析和因子分析的發(fā)展及應(yīng)用1.3.1 主成分分析的發(fā)展及應(yīng)用主成分分析也稱主分量分析,旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個綜合指標(biāo)。首先是由K皮爾森對非隨機變量引入的3,而后H霍特林將此方法推廣到隨機變量的情形。信息的大小通常用離差平方和或方差來衡量。在實際課題中,為了全面分析問題,往往提出很多與此有關(guān)的變量(或因素)因為每個變量都在不同程度上反映這個課題的客觀信息。在實際問題研究中,為了全面、系統(tǒng)地分析問題,我們必須考慮眾多影響因素。在用統(tǒng)計方法研究多變量問題時,變量太多會增加計算量和增加分析問題的復(fù)雜性,人們希望在進(jìn)行定量分析的過程中,涉及的變量較少,得到的信息量較多。主成分分析正是

40、適應(yīng)這一要求產(chǎn)生的,是解決這類題的理想工具。主成分分析往往會在大型研究中成為一個中間環(huán)節(jié),用于解決數(shù)據(jù)信息濃縮等問題,這就可能產(chǎn)生各種各樣的組合方法。主成分所關(guān)心的問題,是通過一組變量的幾個線性組合來解釋這組變量的方差-協(xié)方差結(jié)構(gòu),它的一般目的是數(shù)據(jù)的壓縮以及數(shù)據(jù)的解釋。在一些歐美國家用核主成分分析的方法也就是主成分分析的改進(jìn)方法,其采用非線性方法提取主成分,把核主成分分析應(yīng)用到人臉識別中。在國外運用主成分分析的方法對肝素鈉、肝素鈣等低分子肝素相關(guān)產(chǎn)品的銷售額數(shù)據(jù)進(jìn)行處理,形成新的指標(biāo)體系,而后應(yīng)用BP神經(jīng)網(wǎng)絡(luò)的方法建立模型,評價模型的擬合能力。在日本運用主成分分析的方法對地質(zhì)行分析,從而來預(yù)

41、測地震避免不必要的損失。同時,主成分作為一種優(yōu)秀的降維提取主要信息的手段,先后在海洋學(xué)、地質(zhì)學(xué)、地球物理學(xué)、資源科學(xué)等中都得到了一定程度的應(yīng)用。我國經(jīng)過近幾十年來的發(fā)展,運用主成分分析的方法對高光譜遙感礦物信息特征提取已經(jīng)取得了很大進(jìn)展。在國內(nèi)運用主成分分析的方法對人口、教育、地區(qū)的經(jīng)濟發(fā)展等方面研究,都取得了一定的成果。1.3.2 因子分析的發(fā)展及應(yīng)用在對某一個問題進(jìn)行論證分析時,采集大量多變量的數(shù)據(jù)能為我們的研究分析提供更為豐富的信息和增加分析的精確度。然而,這種方法不僅需要巨大的工作量,并且可能會因為變量之間存在相關(guān)性而增加了我們研究問題的復(fù)雜性。因而分析法就是從研究變量內(nèi)部相關(guān)的依賴關(guān)

42、系出發(fā)把一些具有錯綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個綜合因子的一種多變量統(tǒng)計分析方法。這樣我們就對原始的數(shù)據(jù)進(jìn)行分類歸并,將相關(guān)比較密切的變量分別歸類,歸結(jié)多個綜合指標(biāo),這些綜合指標(biāo)互不相關(guān),即它們所綜合的信息互相不重疊。這些綜合指標(biāo)就稱為因子或公共子因子。因子分析法是兩種分析形式的 HYPERLINK /view/7841327.htm t _blank 統(tǒng)一體,即驗證性分析和純粹的探索性分析。因子分析最早是由英國的 HYPERLINK /view/4268.htm t _blank 心理學(xué)家CharlesSpearman在1904年的時候,提出單一化的智能因子(ASingleIntellect

43、ualFactor)開始。隨著試驗的深入,大量個體樣本被分析研究,證明了Spearman的單一智能因子理論是不充分的。同時,人們漸漸認(rèn)識到有必要考慮多元因子。20世紀(jì)30年代,瑞典心理學(xué)家Thurstone打破了流行的單因子理論假設(shè),經(jīng)長期實踐研究,他大膽提出了多元因子分析(MultipleFactorAnalysis)理論。Thurstone在他的心智向量(VectorsofMind,1935)一書中,闡述了多元因子分析理論的數(shù)學(xué)和邏輯基礎(chǔ)。因子分析的基本目的就是用少數(shù)幾個因子去描述許多指標(biāo)或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個變量歸在同一類中,每一類變量就成為一個因子(之所以稱其為因子,

44、是因為它是不可觀測的,即不是具體的變量),以較少的幾個因子反映原資料的大部分信息。因子分析法(FactorAnalysis)就是尋找這些公共因子的模型分析方法,它是在主成分的基礎(chǔ)上構(gòu)筑若干意義較為明確的公因子,以它們?yōu)榭蚣芊纸庠兞浚源丝疾煸兞块g的聯(lián)系與區(qū)別4。因子分析在市場調(diào)研中有著廣泛的應(yīng)用,主要包括:經(jīng)濟發(fā)展的研究、評價指標(biāo)結(jié)構(gòu)、消費者習(xí)慣和態(tài)度研究(U&A)、品牌形象和特性研究、服務(wù)質(zhì)量調(diào)查、個性測試、形象調(diào)查、市場劃分識別、顧客、產(chǎn)品和行為分類。1.4 本文主要研究內(nèi)容本文首先是了解了國內(nèi)外經(jīng)濟發(fā)展的基礎(chǔ)及黑龍江省經(jīng)濟發(fā)展的現(xiàn)狀,接著學(xué)習(xí)研究主成分分析和因子分析的基本思路和步驟,

45、并將其理論與本文所研究的內(nèi)容結(jié)合,其目的在于找到目前影響黑龍江省經(jīng)濟發(fā)展指標(biāo)的主要因素,并根據(jù)得到的數(shù)學(xué)模型對黑龍江省經(jīng)濟發(fā)展情況進(jìn)行綜合分析。然后通過學(xué)習(xí)與查閱相關(guān)資料找到黑龍江省12個地級市的10個具有代表性指標(biāo),運用spss統(tǒng)計分析軟件對這些指標(biāo)進(jìn)行主成分分析和因子分析得到特征值、方差貢獻(xiàn)率及公共因子等相關(guān)數(shù)據(jù)。并利用這些數(shù)據(jù)對12個市經(jīng)濟水平劃分等級。最后對論文進(jìn)行總體的評價,指出本文的不足,以期待改進(jìn)的新方案。第2章 主成分與因子分析2.1 主成分分析的內(nèi)容2.1.1 主成分分析原理和基本思想Karl parson在1901年最先引進(jìn)了主成分的概念5,但是當(dāng)時只是對非隨機變量討論的。

46、Hotelling在1933年將這個概念推廣到隨機變量。主成分分析的思想是降維,在損失很少信息的前提下把多個指標(biāo)轉(zhuǎn)化為較少的幾個綜合指標(biāo)。通常情況下將轉(zhuǎn)化生成的綜合指標(biāo)稱為主成分,原始變量的線性組合就是每個主成分,且各個主成分之間是各不相關(guān)的,這就使得主成分比原始變量具有更優(yōu)越的性能3。通常數(shù)學(xué)上的處理就是將原來個指標(biāo)作線性組合,作為新的綜合指標(biāo),但是這種現(xiàn)行組合,如果不加以限制,則可以有很多,我們應(yīng)該選取方差最大的作為第一主成分,較大的作為第二主成分,一次類推可以構(gòu)造出第三、四,等個主成分。不難想像這些主成分之間不僅不相關(guān),而且他們的方差一次遞減。因此在實際問題中,就挑選前幾個最大成分,雖然

47、這樣會損失一些信息,但是由于它使我們抓住了主要矛盾,并從原始數(shù)據(jù)中進(jìn)一步提取了某些新信息,因為在某次額實際工作中的研究中得益較多,這種不僅減少了變量的數(shù)目還抓住了主要矛盾的做法更有利于問題的分析和處理。2.1.2 主成分的幾何意義從代數(shù)學(xué)的點看,成分就是個變量的一些特殊的線性組合6,在幾何上這些線性組合正是把構(gòu)成的坐標(biāo)系旋轉(zhuǎn)產(chǎn)生的新坐標(biāo)系,新坐標(biāo)軸使之通過樣品變差最大方向(或說具有最大的樣品方差)。下面以最簡單的二元正態(tài)變量來說明主成分的幾何意義6。設(shè)有個樣品,每個樣品有個變量記為,它們的綜合變量記為。當(dāng)時,原變量是設(shè)它們有圖3-1的相關(guān)關(guān)系: 圖3-1 相關(guān)關(guān)系圖對于二元正態(tài)分布變量,個點的

48、散步大致為一個橢圓,若在橢圓長軸方向取坐標(biāo)軸,在短軸方向取,這相當(dāng)于在平面上作一個坐標(biāo)變換,即按逆時針方向旋轉(zhuǎn)角度,根據(jù)旋軸變換公式新老坐標(biāo)之間有關(guān)系: 我們看到,是原變量和的線性組合,用矩陣表示是顯然。從上圖還容易看出二維平面上的個點的波動(可用方差表示)大部分可以歸結(jié)為在軸上的波動,而在軸上的波動是較小的。如果上圖的橢圓是相當(dāng)扁平的,那么我們可以只考慮方向上的波動,忽略方向的波動。這樣一來,二維可以降為一維了,只取第一個綜合變量即可。而是橢圓的長軸。一般情況,個變量組成維空間,個樣品就是維空間的個點,對元正態(tài)分布變量來說,找主成分的問題就是找維空間中橢球體的主軸問題。2.1.3 主成分分析

49、的性質(zhì)(1) 各主成分之間互不相關(guān),若原變量服從正態(tài),則各主成分之間互相獨立7;(2) 全部個主成分所反映的例樣品的總信息,等于個原變量的總信息。信息量的多少,用變量的方差來度量。若將個原變量標(biāo)準(zhǔn)化后,每個變量的方差都為,故方差之和為,此時,求得主成分的方差之和也為;(3) 各主成分的作用大小是:(4) 第個主成分的貢獻(xiàn)率是()100,為貢獻(xiàn)率之和;(5) 前個主成分的累計貢獻(xiàn)率是()100。在應(yīng)用時,一般取累計貢獻(xiàn)率為7085或以上所對應(yīng)的前個主成分即可。在資料所含的變量個數(shù)、樣品數(shù)及累計貢獻(xiàn)率固定的前提下,的比值越小,則說明此資料用主成分分析越合適。2.2 主成分分析的求解方法和數(shù)學(xué)模型求

50、解主成分的方法主要有兩種,一是從原始變量的協(xié)方差矩陣結(jié)構(gòu)入手,二是從原始變量的相關(guān)性矩陣結(jié)構(gòu)入手。(1) 從協(xié)方差矩陣出發(fā)求解主成分為8:設(shè)矩陣,將的特征值依大小順序排列,不妨設(shè)為矩陣各特征值對應(yīng)的標(biāo)準(zhǔn)正交特征向量,則對任意向量有 所以我們把的協(xié)方差矩陣的非零特征值,對應(yīng)的標(biāo)準(zhǔn)化特征像量,分別作為系數(shù)向量分別稱為隨機向量的第一主成分,第二主成分,,第主成分。于是隨機與隨機向量之間存在關(guān)系: (2-1)(2) 從相關(guān)系數(shù)矩陣出發(fā)求解主成分為:首先數(shù)據(jù)矩陣元素進(jìn)行標(biāo)準(zhǔn)化 (2-2)式中,和分別表示變量的期望與方差,于是有 (2-3)于是對原始變量進(jìn)行如下標(biāo)準(zhǔn)化: (2-4)顯然有 (2-5)因此,

51、原始變量的相關(guān)矩陣實際是對原始變量標(biāo)準(zhǔn)化后的協(xié)方差陣。由相關(guān)陣求主成分的過程與主成分個數(shù)的確定準(zhǔn)則實際上是與由協(xié)方差陣出發(fā)求主成分的過程與主成分個數(shù)的確定準(zhǔn)則是一致的。求得的主成分與原始變量表示為:。 數(shù)學(xué)模型設(shè)有個樣品,每個樣品觀測項指標(biāo)(變量):,得到原始數(shù)據(jù)資料庫: (2-6)其中, 。用數(shù)據(jù)矩陣的個向量(即個指標(biāo)向量)作線性組合(即綜合指標(biāo)向量)為9: (2-7)上述方程要求:且系數(shù)由下列原則決定: (1) 與不相關(guān);(2) 是與的一切線性組合(系數(shù)滿足上述方程組)中方差最大的,與是不相關(guān)的的一切線性相關(guān)中方差最大的,是與都不相關(guān)的的所有線性組合的最大者。這里要說明兩點:一個是數(shù)學(xué)模型

52、中為什么作線性組合?基于兩種原因: = 1 * GB3 數(shù)學(xué)上比較容易處理 = 2 * GB3 在實踐中效果很好。另一個要說明的是每次選取的主成分要使Var()最大,如果不加限制就可使Var(),這樣就沒什么意義了,常用的限制是要求,。2.3 主成分分析的基本步驟設(shè)原始資料矩陣為:(1) 將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理:進(jìn)行標(biāo)準(zhǔn)化的目的在于消除原始數(shù)據(jù)各指標(biāo)的量綱不同,公式如下: (2-8)其中為每一列指標(biāo)的標(biāo)準(zhǔn)值;為每一列指標(biāo)的均方差。標(biāo)準(zhǔn)化處理后,得到新的矩陣(2) 建立變量的相關(guān)系數(shù)陣:根據(jù)公式建立樣本的相關(guān)系數(shù)矩陣;(3) 求特征根和特征向量:根據(jù)公式求出其前個特征值根據(jù)公式解出與特征值對應(yīng)

53、的單位正交化特征向量。4. 寫出主成分將原變量轉(zhuǎn)換成主成分的線性組合,且具有正交特征,綜合成為相應(yīng),而基本信息量保持不變。這樣確定的綜合變量分別稱作原變量的第一、第二、第個主成分,且應(yīng)在總方差中所占比例依次遞減。2.4 因子分析的內(nèi)容2.4.1 因子分析原理和基本思想1904年,Charles Spearman發(fā)表一篇著名論文對智力檢驗得分進(jìn)行統(tǒng)計分析視為因子分析的起點10。因子分析的形成和發(fā)展有相當(dāng)長的歷史,最早用以研究解決心理學(xué)和教育學(xué)方面的問題,由于計算量大,又缺少高速計算的設(shè)備使因子分析的應(yīng)用和發(fā)展受到很大的限制,甚至停滯了很長的時間。后來,由于電子計算機的出現(xiàn),才使因子分析的理論研究

54、和計算問題,有了很大的進(jìn)展。目前這一方法的應(yīng)用范圍已十分廣泛,在經(jīng)濟學(xué)、社會學(xué)、考古學(xué)、生物學(xué)、醫(yī)學(xué)、地質(zhì)學(xué)以及體育科學(xué)等各個領(lǐng)域都取得了顯著的成績。因子分析是主成分分析的推廣和發(fā)展,它也是將具有錯綜復(fù)雜關(guān)系的變量(或樣品)綜合為數(shù)量較少的幾個因子,以再現(xiàn)原始變量與因子的相互關(guān)系,同時根據(jù)不同因子還可以對變量進(jìn)行分類,它也是屬于多元分析中處理降維的一種統(tǒng)計方法。因子分析的基本思想是通過變量(或樣品)的相關(guān)系數(shù)矩陣(對樣品是相似系數(shù)矩陣)內(nèi)部結(jié)構(gòu)的研究,找出能控制所有變量(或樣品)的少數(shù)幾個隨機變量去描述多個變量(或樣品)之間的相關(guān)(相似)關(guān)系,但在這里,這少數(shù)幾個隨機變量是不可觀測的,通常稱為

55、因子。然后根據(jù)相關(guān)性的大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,但不同的變量相關(guān)性較低。因為因子分析的內(nèi)容很豐富,本文僅介紹因子分析常用的兩種類型:型因子分析(對變量作因子分析)和型因子分析(對樣品作因子分析)。2.4.2 因子分析的性質(zhì)因子分析是主成分分析的推廣,也是一種把多個變量化為少數(shù)幾個綜合變量的多變量分析方法,其目的是用有限個不可觀測的隱變量解釋原始變量之間的相關(guān)關(guān)系11。因子性質(zhì)主要表現(xiàn)變量之間關(guān)聯(lián)度上,根據(jù)關(guān)聯(lián)度可以劃分為特殊因子和公共因子,利用因子分析,減少分析變量個數(shù),通過對變量的相關(guān)關(guān)系探測,將原始變量進(jìn)行分類。其中共同度表明的第個分量對于的每一分量共同依賴程度。如果

56、它的值越大,依賴程度就越大.方差貢獻(xiàn)是衡量公共因子相對重要性的指標(biāo)。越大,表明公共因子對的貢獻(xiàn)越大,或者說對的影響和作用就越大12。2.5 因子分析的求解方法和數(shù)學(xué)模型2.5.1 型因子分析數(shù)學(xué)模型13簡記為且滿足:i) ;ii) 即和是不相關(guān)的;iii) 即不相關(guān)且方差皆為1. 即不相關(guān),且方差不同。其中是可實測的個指標(biāo)所構(gòu)成的維隨機向量,是不可觀測的向量,稱為的公共因子或潛因子,即前面所說的綜合變量,可以把它們理解為高維空間中相互垂直的個坐標(biāo)軸;稱為因子載荷是第個變量在第個公共因子上的負(fù)荷,如果把變量看成維因子空間中的一個向量,則表示在坐標(biāo)軸上的投影,矩陣稱為因子載荷矩陣;稱為的特殊因子,

57、通常理論上要求的協(xié)方差陣是對角陣,包括隨機誤差14。因子分析的目的就是通過模型以代替,由于,從而達(dá)到簡化變量維數(shù)的愿望。2.5.2 因子模型中公共因子,因子載荷量的統(tǒng)計意義為了便于對因子分析計算結(jié)果做解釋,將因子分析數(shù)學(xué)模型中各個量的統(tǒng)計意義加以說明是十分必要的。假定因子模型中,各個變量以及公共因子、特殊因子都已經(jīng)是標(biāo)準(zhǔn)化(均值為0,方差為1)的變量15。(1) 因子載荷的統(tǒng)計意義已知模型:由于在標(biāo)準(zhǔn)化下有:因此,公式中F同一所以上式可寫成: (因為各因子不相關(guān),所以相關(guān)系數(shù)為0)故因子載荷的統(tǒng)計意義就是第個變量與第個公共因子的相關(guān)系數(shù)即表示依賴的分量(比重)。因此用統(tǒng)計學(xué)的術(shù)語應(yīng)該叫做權(quán),但

58、由于歷史的原因,心理學(xué)家將它叫做載荷,即表示第個變量在第個公共因子上的負(fù)荷,它反映了第個變量在第個公共因子上的相對重要性。(2) 公因子的方差貢獻(xiàn)率的統(tǒng)計意義將因子載荷矩陣中各列元素的平方和記為 稱為公共因子對的貢獻(xiàn),即表示同一公共因子對諸變量所提供的方差貢獻(xiàn)之總和,它是衡量公共因子相對重要性指標(biāo)。 2.5.3 因子旋轉(zhuǎn)與因子得分建立因子分析數(shù)學(xué)模型的目的不僅要找出公共因子以及對變量進(jìn)行分組,更重要的是要知道每個因子的意義,以便對實際問題作出科學(xué)的分析,如果每個公共因子的涵義不清,不便于進(jìn)行實際背景的解釋,這時根據(jù)因子載荷陣的不唯一性,可對因子載荷陣實行旋轉(zhuǎn)即用一個正交陣右乘使旋轉(zhuǎn)后的因子載荷

59、陣結(jié)構(gòu)簡化,便于對公共因子進(jìn)行解釋。所謂結(jié)構(gòu)簡化就是使每個變量僅在一個公共因子上有較大的載荷,而在其余公共因子上的載荷比較小,至多是中等大小。這種變換因子載荷的方法稱為因子軸的旋轉(zhuǎn),而旋轉(zhuǎn)的方法有很多。如正交旋轉(zhuǎn),斜交旋轉(zhuǎn)等。因子分析的最后一步是計算因子得分。因子變量確定后,便可計算各因子得分即每個樣本上的具體數(shù)值,新變量形成了因子變量,它和原變量的得分是相對應(yīng)的。想要在以后分析中用因子變量代替原有變量進(jìn)行數(shù)據(jù)建模,就要有因子得分,或利用因子變量對樣本進(jìn)行分類或評價等研究,進(jìn)而實現(xiàn)降維和簡化的目標(biāo)16。2.6 計算步驟因子分析法的步驟入下:(1) 將原始數(shù)據(jù)標(biāo)準(zhǔn)化,為書寫方便記為;(2) 建立

60、變量的相系數(shù)陣;(3) 求的特征根及相應(yīng)的單位特征向量,分別記為和;(4) 對施行方差最大正交旋轉(zhuǎn);(5) 計算因子得分。第3章 主成分與因子分析在黑龍江省 城市經(jīng)濟水平研究中的應(yīng)用對黑龍江省12個地級市選取10個主要經(jīng)濟指標(biāo)17(見表3-1),-國內(nèi)生產(chǎn)總值(億元)、-工業(yè)總產(chǎn)值(億元)、-人均GDP(元)、-工業(yè)企業(yè)單位數(shù)(個)、-固定資產(chǎn)投資(億元)、-社會消費品零售總額(億元)、-財政收入(萬元)、-金融機構(gòu)存款年底余額(億元)、-年末人口數(shù)(萬人)、-財政支出(萬元)。運用spss軟件進(jìn)行主成分和因子分析。表3-1 經(jīng)濟指標(biāo)城市哈爾濱4550.22503.74581011424127

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論