版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
SPSS統(tǒng)計(jì)分析第10章主成分分析和因子分析1SPSS統(tǒng)計(jì)分析第10章主成分分析和因子分析1主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.2主成分分析10.3因子分析主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.1主成分分析和因子分析簡(jiǎn)介10.1.1基本概念和主要用途(1)基本概念
主成分分析就是考慮各指標(biāo)之間的相互關(guān)系,利用降維的方法將多個(gè)指標(biāo)轉(zhuǎn)換為少數(shù)幾個(gè)互不相關(guān)的指標(biāo),從而使進(jìn)一步研究變得簡(jiǎn)單的一種統(tǒng)計(jì)方法。主成分分析是由Hotelling于1933年首先提出的,是利用“降維”的思想,在損失很少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo),稱(chēng)為主成分。每個(gè)主成分均是原始變量的線性組合,且各個(gè)主成分之間互不相關(guān),這就使得主成分比原始變量具有某些更優(yōu)越的性能。
因子分析是一種通過(guò)顯在變量測(cè)評(píng)潛在變量,通過(guò)具體指標(biāo)測(cè)評(píng)抽象因子的分析方法,最早是由心理學(xué)家ChalesSpearman在1904年提出的,它的基本思想是將實(shí)測(cè)的多個(gè)指標(biāo),用少數(shù)幾個(gè)潛在指標(biāo)(因子)的線性組合表示。10.1主成分分析和因子分析簡(jiǎn)介10.1.1基本概念和主10.1主成分分析和因子分析簡(jiǎn)介(2)主要用途解決共線性問(wèn)題;評(píng)估問(wèn)卷的結(jié)構(gòu)效度;尋找變量之間的潛在結(jié)構(gòu);內(nèi)在結(jié)構(gòu)證實(shí)。(3)常用術(shù)語(yǔ)因子載荷變量共同度公共因子的方差貢獻(xiàn)10.1主成分分析和因子分析簡(jiǎn)介(2)主要用途10.1主成分分析和因子分析簡(jiǎn)介10.1.2主成分和公因子數(shù)量的確定(1)確定時(shí)遵循幾個(gè)原則主成分的累積貢獻(xiàn)率:一般來(lái)說(shuō),提取主成分的累積貢獻(xiàn)率達(dá)到80%~85%以上就比較滿意了,可以由此確定需要提取多少個(gè)主成分。特征值:特征值在某種程度上可以看成表示主成分影響力度大小的指標(biāo),如果特征值小于1,說(shuō)明該主成分的解釋力度還不如直接引入原變量的平均解釋力度大。因此一般可以用特征值大于1作為納入標(biāo)準(zhǔn)。綜合判斷:大量的實(shí)際情況表明,如果根據(jù)累積貢獻(xiàn)率來(lái)確定主成分?jǐn)?shù)往往較多,而用特征值來(lái)確定又往往較少,很多時(shí)候應(yīng)當(dāng)將兩者結(jié)合起來(lái),以綜合確定合適的數(shù)量。10.1主成分分析和因子分析簡(jiǎn)介10.1.2主成分和公因子數(shù)10.1主成分分析和因子分析簡(jiǎn)介10.1.3兩者的區(qū)別與聯(lián)系(1)兩者都是在多個(gè)原始變量中通過(guò)它們之間的內(nèi)部相關(guān)性來(lái)獲得新的變量(主成分變量或因子變量),達(dá)到既能減少分析指標(biāo)個(gè)數(shù),又能概括原始指標(biāo)主要信息的目的。(2)提取公因子主要有主成分分析法和公因子法,若采用主成分法,則主成分分析和因子分析基本等價(jià)。(3)因子分析提取的公因子比主成分分析提取的主成分更具有解釋性。(4)兩者分析的實(shí)質(zhì)和重點(diǎn)不同。(5)兩者的SPSS操作都是通過(guò)“分析→降維→因子分析”過(guò)程實(shí)現(xiàn)的,主成分分析不需要因子旋轉(zhuǎn),而因子分析需要經(jīng)過(guò)旋轉(zhuǎn)。10.1主成分分析和因子分析簡(jiǎn)介10.1.3兩者的區(qū)別與聯(lián)主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.2主成分分析10.3因子分析主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.2主成分分析10.2.1統(tǒng)計(jì)原理與分析步驟(1)統(tǒng)計(jì)原理
10.2主成分分析10.2.1統(tǒng)計(jì)原理與分析步驟10.2主成分分析(1)統(tǒng)計(jì)原理
10.2主成分分析(1)統(tǒng)計(jì)原理10.2主成分分析10.2.1統(tǒng)計(jì)原理與分析步驟(2)分析步驟
第1步原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理。第2步計(jì)算相關(guān)系數(shù)矩陣。第3步計(jì)算特征值及單位特征向量。第4步計(jì)算主成分的方差貢獻(xiàn)率和累積方差貢獻(xiàn)率。第5步計(jì)算主成分。
10.2主成分分析10.2.1統(tǒng)計(jì)原理與分析步驟10.2主成分分析10.2.2SPSS實(shí)例分析【例10-1】為了從總體上反映世界經(jīng)濟(jì)全球化的狀況,現(xiàn)選擇了具有代表性的16個(gè)國(guó)家的數(shù)據(jù),這些國(guó)家參與經(jīng)濟(jì)全球化的程度指標(biāo)值如下表所示。試分析一個(gè)國(guó)家參與經(jīng)濟(jì)全球化的程度主要受哪些因素的影響。編號(hào)國(guó)家x1x2x3x4x5x6x7x8x9x10x11x12x13x14x151中國(guó)3.20554.528.530.8781.4090.89411.62.3050.5472.9324.8189.0032.73.9141.4722印度1.44931.10.2790.3390.2720.12.70.1280.1930.8252.3185.1270.640.2183日本14.07952.30.65310.25411.7691.09701.9671.36.17814.74627.29730.957.73415.1254韓國(guó)1.318136.31.0111.60.421.8381.30.770.782.26723.3242.8759.112.1290.4525新加坡0.275739.53.57227.8410.88413.31428.60.6220.1431.885169.772319.90754.2917.3280.7186美國(guó)29.64146.13.6826.42920.5634.8085.424.25329.94115.63810.78424.55513.624.49521.2747加拿大2.056101.50.8988.2762.3135.36910.52.4445.1453.85434.69167.04715.121.831.3628巴西2.43427.11.5842.3270.9622.9056.81.9532.30.8574.71610.1016.75.4981.1049墨西哥1.567151.41.6572.8370.7971.47110.90.670.2122.18618.48537.9864.54.8870.46810英國(guó)4.67118.40.49726.15112.45622.13711.216.55219.6425.54228.43458.766.1278.96811.28911法國(guó)4.639120.61.849.2424.49210.8488.58.2825.8415.2128.4654.05229.256.4538.88912德國(guó)6.84132.92.2529.5586.6467.7472.28.5898.9718.84332.12163.1743651.51412.1813意大利3.792104.50.3218.1533.7241.0592.50.771.9134.03222.86943.9242717.7765.67814俄羅斯1.358.61.5331.4990.5520.4992.50.310.2980.9877.7712.5811.12.0010.46915澳大利亞1.30994.50.5025.7730.9411.98718.90.5271.3711.13115.74533.79513.224.1170.79716新西蘭0.177110.50.2187.3740.1793.0431.50.1260.3380.24823.22147.38719.841.2740.21510.2主成分分析10.2.2SPSS實(shí)例分析編號(hào)國(guó)家x10.2主成分分析第1步分析:從數(shù)據(jù)來(lái)看,一共有15個(gè)因素,但有些因素是存在相關(guān)性的,同時(shí)各因素對(duì)全球化影響的程度也是不一樣的,故可采用主成分分析。第2步數(shù)據(jù)組織:按如教材所示的“指標(biāo)”一列定義變量,輸入數(shù)據(jù)并保存。第3步主成分分析的設(shè)置:按“分析→降維→因子分析”順序打開(kāi)“因子分析”對(duì)話框,將x1~x15這15個(gè)變量移入“變量”對(duì)話框中,并按如下所示的圖形進(jìn)行設(shè)置。
10.2主成分分析第1步分析:從數(shù)據(jù)來(lái)看,一共有15個(gè)因10.2主成分分析10.2主成分分析10.2主成分分析說(shuō)明:由于在SPSS中并沒(méi)有完整的主成分分析過(guò)程,其主成分分析過(guò)程是集成在“因子分析”過(guò)程中的,但并不完善。由于主成分的得分需要對(duì)因子得分情況進(jìn)行進(jìn)一步計(jì)算,故不需設(shè)置“得分”子對(duì)話框,即不需保存因子得分情況,即使保存了,因子得分也不是各主成分得分的結(jié)果。對(duì)于提取因子的個(gè)數(shù)問(wèn)題,一般遵循兩個(gè)標(biāo)準(zhǔn),其一是累計(jì)方差貢獻(xiàn)率在80%以上,其二是其特征值大于1。本例之所以設(shè)置為3,是因?yàn)橥ㄟ^(guò)預(yù)先分析,發(fā)現(xiàn)前3個(gè)主成分可以解釋總體信息的86.7%。
10.2主成分分析說(shuō)明:10.2主成分分析第四步因子分析的結(jié)果:特征值和方差貢獻(xiàn)表成分初始特征值提取平方和載入合計(jì)方差的%累積%合計(jì)方差的%累積%16.04940.32540.3256.04940.32540.32525.81338.75579.0805.81338.75579.08031.1427.61686.6961.1427.61686.6964.8765.84292.5385.5993.99696.5346.3262.17498.7097.119.79699.5058.041.27299.7769.018.12199.89710.010.06399.96111.004.02799.98812.001.00999.99713.000.00299.99914.000.001100.000154.080E-72.720E-6100.000提取方法:主成分分析。從表中可以看出前3個(gè)主成分已經(jīng)解釋了總方差的近86.7%,故可以選擇前3個(gè)主成分進(jìn)行分析。10.2主成分分析第四步因子分析的結(jié)果:成分初始特征值提10.2主成分分析第四步因子分析的結(jié)果:主成分的碎石圖該圖從另一個(gè)側(cè)面說(shuō)明了取前三個(gè)主成分為宜。10.2主成分分析第四步因子分析的結(jié)果:該圖從另一個(gè)側(cè)面10.2主成分分析第四步因子分析的結(jié)果:旋轉(zhuǎn)前的因子載荷矩陣成分123x1.407.805.268x2.596-.727.209x3-.147.016.821x4.895-.333-.181x5.614.763.028x6.826-.124-.281x7.273-.627.184x8.636.703.041x9.619.703.008x10.552.766.196x11.654-.691.172x12.666-.685.166x13.863-.191-.297x14.728-.632.144x15.579.760.005提取方法
:主成分。a.已提取了
3個(gè)成分。說(shuō)明:教材中公式10.7中的是標(biāo)準(zhǔn)化正交向量,并不是SPSS輸出“因子載荷矩陣”中的系數(shù)。而“因子載荷矩陣”中各分量的系數(shù)為單位特征向量乘以相應(yīng)的特征值的平方根的結(jié)果,其公式為。故需進(jìn)一步利用因子分析的結(jié)果進(jìn)行主成分分析。10.2主成分分析第四步因子分析的結(jié)果:成分123x1.10.2主成分分析第五步利用因子分析的結(jié)果進(jìn)行主成分分析。10.2主成分分析第五步利用因子分析的結(jié)果進(jìn)行主成分分析10.2主成分分析第六步主要結(jié)果:編號(hào)國(guó)家y1y2y31中國(guó)-2.190.073.01-0.632印度-2.56-0.11-0.46-1.113日本0.451.85-0.270.884韓國(guó)-1.69-0.46-0.27-0.885新加坡5.28-6.261.19-0.206美國(guó)3.306.071.463.807加拿大-0.43-0.47-0.31-0.388巴西-1.91-0.06-0.43-0.839墨西哥-1.68-0.680.03-0.9410英國(guó)4.460.98-1.752.0511法國(guó)0.870.46-0.520.4912德國(guó)1.401.34-0.261.0613意大利-0.610.10-0.54-0.2514俄羅斯-2.35-0.20-0.30-1.0515澳大利亞-1.36-0.92-0.30-0.9316新西蘭-0.99-1.73-0.28-1.09過(guò)綜合得分的高低可知各國(guó)參與國(guó)際化水平的高低,其中美國(guó)最高,印度最低。10.2主成分分析第六步主要結(jié)果:編號(hào)國(guó)家y1y2y31主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.2主成分分析10.3因子分析主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.3因子分析10.3.1統(tǒng)計(jì)原理與分析步驟(1)統(tǒng)計(jì)原理其中x1,x2,…,xp為p個(gè)原有變量,是均值為零,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)化變量,F(xiàn)1,F(xiàn)2,…,F(xiàn)m為m個(gè)因子變量,m小于p,表示成矩陣形式為:10.3因子分析10.3.1統(tǒng)計(jì)原理與分析步驟其中x1,10.3因子分析10.3.1統(tǒng)計(jì)原理與分析步驟(2)分析步驟第1步將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化;第2步確定待分析的原有若干變量是否適合于因子分析;第3步構(gòu)造因子變量;第4步利用旋轉(zhuǎn)使得因子變量更具有可解釋性;第5步計(jì)算因子變量的得分。計(jì)算因子得分和模型為:j=1,2,…,m
10.3因子分析10.3.1統(tǒng)計(jì)原理與分析步驟j=1,210.3因子分析10.3.2SPSS實(shí)例分析【例10-2】為了研究幾個(gè)省市的科技創(chuàng)新力問(wèn)題,現(xiàn)取了2005年8個(gè)省市的15個(gè)科技指標(biāo)數(shù)據(jù),試分析一個(gè)省的科技創(chuàng)新能力主要受哪些潛在因素的影響?省市x1x2x3x4x5x6x7x8x9x10x11x12x13x14x15北京22980.2648.524.493.555.5510.2344774.4525.0224.1779.24226.0134.423183.292.12天冿8767.4836.8214.082.621.964.4935451.7733.5921.38410.3473.1525.06495.781.82遼寧4465.6935.948.342.321.562.4518974.211.295.57263.3522.3215.21204.981.78上海10474.0635.9817.844.782.284.851485.8339.7219.08654.31112.3215.851303.322江蘇5060.7934.076.82.131.473.1724489.1843.1317.99206.6816.69.14134.891.41浙江5363.4831.085.423.951.221.8327435.387.947.63257.6522.665.8279.011.72山東3064.5933.224.441.811.051.5920022.579.175.69117.739.768.41106.361.34廣東3569.6437.275.813.661.092.1824327.3235.6724.99117.5120.45.08122.331.4710.3因子分析10.3.2SPSS實(shí)例分析省市x1x210.3因子分析第1步分析:如題所述,要分析一個(gè)省的科技創(chuàng)新能力受哪些潛在因素的影響,可用因子分析法進(jìn)行分析。第2步數(shù)據(jù)組織:建立x1~x15共15個(gè)數(shù)據(jù)變量和一個(gè)“省市”字符型變量,將北京、天津等8個(gè)省市作為個(gè)案數(shù)據(jù)輸入并保存。第3步因子分析設(shè)置:按“分析→降維→因子分析”打開(kāi)“因子分析”對(duì)話框,將x1~x15這15個(gè)變量移入“變量”對(duì)話框中,表示對(duì)這15個(gè)變量數(shù)據(jù)進(jìn)行因子分析。10.3因子分析第1步分析:如題所述,要分析一個(gè)省的科技10.3因子分析“得分”對(duì)話框的設(shè)置:?jiǎn)螕簟暗梅郑⊿)…”按鈕,彈出此子對(duì)話框,選擇“保存為變量”,即將因子得分保存下來(lái)。第4步主要結(jié)果及分析:特征值與方差貢獻(xiàn)表可以看出前3個(gè)特征值大于1,同時(shí)這3個(gè)公共因子的方差貢獻(xiàn)率占了93.924%,說(shuō)明提取這3個(gè)公共因子可以解釋原變量的絕大部分信息。10.3因子分析“得分”對(duì)話框的設(shè)置:?jiǎn)螕簟暗梅郑⊿)…”10.3因子分析旋轉(zhuǎn)前的因子載荷矩陣表的底部表明使用的是主成分分析法,3個(gè)主成分被抽取出來(lái)。成分123x1.973-.158.052x2.919.036-.090x3.883-.161.334x4.985-.004-.022x5.482.497-.664x6.947-.242.131x7.972-.108.178x8.849.340-.301x9.300.834.386x10.611.637.399x11.955-.001-.211x12.992-.091-.001x13.876-.282.205x14.968-.156.032x15.859-.092-.385提取方法
:主成分。a.已提取了3個(gè)成分。10.3因子分析旋轉(zhuǎn)前的因子載荷矩陣表的底部表明使用的是10.3因子分析旋轉(zhuǎn)后的因子載荷矩陣是按照前面設(shè)定的“方差極大法”對(duì)因子載荷矩陣旋轉(zhuǎn)的結(jié)果。在表10.10所示未經(jīng)旋轉(zhuǎn)的載荷矩陣中,因子變量在許多變量上均有較高的載荷,從旋轉(zhuǎn)后的因子載荷矩陣可以看出,因子1在1、3、4、6、7、12、13、14上有較大載荷,反映科技投入與產(chǎn)出情況,可以命名為創(chuàng)新水平因子;因子2在指標(biāo)5、8、15上有較大載荷,反映地區(qū)經(jīng)濟(jì)發(fā)展及財(cái)政科教投入水平,可以命名為創(chuàng)新環(huán)境因子;因子3在指標(biāo)9和指標(biāo)10上有較大載荷,可以命名為高技術(shù)產(chǎn)業(yè)發(fā)展因子。成分123x1.936.286.130x2.776.459.202x3.924.016.251x4.867.413.221x5.068.940.180x6.966.177.095x7.944.202.235x8.541.726.327x9.018.137.956x10.377.172.876x11.794.558.118x12.913.365.161x13.937.071.084x14.926.301.119x15.705.626-.069提取方法:主成分。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法。a.旋轉(zhuǎn)在
5次迭代后收斂。10.3因子分析旋轉(zhuǎn)后的因子載荷矩陣是按照前面設(shè)定的“方10.3因子分析因子轉(zhuǎn)換矩陣表表明因子提取的方法是主成分分析,旋轉(zhuǎn)的方法是方差極大法。成分1231.884.403.2392-.405.400.8223.236-.823.517提取方法:主成分。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法。因子得分及綜合因子得分情況
省市F1F2F3F綜合排序山東-0.344-1.001-0.945-0.5368浙江-0.7910.905-1.223-0.4737江蘇-0.488-1.0241.073-0.3426廣東-0.791-0.1041.202-0.3275遼寧-0.002-0.500-1.206-0.2694天冿0.248-0.2750.5720.1773上海-0.1361.9470.4810.3662北京2.3050.0530.0451.406110.3因子分析因子轉(zhuǎn)換矩陣表表明因子提取的方法是主成分SPSS統(tǒng)計(jì)分析第10章主成分分析和因子分析29SPSS統(tǒng)計(jì)分析第10章主成分分析和因子分析1主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.2主成分分析10.3因子分析主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.1主成分分析和因子分析簡(jiǎn)介10.1.1基本概念和主要用途(1)基本概念
主成分分析就是考慮各指標(biāo)之間的相互關(guān)系,利用降維的方法將多個(gè)指標(biāo)轉(zhuǎn)換為少數(shù)幾個(gè)互不相關(guān)的指標(biāo),從而使進(jìn)一步研究變得簡(jiǎn)單的一種統(tǒng)計(jì)方法。主成分分析是由Hotelling于1933年首先提出的,是利用“降維”的思想,在損失很少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo),稱(chēng)為主成分。每個(gè)主成分均是原始變量的線性組合,且各個(gè)主成分之間互不相關(guān),這就使得主成分比原始變量具有某些更優(yōu)越的性能。
因子分析是一種通過(guò)顯在變量測(cè)評(píng)潛在變量,通過(guò)具體指標(biāo)測(cè)評(píng)抽象因子的分析方法,最早是由心理學(xué)家ChalesSpearman在1904年提出的,它的基本思想是將實(shí)測(cè)的多個(gè)指標(biāo),用少數(shù)幾個(gè)潛在指標(biāo)(因子)的線性組合表示。10.1主成分分析和因子分析簡(jiǎn)介10.1.1基本概念和主10.1主成分分析和因子分析簡(jiǎn)介(2)主要用途解決共線性問(wèn)題;評(píng)估問(wèn)卷的結(jié)構(gòu)效度;尋找變量之間的潛在結(jié)構(gòu);內(nèi)在結(jié)構(gòu)證實(shí)。(3)常用術(shù)語(yǔ)因子載荷變量共同度公共因子的方差貢獻(xiàn)10.1主成分分析和因子分析簡(jiǎn)介(2)主要用途10.1主成分分析和因子分析簡(jiǎn)介10.1.2主成分和公因子數(shù)量的確定(1)確定時(shí)遵循幾個(gè)原則主成分的累積貢獻(xiàn)率:一般來(lái)說(shuō),提取主成分的累積貢獻(xiàn)率達(dá)到80%~85%以上就比較滿意了,可以由此確定需要提取多少個(gè)主成分。特征值:特征值在某種程度上可以看成表示主成分影響力度大小的指標(biāo),如果特征值小于1,說(shuō)明該主成分的解釋力度還不如直接引入原變量的平均解釋力度大。因此一般可以用特征值大于1作為納入標(biāo)準(zhǔn)。綜合判斷:大量的實(shí)際情況表明,如果根據(jù)累積貢獻(xiàn)率來(lái)確定主成分?jǐn)?shù)往往較多,而用特征值來(lái)確定又往往較少,很多時(shí)候應(yīng)當(dāng)將兩者結(jié)合起來(lái),以綜合確定合適的數(shù)量。10.1主成分分析和因子分析簡(jiǎn)介10.1.2主成分和公因子數(shù)10.1主成分分析和因子分析簡(jiǎn)介10.1.3兩者的區(qū)別與聯(lián)系(1)兩者都是在多個(gè)原始變量中通過(guò)它們之間的內(nèi)部相關(guān)性來(lái)獲得新的變量(主成分變量或因子變量),達(dá)到既能減少分析指標(biāo)個(gè)數(shù),又能概括原始指標(biāo)主要信息的目的。(2)提取公因子主要有主成分分析法和公因子法,若采用主成分法,則主成分分析和因子分析基本等價(jià)。(3)因子分析提取的公因子比主成分分析提取的主成分更具有解釋性。(4)兩者分析的實(shí)質(zhì)和重點(diǎn)不同。(5)兩者的SPSS操作都是通過(guò)“分析→降維→因子分析”過(guò)程實(shí)現(xiàn)的,主成分分析不需要因子旋轉(zhuǎn),而因子分析需要經(jīng)過(guò)旋轉(zhuǎn)。10.1主成分分析和因子分析簡(jiǎn)介10.1.3兩者的區(qū)別與聯(lián)主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.2主成分分析10.3因子分析主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.2主成分分析10.2.1統(tǒng)計(jì)原理與分析步驟(1)統(tǒng)計(jì)原理
10.2主成分分析10.2.1統(tǒng)計(jì)原理與分析步驟10.2主成分分析(1)統(tǒng)計(jì)原理
10.2主成分分析(1)統(tǒng)計(jì)原理10.2主成分分析10.2.1統(tǒng)計(jì)原理與分析步驟(2)分析步驟
第1步原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理。第2步計(jì)算相關(guān)系數(shù)矩陣。第3步計(jì)算特征值及單位特征向量。第4步計(jì)算主成分的方差貢獻(xiàn)率和累積方差貢獻(xiàn)率。第5步計(jì)算主成分。
10.2主成分分析10.2.1統(tǒng)計(jì)原理與分析步驟10.2主成分分析10.2.2SPSS實(shí)例分析【例10-1】為了從總體上反映世界經(jīng)濟(jì)全球化的狀況,現(xiàn)選擇了具有代表性的16個(gè)國(guó)家的數(shù)據(jù),這些國(guó)家參與經(jīng)濟(jì)全球化的程度指標(biāo)值如下表所示。試分析一個(gè)國(guó)家參與經(jīng)濟(jì)全球化的程度主要受哪些因素的影響。編號(hào)國(guó)家x1x2x3x4x5x6x7x8x9x10x11x12x13x14x151中國(guó)3.20554.528.530.8781.4090.89411.62.3050.5472.9324.8189.0032.73.9141.4722印度1.44931.10.2790.3390.2720.12.70.1280.1930.8252.3185.1270.640.2183日本14.07952.30.65310.25411.7691.09701.9671.36.17814.74627.29730.957.73415.1254韓國(guó)1.318136.31.0111.60.421.8381.30.770.782.26723.3242.8759.112.1290.4525新加坡0.275739.53.57227.8410.88413.31428.60.6220.1431.885169.772319.90754.2917.3280.7186美國(guó)29.64146.13.6826.42920.5634.8085.424.25329.94115.63810.78424.55513.624.49521.2747加拿大2.056101.50.8988.2762.3135.36910.52.4445.1453.85434.69167.04715.121.831.3628巴西2.43427.11.5842.3270.9622.9056.81.9532.30.8574.71610.1016.75.4981.1049墨西哥1.567151.41.6572.8370.7971.47110.90.670.2122.18618.48537.9864.54.8870.46810英國(guó)4.67118.40.49726.15112.45622.13711.216.55219.6425.54228.43458.766.1278.96811.28911法國(guó)4.639120.61.849.2424.49210.8488.58.2825.8415.2128.4654.05229.256.4538.88912德國(guó)6.84132.92.2529.5586.6467.7472.28.5898.9718.84332.12163.1743651.51412.1813意大利3.792104.50.3218.1533.7241.0592.50.771.9134.03222.86943.9242717.7765.67814俄羅斯1.358.61.5331.4990.5520.4992.50.310.2980.9877.7712.5811.12.0010.46915澳大利亞1.30994.50.5025.7730.9411.98718.90.5271.3711.13115.74533.79513.224.1170.79716新西蘭0.177110.50.2187.3740.1793.0431.50.1260.3380.24823.22147.38719.841.2740.21510.2主成分分析10.2.2SPSS實(shí)例分析編號(hào)國(guó)家x10.2主成分分析第1步分析:從數(shù)據(jù)來(lái)看,一共有15個(gè)因素,但有些因素是存在相關(guān)性的,同時(shí)各因素對(duì)全球化影響的程度也是不一樣的,故可采用主成分分析。第2步數(shù)據(jù)組織:按如教材所示的“指標(biāo)”一列定義變量,輸入數(shù)據(jù)并保存。第3步主成分分析的設(shè)置:按“分析→降維→因子分析”順序打開(kāi)“因子分析”對(duì)話框,將x1~x15這15個(gè)變量移入“變量”對(duì)話框中,并按如下所示的圖形進(jìn)行設(shè)置。
10.2主成分分析第1步分析:從數(shù)據(jù)來(lái)看,一共有15個(gè)因10.2主成分分析10.2主成分分析10.2主成分分析說(shuō)明:由于在SPSS中并沒(méi)有完整的主成分分析過(guò)程,其主成分分析過(guò)程是集成在“因子分析”過(guò)程中的,但并不完善。由于主成分的得分需要對(duì)因子得分情況進(jìn)行進(jìn)一步計(jì)算,故不需設(shè)置“得分”子對(duì)話框,即不需保存因子得分情況,即使保存了,因子得分也不是各主成分得分的結(jié)果。對(duì)于提取因子的個(gè)數(shù)問(wèn)題,一般遵循兩個(gè)標(biāo)準(zhǔn),其一是累計(jì)方差貢獻(xiàn)率在80%以上,其二是其特征值大于1。本例之所以設(shè)置為3,是因?yàn)橥ㄟ^(guò)預(yù)先分析,發(fā)現(xiàn)前3個(gè)主成分可以解釋總體信息的86.7%。
10.2主成分分析說(shuō)明:10.2主成分分析第四步因子分析的結(jié)果:特征值和方差貢獻(xiàn)表成分初始特征值提取平方和載入合計(jì)方差的%累積%合計(jì)方差的%累積%16.04940.32540.3256.04940.32540.32525.81338.75579.0805.81338.75579.08031.1427.61686.6961.1427.61686.6964.8765.84292.5385.5993.99696.5346.3262.17498.7097.119.79699.5058.041.27299.7769.018.12199.89710.010.06399.96111.004.02799.98812.001.00999.99713.000.00299.99914.000.001100.000154.080E-72.720E-6100.000提取方法:主成分分析。從表中可以看出前3個(gè)主成分已經(jīng)解釋了總方差的近86.7%,故可以選擇前3個(gè)主成分進(jìn)行分析。10.2主成分分析第四步因子分析的結(jié)果:成分初始特征值提10.2主成分分析第四步因子分析的結(jié)果:主成分的碎石圖該圖從另一個(gè)側(cè)面說(shuō)明了取前三個(gè)主成分為宜。10.2主成分分析第四步因子分析的結(jié)果:該圖從另一個(gè)側(cè)面10.2主成分分析第四步因子分析的結(jié)果:旋轉(zhuǎn)前的因子載荷矩陣成分123x1.407.805.268x2.596-.727.209x3-.147.016.821x4.895-.333-.181x5.614.763.028x6.826-.124-.281x7.273-.627.184x8.636.703.041x9.619.703.008x10.552.766.196x11.654-.691.172x12.666-.685.166x13.863-.191-.297x14.728-.632.144x15.579.760.005提取方法
:主成分。a.已提取了
3個(gè)成分。說(shuō)明:教材中公式10.7中的是標(biāo)準(zhǔn)化正交向量,并不是SPSS輸出“因子載荷矩陣”中的系數(shù)。而“因子載荷矩陣”中各分量的系數(shù)為單位特征向量乘以相應(yīng)的特征值的平方根的結(jié)果,其公式為。故需進(jìn)一步利用因子分析的結(jié)果進(jìn)行主成分分析。10.2主成分分析第四步因子分析的結(jié)果:成分123x1.10.2主成分分析第五步利用因子分析的結(jié)果進(jìn)行主成分分析。10.2主成分分析第五步利用因子分析的結(jié)果進(jìn)行主成分分析10.2主成分分析第六步主要結(jié)果:編號(hào)國(guó)家y1y2y31中國(guó)-2.190.073.01-0.632印度-2.56-0.11-0.46-1.113日本0.451.85-0.270.884韓國(guó)-1.69-0.46-0.27-0.885新加坡5.28-6.261.19-0.206美國(guó)3.306.071.463.807加拿大-0.43-0.47-0.31-0.388巴西-1.91-0.06-0.43-0.839墨西哥-1.68-0.680.03-0.9410英國(guó)4.460.98-1.752.0511法國(guó)0.870.46-0.520.4912德國(guó)1.401.34-0.261.0613意大利-0.610.10-0.54-0.2514俄羅斯-2.35-0.20-0.30-1.0515澳大利亞-1.36-0.92-0.30-0.9316新西蘭-0.99-1.73-0.28-1.09過(guò)綜合得分的高低可知各國(guó)參與國(guó)際化水平的高低,其中美國(guó)最高,印度最低。10.2主成分分析第六步主要結(jié)果:編號(hào)國(guó)家y1y2y31主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.2主成分分析10.3因子分析主要內(nèi)容10.1主成分分析和因子分析簡(jiǎn)介10.3因子分析10.3.1統(tǒng)計(jì)原理與分析步驟(1)統(tǒng)計(jì)原理其中x1,x2,…,xp為p個(gè)原有變量,是均值為零,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)化變量,F(xiàn)1,F(xiàn)2,…,F(xiàn)m為m個(gè)因子變量,m小于p,表示成矩陣形式為:10.3因子分析10.3.1統(tǒng)計(jì)原理與分析步驟其中x1,10.3因子分析10.3.1統(tǒng)計(jì)原理與分析步驟(2)分析步驟第1步將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化;第2步確定待分析的原有若干變量是否適合于因子分析;第3步構(gòu)造因子變量;第4步利用旋轉(zhuǎn)使得因子變量更具有可解釋性;第5步計(jì)算因子變量的得分。計(jì)算因子得分和模型為:j=1,2,…,m
10.3因子分析10.3.1統(tǒng)計(jì)原理與分析步驟j=1,210.3因子分析10.3.2SPSS實(shí)例分析【例10-2】為了研究幾個(gè)省市的科技創(chuàng)新力問(wèn)題,現(xiàn)取了2005年8個(gè)省市的15個(gè)科技指標(biāo)數(shù)據(jù),試分析一個(gè)省的科技創(chuàng)新能力主要受哪些潛在因素的影響?省市x1x2x3x4x5x6x7x8x9x10x11x12x13x14x15北京22980.2648.524.493.555.5510.2344774.4525.0224.1779.24226.0134.423183.292.12天冿8767.4836.8214.082.621.964.4935451.7733.5921.38410.3473.1525.06495.781.82遼寧4465.6935.948.342.321.562.4518974.211.295.57263.3522.3215.21204.981.78上海10474.0635.9817.844.782.284.851485.8339.7219.08654.31112.3215.851303.322江蘇5060.7934.076.82.131.473.1724489.1843.1317.99206.6816.69.14134.891.41浙江5363.4831.085.423.951.221.8327435.387.947.63257.6522.665.8279.011.72山東3064.5933.224.441.811.051.5920022.579.175.69117.739.768.41106.361.34廣東3569.6437.275.813.661.092.1824327.3235.6724.99117.5120.45.08122.331.4710.3因子分析10.3.2SPSS實(shí)例分析省市x1x210.3因子分析第1步分析:如題所述,要分析一個(gè)省的科技創(chuàng)新能力受哪些潛在因素的影響,可用因子分析法進(jìn)行分析。第2步數(shù)據(jù)組織:建立x1~x15共15個(gè)數(shù)據(jù)變量和一個(gè)“省市”字符型變量,將北京、天津等8個(gè)省市作為個(gè)案數(shù)據(jù)輸入并保存。第3步因子分析設(shè)置:按“分析→降維→因子分析”打開(kāi)“因子分析”對(duì)話框,將x1~x15這1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 體系合同評(píng)審過(guò)程的衡量目標(biāo)
- 2025年錦州貨運(yùn)從業(yè)資格證考試模擬
- 2025年北京貨運(yùn)從業(yè)資格證試題答題器
- 電力設(shè)備公司員工停薪留職
- 建筑防貓害安全施工協(xié)議
- 圖書(shū)館消毒操作規(guī)程
- 汽車(chē)制造空氣凈化合同
- 廠房改造項(xiàng)目租賃承包合同
- 酒店走廊綠植裝飾合作協(xié)議
- 政府信息資產(chǎn)整合辦法
- 湖南省懷化市2023-2024學(xué)年九年級(jí)上學(xué)期1月期末歷史試題(無(wú)答案)
- 城市排水系統(tǒng)雨污分流改造
- 《小腸解剖及臨床》課件
- 高端醫(yī)療器械招商方案
- 肝衰竭病人的護(hù)理
- 一年級(jí)詩(shī)詞大會(huì)(經(jīng)典誦讀比賽)課件
- GB/T 13296-2023鍋爐、熱交換器用不銹鋼無(wú)縫鋼管
- 公眾號(hào)運(yùn)維服務(wù)方案
- 第三課 民族問(wèn)題的內(nèi)涵與產(chǎn)生根源 (1)課件
- 計(jì)算表-V型濾池
- 2023國(guó)家開(kāi)放大學(xué)《經(jīng)濟(jì)學(xué)基礎(chǔ)》形考任務(wù)1-4參考答案
評(píng)論
0/150
提交評(píng)論