版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、實驗二 主成分分析-基于SPSS軟件一、實驗?zāi)康募耙笳莆绽肧PSS軟件進(jìn)行主成分分析的基本操作方法,試著理解SPSS軟件給出的分析結(jié)果,并通過主成分分析去認(rèn)識和理解因子分析的思想及過程。二、實驗內(nèi)容利用SPSS軟件進(jìn)行主成分分析,了解SPSS進(jìn)行主成分析的步驟。三、實驗原理主成分分析(Principal Components Analysis,PCA)也稱為主分量分析,是一種通過降維來簡化數(shù)據(jù)結(jié)構(gòu)的方法;主成分分析因子分析中的一種方法,掌握了主成分析也就基本掌握了因子分析,因子分析的SPSS操作過程與主成分析類似,以下簡單對因子分析的原理及步驟進(jìn)行介紹。我們在對某種現(xiàn)象進(jìn)行描述時,總是要從
2、不同的方面來說明,才能夠?qū)λ枋鰧ο笥幸粋€比較完整認(rèn)識,而每一個方面往往就是一個變量,這樣就會涉及到很多變量,給問題的分析增加難度。另一方面,這些變量之間往往又存在一定程度的聯(lián)系,有的甚至是非常密切的聯(lián)系,這就使我們用來分析的數(shù)據(jù)所包含的信息在一定程度上有所重疊。因子分析的目的就是使數(shù)據(jù)簡化,即用較少的幾個因子去表示具有相互關(guān)系的原始變量。因子分析基本思想是從觀測到的個變量的相關(guān)性入手,將相關(guān)性較高的變量歸為一類,認(rèn)為這些相關(guān)性緊密的變量背后會有起主導(dǎo)作用的內(nèi)在原因,或者說有某個內(nèi)在原因使得這些變量的關(guān)系緊密。如果共找出()個這樣的內(nèi)在原因,我們說這個變量有個公共因子。這樣每個觀察變量都可以寫
3、成個互不相關(guān)的公共因子的線性組合的形式,即因子分析的數(shù)學(xué)模式。其中為公因子,可理解為原始變量共同具有的公共因素,或者說潛在變量,每個公因子至少要對兩個原始變量起作用,否則將列入特殊因子。為特殊因子,他們都是不可觀測的隨機(jī)變量,每個特殊因子只對對應(yīng)的一個原始變量有作用。用矩陣表示為:。因子分析的基本步驟:1.確定待研究的問題。首先要明確這次研究的目的,在相關(guān)理論的指導(dǎo)下,結(jié)合以往研究結(jié)果,再根據(jù)研究者自己的判斷,確定研究中應(yīng)該包括哪些變量。在選擇變量時應(yīng)注意所選變量必須是定距或定比變量;而樣本量則應(yīng)保持在變量個數(shù)的45倍以上。2.建立相關(guān)系數(shù)矩陣,檢查變量之間的相關(guān)性。因子分析的目的就是用潛在變
4、量來解釋具有相關(guān)關(guān)系的原始變量。所以變量之間必須具有較強(qiáng)的相關(guān)關(guān)系,才能適用于因子分析。3.選擇提取因子的方法。提取因子的方法有主成分法、主因子法、最大似然法、最小二乘法、最小殘差法等等,而一般常用的是主成分法和主因子法。4.確定因子的個數(shù)。常用的確定因子個數(shù)的方法有以下三種:1)根據(jù)研究者的設(shè)計方案或有關(guān)經(jīng)驗或知識事先確定;2)變量共同度,即原始變量對公因子依賴的程度,用因子載荷矩陣中第行元素的平方和表示,則有:。反映了公因子對的影響,可以看成是公因子對的方差貢獻(xiàn),即全部因子反映原始變量信息的百分比。越接近于1,說明原始信息保留的越多。根據(jù)對原始信息保留量的大小來確定因子個數(shù)。3)因子的累計
5、方差貢獻(xiàn)率。公因子對向量的貢獻(xiàn),用因子載荷矩陣中第列元素的平方和表示,則有: 。反映了公因子對各原始變量所提供的方差貢獻(xiàn)的總和,是衡量公因子相對重要性的指標(biāo)。一般要求所提取的公因子的累計方差貢獻(xiàn)率應(yīng)在60%以上。5.因子旋轉(zhuǎn)。得到初始因子載荷矩陣后,雖然它能反映因子與原始變量之間的關(guān)系,但是由于因子與很多變量都有關(guān)系,不便于對因子進(jìn)行解釋,這時就需要將因子載荷矩陣進(jìn)行旋轉(zhuǎn)。因子旋轉(zhuǎn)的方法有正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)兩類,一般用正交旋轉(zhuǎn)比較多,即在因子載荷矩陣后乘以一個正交矩陣。正交旋轉(zhuǎn)不會影響每個變量的共同度,也不會影響所有公因子的累計方差貢獻(xiàn)率,但是每個因子的方差貢獻(xiàn)率會改變,最終達(dá)到某些變量在某個
6、因子上的載荷較高,而在其它因子上的載荷卻很低的目的,便于對每個因子的含義進(jìn)行解釋。最常用的正交旋轉(zhuǎn)法是“方差最大正交旋轉(zhuǎn)”。斜交旋轉(zhuǎn)用于因子之間有相關(guān)關(guān)系的情況。6.解釋因子和命名。通過因子旋轉(zhuǎn)后,因子對哪些原始變量有顯著的負(fù)荷就比較清楚了,這時可以根據(jù)這些變量所隱含的意義來對因子進(jìn)行解釋和命名。四、實驗案例公司老板在對應(yīng)聘者進(jìn)行面試時,從15個方面進(jìn)行了打分,這15個方面分別是:x1申請書的形式;x2外貌;x3專業(yè)能力;x4討人喜歡;x5自信心;x6精明;x7誠實;x8推銷能力;x9經(jīng)驗;x10積極性;x11抱負(fù);x12 理解能力;x13潛力;x14交際能力;x15適應(yīng)性。下面是48名應(yīng)聘者
7、的得分情況。試對變量進(jìn)行因子分析,并對因子給出合理的解釋。應(yīng)征者x1x2x3x4x5x6x7x8x9x10x11x12x13x14x151672587883897571029105810991059988810378369897499868104568565928458765568884492855887767776871059658666799888888108108981089998998810910999109997888859898881010471021010710310101093101147100108395910810251247104101078288101037136981
8、054944454768148989638252667561548875410275366461669678989887686101797779586678667818688488643367264196784785442683542048788910526798892138688810536788582298789101010310810810823710799910103991091082498710810101029799108256977459324444542678785482345655627210798910535676452863535350033005029434330000
9、440050304656941031332273315547841032553483323357791032537552332357791032236452343464338113332523567433090102315336985566822245663374964108891397532384966997912108552391069109101010101081010101040106910910101010101010101010411078021201020300104210380110010000001043349824536213338447776988688108865459
10、61097710215578454698101079103157994447071035010002200004806101501000220000實驗過程:1)建立數(shù)據(jù)文件。按要求定義各變量名,輸入原始數(shù)據(jù)。2)選擇Analyze Data Reduction Factor,選擇x1-x15變量進(jìn)入Variables圖63)點擊Descriptive,設(shè)置需要輸出的描述統(tǒng)計量(如圖7)。圖74)點擊Extraction,對因子分析的方法、提取標(biāo)準(zhǔn)、顯示結(jié)果等進(jìn)行設(shè)置(如圖8)。圖85)點擊Rotation,設(shè)定因子旋轉(zhuǎn)(如圖9)。圖96)點擊Factor Scores,對因子得分進(jìn)行設(shè)定(如
11、圖10)。圖10結(jié)果說明:申請書自信心精明推銷能力積極性抱負(fù)理解能力潛力適應(yīng)性申請書1.000.098.223.270.348.288.335.366.587外貌.237.431.371.477.341.550.506.507.384專業(yè)能力.043.001.077.046.094.044.198.290.140討人喜歡.306.302.483.347.393.347.503.606.327自信心.0981.000.808.816.704.842.721.672.250精明.223.8081.000.826.698.758.883.777.416誠實-.106.410.356.231.280.
12、215.386.416.003推銷能力.270.816.8261.000.811.860.766.735.548經(jīng)驗.549.015.147.233.337.195.299.348.693積極性.348.704.698.8111.000.780.714.788.623抱負(fù).288.842.758.860.7801.000.784.769.435理解能力.335.721.883.766.714.7841.000.876.528潛力.366.672.777.735.788.769.8761.000.574交際能力.468.482.527.549.613.547.549.539.396適應(yīng)性.587
13、.250.416.548.623.435.528.5741.000上表是簡化了的相關(guān)矩陣太大,由表中數(shù)據(jù)可知:不少變量間相關(guān)性比較高,故可做因子分析。KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.784Bartlett's Test of SphericityApprox. Chi-Square648.300df105Sig.000上表顯示的是KMO檢驗和巴特萊特球形檢驗的結(jié)果,一般KMO值越接近1表明各變量間的相關(guān)程度差別不大,這時適合做因子分析;巴特萊特球形檢驗用來檢驗變量之間的
14、相關(guān)性,從本例來看,各變量間均具有較強(qiáng)的相關(guān)性,也適合做因子分析。CommunalitiesInitialExtraction申請書1.000.732外貌1.000.426專業(yè)能力1.000.881討人喜歡1.000.873自信心1.000.884精明1.000.822誠實1.000.850推銷能力1.000.893經(jīng)驗1.000.781積極性1.000.788抱負(fù)1.000.879理解能力1.000.852潛力1.000.885交際能力1.000.885適應(yīng)性1.000.795Extraction Method: Principal Component Analysis.上表顯示了按照設(shè)置的
15、標(biāo)準(zhǔn)提取公因子后各變量中的信息被提取的程度,從表中可以看出除第二個變量外,信息量提取還是比較高的。下表列出的是總的變量解釋程度的說明。按照設(shè)定的提取特征值大于1來提取,可以取前四個公因子,這四個公因子提取了原始信息的81.51%。Compo-nentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %17.50049.99749.9977.50049.99749.99722.05713.71163.7082.05713.
16、71163.70831.4629.74973.4561.4629.74973.45641.2088.05481.5101.2088.05481.5105.7394.92786.4386.4903.26889.7067.3542.35792.0638.3102.07094.1339.2551.70295.83510.1981.32297.15711.1501.00298.15912.092.61498.77313.085.56499.33814.064.42999.76715.035.233100.000下圖稱為碎石圖,是按主成分對應(yīng)特征值從大到小順序排列的,從另一方面來協(xié)助確定公因子的提取個數(shù)
17、。下表給出的是因子載荷矩陣,既因子表達(dá)式。由表中數(shù)據(jù)可得如下因子表達(dá)式。加*號說明是標(biāo)準(zhǔn)化后的值。Component MatrixaComponent1234申請書.445.617.372-.120外貌.583-.049-.019.289專業(yè)能力.109.339-.502.708討人喜歡.616-.181.574.364自信心.800-.356-.293-.180精明.865-.189-.184-.071誠實.433-.577.359.448推銷能力.882-.056-.244-.231經(jīng)驗.365.795.100.073積極性.864.068-.099-.165抱負(fù).873-.097-.254-.208理解能力.907-.033-.136.092潛力.912.034-.079.213交際能力.710-.114.561-.232適應(yīng)性.646.605.104-.025a. 4 components extracted.下表是因子得分系數(shù)矩陣,其實是進(jìn)行主成分分子的最終結(jié)果。按主成分表達(dá)式可表示如下:Rotated Component MatrixaComponent1234申請書.117.829.107-.138外貌.437.151.401.228專業(yè)能力.062.128.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度某數(shù)據(jù)中心水電暖安全保障服務(wù)合同4篇
- 二零二五年度奶牛養(yǎng)殖金融服務(wù)與風(fēng)險管理合同3篇
- 2025版實木地板批發(fā)業(yè)務(wù)供應(yīng)合同范本4篇
- 二零二五年度木材行業(yè)原材料采購與倉儲服務(wù)合同4篇
- 2025年度門窗行業(yè)知識產(chǎn)權(quán)保護(hù)合同-@-2
- 二零二五年度卵石開采與環(huán)保治理采購合同3篇
- 二零二五年度農(nóng)藥產(chǎn)品國際貿(mào)易爭端解決合同
- 二零二五年度夜間經(jīng)濟(jì)攤位租賃管理合同
- 二零二五年度文化創(chuàng)意產(chǎn)業(yè)門面租賃合同范本4篇
- 二零二五年度外架工程高空作業(yè)人員培訓(xùn)合同
- 開展課外讀物負(fù)面清單管理的具體實施舉措方案
- 2025年云南中煙工業(yè)限責(zé)任公司招聘420人高頻重點提升(共500題)附帶答案詳解
- 2025-2030年中國洗衣液市場未來發(fā)展趨勢及前景調(diào)研分析報告
- 2024解析:第三章物態(tài)變化-基礎(chǔ)練(解析版)
- 北京市房屋租賃合同自行成交版北京市房屋租賃合同自行成交版
- 《AM聚丙烯酰胺》課件
- 系統(tǒng)動力學(xué)課件與案例分析
- 《智能網(wǎng)聯(lián)汽車智能傳感器測試與裝調(diào)》電子教案
- 客戶分級管理(標(biāo)準(zhǔn)版)課件
- GB/T 32399-2024信息技術(shù)云計算參考架構(gòu)
- 固定資產(chǎn)盤點報告醫(yī)院版
評論
0/150
提交評論