SAS系統(tǒng)和數(shù)據(jù)分析因子分析_第1頁
SAS系統(tǒng)和數(shù)據(jù)分析因子分析_第2頁
SAS系統(tǒng)和數(shù)據(jù)分析因子分析_第3頁
SAS系統(tǒng)和數(shù)據(jù)分析因子分析_第4頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列第三十六課因子分析因子分析( Factor Analysis )是主成分分析的推廣,它也是從研究相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些具有錯綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個綜合因子的一種多變量統(tǒng)計(jì)分析方法。具體地說,就是要找出某個問題中可直接測量的、具有一定相關(guān)性的諸指標(biāo),如何受少數(shù)幾個在專業(yè)中有意義,又不可直接測量到,且相對獨(dú)立的因子支配的規(guī)律,從而可用諸指標(biāo)的測定來間接確定諸因子的狀態(tài)。一、何為因子分析因子分析的目的是用有限個不可觀察的潛在變量來解釋原變量間的相關(guān)性或協(xié)方差關(guān)系。在這里我們把不可觀察的潛在變量稱為公共因子(common facto

2、r )。在研究樣品時(shí),每個樣品需要檢測很多指標(biāo),假設(shè)測得p 個指標(biāo),但是這p 個指標(biāo)可能受到 m ( m < p ) 個共同因素的影響,再加上其他對這些指標(biāo)有影響的因素。寫成數(shù)學(xué)的形式就是:X1a11 f1a12 f2a1m f me1X 2a21 f1a22 f2a2m fme2(36.1)X pap1 f1ap2 f2a pm fmep利用矩陣記號有:XA fe(36.2)p 1P m m 1p 1各個指標(biāo)變量都受到f i的影響,因此fi 稱為公共因子, A 稱為因子載荷矩陣, ei是單變量 X i 所特有的因子,稱為X i 的特殊因子( unique factor )。設(shè) f1 ,

3、 f 2 , , f m 分別是均值為 0,方差為 1的隨機(jī)變量,即D( f )I m ;特殊因子 e1 , e2 , , ep 分別是均值為0,方差為 d12 , d22 , , d p2 的隨機(jī)變量,即D(e) diag(d12 , d22 , , d p2 ) D ;各特殊因子之 間 及 特 殊 因 子 與 公 共 因 子 之 間 都 是 相 互 獨(dú) 立 的 , 即 Cov(ei ,e j ) 0, ij 及Cov (e, f )0 。 錯誤!未定義書簽。 是第 j 個變量在第 i 個公共因子上的負(fù)荷,從投影的角度看, a ji就是 X j 在坐標(biāo)軸 fi上的投影。主成分分析的目標(biāo)是降維

4、,而因子分析的目標(biāo)是找出公共因素及特有的因素,即公共因子與特殊因子。在主成分分析中,殘差通常是彼此相關(guān)的。在公因子分析中,特殊因子起到殘差的作用,但被定義為彼此不相關(guān)且和公因子也不相關(guān)。而且每個公因子假定至少對兩個變量有貢獻(xiàn),否則它將是一個特殊因子。在開始提取公因子時(shí),為了簡便還假定公因子彼此不相關(guān)且具有單位方差。在這種情況下,向量X 的協(xié)方差矩陣 可以表示為:上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 1 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列D(X)D ( Afe) AAD(36.3)這里 D=diag( d2, d 2, ,d 2), diag表示對角矩陣。

5、如果假定已將錯誤!未定義書簽。標(biāo)12p準(zhǔn)化,也就是說 錯誤!未定義書簽。的每一個分量X i 的均值都為 0,方差都是 1,即 D (X i )1 ,那么:X iai1 f1ai 2 f 2aim f meim22(36.4)1Var ( X i )aijdij 1m記 hi2aij2,則有:j 11hi2di2 ,i1,2, p(36.5)錯誤!未定義書簽。 反映了公共因子f對 X i的影響, 稱為公共因子 f 對 X i 的“貢獻(xiàn)”。hi2實(shí)際反映了變量X i 對公共因子f 的依賴程度。另一方面,還可以考慮指定的一個公共因子f j 對各個變量 X i 的影響。實(shí)際上,f j 對各個變量 X

6、i 的影響可由 A 中第 j 列的元素來描述,那么:pg 2jaij2(36.6)i 1稱為公共因子 f j 對 X 的“貢獻(xiàn)” 。顯然 g 2j 越大, f j 對 X 的影響就越大,g 2j 成為衡量因子重要性的一個尺度。實(shí)際上:mCov ( X i , f j )aik Cov ( f k , f j )Cov (ei , f j ) aij(36.7)k 1那么,矩陣 A 的統(tǒng)計(jì)意義就非常清楚:錯誤!未定義書簽。是 X i和 f j 的相關(guān)系數(shù)錯誤!未定義書簽。是 X i對公共因子f 的依賴程度錯誤!未定義書簽。是公共因子f j 對 X 的各個分量總的影響下面我們來看怎樣求解因子載荷矩

7、陣A 。二、因子載荷矩陣的求解上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 2 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列如果已知 X 協(xié)方差矩陣和 D ,可以很容易地求出A 。根據(jù)式 (36.3)有:DA A(36.8)記*D ,則*是非負(fù)定矩陣。 若記矩陣* 的 p 個特征值1 2 m >m 1=p = 0 ,且 m 個非零特征值所對應(yīng)的特征向量分別為1 ,2 , , m ,則*的譜分解式為:*11 122 2mmm(36.9)1 1 ,2 2 ,1 1 ,2 2 ,m mm m只要令:A11 ,22 ,m m(36.10)就可以求出因子載荷矩陣A 。但在實(shí)際

8、問題中,我們并不知道、 D ,即不知道*,已知的只是 n 個樣品,每個樣品測得 p 個指標(biāo),共有 np 個數(shù)據(jù), 樣品數(shù)據(jù)見表36.1。為了建立公因子模型, 首先要估計(jì)因子載荷 錯誤!未定義書簽。 和特殊因子方差d i2 。常用的參數(shù)估計(jì)方法有以下三種:主成分法、主因子解法和極大似然法。1. 主成分法主成分法求因子載荷矩陣A 的具體求法如下:首先從資料矩陣出發(fā)求出樣品的協(xié)方差矩陣,記之為 ? ,其特征值為12p0 ,相應(yīng)的單位正交特征向量為1 , 2 , p ,當(dāng)最后 pm 個特征值較小時(shí),則對? 進(jìn)行譜分解可以近似為:?11 122 2m m mD(36.11)其中, 12 m >0

9、是 協(xié) 方 差 矩 陣 ? 相 應(yīng) 的 前 m 個 較 大 特 征 值 。 先 取a111 ,然后看 ?a1a1 是否接近對角陣。如果接近對角陣,說明公共因子只要取一個就行了,所有指標(biāo)主要受到這一個公共因子的影響;如果? a1a1 不是近似對角陣,就取a222 ,然后看 ?a1 a1a2 a2 是否接近對角陣,如果接近對角陣,就取兩個公共因子;否則,再取a333 , ,直到滿足“要求”為止。這里的“要求”要視具體情況而定,一般而言,就像主成分分析一樣,直接取前q 個特征值和特征向量,使得它們的特征值之和占全部特征值之和的85以上即可。此時(shí),特殊因子方差上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFE

10、Page 3 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列d i2 ?iiqati2 ,i 1,2, , p 。t 12. 主因子解法主因子解法是主成分法的一種修正,它是從資料矩陣出發(fā)求出樣品的相關(guān)矩陣R ,設(shè)RAAD,則 RDAA 。如果我們已知特殊因子方差的初始估計(jì)?*2(di) ,也就是已?*)21?*)2R*RD 為:知了先驗(yàn)公因子方差的估計(jì)為(hi(di,則約相關(guān)陣?*2r12r1 p(h1 )?*2R*r21( h2 )r2 p(36.12)rp 1r p2?*2(hp )*m 個正特征值*0 及相應(yīng)特征向計(jì)算 R的特征值和特征向量,取前12m量為 1*,2* ,

11、m*,則有近似分解式:R*AA(36.13)(*,*,*?2m2, p , 則 A 和其 中 ,A1, i1,2,1122 ,mm ) , 令 diatit 1D*?2?2,?2diag(d1, d 2, d p ) 為因子模型的一個解,這個解就稱為主因子解。上面的計(jì)算是我們假設(shè)已知特殊因子方差的初始估計(jì)?*)2(d i,那么,特殊因子方差的初始估計(jì)值如何得到呢?由于在實(shí)際中特殊因子方差di2 (或公因子方差hi2 )是未知的。以上得到的解是近似解。為了得到近似程度更好的解,常常采用迭代主因子法。即利用上面得到的 D*?2?2?2diag(d1 , d2 , d p ) 作為特殊方差的初始估計(jì)

12、,重復(fù)上述步驟,直到解穩(wěn)定為止。公因子方差(或稱變量的共同度)常用的初始估計(jì)有下面三種方法:hi2 取為第 i個變量與其他所有變量的多重相關(guān)系數(shù)的平方(或者取d i21/ r ii ,其中 r ii是相關(guān)矩陣 R 的可逆矩陣 R 1 的對角元素,則 hi21di2 )hi2 取為第 i 個變量與其他所有變量相關(guān)系數(shù)絕對值的最大值取 hi2 =1,它等價(jià)于主成分解上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 4 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列3. 極大似然法假定公共因子f 和特殊因子e 服從正態(tài)分布, 那么我們可得到因子載荷陣和特殊方差的極大似然估計(jì)。 設(shè) p

13、 維的 n 個觀察向量x( 1) , x(2) , x(n) 為來自正態(tài)總體N p ( , ) 的隨機(jī)樣本,則樣本似然函數(shù)為和 的函數(shù) L(, )。設(shè)AAD ,取x ,對于一組確定的隨機(jī)樣本,已經(jīng)變成了確定已知的值,則似然函數(shù)L( , )可以轉(zhuǎn)換為 A和D的函數(shù)( A, D ) 。接下來,就可以求A 和 D 取什么值,使函數(shù)( A, D ) 能達(dá)到最大。為了保證得到唯一解,可以附加唯一性條件A D 1 A 對角陣,再用迭代方法可求得極大似然估計(jì)的A 和 D的值。三、因子旋轉(zhuǎn)因子模型被估計(jì)后,還必須對得到的公因子f 進(jìn)行解釋。進(jìn)行解釋通常意味著對每個公共因子給出一種意義明確的名稱, 它用來反映在

14、預(yù)測每個可觀察變量中這個公因子的重要性,這個公因子的重要程度就是在因子模型矩陣中相應(yīng)于這個因子的系數(shù),顯然這個因子的系數(shù)絕對值越大越重要,而接近 0 則表示對可觀察變量沒有什么影響。因子解釋是一種主觀的方法,有時(shí)侯,通過旋轉(zhuǎn)公因子可以減少這種主觀性,也就是要使用非奇異的線性變換。設(shè) p 維可觀察變量 X 滿足因子模型 XAfe 。設(shè)錯誤!未定義書簽。 是任一正交陣,則因子模型可改寫為:XA f e ? A*f *e(36.14)其中, A*A , f *f 。根據(jù)我們前面假定:每個公因子的均值為0,即 E( f )0,每個公因子的方差為1,即D( f )I ,各特殊因子之間及特殊因子與公共因子

15、之間都是相互獨(dú)立的,即Cov(ei, ej ) 0, i j 及 Cov (e, f )0??梢宰C明:E( f * )E(f )E( f )0(36.15)D( f *)D(f )D( f )II(36.16)Cov(e,f * )Cov(e,f )Cov( e, f )0(36.17)上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 5 of 31595381861.doc商務(wù)數(shù)據(jù)分析D( X )D( A* f *e)D( A* f * )D( e)A* ( A* )D電子商務(wù)系列(36.18)因此, XAADA* ( A* )D 。這說明,若 A 和 D 是一個因子解,任給正交陣錯誤!未

16、定義書簽。 , A*A和 D 也是因子解。由于正交陣錯誤!未定義書簽。是任給的,因此,因子解不是唯一的。在實(shí)際工作中,為了使載荷矩陣有更好的實(shí)際意義,在求出因子載荷矩陣 A 后,再右乘一個正交陣,這樣就變換了因子載荷矩陣,這種方法稱為因子軸的正交旋轉(zhuǎn)。我們知道, 一個所有系數(shù)接近0 或± 1 的旋轉(zhuǎn)模型矩陣比系數(shù)多數(shù)為0 與± 1 之間的模型容易解釋。因此,大多數(shù)旋轉(zhuǎn)方法都是試圖最優(yōu)化模型矩陣的函數(shù)。在初始因子提取后,這些公因子是互不相關(guān)的。如果這些因子用正交變換(orthogonal transformation )進(jìn)行旋轉(zhuǎn),旋轉(zhuǎn)后的因子也是不相關(guān)的。如果因子用斜交變換(

17、oblique transformation )進(jìn)行旋轉(zhuǎn),則旋轉(zhuǎn)后的因子變?yōu)橄嚓P(guān)的。但斜交旋轉(zhuǎn)常常產(chǎn)生比正交旋轉(zhuǎn)更有用的模型。旋轉(zhuǎn)一組因子并不能改變這些因子的統(tǒng)計(jì)解釋能力。如果兩種旋轉(zhuǎn)模型導(dǎo)出不同的解釋,這兩種解釋不能認(rèn)為是矛盾的。倒不如說,是看待相同事物的兩種不同方法。從統(tǒng)計(jì)觀點(diǎn)看,不能說一些旋轉(zhuǎn)比另一些旋轉(zhuǎn)好。在統(tǒng)計(jì)意義上,所有旋轉(zhuǎn)都是一樣的。因此,在不同的旋轉(zhuǎn)之間進(jìn)行選擇必須根據(jù)非統(tǒng)計(jì)觀點(diǎn)。在多數(shù)應(yīng)用中,我們選擇最容易解釋的旋轉(zhuǎn)模型。四、應(yīng)注意的幾個問題因子分析是主成分分析的推廣,它也是一種降維技術(shù),其目的是用有限個不可觀測的隱變量來解釋原始變量之間的相關(guān)關(guān)系。因子模型在形式上與線性回歸

18、模型很相似,但兩者有著本質(zhì)的區(qū)別:回歸模型中的自變量是可觀測到的, 而因子模型中的各公因子是不可觀測的隱變量。 而且, 兩個模型的參數(shù)意義很不相同。因子載荷矩陣不是唯一的,利用這一點(diǎn)通過因子的旋轉(zhuǎn),可以使得旋轉(zhuǎn)后的因子有更鮮明的實(shí)際意義。因子載荷矩陣的元素及一些元素組合有很明確的統(tǒng)計(jì)意義。因子模型中常用的參數(shù)估計(jì)方法主要有:主成分法,主因子法和極大似然法。在實(shí)際應(yīng)用中,常從相關(guān)矩陣R 出發(fā)進(jìn)行因子模型分析。常用的因子得分估計(jì)方法有:巴特萊特因子得分和湯姆森因子得分兩種方法。五、Factor 因子分析過程因子分析用少數(shù)起根本作用、相互獨(dú)立、易于解釋通常又是不可觀察的因子來概括和描述數(shù)據(jù),表達(dá)一組

19、相互關(guān)聯(lián)的變量。通常情況下,這些相關(guān)因素并不能直觀觀測,這類分析通常需用因子分析完成。factor 過程一般由下列語句控制:proc factor data=數(shù)據(jù)集 < 選項(xiàng)列表 > ;priors公因子方差;var變量表 ;上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 6 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列partial變量表 ;freq變量 ;weight變量 ;by變量 ;run ;1. proc factor 語句的 <選項(xiàng)列表 >(1) 有關(guān)輸出數(shù)據(jù)集選項(xiàng)out= 輸出數(shù)據(jù)集 創(chuàng)建一個輸出數(shù)據(jù)集,包括輸入數(shù)據(jù)集中的全部數(shù)據(jù)和因子

20、得分估計(jì)。outstat= 輸出數(shù)據(jù)集 用于存儲因子分析的結(jié)果。這個結(jié)果中的部分內(nèi)容可作為進(jìn)一步因子分析的讀入數(shù)據(jù)集。(2) 有關(guān)因子提取和公因子方差選項(xiàng)method= 因子選擇方法 包括 principal (主成分法), prinit (迭代主因子法) ,usl(沒有加權(quán)的最小二乘因子法) , alpha( 因子法或稱 harris 法), ml(極大似然法) ,image(映象協(xié)方差陣的主成分法) ,pattern(從 type=選項(xiàng)的數(shù)據(jù)集中讀入因子模型) 、score(從 type=選項(xiàng)的數(shù)據(jù)集中讀入得分系數(shù)) 。常用方法為 principal (主成分法) 、 ml(極大似然法)和

21、 prinit (迭代主因子法) 。heywood 公因子方差大于1 時(shí)令其為1,并允許迭代繼續(xù)執(zhí)行下去。因?yàn)楣蜃臃讲钍窍嚓P(guān)系數(shù)的平方,我們要求它總是在0 和 1 之間。這是公因子模型的數(shù)學(xué)性質(zhì)決定的。盡管如此,但在最終的公因子方差的迭代估計(jì)時(shí)有可能超過1。如果公因子方差等于 1,這種狀況稱為Heywood 狀況,如果公因子方差大于1,這種狀況稱為超- Heywood狀況。在超 - Heywood 狀況時(shí),因子解是無效的。priors =公因子方差的計(jì)算方法名 規(guī)定計(jì)算先驗(yàn)公因子方差估計(jì)的方法,即給各變量的公因子方差hi2賦初值,包括one(等于1.0), max (最大絕對相關(guān)系數(shù)), s

22、mc(多元相關(guān)系數(shù)的平方) ,asmc (與多元相關(guān)系數(shù)的平方成比例,但要適當(dāng)調(diào)整使它們的和等于最大絕對相關(guān) ), input (從 data=指定的數(shù)據(jù)集中,按 type=指定類型讀入第一個觀察中的先驗(yàn)公因子方差估計(jì)) , random ( 0 與 1 之間的隨機(jī)數(shù)) 。(3) 有關(guān)規(guī)定因子個數(shù)及收斂準(zhǔn)則的選項(xiàng)nfactors=n 要求保留n 個公因子,否則只保留特征值大于1 的那些公因子。mineigen=p 規(guī)定被保留因子的最小特征值。proportion=p 使用先驗(yàn)公因子方差估計(jì),對被保留的因子規(guī)定所占公共方差比例為這個p 值。converge=p 當(dāng)公因子方差的最大改變小于 max

23、iter=n 規(guī)定迭代的最大數(shù)。缺省值為p 時(shí)停止迭代。缺省值30。=0.001 。(4) 有關(guān)旋轉(zhuǎn)方法的選項(xiàng)上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 7 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列rotate因子轉(zhuǎn)軸方式名 給出旋轉(zhuǎn)方法。包括none, varimax , quartimax ,equamax, orthomax , hk , promax, procrustes。常用的有varimax (正交的最大方差轉(zhuǎn)軸法)、 orthomax(由 gamma= 指定權(quán)數(shù)的正交方差最大轉(zhuǎn)軸法)和promax (在正交最大方差轉(zhuǎn)軸的基礎(chǔ)上進(jìn)行斜交旋轉(zhuǎn))。norm

24、 kaiser | raw | weight | cov | none 為了對因子模型進(jìn)行旋轉(zhuǎn),規(guī)定模型矩陣中行的正規(guī)化方法。例如,norm=kaiser 表示使用Kaiser 的正規(guī)化方法。norm=weight表示使用Cureton-Mulaik方法進(jìn)行加權(quán)。norm=cov 表示模型矩陣的這些行被重新標(biāo)度為表示協(xié)方差而不是相關(guān)系數(shù)。norm=raw 或 none 表示不進(jìn)行正規(guī)化。gamma=p 規(guī)定正交方差最大旋轉(zhuǎn)的權(quán)數(shù)。prerotate因子轉(zhuǎn)軸方式名 規(guī)定預(yù)先旋轉(zhuǎn)的方法。除了promax和procrustes的旋轉(zhuǎn)方法,任何其他的旋轉(zhuǎn)方法都可使用。(5) 有關(guān)控制打印輸出的選項(xiàng)si

25、mple 打印輸出包括簡單統(tǒng)計(jì)數(shù)。corr 打印輸出相關(guān)陣和偏相關(guān)陣。score 打印因子得分模型中的系數(shù)。scree 打印特征值的屏幕圖。ev 打印輸出特征向量。residuals 打印殘差相關(guān)陣和有關(guān)的偏相關(guān)陣。nplot=n 規(guī)定被作圖的因子個數(shù)。plot 在旋轉(zhuǎn)之后畫因子模型圖。preplot 在旋轉(zhuǎn)之前畫因子模型圖。msa 打印被所有其余變量控制的每對變量間的偏相關(guān),并抽樣適當(dāng)?shù)腒aiser度量。reorder 在打印輸出時(shí)讓各種因子矩陣的這些行重新排序。在第一個因子上具有最大絕對載荷的變量首先被輸出,然后按最大載荷到最小輸出,緊接著在第二個因子上輸出具有最大絕對載荷的變量等等。2.

26、priors 語句為 var 變量設(shè)定公因子方差,值在0.0 和 1.0 之間。其值的設(shè)定應(yīng)與應(yīng)。例如: proc factor ; priors0.70.80.9; varxyz;其他語句的使用略。var語句的變量相對六、Factor score 因子得分過程無論是初始因子模型還是旋轉(zhuǎn)后的因子模型,都是將指標(biāo)表示為公因子的線性組合。在因子分析中,還可以將公因子表示為指標(biāo)的線性組合,這樣就可以從指標(biāo)的觀測值估計(jì)各個公因子的值, 這種值叫因子得分。 它對樣品的分類有實(shí)際意義。 因子得分可由 proc score 過程完成。score 過程一般由下列語句控制:proc scoredata=數(shù)據(jù)集

27、< 選項(xiàng)列表 > ;上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 8 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列var變量 ;run ;proc score 語句選項(xiàng)包括out輸出數(shù)據(jù)集,存儲因子得分結(jié)果等。將factor 和 score 兩個過程書寫在同一個程序中,可以提高分析的效率。七、實(shí)例分析例 36.1表 36.1 給出的數(shù)據(jù)是在洛杉磯十二個標(biāo)準(zhǔn)大都市居民統(tǒng)計(jì)地區(qū)中進(jìn)行人口調(diào)查獲得的。 它有五個社會經(jīng)濟(jì)變量,分別是人口總數(shù) ( pop) 、居民的教育程度或中等教育的年數(shù)(school )、雇傭人總數(shù) (employ )、各種服務(wù)行業(yè)的人數(shù)(servi

28、ces)和中等的房價(jià) ( house ),試作因子分析。表 36.1五個社會因素調(diào)查數(shù)據(jù)編號popschoolemployserviceshouse1570012.82500270250002100010.96001010000334008.810001090004380013.61700140250005400012.8160014025000682008.3260060120007120011.440010160008910011.5330060140009990012.534001801800010960013.73600390250001196009.63300801200012940

29、011.44000100130001. 建立數(shù)據(jù)文件程序如下:data socecon;inputpop school employ services house;title'FIVE SOCIO-ECONOMIC VARIABLES'cards;5700 12.8 2500 270 250001000 10.9 6001010000 9400 11.4 4000 100 13000;run;上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 9 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列程序運(yùn)行后,生成一個scoecon 數(shù)據(jù)集。2.調(diào)用因子分析factor

30、 過程菜單操作方法,在SAS 系統(tǒng)的主菜上,選擇Globals/SAS/Assist再選擇 data analysis/multivar/factor analysis( 因子分析 )。編程方法如下:進(jìn)入Assist的主菜單,proc factor data=socecon method=prin priors=one simple corr score;run;proc factor data=socecon method=prin priors=smc msa scree residual preplot rotate=promax reorder plot outstat=fact_al

31、l ;run;proc factor data=socecon method=ml heywood nfacotors=1;run;proc factor data=socecon method=ml heywood nfactors=2;run;proc factor data=socecon method=ml heywood nfactors=3;run;程序說明:共調(diào)用了 5 個 factor 因子分析過程。第 1 個過程為主成分因子分析,第 2 個過程為主因子分析,第 3 個過程為提取一個因子的最大似然分析,第 4 個過程為提取二個因子的最大似然分析,第 5 個過程為提取三個因子的最

32、大似然分析。第 1 個 factor 因子分析過程,由于選項(xiàng) method=prin 和 priors=one ,提取因子的方法采用主成分分析,先驗(yàn)公因子方差估計(jì)被規(guī)定為 1。選項(xiàng) simple 和 corr 要求輸出描述統(tǒng)計(jì)量和相關(guān)陣。選項(xiàng) score 要求輸出因子得分系數(shù)。第 2 個 factor 因子分析過程, 由于不是 priors=one 選項(xiàng), 因此,提取因子的方法采用主因子分析, 選項(xiàng) method=prin 不起作用。 選項(xiàng) priors=smc 表示先驗(yàn)公因子方差估計(jì)被規(guī)定為每個變量與其他變量的多重相關(guān)系數(shù)的平方。 選項(xiàng) msa 表示控制所有其余變量的偏相關(guān)。 選項(xiàng) scre

33、e表示輸出所有特征值按從大到小排列的斜坡圖,用于選擇因子個數(shù)。選項(xiàng) residual 輸出殘差相關(guān)陣和有關(guān)的偏相關(guān)陣,得到特殊因子方差的剩余相關(guān)。選項(xiàng)rotate=promax 規(guī)定因子模型預(yù)先按正交最大方差的旋轉(zhuǎn),再在正交最大方差轉(zhuǎn)軸的基礎(chǔ)上進(jìn)行斜交的promax 旋轉(zhuǎn)。選項(xiàng)preplot 表示繪制因子模型旋轉(zhuǎn)前的散點(diǎn)圖。選項(xiàng)plot 表示繪制因子模型旋轉(zhuǎn)后的散點(diǎn)圖。選項(xiàng) reorder 表示按因子上具有的載荷大小排列。選項(xiàng)outstat=fact_all 表示將因子分析的各種結(jié)果輸出到fact_all 數(shù)據(jù)集中。其他 3 個最大似然因子分析過程的說明,我們在這里省略。第1 和第 2 個 f

34、actor 因子分析過程運(yùn)行后,主要的結(jié)果見表36.2 到表 36.9。表36.2均值、標(biāo)準(zhǔn)差及相關(guān)矩陣上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 10 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列Means and Standard Deviations from 12 observations(每個變量的均值和標(biāo)準(zhǔn)差)POPSCHOOLEMPLOYSERVICESHOUSEMean6241.66667 11.4416667 2333.33333 120.83333317000Std Dev3439.99427 1.78654483 1241.21153 114.92

35、7513 6367.53128Correlations(相關(guān)矩陣)POPPOPSCHOOLEMPLOYSERVICESHOUSE1.000000.009750.972450.438870.02241表 36.3主成分法的輸出結(jié)果Initial Factor Method: Principal ComponentsPrior Communality Estimates: ONE(初始公因子方差估計(jì)值)Eigenvalues of the Correlation Matrix: Total = 5 Average = 1(相關(guān)矩陣的特征值)12345Eigenvalue2.87331.79670.

36、21480.09990.0153Difference1.07671.58180.11490.0847Proportion0.57470.35930.04300.02000.0031Cumulative0.57470.93400.97700.99691.00002 factors will be retained by the MINEIGEN criterion.(確定的因子數(shù)目)Factor Pattern(因子模型)FACTOR1FACTOR2POP0.580960.80642SCHOOL0.76704 -0.54476EMPLOY0.672430.72605SERVICES0.93239

37、 -0.10431HOUSE0.79116 -0.55818Variance explained by each factor(每個因子解釋的方差)FACTOR1FACTOR22.873314 1.796660Final Communality Estimates: Total = 4.669974(最終公因子方差估計(jì))POPSCHOOLEMPLOY SERVICESHOUSE表 36.4主因子法的輸出結(jié)果上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 11 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列Initial Factor Method: Principal Fac

38、torsPartial Correlations Controlling all other Variables(控制所有其余變量的偏相關(guān))POP SCHOOLEMPLOY SERVICESHOUSEPOP1.00000 -0.544650.97083 0.09612 0.15871SCHOOL-0.54465 1.00000 0.54373 0.04996 0.64717EMPLOY0.97083 0.54373 1.00000 0.06689-0.25572SERVICES 0.09612 0.04996 0.06689 1.00000 0.59415HOUSE0.15871 0.6471

39、7 -0.25572 0.594151.00000Kaiser's Measure of Sampling Adequacy: Over-all MSA = 0.57536759(抽樣適當(dāng)?shù)?Kaiser 量度,包括所有變量的和每個變量的)POPSCHOOLEMPLOY SERVICESHOUSE0.472079 0.551588 0.488511 0.806644 0.612814Prior Communality Estimates: SMCPOPSCHOOLEMPLOY SERVICESHOUSE0.968592 0.822285 0.969181 0.785724 0.8470

40、19Eigenvalues of the Reduced Correlation Matrix:(約化相關(guān)矩陣的特征值)Total = 4.39280116 Average = 0.8785602312345Eigenvalue2.73431.71610.0396 -0.0245 -0.0726Difference1.01821.67650.06410.0481Proportion0.62250.39070.0090 -0.0056 -0.0165Cumulative0.62251.01311.02211.0165 1.00002 factors will be retained by the

41、 PROPORTION criterion.Factor PatternFACTOR1FACTOR2SERVICES 0.87899 -0.15847HOUSE0.74215 -0.57806EMPLOY0.71447 0.67936SCHOOL0.71370 -0.55515POP0.625330.76621Variance explained by each factorFACTOR1FACTOR22.734301 1.716069Final Communality Estimates: Total = 4.450370POPSCHOOLEMPLOY SERVICESHOUSE0.9781

42、13 0.817564 0.971999 0.797743 0.884950Residual Correlations With Uniqueness on the Diagonal(在對角線上是特殊因子方差的剩余相關(guān))POPSCHOOLEMPLOY SERVICESHOUSE表 36.5主因子法的正交最大方差預(yù)旋轉(zhuǎn)結(jié)果上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 12 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列Prerotation Method: Varimax(預(yù)先旋轉(zhuǎn)方法:正交最大方差旋轉(zhuǎn))Orthogonal Transformation Matrix(正交變

43、換矩陣)121 0.78895 0.614462 -0.61446 0.78895 Rotated Factor Pattern(旋轉(zhuǎn)后的因子模型)FACTOR1 FACTOR2HOUSE0.94072 -0.00004SCHOOL0.904190.00055SERVICES 0.790850.41509POP0.02255 0.98874表 36.6主因子法的Promax 斜交旋轉(zhuǎn)結(jié)果上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPage 13 of 31595381861.doc商務(wù)數(shù)據(jù)分析電子商務(wù)系列Rotation Method: Promax( 旋轉(zhuǎn)方法 : 在正交最大方差旋轉(zhuǎn)的基礎(chǔ)上再斜交旋轉(zhuǎn))Target Matrix for Procrustean Transformation(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論