版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
因子分析法預(yù)測第1頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第一節(jié)引言第二節(jié)主成分分析第三節(jié)因子分析第四節(jié)對應(yīng)分析主要內(nèi)容第2頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第一節(jié)引言第3頁,共112頁,2023年,2月20日,星期六YOURSITEHERE回歸分析因果因子分析由因索果執(zhí)果析因第4頁,共112頁,2023年,2月20日,星期六YOURSITEHERE方陣的特征值和特征向量對于n階方陣AAx=lx特征值實(shí)數(shù)(也可以是復(fù)數(shù))特征向量n維非零向量可以用從一點(diǎn)指向另一點(diǎn)的箭頭來表示縮放因子矩陣乘法對應(yīng)了一個(gè)變換,把一個(gè)向量變成同維數(shù)的另一個(gè)向量第5頁,共112頁,2023年,2月20日,星期六YOURSITEHERE一個(gè)變換的特征向量是這樣一種向量,它經(jīng)過這種特定的變換后保持方向不變,只是進(jìn)行長度上的伸縮而已。特征向量所指示的方向是更本質(zhì)的東西,特征值只不過反映了特征向量在變換時(shí)的伸縮倍數(shù)。特征方程|A-lI|=0的解為特征值l;滿足(A-liI)xi=0的向量xi為li的特征量。第6頁,共112頁,2023年,2月20日,星期六YOURSITEHEREn階方陣A有且恰有n個(gè)特征值;AT與A有相同的特征值;n階方陣A=(aij)nxn的跡等于其特征值之和;實(shí)對稱矩陣A的特征值都是實(shí)數(shù);實(shí)對稱矩陣A的不同特征值所對應(yīng)的特征向量都正交。因此,其特征值可以排序:l1≥l2≥…≥lp因此,存在正交矩陣P,使得P-1AP=∧
(以A的n個(gè)特征值為對角元素的對角陣)第7頁,共112頁,2023年,2月20日,星期六YOURSITEHERE地質(zhì)成因是地質(zhì)學(xué)研究的根本問題之一。理性認(rèn)識↑感性認(rèn)識內(nèi)在本質(zhì)↑外在表象從定量角度對各地質(zhì)變量進(jìn)行成因分析,所建立的數(shù)學(xué)模型一般有主成分分析(又稱主分量分析)因子分析(R型、Q型)對應(yīng)分析第8頁,共112頁,2023年,2月20日,星期六YOURSITEHERE在如此多的地質(zhì)變量之中,有很多是相關(guān)的。人們希望能夠找出它們的少數(shù)“代表”來對它們進(jìn)行描述。需要把這種有很多變量的數(shù)據(jù)進(jìn)行高度概括。一般情形下,每個(gè)變量都會提供一定的信息,但其重要程度與側(cè)重有所不同,且這些變量所提供的信息在一定程度上有所重疊。把所有指標(biāo)和數(shù)字都原封不動地?cái)[出去嗎?第9頁,共112頁,2023年,2月20日,星期六YOURSITEHERE利用相關(guān)性來對所涉及的變量加以“改造”和“組合”。用為數(shù)較少的、互不相關(guān)(或基本不相關(guān))的新變量來“代表”原來多個(gè)變量所提供的信息。通過對新變量的分析達(dá)到合理分析和數(shù)據(jù)解釋的目的。相關(guān)→互不相關(guān)第10頁,共112頁,2023年,2月20日,星期六YOURSITEHERE潛在的、可導(dǎo)出的(latent、derived)少量不相關(guān)取主舍次識別、分離隱性的基因的可觀測的(observed)大量相關(guān)主次雜亂混合、疊加顯性的多樣化的地質(zhì)資料觀測變量因子兩類變量的不同特性執(zhí)果析因第11頁,共112頁,2023年,2月20日,星期六YOURSITEHERE最早提出:J.Person(皮爾遜),主成分分析,1901、S.Spearman(斯卑爾曼),真因子分析,1904年,用于心理學(xué)研究;Benzeci(貝爾凱斯),對應(yīng)分析,1970。因子分析最早引入地質(zhì)領(lǐng)域:W.C.Krumbren(克倫賓),1957年,研究沉積學(xué)。應(yīng)用發(fā)展的重要地質(zhì)人物:J.Imbrie(英布里)發(fā)展簡史已成為地質(zhì)學(xué)等領(lǐng)域中傳播最快、應(yīng)用最廣的多元統(tǒng)計(jì)方法之一。第12頁,共112頁,2023年,2月20日,星期六YOURSITEHERE基本概念是一種常用的處理高維數(shù)據(jù)的多元統(tǒng)計(jì)分析方法。是一種化繁為簡,將指標(biāo)盡可能壓縮的降維(即空間壓縮)技術(shù)。把數(shù)目較多的變量作線性組合,組合成幾個(gè)主要的新變量——主成分,少數(shù)幾個(gè)主成分代表了原有變量變化的主要信息。又稱主分量分析。主成分分析(PrincipalComponentAnalysis)作用:降維第13頁,共112頁,2023年,2月20日,星期六YOURSITEHERE信息的大小如何度量?從統(tǒng)計(jì)分析角度看,一個(gè)指標(biāo)(看作隨機(jī)變量)或一串?dāng)?shù)據(jù)所包含的信息,可以用差異的大小——方差來度量。方差越大,所包含的信息量就越大;方差越小,所包含的信息量就越小。數(shù)學(xué)物理化學(xué)總分甲807060210乙707060200丙607060200第14頁,共112頁,2023年,2月20日,星期六YOURSITEHEREx1x2y2y1第15頁,共112頁,2023年,2月20日,星期六YOURSITEHERE是一種常用的處理高維數(shù)據(jù)的多元統(tǒng)計(jì)分析方法。是一種探索不易觀測或不能觀測的潛在因素,用有限個(gè)隱變量來解釋原始變量之間相關(guān)關(guān)系的技術(shù)。是通過對地質(zhì)觀測數(shù)據(jù)的分析來建立一個(gè)成因系統(tǒng)。它能把原來具有一定程度相關(guān)聯(lián)系的地質(zhì)變量轉(zhuǎn)換為數(shù)量較少的由原始地質(zhì)變量組合而成的新變量——因子,用它們來代替原始變量,各因子之間基本上是不相關(guān)的(基本獨(dú)立)。又稱析因分析。因子分析(FactorAnalysis)基本概念第16頁,共112頁,2023年,2月20日,星期六YOURSITEHERE相關(guān)性度量:變量間的方差-協(xié)方差、相關(guān)系數(shù)相關(guān)性度量:夾角余弦和各種距離系數(shù)R型因子分析R型因子分析是主成分分析的發(fā)展Q型因子分析研究變量之間的成因分類研究樣品之間的成因分類因子分析分類第17頁,共112頁,2023年,2月20日,星期六YOURSITEHERECIMFEABDKLGJN形狀因子1因子2因子3=2+0+0CHH=2+1+1第18頁,共112頁,2023年,2月20日,星期六YOURSITEHERE沉積盆地與剝蝕區(qū)示意圖F1F2F3xj=f(F1,F2,F3,ε)第19頁,共112頁,2023年,2月20日,星期六YOURSITEHEREMgCO3SiO2CaCO3COMgCaSi碳酸鹽演示分類三角圖解第20頁,共112頁,2023年,2月20日,星期六YOURSITEHERER2R1R1=[4Si-11(Na+K)-2(Fe+Ti)]R2=(Al+2Mg+6Ca)侵入巖分類R1-R2圖解(DelaRoche等,1980)第21頁,共112頁,2023年,2月20日,星期六YOURSITEHERE因子分析典型應(yīng)用問題沉積盆地蝕源區(qū)的研究沉積物粒度分析沉積相研究地層分析古生物與古環(huán)境的研究巖石化學(xué)成分的研究變質(zhì)巖原巖恢復(fù)礦床成因研究礦物的類質(zhì)同象研究地球化學(xué)等識別礦化活動的階段和類型分析成礦控制因素識別地層剖面上發(fā)生的氣候、水體深度、物質(zhì)來源,水動力學(xué)條件等沉積環(huán)境因素的細(xì)微變化。識別在同一時(shí)間點(diǎn)上不同空間過程的疊加過程;識別蝕源區(qū)的個(gè)數(shù)、巖石類型、分布識別巖漿巖的形成過程,諸如巖漿的異源疊加,或同源多期侵入,分異作用,交代作用,同化作用,交代識別作用,礦化活動等;巖漿巖的分類識別在同一空間點(diǎn)上不同時(shí)間過程的疊加過程第22頁,共112頁,2023年,2月20日,星期六YOURSITEHERE作用:用最精煉的形式描述地質(zhì)對象(壓縮原始數(shù)據(jù),降維技術(shù))指示成因推理方向(探索潛在因素、進(jìn)行成因分類、思考成因結(jié)論)分解疊加的地質(zhì)過程(例如:得到礦物共生組合變量→劃分不同成礦階段→不同地質(zhì)過程分解、時(shí)空分解)等第23頁,共112頁,2023年,2月20日,星期六YOURSITEHERE是在R型因子分析和Q型因子分析的基礎(chǔ)上發(fā)展起來的,能夠揭示變量與樣品之間雙重關(guān)系的一種多元統(tǒng)計(jì)方法。又稱R-Q型因子分析。對應(yīng)分析(CorrespondenceAnalysis)基本概念第24頁,共112頁,2023年,2月20日,星期六因子分析是研究系統(tǒng)分類、成因分類的重要手段,在地質(zhì)研究中的作用:
第一、壓縮原始數(shù)據(jù)。
第二、指示成因推理方向。
第三、分解疊加的地質(zhì)過程。
第25頁,共112頁,2023年,2月20日,星期六因子分析是研究變量間相關(guān)關(guān)系、樣品間相似關(guān)系、變量與樣品間成因聯(lián)系以及探索它們之間產(chǎn)生上述關(guān)系之內(nèi)在原因的一些多元統(tǒng)計(jì)分析方法的總稱.根據(jù)它們的的研究對象可分為:(1)、主成分分析;(2)、R型因子分析;(3)、Q型因子分析;(4)、對應(yīng)分析;第26頁,共112頁,2023年,2月20日,星期六因子分析在地質(zhì)研究中的應(yīng)用:第27頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第二節(jié)主成分分析第28頁,共112頁,2023年,2月20日,星期六2主成分分析地質(zhì)中經(jīng)常要作多變量的綜合分析,這些變量經(jīng)常是不獨(dú)立的,存在復(fù)雜的相關(guān)關(guān)系。為了化繁為簡,用一種數(shù)學(xué)方法把數(shù)目較多的變量作線性組合,組合成幾個(gè)主要的新變量——主成分。第29頁,共112頁,2023年,2月20日,星期六YOURSITEHERE一、主成分分析的基本思想構(gòu)造關(guān)于原始變量的適當(dāng)?shù)木€性組合,形成幾個(gè)新變量(即所謂的主成分),它們是我們用來代替原始變量進(jìn)行資料解釋的綜合性指標(biāo)。這一分析過程應(yīng)使得每個(gè)新變量都是各原始變量的線性組合新變量的數(shù)目大大少于原始變量的數(shù)據(jù)新變量保留了原始變量所包含的絕大部分信息新變量之間互不相關(guān),即各自含義的信息不重疊。第30頁,共112頁,2023年,2月20日,星期六主成分的幾何意義:
(1)N個(gè)點(diǎn)的新坐標(biāo)F1和F2的相關(guān)很小,幾乎為零。
(2)在新坐標(biāo)系中N個(gè)點(diǎn)的波動(方差)大部分歸結(jié)為F1的波動,F(xiàn)2的波動很小,故用F1就可以反映變化的大部分信息。
(3)由于是正交坐標(biāo)系,坐標(biāo)(F1,F(xiàn)2)與(x1,x2)間的關(guān)系可用下式表示:
x1x2F1F2A是正交矩陣,滿足第31頁,共112頁,2023年,2月20日,星期六第32頁,共112頁,2023年,2月20日,星期六計(jì)算步驟:
(1)作數(shù)據(jù)標(biāo)準(zhǔn)化。
(2)計(jì)算變量之間的相關(guān)系數(shù)矩陣
(3)用Jacobi法計(jì)算相關(guān)系數(shù)矩陣R的特征值λj及對應(yīng)的特征向量uj(j=1,2,…,p)即可得主成分Fj,其表達(dá)式為:
第33頁,共112頁,2023年,2月20日,星期六(4)計(jì)算前m個(gè)特征值所占的累計(jì)百分比:
(5)計(jì)算各個(gè)樣品在m個(gè)主成分上的得分,第i個(gè)樣品的第j個(gè)主成分為:
(6)利用前m個(gè)主成分作地質(zhì)解釋或利用樣品在主成分上的得分對樣品進(jìn)行分類。
第34頁,共112頁,2023年,2月20日,星期六第35頁,共112頁,2023年,2月20日,星期六第36頁,共112頁,2023年,2月20日,星期六第37頁,共112頁,2023年,2月20日,星期六第38頁,共112頁,2023年,2月20日,星期六第39頁,共112頁,2023年,2月20日,星期六第40頁,共112頁,2023年,2月20日,星期六第41頁,共112頁,2023年,2月20日,星期六YOURSITEHERE二、主成分分析的數(shù)學(xué)提法觀測資料矩陣x1 x2xpCaseVar.12n確定應(yīng)該構(gòu)造多少個(gè)綜合指標(biāo)(主成分),并如何構(gòu)造出各主成分的表達(dá)式(用x1,x2,…,xp表示)第42頁,共112頁,2023年,2月20日,星期六YOURSITEHEREx1x2y2y1方差越大,所包含的信息量就越大主成分分析第43頁,共112頁,2023年,2月20日,星期六YOURSITEHERE我們希望用y1來代替原來p個(gè)變量x1,x2,…,xp,這就要求在向量l1的正則化條件下,y1的方差盡可能大,由此確定的隨機(jī)變量y1稱為第一主成分。如果第一主成分還不足以反映原來p個(gè)變量的信息,那么考慮第二主成分。為了有效反映原變量的信息,新變量y1和y2所包含的信息不應(yīng)重疊,即要求y1和y2不相關(guān)。前述兩個(gè)約束條件下求l2使Var(y2)達(dá)到最大,從而得到第二主成分。第44頁,共112頁,2023年,2月20日,星期六YOURSITEHERE以此類推,我們最多可以找出p個(gè)yi出來。然而我們最多只選擇k個(gè)yi(i=1,2,…,k,k<p),并希望主成分?jǐn)?shù)量較少,但解釋能力卻能達(dá)到約85%以上。推導(dǎo)表明:變量x1,x2,…,xp的主成分是以協(xié)方差矩陣S(或相關(guān)矩陣R)的特征向量為系數(shù)的線性組合,它們互不相關(guān),方差為S(或R)的特征根。而S(或R)的特征根l1≥
l2≥…≥
lp,所以有:Var(y1)≥Var(y2)≥…≥Var(yp)>0。第45頁,共112頁,2023年,2月20日,星期六YOURSITEHERE對p個(gè)指標(biāo),經(jīng)過適當(dāng)線性組合,p個(gè)新變量為這里y1,y2,…,yp——分別稱為第一主成分、第二主成分、第p主成分。lij——稱為第i個(gè)主成分yi
在第j個(gè)原始變量xj
上的載荷(主成分載荷),是第i個(gè)特征向量的第j個(gè)分量
。第46頁,共112頁,2023年,2月20日,星期六YOURSITEHERE其中,樣本協(xié)方差矩陣樣本相關(guān)矩陣對標(biāo)準(zhǔn)化數(shù)據(jù)矩陣:新變量(隨機(jī)變量)yi的方差與協(xié)方差第47頁,共112頁,2023年,2月20日,星期六YOURSITEHERE一般地,在約束條件(向量l的正則化)(yi和yk所包含的信息不應(yīng)重疊,即yi和yk不相關(guān))之下求向量li,使Var(yi)達(dá)到最大,由此向量li所確定的稱為x1,x2,…,xp的第i個(gè)主成分。第48頁,共112頁,2023年,2月20日,星期六YOURSITEHERE三、主成分的性質(zhì)①Y=L’X,L’L=I。這里,L為X的協(xié)差陣的特征向量(單位化的)組成的正交陣。②y的各分量之間是互不相關(guān)的。③y的p個(gè)分量是按方差大小、由大到小排列的。④
y的協(xié)差陣為對角陣。第49頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第k個(gè)主成分的方差貢獻(xiàn)率前k個(gè)主成分的累積方差貢獻(xiàn)率(一般取80%,85%)⑤⑥這里,a(yi,xj)表示第i個(gè)主成分yi
和第j個(gè)原始變量xj
之間的線性相關(guān)系數(shù),稱為因子載荷。矩陣A=(aij)稱為因子載荷矩陣標(biāo)準(zhǔn)化:消除量綱和數(shù)量級上的影響,sii=1(k<p)系統(tǒng)總方差不變(i,j=1,2…,p)⑦⑧第50頁,共112頁,2023年,2月20日,星期六YOURSITEHERE①對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化變換②計(jì)算個(gè)變量間的相關(guān)系數(shù),形成相關(guān)系數(shù)矩陣R。③求出R的特征值并按大小排列及相應(yīng)于的單位特征向量。即可得主成分的表達(dá)式。④將特征值按大小降序排列,計(jì)算前k個(gè)特征值之和占特征值總和的百分?jǐn)?shù),一般按累積方差貢獻(xiàn)率大于85%(或80%)的準(zhǔn)則,來確定k,從而建立前k個(gè)主成分:四、主成分的計(jì)算步驟第51頁,共112頁,2023年,2月20日,星期六YOURSITEHERE⑤計(jì)算各個(gè)樣品在k個(gè)主成分上的得分。第i個(gè)樣品的第j個(gè)主成分得分為:從而可得新指標(biāo)(主成分)樣本值(yij)nxk以代替原樣本值(xij)nxp作統(tǒng)計(jì)分析。⑥對前k個(gè)主成分進(jìn)行地質(zhì)解釋并對樣品進(jìn)行分類。四、主成分的計(jì)算步驟第52頁,共112頁,2023年,2月20日,星期六YOURSITEHERE(A)Sn,(B)As,(C)Cu,(D)Pb,(E)Zn,(E)Cd.三角符號表示錫礦床,粗黑線條表示斷層四、應(yīng)用實(shí)例第53頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第54頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第一主成分第55頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第三節(jié)因子分析第56頁,共112頁,2023年,2月20日,星期六YOURSITEHERE一、因子分析的基本思想對于直接可觀測的隨機(jī)變量,根據(jù)其相關(guān)性大小,使得同組內(nèi)的變量之間相關(guān)性較高,不同組的變量相關(guān)性較低。每組變量代表一個(gè)基本結(jié)構(gòu),用一個(gè)不可觀測的綜合變量表示,這個(gè)基本結(jié)構(gòu)稱為公因子。于是,原始觀測的隨機(jī)變量X可分解為不可觀測(或未做觀測)的兩個(gè)隨機(jī)向量的線性組合:一是對整個(gè)X有影響的公共因素——公因子;二是只對各對應(yīng)分量有影響的特殊因素——特殊因子。第57頁,共112頁,2023年,2月20日,星期六YOURSITEHEREF1F2第58頁,共112頁,2023年,2月20日,星期六YOURSITEHERE建立因子載荷矩陣給出各公共因子的合理解釋及命名若有必要(當(dāng)難以招到合理解釋的公共因子)時(shí),進(jìn)一步作因子旋轉(zhuǎn)。因子分析的基本任務(wù)是:因子分析就是尋找這些公共因子的模型分析方法,它是在主成分的基礎(chǔ)上構(gòu)筑若干意義較為明確的公因子,以它們?yōu)榭蚣芊纸庠兞浚源丝疾煸兞块g的聯(lián)系與區(qū)別。第59頁,共112頁,2023年,2月20日,星期六百米跑成績X1跳遠(yuǎn)成績X2鉛球成績X3跳高成績X4400米跑成績X5百米跨欄X6鐵餅成績X7撐桿跳遠(yuǎn)成績X8標(biāo)槍成績X91500米跑成績X10
奧運(yùn)會十項(xiàng)全能運(yùn)動項(xiàng)目得分?jǐn)?shù)據(jù)的因子分析
第60頁,共112頁,2023年,2月20日,星期六
因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運(yùn)動因子。其他的3個(gè)因子不太容易解釋。似乎是跑和投擲的能力對比,似乎是長跑耐力和短跑速度的對比。于是考慮旋轉(zhuǎn)因子,得下表第61頁,共112頁,2023年,2月20日,星期六
通過旋轉(zhuǎn),因子有了較為明確的含義:
X1百米跑,X2跳遠(yuǎn)和X5400米跑,需要爆發(fā)力的項(xiàng)目在F1有較大的載荷,F1可以稱為短跑速度因子;
X3鉛球,X7鐵餅和X9
標(biāo)槍在F2上有較大的載荷,可以稱為爆發(fā)性臂力因子;
X6百米跨欄,X8撐桿跳遠(yuǎn),X2跳遠(yuǎn)和X4跳高在F3上有較大的載荷,F(xiàn)3爆發(fā)腿力因子;F4
長跑耐力因子第62頁,共112頁,2023年,2月20日,星期六設(shè)對研究對象的n個(gè)樣品測試了p個(gè)變量x1,x2,…,xp,可認(rèn)為這p個(gè)變量共同起因于m因子(即因素)F1,F2,…,Fm.假定這m個(gè)公因子(可理解為新的變量)對每個(gè)指標(biāo)(變量)的影響或作用是線性的(我們總是討論線性模型),那么,因子分析模型可以表示為:
二、R型因子分析的數(shù)學(xué)提法第63頁,共112頁,2023年,2月20日,星期六YOURSITEHERE稱為因子模型。矩陣形式第64頁,共112頁,2023年,2月20日,星期六YOURSITEHERE(1)x=(x1,x2,…,xp)'是可觀測隨機(jī)向量,均值向量E(x)=0,協(xié)方差陣Cov(X)=∑,且協(xié)方差陣∑與相關(guān)矩陣R相等(因子分析通常要先對觀測資料數(shù)據(jù)作標(biāo)準(zhǔn)化處理);(2)F=(F1,F2,…,Fm)’(m<p)是不可測的向量,其均值向量E(F)=0,協(xié)方差矩陣Cov(F)=I,即向量的各分量是相互獨(dú)立的;(3)ε=(ε1,ε2,…,εp)’與F相互獨(dú)立Cov(F,ε)=0,且E(ε)=0,e的協(xié)方差陣∑是對角陣,即各分量e之間是相互獨(dú)立的。假定條件第65頁,共112頁,2023年,2月20日,星期六YOURSITEHERE因子載荷第i個(gè)變量在第j個(gè)公因子上的載荷A中元素aij稱為第66頁,共112頁,2023年,2月20日,星期六YOURSITEHERE主成分模型特征向量約束條件從而,每個(gè)原始變量亦可用各主成分F1,F2,…,Fp的線性組合來表示實(shí)際上,我們不需要p個(gè)主成分,按累積方差貢獻(xiàn)取前m個(gè)主成分。從主成分分析模型到因子分析模型第67頁,共112頁,2023年,2月20日,星期六YOURSITEHERE這m個(gè)主成分對應(yīng)的數(shù)據(jù)矩陣就是將特征向量矩陣剖分成:(i=1,2,…,p)于是使得模型中FA和FB因子中各變量都是標(biāo)準(zhǔn)化,即均值為0,方差為1,可得R型因子模型:從主成分分析模型到因子分析模型第68頁,共112頁,2023年,2月20日,星期六YOURSITEHERE稱為因子模型。矩陣形式因子分析——二、R型因子分析的數(shù)學(xué)提法公因子、公共因子或潛因子特殊因子唯一因子原始觀測變量共性個(gè)性第69頁,共112頁,2023年,2月20日,星期六YOURSITEHERE因子載荷第i個(gè)變量在第j個(gè)公因子上的載荷A中元素aij稱為略去特殊因子部分,因子分析的簡化模型(m<p)第70頁,共112頁,2023年,2月20日,星期六YOURSITEHERE三、因子載荷矩陣的求解方法一:主成分法方法二:極大似然法(在多元正態(tài)分布的假定下)第71頁,共112頁,2023年,2月20日,星期六YOURSITEHERE四、與因子載荷矩陣的統(tǒng)計(jì)意義(1)因子載荷aij的統(tǒng)計(jì)意義aij——第i個(gè)變量在第j個(gè)公因子上的載荷;lij——由相關(guān)矩陣R提取的第j個(gè)公因子之特征值(j=1,2,...,m)所對應(yīng)的特征向量在第i個(gè)分量。因子載荷求解公式:(注意:E(Fj)=0,Var(Fj)=1)aij——是變量xi與Fj的協(xié)方差,也是xi與Fj的相關(guān)系數(shù)(依賴程度)。第i個(gè)變量在第j個(gè)公因子上的重要性(權(quán)重)。aij
的絕對值越大(|aij|≤1),表明xi
與Fj的相依程度越大,或稱公共因子Fj
對于xi的載荷量越大。公因子F的實(shí)際含義,這可以通過各變量在公因子上載荷的符號與絕對值的大小來描述。第72頁,共112頁,2023年,2月20日,星期六YOURSITEHERE(2)變量共同度hi2的統(tǒng)計(jì)意義(也稱公因子方差、共性方差、公共方差)因子載荷矩陣中各行元素的平方和F1F2Fm公因子方差hi2代表所有m個(gè)公因子對原始變量xi的總方差的貢獻(xiàn)。反映了xi對于F1,F2,…,Fm的共同依賴程度。如果公因子方差近于1,則說明該變量xi的幾乎全部原始信息都被所選取的因子說明了。公因子方差的意義在于提供轉(zhuǎn)化為因子空間后,保留原來各變量的信息有多少。 注意:(特殊方差個(gè)性方差)第73頁,共112頁,2023年,2月20日,星期六YOURSITEHERE(3)公因子Fj的方差貢獻(xiàn)的統(tǒng)計(jì)意義因子載荷矩陣中各列元素的平方和F1F2Fm公因子Fj對所有原始變量所提供方差貢獻(xiàn)的總和。它是衡量公因子相對重要性的指標(biāo)。gj2
越大,表明公因子Fj
對
x的貢獻(xiàn)越大,或者說對x的影響和作用就越大。如果將因子載荷矩陣A的所有g(shù)j2(j=1,2,…,m)都計(jì)算出來,使其按照大小排序,就可以依此提煉出最有影響力的公共因子。注意:第74頁,共112頁,2023年,2月20日,星期六YOURSITEHERE五、因子旋轉(zhuǎn)1.旋轉(zhuǎn)的目的建立因子分析模型的目的不僅是找出主因子,更重要的是知道每個(gè)主因子的意義,以便對實(shí)際問題進(jìn)行分析。如果求出的主因子解后,各個(gè)主因子的“典型變量”不很突出,還需要進(jìn)行因子旋轉(zhuǎn)。使因子載荷兩極分化,因子載荷的平方值要么接近于0,要么接近于1。通過適當(dāng)?shù)男D(zhuǎn)得到比較滿意的因子。第75頁,共112頁,2023年,2月20日,星期六YOURSITEHERE(2)常用的旋轉(zhuǎn)方法①方差最大正交旋轉(zhuǎn)(varimaxorthogonalrotation)——因子對應(yīng)軸相互正交②斜交旋轉(zhuǎn)(obliquerotation)——因子對應(yīng)軸相互間不正交第76頁,共112頁,2023年,2月20日,星期六YOURSITEHERE②斜交旋轉(zhuǎn)因子斜交旋轉(zhuǎn)后,各因子負(fù)荷發(fā)生了較大變化,出現(xiàn)了兩極分化。各因子間不再相互獨(dú)立,而彼此相關(guān)。各因子對各變量的貢獻(xiàn)的總和也發(fā)生了改變。適用于大數(shù)據(jù)集的因子分析。①方差最大正交旋轉(zhuǎn)基本思想以使各因子載荷值的方差達(dá)到最大作為因子載荷矩陣簡化的準(zhǔn)則,且保持原公因子的正交性和變量共同度hi2不變,此時(shí)公因子的方差貢獻(xiàn)則不再與原來相同??墒姑總€(gè)因子上的具有最大載荷的變量數(shù)最小,因此可以簡化對因子的解釋。第77頁,共112頁,2023年,2月20日,星期六YOURSITEHERE因子旋轉(zhuǎn)的操作對于二維因子來說好辦,而多維因子的旋轉(zhuǎn)就復(fù)雜多了,每次只調(diào)整兩個(gè)因子軸,讓其它的軸固定,這樣不斷反復(fù)地進(jìn)行,直到獲得最大方差為止。bij為旋轉(zhuǎn)后因子載荷中第i行第j列的元素,使用平方是為了避免負(fù)值?!_(dá)到極大第78頁,共112頁,2023年,2月20日,星期六YOURSITEHEREF1F1F2F2Factor1 Factor2 x1 0.5 0.5x2 0.7 0.7x3 -0.6 0.6x4 -0.5 -0.5 Factor1 Factor2 x1 0 0.6x2 0 0.9x3 -0.9 0x4 0 -0.9 21342134正交旋轉(zhuǎn)及樣品點(diǎn)投影第79頁,共112頁,2023年,2月20日,星期六YOURSITEHERE六、因子得分因子分析模型建立后,還有一個(gè)重要的作用是應(yīng)用因子分析模型去評價(jià)每個(gè)樣品(或變量)在整個(gè)模型中的地位,即進(jìn)行綜合評價(jià)。由于公因子能充分反映原始變量的相關(guān)關(guān)系,用公因子代表原始變量時(shí),將更有利于描述研究對象的特征。通常,所選取的公因子數(shù)總是少于原始變量數(shù)。對于每一個(gè)樣品,利用其原始變量觀測值去計(jì)算相應(yīng)因子Fi的估計(jì)值,這便稱為因子得分或因子計(jì)量。第80頁,共112頁,2023年,2月20日,星期六YOURSITEHERE變成F=bx
或Fj=bj1x1+…+bjpxpj=1,…,m.
稱為因子得分(函數(shù)).由簡化的因子模型可用Thomson法,即回歸法等來求?;貧w法得分是由Bayes思想導(dǎo)出的,得到的因子得分是有偏的,但計(jì)算結(jié)果誤差較小。第81頁,共112頁,2023年,2月20日,星期六YOURSITEHERE根據(jù)最小二乘估計(jì)得因?yàn)樽兞亢鸵蜃泳褬?biāo)準(zhǔn)化,所以bj0=0第82頁,共112頁,2023年,2月20日,星期六第83頁,共112頁,2023年,2月20日,星期六YOURSITEHERE七、Q型因子分析(自學(xué))第84頁,共112頁,2023年,2月20日,星期六YOURSITEHERE輸入原始數(shù)據(jù)xn*p,計(jì)算樣本均值和方差,進(jìn)行標(biāo)準(zhǔn)化計(jì)算(處理);求樣本相關(guān)系數(shù)矩陣R=(rij)p*p;求相關(guān)系數(shù)矩陣的特征根λi(λ1,λ2,…,λp>0)和相應(yīng)的標(biāo)準(zhǔn)正交的特征向量li;八、因子分析的步驟第85頁,共112頁,2023年,2月20日,星期六YOURSITEHERE確定公共因子數(shù)m(按前m個(gè)特征值之和占特征值總和的百分比來確定);求出主因子載荷矩陣A=[aij];計(jì)算公共因子的共性方差hi2,是否接近于1;對載荷矩陣進(jìn)行旋轉(zhuǎn),以求能更好地解釋公共因子;計(jì)算因子得分;對公共因子作出專業(yè)性的解釋。第86頁,共112頁,2023年,2月20日,星期六YOURSITEHERE相關(guān)性度量:變量間的方差-協(xié)方差、相關(guān)系數(shù)相關(guān)性度量:夾角余弦和各種距離系數(shù)R型因子分析——控礦地質(zhì)因素分析R型因子分析是主成分分析的發(fā)展Q型因子分析——圈定遠(yuǎn)景區(qū)研究變量之間的成因分類研究樣品之間的成因分類第87頁,共112頁,2023年,2月20日,星期六焦家金礦礦化元素因子分析地質(zhì)找礦論叢,2008年02期焦家金礦位于膠東西北部,是“焦家式破碎帶熱液蝕變巖型”金礦的命名地。它以規(guī)模巨大、礦體形態(tài)簡單、礦化連續(xù)、穩(wěn)定等特點(diǎn)明顯有別于石英脈金礦。第88頁,共112頁,2023年,2月20日,星期六在水平上,以斷面為中心向外依次出現(xiàn)絹英巖化帶、鉀化-絹英巖化-硅化帶、硅化-鉀化帶、正?;◢弾r帶;在垂向上,蝕變分帶不是很發(fā)育,隨著深部韌性變形作用加強(qiáng),蝕變的強(qiáng)度和規(guī)模都逐漸減小。第89頁,共112頁,2023年,2月20日,星期六第90頁,共112頁,2023年,2月20日,星期六第91頁,共112頁,2023年,2月20日,星期六第92頁,共112頁,2023年,2月20日,星期六第93頁,共112頁,2023年,2月20日,星期六第94頁,共112頁,2023年,2月20日,星期六第95頁,共112頁,2023年,2月20日,星期六第96頁,共112頁,2023年,2月20日,星期六第97頁,共112頁,2023年,2月20日,星期六第98頁,共112頁,2023年,2月20日,星期六第99頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第四節(jié)對應(yīng)分析第100頁,共112頁,2023年,2月20日,星期六YOURSITEHERE對應(yīng)分析是在R型因子分析和Q型因子分析的基礎(chǔ)上發(fā)展起來的、能夠揭示變量與樣品之間雙重關(guān)系的一種多元統(tǒng)計(jì)方法。第101頁,共112頁,2023年,2月20日,星期六YOURSITEHERE可提供以下信息:①變量間的關(guān)系:空間上鄰近的一些變量點(diǎn),表示這些變量緊密相關(guān),即它們具有成因上的聯(lián)系,指示某一特定的地質(zhì)作用;②樣品間的關(guān)系:鄰近的樣品點(diǎn)具有相似的性質(zhì),屬同一類型,是同樣地質(zhì)作用的產(chǎn)物;③變量與樣品之間的關(guān)系:同一類型的樣品點(diǎn)將為鄰近的變量點(diǎn)所表征。也就是說,同類樣品點(diǎn)為其鄰近變量點(diǎn)所指示的地質(zhì)作用下的產(chǎn)物。更重要的是,可在同一圖上表示出上述三種信息,從而可同時(shí)進(jìn)行分類及地質(zhì)推斷解釋。第102頁,共112頁,2023年,2月20日,星期六YOURSITEHERER型和Q型對應(yīng)關(guān)系的對偶定理第103頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第104頁,共112頁,2023年,2月20日,星期六YOURSITEHEREG2F2G2
F200.2-0.20.20.4-0.2-0.41.2.3.4.5.6.7.8.11.10.12.9.13.1△2△3△4△5△6△7△
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度藝術(shù)品共同創(chuàng)作與展覽合同2篇
- 二零二五版房屋租賃合同免責(zé)及維修保障3篇
- 二零二五年空調(diào)銷售與綠色消費(fèi)倡導(dǎo)合同3篇
- 二零二五年度鋼管模板租賃環(huán)保要求及價(jià)格評估合同3篇
- 二零二五版綠色金融貸款購銷環(huán)保合同3篇
- 二零二五版綠色交通地產(chǎn)轉(zhuǎn)讓合同補(bǔ)充協(xié)議3篇
- 二零二五版商鋪?zhàn)赓U合同樣本-商業(yè)地產(chǎn)租賃合同示范文本3篇
- 二零二五版韓娛版權(quán)林綿綿著作離婚協(xié)議書撰寫與版權(quán)登記及保護(hù)合同3篇
- 二零二五年度數(shù)據(jù)中心網(wǎng)絡(luò)安全服務(wù)合同樣本2篇
- 二零二五年度高端木門定制安裝服務(wù)合同3篇
- 驗(yàn)貨報(bào)告范本(英文版)
- 理想氣體熱力過程
- 2022度機(jī)構(gòu)編制重要事項(xiàng)的報(bào)告【3篇】
- GB/T 25772-2010滾動軸承鐵路客車軸承
- GB 31247-2014電纜及光纜燃燒性能分級
- 專利評估報(bào)告模板
- 士卓曼種植系統(tǒng)外科植入流程課件
- 二年級下冊《一起長大的玩具》導(dǎo)讀教學(xué)-一場別樣的童年之旅
- 二尖瓣狹窄并關(guān)閉不全共17張課件
- 某環(huán)保企業(yè)業(yè)務(wù)介紹課件
- 心臟瓣膜病護(hù)理課件
評論
0/150
提交評論