SAS入門對應(yīng)分析_第1頁
SAS入門對應(yīng)分析_第2頁
SAS入門對應(yīng)分析_第3頁
SAS入門對應(yīng)分析_第4頁
SAS入門對應(yīng)分析_第5頁
已閱讀5頁,還剩96頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

對應(yīng)分析第九章對應(yīng)分析對應(yīng)分析(correspondenceanalysis)是用于尋求列聯(lián)表的行和列之間聯(lián)系的一種低維圖形表示法,它可以從直覺上揭示出同一分類變量的各個類別之間的差異,以及不同分類變量各個類別之間的對應(yīng)關(guān)系。對應(yīng)分析是由法國人Benzecri于1970年提出的,起初在法國和日本最為流行,然后引入美國。在對應(yīng)分析中,列聯(lián)表的每一行對應(yīng)〔通常是二維〕圖中的一點,每一列也對應(yīng)同一圖中的一點。本質(zhì)上,這些點都是列聯(lián)表的各行各列向一個二維歐式空間的投影,這種投影最大限度地保持了各行〔或各列〕之間的關(guān)系。第九章對應(yīng)分析§9.1行輪廓和列輪廓§9.2獨立性的檢驗和總慣性§9.3行、列輪廓的坐標§9.4對應(yīng)分析圖§9.1行輪廓和列輪廓一、列聯(lián)表二、對應(yīng)矩陣三、行、列輪廓一、列聯(lián)表其中,是第行、第列類別組合的頻數(shù),

;為第行的頻數(shù)之和,;為第列的頻數(shù)之和,;為所有類別組合的頻數(shù)總和。二、對應(yīng)矩陣這里,。顯然有。稱 為對應(yīng)矩陣。將對應(yīng)矩陣表中的最后一列用表示,即其中是元素均為1的維向量,最后一行用表示,即

其中是元素均為1的維向量,向量和的元素有時稱為行和列密度〔masses〕。三、行、列輪廓第行輪廓:其各元素之和等于1,即。第列輪廓:其各元素之和等于1,即。行輪廓矩陣

其中。列輪廓矩陣

其中。

可見,可以表示成各列輪廓的加權(quán)平均。類似地,即可以表示成各行輪廓的加權(quán)平均。例將由個人組成的樣本按心理健康狀況與社會經(jīng)濟狀況進行交叉分類,分類結(jié)果見表。

將表中的數(shù)據(jù)除以,得到對應(yīng)矩陣,列于表中。表給出的行密度和列密度向量為

行輪廓矩陣為

列輪廓矩陣為兩個馬賽克圖

對心理健康的每一種狀況,A、B、C、D、E五個小方塊的寬度顯示了行輪廓,0、1、2、3四種心理健康狀況的小方塊高度顯示了行密度。

對社會經(jīng)濟的每一種狀況,0、1、2、3四個小方塊的高度顯示了列輪廓,A、B、C、D、E五種社會經(jīng)濟狀況的小方塊寬度顯示了列密度。§9.2獨立性的檢驗和總慣量一、行、列獨立的檢驗二、總慣量一、行、列獨立的檢驗在列聯(lián)表中,檢驗行變量和列變量相互獨立假設(shè)的統(tǒng)計量為

當(dāng)獨立性的原假設(shè)為真,且樣本容量充分大,期望頻數(shù)時,近似服從自由度為的卡方分布。拒絕規(guī)那么為假設(shè),那么拒絕獨立性的原假設(shè)其中是的上分位點。二、總慣量

總慣量還可以行輪廓和列輪廓的形式表達如下:其中稱為第行輪廓到行輪廓中心的卡方〔〕距離,它可看作是一個加權(quán)的平方歐氏距離。同樣,是第列輪廓到列輪廓中心的卡方距離。故總慣量可看成是行輪廓到其中心的卡方距離的加權(quán)平均,也可看成是列輪廓到其中心的卡方距離的加權(quán)平均。它既度量了行輪廓之間的總變差,也度量了列輪廓之間的總變差??倯T量為零的等價情形

總慣量為零與以下三種情形的任一種等價:〔1〕,或表示為;〔2〕所有的行輪廓相等,即;〔3〕所有的列輪廓相等,即。所以,如果行變量與列變量相互獨立,那么我們可以期望〔由樣本數(shù)據(jù)構(gòu)成的〕列聯(lián)表中所有的行有相近的輪廓,所有的列亦有相近的輪廓?!?.3行、列輪廓的坐標§9.4對應(yīng)分析圖一、行、列輪廓的逼近二、行〔列〕點之間的距離三、行點和列點相近的意涵一、行、列輪廓的逼近二、行〔列〕點之間的距離如果兩個行〔列〕點接近,那么說明相應(yīng)的兩個行〔列〕輪廓是類似的;反之,如果兩個行〔列〕點遠離,那么說明相應(yīng)的兩個行〔列〕輪廓是非常不同的。需要指出的是,行點與列點之間并沒有直接的距離關(guān)系。三、行點和列點相近的意涵如果一個行點和一個列點相近,那么說明行、列兩個變量的相應(yīng)類別組合發(fā)生的頻數(shù)會高于這兩個變量相互獨立情形下的期望值。例在例中,經(jīng)計算,奇異值、主慣性以及奉獻率等的計算結(jié)果列于表中??倯T量的94.75%可由第一維來解釋,前二維解釋了高達99.76%的總慣量,幾乎解釋了列聯(lián)表數(shù)據(jù)的所有變差。例行點和列點的前二維坐標矩陣為

將各行點和列點置于同一坐標系中,構(gòu)成對應(yīng)分析圖,如下圖。一.對應(yīng)分析在因子分析中,或者只對變量〔列中的變量〕進行分析,或者只對樣品〔觀測值或行中的變量〕進行分析;而且利用載荷圖來描述各個變量之間的接近程度。典型相關(guān)分析也只研究列中兩組變量之間的關(guān)系。然而,在很多情況下,所關(guān)心的不僅僅是行或列本身變量之間的關(guān)系,而是行變量和列變量各水平間的相互關(guān)系;這就是因子分析等方法所沒有說明的了。該數(shù)據(jù)關(guān)于漢字讀寫能力的變量有三個水平:“純漢字〞意味著可以完全自由使用純漢字讀寫,“半漢字〞意味著讀寫中只有局部漢字〔比方日文〕,而“純英文〞意味著只能夠讀寫英文而不會漢字。而數(shù)學(xué)成績有4個水平〔A、B、C、D〕。

對應(yīng)分析引入例:中文水平與數(shù)學(xué)學(xué)習(xí)優(yōu)劣的關(guān)系可以對這個列聯(lián)表進行前面所說的c2檢驗來考察行變量和列變量是否獨立。結(jié)果在下面表中〔通過Analyze-DescriptiveStatistics-Crosstabs〕所有的檢驗都很顯著,看來兩個變量確實不獨立。一.對應(yīng)分析但是如何用象因子分析的載荷圖那樣的直觀方法來展示這兩個變量各個水平之間的關(guān)系呢?這就是對應(yīng)分析〔correspondenceanalysis〕方法。對應(yīng)分析方法被普遍認為是探索性數(shù)據(jù)分析的內(nèi)容,因此,讀者只要能夠會用數(shù)據(jù)畫出描述性的點圖,并能夠理解圖中包含的信息即可。一.對應(yīng)分析處理列聯(lián)表的問題僅僅是對應(yīng)分析的一個特例。一般地,對應(yīng)分析常規(guī)地處理連續(xù)變量的數(shù)據(jù)矩陣;這些數(shù)據(jù)具有如在主成分分析、因子分析、聚類分析等時所處理的數(shù)據(jù)形式。一.對應(yīng)分析在對應(yīng)分析中,根據(jù)各行變量的因子載荷和各列變量的因子載荷之間的關(guān)系,行因子載荷和列因子載荷之間可以兩兩配對。如果對每組變量選擇前兩列因子載荷,那么兩組變量就可畫出兩因子載荷的散點圖。由于這兩個圖所表示的載荷可以配對,于是就可以把這兩個因子載荷的兩個散點圖畫到同一張圖中,并以此來直觀地顯示各行變量和各列變量之間的關(guān)系。由于列聯(lián)表數(shù)據(jù)形式和一般的連續(xù)變量的數(shù)據(jù)形式類似,所以也可以用對應(yīng)分析的數(shù)學(xué)方法來研究行變量各個水平和列變量各個水平之間的關(guān)系;雖然對不同數(shù)據(jù)類型所產(chǎn)生結(jié)果的解釋有所不同,數(shù)學(xué)的原理是一樣的。一.對應(yīng)分析對應(yīng)分析結(jié)果的展示

運用純漢字的點和最好的數(shù)學(xué)成績A最接近,而不會漢字只會英文的點與最差的數(shù)學(xué)成績F〔或者D,雖然在縱坐標稍有差距〕最接近,而用局部漢字的和數(shù)學(xué)成績B接近。結(jié)果解釋根據(jù)SAS計算。其中第一個就是下面的各維的匯總表。這里所涉及的是行與列因子載荷之間的關(guān)系;選擇行和列變量的顯著的因子載荷的標準是一樣的。選擇多少就涉及幾維。為了畫出散點圖,就至少要選擇兩維了。

TheCORRESPProcedureInertiaandChi-SquareDecomposition

奇異值慣量(特征值)

慣量比例SingularPrincipalChi-CumulativeValueInertiaSquarePercentPercent1734507090----+----+----+----+----+---

0.5520.30593.993.9****************************0.1410.0206.1699.63**Total0.6930.32575.12100.00DegreesofFreedom=6Inertia-慣量,為每一維到其重心的加權(quán)距離的平方。它度量行列關(guān)系的強度。SingularValue-奇異值〔是慣量的平方根〕,反映了是行與列各水平在二維圖中分量的相關(guān)程度,是對行與列進行因子分析產(chǎn)生的新的綜合變量的典型相關(guān)系數(shù)。ChiSquare-就是關(guān)于列聯(lián)表行列獨立性c2檢驗的c2統(tǒng)計量的值,和前面表中的相同。其后面的Sig為在行列獨立的零假設(shè)下的p-值,注釋說明自由度為(4-1)×(3-1)=6,Sig.值很小說明列聯(lián)表的行與列之間有較強的相關(guān)性。ProportionofInertia-慣量比例,是各維度〔公因子〕分別解釋總慣量的比例及累計百分比,類似于因子分析中公因子解釋能力的說明。解釋

從該表可以看出,由于第一維的慣量比例占了總比例的93.9%,因此,其他維的重要性可以忽略〔雖然畫圖時需要兩維,但主要看第一維-橫坐標〕。在輸出中還有另外兩個表分別給出了畫圖中兩套散點圖所需要的兩套坐標。一.對應(yīng)分析行變量(中文)的縱,橫坐標每個變量對公因子的奉獻率,各列之和等于1行點余弦平方,表示公因子對行變量的奉獻率,每行之和等于1Mass–原始數(shù)據(jù)中各列數(shù)據(jù)之和占總合計的百分比列變量(數(shù)學(xué)成績中文)的縱,橫坐標

該表給出了圖中三個漢字使用點的坐標:純漢字(-.897,-.240),半漢字(.102,.491),純英文(.970,-.338),以及四個數(shù)學(xué)成績點的坐標:數(shù)學(xué)A(-.693,-.345),數(shù)學(xué)B(-.340,.438),數(shù)學(xué)C(.928,.203),數(shù)學(xué)C(1.140,-.479)。兩表中的概念不必記;其中Mass為行與列的邊緣概率;ScoreinDimension是各維度的分值(二維圖中的坐標);Inertia:就是前面所提到的慣量,為每一行/列到其重心的加權(quán)距離的平方。

一.對應(yīng)分析解釋對應(yīng)分析結(jié)果的展示

運用純漢字的點和最好的數(shù)學(xué)成績A最接近,而不會漢字只會英文的點與最差的數(shù)學(xué)成績F〔或者D,雖然在縱坐標稍有差距〕最接近,而用局部漢字的和數(shù)學(xué)成績B接近。典范對應(yīng)分析〔CCA〕在群落結(jié)構(gòu)分析中的應(yīng)用

一.對應(yīng)分析例2以荷蘭Terschelling島沙丘草地樣地調(diào)查數(shù)據(jù)為例,分析了Terschelling島植被與環(huán)境因子(土壤A1層厚度,土壤濕度)和人類活動〔草地管理類型,草地農(nóng)業(yè)使用方式和施肥量〕的關(guān)系。結(jié)果說明CCA第一排序軸〔主要反映土壤自身的環(huán)境信息,或者說立地的水土條件〕和第二排序軸〔人類活動的影響〕能較好地被所實測的環(huán)境變量解釋??梢园l(fā)現(xiàn)物種分布與環(huán)境的關(guān)系。物種Salrep,hyprad主要分布人類干擾少的地段JunbufAlogen主要分布在人類干擾比較大的地段。Junart,Elepal主要分布在濕潤的立地上,而Tripra,Brohor主要分布在枯燥的地段上。一.對應(yīng)分析Eyik=ck*exp[-(xi-uk)2/2tk2]yik

物種

k在樣方i

(i

=1,…,n;k=1,…,m)中的多度,Eyik多度期望值。

xi

環(huán)境變量x

樣方I中的取值。

ck物種k最大多度值,

uk

物種k,多度值最大時對應(yīng)的環(huán)境變量值。

tk物種k的生態(tài)幅。

一.對應(yīng)分析一.對應(yīng)分析ST1ST2ST3ST4ST5ST6SP1038542SP2644352SP3795421SP4248122SP5780123SP6457312一.對應(yīng)分析一.對應(yīng)分析結(jié)論和討論

通過對Terschelling島上沙丘草地植被調(diào)查進行CCA分析,我們發(fā)現(xiàn)第一和第二排序軸能較好地被所實測的環(huán)境變量解釋。第一排序軸主要反映土壤自身的環(huán)境信息,或者說立地的水土條件。而第二軸主要反映人類活動的影響。Terschelling島沙丘草地植被物種分布和樣方分布并不能令人滿意地用這兩個理論環(huán)境變量來解釋,這可以從兩個排序軸累積特征值百分率〔37.7%〕上可以看出。一.對應(yīng)分析結(jié)論和討論即使這樣,我們還可以發(fā)現(xiàn)物種分布與環(huán)境的關(guān)系。物種Salrep,hyprad主要分布人類干擾少的地段JunbufAlogen主要分布在人類干擾比較大的地段。Junart,Elepal主要分布在濕潤的立地上,而Tripra,Brohor主要分布在枯燥的地段上。

在CCA分析過程中,稀有物種已經(jīng)被剔除。但對樣方?jīng)]有進行任何處理,這可能在某種程度上導(dǎo)致了兩個理論環(huán)境變量解釋數(shù)據(jù)結(jié)構(gòu)能力的缺乏。用于CCA分析的樣方較少,也可能是另外一個原因。一.對應(yīng)分析一.對應(yīng)分析利用對應(yīng)分析,在同一平面上圖示出來的樣品點群和變量點群可以提供豐富的信息,比方:(1)互相靠近的樣品點群具有相似性質(zhì),可以認為它們是同一過程所產(chǎn)生的結(jié)果,或者可以解釋為這樣的點群屬于同一類;〔2〕互相靠近的變量點群表示變量之間有種相互關(guān)系;〔3〕一個樣品點群可用靠近它的變量點群來描述,這有于解釋樣品類型,并通過樣品在空間的分布了解過程的空間關(guān)系,所以對應(yīng)分析在實際問題中的用也是較為廣泛的。一.對應(yīng)分析二.對應(yīng)分析的原理和方法設(shè)有n個樣本,每個樣本有p個變量,即其信息陣為對應(yīng)分析的數(shù)據(jù)變換對應(yīng)分析的數(shù)據(jù)變換二.對應(yīng)分析的原理和方法nvaavlp行和18030251560552652160605030120110530二.對應(yīng)分析的原理和方法二.對應(yīng)分析的原理和方法二.對應(yīng)分析的原理和方法二.對應(yīng)分析的原理和方法二.對應(yīng)分析的原理和方法三.對應(yīng)分析的計算步驟三.對應(yīng)分析的計算步驟三.對應(yīng)分析的計算步驟三、應(yīng)用實例

用Exce15.0建立數(shù)據(jù)庫,用SASforWindows6.12對其做對應(yīng)分析。12個死因點10種惡性腫瘤死亡率見表1。表11996年福建省死因點惡性腫瘤死亡率(1/10萬)死因點鼻咽癌食管癌胃癌肝癌腸癌肺癌乳腺癌宮頸癌膀胱癌白血病長樂3.8914.0648.0121.395.389.571.650.150.603.29長泰2.1726.0024.9222.758.6710.291.080.000.003.25福安0.002.185.4422.844.3517.401.094.350.004.35福州1.467.6131.9226.946.1515.822.051.460.292.93惠安0.8946.3711.5932.100.899.810.893.570.891.78將樂0.601.8116.2719.283.016.021.200.600.004.82寧化1.748.723.2024.702.034.360.000.582.032.62莆田1.9841.1844.1535.224.9614.880.000.000.004.96沙縣2.143.0013.2926.585.148.141.716.860.003.00同安1.8337.9710.4536.134.5914.861.650.000.733.67廈門4.7120.7123.7742.8412.2424.245.413.060.244.24永定1.664.986.6435.715.8118.270.832.490.007.47特征根及其貢獻率見表2。

表2特征根及貢獻率

123456789特征根0.115630.090510.024470.019520.012690.005120.002600.001190.00054貢獻率(%)42.733.248.997.174.661.880.960.440.20累積貢獻率(%)42.4775.7184.7091.8796.5398.4199.3699.80100.00前兩個特征根累積貢獻率達75.71%,大體上可代表原始資料的信息。

因子載荷及“信息量(mass)”見表3。

表3因子載荷及“信息量”死因點公因子1

(diml1公因子2

(dim2)信息量

(mass)腫瘤公因子1

(dim1)公因子2

(dim2)信息量

(mass)長樂(c1)-0.068978-0.5822270.095355鼻咽癌(NA)0.079835-0.1631590.020371長泰(fa)-0.226265-0.1332700.087531食管癌(ES)-0.6236810.2066830.189482福安(fa)0.6066640.3003390.054746胃癌(ST)-0.056380-0.5455520.211610福州(fz)0.183955-0.3110940.085324肝癌(LI)0.1331620.1724840.305940惠安(ha)-0.5084040.3737620.096052腸癌(IN)0.282343-0.0848080.055823將樂(jl)0.312674-0.2601340.047337肺癌(LU)0.2704680.1180620.135681寧化(nh)0.0119720.4154850.044132乳腺癌(BR)0.364518-0.0655560.015505莆田(pt)-0.321754-0.1822430.130092宮頸癌(CE)0.8097880.5073790.020415沙縣(sx)0.5050490.0830850.061686膀胱癌(BL)-0.3782400.6706780.004221同安(ta)-0.3247720.3009380.098789白血病(LE)0.3588250.0824900.040953廈門(xm)0.1604220.0344420.124908

永定(yd)0.4554820.2689250.074048

表4λ1、λ2在各死因點及惡性腫瘤合計奉獻率死因點長樂長泰福安福州惠安將樂寧化莆田沙縣同安貢獻率(%)94.7264.0285.4387.9290.2664.7729.3887.7947.8391.75惡性腫瘤鼻咽癌食管癌胃癌肝癌腸癌肺癌乳腺癌宮頸癌膀胱癌白血病貢獻率(%)12.3098.2498.1078.9747.3659.7126.1553.8915.1550.49小結(jié)

通過對死因點和惡性腫瘤作對應(yīng)分析,可以直觀地看出各死因點的癌譜特征,以便對惡性腫瘤的高發(fā)區(qū)和低發(fā)區(qū)進行病因?qū)W研究,以期進一步了解惡性腫瘤的發(fā)生、開展及死亡情況,指定有效的防治措施。[2]

對應(yīng)分析將變量與樣品結(jié)合起來,通過共同的特征根,得到共同的公因子,再由因子載荷將二者反映到同一張二維平面圖上,反映出樣品與變量的內(nèi)在關(guān)系,因而對應(yīng)分析是探索性研究的有力工具。

公共場所空氣質(zhì)量指標的對應(yīng)分析

評價空氣質(zhì)量的定量或定性指標,通常采用t檢驗、F檢驗、相關(guān)回歸或χ2檢驗等方法進行。本文用對應(yīng)分析〔Correspondenceanalysis,ANACOR〕法,可將兩兩指標不同分類間的關(guān)系在二維坐標圖上給出直觀、形象的表達。一.資料與方法1.資料來源

調(diào)查福州市區(qū)5家具有中央空調(diào)的綜合性賓館內(nèi)娛樂場所的空氣監(jiān)測資料(1989-1998年),對其中的5個指標-二氧化碳〔co2)、細菌總數(shù)(bac)、相對濕度(hum)、負離子濃度(ne2)和監(jiān)測時間(tim〕進行兩兩對應(yīng)分析。監(jiān)測時各場所新風(fēng)量均>20m3/人.h。2.統(tǒng)計分析方法

采用國際通用的SPSS8.0forWindows軟件包進行統(tǒng)計分析與繪圖。各指標監(jiān)測資料已存儲為數(shù)據(jù)庫文件Xu.sav。3.分類方法表示

L表示低值,M表示中值,H表示高值;低于P25者、P25~P75者和≥P75者分別定為L、M和H。4個指標的等級分類標示為:細菌總數(shù)LB、MB、HB;二氧化碳為LC2、MC2、HC2;相對濕度為LH、MH、HH;負離子濃度為LN2、MN2、HN2。監(jiān)測時間以開場前〔T0〕、開場后1小時〔T1〕、開場2小時后〔T2〕表示。表1顯示二氧化碳與細菌總數(shù)、相對濕度與負離子濃度、開場時間與細菌總數(shù)以及監(jiān)測時間與二氧化碳在不同等級分類間關(guān)系密切,有顯著性。表1.二氧化碳、細菌總數(shù)、相對濕度、負離子濃度與開場時間的列聯(lián)表----------------------------------------------------------------------------

LB

MB

HB

χ2檢驗----------------------------------------------------------------------------

LC2

17

28

9

χ2=27.035

MC2

35

79

26

HC2

8

24

32

P=0.000----------------------------------------------------------------------------

LN2

MN2

HN2

LH

27

4

1

χ2=13.078

MH

19

8

2

HH

1

2

2

P=0.011----------------------------------------------------------------------------

LB

MB

HB

T0

29

36

15

χ2=13.436

T1

18

48

22

T2

13

47

30

P=0.009-----------------------------------------------------------------------------

LC2

MC2

HC2T0

31

38

11

χ2=28.253T1

15

52

21T2

8

50

32

P=0.000-----------------------------------------------------------------------------三.統(tǒng)計分析結(jié)果本文僅介紹二氧化碳與細菌總數(shù)間的相互關(guān)系的主要輸出,以及4種相互關(guān)系的聯(lián)合坐標圖,其余從略。1.二氧化碳與細菌總數(shù)間的相互關(guān)系〔1〕公因子、特征根與表達比例表3.2個公因子、奇異值與累積比例--------------------------------------------------------------------------公因子

奇異值

慣量

表達比例

累積比例--------------------------------------------------------------------------

1

0.31916

0.10187

0.972

0.972

2

0.05403

0.00292

0.028

1.000--------------------------------------------------------------------------合計

——

0.00145

1.000

1.000--------------------------------------------------------------------------〔3〕列得分與奉獻率表5.列得分與各公因子奉獻率--------------------------------------------------------------------------

列得分

奉獻率細菌總數(shù)

合計-----------------------------------------------(個/皿)

公因子1公因子2

公因子1

公因子2--------------------------------------------------------------------------LB(<7)

0.233

-0.484

0.372

0.171

0.597MB(7~17.99)

0.508

-0.260

-0.202

0.107

0.385HB(≥18)

0.260

0.942

0.062

0.722

0.019--------------------------------------------------------------------------

合計

1.000

1.000

1.000-------------------------------------------------------------------------

〔2〕行得分與奉獻率表4.行得分與各公因子奉獻率--------------------------------------------------------------------------

行得分

奉獻率二氧化碳

合計------------------------------------------〔%〕

公因子1公因子2

公因子1公因子2--------------------------------------------------------------------------LC2(<0.05)

0.209

-0.408

0.419

0.109

0.682MC2(0.05~0.0711)

0.543

-0.291

-0.177

0.144

0.314HC2(≥0.0712)

0.248

0.980

0.033

0.747

0.005--------------------------------------------------------------------------

合計

1.000

1.000

1.000--------------------------------------------------------------------------對應(yīng)分析的corresp過程CORResp過程用以下語句引用:PROCCORRESP選項;TABLES<變量>變量VAR變量;BY變量ID變量;SUPPLEMENTARY變量;WEIGHT變量;PROCCORRESP語句的選項DATA=SAS-data-set——給出CORResp過程分析的SAS集名字。OUT=SAS-data-set——輸出SAS數(shù)據(jù)集。OUTF=SAS-data-set——生成包含各種統(tǒng)計量。的Inertia-慣量,為每一維到其重心的加權(quán)距離的平方。它度量行列關(guān)系強度。SingularValue-奇異值〔是慣量的平方根〕,反映了是行與列各水平在二維圖中分量的相關(guān)程度,是對行與列進行因子分析產(chǎn)生的新的綜合變量的典型相關(guān)系數(shù)。ChiSquare-就是關(guān)于列聯(lián)表行列獨立性c2檢驗的c2統(tǒng)計量的值,和前面表中的相同。其后面的Sig為在行列獨立的零假設(shè)下的p-值,注釋說明自由度為(4-1)×(3-1)=6,Sig.值很小說明列聯(lián)表的行與列之間有較強的相關(guān)性。ProportionofInertia-慣量比例,是各維度〔公因子〕分別解釋總慣量的比例及累計百分比,類似于因子分析中公因子解釋能力的說明。例題計算步驟①

計算兩個“相關(guān)矩陣〞:利用變換后的R行C列數(shù)據(jù)陣Z,計算每兩行的“相關(guān)系數(shù)〞,可得一個“相關(guān)系數(shù)矩陣〞A;再計算每兩列的“相關(guān)系數(shù)〞,可得另一個R行C列的“相關(guān)系數(shù)矩陣〞B。可以證明,A和B有相同的非零特征根,但特征向量。本例可以有三個非零特征根,0.1992,0.03009和0.0008595,其奉獻率分別為86.56%,13.07%,0.37%。②

基于A作一次因子分析,得到行因素各類別的因子負荷。③

基于B作一次因子分析,得到列因素各類別的因子負荷。SAS編程

TheCORRESPProcedureInertiaandChi-SquareDecomposition

奇異值慣量,慣量比例SingularPrincipalChi-CumulativeValueInertiaSquarePercentPercent1734516885----+----+----+----+----+---

0.446370.199241073.3386.5686.56*************************0.173460.03009162.0813.0799.63****0.029320.000864.630.37100.00Total0.230191240.04100.00DegreesofFreedom=12Inertia-慣量,它度量行列關(guān)系強度SingularValue-奇異值〔是慣量的平方根〕,反映了是行與列各水平在二維圖中分量的相關(guān)程度,ProportionofInertia-慣量比例

RowCoordinates行變量(眼睛)的縱,橫坐標Dim1Dim2淺色lighteye0.44070.0885第一象限藍色blueeye0.40030.1654第一象限棕色mediumey-0.0336-0.2450第三象限深色darkeye-0.70270.1339第四象限

SummaryStatisticsfortheRowPoints

QualityMassInertialighteye0.99500.29330.2587blueeye0.97850.13330.1110mediumey0.99950.32930.0875darkeye1.00000.24410.5427Quality-每個變量上兩個公因子奉獻率的和,Mass–原始數(shù)據(jù)中各列數(shù)據(jù)之和占總合計的百分比,Inertia–每個變量對特征根的奉獻率PartialContributionstoInertiafortheRowPoints

Dim1Dim2lighteye0.28590.0763blueeye0.10720.1212mediumey0.00190.6570darkeye0.60500.1455每個變量對公因子的奉獻率,各列之和等于1TheCORRESPProcedureIndicesoftheCoordinatesthatContributeMosttoInertiafortheRowPoints每個變量對公因子奉獻率分別用0,1,2表示Dim1Dim2Bestlighteye101blueeye002mediumey022darkeye111

行點余弦平方,表示公因子對行變量的奉獻率,每行之和等于1SquaredCosinesfortheRowPointsDim1Dim2lighteye0.95650.0385blueeye0.83580.1427mediumey0.01850.9810darkeye0.96490.0350

列變量(頭發(fā))的縱,橫坐標ColumnCoordinatesDim1Dim2

金色fair0.54400.1738第一象限紅色red0.23330.0483第一象限棕色medium0.0420-0.2083第二象限深色dark-0.58870.1040第四象限黑色black-1.09440.2864第四象限

SummaryStatisticsfortheColumnPoints

QualityMassInertia

fair0.99950.27010.3829red0.80280.05310.0163medium0.99980.39670.0778dark0.99970.25820.4010black0.99830.02190.1220

Quality-每個變量上兩個公因子奉獻率的和,Mass–原始數(shù)據(jù)中各列數(shù)據(jù)之和占總合計的百分比,Inertia–每個變量對特征根的奉獻率TheCORRESPProcedurePartialContributionstoInertiafortheColumnPoints每個變量對公因子的奉獻率,各列之和等于1Dim1Dim2fair0.40120.2713red0.01450.0041medium0.00350.5721dark0.44920.0927black0.13170.0597

IndicesoftheCoordinatesthatContributeMosttoInertiafortheColumnPoints每個變量對公因子奉獻率分別用0,1,2表示Dim1Dim2Bestfair111red001medium022dark101black001

SquaredCosinesfortheColumnPoints列點余弦平方,表示公因子對列變量的奉獻率,每行之和等于1Dim1Dim2fair0.90690.0926red0.76980.0330medium0.03910.9607dark0.96950.0302black0.93430.0640

PlotofDim2*Dim1$eye.Symbolusedis'*'.

-+--------+--------+--------+--------+--------+--------+--------+--------+--------+--------+--Dim2||||0.3++||||||||||0.2++|||blueeye**fair||||*darkeye|||0.1+*dark+|

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論