多變量分析程序概述_第1頁
多變量分析程序概述_第2頁
多變量分析程序概述_第3頁
多變量分析程序概述_第4頁
多變量分析程序概述_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第33章SAS系統(tǒng)內(nèi)四種多變量分析程序概 第34章主成份分析統(tǒng)計程序 P程序概 如何撰寫 P程 第35章因子分析統(tǒng)計程序PROC 因子分析法中的因子一詞指什 PROCFACTOR程序概 如何撰寫PROCFACTOR程 第36章典型相關(guān)分析統(tǒng)計程序PROC PROCCANCORR程序概 如何撰寫PROCCANCORR程 第37章多次元尺度法統(tǒng)計程序PROC PROCMDS程序概 如何撰寫PROCMDS程 注意事 33章SAS本章將簡要地介紹四種多變量分析的統(tǒng)計程序即主成份分析( P)傳統(tǒng)式因子分析(FACTOR)典型相關(guān)分析(CANCORR)和多次元尺度分析(MDS)這四種統(tǒng)計程序的功能在于找尋多個變量之間的關(guān)系或簡化數(shù)據(jù)的復(fù)雜性這些變量并不一定得視為自變量或因變量其中主成份分析傳統(tǒng)式因子分析以及多次元尺度分析都是對一組變量作分析而典型相關(guān)則是對兩組變量作分析SAS還有其它的統(tǒng)計程序可以執(zhí)行多變量的統(tǒng)計分析如CATMOD變異數(shù)分析回歸分析集群分析及鑒別分析等P程序主成份分析 間互相依賴的程度將這些線性相關(guān)以主成份值表示其分析的結(jié)果包括 準(zhǔn)化后的主成份值這些主成份值可以代替變量的原始數(shù)據(jù)進(jìn)行進(jìn)一步的分析處理如制圖 執(zhí)行回歸分析或集群分析 值得讀者注意的是 主成份分析(Principal ysis)與主軸因子分析(PrincipalAxisCommonFactor ysis)不是同義FACTOR程序(傳統(tǒng)式因子分析)對同一組觀察體內(nèi)的多個變量執(zhí)行上述的主成份分析及傳統(tǒng)式因子分析因子分析法還附帶有因子的坐標(biāo)轉(zhuǎn)換以取得最大的詮釋效果其分析結(jié)果可以是標(biāo)準(zhǔn)化的主成份值也可以是傳統(tǒng)因子分析的值傳統(tǒng)式因子分析的目的在尋求一小群隱藏的變量以解釋原變量之間的相關(guān)和主成份分析不同的是這一小群隱藏的變量不直接由原變量間的線性組合導(dǎo)出因素分析"因此對本書讀者而言這CANCORR程序(典型相關(guān)分析)對兩組變量執(zhí)行典型相關(guān)分析其分析的結(jié)果是典型變量值典型相關(guān)分析的目的是藉一小群有最高組間相關(guān)的組內(nèi)變量之線性組合(又稱向量)來解釋并概述兩組變量之間的關(guān)系構(gòu)成向量的變量多少并沒有限制若某個向量中只含一個變量則典型相關(guān)的作 第七部分多變量的分析MDS程序(多次元尺度分析)MDS是MultidimensionalScaling的簡稱它代表一系列的分析法其目的在于從或變量或刺激詞)的坐標(biāo)如此讀者可藉圖形的視覺效果如上所述FACTOR程序除了涵蓋 P程序并且包括了另外幾種常用的因子分析法當(dāng)讀者使用FACTOR程序時若不指明用那一種分析法則主成份分析便是FACTOR程序的內(nèi)設(shè)值FACTOR程序產(chǎn)生的主成份值是經(jīng)過標(biāo)準(zhǔn)化的然而P程序所產(chǎn)生的主成份值是 標(biāo)準(zhǔn)化的不過讀者也可額外地要求P與FACTOR程序相 P程序的優(yōu)點(diǎn)如最適用于變量多但主成份少的大型資料文件可節(jié)省電腦處理時間 P程序相比FACTOR程序的優(yōu)點(diǎn)如下 P程序廣泛包括誤差值的檢定因子坐標(biāo)轉(zhuǎn)換的角度及特性根由大到小的排列等 P程序只有一種分析法 即主成份分析法然而FACTOR程序內(nèi)有九種分析法供你選擇第34章主成份分析統(tǒng)計程序 P P程序?qū)斎胭Y料文件執(zhí)行主成份分析其輸入資料文件可以是原始數(shù)據(jù)也可以是一個相關(guān)系數(shù)矩陣或是一個變異數(shù)共變異數(shù)矩陣輸出資料則包括特性根特性向量及()標(biāo)準(zhǔn)化的主成份值主成份分析是一個多變量的統(tǒng)計程序可用來檢定多個數(shù)值變量之間的關(guān)系主成要目的是求出一組變量的線性組合即主成份)這些線性組合就是原變量矩陣的特性向(Pearson)1901(Holing1933)(Rao1964)(CooleyandLohnes1971)和干那氏(Gnanadesikan1977)的著作如何撰寫 P程PPARTIAL變量名稱串PPARTIAL變量名稱串 一般而言只須用到前兩個指令亦即 P以及指令#1 P選項(xiàng)指明到底對那一個SAS資料文件執(zhí)行PROC P的分析這個輸入資料文件可以是原始數(shù)據(jù)也可以是一個相關(guān)系數(shù)矩陣(TYPE=CORR或UCORR)或是一個變異數(shù)共變異數(shù)矩陣(TYPE=COV或UCOV)或TYPE=FACTORSSCPESP等不同形式的資料文件若省略此選項(xiàng)則SAS會自動找出在此程序之前最后形成的資料文件對它執(zhí)行主成份分析這一個輸出資料文件包含下列的統(tǒng)計值算術(shù)平均數(shù)標(biāo)準(zhǔn)差觀察體的總數(shù)關(guān)系數(shù)(它們的代號與定義如下定義 特性根N=界定成份個數(shù)少于實(shí)際導(dǎo)出的個數(shù)界定的個數(shù)為準(zhǔn) 特性向量這些向量值一般是用來計算主成份值或被輸送到FACTOR程序作因子坐標(biāo)的轉(zhuǎn)換) 值的總和 若讀者在程序中包括了PARTIAL指令而且定 則SUMWGT的值是加權(quán)值的總和減去PARTIAL變量串的自由度當(dāng)SUMWGT與N值相同時SUMWGT的變量不會被納入OUTSTAT=輸出資料文件內(nèi)要求相關(guān)矩陣或變異數(shù)共變異數(shù)矩陣不針對平均數(shù)作校正 要求以變異數(shù)共變異數(shù)矩陣為分析的數(shù)據(jù) 若省略此選項(xiàng)則此統(tǒng)計分析將以要求OUT=輸出資料文件中含標(biāo)準(zhǔn)化的主成份值 若省略此選項(xiàng)則輸出資料文 標(biāo)準(zhǔn)化的主成份值(這些值的變異數(shù)等于特性根的值)為主成份命名內(nèi)設(shè)值是PRIN1 ...PRINn n為正整數(shù)主成份的名字(包括字母及數(shù)字)不得超過八個字母或數(shù)字VARDEF=DFNWGT DF代表自由度是此選項(xiàng)的內(nèi)設(shè)N是樣本總數(shù)WGT是后的樣本總數(shù)WDF則是(WGT-#2VAR 若省略此指令則本程序內(nèi)其它指令里未曾提#3PARTIAL 若讀者在程序中同時界定OUT=或OUTSTAT=輸出資料文件名則此輸出資料文件也會含凈化后的殘差變量(Residual 這些殘差變量名原則是R_加上VAR指令所界定之變量名稱的前六個字母所以如果VAR指令含X Z三個變量則其所對應(yīng)的殘差變量就是R_X R_Z了#4FREQ 所以計算自由度時將以#5WEIGHT 派不同的值以區(qū)分各觀察體的重要性這些值可被存入一個WEIGHT變量內(nèi)#6BY此指令指示SAS將輸入資料文件分成幾個小的資料文件然后對每一個小的資料文BY指令里所列舉的變量值作從小到大的排列這個步驟可藉PROCSORT達(dá)成 例一一月和七月的氣溫分析本例的輸入資料文件(TEMPERAT)是個城市一月與七月的平均日溫分PROCPLOT畫出原始數(shù)據(jù)的分配圖然后用P程序執(zhí)行主成份PRIN1PRIN2)COV選項(xiàng)使得一月在第一主成份上的負(fù)荷量較重最后用PROCPLOT畫出兩個主成份上各城市的負(fù)荷量PLOT程序所求得的兩個圖表來歸納出第一與第二主成份是原坐標(biāo)軸旋轉(zhuǎn)30度的結(jié)果程DATATEMPERAT;TITLE'MeanTemperatureinJanuaryandJulyforSelectedCities';INPUTCITY$:16.JANUARY:4.1JULY:5.1@@;51.281.620.651.291.232.739.581.435.245.175.221.529.973.023.724.872.732.232.075.842.135.678.740.554.681.08.267.282.331.142.478.026.929.074.528.422.971.936.823.875.138.127.975.032.319.475.128.131.380.728.433.376.945.452.981.914.221.568.040.533.476.638.329.273.344.825.573.343.614.263.852.18.565.628.012.271.916.847.181.740.527.878.8Ri37.531.378.625.420.569.334.522.677.219.431.969.326.6結(jié)結(jié)34.1;PROCPLOTJULY*JANUARY=CITY/VPOS=31;RUN; PCOVOUT=PRIN;VARJULYJANUARY;RUN;PROCPLOT;TITLE2'PlotofPrincipalComponents';95||

MeanTemperatureinJanuaryandJulyforSeletedCitiesPlotofJULY*JANUARY.Symbolisvalueof 90|||85 O C 80 N K R 75 IBCA D ACHP 70 BMC |65 |60| NOTE:3obs642

EigenvaluesoftheCovariance 0 PlotofPrincipalPlotofPRIN2*PRIN1.Symbolisvalueof10||P||SOKWOD|BMDSL||0

ACHD

N CR A M G CP |||-10 NOTE:4obs例二率的分本例的輸入資料文件(CRIME)是一個五十個觀察體乘以七個變量的原始數(shù)據(jù)矩陣它包含了五十個州在七種項(xiàng)目上的發(fā)生頻率 這七種罪名分別是 謀殺 強(qiáng) 搶劫 騷擾 夜間偷 竊盜(LARCENY)及偷車(AUTO) 成份分析法簡化到只用兩個或三個特性向量就可以地表示程TITLE'CrimeRatesper100,000PopulationbyINPUTSTATE$1-14MURDER18-21RAPE23-26ROBBERY28-32ASSAULT34-BURGLARY40-45LARCENY47-52AUTO53-59;14.225.296.8278.31135.510.851.696.8284.01331.79.534.2138.2312.32346.18.827.683.2203.4972.611.549.4287.0358.02139.46.342.0170.7292.91935.2NewNewNewNewNorthNorthRhodeSouthSouth1.415.930.8101.21348.29.023.392.1165.7986.24.339.6106.2224.81605.6West6.042.2597.42.852.2846.9;5.439.7811.6PROCPPROCIDVARPRIN1VARPRIN1PRIN2MURDERRAPEROBBERYASSAULTBURGLARYLARCENYTITLE2'StatesListedinOrderofOverallCrimeTITLE3'AsDeterminedbytheFirstPrincipalPROCSORT; PROC IDVARPRIN1PRIN2MURDERRAPEROBBERYASSAULTBURGLARYLARCENYAUTO;TITLE2'StatesListedinOrderofPropertyVs.ViolentCrime';TITLE3'AsDeterminedbytheSecondPrincipalPROC TITLE2'PlotoftheFirstTwoPrincipalComponents';PROC TITLE2'PlotoftheFirstandThirdPrincipal76%的變異數(shù)若再加上第三個主軸則百分比升到87%見報表34.2a)第一個主成份代表一般率的高低它的特性向量在這七個變量上差不多第二個主成份似乎在類型中分出財物偷竊和的不同第三主成份的解釋則不甚清楚為了詮釋這些主成份的意義可將原始數(shù)據(jù)依各主成份的值重新排列然后印出整理過后的數(shù)據(jù)見報表34.2b) 然后試著去了解各區(qū)(如中西部東南部)在坐標(biāo)圖上的分布(見報表34.2c) 州如 第一圖上有四個"A"開頭的州名即 AlabamaArkansasAlaska和Arizona在這四州中Alabama的位置最靠近橫軸其坐標(biāo)值是(-.0499 閱坐標(biāo)值與圖形以便識別各州在率上的分507

CrimeRatesper100,000PopulationbyStatePrincipalComponent Simple 1291.9040002671.288000432.455711725.908707CorrelationEigenvaluesoftheCorrelationCrimeRatesper100,000PopulationbyStateStatesListedinOrderofOverallCrimeRateAsDeterminedbytheFirstPrincipalComponentB RRRRBALCA IIDAEUAEU NNEPRLRNT 12REYTYY -3.17203- -3.14772- -1.72691- -1.72007- -1.50736- -1.43245- -1.05441- -0.91621- NorthCarolina-0.69925- -0.63407- -0.32136- -0.13660- -0.04988- 0.49041- 0.55637- 2311.3 1.12020- 1.21417- 1.39696- CrimeRatesper100,000PopulationbyStateStatesListedinOrderofPropertyVs.ViolentCrimeAsDeterminedbytheSecondPrincipalComponentRABULMOSRASPPUBSGRTRRRRBALCAAIIDAEUAEUTNNEPRLRNTE12REYTYYO CrimeRatesper100,000PopulationbyStatePlotoftheFirstTwoPrincipalComponentsPlotofPRIN2*PRIN1.SymbolisvalueofSTATE.3| | 2 | 1 V PRIN2| NM 0+ OI | -1 |-2 | |-3 NOTE:2obsCrimeRatesper100,000PopulationbyStatePlotoftheFirstandThirdPrincipalComponentsPlotofPRIN3*PRIN1.Symbolisvalueof3 |2||1|||| TANM 0 A N VMI -1 | -2 35PROC因子分析法中的因子許多人對因子分析法中所指的因子一詞不甚了解本節(jié)特就此說明之因子分析法中提到兩種因子又稱共因子)和獨(dú)特因子這兩種因子都是指一個(或一組)假設(shè)的抽象的變量所謂共同因子指一個假設(shè)的抽象的變量它可用來解釋兩個或兩個以上的原始變量然而獨(dú)特因子則指一個假設(shè)的抽象的變量它只能用來解釋一個原始的變量與其如上所述因子指假設(shè)的抽象的變量它的功能在于詮釋原始變量之間的關(guān)系或結(jié)構(gòu)然而主成份是指原始變量間的線性組合它的功能在于簡化原有的變量群共因子分析法的模型允許每一變量有一獨(dú)特因子Yij=Xi1b1j+Xi2b2j+...+Xiqbqj+其中Yij=ijXik=ikbkj=被第k個共因子用來預(yù)測第j個變量的回歸系 又稱因子負(fù)荷Eij=ijq共同因子的總數(shù)PROCFACTORPROCFACTOR可以對輸入資料文件執(zhí)行許多種不同的共因子分析及主成份分析也可將分析的結(jié)果經(jīng)過坐標(biāo)的轉(zhuǎn)換以利于詮釋PROCFACTOR的輸入資料文件可以是多變量數(shù)據(jù)一個相關(guān)系數(shù)矩陣一個變異數(shù)(FactorPattern)(FactorScoreCoefficient)的矩陣FACTOR程序也接受其它程序的輸出資料文件所以輸入資料文件變化很多詳35.6FACTOR程序提供九種因子提煉的方法供讀者選用 這九種方法將在介紹選項(xiàng)METHOD=中詳加解釋另外FACTOR程序也提供了六種方法來預(yù)估變量間的共通性見選項(xiàng)PRIORS=的說明一般而言因子坐標(biāo)的轉(zhuǎn)換可分正交及斜交兩大類 FACTOR程序提供了八種坐標(biāo)轉(zhuǎn)換的方法供讀者選擇見選項(xiàng)ROTATE=的說明FACTOR程序所產(chǎn)生的輸出資料文件不止一個 它們分別在選項(xiàng)OUTSTAT=中逐Spearman)1904年首創(chuàng)Gould1981)及KimandMueller1978)的書籍以便對分析法的目的及模型有初步的認(rèn)識較深入的討論可參看慕雷克(Mulaik1972)Harman1976)的著作PROCFACTORPROCFACTOR含七道指令PROCFACTORVAR#1PROCFACTORPROCFACTOR的選項(xiàng)可分下列五大類討論 第二類與因子提煉有關(guān)第三類與因子坐標(biāo)的轉(zhuǎn)換有關(guān)第四類選項(xiàng)控制報表的印出第 若省略此選項(xiàng)則SAS會自動找出在此程序之前最后形成的SAS資料文件對它執(zhí)行因子分析這一個資料文件內(nèi)含有Procrustes坐標(biāo)轉(zhuǎn)換后理想的 必須與PROCRUSTES這一個輸出資料文件包括原輸入資料文件的觀察值以及因子分?jǐn)?shù)(FactorScore)這些值以FACTOR1 FACTOR2等表示讀者必須同時用NFACTOR=選項(xiàng)界定OUT=OUTSTAT文代號(TYPE 定 _NAME_ ImageCoefficientMatrix)矩陣內(nèi)各橫列的變量名字以_NAME_表示 ImageCovarianceMatrix)矩陣內(nèi)各橫列的變量名字以_NAME_表示 變量的 (ReferenceStructure FactorStructure SCORE程序以便產(chǎn)生共因子分?jǐn)?shù)見第12章的例一) METHOD=一般而言此選項(xiàng)的內(nèi)設(shè)值是MEHTOD=PRINCIPAL但當(dāng)輸入資料文件是TYPE=FACTORMETHOD=PATTERN下列九種因子提煉的 PRIORS=而定(或PRIN或P) 項(xiàng)不與PRIORS=并用 或與PRIORS=ONE并用時 法是主軸因子分析法(PrincipalAxisCommonFactor 界定循環(huán)式主軸因子分析(I tivePrincipalAxisM=ULS(或U) 界定未的最小誤差平方之因子分析(UnweightedLeastSquaresMethod)M=ALPHA(或 界定阿爾法因子分析(Alpha M=ML(或M) 界定最大可能率因子分析此法要求一個滿秩的相關(guān)系數(shù)M=HARRIS(或H)界定哈里斯氏(Harris)于1962年S-1RS-1主軸分析此處S是變量的變異數(shù)共變異數(shù)矩陣R是變量間的相關(guān)系數(shù)矩陣此法要求一個滿秩的相關(guān)系數(shù)M=IMAGE(或I) 針對映象共變異數(shù)矩陣作主成份分析(PrincipalComponentysisofImageCovarianceMatrix)此法要求一個滿秩的相關(guān)系數(shù)矩陣請讀者注意比法與凱斯(Kaiser196319701974)所提的映象分析(Imageysis) 從輸入資料文件(其 或 間的相關(guān)系數(shù)也必須同時輸入(TYPE='FCORR'的數(shù)據(jù)) 從輸入資料文件(其 或 括變量間的相關(guān)系數(shù)或其變異數(shù)共變異數(shù)矩陣PRIORS=ONE(或 設(shè)定所有共通性的預(yù)估值為PRIORS=MAX(或 取每一變量與其它變量的最大相關(guān)系數(shù)絕對值為PRIORS=SMC(或 取每一變量與其它變量的復(fù)相關(guān)平方值為該變量 將上述的復(fù)相關(guān)(SMC)調(diào)整使其總和等于最大 正比(Cureton 如果輸入資料文件的 則讀者可用此選項(xiàng)SAS會進(jìn)入資料文件內(nèi)尋找='PRIORS'或_TYPE_='COMMUNAL'的變 此PRIORS=RANDOM(R)01因子提煉的方 共通性預(yù)測值的內(nèi)設(shè) (不適用 (不適用 (不適用 (不適用起始隨機(jī)隨機(jī)數(shù)表的起始值與選項(xiàng)2)PRIORS=RANDOM界定METHOD=PRINITULSALPHA或ML等因子分析法中循環(huán)分析的次數(shù)內(nèi)設(shè)值是30CONVERGECONV)=界定METHOD=PRINITULSALPHA或ML等因子分析法中循環(huán)分析的收斂值它的定義是兩次循環(huán)所求得變量之共通性的差距當(dāng)這個差距小于此選項(xiàng)001要求FACTOR程序?qū)ψ儺悢?shù)共變異數(shù)矩陣(而非相關(guān)系數(shù)矩陣)執(zhí)行因子分析此選項(xiàng)必須與METHOD=PRINCIPALPRINITULS或IMAGE適用要求FACTOR程序?qū)σ粋€經(jīng)過調(diào)整的相關(guān)系數(shù)矩陣或變異數(shù)共變異數(shù)矩陣執(zhí)行因子分析選用此項(xiàng)時必須同時滿足下列的條件 ULS輸入資料文件的 UCOV或各變量的值由_TYPE_='WEIGHT'提 三個選項(xiàng)則SAS會自動挑選最小的值 或N)=正整 或P)=百分比(正實(shí)數(shù)不帶%符號1(即百分之百M(fèi)ETHOD=PATTERNSCORE要求SAS保留特性根大于此選項(xiàng)所設(shè)定的那些因子此選項(xiàng)不可與METHOD=PATTERNSCORE合用一般而言其內(nèi)設(shè)值是0若讀者對未過的相關(guān)系數(shù)矩陣進(jìn)行因子分析則其內(nèi)設(shè)值等于1但如果讀者同時省略NFACTORS=PROPORTION=及MINEIGEN=三選項(xiàng)時SAS會依下面的原則MINEIGEN當(dāng) 則MINEIGEN的值A(chǔ)LPHA或 TotalImage其它的方法而 經(jīng)過調(diào)整的總變異 一般而言當(dāng)共通性的預(yù)估值超過1 ALPHAML立刻停止分析的過程并設(shè)因子的總個數(shù)為 HEYWOOD將大于1的變量共通性重新調(diào)整為 如此分析可以繼續(xù)進(jìn)改變規(guī)定允許變量的共通性大于1 此選項(xiàng)極可能導(dǎo)致不合理的分析結(jié)果因 R=VARIMAX(或V) R=QUARTIMAX(或Q) R=EQUAMAX(或E) 界定標(biāo)準(zhǔn)正交轉(zhuǎn)換 其加權(quán)值來自選 界定哈雷斯-凱斯(Harris-Kaiser)坐標(biāo)轉(zhuǎn)換法 選項(xiàng)HKPOWER=合用它界定特性根開方的次數(shù)R=PROMAX(或 界定最優(yōu)斜交轉(zhuǎn)換 可與選項(xiàng)PREROTATE=POWER=合用 則PRER-OTATE=VARIMAX而且POWER=3 界定斜交轉(zhuǎn)換法TARGET=R=NONE(或 不執(zhí)行任何坐標(biāo)轉(zhuǎn)換是R=的內(nèi)設(shè) 決定標(biāo)準(zhǔn)正交轉(zhuǎn)換的程 此選項(xiàng)只能和ROTATE=ORTHOMAX界定特性根開方的次 開方過的特性根是用來調(diào)整特性向量的元 也可以和 MAX或ORTHOMAX合用此選項(xiàng)的值常介于0與1之間內(nèi)設(shè)值為1時界定ROTATE=PROMAX方法中所需的次方數(shù)以達(dá)到理想的矩陣形態(tài)內(nèi)設(shè)值是3只適合與ROTATE=PROMAX選項(xiàng)適用它用來界定初步坐標(biāo)轉(zhuǎn)換的方法內(nèi)設(shè)值是VARIMAX此選項(xiàng)不可是PROMAX或PROCRUSTES當(dāng)METHOD=PATTERN時PREROTATE必須是NONENORM=KAISERWEIGHTCOVRAW為因子系數(shù)矩陣的列(Row)界定一個標(biāo)準(zhǔn)化的方法內(nèi)設(shè)值是KAISER若NORM=KAISER則采凱斯氏標(biāo)準(zhǔn)化之法若NORM=WEIGHT各列以Cureton-MulaikNORM=COV而非相關(guān)系數(shù))若NORM=NONERAW則不進(jìn)行任何標(biāo)準(zhǔn)化 SIMPLECORR控制其它變量后)的凈相關(guān)矩陣此矩陣又稱為負(fù)反映象(NegativeAnti-ImageCorrelationsMatrix)Kaiser的抽樣合宜度(MeasureofSamplingAdequacy)(Kaiser1970CernyandKaiser1977)將特性根由大到小排列后以圖形顯示SCREEEIGENVECTORS印出輸入資料文件中有關(guān)因子負(fù)荷 因子分?jǐn)?shù)系數(shù)的數(shù) 此選項(xiàng)只適合METHOD=PATTERNSCORERESIDUALS NPLOT=印出前幾(4)個最重要的因子負(fù)荷量矩陣 最小值是2 這些系數(shù)可再輸入PROCSCORE以便計算各觀察體因子PLOTNPLOTREORDER重新排列因子系數(shù)矩陣的列使那些在第一因子上負(fù)荷量的絕對值高的變量排在前面幾列以協(xié)助解釋因子的含意100后ROUND所訂的值將以星號標(biāo)明之FUZZ=所定的值均會以句號(表遺漏數(shù)據(jù))取代之以簡化矩陣 與METHOD=PATTERN或SCORE聯(lián)用相關(guān)系數(shù)矩陣被納入輸出資料文件內(nèi)界定一個矩陣不滿秩的標(biāo)準(zhǔn)10-8界定變異數(shù)與共變異數(shù)計算時所用的分母 N值減i未使用PARTIAL指令)或N-p-i使PARTIAL指令)i0NOINT選項(xiàng))或1如果未界定NOINT選項(xiàng))p等于PARTIAL指令中界定的變量個數(shù)WEIGHT(或 WGT-iPARTIAL指令)WGT-p-i使用PARTIAL指令)ip的定義同DFVARDEF#2PRIORS01之間VAR應(yīng)PROCPROCVARXYZ;PRIORS.7.8.9;XYZ#3VAR 若省略此指令則本程序內(nèi)其它指令中未曾提#4PARTIAL 系數(shù)矩陣而非相關(guān)系數(shù)矩陣#5FREQ#6WEIGHT 來指派不同的值以區(qū)分各觀察體的重要性WEIGHT變量的值就代表這些值#7BYSAS依據(jù)此指令所列舉的變量將資料文件分成幾個小的資料文件(如男/女組等)然后對每一個小的資料文件單獨(dú)進(jìn)行因子分析當(dāng)讀者選用此指令時資料文件內(nèi)BYPROCSORTPROCPROCCORRDATA=RAW*TYPE=CORR的資料文件PROCFACTORDATA=CORRELMETHOD=ML*最大可能率因子分析法PROCFACTOR *主成份分析PROCPROCFACTORDATA=RAWOUTSTAT=FACT*主成份分析PROCFACTORROTATE=VARIMAX; *VARIMAX坐標(biāo)轉(zhuǎn)換法;PROCFACTORROTATE=QUARTIMAX; X Y Z.4;DATACORRELINPUT_NAME_$XYZ;PROC注相關(guān)系數(shù)矩陣經(jīng)ML法分析后其樣本數(shù)都會設(shè)定為100,000讀者必須參考HarmanDATACORRELINPUT_NAME_$XYZ;PROCDATADATAPATINPUT_NAME_$XYZ;FACTOR1.5.7FACTOR2.8.2;PROCFACTORROTATE=PROMAXDATADATAPATINPUT_TYPE_$_NAME_$XYZ;PATTERNPATTERN; .7 .2 .2.21.0PROCFACTORROTATE=PROMAX 下面三個因子分析的示范都是用同一套輸入資料文件(SOCECON)這一組資料代表洛杉磯市十二個社區(qū)的社會經(jīng)濟(jì)情況(以五個變量表示)這五個社經(jīng)變量是人POP)(SCHOOL)EMPLOY)(SERVICES)及房價(HOUSE)例一主成份分析(PrincipalComponentPRIORS=METHOD=的內(nèi)設(shè)值是主成份分析)分析的結(jié)果并沒有經(jīng)過坐標(biāo)轉(zhuǎn)換結(jié)果顯示兩個主成份因子似乎足以解釋93.4%的總變異數(shù)程DATATITLE'FiveSocioeconomic INPUTSCHOOLEMPLOYSERVICES12.827010.9108.8101401406039080100;PROCFACTORPROCFACTORDATA=SOCECONSIMPLETITLE3'Principal 12.873314 當(dāng)我們檢視因子形態(tài)時發(fā)現(xiàn)五個變量在第一主成份上的負(fù)荷量均是大于0.50的正值在第二主成份的負(fù)荷量則有正有負(fù)由于這個因子形態(tài)坐標(biāo)軸的轉(zhuǎn)換我們只能說第一主成份是一個一般性的社經(jīng)成份然而第二主成份則與社區(qū)經(jīng)濟(jì)較有關(guān)這是因?yàn)镻OPEMPLOY在第二主成份上的負(fù)荷量為正值而區(qū)民教育程度與房價的負(fù)荷量是負(fù)最后POP)的因子共通性最高35.35.1(PrincipalFiveSocioeconomicSeePage14ofHarman:ModernFctor ysis,3rdEDPrincipalComponent MeansandStandardDeviationsfrom12Std EMPLOY InitialFactorMethod:PrincipalPriorCommunalityEstimates:EigenvaluesoftheCorrelationMatrix:Total=5123452factorswillberetainedbyMINEIGENInitialFactorMethod:Principal VarianceexinedbyeachfactorFACTOR1FACTOR22.873314FinalCommunalityEstimates:Total= EMPLOYSERVICES 0.9878260.8851060.9793060.8802360.937500例二(PrincipalAxisCommonFactor程對同一套輸入資料文件執(zhí)行主軸因子分析因變量的共通性預(yù)估值是SMC故METHOD選項(xiàng)的內(nèi)設(shè)值是主軸因子分析因子的坐標(biāo)轉(zhuǎn)換采PROMAX法這個例子REORDER選項(xiàng))最后將分析結(jié)果放入一個叫FACT_ALL的輸出資料文件內(nèi)程PROCPROCFACTORDATA=SOCECONPRIORS=SMCMSASCREERESIDUALPREPLOTROTATE=PROMAXREORDERPLOTTITLE3'PrincipalFactor ysisPromaxRotation';PROCPRINT;TITLE3'FactorOutputData結(jié)與SCHOOL為主另一類因子以POP與EMPLOY為主這兩類因子可解釋成經(jīng)濟(jì)因(FACTOR1)(FACTOR2)VARIMAXPROMAX的坐標(biāo)轉(zhuǎn)換后顯明出來但變量SERVICES一直介于這兩個因子之間無法被納入某一個因子SERVICES在任一因子上的負(fù)荷量時可試著采用HK轉(zhuǎn)換法此法所需輸入資料文件可由例二的輸出資料文件提供唯一必須修飾的地方是刪除_TYPE_='PATTERN'與_TYPE_='FCORR'的觀察體并將_TYPE_='UNROTATE'IF_TYPE_='PATTERN'|_TYPE_='FCORR'THENDELETE;IF_TYPE_='UNROTATE'THEN_TYPE_='PATTERN';PROCFACTORROTATE=HKNORM=WEIGHTREORDERTITLE3'Harris-KaiserRotationwithCureton-MulaikWeights';35.2(PrincipalAxisCommonFiveSocioeconomicSeePage14ofHarman:ModernFctorysis,3rdPrincipalComponentysisPrincipalFactorysisPromaxRotationInitialFactorMethod:PrincipalPartialCorrelationsControllingallotherKaiser'sMeasureofSamplingAdequacy:Over-allMSA=0. EMPLOY 0.4720790.5515880.4885110.806644PriorCommunalityEstimates: EMPLOYSERVICES 0.9685920.8222850.9691810.785724EigenvaluesoftheReducedCorrelationMatrix:Total=4. Average=0.123452factorswillberetainedbythePROPORTIONScreePlotofE3 e2 a1 e0 FactorPattern Varianceexinedbyeachfactor 2.734301FinalCommunalityEstimates:Total=0.71370- 0.9781130.817564ResidualCorrelationsWithUniquenessontheRootMeanSquareOff-diagonalResiduals:Over-all=0. EMPLOY 0.0081530.0181300.0138280.021517PartialCorrelationsControllingRootMeanSquareOff-diagonalPartials:Over-all= EMPLOYSERVICES 0.1585080.1902590.2318180.154470PlotofFactorPatternforFACTOR1and1 E -1-.9-.8-.7-.6-.5-.4-.3-.2-.10.1.2.3.4.5.6.7.8.91.0- - - SCHOOL EMPLOY PrerotationMethod:Varimax1212RotatedFactorVarianceexinedbyeach 2.349857FinalCommunalityEstimates:Total=4.450370 EMPLOY 0.9781130.8175640.9719990.797743PlotofFactorPatternforFACTOR1andFACTOR21E C -1-.9-.8-.7-.6-.5-.4-.3-.2-.10.1.2.3.4.5.6.7.8.9-O-R-2SCHOOL- RotationMethod:TargetMatrixforProcrustean 121-2- NormalizedObliqueTransformationMatrix 1 2- Inter-factor ReferenceAxis 1.00000- - RotatedFactorPattern(StdReg ReferenceStructure(Semipartial - - - Varianceexinedbyeachfactoreliminatingotherfactors 2.248089FactorStructureVarianceexinedbyeachignoringotherfactors FinalCommunalityEstimates:Total=4.450370 EMPLOY 2.447349 0.9781130.8175640.9719990.797743PlotofReferenceStructureforFACTOR1andReferenceAxisCorrelation=-0.2019Angle=101.64711EB -1-.9-.8-.7-.6-.5-.4-.3-.2-.10.1.2.3.4.5.6.7.8.91.0- - -2SCHOOLEMPLOY FiveSocioeconomicSeePage14ofHarman:ModernFctorysis,3rdEDFactorOutputDataSet123N456789--...-... 例三最大可能率的因子分析(umLikelihoodFactor對SOCECONMETHOD=ML)分析過程包括單因子(N=1)N=2)N=3)的解法每一解法均以Chi-Square最后我們還是覺得雙因子的結(jié)論最合適三因子的解法太多余而單因子解法并程PROCPROCFACTORDATA=SOCECONMETHOD=MLHEYWOODTITLE3' un-LikelihoodFactor ysiswithOneFactor';PROCFACTORDATA=SOCECONMETHOD=MLHEYWOODN=2;TITLE3' un-LikelihoodFactor ysiswithTwoFactors';PROCFACTORDATA=SOCECONMETHOD=MLHEYWOODN=3;TITLE3 un-Likelihood ysiswithThree結(jié)所以經(jīng)過這三次因子分析檢定35.335.3umLikelihoodFiveSocioeconomicSeePage14ofHarman:ModernFctorysis,3rdun-LikelihoodFactorysiswithOneFactor(單因子的解法InitialFactorMethod:umPriorCommunalityEstimates: EMPLOYSERVICES 0.9685920.8222850.9691810.785724PreliminaryEigenvalues:Total= Average=123451factorswillberetainedbytheNFACTORIter 10.0000.938280.722271.000000.7194020.0000.945660.023801.000000.26493ConvergencecriterionSignificancetestsbasedon12TestofH0:Nocommonfactors. TestofH0:1Factorsaresufficient.vsHA:Atleastonecommon vsHA:MorefactorsareChi-square=54.252 df=10 Prob>chi**2=0.0000 Chi-square=24.466 df=5 Chi-squarewithoutBartlett'scorrection=34.Akaike'sInformationCriterion=24.Schwarz'sBayesianCriterion=21.TuckerandLewis'sReliabilityCoefficient=SquaredCanonicalEigenvaluesoftheWeightedReducedCorrelationTotal=0Average= 1.927160-0.228313-0.792956- 2.1554730.564643FactorVariance inedbyeach UnweightedFinalCommunalityEstimatesandVariableTotalCommunality:Weighted= Unweighted= EMPLOYSERVICES 0.9456560.0238031.0000000.2649350.014866 18.401165 1.360424un-LikelihoodFactorysiswithTwoFactors(雙因子的解法)PriorCommunalityEstimates:SMC EMPLOYSERVICES 0.9685920.8222850.9691810.785724PreliminaryEigenvalues:Total= Average=123452factorswillberetainedbytheNFACTOR11.000000.806720.950580.7934821.000000.808210.960230.8104831.000000.811490.959480.8167741.000000.809850.959630.8149851.000000.810190.959550.81569ConvergencecriterionSignificancetestsbasedon12TestofH0:Nocommonfactors. TestofH0:2Factorsaresufficient.vsHA:Atleastonecommon vsHA:MorefactorsareChi-square=54.252 df=10 Prob>chi**2=0.0000 Chi-square=2.198 df=1 Chi-squarewithoutBartlett'scorrection=3.Akaike'sInformationCriterion=1.Schwarz'sBayesianCriterion=0.TuckerandLewis'sReliabilityCoefficient=SquaredCanonicalCorrelations 1.0000000.951889EigenvaluesoftheWeightedReducedCorrelationMatrix:Total=19. Average=4.123123-0.039771-- - Factor Variance inedbyeach 24.4329712.138861FinalCommunalityEstimatesandVariableTotalCommunality:Weighted= Unweighted= EMPLOY 0.8101450.815603.5.2682945.425646un-LikelihoodFactorysiswithThreeFactors(三因子的解法)PriorCommunalityEstimates:SMC EMPLOYSERVICES 0.9685920.8222850.9691810.785724PreliminaryEigenvalues:Total= Average= 63.70100913.0547190.327639-0.347281- 50.64628912.7270800.674920 - - 3factorswillberetainedbytheNFACTORWARNING:Toomanyfactorsforauniquesolution.IterCriterion 0.031 0.960810.841841.000000.80175 0.031 0.980810.887131.000000.7955934.13501E-0.981950.886031.000000.8049842.53532E-0.982020.885851.000000.80561Converged,butnottoaproperoptimum.Tryadifferent'PRIORS'statement.Significancetestsbasedon12TestofH0:Nocommonfactors. TestofH0:3Factorsaresufficient.vsHA:Atleastonecommon vsHA:MorefactorsareChi-square= df= Prob>chi**2= Chi-square= df=- Prob>chi**2=Chi-squarewithoutBartlett'scorrection=2. Akaike'sInformationCriterion=4.Schwarz'sBayesianCriterion=TuckerandLewis'sReliabilityCoefficient=0SquaredCanonicalCorrelations 1.0000000.975189EigenvaluesoftheWeightedReducedCorrelationMatrix:Total=41. Average=10.12345.-..-.FactorVarianceexinedbyeachfactor 54.61152439.305483Unweighted2.2492602.276344FinalCommunalityEstimatesandVariableTotalCommunality:Weighted= Unweighted= EMPLOYSERVICES 0.9820170.8858521.0000000.805643 55.606690 5.14442636章PROC典型相關(guān)的功能在于分析兩組變量間的關(guān)系這兩組變量的數(shù)目可以不止一個或不等當(dāng)兩組都只含一個變量時典型相關(guān)就是皮爾森相關(guān)當(dāng)一組含一個變量另一組含多個變量時典型相關(guān)就是復(fù)相關(guān)當(dāng)兩組都含多個變量時就是典型相關(guān)所以皮爾森相PROCCANCORRCANCORR程序可用來執(zhí)行典型相關(guān)分析典型凈相關(guān)分析及典型冗余分析(CanonicalRedundancyysis)(過)標(biāo)準(zhǔn)化的典型相關(guān)系數(shù)所有典型變量與原始變量之間的相關(guān)系數(shù)以及典型變量值為了了解CANCORR程序如何找出兩組變量之間的關(guān)系讀者必須先熟悉三個名詞典型變量典型相關(guān)及典型系數(shù)典型變量乃各組變量所形成的線性組合典型相即典型變量)之間的相關(guān)又稱典型加權(quán)值)表示分析時CANCORR程序從各組內(nèi)找出具有最高典型相關(guān)的一對典型變量稱為第一然后CANCORR程序再找出具有次高典型相關(guān)的另一對典型變量稱為第二典型變量如此重復(fù)多次重復(fù)的次數(shù)等于含較少變量那一組的變量數(shù)目CANCORR程序假F檢定來檢驗(yàn)典型相關(guān)是否為0請讀者注意即第一對典型變量第二對典型變量...)之間必須是獨(dú)立無關(guān)的另外組內(nèi)每一個典型變量只可和另一組內(nèi)相對應(yīng)的典型變量有相關(guān)而必須CANCORRCooleyLohns1971)TimmPROCCANCORRPROCCANCORR含七道指令PROC PROC WITH#1PROCCANCORRPROCCANCORR的選項(xiàng)可分五大類來討論 第二類選項(xiàng)可用來控制報表的打印第三類選項(xiàng)界定報表上變量名與計算過程的有關(guān)事宜第四類選項(xiàng)與回歸分析有關(guān)第五類選項(xiàng)與回歸分析中產(chǎn)生的統(tǒng)計量有關(guān) 為輸入資料文件命名這個資料文件可以包含原始變量的數(shù)據(jù)也可以是一個相關(guān)系數(shù)矩陣(TYPE=CORR或UCORR)或是一個變異數(shù)共變異數(shù)矩陣(TYPE=COV或UCOV)甚或TYPE=SSCP或TYPE=FACTOR的資料文件若省略此選項(xiàng)則SASSAS資料文件 件是一個相關(guān)系數(shù)或是一個變異數(shù)共變異數(shù)矩陣時不可用此選項(xiàng) 號 值的總和是選用WEIGHT指令的結(jié) 95% 95% F F t t SIMPLECORRREDUNDANCYFNCAN= 則讀者可用此選項(xiàng)界定F檢定中分母的自由度內(nèi)設(shè)值是有效觀察體的總數(shù)減1 則讀者可用此選項(xiàng)界定F檢定中分子的自由度內(nèi)設(shè)值是原回歸分析中自變量的數(shù)目SINGULARSING)=10108次方若某一變量與其它變量的復(fù)相關(guān)平方大于或等于1-P則此變量將自動從典型相關(guān)分析中剔出此時這個變量的典型系數(shù)便等于0VPREFIXVP)=VAR指令所導(dǎo)出的典型變量命名若讀者指定VP=ABC則第一第二典型ABC1ABC2內(nèi)設(shè)值是V1V2等WPREFIXWP)=為WITH指令所導(dǎo)出的典型變量命名 若讀者指定WP=XYZ 則第一第二典型變量就是XYZ1 內(nèi)設(shè)值是W1 VNAMEVN)='VAR變量名稱VAR指令中所列的變量串命名字?jǐn)?shù)限在四十個字母之內(nèi)且用單引號括之WNAMEWN)='WITH變量名稱讀者可用此選項(xiàng)在報表上為WITH指令中所列的變量串命名同樣地字?jǐn)?shù)限在四十個字母之內(nèi)用單引號括起來第四類選項(xiàng)這一對選項(xiàng)要求將VAR的變量串當(dāng)作因變量 將WITH變量串當(dāng)作自變量進(jìn)行多變量的復(fù)回歸分析(MultivariateMultipleRegression)與上述(1)(2)的作法剛好相反這一對選項(xiàng)要求將WITH的變量串當(dāng)作因變量將VAR變量串當(dāng)作自變量進(jìn)行多變量的復(fù)回歸分析第五類選項(xiàng)此選項(xiàng))然而若你又界定了NOPRINT的選項(xiàng)則統(tǒng)計量不會在報表上印出來OUTSTAT=的輸出文件內(nèi)BSEBTPROBTBT針對每一個回歸系數(shù)t(在此tT)F要求打印凈相關(guān)系數(shù)的平方(10)要求打印半凈相關(guān)系數(shù)的平方(11)#2VAR 若省略此指令則在本程序內(nèi)其#3WITHCANCORR程序中使用這一道指令不可省略此指令列舉典型相關(guān)#4PARTIAL 其值將由第一第二組變量中凈化出來然后SAS再對凈化過后的兩組變量執(zhí)行典型凈相關(guān)分析#5FREQ#6WEIGHT這個變量的值是正實(shí)數(shù)代表觀察體的或#7BYSAS依據(jù)此指令所列舉的變量將資料文件分成幾個小的資料文 然后對每一個的資料文件分別執(zhí)行典型相關(guān)分 當(dāng)讀者選用此指令時資料文件內(nèi)的數(shù)據(jù)必須先BY變量串的值做由小到大的重新排列PROCSORT 例 FIT)包括兩組變量的數(shù)據(jù)第一組變量包括三個生理變量即WEIGHT)WAIST)PULSE)第二組變量包括三個運(yùn)動變量即CHINS)仰臥起坐次數(shù)(SITUPS)及跳高成績(JUMPS)這些數(shù)據(jù)由一家的二十位中年會員所提供DATAINPUTDATAINPUTWEIGHTWAISTPULSECHINSSITUPSJUMPS;PROCCANCORRDATA=FIT8164VPREFIX=PHYSVPREFIX=PHYSVNAME='PhysiologicalMeasurements'WPREFIX=EXERWNAME='Exercise';VARWEIGHTWAISTPULSE;WITHCHINSSITUPSTITLE'Middle-AgedMeninaHealthFitnessTITLE2'DataCourtesyofDr.A.C.Linnerud,NCState結(jié)(-.6456)各組內(nèi)變量的相關(guān)較高在生理變量組內(nèi)最高的相關(guān)系數(shù)是體重和(.8702)(.6957)也是最高系數(shù)).7956F檢定后其顯著度在0635上下故無法下任何有力的結(jié)論其余兩個次要的典型系數(shù)都沒有達(dá)到任何顯著度所以歸納起來只能勉強(qiáng)算有一個典型系數(shù)因?yàn)楦髯兞繙y量的單位不大相同(1.5793)+(-0.7754)+(-.0591)脈搏(0.7164)+(-1.0540)+(-.3495)0最后冗余分析的結(jié)果第一典型變量對另一組變量的解釋程度偏低只28.54%的生理變量以及25.84%Middle-AgedMeninaHealthFitnessClubDataCourtesyofDr.A.C.Linnerud,NCStateUnivMeansandStandard3PhysiologicalMeasurements Std320CorrelationsAmongtheOriginalCorrelationsAmongthePhysiological CorrelationsAmongthe -CorrelationsAmongtheOriginalCorrelationsBetweenthePhysiologicalMeasurementsandthe --CanonicalCorrelation Eigenvaluesof=CanRsq/(1- EigenvalueDifferenceProportionCorrelation1122-3.3.TestofH0:Thecanonicalcorrelationsinthecurrentrowandallthatfollowarezero Approx Num Den Pr>192431MultivariateStatisticsandF Num DenDFPr>Wilks'9Pillai's9Holing-Lawley9Roy'sGreatest3NOTE:FStatisticforRoy'sGreatestRootisanupperRawCanonicalCoefficientsforthePhysiological RawCanonicalCoefficientsfortheWEIGHT-CHINS-WAIST.SITUPS-PULSE-JUMPSStandardizedCanonicalCoefficients forthePhysiologicalMeasurements fortheExercise--CanonicalCorrelationsBetweenthePhysiological CorrelationsBetweentheExerciseMeasurementsandTheirCanonicalVariables andTheirCanonicalVariablesCanonicalCorrelationsBetweenthePhysiologicalMeasurements CorrelationsBetweentheExerciseandtheCanonicalandtheCanonicalVariablesoftheExercise VariablesofthePhysiologicalMeasurementsCanonicalRedundancyRawVarianceofthePhysiologicalExinedTheir TheCanonical Canonical 123RawVarianceoftheExerciseExinedbyTheir TheCanonical Canonical123StandardizedVarianceofthePhysiologicalExinedTheir TheCanonical Canonical123StandardizedVarianceoftheExinedTheir TheCanonical Canonical 123SquaredMultipleCorrelationsBetweenthePhysiologicalMeasurementsandtheFirst'M'CanonicalVariablesoftheExerciseM123SquaredMultipleCorrelationsBetweentheExerciseandtheFirst'M'CanonicalVariablesofthePhysiologicalMeasurementsM12337章PROCPROCMDSMDS是MultidimensionalScaling的簡稱中文的翻譯是多次元尺度法一般而言MDS代表一系列分析法其目的在于從一組距離矩陣中找出觀察體的坐標(biāo)簡而言之MDSA與BA的坐標(biāo)是(1,9)B的坐標(biāo)是(-4,0)因此兩點(diǎn)間的歐幾里得距離是

反過來說若我們只知道A與B間的距離是 如何能AB點(diǎn)的位置亦即它們的坐標(biāo)值呢?在執(zhí)行MDS的分析過程中讀者有許多的選擇比方說歐幾里得的距離計算只是其中的一種定義其它的定義可能導(dǎo)出的坐標(biāo)值就不盡相同了其次距離與數(shù)據(jù)間吻合的程度也可有多種不同的定義最后輸入的資料文件內(nèi)除了含觀察體兩兩之間的距離資料外也可含其它的變量早上中午下午等)如此就形成一個三元的MDS模型來解釋這一類型的數(shù)據(jù)MDS(Proximity兩個觀察點(diǎn)(如南非)或刺激詞(如紅色 橘色)間的距離長短這個距離可以是相似性的(Similarity)或相異性的(Dissimilarity) 或類似的程度比方說社會學(xué)家所研究的同儕指標(biāo)(Sociometric)就屬于相似性數(shù)據(jù)此外兩個種族間通婚的頻率或兩城市間彼此通 相異性數(shù)據(jù)是上述相似性數(shù)據(jù)的亦即數(shù)據(jù)值愈大 最典型的相異性數(shù)據(jù)就是兩點(diǎn)間的歐幾里得距離或兩城市間飛行的距離等若一位研究 其所使用的測驗(yàn)工具是1-5的相異度量表受試者以此量表判斷兩兩職業(yè)(如醫(yī)生與護(hù)士)間差異的程度 MDS程序利用非線性最小誤差法(NonlinearLeastSquares)根據(jù)輸入資料文件內(nèi)的距離資料來估計各坐標(biāo)值(Dimension這個名詞來自歐氏空間模型(WeightedEuclideanModel)與Carroll與Chang(1970)(INDSCAL)(GroupEuclideanSpace)相乘(IndividualEuclideanSpace)(0.5)INDSCAL模型中個人值(SubjectWeight)的平方根(Transformation距離作對應(yīng)的關(guān)系視讀者對選項(xiàng)LEVEL=的界定轉(zhuǎn)換函數(shù)可以是一個回歸的模型或計量的模型若函數(shù)的形式是回歸的模型則其 fit(輸入數(shù)據(jù)) 若函數(shù)以計量模型的形式呈現(xiàn)則如下 fitFIT=所界定的函數(shù)轉(zhuǎn) 等于由選項(xiàng)LEVEL=界定的對應(yīng)函數(shù)其形式可以是線性的仿射的誤差是左邊與右邊平衡時所需的差MDS程序假設(shè)誤差的分配是常態(tài)分配彼此之間是統(tǒng)計獨(dú)立的在這些假設(shè)的條件下最小誤差平方的估計法所導(dǎo)出的參數(shù)估計值是MDSKruskalWish CarrollDeSarboYoung1987)MDS實(shí)際應(yīng)用的例子Torgerson1958MDS的理論基礎(chǔ)與心理計量學(xué)的發(fā)展 Young 示范MDS如何在很短的時間內(nèi)把十大城市間的航空距離轉(zhuǎn)變成報表上的地圖格局這十個城市分別是亞特蘭大(Atlanta) 芝加哥(Chicago)丹佛(Denver) 休斯頓(Houston) 洛杉磯(LosAngeles) 邁阿密(Miami) 紐約(NewYork)舊金山(SanFrancisco) 西雅圖(Seattle) 及華府(WashingtonD.C) 的數(shù)據(jù)與第43章第6節(jié)的例一完全相同 讀者可參考該例附的地圖及十大城市的原由于輸入資料文件內(nèi)的航空距離與兩兩城市間的歐氏距離十分接近故程序中測量度設(shè)定為(LEVEL=ABSOLUTE)這些選項(xiàng)導(dǎo)致上一節(jié)中所提到的轉(zhuǎn)換函數(shù)不產(chǎn)分析的結(jié)果會產(chǎn)生每一個城市在二度空間內(nèi)的坐標(biāo)值這些坐標(biāo)值收集在一個輸出資料文件內(nèi)然后經(jīng)由PLOT程序繪出圖來OPTIONSOPTIONSLS=78PS=60TITLEDATAysisofagesbetween10AmericanINPUT(ATLANTACHICAGODENVERHOUSTONLOSANGELMIAMINEWYORKSEATTLEWASHDC)(5.)@56CITYNAME$000000Los748713142024510New3470San218217370ysisofagesbetweenysisofagesbetween10AmericanMultidimensionalScaling:Shape=TRIANGLECond=MATRIXLevel=ABSOLUTECoef=IDENTITYDim=2Formula=1Gconverge=0.01Maxiter=100Over=1C

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論