




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第8章 利用SPSS進(jìn)行Logistic回歸分析現(xiàn)實(shí)中的很多現(xiàn)象可以劃分為兩種可能,或者歸結(jié)為兩種狀態(tài),這兩種狀態(tài)分別用0和1表示。如果我們采用多個(gè)因素對(duì)0 1表示的某種現(xiàn)象進(jìn)行因果關(guān)系解釋,就可能應(yīng)用 到logistic回歸。Logistic回歸分為二值logistic回歸和多值logistic回歸兩類。首先用實(shí)例 講述二值logistic回歸,然后進(jìn)一步說(shuō)明多值logistic回歸。在閱讀這部分內(nèi)容之前,最好先看 看有關(guān)SPSS軟件操作技術(shù)的教科書。 8.1 二 logistic 回歸8.1.1數(shù)據(jù)準(zhǔn)備和選項(xiàng)設(shè)置我們研究2005年影響中國(guó)各地區(qū)城市化水平的經(jīng)濟(jì)地理因素。城市化水平用城鎮(zhèn)人口
2、 比重表征,影響因素包括人均GDP、第二產(chǎn)業(yè)產(chǎn)值比重、第三產(chǎn)業(yè)產(chǎn)值比重以及地理位置。 地理位置為名義變量,中國(guó)各地區(qū)被分別劃分到三大地帶:東部地帶、中部地帶和西部地帶。 我們用各地區(qū)的地帶分類代表地理位置。第一步:整理原始數(shù)據(jù)。這些數(shù)據(jù)不妨錄AExcel中。數(shù)據(jù)整理內(nèi)容包括兩個(gè)方面:一 是對(duì)各地區(qū)按照三大地帶的分類結(jié)果賦值,用0、1表示,二是將城鎮(zhèn)人口比重轉(zhuǎn)換邏輯值, 變量名稱為“城市化”。以各地區(qū)2005年城鎮(zhèn)人口比重的平均值45.41%為臨界值,凡是城 鎮(zhèn)人口比重大于等于45.41%的地區(qū),邏輯值用Yes表示,否則用No表示(圖8-1-1)ABCDEFGHIJ地區(qū)常數(shù)項(xiàng)東部中部西部二產(chǎn)比重
3、三產(chǎn)比重人均GDP城鎮(zhèn)人口比重城市化北京11000.2P0.2545443.6P83.62Yes天津11000.550.5135783.1975.11Yes河北11000.520.4614782.2637.69No山西10100.560.5112495.0042.11No內(nèi)彖古10100.460.3816330.8247.20Yes遼寧11000.490.4413983.2058.70Yes吉林10100.440.3813348.0052.52Yes黑龍江10100.540.4914434.0653.10Yes上海11000.490.4551474.0089.09Yes圖8-1-1原始數(shù)據(jù)(E
4、xcel中,局部)將數(shù)據(jù)拷貝或者導(dǎo)入SPSS的數(shù)據(jù)窗口(Data View)中(圖8-1-2)。地區(qū)常數(shù)項(xiàng) 東部 中部 西部 二產(chǎn)比重三產(chǎn)比重人均GDP城鎮(zhèn)人口比重城市代北京 天津 河北 山西 內(nèi)蒙 遼寧45443.6935783.1914732.2612495.0016330.8218983.20林龍海吉黑上o u O.44,3S1334S.00.54.4914434.06.49.451474.0033.ID YesS9.09 Yes州南藏西肅海夏疆貴云西陜甘青寧新.41.42.42.41.25.50.43.49.46.45.33.34.36.34.07.42.35.38.38.371098
5、2.009060.005Q51.967S35.009114.009899.007476.5310044.7410239.0013108.0045.2033.0026.S729.5026.6537.2330.0239.2542.2837.15NoNdNoNoNoNoNoNoNoNo圖8-1-2中國(guó)31個(gè)地區(qū)的數(shù)據(jù)(SPSS中,局部)第二步:打開(kāi)“聚類分析”對(duì)話框。沿著主菜單的“AnalyzeRegressionBinary LogisticK ”的路徑(圖8-1-3)打開(kāi)二值 Logistic回歸分析選項(xiàng)框(圖8-1-4)。圖8-1-3打開(kāi)二值Logistic回歸分析對(duì)話框的路徑對(duì)數(shù)據(jù)進(jìn)行多次擬
6、合試驗(yàn),結(jié)果表明,像二產(chǎn)比重、三產(chǎn)比重等對(duì)城市化水平影響不顯著。 至于反映地區(qū)位置的分類變量,不宜一次性的全部引入,至多引入兩個(gè),比方說(shuō)東部和 中部。通過(guò)嘗試,發(fā)現(xiàn)引入中部地帶為變量比較合適。因此,為了實(shí)例的典型性,我們采用 兩個(gè)變量作為自變量:一是數(shù)值變量人均GDP,二是分類變量中部地帶。圖8-1-4 Logistic回歸分析選項(xiàng)框第三步:選項(xiàng)設(shè)置。首先,在源變量框中選中需要進(jìn)行分析的變量,點(diǎn)擊右邊的箭頭符號(hào),將需要的變量調(diào)入Dependent (因變量)和Covariates (協(xié)變量)列表框中(圖8-1-5)。在本例中,將名義變 量“城市化”調(diào)ADependent (因變量)列表框,將“
7、人均GDP”和“中部”調(diào)ACovariates(協(xié)變量)列表框中。在Method (方法)一欄有七個(gè)選項(xiàng)。采用第一種方法,即系統(tǒng)默認(rèn)的強(qiáng)迫回歸方法(Enter )o圖8-1-5 Logistic回歸分析的初步設(shè)置接下來(lái)進(jìn)行如下4項(xiàng)設(shè)置:1.設(shè)置Categorical (分類)選項(xiàng):定義分類變量(圖8-1-6)。將中部調(diào)入Categorical Covariates (分類協(xié)變量)列表框,其余選項(xiàng)取默認(rèn)值即可。完 成后,點(diǎn)擊Continue繼續(xù)。圖8-1-6定義分類變量選項(xiàng)2.設(shè)置Save (保存)選項(xiàng):決定保存到Data View的計(jì)算結(jié)果(圖8-1-7)。選中 Leverage values
8、、DfBeta(s)、Standardized 和Deviance 四項(xiàng)。完成后,點(diǎn)擊Continue 繼續(xù)。圖8-1-7 Logistic回歸分析的存儲(chǔ)選項(xiàng)3.設(shè)置Options:有三個(gè)選項(xiàng)區(qū)(圖8-1-5)。第一個(gè)是Statistics and Plots (統(tǒng)計(jì)和畫圖)選項(xiàng),包括六種可以兼容的選擇(復(fù)選項(xiàng))。選中Classification plots、Hosmer-Lemeshow goodness-of-fit 和CI for exp(B)三個(gè)選項(xiàng)。第二個(gè)是Display (顯示)選項(xiàng),選擇At last step (最后一步),這樣,輸出結(jié)果將僅僅 給出最終結(jié)果,而省略每一步的計(jì)算
9、過(guò)程。由于我們采用強(qiáng)迫回歸,Probability for Stepwise (逐步回歸概率)選項(xiàng)可以不管。圖8-1-8 Logisti回歸分析的選項(xiàng)設(shè)置此外還有一個(gè)選項(xiàng)需要說(shuō)明。一是Classification cutoff (分類臨界值),默認(rèn)值為0.5, 即按四舍五入的原則將概率預(yù)測(cè)值化為0或者1。如果將數(shù)值改為0.6,則大于等于0.6的概 率值才表示為1,否則為0。其情況余依此類推。二是Maximum Iterations (最大迭代值), 規(guī)定系統(tǒng)運(yùn)算的迭代次數(shù),默認(rèn)值為20次,為安全起見(jiàn),我們將迭代次數(shù)增加到50。原因 是,有時(shí)迭代次數(shù)太少,計(jì)算結(jié)果不能真正收斂。三是Include
10、 constant in model(模型中包 括常數(shù)項(xiàng)),即模型中保留截距。除了迭代次數(shù)之外,其余兩個(gè)選項(xiàng)均采用系統(tǒng)默認(rèn)值。 完成后,點(diǎn)擊Continue繼續(xù)。8.1.2結(jié)果解讀全部選項(xiàng)設(shè)置完畢以后,點(diǎn)擊如圖8-1-5所示的OK按鈕確定,即可得到Logistic回歸 分析結(jié)果。輸出結(jié)果可以分為三大部分,下面逐一說(shuō)明。1. Case Processing Summary(樣品處理摘要)。在輸出結(jié)果中,首先給出樣品處理摘要 報(bào)告,包括如下信息:選擇了多少樣品,沒(méi)有選擇的有多少樣品;在選擇的樣品里,分析多 少樣品,缺失了多少樣品一一缺失樣品一般是因?yàn)閿?shù)據(jù)中存在缺失值;選擇的樣品總數(shù)以及 全體樣品總
11、數(shù)(圖8-1-9)o 用N表示各類樣品數(shù)目,Percent表示各類樣品的百分比。在正 常情況下,這些信息對(duì)我們的分析沒(méi)有什么用處。但是,如果樣本很大并且構(gòu)成很復(fù)雜,涉及到樣品的取舍或者數(shù)據(jù)缺失的時(shí)候,這些信息就很重要,會(huì)為后面的分析提供很大方便。Case Processing SummaryUr weqhted Cases3NPercentSele-clted CasesIncluded in Analysis31100.0Missing Cases0.0Total31100.0Urselected Ca&es0.0Total31wo.o3- If weight is in erfect, s
12、ee classification table far the totalnumber of ca&es.圖8-1-9樣品處理摘要2. Dependent Variable Encoding(因變量編碼)。這是很重要的信息,告訴我們對(duì)不同城 市化水平地區(qū)的分類編碼結(jié)果(圖8-1-10)。我們開(kāi)始根據(jù)全國(guó)各地區(qū)的平均結(jié)果45.41分 為兩類:大于等于45.41的地區(qū)用Yes表示,否則用No表示。現(xiàn)在,圖8-1-10顯示,Yes 用0表示,No用1表示。也就是說(shuō),在這次SPSS分析過(guò)程中,0代表城市化水平高于平 均值的狀態(tài),1代表城市化水平低于平均值的狀態(tài)。記住這個(gè)分類。Dependeni Var
13、iable EncodingOriginal ValueInternal ValueYes0No1圖8-1-10因變量編碼3. Categorical Variables Codings (分類變量編碼)。我們的自變量中涉及到代表不同地 域類型的名義變量(圖8-1-11)。在我們開(kāi)始的分類中,屬于中部用1表示,否則用0表示。 但是,SPSS改變了這種編碼,原來(lái)的0改用1表示,原來(lái)的1改用0表示。也就是說(shuō),在 這次SPSS分析過(guò)程中,0代表屬于中部的地區(qū),1代表不屬于中部的地區(qū)。記住這個(gè)分類 對(duì)后面開(kāi)展預(yù)測(cè)分析非常重要。Categorical Variables Codin-gsFrequenc
14、yPara mete中部 02219.000圖SI 11分類變最編碼4. Classification Table (初始分類表)。Logistic建模如同其他很多種建模方式一樣,首先 對(duì)模型參數(shù)賦予初始值,然后借助迭代計(jì)算尋找最佳值。以誤差最小為原則,或者以最大似 然為原則,促使迭代過(guò)程收斂。當(dāng)參數(shù)收斂到穩(wěn)定值之后,就給出了我們需要的比較理想的 參數(shù)值。下面是用初始值給出的預(yù)測(cè)和分類結(jié)果(圖8-1-12)。這個(gè)結(jié)果主要用于對(duì)比,比 較模型參數(shù)收斂前后的效果。Classification Tabll,bObservedPredicted城T亍化Percentage CorrectYe-sNoS
15、tep。城巾化丫女NoOverall Percentage0D1120.0100.064.5a C-onslant is included in the model, b. TTie cut value is .500圖8-1-12初始預(yù)測(cè)分類表5.Variable in the Equation (初始方程中的變量)。從這個(gè)表中可以看到系統(tǒng)對(duì)模型的最初 賦值方式(圖8-1-13)。最開(kāi)始僅僅對(duì)常數(shù)項(xiàng)賦值,結(jié)果為B=0.598 (復(fù)制到Excel可以看來(lái), 更精確的數(shù)值為0.597837),標(biāo)準(zhǔn)誤差為S.E.=0.375 (復(fù)制到Excel可以看來(lái),更精確的數(shù)值 為0.375379),于是Wa
16、ld值為才(B V (。斗 審血2.536 .S.E. )0.37J379 )后面的df為自由度,即df=1; Sig.為P值,Sig.=0.111。注意Sig.值越低越好,一般要求小 于0.05。當(dāng)然,對(duì)于Sig.值,我們關(guān)注的是最終模型的顯示結(jié)果Exp(E)是B還原之后數(shù)值, 顯然Exp(B) = &s =/翎陌 了 =lglg在Excel里,利用指數(shù)函數(shù)exp很容易對(duì)B值進(jìn)行還原。in the EquationBS.E.WalddfSig.Exp(B)Step 0 Constant.598.3752.5361.1111.818圖S-L-13初始方程中的變量6. Variable not
17、in the Equation (不在初始方程中的變量)。人均GDP和代表地理位置的 中部地帶的系數(shù)初始值設(shè)為0,這相當(dāng)于,在初始模型中不考慮這兩個(gè)變量(圖8-1-14)。 表中給出了Score檢驗(yàn)值及其對(duì)應(yīng)的自由度df和P值,即Sig.值。Score檢驗(yàn)是一種初始檢 驗(yàn),在建模之初根據(jù)變量之間的結(jié)構(gòu)關(guān)系判斷自變量與因變量之間的密切程度。Score檢驗(yàn) 值的計(jì)算公式為Score .?。? -如fi-:因變量為0、1值,根據(jù)圖8-1-10所示的編碼原則,令所有的Yes為0,所有的No為1,容 易算出y(1 - y) = 0.645161(1 - 0.645161) = 0.228928 .人均G
18、DP已知,中部的編碼法則已知,于是不難算出31V (GZJP - GDP)- =3595636978 103,f-131工(中部L 兩)=6點(diǎn)7097、11(光一可:=12747397078.835,j-111 中部5-肉F = 0 037461i-:將上面的結(jié)果代入Score檢驗(yàn)值計(jì)算公式,立即得到= 15.4S6,假口骼向=0,026 .可以看到,人均GDP的Score檢驗(yàn)值滿足一般的要求,而中部地帶這個(gè)變量的數(shù)值偏低。Variables not in the Equatiorl5 coredfSigStepVariabl &s人均 GDP0中部15.4&.02&11.00.873Resi
19、dual Chi-Squares are not computed because cf redundancies圖8-1-14不在初始方程中的變最7. Omnibus Tests of Model Coefficients(模型系數(shù)的混合檢驗(yàn))。主要是針對(duì)步驟、模塊和模型開(kāi)展模型系數(shù)的綜合性檢驗(yàn)(圖8-1-15)。表中給出卡方值及其相應(yīng)的自由度、P 值即Sig.值。取顯著性水平0.05,考慮到自由度數(shù)目df=2,在Excel中的任意單元格輸入公 式“ =CHIINV(0.05,2)”,回車,就可以查出卡方臨界值5.991。我們計(jì)算的卡方值31.187, 大于臨界值,并且相應(yīng)的Sig.值小于0
20、.05,因此在顯著性水平為0.05的情況下,這些檢驗(yàn) 都不成問(wèn)題。Omnibus Tests of Model CoefficientsChi-squaredfSiq.St&p 1 Step31.1872.ooBlack31 1872.00。Model31 1872.ODD圖模型系數(shù)的綜合檢驗(yàn)8. Model Summary (模型摘要)。模型摘要中給出最大似然平方的對(duì)數(shù)、Cox-Snell擬合 優(yōu)度以及Nagelkerke擬合優(yōu)度值(圖8-1-16a)。最大似然平方的對(duì)數(shù)值(-2loglikelihood=9.137)用于檢驗(yàn)?zāi)P偷恼w性擬合效果,該值在理論上服從卡方分布,上面給出的卡方臨界
21、值 5.991,因此,最大似然對(duì)數(shù)值檢驗(yàn)通過(guò)。Model SummaryStep-2 Log likelihoodG(nc & Snell R SquareNagelkerXe R Square19.137a.634.872a Estimation terminated at iteration number W because parameter estimates charged by less than .001.a以人均GDP和中部為自變量的回歸模型摘要Model SummaryStep-2 Log liKeStoodCox & Snell R SquareNagelkerke- R
22、Square140 324a.000ODDa Estinnatian terminated at iteration number 3 because parameter estimates thanged by less than .001.b以常數(shù)項(xiàng)(數(shù)值為1)為自變景的回歸模型捕亶圖8-L 1數(shù)據(jù)窗口的輸出結(jié)果為了便于理解,有必要解釋一下Cox-Snell擬合優(yōu)度以及Nagelkerke擬合優(yōu)度值與最大 似然平方對(duì)數(shù)值的關(guān)系。為此,我們需要開(kāi)展一次特殊的logistic回歸。在圖8-1-5所示的 選項(xiàng)中,從協(xié)變量(covariates)列表框中剔除人均GDP和中部?jī)蓚€(gè)選項(xiàng),選中并引入常數(shù)
23、 項(xiàng)一一對(duì)應(yīng)于常系數(shù)、所有數(shù)值均為1的變量(參加圖8-1-1)。以常數(shù)項(xiàng)為唯一的自變量, 其他選項(xiàng)不變,開(kāi)展logistic回歸,結(jié)果將會(huì)給出特別的模型摘要(圖8-1-16b),其 -2loglikelihood=40.324為未引入任何真正自變量的最大似然對(duì)數(shù)平方值。然后,我們采用下 式計(jì)算Cox-Snell擬合優(yōu)度R& =1-6 =l-e.容易算出r(5.15710.324)始=1 /=。一634 一更精確的數(shù)值為0.634332。至于Nagelkerke擬合優(yōu)度,相當(dāng)于校正后的Cox-Snell擬合優(yōu)度, 計(jì)算公式為=1:二微皿一沖1-e1-v k因此心=*40.32.4因此,校正后的模
24、型擬合優(yōu)度可以視為0.872。9. Hosmer and Lemeshow Test(Hosmer和Lemeshow 檢驗(yàn))。似然比函數(shù)的自然對(duì)數(shù)值 對(duì)樣品數(shù)目很敏感,作為補(bǔ)充和參照,我們需要Hosmer-Lemeshow檢驗(yàn)(圖8-1-17)。該 檢驗(yàn)依然以卡方分布為標(biāo)準(zhǔn),但檢驗(yàn)的方向與常規(guī)檢驗(yàn)不同:我們要求其卡方值低于臨界值 而不是高于臨界值。取顯著性水平0.05,考慮到自由度數(shù)目df=8,在Excel中的任意單元格 輸入函數(shù)=CHIINV(0.05,8)”,回車,理解得到卡方臨界值15.507。作為Hosmer-Lemeshow 檢驗(yàn)的卡方值4.73015.507,檢驗(yàn)通過(guò)。后面的Sig
25、.值0.786大于0.05,據(jù)此也可以判知 Hosmer-Lemeshow 檢驗(yàn)可以通過(guò)。Hosmer ond Lemeshow TestStepChi-square-dfSig14.7308.786圖 Hosmer-LemeshoTi10. Contingency Table for Hosmer and Lemeshow Test (對(duì)應(yīng)于Hosmer-Lemeshow 檢驗(yàn)的 列聯(lián)表)。因變量有兩類數(shù)值,即0和1。在正常情況下,我們要求觀測(cè)值(observed)與 期望值(expected)逐漸趨于接近(圖8-1-18)。我們的計(jì)算結(jié)果表明,相應(yīng)于“城市化=Yes”, 期望值逐漸減少到0
26、,與觀測(cè)值趨于接近;相應(yīng)于“城市化=No,期望值逐漸增加到4, 與觀測(cè)值也趨于接近。這種結(jié)果是比較理想的,否則,模型的Hosmer-Lemeshow檢驗(yàn)就不 太理想,從而模型的整體擬合效果不是很好。Comingency Table for Hosmer and Lemeshow Test城市化=Yes城ill化=NoTotalObservedExpectedObservedExpectedStep 133.0000aao31232.9990.am3322.69313073431.70901.291350.54032.460360.05432.946370.00532.995380.00033
27、000390.00033.0QO3100.0044 aao4圖8-1-18對(duì)應(yīng)于Hoinei-Lemeshow檢驗(yàn)的列聯(lián)表11. Classification Table(最終預(yù)測(cè)分類表)。經(jīng)過(guò)迭代運(yùn)算,模型參數(shù)逐漸收斂到穩(wěn)定 值,于是我們得到最終模型參數(shù)。利用最終的logistic模型,可以對(duì)因變量進(jìn)行預(yù)測(cè),預(yù)測(cè) 結(jié)果分類列入下表(圖8-1-19)??梢钥闯?,觀測(cè)值Yes有11個(gè)(Yes=0),相應(yīng)的預(yù)測(cè) 值全部是Yes=0,預(yù)測(cè)正確率為11/11*100%=100%;觀測(cè)值No有20個(gè)(No=1),相應(yīng)的 預(yù)測(cè)值有19個(gè)No=1,一個(gè)Yes=0,也就是說(shuō),預(yù)測(cè)失敗1例,預(yù)測(cè)正確率為19/(
28、1+19)*100%=95%??偟念A(yù)測(cè)正確率為預(yù)測(cè)正確率=11+1911 | 0-| 1 | 19*100% =30 *100% =96.8%31全部31個(gè)樣品有30個(gè)預(yù)測(cè)正確,一個(gè)預(yù)測(cè)失敗,模型效果良好。Classification TablObserv&dPredicted城市化PercentageCorrectYesNoStep 1堀T化YesNoOverall Percentage1110191100.095.096. Ba. The cut value is .500圖8-L-1P最耕預(yù)濯分類衰12. Variables in the Equation(最終模型中的變量)。只要理解圖
29、8-1-13的含義,就不難 理解下圖所示的結(jié)果(圖8-1-20)。B對(duì)應(yīng)的是最終模型參數(shù)估計(jì)值:常系數(shù)為16.365 (更 精確的結(jié)果為16.364888),中部的回歸系數(shù)為6.917(更精確的結(jié)果為6.917073),人均 GDP的回歸系數(shù)為-0.001 (更精確的結(jié)果為-0.001251)。S.E,為相應(yīng)的標(biāo)準(zhǔn)誤差?;貧w系數(shù) 與標(biāo)準(zhǔn)誤差比值的平方就是Wald值,例如其余依此類推。由于不知道Wald的臨界值,我們可以考察后面的Sig.值??梢钥闯觯O?數(shù)和人均GDP回歸系數(shù)的置信度達(dá)到90%以上,而中部的回歸系數(shù)只有80%以上。這個(gè)結(jié) 果可以與前面的Score檢驗(yàn)形成對(duì)照。Variable
30、s in the EquationBS.E.Wald(lfSig.Exp(B)3押人均GDF0010012.8331.929991中部U)6.9174.9551.9491.1631009 361Constant16.%59.5222.9531.861E+007a Variable(s) entered o-n step 1:人均GDP,中部一圖8 1 20最終方程中的變量最后的Exp(B)是對(duì)回歸系數(shù)B值進(jìn)行指數(shù)運(yùn)算的結(jié)果,例如鈕部)二產(chǎn)“啪=1009.361 一其余的數(shù)據(jù)還原依此類推。8.1.3建模與預(yù)測(cè)將圖8-1-20所示的結(jié)果從SPSS中復(fù)制到Excel中,可以看到更精確的數(shù)值,據(jù)此可以
31、建立如下線性關(guān)系z(mì) =16.364888 + 6.917073* 中部-0.001*人均GDP .將上面的關(guān)系式代入下式,得到P。)二二一l + -J L +fl.l64SES-i-617&73Hti 部一0.001251 人蚓丘HP1=L+尸隊(duì)倒呻時(shí).碩頊均球有了上面的式子,就可以對(duì)因變量的發(fā)生概率進(jìn)行預(yù)測(cè)。需要再次強(qiáng)調(diào)的是,對(duì)于名義變量中部,我們用1代表“是”,0代表“非”,而SPSS 改為0代表“是”,1代表“非”。對(duì)于因變量城市人口比重,我們用Yes代表1(城市化 水平高于平均值),用No代表0(城市化水平低于平均值),而SPSS改為相反的表示。明確 Tspss的重新編碼過(guò)程及其含義,
32、就可以檢驗(yàn)上述模型的預(yù)測(cè)效果。首先,在Excel中,將因變量中的名義變量轉(zhuǎn)換為0、1數(shù)值。根據(jù)SPSS的編碼原則(圖 8-1-10),所有的Yes表示為0,所有的No表示為1。一個(gè)快捷的處理方式是利用if函數(shù)。 在與因變量并列的第二個(gè)單元格中,即H2中,輸入函數(shù)“=IF(G2=Yes,0,1)”,回車立即 得到0;將鼠標(biāo)指向H2單元格的右下角,待其變成細(xì)小黑十字,雙擊或者下拉,得到全部轉(zhuǎn) 換結(jié)果(圖8-1-21)。圖8-1-21用于預(yù)測(cè)的數(shù)據(jù)的整理與轉(zhuǎn)換結(jié)果(部分)數(shù)據(jù)整理完成以后,將圖8-1-20所示的表格從SPSS中復(fù)制到Excel中,放在將要開(kāi)展 預(yù)測(cè)的單元格旁邊(圖8-1-22)圖8-
33、1-22將SPSS給出的模型參數(shù)估計(jì)值復(fù)制到Excel中(局部)根據(jù)數(shù)據(jù)分布的位置,在I2單元格中輸入如下公式(圖8-1-23):“=1/(1+EXP(-($K$5+$K$4*(1-C2)+$K$3*E2)”,回車,立即得到0。將鼠標(biāo)指向H2 單元格的右下角,待其變成細(xì)小填充柄,雙擊或者下拉,得到全部預(yù)測(cè)結(jié)果(圖8-1-24);將這些數(shù)值四舍五入,所有的預(yù)測(cè)值都變成0或者1。圖8-1-23預(yù)測(cè)公式的表達(dá)形式注意上面的計(jì)算公式中有一個(gè)細(xì)節(jié),對(duì)應(yīng)于中部變量的單元格為C2,公式中不是用系數(shù)6.917073(在單元格K4中)直接乘以C2,而是乘以(1-C2)。這樣處理的原因如前所述,SPSS改變了我們的編碼,我們用1表示“是(中部)”,用0表示“非(中部)”。而SPSS 將我們的1改編為0,0改編為1(圖8-1-11)。我們用1-C2代替C2,相當(dāng)于將中部變量的 0、1 互換,使之與SPSS的編碼一致。AECDEFGHI1地區(qū)輯中部西部人均GDP城街人口城市1七城市化預(yù)測(cè)值2北京10045443.69S3.62Ves00.0003天津10035783.1975.11Ves00.0004河北10014782.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 古詩(shī)文教學(xué)新思路:春江花月夜教學(xué)設(shè)計(jì)與實(shí)施案例分享
- 汽車機(jī)械維修技術(shù)實(shí)操測(cè)試卷
- 企業(yè)管理培訓(xùn)服務(wù)合同
- 墩、臺(tái)身和蓋梁工程現(xiàn)場(chǎng)質(zhì)量檢驗(yàn)報(bào)告單(二)
- 超前錨桿 現(xiàn)場(chǎng)質(zhì)量檢驗(yàn)報(bào)告單
- 酒水采購(gòu)合同
- 防控疫情知識(shí)培訓(xùn)課件
- 醫(yī)療護(hù)理操作規(guī)范測(cè)試題
- 武漢手房屋買賣合同書
- 教育范文選錄
- 泵站工程設(shè)計(jì)(共138張課件)
- 部編版五年級(jí)上冊(cè)快樂(lè)讀書吧練習(xí)題含答案
- 2024至2030年中國(guó)石油瀝青市場(chǎng)前景及投資機(jī)會(huì)研究報(bào)告
- 武漢大學(xué)張俊:2024生成式人工智能大模型及其電力系統(tǒng)數(shù)智化應(yīng)用前沿報(bào)告
- (高清版)AQ 1056-2008 煤礦通風(fēng)能力核定標(biāo)準(zhǔn)
- 《內(nèi)陸干旱區(qū)季節(jié)性河流生態(tài)流量(水量)確定技術(shù)導(dǎo)則》
- IATF16949-2016標(biāo)準(zhǔn)和內(nèi)審員培訓(xùn)
- 2024秋季山西交控集團(tuán)所屬路橋集團(tuán)校園招聘270人公開(kāi)引進(jìn)高層次人才和急需緊缺人才筆試參考題庫(kù)(共500題)答案詳解版
- 2024年常州機(jī)電職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及答案解析
- 2024年人教版小學(xué)語(yǔ)文六年級(jí)下冊(cè)第二單元測(cè)試卷(含答案解析)【可編輯打印】
評(píng)論
0/150
提交評(píng)論