第七章回歸分析_第1頁(yè)
第七章回歸分析_第2頁(yè)
第七章回歸分析_第3頁(yè)
第七章回歸分析_第4頁(yè)
第七章回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章回歸分析第一節(jié)Linear過(guò)程線性回歸第二節(jié)CurveEstimation過(guò)程曲線回歸第三節(jié)Logistic過(guò)程羅輯斯諦回歸第四節(jié)Probit過(guò)程概率單位回歸第五節(jié)Nonlinear過(guò)程非線性回歸回歸的主要內(nèi)容:從一組樣本數(shù)據(jù)出發(fā),確定這些變量間的定量關(guān)系式;對(duì)這些關(guān)系式的可信度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn);從影響某一變量的諸多變量中,判斷哪些變量的影響顯著,哪些不顯著;利用求得的關(guān)系式進(jìn)行預(yù)測(cè)和控制?;貧w的分類:按是否線性分:線性回歸模型和非線性回歸模型。按自變量個(gè)數(shù)分:簡(jiǎn)單的一元回歸,多元回歸。利用SPSS得到模型關(guān)系式,是否具有適用性,要看回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))和回歸系數(shù)b的顯著性檢驗(yàn)(T檢驗(yàn)),還要看擬合程度R2(相關(guān)系數(shù)的平方,一元回歸用Rsquare,多元回歸用AdjustedRSquare)回歸分析的菜單選項(xiàng)及說(shuō)明:在回歸過(guò)程中包括:Liner:線性回歸CurveEstimation:曲線估計(jì)BinaryLogistic:二分變量邏輯回歸MultinomialLogistic:多分變量邏輯回歸Ordinal序回歸Probit:概率單位回歸Nonlinear:非線性回歸WeightEstimation:加權(quán)估計(jì)2-StageLeastsquares:二段最小平方法OptimalScaling最優(yōu)編碼回歸

第一節(jié)Linear過(guò)程7.1.1主要功能調(diào)用此過(guò)程可完成二元或多元的線性回歸分析。在多元線性回歸分析中,用戶還可根據(jù)需要,選用不同篩選自變量的方法(如:逐步法、向前法、向后法,等)。一元線性回歸方程:

多元線性回歸方程:

1.?dāng)?shù)據(jù)正態(tài)性假設(shè):誤差項(xiàng)的分布與自變量無(wú)關(guān),服從均值0,方差常數(shù)的正態(tài)分布;2.方差齊性假設(shè):對(duì)不同的自變量取值條件下,誤差分布方差相同;3.獨(dú)立性假設(shè):對(duì)不同的自變量取值條件下,誤差分布期望為0;4.無(wú)自相關(guān)性假設(shè):對(duì)不同的自變量取值條件下,誤差不相關(guān);5.隨機(jī)誤差與自變量對(duì)因變量的影響不相關(guān);4.回歸方程的建立

Enter所有變量都進(jìn)入方程(全模型)Remove根據(jù)設(shè)定好的條件,刪除部分變量,通常根據(jù)變量與模型的相關(guān)性Forward向前選擇根據(jù)條件從無(wú)自變量開始逐個(gè)選擇適合的變量進(jìn)入模型Backward向后剔除法根據(jù)條件從全模型中逐個(gè)剔除變量Stepwise逐步進(jìn)入法注:衡量變量在回歸模型中作用的大小,一般用偏回歸平方和刻畫,令S(i1,i2,…,ik)表示方程中有變量(i1,i2,…,ik)時(shí)殘差平方和,則第i個(gè)變量的偏回歸平方和定義為:Pi2=S(i1,i2,…im-1,im+1,…,ik)—S(i1,i2,…,ik)Pi越大表明該變量越重要。)5.參入分析的觀測(cè)量的選擇:利用Selection變量的取值實(shí)現(xiàn)分析中CASE的選擇6.Statistics選項(xiàng)設(shè)置:RsquaredChang:表示當(dāng)回歸方程中引入或剔除一個(gè)變量后R2的改變量。7.共線性診斷:回歸方程中,雖然各自變量對(duì)因變量都是有意義的,但是某些自變量可能彼此相關(guān),即存在共線性問(wèn)題,因此需要對(duì)方程中的自變量進(jìn)行共線性診斷。如果存在常數(shù)C0C1C2,使C0=C1X1+C2X2則稱X1,X2具有精確共線性.如果上式近似成立,則稱近似共線性當(dāng)一組自變量有精確共線性時(shí),必須刪除引起共線性的一個(gè)或多個(gè)自變量,當(dāng)共線性為近似時(shí),要把引起共線性的自變量刪除,但必須保證模型丟失信息最少。共線性診斷常用參數(shù):容許度()在只有兩個(gè)變量的情況下,其間的貢獻(xiàn)性表現(xiàn)在兩個(gè)變量間的相關(guān)系數(shù),相關(guān)系數(shù)為1時(shí),精確共線性,為0時(shí),不存在共線性。多個(gè)變量時(shí),Xi與其他自變量X之間的復(fù)相關(guān)系數(shù)的平方體現(xiàn)了共線性,容許度Toli=1—R2當(dāng)容許度較小時(shí),自變量X與其他變量存在共線性。容許度測(cè)量共線性的條件是:觀測(cè)量應(yīng)近似服從正態(tài)分布方差膨脹因子(VIF)方差膨脹因子VIF=1/(1—R2)容許度的倒數(shù),值越大,自變量之間存在共線性可能性越大.條件參數(shù)(ConditionIndex)ConditionIndex=

條件參數(shù)大于等于30時(shí)認(rèn)為有共線性存在的可能性共線性問(wèn)題的解決方法.剔除不重要的有共線性的變量、增加樣本量、重新測(cè)量.7.1.2實(shí)例分析[例7.1]某醫(yī)師測(cè)得10名3歲兒童的身高(cm)、體重(kg)和體表面積(cm2)資料如下。試用多元回歸方法確定以身高、體重為自變量,體表面積為應(yīng)變量的回歸方程。數(shù)據(jù)準(zhǔn)備:激活數(shù)據(jù)管理窗口,定義變量名:體表面積為Y,保留3位小數(shù);身高、體重分別為X1、X2,1位小數(shù)。輸入原始數(shù)據(jù)。數(shù)據(jù)文件:spssjiaoan\例題數(shù)據(jù)\身高體重體表面積回歸統(tǒng)計(jì)分析激活A(yù)naylze菜單選Regression中的Linear...項(xiàng),彈出LinearRegression對(duì)話框。從對(duì)話框左側(cè)的變量列表中選y,點(diǎn)擊

鈕使之進(jìn)入Dependent框,選x1、x2,點(diǎn)擊

鈕使之進(jìn)入Indepentdent(s)框;在Method處下拉菜單,共有5個(gè)選項(xiàng):Enter(全部入選法)、Stepwise(逐步法)、Remove(強(qiáng)制剔除法)、Backward(向后法)、Forward(向前法)。本例選用Enter法。點(diǎn)擊OK鈕即完成分析。結(jié)果顯示,本例以X1、X2為自變量,Y為應(yīng)變量,采用全部入選法建立回歸方程?;貧w方程的復(fù)相關(guān)系數(shù)為0.94964,決定系數(shù)(即r2)為0.90181,經(jīng)方差分析,F(xiàn)=34.14499,P=0.0003,回歸方程有效。回歸方程為Y=0.0687101X1+0.183756X2-2.856476。結(jié)果輸出:spssjiaoan\例題數(shù)據(jù)\身高體重體表面積回歸實(shí)例分析[例7.2]建立一個(gè)以初始工資Salbegin、工作經(jīng)驗(yàn)prevexp、工作時(shí)間jobtime、工作種類jobcat、受教育年限edcu等為自變量,當(dāng)前工資Salary為因變量的回歸模型。.數(shù)據(jù)文件:spssjiaoan\例題數(shù)據(jù)\回歸方程預(yù)測(cè)工資。數(shù)據(jù)分析:數(shù)據(jù)文件:spssjiaoan\例題數(shù)據(jù)\回歸方程預(yù)測(cè)工資。數(shù)據(jù)分析:先做數(shù)據(jù)散點(diǎn)圖,觀測(cè)因變量Salary與自變量Salbegin之間關(guān)系是否有線性特點(diǎn)Graphs->Scatter->SimpleXAxis:SalbeginYAxis:Salary若散點(diǎn)圖的趨勢(shì)大概呈線性關(guān)系,可以建立線性回歸模型Analyze->Regression->LinearDependent:SalaryIndependents:Salbegin,prevexp,jobtime,jobcat,edcu等變量Method:Stepwise比較有用的結(jié)果:擬合程度AdjustedR2:越接近1擬合程度越好回歸方程的顯著性檢驗(yàn)Sig回歸系數(shù)表Coefficients的Model最后一個(gè)中的回歸系數(shù)B和顯著性檢驗(yàn)Sig得模型:Salary=-15038.6+1.37Salbegin+5859.59jobcat-19.55prevexp+154.698jobtime+539.64edcu第二節(jié)CurveEstimation過(guò)程7.2.1主要功能調(diào)用此過(guò)程可完成下列有關(guān)曲線擬合的功能:7.2.2實(shí)例分析:[例7.3]汽車問(wèn)題已知汽車每加侖焰料行駛英里數(shù)mpq汽車重量Weight的一組數(shù)據(jù),確定曲線回歸模型.數(shù)據(jù)文件:spssjiaoan\例題數(shù)據(jù)\汽車問(wèn)題曲線回歸數(shù)據(jù)分析:先做散點(diǎn)圖(Graphs->Scatter->Simple):weight(X)、mpg(Y),看每加侖汽油行駛里程數(shù)mpg(Y)隨著汽車自重weight(X)的增加而減少的關(guān)系,也發(fā)現(xiàn)是曲線關(guān)系建立若干曲線模型(可試著選用所有模型Models)Analyze->Regression->CurveEstimationDependent:mpgIndependent:weightModels:全選(除了最后一個(gè)邏輯回歸)選Plotmodels:輸出模型圖形比較有用的結(jié)果:各種模型的AdjustedR2,并比較哪個(gè)大,結(jié)果是指數(shù)模型Compound的AdjustedR2=0.70678最好(擬合情況可見圖形窗口),結(jié)果方程為:mpg=60.15*0.999664weight說(shuō)明:Growth和Exponential的結(jié)果也相同,也一樣。結(jié)果文件:spssjiaoan\例題數(shù)據(jù)\汽車問(wèn)題曲線回歸實(shí)例操作[例8.2]某地1963年調(diào)查得兒童年齡(歲)X與錫克試驗(yàn)陰性率(%)Y的資料如下,試擬合對(duì)數(shù)曲線。數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:錫克試驗(yàn)陰性率為Y,年齡為X,輸入原始數(shù)據(jù)。數(shù)據(jù)文件:spssjiaoan\例題數(shù)據(jù)\擬合對(duì)數(shù)曲線。激活A(yù)naylze菜單選Regression中的CurveEstimation...項(xiàng),彈出CurveEstimation對(duì)話框。從對(duì)話框左側(cè)的變量列表中選y,點(diǎn)擊

鈕使之進(jìn)入Dependent框,選x,點(diǎn)擊

鈕使之進(jìn)入Indepentdent(s)框;在Model框內(nèi)選擇所需的曲線模型,本例選擇Logarithmic模型(即對(duì)數(shù)曲線);選Plotmodels項(xiàng)要求繪制曲線擬合圖;點(diǎn)擊Save...鈕,彈出CurveEstimation:Save對(duì)話框,選擇Predictedvalue項(xiàng),要求在原始數(shù)據(jù)庫(kù)中保存根據(jù)對(duì)數(shù)方程求出的Y預(yù)測(cè)值,點(diǎn)擊Continue鈕返回CurveEstimation對(duì)話框,再點(diǎn)擊OK鈕即可。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù):在以X為自變量、Y為應(yīng)變量,采用對(duì)數(shù)曲線擬合方法建立的方程,決定系數(shù)R2=0.913(接近于1),作擬合優(yōu)度檢驗(yàn),方差分析表明:F=52.32,P=0.001,擬合度很好,對(duì)數(shù)方程為:Y=61.3259+20.6704lnX。結(jié)果文件:spssjiaoan\例題數(shù)據(jù)\擬合對(duì)數(shù)曲線。第三節(jié)二項(xiàng)邏輯回歸(BinaryLogistic)

7.3.1主要功能調(diào)用此過(guò)程可完成BinaryLogistic回歸的運(yùn)算。所謂BinaryLogistic回歸,是指應(yīng)變量為二級(jí)計(jì)分或二類評(píng)定的回歸分析,這在醫(yī)學(xué)研究中經(jīng)常遇到,如:死亡與否(即生、死二類評(píng)定)的概率跟病人自身生理狀況和所患疾病的嚴(yán)重程度有關(guān);對(duì)某種疾病的易感性的概率(患病、不患病二類評(píng)定)與個(gè)體性別、年齡、免疫水平等有關(guān)。此類問(wèn)題的解決均可借助邏輯回歸來(lái)完成。本節(jié)介紹的BinaryLogistic過(guò)程,應(yīng)與日常所說(shuō)的Logistic曲線模型(即S或倒S形曲線)相區(qū)別。用戶如果要擬合Logistic曲線模型,可調(diào)用第二節(jié)CurveEstimation過(guò)程,系統(tǒng)提供11種曲線模型,其中含有Logistic曲線模型。Logistic回歸方程為7.3.2實(shí)例操作[例7.3]某醫(yī)師研究男性胃癌患者發(fā)生術(shù)后院內(nèi)感染的影響因素,資料如下表,請(qǐng)通過(guò)Logistic回歸統(tǒng)計(jì)方法對(duì)主要影響因素進(jìn)行分析。數(shù)據(jù)文件:spssjiaoan\例題數(shù)據(jù)\術(shù)后感染的Logistic回歸數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:術(shù)后感染為Y(字符變量,有輸入Y、無(wú)輸入N),年齡為X1,手術(shù)創(chuàng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論