二章多元線回歸multiplelinearregression_第1頁(yè)
二章多元線回歸multiplelinearregression_第2頁(yè)
二章多元線回歸multiplelinearregression_第3頁(yè)
二章多元線回歸multiplelinearregression_第4頁(yè)
二章多元線回歸multiplelinearregression_第5頁(yè)
已閱讀5頁(yè),還剩63頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、二章多元線回歸multiplelinearregression二章多元線回歸multiplelinearregressio解讀X與y的相關(guān)系數(shù)為0.6,x與z的相關(guān)系數(shù)為0.3第2頁(yè),共67頁(yè)幻燈片。解讀X與y的相關(guān)系數(shù)為0.6,x與z的相關(guān)系數(shù)為0.3第2頁(yè)答案:只能說(shuō)明x與y相關(guān)程度高于x與z的相關(guān)程度,但不能說(shuō)前者是后者的兩倍第3頁(yè),共67頁(yè)幻燈片。答案:第3頁(yè),共67頁(yè)幻燈片。二、計(jì)算相關(guān)的思路定距:數(shù)量上的“共變”定類、定序:“連同發(fā)生”隱含根據(jù)一個(gè)變量去預(yù)測(cè)或估計(jì)另一個(gè)變量的意思人們正是根據(jù)預(yù)測(cè)的準(zhǔn)確程度來(lái)界定定類或定序變量之間的關(guān)系的消減誤差比例第4頁(yè),共67頁(yè)幻燈片。二、計(jì)算相

2、關(guān)的思路第4頁(yè),共67頁(yè)幻燈片。三、相關(guān)測(cè)量邏輯展示(一)Lambda相關(guān)測(cè)量法基本邏輯:以一個(gè)定類變項(xiàng)的值來(lái)預(yù)測(cè)另一個(gè)定類變項(xiàng)的值時(shí),如果以眾值作為預(yù)測(cè)準(zhǔn)則,可以減少多少誤差公式:第5頁(yè),共67頁(yè)幻燈片。三、相關(guān)測(cè)量邏輯展示第5頁(yè),共67頁(yè)幻燈片。練習(xí):根據(jù)下表數(shù)據(jù)計(jì)算lambda志愿性別男女總數(shù)快樂(lè)家庭103040理想工作401050增廣見(jiàn)聞10010總數(shù)6040100第6頁(yè),共67頁(yè)幻燈片。練習(xí):根據(jù)下表數(shù)據(jù)計(jì)算lambda志愿性別男女總數(shù)快樂(lè)家庭1第7頁(yè),共67頁(yè)幻燈片。第7頁(yè),共67頁(yè)幻燈片。思考并運(yùn)算:如果數(shù)據(jù)有如下變化,lambda值會(huì)發(fā)生什么變化呢?志愿性別男女總數(shù)快樂(lè)家庭10

3、1020理想工作403070增廣見(jiàn)聞10010總數(shù)6040100第8頁(yè),共67頁(yè)幻燈片。思考并運(yùn)算:如果數(shù)據(jù)有如下變化,lambda值會(huì)發(fā)生什么變化存在的問(wèn)題:1、Lambda系數(shù)以眾值為預(yù)測(cè)準(zhǔn)則,不理會(huì)眾值以外的次數(shù)分布,對(duì)數(shù)據(jù)利用率低。2、因?yàn)樯鲜鲇?jì)算方式,如果全部眾值集中在條件次數(shù)表的同一列或同一行中,則Lambda系數(shù)會(huì)等于0,相關(guān)失去意義第9頁(yè),共67頁(yè)幻燈片。存在的問(wèn)題:第9頁(yè),共67頁(yè)幻燈片。(二)相關(guān)系數(shù)r1、協(xié)方差的思想2、r系數(shù)計(jì)算3、PRE計(jì)算思路第10頁(yè),共67頁(yè)幻燈片。(二)相關(guān)系數(shù)r第10頁(yè),共67頁(yè)幻燈片。四、回歸回歸是相關(guān)分析的深入回歸分析的結(jié)果是建立一個(gè)數(shù)學(xué)模

4、型以表達(dá)變量之間的關(guān)系在分析觀測(cè)數(shù)據(jù)的基礎(chǔ)上,確定一個(gè)能反映變量之間關(guān)系的近似函數(shù)表達(dá)式第11頁(yè),共67頁(yè)幻燈片。四、回歸回歸是相關(guān)分析的深入第11頁(yè),共67頁(yè)幻燈片。線性關(guān)聯(lián)整體研究方案1(多)個(gè)定距(類)變量1個(gè)定距變量理論思路經(jīng)驗(yàn)支撐方法論指導(dǎo)第12頁(yè),共67頁(yè)幻燈片。線性關(guān)聯(lián)整體研究方案1(多)個(gè)1個(gè)理論思路經(jīng)驗(yàn)支撐方法論指導(dǎo)注意回歸模型只是整個(gè)研究方案中的一環(huán),它必須依賴?yán)碚摵徒?jīng)驗(yàn)的支撐,服從研究設(shè)計(jì)的需要,在研究方法論的指導(dǎo)下展開(kāi)第13頁(yè),共67頁(yè)幻燈片。注意回歸模型只是整個(gè)研究方案中的一環(huán),它必須依賴?yán)碚摵徒?jīng)驗(yàn)的研究變量間的因果關(guān)系預(yù)測(cè)是否吻合預(yù)先構(gòu)想評(píng)價(jià)模型擬合度求解模型參數(shù)估

5、計(jì)第14頁(yè),共67頁(yè)幻燈片。研究變量間的因果關(guān)系預(yù)測(cè)是否吻合預(yù)先構(gòu)想評(píng)價(jià)模型擬合度求解模第二節(jié)一元線性回歸參見(jiàn):盧叔華社會(huì)統(tǒng)計(jì)學(xué),北京大學(xué)出版社1997 第十二章 回歸與相關(guān)一、回歸方程與線性回歸方程二、回歸方程的建立與最小二乘法三、回歸方程的假定與檢驗(yàn)第15頁(yè),共67頁(yè)幻燈片。第二節(jié)一元線性回歸參見(jiàn):盧叔華社會(huì)統(tǒng)計(jì)學(xué),北京大學(xué)出版一、回歸方程與線性回歸方程兩變量x與y對(duì)于確定的xi,yi是隨機(jī)變量,可計(jì)算其均值回歸方程是研究自變量不同取值時(shí),y的均值的變化當(dāng)因變量y的均值與自變量x呈線性規(guī)律時(shí),稱線性回歸方程根據(jù)x個(gè)數(shù)不同,分為一元線性回歸、多元線性回歸第16頁(yè),共67頁(yè)幻燈片。一、回歸方程

6、與線性回歸方程兩變量x與y第16頁(yè),共67頁(yè)幻燈關(guān)于模型現(xiàn)實(shí)數(shù)據(jù)=模型+誤差沒(méi)有誤差的不是模型,是復(fù)制復(fù)制很精確,但是往往太不簡(jiǎn)潔設(shè)置模型一般而言是希望用簡(jiǎn)潔的方式表述復(fù)雜信息,達(dá)到較好的精確度第17頁(yè),共67頁(yè)幻燈片。關(guān)于模型現(xiàn)實(shí)數(shù)據(jù)=模型+誤差第17頁(yè),共67頁(yè)幻燈片。二、回歸方程的建立與最小二乘法回歸分析的目的:找出錯(cuò)誤最小的方法來(lái)預(yù)測(cè)因變量的數(shù)值擬合思路:各點(diǎn)到待估直線鉛直距離之和為最小最小二乘 第18頁(yè),共67頁(yè)幻燈片。二、回歸方程的建立與最小二乘法回歸分析的目的:找出錯(cuò)誤最小的原理:(1)散點(diǎn)圖(2)每個(gè)x值對(duì)應(yīng)的y的均值,構(gòu)成回歸線(曲折)(3)用最小平方法繪制回歸直線(各個(gè)樣本

7、個(gè)案的估計(jì)誤差和為誤差總數(shù)。為避免正負(fù)抵消,改為將誤差的平方值相加。如果回歸直線位置能夠使此平方和最小,即為最佳擬和直線)第19頁(yè),共67頁(yè)幻燈片。原理:第19頁(yè),共67頁(yè)幻燈片。線性回歸方程式不但有簡(jiǎn)化資料的作用,而且可以推廣應(yīng)用于預(yù)測(cè)或估計(jì)樣本以外之個(gè)案的數(shù)值第20頁(yè),共67頁(yè)幻燈片。線性回歸方程式不但有簡(jiǎn)化資料的作用,而且可以推廣應(yīng)用于預(yù)測(cè)或回歸系數(shù)的意義:b值的大小表示每增加一個(gè)單位的x值,y值的變化有多大第21頁(yè),共67頁(yè)幻燈片?;貧w系數(shù)的意義:第21頁(yè),共67頁(yè)幻燈片。三、回歸方程的假定與檢驗(yàn)(一)基本假定1、自變量x可以是隨機(jī)變量,也可以是非隨機(jī)變量,其誤差忽略不計(jì)2、對(duì)于每一個(gè)

8、x值,yi都是隨機(jī)變量。Y的所有子總體y1,y2yn,方差相等3、y的所有子總體,其均值都在一條直線上線性假定4、隨機(jī)變量yi是統(tǒng)計(jì)獨(dú)立的5、 y的所有子總體都滿足正態(tài)分布第22頁(yè),共67頁(yè)幻燈片。三、回歸方程的假定與檢驗(yàn)(一)基本假定第22頁(yè),共67頁(yè)幻燈(二)檢驗(yàn)F檢驗(yàn)第23頁(yè),共67頁(yè)幻燈片。(二)檢驗(yàn)第23頁(yè),共67頁(yè)幻燈片。第三節(jié) 多元線性回歸模型一、多元的思路二、回歸方程的建立三、回歸方程的解釋四、標(biāo)準(zhǔn)化回歸系數(shù)第24頁(yè),共67頁(yè)幻燈片。第三節(jié) 多元線性回歸模型一、多元的思路第24頁(yè),共67頁(yè)幻一、多元的思路關(guān)聯(lián)性 Association 和因果性Causality統(tǒng)計(jì)意義上的關(guān)聯(lián)

9、性很容易發(fā)現(xiàn) , 難的是,如何確立因果聯(lián)系。然而我們?cè)谘芯恐懈雨P(guān)心的是因果性的解釋。 第25頁(yè),共67頁(yè)幻燈片。一、多元的思路關(guān)聯(lián)性 Association 和因果性Cau因果關(guān)系存在的必要條件: 1、變量間的關(guān)系是strong and consistent; 2、變量間有適當(dāng)?shù)臅r(shí)序性; 3、變量間的關(guān)系不能夠被其他變量所解釋。 第26頁(yè),共67頁(yè)幻燈片。因果關(guān)系存在的必要條件: 第26頁(yè),共67頁(yè)幻燈片。對(duì)觀察數(shù)據(jù)的統(tǒng)計(jì)控制我們?nèi)绾闻懦渌麄溥x解釋? 和實(shí)驗(yàn)室的實(shí)驗(yàn)不同的是,我們不能控制社會(huì)現(xiàn)象發(fā)生的環(huán)境。對(duì)于觀察數(shù)據(jù), 因果性問(wèn)題可以部分地通過(guò)統(tǒng)計(jì)控制來(lái)解決即, 我們可以把個(gè)體根據(jù)我們所

10、要控制的特征分成幾個(gè)小組, 來(lái)比較組內(nèi)的結(jié)果變量的差異對(duì)定量變量最常用的統(tǒng)計(jì)控制體現(xiàn)在多元回歸模型中。 第27頁(yè),共67頁(yè)幻燈片。對(duì)觀察數(shù)據(jù)的統(tǒng)計(jì)控制我們?nèi)绾闻懦渌麄溥x解釋? 第27頁(yè),共二、回歸方程的建立多元回歸模型一般表達(dá)式建立的多元回歸方程:其中, 稱y對(duì)x的回歸系數(shù)或偏回歸系數(shù)可用最小二乘法求解第28頁(yè),共67頁(yè)幻燈片。二、回歸方程的建立多元回歸模型一般表達(dá)式建立的多元回歸方程:多元回歸系數(shù)的估計(jì)首先看只有兩個(gè)自變量的模型 :我們?nèi)钥梢杂米钚《朔?,使得觀測(cè)的Y值和預(yù)測(cè)的Y值的差距的平方和最小。利用微積分, Let Z(a, b1, b2)= (Y-a-b1X1-b2X2)2第29頁(yè)

11、,共67頁(yè)幻燈片。多元回歸系數(shù)的估計(jì)首先看只有兩個(gè)自變量的模型 :Let Z(對(duì)三個(gè)未知參數(shù)a, b1, and b2 求導(dǎo): 第30頁(yè),共67頁(yè)幻燈片。對(duì)三個(gè)未知參數(shù)a, b1, and b2 求導(dǎo): 第30頁(yè),解方程:第31頁(yè),共67頁(yè)幻燈片。解方程:第31頁(yè),共67頁(yè)幻燈片。這種方法可以擴(kuò)展到任意多的自變量的模型。計(jì)算機(jī)可以直接給出估計(jì)的系數(shù)。第32頁(yè),共67頁(yè)幻燈片。這種方法可以擴(kuò)展到任意多的自變量的模型。第32頁(yè),共67頁(yè)幻三、回歸方程的解釋在任何情況下, a 始終為當(dāng)所有自變量為0時(shí)的應(yīng)變量值 (截距)斜率系數(shù) b1 到 bk 表示在其他變量不變的情況下,相關(guān)的X增加一個(gè)單位,Y所

12、對(duì)應(yīng)的變化。第33頁(yè),共67頁(yè)幻燈片。三、回歸方程的解釋在任何情況下, a 始終為當(dāng)所有自變量為0對(duì)于方程:如果xi增加一個(gè)單位,即xi變?yōu)閤i+1,而其他自變量均保持不變,相應(yīng)有則y的變化幅度為第34頁(yè),共67頁(yè)幻燈片。對(duì)于方程:如果xi增加一個(gè)單位,即xi變?yōu)閤i+1,而其他自規(guī)范解讀方式(在其他變量不變的情況下,)xi平均變化一個(gè)單位,y平均相應(yīng)變化bi個(gè)單位第35頁(yè),共67頁(yè)幻燈片。規(guī)范解讀方式(在其他變量不變的情況下,)xi平均變化一個(gè)單位x及未包括進(jìn)方程中的其他與x有關(guān)的一切因素對(duì)y的總影響一元回歸系數(shù)多元回歸系數(shù)偏回歸系數(shù):除去方程中其他因素對(duì)y的共同影響后,某自變量對(duì)y的邊際影

13、響回歸系數(shù)的意義第36頁(yè),共67頁(yè)幻燈片。x及未包括進(jìn)方程中的其他與x有關(guān)的一切因素對(duì)y的總影響一元回四、標(biāo)準(zhǔn)化回歸系數(shù)問(wèn)題需要判別所考察的因素的重要程度解決將回歸系數(shù)標(biāo)準(zhǔn)化做法1、先將變量標(biāo)準(zhǔn)化,再 計(jì)算2、利用回歸系數(shù)計(jì)算第37頁(yè),共67頁(yè)幻燈片。四、標(biāo)準(zhǔn)化回歸系數(shù)問(wèn)題需要判別所考察的因素的重要程度解決將回變量 每平均變化一個(gè)標(biāo)準(zhǔn)分?jǐn)?shù),y將平均變化 個(gè)標(biāo)準(zhǔn)分?jǐn)?shù)第38頁(yè),共67頁(yè)幻燈片。變量 每平均變化一個(gè)標(biāo)準(zhǔn)分?jǐn)?shù),第38頁(yè),共67頁(yè)幻燈第四節(jié)方程的解釋能力一、確定系數(shù)二、調(diào)整的確定系數(shù)三、多元相關(guān)系數(shù)四、方差分析第39頁(yè),共67頁(yè)幻燈片。第四節(jié)方程的解釋能力一、確定系數(shù)第39頁(yè),共67頁(yè)幻

14、燈片。一、確定系數(shù)(01)回歸方程解釋的差異與用y均值解釋的差異之比模型中所有變量解釋y的變化占總變化的比例受奇異值影響散點(diǎn)圖第40頁(yè),共67頁(yè)幻燈片。一、確定系數(shù)(01)回歸方程解釋的差異與用y均值解釋的差異 預(yù)測(cè)與殘差 e=(Y - )The sum of squared errors 我們通過(guò)對(duì)該項(xiàng)(殘差)最小化方法求得 a and bi. 第41頁(yè),共67頁(yè)幻燈片。 預(yù)測(cè)與殘差 e=(Y - )The sum of擬合優(yōu)度where and第42頁(yè),共67頁(yè)幻燈片。擬合優(yōu)度where 第42頁(yè),共67頁(yè)幻燈片。 和前面一樣, 是衡量 Y的所有變異中由所有自變量的差異共同解釋的比例 越高

15、, 模型擬合數(shù)據(jù)的程度就越好。 當(dāng)加入新的變量時(shí), 只升不降。 由于常常是隨著自變量數(shù)目的增加而增加, 所以直接比較 沒(méi)有太大的意義。第43頁(yè),共67頁(yè)幻燈片。 和前面一樣, 是衡量 Y的所有變異中由所有自變量的二、調(diào)整的確定系數(shù)自變量個(gè)數(shù)樣本規(guī)模(1:10)(1:5)自變量個(gè)數(shù)樣本規(guī)模偏高第44頁(yè),共67頁(yè)幻燈片。二、調(diào)整的確定系數(shù)自變量個(gè)數(shù)樣本規(guī)模(1:10)(1:5三、多元相關(guān)系數(shù)R因變量觀測(cè)值和預(yù)測(cè)值之間的相關(guān)程度第45頁(yè),共67頁(yè)幻燈片。三、多元相關(guān)系數(shù)R第45頁(yè),共67頁(yè)幻燈片。四、方差分析y的總變差平方和回歸平方和余差平方和第46頁(yè),共67頁(yè)幻燈片。四、方差分析y的總變差平方和回

16、歸平方和余差平方和第46頁(yè),共檢驗(yàn)統(tǒng)計(jì)推斷回歸方程回歸系數(shù)回歸系數(shù)的置信區(qū)間為什么不顯著?第五節(jié)回歸方程的檢驗(yàn)和回歸系數(shù)的推斷統(tǒng)計(jì)第47頁(yè),共67頁(yè)幻燈片。檢驗(yàn)統(tǒng)計(jì)推斷回回回歸系數(shù)的置信區(qū)間為什么不顯著?第五節(jié)回歸實(shí)質(zhì)假設(shè)計(jì)算H0:B1B2Bk0 (BSS/k)/ ESS/(n-k-1)在總體中,X1,Xk的變化都不引起Y的線性變化P與a比較,決定是否拒絕H0檢驗(yàn)在a水平統(tǒng)計(jì)性顯著,并拒絕H0、接受H1我們有相當(dāng)大的把握斷定,統(tǒng)計(jì)量b1,bk不等于0不是由于抽樣誤差造成的。表述檢驗(yàn)樣本y與x1,xk的線性關(guān)系是否顯著判斷能否肯定總體回歸系數(shù)中至少有一個(gè)不等于0一、回歸方程的顯著性檢驗(yàn)第48頁(yè),

17、共67頁(yè)幻燈片。實(shí)質(zhì)假設(shè)計(jì)算H0:B1B2Bk0 當(dāng)回歸方程檢驗(yàn)顯著時(shí),可以認(rèn)為回歸方程中至少有一個(gè)回歸系數(shù)是顯著的。但并不一定所有回歸系數(shù)都顯著?;貧w模型希望:保留最重要的變量,刪除不顯著的變量對(duì)每個(gè)變量的回歸系數(shù)進(jìn)行檢驗(yàn)二、回歸系數(shù)的顯著性檢驗(yàn)第49頁(yè),共67頁(yè)幻燈片。當(dāng)回歸方程檢驗(yàn)顯著時(shí),可以認(rèn)為回歸方程中至少有一個(gè)回歸系數(shù)是具體做法:TSig T H0:Bj0 H1:Bj0第50頁(yè),共67頁(yè)幻燈片。具體做法:T H0:Bj0第50頁(yè),共三、回歸系數(shù)的置信區(qū)間回歸系數(shù)的統(tǒng)計(jì)檢驗(yàn)只能說(shuō)明Bj與0有顯著差別,并不能說(shuō)明Bj的具體情況。用樣本回歸系數(shù)b及其標(biāo)準(zhǔn)誤,可以推斷Bj值的置信區(qū)間P(b

18、j-ta/2sjBj回歸系數(shù)的統(tǒng)計(jì)檢驗(yàn)只能說(shuō)明Bj與0有顯著差別,并不能說(shuō)明Bj的具體情況。用樣本回歸系數(shù)b及其標(biāo)準(zhǔn)誤,可以推斷Bj值的置信區(qū)間P(bj- sjBjbj+ sj)=1-a第51頁(yè),共67頁(yè)幻燈片。三、回歸系數(shù)的置信區(qū)間回歸系數(shù)的統(tǒng)計(jì)檢驗(yàn)只能說(shuō)明Bj與0有顯樣本量太小變量數(shù)太多Xj標(biāo)準(zhǔn)差過(guò)小自變量線性相關(guān)確實(shí)不相關(guān)非線性關(guān)系四、回歸系數(shù)不顯著的原因第52頁(yè),共67頁(yè)幻燈片。樣變量數(shù)太多Xj標(biāo)準(zhǔn)差過(guò)小自變量線性相關(guān)確實(shí)不相關(guān)非線性關(guān)系第六節(jié)虛擬變量的應(yīng)用什么變量需要虛擬?分類變量第53頁(yè),共67頁(yè)幻燈片。第六節(jié)虛擬變量的應(yīng)用什么變量需要虛擬?分類變量第53頁(yè),共虛擬變量一個(gè)變量只有

19、兩個(gè)可能值1 or 0. 對(duì)于一個(gè)兩分的變量: gender: 1. male 2. female 我們可以重新編碼 1=male and 0=female. 由此, gender 就變成了一個(gè)虛擬變量 , 表示被訪者是否男性 . 第54頁(yè),共67頁(yè)幻燈片。虛擬變量一個(gè)變量只有兩個(gè)可能值1 or 0. 對(duì)于一個(gè)兩分如何虛擬?二分變量(是、否)把二分狀態(tài)看作連續(xù)變化的過(guò)程將某一個(gè)分類變量(有n個(gè)選項(xiàng))轉(zhuǎn)換成(n-1)個(gè)二分變量,以沒(méi)有進(jìn)入變量表達(dá)的那個(gè)類別為參照進(jìn)行解釋,說(shuō)明不同類別間y取值的變化均值的意義是編碼為1的案例占樣本的比例第55頁(yè),共67頁(yè)幻燈片。如何虛擬?二分變量把二分狀態(tài)看作連續(xù)

20、變化的過(guò)程將某一個(gè)分類變?yōu)槭裁匆诨貧w分析中引入虛擬變量?有時(shí)我們社會(huì)研究的樣本數(shù)據(jù)中觀察的個(gè)體可以分成不同的組別。組與組、或群體與群體間的在自變量和應(yīng)變量的平均數(shù)會(huì)有差異在這種情況下, 不控制組別特征的回歸模型結(jié)果會(huì)導(dǎo)致 所估計(jì)的偏回歸系數(shù)偏差。 特別是, 系數(shù)可能低估或者高估一個(gè)自變量對(duì)應(yīng)變量的影響強(qiáng)度。 第56頁(yè),共67頁(yè)幻燈片。為什么要在回歸分析中引入虛擬變量?有時(shí)我們社會(huì)研究的樣本數(shù)據(jù)第七節(jié)多重共線性及其解決方案多元線性回歸的解釋方式:“在其他變量不變的前提下,xi平均變化一個(gè)單位y將平均變化bi個(gè)單位”如果xi與另一自變量存在高度相關(guān),則這種解釋不成立,因?yàn)椤霸谄渌兞坎蛔兊那疤帷?/p>

21、不可能實(shí)現(xiàn)此即所謂的“多重共線性”第57頁(yè),共67頁(yè)幻燈片。第七節(jié)多重共線性及其解決方案多元線性回歸的解釋方式:“在其回歸方程整體顯著,但各個(gè)自變量都不顯著多重共線性的表現(xiàn)之一:自變量之間存在高度線性相關(guān)后果: 影響回歸方程的有效性 回歸預(yù)測(cè)結(jié)果將不可靠 xi與y之間的關(guān)系不準(zhǔn)確第58頁(yè),共67頁(yè)幻燈片?;貧w方程整體顯著,多重共線性的表現(xiàn)之一:自變量之間存在高度線鑒別多重共線性的思路:在自變量之間建立回歸方程,以該回歸方程的確定系數(shù)來(lái)判斷自變量之間的相關(guān)程度具體做法:假定有k個(gè)自變量,先以第一個(gè)自變量x1為因變量建立回歸方程,計(jì)算確定系數(shù)若值較大,說(shuō)明至少有一個(gè)自變量與x1相關(guān),也即存在共線性

22、問(wèn)題;按此方法依次建立回歸方程,根據(jù)確定系數(shù)的變化來(lái)判斷共線性問(wèn)題第59頁(yè),共67頁(yè)幻燈片。鑒別多重共線性的思路:在自變量之間建立回歸方程,以該回歸方程檢查多重共線性容限度(tolerance)特征值和條件次數(shù)(eigen-values and condition indexes)方差膨脹因子(variance inflation factor)以每個(gè)自變量作為因變量對(duì)其他自變量回歸得到的余差比例是容限度的倒數(shù)。表示所對(duì)應(yīng)的偏回歸系數(shù)的方差由于多重共線性而擴(kuò)大的倍數(shù)小于0.1,則認(rèn)為多重共線性嚴(yán)重大于10,則認(rèn)為多重共線性嚴(yán)重第60頁(yè),共67頁(yè)幻燈片。檢查多重共線性容限度(tolerance)特征值和條件次數(shù)(去掉與y相關(guān)較低,而與其他自變量相關(guān)高的變量去掉可以被其余自變量線性表出的變量增加樣本規(guī)模采用新的樣本數(shù)據(jù)利用先驗(yàn)信息組合變量逐步刪除(逐步回歸方法即可消除此問(wèn)題)變量變換補(bǔ)救辦法第61頁(yè),共67頁(yè)幻燈片。去掉與y相關(guān)較低,而與其他自變量相關(guān)高的變量去掉可以被其余自全部納入全部刪除向前回歸逐步回歸向后回歸選擇最優(yōu)回歸方程第62頁(yè),共67頁(yè)幻燈片。全部納入全部刪除向前回歸逐步回歸向后回歸選擇最優(yōu)回歸方程第6第八節(jié)計(jì)算機(jī)操作第63頁(yè),共67頁(yè)幻燈片。第八節(jié)計(jì)算機(jī)操作第63頁(yè),共67頁(yè)幻燈片。第九節(jié) 研究實(shí)例社會(huì)意識(shí)的行動(dòng)邏輯性別不平等的現(xiàn)象學(xué)社會(huì)學(xué)解釋框架浙江學(xué)刊20

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論