版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第二部分多元線回歸multiplelinearregression第二部分多元線回歸multiplelinearregress第一節(jié)相關(guān)和回歸一、相關(guān)統(tǒng)計量用一個數(shù)值表示兩個變量間的相關(guān)程度(無單位度量)(-1~+1)第一節(jié)相關(guān)和回歸一、相關(guān)統(tǒng)計量GPS接收機(jī)工作原理GPS接收機(jī)工作原理二、計算相關(guān)的思路定距:數(shù)量上的“共變”定類、定序:“連同發(fā)生”——隱含根據(jù)一個變量去預(yù)測或估計另一個變量的意思人們正是根據(jù)預(yù)測的準(zhǔn)確程度來界定定類或定序變量之間的關(guān)系的——消減誤差比例二、計算相關(guān)的思路三、相關(guān)測量邏輯展示(一)Lambda相關(guān)測量法基本邏輯:以一個定類變項的值來預(yù)測另一個定類變項的值時,如果以眾值作為預(yù)測準(zhǔn)則,可以減少多少誤差公式:三、相關(guān)測量邏輯展示練習(xí):根據(jù)下表數(shù)據(jù)計算lambda志愿性別男女總數(shù)快樂家庭103040理想工作401050增廣見聞10010總數(shù)6040100練習(xí):根據(jù)下表數(shù)據(jù)計算lambda志愿性別男女總數(shù)快樂家庭1GPS接收機(jī)工作原理思考并運(yùn)算:如果數(shù)據(jù)有如下變化,lambda值會發(fā)生什么變化呢?志愿性別男女總數(shù)快樂家庭101020理想工作403070增廣見聞10010總數(shù)6040100思考并運(yùn)算:如果數(shù)據(jù)有如下變化,lambda值會發(fā)生什么變化存在的問題:1、Lambda系數(shù)以眾值為預(yù)測準(zhǔn)則,不理會眾值以外的次數(shù)分布,對數(shù)據(jù)利用率低。2、因為上述計算方式,如果全部眾值集中在條件次數(shù)表的同一列或同一行中,則Lambda系數(shù)會等于0,相關(guān)失去意義存在的問題:(二)相關(guān)系數(shù)r1、協(xié)方差的思想2、r系數(shù)計算3、PRE計算思路(二)相關(guān)系數(shù)r四、回歸回歸是相關(guān)分析的深入回歸分析的結(jié)果是建立一個數(shù)學(xué)模型以表達(dá)變量之間的關(guān)系——在分析觀測數(shù)據(jù)的基礎(chǔ)上,確定一個能反映變量之間關(guān)系的近似函數(shù)表達(dá)式四、回歸回歸是相關(guān)分析的深入線性關(guān)聯(lián)整體研究方案1(多)個定距(類)變量1個定距變量理論思路經(jīng)驗支撐方法論指導(dǎo)線性關(guān)聯(lián)整體研究方案1(多)個1個理論思路經(jīng)驗支撐方法論指導(dǎo)注意回歸模型只是整個研究方案中的一環(huán),它必須依賴?yán)碚摵徒?jīng)驗的支撐,服從研究設(shè)計的需要,在研究方法論的指導(dǎo)下展開注意回歸模型只是整個研究方案中的一環(huán),它必須依賴?yán)碚摵徒?jīng)驗的研究變量間的因果關(guān)系預(yù)測是否吻合預(yù)先構(gòu)想評價模型擬合度求解模型參數(shù)估計研究變量間的因果關(guān)系預(yù)測是否吻合預(yù)先構(gòu)想評價模型擬合度求解模第二節(jié)一元線性回歸參見:盧叔華《社會統(tǒng)計學(xué)》,北京大學(xué)出版社1997第十二章回歸與相關(guān)一、回歸方程與線性回歸方程二、回歸方程的建立與最小二乘法三、回歸方程的假定與檢驗第二節(jié)一元線性回歸參見:盧叔華《社會統(tǒng)計學(xué)》,北京大學(xué)出版一、回歸方程與線性回歸方程兩變量x與y對于確定的xi,yi是隨機(jī)變量,可計算其均值——回歸方程是研究自變量不同取值時,y的均值的變化當(dāng)因變量y的均值與自變量x呈線性規(guī)律時,稱線性回歸方程根據(jù)x個數(shù)不同,分為一元線性回歸、多元線性回歸一、回歸方程與線性回歸方程兩變量x與y關(guān)于模型現(xiàn)實數(shù)據(jù)=模型+誤差沒有誤差的不是模型,是復(fù)制復(fù)制很精確,但是往往太不簡潔設(shè)置模型一般而言是希望用簡潔的方式表述復(fù)雜信息,達(dá)到較好的精確度關(guān)于模型現(xiàn)實數(shù)據(jù)=模型+誤差二、回歸方程的建立與最小二乘法回歸分析的目的:找出錯誤最小的方法來預(yù)測因變量的數(shù)值擬合思路:各點(diǎn)到待估直線鉛直距離之和為最小——最小二乘二、回歸方程的建立與最小二乘法回歸分析的目的:找出錯誤最小的原理:(1)散點(diǎn)圖(2)每個x值對應(yīng)的y的均值,構(gòu)成回歸線(曲折)(3)用最小平方法繪制回歸直線(各個樣本個案的估計誤差和為誤差總數(shù)。為避免正負(fù)抵消,改為將誤差的平方值相加。如果回歸直線位置能夠使此平方和最小,即為最佳擬和直線)原理:線性回歸方程式不但有簡化資料的作用,而且可以推廣應(yīng)用于預(yù)測或估計樣本以外之個案的數(shù)值線性回歸方程式不但有簡化資料的作用,而且可以推廣應(yīng)用于預(yù)測或回歸系數(shù)的意義:b值的大小表示每增加一個單位的x值,y值的變化有多大回歸系數(shù)的意義:三、回歸方程的假定與檢驗(一)基本假定1、自變量x可以是隨機(jī)變量,也可以是非隨機(jī)變量,其誤差忽略不計2、對于每一個x值,yi都是隨機(jī)變量。Y的所有子總體y1,y2…yn,方差相等3、y的所有子總體,其均值都在一條直線上——線性假定4、隨機(jī)變量yi是統(tǒng)計獨(dú)立的5、y的所有子總體都滿足正態(tài)分布三、回歸方程的假定與檢驗(一)基本假定(二)檢驗F檢驗(二)檢驗第三節(jié)多元線性回歸模型一、多元的思路二、回歸方程的建立三、回歸方程的解釋四、標(biāo)準(zhǔn)化回歸系數(shù)第三節(jié)多元線性回歸模型一、多元的思路一、多元的思路關(guān)聯(lián)性Association和因果性Causality統(tǒng)計意義上的關(guān)聯(lián)性很容易發(fā)現(xiàn),難的是,如何確立因果聯(lián)系。然而我們在研究中更加關(guān)心的是因果性的解釋。一、多元的思路關(guān)聯(lián)性Association和因果性Cau因果關(guān)系存在的必要條件:1、變量間的關(guān)系是strongandconsistent;2、變量間有適當(dāng)?shù)臅r序性;3、變量間的關(guān)系不能夠被其他變量所解釋。因果關(guān)系存在的必要條件:對觀察數(shù)據(jù)的統(tǒng)計控制我們?nèi)绾闻懦渌麄溥x解釋?和實驗室的實驗不同的是,我們不能控制社會現(xiàn)象發(fā)生的環(huán)境。對于觀察數(shù)據(jù),因果性問題可以部分地通過統(tǒng)計控制來解決即,我們可以把個體根據(jù)我們所要控制的特征分成幾個小組,來比較組內(nèi)的結(jié)果變量的差異對定量變量最常用的統(tǒng)計控制體現(xiàn)在多元回歸模型中。對觀察數(shù)據(jù)的統(tǒng)計控制我們?nèi)绾闻懦渌麄溥x解釋?二、回歸方程的建立多元回歸模型一般表達(dá)式建立的多元回歸方程:其中,稱y對x的回歸系數(shù)或偏回歸系數(shù)可用最小二乘法求解二、回歸方程的建立多元回歸模型一般表達(dá)式建立的多元回歸方程:多元回歸系數(shù)的估計首先看只有兩個自變量的模型:我們?nèi)钥梢杂米钚《朔?,使得觀測的Y值和預(yù)測的Y值的差距的平方和最小。利用微積分,LetZ(a,b1,b2)=Σ(Y-a-b1X1-b2X2)2多元回歸系數(shù)的估計首先看只有兩個自變量的模型:LetZ(對三個未知參數(shù)a,b1,andb2求導(dǎo):對三個未知參數(shù)a,b1,andb2求導(dǎo):解方程:解方程:這種方法可以擴(kuò)展到任意多的自變量的模型。計算機(jī)可以直接給出估計的系數(shù)。這種方法可以擴(kuò)展到任意多的自變量的模型。三、回歸方程的解釋在任何情況下,a始終為當(dāng)所有自變量為0時的應(yīng)變量值(截距)斜率系數(shù)b1到bk表示在其他變量不變的情況下,相關(guān)的X增加一個單位,Y所對應(yīng)的變化。三、回歸方程的解釋在任何情況下,a始終為當(dāng)所有自變量為0對于方程:如果xi增加一個單位,即xi變?yōu)閤i+1,而其他自變量均保持不變,相應(yīng)有則y的變化幅度為對于方程:如果xi增加一個單位,即xi變?yōu)閤i+1,而其他自規(guī)范解讀方式(在其他變量不變的情況下,)xi平均變化一個單位,y平均相應(yīng)變化bi個單位規(guī)范解讀方式(在其他變量不變的情況下,)xi平均變化一個單位x及未包括進(jìn)方程中的其他與x有關(guān)的一切因素對y的總影響一元回歸系數(shù)多元回歸系數(shù)偏回歸系數(shù):除去方程中其他因素對y的共同影響后,某自變量對y的邊際影響回歸系數(shù)的意義x及未包括進(jìn)方程中的其他與x有關(guān)的一切因素對y的總影響一元回四、標(biāo)準(zhǔn)化回歸系數(shù)問題需要判別所考察的因素的重要程度解決將回歸系數(shù)標(biāo)準(zhǔn)化做法1、先將變量標(biāo)準(zhǔn)化,再計算2、利用回歸系數(shù)計算四、標(biāo)準(zhǔn)化回歸系數(shù)問題需要判別所考察的因素的重要程度解決將回變量每平均變化一個標(biāo)準(zhǔn)分?jǐn)?shù),y將平均變化個標(biāo)準(zhǔn)分?jǐn)?shù)變量每平均變化一個標(biāo)準(zhǔn)分?jǐn)?shù),第四節(jié)方程的解釋能力一、確定系數(shù)二、調(diào)整的確定系數(shù)三、多元相關(guān)系數(shù)四、方差分析第四節(jié)方程的解釋能力一、確定系數(shù)一、確定系數(shù)(0~1)回歸方程解釋的差異與用y均值解釋的差異之比模型中所有變量解釋y的變化占總變化的比例受奇異值影響散點(diǎn)圖一、確定系數(shù)(0~1)回歸方程解釋的差異與用y均值解釋的差異
預(yù)測與殘差
e=(Y-)Thesumofsquarederrors
我們通過對該項(殘差)最小化方法求得
aandbi.預(yù)測與殘差e=(Y-)Thesumof擬合優(yōu)度whereand擬合優(yōu)度where和前面一樣,是衡量Y的所有變異中由所有自變量的差異共同解釋的比例越高,模型擬合數(shù)據(jù)的程度就越好。當(dāng)加入新的變量時,只升不降。由于常常是隨著自變量數(shù)目的增加而增加,所以直接比較沒有太大的意義。和前面一樣,是衡量Y的所有變異中由所有自變量的二、調(diào)整的確定系數(shù)自變量個數(shù)樣本規(guī)模>(1:10)<(1:5)自變量個數(shù)樣本規(guī)模偏高二、調(diào)整的確定系數(shù)自變量個數(shù)樣本規(guī)模>(1:10)<(1:5三、多元相關(guān)系數(shù)R因變量觀測值和預(yù)測值之間的相關(guān)程度三、多元相關(guān)系數(shù)R四、方差分析y的總變差平方和回歸平方和余差平方和四、方差分析y的總變差平方和回歸平方和余差平方和檢驗統(tǒng)計推斷回歸方程回歸系數(shù)回歸系數(shù)的置信區(qū)間為什么不顯著?第五節(jié)回歸方程的檢驗和回歸系數(shù)的推斷統(tǒng)計檢驗統(tǒng)計推斷回回回歸系數(shù)的置信區(qū)間為什么不顯著?第五節(jié)回歸實質(zhì)假設(shè)計算H0:B1=B2=…=Bk=0=(BSS/k)/[ESS/(n-k-1)]在總體中,X1,…,Xk的變化都不引起Y的線性變化P與a比較,決定是否拒絕H0檢驗在a水平統(tǒng)計性顯著,并拒絕H0、接受H1我們有相當(dāng)大的把握斷定,統(tǒng)計量b1,…,bk不等于0不是由于抽樣誤差造成的。表述檢驗樣本y與x1,…,xk的線性關(guān)系是否顯著判斷能否肯定總體回歸系數(shù)中至少有一個不等于0一、回歸方程的顯著性檢驗實質(zhì)假設(shè)計算H0:B1=B2=…=Bk=0當(dāng)回歸方程檢驗顯著時,可以認(rèn)為回歸方程中至少有一個回歸系數(shù)是顯著的。但并不一定所有回歸系數(shù)都顯著?;貧w模型希望:保留最重要的變量,刪除不顯著的變量對每個變量的回歸系數(shù)進(jìn)行檢驗二、回歸系數(shù)的顯著性檢驗當(dāng)回歸方程檢驗顯著時,可以認(rèn)為回歸方程中至少有一個回歸系數(shù)是具體做法:TSigT
H0:Bj=0H1:Bj≠0具體做法:TH0:Bj=0三、回歸系數(shù)的置信區(qū)間回歸系數(shù)的統(tǒng)計檢驗只能說明Bj與0有顯著差別,并不能說明Bj的具體情況。用樣本回歸系數(shù)b及其標(biāo)準(zhǔn)誤,可以推斷Bj值的置信區(qū)間P(bj-ta/2sj<Bj回歸系數(shù)的統(tǒng)計檢驗只能說明Bj與0有顯著差別,并不能說明Bj的具體情況。用樣本回歸系數(shù)b及其標(biāo)準(zhǔn)誤,可以推斷Bj值的置信區(qū)間P(bj-sj<Bj<bj+sj)=1-a三、回歸系數(shù)的置信區(qū)間回歸系數(shù)的統(tǒng)計檢驗只能說明Bj與0有顯樣本量太小變量數(shù)太多Xj標(biāo)準(zhǔn)差過小自變量線性相關(guān)確實不相關(guān)非線性關(guān)系四、回歸系數(shù)不顯著的原因樣變量數(shù)太多Xj標(biāo)準(zhǔn)差過小自變量線性相關(guān)確實不相關(guān)非線性關(guān)系第六節(jié)虛擬變量的應(yīng)用什么變量需要虛擬?分類變量第六節(jié)虛擬變量的應(yīng)用什么變量需要虛擬?分類變量虛擬變量一個變量只有兩個可能值1or0.對于一個兩分的變量:gender:1.male2.female我們可以重新編碼1=maleand0=female.由此,gender就變成了一個虛擬變量,表示被訪者是否男性.虛擬變量一個變量只有兩個可能值1or0.對于一個兩分如何虛擬?二分變量(是、否)把二分狀態(tài)看作連續(xù)變化的過程將某一個分類變量(有n個選項)轉(zhuǎn)換成(n-1)個二分變量,以沒有進(jìn)入變量表達(dá)的那個類別為參照進(jìn)行解釋,說明不同類別間y取值的變化均值的意義是編碼為1的案例占樣本的比例如何虛擬?二分變量把二分狀態(tài)看作連續(xù)變化的過程將某一個分類變?yōu)槭裁匆诨貧w分析中引入虛擬變量?有時我們社會研究的樣本數(shù)據(jù)中觀察的個體可以分成不同的組別。組與組、或群體與群體間的在自變量和應(yīng)變量的平均數(shù)會有差異在這種情況下,不控制組別特征的回歸模型結(jié)果會導(dǎo)致所估計的偏回歸系數(shù)偏差。特別是,系數(shù)可能低估或者高估一個自變量對應(yīng)變量的影響強(qiáng)度。為什么要在回歸分析中引入虛擬變量?有時我們社會研究的樣本數(shù)據(jù)第七節(jié)多重共線性及其解決方案多元線性回歸的解釋方式:“在其他變量不變的前提下,xi平均變化一個單位y將平均變化bi個單位”如果xi與另一自變量存在高度相關(guān),則這種解釋不成立,因為“在其他變量不變的前提”不可能實現(xiàn)此即所謂的“多重共線性”第七節(jié)多重共線性及其解決方案多元線性回歸的解釋方式:“在其回歸方程整體顯著,但各個自變量都不顯著多重共線性的表現(xiàn)之一:自變量之間存在高度線性相關(guān)后果:影響回歸方程的有效性回歸預(yù)測結(jié)果將不可靠xi與y之間的關(guān)系不準(zhǔn)確回歸方程整體顯著,多重共線性的表現(xiàn)之一:自變量之間存在高度線鑒別多重共線性的思路:在自變量之間建立回歸方程,以該回歸方程的確定系數(shù)來判斷自變量之間的相關(guān)程度具體做法:假定有k個自變量,先以第一個自變量x1為因變量建立回歸方程,計算確定系數(shù)——若值較大,說明至少有一個自變量與x1相關(guān),也即存在共線性問題;按此方法依次建立回歸方程,根據(jù)確定系數(shù)的變化來判斷共線性問題鑒別多重共線性的思路:在自變量之間建立回歸方程,以該回歸方程檢查多重共線性容限度(tolerance)特征值和條件次數(shù)(eigen-valuesandconditionindexes)方差膨脹因子(varianceinflationfactor)以每個自變量作為因變量對其他自變量回歸得到的余差比例是容限度的倒數(shù)。表示所對應(yīng)的偏回歸系數(shù)的方差由于多重共線性而擴(kuò)大的倍數(shù)小于0.1,則認(rèn)為多重共線性嚴(yán)重大于10,則認(rèn)為多重共線性嚴(yán)重檢查多重共線性容限度(tolerance)特征值和條件次數(shù)(去掉與y相關(guān)較低,而與其他自變量相關(guān)高的變量去掉可以被其余自變量線性表出的變量增加樣本規(guī)模采用新的樣本數(shù)據(jù)利用先驗信息組合變量逐步刪除(逐步回歸方法即可消除此問題)變量變換補(bǔ)救辦法去掉與y相關(guān)較低,而與其他自變量相關(guān)高的變量去掉可以被其余自全部納入全部刪除向前回歸逐步回歸向后回歸選擇最優(yōu)回歸方程全部納入全部刪除向前回歸逐步回歸向后回歸選擇最優(yōu)回歸方程第八節(jié)計算機(jī)操作第八節(jié)計算機(jī)操作第九節(jié)研究實例社會意識的行動邏輯――性別不平等的現(xiàn)象學(xué)社會學(xué)解釋框架《浙江學(xué)刊》2006年第5期第九節(jié)研究實例社會意識的行動邏輯表3家務(wù)勞動時
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度智慧城市建設(shè)擔(dān)保協(xié)議3篇
- 運(yùn)動隊訓(xùn)練中的科技裝備與智能化管理
- 2025版商業(yè)綜合體物業(yè)商鋪裝修管理及維護(hù)服務(wù)協(xié)議書3篇
- 網(wǎng)絡(luò)信息搜索與評價能力的培養(yǎng)方案設(shè)計
- 小學(xué)數(shù)學(xué)課堂的科學(xué)實驗教學(xué)探討
- 2025年粵教新版選修6歷史下冊階段測試試卷含答案
- 二零二五年度離婚協(xié)議中夫妻共同財產(chǎn)分割及子女撫養(yǎng)協(xié)議范本6篇
- 2025年蘇人新版必修1歷史下冊月考試卷含答案
- 2025版無息醫(yī)療健康貸款合同書示例3篇
- 2025年浙教版選擇性必修三語文下冊階段測試試卷
- 2024年09月2024興業(yè)銀行總行崗測評筆試歷年參考題庫附帶答案詳解
- 山東省煙臺市招遠(yuǎn)市2024-2025學(xué)年九年級上學(xué)期期末考試英語(筆試)試題(含答案)
- 駱駝祥子讀書筆記一至二十四章
- 2025年方大萍安鋼鐵招聘筆試參考題庫含答案解析
- 2024年醫(yī)師定期考核臨床類考試題庫及答案(共500題)
- 2025年電力工程施工企業(yè)發(fā)展戰(zhàn)略和經(jīng)營計劃
- 2022年公務(wù)員多省聯(lián)考《申論》真題(安徽C卷)及答案解析
- 大型活動保安培訓(xùn)
- 2024年大學(xué)本科課程教育心理學(xué)教案(全冊完整版)
- 信息系統(tǒng)運(yùn)維服務(wù)類合同6篇
- 江蘇省七市2025屆高三最后一卷物理試卷含解析
評論
0/150
提交評論