《回歸分析》 課件 第3、4章 多元線性回歸、回歸診斷_第1頁
《回歸分析》 課件 第3、4章 多元線性回歸、回歸診斷_第2頁
《回歸分析》 課件 第3、4章 多元線性回歸、回歸診斷_第3頁
《回歸分析》 課件 第3、4章 多元線性回歸、回歸診斷_第4頁
《回歸分析》 課件 第3、4章 多元線性回歸、回歸診斷_第5頁
已閱讀5頁,還剩210頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸應(yīng)用回歸分析李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院1

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性目錄多元線性回歸模型參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)類別型自變量分段線性回歸實例分析小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院2

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性點球成金李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院3

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性電影《點球成金》講述了奧克蘭田徑棒球隊總經(jīng)理比利·比恩(BillyBeane)如何利用分析技術(shù)組建一支有競爭力的球隊的故事。這部電影是根據(jù)邁克爾·劉易斯2003

年出版的同名非小說類書籍《點球成金:贏得不公平游戲的藝術(shù)》改編1。1/

qinyn/BANA7038/moneyball.html李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院4

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性取因變量為回合數(shù)(runs,R),散點圖y

軸為因變量,x

軸為各自變量2:2/

qinyn/BANA7038/moneyball.html李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院5

/

105中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)

模型推斷化肥成分含量與農(nóng)作物產(chǎn)出關(guān)系某種化肥含氮、磷和鉀三種主要成分。為了研究該肥料三種成分不同含量對某種農(nóng)作物產(chǎn)量的影響,對每畝農(nóng)作物施用一定量的該種化肥,得到了該作物每畝收成以及該化肥各主要成分含量的數(shù)據(jù),如表1所示。李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院6

/

105中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)

模型推斷化肥成分含量與農(nóng)作物產(chǎn)出關(guān)系表1:某農(nóng)作物每畝收成與對應(yīng)施用化肥中氮、磷和鉀含量數(shù)據(jù)

氮含量(X1,單位:千克)磷含量(X2,單位:克)

0.798

10000.062鉀含量(X3,單位:千克)

30.098作物收成(Y

,單位:千克/畝)332.6241.90510527.58032.130355.7912.16811053.39429.476352.4673.60811580.22132.402383.8593.31212104.94931.783386.8693.98712631.64134.154409.3873.56013157.67532.994413.1295.33013684.94135.203438.5384.26414209.86934.454440.7725.20314737.58933.058446.0856.12715263.56735.016468.6546.60715791.73134.251474.2626.78316316.15236.695496.3498.19816842.49438.940524.1048.05517368.23135.296511.2138.37617895.01539.075542.6278.49018421.73637.222542.0859.86318948.28640.972575.7918.91319475.25041.055583.57512.61020001.47039.361592.589李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院7

/

105中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)

模型推斷化肥成分含量與農(nóng)作物產(chǎn)出關(guān)系圖1:氮、磷和鉀含量數(shù)據(jù)與農(nóng)作物產(chǎn)量三維圖。其中,(a)圖的自變量為氮、磷含量;(b)圖的自變量為氮、鉀含量;(c)圖為磷、鉀含量李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院8

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)類別型自變量分段線性回歸實例分析小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院9

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性引言李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院10

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性引言李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院11

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性模型簡介李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院12

/

105

(1)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性模型簡介李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院13

/

105稱

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性模型假定李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院14

/

105

(4)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性模型假設(shè)李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院15

/

105正態(tài)性假定(5)從而有模型(3)滿足(6)

(7)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性模型解釋李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院16

/

105為了對多元線性回歸模型以及對應(yīng)的回歸系數(shù)進(jìn)行解釋,使用服裝銷售研究中的員工薪資、宣傳費用和流動資金三個變量對服裝銷售量的影響這一實例,給出回歸方程的幾何解釋以及各回歸系數(shù)的實際含義。(8)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性模型解釋李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院17

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)類別型自變量分段線性回歸實例分析小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院18

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性最小二乘估計李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院19

/

105

(9)其中,

為離差平方和。(10)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性最小二乘估計李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院20

/

105利用式(10)對各參數(shù)求偏導(dǎo)并令其等于0,即(11)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性最小二乘估計李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院21

/

105有

(12)稱

(13)為經(jīng)驗回歸方程。多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性極大似然估計李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院22

/

105由式(7)有似然函數(shù)

取對數(shù)并分別對參數(shù)β

和σ2

求偏導(dǎo),并令其等于0

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性極大似然估計李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院23

/

105

(14)

模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.1李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院24

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性回歸擬合值與殘差李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院25

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性回歸擬合值與殘差李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院26

/

105

(18)稱(19)

(20)為回歸殘差向量。

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性回歸擬合值與殘差李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院27

/

105由式(17)有

則(21)因而有(22)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性回歸擬合值與殘差李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院28

/

105由式(11)可知,殘差滿足

(23)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性估計性質(zhì)李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院29

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院30

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院31

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院32

/

105由

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院33

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院34

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院35

/

105性質(zhì)5

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院36

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性估計性質(zhì)李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院37

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院38

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院39

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院40

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院41

/

105從而有

作變換,令

有故有

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院42

/

105

所以

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)類別型自變量分段線性回歸實例分析小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院43

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性引言李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院44

/

105

模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)F

檢驗李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院45

/

105

模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)F

檢驗李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院46

/

105類似于一元線性回歸檢驗,這里仍使用總離差平方和的分解式,即簡記為

(24)其中,進(jìn)而構(gòu)造F

檢驗統(tǒng)計量(25)

模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)F

檢驗李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院47

/

105表2:方差分析表模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)F

檢驗李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院48

/

105

模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)t

檢驗李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院49

/

105

(26)由性質(zhì)(6)有

(27)

(28)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)t

檢驗李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院50

/

105

(29)其中,

模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)t

檢驗李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院51

/

105

模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)偏F

檢驗李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院52

/

105

(30)

(31)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性擬合優(yōu)度李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院53

/

105類似于一元線性回歸模型,可以定義關(guān)于多元線性回歸模型的樣本決定系數(shù)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性擬合優(yōu)度李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院54

/

105(33)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性置信區(qū)間李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院55

/

105由性質(zhì)(6)及式(28),可得

(34)

(35)

模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.2李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院56

/

105例3.1

中已經(jīng)得到了某農(nóng)作物每畝產(chǎn)量與某化肥氮、磷和鉀含量之間的線性估計方程。這里將對模型以及各回歸系數(shù)的估計結(jié)果分別進(jìn)行F檢驗和t

檢驗,并計算相應(yīng)的擬合優(yōu)度。檢驗結(jié)果見表3。表3:參數(shù)估計以及模型推斷結(jié)果模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.2李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院57

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)類別型自變量分段線性回歸實例分析小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院58

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性引言李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院59

/

105在多元線性回歸模型的使用場景中,常常會遇到自變量之間具有不同度量單位的情形。例如,對于距離這一變量而言,有的數(shù)據(jù)記錄采用的是以米為單位,而有的則可能是以千米為單位,再如對于商品價格而言,有的數(shù)據(jù)記錄采用的是以人民幣元為單位,也有的可能是以美元為單位。在分析類似數(shù)據(jù)時,得到的結(jié)果可能會不一致,對分析結(jié)果的比較也會帶來影響,因此需要對數(shù)據(jù)進(jìn)行預(yù)處理,例如:中心化(centralization)和標(biāo)準(zhǔn)化(normalization)。多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院60

/

105記(36)則經(jīng)驗回歸方程(13)等價于

(37)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性圖2:數(shù)據(jù)中心化效果示意圖李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院61

/

105中心化稱式(37)為中心化經(jīng)驗回歸方程。中心化經(jīng)驗回歸方程中的常數(shù)項為

0,中心化是將樣本中心移到坐標(biāo)原點,因而方程中沒有截距項,而其他回歸系數(shù)的最小二乘估計值則保持不變。顯然,這是因為坐標(biāo)的平移變換不會改變直線的斜率,圖2為數(shù)據(jù)中心化處理的示意圖。多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性標(biāo)準(zhǔn)化李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院62

/

105在多元線性回歸模型中,由于自變量X1,·

·

·

,Xp

所用單位大多不同,數(shù)據(jù)的大小差異往往很大,這就不利于在同一標(biāo)準(zhǔn)上進(jìn)行比較。對于中心化處理后的數(shù)據(jù)可以進(jìn)一步進(jìn)行標(biāo)準(zhǔn)化處理,從而消除變量量綱不同和數(shù)量級差異所帶來的影響。樣本數(shù)據(jù)標(biāo)準(zhǔn)化處理公式為(38)其中,

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性標(biāo)準(zhǔn)化李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院63

/

105標(biāo)準(zhǔn)化后的經(jīng)驗回歸方程為

(39)

標(biāo)準(zhǔn)化回歸系數(shù)與普通最小二乘回歸系數(shù)之間存在如下關(guān)系式(40)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性標(biāo)準(zhǔn)化李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院64

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性標(biāo)準(zhǔn)化圖3:數(shù)據(jù)標(biāo)準(zhǔn)化示意圖.標(biāo)準(zhǔn)化處理使原數(shù)據(jù)的取值范圍以及對應(yīng)擬合直線斜率等信息都發(fā)生了改變李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院65

/

105模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.3李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院66

/

105觀察例3.1中的數(shù)據(jù)(見下表)可以發(fā)現(xiàn)磷元素的含量從數(shù)值上看明顯大于氮和鉀的含量,這是由于單位不同引起的。

表4:某農(nóng)作物每畝收成與對應(yīng)施用化肥中氮、磷和鉀含量數(shù)據(jù)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.3李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院67

/

105表5:某農(nóng)作物產(chǎn)量與對應(yīng)施用化肥中氮、磷和鉀含量標(biāo)準(zhǔn)化數(shù)據(jù)123模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.3李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院68

/

105利用多元線性回歸模型再次對表5中標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行建模,得到經(jīng)驗回歸方程

由此可以看出,標(biāo)準(zhǔn)化回歸系數(shù)使變量的相對重要性具有了很好的可比較性。數(shù)據(jù)標(biāo)準(zhǔn)化處理過程中包含了數(shù)據(jù)中心化過程,這對應(yīng)了利用標(biāo)準(zhǔn)化數(shù)據(jù)所得到的經(jīng)驗回歸方程中沒有截距項這一事實。多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)類別型自變量分段線性回歸實例分析小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院69

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性相關(guān)陣?yán)顡P/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院70

/

105

(41)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性偏決定系數(shù)和偏相關(guān)系數(shù)李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院71

/

105

,

(42)

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性偏相關(guān)系數(shù)李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院72

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性偏相關(guān)系數(shù)與簡單相關(guān)系數(shù)在此用一個例子來說明簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的關(guān)系:一種商品的需求既受收入水平的影響又受其價格的影響。按照經(jīng)濟(jì)學(xué)理論,在一定收入水平下,該商品的價格越高,商品的需求量就越小。也就是說,需求與價格之間應(yīng)當(dāng)是負(fù)相關(guān)關(guān)系??墒?,在現(xiàn)實經(jīng)濟(jì)生活中,由于收入和價格常常都有不斷提高的趨勢,如果不考慮收入對需求的影響,僅僅利用需求和價格的時間序列數(shù)據(jù)去計算簡單相關(guān)系數(shù),就有可能得出價格越高需求越大的錯誤結(jié)論。在多元回歸中,簡單相關(guān)系數(shù)只是衡量兩個變量的局部相關(guān)性,而偏相關(guān)系數(shù)真正反映了因變量與自變量、自變量與自變量之間的相關(guān)性。在后續(xù)的逐步回歸剔除某個自變量時,也可以綜合偏相關(guān)系數(shù)來考慮。李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院73

/

105模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.4李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院74

/

105利用例3.1

中的數(shù)據(jù)計算氮、磷、鉀元素含量和該農(nóng)作物產(chǎn)量相關(guān)陣,并計算相應(yīng)的偏決定系數(shù)和偏相關(guān)系數(shù),結(jié)果見表6。表6:氮、磷、鉀元素含量和某農(nóng)作物產(chǎn)量相關(guān)陣模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.4李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院75

/

105

模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.4李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院76

/

105由以上分析,本例可得如下結(jié)論:由于氮、磷、鉀含量分別與該農(nóng)作物產(chǎn)量之間的相關(guān)系數(shù)都大于0.9,表明這些自變量與農(nóng)作物產(chǎn)量具有顯著的正的線性相關(guān)關(guān)系。由偏決定系數(shù)值可以看出,各自變量與因變量之間具有顯著的線性相關(guān)關(guān)系,偏相關(guān)關(guān)系值表明各自變量與因變量之間具有顯著的線性正相關(guān)性。由此可能發(fā)現(xiàn),施用含氮、磷、鉀元素的肥料越多該農(nóng)作物的產(chǎn)量越高。多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)類別型自變量分段線性回歸實例分析小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院77

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性類別型自變量

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院78

/

105中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)

模型推斷例3.5(兩類別的定性協(xié)變量)

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院79

/

105模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.5反映性別屬性的啞變量為

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院80

/

105

模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.5

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院81

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多類別的定性協(xié)變量

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院82

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多類別的定性協(xié)變量再如,考慮建立個人受教育水平與個人教育支出之間的回歸模型,若教育水平被分為高中以下、高中、大學(xué)及其以上三個層次,這時僅需要引人兩個啞變量:

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院83

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多類別的定性協(xié)變量

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院84

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)類別型自變量分段線性回歸實例分析小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院85

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性分段線性回歸在經(jīng)濟(jì)學(xué)中常有這樣的情況,一些經(jīng)濟(jì)變量之間的關(guān)系會在解釋變量達(dá)到某個臨界值時發(fā)生突變。對于這類問題,研究者發(fā)現(xiàn)使用線性回歸模型擬合后的殘差不具隨機(jī)性,其中仍存在系統(tǒng)性信息。研究者可以利用虛擬變量,通過分段線性回歸進(jìn)行處理。李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院86

/

105模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.6

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院87

/

105模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.6

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院88

/

105模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.6

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院89

/

105模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.6

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院90

/

105

模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.6

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院91

/

105

模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型

參數(shù)的估計與性質(zhì)例3.6

李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院92

/

105圖5:日平均氣溫與居民生活用電量間的分段回歸擬合直線多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)類別型自變量分段線性回歸實例分析小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院93

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性實例分析本節(jié)以高性能水泥的混凝土抗壓強度數(shù)據(jù)分析為例,對多元線性回歸模型的一般步驟進(jìn)行介紹。由于高性能混凝土的水泥含量、高爐渣含量、飛灰含量、水的含量、高效減水劑含量、粗骨料含量和細(xì)骨料含量等8個因素(單位:kg/m3)對高性能水泥的混凝土抗壓強度有關(guān)。使用的數(shù)據(jù)共包含9

個變量1030

個樣本觀測值,變量由上述提到的8

個自變量以及1

個因變量(混凝土抗壓強度)組成。使用的數(shù)據(jù)來自于葉怡成[2]的相關(guān)研究,可以從UCI

數(shù)據(jù)庫中下載,網(wǎng)址為:/ml/datasets/

Concrete+Compressive+Strength。李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院94

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性實例分析

圖6:高性能混凝土成對變量散點圖李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院95

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性實例分析第二步是擬合模型。利用R軟件采用多元線性回歸模型擬合上述數(shù)據(jù),擬合結(jié)果如下表9所示。從表中可以得到模擬方程為李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院96

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性實例分析表9:多元線性回歸模型擬合結(jié)果表李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院97

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性實例分析第三步是模型診斷。若取顯著性水平為α

=0.1,從表中可得Fstat

=204.300,其對應(yīng)的

p

<2.00

×10?16

=0.1,則拒絕H0,表明使用多元線性回歸模型擬合該數(shù)據(jù)是可取的。各自變量t

檢驗所對應(yīng)的p

值都小于給定的顯著性水平α,表明各自變量對因變量具有顯著的影響。從實際意義上看,自變量的8個因素分別與高性能水泥的混凝土抗壓強度具有顯著的相關(guān)關(guān)系。結(jié)合各變量的系數(shù)可以看出,在一定限度內(nèi)含水量的大小與混凝土抗壓強度成反比而其他因素則與混凝土抗壓強度成正比。李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院98

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性實例分析李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院99

/

105利用Q-Q

圖對殘差項的正態(tài)性進(jìn)行檢驗,可以從圖5中看出,殘差項的Q-Q

圖大致在一條直線上,因而可以判斷隨機(jī)誤差項滿足正態(tài)性假定。圖7:隨機(jī)誤差項正態(tài)性檢驗Q-Q

圖多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性實例分析值得注意的是,實際數(shù)據(jù)往往具有不可忽略的“缺陷”,例如不滿足多元線性模型的基本假定:正態(tài)性,獨立同分布性,自變量之間不相關(guān)性,樣本量足夠大等。此時,前文提到的基本步驟的每一步可能都會遇到阻礙,這時,只有解決這些問題,才能繼續(xù)下一步。對于相應(yīng)可能出現(xiàn)的問題以及相應(yīng)的處理方法,將會在后續(xù)章節(jié)中一一學(xué)習(xí)。李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院100

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性多元線性回歸模型參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)類別型自變量分段線性回歸實例分析小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院101

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化

相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院102

/

105

多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性小結(jié)與評注另一方面,樣本量的多少也會影響到參數(shù)估計。當(dāng)樣本量相較于變量個數(shù)較小時,設(shè)計矩陣的列滿秩假定可能不再滿足,此時同樣無法使用普通的最小二乘估計參數(shù)。進(jìn)一步,當(dāng)自變量個數(shù)不斷增大,達(dá)到高維甚至超高維時,傳統(tǒng)的參數(shù)估計方法以及參數(shù)顯著性的檢驗方法也不再適用。這時,一些新的解決方法應(yīng)運而生,在后續(xù)的學(xué)習(xí)中將對這些問題的解決方法進(jìn)行學(xué)習(xí)。李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院103

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性參考文獻(xiàn)周紀(jì)薌.回歸分析.上海:華東師范大學(xué)出版社,1993.Yeh

IC.

Modeling

ofstrength

of

high-performance

concrete

using

arti- ficial

neural

networks.

CementandConcrete

research,

28(12):

1797– 808,

1998.袁建文,李宏,王克林.劑量經(jīng)濟(jì)學(xué)理論與實踐.北京:清華大學(xué)出 版社,2012.李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院104

/

105多元線性回歸模型

參數(shù)的估計與性質(zhì)模型推斷中心化與標(biāo)準(zhǔn)化相關(guān)陣與偏相關(guān)系數(shù)

類別型自變量

分段線性謝謝!李揚/林存潔/王菲菲/孫韜/廖軍多元線性回歸中國人民大學(xué)統(tǒng)計學(xué)院105

/

105模型的診斷異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX歸分析之緒論應(yīng)用

歸分析李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院106

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX目錄歸模型的診斷異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX變換廣義最小二乘估計小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院107

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX高斯-馬爾可夫李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院108

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX最小二乘法是一種使誤差平方和達(dá)到最小以尋求估計值的方法,最常見于線性模型。用最小二乘法得到的估計,叫做最小二乘估計。1805年,法國數(shù)學(xué)家勒讓德在他的著作《計算彗星軌道的新 方法》的附錄中第一次公開提出了最小二乘法。德國數(shù)學(xué)家高斯對最小二乘理論的貢獻(xiàn)除了著名的正態(tài)誤差 理論之外,還有高斯-馬爾可夫定理。他聲稱從1799年起就 開始使用最小二乘法,導(dǎo)致了當(dāng)時兩大數(shù)學(xué)家關(guān)于最小二乘 法發(fā)明優(yōu)先權(quán)之爭,類似于牛頓和萊布尼茨關(guān)于微積分發(fā)明 權(quán)的爭論,至今都沒有定論。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院109

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX高斯-馬爾可夫定理是最小二乘理論中最重要的理論結(jié)果,它 從統(tǒng)計學(xué)的角度肯定了最小二乘法的合法性,在此之前,最 小二乘估計只是看上去合理且計算簡便的一種算法。但是實際數(shù)據(jù)有很多情況不滿足高斯-馬爾可夫定理的條件,這一點在二十世紀(jì)中期得到了學(xué)者的廣泛關(guān)注。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院110

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX高斯-馬爾可夫條件李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院111

/

110

異常值和強影響點BOX-COX歸模型的診斷

異方差的診斷及其處理

自相關(guān)的診斷及其處理例1.居民收入和消費的關(guān)系運用截面數(shù)據(jù)研究消費和居民收入的關(guān)系。用Yi

表示第i

戶的消費額,用Xi

表示第i

戶的收入,一個簡單的消費模型為Yi

=

β0

+

β1Xi

+

εi

,

i

=

1,

...,

n.將家庭以收入數(shù)據(jù)按照一定方式進(jìn)行劃分會發(fā)現(xiàn):低收入組家庭用于購買生活必需品的比例相對較大,且購買差異性較小。高收入組家庭購買行為差異很大,自由支配的收入更多意味著更多的購買選擇,消費的分散程度很大。反映在消費模型上則為εi

對回歸直線即均值的偏離程度存在差異,從而出現(xiàn)異方差。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院112

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX例2.經(jīng)濟(jì)模型經(jīng)濟(jì)變量的滯后性會給序列帶來自相關(guān)性。許多經(jīng)濟(jì)變量都會產(chǎn)生滯后影響,

例如物價指數(shù)、基建投 資、國民收入、消費、貨幣發(fā)行量等都有一定的滯后性,例 如前期消費額對后期消費額一般會有明顯的影響。經(jīng)濟(jì)變量的滯后有時表現(xiàn)出一種不規(guī)則的循環(huán)波動,當(dāng)經(jīng)濟(jì) 處于衰退的低谷時,經(jīng)濟(jì)擴(kuò)張期隨之開始,這時大多數(shù)經(jīng)濟(jì) 時間序列上升得快一些。在經(jīng)濟(jì)擴(kuò)張期,經(jīng)濟(jì)時間序列內(nèi)部 有一種內(nèi)在的沖力,序列一直上升到循環(huán)的頂點,在頂點時 刻經(jīng)濟(jì)收縮隨之開始。因此在這樣的時間序列中,序列觀測值之間的相關(guān)現(xiàn)象是很自然的。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院113

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX歸模型的診斷異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX變換廣義最小二乘估計小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院114

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX殘差分析在利用最小二乘估計得到參數(shù)估計值β?0和β?1后,可以通過下式得到殘差ei

=

Yi

?

β?0

?

β?1Xi

.由于高斯—馬爾可夫條件都是關(guān)于誤差項的,所以研究者自 然地可以從分析誤差項的“估計量”——殘差的角度來考察數(shù) 據(jù)是否滿足假設(shè)。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院115

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX考慮線性

歸模型Y

=

+

ε,(1)??1?n若用X

,...,X

表示X

的n個行向量,定義第i

次觀測的殘差?i

i

i?e

=

Y

?

X

β,

i

=

1,

...,

n將殘差ei

看作誤差εi

的一次觀測值,如果模型(1)正確,ei

應(yīng)具有εi

的一些特征。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院116

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COXi記Y?

=X

β?,

稱Y?

為擬合值向量,

稱其第i

個分量Y?i

=X

?β?為第i

個擬合值,則Y?

可以寫成Y?

=

X

(X

?X

)?1X

?Y

=

HY

,其中H

=X

(X

?X

)?1X

?,文獻(xiàn)中通常稱之為帽子矩陣。容易驗證,帽子矩陣H滿足H?

=

H,

H2

=

H,即帽子矩陣是一個對稱冪等陣。利用帽子矩陣H,殘差向量e可表示為e

=

Y

?

Y?

=

(I

?

H)Y

=

(I

?

H)ε.(2)李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院117

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX定理考慮線性

歸模型(1),則由(2)式所定義的殘差向量具有如下性質(zhì):E

(e)

=

0,

Cov

(e)

=

σ2(I

?

H);若進(jìn)一步假設(shè)誤差服從正態(tài)分布,即ε

~N(0,σ2I

),則e

N(0,

σ2(I

?

H)).李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院118

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX

李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院119

/

110

歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX根據(jù)正態(tài)分布的性質(zhì),若隨機(jī)變量U

~N(μ,

σ2),則P(μ

?

<

U

<

μ

+

2σ)

=

95.4%.因此學(xué)生化殘差具有如下性質(zhì):當(dāng)μ

=0,σ

=1時,大約應(yīng)有95.4%的ri

落在區(qū)間[?2,2]中。擬合值向量Y?

與殘差e相互獨立,因而與學(xué)生化殘差r1,...,rn也獨立。如果以擬合值y?i

為橫軸,ri

為縱軸,那么平面上的點(y?i

,ri

),i

= 1,...,n大致應(yīng)落在寬度為4的水平帶|ri|≤2區(qū)域內(nèi),且不呈 現(xiàn)任何趨勢。這種以殘差為縱軸,以擬合值或其它量為橫軸的圖稱為殘差圖,這是回歸診斷的一個重要工具。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院120

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX殘差示意圖李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院121

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX

李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院122

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX本章介紹了

歸模型隨機(jī)誤差項違背基本假設(shè)的診斷與修正方法,以及異常值的識別和處理。隨機(jī)誤差序列方差不同或存在相關(guān),分別對應(yīng)了違背基本假設(shè)的異方差性和自相關(guān)現(xiàn)象。殘差圖分析是診斷兩者最直觀的方式,但比較粗糙。更準(zhǔn)確的診斷方法包括:借助等級相關(guān)系數(shù)檢驗或其他方法 來診斷是否具有異方差性;通過自相關(guān)系數(shù)或DW檢驗等方 法考察序列相關(guān)是否存在。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院123

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX當(dāng)根據(jù)某種檢驗方法認(rèn)為存在異方差時,可以用自變量的冪函數(shù)作為權(quán)函數(shù),作加權(quán)最小二乘

歸。但是加權(quán)最小二乘估計并不能消除異方差,只是能夠消除或減弱異方差的不良影響;研究者們還常常考慮對因變量進(jìn)行方差穩(wěn)定變換,使得對變換過后的數(shù)據(jù),誤差方差能夠近似相等,即方差比較穩(wěn)定;要注意的是方差穩(wěn)定變換在改變誤差項方差的同時,也會改變誤差項的分布和

歸函數(shù)的形式。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院124

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COXDW檢驗是檢驗隨機(jī)誤差項自相關(guān)性最常用的一種方法,但DW檢驗有一些局限性。不僅因其不適合隨機(jī)項具有高階序列相關(guān)的檢驗,還因為DW檢驗有兩個不能確定結(jié)果的區(qū)域。當(dāng)模型存在序列相關(guān)時,常通過迭代法和差分法消除自相關(guān)性。要注意的是用迭代法處理序列相關(guān)并不總是有效。一階差分法是自相關(guān)系數(shù)ρ

=1時的迭代法,因此只有當(dāng)ρ

=1或者接近1時,差分法的效果才會好。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院125

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX異常值的識別和處理是優(yōu)化

歸方程的必要部分。通過散點圖可以簡單直觀地對某些點進(jìn)行甄別。更準(zhǔn)確地方法,則是通過計算刪除學(xué)生化殘差、杠桿值、Cook統(tǒng)計量等對異常值進(jìn)行判斷。識別出異常值后,需要對異常值產(chǎn)生的原因進(jìn)行診斷,不能簡單地剔除異常值。有時異常值是正確的觀測,出現(xiàn)的原因可能是由于模型遺漏 了關(guān)鍵的自變量,或模型設(shè)定錯誤,這時將為模型的修正帶 來啟發(fā)。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院126

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX歸模型的診斷異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX變換廣義最小二乘估計小結(jié)與評注李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院127

/

110編號

Y

(億元)X

(萬畝)

編號

Y

(億元)

X

(萬畝)農(nóng)作物產(chǎn)值播種面積農(nóng)作物產(chǎn)值播種面積116.31907.516183.6517729.2217.14873.217146.7911061.53125.2413159.218129.6311304.7442.245928.119154.289166.2540.286834.42061.246821.7684.475495.521206.517779.6770.76055.22244.374701.38101.6712694.62351.796036.1916.831018.5243.53316.510211.5112770.92559.457016.5111016542.72637.295252.512155.8712244.3276.33761.71349.723601.52810.071235.21469.78158.12944.784275.115255.9216564.5異常值和強影響點BOX-COX歸模型的診斷

異方差的診斷及其處理

自相關(guān)的診斷及其處理農(nóng)作物種植業(yè)產(chǎn)值與播種面積關(guān)系表

1:1986

29

個省市自治區(qū)農(nóng)作物種植業(yè)產(chǎn)值和農(nóng)作物播種面積數(shù)據(jù)李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院128

/

110歸模型的診斷

異方差的診斷及其處理

自相關(guān)的診斷及其處理

異常值和強影響點BOX-COX1986年29個省市自治區(qū)農(nóng)作物種植業(yè)產(chǎn)值和農(nóng)作物播種面積數(shù)據(jù)如表所示,以農(nóng)作物種植業(yè)產(chǎn)值作為因變量Y

,以農(nóng)作物播種面積作為自變量X

,建立一元線性

歸模型。首先利用普通的最小二乘估計得到經(jīng)驗

歸模型Y?

=

?5.661

+

0.012X

.其次做殘差與自變量農(nóng)作物播種面積的散點圖如下所示,可以發(fā)現(xiàn)有明顯的異方差問題。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院129

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX異方差性產(chǎn)生的原因模型設(shè)定錯誤常導(dǎo)致異方差,模型設(shè)定主要包括變量的選擇。模型遺漏關(guān)鍵解釋變量常導(dǎo)致異方差,此時隨機(jī)誤差項、異方差的產(chǎn)生與解釋變量密切相關(guān)。設(shè)正確模型的形式為Yi

=β0

+β1Xi1

+β2Xi2

+β3Xi3

+εi

,但實際采用的是Yi

=

β0

+

β1Xi1

+

β2Xi2

+

ui

,即略去了解釋變量X3。當(dāng)X3與X1,X2之間存在相關(guān)性或某種函數(shù)關(guān)系時,其影響將體現(xiàn)在誤差項中。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院130

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX

李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院131

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX異方差性的影響當(dāng)

歸模型出現(xiàn)異方差時,如果仍用OLS估計來估計未知參數(shù),將引起不良后果。參數(shù)的OLS估計仍是無偏的,但不再是最小方差線性無偏估計(BLUE)。普通最小二乘估計的無偏性僅依賴于解釋變量非隨機(jī)與隨機(jī) 誤差項均值為0的假定,而其為BLUE則需要高斯—馬爾可夫 條件均滿足。本章廣義最小二乘估計這一節(jié)將介紹當(dāng)異方差存在時,比OLS更 有效的線性無偏估計。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院132

/

110歸模型的診斷

異方差的診斷及其處理自相關(guān)的診斷及其處理異常值和強影響點BOX-COX

?

將不再服從t分布,并且即使擴(kuò)大樣本量也不能解決這個問題。類似地,F(xiàn)

統(tǒng)計量不再服從F

分布。因此,異方差的存在使高 斯-馬爾可夫假定下進(jìn)行的假設(shè)檢驗不再有效,檢驗結(jié)果不再 值得信任。李揚/林存潔/王菲菲/孫韜/廖軍歸分析之緒論中國人民大學(xué)統(tǒng)計學(xué)院133

/

110歸模型的診斷異方差的診斷及其處理自

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論