




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Linear regression 直線回歸 第十一章第十一章第一節(jié)第一節(jié) 內(nèi)容 ?概述 ?直線回歸方程的建立 ?回歸系數(shù)和回歸方程的意義及性質(zhì) ?回歸系數(shù)的假設(shè)檢驗(yàn) ?應(yīng)變量總變異的分解 ?回歸問(wèn)題的方差分析 ?直線回歸的區(qū)間估計(jì) ?兩個(gè)斜率的比較 ?兩條回歸直線的合并 ?過(guò)定點(diǎn)的直線回歸 ?直線回歸與直線相關(guān)的區(qū)別及聯(lián)系 ?回歸分析的正確應(yīng)用 11.1 概述 ? Y 因變量,響應(yīng)變量 (dependent variable, response variable) ? X 自變量,解釋變量 (independent variable, explanatory variable) ?直線回歸的
2、形式: bXaY? ? Regression 釋義 n=1078單位:英寸 x= 68 y=69 x1=72 y1=71 x2=64 y2=67 11.1 直線回歸方程的建立 ?最小二乘法(least square estimation) XX XY l l XX YYXX b? ? ? ? ? ? 2 )( )( XbYa? bXaY? ? 例:某醫(yī)院欲研究?jī)和捏w重與體表面積的關(guān)系,測(cè) 量了10名3歲男童體重與體表面積,數(shù)據(jù)見(jiàn)下表 編號(hào) X (X,kg)Y (Y,10 3cm2) 111.05.283 211.85.299 312.05.358 412.35.292 513.15.602
3、613.76.014 714.45.830 814.96.102 915.26.075 1016.06.411 合計(jì) 133.457.266 111213141516 5.0 5.5 6.0 6.5 10名3歲男童體重與體表面積的直線回歸 體重與體表面積的回歸 9396. 55439. 19040.24 7266. 544.13 ? ? XYYYXX lll Y X )/10(2385. 0 9040.24 9396. 5 23 kgcm l l b XX XY ? XY2385. 05212. 2 ? ? 5212. 20.238513.44-5.7266?a 回歸直線的繪制 ?計(jì)算不太接近
4、的兩點(diǎn)的Y值: ?X=12kg時(shí) Y=2.5212+0.2385 12=5.3832(10 3cm2) ?X=15kg時(shí) Y=2.5212+0.2385 15=6.0987(10 3cm2) XY2385. 05212. 2 ? ? 10名3歲男童體重與體表面積回歸圖 111213141516 5.0 5.5 6.0 6.5 體重(kg),X 體 表 面 積 Y (10 3cm2) XY2358. 05211. 2 ? ? ? 11.3 回歸系數(shù)和回歸方程的意義及性質(zhì) ?b 的意義 ?a 的意義 ?的意義 ?的意義 ?的意義 bXaY? ? Y Y ? ? ? ? n i ii YY 1 2
5、? ? Y b 的意義 ?斜率(slope) ?2.5212+ 0.2385X 體重每增加1 kg, 則體表面積平均增加0.2385(10 3cm2) b的單位為 (Y的單位/X的單位) Y ? a 的意義 bXaY? ? ?a截距(intercept, constant) ?X=0 時(shí),Y的估計(jì)值 ?a的單位與Y值相同 ?當(dāng)X可能取0時(shí),a才有實(shí)際意義。 估計(jì)值的意義 ?X=11時(shí), =5.145, 即體重為 11kg 的三歲女童,其平均體表面積之 估計(jì)為 5.145 (10 3cm2); ?X=15時(shí), =6.099, 即體重為 15kg 的三歲女童,其平均體表面積之 估計(jì)為 6.099(
6、10 3cm2). ?給定X時(shí),Y的估計(jì)值。 ?當(dāng)時(shí), Y ? Y ? Y ? XX ?YY ? ? 由體重(kg)估計(jì)體表面積(10 3cm2 ) XYY的估計(jì)值 (體重,kg)(體表面積) 11.05.2835.145 11.85.2995.336 12.05.3585.383 12.35.2925.455 13.15.6025.646 13.76.0145.789 14.45.8305.956 14.96.1026.075 15.26.0756.146 16.06.4116.337 的意義YY ? ? YY ? ? ?為殘差:點(diǎn)到直線的縱向距離。 111213141516 5.0 5.5
7、 6.0 6.5 ? 殘差平方和 (residual sum of squares). ? 綜合表示點(diǎn)距直線的距離。 ? 在所有的直線中,回歸直線的殘差平方和是最小的。 (最小二乘) ? ? 的意義? ? 2 ) ? (YY YY n YY YY? ? ? ? ? ? ? ? ? 1 0 ? XX XY YY l l lYY 2 2 ? ? ? 回歸直線的有關(guān)性質(zhì) (1)直線通過(guò)均點(diǎn) (2)直線上方各點(diǎn)到直線的縱向距離之和 = 直線下方各點(diǎn)到直線的縱向距離之和 即: (3)各點(diǎn)到該回歸線縱向距離平方和較到其 它任何直線者為小。 ? ?0) ? (YY ? ? ? 22 ? bXaYYY ),(
8、YX ? 11.4 回歸系數(shù)的假設(shè)檢驗(yàn)回歸系數(shù)的假設(shè)檢驗(yàn) 回歸系數(shù)為0,則回歸關(guān)系不存在。 H0:總體回歸系數(shù)為0,? =0 ; H1 :總體回歸系數(shù)不為 0,?0; ?=0.05 。 回歸系數(shù)的回歸系數(shù)的 t 檢驗(yàn)檢驗(yàn) ? 2 ? 2 . ? ? ? ? ? ? n YY s l s s XY XX XY b 2 0 ? ? ?n s b t b b ? , 體重與體表面積回歸系數(shù)的假設(shè)檢驗(yàn) ? H 0:總體回歸系數(shù) ?0,即體重與體表面積無(wú)回歸關(guān)系; ? H 1:總體回歸系數(shù) ?0,即體重與體表面積有回歸關(guān)系。 ? ?=0.05 。 ? 0.0001P 8, ,435. 9 02528.
9、0 2385. 0 02528. 0 9040.24 1262. 0 1262. 0 810 127318. 0 ,127318. 0 ? . 2 ? ? ? ? ? ? vt s sYY b b XY 體重與體表面積間存在回歸關(guān)系。 回歸系數(shù)與相關(guān)系數(shù)的假設(shè)檢驗(yàn) rb tt ? 結(jié)果等價(jià)。 ? 11.5 因變量總變異的分解 X P (X,Y) Y Y )( YY? ? )( ? ?YY Y )( YY ? ? Y Y的總變異分解 ?未引進(jìn)回歸時(shí)的總變異: (sum of squares about the mean of Y) ?引進(jìn)回歸以后的變異 (剩余): (sum of squares
10、 about regression) ?回歸的貢獻(xiàn),回歸平方和: (sum of squares due to regression) ? ? 2 )(YY ? ? ? 2 )(YY ? ? ? 2 )(YY Y的總變異分解 ? 22 2 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?YYYYYY ?;乜?SSSSSS? 剩回總 ? 總 回歸 決定系數(shù) SS SS r ? 2 YYYYYY lrlrl 22) 1(? YY lYY? ? 2 )( ? ? YY lrYY)1() ? ( 22 ? ? ? YY lrYY 22 )( ? 剩余標(biāo)準(zhǔn)差 ? 2 ? 2
11、 ? ? ? ? ? n YY s XY (1) 扣除了X的影響后Y方面的變異; (2) 引進(jìn) 回歸方程后, Y方面的變異。 ? 11.6 回歸問(wèn)題的方差分析 前面應(yīng)變量總變異的分解與方差分析中 方差的分解原理相同,因而,X對(duì)Y的影 響是否有統(tǒng)計(jì)學(xué)意義,或X與Y的回歸關(guān) 系是否成立,可以進(jìn)行方差分析 例11.2 對(duì)例11.1所建方程進(jìn)行方差分析。 ?H0:體重與體表面積間無(wú)直線回歸關(guān)系; H1 :體重與體表面積間有直線回歸關(guān)系。 ?=0.05。 lXX=24.9040,lYY=1.5439,lXY=5.9396,SS總= lYY=1.5439, 根據(jù)式(11.6) SS剩= 1.5439-5.
12、93962/24.9040=0.1273 根據(jù)(11.12): SS回= SS總-SS剩=1.5439-0.1273=1.4166 變異來(lái)源 SS?MSF 回 歸1.416611.416689.01 剩 余0.127380.0159 總變異1.543990.1715 表11.2 方差分析表 得F=89.01,今?1=1,?2=8,查附表4 F界值表,得P0.01, 按?=0.05水準(zhǔn)拒絕H0,接受H1,故可認(rèn)為3歲男童的體重與 體表面積之間有線性回歸關(guān)系 11.7 回歸問(wèn)題的區(qū)間估計(jì) ?回歸系數(shù)的可信區(qū)間估計(jì) ?估計(jì)值的可信區(qū)間估計(jì) ?個(gè)體Y值的容許區(qū)間估計(jì) ? Y 復(fù)習(xí) ?均數(shù)的可信區(qū)間:
13、均數(shù)?界值標(biāo)準(zhǔn)誤 (4.3,4.4) ?個(gè)體的容許區(qū)間(參考值范圍): 均數(shù)?界值標(biāo)準(zhǔn)差 (2.37) 11.7.1 總體回歸系數(shù) ? 的可信區(qū)間估計(jì) ?根據(jù) t 分布原理估計(jì): ?0.2385+/-2.3060.02528 0.18020.2968(10 3cm2/kg) 2 0 ? ? ?n s b t b b ? , bn stb 2, ? ? ? 11.7.2 的可信區(qū)間估計(jì) Y ? ? 樣本總體 Y的總平均 給定X時(shí)Y的平均 (Y 的條件均數(shù)) ? ? Y Y Y ? ? ? ? ? ? ? ? ? ? ? 2 2 .2,2, )( )(1 XX XX n stYstY XYn Y
14、n? ?根據(jù) t 分布原理根據(jù): X=12 時(shí),求的95%可信區(qū)間 ?=13.44,lXX=24.9040,=0.1262。 ?當(dāng)X=12時(shí),=5.3832, Y ? ? X XY s . ? Y 05400 904024 124413 10 1 12620 2 ? . . ).( .s Y ? ? ? )10)(5077. 5 ,2587. 5( 0540. 0306. 23832. 5 23 2, cm stY Y n ? ? ? ? ? 11.7.3 的容許區(qū)間估計(jì) Y ? ?給定 X 時(shí)Y 的估計(jì)值是 Y 的均數(shù)的一個(gè)估計(jì)。 ?給定X 時(shí) Y 值的容許區(qū)間是 Y值的可能范圍。 ?的10
15、0(1- ?)%容許限: ? ? ? ? ? ? ? ? 2 2 .2,2, )( )(1 1 XX XX n stYstY XYnYn? Y ? 的可信區(qū)間與Y的容許區(qū)間 ? 可信區(qū)間是針對(duì)條件均數(shù)的,而容許區(qū)間是針對(duì)Y的取值 范圍的。 ?X=12時(shí),的可信區(qū)間為:5.25785.5077(10 3cm2), 表示:體重為12kg的3歲男童,估計(jì)其平均體表面積為 5.3832 ,95可信區(qū)間為(5.2587,5.5077) (10 3cm2)。 ? X=12 時(shí),Y的容許區(qū)間為:5.06665.6998(10 3cm2), 表示:體重為12kg的3歲男童, 估計(jì)有95的人其體表 面積在5.0
16、6665.6998 (10 3cm2)之間。 Y ? ? Y ? ? 結(jié)論: ?體重為12kg的3歲男童,估計(jì)有95%的人其體 表面積在5.06665.6998(10 3cm2)之間,平均 體表面積為5.3832(10 3cm2),95 可信區(qū)間 為(5.2587,5.5077) (10 3cm2)。 可信區(qū)間與容許區(qū)間示意 (confidence band & tolerance band) 111213141516 4.5 5.0 5.5 6.0 6.5 7.0 ? 11.8 兩條回歸直線的比較 ?有時(shí)需要對(duì)兩條回歸方程進(jìn)行比較,以推斷相應(yīng) 的兩總體回歸直線是否平行,是否重疊。 ?決定直線
17、回歸方程的參數(shù)是回歸系數(shù) b和截距a ?兩回歸直線平行,等價(jià)于 ?1=?2; ?兩回歸直線重疊,等價(jià)于 ?1=?2且? 1 =? 2。 11.8.1 兩回歸系數(shù)的比較 ?檢驗(yàn)假設(shè)為: H0:?1 ?2; H1:?1?2。 ?=0.05 。 21 21 bb s bb ? ? 4 21 ?nn? t= ? ? ? ? ? ? ? ? ? ? 2211 21 11 )( 2 XXXX wXYbb ll ss ? )2()2( ) ? () ? ( )2()2( )2()2( 21 2 22 2 11 21 2 2 1 2 221 ? ? ? ? ? ? ? ? ? nn YYYY nn nsns
18、s XYXY w XY 11.9 過(guò)定點(diǎn)的直線回歸 ? 例11.4在用熒光光度法測(cè)定全血硒的研究中,分別取 不同硒含量的標(biāo)準(zhǔn)液,消化后測(cè)定其熒光強(qiáng)度,試作 標(biāo)準(zhǔn)直線。 ?含硒量(?g)X 熒光強(qiáng)度Y 0.0000.00 0.0254.36 0.0509.31 0.10017.13 0.15025.03 0.20033.22 過(guò)定點(diǎn)(X 0 ,Y 0 )的直線回歸方程 bXbXYY XXbYY ? ? ? ? )( )( 00 00 bXXbYY? ? )( 一般的直線回歸方程 (過(guò)X的均數(shù)和Y的均數(shù)): 過(guò)定點(diǎn)(X 0 ,Y 0 )的直線方程估計(jì) ? 1 )( )( )( )()( )( )(
19、 )( 2 . 2 0 2 002 0 2 2 0 00 00 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? n YY s XX YYXX YYYY XX YYXX b XXbYY XY 不同硒含量所得熒光強(qiáng)度的過(guò)定點(diǎn)的回歸 ? 熒熒 光光 強(qiáng)強(qiáng) 度度 Y 00.025 0.05 0.075 0.10.125 0.15 0.175 0.2 0 5 10 15 20 25 30 35 硒含量硒含量X (?g) XY7488.167? ? 11.10 直線回歸與直線相關(guān)的區(qū)別與聯(lián)系 ? 區(qū)別 ?r沒(méi)有單位,b有單位;所以,相關(guān)系數(shù)與單位無(wú)關(guān),回歸 系數(shù)與單位有關(guān); ?相關(guān)表示相互關(guān)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 租房住宿合同范本
- 企業(yè)過(guò)戶合同范本
- 高性能纖維企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 甲基四氫苯酐企業(yè)如何構(gòu)建有效的風(fēng)險(xiǎn)管理機(jī)制
- 軋鋼機(jī)油企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- 珠寶翡翠首飾企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 白酒采購(gòu)合同范本
- 勞動(dòng)者職業(yè)安全協(xié)議
- 地產(chǎn)分成協(xié)議
- 受贈(zèng)合同范本
- 《第十一課-絮絮叨叨滿是情課件》小學(xué)心理健康教育
- 江蘇天嘉宜化工有限公司特大事故警示專題教育課件
- 2023年體育單招英語(yǔ)語(yǔ)法練習(xí)專題08 非謂語(yǔ)動(dòng)詞(含解析)
- 如何抓好學(xué)生的行為習(xí)慣課件
- 商場(chǎng)裝修管理規(guī)范課件
- 2023年青島恒星科技學(xué)院?jiǎn)握芯C合素質(zhì)考試筆試題庫(kù)及答案解析
- 民族宗教新疆歷史課件
- PVC注塑問(wèn)題的改善措施
- 頸動(dòng)脈斑塊講稿課件
- 部編語(yǔ)文八年級(jí)上冊(cè)1-3單元教材分析課件
- (完整版)SF-36評(píng)分標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論