實(shí)用生物統(tǒng)計(jì)(第2版)唐志宇-第14講回歸_第1頁
實(shí)用生物統(tǒng)計(jì)(第2版)唐志宇-第14講回歸_第2頁
實(shí)用生物統(tǒng)計(jì)(第2版)唐志宇-第14講回歸_第3頁
實(shí)用生物統(tǒng)計(jì)(第2版)唐志宇-第14講回歸_第4頁
實(shí)用生物統(tǒng)計(jì)(第2版)唐志宇-第14講回歸_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1第二節(jié)第二節(jié) 簡(jiǎn)單線性回歸簡(jiǎn)單線性回歸一元線性回歸一元線性回歸一元線性回歸的方差分析一元線性回歸的方差分析2一、一、“回歸(回歸(regressionregression)”的由來的由來0.51633.73sonfatherhh父輩身高增加一父輩身高增加一個(gè)單位,兒子身個(gè)單位,兒子身高僅增加半個(gè)單高僅增加半個(gè)單位左右;父輩身位左右;父輩身高減少一個(gè)單位,高減少一個(gè)單位,兒子身高僅減少兒子身高僅減少半個(gè)單位左右;半個(gè)單位左右;子代的平均高度子代的平均高度向中心靠近向中心靠近 回回歸效應(yīng)歸效應(yīng).3例例1 1從大白鼠出生第從大白鼠出生第6 6天起,每天起,每3 3天稱一次體重,天稱一次體重,直到第

2、直到第1818天天. .兩個(gè)不同的連續(xù)變量(兩個(gè)不同的連續(xù)變量(xi,yi)4例例1 1 散點(diǎn)圖散點(diǎn)圖散點(diǎn)沿一條直線周圍分布散點(diǎn)沿一條直線周圍分布.回歸的目的回歸的目的: Y、X關(guān)系的形式關(guān)系的形式.iiyx i 5殘差殘差ei(,)iixy(,)iixyiiyabxiiyy ie 6二、擬合回歸直線二、擬合回歸直線 最小二乘估計(jì)最小二乘估計(jì)評(píng)價(jià)一條直線評(píng)價(jià)一條直線(ya+bx)與數(shù)據(jù)點(diǎn)與數(shù)據(jù)點(diǎn)(xi,yi)擬合擬合(吻合)的好壞(吻合)的好壞 殘差殘差ei平方和:平方和:最小二乘估計(jì)最小二乘估計(jì)(least square estimate):使原始:使原始數(shù)據(jù)(數(shù)據(jù)(yi)與擬合數(shù)據(jù)()與擬

3、合數(shù)據(jù)(a+bxi)的差的平方)的差的平方和和SSe最小最小.222111()()nnneiiiiiiiiSSeyyyabx71.模型模型1 1:過原點(diǎn)的直線:過原點(diǎn)的直線yx 121niiiniix ybx 2211()()nneiiiiiiSSyyybx1d2()0dneiiiiSSybx xb 82.模型模型2:過定點(diǎn)(:過定點(diǎn)(x0,y0)的直線的直線001122011()()()nniiiiiinniiiix yxxyybxxx 00 xxxyyy 121niiiniix ybyxx 00= ()yyxx =yx 93.模型模型3:一般直線:一般直線00120001()()()=)n

4、iiiniixxyybxyxxyx aybx yx ()()yyxx 00(,)( , )xyx y 121()()()niiiniixx yybxx xyxxSS yx10最小二乘估計(jì)最小二乘估計(jì)121()()()niiiniixxyybxx 121niiiniix ybx yxyx第一種情況第一種情況:過原點(diǎn):過原點(diǎn)()()()yyxx 第三種情況:第三種情況:第二種情況:過定點(diǎn)第二種情況:過定點(diǎn)001201()()()niiiniixxyybxx 00()yyxx 11最小二乘估計(jì)(最小二乘估計(jì)(1)最小二乘原則同樣適用于非線性回歸,只是非最小二乘原則同樣適用于非線性回歸,只是非線性回歸

5、模型的正則方程比較復(fù)雜,經(jīng)常無解線性回歸模型的正則方程比較復(fù)雜,經(jīng)常無解析解;析解;21()neiiiSSyy 12例例1 1 回歸方程回歸方程136.5 1.516790104.5601.51672.699655xyxxSbSaybx 13問題問題1:4.53488.4326hage某地調(diào)查了某地調(diào)查了418歲男孩與女孩的平均身高,歲男孩與女孩的平均身高,試描述男孩與女孩平均身高與年齡間的關(guān)系試描述男孩與女孩平均身高與年齡間的關(guān)系.14問題問題1:散點(diǎn)圖:散點(diǎn)圖4.53488.4326hage15最小二乘估計(jì)(最小二乘估計(jì)(2)無論無論X和和Y的真實(shí)關(guān)系是什么樣的,用線性模型的真實(shí)關(guān)系是什么

6、樣的,用線性模型的最小二乘的解總是存在的的最小二乘的解總是存在的. So,正確選擇模型很重要;正確選擇模型很重要;用最小二乘得出的結(jié)果要經(jīng)過假設(shè)檢驗(yàn)用最小二乘得出的結(jié)果要經(jīng)過假設(shè)檢驗(yàn).121()()()niixyinxxiixxyySbaybxSxx 16三、一元線性回歸模型假設(shè)三、一元線性回歸模型假設(shè)( (LINELINE) )( (L Line)ine)線性性線性性: : Y與與X之間是線性關(guān)系:之間是線性關(guān)系:( (I Independence)ndependence)獨(dú)立性:樣本獨(dú)立獨(dú)立性:樣本獨(dú)立( (N Normal)ormal)正態(tài)性:誤差正態(tài)性:誤差服從正態(tài)分布,均值為服從正態(tài)

7、分布,均值為0.0.( (E Equal)qual)方差齊性:不同方差齊性:不同X值對(duì)應(yīng)的值對(duì)應(yīng)的的方差完全相的方差完全相同。即同。即: : Yx ,(|)Y xE YXxx 2(,)YNx 2(0,)N 171.1.一元線性回歸模型假設(shè)一元線性回歸模型假設(shè)(LINE)(LINE)HfatherHson263(,)sonHN ,(|)Y xsonfatherE HHxx 22(,)sonxHN 32(,)sonxHN 632x3xx2(,)sonxHN 18截距截距, , 斜率,稱為回歸系數(shù)斜率,稱為回歸系數(shù). . 給定給定X 下下Y 的估計(jì)值的估計(jì)值. .給定給定X 下下Y 的平均值的平均值

8、Y 的條件數(shù)學(xué)期望的條件數(shù)學(xué)期望. .回歸直線的意義回歸直線的意義(|)( )E Y Xxf xx 19例例1 1 回歸方程的含義回歸方程的含義斜率斜率(1.5167)(1.5167)日齡每增長(zhǎng)日齡每增長(zhǎng)1 1天,平均體重天,平均體重增加增加出生出生x天的大白鼠,體重天的大白鼠,體重為為: :出生出生x天的大白鼠,平均體重天的大白鼠,平均體重為為: :,2.69961.5167Y xx 2.69961.5167yx20If b0HfatherHson2( ,)sonHN a 0: (|)xifbE YXxa 2(,)sonHNa 2( ,)sonHN a 632x3xx2( ,)sonHN a

9、 21問題問題2 2:b0?0?某研究小組隨即抽查了某研究小組隨即抽查了20名名15歲健康男童,測(cè)歲健康男童,測(cè)量其身高(量其身高(h)與體重()與體重(w):):121()()=()niixyinxxiixx yySbSxx ()58.2350.7158 ()w kgh cm ( )5823571580 ()w gh m 222.參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)和假設(shè)檢驗(yàn)參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)和假設(shè)檢驗(yàn)2(,)YNx 22( )( )()(2)2(iieyySE bnaSnEEE 2221( )( )()xxxxxD bD aSnS 22xyexxSSSbaybxSn 2221()ebaexxxxMS

10、xSSMSSnS 參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)和假設(shè)檢驗(yàn)參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)和假設(shè)檢驗(yàn)2( ,)xxb NS 00:H 02(0,1)xxbNS 0 (2)xxebtt nSMS 22eenSSMS 12(2)exxbtnSMS 參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)和假設(shè)檢驗(yàn)參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)和假設(shè)檢驗(yàn)021220,01220000121:(2)()()1:(2)()()1:)1(2)(xxY XxeexxexxxatnnSxxytnMSnSxxyxytnMSnSMS 25例例1 1 參數(shù)的檢驗(yàn)(參數(shù)的檢驗(yàn)(P215P215,例),例)0:0, :0AHH 0:0, :0AHH 26例例1 1 參數(shù)的檢驗(yàn)(

11、參數(shù)的檢驗(yàn)(P215P215,例),例)273. 分解數(shù)據(jù)分解數(shù)據(jù) yiyy iyy iiyy iyy iyy iiyy 模型:模型: y的變化的變化 x的作用的作用隨機(jī)誤差隨機(jī)誤差28分解數(shù)據(jù)分解數(shù)據(jù)iiixy ()()iiiiyyyyyy ()()iiiabxabxbyyxx ()()()iiiiiiixabxab xyy ( )( )E bbE aa 隨機(jī)隨機(jī)x的作用的作用隨機(jī)隨機(jī)29總離差平方和的分解總離差平方和的分解222()()iiiiyyyyyy Syy:總離差平方和:總離差平方和SSe :殘差平方和殘差平方和,反映隨機(jī)誤差引起的變異,反映隨機(jī)誤差引起的變異SSR:回歸平方和回歸

12、平方和,反映隨機(jī)誤差及,反映隨機(jī)誤差及X對(duì)對(duì)Y的線性影響的線性影響產(chǎn)生的變異產(chǎn)生的變異Syy SSeSSR()()()iiiiyyyyyy303個(gè)平方和個(gè)平方和222()()iiiiyyyyyy ()()iiiabxabxbyyxx 2()RiSSyy 22()ibxx 2xxb S 22xyyyyyRxxxyyyyyexxSSSb SbSSSSSSSS 2()iyyySy 2(1)ynSxyxxSbS 2xyxyxxSbSS314. 回歸方程的檢驗(yàn)回歸方程的檢驗(yàn) 方差分析方差分析2()2eEnSS (1,2)(2)eRReSSMSnSFSFMnS 0:0H 222()()()iiiiyyyy

13、yy22()RxxSE SS Syy SSe SSR32例例1 1 回歸方程的檢驗(yàn)(回歸方程的檢驗(yàn)(P219P219,例),例)0:0, :0AHH 207.033.17210.20yRyeSSSSS 21.06eMS 335.決定系數(shù)決定系數(shù) R22207.030.985210.20RyySSSR =X能解釋能解釋變化的百分比,越接近于變化的百分比,越接近于1,表示,表示回歸效果越好回歸效果越好.2207.033.17210.201.06yyeReSSMSSSS 1.06eMS 0.992r 34決定系數(shù)與相關(guān)系數(shù)決定系數(shù)與相關(guān)系數(shù)2()iRySSy 22xyxxxyxxSb SbSS222

14、xyyyxxyyxyxxSSSSrSS2RyySSSR 35例例2 2 模擬數(shù)據(jù)模擬數(shù)據(jù)1r 21R 31199.68074644.70206 10199.6807464yyeRSSSSS 210eyyRSSSSSR 36例例2 2 散點(diǎn)圖散點(diǎn)圖210eyyRSSSSSR 某作者分析淋巴細(xì)胞轉(zhuǎn)換率與年齡的關(guān)系:某作者分析淋巴細(xì)胞轉(zhuǎn)換率與年齡的關(guān)系:n252,r回歸方程為:回歸方程為:結(jié)論是淋巴細(xì)胞轉(zhuǎn)換率與年齡密切相關(guān)結(jié)論是淋巴細(xì)胞轉(zhuǎn)換率與年齡密切相關(guān). .請(qǐng)問請(qǐng)問:這個(gè)結(jié)論是否有使用價(jià)值,為什么?:這個(gè)結(jié)論是否有使用價(jià)值,為什么? 37問題問題3 376.00.4agey 0.01P 386.

15、3yx 23,(0,0.5 )yxN 3923,(0,1.5 )yxN 23,(0,2.5 )yxN 4023,(0,3.5 )yxN 23,(0,4 )yxN 41不拒絕原假設(shè)時(shí)不拒絕原假設(shè)時(shí)所得的線性回歸方程無意義:所得的線性回歸方程無意義:lX 、Y 無線性關(guān)系;無線性關(guān)系;l誤差過大,掩蓋了誤差過大,掩蓋了X 、Y 間的線性關(guān)系;間的線性關(guān)系;lX 對(duì)對(duì)Y 的影響為非線性的的影響為非線性的;l除除X 外還有其它不可忽略的變量,從而削弱外還有其它不可忽略的變量,從而削弱了了X 對(duì)對(duì)Y 的影響,用多元線性回歸的影響,用多元線性回歸.0:0, :0AHH 四、相關(guān)與回歸四、相關(guān)與回歸22xy

16、RxxxxyxyxxxxyyyxxSSSSSrbSS Sb SbSS22xyxxyySrS S xyxyy a bxx ab yxxyySSbbSS 2RyySSRS關(guān)于斜率的檢驗(yàn)關(guān)于斜率的檢驗(yàn)0:0H 0:0H (1,2)ReFFSMSnM (2)xxebttMSnS附表附表22exxMSbtS22 (2)1r ntt nr 44回歸分析回歸分析 最小二乘原則(最小二乘原則(LSE)估計(jì)回歸方程參數(shù):)估計(jì)回歸方程參數(shù):、2 得到回歸方程:得到回歸方程: 檢驗(yàn)回歸方程:檢驗(yàn)回歸方程:H0:= 0 yabx45例例3富有的美國加州富有的美國加州Beverly Hills和和Palm Sprin

17、gs地區(qū)的理療醫(yī)生在年輕人當(dāng)中發(fā)現(xiàn)了一種新的地區(qū)的理療醫(yī)生在年輕人當(dāng)中發(fā)現(xiàn)了一種新的疾病疾病. 當(dāng)一個(gè)人想要體驗(yàn)極端速度變化的刺激當(dāng)一個(gè)人想要體驗(yàn)極端速度變化的刺激,不斷變換寶馬,不斷變換寶馬L7系車的加速器和制動(dòng)器,系車的加速器和制動(dòng)器,那么此人很有可能患上這種被稱為寶馬膝的病那么此人很有可能患上這種被稱為寶馬膝的病. 這種疾病的病因一直不太明確這種疾病的病因一直不太明確. 觀察治療學(xué)家觀察治療學(xué)家Sausalito發(fā)現(xiàn)這種奇怪的疾病的嚴(yán)重程度與患發(fā)現(xiàn)這種奇怪的疾病的嚴(yán)重程度與患者的雅皮士程度密切相關(guān)者的雅皮士程度密切相關(guān). 生物統(tǒng)計(jì)學(xué)基礎(chǔ)生物統(tǒng)計(jì)學(xué)基礎(chǔ),凌莉,凌莉,P13246例例31.測(cè)

18、量這種疾病的嚴(yán)重程度僅需用量角器測(cè)量測(cè)量這種疾病的嚴(yán)重程度僅需用量角器測(cè)量膝關(guān)節(jié)活動(dòng)度(膝關(guān)節(jié)活動(dòng)度(ROM).2.雅皮士程度得分(雅皮士程度得分(CHICC)汽車(汽車(Cars):汽車擁有量(歐洲產(chǎn)越野車現(xiàn)):汽車擁有量(歐洲產(chǎn)越野車現(xiàn)代小馬車、雪佛蘭或小貨車)代小馬車、雪佛蘭或小貨車)健康(健康(Health):俱樂部(網(wǎng)球滑雪健身):俱樂部(網(wǎng)球滑雪健身)收入(收入(Income):):1萬美金為單位萬美金為單位飲食(飲食(Cuisine):香油的總消費(fèi)量(公升)冰箱):香油的總消費(fèi)量(公升)冰箱中芥末類型的數(shù)量中芥末類型的數(shù)量服飾(服飾(Clothes):衣柜中):衣柜中Gucci、Lacoste和和Saint Laurent等高檔品牌服飾的數(shù)量等高檔品牌服飾的數(shù)量47例例30:0H 2220.01()0.5610.8184rR 48小結(jié)小結(jié) 相關(guān)系數(shù)的含義及其計(jì)算、檢驗(yàn)相關(guān)系數(shù)的含義及其計(jì)算、檢驗(yàn) 線性回歸模型、回歸方程的含義線性回歸模型、回歸方程的含義 回歸分析:回歸分析: 最小二乘原則(最小二乘原則(LSE)估計(jì)回歸方程參)估計(jì)回歸方程參數(shù):數(shù):、2 回歸方程:回歸方程:y=a+bx檢驗(yàn)回歸方程:檢驗(yàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論