




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、生物統(tǒng)計學教案第十章 一元回歸及簡單相關(guān)分析教學時間:5學時教學方法:課堂板書講授教學目的:重點掌握一元線性回歸方程,掌握一元線性回歸方程的檢驗和相關(guān),了解一元非線性回歸和多元回歸與相關(guān)。講授難點:一元線性回歸方程的檢驗和相關(guān)10.1 回歸與相關(guān)的基本概念函數(shù)關(guān)系:Fma相關(guān)關(guān)系:單位面積的施肥量、播種量和產(chǎn)量;血壓和年齡;胸徑和高度;玉米的穗長和穗重;身高和體重。相關(guān):設(shè)有兩個隨機變量X和Y,對于任一隨機變量的每一個可能的值,另一個隨機變量都有一個分布與之相對應,稱X和Y存在相關(guān)?;貧w:對于變量X的每一個可能的值xi,都有隨機變量Y的一個分布相對應,則稱隨機變量Y對變量X存在回歸。X稱為自變
2、量,Y稱為因變量。條件平均數(shù):當Xxi時Y的平均數(shù)Y.Xxi,稱為條件平均數(shù)。10.2 一元線性回歸方程10.2.1 散點圖NaCl含量X(g/kg土壤) 00.81.62.43.24.04.8干重Y(mg/dm2)809095115130115135例 不同NaCl含量對單位葉面積干物質(zhì)的影響從上圖雖可以看出Y對X的線性關(guān)系,但點子并不在一條直線上。例 每一NaCl含量下干物質(zhì)10次重復值干重(mg/dm2)重復值NaCl含量(g/kg土壤)00.81.62.43.24.04.81 80 90 951151301151352100 85 89 941061251373 75107115103
3、1031281284 89 93 921101101431275 911031151131281321556 79 921201081311211327101 78 951211171291488 85105 951101211121179 83 9310510811412013410 79 85 98111116130132平均值 86.2 93.1101.9109.3117.6125.5134.5如果增加每一NaCl濃度下的重復次數(shù),用其平均值畫成散點圖,則點子直線化的程度要好得多。上表給出10次重復的平均值,從下圖中可見,點子更接近在一條直線上。當以Y的條件平均數(shù)所做的散點圖,則完全在一
4、條上。10.2.2 一元正態(tài)線性回歸模型 xi和各xi上Y的條件平均數(shù)y.x可構(gòu)成一條直線: YX對于變量X的每一個值,都有一個Y的分布,其平均數(shù)是上式所示的線性函數(shù)。對于隨機變量Y: YX :NID(0,2) Y:NID(+X,2)上式稱為一元正態(tài)線性回歸模型。10.2.3 參數(shù)和的估計 在實際工作中,我們是無法得到和的,只能得到它們的估計值a和b,從而得到一條估計的回歸線: 上式稱為Y對X的回歸方程,所畫出的直線稱為回歸線。a是直線的截距,稱為常數(shù)項;b是直線的斜率,稱為回歸系數(shù)。對于因變量Y的每一個觀測值yi: yi = a + bxi + ei yi 的回歸估計值是對的估計,因此也是平
5、均數(shù)。在各種離差平方和中,以距平均數(shù)的離差平方和為最小。因此我們就把ei = yi-平方和為最小的直線作為最好的回歸線。記,求出使L達到最小時的a和b,這種方法稱為最小二乘法。為使達到最小,令:可以得到以下一組聯(lián)立方程:解該方程組,得到的最小二乘估計:及a的最小二乘估計:公式的分子部分稱為X和Y的校正交叉乘積和,以SXY表示。分母部分稱為X的校正平方和,以SXX表示。因變量Y的 平方和稱為總平方和,以SYY表示。因此,b又可以表示為:10.2.4 回歸方程的計算XX=X-2.4X2YY=Y-110Y2XY0 -2.4 5.76 80 -30 900 720.8 -1.6 2.56 90 -20
6、 400 321.6 -0.8 0.64 95 -15 225 122.4 0 0115 5 25 0 3.2 0.8 0.64130 20 400 164.0 1.6 2.56115 5 25 84.8 2.4 5.76135 25 625 60和 017.92 -102600 200由此得出回歸方程:回歸系數(shù)的含義是:當自變量X每變動一個單位,因變量Y平均變動11.16個單位。10.3 一元線性回歸的檢驗10.3.1 b和a的數(shù)學期望和方差上式中的2是由得到的,是實際觀測值與總體回歸估計值的離差。由于和都是未知的,因此無法得到i,只能用i的估計值ei,。稱為誤差平方和即為SSe 可以證明M
7、Se是2的無偏估計量,因此樣本回歸系數(shù)b的方差a的方差 根據(jù)表102中的7套重復數(shù)據(jù)(細線所示),和它們的平均數(shù)(粗虛線所示)所繪出的回歸線。如果無限增加重復次數(shù),最終將得到一條直線YX。實際上這條直線是無法獲得的,只能得到它的估計直線(由一套或幾套數(shù)據(jù)獲得),。這些估計直線是總體回歸線的無偏估計。它們有自己的分布,因此有自己的期望和方差。10.3.2 b和a的顯著性檢驗10.3.2.1 b的顯著性檢驗b的顯著性檢驗原理與第五章所講的假設(shè)檢驗原理類似。決定回歸線的傾斜程度,當0時兩變量間不存在回歸關(guān)系。b有自己的分布,。根據(jù)b的分布,在0這一假設(shè)下計算出,獲得回歸系數(shù)為b的這一事件出現(xiàn)的概率很
8、小,而實際上它卻出現(xiàn)了,說明假設(shè)的條件不正確,從而拒絕假設(shè)。上面已經(jīng)說過,b2無法得到,只能用sb2估計,因此需用t檢驗。所使用的檢驗統(tǒng)計量為:服從n2自由度的t分布。因回歸系數(shù)是由Y.X的估計值得到的,因此sb是標準誤差,而不是標準差。例 對前述回歸方程的回歸系數(shù)的顯著性作檢驗。解 H0:0 HA:0計算MSe,檢驗統(tǒng)計量 t5,0.005=4.032,t > t0.005,P < 0.01,拒絕H0。結(jié)論是干物重在NaCl含量上的回歸極顯著。t檢驗還可以檢驗具有某一給定值的假設(shè)。例 對前述方程的以下假設(shè)做檢驗 H0:7 HA:7檢驗統(tǒng)計量t5,0.025=2.571,t <
9、; t0.025,P>0.05,接受H0。b很可能抽自7的總體。10.3.2.2 a的顯著性檢驗檢驗統(tǒng)計量,在H0:0的假設(shè)下 , 具n - 2自由度在H0:0的假設(shè)下 , 具n - 2自由度例 對前述方程的a的顯著性做檢驗解 H0: = 0 HA: 0先計算sa,計算統(tǒng)計量的值t5,0.025=2.571,t > t5,0.025,P<0.05,拒絕H0:0。例 對前述方程的a=100這一假設(shè)做檢驗解 H0: =100 HA: 100sa在上例中已經(jīng)求出,計算統(tǒng)計量的值t5,0.025=2.571,|t|>t0.025,P < 0.05,結(jié)論是拒絕H0:100的
10、假設(shè)。10.3.4 一元回歸的方差分析10.3.4.1 無重復時一元回歸的方差分析 回歸方程方差分析的基本思想與第八章所述方差分析的基本思想是相同的。即將總變差的平方和分解為各個分量的平方和。從圖中可見,將等式兩邊平方,然后對全部n個點求和。其中的第三項等于0,因此等號左邊一項是Y的平方和,稱為總校正平方和,記為SYY。等號右邊的第二項稱為回歸平方和,是由于X對Y的線性貢獻而產(chǎn)生的平方和,記為SSR。等號右邊的第一項是觀測值距回歸估計值離差的平方和,稱為誤差平方和或剩余平方和,記為SSe?!笆S嗥椒胶汀钡暮x是,該平方和表示除了X對Y的線性影響外,一切因素對Y的變差的作用,包括X對Y的非線性影
11、響及實驗誤差等。SYY具n 1自由度,SSR具1自由度,SSe具n 2自由度。由此可以得到相應的均方。 ,以及檢驗統(tǒng)計量方差分析的零假設(shè)H0:0,備擇假設(shè)HA:0。當F >F1,n-2,時拒絕H0。在實際計算時,可以利用以下二式求出誤差平方和及回歸平方和。 SSeSYYbSxy SSRSYYSSebSXY最后,將計算結(jié)果列成方差分析表。例 對前例的方程做方差分析。已知 SYY2585.71,SXY200,b11.16。由此計算出 SSRbSXY11.16×2002232, SSeSYYbSXY =2585.712232=353.71。將上述結(jié)果列成方差分析表變差來源平方和 自由
12、度 均 方 F 回歸 2232 1 2232 31.55* 剩余 353.71 5 70.74 總和 2585.71 6 *0.01F >F1,5,0.01,結(jié)果是回歸極顯著。10.3.4.2 有重復時的一元回歸的方差分析如果同一自變量,因變量重復觀測兩次以上,則稱為有重復觀測。這時誤差平方和可以通過重復平方和獲得,因此總平方和可以做如下分解: SYYSSRSSLOFSSpe其中SSpe稱為純實驗誤差平方和,是通過重復觀測獲得的。SSLOF稱為失擬平方和,是剩余平方和除掉純實驗誤差平方和之后的剩余部分,這部分是由于模型選擇不當造成的。各項平方和的計算如下:設(shè)實驗共收集i=1,2,n對數(shù)據(jù)
13、,在每一xi下做了j=1,2,m次重復,各平方和由以下各式給出自由度分別為:回歸項為1,失擬項為n2,純誤差項為mnn,總和為mn-1。從而得出各項均方。在作檢驗時,首先用純誤差均方對失擬均方作檢驗如果結(jié)果是顯著的,可能有以下幾個原因:除X外,還有其它影響Y的因素。模型選擇不當,X、Y之間可能是非線性關(guān)系。X和Y無關(guān)。這時沒有必要用SSLOF對MSR做檢驗。若結(jié)果是不顯著的,說明失擬平方和基本是由實驗誤差造成的,這時需將失擬平方和與純誤差平方和合并,用合并的平方和對回歸平方和做檢驗。若檢驗的結(jié)果仍不顯著,可能的原因有:X和Y不存在回歸關(guān)系。實驗誤差過大。例 以10.2節(jié)所給出的前兩次重復為例,
14、做方差分析。 NaCl含量00.81.62.43.24.04.8干重復I 80 90 95 115 130 115 135重重復II 100 85 89 94 106 125 137和16400153251694622061281362885036994 16471232400306253385643681556965760073984 327842由以上數(shù)據(jù)計算出回歸方程:,以及SYY4853.71和SSR3744.61。純誤差平方和代入上表右下角數(shù)字,得。失擬平方和SSLOFSYYSSRSSpe4853.713744.61791.00318.10。將以上結(jié)果列成方差分析表:變差來源平方和自
15、由度均 方F回 歸 3744.61 1 3744.61 40.52失 擬 318.10 5 63.62 0.56純誤差 791.00 7 113.00總 和 4853.71 13對失擬做檢驗的結(jié)果,F(xiàn)0.56。將失擬平方和與誤差平方和合并后對回歸做檢驗的結(jié)果F40.52。F>F0.01,Y與X存在極顯著的回歸關(guān)系。10.3.6 一元回歸分析的意義 1、預報 2、減少實驗誤差10.4 一元非線性回歸10.4.2 對數(shù)變換例 用X射線照射大麥種子,記處理株第一葉平均高度占對照株高度的百分數(shù)為X,存活百分數(shù)為Y,得到以下結(jié)果。X283240506072808085Y81218283055618
16、580在直角坐標紙上做成的散點圖和線性回歸線如下:可以明顯看出用直線擬合散點是不合適的。為了能夠以直線擬合散點,對X和Y進行坐標變換,取X=lgX,Y=lgY,重新作圖如下:這時可按直線回歸,求出線性方程:將X=lgX,Y=lgY代入上式,經(jīng)整理得到如下回歸方程:例 鉤蟲病人的重復治療次數(shù)X和復查陽性率Y如下表:治療次數(shù) X12345678復查陽性率 Y63.936.017.110.57.34.52.81.7散點圖如下:從散點圖可見,Y和X顯然不是線性關(guān)系,很可能呈指數(shù)函數(shù)關(guān)系。令Y'=lnY,變換后的散點圖可用直線擬合,求出Y和X的線性方程,以lnY代替,整理后得到以下回歸方程: 圖
17、中的實線就是根據(jù)該方程繪出的。10.4.3 概率對數(shù)變換 在尋找半致死劑量時,常用到這種變換。例 用不同劑量的射線照射小麥品種庫班克調(diào)查死苗率,得到以下結(jié)果:劑量(Kr)X14161820222426死苗率(%)Y6104070809395散點圖和擬合曲線如下:上圖為一S形曲線,曲線的下半部比較陡峭,上半部比較平緩。將劑量X作對數(shù)變換,變換后的圖形,成為對稱的S形曲線。該曲線的形狀與正態(tài)分布累積分布曲線的形狀是一樣的。因此,只要把死亡率的百分率坐標變換為概率坐標,S形曲線便化作為直線。有時為了防止出現(xiàn)負值,將變換后的每一個值都加上5。當然,不做這樣處理也可以。本例中,劑量是自變量,死亡率是因變
18、量,因此劑量為橫坐標,死亡率為縱坐標。但是在計算半致死劑量時,要求在死亡50時的劑量,這時經(jīng)常將死亡率作為橫坐標,劑量作為縱坐標。經(jīng)概率坐標變換的圖形如下:于是可以得到一個線性方程,。在半致死劑量處,X50,X0,回歸方程變?yōu)椤0胫滤绖┝縇D50可由下式得到:。上例經(jīng)變換后所得回歸方程為:半致死劑量的估計為: 。10.4.5 曲線擬合優(yōu)劣的檢驗10.4.5.1 通過比較剩余均方來判斷曲線擬合好壞對于一個未知的曲線,可以用幾種不同的方法擬合。在幾種不同的擬合曲線中,必然有一種是最好的。為了得到最優(yōu)擬合曲線,可以計算各種擬合曲線的剩余平方和,哪一個剩余平方和最小,哪一個就是最優(yōu)擬合。但在計算剩余平方和時一定要用實測點與回歸估計點離差的平方和來計算,這一點至關(guān)重要。10.4.5.2 根據(jù)失擬均方的大小判斷曲線擬合優(yōu)劣 對于有重復的實驗數(shù)據(jù),可以采取多種方法直線化,求出直線方程,按有重復實驗方差分析方法進行分析。用純誤差均方對失擬均方做檢驗,所得F值不顯著的擬合最好。10.4.5.3 根據(jù)相關(guān)指數(shù)做判斷相關(guān)指數(shù)記為R2。 在計算上式的SS剩余時,不能使用變換后的X和Y根據(jù)來計算,而應由實測值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 修建道路護欄合同范本
- 科技創(chuàng)新驅(qū)動的生產(chǎn)流程優(yōu)化思考
- 光伏 項目 合同范本
- 公司裝修消防合同范本
- 知識產(chǎn)權(quán)在促進經(jīng)濟轉(zhuǎn)型升級中的作用
- 眾籌合同范本
- 訂婚宴父母致辭(合集15篇)
- 給員工的講話稿(24篇)
- 入場合同范本
- 專家委托邀請合同范本
- 濟南2024年山東濟南廣播電視臺招聘14人筆試歷年參考題庫附帶答案詳解
- 海洋氣候預測模型創(chuàng)新研究-深度研究
- 《客戶服務(wù)基礎(chǔ)》教案及課件項
- 2025《醫(yī)藥企業(yè)防范商業(yè)賄賂風險合規(guī)指引》解讀課件
- 2025年湖南工業(yè)職業(yè)技術(shù)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2025年丹參原藥材項目可行性研究報告
- 物理(A版)-安徽省合肥一中(省十聯(lián)考)2024-2025學年度高二年級上學期期末測試試題和答案
- 人教版初中歷史與社會七年級下冊 6.3.3向西開放的重要門戶-烏魯木齊 說課稿
- 綜合材料繪畫課程設(shè)計
- 數(shù)學史簡介課件
- 八年級 下冊《黃河兩岸的歌(1)》課件
評論
0/150
提交評論