版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第七章回來與相關
RegressionandCorrelation060120180施氮量(kgN/ha)2468植物的生長量直線回來和相關第一節(jié)回來和相關的概念其次節(jié)直線回來第三節(jié)直線相關第四節(jié)直線回來與相關的內(nèi)在關系和應用要點引言這一章探討的對象:由一個變數(shù)兩個或多個變數(shù),因為在實際生產(chǎn)實踐和科學試驗中所要探討的變數(shù)往往不止一個,例如:探討溫度凹凸和作物發(fā)育進度快慢的關系探討每畝穗數(shù)、每穗粒數(shù)和每畝產(chǎn)量的關系第一節(jié)回來和相關的概念1.函數(shù)關系與統(tǒng)計關系2.自變數(shù)與依變數(shù)3.回來分析和相關分析4.兩個變數(shù)資料的散點圖變量間的關系有兩類:
一類是變量間存在著完全確定性的關系,可以用精確的數(shù)學表達式來表示。
如長方形的面積:S=ab。它們之間的關系是確定性的,只要知道了其中兩個變量的值就可以精確地計算出另一個變量的值,這類變量間的關系稱為函數(shù)關系。
下一張
主頁
退出
上一張
另一類是變量間不存在完全的確定性關系,不能用精確的數(shù)學公式來表示。如施肥與產(chǎn)量的關系;身高與體重關系等這些變量間都存在著特殊親密的關系,但不能由一個或幾個變量的值精確地求出另一個變量的值。像這樣一類關系在生物界中是大量存在的,統(tǒng)計學中把這些變量間的關系稱為相關關系,把存在相關關系的變量稱為相關變量。統(tǒng)計關系下一張
主頁
退出
上一張
相關變量間的關系一般分為兩種:一種是因果關系,即一個變量的變更受另一個或幾個變量的影響。施肥影響產(chǎn)量,子代的體高受親本體高的影響;另一種是平行關系,它們互為因果或共同受到另外因素的影響。如身高和體重之間的關系等都屬于平行關系。下一張
主頁
退出
上一張
統(tǒng)計學上接受回來分析(regressionanalysis)探討呈因果關系的相關變量間的關系。表示緣由的變量稱為自變量,表示結果的變量稱為依變量。一元回來分析:探討“一因一果”直線回來分析和曲線回來分析多元回來分析:探討“多因一果”多元線性回來分析與多元非線性回來分析下一張
主頁
退出
上一張
回來分析的任務:揭示出呈因果關系的相關變量間的聯(lián)系形式,建立它們之間的回來方程,利用所建立的回來方程,由自變量(緣由)來預料、限制依變量(結果)。
統(tǒng)計學上接受相關分析(correlationanalysis)探討呈平行關系的相關變量之間的關系。簡潔相關分析(直線相關分析):兩個變量;復相關分析:探討一個變量與多個變量間的線性相關;偏相關分析:多個變量,探討其余變量保持不變的狀況下兩個變量間的線性相關。
下一張
主頁
退出
上一張
函數(shù)關系有精確的數(shù)學表達式(確定性的關系)直線回來分析一元回來分析變量間的關系因果關系曲線回來分析(回來分析)多元回來分析多元線性回來分析統(tǒng)計關系 多元非線性回來分析(非確定性的關系)簡潔相關分析——直線相關分析平行關系復相關分析(相關分析)多元相關分析偏相關分析第一節(jié)直線回來一、直線回來方程的建立對于兩個相關變量,一個變量用x表示,另一個變量用y表示,假如通過試驗或調(diào)查獲得兩個變量的n對觀測值:(x1,y1),(x2,y2),……,(xn,yn)
下一張
主頁
退出
上一張
為了直觀地看出x和y間的變更趨勢,可作出散點圖。例如,圖是水稻方面的3幅散點圖
x,單株產(chǎn)量(g)水稻單株生物產(chǎn)量與稻谷產(chǎn)量的散點圖x,每m2穎花數(shù)(萬)
水稻每m2穎花數(shù)和堅固率的散點圖x,最高葉面積指數(shù)
水稻最高葉面積指數(shù)和畝產(chǎn)量的散點圖從散點圖可以看出兩個變量間:
(2)關系性質:正相關?負相關?(3)相關程度:相關親密?不親密?下一張
主頁
退出
上一張
散點圖直觀地、定性地表示了兩個變量之間的關系。定量?
(1)關系類型:直線型?曲線型?假如呈因果關系的兩個相關變量y(依變量)與x(自變量)間的關系是直線關系
依變量y的實際觀測值yi可用自變量x的實際觀測值xi表示為:(由于依變量y的實際觀測值總是帶有隨機誤差)(i=1,2,…,n)(7-1)其中:x為可以觀測的一般變量(也可以是可以觀測的隨機變量);y為可以觀測的隨機變量;
這就是直線回來的數(shù)學模型。我們可以依據(jù)實際觀測值對α,β以及方差做出估計。i為相互獨立,且都聽從N(0,)的隨機變量。在x、y直角坐標平面上可以作出多數(shù)條直線,我們把全部直線中最接近散點圖中全部散點的直線用來表示x與y的直線關系,這條直線稱為回來直線。
下一張
主頁
退出
上一張
設回歸直線的方程為:(7-2)其中,a是α的估計值,b是β的估計值。確定直線回來方程的方法有最小二乘法、高斯牛頓法、麥夸特法、牛頓法、梯度法、正割法等等。這里重點給大家介紹最小二乘法。
a、b應使回來估計值與實際觀測值y的偏差平方和最小,即:
依據(jù)微積分學中的求極值的方法,令Q對a、b的一階偏導數(shù)等于0,即:最小整理得關于a、b的正規(guī)方程組:
下一張
主頁
退出
上一張
解正規(guī)方程組,得:(7-3)(7-4)分子是自變量x的離均差與依變量y的離均差的乘積和,簡稱乘積和,記作分母是自變量x的離均差平方和,記作SSX。
回歸系數(shù)回歸截距b的符號反映了x影響y的性質,b的確定值大小反映了x影響y的程度;的估計值。叫做回歸估計值,是當x在在其研究范圍內(nèi)取某一個值時,y值平均數(shù)回來方程的基本性質:
假如將(7-4)式代入(7-2)式,得到回來方程的另一種形式(中心化形式):
下一張
主頁
退出
上一張
性質1最??;性質2;性質3回歸直線通過點。(7-5)【例7.1】在四川白鵝的生產(chǎn)性能探討中,得到如下一組關于雛鵝重(g)與70日齡重(g)的數(shù)據(jù),試建立70日齡重(y)與雛鵝重(x)的直線回來方程。表7-1四川白鵝雛鵝重與70日齡重測定結果(單位:g)下一張
主頁
退出
上一張
1、作散點圖以雛鵝重(x)為橫坐標,70日齡重(y)為縱坐標作散點圖,見圖
2、計算回來截距a,回來系數(shù)b,建立直線回來方程首先依據(jù)實際觀測值計算出下列數(shù)據(jù):下一張
主頁
退出
上一張
進而計算出b、a:
得到四川白鵝的70日齡重y對雛鵝重x的直線回歸方程為:依據(jù)直線回來方程可作出回來直線。(作圖)制作直線回來圖時,首先以x為橫坐標,以y為縱坐標構建直角坐標系;然后取x坐標上的一個小值x1代入回來方程得,取一個大值x2代入回來方程得,連接坐標點(x1,)和(x2,)即成一條回來直線。從圖看出,并不是全部的散點都恰好落在回來直線上,這說明用去估計y是有偏差的。下一張
主頁
退出
上一張
3、直線回來的偏離度估計偏差平方和的大小表示了實測點與回來直線偏離的程度,因而偏差平方和又稱為離回來平方和。離回來均方為:
離回來標準誤(7-6)離回來標準誤Syx的大小表示了回來直線與實測點偏差的程度,即回來估測值與實際觀測值y偏差的程度,于是我們把離回來標準誤Syx用來表示回來方程的偏離度。下一張
主頁
退出
上一張
二、直線回來的顯著性檢驗
上面介紹的方法求得一個回來方程=a+bx。明顯,這樣的回來方程所反應的兩個變量間的直線關系是不真實的。如何推斷直線回來方程所反應的兩個變量間的直線關系的真實性呢?這取決于變量x與y間是否存在直線關系。下一張
主頁
退出
上一張
1、直線回來的變異來源圖7-4的分解圖從圖7-4看到:上式兩端平方,然后對全部的n點求和,則有
下一張
主頁
退出
上一張
反映了y的總變異程度,稱為y的總平方和,記為SSy;反映了由于y與x間存在直線關系所引起的y的變異程度,稱為回來平方和,記為SSR;反映了除y與x存在直線關系以外的緣由,包括隨機誤差所引起的y的變異程度,稱為離回來平方和或剩余平方和,記為SSr。
(7-9)
這表明y的總平方和剖分為回來平方和與離回來平方和兩部分。下一張
主頁
退出
上一張
y的總自由度dfy也劃分為回來自由度dfR與離回來自由度dfr兩部分,即
回來自由度等于自變量的個數(shù),即離回來自由度y的總自由度回歸均方離回來均方。
2、回來關系顯著性檢驗—F檢驗
無效假設HO:=0,備擇假設HA:≠0。在無效假設成立的條件下,回來均方與離回來均方的比值聽從和的F分布
(7-11)下一張
主頁
退出
上一張
對于【例7.1】資料,有而。于是可以列出方差分析表進行回來關系顯著性檢驗。表7-2四川白鵝70日齡重與雛鵝重回來關系方差分析下一張
主頁
退出
上一張
因為,表明四川白鵝70日齡重與雛鵝重間存在極顯著的直線關系。3、回來系數(shù)的顯著性檢驗—t檢驗接受回來系數(shù)的顯著性檢驗—t檢驗也可檢驗x與y間是否存在直線關系?;貋硐禂?shù)顯著性檢驗的無效假設和備擇假設為HO:β=0,HA:β≠0。t檢驗的計算公式為:(7-14)
(7-15)
其中,Sb為回來系數(shù)標準誤。
對于【例7.1】資料,已計算得
故有
下一張
主頁
退出
上一張
查t值表,得
因否定HO:β=0,接受HA:β≠0,即直線回來系數(shù)b=21.7122是極顯著的,表明四川白鵝70日齡重與雛鵝重間存在極顯著的直線關系,可用所建立的直線回來方程來進行預料和限制。留意:利用直線回來方程進行預料或限制時,一般只適用于原來探討的范圍,不能隨意把范圍擴大。一般只能內(nèi)插,不要輕易外延。其次節(jié)直線相關進行直線相關分析的基本任務在于依據(jù)x、y的實際觀測值,計算表示兩個相關變量x、y間線性相關程度和性質的統(tǒng)計量——相關系數(shù)r并進行顯著性檢驗。下一張
主頁
退出
上一張
一、確定系數(shù)和相關系數(shù)
y與x直線回來效果的好壞取決于回來平方和與離回來平方和的大小取決于回來平方和在總平方和中所占的比的大小。這個比例越大,y與x的直線回來效果就越好,反之則差。我們把比值
叫做x對y的確定系數(shù)(coefficientofdetermination),記為r2,即下一張
主頁
退出
上一張
(7-24)確定系數(shù)的大小表示了回來方程估測牢靠程度的凹凸,或者說表示了回來直線擬合度的凹凸。明顯有0≤r2≤1。SPxy/SSx是以x為自變量、y為依變量時的回來系數(shù)byx。若把y作為自變量、x作為依變量,則回來系數(shù)bxy=SPxy/Ssy,確定系數(shù)r2等于y對x的回來系數(shù)與x對y的回來系數(shù)的乘積。確定系數(shù)反應了x為自變量、y為依變量和y為自變量、x為依變量時兩個相關變量x與y直線相關的信息,即確定系數(shù)表示了兩個互為因果關系的相關變量間直線相關的程度。但確定系數(shù)介于0和1之間,不能反應直線關系的性質——是同向增減或是異向增減。下一張
主頁
退出
上一張
求r2的平方根,且取平方根的符號與乘積和SPxy的符號一樣,即與bxy、byx的符號一樣求出的平方根既可表示y與x的直線相關的程度,也可表示直線相關的性質。統(tǒng)計學上把這樣計算所得的統(tǒng)計量稱為x與y的相關系數(shù)(coefficientofcorrelation),記為r二、相關系數(shù)的計算【例7.6】計算10只綿羊的胸圍(cm)和體重(kg)的相關系數(shù)。
10只綿羊胸圍和體重資料下一張
主頁
退出
上一張
依據(jù)表所列數(shù)據(jù)先計算出:代入公式得:即綿羊胸圍與體重的相關系數(shù)為0.8475。下一張
主頁
退出
上一張
三、相關系數(shù)的顯著性檢驗上述依據(jù)實際觀測值計算得來的相關系數(shù)r是樣本相關系數(shù),它是雙變量正態(tài)總體中的總體相關系數(shù)ρ的估計值。樣本相關系數(shù)r是否來自ρ≠0的總體,還須對樣本相關系數(shù)r進行顯著性檢驗。此時無效假設、備擇假設為HO:ρ=0,HA:ρ≠0。與直線回來關系顯著性檢驗一樣,可接受t檢驗法與F檢驗法對相關系數(shù)r的顯著性進行檢驗。
t檢驗的計算公式為:t=,df=n-2(8-27)其中,,叫做相關系數(shù)標準誤。F檢驗的計算公式為:F=,df1=1,df2=n-2(8-28)下一張
主頁
退出
上一張
可干脆用查表法對相關系數(shù)r進行顯著性檢驗。具體作法是:(1)先根據(jù)自由度n-2查臨界r值,得,(2)若|r|<,P>0.05,則相關系數(shù)r不顯著,在r的右上方標記“ns”;(3)若≤|r|<,0.01<P≤0.05,則相關系數(shù)r顯著,在r的右上方標記“*”;(4)若|r|≥,P≤0.01,則相關系數(shù)r極顯著,在r的右上方標記“**”。
四、相關系數(shù)與回來系數(shù)的關系從相關系數(shù)計算公式的導出可以看到:相關變量x與y的相關系數(shù)r是y對x的回來系數(shù)與x對y的相關系數(shù)bxv的幾何平均數(shù)下一張
主頁
退出
上一張
表明直線相關分析與回來分析關系特殊親密。它們的探討對象都是呈直線關系的相關變量。直線回來分析將二個相關變量區(qū)分為自變量和依變量,側重于尋求它們之間的聯(lián)系形式-直線回來方程;直線相關分析不區(qū)分自變量和依變量,側重于揭示它們之間的聯(lián)系程度和性質-計算出相關系數(shù)。兩種分析所進行的顯著性檢驗都是解決y與x間是否存在直線關系。因而二者的檢驗是等價的。即相關系數(shù)顯著,回來系數(shù)亦顯著;相關系數(shù)不顯著,回來系數(shù)也必定不顯著。由于利用查表法對相關系數(shù)進行檢驗特殊簡便,因此在實際進行直線回來分析時,可用相關系數(shù)顯著性檢驗代替直線回來關系顯著性檢驗即可先計算出相關系數(shù)r并對其進行顯著性檢驗,若檢驗結果r不顯著,則用不著建立直線回來方程;若r顯著,再計算回來系數(shù)b、回來截距a,建立直線回來方程,此時所建立的直線回來方程代表的直線關系是真實的,可利用來進行預料和限制。下一張
主頁
退出
上一張
五、應用直線回來與相關的留意事項直線回來分析與相關分析在生物科學探討領域中已得到了廣泛的應用,但在實際工作中卻很簡潔被誤用或作出錯誤的說明。為了正確地應用直線回來
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度綠色建筑鋼筋綁扎與回收利用合同4篇
- 江蘇省無錫市錫山區(qū)2019-2020學年八年級下學期期中物理試題【含答案、解析】
- 2025版房屋抵押貸款風險評估與咨詢服務合同4篇
- 股權代持合同簽訂與解除的法律要點2025年合同2篇
- 江西省贛州市瑞金市2024-2025學年八年級上學期期末考試道德與法治試題(含答案)
- 廣東省茂名市電白區(qū)2024-2025學年八年級上學期期末地理試卷(含答案)
- 固體飲料行業(yè)的融資模式與投資機會分析報告考核試卷
- 2025版企業(yè)知識產(chǎn)權保護委托合同范本指南3篇
- 東南歐eMAG知識百科 2025
- 2001年江蘇南通中考滿分作文《我發(fā)現(xiàn)女孩也可做“太陽”》
- 《健康體檢知識》課件
- 蘇少版七年級美術下冊 全冊
- 名表買賣合同協(xié)議書
- JTG-T-F20-2015公路路面基層施工技術細則
- 2024年遼寧石化職業(yè)技術學院單招職業(yè)適應性測試題庫附答案
- 中西方校服文化差異研究
- 《子宮肉瘤》課件
- 《準媽媽衣食住行》課件
- 給男友的道歉信10000字(十二篇)
- 客人在酒店受傷免責承諾書范本
- 練字本方格模板
評論
0/150
提交評論