版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
線性回歸和相關(guān)線性回歸和相關(guān)1(優(yōu)選)線性回歸和相關(guān)(優(yōu)選)線性回歸和相關(guān)2不同飼料組大鼠肝中維生素A的含量(IU/g)不同飼料組大鼠肝中維生素A的含量(IU/g)312只大鼠的進(jìn)食量與體重增生量12只大鼠的進(jìn)食量與體重增生量4在生物學(xué)中,還有很多現(xiàn)象之間有類似的或強(qiáng)或弱的相互依存關(guān)系.例如身高與體重、體溫與脈搏、年齡與血壓、毒物劑量與動物的存活時間等等。在生物學(xué)中,還有很多現(xiàn)象之間有類似的或強(qiáng)或弱的相互依存關(guān)系.5回歸的由來英國統(tǒng)計學(xué)家PearsonK(18571936)1903搜集了1078個家庭人員的身高、前臂長等指標(biāo)的記錄,發(fā)現(xiàn)兒子的身高(Y,英寸)與父親的身高(X,英寸)存在線性關(guān)系。K.皮爾遜(K.Pearson,1857-1936)回歸的由來英國統(tǒng)計學(xué)家PearsonK(185719366回歸的由來Galton將這種趨向于種族穩(wěn)定的現(xiàn)象稱之為“回歸”(regression).“回歸”逐漸發(fā)展成為分析兩個變量或多個變量之間某種數(shù)量依存關(guān)系的一類統(tǒng)計方法。(Francis
Galton,1822-1911)回歸的由來Galton將這種趨向于種族穩(wěn)定的現(xiàn)象稱之為“回歸78.18.188.1直線回歸在實(shí)際生活中,很多雙變量間關(guān)系呈直線趨勢,但不是嚴(yán)格的直線關(guān)系,為了區(qū)別于兩變量間的直線關(guān)系,我們稱這種關(guān)系為直線回歸。直線回歸仍用直線方程來描述兩變量間的回歸關(guān)系,但稱為直線回歸方程。直線方程:y=a+bx直線回歸方程:確定性關(guān)系函數(shù)關(guān)系非確定性關(guān)系相關(guān)關(guān)系8.1直線回歸在實(shí)際生活中,很多雙變量間關(guān)系呈直線趨勢,但98.1.1、直線回歸的概念實(shí)例某地12名女大學(xué)生的體重與肺活量的測量值如下
兩變量之間存在一定關(guān)系,但不十分確定的。表現(xiàn)在X與Y的散點(diǎn)圖中,散點(diǎn)有回歸到某條直線上去的趨勢,這種關(guān)系稱為直線回歸。
8.28.1.1、直線回歸的概念實(shí)例某地12名女大學(xué)生的體重10相關(guān):只說明是否有關(guān)聯(lián)。CASIOfx3600PA條件兩變量(X,Y)都是來自正態(tài)分布的隨機(jī)變量58.53293.(1)回歸直線應(yīng)在X的實(shí)測范圍內(nèi)或?qū)嶋H可應(yīng)用范圍內(nèi)繪制,不要任意延長。y發(fā)育歷期;例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下00250076.05,拒絕H0,接受H1。y(Tt)=KK有效積溫;Sb為回歸系數(shù)的標(biāo)準(zhǔn)誤2)x必須是簡單性狀,y必須是難于觀測的復(fù)雜性狀。在實(shí)際生活中,很多雙變量間關(guān)系呈直線趨勢,但不是嚴(yán)格的直線關(guān)系,為了區(qū)別于兩變量間的直線關(guān)系,我們稱這種關(guān)系為直線回歸。1狗的紅血細(xì)胞數(shù)(y,單位百萬個)和填充細(xì)胞體長度(x,單位mm)的關(guān)系表現(xiàn)在X與Y的散點(diǎn)圖中,散點(diǎn)有回歸到某條直線上去的趨勢,這種關(guān)系稱為直線回歸。當(dāng)x、y為確定性關(guān)系時y=a+bxa為截距,b為斜率(x每增加一個單位,y平均增加或減少的單位數(shù),b=tgα)相關(guān):只說明是否有關(guān)聯(lián)。當(dāng)x、y為確定性關(guān)系時y=a+bx11當(dāng)x、y為不確定關(guān)系時線性回歸和相關(guān)精選課件128.1.2直線回歸方程式的建立
(1)一般表達(dá)式
a:截距,直線與Y軸交點(diǎn)的縱坐標(biāo)。b:斜率,又稱回歸系數(shù),用來描述Y依賴X的直線變化的數(shù)量關(guān)系與大小。
意義:X每改變一個單位,Y平均改變b個單位。8.1.2直線回歸方程式的建立(1)一般表達(dá)式a:截距13
b>0,y隨x的增大而增大---斜上;
b<0,y隨x的增大而減小---斜下;
b=0,y與x無直線回歸關(guān)系---水平。
|b|越大,表示y隨x變化越快,直線越陡峭。a>0a=0a<0b>0b=0b<0b>0,y隨x的增大而增大---斜上14(2)確定直線回歸方程的準(zhǔn)則(參數(shù)a和b的估計)(2)確定直線回歸方程的準(zhǔn)則(參數(shù)a和b的估計)15線性回歸和相關(guān)精選課件160,回歸有意義。Sumofsquare05,不拒絕H0,若rr0.如果兩H0均被接受,則可認(rèn)為兩組數(shù)據(jù)是抽自同一總體,從而將兩回歸方程合并,得到一個更加精確的方程。直線方程:y=a+bx則“+”的乘積占優(yōu)勢,點(diǎn)的趨勢6應(yīng)用直線回歸應(yīng)注意事項:而且越大,例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下描述兩變量間是否有直線關(guān)系以及直線關(guān)系的方向和密切程度的分析方法。表現(xiàn)在X與Y的散點(diǎn)圖中,散點(diǎn)有回歸到某條直線上去的趨勢,這種關(guān)系稱為直線回歸。附計算器的相關(guān)和回歸功能(優(yōu)選)線性回歸和相關(guān)1“狗紅血細(xì)胞數(shù)和填充細(xì)胞體長度”的回歸模型作顯著性檢驗(yàn)應(yīng)對回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)。公式 ~t(df=n-2)4直線回歸的區(qū)間估計7Σxy=3441.05,拒絕H0,接受H1。0,回歸有意義。17XY乘積和X的平方和XY乘積和X的平方和18線性回歸和相關(guān)精選課件19例8.1狗的紅血細(xì)胞數(shù)(y,單位百萬個)和填充細(xì)胞體長度(x,單位mm)的關(guān)系xyxyx2y2456.53293.85202542.6409426.30264.60176439.6900569.52533.12313690.6304487.50360.00230456.2500426.99293.58176448.8601355.90206.50122534.8100589.49550.42336490.0601406.20248.00160038.4400396.55255.45152142.9025508.72436.00250076.0384Σx=455Σy=73.7Σxy=3441.52Σx2=21203Σy2=560.3224例8.1狗的紅血細(xì)胞數(shù)(y,單位百萬個)和填充細(xì)胞體長度(x20圖狗紅血細(xì)胞數(shù)與填充細(xì)胞長度的關(guān)系圖狗紅血細(xì)胞數(shù)與填充細(xì)胞長度的關(guān)系21線性回歸和相關(guān)精選課件22線性回歸和相關(guān)精選課件23例8.2某地10名女中學(xué)生的體重與肺活量數(shù)據(jù)如下,試進(jìn)行肺活量y(L)對體重x(kg)的回歸分析。⑶計算步驟:
表12-1某地10名女中學(xué)生的體重與肺活量數(shù)據(jù)例8.2某地10名女中學(xué)生的體重與肺活量數(shù)據(jù)如下24y復(fù)雜的、調(diào)查困難的、真正要調(diào)查性狀。1)設(shè)總體相關(guān)系數(shù)為ρ,H0ρ=0則“+”的乘積占優(yōu)勢,點(diǎn)的趨勢病蟲害預(yù)測預(yù)報因子的選擇類型則“+”的乘積占優(yōu)勢,點(diǎn)的趨勢[4]LD50或LC50的計算零相關(guān)零相關(guān)零相關(guān)r說明具有直線關(guān)系的兩個變量間關(guān)系的密切程度和方向。MODE2進(jìn)入相關(guān)與回歸LR124.不同飼料組大鼠肝中維生素A的含量(IU/g)例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下r說明具有直線關(guān)系的兩個變量間關(guān)系的密切程度和方向。1狗的紅血細(xì)胞數(shù)(y,單位百萬個)和填充細(xì)胞體長度(x,單位mm)的關(guān)系Sumofsquare12只大鼠的進(jìn)食量與體重增生量3相關(guān)系數(shù)示意圖124.r說明具有直線關(guān)系的兩個變量間關(guān)系的密切程度和方向?;貧w:由一個變量值推算另一個變量的數(shù)值,說明依存變化的數(shù)量關(guān)系。//由數(shù)據(jù)及散點(diǎn)圖初步分析,有直線趨勢時轉(zhuǎn)入下步(否則不能作此分析)。
8.2y復(fù)雜的、調(diào)查困難的、真正要調(diào)查性狀。//由數(shù)據(jù)及25求合計數(shù)列出回歸方程求合計數(shù)列出回歸方程26直線回歸方程的圖示
//注意:(1)回歸直線應(yīng)在X的實(shí)測范圍內(nèi)或?qū)嶋H可應(yīng)用范圍內(nèi)繪制,不要任意延長。(3)直線與縱軸交點(diǎn)的縱坐標(biāo)為截距a8.2直線回歸方程的圖示//注意:(3)直線與縱軸交點(diǎn)的縱坐標(biāo)278.1.3回歸系數(shù)的假設(shè)檢驗(yàn)樣本回歸系數(shù)b≠0原因①由于抽樣誤差引起,β=0 ②存在回歸關(guān)系,β≠0問題:總體回歸方程是否成立(即總體回歸系數(shù)β是否為0)?若=0,則Y不依賴于X,回歸無意義;0,回歸有意義。----假設(shè)檢驗(yàn):方差分析或t檢驗(yàn)
8.1.3回歸系數(shù)的假設(shè)檢驗(yàn)樣本回歸系數(shù)b≠0原因問題:總體28[1]方差分析F檢驗(yàn)1)變異來源總體Y的變異由2個原因a)x的變動引起y的變異(回歸,regression)b)其他因素——除回歸因素以外的因素,是隨機(jī)誤差。也稱為剩余(殘差,residuals)因素或離回歸因素。[1]方差分析F檢驗(yàn)292)平方和的分解2)平方和的分解30SSYSSRSSESSYSSRSSE312)自由度的分解:自由度的分解2)自由度的分解:自由度的分解323)原假設(shè)H0B=04)統(tǒng)計量3)原假設(shè)H0B=033方差分析表SourceDegreeoffreedomSumofsquareMeansquareFRegression1SSRMSRMSR/MSEResidualsn-2SSEMSETotaln-1SSY方差分析表SourceDegreeoffreedomSu34[2]
t檢驗(yàn)
公式
~t(df=n-2)Sb為回歸系數(shù)的標(biāo)準(zhǔn)誤理論上,同一份資料,F(xiàn)檢驗(yàn)和t檢驗(yàn)有關(guān)系式t2=F。
[2]t檢驗(yàn)公式 ~t(df=n-235請對例8.1“狗紅血細(xì)胞數(shù)和填充細(xì)胞體長度”的回歸模型作顯著性檢驗(yàn)請對例8.1“狗紅血細(xì)胞數(shù)和填充細(xì)胞體長度”的回歸模型作顯著36SourceDegreeoffreedomSumofsquareMeansquareFRegression115.5315.5376.69**Residuals81.620.2025Total917.15方差分析表SourceDegreeoffreedomSumof37線性回歸和相關(guān)精選課件38兩個回歸方程的比較利用F值和t值還可以進(jìn)行兩回歸方程的比較,即檢驗(yàn)H0B1=B2,H0A1=A2如果兩H0均被接受,則可認(rèn)為兩組數(shù)據(jù)是抽自同一總體,從而將兩回歸方程合并,得到一個更加精確的方程。見書119頁例8.3。兩個回歸方程的比較利用F值和t值還可以進(jìn)行兩回歸方程的比較,39(1)回歸系數(shù)的區(qū)間估計8.1.4直線回歸的區(qū)間估計
(1)回歸系數(shù)的區(qū)間估計8.1.4直線回歸的區(qū)間估計40(2)總體均值(2)總體均值41[1]預(yù)測:病蟲害發(fā)生期和發(fā)生量預(yù)測病蟲害預(yù)測預(yù)報因子的選擇類型氣象因子如氣溫、濕度、雨量、日照時數(shù)等;病蟲害本身前一時期發(fā)生情況的數(shù)據(jù)如發(fā)生量、發(fā)生期、為害程度等;寄主植物的發(fā)育期;天敵的種類、密度等。(P124~125)8.1.5回歸方程的應(yīng)用[1]預(yù)測:病蟲害發(fā)生期和發(fā)生量預(yù)測8.1.5回歸方程的應(yīng)42[2]控制如果希望在區(qū)間(c,d)內(nèi)取值,應(yīng)如何確定x的控制范圍(x1,x2),即為控制問題。在企業(yè)質(zhì)量管理(QC)等較為常用。[2]控制43[3]昆蟲(病原物)發(fā)育起點(diǎn)溫度及有效積溫的計算y(Tt)=KK有效積溫;t發(fā)育起點(diǎn)溫度;y發(fā)育歷期;T環(huán)境溫度為求K和t,可把上式寫成T=t+KVV為發(fā)育速率(1/y)為方便計算把V定為相對發(fā)育速率(V‘)例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下T(oC)y(天)V’18.333.52.9821.124.34.1124.916.36.1328.011.48.7730.59.310.7531.58.711.4935.08.511.76[3]昆蟲(病原物)發(fā)育起點(diǎn)溫度及有效積溫的計算4490206.當(dāng)x、y為確定性關(guān)系時y=a+bx利用F值和t值還可以進(jìn)行兩回歸方程的比較,a為截距,b為斜率(x每增加一個單位,y平均增加或減少的單位數(shù),b=tgα)如果大多數(shù)的點(diǎn)落在I、III象限,1)直線相關(guān)系數(shù)的意義和計算05(df),則P0.病蟲害預(yù)測預(yù)報因子的選擇類型50360.回歸:由一個變量值推算另一個變量的數(shù)值,說明依存變化的數(shù)量關(guān)系。x(個/單位):63121228321227231219171212121320211914Galton將這種趨向于種族穩(wěn)定的現(xiàn)象稱之為“回歸”(regression).(3)直線與縱軸交點(diǎn)的縱坐標(biāo)為截距a49550.T(oC)y(天)V’回歸:由一個變量值推算另一個變量的數(shù)值,說明依存變化的數(shù)量關(guān)系。圖狗紅血細(xì)胞數(shù)與填充細(xì)胞長度的關(guān)系|b|越大,表示y隨x變化越快,直線越陡峭。05,拒絕H0,接受H1。(4)取值范圍:-∞<b<+∞;[4]LD50或LC50的計算例劑量(y)供試蟲數(shù)死亡蟲數(shù)死亡率(%)(x)8001000.0100010110.0120010330.0140010770.0160010880.0180010990.020001010100.090206.[4]LD50或LC50的計45[5]雙重取樣x簡單的、容易調(diào)查的性狀;y復(fù)雜的、調(diào)查困難的、真正要調(diào)查性狀。雙重取樣的條件1)x、y必須存在顯著的線性相關(guān)關(guān)系;2)x必須是簡單性狀,y必須是難于觀測的復(fù)雜性狀。例玉米螟幼蟲的調(diào)查玉米螟(y)難于調(diào)查;玉米螟蛀孔(x)容易調(diào)查?,F(xiàn)調(diào)查20個單位,每單位5株玉米,數(shù)據(jù)如下x(個/單位):63121228321227231219171212121320211914y(頭/單位):31681218101615612107555101286[5]雙重取樣468.1.6應(yīng)用直線回歸應(yīng)注意事項:1.
回歸方程要有實(shí)際意義。2.
分析前繪制散點(diǎn)圖(直線否?異常點(diǎn)?)。3.兩變量有直線關(guān)系時,不一定是因果關(guān)系。4.應(yīng)對回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)。5.
直線回歸的適用范圍一般以自變量的取值范圍為限 沒有充分理由X的取值不要外延。8.1.6應(yīng)用直線回歸應(yīng)注意事項:478.2
直線相關(guān)大綱要求1)直線相關(guān)系數(shù)的意義和計算2)直線相關(guān)系數(shù)的假設(shè)檢驗(yàn)3)直線回歸系數(shù)與相關(guān)系數(shù)的區(qū)別和聯(lián)系8.2
直線相關(guān)大綱要求48線性相關(guān)分析----描述兩變量間是否有直線關(guān)系以及直線關(guān)系的方向和密切程度的分析方法。8.2.1直線相關(guān)的概念
條件兩變量(X,Y)都是來自正態(tài)分布的隨機(jī)變量線性相關(guān)分析----8.2.1直線相關(guān)的概念條件兩變量(X49圖10.3相關(guān)系數(shù)示意圖
散點(diǎn)呈橢圓形分布,x、y同時增減---正相關(guān)(postivecorrelation);
x、y此增彼減---負(fù)相關(guān)(negativecorrelation)。散點(diǎn)在一條直線上:
x、y變化趨勢相同----完全正相關(guān);
反向變化----完全負(fù)相關(guān)。圖10.3相關(guān)系數(shù)示意圖散點(diǎn)呈橢圓形分布,散50
x、y變化互不影響----零相關(guān)(zerocorrelation);零相關(guān)零相關(guān)零相關(guān)r≌0r≌0r≌0x、y變化互不影響----零相關(guān)(zerocorre518.2.2相關(guān)系數(shù)(r)的推導(dǎo)以如果作平行于原坐標(biāo)軸,以為新坐標(biāo)的原點(diǎn),在新坐標(biāo)中,任一點(diǎn)的坐標(biāo)為如果大多數(shù)的點(diǎn)落在I、III象限,則“+”的乘積占優(yōu)勢,點(diǎn)的趨勢為正相關(guān);如果大多數(shù)的點(diǎn)落在II、IV象限,則“”的乘積占優(yōu)勢,點(diǎn)的趨勢為負(fù)相關(guān)。而且越大,點(diǎn)(x,y)越靠近一條直線。8.2.2相關(guān)系數(shù)(r)的推導(dǎo)52線性回歸和相關(guān)精選課件53線性回歸和相關(guān)精選課件54根據(jù)以前的推導(dǎo)結(jié)果,有決定系數(shù)根據(jù)以前的推導(dǎo)結(jié)果,有決定系數(shù)55r≠0原因①由于抽樣誤差引起,ρ=0 ②存在相關(guān)關(guān)系,ρ≠08.2.3相關(guān)系數(shù)的假設(shè)檢驗(yàn)
問題:總體相關(guān)系數(shù)ρ是否有統(tǒng)計學(xué)意義?若H0:ρ=0,則X與Y無相關(guān)關(guān)系;H1:ρ0,相關(guān)有意義----假設(shè)檢驗(yàn):直接查r界值表或采用t檢驗(yàn)r≠0原因①由于抽樣誤差引起,ρ=08.2.56根據(jù)自由度(df=n1)查相關(guān)系數(shù)r界值表(表C6),查出r0.05(df),若rr0.05(df),則P0.05,不拒絕H0,若rr0.05(df),則P0.05,拒絕H0,接受H1。[1]查表法根據(jù)自由度(df=n1)查相關(guān)系數(shù)r界值表(表C6)570,回歸有意義?!盎貧w”逐漸發(fā)展成為分析兩個變量或多個變量之間某種數(shù)量依存關(guān)系的一類統(tǒng)計方法。7Σxy=3441.LR=LinearRegression1狗的紅血細(xì)胞數(shù)(y,單位百萬個)和填充細(xì)胞體長度(x,單位mm)的關(guān)系r說明具有直線關(guān)系的兩個變量間關(guān)系的密切程度和方向。8001000.點(diǎn)(x,y)越靠近一條直線。r說明具有直線關(guān)系的兩個變量間關(guān)系的密切程度和方向。2相關(guān)系數(shù)(r)的推導(dǎo)(Francis
Galton,[1]方差分析F檢驗(yàn)00160038.Galton將這種趨向于種族穩(wěn)定的現(xiàn)象稱之為“回歸”(regression).(1)回歸直線應(yīng)在X的實(shí)測范圍內(nèi)或?qū)嶋H可應(yīng)用范圍內(nèi)繪制,不要任意延長。而且越大,病蟲害本身前一時期發(fā)生情況的數(shù)據(jù)如發(fā)生量、發(fā)生期、為害程度等;例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下如果兩H0均被接受,則可認(rèn)為兩組數(shù)據(jù)是抽自同一總體,從而將兩回歸方程合并,得到一個更加精確的方程。508.當(dāng)x、y為不確定關(guān)系時[2]t檢驗(yàn)1)設(shè)總體相關(guān)系數(shù)為ρ,H0ρ=02)統(tǒng)計量0,回歸有意義。58線性回歸和相關(guān)精選課件591)區(qū)別8.2.4直線回歸與相關(guān)的區(qū)別與聯(lián)系
⑴資料要求不同
②x、y服從雙變量正態(tài)分布----Ⅱ型回歸
①y正態(tài)隨機(jī)變量,x為選定變量----Ⅰ型回歸
回歸⑵應(yīng)用:回歸:由一個變量值推算另一個變量的數(shù)值,說明依存變化的數(shù)量關(guān)系。相關(guān):只說明是否有關(guān)聯(lián)。
相關(guān)1)區(qū)別8.2.4直線回歸與相關(guān)的區(qū)別與聯(lián)系⑴資料要60回歸系數(shù)b
和相關(guān)系數(shù)r的區(qū)別
回歸系數(shù)b和相關(guān)系數(shù)r的區(qū)別613)
意義:b表示X每增(減)一個單位,Y平均改變b個單位;r說明具有直線關(guān)系的兩個變量間關(guān)系的密切程度和方向。
(4)
取值范圍:-∞<b<+∞;-1<r<+1。
(5)
回歸系數(shù)有單位,相關(guān)系數(shù)無單位。3)意義:622)關(guān)系⑴方向一致對一組數(shù)據(jù)若同時計算r與b,其正負(fù)號一致
。
(2)假設(shè)檢驗(yàn)等價對同一樣本,tr=tb,值相等。
(3)用回歸解釋相關(guān)。
決定系數(shù):
反映Y的總變異中有多大可能可由X來解釋。越接近1,回歸的效果越好。
2)關(guān)系⑴方向一致(2)假設(shè)檢驗(yàn)等價(3)用回歸解釋63附計算器的相關(guān)和回歸功能CASIOfx3600PAMODE2進(jìn)入相關(guān)與回歸LRSHIFTAC清除內(nèi)存x1[(…y1RUN輸入一組數(shù)據(jù)KoutSHIFTLR=LinearRegression附計算器的相關(guān)和回歸功能641)冪函數(shù)8.3曲線問題線性化1)冪函數(shù)8.3曲線問題線性化652)指數(shù)函數(shù)2)指數(shù)函數(shù)663)雙曲線3)雙曲線674)對數(shù)函數(shù)4)對數(shù)函數(shù)68例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下描述兩變量間是否有直線關(guān)系以及直線關(guān)系的方向和密切程度的分析方法。①y正態(tài)隨機(jī)變量,x為選定變量----Ⅰ型回歸00160038.58.426.(3)直線與縱軸交點(diǎn)的縱坐標(biāo)為截距a回歸:由一個變量值推算另一個變量的數(shù)值,說明依存變化的數(shù)量關(guān)系。由數(shù)據(jù)及散點(diǎn)圖初步分析,有直線趨勢時轉(zhuǎn)入下步(否則不能作此分析)。426.|b|越大,表示y隨x變化越快,直線越陡峭。160010880.則“+”的乘積占優(yōu)勢,點(diǎn)的趨勢如果兩H0均被接受,則可認(rèn)為兩組數(shù)據(jù)是抽自同一總體,從而將兩回歸方程合并,得到一個更加精確的方程。例如身高與體重、體溫與脈搏、年齡與血壓、毒物劑量與動物的存活時間等等。05,拒絕H0,接受H1。病蟲害本身前一時期發(fā)生情況的數(shù)據(jù)如發(fā)生量、發(fā)生期、為害程度等;②x、y服從雙變量正態(tài)分布----Ⅱ型回歸描述兩變量間是否有直線關(guān)系以及直線關(guān)系的方向和密切程度的分析方法。5)S型曲線例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下5)S型曲線69線性回歸和相關(guān)線性回歸和相關(guān)70(優(yōu)選)線性回歸和相關(guān)(優(yōu)選)線性回歸和相關(guān)71不同飼料組大鼠肝中維生素A的含量(IU/g)不同飼料組大鼠肝中維生素A的含量(IU/g)7212只大鼠的進(jìn)食量與體重增生量12只大鼠的進(jìn)食量與體重增生量73在生物學(xué)中,還有很多現(xiàn)象之間有類似的或強(qiáng)或弱的相互依存關(guān)系.例如身高與體重、體溫與脈搏、年齡與血壓、毒物劑量與動物的存活時間等等。在生物學(xué)中,還有很多現(xiàn)象之間有類似的或強(qiáng)或弱的相互依存關(guān)系.74回歸的由來英國統(tǒng)計學(xué)家PearsonK(18571936)1903搜集了1078個家庭人員的身高、前臂長等指標(biāo)的記錄,發(fā)現(xiàn)兒子的身高(Y,英寸)與父親的身高(X,英寸)存在線性關(guān)系。K.皮爾遜(K.Pearson,1857-1936)回歸的由來英國統(tǒng)計學(xué)家PearsonK(1857193675回歸的由來Galton將這種趨向于種族穩(wěn)定的現(xiàn)象稱之為“回歸”(regression).“回歸”逐漸發(fā)展成為分析兩個變量或多個變量之間某種數(shù)量依存關(guān)系的一類統(tǒng)計方法。(Francis
Galton,1822-1911)回歸的由來Galton將這種趨向于種族穩(wěn)定的現(xiàn)象稱之為“回歸768.18.1778.1直線回歸在實(shí)際生活中,很多雙變量間關(guān)系呈直線趨勢,但不是嚴(yán)格的直線關(guān)系,為了區(qū)別于兩變量間的直線關(guān)系,我們稱這種關(guān)系為直線回歸。直線回歸仍用直線方程來描述兩變量間的回歸關(guān)系,但稱為直線回歸方程。直線方程:y=a+bx直線回歸方程:確定性關(guān)系函數(shù)關(guān)系非確定性關(guān)系相關(guān)關(guān)系8.1直線回歸在實(shí)際生活中,很多雙變量間關(guān)系呈直線趨勢,但788.1.1、直線回歸的概念實(shí)例某地12名女大學(xué)生的體重與肺活量的測量值如下
兩變量之間存在一定關(guān)系,但不十分確定的。表現(xiàn)在X與Y的散點(diǎn)圖中,散點(diǎn)有回歸到某條直線上去的趨勢,這種關(guān)系稱為直線回歸。
8.28.1.1、直線回歸的概念實(shí)例某地12名女大學(xué)生的體重79相關(guān):只說明是否有關(guān)聯(lián)。CASIOfx3600PA條件兩變量(X,Y)都是來自正態(tài)分布的隨機(jī)變量58.53293.(1)回歸直線應(yīng)在X的實(shí)測范圍內(nèi)或?qū)嶋H可應(yīng)用范圍內(nèi)繪制,不要任意延長。y發(fā)育歷期;例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下00250076.05,拒絕H0,接受H1。y(Tt)=KK有效積溫;Sb為回歸系數(shù)的標(biāo)準(zhǔn)誤2)x必須是簡單性狀,y必須是難于觀測的復(fù)雜性狀。在實(shí)際生活中,很多雙變量間關(guān)系呈直線趨勢,但不是嚴(yán)格的直線關(guān)系,為了區(qū)別于兩變量間的直線關(guān)系,我們稱這種關(guān)系為直線回歸。1狗的紅血細(xì)胞數(shù)(y,單位百萬個)和填充細(xì)胞體長度(x,單位mm)的關(guān)系表現(xiàn)在X與Y的散點(diǎn)圖中,散點(diǎn)有回歸到某條直線上去的趨勢,這種關(guān)系稱為直線回歸。當(dāng)x、y為確定性關(guān)系時y=a+bxa為截距,b為斜率(x每增加一個單位,y平均增加或減少的單位數(shù),b=tgα)相關(guān):只說明是否有關(guān)聯(lián)。當(dāng)x、y為確定性關(guān)系時y=a+bx80當(dāng)x、y為不確定關(guān)系時線性回歸和相關(guān)精選課件818.1.2直線回歸方程式的建立
(1)一般表達(dá)式
a:截距,直線與Y軸交點(diǎn)的縱坐標(biāo)。b:斜率,又稱回歸系數(shù),用來描述Y依賴X的直線變化的數(shù)量關(guān)系與大小。
意義:X每改變一個單位,Y平均改變b個單位。8.1.2直線回歸方程式的建立(1)一般表達(dá)式a:截距82
b>0,y隨x的增大而增大---斜上;
b<0,y隨x的增大而減小---斜下;
b=0,y與x無直線回歸關(guān)系---水平。
|b|越大,表示y隨x變化越快,直線越陡峭。a>0a=0a<0b>0b=0b<0b>0,y隨x的增大而增大---斜上83(2)確定直線回歸方程的準(zhǔn)則(參數(shù)a和b的估計)(2)確定直線回歸方程的準(zhǔn)則(參數(shù)a和b的估計)84線性回歸和相關(guān)精選課件850,回歸有意義。Sumofsquare05,不拒絕H0,若rr0.如果兩H0均被接受,則可認(rèn)為兩組數(shù)據(jù)是抽自同一總體,從而將兩回歸方程合并,得到一個更加精確的方程。直線方程:y=a+bx則“+”的乘積占優(yōu)勢,點(diǎn)的趨勢6應(yīng)用直線回歸應(yīng)注意事項:而且越大,例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下描述兩變量間是否有直線關(guān)系以及直線關(guān)系的方向和密切程度的分析方法。表現(xiàn)在X與Y的散點(diǎn)圖中,散點(diǎn)有回歸到某條直線上去的趨勢,這種關(guān)系稱為直線回歸。附計算器的相關(guān)和回歸功能(優(yōu)選)線性回歸和相關(guān)1“狗紅血細(xì)胞數(shù)和填充細(xì)胞體長度”的回歸模型作顯著性檢驗(yàn)應(yīng)對回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)。公式 ~t(df=n-2)4直線回歸的區(qū)間估計7Σxy=3441.05,拒絕H0,接受H1。0,回歸有意義。86XY乘積和X的平方和XY乘積和X的平方和87線性回歸和相關(guān)精選課件88例8.1狗的紅血細(xì)胞數(shù)(y,單位百萬個)和填充細(xì)胞體長度(x,單位mm)的關(guān)系xyxyx2y2456.53293.85202542.6409426.30264.60176439.6900569.52533.12313690.6304487.50360.00230456.2500426.99293.58176448.8601355.90206.50122534.8100589.49550.42336490.0601406.20248.00160038.4400396.55255.45152142.9025508.72436.00250076.0384Σx=455Σy=73.7Σxy=3441.52Σx2=21203Σy2=560.3224例8.1狗的紅血細(xì)胞數(shù)(y,單位百萬個)和填充細(xì)胞體長度(x89圖狗紅血細(xì)胞數(shù)與填充細(xì)胞長度的關(guān)系圖狗紅血細(xì)胞數(shù)與填充細(xì)胞長度的關(guān)系90線性回歸和相關(guān)精選課件91線性回歸和相關(guān)精選課件92例8.2某地10名女中學(xué)生的體重與肺活量數(shù)據(jù)如下,試進(jìn)行肺活量y(L)對體重x(kg)的回歸分析。⑶計算步驟:
表12-1某地10名女中學(xué)生的體重與肺活量數(shù)據(jù)例8.2某地10名女中學(xué)生的體重與肺活量數(shù)據(jù)如下93y復(fù)雜的、調(diào)查困難的、真正要調(diào)查性狀。1)設(shè)總體相關(guān)系數(shù)為ρ,H0ρ=0則“+”的乘積占優(yōu)勢,點(diǎn)的趨勢病蟲害預(yù)測預(yù)報因子的選擇類型則“+”的乘積占優(yōu)勢,點(diǎn)的趨勢[4]LD50或LC50的計算零相關(guān)零相關(guān)零相關(guān)r說明具有直線關(guān)系的兩個變量間關(guān)系的密切程度和方向。MODE2進(jìn)入相關(guān)與回歸LR124.不同飼料組大鼠肝中維生素A的含量(IU/g)例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下r說明具有直線關(guān)系的兩個變量間關(guān)系的密切程度和方向。1狗的紅血細(xì)胞數(shù)(y,單位百萬個)和填充細(xì)胞體長度(x,單位mm)的關(guān)系Sumofsquare12只大鼠的進(jìn)食量與體重增生量3相關(guān)系數(shù)示意圖124.r說明具有直線關(guān)系的兩個變量間關(guān)系的密切程度和方向。回歸:由一個變量值推算另一個變量的數(shù)值,說明依存變化的數(shù)量關(guān)系。//由數(shù)據(jù)及散點(diǎn)圖初步分析,有直線趨勢時轉(zhuǎn)入下步(否則不能作此分析)。
8.2y復(fù)雜的、調(diào)查困難的、真正要調(diào)查性狀。//由數(shù)據(jù)及94求合計數(shù)列出回歸方程求合計數(shù)列出回歸方程95直線回歸方程的圖示
//注意:(1)回歸直線應(yīng)在X的實(shí)測范圍內(nèi)或?qū)嶋H可應(yīng)用范圍內(nèi)繪制,不要任意延長。(3)直線與縱軸交點(diǎn)的縱坐標(biāo)為截距a8.2直線回歸方程的圖示//注意:(3)直線與縱軸交點(diǎn)的縱坐標(biāo)968.1.3回歸系數(shù)的假設(shè)檢驗(yàn)樣本回歸系數(shù)b≠0原因①由于抽樣誤差引起,β=0 ②存在回歸關(guān)系,β≠0問題:總體回歸方程是否成立(即總體回歸系數(shù)β是否為0)?若=0,則Y不依賴于X,回歸無意義;0,回歸有意義。----假設(shè)檢驗(yàn):方差分析或t檢驗(yàn)
8.1.3回歸系數(shù)的假設(shè)檢驗(yàn)樣本回歸系數(shù)b≠0原因問題:總體97[1]方差分析F檢驗(yàn)1)變異來源總體Y的變異由2個原因a)x的變動引起y的變異(回歸,regression)b)其他因素——除回歸因素以外的因素,是隨機(jī)誤差。也稱為剩余(殘差,residuals)因素或離回歸因素。[1]方差分析F檢驗(yàn)982)平方和的分解2)平方和的分解99SSYSSRSSESSYSSRSSE1002)自由度的分解:自由度的分解2)自由度的分解:自由度的分解1013)原假設(shè)H0B=04)統(tǒng)計量3)原假設(shè)H0B=0102方差分析表SourceDegreeoffreedomSumofsquareMeansquareFRegression1SSRMSRMSR/MSEResidualsn-2SSEMSETotaln-1SSY方差分析表SourceDegreeoffreedomSu103[2]
t檢驗(yàn)
公式
~t(df=n-2)Sb為回歸系數(shù)的標(biāo)準(zhǔn)誤理論上,同一份資料,F(xiàn)檢驗(yàn)和t檢驗(yàn)有關(guān)系式t2=F。
[2]t檢驗(yàn)公式 ~t(df=n-2104請對例8.1“狗紅血細(xì)胞數(shù)和填充細(xì)胞體長度”的回歸模型作顯著性檢驗(yàn)請對例8.1“狗紅血細(xì)胞數(shù)和填充細(xì)胞體長度”的回歸模型作顯著105SourceDegreeoffreedomSumofsquareMeansquareFRegression115.5315.5376.69**Residuals81.620.2025Total917.15方差分析表SourceDegreeoffreedomSumof106線性回歸和相關(guān)精選課件107兩個回歸方程的比較利用F值和t值還可以進(jìn)行兩回歸方程的比較,即檢驗(yàn)H0B1=B2,H0A1=A2如果兩H0均被接受,則可認(rèn)為兩組數(shù)據(jù)是抽自同一總體,從而將兩回歸方程合并,得到一個更加精確的方程。見書119頁例8.3。兩個回歸方程的比較利用F值和t值還可以進(jìn)行兩回歸方程的比較,108(1)回歸系數(shù)的區(qū)間估計8.1.4直線回歸的區(qū)間估計
(1)回歸系數(shù)的區(qū)間估計8.1.4直線回歸的區(qū)間估計109(2)總體均值(2)總體均值110[1]預(yù)測:病蟲害發(fā)生期和發(fā)生量預(yù)測病蟲害預(yù)測預(yù)報因子的選擇類型氣象因子如氣溫、濕度、雨量、日照時數(shù)等;病蟲害本身前一時期發(fā)生情況的數(shù)據(jù)如發(fā)生量、發(fā)生期、為害程度等;寄主植物的發(fā)育期;天敵的種類、密度等。(P124~125)8.1.5回歸方程的應(yīng)用[1]預(yù)測:病蟲害發(fā)生期和發(fā)生量預(yù)測8.1.5回歸方程的應(yīng)111[2]控制如果希望在區(qū)間(c,d)內(nèi)取值,應(yīng)如何確定x的控制范圍(x1,x2),即為控制問題。在企業(yè)質(zhì)量管理(QC)等較為常用。[2]控制112[3]昆蟲(病原物)發(fā)育起點(diǎn)溫度及有效積溫的計算y(Tt)=KK有效積溫;t發(fā)育起點(diǎn)溫度;y發(fā)育歷期;T環(huán)境溫度為求K和t,可把上式寫成T=t+KVV為發(fā)育速率(1/y)為方便計算把V定為相對發(fā)育速率(V‘)例棉紅鈴蟲蛹的發(fā)育歷期與溫度的關(guān)系如下T(oC)y(天)V’18.333.52.9821.124.34.1124.916.36.1328.011.48.7730.59.310.7531.58.711.4935.08.511.76[3]昆蟲(病原物)發(fā)育起點(diǎn)溫度及有效積溫的計算11390206.當(dāng)x、y為確定性關(guān)系時y=a+bx利用F值和t值還可以進(jìn)行兩回歸方程的比較,a為截距,b為斜率(x每增加一個單位,y平均增加或減少的單位數(shù),b=tgα)如果大多數(shù)的點(diǎn)落在I、III象限,1)直線相關(guān)系數(shù)的意義和計算05(df),則P0.病蟲害預(yù)測預(yù)報因子的選擇類型50360.回歸:由一個變量值推算另一個變量的數(shù)值,說明依存變化的數(shù)量關(guān)系。x(個/單位):63121228321227231219171212121320211914Galton將這種趨向于種族穩(wěn)定的現(xiàn)象稱之為“回歸”(regression).(3)直線與縱軸交點(diǎn)的縱坐標(biāo)為截距a49550.T(oC)y(天)V’回歸:由一個變量值推算另一個變量的數(shù)值,說明依存變化的數(shù)量關(guān)系。圖狗紅血細(xì)胞數(shù)與填充細(xì)胞長度的關(guān)系|b|越大,表示y隨x變化越快,直線越陡峭。05,拒絕H0,接受H1。(4)取值范圍:-∞<b<+∞;[4]LD50或LC50的計算例劑量(y)供試蟲數(shù)死亡蟲數(shù)死亡率(%)(x)8001000.0100010110.0120010330.0140010770.0160010880.0180010990.020001010100.090206.[4]LD50或LC50的計114[5]雙重取樣x簡單的、容易調(diào)查的性狀;y復(fù)雜的、調(diào)查困難的、真正要調(diào)查性狀。雙重取樣的條件1)x、y必須存在顯著的線性相關(guān)關(guān)系;2)x必須是簡單性狀,y必須是難于觀測的復(fù)雜性狀。例玉米螟幼蟲的調(diào)查玉米螟(y)難于調(diào)查;玉米螟蛀孔(x)容易調(diào)查?,F(xiàn)調(diào)查20個單位,每單位5株玉米,數(shù)據(jù)如下x(個/單位):63121228321227231219171212121320211914y(頭/單位):31681218101615612107555101286[5]雙重取樣1158.1.6應(yīng)用直線回歸應(yīng)注意事項:1.
回歸方程要有實(shí)際意義。2.
分析前繪制散點(diǎn)圖(直線否?異常點(diǎn)?)。3.兩變量有直線關(guān)系時,不一定是因果關(guān)系。4.應(yīng)對回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)。5.
直線回歸的適用范圍一般以自變量的取值范圍為限 沒有充分理由X的取值不要外延。8.1.6應(yīng)用直線回歸應(yīng)注意事項:1168.2
直線相關(guān)大綱要求1)直線相關(guān)系數(shù)的意義和計算2)直線相關(guān)系數(shù)的假設(shè)檢驗(yàn)3)直線回歸系數(shù)與相關(guān)系數(shù)的區(qū)別和聯(lián)系8.2
直線相關(guān)大綱要求117線性相關(guān)分析----描述兩變量間是否有直線關(guān)系以及直線關(guān)系的方向和密切程度的分析方法。8.2.1直線相關(guān)的概念
條件兩變量(X,Y)都是來自正態(tài)分布的隨機(jī)變量線性相關(guān)分析----8.2.1直線相關(guān)的概念條件兩變量(X118圖10.3相關(guān)系數(shù)示意圖
散點(diǎn)呈橢圓形分布,x、y同時增減---正相關(guān)(postivecorrelation);
x、y此增彼減---負(fù)相關(guān)(negativecorrelation)。散點(diǎn)在一條直線上:
x、y變化趨勢相同----完全正相關(guān);
反向變化----完全負(fù)相關(guān)。圖10.3相關(guān)系數(shù)示意圖散點(diǎn)呈橢圓形分布,散119
x、y變化互不影響----零相關(guān)(zerocorrelation);零相關(guān)零相關(guān)零相關(guān)r≌0r≌0r≌0x、y變化互不影響----零相關(guān)(zerocorre1208.2.2相關(guān)系數(shù)(r)的推導(dǎo)以如果作平行于原坐標(biāo)軸,以為新坐標(biāo)的原點(diǎn),在新坐標(biāo)中,任一點(diǎn)的坐標(biāo)為如果大多數(shù)的點(diǎn)落在I、III象限,則“+”的乘積占優(yōu)勢,點(diǎn)的趨勢為正相關(guān);如果大多數(shù)的點(diǎn)落在II、IV象限,則“”的乘積占優(yōu)勢,點(diǎn)的趨勢為負(fù)相關(guān)。而且越大,點(diǎn)(x,y)越靠近一條直線。8.2.2相關(guān)系數(shù)(r)的推導(dǎo)121線性回歸和相關(guān)精選課件122線性回歸和相關(guān)精選課件123根據(jù)以前的推導(dǎo)結(jié)果,有決定系數(shù)根據(jù)以前的推導(dǎo)結(jié)果,有決定系數(shù)124r≠0原因①由于抽樣誤差引起,ρ=0 ②存在相關(guān)關(guān)系,ρ≠08.2.3相關(guān)系數(shù)的假設(shè)檢驗(yàn)
問題:總體相關(guān)系數(shù)ρ是否有統(tǒng)計學(xué)意義?若H0:ρ=0,則X與Y無相關(guān)關(guān)系;H1:ρ0,相關(guān)有意義----假設(shè)檢驗(yàn):直接查r界值表或采用t檢驗(yàn)r≠0原因①由于抽樣誤差引起,ρ=08.2.125根據(jù)自由度(df=n1)查相關(guān)系數(shù)r界值表(表C6),查出r0.05(df),若rr0.0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度新型農(nóng)用拖拉機(jī)進(jìn)口代理銷售合同4篇
- 二零二五年度ktv室內(nèi)裝修消防設(shè)計審核合同3篇
- 二零二五年度教育培訓(xùn)機(jī)構(gòu)退款合同協(xié)議正規(guī)范本2025年版
- 二零二五年度WPS文檔定制化租賃合同修訂版3篇
- 二零二五年度充電樁安裝工程節(jié)能評估合同4篇
- 2025年個人住宅買賣合同(含物業(yè)交割)2篇
- 2025年度智慧停車場運(yùn)營管理承包合同4篇
- 2025年度水暖工程安全質(zhì)量監(jiān)督及驗(yàn)收合同
- 二零二五年度房產(chǎn)抵押貸款風(fēng)險管理與服務(wù)合同4篇
- 2025年度暖氣片銷售區(qū)域代理合同模板
- 2025年度車輛抵押借款合同模板(專業(yè)二手車交易平臺)
- 2025年人民教育出版社有限公司招聘筆試參考題庫含答案解析
- 康復(fù)醫(yī)學(xué)治療技術(shù)(士)復(fù)習(xí)題及答案
- 完整版100以內(nèi)加減法混合運(yùn)算4000道100
- 2024年產(chǎn)權(quán)管理部年終工作總結(jié)例文(3篇)
- 《血管性血友病》課件
- 高三日語一輪復(fù)習(xí)日語助詞「に」和「を」的全部用法課件
- 機(jī)場地勤勞動合同三篇
- 2024年山東省高考政治試卷真題(含答案逐題解析)
- 《用銳角三角函數(shù)解決問題(3)》參考課件
- 訂婚協(xié)議書手寫模板攻略
評論
0/150
提交評論