6回歸與相關(guān)分析_第1頁
6回歸與相關(guān)分析_第2頁
6回歸與相關(guān)分析_第3頁
6回歸與相關(guān)分析_第4頁
6回歸與相關(guān)分析_第5頁
已閱讀5頁,還剩89頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第六章第六章 回歸與相關(guān)分析回歸與相關(guān)分析chapter 6 regression and chapter 6 regression and correlation analysiscorrelation analysis 本章重點和難點本章重點和難點 l理解并掌握回歸與相關(guān)的區(qū)別與聯(lián)系;理解并掌握回歸與相關(guān)的區(qū)別與聯(lián)系;l一元線性回歸的基本原理、方法,線性回歸的一元線性回歸的基本原理、方法,線性回歸的顯著性檢驗、區(qū)間估計和預(yù)測;顯著性檢驗、區(qū)間估計和預(yù)測;l相關(guān)系數(shù)的定義、性質(zhì)和顯著性檢驗;相關(guān)系數(shù)的定義、性質(zhì)和顯著性檢驗;l常用曲線方程的線性化方法及回歸方程擬合情常用曲線方程的線性化方法及

2、回歸方程擬合情況的比較。況的比較。 本章內(nèi)容本章內(nèi)容 l 回歸與相關(guān)的概念回歸與相關(guān)的概念l 一元線性回歸分析一元線性回歸分析l 線性相關(guān)分析線性相關(guān)分析l 一元非線形回歸(可直線化的曲線回歸)一元非線形回歸(可直線化的曲線回歸)第一節(jié)第一節(jié) 回歸與相關(guān)的概念回歸與相關(guān)的概念l【本節(jié)內(nèi)容本節(jié)內(nèi)容】l回歸與相關(guān)的概念回歸與相關(guān)的概念l兩者的主要差別兩者的主要差別一、回歸與相關(guān)的概念一、回歸與相關(guān)的概念l1、回歸分析(、回歸分析(regression analysis)l概念概念:是研究一個隨機(jī)變量是研究一個隨機(jī)變量y y與另一些變與另一些變量(主要為固定變量)關(guān)系的一種統(tǒng)計量(主要為固定變量)關(guān)

3、系的一種統(tǒng)計方法。方法。l即:將一個變量即:將一個變量y y表述為另一些變量的函表述為另一些變量的函數(shù),并通過建立變量間的函數(shù)關(guān)系,達(dá)數(shù),并通過建立變量間的函數(shù)關(guān)系,達(dá)到根據(jù)一個或一些變量的取值去估計或到根據(jù)一個或一些變量的取值去估計或預(yù)測另一個變量的目的。預(yù)測另一個變量的目的。l自變量與因變量自變量與因變量l在某些問題中,在某些問題中,y y隨隨x x的變化而變化的變化而變化lx x帶有帶有“原因原因”的性質(zhì),稱為的性質(zhì),稱為“自變量自變量”ly y帶有帶有“結(jié)果結(jié)果”的性質(zhì),稱為的性質(zhì),稱為“因變量因變量”l有時有時x x和和y y之間并無明顯的因果關(guān)系之間并無明顯的因果關(guān)系l仍然沿用仍然

4、沿用上述名稱上述名稱l一元線性回歸一元線性回歸(linear regression)l如果自變量與因變量都是一個,且如果自變量與因變量都是一個,且y y和和x x大體上有線性關(guān)系,這種研究兩個變量大體上有線性關(guān)系,這種研究兩個變量線性關(guān)系的回歸稱為線性關(guān)系的回歸稱為一元線性回歸一元線性回歸。l多元回歸多元回歸l如果自變量如果自變量x x是多個,如是多個,如x x1 1,x x2 2, ,x xk k,而因變量是一個,而因變量是一個y y,這種研究因變,這種研究因變量量y y與多個自變量與多個自變量x x之間的定量關(guān)系的問之間的定量關(guān)系的問題稱為題稱為多元回歸多元回歸。l回歸分析的研究目的回歸分

5、析的研究目的l變量之間存在怎樣的函數(shù)關(guān)系變量之間存在怎樣的函數(shù)關(guān)系l能否通過這種關(guān)系,由能否通過這種關(guān)系,由x x的變化定量地解釋或預(yù)的變化定量地解釋或預(yù)測測y y的變化的變化l回歸分析的變量類型回歸分析的變量類型l因變量因變量y y 隨機(jī)變量隨機(jī)變量l自變量自變量x x 固定變量(為主)或隨機(jī)變量固定變量(為主)或隨機(jī)變量l回歸分析中回歸分析中x和和y的關(guān)系的關(guān)系l地位不平等地位不平等l關(guān)心的是關(guān)心的是y y依依x x的變化規(guī)律的變化規(guī)律l2、相關(guān)分析(、相關(guān)分析(correlation analysis)l概念:概念:是研究隨機(jī)變量之間是研究隨機(jī)變量之間“相關(guān)關(guān)系相關(guān)關(guān)系”的一種統(tǒng)計方法。

6、用于研究兩個或數(shù)個的一種統(tǒng)計方法。用于研究兩個或數(shù)個變量共同變化的程度,主要通過計算相變量共同變化的程度,主要通過計算相關(guān)系數(shù)來判斷這種相關(guān)關(guān)系的強(qiáng)弱。關(guān)系數(shù)來判斷這種相關(guān)關(guān)系的強(qiáng)弱。l相關(guān)關(guān)系:相關(guān)關(guān)系:是一種非確定性的關(guān)系,即一種隨是一種非確定性的關(guān)系,即一種隨機(jī)關(guān)系。按其形成的原因,可分為機(jī)關(guān)系。按其形成的原因,可分為l直接相關(guān)直接相關(guān)(real correlation)l間接相關(guān)間接相關(guān)(nonsense correlation)l二元相關(guān)分析(簡單相關(guān)分析)二元相關(guān)分析(簡單相關(guān)分析)l研究兩個變量間相關(guān)關(guān)系的方法。研究兩個變量間相關(guān)關(guān)系的方法。l只介紹簡單相關(guān)。只介紹簡單相關(guān)。l相

7、關(guān)分析的研究目的相關(guān)分析的研究目的l變量之間是否存在某種隨機(jī)的共變關(guān)系變量之間是否存在某種隨機(jī)的共變關(guān)系l各變量一起變化的程度各變量一起變化的程度l相關(guān)分析不具備預(yù)測性相關(guān)分析不具備預(yù)測性l相關(guān)分析的變量類型與關(guān)系相關(guān)分析的變量類型與關(guān)系l所有變量都必須是隨機(jī)變量所有變量都必須是隨機(jī)變量l沒有自變量和因變量之分,沒有自變量和因變量之分,x和和y的地位一樣的地位一樣l分析側(cè)重于隨機(jī)變量之間的相關(guān)特征分析側(cè)重于隨機(jī)變量之間的相關(guān)特征二、二者的主要差別二、二者的主要差別l回歸分析與相關(guān)分析回歸分析與相關(guān)分析在計算上有很多在計算上有很多相似相似之處之處,如果在應(yīng)用時不注意所研究,如果在應(yīng)用時不注意所研

8、究變量的變量的類型類型以及兩種方法的以及兩種方法的內(nèi)在差別內(nèi)在差別,很容易出,很容易出現(xiàn)錯誤?,F(xiàn)錯誤。回歸分析與相關(guān)分析的主要差別回歸分析與相關(guān)分析的主要差別 統(tǒng)計方法統(tǒng)計方法相關(guān)分析相關(guān)分析回歸分析回歸分析研究對象研究對象若干變量一起若干變量一起變化的程度變化的程度一個變量與其它變量間的函一個變量與其它變量間的函數(shù)關(guān)系數(shù)關(guān)系變量關(guān)系變量關(guān)系變量間的共變變量間的共變關(guān)系關(guān)系一個因變量及一個或數(shù)個自一個因變量及一個或數(shù)個自變量,前者是后者的函數(shù)變量,前者是后者的函數(shù)變量類型變量類型均為隨機(jī)變量均為隨機(jī)變量因變量:為隨機(jī)變量因變量:為隨機(jī)變量自變量:為固定變量(為主)自變量:為固定變量(為主)或隨

9、機(jī)變量或隨機(jī)變量統(tǒng)計量統(tǒng)計量無量綱的相關(guān)無量綱的相關(guān)系數(shù)系數(shù)有單位的回歸系數(shù)有單位的回歸系數(shù)第二節(jié)第二節(jié) 一元線性回歸分析一元線性回歸分析l【本節(jié)內(nèi)容【本節(jié)內(nèi)容】l一元線性回歸的數(shù)學(xué)模型一元線性回歸的數(shù)學(xué)模型l一元線性回歸方程的建立一元線性回歸方程的建立l線性回歸的顯著性檢驗線性回歸的顯著性檢驗l線性回歸的區(qū)間估計和預(yù)測線性回歸的區(qū)間估計和預(yù)測 一、一元線性回歸的數(shù)學(xué)模型一、一元線性回歸的數(shù)學(xué)模型l一元線性回歸的常用數(shù)學(xué)模型為:一元線性回歸的常用數(shù)學(xué)模型為:l: 回歸截距(回歸截距(intercept)(又稱回歸常數(shù))(又稱回歸常數(shù))l: 回歸系數(shù)(回歸系數(shù)(coefficient of re

10、gression)iiixy二、一元線性回歸方程的建立二、一元線性回歸方程的建立 l(一)原理(一)原理最小二乘法最小二乘法l線性回歸方程的一般形式為:線性回歸方程的一般形式為: l殘差:殘差:l最小二乘法最小二乘法:使殘差平方和(剩余平方和):使殘差平方和(剩余平方和)最小的一種確定最小的一種確定a a 和和b b 的方法。的方法。bxayiiiyye使:使:l根據(jù)微積分學(xué)中的極值原理,必須使根據(jù)微積分學(xué)中的極值原理,必須使q 對對a 和和b的一階偏導(dǎo)數(shù)為的一階偏導(dǎo)數(shù)為0:2020iiiiiiiqyabxaqyabxxb 22iiiiiiqyyyabx最小值整理得到整理得到l一元線性回歸的正

11、規(guī)方程組:一元線性回歸的正規(guī)方程組: 2iiiiiiiiiiianbxyaxbxx yl(二)一元線性回歸的計算(二)一元線性回歸的計算 l(三)回歸直線的圖示(三)回歸直線的圖示l資料的散點圖資料的散點圖l回歸直線圖回歸直線圖 121()()()niiiniixxyyspbssxxxaybx(四)一元線性回歸方程建立的基本步驟(四)一元線性回歸方程建立的基本步驟(4 4步)步) l根據(jù)資料計算根據(jù)資料計算8個一級數(shù)據(jù)個一級數(shù)據(jù) lx , x2, , y , y2 , , xy , n l計算計算3個二級數(shù)據(jù):個二級數(shù)據(jù):ssx , ssy , sp l計算參數(shù)的估計值計算參數(shù)的估計值a和和b

12、,并寫出回歸方程,并寫出回歸方程 l作出資料的散點圖和回歸直線圖作出資料的散點圖和回歸直線圖 xyxaybxbsp ss yabxl為了研究特定條件下魚類對水中某農(nóng)藥的為了研究特定條件下魚類對水中某農(nóng)藥的富集能力,搜集了富集能力,搜集了10組有關(guān)數(shù)據(jù)如下組有關(guān)數(shù)據(jù)如下(g/l和和g/kg),試建立二者間的一元線),試建立二者間的一元線性回歸方程。性回歸方程。 i12345678910水中含水中含量量(x)4.65.14.84.45.94.75.15.24.95.1魚體含魚體含量量(y)17.418.617.918.319.918.419.1 19.9 18.7 18.9【例【例6.16.1】解

13、解:經(jīng)計算:經(jīng)計算所以,所以,b = sp / ssx = 1.5508,a = 10.987 x與與y的回歸方程為:的回歸方程為: 10.987 1.5508yx4.98 1.563 18.71 5.6692.382xyxssysssp,散點圖和回歸直線圖散點圖和回歸直線圖某某農(nóng)農(nóng)藥藥的的水水中中含含量量與與魚魚體體中中含含量量的的關(guān)關(guān)系系y = 10.987+1.5508xr2 = 0.65161516171819202134567x ( ug / l )y ( ug / kg )三、線性回歸的顯著性檢驗三、線性回歸的顯著性檢驗 (一)線性回歸的變異來源(一)線性回歸的變異來源 l變異來源

14、變異來源 隨機(jī)變量隨機(jī)變量y的觀測值的觀測值y1, y2, , yn之間的變異是由兩個方面的原因引起的:之間的變異是由兩個方面的原因引起的:l自變量自變量 x 取值的不同;取值的不同;l其它因素(試驗誤差)的影響。其它因素(試驗誤差)的影響。l平方和的分解平方和的分解(ssyssessr) ly 的離均差平方和的離均差平方和ssy(總平方和總平方和sst):): l (dftn1)l離回歸平方和離回歸平方和sse(剩余平方和,殘差平方剩余平方和,殘差平方和和):): (dfen2) 2yiissyy2eiiissyy l回歸平方和回歸平方和ssr: (dfr1) ssssr r的意義:的意義:

15、根據(jù)等式根據(jù)等式ssyssysssse essssr r可知,如可知,如果果ssssr r的值較大,的值較大,sssse e的數(shù)值便比較小,說明回歸的數(shù)值便比較小,說明回歸的效果好;反之,如果的效果好;反之,如果ssssr r的值較小,的值較小,sssse e的數(shù)值的數(shù)值便比較大,說明回歸的效果差。便比較大,說明回歸的效果差。2riissyy(二)(二)f f 檢驗檢驗當(dāng)零假設(shè)當(dāng)零假設(shè)h0:0成立時,成立時,ssr與與sse相互相互獨立,且統(tǒng)計量獨立,且統(tǒng)計量當(dāng)當(dāng)f f時,時,h0 :0不成立,稱不成立,稱回歸方程回歸方程顯著顯著1(1,2)2ressffnssn具體檢驗可在方差分析表上進(jìn)行:

16、具體檢驗可在方差分析表上進(jìn)行:ssessyssr ssrbspb2ssxsp 2ssx 變異來源變異來源自由度自由度平方和平方和均方均方fx1ssrsr2sr2se2殘余殘余n2ssese2總和總和n1ssy【例【例6.2】 l根據(jù)例根據(jù)例6.16.1給出的魚類對水中農(nóng)藥的富集給出的魚類對水中農(nóng)藥的富集資料,試檢驗其線性回歸方程的顯著性。資料,試檢驗其線性回歸方程的顯著性。變異來源變異來源dfssmsff0.01回回 歸歸13.6943.69414.96*11.3離回歸離回歸81.9750.247總總 計計95.669(三)(三)t t 檢驗檢驗采用采用t檢驗可以檢驗回歸系數(shù)檢驗可以檢驗回歸系

17、數(shù)b的顯著性,進(jìn)而的顯著性,進(jìn)而對回歸方程的顯著性作出判斷。對回歸方程的顯著性作出判斷。1、統(tǒng)計假設(shè)、統(tǒng)計假設(shè) h0:0,ha:02、b的標(biāo)準(zhǔn)誤的標(biāo)準(zhǔn)誤3、檢驗統(tǒng)計量、檢驗統(tǒng)計量4、判斷:若、判斷:若t t(n2),則否定,則否定h0,接受,接受ha。 bexssss(2)bbtt ns 前述資料回歸關(guān)系的前述資料回歸關(guān)系的t檢驗檢驗(2)1.975 80.497eesssn0.4971.5360.401bexssss1.553.8650.401bbbbtss 0.010.01(102)(8)3.355tt0.01(8)tt所以,否定所以,否定h0,接受,接受ha,即,即b極顯著。極顯著。 四

18、、線性回歸的區(qū)間估計和預(yù)測四、線性回歸的區(qū)間估計和預(yù)測 l(一)(一)和和的區(qū)間估計的區(qū)間估計 l有時有時和和在專業(yè)上有特殊意義時,要確在專業(yè)上有特殊意義時,要確定其置信區(qū)間。定其置信區(qū)間。l1、的置信區(qū)間的置信區(qū)間la 的標(biāo)準(zhǔn)誤為:的標(biāo)準(zhǔn)誤為:l而而 l所以所以 的置信區(qū)間為:的置信區(qū)間為:21aexxssnss(2)aatt ns (,)aaat sat s l2、的置信區(qū)間的置信區(qū)間lb 的標(biāo)準(zhǔn)誤為:的標(biāo)準(zhǔn)誤為:l而而 l所以所以 的置信區(qū)間為:的置信區(qū)間為:bexssss(2)bbtt ns (,)bbbt sbt s l(二)對(二)對x的區(qū)間估計的區(qū)間估計l對對x的區(qū)間估計,即是對

19、總體均的區(qū)間估計,即是對總體均值(期望值)的區(qū)間估計。值(期望值)的區(qū)間估計。l當(dāng)當(dāng)xxi 時,估計標(biāo)準(zhǔn)誤為:時,估計標(biāo)準(zhǔn)誤為:21ieyxxxssnss lx的點估計為:的點估計為:l所以,所以,x 的置信度為(的置信度為(1)的置信)的置信區(qū)間為:區(qū)間為:iiyabx(2)iyytns l以魚體對水中農(nóng)藥富集的數(shù)據(jù)為例:以魚體對水中農(nóng)藥富集的數(shù)據(jù)為例:l在在x5.5處,處,y 的期望值的置信區(qū)間(的期望值的置信區(qū)間(95的置信度)為:的置信度)為:21(5.54.98)(10.99 1.55 5.5)2.306 0.247()101.53619.520.60(18.92,20.12)l(三

20、)對(三)對y yxx的預(yù)測的預(yù)測l當(dāng)當(dāng)xxi 時,對時,對yx的預(yù)測,即對的預(yù)測,即對子總體的某一觀察值子總體的某一觀察值 yixii進(jìn)行預(yù)進(jìn)行預(yù)測,相當(dāng)于預(yù)測個體值的問題。測,相當(dāng)于預(yù)測個體值的問題。 l預(yù)測標(biāo)準(zhǔn)誤為:預(yù)測標(biāo)準(zhǔn)誤為:l當(dāng)當(dāng)xxi 時,時,yi 的預(yù)測值的置信區(qū)間(置的預(yù)測值的置信區(qū)間(置信度為信度為1)為:)為:211iyexxxssnss(2)iyytns l以魚體對水中農(nóng)藥富集的數(shù)據(jù)為例以魚體對水中農(nóng)藥富集的數(shù)據(jù)為例l求求x5.5 時魚體內(nèi)農(nóng)藥含量時魚體內(nèi)農(nóng)藥含量y 的預(yù)測區(qū)間。的預(yù)測區(qū)間。l在在x5.5 處,魚體內(nèi)農(nóng)藥含量處,魚體內(nèi)農(nóng)藥含量y 的置信度為的置信度為95

21、的預(yù)測區(qū)間為:的預(yù)測區(qū)間為:21(5.5 4.98)(10.99 1.55 5.5) 2.306 0.247(1)101.53619.52 1.29(18.23,20.81)l從計算可知,當(dāng)從計算可知,當(dāng)x5.5 時,時,y 的區(qū)間估計的區(qū)間估計的區(qū)間范圍(的區(qū)間范圍(18.92,20.12)小于)小于y 的預(yù)測的預(yù)測區(qū)間范圍(區(qū)間范圍(18.23,20.81)。)。l因此,回歸分析的預(yù)測精度低于估計精度。因此,回歸分析的預(yù)測精度低于估計精度。 4.24.44.64.85.05.25.45.65.86.0 x17.017.518.018.519.019.520.020.5yy = 10.987

22、 + 1.5508 xr = 0.80722回歸方程的區(qū)間估計和預(yù)測區(qū)間回歸方程的區(qū)間估計和預(yù)測區(qū)間第三節(jié)第三節(jié) 線性相關(guān)分析線性相關(guān)分析l【講授內(nèi)容【講授內(nèi)容】l相關(guān)系數(shù)相關(guān)系數(shù)l相關(guān)系數(shù)的顯著性檢驗相關(guān)系數(shù)的顯著性檢驗l相關(guān)與回歸的關(guān)系相關(guān)與回歸的關(guān)系 一、相關(guān)系數(shù) 如果兩個變量間呈線性關(guān)系,又不需要如果兩個變量間呈線性關(guān)系,又不需要由由x 來估計來估計 y,只需了解,只需了解 x 和和 y 相關(guān)的性質(zhì)相關(guān)的性質(zhì)以及相關(guān)的程度,便可以通過計算表示以及相關(guān)的程度,便可以通過計算表示x 和和y 之間相關(guān)性質(zhì)和相關(guān)程度的統(tǒng)計量之間相關(guān)性質(zhì)和相關(guān)程度的統(tǒng)計量相相關(guān)系數(shù)關(guān)系數(shù)進(jìn)行相關(guān)分析。進(jìn)行相關(guān)分

23、析。 (一)雙變量(正態(tài))總體(一)雙變量(正態(tài))總體如果如果:研究對象僅僅涉及兩個變量,而且這:研究對象僅僅涉及兩個變量,而且這兩個變量均服從正態(tài)分布(即服從二元正態(tài)兩個變量均服從正態(tài)分布(即服從二元正態(tài)分布分布bivariate normal distribution)則則:研究樣本所屬的總體稱為:研究樣本所屬的總體稱為雙變量(正態(tài))雙變量(正態(tài))總體總體。 (二)相關(guān)系數(shù)及其計算(二)相關(guān)系數(shù)及其計算 如果研究的兩個變量服從如果研究的兩個變量服從二元正態(tài)分布二元正態(tài)分布,則,則可以采用可以采用參數(shù)相關(guān)分析參數(shù)相關(guān)分析方法方法計算計算相關(guān)系相關(guān)系數(shù)數(shù)來研究變量間的線性相關(guān)關(guān)系。來研究變量間

24、的線性相關(guān)關(guān)系。1、雙變量總體的相關(guān)系數(shù)、雙變量總體的相關(guān)系數(shù) 設(shè):二元正態(tài)總體的兩個變量為設(shè):二元正態(tài)總體的兩個變量為x和和y,具有,具有n對對(x,y) 則:總體的相關(guān)系數(shù)為則:總體的相關(guān)系數(shù)為 221()()cov()()()11()()xyxyx x y yxyx x y ynss ssx xy ynn 相關(guān)性質(zhì)相關(guān)性質(zhì)l0,x 和和y 有有正相關(guān)關(guān)系(正相關(guān))正相關(guān)關(guān)系(正相關(guān)),兩個變,兩個變量表現(xiàn)出共同增加或共同減少的趨勢;量表現(xiàn)出共同增加或共同減少的趨勢; l0,x 和和y 有有負(fù)相關(guān)關(guān)系(負(fù)相關(guān))負(fù)相關(guān)關(guān)系(負(fù)相關(guān)),一個變,一個變量的增加伴隨著另一個變量的減??;量的增加伴隨

25、著另一個變量的減?。?l0,x 和和y 完全不相關(guān)完全不相關(guān)。l| |1l1,完全正相關(guān);,完全正相關(guān); 1,完全負(fù)相關(guān)。,完全負(fù)相關(guān)。2、樣本的相關(guān)系數(shù)、樣本的相關(guān)系數(shù)r(對應(yīng)對應(yīng))22()()()()xyxx yysprssssxxyyl 從二元正態(tài)總體抽樣,得到從二元正態(tài)總體抽樣,得到n 對觀察值(對觀察值(xi,yi)l則:樣本的相關(guān)系數(shù)則:樣本的相關(guān)系數(shù)r 可由下式定義可由下式定義 例例6.3l pearson和和lee研究了研究了1401個家庭兄妹身個家庭兄妹身高的問題,我們從中抽取高的問題,我們從中抽取11對數(shù)據(jù)紀(jì)錄如對數(shù)據(jù)紀(jì)錄如下,試求樣本的相關(guān)系數(shù)。下,試求樣本的相關(guān)系數(shù)。

26、編號編號1234567891011兄弟兄弟(x)7168666770717073726566姊妹姊妹(y)6964656365626564665962解:解:l1)先求出一些基本統(tǒng)計量)先求出一些基本統(tǒng)計量 lx759, , x252445 l (xx)274l y704, , y245122 l(yy)266l xy48615, (xx)(yy)39 69x 64y l2)計算)計算r 統(tǒng)計量統(tǒng)計量22()()()()390.55874 66xyspxxyyrssssxxyy二、相關(guān)系數(shù)的顯著性檢驗二、相關(guān)系數(shù)的顯著性檢驗l1 1、t t 檢驗檢驗l統(tǒng)計假設(shè)統(tǒng)計假設(shè) h0:0;ha:0l統(tǒng)計

27、量統(tǒng)計量lr 的標(biāo)準(zhǔn)誤:的標(biāo)準(zhǔn)誤:l當(dāng)當(dāng)h0:0成立時,檢驗統(tǒng)計量成立時,檢驗統(tǒng)計量212rrsn(2)rrtt ns l判斷:給定顯著性水平判斷:給定顯著性水平,將,將|t|與與t(n2)進(jìn)行比較,即可作出進(jìn)行比較,即可作出r 是否顯著的結(jié)論。是否顯著的結(jié)論。l2 2、利用、利用r r 和和r r 的相關(guān)系數(shù)表的相關(guān)系數(shù)表進(jìn)行檢驗進(jìn)行檢驗l將統(tǒng)計量將統(tǒng)計量t 變形,可得:變形,可得:l將將t(n2)代入上式,計算出)代入上式,計算出|r|的臨界值的臨界值r(n2),制作為,制作為“r和和r的相關(guān)系數(shù)表的相關(guān)系數(shù)表”。22trtnl將計算所得的將計算所得的|r|直接與臨界值直接與臨界值r(n2

28、)進(jìn)進(jìn)行比較,也可以作出行比較,也可以作出r是否顯著的結(jié)論。是否顯著的結(jié)論。l若:若: |r| r(n2)l則:則:r 值在值在水平上顯著水平上顯著【實例【實例】 l試檢驗【例試檢驗【例6.3】中相關(guān)系數(shù)】中相關(guān)系數(shù)r0.558的顯的顯著性。著性。l解:查表得解:查表得l由于由于 l所以,接受零假設(shè)所以,接受零假設(shè)h0:0,即樣本的,即樣本的相關(guān)系數(shù)相關(guān)系數(shù)r 不顯著。不顯著。0.05(9)0.602r0.050.5580.602(9)rr三、三、相關(guān)與回歸的關(guān)系相關(guān)與回歸的關(guān)系 l1 1、相關(guān)與回歸的關(guān)系、相關(guān)與回歸的關(guān)系l(1)從檢驗結(jié)果,即數(shù)量上從檢驗結(jié)果,即數(shù)量上,b 與與r 有著密切

29、的聯(lián)系,表現(xiàn)出一致性。對有著密切的聯(lián)系,表現(xiàn)出一致性。對b 與與r 的顯著性檢驗,其實質(zhì)是完全相同的顯著性檢驗,其實質(zhì)是完全相同的,的,b 顯著,則顯著,則r 必顯著;反之亦然。必顯著;反之亦然。l(2)從相關(guān)關(guān)系與回歸關(guān)系的區(qū)別來看從相關(guān)關(guān)系與回歸關(guān)系的區(qū)別來看l若若自變量為固定變量自變量為固定變量,則兩變量間可進(jìn),則兩變量間可進(jìn)行回歸分析,而相關(guān)系數(shù)沒有任何幾何行回歸分析,而相關(guān)系數(shù)沒有任何幾何意義,意義,r 僅可用來間接反映回歸方程的僅可用來間接反映回歸方程的顯著程度,即表示回歸曲線與觀測數(shù)據(jù)顯著程度,即表示回歸曲線與觀測數(shù)據(jù)的吻合程度。的吻合程度。 l如果如果兩個變量均為隨機(jī)變量兩個變

30、量均為隨機(jī)變量,則相關(guān)系,則相關(guān)系數(shù)與回歸系數(shù)均存在,這時兩種關(guān)系的數(shù)與回歸系數(shù)均存在,這時兩種關(guān)系的顯著性才是真正一致的。顯著性才是真正一致的。|r|大時,回歸大時,回歸方程顯著,且變量間線性相關(guān)關(guān)系密切;方程顯著,且變量間線性相關(guān)關(guān)系密切;當(dāng)當(dāng)|r|小時,則回歸方程不顯著,變量間小時,則回歸方程不顯著,變量間線性相關(guān)關(guān)系松懈。線性相關(guān)關(guān)系松懈。l2 2、決定系數(shù)、決定系數(shù)l如果僅考慮回歸方程與觀測數(shù)據(jù)的接近如果僅考慮回歸方程與觀測數(shù)據(jù)的接近程度,即回歸方程對數(shù)據(jù)擬合的優(yōu)劣,程度,即回歸方程對數(shù)據(jù)擬合的優(yōu)劣,那么決定系數(shù)提供了一個很好的度量,那么決定系數(shù)提供了一個很好的度量,可以避免將相關(guān)與

31、回歸混淆??梢员苊鈱⑾嚓P(guān)與回歸混淆。l決定系數(shù)決定系數(shù) l兩變量均為隨機(jī)變量即存在相關(guān)關(guān)系時,兩變量均為隨機(jī)變量即存在相關(guān)關(guān)系時,r2 的大小也反映了變量間的相關(guān)程度的的大小也反映了變量間的相關(guān)程度的大小,但不能反映出相關(guān)性質(zhì)(正相關(guān)大小,但不能反映出相關(guān)性質(zhì)(正相關(guān)與負(fù)相關(guān))。與負(fù)相關(guān))。22rxyyyssspb sprssssssss第四節(jié)第四節(jié) 一元非線性回歸(一元非線性回歸(可可直線化的曲線回歸直線化的曲線回歸 )l【講授內(nèi)容【講授內(nèi)容】l非線形回歸及曲線類型的選擇非線形回歸及曲線類型的選擇l常用曲線方程的線性化方法常用曲線方程的線性化方法 l非線形回歸方程擬合情況的比較非線形回歸方程

32、擬合情況的比較一、非線形回歸及曲線類型的選擇一、非線形回歸及曲線類型的選擇 l1、非線性回歸非線性回歸(nonlinear regression)l在許多情況下,因變量與自變量之間的函在許多情況下,因變量與自變量之間的函數(shù)關(guān)系不能用簡單的回歸直線來表述,采數(shù)關(guān)系不能用簡單的回歸直線來表述,采用適當(dāng)?shù)那€方程往往更符合總體間的實用適當(dāng)?shù)那€方程往往更符合總體間的實際關(guān)系,這就是所謂的非線性回歸或曲線際關(guān)系,這就是所謂的非線性回歸或曲線回歸(回歸(curvilinear regression)。)。l一元非線性回歸一元非線性回歸:只有一個自變量的非線:只有一個自變量的非線性回歸。性回歸。l2 2、

33、曲線類型的選擇方法、曲線類型的選擇方法l選用正確、合適的曲線類型,是非線性選用正確、合適的曲線類型,是非線性回歸的回歸的關(guān)鍵關(guān)鍵。曲線類型的確定方式可以。曲線類型的確定方式可以是理論的,也可以是經(jīng)驗的。是理論的,也可以是經(jīng)驗的。l(1 1)理論法(經(jīng)驗法)理論法(經(jīng)驗法)l根據(jù)專業(yè)知識或前人的經(jīng)驗選用合適的回根據(jù)專業(yè)知識或前人的經(jīng)驗選用合適的回歸方程。歸方程。l根據(jù)已知理論確定曲線類型雖是最理想的根據(jù)已知理論確定曲線類型雖是最理想的選擇,但是,如果不考慮已知理論的應(yīng)用選擇,但是,如果不考慮已知理論的應(yīng)用對象和條件而盲目照搬,將會造成錯誤的對象和條件而盲目照搬,將會造成錯誤的結(jié)論。結(jié)論。l(2)

34、圖示法)圖示法 l描出(描出(xi ,yi)的散點圖,根據(jù)散點的變)的散點圖,根據(jù)散點的變化趨勢畫出趨勢線,并對照曲線圖譜來選化趨勢畫出趨勢線,并對照曲線圖譜來選用合適的曲線類型。用合適的曲線類型。 l(3 3)擬合比較法)擬合比較法l如果采用圖示法時遇到幾種曲線形式與試如果采用圖示法時遇到幾種曲線形式與試驗數(shù)據(jù)較接近,則可同時選擇多個曲線方驗數(shù)據(jù)較接近,則可同時選擇多個曲線方程,求出回歸系數(shù)后,再比較各個回歸方程,求出回歸系數(shù)后,再比較各個回歸方程的擬合情況,從中選出擬合情況較好的程的擬合情況,從中選出擬合情況較好的回歸方程作為所求的一元非線性回歸方程?;貧w方程作為所求的一元非線性回歸方程。

35、 二、常用曲線方程的線性化方法二、常用曲線方程的線性化方法 l“線性化線性化”是建立非線性回歸方程的方法之一。是建立非線性回歸方程的方法之一。一元非線性回歸方程一元非線性回歸方程直線形式直線形式( (線性回歸方程線性回歸方程) )配合線性回歸方程配合線性回歸方程轉(zhuǎn)換為轉(zhuǎn)換為變量變換變量變換(一)(一)直接引入新變量直接引入新變量 l這一類非線性回歸方程這一類非線性回歸方程“線性化線性化”后,回后,回歸系數(shù)沒有變化,線性回歸方程的系數(shù)也歸系數(shù)沒有變化,線性回歸方程的系數(shù)也是非線性回歸方程的系數(shù)。是非線性回歸方程的系數(shù)。l1 1、拋物線、拋物線l令:令:l可化為:可化為:2 yabx2xx yab

36、x0b 0b yx0 l2 2、 型曲線型曲線l令:令:l可化為:可化為:1 yabx1yy yabx 0b0b xy0l3 3、雙曲線(、雙曲線(1 1)l l令:令:l可化為:可化為:byax1xx yabx00abxy00,0abxy0l3 3、雙曲線(、雙曲線(2 2)l l令:令:l可化為:可化為:1()bxayyxaxb或或11xxyy yabx0b xy00b xy0l(4 4)對數(shù)函數(shù)曲線)對數(shù)函數(shù)曲線l l令:令:l可化為:可化為:lgyabx lnyabx(或或)lgxx yabx0b0b x0y(二)(二)原方程經(jīng)過數(shù)學(xué)變換后再引入原方程經(jīng)過數(shù)學(xué)變換后再引入新變量新變量

37、l這類曲線方程需要這類曲線方程需要“改變形式改變形式”后才可以后才可以線性化為線性方程。但是線性化為線性方程。但是“線性化線性化”前后前后兩個方程的回歸系數(shù)有變化,由線性回歸兩個方程的回歸系數(shù)有變化,由線性回歸方程的系數(shù)易于求出非線性回歸方程的系方程的系數(shù)易于求出非線性回歸方程的系數(shù)。數(shù)。l1 1、指數(shù)函數(shù)曲線、指數(shù)函數(shù)曲線 l(1 1)bxyae0b 0b x0yl1 1、指數(shù)函數(shù)曲線、指數(shù)函數(shù)曲線 l(2 2)b xyae0b xy0a0b xy0al2 2、冪函數(shù)曲線、冪函數(shù)曲線 byax1b 1b 01baxy010b axy01l3 3、logisticlogistic生長曲線生長曲

38、線11a bxbxkkyeae 或或 kxy0三、非線形回歸方程擬合情況的比較三、非線形回歸方程擬合情況的比較 l1 1、非線性回歸的剩余平方和、非線性回歸的剩余平方和li1,2,n l其中其中 來自非線性方程來自非線性方程 2iiiqyyiyl2 2、非線性關(guān)系的相關(guān)指數(shù)、非線性關(guān)系的相關(guān)指數(shù)l非線性關(guān)系的非線性關(guān)系的相關(guān)指數(shù)相關(guān)指數(shù) 的大小與非線的大小與非線性回歸方程性回歸方程“線性化線性化”以后所得線性回歸以后所得線性回歸方程的方程的決定系數(shù)決定系數(shù)r2 的大小的大小并非總是一致的并非總是一致的。222()11()iiiyiiyyqrssyy2rlr r2 2 與與 的適用范圍的適用范圍l決定系數(shù)決定系數(shù)r2 適用于適用于線性回歸線性回歸的情況,反映的情況,反映線性回歸方程擬合情況的優(yōu)劣。線性回歸方程擬合情況的優(yōu)劣。l相關(guān)指數(shù)相關(guān)指數(shù) 適用于適用于非線性回歸非線性回歸的情況,的情況,反映了非線性回歸方程擬合的好壞。反映了非線性回歸方程擬合的好壞。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論