相關(guān)與回歸分析_第1頁(yè)
相關(guān)與回歸分析_第2頁(yè)
相關(guān)與回歸分析_第3頁(yè)
相關(guān)與回歸分析_第4頁(yè)
相關(guān)與回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩78頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于相關(guān)與回歸分析第1頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五學(xué)習(xí)目的:(1)掌握相關(guān)分析與相關(guān)系數(shù)的概念、相關(guān)系數(shù)的計(jì)算方法(2)掌握一元線性回歸的基本原理和參數(shù)的最小二乘估計(jì)方法(3)掌握回歸方程的顯著性檢驗(yàn)(4)利用回歸方程進(jìn)行預(yù)測(cè)重點(diǎn):(1)相關(guān)系數(shù);

(2)一元線性回歸的基本原理。難點(diǎn):(1)相關(guān)系數(shù)的計(jì)算方法;

(2)回歸方程的顯著性檢驗(yàn)。第2頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五聯(lián)系與相互影響是普遍的現(xiàn)象受教育的水平工作后的收入預(yù)防疾病支出疾病的發(fā)病率事物相互間關(guān)系的質(zhì)的解釋?zhuān)鹤匀坏?、社?huì)的、經(jīng)濟(jì)的、心理的…事物相互間關(guān)系的量的分析:兩變量或多變量間的數(shù)量關(guān)系。在可以解釋的質(zhì)的關(guān)系基礎(chǔ)上進(jìn)行相關(guān)分析和回歸分析第3頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五一、相關(guān)分析的概念第一節(jié)相關(guān)分析與相關(guān)系數(shù)社會(huì)經(jīng)濟(jì)現(xiàn)象中,一些現(xiàn)象與另一些現(xiàn)象之間往往存在著依存關(guān)系,當(dāng)我們用變量來(lái)反映這些現(xiàn)象的的特征時(shí),便表現(xiàn)為變量之間的依存關(guān)系。

在分析變量的依存關(guān)系時(shí),我們把變量分為兩種:自變量因變量引起其他變量發(fā)生變化的量。受自變量的影響發(fā)生對(duì)應(yīng)變化的量第4頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五現(xiàn)象之間的相互關(guān)系,可以概括為兩種不同的類(lèi)型:(一)函數(shù)關(guān)系(二)相關(guān)關(guān)系例如:家庭收入決定消費(fèi)支出,收入的變化必然引起消費(fèi)支出的變化,這兩個(gè)變量中收入是自變量,而消費(fèi)支出則是因變量。第5頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五函數(shù)關(guān)系指變量之間存在著確定性依存關(guān)系。即當(dāng)一個(gè)或一組變量每取一個(gè)值時(shí),相應(yīng)的另一個(gè)變量必然有一個(gè)確定值與之對(duì)應(yīng)。

函數(shù)關(guān)系可以用一個(gè)確定的公式,即函數(shù)式來(lái)表示?;颍篩=F(X)第6頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五相關(guān)關(guān)系指變量之間存在著非確定性依存關(guān)系。即當(dāng)一個(gè)或一組變量每取一個(gè)值時(shí),相應(yīng)的另一個(gè)變量可能有多個(gè)不同值與之對(duì)應(yīng)。

例2、根據(jù)消費(fèi)理論,商品需求量Q與商品價(jià)格P、居民收入I之間具有相關(guān)關(guān)系:相關(guān)關(guān)系可用統(tǒng)計(jì)模型:或:Y=F(X)+ε式中,為影響Y的除X外的其他隨機(jī)因素。第7頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五二、相關(guān)數(shù)據(jù)的收集和相關(guān)關(guān)系的種類(lèi):(一)相關(guān)數(shù)據(jù)的收集199019911992199319941995199619971998199920002001

18598.421662.526651.934560.546670.057494.966850.573142.776967.280579.488189.695933.00

2.1828.4039.4746.8373.2387.33102.00120.74126.02140.99162.24178.00年份國(guó)內(nèi)生產(chǎn)總值(億元)旅游外匯收入(億美元)第8頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五單相關(guān)

是兩個(gè)變量之間存在的相關(guān)關(guān)系,即一個(gè)因變量與一個(gè)自變量之間的依存關(guān)系。因此也稱(chēng)為一元相關(guān)。復(fù)相關(guān)

也稱(chēng)多元相關(guān),是指三個(gè)或三個(gè)以上變量之間存在的相關(guān)關(guān)系,通常涉及一個(gè)因變量與兩個(gè)或更多個(gè)自變量,也稱(chēng)多元相關(guān)。(二)相關(guān)關(guān)系的種類(lèi):1、按相關(guān)關(guān)系涉及變量的多少可分為:第9頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五直線相關(guān)當(dāng)自變量X值每變動(dòng)一個(gè)單位,因變量Y值則隨著發(fā)生大致均等的變動(dòng),這就是直線相關(guān)。亦稱(chēng)為簡(jiǎn)單相關(guān)或一元線性相關(guān)。曲線相關(guān)當(dāng)自變量X值每變動(dòng)一個(gè)單位,因變量Y值則隨之發(fā)生不均等的變化,這就曲線相關(guān)。亦稱(chēng)為一元非線性相關(guān)。2、按相關(guān)關(guān)系形式可分為:第10頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五正相關(guān)當(dāng)自變量X值增加(或減少)時(shí),因變量Y值也隨之增加(或減少),這樣的相關(guān)關(guān)系就是正相關(guān),也叫同向相關(guān)。負(fù)相關(guān)當(dāng)自變量X的值增加(或減少)時(shí),因變量Y的值隨之而減少(或增加),這樣的相關(guān)關(guān)系就是負(fù)相關(guān),也叫異向相關(guān)。3、按相關(guān)的方向可分為:第11頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五線性正相關(guān)第12頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五線性負(fù)相關(guān)非線性相關(guān)第13頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五無(wú)(不)相關(guān)第14頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五4、按相關(guān)關(guān)系的密切程度分為:完全相關(guān)因變量完全隨自變量變動(dòng)而變動(dòng),存在著嚴(yán)格的依存關(guān)系。即變量間的關(guān)系為函數(shù)關(guān)系。不完全相關(guān)變量之間存在著不嚴(yán)格的依存關(guān)系,即因變量的變動(dòng)除了受自變量變動(dòng)的影響外,還受其他因素的影響。它是相關(guān)關(guān)系的主要表現(xiàn)形式。不相關(guān)自變量與因變量彼此獨(dú)立,互不影響,其數(shù)量變化毫無(wú)聯(lián)系。。第15頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五(1)確定現(xiàn)象之間有無(wú)相關(guān)關(guān)系,以及相關(guān)關(guān)系的表現(xiàn)形態(tài)。(2)確定相關(guān)關(guān)系的密切程度。(3)確定相關(guān)關(guān)系的數(shù)字模型,并進(jìn)行參數(shù)估計(jì)和擬合優(yōu)度檢驗(yàn)。(4)回歸預(yù)測(cè),并分析估計(jì)標(biāo)準(zhǔn)誤差。相關(guān)分析的主要內(nèi)容包括:第16頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五相關(guān)關(guān)系的測(cè)定定性分析是依據(jù)研究者的理論知識(shí)和實(shí)踐經(jīng)驗(yàn),對(duì)客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷定量分析在定性分析的基礎(chǔ)上,通過(guò)編制相關(guān)表、繪制相關(guān)圖、計(jì)算相關(guān)系數(shù)與判定系數(shù)等方法,來(lái)判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度第17頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五相關(guān)圖相關(guān)關(guān)系的測(cè)定將變量之間的伴隨變動(dòng)繪于坐標(biāo)圖上所形成的統(tǒng)計(jì)圖。又稱(chēng)散點(diǎn)圖。簡(jiǎn)單相關(guān)圖根據(jù)未分組資料的原始數(shù)據(jù)直接繪制的相關(guān)圖。分組相關(guān)圖根據(jù)分組資料繪制的相關(guān)圖。第18頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五X(qián)Y第19頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五在直線相關(guān)的條件下,用以反映兩變量間線性相關(guān)密切程度的統(tǒng)計(jì)指標(biāo),用r表示三、相關(guān)系數(shù)其基本算法是英國(guó)統(tǒng)計(jì)學(xué)家皮爾遜所創(chuàng)的乘積動(dòng)差法,簡(jiǎn)稱(chēng)積差法。(一)相關(guān)系數(shù)的含義和公式第20頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五(二)相關(guān)系數(shù)的意義第21頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五相關(guān)系數(shù)r的取值范圍:-1≤r≤10<|r|<1表示存在不同程度線性相關(guān):

|r|

<0.3為微弱線性相關(guān);

0.3≤|r|<0.5為低度線性相關(guān);

0.5≤|r|<0.8為顯著性線性相關(guān)

0.8≤|r|<1為高度線性相關(guān)r>0為正相關(guān),r<0為負(fù)相關(guān);|r|=0表示不存在線性關(guān)系;|r|=1表示完全線性相關(guān);第22頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五序號(hào)能源消耗量(十萬(wàn)噸)x工業(yè)總產(chǎn)值(億元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合計(jì)916625550862617537887第23頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五【例】計(jì)算工業(yè)總產(chǎn)值與能源消耗量之間的相關(guān)系數(shù)資料結(jié)論:工業(yè)總產(chǎn)值與能源消耗量之間存在高度的正相關(guān)關(guān)系,能源消耗量x的變化能夠解釋工業(yè)總產(chǎn)值y變化的95.2﹪。(三)相關(guān)系數(shù)的計(jì)算第24頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五相關(guān)關(guān)系不等于因果關(guān)系;相關(guān)系數(shù)只度量變量間的線性關(guān)系,因此,弱相關(guān)不一定表明變量間沒(méi)有關(guān)系;極端值可能影響相關(guān)系數(shù)。注意相關(guān)關(guān)系成立的數(shù)據(jù)范圍。警惕虛假相關(guān)使用相關(guān)系數(shù)時(shí)應(yīng)注意的問(wèn)題:第25頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五回歸:退回regression1877年弗朗西斯?高爾頓爵士遺傳學(xué)研究回歸線平均身高第二節(jié)回歸分析第26頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五父親們的身高與兒子們的身高之間

關(guān)系的研究1889年F.Gallton和他的朋友K.Pearson收集了上千個(gè)家庭的身高、臂長(zhǎng)和腿長(zhǎng)的記錄企圖尋找出兒子們身高與父親們身高之間關(guān)系的具體表現(xiàn)形式下圖是根據(jù)1078個(gè)家庭的調(diào)查所作的散點(diǎn)圖(略圖)回歸分析法產(chǎn)生的歷史第27頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五160165170175180185140150160170180190200YX兒子們身高向著平均身高“回歸”,以保持種族的穩(wěn)定回歸分析法產(chǎn)生的歷史第28頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五從圖上雖可看出,個(gè)子高的父親確有生出個(gè)子高的兒子的傾向,同樣地,個(gè)子低的父親確有生出個(gè)子低的兒子的傾向。得到的具體規(guī)律如下:如此以來(lái),高的伸進(jìn)了天,低的縮入了地。他百思不得其解,同時(shí)又發(fā)現(xiàn)某人種的平均身高是相當(dāng)穩(wěn)定的。最后得到結(jié)論:兒子們的身高回復(fù)于全體男子的平均身高,即“回歸”——見(jiàn)1889年F.Gallton的論文《普用回歸定律》。后人將此種方法普遍用于尋找變量之間的規(guī)律回歸分析法產(chǎn)生的歷史第29頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五一、一元線性回歸分析回歸分析通過(guò)一個(gè)變量x或一些變量(x1,x2,x3…)的變化解釋另一變量y的變化.即根據(jù)相關(guān)關(guān)系的數(shù)量表達(dá)式(回歸方程式)與給定的自變量x,揭示因變量y在數(shù)量上的平均變化和求得因變量的預(yù)測(cè)值的統(tǒng)計(jì)分析方法回歸:退回regression回歸方程回歸模型反映自變量和因變量之間數(shù)學(xué)聯(lián)系的表達(dá)式。某一類(lèi)回歸方程的總稱(chēng)。第30頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五

自變量(independentvariable):解釋變量,給定的或可以控制的、用來(lái)解釋、預(yù)測(cè)應(yīng)變量的變量。因變量(dependentvariable):響應(yīng)變量,由自變量來(lái)解釋其變化的變量。XYXY????????《統(tǒng)計(jì)學(xué)》第十章相關(guān)與回歸第31頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五回歸分析的內(nèi)容和步驟1、根據(jù)理論和對(duì)問(wèn)題的分析判斷,區(qū)分自變量和因變量;2、設(shè)法找出適合的數(shù)學(xué)方程式(即回歸模型)描述變量間的關(guān)系3、對(duì)回歸模型進(jìn)行統(tǒng)計(jì)檢驗(yàn);4、統(tǒng)計(jì)檢驗(yàn)通過(guò)后,利用回歸模型,根據(jù)解釋變量去估計(jì),預(yù)測(cè)因變量。第32頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五回歸分析的分類(lèi)根據(jù)變量的多少分為:簡(jiǎn)單回歸多元回歸只有一個(gè)自變量和一個(gè)因變量的回歸自變量數(shù)目在兩個(gè)或兩個(gè)以上根據(jù)建立的回歸模型形式分為:線性回歸非線性回歸從所擬合的回歸模型來(lái)看,一變量表現(xiàn)為其它變量的線性組合。從所擬合的回歸模型來(lái)看,一變量表現(xiàn)為其它變量的非線性組合第33頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五回歸分析與相關(guān)分析理論和方法具有一致性;無(wú)相關(guān)就無(wú)回歸,相關(guān)程度越高,回歸越好;

相關(guān)系數(shù)和回歸系數(shù)方向一致,可以互相推算。聯(lián)系:第34頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五相關(guān)分析中x與y對(duì)等,回歸分析中x與y要確定自變量和因變量;相關(guān)分析中x、y均為隨機(jī)變量,回歸分析中只有y為隨機(jī)變量;相關(guān)分析測(cè)定相關(guān)程度和方向,回歸分析用回歸模型進(jìn)行預(yù)測(cè)和控制。回歸分析與相關(guān)分析區(qū)別:第35頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五簡(jiǎn)單線性回歸模型指根據(jù)成對(duì)的兩個(gè)變量的數(shù)值,配合直線方程式,根據(jù)自變量的變動(dòng),來(lái)推算因變量發(fā)展變動(dòng)趨勢(shì)的方法,其模型為:其中:Yi表示因變量Y在總體中某一個(gè)具體的觀察值;Xi表示在研究總體中自變量X的具體觀察數(shù)值;A與B是參數(shù),稱(chēng)為回歸系數(shù);εi是一個(gè)隨機(jī)變量,其平均數(shù)為0,方差為σ2.總體回歸模型第36頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五總體一元線性回歸模型:模型參數(shù)誤差項(xiàng)假定:E()=0總體一元線性回歸方程:第37頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五簡(jiǎn)單線性回歸模型的假設(shè)1、正態(tài)性假定3、線性假定2、同方差假定4、獨(dú)立性假定當(dāng)確定某一個(gè)Xi時(shí),相應(yīng)的Y就有許多Yi值與之對(duì)應(yīng)。Yi是一個(gè)隨機(jī)變量,這些Yi構(gòu)成一個(gè)在X取值為Xi條件下的條件分布、并假設(shè)其服從正態(tài)分布。

假定所有Yi這一條件分布的方差是相等的。

假定所有Yi這一條件分布的平均數(shù)位于一條直線上,這條直線為Yi=A+BX,

假定Yi之間是獨(dú)立的,也就是說(shuō)抽樣時(shí),Y的值在每取一個(gè)X值的條件分布相互獨(dú)立。第38頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五一元線性回歸模型的假定第39頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五在實(shí)際應(yīng)用中,我們對(duì)X和Y所代表的總體往往不可能全面的觀察和了解,而只能從中抽取部分資料作為樣本,并通過(guò)樣本提供的信息來(lái)認(rèn)識(shí)總體,找出總體回歸模型的估計(jì)式,其估計(jì)式的方程式可寫(xiě)為:簡(jiǎn)單線性回歸模型其中:a,b和ei分別為A、B及εi的估計(jì)量。由于抽樣的隨機(jī)性,使樣本回歸線不可能與總體回歸完全重合,從而會(huì)出現(xiàn)樣本回歸函數(shù)高估或低估總體回歸函數(shù)的情況,我們能做的就是設(shè)法使樣本回歸函數(shù)盡可能接近總體回歸函數(shù),也就是說(shuō)要使回歸方程參數(shù)的估計(jì)值a、b盡量接近總體真實(shí)參數(shù)A、B。樣本回歸模型第40頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五一元線性回歸方程的幾何意義截距斜率一元線性回歸方程的可能形態(tài)為正為負(fù)為0回歸直線的擬合第41頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五總體一元線性回歸方程:樣本一元線性回歸方程:以樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)斜率(回歸系數(shù))截距截距a表示在沒(méi)有自變量x的影響時(shí),其它各種因素對(duì)因變量y的平均影響;回歸系數(shù)b表明自變量x每變動(dòng)一個(gè)單位,因變量y平均變動(dòng)b個(gè)單位。(估計(jì)的回歸方程)第42頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五隨機(jī)干擾:各種偶然因素、觀察誤差和其他被忽視因素的影響X對(duì)y的線性影響而形成的系統(tǒng)部分,反映兩變量的平均變動(dòng)關(guān)系,即本質(zhì)特征。第43頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五殘差(Residual):e第44頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五(一)建立一元線性回歸方程的步驟1、作散點(diǎn)圖2、配直線方程第45頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五一元線性回歸方程中參數(shù)a、b的確定:最小平方法基本數(shù)學(xué)要求第46頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五整理得到由兩個(gè)關(guān)于a、b的二元一次方程組成的方程組:進(jìn)一步整理,有:第47頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五例考察某班學(xué)生身高與體重的相關(guān)關(guān)系學(xué)生身高x體重yx2y2xy估計(jì)值?殘差y-?ABCDEFGHIJ1581601621641661681701721741764750485562605261706524964256002624426896275562822428900295843027630976220925002304302538443600270437214900422574268000777690201029210080884010492121801144047.29149.44851.60653.76455.92158.07960.23662.39464.55266.709-0.2910.552-3.6061.2366.0791.921-8.236-1.3945.448-1.70916705702792203303295546-0第48頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五【分析】因?yàn)楣I(yè)總產(chǎn)值與能源消耗量之間存在高度正相關(guān)關(guān)系(),所以可以擬合工業(yè)總產(chǎn)值對(duì)能源消耗量的線性回歸方程?!纠拷⒐I(yè)總產(chǎn)值對(duì)能源消耗量的線性回歸方程資料解:設(shè)線性回歸方程為第49頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五散點(diǎn)圖工業(yè)總產(chǎn)值能源消耗量第50頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五即線性回歸方程為:計(jì)算結(jié)果表明,在其他條件不變時(shí),能源消耗量每增加一個(gè)單位(十萬(wàn)噸),工業(yè)總產(chǎn)值將增加0.7961個(gè)單位(億元)。第51頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五最小二乘法估計(jì)的優(yōu)良性質(zhì)殘差之和為零所擬合直線通過(guò)樣本散點(diǎn)圖的重心誤差項(xiàng)與解釋變量不相關(guān)a與b分別是總體回歸系數(shù)的無(wú)偏估計(jì)量a與b均為服從正態(tài)分布的隨機(jī)變量第52頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五b與r的關(guān)系:r>0r<0r=0b>0b<0 b=0第53頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五二、回歸方程的顯著性檢驗(yàn)(一)平方和的分解第54頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五殘差平方和回歸平方和總離差平方和第55頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五計(jì)算公式第56頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五(三)樣本判定系數(shù)確定回歸直線后,需要評(píng)價(jià)這一直線方程是否有效地反映了這兩變量之間的關(guān)系。評(píng)價(jià)回歸方程配合好壞的一個(gè)主要指標(biāo)是判定系數(shù)(或稱(chēng)確定系數(shù))是相關(guān)系數(shù)的平方,用表示;用來(lái)衡量回歸方程對(duì)y的解釋程度。判定系數(shù)取值范圍:

越接近于1,表明x與y之間的相關(guān)性越強(qiáng);越接近于0,表明兩個(gè)變量之間幾乎沒(méi)有直線相關(guān)關(guān)系.樣本判定系數(shù)第57頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五r2表示全部偏差中有百分之幾的偏差可由x與y的回歸關(guān)系來(lái)解釋r的符號(hào)同b第58頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五學(xué)生身高體重估計(jì)值A(chǔ)BCDEFGHIJ1581601621641661681701721741764750485562605261706524964256002624426896275562822428900295843027630976220925002304302538443600270437214900422574268000777690201029210080884010492121801144047.2949.4551.6153.7655.9258.0860.2462.3964.5566.71-9.71-7.55-5.39-3.24-1.081.083.245.397.559.71-10-7-9-253-5413816705702792203303295546-00第59頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五回歸分析中我們最關(guān)心的是:

X與Y是否有真正的相關(guān)關(guān)系。即:(二)F檢驗(yàn)第60頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五回歸系數(shù)的檢驗(yàn)1、提出假設(shè);2、確定檢驗(yàn)統(tǒng)計(jì)量;3、給定顯著性水平,確定臨界值;第61頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五5、結(jié)論4、計(jì)算F,比較第62頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五學(xué)生身高體重估計(jì)值A(chǔ)BCDEFGHIJ1581601621641661681701721741764750485562605261706524964256002624426896275562822428900295843027630976220925002304302538443600270437214900422574268000777690201029210080884010492121801144047.2949.4551.6153.7655.9258.0860.2462.3964.5566.71-9.71-7.55-5.39-3.24-1.081.083.245.397.559.71-10-7-9-253-5413816705702792203303295546-00第63頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五檢驗(yàn)統(tǒng)計(jì)量落入拒絕域中,故拒絕原假設(shè),接受備擇假設(shè)。即可以認(rèn)為b明顯地不等于零,X與Y是顯著的。第64頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五F檢驗(yàn)是基于F分布進(jìn)行的,是方差分析內(nèi)容之一。方差來(lái)源平方和自由度均方F值回歸誤差總計(jì)SSRSSESST1n-2n-1均方回歸均方誤差第65頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五當(dāng)1=0時(shí),SSR=0,則F值=0。當(dāng)10時(shí),SSR>0,則F值>0。當(dāng)我們?cè)O(shè)1=0時(shí),則較大的F值將推翻這一假設(shè)。故拒絕原假設(shè),接受備擇假設(shè),即認(rèn)為回歸方程是顯著的。第66頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五

預(yù)測(cè)的前提:回歸方程經(jīng)過(guò)檢驗(yàn),證明X和Y

的關(guān)系在統(tǒng)計(jì)上是顯著的。

回歸分析的點(diǎn)預(yù)測(cè):對(duì)于給定的

X

值,求出Y平均值的一個(gè)估計(jì)值或Y

的一個(gè)個(gè)別值。若x=169,則:

三、預(yù)測(cè)及應(yīng)用第67頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五利用點(diǎn)預(yù)測(cè)得到的Y平均值的點(diǎn)估計(jì)值和Y的一個(gè)個(gè)別值其結(jié)果是相同的。點(diǎn)預(yù)測(cè)不能提供估計(jì)量的精確度。在樣本自變量取值范圍之外進(jìn)行預(yù)測(cè)要特別謹(jǐn)慎。使用點(diǎn)預(yù)測(cè)應(yīng)注意的問(wèn)題:第68頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五回歸方程的估計(jì)與預(yù)測(cè)估計(jì)的前提:回歸方程經(jīng)過(guò)檢驗(yàn),證明X和Y

的關(guān)系在統(tǒng)計(jì)上是顯著相關(guān)的。對(duì)于給定的

X

值,求出Y平均值的一個(gè)估計(jì)值或Y

的一個(gè)個(gè)別值的預(yù)測(cè)值。對(duì)于給定的X值,求出Y

的平均值的置信區(qū)間或Y

的一個(gè)個(gè)別值的預(yù)測(cè)區(qū)間。點(diǎn)估計(jì)區(qū)間估計(jì)第69頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五點(diǎn)估計(jì)若x=80(十萬(wàn)噸),則:第70頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五區(qū)間估計(jì)對(duì)于給定的x=x0

,Y的1-置信區(qū)間為自由度為n-2的t分布的水平雙側(cè)分位數(shù)第71頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五即:在大樣本條件下,近似有:第72頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五

回歸分析的區(qū)間估計(jì):對(duì)于給定的X值,求出Y

的平均值的置信區(qū)間或Y

的一個(gè)個(gè)別值的預(yù)測(cè)區(qū)間。第73頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五

Y的平均值的置信區(qū)間估計(jì)總體的回歸模型樣本回歸方程如果樣本回歸方程通過(guò)檢驗(yàn),則:如果給定x=x0

,則有:分布形態(tài)?第74頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五可以證明,?0

是服從正態(tài)分布的,其數(shù)學(xué)期望:其方差:其標(biāo)準(zhǔn)差:第75頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五對(duì)于給定的x=x0

,Y的1-置信區(qū)間為:也就是:自由度為n-2的t分布的水平雙側(cè)分位數(shù)第76頁(yè),共83頁(yè),2022年,5月20日,13點(diǎn)31分,星期五學(xué)生身高體重估計(jì)值A(chǔ)BCDEFGHIJ1581601621641661681701721741764750485562605261706524964256002624426896275562822428900295843027630976220925002304302538443600270437214900422574268000777690201029210080884010492121801144047.2949.4551.6153.7655.9258.0860.2462.3964.5566.71

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論