11回歸分析的基本思想及其初步應(yīng)用_第1頁(yè)
11回歸分析的基本思想及其初步應(yīng)用_第2頁(yè)
11回歸分析的基本思想及其初步應(yīng)用_第3頁(yè)
11回歸分析的基本思想及其初步應(yīng)用_第4頁(yè)
11回歸分析的基本思想及其初步應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1.1回歸分析的基本思想及其回歸分析的基本思想及其初步應(yīng)用初步應(yīng)用 高二數(shù)學(xué)組高二數(shù)學(xué)組整理整理ppt2函數(shù)關(guān)系函數(shù)關(guān)系確定性關(guān)系確定性關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系非確定性關(guān)系非確定性關(guān)系如身高與體重、水稻產(chǎn)量與施肥量如身高與體重、水稻產(chǎn)量與施肥量回歸分析:回歸分析:對(duì)具有相關(guān)關(guān)系的兩個(gè)對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法變量進(jìn)行統(tǒng)計(jì)分析的方法線(xiàn)性回歸分析:線(xiàn)性回歸分析:對(duì)具有對(duì)具有線(xiàn)性線(xiàn)性相關(guān)關(guān)相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法整理整理ppt3(一)回顧:線(xiàn)性回歸分析的步驟(一)回顧:線(xiàn)性回歸分析的步驟 : :溫故知新溫故知新1.畫(huà)散點(diǎn)圖畫(huà)散點(diǎn)圖4.用回歸直線(xiàn)方

2、程進(jìn)行預(yù)報(bào)用回歸直線(xiàn)方程進(jìn)行預(yù)報(bào)3.求回歸直線(xiàn)方程求回歸直線(xiàn)方程 ybxa2.求求 , b a1221-,-niiiniix ynx ybxnx參考公式:( , )x y回歸直線(xiàn)過(guò)樣本點(diǎn)的中心回歸直線(xiàn)過(guò)樣本點(diǎn)的中心.xbya整理整理ppt4 (三)描述兩個(gè)變量之間線(xiàn)性相關(guān)關(guān)系的強(qiáng)(三)描述兩個(gè)變量之間線(xiàn)性相關(guān)關(guān)系的強(qiáng)弱的弱的相關(guān)系數(shù)相關(guān)系數(shù)r0.751, 1, 0.75, 0 25,0.25,rrr 當(dāng), 表明兩個(gè)變量正相關(guān)很強(qiáng);當(dāng)表明兩個(gè)變量負(fù)相關(guān)很強(qiáng);當(dāng).表明兩個(gè)變量相關(guān)性較弱。122122211121()()()()(niiinniiiiniiinniiiix ynxxyx yxnxyn

3、yyxxyyr整理整理ppt5xo246820406080y線(xiàn)性相關(guān)整理整理ppt61221-,-niiiniix ynx ybxnx參考公式:(2)ybxa求回歸直線(xiàn)方程51iiixy521iixx y 550138014521380-5 5 50=6.5,145-5 5b 506.5 517.5ayb x 6.517.5yx回歸方程為:10()82.5廣告支出為百萬(wàn)元 時(shí),銷(xiāo)售收入約百萬(wàn)元.例例1 1 從某大學(xué)中隨機(jī)選取從某大學(xué)中隨機(jī)選取8 8名女大學(xué)生,其身高和體重名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表數(shù)據(jù)如表1-11-1所示。所示。編號(hào)編號(hào)1 12 23 34 45 56 67 78 8身高

4、身高/cm/cm165165165165157157170170175175165165155155170170體重體重/kg/kg48485757505054546464616143435959求根據(jù)女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程,并預(yù)報(bào)求根據(jù)女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程,并預(yù)報(bào)一名身高為一名身高為172cm172cm的女大學(xué)生的體的女大學(xué)生的體重。重。問(wèn)題呈現(xiàn):女大學(xué)生的身高與體重問(wèn)題呈現(xiàn):女大學(xué)生的身高與體重整理整理ppt80.84985.712yx解;解; 1.1.由于問(wèn)題中由于問(wèn)題中要求根據(jù)身高預(yù)報(bào)要求根據(jù)身高預(yù)報(bào)體重,因此選取身體重,因此選取身高為自變量高為自變量x

5、x,體重,體重為因變量為因變量y y學(xué)學(xué)身身高高1 17 72 2c cm m女女大大生生體體重重y y = = 0 0. .8 84 49 91 17 72 2- -8 85 5. .7 71 12 2 = = 6 60 0. .3 31 16 6( (k kg g) )3.3.回歸方程回歸方程:2. 2. 散點(diǎn)圖散點(diǎn)圖;4.本例中本例中, r=0.7980.75這表明體重與身高有很強(qiáng)的線(xiàn)性相關(guān)這表明體重與身高有很強(qiáng)的線(xiàn)性相關(guān)關(guān)系,從而也表明我們建立的回歸模型是有意義的。關(guān)系,從而也表明我們建立的回歸模型是有意義的。0.84985.712yx探究:探究:身高為身高為172cm的女大學(xué)生的體重

6、一定是的女大學(xué)生的體重一定是60.316kg嗎?嗎?如果不是,你能解析一下原因嗎?如果不是,你能解析一下原因嗎?答:身高為答:身高為172cm172cm的女大學(xué)生的體重不一定是的女大學(xué)生的體重不一定是60.316kg60.316kg, 但一般可以認(rèn)為她的體重接近于但一般可以認(rèn)為她的體重接近于60.316kg60.316kg。例例1 1 從某大學(xué)中隨機(jī)選取從某大學(xué)中隨機(jī)選取8 8名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表1-11-1所示。所示。編號(hào)12345678身高/cm165165 157 170 175 165 155 170體重/kg4857505464614359

7、女大學(xué)生的身高與體重女大學(xué)生的身高與體重ybxa我們可以用下面的我們可以用下面的線(xiàn)性回歸模型線(xiàn)性回歸模型來(lái)表示:來(lái)表示:y=bx+a+e, (3)其中其中a和和b為模型的未知參數(shù),為模型的未知參數(shù),e稱(chēng)為隨機(jī)誤差稱(chēng)為隨機(jī)誤差。它。它的均值的均值E(X)=0,方差,方差D(e)0;(4)為線(xiàn)性回歸模型的為線(xiàn)性回歸模型的完整表達(dá)式完整表達(dá)式y(tǒng)=bx+a+e,E(e)=0,D(e)= (4) 2. 在線(xiàn)性回歸模型在線(xiàn)性回歸模型(4)中,隨機(jī)誤差中,隨機(jī)誤差e的方差的方差 越小,用越小,用bx+a 預(yù)報(bào)真實(shí)值預(yù)報(bào)真實(shí)值y y的精度越高。的精度越高。2隨機(jī)誤差是引起預(yù)報(bào)值隨機(jī)誤差是引起預(yù)報(bào)值 與真實(shí)值與

8、真實(shí)值 y 之間的誤差的原因之一,之間的誤差的原因之一,其大小取決于隨機(jī)誤差的方差。其大小取決于隨機(jī)誤差的方差。 y另一方面,由于公式另一方面,由于公式(1)和和(2)中中 和和 為截距和斜率的估計(jì)值,它為截距和斜率的估計(jì)值,它們與真實(shí)值們與真實(shí)值 a 和和 b 之間也存在誤差,這種誤差是引起預(yù)報(bào)值之間也存在誤差,這種誤差是引起預(yù)報(bào)值 與真與真實(shí)值實(shí)值 y 之間誤差的另一個(gè)原因。之間誤差的另一個(gè)原因。 y ab5943616454505748體重體重/kg170155165175170157165165身高身高/cm87654321編號(hào)編號(hào)假設(shè)假設(shè): :隨機(jī)誤差對(duì)體重沒(méi)有影響,也就是說(shuō),體重僅

9、受身高的影響,隨機(jī)誤差對(duì)體重沒(méi)有影響,也就是說(shuō),體重僅受身高的影響,那么散點(diǎn)圖中所有的點(diǎn)將完全落在回歸直線(xiàn)上那么散點(diǎn)圖中所有的點(diǎn)將完全落在回歸直線(xiàn)上。 怎樣研究隨即誤差?怎樣研究隨即誤差?因此,數(shù)據(jù)點(diǎn)和它在回歸直線(xiàn)上相應(yīng)位置的差異因此,數(shù)據(jù)點(diǎn)和它在回歸直線(xiàn)上相應(yīng)位置的差異 是隨機(jī)誤差的效應(yīng),稱(chēng)是隨機(jī)誤差的效應(yīng),稱(chēng) 為為殘差殘差。)iiyy(iiieyy=例如,編號(hào)為例如,編號(hào)為6 6的女大學(xué)生,計(jì)算隨機(jī)誤差的效應(yīng)(殘差)的女大學(xué)生,計(jì)算隨機(jī)誤差的效應(yīng)(殘差)為:為:61 (0.849 16585.712)6.627對(duì)每名女大學(xué)生計(jì)算這個(gè)差異,然后分別將所得的值平方對(duì)每名女大學(xué)生計(jì)算這個(gè)差異,然

10、后分別將所得的值平方后加起來(lái),用數(shù)學(xué)符號(hào)后加起來(lái),用數(shù)學(xué)符號(hào)21()niiiyy稱(chēng)為稱(chēng)為殘差平方和殘差平方和,它代表了隨機(jī)誤差的效應(yīng)。它代表了隨機(jī)誤差的效應(yīng)。表示為:表示為:用殘差估計(jì)隨機(jī)誤差用殘差估計(jì)隨機(jī)誤差整理整理ppt14殘差圖的制作及作用。坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇;若模型選擇的正確,殘差圖中的點(diǎn)應(yīng)該分布在以橫軸為心的帶形區(qū)域;對(duì)于遠(yuǎn)離橫軸的點(diǎn),要特別注意。身高與體重殘差圖身高與體重殘差圖異常點(diǎn)異常點(diǎn) 錯(cuò)誤數(shù)據(jù)錯(cuò)誤數(shù)據(jù) 模型問(wèn)題模型問(wèn)題 幾點(diǎn)說(shuō)明: 第一個(gè)樣本點(diǎn)和第6個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集過(guò)程中是否有人為的錯(cuò)誤。如果數(shù)據(jù)采集有錯(cuò)誤,就予以糾正,然后再重新利用

11、線(xiàn)性回歸模型擬合數(shù)據(jù);如果數(shù)據(jù)采集沒(méi)有錯(cuò)誤,則需要尋找其他的原因。 另外,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型計(jì)較合適,這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高。我們可以用我們可以用相關(guān)指數(shù)相關(guān)指數(shù)R R2 2來(lái)刻畫(huà)回歸的效果,其計(jì)算公式來(lái)刻畫(huà)回歸的效果,其計(jì)算公式是是22121()11()niiiniiyyRyy 殘差平方和。總偏差平方和如何衡量預(yù)報(bào)的精度?如何衡量預(yù)報(bào)的精度?顯然,顯然,R R2 2的值越大,說(shuō)明殘差平方和越小,也就是說(shuō)模型的值越大,說(shuō)明殘差平方和越小,也就是說(shuō)模型擬合效果越好。擬合效果越好。 如果某組數(shù)據(jù)可能采取幾種不同回歸方

12、程進(jìn)行回歸分析,如果某組數(shù)據(jù)可能采取幾種不同回歸方程進(jìn)行回歸分析,則可以通過(guò)比較則可以通過(guò)比較R R2 2的值來(lái)做出選擇,即選取的值來(lái)做出選擇,即選取R R2 2較大的模型較大的模型作為這組數(shù)據(jù)的模型作為這組數(shù)據(jù)的模型。54.5kg5943616454505748體重體重/kg170155165175170157165165身高身高/cm87654321編號(hào)編號(hào)數(shù)學(xué)上,把每個(gè)效應(yīng)(觀測(cè)值減去總的平均值)的平方加起來(lái),即用21()niiyy表示總的效應(yīng),稱(chēng)為總偏差平方和。1 1、在對(duì)兩個(gè)變量,進(jìn)行線(xiàn)性回歸分析時(shí)有下列步驟、在對(duì)兩個(gè)變量,進(jìn)行線(xiàn)性回歸分析時(shí)有下列步驟:對(duì)所求出的回歸方程作出解釋?zhuān)?/p>

13、集數(shù)據(jù)(對(duì)所求出的回歸方程作出解釋?zhuān)占瘮?shù)據(jù)( ,),)求線(xiàn)性回歸方程,求相關(guān)系數(shù),根據(jù)所搜集的數(shù)據(jù)繪制散點(diǎn)求線(xiàn)性回歸方程,求相關(guān)系數(shù),根據(jù)所搜集的數(shù)據(jù)繪制散點(diǎn)圖如果根據(jù)可靠性要求能夠作出變量,具有線(xiàn)性相關(guān)結(jié)論,圖如果根據(jù)可靠性要求能夠作出變量,具有線(xiàn)性相關(guān)結(jié)論,則在下列操作順序中正確的是()則在下列操作順序中正確的是()學(xué)以致用:學(xué)以致用:iyix整理整理ppt18練習(xí):、的取植越小,模型擬合效果越好的取植越小,模型擬合效果越好、的取值可以是任意大,且取值越大擬合效果的取值可以是任意大,且取值越大擬合效果 越好越好、的取值越接近,模型擬合效果越好的取值越接近,模型擬合效果越好、以上答案都不對(duì)

14、以上答案都不對(duì)學(xué)以致用:學(xué)以致用:2 2、對(duì)于相關(guān)指數(shù),下列說(shuō)法正確的是()、對(duì)于相關(guān)指數(shù),下列說(shuō)法正確的是()2R2R2R2R2R2R學(xué)以致用:學(xué)以致用:3 3、甲、乙、丙,丁四位同學(xué)各自對(duì),兩變量的線(xiàn)性、甲、乙、丙,丁四位同學(xué)各自對(duì),兩變量的線(xiàn)性相關(guān)性做實(shí)驗(yàn),并用回歸分析方法分別求得相關(guān)系數(shù)相關(guān)性做實(shí)驗(yàn),并用回歸分析方法分別求得相關(guān)系數(shù)r r與與殘差平方和殘差平方和m m如下表如下表:甲甲乙乙丙丙丁丁r0.820.820.780.780.690.690.850.85m106106115115124124103103則哪位同學(xué)的實(shí)驗(yàn)結(jié)果體現(xiàn),兩變量有更強(qiáng)的線(xiàn)性相則哪位同學(xué)的實(shí)驗(yàn)結(jié)果體現(xiàn),兩變量有更強(qiáng)的線(xiàn)性相關(guān)性關(guān)性甲乙丙丁甲乙丙丁學(xué)以致用學(xué)以致用:4 4、 已知兩個(gè)變量已知兩個(gè)變量x x和和y y之間有線(xiàn)性相關(guān)性,次實(shí)之間有線(xiàn)性相關(guān)性,次實(shí)驗(yàn)得到樣本如下驗(yàn)得到樣本如下:6.13.920y3210 x()則()則y y對(duì)對(duì)x x的線(xiàn)性回歸方程是的線(xiàn)性回歸方程是()相應(yīng)于各樣本點(diǎn)的殘差()

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論