簡單線性回歸模型課件_第1頁
簡單線性回歸模型課件_第2頁
簡單線性回歸模型課件_第3頁
簡單線性回歸模型課件_第4頁
簡單線性回歸模型課件_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第十講簡單線性回歸模型1第十講簡單線性回歸模型1建立兩個(gè)變量X和Y間的關(guān)系模型,推斷變量Y如何依賴于變量X,從而可以用X預(yù)測Y.例:廣告費(fèi)用和銷售量公司的市值與CEO的年薪原始股的銷售數(shù)量和期望價(jià)格證券市場收益率與某只股票的收益率商品價(jià)格和銷售量裝配線的速度和次品數(shù)量年收入與信用卡消費(fèi)金額年齡與手機(jī)話費(fèi)連鎖店附近的人流與店的利潤氣溫與滑雪場門票銷量………2建立兩個(gè)變量X和Y間的關(guān)系模型,推斷變量Y如何依賴于變量X,阿姆德比薩餅連鎖店的問題阿姆得(Armand)比薩餅連鎖店坐落在美國的5個(gè)州內(nèi),它們通常的位置是在大學(xué)旁邊,而且管理人員相信附近大學(xué)的人數(shù)與這些連鎖店的季度銷售額是有關(guān)系的。下面是10家連鎖店附近大學(xué)的學(xué)生人數(shù)和季度銷售收入的數(shù)據(jù):根據(jù)以上數(shù)據(jù),你能否判斷學(xué)生人數(shù)(x)如何影響到銷售收入(y)?根據(jù)一家連鎖店附近大學(xué)的人數(shù),你能夠預(yù)測該家連鎖店的季度銷售收入嗎?3阿姆德比薩餅連鎖店的問題阿姆得(Ar描述學(xué)生人數(shù)和銷售收入之間的關(guān)系協(xié)方差(315.56)和相關(guān)系數(shù)(0.95),散點(diǎn)圖;根據(jù)這些你可以得到什么結(jié)論?

4描述學(xué)生人數(shù)和銷售收入之間的關(guān)系協(xié)方差(315.56)和相關(guān)TypesofRegressionModelsPositiveLinearRelationshipNegativeLinearRelationshipRelationshipNOTLinearNoRelationship5TypesofRegressionModelsPos模型的引入對于給定的學(xué)生人數(shù),銷售收入是唯一確定的一個(gè)數(shù),還是一個(gè)隨機(jī)變量?學(xué)生人數(shù)的變化如何影響到銷售收入?使用的模型

6模型的引入對于給定的學(xué)生人數(shù),銷售收入是唯一確定的一個(gè)數(shù),還簡單線性回歸模型

Y的截距斜率隨機(jī)誤差因變量(響應(yīng)變量,被預(yù)測變量)自變量(解釋變量,預(yù)測變量)7簡單線性回歸模型Y的截距斜率隨機(jī)誤差因變量(響應(yīng)變量,i=隨機(jī)誤差YX觀測值觀測值YX01YXiii018i=隨機(jī)誤差YX觀測值觀測值YX01YXiii模型的假定1)E()=0;(E(y)=x)2)對于所有的x,Var()=.3)是服從正態(tài)分布N(0,)的.4)對于不同的x,是相互獨(dú)立的.這些假定意味著什么?9模型的假定1)E()=0;(E(y)=X1X2XYfy服從在回歸直線附近的正態(tài)分布對每個(gè)x值,y分布的方差相同.回歸直線10X1X2XYfy服從在回歸直線附近的正態(tài)分布回歸直線10估計(jì)的回歸方程如何估計(jì)參數(shù)和?最小二乘準(zhǔn)則

11估計(jì)的回歸方程如何估計(jì)參數(shù)和?11阿姆德連鎖店的回歸直線估計(jì)參數(shù)b1=5b0=60回歸直線你對系數(shù)的含義怎么理解?

12阿姆德連鎖店的回歸直線估計(jì)參數(shù)12回歸方程的判定系數(shù)y的總變差的分解定義判定系數(shù)R2=SSR/SST.判定系數(shù)的含義是什么?阿姆德比薩餅連鎖店的例子:R2=0.9027.判定系數(shù)和相關(guān)系數(shù)的關(guān)系。

13回歸方程的判定系數(shù)y的總變差的分解13CoefficientsofDetermination(r2)andCorrelation(r)

r2=1,r2=1,r2=.8,r2=0,YXY

XY

YXr=+1r=-1r=+0.9r=0X14CoefficientsofDetermination的估計(jì)理解誤差平方和的一個(gè)無偏估計(jì)s2=MSE=SSE/(n-2)

15的估計(jì)15關(guān)于回歸系數(shù)的假設(shè)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量給定顯著水平時(shí),選擇拒絕域

16關(guān)于回歸系數(shù)的假設(shè)檢驗(yàn)16關(guān)于回歸方程整體的檢驗(yàn)變量x的確對y有解釋作用嗎?(H0:=0)檢驗(yàn)統(tǒng)計(jì)量F=MSR/MSE其中MSR=SSR/自變量的個(gè)數(shù)拒絕域F>F(1,n-2)17關(guān)于回歸方程整體的檢驗(yàn)變量x的確對y有解釋作用嗎?(H0:回歸方程的方差分析表18回歸方程的方差分析表18阿姆德連鎖店的情形

使用EXCEL對阿姆德連鎖店的數(shù)據(jù)建立模型,并進(jìn)行分析,基于EXCEL的輸出結(jié)果,你對該模型有些什么認(rèn)識(shí)?19阿姆德連鎖店的情形19使用你建立的模型(一)問題一:對于那些附近學(xué)校人數(shù)是1萬的連鎖店,他們的季度銷售收入一定是一樣嗎?這種連鎖店平均的季度銷售收入是多少?你能夠給出一個(gè)估計(jì)嗎?問題二:某家連鎖店附近學(xué)生總數(shù)約1萬人,你能夠給出它的季度銷售收入的一個(gè)估計(jì)值嗎?點(diǎn)估計(jì):11020使用你建立的模型(一)問題一:對于那些附近學(xué)校人數(shù)是1萬的連使用你建立的模型(二)對于問題一,如何得到這種連鎖店平均銷售收入的一個(gè)95%的置信區(qū)間?

(98.58,121.42)21使用你建立的模型(二)對于問題一,如何得到這種連鎖店平均銷售使用你建立的模型(三)對于問題二,如何給出一個(gè)預(yù)測區(qū)間,使得這家連鎖店的季度銷售收入落在該區(qū)間里面的概率是1-?(76.13,143.87)22使用你建立的模型(三)對于問題二,如何給出一個(gè)預(yù)測區(qū)間,使得兩種區(qū)間的關(guān)系xp預(yù)測區(qū)間邊界均值的置信區(qū)間23兩種區(qū)間的關(guān)系xp預(yù)測區(qū)間邊界均值的置信區(qū)間23對模型作進(jìn)一步的探討回憶我們使用的模型;對模型作了什么假定?邏輯問題:如何判斷我們的問題符合這些假定?分析的方案:殘差分析

24對模型作進(jìn)一步的探討回憶我們使用的模型;24通過殘差你能夠了解什么?對誤差項(xiàng)作的假定適合嗎?1)等方差;2)相互獨(dú)立;3)正態(tài)分布;哪些數(shù)據(jù)屬于異常值?哪些觀測屬于對回歸模型有很大影響的?25通過殘差你能夠了解什么?對誤差項(xiàng)作的假定適合嗎?25殘差圖關(guān)于自變量的殘差圖;關(guān)于因變量的預(yù)測值的殘差圖;學(xué)生化的標(biāo)準(zhǔn)殘差圖:

26殘差圖關(guān)于自變量的殘差圖;26如何分析殘差圖如果模型是符合的,那么殘差圖上的散點(diǎn)應(yīng)該落在一條水平帶中間,除此之外,殘差圖上的點(diǎn)不應(yīng)呈現(xiàn)出什么規(guī)律性。使用EXCEL對阿姆德連鎖店的數(shù)據(jù)產(chǎn)生殘差圖。你能得到什么結(jié)論?27如何分析殘差圖如果模型是符合的,那么殘差圖上的散點(diǎn)應(yīng)該落在一非線性線性X

X28非線性線性XX28方差不等方差相等XX29方差不等方差相等XX29不獨(dú)立獨(dú)立XX30不獨(dú)立獨(dú)立XX30一個(gè)殘差不獨(dú)立的例子31一個(gè)殘差不獨(dú)立的例子31異常值的檢測異常值是與其它點(diǎn)顯示的趨勢不合的點(diǎn)。檢查它是否可能是被錯(cuò)誤輸入的數(shù)據(jù)。檢測異常值的方法:散點(diǎn)圖;利用學(xué)生化標(biāo)準(zhǔn)殘差基本服從標(biāo)準(zhǔn)正態(tài)分布來檢測(落在2個(gè)標(biāo)準(zhǔn)差之外時(shí))。32異常值的檢測異常值是與其它點(diǎn)顯示的趨勢不合的點(diǎn)。32帶有異常值的散點(diǎn)圖示例33帶有異常值的散點(diǎn)圖示例33檢測有影響的觀測值什么是有影響的觀測?觀測的杠桿率:高杠桿率的點(diǎn)意味著它的自變量距離別的自變量的值距離較大的點(diǎn)。識(shí)別影響的觀測:杠桿率>6/n的觀測.

34檢測有影響的觀測值什么是有影響的觀測?34對于建立簡單線性回歸模型,

你知道了些什么?什么情況下需要建立簡單線性回歸模型?對模型的假定有哪些?如何估計(jì)模型的參數(shù)?如何檢驗(yàn)?zāi)P图捌鋮?shù)的顯著性?如何使用你建立的模型進(jìn)行預(yù)測?如何分析你的問題符合對模型做的假定?35對于建立簡單線性回歸模型,

你知道了些什么?什么情況下需要建第十講簡單線性回歸模型36第十講簡單線性回歸模型1建立兩個(gè)變量X和Y間的關(guān)系模型,推斷變量Y如何依賴于變量X,從而可以用X預(yù)測Y.例:廣告費(fèi)用和銷售量公司的市值與CEO的年薪原始股的銷售數(shù)量和期望價(jià)格證券市場收益率與某只股票的收益率商品價(jià)格和銷售量裝配線的速度和次品數(shù)量年收入與信用卡消費(fèi)金額年齡與手機(jī)話費(fèi)連鎖店附近的人流與店的利潤氣溫與滑雪場門票銷量………37建立兩個(gè)變量X和Y間的關(guān)系模型,推斷變量Y如何依賴于變量X,阿姆德比薩餅連鎖店的問題阿姆得(Armand)比薩餅連鎖店坐落在美國的5個(gè)州內(nèi),它們通常的位置是在大學(xué)旁邊,而且管理人員相信附近大學(xué)的人數(shù)與這些連鎖店的季度銷售額是有關(guān)系的。下面是10家連鎖店附近大學(xué)的學(xué)生人數(shù)和季度銷售收入的數(shù)據(jù):根據(jù)以上數(shù)據(jù),你能否判斷學(xué)生人數(shù)(x)如何影響到銷售收入(y)?根據(jù)一家連鎖店附近大學(xué)的人數(shù),你能夠預(yù)測該家連鎖店的季度銷售收入嗎?38阿姆德比薩餅連鎖店的問題阿姆得(Ar描述學(xué)生人數(shù)和銷售收入之間的關(guān)系協(xié)方差(315.56)和相關(guān)系數(shù)(0.95),散點(diǎn)圖;根據(jù)這些你可以得到什么結(jié)論?

39描述學(xué)生人數(shù)和銷售收入之間的關(guān)系協(xié)方差(315.56)和相關(guān)TypesofRegressionModelsPositiveLinearRelationshipNegativeLinearRelationshipRelationshipNOTLinearNoRelationship40TypesofRegressionModelsPos模型的引入對于給定的學(xué)生人數(shù),銷售收入是唯一確定的一個(gè)數(shù),還是一個(gè)隨機(jī)變量?學(xué)生人數(shù)的變化如何影響到銷售收入?使用的模型

41模型的引入對于給定的學(xué)生人數(shù),銷售收入是唯一確定的一個(gè)數(shù),還簡單線性回歸模型

Y的截距斜率隨機(jī)誤差因變量(響應(yīng)變量,被預(yù)測變量)自變量(解釋變量,預(yù)測變量)42簡單線性回歸模型Y的截距斜率隨機(jī)誤差因變量(響應(yīng)變量,i=隨機(jī)誤差YX觀測值觀測值YX01YXiii0143i=隨機(jī)誤差YX觀測值觀測值YX01YXiii模型的假定1)E()=0;(E(y)=x)2)對于所有的x,Var()=.3)是服從正態(tài)分布N(0,)的.4)對于不同的x,是相互獨(dú)立的.這些假定意味著什么?44模型的假定1)E()=0;(E(y)=X1X2XYfy服從在回歸直線附近的正態(tài)分布對每個(gè)x值,y分布的方差相同.回歸直線45X1X2XYfy服從在回歸直線附近的正態(tài)分布回歸直線10估計(jì)的回歸方程如何估計(jì)參數(shù)和?最小二乘準(zhǔn)則

46估計(jì)的回歸方程如何估計(jì)參數(shù)和?11阿姆德連鎖店的回歸直線估計(jì)參數(shù)b1=5b0=60回歸直線你對系數(shù)的含義怎么理解?

47阿姆德連鎖店的回歸直線估計(jì)參數(shù)12回歸方程的判定系數(shù)y的總變差的分解定義判定系數(shù)R2=SSR/SST.判定系數(shù)的含義是什么?阿姆德比薩餅連鎖店的例子:R2=0.9027.判定系數(shù)和相關(guān)系數(shù)的關(guān)系。

48回歸方程的判定系數(shù)y的總變差的分解13CoefficientsofDetermination(r2)andCorrelation(r)

r2=1,r2=1,r2=.8,r2=0,YXY

XY

YXr=+1r=-1r=+0.9r=0X49CoefficientsofDetermination的估計(jì)理解誤差平方和的一個(gè)無偏估計(jì)s2=MSE=SSE/(n-2)

50的估計(jì)15關(guān)于回歸系數(shù)的假設(shè)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量給定顯著水平時(shí),選擇拒絕域

51關(guān)于回歸系數(shù)的假設(shè)檢驗(yàn)16關(guān)于回歸方程整體的檢驗(yàn)變量x的確對y有解釋作用嗎?(H0:=0)檢驗(yàn)統(tǒng)計(jì)量F=MSR/MSE其中MSR=SSR/自變量的個(gè)數(shù)拒絕域F>F(1,n-2)52關(guān)于回歸方程整體的檢驗(yàn)變量x的確對y有解釋作用嗎?(H0:回歸方程的方差分析表53回歸方程的方差分析表18阿姆德連鎖店的情形

使用EXCEL對阿姆德連鎖店的數(shù)據(jù)建立模型,并進(jìn)行分析,基于EXCEL的輸出結(jié)果,你對該模型有些什么認(rèn)識(shí)?54阿姆德連鎖店的情形19使用你建立的模型(一)問題一:對于那些附近學(xué)校人數(shù)是1萬的連鎖店,他們的季度銷售收入一定是一樣嗎?這種連鎖店平均的季度銷售收入是多少?你能夠給出一個(gè)估計(jì)嗎?問題二:某家連鎖店附近學(xué)生總數(shù)約1萬人,你能夠給出它的季度銷售收入的一個(gè)估計(jì)值嗎?點(diǎn)估計(jì):11055使用你建立的模型(一)問題一:對于那些附近學(xué)校人數(shù)是1萬的連使用你建立的模型(二)對于問題一,如何得到這種連鎖店平均銷售收入的一個(gè)95%的置信區(qū)間?

(98.58,121.42)56使用你建立的模型(二)對于問題一,如何得到這種連鎖店平均銷售使用你建立的模型(三)對于問題二,如何給出一個(gè)預(yù)測區(qū)間,使得這家連鎖店的季度銷售收入落在該區(qū)間里面的概率是1-?(76.13,143.87)57使用你建立的模型(三)對于問題二,如何給出一個(gè)預(yù)測區(qū)間,使得兩種區(qū)間的關(guān)系xp預(yù)測區(qū)間邊界均值的置信區(qū)間58兩種區(qū)間的關(guān)系xp預(yù)測區(qū)間邊界均值的置信區(qū)間23對模型作進(jìn)一步的探討回憶我們使用的模型;對模型作了什么假定?邏輯問題:如何判斷我們的問題符合這些假定?分析的方案:殘差分析

59對模型作進(jìn)一步的探討回憶我們使用的模型;24通過殘差你能夠了解什么?對誤差項(xiàng)作的假定適合嗎?1)等方差;2)相互獨(dú)立;3)正態(tài)分布;哪些數(shù)據(jù)屬于異常值?哪些觀測屬于對回歸模型有很大影響的?60通過殘差你能夠了解什么?對誤差項(xiàng)作的假定適合嗎?25殘差圖關(guān)于自變量的殘差圖;關(guān)于因變量的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論