




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十講簡單線性回歸模型1第十講簡單線性回歸模型1建立兩個(gè)變量X和Y間的關(guān)系模型,推斷變量Y如何依賴于變量X,從而可以用X預(yù)測Y.例:廣告費(fèi)用和銷售量公司的市值與CEO的年薪原始股的銷售數(shù)量和期望價(jià)格證券市場收益率與某只股票的收益率商品價(jià)格和銷售量裝配線的速度和次品數(shù)量年收入與信用卡消費(fèi)金額年齡與手機(jī)話費(fèi)連鎖店附近的人流與店的利潤氣溫與滑雪場門票銷量………2建立兩個(gè)變量X和Y間的關(guān)系模型,推斷變量Y如何依賴于變量X,阿姆德比薩餅連鎖店的問題阿姆得(Armand)比薩餅連鎖店坐落在美國的5個(gè)州內(nèi),它們通常的位置是在大學(xué)旁邊,而且管理人員相信附近大學(xué)的人數(shù)與這些連鎖店的季度銷售額是有關(guān)系的。下面是10家連鎖店附近大學(xué)的學(xué)生人數(shù)和季度銷售收入的數(shù)據(jù):根據(jù)以上數(shù)據(jù),你能否判斷學(xué)生人數(shù)(x)如何影響到銷售收入(y)?根據(jù)一家連鎖店附近大學(xué)的人數(shù),你能夠預(yù)測該家連鎖店的季度銷售收入嗎?3阿姆德比薩餅連鎖店的問題阿姆得(Ar描述學(xué)生人數(shù)和銷售收入之間的關(guān)系協(xié)方差(315.56)和相關(guān)系數(shù)(0.95),散點(diǎn)圖;根據(jù)這些你可以得到什么結(jié)論?
4描述學(xué)生人數(shù)和銷售收入之間的關(guān)系協(xié)方差(315.56)和相關(guān)TypesofRegressionModelsPositiveLinearRelationshipNegativeLinearRelationshipRelationshipNOTLinearNoRelationship5TypesofRegressionModelsPos模型的引入對于給定的學(xué)生人數(shù),銷售收入是唯一確定的一個(gè)數(shù),還是一個(gè)隨機(jī)變量?學(xué)生人數(shù)的變化如何影響到銷售收入?使用的模型
6模型的引入對于給定的學(xué)生人數(shù),銷售收入是唯一確定的一個(gè)數(shù),還簡單線性回歸模型
Y的截距斜率隨機(jī)誤差因變量(響應(yīng)變量,被預(yù)測變量)自變量(解釋變量,預(yù)測變量)7簡單線性回歸模型Y的截距斜率隨機(jī)誤差因變量(響應(yīng)變量,i=隨機(jī)誤差YX觀測值觀測值YX01YXiii018i=隨機(jī)誤差YX觀測值觀測值YX01YXiii模型的假定1)E()=0;(E(y)=x)2)對于所有的x,Var()=.3)是服從正態(tài)分布N(0,)的.4)對于不同的x,是相互獨(dú)立的.這些假定意味著什么?9模型的假定1)E()=0;(E(y)=X1X2XYfy服從在回歸直線附近的正態(tài)分布對每個(gè)x值,y分布的方差相同.回歸直線10X1X2XYfy服從在回歸直線附近的正態(tài)分布回歸直線10估計(jì)的回歸方程如何估計(jì)參數(shù)和?最小二乘準(zhǔn)則
11估計(jì)的回歸方程如何估計(jì)參數(shù)和?11阿姆德連鎖店的回歸直線估計(jì)參數(shù)b1=5b0=60回歸直線你對系數(shù)的含義怎么理解?
12阿姆德連鎖店的回歸直線估計(jì)參數(shù)12回歸方程的判定系數(shù)y的總變差的分解定義判定系數(shù)R2=SSR/SST.判定系數(shù)的含義是什么?阿姆德比薩餅連鎖店的例子:R2=0.9027.判定系數(shù)和相關(guān)系數(shù)的關(guān)系。
13回歸方程的判定系數(shù)y的總變差的分解13CoefficientsofDetermination(r2)andCorrelation(r)
r2=1,r2=1,r2=.8,r2=0,YXY
XY
YXr=+1r=-1r=+0.9r=0X14CoefficientsofDetermination的估計(jì)理解誤差平方和的一個(gè)無偏估計(jì)s2=MSE=SSE/(n-2)
15的估計(jì)15關(guān)于回歸系數(shù)的假設(shè)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量給定顯著水平時(shí),選擇拒絕域
16關(guān)于回歸系數(shù)的假設(shè)檢驗(yàn)16關(guān)于回歸方程整體的檢驗(yàn)變量x的確對y有解釋作用嗎?(H0:=0)檢驗(yàn)統(tǒng)計(jì)量F=MSR/MSE其中MSR=SSR/自變量的個(gè)數(shù)拒絕域F>F(1,n-2)17關(guān)于回歸方程整體的檢驗(yàn)變量x的確對y有解釋作用嗎?(H0:回歸方程的方差分析表18回歸方程的方差分析表18阿姆德連鎖店的情形
使用EXCEL對阿姆德連鎖店的數(shù)據(jù)建立模型,并進(jìn)行分析,基于EXCEL的輸出結(jié)果,你對該模型有些什么認(rèn)識(shí)?19阿姆德連鎖店的情形19使用你建立的模型(一)問題一:對于那些附近學(xué)校人數(shù)是1萬的連鎖店,他們的季度銷售收入一定是一樣嗎?這種連鎖店平均的季度銷售收入是多少?你能夠給出一個(gè)估計(jì)嗎?問題二:某家連鎖店附近學(xué)生總數(shù)約1萬人,你能夠給出它的季度銷售收入的一個(gè)估計(jì)值嗎?點(diǎn)估計(jì):11020使用你建立的模型(一)問題一:對于那些附近學(xué)校人數(shù)是1萬的連使用你建立的模型(二)對于問題一,如何得到這種連鎖店平均銷售收入的一個(gè)95%的置信區(qū)間?
(98.58,121.42)21使用你建立的模型(二)對于問題一,如何得到這種連鎖店平均銷售使用你建立的模型(三)對于問題二,如何給出一個(gè)預(yù)測區(qū)間,使得這家連鎖店的季度銷售收入落在該區(qū)間里面的概率是1-?(76.13,143.87)22使用你建立的模型(三)對于問題二,如何給出一個(gè)預(yù)測區(qū)間,使得兩種區(qū)間的關(guān)系xp預(yù)測區(qū)間邊界均值的置信區(qū)間23兩種區(qū)間的關(guān)系xp預(yù)測區(qū)間邊界均值的置信區(qū)間23對模型作進(jìn)一步的探討回憶我們使用的模型;對模型作了什么假定?邏輯問題:如何判斷我們的問題符合這些假定?分析的方案:殘差分析
24對模型作進(jìn)一步的探討回憶我們使用的模型;24通過殘差你能夠了解什么?對誤差項(xiàng)作的假定適合嗎?1)等方差;2)相互獨(dú)立;3)正態(tài)分布;哪些數(shù)據(jù)屬于異常值?哪些觀測屬于對回歸模型有很大影響的?25通過殘差你能夠了解什么?對誤差項(xiàng)作的假定適合嗎?25殘差圖關(guān)于自變量的殘差圖;關(guān)于因變量的預(yù)測值的殘差圖;學(xué)生化的標(biāo)準(zhǔn)殘差圖:
26殘差圖關(guān)于自變量的殘差圖;26如何分析殘差圖如果模型是符合的,那么殘差圖上的散點(diǎn)應(yīng)該落在一條水平帶中間,除此之外,殘差圖上的點(diǎn)不應(yīng)呈現(xiàn)出什么規(guī)律性。使用EXCEL對阿姆德連鎖店的數(shù)據(jù)產(chǎn)生殘差圖。你能得到什么結(jié)論?27如何分析殘差圖如果模型是符合的,那么殘差圖上的散點(diǎn)應(yīng)該落在一非線性線性X
X28非線性線性XX28方差不等方差相等XX29方差不等方差相等XX29不獨(dú)立獨(dú)立XX30不獨(dú)立獨(dú)立XX30一個(gè)殘差不獨(dú)立的例子31一個(gè)殘差不獨(dú)立的例子31異常值的檢測異常值是與其它點(diǎn)顯示的趨勢不合的點(diǎn)。檢查它是否可能是被錯(cuò)誤輸入的數(shù)據(jù)。檢測異常值的方法:散點(diǎn)圖;利用學(xué)生化標(biāo)準(zhǔn)殘差基本服從標(biāo)準(zhǔn)正態(tài)分布來檢測(落在2個(gè)標(biāo)準(zhǔn)差之外時(shí))。32異常值的檢測異常值是與其它點(diǎn)顯示的趨勢不合的點(diǎn)。32帶有異常值的散點(diǎn)圖示例33帶有異常值的散點(diǎn)圖示例33檢測有影響的觀測值什么是有影響的觀測?觀測的杠桿率:高杠桿率的點(diǎn)意味著它的自變量距離別的自變量的值距離較大的點(diǎn)。識(shí)別影響的觀測:杠桿率>6/n的觀測.
34檢測有影響的觀測值什么是有影響的觀測?34對于建立簡單線性回歸模型,
你知道了些什么?什么情況下需要建立簡單線性回歸模型?對模型的假定有哪些?如何估計(jì)模型的參數(shù)?如何檢驗(yàn)?zāi)P图捌鋮?shù)的顯著性?如何使用你建立的模型進(jìn)行預(yù)測?如何分析你的問題符合對模型做的假定?35對于建立簡單線性回歸模型,
你知道了些什么?什么情況下需要建第十講簡單線性回歸模型36第十講簡單線性回歸模型1建立兩個(gè)變量X和Y間的關(guān)系模型,推斷變量Y如何依賴于變量X,從而可以用X預(yù)測Y.例:廣告費(fèi)用和銷售量公司的市值與CEO的年薪原始股的銷售數(shù)量和期望價(jià)格證券市場收益率與某只股票的收益率商品價(jià)格和銷售量裝配線的速度和次品數(shù)量年收入與信用卡消費(fèi)金額年齡與手機(jī)話費(fèi)連鎖店附近的人流與店的利潤氣溫與滑雪場門票銷量………37建立兩個(gè)變量X和Y間的關(guān)系模型,推斷變量Y如何依賴于變量X,阿姆德比薩餅連鎖店的問題阿姆得(Armand)比薩餅連鎖店坐落在美國的5個(gè)州內(nèi),它們通常的位置是在大學(xué)旁邊,而且管理人員相信附近大學(xué)的人數(shù)與這些連鎖店的季度銷售額是有關(guān)系的。下面是10家連鎖店附近大學(xué)的學(xué)生人數(shù)和季度銷售收入的數(shù)據(jù):根據(jù)以上數(shù)據(jù),你能否判斷學(xué)生人數(shù)(x)如何影響到銷售收入(y)?根據(jù)一家連鎖店附近大學(xué)的人數(shù),你能夠預(yù)測該家連鎖店的季度銷售收入嗎?38阿姆德比薩餅連鎖店的問題阿姆得(Ar描述學(xué)生人數(shù)和銷售收入之間的關(guān)系協(xié)方差(315.56)和相關(guān)系數(shù)(0.95),散點(diǎn)圖;根據(jù)這些你可以得到什么結(jié)論?
39描述學(xué)生人數(shù)和銷售收入之間的關(guān)系協(xié)方差(315.56)和相關(guān)TypesofRegressionModelsPositiveLinearRelationshipNegativeLinearRelationshipRelationshipNOTLinearNoRelationship40TypesofRegressionModelsPos模型的引入對于給定的學(xué)生人數(shù),銷售收入是唯一確定的一個(gè)數(shù),還是一個(gè)隨機(jī)變量?學(xué)生人數(shù)的變化如何影響到銷售收入?使用的模型
41模型的引入對于給定的學(xué)生人數(shù),銷售收入是唯一確定的一個(gè)數(shù),還簡單線性回歸模型
Y的截距斜率隨機(jī)誤差因變量(響應(yīng)變量,被預(yù)測變量)自變量(解釋變量,預(yù)測變量)42簡單線性回歸模型Y的截距斜率隨機(jī)誤差因變量(響應(yīng)變量,i=隨機(jī)誤差YX觀測值觀測值YX01YXiii0143i=隨機(jī)誤差YX觀測值觀測值YX01YXiii模型的假定1)E()=0;(E(y)=x)2)對于所有的x,Var()=.3)是服從正態(tài)分布N(0,)的.4)對于不同的x,是相互獨(dú)立的.這些假定意味著什么?44模型的假定1)E()=0;(E(y)=X1X2XYfy服從在回歸直線附近的正態(tài)分布對每個(gè)x值,y分布的方差相同.回歸直線45X1X2XYfy服從在回歸直線附近的正態(tài)分布回歸直線10估計(jì)的回歸方程如何估計(jì)參數(shù)和?最小二乘準(zhǔn)則
46估計(jì)的回歸方程如何估計(jì)參數(shù)和?11阿姆德連鎖店的回歸直線估計(jì)參數(shù)b1=5b0=60回歸直線你對系數(shù)的含義怎么理解?
47阿姆德連鎖店的回歸直線估計(jì)參數(shù)12回歸方程的判定系數(shù)y的總變差的分解定義判定系數(shù)R2=SSR/SST.判定系數(shù)的含義是什么?阿姆德比薩餅連鎖店的例子:R2=0.9027.判定系數(shù)和相關(guān)系數(shù)的關(guān)系。
48回歸方程的判定系數(shù)y的總變差的分解13CoefficientsofDetermination(r2)andCorrelation(r)
r2=1,r2=1,r2=.8,r2=0,YXY
XY
YXr=+1r=-1r=+0.9r=0X49CoefficientsofDetermination的估計(jì)理解誤差平方和的一個(gè)無偏估計(jì)s2=MSE=SSE/(n-2)
50的估計(jì)15關(guān)于回歸系數(shù)的假設(shè)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量給定顯著水平時(shí),選擇拒絕域
51關(guān)于回歸系數(shù)的假設(shè)檢驗(yàn)16關(guān)于回歸方程整體的檢驗(yàn)變量x的確對y有解釋作用嗎?(H0:=0)檢驗(yàn)統(tǒng)計(jì)量F=MSR/MSE其中MSR=SSR/自變量的個(gè)數(shù)拒絕域F>F(1,n-2)52關(guān)于回歸方程整體的檢驗(yàn)變量x的確對y有解釋作用嗎?(H0:回歸方程的方差分析表53回歸方程的方差分析表18阿姆德連鎖店的情形
使用EXCEL對阿姆德連鎖店的數(shù)據(jù)建立模型,并進(jìn)行分析,基于EXCEL的輸出結(jié)果,你對該模型有些什么認(rèn)識(shí)?54阿姆德連鎖店的情形19使用你建立的模型(一)問題一:對于那些附近學(xué)校人數(shù)是1萬的連鎖店,他們的季度銷售收入一定是一樣嗎?這種連鎖店平均的季度銷售收入是多少?你能夠給出一個(gè)估計(jì)嗎?問題二:某家連鎖店附近學(xué)生總數(shù)約1萬人,你能夠給出它的季度銷售收入的一個(gè)估計(jì)值嗎?點(diǎn)估計(jì):11055使用你建立的模型(一)問題一:對于那些附近學(xué)校人數(shù)是1萬的連使用你建立的模型(二)對于問題一,如何得到這種連鎖店平均銷售收入的一個(gè)95%的置信區(qū)間?
(98.58,121.42)56使用你建立的模型(二)對于問題一,如何得到這種連鎖店平均銷售使用你建立的模型(三)對于問題二,如何給出一個(gè)預(yù)測區(qū)間,使得這家連鎖店的季度銷售收入落在該區(qū)間里面的概率是1-?(76.13,143.87)57使用你建立的模型(三)對于問題二,如何給出一個(gè)預(yù)測區(qū)間,使得兩種區(qū)間的關(guān)系xp預(yù)測區(qū)間邊界均值的置信區(qū)間58兩種區(qū)間的關(guān)系xp預(yù)測區(qū)間邊界均值的置信區(qū)間23對模型作進(jìn)一步的探討回憶我們使用的模型;對模型作了什么假定?邏輯問題:如何判斷我們的問題符合這些假定?分析的方案:殘差分析
59對模型作進(jìn)一步的探討回憶我們使用的模型;24通過殘差你能夠了解什么?對誤差項(xiàng)作的假定適合嗎?1)等方差;2)相互獨(dú)立;3)正態(tài)分布;哪些數(shù)據(jù)屬于異常值?哪些觀測屬于對回歸模型有很大影響的?60通過殘差你能夠了解什么?對誤差項(xiàng)作的假定適合嗎?25殘差圖關(guān)于自變量的殘差圖;關(guān)于因變量的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 玉柴職業(yè)技術(shù)學(xué)院《創(chuàng)業(yè)經(jīng)營管理》2023-2024學(xué)年第二學(xué)期期末試卷
- 南京審計(jì)大學(xué)金審學(xué)院《登山運(yùn)動(dòng)》2023-2024學(xué)年第一學(xué)期期末試卷
- 寧夏幼兒師范高等專科學(xué)?!兑魳贩治鰧I(yè)理論教學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年質(zhì)量管理考試試題及答案
- 2025年客服經(jīng)理考試試題及答案
- 工業(yè)機(jī)器人系統(tǒng)操作試題復(fù)習(xí)測試卷
- 2025年民法典試題及答案
- 2025年08c語言復(fù)試題及答案
- 2025年全國考博數(shù)學(xué)試題及答案
- 2025年垃圾治理面試試題及答案
- 2025版年度城市綠化活動(dòng)策劃及實(shí)施服務(wù)合同范本
- 2025年誠通證券招聘筆試參考題庫含答案解析
- 人教版高一上學(xué)期數(shù)學(xué)(必修一)期末考試卷(附答案)
- 專題17 全等三角形模型之奔馳模型解讀與提分精練(全國)(解析版)
- 人教版高中物理《圓周運(yùn)動(dòng)》
- 【課件】平行線的概念課件人教版(2024)+數(shù)學(xué)七年級(jí)下冊
- 智能制造能力成熟度模型(-CMMM-)介紹及評估方法分享
- 臨床康復(fù)??谱o(hù)士主導(dǎo)神經(jīng)重癥患者早期漸進(jìn)式離床活動(dòng)實(shí)踐應(yīng)用
- 《搜索引擎使用方法》課件
- DBJT14-100-2013 外墻外保溫應(yīng)用技術(shù)規(guī)程(改性酚醛泡沫板薄抹灰外墻外保溫系統(tǒng))
- 《兒科補(bǔ)液》課件
評論
0/150
提交評論