第六講應(yīng)用統(tǒng)計(jì)_第1頁
第六講應(yīng)用統(tǒng)計(jì)_第2頁
第六講應(yīng)用統(tǒng)計(jì)_第3頁
第六講應(yīng)用統(tǒng)計(jì)_第4頁
第六講應(yīng)用統(tǒng)計(jì)_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六講簡(jiǎn)潔線性回來模型11建立兩個(gè)變量X和Y間的關(guān)系模型,推斷變量Y如何依靠于變量X,從而可以用X預(yù)料Y.例:廣告費(fèi)用和銷售量公司的市值與CEO的年薪原始股的銷售數(shù)量和期望價(jià)格證券市場(chǎng)收益率與某只股票的收益率商品價(jià)格和銷售量裝配線的速度和次品數(shù)量年收入與信用卡消費(fèi)金額年齡與手機(jī)話費(fèi)連鎖店旁邊的人流與店的利潤氣溫與滑雪場(chǎng)門票銷量………2變量間的關(guān)系變量之間是否存在關(guān)系?假如存在,它們之間是什么樣的關(guān)系呢?變量之間關(guān)系強(qiáng)度如何?樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?最簡(jiǎn)潔直觀的就是用散點(diǎn)圖描述變量間的關(guān)系。3函數(shù)關(guān)系是一一對(duì)應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變更,并完全依靠于x,當(dāng)變量x取某個(gè)數(shù)值時(shí),y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測(cè)點(diǎn)落在一條線上xy4相關(guān)關(guān)系

(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)各觀測(cè)點(diǎn)分布在直線四周xy5相關(guān)關(guān)系

(類型)6散點(diǎn)圖

(scatterdiagram)不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)7阿姆德比薩餅連鎖店的問題阿姆得(Armand)比薩餅連鎖店坐落在美國的5個(gè)州內(nèi),它們通常的位置是在高校旁邊,而且管理人員信任旁邊高校的人數(shù)與這些連鎖店的季度銷售額是有關(guān)系的。下面是10家連鎖店旁邊高校的學(xué)生人數(shù)和季度銷售收入的數(shù)據(jù):依據(jù)以上數(shù)據(jù),你能否推斷學(xué)生人數(shù)(x)如何影響到銷售收入(y)?依據(jù)一家連鎖店旁邊高校的人數(shù),你能夠預(yù)料該家連鎖店的季度銷售收入嗎?8描述學(xué)生人數(shù)和銷售收入之間的關(guān)系相關(guān)系數(shù)(0.95),散點(diǎn)圖;依據(jù)這些你可以得到什么結(jié)論?

9相關(guān)系數(shù)

(correlationcoefficient)對(duì)變量之間關(guān)系親密程度的度量對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱為簡(jiǎn)潔相關(guān)系數(shù)若相關(guān)系數(shù)是依據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若是依據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r10相關(guān)系數(shù)

(計(jì)算公式)

樣本相關(guān)系數(shù)的計(jì)算公式或化簡(jiǎn)為11相關(guān)系數(shù)

(取值及其意義)r的取值范圍是[-1,1]|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)r=0,不存在線性關(guān)系-1r<0,為負(fù)相關(guān)0<r1,為正相關(guān)|r|越趨于1表示關(guān)系越親密;|r|越趨于0表示關(guān)系越不親密12什么是回來分析?

(Regression)從一組樣本數(shù)據(jù)動(dòng)身,確定變量之間的數(shù)學(xué)關(guān)系式對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,依據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)料或限制另一個(gè)特定變量的取值,并給出這種預(yù)料或限制的精確程度回歸一詞是怎么來的??13回來分析與相關(guān)分析的區(qū)分相關(guān)分析中,變量x變量y處于同等的地位;回來分析中,變量y稱為因變量,處在被說明的地位,x稱為自變量,用于預(yù)料因變量的變更相關(guān)分析中所涉及的變量x和y都是隨機(jī)變量;回來分析中,因變量y是隨機(jī)變量,自變量x可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的親密程度;回來分析不僅可以揭示變量x對(duì)變量y的影響大小,還可以由回來方程進(jìn)行預(yù)料和限制14回來模型的類型15一元線性回來涉及一個(gè)自變量的回來因變量y與自變量x之間為線性關(guān)系被預(yù)料或被說明的變量稱為因變量(dependentvariable),用y表示用來預(yù)料或用來說明因變量的一個(gè)或多個(gè)變量稱為自變量(independentvariable),用x表示因變量與自變量之間的關(guān)系用一個(gè)線性方程來表示16模型的引入對(duì)于給定的學(xué)生人數(shù),銷售收入是唯一確定的一個(gè)數(shù),還是一個(gè)隨機(jī)變量?學(xué)生人數(shù)的變更如何影響到銷售收入?運(yùn)用的模型

17簡(jiǎn)潔線性回來模型

Y的截距斜率隨機(jī)誤差因變量(響應(yīng)變量,被預(yù)料變量)自變量(說明變量,預(yù)料變量)18i=隨機(jī)誤差YX1觀測(cè)值觀測(cè)值X01YXiii0119模型的假定1)E()=0;(E(y)=x)2)對(duì)于全部的x,Var()=.3)是聽從正態(tài)分布N(0,)的.4)對(duì)于不同的x,是相互獨(dú)立的.這些假定意味著什么?20X1X2XYfy聽從在回來直線旁邊的正態(tài)分布對(duì)每個(gè)x值,y分布的方差相同.回來直線21估計(jì)的回來方程如何估計(jì)參數(shù)和?最小二乘準(zhǔn)則

22阿姆德連鎖店的回來直線估計(jì)參數(shù)b1=5b0=60回來直線你對(duì)系數(shù)的含義怎么理解?

23回來方程的判定系數(shù)y的總變差的分解定義判定系數(shù)R2=SSR/SST.判定系數(shù)的含義是什么?阿姆德比薩餅連鎖店的例子:R2=0.9027.判定系數(shù)和相關(guān)系數(shù)的關(guān)系。

24CoefficientsofDetermination(r2)andCorrelation(r)

r2=1,r2=1,r2=.8,r2=0,YXY

XY

YXr=+1r=-1r=+0.9r=0X25的估計(jì)理解誤差平方和的一個(gè)無偏估計(jì)

s2=MSE=SSE/(n-2)

26關(guān)于回來系數(shù)的假設(shè)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量給定顯著水平時(shí),選擇拒絕域

27關(guān)于回來方程整體的檢驗(yàn)變量x的確對(duì)y有說明作用嗎?(H0:=0)檢驗(yàn)統(tǒng)計(jì)量F=MSR/MSE其中MSR=SSR/自變量的個(gè)數(shù)拒絕域F>F(1,n-2)28回來方程的方差分析表29阿姆德連鎖店的情形

運(yùn)用EXCEL對(duì)阿姆德連鎖店的數(shù)據(jù)建立模型,并進(jìn)行分析,基于EXCEL的輸出結(jié)果,你對(duì)該模型有些什么相識(shí)?30用Excel進(jìn)行回來分析第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項(xiàng)第3步:在分析工具中選擇“回來”,然后選擇“確定”第4步:當(dāng)對(duì)話框出現(xiàn)時(shí)在“Y值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入Y的數(shù)據(jù)區(qū)域在“X值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入X的數(shù)據(jù)區(qū)域在“置信度”選項(xiàng)中給出所需的數(shù)值在“輸出選項(xiàng)”中選擇輸出區(qū)域在“殘差”分析選項(xiàng)中選擇所需的選項(xiàng)用Excel進(jìn)行回來分析3132輸出各部分的內(nèi)容回來統(tǒng)計(jì)部分:相關(guān)系數(shù)R、判定系數(shù)R2、調(diào)整的判定系數(shù)、標(biāo)準(zhǔn)誤差s、樣本容量n,各自含義已知。系數(shù)估計(jì)和檢驗(yàn)部分:回來系數(shù)的估計(jì)和檢驗(yàn),給出回來系數(shù)β0、β1的點(diǎn)估計(jì)、區(qū)間估計(jì)和檢驗(yàn)。方差分析部分:對(duì)模型整體的檢驗(yàn),在一元回來分析中,H0:β1=0,該假設(shè)與系數(shù)估計(jì)和檢驗(yàn)部分中對(duì)回來系數(shù)β1的檢驗(yàn)相同,二者的p值也相同,但是統(tǒng)計(jì)量分布不同,本部分運(yùn)用F檢驗(yàn),系數(shù)部分運(yùn)用t檢驗(yàn)。在多元回來分析中,二者的差異和作用才有顯露。33輸出各數(shù)據(jù)之間的關(guān)系各部分內(nèi)部數(shù)據(jù)之間的關(guān)系:回來統(tǒng)計(jì)模塊中R、R2、之間的關(guān)系;系數(shù)模塊中(tStat)i=bi/sbi;方差分析模塊中dfT=dfr+dfe、SST=SSR+SSE、MST=SST/dfT、MSR=SSR/dfr、MSE=SSE/dfe、F=MSR/MSE。各模塊外部數(shù)據(jù)之間的關(guān)系:R2=SSR/SST、s2=MSE34運(yùn)用你建立的模型(一)問題一:對(duì)于那些旁邊學(xué)校人數(shù)是1萬的連鎖店,他們的季度銷售收入確定是一樣嗎?這種連鎖店平均的季度銷售收入是多少?你能夠給出一個(gè)估計(jì)嗎?問題二:某家連鎖店旁邊學(xué)生總數(shù)約1萬人,你能夠給出它的季度銷售收入的一個(gè)估計(jì)值嗎?點(diǎn)估計(jì):11035運(yùn)用你建立的模型(二)對(duì)于問題一,如何得到這種連鎖店平均銷售收入的一個(gè)95%的置信區(qū)間?

(98.58,121.42)36運(yùn)用你建立的模型(三)對(duì)于問題二,如何給出一個(gè)預(yù)料區(qū)間,使得這家連鎖店的季度銷售收入落在該區(qū)間里面的概率是1-?(76.13,143.87)37兩種區(qū)間的關(guān)系xp預(yù)料區(qū)間邊界均值的置信區(qū)間38對(duì)模型作進(jìn)一步的探討回憶我們運(yùn)用的模型;對(duì)模型作了什么假定?邏輯問題:如何推斷我們的問題符合這些假定?分析的方案:殘差分析

39變差因變量y的取值是不同的,y取值的這種波動(dòng)稱為變差。變差來源于兩個(gè)方面由于自變量x的取值不同造成的除x以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響對(duì)一個(gè)具體的觀測(cè)值來說,變差的大小可以通過該實(shí)際觀測(cè)值與其均值之差來表示40通過殘差你能夠了解什么?對(duì)誤差項(xiàng)作的假定適合嗎?1)等方差;2)相互獨(dú)立;3)正態(tài)分布;哪些數(shù)據(jù)屬于異樣值?哪些觀測(cè)屬于對(duì)回來模型有很大影響的?41殘差圖關(guān)于自變量的殘差圖;關(guān)于因變量的預(yù)料值的殘差圖;學(xué)生化的標(biāo)準(zhǔn)殘差圖:

42如何分析殘差圖假如模型是符合的,那么殘差圖上的散點(diǎn)應(yīng)當(dāng)落在一條水平帶中間,除此之外,殘差圖上的點(diǎn)不應(yīng)呈現(xiàn)出什么規(guī)律性。運(yùn)用EXCEL對(duì)阿姆德連鎖店的數(shù)據(jù)產(chǎn)生殘差圖。你能得到什么結(jié)論?43非線性線性X

X441方差不等方差相等XX45不獨(dú)立獨(dú)立XX46異樣值的檢測(cè)異樣值是與其它點(diǎn)顯示的趨勢(shì)不合的點(diǎn)。檢查它是否可能是被錯(cuò)誤輸入的數(shù)據(jù)。檢測(cè)異樣值的方法:散點(diǎn)圖;利用學(xué)生化標(biāo)準(zhǔn)殘差基本聽從標(biāo)準(zhǔn)正態(tài)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論