




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
中國人民大學(xué)勞動人事學(xué)院相關(guān)與回歸分析2023/3/16(C)中國人民大學(xué)2
變量之間的數(shù)量關(guān)系函數(shù)關(guān)系相關(guān)關(guān)系2023/3/16(C)中國人民大學(xué)3函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系設(shè)有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x,當(dāng)變量x取某個數(shù)值時,y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測點(diǎn)落在一條線上xy2023/3/16(C)中國人民大學(xué)4函數(shù)關(guān)系函數(shù)關(guān)系的例子某種商品的銷售額y與銷售量x之間的關(guān)系可表示為y=px(p為單價)圓的面積S與半徑之間的關(guān)系可表示為S=R2
企業(yè)的原材料消耗額y與產(chǎn)量x1、單位產(chǎn)量消耗x2、原材料價格x3之間的關(guān)系可表示為
y=x1×x2×x32023/3/16(C)中國人民大學(xué)5相關(guān)關(guān)系(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個變量的取值不能由另一個變量唯一確定當(dāng)變量x取某個值時,變量y的取值可能有幾個各觀測點(diǎn)分布在直線周圍xy2023/3/16(C)中國人民大學(xué)6相關(guān)關(guān)系(舉例)相關(guān)關(guān)系的例子父親身高y與子女身高x之間的關(guān)系收入水平y(tǒng)與受教育程度x之間的關(guān)系學(xué)習(xí)成績與學(xué)習(xí)時間長度之間的關(guān)系商品銷售額y與廣告費(fèi)支出x之間的關(guān)系2023/3/16(C)中國人民大學(xué)7相關(guān)關(guān)系的類型正相關(guān)負(fù)相關(guān)線性相關(guān)非線性相關(guān)正相關(guān)負(fù)相關(guān)完全相關(guān)
不相關(guān)相關(guān)關(guān)系2023/3/16(C)中國人民大學(xué)8相關(guān)的散點(diǎn)圖不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)2023/3/16(C)中國人民大學(xué)9相關(guān)關(guān)系的例題一家大型商業(yè)銀行在多個地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的增長,這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。2023/3/16(C)中國人民大學(xué)10相關(guān)關(guān)系的例題分析2023/3/16(C)中國人民大學(xué)11散點(diǎn)圖2023/3/16(C)中國人民大學(xué)12相關(guān)系數(shù)對變量之間關(guān)系密切程度的度量對兩個變量之間線性相關(guān)程度的度量稱為簡單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),記為r2023/3/16(C)中國人民大學(xué)13相關(guān)系數(shù)的計算公式或化簡為2023/3/16(C)中國人民大學(xué)14相關(guān)系數(shù)的取值與意義
r
的取值范圍是[-1,1]|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)
r=0,不存在線性相關(guān)關(guān)系
-1r<0,為負(fù)相關(guān)
0<r1,為正相關(guān)
|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切2023/3/16(C)中國人民大學(xué)15-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加相關(guān)系數(shù)的取值與意義2023/3/16(C)中國人民大學(xué)16相關(guān)系數(shù)的例題分析2023/3/16(C)中國人民大學(xué)17相關(guān)系數(shù)的顯著性檢驗(yàn)(
r的抽樣分布)r的抽樣分布隨總體相關(guān)系數(shù)和樣本容量的大小而變化當(dāng)樣本數(shù)據(jù)來自正態(tài)總體時,隨著n的增大,r
的抽樣分布趨于正態(tài)分布,尤其是在總體相關(guān)系數(shù)很小或接近0時,趨于正態(tài)分布的趨勢非常明顯。而當(dāng)遠(yuǎn)離0時,除非n非常大,否則r的抽樣分布呈現(xiàn)一定的偏態(tài)。當(dāng)為較大的正值時,r呈現(xiàn)左偏分布;當(dāng)為較小的負(fù)值時,r呈現(xiàn)右偏分布。只有當(dāng)接近于0,而樣本容量n很大時,才能認(rèn)為r是接近于正態(tài)分布的變量2023/3/16(C)中國人民大學(xué)18相關(guān)系數(shù)的顯著性檢驗(yàn)的步驟檢驗(yàn)兩個變量之間是否存在線性相關(guān)關(guān)系等價于對回歸系數(shù)b1的檢驗(yàn)采用R.A.Fisher提出的t檢驗(yàn)檢驗(yàn)的步驟為1、提出假設(shè):H0:;H1:0
2、計算檢驗(yàn)的統(tǒng)計量:3、確定顯著性水平,并作出決策若t>t,拒絕H0
若t<t,不能拒絕H02023/3/16(C)中國人民大學(xué)19相關(guān)系數(shù)的顯著性檢驗(yàn)的例題分析對不良貸款與貸款余額之間的相關(guān)系數(shù)進(jìn)行顯著性檢(0.05)提出假設(shè):H0:;H1:0計算檢驗(yàn)的統(tǒng)計量3.根據(jù)顯著性水平=0.05,查t分布表得t(n-2)=2.0687由于t=7.5344>t(25-2)=2.0687,拒絕H0,不良貸款與貸款余額之間存在著顯著的正線性相關(guān)關(guān)系2023/3/16(C)中國人民大學(xué)20相關(guān)系數(shù)的顯著性檢驗(yàn)的例題分析各相關(guān)系數(shù)檢驗(yàn)的統(tǒng)計量2023/3/16(C)中國人民大學(xué)21什么是回歸分析?(Regression)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù)測或控制另一個特定變量的取值,并給出這種預(yù)測或控制的精確程度2023/3/16(C)中國人民大學(xué)22相關(guān)分析中,變量x
變量y處于平等的地位;回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預(yù)測因變量的變化相關(guān)分析主要是描述兩個變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量x對變量y的影響大小,還可以由回歸方程進(jìn)行預(yù)測和控制回歸分析與相關(guān)分析的區(qū)別2023/3/16(C)中國人民大學(xué)23回歸模型的類型2023/3/16(C)中國人民大學(xué)24一元線性回歸涉及一個自變量的回歸因變量y與自變量x之間為線性關(guān)系被預(yù)測或被解釋的變量稱為因變量(dependentvariable),用y表示用來預(yù)測或用來解釋因變量的一個變量稱為自變量(independentvariable),用x表示因變量與自變量之間的關(guān)系用一個線性方程來表示2023/3/16(C)中國人民大學(xué)25回歸方程(regressionequation)描述y的平均值或期望值如何依賴于x的方程稱為回歸方程一元線性回歸方程的形式如下
E(y)=0+1x方程的圖示是一條直線,也稱為直線回歸方程0是回歸直線在y軸上的截距,是當(dāng)x=0時y的期望值1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動一個單位時,y的平均變動值2023/3/16(C)中國人民大學(xué)26估計的回歸方程
(estimatedregressionequation)一元線性回歸中估計的回歸方程為用樣本統(tǒng)計量和代替回歸方程中的未知參數(shù)和,就得到了估計的回歸方程總體回歸參數(shù)和
是未知的,必須利用樣本數(shù)據(jù)去估計其中:是估計的回歸直線在y
軸上的截距,是直線的斜率,它表示對于一個給定的x
的值,是y
的估計值,也表示x
每變動一個單位時,y的平均變動值
2023/3/16(C)中國人民大學(xué)27最小二乘估計使因變量的觀察值與估計值之間的離差平方和達(dá)到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小2023/3/16(C)中國人民大學(xué)28最小二乘估計(圖示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^2023/3/16(C)中國人民大學(xué)29最小二乘法
(
和的計算公式)
根據(jù)最小二乘法的要求,可求解和的公式如下2023/3/16(C)中國人民大學(xué)30散點(diǎn)圖(例題分析)【例】一家大型商業(yè)銀行在多個地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的增長,這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)2023/3/16(C)中國人民大學(xué)31散點(diǎn)圖
(例題分析)2023/3/16(C)中國人民大學(xué)32散點(diǎn)圖(例題分析)2023/3/16(C)中國人民大學(xué)33估計方程的求法(例題分析)【例】求不良貸款對貸款余額的回歸方程回歸方程為:y=-0.8295
+0.037895
x回歸系數(shù)=0.037895表示,貸款余額每增加1億元,不良貸款平均增加0.037895億元
^2023/3/16(C)中國人民大學(xué)34估計方程的求法(例題分析)不良貸款對貸款余額回歸方程的圖示2023/3/16(C)中國人民大學(xué)35回歸直線的擬合優(yōu)度----變差因變量y的取值是不同的,y取值的這種波動稱為變差。變差來源于兩個方面由于自變量x的取值不同造成的除x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響對一個具體的觀測值來說,變差的大小可以通過該實(shí)際觀測值與其均值之差來表示2023/3/16(C)中國人民大學(xué)36變差的分解(圖示)xyy{}}2023/3/16(C)中國人民大學(xué)37離差平方和的分解(三個平方和的關(guān)系)SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{2023/3/16(C)中國人民大學(xué)38離差平方和的分解(三個平方和的意義)總平方和(SST)反映因變量的n個觀察值與其均值的總離差回歸平方和(SSR)反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和2023/3/16(C)中國人民大學(xué)39判定系數(shù)R2
(coefficientofdetermination)回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間
R21,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即R2=r22023/3/16(C)中國人民大學(xué)40判定系數(shù)R2
(例題分析)【例】計算不良貸款對貸款余額回歸的判定系數(shù),并解釋其意義
判定系數(shù)的實(shí)際意義是:在不良貸款取值的變差中,有71.16%可以由不良貸款與貸款余額之間的線性關(guān)系來解釋,或者說,在不良貸款取值的變動中,有71.16%是由貸款余額所決定的。也就是說,不良貸款取值的差異有2/3以上是由貸款余額決定的。可見不良貸款與貸款余額之間有較強(qiáng)的線性關(guān)系2023/3/16(C)中國人民大學(xué)41線性關(guān)系的檢驗(yàn)檢驗(yàn)自變量與因變量之間的線性關(guān)系是否顯著將回歸均方(MSR)同殘差均方(MSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著回歸均方:回歸平方和SSR除以相應(yīng)的自由度(自變量的個數(shù)p)殘差均方:殘差平方和SSE除以相應(yīng)的自由度(n-p-1)2023/3/16(C)中國人民大學(xué)42線性關(guān)系的檢驗(yàn)(檢驗(yàn)的步驟)提出假設(shè)H0:1=0線性關(guān)系不顯著2.計算檢驗(yàn)統(tǒng)計量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F
作出決策:若F>F
,拒絕H0;若F<F
,不能拒絕H02023/3/16(C)中國人民大學(xué)43線性關(guān)系的檢驗(yàn)(例題分析)提出假設(shè)H0:1=0不良貸款與貸款余額之間的線性關(guān)系不顯著計算檢驗(yàn)統(tǒng)計量F確定顯著性水平=0.05,并根據(jù)分子自由度1和分母自由度25-2找出臨界值F
=4.28作出決策:若F>F,拒絕H0,線性關(guān)系顯著2023/3/16(C)中國人民大學(xué)44線性關(guān)系的檢驗(yàn)(方差分析表)2023/3/16(C)中國人民大學(xué)45回歸系數(shù)的檢驗(yàn)在一元線性回歸中,等價于線性關(guān)系的顯著性檢驗(yàn)檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說,檢驗(yàn)自變量x對因變量y的影響是否顯著理論基礎(chǔ)是回歸系數(shù)
的抽樣分布2023/3/16(C)中國人民大學(xué)46回歸系數(shù)的檢驗(yàn)(樣本統(tǒng)計量的分布)
是根據(jù)最小二乘法求出的樣本統(tǒng)計量,它有自己的分布的分布具有如下性質(zhì)數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于未知,需用其估計量sy來代替得到的估計的標(biāo)準(zhǔn)差2023/3/16(C)中國人民大學(xué)47回歸系數(shù)的檢驗(yàn)(檢驗(yàn)步驟)提出假設(shè)H0:b1=0(沒有線性關(guān)系)H1:b1
0(有線性關(guān)系)計算檢驗(yàn)的統(tǒng)計量
確定顯著性水平,并進(jìn)行決策t>t,拒絕H0;t<t,不能拒絕H02023/3/16(C)中國人民大學(xué)48回歸系數(shù)的檢驗(yàn)
(例題分析)對例題的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(=0.05)提出假設(shè)H0:b1=0H1:b1
0計算檢驗(yàn)的統(tǒng)計量
t=7.533515>t=2.201,拒絕H0,表明不良貸款與貸款余額之間有線性關(guān)系2023/3/16(C)中國人民大學(xué)49回歸系數(shù)的檢驗(yàn)
(例題分析)P值的應(yīng)用P=0.000000<=0.05,拒絕原假設(shè),不良貸款與貸款余額之間有線性關(guān)系多元回歸模型與回歸方程2023/3/16(C)中國人民大學(xué)51多元回歸方程
(multipleregressionequation)描述因變量y的平均值或期望值如何依賴于自變量x1,x2
,…,xp的方程多元線性回歸方程的形式為
E(y)=0+1x1
+2x2
+…+
p
xpb1,b2,,bp稱為偏回歸系數(shù)
bi
表示假定其他變量不變,當(dāng)xi
每變動一個單位時,y的平均平均變動值2023/3/16(C)中國人民大學(xué)52二元回歸方程的直觀解釋二元線性回歸模型(觀察到的y)回歸面0ix1yx2(x1,x2)}2023/3/16(C)中國人民大學(xué)53估計的多元回歸的方程
(estimatedmultipleregressionequation)
是y
的估計值用樣本統(tǒng)計量估計回歸方程中的參數(shù)
時得到的方程由最小二乘法求得一般形式為是
估計值2023/3/16(C)中國人民大學(xué)54參數(shù)的最小二乘法求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下使因變量的觀察值與估計值之間的離差平方和達(dá)到最小來求得
。即2023/3/16(C)中國人民大學(xué)55多重判定系數(shù)(multiplecoefficientofdetermination)
回歸平方和占總平方和的比例計算公式為因變量取值的變差中,能被估計的多元回歸方程所解釋的比例2023/3/16(C)中國人民大學(xué)56修正多重判定系數(shù)(adjustedmultiplecoeffi
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 信息化技術(shù)在農(nóng)業(yè)生產(chǎn)中的合作協(xié)議
- 農(nóng)民工在崗培訓(xùn)與勞務(wù)派遣合同
- 購買物業(yè)管理服務(wù)協(xié)議書
- 高考語文復(fù)習(xí):專題六、七
- 高考文言文斷句100題專項(xiàng)練習(xí)(附答案及翻譯最方便)
- 小馬過河自我成長的故事解讀
- 產(chǎn)品委托研發(fā)與技術(shù)合作協(xié)議合同書
- 餐飲公司員工管理手冊
- 代辦貸款協(xié)議合同
- 甲醇買賣合同
- 《 大學(xué)生軍事理論教程》全套教學(xué)課件
- 三年級數(shù)學(xué)下冊一兩位數(shù)乘兩位數(shù)的乘法2問題解決作業(yè)課件西師大版
- 家校溝通經(jīng)驗(yàn)分享-溝通有方法教育有溫度
- 2024年福建省廈門市翔安區(qū)殘疾人聯(lián)合會招聘殘疾人工作聯(lián)絡(luò)員29人歷年重點(diǎn)基礎(chǔ)提升難、易點(diǎn)模擬試題(共500題)附帶答案詳解
- 幼兒園家長會疾病預(yù)防
- 《儲糧害蟲防治技術(shù)》課件-第六章 儲糧保護(hù)劑及其應(yīng)用
- 排水管道施工組織設(shè)計排水管道施工組織設(shè)計排水施工排水管道施工施工設(shè)計
- 人工智能科普教育活動方案設(shè)計
- 2024未來會議:AI與協(xié)作前沿趨勢白皮書
- 2024年廣東普通專升本《公共英語》完整版真題
- 國家中長期科技發(fā)展規(guī)劃(2021-2035)
評論
0/150
提交評論