回歸分析和回歸方程、變量相互關(guān)系分析課件_第1頁(yè)
回歸分析和回歸方程、變量相互關(guān)系分析課件_第2頁(yè)
回歸分析和回歸方程、變量相互關(guān)系分析課件_第3頁(yè)
回歸分析和回歸方程、變量相互關(guān)系分析課件_第4頁(yè)
回歸分析和回歸方程、變量相互關(guān)系分析課件_第5頁(yè)
已閱讀5頁(yè),還剩187頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

相關(guān)與回歸分析第一節(jié)變量間關(guān)系的度量第二節(jié)一元線性回歸分析第三節(jié)利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)相關(guān)與回歸分析第一節(jié)變量間關(guān)系的度量第一節(jié)變量間關(guān)系的度量一、變量間的函數(shù)關(guān)系與相關(guān)關(guān)系二、相關(guān)關(guān)系的描述與測(cè)度三、相關(guān)系數(shù)的顯著性檢驗(yàn)第一節(jié)變量間關(guān)系的度量一、變量間的函數(shù)關(guān)系與相關(guān)關(guān)系一、變量間的函數(shù)關(guān)系與相關(guān)關(guān)系客觀現(xiàn)象之間是普遍聯(lián)系相互依存的。客觀現(xiàn)象之間的數(shù)量聯(lián)系可分為兩類:

確定性關(guān)系(函數(shù)關(guān)系)非確定性關(guān)系(相關(guān)關(guān)系)一、變量間的函數(shù)關(guān)系與相關(guān)關(guān)系客觀現(xiàn)象之間是普遍聯(lián)系相互依存函數(shù)關(guān)系一個(gè)或幾個(gè)變量取一定值時(shí)另一個(gè)變量有確定值與之對(duì)應(yīng),這種變量間一一對(duì)應(yīng)的確定性關(guān)系稱為函數(shù)關(guān)系。例如,設(shè)有兩個(gè)變量x和y,變量y隨變量x變化,并完全依賴于x

,當(dāng)變量x取某個(gè)數(shù)值時(shí),

y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為

y=f(x),其中x稱為自變量,y稱為因變量。兩變量函數(shù)關(guān)系在圖形上表現(xiàn)為各觀測(cè)點(diǎn)落在一條線上xy函數(shù)關(guān)系一個(gè)或幾個(gè)變量取一定值時(shí)另一個(gè)變量有確定值與之對(duì)應(yīng),

函數(shù)關(guān)系舉例某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y=p

x(p為單價(jià))圓的面積(S)與半徑(R)之間的關(guān)系可表示為S=R2

企業(yè)原材料消耗額(y)與產(chǎn)品產(chǎn)量(x1)

、單位產(chǎn)量原材料消耗量(x2)

、原材料價(jià)格(x3)之間的關(guān)系可表示為y=x1x2x3

函數(shù)關(guān)系舉例某種商品的銷售額(y)與銷售量(x)之間的關(guān)相關(guān)關(guān)系一個(gè)或幾個(gè)相互聯(lián)系的變量取一定值時(shí),與之對(duì)應(yīng)的另一個(gè)變量的值雖然不確定,但它按某種規(guī)律在一定范圍內(nèi)變化,這種變量間的不確定性對(duì)應(yīng)關(guān)系稱為相關(guān)關(guān)系。例如,設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,但不完全依賴于x

,當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè),但取值范圍變化有一定規(guī)律,則稱y與x之間有相關(guān)關(guān)系。xy兩變量相關(guān)關(guān)系在圖形上表現(xiàn)為各觀測(cè)點(diǎn)分布在線的周圍相關(guān)關(guān)系一個(gè)或幾個(gè)相互聯(lián)系的變量取一定值時(shí),與之對(duì)應(yīng)的另一個(gè)

相關(guān)關(guān)系舉例商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系相關(guān)關(guān)系舉例商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系比因果關(guān)系包括的范圍更廣泛。具有相關(guān)關(guān)系的某些現(xiàn)象的數(shù)量可表現(xiàn)為因果關(guān)系,即自變量與因變量的關(guān)系,但有時(shí)不存在明顯的因果關(guān)系或互為因果關(guān)系,如人的身高和體重、商品的供求與價(jià)格等。變量間的函數(shù)關(guān)系與相關(guān)關(guān)系在一定條件下可以相互轉(zhuǎn)化。當(dāng)存在測(cè)量誤差或隨機(jī)因素的干擾時(shí),函數(shù)關(guān)系可表現(xiàn)為相關(guān)關(guān)系;當(dāng)我們對(duì)變量?jī)?nèi)在聯(lián)系有規(guī)律性認(rèn)識(shí)時(shí),相關(guān)關(guān)系可能轉(zhuǎn)化為函數(shù)關(guān)系或用函數(shù)關(guān)系來(lái)描述。相關(guān)關(guān)系相關(guān)關(guān)系比因果關(guān)系包括的范圍更廣泛。具有相關(guān)關(guān)系的某相關(guān)分析現(xiàn)象的函數(shù)關(guān)系可以用數(shù)學(xué)分析方法研究和測(cè)度,現(xiàn)象的相關(guān)關(guān)系需用統(tǒng)計(jì)學(xué)的相關(guān)與回歸分析方法研究和測(cè)度。相關(guān)分析是描述和測(cè)度變量間相關(guān)關(guān)系類型和相關(guān)程度的分析方法。在相關(guān)分析中,所有變量都假定是隨機(jī)變量,它們之間不存在解釋變量和被解釋變量的關(guān)系,即不考慮因果關(guān)系。相關(guān)分析現(xiàn)象的函數(shù)關(guān)系可以用數(shù)學(xué)分析方法研究和測(cè)度,現(xiàn)象的相相關(guān)關(guān)系的種類1按相關(guān)因素的多少分

單相關(guān)復(fù)相關(guān)2按相關(guān)關(guān)系的形式分

線性相關(guān)(直線相關(guān))非線性相關(guān)(曲線相關(guān))3按相關(guān)關(guān)系的方向分

正相關(guān)負(fù)相關(guān)4按相關(guān)關(guān)系的程度分

完全相關(guān)不完全相關(guān)不相關(guān)相關(guān)關(guān)系的種類1按相關(guān)因素的多少分單相關(guān)相關(guān)關(guān)系的種類簡(jiǎn)單相關(guān)和多元相關(guān)(多重相關(guān)、復(fù)相關(guān))

簡(jiǎn)單相關(guān)指兩個(gè)變量之間的相關(guān)關(guān)系;多元相關(guān)指三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系。

線性相關(guān)和非線性相關(guān)

如果散點(diǎn)圖上的所有的點(diǎn)幾乎接近一條直線,可以認(rèn)為變量之間是線性相關(guān)的;如果散點(diǎn)圖上的所有點(diǎn)幾乎接近一條曲線,可以認(rèn)為變量之間是非線性相關(guān)的。

相關(guān)關(guān)系的種類簡(jiǎn)單相關(guān)和多元相關(guān)(多重相關(guān)、復(fù)相關(guān))相關(guān)關(guān)系的種類正相關(guān)和負(fù)相關(guān)

如果相關(guān)變量之間同增或同減,稱這種相關(guān)關(guān)系是正相關(guān)。如果相關(guān)變量間一個(gè)變量值增加時(shí)另一個(gè)變量值減少,稱這種相關(guān)關(guān)系是負(fù)相關(guān)。完全相關(guān)、不完全相關(guān)和不相關(guān)

如果一個(gè)變量的變化完全由另一個(gè)變量的變化所確定,則稱兩變量的關(guān)系為完全相關(guān),即為函數(shù)關(guān)系;如果兩個(gè)變量間的關(guān)系很弱或看不出任何關(guān)系,則稱之為不相關(guān)(或零相關(guān))。兩變量的關(guān)系介于完全相關(guān)和不相關(guān)之間稱為不完全相關(guān)。相關(guān)關(guān)系的種類正相關(guān)和負(fù)相關(guān)二、相關(guān)關(guān)系的描述與測(cè)度判斷現(xiàn)象之間有無(wú)相關(guān)關(guān)系,應(yīng)先進(jìn)行定性分析,即依據(jù)理論知識(shí)、實(shí)踐經(jīng)驗(yàn)對(duì)現(xiàn)象之間是否存在相關(guān)關(guān)系及相關(guān)關(guān)系的類型作出判斷。然后在此基礎(chǔ)上進(jìn)行定量分析,即運(yùn)用相關(guān)圖、相關(guān)表和相關(guān)系數(shù)等方法對(duì)現(xiàn)象之間的相關(guān)關(guān)系進(jìn)行描述與測(cè)度。㈠相關(guān)表㈡相關(guān)關(guān)系的圖示㈢相關(guān)系數(shù)二、相關(guān)關(guān)系的描述與測(cè)度判斷現(xiàn)象之間有無(wú)相關(guān)關(guān)系,應(yīng)先進(jìn)行定㈠相關(guān)表簡(jiǎn)單相關(guān)表例:居民消費(fèi)支出和收入的相關(guān)表(單位:百元)

根據(jù)以上資料繪制坐標(biāo)圖便得到相關(guān)圖家庭編號(hào)12345678910消費(fèi)支出y可支配收入x1520304042536065707818254560627588929998㈠相關(guān)表簡(jiǎn)單相關(guān)表家庭編號(hào)123單變量分組表產(chǎn)量(千件)x企業(yè)數(shù)平均單位成本(元/件)y20304050809556516.815.615.014.814.2合計(jì)30例:30家企業(yè)按產(chǎn)品產(chǎn)量分組的平均單位產(chǎn)品成本單變量分組表產(chǎn)量企業(yè)數(shù)平均單位成本(元/件)y20916.雙變量分組表

例:30家企業(yè)按產(chǎn)品產(chǎn)量和單位產(chǎn)品成本分組

單位成本(元/件)y產(chǎn)量(千件)

x合計(jì)203040508018161514441--32--131-132--1449107合計(jì)9556530雙變量分組表

例:30家企業(yè)按產(chǎn)品產(chǎn)量和單位產(chǎn)品成本分組㈡相關(guān)關(guān)系的圖示(散點(diǎn)圖scatterdiagram)不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)如何制作散點(diǎn)圖?Minitab教您怎么制作散點(diǎn)圖(scatterdiagram)/thread-4292-1-1.html

Minitab制作3D散點(diǎn)圖(3DScatterplot)的方法,如何制作3D散點(diǎn)圖教程/thread-4639-1-1.html

㈡相關(guān)關(guān)系的圖示(散點(diǎn)圖scatterdiagram)散點(diǎn)圖(例題分析)【例9.1】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國(guó)家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年該銀行貸款額平穩(wěn)增長(zhǎng),但不良貸款額也有較大提高,給銀行業(yè)務(wù)發(fā)展帶來(lái)較大壓力。為弄清不良貸款形成的原因,以便找出控制不良貸款的辦法,現(xiàn)利用銀行有關(guān)業(yè)務(wù)數(shù)據(jù)進(jìn)行相關(guān)分析。下面是該銀行所屬25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。

散點(diǎn)圖(例題分析)【例9.1】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有散點(diǎn)圖(例題分析)散點(diǎn)圖(例題分析)散點(diǎn)圖(例題分析)散點(diǎn)圖(例題分析)㈢相關(guān)系數(shù)相關(guān)系數(shù)是對(duì)變量之間關(guān)系密切程度的度量對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱為簡(jiǎn)單相關(guān)系數(shù)(簡(jiǎn)稱相關(guān)系數(shù))若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若相關(guān)系數(shù)是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r在此僅討論兩變量間相關(guān)關(guān)系問(wèn)題。對(duì)于隨機(jī)變量x和y,總體相關(guān)系數(shù)一般是未知的,只能根據(jù)樣本觀測(cè)值給出一個(gè)估計(jì)量即樣本相關(guān)系數(shù)r。

㈢相關(guān)系數(shù)相關(guān)系數(shù)是對(duì)變量之間關(guān)系密切程度的度量樣本相關(guān)系數(shù)r的計(jì)算公式或化簡(jiǎn)為樣本相關(guān)系數(shù)r的計(jì)算公式或化簡(jiǎn)為相關(guān)系數(shù)取值及其意義

r

的取值范圍是[-1,1]|r|=1,表明x與y完全線性相關(guān)r=1,為完全正線性相關(guān)r=-1,為完全負(fù)線性相關(guān)

r=0,表明x與y不存在線性相關(guān)關(guān)系-1r<0,為負(fù)線性相關(guān)0<r1,為正線性相關(guān)|r|越趨于1表示x與y線性關(guān)系越密切;|r|越趨于0表示x與y線性關(guān)系越不密切相關(guān)系數(shù)取值及其意義r的取值范圍是[-1,1]相關(guān)系數(shù)(取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無(wú)線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加相關(guān)系數(shù)(取值及其意義)-1.0+1.00-0.5+0.5完樣本容量適中時(shí)相關(guān)關(guān)系程度一般判斷標(biāo)準(zhǔn)

無(wú)相關(guān)或微弱相關(guān)低度相關(guān)中度相關(guān)(顯著相關(guān))高度相關(guān)這種判斷必須建立在對(duì)相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)的基礎(chǔ)上。樣本容量適中時(shí)相關(guān)關(guān)系程度一般判斷標(biāo)準(zhǔn)

我國(guó)人均國(guó)民收入與人均消費(fèi)金額數(shù)據(jù)單位:元年份人均國(guó)民收入人均消費(fèi)金額年份人均國(guó)民收入人均消費(fèi)金額1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相關(guān)系數(shù)計(jì)算例【例9.2】在我國(guó)居民消費(fèi)水平研究中,將人均消費(fèi)額記為y,人均國(guó)民收入記為x。收集到1981~1993年的樣本數(shù)據(jù)(xi

,yi,i=1,2,…,13)見下表,計(jì)算相關(guān)系數(shù)。我國(guó)人均國(guó)民收入與人均消費(fèi)金額數(shù)據(jù)相關(guān)系數(shù)計(jì)算例表年份序號(hào)人均國(guó)民收入x人均消費(fèi)金額yx2y2xy123∶∶∶∶13393.8419.14460.86∶∶∶∶2099.5249267289∶∶∶∶1148155078.44175678.34212391.94∶∶∶∶4407900.25620017128983521∶∶∶∶131790498056.20111910.38133188.54∶∶∶∶2410226合計(jì)12827.5745716073323.7752263399156173.99相關(guān)系數(shù)計(jì)算例表年份序號(hào)人均人均1393.824915507例計(jì)算結(jié)果相關(guān)系數(shù)相關(guān)系數(shù)為0.9987,顯示人均國(guó)民收入與人均消費(fèi)金額之間高度正相關(guān)。例計(jì)算結(jié)果相關(guān)系數(shù)相關(guān)系數(shù)計(jì)算例

【例】用例9.1數(shù)據(jù)計(jì)算出該商業(yè)銀行不良貸款、貸款余額、應(yīng)收貸款、貸款項(xiàng)目、固定資產(chǎn)投資額之間的相關(guān)系數(shù)如下:可以看出,不良貸款與貸款余額的相關(guān)系數(shù)最大,與固定資產(chǎn)投資額的相關(guān)系數(shù)最小。相關(guān)系數(shù)計(jì)算例

【例】用例9.1數(shù)據(jù)計(jì)算出該商業(yè)銀行不良貸三、相關(guān)系數(shù)的顯著性檢驗(yàn)根據(jù)樣本計(jì)算的相關(guān)系數(shù)r能否代表總體相關(guān)系數(shù),只有對(duì)其檢驗(yàn)以后才能下結(jié)論。因其具有一定的隨機(jī)性,樣本容量越小其可信程度越差。相關(guān)系數(shù)的顯著性檢驗(yàn)問(wèn)題可分為兩類:一是對(duì)總體相關(guān)系數(shù)是否等于0進(jìn)行檢驗(yàn);二是對(duì)總體相關(guān)系數(shù)是否等于某一給定的不為0的數(shù)值進(jìn)行檢驗(yàn)。這里只介紹第一類檢驗(yàn)。三、相關(guān)系數(shù)的顯著性檢驗(yàn)根據(jù)樣本計(jì)算的相關(guān)系數(shù)r能否代表總體相關(guān)系數(shù)的顯著性檢驗(yàn)(方法與步驟)

數(shù)學(xué)上可以證明,在X與Y都服從正態(tài)分布且的條件下,可以采用t檢驗(yàn)來(lái)確定r

的顯著性。檢驗(yàn)統(tǒng)計(jì)量t服從自由度為n-2的t分布,即檢驗(yàn)的步驟為:提出假設(shè):假設(shè)樣本是從一個(gè)不相關(guān)的總體中抽出的,即H0:;H1:0計(jì)算檢驗(yàn)統(tǒng)計(jì)量:根據(jù)給定的顯著性水平和自由度df=n-2查t分布表得t(n-2)的臨界值,并作出決策:若t>t(n-2),拒絕H0,表明r在統(tǒng)計(jì)上是顯著的,兩變量之間存在顯著線性關(guān)系;若t<t(n-2),接受H0,表明r在統(tǒng)計(jì)上是不顯著的。相關(guān)系數(shù)的顯著性檢驗(yàn)(方法與步驟)數(shù)學(xué)上可以證明,在X與Y相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)

【例】對(duì)前述用例9.2數(shù)據(jù)計(jì)算的人均消費(fèi)額與人均國(guó)民收入相關(guān)系數(shù)進(jìn)行顯著性檢(0.05)提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)顯著性水平=0.05,查t分布表得臨界值

t(n-2)=t0.025(13-2)=2.201

由于t=64.9809>t0.025(13-2)=2.201,所以拒絕H0,接受H1,即說(shuō)明人均消費(fèi)金額與人均國(guó)民收入之間的相關(guān)關(guān)系顯著。相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)【例】對(duì)前述用例9.2數(shù)相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)【例】對(duì)前述用例9.1數(shù)據(jù)計(jì)算的某大型商業(yè)銀行例不良貸款與貸款余額之間的相關(guān)系數(shù)進(jìn)行顯著性檢(0.05)提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量3.根據(jù)顯著性水平=0.05和自由度df=n-2=25-2=23查t分布表得t0.025(23)=2.0687由于t=7.5344>t0.05(23)=2.0687,所以拒絕H0,說(shuō)明不良貸款與貸款余額之間存在顯著正線性相關(guān)關(guān)系相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)【例】對(duì)前述用例9.1數(shù)據(jù)計(jì)相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)對(duì)前述9.1例某大型商業(yè)銀行各相關(guān)系數(shù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量數(shù)據(jù)如下,同學(xué)們可以自行檢驗(yàn)和分析相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)對(duì)前述9.1例某大型商業(yè)銀行第二節(jié)一元線性回歸分析一、回歸分析的含義二、一元線性回歸模型及其參數(shù)的估計(jì)三、回歸直線擬合程度的評(píng)價(jià)四、一元線性回歸模型的檢驗(yàn)一個(gè)用Minitab做的回歸方程Regressionequation案例:判斷標(biāo)準(zhǔn)P<0.05/thread-7745-1-1.html

什么是回歸方程(Regressionequation)?如何用Minitab制作回歸方程/thread-4643-1-1.html

Minitab做回歸方程分析時(shí):線性一次Liner,二次Quadratic,三次立方Cubic的選擇/thread-8238-1-1.html

第二節(jié)一元線性回歸分析一、回歸分析的含義一個(gè)用Minita一、回歸分析的含義什么是回歸回歸是由英國(guó)著名統(tǒng)計(jì)學(xué)家FrancisGalton在19世紀(jì)末期研究孩子及其父母的身高時(shí)提出來(lái)的。Galton發(fā)現(xiàn)身材高的父母,他們的孩子也高。但這些孩子平均起來(lái)并不像他們父母那樣高。比較矮的父母情形也類似:他們的孩子比較矮,但這些孩子的平均身高要比他們父母的平均身高高。Galton把這種孩子的身高向中間值靠近的趨勢(shì)稱之為一種回歸效應(yīng),而他發(fā)展的研究?jī)蓚€(gè)數(shù)值變量之間數(shù)量關(guān)系的方法稱為回歸分析。什么是回歸分析回歸分析是對(duì)具有相關(guān)關(guān)系的變量擬合數(shù)學(xué)方程,通過(guò)一個(gè)或一些變量的變化解釋另一變量變化的方法。一、回歸分析的含義什么是回歸回歸分析的內(nèi)容和步驟根據(jù)理論和對(duì)問(wèn)題的分析判斷,區(qū)分自變量(即解釋變量)和因變量(即被解釋變量);從一組樣本數(shù)據(jù)出發(fā),設(shè)法確定合適的數(shù)學(xué)方程式(即回歸模型regressionmodel)描述變量間的關(guān)系;對(duì)數(shù)學(xué)方程式(回歸模型)的可信程度進(jìn)行統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著;利用數(shù)學(xué)方程式(回歸模型),根據(jù)一個(gè)或幾個(gè)自變量的取值來(lái)估計(jì)或預(yù)測(cè)因變量的取值,并給出這種估計(jì)或預(yù)測(cè)的精確程度。回歸分析的內(nèi)容和步驟根據(jù)理論和對(duì)問(wèn)題的分析判斷,區(qū)分自變量(回歸分析與相關(guān)分析的區(qū)別相關(guān)分析中,變量x

與y處于平等地位;回歸分析中具有相關(guān)關(guān)系的變量之間地位是非對(duì)等的,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預(yù)測(cè)因變量的變化相關(guān)分析中所涉及的變量x和y都是隨機(jī)變量;回歸分析中,因變量y是隨機(jī)變量,自變量x

可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量相關(guān)分析主要描述變量之間相關(guān)關(guān)系的密切程度;回歸分析不僅可以揭示變量x對(duì)變量y的影響大小,還可以由回歸方程進(jìn)行估計(jì)和預(yù)測(cè)回歸分析與相關(guān)分析的區(qū)別相關(guān)分析中,變量x與y處于平回歸模型的類型按涉及變量多少分為:一元回歸和多元回歸按變量相關(guān)的形式分:線性回歸和非線性回歸(本節(jié)僅討論一元回歸分析問(wèn)題)一個(gè)自變量?jī)蓚€(gè)及以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸回歸模型的類型按涉及變量多少分為:一元回歸和多元回歸一個(gè)自變二、一元線性回歸模型及其參數(shù)的估計(jì)

㈠一元線性回歸模型的設(shè)定對(duì)于只涉及一個(gè)自變量的回歸分析,若因變量y與自變量x之間為線性關(guān)系,可以用一個(gè)線性方程來(lái)表示二者之間的關(guān)系,此方程為一元線性回歸模型。通常先要收集若干(n)組樣本數(shù)據(jù)(xi,yi,i=1,2,…,n),然后將數(shù)據(jù)繪制散點(diǎn)圖,若圖中顯示x和y之間大致呈線性關(guān)系,就可以用一元線性回歸方程來(lái)描述這種關(guān)系。二、一元線性回歸模型及其參數(shù)的估計(jì)

㈠一元線性回歸模型的設(shè)一元線性回歸模型(理論模型)一元線性回歸模型可表示為

y=b0+b1x+e此模型將變量y與x間的關(guān)系用兩部分描述。一部分是由x的變化引起y線性變化的部分,即:另一部分是由其他隨機(jī)因素引起y線性變化的部分,記為ε。該回歸模型表達(dá)了變量x與y之間密切相關(guān)、但還沒(méi)有到y(tǒng)由x唯一確定的密切程度的關(guān)系。模型中,一般稱y為被解釋變量(因變量),x為解釋變量(自變量)。β0和β1為模型的參數(shù),又稱回歸系數(shù)。ε為隨機(jī)誤差項(xiàng),又稱隨機(jī)干擾項(xiàng),表示除能用x和y之間線性關(guān)系解釋的因素外的其他隨機(jī)因素對(duì)y的影響。一元線性回歸模型(理論模型)一元線性回歸模型可表示為一元線性回歸模型(理論模型的基本假定)誤差項(xiàng)ε是一個(gè)不可觀測(cè)的且期望值為0的隨機(jī)變量,即E(ε)=0。對(duì)于一個(gè)給定的x值,y的期望值為E(y)=0+

1x對(duì)于所有的x值,ε的方差σ2都相同。誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立,即ε~N(0,σ2)獨(dú)立性意味著對(duì)于一個(gè)特定的x值,它所對(duì)應(yīng)的ε與其他x值所對(duì)應(yīng)的ε不相關(guān)對(duì)于一個(gè)特定的x值,它所對(duì)應(yīng)的y值與其他x所對(duì)應(yīng)的y值也不相關(guān)一元線性回歸模型(理論模型的基本假定)誤差項(xiàng)ε是一個(gè)不可觀測(cè)一元線性回歸模型(應(yīng)用模型)

(估計(jì)的回歸方程estimatedregressionequation

)由于ε為隨機(jī)因素不可觀測(cè),其期望值為0,所以通常用y的數(shù)學(xué)期望E(y)

作為y的估計(jì),即

E(y)=0+1x由于總體回歸參數(shù)0和1是未知的,必須利用樣本數(shù)據(jù)估計(jì),所以用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)0和1,就得到了應(yīng)用的估計(jì)一元線性回歸方程式中:是y的估計(jì)值,表示對(duì)于一個(gè)給定的x值,估計(jì)的y的期望值,是估計(jì)的回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值,是直線的斜率,表示x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值一元線性回歸模型(應(yīng)用模型)

(估計(jì)的回歸方程estima㈡一元線性回歸模型參數(shù)的估計(jì)用來(lái)估計(jì)一元線性回歸模型參數(shù)0和1的方法是最小二乘法,其要點(diǎn)為:它是使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得和的方法。即用此法擬合的直線來(lái)代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都?、嬉辉€性回歸模型參數(shù)的估計(jì)用來(lái)估計(jì)一元線性回歸模型參數(shù)0最小二乘法(圖示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^最小二乘法(圖示)xy(xn,yn)(x1,y1)最小二乘法(

和的計(jì)算公式)

根據(jù)最小二乘法的要求,可得求解和的標(biāo)準(zhǔn)方程如下從的計(jì)算公式可以看出其分母大于0。的正負(fù)取決于分子,且分子與相關(guān)系數(shù)r的分子相同。>0時(shí),表示x每增加一個(gè)單位y值平均增加的數(shù)量,即x與y正相關(guān);<0時(shí),表示x每增加一個(gè)單位y值平均減少的數(shù)量,即x與y負(fù)相關(guān)。最小二乘法(和的計(jì)算公式)根據(jù)最小二乘法一元線性回歸模型估計(jì)(舉例)【例】用例9.2中的數(shù)據(jù)配合人均消費(fèi)金額對(duì)人均國(guó)民收入的回歸方程

根據(jù)和的求解公式得

的含義是人均國(guó)民收入每增加1元,人均消費(fèi)額平均增加約0.53元。一元線性回歸模型估計(jì)(舉例)【例】用例9.2中的數(shù)據(jù)配合人均一元線性回歸模型估計(jì)(舉例)

∴人均消費(fèi)金額對(duì)人均國(guó)民收入的回歸方程為y=54.22286+0.52638x^一元線性回歸模型估計(jì)(舉例)∴人均消費(fèi)金額對(duì)人均國(guó)民收入的一元線性回歸模型估計(jì)(舉例)【例】對(duì)例9.1數(shù)據(jù)求某大型商業(yè)銀行不良貸款對(duì)貸款余額的回歸方程回歸方程為:y=-0.8295+0.037895x回歸系數(shù)=0.037895表示,貸款余額每增加1億元,不良貸款平均增加0.037895億元。

一元線性回歸模型估計(jì)(舉例)【例】對(duì)例9.1數(shù)據(jù)求某大型商業(yè)一元線性回歸模型估計(jì)(舉例)不良貸款對(duì)貸款余額回歸方程的圖示一元線性回歸模型估計(jì)(舉例)不良貸款對(duì)貸款余額回歸方程的圖示用Excel進(jìn)行回歸分析第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項(xiàng)第3步:在分析工具中選擇“回歸”,然后選擇“確定”第4步:當(dāng)對(duì)話框出現(xiàn)時(shí)

在“Y值輸入?yún)^(qū)域”方框內(nèi)鍵入Y的數(shù)據(jù)區(qū)域在“X值輸入?yún)^(qū)域”方框內(nèi)鍵入X的數(shù)據(jù)區(qū)域在“置信度”選項(xiàng)中給出所需的數(shù)值在“輸出選項(xiàng)”中選擇輸出區(qū)域在“殘差”分析選項(xiàng)中選擇所需的選項(xiàng)用Excel進(jìn)行回歸分析第1步:選擇“工具”下拉菜單三、回歸直線擬合程度的評(píng)價(jià)根據(jù)估計(jì)的回歸方程由自變量的值估計(jì)因變量的值,估計(jì)精度取決于回歸方程對(duì)觀察數(shù)據(jù)的擬合程度?;貧w直線與各觀測(cè)點(diǎn)的接近程度稱為回歸直線對(duì)數(shù)據(jù)的擬合優(yōu)度。它可以通過(guò)判定系數(shù)和估計(jì)標(biāo)準(zhǔn)誤差來(lái)反映。㈠離差平方和的分解和判定系數(shù)㈡估計(jì)標(biāo)準(zhǔn)誤差三、回歸直線擬合程度的評(píng)價(jià)根據(jù)估計(jì)的回歸方程由自變量的值估計(jì)㈠離差平方和的分解和判定系數(shù)

1.離差平方和的分解為說(shuō)明直線的擬合程度,需要研究因變量y取值的變化規(guī)律。因變量y取值的波動(dòng)(或差異)稱為變差。變差來(lái)源于兩個(gè)方面:由于自變量x的取值不同造成的由于受自變量x以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響某一項(xiàng)具體觀測(cè)值的變差可以用該觀測(cè)值與其均值之差來(lái)表示。全部n項(xiàng)觀測(cè)值的總變差(記為SST)可由各觀測(cè)值與均值離差的平方和來(lái)表示,即:㈠離差平方和的分解和判定系數(shù)

1.離差平方和的分解為說(shuō)明直離差平方和的分解(圖示)xyy{}}離差分解圖離差平方和的分解(圖示)xyy{}}離差分解圖離差平方和的分解(三個(gè)平方和的關(guān)系)

兩端平方并對(duì)所有點(diǎn)求離差平方和,有從圖上看有SST=SSR+SSE總變差平方和(SST){回歸離差平方和(SSR){殘差平方和(SSE){離差平方和的分解(三個(gè)平方和的關(guān)系)兩端平方并對(duì)所有離差平方和的分解(三個(gè)平方和的意義)總變差平方和(SST)反映因變量的n個(gè)觀察值與其均值的總離差回歸離差平方和(SSR)反映自變量x的變化對(duì)因變量y取值變化的影響,或者說(shuō)是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的變差平方和殘差平方和(SSE)反映除x以外的其他因素對(duì)y取值的影響,也稱為不可解釋的變差平方和或剩余變差平方和從上圖可以看出,在總變差平方和(SST)中回歸離差平方和(SSR)的比例越大,回歸直線擬合越好。離差平方和的分解(三個(gè)平方和的意義)總變差平方和(SST)2.判定系數(shù)r2

(coefficientofdetermination)將回歸離差平方和(SSR)在總變差平方和(SST)中的比例定義為判定系數(shù),或稱樣本決定系數(shù)、可決系數(shù),記為r2。它有以下要點(diǎn):⑴是回歸離差平方和占總變差平方和的比例,基本公式:⑵反映回歸直線的擬合程度⑶取值范圍在[0,1]之間⑷判定系數(shù)r2越接近于1,說(shuō)明回歸方程擬合越好;判定系數(shù)r2越接近于0,說(shuō)明回歸方程擬合越差⑸判定系數(shù)等于相關(guān)系數(shù)的平方,即r2=(r)22.判定系數(shù)r2(coefficientofdete判定系數(shù)r2

(舉例)【例】對(duì)例9.2數(shù)據(jù)計(jì)算人均消費(fèi)額與人均國(guó)民收入相關(guān)關(guān)系判定系數(shù)為

r2=(0.9987)2=0.9974

說(shuō)明在人均消費(fèi)額的總變差中有99.74%可以由人均國(guó)民收入與人均消費(fèi)額之間的線性關(guān)系來(lái)解釋,或者說(shuō)在人均消費(fèi)額取值的變動(dòng)中,有99.74%是由人均國(guó)民收入所決定的。說(shuō)明二者之間有較強(qiáng)的線性關(guān)系。判定系數(shù)r2(舉例)【例】對(duì)例9.2數(shù)據(jù)計(jì)算人均消費(fèi)額與人判定系數(shù)r2

(舉例)【例】對(duì)例9.1數(shù)據(jù)計(jì)算某大型商業(yè)銀行不良貸款額對(duì)貸款余額回歸的判定系數(shù)意義:在不良貸款額的變差中有71.16%可以由不良貸款與貸款余額之間的線性關(guān)系來(lái)解釋,或者說(shuō)在不良貸款額的變動(dòng)中,有71.16%是由貸款余額所決定的??梢姴涣假J款與貸款余額之間有較強(qiáng)的線性關(guān)系。判定系數(shù)r2(舉例)【例】對(duì)例9.1數(shù)據(jù)計(jì)算某大型商業(yè)銀行㈡估計(jì)標(biāo)準(zhǔn)誤差Sy

(standarderrorofestimate)估計(jì)標(biāo)準(zhǔn)誤差是對(duì)回歸模型隨機(jī)誤差項(xiàng)的標(biāo)準(zhǔn)差的估計(jì),即觀察值與回歸估計(jì)值離差平方和的均方根,是在排除了x對(duì)y的線性影響后對(duì)因變量y隨機(jī)波動(dòng)大小的一個(gè)估計(jì)量。反映觀察值在回歸直線周圍的分散程度和回歸方程對(duì)因變量代表性的大小,其數(shù)值越大說(shuō)明代表性越小。也反映用估計(jì)的回歸方程預(yù)測(cè)y時(shí)預(yù)測(cè)誤差的大小,其數(shù)值越大說(shuō)明預(yù)測(cè)誤差越大。

可從另一個(gè)角度說(shuō)明回歸直線的擬合程度。計(jì)算公式為㈡估計(jì)標(biāo)準(zhǔn)誤差Sy(standarderrorof估計(jì)標(biāo)準(zhǔn)誤差Sy

(舉例)【例】對(duì)例9.2數(shù)據(jù)計(jì)算人均消費(fèi)額對(duì)人均國(guó)民收入回歸模型的估計(jì)標(biāo)準(zhǔn)誤差Sy

計(jì)算結(jié)果:Sy=14.9497

說(shuō)明利用回歸模型根據(jù)人均國(guó)民收入預(yù)測(cè)人均消費(fèi)額時(shí),平均預(yù)測(cè)誤差為14.95元?!纠繉?duì)例9.1數(shù)據(jù)計(jì)算某大型商業(yè)銀行不良貸款對(duì)貸款余額回歸模型的估計(jì)標(biāo)準(zhǔn)誤差Sy

計(jì)算結(jié)果:Sy=1.9799

說(shuō)明利用回歸模型根據(jù)貸款余額預(yù)測(cè)不良貸款額時(shí),平均預(yù)測(cè)誤差為1.9799億元。估計(jì)標(biāo)準(zhǔn)誤差Sy(舉例)【例】對(duì)例9.2數(shù)據(jù)計(jì)算人均消費(fèi)估計(jì)標(biāo)準(zhǔn)誤差與相關(guān)系數(shù)的關(guān)系可以看出估計(jì)標(biāo)準(zhǔn)誤差Sy與相關(guān)系數(shù)r有相反的數(shù)量關(guān)系,|r|越大,Sy越小。如果Sy=0,則|r|=1。此時(shí)x與y完全相關(guān)。因此估計(jì)標(biāo)準(zhǔn)誤差可以從另一個(gè)角度說(shuō)明x與y相關(guān)關(guān)系的密切程度。但估計(jì)標(biāo)準(zhǔn)誤差所表現(xiàn)的關(guān)系密切程度不很明顯,且不能反映相關(guān)關(guān)系的正負(fù)方向。估計(jì)標(biāo)準(zhǔn)誤差與相關(guān)系數(shù)的關(guān)系可以看出估計(jì)標(biāo)準(zhǔn)誤差Sy與相關(guān)系四、一元線性回歸模型的檢驗(yàn)在根據(jù)樣本數(shù)據(jù)擬合回歸方程時(shí),首先假設(shè)變量x和y之間存在線性關(guān)系,這種假設(shè)是否成立必須經(jīng)過(guò)檢驗(yàn)才能證實(shí)。回歸分析中的顯著性檢驗(yàn)包括兩方面內(nèi)容:㈠回歸方程線性關(guān)系的顯著性檢驗(yàn)㈡回歸系數(shù)的顯著性檢驗(yàn)四、一元線性回歸模型的檢驗(yàn)在根據(jù)樣本數(shù)據(jù)擬合回歸方程時(shí),首先㈠回歸方程線性關(guān)系的顯著性檢驗(yàn)是檢驗(yàn)自變量與因變量之間線性關(guān)系是否顯著。方法是將回歸均方(MSR)同殘差均方(MSE)加以比較,應(yīng)用F檢驗(yàn)分析二者之間的差別是否顯著回歸均方(MSR):回歸離差平方和(SSR)除以相應(yīng)的自由度(自變量的個(gè)數(shù)p)殘差均方(MSE):殘差平方和(SSE)除以相應(yīng)的自由度(n-p-1)如果差別顯著,兩個(gè)變量之間存在線性關(guān)系如果差別不顯著,兩個(gè)變量之間不存在線性關(guān)系㈠回歸方程線性關(guān)系的顯著性檢驗(yàn)是檢驗(yàn)自變量與因變量之間線性關(guān)回歸方程線性關(guān)系的顯著性檢驗(yàn)(檢驗(yàn)的步驟)1.提出假設(shè):H0:兩變量之間的線性關(guān)系不顯著

H1:兩變量之間的線性關(guān)系顯著2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F

其中,F(xiàn)(1,n-2)表示第一自由度為1,第二自由度為n-2的F分布。3.確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2查F分布表找出臨界值F4.作出決策:若FF,拒絕H0;若F<F,接受H0回歸方程線性關(guān)系的顯著性檢驗(yàn)(檢驗(yàn)的步驟)1.提出假設(shè):H0回歸方程線性關(guān)系的顯著性檢驗(yàn)(舉例)【例】對(duì)例9.1數(shù)據(jù)建立的不良貸款對(duì)貸款余額的回歸方程,進(jìn)行回歸方程線性關(guān)系的顯著性檢驗(yàn)。給定顯著性水平=0.05。提出假設(shè)H0:1=0即不良貸款與貸款余額之間的線性關(guān)系不顯著計(jì)算檢驗(yàn)統(tǒng)計(jì)量F查F分布表得臨界值:

F(1,n-2)=F0.05(1,25-2)=4.28∵F=56.75>F0.05(1,25-2)=4.84∴拒絕H0,說(shuō)明貸款余額x與不良貸款y之間存在顯著的線性關(guān)系,即回歸方程線性關(guān)系顯著。回歸方程線性關(guān)系的顯著性檢驗(yàn)(舉例)【例】對(duì)例9.1數(shù)據(jù)建立線性關(guān)系的顯著性檢驗(yàn)

(方差分析表)

Excel輸出的方差分析表平方和均方線性關(guān)系的顯著性檢驗(yàn)(方差分析表)Excel輸出的方差㈡回歸系數(shù)的顯著性檢驗(yàn)是檢驗(yàn)自變量x對(duì)因變量y的影響是否顯著。方法是檢驗(yàn)回歸系數(shù)1是否為0,如果1為0,回歸直線為一條水平線,表明兩變量之間沒(méi)有線性關(guān)系,反之,如果1不為0,表明x對(duì)y的影響是顯著的,兩變量之間存在線性關(guān)系。檢驗(yàn)的理論基礎(chǔ)是回歸系數(shù)

的抽樣分布,即假定其抽樣分布服從正態(tài)分布。在一元線性回歸中,自變量只有一個(gè),回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))等價(jià)于回歸方程線性關(guān)系的顯著性檢驗(yàn)(F檢驗(yàn)),如果t檢驗(yàn)顯著,F(xiàn)檢驗(yàn)結(jié)果也一定顯著。但在多元回歸分析中兩種檢驗(yàn)的意義不同。㈡回歸系數(shù)的顯著性檢驗(yàn)是檢驗(yàn)自變量x對(duì)因變量y的影響是否顯著回歸系數(shù)的顯著性檢驗(yàn)(樣本統(tǒng)計(jì)量的分布)

是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,有自己的分布,其分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于總體未知,需用其估計(jì)量Sy來(lái)代替得到的估計(jì)的標(biāo)準(zhǔn)差

抽樣分布回歸系數(shù)的顯著性檢驗(yàn)(樣本統(tǒng)計(jì)量的分布)是根據(jù)最小回歸系數(shù)的顯著性檢驗(yàn)(步驟)提出假設(shè)H0:b1=0(沒(méi)有線性關(guān)系)H1:b1

0(有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量

確定顯著性水平,并進(jìn)行決策t>t(n-2)

,拒絕H0;t<t(n-2)

,接受H0回歸系數(shù)的顯著性檢驗(yàn)(步驟)提出假設(shè)確定顯著性水平,并進(jìn)回歸系數(shù)的顯著性檢驗(yàn)(例題分析)【例】對(duì)例9.1數(shù)據(jù)建立的回歸方程的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(=0.05)提出假設(shè)H0:b1=0H1:b1

0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量

t=7.533797>t(n-2)=t0.025(25-2)=2.0687,拒絕H0,表明不良貸款與貸款余額之間有線性關(guān)系回歸系數(shù)的顯著性檢驗(yàn)(例題分析)【例】對(duì)例9.1數(shù)據(jù)建立的回回歸系數(shù)的顯著性檢驗(yàn)(例題分析)P值的應(yīng)用P=0.000000<=0.05,拒絕原假設(shè),不良貸款與貸款余額之間有線性關(guān)系回歸系數(shù)的顯著性檢驗(yàn)(例題分析)P值的應(yīng)用P=0.0000第三節(jié)利用回歸模型進(jìn)行估計(jì)預(yù)測(cè)一、點(diǎn)估計(jì)二、區(qū)間估計(jì)第三節(jié)利用回歸模型進(jìn)行估計(jì)預(yù)測(cè)一、點(diǎn)估計(jì)利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)回歸方程通過(guò)檢驗(yàn)就可以根據(jù)自變量x

的取值估計(jì)或預(yù)測(cè)因變量y的取值。估計(jì)或預(yù)測(cè)的類型:點(diǎn)估計(jì)y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)區(qū)間估計(jì)y的平均值的置信區(qū)間估計(jì)y的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì)利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)回歸方程通過(guò)檢驗(yàn)就可以根據(jù)自變量一、點(diǎn)估計(jì)點(diǎn)估計(jì)是對(duì)于自變量x的一個(gè)給定值x0

,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)值2.點(diǎn)估計(jì)值有y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)3.在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和個(gè)別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估計(jì)中則不同一、點(diǎn)估計(jì)點(diǎn)估計(jì)是對(duì)于自變量x的一個(gè)給定值x0,根據(jù)回

y的平均值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0

,求出因變量y

的平均值的一個(gè)估計(jì)值E(y0),就是平均值的點(diǎn)估計(jì)在前面某大型商業(yè)銀行的例子中,假如要估計(jì)貸款余額為100億元時(shí)所有分行不良貸款的平均值,就是平均值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得y的平均值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的y的個(gè)別值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0

,求出因變量y

的一個(gè)個(gè)別值的估計(jì)值,就是個(gè)別值的點(diǎn)估計(jì)比如,在前面某大型商業(yè)銀行的例子中,如果只是想知道貸款余額為72.8億元的那個(gè)分行(這里是編號(hào)為10的那個(gè)分行)的不良貸款是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得y的個(gè)別值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給二、區(qū)間估計(jì)點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)。區(qū)間估計(jì)是對(duì)于自變量x的一個(gè)給定值x0,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)區(qū)間。區(qū)間估計(jì)有兩種類型置信區(qū)間估計(jì)(confidenceintervalestimate)預(yù)測(cè)區(qū)間估計(jì)(predictionintervalestimate)二、區(qū)間估計(jì)點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是置信區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0

,求出因變量y

的平均值E(y0)的估計(jì)區(qū)間,這一估計(jì)區(qū)間稱為置信區(qū)間(confidenceinterval)

E(y0)

在1-置信水平下的置信區(qū)間為式中:sy為估計(jì)標(biāo)準(zhǔn)誤差置信區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值置信區(qū)間估計(jì)(例題分析)【例】在前面某大型商業(yè)銀行的例子中,求出貸款余額為100億元時(shí),不良貸款95%的置信區(qū)間解:根據(jù)前面的計(jì)算結(jié)果,已知n=25,sy=1.9799,t(25-2)=2.0687,貸款余額為100億元時(shí)不良貸款平均值的點(diǎn)估計(jì)值為2.96,置信區(qū)間為即當(dāng)貸款余額為100億元時(shí),所有分行不良貸款的平均值在2.1141億元到3.8059億元之間。

置信區(qū)間估計(jì)(例題分析)【例】在前面某大型商業(yè)銀行的例子中,預(yù)測(cè)區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0

,求出因變量y

的一個(gè)個(gè)別值的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測(cè)區(qū)間(predictioninterval)

y0在1-置信水平下的預(yù)測(cè)區(qū)間為注意!預(yù)測(cè)區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值預(yù)測(cè)區(qū)間估計(jì)(例題分析)【例】在前面某大型商業(yè)銀行的例子中,求出貸款余額為72.8億元的那個(gè)分行不良貸款95%的預(yù)測(cè)區(qū)間解:根據(jù)前面的計(jì)算結(jié)果,已知n=25,sy=1.9799,

t(25-2)=2.0687,貸款余額為72.8億元時(shí)不良貸款點(diǎn)估計(jì)值為1.93,預(yù)測(cè)區(qū)間為即貸款余額為72.8億元的那個(gè)分行不良貸款的預(yù)測(cè)區(qū)間在-2.2766億元到6.1366億元之間。預(yù)測(cè)區(qū)間估計(jì)(例題分析)【例】在前面某大型商業(yè)銀行的例子中,影響區(qū)間寬度的因素1. 置信水平(1-)區(qū)間寬度隨置信水平的增大而增大2. 數(shù)據(jù)的離散程度(s)區(qū)間寬度隨離散程度的增大而增大3. 樣本容量區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測(cè)的x0

與x的差異程度區(qū)間寬度隨x0

與x的差異程度的增大而增大因此用于預(yù)測(cè)的x0與x的差異程度越大預(yù)測(cè)精度越差影響區(qū)間寬度的因素1. 置信水平(1-)置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方程xpyxx預(yù)測(cè)上限置信上限預(yù)測(cè)下限置信下限置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方程xpyxx預(yù)測(cè)上限置信上限預(yù)測(cè)相關(guān)、回歸分析舉例例:已知某地居民人均收入與商品銷售額的資料如下年份人均收入(百元/人)x商品銷售額(百萬(wàn)元)y

x2y2xy1996199719981999200024303234381115141620576900102411561444121225196256400264450448544760合計(jì)15876510011982466相關(guān)、回歸分析舉例例:已知某地居民人均收入與商品銷售額的資料相關(guān)、回歸分析舉例要求根據(jù)上述資料

⑴計(jì)算簡(jiǎn)單相關(guān)系數(shù),并進(jìn)行顯著性檢驗(yàn)(α=0.05)⑵求出估計(jì)的一元線性回歸方程,并解釋回歸系數(shù)的意義⑶計(jì)算判定系數(shù),并解釋其意義⑷計(jì)算估計(jì)標(biāo)準(zhǔn)誤差⑸檢驗(yàn)回歸系數(shù)的顯著性(α=0.05)⑹估計(jì)人均收入為4000元時(shí)商品銷售額95%的置信區(qū)間和預(yù)測(cè)區(qū)間相關(guān)、回歸分析舉例要求根據(jù)上述資料⑴計(jì)算相關(guān)系數(shù)⑴計(jì)算相關(guān)系數(shù)相關(guān)系數(shù)的顯著性檢驗(yàn)提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)顯著性水平=0.05,查t分布表得臨界值

t(n-2)=t0.025(5-2)=3.1824

由于t=5.3099>t0.025(5-2)=3.1824,所以拒絕H0,接受H1,即說(shuō)明居民人均收入與商品銷售額之間的相關(guān)關(guān)系顯著。相關(guān)系數(shù)的顯著性檢驗(yàn)提出假設(shè):H0:;H1⑵求一元線性回歸方程,解釋回歸系數(shù)的意義

的含義是人均收入每增加1元,商品銷售額平均增加約0.6萬(wàn)元。⑵求一元線性回歸方程,解釋回歸系數(shù)的意義⑶計(jì)算判定系數(shù),并解釋其意義

r2=(0.9507)2=0.9038

說(shuō)明在商品銷售額的總變差中有90.38%可以由人均收入與商品銷售額之間的線性關(guān)系來(lái)解釋,或者說(shuō),在商品銷售額取值的變動(dòng)中,有90.38%是由人均收入所決定的。說(shuō)明二者之間有較強(qiáng)的線性關(guān)系。⑷計(jì)算估計(jì)標(biāo)準(zhǔn)誤差

說(shuō)明根據(jù)人均收入預(yù)測(cè)商品銷售額時(shí),平均的預(yù)測(cè)誤差為1.387百萬(wàn)元。⑶計(jì)算判定系數(shù),并解釋其意義r2=(0.9507)2⑸檢驗(yàn)回歸系數(shù)的顯著性(α=0.05)提出假設(shè)H0:b1=0人均收入與商品銷售額之間無(wú)線性關(guān)系H1:b1

0人均收入與商品銷售額之間有線性關(guān)系計(jì)算檢驗(yàn)的統(tǒng)計(jì)量

t=4.4789>t0.025(5-2)=3.1824

,拒絕H0,接受H1,表明人均收入與商品銷售額之間有線性關(guān)系⑸檢驗(yàn)回歸系數(shù)的顯著性(α=0.05)提出假設(shè)t=4.47⑹估計(jì)人均收入為40百元時(shí)商品銷售額95%的置信區(qū)間和預(yù)測(cè)區(qū)間t(5-2)=t0.025(3)=3.1824置信區(qū)間:人均收入為4000元時(shí)商品銷售額平均值95%的置信區(qū)間為區(qū)間為1711~2337萬(wàn)元。⑹估計(jì)人均收入為40百元時(shí)商品銷售額95%的置信區(qū)間和預(yù)測(cè)區(qū)預(yù)測(cè)區(qū)間:人均收入為4000元的年份商品銷售額95%的預(yù)測(cè)區(qū)間為1422~2626萬(wàn)元。預(yù)測(cè)區(qū)間:練習(xí)題:以下為10家商店銷售額和利潤(rùn)率的資料編號(hào)每人月平均銷售額(千元)利潤(rùn)率(%)12345678910658147633712.610.418.538.116.312.36.26.616.8練習(xí)題:以下為10家商店銷售額和利潤(rùn)率的資料編號(hào)每人月平均銷要求根據(jù)上述資料⑴計(jì)算兩變量的相關(guān)系數(shù),并進(jìn)行顯著性檢驗(yàn)(α=0.05)⑵求出估計(jì)的一元線性回歸方程,并解釋回歸系數(shù)的意義⑶計(jì)算判定系數(shù),并解釋其意義⑷計(jì)算估計(jì)標(biāo)準(zhǔn)誤差⑸檢驗(yàn)回歸系數(shù)的顯著性(α=0.05)⑹估計(jì)月平均每人銷售額為5000元時(shí)利潤(rùn)率95%的置信區(qū)間和預(yù)測(cè)區(qū)間要求根據(jù)上述資料本章學(xué)習(xí)要求理解變量之間相關(guān)關(guān)系的概念、種類;掌握相關(guān)系數(shù)及其顯著性檢驗(yàn);掌握一元線性回歸方程的確定,判定系數(shù)、估計(jì)標(biāo)準(zhǔn)差、回歸系數(shù)的顯著性檢驗(yàn);掌握利用回歸模型進(jìn)行估計(jì)預(yù)測(cè)的方法。本章學(xué)習(xí)要求理解變量之間相關(guān)關(guān)系的概念、種類;相關(guān)與回歸分析第一節(jié)變量間關(guān)系的度量第二節(jié)一元線性回歸分析第三節(jié)利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)相關(guān)與回歸分析第一節(jié)變量間關(guān)系的度量第一節(jié)變量間關(guān)系的度量一、變量間的函數(shù)關(guān)系與相關(guān)關(guān)系二、相關(guān)關(guān)系的描述與測(cè)度三、相關(guān)系數(shù)的顯著性檢驗(yàn)第一節(jié)變量間關(guān)系的度量一、變量間的函數(shù)關(guān)系與相關(guān)關(guān)系一、變量間的函數(shù)關(guān)系與相關(guān)關(guān)系客觀現(xiàn)象之間是普遍聯(lián)系相互依存的??陀^現(xiàn)象之間的數(shù)量聯(lián)系可分為兩類:

確定性關(guān)系(函數(shù)關(guān)系)非確定性關(guān)系(相關(guān)關(guān)系)一、變量間的函數(shù)關(guān)系與相關(guān)關(guān)系客觀現(xiàn)象之間是普遍聯(lián)系相互依存函數(shù)關(guān)系一個(gè)或幾個(gè)變量取一定值時(shí)另一個(gè)變量有確定值與之對(duì)應(yīng),這種變量間一一對(duì)應(yīng)的確定性關(guān)系稱為函數(shù)關(guān)系。例如,設(shè)有兩個(gè)變量x和y,變量y隨變量x變化,并完全依賴于x

,當(dāng)變量x取某個(gè)數(shù)值時(shí),

y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為

y=f(x),其中x稱為自變量,y稱為因變量。兩變量函數(shù)關(guān)系在圖形上表現(xiàn)為各觀測(cè)點(diǎn)落在一條線上xy函數(shù)關(guān)系一個(gè)或幾個(gè)變量取一定值時(shí)另一個(gè)變量有確定值與之對(duì)應(yīng),

函數(shù)關(guān)系舉例某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y=p

x(p為單價(jià))圓的面積(S)與半徑(R)之間的關(guān)系可表示為S=R2

企業(yè)原材料消耗額(y)與產(chǎn)品產(chǎn)量(x1)

、單位產(chǎn)量原材料消耗量(x2)

、原材料價(jià)格(x3)之間的關(guān)系可表示為y=x1x2x3

函數(shù)關(guān)系舉例某種商品的銷售額(y)與銷售量(x)之間的關(guān)相關(guān)關(guān)系一個(gè)或幾個(gè)相互聯(lián)系的變量取一定值時(shí),與之對(duì)應(yīng)的另一個(gè)變量的值雖然不確定,但它按某種規(guī)律在一定范圍內(nèi)變化,這種變量間的不確定性對(duì)應(yīng)關(guān)系稱為相關(guān)關(guān)系。例如,設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,但不完全依賴于x

,當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè),但取值范圍變化有一定規(guī)律,則稱y與x之間有相關(guān)關(guān)系。xy兩變量相關(guān)關(guān)系在圖形上表現(xiàn)為各觀測(cè)點(diǎn)分布在線的周圍相關(guān)關(guān)系一個(gè)或幾個(gè)相互聯(lián)系的變量取一定值時(shí),與之對(duì)應(yīng)的另一個(gè)

相關(guān)關(guān)系舉例商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系相關(guān)關(guān)系舉例商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系比因果關(guān)系包括的范圍更廣泛。具有相關(guān)關(guān)系的某些現(xiàn)象的數(shù)量可表現(xiàn)為因果關(guān)系,即自變量與因變量的關(guān)系,但有時(shí)不存在明顯的因果關(guān)系或互為因果關(guān)系,如人的身高和體重、商品的供求與價(jià)格等。變量間的函數(shù)關(guān)系與相關(guān)關(guān)系在一定條件下可以相互轉(zhuǎn)化。當(dāng)存在測(cè)量誤差或隨機(jī)因素的干擾時(shí),函數(shù)關(guān)系可表現(xiàn)為相關(guān)關(guān)系;當(dāng)我們對(duì)變量?jī)?nèi)在聯(lián)系有規(guī)律性認(rèn)識(shí)時(shí),相關(guān)關(guān)系可能轉(zhuǎn)化為函數(shù)關(guān)系或用函數(shù)關(guān)系來(lái)描述。相關(guān)關(guān)系相關(guān)關(guān)系比因果關(guān)系包括的范圍更廣泛。具有相關(guān)關(guān)系的某相關(guān)分析現(xiàn)象的函數(shù)關(guān)系可以用數(shù)學(xué)分析方法研究和測(cè)度,現(xiàn)象的相關(guān)關(guān)系需用統(tǒng)計(jì)學(xué)的相關(guān)與回歸分析方法研究和測(cè)度。相關(guān)分析是描述和測(cè)度變量間相關(guān)關(guān)系類型和相關(guān)程度的分析方法。在相關(guān)分析中,所有變量都假定是隨機(jī)變量,它們之間不存在解釋變量和被解釋變量的關(guān)系,即不考慮因果關(guān)系。相關(guān)分析現(xiàn)象的函數(shù)關(guān)系可以用數(shù)學(xué)分析方法研究和測(cè)度,現(xiàn)象的相相關(guān)關(guān)系的種類1按相關(guān)因素的多少分

單相關(guān)復(fù)相關(guān)2按相關(guān)關(guān)系的形式分

線性相關(guān)(直線相關(guān))非線性相關(guān)(曲線相關(guān))3按相關(guān)關(guān)系的方向分

正相關(guān)負(fù)相關(guān)4按相關(guān)關(guān)系的程度分

完全相關(guān)不完全相關(guān)不相關(guān)相關(guān)關(guān)系的種類1按相關(guān)因素的多少分單相關(guān)相關(guān)關(guān)系的種類簡(jiǎn)單相關(guān)和多元相關(guān)(多重相關(guān)、復(fù)相關(guān))

簡(jiǎn)單相關(guān)指兩個(gè)變量之間的相關(guān)關(guān)系;多元相關(guān)指三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系。

線性相關(guān)和非線性相關(guān)

如果散點(diǎn)圖上的所有的點(diǎn)幾乎接近一條直線,可以認(rèn)為變量之間是線性相關(guān)的;如果散點(diǎn)圖上的所有點(diǎn)幾乎接近一條曲線,可以認(rèn)為變量之間是非線性相關(guān)的。

相關(guān)關(guān)系的種類簡(jiǎn)單相關(guān)和多元相關(guān)(多重相關(guān)、復(fù)相關(guān))相關(guān)關(guān)系的種類正相關(guān)和負(fù)相關(guān)

如果相關(guān)變量之間同增或同減,稱這種相關(guān)關(guān)系是正相關(guān)。如果相關(guān)變量間一個(gè)變量值增加時(shí)另一個(gè)變量值減少,稱這種相關(guān)關(guān)系是負(fù)相關(guān)。完全相關(guān)、不完全相關(guān)和不相關(guān)

如果一個(gè)變量的變化完全由另一個(gè)變量的變化所確定,則稱兩變量的關(guān)系為完全相關(guān),即為函數(shù)關(guān)系;如果兩個(gè)變量間的關(guān)系很弱或看不出任何關(guān)系,則稱之為不相關(guān)(或零相關(guān))。兩變量的關(guān)系介于完全相關(guān)和不相關(guān)之間稱為不完全相關(guān)。相關(guān)關(guān)系的種類正相關(guān)和負(fù)相關(guān)二、相關(guān)關(guān)系的描述與測(cè)度判斷現(xiàn)象之間有無(wú)相關(guān)關(guān)系,應(yīng)先進(jìn)行定性分析,即依據(jù)理論知識(shí)、實(shí)踐經(jīng)驗(yàn)對(duì)現(xiàn)象之間是否存在相關(guān)關(guān)系及相關(guān)關(guān)系的類型作出判斷。然后在此基礎(chǔ)上進(jìn)行定量分析,即運(yùn)用相關(guān)圖、相關(guān)表和相關(guān)系數(shù)等方法對(duì)現(xiàn)象之間的相關(guān)關(guān)系進(jìn)行描述與測(cè)度。㈠相關(guān)表㈡相關(guān)關(guān)系的圖示㈢相關(guān)系數(shù)二、相關(guān)關(guān)系的描述與測(cè)度判斷現(xiàn)象之間有無(wú)相關(guān)關(guān)系,應(yīng)先進(jìn)行定㈠相關(guān)表簡(jiǎn)單相關(guān)表例:居民消費(fèi)支出和收入的相關(guān)表(單位:百元)

根據(jù)以上資料繪制坐標(biāo)圖便得到相關(guān)圖家庭編號(hào)12345678910消費(fèi)支出y可支配收入x1520304042536065707818254560627588929998㈠相關(guān)表簡(jiǎn)單相關(guān)表家庭編號(hào)123單變量分組表產(chǎn)量(千件)x企業(yè)數(shù)平均單位成本(元/件)y20304050809556516.815.615.014.814.2合計(jì)30例:30家企業(yè)按產(chǎn)品產(chǎn)量分組的平均單位產(chǎn)品成本單變量分組表產(chǎn)量企業(yè)數(shù)平均單位成本(元/件)y20916.雙變量分組表

例:30家企業(yè)按產(chǎn)品產(chǎn)量和單位產(chǎn)品成本分組

單位成本(元/件)y產(chǎn)量(千件)

x合計(jì)203040508018161514441--32--131-132--1449107合計(jì)9556530雙變量分組表

例:30家企業(yè)按產(chǎn)品產(chǎn)量和單位產(chǎn)品成本分組㈡相關(guān)關(guān)系的圖示(散點(diǎn)圖scatterdiagram)不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)如何制作散點(diǎn)圖?Minitab教您怎么制作散點(diǎn)圖(scatterdiagram)/thread-4292-1-1.html

Minitab制作3D散點(diǎn)圖(3DScatterplot)的方法,如何制作3D散點(diǎn)圖教程/thread-4639-1-1.html

㈡相關(guān)關(guān)系的圖示(散點(diǎn)圖scatterdiagram)散點(diǎn)圖(例題分析)【例9.1】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國(guó)家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年該銀行貸款額平穩(wěn)增長(zhǎng),但不良貸款額也有較大提高,給銀行業(yè)務(wù)發(fā)展帶來(lái)較大壓力。為弄清不良貸款形成的原因,以便找出控制不良貸款的辦法,現(xiàn)利用銀行有關(guān)業(yè)務(wù)數(shù)據(jù)進(jìn)行相關(guān)分析。下面是該銀行所屬25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。

散點(diǎn)圖(例題分析)【例9.1】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有散點(diǎn)圖(例題分析)散點(diǎn)圖(例題分析)散點(diǎn)圖(例題分析)散點(diǎn)圖(例題分析)㈢相關(guān)系數(shù)相關(guān)系數(shù)是對(duì)變量之間關(guān)系密切程度的度量對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱為簡(jiǎn)單相關(guān)系數(shù)(簡(jiǎn)稱相關(guān)系數(shù))若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若相關(guān)系數(shù)是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r在此僅討論兩變量間相關(guān)關(guān)系問(wèn)題。對(duì)于隨機(jī)變量x和y,總體相關(guān)系數(shù)一般是未知的,只能根據(jù)樣本觀測(cè)值給出一個(gè)估計(jì)量即樣本相關(guān)系數(shù)r。

㈢相關(guān)系數(shù)相關(guān)系數(shù)是對(duì)變量之間關(guān)系密切程度的度量樣本相關(guān)系數(shù)r的計(jì)算公式或化簡(jiǎn)為樣本相關(guān)系數(shù)r的計(jì)算公式或化簡(jiǎn)為相關(guān)系數(shù)取值及其意義

r

的取值范圍是[-1,1]|r|=1,表明x與y完全線性相關(guān)r=1,為完全正線性相關(guān)r=-1,為完全負(fù)線性相關(guān)

r=0,表明x與y不存在線性相關(guān)關(guān)系-1r<0,為負(fù)線性相關(guān)0<r1,為正線性相關(guān)|r|越趨于1表示x與y線性關(guān)系越密切;|r|越趨于0表示x與y線性關(guān)系越不密切相關(guān)系數(shù)取值及其意義r的取值范圍是[-1,1]相關(guān)系數(shù)(取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無(wú)線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加相關(guān)系數(shù)(取值及其意義)-1.0+1.00-0.5+0.5完樣本容量適中時(shí)相關(guān)關(guān)系程度一般判斷標(biāo)準(zhǔn)

無(wú)相關(guān)或微弱相關(guān)低度相關(guān)中度相關(guān)(顯著相關(guān))高度相關(guān)這種判斷必須建立在對(duì)相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)的基礎(chǔ)上。樣本容量適中時(shí)相關(guān)關(guān)系程度一般判斷標(biāo)準(zhǔn)

我國(guó)人均國(guó)民收入與人均消費(fèi)金額數(shù)據(jù)單位:元年份人均國(guó)民收入人均消費(fèi)金額年份人均國(guó)民收入人均消費(fèi)金額1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相關(guān)系數(shù)計(jì)算例【例9.2】在我國(guó)居民消費(fèi)水平研究中,將人均消費(fèi)額記為y,人均國(guó)民收入記為x。收集到1981~1993年的樣本數(shù)據(jù)(xi

,yi,i=1,2,…,13)見下表,計(jì)算相關(guān)系數(shù)。我國(guó)人均國(guó)民收入與人均消費(fèi)金額數(shù)據(jù)相關(guān)系數(shù)計(jì)算例表年份序號(hào)人均國(guó)民收入x人均消費(fèi)金額yx2y2xy123∶∶∶∶13393.8419.14460.86∶∶∶∶2099.5249267289∶∶∶∶1148155078.44175678.34212391.94∶∶∶∶4407900.25620017128983521∶∶∶∶131790498056.20111910.38133188.54∶∶∶∶2410226合計(jì)12827.5745716073323.7752263399156173.99相關(guān)系數(shù)計(jì)算例表年份序號(hào)人均人均1393.824915507例計(jì)算結(jié)果相關(guān)系數(shù)相關(guān)系數(shù)為0.9987,顯示人均國(guó)民收入與人均消費(fèi)金額之間高度正相關(guān)。例計(jì)算結(jié)果相關(guān)系數(shù)相關(guān)系數(shù)計(jì)算例

【例】用例9.1數(shù)據(jù)計(jì)算出該商業(yè)銀行不良貸款、貸款余額、應(yīng)收貸款、貸款項(xiàng)目、固定資產(chǎn)投資額之間的相關(guān)系數(shù)如下:可以看出,不良貸款與貸款余額的相關(guān)系數(shù)最大,與固定資產(chǎn)投資額的相關(guān)系數(shù)最小。相關(guān)系數(shù)計(jì)算例

【例】用例9.1數(shù)據(jù)計(jì)算出該商業(yè)銀行不良貸三、相關(guān)系數(shù)的顯著性檢驗(yàn)根據(jù)樣本計(jì)算的相關(guān)系數(shù)r能否代表總體相關(guān)系數(shù),只有對(duì)其檢驗(yàn)以后才能下結(jié)論。因其具有一定的隨機(jī)性,樣本容量越小其可信程度越差。相關(guān)系數(shù)的顯著性檢驗(yàn)問(wèn)題可分為兩類:一是對(duì)總體相關(guān)系數(shù)是否等于0進(jìn)行檢驗(yàn);二是對(duì)總體相關(guān)系數(shù)是否等于某一給定的不為0的數(shù)值進(jìn)行檢驗(yàn)。這里只介紹第一類檢驗(yàn)。三、相關(guān)系數(shù)的顯著性檢驗(yàn)根據(jù)樣本計(jì)算的相關(guān)系數(shù)r能否代表總體相關(guān)系數(shù)的顯著性檢驗(yàn)(方法與步驟)

數(shù)學(xué)上可以證明,在X與Y都服從正態(tài)分布且的條件下,可以采用t檢驗(yàn)來(lái)確定r

的顯著性。檢驗(yàn)統(tǒng)計(jì)量t服從自由度為n-2的t分布,即檢驗(yàn)的步驟為:提出假設(shè):假設(shè)樣本是從一個(gè)不相關(guān)的總體中抽出的,即H0:;H1:0計(jì)算檢驗(yàn)統(tǒng)計(jì)量:根據(jù)給定的顯著性水平和自由度df=n-2查t分布表得t(n-2)的臨界值,并作出決策:若t>t(n-2),拒絕H0,表明r在統(tǒng)計(jì)上是顯著的,兩變量之間存在顯著線性關(guān)系;若t<t(n-2),接受H0,表明r在統(tǒng)計(jì)上是不顯著的。相關(guān)系數(shù)的顯著性檢驗(yàn)(方法與步驟)數(shù)學(xué)上可以證明,在X與Y相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)

【例】對(duì)前述用例9.2數(shù)據(jù)計(jì)算的人均消費(fèi)額與人均國(guó)民收入相關(guān)系數(shù)進(jìn)行顯著性檢(0.05)提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)顯著性水平=0.05,查t分布表得臨界值

t(n-2)=t0.025(13-2)=2.201

由于t=64.9809>t0.025(13-2)=2.201,所以拒絕H0,接受H1,即說(shuō)明人均消費(fèi)金額與人均國(guó)民收入之間的相關(guān)關(guān)系顯著。相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)【例】對(duì)前述用例9.2數(shù)相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)【例】對(duì)前述用例9.1數(shù)據(jù)計(jì)算的某大型商業(yè)銀行例不良貸款與貸款余額之間的相關(guān)系數(shù)進(jìn)行顯著性檢(0.05)提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量3.根據(jù)顯著性水平=0.05和自由度df=n-2=25-2=23查t分布表得t0.025(23)=2.0687由于t=7.5344>t0.05(23)=2.0687,所以拒絕H0,說(shuō)明不良貸款與貸款余額之間存在顯著正線性相關(guān)關(guān)系相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)【例】對(duì)前述用例9.1數(shù)據(jù)計(jì)相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)對(duì)前述9.1例某大型商業(yè)銀行各相關(guān)系數(shù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量數(shù)據(jù)如下,同學(xué)們可以自行檢驗(yàn)和分析相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析)對(duì)前述9.1例某大型商業(yè)銀行第二節(jié)一元線性回歸分析一、回歸分析的含義二、一元線性回歸模型及其參數(shù)的估計(jì)三、回歸直線擬合程度的評(píng)價(jià)四、一元線性回歸模型的檢驗(yàn)一個(gè)用Minitab做的回歸方程Regressionequation案例:判斷標(biāo)準(zhǔn)P<0.05/thread-7745-1-1.html

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論