相關分析與回歸分析課件_第1頁
相關分析與回歸分析課件_第2頁
相關分析與回歸分析課件_第3頁
相關分析與回歸分析課件_第4頁
相關分析與回歸分析課件_第5頁
已閱讀5頁,還剩93頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

相關分析和回歸分析相關分析和回歸分析

學習目標掌握相關分析及回歸分析的相關概念和思想;會計算相關系數(shù);能解決一元回歸分析的參數(shù)估計問題。學習目標掌握相關分析及回重難點重點:相關分析及回歸分析的相關概念和思想一元線性回歸分析最小二乘法難點:回歸系數(shù)的參數(shù)估計重難點重點:

利用相關與回歸分析技術改進民航服務質量降低服務成本

引入引入

據(jù)網(wǎng)友爆料,4月11日上午浦東機場有旅客擅自闖入機場滑行道造成多架外航飛機堵在后面不能移動。紅圈中為浦東機場上的攔機者。

航空公司編號航班正點率(%)x投訴次數(shù)(次)y181.821276.656376.685475.768573.874672.293771.272870.8122991.4181068.512510家航空公司航班正點率與顧客投訴次數(shù)數(shù)據(jù)航空公司航班正點率(%)x投訴次數(shù)(次)y181.82127相關分析與回歸分析課件相關分析相關分析一、相關關系和函數(shù)關系函數(shù)關系是指現(xiàn)象之間存在著確定性的嚴格的依存關系。在這種關系下,當個或一一組變量取一定的數(shù)值時,另一個變量就有一個確定的數(shù)值與之相對應,這種關系可以用一個數(shù)學表達式反映出來。函數(shù)關系一、相關關系和函數(shù)關系函數(shù)關系是指現(xiàn)象之間存在著確定性的嚴格

相關關系是指現(xiàn)象之間確實存在著的,但其數(shù)量表現(xiàn)又是不確定、不規(guī)則的一種相互依存關系。在這種關系下,當一個或一組變量取一定的數(shù)值時,與之相對應的另一個變量的數(shù)值是不能確定的,只是按照某種規(guī)律在一定范圍內變化。這種關系不能用嚴格的函數(shù)式來表示。相關關系相關關系是指現(xiàn)象之間確實存在著的,但其數(shù)量表現(xiàn)二、相關關系的種類1.按照相關關系涉及的變量(或因素)的多少,可以分為單相關、復相關和偏相關。2.按照變量之間相互關系的表現(xiàn)形式的不同,可以分為線性相關和非線性相關。3.按照變量之間的相互關系的方向不同,可以分為正相關和負相關。4.按照變量之間的相關程度、可以分為完全相關、不完全相關和不相關。二、相關關系的種類1.按照相關關系涉及的變量(或因素)的多少三、相關分析的主要內容1.確定現(xiàn)象之間有無相關關系,以及相關關系的表現(xiàn)形式2.確定相關關系的密切程度三、相關分析的主要內容1.確定現(xiàn)象之間有無相關關系,以及相關常見的相關分析工具:相關表相關圖:散點圖相關系數(shù)

四、相關分析的測定常見的相關分析工具:四、相關分析的測定年份2000200120022003200420052006全員勞動生產率(元/人)X381345825524816192741029110812平均工資(元/人)y77983010301261147315921942表8-5:某企業(yè)勞動生產率與平均工資情況相關表年份2000200120022003200420052006相關圖相關圖相關圖完全正相關不完全正相關不相關完全負相關不完全負相關曲線相關相關圖完全正相關不完全正相關相關系數(shù)

我們雖然可以通過相關表和相關圖,定性給出兩個變量之間相關關系,但是對于相關關系的具體的密切程度則無法度量,為此我們給出了相關系數(shù),定量研究這兩個變量之間的相關關系。相關系數(shù)我們雖然可以通過相關表和相關圖,定

相關系數(shù)X和Y之間的相關系數(shù)公式:xy的協(xié)方差x的標準差y的標準差xy的協(xié)方差x的方差y的方差積差法相關系數(shù)X和Y之間的相關系數(shù)公式:xy化簡的公式:化簡的公式:

相關系數(shù)的特點相關系數(shù)的取值在-1與1之間。|r|越大,表明變量間線性相關關系越強。當r=0時,表明X與Y沒有線性相關關系。當0<|r|<1時,表明X與Y存在一定的線性相關關系:若r>0表明X與Y為正相關;若r<0表明X與Y為負相關。當|r|=1時,表明X與Y完全線性相關:若r=1,稱X與Y完全正線性相關;若r=-1,稱X與Y完全負線性相關。相關系數(shù)的特點相關系數(shù)的取值在-1密切程度的判斷相關系數(shù)一般的判斷標準是:|r|<0.3稱為微弱相關;0.3≤|r|<0.5稱為低度相關;0.5≤|r|<0.8稱為顯著相關;0.8≤|r|<1稱為高度相關;|r|=1稱為完全相關。密切程度的判斷相關系數(shù)一般的判斷標準是:-101完全負相關不相關完全正相關

不完全負相關不完全正相關微弱相關低度相關低度相關顯著相關顯著相關高度相關高度相關-1-0.8-0.5-0.30.30.50.81相關系數(shù)分類圖-1年份xyx2y2xy20003813779145389696068412970327200145828302099472468890038030602002552410303051457610609005689720200381611261666019211590121102910212004927414738600707621697291366060220051029115921059046812534464163832722006108121942116899344377136420996904合計5245789074414612911242231973794906例子:P192表8-7x:全員勞動生產率y:平均工資年份xyx2y2xy20003813779145389696答:勞動生產率與平均工資之間存在著高度正線性相關。答:勞動生產率與平均工資之間存在著高度正線練習題企業(yè)編號固定資產價值x總產值y131852429101019320063844098155415913650292873146058121015169102212191012251624下表給出了某局各企業(yè)固定資產價值和總產值的相關數(shù)據(jù),請計算固定資產價值和總產值之間的關系。練習題企業(yè)編號固定資產價值x總產值y131852429101相關分析與回歸分析課件例:某局各企業(yè)固定資產和總產值統(tǒng)計表企業(yè)編號固定資產價值x總產值y1318524101124274576166632291010198281001038361927903200638400004070041276004409815167281664225333335541591317222583356937889565029282520048611844658567314605985963660251899708121015161464100229825619343609102212191044484148596112458181012251624150052526373761989400合計652598015668539108665777659156例:某局各企業(yè)固定資產和總產值統(tǒng)計表企業(yè)編號固定資產價值x總解:根據(jù)上表資料可得:兩者呈高度正相關。解:根據(jù)上表資料可得:兩者呈高度正相關。

使用相關系數(shù)的注意事項:▲X和Y是相互對稱的隨機變量,所以▲相關系數(shù)只反映變量間的線性相關程度,不能說明非線性相關關系?!嚓P系數(shù)不能確定變量的因果關系,也不能說明相關關系具體接近于哪條直線。使用相關系數(shù)的注意事項:▲X和Y是相互對稱的隨線性回歸線性回歸想一想相關系數(shù)能確定變量的因果關系嗎?能說明相關關系具體接近于哪條直線嗎?答:不能,為明確變量間聯(lián)系的具體數(shù)量規(guī)律,需要進行回歸分析。只有兩個變量的回歸稱為簡單回歸分析或者一元回歸分析。簡單回歸分析將變量X和Y區(qū)分為自變量和因變量。想一想相關系數(shù)能確定變量的因果關系嗎?能說明相關關系具體接近一、“回歸”的概念回歸的古典意義:高爾頓遺傳學的回歸概念

父母身高與子女身高的關系:

無論高個子或低個子的子女

都有向人的平均身高回歸的趨勢一、“回歸”的概念回歸的古典意義:

回歸的現(xiàn)代意義一個因變量對若干解釋變量依存關系的研究回歸的目的(實質):

由固定的自變量去估計因變量的平均值樣本總體自變量固定值估計因變量平均值回歸的現(xiàn)代意義一個因變量對若干解二、一元線性回歸模型回歸數(shù)學模型:該模型表明當x取某個數(shù)值時,y并不必然表現(xiàn)為一個確定的值,而是在f(x)附近波動,但其平均數(shù)在大量觀察下趨向于確定的值f(x)。二、一元線性回歸模型回歸數(shù)學模型:一元線性回歸

真實值:yi=a+bxi+εi預測值:?i=a+bxi散點圖一元線性回歸

真實值:預測值:散點圖一元線性回歸模型:其中:a為截距,b為直線斜率,也叫做y對x的回歸系數(shù)。它表示每變動一個單位所引起的的邊際變動量;一元線性回歸模型:其中:εi稱殘差(也稱為回歸誤差或預測誤差),表示除x外的其它次要因素形成的隨機擾動。當樣本容量較大時,正負干擾可相互抵消,所以可認為εi的均值為0。εi稱殘差(也稱為回歸誤差或預測誤差),表示除x外的其它次要回歸分析的主要任務是:1、確定回歸系數(shù)a,b2、判斷回歸方程是否合理回歸分析的主要任務是:

回歸系數(shù)的最小二乘估計最小二乘法的基本思想:

想一想:為什么不可以取Σεi或Σ|εi|?希望所估計的偏離實際觀察值的殘差越小越好??梢匀埐钇椒胶妥鳛楹饬颗c偏離程度的指標。即選擇a、b使得回歸系數(shù)的最小二乘估計最小二乘法的基本思想:想一想經(jīng)過推導可得:經(jīng)過推導可得:注:一般先求b,再求a回歸直線經(jīng)過點ei與xi、yi之間無相關關系注:一般先求b,再求axy回歸直線L經(jīng)過重心()則有:TSS=RSS+ESSxy回歸直線L經(jīng)過重心()則有:TSS=R【例8-5】根據(jù)例8-3資料:則直線回歸方程:請解釋一下回歸系數(shù)a,b的經(jīng)濟學含義【例8-5】根據(jù)例8-3資料:則直線回歸方程:請解釋一下回歸相關分析與回歸分析課件練習題企業(yè)編號固定資產價值x總產值y131852429101019320063844098155415913650292873146058121015169102212191012251624以總產值y為因變量,固定資產價值x為自變量,建立回歸直線方程y=a+bx。請進行參數(shù)估計。練習題企業(yè)編號固定資產價值x總產值y131852429101相關分析與回歸分析課件9.2.4估計標準誤差(standarderroroftheestimate)

因變量實際值與理論值離差的平均值

計算原理與能夠反映平均數(shù)代表性大小的標準差基本相同

定義公式為:

計算公式:=

S=9.2.4估計標準誤差(standarderrorof9.2.5判定系數(shù)(coefficientofdetermination)

用表示

用來測定回歸方程擬合數(shù)據(jù)的好壞程度

范圍在0與1之間

越大,線性回歸效果就越好

9.2.5判定系數(shù)(coefficientofdeterr越大

回歸直線代表性大

r越小

回歸直線代表性小小大r越大回歸直線代表性大r越小回歸直線代表性小小大相關分析和回歸分析相關分析和回歸分析

學習目標掌握相關分析及回歸分析的相關概念和思想;會計算相關系數(shù);能解決一元回歸分析的參數(shù)估計問題。學習目標掌握相關分析及回重難點重點:相關分析及回歸分析的相關概念和思想一元線性回歸分析最小二乘法難點:回歸系數(shù)的參數(shù)估計重難點重點:

利用相關與回歸分析技術改進民航服務質量降低服務成本

引入引入

據(jù)網(wǎng)友爆料,4月11日上午浦東機場有旅客擅自闖入機場滑行道造成多架外航飛機堵在后面不能移動。紅圈中為浦東機場上的攔機者。

航空公司編號航班正點率(%)x投訴次數(shù)(次)y181.821276.656376.685475.768573.874672.293771.272870.8122991.4181068.512510家航空公司航班正點率與顧客投訴次數(shù)數(shù)據(jù)航空公司航班正點率(%)x投訴次數(shù)(次)y181.82127相關分析與回歸分析課件相關分析相關分析一、相關關系和函數(shù)關系函數(shù)關系是指現(xiàn)象之間存在著確定性的嚴格的依存關系。在這種關系下,當個或一一組變量取一定的數(shù)值時,另一個變量就有一個確定的數(shù)值與之相對應,這種關系可以用一個數(shù)學表達式反映出來。函數(shù)關系一、相關關系和函數(shù)關系函數(shù)關系是指現(xiàn)象之間存在著確定性的嚴格

相關關系是指現(xiàn)象之間確實存在著的,但其數(shù)量表現(xiàn)又是不確定、不規(guī)則的一種相互依存關系。在這種關系下,當一個或一組變量取一定的數(shù)值時,與之相對應的另一個變量的數(shù)值是不能確定的,只是按照某種規(guī)律在一定范圍內變化。這種關系不能用嚴格的函數(shù)式來表示。相關關系相關關系是指現(xiàn)象之間確實存在著的,但其數(shù)量表現(xiàn)二、相關關系的種類1.按照相關關系涉及的變量(或因素)的多少,可以分為單相關、復相關和偏相關。2.按照變量之間相互關系的表現(xiàn)形式的不同,可以分為線性相關和非線性相關。3.按照變量之間的相互關系的方向不同,可以分為正相關和負相關。4.按照變量之間的相關程度、可以分為完全相關、不完全相關和不相關。二、相關關系的種類1.按照相關關系涉及的變量(或因素)的多少三、相關分析的主要內容1.確定現(xiàn)象之間有無相關關系,以及相關關系的表現(xiàn)形式2.確定相關關系的密切程度三、相關分析的主要內容1.確定現(xiàn)象之間有無相關關系,以及相關常見的相關分析工具:相關表相關圖:散點圖相關系數(shù)

四、相關分析的測定常見的相關分析工具:四、相關分析的測定年份2000200120022003200420052006全員勞動生產率(元/人)X381345825524816192741029110812平均工資(元/人)y77983010301261147315921942表8-5:某企業(yè)勞動生產率與平均工資情況相關表年份2000200120022003200420052006相關圖相關圖相關圖完全正相關不完全正相關不相關完全負相關不完全負相關曲線相關相關圖完全正相關不完全正相關相關系數(shù)

我們雖然可以通過相關表和相關圖,定性給出兩個變量之間相關關系,但是對于相關關系的具體的密切程度則無法度量,為此我們給出了相關系數(shù),定量研究這兩個變量之間的相關關系。相關系數(shù)我們雖然可以通過相關表和相關圖,定

相關系數(shù)X和Y之間的相關系數(shù)公式:xy的協(xié)方差x的標準差y的標準差xy的協(xié)方差x的方差y的方差積差法相關系數(shù)X和Y之間的相關系數(shù)公式:xy化簡的公式:化簡的公式:

相關系數(shù)的特點相關系數(shù)的取值在-1與1之間。|r|越大,表明變量間線性相關關系越強。當r=0時,表明X與Y沒有線性相關關系。當0<|r|<1時,表明X與Y存在一定的線性相關關系:若r>0表明X與Y為正相關;若r<0表明X與Y為負相關。當|r|=1時,表明X與Y完全線性相關:若r=1,稱X與Y完全正線性相關;若r=-1,稱X與Y完全負線性相關。相關系數(shù)的特點相關系數(shù)的取值在-1密切程度的判斷相關系數(shù)一般的判斷標準是:|r|<0.3稱為微弱相關;0.3≤|r|<0.5稱為低度相關;0.5≤|r|<0.8稱為顯著相關;0.8≤|r|<1稱為高度相關;|r|=1稱為完全相關。密切程度的判斷相關系數(shù)一般的判斷標準是:-101完全負相關不相關完全正相關

不完全負相關不完全正相關微弱相關低度相關低度相關顯著相關顯著相關高度相關高度相關-1-0.8-0.5-0.30.30.50.81相關系數(shù)分類圖-1年份xyx2y2xy20003813779145389696068412970327200145828302099472468890038030602002552410303051457610609005689720200381611261666019211590121102910212004927414738600707621697291366060220051029115921059046812534464163832722006108121942116899344377136420996904合計5245789074414612911242231973794906例子:P192表8-7x:全員勞動生產率y:平均工資年份xyx2y2xy20003813779145389696答:勞動生產率與平均工資之間存在著高度正線性相關。答:勞動生產率與平均工資之間存在著高度正線練習題企業(yè)編號固定資產價值x總產值y131852429101019320063844098155415913650292873146058121015169102212191012251624下表給出了某局各企業(yè)固定資產價值和總產值的相關數(shù)據(jù),請計算固定資產價值和總產值之間的關系。練習題企業(yè)編號固定資產價值x總產值y131852429101相關分析與回歸分析課件例:某局各企業(yè)固定資產和總產值統(tǒng)計表企業(yè)編號固定資產價值x總產值y1318524101124274576166632291010198281001038361927903200638400004070041276004409815167281664225333335541591317222583356937889565029282520048611844658567314605985963660251899708121015161464100229825619343609102212191044484148596112458181012251624150052526373761989400合計652598015668539108665777659156例:某局各企業(yè)固定資產和總產值統(tǒng)計表企業(yè)編號固定資產價值x總解:根據(jù)上表資料可得:兩者呈高度正相關。解:根據(jù)上表資料可得:兩者呈高度正相關。

使用相關系數(shù)的注意事項:▲X和Y是相互對稱的隨機變量,所以▲相關系數(shù)只反映變量間的線性相關程度,不能說明非線性相關關系。▲相關系數(shù)不能確定變量的因果關系,也不能說明相關關系具體接近于哪條直線。使用相關系數(shù)的注意事項:▲X和Y是相互對稱的隨線性回歸線性回歸想一想相關系數(shù)能確定變量的因果關系嗎?能說明相關關系具體接近于哪條直線嗎?答:不能,為明確變量間聯(lián)系的具體數(shù)量規(guī)律,需要進行回歸分析。只有兩個變量的回歸稱為簡單回歸分析或者一元回歸分析。簡單回歸分析將變量X和Y區(qū)分為自變量和因變量。想一想相關系數(shù)能確定變量的因果關系嗎?能說明相關關系具體接近一、“回歸”的概念回歸的古典意義:高爾頓遺傳學的回歸概念

父母身高與子女身高的關系:

無論高個子或低個子的子女

都有向人的平均身高回歸的趨勢一、“回歸”的概念回歸的古典意義:

回歸的現(xiàn)代意義一個因變量對若干解釋變量依存關系的研究回歸的目的(實質):

由固定的自變量去估計因變量的平均值樣本總體自變量固定值估計因變量平均值回歸的現(xiàn)代意義一個因變量對若干解二、一元線性回歸模型回歸數(shù)學模型:該模型表明當x取某個數(shù)值時,y并不必然表現(xiàn)為一個確定的值,而是在f(x)附近波動,但其平均數(shù)在大量觀察下趨向于確定的值f(x)。二、一元線性回歸模型回歸數(shù)學模型:一元線性回歸

真實值:yi=a+bxi+εi預測值:?i=a+bxi散點圖一元線性回歸

真實值:預測值:散點圖一元線性回歸模型:其中:a為截距,b為直線斜率,也叫做y對x的回歸系數(shù)。它表示每變動一個單位所引起的的邊際變動量;一元線性回歸模型:其中:εi稱殘差(也稱為回歸誤差或預測誤差),表示除x外的其它次要因素形成的隨機擾動。當樣本容量較大時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論