




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四講統(tǒng)計學中的相關分析*2第一節(jié)相關分析的意義和種類
一、相關分析的意義現(xiàn)象總體各單位可以有若干個數(shù)量標志,這些數(shù)量標志之間都有一定的關系,有的關系密切一些,有的關系松散一些。一般地說,如果總體中某個變量x的每一個數(shù)值,與總體中另一個變量y的數(shù)值有對應關系,我們則將其稱為二元總體。如果總體中某個變量x的每一個數(shù)值,與總體中另外若干個變量值有對應關系,則可將其稱為多元總體。我們僅討論二元總體的情形。*3對于二元總體,我們將關注以下幾個問題:兩個變量是不是存在關系,關系的密切程度如何,如商品銷售額是否與它的價格有關系,關系密切到什么程度等。
如果存在關系,那么這種關系的表現(xiàn)形式是什么。兩個變量是同方向變動,還是反方向變動;是線性變動,還是非線性變動。
怎樣根據一個變量的變動來估計另一個變量的變動。例如,從全社會固定資產投資額的變動來估計國內生產總值的變動,從居民收入的變動來估計零售商品銷售額的變動等。
相關分析就是研究兩個或兩個以上變量之間相互關系的統(tǒng)計分析方法。本章將通過分析二元總體的相關關系,來提供相關分析的一般模式。社會經濟現(xiàn)象總體中的兩個變量往往表現(xiàn)為因素標志和結果標志的的相互關系,即自變量和因變量之間的因果關系。自變量和因變量之間的關系可以概括為兩種類型,即函數(shù)關系和相關關系。函數(shù)關系是指客觀現(xiàn)象存在的一種完全確定的相互依存關系,即自變量的每一個取值,因變量會有唯一確定的數(shù)值與之對應。函數(shù)分析中的自變量和因變量有嚴格的區(qū)別,不能互換。相關關系是客觀現(xiàn)象存在的一種非確定的相互依存關系,即自變量的每一個取值,因變量由于受隨機因素影響,與其所對應的數(shù)值是非確定性的。相關分析中的自變量和因變量沒有嚴格的區(qū)別,可以互換。社會經濟的很多原發(fā)現(xiàn)象都是以相關關系表現(xiàn)出來的。相關關系不能用數(shù)學方程式表示,只能用相關表、相關圖及相關系數(shù)來分析。*4二、相關關系的概念
*5三、相關關系的種類
(一)單相關和復相關相關關系按影響因素的多少可分為單相關和復相關單相關就是結果標志只受一個因素標志影響的相關關系。即所謂二元總體的情形,有一個自變量和一個因變量。復相關就是結果標志受兩個或兩個以上因素標志影響的相關關系。即所謂多元總體的情形,一個因變量受多個自變量的影響。社會經濟現(xiàn)象大多是復相關關系。
相關關系按表現(xiàn)形態(tài)可分為線性相關和非線性相關,相關關系本身是一種在數(shù)量上不嚴格的依存關系。如果兩個變量所對應的取值在直角坐標系中近似于一條直線,則可將這兩個變量的關系稱為線性相關。如果兩個變量所對應的取值在直角坐標系中近似于一條曲線,則可將這兩個變量的關系稱為非線性相關。現(xiàn)實生活中大多數(shù)現(xiàn)象都表現(xiàn)為非線性相關。有時非線性相關現(xiàn)象可以轉化為線性相關現(xiàn)象來分析。例如,股票的長期K線圖呈現(xiàn)為曲線,但幾天或幾周的K線圖可視為直線。*6(二)線性相關和非線性相關*7(三)正相關和負相關相關關系按變動方向可分為正相關和負相關如果相關關系表現(xiàn)為因素標志和結果標志的數(shù)值在變動方向上保持一致,則稱為正相關。例如家庭收入增加,銀行儲蓄也會增加。如果相關關系表現(xiàn)為因素標志和結果標志的數(shù)值在變動方向上相反,則稱為負相關。例如企業(yè)的生產規(guī)模越大,產品的單位成本就越低?,F(xiàn)象總體表現(xiàn)出來的正相關或負相關是有一定條件和范圍的。某種現(xiàn)象不會永遠以正相關表現(xiàn),也不會永遠以負相關表現(xiàn)。例如,在一定的范圍內,增加施肥量能提高農作物的產量,但如果施肥過多,反而使莊稼只長葉子,不長果實,最后可能收獲量很少。*第八章相關分析8四、相關分析的主要內容
第一,判定相關關系呈現(xiàn)的形態(tài)、方向、以及相關關系的密切程度。判定的方法主要有繪制相關圖表和計算相關系數(shù)。第二,將相關關系轉化為函數(shù)關系來分析,即將變量的相關關系擬合成一個數(shù)學表達式。如果現(xiàn)象呈現(xiàn)線性相關,我們就采用配合直線方程式的方法;如果現(xiàn)象呈現(xiàn)非線性相關,我們就采用配合曲線方程式的方法。第三,確定因變量估計值誤差的程度。用數(shù)學表達式來代表變量之間的相關關系,必然會產生誤差,我們可計算這種估計標準誤差。估計標準誤差大,說明數(shù)學表達式的代表性差。反之,估計標準誤差小,說明數(shù)學表達式的代表性好,預測較為精確。相關分析的主要內容有:*9第二節(jié)相關圖表和相關系數(shù)一、相關表的編制相關表可分為簡單相關表和分組相關表。相關表屬于統(tǒng)計表的一種。(一)簡單相關表簡單相關表是資料未經分組的相關表,它是直接將原始數(shù)據中的自變量與因變量一一對應排列,并將變量值按從小到大排序形成的統(tǒng)計表。從表中可以直觀地看出:隨著產量的增加,單位成本有逐漸降低的趨勢,但不是與產量成等比例地降低,即產量與單位成本呈現(xiàn)負相關關系。產量與單位成本這種變動關系體現(xiàn)了產品生產的規(guī)模經濟效果。*10例8‐1某企業(yè)最近不斷擴大產品生產規(guī)模,每次擴大規(guī)模后產品產量與單位成本的相關資料如下表所示:某企業(yè)產品產量與單位成本資料
產量(萬件)x
單位成本(元)y
101632405060767267656359*11分組相關表是將原始數(shù)據進行分組而編制的統(tǒng)計表,它適用于資料數(shù)量很大的情況。下表為某地132戶居民人均收入與人均支出的分組相關表:(二)分組相關表分組相關表的自變量分組可以是單項式的,也可以是組距式的。本例為組距式,人均年收入以組中值表示。某地人均收入與人均支出的樣本資料
人均年收入(千元)組中值x(千元)戶數(shù)(戶)人均年支出y(千元)1.0以下1.0~2.02.0~3.03.0~4.04.0~5.05.0以上915233736120.51.52.53.54.55.50.51.21.82.23.64.0從表中可以看出:人均收入與人均支出的關系是正相關關系。即人均收入越高,相應的人均支出也越多。*12二、相關圖的繪制相關圖又稱散點圖,它是將相關表中的觀察值在平面直角坐標系中用坐標點描繪出來的圖形。相關圖可以用來直觀地分析兩個變量相關的分布狀況。本例人均收入x與人均支出y呈現(xiàn)正相關關系,且相關程度較為密切。
下圖根據以上分組相關表資料繪制的:4321
??
??
?
?
01234560123456*13三、相關系數(shù)的計算和分析相關系數(shù)是測定變量之間相關密切程度的比較完善的指標。單相關是最基本的相關關系,而測定單相關的相關系數(shù)是最基本的相關分析方法。
0123456(一)相關系數(shù)計算公式剖析
計算公式為:*第八章相關分析14
0123456式中:是x和y的協(xié)方差;是x的標準差;是y的標準差。
1.協(xié)方差的意義
協(xié)方差是一個積差平均數(shù),可用來度量x和y的相關關系。協(xié)方差有兩個作用:一是它的數(shù)值有正有負,可表明兩個變量是正相關還是負相關。二是協(xié)方差數(shù)值的大小可表明兩個變量相關程度的大小。*15
0123456協(xié)方差的正負號與相關方向的關系圖示:Ⅰ
ⅡⅢⅣ
當相關點分布在Ⅰ和Ⅲ兩部分時,協(xié)方差表現(xiàn)為正數(shù),說明是正相關;當相關點分布在Ⅱ和Ⅳ兩部分時,協(xié)方差表現(xiàn)為負數(shù),說明是負相關。從圖中可看出:*16
0123456協(xié)方差數(shù)值的大小與與變量相關程度大小的關系
如果相關點呈散亂分布狀態(tài),表明兩個變量的相關程度較低,這時因正負項相互抵消,所以絕對值很小,即協(xié)方差的絕對值很小,從而相關系數(shù)的絕對值也很小,表示x和y的相關程度較低。反之,若相關點的分布十分靠近某一直線,這時少有正負項抵消或沒有正負項抵消,則協(xié)方差的絕對值較大,表示x和y的相關程度密切。協(xié)方差是個隨機變量,可大可小,不能直接作為相關系數(shù)。*17
01234562.標準差的作用
標準差和的作用在于對協(xié)方差進行標準化處理:
由于
≥0所以
2r+2
≥0,r≥-1;-2r+2≥0,r≤1;-1≤r≤1或∣
r∣≤1當x和y完全相關時,且*18
0123456和
所以有:
即∣r∣=1,*19
0123456(二)相關系數(shù)的性質
相關系數(shù)只適用于線性相關的現(xiàn)象,其性質有如下幾點:1.當=1時,x和y為完全線性相關,即存在線性函數(shù)關系。
2.當r>0時,表示x和y為正相關;當r<
0時,為負相關。3.當=1時,即零相關,表示x和y沒有線性相關關系。零相關表示x和y不相關或存在非線性關系。4.當0<<1時,表示x和y存在著一定的線性相關關系。<0.3稱為微弱相關;<0.5稱為低度相關;0.3≤<0.8稱為顯著相關;0.5≤<1稱為高度相關;0.8≤相關系數(shù)的的基本公式比較煩瑣,其簡式計算方法有:
*20
0123456(三)相關系數(shù)的簡化計算公式
*21
0123456例8‐2試根據下表資料,計算產品產量與單位成本的相關系數(shù)。產品產量與單位成本相關系數(shù)計算表
產量(萬件)序號123456合計10163240506208單位成本(元)
76726765635940210025610241600250036009080577651844489422539693481271247601152214426003150354013346即產品產量與單位成本呈現(xiàn)高度負相關。*22
0123456例8‐3試根據下表分組資料計算某地人均收入與人均支出的相關系數(shù)。
某地人均收入與人均支出的樣本資料
人均年收入(千元)組中值x(千元)戶數(shù)(戶)人均年支出y(千元)1.0以下1.0~2.02.0~3.03.0~4.04.0~5.05.0以上915233736120.51.52.53.54.55.50.51.21.82.23.64.0將上表資料計算如下(先利用表格計算):合計
人均收入與人均支出相關系數(shù)計算表
0.51.52.53.54.55.50.51.21.82.23.64.013.3915233736121324.522.557.5129.5162.066.0442.04.518.041.481.4129.648.0322.92.327.0103.5284.9583.2264.01264.92.2533.75143.75453.25729.00363.001725.002.2521.6074.52179.08466.56192.00936.01*23
0123456然后可用簡化公式計算如下:式中:計算結果表明該地居民人均收入與人均支出呈高度正相關關系?;貧w分析就是對具有相關關系的兩個或兩個以上變量之間數(shù)量變化的一般關系進行測定,確立一個相應的數(shù)學表達式,以便從一個已知量來推測另一個未知量,為估算預測提供基礎的一種重要方法。*24第三節(jié)回歸分析一、回歸分析的意義相關分析是回歸分析的基礎,回歸分析是相關分析的深入。只有當兩個變量具有顯著相關的情況下,進行線性回歸分析才有意義。按自變量的個數(shù)分,有一元回歸分析和多元回歸分析。一元回歸方程中只有一個自變量,多元回歸方程中,有兩個或兩個以上自變量。按回歸線的形狀分,有線性回歸分析和非線性回歸分析。其中,線性回歸分析是最基本的。本章只介紹一元線性回歸分析,即直線回歸分析。*25回歸分析的種類:*26二、直線回歸方程(一)直線回歸方程的建立當x和y呈現(xiàn)完全線性相關時,設,則可用一元線性方程式表示:若兩個變量之間存在著顯著的相關關系,可在其相關圖的散點中引出一條模擬的直線,我們稱這條直線為估計回歸線,配合回歸線的方程式稱回歸方程。即:式中:yc表示y的估計值;a表示直線的起始值,在數(shù)學上稱為直線在縱軸上的截距;b表示自變量增加一個單位時因變量平均增加的值,數(shù)學上稱為斜率,這里被稱為回歸系數(shù)。a、b是兩個待定的參數(shù)。
最小二乘法的思路是:原始數(shù)據y與它的估計值yc之間存在離差,如果在求解出a、b的同時,能使這些離差的平方之和為最小,那么得到的回歸方程將是一條最能反映原始數(shù)據變化規(guī)律的理想直線。
*27用最小二乘法來求解直線方程式參數(shù)a、b
設以Q表示y對于yc的離差平方和,則有分別對a、b求一階偏導,并令一階偏導等于0,有*28整理后得解之可得最小二乘法的數(shù)學基礎是為最小和*29例8‐4根據下表資料擬合一直線方程,并估算產量為70萬件時的單位成本。產品產量與單位成本資料及計算表
產量(萬件)序號123456合計10163240506208單位成本(元)
767267656359402100256102416002500360090807601152214426003150354013346可計算如下:*30得直線趨勢方程:當產量為70萬件時,可估算產品的單位成本為:回歸系數(shù)b的經濟意義為:產品產量每增加1萬件,單位成本平均來說降低0.32元。注意:回歸系數(shù)b的正負號與同例的相關系數(shù)是相同的。
(元)注意:預測時只能給定自變量估算或預測因變量,不能給定因變量來估算或預測自變量。*31例8‐5根據下表資料試擬合一直線方程,并估算人均收入為6000元時,人均支出為多少?可計算如下:合計
某地人均收入與人均支出資料及計算表
0.51.52.53.54.55.50.51.21.82.23.64.013.3915233736121324.522.557.5129.5162.066.0442.04.518.041.481.4129.648.0322.92.327.0103.5284.9583.2264.01264.92.2533.75143.75453.25729.00363.001725.00人均收入人均支出戶數(shù)*32得直線趨勢方程:本例人均收入和人均支出的單位為千元,a為y軸上的截距;
b的經濟意義是人均收入每增加1000元,則當年的人均支出將增加750元。彈性系數(shù)是因變量增長率與自變量增長率的比率,它表明自變量增長1%時,因變量增長百分之多少。*33(二)彈性系數(shù)、相關系數(shù)和回歸系數(shù)的關系
1.彈性系數(shù)與回歸系數(shù)的關系式中,為彈性系數(shù);就是直線回歸方程中的斜率,即回歸系數(shù)b。因此有*第八章相關分析342.相關系數(shù)與回歸系數(shù)的關系因此有相關系數(shù)的基本公式為而回歸系數(shù)可表達為:注意:r和b在不等于0的情況下正負方向相同。*35第一,回歸分析是研究兩個變量之間的必須有因果關系,相關分析兩個變量之間不一定有因果關系。第二,回歸分析中因變量是隨機的,自變量不是隨機變量,可以給定。相關分析中兩個變量都可以是隨機變量。第三,回歸分析對于因果關系不甚明確或互為因果關系的兩個變量,可以求出y倚x的回歸方程,也可以求出x倚y的回歸方程:(三)回歸分析與相關分析特點比較
其中:*36而相關分析時兩個變量是對等的。若將兩個變量互換位置,則計算的相關系數(shù)與原來是相同的。
第四,回歸方程在進行預測時,只能給出自變量的數(shù)值來估計因變量的可能值,而不能給出因變量的數(shù)值來估計自變量的可能值?;貧w方程的逆向運算沒有現(xiàn)實意義。例如,可以根據降雨量來估計農作物的收獲量,但不能根據農作物的收獲量來估計降雨量。
值得注意的是:無論是相關分析還是回歸分析,在時間、空間上都是有限度的,超過了一定的范圍,所作的估算和預測就會失去實際意義。*37三、估計標準誤差(一)估計標準誤差的概念和計算利用回歸方程根據自變量來推算因變量的可能值是存在一定誤差的,這種誤差可以用估計標準誤差來表示。其計算公式為:
式中:Syx表示估計標準誤差,其下標yx表示y倚x的回歸;y表示因變量實際值;yc表示因變量估計值;分母n‐2稱為回歸估計自由度。因為回歸方程式中a、b兩個參數(shù)已知,所以失去了兩個自由度。*38計算估計標準誤差時,a、b兩個參數(shù)應多保留幾位小數(shù)點。特別是b這個參數(shù),它與一個較大的數(shù)x相乘,在公式中將起到杠桿作用,其微小的變化會引起估計標準誤差計算結果的很大波動。注意點某企業(yè)產品產量與單位成本資料
產量(萬件)x
單位成本(元)y
101632405060767267656359例8‐6已知根據下表資料擬合的直線方程為:試計算估計標準誤差。*39合計序號單位成本倚產量回歸方程及估計標準誤差計算表12345610163240506020876726765635940274.784872.891267.841665.316862.160859.0048—1.47670.79420.70830.10040.70430.00023.7841先利用表格計算:公式計算如下:*40估計標準誤差的簡式計算公式:現(xiàn)證明如下:由于:,和所以有:*第八章相關分析41
0123456例8‐7已知下表資料的直線方程為:試用簡式計算公式計算估計標準誤差。產品產量與單位成本資料及計算表
產量(萬件)序號123456合計10163240506208單位成本(元)
767267656359402577651844489422539693481271247601152214426003150354013346計算如下:*42(二)估計標準誤差和相關系數(shù)的關系總誤差、估計誤差、回歸誤差圖示:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 國際關系學院《工程力學與機械設計》2023-2024學年第二學期期末試卷
- 河北環(huán)境工程學院《護理學基礎技術(一)》2023-2024學年第二學期期末試卷
- 南京航空航天大學金城學院《細胞生物學課程設計》2023-2024學年第二學期期末試卷
- 廣州城市職業(yè)學院《戰(zhàn)略管理》2023-2024學年第二學期期末試卷
- 廣東新安職業(yè)技術學院《生物化學及實驗》2023-2024學年第二學期期末試卷
- 長春師范大學《汽車底盤構造與維修》2023-2024學年第二學期期末試卷
- 山西華澳商貿職業(yè)學院《移動通信技術》2023-2024學年第二學期期末試卷
- 大學生畢業(yè)實習計劃
- 大一新生軍訓心得感悟(28篇)
- 農村亂占耕地建房問題整治工作匯報范文(3篇)
- 地鐵施工管線保護培訓課件
- 農村公路質量監(jiān)督管理及措施
- 小學體積單位換算練習100道及答案
- 第7課《誰是最可愛的人》公開課一等獎創(chuàng)新教學設計-2
- 人音版四年級音樂下冊全冊教學設計教案表格式
- 骨盆骨折小講課護理課件
- 渣土車司機安全培訓
- 分布式儲能系統(tǒng)的成本效益評估
- 二次函數(shù)(最全的中考二次函數(shù)知識點總結)
- 建筑衛(wèi)生陶瓷生產英文資料
- 網絡意識形態(tài)安全
評論
0/150
提交評論