




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
相關(guān)及回歸分析第1頁,課件共53頁,創(chuàng)作于2023年2月第八章§8.1相關(guān)分析相關(guān)與回歸分析一、相關(guān)關(guān)系的概念現(xiàn)象之間的數(shù)量關(guān)系存在著兩種不同的類型:一種是函數(shù)關(guān)系,另一種是相關(guān)關(guān)系。第2頁,課件共53頁,創(chuàng)作于2023年2月函數(shù)關(guān)系指的是變量之間存在著的嚴(yán)格的依存關(guān)系,它們之間的關(guān)系值是固定的,對于某一變量的每一個值,都有另一個變量的完全確定的值與之相對應(yīng)。例如,圓的面積等于圓周率乘以半徑的平方。S=πr2第3頁,課件共53頁,創(chuàng)作于2023年2月相關(guān)關(guān)系是指變量之間確實存在的但關(guān)系值不固定的相互依存關(guān)系。在這種關(guān)系中,當(dāng)一個(或幾個)變量的值確定以后,另一個變量的值雖與它(或它們)有關(guān),但卻不能完全確定。這是一種非確定性的關(guān)系。例如,電視機的擁有率與人均收入水平有關(guān),但對于人均收入水平相同的地區(qū),其電視機的擁有率可能不盡相同。在客觀事物中,尤其是在經(jīng)濟現(xiàn)象中,相關(guān)關(guān)系普遍存在。統(tǒng)計很有必要對這種關(guān)系進(jìn)行研究。第4頁,課件共53頁,創(chuàng)作于2023年2月在相關(guān)關(guān)系中,通常,在相互聯(lián)系的現(xiàn)象之間存在著一定的因果關(guān)系,這時就把其中的起著影響作用的現(xiàn)象具體化,通過一定的變量反映出來,這樣的變量稱為自變量。由于受到自變量變動的影響而發(fā)生變動的變量稱為因變量。第5頁,課件共53頁,創(chuàng)作于2023年2月在相關(guān)關(guān)系中,有時兩個變量之間只存在相互聯(lián)系而并不存在明顯的因果關(guān)系。確定哪一個是自變量,哪一個是因變量,主要決定于研究的目的。例如,在糧食畝產(chǎn)量與施肥量之間,施肥量這一變量是自變量,畝產(chǎn)量這一變量是因變量。當(dāng)研究的是兩個變量之間的關(guān)系時,通常以符號X表示自變量,以符號Y表示因變量。第6頁,課件共53頁,創(chuàng)作于2023年2月二、相關(guān)關(guān)系的種類相關(guān)關(guān)系從不同的角度可以劃分成不同的類型。(一)正相關(guān)與負(fù)相關(guān)從相關(guān)的方向看,相關(guān)關(guān)系可以分為正相關(guān)和負(fù)相關(guān)。第7頁,課件共53頁,創(chuàng)作于2023年2月負(fù)相關(guān)是指相關(guān)變量之間的變化趨勢相反,即當(dāng)自變量的值增加,因變量的值隨之減少;當(dāng)自變量的值減少,因變量的值隨之增加。例如,產(chǎn)品產(chǎn)量與單位產(chǎn)品成本之間的關(guān)系。正相關(guān)是指相關(guān)變量之間的變化趨勢相同,即當(dāng)自變量的值增加,因變量的值也隨之增加;當(dāng)自變量的值減少,因變量的值也隨之減少。例如,汽車的使用年限與汽車的修理費用之間的關(guān)系。第8頁,課件共53頁,創(chuàng)作于2023年2月(二)線性相關(guān)與非線性相關(guān)從相關(guān)的形式上來看,相關(guān)關(guān)系可分為線性相關(guān)和非線性相關(guān)。線性相關(guān)也稱直線相關(guān),是指相關(guān)的兩個變量之間變化的趨勢呈線性或近似于線性。即自變量發(fā)生變動,因變量隨之發(fā)生變動,其增加或減少量是大致均等的,從圖形上看,其觀察點的分布近似表現(xiàn)為直線形式。第9頁,課件共53頁,創(chuàng)作于2023年2月非線性相關(guān)也稱曲線相關(guān),是指相關(guān)的兩個變量之間變化的趨勢呈非線性。即自變量發(fā)生變動,因變量隨之發(fā)生變動,但其增加或減少量不是均等的,從圖形上看,其觀察點的分布表現(xiàn)為各種曲線形式。第10頁,課件共53頁,創(chuàng)作于2023年2月(三)單相關(guān)和復(fù)相關(guān)從相關(guān)變量的個數(shù)來看,相關(guān)關(guān)系可分為單相關(guān)和復(fù)相關(guān)。單相關(guān)是指兩個變量之間的相關(guān)關(guān)系。復(fù)相關(guān)是三個或三個以上變量之間的相關(guān)關(guān)系。例如,僅僅考慮施肥量對產(chǎn)量的影響,這就是一種單相關(guān);如果除了施肥量之外,再考慮降雨量及深耕程度對產(chǎn)量的影響,則這種相關(guān)關(guān)系就是一種復(fù)相關(guān)。第11頁,課件共53頁,創(chuàng)作于2023年2月三、回歸與相關(guān)分析的概念在對變量之間存在的相關(guān)關(guān)系進(jìn)行分析研究時,最常用的方法就是回歸分析和相關(guān)分析?;貧w分析和相關(guān)分析是相互聯(lián)系的,它們從不同方面研究變量之間相關(guān)關(guān)系的本質(zhì)?;貧w分析是用來研究變量之間關(guān)系的可能形式的統(tǒng)計方法。它把兩個或兩個以上變量之間的變動關(guān)系加以模型化,用數(shù)學(xué)函數(shù)表達(dá)變量之間的關(guān)系。運用這種方法時,最終的目的通常在于預(yù)測或估計與某一個或某幾個變量的給定值相對應(yīng)的另一變量的數(shù)值。第12頁,課件共53頁,創(chuàng)作于2023年2月相關(guān)分析是研究如何計量變量之間關(guān)系強度的統(tǒng)計方法。它能確定變量之間相關(guān)的程度,即變量之間某種關(guān)系的確切程度有多大?;貧w分析和相關(guān)分析既有聯(lián)系,又有區(qū)別。就其研究對象來說,兩者都是研究變量之間的相關(guān)關(guān)系。但就彼此研究變量之間關(guān)系的性質(zhì)來看,兩者存在明顯的區(qū)別?;貧w分析中,必須將相關(guān)變量區(qū)分為自變量和因變量,以確定其關(guān)系的可能形式,所研究變量屬于非對等關(guān)系。相關(guān)分析中,計量變量之間關(guān)系的強度,不必區(qū)分自變量與因變量,所研究變量屬于對等的關(guān)系。第13頁,課件共53頁,創(chuàng)作于2023年2月四、相關(guān)圖表對現(xiàn)象變量之間是否存在相關(guān)關(guān)系以及存在怎樣的相關(guān)關(guān)系進(jìn)行分析、作出判斷,這是進(jìn)行回歸和相關(guān)分析的前提。通過編制相關(guān)表和相關(guān)圖,可以直觀地、大致地判斷現(xiàn)象變量之間是否存在相關(guān)關(guān)系以及關(guān)系的類型。第14頁,課件共53頁,創(chuàng)作于2023年2月(一)相關(guān)表相關(guān)表是表現(xiàn)現(xiàn)象變量之間相關(guān)關(guān)系的表格。例如,為研究商店人均月銷售額和利潤率的關(guān)系,調(diào)查10家商店取得10對數(shù)據(jù),以人均銷售額為自變量,利潤率為因變量,編制簡單相關(guān)表如下表。第15頁,課件共53頁,創(chuàng)作于2023年2月人均銷售額與和利潤率相關(guān)表編號人均月銷售額(千元)利潤率(%)1234567891013345667783.06.26.68.110.412.612.316.316.818.5第16頁,課件共53頁,創(chuàng)作于2023年2月(二)相關(guān)圖所謂相關(guān)圖,是把相關(guān)的兩個變量之間的關(guān)系在平面直角坐標(biāo)(第一象限)中反映出來。通常將自變量(x)置于橫軸上,因變量(y)置于縱軸上,而將兩個變量相對應(yīng)的變量值用坐標(biāo)點形式描繪出來。相關(guān)圖就是用相關(guān)點的分布狀況來描述相關(guān)關(guān)系的,所以又稱為散點圖。根據(jù)相關(guān)圖,可以直觀地看出變量之間相關(guān)關(guān)系的模式。第17頁,課件共53頁,創(chuàng)作于2023年2月例如,前述人均月銷售額與利潤率的關(guān)系,可用相關(guān)圖表示如下:利潤率(%)人均銷售額(千元)1
20人均銷售額與利潤率相關(guān)圖51015
2
3
84
567第18頁,課件共53頁,創(chuàng)作于2023年2月從圖中,我們可以清楚地看出,這兩個變量之間相關(guān)的方向(即正相關(guān))以及相關(guān)的具體形式(直線相關(guān))(a)直線關(guān)系(b)反直線關(guān)系(c)正曲線關(guān)系第19頁,課件共53頁,創(chuàng)作于2023年2月(e)較分散的
反直線關(guān)系(d)反曲線關(guān)系(f)沒有關(guān)系x與y的一些可能關(guān)系的散點圖第20頁,課件共53頁,創(chuàng)作于2023年2月上圖說明了相關(guān)圖中的一些可能關(guān)系。圖(a)和(b)表示的是正的和反的直線關(guān)系,即正線性相關(guān)和負(fù)線性相關(guān)。圖(c)和(d)分別表示的是正的和反的曲線關(guān)系,即正非線性相關(guān)和負(fù)非線性相關(guān)。圖(e)中是散布域很寬的反直線關(guān)系。散布域越寬,則表明變量之間的聯(lián)系程度越差。圖(f)中的圖象表明兩個變量之間沒有什么關(guān)系。第21頁,課件共53頁,創(chuàng)作于2023年2月§8.2相關(guān)系數(shù)相關(guān)分析是用以說明變量之間相關(guān)程度的統(tǒng)計工具。相關(guān)分析常常與回歸分析聯(lián)合使用,以衡量回歸方程所表示的因變量變化的精確度如何。相關(guān)分析也可單獨用于衡量變量之間的聯(lián)系程度。本節(jié)我們討論兩個變量之間線性相關(guān)程度問題。兩個變量之間線性相關(guān)程度的描述通常采用相關(guān)系數(shù)。第22頁,課件共53頁,創(chuàng)作于2023年2月一、相關(guān)系數(shù)的意義我們回過頭來考察一下線性回歸中指標(biāo)y的值yi與回歸估計值yi的離差平方和。記于是有:Q=Lyy(1r2)r稱為相關(guān)系數(shù)。它是在線性相關(guān)條件下用來說明兩個變量之間相關(guān)關(guān)系密切程度的指標(biāo)。第23頁,課件共53頁,創(chuàng)作于2023年2月因為Q≥0,Lyy≥0,故相關(guān)系數(shù)有一個重要性質(zhì):|r|≤1r=1(1)1<r=0(2)r=0(3)r=0(4)0<r<1(5)r=1(6)相關(guān)圖與相關(guān)系數(shù)經(jīng)驗關(guān)系第24頁,課件共53頁,創(chuàng)作于2023年2月由于Lyy對于一組實測數(shù)據(jù)來講是定值,故由Q=Lyy(1r2)可知,當(dāng)|r|較大接近于1時,離差平方和Q就較小而接近于0,此時,y與x高度相關(guān)。特別當(dāng)|r|=1時,稱它們是完全相關(guān)的,上圖(1)、(6)所示。當(dāng)|r|較小而接近于0時,Q就大,y與x的相關(guān)關(guān)系很弱,特別當(dāng)r=0時,稱它們線性無關(guān)。如上圖(3)、(4)所示第25頁,課件共53頁,創(chuàng)作于2023年2月由于Lxy可正可負(fù),所以相關(guān)系數(shù)r也可正可負(fù)。若r>0則稱y與x正相關(guān),如上圖(5)、(6)所示。此時,隨著x的增大(或減小),y將呈現(xiàn)增大(或減小)的趨勢。特別對于上圖(6)的情形,由于r=1,故稱完全正相關(guān)。若r<0,則稱y與x負(fù)相關(guān),如上圖(1)、(2)所示。此時,隨著x的增大(或減小),y將呈現(xiàn)減小(或增大)的趨勢。特別對于圖(1)的情形。由于r=1,故稱為完全負(fù)相關(guān)。第26頁,課件共53頁,創(chuàng)作于2023年2月應(yīng)當(dāng)注意,相關(guān)系數(shù)r只表明x與y之間的線性關(guān)系的密切程度和方向。當(dāng)r很小甚至為0時,只表明x與y之間的線性關(guān)系不密切,或不存在線性關(guān)系,并不表示x與y之間就沒有關(guān)系,可能二者之間有非線性關(guān)系。如上圖(4)所示,x與y之間就存在著曲線關(guān)系。第27頁,課件共53頁,創(chuàng)作于2023年2月二、相關(guān)系數(shù)的計算我們已經(jīng)知道,相關(guān)系數(shù)的公式為:第二節(jié)中我們介紹了離差乘積的和式:第28頁,課件共53頁,創(chuàng)作于2023年2月于是有:第29頁,課件共53頁,創(chuàng)作于2023年2月如果將分子分母同乘以n,又可得:根據(jù)第二節(jié)中煉鋼廠鋼液含碳量與精煉時間資料,可計算相關(guān)系數(shù)。那里,我們已經(jīng)求得:第30頁,課件共53頁,創(chuàng)作于2023年2月于是其相關(guān)系數(shù)為:計算得出r=0.9892,表明精煉時間和含碳量之間為正相關(guān)關(guān)系。而且r值接近于1,表示兩者關(guān)系很密切。第31頁,課件共53頁,創(chuàng)作于2023年2月三、線性相關(guān)的顯著性檢驗回歸方程在一定程度上揭示了變量之間的內(nèi)在聯(lián)系,但它所揭示的規(guī)律性是否顯著?只有當(dāng)相關(guān)系數(shù)r的絕對值大到一定程度時,用回歸直線表示x與y之間的關(guān)系,并說明相關(guān)系數(shù)r顯著,配置回歸直線才有意義。那么|r|究竟大到多大時,x與y之間才存在線性關(guān)系,配置回歸直線才有意義呢?第32頁,課件共53頁,創(chuàng)作于2023年2月為了給出相關(guān)系數(shù)的定量刻劃,相關(guān)系數(shù)顯著性檢驗表給出了顯著性水平a為0.10,0.05,0.02,0.01,0.001時的臨界值。如果相關(guān)系數(shù)觀測值r大于相應(yīng)的臨界值,則認(rèn)為y與x的線性相關(guān)關(guān)系是顯著的,配置回歸直線有意義。否則便認(rèn)為y與x的線性相關(guān)關(guān)系不顯著。查表時,使用的自由度為nm1。其中n為樣本容量,m為參與試驗的因素個數(shù),因而,在一元回歸場合下查表用自由度為n2。第33頁,課件共53頁,創(chuàng)作于2023年2月對于第二節(jié)中的資料,我們算得相關(guān)系數(shù)r=0.9892。若a=0.01,查表得臨界值:r(0.01;102)=0.7646|0.9892|>r(0.01;102)所以,第二節(jié)中求得的回歸方程所表達(dá)的精煉時間y與鋼液含碳百分比之間的線性關(guān)系對于a=0.01是顯著的,也就是說配置的回歸方程有意義。這種顯著性通常稱為高度顯著。第34頁,課件共53頁,創(chuàng)作于2023年2月§8.3一元一次線性回歸一、回歸直線的確定如果變量x和y相關(guān),并且從相關(guān)圖表中可以看出它們之間大致形成一種直線關(guān)系,我們就可在相關(guān)圖上求出一條與各點最相配合的直線。第35頁,課件共53頁,創(chuàng)作于2023年2月由于這些點所代表的若干對數(shù)據(jù)——觀察值,只是相互有一定關(guān)系的變量x、y的總體中的一個樣本,故這樣求出的直線是總體回歸直線的估計線。在估計線上的點的縱坐標(biāo)是相應(yīng)于x的y的估計值。y=a+bx如果這個y的估計值用y表示,則估計線的方程可寫為第36頁,課件共53頁,創(chuàng)作于2023年2月這叫做樣本回歸直線。它是y對x的回歸線,表明y對x的平均關(guān)系。式中x為受控制的自變量,通常由研究者事先選定數(shù)值。a為樣本回歸直線y的截距,它是樣本回歸直線通過縱軸的點的y坐標(biāo);b為樣本回歸直線的斜率,它表示當(dāng)x增加一個單位時y的平均增加數(shù)量,b又稱回歸系數(shù)。第37頁,課件共53頁,創(chuàng)作于2023年2月如何確定回歸直線方程呢?也就是說怎樣確定方程中的參數(shù)a、b呢?若用(xi,yi)(i=1,2,…n)表示n組觀察值,則對任意給定的xi
,可得y的估計值為這些數(shù)值同實際值yi之間存在著誤差;yi=a+bxii=yi
yi=
yi
a
bxi第38頁,課件共53頁,創(chuàng)作于2023年2月Q(a,b)=2=(yabx)2為最小。這樣便把尋找適當(dāng)直線問題轉(zhuǎn)化為使Q(a,b)達(dá)到最小條件下求出a、b的問題。在回歸分析中,人們普遍采用的是最小二乘法原則。根據(jù)最小二乘法的原則,欲使所求回歸直線y=a+bx最適合于實際資料,必須使每個xi對應(yīng)的指標(biāo)實測值yi與回歸直線確定的估計值yi的離差平方之和為最小,即必須使第39頁,課件共53頁,創(chuàng)作于2023年2月因為Q(a,b)是a、b的非負(fù)二元函數(shù),所以其最小值無疑是存在的。根據(jù)數(shù)學(xué)中的極值原理,令:滿足上述條件的a、b即為所求的未知參數(shù)。由化簡得(yabx)=0(yabx)x=0第40頁,課件共53頁,創(chuàng)作于2023年2月即:y=na+bxxy=ax+bx2上述方程組稱為標(biāo)準(zhǔn)方程組。解之,得:a=ybx第41頁,課件共53頁,創(chuàng)作于2023年2月因此即可確定回歸方程式為:y=a+bx這個方程稱為在給定樣本條件下的一元線性回歸方程,對應(yīng)的直線稱為樣本回歸直線。顯然,回歸方程對于不同的樣本是有差別的,因而,它具有經(jīng)驗的特征,所以在實用上,也將它叫做經(jīng)驗公式。為了簡化上述回歸系數(shù)b的表達(dá)形式,引入如下離差乘積的和式:Lxy=(xx)(yy)第42頁,課件共53頁,創(chuàng)作于2023年2月Lxx=(xx)2于是,回歸系數(shù)可簡化為為了相關(guān)性檢驗的需要,順便引入關(guān)于y的離差平方和:Lyy=(yy)2第43頁,課件共53頁,創(chuàng)作于2023年2月求回歸方程式的系數(shù)往往是通過列表進(jìn)行的。這里,我們以下表資料為倒,通過求某鋼鐵廠煉鋼精煉時間對含碳量的回歸方程,說明回歸方程的確定。10.9100爐次含碳量(%)
(x)精煉時間(分)
(y)某鋼鐵廠十個爐次鋼液含碳量和精煉時間10234567892.01.01.21.41.51.61.71.81.9105235130145170175190190220第44頁,課件共53頁,創(chuàng)作于2023年2月可以看出,x與y之間的關(guān)系近似為直線關(guān)系。我們可以對其配合一條回歸直線。為計算回歸方程的系數(shù)a、b,我們先對原始數(shù)據(jù)進(jìn)行加工。第45頁,課件共53頁,創(chuàng)作于2023年2月yx2y2xy1001051301451701751901902202350.811.001.441.962.252.562.893.243.614.001000011025169002102528900306253610036100484005522590105156203255280323342418470166023.762943002642爐次x123456789100.91.01.21.41.51.61.71.81.92.015.0原始數(shù)據(jù)加工表第46頁,課件共53頁,創(chuàng)作于2023年2月于是:第47頁,課件共53頁,創(chuàng)作于2023年2月所以:故精煉時間關(guān)于含碳量的回歸方程為:y=14.9525+120.635x第48頁,課件共53頁,創(chuàng)作于2023年2月計算結(jié)果表明,這個方程顯示著鋼水溶液的含碳量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 細(xì)長身水口鉗行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報告
- 溫泉旅游開發(fā)項目可行性研究報告
- 2025年度能源管理系統(tǒng)承包合同規(guī)范
- 2025年鐵藤水果籃行業(yè)深度研究分析報告
- 2025年聲學(xué)海流計項目發(fā)展計劃
- 《食物到哪里去了》教學(xué)設(shè)計-2023-2024學(xué)年青島版科學(xué)三年級下冊
- 2025年煤炭清潔高效利用項目節(jié)能評估報告(節(jié)能專)
- 2025年水性環(huán)氧中涂材料項目投資可行性研究分析報告-20241226-171913
- 2025年真空罐項目建議書
- 2024-2030年中國新型高效飼料行業(yè)發(fā)展監(jiān)測及投資戰(zhàn)略規(guī)劃報告
- DeepSeek1天開發(fā)快速入門
- 2025書記員招聘考試題庫及參考答案
- 2024-2025年第二學(xué)期數(shù)學(xué)教研組工作計劃
- 2025輔警招聘公安基礎(chǔ)知識題庫附含參考答案
- GB/T 44927-2024知識管理體系要求
- 2025年環(huán)衛(wèi)工作計劃
- 品質(zhì)巡檢培訓(xùn)課件
- 初驗整改報告格式范文
- 2023青島版數(shù)學(xué)三年級下冊全冊教案
- 建設(shè)工程總承包EPC建設(shè)工程項目管理方案1
- T-CSUS 69-2024 智慧水務(wù)技術(shù)標(biāo)準(zhǔn)
評論
0/150
提交評論