版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 v相關(guān)關(guān)系是指現(xiàn)象之間客觀存在的,在數(shù)量變化上受隨機(jī)因素影響的,非確定性的相互依存關(guān)系。相關(guān)分析的主要任務(wù)就是測(cè)定現(xiàn)象間是否存在相關(guān)關(guān)系,若存在,其相關(guān)程度如何。我們主要研究線(xiàn)性相關(guān)問(wèn)題,測(cè)定線(xiàn)性相關(guān)程度的主要指標(biāo)是相關(guān)系數(shù),計(jì)算相關(guān)系數(shù)的基本方法是積差法及其簡(jiǎn)捷法。v回歸分析就是對(duì)具有相關(guān)關(guān)系的變量之間的數(shù)量變化關(guān)系進(jìn)行測(cè)定,確定一個(gè)與之相應(yīng)的數(shù)學(xué)表達(dá)式,以便進(jìn)行估計(jì)和預(yù)測(cè)的一種統(tǒng)計(jì)方法?;貧w分析的內(nèi)容:(1)建立回歸方程;(2)進(jìn)行相關(guān)關(guān)系檢驗(yàn);(3)利用回歸模型進(jìn)行預(yù)測(cè)?;貧w分析根據(jù)自變量多少,可分為一元回歸和多元回歸;根據(jù)現(xiàn)象間依存關(guān)系的形式,可分為線(xiàn)性回歸和非線(xiàn)性回歸。這里要求重點(diǎn)
2、掌握一元線(xiàn)性回歸分析。 v相關(guān)關(guān)系是指現(xiàn)象之間客觀存在的,在數(shù)量變化上受隨機(jī)因素的影響,非確定性的相互依存關(guān)系。v相關(guān)關(guān)系與函數(shù)關(guān)系 1)相關(guān)關(guān)系的范圍比函數(shù)關(guān)系的范圍更廣,函數(shù)關(guān)系可以說(shuō)是相關(guān)關(guān)系的一個(gè)特例。 2)二者之間也有聯(lián)系,并沒(méi)有嚴(yán)格的界限。一方面,有些現(xiàn)象從理論上說(shuō)存在著函數(shù)關(guān)系,可是在進(jìn)行多次觀察和測(cè)量時(shí),由于存在測(cè)量誤差等原因,實(shí)際得到的數(shù)據(jù)往往也是非確定性的,這時(shí)就表現(xiàn)為相關(guān)關(guān)系。另一方面,有些變量之間盡管沒(méi)有確定性的函數(shù)關(guān)系,但為了找到相關(guān)關(guān)系的一般數(shù)量表現(xiàn)形式,又往往需要使用函數(shù)關(guān)系的近似表達(dá)式。而且當(dāng)我們對(duì)現(xiàn)象之間的內(nèi)在聯(lián)系和規(guī)律性了解得比較清楚時(shí),相關(guān)關(guān)系又可能轉(zhuǎn)化為
3、函數(shù)關(guān)系。 相關(guān)關(guān)系的概念 v相關(guān)關(guān)系依據(jù)不同的劃分方式可以分成不同的類(lèi)型: 1)按相關(guān)的因素多少分為單相關(guān)和復(fù)相關(guān) 2)按相關(guān)的形式不同分為直線(xiàn)相關(guān)和曲線(xiàn)相關(guān) 3)按相關(guān)變量變化的方向不同分為正相關(guān)和負(fù)相關(guān) 4)按相關(guān)的程度分為完全相關(guān)、不完全相關(guān)和不相關(guān)2)按相關(guān)的形式不同分為直線(xiàn)相關(guān)和曲線(xiàn)相關(guān) v相關(guān)分析的具體內(nèi)容主要有四個(gè)方面 : 1)揭示現(xiàn)象之間是否具有相關(guān)關(guān)系。 2)測(cè)定現(xiàn)象相關(guān)關(guān)系的密切程度。 3)構(gòu)建現(xiàn)象相關(guān)關(guān)系的數(shù)學(xué)模型。 4)測(cè)定因變量估計(jì)值的誤差程度。相關(guān)分析的類(lèi)型與內(nèi)容 1.1.3相關(guān)分析的內(nèi)容 v相關(guān)分析的具體內(nèi)容主要有四個(gè)方面 : 1)揭示現(xiàn)象之間是否具有相關(guān)關(guān)系。
4、 2)測(cè)定現(xiàn)象相關(guān)關(guān)系的密切程度。 3)構(gòu)建現(xiàn)象相關(guān)關(guān)系的數(shù)學(xué)模型。 4)測(cè)定因變量估計(jì)值的誤差程度。 第二節(jié) 相關(guān)關(guān)系的判斷與測(cè)定v2.1相關(guān)關(guān)系的判斷v2.2相關(guān)關(guān)系的測(cè)定 v定性分析:對(duì)現(xiàn)象進(jìn)行定性分析,就是根據(jù)現(xiàn)象質(zhì)的規(guī)定性,運(yùn)用理論知識(shí)、專(zhuān)業(yè)知識(shí)、實(shí)際經(jīng)驗(yàn)來(lái)進(jìn)行判斷和分析。定性分析是進(jìn)行相關(guān)分析的基礎(chǔ),在此基礎(chǔ)上,根據(jù)需要通過(guò)編制相關(guān)表和繪制相關(guān)圖來(lái)進(jìn)行分析。 v定量分析 :利用相關(guān)圖和相關(guān)表進(jìn)行相關(guān)關(guān)系的判斷 1)相關(guān)表.相關(guān)表是一種反映變量之間相關(guān)關(guān)系的統(tǒng)計(jì)表。 例1:某公司A產(chǎn)品廣告費(fèi)與銷(xiāo)售收入相關(guān)表 年 份 12345678910年廣告費(fèi)(萬(wàn)元) 2234566677年銷(xiāo)售收
5、入(萬(wàn)元) 50515253535455565657相關(guān)關(guān)系的判斷 根據(jù)對(duì)自變量是否分組,相關(guān)表分為簡(jiǎn)單相關(guān)表和分組相關(guān)表。上例中即為簡(jiǎn)單相關(guān)表.分組相關(guān)表是將原始數(shù)據(jù)進(jìn)行分組編制而成的相關(guān)表。分組相關(guān)表又分為單變量分組相關(guān)表和雙變量分組相關(guān)表。 例2:某公司A產(chǎn)品廣告費(fèi)與銷(xiāo)售收入單變量分組相關(guān)表 年廣告費(fèi)(萬(wàn)元) 年數(shù)累計(jì) 年銷(xiāo)售收入(萬(wàn)元) 234567 211132 505253535556 例3:某公司A產(chǎn)品廣告費(fèi)與銷(xiāo)售收入雙變量分組相關(guān)表 年廣告費(fèi)(萬(wàn)元) 年銷(xiāo)售收入(萬(wàn)元) 合計(jì) 5051515252535354545555565657765432 2111122231112合計(jì)
6、211112210 2)相關(guān)圖.相關(guān)圖也稱(chēng)相關(guān)散點(diǎn)圖或散點(diǎn)圖,是將具有相關(guān)關(guān)系的兩個(gè)變量值描繪在坐標(biāo)圖上,以橫軸表示自變量,縱軸表示因變量,按兩變量的對(duì)應(yīng)值標(biāo)出坐標(biāo)點(diǎn)的分布狀況的統(tǒng)計(jì)圖。 例4:某公司A產(chǎn)品廣告費(fèi)與銷(xiāo)售收入相關(guān)圖 廣告費(fèi)用與銷(xiāo)售收入依存關(guān)系散點(diǎn)圖4950515253545556575802468系列1 v相關(guān)系數(shù) 1)概念:相關(guān)系數(shù)是指在直線(xiàn)相關(guān)的條件下,說(shuō)明兩個(gè)現(xiàn)象之間相關(guān)關(guān)系緊密程度的統(tǒng)計(jì)分析指標(biāo),常用表示。 2)相關(guān)系數(shù)的取值范圍及其表達(dá)的相關(guān)程度: (1) 的取值范圍為:1 1。的絕對(duì)值越接近于1,表明相關(guān)程度越高;越接近于0,表明相關(guān)程度越低。 (2) =1或 =1,
7、表明兩現(xiàn)象完全相關(guān)。 (3) = 0,表明兩變量之間無(wú)直線(xiàn)相關(guān)關(guān)系。 (4)0,現(xiàn)象呈正相關(guān);0,現(xiàn)象呈負(fù)相關(guān)。 實(shí)踐中,一般將現(xiàn)象的相關(guān)關(guān)系分為四個(gè)等級(jí): 0.3表示微弱相關(guān),0.3 0.5表示低度相關(guān);0.5 0.8表示顯著相關(guān); 0.8表示高度相關(guān)。 rrrrrrrrrrrr相關(guān)關(guān)系的測(cè)定 3)相關(guān)系數(shù)的計(jì)算 相關(guān)系數(shù)通常采用積差法計(jì)算,其計(jì)算公式為:式中 表示相關(guān)系數(shù); 表示自變量; 表示因變量。該公式也可寫(xiě)成: 式中 為自變量的標(biāo)準(zhǔn)差; 為因變量的標(biāo)準(zhǔn)差; 為自變量與因變量的協(xié)方差。由此可知,相關(guān)系數(shù)是兩個(gè)變量協(xié)方差與兩個(gè)變量標(biāo)準(zhǔn)差乘積 的比。 22)()()(yyxxyyxxrii
8、iirxyyxxyr22)(1xxnx2)(1yyny)(12yyxxnxy 例5 利用下表中的資料計(jì)算相關(guān)系數(shù)。 積差法相關(guān)系數(shù)計(jì)算表 年份廣告費(fèi)(萬(wàn)元)銷(xiāo)售收入(萬(wàn)元)123456789102234566677 505152535354555656572.82.81.80.80.21.21.21.22.22.2 3.72.61.70.70.70.30.30.32.33.3 7.847.842.240.640.041.441.441.444.844.84 13.696.760.890.490.490.090.091.695.2910.89 10.367.283.060.560.140.360
9、.361.565.067.26 合計(jì) 4853732.642.3736xx yy7 .53y8 . 4x2)(xx 2)(yy )(yyxx 解:數(shù)據(jù)計(jì)算過(guò)程如上表所示,將其中數(shù)據(jù)代入積差法公式得 相關(guān)系數(shù) = 0.9687 ,說(shuō)明A產(chǎn)品年廣告費(fèi)用與年銷(xiāo)售收入之間存在高度相關(guān)關(guān)系。 為減輕計(jì)算工作量,可將上述相關(guān)系數(shù)公式整理成如下簡(jiǎn)捷計(jì)算公式: 例6 利用下表中的資料用簡(jiǎn)捷法計(jì)算相關(guān)系數(shù) 9687. 01649.37365092. 67096. 53637.426 .3236rr 2222)()(yynxxnyxxynr 相關(guān)系數(shù)簡(jiǎn)捷計(jì)算表 年份 年廣告費(fèi)(萬(wàn)元) 年銷(xiāo)售收入(萬(wàn)元) 1234
10、5678910 2234566677 50515253535455565657 44916253636364949 2500260127042809280929163025313631363249 100102156212265324330336392399 合計(jì) 48 537 264 28885 2616 xy2x2yxy 解:依據(jù)上表中的資料利用簡(jiǎn)捷公式計(jì)算得: =0.9552288369288850230426402577626160537288851048264105374826161022r 回歸分析變變量量間間的的關(guān)關(guān)系系確定性關(guān)系或函數(shù)關(guān)系y=f(x)人的身高和體重人的身高和體重
11、家庭的收入和消費(fèi)家庭的收入和消費(fèi)商品的廣告費(fèi)和銷(xiāo)售額商品的廣告費(fèi)和銷(xiāo)售額糧食的產(chǎn)量和施肥量糧食的產(chǎn)量和施肥量股票的價(jià)格和時(shí)間股票的價(jià)格和時(shí)間學(xué)生的期中和期末考試成績(jī)學(xué)生的期中和期末考試成績(jī), ,非確定性關(guān)系xY實(shí)變量實(shí)變量隨機(jī)變量隨機(jī)變量非確定性關(guān)系非確定性關(guān)系回歸分析模型回歸分析模型(x,y)采集樣本信息(xi,yi)回歸分析散點(diǎn)圖回歸方程回歸方程的顯著性檢驗(yàn)對(duì)現(xiàn)實(shí)進(jìn)行預(yù)測(cè)與控制基本思想基本思想如果數(shù)學(xué)關(guān)系式描寫(xiě)了一個(gè)變量與另一個(gè)變量之間的關(guān)系,則稱(chēng)其為一元回歸分析一元回歸分析;如果數(shù)學(xué)關(guān)系式描寫(xiě)了一個(gè)變量與另多個(gè)變量之間的關(guān)系,則稱(chēng)其為多元回歸分析多元回歸分析,并且稱(chēng)這一個(gè)變量是被影響變量
12、被影響變量(因變量:因變量:Dependent Variable);稱(chēng)這多個(gè)變量是影響變量影響變量(自變量自變量:Independent Variable).回歸分析回歸分析是根據(jù)變量觀測(cè)數(shù)據(jù)分析變量間關(guān)系的常用統(tǒng)計(jì)分析方法.通常把變量觀測(cè)數(shù)據(jù)稱(chēng)為樣本樣本. v一元線(xiàn)性回歸模型 一元線(xiàn)性回歸模型也稱(chēng)簡(jiǎn)單線(xiàn)性回歸模型,是分析兩個(gè)變量之間相互關(guān)系的數(shù)學(xué)方程式,其一般表達(dá)式為: 式中, 代表因變量的估計(jì)值, 代表自變量, 稱(chēng)為回歸模型的待定參數(shù), 其中 又稱(chēng)為回歸系數(shù) v一元回歸模型的建立 用 表示自變量 的實(shí)際值,用 表示因變量 的實(shí)際值( ,因變量的實(shí)際值與估計(jì)值之差用 表示,稱(chēng)為估計(jì)誤差或殘差
13、。即: 。 依據(jù)最小平方法理論可得: bxayy xba,bixiyxy),3 , 2 , 1niieiiiyye一元線(xiàn)性回歸分析 21212112111)(11,xnxxynyxxnxyxnyxbbaniiniiiniiniiniiniiniii的估計(jì):xbynxbyaniinii11 1)相關(guān)系數(shù)顯著性檢驗(yàn) 為保證回歸方程具有最低的線(xiàn)性關(guān)系,可以將相關(guān)系數(shù) 的臨界值列成相關(guān)系數(shù)檢驗(yàn)表。在給定顯著性水平 值和自由度 的值以后,查相關(guān)系數(shù)檢驗(yàn)表,即可找到 對(duì)應(yīng)的最低臨界值 ,據(jù)此就可以判斷線(xiàn)性關(guān)系是否成立。 若 ,表明在顯著性水平 條件下,變量間的線(xiàn)性關(guān)系是顯著的,建立的回歸方程是有意義的;若
14、 ,表明在顯著性水平 條件下變量間的線(xiàn)性關(guān)系不顯著,建立的回歸模型實(shí)際意義待定。 rnrr)(mnrr)(mnrr一元回歸模型的檢驗(yàn) 2)估計(jì)標(biāo)準(zhǔn)誤差檢驗(yàn) 估計(jì)標(biāo)準(zhǔn)誤差也稱(chēng)為估計(jì)標(biāo)準(zhǔn)差或估計(jì)標(biāo)準(zhǔn)誤,是殘差平方和的算術(shù)平均數(shù)的平方根,用 表示。其計(jì)算公式為: 式中 代表估計(jì)標(biāo)準(zhǔn)誤差, 代表估計(jì)殘差(實(shí)際值與估計(jì)值之差), 代表樣本容量, 代表回歸模型中待定參數(shù)的個(gè)數(shù)。 估計(jì)標(biāo)準(zhǔn)差是一項(xiàng)誤差分析指標(biāo),用于判斷回歸模型擬合的優(yōu)劣程度。 ySmneSniiy12ySiemnnininiiiiibxayyye111222)() ( 上述公式計(jì)算估計(jì)標(biāo)準(zhǔn)差較繁瑣,可以將其化簡(jiǎn)整理成如下的簡(jiǎn)捷計(jì)算法: 越大
15、,實(shí)際值與回歸直線(xiàn)的離散程度越大;反之, 越小,實(shí)際值與回歸直線(xiàn)的離散程度越小。一般要求 mnyxbyaySnininiiiiiy1112ySyS%15ySy 一元線(xiàn)性回歸模型通過(guò)檢驗(yàn),若其精度較好,擬合度優(yōu),即可用其進(jìn)行預(yù)測(cè)。 例 若對(duì)回歸模型 進(jìn)行預(yù)測(cè).若2005年A產(chǎn)品廣告費(fèi)為8萬(wàn)元,則年銷(xiāo)售收入預(yù)測(cè)值為: 將 (萬(wàn)元)代入回歸方程 中得: (萬(wàn)元) 上述預(yù)測(cè)只測(cè)算了一個(gè)數(shù)值點(diǎn),假定其他因素不變, ,置信度為95%( ),查正態(tài)分布概率表,F(xiàn)(t)=95%, t=1.96,則A產(chǎn)品2005年估計(jì)銷(xiāo)售收入為: 即A產(chǎn)品年廣告費(fèi)為8萬(wàn)元時(shí),其年銷(xiāo)售收入在(55.984,58.7918 )之間
16、。 xy1429. 12143.488xxy1429. 12143.483862.5781429. 12143.48y7154. 0yS%95)(tF7154. 096. 13862.57y預(yù)測(cè) 多元線(xiàn)性回歸分析 v二元線(xiàn)性回歸模型 一個(gè)因變量 與兩個(gè)自變量 , 呈線(xiàn)性相關(guān),則可建立二元線(xiàn)性回歸模型: 式中, 代表因變量的估計(jì)值,a為回歸常數(shù),b1,b2為回歸系數(shù), , 代表自變量 利用最小二乘法,可推導(dǎo)出計(jì)算求解二元線(xiàn)性回歸方程參數(shù) 的方程組: y1x2x2211xbxbayy 1x2x21,bbaniiniiiniiniiiniiiniiniiniiiniiniiniixbxxbxayxx
17、xbxbxayxxbxbnay1222121112121212121121111221111二元線(xiàn)性回歸模型 v二元線(xiàn)性回歸模型 例1 某商品的需求量主要受商品價(jià)格及居民收入水平的影響,近十年該商品有關(guān)資料如下表二、三、四列所示,試建立二元線(xiàn)性回歸方程。 年份 需求量( ) 價(jià)格( ) 居民收入( ) 12345678910566.577.589101011 8976765453 3030405060120130110100130 405445.54252.54845405033 1501802603504509601170110010001430 2402702803004207206504
18、40500390 6481493649362516259 9009001600250036001440016900121001000016900 合計(jì)80608004507050421039079800iyix1ix2iiyx1iiyx2iixx2121ix22ix 解: 根據(jù)計(jì)算回歸方程參數(shù)的要求,計(jì)算相關(guān)資料如上表五、六、七、八、九列所示。 由表中資料計(jì)算可得: , , 把表中相關(guān)資料代入求參數(shù)a,b1,b2的線(xiàn)性方程組: 解此方程組,得: a=11.228 b1=0.725 b2=0.014 故二元線(xiàn)性回歸方程為: 這一模型表明,當(dāng)居民收入不變時(shí),價(jià)格每上漲一元,該商品的需求量將平均減少
19、0.724千克;當(dāng)商品價(jià)格不變時(shí),居民收入每增加一萬(wàn)元,該商品的需求量將平均增加0.014千克。 81080y610601ix80108002ix2121217980042108007050421039060450800601080bbabbabba21014. 0725. 0228.11xxy v二元回歸模型的檢驗(yàn) 1)相關(guān)系數(shù)及顯著性檢驗(yàn) 復(fù)相關(guān)系數(shù)是反映一個(gè)因變量與多個(gè)自變量之間的線(xiàn)性相關(guān)程度的指標(biāo),用R表示。其計(jì)算公式為: 此公式只能在因變量的估計(jì)值求得以后才能運(yùn)用。其簡(jiǎn)捷計(jì)算公式為: niiiniiiniiniiyyyyyyyyR12121212)()(1)()(2121221111
20、12)(1iniiniiiniiiniiniiynyyxbyxbyayR二元線(xiàn)性回歸模型的檢驗(yàn) 例2 依據(jù)例1的資料計(jì)算復(fù)相關(guān)系數(shù)。解:根據(jù)例1的資料作復(fù)相關(guān)系數(shù)計(jì)算表 年份 需求量( ) 12345678910566.577.5891010115.95.16.77.67.08.69.49.99.01.90.810.810.040.360.250.360.160.011.00.01942.2510.2501449253642.254956.256481100100121合計(jì) 8080.13.8134.5674.5iyiy 2)(iiyy 2)(iiyy 2iy 將上表數(shù)據(jù)代入復(fù)相關(guān)系數(shù)公式得:
21、 若顯著性水平 時(shí),自由度=103=7,查“相關(guān)系數(shù)檢驗(yàn)表”得 由相關(guān)系數(shù)及其顯著性水平檢驗(yàn)數(shù)值可知,上述二元線(xiàn)性方程具有高度相關(guān)關(guān)系。 復(fù)相關(guān)系數(shù)的取值范圍為0R1。復(fù)相關(guān)系數(shù)為1,表明因變量與自變量之間存在嚴(yán)密的線(xiàn)性關(guān)系,復(fù)相關(guān)系數(shù)為0則表明因變量與自變量之間不存在任何線(xiàn)性相關(guān)關(guān)系。一般情況下,復(fù)相關(guān)系數(shù)的取值在0和1之間,表明變量之間存在一定程度的線(xiàn)性相關(guān)關(guān)系。 943. 05 .3481. 31R05. 0758. 0)310(05. 0R 2)估計(jì)標(biāo)準(zhǔn)誤檢驗(yàn) 二元線(xiàn)性回歸分析中,估計(jì)標(biāo)準(zhǔn)誤也是殘差平方和的算術(shù)平均數(shù)的平方根。其一般計(jì)算公式為: 其簡(jiǎn)捷計(jì)算公式為: mnyySniiiy
22、12)(mnyxbyxbyaySniiiniiniiniiy1221111112mnyxbyxbyaySniiiniiniiniiy1221111112 例3 根據(jù)例1所建立的二元線(xiàn)性模型 ,依據(jù)例1表中的資料計(jì)算估計(jì)標(biāo)準(zhǔn)誤,檢驗(yàn)所建模型的擬合程度 解: 0.738 估計(jì)標(biāo)準(zhǔn)誤為0.738,說(shuō)明建立的二元線(xiàn)性回歸方程擬合度較好。 21014. 0725. 0228.11xxy3107050014. 0450)725. 0(80228.115 .674yS 案例一案例一 軟件開(kāi)發(fā)人員的薪金軟件開(kāi)發(fā)人員的薪金一家高技術(shù)公司人事部門(mén)為研究軟件開(kāi)發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度等因素之間的
23、關(guān)系,要建立一個(gè)數(shù)學(xué)模型,以便分析公司人士策略的合理性軟件開(kāi)發(fā)軟件開(kāi)發(fā)人員的薪金人員的薪金,并作為新聘用人員工資的參考。他們認(rèn)為目前公司人員的薪金總體上是合理的,可以作為建模的依據(jù),于是調(diào)查了46名開(kāi)發(fā)人員的檔案資料,如表。 其中:資歷一列指從事專(zhuān)業(yè)工作的年數(shù), 管理一列中1表示管理人員, 0表示非管理人員, 教育一列中1表示中學(xué)程度,2表示大學(xué)程度, 3表示更高程度(研究生)編號(hào)薪金資歷管理教育編號(hào)薪金資歷管理教育011387611113198003130211608103141141740103187011131520263413041128310216132314030511767103
24、171284440206208722121813245502071177220219136775030810535201201596551109121952032112366601101231330222213526131114975311231383960212213713122422884612編號(hào)薪金資歷管理教育編號(hào)薪金資歷管理教育2516978711361688212022614803802372417012132717404811381599013012822184813392633013122913548801401794914023014467100141256851513311
25、59421002422783716123223174101343188381602332378010124417483160134254101112451920717023514861110146193462001開(kāi)發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度分析與假設(shè):分析與假設(shè):按照常識(shí),薪金自然按照資歷(年)的增長(zhǎng)而增加,管理人員的薪金高于非管理人員,教育程度越高薪金越高。薪金記作y,資歷(年)記作1x,為了表示是否為管理人員定義2x1,管理人員0,非管理人員為了表示三種教育程度,定義3x1,中學(xué)0,其它4x1,大學(xué)0,其它這樣,中學(xué)用0, 143xx表示,大學(xué)用1, 043xx表示,研
26、究生則用0, 043xx表示。為了簡(jiǎn)單起見(jiàn),我們假定資歷(年)對(duì)薪金的作用是線(xiàn)性的,即資歷每加一年,薪金的增長(zhǎng)是常數(shù);管理責(zé)任、教育程度、資歷諸因素之間沒(méi)有交互作用,建立線(xiàn)性回歸模型?;灸P停夯灸P停盒浇饄與資歷1x,管理責(zé)任2x,教育程度43,xx之間的多元線(xiàn)性回歸模型為443322110 xaxaxaxaay其中,410,aaa是待估計(jì)的回歸系數(shù),是隨機(jī)誤差。利用MATLAB的系統(tǒng)工具箱可以得到回歸系數(shù)及其置信區(qū)間(置信水平 )05. 0、檢驗(yàn)統(tǒng)計(jì)量pFR,2的結(jié)果,見(jiàn)表。參數(shù)參數(shù)估計(jì)值置信區(qū)間1103210258 11807546484 60868836248 7517-2994-3
27、826 -2162148-636 9310a1a2a3a4a0,226,957. 02pFR結(jié)果分析:結(jié)果分析:從表中,957. 02R,即因變量(薪金)的95.7%可由模型確定,F(xiàn)值超過(guò)F檢驗(yàn)的臨界值,p遠(yuǎn)小于,因而模型從整體來(lái)看是可用的。比如,利用模型可以估計(jì)(或估計(jì))一個(gè)大學(xué)畢業(yè)、有2年資歷、管理人員的薪金為12273100243210aaaaay模型中各個(gè)回歸系數(shù)的含義可初步解釋如下:1x的系數(shù)為546,說(shuō)明資歷每增加一年,薪金增長(zhǎng)546;2x的系數(shù)為6883,說(shuō)明管理人員的薪金比非管理人員多6883;3x的系數(shù)為-2994,說(shuō)明中學(xué)程度的薪金比研究生少2994;4x的系數(shù)為148,說(shuō)
28、明大學(xué)程度的薪金比研究生多148,但是應(yīng)該注意到4a的置信區(qū)間包含零點(diǎn),所以這個(gè)系數(shù)的解釋是不可靠的。注意:上述解釋是就平均值來(lái)說(shuō)的,并且,一個(gè)因素改變引起的因變量的變化量,都是在其它因素不變的條件下才成立的。進(jìn)一步討論:進(jìn)一步討論:的置信區(qū)間包含零點(diǎn),說(shuō)明上述基本模型存在缺點(diǎn)。為了4a尋找改進(jìn)的方向,常用殘差分析法(殘差指薪金的實(shí)際值y與模型估計(jì)的薪金y 之差,是基本模型中隨機(jī)誤差的估計(jì)值,這里用同一個(gè)符號(hào))。我們將影響因素分成資歷與管理教育組合兩類(lèi),管理-教育組合定義如表。組合1 23456管理010101教育112233管理管理教育組合教育組合為了對(duì)殘差進(jìn)行分析,下圖給出與資歷1x的關(guān)系
29、,及與管理2x-教育43, xx組合間的關(guān)系。與資歷1x的關(guān)系與432,xxx 組合的關(guān)系從左圖看,殘差大概分成3個(gè)水平,這是由于6種管理教育組合混在一起,在模型中未被正確反映的結(jié)果;從右圖看,對(duì)于前4個(gè)管理教育組合,殘差或者全為正,或者全為負(fù),也表明管理-教育組合在模型中處理不當(dāng)。在模型中,管理責(zé)任和教育程度是分別起作用的,事實(shí)上,二者可能起著交互作用,如大學(xué)程度的管理人員的薪金會(huì)比二者分別的薪金之和高一點(diǎn)。以上分析提示我們,應(yīng)在基本模型中增加管理更好的模型:更好的模型:2x與教育43, xx的交互項(xiàng),建立新的回歸模型。增加2x與43, xx的交互項(xiàng)后,模型記作426325443322110
30、 xxaxxaxaxaxaxaay利用MATLAB的統(tǒng)計(jì)工具箱得到的結(jié)果如表:參數(shù)參數(shù)估計(jì)值置信區(qū)間1120411044 11363497486 50870486841 7255-1727-1939 -1514-348-545 -152-3071-3372 -276918361571 21010a1a2a3a4a5a6a0,554,999. 02pFR由上表可知,這個(gè)模型的 做該模型的兩個(gè)殘差分析圖,可以看出,已經(jīng)消除了不正?,F(xiàn)象,這也說(shuō)明了模型的適用性。2R和F值都比上一個(gè)模型有所改進(jìn),并且所有回歸系數(shù)的置信區(qū)間都不含零點(diǎn),表明這個(gè)模型完全可用。與1x的關(guān)系與432,xxx 組合的關(guān)系 從上
31、圖,還可以發(fā)現(xiàn)一個(gè)異常點(diǎn):具有10年資歷、大學(xué)程度的管理人員(編號(hào)33)的實(shí)際薪金明顯低于模型的估計(jì)值,也明顯低于與他有類(lèi)似經(jīng)歷的其他人的薪金。這可能是由我們未知的原因造成的。為了使個(gè)別數(shù)據(jù)不致影響整個(gè)模型,應(yīng)該將這個(gè)異常數(shù)據(jù)去掉,對(duì)模型重新估計(jì)回歸系數(shù),得到的結(jié)果如表。殘差分析見(jiàn)圖??梢钥吹?,去掉異常數(shù)后結(jié)果又有改善。參數(shù)參數(shù)估計(jì)值置信區(qū)間1120011139 11261498494 50370416962 7120-1737-1818 -1656-356-431 -281-3056-3171 -294219971894 21000a1a2a3a4a5a6a0,36701,9998. 02p
32、FR與1x的關(guān)系與432,xxx 組合的關(guān)系模型的應(yīng)用:模型的應(yīng)用:對(duì)于第二個(gè)模型,用去掉異常數(shù)據(jù)(33號(hào))后估計(jì)出的系數(shù)得到的結(jié)果是滿(mǎn)意的。模型的應(yīng)用之一,可以用來(lái)“制訂”6種管理教育組合人員的“基礎(chǔ)”薪金(即資歷為零的薪金),這是平均意義上的。利用第二個(gè)模型和去掉異常數(shù)據(jù)后得到的回歸系數(shù),可以得到如下結(jié)果:組合管理教育系數(shù)“基礎(chǔ)”薪金1019463211134483021084441219882503112006131824130aa 5320aaaa40aa 6420aaaa0a20aa 可以看出,大學(xué)程度的管理人員薪金比研究生程度管理人員薪金高,而大學(xué)程度的非管理人員薪金比研究生程度非
33、管理人員薪金略低。當(dāng)然,這是根據(jù)這家公司實(shí)際數(shù)據(jù)建立的模型得到的結(jié)果,并不具普遍性。評(píng)注:評(píng)注:從建立回歸模型的角度,通過(guò)這個(gè)問(wèn)題的求解我們學(xué)習(xí)了:1) 對(duì)于影響因變量的定性因素(管理、教育),可以引入 01變量來(lái)處理,01變量的個(gè)數(shù)比定性因素的水平少 1(如教育程度有3個(gè)水平,引入2個(gè)01變量)。2) 用殘差分析法可以發(fā)現(xiàn)模型的缺陷,引入交互作用項(xiàng)常 ??梢缘玫礁纳?。3) 若發(fā)現(xiàn)異常值應(yīng)剔除,有助于結(jié)果的合理性。思考:思考:在這里我們由簡(jiǎn)到繁,先分別引進(jìn)管理和教育因素,再引入交互項(xiàng)。試直接對(duì)6種管理-教育組合引入5個(gè)01變量,建立模型,看結(jié)果如何。案例二案例二 教學(xué)評(píng)估教學(xué)評(píng)估為了考評(píng)教師的
34、教學(xué)質(zhì)量,教學(xué)研究部門(mén)設(shè)計(jì)了一個(gè)教學(xué)評(píng)估表,對(duì)學(xué)生進(jìn)行一次問(wèn)卷調(diào)查,要求學(xué)生對(duì)12位教師的15門(mén)課程(其中3為教師有兩門(mén)課程)按以下7項(xiàng)內(nèi)容打分,分值為15分(5分最好,1分最差):?jiǎn)栴}:?jiǎn)栴}:1X課程內(nèi)容組織的合理性;2X主要問(wèn)題展開(kāi)的邏輯性;3X回答學(xué)生問(wèn)題的有效性;4X課下交流的有助性;5X教科書(shū)的幫助性;6X考試評(píng)分的公正性;Y對(duì)教師的總體評(píng)價(jià)。收回問(wèn)卷調(diào)查表后,得到了學(xué)生對(duì)12為教師、15門(mén)課程各項(xiàng)評(píng)分的平均值,見(jiàn)表。 教師編號(hào)課程編號(hào)12014.464.424.234.104.564.374.1122244.113.823.293.603.993.823.3833013.583.3
35、13.243.764.393.753.1743014.424.374.344.403.634.274.3953014.624.474.534.674.634.574.691X2X3X4X5X6XY教師編號(hào)課程編號(hào)63093.183.823.923.623.504.143.2573112.472.793.583.502.843.842.8483114.293.924.053.762.764.113.9593124.414.364.274.754.594.114.18103124.594.344.244.392.644.384.44113334.554.454.434.574.454.404.47
36、124244.674.644.524.393.484.214.6133513.713.413.394.184.064.063.1744114.284.454.104.073.764.434.1594244.244.384.354.484.154.504.331X2X3X4X5X6XY61 XX不一定每項(xiàng)都對(duì)教師總體評(píng)價(jià)Y有顯著影響,并且各項(xiàng)內(nèi)容之間也可能存在很強(qiáng)的相關(guān)性,他們希望得到一個(gè)總體評(píng)價(jià)與各項(xiàng)具體內(nèi)容之間的模型,模型應(yīng)盡量簡(jiǎn)單和有效,并且由此能給教師一些合理的建議,以提高總體評(píng)價(jià)。準(zhǔn)備知識(shí):準(zhǔn)備知識(shí):逐步回歸這個(gè)問(wèn)題給出了6個(gè)自變量,但我們希望從中選出對(duì)因變量Y影響顯著的那些來(lái)建立回歸
37、模型。變量選擇的標(biāo)準(zhǔn)應(yīng)該是將所有對(duì)因變量影響顯著的自變量都選入模型,而影響不顯著的自變量都不選入模型,從便于應(yīng)用的角度,應(yīng)使模型中的自變量個(gè)數(shù)盡量少。逐步回歸就是一種從眾多自變量中有效的選擇重要變量的方法。教學(xué)研究部門(mén)認(rèn)為,所列各項(xiàng)具體內(nèi)容逐步回歸逐步回歸的基本思路是,先確定一個(gè)包含若干自變量的初始集合,然后每次從集合外的變量中引入一個(gè)對(duì)因變量影響最大的,再對(duì)集合中的變量進(jìn)行檢驗(yàn),從變得不顯著的變量中移出一個(gè)影響最小的,依次進(jìn)行,直到不能引入和移出為止。引入和移出都以給定的顯著性水平為標(biāo)準(zhǔn)。利用MATLAB系統(tǒng)工具箱中的逐步回歸命令stepwise可以實(shí)現(xiàn)逐步回歸。Stepwise提供人機(jī)交互
38、式畫(huà)面,可以在畫(huà)面上自由引入和移出變量,進(jìn)行統(tǒng)計(jì)分析。具體用法參見(jiàn)MATLAB叢書(shū)回歸模型的建立與求解:回歸模型的建立與求解:我們利用MATLAB命令得到各個(gè)變量的回歸系數(shù),置信區(qū)間,及剩余標(biāo)準(zhǔn)差(RMSE),決定系數(shù)(R-square),F(xiàn)值,p值。見(jiàn)表。參數(shù)參數(shù)估計(jì)值置信區(qū)間10.51620.01546 0.0192-0.05469-0.853 0.7436 30.6706-0.03795 1.37940.1245-0.462 0.67515-0.04335-0.2514 0.164760.1363-0.6958 0.9684RMSER-squareFp0.11250.980667.292.071e-006可以看到,除1X外其他
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 感恩節(jié)創(chuàng)意方案(19篇)
- 易錯(cuò)點(diǎn)16 閱讀理解:詞義猜測(cè)題(4大陷阱)-備戰(zhàn)2025年高考英語(yǔ)考試易錯(cuò)題含解析
- 土壤(第1課時(shí))導(dǎo)學(xué)案 高中地理人教版(2019)必修一
- 快遞使用規(guī)則培訓(xùn)
- 初級(jí)會(huì)計(jì)實(shí)務(wù)-初級(jí)會(huì)計(jì)《初級(jí)會(huì)計(jì)實(shí)務(wù)》模擬試卷294
- 初級(jí)會(huì)計(jì)經(jīng)濟(jì)法基礎(chǔ)-2021年5.15上午初級(jí)會(huì)計(jì)職稱(chēng)考試《經(jīng)濟(jì)法基礎(chǔ)》真題
- 智研咨詢(xún)-2024年中國(guó)地?zé)崮荛_(kāi)發(fā)利用行業(yè)市場(chǎng)規(guī)模、行業(yè)集中度及發(fā)展前景研究報(bào)告
- 220k變電所安全運(yùn)行
- 建筑與市政工程質(zhì)量安全第三方巡查執(zhí)行方案
- 現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)園社會(huì)效益與經(jīng)濟(jì)效益分析
- 2024年安全教育培訓(xùn)試題附完整答案(奪冠系列)
- 神農(nóng)架研學(xué)課程設(shè)計(jì)
- 文化資本與民族認(rèn)同建構(gòu)-洞察分析
- 2025新譯林版英語(yǔ)七年級(jí)下單詞默寫(xiě)表
- 【超星學(xué)習(xí)通】馬克思主義基本原理(南開(kāi)大學(xué))爾雅章節(jié)測(cè)試網(wǎng)課答案
- 《錫膏培訓(xùn)教材》課件
- 斷絕父子關(guān)系協(xié)議書(shū)
- 福建省公路水運(yùn)工程試驗(yàn)檢測(cè)費(fèi)用參考指標(biāo)
- 2024年中國(guó)工業(yè)涂料行業(yè)發(fā)展現(xiàn)狀、市場(chǎng)前景、投資方向分析報(bào)告(智研咨詢(xún)發(fā)布)
- 化工企業(yè)重大事故隱患判定標(biāo)準(zhǔn)培訓(xùn)考試卷(后附答案)
- 工傷賠償授權(quán)委托書(shū)范例
評(píng)論
0/150
提交評(píng)論