ch4 相關(guān)分析1508_第1頁
ch4 相關(guān)分析1508_第2頁
ch4 相關(guān)分析1508_第3頁
ch4 相關(guān)分析1508_第4頁
ch4 相關(guān)分析1508_第5頁
已閱讀5頁,還剩116頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第四章第四章 相關(guān)分析與回歸分析相關(guān)分析與回歸分析4.1 隨機(jī)關(guān)系隨機(jī)關(guān)系 函數(shù)關(guān)系函數(shù)關(guān)系 (Deterministic Relationship) Y= f (X) 每一個 X 值都唯一地對應(yīng)一個 Y值. 隨機(jī)關(guān)系隨機(jī)關(guān)系( Stochastic Relationship) 當(dāng) X 的值給定時, Y 的取值服從一個分布隨機(jī)關(guān)系隨機(jī)關(guān)系隨機(jī)關(guān)系(隨機(jī)關(guān)系( Stochastic Relationship):例: 鋼材消費(fèi)量與工業(yè)增加值 Y 鋼材消費(fèi)量(萬噸) X 工業(yè)增加值(億元) 問題:如何測量問題:如何測量X與與Y的相關(guān)性大???(重復(fù)觀測)的相關(guān)性大???(重復(fù)觀測)),( :),( :2

2、121nnyyyYxxxX鋼材產(chǎn)量與工業(yè)增加值鋼材產(chǎn)量與工業(yè)增加值年 份鋼材產(chǎn)量(萬噸)工業(yè)增加值(億元)1992 6697.0 7665.51993 7716.012842.61994 8428.014700.11995 8979.815446.11996 9338.018026.11997 9978.919835.2199810737.819421.9199912109.821564.7200013146.025394.9200116067.628329.4200219251.632994.8200324108.041990.2200431975.754805.1200537771.172

3、187.0200646893.491075.7200756560.9117048.4200858488.1129112.0(19922008)隨機(jī)關(guān)系隨機(jī)關(guān)系 ( Stochastic Relationship): 當(dāng)當(dāng) X 的值給定時,的值給定時, Y 的取值服的取值服從一個分布從一個分布經(jīng)濟(jì)數(shù)據(jù)變動之間的關(guān)聯(lián)關(guān)系經(jīng)濟(jì)數(shù)據(jù)變動之間的關(guān)聯(lián)關(guān)系(2001.9 2001.9 2008.3 2008.3) 在許多經(jīng)濟(jì)指標(biāo)之間,都存在在許多經(jīng)濟(jì)指標(biāo)之間,都存在某種形式某種形式的相關(guān)關(guān)系的相關(guān)關(guān)系 同步、領(lǐng)先、滯后同步、領(lǐng)先、滯后GDPGDP、CPICPI、股指、固定資產(chǎn)投資總額、大宗商品價格、國際原油

4、價格指數(shù)、股指、固定資產(chǎn)投資總額、大宗商品價格、國際原油價格指數(shù)、國際航運(yùn)指數(shù)、房地產(chǎn)價格(交易量)、貨幣供應(yīng)量、匯率、進(jìn)出口總國際航運(yùn)指數(shù)、房地產(chǎn)價格(交易量)、貨幣供應(yīng)量、匯率、進(jìn)出口總額額 景氣周期景氣周期李克強(qiáng)指數(shù)李克強(qiáng)指數(shù)源于李克強(qiáng)總理源于李克強(qiáng)總理20072007年任職遼寧省委書記時,提出通過耗電量、鐵路貨運(yùn)量和貸款發(fā)年任職遼寧省委書記時,提出通過耗電量、鐵路貨運(yùn)量和貸款發(fā)放量三個指標(biāo),分析當(dāng)時遼寧省經(jīng)濟(jì)狀況。英國著名政經(jīng)雜志放量三個指標(biāo),分析當(dāng)時遼寧省經(jīng)濟(jì)狀況。英國著名政經(jīng)雜志經(jīng)濟(jì)學(xué)人經(jīng)濟(jì)學(xué)人在在20102010年年推出的用于評估中國推出的用于評估中國GDPGDP增長量的指標(biāo),受

5、到花旗銀行在內(nèi)的眾多國際機(jī)構(gòu)認(rèn)可。增長量的指標(biāo),受到花旗銀行在內(nèi)的眾多國際機(jī)構(gòu)認(rèn)可。消耗電量:消耗電量: 反映反映工業(yè)生產(chǎn)活躍度工業(yè)生產(chǎn)活躍度以及企業(yè)運(yùn)行狀態(tài)。以及企業(yè)運(yùn)行狀態(tài)。鐵路貨運(yùn)量:鐵路貨運(yùn)量:從從物流物流角度反映工農(nóng)業(yè)生產(chǎn)以至整體經(jīng)濟(jì)運(yùn)行狀態(tài)角度反映工農(nóng)業(yè)生產(chǎn)以至整體經(jīng)濟(jì)運(yùn)行狀態(tài)貸款發(fā)放量:貸款發(fā)放量:從從融資融資方面,反映出市場信心,以及經(jīng)濟(jì)運(yùn)行風(fēng)險度。方面,反映出市場信心,以及經(jīng)濟(jì)運(yùn)行風(fēng)險度。2015年年7月全社會用電量同比下降月全社會用電量同比下降1.3%;增速為負(fù)省份;增速為負(fù)省份19個,北京(個,北京(-6.2%)1234567-9.1-9.1-10.1-9.9-11.0-

6、11.7-10.9 2015年鐵路貨運(yùn)量當(dāng)月同比:年鐵路貨運(yùn)量當(dāng)月同比:中國上半年的信貸也遠(yuǎn)不及中國上半年的信貸也遠(yuǎn)不及GDP增長的表現(xiàn)增長的表現(xiàn)u斯坦福大學(xué)亞太問題專家帕克斯坦福大學(xué)亞太問題專家帕克(Michael(MichaelParker)Parker)認(rèn)為中國正在認(rèn)為中國正在從重工業(yè)經(jīng)濟(jì)轉(zhuǎn)型為服務(wù)驅(qū)動型經(jīng)濟(jì)。他運(yùn)用從重工業(yè)經(jīng)濟(jì)轉(zhuǎn)型為服務(wù)驅(qū)動型經(jīng)濟(jì)。他運(yùn)用影院票房收入影院票房收入和和4G4G網(wǎng)絡(luò)使用率網(wǎng)絡(luò)使用率,來嘗試解釋中國經(jīng)濟(jì)運(yùn)行規(guī)律。,來嘗試解釋中國經(jīng)濟(jì)運(yùn)行規(guī)律。u服務(wù)業(yè)占經(jīng)濟(jì)總量的一半左右,占經(jīng)濟(jì)增長的三分之二左右服務(wù)業(yè)占經(jīng)濟(jì)總量的一半左右,占經(jīng)濟(jì)增長的三分之二左右。按照這一標(biāo)準(zhǔn)

7、,中國經(jīng)濟(jì)的表現(xiàn)實際上比克強(qiáng)指數(shù)反映情況。按照這一標(biāo)準(zhǔn),中國經(jīng)濟(jì)的表現(xiàn)實際上比克強(qiáng)指數(shù)反映情況要好。要好。u“新克強(qiáng)指數(shù)新克強(qiáng)指數(shù)”(?)(?)就業(yè)、物價、居民收入、能耗強(qiáng)度就業(yè)、物價、居民收入、能耗強(qiáng)度 2014年,李克強(qiáng)在漢堡出席中歐論壇漢堡峰會發(fā)表演說,透露了他關(guān)注經(jīng)年,李克強(qiáng)在漢堡出席中歐論壇漢堡峰會發(fā)表演說,透露了他關(guān)注經(jīng)濟(jì)的幾個重要指標(biāo):濟(jì)的幾個重要指標(biāo):“只要就業(yè)比較充分、物價比較穩(wěn)定、居民收入同步增只要就業(yè)比較充分、物價比較穩(wěn)定、居民收入同步增長、生態(tài)環(huán)保取得積極成果,經(jīng)濟(jì)增速比長、生態(tài)環(huán)保取得積極成果,經(jīng)濟(jì)增速比7.5%高一點(diǎn)、低一點(diǎn),都是可以接高一點(diǎn)、低一點(diǎn),都是可以接受的

8、。受的。”發(fā)電量與工業(yè)增加值(發(fā)電量與工業(yè)增加值(1995199520072007)年度年度工業(yè)增加值工業(yè)增加值(億元)(億元)發(fā)電量發(fā)電量(億千瓦小時億千瓦小時)199515446.1210070.30199618026.1110813.10199719835.1811355.53199819421.9311670.00199921564.7412393.00200025394.8013556.00200128329.3714808.02200232994.7516540.00200341990.2319105.75200454805.1022033.09200572186.9925002.

9、60200691075.7328657.262007117048.4032815.534.2 相關(guān)系數(shù)相關(guān)系數(shù)(The Correlation Coefficient) Pearson 相關(guān)系數(shù)相關(guān)系數(shù): r(x,y) 記niiniiniiiyyxxyyxxyxr12121)()()(),(YXXYniiYniiXniiiXYsssyxryynsxxnsyyxxns),( )(11 ,)(11( )(111221221樣本協(xié)方差)cos,yxyxrr(x, y) 的性質(zhì)的性質(zhì) (1) -1 r 1 (2) 0 r 1: 正線性相關(guān) (3) -1 r 0: 負(fù)線性相關(guān) (4) r = 0: 線性

10、無關(guān) (5) r =1: 完全正線性相關(guān) (6) r= -1:完全負(fù)線性相關(guān)不相關(guān)弱相關(guān)中度相關(guān)強(qiáng)相關(guān) 3 . 0 5 . 03 . 0 8 . 05 . 0 8 . 0rrrr0cos 901cos 1801cos 0cos,oooyxyxr Pearson Pearson 相關(guān)系數(shù)的解釋:地區(qū)經(jīng)濟(jì)與交通協(xié)調(diào)發(fā)展相關(guān)系數(shù)的解釋:地區(qū)經(jīng)濟(jì)與交通協(xié)調(diào)發(fā)展 記niiniiniiiyyxxyyxxyxr12121)()()(),( (1) -1 r 1 (2) 0 r 1: 正線性相關(guān)正線性相關(guān) (3) -1 r 0: 負(fù)線性相關(guān)負(fù)線性相關(guān) (4) r = 0: 線性無關(guān)線性無關(guān) (5) r =1:

11、 完全正線性相關(guān)完全正線性相關(guān) (6) r= -1: 完全負(fù)線性相關(guān)完全負(fù)線性相關(guān)11()()( , )1niiixyxxyyr x ynssYXXYniiYniiXniiiXYsssyxryynsxxnsyyxxns),( )(11 ,)(11( )(111221221樣本協(xié)方差)*11 ( , ) 1niiir x yx yn-3-2-1012-2-1012(a)xy-2-1012-2-1012(b)xy-2-1012-2-1012(c)xy-3-2-1012302468(d)xyPearsonPearson相關(guān)系數(shù)主要用于測量個變量之間的線性關(guān)系相關(guān)系數(shù)主要用于測量個變量之間的線性關(guān)系討

12、論:討論:“假如我是假如我是Pearson”1 1、觀察到的兩個變量有相隨變動的規(guī)律、觀察到的兩個變量有相隨變動的規(guī)律正相關(guān)正相關(guān)負(fù)相關(guān)負(fù)相關(guān)無關(guān)無關(guān)1010iiixy101220iiixy x-1-2-3-4-5-6-7-8-9-10y109876543213. 為什么要做為什么要做中心化中心化正相關(guān)得到正值正相關(guān)得到正值101220iiixy 101385iiixyx12345678910y1234567891010182.5iiixy10182.5iiixyx-1-2-3-4-5-6-7-8-9-10y10987654321()()iixxyyniiniiniiiyyxxyyxxyxr1

13、2121)()()(),(X X1 12 23 34 45 56 67 78 89 91010Y Y2828262624242222202018181616141412121010101165iiixy 101880iiixy1010iiixy101225iiixy111111234522222123453333312345444441234555555123452211nniiiixxyyniiniiniiiyyxxyyxxyxr12121)()()(),(目的:目的:是把相關(guān)系數(shù)的取值規(guī)范到是把相關(guān)系數(shù)的取值規(guī)范到 -1-1,11的范圍的范圍!思考:思考:把相關(guān)系數(shù)的取值規(guī)范到把相關(guān)系數(shù)的

14、取值規(guī)范到-1-1,11的范圍有什么意義?的范圍有什么意義?證明:為什么做了這個除法,就可以達(dá)到這個目的?證明:為什么做了這個除法,就可以達(dá)到這個目的?三三. . 例題例題yi 股票價格股票價格 ($) xi 股息股息 ($) 股票 股息 ($) 股價($) ixi yi 113115 2 4 45 312100 4 5 50 5 6 55 6 8 85 7 3 40 8 4 50 9 5 45 10 7 70EXCEL:數(shù)據(jù)數(shù)據(jù)數(shù)據(jù)分析(數(shù)據(jù)分析(D) 相關(guān)系數(shù)相關(guān)系數(shù) 相關(guān)系數(shù):相關(guān)系數(shù):發(fā)電量與工業(yè)增加值(發(fā)電量與工業(yè)增加值(1995199520072007)年度工業(yè)增加值(億元)發(fā)電量

15、(億千瓦小時)199515446.1210070.30199618026.1110813.10199719835.1811355.53199819421.9311670.00199921564.7412393.00200025394.8013556.00200128329.3714808.02200232994.7516540.00200341990.2319105.75200454805.1022033.09200572186.9925002.60200691075.7328657.262007117048.4032815.53相關(guān)系數(shù)相關(guān)系數(shù)工業(yè)增加值 發(fā)電量 工業(yè)增加值 1 1發(fā)電量 0

16、.9883570.9883571 1分行分行編號編號不良貸款不良貸款(億元)(億元)各項貸款余額各項貸款余額(億元)(億元)本年累計應(yīng)收貸款本年累計應(yīng)收貸款(億元)(億元)貸款項目個數(shù)貸款項目個數(shù)(個)(個)本年固定資產(chǎn)投資額本年固定資產(chǎn)投資額(億元)(億元)10.967.36.8551.921.1111.319.81690.934.8173.07.71773.743.280.87.21014.557.8199.716.51963.262.716.22.212.271.6107.410.71720.2812.5185.427.11843.891.096.11.71055.9102.672.89

17、.11464.3110.364.22.11142.7124.0132.211.22376.7130.858.66.01422.8143.5174.612.726117.11510.2263.515.634146.7163.079.38.91529.9170.214.80.6242.1180.473.55.91125.3191.024.75.0413.4206.8139.47.22864.32111.6368.216.832163.9221.695.73.81044.5231.2109.610.31467.9247.2196.215.81639.7253.2102.212.01097.1練習(xí):練

18、習(xí): 某商業(yè)銀行某商業(yè)銀行25家分行家分行2002年的主要業(yè)務(wù)數(shù)據(jù)年的主要業(yè)務(wù)數(shù)據(jù)不良貸款(億元)各項貸款余額(億元)本年累計應(yīng)收貸款(億元)貸款項目個數(shù)(個)本年固定資產(chǎn)投資額(億元)不良貸款(億元)1各項貸款余額(億元) 0.8435711本年累計應(yīng)收貸款(億元) 0.731505 0.6787721貸款項目個數(shù)(個)0.700281 0.848416 0.5858311本年固定資產(chǎn)投資額(億元) 0.518518 0.779702 0.472431 0.7466461相關(guān)系數(shù)矩陣相關(guān)系數(shù)矩陣相關(guān)關(guān)系與因果關(guān)系討論之一相關(guān)關(guān)系與因果關(guān)系討論之一從相關(guān)關(guān)系發(fā)現(xiàn)因果關(guān)系從相關(guān)關(guān)系發(fā)現(xiàn)因果關(guān)系案

19、例:案例:2006年北京市的福壽螺事件年北京市的福壽螺事件5月月20日日 蜀國演義酒樓將蜀國演義酒樓將“涼拌螺肉涼拌螺肉”的原料的原料海水螺改為福壽螺。海水螺改為福壽螺。5月月23日日 廣州管圓線蟲病患者開始出現(xiàn)癥狀,但病因難查。廣州管圓線蟲病患者開始出現(xiàn)癥狀,但病因難查。6月月24日日 首例廣州管圓線蟲病在友誼醫(yī)院確診。首例廣州管圓線蟲病在友誼醫(yī)院確診。(熱帶病研究所)(熱帶病研究所)6月月25日日 友誼醫(yī)院臨床醫(yī)生先后友誼醫(yī)院臨床醫(yī)生先后2次到蜀國演義酒樓暗訪、明查,次到蜀國演義酒樓暗訪、明查, 檢測出福壽螺攜帶廣州管圓線蟲幼蟲。檢測出福壽螺攜帶廣州管圓線蟲幼蟲。8月月17日日 北京市衛(wèi)生

20、局通報因食用涼拌螺肉染上北京市衛(wèi)生局通報因食用涼拌螺肉染上“廣州管圓線蟲病廣州管圓線蟲病”情況。情況。 20082008年年0505月月1212日日 新華網(wǎng)報道,新華網(wǎng)報道,100100多位曾在蜀國演義酒樓食用涼拌多位曾在蜀國演義酒樓食用涼拌螺肉的顧客患上廣州管圓線蟲病。該病嚴(yán)重者出現(xiàn)頭痛、發(fā)熱、頸部強(qiáng)硬螺肉的顧客患上廣州管圓線蟲病。該病嚴(yán)重者出現(xiàn)頭痛、發(fā)熱、頸部強(qiáng)硬等癥狀,嚴(yán)重者可致癡呆,甚至死亡。經(jīng)場歷時一年半的賠償案審理,等癥狀,嚴(yán)重者可致癡呆,甚至死亡。經(jīng)場歷時一年半的賠償案審理,160160多名患者共獲賠償近多名患者共獲賠償近10001000萬元。酒樓總損失則為萬元。酒樓總損失則為2

21、3202320萬元。萬元。 相關(guān)關(guān)系與因果關(guān)系討論之二相關(guān)關(guān)系與因果關(guān)系討論之二 相關(guān)關(guān)系相關(guān)關(guān)系 因果關(guān)系因果關(guān)系 西班牙醫(yī)生Gasper Casal 與18世紀(jì)在歐洲首次發(fā)現(xiàn)糙皮病是非常貧困的居民中體弱多病、傷殘、夭折的一個重要原因。十九世紀(jì)初這種疾病在歐洲蔓延,二十世紀(jì)頭十年,在美國泛濫。 患病者家庭貧困,環(huán)境條件惡劣,到處有蒼蠅。而在歐洲,一種吸血蠅一種吸血蠅與糙皮病有同樣的地理分布范圍;與糙皮病有同樣的地理分布范圍;而吸血蠅在春天最為活躍,恰恰是糙皮病發(fā)生病歷最多的季節(jié)。 許多流行病專家認(rèn)為這種疾病是傳染性的許多流行病專家認(rèn)為這種疾病是傳染性的由昆蟲傳染。由昆蟲傳染。 1914年初,

22、美國醫(yī)生Joseph Goldberger通過實驗研究證實,糙皮病是由于不良飲食引起的,可以通過食用含P-P因子(煙酸)的食物而預(yù)防和治療。煙酸天然存在與肉、奶、蛋和一些蔬菜、谷物中。發(fā)病地區(qū)的窮人主發(fā)病地區(qū)的窮人主要以玉米為食物,而玉米幾乎不含煙酸要以玉米為食物,而玉米幾乎不含煙酸。1940年以來,美國銷售的大部分面粉中添加了P-P因子。 蒼蠅是貧窮的標(biāo)志,而不是糙皮病的起因。相關(guān)關(guān)系不等于蒼蠅是貧窮的標(biāo)志,而不是糙皮病的起因。相關(guān)關(guān)系不等于因果關(guān)系。因果關(guān)系。(4)航空運(yùn)量的增長在1996年以前是經(jīng)濟(jì)增長的線性趨勢。1996 還有一些例子:還有一些例子: (1)閃電是打雷的原因嗎? (2)

23、公雞打鳴,天就亮 (相關(guān)關(guān)系?反因果關(guān)系?) (3) 哲學(xué)家羅素(Bertrand Russell)討論因果問題 在一只雞看來:農(nóng)婦到來,飼料會被放在缽子里有相關(guān)關(guān)系,不一定有因果關(guān)系;有相關(guān)關(guān)系,不一定有因果關(guān)系;社交網(wǎng)絡(luò):社交網(wǎng)絡(luò):舞會的意義:舞會的意義:微博、微信、人人、微博、微信、人人、QQ群、群、ihome,手機(jī)客戶端手機(jī)客戶端(4)航空運(yùn)量的增長在1996年以前是經(jīng)濟(jì)增長的線性趨勢。1996 還有一些例子:還有一些例子: (1)閃電是打雷的原因嗎? (2)公雞打鳴,天就亮 (相關(guān)關(guān)系?反因果關(guān)系?) (3) 哲學(xué)家羅素(Bertrand Russell)討論因果問題 在一只雞看來:

24、農(nóng)婦到來,飼料會被放在缽子里有相關(guān)關(guān)系,不一定有因果關(guān)系;有相關(guān)關(guān)系,不一定有因果關(guān)系;沒有相關(guān)關(guān)系,就一定沒有因果關(guān)系。沒有相關(guān)關(guān)系,就一定沒有因果關(guān)系。案例(案例(P77P77)( (品牌忠誠度品牌忠誠度) )美國折扣零售商美國折扣零售商Target與懷孕預(yù)測與懷孕預(yù)測 對于零售商來說,知道一個顧客是否懷孕是十分重要的。對于零售商來說,知道一個顧客是否懷孕是十分重要的。因為這是一對夫妻改變消費(fèi)觀念的分水嶺,他們會去光顧以前因為這是一對夫妻改變消費(fèi)觀念的分水嶺,他們會去光顧以前不去的商店,漸漸對新品牌建立忠誠。公司的市場專員向分析不去的商店,漸漸對新品牌建立忠誠。公司的市場專員向分析團(tuán)隊求助

25、,看能否團(tuán)隊求助,看能否根據(jù)一個人的購物方式發(fā)現(xiàn)她是否懷孕根據(jù)一個人的購物方式發(fā)現(xiàn)她是否懷孕。為。為此,首先查看了簽署此,首先查看了簽署。注意到登記簿中的女性在懷孕大約。注意到登記簿中的女性在懷孕大約3 3個月個月時會買很多無香乳液,幾個月后,他們會買一些營養(yǎng)品,比如時會買很多無香乳液,幾個月后,他們會買一些營養(yǎng)品,比如鎂、鈣、鋅。公司最終找出鎂、鈣、鋅。公司最終找出2020多種關(guān)聯(lián)物品,可以給顧客進(jìn)行多種關(guān)聯(lián)物品,可以給顧客進(jìn)行懷孕趨勢評分。這樣就能懷孕趨勢評分。這樣就能在孕期的每個階段給客戶送相應(yīng)的優(yōu)在孕期的每個階段給客戶送相應(yīng)的優(yōu)惠劵惠劵。一天,一個男人沖進(jìn)一家塔吉特商店,要求經(jīng)理來見他

26、。一天,一個男人沖進(jìn)一家塔吉特商店,要求經(jīng)理來見他。他氣憤地說:他女兒還是高中生,但是商店卻給她寄嬰兒服。他氣憤地說:他女兒還是高中生,但是商店卻給她寄嬰兒服和嬰兒床的優(yōu)惠劵。幾天后,當(dāng)經(jīng)理打電話向他致歉時,他卻和嬰兒床的優(yōu)惠劵。幾天后,當(dāng)經(jīng)理打電話向他致歉時,他卻說:女兒確實懷孕了,是自己完全沒有意識到這件事情的發(fā)生說:女兒確實懷孕了,是自己完全沒有意識到這件事情的發(fā)生。案例(案例(P163): p ( (廣告投放策略廣告投放策略) ) 信用卡發(fā)行公司信用卡發(fā)行公司MasterCard MasterCard 收集和分析了來收集和分析了來自自210210個國家的個國家的1515億信用卡用戶的億

27、信用卡用戶的650650億交易記錄,用來預(yù)測商業(yè)億交易記錄,用來預(yù)測商業(yè)發(fā)展和客戶的消費(fèi)趨勢,然后把分析結(jié)果賣給其他公司。它發(fā)現(xiàn)發(fā)展和客戶的消費(fèi)趨勢,然后把分析結(jié)果賣給其他公司。它發(fā)現(xiàn),如果一個人在下午四點(diǎn)鐘加油,他很可能在接下來的一小時內(nèi)如果一個人在下午四點(diǎn)鐘加油,他很可能在接下來的一小時內(nèi)要去購物或者去餐館吃飯。要去購物或者去餐館吃飯。商家可能正需要這樣的信息,因為這商家可能正需要這樣的信息,因為這樣他就可能在這個時間段的加油小票背面附上加油站附近商店的樣他就可能在這個時間段的加油小票背面附上加油站附近商店的優(yōu)惠劵。優(yōu)惠劵。p( (財務(wù)預(yù)測財務(wù)預(yù)測) )InrixInrix收集交通狀況信息

28、,用于評價一個地方的經(jīng)濟(jì)收集交通狀況信息,用于評價一個地方的經(jīng)濟(jì)情況,提供關(guān)于失業(yè)率、零售額情況,提供關(guān)于失業(yè)率、零售額等等信息。信息。InriInri把它收集的交通數(shù)把它收集的交通數(shù)據(jù)賣給一個據(jù)賣給一個,投資基金把交通狀況視作一個大型零售商,投資基金把交通狀況視作一個大型零售商場銷售的代表,場銷售的代表,一旦附近車輛很多,就說明商場銷售量會增加一旦附近車輛很多,就說明商場銷售量會增加。在商場公布在商場公布財務(wù)報表財務(wù)報表之前,這項基金還利用這些數(shù)據(jù)分析結(jié)果換之前,這項基金還利用這些數(shù)據(jù)分析結(jié)果換得了商場的一部分股份。得了商場的一部分股份。u 4V ?u 有相關(guān)關(guān)系沒有因果關(guān)系的數(shù)據(jù)?有相關(guān)關(guān)

29、系沒有因果關(guān)系的數(shù)據(jù)?關(guān)聯(lián)關(guān)系預(yù)警方法關(guān)聯(lián)關(guān)系預(yù)警方法再論:公雞打鳴天就亮再論:公雞打鳴天就亮案例案例1:20092009年谷歌通過通過觀察人們在網(wǎng)上的搜索記錄,預(yù)測冬年谷歌通過通過觀察人們在網(wǎng)上的搜索記錄,預(yù)測冬季流感的傳播。季流感的傳播。案例案例3:預(yù)測預(yù)測預(yù)警預(yù)警利用電磁波和地震波的時間差來發(fā)布地利用電磁波和地震波的時間差來發(fā)布地震預(yù)警,能搶出震預(yù)警,能搶出4040秒時間。中國秒時間。中國“國家國家地震烈度速報與預(yù)警工程地震烈度速報與預(yù)警工程”。20132013年年8 8月月9 9日,日,日本緊急地震速報系統(tǒng)日本緊急地震速報系統(tǒng)的的海底測量儀器,誤把電波雜訊當(dāng)作地海底測量儀器,誤把電波雜

30、訊當(dāng)作地震波震波,出出7.87.8大地震警報大地震警報。沃爾瑪經(jīng)典營銷案例:啤酒與尿布沃爾瑪經(jīng)典營銷案例:啤酒與尿布u 1993年美國學(xué)者年美國學(xué)者Agrawal提出通過分析購物籃中的商品集合,提出通過分析購物籃中的商品集合,從而找出商品之間關(guān)聯(lián)關(guān)系的關(guān)聯(lián)算法,并根據(jù)商品之間的關(guān)從而找出商品之間關(guān)聯(lián)關(guān)系的關(guān)聯(lián)算法,并根據(jù)商品之間的關(guān)系,找出客戶的購買行為。系,找出客戶的購買行為。u 啤酒與尿布案例正式刊登在啤酒與尿布案例正式刊登在1998年的年的哈佛商業(yè)評論哈佛商業(yè)評論有邏輯的相關(guān)關(guān)系有邏輯的相關(guān)關(guān)系解放思想,把握實質(zhì),靈活運(yùn)用解放思想,把握實質(zhì),靈活運(yùn)用4.4 4.4 一元線性回歸模型介紹一

31、元線性回歸模型介紹 ( Simple Linear Regression Model) 回歸模型回歸模型: : 研究因變量與自變量之間的因果關(guān)系研究因變量與自變量之間的因果關(guān)系 Y因變量(因變量(dependent variable) Xj 自變量(自變量(independent variable) 例例: 總體參數(shù)總體參數(shù) : 0 , 1, , p 隨機(jī)誤差隨機(jī)誤差 : ppXXXYCTYXXY2211023/2210/21Sir Francis Galton1889, Natural InheritanceT 8, Y 4C 8, Y 64例例1: 1: 阿蒙德比薩餅屋的銷售預(yù)測阿蒙德比薩

32、餅屋的銷售預(yù)測阿蒙德比薩餅屋在美國阿蒙德比薩餅屋在美國5 5個州個州有連鎖店。最成功的店址是在有連鎖店。最成功的店址是在大學(xué)校園邊上。經(jīng)理們認(rèn)為,大學(xué)校園邊上。經(jīng)理們認(rèn)為,這些飯店的季度銷售額這些飯店的季度銷售額Y Y與學(xué)與學(xué)生人數(shù)成正相關(guān),即位于學(xué)生生人數(shù)成正相關(guān),即位于學(xué)生人數(shù)較多校園旁邊的飯店將比人數(shù)較多校園旁邊的飯店將比位于學(xué)生人數(shù)較少的校園邊上位于學(xué)生人數(shù)較少的校園邊上的飯店實現(xiàn)更達(dá)的銷售額。為的飯店實現(xiàn)更達(dá)的銷售額。為了研究學(xué)生人數(shù)與季度銷售額了研究學(xué)生人數(shù)與季度銷售額之間的關(guān)系,阿蒙德公司采集之間的關(guān)系,阿蒙德公司采集了了1010家位于大學(xué)校園邊的飯店家位于大學(xué)校園邊的飯店的數(shù)據(jù)

33、。的數(shù)據(jù)。飯店飯店Y = 季度銷售額季度銷售額(千美元)(千美元)X = 學(xué)生人數(shù)學(xué)生人數(shù)(千人)(千人)1234567891058105881181171371571691492022688121620202226xy560 (1) b1=5 (為正為正),說明學(xué)生人數(shù)增加時說明學(xué)生人數(shù)增加時,季度銷售額便會增加季度銷售額便會增加(2) 學(xué)生人數(shù)每增加學(xué)生人數(shù)每增加1000人人,預(yù)計銷售額會增加預(yù)計銷售額會增加5000美元美元(3) 如果要預(yù)測一個位于擁有如果要預(yù)測一個位于擁有16 000個學(xué)生的校園邊的飯店的季度銷售額,個學(xué)生的校園邊的飯店的季度銷售額,可以預(yù)測季度銷售額約為可以預(yù)測季度銷

34、售額約為 140 000美元美元.14016560 y一、一元線性回歸模型一、一元線性回歸模型 假設(shè)對于總體數(shù)據(jù)假設(shè)對于總體數(shù)據(jù): 希望估計模型參數(shù)希望估計模型參數(shù): 0 , 1 從總體中抽取容量為從總體中抽取容量為 n 的樣本的樣本: 估計量估計量: 一元回歸線一元回歸線: ,n,ixyiii21 101100 ,estimatesestimatesbb) ( : 10的預(yù)測值的擬合值iiiiiyyyxbby),( ,),(),(2211nnyxyxyx二、二、最小二乘方法(最小二乘方法(Least Squares ) 一元回歸線一元回歸線: 殘差平方和殘差平方和: SSE(Sum of S

35、quares for Error)01 Residuals(: (- )iiiiiiiybb xyyey y殘差)min)( )(21102112iniiiniiniixbbyyyeSSE例題例題:yi 股票價格 ($) xi 股息 ($) 股票 股息 ($) 股價($) ixi yi 113115 2 4 45 312100 4 5 50 5 6 55 6 8 85 7 3 40 8 4 50 9 5 45 10 7 70yi 股價 ($) xi 股息 ($)030609012015002468101214解:解: y 股價 x 股息 計算結(jié)果為計算結(jié)果為: b1=7.5072, b0=15

36、.2017 20.280.11200.11580.112135072.72017.15)0 .115( 13$ 5072.72017.15 eyyxxy當(dāng) 三、評價回歸模型三、評價回歸模型 問題提出問題提出: : 樣本回歸模型總是可以求到的,但是它是否確實樣本回歸模型總是可以求到的,但是它是否確實是總體回歸模型的正確估計呢?是總體回歸模型的正確估計呢? 1. 該模型能否較好地解釋該模型能否較好地解釋 yi 的取值變化規(guī)律?的取值變化規(guī)律? 回歸方程的質(zhì)量如何?回歸方程的質(zhì)量如何? 2. 關(guān)于一元線性回歸模型的幾個基本假設(shè)條件是關(guān)于一元線性回歸模型的幾個基本假設(shè)條件是 否得到滿足?否得到滿足?0

37、101 1 2iiiiiyxi, ,nybb x1 2 xyxy() 與是線性關(guān)系嗎?( ) 在解釋 時,是一個有用的自變量嗎? 1. 擬合優(yōu)度擬合優(yōu)度 : R2 2. 在在 X 和和Y 之間是否存在線性關(guān)系之間是否存在線性關(guān)系? (F-test) 3. X 在解釋在解釋 Y時,是否有作用時,是否有作用? (t-test)模型評估方法模型評估方法: :1、擬合優(yōu)度、擬合優(yōu)度 Goodness of Fit2),(RYXr 判定系數(shù)判定系數(shù) R2 (Coefficient of Determination ) R2 的性質(zhì)的性質(zhì): (1) 0 R2 1 (2) 當(dāng)當(dāng) R2=1: 所有點(diǎn)在回歸線上

38、,誤差為所有點(diǎn)在回歸線上,誤差為0 (3) 當(dāng)當(dāng) R2=0: 回歸線完全不能解釋數(shù)據(jù)變異情況回歸線完全不能解釋數(shù)據(jù)變異情況 (4) r(X,Y) 的的( )號與號與 b1相同相同; 222111nnniiiiiiiyyyyyy常量常量大大小小總變異量異量用回歸模型可解釋的變niiniiyyyy12122R例題:例題: 股價與股利之間的關(guān)系股價與股利之間的關(guān)系回歸方程回歸方程:9582. 0R5072. 72017.152iixy9789. 0),(yxr 1. R2= 0.64, X 與與 Y 的相關(guān)系數(shù)等于的相關(guān)系數(shù)等于 (a) 0.64 (c) 0.32 (b) 0.80 (d) 0.40

39、 2. 指出下面哪一個方程一定是錯誤的指出下面哪一個方程一定是錯誤的95. 0 38 )(86. 0 9 . 0100 )(75. 0 01. 0500 )(rxyc rxyb rxya 2、F-檢驗檢驗 一元線性回歸模型一元線性回歸模型: F-test 在在 X 和和 Y之間是否存在線性關(guān)系之間是否存在線性關(guān)系?0: , 0:1110HH,n,ixyiii21 103、 t -檢驗檢驗(回歸系數(shù)的檢驗)(回歸系數(shù)的檢驗) X 對對Y 是否有解釋作用是否有解釋作用? 0: , 0:1110HH(檢驗回歸模型的線性關(guān)系)(檢驗回歸模型的線性關(guān)系)當(dāng)當(dāng) Significance F 0.05時,時

40、, F檢驗通過。檢驗通過。當(dāng)當(dāng)P-value 0.05時,時, t檢驗通過檢驗通過例題例題:yi 股票價格股票價格 ($) xi 股息股息 ($) 股票股票 股息股息 ($) 股價股價($) ixi yi 113115 2 4 45 312100 4 5 50 5 6 55 6 8 85 7 3 40 8 4 50 9 5 45 10 7 70EXCEL:工具工具 數(shù)據(jù)分析(數(shù)據(jù)分析(D) 回歸回歸回歸:回歸:iixy5072. 72017.15當(dāng)P-value 0.05時, t檢驗通過當(dāng) Significance F 0.05時, F檢驗通過擬合趨勢圖擬合趨勢圖4.5 多多元線性回歸模型元線

41、性回歸模型0112201 , iiikikiikijjiyxxxyYixXii其中:是因變量 在第 個樣本點(diǎn)上的取值為未知的總體參數(shù)自變量在第 個樣本點(diǎn)上的取值是第 個隨機(jī)誤差項的取值一、最小二乘法一、最小二乘法 多元回歸方程多元回歸方程 殘差平方和(殘差平方和(Sum of Squares for Error)01122 Residuals(: (- )iiikikiiiiiybb xb xb xyyey y殘差)MinxbxbbyyyeSSEikkiniiiniinii211102112)( )(參數(shù)估計的參數(shù)估計的矩陣記法矩陣記法:101111121221 () 11, , 1kkknn

42、knBX XX YbxxybxxyBXYbxxy其中,記二、二、 擬和優(yōu)度擬和優(yōu)度 復(fù)測定系數(shù)復(fù)測定系數(shù)(Coefficient of Multiple Determination) 問題:問題:測定系數(shù)是否越大越好? 當(dāng)增加變量個數(shù),而樣本容量過小時,會出現(xiàn)過當(dāng)增加變量個數(shù),而樣本容量過小時,會出現(xiàn)過度擬和現(xiàn)象。度擬和現(xiàn)象。 1R02線性回歸模型預(yù)測點(diǎn)Oyx多項式模型預(yù)測點(diǎn)新數(shù)據(jù)點(diǎn) 調(diào)整的測定系數(shù)調(diào)整的測定系數(shù)(Adjusted Coefficient of Determination) 220RR假設(shè)檢驗假設(shè)檢驗1 . F-test :在:在 Y 與與 X1 , X2 , Xk 之間是之間

43、是否存在線性關(guān)系否存在線性關(guān)系0:210kH2. t 檢驗檢驗 Xj 在解釋在解釋 Y 時是否是一個有用的變量時是否是一個有用的變量? 0: , 0:10jjHH當(dāng) Significance F 0.05時, F檢驗通過。當(dāng)P-value 0.05時, t檢驗通過分行分行編號編號不良貸款不良貸款(億元)(億元)各項貸款余額各項貸款余額(億元)(億元)本年累計應(yīng)收貸款本年累計應(yīng)收貸款(億元)(億元)貸款項目個數(shù)貸款項目個數(shù)(個)(個)本年固定資產(chǎn)投資額本年固定資產(chǎn)投資額(億元)(億元)10.967.36.8551.921.1111.319.81690.934.8173.07.71773.743.

44、280.87.21014.557.8199.716.51963.262.716.22.212.271.6107.410.71720.2812.5185.427.11843.891.096.11.71055.9102.672.89.11464.3110.364.22.11142.7124.0132.211.22376.7130.858.66.01422.8143.5174.612.726117.11510.2263.515.634146.7163.079.38.91529.9170.214.80.6242.1180.473.55.91125.3191.024.75.0413.4206.8139.

45、47.22864.32111.6368.216.832163.9221.695.73.81044.5231.2109.610.31467.9247.2196.215.81639.7253.2102.212.01097.1例題:例題: 某商業(yè)銀行某商業(yè)銀行25家分行家分行2002年的主要業(yè)務(wù)數(shù)據(jù)年的主要業(yè)務(wù)數(shù)據(jù)SUMMARY OUTPUT回歸統(tǒng)計Multiple R 0.893087R Square 0.797604Adjusted R Square0.757125標(biāo)準(zhǔn)誤差 1.778752觀測值25方差分析dfSSMSF Significance F回歸分析4 249.371262.3428

46、19.70404 1.04E-06殘差20 63.279193.16396總計24 312.6504Coefficients 標(biāo)準(zhǔn)誤差t StatP-value Lower 95%Upper 95% 下限 95.0% 上限 95.0%Intercept-1.02164 0.782372 -1.30582 0.206434 -2.653640.61036 -2.653640.61036X Variable 10.040039 0.010434 3.837495 0.001028 0.018275 0.061804 0.018275 0.061804X Variable 20.148034 0.0

47、78794 1.878738 0.074935 -0.01633 0.312396 -0.01633 0.312396X Variable 30.014529 0.083033 0.174983 0.862853 -0.15867 0.187733 -0.15867 0.187733X Variable 4-0.02919 0.015073 -1.936770.06703 -0.06063 0.002249 -0.06063 0.002249Coefficients 標(biāo)準(zhǔn)誤差t StatP-value Lower 95%Intercept-1.02164 0.782372 -1.30582 0

48、.206434 -2.653640.61036 -2.653640.61036X Variable 10.040039 0.010434 3.837495 0.001028 0.018275 0.061804 0.018275 0.061804X Variable 20.148034 0.078794 1.878738 0.074935 -0.01633 0.312396 -0.01633 0.312396X Variable 30.014529 0.083033 0.174983 0.862853 -0.15867 0.187733 -0.15867 0.187733X Variable 4

49、-0.02919 0.015073 -1.936770.06703 -0.06063 0.002249 -0.06063 0.0022494.6 變量篩選方法變量篩選方法 1. 向后篩選法向后篩選法 (Backward Elimination) 1)起始:所有自變量)起始:所有自變量X1 Xk 均包含均包含 在模型中;在模型中; 如果如果 t-test都顯著,則都顯著,則X1 Xk 均包含在模型中;均包含在模型中; 如果如果 存在若干存在若干 t-test不通過的參數(shù),則先把不通過的參數(shù),則先把 p-value最最大的變量刪除。大的變量刪除。 2)對剩余的()對剩余的(k-1) 個變量做回歸方

50、程個變量做回歸方程, 在在t-test不通過不通過的變量中,刪除的變量中,刪除p-value最大的變量;最大的變量; 3)重復(fù)以上步驟。直到模型中所以變量均通過)重復(fù)以上步驟。直到模型中所以變量均通過 t-test。 )( )( )( )( 21022110kkkttttXbXbXbbY 2.向前選擇法向前選擇法 (Foreword Selection) 1)起始:模型中沒有任何變量。分別計算)起始:模型中沒有任何變量。分別計算Y與每一個與每一個 Xj 的一元線性回歸模型。的一元線性回歸模型。 選擇選擇t-test值最大的變量首先進(jìn)入模型(不妨設(shè)值最大的變量首先進(jìn)入模型(不妨設(shè)X1). 2)對

51、剩余的()對剩余的(k-1)個變量分別做二元回歸方程,個變量分別做二元回歸方程, 在所有通過在所有通過 t-test 的變量中,選擇的變量中,選擇 p-value最小進(jìn)入方程最小進(jìn)入方程 3)重復(fù)以上步驟,直到模型外所有變量均不能通過)重復(fù)以上步驟,直到模型外所有變量均不能通過 t-test。 )( )( , 2 , 1 0jjjjttkjxbay )( )( )( , 2 1011jjjjtttkjxbxbay3. Stepwise Regression(逐步回歸法)(逐步回歸法) 前進(jìn)法的問題:前進(jìn)法的問題: 一旦某自變量進(jìn)入模型后,它就永遠(yuǎn)留在一旦某自變量進(jìn)入模型后,它就永遠(yuǎn)留在模型中。

52、然而,隨著其他自變量的引入,模型中。然而,隨著其他自變量的引入,一些先進(jìn)入模型的變量的作用會變得不再一些先進(jìn)入模型的變量的作用會變得不再顯著。顯著。 向后法的問題:向后法的問題: 一旦某自變量被刪除后,就永遠(yuǎn)不再進(jìn)入一旦某自變量被刪除后,就永遠(yuǎn)不再進(jìn)入模型。然而,隨著其他自變量被刪除,它模型。然而,隨著其他自變量被刪除,它的作用有可能會顯著起來。的作用有可能會顯著起來。 Stepwise Regression(逐步回歸法)(逐步回歸法) 對于模型外部的變量,只要還能提供顯著的解釋作對于模型外部的變量,只要還能提供顯著的解釋作用,則可以再次進(jìn)入模型。而在模型內(nèi)部的變量,用,則可以再次進(jìn)入模型。而

53、在模型內(nèi)部的變量,只要它的只要它的 t t檢驗不再顯著,則可以從模型中刪除。檢驗不再顯著,則可以從模型中刪除。方法:方法: 邊進(jìn)邊退邊進(jìn)邊退起始:同前進(jìn)法;起始:同前進(jìn)法;結(jié)束:模型外所有變量均不能通過結(jié)束:模型外所有變量均不能通過t t檢驗。檢驗。t進(jìn)進(jìn) 為了避免變量進(jìn)出循環(huán),一般選取為了避免變量進(jìn)出循環(huán),一般選取 t-test的進(jìn)、出的進(jìn)、出水平不等:水平不等: 原則:原則:一旦出去,就很難進(jìn)來。一旦出去,就很難進(jìn)來。)刪除變量的臨界值()選入變量的臨界值(出進(jìn)出進(jìn)10. 005. 0(0.10) (0.05) ttttt出出分行分行編號編號不良貸款不良貸款(億元)(億元)各項貸款余額各項

54、貸款余額(億元)(億元)本年累計應(yīng)收貸款本年累計應(yīng)收貸款(億元)(億元)貸款項目個數(shù)貸款項目個數(shù)(個)(個)本年固定資產(chǎn)投資額本年固定資產(chǎn)投資額(億元)(億元)10.967.36.8551.921.1111.319.81690.934.8173.07.71773.743.280.87.21014.557.8199.716.51963.262.716.22.212.271.6107.410.71720.2812.5185.427.11843.891.096.11.71055.9102.672.89.11464.3110.364.22.11142.7124.0132.211.22376.7130.

55、858.66.01422.8143.5174.612.726117.11510.2263.515.634146.7163.079.38.91529.9170.214.80.6242.1180.473.55.91125.3191.024.75.0413.4206.8139.47.22864.32111.6368.216.832163.9221.695.73.81044.5231.2109.610.31467.9247.2196.215.81639.7253.2102.212.01097.1例題:例題: 某商業(yè)銀行某商業(yè)銀行25家分行家分行2002年的主要業(yè)務(wù)數(shù)據(jù)年的主要業(yè)務(wù)數(shù)據(jù)SPSS 分析分析

56、 回歸回歸 線性線性 不良貸款額不良貸款額 = -0.433 + 0.05 各項貸款余額各項貸款余額 - 0.032 本年度固定資產(chǎn)投資本年度固定資產(chǎn)投資 從模型結(jié)果看,各項貸款余額顯然是影響不良貸款增加的一個重從模型結(jié)果看,各項貸款余額顯然是影響不良貸款增加的一個重要因素。但是值得注意的是:在第二個模型中,對關(guān)本年度固定資產(chǎn)要因素。但是值得注意的是:在第二個模型中,對關(guān)本年度固定資產(chǎn)投資額變量作用的解釋卻是很困難的。從模型來看,似乎增加本年度投資額變量作用的解釋卻是很困難的。從模型來看,似乎增加本年度固定資產(chǎn)投資額,可以使不良貸款額下降,這顯然與人們的一般認(rèn)識固定資產(chǎn)投資額,可以使不良貸款額

57、下降,這顯然與人們的一般認(rèn)識不相符合。不相符合。 不良貸款不良貸款(億元)億元)各項貸款余額各項貸款余額(億元)(億元)本年固定資產(chǎn)投資額本年固定資產(chǎn)投資額(億元)(億元)不良貸款不良貸款(億元)億元)10.51850.7797各項貸款余額(億元)各項貸款余額(億元)0.843610.8436本年固定資產(chǎn)投資額(億本年固定資產(chǎn)投資額(億元)元)0.51850.77971可以放心使用這個模型了嗎?可以放心使用這個模型了嗎?3個變量之間的個變量之間的Pearson相關(guān)系數(shù)相關(guān)系數(shù)不良貸款額不良貸款額= -0.433 + 0.05各項貸款余額各項貸款余額 - 0.032本年度固定資產(chǎn)投資本年度固定資

58、產(chǎn)投資Dota2Dota2國際邀請賽國際邀請賽全球全球DotA2DotA2注冊玩家達(dá)到注冊玩家達(dá)到20002000多萬人。多萬人。20142014年年DotA2DotA2的的101101場賽事總獎場賽事總獎金約合一億元人民幣,破電子競技?xì)v史最高獎金池記錄。金約合一億元人民幣,破電子競技?xì)v史最高獎金池記錄。20142014年個人技能年個人技能(Solo賽)賽): 中、美國隊員都不占絕對優(yōu)勢中、美國隊員都不占絕對優(yōu)勢在冒泡賽和淘汰賽中:在冒泡賽和淘汰賽中:中國隊表現(xiàn)突出中國隊表現(xiàn)突出經(jīng)過淘汰賽:經(jīng)過淘汰賽:中國隊獲得冠、亞軍中國隊獲得冠、亞軍美國隊獲得季軍美國隊獲得季軍數(shù)據(jù)分析:數(shù)據(jù)分析:戰(zhàn)斗行為

59、變量戰(zhàn)斗行為變量問題:什么是影響戰(zhàn)斗結(jié)果的主要因素?問題:什么是影響戰(zhàn)斗結(jié)果的主要因素?中、美戰(zhàn)隊的行為比較分析中、美戰(zhàn)隊的行為比較分析顯著性檢驗顯著性檢驗反隱眼控符反補(bǔ)發(fā)起戰(zhàn)斗團(tuán)殺4.7 曲線回歸問題曲線回歸問題 (Nonlinear Regression Models) 問題:因變量與自變量之間是曲線關(guān)系。問題:因變量與自變量之間是曲線關(guān)系。 例:例: 環(huán)比發(fā)展速度近似常量,即時間序列能按環(huán)比發(fā)展速度近似常量,即時間序列能按照一種不變的比率增長:照一種不變的比率增長: 一種處理方法:一種處理方法: 將非線性關(guān)系線性化,然后再運(yùn)用線性模型。將非線性關(guān)系線性化,然后再運(yùn)用線性模型。ttttba

60、YbYY 1 1. 多項式模型(多項式模型(Polynomial Model) 可以對方程做變換:可以對方程做變換: 原方程變換為多元線性模型:原方程變換為多元線性模型:ppXXXXXXYY221ppXXXY22110ppXXXY2210 2. 指數(shù)模型(指數(shù)模型(Exponential Model) 令:令: 反變換:反變換:bXeaYbXaYlnlnXYbaYY1010* lnln*XbeaYbea1 ,0兩邊取對數(shù):兩邊取對數(shù): 3. 冪指數(shù)模型(冪指數(shù)模型(Multiplicative Model) 變換方法:變換方法:2121bbXXaY*22*110*221102*21*1*221

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論