版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、4:回歸分析0:引言:1:在國民經(jīng)濟產(chǎn)值與資金、勞動力的關(guān)系,我們用線性最小二乘法或非線性最小二乘法估計了其中的參數(shù)。有無進一步研究的必要?2:從數(shù)理統(tǒng)計的觀點 看,這里涉及的都是隨機變量,我們根據(jù)樣本計算出的那些系數(shù),只是它們的一個(點)估計,如果置信區(qū)間太大,甚至包含了零點,那么系數(shù)的估計值是沒有多大意義的。另外,也可以用方差分析方法對模型的誤差進行分析,對擬合的優(yōu)劣給出評價,簡單地說,回歸分析就是對擬合問題作的統(tǒng)計分析。3:舉一個例子說明統(tǒng)計分析的必要性:(1)問題甲得到一組數(shù)據(jù):X=0,1,2,3,4,Y=1.0,1.3,1.5,2.0,2.3;問題乙得到一組數(shù)據(jù):X=0,1,2,3,
2、4,Z=0.6,1.95,0.9,2.85,1.8;(2)兩組數(shù)據(jù)的散點圖:Xk,Yk用+表示; Xk,Zk用*表示。(3)MATLAB 實現(xiàn) to huiguibiyao.mX=0,1,2,3,4;Y=1.0,1.3,1.5,2.0,2.3;Z=0.6,1.95,0.9,2.85,1.8;a=polyfit(X,Y,1)a;b=polyfit(X,Z,1)b;plot(X,Y,+r);hold onplot(X,Z,*b);hold onfplot(0.33*x+0.96,0 4);hold on得到:a=0.33 0.96; b=0.33 0.96.結(jié)論:兩者擬合的結(jié)果是同一條直線y=0.
3、33x+0.96(z=0.33x+0.96)但是它們的意義卻大不一樣。人們對結(jié)果a的信任度很高;人們對結(jié)果b的信任度很低.4:統(tǒng)計分析的任務(wù):(對可信度作出定量評價)建立因變量y與自變量之間x1,x2,xm的回歸模型(經(jīng)驗公式);對回歸模型的可信度進行檢驗;判斷每個自變量xi(i=1,2,m)對y的影響是否顯著;診斷回歸模型是否適合這組數(shù)據(jù);利用回歸模型對y進行預(yù)報或控制。二實際問題:1:合金強度與碳含量:合金強度y與其中碳含量x有比較密切的關(guān)系。(如下):用polyfit(x,y,1)擬合得:y=ax+b;a=140.6194,b=27.0269;上述結(jié)果的可信度?x對y影響是否顯著?有無異
4、常點?2:年齡與運動能力:將17至29歲的運動員每兩周歲一組分為7組,每組兩人測量起旋轉(zhuǎn)定向能力,以考察年齡對這種運動能力的影響,現(xiàn)得到一組數(shù)據(jù)如下表,試建立二者的關(guān)系:散點圖形狀:兩端低,用二次曲線擬合:ploy(X,Y,2)但需進一步分析?3:商品銷售量與價格: 某廠生產(chǎn)的一種電器的銷售量y與競爭對手的價格x1和本廠的價格x2有關(guān):試根據(jù)這些數(shù)據(jù)建立與和的關(guān)系式,對得到的模型和系數(shù)進行檢驗;如果某市本廠產(chǎn)品售價160(元),競爭對手的售價170元,預(yù)測商品在該市的銷售量。三:多元線性回歸: 回歸分析中最簡單的形式是:y=0+1x均為標(biāo)量, 0,1為回歸系數(shù),稱一元線性回歸。推廣:x是多元變
5、量:這里y對回歸系數(shù)=(0,1,m)是線性的,稱為多元線性回歸。不難看出,對x作變換,(2)將化為(1)的形式,所以(1)稱為線性回歸的標(biāo)準(zhǔn)形。1:模型: 在回歸分析中自變量x=(x1,x2, ,xm)是影響因變量的主要因素,是人們能控制的或能觀察的,而y還受到隨機因素的干擾,可以合理地假定這種干擾服從0均值的正態(tài)分布,于是模型記作: 現(xiàn)得到n個獨立觀測數(shù)據(jù)(yi,xi1,xim),i=1,2,n,nm,由(3)得:2:參數(shù)估計:(1)方法: 用最小二乘法估計模型(3)中參數(shù)。 由(4)式這組數(shù)據(jù)的誤差平方和為:(2)殘差:稱為殘差平方和(或剩余平方和)。即3:統(tǒng)計分析:(不證明,直接給出結(jié)果
6、)(5):回歸平方和:其中Q是由(10)式定義的殘差平方和,反映隨機誤差對y的影響。U稱為回歸平方和,反映自變量對y的影響。4:回歸模型的假設(shè)檢驗:(1)檢驗的必要性:(2)檢驗的方法一:(F分布檢驗) 可令原假設(shè)為H0:j=0(j=1,,m);注意:接受H0只說明y與x1,,xm線性關(guān)系不顯著,可能存在非線性關(guān)系,如平方關(guān)系。5:回歸系數(shù)的假設(shè)檢驗和區(qū)間關(guān)系。(1)原因:當(dāng)上面H0被拒絕時(即線性模型成立時)j不全為0;但不排除其中若干個等于0;應(yīng)進一步做如下m個檢驗(j=1,m):(2)檢驗方法(t檢驗)思考:6:利用回歸模型進行預(yù)測:7:MATLAB實現(xiàn):(在MATLAB統(tǒng)計工具箱中用r
7、egress實現(xiàn)多元線性回歸)(1)用法:Y,X同上;alpha為顯著性水平(確省時設(shè)定為0.05);b,bint為回歸系數(shù)估計值和它們的置信區(qū)間;r,rint為殘差(向量)及置信區(qū)間;stats是用于檢驗回歸模型的統(tǒng)計量,有3個數(shù)值:第1個是R*R(見(16)式),第2個是F(見(15)式),第3個是與F對應(yīng)的概率p,p時拒絕H0,回歸模型成立。Rcoplot(r,rint)畫殘差及置信區(qū)間圖。四:幾個實際問題用回歸模型求解。1:合金強度與碳含量問題:(1)建立模型:(2)編程(用regress和rcoplot求解)to hejing.mx1=0.1:0.01:0.18;x=x1,0.2,0
8、.21,0.23;Y=42,41.5,45,45.5,45,47.5,49,55,50,55,55.5,60.5;X=ones(12,1),x;b,bint,r,rint,stats=regress(Y,X);bbintstatsrcoplot(r,rint);(3)結(jié)果:殘差圖除第8個數(shù)據(jù)外,其余殘差置信區(qū)間均包含0點,剔除第8個點。(即第8個點為異常點)(4)剔除異常點后重新計算:to hejing2.mb = 27.0992 137.8085bint = 23.8563 30.3421 117.8534 157.7636stats = 0.9644 244.0571 0.00002:商品
9、銷售量與價格問題:(1)建立模型:(2)編程計算:to shangping.mX1=120,140,190,130,155,175,125,145,180,150;X2=100,110,90,150,210,150,250,270,300,250;Y=102,100,120,77,46,93,26,69,65,85;X=ones(10,1) X1 X2;b,bint,r,rint,stats=regress(Y,X);bbintstats(3)結(jié)果:b = 66.5176 0.4139 -0.2698bint = -32.5060 165.5411 -0.2018 1.0296 -0.4611
10、 -0.0785stats = 0.6527 6.5786 0.0247五:多項式回歸及問題求解:1:多項式回歸的MATLAB實現(xiàn):(1)一元多項式回歸:(2)多元多項式回歸:rstool(X,Y,model,alpha);輸入數(shù)據(jù)X,Y分別為nm矩陣和n維向量,alpha為顯著性水平(缺省時為0.05);model由下列4個模型中選擇1個(用字符串輸入,缺省時設(shè)定為線性模型):2:運動能力問題求解:(1)選用二次模型:(2)編程計算:to yundong.mX1=17:2:29;X=X1,X1;y=20.48,25.13,26.15,30.0,26.1,20.3,19.35,24.35,28
11、.11,26.3,31.4,26.92,25.7,21.3;P,S=polyfit(X,y,2);P(3)結(jié)果:P = -0.2003 8.9782 -72.2150;a1=-0.2003 a2= 8.9782 a3=-72.2150.(4):檢驗:A:擬合圖:上面S是一個數(shù)據(jù)結(jié)構(gòu),用于它函數(shù)的計算;如Y,delta=polyconf(P,X,S);Y得到Y(jié)的擬合值:Y = Columns 1 through 7 22.5243 26.0582 27.9896 28.3186 27.0450 24.1689 19.6904 Columns 8 through 14 22.5243 26.058
12、2 27.9896 28.3186 27.0450 24.1689 19.6904。作X與Y的連續(xù)曲線,擬合效果如圖:B: 相關(guān)系數(shù)(R*R)和殘差(s):Y1=mean(y);requare=sum(Y-Y1).2)/sum(y-Y1).2)s=sqrt(sum(y-Y).2)/12)requare = 0.6980s = 2.0831(5)結(jié)論:尚能接受的結(jié)果。3:商品銷售量與價格模型的修正:(1)改用純二次模型:即:(2)編程計算:to shangpingerci.mX1=120,140,190,130,155,175,125,145,180,150;X2=100,110,90,150,210,150,250,270,300,250;y=102,100,120,77,46,93,26,69,65,85;X=X1 X2;rstool(X,y,purequadratic)(3)結(jié)果:A:得到如圖的交互式畫面:to shangpingerci.m給出兩幅圖形:左邊是x2(=151)固定時的曲線y(x1)及其置區(qū)間;右邊是x1(=188)固定時的曲線y(x2)及其置區(qū)間;在圖下方窗口,可改變x1,x2的值。B:Expor
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 婚慶行業(yè)前臺工作總結(jié)
- 定制家具設(shè)計師工作要點
- 《美麗的海洋世界》課件
- 購物服務(wù)員工作總結(jié)
- 前臺文員情緒智力提升方案計劃
- 《苗木霜害怎么預(yù)防》課件
- 2024年廣東省汕尾市公開招聘警務(wù)輔助人員輔警筆試自考題2卷含答案
- 2021年甘肅省嘉峪關(guān)市公開招聘警務(wù)輔助人員輔警筆試自考題2卷含答案
- 2023年四川省雅安市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2021年云南省楚雄自治州公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 甘肅科技重大專項計劃申報書模版
- 35kV線路工程電桿組立工程施工組織方案
- 畢業(yè)論文材料分揀裝置PLC控制系統(tǒng)方案
- 刑法涉及安全生產(chǎn)的16宗罪解讀
- 京東五力模型分析
- 電大《電氣傳動與調(diào)速系統(tǒng)》網(wǎng)絡(luò)課形考任務(wù)1-4作業(yè)及答案
- 銅精礦加工費簡析
- 機電拆除專項施工方案
- 變電站電氣一次工程監(jiān)理要點重點
- 足球?qū)m楏w育課教學(xué)大綱、教學(xué)計劃
- ASTMA153∕A153M-05鋼鐵制金屬構(gòu)件上鍍鋅層(熱浸)標(biāo)準(zhǔn)規(guī)范
評論
0/150
提交評論