




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、公司年銷售額的分析摘 要公司年銷售額通常和很多因素有關,但它們之間并不是確定性關系,所以我們用回歸分析來處理,并建立了多元線性回歸模型。本文用最小二乘的方法給出了變量間相關關系的回歸方程,針對各因素對公司年銷售額的影響我們與偏回歸平方和聯(lián)系起來,并將各因素的影響程度進行了排序。還通過F檢驗和T檢驗分別驗證了回歸方程的顯著性和方程系數(shù)的顯著性。最后我們采用了逐個剔除的方法找出了影響年銷售額的主要因素,并且建立了新的回歸方程,再次進行檢驗,新回歸方程高度顯著,最后得到了個人可支配收入、價格、投資和廣告費密切相關的結論。第一問:我們首先對附表1的數(shù)據(jù)進行處理,利用MATLAB對殘差向量進行分析,剔除
2、其中的異常點。然后建立起多元線性回歸模型,采用最小二乘的方法來估計回歸方程的參數(shù)。我們引入偏回歸平方和的概念來判定各因素對年銷售額的影響程度,并對各因素的影響程度由深到淺進行了排序。第二問:通過對回歸平方和和剩余平方和的分析,并且運用F檢驗法來判定線性回歸方程的顯著性。由于回歸方程顯著并不意味著每個自變量,,對因變量的影響都是重要的。所以我們對方程系數(shù)的顯著性用T檢驗法進行了檢驗。最后通過逐個剔除的方法找出了其中的主要因素,主要因素為:個人可支配的收入、價格、投資、廣告費這四個方面。第三問:通過逐個剔除的方法建立了新的回歸方程,并對新的回歸方程進行顯著性檢驗,對方程系數(shù)進行顯著性檢驗。得到了公
3、司的年銷售額與個人可支配收入、價格、投資和廣告費密切相關的結論。關鍵詞:多元線性回歸 最小二乘法 F檢驗 T檢驗 偏回歸平方和1 問題重述在經(jīng)濟流通領域中,某公司的年銷售額()與個人可支配的收入();商人的回扣();價格();研究與發(fā)展費();投資();廣告費();銷售費用();總的工業(yè)廣告預算()等有關。附表1中是某公司的原始數(shù)據(jù)。建立模型,分析各因素對年銷售額的影響程度。并對所做模型進行檢驗,找出影響銷售額的主要因素。最后分析主要因素與銷售額的關系,并給出結論。2 問題分析對于公司年銷售額的分析,我們知道,和有關的變量有8個,研究與變量,,之間的定量關系的問題為多元回歸問題。又因為許多多元
4、非線性回歸問題都可以化為多元線性回歸問題,所以對于本問題我們建立了多元線性回歸的數(shù)學模型。第一問:首先對附表1的數(shù)據(jù)進行處理,對殘差向量進行,剔除其中的異常點。然后我們建立了多元線性回歸的數(shù)學模型,并采用了最小二乘法來估計參數(shù)。把模型寫成矩陣的形式,化簡整理得其正規(guī)方程組,通過對正規(guī)方程組的求解,最后得到回歸方程。對于各因素對年銷售額的影響程度,由于利用偏回歸平方和可以衡量每個變量在回歸中所起的作用大?。从绊懗潭龋?,我們對每個變量的偏回歸平方和進行了計算,最后把影響程度由深到淺的各因素進行了排序。第二問:回歸方程的顯著性檢驗:事先我們并不能斷定隨機變量與一般變量,,之間是否確有線性關系。在求
5、線性回歸方程前線性回歸模型只是一種假設,所以在求出線性回歸方程之后,我們需要對其進行統(tǒng)計檢驗。將總的平方和分解為回歸平方和和剩余平方和,運用F檢驗法來判定線性回歸方程的顯著性。回歸系數(shù)的顯著性檢驗:由于回歸方程顯著并不意味著每個自變量,,對因變量的影響都是重要的。而我們要找出響銷售額的主要因素,即從回歸方程中剔除那些次要的、可有可無的變量,這就需要我們對每個變量進行考察。顯然,如果某個變量對的作用不顯著,那么在多元線性回歸模型中,它前面的系數(shù)就可以取值為零。因此,檢驗因子是否顯著等價于檢驗假設 。最后再運用T檢驗法來辨別模型中哪些因子是顯著的。第三問:由于回歸系數(shù)之間存在相關性,當從原回歸方程
6、中剔除一個變量時,其他變量,特別是與它密切相關的一些變量的回歸系數(shù)就會受到影響,剔除一個變量后,這個變量對的影響很大部分轉(zhuǎn)加到另一個變量對的影響上。所以,我們對回歸系數(shù)進行一次檢驗后,只能剔除所有不顯著因子中值最小的,然后重新建立新的回歸方程,再對新的回歸系數(shù)逐個進行檢驗,直到余下的回歸系數(shù)都顯著為止。3 符號說明表一符號說明影響年銷售額的因素。()年銷售額()相互獨立且服從同一正態(tài)分布的隨機變量()變量的偏回歸平方和總平方和回歸平方和剩余平方和待估計系數(shù)參數(shù)()的回歸值參數(shù)的最小二乘估計()4 模型假設1.影響銷售額的各個因素相互之間關聯(lián)性不大,即相互獨立。2.異常值認為是人為因素引起的,可
7、將其剔除。5 模型的建立與求解第一問:5.1模型 “多元線性回歸的數(shù)學模型” 5.1.1 模型的建立1、處理數(shù)據(jù)我們先通過MATLAB(程序見附錄1)對原始數(shù)據(jù)進行檢驗,對殘差向量進行分析,得到了殘差向量分析圖,剔除其中的異常點。2、設隨機變量假如變量與另外8個變量,,的內(nèi)在聯(lián)系是線性的,它的第次試驗數(shù)據(jù)是 =1,2,,8 (1)那么這一組數(shù)據(jù)可以假設有如下的結構式: (2)其中,是9個待估計參數(shù),,是8個可以精確測量的一般變量,是38個相互獨立且服從同一正態(tài)分布的隨機變量,這就是多元線性回歸的數(shù)學模型。 令, , , 那么多元線性回歸的數(shù)學模型(2)可以寫成矩陣形式 (3)其中是38維隨機向
8、量,它的分量是相互獨立的。3、參數(shù)的最小二乘估計為了估計參數(shù),我們采用最小二乘估計法。設分別是參數(shù),的最小二乘估計,則回歸方程為 (4)由最小二乘法知道,應使得全部觀察值與回歸值的偏差平方和達到最小,即使 (5)所以是的非負二次式,最小值一定存在。根據(jù)微積分學中的極值原理,應是下列正規(guī)方程組的解: (6)顯然,正規(guī)方程組的系數(shù)矩陣是對稱矩陣,用來表示,則,且其右端常數(shù)項矩陣亦可采用矩陣和來表示:。所以可以得到回歸方程的回歸系數(shù): (7)4、由于利用偏回歸平方和可以衡量每個變量在回歸中所起的作用大?。从绊懗潭龋O是p個變量所引起的回歸平方和,是p-1個變量所引起的回歸平方和(即除去),則偏回
9、歸平方和為:=-=-= (8)就是去掉變量后,回歸平方和所減少的量。5.1.2 模型的求解1、數(shù)據(jù)篩選通過MATLAB(程序見附錄1)作圖如下:此時可見第八個點、第十四個點和第二十八個點是異常點,于是刪除原始數(shù)據(jù)中第八行和第十四行和第二十八行數(shù)據(jù)。2、回歸方程的求解 由附表1和所得的公式(7),運用MATLAB進行編程(程序見附錄2),可得正規(guī)矩陣的系數(shù)矩陣為:回歸系數(shù)為:, , , 回歸方程為:3、偏回歸平方和的比較運用MATLAB進行編程(程序見附錄2),得到各因素的偏回歸平方和:()0.33840.00300.36850.10090.14291.24180.14720.1963根據(jù)的大小
10、可判斷各因素對年銷售額的影響程度:第二問:5.2 模型 5.2.1 模型的建立1、設隨機變量回歸方程的顯著性檢驗(F檢驗):因為是第個試驗點上的回歸值,顯然總的偏差平方和為 (9)它的自由度為,又因為,其中回歸平方和為 (10)是由于引入變量,,后引起的,剩余平方和 (11)它是由于實驗誤差和其他一些因素引起的。如果變量y與變量,,之間無線性關系,則模型(2)中的一次項系數(shù)應均為零。所以要檢驗變量y與變量,,之間是否有線性關系,即要檢驗假設 (12)是否成立,這一點可以通過比較和來實現(xiàn)??梢宰C明:在滿足矩陣X滿秩和假設成立的條件下, (13)和相互獨立,從而 (14)這樣就用統(tǒng)計量F檢驗假設成
11、立與否,若對于給定的一組數(shù)據(jù),算得 (15)在顯著水平下,認為回歸方程有顯著意義。2、方程系數(shù)的顯著性檢驗(T檢驗):某個自變量如果對作用不顯著, 則它的系數(shù)就應取值為0, 因此檢驗每個自變量是否顯著, 就要檢驗假設:在假設下, 可應用檢驗: (16)其中為矩陣的對角線上第個元素。對給定的檢驗水平, 從分布表中可查出與對應的臨界值, 如果有, 則拒絕假設, 即認為與0有顯著差異, 這說明對有重要作用不應剔除; 如果有則接受假設, 即認為成立, 這說明對不起作用, 應予剔除。采用,來檢驗回歸系數(shù)是否顯著。5.2.2 模型的求解1、回歸方程的顯著性檢驗:運用MATLAB進行編程(程序見附錄2)取,
12、。所以回歸方程高度顯著。2、方程系數(shù)的顯著性檢驗:第一次檢驗對所得各項回歸系數(shù)進行t檢驗t2.78070.26012.90181.51821.80715.32661.83422.1176剔除第一次檢驗所有不顯著因子中t值最小的因子t2.8291剔除2.98811.53001.82135.44031.87532.2608剔除第二次檢驗所有不顯著因子中t值最小的因子t3.63623.6725剔除1.50005.22661.41372.0924剔除第三次檢驗所有不顯著因子中t值最小的因子t9.73803.38112.15114.9474剔除1.9319剔除第四次檢驗所有不顯著因子中t值最小的因子t9
13、.14992.93842.27274.9818剔除計算知:,所以,顯著,其余變量對貢獻不大,應剔除。5.3 模型 由第二問得到,是影響銷售額的主要因素,我們只考慮這四個因素與銷售額的關系,再根據(jù)第一問的方法,運用MATLAB求解,重新建立回歸方程:然后再次檢驗新的回歸方程的顯著性,得,所以回歸方程高度顯著。又因為(由上問可知)所以自變量,高度顯著。最后得出結論:銷售額的大小與個人可支配收入、價格、投資和廣告費密切相關。6 模型的評價6.1模型的優(yōu)點 本文對于各種因素對于銷售額的影響建立了多元線性回歸模型,全面綜合考慮了各個方面的因素,避免了單一因素分析的不準確性,得出了合理的數(shù)學模型。并且通過
14、各因素的顯著性分析,找到了影響銷售額的主要因素,較符合實際情況,模型可靠,并且模型相對簡單,利于操作;該方法不僅適用于本題,也適用于其他方面的數(shù)據(jù)預測,有實際背景,可運用于實踐,具有廣泛適用性。6.2模型的缺點 本文忽略了除了所給因素之外的因素對銷售額的影響,與實際問題存在偏差。同時是在假設各因素相互獨立的情況下對銷售額的影響進行分析,可能會導致誤差7 模型的改進與推廣模型中得到最優(yōu)回歸方程的方法是從包含全部變量的回歸方程中逐次剔除不顯著因子,這種方法是在不顯著因子不多時采用,當不顯著因子較多時,則工作量將會相當大,因為每剔除一個變量就得重新計算回歸系數(shù)。鑒于以上問題,我們引入了逐步回歸分析的
15、方法,它的基本思想是將因子一個個引入,引入因子的條件是,該因子的偏回歸平方和經(jīng)檢驗時顯著的。同時,每引入一個新因子后,要對老因子逐個檢驗,將偏回歸平方和變?yōu)椴伙@著的因子剔除。這種方法不需要計算偏相關系數(shù),計算較簡便,并且由于每步都作檢驗,因而保證了最后所得的方程中所有因子都是顯著的。若回歸方程是擬合好的,就可以進一步利用它來進行預報和控制。預報問題,用統(tǒng)計數(shù)學的語言來說就是一個區(qū)間估計問題。在建立氣象預報、地震預報、自動控制等數(shù)學模型時,都可以用到本文的模型。8 參考文獻1 馬新民,王逸迅. 概率與數(shù)理統(tǒng)計M. 北京:機械工業(yè)出版社,2010.2 劉衛(wèi)國. MATLAB程序設計與應用M. 北京
16、:高等教育出版社,2009.3 茆詩松. 回歸分析及其試驗設計M. 上海:華東師范大學出版社,1986.9 附錄1、篩選數(shù)據(jù)程序%data(14,:)=;%data(28,:)=;%data(8,:)=;n=35;m=8;alpha=0.05;y=data(:,9);x1=data(:,1);x2=data(:,2);x3=data(:,3);x4=data(:,4);x5=data(:,5);x6=data(:,6);x7=data(:,7);x8=data(:,8);X=ones(n,1),x1,x2,x3,x4,x5,x6,x7,x8;b,bint,r,rint,s=regress(y,
17、X,alpha);% b 回歸系數(shù)% bint 回歸系數(shù)的區(qū)間估計% r 殘差% rint 殘差置信區(qū)間% stats 用于檢驗回歸模型的統(tǒng)計量,有三個數(shù)值:相關系數(shù)R2、F值、與F對應的概率p,相關系數(shù)R2越接近1,說明回歸方程越顯著;%F > F1-(k,n-k-1)時拒絕H0,F(xiàn)越大,說明回歸方程越顯著;與F對應的概率p 時拒絕H0,回歸模型成立。% Y為n*1的矩陣;% X為(ones(n,1),x1,xm)的矩陣;% alpha顯著性水平s2=sum(r.2)/(n-m-1);b,bint,s,s2rcoplot(r,rint); %用這個圖來來做參差及其置信區(qū)間的圖,如果數(shù)據(jù)
18、的置信區(qū)間不包含零點,則可認為這個數(shù)據(jù)是異常的,應把它剔除2、求多元回歸方程并且進行顯著性檢驗m,n=size(data);Y=data(:,9);X=zeros(38,9);X(:,1)=1;Z=zeros(38,1);t=zeros(1,8);Q=zeros(1,8);for i=1:m for j=2:9 X(i,j)=data(i,j-1); endendA=X'*X;C=inv(A);b=C*X'*Y; %求多元線性回歸方程的系數(shù)for i=1:mZ(i)=b(1)+b(2)*data(i,1)+b(3)*data(i,2)+b(4)*data(i,3)+b(5)*d
19、ata(i,4)+b(6)*data(i,5)+b(7)*data(i,6)+b(8)*data(i,7)+b(9)*data(i,8);end%將數(shù)據(jù)代入回歸方程,求出理論值for i=2:9 Q(i-1)=(b(i).*b(i)/C(i,i); %求各因素所占比重endQft=m-8-1;St=0;Sf=0;for i=1:m St=St+(Y(i)-Z(i).*(Y(i)-Z(i); %求S剩 Sf=Sf+(Z(i)-mean(Y).*(Z(i)-mean(Y); %求S總endp=sqrt(St/ft)for i=2:9 t(i-1)=abs(b(i)/(p*sqrt(C(i,i); %t檢驗endbtStSfZCF=(Sf/8)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 住宅小區(qū)車庫使用權購買合同
- 商業(yè)地產(chǎn)場地租賃及物業(yè)管理合同
- 車輛質(zhì)押貸款信用評估合同
- 高檔寫字樓停車位產(chǎn)權轉(zhuǎn)移及管理服務合同
- 夜游打卡活動方案
- 大班植樹節(jié)班隊活動方案
- 大潤發(fā)珠寶活動方案
- 多元與包容活動方案
- 夏日避暑養(yǎng)老活動方案
- 外貿(mào)搞促銷活動方案
- 個人信息保護合規(guī)審計師CCRC-PIPCA含答案
- 陰道松弛激光治療
- 2025至2030年中國電商導購行業(yè)市場運營態(tài)勢及投資前景趨勢報告
- 河北省邢臺市卓越聯(lián)盟2024-2025學年高二下學期第三次考試(6月)語文試卷(圖片版含解析)
- 2025年佛山市南海區(qū)民政局招聘殘疾人專項工作人員題庫帶答案分析
- 公寓中介渠道管理制度
- PICC尖端心腔內(nèi)心電圖定位技術
- 2024東莞農(nóng)商銀行社會招聘筆試歷年典型考題及考點剖析附帶答案詳解
- 肺性腦病的護理
- 混凝土銷售技能培訓課件
- 老年外科患者圍手術期營養(yǎng)支持中國專家共識(2024)解讀課件
評論
0/150
提交評論