統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析_第1頁
統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析_第2頁
統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析_第3頁
統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析_第4頁
統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析_第5頁
已閱讀5頁,還剩63頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

關(guān)于統(tǒng)計(jì)學(xué)實(shí)驗(yàn)方差回歸分析1第1頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五2方差分析(AnalysisofVariance,ANOVA)1928年由英國統(tǒng)計(jì)學(xué)家R.A.Fisher首先提出,為紀(jì)念Fisher,以F命名,故方差分析又稱為F檢驗(yàn)。第2頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五3方差分析(ANOVA)①檢驗(yàn)多個總體均值是否相等②研究一個或多個分類型自變量對一個數(shù)值型因變量的影響③有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個分類的自變量雙因素方差分析:涉及兩個分類的自變量無交互作用的雙因素方差分析;有交互作用的雙因素方差分析;第3頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五4

方差分析檢驗(yàn)假定

①總體是服從正態(tài)分布的;

②總體方差是相等的;③隨機(jī)樣本是獨(dú)立的。

第4頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五單因素方差分析用于檢驗(yàn)由單一因素影響的一個(或幾個相互獨(dú)立的)因變量按因素各水平分組的均值之間是否具有顯著性差異,也可用于進(jìn)行兩兩組間均值的比較;可通過One-WayANOVA對話框?qū)崿F(xiàn)。第5頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五6建立的假設(shè)組為:提出假設(shè)H0

:12…k

自變量對因變量沒有顯著影響,沒有系統(tǒng)誤差

H1:1,2,,k

不全相等自變量對因變量有顯著影響注意:拒絕原假設(shè),只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等第6頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五例1單因素方差分析某企業(yè)需要一種零件,現(xiàn)有三個不同的地區(qū)的企業(yè)生產(chǎn)的同種零件可供選擇,為了比較這三個零件的強(qiáng)度是否相同,每個地區(qū)的企業(yè)抽出6件產(chǎn)品進(jìn)行強(qiáng)度測試,其值如表所示。假設(shè)每個企業(yè)零件的強(qiáng)度值服從正態(tài)分布,試檢驗(yàn)這三個地區(qū)企業(yè)的零件強(qiáng)度是否存在顯著差異。地區(qū)強(qiáng)度樣本12311161108929810385310011899411510673583107976105116102第7頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五81、單擊分析(Analyze)

比較均值(CompareMeans)

單因素(

One-WayANOVA),打開對話框。步驟:2、從左框中選擇因變量”零件強(qiáng)度”進(jìn)入因變量框內(nèi),選擇“地區(qū)”進(jìn)入因子框內(nèi)。點(diǎn)擊確定。第8頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五9可以得到方差分析表由于F統(tǒng)計(jì)量值的P值明顯小于顯著性水平0.05,故拒絕假設(shè)H0,認(rèn)為這三個地區(qū)的零件強(qiáng)度有顯著差異。如果需要對各地區(qū)間的零件強(qiáng)度進(jìn)行進(jìn)一步的比較和分析,可以通過按紐選項(xiàng)Option選項(xiàng),contrast對比,PostHoc兩兩比較去實(shí)現(xiàn)。aF分布F(k-1,n-k)0拒絕H0不能拒絕H0F第9頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五103、單擊選項(xiàng)Option按紐,打開對話框如圖所示,選擇輸出項(xiàng)。主要有不同水平下樣本方差的齊性檢驗(yàn),缺失值的處理方式及均值的圖形。本例中選擇描述性(Descriptive)進(jìn)行基本統(tǒng)計(jì)描述,以及方差同質(zhì)檢驗(yàn)(Homogeneityofvariancetest)進(jìn)行不同水平間方差齊性的檢驗(yàn)。在缺失值(MissingValue)欄中選擇系統(tǒng)默認(rèn)項(xiàng)。第10頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五11完成所有選擇后返回主對話框,然后單擊OK,就可以得到三個地區(qū)零件強(qiáng)度分析表。基本統(tǒng)計(jì)描述

方差齊性檢驗(yàn)

P值大于0.05,所以因素變量的各水平間的方差是沒有顯著差異的。Levene檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法,與F檢驗(yàn)類似,但不依賴與正態(tài)性假設(shè),比F檢驗(yàn)更穩(wěn)健。第11頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五124、如果需要將水平間兩兩比較,可以單擊兩兩比較PostHoc

按紐,打開多重比較對話框。如圖所示:如果滿足在水平間方差相等的條件,常用LSD(最小顯著性差異法),用t檢驗(yàn)完成各組均值間的配對比較。當(dāng)方差不等的情況下,可以選擇TamhanesT2,用t檢驗(yàn)進(jìn)行各組均值間的配對比較。第12頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五13選擇多重比較方式后,點(diǎn)擊OK,得到輸出結(jié)果。從表中可以看出,地區(qū)2與地區(qū)3之間的差異是非常顯著的,它們均值差的檢驗(yàn)的尾概率為0.005,明顯小于顯著性水平0.05。第13頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五14某大型連鎖超市為了解不同促銷手段對商品銷售額的影響,在其下屬五個分店中,對同一類日常生活用品分別采用不同促銷方式進(jìn)行了為期四個月的銷售對比試驗(yàn)(銷售對比試驗(yàn)結(jié)果見所附數(shù)據(jù)集SY-22)。試?yán)梅讲罘治龇椒?,檢驗(yàn)不同促銷方式下的商品銷售量是否存在顯著性差異(試驗(yàn)前該類商品在五個分店內(nèi)的月銷售額基本處于同一水平)。例2分析思路:這是單一因素影響下的方差分析問題,可以以月銷售額為因變量,以促銷方式為影響因素變量進(jìn)行分析;分析過程利用SPSS軟件中的One-WayANOVA菜單實(shí)現(xiàn)。第14頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五15操作步驟:打開數(shù)據(jù)集SY-22,變量SALE和A分別表示月銷售額和促銷方式

。依次選擇Analyze→CompareMeans→One-WayANOVA,展開單因素方差分析對話框,將變量SALE送入Dependentlist框,將影響因素變量A送入Factor框。

單擊PostHoc項(xiàng),在打開的對話框中,選中LSD復(fù)選框,以進(jìn)行各組均值間的兩兩比較。繼續(xù)單擊Continue按鈕,返回到主對話框。

單擊OK按鈕,即得出單因素方差分析的運(yùn)行結(jié)果。第15頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五16單因素方差分析的輸出結(jié)果輸出結(jié)果第16頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五17雙因素方差分析雙因素方差分析的應(yīng)用范圍很廣;應(yīng)用條件:因變量是數(shù)值型變量,且來自或近似來自正態(tài)總體。自變量是分類變量,變量可以是數(shù)值型或字符型的。各水平下的總體假設(shè)服從正態(tài)分布,而且假設(shè)各水平下的方差是相等的。第17頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五18雙因素方差分析雙因素方差分析過程:可以分析出每一個因素的作用;各因素之間的交互作用;檢驗(yàn)各總體間方差是否相等;能夠?qū)σ蛩氐母魉介g均值差異進(jìn)行比較等。第18頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五19例3雙因素方差分析下表是某商品S在不同地區(qū)和不同時(shí)期的銷售量(千件)表。已知數(shù)據(jù)服從正態(tài)分布,則要檢驗(yàn)地區(qū)因素及時(shí)間因素對銷售量的影響是否顯著。(SY-23)地區(qū)時(shí)期1234516.514.213.42.46.221.87.19.41.54.833.610.87.21.74.943.78.98.62.34.657.612.67.52.85.2由于銷售量受地區(qū)和時(shí)間兩個因素的影響,這是一個雙因素方差分析的問題。第19頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五201、單擊分析(Analyze)

一般線性模型(GenerallinearModel)單變量(Univariate),打開主對話框。

步驟:2、從左框中選擇因變量“銷售量

”進(jìn)入因變量框內(nèi),選擇“地區(qū)”和“時(shí)期”進(jìn)入固定因子框內(nèi)。點(diǎn)擊確定。第20頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五213、單擊模型(Model)按紐選擇分析模型,得到對話框如圖。全因子選項(xiàng)為系統(tǒng)默認(rèn)項(xiàng),建立全模型,全模型中包括因素之間的交互作用。如果選擇分析兩個因素的交互作用,則必須在每種水平組合下,取得兩個以上的實(shí)驗(yàn)數(shù)據(jù),才能實(shí)現(xiàn)兩個因素的交互作用的分析結(jié)果。如果不考慮因素間的交互作用時(shí),應(yīng)當(dāng)選擇設(shè)定模型。第21頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五22先從左邊框中選擇因素變量進(jìn)入模型框中,然后選擇類型。一般不考慮交互作用時(shí),選擇主效應(yīng),考慮交互作用時(shí),選擇交互。本例中選擇主效應(yīng)。平方和一般選取默認(rèn)項(xiàng)類型Ⅲ。單擊繼續(xù),返回主對話框,點(diǎn)擊確定就可以得到相應(yīng)的雙因素方差分析表.第22頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五23從表中數(shù)據(jù)可以看出,F(xiàn)值對應(yīng)概率P值都小于顯著性水平0.05,這說明地區(qū)和時(shí)期對銷售量的影響都是顯著的。第23頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五24實(shí)驗(yàn)4:相關(guān)與回歸分析相關(guān)分析回歸分析第24頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五25相關(guān)分析相關(guān)分析是研究變量間密切程度的統(tǒng)計(jì)方法,線性相關(guān)分析研究的是兩變量間線性關(guān)系的程度,用相關(guān)系數(shù)表示;可以通過分析菜單進(jìn)行相關(guān)分析;

SPSS提供的相關(guān)分析功能有雙變量相關(guān)分析(Bivariate);偏相關(guān)分析(Partial);距離相關(guān)分析(Distance)。第25頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五26雙變量相關(guān)分析(簡單相關(guān)分析)

兩個變量之間的相關(guān)關(guān)系稱簡單相關(guān)關(guān)系。有兩種方法可以反映簡單相關(guān)關(guān)系:通過散點(diǎn)圖直觀地顯示變量之間關(guān)系;通過相關(guān)系數(shù)準(zhǔn)確地反映兩變量的關(guān)系程度。第26頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五27雙變量相關(guān)分析——散點(diǎn)圖例4數(shù)據(jù)庫SY-31中的變量X表示山東省人均國內(nèi)生產(chǎn)總值,Y表示山東省城鎮(zhèn)居民的消費(fèi)額(資料來源:山東省2003年統(tǒng)計(jì)年鑒),現(xiàn)畫出散點(diǎn)圖來觀察兩個變量的關(guān)聯(lián)程度。具體操作步驟如下:首先打開數(shù)據(jù)SY-31;然后單擊圖形Graphs

散點(diǎn)Scatter,打開散點(diǎn)圖Scatterplot對話框,選擇需要的散點(diǎn)圖,圖中的5個選項(xiàng)如下:第27頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五283.如果只考慮兩個變量,可選擇簡單的散點(diǎn)圖Simple,然后點(diǎn)擊定義Define,打開簡單散點(diǎn)圖SimpleScatterplot對話框,如左圖所示。4.選擇變量分別進(jìn)入X軸和Y軸,點(diǎn)擊OK后就可以得到右邊的散點(diǎn)圖。第28頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五29雙變量相關(guān)分析——相關(guān)系數(shù)具體操作如下:1.打開數(shù)據(jù)庫SY-31后,單擊分析Analyze

相關(guān)Correlate雙變量

Bivariate;如圖所示。第29頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五30用于計(jì)算分類變量的秩相關(guān),考慮結(jié)點(diǎn)的影響用于計(jì)算分類變量的秩相關(guān)適用于正態(tài)分布等間隔測度的變量分析變量2、從左邊的變量框中選擇需要考察的兩個變量進(jìn)入變量框內(nèi),選擇相關(guān)系數(shù)的種類,選擇檢驗(yàn)方式,單擊選項(xiàng)Options按紐。

第30頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五313.選擇輸出項(xiàng)和缺失值的處理方式。本例中選擇輸出基本統(tǒng)計(jì)描述。成對剔除帶有缺失值的觀測量剔除所有帶有缺失值的觀測量第31頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五324.單擊OK,可以得到相關(guān)分析的結(jié)果。見圖所示。從表中可以看到兩個變量相關(guān)性分析的結(jié)果:相關(guān)系數(shù)是0.996,相關(guān)程度非常高,且假設(shè)檢驗(yàn)的P值遠(yuǎn)遠(yuǎn)地小于0.05,可以認(rèn)為人均國內(nèi)生產(chǎn)總值與城鎮(zhèn)居民消費(fèi)額存在線性正相關(guān)關(guān)系。第32頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五33偏相關(guān)分析

簡單相關(guān)關(guān)系只反映兩個變量之間的關(guān)系,但如果因變量受到多個因素的影響時(shí),因變量與某一自變量之間的簡單相關(guān)關(guān)系顯然受到其它相關(guān)因素的影響,不能真實(shí)地反映二者之間的關(guān)系,所以需要考察在其它因素的影響剔除后二者之間的相關(guān)程度,即偏相關(guān)分析。第33頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五34例5為了考察火柴銷售量的影響因素,選擇煤氣戶數(shù)、卷煙銷量、蚊香銷量、打火石銷量作為影響因素,得數(shù)據(jù)表。試求火柴銷售量與煤氣戶數(shù)的偏相關(guān)系數(shù).

年份火柴銷售量(萬件)煤氣戶數(shù)(萬戶)卷煙銷量(百箱)蚊香銷量(十萬盒)打火石銷量(百萬粒)6823.6925.6823.610.14.186924.125.7723.4213.312.437022.7425.8822.099.496.57117.8427.4321.4311.0925.787218.2729.9524.9614.4828.167320.2933.5328.3716.9724.267422.6137.3142.5720.1630.187526.7141.1645.1626.3917.087631.1945.7352.4627.047.397730.550.5945.323.083.887829.6358.8246.824.4610.537929.6965.2851.1133.8220.098029.2571.2553.2933.5721.228131.0573.3755.3639.5912.638232.2876.685448.4911.17第34頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五35求解火柴銷售量與煤氣戶數(shù)的偏相關(guān)系數(shù)具體操作如下:1、首先打開數(shù)據(jù)文件SY-32,單擊分析Analyze相關(guān)

Correlate偏相關(guān)

Partial,打開對話框,見圖所示。要考察的變量

其它客觀存在的變量

2、從左邊框內(nèi)選擇要考察的兩個變量進(jìn)入變量框內(nèi),其它變量進(jìn)入控制框內(nèi),如本例中考察煤氣戶數(shù)與火柴銷量的偏相關(guān)系數(shù)進(jìn)入變量框內(nèi),其它(除年份外)進(jìn)入控制框內(nèi)。第35頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五36PartialCorrelations對話框第36頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五37PartialCorrelations對話框(即:Pearson相關(guān)系數(shù))本例中選擇簡單相關(guān)系數(shù)。第37頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五38輸出結(jié)果:從表中可以看出,火柴銷量與煤氣戶數(shù)的簡單相關(guān)系數(shù)為0.826,自由度為13,檢驗(yàn)的P值為0.00;而偏相關(guān)系數(shù)為0.605,自由度為10,檢驗(yàn)的P值為0.037,表示煤氣戶數(shù)對火柴銷量的真實(shí)影響是顯著的。表中的上半部分是簡單相關(guān)系數(shù),下半部分是偏相關(guān)系數(shù)。第38頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五39回歸分析研究的是自變量與因變量之間的非確定性的因果關(guān)系;SPSS提供的回歸分析過程有:

線性回歸(Linear)、曲線估計(jì)(CurveEstimation)、二分變量邏輯回歸(BinaryLogistic)、多分變量邏輯回歸(MultinomialLogistic)、序回歸(Ordinal)、概率單位回歸(Probit)、非線性回歸(Nonlinear)、加權(quán)估計(jì)(WeightEstimation)、最優(yōu)編碼回歸(optimalScaling)和二階段最小平方法(2-StageLeastSquares)?;貧w分析第39頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五40線性回歸分析線性回歸是統(tǒng)計(jì)分析方法中最常用的方法之一。如果所研究的現(xiàn)象有若干個影響因素,且這些因素對現(xiàn)象的綜合影響是線性的,則可以使用線性回歸的方法建立現(xiàn)象(因變量)與影響因素(自變量)之間的線性函數(shù)關(guān)系式。由于多元線性回歸的計(jì)算量比較大,所以有必要應(yīng)用統(tǒng)計(jì)分析軟件實(shí)現(xiàn)。介紹SPSS軟件的線性回歸分析的操作方法,包括求回歸系數(shù),給出回歸模型的各項(xiàng)檢驗(yàn)統(tǒng)計(jì)量值及相應(yīng)的概率,對輸出結(jié)果的分析等相關(guān)內(nèi)容。第40頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五411、線性回歸的假設(shè)理論(1)正態(tài)性假設(shè):即所研究的變量均服從正態(tài)分布;(2)等方差假設(shè):即各變量總體的方差是相等的;(3)獨(dú)立性假設(shè),即各變量之間是相互獨(dú)立的;(4)殘差項(xiàng)無自相關(guān)性,即誤差項(xiàng)之間互不相關(guān);2、線性回歸模型的檢驗(yàn)項(xiàng)目(1)回歸系數(shù)的檢驗(yàn)(t檢驗(yàn))。(2)回歸方程的檢驗(yàn)(F檢驗(yàn))。(3)擬合程度判定(可決系數(shù)R2)。(4)D.W檢驗(yàn)(殘差項(xiàng)是否自相關(guān))。(5)共線性檢驗(yàn)(多元線性回歸)。(6)殘差圖示分析(判斷異方差性和殘差序列自相關(guān))。線性回歸模型假設(shè)條件與模型的各種檢驗(yàn)第41頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五421、打開數(shù)據(jù)文件,單擊分析Analyze

回歸Regression

線性Linear,打開對話框如圖所示。指定回歸方法全部選入逐步回歸強(qiáng)行剔除向后剔除向前選擇加權(quán)最小平方法指定選擇參與回歸分析觀測量的變量指定作為觀測量標(biāo)簽的變量線性回歸分析的具體步驟:2、從左邊框中選擇因變量Y,選擇一個或多個自變量。從方法框內(nèi)下拉式菜單中選擇回歸分析方法。第42頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五433.單擊統(tǒng)計(jì)量Statistics,打開線性回歸:統(tǒng)計(jì)量對話框,可以選擇輸出的統(tǒng)計(jì)量如圖所示。德賓-沃森檢驗(yàn)提供判定系數(shù)、估計(jì)標(biāo)準(zhǔn)誤、ANOVA表等顯示每個自變量進(jìn)入方程后對R2和F值的影響觀測值診斷估計(jì)(系統(tǒng)默認(rèn)):包括回歸系數(shù),回歸系數(shù)標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)檢驗(yàn)統(tǒng)計(jì)量(t值)及相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量概率的P值(sig)。描述性統(tǒng)計(jì)量第43頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五444、如果需要觀察圖形,可單擊繪制Plots按紐,打開線性回歸:圖對話框,如圖所示。在此對話框中可以選擇所需要的圖形。標(biāo)準(zhǔn)化預(yù)測值標(biāo)準(zhǔn)化殘差剔除殘差調(diào)整預(yù)測值學(xué)生化殘差學(xué)生化剔除殘差輸出標(biāo)準(zhǔn)化殘差相對于因變量的散布圖在左上角的源變量框中,選擇Dependent進(jìn)入X(或Y)軸變量框,選擇其它變量進(jìn)入Y(或X)軸變量框,除因變量外,其客觀存在變量依次是:ZPRED:標(biāo)準(zhǔn)化預(yù)測值,ZRESID:標(biāo)準(zhǔn)化殘差,DRESID:剔除殘差,ADJPRED:修正后預(yù)測值,SRESID學(xué)生化殘差,SDRESID:學(xué)生化剔除殘差。第44頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五455、單擊選項(xiàng)Options按紐,打開線性回歸:選項(xiàng)對話框,如圖所示??梢詮闹羞x擇模型擬合判斷準(zhǔn)則及缺失值的處理方式。步行方法標(biāo)準(zhǔn)(SteppingMethodCriteria)欄,設(shè)置變量引入或剔除模型的判別標(biāo)準(zhǔn)。使用F的概率(UseprobabilityofF):采用F檢驗(yàn)的概率為判別依據(jù)。使用F值(UseFvalue):采用F值作為檢驗(yàn)標(biāo)準(zhǔn)。Includeconstantinequation回歸方程中包括常數(shù)項(xiàng)。缺失值(MissingValues):缺失值的處理方式。第45頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五466、如果要保存預(yù)測值等數(shù)據(jù),可單擊保存(Save)按紐打開對話框。選擇需要保存的數(shù)據(jù)種類作為新變量存在數(shù)據(jù)編輯窗口。其中有預(yù)測值、殘差,預(yù)測區(qū)間等。7、當(dāng)所有選擇完成后,單擊OK得到分析結(jié)果。第46頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五47分析思路:繪制散點(diǎn)圖,對兩個變量之間相關(guān)關(guān)系的形式、方向做出大致判斷;計(jì)算相關(guān)系數(shù)

;若二者之間存在顯著性線性相關(guān),則建立回歸方程;例6已知某市10家百貨商店職工的人均月銷售額和利潤率的數(shù)據(jù)(見數(shù)據(jù)SY33

),試分析人均月銷售額和利潤率之間的關(guān)系,并建立利潤率對人均月銷售額的回歸方程。第47頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五48操作步驟:打開數(shù)據(jù)集SY33,依次選擇圖形→散點(diǎn)/點(diǎn)狀,展開對話框。選中簡單分布選項(xiàng),單擊定義按鈕,進(jìn)入對話框。將變量rjxse送入“X軸”框中,將變量lrl送入Y軸框中。單擊確定按鈕,得到人均月銷售額與利潤率的散點(diǎn)圖。依次選擇分析→相關(guān)→雙變量,展開對話框;將變量rjxse和lrl同時(shí)送入變量框中;單擊確定按鈕,得到人均月銷售額與利潤率的相關(guān)系數(shù)。依次選擇分析→回歸→線性,展開對話框;將變量rjxse送入自變量框中,將變量lrl送入因變量框;單擊確定按鈕,得到回歸過程運(yùn)行結(jié)果。第48頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五49輸出結(jié)果Ⅰ第49頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五50回歸方程:輸出結(jié)果Ⅱ

檢驗(yàn)假設(shè)H0:

線性關(guān)系不顯著第50頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五51例7用數(shù)據(jù)SY-32,考察火柴銷售量與各影響因素之間的相關(guān)關(guān)系,建立火柴銷售量對于相關(guān)因素煤氣戶數(shù)、卷煙銷量、蚊香銷量、打火石銷量的線性回歸模型,通過對模型的分析,找出合適的線性回歸方程。第51頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五521、打開數(shù)據(jù)文件SY-32,單擊分析回歸線性,打開線性對話框。2、從左邊框中選擇因變量和自變量。從方法框內(nèi)下拉式菜單中選擇逐步回歸法。3、單擊統(tǒng)計(jì)量,打開對話框,本例中選擇估計(jì)、所有與模型擬合及擬合效果有關(guān)的選擇項(xiàng)、D.W檢驗(yàn)及奇異值診斷,選擇標(biāo)準(zhǔn)差為2,即置信度約為95%。點(diǎn)擊繼續(xù)。4、單擊繪制按紐,打開對話框。選擇Dependent進(jìn)入X軸變量框,選擇標(biāo)準(zhǔn)化殘差ZRESID變量進(jìn)入Y(或X)軸變量框,繪制殘差圖。5、單擊選項(xiàng)按紐,打開對話框。選擇默認(rèn)項(xiàng)。6、點(diǎn)擊確定,得到結(jié)果。步驟:第52頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五53輸出結(jié)果(部分):模型綜合分析表

模型綜合分析表中,有模型的復(fù)相關(guān)系數(shù)R,樣本決定系數(shù)R2,修正的可決系數(shù),估計(jì)標(biāo)準(zhǔn)誤,模型變化導(dǎo)致的可決系數(shù)及F值的變化,D.W檢驗(yàn)值等。由上表中知模型3的修正的可決系數(shù)為0.993,其模型的擬合程度最好,DW值為2.066(在2附近),顯然通過DW檢驗(yàn),說明殘差項(xiàng)不存在一階自相關(guān)。序列相關(guān)檢驗(yàn)第53頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五54方差分析表:方差分析表同時(shí)給出了3個模型的方差分析表。其中模型3的F值最大,說明模型3的回歸效果最顯著。第54頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五55回歸系數(shù)表:表中的Model欄中,模型1是先將卷煙銷量作為自變量進(jìn)入模型,模型2將卷煙銷量與打火石銷量兩個自變量進(jìn)入模型,模型3是將卷煙、打火石和煤氣戶數(shù)三個自變量進(jìn)入模型。第四個自變量蚊香銷量沒有通過檢驗(yàn)自動剔除。建立火柴銷售量對于相關(guān)因素煤氣戶數(shù)、卷煙銷量、蚊香銷量、打火石銷量的線性回歸模型第55頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五56回歸系數(shù)表:回歸系數(shù)表的輸出結(jié)果可以看出,回歸系數(shù)都通過檢驗(yàn),模型中自變量與因變量的偏相關(guān)系數(shù)都在0.7以上,說明進(jìn)入模型的自變量對因變量的影響都比較顯著。非標(biāo)準(zhǔn)化回歸系數(shù)標(biāo)準(zhǔn)化回歸系數(shù)第56頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五57由最后兩列的容忍度Tolerance和方差膨脹因子VIF的值來看,自變量之間不存在強(qiáng)烈的共線性。共線性統(tǒng)計(jì)方差膨脹因子其值介于1~∞之間,其值越大,自變量之間存在共線性的可能性越大。檢驗(yàn)表明,VIF≥10,說明解釋變量與其余解釋變量之間存在嚴(yán)重的多重共線性容忍度介于0-1之間,其值越小,自變量與其他自變量之間的共線性越強(qiáng)。使用容忍度作為共線性度量標(biāo)準(zhǔn)的條件比較嚴(yán)格,觀測量一定要大致近似于正態(tài)分布。第57頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五58殘差統(tǒng)計(jì)表:

殘差統(tǒng)計(jì)表中表示了預(yù)測值、殘差、標(biāo)準(zhǔn)化預(yù)測值和標(biāo)準(zhǔn)化殘差的特征值。其中包括預(yù)測值及殘差項(xiàng)的最小值和最大值、均值、標(biāo)準(zhǔn)誤和樣本容量。第58頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五59奇異值表(標(biāo)準(zhǔn)化殘差值大于2)奇異值表中依次是序號,標(biāo)準(zhǔn)化殘差值,實(shí)際觀測值、預(yù)測值及殘差值。表中給出的兩個個體數(shù)據(jù)的標(biāo)準(zhǔn)化殘差(數(shù)據(jù)號為12和14)超出了2。第59頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五60標(biāo)準(zhǔn)化殘差圖(異方差的檢驗(yàn)):

由圖中可以看出,殘差圖中的點(diǎn)分布是隨機(jī)的,沒有出現(xiàn)趨勢性,所以回歸模型是有效的。第60頁,共68頁,2022年,5月20日,19點(diǎn)45分,星期五61最終得回歸模型為:第61頁,共68頁,2022年,5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論