版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第7章
分類數(shù)據(jù)分析1第7章分類數(shù)據(jù)分析——目錄7.1一個分類變量的擬合優(yōu)度檢驗7.2兩個分類變量的獨立性檢驗7.3卡方檢驗中需要注意的地方2
37.1一個分類變量的擬合優(yōu)度檢驗擬合優(yōu)度檢驗的原假設(shè)和備擇假設(shè)的一般形式如下:4
7.1一個分類變量的擬合優(yōu)度檢驗H0:觀察頻數(shù)與期望頻數(shù)一致H1:觀察頻數(shù)與期望頻數(shù)不一致擬合優(yōu)度檢驗的檢驗統(tǒng)計量如下:
7.1一個分類變量的擬合優(yōu)度檢驗
56例:B連鎖餐廳老板想要了解顧客在餐廳就餐時最喜歡的主食,對120位顧客進行調(diào)查,結(jié)果如表7-1所示。試評價顧客在這四種主食中選擇時是否存在明顯偏好。表7-1120人樣本中最愛點的主食
7.1一個分類變量的擬合優(yōu)度檢驗最愛點的主食頻數(shù)雜糧24面條29米飯32饅頭35合計1207
SPSS輸出的結(jié)果如表7-2和表7-3所示:
注意擬合優(yōu)度檢驗除了可以處理期望頻數(shù)相同的數(shù)據(jù),同樣可以處理期望頻數(shù)不同的分類數(shù)據(jù)。7.1一個分類變量的擬合優(yōu)度檢驗
觀察數(shù)期望數(shù)剩余殘差雜糧2430.0-6.0面條2930.0-1.0米飯3230.02.0饅頭3530.05.0總數(shù)120
主食偏好卡方2.200df3漸近顯著性.532表7-2顧客主食偏好的擬合優(yōu)度檢驗(一)人數(shù)表7-3顧客主食偏好的擬合優(yōu)度檢驗(二)檢驗統(tǒng)計量8
7.2兩個分類變量的獨立性檢驗利用χ2檢驗來判斷兩個分類變量是否有關(guān)聯(lián)
獨立性檢驗的原假設(shè)和備擇假設(shè)的一般形式如下:
7.2兩個分類變量的獨立性檢驗
獨立性檢驗的檢驗統(tǒng)計量如下:
97.2兩個分類變量的獨立性檢驗
10例:葡萄酒行業(yè)協(xié)會想要了解飲酒者性別與葡萄酒偏好是否有關(guān)聯(lián),對200名飲酒者進行調(diào)研,其中男性132人、女性68人,共三種葡萄酒類型:甜葡萄酒、半干葡萄酒、干葡萄酒,樣本資料見表7-4。試評價飲酒者性別與葡萄酒偏好是否獨立。表7-4男性與女性飲酒者葡萄酒偏好的樣本資料
7.2兩個分類變量的獨立性檢驗葡萄酒偏好飲酒者性別合計男性女性甜葡萄酒513990半干葡萄酒562177干葡萄酒25833合計132682001112
SPSS輸出的結(jié)果如表7-5和表7-6所示:
7.2兩個分類變量的獨立性檢驗表7-5飲酒者性別與葡萄酒偏好的頻數(shù)分布飲酒者性別*葡萄酒偏好交叉制表
飲酒者性別合計男女葡萄酒偏好甜葡萄酒計數(shù)513990期望的計數(shù)59.430.690.0半干葡萄酒計數(shù)25833期望的計數(shù)21.811.233.0干葡萄酒計數(shù)562177期望的計數(shù)50.826.277.0合計計數(shù)13268200期望的計數(shù)132.068.0200.0
值df漸進Sig.(雙側(cè))Pearson卡方6.4472.040似然比6.4612.040有效案例中的N200
7.3卡方檢驗中需要注意的地方卡方檢驗中需要注意的地方有:單元數(shù)量為2,各單元的期望頻率需大于5,如表7-7;單元數(shù)量大于2,期望頻率小于5的單元比例不超過20%,如表7-8。特殊情況該如何處理:擴大樣本量;將期望頻數(shù)小于5的類別合并。單元190922108單元19092210838180456567644表7-7準(zhǔn)則1說明表表7-8準(zhǔn)則2說明表13第8章
方差分析14第8章方差分析——目錄8.1方差分析引論8.2單因素方差分析8.3雙因素方差分析15
8.1方差分析引論1617例:某企業(yè)研發(fā)了一種新型有機發(fā)光二極管(OLED),為確定其性能的優(yōu)劣,企業(yè)決定考察三種使用溫度和三種電極對OLED壽命的影響。在每種電極材料和使用溫度下檢測三個OLED。表8-1有機分光二極管壽命數(shù)據(jù)溫度電極13015518034407221698015018812412612211125705713811016117412015296104828.1方差分析引論——例題因素(factor),又稱為因子,是在方差分析中待檢驗的自變量。水平(level),又稱為處理(treatment),是因素的每個取值電極和溫度為兩個因素。在每個因素下,如電極,一共有三個水平。8.1方差分析引論——基本概念18單因素方差分析,是一種僅討論單一因素對試驗結(jié)果有無顯著影響的分析。僅討論電極或溫度對電池壽命的影響。雙因素方差分析,是一種討論兩種因素對試驗結(jié)果有無顯著影響的分析。同時討論電極和溫度對電池壽命的影響8.1方差分析引論——基本概念19主效應(yīng),指因素僅對因變量產(chǎn)生的影響。交互效應(yīng),指一個因素各個水平之間的差異隨其他因素的不同水平而發(fā)生變化的現(xiàn)象。無交互作用雙因素方差分析,在方差分析中僅考慮兩個因素的主效應(yīng)。有交互作用雙因素方差分析,在方差分析中除了考慮兩個因素的主效應(yīng),還要考慮兩個因素的交互效應(yīng)。8.1方差分析引論——基本概念20總誤差(totalerror),反映全部觀測數(shù)據(jù)的誤差。電池壽命的全部27個樣本的誤差組內(nèi)誤差(within-grouperror),同一水平下的數(shù)據(jù)誤差。其他隨機因素產(chǎn)生的誤差。組間誤差(between-grouperror),不同水平之間的數(shù)據(jù)誤差??赡苁怯呻S機誤差引起的,也可能是由水平差異引起的。8.1方差分析引論——基本原理218.1方差分析引論——基本原理總離差平方和(totalerror),反映全部觀測數(shù)據(jù)的誤差,記為SST。組間誤差平方和(between-grouperrorsumofsquares),反映不同水平之間的數(shù)據(jù)誤差,記為SSA。組內(nèi)平方和(within-groupsumofsquares),反映隨機因素產(chǎn)生的誤差,記為SSE。
統(tǒng)計學(xué)中,常利用平方和來表示誤差,三種誤差的平方和表現(xiàn)形式如下:22如果因素對因變量的影響不顯著,則每單位自由度的組間誤差與組內(nèi)誤差的差異不大,它們的比值接近1。如果因素對因變量有顯著影響,每單位自由度的組間誤差與組內(nèi)誤差的比值就會大于1。當(dāng)這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,即自變量對因變量有影響。8.1方差分析引論——基本原理23(一)正態(tài)性——每個總體應(yīng)滿足正態(tài)分布每個電極或者溫度水平下,電池使用壽命的樣本數(shù)據(jù)必須服從正態(tài)分布。(二)方差齊性——每個總體的方差應(yīng)相同每個電極或者溫度水平下,電池使用壽命樣本數(shù)據(jù)的方差必須相同。(三)獨立性——數(shù)據(jù)觀測值是獨立的每個電極或者溫度水平下,電池使用壽命樣本數(shù)據(jù)來自不同的獨立樣本。8.1方差分析引論——基本假設(shè)24(一)正態(tài)性假設(shè)的檢驗1.圖形檢驗法直方圖8.1方差分析引論——假設(shè)的檢驗三個溫度水平下的電池使用壽命頻數(shù)直方圖根據(jù)直方圖的形狀可對數(shù)據(jù)的正態(tài)性進行判斷,但是結(jié)果并不具備充分性,仍需要進一步的驗證25(一)正態(tài)性假設(shè)的檢驗1.圖形檢驗法P-P圖和Q-Q圖8.1方差分析引論——假設(shè)的檢驗合并三種溫度水平后的正態(tài)概率圖根據(jù)P-P圖和Q-Q圖中樣本點是否均勻且隨機分布在理論正態(tài)分布直線周圍,可對數(shù)據(jù)的正態(tài)性進行判斷,但是結(jié)果仍不充分,需要通過進一步的驗證才能得到準(zhǔn)確結(jié)論。26(一)正態(tài)性假設(shè)的檢驗2.參數(shù)檢驗法:K-S檢驗8.1方差分析引論——假設(shè)的檢驗根據(jù)檢驗結(jié)果,在顯著性水平為0.05情況下,三種溫度下的檢驗結(jié)果均不顯著,所以不拒絕正態(tài)性假設(shè)
溫度Kolmogorov-Smirnova統(tǒng)計量dfSig.T1.1129.200*T2.2119.200*T3.1939.200*a.Lilliefors顯著水平修正三種溫度下電池壽命的K-S正態(tài)性檢驗27(二)方差齊次性假設(shè)的檢驗1.圖形檢驗法箱線圖8.1方差分析引論——假設(shè)的檢驗根據(jù)箱線圖,不同因素水平下箱體的離散程度對數(shù)據(jù)方差是否滿足齊次性進行判斷,但是檢驗結(jié)果不充分,仍需配合其他方法得到準(zhǔn)確結(jié)論。三種溫度水平下的電池壽命箱線圖28(二)方差齊次性假設(shè)的檢驗1.圖形檢驗法殘差圖8.1方差分析引論——假設(shè)的檢驗根據(jù)殘差圖中標(biāo)準(zhǔn)化殘差是否隨著預(yù)測值的變化產(chǎn)生較大差異,可對方差齊次做出判斷,但是想得到準(zhǔn)確結(jié)論仍然需要進一步驗證單溫度因素方差分析的殘差圖29(二)方差齊性假設(shè)的檢驗2.參數(shù)檢驗法Levene檢驗8.1方差分析引論——假設(shè)的檢驗根據(jù)檢驗結(jié)果,在顯著性水平為0.05情況下,檢驗結(jié)果不顯著,所以不拒絕方差齊性的假設(shè)。因變量:使用壽命Levene統(tǒng)計量df1df2顯著性2.251224.127三種溫度水平下方差齊性的levene檢驗法30觀察值因素(A)
水平A1水平A2…水平Ak12::n
x11x12…x1kx21x22…x2k::::::::xn1
xn2…xnk8.2單因素方差分析——數(shù)據(jù)結(jié)構(gòu)318.2單因素方差分析——分析步驟(一)提出原假設(shè)和備擇假設(shè)原假設(shè):自變量對因變量沒有顯著影響()備擇假設(shè):自變量對因變量存在顯著影響()(二)構(gòu)造檢驗統(tǒng)計量1.均值令為第j水平的均值令為總體均值328.2單因素方差分析——分析步驟(二)構(gòu)造檢驗統(tǒng)計量2.離差平方和總平方和組間平方和組內(nèi)平方和
338.2單因素方差分析——分析步驟
348.2單因素方差分析——分析步驟
F檢驗35
誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值因素ASSAk-1**誤差SSEn-k總和SSTn-18.2單因素方差分析——方差分析表368.2單因素方差分析——均值的多重比較均值的多重比較用方差分析解決問題的時候,當(dāng)?shù)贸鲲@著性結(jié)論時,僅表明各水平的均值不全相等,至于是哪些水平之間的差異具有顯著性,哪些水平之間不具有顯著性是無法判斷的,需要進一步進行比較。這里主要介紹最小顯著性差異(LSD)法:LSD的檢驗統(tǒng)計量為t統(tǒng)計量,378.2單因素方差分析——均值的多重比較
我們將最小顯著性差異(LSD)定義為3839
8.2單因素方差分析——例題408.2單因素方差分析——例題解:總離差平方和SST為:組間離差平方和SSA為:組內(nèi)離差平方和SSE為:418.2單因素方差分析——例題MSA為:
MSE為:
F為:
8.3無交互作用雙因素方差分析——數(shù)據(jù)結(jié)構(gòu)428.3無交互作用雙因素方差分析——分析步驟
43(二)構(gòu)造檢驗統(tǒng)計量2.離差平方和總平方和組間平方和組內(nèi)平方和
四者滿足:SST=SSA+SSB+SSE8.3無交互作用雙因素方差分析——分析步驟44
8.3無交互作用雙因素方差分析——分析步驟45
8.3無交互作用雙因素方差分析——分析步驟46誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值因素ASSAk-1MSAMSAMSE**因素BSSBr-1MSBMSBMSE**誤差SSE(k-1)(r-1)MSE總和SSTkr-18.3無交互作用雙因素方差分析——方差分析表4748例:某化工廠采購了一批聚乙烯生產(chǎn)設(shè)備,為了研究聚乙烯聚合度與聚合時間及反應(yīng)溫度的關(guān)系,現(xiàn)選擇四個聚合溫度和三個聚合時間。試驗數(shù)據(jù)見表。聚合度數(shù)據(jù)表8.3無交互作用雙因素方差分析——例題49解:聚合時間為22min水平的均值為
反應(yīng)溫度為160℃水平的均值為
總體均值為
8.3無交互作用雙因素方差分析——例題
50解:總離差平方和SST為:聚合時間離差平方和SSA為:組內(nèi)離差平方和SSE為:反應(yīng)溫度離差平方和SSB為:8.3無交互作用雙因素方差分析——例題51MSA為:
MSE為:
MSB為:
8.3無交互作用雙因素方差分析——例題
8.3無交互作用雙因素方差分析——例題528.3有交互作用雙因素方差分析——數(shù)據(jù)結(jié)構(gòu)538.3有交互作用雙因素方差分析——分析步驟
548.3有交互作用雙因素方差分析——分析步驟
558.3有交互作用雙因素方差分析——分析步驟(二)構(gòu)造檢驗統(tǒng)計量離差平方和
總平方和
組間平方和交互平方和組內(nèi)平方和
五者滿足:SST=SSA+SSB+SSAB+SSE56
8.3有交互作用雙因素方差分析——分析步驟
57
8.3有交互作用雙因素方差分析——分析步驟58
8.3有交互作用雙因素方差分析——分析步驟59誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值因素ASSAk-1MSAFA**因素BSSBr-1MSBFB**交互ABSSAB(k-1)(r-1)MSABFAB**誤差SSEKr(m-1)MSE總和SSTn-1注:m為樣本的行數(shù)8.3有交互作用雙因素方差分析——方差分析表6061例:某企業(yè)研發(fā)了一種新型有機發(fā)光二極管(OLED),為確定其性能的優(yōu)劣,企業(yè)決定考察三種使用溫度和三種電極對OLED壽命的影響。在每種電極材料和使用溫度下檢測三個OLED。表8-1有機分光二極管壽命數(shù)據(jù)溫度電極13015518034407221698015018812412612211125705713811016117412015296104828.3有交互作用雙因素方差分析——例題62
8.3有交互作用雙因素方差分析——例題
解:總離差平方和SST為:電極種類離差平方和SSA為:使用溫度離差平方和SSB為:
交互作用離差平方和SSAB為:
誤差離差平方和為SSE為:8.3有交互作用雙因素方差分析——例題
63
MSA為:
MSAB為:MSB為:8.3有交互作用雙因素方差分析——例題
MSE為:64
8.3有交互作用雙因素方差分析——例題
65第9章
一元線性回歸66第9章一元線性回歸——目錄9.1一元線性回歸模型及其參數(shù)估計9.2一元線性回歸模型的評估9.3利用回歸模型進行預(yù)測9.4殘差分析679.1.1一元線性回歸模型9.1.2參數(shù)的最小二乘估計689.1一元線性回歸模型及其參數(shù)估計69什么是回歸分析?(Regression)回歸分析是研究變量之間相互關(guān)系的一種統(tǒng)計分析技術(shù)。一般是將一個變量當(dāng)做被影響變量,其他變量當(dāng)做影響這一變量的因素。主要目的就是通過采集樣本構(gòu)建變量之間的關(guān)系模型,可以通過該模型預(yù)測被影響變量的取值。回歸模型的類型一個自變量兩個及兩個以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸70一元線性回歸模型71一元線性回歸一個自變量的回歸因變量y與自變量x之間為線性關(guān)系被預(yù)測或被解釋的變量稱為因變量(dependentvariable),用y表示用來預(yù)測或用來解釋因變量的一個或多個變量稱為自變量(independentvariable),用x表示因變量與自變量之間的關(guān)系用一個線性方程來表示72描述因變量y如何依賴于自變量x和誤差項
的方程稱為回歸模型一元線性回歸模型可表示為
y為因變量,x為自變量
為截距,
為直線斜率和是模型的參數(shù)為一個隨機變量,稱為誤差項,表示除x之外,其他因素或者是無法觀測的因素對y的影響保持不變,y和x呈線性函數(shù)關(guān)系。73一元線性回歸
一元線性回歸模型——基本假定x=x3時的E(y)x=x2時y的分布x=x1時y的分布x=x2時的E(y)x3x2x1x=x1時的E(y)
0xyx=x3時y的分布
0+1x75一元線性回歸模型——基本假定參數(shù)
0和
1的最小二乘估計76估計(經(jīng)驗)回歸方程總體回歸參數(shù)和
是未知的,要利用樣本數(shù)據(jù)去估計用樣本統(tǒng)計量
和代替回歸方程中的未知參數(shù)和,就得到了估計的回歸方程。簡單線性回歸中估計的回歸方程為其中:表示y軸上的截距,是斜率,?表示給定x的一個值,y的估計值或預(yù)測值,也是y
的期望E(y)的估計值。77
求解方程得
最小二乘法78
最小二乘法對于平面的n個點,可以使用無數(shù)條曲線進行擬合,需要選擇一條盡可能更好地擬合這組數(shù)據(jù)的直線79估計方程的求法——實例例:某知名連鎖餐飲企業(yè)在全國有很多連鎖店,為研究它的營業(yè)收入和員工培訓(xùn)費用的關(guān)系,隨機抽取25家連鎖店,得到它們的年營業(yè)收入和員工培訓(xùn)費用的數(shù)據(jù),數(shù)據(jù)如表所示,求營業(yè)收入和員工培訓(xùn)費用的估計的回歸方程。80序號營業(yè)收入(萬元)員工培訓(xùn)費用(萬元)1213.4011.702248.0015.303513.4022.904390.8026.405598.0033.606312.4034.307480.2039.408601.6045.509821.8055.4010504.8060.8011870.6066.2012603.1070.1013872.3074.9014970.5078.6015643.2085.3016974.1090.40171060.5093.6018870.6098.80191180.50102.50201290.40107.80211380.10119.90221067.20127.50231472.40137.90241290.40149.50251590.90158.00估計方程的求法——實例例:根據(jù)例中的數(shù)據(jù),將其輸入SPSS進行分析得到以下結(jié)果。81回歸系數(shù)=8.654表示,員工培訓(xùn)費用每增加1萬元,營業(yè)收入增加8.654萬元。估計方程的求法——實例例:根據(jù)例中的數(shù)據(jù),將其輸入SPSS進行分析得到以下結(jié)果。82
9.2.1判定系數(shù)9.2.2顯著性檢驗9.2.3回歸模型解釋的注意點839.2一元線性回歸模型的評估判定系數(shù)84離差平方和的分解因變量y的取值是不同的,y取值的這種波動稱為變差。變差來源于兩個方面由于自變量x的取值不同造成的由其他隨機因素導(dǎo)致的測量模型擬合好壞的方式就是測量x的值對于預(yù)測y值的貢獻程度85離差平方和的分解(圖示)xyy{}}
離差分解圖86離差平方和的分解——三個平方和的關(guān)系1.從圖上看有
2.兩端平方后求和有SST=SSR+SSE總平方和(SST)回歸平方和(SSR)殘差平方和(SSE)87離差平方和的分解——三個平方和的意義
88判定系數(shù)R2
(coefficientofdetermination)1.回歸平方和占總離差平方和的比例2.反映回歸直線的擬合度3.取值范圍在[0,1]之間4.R2
1,說明回歸方程擬合的越好;
R20,說明回歸方程擬合的越差5.一元線性回歸中,判定系數(shù)等于相關(guān)系數(shù)的平方,即R2=r2
89判定系數(shù)——例題分析營業(yè)收入實例的判定系數(shù)的意義是:營業(yè)收入的變異性有87.3%可以由和員工培訓(xùn)費用之間的線性關(guān)系所解釋,對于估計的回歸方程,這個模型的擬合效果較高。90ModelSummaryModel RRSquareAdjustedRSquareStd.ErroroftheEstimate1.934a.873.867143.09319a.Predictors:(Constant),員工培訓(xùn)費用(續(xù)前例)顯著性檢驗91回歸方程總體的顯著性檢驗——F檢驗檢驗自變量與因變量之間的線性關(guān)系是否顯著具體方法是將回歸均方(MSR)同殘差均方(MSE)加以比較,應(yīng)用F檢驗來分析二者之間的差別是否顯著回歸均方:回歸平方和SSR除以相應(yīng)的自由度(自變量的個數(shù)k)殘差均方:殘差平方和SSE除以相應(yīng)的自由度(n-k-1)如果拒絕原假設(shè),則兩個變量之間存在顯著關(guān)系如果不拒絕原假設(shè),則沒有證據(jù)表明兩個變量之間存在顯著關(guān)系92回歸方程總體的顯著性檢驗——檢驗步驟1.提出原假設(shè)和備擇假設(shè)H0:H1:2.構(gòu)造檢驗統(tǒng)計量
93
回歸方程的顯著性檢驗——方差分析表(續(xù)前例)方差分析表平方和均方
94回歸系數(shù)的顯著性檢驗——t檢驗95
估計方程的求法——實例96(續(xù)前例)回歸系數(shù)的顯著性檢驗——要點
979.3.1點估計9.3.2平均值的置信區(qū)間9.3.3個別值的預(yù)測區(qū)間989.3利用回歸模型進行預(yù)測利用回歸方程進行估計和預(yù)測回歸模型主要的作用之一是用來對因變量進行預(yù)測。使用最小二乘法通過樣本數(shù)據(jù),求得估計一元線性回歸方程。對該回歸方程進行顯著性檢驗和判定系數(shù)驗證。使用該方程對因變量進行估計和預(yù)測。99點估計100點估計
101區(qū)間估計102區(qū)間估計點估計作為一個單一的值,不能提供有關(guān)估計量精度的相關(guān)信息。因此,在點估計的基礎(chǔ)上,可以建立一個區(qū)間估計。對于自變量x的一個給定值x0,根據(jù)回歸方程得到因變量y的一個估計區(qū)間區(qū)間估計有兩種類型置信區(qū)間估計
給定一個x值,y的平均值的一個區(qū)間估計預(yù)測區(qū)間估計
給定一個x值,y的個別值的一個區(qū)間估計。103置信區(qū)間估計y的平均值的置信區(qū)間估計利用估計的回歸方程,對于自變量x的一個給定值x0
,求出因變量y的平均值E(y0)的估計區(qū)間,這一估計區(qū)間稱為置信區(qū)間。
E(y0)
在1-
置信水平下的置信區(qū)間為s為估計標(biāo)準(zhǔn)差104預(yù)測區(qū)間估計
s為估計標(biāo)準(zhǔn)差105區(qū)間估計——算例【例】根據(jù)前例,求出求出每個給定的員工培訓(xùn)費用水平下,年營業(yè)收入的置信區(qū)間和預(yù)測區(qū)間
解:SPSS輸出結(jié)果如下:106序號預(yù)測值置信下限置信上限預(yù)測上限預(yù)測下限1274.24496164.78344383.70648-41.35642589.846342305.39769200.21837410.57701-8.74415619.539533371.16456274.75162467.5775059.84823682.480904401.45194308.92826493.9756191.31804711.585845463.75739378.87091548.64388155.81564771.699146469.81487385.64102553.98872162.06880777.560947513.94790434.77945593.11635207.53307820.362738566.73447493.05460640.41433261.69164871.777309652.40447586.15170718.65725349.06995955.7390010699.13357635.96222762.30491396.457131001.8100011745.86266684.94920806.77612443.649401048.0759212779.61145719.76256839.46034477.610961081.6119413821.14842761.91486880.38198519.269271123.0275714853.16650793.86969912.46331551.274941155.0580715911.14519850.55280971.73759608.996481213.2939016955.27822892.731461017.82499652.731531257.8249217982.96954918.804671047.13441680.084191285.85489181027.96792960.594571095.34128724.386681331.54917191059.98601989.939911130.03210755.800441364849751031.488431180.21107800.641601411.05789211210.557531124.647251296.46780902.331991518.78306221276.324401182.261941370.38686965.727961586.92084231366.321171260.319861472.322481051.903171680.73918241466.702191346.620681586.783691147.262091786257241409.491371671.023111216.649271863.86521區(qū)間估計——算例【例】根據(jù)前例,求出每個給定的員工培訓(xùn)費用水平下,年營業(yè)收入的置信區(qū)間和預(yù)測區(qū)間
解:SPSS輸出結(jié)果如下:107影響區(qū)間寬度的因素
108置信區(qū)間、預(yù)測區(qū)間、回歸方程預(yù)測上限置信上限預(yù)測下限置信下限
x處兩區(qū)間寬度最小1099.4.1誤差的均值為零9.4.2誤差的正態(tài)性9.4.3誤差的方差齊性9.4.4誤差的獨立性9.4.5異常值和有影響的觀測1109.4殘差分析殘差分析
111誤差的均值為零112誤差的均值為零——殘差圖該圖為非隨機模型,殘差呈二次曲線的形狀,殘差的范圍可以分為三段,較小的x對應(yīng)的殘差在0水平線之上,中等的x對應(yīng)的殘差在0水平線之下,較大的x對應(yīng)的殘差又在0水平線之上,這說明隨機誤差
的均值在x取值的三段范圍內(nèi)可能不為0。因此可說明該回歸模型所對應(yīng)的誤差的均值為0的假設(shè)不成立,需要重新檢查回歸模型是否合理。113誤差的均值為零——殘差圖114
誤差的正態(tài)性115誤差的正態(tài)性116檢驗隨機誤差項?是否近似于正態(tài)分布,可通過標(biāo)準(zhǔn)化殘差圖進行判斷。每個殘差除以其標(biāo)準(zhǔn)差就得到了標(biāo)準(zhǔn)化殘差。
其中,誤差的正態(tài)性——算例117要滿足正態(tài)性假設(shè),標(biāo)準(zhǔn)化殘差至少大約有95%都應(yīng)該落在-2到+2之間的區(qū)域,從該例的圖中可以看出,?
是近似服從于正態(tài)分布。誤差的正態(tài)性——算例118除標(biāo)準(zhǔn)化殘差圖之外,標(biāo)準(zhǔn)化殘差的直方圖和正態(tài)概率也可以確定誤差項?
是否服從正態(tài)分布。從標(biāo)準(zhǔn)化殘差直方圖來看,中間稍低,左右兩側(cè)不完全對稱,有一定瑕疵。誤差的正態(tài)性——算例119從標(biāo)準(zhǔn)化殘差的P-P圖來看,雖然散點并沒有全部靠近斜線,并不完美,但較多的點聚集在45度直線附近。綜合而言,殘差正態(tài)性結(jié)果不是最好的,但也可以接受誤差項?
服從正態(tài)分布。誤差的方差齊性120誤差的方差齊性121利用殘差圖,還可以幫助判斷誤差項的方差是否恒定,即方差齊性的判斷。雖然殘差整體形狀不同,但殘差的取值范圍都是隨著自變量x的增大而增大,這就是意味著殘差隨著x的增大而增大,殘差的方差并不是一個恒定的值。誤差的方差齊性122殘差范圍呈梭子狀,取值范圍先隨著x的增大而增大,然后又隨著x的增大而減小,很顯然殘差的也不是恒定的值。誤差的方差齊性123如果?的方差相等的假設(shè)成立,而且回歸模型也是合理的,那么殘差圖中殘差點,應(yīng)該隨機地落在一條水平帶之內(nèi)。誤差的獨立性124誤差的獨立性125誤差的獨立性假設(shè)要求一系列誤差變量之間是不相關(guān)的。這個假設(shè)不總是滿足,尤其在時間數(shù)據(jù)中表現(xiàn)比較明顯。為了驗證在該類數(shù)據(jù)中的誤差獨立性假設(shè)是否滿足,可以繪制殘差與時間的關(guān)系圖來實現(xiàn)。如果殘差-時間圖呈現(xiàn)了某種規(guī)律,說明各個殘差之間可能存在某種相關(guān)性,那么很有可能就不滿足獨立性要求。誤差的獨立性——自相關(guān)126呈現(xiàn)出正負(fù)誤差交替出現(xiàn)的規(guī)律,因此不滿足誤差獨立性的假設(shè)。呈現(xiàn)出誤差值隨著時間遞減的規(guī)律,因此也不滿足誤差獨立性的假設(shè)。誤差的獨立性127各誤差點之間是隨機分布,誤差之間相互獨立。誤差的獨立性——D-W檢驗128Durbin–WatsonTest,通過統(tǒng)計檢驗方法驗證殘差獨立性是否滿足。檢測誤差項之間是否存在一階自相關(guān),即誤差項和是否存在某種關(guān)系,其中i表示時間間隔。決策準(zhǔn)則:
異常值和有影響的觀測129異常值檢測——識別130異常值可通過數(shù)據(jù)集的散點圖進行識別。如圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年臨時搬運合同
- 2024年度某新能源汽車制造技術(shù)許可合同
- 2024年度文化娛樂活動策劃合同
- 2024年廣播劇配音委托合同
- 2024年建筑工程地面建設(shè)合同
- 企業(yè)普通員工年終個人工作總結(jié)
- 2024年度風(fēng)力發(fā)電設(shè)備安裝合同
- 節(jié)能宣傳課件教學(xué)課件
- 2024醫(yī)療機構(gòu)人力資源共享與培訓(xùn)合同
- 2024年度碎石料供需合同
- 護士與醫(yī)生的合作與溝通
- GB 42295-2022電動自行車電氣安全要求
- 產(chǎn)品系統(tǒng)設(shè)計開發(fā) 課件 第4、5章 產(chǎn)品系統(tǒng)設(shè)計類型、產(chǎn)品系統(tǒng)設(shè)計開發(fā)綜合案例
- 1編譯原理及實現(xiàn)課后題及答案
- 焊接材料的質(zhì)量控制和追溯規(guī)范
- 讓閱讀成為習(xí)慣家長會課件
- 家庭健康照護服務(wù)方案
- 施工方案 誰編
- 滬教牛津版八上英語Unit-6-單元完整課件
- 新能源及多能互補互補技術(shù)
- 混凝土攪拌站安裝及拆除方案
評論
0/150
提交評論