




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
本章目標(biāo)1.理解方差分析的概念2.知道方差分析解決什么樣的問(wèn)題3.掌握單因素和多因素方差分析的原理4.會(huì)利用Minitab對(duì)實(shí)際問(wèn)題進(jìn)行方差分析5.能夠?qū)Ψ讲罘治龅慕Y(jié)果作出解釋返回目錄本章目標(biāo)1.理解方差分析的概念返回目錄1方差分析的引入(續(xù)一)方差分析(ANOVA:analysisofvariance)能夠解決多個(gè)均值是否相等的檢驗(yàn)問(wèn)題。方差分析是要檢驗(yàn)各個(gè)水平的均值是否相等,采用的方法是比較各水平的方差。返回目錄方差分析的引入(續(xù)一)方差分析(ANOVA:analysis2方差分析的引入(續(xù)三)方差分析實(shí)際上是用來(lái)辨別各水平間的差別是否超出了水平內(nèi)正常誤差的程度觀察值之間的差異包括系統(tǒng)性差異和隨機(jī)性差異。返回目錄方差分析的引入(續(xù)三)方差分析實(shí)際上是用來(lái)返回目錄3方差分析的引入(續(xù)四)觀察值期望值差距總離差組內(nèi)方差組間方差水平1水平2返回目錄方差分析的引入(續(xù)四)觀察值期望值差距總離差組內(nèi)方差組間方差47.2怎樣得到F統(tǒng)計(jì)量總離差組內(nèi)方差組間方差返回目錄7.2怎樣得到F統(tǒng)計(jì)量總離差組內(nèi)方差組間方差返回目錄5怎樣得到F統(tǒng)計(jì)量水平間(也稱組間)方差和水平內(nèi)(也稱組內(nèi))方差之比是一個(gè)統(tǒng)計(jì)量。實(shí)踐證明這個(gè)統(tǒng)計(jì)量遵從一個(gè)特定的分布,數(shù)理統(tǒng)計(jì)上把這個(gè)分布稱為F分布。即注意:組間方差(SSB)+組內(nèi)方差(SSw)=總方差(SST)F=組間方差/組內(nèi)方差返回目錄怎樣得到F統(tǒng)計(jì)量水平間(也稱組間)方差和水平內(nèi)(也稱組內(nèi))方6方差分析的前提不同組樣本的方差應(yīng)相等或至少很接近水平1水平2水平1組內(nèi)方差遠(yuǎn)遠(yuǎn)超過(guò)兩水平組間方差,我無(wú)法分離這兩種差別!返回目錄方差分析的前提不同組樣本的方差應(yīng)相等或至少很接近水平1水平27檢驗(yàn)方差是否一致在方差分析之前,我們可利用Minitab對(duì)數(shù)據(jù)作方差一致性檢驗(yàn)Minitab能夠讀取的數(shù)據(jù)格式與上表給出的格式不同,我們必須把數(shù)據(jù)轉(zhuǎn)化為Minitab能夠理解的形式,具體做法是:將所有變量值輸入工作表的第一列,對(duì)因素進(jìn)行編碼,按照一定的順序編為1、2、3...,輸入后面幾列。對(duì)本例:先將素質(zhì)測(cè)評(píng)的得分輸入工作表列一;三個(gè)分支分別編碼為1、2、3,對(duì)應(yīng)于變量值填入第二列;返回目錄檢驗(yàn)方差是否一致在方差分析之前,我們可利用Minitab對(duì)數(shù)8給出假設(shè)因素是方差分析研究的對(duì)象,在這個(gè)例子里,兩個(gè)變量分別是分支機(jī)構(gòu)位置和員工素質(zhì)測(cè)評(píng)分?jǐn)?shù),這里分支機(jī)構(gòu)的位置就是一個(gè)因素,因素中的內(nèi)容就稱為水平。該因素中有三個(gè)水平,即機(jī)構(gòu)的不同位置。學(xué)過(guò)第5章的知識(shí)后,我們可以給出下面的假設(shè):返回目錄給出假設(shè)因素是方差分析研究的對(duì)象,在這個(gè)例子里,兩個(gè)變量分別9相關(guān)分析是研究事物的相互關(guān)系,測(cè)定它們聯(lián)系的緊密程度,揭示其變化的具體形式和規(guī)律性的統(tǒng)計(jì)方法,是構(gòu)造各種經(jīng)濟(jì)模型、進(jìn)行結(jié)構(gòu)分析、政策評(píng)價(jià)、預(yù)測(cè)和控制的重要工具。相關(guān)關(guān)系度量工具相關(guān)表相關(guān)系數(shù)r散點(diǎn)圖相關(guān)分析概念度量工具
種類
返回目錄相關(guān)分析是研究事物的相互關(guān)系,測(cè)定它們聯(lián)系的緊密程度,揭示其10符號(hào):r>0正相關(guān);r<0
負(fù)相關(guān)測(cè)定兩變量是否線性相關(guān)?相關(guān)系數(shù)定義式:實(shí)際計(jì)算:計(jì)算公式值:|r|=0不存在線性關(guān)系或存在非線性相關(guān);|r|=1
完全線性相關(guān)0<|r|<1不同程度線性相關(guān)(0~0.3微弱;0.3~0.5低度;
0.5~0.8顯著;0.8~1高度)返回目錄符號(hào):r>0正相關(guān);r<0負(fù)相關(guān)測(cè)定兩變量是否線性相關(guān)?11相關(guān)系數(shù)的檢驗(yàn):相關(guān)系數(shù)的檢驗(yàn)(t檢驗(yàn))H0
:
ρ=0,H1
:ρ≠0檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)量t遵從t(n-2)分布,將r變換成t后,可以用t檢驗(yàn)方法檢驗(yàn)ρ=0是否成立。拒絕域拒絕域接受域返回目錄相關(guān)系數(shù)的檢驗(yàn):相關(guān)系數(shù)的檢驗(yàn)(t檢驗(yàn))H0:ρ=0121.一元線性回歸模型擬合優(yōu)度的評(píng)價(jià)判定系數(shù)(R2)是對(duì)回歸模型擬合優(yōu)度的評(píng)價(jià)??偲?回歸偏差+剩余偏差xy返回目錄1.一元線性回歸模型擬合優(yōu)度的評(píng)價(jià)判定系數(shù)(R2)是對(duì)回歸模13
2.一元線性回歸模型的顯著性檢驗(yàn)回歸系數(shù)b的檢驗(yàn):1.提出假設(shè)。H0:β=0;H1:β≠02.確定顯著性水平α。3.計(jì)算回歸系數(shù)的t值。4.確定臨界值。雙側(cè)檢驗(yàn)查t分布表所確定的臨界值是(-tα/2)和(tα/2);單側(cè)檢驗(yàn)所確定的臨界值是(tα)。5.做出判斷。返回目錄2.一元線性回歸模型的顯著性檢驗(yàn)回歸系數(shù)b的檢驗(yàn):4.確14當(dāng)樣本量n<30,用t檢驗(yàn)當(dāng)樣本量n>30,t分布接近于標(biāo)準(zhǔn)正態(tài)分布Z,所以可以用正態(tài)分布代替。系數(shù)檢驗(yàn)的方法選擇:返回目錄當(dāng)樣本量n<30,用t檢驗(yàn)當(dāng)樣本量n>30,t分布接近于標(biāo)151.提出假設(shè):H0:R2=0;H1:R2≠02.計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.比較做出判斷回歸模型整體的F檢驗(yàn)
返回目錄1.提出假設(shè):H0:R2=0;H1:R2≠0回歸模型整體的168.6一元線性回歸模型的Minitab實(shí)現(xiàn)例8-2.某家電集團(tuán)1989年至1998年10年的廣告費(fèi)支出與銷(xiāo)售量的資料如下表所示:年份89909192939495969798廣告支出x(萬(wàn)元)10204050608070110110140銷(xiāo)售量y(萬(wàn)元)20303540507065807095試根據(jù)此資料確定銷(xiāo)售量y與廣告費(fèi)支出x的是否存在線性關(guān)系,并進(jìn)行模型分析。返回目錄8.6一元線性回歸模型的Minitab實(shí)現(xiàn)例8-2.某17系數(shù)的t檢驗(yàn)擬合優(yōu)度R2方程的F檢驗(yàn)預(yù)測(cè)方程結(jié)果輸出:返回目錄系數(shù)的t檢驗(yàn)擬合優(yōu)度R2方程的F檢驗(yàn)預(yù)測(cè)方程結(jié)果輸出:返回目18常見(jiàn)的可線性化的曲線回歸方程:英文名稱中文名稱方程形式Linear線性函數(shù)Logarithm對(duì)數(shù)函數(shù)Inverse雙曲線函數(shù)Quadratic二次曲線Cubic三次曲線Power冪函數(shù)Compound復(fù)合函數(shù)SS形函數(shù)Logistic邏輯函數(shù)
u是預(yù)先給定的常數(shù)Growth增長(zhǎng)曲線Exponent指數(shù)函數(shù)返回目錄常見(jiàn)的可線性化的曲線回歸方程:英文名稱中文名稱方程形式L19常用的非線性函數(shù)的線性變換法下面是我們常用的4種線性變換法,分別舉例進(jìn)行說(shuō)明,其他的非線性方程也可以以此類推,得到相應(yīng)的線性形式。1.倒數(shù)變換。例如:雙曲線模型令,將其代入得2.半對(duì)數(shù)變換。例如:對(duì)數(shù)函數(shù)令,代入得返回目錄常用的非線性函數(shù)的線性變換法下面是我們常用的4種線性變換法,20常用的非線性函數(shù)的線性變換法(續(xù))3.雙對(duì)數(shù)變換。例如:冪函數(shù)兩邊取對(duì)數(shù)的變換得:令代入得:4.多項(xiàng)式變換。如二元二次多項(xiàng)式令代入得:返回目錄常用的非線性函數(shù)的線性變換法(續(xù))3.雙對(duì)數(shù)變換。返回目錄21回歸分析的一般程序定性和定量分析相結(jié)合正確選擇變量搜集(試驗(yàn))統(tǒng)計(jì)數(shù)據(jù)估計(jì)回歸方程檢驗(yàn)回歸方程檢驗(yàn)回歸系數(shù)通過(guò)驗(yàn)證理論估計(jì)影響預(yù)測(cè)變化通過(guò)不通過(guò)不通過(guò)返回目錄回歸分析的一般程序定性和定量分析相搜集(試驗(yàn))統(tǒng)計(jì)數(shù)據(jù)估計(jì)回229.1多元線性回歸分析的基本理論
多元線性回歸是簡(jiǎn)單線性回歸的推廣,指的是多個(gè)因變量對(duì)多個(gè)自變量的回歸(MultivariateRegression),最常用的是一個(gè)因變量對(duì)多個(gè)自變量的回歸。返回目錄9.1多元線性回歸分析的基本理論多元線性回歸是簡(jiǎn)單線性23多元線性回歸模型的性質(zhì)截距偏回歸系數(shù)例二元線性回歸模型:b2:假定x2固定時(shí)x1每變動(dòng)1個(gè)單位引起的y的增量。b3:假定x1固定時(shí)x2每變動(dòng)1個(gè)單位引起的y的增量。是x1和x2共同變動(dòng)引起的y的平均變動(dòng),反映一組自變量與因變量的平均變動(dòng)關(guān)系。是給定x1、x2計(jì)算得到的估計(jì)值,是y的實(shí)際值的數(shù)學(xué)期望。返回目錄多元線性回歸模型的性質(zhì)截距偏回歸系數(shù)例二元線性回歸模型:b224一.擬合程度的評(píng)價(jià)調(diào)整可決系數(shù)
式中,n是樣本容量;k是模型中回歸系數(shù)的個(gè)數(shù)。調(diào)整可決系數(shù)的特點(diǎn)。9.4多元線性回歸模型的檢驗(yàn)返回目錄一.擬合程度的評(píng)價(jià)9.4多元線性回歸模型的檢驗(yàn)返回目錄25
二.多元線性回歸模型的顯著性檢驗(yàn)回歸系數(shù)b的檢驗(yàn)1.提出假設(shè)。H0:βj=0;H1:βj≠0
2.確定顯著水平α。3.計(jì)算回歸系數(shù)的t值。式中,是的標(biāo)準(zhǔn)差的估計(jì)值。按下式計(jì)算:
式中,是(X’X)-1的第j個(gè)對(duì)角線元素,S2是隨機(jī)誤差項(xiàng)方差的估計(jì)值。返回目錄二.多元線性回歸模型的顯著性檢驗(yàn)回歸系數(shù)b的檢驗(yàn)返回26
二.多元線性回歸模型的顯著性檢驗(yàn)(續(xù)一)4.確定臨界值。雙側(cè)檢驗(yàn)查t分布表所確定的臨界值是(-tα/2)和(tα/2);單側(cè)檢驗(yàn)所確定的臨界值是(tα)。5.做出判斷。拒絕域拒絕域接受域雙側(cè)檢驗(yàn)圖示:返回目錄二.多元線性回歸模型的顯著性檢驗(yàn)(續(xù)一)4.確定臨界值。27回歸方程的顯著性檢驗(yàn)具體的方法步驟回歸模型方差分析表F統(tǒng)計(jì)量
二.多元線性回歸模型的顯著性檢驗(yàn)(續(xù)二)離差名稱平方和自由度均方差回歸平方和k-1SSR/(k-1)殘差平方和
n-kSSE/(n-k)總離差平方和返回目錄回歸方程的顯著性檢驗(yàn)二.多元線性回歸模型的顯著性檢驗(yàn)(續(xù)28例9-1:在研究某超市顧客人數(shù)y與該超市促銷(xiāo)費(fèi)用x1
、超市面積x2
、超市位置x3之間關(guān)系時(shí),選取變量如下:y——某超市某一周六顧客人數(shù)(千人)x1——該超市上周促銷(xiāo)所花的費(fèi)用(萬(wàn)元)x2——該超市的面積(百平方米)x3——超市所處位置(0表示市區(qū)、1表示郊區(qū))按照y變量排序后的原始數(shù)據(jù)是:y23578101724253031353642444548505255x111.522.54.444.1x21.522.522435578x311110111001010001000多元回歸案例分析:返回目錄例9-1:在研究某超市顧客人數(shù)y與該超市促銷(xiāo)費(fèi)用x1、超市29輸入數(shù)據(jù)見(jiàn)圖直接回歸法:點(diǎn)擊Stat——Regression——Regression返回目錄輸入數(shù)據(jù)見(jiàn)圖直接回歸法:點(diǎn)擊Stat——Regression30擬合的多元方程回歸系數(shù)的t檢驗(yàn)調(diào)整后的可決系數(shù)可決系數(shù)回歸方程的F檢驗(yàn)輸出結(jié)果:返回目錄擬合的多元方程回歸系數(shù)的t檢驗(yàn)調(diào)整后的可決系數(shù)可決系數(shù)回歸方31若我們上面的預(yù)測(cè)方程不顯著,但確實(shí)知道其中幾個(gè)變量存在著一定的線性關(guān)系,我們也可以運(yùn)用逐步回歸的方法對(duì)變量進(jìn)行分析處理。點(diǎn)擊選擇回歸方法點(diǎn)擊彈出變量選擇框如下:逐步回歸實(shí)現(xiàn):返回目錄若我們上面的預(yù)測(cè)方程不顯著,但確實(shí)知道其中幾個(gè)變量存在著一定32方程中X1的回歸系數(shù)及其t檢驗(yàn)值、p值可決系數(shù)及調(diào)整后的可決系數(shù)回歸方程常數(shù)項(xiàng)點(diǎn)擊OK返回目錄方程中X1的回歸系數(shù)及其t檢驗(yàn)值、p值可決系數(shù)及回33SS(factor)的自由度
是, SS(error)的自由度
是,
ComputingDegreeofFreedom自由度的計(jì)算One-WayANOVAPrinciples
One-WayANOVA的原理DOFofSS(total),SS(total)的自由度
是, DOFofSS(factor),DOFofSS(error),SS(factor)的自由度是, SS(er34因子(factor)平方和(SumofSquares)自由度(DegreeofFreedom)均平方(MeanSquare)F值SSBetweenSSWithinTotalOne-WayANOVAPrinciples
One-WayANOVA的原理因子平方和自由度均平方F值SSBetweenSSWith35RegressionAnalysis:Oxygenpurity%versusHydrocarbon%TheregressionequationisOxygenpurity%=74.3+14.9Hydrocarbon%PredictorCoefSECoefTPConstant74.2831.59346.620.000Hydrocar14.9471.31711.350.000S=1.087R-Sq=87.7%R-Sq(adj)=87.1%AnalysisofVarianceSourceDFSSMSFPRegression1152.13152.13128.860.000ResidualError1821.251.18Total19173.38Example1A:MinitabSessionWindow
例1A:Minitab的對(duì)話窗口TheF-testshowsthatthe87.7%explainedbytheregressionrelationshipisstatisticallysignificant.F測(cè)試顯示測(cè)定系數(shù)87.7%,具備統(tǒng)計(jì)顯著性87.7%ofthevariabilityinyvaluesisexplainedbytherelationshiptoHydrocar.與Hydrocar的關(guān)系解釋了y值87.7%的變異RegressionAnalysis:Oxygenpu36R2=1meanstheregressionequationprovidesaperfectfitforthesampledata.R2=1表示回歸等式與抽樣數(shù)據(jù)完全吻合CoefficientofDetermination--R2
測(cè)定系數(shù)--R2定義Thecoefficientofdetermination,R2istheamountofthevariationinythatisexplainedbytheregressionline.測(cè)定系數(shù),R2是由回歸線代表y中變異數(shù)量R2=SSRSSTSSR=Si(Yi-Y)2SSE=Si(Yi-Y)2SST=Si(Yi-Y)2SST=SSR+SSE
R2=1meanstheregressioneq37InfluentialObservations
具有影響的數(shù)據(jù)點(diǎn)InfluentialObservationsareObservationsthat: 具有影響的數(shù)據(jù)點(diǎn)包括下列現(xiàn)象1) lieoutsideofgeneralpatternsofthedataset在正常數(shù)據(jù)模式以外的數(shù)據(jù)significantlyinfluencetheregressionresults (i.e.significantlychangetheslopeory-intercept)強(qiáng)烈影響回歸結(jié)果的數(shù)據(jù) (也就是顯著改變斜率或y軸截取值)InfluentialObservations
具有影響的38Theseobservationsarenotnecessarilybad,thereforeyoumaynotneedtocensorthem.這些現(xiàn)象并不一定是壞現(xiàn)象,因此你不一定要?jiǎng)h除他們。However,theyshouldbeidentifiedandtheirimpactevaluatedbeforeanalyzingtheregressionresults.不管怎樣,在分析回歸結(jié)果之前應(yīng)該識(shí)別這些數(shù)據(jù)點(diǎn)并評(píng)估其影響。InfluentialObservations
具有影響的數(shù)據(jù)點(diǎn)Theseobservationsarenotnec39InfluentialObservations:Outliers
具有影響的數(shù)據(jù)現(xiàn)象:界外點(diǎn)Outliers 界外點(diǎn)Observationsthathavelargeresidualvalues.具有很大的殘差數(shù)值的現(xiàn)象數(shù)據(jù)。YXOutlier界外點(diǎn)InfluentialObservations:Out40InfluentialObservations:LeveragePoints
具有影響的數(shù)據(jù)現(xiàn)象:杠桿點(diǎn)LeveragePoints 杠桿點(diǎn)ExtremehighvaluesintheX-directionandaccountforahighproportionofthesumofsquares.X方向的高數(shù)值數(shù)據(jù),它對(duì)于平方占有很高的比例YXLeveragePoint影響點(diǎn)InfluentialObservations:Leve41InfluentialObservations
具有影響的現(xiàn)象數(shù)據(jù)YX(a)YX(b)YX(c)YX(d)YX(e)YX(f)InfluentialObservations
具有影響的42HowToHandleOutliers 界外點(diǎn)的處理方法Wecanremoveoutlierpointsundertwosituations:對(duì)于如下兩種情況,可以取消界外點(diǎn):Thereisagoodreasonfornotincludingintheanalysis(e.g.inputerror) 對(duì)不將其納入分析中有合理的解釋(例如:輸入錯(cuò)誤)2)Thesepointswillmakereasonableinterpretationoftheregressioninvalid. 若納入這些數(shù)據(jù),會(huì)令回歸分析的合理的解釋失效。HowToHandleOutliers 界外點(diǎn)的處理方43ANOVAtableforLinearRegression 線性回歸方差分析表Source DF SumofSquare(SS) MeanSquare(MS)Regression 1 SSR=i(Yi–Y)2 SSR÷1Error n-2 SSE=i(Yi–Yi)2 SSE÷(n-2)Total n-1 SST=i(Yi–Y)2 F*=MSR÷MSE vsF(1,n-2)-distribution
AutomaticallycomputedinMinitabunder用Minitab自動(dòng)計(jì)算如下
StatRegressionRegression/FittedLinePlot_StatisticalSignificance
統(tǒng)計(jì)性意義
ANOVAtableforLinearRegress44本章目標(biāo)1.理解方差分析的概念2.知道方差分析解決什么樣的問(wèn)題3.掌握單因素和多因素方差分析的原理4.會(huì)利用Minitab對(duì)實(shí)際問(wèn)題進(jìn)行方差分析5.能夠?qū)Ψ讲罘治龅慕Y(jié)果作出解釋返回目錄本章目標(biāo)1.理解方差分析的概念返回目錄45方差分析的引入(續(xù)一)方差分析(ANOVA:analysisofvariance)能夠解決多個(gè)均值是否相等的檢驗(yàn)問(wèn)題。方差分析是要檢驗(yàn)各個(gè)水平的均值是否相等,采用的方法是比較各水平的方差。返回目錄方差分析的引入(續(xù)一)方差分析(ANOVA:analysis46方差分析的引入(續(xù)三)方差分析實(shí)際上是用來(lái)辨別各水平間的差別是否超出了水平內(nèi)正常誤差的程度觀察值之間的差異包括系統(tǒng)性差異和隨機(jī)性差異。返回目錄方差分析的引入(續(xù)三)方差分析實(shí)際上是用來(lái)返回目錄47方差分析的引入(續(xù)四)觀察值期望值差距總離差組內(nèi)方差組間方差水平1水平2返回目錄方差分析的引入(續(xù)四)觀察值期望值差距總離差組內(nèi)方差組間方差487.2怎樣得到F統(tǒng)計(jì)量總離差組內(nèi)方差組間方差返回目錄7.2怎樣得到F統(tǒng)計(jì)量總離差組內(nèi)方差組間方差返回目錄49怎樣得到F統(tǒng)計(jì)量水平間(也稱組間)方差和水平內(nèi)(也稱組內(nèi))方差之比是一個(gè)統(tǒng)計(jì)量。實(shí)踐證明這個(gè)統(tǒng)計(jì)量遵從一個(gè)特定的分布,數(shù)理統(tǒng)計(jì)上把這個(gè)分布稱為F分布。即注意:組間方差(SSB)+組內(nèi)方差(SSw)=總方差(SST)F=組間方差/組內(nèi)方差返回目錄怎樣得到F統(tǒng)計(jì)量水平間(也稱組間)方差和水平內(nèi)(也稱組內(nèi))方50方差分析的前提不同組樣本的方差應(yīng)相等或至少很接近水平1水平2水平1組內(nèi)方差遠(yuǎn)遠(yuǎn)超過(guò)兩水平組間方差,我無(wú)法分離這兩種差別!返回目錄方差分析的前提不同組樣本的方差應(yīng)相等或至少很接近水平1水平251檢驗(yàn)方差是否一致在方差分析之前,我們可利用Minitab對(duì)數(shù)據(jù)作方差一致性檢驗(yàn)Minitab能夠讀取的數(shù)據(jù)格式與上表給出的格式不同,我們必須把數(shù)據(jù)轉(zhuǎn)化為Minitab能夠理解的形式,具體做法是:將所有變量值輸入工作表的第一列,對(duì)因素進(jìn)行編碼,按照一定的順序編為1、2、3...,輸入后面幾列。對(duì)本例:先將素質(zhì)測(cè)評(píng)的得分輸入工作表列一;三個(gè)分支分別編碼為1、2、3,對(duì)應(yīng)于變量值填入第二列;返回目錄檢驗(yàn)方差是否一致在方差分析之前,我們可利用Minitab對(duì)數(shù)52給出假設(shè)因素是方差分析研究的對(duì)象,在這個(gè)例子里,兩個(gè)變量分別是分支機(jī)構(gòu)位置和員工素質(zhì)測(cè)評(píng)分?jǐn)?shù),這里分支機(jī)構(gòu)的位置就是一個(gè)因素,因素中的內(nèi)容就稱為水平。該因素中有三個(gè)水平,即機(jī)構(gòu)的不同位置。學(xué)過(guò)第5章的知識(shí)后,我們可以給出下面的假設(shè):返回目錄給出假設(shè)因素是方差分析研究的對(duì)象,在這個(gè)例子里,兩個(gè)變量分別53相關(guān)分析是研究事物的相互關(guān)系,測(cè)定它們聯(lián)系的緊密程度,揭示其變化的具體形式和規(guī)律性的統(tǒng)計(jì)方法,是構(gòu)造各種經(jīng)濟(jì)模型、進(jìn)行結(jié)構(gòu)分析、政策評(píng)價(jià)、預(yù)測(cè)和控制的重要工具。相關(guān)關(guān)系度量工具相關(guān)表相關(guān)系數(shù)r散點(diǎn)圖相關(guān)分析概念度量工具
種類
返回目錄相關(guān)分析是研究事物的相互關(guān)系,測(cè)定它們聯(lián)系的緊密程度,揭示其54符號(hào):r>0正相關(guān);r<0
負(fù)相關(guān)測(cè)定兩變量是否線性相關(guān)?相關(guān)系數(shù)定義式:實(shí)際計(jì)算:計(jì)算公式值:|r|=0不存在線性關(guān)系或存在非線性相關(guān);|r|=1
完全線性相關(guān)0<|r|<1不同程度線性相關(guān)(0~0.3微弱;0.3~0.5低度;
0.5~0.8顯著;0.8~1高度)返回目錄符號(hào):r>0正相關(guān);r<0負(fù)相關(guān)測(cè)定兩變量是否線性相關(guān)?55相關(guān)系數(shù)的檢驗(yàn):相關(guān)系數(shù)的檢驗(yàn)(t檢驗(yàn))H0
:
ρ=0,H1
:ρ≠0檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)量t遵從t(n-2)分布,將r變換成t后,可以用t檢驗(yàn)方法檢驗(yàn)ρ=0是否成立。拒絕域拒絕域接受域返回目錄相關(guān)系數(shù)的檢驗(yàn):相關(guān)系數(shù)的檢驗(yàn)(t檢驗(yàn))H0:ρ=0561.一元線性回歸模型擬合優(yōu)度的評(píng)價(jià)判定系數(shù)(R2)是對(duì)回歸模型擬合優(yōu)度的評(píng)價(jià)??偲?回歸偏差+剩余偏差xy返回目錄1.一元線性回歸模型擬合優(yōu)度的評(píng)價(jià)判定系數(shù)(R2)是對(duì)回歸模57
2.一元線性回歸模型的顯著性檢驗(yàn)回歸系數(shù)b的檢驗(yàn):1.提出假設(shè)。H0:β=0;H1:β≠02.確定顯著性水平α。3.計(jì)算回歸系數(shù)的t值。4.確定臨界值。雙側(cè)檢驗(yàn)查t分布表所確定的臨界值是(-tα/2)和(tα/2);單側(cè)檢驗(yàn)所確定的臨界值是(tα)。5.做出判斷。返回目錄2.一元線性回歸模型的顯著性檢驗(yàn)回歸系數(shù)b的檢驗(yàn):4.確58當(dāng)樣本量n<30,用t檢驗(yàn)當(dāng)樣本量n>30,t分布接近于標(biāo)準(zhǔn)正態(tài)分布Z,所以可以用正態(tài)分布代替。系數(shù)檢驗(yàn)的方法選擇:返回目錄當(dāng)樣本量n<30,用t檢驗(yàn)當(dāng)樣本量n>30,t分布接近于標(biāo)591.提出假設(shè):H0:R2=0;H1:R2≠02.計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.比較做出判斷回歸模型整體的F檢驗(yàn)
返回目錄1.提出假設(shè):H0:R2=0;H1:R2≠0回歸模型整體的608.6一元線性回歸模型的Minitab實(shí)現(xiàn)例8-2.某家電集團(tuán)1989年至1998年10年的廣告費(fèi)支出與銷(xiāo)售量的資料如下表所示:年份89909192939495969798廣告支出x(萬(wàn)元)10204050608070110110140銷(xiāo)售量y(萬(wàn)元)20303540507065807095試根據(jù)此資料確定銷(xiāo)售量y與廣告費(fèi)支出x的是否存在線性關(guān)系,并進(jìn)行模型分析。返回目錄8.6一元線性回歸模型的Minitab實(shí)現(xiàn)例8-2.某61系數(shù)的t檢驗(yàn)擬合優(yōu)度R2方程的F檢驗(yàn)預(yù)測(cè)方程結(jié)果輸出:返回目錄系數(shù)的t檢驗(yàn)擬合優(yōu)度R2方程的F檢驗(yàn)預(yù)測(cè)方程結(jié)果輸出:返回目62常見(jiàn)的可線性化的曲線回歸方程:英文名稱中文名稱方程形式Linear線性函數(shù)Logarithm對(duì)數(shù)函數(shù)Inverse雙曲線函數(shù)Quadratic二次曲線Cubic三次曲線Power冪函數(shù)Compound復(fù)合函數(shù)SS形函數(shù)Logistic邏輯函數(shù)
u是預(yù)先給定的常數(shù)Growth增長(zhǎng)曲線Exponent指數(shù)函數(shù)返回目錄常見(jiàn)的可線性化的曲線回歸方程:英文名稱中文名稱方程形式L63常用的非線性函數(shù)的線性變換法下面是我們常用的4種線性變換法,分別舉例進(jìn)行說(shuō)明,其他的非線性方程也可以以此類推,得到相應(yīng)的線性形式。1.倒數(shù)變換。例如:雙曲線模型令,將其代入得2.半對(duì)數(shù)變換。例如:對(duì)數(shù)函數(shù)令,代入得返回目錄常用的非線性函數(shù)的線性變換法下面是我們常用的4種線性變換法,64常用的非線性函數(shù)的線性變換法(續(xù))3.雙對(duì)數(shù)變換。例如:冪函數(shù)兩邊取對(duì)數(shù)的變換得:令代入得:4.多項(xiàng)式變換。如二元二次多項(xiàng)式令代入得:返回目錄常用的非線性函數(shù)的線性變換法(續(xù))3.雙對(duì)數(shù)變換。返回目錄65回歸分析的一般程序定性和定量分析相結(jié)合正確選擇變量搜集(試驗(yàn))統(tǒng)計(jì)數(shù)據(jù)估計(jì)回歸方程檢驗(yàn)回歸方程檢驗(yàn)回歸系數(shù)通過(guò)驗(yàn)證理論估計(jì)影響預(yù)測(cè)變化通過(guò)不通過(guò)不通過(guò)返回目錄回歸分析的一般程序定性和定量分析相搜集(試驗(yàn))統(tǒng)計(jì)數(shù)據(jù)估計(jì)回669.1多元線性回歸分析的基本理論
多元線性回歸是簡(jiǎn)單線性回歸的推廣,指的是多個(gè)因變量對(duì)多個(gè)自變量的回歸(MultivariateRegression),最常用的是一個(gè)因變量對(duì)多個(gè)自變量的回歸。返回目錄9.1多元線性回歸分析的基本理論多元線性回歸是簡(jiǎn)單線性67多元線性回歸模型的性質(zhì)截距偏回歸系數(shù)例二元線性回歸模型:b2:假定x2固定時(shí)x1每變動(dòng)1個(gè)單位引起的y的增量。b3:假定x1固定時(shí)x2每變動(dòng)1個(gè)單位引起的y的增量。是x1和x2共同變動(dòng)引起的y的平均變動(dòng),反映一組自變量與因變量的平均變動(dòng)關(guān)系。是給定x1、x2計(jì)算得到的估計(jì)值,是y的實(shí)際值的數(shù)學(xué)期望。返回目錄多元線性回歸模型的性質(zhì)截距偏回歸系數(shù)例二元線性回歸模型:b268一.擬合程度的評(píng)價(jià)調(diào)整可決系數(shù)
式中,n是樣本容量;k是模型中回歸系數(shù)的個(gè)數(shù)。調(diào)整可決系數(shù)的特點(diǎn)。9.4多元線性回歸模型的檢驗(yàn)返回目錄一.擬合程度的評(píng)價(jià)9.4多元線性回歸模型的檢驗(yàn)返回目錄69
二.多元線性回歸模型的顯著性檢驗(yàn)回歸系數(shù)b的檢驗(yàn)1.提出假設(shè)。H0:βj=0;H1:βj≠0
2.確定顯著水平α。3.計(jì)算回歸系數(shù)的t值。式中,是的標(biāo)準(zhǔn)差的估計(jì)值。按下式計(jì)算:
式中,是(X’X)-1的第j個(gè)對(duì)角線元素,S2是隨機(jī)誤差項(xiàng)方差的估計(jì)值。返回目錄二.多元線性回歸模型的顯著性檢驗(yàn)回歸系數(shù)b的檢驗(yàn)返回70
二.多元線性回歸模型的顯著性檢驗(yàn)(續(xù)一)4.確定臨界值。雙側(cè)檢驗(yàn)查t分布表所確定的臨界值是(-tα/2)和(tα/2);單側(cè)檢驗(yàn)所確定的臨界值是(tα)。5.做出判斷。拒絕域拒絕域接受域雙側(cè)檢驗(yàn)圖示:返回目錄二.多元線性回歸模型的顯著性檢驗(yàn)(續(xù)一)4.確定臨界值。71回歸方程的顯著性檢驗(yàn)具體的方法步驟回歸模型方差分析表F統(tǒng)計(jì)量
二.多元線性回歸模型的顯著性檢驗(yàn)(續(xù)二)離差名稱平方和自由度均方差回歸平方和k-1SSR/(k-1)殘差平方和
n-kSSE/(n-k)總離差平方和返回目錄回歸方程的顯著性檢驗(yàn)二.多元線性回歸模型的顯著性檢驗(yàn)(續(xù)72例9-1:在研究某超市顧客人數(shù)y與該超市促銷(xiāo)費(fèi)用x1
、超市面積x2
、超市位置x3之間關(guān)系時(shí),選取變量如下:y——某超市某一周六顧客人數(shù)(千人)x1——該超市上周促銷(xiāo)所花的費(fèi)用(萬(wàn)元)x2——該超市的面積(百平方米)x3——超市所處位置(0表示市區(qū)、1表示郊區(qū))按照y變量排序后的原始數(shù)據(jù)是:y23578101724253031353642444548505255x111.522.54.444.1x21.522.522435578x311110111001010001000多元回歸案例分析:返回目錄例9-1:在研究某超市顧客人數(shù)y與該超市促銷(xiāo)費(fèi)用x1、超市73輸入數(shù)據(jù)見(jiàn)圖直接回歸法:點(diǎn)擊Stat——Regression——Regression返回目錄輸入數(shù)據(jù)見(jiàn)圖直接回歸法:點(diǎn)擊Stat——Regression74擬合的多元方程回歸系數(shù)的t檢驗(yàn)調(diào)整后的可決系數(shù)可決系數(shù)回歸方程的F檢驗(yàn)輸出結(jié)果:返回目錄擬合的多元方程回歸系數(shù)的t檢驗(yàn)調(diào)整后的可決系數(shù)可決系數(shù)回歸方75若我們上面的預(yù)測(cè)方程不顯著,但確實(shí)知道其中幾個(gè)變量存在著一定的線性關(guān)系,我們也可以運(yùn)用逐步回歸的方法對(duì)變量進(jìn)行分析處理。點(diǎn)擊選擇回歸方法點(diǎn)擊彈出變量選擇框如下:逐步回歸實(shí)現(xiàn):返回目錄若我們上面的預(yù)測(cè)方程不顯著,但確實(shí)知道其中幾個(gè)變量存在著一定76方程中X1的回歸系數(shù)及其t檢驗(yàn)值、p值可決系數(shù)及調(diào)整后的可決系數(shù)回歸方程常數(shù)項(xiàng)點(diǎn)擊OK返回目錄方程中X1的回歸系數(shù)及其t檢驗(yàn)值、p值可決系數(shù)及回77SS(factor)的自由度
是, SS(error)的自由度
是,
ComputingDegreeofFreedom自由度的計(jì)算One-WayANOVAPrinciples
One-WayANOVA的原理DOFofSS(total),SS(total)的自由度
是, DOFofSS(factor),DOFofSS(error),SS(factor)的自由度是, SS(er78因子(factor)平方和(SumofSquares)自由度(DegreeofFreedom)均平方(MeanSquare)F值SSBetweenSSWithinTotalOne-WayANOVAPrinciples
One-WayANOVA的原理因子平方和自由度均平方F值SSBetweenSSWith79RegressionAnalysis:Oxygenpurity%versusHydrocarbon%TheregressionequationisOxygenpurity%=74.3+14.9Hydrocarbon%PredictorCoefSECoefTPConstant74.2831.59346.620.000Hydrocar14.9471.31711.350.000S=1.087R-Sq=87.7%R-Sq(adj)=87.1%AnalysisofVarianceSourceDFSSMSFPRegression1152.13152.13128.860.000ResidualError1821.251.18Total19173.38Example1A:MinitabSessionWindow
例1A:Minitab的對(duì)話窗口TheF-testshowsthatthe87.7%explainedbytheregressionrelationshipisstatisticallysignificant.F測(cè)試顯示測(cè)定系數(shù)87.7%,具備統(tǒng)計(jì)顯著性87.7%ofthevariabilityinyvaluesisexplainedbytherelationshiptoHydrocar.與Hydrocar的關(guān)系解釋了y值87.7%的變異RegressionAnalysis:Oxygenpu80R2=1meanstheregressionequationprovidesaperfectfitforthesampledata.R2=1表示回歸等式與抽樣數(shù)據(jù)完全吻合CoefficientofDetermination--R2
測(cè)定系數(shù)--R2定義Thecoefficientofdetermination,R2istheamountofthevariationinythatisexplainedbytheregressionline.測(cè)定系數(shù),R2是由回歸線代表y中變異數(shù)量R2=SSRSSTSSR=Si(Yi-Y)2SSE=Si(Yi-Y)2SST=Si(Yi-Y)2SST=SSR+SSE
R2=1meanstheregressioneq81InfluentialObservations
具有影響的數(shù)據(jù)點(diǎn)InfluentialObservationsareObservationsthat: 具有影響的數(shù)據(jù)點(diǎn)包括下列現(xiàn)象1) lieoutsideofgeneralpatternsofthedataset在正常數(shù)據(jù)模式以外的數(shù)據(jù)sign
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年農(nóng)業(yè)植保員測(cè)試要點(diǎn)試題及答案
- 2024年體育經(jīng)紀(jì)人考試考生的必修知識(shí)試題及答案
- 模具設(shè)計(jì)師資格考試細(xì)節(jié)把握試題及答案
- 2024年模具設(shè)計(jì)師考試的知識(shí)更新與試題答案
- 2024年3月全國(guó)事業(yè)單位考試聯(lián)考A類綜合應(yīng)用能力真題試題試卷答案解析
- 2024年植保員考試中的常見(jiàn)誤區(qū)試題及答案
- 2024年足球裁判員考試實(shí)際案例試題
- 2024年裁判員綜合能力試題及答案
- 農(nóng)作物種子繁育員關(guān)鍵知識(shí)點(diǎn)總結(jié)試題及答案
- 2024年裁判員考試地域差異試題及答案
- (四調(diào))武漢市2025屆高中畢業(yè)生四月調(diào)研考試 數(shù)學(xué)試卷(含答案詳解)
- 2024年中國(guó)礦產(chǎn)資源集團(tuán)大數(shù)據(jù)有限公司招聘筆試真題
- 2025年河南機(jī)電職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)及參考答案
- 超越廣告-南京林業(yè)大學(xué)中國(guó)大學(xué)mooc課后章節(jié)答案期末考試題庫(kù)2023年
- TK305水噴砂方案
- 先進(jìn)加工技術(shù)--水切割技術(shù)PPT
- 危廢處置方案完全示范版
- 沁園春·疊嶂西馳.中職課件電子教案
- 《第十三章:牙頜面畸形》PPT課件
- 人民醫(yī)院驗(yàn)收管理規(guī)定
- 污水處理廠工程分部、分項(xiàng)、檢驗(yàn)批劃分
評(píng)論
0/150
提交評(píng)論