




已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
本章目標(biāo) 1 理解方差分析的概念2 知道方差分析解決什么樣的問題3 掌握單因素和多因素方差分析的原理4 會(huì)利用Minitab對(duì)實(shí)際問題進(jìn)行方差分析5 能夠?qū)Ψ讲罘治龅慕Y(jié)果作出解釋 返回目錄 方差分析的引入 續(xù)一 方差分析 ANOVA analysisofvariance 能夠解決多個(gè)均值是否相等的檢驗(yàn)問題 方差分析是要檢驗(yàn)各個(gè)水平的均值是否相等 采用的方法是比較各水平的方差 返回目錄 方差分析的引入 續(xù)三 方差分析實(shí)際上是用來辨別各水平間的差別是否超出了水平內(nèi)正常誤差的程度觀察值之間的差異包括系統(tǒng)性差異和隨機(jī)性差異 返回目錄 方差分析的引入 續(xù)四 觀察值 期望值 差距 總離差 組內(nèi)方差 組間方差 水平1 水平2 返回目錄 7 2怎樣得到F統(tǒng)計(jì)量 返回目錄 怎樣得到F統(tǒng)計(jì)量 水平間 也稱組間 方差和水平內(nèi) 也稱組內(nèi) 方差之比是一個(gè)統(tǒng)計(jì)量 實(shí)踐證明這個(gè)統(tǒng)計(jì)量遵從一個(gè)特定的分布 數(shù)理統(tǒng)計(jì)上把這個(gè)分布稱為F分布 即 注意 組間方差 SSB 組內(nèi)方差 SSw 總方差 SST F 組間方差 組內(nèi)方差 返回目錄 方差分析的前提 不同組樣本的方差應(yīng)相等或至少很接近 水平1 水平2 水平1組內(nèi)方差遠(yuǎn)遠(yuǎn)超過兩水平組間方差 我無法分離這兩種差別 返回目錄 檢驗(yàn)方差是否一致 在方差分析之前 我們可利用Minitab對(duì)數(shù)據(jù)作方差一致性檢驗(yàn) Minitab能夠讀取的數(shù)據(jù)格式與上表給出的格式不同 我們必須把數(shù)據(jù)轉(zhuǎn)化為Minitab能夠理解的形式 具體做法是 將所有變量值輸入工作表的第一列 對(duì)因素進(jìn)行編碼 按照一定的順序編為1 2 3 輸入后面幾列 對(duì)本例 先將素質(zhì)測(cè)評(píng)的得分輸入工作表列一 三個(gè)分支分別編碼為1 2 3 對(duì)應(yīng)于變量值填入第二列 返回目錄 給出假設(shè) 因素是方差分析研究的對(duì)象 在這個(gè)例子里 兩個(gè)變量分別是分支機(jī)構(gòu)位置和員工素質(zhì)測(cè)評(píng)分?jǐn)?shù) 這里分支機(jī)構(gòu)的位置就是一個(gè)因素 因素中的內(nèi)容就稱為水平 該因素中有三個(gè)水平 即機(jī)構(gòu)的不同位置 學(xué)過第5章的知識(shí)后 我們可以給出下面的假設(shè) 返回目錄 相關(guān)分析是研究事物的相互關(guān)系 測(cè)定它們聯(lián)系的緊密程度 揭示其變化的具體形式和規(guī)律性的統(tǒng)計(jì)方法 是構(gòu)造各種經(jīng)濟(jì)模型 進(jìn)行結(jié)構(gòu)分析 政策評(píng)價(jià) 預(yù)測(cè)和控制的重要工具 相關(guān)關(guān)系度量工具 返回目錄 符號(hào) r 0正相關(guān) r 0負(fù)相關(guān) 測(cè)定兩變量是否線性相關(guān) 返回目錄 相關(guān)系數(shù)的檢驗(yàn) 統(tǒng)計(jì)量t遵從t n 2 分布 將r變換成t后 可以用t檢驗(yàn)方法檢驗(yàn) 0是否成立 返回目錄 1 一元線性回歸模型擬合優(yōu)度的評(píng)價(jià) 判定系數(shù) R2 是對(duì)回歸模型擬合優(yōu)度的評(píng)價(jià) 總偏差 回歸偏差 剩余偏差 返回目錄 2 一元線性回歸模型的顯著性檢驗(yàn) 回歸系數(shù)b的檢驗(yàn) 1 提出假設(shè) H0 0 H1 02 確定顯著性水平 3 計(jì)算回歸系數(shù)的t值 4 確定臨界值 雙側(cè)檢驗(yàn)查t分布表所確定的臨界值是 t 2 和 t 2 單側(cè)檢驗(yàn)所確定的臨界值是 t 5 做出判斷 返回目錄 當(dāng)樣本量n 30 用t檢驗(yàn) 當(dāng)樣本量n 30 t分布接近于標(biāo)準(zhǔn)正態(tài)分布Z 所以可以用正態(tài)分布代替 系數(shù)檢驗(yàn)的方法選擇 返回目錄 1 提出假設(shè) H0 R2 0 H1 R2 02 計(jì)算檢驗(yàn)統(tǒng)計(jì)量3 比較做出判斷 回歸模型整體的F檢驗(yàn) 返回目錄 8 6一元線性回歸模型的Minitab實(shí)現(xiàn) 例8 2 某家電集團(tuán)1989年至1998年10年的廣告費(fèi)支出與銷售量的資料如下表所示 試根據(jù)此資料確定銷售量y與廣告費(fèi)支出x的是否存在線性關(guān)系 并進(jìn)行模型分析 返回目錄 結(jié)果輸出 返回目錄 常見的可線性化的曲線回歸方程 返回目錄 常用的非線性函數(shù)的線性變換法 下面是我們常用的4種線性變換法 分別舉例進(jìn)行說明 其他的非線性方程也可以以此類推 得到相應(yīng)的線性形式 1 倒數(shù)變換 例如 雙曲線模型令 將其代入得2 半對(duì)數(shù)變換 例如 對(duì)數(shù)函數(shù)令 代入得 返回目錄 常用的非線性函數(shù)的線性變換法 續(xù) 3 雙對(duì)數(shù)變換 例如 冪函數(shù)兩邊取對(duì)數(shù)的變換得 令代入得 4 多項(xiàng)式變換 如二元二次多項(xiàng)式令代入得 返回目錄 回歸分析的一般程序 定性和定量分析相結(jié)合正確選擇變量 返回目錄 9 1多元線性回歸分析的基本理論 多元線性回歸是簡單線性回歸的推廣 指的是多個(gè)因變量對(duì)多個(gè)自變量的回歸 MultivariateRegression 最常用的是一個(gè)因變量對(duì)多個(gè)自變量的回歸 返回目錄 多元線性回歸模型的性質(zhì) 例 二元線性回歸模型 b2 假定x2固定時(shí)x1每變動(dòng)1個(gè)單位引起的y的增量 b3 假定x1固定時(shí)x2每變動(dòng)1個(gè)單位引起的y的增量 是x1和x2共同變動(dòng)引起的y的平均變動(dòng) 反映一組自變量與因變量的平均變動(dòng)關(guān)系 是給定x1 x2計(jì)算得到的估計(jì)值 是y的實(shí)際值的數(shù)學(xué)期望 返回目錄 一 擬合程度的評(píng)價(jià)調(diào)整可決系數(shù)式中 n是樣本容量 k是模型中回歸系數(shù)的個(gè)數(shù) 調(diào)整可決系數(shù)的特點(diǎn) 9 4多元線性回歸模型的檢驗(yàn) 返回目錄 二 多元線性回歸模型的顯著性檢驗(yàn) 回歸系數(shù)b的檢驗(yàn)1 提出假設(shè) H0 j 0 H1 j 02 確定顯著水平 3 計(jì)算回歸系數(shù)的t值 式中 是的標(biāo)準(zhǔn)差的估計(jì)值 按下式計(jì)算 式中 是 X X 1的第j個(gè)對(duì)角線元素 S2是隨機(jī)誤差項(xiàng)方差的估計(jì)值 返回目錄 二 多元線性回歸模型的顯著性檢驗(yàn) 續(xù)一 4 確定臨界值 雙側(cè)檢驗(yàn)查t分布表所確定的臨界值是 t 2 和 t 2 單側(cè)檢驗(yàn)所確定的臨界值是 t 5 做出判斷 拒絕域 拒絕域 接受域 雙側(cè)檢驗(yàn)圖示 返回目錄 回歸方程的顯著性檢驗(yàn)具體的方法步驟回歸模型方差分析表F統(tǒng)計(jì)量 二 多元線性回歸模型的顯著性檢驗(yàn) 續(xù)二 返回目錄 例9 1 在研究某超市顧客人數(shù)y與該超市促銷費(fèi)用x1 超市面積x2 超市位置x3之間關(guān)系時(shí) 選取變量如下 y 某超市某一周六顧客人數(shù) 千人 x1 該超市上周促銷所花的費(fèi)用 萬元 x2 該超市的面積 百平方米 x3 超市所處位置 0表示市區(qū) 1表示郊區(qū) 按照y變量排序后的原始數(shù)據(jù)是 多元回歸案例分析 返回目錄 輸入數(shù)據(jù)見圖 直接回歸法 返回目錄 輸出結(jié)果 返回目錄 若我們上面的預(yù)測(cè)方程不顯著 但確實(shí)知道其中幾個(gè)變量存在著一定的線性關(guān)系 我們也可以運(yùn)用逐步回歸的方法對(duì)變量進(jìn)行分析處理 逐步回歸實(shí)現(xiàn) 返回目錄 返回目錄 SS factor 的自由度是 SS error 的自由度是 ComputingDegreeofFreedom自由度的計(jì)算 One WayANOVAPrinciplesOne WayANOVA的原理 DOFofSS total SS total 的自由度是 DOFofSS factor DOFofSS error One WayANOVAPrinciplesOne WayANOVA的原理 RegressionAnalysis Oxygenpurity versusHydrocarbon TheregressionequationisOxygenpurity 74 3 14 9Hydrocarbon PredictorCoefSECoefTPConstant74 2831 59346 620 000Hydrocar14 9471 31711 350 000S 1 087R Sq 87 7 R Sq adj 87 1 AnalysisofVarianceSourceDFSSMSFPRegression1152 13152 13128 860 000ResidualError1821 251 18Total19173 38 Example1A MinitabSessionWindow例1A Minitab的對(duì)話窗口 TheF testshowsthatthe87 7 explainedbytheregressionrelationshipisstatisticallysignificant F測(cè)試顯示測(cè)定系數(shù)87 7 具備統(tǒng)計(jì)顯著性 87 7 ofthevariabilityinyvaluesisexplainedbytherelationshiptoHydrocar 與Hydrocar的關(guān)系解釋了y值87 7 的變異 R2 1meanstheregressionequationprovidesaperfectfitforthesampledata R2 1表示回歸等式與抽樣數(shù)據(jù)完全吻合 CoefficientofDetermination R2測(cè)定系數(shù) R2定義 Thecoefficientofdetermination R2istheamountofthevariationinythatisexplainedbytheregressionline 測(cè)定系數(shù) R2是由回歸線代表y中變異數(shù)量 SSR Si Yi Y 2SSE Si Yi Y 2SST Si Yi Y 2SST SSR SSE InfluentialObservations具有影響的數(shù)據(jù)點(diǎn) InfluentialObservationsareObservationsthat 具有影響的數(shù)據(jù)點(diǎn)包括下列現(xiàn)象1 lieoutsideofgeneralpatternsofthedataset在正常數(shù)據(jù)模式以外的數(shù)據(jù)significantlyinfluencetheregressionresults i e significantlychangetheslopeory intercept 強(qiáng)烈影響回歸結(jié)果的數(shù)據(jù) 也就是顯著改變斜率或y軸截取值 Theseobservationsarenotnecessarilybad thereforeyoumaynotneedtocensorthem 這些現(xiàn)象并不一定是壞現(xiàn)象 因此你不一定要?jiǎng)h除他們 However theyshouldbeidentifiedandtheirimpactevaluatedbeforeanalyzingtheregressionresults 不管怎樣 在分析回歸結(jié)果之前應(yīng)該識(shí)別這些數(shù)據(jù)點(diǎn)并評(píng)估其影響 InfluentialObservations具有影響的數(shù)據(jù)點(diǎn) InfluentialObservations Outliers具有影響的數(shù)據(jù)現(xiàn)象 界外點(diǎn) Outliers界外點(diǎn)Observationsthathavelargeresidualvalues 具有很大的殘差數(shù)值的現(xiàn)象數(shù)據(jù) InfluentialObservations LeveragePoints具有影響的數(shù)據(jù)現(xiàn)象 杠桿點(diǎn) LeveragePoints杠桿點(diǎn)ExtremehighvaluesintheX directionandaccountforahighproportionofthesumofsquares X方向的高數(shù)值數(shù)據(jù) 它對(duì)于平方占有很高的比例 InfluentialObservations具有影響的現(xiàn)象數(shù)據(jù) a b c d e f HowToHandleOutliers界外點(diǎn)的處理方法 Wecanremoveoutlierpointsundertwosituations 對(duì)于如下兩種情況 可以取消界外點(diǎn) Thereisagoodreasonfornotincludingintheanalysis e g inputerror 對(duì)不將其納入分析中有合理的解釋 例如 輸入錯(cuò)誤 2 Thesepointswillmakereasonableinterpretationoftheregressioninvalid 若納入這些數(shù)據(jù) 會(huì)令回歸分析的合理的解釋失效 ANOVAtableforLinearRegression線性回歸方差分析表SourceDFSum
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 家教合同模板
- 二零二五版食堂員工勞務(wù)派遣合同范例
- 抖音粉絲推廣合同范例
- 2024年度四川省護(hù)師類之兒科護(hù)理主管護(hù)師綜合檢測(cè)試卷B卷含答案
- 肺結(jié)核病防控課件
- 2025年傳統(tǒng)銀飾項(xiàng)目建議書
- 肝病未病先防課件
- 2025年醫(yī)院食堂運(yùn)營管理總結(jié)與年度計(jì)劃范文
- 互聯(lián)網(wǎng)營銷項(xiàng)目實(shí)施計(jì)劃
- 小學(xué)生編程社團(tuán)活動(dòng)計(jì)劃
- 賓館治安管理制度
- 2025年醫(yī)保政策法規(guī)考試題庫及答案試卷(宣傳解讀)
- 中國特色社會(huì)主義政治經(jīng)濟(jì)學(xué)知到課后答案智慧樹章節(jié)測(cè)試答案2025年春內(nèi)蒙古財(cái)經(jīng)大學(xué)
- 獸醫(yī)屠宰衛(wèi)生人員考試題庫及答案(415題)
- 心肺復(fù)蘇術(shù)課件2024新版
- TCECA-G 0310-2024 離網(wǎng)制氫靈活消納與柔性化工系統(tǒng)開發(fā)規(guī)范
- GB/T 23132-2024電動(dòng)剃須刀
- 行政復(fù)議法-形考作業(yè)2-國開(ZJ)-參考資料
- 2022年袋鼠數(shù)學(xué)競(jìng)賽真題一二年級(jí)組含答案
- 人民版四年級(jí)下冊(cè)勞動(dòng)教案全冊(cè)2024
- 三月三主題班會(huì)課件
評(píng)論
0/150
提交評(píng)論