六西格瑪培訓講義-方差與回規(guī).ppt_第1頁
六西格瑪培訓講義-方差與回規(guī).ppt_第2頁
六西格瑪培訓講義-方差與回規(guī).ppt_第3頁
六西格瑪培訓講義-方差與回規(guī).ppt_第4頁
六西格瑪培訓講義-方差與回規(guī).ppt_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

本章目標 1 理解方差分析的概念2 知道方差分析解決什么樣的問題3 掌握單因素和多因素方差分析的原理4 會利用Minitab對實際問題進行方差分析5 能夠對方差分析的結果作出解釋 返回目錄 方差分析的引入 續(xù)一 方差分析 ANOVA analysisofvariance 能夠解決多個均值是否相等的檢驗問題 方差分析是要檢驗各個水平的均值是否相等 采用的方法是比較各水平的方差 返回目錄 方差分析的引入 續(xù)三 方差分析實際上是用來辨別各水平間的差別是否超出了水平內正常誤差的程度觀察值之間的差異包括系統(tǒng)性差異和隨機性差異 返回目錄 方差分析的引入 續(xù)四 觀察值 期望值 差距 總離差 組內方差 組間方差 水平1 水平2 返回目錄 7 2怎樣得到F統(tǒng)計量 返回目錄 怎樣得到F統(tǒng)計量 水平間 也稱組間 方差和水平內 也稱組內 方差之比是一個統(tǒng)計量 實踐證明這個統(tǒng)計量遵從一個特定的分布 數(shù)理統(tǒng)計上把這個分布稱為F分布 即 注意 組間方差 SSB 組內方差 SSw 總方差 SST F 組間方差 組內方差 返回目錄 方差分析的前提 不同組樣本的方差應相等或至少很接近 水平1 水平2 水平1組內方差遠遠超過兩水平組間方差 我無法分離這兩種差別 返回目錄 檢驗方差是否一致 在方差分析之前 我們可利用Minitab對數(shù)據(jù)作方差一致性檢驗 Minitab能夠讀取的數(shù)據(jù)格式與上表給出的格式不同 我們必須把數(shù)據(jù)轉化為Minitab能夠理解的形式 具體做法是 將所有變量值輸入工作表的第一列 對因素進行編碼 按照一定的順序編為1 2 3 輸入后面幾列 對本例 先將素質測評的得分輸入工作表列一 三個分支分別編碼為1 2 3 對應于變量值填入第二列 返回目錄 給出假設 因素是方差分析研究的對象 在這個例子里 兩個變量分別是分支機構位置和員工素質測評分數(shù) 這里分支機構的位置就是一個因素 因素中的內容就稱為水平 該因素中有三個水平 即機構的不同位置 學過第5章的知識后 我們可以給出下面的假設 返回目錄 相關分析是研究事物的相互關系 測定它們聯(lián)系的緊密程度 揭示其變化的具體形式和規(guī)律性的統(tǒng)計方法 是構造各種經濟模型 進行結構分析 政策評價 預測和控制的重要工具 相關關系度量工具 返回目錄 符號 r 0正相關 r 0負相關 測定兩變量是否線性相關 返回目錄 相關系數(shù)的檢驗 統(tǒng)計量t遵從t n 2 分布 將r變換成t后 可以用t檢驗方法檢驗 0是否成立 返回目錄 1 一元線性回歸模型擬合優(yōu)度的評價 判定系數(shù) R2 是對回歸模型擬合優(yōu)度的評價 總偏差 回歸偏差 剩余偏差 返回目錄 2 一元線性回歸模型的顯著性檢驗 回歸系數(shù)b的檢驗 1 提出假設 H0 0 H1 02 確定顯著性水平 3 計算回歸系數(shù)的t值 4 確定臨界值 雙側檢驗查t分布表所確定的臨界值是 t 2 和 t 2 單側檢驗所確定的臨界值是 t 5 做出判斷 返回目錄 當樣本量n 30 用t檢驗 當樣本量n 30 t分布接近于標準正態(tài)分布Z 所以可以用正態(tài)分布代替 系數(shù)檢驗的方法選擇 返回目錄 1 提出假設 H0 R2 0 H1 R2 02 計算檢驗統(tǒng)計量3 比較做出判斷 回歸模型整體的F檢驗 返回目錄 8 6一元線性回歸模型的Minitab實現(xiàn) 例8 2 某家電集團1989年至1998年10年的廣告費支出與銷售量的資料如下表所示 試根據(jù)此資料確定銷售量y與廣告費支出x的是否存在線性關系 并進行模型分析 返回目錄 結果輸出 返回目錄 常見的可線性化的曲線回歸方程 返回目錄 常用的非線性函數(shù)的線性變換法 下面是我們常用的4種線性變換法 分別舉例進行說明 其他的非線性方程也可以以此類推 得到相應的線性形式 1 倒數(shù)變換 例如 雙曲線模型令 將其代入得2 半對數(shù)變換 例如 對數(shù)函數(shù)令 代入得 返回目錄 常用的非線性函數(shù)的線性變換法 續(xù) 3 雙對數(shù)變換 例如 冪函數(shù)兩邊取對數(shù)的變換得 令代入得 4 多項式變換 如二元二次多項式令代入得 返回目錄 回歸分析的一般程序 定性和定量分析相結合正確選擇變量 返回目錄 9 1多元線性回歸分析的基本理論 多元線性回歸是簡單線性回歸的推廣 指的是多個因變量對多個自變量的回歸 MultivariateRegression 最常用的是一個因變量對多個自變量的回歸 返回目錄 多元線性回歸模型的性質 例 二元線性回歸模型 b2 假定x2固定時x1每變動1個單位引起的y的增量 b3 假定x1固定時x2每變動1個單位引起的y的增量 是x1和x2共同變動引起的y的平均變動 反映一組自變量與因變量的平均變動關系 是給定x1 x2計算得到的估計值 是y的實際值的數(shù)學期望 返回目錄 一 擬合程度的評價調整可決系數(shù)式中 n是樣本容量 k是模型中回歸系數(shù)的個數(shù) 調整可決系數(shù)的特點 9 4多元線性回歸模型的檢驗 返回目錄 二 多元線性回歸模型的顯著性檢驗 回歸系數(shù)b的檢驗1 提出假設 H0 j 0 H1 j 02 確定顯著水平 3 計算回歸系數(shù)的t值 式中 是的標準差的估計值 按下式計算 式中 是 X X 1的第j個對角線元素 S2是隨機誤差項方差的估計值 返回目錄 二 多元線性回歸模型的顯著性檢驗 續(xù)一 4 確定臨界值 雙側檢驗查t分布表所確定的臨界值是 t 2 和 t 2 單側檢驗所確定的臨界值是 t 5 做出判斷 拒絕域 拒絕域 接受域 雙側檢驗圖示 返回目錄 回歸方程的顯著性檢驗具體的方法步驟回歸模型方差分析表F統(tǒng)計量 二 多元線性回歸模型的顯著性檢驗 續(xù)二 返回目錄 例9 1 在研究某超市顧客人數(shù)y與該超市促銷費用x1 超市面積x2 超市位置x3之間關系時 選取變量如下 y 某超市某一周六顧客人數(shù) 千人 x1 該超市上周促銷所花的費用 萬元 x2 該超市的面積 百平方米 x3 超市所處位置 0表示市區(qū) 1表示郊區(qū) 按照y變量排序后的原始數(shù)據(jù)是 多元回歸案例分析 返回目錄 輸入數(shù)據(jù)見圖 直接回歸法 返回目錄 輸出結果 返回目錄 若我們上面的預測方程不顯著 但確實知道其中幾個變量存在著一定的線性關系 我們也可以運用逐步回歸的方法對變量進行分析處理 逐步回歸實現(xiàn) 返回目錄 返回目錄 SS factor 的自由度是 SS error 的自由度是 ComputingDegreeofFreedom自由度的計算 One WayANOVAPrinciplesOne WayANOVA的原理 DOFofSS total SS total 的自由度是 DOFofSS factor DOFofSS error One WayANOVAPrinciplesOne WayANOVA的原理 RegressionAnalysis Oxygenpurity versusHydrocarbon TheregressionequationisOxygenpurity 74 3 14 9Hydrocarbon PredictorCoefSECoefTPConstant74 2831 59346 620 000Hydrocar14 9471 31711 350 000S 1 087R Sq 87 7 R Sq adj 87 1 AnalysisofVarianceSourceDFSSMSFPRegression1152 13152 13128 860 000ResidualError1821 251 18Total19173 38 Example1A MinitabSessionWindow例1A Minitab的對話窗口 TheF testshowsthatthe87 7 explainedbytheregressionrelationshipisstatisticallysignificant F測試顯示測定系數(shù)87 7 具備統(tǒng)計顯著性 87 7 ofthevariabilityinyvaluesisexplainedbytherelationshiptoHydrocar 與Hydrocar的關系解釋了y值87 7 的變異 R2 1meanstheregressionequationprovidesaperfectfitforthesampledata R2 1表示回歸等式與抽樣數(shù)據(jù)完全吻合 CoefficientofDetermination R2測定系數(shù) R2定義 Thecoefficientofdetermination R2istheamountofthevariationinythatisexplainedbytheregressionline 測定系數(shù) R2是由回歸線代表y中變異數(shù)量 SSR Si Yi Y 2SSE Si Yi Y 2SST Si Yi Y 2SST SSR SSE InfluentialObservations具有影響的數(shù)據(jù)點 InfluentialObservationsareObservationsthat 具有影響的數(shù)據(jù)點包括下列現(xiàn)象1 lieoutsideofgeneralpatternsofthedataset在正常數(shù)據(jù)模式以外的數(shù)據(jù)significantlyinfluencetheregressionresults i e significantlychangetheslopeory intercept 強烈影響回歸結果的數(shù)據(jù) 也就是顯著改變斜率或y軸截取值 Theseobservationsarenotnecessarilybad thereforeyoumaynotneedtocensorthem 這些現(xiàn)象并不一定是壞現(xiàn)象 因此你不一定要刪除他們 However theyshouldbeidentifiedandtheirimpactevaluatedbeforeanalyzingtheregressionresults 不管怎樣 在分析回歸結果之前應該識別這些數(shù)據(jù)點并評估其影響 InfluentialObservations具有影響的數(shù)據(jù)點 InfluentialObservations Outliers具有影響的數(shù)據(jù)現(xiàn)象 界外點 Outliers界外點Observationsthathavelargeresidualvalues 具有很大的殘差數(shù)值的現(xiàn)象數(shù)據(jù) InfluentialObservations LeveragePoints具有影響的數(shù)據(jù)現(xiàn)象 杠桿點 LeveragePoints杠桿點ExtremehighvaluesintheX directionandaccountforahighproportionofthesumofsquares X方向的高數(shù)值數(shù)據(jù) 它對于平方占有很高的比例 InfluentialObservations具有影響的現(xiàn)象數(shù)據(jù) a b c d e f HowToHandleOutliers界外點的處理方法 Wecanremoveoutlierpointsundertwosituations 對于如下兩種情況 可以取消界外點 Thereisagoodreasonfornotincludingintheanalysis e g inputerror 對不將其納入分析中有合理的解釋 例如 輸入錯誤 2 Thesepointswillmakereasonableinterpretationoftheregressioninvalid 若納入這些數(shù)據(jù) 會令回歸分析的合理的解釋失效 ANOVAtableforLinearRegression線性回歸方差分析表SourceDFSum

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論