相關(guān)及回歸分析.ppt_第1頁
相關(guān)及回歸分析.ppt_第2頁
相關(guān)及回歸分析.ppt_第3頁
相關(guān)及回歸分析.ppt_第4頁
相關(guān)及回歸分析.ppt_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

相關(guān)及回歸分析,方法論,Analyze 概要 DATA 收集計劃 Graph 分析 假設(shè)檢定概要 平均的檢定,分散的檢定 比率的檢定 相關(guān)及回歸分析,相關(guān)及回歸分析,學(xué)習(xí)目標(biāo) 理解相關(guān)、回歸分析的概念及用語。 理解相關(guān)、回歸分析的使用目的。 理解利用Minitab的相關(guān)分析方法。 理解利用Minitab的回歸分析方法。,定義,相關(guān)分析(Correlation Analysis) : 是把計量型輸出變量和計量型輸入變量之間相關(guān)程度, 利用相關(guān)常數(shù)(r)“數(shù)量化”的技法。 回歸分析(Regression Analysis) : 導(dǎo)出輸入變量X和輸出變量Y的函數(shù)關(guān)系,預(yù)測輸出變量的 統(tǒng)計性分析技法。 回歸式(Regression Equation) : 為預(yù)測對應(yīng)的輸出值,利用輸入值的預(yù)測方程式。,為什么使用這樣的工具?,不防礙工程進行,對工程有意義的 DATA收集可能。 進行DOE時跟加人為的變化比較 相關(guān)關(guān)系是提供Graph分析,輸入變量和輸出變量的相關(guān)性計量化而確認(rèn)。 回歸分析使用于為了管理輸入變量的預(yù)測式導(dǎo)出。 回歸分析能顯示輸入變量和輸出變量之間的因果關(guān)系,所以能決定潛在Xs是否為Vital Few Xs., 散點圖 (Scatter Diagram), 相關(guān)分析 (Correlation Analysis),在統(tǒng)計學(xué)中最有興趣的問題中的一個變量間相關(guān)性分析的方法 , 通過散點圖和相關(guān)常數(shù)能分析。,例) 智能指數(shù)和學(xué)業(yè)成績、吸咽量和肺癌的發(fā)生率、身高和體重、工程溫度和 制品強度、運動量和肺活量間的關(guān)系、所得和消費支出。,相關(guān)分析的第一階段,把相互對應(yīng)的資料 用作表平面上的點來表示的Graph, 能大概確認(rèn)兩個變量之間的關(guān)系。,相關(guān)分析, 相關(guān)常數(shù) (Correlation Coefficient),定量表示兩個變量之間線形關(guān)系的指標(biāo),并不表示函數(shù)關(guān)系。 一般用 表示,其范圍是 1 1. 一般不可知道的正確值, 因此使用從Sample中推定的值 r 。, 相關(guān)常數(shù) (Correlation Coefficient)的性質(zhì),r 值,(+) 時 陽的相關(guān)關(guān)系 () 時 陰的相關(guān)關(guān)系 接近于0時,沒有相關(guān)關(guān)系。 接近于-1 或1時有強的相關(guān)關(guān)系。,相關(guān)分析, 散點圖和相關(guān)關(guān)系,強的陽的相關(guān)關(guān)系,弱的陽的相關(guān)關(guān)系,中間程度的陽的相關(guān)關(guān)系,強的陰的相關(guān)關(guān)系,弱的陰的相關(guān)關(guān)系,中間程度的陰的相關(guān)關(guān)系,相關(guān)分析,相關(guān)常數(shù)的亂用和誤用,檢定兩個變量之間存在相關(guān)關(guān)系,并不是一個變量成為 另一個變量的原因。 可能會藏在對兩個變量都有影響的第三變量。 即,兩個變量之間存在相關(guān)關(guān)系的結(jié)論,并不是一個變量 成為另一個變量的原因。,相關(guān)關(guān)系并不一定意味著因果關(guān)系!,通過下例觀察散點圖和相關(guān)分析。,廣告費 (10萬) 銷售額 (100萬) 廣告費 (10萬) 銷售額 (100萬),4 9 12 23 8 20 6 18 9 22 10 25 8 15 6 10 7 17 9 20,下面是表示某公司的廣告費用和銷售額之間關(guān)系的資料。 求這公司的廣告費和銷售額的相關(guān)常數(shù)。,例題1,相關(guān)分析,Step 1,Work sheet 里輸入DATA,(Correlation.mtw),Step 2,Graph Plot,通過Plot 作成散點圖的結(jié)果, 預(yù)測是陽的相關(guān)關(guān)系。,( Y 欄里C2, X欄里 輸入C1),相關(guān)分析,Step 3,Stat Basic Statistics Correlation,Step 4,Session 結(jié)果確認(rèn),選擇兩個 變量列,相關(guān)常數(shù)是 0.853有陽的相關(guān)關(guān)系, p 值為 0.002小于 留意水準(zhǔn) 0.05,所以廣告費和銷售額的相關(guān)關(guān)系是有影響的。,相關(guān)常數(shù),p 值,相關(guān)分析, 回歸分析 (Regression Analysis),為了查明變量之間函數(shù)的相關(guān)性而假定某數(shù)學(xué)Model,從已測定變量的Data中 推定其Model的統(tǒng)計性分析方法。根據(jù)這樣的函數(shù)Model,從一個變量的變化 能預(yù)測另一個變量的變化,例) 父親和兒子的身高關(guān)系 工程溫度影響的制品強度,輸出變量 : 欲預(yù)測的變量,受輸入變量影響的變量。 輸入變量 : 影響輸出變量的變量。, 輸入變量和輸出變量(反應(yīng)變量),父親的身高和工程溫度是獨立變量, 兒子的身高和制品的強度是從屬變量!,回歸分析,R-Sq值叫決定系數(shù)用 R2表示。 在0 R2 1范圍,總變動中被回歸線說明的變動所占的比率。 R2 值越接近1時,回歸線越高,判斷有意義。 合理的值是多少? 根據(jù)情況不同?;瘜W(xué)者要求的是 0.99程度的R2 值, 但根據(jù)工程和產(chǎn)業(yè)不同。一般值為0.7以上是可以認(rèn)為輸出變量和 輸入變量的關(guān)系大。 如果R2是0.679(67.9%) ,用回歸方程式能說明散布的67.9%, 剩下的 32.1%是別的原因造成的。,決定系數(shù)(Coefficient of Determination ),回歸分析,通過下例觀察回歸分析和決定系數(shù)。,例題2,為了知道機械的使用年度和 整備費用之間有什么關(guān)系,得到了有關(guān)對相同機械 整備記錄的如下DATA。,3 1 5 8 1 4 2 6 9 3 5 7 2 6,39 24 115 105 50 86 67 90 140 112 70 186 43 126,使用年度(年) 整備費用(千元),1) 對這個DATA求說明 x與 y之間關(guān)系的單純回歸方程式。 2) 使用年度為10年時,整備費用是多少?,回歸分析,Step 1,Work sheet里 DATA 輸入,Step 2,Stat Regression Regression,選擇輸出變量列,選擇輸入變量列,(Regression.mtw),回歸分析,選擇顯示在殘差Graph的 殘差形態(tài),Regression - Graphs : 選擇為幫助最佳回歸模型分析的殘差 Plot 的形態(tài),Histogram of residuals : 殘差Histogram 作成 Normal plot of residuals : 為殘差的正規(guī)性檢定而作成Graph Residuals versus fits : 作成殘差和被適合值的圖 Residuals versus order : 作成殘差對觀測順序的圖 Residuals versus the variables : 作成殘差對指定變量的圖,回歸分析,Residual Plots,輸入所需的x 值,通過得出的回歸式 可以求 值和信賴區(qū)間。 輸入10,能計算出10年后的整備 費用(預(yù)測值)。,Regression - Options : 可以選擇加重值列,預(yù)測新的觀測值確認(rèn)信賴區(qū)間。,回歸分析,Storage : 選擇從Work sheet 的輸入變量和輸出變量列的下一個列開始被Check的項目。,Results :調(diào)整對顯示在Window Section的回歸模型的分析結(jié)果范圍。,回歸分析,Step 3,Session結(jié)果確認(rèn),關(guān)于整備費用和使用年度的回歸式是,決定系數(shù)R-Sq 值為61%,在全體變動中按回歸直線 說明的變動是61%.,使用年度10年的機械的整備費用 期待值是165.48,對其的95% 信賴區(qū)間是(123.66, 207.29).,回歸分析,p 值為0.001小于留意水準(zhǔn)0.05, 所以認(rèn)為上面的回歸式有意。,R-Sq(adj)是在回歸式上每追加變量R-Sq 值就增加的調(diào)整值。 輸入變量兩個以上時,此值有意義, 所以一般分析 R-Sq(adj).,Step 1,Stat Regression Fitted Line Plot,選擇輸出變量列,選擇輸入變量列,回歸模型的類型決定 (1次, 2次, 3次),回歸分析,Fitted Line Plot : 欲用Graph分析時活用。,Step 2,Graph 結(jié)果確認(rèn),回歸分析, 殘差分析,從實際值中減掉被回歸模型適合的值叫殘差,通過殘差分析我們要確認(rèn)模型的適合性。,殘差分析,殘差越小,推定的回歸式越準(zhǔn)確 說明實際觀測結(jié)果。 殘差是誤差最好的推定值。 殘差按獨立變量的大小順序或者 資料的輸入順序排列時,確認(rèn)他 們對0對稱 ,不顯示特別的傾向。,殘差,實際值,回歸模型,殘差 :,例題3,為了知道機械的使用年度和整備費用之間有什么關(guān)系,得到了對相同機械的 整備記錄有關(guān)的如下 Data。得出適合值和殘差后執(zhí)行殘差分析。,3 1 5 8 1 4 2 6 9 3 5 7 2 6,39 24 115 105 50 86 67 90 140 112 70 186 43 126,使用年度(年) 整備費用(千元),殘差分析,Step 1,Work sheet 里輸入DATA,(Residuals.mtw),Step 2,Stat Regression Regression,選擇從屬變量列,選擇獨立變量列,殘差分析,Storage,Fits(適合值) Check,Residuals(殘差) Check,Step 3,Work sheet 結(jié)果確認(rèn),殘差和 適合值被儲存。,Step 4,Stat Regression Residual Plots,選擇適合值列,選擇殘差列,殘差分析,Step 5,確認(rèn)Graph,殘差分析, 結(jié)果分析,通過Normal Plot of Residuals 數(shù)據(jù)分布接近于對角線,所以可以說殘差的分布 接近于正態(tài)分布。 ( 通過Stat Basic Statistics Normality Test 更仔細(xì)地做到正規(guī)性檢定。) 在I Chart of Residuals中不離開管理限界線,因不具有任何Perform, 所以可以說殘差的分布是穩(wěn)定的。 Histogram of Residuals 是表示殘差形態(tài)的Graph。 Residuals vs. Fits 是殘差對適合值的Graph,在0近處任意地分布。 因此,可以說回歸模型是適合的。,殘差分析,實習(xí),按下面方法做紙飛機的實習(xí)。 1) 機翼長度為 6 14cm 2) 機翼長度按每次5mm差剪掉。 3) 測定2.5m高度的降落時間。 得到回歸方程式后,求降落時間成為2秒及2.5秒時的翅膀的長度。,90 分鐘,練習(xí)問題,1. 下表是檢查人的記憶力x 和判斷力 y 的 。,記憶力 x 11 10 14 18 10 6 12 8 15 16 判斷力 y 6 4 6 9 2 3 3 9 6 7,按以下順序分析。,1) 記述X變量和Y變量之間的關(guān)系。(例: X減少時,Y增加) 2)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論