![六西格瑪統(tǒng)計工具介紹(共143頁).ppt_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/10/5af60fb1-48f5-452f-866a-dd1145a783f4/5af60fb1-48f5-452f-866a-dd1145a783f41.gif)
![六西格瑪統(tǒng)計工具介紹(共143頁).ppt_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/10/5af60fb1-48f5-452f-866a-dd1145a783f4/5af60fb1-48f5-452f-866a-dd1145a783f42.gif)
![六西格瑪統(tǒng)計工具介紹(共143頁).ppt_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/10/5af60fb1-48f5-452f-866a-dd1145a783f4/5af60fb1-48f5-452f-866a-dd1145a783f43.gif)
![六西格瑪統(tǒng)計工具介紹(共143頁).ppt_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/10/5af60fb1-48f5-452f-866a-dd1145a783f4/5af60fb1-48f5-452f-866a-dd1145a783f44.gif)
![六西格瑪統(tǒng)計工具介紹(共143頁).ppt_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/10/5af60fb1-48f5-452f-866a-dd1145a783f4/5af60fb1-48f5-452f-866a-dd1145a783f45.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、六西格瑪統(tǒng)計工具介紹(二)六西格瑪統(tǒng)計工具介紹(二)20142014年年2 2月月2精益六西格瑪理論體系全景圖客戶客戶流程描述流程描述控制計劃控制計劃測量系統(tǒng)測量系統(tǒng)控制控制過程能力過程能力分析分析多變量多變量分析分析實驗設(shè)計實驗設(shè)計VoC分析分析失效模式分析失效模式分析流程圖流程圖(I/O)因果矩陣因果矩陣統(tǒng)計過程統(tǒng)計過程控制控制定性分析定性分析 定量分析定量分析頭腦風暴頭腦風暴+KJ失效樹失效樹魚骨圖魚骨圖Why-Why分析分析PFMEA對標分析對標分析訪談訪談現(xiàn)場調(diào)研現(xiàn)場調(diào)研流程觀察流程觀察回歸分析回歸分析軟件使用軟件使用項目管理項目管理精益六西格瑪意識精益六西格瑪意識統(tǒng)計基礎(chǔ)統(tǒng)計基礎(chǔ)精
2、益工具精益工具基本圖表基本圖表精益六西格瑪持續(xù)改進體系精益六西格瑪持續(xù)改進體系精益六西格瑪推行綜合管理精益六西格瑪推行綜合管理3課程大綱n假設(shè)檢驗概述假設(shè)檢驗概述n相關(guān)與回歸相關(guān)與回歸4統(tǒng)計基礎(chǔ)-數(shù)據(jù)類型n計數(shù)型數(shù)據(jù)(離散型數(shù)據(jù),屬性型數(shù)據(jù)):通常表示事物的分類計數(shù)型數(shù)據(jù)(離散型數(shù)據(jù),屬性型數(shù)據(jù)):通常表示事物的分類不良品數(shù)量/不良率缺陷品數(shù)量/缺陷率機器 A, 機器 B, 機器 C白班/中班/夜班n計量型數(shù)據(jù)計量型數(shù)據(jù) (連續(xù)型數(shù)據(jù)):通常是通過測量儀器測量得到的數(shù)(連續(xù)型數(shù)據(jù)):通常是通過測量儀器測量得到的數(shù)據(jù)據(jù)壓力時間長度重量5目錄n假設(shè)檢驗相關(guān)基礎(chǔ)概念假設(shè)檢驗相關(guān)基礎(chǔ)概念總體參數(shù)及樣本
3、統(tǒng)計量推定置信區(qū)間n假設(shè)檢驗介紹假設(shè)檢驗介紹目的與意義假設(shè)檢驗概念介紹假設(shè)檢驗原理假設(shè)檢驗步驟假設(shè)檢驗常見路徑雙樣本T 與配對T的區(qū)別 n討論及問答討論及問答6假設(shè)檢驗相關(guān)基礎(chǔ)概念n總體參數(shù)與樣本統(tǒng)計量總體參數(shù)與樣本統(tǒng)計量s= 樣本標準差X= 樣本平均值 參數(shù) 估計 統(tǒng)計量 = 總體平均值= 總體標準差抽樣(Sampling)AABDDDCCCCBAAAAAAABBBBBBCCCCCCDDDDDDD7估計的概念n點估計:通過抽樣用一個具體的值估計總體的參數(shù)點估計:通過抽樣用一個具體的值估計總體的參數(shù)舉例:通過抽樣調(diào)查中秋月餅的保質(zhì)期是3個月點估計的種類:平均的估計、標準差、方差的估計、比率的估
4、計等n區(qū)間估計:通過抽樣用一個具體的值估計總體的參數(shù)區(qū)間估計:通過抽樣用一個具體的值估計總體的參數(shù)舉例:通過抽樣調(diào)查中秋的月餅的保質(zhì)期是1-6個月8置信區(qū)間n置信區(qū)間的概念(置信區(qū)間的概念(Confidence Interval)誤差是,相同樣本量的樣本重復抽樣測量樣本中存在實際總體參數(shù)的可能性的區(qū)間,即100(1- )%n置信水平(置信水平(Confidence Level)是指區(qū)間估計時,能夠包含總體參數(shù)的能力水平,即1- 。05. 0z05. 0z%90%5%5%1525. 0z25. 0z%50%25%25=0.5(50%)=0.1(10%)信賴水準信賴區(qū)間誤 差9置信區(qū)間n90%的置
5、信區(qū)間舉例如下圖的置信區(qū)間舉例如下圖如下圖總體平均為,連續(xù)抽取10個樣本,其中有一個樣本不包含總體平均n95%置信區(qū)間的解釋:置信區(qū)間的解釋:大約100個置信區(qū)間中有95個會包含總體參數(shù), 或者我們有95%的把握確定總體參數(shù)在置信區(qū)間內(nèi)通常我們計算95%的置信區(qū)間 總體的平均樣本 1樣本 2 樣本 1010置信區(qū)間n置信區(qū)間的計算置信區(qū)間的計算通用公式:置信區(qū)間C.I.=統(tǒng)計量K*S(標準偏差)統(tǒng)計量=平均值、方差、Cp等K=統(tǒng)計分布常數(shù)正態(tài)分布的置信區(qū)間公式( 知道的時候):樣本的置信區(qū)間公式(不知道,只能計算S):樣本的平均遵循t分布nZX2/nStXn 1, 2/11置信區(qū)間nMinit
6、ab中置信區(qū)間的計算中置信區(qū)間的計算這些都可以計算出置信區(qū)間12假設(shè)檢驗n假設(shè)檢驗的目的假設(shè)檢驗的目的假設(shè)檢驗是對差異較小的情形進行差異性比較,從而通過數(shù)據(jù)作出客觀的判斷。是為了解決選擇的困難性n假設(shè)檢驗的意義假設(shè)檢驗的意義用統(tǒng)計的方法,通過數(shù)據(jù)進行客觀的判斷把我決策的風險,提高決策水準假設(shè)檢驗是我們政府部門最需要的工具之一。13假設(shè)檢驗n假設(shè)檢驗的概念假設(shè)檢驗的概念對觀測的樣本資料分析后對總體差異的估計是作出選擇與否判斷的統(tǒng)計性方法n假設(shè)檢驗術(shù)語假設(shè)檢驗術(shù)語假設(shè)設(shè)定:對要進行判斷的情況進行假設(shè)設(shè)定H0 -Null Hypothesis:說明沒有變化或者差異的設(shè)定Ha- Alternative
7、 Hypothesis:說明有變化或者差異的設(shè)定n假設(shè)設(shè)定練習:假設(shè)設(shè)定練習:為了確認小學生男女身高是否有差異為了確認小學生男生比女生高為了確認小學生身高和性別是否有相關(guān)性14假設(shè)檢驗n假設(shè)檢驗的種類假設(shè)檢驗的種類單邊檢驗 One-sided hypothesisOne-sided hypothesis雙邊檢驗 TwoTwo-sided hypothesis-sided hypothesis15n假設(shè)檢驗的兩種錯誤假設(shè)檢驗的兩種錯誤第1種 錯誤 (TypeError, -風險)不顧Null Hypothesis 真實. Null Hypothesis放棄的錯誤 把良品判斷為不良的時候(誤判)
8、既, 可以說生產(chǎn)者危險1- 就是置信區(qū)間 第2種 錯誤 ( TypeError, -風險) : 不顧Null Hypothesis 假的. Null Hypothesis接受的錯誤 不良品當成良品的時候( 漏失 ) 即, 可以說顧客危險1- 是檢定力,即檢出能力16n假設(shè)檢驗的兩種錯誤說明假設(shè)檢驗的兩種錯誤說明你的判定你的判定接受接受 H Ho o真真實實情情況況H Ho o 對對H Ho o 錯錯I I類錯誤類錯誤 (-風險風險)IIII類錯誤類錯誤 (-風險風險)正確正確正確正確拒絕拒絕 H Ho o17n假設(shè)檢驗的兩種錯誤舉例假設(shè)檢驗的兩種錯誤舉例陪審團的判決陪審團的判決他無罪他無罪事實
9、事實實際清白實際清白他有罪他有罪實際有罪實際有罪正確正確正確正確I I類錯誤類錯誤 (-風險)風險)后果: II II 類錯誤類錯誤 (-風險)風險)后果: :18假設(shè)檢驗n假設(shè)檢驗原理假設(shè)檢驗原理假設(shè)檢驗其實是個比較的過程兩種假設(shè)的比較,是A還是B?我們總是用H0 來說話我們的初衷多數(shù)時候是想看區(qū)別和差異,所以我們總是想放棄H0 放棄H0 的決策不會總是正確的 ,任何決定都會有風險但風險的高低及嚴重度,會影響我們決策于是我們很急切的指導,我們做出放棄H0 的決策的風險有多大?于是我們通過抽樣數(shù)據(jù)進行運算,算出放棄H0 的決策的風險的大小就是我們長見的 P值(P-value)19假設(shè)檢驗n假設(shè)
10、檢驗原理假設(shè)檢驗原理(續(xù)續(xù))知道了做出放棄H0 的決策的風險的大小,那么風險小于多少時我們才敢于做出放棄H0 的決策呢?于是我們需要提前設(shè)定一個風險判斷標準 而根據(jù)我們承受力的大小及后果的嚴重度,這個標準各有不同,0.01 、0.05、0.1 等但我們通常設(shè)定 為0.05這也就是我們通常拿P值和0.05 進行大小比較的原因。如果P0.05 接受H0; P0.05 放棄H0 (P Low H0 Go) 理解練習為什么正態(tài)檢驗,等方差檢驗P要大于0.05?20假設(shè)檢驗n假設(shè)檢驗原理假設(shè)檢驗原理(續(xù)續(xù)) (Significance Level)置信水平:風險判斷標準P-value 做出放棄H0 的決
11、策犯錯誤的最大風險值p 值Ho 選擇域選擇域Ho棄卻域棄卻域 Ho選擇域選擇域Ho棄卻域棄卻域 p值P值值 接受接受H0不能做決策不能做決策 ,不能說有差異,不能說有差異TPT TPT 21假設(shè)檢驗n假設(shè)檢驗步驟假設(shè)檢驗步驟假設(shè)假設(shè) 設(shè)定設(shè)定檢定統(tǒng)計量選擇檢定統(tǒng)計量選擇留意水準留意水準 決定決定p-value 計算計算(棄卻域棄卻域 , 檢定統(tǒng)計量檢定統(tǒng)計量 計算計算)判定(統(tǒng)計結(jié)論)判定(統(tǒng)計結(jié)論)p-value 0.05 時 Ho 接受P-值 0.05 時 Ho 放棄正態(tài)數(shù)據(jù)標準偏差的置信區(qū)間一個總體兩個以上的總體2 Sample t(方差相等)2 Sample t(方差不相等) 1 Sa
12、mple t 或者1 Sample ZHo: 1 = (平均值)H1: 1 (平均值)Stat - Basic Stats - 1 Sample-t (不知道時候) 1Sample Z (知道時候)1 Sample-Sign 或者 1 Sample-WilcoxonMann-Whitney Test兩個以上的總體兩個母集團1-Proportion2-Proportion一個總體兩個總體兩個以上的總體非正態(tài)數(shù)據(jù)等 方差YesNoKruskal-Wallis Test一個總體一個總體兩個以上的總體Ho: M1 = M2H1: M1 M2Stat - Nonparametric - Mann-Whi
13、tneyHo: M1 = M2 = M3 = .H1: 至少一個是不一樣Stat - Nonparametric - Kruskal-WallisHo: 1 = 2H1: 1 2Stat - Basic Stats - 2-Sample t “assume equal variances”“假定等方差選擇按鈕” 不選擇 Test for Equal Variances(Levenes Test) Test for Equal Variances(F Test or Bartletts Test)Ho: 1 = 2 = 3 = .H1: 至少有一個不一樣Stat - Anova - Test f
14、or Equal Variances兩個總體比較的時候 用F-testHo: 1 = (標準差)H1: 1 (標準差)標準差的置信區(qū)間使用Minitab 路徑 Stat -Basic Statistics - Display Descriptive Stats計量型數(shù)據(jù)數(shù)據(jù)穩(wěn)定性研究(控制圖)配對T(Paired T)Ho: D =0 (差值)H1: D 0 (差值)要對差值進行正態(tài)性檢驗Minitab 路徑 Stat -Basic Statistics Paired t test (配對T)假設(shè)檢驗-常用路徑圖23假設(shè)檢驗 - 單樣本T檢驗24“單樣本t檢驗”解決什么問題?典型的問題為典型的
15、問題為: “我們抽取了新坐席員我們抽取了新坐席員Bob的的30通電話錄音數(shù)據(jù),想知道坐席員通電話錄音數(shù)據(jù),想知道坐席員A的的話后整理時長的平均值是否剛好等于考核要求的話后整理時長的平均值是否剛好等于考核要求的25秒?秒?”當然問題也可以是當然問題也可以是“Bob的平均整理時長大于的平均整理時長大于25秒嗎?秒嗎?”或者或者“Bob的平均整理時長剛好小于的平均整理時長剛好小于25秒嗎?秒嗎?”25 建立零假設(shè)和備選假設(shè):平均整理時間等于目標值平均整理時間不等于目標值 決定顯著性水平: = 0.05(5%) 隨機抽取30通電話的整理時間數(shù)據(jù)作為樣本 選取適合方法計算P值(參考下頁詳細步驟) 依據(jù)P
16、值結(jié)果做出結(jié)論秒25:0=H秒25:1H按照以下步驟完成n如果P值大于或等于0.05,不能推翻零假設(shè) H0n如果P值小于a,推翻零假設(shè) H026選取適合方法計算P值詳細過程使用控制圖檢驗樣本數(shù)據(jù)穩(wěn)定性樣本量不足,n25不是正態(tài)分布是正態(tài)分布單樣本T檢驗單樣本T檢驗單樣本T檢驗先把數(shù)據(jù)轉(zhuǎn)換為正態(tài)后再使用單樣本T檢驗檢驗數(shù)據(jù)正態(tài)性數(shù)據(jù)不穩(wěn)定應(yīng)先解決穩(wěn)定性問題NOYES算出P值樣本數(shù)據(jù)n個27分析路線圖 單樣本T28步驟1: 檢驗穩(wěn)定性29步驟1: 檢驗穩(wěn)定性是否有任何明顯的變化趨勢或模式,足以證明數(shù)據(jù)并非來自單一的總體/流程?212223242526272829Bob369121518212427
17、3033樣本平均數(shù)=24.85控制下限=21.67控制上限=28.03Bob 的 單個測量Bob 的 單個測量01234“Bob”的移動控制范圍3691215182124273033樣本平均數(shù)=1.20控制下限=0.00控制上限=3.91Bob 的 移動控制范圍Bob 的 移動控制范圍控制圖控制圖30步驟2: 檢驗正態(tài)性31步驟2: 檢驗正態(tài)性32步驟 3: 檢驗均值假設(shè)值實際估計值df標準差2524.8482290.86932檢驗統(tǒng)計量p 值 |t|p 值 tp 值 0.05),或者說,),或者說,由于均值的置信區(qū)間包含了目標值,我們可以作出下述結(jié)論:由于均值的置信區(qū)間包含了目標值,我們可以
18、作出下述結(jié)論:n我們沒有足夠的證據(jù)拒絕零假設(shè)。我們沒有足夠的證據(jù)拒絕零假設(shè)。n是否可以說零假設(shè)是正確的(是否可以說零假設(shè)是正確的(Bob的均值的均值=25秒)?秒)? 不!不!n但是,我們通常在假定零假設(shè)是正確的情況下執(zhí)行操作。但是,我們通常在假定零假設(shè)是正確的情況下執(zhí)行操作。34延伸如果問題是如果問題是: “Bob的平均整理時長大于25秒嗎?”或者“Bob的平均整理時長剛好小于25秒嗎?”如何構(gòu)造零假設(shè)和備選假設(shè)?你的結(jié)論是什么?如何利用剛才的結(jié)果?35假設(shè)檢驗 - 雙樣本t檢驗36“雙樣本t檢驗”解決什么問題?典型的問題為典型的問題為: “我們各抽取了坐席員我們各抽取了坐席員Bob和和Ja
19、ne的的30通電話樣本,想知道坐席員通電話樣本,想知道坐席員A和和B的平均話后整理時長是否的平均話后整理時長是否相等相等?”當然問題也可以是當然問題也可以是“Bob的平均整理時長的平均整理時長大于大于Jane的平均整理時的平均整理時長嗎?長嗎?”或者或者“Bob的平均整理時長的平均整理時長小于小于Jane的平均整理時長的平均整理時長嗎?嗎?”37 建立零假設(shè)和備選假設(shè): Bob的平均值等于Jane的平均值 Bob的平均值不等于Jane的平均值 決定顯著性水平: = 0.05(5%) 隨機抽取Bob和Jane各30通電話的整理時間數(shù)據(jù)作為樣本 選取適合方法計算P值(參考下頁詳細步驟) 依據(jù)P值結(jié)
20、果做出結(jié)論按照以下步驟完成n如果P值大于或等于0.05,不能推翻零假設(shè) H0n如果P值小于a,推翻零假設(shè) H0JaneBob:1HJaneBob:0H=38選取適合方法計算P值詳細過程使用控制圖檢驗樣本數(shù)據(jù)穩(wěn)定性樣本量不足,n2539樣本量n在獲取數(shù)據(jù)并試圖得出一些陳述之前在獲取數(shù)據(jù)并試圖得出一些陳述之前, 我們需要確定進行這種檢驗我們需要確定進行這種檢驗數(shù)要多少數(shù)據(jù)數(shù)要多少數(shù)據(jù).n記住記住, 我們有一些基于估計值的抽樣我們有一些基于估計值的抽樣“經(jīng)驗方法經(jīng)驗方法 Rules of Thumbn并不要求并不要求Bob和和Jane的兩組樣本量一定是相同的的兩組樣本量一定是相同的n注意注意: 我們
21、將在以后的模塊中講解樣本量的計算我們將在以后的模塊中講解樣本量的計算40工具或統(tǒng)計工具或統(tǒng)計 最小樣本量最小樣本量 平均值5 - 10 標準偏差 25 - 30 有缺陷的比例 (P) 100 并且 nP = 5 直方圖 或帕累托圖 50 散點圖 25 控制圖 20不同工具的樣本量通常41步驟1: 檢驗穩(wěn)定性42步驟1: 檢驗穩(wěn)定性212223242526272829Bob3691215182124273033樣本平均數(shù)=24.85控制下限=21.67控制上限=28.03Bob 的 單個測量Bob 的 單個測量01234“Bob”的移動控制范圍3691215182124273033樣本平均數(shù)=1
22、.20控制下限=0.00控制上限=3.91Bob 的 移動控制范圍Bob 的 移動控制范圍2223242526272829Jane3691215182124273033樣本平均數(shù)=25.45控制下限=22.89控制上限=28.00Jane 的 單個測量Jane 的 單個測量-0.50.00.51.01.52.02.53.03.5“Jane”的移動控制范圍3691215182124273033樣本平均數(shù)=0.962控制下限=0.000控制上限=3.143Jane 的 移動控制范圍Jane 的 移動控制范圍43步驟2: 檢驗正態(tài)性44步驟2: 檢驗正態(tài)性45步驟2: 檢驗正態(tài)性位置離差類類 型型參
23、參 數(shù)數(shù)25.4460730.9880899估估 計計25.0771140.78692179 95 5% % 下下 限限25.8150321.32830439 95 5% % 上上 限限參參 數(shù)數(shù) 估估 計計 Shapiro-Wilk W 檢驗0.974329W W 0.6630p p 值值 W W注:Ho = 數(shù)據(jù)來自 正態(tài) 分布。小 p 值拒絕 Ho。擬擬 合合 優(yōu)優(yōu) 度度 檢檢 驗驗正正 態(tài)態(tài) 擬擬 合合位置離差類類 型型參參 數(shù)數(shù)24.8482070.8693181估估 計計24.5235980.69233099 95 5% % 下下 限限25.1728151.16863759 95
24、5% % 上上 限限參參 數(shù)數(shù) 估估 計計 Shapiro-Wilk W 檢驗0.932453W W 0.0571p p 值值 Fp 值 F2.4882t 檢驗t 檢驗等方差檢驗等方差檢驗50步驟4:均值檢驗 51步驟4:均值檢驗 232425262728整理時長BobJane坐席員R 平方調(diào)整 R 平方均方根誤差響應(yīng)均值觀測值 (或權(quán)重和)0.0964490.0808710.93060125.1471460擬擬 合合 匯匯 總總Jane-Bob假定方差相等差分差的標準誤差差的置信上限差的置信下限置信0.597870.240281.078840.116890.95t 比率DFp 值 |t|p
25、值 tp 值 t2.488207580.0157*0.0079*0.9921-0.8-0.40.00.40.8t t 檢檢 驗驗52結(jié)論的陳述n由于由于P值小于臨界置信水平(本例中值小于臨界置信水平(本例中P=0.01570.05,我們可以作,我們可以作出下述結(jié)論:出下述結(jié)論:n我們有足夠的證據(jù)拒絕零假設(shè)我們有足夠的證據(jù)拒絕零假設(shè)53假設(shè)檢驗 多樣本比較54n假設(shè)檢驗用于比較假設(shè)檢驗用于比較數(shù)據(jù)樣本的數(shù)據(jù)樣本的nANOVA檢驗陳述的原假設(shè)(檢驗陳述的原假設(shè)(null hypothesis)是所有樣本的均是所有樣本的均值都相同值都相同Ho: a = b = c = d = e nANOVA檢驗陳
26、述的備擇假設(shè)(檢驗陳述的備擇假設(shè)(alternate hypothesis) 是至少有是至少有一個均值是不同的一個均值是不同的Ha: 至少一對至少一對 是不同的是不同的方差分析 ANOVA55“方差分析(ANOVA)”解決什么問題?典型的問題為典型的問題為: “我們各抽取了坐席員我們各抽取了坐席員Bob,Jane和和Walt的各的各30通電話樣本,想知通電話樣本,想知道坐席員的平均話后整理時長是否道坐席員的平均話后整理時長是否相等相等?”56 建立零假設(shè)和備選假設(shè): Ho: Bob = Jane = san 三個坐席員的平均值彼此相等 Ha: 至少一對 是不同的 至少一個坐席員得平均值和其他人
27、不同 決定顯著性水平: = 0.05(5%) 隨機抽取Bob和Jane各30通電話的整理時間數(shù)據(jù)作為樣本 選取適合方法計算P值(參考下頁詳細步驟) 依據(jù)P值結(jié)果做出結(jié)論按照以下步驟完成57選取適合方法計算P值詳細過程使用控制圖檢驗樣本數(shù)據(jù)穩(wěn)定性樣本量不足,n2558步驟1 & 2 不再重復n步驟步驟1:穩(wěn)定性檢驗:穩(wěn)定性檢驗分別使用控制圖檢驗三名坐席員樣本數(shù)據(jù)的穩(wěn)定性n步驟步驟2:正態(tài)性檢驗:正態(tài)性檢驗分別使用分布圖檢驗三名坐席員樣本數(shù)據(jù)的正態(tài)性59堆疊數(shù)據(jù) 60步驟3: 等方差檢驗610.00.20.40.60.81.0標準差BobJaneWalt座席員BobJaneWalt水平水平
28、303030計數(shù)計數(shù)0.86931810.98808990.9806127標準差標準差0.72742580.78016180.8059338均值的絕對差的平均均值的絕對差的平均0.70814670.77818000.8023567中位數(shù)的絕對差的平均中位數(shù)的絕對差的平均OBrien.5Brown-ForsytheLeveneBartlett檢驗檢驗0.34790.22920.17060.2863F 比率F 比率2222分子自由度分子自由度878787.分母自由度分母自由度0.70710.79570.84340.7510p 值 Fp 值 FWelch 方差分析檢驗均值是否相等。該法允許標準差呈不
29、等44.7405F 比率F 比率2分子自由度分子自由度57.786分母自由度分母自由度 Fp 值 F等方差檢驗等方差檢驗步驟3: 等方差檢驗P-值!62步驟4:均值檢驗 6323242526272829處理時長BobJaneWalt座席員R 平方調(diào)整 R 平方均方根誤差響應(yīng)均值觀測值 (或權(quán)重和)0.5071620.4958320.94756525.7927490擬合匯總擬合匯總座席員誤差C. 合計來源來源28789DFDF80.3858178.11547158.50128平方和平方和40.19290.8979均方均方44.7643F 比率F 比率 Fp 值 F方差分析方差分析BobJaneW
30、alt水平水平303030數(shù)值數(shù)值24.848225.446127.0839均值均值0.173000.173000.17300標準誤差標準誤差24.50425.10226.74095% 下限95% 下限25.19225.79027.42895% 上限95% 上限標準誤差使用合并的誤差方差估計值單因子方差分析均值單因子方差分析均值單因子方差分析單因子方差分析處理時長 關(guān)于 座席員 的單因子分析處理時長 關(guān)于 座席員 的單因子分析步驟4:均值檢驗 64步驟4:均值檢驗 23242526272829處理時長BobJaneJaneWalt座席員每對比較t 統(tǒng)計量0.0565ANOVA: 我們了解到什么
31、?n有一個操作員與其它操作員之間存在差異有一個操作員與其它操作員之間存在差異n同樣我們可以從菱形圖看到同樣我們可以從菱形圖看到, Walt 用的時間比其它兩位操作員用用的時間比其它兩位操作員用的長一些的長一些n現(xiàn)在我們需要問現(xiàn)在我們需要問 “為什么為什么?”n致使長于整體周期的根源是致使長于整體周期的根源是CWalt么么?n你將如何找到答案你將如何找到答案?66假設(shè)檢驗 - 非正態(tài)(非參數(shù)檢驗)67Mann-Whitney 檢驗n查看工作表查看工作表 2- Non-Normal Shipping 中的數(shù)據(jù)中的數(shù)據(jù)n我們希望了解在周末和工作天期間發(fā)貨的時間是否有差異我們希望了解在周末和工作天期間
32、發(fā)貨的時間是否有差異 遵循分析路徑圖研究穩(wěn)定性研究形狀研究散布(離散程度)68研究穩(wěn)定性-3-2-101234567周末發(fā)貨48 122028364452樣本平均數(shù)=1.72控制下限=-2.09控制上限=5.54周末發(fā)貨 的 單個測量周末發(fā)貨 的 單個測量-10123456“周末發(fā)貨”的移動控制范圍48 122028364452樣本平均數(shù)=1.43控制下限=0.00控制上限=4.68周末發(fā)貨 的 移動控制范圍周末發(fā)貨 的 移動控制范圍-2-101234工作天發(fā)貨48 122028364452樣本平均數(shù)=1.27控制下限=-1.20控制上限=3.73工作天發(fā)貨 的 單個測量工作天發(fā)貨 的 單個測
33、量-0.50.00.51.01.52.02.53.03.5“工作天發(fā)貨”的移動控制范圍48 122028364452樣本平均數(shù)=0.928控制下限=0.000控制上限=3.030工作天發(fā)貨 的 移動控制范圍工作天發(fā)貨 的 移動控制范圍69研究正態(tài)性0123456.01.05.10.25.50.75.90.95.99-3-2-10123正態(tài)分位數(shù)圖00.511.522.533.5.01.05.10.25.50.75.90.95.99-3-2-10123正態(tài)分位數(shù)圖 Shapiro-Wilk W 檢驗0.905821W W 0.0008 *p p 值值 W W注:Ho = 數(shù)據(jù)來自 正態(tài) 分布。小
34、 p 值拒絕 Ho。擬擬 合合 優(yōu)優(yōu) 度度 檢檢 驗驗 Shapiro-Wilk W 檢驗0.921539W W 0.0027 *p p 值值 Fp 值 F1.9618t 檢驗t 檢驗等方差檢驗等方差檢驗研究等方差性71p-值值! P值不低值不低, 所以我們說所以我們說, 沒沒有差異有差異. 工作天發(fā)貨周末發(fā)貨水水 平平5050計計 數(shù)數(shù)2317.002733.00得得 分分 和和46.340054.6600得得 分分 均均 值值-1.4301.430( (均均 值值 - -均均 值值 0 0) )/ /標標 準準 0 02733S S1.43047Z Z0.1526P P 值值 | |Z Z
35、| |二二 樣樣 本本 檢檢 驗驗 , , 成成 近近 似似 正正 態(tài)態(tài) 分分 布布2.0561卡卡 方方1D DF F0.1516p p 值值 卡卡 方方 檢檢 驗驗單單 因因 子子 檢檢 驗驗 , , 卡卡 方方 近近 似似W Wi il lc co ox xo on n / / K Kr ru us sk ka al l- -W Wa al ll li is s 檢檢 驗驗 ( 秩秩 和和 )Wilcoxon/Kruskal Wallis檢驗72工作天發(fā)貨周末發(fā)貨水平水平5050計數(shù)計數(shù)23.00027.000得分和得分和0.4600000.540000得分均值得分均值-0.7960.7
36、96(均值-(均值-均值0)/標準0均值0)/標準027S S0.79599Z Z0.4260P 值|Z|P 值|Z|二樣本檢驗, 成近似正態(tài)分布二樣本檢驗, 成近似正態(tài)分布0.6336卡方卡方1DFDF0.4260p 值 卡方檢驗p 值 卡方檢驗單因子檢驗, 卡方近似單因子檢驗, 卡方近似中位數(shù)檢驗(大于中位數(shù)的個數(shù))中位數(shù)檢驗(大于中位數(shù)的個數(shù))p-值! P值不低, 所以我們說, 沒有差異. 中位數(shù)檢驗73總結(jié)n全面的數(shù)據(jù)分析包括查看穩(wěn)定性,形狀,散布(離散程度),居中全面的數(shù)據(jù)分析包括查看穩(wěn)定性,形狀,散布(離散程度),居中(中心趨勢)和相關(guān)性(中心趨勢)和相關(guān)性nT-檢驗檢驗 (單樣本
37、單樣本, 雙樣本雙樣本) 檢查居中檢查居中, ANOVA (2個或個或2個以上樣本個以上樣本) 檢查檢查居中居中n等方差檢驗檢查離散程度等方差檢驗檢查離散程度n檢驗關(guān)系是下一步如要檢查的檢驗關(guān)系是下一步如要檢查的卡方檢驗74比例數(shù)據(jù)檢驗75單比例檢驗例:缺陷品率 3 單比例檢驗.jmp以前,合同審批發(fā)現(xiàn)的不合格率為12%對過程進行了變更。從新過程抽樣300個產(chǎn)品,其中45個存在缺陷是不合格品請問:過程是否得到了改善76單比例檢驗步驟1.) 建立備選假設(shè)和零假設(shè)12. 0:0NewPH新過程產(chǎn)生12%或更多的的缺陷率12. 0:1NewPH新過程的缺陷率少于12%77單比例檢驗步驟2.) 決定顯
38、著性水平 = 0.053.) 隨機抽取數(shù)據(jù)抽樣數(shù)量為300發(fā)現(xiàn)有45個產(chǎn)品為缺陷品。78b.) 決定顯著性水平:a = 0.05c.) 隨機抽取數(shù)據(jù):抽樣數(shù)量為300,發(fā)現(xiàn)有45個為缺陷品。d.) 計算P值:分析分析 分布分布 檢驗概率檢驗概率單比例檢驗步驟79e.) 比較P值和顯著性水平:P-value =0.9507 a = 0.05 0.951 0.05f.) 結(jié)論:所以我們不能否定零假設(shè),流程沒有得到改善!單比例檢驗步驟80卡方分析81檢驗相互關(guān)系:卡方檢驗n當當y y和和 x x都是屬性數(shù)據(jù),要檢驗相互關(guān)系時使用都是屬性數(shù)據(jù),要檢驗相互關(guān)系時使用n我們假設(shè)變量是獨立的。我們假設(shè)變量是
39、獨立的。Ho: 數(shù)據(jù)是獨立的 (不相關(guān))Ha: 數(shù)據(jù)不獨立 (相關(guān))n如果如果p p值值 0.05, c所以,我們否定零假設(shè)。因為比較計算的卡方和臨界值這種查表的方法并不方便,更常使用的方法利用軟件直接計算 卡方值對應(yīng)的P值(概率值)89nJMP 軟件計算P值n用JMP建立列聯(lián)表和P數(shù)值n分析 以X擬合YP值90因為P值=0.000,小于 = 0.05,我們將否定零假設(shè),既學院招生與性別之間并不是獨立的,觀察馬賽克圖可以看到教育學院女生比例較高結(jié)論JMP輸出學院工程教育商務(wù)51228.1351.4170.4321511.8126.0929.571276.9812.7524.6138921.37
40、47.2175.3935719.6235.8461.8722012.0926.7038.1372739.9551628.3557731.7099654.7382445.271820性別計數(shù)合計百分比列百分比行百分比男女列列聯(lián)聯(lián)表表1820數(shù)數(shù) 目目2D DF F140.47587- - 對對 數(shù)數(shù) 似似 然然0.1121R R 平平 方方 ( (U U) )似然比Pearson檢檢 驗驗280.952273.076卡卡 方方.0001* 卡卡 方方 檢檢 驗驗檢檢驗驗性別0.000.250.500.751.00工程教育商務(wù)學院男女馬賽克圖馬賽克圖91JMP輸出進一步擴展使用“對應(yīng)分析”可以看到
41、,圖中相距比較近說明而這之間具有緊密關(guān)系,例如教育學院和女生而這相距很近,而工程學院和男生距離很近。說明教育女生比例高,工程男生比例高92卡方檢驗注釋n卡方檢驗是我們本周將學到的卡方檢驗是我們本周將學到的“較易分析較易分析”工具的一種,但它并工具的一種,但它并不如其他假設(shè)檢驗?zāi)菢硬蝗缙渌僭O(shè)檢驗?zāi)菢印案挥卸床炝Ω挥卸床炝Α睂傩詳?shù)據(jù)的結(jié)果n對于卡方檢驗,為了滿足假設(shè),期望頻率必須至少為對于卡方檢驗,為了滿足假設(shè),期望頻率必須至少為5如果該值小于5 , 將告警n數(shù)據(jù)必須確保隨機性數(shù)據(jù)必須確保隨機性注意其他隱藏的因子 (Xs)93范例: 貸款審批通過率JMP 工作表結(jié)構(gòu)我們的信用審批部處理小宗商業(yè)貸
42、款申請。許多申請得到批準,但有一些被拒絕。部門經(jīng)理猜想拒絕率可能與該申請是哪天被處理的有關(guān)。她的猜想正確嗎?打開文件打開文件 5- Loan Approval.JMP 94范例: 貸款審批通過率日期周二周三周四周五周一89.66667-1.66670.28742119.33331.666670.14371112-10.0833252410.0417710.3333-3.33331.07532420.66673.333330.5376251695.06252332-92.5313912-30.7500272430.3750293631483660120180審批結(jié)果計數(shù)預期值偏差單元格 Chi2
43、拒絕通過列列 聯(lián)聯(lián) 表表審批結(jié)果0.000.250.500.751.00周二周三周四周五周一日期拒絕通過馬賽克圖馬賽克圖180數(shù)數(shù) 目目4D DF F5.3011451- - 對對 數(shù)數(shù) 似似 然然0.0463R R 平平 方方 ( (U U) )似然比Pearson檢檢 驗驗10.60210.888卡卡 方方0.0314 *0.0279 *p p 值值 卡卡 方方 檢檢 驗驗檢檢 驗驗P值值 卡方檢驗p 值 卡方檢驗左側(cè)右側(cè)雙側(cè)Fisher 精確檢驗Fisher 精確檢驗0.0014*0.99960.0022*概率概率Prob(審批結(jié)果 2=通過) 在 日期 2=其它天 的情況下比在 周五
44、的情況下大Prob(審批結(jié)果 2=通過) 在 日期 2=周五 的情況下比在 其它天 的情況下大各 日期 2 的 Prob(審批結(jié)果 2=通過) 不同對立假設(shè)對立假設(shè)檢驗檢驗P值值 卡卡 方方 檢檢 驗驗檢檢 驗驗較高的P值表示剩下的幾天沒有明顯的相互關(guān)系。星期五才是我們要找的!100還有哪些情況我能使用卡方檢驗?n行政流程充滿屬性數(shù)據(jù)例如:行政流程充滿屬性數(shù)據(jù)例如:職能:職能: (Y) 和和 (X)人力資源: 病假天數(shù)和員工或部門財會: 錯誤的費用報告數(shù)和員工或部門銷售: 失去的銷售額和帳戶或區(qū)域或國家后勤: 遲到的交貨次數(shù)和配送中心或國家呼叫中心: 錯過的客戶電話數(shù)和公司人員或班次安裝: 反
45、復服務(wù)電話數(shù)和區(qū)域技術(shù)(field tech)采購: 訂單的交貨天數(shù)和供應(yīng)商庫存: 零件數(shù)和配送中心 101實際意義n明確問題明確問題“我關(guān)心嗎?我關(guān)心嗎?”nP值可能顯示統(tǒng)計上的意義值可能顯示統(tǒng)計上的意義樣本容量越大,p值越小對非常大的樣本容量而言,即使很小的差異或相互關(guān)系通常都比較顯著在實際上這些細小的差異可能并不顯著n通過關(guān)注組間差異評估實際的顯著性通過關(guān)注組間差異評估實際的顯著性n差異是否大到有所影響?差異是否大到有所影響?如果是,那么在實際中這些差異就是顯著的。的因子可以用于操作流程的因子可以用于操作流程102相關(guān)性分析與簡單線性回歸103相關(guān)性n從這張圖我們可以看出什么?從這張圖我
46、們可以看出什么?n這些變量是否相關(guān)?這些變量是否相關(guān)?15014013012011010090807060260250240230AdvertismentsSales104相關(guān)性:它對我們意味著什么?當我們提到相關(guān)性時,我們怎么想?當我們提到相關(guān)性時,我們怎么想?n廣告投入是否與銷售量有關(guān)?廣告投入是否與銷售量有關(guān)?n資本的利用與定價是否有關(guān)?資本的利用與定價是否有關(guān)?n你認為奧運會溜冰項目兩個裁判員之間有多大的相關(guān)性?你認為奧運會溜冰項目兩個裁判員之間有多大的相關(guān)性?n為什么當我攜帶雨傘時,天色看起來都不會下雨呢?為什么當我攜帶雨傘時,天色看起來都不會下雨呢?105相關(guān)性與回歸分析n當當y和
47、和x都是連續(xù)數(shù)據(jù)都是連續(xù)數(shù)據(jù),檢驗相互關(guān)系時使用檢驗相互關(guān)系時使用n假設(shè)變量不相關(guān)假設(shè)變量不相關(guān)。 Ho: 數(shù)據(jù)獨立 (不相關(guān))Ha: 數(shù)據(jù)不獨立 (相關(guān))n如果如果p值值 0.05, 拒絕拒絕 Ho106X X 數(shù)據(jù)數(shù)據(jù)單一 X多元 Xs Y Y 數(shù)據(jù)數(shù)據(jù)單一 Y 多元 Ys 多變量分析(注:此表和多變量圖表不同)X X數(shù)據(jù)數(shù)據(jù)離散 連續(xù) Y Y 數(shù)據(jù)數(shù)據(jù)離散 連續(xù) 卡方檢驗卡方檢驗邏輯邏輯 回歸回歸ANOVAANOVA均值均值/ /中位數(shù)檢驗中位數(shù)檢驗回歸分析回歸分析X X 數(shù)據(jù)數(shù)據(jù)離散 連續(xù) Y Y 數(shù)據(jù)數(shù)據(jù)離散 連續(xù)多元回歸多元回歸邏輯邏輯 回歸回歸多元多元 中位數(shù)檢驗中位數(shù)檢驗2,
48、3, 4 way.2, 3, 4 way.ANOVAANOVA邏輯邏輯 回歸回歸多重多重 何時使用相關(guān)性和回歸分析107相關(guān)定義:決定兩個來自不同變量源的響應(yīng)(或輸出)之間線性關(guān)系的方定義:決定兩個來自不同變量源的響應(yīng)(或輸出)之間線性關(guān)系的方法。法。也代表兩個變量間的線性關(guān)聯(lián)程度。由一個相關(guān)系數(shù)也代表兩個變量間的線性關(guān)聯(lián)程度。由一個相關(guān)系數(shù)(R)來衡量兩個)來衡量兩個變量間的聯(lián)系強度,在這里變量間的聯(lián)系強度,在這里-1 R 1 。按照慣例,按照慣例, R 表示表示 真實的真實的 系數(shù),系數(shù), R 表示我們的最佳估算。表示我們的最佳估算。 108nR值取值范圍從-1.0到 +1.0,即 -1
49、R 1 ,R值越接近+1或-1說明線性相關(guān)性越強nR 0 意味著一個正線性相關(guān),即是 Y 隨著 X 的增加而增加。nR=-1意味著一個完全負線性關(guān)系nR=1 意味著一個完全正線性關(guān)系nR=0 意味著無線性關(guān)系。相關(guān)系數(shù):R10912011010090807060504011010090807060504030InputOutputR-Squared = 0.876Y = 9.77271 + 0.745022XStrong Positive Correlation90807060504085756555InputOutputR-Squared = 0.115Y = 56.6537 + 0.181
50、987XWeak Positive Correlation8070605040302010011010090807060504030InputOutputR-Squared = 0.876Y = 99.1754 - 0.745022XStrong Negative Correlation50403020100110100908070605040InputOutputR-Squared = 0.359Y = 90.3013 - 0.645418XModerate Negative Correlation60504030201085756555InputOutputR-Squared = 0.11
51、5Y = 74.8524 - 0.181987XWeak Negative Correlation散點圖-圖形展示關(guān)系110R 應(yīng)該多大:如果你真想知道的話 依樣本大小,若所得的相關(guān)系數(shù)比表中的值大,則可視為 “重要” 或統(tǒng)計顯著Sample Sized.f.Significance Levelnn-20.050.0250.010.005310.98770.99690.99950.9999420.90000.95000.98000.9900530.80540.87830.93430.9587640.72930.81140.88220.9172750.66940.75450.83290.8745
52、860.62150.70670.78870.8343970.58220.66640.74980.79771080.54940.63190.71550.76461190.52140.60210.68510.734812100.49730.57600.65810.707913110.47620.55290.63390.683514120.45750.53240.61200.661415130.44090.51400.59230.641116140.42590.49730.57420.622617150.41240.48210.55770.605518160.40000.46830.54250.589719170.38870.4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)殖買賣的合同范本
- 2025企業(yè)年金基金托管合同范本
- 2025江蘇省建設(shè)工程造價咨詢合同(示范文本)
- 油罐安全合同范本
- 2025企業(yè)管理資料范本福建勞動合同范本
- 2025衢州市衢江區(qū)高家鎮(zhèn)湖仁村物業(yè)用房及廠房租賃合同
- 汽車貨物運輸合同協(xié)議書
- 2025【合同范本】農(nóng)村土地承包合同
- 2025“誰造誰有”林地使用合同書
- 貨物運輸合同協(xié)議書模板
- 工程造價咨詢服務(wù)方案(技術(shù)方案)
- 整體租賃底商運營方案(技術(shù)方案)
- 常用藥物作用及副作用課件
- 小學生作文方格紙A4紙直接打印版
- 老人心理特征和溝通技巧
- 幼兒阿拉伯數(shù)字描紅(0-100)打印版
- 標桿地產(chǎn)集團 研發(fā)設(shè)計 工程管理 品質(zhì)地庫標準研發(fā)成果V1.0
- TMS開發(fā)業(yè)務(wù)需求文檔
- 2023年1月浙江高考英語聽力試題及答案(含MP3+錄音原文)
- HI-IPDV10芯片產(chǎn)品開發(fā)流程V10宣課件
- 房產(chǎn)抵押注銷申請表
評論
0/150
提交評論