西格瑪A階段綠帶教材.ppt_第1頁
西格瑪A階段綠帶教材.ppt_第2頁
西格瑪A階段綠帶教材.ppt_第3頁
西格瑪A階段綠帶教材.ppt_第4頁
西格瑪A階段綠帶教材.ppt_第5頁
已閱讀5頁,還剩219頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

6Sigma綠帶培訓(xùn)-分析階段,第一章概述(1)多變量分析(2)方差組分分析(3)中心極限定理第二章假設(shè)檢驗(1)假設(shè)檢驗簡介(2)均值比較(3)方差比較(4)比例比較(5)樣本量選擇,第三章相關(guān)性分析(1)X-Y圖(2)相關(guān)系數(shù)(3)誤解分析(4)Minitab練習(xí)(拋射器)第四章一般線性回歸分析第五章多元回歸分析第六章分析階段路徑第七章附錄第八章非參量統(tǒng)計(閱),目錄,DM階段回顧與試題講解,多變量分析,第一章概述,變異的2個來源3種分類多變量分析數(shù)據(jù)采集抽樣要求組內(nèi)、組間、組外的含義Minitab制作多變量圖路徑,三種數(shù)據(jù)結(jié)構(gòu)及相關(guān)分析方法方差組分分析四大用途Minitab進行方差組分分析路徑,模塊目標(biāo),流程圖/魚骨圖,篩選DOE,因果矩陣與FMEA,多變量/方差組分/中心極限定理,優(yōu)化DOE,通過優(yōu)化并控制關(guān)鍵X達到流程優(yōu)化和控制的目的,6Sigma改進過程中的漏斗效應(yīng),假設(shè)檢驗,30-50個X,10-15個X,8-10個X,4-8個關(guān)鍵X,3-6個關(guān)鍵X,應(yīng)用環(huán)境,變異的來源,單件產(chǎn)品內(nèi)部批次內(nèi)單件產(chǎn)品之間不同批次之間不同操作員之間不同生產(chǎn)設(shè)備之間設(shè)備生產(chǎn)轉(zhuǎn)換前后不同時間段,測量系統(tǒng)的重復(fù)性測量系統(tǒng)的再現(xiàn)性校準(zhǔn)前后的穩(wěn)定性不同測量人員之間量程范圍內(nèi)的線性度,來自流程的變異,來自測量系統(tǒng)的變異,變異,什么是多變量分析?,多變量分析:基本概念及作用,從多個角度通過圖表觀察造成流程績效指標(biāo)變異的原因觀察流程的短期與長期能力間的差距及造成差距的主要原因與方差組分分析一起使用,可以明確流程變異的根本原因,流程績效指標(biāo)隨流程輸入和流程指標(biāo)變化的圖標(biāo)展示在生產(chǎn)中對當(dāng)前流程水平進行過程能力分析的手段流程穩(wěn)定性的直觀觀察,多變量分析的作用是什么?,多變量圖,R內(nèi):單元內(nèi)部的變化范圍R間:單元間的差別R時:不同時間段的差別,圖為某注塑車間隨時間(151821)的不同,注塑強度差異的多變量圖,R內(nèi),R外,R間,多變量分析:多變量圖,通常在一個圖表上展示2-4個X對連續(xù)變量Y的影響,多變量圖與控制圖的比較,多變量分析:與控制圖的比較,有助于發(fā)現(xiàn)將流程穩(wěn)定在最佳條件下的一些有用線索,變異來源,多變量分析:應(yīng)用環(huán)境,順序,空間,時間,來自單件內(nèi)部的變異,來自同一批次不同單件間的變異化工廠的不同反應(yīng)容器之間不同的設(shè)備或操作員工之間,連續(xù)生產(chǎn)的單件之間不同的生產(chǎn)安排之間不同的原料或批次之間,固定間隔的不同時間段,如每小時,班組,日,星期等短時間間隔(小時,班組)與長時間間隔(日、星期)的比較等,常見變異來源分類,多變量分析:應(yīng)用環(huán)境,常見的變異來源圖示,多變量分析:應(yīng)用環(huán)境,揭示常見的變異來源產(chǎn)品單元內(nèi),單元之間,批次之間,人員,設(shè)備,班組,時間,原料,生產(chǎn)調(diào)整等。測量系統(tǒng)的重復(fù)性與再現(xiàn)性分析理解測量誤差的來源。,應(yīng)用舉例,多變量分析:應(yīng)用環(huán)境,如果要確定是時間因素帶來的變異,進行多變量分析時應(yīng)盡量采用系統(tǒng)抽樣的方式(定時或固定間隔采樣),為了充分暴露問題,應(yīng)盡量使用長期數(shù)據(jù),考慮了各個造成變異的因素后,才能客觀反映問題的來源,一般要求樣本的方差達到流程總變異的80%以上。,抽樣指導(dǎo)原則:1、空間/位置原因變異每個單件上至少選擇兩個位置2、順序每個批號或每個時間段至少選取3個連續(xù)生產(chǎn)的部件3、時間因素至少挑選20個固定間隔的抽樣時間段,多變量分析數(shù)據(jù)采集要求,多變量分析:應(yīng)用環(huán)境,應(yīng)用Minitab畫多變量圖,黑帶老王希望了解培訓(xùn)和經(jīng)歷對員工生產(chǎn)率的影響,根據(jù)與項目團隊的交流發(fā)現(xiàn)員工在崗時間(1-5年)和培訓(xùn)項目(有基礎(chǔ)培訓(xùn)與專家培訓(xùn)兩種),分別為40和80小時。對工件的加工時間用來衡量生產(chǎn)率。部分相關(guān)數(shù)據(jù)如圖所示。數(shù)據(jù)在Minitab文件multivariate-crossed.maw中。打開文件按下圖進行練習(xí)。,實例操作,多變量分析:圖形制作,StatQualityToolsMulti-VaryChartResponse:TimeFactor1:TrainingHoursFactor2:Experience點擊“Options”并選擇所有三項(包括DisplayindividualDataPoints)OK,應(yīng)用Minitab畫多變量圖,多變量分析:圖形制作,應(yīng)用Minitab練習(xí),你能得出什么結(jié)論?,多變量分析:圖形制作,多變量分析:圖形制作,再練習(xí)一次,但兩個因子的順序互換StatQualityToolsMulti-VaryChartResponse:TimeFactor1:ExperienceFactor2:TrainingHours點擊“Options”并選擇所有三項(包括DisplayindividualDataPoints)OK,應(yīng)用Minitab練習(xí)“多變量分析”,多變量分析:練習(xí),多變量分析:練習(xí),應(yīng)用Minitab練習(xí),你能得出什么結(jié)論?,方差組分分析,第一章概述,交叉結(jié)構(gòu)舉例,注意內(nèi)容,三種因子數(shù)據(jù)結(jié)構(gòu),交叉結(jié)構(gòu):根據(jù)具體生產(chǎn)運營情況,有完全交叉的因子關(guān)系嵌入結(jié)構(gòu):因子間存在從屬關(guān)系交叉與嵌入混合結(jié)構(gòu):交叉與從屬結(jié)構(gòu)混合的情形,在進行多變量分析前應(yīng)該特別注意數(shù)據(jù)是如何收集的及因子之間的相互關(guān)系,在一次MSA分析中,由3個檢驗員對10個部件進行了MSA分析。要求:3個檢驗員對所有10個部件都重復(fù)測量對于測量結(jié)果來說,部件和質(zhì)檢員都是造成偏差的來源由于所有的檢驗員和所有部件都組合過,是典型的交叉結(jié)構(gòu)其它交叉結(jié)構(gòu)實例:試驗設(shè)計中的全因子試驗?zāi)P?方差組分分析:因子數(shù)據(jù)結(jié)構(gòu),交叉結(jié)構(gòu)圖示,方差組分分析:因子數(shù)據(jù)結(jié)構(gòu),在超市購買洗發(fā)水,香皂,罐裝飲料等,都可以發(fā)現(xiàn)一個產(chǎn)品序列號。產(chǎn)品的序列號可以追蹤到生產(chǎn)日期和批次。再生產(chǎn)商內(nèi)部,任何一件產(chǎn)品只能來自某個批次,某個生產(chǎn)線,某班組,某批原料。同一批次的產(chǎn)品只能來自某個生產(chǎn)線,可能屬某班組,某批原料。幾個班組可能只是在某個生產(chǎn)線工作(如不同地域)所有生產(chǎn)線可能在同時只處理同一批原料。這就可能構(gòu)成完全嵌入的從屬關(guān)系。,嵌入式結(jié)構(gòu)舉例,方差組分分析:因子數(shù)據(jù)結(jié)構(gòu),嵌入式結(jié)構(gòu)圖示,方差組分分析:因子數(shù)據(jù)結(jié)構(gòu),因子數(shù)據(jù)結(jié)構(gòu)不同,采用的定量分析方法就不同,方差組分分析可用于:,識別最大的變異來源通過對最大變異來源的消除達到改善流程的目的為改善階段流程的優(yōu)化確定方向建立更有效的樣本采集計劃,交叉結(jié)構(gòu)采用方差分析(包括固定模型和隨機模型)的方法分析通嵌入結(jié)構(gòu)采用方差組分分析可以把各個來源所造成的變異進行分離,并計算出各自為總體的偏差(以方差計算)所帶來的份額有多少,方差組分分析:用途,方差組分分析舉例,某化工廠黑帶小張意圖減少洗發(fā)水罐裝量偏差過大的問題。罐裝是在不同工廠,不同設(shè)備及有不同班組的員工進行。為了定量了解上述原因?qū)扪b量(以克為單位)變異的影響,小張分別到四個工廠的四個班組中隨機抽取了四位操作員,每位操作員工作時抽取三個樣品(每間隔800個生產(chǎn)產(chǎn)品)進行了分析。這是一個典型的嵌入式結(jié)構(gòu),可借助完全嵌入結(jié)構(gòu)的方差分析(即方差組分分析)定量研究成果作為該結(jié)果。文件名稱為:shapooweight.mtw.,方差組分分析:分析案例,多變量分析:舉例,方差組分分析:分析案例,班組間變異,操作員間變異,內(nèi)部變異,工廠間變異,多變量分析結(jié)論,方差組分分析:分析案例,請注意輸入順序:從高級開始逐級下沿,進行定量分析,方差組分分析Minitab應(yīng)用,方差組分分析:分析案例,方差組分分析舉例,方差組分分析:分析案例,方差組分分析舉例,方差組分分析:分析案例,同一操作員隨時間進行會有不同的罐裝量,這是造成變異的最大原因不同員工罐裝量有區(qū)別,應(yīng)研究培訓(xùn)或操作規(guī)程的制定執(zhí)行情況不同工廠罐裝數(shù)量有不同之處,應(yīng)調(diào)查原因是什么不同班組之間沒有明顯的區(qū)別,方差組分分析結(jié)論,方差組分分析:分析案例,綠帶李小姐負責(zé)供應(yīng)商質(zhì)量管理工作,她需要了解是否存在供應(yīng)商與本公司之間對某產(chǎn)品某項指標(biāo)的檢驗結(jié)果是否相同。由于供應(yīng)商來自另外一個國家,來料的品質(zhì)檢驗難以按照交叉檢驗的方式進行。為此,李小姐要求供應(yīng)商在其兩個生產(chǎn)基地各自選五件產(chǎn)品,并各隨機選擇一個檢驗員進行重復(fù)測量。在本公司也選了五件產(chǎn)品,也挑選了一位檢驗員進行了重復(fù)測量。結(jié)果匯總到文件nestedr所以我們不能否定零假設(shè)。數(shù)據(jù)不能提供足夠的證據(jù)否定平均強度等于2.85磅。,Minitab輸出結(jié)論,我們現(xiàn)在展示進行假設(shè)檢驗的細節(jié)我們在檢驗關(guān)于抽樣對象均值的聲明由于n30,根據(jù)中心極限定理,抽樣均值的分布接近正態(tài)分布。,由于1.96BasicStatisticNormalitytest,正態(tài)性檢驗,P值計算,d)計算P值,使用Minitab:StatBasicStatistics1-Samplet,e)因為0.001Normalitytest2、T檢驗:StatBasicStatistic1-samplet,由于P值大于臨界置信水平(本例中為0.05),或者說,由于均值的置信區(qū)間包含了目標(biāo)值,我們可以做出下述結(jié)論:我們沒有足夠的證據(jù)拒絕零假設(shè)。,我們沒有足夠的證據(jù)拒絕零假設(shè)。是否可以說零假設(shè)是正確的(總體均值的真值=950)?不!但是,我們通常在假定零假設(shè)是正確的情況下執(zhí)行操作。,結(jié)論,均值比較:一個小樣本均值檢驗,情況2,檢驗兩個抽樣對象的均值是否相等,第二章假設(shè)檢驗,雙對象總體均值::大樣本,雙樣本Z檢驗用于檢驗兩個抽樣對象總體均值,并且每個抽樣數(shù)量都較大。Minitab軟件不提供雙樣本Z檢驗。所以,我們必須使用雙樣本T檢驗。標(biāo)準(zhǔn)雙樣本Z檢驗或T檢驗用于互相獨立的兩個樣本。當(dāng)樣本是相互依賴的時候我們要使用成對T檢驗。,獨立樣本:例如,兩個公司的交貨期,依賴樣本:熱處理前后同一產(chǎn)品的硬度,均值比較:雙樣本檢驗,兩個獨力大樣本均值比較,當(dāng)比較來自兩個獨立的大量抽樣的均值,使用以下檢驗統(tǒng)計方法:,Z=,我們在檢驗零假設(shè),1=2,因此,(1-2)=0因為雖提供類的檢驗方法類似單樣本Z檢驗,所以我們只用Minitab計算P值,并得出結(jié)論。,舉例訂單生成,某公司有兩個辦公室都生成訂單。為了確定是否一個部門比另一個的速度更快,黑帶從每個部門的80個訂單的“訂單時間”數(shù)據(jù)。數(shù)據(jù)在“Ordergeneration.mtw”A)建立零假設(shè)和備選假設(shè)。H0:officeA=officeBH1:officeAofficeBB)確定顯著水平,=0.05C)隨機抽取樣本。OfficeA:n=80y=1.48s=0.45OfficeB:n=80y=1.58s=0.51D)計算P值UsingMinitabStatBasicStatistics2-sampletTick“Assumeequalvariance”,E)比較P值和顯著性水平。P-value=0.183所以,我們不能否定零假設(shè)。F)結(jié)論:數(shù)據(jù)不能提供足夠的證據(jù)證明時間存在差異。,Two-SampleT-TestandCI:OfficeA,OfficeBTwo-sampleTforOfficeAvsOfficeBNMeanStDevSEMeanOfficeA801.4780.4470.050OfficeB801.5790.5080.057Difference=mu(OfficeA)-mu(OfficeB)Estimatefordifference:-0.10125095%CIfordifference:(-0.250716,0.048216)T-Testofdifference=0(vsnot=):T-Value=-1.34P-Value=0.183DF=158BothusePooledStDev=0.4786,Minitab輸出,均值比較:獨立大樣本均值檢驗,雙樣本t檢驗用于檢驗兩個均值是否相等,并且是小樣本抽樣。使用雙樣本t檢驗的條件是:1.整體標(biāo)準(zhǔn)差未知。2.每個母體的分布必須是正態(tài)分布例子將比較兩組均值:下述數(shù)據(jù)代表了來自兩個不同群組的10個測量值。Dataisin:LPC(2-samplet).MTW判斷兩組的均值是否相同?1、零假設(shè)和被選假設(shè)是:H0:1=2;H1:122、正態(tài)性驗證:StatBasicStatisticsNormalitytest,檢驗兩個總體均值:小樣本,均值比較:獨立小樣本均值檢驗,如果t或tStack/UnstackStackColumns,選擇“StoreSubscriptsin”,輸出變量在C3中,輸出變量在C4中,將變量名加到堆疊數(shù)據(jù)中,4、堆疊數(shù)據(jù)的等方差檢驗:StatBasicstatisticsTestforequalvariance5、堆疊數(shù)據(jù)的T檢驗:StatBasicStatistics2-SampletTwo-sampleT-TestandC1:sampleA,sampleB,Two-SampleT-TestandCI:sampleA,sampleBTwo-sampleTforsampleAvssampleBNMeanStDevSEMeansampleA10899.135.811sampleB101093.642.713Difference=mu(sampleA)-mu(sampleB)Estimatefordifference:-194.50095%CIfordifference:(-231.680,-157.320)T-Testofdifference=0(vsnot=):T-Value=-11.04P-Value=0.000DF=17,均值比較:獨立小樣本均值檢驗,如果一個抽樣同另一個抽樣有關(guān),這兩個抽樣就是相關(guān)的。如果你對某一洗發(fā)液對于治療脫發(fā)的效果進行陳述,你應(yīng)對同一群人使用該洗發(fā)液前后的脫發(fā)情況進行測量。你需要成對數(shù)據(jù)。如果你對同一批電腦晶片在跌落測試前和測試后進行測量,兩個測量之間就存在相關(guān)性。在這些例子中,我們不是檢驗兩個不同的數(shù)據(jù)集。相反,我們需要的是數(shù)據(jù)前和后的區(qū)別,來研究前后差異是否顯著。,相關(guān)樣本,均值比較:總結(jié),成對T檢驗,利用Minitab軟件檢驗兩個相關(guān)的樣本是否相等。兩個相關(guān)的樣本必須是隨機抽取的每個抽樣整體都應(yīng)該整體呈正態(tài)分布StatBasicStatisticsPairedt,練習(xí):一輪胎公司認為他們新生產(chǎn)的輪胎的里程數(shù)較競爭者的提高,選擇了12部車,用新輪胎跑1000哩,再用競爭者的輪胎跑1000哩。假定里程的差異服從正態(tài)分布。File:CarMileage.MTWStatsBasicStatsPairedt,練習(xí),結(jié)論是什么?,結(jié)論是什么?如果我們將數(shù)據(jù)組作兩樣本t檢驗會如何?雙樣本T檢驗與1Samplet檢驗有何不同?,均值比較:總結(jié),情況3,檢驗超過兩個的抽樣對象均值是否相等,第二章假設(shè)檢驗,假設(shè)檢驗利用以下格式進行:H0:1=2=3=4,,=n;H1:至少一個均值與其它不同,均值比較:三個以上樣本檢驗,單因子方差分析(OneWayANOVA),ANOVA假定母體是正態(tài)分布抽樣是隨機的每個抽樣對象方差相等每個抽樣對象的隨機抽樣數(shù)量沒有必要相等。例子:在美國空軍學(xué)院進行試驗,確定當(dāng)?shù)厥欠裼兴嵊辍7謩e在學(xué)院的三個地點測量雨的酸性。地點1位較高地點;地點2為中間地勢;地點3為低地。測量的值為PH。各地點的酸性是否存在差異?,按照以下步驟:A)H0:A=B=C;H1:至少一個不同;B)=0.05B)隨機在各地點分別測量7個數(shù)據(jù)。C)用Minitab軟件計算P值。StatANOVAOne-way,F(xiàn)ile:Anova(Acidity).MTW,One-wayANOVA:Station1,Station2,Station3SourceDFSSMSFPFactor20.0470.0230.190.832Error182.2600.126Total202.307S=0.3543R-Sq=2.02%R-Sq(adj)=0.00%Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev-+-+-+-+-Station177.31430.4598(-*-)Station277.42860.2628(-*-)Station377.35710.3101(-*-)-+-+-+-+-7.207.407.607.80PooledStDev=0.3543,Minitab輸出,均值比較:三個以上樣本檢驗,TestingofVariances方差比較,第二章假設(shè)檢驗,學(xué)習(xí)目標(biāo),1、了解ANOVA定義、術(shù)語2、一元、二元ANOVA。4、ANOVA原理。5、一元/二元ANOVA應(yīng)用。,情況1,單一標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)比較,第二章假設(shè)檢驗,“通常我們對由不同方法或處理過程中產(chǎn)生的響應(yīng)的均值差異感興趣。有時對數(shù)據(jù)的變異程度感興趣。通過制程改善以減少過程的方法非常重要,即使沒有改變均值。同樣,兩種或多種分析方法的變異也是感興趣的話題?!崩樱嚎煽诳蓸费b瓶公司希望減少瓶裝重量的變異。經(jīng)過一些變更后,他們聲稱過程的標(biāo)準(zhǔn)差是0.02。數(shù)據(jù)在:Coca-Cola.MTW,注:Minitab沒提供單獨標(biāo)準(zhǔn)差的檢驗。作為替代,必須檢查標(biāo)準(zhǔn)差的置信區(qū)間并確定置信區(qū)間是否包含聲明值。,方差比較:單一標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)比較,方差的推論,單一標(biāo)準(zhǔn)差,StatBasicStatisticsGraphsummary,結(jié)論:由于標(biāo)準(zhǔn)差的置信區(qū)間包含了聲明值,我們可以做出下述陳述:我們沒有足夠的證據(jù)拒絕零假設(shè)=0.02,Minitab輸出,方差比較:單一標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)比較,ANOVA是方差/變異的分析ANOVA是發(fā)現(xiàn)變異源頭的有效方法,方差比較:什么是ANOVA,ANOVA術(shù)語,因子:一個對響應(yīng)變量(非獨立)可能有影響的獨立變量,并以不同的水平出現(xiàn)在實驗內(nèi)。水平:一個輸入因子的特定設(shè)定;例如:一個熱處理的4個水平是100,200,300,400。交互作用:交互作用的出現(xiàn)是當(dāng)一個輸入因子對輸出所產(chǎn)生的效果取決于另一個輸入因子的水平時。,一元/二元/多元ANOVA,1、檢驗單個因子的2個以上水平的平均值是否有顯著差異-一元ANOVA2、存在兩個(或更多)因子時,檢驗平均值是否有顯著差異-二元,多元ANOVA.,例:假設(shè)某餐廳經(jīng)理認為,送餐的時間會受到員工的影響,也就是說,不同的員工送餐的時間是不同的(即使送餐的距離等其他因素完全相同),現(xiàn)在他需要比較三名不同員工:Jack,Bob,Rena的送餐時間有無統(tǒng)計差異,他該使用何種統(tǒng)計工具?,方差比較:一元ANOVA舉例,這種通過收集數(shù)據(jù)來比較同一因子的不同水平對Y的影響是否存在差異的方法,就叫做單因子設(shè)計,因為影響Y輸入變量只有一種:即員工,該例中影響Y的因子(輸入變量)有幾種?該因子有幾個不同的Level?,假設(shè)員工Jack,Bob,Rena每人送6份快餐的時間,記錄在上頁表格中,(假設(shè)每次送餐的距離等其他因素完全相同),即Y=送一份快餐的時間,以分鐘為單位。,假設(shè)對于送餐時間,除了不同的員工有影響外,天氣(晴天,雨天)是另外一個產(chǎn)生變異(影響送餐時間)的可能原因。,1、假設(shè)影響送餐時間的原因有兩種:員工和天氣2、這種同時比較兩個因子不同水平各自對Y的影響叫做雙因子設(shè)計,例如Y的輸入變量(X)有兩種:員工和天氣3、假設(shè)每個因子有L個水平,各水平的反復(fù)數(shù)都是m,數(shù)據(jù)列表如下:,一元ANOVA原理,方差比較:一元ANOVA舉例,左邊和右邊同時平方如下,總平均值是,假設(shè)數(shù)據(jù)為Xij總平均是,上式可變?yōu)槿缦拢?方差比較:一元ANOVA舉例,所以上頁方程式變?yōu)槿缦路匠淌剑郝詫慡S代表方差的總和SS,DegreeofFreedom(DOF)自由度是?自由度是指在一個系統(tǒng)中不影響其他變數(shù)、不受任何約束,能夠獨立變動的數(shù)目。(獨立樣本的個數(shù))樣本方差的自由度為n-1,因為:中,x1-x,x2-x,.xnx,這n個量并不能自由變化,而是受到一個=0,少了一個自由度。,方差比較:一元ANOVA舉例,自由度的計算SS(total)的自由度SS(Between)的自由度SS(within)的自由度,方差比較:一元ANOVA舉例,F分布,ANOVA是通過比較群間變異與群內(nèi)變異,來判斷到底是群間變異和群內(nèi)變異哪個比較大。當(dāng)MSA與MSE相差不大時,則F較小,說明該因子是不顯著的,當(dāng)F值越大說明群間的效果越明顯,即該因子是顯著的。(也可利用F分布確認P-value),方差比較:一元ANOVA舉例,方差比較:一元ANOVA舉例,=,=,=l-1,=l(m-1),=lm-1,平方和(SumofSquares),SSA=,SSE=,SST=,F值,因子(factor),SSBetween,SSWith,Total,=,方差比較:一元ANOVA舉例,輸出:焊接強度輸入的水平:3個:A,B,C這是一個具有3個水平的單因子實驗,一個采購工程師要調(diào)查某個電阻焊接系統(tǒng)中,3種不同型號(A,B,C)的焊接機對焊接強度的影響是否有顯著差異,他收集了一些數(shù)據(jù)。,方差比較:一元ANOVA舉例,實際問題,應(yīng)用Minitab計算,Minitab利用p值決定每個變異來源的顯著性。記住:P值是當(dāng)零假設(shè)是正確時得到觀察樣本的概率。,在此單因子實驗中,零假設(shè)是H0:焊接強度均值相等備擇假設(shè)是H1:焊接強度均值不相等,方差比較:一元ANOVA舉例,應(yīng)用Minitab計算,One-wayANOVA:C4versusC5SourceDFSSMSFPC52161.7380.879.590.003Error12101.208.43Total14262.93S=2.904R-Sq=61.51%R-Sq(adj)=55.10%Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev+-+-+-+-MachineA59.8003.347(-*-)MachineB515.4003.130(-*-)MachineC517.6002.074(-*-)+-+-+-+-7.010.514.017.5PooledStDev=2.904,如果平均焊接強度相等的話,得到觀察樣本的概率為0.3%,方差比較:一元ANOVA舉例,分析結(jié)果,拋射器練習(xí)第1輪,限制條件:要素水準(zhǔn)1.栓的位置1,2,3,42.停止角1,2,3,4,5,63.杯高1,24.吊鉤位置4,5,65.橡皮帶數(shù)目1,26.起始角160-180度7.球的類型塑料或橡皮,距離(米),小組角色34567發(fā)射者11111測量者11111數(shù)據(jù)輸入文員11111設(shè)置調(diào)整11111質(zhì)量/流程檢驗員1111計時員111回球員11,拋射器練習(xí)第1輪,說明1.組成4-7人的小組2.分配責(zé)任給所有的小組成員3.按以下設(shè)置安裝拋射器4.3個作業(yè)員各射擊5次并記錄距離問題1.計算射擊的平均值和標(biāo)準(zhǔn)偏差2.如果規(guī)定公差是+/-5厘米,計算西格瑪值,設(shè)置:1.栓的位置32.停止角33.杯高14.吊鉤位置45.起始角170度,拋射器練習(xí)第1輪,Exercise1練習(xí)1,文件:塑膠強度,某工程師認為反應(yīng)溫度對生產(chǎn)的塑膠產(chǎn)品的強度有影響,所以他為了證實這一點,進行了實驗。他設(shè)定了4種不同溫度,每種溫度測試了3回,總計12次實驗,數(shù)據(jù)如下表,請分析并判斷工程師的想法是否正確?,Exercise2練習(xí)2,對某個數(shù)字電路的4種不同的設(shè)計進行研究,以比較噪聲量(我們希望噪聲越小越好)。得到了如下數(shù)據(jù)。這4種電路設(shè)計造成的噪聲相同嗎?哪個設(shè)計最好?,電路設(shè)計噪聲1182021308280617356803472625355049546837897分析后得出您的結(jié)論。,情況2,檢驗兩個抽樣對象的方差是否相等,第二章假設(shè)檢驗,檢驗兩方差(正態(tài)),方差比較:二元ANOVA圖形,兩方差相同還是不同?使用F檢驗:比較F=to,和S1S2.如果F,那么否定兩者相等基于,分子自由度為n1-1,分母自由度為n2-1,等方差檢驗,StatANOVATestforequalVariance,假如P,接受H0;如果PANOVATestforequalvariance,對2樣本,這與F檢驗相對,經(jīng)理決心改善送餐時間。他認為:人員和天氣都可能影響送餐時間影響送餐時間的因素:員工(Jack、Bob、Rena)天氣(晴天、雨天、風(fēng)天)經(jīng)理取了3名員工,分別調(diào)查了他們在晴天,雨天,風(fēng)天的表現(xiàn)情況,收集數(shù)據(jù)如下:文件在:送餐時間。,方差比較:二元ANOVA舉例,送餐時間,疊加數(shù)據(jù),注意:Minitab需要將相同類型的數(shù)據(jù)放在一欄。,制作變量圖,多變量圖結(jié)果,StatQualityToolsMulti-VariChart,方差比較:二元ANOVA舉例,主效果圖,StatANOVAMainEfectsChart,方差比較:二元ANOVA舉例,交互作用效果圖,StatQualityToolsSummetryPlot,方差比較:二元ANOVA舉例,二元ANOVA分析,StatANOVA,比較計算的Chi-Square和臨界值,P值,Minitab軟件計算P值,用Minitab建立列聯(lián)表和P數(shù)值:StatTablesChi-squaretest,ExpectedcountsareprintedbelowobservedcountsChi-SquarecontributionsareprintedbelowexpectedcountsC1C2C3C4Total15123571279961992397.85315.76282.38996.0032.7505.38585.5000.00022152203898241648329.15261.24233.62824.0039.5866.509103.3470.000372757751618203640727.00577.00516.001820.000.0000.0000.0000.000,因為P值=0.000,小于=0.05,我們將否定零假設(shè)。,結(jié)論,比例比較:多比例檢驗,樣本量的選擇,第二章假設(shè)檢驗,選擇樣本量的重要性,如果樣本量太?。繂栴}:不能發(fā)現(xiàn)差別如果樣本量太大?問題:太靈敏資源浪費,樣本量計算,樣本選擇的步驟,step1:確定需研究的響應(yīng)變量(Y)step2:選擇適當(dāng)?shù)慕y(tǒng)計檢驗方法Step3:確定兩類風(fēng)險Step4:確定需要的偏移靈敏度Step5:建立或評估現(xiàn)有過程參數(shù)Step6:確定樣本量,抽樣風(fēng)險,H0:沒有差異H1:有差異,不否定零假設(shè),否定零假設(shè),Decision決策,TrueState真實情況,偏移靈敏度,進行實驗前,首先要確定顯著差異。顯著差異除以標(biāo)準(zhǔn)差,得到偏移靈敏度/。,對比平均值的檢驗,1-SampleTests:Stat/PowerandSampleSize/1-SamplezStat/PowerandSampleSize/1-Samplet2-SampleTests:Stat/PowerandSampleSize/2-Samplet,Example1,用64昂司的盒子裝冰其淋,差異不能超過3昂司裝冰其淋的機器的過程變異為1昂司。要求置信度為0.99,檢出能力為.5.7.9時樣本量分別為多少.,Stat/PowerandSampleSize/1-Samplez,DifferencesizepowerActualPower320.50.952224320.70.952224320.90.952224,Stat/PowerandSampleSize/1-Samplet,DifferencesizepowerActualPower340.50.619933350.70.894714360.90.992651,某工程師要了解新機器的功效,現(xiàn)有機器的平均值為5;標(biāo)準(zhǔn)差為1;如果新機器的均值比現(xiàn)有機器大過3,他將建議購買.考慮到投資的成本,他希望投資失誤的風(fēng)險限制在0.5%.檢出能力時樣本量分別為多少?,Example2,Stat/PowerandSampleSize/2-Samplet,DifferencesizepowerActualPower340.50.6875350.70.8741360.90.9563,對比比率的檢驗,1ProportionTestStat/PowerandSampleSize/1-Proportion2-ProportionTestStat/PowerandSampleSize/2-Proportion,某高層想評估當(dāng)?shù)氐腟ixSigma意識水平.他想知道是否他的員工至少有50%的人了解SixSigma理念.如果低于45%,他將推進培訓(xùn)計劃.要求=0.05=0.15;樣本量應(yīng)為多少?,Example3:1-Proportion,Stat/PowerandSampleSize/1-Proportion,Testingproportion=0.5(versusRegressionFittedLinePlot,應(yīng)用Minitab畫散點圖,案例分析1,黑帶想了解一化合物蒸餾過程中氧氣的純度(Y)與冷凝器中的碳氫化合物的%之間的關(guān)系。數(shù)據(jù)在Oxygenpurity.mtw中請做出散點圖:MinitabGraphPlot,相關(guān)性分析:散點圖,散點圖(Scatterplot):顯示兩個變量之間的關(guān)系打開工作表BATTERIES.MTW點擊“OpenWorksheet”,在Minitab自帶的“我的電腦C盤ProgramFilesMinitab14Correlation,Minitab:StatBasicStatisticsCorrelation,案例分析3,相關(guān)性分析:相關(guān)系數(shù),Correlations:Hydrocarbon%,Oxygenpurity%PearsoncorrelationofHydrocarbon%andOxygenpurity%=0.937P-Value=0.000,結(jié)論是什么?,H0:=0(無相關(guān)性)H1:0(有相關(guān)性),1、收集數(shù)據(jù)范圍過窄2、外推法3、因果歸屬4、掩飾真正的相關(guān)或制造虛假的相關(guān)5、過多的集中在相關(guān)系數(shù)上,相關(guān)性分析:常見錯誤,相關(guān)分析的常見錯誤,錯誤1:數(shù)據(jù)覆蓋范圍過窄,在窄范圍內(nèi)收集數(shù)據(jù),較寬范圍的數(shù)據(jù)可提供一個評估結(jié)果,錯誤2:外推法,在數(shù)據(jù)范圍以外對相關(guān)性進行外推,數(shù)據(jù)范圍內(nèi)的關(guān)系在其他區(qū)域內(nèi)不一定適用。,相關(guān)并不意味著因果,僅僅是兩個變量間存在的關(guān)系,錯誤3:因果歸屬,雖然該相關(guān)系數(shù)(r)為0.918,但捕殺鸛并非是控制人口的好辦法。,控制“X”不會影響“Y”,相關(guān)性分析:常見錯誤,掩飾真實的相關(guān)或創(chuàng)造虛假的相關(guān),數(shù)據(jù)實際上是來自不同的數(shù)據(jù)來源,錯誤4:曲解數(shù)據(jù),錯誤5:過多的數(shù)據(jù)集中于R,過多的集中于相關(guān)系數(shù),上圖有相關(guān)系數(shù)R0.7,相關(guān)性分析:常見錯誤,通常,人們過于把R(或)值作為一個“好”的相關(guān)的依據(jù)。前面的圖形說明了將數(shù)據(jù)圖表變化是多么重要。但是當(dāng)圖表(和接下來的診斷)展示出一個合法的線性關(guān)系或數(shù)學(xué)模型時,我們可以做如下結(jié)論:,錯誤5:過多的數(shù)據(jù)集中于R,R20.4:相關(guān)性明確存在R20.7:我們可以使用該關(guān)系,但必須慎重R20.9:可使用的關(guān)系存在R20.95:關(guān)系良好,注意:這些“規(guī)則”是基于經(jīng)驗的主觀判斷,相關(guān)性分析:常見錯誤,使用理論模型,或源自他處的知識。2.正確的數(shù)據(jù)收集-使用正交實驗數(shù)據(jù)-使用大范圍的自變量-將數(shù)據(jù)收集的順序隨機化3.使用回歸診斷法-散點圖-殘值圖(觀察值-預(yù)計值)對預(yù)計值對自變量對抽樣順序,可通過以下方法來避免回歸中易出現(xiàn)的錯誤,-Minitab會標(biāo)注出殘值大、影響大的觀測數(shù)據(jù)-看看它們!-估計系數(shù)的顯著性檢驗-殘值的標(biāo)準(zhǔn)差(擬合有多好?)4.當(dāng)擬合平方項和交互作用項(例如對應(yīng)表面設(shè)計)時,先“對中”自變量。使用:平方項:相互作用項:,相關(guān)性分析:避免方法,SimpleLinearRegression一般線性回歸分析,第四章一元線性回歸分析,結(jié)束本章的學(xué)習(xí)后,學(xué)員將可以:解釋什么是回歸分析?進行一般線性回歸分析與解釋假設(shè)測定系數(shù)R2和調(diào)整過的R2回歸診斷置信區(qū)間有影響的觀測數(shù)據(jù)估計標(biāo)準(zhǔn)誤,學(xué)習(xí)目的,學(xué)習(xí)目的,回歸是確定一個響應(yīng)變量(或輸出)與一個或多個因變量(或輸入)之間的統(tǒng)計關(guān)系的方法。Y=f(X1,X2,X3,Xn)其中,Y是響應(yīng)變量,X1到Xn是因變量,決定兩個來自不同變量源的響應(yīng)(或輸出)之間線性關(guān)系的方法。也代表兩個變量間的線性關(guān)聯(lián)程度。由一個相關(guān)系數(shù)(R)來衡量兩個變量間的聯(lián)系強度,在這里-1R1。按照慣例,R表示真實的系數(shù),R表示我們的最佳估算。,相關(guān)性分析:概念,回歸分析概念,回歸與相關(guān),回歸應(yīng)用于如下幾個方面:預(yù)測系統(tǒng)模型因子篩選參數(shù)估算一般線性回歸(SLR)模型,其中:,一般線性回歸分析:回歸分析與相關(guān),如何理解回歸,最小平方的方法,殘差(或誤差)由ei確定最適合的直線即是殘差平方和最小的那條線。,=-(a+b),是最小值,本方法假設(shè)X無誤差,在Minitab中,可通過以下兩種方法得到一般線性回歸模型(最佳擬合線):,StatRegressionRegression,StatRegressionFittedLinePlot,例1:A黑帶想了解一化學(xué)蒸餾過程中氧氣的純度(Y)與冷凝器中的碳氫化合物的%之間的關(guān)系。,案例分析1,一般線性回歸分析:案例應(yīng)用,數(shù)據(jù)在文件中Oxygenpurity.mtw中建立Oxygenpurity(Y)對Hydrocarbon%(X)之間的一般線性回歸模式應(yīng)用“StatRegressionRegression,RegressionAnalysis:Oxygenpurity%versusHydrocarbon%TheregressionequationisOxygenpurity%=74.3+14.9Hydrocarbon%PredictorCoefSECoefTPConstant74.2831.59346.620.000Hydrocarbon%14.9471.31711.350.000S=1.08653R-Sq=87.7%R-Sq(adj)=87.1%AnalysisofVarianceSourceDFSSMSFPRegression1152.13152.13128.860.000ResidualError1821.251.18Total19173.38,與Hydrocar的關(guān)系解釋了y值87.7%的變異。,F測試顯示了測定系數(shù)87.7%,具有統(tǒng)計顯著性,一般線性回歸分析:案例應(yīng)用,測定系數(shù),R2是由回歸線代表y中變異數(shù)量。,R2=1代表回歸等式與抽樣數(shù)據(jù)完全吻合,測定系數(shù)定義R2,一般線性回歸分析:案例應(yīng)用,整體顯著性,在Minitab中P數(shù)值是對回歸等式的整體顯著性的測量P-valueRegressionFittedLinePlot,一般線性回歸分析:回歸分析與相關(guān),案例分析2,擬合線圖,回歸模型擬合線與整體顯著性,從文件Oxygenpurity.mtw中,建立Oxygenpurity對Hydrocarbon%(X)之間的一般線性回歸模式并進行殘差分析。,MinitabStatRegressionRegression,殘差分析,一般線性回歸分析:回歸分析與相關(guān),殘差圖表,置信區(qū)間,置信區(qū)間(CI):對于一個給出的X,Y的平均值的分布區(qū)間。該區(qū)間在X=X處最窄;X值離X越遠其區(qū)間寬度越大。預(yù)測區(qū)間(PI):對于一個給出的X值相應(yīng)的個別的Y值的區(qū)間。由于其應(yīng)用個體值,該區(qū)間比置信區(qū)間寬。,一般線性回歸分析:回歸分析與相關(guān),拋射器練習(xí)第2輪,說明射擊160度、170度、180度各10次并記錄距離問題1.求出回歸方程。,設(shè)置:1.栓的位置32.停止角33.杯高14.吊鉤位置45.起始角160-180度,從文件Oxygenpurity.mtw中,測定對于已獲得的線性回歸模型的95%置信區(qū)間和預(yù)測區(qū)間。MinitabStatRegressionFittedLinePlot,案例分析3,一般線性回歸分析:置信與預(yù)測區(qū)間,CI與PI,我們可以預(yù)測兩個數(shù)我們不可以用此模型預(yù)測數(shù)據(jù)范圍以外的或y。此模型只是在數(shù)據(jù)范圍內(nèi)才被驗證為有效。從文件Oxygenpurity.mtw中,給定的X值為1.15,確定和y的95%的區(qū)間。,給出x值,預(yù)測y的均值,給出x值,預(yù)測y的數(shù)值,利用回歸模型的預(yù)測,一般線性回歸分析:置信與預(yù)測區(qū)間,MinitabStatRegressionRegression,案例分析4:預(yù)測,案例分析4:Minitab輸出,PredictedValuesforNewObservationsNewObsFitSEFit95%CI95%PI191.4730.250(90.947,91.999)(89.130,93.815)ValuesofPredictorsforNewObservationsNewObsHydrocarbon%11.15,一般線性回歸分析:置信與預(yù)測區(qū)間,1)在正常數(shù)據(jù)模式以外的數(shù)據(jù)2)強烈影響回歸結(jié)果的數(shù)據(jù)(也就是顯著改變斜率或y軸截取值)這些現(xiàn)象并不一定是壞現(xiàn)象,因此你不一定要刪除他們。不管怎樣,在分析回歸結(jié)果之前應(yīng)該識別這些數(shù)據(jù)點并評估其影響。具有影響的數(shù)據(jù)可由于下列原因而被刪除:測量誤差數(shù)據(jù)輸入誤差違反物理定律,具有影響的數(shù)據(jù)點,具有影響的數(shù)據(jù)現(xiàn)象:界外點,界外點具有很大的殘差數(shù)值的現(xiàn)象數(shù)據(jù)。,一般線性回歸分析:置信與預(yù)測區(qū)間,界外點的處理方法,對于如下兩種情況,可以取消界外點:1)對不將其納入分析中有合理的解釋(例如:輸入錯誤)2)若納入這些數(shù)據(jù),會令回歸分析的合理的解釋失效。但是,因原因2被撤銷的點必須和回歸分析結(jié)果同時報告,要么作為一次計數(shù)要么作為一個稱為“虛假”數(shù)值的百分比。這些點通常是一個造成問題的根源,因此,一定不可被“隱藏”。,所有分析都應(yīng)報告上述界外點,案例分析5,從Oxygenpurity.mtw文件中,測定在數(shù)據(jù)組內(nèi)部是否存在具有影響的數(shù)據(jù)點。,一般線性回歸分析:置信與預(yù)測區(qū)間,MultipleRegressionAnalysis多元回歸分析,第五章多元回歸分析,學(xué)習(xí)目的,結(jié)束本章的學(xué)習(xí)后,學(xué)員將可以:解釋什么是多項式回歸和多元回歸進行多項式回歸分析。進行多元回歸分析。,多元回歸:多項式回歸,在前一節(jié),我們講解

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論