版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
假設檢驗二OO四年二月二十五日培訓資料假設檢驗二OO四年二月二十五日培訓資料目標:完成該章你將能夠:1)寫假設檢驗--原假設和備擇假設。2)解釋假設檢驗的結果。熟悉連續(xù)變量和邏輯變量的假設檢驗。目的:目標:熟悉連續(xù)變量和邏輯變量的假設檢驗。目的:情況:在三個不同的銷售區(qū)域使用相同促銷方法,銷售量分別是:A區(qū):1000B區(qū):850C區(qū):700“歷史”的解釋方法:銷售VP給A區(qū)經理較多的獎金。銷售VP考慮換掉C區(qū)經理?!癝ixSigma”解釋的方法:銷售VP問:“在95%置信度下是否有統(tǒng)計上的差異?”回答說:“是的,A區(qū)銷售與總平均值有統(tǒng)計上的差異。”VP研究A區(qū)的最佳實踐。情況:在三個不同的銷售區(qū)域使用相同促銷方法,銷售量分別統(tǒng)計“能夠”...推論兩組數(shù)據(jù)的平均值是否相同推論兩組數(shù)據(jù)的偏差是否相同推論兩組數(shù)據(jù)的缺陷率是否相同統(tǒng)計“不能”…直接說那一個較好
告訴我們如何解決問題做出決定確定規(guī)范或極限統(tǒng)計“能夠”...統(tǒng)計“不能”…總體:整個集合的全體特征樣本:具有總體特征的子集根據(jù)樣本確定總體!!!為什幺需要假設檢驗?總體:整個集合的全體特征樣本:具有總體特征的子集根據(jù)樣本確定總體參數(shù)與樣本統(tǒng)計總體參數(shù)樣本統(tǒng)計x平均值標準偏差比例(百分數(shù))spP1.總體參數(shù)(值)是固定的,但不知道。2.樣本統(tǒng)計是用來估計總體值的。假設是對總體值進行闡述,而不是對樣本統(tǒng)計。總體參數(shù)與樣本統(tǒng)計總體參數(shù)樣本統(tǒng)計x平均值標準偏差比例置信區(qū)間使用置信區(qū)間我們可以利用樣本估算總體的平均值和標準方差置信區(qū)間是基于下列要素的取值范圍:
樣本平均值
(X)和樣本標準方差(s)置信區(qū)間的取值范圍會包括:
總體平均值()及總體標準方差()。在風險水平一定的情況下,樣本平均值周邊的多大范圍能將總體平均值包括在內?置信區(qū)間置信區(qū)間置信區(qū)間使用置信區(qū)間我們可以利用樣本估算總體的平均值和標準置信區(qū)間....置信限...置信下限置信上限置信區(qū)間真實的總體平均值和標準方差可以落在置信上限和下限之間的任何一點!!!置信限是置信區(qū)間內的最大值和最小值!置信限置信區(qū)間....置信限...置信下限置信上限置信區(qū)間真實的總置信度是希望讓總體平均值和標準方差落在根據(jù)樣本計算出的置信區(qū)間內的概率大??!6西格瑪和業(yè)內通常使用95%的置信度,這意味著:在95%的情況下總體平均值和標準方差落在置信區(qū)間內在5%的情況下(alpha風險),總體平均值落在置信區(qū)間外。如果我希望提高信心
(99%的置信度).……或者承擔更多風險
(75%的置信度).……真實情景下,需要明確愿意承受的風險度…!置信度置信度是希望讓總體平均值和標準方差落在根據(jù)樣本計算出的置信區(qū)置信度=承擔業(yè)務風險的意愿高風險<75%中等風險~85%低風險>95%KmartLFLWatts舉例X軸LSLX軸
USL1Watt的增加=Kmart發(fā)生1億美元的成本/照明公司的擔保風險Kmart需求60.860.961.061.1X軸估計AverageWatts置信水平
樣本容99% 25995% 13285% 5375% 23故障幾率置信度=承擔業(yè)務風險的意愿高風險中等風險低風險Kmart假設檢驗:依據(jù)數(shù)據(jù)進行決策的核心實際答案統(tǒng)計問題數(shù)據(jù)知識“經驗”本能實際問題統(tǒng)計答案假設檢驗:實際答案統(tǒng)計問題數(shù)據(jù)知識“經驗”本能實際問題統(tǒng)計答1.所有流程均具有變動性2.從給定流程取得的樣本可能有所不同3.如何區(qū)分基于樣本的“幾率性”差異和真正的流程差異?1.所有流程均具有變動性2.從給定流程取得的樣本可能有所真實情況HoHa判決HoHa無罪,監(jiān)禁有罪,釋放無罪釋放有罪,監(jiān)禁無罪有罪釋放監(jiān)禁真實情況接受HoHaHoHaI類錯誤aII類錯誤b正確判決正確判決真實情況HoHa判決HoHa無罪,監(jiān)禁有罪,釋放無罪釋放有罪abHoHaa和b處在不同區(qū)域;故我們不可能同時犯I類和II類錯誤臨界限制abHoHaa和b處在不同區(qū)域;故我們不可能同時犯I何時需要假設檢驗?如果想分析輸入以確定是否影響輸出輸入A輸入C輸入B過程發(fā)票輸出如果在“改進”實施前想確認一下。任何時侯如果想根據(jù)樣本作客觀的判斷,就用假設檢驗!!!如果想知道兩個不同的過程產生的結果是否相同何時需要假設檢驗?如果想分析輸入以確定是否影響輸出輸入A輸入假設檢驗路線圖數(shù)據(jù)類型連續(xù)變量數(shù)據(jù)正態(tài)正態(tài)理論檢驗平均值的檢驗.標準偏差檢驗數(shù)據(jù)非正態(tài)非參數(shù)的檢驗位置的檢驗離數(shù)的檢驗邏輯變量比例數(shù)可計數(shù)數(shù)據(jù)假設檢驗路線圖數(shù)據(jù)類型連續(xù)變量數(shù)據(jù)正態(tài)正態(tài)理論檢驗平均值的常用的假設檢驗連續(xù)變量平均值的檢驗標準偏差的檢驗一個樣本的T檢驗樣本相關成對T檢驗樣本不相關二個樣本的T檢驗結構圖平均值的分析ANOM無結構圖均方差的分析ANOVA一個總體兩個總體三個或以上總體標準偏差的CHI平方檢驗均方差的同一性BARTLETT'STEST.LEVENE'STEST.一個總體兩個總體三個或以上總體標準偏差比率的F檢驗Tukey的快速檢驗常用的假設檢驗連續(xù)變量平均值的檢驗標準偏差的檢驗一個樣本的T將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)Stat>ANOVA>1-Way,2-Way,orGLM邏輯變量比例分析Stat>ANOVA>AnalysisofMeansBinomial(np>5)比例分析Stat>ControlChart>P(np>5)可計數(shù)數(shù)據(jù)分析Stat>ControlChart>U或比例分析Stat>ControlChart>P(np>5)或可計數(shù)數(shù)據(jù)比例數(shù)(樣本數(shù)N是常數(shù))比例數(shù)(樣本數(shù)N不是常數(shù))將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)邏輯變量比例分析比例分析可計平均值分析:FEDCBA0.400.350.300.4113260.2961740.35375
Hit
Ratio
平均值圖形分析ANOM是檢驗總體平均值的圖形檢驗平均值分析:FEDCBA0.400.350.300.4113方差分析:ANOVA單因子ANOVA:檢驗有一個變量時,總體平均值是否相等雙因子ANOVA:檢驗有兩個變量時,總體平均值是否相等ANOVA-GeneralLinearModel:檢驗有兩個以上變量時,總體平均值是否相等方差分析:ANOVA單因子ANOVA:檢驗有一個變量時,總利用樣本數(shù)據(jù)提供的信息來接受或拒絕一個關于總體參數(shù)(平均值,標準偏差,比例數(shù),可計數(shù)數(shù)據(jù))的陳述(假設)的統(tǒng)計推論?!霸僭O”HO,是對總體參數(shù)的一個陳述,通常HO是“沒影響”或“沒差別”的陳述。原假設“備擇假設”Ha或H1,是Ho被拒絕時可被接受的陳述,除非試驗結果強烈反對Ho,我們應該接受Ho。原假設:在統(tǒng)計證據(jù)證明你有罪前,你是清白的。利用樣本數(shù)據(jù)提供的信息來接受或拒絕一個關于總體“原假設”數(shù)據(jù)的收集與分析(Minitab)結果: p值>0.05OR 在判定限以內 不拒絕H0 P值<0.05OR 超出判定限 拒絕H0結論問題闡述列出將要采取的行動Ifp<0.05或超出判定限那幺....H0H日常語言統(tǒng)計語言沒有差別有差別或一個比另一個好=,=/>,or=/<=,>,or<數(shù)據(jù)的收集與分析(Minitab)結果: p值>0.接受Ho拒絕Ho在判定限內超出判定限用P值用判定限P值>0.05P值<0.05TwosampleTforC1vsC4NMeanStDevSEMeanC1109.4100.3570.11C4108.4600.3200.1095%CIformuC1-muC4:(0.63,1.27)T-TestmuC1=muC4(vsnot=):T=6.26P=0.0000DF=17TwosampleTforC1vsC2NMeanStDevSEMeanC1109.4100.3570.11C2109.4200.4290.1495%CIformuC1-muC2:(-0.38,0.36)T-TestmuC1=muC2(vsnot=):T=-0.06P=0.96DF=17統(tǒng)計語言實際語言“沒有足夠的數(shù)據(jù)顯示差別”“看起來是有差別”接受Ho拒絕Ho在判定限內超出判定限用P值用判定限P值假設陳述練習我們收集兩個發(fā)貨中心關于定單滿足率的數(shù)據(jù),想知道這兩個發(fā)貨中心的定單滿足率是否有差異寫一個合適的假設檢驗假設陳述練習我們收集兩個發(fā)貨中心關于定單滿足率的數(shù)據(jù),想知數(shù)據(jù)收集與分析(Minitab)Result: 在判定限以內 不拒絕H0
超出判定限 拒絕H0問題闡述
H0H日常語言統(tǒng)計語言結論數(shù)據(jù)收集與分析(Minitab)Result: 在數(shù)據(jù)收集與分析(Minitab)結果:在判定限以內不拒絕H0
超出判定限拒絕H0問題闡述H0H日常語言統(tǒng)計語言結論定單滿足率沒有差異P1=P2定單滿足率有差異P1<or>P2數(shù)據(jù)收集與分析(Minitab)結果:在判定限以內配貨中心正在考慮使用一種新的包裝材料現(xiàn)在,包裹燈泡使用的是漂白過的,對環(huán)境有污染的紙質材料,備選的包裝材料是一種對環(huán)境沒有污染,超柔,未經漂白的紙我們要做一項實驗來測試超柔、未經漂白的紙是否能有效減少破損;只有在證明超柔紙能有效減少破損的情況下才會被替代使用寫一個合適的假設檢驗假設陳述練習配貨中心正在考慮使用一種新的包裝材料假設陳述練習數(shù)據(jù)收集與分析(Minitab)結果: 在判定限以內 不拒絕H0
超出判定限 拒絕H0問題闡述
H0H日常語言統(tǒng)計語言結論數(shù)據(jù)收集與分析(Minitab)結果: 在判定限以內 數(shù)據(jù)收集與分析(Minitab)結果: 在判定限以內 不拒絕H0
超出判定限 拒絕H0問題闡述
H0H日常語言統(tǒng)計語言結論不同的包裝材料對破損沒有影響不同的包裝材料對破損有影響B(tài)1=B2B1<or>B2數(shù)據(jù)收集與分析(Minitab)結果: 在判定限以練習:巧克力豆/投訴計數(shù)一個綠帶項目主要目的是從第二季度開始減少每個地區(qū)的投訴次數(shù)。每張桌子發(fā)一勺巧克力豆,其數(shù)量代表每個區(qū)域第一季度收到的投訴次數(shù)。每桌選一位代表在教室前面的黑板上計下投訴的次數(shù)。其后,每桌會收到另外一勺巧克力豆,其數(shù)量代表每個銷售區(qū)域第二季度收到的投訴次數(shù)。請在前面的黑板上同樣計下第二季度的投訴次數(shù)請分析以下按季度和地區(qū)的數(shù)據(jù),以確認綠帶項目是否成功銷售地區(qū) 季度 投訴次數(shù)Region1 1 Region1 2 Region2 1 Region2 2Region3 1ETC. 練習:巧克力豆/投訴計數(shù)一個綠帶項目主要目的是從第二練習:巧克力豆/投訴計數(shù)你的假設是什么?你有什么類型的數(shù)據(jù)?你需要做的第一件事是什么?你將做何種假設檢驗?你檢驗哪些因子(變量)?練習:巧克力豆/投訴計數(shù)你的假設是什么?練習:巧克力豆/投訴計數(shù)用Minitab將計數(shù)型數(shù)據(jù)轉換為連續(xù)數(shù)據(jù)象左表一樣排列數(shù)據(jù)Calculate>CalculatorStoreResultinVariable=ClaimsExpression=SquareRoot(SQRT)Number=Claims可得到一列連續(xù)數(shù)據(jù),運行ANOM&ANOVA練習:巧克力豆/投訴計數(shù)用Minitab將計數(shù)型數(shù)據(jù)轉練習:巧克力豆/投訴計數(shù)ANOM:Stat>Anova>AnalysisofMeansResponse=ClaimsFactor =RegionOkANOVA:Stat>ANOVA>TwoWayResponse=ClaimsRowFactor=QtrColumnFactor=RegionOKTwo-wayAnalysisofVarianceAnalysisofVarianceforClaimsSource DF SS MS F PQtr 1 1299.6 1299.6 55.66 0.002Region 4 10.6 2.6 0.11 0.971Error 4 93.4 23.4Total 9 1403.6練習:巧克力豆/投訴計數(shù)ANOM:Two-wayAn銷售拜訪練習
3002001000100806040200銷售經理瑪麗,把銷售拜訪頻率作為她的綠帶項目,原先的黑帶為此設定了規(guī)范,即每周每個銷售員打35個電話影響銷量的KPIV’s產品庫存情況有競爭力的價格產品質量銷售拜訪頻率廣告其它KPIVS風險系數(shù)百分比銷售拜訪練習30020010001008060理解不同的客戶經理,經驗,時間,客戶類型,和銷售區(qū)域對
每周銷售拜訪次數(shù)的影響。學習目標:PIVs客戶經理經驗時間客戶類型銷售區(qū)域KPOV每周銷售拜訪次數(shù)小結一下如何順利完成這個練習,
以保證收集正確的數(shù)據(jù)!銷售拜訪練習理解不同的客戶經理,經驗,時間,客戶類型,和銷銷售員 財務周 銷售區(qū)域 經驗水平 客戶類型 銷售拜訪次數(shù)1-NancyKing 1 1-北區(qū) 1-沒有經驗的 1-小型 242-SueSmith 1 2-南區(qū) 3-有經驗的 2-中等 353-JackEnjill 1 3-東區(qū) 2-中等的 3-大型 254-GeorgeHow 1 4-西區(qū) 2 1 235-MikeSell 1 1 3 2 326-DanDollar 1 2 1 3 227-JimJones 1 3 3 1 301 2 1 1 2 222 2 2 3 3 363 2 3 2 1 274 2 4 2 2 265 2 1 3 3 336 2 2 1 1 247 2 3 3 2 321 3 1 1 3 272 3 2 3 1 393 3 3 2 2 364 3 4 2 3 385 3 1 3 1 406 3 2 1 2 287 3 3 3 3 351 4 1 1 1 302 4 2 3 2 423 4 3 2 3 384 4 4 2 1 375 4 1 3 2 456 4 2 1 3 307 4 3 3 1 40銷售拜訪小結銷售員 財務周 銷售區(qū)域 經驗水平 客戶類型 銷售拜訪次數(shù)銷你的假設是什么?你有什么類型的數(shù)據(jù)?你需要做的第一件事是什么?你將做何種假設檢驗?你檢驗哪些因子(變量)?你的假設是什么?首先你將計數(shù)型數(shù)據(jù)轉換成連續(xù)數(shù)據(jù)...轉換方式:原來計數(shù)型數(shù)據(jù)取平方根首先你將計數(shù)型數(shù)據(jù)轉換成連續(xù)數(shù)據(jù)...轉換方式:原來計數(shù)型以銷售員為因子的ANOVA圖…Stat>ANOVA>ANOMResponse=SRSalesCallsFactor1=Salesperson每周銷售拜訪次數(shù)銷售員平均值以銷售員為因子的ANOVA圖…Stat>ANOVA>ANOM以經驗為因子的ANOVA圖每周銷售拜訪次數(shù)經驗平均值以經驗為因子的ANOVA圖每周銷售拜訪次數(shù)經驗平均值以財務周為因子的ANOVA圖財務周平均值每周銷售拜訪次數(shù)以財務周為因子的ANOVA圖財務周平均值每周銷售拜訪次數(shù)以客戶類型為因子的ANOVA客戶類型平均值每周銷售拜訪次數(shù)以客戶類型為因子的ANOVA客戶類型平均值每周銷售拜訪次數(shù)以銷售區(qū)域為因子的ANOVA圖銷售區(qū)域平均值每周銷售拜訪次數(shù)以銷售區(qū)域為因子的ANOVA圖銷售區(qū)域平均值每周銷售拜訪次AnalysisofVariance:ANOVA單因子ANOVA:檢驗有一個變量時,總體平均值是否相等雙因子ANOVA:檢驗有兩個變量時,總體平均值是否相等ANOVA-GeneralLinearModel:檢驗有兩個以上變量時,總體平均值是否相等AnalysisofVariance:ANOVA單因子運行Anova(GLM-GeneralLinearModel)...確保對轉換后的數(shù)據(jù)運行Anova!Salesperson,SalesRegion,ExperienceLevel,FW,CustType運行Anova(GLM-GeneralLinear結論銷售拜訪的Anova結果統(tǒng)計結論基于95%的置信度!!!結論銷售拜訪的Anova結果統(tǒng)計結論基于95%的置信度!!!將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)Stat>ANOVA>1-Way,2-Way,orGLM可計數(shù)數(shù)據(jù)比例數(shù)(樣本數(shù)N是常數(shù))比例數(shù)(樣本數(shù)N不是常數(shù))邏輯變量比例分析Stat>ANOVA>AnalysisofMeansBinomial(np>5)比例分析Stat>ControlChart>P(np>5)可計數(shù)數(shù)據(jù)分析Stat>ControlChart>U或比例分析Stat>ControlChart>P(np>5)或將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)可計數(shù)數(shù)據(jù)比例數(shù)(樣本數(shù)N是比例數(shù)的練習:某公司生產的節(jié)日燈。這種燈有綠,紅,桔黃,黃,淡褐,深褐色。你可以用巧克力豆做這個練習。客戶關心的是在每一個包裝箱里不同顏色燈泡的數(shù)量一致。而在公司生產過程中,有多個工作臺生產各種顏色的燈泡。你的小組決定研究一下在你們的工作臺產生的結果的否有別于其它工作臺。在每個工作臺抽取30只燈泡,記錄黃色燈的數(shù)量。作如下的分析;用記錄的數(shù)據(jù)分析每個工作臺黃色節(jié)日燈的比例是否相同。運用Minitab。比例數(shù)的練習:工作臺#抽樣數(shù)#黃色燈的數(shù)量工作臺#抽樣數(shù)#黃色燈的數(shù)量用Minitab: ANOVA>AnalysisofMeans
選擇Binomial
樣本大小30缺陷比例用Minitab:缺陷比例比例數(shù)分析:N不是常數(shù)將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)Stat>ANOVA>1-Way,2-Way,orGLM計數(shù)型數(shù)據(jù)比例數(shù)(樣本數(shù)N是常數(shù))比例數(shù)(樣本數(shù)N不是常數(shù))比例分析Stat>ANOVA>AnalysisofMeansBinomial(np>5)比例分析Stat>ControlChart>P(np>5)比例數(shù)分析:N不是常數(shù)將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)計數(shù)型比例數(shù)分析:N不是常數(shù)STAT>CONTROLCHART>P#1#2#3#1輸入結果數(shù)據(jù)所在列#2輸入樣本大小所在列#3輸入Hα值以替代3西格碼控制限比例分析比例數(shù)分析:N不是常數(shù)#1#2#3比例分析樣本數(shù)95%2 1.386 3 1.914 2.145 2.296 2.397 2.488 2.549 2.6010 2.6611 2.7012 2.7413 2.7714 2.7915 2.83H值選擇95%置信度下相應的H值樣本數(shù)95%H值選擇95%置信度下相應的H值比例數(shù)分析N不是常數(shù)比例數(shù)分析N不是常數(shù)用假設檢驗方法時,有得出錯誤結論的風險!假設檢驗-錯誤類型原假設是真原假設是假接受原假設拒絕原假設結論正確第I類錯誤結論正確第II類錯誤一般可能性為.20接受Ho第I類錯誤的概率為.第II類錯誤的概率為一般可能性為.05接受Ha用假設檢驗方法時,有得出錯誤結論的風險!假設檢驗-錯誤例子-選擇適當?shù)募僭O檢驗A)電視廣告之后,海飛絲的銷售有統(tǒng)計上的顯著增加嗎?B)用2種不同的促銷方法(送禮物和降價),腦白金的銷量有顯著差異嗎?C)比較三種彩管產品的訂單完成率(相等的樣本大小和相同的測量程序及標準)。D)印尼包裝紙的質量比規(guī)范要求的好嗎?例子-選擇適當?shù)募僭O檢驗A)電視廣告之后,海飛絲的銷回答問題1)在比例圖分析中判定限的改變顯示:
a)樣本尺寸不是常數(shù)
b)缺陷率不是常數(shù)
c)該圖無效
d)上面都不對2)對/錯Anova能夠被用于計數(shù)型原始數(shù)據(jù)的分析3)如果我想估計星期六的天氣對打高爾夫球的人數(shù)的影響,我分別記錄了幾個好天氣和壞天氣的數(shù)據(jù),應采用的假設檢驗是:
a)2個樣本的T檢驗
b)比例數(shù)分析
c)記數(shù)型數(shù)據(jù)的ANOVA d)Tukey’s的快速檢驗4)解釋下列比例分析 321353025
C=32.001.9SL=35.12-1.9SL=28.88ProportionDefectiveShift回答問題1)在比例圖分析中判定限的改變顯示:3213530關于假設檢驗知道些什么?1)Ahypothesistesthelpstoobjectivelydecidewhetherornotthereisa_____________.
假設檢驗幫助客觀地判斷是否存在__________。2)The____________hypothesisisastatementofnoeffectornodifference.__________假設是聲明無影響或無差異。3)ForPvalues>0.05we(failtoreject,reject)thenullhypothesis.
如果P值>0.05,我們(接受,拒絕)原假設。4)Werejectthenullhypothesisifdatalies(outside,inside)thedecisionlimits.
如果數(shù)據(jù)位于判定限(之外,之內),我們拒絕原假設。5)Thetypeofdataandnumberof______________helptodeterminewhichtesttoconductinminitab.
數(shù)據(jù)類型和_______的個數(shù)幫助決定執(zhí)行minitab中的何種檢驗。6)Whattypeoftestisusedtocomparethemeanoftworelatedpopulations?
哪種類型的檢驗被用于比較兩個相關總體的平均值?關于假設檢驗知道些什么?1)Ahypothesist附錄附錄取樣置信區(qū)間/假設檢驗取樣置信區(qū)間/假設檢驗什么都不知道–從這兒開始!置信區(qū)間“太寬”或無法區(qū)分有顯著差異的過程
平均數(shù)標準偏差缺陷率(P)5-1025-30100而且nP35統(tǒng)計概念 最少的樣本大小已有數(shù)據(jù)–從這兒開始!計算樣本大小計算樣本大小置信區(qū)間“太寬”或無法區(qū)分有顯著差異的過程決定樣本大小-一個反復的過程取樣置信區(qū)間取樣置信區(qū)間什么都不知道–從這兒開始!置信區(qū)間“ 其中:
n=樣本大小 p=平均缺陷率 Ha=查表值,a通常取0.05 E=估計誤差比例數(shù)計算樣本大小的公式與數(shù)據(jù)類型有關計數(shù)型數(shù)據(jù)連續(xù)數(shù)據(jù)(平均數(shù)) 這里: n=續(xù)計數(shù)的次數(shù) Ha=查表值,a通常取0.05 C=平均數(shù) E=估計誤差nEH=é?êacù?ú2* 這里: n=樣本大小 Ha=查表值,a通常取0.05 s=標準偏差(或其估計值) E=估計誤差En=é?êù?úHa*2s 其中: n=樣本大小比例數(shù)計算樣本大小的公式與數(shù)據(jù)類型試驗統(tǒng)計表,(H0.05)1 1.962 2.243 2.394 2.495 2.576 2.637 2.688 2.739 2.7710 2.8012 2.8615 2.9318 2.9820 3.0225 3.0930 3.1635 3.1940 3.2250 3.2975 3.40100 3.48平均值或比例數(shù)的個數(shù)H0.05平均值或比例數(shù)的個數(shù)H0.05表示:測試的平均數(shù)或比例數(shù)(總體)的個數(shù)表示:H0.05用于邏輯或連續(xù)數(shù)據(jù)樣本大小的
值試驗統(tǒng)計表,(H0.05)12 2.86平均值或比例數(shù)的個樣本大小取決于你的...你必須決定在某一置信度下可以接受的誤差,或者說怎樣的區(qū)別才會被認為是有顯著差異的。如果你不知道你可以接受的誤差…你可以從用1/2標準偏差開始數(shù)據(jù)與你的取樣方法有很大關聯(lián)…如果樣本不能代表總體,你不會得到正確的答案!!!最重要的是你的專業(yè)判斷...正確地取樣(有代表性和適當?shù)臉颖敬笮?樣本大小取決于你的...你必須決定在某一置信度下可以接受的誤邏輯數(shù)據(jù):比例數(shù)的樣本大小配貨中心打算采用可提高定單正確性的新系統(tǒng)。分別用新、舊系統(tǒng)處100個定單,我們定義定單準確性1%的改進為顯著的改進,我們可以使用新系統(tǒng)嗎?
舊系統(tǒng) 新系統(tǒng)正確的定單數(shù) 97/100 98/100ANOM顯示沒有顯著區(qū)別....因為我們
的樣本大小不足以區(qū)別1%的改進我們能覺察到的最小的改進是4%!!!邏輯數(shù)據(jù):比例數(shù)的樣本大小配貨中心打算采用可提高定單正確但是,
如果我們先計算樣本大小呢...從歷史數(shù)據(jù),I我知道p=97%
根據(jù)我的專業(yè)知識,我知道如果改進達到%(E=1%)我會使用新1查表知道,H=2.24 n=(0.97*(1-0.97))*(2.24/0.01)**2=1460但是,如果我們先計算樣本大小呢...從歷史數(shù)據(jù),I用較大的樣本重做假設檢驗... 舊系統(tǒng) 新系統(tǒng)正確的定單數(shù)1445/1500 1465/1500新、舊系統(tǒng)各取1500個定單...在95%置信度下有顯著的差別!!!OldSystemNewSystem0.9750.9700.9650.9761040.9638960.97ProportionAccurateOrdersAnalysisofMeans-AccurateOrders用較大的樣本重做假設檢驗...新、舊系統(tǒng)各取1500個定單邏輯數(shù)據(jù):可計數(shù)數(shù)據(jù)的樣本大小每個倉庫每8小時平均的發(fā)貨數(shù)是17個定單.LLC正在試行一種新的發(fā)貨的流程,但可能會增加每個倉庫完成的定單發(fā)貨數(shù)。有兩種可能的新流程,但
都會顯著提高成本。只有在新系統(tǒng)使每個倉庫完成的定單發(fā)貨數(shù)至少增加3次的前提下,成本才與現(xiàn)流程相當。問我們需要收集多少天的數(shù)據(jù)?
c=17 E=3 Ha=2.39
n=17*(2.39/3)**2=10.8或11days收集11天的數(shù)據(jù)...nEH=é?êacù?ú2*邏輯數(shù)據(jù):可計數(shù)數(shù)據(jù)的樣本大小每個倉庫每8小時平均的發(fā)貨Day Old New1 New21 17 19 202 16 18 193 18 19 214 19 17 225 15 17 186 17 19 207 16 18 198 15 17 189 17 19 2010 18 20 2211 19 21 22SourceDFSeqSSAdjSSAdjMSFPC820.300660.300660.150336.960.003Error300.647880.647880.02160Total320.94854注:可轉換的可計數(shù)數(shù)據(jù)的Anova表格邏輯數(shù)據(jù):可計數(shù)數(shù)據(jù)的樣本大小結論:我們要實行第二種新流程!!!每個倉庫完成的定單發(fā)貨數(shù)Day Old New1 New2注:可轉換的可計數(shù)數(shù)據(jù)連續(xù)數(shù)據(jù)的樣本大小MaryAnne,LLC客戶服務負責人,需要估計對客戶查詢的平均反應時間.通過隨機的5個客戶查詢,MaryAnne發(fā)現(xiàn)平均反應時間是20小時,標準偏差是7小時.MaryAnne的估計值允許的誤差必須在5%即1小時以內.問要取多大的樣本?En=é?êùúHa*2ss=7hrsE=1hrHa=1.96n=(7hrs*1.96/1hr)**2=192要使估計值允許的誤差在1小時以內,需收集大約200個查詢數(shù)據(jù)!連續(xù)數(shù)據(jù)的樣本大小MaryAnne,LLC客戶服務負責人MaryAnne收集了隨機取樣的200個客戶查詢反應時間的數(shù)據(jù)并發(fā)現(xiàn):中心值=19.0小時 標準偏差=8小時她計算出在95%置信度下,置信區(qū)間為: x+/-(s*Ha)或19+/-(8*1.96)/14.14
n
反應時間:19+/-1.1小時連續(xù)數(shù)據(jù)的樣本大小MaryAnne收集了隨機取樣的200個客戶查詢反應時間1、有時候讀書是一種巧妙地避開思考的方法。12月-2212月-22Wednesday,December14,20222、閱讀一切好書如同和過去最杰出的人談話。02:11:0902:11:0902:1112/14/20222:11:09AM3、越是沒有本領的就越加自命不凡。12月-2202:11:0902:11Dec-2214-Dec-224、越是無能的人,越喜歡挑剔別人的錯兒。02:11:0902:11:0902:11Wednesday,December14,20225、知人者智,自知者明。勝人者有力,自勝者強。12月-2212月-2202:11:0902:11:09December14,20226、意志堅強的人能把世界放在手中像泥塊一樣任意揉捏。14十二月20222:11:09上午02:11:0912月-227、最具挑戰(zhàn)性的挑戰(zhàn)莫過于提升自我。。十二月222:11上午12月-2202:11December14,20228、業(yè)余生活要有意義,不要越軌。2022/12/142:11:0902:11:0914December20229、一個人即使已登上頂峰,也仍要自強不息。2:11:09上午2:11上午02:11:0912月-2210、你要做多大的事情,就該承受多大的壓力。12/14/20222:11:09AM02:11:0914-12月-2211、自己要先看得起自己,別人才會看得起你。12/14/20222:11AM12/14/20222:11AM12月-2212月-2212、這一秒不放棄,下一秒就會有希望。14-Dec-2214December202212月-2213、無論才能知識多么卓著,如果缺乏熱情,則無異紙上畫餅充饑,無補于事。Wednesday,December14,202214-Dec-2212月-2214、我只是自己不放過自己而已,現(xiàn)在我不會再逼自己眷戀了。12月-2202:11:0914December202202:11謝謝大家1、有時候讀書是一種巧妙地避開思考的方法。12月-2212月假設檢驗二OO四年二月二十五日培訓資料假設檢驗二OO四年二月二十五日培訓資料目標:完成該章你將能夠:1)寫假設檢驗--原假設和備擇假設。2)解釋假設檢驗的結果。熟悉連續(xù)變量和邏輯變量的假設檢驗。目的:目標:熟悉連續(xù)變量和邏輯變量的假設檢驗。目的:情況:在三個不同的銷售區(qū)域使用相同促銷方法,銷售量分別是:A區(qū):1000B區(qū):850C區(qū):700“歷史”的解釋方法:銷售VP給A區(qū)經理較多的獎金。銷售VP考慮換掉C區(qū)經理?!癝ixSigma”解釋的方法:銷售VP問:“在95%置信度下是否有統(tǒng)計上的差異?”回答說:“是的,A區(qū)銷售與總平均值有統(tǒng)計上的差異。”VP研究A區(qū)的最佳實踐。情況:在三個不同的銷售區(qū)域使用相同促銷方法,銷售量分別統(tǒng)計“能夠”...推論兩組數(shù)據(jù)的平均值是否相同推論兩組數(shù)據(jù)的偏差是否相同推論兩組數(shù)據(jù)的缺陷率是否相同統(tǒng)計“不能”…直接說那一個較好
告訴我們如何解決問題做出決定確定規(guī)范或極限統(tǒng)計“能夠”...統(tǒng)計“不能”…總體:整個集合的全體特征樣本:具有總體特征的子集根據(jù)樣本確定總體!!!為什幺需要假設檢驗?總體:整個集合的全體特征樣本:具有總體特征的子集根據(jù)樣本確定總體參數(shù)與樣本統(tǒng)計總體參數(shù)樣本統(tǒng)計x平均值標準偏差比例(百分數(shù))spP1.總體參數(shù)(值)是固定的,但不知道。2.樣本統(tǒng)計是用來估計總體值的。假設是對總體值進行闡述,而不是對樣本統(tǒng)計??傮w參數(shù)與樣本統(tǒng)計總體參數(shù)樣本統(tǒng)計x平均值標準偏差比例置信區(qū)間使用置信區(qū)間我們可以利用樣本估算總體的平均值和標準方差置信區(qū)間是基于下列要素的取值范圍:
樣本平均值
(X)和樣本標準方差(s)置信區(qū)間的取值范圍會包括:
總體平均值()及總體標準方差()。在風險水平一定的情況下,樣本平均值周邊的多大范圍能將總體平均值包括在內?置信區(qū)間置信區(qū)間置信區(qū)間使用置信區(qū)間我們可以利用樣本估算總體的平均值和標準置信區(qū)間....置信限...置信下限置信上限置信區(qū)間真實的總體平均值和標準方差可以落在置信上限和下限之間的任何一點!!!置信限是置信區(qū)間內的最大值和最小值!置信限置信區(qū)間....置信限...置信下限置信上限置信區(qū)間真實的總置信度是希望讓總體平均值和標準方差落在根據(jù)樣本計算出的置信區(qū)間內的概率大小!6西格瑪和業(yè)內通常使用95%的置信度,這意味著:在95%的情況下總體平均值和標準方差落在置信區(qū)間內在5%的情況下(alpha風險),總體平均值落在置信區(qū)間外。如果我希望提高信心
(99%的置信度).……或者承擔更多風險
(75%的置信度).……真實情景下,需要明確愿意承受的風險度…!置信度置信度是希望讓總體平均值和標準方差落在根據(jù)樣本計算出的置信區(qū)置信度=承擔業(yè)務風險的意愿高風險<75%中等風險~85%低風險>95%KmartLFLWatts舉例X軸LSLX軸
USL1Watt的增加=Kmart發(fā)生1億美元的成本/照明公司的擔保風險Kmart需求60.860.961.061.1X軸估計AverageWatts置信水平
樣本容99% 25995% 13285% 5375% 23故障幾率置信度=承擔業(yè)務風險的意愿高風險中等風險低風險Kmart假設檢驗:依據(jù)數(shù)據(jù)進行決策的核心實際答案統(tǒng)計問題數(shù)據(jù)知識“經驗”本能實際問題統(tǒng)計答案假設檢驗:實際答案統(tǒng)計問題數(shù)據(jù)知識“經驗”本能實際問題統(tǒng)計答1.所有流程均具有變動性2.從給定流程取得的樣本可能有所不同3.如何區(qū)分基于樣本的“幾率性”差異和真正的流程差異?1.所有流程均具有變動性2.從給定流程取得的樣本可能有所真實情況HoHa判決HoHa無罪,監(jiān)禁有罪,釋放無罪釋放有罪,監(jiān)禁無罪有罪釋放監(jiān)禁真實情況接受HoHaHoHaI類錯誤aII類錯誤b正確判決正確判決真實情況HoHa判決HoHa無罪,監(jiān)禁有罪,釋放無罪釋放有罪abHoHaa和b處在不同區(qū)域;故我們不可能同時犯I類和II類錯誤臨界限制abHoHaa和b處在不同區(qū)域;故我們不可能同時犯I何時需要假設檢驗?如果想分析輸入以確定是否影響輸出輸入A輸入C輸入B過程發(fā)票輸出如果在“改進”實施前想確認一下。任何時侯如果想根據(jù)樣本作客觀的判斷,就用假設檢驗!!!如果想知道兩個不同的過程產生的結果是否相同何時需要假設檢驗?如果想分析輸入以確定是否影響輸出輸入A輸入假設檢驗路線圖數(shù)據(jù)類型連續(xù)變量數(shù)據(jù)正態(tài)正態(tài)理論檢驗平均值的檢驗.標準偏差檢驗數(shù)據(jù)非正態(tài)非參數(shù)的檢驗位置的檢驗離數(shù)的檢驗邏輯變量比例數(shù)可計數(shù)數(shù)據(jù)假設檢驗路線圖數(shù)據(jù)類型連續(xù)變量數(shù)據(jù)正態(tài)正態(tài)理論檢驗平均值的常用的假設檢驗連續(xù)變量平均值的檢驗標準偏差的檢驗一個樣本的T檢驗樣本相關成對T檢驗樣本不相關二個樣本的T檢驗結構圖平均值的分析ANOM無結構圖均方差的分析ANOVA一個總體兩個總體三個或以上總體標準偏差的CHI平方檢驗均方差的同一性BARTLETT'STEST.LEVENE'STEST.一個總體兩個總體三個或以上總體標準偏差比率的F檢驗Tukey的快速檢驗常用的假設檢驗連續(xù)變量平均值的檢驗標準偏差的檢驗一個樣本的T將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)Stat>ANOVA>1-Way,2-Way,orGLM邏輯變量比例分析Stat>ANOVA>AnalysisofMeansBinomial(np>5)比例分析Stat>ControlChart>P(np>5)可計數(shù)數(shù)據(jù)分析Stat>ControlChart>U或比例分析Stat>ControlChart>P(np>5)或可計數(shù)數(shù)據(jù)比例數(shù)(樣本數(shù)N是常數(shù))比例數(shù)(樣本數(shù)N不是常數(shù))將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)邏輯變量比例分析比例分析可計平均值分析:FEDCBA0.400.350.300.4113260.2961740.35375
Hit
Ratio
平均值圖形分析ANOM是檢驗總體平均值的圖形檢驗平均值分析:FEDCBA0.400.350.300.4113方差分析:ANOVA單因子ANOVA:檢驗有一個變量時,總體平均值是否相等雙因子ANOVA:檢驗有兩個變量時,總體平均值是否相等ANOVA-GeneralLinearModel:檢驗有兩個以上變量時,總體平均值是否相等方差分析:ANOVA單因子ANOVA:檢驗有一個變量時,總利用樣本數(shù)據(jù)提供的信息來接受或拒絕一個關于總體參數(shù)(平均值,標準偏差,比例數(shù),可計數(shù)數(shù)據(jù))的陳述(假設)的統(tǒng)計推論?!霸僭O”HO,是對總體參數(shù)的一個陳述,通常HO是“沒影響”或“沒差別”的陳述。原假設“備擇假設”Ha或H1,是Ho被拒絕時可被接受的陳述,除非試驗結果強烈反對Ho,我們應該接受Ho。原假設:在統(tǒng)計證據(jù)證明你有罪前,你是清白的。利用樣本數(shù)據(jù)提供的信息來接受或拒絕一個關于總體“原假設”數(shù)據(jù)的收集與分析(Minitab)結果: p值>0.05OR 在判定限以內 不拒絕H0 P值<0.05OR 超出判定限 拒絕H0結論問題闡述列出將要采取的行動Ifp<0.05或超出判定限那幺....H0H日常語言統(tǒng)計語言沒有差別有差別或一個比另一個好=,=/>,or=/<=,>,or<數(shù)據(jù)的收集與分析(Minitab)結果: p值>0.接受Ho拒絕Ho在判定限內超出判定限用P值用判定限P值>0.05P值<0.05TwosampleTforC1vsC4NMeanStDevSEMeanC1109.4100.3570.11C4108.4600.3200.1095%CIformuC1-muC4:(0.63,1.27)T-TestmuC1=muC4(vsnot=):T=6.26P=0.0000DF=17TwosampleTforC1vsC2NMeanStDevSEMeanC1109.4100.3570.11C2109.4200.4290.1495%CIformuC1-muC2:(-0.38,0.36)T-TestmuC1=muC2(vsnot=):T=-0.06P=0.96DF=17統(tǒng)計語言實際語言“沒有足夠的數(shù)據(jù)顯示差別”“看起來是有差別”接受Ho拒絕Ho在判定限內超出判定限用P值用判定限P值假設陳述練習我們收集兩個發(fā)貨中心關于定單滿足率的數(shù)據(jù),想知道這兩個發(fā)貨中心的定單滿足率是否有差異寫一個合適的假設檢驗假設陳述練習我們收集兩個發(fā)貨中心關于定單滿足率的數(shù)據(jù),想知數(shù)據(jù)收集與分析(Minitab)Result: 在判定限以內 不拒絕H0
超出判定限 拒絕H0問題闡述
H0H日常語言統(tǒng)計語言結論數(shù)據(jù)收集與分析(Minitab)Result: 在數(shù)據(jù)收集與分析(Minitab)結果:在判定限以內不拒絕H0
超出判定限拒絕H0問題闡述H0H日常語言統(tǒng)計語言結論定單滿足率沒有差異P1=P2定單滿足率有差異P1<or>P2數(shù)據(jù)收集與分析(Minitab)結果:在判定限以內配貨中心正在考慮使用一種新的包裝材料現(xiàn)在,包裹燈泡使用的是漂白過的,對環(huán)境有污染的紙質材料,備選的包裝材料是一種對環(huán)境沒有污染,超柔,未經漂白的紙我們要做一項實驗來測試超柔、未經漂白的紙是否能有效減少破損;只有在證明超柔紙能有效減少破損的情況下才會被替代使用寫一個合適的假設檢驗假設陳述練習配貨中心正在考慮使用一種新的包裝材料假設陳述練習數(shù)據(jù)收集與分析(Minitab)結果: 在判定限以內 不拒絕H0
超出判定限 拒絕H0問題闡述
H0H日常語言統(tǒng)計語言結論數(shù)據(jù)收集與分析(Minitab)結果: 在判定限以內 數(shù)據(jù)收集與分析(Minitab)結果: 在判定限以內 不拒絕H0
超出判定限 拒絕H0問題闡述
H0H日常語言統(tǒng)計語言結論不同的包裝材料對破損沒有影響不同的包裝材料對破損有影響B(tài)1=B2B1<or>B2數(shù)據(jù)收集與分析(Minitab)結果: 在判定限以練習:巧克力豆/投訴計數(shù)一個綠帶項目主要目的是從第二季度開始減少每個地區(qū)的投訴次數(shù)。每張桌子發(fā)一勺巧克力豆,其數(shù)量代表每個區(qū)域第一季度收到的投訴次數(shù)。每桌選一位代表在教室前面的黑板上計下投訴的次數(shù)。其后,每桌會收到另外一勺巧克力豆,其數(shù)量代表每個銷售區(qū)域第二季度收到的投訴次數(shù)。請在前面的黑板上同樣計下第二季度的投訴次數(shù)請分析以下按季度和地區(qū)的數(shù)據(jù),以確認綠帶項目是否成功銷售地區(qū) 季度 投訴次數(shù)Region1 1 Region1 2 Region2 1 Region2 2Region3 1ETC. 練習:巧克力豆/投訴計數(shù)一個綠帶項目主要目的是從第二練習:巧克力豆/投訴計數(shù)你的假設是什么?你有什么類型的數(shù)據(jù)?你需要做的第一件事是什么?你將做何種假設檢驗?你檢驗哪些因子(變量)?練習:巧克力豆/投訴計數(shù)你的假設是什么?練習:巧克力豆/投訴計數(shù)用Minitab將計數(shù)型數(shù)據(jù)轉換為連續(xù)數(shù)據(jù)象左表一樣排列數(shù)據(jù)Calculate>CalculatorStoreResultinVariable=ClaimsExpression=SquareRoot(SQRT)Number=Claims可得到一列連續(xù)數(shù)據(jù),運行ANOM&ANOVA練習:巧克力豆/投訴計數(shù)用Minitab將計數(shù)型數(shù)據(jù)轉練習:巧克力豆/投訴計數(shù)ANOM:Stat>Anova>AnalysisofMeansResponse=ClaimsFactor =RegionOkANOVA:Stat>ANOVA>TwoWayResponse=ClaimsRowFactor=QtrColumnFactor=RegionOKTwo-wayAnalysisofVarianceAnalysisofVarianceforClaimsSource DF SS MS F PQtr 1 1299.6 1299.6 55.66 0.002Region 4 10.6 2.6 0.11 0.971Error 4 93.4 23.4Total 9 1403.6練習:巧克力豆/投訴計數(shù)ANOM:Two-wayAn銷售拜訪練習
3002001000100806040200銷售經理瑪麗,把銷售拜訪頻率作為她的綠帶項目,原先的黑帶為此設定了規(guī)范,即每周每個銷售員打35個電話影響銷量的KPIV’s產品庫存情況有競爭力的價格產品質量銷售拜訪頻率廣告其它KPIVS風險系數(shù)百分比銷售拜訪練習30020010001008060理解不同的客戶經理,經驗,時間,客戶類型,和銷售區(qū)域對
每周銷售拜訪次數(shù)的影響。學習目標:PIVs客戶經理經驗時間客戶類型銷售區(qū)域KPOV每周銷售拜訪次數(shù)小結一下如何順利完成這個練習,
以保證收集正確的數(shù)據(jù)!銷售拜訪練習理解不同的客戶經理,經驗,時間,客戶類型,和銷銷售員 財務周 銷售區(qū)域 經驗水平 客戶類型 銷售拜訪次數(shù)1-NancyKing 1 1-北區(qū) 1-沒有經驗的 1-小型 242-SueSmith 1 2-南區(qū) 3-有經驗的 2-中等 353-JackEnjill 1 3-東區(qū) 2-中等的 3-大型 254-GeorgeHow 1 4-西區(qū) 2 1 235-MikeSell 1 1 3 2 326-DanDollar 1 2 1 3 227-JimJones 1 3 3 1 301 2 1 1 2 222 2 2 3 3 363 2 3 2 1 274 2 4 2 2 265 2 1 3 3 336 2 2 1 1 247 2 3 3 2 321 3 1 1 3 272 3 2 3 1 393 3 3 2 2 364 3 4 2 3 385 3 1 3 1 406 3 2 1 2 287 3 3 3 3 351 4 1 1 1 302 4 2 3 2 423 4 3 2 3 384 4 4 2 1 375 4 1 3 2 456 4 2 1 3 307 4 3 3 1 40銷售拜訪小結銷售員 財務周 銷售區(qū)域 經驗水平 客戶類型 銷售拜訪次數(shù)銷你的假設是什么?你有什么類型的數(shù)據(jù)?你需要做的第一件事是什么?你將做何種假設檢驗?你檢驗哪些因子(變量)?你的假設是什么?首先你將計數(shù)型數(shù)據(jù)轉換成連續(xù)數(shù)據(jù)...轉換方式:原來計數(shù)型數(shù)據(jù)取平方根首先你將計數(shù)型數(shù)據(jù)轉換成連續(xù)數(shù)據(jù)...轉換方式:原來計數(shù)型以銷售員為因子的ANOVA圖…Stat>ANOVA>ANOMResponse=SRSalesCallsFactor1=Salesperson每周銷售拜訪次數(shù)銷售員平均值以銷售員為因子的ANOVA圖…Stat>ANOVA>ANOM以經驗為因子的ANOVA圖每周銷售拜訪次數(shù)經驗平均值以經驗為因子的ANOVA圖每周銷售拜訪次數(shù)經驗平均值以財務周為因子的ANOVA圖財務周平均值每周銷售拜訪次數(shù)以財務周為因子的ANOVA圖財務周平均值每周銷售拜訪次數(shù)以客戶類型為因子的ANOVA客戶類型平均值每周銷售拜訪次數(shù)以客戶類型為因子的ANOVA客戶類型平均值每周銷售拜訪次數(shù)以銷售區(qū)域為因子的ANOVA圖銷售區(qū)域平均值每周銷售拜訪次數(shù)以銷售區(qū)域為因子的ANOVA圖銷售區(qū)域平均值每周銷售拜訪次AnalysisofVariance:ANOVA單因子ANOVA:檢驗有一個變量時,總體平均值是否相等雙因子ANOVA:檢驗有兩個變量時,總體平均值是否相等ANOVA-GeneralLinearModel:檢驗有兩個以上變量時,總體平均值是否相等AnalysisofVariance:ANOVA單因子運行Anova(GLM-GeneralLinearModel)...確保對轉換后的數(shù)據(jù)運行Anova!Salesperson,SalesRegion,ExperienceLevel,FW,CustType運行Anova(GLM-GeneralLinear結論銷售拜訪的Anova結果統(tǒng)計結論基于95%的置信度!!!結論銷售拜訪的Anova結果統(tǒng)計結論基于95%的置信度!!!將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)Stat>ANOVA>1-Way,2-Way,orGLM可計數(shù)數(shù)據(jù)比例數(shù)(樣本數(shù)N是常數(shù))比例數(shù)(樣本數(shù)N不是常數(shù))邏輯變量比例分析Stat>ANOVA>AnalysisofMeansBinomial(np>5)比例分析Stat>ControlChart>P(np>5)可計數(shù)數(shù)據(jù)分析Stat>ControlChart>U或比例分析Stat>ControlChart>P(np>5)或將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)可計數(shù)數(shù)據(jù)比例數(shù)(樣本數(shù)N是比例數(shù)的練習:某公司生產的節(jié)日燈。這種燈有綠,紅,桔黃,黃,淡褐,深褐色。你可以用巧克力豆做這個練習??蛻絷P心的是在每一個包裝箱里不同顏色燈泡的數(shù)量一致。而在公司生產過程中,有多個工作臺生產各種顏色的燈泡。你的小組決定研究一下在你們的工作臺產生的結果的否有別于其它工作臺。在每個工作臺抽取30只燈泡,記錄黃色燈的數(shù)量。作如下的分析;用記錄的數(shù)據(jù)分析每個工作臺黃色節(jié)日燈的比例是否相同。運用Minitab。比例數(shù)的練習:工作臺#抽樣數(shù)#黃色燈的數(shù)量工作臺#抽樣數(shù)#黃色燈的數(shù)量用Minitab: ANOVA>AnalysisofMeans
選擇Binomial
樣本大小30缺陷比例用Minitab:缺陷比例比例數(shù)分析:N不是常數(shù)將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)Stat>ANOVA>1-Way,2-Way,orGLM計數(shù)型數(shù)據(jù)比例數(shù)(樣本數(shù)N是常數(shù))比例數(shù)(樣本數(shù)N不是常數(shù))比例分析Stat>ANOVA>AnalysisofMeansBinomial(np>5)比例分析Stat>ControlChart>P(np>5)比例數(shù)分析:N不是常數(shù)將數(shù)據(jù)轉變成連續(xù)數(shù)據(jù)(開平方根)計數(shù)型比例數(shù)分析:N不是常數(shù)STAT>CONTROLCHART>P#1#2#3#1輸入結果數(shù)據(jù)所在列#2輸入樣本大小所在列#3輸入Hα值以替代3西格碼控制限比例分析比例數(shù)分析:N不是常數(shù)#1#2#3比例分析樣本數(shù)95%2 1.386 3 1.914 2.145 2.296 2.397 2.488 2.549 2.6010 2.6611 2.7012 2.7413 2.7714 2.7915 2.83H值選擇95%置信度下相應的H值樣本數(shù)95%H值選擇95%置信度下相應的H值比例數(shù)分析N不是常數(shù)比例數(shù)分析N不是常數(shù)用假設檢驗方法時,有得出錯誤結論的風險!假設檢驗-錯誤類型原假設是真原假設是假接受原假設拒絕原假設結論正確第I類錯誤結論正確第II類錯誤一般可能性為.20接受Ho第I類錯誤的概率為.第II類錯誤的概率為一般可能性為.05接受Ha用假設檢驗方法時,有得出錯誤結論的風險!假設檢驗-錯誤例子-選擇適當?shù)募僭O檢驗A)電視廣告之后,海飛絲的銷售有統(tǒng)計上的顯著增加嗎?B)用2種不同的促銷方法(送禮物和降價),腦白金的銷量有顯著差異嗎?C)比較三種彩管產品的訂單完成率(相等的樣本大小和相同的測量程序及標準)。D)印尼包裝紙的質量比規(guī)范要求的好嗎?例子-選擇適當?shù)募僭O檢驗A)電視廣告之后,海飛絲的銷回答問題1)在比例圖分析中判定限的改變顯示:
a)樣本尺寸不是常數(shù)
b)缺陷率不是常數(shù)
c)該圖無效
d)上面都不對2)對/錯Anova能夠被用于計數(shù)型原始數(shù)據(jù)的分析3)如果我想估計星期六的天氣對打高爾夫球的人數(shù)的影響,我分別記錄了幾個好天氣和壞天氣的數(shù)據(jù),應采用的假設檢驗是:
a)2個樣本的T檢驗
b)比例數(shù)分析
c)記數(shù)型數(shù)據(jù)的ANOVA d)Tukey’s的快速檢驗4)解釋下列比例分析 321353025
C=32.001.9SL=35.12-1.9SL=28.88ProportionDefectiveShift回答問題1)在比例圖分析中判定限的改變顯示:3213530關于假設檢驗知道些什么?1)Ahypothesistesthelpstoobjectivelydecidewhetherornotthereisa_____________.
假設檢驗幫助客觀地判斷是否存在__________。2)The____________hypothesisisastatementofnoeffectornodifference.__________假設是聲明無影響或無差異。3)ForPvalues>0.05we(failtoreject,reject)thenullhypothesis.
如果P值>0.05,我們(接受,拒絕)原假設。4)Werejectthenullhypothesisifdatalies(outside,inside)thedecisionlimits.
如果數(shù)據(jù)位于判定限(之外,之內),我們拒絕原假設。5)Thetypeofdataandnumberof______________helptodeterminewhichtesttoconductinminitab.
數(shù)據(jù)類型和_______的個數(shù)幫助決定執(zhí)行minitab中的何種檢驗。6)Whattypeoftestisusedtocomparethemeanoftworelatedpopulations?
哪種類型的檢驗被用于比較兩個相關總體的平均值?關于假設檢驗知道些什么?1)Ahypothesist附錄附錄取樣置信區(qū)間/假設檢驗取樣置信區(qū)間/假設檢驗什么都不知道–從這兒開始!置信區(qū)間“太寬”或無法區(qū)分有顯著差異的過程
平均數(shù)標準偏差缺陷率(P)5-1025-30100而且nP35統(tǒng)計概念 最少的樣本大小已有數(shù)據(jù)–從這兒開始!計算樣本大小計算樣本大小置信區(qū)間“太寬”或無法區(qū)分有顯著差異的過程決定樣本大小-一個反復的過程取樣置信區(qū)間取樣置信區(qū)間什么都不知道–從這兒開始!置信區(qū)間“ 其中:
n=樣本大小 p=平均缺陷率 Ha=查表值,a通常取0.05 E=估計誤差比例數(shù)計算樣本大小的公式與數(shù)據(jù)類型有關計數(shù)型數(shù)據(jù)連續(xù)數(shù)據(jù)(平均數(shù)) 這里: n=續(xù)計數(shù)的次數(shù) Ha=查表值,a通常取0.05 C=平均數(shù) E=估計誤差nEH=é?êacù?ú2* 這里: n=樣本大小 Ha=查表值,a通常取0.05 s=標準偏差(或其估計值) E=估計誤差En=é?êù?úHa*2s 其中: n=樣本大小比例數(shù)計算樣本大小的公式與數(shù)據(jù)類型試驗統(tǒng)計表,(H0.05)1 1.962 2.243 2.394 2.495 2.576 2.637 2.688 2.739 2.7710 2.8012 2.8615 2.9318 2.9820 3.0225 3.0930 3.1635 3.1940 3.2250 3.2975 3.40100 3.48平均值或比例數(shù)的個數(shù)H0.05平均值或比例數(shù)的個數(shù)H0.05表示:測試的平均數(shù)或比例數(shù)(總體)的個數(shù)表示:H0.05用于邏輯或連續(xù)數(shù)據(jù)樣本大小的
值試驗統(tǒng)計表,(H0.05)12 2.86平均值或比例數(shù)的個樣本大小取決于你的...你必須決定在某一置信度下可以接受的誤差,或者說怎樣的區(qū)別才會被認為是有顯著差異的。如果你不知道你可以接受的誤差…你可以從用1/2標準偏差開始數(shù)據(jù)與你的取樣方法有很大關聯(lián)…如果樣本不能代表總體,你不會得到正確的答案!!!最重要的是你的專業(yè)判斷...正確地取樣(有代
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度年福建省高校教師資格證之高等教育心理學??寄M試題(全優(yōu))
- 2024年度山西省高校教師資格證之高等教育法規(guī)考前沖刺模擬試卷A卷含答案
- 2023年標膠投資申請報告
- 廣東開放大學2024年秋《大學英語2(專)》形考測驗1參考答案
- 第七章 社會主義改革和對外開放課件
- 二年級數(shù)學計算題專項練習1000題匯編集錦
- 2024年輸電設備建設承包協(xié)議
- 2024年工程承包商協(xié)議條款及細則
- 道德與法治八上八上9.2《維護國家安全》教學設計
- 2024年飲食店全職員工聘用協(xié)議
- 區(qū)塊鏈技術在教育行業(yè)的應用場景
- 《西溪濕地博物館》課件
- 2023-2024學年四川省成都市高一上英語期末考試題(含答案和音頻)
- 兒童合唱團管理制度
- 銀行業(yè)波特五力分析報告
- 設立船舶管理服務公司商業(yè)計劃書
- 做頭療計劃書
- 《透視學》全套教學課件
- 房屋建筑工程監(jiān)理規(guī)劃(范本-附帶監(jiān)理細則內容)
- 南京大屠殺-張純如
- 學術道德與倫理
評論
0/150
提交評論