σ統(tǒng)計學(xué)基本概念_第1頁
σ統(tǒng)計學(xué)基本概念_第2頁
σ統(tǒng)計學(xué)基本概念_第3頁
σ統(tǒng)計學(xué)基本概念_第4頁
σ統(tǒng)計學(xué)基本概念_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

(6σ導(dǎo)論)(ZTE-PGB103-V1.5)6σ統(tǒng)計學(xué)基本概念(6σ導(dǎo)論)(ZTE-PGB103-V1.5)6σ統(tǒng)計學(xué)

主要內(nèi)容1.波動(偏差)。2.連續(xù)變量和離散變量。3.平均值,中位數(shù),眾數(shù),極差,方差,標(biāo)準(zhǔn)偏差。4.正態(tài)曲線及中心極限定理。5.簡單圖表分析。6.樣本容量與置信度及置信區(qū)間的關(guān)系。主要內(nèi)容1.波動(偏差)。波動的型式與原因

任何過程都包含隨機(jī)波動(由于一般或普遍原因造成的)和非隨機(jī)波動(由于特殊原因造成的)。時間不合格產(chǎn)品率非隨機(jī)波動歷史水平(

0)最佳水平(

1)在

0(±3

0)

范圍內(nèi)的隨機(jī)波動在

1(±3

1)

范圍內(nèi)的隨機(jī)波動波動的型式與原因任何過程都包含隨機(jī)波動(由于一般或普遍原因普遍原因:過程波動隨時間推移是穩(wěn)定的,可預(yù)測的。處于控制狀態(tài)。原因:固有的或是自然的。例如:垂直向上空(先把硬幣夾垂直)拋擲一枚硬幣,統(tǒng)計硬幣落地后每一面向上的次數(shù)。當(dāng)拋擲次數(shù)很多時,每面向上的次數(shù)大約各占一半,只有微小差異。普遍原因:差異的原因:有風(fēng),每次拋擲動作有微小差異,地面不平整,等等。隨機(jī)波動例如:垂直向上空(先把硬幣夾垂直)拋擲一枚硬幣,特殊原因:過程波動無法預(yù)測。處于失控狀態(tài)。原因:機(jī)器調(diào)整不當(dāng),原材料不合格,操作者本身。目標(biāo):檢測和消除特殊原因。特殊原因:例如:同樣是拋硬幣,拋1000次,AB兩面各自向上的次數(shù)卻相差400多次。原因:操作者每次拋擲時,總時將硬幣平放,且總是將正面朝上,然后拋出。非隨機(jī)波動特殊原因:例如:同樣是拋硬幣,拋1000次,AB兩面原因:數(shù)據(jù)的兩種類型連續(xù)(可變)數(shù)據(jù):使用一種度量單位,比如英寸或小時。連續(xù)(可變)數(shù)據(jù)的例子:電壓、電流、功率、時間、距離、重量、速度。離散(邏輯)數(shù)據(jù):是類別信息,比如“合格”或“不合格”。連續(xù)數(shù)據(jù)離散數(shù)據(jù)數(shù)據(jù)的兩種類型連續(xù)(可變)數(shù)據(jù):使用一種度量單位,比如英寸或統(tǒng)計領(lǐng)域用下列方法處理波動(偏差):描述型統(tǒng)計-用圖表或總結(jié)性的數(shù)字(均值,方差,標(biāo)準(zhǔn)偏差)來描述一系列數(shù)據(jù)。統(tǒng)計推斷-當(dāng)結(jié)果差異可能因為隨機(jī)偏差或不能歸屬為隨機(jī)偏差時所作的決定(假設(shè)檢驗)。試驗設(shè)計-收集并分析數(shù)據(jù)估計過程改變效果。數(shù)理統(tǒng)計的作用統(tǒng)計領(lǐng)域用下列方法處理波動(偏差):描述型統(tǒng)計-用圖表或總結(jié)總體和樣本總體(母體):它是提供數(shù)據(jù)的原始集團(tuán),是所要研究分析的對象的全部??傮w可以是一批產(chǎn)品(由于一批產(chǎn)品的數(shù)量是有限的,故稱為有限總體),也可以是一道工序所生產(chǎn)的所有產(chǎn)品(由于其源源不斷的運行,甚至也包含今后的產(chǎn)品,故稱為無限總體)樣本(子樣,抽樣,試樣):從總體中抽出一部分個體,總體中的這一部分個體稱之為樣本。它是直接被檢測并提供數(shù)據(jù)的諸個體??傮w和樣本總體(母體):連續(xù)數(shù)據(jù)的測量如何描述數(shù)據(jù)的統(tǒng)計特性:measuresoflocation(centraltendency居中程度)measuresofdispersion(variation離散程度)連續(xù)數(shù)據(jù)的測量如何描述數(shù)據(jù)的統(tǒng)計特性:描述數(shù)據(jù)的居中程度Mean均值Median中位數(shù)Mode眾數(shù)Quartiles四分位數(shù)描述數(shù)據(jù)的居中程度Mean均值均值(中心值)均值-總體或樣本的平均值。-

總體的中心值用

表示。-樣本的中心值用x表示。樣本均值的計算公式如下:Themeanisthemostcommonmeasureoflocationorcenterofthedata.均值(中心值)均值-總體或樣本的平均值。中位數(shù)中位數(shù)-反應(yīng)樣本數(shù)據(jù)中間50%的數(shù)值,一系列數(shù)據(jù)由低到高排列后所得到的中間數(shù)。偶數(shù)奇數(shù)中位數(shù)中位數(shù)-反應(yīng)樣本數(shù)據(jù)中間50%的數(shù)眾數(shù)----在一個數(shù)據(jù)集中最頻繁出現(xiàn)的值。眾數(shù)Themodeistheobservationthatoccursmostfrequentlyinthesample.Themodemaybeunique,ortheremaybemorethan1mode.Sometimes,themodemaynotexist.眾數(shù)----在一個數(shù)據(jù)集中最頻繁出現(xiàn)的值。眾數(shù)ThRange極差Variance方差StandardDeviation標(biāo)準(zhǔn)偏差I(lǐng)nterQuartileRange內(nèi)四分位極差描述數(shù)據(jù)的離散程度Range極差描述數(shù)據(jù)的離散程度離散程度的測量用來判定一個數(shù)據(jù)集合離散程度或?qū)挾鹊暮懔砍叨葮O差--在一個樣本中最大值與最小值的差值。

極差=最大值-最小值即:R=x(max)–x(min)方差-

與中心值間距的平方和的平均值。

總體的方差用

表示

樣本的方差用s2

表示標(biāo)準(zhǔn)偏差-是方差的平方根。

總體標(biāo)準(zhǔn)偏差由

表示樣本標(biāo)準(zhǔn)偏差由s表示離散程度的測量用來判定一個數(shù)據(jù)集合離散程度或?qū)挾鹊暮懔砍叨萓nitsofMeasure

直方圖塊的中點中心光滑連接形成曲線大多數(shù)(但不是所有)數(shù)據(jù)是正態(tài)分布或鐘形曲線正態(tài)分布UnitsofMeasure直方圖塊的中點中心光滑連接

在許多實際問題中,我們遇到的隨機(jī)變量都受到為數(shù)眾多的相互獨立的隨機(jī)因素的影響,而每一個因素的影響都是微小的,且這些影響是可以疊加的。

例如,電燈在指定條件下的耐用時間受到原料,工藝,保管等條件的影響,而且每一種因素在正常情形下都是可以疊加的。具有上述特點的隨機(jī)變量一般都可以認(rèn)為是具有正態(tài)分布的隨機(jī)變量。在現(xiàn)實生產(chǎn)生活中,我們所遇到實際問題大多數(shù)都屬于具有正態(tài)分布的隨機(jī)變量,因此在此我們重點討論研究此類分布。正態(tài)分布簡介在許多實際問題中,我們遇到的隨機(jī)變量都受到為數(shù)眾多正態(tài)分布的特點: 1.形態(tài)如鐘; 2.左右對稱; 3.于平均值處分布的頻數(shù)最多。此外,越遠(yuǎn)離平均值,分布的頻數(shù)也越少。正態(tài)分布的要素:1.平均值:決定正態(tài)分布曲線的中心位置;

2.標(biāo)準(zhǔn)偏差:決定正態(tài)分布曲線的“寬窄”.為何要研究正態(tài)分布? 1.它是自然界的一種最基本的最普遍的法則,反應(yīng)了事物內(nèi)在的變化規(guī)律;2.它使我們得以將許多復(fù)雜的事物簡化處理;3.它使我們得以通過少量抽樣來把握全體,從而節(jié)省大量人力,物力,財力和時間。正態(tài)分布簡介正態(tài)分布的特點:為何要研究正態(tài)分布?正態(tài)分布簡介正態(tài)檢驗為什么有用?許多統(tǒng)計檢驗(均值和方差的檢驗)都假定數(shù)據(jù)是正態(tài)分布的,正態(tài)檢驗用來判定該假定是否有效。何時用正態(tài)檢驗?

當(dāng)你分析數(shù)據(jù)并要計算基本統(tǒng)計值如Z值或假定正態(tài)性的統(tǒng)計檢驗如T-檢驗或方差分析(ANOVA)時。分布的正態(tài)性檢驗正態(tài)檢驗為什么有用?分布的正態(tài)性檢驗如何做正態(tài)性檢驗?采用Minitab公司的專業(yè)統(tǒng)計軟件MINITAB:如何做正態(tài)性檢驗?采用Minitab公司的專業(yè)統(tǒng)計軟件MIN如何做正態(tài)性檢驗?方法1:從Minitab的菜單選項里,選擇:

Stat>BasicStatistics>NormalityTest打開數(shù)據(jù)文件:DOT-BOX-HISTOGRAM.MTV如何做正態(tài)性檢驗?方法1:從Minitab的菜單選項里,選如何做正態(tài)性檢驗?從Minitab的菜單選項里,選擇

Stat>BasicStatistics>NormalityTest.

我們可以看到下圖的對話框。如何做正態(tài)性檢驗?從Minitab的菜單選項里,選擇St變量:選擇一列數(shù)據(jù)用于X軸。正態(tài)檢驗:有3種類型,通常用Anderson-Darlingtest.標(biāo)題:用你自擬的題目取代默認(rèn)的。

單擊OK.圖形輸出如下圖。正態(tài)概率圖:如何做正態(tài)性檢驗?變量:選擇一列數(shù)據(jù)用于X軸。正態(tài)概率圖:如何做正態(tài)性檢驗?如何做正態(tài)性檢驗?方法2:從Minitab的菜單選項里,選擇:

Stat>BasicStatistics>DisplayDescriptiveStatistics打開數(shù)據(jù)文件:DOT-BOX-HISTOGRAM.MTV如何做正態(tài)性檢驗?方法2:從Minitab的菜單選項里,選如何做正態(tài)性檢驗?從Minitab的菜單選項里,選擇:

Stat>BasicStatistics>DisplayDescriptiveStatistics我們可以看到下圖的對話框。

如何做正態(tài)性檢驗?從Minitab的菜單選項里,選擇:如何做正態(tài)性檢驗?結(jié)果顯示:P-Value大于0.05,判定數(shù)據(jù)的分布為正態(tài)分布。

(α冒險概率=0.05)

如何做正態(tài)性檢驗?結(jié)果顯示:P-Value大于0.05,判定如何做正態(tài)性檢驗?顯示在圖上的總結(jié)包括添加了分布曲線的直方圖和AndersonDarling正態(tài)檢驗的P值(顯示在右上角)。正態(tài)檢驗的通常規(guī)則當(dāng)P值小于或等于0.05則認(rèn)為樣本數(shù)據(jù)的分布不同于標(biāo)準(zhǔn)的正態(tài)分布。相反,當(dāng)P值大于0.05,則認(rèn)為樣本數(shù)據(jù)的分布與正態(tài)沒有顯著差異。進(jìn)一步解釋:正態(tài)性檢驗屬于根據(jù)樣本來檢驗關(guān)于總體分布的檢驗方法,屬于數(shù)學(xué)中的非參數(shù)檢驗方法。對于正態(tài)檢驗,原假設(shè)為:H0:總體的分布與正態(tài)分布無顯著差異;對立假設(shè)為:H1:總體的分布與正態(tài)分布有顯著差異。其中P值代表判斷總體數(shù)據(jù)分布和正態(tài)分布沒有顯著差異的可能性。上圖表現(xiàn)了數(shù)據(jù)分布的直方圖及分布曲線,從圖中我們可以看出此圖不是正態(tài)分布。結(jié)果說明:如何做正態(tài)性檢驗?顯示在圖上的總結(jié)包括添加了概率論基本概念:1.隨機(jī)變量--根據(jù)試驗結(jié)果對隨機(jī)試驗取什么值的變量。2.隨機(jī)事件的頻率-設(shè)隨機(jī)事件A在n次試驗中出現(xiàn)了r次,則稱比值r/n為這n次試驗中事件A出現(xiàn)的頻率,記作W(A)即:W(A)=r/n3.概率的統(tǒng)計定義-隨著試驗次數(shù)n的增大,事件出現(xiàn)的頻率r/n在區(qū)間[0,1]上的某個數(shù)字p附近擺動,那么定義事件的概率為:P(A)=p

根據(jù)貝努里大數(shù)定理,在實際應(yīng)用中,當(dāng)試驗次數(shù)很大時,便可以用事件出現(xiàn)的頻率來代替事件發(fā)生的概率。中心極限定理概率論基本概念:中心極限定理中心極限定理在實際問題中,有許多隨機(jī)變量,它們是由大量的相互獨立的隨機(jī)因素的綜合影響所形成的,即可以表示成獨立隨機(jī)因素之和,這種隨機(jī)變量往往近似地服從正態(tài)分布,這就是中心極限定理的客觀背景。獨立同分布的中心極限定理指出:設(shè)獨立隨機(jī)變量序列X1,X2,…,Xn,…服從同一分布,并具有有限的數(shù)學(xué)期望和方差,則只要n充分大,不管Xi服從什么分布,近似地服從正態(tài)分布德莫佛-拉普拉斯定理指出:當(dāng)n很大時,在n次獨立重復(fù)試驗中事件A發(fā)生地次數(shù)近似服從正態(tài)分布。從而服從二項分布的隨機(jī)變量近似服從正態(tài)分布N(np,np(1-p))。(附:在不合格率為p的一大批產(chǎn)品中任取n

件產(chǎn)品,那么取得不合格品的件數(shù)

服從二項分布)。中心極限定理在實際問題中,有許多隨機(jī)變量,它們是由大量的相互例1“總銷售量”是許多許多經(jīng)銷商銷售的總和,一個銷售商可能不是正態(tài)分布,但總的銷售量大致是正態(tài)分布的。例2即使單一產(chǎn)品高度不是正態(tài)分布,但是許多產(chǎn)品的堆積高度大致是正態(tài)分布,注意:不是所有數(shù)據(jù)服從正態(tài)分布,如何檢驗正態(tài)性,及數(shù)據(jù)非正態(tài)時如何辦?中心極限定理舉例說明:例1例2注意:不是所有數(shù)據(jù)服從正態(tài)分布,中心極限定理舉例說明Visualinterpretationthedataset.Commongraphicaltoolstoillustrateadataset:DotPlot散點圖BoxPlot盒子圖Histogram直方圖圖形工具描述Visualinterpretationthedata散點圖(DotPlot)Thedotplotisusefulfordisplayingasmallbodyofdata.散點圖更易分析樣本容量較少的參數(shù)特性。Thelocationorcentraltendencyinthedatasetanditsspreadordispersionareeasilyidentified.散點圖對單個樣本數(shù)據(jù)的居中程度和離散程度都很容易看出來。Itcanalsobeusedincomparingtwoormoredatasets.散點圖還可用于定性地比較兩組樣本或多組樣本的數(shù)據(jù)之間有無顯著差異。散點圖(DotPlot)Thedotploti案例:某器件AM5003特性參數(shù)-電流增量(mA):批次A:4.5,7.3,4.8,6.2,8.7,5.1,3.5,5.4,4.6,3.8批次B:4.5,7.3,4.8,6.2,8.7,5.1,11,13,9.7,10.5Minitab:Graph>Dotplot散點圖(DotPlot)打開數(shù)據(jù)文件:DOT-BOX-HISTOGRAM.MTV案例:某器件AM5003特性參數(shù)-電流增量(mA):Mi結(jié)論:散點圖結(jié)果顯示:批次A的電流增量比較集中,均值小,因此批次A的質(zhì)量比較穩(wěn)定;而批次B的電流增量比較分散,均值較大,性能較差。圖形結(jié)果顯示:散點圖(DotPlot)批次A批次B結(jié)論:散點圖結(jié)果顯示:批次A的電流增量比較集中,均值小,因盒子圖(BoxPlot)Nottobeusedwhensamplesizeislessthan10units.注意:當(dāng)樣本容量小于10時請勿采用!盒子圖是比較樣本數(shù)據(jù)間的分布差異,中心位置和分散大小。和散點圖相近,都是用來分析樣本數(shù)據(jù)的居中程度和離散程度,但比散點圖更直觀,更有效。盒子圖(BoxPlot)Nottobeused*異常點

75%數(shù)(3/4分位)-Q3Q1-Max{Minimum,Q1-1.5IQR}Q3+Min{Maximum,Q3+1.5IQR}25%的數(shù)(1/4分位)-Q1中位數(shù)(1/2分位)-Q2注:盒子的高度---內(nèi)四分位極差(IQR)=InterQuartileRange=Q3-Q1盒子圖(BoxPlot)數(shù)據(jù)的中心50%(盒子的高度)*異常點75%數(shù)(3/4分位)-Q3Q1-Max{MiMinitab:Graph>Boxplot:盒子圖(BoxPlot)打開數(shù)據(jù)文件:DOT-BOX-HISTOGRAM.MTV單個樣本數(shù)據(jù)分析:Minitab:Graph>Boxplot:圖形結(jié)果顯示-單個樣本數(shù)據(jù)分析:盒子圖(BoxPlot)圖形結(jié)果顯示盒子圖(BoxPlot)盒子圖(BoxPlot)打開數(shù)據(jù)文件:DOT-BOX-HISTOGRAM.MTV多個樣本數(shù)據(jù)比較分析:盒子圖(BoxPlot)打開數(shù)據(jù)文件:DOT-盒子圖(BoxPlot)圖形結(jié)果顯示-多個樣本數(shù)據(jù)比較分析:盒子圖(BoxPlot)圖形結(jié)果顯示-多個樣本數(shù)據(jù)比直方圖(Histogram)Thehistogram,agraphicalpresentationofthefrequencydistribution,providesavisualimpressionoftheshapeofthedistributionofmeasurements.直方圖--表征數(shù)據(jù)的概率分布,主要應(yīng)用在了解數(shù)據(jù)分布的形狀及形態(tài)。便于掌握數(shù)據(jù)的居中趨勢,數(shù)據(jù)的分布等。X-axis:measurementscale--測量數(shù)據(jù)的區(qū)間劃分,隨著區(qū)間的調(diào)整,數(shù)據(jù)的形狀分布略有不同。Y-axis:frequency(orrelativefrequency)scale--事件發(fā)生的頻數(shù)。Nottobeusedwhensamplesizeislessthan50units.注意:當(dāng)樣本容量小于50時謹(jǐn)慎使用直方圖!直方圖(Histogram)ThehistogramMinitab:Graph>Histogram直方圖(Histogram)打開數(shù)據(jù)文件:DOT-BOX-HISTOGRAM.MTVMinitab:Graph>Hi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論