MINITAB統(tǒng)計(jì)基礎(chǔ)_第1頁
MINITAB統(tǒng)計(jì)基礎(chǔ)_第2頁
MINITAB統(tǒng)計(jì)基礎(chǔ)_第3頁
MINITAB統(tǒng)計(jì)基礎(chǔ)_第4頁
MINITAB統(tǒng)計(jì)基礎(chǔ)_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、MINITAB統(tǒng)計(jì)基礎(chǔ)1. 正態(tài)總體的抽樣分布1) 樣本均值 X 的分布標(biāo)準(zhǔn)正態(tài)分布及T分布樣本標(biāo)準(zhǔn)差計(jì)算公式:u T分布的定義:Student t distribution,如果X服從標(biāo)準(zhǔn)正態(tài)分布,S2服從個(gè)自由度的卡方分布,且它們相互獨(dú)立,那么隨機(jī)量所服從的分布稱為 個(gè)自由度的t分布。其分布密度函數(shù)為:當(dāng) 時(shí)的極限分布即是標(biāo)準(zhǔn)正態(tài)分布,當(dāng) =1 時(shí)就是Cauchy分布。T分布只包含1個(gè)參數(shù)。數(shù)學(xué)期望和方差分別為0,-2(1時(shí)期望不存在,2方差不存在)。我們常常用 t 表示 個(gè)自由度的t分布。MINITAB對(duì)于更一般的t分布還增加了一個(gè)“非中心參數(shù)”,當(dāng)非中心參數(shù)為0時(shí),就得到了我們現(xiàn)在所說

2、的t分布。在用MINITAB計(jì)算時(shí),只要注意這一點(diǎn)就行了。自由度:可以簡單理解為在研究問題中,可以自由獨(dú)立取值的數(shù)據(jù)或變量的個(gè)數(shù)。范例:² ZN(0,1),求Z=1.98時(shí)的概率密度。計(jì)算->概率分布->正態(tài)分布->概率密度->輸入常數(shù)1.98->確定概率密度函數(shù) 正態(tài)分布,均值 = 0 和標(biāo)準(zhǔn)差 = 1 x f( x )1.98 0.0561831² ZN0,1,求PZ<2.4。計(jì)算->概率分布->正態(tài)分布->累積概率->輸入常數(shù)2.4->確定累積分布函數(shù) 正態(tài)分布,均值 = 0 和標(biāo)準(zhǔn)差 = 1 x P(

3、 X <= x )2.4 0.991802² ZN(0,1),求使得P(Z<x)=0.95成立的x值,即Z的0.95分位數(shù)。計(jì)算->概率分布->正態(tài)分布->逆累積概率->輸入常數(shù)0.95->確定逆累積分布函數(shù) 正態(tài)分布,均值 = 0 和標(biāo)準(zhǔn)差 = 1P( X <= x ) x 0.95 1.64485² 自由度=12,求使得PZ<x=0.95成立的x值。計(jì)算->概率分布->t分布->逆累積概率->輸入自由度12->輸入常數(shù)0.95->確定逆累積分布函數(shù) 學(xué)生 t 分布,12 自由度P(

4、 X <= x ) x 0.95 1.7822² 自由度=12,求使得Pt3。計(jì)算->概率分布->t分布->累積概率->輸入自由度12->輸入常數(shù)3->確定累積分布函數(shù) 學(xué)生 t 分布,12 自由度x P( X <= x )3 0.9944672) 雙樣本均值差的分布3) 正態(tài)樣本正態(tài)樣本方差S2的分布卡房卡方分布若X1,X2,,Xn是從正態(tài)總體N,2中抽出的一組樣本量為n的獨(dú)立隨機(jī)樣本,記則當(dāng) 已知時(shí):當(dāng)未知時(shí),用 X 替 后可以得到其概率密度函數(shù)在正半軸上呈正偏態(tài)分布。u 卡方分布的定義:把n個(gè)相互獨(dú)立的標(biāo)準(zhǔn)正態(tài)隨機(jī)變量的平方和稱為

5、自由度為n的卡方分布。它的密度表達(dá)式為:參數(shù) 1 稱為自由度。卡方分布有向右的偏斜,特別在較小自由度情況下( 越小,分布越偏斜)。我們常用 2 表達(dá)自由度為 的卡方分布??ǚ椒植加泻芏嘤猛荆渲幸豁?xiàng)就是用來分析單個(gè)正態(tài)總體樣本方差的狀況;還可以用來進(jìn)行分布的擬合優(yōu)度檢驗(yàn),即檢驗(yàn)資料是否符合某種特定分布;對(duì)于離散數(shù)據(jù)構(gòu)成的列聯(lián)表,也可以用來分析兩個(gè)離散型因子間是否獨(dú)立等。u 卡方分布的性質(zhì)a) 卡方分布的加法性:設(shè)X和Y彼此獨(dú)立,且都服從卡方分布,其自由度分別為n1,n2。若令Z=X+Y,則Z服從自由度為n1+n2的卡方分布。b) 若 X2n ,則 EX=n ,VX=2n 。計(jì)算下列各卡方分布的

6、相關(guān)數(shù)值:² 自由度=10,求使得 P2<x=0.95 成立的 x 值。計(jì)算 -> 概率分布 -> 卡方分布 -> 逆累積概率 -> 自由度=10 -> 常數(shù)=0.95 -> 確定逆累積分布函數(shù) 卡方分布,10 自由度P( X <= x ) x 0.95 18.307² 自由度=10,求 P228 。計(jì)算 -> 概率分布 -> 卡方分布 -> 累積概率 -> 自由度=10 -> 常數(shù)=28 -> 確定累積分布函數(shù) 卡方分布,10 自由度 x P( X <= x )28 0.998195

7、4) 兩個(gè)獨(dú)立的正態(tài)樣本方差之比的分布F分布兩個(gè)獨(dú)立的正態(tài)樣本方差之比的分布是F分布。設(shè)有兩個(gè)獨(dú)立的正態(tài)總體 N(1,2) 和 N(2,2) ,它們的方差相等。又設(shè)X1,X2,Xn是來自N(1,2)的一個(gè)樣本Y1,Y2,Yn是來自N(2,2) 的一個(gè)樣本,這兩樣相互獨(dú)立。它們的樣本方差之比是自由度為n-1和m-1的F分布:n-1稱為分子自由度;m-1為分母自由度;F分布的概率密度函數(shù)在正半軸上呈正偏態(tài)分布。實(shí)際上,F(xiàn)統(tǒng)計(jì)量就是由兩個(gè)卡方隨機(jī)變量相除所構(gòu)成的,如果 21 ,Y22 ,且二者相互獨(dú)立,則稱二者比值的分布為F分布,即其密度函數(shù)是:F分布的應(yīng)用非常廣泛,尤其是在判斷兩正態(tài)總體方差是否相

8、等以及方差分析(ANOVA)等問題上面。² 計(jì)算F0.95(8,,18)的數(shù)值。計(jì)算 -> 概率分布 -> F分布 -> 逆累積概率 -> 分子自由度=8 -> 分母自由度=18 ->常數(shù)=0.95 ->確定逆累積分布函數(shù) F 分布,8 分子自由度和 18 分母自由度P( X <= x ) x 0.95 2.510162. 參數(shù)的點(diǎn)估計(jì)1) 點(diǎn)估計(jì)的概念用單個(gè)數(shù)值對(duì)于總體參數(shù)給出估計(jì)的方法稱為點(diǎn)估計(jì)。設(shè)是總體的一個(gè)未知參數(shù),X1,X2,Xn是從總體中抽取的樣本量為n的一個(gè)隨機(jī)樣本,那么用來估計(jì)未知參數(shù)的統(tǒng)計(jì)量 (X1,X2,Xn)稱為的

9、估計(jì)量,或稱為的點(diǎn)估計(jì)。我們總是在參數(shù)上方畫一個(gè)帽子“”表示該參數(shù)的估計(jì)量。在工程中經(jīng)常出現(xiàn)的點(diǎn)估計(jì)問題之最好結(jié)果是:Ø 對(duì)于總體均值 , =X ;Ø 對(duì)于總體方差 2 , 2 =S2 ;Ø 對(duì)于比率p , p =Xn ,X是樣本量為n的隨機(jī)樣本中我們感興趣的那類出現(xiàn)的次數(shù);Ø 對(duì)于 1 - 2 ,1 - 2 = X1-X2(兩個(gè)獨(dú)立隨機(jī)樣本均值之差);Ø 對(duì)于p1 - p2,估計(jì)為 P1 -P2(兩個(gè)獨(dú)立隨機(jī)樣本比率之差);2) 點(diǎn)估計(jì)的評(píng)選標(biāo)準(zhǔn)3. 參數(shù)的區(qū)間估計(jì)設(shè)是總體的一個(gè)待估參數(shù),從總體中獲得樣本量為n 的樣本是X

10、1,X2,Xn,對(duì)給定的顯著性水平(01),有統(tǒng)計(jì)量:L= L(X1,X2,Xn)與U= U(X1,X2,Xn),若對(duì)于任意有P(LU)= 1 - ,則稱隨機(jī)區(qū)間L,U是的置信水平為1-的置信區(qū)間,L與U分別稱為置信下限和置信上限。置信區(qū)間的大小表達(dá)了區(qū)間估計(jì)的精確性,置信水平表達(dá)了區(qū)間估計(jì)的可靠性, 1 - 是區(qū)間估計(jì)的可靠程度,而 表達(dá)了區(qū)間估計(jì)的不可靠程度。在進(jìn)行區(qū)間估計(jì)時(shí),必須同時(shí)考慮置信水平與置信區(qū)間兩個(gè)方面。對(duì)于置信區(qū)間的選取,一定要注意,決不能認(rèn)為置信水平越大的置信區(qū)間就越好。實(shí)際上,置信水平定的越大,則置信區(qū)間相應(yīng)也一定越寬,當(dāng)置信水平太大時(shí),則置信區(qū)間會(huì)寬得沒有實(shí)際意義了。這

11、兩者要結(jié)合在一起考慮,才更為實(shí)際。通常我們?nèi)≈眯潘綖?.95,極個(gè)別情況下可取0.99或0.90,一般不取其他的置信水平。1) 單正態(tài)總體均值的置信區(qū)間當(dāng) X N(,2)時(shí),正態(tài)總體均值的置信區(qū)間有以下三種情況:a) 當(dāng)總體方差 2 已知時(shí),正態(tài)總體均值 的 1 置信區(qū)間為:式中,Z1-2是標(biāo)準(zhǔn)正態(tài)分布的 1-2 分位數(shù),也就是雙側(cè) 分位數(shù)。例如=0.05時(shí),Z0.975=1.96。在MINITAB中,我們通過:統(tǒng)計(jì) -> 基本統(tǒng)計(jì)量 -> 單樣本Z 來實(shí)現(xiàn)的。由于實(shí)際情況中,已知標(biāo)準(zhǔn)差的情況很少見,因此我們這里重點(diǎn)關(guān)注的是標(biāo)準(zhǔn)差位置時(shí)的情況。b) 當(dāng)總體方差 2 未知時(shí), 用樣

12、本標(biāo)準(zhǔn)差S代替,此時(shí)正態(tài)總體均值 的 1 置信區(qū)間為:式中,t1-2n-1 表示自由度為n 1的 t 分布的 1-2 分位數(shù),也就是t分布的雙側(cè) 分位數(shù)。例如=0.05時(shí),樣本量n = 16時(shí),t0.97515=2.131,其值略大于Z0.975=1.96。在MINITAB中,我們通過:統(tǒng)計(jì) -> 基本統(tǒng)計(jì)量 -> 單樣本t 來實(shí)現(xiàn)的。² 某集團(tuán)公司正推進(jìn)節(jié)省運(yùn)輸費(fèi)用活動(dòng),下表為20個(gè)月使用的運(yùn)輸費(fèi)用調(diào)查結(jié)果數(shù)據(jù):17421827168117421676168017921735168718521861177817471678175417991697166418041707

13、假設(shè)運(yùn)輸費(fèi)用是服從正態(tài)分布的,求運(yùn)輸費(fèi)用均值的95%置信區(qū)間。統(tǒng)計(jì) -> 基本統(tǒng)計(jì)量 -> 單樣本t -> 樣本所在列 = 運(yùn)輸費(fèi)用 -> 選項(xiàng) -> 置信水平 = 95 -> 確定。單樣本 T: 運(yùn)輸費(fèi)用 均值標(biāo)變量 N 均值 標(biāo)準(zhǔn)差 準(zhǔn)誤 95% 置信區(qū)間運(yùn)輸費(fèi)用 20 1745.2 61.9 13.8 (1716.2, 1774.2)c) 前兩種情況討論的是當(dāng)總體為正態(tài)分布時(shí), 的區(qū)間估計(jì),然而當(dāng)總體不是正態(tài)分布時(shí),如果樣本量n 超過30,則可根據(jù)中心極限定理知道:X 仍近似服從正態(tài)分布,因而仍可用正態(tài)分布總提示的均值 的區(qū)間估計(jì)方法,而且可以直接用樣

14、本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,即采用公式:在MINITAB中,通常直接采用:統(tǒng)計(jì) -> 基本統(tǒng)計(jì)量 -> 圖形化匯總 中得到總體均值的置信區(qū)間結(jié)果。只不過要注意的是:總體非正態(tài)時(shí),在小樣本情況下此結(jié)果并不可信,只有當(dāng)樣本量超過30后,由于中心極限定理的保證,此結(jié)果才是可信的。2) 單正態(tài)總體方差和標(biāo)準(zhǔn)差的置信區(qū)間當(dāng) X N(,2)時(shí),正態(tài)總體方差的置信區(qū)間是:式中,1-22n-1和22n-1分別是 1-2 分位數(shù)與 2 分位數(shù)。當(dāng) X N(,2)時(shí),正態(tài)總體標(biāo)準(zhǔn)差的置信區(qū)間是:² 某集團(tuán)公司正推進(jìn)節(jié)省運(yùn)輸費(fèi)用活動(dòng),下表為20個(gè)月使用的運(yùn)輸費(fèi)用調(diào)查結(jié)果數(shù)據(jù)/p>

15、117421676168017921735168718521861177817471678175417991697166418041707假設(shè)運(yùn)輸費(fèi)用是服從正態(tài)分布的,求運(yùn)輸費(fèi)用方差和標(biāo)準(zhǔn)差的95%置信區(qū)間。統(tǒng)計(jì) -> 基本統(tǒng)計(jì)量 -> 單方差 -> 樣本所在列 = 運(yùn)輸費(fèi)用 -> 選項(xiàng) -> 置信水平 = 95 -> 確定。單方差檢驗(yàn)和置信區(qū)間: 運(yùn)輸費(fèi)用 方法卡方方法僅適用于正態(tài)分布。Bonett 方法適用于任何連續(xù)分布。統(tǒng)計(jì)量變量 N 標(biāo)準(zhǔn)差 方差運(yùn)輸費(fèi)用 20 61.9 383095% 置信區(qū)間 標(biāo)準(zhǔn)差置信 方差置信區(qū)變量 方法 區(qū)間 間運(yùn)輸費(fèi)用 卡

16、方 (47.1, 90.4) (2215, 8170) Bonett (49.0, 86.6) (2401, 7507)求總體標(biāo)準(zhǔn)差置信區(qū)間另一種方法:統(tǒng)計(jì)->基本統(tǒng)計(jì)量->圖形化匯總->變量:運(yùn)輸費(fèi)用->置信水平:95 ->確定3) 單總體比率的置信區(qū)間當(dāng) X b(1,p)時(shí),也就是X取“非0則1”的0-1分布,我們常需要估計(jì)總體中感覺的那類比率的置信區(qū)間,比如,一批產(chǎn)品中,不合格品率的大致范圍;顧客滿意度調(diào)查中,有抱怨顧客的比率范圍等。這里我們記總體比率為p,樣本比率為 p ??梢宰C明,當(dāng)樣本量足夠大時(shí)(要求np>5及np(1-p)>5),且p值適

17、中(0.1<p<0.9),則可用正態(tài)分布去近似二項(xiàng)分布,因而近似有: p N(p,p1-pn)。因此,由 p 服從的正態(tài)分布構(gòu)造總體比率p的置信區(qū)間為:² 一電視臺(tái)為了調(diào)查新節(jié)目收視率,在節(jié)目放映時(shí)間內(nèi)進(jìn)行了電話調(diào)查。在接受調(diào)查的2000名被調(diào)查者中有1230名正在收看本節(jié)目。求此節(jié)目收視率的95%置信區(qū)間。統(tǒng)計(jì)->基本統(tǒng)計(jì)量->單比率->匯總數(shù)據(jù):事件數(shù)=1230,實(shí)驗(yàn)數(shù)=2000->選項(xiàng)->置信水平:95 ;勾選使用正態(tài)分布的檢驗(yàn)和區(qū)間->確定由于np>5及np(1-p)>5,可用于正態(tài)分布近似二項(xiàng)分布,故可以勾選使用基

18、于正態(tài)分布的檢驗(yàn)和區(qū)間。單比率檢驗(yàn)和置信區(qū)間 樣本 X N 樣本 p 95% 置信區(qū)間1 1230 2000 0.615000 (0.593674, 0.636326)使用正態(tài)近似。4) 雙總體均值差的置信區(qū)間設(shè)有兩個(gè)總體X N(1,12),Y N(2,22),從總體X中抽取的樣本X1,X2,Xn,樣本均值為 X ,樣本方差為 SX2 ,樣本標(biāo)準(zhǔn)差為 SX ,從總體Y中抽取的樣本Y1,Y2,Yn,樣本均值為 Y ,樣本方差為 SY2 ,樣本標(biāo)準(zhǔn)差為 SY 。對(duì)兩總體均值差異 1-2 的區(qū)間估計(jì)常有以下三種情況:a) 兩個(gè)總體均服從正態(tài)分布,且兩個(gè)總體的方差 12,22 都已知時(shí),兩總體均值差異

19、 1 - 2 的1- 置信水平下的置信區(qū)間為:只要樣本量足夠大,無論兩總體的方差是否相等,上式都成立。b) 兩個(gè)總體均服從正態(tài)分布,且兩個(gè)總體的方差 12=22 均未知時(shí),兩總體均值差異 1 - 2 的1- 置信水平下的置信區(qū)間為:式中,² 一家冶金公司需要減少其排放到廢水中的生物氧需求量含量。用于廢水處理的活化泥供應(yīng)商建議,用純氧取代空氣吹入活化泥以改善生物氧需求量含量(此數(shù)值越小越好)。從兩種處理的廢水中分別抽取10個(gè)和9個(gè)樣品,數(shù)據(jù)如下:空氣184194158218186218165172191179氧氣163185178183171140155179175已知生物氧需求量含量

20、服從正態(tài)分布,試確定:該公司采用空氣和采用純氧減少生物氧需求量含量均值之差的95%置信區(qū)間。求兩總體1 - 2 的置信區(qū)間:統(tǒng)計(jì)->基本統(tǒng)計(jì)量->雙樣本t->樣本在不同列中:第一=空氣,第二=氧氣->勾選假定等方差->選項(xiàng):置信水平=95,備擇=不等于->確定。雙樣本 T 檢驗(yàn)和置信區(qū)間: 空氣, 氧氣 空氣 與 氧氣 的雙樣本 T 均值標(biāo) N 均值 標(biāo)準(zhǔn)差 準(zhǔn)誤空氣 10 186.5 20.0 6.3氧氣 9 169.9 14.7 4.9差值 = mu (空氣) - mu (氧氣)差值估計(jì)值: 16.61差值的 95% 置信區(qū)間: (-0.58, 33.8

21、0)差值 = 0 (與 ) 的 T 檢驗(yàn): T 值 = 2.04 P 值 = 0.057 自由度 = 17兩者都使用合并標(biāo)準(zhǔn)差 = 17.7356c) 當(dāng)兩個(gè)總體均服從正態(tài)分布,且兩個(gè)總體的方差 1222 均未知時(shí),兩總體均值差異 1 - 2 的1- 置信水平下的置信區(qū)間為:式中,自由度的計(jì)算公式為:² 假定A,B兩名工人生產(chǎn)相同規(guī)格的軸棒,關(guān)鍵尺寸是軸棒的直徑。由于A使用的是老式車床,B使用的是新式車床,二者精度可能有差異。經(jīng)檢驗(yàn),他們的直徑數(shù)據(jù)確實(shí)來自兩個(gè)方差不等的正態(tài)分布?,F(xiàn)他們各測(cè)定13根軸棒直徑,數(shù)據(jù)如下:12345678910111213A14.7614.2114.021

22、5.0810.6512.1816.6718.2012.2411.2116.6713.4516.85B12.3710.2813.1813.2613.8010.9610.5712.8311.6713.5412.4213.2412.52試確定A,B生產(chǎn)的軸棒直徑差異的95%置信區(qū)間。求兩總體1 - 2的置信區(qū)間:統(tǒng)計(jì)->基本統(tǒng)計(jì)量->雙樣本t->樣本在不同列中:第一=空氣,第二=氧氣->選項(xiàng):置信水平=95,備擇=不等于->確定。雙樣本 T 檢驗(yàn)和置信區(qū)間: A工人, B工人 A工人 與 B工人 的雙樣本 T 均值標(biāo) N 均值 標(biāo)準(zhǔn)差 準(zhǔn)誤A工人 13 14.32 2.

23、35 0.65B工人 13 12.36 1.15 0.32差值 = mu (A工人) - mu (B工人)差值估計(jì)值: 1.965差值的 95% 置信區(qū)間: (0.435, 3.496)差值 = 0 (與 ) 的 T 檢驗(yàn): T 值 = 2.71 P 值 = 0.015 自由度 = 17² 獨(dú)立隨機(jī)樣本取自均值1, 2 未知,標(biāo)準(zhǔn)差未知的兩個(gè)正態(tài)分布總體,若第一個(gè)總體樣本標(biāo)準(zhǔn)差S1=0.73,樣本量n=25,X=6.9,第二個(gè)總體樣本標(biāo)準(zhǔn)差S2=0.89,樣本量n=20,Y=6.7。求1- 2的95%置信區(qū)間。統(tǒng)計(jì)->基本統(tǒng)計(jì)量->雙樣本t->匯總數(shù)據(jù):第一(樣本數(shù)量=25

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論