數(shù)據(jù)的統(tǒng)計描述及其_第1頁
數(shù)據(jù)的統(tǒng)計描述及其_第2頁
數(shù)據(jù)的統(tǒng)計描述及其_第3頁
數(shù)據(jù)的統(tǒng)計描述及其_第4頁
數(shù)據(jù)的統(tǒng)計描述及其_第5頁
已閱讀5頁,還剩80頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)據(jù)的統(tǒng)計描述和分析皖西學(xué)院數(shù)理系袁國軍1/2/20231一個有趣的現(xiàn)象在全球最大的零售業(yè)巨頭沃爾瑪連鎖商店里,就有這么一個有趣的現(xiàn)象,啤酒與嬰幼兒尿布是擺設(shè)在一塊的。這是什么原因呢?原來美國太太們總是要求其先生下班后給兒女們買尿布,而美國男士們又特愛喝啤酒,下班時總忘不了要到商店中買幾罐啤酒,而這兩樣?xùn)|西放在一塊,既提醒做父親的不要忘了買尿布同時又順便把自己喜愛的啤酒帶回了家。沃爾瑪連鎖商店通過周密的調(diào)查與細心的統(tǒng)計發(fā)現(xiàn)這兩樣看似毫無關(guān)系的東西卻有著如此神奇的聯(lián)系,從而把這兩樣表面看似毫不搭界的東西擺在了一起,結(jié)果,啤酒與尿布的銷量雙雙大增??梢姡诩毼⒅幦胧?,是會有意想不到的效果的。1/2/20232統(tǒng)計的基本概念參數(shù)估計假設(shè)檢驗數(shù)據(jù)的統(tǒng)計描述和分析1/2/20233一、統(tǒng)計量統(tǒng)計的基本概念1/2/202341/2/20235二、分布函數(shù)的近似求法1/2/20236三、幾個在統(tǒng)計中常用的概率分布-4-2024600.050.10.150.20.250.30.350.41.正態(tài)分布),(2smN密度函數(shù):222)(21)(smsp--=xexp分布函數(shù):dyexFyx222)(21)(smsp--¥-ò=其中m為均值,2s為方差,+¥<<¥-x.標準正態(tài)分布:N(0,1)密度函數(shù)2221)(xex-=pjdyexyx2221)(-¥-ò=Fp,

分布函數(shù)1/2/202371/2/202381/2/20239F分布F(10,50)的密度函數(shù)曲線1/2/202310參數(shù)估計12/24/202211一、點估計計的求法(一)矩估估計法12/24/202212(二)極大大似然估計計法12/24/202213二、區(qū)間估估計的求法法12/24/2022141、已知DX,求EX的置信信區(qū)間2.未知知方差DX,求EX的置信區(qū)區(qū)間(一)數(shù)學(xué)學(xué)期望的置置信區(qū)間(二)方差差的區(qū)間估估計12/24/202215Matlab統(tǒng)計工具具箱的使使用之一一一、常見見統(tǒng)計量量的Matlab命令令1.輸出出頻數(shù)表表:[n,y]=hist(x,k),k為為等分區(qū)區(qū)間數(shù),,n為頻數(shù)數(shù)行向量量,x為為原始數(shù)數(shù)據(jù)行向向量。2.輸出出直方圖圖:hist(x,k),,k為等分分區(qū)間數(shù)數(shù),默認認值為10。3.基本本統(tǒng)計量量:對隨機變變量x,,計算其其基本統(tǒng)統(tǒng)計量的命令如如下:均值:mean(x)中位數(shù)::median(x)標準差::std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)k階中心心矩:monment(x,order),order是階數(shù)數(shù)12/24/202216二、常見概率率分布的的函數(shù)Matlab工工具箱對對每一種種分布都都提供五五類函數(shù)數(shù),其命命令字符符為:概率密度度:pdf概率分布布:cdf逆概率分分布:inv均值與方方差:stat隨機數(shù)生生成:rnd(當(dāng)需要要一種分分布的某某一類函函數(shù)時,,將以上上所列的的分布命命令字符符與函數(shù)數(shù)命令字字符接起起來,并并輸入自自變量((可以是是標量、、數(shù)組或或矩陣))和參數(shù)數(shù)即可.)12/24/202217如對均值值為mu、標準準差為sigma的正正態(tài)分布布,舉例例如下::1、密度度函數(shù):p=normpdf(x,mu,sigma)(當(dāng)當(dāng)mu=0,sigma=1時可缺缺省)例求正正態(tài)分布布N(1,22),x=1.8處的密密度函數(shù)數(shù)值y=normpdf(1.8,1,2),,得y=0.1841在Matlab中輸入入以下命命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)12/24/20221812/24/2022192、概率分布布(分布函數(shù)數(shù)):P=normcdf(x,mu,sigma)求正態(tài)分布N(0,22),x=1.2處的分布布函數(shù)值,即即F(1.2)的值P=normcdf(1.2,0,2),得p=0.7257求二項分布B(20,0.3),x=6處的分分布函數(shù)值P=binocdf(6,20,0.3),得得p=0.608012/24/2022203、逆概率分分布:x=norminv(P,mu,sigma).即求求出x,使使得P{X<x}=P.此命令可用用來求分位數(shù)數(shù)(下側(cè))求p=0.999的tf分布(自由由度n=10)的分位數(shù)數(shù)y=tinv(0.999,10),得y=4.143712/24/2022214、均值與方方差:例5求正態(tài)分布N(3,52)的均值與方方差.命令為:[m,v]=normstat(3,5)結(jié)果為:m=3,v=25計算F(2,5)的期望望與方差命令:[m,v]=fstat(2,5)結(jié)果為:m=1.6667,v=13.888912/24/2022225、隨機數(shù)生生成:normrnd(mu,sigma,m,n).產(chǎn)產(chǎn)生mn階的正態(tài)分布布隨機數(shù)矩陣陣.例6命令:M=normrnd([123;456],0.1,2,3)此命令產(chǎn)生了了2×3的正態(tài)分分布隨機數(shù)矩矩陣,各數(shù)分分別服從N(1,0.12),N(2,22),N(3,32),N(4,0.12),N(5,22),N(6,32)M=normrnd([123;456],[0.123;246])請思考此命令令生成的是什什么樣的隨機機矩陣呢?12/24/202223二、參數(shù)估估計1、正態(tài)總體的的參數(shù)估計計設(shè)總體服從從正態(tài)分布布,則其點點估計和區(qū)區(qū)間估計可可同時由以以下命令獲獲得:[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在顯顯著性水平平alpha下估計計數(shù)據(jù)X的的參數(shù)(alpha缺省時設(shè)設(shè)定為0.05),,返回值muhat是X的均均值的點估估計值,sigmahat是是標準差的的點估計值值,muci是均均值的區(qū)間間估計,sigmaci是標標準差的區(qū)區(qū)間估計.12/24/202224例如:有一一批糖果,,從中隨機機的取16袋,稱得得重量如下下:509496,假假設(shè)糖果的的重量近似似服從正態(tài)態(tài)分布,求求總體均值值、標準差的的估計值和和置信水平平為0.95的置信信區(qū)間。x=[506508499503504510497512514505493496506502509496];[mu,sigma,muci,sigmaci]=normfit(x,0.05)得到mu=503.7500sigma=6.2022muci=[500.4451,507.0549]sigmaci=[4.5816,9.5990]12/24/2022252.常見的的幾種分布布數(shù)據(jù)的點點估計和區(qū)區(qū)間估計的matlab命令令格式1.均勻分分布:[ahat,bhat,aci,bci]=unifit(x,alpha),在顯著性水平平alpha下,求求均勻分布的的數(shù)據(jù)X的均值的點估計及及其區(qū)間估估計.2.指數(shù)分分布:[muhat,muci,]=expfit(x,alpha)在顯著性水平alpha下,,求指數(shù)分布的的數(shù)據(jù)X的均值的點估估計及其區(qū)間間估計.3.正態(tài)分分布:[mu,sigma,muci,sigmaci]=normfit(x,alpha),在顯著性水水平alpha下,,求正態(tài)分布的的數(shù)據(jù)X的均值的點估計及及其區(qū)間估估計.12/24/2022264.泊松分分布:[lambdahat,lambdaci]=poissfit(x,alpha)在顯著性水水平alpha下,,求正態(tài)分布的的數(shù)據(jù)X的均值的點估估計及其區(qū)區(qū)間估計.5.二項分分布:[phat,pci]=binofit(x,n,alpha)在顯著性水水平alpha下,,求正態(tài)分布的的數(shù)據(jù)X的均值的點估計及及其區(qū)間估估計.其中x是樣樣本數(shù)組,,alpha是顯著著性水平,,輸出有關(guān)關(guān)參數(shù)的點點估計和區(qū)區(qū)間估計。。12/24/202227例如假設(shè)下面的的數(shù)據(jù)近似似服從泊松松分布,請請求出分布布的參數(shù)及0.95的的置信區(qū)間間。6575855x=[6106533105357386575855];[muhat,muci]=poissfit(x,0.05)12/24/202228練習(xí)習(xí):某校校60名名學(xué)學(xué)生生的的一一次次考考試試成成績績?nèi)缛缦孪?1)計算算均均值值、、標標準準差差、、極極差差、、偏偏度度、、峰峰度度,,畫畫出出直直方方圖圖;;2)若若成成績績近近似似服服從從正正態(tài)態(tài)分分布布,,估估計計正正態(tài)態(tài)分分布布的的參參數(shù)數(shù).12/24/2022291.參數(shù)數(shù)檢檢驗驗:如如果果觀觀測測的的分分布布函函數(shù)數(shù)類類型型已已知知,,這這時時構(gòu)構(gòu)造造出出的的統(tǒng)計計量量依依賴賴于于總總體體的的分分布布函函數(shù)數(shù),,這這種種檢檢驗驗稱稱為為參參數(shù)數(shù)檢檢驗驗.參數(shù)數(shù)檢檢驗驗的的目目的的往往往往是是對對總總體體的的參參數(shù)數(shù)及及其其有有關(guān)關(guān)性性質(zhì)質(zhì)作作出出明明確的的判判斷斷.對總總體體X的的分分布布律律或或分分布布參參數(shù)數(shù)作作某某種種假假設(shè)設(shè),,根根據(jù)據(jù)抽抽取取的的樣樣本本觀觀察察值值,,運運用用數(shù)數(shù)理理統(tǒng)統(tǒng)計計的的分分析析方方法法,,檢檢驗驗這這種種假假設(shè)設(shè)是是否否正正確確,,從從而而決決定定接接受受假假設(shè)設(shè)或或拒拒絕絕假假設(shè)設(shè).2.非非參參數(shù)數(shù)檢檢驗驗:如如果果所所檢檢驗驗的的假假設(shè)設(shè)并并非非是是對對某某個個參參數(shù)數(shù)作作出出明明確的的判判斷斷,,因因而而必必須須要要求求構(gòu)構(gòu)造造出出的的檢檢驗驗統(tǒng)統(tǒng)計計量量的的分分布布函函數(shù)數(shù)不依依賴賴于于觀觀測測值值的的分分布布函函數(shù)數(shù)類類型型,,這這種種檢檢驗驗叫叫非非參參數(shù)數(shù)檢檢驗驗.如要要求求判判斷斷總總體體分分布布類類型型的的檢檢驗驗就就是是非非參參數(shù)數(shù)檢檢驗驗.假設(shè)設(shè)檢檢驗驗12/24/202230假設(shè)設(shè)檢檢驗驗的的一一般般步步驟驟是是:12/24/202231(一一))單單個個正正態(tài)態(tài)總總體體均均值值檢檢驗驗一、、參參數(shù)數(shù)檢檢驗驗12/24/20223212/24/202233(二二))單單個個正正態(tài)態(tài)總總體體方方差差檢檢驗驗12/24/202234(三三))兩兩個個正正態(tài)態(tài)總總體體均均值值檢檢驗驗12/24/202235(四))兩個個正態(tài)態(tài)總體體方差差檢驗驗12/24/202236二、非非參數(shù)數(shù)檢驗驗前面討討論的的是分分布已已知時時的參參數(shù)假假設(shè)檢檢驗問問題,,稱為為參數(shù)數(shù)假設(shè)設(shè)檢驗。。一般般說來來,在在進行行參數(shù)數(shù)假設(shè)設(shè)檢驗驗之前前,要要對總總體的的分布布進行推推斷,,即為為總體體分布布的擬擬合檢檢驗問問題,,它屬屬于非非參數(shù)數(shù)檢驗驗。已知總總體X的樣樣本分分布函函數(shù)Fn(x),若若選用用某個個分布布函數(shù)數(shù)F0(x)去擬合合,則則無論論選擇擇,F(xiàn)0(x)與與Fn(x)之間間總會會存在在差異異。這這些差異是是由于于試驗驗的有有限性性而導(dǎo)導(dǎo)致的的隨機機性產(chǎn)產(chǎn)生的的呢,,還是是所選選擇的分布布函數(shù)數(shù)F0(x)與樣樣本函函數(shù)Fn(x之之間存存在實實質(zhì)性性差異異而產(chǎn)產(chǎn)生的的呢??12/24/202237此種方方法主主要是是通過過各組組試驗驗數(shù)據(jù)據(jù)頻數(shù)數(shù)與理理論頻頻數(shù)差差異性性的大大小來推斷斷經(jīng)驗驗分布布是否否服從從任何何一個個預(yù)先先給定定的理理論分分布。。其理理論依據(jù)就就是用用各組組試驗驗數(shù)據(jù)據(jù)頻數(shù)數(shù)與理理論頻頻數(shù)的的差異異構(gòu)造造一個個服從從分布的的統(tǒng)計計量,,并用用次統(tǒng)統(tǒng)計量量來進進行假假設(shè)檢檢驗。。使用用此法法時要要求樣本容容量較較大,,并且且在進進行分分組時時,每每組的的理論論頻數(shù)數(shù)不小小于5。具體的的內(nèi)容容請參參見有有關(guān)概概率論論與數(shù)數(shù)理統(tǒng)統(tǒng)計教教材12/24/202238概率紙紙是一一種判判斷總總體分分布的的簡便便工具具.使使用它它們,,可以以很快快地判判斷總總體分分布的的類型型.概概率紙紙的種種類很很多,,以正正態(tài)概概率紙紙最為為常見見。正正態(tài)概概率紙紙的橫橫坐標標是均均勻刻刻度,,縱坐坐標是是按正正態(tài)分分布律律刻度度,表表示概概率。。(二))概率率紙檢檢驗法法12/24/202239統(tǒng)計工工具箱箱中的的基本本統(tǒng)計計命令令1.數(shù)數(shù)據(jù)的的錄入入、保保存和和調(diào)用用2.基基本統(tǒng)統(tǒng)計量量3.常見概概率分分布的的函數(shù)數(shù)4.頻頻數(shù)數(shù)直直方方圖圖的的描描繪繪5.參參數(shù)估估計6.假假設(shè)檢檢驗7.綜綜合實實例12/24/202240一、數(shù)據(jù)據(jù)的錄入入、保存存和調(diào)用用例1上海市區(qū)區(qū)社會商商品零售售總額和和全民所所有制職職工工資資總額的的數(shù)據(jù)如如下統(tǒng)計工具具箱中的的基本統(tǒng)統(tǒng)計命令令12/24/2022411、年份數(shù)據(jù)據(jù)以1為為增量,,用產(chǎn)生生向量的的方法輸輸入。命令格式式:x=a:h:bt=78:872、分別以x和y代代表變量量職工工工資總額額和商品品零售總總額。x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4];y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0];3、將變變量t、、x、y的數(shù)據(jù)據(jù)保存在在文件data中。savedatatxy4、進行行統(tǒng)計分分析時,,調(diào)用數(shù)數(shù)據(jù)文件件data中的的數(shù)據(jù)。。loaddataToMATLAB(txy)方法112/24/2022421、輸入矩陣陣:data=[78,79,80,81,82,83,84,85,86,87;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]2、將矩矩陣data的的數(shù)據(jù)保保存在文文件data1中:savedata1data3、進行統(tǒng)統(tǒng)計分析析時,先先用命令令:loaddata1調(diào)用數(shù)據(jù)據(jù)文件data1中的的數(shù)據(jù),,再用以以下命令令分別將將矩陣data的第一一、二、、三行的的數(shù)據(jù)賦賦給變量量t、x、y::t=data(1,:)x=data(2,:)y=data(3,:)若要調(diào)用用矩陣data的第j列的數(shù)據(jù)據(jù),可用用命令::data(:,j)方法2ToMATLAB(data)12/24/202243二、基本本統(tǒng)計量量對隨機變變量x,,計算其其基本統(tǒng)統(tǒng)計量的的命令如如下:均值:mean(x)中位數(shù)::median(x)標準差::std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)例對例1中中的職工工工資總總額x,,可計算算上述基基本統(tǒng)計計量。ToMATLAB(tjl)12/24/202244三、常見概率率分布的的函數(shù)Matlab工工具箱對對每一種種分布都都提供五五類函數(shù)數(shù),其命命令字符符為:概率密度度:pdf概率分布布:cdf逆概率分分布:inv均值與方方差:stat隨機數(shù)生生成:rnd(當(dāng)需要要一種分分布的某某一類函函數(shù)時,,將以上上所列的的分布命命令字符符與函數(shù)數(shù)命令字字符接起起來,并并輸入自自變量((可以是是標量、、數(shù)組或或矩陣))和參數(shù)數(shù)即可.)12/24/202245在Matlab中輸入入以下命命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)1、密度度函數(shù):p=normpdf(x,mu,sigma)(當(dāng)當(dāng)mu=0,sigma=1時可缺缺省)ToMATLAB(liti2)如對均值值為mu、標準準差為sigma的正正態(tài)分布布,舉例例如下::12/24/20224612/24/202247x=-6:0.01:6;y=normpdf(x);z=normpdf(x,1,2);plot(x,y,x,z)12/24/202248ToMATLAB(liti3)3、逆概率分分布:x=norminv(P,mu,sigma).即求求出x,使使得P{X<x}=P.此命令可用用來求分位數(shù)數(shù).2、概率分布布:P=normcdf(x,mu,sigma)ToMATLAB(liti4)12/24/202249ToMATLAB(liti5)4、均值與方方差:[m,v]=normstat(mu,sigma)例5求正態(tài)分布N(3,52)的均值與方方差.命令為:[m,v]=normstat(3,5)結(jié)果為:m=3,v=255、隨機數(shù)生生成:normrnd(mu,sigma,m,n).產(chǎn)生m╳n階的正態(tài)分布布隨機數(shù)矩陣陣.例6命令:M=normrnd([123;456],0.1,2,3)ToMATLAB(liti6)此命令產(chǎn)生了了2╳3的正態(tài)分布布隨機數(shù)矩陣陣,各數(shù)分別別服從N(1,0.12),N(2,0.12),N(3,0.12),N(4,0.12),N(5,0.12),N(0.1,32)返回12/24/2022501、給出數(shù)組data的頻數(shù)表的命令為:[N,X]=hist(data,k)此命令將區(qū)間間[min(data),max(data)]分為k個個小區(qū)間(缺缺省為10)),返回數(shù)組組data落落在每一個小小區(qū)間的頻數(shù)數(shù)N和每一個個小區(qū)間的中中點X.2、描繪數(shù)組組data的的頻數(shù)直方圖的命令為:hist(data,k)例如:loaddatahist(x)四、頻數(shù)直直方圖圖的描繪繪12/24/20225112/24/202252五、參數(shù)估估計1、正態(tài)總體的的參數(shù)估計計設(shè)總體服從從正態(tài)分布布,則其點點估計和區(qū)區(qū)間估計可可同時由以以下命令獲獲得:[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在顯顯著性水平平alpha下估計計數(shù)據(jù)X的的參數(shù)(alpha缺省時設(shè)設(shè)定為0.05),,返回值muhat是X的均均值的點估估計值,sigmahat是是標準差的的點估計值值,muci是均均值的區(qū)間間估計,sigmaci是標標準差的區(qū)區(qū)間估計.12/24/2022532、其它分分布的參數(shù)數(shù)估計有兩種處理理辦法:一.取容量量充分大的的樣本(n>50)),按中心心極限定理理,它近似似地服從正態(tài)分分布;二.使用Matlab工具箱箱中具有特特定分布總總體的估計計命令.(1)[muhat,muci]=expfit(X,alpha)-----在顯著性水水平alpha下,,求指數(shù)分布的的數(shù)據(jù)X的均值的點估估計及其區(qū)區(qū)間估計.(2)[lambdahat,lambdaci]=poissfit(X,alpha)-----在顯著性水水平alpha下,,求泊松分布的的數(shù)據(jù)X的參數(shù)的點點估計及其其區(qū)間估計計.(3)[phat,pci]=weibfit(X,alpha)-----在顯著性水水平alpha下,,求Weibull分布布的數(shù)據(jù)X的參數(shù)的點點估計及其其區(qū)間估計計.12/24/202254六、假設(shè)檢檢驗在總體服從從正態(tài)分布布的情況下下,可用以以下命令進進行假設(shè)檢檢驗.1、總體方差sigma2已知時,總總體均值的的檢驗使用用z-檢檢驗[h,sig,ci]=ztest(x,m,sigma,alpha,tail)檢驗數(shù)據(jù)x的關(guān)關(guān)于均值的的某一假設(shè)設(shè)是否成立立,其中sigma為已知知方差,alpha為顯顯著性水平平,究竟檢檢驗什么假假設(shè)取決于于tail的取取值:tail=0,,檢驗假設(shè)設(shè)“x的的均值等于于m””tail=1,,檢驗假設(shè)設(shè)“x的的均值大于于m””tail=-1,,檢驗假設(shè)設(shè)“x的的均值小于于m””tail的的缺省值為為0,alpha的缺省省值為0.05.返回值h為一個個布爾值,,h=1表表示可以以拒絕原假設(shè),h=0表表示不可可以拒絕原假設(shè),sig為為假設(shè)成成立的概率率,ci為為均值的的1-alpha置信區(qū)區(qū)間.12/24/202255例7Matlab統(tǒng)計工工具箱中的的數(shù)據(jù)文件件gas.mat.中提供了了美國1993年一一月份和二二月份的汽汽油平均價價格(price1,price2分分別是一,,二月份的的油價,單單位為美分分),它是是容量為20的雙樣樣本.假設(shè)設(shè)一月份油油價的標準準偏差是一一加侖四分分幣(=4),試試檢驗一月月份油價的的均值是否否等于115.解作假設(shè):m=115.首先取出數(shù)數(shù)據(jù),用以以下命令::loadgas然后用以下下命令檢驗驗[h,sig,ci]=ztest(price1,115,4)返回:h=0,,sig=0.8668,ci=[113.3970116.9030].檢驗結(jié)果:1.布爾變變量h=0,表示示不拒絕零零假設(shè).說說明提出出的假設(shè)均均值115是合理的.2.sig-值為為0.8668,遠遠超過0.05,不能拒拒絕零假設(shè)設(shè)3.95%的置信信區(qū)間為[113.4,116.9],它它完全包括括115,且精度度很高..ToMATLAB(liti7))12/24/202256練習(xí)1有一批糖果果,從中隨隨機的取16袋,稱稱得重量如如下:496506502509496,假假設(shè)糖果的的重量近似似服從正態(tài)態(tài)分布、標準準差為4,,請問該批批糖果每袋袋的平均重重量是否為500??(置信水水平為0.05)x=[496506502509496];[h,sig,muci]=ztest(x,500,4,0.05,0)得到h=1,sig=1.7683e-004muci=[501.7900,505.7100]h=1,因因此拒絕原原假設(shè),即即平均重量量不等于50012/24/2022572、總體方差sigma2未知時,總總體均值的的檢驗使用用t-檢驗驗[h,sig,ci]=ttest(x,m,alpha,tail)檢驗數(shù)據(jù)x的關(guān)關(guān)于均值的的某一假設(shè)設(shè)是否成立立,其中alpha為顯著著性水平,,究竟檢驗驗什么假設(shè)設(shè)取決于tail的取值值:tail=0,,檢驗假設(shè)設(shè)“x的的均值等于于m””tail=1,,檢驗假設(shè)設(shè)“x的的均值大于于m””tail=-1,,檢驗假設(shè)設(shè)“x的的均值小于于m””tail的的缺省值為為0,alpha的缺省省值為0.05.返回值h為一個個布爾值,,h=1表表示可以以拒絕假設(shè)設(shè),h=0表示不不可以拒絕絕假設(shè),sig為為假設(shè)成立立的概率,,ci為為均值的1-alpha置置信區(qū)間間.12/24/202258返回回::h=1,,sig=4.9517e-004,ci=[].檢驗驗結(jié)結(jié)果果:1.布布爾爾變變量量h=1,表表示示拒拒絕絕零零假假設(shè)設(shè).說說明明提提出出的的假假設(shè)油油價價均均值值115是是不不合合理理的的.2.95%的的置置信信區(qū)區(qū)間間為為[],它它不不包包括括115,故故不不能能接接受受假假設(shè)設(shè).3.sig-值值為為4.9517e-004,遠遠小小于于0.05,不不能能接接受受零零假設(shè)設(shè).ToMATLAB((liti8))例8試檢檢驗驗例例8中中二二月月份份油油價價Price2的的均均值值是是否否等等于于115.解作假假設(shè)設(shè)::m=115,,price2為為二二月月份份的的油油價價,,不不知知其其方方差差,,故故用用以以下下命命令令檢檢驗驗[h,sig,ci]=ttest(price2,115)12/24/202259練習(xí)正常人的脈搏為每分鐘72次,測得10例慢性中毒者的脈搏為:54676568787066706967設(shè)中毒者的脈搏為正態(tài)分布,問中毒者和正常人的脈搏有無顯著性差異?12/24/2022603、、兩總總體體均均值值的的假假設(shè)設(shè)檢檢驗驗使用用t-檢檢驗驗[h,sig,ci]=ttest2(x,y,alpha,tail)檢驗驗數(shù)數(shù)據(jù)據(jù)x,,y的的關(guān)關(guān)于于均均值值的的某某一一假假設(shè)設(shè)是是否否成成立立,,其其中中alpha為為顯顯著著性性水水平平,,究究竟竟檢檢驗驗什什么么假假設(shè)設(shè)取取決決于于tail的的取取值值::tail=0,,檢檢驗驗假假設(shè)設(shè)““x的的均均值值等等于于y的的均均值值””tail=1,,檢檢驗驗假假設(shè)設(shè)““x的的均均值值大大于于y的的均均值值””tail=-1,,檢檢驗驗假假設(shè)設(shè)““x的的均均值值小小于于y的的均均值值””tail的的缺缺省省值值為為0,,alpha的的缺缺省省值值為為0.05.返回回值值h為為一一個個布布爾爾值值,,h=1表表示示可可以以拒拒絕絕假假設(shè)設(shè),,h=0表表示示不不可可以以拒拒絕絕假假設(shè)設(shè),,sig為為假假設(shè)設(shè)成成立立的的概概率率,,ci為為與與x與與y均均值值差差的的的的1-alpha置置信信區(qū)區(qū)間間.12/24/202261返回回::h=1,,sig=0.0083,,ci=[-5.8,-0.9].檢驗驗結(jié)結(jié)果果:1.布布爾爾變變量量h=1,表表示示拒拒絕絕零零假假設(shè)設(shè).說說明明提提出出的的假設(shè)設(shè)““油油價價均均值值相相同同””是是不不合合理理的的.2.95%的的置置信信區(qū)區(qū)間間為為[-5.8,-0.9],說說明明一一月月份份油油價比比二二月月份份油油價價約約低低1至至6分分.3.sig-值值為為0.0083,遠小于0.5,不不能接受“油油價均相同”假設(shè).ToMATLAB(liti9)例9試檢驗例8中中一月份油價價Price1與二月份份的油價Price2均均值是否相同同.解用以下命令檢檢驗[h,sig,ci]=ttest2(price1,price2)12/24/202262練習(xí)112/24/202263練習(xí)2設(shè)某產(chǎn)品的生生產(chǎn)工藝發(fā)生生了變化,在在改變前后分分別測得若干產(chǎn)品的技技術(shù)指標:改變后:24.123.824.724.023.724.324.523.9設(shè)技術(shù)指標數(shù)數(shù)服從正態(tài)分分布,方差未未知且在改變變前后不變。工藝改變前前后對該指標標有無顯著性性影響(顯著著性水平為0.05);;試估計工藝藝改變后,該該技術(shù)指標的的置信水平為為0.95的平均值的變變化范圍?!?3.832824.4172】12/24/2022644.單正態(tài)總總體方差的假假設(shè)檢驗M文件function[chi21,chi2,chi22]=chi2test(x,sigma,alpha)n=length(x);[xbar,S]=normfit(x);chi2=(n-1)*S^2/sigma^2;chi21=chi2inv(alpha/2,n-1);chi22=chi2inv(1-alpha/2,n-1);fprintf('chi21=%.4fchi2=%.4f,chi22=%.4f',chi21,chi2,chi22);12/24/202265function[h,sig,ci]=chi23test(x,sigma,alpha)n=length(x);[xbar,S]=normfit(x);chi20=(n-1)*S^2/sigma^2;chi21=chi2inv(alpha/2,n-1);chi22=chi2inv(1-alpha/2,n-1);ifchi21<chi20<chi22h=0;elseh=1;endsig=chi2cdf(chi20,n-1);ci=[(n-1)*S^2/chi22,(n-1)*S^2/chi21];fprintf('h=%.4fsig=%.4f,ci=%.4f',h,sig,ci);12/24/202266命令格格式::x=[…];[chi21,chi2,chi22]=chi2test(x,sigma,alpha)若chi21>chi2或chi22<chi2,則則拒絕絕原假假設(shè)否則,,不能能拒絕絕原假假設(shè)例從從某一一批保保險絲絲中隨隨機抽抽取10根根,測測試其其融化化時間間,得如下下數(shù)據(jù)假設(shè)保保險絲絲的融融化時時間服服從正正態(tài)分分布,,檢驗驗總體體方差差是否等于于122。12/24/2022675.雙雙正態(tài)態(tài)總體體方差差的假假設(shè)檢檢驗((F檢檢驗))M文件function[F1,F,F2]=ftest(x,y,alpha)m=length(x);n=length(y);[xbar,Sx]=normfit(x);[ybar,Sy]=normfit(y);F=Sx^2/Sy^2;F1=finv(alpha/2,m-1,n-1);F2=finv(1-alpha/2,m-1,n-1);fprintf('F1=%.4fF=%.4f,F2=%.4f',F1,F,F2);12/24/202268function[h,sig,ci]=ftest2(x,y,alpha)m=length(x);n=length(y);[xbar,Sx]=normfit(x);[ybar,Sy]=normfit(y);F=Sx^2/Sy^2;F1=finv(alpha/2,m-1,n-1);F2=finv(1-alpha/2,m-1,n-1);ifF1<F<F2h=0;elseh=1;endsig=fcdf(F,m-1,n-1);ci=[F/F2,F/F1];12/24/202269命令格格式::x=[…];y=[…];[h,sig,ci]=ftest2(x,y,alpha)若h=1,則拒拒絕原原假設(shè)設(shè),否否則,,不能能拒絕絕原假假設(shè)。。例題12/24/202270未知,請請問試驗驗前后鋼鋼得率的的方差是是否發(fā)生生了變化化?(顯顯著性水水平為0.05)x=[……];y=[……];[h,sig,ci]=ftest2(x,y,alpha)得到:h=0,,所以試試驗前后后的方差差沒有發(fā)發(fā)生變化化12/24/2022715、非參數(shù)檢檢驗:總總體分布布的檢驗驗Matlab工工具箱提提供了兩兩個對總總體分布布進行檢檢驗的命命令:(1)h=normplot(x)(2)h=weibplot(x)此命令顯顯示數(shù)據(jù)據(jù)矩陣x的正態(tài)概概率圖.如果數(shù)數(shù)據(jù)來自自于正態(tài)態(tài)分布,,則圖形形顯示出出直線性性形態(tài).而其它它概率分分布函數(shù)數(shù)顯示出出曲線形形態(tài).此命令顯顯示數(shù)據(jù)據(jù)矩陣x的Weibull概率圖.如果數(shù)數(shù)據(jù)來自自于Weibull分布,則則圖形將將顯示出出直線性性形態(tài).而其它它概率分分布函數(shù)數(shù)將顯示示出曲線線形態(tài).返回12/24/20227212/24/202273另外還有有:1.總體體是否服服從正態(tài)態(tài)分布的的檢驗驗Jarque-Bera檢驗驗,是近近似檢驗驗,適合合大樣本本的情形形[h,p,jbstat,cv]=jbtest(x,alpha)返回值h=1,,則拒絕絕總體是是正態(tài)分分布的假假設(shè),h=0,,則不能拒絕絕總體是是正態(tài)分分布的假假設(shè);還還有三個個附加輸輸出:檢驗的的p值,,檢驗統(tǒng)統(tǒng)計量的的值jbstat,cv是判判斷是否否拒絕假設(shè)設(shè)的關(guān)鍵鍵值。2.總體體是否服服從標準準正態(tài)分分布的的檢驗驗,Kolmogorov-Smirnov檢檢驗,即即K-S檢驗h=kstest(x)H=1,,則拒絕絕總體是是標準正正態(tài)分布布的假設(shè)設(shè),h=0,則則不能拒絕絕總體是是標準正正態(tài)分布布的假設(shè)設(shè)。12/24/2022743.總體體是否服服從正態(tài)態(tài)分布的的檢驗驗,Lilliefors檢檢驗,適合小小樣本的的情形[h,p,jstat,cv]=lillietest(x,alpha)返回值h=1,,則拒絕絕總體是是正態(tài)分分布的假假設(shè),h=0,,則不能拒絕絕總體是是正態(tài)分分布的假假設(shè);4.雙樣樣本同分分布的Kolmogorov-Smirnov檢檢驗,即即K-S檢驗h=kstest(x1,x2)H=1,,則拒絕絕兩個樣樣本具有有相同連連續(xù)分布布的假設(shè)設(shè),h=0,則則不能拒拒絕兩個個樣本具具有相同同連續(xù)分分布的假假設(shè)。12/24/2022755.雙樣樣本同分分布的Wilcoxon秩和和檢驗適合離散散數(shù)據(jù)的的情形[p,h]=ranksum(x,y,alpha)當(dāng)p>alpha時,h=0,代表表檢驗的結(jié)果果接受原假設(shè)設(shè),即兩個總體不是同分分布的。12/24/2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論