Matlab筆記-數(shù)值計(jì)算-概率篇017_第1頁
Matlab筆記-數(shù)值計(jì)算-概率篇017_第2頁
Matlab筆記-數(shù)值計(jì)算-概率篇017_第3頁
Matlab筆記-數(shù)值計(jì)算-概率篇017_第4頁
Matlab筆記-數(shù)值計(jì)算-概率篇017_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

17.數(shù)值計(jì)算—概率篇一、計(jì)算組合數(shù)、排列數(shù)——factorial(n)或prod(1:n)——nchoosek(n,k)——factorial(n)/factorial(n-k)二、生成隨機(jī)數(shù)1.rand(m,n)——生成m×n的服從[0,1]上均勻分布的隨機(jī)數(shù);用a+(b-a).*rand(m,n)生成m×n的服從[a,b]上均勻分布的隨機(jī)數(shù)。2.二項(xiàng)分布與正態(tài)分布隨機(jī)數(shù)binornd(N,P,m,n)——生成m×n的服從二項(xiàng)分布B(N,P)的隨機(jī)數(shù);normrnd(MU,SIGMA,m,n)——生成m×n的服從正態(tài)分布N(MU,SIGMA2)的隨機(jī)數(shù);3.通用格式:分布縮寫+rnd(分布參數(shù),m,n)或random(‘分布名或縮寫’,分布參數(shù),m,n)可以用來生成m×n該分布的隨機(jī)數(shù)。各種分布名見下圖:表1一維隨機(jī)變量概率分布名稱表分布縮寫、分布名稱函數(shù)說明'beta'或'Beta'Beta分布'bino'或'Binomial'二項(xiàng)分布'chi2'或'Chisquare'卡方分布'exp'或'Exponential'指數(shù)分布'f'或'F'F分布'gam'或'Gamma'GAMMA分布'geo'或'Geometric'幾何分布'hyge'或'Hypergeometric'超幾何分布'logn'或'Lognormal'對(duì)數(shù)正態(tài)分布'nbin'或'NegativeBinomial'負(fù)二項(xiàng)式分布'ncf'或'NoncentralF'非中心F分布'nct'或'Noncentralt'非中心t分布'ncx2'或'NoncentralChi-square'非中心卡方分布'norm'或'Normal'正態(tài)分布'poiss'或'Poisson'泊松分布'rayl'或'Rayleigh'瑞利分布't'或'T'T分布'unif'或'Uniform'均勻分布'unid'或'DiscreteUniform'離散均勻分布'weib'或'Weibull'威布爾分布4.使用randsample和randsrc函數(shù)生成指定離散分布隨機(jī)數(shù)X=randsample(N,k,replace,w)N相當(dāng)于[1:N],也可以是具有確定值的向量;k表示生成k個(gè)隨機(jī)數(shù);replace=’true’表示可重復(fù),或’false’表示不可重復(fù)(默認(rèn));w是權(quán)重向量。X=randsrc(m,n,[x;p])生成m×n的隨機(jī)矩陣,服從取值為向量x,對(duì)應(yīng)概率為向量p的離散分布。例1設(shè)離散型隨機(jī)變量X服從如下分布:X-2-1012P0.050.20.50.20.05生成服從3×5的該分布的隨機(jī)數(shù)。代碼:xvalue=[-2-1012];xp=[0.050.20.50.20.05];%調(diào)用randsample函數(shù)生成100個(gè)服從指定離散分布的隨機(jī)數(shù)x=randsample(xvalue,15,true,xp);reshape(x,[35])%調(diào)用randsrc函數(shù)生成10*10的服從指定離散分布的隨機(jī)數(shù)矩陣y=randsrc(3,5,[xvalue;xp])運(yùn)行結(jié)果:ans=00100000-1-111001y=-1-111-1-10020-10-1005.已知概率密度函數(shù),生成服從該分布的隨機(jī)數(shù)例2設(shè)隨機(jī)變量X的概率密度函數(shù)為(拋物線分布):調(diào)用crnd函數(shù)(來自《MATLAB統(tǒng)計(jì)分析與應(yīng)用40個(gè)案例分析》作者:謝中華),生成3×5個(gè)服從該分布的隨機(jī)數(shù)。代碼:pdffun='6*x*(1-x)';%密度函數(shù)表達(dá)式x=crnd(pdffun,[01],3,5)運(yùn)行結(jié)果:x=0.31600.68660.27240.28160.12680.26810.84390.19480.79990.53830.73770.20400.49320.19480.69096.生成多元分布的隨機(jī)數(shù)mrnd(N,P,m)——多項(xiàng)分布,P為概率向量;mvnrnd(mu,sigma,m)——多元正態(tài)分布,mu,sigma為n元向量;mvtrnd(C,df,m)——多元t分布;wishrnd(sigma,df,m)——Wishart分布;iwishrnd(sigma,df,m)——逆Wishart分布;例3利用mvnrnd函數(shù)生成3組的二元正態(tài)分布隨機(jī)數(shù),其中分布的參數(shù)為代碼:mu=[1020];sigma=[13;316];xy=mvnrnd(mu,sigma,3)運(yùn)行結(jié)果:xy=11.833625.73859.034717.80269.603019.5821三、隨機(jī)變量的概率密度函數(shù)及其圖像概率密度函數(shù),描述隨機(jī)變量X在點(diǎn)x附近取值的可能性。1.通用格式:pdf(‘分布名或縮寫’,x,分布參數(shù))——返回該分布在X=x處的概率密度值;例如,Pk=pdf('bino',3,10,0.4)2.專用函數(shù)分布名縮寫+pdf(x,分布參數(shù))例如,binopdf(k,n,p)例4繪制卡方分布密度函數(shù)在自由度分別為1、5、15的圖形。代碼:x=0:0.1:30;y1=chi2pdf(x,1);plot(x,y1,':')holdony2=chi2pdf(x,3);plot(x,y2,'+')y3=chi2pdf(x,10);plot(x,y3,'o')axis([0,30,0,0.2])運(yùn)行結(jié)果:四、隨機(jī)變量的分布函數(shù)分布函數(shù)定義為:F(x)=P{X≤x},表示隨機(jī)變量X的取值落在(-∞,x)范圍內(nèi)的概率。引入分布函數(shù)的目的,就是可以計(jì)算隨機(jī)變量X的取值落在任意區(qū)間內(nèi)的概率,例如,P{a<X≤b}=F(b)-F(a)1.通用格式:cdf(‘分布名或縮寫’,x,分布參數(shù))——返回該分布的分布函數(shù);例如,Pk=cdf('bino',3,10,0.4)2.專用函數(shù)分布名縮寫+cdf(x,分布參數(shù))例如,binocdf(k,n,p)五、逆分布函數(shù)已知F(x)=P{X≤x}的值,求x點(diǎn)。1.通用格式:icdf(‘分布名或縮寫’,p,分布參數(shù))——返回該分布的分布函數(shù)F(x)=P{X≤x}=p的x值;例如,Pk=icdf('bino',3,10,0.4)2.專用函數(shù)分布名縮寫+inv(p,分布參數(shù))例如,binoinv(p,N,P)3.分位數(shù)N(0,1)的上α分位數(shù):P{X>uα}=α,故uα=norminv(1-α,0,1)其它分布的上分位數(shù)也是類似的。N(0,1)的雙側(cè)α分位數(shù):P{|X|>uα/2}=α,故uα/2=norminv(1-α/2,0,1)注意:-uα/2=u1-α/2(-uα/2右側(cè)的面積為1-α/2),其它對(duì)稱分布也成立,例如,t1-α(n)=-tα(n).六、隨機(jī)變量的數(shù)字特征注:若要X中除NaN(非數(shù))之外的數(shù)進(jìn)行操作,加前綴nan,例如nanmean(X).1.幾種平均(1)算術(shù)平均值(樣本均值)適用于性質(zhì)相同、單峰,且近似服從正態(tài)分布的定量數(shù)據(jù);代碼:mean(X)(若X為矩陣,返回每列的均值)(2)中位數(shù)代碼:median(X)(3)幾何平均值適用于對(duì)比率數(shù)據(jù)的平均,并主要用于計(jì)算數(shù)據(jù)平均增長(zhǎng)(變化)率;服從正偏態(tài)分布(較長(zhǎng)右尾),特別是對(duì)數(shù)正態(tài)分布數(shù)據(jù)(取對(duì)數(shù)變換后服從正態(tài)分布)。代碼:geomean(X)(4)調(diào)和平均值即先取倒數(shù),再取算術(shù)平均值,再取倒數(shù)回來。例如前半段時(shí)速60公里,后半段時(shí)速30公里(兩段距離相等),則其平均速度為兩者的調(diào)和平均數(shù)時(shí)速40公里。在實(shí)際中,往往由于缺乏總體單位數(shù)的資料而不能直接計(jì)算算術(shù)平均數(shù),這時(shí)需用調(diào)和平均法來求得平均數(shù)。代碼:harmmean(X)(5)眾數(shù)出現(xiàn)次數(shù)最多的數(shù),代碼:mode(X)2.期望和方差(1)樣本數(shù)據(jù)mean(X)——樣本均值var(X)或var(X,0)——樣本方差var(X,1)——方差std(X)或std(X,0)——樣本標(biāo)準(zhǔn)差Sstd(X,1)——標(biāo)準(zhǔn)差(2)常見分布的期望和方差通用格式:[E,D]=分布名縮寫+stat(分布參數(shù))返回E為期望,D為方差;例如,[E,D]=normstat(MU,SIGMA)(3)已知離散型隨機(jī)變量的分布律,求期望和方差例5設(shè)離散型隨機(jī)變量X服從如下分布:X-2-1012P0.30.10.20.10.3求E(X),E(X2-1),D(X).代碼:X=[-2-1012];p=[0.30.10.20.10.3];EX=sum(X.*p)%或EX=X*p’Y=X.^2-1;EY=sum(Y.*p)XX=X.^2;EXX=sum(XX.*p);DX=EXX-EX^2運(yùn)行結(jié)果:EX=0EY=1.6000DX=2.60003.極差、偏度、峰度極差,數(shù)據(jù)的最大值與最小值之差。代碼:range(X)偏度,是數(shù)據(jù)關(guān)于均值不對(duì)稱的指標(biāo)。若偏度為負(fù),說明均值左邊的數(shù)據(jù)比右邊的數(shù)據(jù)更散;若偏度為正,說明均值右邊的數(shù)據(jù)比左邊的數(shù)據(jù)更散,正態(tài)分布的偏度為0.代碼:skewness(X)峰度,是用來反映數(shù)據(jù)的分布曲線頂端尖峭或扁平程度的指標(biāo)。代碼:kurtosis(X)4.矩k階中心矩——m=moment(X,k)k階原點(diǎn)矩——可以使用下面自編的OriginMoment.mfunctiony=OriginMoment(X,k);%X為樣本矩陣[n,m]=size(X);y=zeros(1,m);forii=1:m;y(ii)=sum(X(:,ii).^k)/n;end5.協(xié)方差(矩陣)、相關(guān)系數(shù)(矩陣)對(duì)于樣本數(shù)據(jù)矩陣:Matlab將矩陣X的每一列Xj,j=1,…,n作為一個(gè)隨機(jī)變量的樣本,每一行[xj1,xj2,…,xjn],j=1,2,...,m作為n個(gè)隨機(jī)變量的聯(lián)合分布的一個(gè)樣本。由于矩陣X給出的只是隨機(jī)變量的樣本數(shù)據(jù),并不知道這些隨機(jī)變量的(聯(lián)合)概率分布,因此是不能計(jì)算出這些隨機(jī)變量的總體期望、方差或協(xié)方差的,而只能計(jì)算出它們的一個(gè)無偏估計(jì),即樣本均值、樣本方差與樣本協(xié)方差。樣本協(xié)方差公式:,其中稱為隨機(jī)變量X1,…,Xn的協(xié)方差矩陣(實(shí)對(duì)稱、非負(fù)定)。協(xié)方差矩陣是一維隨機(jī)變量方差、二維隨機(jī)向量協(xié)方差向高維隨機(jī)向量的推廣,常應(yīng)用于在主成分分析中。相關(guān)系數(shù)(矩陣)是協(xié)方差(矩陣)的標(biāo)準(zhǔn)化,反映了隨機(jī)變量?jī)蓛芍g的線性關(guān)系的強(qiáng)弱程度。代碼:cov(X)——返回樣本矩陣X的協(xié)方差矩陣;corrcoef(X)——返回樣本矩陣X的相關(guān)系數(shù)矩陣;例6隨機(jī)生成樣本數(shù)據(jù)矩陣X,計(jì)算X的協(xié)方差矩陣、相關(guān)系數(shù)矩陣。代碼:M=5;N=3;X=10.*rand(M,N)CovX=cov(X)Cov12=cov(X(:,1),X(:,2))Cov11=cov(X(:,1),X(:,1))var(X(:,1))RhoX=corrcoef(X)運(yùn)行結(jié)果:X=1.06658.68694.31419.61900.84449.10650.04633.99781.81857.74912.59872.63808.17308.00071.4554CovX=19.6061-6.38125.3900-6.381211.6214-5.58945.3900-5.58949.7937Cov12=19.6061-6.3812-6.381211.6214Cov11=19.606119.606119.606119.6061VarX1=19.6061RhoX=1.0000-0.42270.3890-0.42271.0000-0.52390.3890-0.52391.0000七、頻率直方圖1.統(tǒng)計(jì)數(shù)值或字符出現(xiàn)的頻數(shù)、頻率設(shè)X為數(shù)值型或字符型向量,代碼:tabulate(X);輸出X的值、頻數(shù)、頻率的三列表。注意:若X中的值都是非負(fù)整數(shù),則min(X)與max(X)之間的任一整數(shù)都統(tǒng)計(jì),未出現(xiàn)的頻數(shù)=0.2.經(jīng)驗(yàn)分布函數(shù)實(shí)際上是累積頻率直方圖曲線。依據(jù)樣本以頻率估計(jì)概率,當(dāng)n充分大時(shí),是總體分布函數(shù)的近似。例7生成指數(shù)分布隨機(jī)數(shù),計(jì)算其經(jīng)驗(yàn)分布函數(shù)值并繪圖,并與其分布函數(shù)做對(duì)比。代碼:X=exprnd(3,100,1);[fp,xp]=ecdf(X);%計(jì)算經(jīng)驗(yàn)分布函數(shù)值subplot(1,2,1)ecdfhist(fp,xp,20);%繪制頻率直方圖subplot(1,2,2)plot(xp,fp,'r')%繪制經(jīng)驗(yàn)分布函數(shù)圖形(連線型)holdon[h,stats]=cdfplot(X)%繪制經(jīng)驗(yàn)分布函數(shù)圖形(階梯型)x=0:0.01:15;y=expcdf(x,3);plot(x,y,'g');legend('連線型經(jīng)驗(yàn)分布函數(shù)','階梯型經(jīng)驗(yàn)分布函數(shù)','分布函數(shù)');運(yùn)行結(jié)果:h=177.0125(圖形句柄)stats=min:0.0180max:27.9801mean:3.2968median:2.1667std:3.29693.直方圖定量數(shù)據(jù)常用直方圖來展示某變量取值的分布,利用直方圖可以估計(jì)總體的概率密度。例8隨機(jī)生成服從F(3,5)分布的樣本數(shù)據(jù),繪制直方圖并與該分布的真實(shí)概率密度曲線做對(duì)比。代碼:n=5000;X=frnd(3,5,n,1);%生成F分布隨機(jī)數(shù)m=150;%分組區(qū)間數(shù)a=min(X);b=max(X);d=(b-a)/m;%分組寬度[r,xout]=hist(X,[a:d:b]);%或者[r,xout]=hist(X,m);%計(jì)算直方圖數(shù)據(jù),r返回每段的頻數(shù),xout返回每段的中心位置f=r./(n*d);%計(jì)算頻率bar(xout,f);%繪制頻率直方圖holdonx=0:0.01:10;y=fpdf(x,3,5);plot(x,y,'k-');axis([01001]);title('頻率密度直方圖');運(yùn)行結(jié)果:注:也可以用例7中方法繪制頻率直方圖:[fp,xp]=ecdf(X);%計(jì)算經(jīng)驗(yàn)分布函數(shù)值ecdfhist(fp,xp,20);%繪制頻率直方圖4.繪制分布的概率圖形normplot(X)——繪制X的正態(tài)分布概率圖形(若X為矩陣,則針對(duì)每列繪制);可以用來驗(yàn)證數(shù)據(jù)X是否服從正態(tài)分布,若是,則近似一條直線。類似的還有,weibplot(X)——繪制X的威布爾分布概率圖形。例9隨機(jī)生成服從正態(tài)分布的隨機(jī)數(shù)據(jù),繪制其正態(tài)概率分布圖形,驗(yàn)證數(shù)據(jù)的正態(tài)性。代碼:X=normrnd(5,1.44,100,1);normplot(X)運(yùn)行結(jié)果:八、箱線圖又稱為盒形圖。在一條數(shù)軸上,以數(shù)據(jù)的上下四分位數(shù)(Q1-Q3)為界畫一個(gè)矩形盒子(中間50%的數(shù)據(jù)落在盒內(nèi));在數(shù)據(jù)的中位數(shù)位置畫一條線段為中位線;默認(rèn)延長(zhǎng)線不超過盒長(zhǎng)的1.5倍,之外的點(diǎn)認(rèn)為是異常值(用+標(biāo)記)。盒形圖的主要應(yīng)用就是,剔除數(shù)據(jù)的異常值、判斷數(shù)據(jù)的偏態(tài)和尾重。代碼:boxplot(X,notch,'sym',vert,whis)當(dāng)notch=1時(shí),產(chǎn)生一凹盒圖,notch=0時(shí)產(chǎn)生一矩箱圖;sym表示異常值的標(biāo)記符號(hào),默認(rèn)值為“+”;當(dāng)vert=0時(shí),生成水平盒圖,vert=1時(shí),生成豎直盒圖(默認(rèn)值vert=1);whis定義“須線”的長(zhǎng)度,默認(rèn)值為1.5.例10繪制箱線圖。代碼:x1=normrnd(5,1,100,1);x2=normrnd(6,1,100,1);x=[x1x2];boxplot(x,0,'g+',1,1.5)運(yùn)行結(jié)果:注:若有異常值,應(yīng)先去掉異常值,再重新繪制修正的箱線圖。九、參數(shù)估計(jì)刻畫總體某方面概率特性的量,稱為參數(shù);當(dāng)某參數(shù)未知時(shí),從總體抽取樣本,用某種方法(矩估計(jì)、最大似然估計(jì))對(duì)該未知參數(shù)進(jìn)行估計(jì),就是參數(shù)估計(jì)。通過構(gòu)造樣本的函數(shù),給出未知參數(shù)的估計(jì)值(點(diǎn)估計(jì))、取值范圍(區(qū)間估計(jì))。1.通過格式(基于最大似然估計(jì))[phat,pci]=分布名縮寫+fit(X,alpha)phat返回參數(shù)的點(diǎn)估計(jì)值,pci返回區(qū)間估計(jì)的兩端點(diǎn);alpha為顯著水平,即估計(jì)結(jié)果具有(1-alpha)×100%的置信度。注意:對(duì)于二項(xiàng)分布的參數(shù)估計(jì)需要帶參數(shù)“N”表示試驗(yàn)次數(shù):[phat,pci]=binofit(x,N,alpha)2.或者使用[phat,pci]=mle(‘分布名縮寫’,X,alpha)對(duì)于二項(xiàng)分布為:[phat,pci]=mle(‘分布名縮寫’,X,alpha,N)3.求最大對(duì)數(shù)似然函數(shù)值[logL,info]=分布名縮寫+like(給定參數(shù),X)其中,給定參數(shù)為行向量形式,輸入的是參數(shù)的極大似然估計(jì)值;info返回回Fisher逆信息矩陣,其對(duì)角線為為相應(yīng)參數(shù)的漸近方差。例11某廠生產(chǎn)的滾珠隨機(jī)抽取10個(gè),測(cè)得滾珠直徑(mm)如下:15.1414.8115.1115.2615.0815.1715.1214.9515.0514.87設(shè)測(cè)定值總體服從N(μ,σ2),μ和σ未知,分別求μ和σ的最大似然估計(jì)以及95%的置信區(qū)間。代碼:X=[15.1414.8115.1115.2615.0815.1715.1214.9515.0514.87];[muhat,sigmaheat,muci,sigmaci]=normfit(X,0.05)運(yùn)行結(jié)果:muhat=15.0560sigmahat=0.1397muci=14.956115.1559sigmaci=0.09610.2550logL=-5.9933info=0.00200.00000.00000.0011十、假設(shè)檢驗(yàn)實(shí)際中,我們只能抽取部分樣本,做統(tǒng)計(jì)分析得到統(tǒng)計(jì)結(jié)果,進(jìn)一步推斷總體的特征,但是這種推斷必然有可能犯錯(cuò),犯錯(cuò)的概率為多少時(shí)應(yīng)該接受這種推斷呢?為此,統(tǒng)計(jì)學(xué)家就開發(fā)了一些統(tǒng)計(jì)方法進(jìn)行統(tǒng)計(jì)檢定,通過把所得到的統(tǒng)計(jì)檢定值,與統(tǒng)計(jì)學(xué)家樹立了一些隨機(jī)變量的概率分布進(jìn)行對(duì)比,我們可以知道在百分之多少的機(jī)遇下會(huì)得到目前的結(jié)果。倘若經(jīng)比較后發(fā)現(xiàn),涌現(xiàn)這結(jié)果的機(jī)率很少,即是說,是在時(shí)機(jī)很少、很罕有的情況下才出現(xiàn);那我們便可以有信念地說,這不是巧合,該推斷結(jié)果是具有統(tǒng)計(jì)學(xué)上的意義的。否則,就是推斷結(jié)果不具有統(tǒng)計(jì)學(xué)意義。假設(shè)檢驗(yàn)是基于反證法思想:先提出原假設(shè)(H0),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性(P值)大小,如可能性小(P≤α),則認(rèn)為原假設(shè)不成立,若可能性大,則還不能認(rèn)為備擇假設(shè)(H1)成立。原假設(shè)與備擇假設(shè)是是完備且相互獨(dú)立的事件組,一般,原假設(shè)(H0)——研究者想收集證據(jù)予以反對(duì)的假設(shè);備擇假設(shè)(H1)——研究者想收集證據(jù)予以支持的假設(shè);假設(shè)檢驗(yàn)的P值是由檢驗(yàn)統(tǒng)計(jì)量的樣本觀察值得出的原假設(shè)可被拒絕的最小顯著水平。(1)雙側(cè)檢驗(yàn)(H1:μ≠μ0)I.原假設(shè)H0:μ=μ0,備擇假設(shè)H1:μ≠μ0;Ⅱ.根據(jù)樣本數(shù)據(jù)計(jì)算出統(tǒng)計(jì)量t的觀察值t0;Ⅲ.P值=P{|t|≥|t0|}=t0的雙側(cè)尾部的面積;Ⅳ.若P值≤α(在右尾部分),則在顯著水平α下拒絕H0;若P值>α,則在顯著水平α下接受H0;注意:α為臨界值,看P值在不在陰影部分(拒絕域),空白部分為接受域。(2)左側(cè)檢驗(yàn)(H1:μ<μ0)I.原假設(shè)H0:μ≥μ0,備擇假設(shè)H1:μ<μ0;Ⅱ.根據(jù)樣本數(shù)據(jù)計(jì)算出統(tǒng)計(jì)量t的觀察值t0(<0);Ⅲ.P值=P{t≤t0}=t0的左側(cè)尾部的面積;Ⅳ.若P值≤α(在左尾部分),則在顯著水平α下拒絕H0;若P值>α,則在顯著水平α下接受H0;(3)右側(cè)檢驗(yàn)(H1:μ>μ0)I.原假設(shè)H0:μ≤μ0,備擇假設(shè)H1:μ>μ0;Ⅱ.根據(jù)樣本數(shù)據(jù)計(jì)算出統(tǒng)計(jì)量t的觀察值t0(>0);Ⅲ.P值=P{t≥t0}=t0的右側(cè)尾部的面積;Ⅳ.若P值≤α(在右尾部分),則在顯著水平α下拒絕H0;若P值>α,則在顯著水平α下接受H0;1.總體標(biāo)準(zhǔn)差已知,單個(gè)正態(tài)總體均值的U檢驗(yàn)[h,p,muci,zval]=ztest(X,mu,sigma,alpha,tail)p返回p值,h=1或p≤alpha時(shí),拒絕H0;h=0或p>alpha時(shí)接受H0.muci返回總體均值的1-alpha置信區(qū)間;zval返回檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值;tail=’both’或’right’或’left’,用來規(guī)定雙側(cè)、右側(cè)、左側(cè)檢驗(yàn),默認(rèn)是’both’.例12某切割機(jī)正常工作時(shí),切割的金屬棒的長(zhǎng)度服從N(100,4),隨機(jī)抽取15根,測(cè)得長(zhǎng)度(mm)如下:9710210511299103102941009510598102100103假設(shè)總體方差不變,檢驗(yàn)該切割機(jī)是否正常,即總體均值是否等于100mm?顯著性水平取α=0.05.H0:μ=μ0=100,H1:μ≠μ0代碼:X=[9710210511299103102941009510598102100103];[h,p,muci,zval]=ztest(X,100,2,0.05)%h=1或p≤0.05時(shí),拒絕原假設(shè);h=0或p>0.05時(shí),接受原假設(shè)[h1,p1,muci1,zval1]=ztest(X,100,2,0.05,'right')運(yùn)行結(jié)果:h=1p=0.0282muci=100.1212102.1455zval=2.1947(U統(tǒng)計(jì)量值)h1=1p1=0.0141uci1=100.2839Infzval1=2.1947由于p值=0.0282<α=0.05,拒絕原假設(shè)H0,故結(jié)論是:在顯著水平α=0.05下,設(shè)備工作不正常。注意到,總體均值的置信區(qū)間均大于100,有必要繼續(xù)做假設(shè)檢驗(yàn):H0:μ≤μ0=100,H1:μ>μ0經(jīng)檢驗(yàn),p值=0.0141<α=0.05,拒絕原假設(shè)H0,故結(jié)論是:在顯著水平α=0.05下,總體均值大于100.2.t檢驗(yàn)t檢驗(yàn),用來檢驗(yàn)“單樣本均值與已知均值、兩獨(dú)立樣本均值、配對(duì)設(shè)計(jì)資料的均值”是否存在差異,這種差異是否能推論至總體。t檢驗(yàn)適用于樣本含量較小(比如n<60,大樣本數(shù)據(jù)可以用U檢驗(yàn)),適用條件:①數(shù)據(jù)服從正態(tài)分布(做正態(tài)性檢驗(yàn));②滿足方差齊性(即兩樣本的總體方差相等,做F檢驗(yàn));若數(shù)據(jù)不滿足①,②,可以嘗試對(duì)數(shù)據(jù)做變量變換:對(duì)數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等。(1)總體標(biāo)準(zhǔn)差未知,單個(gè)正態(tài)總體均值的t檢驗(yàn)[h,p,muci,stats]=ttest(X,x0,alpha,tail)(2)總體標(biāo)準(zhǔn)差未知,兩正態(tài)總體均值的t檢驗(yàn)[h,p,muci,stats]=ttest2(X,Y,alpha,tail,vartype)vartype用來指定方差類型:’equal’(方差齊)、’unequal’(方差不齊).例13某化肥廠用自動(dòng)包裝機(jī)包裝化肥,某日測(cè)得9包化肥的質(zhì)量(kg)如下:49.450.550.751.749.847.949.251.448.9假設(shè)每包化肥的質(zhì)量服從正態(tài)分布,是否可以認(rèn)為每包化肥的平均質(zhì)量為50kg?顯著性水平取α=0.05.H0:μ=μ0=50,H1:μ≠μ0代碼:X=[49.450.550.751.749.847.949.251.448.9];[h,p,muci,stats]=ttest(X,50,0.05)運(yùn)行結(jié)果:h=0p=0.8961muci=48.994350.8945stats=tstat:-0.1348df:8sd:1.2360經(jīng)檢驗(yàn),p值=0.8961>α=0.05,接受原假設(shè),故結(jié)論是:在顯著水平α=0.05下,每包化肥的平均質(zhì)量等于50kg.例14甲、乙兩臺(tái)機(jī)床加工同一種產(chǎn)品,從這兩臺(tái)機(jī)床加工的產(chǎn)品中隨機(jī)抽取若干件,測(cè)得產(chǎn)品直徑(mm)如下:甲機(jī)床:20.120.019.320.620.219.920.019.919.119.9乙機(jī)床:18.619.120.020.020.019.719.919.620.2設(shè)甲、乙兩機(jī)床加工的產(chǎn)品直徑分別服從N(μ1,σ12)和N(μ2,σ22),試比較兩臺(tái)機(jī)床加工的產(chǎn)品直徑是否有差異?顯著性水平取α=0.05.H0:μ1=μ2,H1:μ1≠μ2代碼:X=[20.120.019.320.620.219.920.019.919.119.9];Y=[18.619.120.020.020.019.719.919.620.2];[h,p,muci,stats]=ttest2(X,Y,0.05,'both','equal')運(yùn)行結(jié)果:h=0p=0.3191muci=-0.23460.6791stats=tstat:1.0263df:17sd:0.4713經(jīng)檢驗(yàn),p值=0.3191>α=0.05,接受原假設(shè),故結(jié)論是:在顯著水平α=0.05下,兩臺(tái)機(jī)床加工的產(chǎn)品直徑?jīng)]有顯著差異。3.總體均值未知,單個(gè)正態(tài)總體方差的χ2檢驗(yàn)卡方的統(tǒng)計(jì)原理,是取觀

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論