第10講數(shù)據(jù)統(tǒng)計(jì)分析與描述_第1頁(yè)
第10講數(shù)據(jù)統(tǒng)計(jì)分析與描述_第2頁(yè)
第10講數(shù)據(jù)統(tǒng)計(jì)分析與描述_第3頁(yè)
第10講數(shù)據(jù)統(tǒng)計(jì)分析與描述_第4頁(yè)
第10講數(shù)據(jù)統(tǒng)計(jì)分析與描述_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2021/7/31數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)后勤工程學(xué)院數(shù)學(xué)教研室數(shù)據(jù)的統(tǒng)計(jì)描述和分析實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)內(nèi)容1、直觀了解統(tǒng)計(jì)基本內(nèi)容。2、掌握用數(shù)學(xué)軟件包求解統(tǒng)計(jì)問(wèn)題。1、統(tǒng)計(jì)的基本理論。2、用數(shù)學(xué)軟件包求解統(tǒng)計(jì)問(wèn)題。3、實(shí)驗(yàn)作業(yè)。統(tǒng)計(jì)的基本概念參數(shù)估計(jì)假設(shè)檢驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)描述和分析2021/7/331、表示位置的統(tǒng)計(jì)量—平均值和中位數(shù)n

iX平均值(或均值,數(shù)學(xué)期望):

X

=i=11n中位數(shù):將數(shù)據(jù)由小到大排序后位于中間位置的那個(gè)數(shù)值.2、表示變異程度的統(tǒng)計(jì)量—標(biāo)準(zhǔn)差、方差和極差11ni=1i(

X

-

X

)2

]2n

-1標(biāo)準(zhǔn)差:s

=[它是各個(gè)數(shù)據(jù)與均值偏離程度的度量.方差:標(biāo)準(zhǔn)差的平方.極差:樣本中最大值與最小值之差.一、統(tǒng)計(jì)量2021/7/343.

表示分布形狀的統(tǒng)計(jì)量—偏度和峰度nis偏度:

g

=331(

X

-

X

)1n

isi=1

i=144峰度:

g

2

=(

X

-

X

)1偏度反映分布的對(duì)稱(chēng)性,g1

>0

稱(chēng)為右偏態(tài),此時(shí)數(shù)據(jù)位于均值右邊的比位于左邊的多;g1

<0

稱(chēng)為左偏態(tài),情況相反;而g1

接近0則可認(rèn)為分布是對(duì)稱(chēng)的.峰度是分布形狀的另一種度量,正態(tài)分布的峰度為3,若g2

比3大很多,表示分布有沉重的尾巴,說(shuō)明樣本中含有較多遠(yuǎn)離均值的數(shù)據(jù),因而峰度可用作衡量偏離正態(tài)分布的尺度之一.nX4. k

階原點(diǎn)矩:Vk

=

kii=11nn2021/7/35kk

階中心矩:U

k

=

ii=1(

X

-

X

)1n二、分布函數(shù)的近似求法1、整理資料:把樣本值

x1,x2,…,xn

進(jìn)行分組,先將它們依大小次序排列得

x*

x*

x*

.在包含[x*

,

x*

]

的區(qū)間[a,b]內(nèi)插入一些等分點(diǎn):1

2

n

1

na

<

x

'

<

x

'

<

<

x

'

<

b,

注意要使每一個(gè)區(qū)間(x

'

,

x

'

]

(i=1,2,…,n-1)1

2

n

i i

+1內(nèi)都有樣本觀測(cè)值xi(i=1,2,…,n-1)落入其中.2、求出各組的頻數(shù)和頻率:統(tǒng)計(jì)出樣本觀測(cè)值在每個(gè)區(qū)間(x

'

,

x

'

]

中出i

i+1n現(xiàn)的次數(shù)ni

,它就是這區(qū)間或這組的頻數(shù).計(jì)算頻率fin=

i.1

2

n3、作頻率直方圖:在直角坐標(biāo)系的橫軸上,標(biāo)出x

',x

',,x

'各點(diǎn),分別以i2021/7/36fiDx

'的矩形,

Dx

'

=

x

'

-

x

'

,

i

=

1,2,,

n

-1

,即得i

i

+1

i(x

',x

'

]為底邊,作高為i

i

+1頻率直方圖.三、幾個(gè)在統(tǒng)計(jì)中常用的概率分布2460.10.050-4 -2

00.40.350.30.250.20.152s

22ps-(

x-m

)21.正態(tài)分布N

(m,s

2

)密度函數(shù):

p(x)=

1

edyex分布函數(shù):F

(x)2s

2

1

2ps(

y-m

)2--¥=其中m

為均值,s

2

為方差,-¥<x

<+¥

.標(biāo)準(zhǔn)正態(tài)分布:N(0,1)密度函數(shù)x2j

(x)=

1

e

-

22px2021/7/37e

2

dyy

21--¥F

(x)

=2p,分布函數(shù)051015200.160.140.120.10.080.060.040.0202、c

2

分布c

2

n)若隨機(jī)變量X

1,X

2

,…Xn

相互獨(dú)立,都服從標(biāo)準(zhǔn)正態(tài)分布N(

0,1),則隨機(jī)變量1

2

nY=

X

2

+

X

2

+

+

X

2服從自由度為n

的c

2

分布,記為Y~

c

2

n)

.Y

的均值為n,方差為2n.2021/7/383、t

分布t(n)若X~N(0,1),Y~

c

2

(n),且相互獨(dú)立,則隨機(jī)變量YnXT

=服從自由度為n

的t

分布,記為T(mén)~t(n).t

分布t(20)的密度函數(shù)曲線和N(0,1)的曲線形狀相似.理論上nfi

時(shí),T~t(n)fi

N(0,1).-4-202460.40.350.30.250.20.150.10.050-62021/7/392021/7/3104.F

分布F(n1,n2)若X~

c

2

(n1),Y~

c

2

(n2),且相互獨(dú)立,則隨機(jī)變量YXF

=

n1n2服從自由度為(n1,n2)的F

分布,記作F~

F(n1,n2).由F

分布的定義可以得到

F

分布的一個(gè)重要性質(zhì):1

22

1若

F~F(n

,n

),則

1

~

F

(n

,

n

)F00.511.522.53010.90.80.70.60.50.40.30.20.1返回F分布F(10,50)的密度函數(shù)曲線無(wú)論總體X

的分布函數(shù)F(x;q1

,q2,,qk

)的類(lèi)型已知或未知,我們總是需要去估計(jì)某些未知參數(shù)或數(shù)字特征,這就是參數(shù)估計(jì)問(wèn)題.即參數(shù)估計(jì)就是從樣本(1

2

n?i1X

,X

,…,X

)出發(fā),構(gòu)造一些統(tǒng)計(jì)量q

(X

,X2,…,Xn)(i=1,2,…,k)去估計(jì)總體X

中的某些參數(shù)(或數(shù)字特征)qi

(i=1,2,…,k).這樣的統(tǒng)計(jì)量稱(chēng)為估計(jì)量.1.點(diǎn)估計(jì):構(gòu)造(X

,1

2

n?iX

,…,X

)的函數(shù)q

(X

,1

2

nX

,…,X

)作為參數(shù)q

的點(diǎn)估計(jì)量,稱(chēng)統(tǒng)計(jì)量q?i

i

i為總體X

參數(shù)q

的點(diǎn)估計(jì)量.2.區(qū)間估計(jì):構(gòu)造兩個(gè)函數(shù)qi1

(X1,X2,…,Xn)和qi

2

(X1,X2,…,Xn)做成區(qū)間,把這(qi1

,qi

2

)作為參數(shù)qi

的區(qū)間估計(jì).2021/7/311一、點(diǎn)估計(jì)的求法(一)矩估計(jì)法假設(shè)總體分布中共含有k

個(gè)參數(shù),它們往往是一些原

點(diǎn)矩或一些原點(diǎn)矩的函數(shù),例如,數(shù)學(xué)期望是一階原點(diǎn)矩,方差是二階原點(diǎn)矩與一階原點(diǎn)矩平方之差等.因此,要想估計(jì)總體的某些參數(shù)qi

(i=1,2,…k),由于k

個(gè)參數(shù)一定可以表為不超過(guò)k

階原點(diǎn)矩的函數(shù),很自然就會(huì)想到用樣本的r階原點(diǎn)矩去估計(jì)總體相應(yīng)的r階原點(diǎn)矩,用樣本的一些原點(diǎn)矩的函數(shù)去估計(jì)總體的相應(yīng)的一些原點(diǎn)矩的函數(shù),再將k

個(gè)參數(shù)反解出來(lái),從而求出各個(gè)參數(shù)的估計(jì)值.這就是矩估計(jì)法,它是最簡(jiǎn)單的一種參數(shù)估計(jì)法.2021/7/312(二)極大似然估計(jì)法i

=1極大似然法的想法是:若抽樣的結(jié)果得到樣本觀測(cè)值x1,x2,…,xn,則我們應(yīng)當(dāng)這樣選取參數(shù)qi

的值,使這組樣本觀測(cè)值出現(xiàn)的可能性最大.即構(gòu)造似然函數(shù):L(q1

,q2

,,qk

)

=

P(

X1

=

x1

,

X

2

=

x2

,,

X

n

=

xn

)

=

P(

X1

=

x1

)P(

X

2

=

x2

)P(

X

n

=

xn

)n=

p

(

x1

,q

1

,

q

k

)

p

(

x

2

,q

1

,

,q

k

)

p

(

x

n

,q

1

,

q

k

)

=

p

(

x

i

,q

1

,

q

k

)1

k

i

i?使L(q

,,q

)達(dá)到最大,從而得到參數(shù)q

的估計(jì)值q

.此估計(jì)值叫極大似然估計(jì)值.函數(shù)L(q1

,,qk

)稱(chēng)為似然函數(shù).求極大似然估計(jì)值的問(wèn)題,就是求似然函數(shù)L(q1

,,qk

)的最大值的問(wèn)題,則?L

=

0?qii

=

1,2,,

k即?LnL

=

0?qii

=

1,2,,

k2021/7/313設(shè)總體

X

的分布中含有未知參數(shù)q

,若對(duì)于給定的概率1-a?11

2X

,X

,…,n?2X

)和q(12X

,X

,…,(0

<a

<1),存在兩個(gè)統(tǒng)計(jì)量q

(Xn),使得P(q?

<q

<q?

)

=1-a1

2則稱(chēng)隨機(jī)區(qū)間(q?

,q?

)為參數(shù)q

的置信水平為1-a

的置信區(qū)間,q?

稱(chēng)為1

2

12置信下限,q?

稱(chēng)為置信上限.二、區(qū)間估計(jì)的求法2021/7/31422na1

a1--EX

在置信水平

1-a

下的置信區(qū)間為[

X

-

u

s

,

X

+

us

]

.n2.未知方差DX,求EX的置信區(qū)間nsnsaa1-21-2,

X

+

tEX

在置信水平1-a

下的置信區(qū)間為[X

-t]

.(一)數(shù)學(xué)期望的置信區(qū)間1、已知DX,求EX的置信區(qū)間設(shè)樣本(X1,X2,…,Xn)來(lái)自正態(tài)母體

X,已知方差DX

=

s

2

,,2021/7/315(二)方差的區(qū)間估計(jì)DX

在置信水平1-a

下的置信區(qū)間為[2a21

ac

2c

2(n

-1)s

2(n

-1)s

2-]

.返回對(duì)總體X的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀察值,運(yùn)用數(shù)理統(tǒng)計(jì)的分析方法,檢驗(yàn)這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè).參數(shù)檢驗(yàn):如果觀測(cè)的分布函數(shù)類(lèi)型已知,這時(shí)構(gòu)造出的統(tǒng)計(jì)量依賴(lài)于總體的分布函數(shù),這種檢驗(yàn)稱(chēng)為參數(shù)檢驗(yàn).參數(shù)檢驗(yàn)的目的往往是對(duì)總體的參數(shù)及其有關(guān)性質(zhì)作出明確的判斷.非參數(shù)檢驗(yàn):如果所檢驗(yàn)的假設(shè)并非是對(duì)某個(gè)參數(shù)作出明確的判斷,因而必須要求構(gòu)造出的檢驗(yàn)統(tǒng)計(jì)量的分布函數(shù)不依賴(lài)于觀測(cè)值的分布函數(shù)類(lèi)型,這種檢驗(yàn)叫非參數(shù)檢驗(yàn).如要求判斷總體分布類(lèi)型的檢驗(yàn)就是非參數(shù)檢驗(yàn).2021/7/316假設(shè)檢驗(yàn)的一般步驟是:根據(jù)實(shí)際問(wèn)題提出原假設(shè)H0與備擇假設(shè)H1,即說(shuō)明需要檢驗(yàn)的假設(shè)的具體內(nèi)容;選擇適當(dāng)?shù)慕y(tǒng)計(jì)量,并在原假設(shè)H0成立的條件下確定該統(tǒng)計(jì)量的分布;按問(wèn)題的具體要求,選取適當(dāng)?shù)娘@著性水平a

,并根據(jù)統(tǒng)計(jì)量的分布查表,確定對(duì)應(yīng)于a

的臨界值.一般a

取0.05,0.01

或0.10根據(jù)樣本觀測(cè)值計(jì)算統(tǒng)計(jì)量的觀測(cè)值,并與臨界值進(jìn)行比較,從而在檢驗(yàn)水平a

條件下對(duì)拒絕或接受原假設(shè)H0

作出判斷.2021/7/317一、參數(shù)檢驗(yàn)(一)單個(gè)正態(tài)總體均值檢驗(yàn)設(shè)取出一容量為n

的樣本,得到均值X和標(biāo)準(zhǔn)差s,現(xiàn)要

對(duì)總體均值m

是否等于某給定值m

0

進(jìn)行檢驗(yàn).記H0

:

m

=

m

0

;

H

1

:

m

?

m

0稱(chēng)H0

為原假設(shè),H1

為備擇假設(shè),兩者擇其一:接受H0

;拒絕H0

,即接受H1

.2021/7/318用u

檢驗(yàn),檢驗(yàn)的拒絕域?yàn)?1-1-1-W

={

z

>

u

a

}

W

=

{z

<

-ua

或z

>

u

a

}2

2H0H1總體方差s

2

已知X

-

m0統(tǒng)計(jì)量z=sn總體方差s

2

未知統(tǒng)計(jì)量t

=X

-m0sn在顯著水平a

下拒絕H0,若Ⅰm

=

m0m

?

m0z

>

u

a1-2t

>

t

a

(n

-1)1-2Ⅱm

=

m0m

>

m0z

>

u1-at

>

t1-a

(n

-1)Ⅲm

=

m0m

<

m0z

<

-u1-at

<

-t1-a

(n

-1)1、總體方差s

2

已知2021/7/3192.總體方差s

2

未知用樣本方差s

2

代替總體方差s

2

,這種檢驗(yàn)叫t

檢驗(yàn).(二)單個(gè)正態(tài)總體方差檢驗(yàn)設(shè)X

,X

,…,X

是來(lái)自正態(tài)總體N

(m,s

2

)的樣本,欲檢驗(yàn)假設(shè):1

2

nH

:

s

2

=

s

2

H

:

s

2

?

s

2

(或

s

2

>

s

2

s

2

<

s

2)0

0

1

0

0

0這叫c

2

檢驗(yàn).H0H1均值m

已知統(tǒng)計(jì)量2

1

n

2

2c

=

2

(

X

i

-

m)s

0

i=1均值m

未知統(tǒng)計(jì)量2

1

n

2

2c

=

2

(

X

i

-

X

)s

0

i=1在顯著水平a

下拒絕H0,若Ⅰs

2

=

s

20s

2

?

s

20c

2

<c

2

(n)或a2c

2

>

c

2

(n)1

a-2c

2

<c

2

(n

-1)或a2c

2

>

c

2

(n

-1)1

a-2Ⅱs

2

=

s

20s

2

>

s

20c

2

>

c

2

(n)1-ac

2

>

c

2

(n

-1)1-aⅢs

2

=

s

20s

2

<

s

20c

2

<

c

2

(n)ac

2

<

c

2

(n

-1)a2021/7/320(三)兩個(gè)正態(tài)總體均值檢驗(yàn)構(gòu)造統(tǒng)計(jì)量s

2

s

2 1

+

2

n1

n2z

=

X

-Y

.1、s

2

與s

2

已知時(shí)1

22、s

2

與s

2

未知但相等時(shí)1

21

1

2

2n1

+

n2(n

-1)s

2

+

(n

-1)s

2構(gòu)造統(tǒng)計(jì)量

t

=

X

-Y

n1n2

(n1

+

n2

-

2)

,H0H1方差s

2

,s

2

已知1

2統(tǒng)計(jì)量z方差s

2

,s

2

未知但相等1

2統(tǒng)計(jì)量t在顯著水平a

下拒絕H0,若Ⅰm1

=

m2m1

?

m2z

>

u

a1-2t

>

t

a

(n1

+

n2

-

2)1-2Ⅱm1

=

m2m1

>

m2z

>

u1-at

>

t1-a

(n1

+

n2

-

2)Ⅲm1

=

m2m1

<

m2z

<

-u1-at

<

-t1-a

(n1

+

n2

-

2)(四)兩個(gè)正態(tài)總體方差檢驗(yàn)設(shè)樣本X1,X2,…,Xn1

與Y1,Y2

,…,Yn2

分別來(lái)自正態(tài)總體N

(m

,s

2

)與1

1N

(m

,s

2

),檢驗(yàn)假設(shè):2

2H

:s

2

=s

2

H

:s

2

?s

2

(或s

2

>s

2

或s

2

<s

2

)0

1

2

1

1

2

1

2

1

2H0H1均值m1

,m2

已知統(tǒng)計(jì)量F0均值m1

,m2

未知統(tǒng)計(jì)量F在顯著水平a

下拒絕H0,若Ⅰs

2

=

s

21

2s

2

?

s

21

2F0

>F

a

(n1

,n2

)或1-2F

<

10

F

(n

,

n

)1

a

2

1-2F

>F

a

(n1

-1,n2

-1)或1-2F

<

1F

a

(n2

-1,

n1

-1)1-2Ⅱs

2

=

s

21

2s

2

>

s

21

2F0

>

F1-a

(n1

,

n2

)F

>

F1-a

(n1

-1,

n2

-1)Ⅲs

2

=

s

21

2s

2

<

s

21

2F

<

10

F

(n

,

n

)1-a

2

1F

<

1F1-a

(n2

-1,

n1

-1)222011n2i=1

i

2n1

i

1nnF(Y

-

m

)(

X

-

m

)=

1

i=1

,2s

2s

21

2F

=

1

(設(shè)s

2

?s

2

)二、非參數(shù)檢驗(yàn)2021/7/323(一)皮爾遜c

2

擬合檢驗(yàn)法(二)概率紙檢驗(yàn)法概率紙是一種判斷總體分布的簡(jiǎn)便工具.使用它們,可以很快地判斷總體分布的類(lèi)型.概率紙的種類(lèi)很多.如果一個(gè)總體的分布F(X)是正態(tài)的,則(x,F(xiàn)(x))點(diǎn)在正態(tài)概率紙上應(yīng)呈一條直線.設(shè)X1,X2,…,Xn

是從正態(tài)總體中抽得的樣本觀測(cè)值,將它們按大小排列后,記作X(1)£

X(2)£…£X(n).則當(dāng)n較大時(shí),樣本的經(jīng)驗(yàn)分布函數(shù)Fn(x)和理論分布F(x)很接近.因此,如果用(x,F(xiàn)(x))畫(huà)圖,則必應(yīng)近似為一條直線.返回統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令數(shù)據(jù)的錄入、保存和調(diào)用基本統(tǒng)計(jì)量常見(jiàn)概率分布的函數(shù)頻數(shù)直方圖的描繪參數(shù)估計(jì)假設(shè)檢驗(yàn)綜合實(shí)例返回2021/7/324一、數(shù)據(jù)的錄入、保存和調(diào)用例1上海市區(qū)社會(huì)商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下年份78798081828284858687職工工資總額

(億元)23.827.631.632.433.734.943.252.863.873.4商品零售總額

(億元)41.451.861.767.968.777.595.9137.4155.0175.0統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令2021/7/3251、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。命令格式:x=a:h:bt=78:872、分別以x和y代表變量職工工資總額和商品零售總額。x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4]y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]3、將變量t、x、y的數(shù)據(jù)保存在文件data中。save

data

t

x

y4、進(jìn)行統(tǒng)計(jì)分析時(shí),調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù)。load

dataTo

MATLAB(txy)2021/7/3261、輸入矩陣:

data=[78,79,80,81,82,83,84,85,86,87,88;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]2、將矩陣data的數(shù)據(jù)保存在文件data1中:save

data1

data3、進(jìn)行統(tǒng)計(jì)分析時(shí),先用命令:

load

data1調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣

data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y:t=data(1,:)x=data(2,:)y=data(3,:)若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令:data(:,j)To

MATLAB(data)返回2021/7/327二、基本統(tǒng)計(jì)量對(duì)隨機(jī)變量x,計(jì)算其基本統(tǒng)計(jì)量的命令如下:均值:mean(x)中位數(shù):median(x)標(biāo)準(zhǔn)差:std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)例對(duì)例1中的職工工資總額x,可計(jì)算上述基本統(tǒng)計(jì)量。2021/7/328To

MATLAB(tjl)返回三、常見(jiàn)概率分布的函數(shù)2021/7/329常見(jiàn)的幾種分布的命令字符為:正態(tài)分布:norm帕松分布:poiss威布爾分布:weibt分布:t指數(shù)分布:expb

分布:betac

2

分布:chi2F分布:FMatlab工具箱對(duì)每一種分布都提供五類(lèi)函數(shù),其命令字符為:概率密度:pdf

概率分布:cdf逆概率分布:inv

均值與方差:stat隨機(jī)數(shù)生成:rnd(當(dāng)需要一種分布的某一類(lèi)函數(shù)時(shí),將以上所列的分布命令字符與函數(shù)命令字符接起來(lái),并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.)To

MATLAB(liti2)如對(duì)均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:1、密度函數(shù):p=normpdf(x,mu,sigma)(當(dāng)mu=0,sigma=1時(shí)可缺省)例

2

畫(huà)出正態(tài)分布

N

(0,1)

N

(0,22

)

的概率密度函數(shù)圖形.在Matlab中輸入以下命令:

x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)2021/7/330To

MATLAB(liti3)2021/7/3313、逆概率分布:x=norminv(P,mu,sigma).

即求出x

,使得P{X<x}=P.此命令可用來(lái)求分位數(shù).2、概率分布:P=normcdf(x,mu,sigma)例

3.

計(jì)算標(biāo)準(zhǔn)正態(tài)分布的概率

P{-1<X<1}.命令為:P=normcdf(1)-normcdf(-1)結(jié)果為:P=0.6827a21-例

4

取a

=

0.05

,求u1-au2

21-a的含義是:

X

~

N

(0,1)

,P{X<

u2}=1

-

aa

=

0.05

時(shí),P=0.975,

u0.975

=

norminv(0.975)=1.96To

MATLAB(liti4)To

MATLAB(liti5)2021/7/3324、均值與方差:[m,v]=normstat(mu,sigma)例5

求正態(tài)分布N(3,52)的均值與方差.命令為:[m,v]=normstat(3,5)結(jié)果為:m=3,v=25結(jié)果為:M=0.95672.01252.88543.83345.02886.1191To

MATLAB(liti6)5、隨機(jī)數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生m

n階的正態(tài)分布隨機(jī)數(shù)矩陣.例6

命令:M=normrnd([1

2

3;4

5

6],0.1,2,3)此命令產(chǎn)生了2

3的正態(tài)分布隨機(jī)數(shù)矩陣,各數(shù)分別服從N(1,0.12),

N(2,22),

N(3,

32),

N(4,0.12),

N(5,

22),N(6,

32)返回1、給出數(shù)組data的頻數(shù)表的命令為:

[N,X]=hist(data,k)此命令將區(qū)間[min(data),max(data)]分為k個(gè)小區(qū)間(缺省為10),返回?cái)?shù)組data落在每一個(gè)小區(qū)間的頻數(shù)N和每一個(gè)小區(qū)間的中點(diǎn)X.2、描繪數(shù)組data的頻數(shù)直方圖的命令為:hist(data,k)四、頻數(shù)直方圖的描繪返回2021/7/333五、參數(shù)估計(jì)2021/7/3341、正態(tài)總體的參數(shù)估計(jì)設(shè)總體服從正態(tài)分布,則其點(diǎn)估計(jì)和區(qū)間估計(jì)可同時(shí)由以下命令獲得:[muhat,sigmahat,muci,sigmaci]

=

normfit(X,alpha)此命令在顯著性水平alpha下估計(jì)數(shù)據(jù)X的參數(shù)(alpha缺省時(shí)設(shè)定為0.05),返回值muhat是X的均值的點(diǎn)估計(jì)值,

sigmahat是標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值,muci是均值的區(qū)間估計(jì),sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計(jì).2、其它分布的參數(shù)估計(jì)有兩種處理辦法:一.取容量充分大的樣本(n>50),按中心極限定理,它近似地服從正態(tài)分布;二.使用Matlab工具箱中具有特定分布總體的估計(jì)命令.(1)[muhat,muci]=expfit(X,alpha)-----在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì).(2)[lambdahat,

lambdaci]

=

poissfit(X,alpha)-----

在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X

的參數(shù)的點(diǎn)估計(jì)及其區(qū)間估計(jì).(3)[phat,

pci]

=

weibfit(X,alpha)-----

在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X

的參數(shù)的點(diǎn)估計(jì)及其區(qū)2021/7/335間估計(jì).返回六、假設(shè)檢驗(yàn)2021/7/336在總體服從正態(tài)分布的情況下,可用以下命令進(jìn)行假設(shè)檢驗(yàn).1、總體方差sigma2已知時(shí),總體均值的檢驗(yàn)使用z-檢驗(yàn)[h,sig,ci]

=

ztest(x,m,sigma,alpha,tail)檢驗(yàn)數(shù)據(jù)x

的關(guān)于均值的某一假設(shè)是否成立,其中sigma

為已知方差,alpha

為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于

tail

的取值:tail=0,檢驗(yàn)假設(shè)“x

的均值等于m”

tail=1,檢驗(yàn)假設(shè)“x

的均值大于m”

tail=-1,檢驗(yàn)假設(shè)“x

的均值小于m”

tail的缺省值為0,alpha的缺省值為0.05.返回值h

為一個(gè)布爾值,h=1

表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig

為假設(shè)成立的概率,ci

為均值的

1-alpha

置信區(qū)間.例7

Matlab統(tǒng)計(jì)工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國(guó)1993年一月份和二月份的汽油平均價(jià)格(price1,price2分別是一,二月份的油價(jià),單位為美分),它是容量為20的雙樣本.假設(shè)一月份油價(jià)的標(biāo)準(zhǔn)偏差是一加侖四分幣(s=4),試檢驗(yàn)一月份油價(jià)的均值是否等于115.2021/7/337解作假設(shè):m=115.首先取出數(shù)據(jù),用以下命令:load

gas然后用以下命令檢驗(yàn)[h,sig,ci]

=

ztest(price1,115,4)返回:h=0,sig=0.8668,ci=[113.3970116.9030].檢驗(yàn)結(jié)果: 1.

布爾變量h=0,

表示不拒絕零假設(shè).

說(shuō)明提出的假設(shè)均值115是合理的.sig-值為0.8668,遠(yuǎn)超過(guò)0.5,不能拒絕零假設(shè)95%的置信區(qū)間為[113.4,116.9],它完全包括115,且精度很高..To

MATLAB(liti7)2、總體方差sigma2未知時(shí),總體均值的檢驗(yàn)使用t-檢驗(yàn)[h,sig,ci]=ttest(x,m,alpha,tail)檢驗(yàn)數(shù)據(jù)x

的關(guān)于均值的某一假設(shè)是否成立,其中

alpha

為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x

的均值等于m”tail=1,檢驗(yàn)假設(shè)“x

的均值大于m”

tail=-1,檢驗(yàn)假設(shè)“x

的均值小于m”

tail的缺省值為0,alpha的缺省值為0.05.返回值h

為一個(gè)布爾值,h=1

表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig

為假設(shè)成立的概率,ci

為均值的

1-alpha

置信區(qū)間.2021/7/338返回:h

=

1,sig

=4.9517e-004,ci

=[116.8

120.2].2021/7/339檢驗(yàn)結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說(shuō)明提出的假設(shè)油價(jià)均值115是不合理的.95%的置信區(qū)間為[116.8 120.2],

它不包括115,故不能接受假設(shè).sig-值為4.9517e-004,遠(yuǎn)小于0.5,不能接受零假設(shè).To

MATLAB(liti8)例8

試檢驗(yàn)例8中二月份油價(jià)

Price2的均值是否等于115.解

作假設(shè):m=115,

price2為二月份的油價(jià),不知其方差,故用以下命令檢驗(yàn)[h,sig,ci]

=

ttest(

price2

,115)3、兩總體均值的假設(shè)檢驗(yàn)使用t-檢驗(yàn)[h,sig,ci]=ttest2(x,y,alpha,tail)檢驗(yàn)數(shù)據(jù)x

,y

的關(guān)于均值的某一假設(shè)是否成立,其中

alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:2021/7/340tail=0,檢驗(yàn)假設(shè)“x的均值等于y的均值”tail=1,檢驗(yàn)假設(shè)“x的均值大于y的均值”tail=-1,檢驗(yàn)假設(shè)“x

的均值小于y的均值”tail的缺省值為0,alpha的缺省值為0.05.返回值h

為一個(gè)布爾值,h=1

表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig

為假設(shè)成立的概率,ci

為與x與y均值差的的1-alpha

置信區(qū)間.返回:h=1,sig=0.0083,ci=[-5.8,-0.9].2021/7/341檢驗(yàn)結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說(shuō)明提出的假設(shè)“油價(jià)均值相同”是不合理的.95%的置信區(qū)間為[-5.8,-0.9],說(shuō)明一月份油價(jià)比二月份油價(jià)約低1至6分.sig-值為0.0083,遠(yuǎn)小于0.5,不能接受“油價(jià)均相同”假設(shè).To

MATLAB(liti9)例9

試檢驗(yàn)例8中一月份油價(jià)Price1與二月份的油價(jià)Price2均值是否相同.解

用以下命令檢驗(yàn)[h,sig,ci]

=

ttest2(price1,price2)4、非參數(shù)檢驗(yàn):總體分布的檢驗(yàn)2021/7/342Matlab工具箱提供了兩個(gè)對(duì)總體分布進(jìn)行檢驗(yàn)的命令:(1)h

=

normplot(x)(2)h

=

weibplot(x)此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來(lái)自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來(lái)自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).返回例10一道工序用自動(dòng)化車(chē)床連續(xù)加工某種零件,由于刀具損壞等會(huì)出現(xiàn)故障.故障是完全隨機(jī)的,并假定生產(chǎn)任一零件時(shí)出現(xiàn)故障機(jī)會(huì)均相同.工作人員是通過(guò)檢查零件來(lái)確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀(jì)錄,故障出現(xiàn)時(shí)該刀具完成的零件數(shù)如下:459362624542509584433748815505612452434982640742565706

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論