概率與統(tǒng)計(jì)基礎(chǔ)_第1頁
概率與統(tǒng)計(jì)基礎(chǔ)_第2頁
概率與統(tǒng)計(jì)基礎(chǔ)_第3頁
概率與統(tǒng)計(jì)基礎(chǔ)_第4頁
概率與統(tǒng)計(jì)基礎(chǔ)_第5頁
已閱讀5頁,還剩90頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

概率與統(tǒng)計(jì)基礎(chǔ)1第1頁,共95頁,2023年,2月20日,星期五

一隨機(jī)變量與分布函數(shù)1、隨機(jī)試驗(yàn)滿足條件:(1)可在相同的條件下重復(fù)進(jìn)行;(2)試驗(yàn)結(jié)果不止一個,但事先能明確所有的結(jié)果;(3)試驗(yàn)前不能預(yù)知哪一個結(jié)果出現(xiàn)的實(shí)驗(yàn)稱為隨機(jī)實(shí)驗(yàn)。用E表示。2、樣本空間隨機(jī)試驗(yàn)E所有可能的結(jié)果組成的集合稱為樣本空間記為Ω

={e}試驗(yàn)的每—個可能結(jié)果稱為樣本點(diǎn)。3、隨機(jī)事件滿足某些條件的樣本點(diǎn)所組成的集合(為的子集),常用大寫字母A、B、C表示,組成隨機(jī)事件的一個樣本點(diǎn)發(fā)生稱為隨機(jī)事件發(fā)生。2第2頁,共95頁,2023年,2月20日,星期五例1:E1隨機(jī)試驗(yàn):拋一枚硬幣,觀察正面、反面了出現(xiàn)的情況。

樣本空間Ω

1:{H,T};E2:將一枚硬幣拋擲三次,觀察正面H、反面T出現(xiàn)的情況。Ω

2:{HHH,HHT,HTH,THH,HTT,THT,TTH,TTT};E3:將一枚硬幣拋擲三次,觀察出現(xiàn)正面的次數(shù)。

Ω

3:{0,1,2,3};E4:拋一顆骰子,觀察出現(xiàn)的點(diǎn)數(shù)。Ω

4:{1,2,3,4,5,6};E5:記錄某城市120急救電話臺一晝夜接到的呼喚次數(shù)。

Ω

5:{0,l,2,3,…};E6:在一批燈泡中任意抽取一只,測試它的壽命。Ω

6:{t︱t≥0};E7:記錄某地一晝夜的最高溫度和最低溫度。

Ω

7:{(x,y)︱T0≤x≤y≤T1},這里x示最低溫度,y表示最高溫度,并設(shè)這一地區(qū)的溫度不會小于To,也不會大于T1。3第3頁,共95頁,2023年,2月20日,星期五

在相同的條件下,進(jìn)行了n次試驗(yàn),在這n次試驗(yàn)中,事件A發(fā)生的次數(shù)nA稱為事件A發(fā)生的頻數(shù)。比值nA

/n稱為事件A發(fā)生的頻率,并記成?n(A)。4概率

對于一個隨機(jī)事件A(除必然事件和不可能事件外)來說,它在一次試驗(yàn)中可能發(fā)生,也可能不發(fā)生。我們希望知道的是事件在一次試驗(yàn)中發(fā)生的可能性。用一個數(shù)P(A)來表示該事件發(fā)生的可能性大小,這個數(shù)P(A)就稱為隨機(jī)事件A的概率。我們希望找到一個數(shù)來表示P(A)。嚴(yán)格定義應(yīng)用公理化三條件非負(fù)性、歸一性和可列可加性。頻率當(dāng)n足夠大時,?n(A)P(A)4第4頁,共95頁,2023年,2月20日,星期五

5、隨機(jī)變量隨機(jī)變量是定義在樣本空間記上的一個單值函數(shù),用來表示隨機(jī)現(xiàn)象的結(jié)果的變量。常用大寫字母X、Y…表示,隨機(jī)變量的取值具有隨機(jī)性,隨機(jī)變量的取值有一定的概率(按一定的概率取某個值)。樣本空間上可以定義多個隨機(jī)變量。隨機(jī)變量分為離散和連續(xù)隨機(jī)變量。用擲硬幣10次來說明上述概念擲硬幣為隨機(jī)實(shí)驗(yàn),={正面,反面}為樣本空間}.正面朝上的次數(shù)可以定義為隨機(jī)變量。6次正面朝上一個隨機(jī)事件A。在所有的實(shí)驗(yàn)中,出現(xiàn)6次朝上事件的頻率為A

的概率也可以將硬幣朝向作為隨機(jī)變量X:正面朝上X=1,否則X=05第5頁,共95頁,2023年,2月20日,星期五概率的重要性質(zhì)6第6頁,共95頁,2023年,2月20日,星期五概率的重要性質(zhì)7第7頁,共95頁,2023年,2月20日,星期五6、條件概率

在事件A

發(fā)生的條件下事件B

發(fā)生的概率稱為條件概率,記為滿足可列可加性:設(shè)B1

,B2

,…

兩兩互不相容的事件,即對于i≠j,BiBj=,i,j=1,2,…,則有8第8頁,共95頁,2023年,2月20日,星期五B1BnAB1AB2ABn全概率公式ABayes公式

全概率公式與Bayes公式B29第9頁,共95頁,2023年,2月20日,星期五6一維隨機(jī)變量分布函數(shù)

對于離散的隨機(jī)變量X,x1,x2,…xk是X的所有取值,則X的概率分布列(也稱概率分布)為:設(shè)

X為隨機(jī)變量,則對于任意實(shí)數(shù)x稱為X

的分布函數(shù),對離散型隨機(jī)變量,采用累加的方法求其分布函數(shù),有公式:Xx1x2…xk…pp(x1)…p(xk)…10第10頁,共95頁,2023年,2月20日,星期五

對連續(xù)型隨機(jī)變量,其分布函數(shù)公式:非負(fù)可積函數(shù)是它的概率密度函數(shù)右圖幾何意義,F(xiàn)(x)為陰影部分的面積yyxF(x)x11第11頁,共95頁,2023年,2月20日,星期五分布函數(shù)的性質(zhì)

F(x)單調(diào)不減,即

F(x)右連續(xù),即12第12頁,共95頁,2023年,2月20日,星期五

7二維隨機(jī)變量的分布函數(shù)設(shè)(X,Y)為二維隨機(jī)變量,(x,y)為任一對實(shí)數(shù),稱函數(shù)稱為二維隨機(jī)變量(X,Y)的分布函數(shù),也稱為X和Y的聯(lián)合分布函數(shù),對離散型隨機(jī)變量,其聯(lián)合分布函數(shù)公式:對連續(xù)型隨機(jī)變量,其聯(lián)合分布函數(shù)公式:定義函數(shù):為X關(guān)于Y的邊緣分布函數(shù),同理13第13頁,共95頁,2023年,2月20日,星期五對離散型隨機(jī)變量,稱對連續(xù)型隨機(jī)變量,關(guān)于X和關(guān)于Y的邊緣概率密度為:8、條件概率函數(shù)關(guān)于X的邊緣分布律為為變量(X,Y)的聯(lián)合概率分布,也稱變量(X,Y)的聯(lián)合分布律同樣關(guān)于Y的的邊緣分布律對離散型隨機(jī)變量(X,Y),稱為在

X=xi

的條件下,Y的條件分布律14第14頁,共95頁,2023年,2月20日,星期五對連續(xù)型隨機(jī)變量(X,Y),在X=x的條件下Y的條件概率密度為在Y=y的條件下X的條件概率密度在Y=y的條件下X的條件分布函數(shù)在X=x的條件下Y的條件分布函數(shù)15第15頁,共95頁,2023年,2月20日,星期五9、相互獨(dú)立的隨機(jī)變量

設(shè)(X,Y)為二維隨機(jī)變量,對于任意實(shí)數(shù)

x,y,有則稱隨機(jī)變量

X和Y是相互獨(dú)立的X和Y是相互獨(dú)立隨機(jī)變量與下列條件等價對于連續(xù)的隨機(jī)變量,X和Y是相互獨(dú)立與下列條件等價如果二維隨機(jī)變量(X,Y)相互獨(dú)立,則有的16第16頁,共95頁,2023年,2月20日,星期五

二隨機(jī)變量的數(shù)字特征1.一維隨機(jī)變量數(shù)學(xué)期望對連續(xù)型隨機(jī)變量,其數(shù)學(xué)期望公式:對離散型隨機(jī)變量,其數(shù)學(xué)期望公式:其中2.一維隨機(jī)變量方差隨機(jī)變量X的方差為Var(X)=D(X)=E[X-E(X)]2稱為均方差與標(biāo)準(zhǔn)差17第17頁,共95頁,2023年,2月20日,星期五對連續(xù)型隨機(jī)變量,其方差公式:對離散型隨機(jī)變量,其方差公式:有公式18第18頁,共95頁,2023年,2月20日,星期五設(shè)(X,Y)為二維隨機(jī)變量,對離散型隨機(jī)變量,其數(shù)學(xué)期望為:3二維隨機(jī)變量的數(shù)字特征:對連續(xù)型隨機(jī)變量,其數(shù)學(xué)期望為:離散和連續(xù)型隨機(jī)變量的方差為:19第19頁,共95頁,2023年,2月20日,星期五數(shù)學(xué)期望和方差的性質(zhì):如果X和Y

是相互獨(dú)立隨機(jī)變量,則有對于n個獨(dú)立的隨機(jī)變量,有20第20頁,共95頁,2023年,2月20日,星期五隨機(jī)變量X和

Y的協(xié)方差為:4協(xié)方差與相關(guān)系數(shù):離散和連續(xù)型隨機(jī)變量的協(xié)方差表達(dá)式為:協(xié)方差性質(zhì)a,b為任意常數(shù)如果X和Y

是相互獨(dú)立,則21第21頁,共95頁,2023年,2月20日,星期五為X和

Y的相關(guān)系數(shù)相關(guān)系數(shù):即存在常數(shù)a和b,a≠0,使得P(Y=aX+b))=1無量綱的量相關(guān)系數(shù)的性質(zhì)2)若則X和Y不相關(guān)(線性)1)3)若則X和Y完全線性相關(guān),既(X,Y)的協(xié)方差矩陣為:22第22頁,共95頁,2023年,2月20日,星期五5.偏度與峰度——X的k

階原點(diǎn)矩——X的k

階中心矩偏度(Skewness)

公式如下

峰度(Kurtosis)公式如下

偏度衡量X圍繞均值是否對稱,峰度衡量凸起或平坦程度S>0表示右偏(右拖尾),S<0表示左偏(左拖尾)。正態(tài)分布S=0,K=3,K>3,凸起大于正態(tài)分布,K<3比標(biāo)準(zhǔn)正態(tài)分布平坦23第23頁,共95頁,2023年,2月20日,星期五三一些重要的概率分布若隨機(jī)變量X的密度函數(shù)為則稱X服從參數(shù)為,2的正態(tài)分布,記作

X~N(,2)正態(tài)分布的分布函數(shù)為:為常數(shù),正態(tài)分布

亦稱高斯(Gauss)分布1正態(tài)分布正態(tài)分布的數(shù)學(xué)期望和方差為:E(X)=Var(X)=224第24頁,共95頁,2023年,2月20日,星期五正態(tài)分布圖形與參數(shù)幾何意義μx0f(x)大小與數(shù)據(jù)的分散程度成正比,與圖形的陡峭程度成反比標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)分布函數(shù)記為記作

X~N(0,1)如果

X~N(,2),作變量代換則有Y~N(0,1),既服從標(biāo)準(zhǔn)正態(tài)分布25第25頁,共95頁,2023年,2月20日,星期五正態(tài)分布正態(tài)分布的性質(zhì)1、E(X)=μ,

var(X)=D(X)=2、F0

(-x)=1-F0

(x)

P(X>x)=P(X<-x)3、如果X~N(μ,σ2),則有Y=aX+b~4、如果隨機(jī)變量相互獨(dú)立,且則其線性組合5、可用標(biāo)準(zhǔn)正態(tài)分布分布函數(shù)表計(jì)算26第26頁,共95頁,2023年,2月20日,星期五對于一般的正態(tài)分布,時,可以認(rèn)為,X的取值幾乎全部集中在區(qū)間內(nèi).這在統(tǒng)計(jì)學(xué)上稱作“3準(zhǔn)則”(三倍標(biāo)準(zhǔn)差原則).μx0f(x)27第27頁,共95頁,2023年,2月20日,星期五標(biāo)準(zhǔn)正態(tài)分布的

分位數(shù)若,則稱z為標(biāo)準(zhǔn)正態(tài)分布的上分位數(shù).定義若,則稱為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)分位數(shù)1x2y1x2y常用數(shù)字28第28頁,共95頁,2023年,2月20日,星期五正態(tài)分布的檢驗(yàn)

一般正態(tài)分布偏度S=0,峰度K=3Jarque-Bera雅克—貝拉檢驗(yàn)

檢驗(yàn)序列是否服從正態(tài)分布。統(tǒng)計(jì)量計(jì)算公式如下S為偏度,K為峰度,k是序列估計(jì)式中參數(shù)的個數(shù)。在正態(tài)分布的原假設(shè)下,J-B統(tǒng)計(jì)量是自由度為2的

2分布。J-B統(tǒng)計(jì)量下顯示的概率值(P值)是J-B統(tǒng)計(jì)量超出原假設(shè)下的觀測值的概率。如果變量服從正態(tài)分布,S=0,K=3,JB統(tǒng)計(jì)量為0,在某一顯著性水平下,通過JB統(tǒng)計(jì)量和2的臨界值對正態(tài)分布進(jìn)行檢驗(yàn)29第29頁,共95頁,2023年,2月20日,星期五正態(tài)分布2卡方分布(n為自由度)設(shè)隨機(jī)變量

相互獨(dú)立且,則密度函數(shù)為服從自由度為n的分布,記為其中稱為伽瑪函數(shù)30第30頁,共95頁,2023年,2月20日,星期五例如分布的性質(zhì)性質(zhì)性質(zhì)性質(zhì)性質(zhì)分布的上α分位點(diǎn)可查表得出20.05(10)?n=10x31第31頁,共95頁,2023年,2月20日,星期五3t

分布

(Student分布)則稱T服從自由度為n

的T分布。記為,其密度函數(shù)為定義X,Y相互獨(dú)立,設(shè)設(shè)t

分布t分布的性質(zhì):1、若則有~性質(zhì)2、E(T)=0,var(T)=n/(n-2)32第32頁,共95頁,2023年,2月20日,星期五2、fn(t)是偶函數(shù),性質(zhì)3、與標(biāo)準(zhǔn)正態(tài)分布類似,t分布也是對稱于y軸的分布,但是比標(biāo)準(zhǔn)正態(tài)分布更平坦,33第33頁,共95頁,2023年,2月20日,星期五3、T分布的上分位數(shù)t與雙測分位數(shù)t/2

有表可查.n=10t-tn=10xn=10t/2/2n=10x-3-2-11230.050.10.150.20.250.30.35-t/2/234第34頁,共95頁,2023年,2月20日,星期五4F分布則稱F服從為第一自由度為n1

,第二自由度為n2的F

分布.

其密度函數(shù)為定義:X,Y相互獨(dú)立,設(shè)F分布記為:令35第35頁,共95頁,2023年,2月20日,星期五F分布性質(zhì)性質(zhì)1:X的數(shù)學(xué)期望為F分布若n2>2性質(zhì)2:~的點(diǎn)為F分布的上分位點(diǎn).F分布的分位點(diǎn)。設(shè)稱F分布的上分位點(diǎn)圖形如右圖.可以通過查表得到36第36頁,共95頁,2023年,2月20日,星期五

在統(tǒng)計(jì)學(xué)中,將我們研究的問題所涉及的對象的全體稱為總體,而把總體中的每個成員稱為個體.

例如:我們想要研究一家工廠的某種產(chǎn)品的廢品率.這種產(chǎn)品的全體就是我們的總體,而每件產(chǎn)品則是個體.從總體中抽取的一部分個體,稱為總體的一個樣本;樣本中個體的個數(shù)稱為樣本的容量。X1,X2,…,Xn稱為從總體X得到的容量為n的隨機(jī)樣本,簡稱樣本。一次具體的抽取記錄x1,x2,…,xn是隨機(jī)變量,X1,X2,…,Xn的一個觀察值,成為樣本值定義:來自總體X的樣本X1,X2,…,Xn的函數(shù)g(X1,X2,…,Xn),若是連續(xù)的且不含任何未知參數(shù),則稱為一個統(tǒng)計(jì)量四、樣本與抽樣總體、個體、樣本、樣本容量、樣本值37第37頁,共95頁,2023年,2月20日,星期五統(tǒng)計(jì)量1、常用的統(tǒng)計(jì)量設(shè)X1,X2,…,Xn是來自總體X的一個樣本,

x1,x2,…,xn

是這一樣本的觀測值,定義(1)樣本均值(2)樣本方差樣本標(biāo)準(zhǔn)差38第38頁,共95頁,2023年,2月20日,星期五常用的統(tǒng)計(jì)量(3)樣本

k

階原點(diǎn)矩(4)樣本

k

階中心矩并稱他們相應(yīng)的觀測值

k=1,2,…仍分別為:樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差、樣本k階原點(diǎn)矩、樣本k階中心矩.39第39頁,共95頁,2023年,2月20日,星期五2、常用統(tǒng)計(jì)量的性質(zhì)設(shè)X1,X2,…,Xn是來自總體X的容量為n一個樣本,若

X有期望EX=

和方差var(X)

=DX

=

2,如果樣本的二階矩存在,則有2)1)40第40頁,共95頁,2023年,2月20日,星期五3、正態(tài)總體的樣本均值與樣本方差的分布2)前面證明的性質(zhì)1

EX=

,var(X)

=DX

=

2,可得,(1)和(3)證明比較復(fù)雜,(見浙江大學(xué)概率論與數(shù)理統(tǒng)計(jì)P172,通過做正交變化降階)41第41頁,共95頁,2023年,2月20日,星期五3、正態(tài)總體的樣本均值與樣本方差的分布證明:由性質(zhì)2,由性質(zhì)3根據(jù)t分布的定義42第42頁,共95頁,2023年,2月20日,星期五兩個正態(tài)總體樣本的抽樣分布的相互獨(dú)立的簡單隨機(jī)樣本.設(shè)與分別是來自正態(tài)總體與設(shè)分別是兩個樣本的均值是兩個樣本的方差則有當(dāng)時定理343第43頁,共95頁,2023年,2月20日,星期五參數(shù)估計(jì)總體分布的未知參數(shù)的估計(jì)──總體分布的參數(shù)往往是未知的,需要通過樣本來估計(jì).通過樣本來估計(jì)總體的參數(shù),稱為參數(shù)估計(jì),它是統(tǒng)計(jì)推斷的一種重要形式.參數(shù)估計(jì)問題的一般提法X1,X2,…,Xn要依據(jù)該樣本對參數(shù)作出估計(jì),或估計(jì)的某個已知函數(shù)。這類問題稱為參數(shù)估計(jì)。設(shè)有一個統(tǒng)計(jì)總體,總體的分布函數(shù)為F(x,)其中為未知參數(shù)(可以是向量)現(xiàn)從該總體抽樣,得樣本44第44頁,共95頁,2023年,2月20日,星期五點(diǎn)估計(jì)矩估計(jì)法用樣本炬替代總體炬極大似然法最小二乘法45第45頁,共95頁,2023年,2月20日,星期五估計(jì)量的評選標(biāo)準(zhǔn)(1)無偏性(2)有效性(3)一致性第46頁,共95頁,2023年,2月20日,星期五假設(shè)檢驗(yàn)參數(shù)假設(shè)檢驗(yàn)非參數(shù)假設(shè)檢驗(yàn)總體分布未知時的假設(shè)檢驗(yàn)問題

在本講中,我們將討論不同于參數(shù)估計(jì)的另一類重要的統(tǒng)計(jì)推斷問題.這就是根據(jù)樣本的信息檢驗(yàn)關(guān)于總體的某個假設(shè)是否正確.這類問題稱作假設(shè)檢驗(yàn)問題.五、假設(shè)檢驗(yàn)總體均值,均值差的檢驗(yàn)總體方差,方差比的檢驗(yàn)分布擬合檢驗(yàn)符號檢驗(yàn)秩和檢驗(yàn)總體分布已知,檢驗(yàn)關(guān)于未知參數(shù)的某個假設(shè)1.假設(shè)檢驗(yàn)的原理47第47頁,共95頁,2023年,2月20日,星期五

假設(shè)檢驗(yàn)的兩類錯誤P{拒絕H0|H0為真}=,P{接受H0|H0不真}=.

犯兩類錯誤的概率:顯著性水平為犯第一類錯誤的概率.H0為真實(shí)際情況決定拒絕H0接受H0H0不真第一類錯誤正確正確第二類錯誤通常控制犯第一類錯誤的概率.一般事先選定一個數(shù),(0<<1),要求犯第一類錯誤的概率≤.,為假設(shè)檢驗(yàn)的顯著性水平,通常只討論犯第一類錯誤的概率48第48頁,共95頁,2023年,2月20日,星期五1.假設(shè)檢驗(yàn)的步驟(1)提出二擇一的假設(shè)H0(往往與試驗(yàn)?zāi)康南喾矗┡cH1(往往是欲得到的結(jié)論);(2)給定顯著水平(小概率);(3)在H0成立下,收集數(shù)據(jù),尋找檢驗(yàn)統(tǒng)計(jì)量(如正態(tài),t,F),由統(tǒng)計(jì)量的分布,可計(jì)算各種取值的概率;(4)找出小概率發(fā)生的臨界值;給出拒絕域形式(5)將樣本值和H0代入檢驗(yàn)統(tǒng)計(jì)量進(jìn)行計(jì)算;(6)將計(jì)算結(jié)果與臨界值比較,若大于臨界值,小概率事件發(fā)生,根據(jù)小概率原理,在一次試驗(yàn)中小概率事件是不會發(fā)生的?,F(xiàn)在,居然發(fā)生了。錯在哪里?(7)原來是假設(shè)H0錯了,因?yàn)橐磺卸际窃贖0成立下推證的。于是拒絕H0。否則,不拒絕H0。49第49頁,共95頁,2023年,2月20日,星期五假設(shè)檢驗(yàn)(三部曲)

其中雙邊檢驗(yàn)左邊檢驗(yàn)確定拒絕域

.

計(jì)算,并作出相應(yīng)判斷.右邊檢驗(yàn)

根據(jù)實(shí)際問題建立假設(shè)與

.

為真時,選擇合適統(tǒng)計(jì)量V

,由α稱為顯著水平為臨界值50第50頁,共95頁,2023年,2月20日,星期五2.正態(tài)總體的參數(shù)檢驗(yàn)一、單個正態(tài)總體N(,2)均值的檢驗(yàn)H0:0;H1:01)關(guān)于的檢驗(yàn)設(shè)X1,X2,,Xn為來自總體N(,2)的樣本.求:對以上假設(shè)的顯著性水平=的假設(shè)檢驗(yàn).在方差2已知的情況當(dāng)原假設(shè)H0:

0為真時統(tǒng)計(jì)量

51第51頁,共95頁,2023年,2月20日,星期五給定小概率,查表得:U檢驗(yàn)法若小概率發(fā)生,拒絕原假設(shè)H0:0

,所以原假設(shè)的拒絕域?yàn)橛?jì)算當(dāng)拒絕假設(shè)H0:0,,接受H0:≠0,,52第52頁,共95頁,2023年,2月20日,星期五0000

<

0

>

0U檢驗(yàn)法

(2已知)原假設(shè)

H0備擇假設(shè)

H1檢驗(yàn)統(tǒng)計(jì)量及其H0為真時的分布拒絕域右則檢驗(yàn)左則檢驗(yàn)53第53頁,共95頁,2023年,2月20日,星期五2.正態(tài)總體的參數(shù)檢驗(yàn)當(dāng)方差2未知時當(dāng)假設(shè)H0:

0為真時由樣本方差S2代替2,根據(jù)抽樣分布性質(zhì)有給定小概率,查表得:,當(dāng)小概率發(fā)生,拒絕原假設(shè)H0:0

,接受假設(shè)H1既時54第54頁,共95頁,2023年,2月20日,星期五T檢驗(yàn)法

(2未知)T檢驗(yàn)法0000

<

0

>

0原假設(shè)

H0備擇假設(shè)

H1檢驗(yàn)統(tǒng)計(jì)量及其H0為真時的分布拒絕域55第55頁,共95頁,2023年,2月20日,星期五算例某種元件的壽命X(以小時計(jì))服從正態(tài)分布T沒有落在拒絕域中,顧接受假設(shè)H0,認(rèn)為平均壽命不大于225小時根據(jù)樣本計(jì)算和查表得:解按題意需檢驗(yàn)H0:

≤0=225,H1:

>0=225取=0.05,現(xiàn)n=16,已知由表知均未知,現(xiàn)測得16只元件的壽命如下:159280101212224379179264222362168250149260485170文師傅有理由認(rèn)為元件的平均壽命大于225(小時)56第56頁,共95頁,2023年,2月20日,星期五2)關(guān)于方差2

的檢驗(yàn)設(shè)X1,X2,,Xn為來自總體N(,2)的樣本.求以下假設(shè)顯著性水平的假設(shè)檢驗(yàn).當(dāng)原假設(shè)

為真時檢驗(yàn)利用樣本方差是2的一個無偏估計(jì)得給定,當(dāng)出現(xiàn)時拒絕假設(shè),為方便起見,取假設(shè)

的拒絕域?yàn)?7第57頁,共95頁,2023年,2月20日,星期五2022>022<022022=02202原假設(shè)

H0備擇假設(shè)

H1檢驗(yàn)統(tǒng)計(jì)量及其在H0為真時的分布拒絕域

檢驗(yàn)法(

已知)關(guān)于2的檢驗(yàn)X2檢驗(yàn)法58第58頁,共95頁,2023年,2月20日,星期五2022>022<022022=02202原假設(shè)

H0備擇假設(shè)

H1檢驗(yàn)統(tǒng)計(jì)量及其在H0為真時的分布拒絕域(

未知)(

未知情況下2

的檢驗(yàn))59第59頁,共95頁,2023年,2月20日,星期五一、兩個正態(tài)總體N(,2)

的參數(shù)檢驗(yàn)設(shè)X~N(1

1

2),Y~

N(2

2

2),兩樣本X,Y相互獨(dú)立,樣本(X1,X2,…,Xn),(Y1,Y2,…,Ym)

樣本值

(x1,x2,…,xn),(y1,y2,…,ym)顯著性水平H0:12;H1:2檢驗(yàn)假設(shè)當(dāng)H0:1=2為真時

∴拒絕域?yàn)?/p>

60第60頁,共95頁,2023年,2月20日,星期五1–2

=(12,22

已知)(1)關(guān)于均值差1–

2

的檢驗(yàn)1–2

1–2

1–2

<

1–2>

1–2

原假設(shè)

H0備擇假設(shè)

H1檢驗(yàn)統(tǒng)計(jì)量及其在H0為真時的分布拒絕域61第61頁,共95頁,2023年,2月20日,星期五1–2

=1–2

1–2

1–2

<

1–2>

1–2

其中12,

22未知12=

22原假設(shè)

H0備擇假設(shè)

H1檢驗(yàn)統(tǒng)計(jì)量及其在H0為真時的分布拒絕域62第62頁,共95頁,2023年,2月20日,星期五

12=

22

12

22

12

22

12>

22

12

22

12<

22(2)關(guān)于方差比

12

/

22的檢驗(yàn)1,

2

均未知原假設(shè)

H0備擇假設(shè)

H1檢驗(yàn)統(tǒng)計(jì)量及其在H0為真時的分布拒絕域63第63頁,共95頁,2023年,2月20日,星期五參數(shù)的點(diǎn)估計(jì)利用給定樣本觀察值,算出參數(shù)的估計(jì)值。但用點(diǎn)估計(jì)的方法得到的估計(jì)值不一定是參數(shù)的真值,即使與真值相等也無法肯定這種相等(因?yàn)榭傮w參數(shù)本身是未知的),也就是說,由點(diǎn)估計(jì)得到的參數(shù)估計(jì)值沒有給出它與真值之間的可靠程度(精度),在實(shí)際應(yīng)用中往往還需要知道參數(shù)的估計(jì)值落在其真值附近的一個范圍。為此我們要求由樣本構(gòu)造一個以較大的概率包含真實(shí)參數(shù)的一個范圍或區(qū)間,這種帶有概率的區(qū)間稱為置信區(qū)間,通過構(gòu)造一個置信區(qū)間對未知參數(shù)進(jìn)行估計(jì)的方法稱為區(qū)間估計(jì)。六、區(qū)間估計(jì)64第64頁,共95頁,2023年,2月20日,星期五1、置信區(qū)間定義:滿足設(shè)是一個待估參數(shù),給定

若由樣本X1,X2,…Xn確定的兩個統(tǒng)計(jì)量則稱區(qū)間是

的置信度(置信概率,置信水平)為

的雙側(cè)置信區(qū)間.分別稱為置信下限和置信上限.作區(qū)間估計(jì),就是要設(shè)法找出兩個只依賴于樣本置信上下限置信區(qū)間是以統(tǒng)計(jì)量為端點(diǎn)的隨機(jī)區(qū)間,希望區(qū)間包含參數(shù)真值

的概率達(dá)到指定的要求.65第65頁,共95頁,2023年,2月20日,星期五2.估計(jì)的精度要盡可能的高.如要求區(qū)間長度盡可能短,或能體現(xiàn)該要求的其它準(zhǔn)則.1.要求以很大的可能被包含在區(qū)間內(nèi),就是說,概率要盡可能大.即要求估計(jì)盡量可靠.可靠度與精度是一對矛盾,一般是在保證可靠度的條件下盡可能提高精度.處理可靠性與精度的原則求參數(shù)置信區(qū)間先再保證可靠性提高精度66第66頁,共95頁,2023年,2月20日,星期五2、置信區(qū)間的求法方差

2已知,的置信水平(度)為1-α置信區(qū)間為:(1)一個正態(tài)總體X~N(2)的情形由由確定解得到(1)式67第67頁,共95頁,2023年,2月20日,星期五(2)方差2未知,的置信區(qū)間

由確定故的置信區(qū)間為68第68頁,共95頁,2023年,2月20日,星期五(3)當(dāng)已知時,方差2

的置信區(qū)間取統(tǒng)計(jì)量,得

2

的置信度為置信區(qū)間為

由概率公式(3)69第69頁,共95頁,2023年,2月20日,星期五隨機(jī)向量的數(shù)字特征

一、數(shù)學(xué)期望1、定義

是有隨機(jī)變量構(gòu)成的隨機(jī)矩陣,定義X的數(shù)學(xué)期望為70第70頁,共95頁,2023年,2月20日,星期五特別當(dāng)時,便可得到隨機(jī)向量的數(shù)學(xué)期望為71第71頁,共95頁,2023年,2月20日,星期五2、性質(zhì)

1)

設(shè)為常數(shù),則;2)設(shè)分別為常數(shù)矩陣,則3)設(shè)為n個同階矩陣,則72第72頁,共95頁,2023年,2月20日,星期五

二、協(xié)方差矩陣

1、定義:設(shè)和分別為維和維隨機(jī)向量,則其協(xié)方差矩陣為73第73頁,共95頁,2023年,2月20日,星期五的(自)協(xié)方差矩陣74第74頁,共95頁,2023年,2月20日,星期五2、性質(zhì)1)若和相互獨(dú)立。則75第75頁,共95頁,2023年,2月20日,星期五

若的分量相互獨(dú)立,則(自)協(xié)方差矩陣,除主對角線上的元素外均為零,即2)隨機(jī)向量X的協(xié)方差矩陣是非負(fù)定矩陣。證:設(shè)α為任意與X有相同維數(shù)的常數(shù)向量,則76第76頁,共95頁,2023年,2月20日,星期五3)設(shè)A是常數(shù)矩陣,b為常數(shù)向量,則Var(AX+b)=AVar(X)A’;

4、若(x1,x2,…,xp)’

和(y1,y2,…,yp)分別是p和q維隨機(jī)向量,A和B為常數(shù)矩陣,則77第77頁,共95頁,2023年,2月20日,星期五

5、若(k1,k2,…,kp)是n個不全為零的常數(shù),(x1,x2,…,xp)是相互獨(dú)立的p維隨機(jī)向量,則

6、設(shè)是n維隨機(jī)向量,記A為n×n維常數(shù)矩陣,則

表示為矩陣的跡,其定義為矩陣主對角線元素之和78第78頁,共95頁,2023年,2月20日,星期五

三、相關(guān)系數(shù)矩陣若(x1,x2,…,xp)’

和(y1,y2,…,yp)分別是p和q維隨機(jī)向量,則其相關(guān)系數(shù)矩陣為79第79頁,共95頁,2023年,2月20日,星期五

均值

(mean)

即序列的平均值,用序列數(shù)據(jù)的總和除以數(shù)據(jù)的個數(shù)。

中位數(shù)

(median)

即從小到大排列的序列的中間值。是對序列分布中心的一個粗略估計(jì)。

最大最小值

(maxandmin)

序列中的最大最小值。

標(biāo)準(zhǔn)差(StandardDeviation)

標(biāo)準(zhǔn)差衡量序列的離散程度。計(jì)算公式如下N是樣本中觀測值的個數(shù),是樣本均值。

80第80頁,共95頁,2023年,2月20日,星期五

偏度(Skewness)

衡量序列分布圍繞其均值的非對稱性。計(jì)算公式如下

是變量方差的有偏估計(jì)。如果序列的分布是對稱的,S值為0;正的S值意味著序列分布有長的右拖尾,負(fù)的S值意味著序列分布有長的左拖尾。例1.1中X的偏度為0,說明X的分布是對稱的;而例1.3中GDP增長率的偏度是0.78,說明GDP增長率的分布是不對稱的。81第81頁,共95頁,2023年,2月20日,星期五

峰度(Kurtosis)

度量序列分布的凸起或平坦程度,計(jì)算公式如下分布的凸起程度大于正態(tài)分布;如果K值小于3,序列分布相對于正態(tài)分布是平坦的。例1.1中X的峰度為2.5,說明X的分布相對于正態(tài)分布是平坦的;而例1.3中GDP增長率的峰度為2.14,說明GDP增長率的分布相對于正態(tài)分布也是平坦的。意義同S中,正態(tài)分布的K值為3。如果K值大于3,82第82頁,共95頁,2023年,2月20日,星期五§1.2均值、中位數(shù)、方差的假設(shè)檢驗(yàn)

這部分是對序列均值、中位數(shù)、方差的假設(shè)檢驗(yàn)。在序列對象菜單選擇View/testsfordescriptivestats/simplehypothesistests,就會出現(xiàn)下面的序列分布檢驗(yàn)對話框:

83第83頁,共95頁,2023年,2月20日,星期五1.均值檢驗(yàn)

如果不指定序列x的標(biāo)準(zhǔn)差,EViews將在t–統(tǒng)計(jì)量中使用該標(biāo)準(zhǔn)差的估計(jì)值s

。

是x的樣本估計(jì)值,N是x的觀測值的個數(shù)。在原假設(shè)下,如果x服從正態(tài)分布,t

統(tǒng)計(jì)量是自由度為N-1的t分布。

原假設(shè)是序列x

的期望值m

,備選假設(shè)是≠m

,即84第84頁,共95頁,2023年,2月20日,星期五

如果給定x的標(biāo)準(zhǔn)差,EViews計(jì)算t統(tǒng)計(jì)量:

是指定的x的標(biāo)準(zhǔn)差。

要進(jìn)行均值檢驗(yàn),在Mean內(nèi)輸入值。如果已知標(biāo)準(zhǔn)差,想要計(jì)算t統(tǒng)計(jì)量,在右邊的框內(nèi)輸入標(biāo)準(zhǔn)差值??梢暂斎肴魏螖?shù)或標(biāo)準(zhǔn)EViews表達(dá)式,下頁我們給出檢驗(yàn)的輸出結(jié)果。

85第85頁,共95頁,2023年,2月20日,星期五

這是檢驗(yàn)例1.7中GDP增長率的均值,檢驗(yàn)H0:X=10%,H1:X≠10%。表中的Probability值是P值(邊際顯著水平)。在雙邊假設(shè)下,如果這個值小于檢驗(yàn)的顯著水平,如0.05則拒絕原假設(shè)。這里我們不能拒絕原假設(shè)。86第86頁,共95頁,2023年,2月20日,星期五2.方差檢驗(yàn)

檢驗(yàn)的原假設(shè)為序列x的方差等于

2,備選假設(shè)為雙邊的,x的方差不等于

2

,即

EViews計(jì)算2統(tǒng)計(jì)量,計(jì)算公式如下

N為觀測值的個數(shù),為x的樣本均值。在原假設(shè)下,如果x服從正態(tài)分布,2

統(tǒng)計(jì)量是服從自由度為N-1的2分布。

要進(jìn)行方差檢驗(yàn),在Variance處填入在原假設(shè)下的方差值??梢蕴钊肴魏握龜?shù)或表達(dá)式。

87第87頁,共95頁,2023年,2月20日,星期五3.中位數(shù)檢驗(yàn)

原假設(shè)為序列x的中位數(shù)等于m,備選假設(shè)為雙邊假設(shè),x的中位數(shù)不等于m,即

EViews提供了三個以排序?yàn)榛A(chǔ)的無參數(shù)的檢驗(yàn)統(tǒng)計(jì)量。方法的主要參考來自于Conover(1980)和Sheskin

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論