實驗十三 二項分布的計算與中心極限定_第1頁
實驗十三 二項分布的計算與中心極限定_第2頁
實驗十三 二項分布的計算與中心極限定_第3頁
實驗十三 二項分布的計算與中心極限定_第4頁
實驗十三 二項分布的計算與中心極限定_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、實驗十三 二項分布的計算與中心極限定實驗?zāi)康?. 研究用Poisson逼近與正態(tài)逼近進行二項分布近似計算的條件2. 檢驗中心極限定理§1 引言二項分布在概率論中占有很重要的地位。N次Bernoulli實驗中正好出現(xiàn)K次成功的概率有下式給出,k=0,1,2,.n.二項分布的值有現(xiàn)成的表可查,這種表對不同的n及p給出了b(k;n.p)的數(shù)值。在實際應(yīng)用中。通??捎枚椀腜oisson逼近與正態(tài)逼近來進行二項分布的近似計算。在本實驗中,我們來具體地研究在什么條件下,可用Poisson逼近與正態(tài)逼近來進行二項分布的近似計算。 在概率論中,中心極限定理是一個很重要的內(nèi)容,在本實驗中,我們用隨即

2、模擬的方法來檢驗一個重要的中心極限定理Liderberg-Levi中心極限定理。 §2 實驗內(nèi)容與練習(xí)1 1二項分布的Poisson逼近用Mathematica軟件可以比較方便地求出二項分布的數(shù)值。例如n=20;p=0,1;TableBinomialn,k*pk*(1-p)(n-k),k,0,20給出了b(k;20,0.1)(k=0,1,2,.,20)的值。聯(lián)系1 用Mathematica軟件給出了b(k;20,0.1),b(k;20,0.3)與b (k;20,0.5)(k=0,1,2,.,20)的值。LISTpOLTtableBinomi al20,k*0.1k*0.9(20-k)

3、,k,0,20,PlotJoined->True 圖13.1 b(k;20,0.1) (k=1,1,2,20)的散點圖練習(xí)2繪出b(l;20,0.3)與b(k;20,0.5)(k=0,1,2,20)的散點圖根據(jù)下面的定理,二項分布可用Poisson分布來進行近似計算。定理13。1 在Bernoulli實驗中,以Pn 代表事件A在試驗中出現(xiàn)的概率,它與試驗總數(shù)有關(guān).如果npn,則當(dāng)n時,。由定理13,1在n很大,p很小,而=np大小適中時,有練習(xí)3 用Poisson逼近給出b(k;100,0.01)(k=0,1,2,.,100)與b(k;1000,0.001)(k=0,1,2,1000)的

4、近似值,并與它們的精確值比較,表13,1二項分布的Poisson逼近kB1(k)B2(k)P(k)R1(k)R2(k)03.6603210-13.6769510-13.6787910-11.8510-31.8410-413.6973010-13.6806310-13.6787910-11.8510-31.8410-421.8486510-11.8403210-11.8349010-19.2510-49.2010-536.0999210-26.1282510-26.1316210-23.1410-43.0710-541.4941710-21.5290010-21.5328310-23.8710-

5、43.8310-552.8977910-33.0488110-33.0656610-31.6810-41.6910-564.6345110-45.0610010-45.1094410-44.7510-54.8410-676.2863510-57.1938110-57.2992010-51.0110-51.0510-687.3816910-68.9382610-69.1239910-61.7410-61.8610-797.6219510-79.8618110-71.0137810-62.5210-72.7610-8107.0060410-89.7828410-81.0137810-73.1310

6、-83.5510-910)(表中即位b1(k)與b(k;1000,0.001)(k=0,1,2,.10)(記為b2(k)的Poisson逼近的近似值記為p9k)與它們的精確值的比較,其中r1(k)=/b1(k)-p9k)/,r2(k)=/b2(k)-p(k)/從表13。1可以看出,用Poisson分布來計算b(k;1000,0.001)比b(k;100,0.01)的效果好得多,我們可以畫出它們的散點圖(圖13。2)來觀察近似計算的效果,下面的程序給出了b(k;20,0.1)的近似計算的精確值的比較圖13。2b(k;20,0.1)的Poisson近似計算的精確值的比較練習(xí)4繪出b(k;100,0

7、.01)與b(k;1000,0.001)的近似計算與精確計算的散點圖。那么n,p,。到底取何值時,我們可以用Poisson分布來近似計算二項分布的值呢?我們可以用誤差來作為衡量標(biāo)準(zhǔn)評價緝私的效果若n與p給定,則b(k;n,p)與其Piosson逼近的誤差是的k函數(shù);根據(jù)上式可以定義二項分布的Poisson逼近的誤差定義13。2若n,p給定,我們定義二項分布b(k;n,p)(k=0,1,p)的Poisson逼近的誤差為;差通過簡單的程序運算我們可以求得;p100,0.01=1.85*10-3 p1000,0.001=1.84*10-4練習(xí)5通過編程求出在n=10,100,1000與10000,=

8、0.1,1與10時,二項分布的Poisson逼近的誤差,填入表13,2; 表13。2二項分布的Poisson逼近的誤差表n0.11.010.0101001.8510-310001.8410-410000你能從中發(fā)現(xiàn)什么規(guī)律那?在一定條件下我們可以認(rèn)為,若絕對誤差p<=10-3,則可以接受近似計算結(jié)果在=1時,若n=100,p=0.01,則p100,0.01=1.85 10-3>10-3,不能接受計算結(jié)果,即此時不能用Poisson逼近來緝私計算二項分布的值,若n=1000,p=0.001,則p1000,0.001=1.84 10-4<10-3,此時可用Poisson逼近來緝私

9、計算二項分布的值,對=1,我們可以用編程求出n=2,3,.1000的對應(yīng)的Poisson二項分布的逼近的誤差,圖13。3就是誤差的散點圖。在=1時,要使絕對誤差p>=10-3,必須n>=185練習(xí)6在=0.1,0.5,2.0,5.0,10.0時,n取何值,可使絕對誤差p<=10-3? 圖13。3Poisson逼近的誤差(=1)練習(xí)7 若誤差標(biāo)準(zhǔn)該為p<=10-4或其它的數(shù)據(jù),研究上面對應(yīng)的問題,練習(xí)8 對于n,p,到底取何值時,可以用Poisson分布 來近似計算二項分布的值,你有什么結(jié)論? 22 二項分布的正態(tài)逼近21節(jié)中討論了用Poisson逼近來近似計算二項分布的

10、問題。在實際應(yīng)用中,我們還可以用正態(tài)逼近來近似計算二項分布。計算的根據(jù)是局部極限定理,在n->時,有 Cnkpkqk圖13.4b(k;20,0.1)的正態(tài)逼近近似計算與精確的比較圖13。4是b(k;20,0.1)的正態(tài)逼近的近似值與精確的比較的散點圖 。圖 13。5用另一種方式更直觀地顯示出逼近的效果。 圖13。5中,階梯函數(shù)給出概率Cnkpkqn-k,而曲線則給出對應(yīng)的正態(tài)分布密度函數(shù)。其Mathematica程序如下:由于n的取值比較小,我們可以看出,近似的效果不是很好。練習(xí)9 用正態(tài)逼近給出b(k;100,0.01)(k=0,1,2,100)與b(k;1000,0.001) (k=

11、0,1,2,1000)的近似值,與它們的精確值作比較。做出近似計算與精確計算的散點圖。練習(xí)10 做出b(k;100,0.01)與b(k;1000,0.001)的階梯函數(shù)與對應(yīng)的正態(tài)分布密度函=數(shù)曲線,觀察其效果。 若n與p給定,我們也可以定義二項分布b(k;n,p) (k=0,1,2,n)的正態(tài)逼近的誤差為: Nn,p=maxNn,p(k)=max|Cnkpkqn-k-(1/) (1/) exp(-(1/2)(k-np)/2)是、式中q=1-p.練習(xí)11 若分別取0.1,0.5,1.0,2.0,5.0,10.0,n取何值時,可使絕對誤差N<=10-3?練習(xí)12 n ,p取何值時,可以用正

12、態(tài)逼近來近似計算二項分布的值。練習(xí)13 比較二項分布的Poisson逼近與正態(tài)逼近的優(yōu)劣。23 中心極限定理的驗證1 正態(tài)分布的假設(shè)檢驗在實際應(yīng)用中,有許多隨機數(shù)據(jù)都可以看作來自于正態(tài)分布。那么,如何檢驗一批數(shù)據(jù)是否來自于正態(tài)分布呢? 按照國家標(biāo)準(zhǔn),我們采用D檢驗來判斷隨機數(shù)據(jù)的正態(tài)性。下面通過一個例子介紹D檢驗的過程。例 下面是某種刀具生產(chǎn)的合格零件個數(shù)(已用Mathematica語句的形式給出),判斷它們是否滿足正態(tài)分布: t=459,362,624,509,584,433,748,815,505,612,452,434,982,640,742,565,706,593,680,926,65

13、3,164487,734,608,428,1153,593,844,527,552,513,781,474,388,824,538,862,659,775,859,755,649,697,515,628,954,771,609,402,960,885,610,292,837,473,677,358,638,699,634,555,570,84,416,606,1062,484,120,447,654,564,339,280,246,687,539,790,581,62,724,531,512,577,496,468,499,544,645,764,558,378,765,666,763,217

14、,715,310,851,解 (1)將100個數(shù)據(jù)按非減次序排列: X(1)<=X( 2)=<=X( 100) (2)計算統(tǒng)計量(其中n=100,X是數(shù)據(jù)樣本的均值): (3)計算統(tǒng)計量; Y= (4)給定檢驗水平 =0.05,查表得臨界值Z/2,; =-2.54及Z1-/2 =1.31. (5)若 Z/2<Y<Z1-/2. ,則接受正態(tài)分布假設(shè),否則拒絕正態(tài)分布假設(shè)。經(jīng)計算得Y=-1.2933,顯然-2 .54<-1.2933<1.31,接受正態(tài)分布假設(shè).D檢驗的Mathematica程序如下:Fata1:=Modulez1=-0.54,z2=1.31,d

15、ada=Sortdada1,N=Lengthdada;Mean=Sumdadak,k,1,n/n;D1=Sum(k-(n+1)/2)*dadak,k,1,n;D2=(Sqrtn)SqrtSum(dadak-mean)2,k,1,n;D=d1/d1;Y=Sqrtn*(d-0.28209479)/0.02998598;Result=Ifz1<y<z2,1,0;Returnresult;Ft運行該程序(運行程序前已將題給數(shù)據(jù)t輸入),得ft的結(jié)果為1,表示通過正態(tài)檢驗。當(dāng)然,我們可將程序中Ifz1<y<z2,1,0語句改為Ifz1<y<z2,Print“succe

16、ed”,Print“fail”來輸入是否通過檢驗的信息。D檢驗的幾個常用的臨界值見表13.3表13.3 D檢驗的臨界值表/n0.0050.0250.050.950.9750.995100-3.57 -2.54-2.071.141.311.59200-3.30-2.39-1.961.291.501.85500-3.04-2.24-2.851.421.672.111000-2.91-2.16-1.791.491.752.25練習(xí)14 用Mathmatica軟件產(chǎn)生2000個標(biāo)準(zhǔn)正態(tài)分布的偽隨機數(shù)(參見實驗十二),用D檢驗的方法檢驗其正態(tài)性。2中心極限定理的檢驗下面我們來研究一個重要的中心極限定理。

17、定理13.3(Liderberg_Levi) 設(shè)1,2,n,是一串相互獨立相同分布的隨機變量,且. Ei=m, D=2,對于標(biāo)準(zhǔn)化隨機變量之和n=1/(i-m),在02時,有LimPn<x=1/2e-t2/2dt.我們先討論相互獨立的隨機變量i(每個i服從二項分布b(k;20,0.1)(I=1,2,)之和的極限情況。已知Ei=m=2,Di=2=1.8,考慮標(biāo)準(zhǔn)化隨機變量之和 n=1/(i-m). 對于固定的n,我們每次Mathematica軟件模擬100個分布n的隨機數(shù),然后D用檢驗來判定其是否能通過正態(tài)分布檢驗.重復(fù)一定的次數(shù),觀測其能通過正態(tài)分布檢驗的比率.在下面的程序中,我們?nèi)=

18、30(程序中的number)<<StatisticsDisstributionsrndn_,p_:=RandomBionmialDistributionn,p;Cleark,c,a;Whole=25;number=30;s=0,c=0;Nn=20;pp=0.1;nu=nn*pp;sigma=Sqrtnn*(1-pp);Forj=1,j<=whole,j+,A=;ForI=1,I<=100,I+,s=(Sumrndnn,pp-nu,k,l,number);A=Appenda,s/(sigma*Sqrtnumber);C=c+fa;Pritc下面就是程序運行20 次得到的結(jié)

19、果:24,25,23,23,21,24,25,23,24,24,24,24,24,23,24,23,25,23,22,25.可見其結(jié)果比較穩(wěn)定,通過正態(tài)分布檢驗的比率為473/500=94.6%.練習(xí)15 通過其他計算機模擬求出,對分布n=b(k;20,0。1),n取何值時,可使其在檢驗水平=0。05條件下,以95%的概率通過正態(tài)分布的檢驗。若取按水平=0。01,結(jié)果又如何?練習(xí)16 選取其他的二項分布,研究上述問題。練習(xí)17 對于Poisson分布,選取適當(dāng)?shù)难芯可鲜鰡栴}。設(shè)1,2,n,是相互獨立,均服從0,1均勻分布的隨機 變量,這是定理13.3的條件得到滿足,故1+2+n漸近于正態(tài)變量.

20、我們可以選取適當(dāng)?shù)膎,由0,1均勻分布隨機數(shù)來產(chǎn)生正態(tài) 分布隨機 數(shù).那么n取多少比較合適呢?練習(xí)18 分別取 正態(tài)分布D檢驗的檢驗水平=0.05,研究n=6,8,10,12,14時相互獨立的0,1均勻分布的隨機 變量之和1+2+n通過正態(tài) 分布檢驗的概率.在實際應(yīng)用中,取 n=12,用來產(chǎn)生標(biāo)準(zhǔn)正態(tài) 分布隨機 數(shù),這種方法的效果任何呢?練習(xí) 19 對于n=12,分別在檢驗水平=0.01,=0.05,=0.1情況下研究上述問題.3 本實驗涉及的Mathematica軟件語句說明 1. Sortdata1將集合data1按從小到大的順序重排.2. GraphicsGraylever0.5,Rec

21、tanglek-0.5,0,k+0.5,tabk+1二維圖形元素,表示一個矩形,其 灰度值為0.5,對教形頂點分別為k-0.5,0與k+0.5,tabk+1.3. ListPlott2,PlotJoined->True,PlotStyle->Graylever0.1,Dashing0.02,Thickness0.01,PlotRange->0,20,0,0.3;上述語句中PlotStyle的三個選項的含義:(1) Graylever0.5圖形的灰度值為0.5.(2) Dashing0.02圖形為虛線,其中虛線長度為0.02.(3) Thickness0.01圖形為粗線,線的寬

22、度值為0.01. D=(3)計算統(tǒng)計量; Y= (4)給定檢驗水平 =0.05,查表得臨界值Z/2,; =-2.54及Z1-/2 =1.31. (5)若 Z/2<Y<Z1-/2. ,則接受正態(tài)分布假設(shè),否則拒絕正態(tài)分布假設(shè)。經(jīng)計算得Y=-1.2933,顯然-2 .54<-1.2933<1.31,接受正態(tài)分布假設(shè).D檢驗的Mathematica程序如下:Fata1:=Modulez1=-0.54,z2=1.31,dada=Sortdada1,N=Lengthdada;Mean=Sumdadak,k,1,n/n;D1=Sum(k-(n+1)/2)*dadak,k,1,n;D

23、2=(Sqrtn)SqrtSum(dadak-mean)2,k,1,n;D=d1/d1;Y=Sqrtn*(d-0.28209479)/0.02998598;Result=Ifz1<y<z2,1,0;Returnresult;Ft運行該程序(運行程序前已將題給數(shù)據(jù)t輸入),得ft的結(jié)果為1,表示通過正態(tài)檢驗。當(dāng)然,我們可將程序中Ifz1<y<z2,1,0語句改為Ifz1<y<z2,Print“succeed”,Print“fail”來輸入是否通過檢驗的信息。D檢驗的幾個常用的臨界值見表13.3表13.3 D檢驗的臨界值表/n0.0050.0250.050.95

24、0.9750.995100-3.57 -2.54-2.071.141.311.59200-3.30-2.39-1.961.291.501.85500-3.04-2.24-2.851.421.672.111000-2.91-2.16-1.791.491.752.25練習(xí)14 用Mathmatica軟件產(chǎn)生2000個標(biāo)準(zhǔn)正態(tài)分布的偽隨機數(shù)(參見實驗十二),用D檢驗的方法檢驗其正態(tài)性。2中心極限定理的檢驗下面我們來研究一個重要的中心極限定理。定理13.3(Liderberg_Levi) 設(shè)1,2,n,是一串相互獨立相同分布的隨機變量,且. Ei=m, D=2,對于標(biāo)準(zhǔn)化隨機變量之和n=1/(i-m)

25、,在02時,有LimPn<x=1/2e-t2/2dt.我們先討論相互獨立的隨機變量i(每個i服從二項分布b(k;20,0.1)(I=1,2,)之和的極限情況。已知Ei=m=2,Di=2=1.8,考慮標(biāo)準(zhǔn)化隨機變量之和 n=1/(i-m). 對于固定的n,我們每次Mathematica軟件模擬100個分布n的隨機數(shù),然后D用檢驗來判定其是否能通過正態(tài)分布檢驗.重復(fù)一定的次數(shù),觀測其能通過正態(tài)分布檢驗的比率.在下面的程序中,我們?nèi)=30(程序中的number)<<StatisticsDisstributionsrndn_,p_:=RandomBionmialDistributionn,p;Cleark,c,a;Whole=25;number=30;s=0,c=0;Nn=20;pp=0.1;nu=nn*pp;sigma=Sqrtnn*(1-pp);Forj=1,j<=whole,j+,A=;ForI=1,I<=100,I+,s=(Sumrndnn,pp-nu,k,l,number);A=Appenda,s/(sigma*Sqrtnumber);C=c+fa;Pritc下面就是程序運行20 次得到的結(jié)果:24,25,23,23,21,24,25,23,24,24,24,24,24,23,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論