實驗十三 二項分布的計算與中心極限定_第1頁
實驗十三 二項分布的計算與中心極限定_第2頁
實驗十三 二項分布的計算與中心極限定_第3頁
實驗十三 二項分布的計算與中心極限定_第4頁
實驗十三 二項分布的計算與中心極限定_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、實驗十三 二項分布的計算與中心極限定實驗目的1. 研究用Poisson逼近與正態(tài)逼近進行二項分布近似計算的條件2. 檢驗中心極限定理§1 引言二項分布在概率論中占有很重要的地位。N次Bernoulli實驗中正好出現(xiàn)K次成功的概率有下式給出,k=0,1,2,.n.二項分布的值有現(xiàn)成的表可查,這種表對不同的n及p給出了b(k;n.p)的數值。在實際應用中。通??捎枚椀腜oisson逼近與正態(tài)逼近來進行二項分布的近似計算。在本實驗中,我們來具體地研究在什么條件下,可用Poisson逼近與正態(tài)逼近來進行二項分布的近似計算。 在概率論中,中心極限定理是一個很重要的內容,在本實驗中,我們用隨即

2、模擬的方法來檢驗一個重要的中心極限定理Liderberg-Levi中心極限定理。 §2 實驗內容與練習1 1二項分布的Poisson逼近用Mathematica軟件可以比較方便地求出二項分布的數值。例如n=20;p=0,1;TableBinomialn,k*pk*(1-p)(n-k),k,0,20給出了b(k;20,0.1)(k=0,1,2,.,20)的值。聯(lián)系1 用Mathematica軟件給出了b(k;20,0.1),b(k;20,0.3)與b (k;20,0.5)(k=0,1,2,.,20)的值。我們可用Mathematica軟件畫出上述數據的散點圖,下面的語句給出了b(k;2

3、0.0.1)的(連線)散點圖(圖13。1):LISTpOLTtableBinomi al20,k*0.1k*0.9(20-k),k,0,20,PlotJoined->True 圖13.1 b(k;20,0.1) (k=1,1,2,20)的散點圖練習2繪出b(l;20,0.3)與b(k;20,0.5)(k=0,1,2,20)的散點圖根據下面的定理,二項分布可用Poisson分布來進行近似計算。定理13。1 在Bernoulli實驗中,以Pn 代表事件A在試驗中出現(xiàn)的概率,它與試驗總數有關.如果npn,則當n時,。由定理13,1在n很大,p很小,而=np大小適中時,有練習3 用Poisson

4、逼近給出b(k;100,0.01)(k=0,1,2,.,100)與b(k;1000,0.001)(k=0,1,2,1000)的近似值,并與它們的精確值比較,表13,1二項分布的Poisson逼近kB1(k)B2(k)P(k)R1(k)R2(k)03.6603210-13.6769510-13.6787910-11.8510-31.8410-413.6973010-13.6806310-13.6787910-11.8510-31.8410-421.8486510-11.8403210-11.8349010-19.2510-49.2010-536.0999210-26.1282510-26.131

5、6210-23.1410-43.0710-541.4941710-21.5290010-21.5328310-23.8710-43.8310-552.8977910-33.0488110-33.0656610-31.6810-41.6910-564.6345110-45.0610010-45.1094410-44.7510-54.8410-676.2863510-57.1938110-57.2992010-51.0110-51.0510-687.3816910-68.9382610-69.1239910-61.7410-61.8610-797.6219510-79.8618110-71.013

6、7810-62.5210-72.7610-8107.0060410-89.7828410-81.0137810-73.1310-83.5510-9表13。1給出了b(k;100.0.01)(k=0,1,2,10)(表中即位b1(k)與b(k;1000,0.001)(k=0,1,2,.10)(記為b2(k)的Poisson逼近的近似值記為p9k)與它們的精確值的比較,其中r1(k)=/b1(k)-p9k)/,r2(k)=/b2(k)-p(k)/從表13。1可以看出,用Poisson分布來計算b(k;1000,0.001)比b(k;100,0.01)的效果好得多,我們可以畫出它們的散點圖(圖13。

7、2)來觀察近似計算的效果,下面的程序給出了b(k;20,0.1)的近似計算的精確值的比較圖13。2b(k;20,0.1)的Poisson近似計算的精確值的比較練習4繪出b(k;100,0.01)與b(k;1000,0.001)的近似計算與精確計算的散點圖。那么n,p,。到底取何值時,我們可以用Poisson分布來近似計算二項分布的值呢?我們可以用誤差來作為衡量標準評價緝私的效果若n與p給定,則b(k;n,p)與其Piosson逼近的誤差是的k函數;根據上式可以定義二項分布的Poisson逼近的誤差定義13。2若n,p給定,我們定義二項分布b(k;n,p)(k=0,1,p)的Poisson逼近的

8、誤差為;差通過簡單的程序運算我們可以求得;p100,0.01=1.85*10-3 p1000,0.001=1.84*10-4練習5通過編程求出在n=10,100,1000與10000,=0.1,1與10時,二項分布的Poisson逼近的誤差,填入表13,2; 表13。2二項分布的Poisson逼近的誤差表n0.11.010.0101001.8510-310001.8410-410000你能從中發(fā)現(xiàn)什么規(guī)律那?在一定條件下我們可以認為,若絕對誤差p<=10-3,則可以接受近似計算結果在=1時,若n=100,p=0.01,則p100,0.01=1.85 10-3>10-3,不能接受計算

9、結果,即此時不能用Poisson逼近來緝私計算二項分布的值,若n=1000,p=0.001,則p1000,0.001=1.84 10-4<10-3,此時可用Poisson逼近來緝私計算二項分布的值,對=1,我們可以用編程求出n=2,3,.1000的對應的Poisson二項分布的逼近的誤差,圖13。3就是誤差的散點圖。在=1時,要使絕對誤差p>=10-3,必須n>=185練習6在=0.1,0.5,2.0,5.0,10.0時,n取何值,可使絕對誤差p<=10-3? 圖13。3Poisson逼近的誤差(=1)練習7 若誤差標準該為p<=10-4或其它的數據,研究上面對應

10、的問題,練習8 對于n,p,到底取何值時,可以用Poisson分布 來近似計算二項分布的值,你有什么結論? 22 二項分布的正態(tài)逼近21節(jié)中討論了用Poisson逼近來近似計算二項分布的問題。在實際應用中,我們還可以用正態(tài)逼近來近似計算二項分布。計算的根據是局部極限定理,在n->時,有 Cnkpkqk圖13.4b(k;20,0.1)的正態(tài)逼近近似計算與精確的比較圖13。4是b(k;20,0.1)的正態(tài)逼近的近似值與精確的比較的散點圖 。圖 13。5用另一種方式更直觀地顯示出逼近的效果。 圖13。5中,階梯函數給出概率Cnkpkqn-k,而曲線則給出對應的正態(tài)分布密度函數。其Mathema

11、tica程序如下:由于n的取值比較小,我們可以看出,近似的效果不是很好。練習9 用正態(tài)逼近給出b(k;100,0.01)(k=0,1,2,100)與b(k;1000,0.001) (k=0,1,2,1000)的近似值,與它們的精確值作比較。做出近似計算與精確計算的散點圖。練習10 做出b(k;100,0.01)與b(k;1000,0.001)的階梯函數與對應的正態(tài)分布密度函=數曲線,觀察其效果。 若n與p給定,我們也可以定義二項分布b(k;n,p) (k=0,1,2,n)的正態(tài)逼近的誤差為: Nn,p=maxNn,p(k)=max|Cnkpkqn-k-(1/) (1/) exp(-(1/2)(

12、k-np)/2)是、式中q=1-p.練習11 若分別取0.1,0.5,1.0,2.0,5.0,10.0,n取何值時,可使絕對誤差N<=10-3?練習12 n ,p取何值時,可以用正態(tài)逼近來近似計算二項分布的值。練習13 比較二項分布的Poisson逼近與正態(tài)逼近的優(yōu)劣。23 中心極限定理的驗證1 正態(tài)分布的假設檢驗在實際應用中,有許多隨機數據都可以看作來自于正態(tài)分布。那么,如何檢驗一批數據是否來自于正態(tài)分布呢? 按照國家標準,我們采用D檢驗來判斷隨機數據的正態(tài)性。下面通過一個例子介紹D檢驗的過程。例 下面是某種刀具生產的合格零件個數(已用Mathematica語句的形式給出),判斷它們是

13、否滿足正態(tài)分布: t=459,362,624,509,584,433,748,815,505,612,452,434,982,640,742,565,706,593,680,926,653,164487,734,608,428,1153,593,844,527,552,513,781,474,388,824,538,862,659,775,859,755,649,697,515,628,954,771,609,402,960,885,610,292,837,473,677,358,638,699,634,555,570,84,416,606,1062,484,120,447,654,564,3

14、39,280,246,687,539,790,581,62,724,531,512,577,496,468,499,544,645,764,558,378,765,666,763,217,715,310,851,解 (1)將100個數據按非減次序排列: X(1)<=X( 2)=<=X( 100) (2)計算統(tǒng)計量(其中n=100,X是數據樣本的均值): (3)計算統(tǒng)計量; Y= (4)給定檢驗水平 =0.05,查表得臨界值Z/2,; =-2.54及Z1-/2 =1.31. (5)若 Z/2<Y<Z1-/2. ,則接受正態(tài)分布假設,否則拒絕正態(tài)分布假設。經計算得Y=-1.

15、2933,顯然-2 .54<-1.2933<1.31,接受正態(tài)分布假設.D檢驗的Mathematica程序如下:Fata1:=Modulez1=-0.54,z2=1.31,dada=Sortdada1,N=Lengthdada;Mean=Sumdadak,k,1,n/n;D1=Sum(k-(n+1)/2)*dadak,k,1,n;D2=(Sqrtn)SqrtSum(dadak-mean)2,k,1,n;D=d1/d1;Y=Sqrtn*(d-0.28209479)/0.02998598;Result=Ifz1<y<z2,1,0;Returnresult;Ft運行該程序(運

16、行程序前已將題給數據t輸入),得ft的結果為1,表示通過正態(tài)檢驗。當然,我們可將程序中Ifz1<y<z2,1,0語句改為Ifz1<y<z2,Print“succeed”,Print“fail”來輸入是否通過檢驗的信息。D檢驗的幾個常用的臨界值見表13.3表13.3 D檢驗的臨界值表/n0.0050.0250.050.950.9750.995100-3.57 -2.54-2.071.141.311.59200-3.30-2.39-1.961.291.501.85500-3.04-2.24-2.851.421.672.111000-2.91-2.16-1.791.491.7

17、52.25練習14 用Mathmatica軟件產生2000個標準正態(tài)分布的偽隨機數(參見實驗十二),用D檢驗的方法檢驗其正態(tài)性。2中心極限定理的檢驗下面我們來研究一個重要的中心極限定理。定理13.3(Liderberg_Levi) 設1,2,n,是一串相互獨立相同分布的隨機變量,且. Ei=m, D=2,對于標準化隨機變量之和n=1/(i-m),在02時,有LimPn<x=1/2e-t2/2dt.我們先討論相互獨立的隨機變量i(每個i服從二項分布b(k;20,0.1)(I=1,2,)之和的極限情況。已知Ei=m=2,Di=2=1.8,考慮標準化隨機變量之和 n=1/(i-m). 對于固定

18、的n,我們每次Mathematica軟件模擬100個分布n的隨機數,然后D用檢驗來判定其是否能通過正態(tài)分布檢驗.重復一定的次數,觀測其能通過正態(tài)分布檢驗的比率.在下面的程序中,我們取n=30(程序中的number)<<StatisticsDisstributionsrndn_,p_:=RandomBionmialDistributionn,p;Cleark,c,a;Whole=25;number=30;s=0,c=0;Nn=20;pp=0.1;nu=nn*pp;sigma=Sqrtnn*(1-pp);Forj=1,j<=whole,j+,A=;ForI=1,I<=100

19、,I+,s=(Sumrndnn,pp-nu,k,l,number);A=Appenda,s/(sigma*Sqrtnumber);C=c+fa;Pritc下面就是程序運行20 次得到的結果:24,25,23,23,21,24,25,23,24,24,24,24,24,23,24,23,25,23,22,25.可見其結果比較穩(wěn)定,通過正態(tài)分布檢驗的比率為473/500=94.6%.練習15 通過其他計算機模擬求出,對分布n=b(k;20,0。1),n取何值時,可使其在檢驗水平=0。05條件下,以95%的概率通過正態(tài)分布的檢驗。若取按水平=0。01,結果又如何?練習16 選取其他的二項分布,研究上

20、述問題。練習17 對于Poisson分布,選取適當的研究上述問題。設1,2,n,是相互獨立,均服從0,1均勻分布的隨機 變量,這是定理13.3的條件得到滿足,故1+2+n漸近于正態(tài)變量.我們可以選取適當的n,由0,1均勻分布隨機數來產生正態(tài) 分布隨機 數.那么n取多少比較合適呢?練習18 分別取 正態(tài)分布D檢驗的檢驗水平=0.05,研究n=6,8,10,12,14時相互獨立的0,1均勻分布的隨機 變量之和1+2+n通過正態(tài) 分布檢驗的概率.在實際應用中,取 n=12,用來產生標準正態(tài) 分布隨機 數,這種方法的效果任何呢?練習 19 對于n=12,分別在檢驗水平=0.01,=0.05,=0.1情

21、況下研究上述問題.3 本實驗涉及的Mathematica軟件語句說明 1. Sortdata1將集合data1按從小到大的順序重排.2. GraphicsGraylever0.5,Rectanglek-0.5,0,k+0.5,tabk+1二維圖形元素,表示一個矩形,其 灰度值為0.5,對教形頂點分別為k-0.5,0與k+0.5,tabk+1.3. ListPlott2,PlotJoined->True,PlotStyle->Graylever0.1,Dashing0.02,Thickness0.01,PlotRange->0,20,0,0.3;上述語句中PlotStyle的三

22、個選項的含義:(1) Graylever0.5圖形的灰度值為0.5.(2) Dashing0.02圖形為虛線,其中虛線長度為0.02.(3) Thickness0.01圖形為粗線,線的寬度值為0.01. D=(3)計算統(tǒng)計量; Y= (4)給定檢驗水平 =0.05,查表得臨界值Z/2,; =-2.54及Z1-/2 =1.31. (5)若 Z/2<Y<Z1-/2. ,則接受正態(tài)分布假設,否則拒絕正態(tài)分布假設。經計算得Y=-1.2933,顯然-2 .54<-1.2933<1.31,接受正態(tài)分布假設.D檢驗的Mathematica程序如下:Fata1:=Modulez1=-0

23、.54,z2=1.31,dada=Sortdada1,N=Lengthdada;Mean=Sumdadak,k,1,n/n;D1=Sum(k-(n+1)/2)*dadak,k,1,n;D2=(Sqrtn)SqrtSum(dadak-mean)2,k,1,n;D=d1/d1;Y=Sqrtn*(d-0.28209479)/0.02998598;Result=Ifz1<y<z2,1,0;Returnresult;Ft運行該程序(運行程序前已將題給數據t輸入),得ft的結果為1,表示通過正態(tài)檢驗。當然,我們可將程序中Ifz1<y<z2,1,0語句改為Ifz1<y<z

24、2,Print“succeed”,Print“fail”來輸入是否通過檢驗的信息。D檢驗的幾個常用的臨界值見表13.3表13.3 D檢驗的臨界值表/n0.0050.0250.050.950.9750.995100-3.57 -2.54-2.071.141.311.59200-3.30-2.39-1.961.291.501.85500-3.04-2.24-2.851.421.672.111000-2.91-2.16-1.791.491.752.25練習14 用Mathmatica軟件產生2000個標準正態(tài)分布的偽隨機數(參見實驗十二),用D檢驗的方法檢驗其正態(tài)性。2中心極限定理的檢驗下面我們來研

25、究一個重要的中心極限定理。定理13.3(Liderberg_Levi) 設1,2,n,是一串相互獨立相同分布的隨機變量,且. Ei=m, D=2,對于標準化隨機變量之和n=1/(i-m),在02時,有LimPn<x=1/2e-t2/2dt.我們先討論相互獨立的隨機變量i(每個i服從二項分布b(k;20,0.1)(I=1,2,)之和的極限情況。已知Ei=m=2,Di=2=1.8,考慮標準化隨機變量之和 n=1/(i-m). 對于固定的n,我們每次Mathematica軟件模擬100個分布n的隨機數,然后D用檢驗來判定其是否能通過正態(tài)分布檢驗.重復一定的次數,觀測其能通過正態(tài)分布檢驗的比率.

26、在下面的程序中,我們取n=30(程序中的number)<<StatisticsDisstributionsrndn_,p_:=RandomBionmialDistributionn,p;Cleark,c,a;Whole=25;number=30;s=0,c=0;Nn=20;pp=0.1;nu=nn*pp;sigma=Sqrtnn*(1-pp);Forj=1,j<=whole,j+,A=;ForI=1,I<=100,I+,s=(Sumrndnn,pp-nu,k,l,number);A=Appenda,s/(sigma*Sqrtnumber);C=c+fa;Pritc下面就是程序運行20 次得到的結果:24,25,23,23,21,24,25,23,24,24,24,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論