(完整word版)統(tǒng)計學(xué)三大分布與正態(tài)分布的關(guān)系_第1頁
(完整word版)統(tǒng)計學(xué)三大分布與正態(tài)分布的關(guān)系_第2頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計學(xué)三大分布與正態(tài)分布的關(guān)系1張柏林41060045理實1002班摘要:本文首先將介紹咒2分布,,分布,F(xiàn)分布和正態(tài)分布的定義及基本性質(zhì),然后用理論說明x2分布,t分布,F(xiàn)分布與正態(tài)分布的關(guān)系,并且利用數(shù)學(xué)軟件MATLAB來驗證之.1.三大分布函數(shù)21.1x2分布x2(n)分布是一種連續(xù)型隨機(jī)變量的概率分布。這個分布是由別奈梅(Benayme)、赫爾默特(Helmert)、皮爾遜分別于1858年、1876年、1900年所發(fā)現(xiàn),它是由正態(tài)分布派生出來的,主要用于列聯(lián)表檢驗。定義:若隨機(jī)變量X,X,X相互獨(dú)立,且都來自正態(tài)總體N(0,1),則稱12n統(tǒng)計量x2=X2+X2+-+X2為服從自由度為

2、n的X2分布,記為12nx2x2(n).X2分布的概率密度函數(shù)為f(X;n)=0,X2分布的密度函數(shù)圖形是一個只取非負(fù)值0的偏態(tài)分布,如下圖.性質(zhì)1:E(咒2(n)=n,D(咒2(n)=2n;性質(zhì)2:若X=*2(n),X=*2(n),X,X相互獨(dú)立,則X+X咒2(n+n);1122121212性質(zhì)3:n時,x(n)T正態(tài)分布;性質(zhì)4:設(shè)x2z(2(n),對給定的實數(shù)八/h)a(0a1),稱滿足條件:PX2X2(n)J:f(x)dx=aa偏n的點z(2(n)為x2(n)分布的水平a的上側(cè)分位數(shù).簡稱為上側(cè)a分位數(shù).對不同的a與n,分位數(shù)的值已經(jīng)編制成表供查用.X2(n)分布的上a分位數(shù)1.21分

3、布t分布也稱為學(xué)生分布,是由英國統(tǒng)計學(xué)家戈賽特在1908年“student”的筆名首次發(fā)表的,這個分布在數(shù)理統(tǒng)計中也占有重要的位置.X定義:設(shè)XN(0,1),Yx2(n),X,Y相互獨(dú)立,則稱統(tǒng)計量Ty/Y/n服從自由度為n的t分布,記為Tt(n).t分布的密度函數(shù)為gt+s.t(x;n)=上二(1+蘭)-詈,叫品n加)對不同的a與n,t分布的雙側(cè)分位數(shù)可從附i2性質(zhì)1:f(t)是偶函數(shù),nTg,f(t)T申(t)e-2nn云;性質(zhì)2:設(shè)Ttjn),對給定的實數(shù)a(0at(n)=f+gf(x)dx=a的點t(n)為t(n)分ata(n)a布的水平a的上側(cè)分位數(shù).由密度函數(shù)f(x)的對稱性,可得

4、t(n)=-1(n).類似地,我們1可以給出t分布的雙側(cè)分位數(shù)PlTlta/2(n)=J-:/2(n)f(x)dx+J+gf(x)dx=a,-gt(n)a/2顯然有PTt(n)=;PTt(n)=.a/22a/22表查得.t分布的上a分位數(shù)1.3F分布F分布是隨機(jī)變量的另一種重要的小樣本分布,應(yīng)用也相當(dāng)廣泛.它可用來檢驗兩個總體的方差是否相等,多個總體的均值是否相等.F分布還是方差分析和正交設(shè)計的理論基礎(chǔ).定義:設(shè)XX2(n),YX2(m),X,Y相互獨(dú)立,令則稱統(tǒng)計量F二X/n服Y/m從為第一自由度為n,第二自由度為m的F分布.F分布的密度函數(shù)圖F分布具有如下一些性質(zhì):性質(zhì)1若FF(n,m),

5、則1/FF(m,n);9性質(zhì)2:若Xt(n),則X2F(1,n);性質(zhì)3:設(shè)FFa(n,m),對給定的實數(shù)a(0aFJn,m)Jf(x)dx=aFa(n,m)的點F(n,m)為F(n,m)分布的水平a的上側(cè)a分位數(shù).F分布的上分位數(shù)F分布的上側(cè)分位數(shù)的可自附表查得.性質(zhì)4:F(m,n)=1.此式常常用來求F分布表中沒有列出的某些上aF(n,m)1-a側(cè)分位數(shù).1.4正態(tài)分布正態(tài)分布是數(shù)理統(tǒng)計中的一種重要的理論分布,是許多統(tǒng)計方法的理論基礎(chǔ).高斯(Gauss)在研究誤差理論時首先用正態(tài)分布來刻畫誤差的分布,所以正態(tài)分布又稱為高斯分布.正態(tài)分布有兩個參數(shù),卩和6決定了正態(tài)分布的位置和形態(tài).為了應(yīng)用

6、方便,常將一般的正態(tài)變量X通過u變換轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)變量u,以使原來各種形態(tài)的正態(tài)分布都轉(zhuǎn)換為尸0,=1的標(biāo)準(zhǔn)正態(tài)分布N(0,1).正態(tài)分布的密度函數(shù)和分布函數(shù)若連續(xù)型隨機(jī)變量X具有概率密度f(x)為1(x丄)2f(x)二_e-2a2,g0)為常數(shù),則稱X服從參數(shù)為P,a的正態(tài)分布,記為XN(P,a2).正態(tài)分布的密度函數(shù)圖特征1:正態(tài)曲線(normalcurve)在橫軸上方均數(shù)處最高;特征2:正態(tài)分布以均數(shù)為中心,左右對稱;特征3:正態(tài)分布有兩個參數(shù),即均數(shù)卩和標(biāo)準(zhǔn)差c.卩是位置參數(shù),c固定不變時,卩越大,曲線沿橫軸越向右移動;反之,卩越小,則曲線沿橫軸越向左移動.c是形狀參數(shù),當(dāng)卩固定不變時

7、,c越大,曲線越平闊;c越小,曲線越尖峭.通常用N0,c2)表示均數(shù)為卩,方差為c2的正態(tài)分布.用N(0,1)表示標(biāo)準(zhǔn)正態(tài)分布.特征4:正態(tài)曲線下面積的分布有一定規(guī)律。實際工作中,常需要了解正態(tài)曲線下橫軸上某一區(qū)間的面積占總面積的百分?jǐn)?shù),以便估計該區(qū)間的例數(shù)占總例數(shù)的百分?jǐn)?shù)(頻數(shù)分布)或觀察值落在該區(qū)間的概率.正態(tài)曲線下一定區(qū)間的面積可以通過標(biāo)準(zhǔn)正態(tài)分布函數(shù)表求得。對于正態(tài)或近似正態(tài)分布的資料,已知均數(shù)和標(biāo)準(zhǔn)差,就可對其頻數(shù)分布作出概約估計2.三大分布與正態(tài)分布的密度函數(shù)比較32.1x2分布收斂于正態(tài)分布_1設(shè)Xx2(n),則對任意X,有l(wèi)imP(._0且yxn所以xn+*2ny因為|f(y)

8、dy|f(x)dx|YX所以f(y)=Y吟(n+:2ny)2-1e一2(n+n/2dyn2-1(1+:2y)2-1e-2(n廣2ny)2nr(n)2n/2n1令n=2m,利用Stirling公式:m!=J2兀mmme-m12m則上式=:4mT(m)2m(2m)m-1(1+y)m-1e-(m+%my)me22兀所以x2分布的極限分布為正態(tài)分布.F面用MATLAB來驗證上面結(jié)論,首先定義x2(n)分布函數(shù)和相應(yīng)的正態(tài)分布從上面三個圖形可以看出,n越大,x2(n)分布密度函數(shù)與正態(tài)分布N(n,2n)度函數(shù)越接近,這就和所證結(jié)論相符合.2.2t分布收斂于標(biāo)準(zhǔn)正態(tài)分布若X服從自由度為n的t分布,limP

9、(X/2s證法1:由于自由度為n的t分布的概率密度函數(shù)為r(+1)2rX2-n+1p(x;n)=2(1+)2,sx+s陌r(n因此(1)式等價于1imp(x;n)=1e-x2/2,gx+8ns2兀1)2)1先利用Stirling公式:m!=J2兀mmme-m2m、r(罟)1證明lim-=-g府(-)邁2事實上,利用r函數(shù)的性質(zhì)n一1n一3n一2k+1n一2k+1)_2(2)-(n)n一2n一4n一2k+2廠(n一2k+2)(2)2(2n2k+1(n-1)(n-3).(n-2k+1)r().n2k+2(n-2)(n-4)(n-2k+2)r(-T-)當(dāng)n=2k時r仔)(2k-1)(2k-3)1-r

10、(2)nr(n/2j2k(2k-2)(2k-4)2-r(1)2(2k-1)!燈2k12k(2k-1)()e2k-12222k-2(k-1)!)22莎22k-2(J2兀(k1)(口)k-1)2e2v2k-i兀(2k-1)2k-1e2k-1e2k-22莎22k22兀(k-1)(k-1)2心2k-112k-1。1、11/、=左2T(1+2k-2)2k-1eT寸TQ當(dāng)n-2k+1時亦可推出同樣的結(jié)果。另外,由特殊極限公式可得X2n1X2亠/x2lim(1+)-2-lim(1+)x2n(-2)-enT8nnT8n綜合上訴,即證明(2)式所以,t分布的極限分布是正態(tài)分布.F面用MATLAB來驗證上面結(jié)論,

11、首先定義t(n)分布函數(shù)和相應(yīng)的正態(tài)分布從上面三個圖形可以看出,n越大,t(n)分布密度函數(shù)與正態(tài)分布N(0,)度函n一2數(shù)越接近,這就和所證結(jié)論相符合.2.3F分布收斂于標(biāo)準(zhǔn)正態(tài)分布若F二常服從為第一自由度為m,第二自由度為n的F分布,則limP(Xx)=1jxe一2/2dt.n2n一8證明:當(dāng)m_8時丫/m1所以FX/n2n2因為E(X/n)二1,D(X/n)二一二-n2nF一1所以由中心極限定理,當(dāng)nT8時N(0,1)所以F分布的極限分布是正態(tài)分布.n2n2(m+n一2)F面用MATLAB來驗證上面結(jié)論,首先定義F(m,n)分布函數(shù)和相應(yīng)的正態(tài)分布(口匚(二2)2(二)再依次增大n比較兩

12、者關(guān)系:15從上面三個圖形可以看出,n越大,F(xiàn)(m,n)分布密度函數(shù)與正態(tài)分布n(,2n2(mn?)度函數(shù)越接近,這就和所證結(jié)論相符合.n-2m(n2)2(n-4)在實際應(yīng)用中我們往往在取得總體的樣本后,通常是借助樣本的統(tǒng)計量對未知的總體分布進(jìn)行推斷,為此須進(jìn)一步確定相應(yīng)的統(tǒng)計量所服從的分布,正態(tài)分布、x2(n)分布、分布、F分布是統(tǒng)計學(xué)最基本的四種分布,而x2(n)分布、t分布和F分布又都收斂于正態(tài)分布,可見正態(tài)分布在統(tǒng)計學(xué)中的地位.實際上,證明X2(n)分布、t分布和F分布收斂于正態(tài)分布的方法很多,本質(zhì)上都是應(yīng)用了大數(shù)定理和中心極限定理.既然三大抽樣分布都收斂于正態(tài)分布,則當(dāng)樣本容量很大時,就可以用正態(tài)分布來近似三大抽樣分布.本文主要還利用了計算機(jī)軟件來驗證數(shù)學(xué)上的理論證明,在現(xiàn)代數(shù)學(xué)學(xué)習(xí)中,我們是離不開計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論