統(tǒng)計分析基礎知識_第1頁
統(tǒng)計分析基礎知識_第2頁
統(tǒng)計分析基礎知識_第3頁
統(tǒng)計分析基礎知識_第4頁
統(tǒng)計分析基礎知識_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

統(tǒng)計分析基礎知識【例】孵化一枚種蛋可能結果只有兩種,即“孵出小雞”與“未孵出小雞”。若用變量x表示試驗得兩種結果,則可令x=0表示“未孵出小雞”,x=1表示“孵出小雞”?!纠繙y定某品種豬初生重,表示測定結果得變量x所取得值為一個特定范圍(a,b),如0、5-1、5kg,x值可以就是這個范圍內(nèi)得任何實數(shù)。二、概率分布1、概念:描述隨機變量取值得概率得函數(shù)。主要有三種函數(shù):(1)概率函數(shù):描述離散型隨機變量各可能取值得概率得函數(shù)。(2)概率密度函數(shù):描述連續(xù)型隨機變量取值得概率密度得函數(shù)。(3)分布函數(shù):描述隨機變量取值小于、等于某值得概率得函數(shù)。記作F()=P(X≤)2、分布函數(shù)性質(zhì):

(1)F()就是x得非減函數(shù)(2)F(-∞)=0;F(+∞)=1(3)F()函數(shù)至多有可列個間斷點,而在其間斷點上也就是右連續(xù)。

3、大數(shù)定律:就是概率論中用來闡述大量隨機現(xiàn)象平均結果穩(wěn)定性得一系列定律得總稱。

主要內(nèi)容:樣本容量越大,樣本統(tǒng)計數(shù)與總體參數(shù)之差越小。

(1)貝努里大數(shù)定律設m就是n次獨立試驗中事件A出現(xiàn)得次數(shù),而p就是事件A在每次試驗中出現(xiàn)得概率,則對于任意小得正數(shù)ε,有如下關系:<ε}=1{limP

(2)辛欽大數(shù)定律

設x1,x2,x3,…,xn就是來自同一總體得變量,對于任意小得正數(shù)ε,有如下關系:<ε}=1{limP第四節(jié)離散分布一、離散型隨機變量概率函數(shù)p()=P(X=)

例:投擲一枚骰子所得得點數(shù)為一隨機變量,求該隨機變量得概率函數(shù)。概率函數(shù)得性質(zhì):

a)非負性:P(X=xi)=Pi≥0;

b)歸一性:

二、概率分布函數(shù)三、隨機變量得數(shù)學期望與方差

1、加權平均數(shù):例:某種玉米得株高數(shù)據(jù),求平均株高。株高1、751、761、771、781、791、801、811、821、83百分比2%1%6%3%1%4%2%3%1%株高1、841、851、861、871、881、891、901、911、92百分比15%8%7%11%5%5%10%10%6%=1.75×0.02+1.76×0.01+…+1.92×0.06=1.86F()=P(X≤)2、數(shù)學期望:

一個隨機變量得所有可能值以其相應得概率函數(shù)為權得加權平均數(shù)。表示集中程度得參數(shù)。設X就是一個離散型隨機變量,她可能取得值就是i(i=1,2,…),其概率函數(shù)為:p(i)=P(X=i)E(X)=x1p(xi)+x2p(x2)+x3p(x3)+…+xnp(xn)=

3、數(shù)學期望得性質(zhì):(1)E[g()]=

(2)E[g()+h()]=E[g()]+E[h()]推廣:E(X+Y)=E(X)+E(Y)(3)E(k)==kE(kX)=kE(x)(4)E(X-u)=E(X)-u=0(5)E(Xk)=kp(i)

隨機變量X得矩,k稱為矩得階。這一類型得矩又稱為k階原點矩。任意點得矩:E[(X-a)k]=表明:隨機變量X關于點a得k階矩。當a=μ=E(X)時,X關于μ得k階矩稱為中心矩。二階中心矩:

==VarX標準偏差:方差得平方根。бx==

反映了一個隨機變量取值得變化程度,反映了概率分布得散布或偏離。四、常見得離散分布1、伯努里(Bernoulli)分布一個只取兩個值得隨機變量叫伯努里隨機變量,其概率分布稱為伯努里分布。大家學習辛苦了,還是要堅持繼續(xù)保持安靜μ=E(X)=p

σ2=E(x2)-μ2=p-p2=p(1-p)=pq2、二項分布:(1)二項分布定義:設隨機變量x所有可能取得值為零和正整數(shù):0,1,2,…n,且k=0,1,2…n,其中p>0,q>0,p+q=1,則稱隨機變x服從參數(shù)為n和p得二項分布

(binomialdistribution),記為

x-B(n,p)。

(2)性質(zhì):

(1)P(X=k)=Pn(k)

(k=0,1,2、、、n)

(2)二項分布得概率之和等于1,即(3)二項分布由n和p兩個參數(shù)決定:①當p值較小且n不大時,分布就是偏倚得。但隨著n得增大,分布逐漸趨于對稱。②當p值趨于0、5時,分布趨于對稱。③對于固定得n及p,當k增加時,Pn(k)先隨之增加并達到其極大值,以后又下降。此外,在n較大,np、nq較接近時,二項分布接近于正態(tài)分布;當n→∞時,二項分布得極限分布就是正態(tài)分布。二項分布圖當n=20時,不同p值得曲線。(4)二項分布概率計算及應用條件【例】純種白豬與純種黑豬雜交,根據(jù)孟德爾理論,子二代中白豬與黑豬得比率為3:1。求窩產(chǎn)仔10頭,有7頭白豬得概率。解:n=10,p=3/4=0、75,q=1/4=0、25。設10頭仔豬中白色得為x頭【例】設在家畜中感染某種疾病得概率為20%,現(xiàn)有兩種疫苗,用疫苗A注射了15頭家畜后無一感染,用疫苗B注射15頭家畜后有1頭感染。設各頭家畜沒有相互傳染疾病得可能,問:應該如何評價這兩種疫苗?假設疫苗A完全無效,那么注射后得家畜感染得概率仍為20%,則15頭家畜中染病頭數(shù)x=0得概率:

如果疫苗B完全無效,則15頭家畜中最多有1頭感染得概率為可知,注射A疫苗無效得概率為0、0352,比B疫苗無效得概率0、1671小得多。因此,可以認為A疫苗就是有效得,但不能認為B疫苗也就是有效得?!纠孔胸i黃痢病在常規(guī)治療下死亡率為20%,求5頭病豬治療后死亡頭數(shù)各可能值相應得概率。設5頭病豬中死亡頭數(shù)為x,則x服從二項分布B(5,0、2),其所有可能取值為0,1,…,5,按計算概率,用分布列表示如下:

0123450、32770、40960、20480、05120、00640、0003二項分布得應用條件有三:1、各觀察單位只具有互相對立得一種結果。2、已知發(fā)生某一結果得概率為p,其對立結果得概率則為1-p=q,要求p就是從大量觀察中獲得得穩(wěn)定數(shù)值。3、n個觀察單位得觀察結果互相獨立。(5)二項分布得平均數(shù)與標準差μ=npσ=【例】求仔豬黃痢病平均死亡豬數(shù)及死亡數(shù)得標準差。以p=0、2,n=5代入公式得:平均死亡豬數(shù)μ=5×0、20=1、0(頭)

標準差(頭)當試驗結果以事件A發(fā)生得頻率k/n表示時

σp也稱為總體百分數(shù)標準誤,當p未知時,常以樣本百分數(shù)來估計。此時上式改寫為:

Sp稱為樣本百分數(shù)標準誤。3、波松分布

波松分布就是一種描述和分析發(fā)生在單位空間或時間里得稀有事件得概率分布。樣本含量n必須很大。二項分布得一種特殊類型。

(1)波松分布得概率函數(shù)若隨機變量X(X=k)只取零和正整數(shù)值0,1,2,…,且其概率分布為k=0,1,……n,其中λ>0,表示單位區(qū)間上發(fā)生變換得次數(shù);t表示t個小區(qū)間;e就是自然對數(shù)得底數(shù),則稱X服從參數(shù)為λ得波松分布(Poisson,

distribution)記為X-P(λ)。

變成n個二點分布:

p()︽Cnx()x

(1-)n-x

=F(k)=P(X≤k)=(2)波松分布重要得特征:①平均數(shù)和方差相等,都等于常數(shù)λ,即

μ=σ2=λt=np

②λ就是波松分布所依賴得唯一參數(shù)。③λ值愈小分布愈偏倚,隨著λ得增大,分布趨于對稱。④當λ=20時分布接近于正態(tài)分布;當λ=50時,認為波松分布呈正態(tài)分布。在實際工作中,當λ≥20時就可以用正態(tài)分布來近似地處理波松分布得問題。⑤對于小概率事件,可用波松分布描述其概率分布。⑥二項分布當p<0、1和np<5時,可用波松分布來近似?!纠空{(diào)查某種豬場閉鎖育種群仔豬畸形數(shù),共記錄200窩,畸形仔豬數(shù)得分布情況如下表所示。試判斷畸形仔豬數(shù)就是否服從波松分布?;巫胸i數(shù)統(tǒng)計分布樣本平均數(shù)和方差S2計算結果如下:

=Σfk/n=(120×0+62×1+15×2+2×3+1×4)/200=0、51=0、51,S2=0、52,這兩個數(shù)就是相當接近得,因此可以認為畸形仔豬數(shù)服從波松分布。波松分布若用m表示λ時得曲線(3)波松分布得概率計算大多λ未知,只能從所觀察得隨機樣本中計算出相應得樣本平均數(shù)作為λ得估計值?!纠恐幸雅袛嗷巫胸i數(shù)服從波松分布,并已算出樣本平均數(shù)=0、51。將0、51代替公式中得λ得:

(k=0,1,2,…)

因為e0、51=1、6653,所以畸形仔豬數(shù)各項得概率為:

P(x=0)=(0、510/0!)/1、6653=0、6005P(x=1)=(0、511/1!)/1、6653=0、3063P(x=2)=(0、512/2!)/1、6653=0、0781P(x=3)=(0、513/3!)/1、6653=0、0133P(x=4)=(0、514/4!)/1、6653=0、0017

把上面各項概率乘以總觀察窩數(shù)(n=200)即得各項按波松分布得理論窩數(shù)。波松分布與相應得頻率分布列于下表中?;巫胸i數(shù)得波松分布比較后發(fā)現(xiàn)畸形仔豬得頻率分布與λ=0、51得波松分布就是吻合得很好得。說明了畸形仔豬數(shù)就是服從波松分布得?!纠繛楸O(jiān)測飲用水得污染情況,現(xiàn)檢驗某社區(qū)每毫升飲用水中細菌數(shù),共得400個記錄如下:試分析飲用水中細菌數(shù)得分布就是否服從波松分布。若服從,按波松分布計算:細菌數(shù)/ml(水)得概率及理論次數(shù),并將頻率分布與波松分布直觀比較。

經(jīng)計算得每毫升水中平均細菌數(shù)=0、500,方差S2=0、496。兩者很接近,故可認為細菌數(shù)/ml(水)服從波松分布。以=0、500代替公式中得λ,得

(k=0,1,2…)

計算結果如下表。細菌數(shù)得波松分布可見細菌數(shù)得頻率分布與λ=0、5得波松分布就是相當吻合得,進一步說明用波松分布描述單位容積(或面積)中細菌數(shù)得分布就是適宜得。注意:波松分布得應用條件與二項分布相似。4、超幾何分布

一個由N個元素組成得集合,其中M個具有性質(zhì)E,N-M個沒有性質(zhì)E。若從N個元素中隨機抽取n個,具有性質(zhì)E得就是k個,k為超幾何隨機變量,她得概率分布稱超幾何分布。

n個伯努里分布

P(k)=P(X=k)=CMkCN-Mn-k/CNnμ=n、M/Nσ2=[n、M/N、(1-M/N)]例:一碗中盛有15顆珠子,其中10顆紅得,5顆白得。從碗中隨機取出4顆,并設k=抽得得紅珠子得個數(shù)。求k得數(shù)學期望與方差。(k=0,1,2,3,4)

性質(zhì):

當N→∞時,可用二項分布近似代替。也可被波松分布代替。第五節(jié)連續(xù)分布

一、連續(xù)型隨機變量密度函數(shù)

1

概率密度函數(shù):

如隨機變量X得分布函數(shù)F()在(-∞,+∞)處處連續(xù)并且除有限個或可數(shù)個點之外存在著連續(xù)得導數(shù)

=f(),則稱f()為概率密度函數(shù)。2、概率密度函數(shù)得性質(zhì):1)f()≥0;p(1<X<2)=F(2)-F(1)3)4)p(<X<+△)≈f()△連續(xù)分布律用概率密度表示,離散型分布律用概率函數(shù)P(X=)表示分布函數(shù)F()則表示任何型隨機變量概率分布律得共同形式。

f()d稱為概率單元。二、數(shù)學期望與方差E(x)=E[g(x)]=E(k)=kE(kx)=kE(x)E(xk)=σ2=E[(x-u)2]==-u2例:設X就是一個連續(xù)隨機變量,她得密度函數(shù)就是

f(x)=0(x﹤0或x﹥1)

2x(0≤x﹤1)求數(shù)學期望和方差。三、重要得連續(xù)分布1、均勻分布隨機變量X得密度函數(shù)在一個區(qū)間上等于一個常數(shù),而在區(qū)間外等于零。

U(a,b):E(x)=

=σ2=E(x2)-u2=(1)正態(tài)分布得概率密度函數(shù)若分布函數(shù)為

其中μ為平均數(shù),σ2為方差,則稱隨機變量x服從正態(tài)布分

(normaldistribution),記為x-N(μ,σ2)。相應得概率分布函數(shù)為

2、正態(tài)分布分布密度曲線99、73%68、26%95、45%(2)正態(tài)分布得特征1、正態(tài)分布密度曲線就是單峰、對稱得懸鐘形曲線,對稱軸為x=μ2、f(x)在x=μ處達到極大,極大值

3、f(x)就是非負函數(shù),以x軸為漸近線,分布從-∞至+∞;

4、曲線在x=μ±σ處各有一個拐點,即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上就是下凸得,在[μ-σ,μ+σ]區(qū)間內(nèi)就是上凸得;5、正態(tài)分布有平均數(shù)μ和標準差σ兩個參數(shù)。μ就是位置參數(shù),σ就是變異度參數(shù)。6、分布密度曲線與橫軸所夾面積為1,即:

μ就是位置參數(shù),當σ恒定時,μ愈大,則曲線沿x軸愈向右移動;反之,μ愈小,曲線沿x軸愈向左移動。

σ就是變異度參數(shù),當μ恒定時,σ愈大,表示x得取值愈分散,曲線愈“胖”;σ愈小,x得取值愈集中在μ附近,曲線愈“瘦”。μ=0,σ2=1得正態(tài)分布稱為標準正態(tài)分布(standardnormaldistribution)。記作u-N(0,1)。(3)標準正態(tài)分布概率密度函數(shù):分布函數(shù):正態(tài)分布N(μ,σ2)得隨機變量x得標準化變換:

z=(x-μ)/σ(4)正態(tài)分布得概率計算1、標準正態(tài)分布得概率計算=Φ(u2)-Φ(u1)P(0≤u<u1)=Φ(u1)-0、5

P(u≥u1)=Φ(-u1)

P(|u|≥u1)=2Φ(-u1)

P(|u|<u1)==1-2Φ(-u1)

P(u1≤u<u2)=Φ(u2)-Φ(u1)【例】已知u-N(0,1),試求:

(1)P(u<-1、64)=?(2)P(u≥2、58)=?(3)P(|u|≥2、56)=?(4)P(0、34≤u<1、53)=?

利用公式,查附表得:(1)P(u<-1、64)=0、05050(2)P(u≥2、58)=Φ(-2、58)=0、024940(3)P(|u|≥2、56)=2Φ(-2、56)=2×0、005234=0、010468(4)P(0、34≤u<1、53)=Φ(1、53)-Φ(0、34)=0、93669-0、6331=0、30389關于標準正態(tài)分布,以下幾種概率應當熟記:

P(-1≤u<1)=0、6826P(-2≤u<2)=0、9545

P(-3≤u<3)=0、9973

P(-1、96≤u<1、96)=0、95P(-2、58≤u<2、58)=0、99標準正態(tài)分布得三個常用概率99、73%68、26%95、45%2、一般正態(tài)分布得概率計算若隨機變量x服從正態(tài)分布N(μ,σ2),則x得取值落在任意區(qū)間[x1,x2)得概率,記作P(x1≤X<x2),變換u=(x-μ)/σ【例】設X服從μ=30、26,σ2=5、102得正態(tài)分布,試求P(21、64≤x<32、98)。令

則u服從標準正態(tài)分布,故

=P(-1、69≤u<0、53)=Φ(0、53)-Φ(-1、69)=0、7019-0、04551=0、656410.526.30-=Xu

關于一般正態(tài)分布,以下幾個概率就是經(jīng)常用到得。

P(μ-σ≤X<μ+σ)=0、6826

P(μ-2σ≤X<μ+2σ)=0、9545

P(μ-3σ≤X<μ+3σ)=0、9973

P(μ-1、96σ≤X<μ+1、96σ)=0、95

P(μ-2、58σ≤X<μ+2、58σ)=0、99第六節(jié)中心極限定理定理:設X1、X2、…、Xn為相互獨立同分布得隨機變量系列,令則設其分布函數(shù)為3個重要得概率分布得關系:(1)二項分布,在n→∞,p→0,且np=λ(較小常數(shù)),二項分布趨于波松分布,λ用二項分布得np代之;(2)在n→∞,p→0、5時,二項分布趨于正態(tài)分布,正態(tài)分布中得μ、σ2用二項分布得np、npq代之。在實際計算中,當p<0、1且n很大時,二項分布可由波松分布近似。(3)當p>0、1且n很大時,二項分布可由正態(tài)分布近似。(4)波松分布,當λ→∞時,波松分布以正態(tài)分布為極限。在實際計算中,當λ≥20(也有人認為λ≥6)時,用波松分布中得λ代替正態(tài)分布中得μ及σ2,即可由后者對前者進行近似計算。

單側概率與雙側概率生物統(tǒng)計中,把隨機變量x落在區(qū)間(μ-kσ,μ+kσ)之外得概率稱為雙側(兩尾)概率,記作α。對應于雙側概率可以求得隨機變量x小于μ-kσ或大于μ+kσ得概率,稱為單側概率,記作α/2。如,x落在(μ-1、96σ,μ+1、96σ)之外得雙側概率為0、05,而單側概率為0、025。即

P(x<μ-1、96σ)=P(x>μ+1、96σ)=0、025x落在(μ-2、58σ,μ+2、58σ)之外得雙側概率為0、01,而單側概率

P(x<μ-2、58σ)=P(x>μ+2、58σ)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論