第四章 理論分布與抽樣分布_第1頁
第四章 理論分布與抽樣分布_第2頁
第四章 理論分布與抽樣分布_第3頁
第四章 理論分布與抽樣分布_第4頁
第四章 理論分布與抽樣分布_第5頁
已閱讀5頁,還剩100頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

生物統(tǒng)計(jì)Biostatistics主講李雪林單位種子科學(xué)與工程系時(shí)間2010年9月河南科技大學(xué)第四章

理論分布與抽樣分布主要內(nèi)容第一節(jié)概率的基礎(chǔ)知識(shí)第二節(jié)二項(xiàng)分布第三節(jié)正態(tài)分布第四節(jié)抽樣分布一、事件和概率(一)事件(event)隨機(jī)試驗(yàn)的每一種可能結(jié)果。

必然事件-----對于一類事件來說,在同一組條件的實(shí)現(xiàn)之下必然要發(fā)生的,稱為必然事件。用U表示,其概率為1。不可能事件

-----對于一類事件來說,在同一組條件的實(shí)現(xiàn)之下必然不發(fā)生的,稱為不可能事件。用V表示,其概率為0。隨機(jī)事件(randomevent)----在同一組條件下,每次試驗(yàn)可能出現(xiàn)也可能不出現(xiàn)的事件。隨機(jī)事件的特點(diǎn)(1)試驗(yàn)可以在相同條件下多次重復(fù)進(jìn)行;(2)試驗(yàn)的所有結(jié)果事先已知;(3)每次試驗(yàn)只出現(xiàn)這些可能結(jié)果中的一個(gè),但不能預(yù)先斷定出現(xiàn)哪個(gè)結(jié)果。盡管隨機(jī)事件在一定的條件下,有多種可能的結(jié)果發(fā)生,事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果;對一次或少數(shù)幾次觀察或試驗(yàn)而言,其結(jié)果呈現(xiàn)偶然性、不確定性。但在相同條件下進(jìn)行大量重復(fù)試驗(yàn)時(shí),其試驗(yàn)結(jié)果卻呈現(xiàn)出某種固有的、特定的規(guī)律性——頻率的穩(wěn)定性,通常稱之為隨機(jī)事件的統(tǒng)計(jì)規(guī)律性。(二)概率(probability)某一事件在試驗(yàn)中出現(xiàn)的可能性大小的一種度量,稱為該事件的概率。在相同條件下進(jìn)行n次重復(fù)試驗(yàn),如果隨機(jī)事件A發(fā)生的次數(shù)為m,那么m/n稱為隨機(jī)事件A的頻率(frequency);當(dāng)重復(fù)試驗(yàn)的次數(shù)n逐漸增大時(shí),隨機(jī)事件A的頻率越來越穩(wěn)定地接近某一數(shù)值p,那么就把p稱為隨機(jī)事件A的概率。事件A的概率表示方法為P(A)。例如:拋擲一枚硬幣發(fā)生正面朝上的頻率試驗(yàn)結(jié)果試驗(yàn)的次數(shù)頻率1.000.000.250.500.750255075100125調(diào)查株數(shù)(n)52550100200500100015002000受害株數(shù)(a)212153372177351525704棉株受害頻率(a/n)0.400.480.300.330.360.3540.3510.3500.352在相同條件下盲蝽象在某棉田危害程度的調(diào)查結(jié)果從上面兩個(gè)事例可以看出,隨著實(shí)驗(yàn)次數(shù)的增多,硬幣正面朝上和棉田受害株這兩個(gè)事件發(fā)生的頻率越來越穩(wěn)定地接近0.5和0.35,我們就把0.5和0.35分布作為這兩個(gè)事件的概率。在一般情況下,隨機(jī)事件的概率p是不可能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)n充分大時(shí)隨機(jī)事件A的頻率作為該隨機(jī)事件概率的近似值。即P(A)=p≈m/n(n充分大),0≤P(A)≤1。12345678910隨機(jī)抽取一個(gè)球,求下列事件的概率;(1)事件A=抽得一個(gè)編號<4(2)事件B=抽得一個(gè)編號是2的倍數(shù)該試驗(yàn)樣本空間由10個(gè)等可能的基本事件構(gòu)成,即n=10,而事件A所包含的基本事件有3個(gè),即抽得編號為1、2、3中的任何一個(gè),事件A便發(fā)生。P(A)=3/10=0.3P(B)=5/10=0.5概率基本概念12345678910A=“一次取一個(gè)球,取得紅球的概率”10個(gè)球中取一個(gè)球,其可能結(jié)果有10個(gè)基本事件(即每個(gè)球被取到的可能性是相等的),即n=10事件A:取得紅球,則A事件包含3個(gè)基本事件,即m=3P(A)=3/10=0.312345678910B=“一次取5個(gè)球,其中有2個(gè)紅球的概率”10個(gè)球中任意取5個(gè),其可能結(jié)果有C105個(gè)基本事件,即n=C105P(B)=C32C73/

C105=0.417概率基本概念0≤P(A)≤1

任何事件P(U)=1

必然事件P(V)=0

不可能事件0<P(A)<1

隨機(jī)事件概率的基本性質(zhì)概率基本概念概率與頻率的關(guān)系頻率與概率都是一個(gè)居于0和1之間的數(shù)。頻率是相對于樣本而言,而概率則是相對于總體而言。因此可以說概率是頻率的理論值,頻率是概率的估計(jì)值。頻率分布是一種觀察分布,而概率分布則是一種理論分布。(三)小概率原理若事件A發(fā)生的概率較小,如小于0.05或0.01,則認(rèn)為事件A在一次試驗(yàn)中不太可能發(fā)生,這稱為小概率事件實(shí)際不可能性原理,簡稱小概率原理。這里的0.05或0.01或0.001稱為小概率標(biāo)準(zhǔn),農(nóng)業(yè)試驗(yàn)研究中通常使用這幾個(gè)小概率標(biāo)準(zhǔn)。小概率原理是統(tǒng)計(jì)學(xué)上進(jìn)行假設(shè)檢驗(yàn)(顯著性檢驗(yàn))的基本依據(jù)。二、事件間的關(guān)系(一)和事件事件A和B至少有一個(gè)發(fā)生而構(gòu)成的新事件稱為事件A和B的和事件,記為A+B,讀作“或A發(fā)生,或B發(fā)生”。例如,有一批種子,包含有能發(fā)芽的和不能發(fā)芽的。若A為“取到能發(fā)芽種子”,B為“取到不能發(fā)芽種子”,則A+B為“或者取到能發(fā)芽種子或者取到不能發(fā)芽種子”。事件間的和事件可以推廣到多個(gè)事件:事件A1、A2、…、An至少有一發(fā)生而構(gòu)成的新事件稱為事件A1、A2、…、An的和事件,記為A1+A2+…+An=和事件A+BAB(二)積事件

事件A和B同時(shí)發(fā)生所構(gòu)成的新事件稱為事件A和B的積事件,記作AB,讀作“A和B同時(shí)發(fā)生或相繼發(fā)生”。事件間的積事件也可以推廣到多個(gè)事件:事件A1、A2、…、An同時(shí)發(fā)生所構(gòu)成的新事件稱為這n個(gè)事件的積事件,記作A1A2…An=積事件ABAB(三)互斥事件事件A和B不可能同時(shí)發(fā)生,即A·B為不可能事件,記作A·B=V,稱事件A和B互斥或互不相容。例如,有一袋種子,按種皮分黃色和白色。每次取1粒,若記A為“取到黃色”,B為“取到白色”,顯然A和B不可能同時(shí)發(fā)生,即一粒種子不可能既為黃色又為白色,說明事件A和B互斥。這一定義也可以推廣到n個(gè)事件。事件A1、A2、…、An不可能同時(shí)發(fā)生所構(gòu)成的新事件稱為這n個(gè)事件互斥或互不相容,記作A1·A2…·An=V。如:打麻將擲一粒骰子,出現(xiàn)1(or2、3、4、5、6)后,其他點(diǎn)便不出現(xiàn)。(四)對立事件事件A和B不可能同時(shí)發(fā)生,但必發(fā)生其一,即A+B為必然事件(記為A+B=U),AB為不可能事件(記為A·B=V),則稱事件B為事件A的對立事件,并記B為。例如,上面例子中A為“取到黃色”,B為“取到白色”,A與B不可能同時(shí)發(fā)生,但是,任意抽取一粒種子,其皮色不是黃色就是白色,即A和B必發(fā)生其一,因此,A和B互為對立事件。兩個(gè)事件互斥,它們未必對立;反之,兩個(gè)事件對立,它們一定互斥。如果事件A、B互斥,則P(AorB)=P(A)+P(B);若A、B是對立事件,則P(AorB)=P(A)+P(B)=1。(五)完全事件系若事件A1、A2、…、An兩兩互斥,且每次試驗(yàn)結(jié)果必發(fā)生其一,則稱A1、A2、…、An為完全事件系。例如,僅有三類花色:黃色、白色和紅色,則取一朵花,“取到黃色”、“取到白色”和“取到紅色”就構(gòu)成完全事件系。(六)事件的獨(dú)立性

若事件A發(fā)生與否不影響事件B發(fā)生的可能性,則稱事件A和事件B相互獨(dú)立。例如,事件A為“花的顏色為黃色”,事件B為“產(chǎn)量高”,顯然如果花的顏色與產(chǎn)量無關(guān),則事件A與事件B相互獨(dú)立。反之,如果花的顏色為黃色的都產(chǎn)量高,則事件A與事件B是非獨(dú)立。三、計(jì)算事件概率的法則(一)互斥事件的加法假定兩互斥事件A和B的概率分別為P(A)和P(B)。則事件A與B的和事件的概率等于事件A的概率與事件B的概率之和,即P(A+B)=P(A)+P(B)。加法定理對于多個(gè)兩兩互斥的事件也成立:假定A1、A2、…、Ann個(gè)事件彼此間均是兩兩互斥的事件,其概率依次為P(A1),P(A2),…,P(An),則A1,A2到An和事件的概率P(A1+A2+…+An)等于P(A1),P(A2),…,P(An)之和,即P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)。例如,一捆花中紅、黃、白花的概率分別為0.2、0.3、0.5,那么我們隨機(jī)抽取一朵非白色花的概率為0.5(=0.2+0.3),這只是由加法定理得到的兩個(gè)事件概率之和。(二)獨(dú)立事件的乘法假定P(A)和P(B)是兩個(gè)獨(dú)立事件A與B各自出現(xiàn)的概率,則事件A與B同時(shí)出現(xiàn)的概率等于兩獨(dú)立事件出現(xiàn)概率P(A)與P(B)的乘積,即P(AB)=P(A)P(B)。乘法定理對于n個(gè)相互獨(dú)立的事件也成立。假定P(A1),P(A2),…,P(An)是n個(gè)相互獨(dú)立事件各自出現(xiàn)的概率,則該n個(gè)事件同時(shí)出現(xiàn)的概率P(A1A2…An)等于各自出現(xiàn)概率之乘積,即P(A1A2…An)=P(A1)P(A2)…P(An)。現(xiàn)有4粒種子,其中3粒為黃色、1粒為白色,采用復(fù)置抽樣。試求下列兩事件的概率:(A)第一次抽到黃色、第二次抽到白色;(B)兩次都抽到黃色。P(A)=P(第一次抽到黃色種子)P(第二次抽到白色種子)=0.25×0.75=0.1875,P(B)=P(第一次黃色種子)P(第二次黃色種子)=0.75×0.75=0.5625。(三)對立事件的概率

若事件A的概率為P(A),那么其對立事件的概率為:(四)完全事件系的概率完全事件系的概率為1。

例如“從10個(gè)數(shù)字中隨機(jī)抽得任何一個(gè)數(shù)字都可以”這樣一個(gè)事件是完全事件系,其概率為1。

(五)非獨(dú)立事件的乘法

如果事件A和B是非獨(dú)立的,那么事件A與B同時(shí)發(fā)生的概率為事件A的概率P(A)乘以事件A發(fā)生的情況下事件B發(fā)生的概率P(B|A),即:P(AB)=P(A)P(B|A)四、概率分布(probabilitydistribution)事件的概率表示了某一事件(試驗(yàn)結(jié)果)在一次試驗(yàn)中出現(xiàn)的可能性大小。若要全面了解試驗(yàn),則必須知道試驗(yàn)的全部可能結(jié)果及各種可能結(jié)果發(fā)生的概率,即必須知道隨機(jī)試驗(yàn)的概率分布。為了深入研究隨機(jī)試驗(yàn),我們先引入變量和隨機(jī)變量(randomvariable)的概念。相同性質(zhì)事物間表現(xiàn)差異性(特征)的數(shù)據(jù)(量)叫變量(變數(shù))。能代表整個(gè)事物特征特性的數(shù)據(jù)叫常量(常數(shù))。常數(shù)在一定過程中是不變的,如平均數(shù),標(biāo)準(zhǔn)差。(一)隨機(jī)變量(randomvariable)一次試驗(yàn)的結(jié)果的數(shù)值性描一般用X,Y,Z來表示,具體取值常用小寫字母x、y、z來表示。例如:投擲兩枚硬幣出現(xiàn)正面的數(shù)量(

X=x=0,1,2)。隨機(jī)變量離散型變量連續(xù)型變量離散型隨機(jī)變量(discreterandomvariable)如果隨機(jī)變量X的結(jié)果是明確的,并可一一列出,當(dāng)X取某一值時(shí),其概率是確定的,則稱X為離散型隨機(jī)變量。試驗(yàn)隨機(jī)變量可能的取值抽查100個(gè)產(chǎn)品一家餐館營業(yè)一天電腦公司一個(gè)月的銷售銷售一輛汽車取到次品的個(gè)數(shù)顧客數(shù)銷售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為1連續(xù)型隨機(jī)變量(continuousrandomvariable)如果表示試驗(yàn)結(jié)果的變量X,其可能取值為某范圍內(nèi)的任何數(shù)值,且X在其取值范圍內(nèi)的任一區(qū)間中取值時(shí),其概率是確定的,則稱X為連續(xù)型隨機(jī)變量??梢匀∫粋€(gè)或多個(gè)區(qū)間中任何值所有可能取值不可以逐個(gè)列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn)試驗(yàn)隨機(jī)變量可能的取值抽查一批電子元件新建一座住宅樓測量一個(gè)產(chǎn)品的長度稱量一個(gè)蘋果的果實(shí)重使用壽命(小時(shí))半年后工程完成的百分比測量誤差(cm)稱量誤差(g)X

00

X100X

030

X200(Ⅰ)離散型隨機(jī)變量的概率分布離散型隨機(jī)變量的概率分布列出離散型隨機(jī)變量X的所有可能取值列出隨機(jī)變量取這些值的概率通常用下面的表格來表示X=xix1,x2

,…

,xnP(X=xi)=pip1,p2

,…

,pnP(X=xi)=pi稱為離散型隨機(jī)變量的概率函數(shù)

;離散型隨機(jī)變量的概率分布

(例題分析)【例】投擲一顆骰子后出現(xiàn)的點(diǎn)數(shù)是一個(gè)離散型隨機(jī)變量。寫出擲一枚骰子出現(xiàn)點(diǎn)數(shù)的概率分布

X=xi123456P(X=xi)

pi1/61/61/61/61/61/6概率分布離散型隨機(jī)變量的概率分布

(例題分析)【例】一部電梯在一周內(nèi)發(fā)生故障的次數(shù)X及相應(yīng)的概率如下表故障次數(shù)X=xi0123概率P(X=xi)

pi0.100.250.35

一部電梯一周發(fā)生故障的次數(shù)及概率分布

確定

的值求正好發(fā)生兩次故障的概率求故障次數(shù)不超過2次的概率至少發(fā)生兩次故障的概率離散型隨機(jī)變量的概率分布

(例題分析)解:(1)由于0.10+0.25+0.35+

=1

所以,

=0.30

(2)P(X=2)=0.35(3)P(X

2)=0.10+0.25+0.35=0.70(4)P(X

2)=0.35+0.30=0.65(Ⅱ)連續(xù)型隨機(jī)變量的概率分布

定義:如果對于隨機(jī)變量X的分布函數(shù)F(x),存在非負(fù)函數(shù)f(x),使得對于任意實(shí)數(shù)x有則稱X為連續(xù)型隨機(jī)變量,其中函數(shù)f(x)為X的概率密度函數(shù)(probabilitydensityfunction)。(Ⅱ)連續(xù)型隨機(jī)變量的概率分布

連續(xù)型隨機(jī)變量(如產(chǎn)量、株高)的概率分布不能用分布列來表示,因?yàn)槠淇赡苋〉闹凳遣豢蓴?shù)的。我們改用隨機(jī)變量X在某個(gè)區(qū)間內(nèi)取值的概率P(a≤x<b)來表示。圖3.1鰱魚體長的頻率分布圖354045505560657075808590直方圖中同一組內(nèi)的頻率是相等的。由表中作150尾鰱魚體長資料的頻率分布方柱形圖,圖中縱座標(biāo)為組距范圍內(nèi)的頻率??梢栽O(shè)想,如果樣本取得越來越大(n→+∞),組分得越來越細(xì)(i→0),某一范圍內(nèi)的頻率將趨近于一個(gè)穩(wěn)定值----概率。這時(shí),頻率分布方柱形圖各個(gè)直方上端中點(diǎn)的聯(lián)線----頻率分布折線將逐漸趨向于一條曲線。換句話說,當(dāng)n→+∞、i→0時(shí),頻率分布折線的極限是一條穩(wěn)定的函數(shù)曲線。對于連續(xù)型隨機(jī)變量的情況,這條函數(shù)曲線將是光滑的。這條曲線完全反映了鰱魚體長的變動(dòng)規(guī)律。這條曲線叫連續(xù)性隨機(jī)變量的概率分布密度曲線,相應(yīng)的函數(shù)叫概率分布密度函數(shù)設(shè)鰱魚體長概率分布密度函數(shù)為f(x),當(dāng)x取值于區(qū)間(a,b)時(shí)的概率為圖中陰影部分的面積,即f(x)xab概率是曲線下的面積注意:

f(x)不是概率,密度函數(shù)f(x)表示X的所有取值x

及其頻數(shù)f(x)。

x值(x值,頻數(shù))頻數(shù)f(x)abx分布函數(shù)

(distributionfunction)1.連續(xù)型隨機(jī)變量的概率可以用分布函數(shù)F(x)來表示,表示隨機(jī)變量X的值小于x的概率。2.分布函數(shù)定義為根據(jù)分布函數(shù),P(a<X<b)可以寫為分布函數(shù)與密度函數(shù)的圖示密度函數(shù)曲線下的面積等于1,表示瞬時(shí)幅值落在某指定范圍內(nèi)的概率。分布函數(shù)是曲線下小于x0

的面積,如果將X看成是數(shù)軸上的隨機(jī)點(diǎn)的坐標(biāo),那么分布函數(shù)F(x)在x處的函數(shù)值就表示X落在區(qū)間(-∞,x]上的概率。。f(x)xx0F(x0

)f(x)abx毒性試驗(yàn):白鼠死亡——生存臨床試驗(yàn):病人治愈——未愈臨床化驗(yàn):血清陽性——陰性事件成功(A)——失?。ǚ茿)這類“成功─失敗型”試驗(yàn)稱為Bernoulli試驗(yàn)。生活中貝努里試驗(yàn)因此,稱P(X)為隨機(jī)變量X的二項(xiàng)分布,記作X~B(n,p),也叫貝努里分布。試驗(yàn)的對象只有兩種結(jié)果,事件A和

。事件A的概率是p,事件

的概率是q。而且p+q=1事件A和

是可以計(jì)數(shù)的。從二項(xiàng)總體中連續(xù)抽取n個(gè)個(gè)體,將結(jié)果是A的次數(shù)記為X。以x表示事件A在n個(gè)個(gè)體中出現(xiàn)的次數(shù),則X是一個(gè)離散型隨機(jī)變量。它的所有可能取值為0,1,2,…,n,其概率分布函數(shù)為完全事件系對于P(X=x)0,x=1,2,…,n,有同樣當(dāng)

n=1時(shí),二項(xiàng)分布化簡為二項(xiàng)分布二項(xiàng)分布的特征(1)每個(gè)觀察單位只有兩個(gè)對立結(jié)果。(2)若其中一個(gè)結(jié)果的概率為p,則其對立結(jié)果的概率為q=1-p。

(3)n個(gè)觀察單位的觀察結(jié)果是互相獨(dú)立的,即每個(gè)觀察單位的觀察結(jié)果不會(huì)影響到其它觀察單位的觀察結(jié)果。二、二項(xiàng)分布的概率計(jì)算【例題1】豌豆紅花與白花雜交,根據(jù)孟德爾遺傳理論,F(xiàn)2代中紅花與白花的比率為3∶1。若一次隨機(jī)觀察12株,有7株紅花的概率是多少?若連續(xù)觀察50次,有7株紅花的理論上會(huì)有幾次?解:n=12,p=3/4=0.75(紅花),q=1/4=0.25(白花)。設(shè)12株豌豆中紅花的株數(shù)以xi表示,則X為服從二項(xiàng)分布B(12,0.75)的隨機(jī)變量。于是12株豌豆中有7株是紅花的概率為:P(7)=C127.p7.q5=792×0.757×0.255=0.1032若觀察50次(N),出現(xiàn)7株紅花的理論次數(shù)為理論次數(shù)=N×P(7)=50×0.1032=5.16(次)【例題2】某小麥品種在田間出現(xiàn)自然變異植株的概率為0.0045,試計(jì)算:觀察100株,獲得兩株或兩株以上變異植株的概率是多少?期望有0.99的概率獲得1株或1株以上的變異植株,至少應(yīng)觀察多少株?解:已知變異株概率p=0.0045;非變異株的概率q=1-p=0.9955;(1)當(dāng)n=100,獲得0個(gè)變異株概率,x=0,P(0)=0.6370

獲得1個(gè)變異株概率,x=1,P(1)=0.2879

獲得2株或以上變異株概率為:x≥2,P(X=x≥2)=1-P(0)-P(1)

=0.0751(2)如果期望調(diào)查n株中至少有1株是變異株的概率是0.99,即P(X=x≥2)=0.99。則獲得非變異株的概率:

P(0)=1-0.99=0.01,即:x=0,P(0)=Cn0.p0.qn=0.01;因此:三、二項(xiàng)分布的形狀和參數(shù)1.二項(xiàng)分布的形狀由n和p兩個(gè)參數(shù)決定(1)當(dāng)p值較小且n值不大時(shí)圖形是偏畸的。隨著n值的增大,分布逐漸趨于對稱。(2)當(dāng)p值趨于0.5時(shí),分布趨于對稱。2、二項(xiàng)分布的參數(shù)若隨機(jī)變量(次數(shù)X

)服從二項(xiàng)分布B(n,p),則該二項(xiàng)次數(shù)分布的平均數(shù)μx、標(biāo)準(zhǔn)差σx與參數(shù)n、p有如下關(guān)系:二項(xiàng)總體百分?jǐn)?shù)分布的參數(shù)由于二項(xiàng)分布中變量X(次數(shù))除以樣本容量n,可以得到二項(xiàng)總體的百分?jǐn)?shù)(成數(shù))p分布。次數(shù)分布與百分?jǐn)?shù)分布在同一坐標(biāo)系中對比二項(xiàng)總體百分?jǐn)?shù)分布的參數(shù)其平均數(shù)和標(biāo)準(zhǔn)差分別為:四、泊松分布1、泊松分布的意義在生物學(xué)研究中,當(dāng)許多事件出現(xiàn)的概率很小,而樣本的容量或試驗(yàn)次數(shù)卻往往很大。即有很小的p值和很大的n值時(shí),二項(xiàng)分布就變成了一種特殊的分布——泊松分布(Poissondistribution)。λ為參數(shù),λ=np,x=0,1,2,…,∞。稱x服從參數(shù)為λ的泊松分布,記為x~P(λ)泊松分布的平均數(shù)和方差、標(biāo)準(zhǔn)差為:2、泊松分布的特征數(shù)μ=σ2=λ是泊松分布的重要特征二項(xiàng)分布中,一般當(dāng)P<0.1和np≤5時(shí),可用泊松分布來近似計(jì)算。【例題】調(diào)查某個(gè)種豬場育種豬群仔豬畸形數(shù),共記錄200窩,畸形仔豬數(shù)的分布情況如下表所示。試判斷畸形仔豬數(shù)是否服從泊松分布。表畸形仔豬數(shù)統(tǒng)計(jì)分布解:樣本均數(shù)和方差S2計(jì)算結(jié)果如下:因?yàn)槠骄鶖?shù)和方差是相當(dāng)接近的,因此可以認(rèn)為畸形仔豬數(shù)服從波松分布。3、泊松分布的概率計(jì)算由上式可知,泊松分布的概率計(jì)算,依賴于參數(shù)λ的確定。但是在大多數(shù)服從泊松分布的實(shí)例中,分布參數(shù)λ往往是未知的,只能從所觀察的隨機(jī)樣本中計(jì)算出相應(yīng)的樣本平均數(shù)作為λ的估計(jì)值。進(jìn)而計(jì)算出x=0,1,2,…時(shí)的各事件概率由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對頻數(shù)分布的模型而提出描述連續(xù)型隨機(jī)變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來描述可用于近似離散型隨機(jī)變量的分布例如:二項(xiàng)分布經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ)正態(tài)分布

(normaldistribution)xf(x)一、正態(tài)分布的定義及其特征(一)正態(tài)分布的定義若連續(xù)型隨機(jī)變量x的概率分布密度函數(shù)則稱隨機(jī)變量x服從正態(tài)分布(normaldistribution),記為X~N(μ,σ2)。f(x)=隨機(jī)變量X的頻數(shù)

=正態(tài)隨機(jī)變量X的均值

=正態(tài)隨機(jī)變量X的方差

=3.1415926;e=2.71828x=隨機(jī)變量的取值(-

<x<

)正態(tài)分布的概率概率是曲線下的面積!abxf(x)(二)正態(tài)分布的特征1、正態(tài)分布密度曲線是單峰、對稱的懸鐘形曲線,對稱軸為x=μ;2、f(x)在x=μ處達(dá)到極大,極大值為;3、曲線在x=μ±σ處各有一個(gè)拐點(diǎn),即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上是下凹的,在[μ-σ,μ+σ]區(qū)間內(nèi)是上凸的;f(x)是非負(fù)函數(shù),以x軸為漸近線,分布從-∞至+∞。4、正態(tài)分布有兩個(gè)參數(shù)即平均數(shù)μ和標(biāo)準(zhǔn)差σ,兩者確定其形狀。5、分布密度曲線與橫軸所夾的面積為1,即:二、標(biāo)準(zhǔn)正態(tài)分布由上述正態(tài)分布的特征可知,正態(tài)分布是依賴于參數(shù)μ和σ2(或σ)的一簇曲線,正態(tài)曲線的位置及形態(tài)隨μ和σ2的不同而不同。這就給研究具體的正態(tài)總體帶來困難,需將一般的N(μ,σ2)轉(zhuǎn)換為μ=0,σ2=1的正態(tài)分布。因此,稱μ=0,σ2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)記作f(u)

:隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布,記作u~N(0,1),分布密度曲線如下圖。對于任何一個(gè)服從正態(tài)分布N(μ,σ2)的隨機(jī)變量x,都可以通過標(biāo)準(zhǔn)化變換:將其變換為服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)的隨機(jī)變量u,u稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差(standardnormaldeviate)。標(biāo)準(zhǔn)正態(tài)分布Xms一般正態(tài)分布

=1Z標(biāo)準(zhǔn)正態(tài)分布

標(biāo)準(zhǔn)正態(tài)分布上的α分位點(diǎn)設(shè)隨機(jī)變量X~N(0,1),其概率密度函數(shù)為f(x)。對于給定的數(shù)α:0<α<1,稱滿足條件:P(X>uα)=的數(shù)uα為標(biāo)準(zhǔn)正態(tài)分布上的α分位點(diǎn),其幾何意義如圖所示:對于給定的α,uα的值這樣求得:由三、正態(tài)分布的概率計(jì)算(一)標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算在連續(xù)性隨機(jī)變數(shù)中,不能夠計(jì)算某一定值的概率,只能計(jì)求某一區(qū)間或范圍的概率。在標(biāo)準(zhǔn)正態(tài)分布曲線下,變量u在[a,b]區(qū)間的概率可用曲線下區(qū)間的面積來表示。區(qū)間概率的可用下式表示P(a≤u<b)正態(tài)分布曲線下--∝到u的面積,可以通過定積分得出,即:F(ui)稱為標(biāo)準(zhǔn)正態(tài)分布的累積函數(shù)。它是變量u小于某一定值ui的概率。因此,正態(tài)分布任一區(qū)間的概率可以如下式計(jì)算:由于標(biāo)準(zhǔn)正態(tài)分布的概率累積函數(shù)具有廣泛的應(yīng)用,所以,統(tǒng)計(jì)學(xué)家已計(jì)算好實(shí)際需要的各個(gè)F(ui)值,列于附表2。學(xué)習(xí)查表例如,u=1.75,累計(jì)概率F(1.75)是多少?查附表1,從第一列中找到1.7,在第一行中找到0.05。行與列相交處的數(shù)值0.95994,所以F(1.75)=0.95994例如:

F(u)=0.284,u值是多少?

這只要在附表1中找到與0.284最接近的值0.2843,對應(yīng)行的第一列數(shù)-0.5,對應(yīng)列的第一行數(shù)值0.07

即相應(yīng)的為u=-0.57根據(jù)正態(tài)分布的對稱性可推出下列關(guān)系式,再借助附表2,便能很方便地計(jì)算有關(guān)概率:關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率經(jīng)常用到:P(-1≤u≤1)=0.6826P(-2≤u≤2)=0.9545P(-3≤u≤3)=0.9973P(-1.96≤u≤1.96)=0.95P(-2.58≤u≤2.58)=0.99u變量在上述區(qū)間以外取值的概率分別為:P(|u|≥1)=2F(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2F(-2)=1-P(-2≤u<2)

=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01

從上述計(jì)算可知,雖然正態(tài)分布u的取值區(qū)間為(一∝,十∝),但實(shí)際上|u|>2.58的概率只有0.01,|u|>1.96的概率也只有0.05。即:在u±1.96和u±2.58范圍內(nèi)已分別包含了95%和99%的變量值。(二)標(biāo)準(zhǔn)正態(tài)分布的兩尾概率和單尾概率以上在計(jì)算P(|u|≥1)和P(|u|≥2.58)等概率時(shí),均為兩尾概率值,即左尾概率和右尾概率之和。由于兩尾概率值經(jīng)常使用,為減少計(jì)算的麻煩,在附表3列出了兩尾概率為某一值時(shí)的uα臨界值,即正態(tài)離差u值表,可直接查用。例如可查得:兩尾概率P=0.05時(shí),uα

=1.959964;兩尾概率P=0.01時(shí),

uα=2.575829。標(biāo)準(zhǔn)正態(tài)分布單側(cè)概率u值的查法如何查右尾P=0.05的uα臨界值??刹楸?,

uα=?

1.644854單尾概率對應(yīng)的u值等于2倍雙尾概率對應(yīng)的u值如何查左尾P=0.05的臨界值?

uα=?-1.644854右尾概率的u值為正,左尾概率的u值為負(fù)(三)一般正態(tài)分布的概率計(jì)算一般正態(tài)分布N(μ,σ2)的隨機(jī)變量x,都可以通過標(biāo)準(zhǔn)化變換:將其轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布N(0,1)。因此,一般正態(tài)分布N(μ,σ2)的隨機(jī)變量x在[x1

,x2]內(nèi)取值的概率,等于服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)的隨機(jī)變量u在[(x1-μ)/σ,(x2-μ)/σ]內(nèi)取值的概率。計(jì)算一般正態(tài)分布的概率時(shí),只要將區(qū)間的上下限作適當(dāng)變換(標(biāo)準(zhǔn)化),就可用查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求得概率了。[例題]設(shè)x服從μ=30.26,σ2=5.102的正態(tài)分布,試求P(21.64≤x<32.98)。則u服從標(biāo)準(zhǔn)正態(tài)分布,故首先X

=21.64

=5.10一般正態(tài)分布32.98

=1u標(biāo)準(zhǔn)正態(tài)分布

-1.690.530.6564【例題】隨機(jī)抽取100株某植物做為樣本,其株高(cm)分別為82,79,85,……,82,80。其樣本平均數(shù)為82.3cm,標(biāo)準(zhǔn)差為1.7502。試求株高≥85cm概率。解:假設(shè)該植物株高服從正態(tài)分布。由于總體平均數(shù)μ和總體標(biāo)準(zhǔn)差σ未知,我們用樣本平均數(shù)和樣本標(biāo)準(zhǔn)差s來估計(jì)μ和σ。關(guān)于一般正態(tài)分布,以下幾個(gè)概率(即隨機(jī)變量x落在μ加減不同倍數(shù)σ區(qū)間的概率)是經(jīng)常用到的。P(μ-σ≤x<μ+σ)=0.6826P(μ-2σ≤x<μ+2σ)=0.9545P(μ-3σ≤x<μ+3σ)=0.9973P(μ-1.96σ≤x<μ+1.96σ)=0.95P(μ-2.58σ≤x<μ+2.58σ)=0.99曲線下面積分布規(guī)律0-11-1.961.96-2.582.5868.27%95.00%99.00%μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%

二項(xiàng)分布、泊松分布、正態(tài)分布間的關(guān)系

對于二項(xiàng)分布,在p→0,n→∞且np=λ(較小常數(shù))情況下,二項(xiàng)分布趨于波松布。在這種場合,波松分布中的參數(shù)λ用二項(xiàng)分布的np代之;在p→0.5,n→∞時(shí),二項(xiàng)分布趨于正態(tài)分布。在這種場合,正態(tài)分布中的μ、σ2用二項(xiàng)分布的np、npq代之。在實(shí)際計(jì)算中,當(dāng)p<0.1且np<5時(shí),二項(xiàng)分布可由波松分布近似;當(dāng)p>0.1且n很大時(shí),二項(xiàng)分布可由正態(tài)分布近似。

研究總體和從中抽取的樣本之間的關(guān)系是統(tǒng)計(jì)學(xué)的中心內(nèi)容。對這種關(guān)系的研究可從兩方面著手,一是從總體到樣本,這就是研究抽樣分布(samplingdistribution)的問題;二是從樣本到總體,這就是統(tǒng)計(jì)推斷(statisticalinference)問題。一、抽樣分布的概念從總體中抽取一個(gè)樣本量為n的隨機(jī)樣本,我們可以計(jì)算出統(tǒng)計(jì)量的一個(gè)值。如果從總體中重復(fù)抽取樣本量為n的樣本,就可以得到統(tǒng)計(jì)量的多個(gè)值。統(tǒng)計(jì)量的抽樣分布就是這一統(tǒng)計(jì)量所有可能值的概率分布。抽樣分布是統(tǒng)計(jì)量的分布而不是總體或樣本的分布。在統(tǒng)計(jì)推斷中總體的分布一般是未知的,不可觀測的(常常被假設(shè)為正態(tài)分布)。樣本數(shù)據(jù)的統(tǒng)計(jì)分布是可以直接觀測的,最直觀的方式是直方圖,可以用來對總體分布進(jìn)行檢驗(yàn)。抽樣分布一般利用概率統(tǒng)計(jì)的理論推導(dǎo)得出,在應(yīng)用中也是不能直接觀測的。其形狀和參數(shù)可能完全不同于總體或樣本數(shù)據(jù)的分布。抽樣分布的幾個(gè)要點(diǎn)(一)抽樣的方法抽樣的方法有復(fù)置抽樣和不復(fù)置抽樣兩種。復(fù)置抽樣指每次抽出一個(gè)個(gè)體后,這個(gè)個(gè)體應(yīng)返回原總體。不復(fù)置抽樣指每次抽出的個(gè)體不再返回原總體。對于無限總體,復(fù)置與否都可保證各個(gè)體被抽到的機(jī)會(huì)仍會(huì)相等。對于有限總體,就應(yīng)該采取復(fù)置抽樣,否則各個(gè)體被抽到的機(jī)會(huì)就不相等。從理論上講,若能從一個(gè)總體中抽取所有可能的樣本,就能獲得有關(guān)統(tǒng)計(jì)量變異的全部信息。

設(shè)總體的容量為N,每個(gè)樣本的容量為n,則所有可能的樣本數(shù)為:Nn(二)研究抽樣分布的方法直接法,即抽樣試驗(yàn)數(shù)理推導(dǎo)法后面我們以一個(gè)很小的有限總體為例,采用抽樣試驗(yàn)的方法,研究樣本統(tǒng)計(jì)量與原總體參數(shù)的關(guān)系。二、樣本統(tǒng)計(jì)量的分布由于從總體中抽出的每一個(gè)樣本,都可以計(jì)算出一個(gè)平均數(shù),每個(gè)隨機(jī)樣本的平均數(shù)可能會(huì)有差異,所有可能的樣本平均數(shù)就構(gòu)成一個(gè)新的總體。所以樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論