第四章理論分布和抽樣分布ppt課件_第1頁(yè)
第四章理論分布和抽樣分布ppt課件_第2頁(yè)
第四章理論分布和抽樣分布ppt課件_第3頁(yè)
第四章理論分布和抽樣分布ppt課件_第4頁(yè)
第四章理論分布和抽樣分布ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩102頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章 實(shí)際分布和抽樣分布第一節(jié) 事件、概率和隨機(jī)變量第二節(jié) 二項(xiàng)式分布第三節(jié) 正態(tài)分布第四節(jié) 抽樣分布.第一節(jié) 事件、概率和隨機(jī)變量一、事件和事件發(fā)生的概率二、事件間的關(guān)系三、計(jì)算事件概率的法那么四、隨機(jī)變量.一、事件和事件發(fā)生的概率 事件 -在自然界中一種事物,常存在幾種能夠出現(xiàn)的情況,每一種能夠出現(xiàn)的情況稱(chēng)為事件。 隨機(jī)事件(random event) -某特定事件只是能夠發(fā)生的幾種事件中的一種,這種事件稱(chēng)為隨機(jī)事件。 概率(probability) -每一個(gè)事件出現(xiàn)的能夠性稱(chēng)為該事件的概率。 必然事件-對(duì)于一類(lèi)事件來(lái)說(shuō),在同一組條件的實(shí)現(xiàn)之下必然要發(fā)生的,稱(chēng)為必然事件;其概率為1。 不

2、能夠事件 -對(duì)于一類(lèi)事件來(lái)說(shuō),在同一組條件的實(shí)現(xiàn)之下必然不發(fā)生的,稱(chēng)為不能夠事件,其概率為0。 . 事件發(fā)生的能夠性(概率)是在大量的實(shí)驗(yàn)中察看得到的,例如棉田發(fā)生盲蝽象為害的情況,并不是一切的棉株都受害,隨著察看的次數(shù)增多,我們對(duì)棉株受害能夠性程度大小的把握越準(zhǔn)確、越穩(wěn)定。這里將一個(gè)調(diào)查結(jié)果列于表4.1。 表4.1 在一樣條件下盲蝽象在某棉田危害程度的調(diào)查結(jié)果調(diào)查株數(shù)(n)52550100200500100015002000受害株數(shù)(a) 21215 33 72177 351 525 704棉株受害頻率(a/n)0.400.480.300.330.360.3540.3510.3500.352

3、. 由表4.1可以看到:調(diào)查5株時(shí),有2株受害,受害株的頻率為40%,調(diào)查25株時(shí)受害頻率為48%,調(diào)查100株時(shí)受害頻率為33%。可以看出三次調(diào)查結(jié)果有差別,闡明受害頻率有動(dòng)搖、不穩(wěn)定。而當(dāng)進(jìn)一步擴(kuò)展調(diào)查的單株數(shù)時(shí),發(fā)現(xiàn)頻率比較穩(wěn)定了,調(diào)查500株到2000株的結(jié)果是受害棉株穩(wěn)定在35%左右。 現(xiàn)以n代表調(diào)查株數(shù),以a代表受害株數(shù),那么可以計(jì)算出受害頻率p=a/n。從棉株受害情況調(diào)查結(jié)果看,頻率在n取不同的值時(shí),雖然調(diào)查田塊是一樣的,頻率p卻不同,只需在n很大時(shí)頻率才比較穩(wěn)定一致。因此,調(diào)查株數(shù)n較多時(shí)的穩(wěn)定頻率才干較好地代表棉株受害的能夠性。 . 統(tǒng)計(jì)學(xué)上用n較大時(shí)穩(wěn)定的p近似代表概率。經(jīng)

4、過(guò)大量實(shí)驗(yàn)而估計(jì)的概率稱(chēng)為實(shí)驗(yàn)概率或統(tǒng)計(jì)概率,以表示。此處P代表概率,P(A)代表事件A的概率,P(A)變化的范圍為01,即0P(A)1。 小概率原理-假設(shè)事件A發(fā)生的概率較小,如小于0.05或0.01,那么以為事件A在一次實(shí)驗(yàn)中不太能夠發(fā)生,這稱(chēng)為小概率事件實(shí)踐不能夠性原理,簡(jiǎn)稱(chēng)小概率原理。這里的0.05或0.01稱(chēng)為小概率規(guī)范,農(nóng)業(yè)實(shí)驗(yàn)研討中通常運(yùn)用這兩個(gè)小概率規(guī)范。.二、事件間的關(guān)系(一) 和事件(二) 積事件 (三) 互斥事件(四) 對(duì)立事件(五) 完全事件系(六) 事件的獨(dú)立性 . (一) 和事件 事件A和B至少有一個(gè)發(fā)生而構(gòu)成的新事件稱(chēng)為事件A和B的和事件,記為A+B,讀作“或A發(fā)

5、生,或B發(fā)生。 例如,有一批種子,包含有能發(fā)芽的和不能發(fā)芽的。假設(shè)A為“取到能發(fā)芽種子,B為“取到不能發(fā)芽種子,那么A+B為“或者取到能發(fā)芽種子或者取到不能發(fā)芽種子。 事件間的和事件可以推行到多個(gè)事件:事件A1、A2、An至少有一發(fā)生而構(gòu)成的新事件稱(chēng)為事件A1、A2、An的和事件,記為A1+A2+An= . (二) 積事件 事件A和B同時(shí)發(fā)生所構(gòu)成的新事件稱(chēng)為事件A和B的積事件,記作AB,讀作“A和B同時(shí)發(fā)生或相繼發(fā)生。 事件間的積事件也可以推行到多個(gè)事件:事件A1、A2、An同時(shí)發(fā)生所構(gòu)成的新事件稱(chēng)為這n個(gè)事件的積事件,記作A1A2An= .(三) 互斥事件 事件A和B不能夠同時(shí)發(fā)生,即AB

6、為不能夠事件,記作AB=V,稱(chēng)事件A和B互斥或互不相容。 例如,有一袋種子,按種皮分黃色和白色。假設(shè)記A為“取到黃色,B為“取到白色,顯然A和B不能夠同時(shí)發(fā)生,即一粒種子不能夠既為黃色又為白色,闡明事件A和B互斥。 這一定義也可以推行到n個(gè)事件。事件A1、A2、An不能夠同時(shí)發(fā)生所構(gòu)成的新事件稱(chēng)為這n個(gè)事件互斥或互不相容,記作A1A2An=V 。 .(四) 對(duì)立事件 事件A和B不能夠同時(shí)發(fā)生,但必發(fā)生其一,即A+B為必然事件(記為A+B=U),AB為不能夠事件(記為AB=V,那么稱(chēng)事件B為事件A的對(duì)立事件,并記B為 。 例如,上面例子中A為“取到黃色,B為“取到白色,A與B不能夠同時(shí)發(fā)生,但是

7、,恣意抽取一粒種子,其皮色不是黃色就是白色,即A和B必發(fā)生其一,因此,A和B互為對(duì)立事件。.積事件AB和事件A+BABAB互斥事件 對(duì)立事件 AB.(五) 完全事件系 假設(shè)事件A1、A2、An兩兩互斥,且每次實(shí)驗(yàn)結(jié)果必發(fā)生其一,那么稱(chēng)A1、A2、An為完全事件系。 例如,僅有三類(lèi)花樣:黃色、白色和紅色,那么取一朵花,“取到黃色、“取到白色和“取到紅色就構(gòu)成完全事件系。.(六) 事件的獨(dú)立性 假設(shè)事件A發(fā)生與否不影響事件B發(fā)生的能夠性,那么稱(chēng)事件A和事件B相互獨(dú)立。 例如,事件A為“花的顏色為黃色,事件B為“產(chǎn)量高,顯然假設(shè)花的顏色與產(chǎn)量無(wú)關(guān),那么事件A與事件B相互獨(dú)立。.三、計(jì)算事件概率的法那

8、么(一) 互斥事件的加法 (二) 獨(dú)立事件的乘法(三) 對(duì)立事件的概率(四) 完全事件系的概率(五) 非獨(dú)立事件的乘法 . (一) 互斥事件的加法 假定兩互斥事件A和B的概率分別為P(A)和P(B)。那么事件A與B的和事件的概率等于事件A的概率與事件B的概率之和,即P(A+B)=P(A)+P(B)。 加法定理對(duì)于多個(gè)兩兩互斥的事件也成立:假定A1、A2、An n個(gè)事件彼此間均是兩兩互斥的事件,其概率依次為P(A1),P(A2),P(An),那么A1,A2到An和事件的概率P(A1+A2+ +An)等于P(A1),P(A2),P(An)之和,即P(A1+A2+ +An)=P(A1)+P(A2)+

9、 +P(An)。 . 例如,一捆花中紅、黃、白花的概率分別為0.2、0.3、0.5,那么我們隨機(jī)抽取一朵非白色花的概率為0.5(=0.2+0.3),這只是由加法定理得到的兩個(gè)事件概率之和。.(二) 獨(dú)立事件的乘法 假定P(A)和P(B)是兩個(gè)獨(dú)立事件A與B各自出現(xiàn)的概率,那么事件A與B同時(shí)出現(xiàn)的概率等于兩獨(dú)立事件出現(xiàn)概率P(A)與P(B)的乘積,即P(AB)=P(A)P(B) 乘法定理對(duì)于n個(gè)相互獨(dú)立的事件也成立。假定P(A1),P(A2),P(An)是n個(gè)相互獨(dú)立事件各自出現(xiàn)的概率,那么該n個(gè)事件同時(shí)出現(xiàn)的概率P(A1A2An)等于各自出現(xiàn)概率之乘積,即P(A1A2An)=P(A1)P(A2

10、)P(An)。. 現(xiàn)有4粒種子,其中3粒為黃色、1粒為白色,采用復(fù)置抽樣。試求以下兩事件的概率:(A)第一次抽到黃色、第二次抽到白色;(B)兩次都抽到黃色。 由于采用復(fù)置抽樣(即每一次抽出察看結(jié)果后又放回再進(jìn)展下一次抽樣),所以第一次和第二次的抽樣結(jié)果間是相互獨(dú)立的。 . 采用概率的古典定義,可以求出抽到黃色種子的概率為0.75,抽到白色種子的概率為0.25。因此,有P(A)=P(第一次抽到黃色種子)P(第二次抽到白色種子) =0.250.75=0.1875,P(B)=P(第一次黃色種子)P(第二次黃色種子) =0.750.75=0.5625。.(三) 對(duì)立事件的概率 假設(shè)事件A的概率為P(A

11、),那么其對(duì)立事件的概率為:. (四) 完全事件系的概率 完全事件系的概率為1。 例如“從10個(gè)數(shù)字中隨機(jī)抽得任何一個(gè)數(shù)字都可以這樣一個(gè)事件是完全事件系,其概率為1。 .(五) 非獨(dú)立事件的乘法 假設(shè)事件A和B是非獨(dú)立的,那么事件A與B同時(shí)發(fā)生的概率為事件A的概率P(A)乘以事件A發(fā)生的情況下事件B發(fā)生的概率P(B|A),即:P(AB)=P(A)P(B|A).四、隨機(jī)變量 隨機(jī)變量是指隨機(jī)變數(shù)所取的某一個(gè)實(shí)數(shù)值。 例1:拋硬幣實(shí)驗(yàn),硬幣落地后只需兩種能夠結(jié)果:幣值面向上和國(guó)徽面向上,用數(shù)“1表示“幣值面向上,用數(shù)“0表示“國(guó)徽面向上。把0,1作為變量y的取值。在討論實(shí)驗(yàn)結(jié)果時(shí),就可以簡(jiǎn)單地把拋

12、硬幣實(shí)驗(yàn)用取值為0,1的變量來(lái)表示。 P(y=1)=0.5,P(y=0)=0.5 . 例2:用“1表示“能發(fā)芽種子,其概率為p;用“0表示“不能發(fā)芽種子,其概率為q。顯然 p+q=1,那么 P(y=1)=p,P(y=0)=q=1p。. 例3:用變量y表示水稻產(chǎn)量,假設(shè)y大于500kg的概率為0.25,大于300kg且等于小于500kg的概率為0.65,等于小于300kg的概率為0.1。 那么用變量y的取值范圍來(lái)表示的實(shí)驗(yàn)結(jié)果為 P(y300)=0.10, P(300y500)=0.65, P(y500)=0.25。. 離散型隨機(jī)變量 -當(dāng)實(shí)驗(yàn)只需幾個(gè)確定的結(jié)果,并可一一列出,變量y的取值可用實(shí)

13、數(shù)表示,且y取某一值時(shí),其概率是確定的,這種類(lèi)型的變量稱(chēng)為離散型隨機(jī)變量。 將這種變量的一切能夠取值及其對(duì)應(yīng)概率一一列出所構(gòu)成的分布稱(chēng)為離散型隨機(jī)變量的概率分布: 概率變量yiy1y2y3ynP1P2P3Pn也可用函數(shù)f(y)表述,稱(chēng)為概率函數(shù)。. 前面例1、例2中的y就是離散型隨機(jī)變量,將其能夠取值與對(duì)應(yīng)概率一一列出,即為:變量y01概率0.50.5變量y01概率qp. 延續(xù)型隨機(jī)變量(continuous random variate) -對(duì)于隨機(jī)變量,假設(shè)存在非負(fù)可積函數(shù)f(y)(y),對(duì)恣意a和b(ab)都有P(ayb)= ,那么稱(chēng)y為延續(xù)型隨機(jī)變量(continuous random

14、 variate),f(y)稱(chēng)為y的概率密度函數(shù)(probability density function)或分布密度(distribution density)。 上述例3中的y就是一個(gè)延續(xù)型隨機(jī)變量。.第二節(jié) 二項(xiàng)式分布一、二項(xiàng)總體及二項(xiàng)式分布二、二項(xiàng)式分布的概率計(jì)算方法三、二項(xiàng)式分布的外形和參數(shù)四、多項(xiàng)式分布.一、二項(xiàng)總體及二項(xiàng)式分布所謂二項(xiàng)總體( binary population ),就是非此即彼的兩項(xiàng)構(gòu)成的總體 例如:小麥種子發(fā)芽和不發(fā)芽,大豆子葉色為黃色和青色,調(diào)查棉田盲蝽象為害分為受害株和不受害株等等。通常將二項(xiàng)總體中的“此事件以變量“1表示,具概率p;將“彼事件以變量“0表示

15、,具概率q。因此二項(xiàng)總體又稱(chēng)為0、1總體,其概率那么顯然有:p+q=1或q=1p. 假設(shè)從二項(xiàng)總體進(jìn)展n次反復(fù)抽樣,設(shè)出現(xiàn)“此的次數(shù)為y,那么y的取值能夠?yàn)?、1、2、n,共有n+1種能夠取值,這n+1種取值各有其概率,因此由變量y及其概率就構(gòu)成了一個(gè)分布,這個(gè)分布叫做二項(xiàng)式概率分布,簡(jiǎn)稱(chēng)二項(xiàng)式分布或二項(xiàng)分布( binomial distribution )。 二項(xiàng)總體的抽樣實(shí)驗(yàn)具有反復(fù)性和獨(dú)立性 反復(fù)性是指每次實(shí)驗(yàn)條件不變,即在每次實(shí)驗(yàn)中“此事件出現(xiàn)的概率皆為p 獨(dú)立性是指任何一次實(shí)驗(yàn)中“此事件的出現(xiàn)與其他各次實(shí)驗(yàn)中出現(xiàn)何種結(jié)果無(wú)關(guān).二、二項(xiàng)式分布的概率計(jì)算方法 例:在由具有一對(duì)基因差別的親

16、本雜交構(gòu)成的F2代群體中,出現(xiàn)黃色子葉的概率為0.75,出現(xiàn)青色子葉的概率為0.25,這是二項(xiàng)總體的概率分布。假設(shè)從這種總體抽取3(n)粒,那么得到1(y)粒是黃子葉的概率是多少呢?. 抽取三粒種子(以Y代黃子葉,以G代青子葉),即n=3,有兩粒黃子葉種子,即y=2,這時(shí)有3種不同組合: GGY,GYG,YGG。出現(xiàn)第一粒,第二粒和第三粒種子是互不影響的,因此這三個(gè)事件是獨(dú)立事件,由乘法法那么可得:. 由于這三個(gè)事件都是互相互斥的,所以出現(xiàn)兩粒黃子葉種子(y=2)的概率為這三種概率之和:上述結(jié)果也可以表示為:. 即復(fù)合事件的概率必等于該事件出現(xiàn)的組合數(shù)目乘以單個(gè)事件的概率;而這一復(fù)合事件的能夠

17、組合數(shù)目那么相當(dāng)于從n(3)個(gè)物體中任取其y(2)個(gè)物體的組合數(shù)。數(shù)學(xué)上的組合公式為:. 二項(xiàng)式中包含兩項(xiàng),這兩項(xiàng)的概率為p、q,并且p+q=1,可推知變量y的概率函數(shù)為:累積函數(shù)F(y):變量小于等于y的一切能夠取值的概率之和實(shí)際次數(shù):對(duì)于恣意y,實(shí)際次數(shù)=nP(y) 這一分布律也稱(chēng)貝努里( Bernoulli )分布,并有 .的泰勒展開(kāi)式為: 可以看到,上式右邊的每一項(xiàng)即為二項(xiàng)分布中變量y 取0、1、2、n時(shí)的概率,又p+q=1,從而 (p+q)n=1 . 例4.1 棉田盲蝽象為害的統(tǒng)計(jì)概率乃從調(diào)查2000株后獲得近似值p=0.35?,F(xiàn)受害株事件為A,其概率為p=0.35,未受害株事件為對(duì)

18、立事件,其概率q=(10.35)=0.65。這一實(shí)驗(yàn)是可以反復(fù)的。假定做了n次實(shí)驗(yàn),即抽出n株為一個(gè)抽樣單位,那么,試問(wèn)出現(xiàn)有y株是受害的,其概率應(yīng)有多少? 假定以n=1,即抽出一株為一個(gè)抽樣單位,這里知P(A)=0.35和P( )=0.65,總體的實(shí)際次數(shù)分布那么以n乘上述概率分布,即np和n(1p),所以有20000.35=700株受害和20000.65=1300株未受害。. 如調(diào)查5株為一個(gè)抽樣單位,即n=5,那么受害株數(shù)y=0,1,2,3,4和5的概率可以計(jì)算出來(lái),如表4.2。棉株受害數(shù)乃一隨機(jī)變數(shù)(y),可以計(jì)算變量y相應(yīng)的概率函數(shù) 假設(shè)每次抽5個(gè)單株,抽n=400次,那么實(shí)際上我們

19、可以得到y(tǒng)=2的次數(shù)應(yīng)為: 實(shí)際次數(shù)=400P(2)=4000.3364=134.56(次)圖4.1和圖4.2給出了概率函數(shù)圖和累積概率函數(shù)圖 和其累計(jì)函數(shù).表4.2 調(diào)查單位為5株的概率分布表(p=0.35,q=0.65)受害株數(shù)概率函數(shù)P(y)P(y)F(y)nP(y)P(0)0.11600.116046.40P(1)0.31240.4284124.96P(2)0.33640.7648134.56P(3)0.18110.945972.44P(4)0.04880.994719.52P(5)0.00531.00002.12. 受害株數(shù)(y) 受害株數(shù)(y)圖4.1 棉株受盲蝽象為害的概率分布圖

20、(p=0.35,n=5) 圖4.2 棉株受盲蝽象為害的累積概率函數(shù)F(y)圖 (p=0.35,n=5). 例4.2 某種昆蟲(chóng)在某地域的死亡率為40%,即p=0.4,現(xiàn)對(duì)這種害蟲(chóng)用一種新藥進(jìn)展治療實(shí)驗(yàn),每次抽樣10頭作為一組治療。試問(wèn)如新藥無(wú)療效,那么在10頭中死3頭、2頭、1頭,以及全部愈好的概率為多少?按上述二項(xiàng)分布概率函數(shù)式計(jì)算 7頭愈好,3頭死去概率:8頭愈好,2頭死去概率:9頭愈好,1頭死去概率:10頭全部愈好的概率: . 假設(shè)問(wèn)10頭中不超越2頭死去的概率為多少?那么應(yīng)該運(yùn)用累積函數(shù),即.三、二項(xiàng)式分布的外形和參數(shù) 圖4.3為上述棉株受害概率如p=1/2時(shí)的概率分布圖。從圖4.1和4

21、.3可看出,如p=q,二項(xiàng)式分布呈對(duì)稱(chēng)外形,如pq,那么表現(xiàn)偏斜外形。 受害株數(shù)( y) 圖4.3 棉株受盲椿害的概率函數(shù)f(y)圖(p=0.5,n=5株) 受害株數(shù)(y) 圖4.1 棉株受盲蝽象為害的概率分布圖(p=0.35,n=5) .二項(xiàng)式分布的參數(shù) 仍以上述棉株受害為例,抽取5株中受害株數(shù)的多少(y)作為統(tǒng)計(jì)目的的話,從總體中可以抽取的一切樣本均有一個(gè)y,這樣一切的y構(gòu)成了一個(gè)新總體,該總體也屬于二項(xiàng)式總體,其平均數(shù)、方差和規(guī)范差如下式 從而,上述棉田受害率調(diào)查結(jié)果,n=5,p=0.35,可求得總體參數(shù)為: =50.35=1.75株, 株。.四、多項(xiàng)式分布 所謂多項(xiàng)總體,是指將變數(shù)資料

22、分為3類(lèi)或多類(lèi)的總體。 例如在給某一人群運(yùn)用一種新藥,能夠有的療效好,有的沒(méi)有療效,而另有療效為副作用的,就是三項(xiàng)分布。 多項(xiàng)總體的隨機(jī)變量的概率分布即為多項(xiàng)式分布( multinomial distribution )。. 設(shè)總體中共包含有k項(xiàng)事件,它們的概率分別為p1、p2、p3、pk,顯然p1+p2+p3+pk=1。假設(shè)從這種總體隨機(jī)抽取n個(gè)個(gè)體,那么能夠得到這k項(xiàng)的個(gè)數(shù)分別為y1、y2、y3、yk,顯然y1+y2+y3+yk=n。那么得到這樣一個(gè)事件的概率為: 多項(xiàng)分布的概率計(jì)算. 例4.3 某藥對(duì)病人有效的概率為1/2,對(duì)病人無(wú)效的概率為1/3,有副作用的概率為1/6,假設(shè)隨機(jī)抽取2

23、個(gè)運(yùn)用該藥的病人,那么我們的結(jié)果能夠包括這樣幾種事件:2個(gè)病人有副作用;一個(gè)無(wú)效、一個(gè)有副作用;兩個(gè)無(wú)效;一個(gè)有效、一個(gè)有副作用;一個(gè)有效、一個(gè)無(wú)效;兩個(gè)均有效。這幾種事件的概率分別為多少呢?可以運(yùn)用上述的概率分布公式來(lái)計(jì)算,如表4.3。.表4.3 多項(xiàng)式分布的概率計(jì)算變 量(y1、y2、y3)概率及其計(jì)算P(y1、y2、y3)(0,0,2)(0,1,1)(0,2,0)(1,0,1)(1,1,0)(2,0,0).五、泊松分布二項(xiàng)分布的一種極限分布 二項(xiàng)分布中往往會(huì)遇到一個(gè)概率p或q是很小的值,例如小于0.1,另一方面n又相當(dāng)大,這樣的二項(xiàng)分布必將為另一種分布所接近,或者為一種極限分布。這一種分

24、布稱(chēng)泊松概率分布,簡(jiǎn)稱(chēng)泊松分布( Poisson distribution )。令np=m,那么泊松分布如下式:y=0,1,2, e=2.71828為自然對(duì)數(shù)的底數(shù)。 凡在察看次數(shù)n相當(dāng)大時(shí),某一事件出現(xiàn)的平均次數(shù)m(m是一個(gè)定值)很小,那么,這一事件出現(xiàn)的次數(shù)將符合泊松分布。 .泊松分布的平均數(shù) 、方差 和規(guī)范差 如下式: 這一分布包括一個(gè)參數(shù)m,由m的大小決議其分布外形如圖4.4。當(dāng)m值小時(shí)分布呈很偏斜外形,m增大后那么逐漸對(duì)稱(chēng)。圖4.4 不同m值的泊松分布. 例4.4 1907年Student氏進(jìn)展以血球計(jì)計(jì)數(shù)酵母細(xì)胞準(zhǔn)確度實(shí)驗(yàn)。如這種計(jì)數(shù)技術(shù)是有效地適宜,那么在每一平方格的細(xì)胞數(shù)目實(shí)際

25、上應(yīng)作為一個(gè)泊松分布。 表4.4是從1mm2分為400個(gè)平方格的結(jié)果??偤嫌?jì)數(shù)的細(xì)胞數(shù)為1872個(gè),因之平均數(shù)m=1782/400=4.68。實(shí)際次數(shù)須從泊松分布的概率計(jì)算,即從(p+q)n的極限為:其中y=0,1,2,3, 是 的泰勒展開(kāi)式(48) .表4.4 血球計(jì)所計(jì)數(shù)的每平方格內(nèi)酵母細(xì)胞數(shù)酵母細(xì)胞數(shù)012345678次 數(shù)2043538670543718理 論 次 數(shù)3.7117.3740.6563.4174.1969.4454.1636.2121.18酵母細(xì)胞數(shù)910111213141516總次 數(shù)10522400理 論 次 數(shù)11.025.162.190.860.310.100.0

26、30.01400.00本例m=4.68,em=(2.71828)4.68=0.009275,0.009275400=3.71. 3.71是實(shí)際次數(shù)第一項(xiàng),其他各實(shí)際次數(shù)均可按(48)計(jì)算。概率值乘以400得實(shí)際次數(shù)。本例規(guī)范差估計(jì)值為 .第三節(jié) 正態(tài)分布一、二項(xiàng)分布的極限正態(tài)分布二、正態(tài)分布曲線的特性三、計(jì)算正態(tài)分布曲線區(qū)間面積或概率的方法.一、二項(xiàng)分布的極限正態(tài)分布 以上述二項(xiàng)分布棉株受害率為例,假定受害概率p=1/2,那么,p=q=1/2?,F(xiàn)假定每個(gè)抽樣單位包括20株,這樣將有21個(gè)組,其受害株的概率函數(shù)為 于是概率分布計(jì)算如下:. 現(xiàn)將這概率分布繪于圖4.5。從圖4.5看出它是對(duì)稱(chēng)的,分

27、布的平均數(shù) 和方差 為: =npq=20(1/2)(1/2)=5(株)2 。=np=20(1/2)=10(株), .圖4.5 棉株受害率(0.5+0.5)20分布圖(實(shí)線表示二項(xiàng) 式概率分布,虛線表示接近的正態(tài)分布曲線)如p=q,不論n值大或小,二項(xiàng)分布的多邊形圖必構(gòu)成對(duì)稱(chēng);如pq,而n很大時(shí),這多邊形仍趨對(duì)稱(chēng)。 . 倘n或組數(shù)添加到無(wú)窮多時(shí)(n),多邊形的折線就表現(xiàn)為一個(gè)光滑曲線。這個(gè)光滑曲線在數(shù)學(xué)上的意義是一個(gè)二項(xiàng)分布的極限曲線,屬于延續(xù)性變數(shù)分布曲線,普通稱(chēng)之為正態(tài)分布曲線或正態(tài)概率密度曲線??梢酝茖?dǎo)出正態(tài)分布的概率密度函數(shù)為: (49) 其中,y是所研討的變數(shù); 是概率密度函數(shù); 和

28、為總體參數(shù), 表示所研討總體平均數(shù), 表示所研討總體規(guī)范差,不同正態(tài)分布可以有不同的 和 ,但某一定總體的 和 是常數(shù)。 .參數(shù) 和 有如下的數(shù)學(xué)表述 (410) 令 可將(49)式規(guī)范化為: (411) 上式稱(chēng)為規(guī)范化正態(tài)分布方程,它是參數(shù) 時(shí)的正態(tài)分布(圖4.7)。記作N(0,1)。 .正態(tài)分布的曲線圖 -3 -2 -1 0 1 2 3圖4.6 正態(tài)分布曲線圖(平均數(shù)為 ,規(guī)范差為 )圖4.7 規(guī)范正態(tài)分布曲線圖(平均數(shù) 為0,規(guī)范差 為1).二、正態(tài)分布曲線的特性 1. 正態(tài)分布曲線是以y = 為對(duì)稱(chēng)軸,向左右兩側(cè)作對(duì)稱(chēng)分布,所以它是一個(gè)對(duì)稱(chēng)曲線。從所豎立的縱軸f(y= )是最大值,所以

29、正態(tài)分布曲線的算術(shù)平均數(shù)、中數(shù)和眾數(shù)是相等的,三者均合一位于點(diǎn) 上。 2. 正態(tài)分布曲線以參數(shù) 和 的不同而表現(xiàn)為一系列曲線,所以它是一個(gè)曲線簇而不僅是一個(gè)曲線。 確定它在橫軸上的位置,而 確定它的變異度,不同 和 的正態(tài)總體具有不同的曲線和變異度,所以任何一個(gè)特定正態(tài)曲線必需在其 和 確定后才干確定。圖4.8 和4.9表示這個(gè)區(qū)別。.圖4.8 規(guī)范差一樣( 1)而平均數(shù)不同( =0、 =1、 =2)的三個(gè)正態(tài)分布曲線 圖4.9 平均數(shù)一樣( 0)而規(guī)范差不同( =1、 =1.5、 =2)的三個(gè)正態(tài)分布曲線 . 3. 正態(tài)分布資料的次數(shù)分布表現(xiàn)為多數(shù)次數(shù)集中于算術(shù)平均數(shù) 附近,離平均數(shù)越遠(yuǎn),其

30、相應(yīng)的次數(shù)越少;且在 左右相等| |范圍內(nèi)具有相等次數(shù);在| |3 以上其次數(shù)極少。 4. 正態(tài)曲線在| |=1 處有“拐點(diǎn)。曲線兩尾向左右伸展,永不接觸橫軸,所以當(dāng)y,分布曲線以y軸為漸近線,因之曲線全距從到+。 5. 正態(tài)曲線與橫軸之間的總面積等于1,因此在曲線下橫軸的任何定值,例如從y=y1到y(tǒng)=y2之間的面積,等于介于這兩個(gè)定值間面積占總面積的成數(shù),或者說(shuō)等于y落于這個(gè)區(qū)間內(nèi)的概率。 . 正態(tài)曲線的任何兩個(gè)y定值ya與yb之間的面積或概率乃完全以曲線的 和 而確定的。詳細(xì)數(shù)值見(jiàn)附表2,下面為幾對(duì)常見(jiàn)的區(qū)間與其相對(duì)應(yīng)的面積或概率的數(shù)字: 區(qū)間 1 面積或概率=0.6827 2 =0.95

31、45 3 =0.9973 1.960 =0.9500 2.576 =0.9900. 例如,上章水稻140行產(chǎn)量資料的樣本分布表現(xiàn)出接近正態(tài)分布,其平均數(shù)( )、規(guī)范差(s)以及離均差為1、2和3個(gè)規(guī)范差的區(qū)間所包括的次數(shù)列于表4.5。實(shí)驗(yàn)的結(jié)果與正態(tài)分布的實(shí)際結(jié)果很相近。 ks數(shù)值(g)區(qū)間(g)區(qū)間內(nèi)包括的次數(shù)次數(shù)%1s157.9 36.4121.5194.5 99 70.712s157.9 72.8 85.1230.7134 95.713s157.9109.2 48.7267.1140100.00表4.5 140行水稻產(chǎn)量在 1s, 2s, 3s范圍內(nèi)所包括的次數(shù)表.三、計(jì)算正態(tài)分布曲線區(qū)

32、間面積或概率的方法 在正態(tài)分布曲線下,y的定值從y=a到y(tǒng)=b間的概率可用曲線下區(qū)間的面積來(lái)表示,或者說(shuō),用其定積分的值表示,如圖4.10所示的面積。(413)同樣可以計(jì)算曲線下從到y(tǒng)的面積,其公式如下:(414) 這里FN(y)稱(chēng)為正態(tài)分布的累積函數(shù),具有平均數(shù) 和規(guī)范差 。 .A=P(ayb)fN(y)圖4.10正態(tài)分布密度函數(shù)的積分闡明圖面積A=P(ayb). 現(xiàn)如給予變數(shù)任何一定值,例如a,那么,可以計(jì)算ya的概率為FN(a),即(415) 假設(shè)a與b(a30就可以運(yùn)用這一定理。 平均數(shù)的規(guī)范化分布是將上述平均數(shù) 轉(zhuǎn)換為u變數(shù)。(423) . 例4.9 在江蘇沛縣調(diào)查336個(gè)m2小地老

33、虎蟲(chóng)危害情況的結(jié)果, =4.73頭, =2.63,試問(wèn)樣本容量n=30時(shí),由于隨機(jī)抽樣得到樣本平均數(shù) 等于或小于4.37的概率為多少? 查附表2,P(u0.36)=0.2266,即概率為22.66% (屬一尾概率)。因所得概率較大,闡明差數(shù)0.36是隨機(jī)誤差,從而證明這樣本平均數(shù)4.37是有代表性的,變異系數(shù)為:.(二) 兩個(gè)獨(dú)立樣本平均數(shù)差數(shù)的分布 假定有兩個(gè)正態(tài)總體各具有平均數(shù)和規(guī)范差為 , 和 , ,從第一個(gè)總體隨機(jī)抽取n1個(gè)察看值,同時(shí)獨(dú)立地從第二個(gè)總體隨時(shí)機(jī)抽取n2個(gè)察看值。這樣計(jì)算出樣本平均數(shù)和規(guī)范差 ,s1和 ,s2。 從統(tǒng)計(jì)實(shí)際可以推導(dǎo)出其樣本平均數(shù)的差數(shù)( )的抽樣分布,具有以下特性: (1) 假設(shè)兩個(gè)總體各作正態(tài)分布,那么其樣本平均數(shù)差數(shù)( )準(zhǔn)確地遵照正態(tài)分布律,無(wú)論樣本容量大或小

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論