常用概率分布_第1頁(yè)
常用概率分布_第2頁(yè)
常用概率分布_第3頁(yè)
常用概率分布_第4頁(yè)
常用概率分布_第5頁(yè)
已閱讀5頁(yè),還剩79頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

常用概率分布第一頁(yè),共八十四頁(yè),2022年,8月28日第一節(jié)概率基礎(chǔ)知識(shí)

一、概念:1、事件:必然事件不可能事件隨機(jī)事件2、頻率:設(shè)事件A在n次重復(fù)試驗(yàn)中發(fā)生了m次,其比值m/n稱為事件A發(fā)生的頻率。[0,1]3、概率:某事件A在n次重復(fù)試驗(yàn)中發(fā)生了m次,當(dāng)試驗(yàn)次數(shù)n不斷增大時(shí),事件A發(fā)生的頻率就越接近某一確定值p第二頁(yè),共八十四頁(yè),2022年,8月28日表3-1拋擲硬幣發(fā)生正面朝上的試驗(yàn)記錄第三頁(yè),共八十四頁(yè),2022年,8月28日在一般情況下,隨機(jī)事件的概率p是不可能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)n充分大時(shí)隨機(jī)事件A的頻率作為該隨機(jī)事件概率的近似值。即P(A)=p≈m/n

(n充分大)第四頁(yè),共八十四頁(yè),2022年,8月28日

二、概率的古典定義

若隨機(jī)試驗(yàn)具有以下特征:

1、試驗(yàn)的所有可能結(jié)果只有有限個(gè);

2、各可能結(jié)果出現(xiàn)的可能性相等;

3、各可能結(jié)果兩兩互不相容。可稱為隨機(jī)試驗(yàn)的古典概型。其概率可定義如下:

設(shè)樣本空間由n個(gè)等可能的基本事件所構(gòu)成,其中事件A包含有m個(gè)基本事件,則事件A的概率為m/n,即

P(A)=m/n第五頁(yè),共八十四頁(yè),2022年,8月28日

【例4.1】在編號(hào)為1、2、3、…、10的十頭豬中隨機(jī)抽取1頭,求下列隨機(jī)事件的概率。(1)A=“抽得一個(gè)編號(hào)≤4”;(2)B=“抽得一個(gè)編號(hào)是2的倍數(shù)”。

第六頁(yè),共八十四頁(yè),2022年,8月28日該試驗(yàn)樣本空間由10個(gè)等可能的基本事件構(gòu)成,即n=10,而事件A所包含的基本事件有4個(gè),即抽得編號(hào)為1,2,3,4中的任何一個(gè),事件A便發(fā)生,于是mA=4,所以P(A)=mA/n=4/10=0.4

同理,事件B所包含的基本事件數(shù)mB=5,即抽得編號(hào)為2,4,6,8,10中的任何一個(gè),事件B便發(fā)生,故

P(B)=mB/n=5/10=0.5。

第七頁(yè),共八十四頁(yè),2022年,8月28日概率的性質(zhì)

1、對(duì)于任何事件A,有0≤P(A)≤1;

2、必然事件的概率為1,即P(Ω)=1;

3、不可能事件的概率為0,即P(ф)=0。第八頁(yè),共八十四頁(yè),2022年,8月28日三、概率的計(jì)算1、事件的相互關(guān)系:和事件積事件互斥事件獨(dú)立事件完全事件系:如果多個(gè)事件A1、A2、…An兩兩互斥,且每次試驗(yàn)結(jié)果必然發(fā)生其一,則稱這些事件為完全事件系。第九頁(yè),共八十四頁(yè),2022年,8月28日2、法則:加法定理:互斥事件A和Bp(A+B)=p(A)+p(B)對(duì)立事件p(A)=1-p(A)乘法定理:獨(dú)立事件A和Bp(A.B)=p(A).P(B)【例4.2】:播種玉米時(shí),每穴播種兩粒種子,已知玉米種子的發(fā)芽率為90%,試求每穴兩粒種子均發(fā)芽的概率和一粒種子發(fā)芽的概率第十頁(yè),共八十四頁(yè),2022年,8月28日練習(xí):今有兩頭懷胎母牛,求下列概率:(1)產(chǎn)兩頭母犢;(2)產(chǎn)一頭母犢和一頭公犢雛雞20只,雌雄各半,從中任意取出4只,求下列概率:(1)4只皆雌雞;(2)恰有2只雌雞第十一頁(yè),共八十四頁(yè),2022年,8月28日【例4.3】在N頭奶牛中,有M頭曾有流產(chǎn)史,從這群奶牛中任意抽出n頭奶牛,試求:(1)其中恰有m頭有流產(chǎn)史奶牛的概率是多少?(2)若N=30,M=8,n=10,m=2,其概率是多少?從N頭奶牛中任意抽出n頭奶牛的基本事件總數(shù)為;事件A

所包含的基本事件數(shù)為;因此所求事件A的概率為:第十二頁(yè),共八十四頁(yè),2022年,8月28日將N=30,M=8,n=10,m=2代入上式,得

=0.0695

即在30頭奶牛中有8頭曾有流產(chǎn)史,從這群奶牛隨機(jī)抽出10頭奶牛其中有2頭曾有流產(chǎn)史的概率為6.95%。

第十三頁(yè),共八十四頁(yè),2022年,8月28日

四、小概率事件實(shí)際不可能性原理隨機(jī)事件的概率表示了隨機(jī)事件在一次試驗(yàn)中出現(xiàn)的可能性大小。若隨機(jī)事件的概率很小,例如小于0.05、0.01、0.001,稱之為小概率事件。在統(tǒng)計(jì)學(xué)上,把小概率事件在一次試驗(yàn)中看成是實(shí)際不可能發(fā)生的事件,稱為小概率事件實(shí)際不可能性原理,亦稱為小概率原理。是統(tǒng)計(jì)學(xué)上進(jìn)行假設(shè)檢驗(yàn)(顯著性檢驗(yàn))的基本依據(jù)。

第十四頁(yè),共八十四頁(yè),2022年,8月28日第二節(jié)概率分布事件的概率表示了一次試驗(yàn)?zāi)骋粋€(gè)結(jié)果發(fā)生的可能性大小。若要全面了解試驗(yàn),則必須知道試驗(yàn)的全部可能結(jié)果及各種可能結(jié)果發(fā)生的概率,即必須知道隨機(jī)試驗(yàn)的概率分布。隨機(jī)變量:離散型隨機(jī)變量連續(xù)型隨機(jī)變量第十五頁(yè),共八十四頁(yè),2022年,8月28日一、離散型隨機(jī)變量的概率分布將離散型隨機(jī)變量x的一切可能取值xi

(i=1,2,…),及其對(duì)應(yīng)的概率pi,記作

P(x=xi)=pi

i=1,2,…(4-3)

則稱(4-3)式為離散型隨機(jī)變量x的概率分布或分布。常用分布列來(lái)表示離散型隨機(jī)變量:

x1x2

…xn

….p1p2

…pn

顯然離散型隨機(jī)變量的概率分布具有pi≥0和Σpi=1這兩個(gè)基本性質(zhì)。

第十六頁(yè),共八十四頁(yè),2022年,8月28日二、連續(xù)型隨機(jī)變量的概率分布

如果從總體中抽取樣本容量n相當(dāng)大,則頻率分布就趨于穩(wěn)定,近似于總體概率分布。對(duì)于一個(gè)連續(xù)型隨機(jī)變量x,取值于區(qū)間[a,b]內(nèi)的概率,p(a≤x<b)=此為概率密度函數(shù)。第十七頁(yè),共八十四頁(yè),2022年,8月28日連續(xù)型隨機(jī)變量概率分布的性質(zhì):1、分布密度函數(shù)總是大于或等于0,即f(x)≥0;2、當(dāng)隨機(jī)變量x取某一特定值時(shí),其概率等于0;即

(c為任意實(shí)數(shù))

因而,對(duì)于連續(xù)型隨機(jī)變量,僅研究其在某一個(gè)區(qū)間內(nèi)取值的概率,而不去討論取某一個(gè)值的概率。第十八頁(yè),共八十四頁(yè),2022年,8月28日

3、在一次試驗(yàn)中隨機(jī)變量x之取值必在

-∞<x<+∞范圍內(nèi),為一必然事件。所以

(4-5)

(4—5)式表示分布密度曲線下、橫軸上的全部面積為1。第十九頁(yè),共八十四頁(yè),2022年,8月28日第三節(jié)二項(xiàng)分布非此即彼事件所構(gòu)成的總體,為二項(xiàng)總體,其分布稱二項(xiàng)分布.如種子的發(fā)芽與不發(fā)芽,穗子有芒與無(wú)芒,后代的成活與死亡.對(duì)于二項(xiàng)總體,在進(jìn)行重復(fù)抽樣試驗(yàn)中,具有如下共同特征:1.每次試驗(yàn)只有兩個(gè)對(duì)立結(jié)果,它們出現(xiàn)的概率分別為p與q;2.具有重復(fù)性和獨(dú)立性.以k表示在n次試驗(yàn)中事件A出現(xiàn)的次數(shù),其概率分布函數(shù)為:k=0,1,2…,n第二十頁(yè),共八十四頁(yè),2022年,8月28日二項(xiàng)分布的意義及性質(zhì)

二項(xiàng)分布定義如下:設(shè)隨機(jī)變量x所有可能取的值為零和正整數(shù):0,1,2,…,n,且有

=k=0,1,2…,n

其中p>0,q>0,p+q=1,則稱隨機(jī)變量x服從參數(shù)為n和p的二項(xiàng)分布

(binomialdistribution),記為

x~B(n,p)。第二十一頁(yè),共八十四頁(yè),2022年,8月28日二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差

統(tǒng)計(jì)學(xué)證明,服從二項(xiàng)分布B(n,p)的隨機(jī)變量之平均數(shù)μ、標(biāo)準(zhǔn)差σ與參數(shù)n、p有如下關(guān)系:當(dāng)試驗(yàn)結(jié)果以事件A發(fā)生次數(shù)k表示時(shí)

μ=npσ=第二十二頁(yè),共八十四頁(yè),2022年,8月28日三、二項(xiàng)分布的概率計(jì)算及應(yīng)用條件

【例4.9】純種白豬與純種黑豬雜交,根據(jù)孟德爾遺傳理論,子二代中白豬與黑豬的比率為3∶1。求窩產(chǎn)仔10頭,有7頭白豬的概率。根據(jù)題意,n=10,p=3/4=0.75,q=1/4=0.25。設(shè)10頭仔豬中白色的為x頭,則x為服從二項(xiàng)分布B(10,0.75)的隨機(jī)變量。于是窩產(chǎn)10頭仔豬中有7頭是白色的概率為:第二十三頁(yè),共八十四頁(yè),2022年,8月28日

【例4.10】仔豬黃痢病在常規(guī)治療下死亡率為20%,求5頭病豬治療后死亡頭數(shù)各可能值相應(yīng)的概率。設(shè)5頭病豬中死亡頭數(shù)為x,則x服從二項(xiàng)分布B(5,0.2),其所有可能取值為0,1,…,5,按(4-6)式計(jì)算概率,用分布列表示如下:

012345

0.32770.40960.20480.05120.00640.0003第二十四頁(yè),共八十四頁(yè),2022年,8月28日

二項(xiàng)分布的應(yīng)用條件有三:(1)各觀察單位只具有互相對(duì)立的一種結(jié)果,如陽(yáng)性或陰性,生存或死亡等,屬于二項(xiàng)分類資料;(2)已知發(fā)生某一結(jié)果(如死亡)的概率為p,其對(duì)立結(jié)果的概率則為1-P=q,實(shí)際中要求p

是從大量觀察中獲得的比較穩(wěn)定的數(shù)值;(3)n個(gè)觀察單位的觀察結(jié)果互相獨(dú)立,即每個(gè)觀察單位的觀察結(jié)果不會(huì)影響到其它觀察單位的觀察結(jié)果。第二十五頁(yè),共八十四頁(yè),2022年,8月28日

【例4.11】求【例4.10】平均死亡豬數(shù)及死亡數(shù)的標(biāo)準(zhǔn)差。以p=0.2,n=5代入(4-18)和(4-19)式得:平均死亡豬數(shù)μ=5×0.20=1.0(頭)

標(biāo)準(zhǔn)差σ===0.894(頭)第二十六頁(yè),共八十四頁(yè),2022年,8月28日

當(dāng)試驗(yàn)結(jié)果以事件A發(fā)生的頻率k/n表示時(shí)

(4-20)(4-21)

也稱為總體百分?jǐn)?shù)標(biāo)準(zhǔn)誤,當(dāng)p未知時(shí),常以樣本百分?jǐn)?shù)來(lái)估計(jì)。此時(shí)(4-21)式改寫為:

=(4-22)

稱為樣本百分?jǐn)?shù)標(biāo)準(zhǔn)誤。第二十七頁(yè),共八十四頁(yè),2022年,8月28日第四節(jié)波松分布波松分布是一種可以用來(lái)描述和分析隨機(jī)地發(fā)生在單位空間或時(shí)間里的稀有事件的概率分布。要觀察到這類事件,樣本含量n必須很大。如,一定畜群中某種患病率很低的非傳染性疾病患病數(shù)或死亡數(shù),畜群中遺傳的畸形怪胎數(shù),每升飲水中大腸桿菌數(shù),計(jì)數(shù)器小方格中血球數(shù)都是服從波松分布的。第二十八頁(yè),共八十四頁(yè),2022年,8月28日一、波松分布的意義若隨機(jī)變量x(x=k)只取零和正整數(shù)值0,1,2,…,且其概率分布為,k=0,1,……(4-23)

其中λ>0;e=2.7182…

是自然對(duì)數(shù)的底數(shù),則稱x服從參數(shù)為λ的波松分布(Poisson‘sdistribution),記為x~P(λ)。第二十九頁(yè),共八十四頁(yè),2022年,8月28日波松分布重要的特征:

平均數(shù)和方差相等,都等于常數(shù)λ,即

μ=σ2=λ【例4.13】調(diào)查某種豬場(chǎng)閉鎖育種群仔豬畸形數(shù),共記錄200窩,畸形仔豬數(shù)的分布情況如表4-3所示。試判斷畸形仔豬數(shù)是否服從波松分布。第三十頁(yè),共八十四頁(yè),2022年,8月28日

表4-13畸形仔豬數(shù)統(tǒng)計(jì)分布樣本均數(shù)和方差S2計(jì)算結(jié)果如下:

=Σfk/n=(120×0+62×1+15×2+2×3+1×4)/200=0.51第三十一頁(yè),共八十四頁(yè),2022年,8月28日

=0.51,S2=0.52,這兩個(gè)數(shù)是相當(dāng)接近的,因此可以認(rèn)為畸形仔豬數(shù)服從波松分布。

第三十二頁(yè),共八十四頁(yè),2022年,8月28日

λ是波松分布所依賴的唯一參數(shù)。λ值愈小分布愈偏倚,隨著λ的增大,分布趨于對(duì)稱(如圖4-11所示)。當(dāng)λ=20時(shí)分布接近于正態(tài)分布;當(dāng)λ=50時(shí),可以認(rèn)為波松分布呈正態(tài)分布。所以在實(shí)際工作中,當(dāng)λ≥20時(shí)就可以用正態(tài)分布來(lái)近似地處理波松分布的問題。

第三十三頁(yè),共八十四頁(yè),2022年,8月28日如【例4.13】中已判斷畸形仔豬數(shù)服從波松分布,并已算出樣本平均數(shù)=0.51。將0.51代替公式(4-23)中的λ得:

(k=0,1,2,…)

因?yàn)閑-0.51=1.6653,所以畸形仔豬數(shù)各項(xiàng)的概率為:P(x=0)=0.510/(0!×1.6653)=0.6005P(x=1)=0.511/(1!×1.6653)=0.3063P(x=2)=0.512/(2!×1.6653)=0.0781第三十四頁(yè),共八十四頁(yè),2022年,8月28日P(x=3)=0.513/(3!×1.6653)=0.0133P(x=4)=0.514/(4!×1.6653)=0.0017

把上面各項(xiàng)概率乘以總觀察窩數(shù)(n=200)即得各項(xiàng)按波松分布的理論窩數(shù)。波松分布與相應(yīng)的頻率分布列于表4—7中。第三十五頁(yè),共八十四頁(yè),2022年,8月28日表4—4畸形仔豬數(shù)的波松分布將實(shí)際計(jì)算得的頻率與根據(jù)λ=0.51的泊松分布計(jì)算的概率相比較,發(fā)現(xiàn)畸形仔豬的頻率分布與λ=0.51的波松分布是吻合得很好的。這進(jìn)一步說(shuō)明了畸形仔豬數(shù)是服從波松分布的。第三十六頁(yè),共八十四頁(yè),2022年,8月28日

【例4.14】為監(jiān)測(cè)飲用水的污染情況,現(xiàn)檢驗(yàn)?zāi)成鐓^(qū)每毫升飲用水中細(xì)菌數(shù),共得400個(gè)記錄如下:試分析飲用水中細(xì)菌數(shù)的分布是否服從波松分布。若服從,按波松分布計(jì)算每毫升水中細(xì)菌數(shù)的概率及理論次數(shù)并將頻率分布與波松分布作直觀比較。第三十七頁(yè),共八十四頁(yè),2022年,8月28日經(jīng)計(jì)算得每毫升水中平均細(xì)菌數(shù)=0.500,方差S2=0.496。兩者很接近,故可認(rèn)為每毫升水中細(xì)菌數(shù)服從波松分布。以=0.500代替(4-23)式中的λ,得

(k=0,1,2…)計(jì)算結(jié)果如表4—5所示。第三十八頁(yè),共八十四頁(yè),2022年,8月28日表4—5細(xì)菌數(shù)的波松分布可見細(xì)菌數(shù)的頻率分布與λ=0.5的波松分布是相當(dāng)吻合的,進(jìn)一步說(shuō)明用波松分布描述單位容積(或面積)中細(xì)菌數(shù)的分布是適宜的。第三十九頁(yè),共八十四頁(yè),2022年,8月28日注意:二項(xiàng)分布的應(yīng)用條件也是波松分布的應(yīng)用條件。比如二項(xiàng)分布要求n

次試驗(yàn)是相互獨(dú)立的,這也是波松分布的要求。然而一些具有傳染性的罕見疾病的發(fā)病數(shù),因?yàn)槭桌l(fā)生之后可成為傳染源,會(huì)影響到后續(xù)病例的發(fā)生,所以不符合波松分布的應(yīng)用條件。對(duì)于在單位時(shí)間、單位面積或單位容積內(nèi),所觀察的事物由于某些原因分布不隨機(jī)時(shí),如細(xì)菌在牛奶中成集落存在時(shí),亦不呈波松分布。第四十頁(yè),共八十四頁(yè),2022年,8月28日第五節(jié)正態(tài)分布正態(tài)分布是一種連續(xù)型隨機(jī)變量的概率分布。許多變量服從或近似服從正態(tài)分布。許多統(tǒng)計(jì)分析方法以正態(tài)分布為基礎(chǔ)的。大多隨機(jī)變量的概率分布在一定條件下以正態(tài)分布為其極限分布。第四十一頁(yè),共八十四頁(yè),2022年,8月28日一、正態(tài)分布的定義及其特征

(一)正態(tài)分布的定義若連續(xù)型隨機(jī)變量x的概率分布密度函數(shù)為

(4-6)

其中μ為平均數(shù),σ2為方差,則稱隨機(jī)變量x服從正態(tài)分布,記為x~N(μ,σ2)。相應(yīng)的概率分布函數(shù)為

(4-7)

第四十二頁(yè),共八十四頁(yè),2022年,8月28日

(二)

正態(tài)分布的特征

1、正態(tài)分布密度曲線是單峰、對(duì)稱的懸鐘形曲線,對(duì)稱軸為x=μ;

2、f(x)在x=μ處達(dá)到極大,;

3、f(x)是非負(fù)函數(shù),以x軸為漸近線,分布從-∞至+∞;第四十三頁(yè),共八十四頁(yè),2022年,8月28日

4、曲線在x=μ±σ處各有一個(gè)拐點(diǎn),即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上是下凸的,在[μ-σ,μ+σ]區(qū)間內(nèi)是上凸的;

5、正態(tài)分布有兩個(gè)參數(shù),即平均數(shù)μ和標(biāo)準(zhǔn)差σ。

6、分布密度曲線與橫軸所夾的面積為1,即:

第四十四頁(yè),共八十四頁(yè),2022年,8月28日二、標(biāo)準(zhǔn)正態(tài)分布μ=0,σ2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布.

標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及概率累積函數(shù)分別記作f(u)和F(u),由(4-6)及(4-7)式得:

(4-8)(4-9)

隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布,記作u~N(0,1)第四十五頁(yè),共八十四頁(yè),2022年,8月28日

對(duì)于任何一個(gè)服從正態(tài)分布N(μ,σ2)的隨機(jī)變量x,都可以通過標(biāo)準(zhǔn)化變換:

u=(x-μ)/σ(4-10)u稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差(standardnormaldeviate)。

第四十六頁(yè),共八十四頁(yè),2022年,8月28日三、正態(tài)分布的概率計(jì)算

(一)標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算

設(shè)u服從標(biāo)準(zhǔn)正態(tài)分布,則u在[u1,u2

) 區(qū)間內(nèi)取值的概率為:=F(u2)-F(u1)(4-11)而F(u1)與F(u2)可由附表1查得。第四十七頁(yè),共八十四頁(yè),2022年,8月28日

例如,u=1.75,1.7放在第一列,0.05放在第一行。在附表1中,1.7所在行與0.05所在列相交處的數(shù)值為0.95994,即F(1.75)=0.95994。若給定F(u)值,例如F(u)=0.284,反過來(lái)查u值。這只要在附表1中找到與0.284最接近的值0.2843,對(duì)應(yīng)行的第一列數(shù)-0.5,對(duì)應(yīng)列的第一行數(shù)值0.07,即相應(yīng)的u值為u=-0.57,亦即F(-0.57)=0.284。如果要求更精確的u值,可用線性插值法計(jì)算。第四十八頁(yè),共八十四頁(yè),2022年,8月28日

由(4-11)式及正態(tài)分布的對(duì)稱性可推出下列關(guān)系式,再借助附表1,便能很方便地計(jì)算有關(guān)概率:

P(u≥u1)=F(-u1)

P(|u|≥u1)=2F(-u1)

P(|u|<u1)=1-2F(-u1)

P(u1

≤u<u2)=F(u2)-F(u1)第四十九頁(yè),共八十四頁(yè),2022年,8月28日

【例4.6】已知u~N(0,1),試求:

(1)P(u<-1.64)=?(2)P(u≥2.58)=?(3)P(|u|≥2.56)=?(4)P(0.34≤u<1.53)=?第五十頁(yè),共八十四頁(yè),2022年,8月28日利用(4-12)式,查附表1得:

(1)P(u<-1.64)=0.05050(2)P(u≥2.58)=F(-2.58)=0.024940(3)P(|u|≥2.56)=2F(-2.56)=2×0.005234=0.010468(4)P(0.34≤u<1.53)=F(1.53)-F(0.34)=0.93669-0.6331=0.30389第五十一頁(yè),共八十四頁(yè),2022年,8月28日關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:

P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545

P(-3≤u<3)=0.9973P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99

第五十二頁(yè),共八十四頁(yè),2022年,8月28日

u變量在上述區(qū)間以外取值的概率分別為:

P(|u|≥1)=2F(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2F(-2)=1-P(-2≤u<2)

=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01第五十三頁(yè),共八十四頁(yè),2022年,8月28日

(二)一般正態(tài)分布的概率計(jì)算

X~N(μ,σ2),則x的取值落在任意區(qū)間[x1,x2)的概率,記作P(x1≤x<x2),即:(4-13)

對(duì)(4-13)式作變換u=(x-μ)/σ,得dx=σdu,故有第五十四頁(yè),共八十四頁(yè),2022年,8月28日

【例4.7】設(shè)x服從μ=30.26,σ2=5.102的正態(tài)分布,試求P(21.64≤x<32.98)。令則u服從標(biāo)準(zhǔn)正態(tài)分布,故

=P(-1.69≤u<0.53)=F(0.53)-F(-1.69)=0.6564

第五十五頁(yè),共八十四頁(yè),2022年,8月28日關(guān)于一般正態(tài)分布,以下幾個(gè)概率(即隨機(jī)變量x落在μ加減不同倍數(shù)σ區(qū)間的概率)是經(jīng)常用到的。

P(μ-σ≤x<μ+σ)=0.6826P(μ-2σ≤x<μ+2σ)=0.9545P(μ-3σ≤x<μ+3σ)=0.9973P(μ-1.96σ≤x<μ+1.96σ)=0.95P(μ-2.58σ≤x<μ+2.58σ)=0.99第五十六頁(yè),共八十四頁(yè),2022年,8月28日例:126頭基礎(chǔ)母羊體重資料的次數(shù)分布接近正態(tài)分布,現(xiàn)根據(jù)其平均數(shù)=52.26(kg),標(biāo)準(zhǔn)差S=5.10(kg),算出平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間內(nèi)所包括的次數(shù)與頻率,列于表4—2。試計(jì)算:母羊體重的95%正常值范圍;體重大于70kg的概率第五十七頁(yè),共八十四頁(yè),2022年,8月28日表4—2126頭基礎(chǔ)母羊體重在±kS

區(qū)間內(nèi)所包括的次數(shù)與頻率第五十八頁(yè),共八十四頁(yè),2022年,8月28日由上表可見,實(shí)際頻率與理論概率相當(dāng)接近,說(shuō)明126頭基礎(chǔ)母羊體重資料的頻率分布接近正態(tài)分布,從而可推斷基礎(chǔ)母羊體重這一隨機(jī)變量很可能服從正態(tài)分布。(1)查附表2,得兩尾概率U0.05=1.96,于是:上限為:下限為:(2)求得U=查附表1,F(U),P(x≥70)=1-F(U)=第五十九頁(yè),共八十四頁(yè),2022年,8月28日例如,x落在(μ-1.96σ,μ+1.96σ)之外的雙側(cè)概率為0.05,而單側(cè)概率為0.025。即

P(x<μ-1.96σ==P(x>μ+1.96σ)=0.025

雙側(cè)概率或單側(cè)概率區(qū)別如下:

x落在(μ-2.58σ,μ+2.58σ)之外的雙側(cè)概率為0.01,而單側(cè)概率

P(x<μ-2.58σ)=P(x>μ+2.58σ)=0.005第六十頁(yè),共八十四頁(yè),2022年,8月28日

附表2給出了滿足P(|u|>)=α的雙側(cè)分位的數(shù)值。因此,只要已知雙側(cè)概率α的值,由附表2就可直接查出對(duì)應(yīng)的雙側(cè)分位數(shù),查法與附表1相同。例如,已知u~N(0,1)試求:

(1)P(u<-)+P(u≥)=0.10的

(2)P(-≤u<﹚=0.86的因?yàn)楦奖?中的α值是:第六十一頁(yè),共八十四頁(yè),2022年,8月28日所以(1)P(u<-)+P(u≥)=1-P(-≤u<﹚=0.10=α由附表2查得:=1.644854(2)P(-≤u<)=0.86,

α=1-P(-≤u<)=1-0.86=0.14

由附表2查得:=1.475791

對(duì)于x~N(μ,σ2),只要將其轉(zhuǎn)換為u~N(0,1),即可求得相應(yīng)的雙側(cè)分位數(shù)。第六十二頁(yè),共八十四頁(yè),2022年,8月28日三個(gè)分布函數(shù)的主要特征:適應(yīng)范圍、概率函數(shù)、表示形式、參數(shù)第六十三頁(yè),共八十四頁(yè),2022年,8月28日前面討論的三個(gè)重要的概率分布的關(guān)系如下:

對(duì)于二項(xiàng)分布,在n→∞,p→0,且np=λ(較小常數(shù))情況下,二項(xiàng)分布趨于波松分布。在這種場(chǎng)合,波松分布中的參數(shù)λ用二項(xiàng)分布的np代之;在n→∞,p→0.5時(shí),二項(xiàng)分布趨于正態(tài)分布。在這種場(chǎng)合,正態(tài)分布中的μ、σ2用二項(xiàng)分布的np、np

q代之。在實(shí)際計(jì)算中,當(dāng)p<0.1且n很大時(shí),二項(xiàng)分布可由波松分布近似;當(dāng)p>0.1且n很大時(shí),二項(xiàng)分布可由正態(tài)分布近似。第六十四頁(yè),共八十四頁(yè),2022年,8月28日對(duì)于波松分布,當(dāng)λ→∞時(shí),波松分布以正態(tài)分布為極限。在實(shí)際計(jì)算中,當(dāng)λ≥20(也有人認(rèn)為λ≥6)時(shí),用波松分布中的λ代替正態(tài)分布中的μ及σ2,即可由后者對(duì)前者進(jìn)行近似計(jì)算。第六十五頁(yè),共八十四頁(yè),2022年,8月28日第六節(jié)樣本平均數(shù)的抽樣分布統(tǒng)計(jì)的主要研究?jī)?nèi)容:抽樣分布的問題---從總體到樣本;統(tǒng)計(jì)推斷問題---從樣本到總體.樣本統(tǒng)計(jì)量也是隨機(jī)變量,也有其概率分布。因此,把統(tǒng)計(jì)量的概率分布稱為抽樣分布。第六十六頁(yè),共八十四頁(yè),2022年,8月28日一、樣本平均數(shù)抽樣分布設(shè)有一總體,平均數(shù)為μ,方差為σ2。從總體中隨機(jī)抽取含量為n的樣本,樣本平均數(shù)記。如做可放回抽樣,可抽出很多甚至無(wú)窮多個(gè)含量為n的樣本。樣本平均數(shù)有大有小,與μ相比存有不同程度的差異。這種差異是由隨機(jī)抽樣造成的,稱為抽樣誤差。樣本平均數(shù)也是一個(gè)隨機(jī)變量,其概率分布叫做樣本平均數(shù)的抽樣分布。由樣本平均數(shù)構(gòu)成的總體稱為樣本平均數(shù)的抽樣總體,其平均數(shù)和標(biāo)準(zhǔn)差分別記為和。是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差,簡(jiǎn)稱標(biāo)準(zhǔn)誤,它表示平均數(shù)抽樣誤差的大小。第六十七頁(yè),共八十四頁(yè),2022年,8月28日總體的兩個(gè)參數(shù)與x

總體的兩個(gè)參數(shù)關(guān)系如下:

例:設(shè)有一個(gè)N=4的有限總體,變數(shù)為2、3、3、4。根據(jù)μ=Σx/N和σ2=Σ(x-μ)2/N求得該總體的μ、σ2、σ為:μ=3,σ2=1/2,σ==0.707第六十八頁(yè),共八十四頁(yè),2022年,8月28日從有限總體作返置隨機(jī)抽樣,所有可能的樣本數(shù)為Nn其中n為樣本含量。以上述總體而論,如果從中抽取n=2的樣本,共可得42=16個(gè)樣本;如果樣本含量n為4,則一共可抽得44=256個(gè)樣本。分別求這些樣本的平均數(shù),其次數(shù)分布如表4—6所示。根據(jù)表4—6,在n=2的試驗(yàn)中,樣本平均數(shù)抽樣總體的平均數(shù)、方差與標(biāo)準(zhǔn)差分別為:第六十九頁(yè),共八十四頁(yè),2022年,8月28日

=4/16=1/4=(1/2)/2=第七十頁(yè),共八十四頁(yè),2022年,8月28日表4—6N=4,n=2和n=4時(shí)的次數(shù)分布第七十一頁(yè),共八十四頁(yè),2022年,8月28日同理,可得n=4時(shí):這就驗(yàn)證了=μ,的正確性。

第七十二頁(yè),共八十四頁(yè),2022年,8月28日二、標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(平均數(shù)抽樣總體的標(biāo)準(zhǔn)差)的大小反映樣本平均數(shù)的抽樣誤差的大小,即精確性的高低。與σ成正比,與n的平方根成反比。從某特定總體抽樣,因?yàn)棣沂且怀?shù),所以只有增大樣本含量才能降低樣本平均數(shù)的抽樣誤差。第七十三頁(yè),共八十四頁(yè),2022年,8月28日

對(duì)于大樣本資料,常將樣本標(biāo)準(zhǔn)差S與樣本平均數(shù)配合使用,記為±S,用以說(shuō)明所考察性狀或指標(biāo)的優(yōu)良性與穩(wěn)定性。

對(duì)于小樣本資料,常將樣本標(biāo)準(zhǔn)誤與樣本平均數(shù)配合使用,記為±,用以表示所考察性狀或指標(biāo)的優(yōu)良性與抽樣誤差的大小。第七十四頁(yè),共八十四頁(yè),2022年,8月28日第七節(jié)

t

分布由樣本平均數(shù)抽樣分布的性質(zhì)知道:若x~N(μ,σ2),則~N(μ,σ2/n)。將隨機(jī)變量標(biāo)準(zhǔn)化得:,則u~N(0,1)。當(dāng)總體標(biāo)準(zhǔn)差σ未知時(shí),以樣本標(biāo)準(zhǔn)差S代替σ所得到的統(tǒng)計(jì)量記為t。在計(jì)算時(shí),由于采用S來(lái)代替σ,使得t

變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布(t-distribution)。它的概率分布密度函數(shù)如下:第七十五頁(yè),共八十四頁(yè),2022年,8月28日

(4-26)

式中,t的取值范圍是(-∞,+∞);

df=n-1為自由度。

t分布的平均數(shù)和標(biāo)準(zhǔn)差為:μt=0(df>1),(df>2)(4-27)t分布密度曲線如圖4-13所示,其特點(diǎn)是:第七十六頁(yè),共八十四頁(yè),2022年,8月28日

1、t分布受自由度的制約,每一個(gè)自由度都有一條t分布密度曲線。

2、t分布密度曲線以縱軸為對(duì)稱軸,左右對(duì)稱,且在t=0時(shí),分布密度函數(shù)取得最大值。

3、與

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論