版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
本文格式為Word版,下載可任意編輯——D04常用概率分布(定稿)第五章常用概率分布
第四章常用概率分布
隨機(jī)變量(randomvariable)的性質(zhì)取決于它的分布規(guī)律。本章介紹三個(gè)最常用的理論分布,包括離散型變量的二項(xiàng)分布(binomialdistribution)與Poisson分布(Poissondistribution),以及連續(xù)型變量的正態(tài)分布(normaldistribution)。醫(yī)學(xué)研究中的好多隨機(jī)現(xiàn)象可以用這三種分布之一進(jìn)行描述。為便于教學(xué),讀者需要復(fù)習(xí)高等數(shù)學(xué)課程中已經(jīng)學(xué)過的概率論基本知識(shí)。
第一節(jié)二項(xiàng)分布一、二項(xiàng)分布的概念與特征
先看一個(gè)小試驗(yàn)。一個(gè)袋子里有5個(gè)乒乓球,其中2個(gè)黃球,3個(gè)白球,我們進(jìn)行盲法摸球游戲,每次摸1球,然后放回再摸。如此重復(fù)。先后摸5次,摸到黃球的次數(shù)可能是0次,可能是1次、2次等,也可能5次都摸到黃球。請(qǐng)問摸到黃球的次數(shù)為0的概率有多大?摸到黃球的次數(shù)為1的概率有多大?摸到黃球的次數(shù)為2的概率有多大?5次均摸到黃球的概率又是多大呢?你會(huì)算嗎?
在這個(gè)試驗(yàn)中,由于黃球的比例是2/5,白球的比例是3/5。又,該試驗(yàn)為有放回的試驗(yàn),因此每一次摸到黃球的概率是0.4,摸到白球的概率是0.6。假使5次里前X次摸到的是黃球,以后5-X次摸到的是白球,相應(yīng)的概率是0.4X0.65?X。由于摸到黃球可能發(fā)生在5次中的任意X次中,因此5次里有X次摸到黃球的概率為C5X0.4X0.65?X。其中,C5X表示“5取X的組合數(shù)〞。該試驗(yàn)有三個(gè)特點(diǎn):①各次摸球是彼此獨(dú)立的;②每次摸球只有二種可能的結(jié)果,或黃球或白球;③每次摸到黃球(或摸到白球)的概率是固定的。具備以上三點(diǎn),n次中有X次摸到黃球的概率分布就是二項(xiàng)分布。
例4-1用針灸治療頭痛,假定結(jié)果只有兩種可能,不是“有效〞就是“無效〞,每一例有效的概率為π。某醫(yī)生用此方法治療頭痛患者3例,2例有效的概率是多少?
用Ai表示第i例有效,Ai表示第i例無效。由于每例有效的概率一致,且各例的治療結(jié)果之間彼此獨(dú)立,3例患者中可以是其中的任意2例有效,所以3例
1
第五章常用概率分布
中2例有效的概率為:
P(A1A2A3)?P(A1A2A3)?P(A1A2A3)?C?(1??)232
推而廣之,醫(yī)學(xué)研究中好多現(xiàn)象的觀測(cè)結(jié)果是以兩分類變量來表示的,如陽(yáng)性與陰性,治愈與未愈,生存與死亡等。假使每個(gè)觀測(cè)對(duì)象陽(yáng)性結(jié)果的發(fā)生概率均為?,陰性結(jié)果的發(fā)生概率均為(1-?);且各個(gè)觀測(cè)對(duì)象的結(jié)果是相互獨(dú)立的,那么,重復(fù)觀測(cè)n個(gè)對(duì)象,發(fā)生陽(yáng)性結(jié)果的次數(shù)X的概率分布聽從二項(xiàng)分布,記作B(n,?)。
二項(xiàng)分布的概率函數(shù)P(X)可用公式(4-1)來計(jì)算。
P(X)?CnX?X(1??)n?X(4-1)
其中
CnX?n!X!(n?X)!(4-2)
!為階乘符號(hào),n!?n(n?1)(n?2)?1,如3!=3×2×1,0!定義為1。
例4-2假使例4-1中?=0.6,隨機(jī)治療3例,有效例數(shù)為0例、1例、2例和3例的概率各多大?1例及以上有效的概率多大?
根據(jù)(4-1)式,0例有效的概率為
00.60(1?0.6)(3?0)?0.43?0.064C31例及以上有效的概率可表示為
P(X?1)?P(1)?P(2)?P(3)?0.288?0.432?0.216?0.936
同理,可算得有效例數(shù)分別為1、2和3的概率,見表4-1。
表4-1治療3例可能的有效例數(shù)及其概率
有效人數(shù)(X)
0
123
C3X
1331
?X
0.600.60.6×0.60.6×0.6×0.6
(1-?)n-X0.4×0.4×0.4
0.4×0.40.40.40
出現(xiàn)該結(jié)果的概率P(X)
0.0640.2880.4320.216
由表4-1可知,由于只有4種可能結(jié)果,各種可能結(jié)果出現(xiàn)的概率之和為1,即?P?X??1。據(jù)此,1例及以上有效的概率又可表示為
P(X?1)?1?P(0)?1?0.064?0.936
2
第五章常用概率分布
兩者結(jié)果一致。
(三)二項(xiàng)分布的特征
二項(xiàng)分布的特征由二項(xiàng)分布的參數(shù)?以及觀測(cè)的次數(shù)n決定。1.二項(xiàng)分布的圖形特征
在n次獨(dú)立重復(fù)的試驗(yàn)中,若某事件發(fā)生的概率為?,則該事件的發(fā)生次數(shù)X聽從二項(xiàng)分布。用圖形表示,以X為橫軸,以對(duì)應(yīng)于X的概率P(X)為縱軸,對(duì)所有可能的X(0≤X≤n)分別用垂直于橫軸、長(zhǎng)度為P(X)的線段表示相應(yīng)的概率,得二項(xiàng)分布圖。
從圖形可知,二項(xiàng)分布的高峰在?=n?處或附近;?為0.5時(shí),圖形是對(duì)稱的;當(dāng)?不等于0.5時(shí),分布不對(duì)稱,且對(duì)同一n,?離0.5愈遠(yuǎn),對(duì)稱性愈差。對(duì)同一?,隨著n的增大,分布趨于對(duì)稱。當(dāng)n→∞時(shí),只要?不太靠近0或1,(特別是當(dāng)n?和n(1-?)均大于5時(shí)),二項(xiàng)分布趨于對(duì)稱。
P(x)0.40.30.20.10.0
0123
P(x)0.40.30.20.10.0
012345678910111213
n=3,π=0.5n=10,π=0.5
圖4-1π=0.5時(shí),不同n值對(duì)應(yīng)的二項(xiàng)分布
3
第五章常用概率分布
P(x)0.40.30.20.1
P(x)0.40.30.20.1
0123
0.0
0.0
0123456
P(x)0.40.30.20.10.0
012345678910
P(x)0.40.30.20.1
0.0
0123456789101112131415
圖4-2π=0.3時(shí),不同n值對(duì)應(yīng)的二項(xiàng)分布
圖4-1和圖4-2給出了?=0.5和?=0.3時(shí)不同n值對(duì)應(yīng)的二項(xiàng)分布圖。2.二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差例4-3求例4-2資料的均數(shù)和方差。
在例4-2中,總共治療三個(gè)患者n=3,有效概率?=0.6,有效的人數(shù)可能為0個(gè)人,1個(gè)人,2個(gè)人或3個(gè)人,對(duì)應(yīng)的概率分別為0.064,0.288,0.432和0.216。根據(jù)總體均數(shù)(又稱數(shù)學(xué)期望,下略)和方差的定義,有效人數(shù)的均數(shù)為
E(X)??XP(X)?0?0.064?1?0.288?2?0.432?3?0.216?1.80
方差為
Var(X)?E?X?E(X)????X?E(X)?P(X)?(0?1.80)2?0.064?(1?1.80)2?0.288?...?(3?1.80)2?0.216?0.7222
事實(shí)上對(duì)于任何二項(xiàng)分布問題,假使每一次試驗(yàn)出現(xiàn)陽(yáng)性結(jié)果的概率均為,?,進(jìn)行n次獨(dú)立重復(fù)試驗(yàn),出現(xiàn)X次陽(yáng)性結(jié)果,那么,可以證明(見附錄)X的總體均數(shù)為
??n?(4-3)
4
第五章常用概率分布
方差為
?2?n?(1??)(4-4)標(biāo)準(zhǔn)差為
??n?(1??)(4-5)
若將出現(xiàn)陽(yáng)性結(jié)果的頻率記為
p?Xn則p的總體均數(shù)、方差、標(biāo)準(zhǔn)差分別為
?p??(4-6)
2?p??(1??)nn(4-7)
?p??(1??)(4-8)
式中?p是頻率p的標(biāo)準(zhǔn)差,又稱頻率的標(biāo)準(zhǔn)誤,它反映陽(yáng)性頻率的抽樣誤差的大小。
例4-4已知某地鉤蟲感染率為6.7%,假使隨機(jī)抽查150人,記樣本鉤蟲感染率為p,求p的標(biāo)準(zhǔn)誤?p。
本例n?150,??0.067,按(4-8)式
?p?0.067(1?0.067)?0.020?2.0%
150
二、二項(xiàng)分布的應(yīng)用
1.概率估計(jì)
例4-5假使某地鉤蟲感染率為13%,隨機(jī)觀測(cè)當(dāng)?shù)?50人,其中恰好有10人感染鉤蟲的概率有多大?
由于人與人之間鉤蟲感染與否可假設(shè)為相互獨(dú)立的,感染鉤蟲的人數(shù)X可認(rèn)為聽從n=150,π=0.13的二項(xiàng)分布,由公式(4-1)和(4-2),可以得出150人中恰有10人感染鉤蟲的概率為
5
第五章常用概率分布
P(X?10)?150!0.1310?0.87140?0.0055
10!(150?10)!2.累積概率計(jì)算
單純計(jì)算二項(xiàng)分布X取某值時(shí)的概率往往沒有太大意義,實(shí)際上經(jīng)常需要計(jì)算的是二項(xiàng)分布的累積概率。
二項(xiàng)分布出現(xiàn)陽(yáng)性的次數(shù)至多為K次的概率為
P(X?K)??P(X)??X?0Kn!?X(1??)n?X(4-9)
X?0X!(n?X)!K出現(xiàn)陽(yáng)性的次數(shù)至少為k次的概率為
P(X?k)??P(X)??X?kX?knnn!?X(1??)n?X(4-10)
X!(n?X)!同理,可以計(jì)算陽(yáng)性的次數(shù)至少為k次至多為K次的概率(k第五章常用概率分布
P(X?k)?1?P(X?k?1)(4-14)
例4-9續(xù)例4-7。試估計(jì)每一個(gè)培養(yǎng)皿中菌落數(shù)小于3個(gè)的概率,大于1個(gè)的概率。
該培養(yǎng)皿菌落數(shù)小于3個(gè)的概率為
e?66Xe?660e?661e?662P(X?3)??P(X)?????X!0!1!2!X?0X?0?0.06222菌落數(shù)大于1個(gè)的概率為
e?660e?661P(X?1)?1?P(X?0)?P(X?1)?1??0!1!
?0.983例4-10續(xù)例4-8。試估計(jì)1000名居民中至多有2人患腦血管疾病的概率有多大?至少有3人患腦血管疾病的概率有多大?
至多有2人患腦血管疾病的概率為
e?1.51.5Xe?1.51.50e?1.51.51e?1.51.52P(X?2)??P(X)??????0.809
X!0!1!2!X?0X?022至少有3人患腦血管疾病的概率為
P(X?3)?1?P(X?2)?1?0.809?0.191
Poisson分布與二項(xiàng)分布的一個(gè)前提條件是事件發(fā)生的概率?不變,每個(gè)事件發(fā)生與否是相互獨(dú)立的。若n次觀測(cè)互不獨(dú)立、發(fā)生概率不等,則不能看作二項(xiàng)分布。例如,在某社區(qū),傳染性疾病首例出現(xiàn)后便成為傳染源,會(huì)增加該社區(qū)后續(xù)病例出現(xiàn)的概率,且隨著病例數(shù)的增加,其他易感人群感染的概率增加,因此病例數(shù)的分布不能看作是二項(xiàng)分布或Poisson分布;又如,污染的牛奶中細(xì)菌成集落存在,單位容量牛奶中細(xì)菌數(shù)不能認(rèn)為聽從Poisson分布;再如,釘螺在繁殖期成窩狀散布,單位面積中釘螺數(shù)的觀測(cè)結(jié)果不是獨(dú)立的,因此也不能認(rèn)為聽從Poisson分布。
11
第五章常用概率分布
第三節(jié)正態(tài)分布一、
正態(tài)分布的概念
正態(tài)分布是統(tǒng)計(jì)學(xué)的基本理論分布之一,也是自然界最常見的分布之一。例如,測(cè)量的誤差、人體大量生化指標(biāo)的測(cè)量值等等都可認(rèn)為近似聽從正態(tài)分布。此外,正態(tài)分布具有大量良好的性質(zhì),大量理論分布在一定條件下可用正態(tài)分布近似,一些重要的分布可由正態(tài)分布導(dǎo)出。可以說正態(tài)分布是統(tǒng)計(jì)學(xué)中最重要的分布。正態(tài)分布具有什么樣的特征呢?請(qǐng)觀測(cè)表4-3和表4-4兩個(gè)頻率分布表。
表4-3某地正常成人心率(次/分)
的頻率分布表
組段45—
50—55—60—65—70—75—80—85—90—95—100—105合計(jì)
頻數(shù)151213263124159752150
頻率(%)0.673.338.008.6717.3320.6716.0010.006.004.673.331.33100.00
組段1.228―1.234―1.240―1.246―1.252―1.258―1.264―1.270―1.276―1.282―1.258―合計(jì)
表4-4(體模)骨密度測(cè)量值(mg/cm3)
的頻率分布表
頻數(shù)22717253725164137175
頻率(%)1.141.144.009.7114.2921.1414.299.142.290.5721.14100.00
表4-3與表4-4的共同點(diǎn)是中間頻數(shù)最多,兩邊頻數(shù)漸少且近似對(duì)稱。為直觀起見將表4-4數(shù)據(jù)繪成一幅特別的直方圖(圖4-4),以各長(zhǎng)方形面積代表各組段的頻率,直條的高度相當(dāng)于頻率除以組距,稱之為頻率密度,這張圖稱為頻率密度圖??梢栽O(shè)想,假使觀測(cè)人數(shù)逐漸增多,組段不斷分細(xì),直條的寬度將逐漸變窄,其頂端逐漸接近于一條光滑的曲線,這條曲線稱為頻率密度曲線。該曲線表現(xiàn)為中間高,兩邊低,左右對(duì)稱,類似鐘形,頗象數(shù)學(xué)上的正態(tài)分布曲線。由于頻率的總和等于1,故橫軸上曲線下的面積恒等于1。
12
第五章常用概率分布
圖4-4體模―骨密度‖測(cè)量值的分布接近正態(tài)分布示意圖(頻率密度=頻率/組距)
正態(tài)曲線(normalcurve)是一條高峰位于中央,兩側(cè)逐漸下降并完全對(duì)稱,曲線兩端永遠(yuǎn)不與橫軸相交的鐘型曲線。該曲線的函數(shù)表達(dá)式f(x)稱為正態(tài)分布密度函數(shù),
f(x)?1e?2??(x??)22?2(4-15)
其中,?為總體均數(shù),?為總體標(biāo)準(zhǔn)差。
正態(tài)概率密度曲線的位置與形狀具有如下特點(diǎn):(1)關(guān)于x=?對(duì)稱。
(2)在x=μ處取得該概率密度函數(shù)的最大值,在x????處有拐點(diǎn)。(3)曲線下面積為1。
(4)?決定曲線在橫軸上的位置,?增大,曲線沿橫軸向右移;反之,?減小,曲線沿橫軸向左移。
(5)?決定曲線的形狀,當(dāng)?恒定時(shí),?越大,數(shù)據(jù)越分散,曲線越―矮胖‖;?越小,數(shù)據(jù)越集中,曲線越―瘦高‖。見圖4-5。
13
第五章常用概率分布
-6-5-4μ1-3-2-1μ2012μ33456a.標(biāo)準(zhǔn)差一致、均數(shù)不同(?1??2??3)的三條正態(tài)曲線
?1?2?3-3-2-10123b.均數(shù)一致、標(biāo)準(zhǔn)差不同(?1??2??3)的三條正態(tài)曲線
圖4-5正態(tài)曲線位置、形狀與?、?關(guān)系示意圖
習(xí)慣上用N(?,?2)表示均數(shù)為?、標(biāo)準(zhǔn)差為?的正態(tài)分布。
好多醫(yī)學(xué)現(xiàn)象聽從正態(tài)分布或近似正態(tài)分布。例如,同性別、同年齡兒童的身高,同性別健康成人的紅細(xì)胞數(shù)、血紅蛋白含量、脈搏數(shù)等。一般說來,若影響某一數(shù)量指標(biāo)的隨機(jī)因素好多,而每個(gè)因素所起的作用均不太大,那么這個(gè)指標(biāo)聽從正態(tài)分布。如試驗(yàn)中的隨機(jī)誤差,尋常表現(xiàn)為正態(tài)分布。
二、正態(tài)概率密度曲線下的面積
1.一個(gè)共同的規(guī)律
14
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年投資款轉(zhuǎn)為項(xiàng)目融資借款合同范本及合規(guī)審查3篇
- 2025年潮州貨運(yùn)資格證題庫(kù)在線練習(xí)
- 2025年淮安道路貨運(yùn)從業(yè)資格證模擬考試官方題下載
- 2025年大同考貨運(yùn)從業(yè)資格證
- 2025年貨運(yùn)從業(yè)資格證考試技巧與方法
- 洛陽(yáng)理工學(xué)院《大數(shù)據(jù)平臺(tái)核心技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 火車站采暖系統(tǒng)施工協(xié)議
- 2024年物業(yè)抵押借款合同
- 商業(yè)地帶凈水機(jī)租賃合同協(xié)議書
- 文化場(chǎng)館改造增補(bǔ)合同
- 安徽省蚌埠市聯(lián)考2024-2025學(xué)年七年級(jí)上學(xué)期12月期末考試英語試題(無答案)
- 心理健康課件教學(xué)課件
- 2024至2030年中國(guó)甲醚化氨基樹脂行業(yè)投資前景及策略咨詢研究報(bào)告
- 貴州省建筑工程施工資料管理導(dǎo)則
- 2024年度鋼模板生產(chǎn)與銷售承包合同3篇
- 《QHSE體系培訓(xùn)》課件
- 計(jì)量經(jīng)濟(jì)學(xué)論文-城鎮(zhèn)單位就業(yè)人員工資總額的影響因素
- 《農(nóng)業(yè)企業(yè)經(jīng)營(yíng)管理》試題及答案(U)
- 山東省聊城市2024-2025學(xué)年高一上學(xué)期11月期中物理試題
- 孫悟空課件教學(xué)課件
- 華南理工大學(xué)《自然語言處理》2023-2024學(xué)年期末試卷
評(píng)論
0/150
提交評(píng)論