第5章 概率分布 醫(yī)學(xué)統(tǒng)計(jì)學(xué)_第1頁
第5章 概率分布 醫(yī)學(xué)統(tǒng)計(jì)學(xué)_第2頁
第5章 概率分布 醫(yī)學(xué)統(tǒng)計(jì)學(xué)_第3頁
第5章 概率分布 醫(yī)學(xué)統(tǒng)計(jì)學(xué)_第4頁
第5章 概率分布 醫(yī)學(xué)統(tǒng)計(jì)學(xué)_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)余小金東南大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室內(nèi)容復(fù)習(xí) 基本概念 研究設(shè)計(jì)基礎(chǔ) 統(tǒng)計(jì)描述 23基本概念匯總總體個(gè)體、個(gè)體變異總體參數(shù)未知樣本代表性、抽樣誤差隨機(jī)抽樣樣本統(tǒng)計(jì)量已知統(tǒng)計(jì)推斷風(fēng) 險(xiǎn)研究設(shè)計(jì)基礎(chǔ) 抽樣研究的科學(xué)性 如何保障抽樣研究的合理性?隨機(jī)原則(randomization)重復(fù)原則 (replication)比較原則( contrast)4統(tǒng)計(jì)學(xué)分支 統(tǒng)計(jì)描述 statistical description 統(tǒng)計(jì)推斷 statistical inference5統(tǒng)計(jì)描述 圖表方法 指標(biāo)方法65 常用概率分布你想怎樣? 中國(guó)成年男子的身高范圍? 中國(guó)成年男子的平均身高

2、? 哪個(gè)范圍的可能性最大? 哪個(gè)范圍的可能性最小?89主要內(nèi)容(Contents) 5.0 隨機(jī)變量的概率分布 5.1 正態(tài)分布 5.2 二項(xiàng)分布 5.3 Poisson分布10隨機(jī)變量 假如一個(gè)變量的取值依賴于隨機(jī)現(xiàn)象的基本結(jié)果,則稱此變量為隨機(jī)變量,用大寫字母表示,其取值用小寫字母表示. 相對(duì)頻率說明了具有某個(gè)性質(zhì)的觀察對(duì)象的出現(xiàn)的可能性。 隨機(jī)變量的類型離散型:性別、血型、子女?dāng)?shù)、事故數(shù)、菌落數(shù)連續(xù)型:身高、體重5.1 正態(tài)分布 正態(tài)分布的特征 標(biāo)準(zhǔn)正態(tài)分布 正態(tài)分布曲線下面積的規(guī)律 正態(tài)分布的應(yīng)用1112例:密度函數(shù)和分布函數(shù) 拋兩枚硬幣,0.250.25AB0.25AB0.250.7

3、50.5PPPPPP兩枚均正面朝上兩枚均反面朝上正面反面朝上反面正面朝上至少有一枚正面朝上恰好有一枚正面朝上密度函數(shù)分布函數(shù)13例:密度函數(shù)和分布函數(shù)x14隨機(jī)變量的概率分布 概率函數(shù)(Probability Function),或者說概率密度函數(shù)(Probability Density Function) 、密度函數(shù)。 在統(tǒng)計(jì)學(xué)中,分布函數(shù)(Distribution Function)。說明變量取某些值的可能性。 當(dāng)變量的取值包括了所有可能的取值時(shí),分布函數(shù)為1。 密度函數(shù)和分布函數(shù)構(gòu)成某種分布(Distribution)15正態(tài)分布的概念及圖形(a)(b)(d)(c)16正態(tài)分布的概念及圖

4、形 Normal distribution Gauss發(fā)現(xiàn) 最早用于物理學(xué)、天文學(xué) Gaussian distribution17正態(tài)分布的概率密度函數(shù) 如果隨機(jī)變量X的概率密度函數(shù) 則稱X服從正態(tài)分布,記作XN(,2),其中, 為分布的均數(shù), 為分布的標(biāo)準(zhǔn)差。Xf Xe22()21()2 (- X +) 18正態(tài)分布圖示x0.1.2.3.4f(x)19方差相等、均數(shù)不等的正態(tài)分布圖示31221320均數(shù)相等、方差不等的正態(tài)分布圖示21331221正態(tài)分布的特征 單峰分布且峰在均數(shù)處; 以均數(shù)為中心,均數(shù)兩側(cè)完全對(duì)稱。 正態(tài)分布有兩個(gè)參數(shù)(parameter),即位置參數(shù)(均數(shù))和變異度參數(shù)(

5、標(biāo)準(zhǔn)差)。 有些指標(biāo)服從正態(tài)分布; 有些指標(biāo)本身不服從正態(tài)分布,但經(jīng)過數(shù)值變換之后服從正態(tài)分布。 正態(tài)曲線下的面積分布有一定的規(guī)律。 22標(biāo)準(zhǔn)正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution)是均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布。 記為N(0,1)。 標(biāo)準(zhǔn)正態(tài)分布是一條曲線。 概率密度函數(shù):uXe221()2 (- u +) 23圖5.4 一般正態(tài)分布變換成標(biāo)準(zhǔn)正態(tài)分布示意圖 24正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布 若 XN(,2),作變換: 則Z服從標(biāo)準(zhǔn)正態(tài)分布。 Z稱為標(biāo)準(zhǔn)正態(tài)離差(standard normal deviation)XZ25標(biāo)準(zhǔn)正態(tài)分布曲線下面積(Z)

6、 Z 0.00 0.02 0.04 0.06 0.08-3.00.0013 0.0013 0.0012 0.0011 0.0010-2.50.0062 0.0059 0.0055 0.0052 0.0049-2.00.0228 0.0217 0.0207 0.0197 0.0188-1.90.0287 0.0274 0.0262 0.0250 0.0239-1.60.0548 0.0526 0.0505 0.0485 0.0465-1.00.1587 0.1539 0.1492 0.1446 0.1401-0.50.3085 0.3015 0.2946 0.2877 0.2810 00.500

7、0 0.4920 0.4840 0.4761 0.46810Z26正態(tài)曲線下的面積規(guī)律 X軸與正態(tài)曲線所夾面積恒等于1 。 對(duì)稱區(qū)域面積相等。S(-, -X)S( +X,)S(-, -X)27正態(tài)曲線下的面積規(guī)律 對(duì)稱區(qū)域面積相等。S( -x1, -x2)-x1 -x2 +x2 + x1S( -x1, -x2)= S( +x1, +x2)28正態(tài)曲線下的面積規(guī)律 -4 -3 -2 -1 0 1 2 3 4 -3 -2 - + +2 +3 S(- , -3 )=0.0013S(- , -2 )=0.0228S(- , -1 )=0.1587S(- , )=0.5S(- , +3 )=0.9987

8、S(- , +2 )=0.9772S(- , +1 )=0.8413S(- , )=129正態(tài)曲線下的面積規(guī)律 -4 -3 -2 -1 0 1 2 3 4 -3 -2 - + +2 +3 1-S( -3 , +3 )=0.00261-S( -2 , +2 )=0.04561-S( - , + )=0.317430正態(tài)曲線下的面積規(guī)律 -4 -3 -2 -1 0 1 2 3 4 -3 -2 - + +2 +3 S(- , -3 )=0.0013S(- , -2 )=0.0228S(- , -1 )=0.1587S(- , )=0.5S(- , +3 )=0.9987S(- , +2 )=0.97

9、72S(- , +1 )=0.8413S(- , )=131正態(tài)曲線下的面積規(guī)律 正態(tài)分布的一個(gè)顯著特點(diǎn) 曲線下面積完全決定于以標(biāo)準(zhǔn)差為單位從點(diǎn)x到的離差。32231X2=-2X2X1=-1X1X3=-3X30.15870.15870.158733正態(tài)曲線下的面積規(guī)律 例5.1 求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間(-,1.96)的面積 (1) 先求區(qū)間(-,-1.96)的面積,查附表 ,得標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間(-,-1.96)的面積是0.0250 (2) 區(qū)間(-,1.96)的面積為1-(1.96,)的面積,即1-0.025=0.975 34例5.2 求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間(-,-2.58)的面積與

10、區(qū)間(2.58,)的面積 (-,-2.58)的面積是0.0049,約為0.5。區(qū)間(2.58,)的面積亦為0.5 正態(tài)曲線下的面積規(guī)律35例5.3 求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間(-1,1)的面積 區(qū)間(-1,1)的面積 1-2(-,-1)的面積 1-20.1587 0.6826 正態(tài)曲線下的面積規(guī)律36例5.4 求正態(tài)分布N(119.41,4.382)曲線下區(qū)間(110.83,127.99)內(nèi)的面積 先用求對(duì)應(yīng)的u值 uL = (110.83-119.41)/4.38 = -1.96 uU = (127.99-119.41)/4.38 = 1.96 查u界值表,得面積(-1.96,1.96)的面積

11、 1-2標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間(-,1.96)的面積 1-20.025 0.95 常用正態(tài)曲線下的面積規(guī)律37常用正態(tài)曲線下的面積規(guī)律-1.96+1.962.5%2.5%95%38常用正態(tài)曲線下的面積規(guī)律-1.64+1.645%5%90%39常用正態(tài)曲線下的面積規(guī)律-2.58+2.580.5%0.5%99%40正態(tài)曲線下的面積規(guī)律 正態(tài)曲線下面積總和為1; 正態(tài)曲線關(guān)于均數(shù)對(duì)稱;對(duì)稱的區(qū)域內(nèi)面積相等; 對(duì)任意正態(tài)曲線,按標(biāo)準(zhǔn)差為單位,對(duì)應(yīng)的面積相等; -1.64 +1.64內(nèi)面積為90%;-1.96 +1.96內(nèi)面積為95%;-2.58 +2.58內(nèi)面積為99%。415.1.4 正態(tài)分布的應(yīng)用

12、 正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ) 估計(jì)頻數(shù)分布( frequency distribution) (自學(xué)) 確定臨床參考值范圍(reference interval) (自學(xué))42作 業(yè) 閱讀內(nèi)容:(P51-54) 查閱文獻(xiàn),介紹某項(xiàng)參考值范圍(reference interval)的制定過程(最新進(jìn)展) 每人準(zhǔn)備5-10張ppt (中英文均可), 我會(huì)給你10-20分鐘時(shí)間.5.2 二項(xiàng)分布 二項(xiàng)生或死,這是個(gè)問題生男生女一個(gè)樣硬幣的正面和反面陰陽隔昏曉43什么樣的結(jié)局用二項(xiàng)分布來描述? 1. 對(duì)立的結(jié)果 2. 觀察單位的結(jié)果獨(dú)立 3. 發(fā)生某一結(jié)果的總體概率不變44伯努利試驗(yàn)伯努利試驗(yàn)(

13、Bernoulli trial)是只有兩種可能結(jié)果的單次隨機(jī)試驗(yàn),即對(duì)于一個(gè)隨機(jī)變量X而言, Pr(x=1)=p,Pr(x=0)=1-p . 5.2 主要內(nèi)容 5.2.1 二項(xiàng)分布的概率及定義 5.2.2 二項(xiàng)分布的性質(zhì) 5.2.3 二項(xiàng)分布的應(yīng)用條件455.2.1 二項(xiàng)分布的概念所有可能結(jié)果每種結(jié)果的概率 死亡數(shù) 生存數(shù)不同死亡數(shù)的概率甲 乙 丙 n-生 生 生0.20.20.2030.008生 生 死 0.20.20.8生 死 生0.20.80.2120.096死 生 生0.80.20.2生 死 死0.20.80.8死 生 死0.80.20.8210.384死 死 生0.80.80.2死

14、死 死0.80.80.8300.51211.000(1)Xn XXnC 三只小白鼠存亡的排列和組合方式及其概率的計(jì)算(1)n XX 46二項(xiàng)分布的概率 設(shè)事件A出現(xiàn)的概率為。則在n次獨(dú)立試驗(yàn)中,事件A恰好出現(xiàn) k 次的概率為: 對(duì)應(yīng)于二項(xiàng)展開式:()(1)kkn knP XkC 011110(1)(1)(1)(1) (1)(1)nnnkkn knnnnCn 47二項(xiàng)展開( 0.2 +0.8 )3 = 0.23 + 30.220.8 + 30.20.82 + 0.83生存概率死亡概率 三生二生一死一生二死 三死48累計(jì)概率P(Xk) = P(X=0)+P(X=1)+P(X=k)P(Xk) = P

15、(X=k)+P(X=k+1)+P(X=n)P(Xk) = 1 P(Xk+1)495.2.2 二項(xiàng)分布的性質(zhì)如果XB(n,p),則:的均數(shù):的均數(shù):的方差:的方差:的標(biāo)準(zhǔn)差:的標(biāo)準(zhǔn)差:2(1)(1)XXXnnn 50二項(xiàng)分布的圖形X 4 8 12 16 0.0 0.1 0.2 0.3 0.4 n =20 =0.5 P(X) 0 2 4 n =5 =0.3 0 2 4 6 n =10 =0.3 4 8 12 16 n =30 =0.3 51二項(xiàng)分布的應(yīng)用條件 各觀察單位的觀察結(jié)果只能是相互對(duì)立的兩種結(jié)果之一; 某事件出現(xiàn)的概率不變; n次試驗(yàn)條件相同, n個(gè)觀察對(duì)象同質(zhì),且相互之間不影響(例如,無

16、傳染性、聚集性等)。52二項(xiàng)分布的應(yīng)用53 計(jì)算二項(xiàng)結(jié)局事件的概率質(zhì)量控制疾病的家族聚集性二項(xiàng)分布與伯努利分布 伯努利分布伯努利分布(the Bernoulli distribution,又名兩點(diǎn)分布兩點(diǎn)分布或者0-1分布分布,是一個(gè)離散型概率分布,為紀(jì)念瑞士科學(xué)家雅各布伯努利而命名。) 若伯努利試驗(yàn)成功,則伯努利隨機(jī)變量取值為1。若伯努利試驗(yàn)失敗,則伯努利隨機(jī)變量取值為0。記其成功概率為批p,失敗概率為1-p。545.3 Poisson 分布 Life is good for only two things: to study mathematics and to teach it. Sim

17、on Denis Poisson1781184055何種結(jié)局需要poisson分布? 二項(xiàng)分布的極限分布不同地區(qū)的某慢性病比例數(shù)單位時(shí)間放射源釋放的原子數(shù)細(xì)菌培養(yǎng)中單位面積的菌落數(shù)單位時(shí)間你接到的電話或信息足球比賽的進(jìn)球數(shù)565.3 主要內(nèi)容 Poisson分布的定義 Poisson分布的性質(zhì) Poisson分布的應(yīng)用571 Poisson分布的概率 如果一個(gè)隨機(jī)變量X的取值為0,1,2,,且:則稱X服從參數(shù)為 的Poisson分布。記為X Poisson()。()!XP XkeX 58累計(jì)概率P(Xk) = P(X=0)+P(X=1)+P(X=k)P(Xk) = P(X=k)+P(X=k+1

18、)+P(Xk) = 1 P(X k) 59Poisson分布例1 單位容積內(nèi)細(xì)菌數(shù)服從Poisson分布。2.49。012.492.49232.492.49 452.492.492.492.49(0)0.082910, (1)0.2064460!1!2.492.49(2)0.257025,(3)0.2133312!3!2.492.49(4)0.132798, (5)0.0661344!5!(PePePePePePeP 62.492.496)0.0274456!(7)1(0)(1)(6)0.013911eP XPPP 60Poisson分布的遞推公式 eP)0()(1)1(XPXXP 61單位容

19、積內(nèi)細(xì)菌數(shù)的分布X觀察數(shù)概率理論頻數(shù)0260.08291024.91510.20644661.92840.25702577.13700.21333164.04420.13279839.85150.06613419.86 90.027445 8.2 7 30.013911 4.2合計(jì) 3001.000000 300.0062Poisson分布例2 2002年韓日世界杯64場(chǎng)比賽中,各隊(duì)進(jìn)球數(shù)有多有少。大部分是0,1,2個(gè)進(jìn)球,個(gè)別隊(duì)是5個(gè)以上進(jìn)球,最多的是8個(gè)進(jìn)球,平均是1.2578個(gè)/場(chǎng)/隊(duì)。雖然強(qiáng)隊(duì)大都能進(jìn)球、贏球(如巴西隊(duì)),弱隊(duì)大都不能進(jìn)球(如中國(guó)隊(duì))。但宏觀上來說,各隊(duì)進(jìn)球數(shù)服從Poi

20、sson分布!63平均計(jì)數(shù)為1.2578的Poisson分布每場(chǎng)各隊(duì)進(jìn)球數(shù) 場(chǎng)次 理論數(shù)03736.3914745.7722728.7831312.074 2 3.795 1 0.95 6 1 0.25 128128.00642.1 Poisson分布的均數(shù)和方差如果XPoisson(),則:的均數(shù):的均數(shù):的方差:的方差:的標(biāo)準(zhǔn)差:的標(biāo)準(zhǔn)差:2XXX 65Poisson分布的兩個(gè)實(shí)例的均數(shù)和標(biāo)準(zhǔn)差 例1資料的均數(shù)和方差:均數(shù)2.490, 方差=2.257 例2資料的均數(shù)和方差:均數(shù)1.2578, 方差=1.2247662.2 Poisson分布的圖形 P(X) X 0 4 8 0 4 8 12 4 8 12 16 20 8 12 16 20 24 28 32 0.0 0.1 0.2 =3 =5 =10 =20 67Poisson分布中均數(shù)的 抽樣分布及其性質(zhì) 在足夠大時(shí),Poisson分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論