衛(wèi)生統(tǒng)計(jì)學(xué)基本分布課件_第1頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)基本分布課件_第2頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)基本分布課件_第3頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)基本分布課件_第4頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)基本分布課件_第5頁(yè)
已閱讀5頁(yè),還剩64頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章基本分布

Oct20,2009第一節(jié)隨機(jī)變量及其分布

一、隨機(jī)變量(randomvariable)

隨機(jī)現(xiàn)象,也稱不確定現(xiàn)象,指在相同條件下重復(fù)試驗(yàn)可得到不同結(jié)果的現(xiàn)象。必然現(xiàn)象,也稱確定性現(xiàn)象隨機(jī)試驗(yàn)所得到的每一種可能的結(jié)果稱為隨機(jī)事件。數(shù)學(xué)上可用一個(gè)變量,如X來(lái)描述,稱為隨機(jī)變量。隨機(jī)變量的每一取值一般都有確定的概率,如P(治愈)=P(X=1)=0.60等。因此每一隨機(jī)變量都有一定的概率分布,其分布的類型有兩種,即離散型分布和連續(xù)型分布。Oct20,20091、離散型隨機(jī)變量(discreterandomvariable)隨機(jī)變量X只能取有限個(gè)數(shù)值X1,X2,…,Xn或無(wú)限個(gè)可數(shù)數(shù)值X1,X2…,Xn…,則X定義為離散型隨機(jī)變量。當(dāng)X=Xk,概率為P(Xk)則有隨機(jī)變量的概率分布Oct20,20092、連續(xù)型隨機(jī)變量(continuousrandomvariable)像某地某年正常成年男子身高這樣的隨機(jī)變量,由于其可能取值不能一一列舉出來(lái),而是在實(shí)數(shù)軸上的某一確定區(qū)間內(nèi)連續(xù)分布,稱之為連續(xù)分布型隨機(jī)變量,簡(jiǎn)稱連續(xù)型隨機(jī)變量。隨機(jī)變量X的分布函數(shù)F(x)為:概率密度函數(shù)f(x):表示隨機(jī)變量X在取值X附近單位長(zhǎng)度內(nèi)的概率的大小。為分布函數(shù)F(x)的導(dǎo)數(shù)。所以,對(duì)于連續(xù)型隨機(jī)變量來(lái)說(shuō),要掌握其概率分布規(guī)律,其關(guān)鍵是求出其概率密度函數(shù)。Oct20,2009第二節(jié)正態(tài)分布

Oct20,2009正態(tài)分布曲線的演變

頻率5-2a1251291331371411451491531571610.1.2.3.4身高(cm)5-2bOct20,2009正態(tài)分布的特性正態(tài)分布只有一個(gè)峰值,位于x=

處正態(tài)分布以x=

對(duì)稱軸左右對(duì)稱正態(tài)分布的兩個(gè)參數(shù)

決定分布位置和形狀正態(tài)分布曲線下面積分布有規(guī)律Oct20,2009Oct20,2009對(duì)于正態(tài)分布常用x~N(,)Oct20,2009標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)化變換:

X~N(μ,σ)標(biāo)準(zhǔn)化變換:令μ=0,

σ=1

標(biāo)準(zhǔn)正態(tài)分布:u~N(0,1)Oct20,2009Oct20,2009Oct20,2009Oct20,2009

D=0.6646-0.1989=0.4657=46.57%

(u1)=(-0.8511)=0.1989(u2)=(0.4255)=1-(-0.4255)=1-0.3354=0.6646

Oct20,2009三、參考值范圍定義:絕大多數(shù)正常人的解剖,生理,生化各種指標(biāo)的波動(dòng)范圍,稱作為醫(yī)學(xué)參考值范圍(medicalreferenceranges)。正常人:并非指機(jī)體任何器官、組織的形態(tài)和機(jī)能都正常的人,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的人Oct20,2009正態(tài)分布法當(dāng)資料符合正態(tài)分布時(shí)雙側(cè)1-α正常值范圍公式為:?jiǎn)蝹?cè)上限1-α正常值范圍公式為:<單側(cè)下限1-α正常值范圍公式為:>Oct20,2009u界值的概念

uα/2為標(biāo)準(zhǔn)正態(tài)分布下雙側(cè)尾部面積為α?xí)r的u值(絕對(duì)值)u2為標(biāo)準(zhǔn)正態(tài)分布下單側(cè)尾部面積為α?xí)r的u值(絕對(duì)值)特別地:u0.05/2=1.96;

u0.01/2=2.58;

u0.05=1.64;

u0.01=2.33;Oct20,2009Oct20,2009百分位數(shù)法用于任何分布的資料(n>150)。當(dāng)資料為偏態(tài)分布時(shí),不能用正態(tài)分布法,而用百分位數(shù)法得到1-α正常值范圍雙側(cè)1-α正常值范圍:P100α/2~P

100(1-α/2)

單側(cè)1-α正常值范圍上限:<P

100(1-α)

單側(cè)1-α正常值范圍下限:>P

100αOct20,2009Oct20,2009樣本均數(shù)分布和抽樣誤差大小的估計(jì)Oct20,2009抽樣試驗(yàn)?zāi)呈?999年18歲男生身高服從均數(shù)μ=167.7cm,σ=5.3cm的正態(tài)分布;從X~N(167.7,5.32)的正態(tài)總體中隨機(jī)抽樣,樣本含量nj=10,g=100;共抽100次;Oct20,2009圖3.11999年某市18歲男生身高

N(167.7,5.32)的抽樣示意μ=167.7cmσ=5.3cmX1,X2,X3…Xj…,

167.41,2.74165.56,6.57168.20,5.36:165.69,5.09100個(gè)Oct20,2009樣本均數(shù)組成一個(gè)新的分布特點(diǎn)各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)間存在差異;樣本均數(shù)的分布很有規(guī)律;,100個(gè)樣本均數(shù)的均數(shù)為167.69cm,而原總體均數(shù)為167.7cm樣本均數(shù)的變異范圍較原變量的變異范圍大大縮小;標(biāo)準(zhǔn)差為1.69(5.3);

Oct20,2009中心極限定理若服從正態(tài)分布,則服從正態(tài)分布;;若不服從正態(tài)分布,n較大則服從正態(tài)分布;;n較小,為非正態(tài)分布;Oct20,2009標(biāo)準(zhǔn)誤:估計(jì)抽樣誤差大小的指標(biāo)標(biāo)準(zhǔn)誤(standarderror,SE):樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差;樣本均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean,SEM):;樣本均數(shù)的標(biāo)準(zhǔn)誤的估計(jì)值:Oct20,2009例2000年某研究者隨機(jī)調(diào)查某地健康成年男子27人,得到血紅蛋白含量的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試估計(jì)該樣本均數(shù)的抽樣誤差。Oct20,2009均數(shù)標(biāo)準(zhǔn)誤的含義反映均數(shù)抽樣誤差大小的一個(gè)指標(biāo);均數(shù)的標(biāo)準(zhǔn)誤與原分布的標(biāo)準(zhǔn)差成

正比,與抽樣樣本量n開(kāi)根號(hào)成反比;欲減少抽樣誤差,可增加樣本量;利用均數(shù)標(biāo)準(zhǔn)誤可以進(jìn)行總體均數(shù)的可信區(qū)間的估計(jì)和假設(shè)檢驗(yàn)。Oct20,2009二、t分布(t—distribution)t分布的由來(lái)t分布的圖形和特征t界值表Oct20,2009

標(biāo)準(zhǔn)正態(tài)變換X0,1ut變換0t抽樣實(shí)驗(yàn)

t分布的由來(lái)XOct20,2009t分布圖形的演變Oct20,2009

t分布圖形的演變Oct20,2009t分布圖形的特征單峰分布,以0為中心,左右對(duì)稱只有一個(gè)參數(shù)ν(自由度n-1),

ν越小,則t值越分散,峰部越矮而尾部翹得越高當(dāng)ν逼近∞時(shí),t分布逼近u分布Oct20,2009t分布圖形下面積具有規(guī)律性總面積為1;任意兩區(qū)間的面積都可以用積分的方法求出;當(dāng)單雙側(cè)確定時(shí),自由度ν確定時(shí),尾部面積(α)與橫軸t值之間有一一對(duì)應(yīng)的關(guān)系;tα/2,ν表示雙側(cè)尾部面積為α,自由度為ν時(shí)的t界值;tα,ν表示單側(cè)尾部面積為α,自由度為ν時(shí)的t界值;Oct20,2009Oct20,2009t界值表的特點(diǎn)表示在單雙側(cè)確定時(shí),自由度ν確定時(shí),t界值越大,外圍面積(P)越?。环粗嗳?;單雙側(cè)確定時(shí),外圍面積(α或P)確定時(shí),自由度ν越大,t界值越小,當(dāng)ν→∞時(shí),t=u;t0.05/2,∞=1.96;t0.01/2,∞=2.58Oct20,2009第四節(jié)二項(xiàng)分布(binomialdistribution)Oct20,2009Bernoulli試驗(yàn)以A表示所感興趣的事件,A事件發(fā)生稱為“成功”,不出現(xiàn)稱為“失敗”。相應(yīng)的這類試驗(yàn)稱作為“成一敗型”試驗(yàn)或Bernoulli試驗(yàn)。Oct20,2009Bernoulli試驗(yàn)滿足條件(1)每次試驗(yàn)結(jié)果只能是兩個(gè)互斥結(jié)果之一(A或非A)。(2)每次試驗(yàn)的條件不變,每次試驗(yàn)結(jié)果A事件發(fā)生的概率為常數(shù)。(3)各次試驗(yàn)獨(dú)立,即每次試驗(yàn)出現(xiàn)事件A的概率與前面各次試驗(yàn)出現(xiàn)的結(jié)果無(wú)關(guān)。Oct20,2009二項(xiàng)分布的概念n次重復(fù)獨(dú)立試驗(yàn)(Bernoulli試驗(yàn)),當(dāng)每次試驗(yàn)的“陽(yáng)性概率”保持不變時(shí),出現(xiàn)“陽(yáng)性”的次數(shù)k=0,1,2…,n的一種概率分布。,k=0,1,2,…n

n為試驗(yàn)例數(shù),k為陽(yáng)性次數(shù),

π為陽(yáng)性率,

Oct20,2009當(dāng)n和不同時(shí),二項(xiàng)分布的概率是不同的,所以說(shuō)n和是二項(xiàng)分布的兩個(gè)重要參數(shù)。如果隨機(jī)變量x服從以n和為參數(shù)的二項(xiàng)分布,則記作x~B(n,)。Oct20,2009二項(xiàng)分布的概率計(jì)算

恰好有k例陽(yáng)性數(shù)的概率為最多發(fā)生k例,即xk的累計(jì)概率為最少發(fā)生k例,即xk的累計(jì)概率二項(xiàng)分布概率的遞推公式為Oct20,2009二項(xiàng)分布的概率計(jì)算例題例5-7據(jù)報(bào)道,對(duì)某藥有10%的人有胃腸道反應(yīng)。為考察某藥廠產(chǎn)品質(zhì)量隨機(jī)抽取5人服用此藥,試求:(1)3人有反應(yīng)的概率(2)最多2人有反應(yīng)的概率(3)有人有反應(yīng)的概率Oct20,2009二項(xiàng)分布的性質(zhì)

Oct20,20092、二項(xiàng)分布的正態(tài)近似(normalapproximation)

Oct20,2009概率論中的中心極限定理證明:當(dāng)n足夠大時(shí),且不接近于0也不接近于1時(shí),且n和n(1-)≥5,二項(xiàng)分布x~B(n,)近似于正態(tài)分布N(n,)。Oct20,2009樣本率的分布和正態(tài)近似

Oct20,2009樣本率的分布和正態(tài)近似例5-9從陽(yáng)性率樣本率=0.6的總體中隨機(jī)抽取樣本量為16的樣本,求樣本率p的均數(shù)和標(biāo)準(zhǔn)差。樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。同樣樣本率的標(biāo)準(zhǔn)差也稱為率的標(biāo)準(zhǔn)誤,它描述了樣本率抽樣誤差的大小。Oct20,2009樣本率的分布和正態(tài)近似樣本率分布的正態(tài)近似當(dāng)樣本量n較大,總體率不接近于0也不接近1時(shí),且n和n(1-)≥5,樣本陽(yáng)性率也近似服從正態(tài)分布p~N(,)。事實(shí)上,總體率,一般是不知道的,往往用p來(lái)估計(jì),用樣本率的標(biāo)準(zhǔn)誤的估計(jì)值來(lái)估計(jì)。

Oct20,2009Oct20,2009第四節(jié)泊松分布(poissondistribution)

是一種典型的離散型隨機(jī)變量的分布,主要用于描述事件出現(xiàn)概率很小而樣本含量或試驗(yàn)次數(shù)很大的隨機(jī)變量的概率分布。當(dāng)n->∞,P≤0.05時(shí),這時(shí)二項(xiàng)分布向泊松分布逼近;泊松分布用來(lái)分析醫(yī)學(xué)上人群中遺傳缺陷、癌癥等發(fā)病率很低的非傳染性疾病的發(fā)病或患病人數(shù)的分布;也可用于研究單位時(shí)間、空間、容積內(nèi)某罕見(jiàn)時(shí)間發(fā)生次數(shù)的分布;Oct20,2009Poisson分布是二項(xiàng)分布的特例,由于這時(shí)n特別大,p特別小,在數(shù)學(xué)上用二項(xiàng)分布計(jì)算n次重復(fù)獨(dú)立試驗(yàn)(Bernoulli試驗(yàn)),出現(xiàn)“陽(yáng)性”的次數(shù)X=0,1,2…,n的概率變得十分困難,所以,可以通過(guò)Poisson分布近似計(jì)算出現(xiàn)“陽(yáng)性”次數(shù)X概率值如已知2000年上海市10萬(wàn)婦女人群中乳腺癌的發(fā)病人數(shù)為40人(=0.0004),計(jì)算某小區(qū)10萬(wàn)人中剛好出現(xiàn)50人的概率?Oct20,2009二項(xiàng)分布的概率公式可推導(dǎo)出泊松分布的概率計(jì)算公式為:

為單位時(shí)間(空間)稀有事件的發(fā)生數(shù)(陽(yáng)性數(shù))的總體均數(shù).二項(xiàng)分布當(dāng)n很大而很小時(shí)即逼近于參數(shù)λ=n×的泊松分布,記做xP()Oct20,2009Oct20,2009泊松分布的概率計(jì)算

泊松分布概率計(jì)算的遞推公式:Oct20

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論