




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
關(guān)于總體均數(shù)和總體率第一頁,共六十二頁,編輯于2023年,星期一第一節(jié)均數(shù)抽樣誤差與t分布欲了解總體的特征,最直接的方法是對總體中的每個觀察單位進(jìn)行測量,通過整理分析得到總體參數(shù),但這在醫(yī)學(xué)研究實(shí)際中往往是不可能實(shí)現(xiàn)的。通常應(yīng)用抽樣研究,通過樣本指標(biāo)來了解總體特征。第二頁,共六十二頁,編輯于2023年,星期一抽樣研究所得樣本均數(shù)會不會恰好等于未知的總體均數(shù)呢?如果固定樣本含量n從同一總體中進(jìn)行多次抽樣,所得樣本均數(shù)又會如何呢?第三頁,共六十二頁,編輯于2023年,星期一假設(shè)已知某地30歲-40歲正常男性血清總膽固醇的均值為5.0mmol/L,標(biāo)準(zhǔn)差為0.6mmol/L。現(xiàn)從該總體中進(jìn)行隨機(jī)抽樣,每次抽取30名正常男子,并測得他們的血清總膽固醇水平,最終共抽取100份樣本,并計算出每份樣本的均數(shù)。第四頁,共六十二頁,編輯于2023年,星期一第五頁,共六十二頁,編輯于2023年,星期一由個體變異產(chǎn)生的,隨機(jī)抽樣引起的樣本統(tǒng)計量與總體參數(shù)之間的差異稱為抽樣誤差(samplingerror)。抽樣造成的樣本均數(shù)與總體均數(shù)間的差異就稱為均數(shù)的抽樣誤差。在抽樣研究中,抽樣誤差是不可避免的,但抽樣誤差分布具有一定的規(guī)律性。第六頁,共六十二頁,編輯于2023年,星期一圖3-1從正態(tài)分布總體N(5.0,0.62)中隨機(jī)抽樣所得樣本均數(shù)的分布第七頁,共六十二頁,編輯于2023年,星期一樣本均數(shù)大部分分布在總體均數(shù)5.0的左右,中間多、兩邊少,左右基本對稱,服從正態(tài)分布,并且樣本均數(shù)的變異范圍比原變量的變異范圍要小很多。第八頁,共六十二頁,編輯于2023年,星期一樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤,簡稱標(biāo)準(zhǔn)誤,用符號表示。均數(shù)的標(biāo)準(zhǔn)誤說明各樣本均數(shù)圍繞總體均數(shù)的離散程度,可用來反映樣本均數(shù)的抽樣誤差大小。第九頁,共六十二頁,編輯于2023年,星期一中心極限定理從正態(tài)總體N(,2)中,隨機(jī)抽取例數(shù)為n的樣本,樣本均數(shù)也服從正態(tài)分布;即使從偏態(tài)總體隨機(jī)抽樣,當(dāng)n足夠大時(n≥50),樣本均數(shù)近似正態(tài)分布。第十頁,共六十二頁,編輯于2023年,星期一從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)或偏態(tài)總體中,抽取例數(shù)為n的樣本,樣本均數(shù)的總體均數(shù)也為,標(biāo)準(zhǔn)差與原標(biāo)準(zhǔn)差成正比,與樣本例數(shù)的平方根成反比。第十一頁,共六十二頁,編輯于2023年,星期一第十二頁,共六十二頁,編輯于2023年,星期一越大,樣本均數(shù)的分布越分散,樣本均數(shù)與總體均數(shù)的差別越大,抽樣誤差越大,由樣本均數(shù)估計總體均數(shù)的可靠性越小。反之,越小,樣本均數(shù)的分布越集中,樣本均數(shù)與總體均數(shù)的差別越小,抽樣誤差越小,由樣本均數(shù)估計總體均數(shù)的可靠性越大。第十三頁,共六十二頁,編輯于2023年,星期一的大小與成正比,與成反比。當(dāng)固定不變時,樣本含量n增大,減小。因此,在實(shí)際工作中,可通過適當(dāng)增加樣本含量來減小抽樣誤差。第十四頁,共六十二頁,編輯于2023年,星期一常未知,用S估計,因此均數(shù)標(biāo)準(zhǔn)誤的估計值為第十五頁,共六十二頁,編輯于2023年,星期一t分布的演化第十六頁,共六十二頁,編輯于2023年,星期一常未知,若用,這時對樣本均數(shù)進(jìn)行的不是Z變換而是t變換統(tǒng)計量t不再服從N(0,1)標(biāo)準(zhǔn)正態(tài)分布第十七頁,共六十二頁,編輯于2023年,星期一英國統(tǒng)計學(xué)家W.S.Gosset于1908年以“Student”筆名發(fā)表論文,證明統(tǒng)計量t服從v=n-1的t分布第十八頁,共六十二頁,編輯于2023年,星期一又稱為Studentt分布(Student’st-distribution)第十九頁,共六十二頁,編輯于2023年,星期一t分布的圖形及特征第二十頁,共六十二頁,編輯于2023年,星期一t分布的特征為:①以0為中心,左右對稱的單峰分布②越小,t值越分散,峰越矮,尾越高增大,t分布逐漸逼近Z分布,時,t分布即為Z分布第二十一頁,共六十二頁,編輯于2023年,星期一t
界值表橫標(biāo)目:自由度縱標(biāo)目:概率P(曲線下面積)表中數(shù)字:自由度為,概率P為時,所對應(yīng)的t界值,記為t,
第二十二頁,共六十二頁,編輯于2023年,星期一單側(cè):或雙側(cè):即第二十三頁,共六十二頁,編輯于2023年,星期一在相同自由度時,t的絕對值越大,P越小在相同P值時,自由度越大所對應(yīng)的t界值越小在相同t值時,雙側(cè)概率P為單側(cè)概率P的兩倍時,t界值即為Z界值第二十四頁,共六十二頁,編輯于2023年,星期一第二節(jié)總體均數(shù)的點(diǎn)估計與區(qū)間估計點(diǎn)估計(pointestimation):將樣本統(tǒng)計量直接作為總體參數(shù)的估計值區(qū)間估計(intervalestimation):按事先給定的概率,估計包含未知總體參數(shù)的一個可能范圍第二十五頁,共六十二頁,編輯于2023年,星期一區(qū)間估計的實(shí)質(zhì)假設(shè)某個總體的均數(shù)為,需要找到兩個量A和B,使得在一個比較高的可信度下(如95%),區(qū)間(A,B)能包含
。即P(A<<B)=0.95第二十六頁,共六十二頁,編輯于2023年,星期一可信區(qū)間的定義按一定的概率或可信度(1-α)估計包含未知總體參數(shù)的可能范圍,該范圍通常稱為參數(shù)的可信區(qū)間或者置信區(qū)間(confidenceinterval,CI),預(yù)先給定的概率(1-α)稱為可信度或者置信度(confidencelevel),常取95%或99%可信區(qū)間(CL,CU)為開區(qū)間,CL、CU稱可信限第二十七頁,共六十二頁,編輯于2023年,星期一總體均數(shù)可信區(qū)間的計算當(dāng)σ已知在總體中抽樣,樣本均數(shù)的Z變換值有95%可能性落在(-1.96,1.96)之間在總體中抽樣,樣本均數(shù)所計算的區(qū)間有95%可能包括總體均數(shù)第二十八頁,共六十二頁,編輯于2023年,星期一2.5%2.5%95%第二十九頁,共六十二頁,編輯于2023年,星期一
未知但n足夠大(n>50)第三十頁,共六十二頁,編輯于2023年,星期一例6-3中,因n=120,,,試求該地正常成年男性血清膽固醇平均水平的95%可信區(qū)間。即(3.55,4.17)mmol/L第三十一頁,共六十二頁,編輯于2023年,星期一例6-1從某地隨機(jī)抽取120名30歲-40歲正常男性,得其血清總膽固醇水平的均數(shù)為4.95mmol/L,標(biāo)準(zhǔn)差為0.64mmol/L,試估計該地30歲-40歲正常男性血清總膽固醇平均水平的95%可信區(qū)間。第三十二頁,共六十二頁,編輯于2023年,星期一因n=120,屬于未知但n足夠大,又均數(shù)為4.95mmol/L,標(biāo)準(zhǔn)差為0.64mmol/L,故該地30歲-40歲正常男性血清總膽固醇平均水平的95%可信區(qū)間為即(4.84,5.06)mmol/L第三十三頁,共六十二頁,編輯于2023年,星期一當(dāng)σ未知n較小-t/2,v0t/2,v
第三十四頁,共六十二頁,編輯于2023年,星期一可信區(qū)間的涵義從總體中作隨機(jī)抽樣,每個樣本可以算得一個可信區(qū)間。如95%可信區(qū)間意味著做100次抽樣,算得100個可信區(qū)間,平均有95個估計正確。在實(shí)際研究中,一般只進(jìn)行一次抽樣,算得一個可信區(qū)間,對于這個可信區(qū)間來說,我們就認(rèn)為該區(qū)間包含了總體均數(shù),把握度為95%。第三十五頁,共六十二頁,編輯于2023年,星期一圖6-5從N(0,1)中隨機(jī)抽樣算得的100個95%可信區(qū)間(n=10)第三十六頁,共六十二頁,編輯于2023年,星期一可信區(qū)間的兩個要素可信度:可靠性,即1-α。一般取90%、95%,可人為控制區(qū)間的寬度:區(qū)間的大?。▍^(qū)間的長度),越小越好必須二者兼顧第三十七頁,共六十二頁,編輯于2023年,星期一均數(shù)的可信區(qū)間與參考值范圍的區(qū)別第三十八頁,共六十二頁,編輯于2023年,星期一第三節(jié)總體率的點(diǎn)估計與區(qū)間估計第三十九頁,共六十二頁,編輯于2023年,星期一一、二項(xiàng)分布如某實(shí)驗(yàn)中小白鼠染毒后死亡概率P為0.8,則生存概率為=1-P=0.2,1、對一只小白鼠進(jìn)行實(shí)驗(yàn)的結(jié)果為:死(概率為P)或生(概率為1-P)2、對二只小白鼠(甲乙)進(jìn)行實(shí)驗(yàn)的結(jié)果為:甲乙均死(概率為P2)、甲死乙生[概率為P(1-P)]、乙死甲生[概率為(1-P)P]或甲乙均生[概率為(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]23、依此類推,對n只小白鼠進(jìn)行實(shí)驗(yàn),所有可能結(jié)果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n其中n為樣本含量,即事件發(fā)生總數(shù),x為某事件出現(xiàn)次數(shù),cnxPx(1-P)n-x為二項(xiàng)式通式,cnx=n!/x!(n-x)!,P為總體率。因此,二項(xiàng)分布是說明結(jié)果只有兩種情況的n次實(shí)驗(yàn)中發(fā)生某種結(jié)果為x次的概率分布。其概率密度為:
P(x)=cnxPx(1-P)n-x,x=0,1,...n。:第四十頁,共六十二頁,編輯于2023年,星期一二項(xiàng)分布的圖形第四十一頁,共六十二頁,編輯于2023年,星期一當(dāng)=0.5時,分布對稱;當(dāng)
0.5,分布呈偏態(tài);當(dāng)<0.5時分布呈正偏態(tài);當(dāng)>0.5時分布呈負(fù)偏態(tài);特別是當(dāng)n值不是很大時,偏離0.5愈遠(yuǎn),分布愈偏第四十二頁,共六十二頁,編輯于2023年,星期一隨著n的增大,二項(xiàng)分布逐漸逼近正態(tài)分布。如
=0.30,n=5和n=10時,圖形呈偏態(tài),當(dāng)n=30時,圖形已接近正態(tài)分布。一般地說,如果n或n(1-)大于5時,??捎谜龖B(tài)近似原理處理二項(xiàng)分布問題第四十三頁,共六十二頁,編輯于2023年,星期一二項(xiàng)分布的性質(zhì):累積概率(1)二項(xiàng)分布的概率之和等于1第四十四頁,共六十二頁,編輯于2023年,星期一(2)單側(cè)累積概率至多有m例陽性的概率(下側(cè)累積概率)至少有m例陽性的概率(上側(cè)累積概率)第四十五頁,共六十二頁,編輯于2023年,星期一二項(xiàng)分布的性質(zhì):均數(shù)和方差陽性結(jié)果發(fā)生數(shù)X的總體均數(shù)總體方差總體標(biāo)準(zhǔn)差第四十六頁,共六十二頁,編輯于2023年,星期一二項(xiàng)分布的抽樣分布及其性質(zhì)二項(xiàng)分布的隨機(jī)抽樣性質(zhì)仍然被中心極限定理所反映在n足夠大時,樣本率近似服從正態(tài)分布樣本率p的均數(shù)等于π樣本率p的標(biāo)準(zhǔn)差(率的標(biāo)準(zhǔn)誤)第四十七頁,共六十二頁,編輯于2023年,星期一二、Poisson分布當(dāng)二項(xiàng)分布中n很大,p很小時,二項(xiàng)分布就變?yōu)镻oisson分布,Poisson分布實(shí)際上是二項(xiàng)分布的極限分布法國數(shù)學(xué)家SimeonDenisPoisson(1781-1840)1837年在《關(guān)于判斷的概率之研究》一文中提出的描述隨機(jī)現(xiàn)象的一種常用分布第四十八頁,共六十二頁,編輯于2023年,星期一Poisson分布也是一種重要的離散型概率分布,用于研究單位時間、單位人群、單位空間內(nèi),某稀有事件發(fā)生次數(shù)的分布單位體積水中細(xì)菌數(shù)單位體積空氣中粉塵數(shù)單位時間內(nèi)放射性物質(zhì)放射出的質(zhì)點(diǎn)數(shù)單位空間中某些昆蟲數(shù)一定人群中惡性腫瘤或罕見非傳染性疾病患病數(shù)或死亡數(shù)第四十九頁,共六十二頁,編輯于2023年,星期一可以認(rèn)為滿足以下三個條件的隨機(jī)變量服從Poisson分布:平穩(wěn)性:X的取值與觀察單位的位置無關(guān),只與觀察單位的大小有關(guān)獨(dú)立性:在某個觀察單位上X的取值與前面各觀察單位上X的取值獨(dú)立(無關(guān))普通性:在充分小的觀察單位上X的取值最多為1第五十頁,共六十二頁,編輯于2023年,星期一Poisson分布的概率函數(shù)若隨機(jī)變量的概率函數(shù)為:則稱此變量服從Poisson分布,記為第五十一頁,共六十二頁,編輯于2023年,星期一Poisson分布的累計概率第五十二頁,共六十二頁,編輯于2023年,星期一Poisson分布的圖形第五十三頁,共六十二頁,編輯于2023年,星期一Poisson分布的性質(zhì)均數(shù)和方差Poisson分布的均數(shù)和方差相等,均為λ
;即第五十四頁,共六十二頁,編輯于2023年,星期一Poisson分布中均數(shù)的抽樣分布及其性質(zhì)在λ足夠大時,Poisson分布的平均計數(shù)近似正態(tài)分布平均計數(shù)的標(biāo)準(zhǔn)誤n=1時(1個單位),第五十五頁,共六十二頁,編輯于2023年,星期一三、總體率的估計根據(jù)樣本率,也可以對總體率做出點(diǎn)估計和區(qū)間估計。我們用樣本率p作為總體率π的點(diǎn)估計值。總體率的點(diǎn)估計亦未考慮其抽樣誤差大小,而總體率的區(qū)間估計克服了點(diǎn)估計的缺陷。第五十六頁,共六十二頁,編輯于2023年,星期一利用樣本資料可估計二項(xiàng)分布總體率的1-α可信區(qū)間,α取0.05或0.01。對于,且接近于0或1時,可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安裝分包施工合同
- 綠色環(huán)保建筑工地安全管理制度
- 《自然環(huán)境保護(hù):高中生物地理教學(xué)教案》
- 委托活動代理服務(wù)協(xié)議書
- 重要會議紀(jì)要的編制要點(diǎn)與范例
- 船舶修理維護(hù)合同7篇
- 摩托車轉(zhuǎn)讓協(xié)議合同與摩托車過戶轉(zhuǎn)讓協(xié)議6篇
- 第三方供餐合同8篇
- 2025年銀川貨運(yùn)從業(yè)資格證考試模擬題及答案
- 2023年新高考全國乙卷語文真題(原卷版)
- 兒童家長非免疫規(guī)劃疫苗猶豫量表的編制及信效度檢驗(yàn)
- 咖啡店飲品配方保密協(xié)議
- 2025年岳陽市岳陽樓區(qū)招考網(wǎng)格管理員高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年中國融通資產(chǎn)管理集團(tuán)限公司春季招聘(511人)高頻重點(diǎn)提升(共500題)附帶答案詳解
- AIAG手冊FMEA第四版資料
- 2025下半年江蘇鹽城廣播電視總臺招聘7人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年纖維混合絮片項(xiàng)目可行性研究報告
- 白油供貨合同范例
- 建設(shè)項(xiàng)目非重大變動及環(huán)??尚行哉撟C報告
- 國外綠地發(fā)展-形成38課件講解
- 2025年湘教版初中地理七年級下冊重點(diǎn)知識點(diǎn)梳理與歸納
評論
0/150
提交評論