版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
多元統(tǒng)計(jì)與軟件應(yīng)用研究生教學(xué)用書/教育部學(xué)位管理與研究生教育司推薦
醫(yī)
學(xué)
統(tǒng)
計(jì)
學(xué)(第三版)
出版日:2010-08-01
孫振球主編徐勇勇副主編課程安排
72學(xué)時(shí)
4~17周,每周6學(xué)時(shí)(星期一、日)考試時(shí)間另行通知由衛(wèi)生部教材辦和全國(guó)高等醫(yī)藥教材建設(shè)研究會(huì)規(guī)劃的研究生教材《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》于2010年8月(第三版)出版以來,為全國(guó)大多數(shù)高等醫(yī)藥院校選用,反映良好。2002年8月(第一版)2005年8月(第二版)2010年8月(第三版)2014年(第四版)講授內(nèi)容內(nèi)容提要第一節(jié)概述第二節(jié)醫(yī)學(xué)統(tǒng)計(jì)資料的來源與分類第三節(jié)統(tǒng)計(jì)學(xué)常用的基本概念第四節(jié)統(tǒng)計(jì)工作的基本步驟第五節(jié)統(tǒng)計(jì)學(xué)發(fā)展簡(jiǎn)史統(tǒng)計(jì)學(xué)(statistics)統(tǒng)計(jì)學(xué)是關(guān)于數(shù)據(jù)(data)的科學(xué),是從數(shù)據(jù)中提取信息的一門學(xué)科,包括設(shè)計(jì)、搜集、整理、分析和表達(dá)等步驟。第一節(jié)概述1.采用統(tǒng)計(jì)學(xué)方法,發(fā)現(xiàn)不確定現(xiàn)象背后隱藏的規(guī)律。變異(variation)是社會(huì)和生物醫(yī)學(xué)中的普遍現(xiàn)象。變異使得實(shí)驗(yàn)或觀察的結(jié)果具有不確定性,如每個(gè)人的身高、體重、血壓等各有不同。
為什么要學(xué)統(tǒng)計(jì)學(xué)?
最大值=6.18,最小值=3.29,極差=2.89。算術(shù)均數(shù)=4.72,標(biāo)準(zhǔn)差=0.57。2.用統(tǒng)計(jì)學(xué)思維方式考慮有關(guān)醫(yī)學(xué)研究中的問題
“陽(yáng)性”結(jié)果是否是虛假聯(lián)系?某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效?
“陰性”結(jié)果是否是樣本含量不足?
有人曾對(duì)發(fā)表在Lancet,NEnglJMed,JAMA等著名醫(yī)學(xué)雜志上的71篇陰性結(jié)果的論文作過分析,發(fā)現(xiàn)其中有62篇(93%)可能是由于樣本含量不足造成的假陰性。
JAMA,新英格蘭醫(yī)學(xué)雜志(NEJM)、英國(guó)醫(yī)學(xué)雜志、中華醫(yī)學(xué)會(huì)雜志對(duì)來稿都有統(tǒng)計(jì)學(xué)要求或統(tǒng)計(jì)學(xué)指導(dǎo)。國(guó)際生物醫(yī)學(xué)雜志編輯協(xié)會(huì)在其《生物醫(yī)學(xué)期刊投稿的統(tǒng)一要求》中也包含了統(tǒng)計(jì)學(xué)要求。UniformRequirementsforManuscripts
SubmittedtoBiomedicalJournals
http://4.獲得循證醫(yī)學(xué)證據(jù)的主要手段“良好愿望的醫(yī)學(xué)”(well-meaningmedicine)轉(zhuǎn)入“以證據(jù)為基礎(chǔ)的醫(yī)學(xué)”(evidence-basedmedicine,EBM)需要有統(tǒng)計(jì)學(xué)方法的支持。
全世界的醫(yī)學(xué)期刊每年大約刊登600萬(wàn)學(xué)術(shù)論文,但能作為可靠“證據(jù)”的論文并不多。
二、統(tǒng)計(jì)數(shù)據(jù)的分類只有認(rèn)識(shí)了數(shù)據(jù)的特點(diǎn),才能正確地選用統(tǒng)計(jì)分析方法
按變量測(cè)量的精確程度由低到高,將數(shù)據(jù)分類為:名義數(shù)據(jù)(如性別、婚姻狀況)、有序變量(如療效,類別間差別大小難以度量)、區(qū)間變量(如攝氏體溫,類別間差別有實(shí)際意義)、比變量(如身高,除具有區(qū)間變量的特征外,還具有真實(shí)意義的零點(diǎn)。攝氏溫度的零點(diǎn)為水結(jié)冰時(shí)溫度,并非絕對(duì)意義的零點(diǎn),所以它不屬于比變量)定量數(shù)據(jù)定性數(shù)據(jù)1、定性數(shù)據(jù)(qualitativedata)
(二項(xiàng)與多項(xiàng))分類數(shù)據(jù)(categoricaldata)計(jì)數(shù)數(shù)據(jù)(enumeration(counting)data)
2、定量數(shù)據(jù)(quantitativedata)
計(jì)量數(shù)據(jù)(measurementdata)區(qū)間數(shù)據(jù)(intervaldata)數(shù)值數(shù)據(jù)(numericaldata)3、等級(jí)資料(rankeddata)
有序資料(ordinaldata)
(一)定性與定量數(shù)據(jù)的別名(二)三類數(shù)據(jù)間的關(guān)系
例:一組2040歲成年人的血壓以12kPa為界分為正常與異常兩組,統(tǒng)計(jì)每組例數(shù)
<8低血壓8正常血壓12輕度高血壓15中度高血壓17重度高血壓定量數(shù)據(jù)等級(jí)數(shù)據(jù)定性數(shù)據(jù)觀察單位observations個(gè)體individuals變量variablesQuantitativedata定量資料Qualitativedata定性數(shù)據(jù)Units;elements(三)三類數(shù)據(jù)的編碼與計(jì)算(1)
例:一組2040歲成年人的血壓以12kPa為界分為正常(=0)與異常(=1)兩組,統(tǒng)計(jì)每組例數(shù)
<8低血壓418正常血壓102
12輕度高血壓13315中度高血壓164
17重度高血壓185定量數(shù)據(jù)等級(jí)數(shù)據(jù)定性數(shù)據(jù)(三)三類數(shù)據(jù)的編碼與計(jì)算(2)1.定量數(shù)據(jù):允許計(jì)算均數(shù)、標(biāo)準(zhǔn)差等(可采用t、F檢驗(yàn)等,可當(dāng)做有序或定性數(shù)據(jù)處理)2.定性數(shù)據(jù):編碼是任意的,不能對(duì)編碼執(zhí)行均數(shù)標(biāo)準(zhǔn)差等計(jì)算,但可計(jì)算率或比(可采用卡方檢驗(yàn)等)
調(diào)查14名男子的婚姻狀況3.有序數(shù)據(jù):允許基于順序的計(jì)算,如計(jì)算中位數(shù)、百分位數(shù)(可當(dāng)做定性數(shù)據(jù)處理)1、變量——可以測(cè)量的任何特征或?qū)傩訟nycharacteristicorattributethatcanbemeasured。(不同個(gè)體結(jié)果可能不同)隨機(jī)變量——在概率論中稱變量為隨機(jī)變量
一、變量與隨機(jī)變量Variableandrandomvariable根據(jù)觀察數(shù)據(jù)之間有無縫隙(gap),常將數(shù)據(jù)分類為離散型(discrete)變量(有縫隙)與連續(xù)型(continuous)變量(無縫隙)兩大類。三、總體與樣本populationandsample總體:根據(jù)研究目的確定的同質(zhì)研究對(duì)象的全體(集合)。分有限總體與無限總體樣本:從總體中隨機(jī)抽取的部分研究對(duì)象
隨機(jī)抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機(jī)的方法抽取樣本(在總體中每個(gè)個(gè)體具有相同的機(jī)會(huì)被抽到)。四、參數(shù)與統(tǒng)計(jì)量
parameterandstatistic參數(shù):總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差,采用希臘字母分別記為μ、σ。固定的常數(shù)
總體樣本抽取部分觀察單位
統(tǒng)計(jì)量
參數(shù)
推斷inference統(tǒng)計(jì)量:樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用拉丁字母分別記為。參數(shù)附近波動(dòng)的隨機(jī)變量。
樣本的實(shí)際發(fā)生率稱為頻率。設(shè)在相同條件下,獨(dú)立重復(fù)進(jìn)行n次試驗(yàn),事件A出現(xiàn)f次,則事件A出現(xiàn)的頻率為f/n。
概率:隨機(jī)事件發(fā)生的可能性大小,用大寫的P表示;取值[0,1]。五、頻率與概率
frequencyandprobability必然事件P=1隨機(jī)事件0<P<1不可能事件P=0
P≤0.05(5%)或P≤0.01(1%)稱為小概率事件(習(xí)慣),統(tǒng)計(jì)學(xué)上認(rèn)為不大可能發(fā)生。小概率事件CertainImpossible0.501頻率與概率間的關(guān)系:1.樣本頻率總是圍繞概率上下波動(dòng)2.樣本含量n越大,波動(dòng)幅度越小,頻率越接近概率。六、誤差(Error)測(cè)量值=真值+隨機(jī)誤差+非隨機(jī)誤差
Xi=i+i
1.隨機(jī)誤差(隨機(jī)抽樣誤差):影響因素眾多,變化無方向性,不可避免,但可用統(tǒng)計(jì)方法進(jìn)行分析。2.系統(tǒng)誤差受確定因素影響,大小變化有方向性。3.非系統(tǒng)誤差(過失誤差)研究者偶然失誤而造成的誤差。偏差(bias)七、準(zhǔn)確度與可靠度準(zhǔn)確度(accuracy)或真實(shí)性(validity):觀察值與真值的接近程度,受系統(tǒng)誤差的影響(常用指標(biāo):如靈敏度、特異度)。可靠度(reliabiliy)——也稱精密度(precision)或重復(fù)性(repeatability):重復(fù)觀察時(shí)觀察值與其均值的接近程度,受隨機(jī)誤差的影響(常用指標(biāo):一致百分率、Kappa值)。八、因果關(guān)系與統(tǒng)計(jì)學(xué)聯(lián)系因果關(guān)系(causality)統(tǒng)計(jì)學(xué)聯(lián)系(association)由于混雜因素,標(biāo)準(zhǔn)的統(tǒng)計(jì)學(xué)方法一般只能獲得是否存在統(tǒng)計(jì)學(xué)聯(lián)系的結(jié)論。一、研究設(shè)計(jì)二、搜集資料三、整理資料四、分析資料五、結(jié)果表達(dá)第四節(jié)統(tǒng)計(jì)工作的基本步驟1.調(diào)查設(shè)計(jì)(surveydesign)對(duì)研究對(duì)象不施加任何干預(yù),通常建立隨機(jī)抽樣(randomsampling)方案。2.實(shí)驗(yàn)設(shè)計(jì)(experimentdesign)對(duì)研究對(duì)象施加干預(yù),如動(dòng)物實(shí)驗(yàn)研究、臨床試驗(yàn),通常建立隨機(jī)分組(randomallocation)方案。一、研究設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì)的三個(gè)基本原則1.隨機(jī)化(randomization)2.對(duì)照(control)3.重復(fù)(replication)Fisher在他的著作中多次強(qiáng)調(diào),統(tǒng)計(jì)學(xué)家與科學(xué)研究者的合作應(yīng)該在實(shí)驗(yàn)設(shè)計(jì)階段,而不是在需要數(shù)據(jù)處理的時(shí)候?!霸囼?yàn)完成后再找統(tǒng)計(jì)學(xué)家,無異于請(qǐng)統(tǒng)計(jì)學(xué)家為試驗(yàn)進(jìn)行“尸體解剖”。統(tǒng)計(jì)學(xué)家或許只能告訴你試驗(yàn)失敗的原因?!?/p>
二、搜集資料(datacollection)搜集資料要遵循準(zhǔn)確、完整、及時(shí)三個(gè)原則。資料搜集計(jì)劃包括:①選擇搜集資料的地點(diǎn)、人員和時(shí)間;②搜集資料人員的培訓(xùn)方案;③預(yù)調(diào)查或預(yù)實(shí)驗(yàn)方案擬定;④資料的記錄方式;⑤調(diào)查表的擬訂和印刷;⑥調(diào)查或?qū)嶒?yàn)儀器、試劑的準(zhǔn)備;⑦調(diào)查資料的抽樣復(fù)核比例和方法;⑧搜集資料所需經(jīng)費(fèi)的準(zhǔn)備等。人員選擇:高素質(zhì)、有相關(guān)專業(yè)基礎(chǔ)、以往曾有類似研究經(jīng)歷的人員加以嚴(yán)格培訓(xùn)和管理是能夠遵循三原則的保證。搜集資料的方式:直接觀察、采訪、填表和通信。直接觀察、采訪:調(diào)查人員親自參與和記錄,若調(diào)查人員素質(zhì)高,工作認(rèn)真負(fù)責(zé),并接受過統(tǒng)一的培訓(xùn),調(diào)查結(jié)果可靠。填表和通信由被調(diào)查者自己填寫,若被調(diào)查者文化水平高,素質(zhì)高,樂意配合調(diào)查,也可以得到可靠的資料,否則資料的誤差較大。三、整理資料(datasorting)
目的是將搜集到的原始資料系統(tǒng)化、條理化,便于進(jìn)一步計(jì)算與分析。編碼,將數(shù)據(jù)輸入計(jì)算機(jī)糾錯(cuò)改錯(cuò)、補(bǔ)漏等四、分析資料(dataanalysis)根據(jù)研究設(shè)計(jì)的目的、要求,資料的類型和分布的特征等選擇統(tǒng)計(jì)分析方法。1.統(tǒng)計(jì)描述:即計(jì)算統(tǒng)計(jì)指標(biāo),如平均值、發(fā)病率等,繪制統(tǒng)計(jì)圖。2.統(tǒng)計(jì)推斷:即可信區(qū)間估計(jì)與統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)總體均數(shù)、總體率的可信區(qū)間及其假設(shè)檢驗(yàn)兩個(gè)總體均數(shù)、總體率差值的可信區(qū)間及其假設(shè)檢驗(yàn)多個(gè)總體指標(biāo)之間的假設(shè)檢驗(yàn)。3.多因素回歸模型分析等。統(tǒng)計(jì)描述統(tǒng)計(jì)推斷指標(biāo)描述圖表描述參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)分析五、結(jié)果表達(dá)使用的統(tǒng)計(jì)學(xué)方法使用的統(tǒng)計(jì)學(xué)軟件假設(shè)檢驗(yàn)的統(tǒng)計(jì)量、P值等結(jié)論第五節(jié)統(tǒng)計(jì)學(xué)發(fā)展簡(jiǎn)史
1.早期公元前3050年古埃及人為修建金字塔籌集建筑費(fèi),對(duì)全國(guó)的人口和財(cái)產(chǎn)進(jìn)行了普查。19世紀(jì),應(yīng)用數(shù)學(xué)家為解決賭徒們?cè)诓┎手谐霈F(xiàn)的輸贏概率問題逐漸形成和發(fā)展了概率論,從而為統(tǒng)計(jì)學(xué)的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。2.近代
計(jì)算機(jī)和統(tǒng)計(jì)軟件如SAS、SPSS的出現(xiàn)使統(tǒng)計(jì)學(xué)得到了突飛猛進(jìn)的發(fā)展。
3.現(xiàn)代
生物統(tǒng)計(jì)學(xué)著名歷史人物其人其事
1.數(shù)學(xué)神童Gauss
(1777-1855)德國(guó)數(shù)學(xué)神童高斯
在孩童時(shí)就能夠快速計(jì)算出“1+2+3+…+100=5050”的答案。他對(duì)統(tǒng)計(jì)的主要貢獻(xiàn)除了正態(tài)分布(
normaldistribution)外,還有算術(shù)均數(shù)、幾何均數(shù)、二項(xiàng)分布理論和最小二乘法等。其實(shí),在Gauss之前就有人發(fā)現(xiàn)了正態(tài)分布,但只有他很快將之應(yīng)用于天文學(xué)研究,并使其應(yīng)用價(jià)值廣為人知,故正態(tài)分布又稱高斯分布(Gaussiandistribution)。2.從釀酒師到統(tǒng)計(jì)主管的Gosset(1876-1937)
1899年Gosset在英國(guó)都柏林一釀酒公司做釀酒師,在對(duì)小樣本進(jìn)行質(zhì)量控制的研究中發(fā)現(xiàn)了t分布,其論文1908年以Student為筆名發(fā)表。自此開創(chuàng)了小樣本統(tǒng)計(jì)的新紀(jì)元。
非常有趣的現(xiàn)象是,Gosset的數(shù)學(xué)欠佳,因而不能自己解決t檢驗(yàn)的理論和應(yīng)用問題,其最后的完善,是由Fisher,Neyman和EPearson先后完成的。正如后人評(píng)價(jià)的那樣:“Gosset提出實(shí)際問題,F(xiàn)isher和EPearson將其轉(zhuǎn)成統(tǒng)計(jì)問題,Neyman用數(shù)學(xué)解決問題”。
實(shí)際上是1925年Fisher在《t分布的應(yīng)用》一文中定義的。
大家熟知的公式:3.醫(yī)院統(tǒng)計(jì)與衛(wèi)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 林副產(chǎn)品購(gòu)銷合同
- 施工工程進(jìn)度保證信
- 踐行社會(huì)主義核心價(jià)值觀
- 房屋租賃合同范本完整
- 農(nóng)業(yè)技術(shù)產(chǎn)品售后服務(wù)協(xié)議
- 掛靠合作協(xié)議簡(jiǎn)單
- 沙石運(yùn)輸質(zhì)量協(xié)議書
- 鋼筋批發(fā)購(gòu)買
- 代收貨款合同書
- 房屋買賣合同的簽訂與法律糾紛處理
- 倉(cāng)庫(kù)溫濕度分布驗(yàn)證報(bào)告
- 【A科技公司員工招聘問題調(diào)查研究及優(yōu)化策略13000字(論文)】
- 英語(yǔ)社團(tuán)-趣配音活動(dòng)總結(jié)
- 國(guó)開電大本科工程數(shù)學(xué)(本)在線形考(形成性考核作業(yè)5)試題及答案
- 肩關(guān)節(jié)Constant評(píng)分表實(shí)用文檔
- 改革開放史學(xué)習(xí)通課后章節(jié)答案期末考試題庫(kù)2023年
- 國(guó)家開放大學(xué)電大《美學(xué)原理》形考任務(wù)1-4試題和答案
- 關(guān)于2023地貧工作計(jì)劃6篇
- 清掃保潔及垃圾清運(yùn)承包合同
- PCB焊盤與孔設(shè)計(jì)規(guī)范(new)
- 儲(chǔ)存場(chǎng)所預(yù)先危險(xiǎn)性分析表
評(píng)論
0/150
提交評(píng)論