醫(yī)學(xué)統(tǒng)計學(xué)基本概念(馬修強(qiáng))_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)基本概念(馬修強(qiáng))_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)基本概念(馬修強(qiáng))_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)基本概念(馬修強(qiáng))_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)基本概念(馬修強(qiáng))_第5頁
已閱讀5頁,還剩63頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、醫(yī)學(xué)統(tǒng)計學(xué)醫(yī)學(xué)統(tǒng)計學(xué)(medical statistics)衛(wèi)生統(tǒng)計學(xué)教研室衛(wèi)生統(tǒng)計學(xué)教研室馬修強(qiáng)馬修強(qiáng) 副教授副教授2011-9-13名人名言名人名言學(xué)者不能離開統(tǒng)計學(xué)而研學(xué);學(xué)者不能離開統(tǒng)計學(xué)而研學(xué);政治家不能離開統(tǒng)計學(xué)而施政;政治家不能離開統(tǒng)計學(xué)而施政;事業(yè)家不能離開統(tǒng)計學(xué)而執(zhí)業(yè);事業(yè)家不能離開統(tǒng)計學(xué)而執(zhí)業(yè);軍事家不能離開統(tǒng)計學(xué)而謀略。軍事家不能離開統(tǒng)計學(xué)而謀略。馬寅初馬寅初統(tǒng)計學(xué)的定義統(tǒng)計學(xué)的定義nA science dealing with the collection, analysis, interpretation and pre-sentation of messes of

2、numerical data. (關(guān)于關(guān)于數(shù)據(jù)的收集、分析、解數(shù)據(jù)的收集、分析、解釋和表達(dá)的學(xué)科釋和表達(dá)的學(xué)科) - Websters International Dictionary統(tǒng)計學(xué)的定義統(tǒng)計學(xué)的定義nThe science and art of dealing with variation through collection, classifi-cation, and analysis in such a way as to obtain reliable result. (通過數(shù)據(jù)的收集、分通過數(shù)據(jù)的收集、分類和分析來處理變異以獲得類和分析來處理變異以獲得可靠結(jié)果的一門學(xué)科和藝術(shù)

3、可靠結(jié)果的一門學(xué)科和藝術(shù))-John M. Last, A Dictionary of Epidemiology統(tǒng)計學(xué)與醫(yī)學(xué)統(tǒng)計學(xué)與醫(yī)學(xué)n統(tǒng)計學(xué)在醫(yī)學(xué)方面應(yīng)用的分支名稱:統(tǒng)計學(xué)在醫(yī)學(xué)方面應(yīng)用的分支名稱:q生物統(tǒng)計學(xué)生物統(tǒng)計學(xué)(biostatistics)q醫(yī)學(xué)統(tǒng)計學(xué)(醫(yī)學(xué)統(tǒng)計學(xué)(medical statistics)q衛(wèi)生統(tǒng)計學(xué)(衛(wèi)生統(tǒng)計學(xué)(health statistics)n醫(yī)學(xué)統(tǒng)計學(xué)醫(yī)學(xué)統(tǒng)計學(xué)q運用統(tǒng)計學(xué)原理和方法研究醫(yī)學(xué)科研中有關(guān)數(shù)據(jù)的運用統(tǒng)計學(xué)原理和方法研究醫(yī)學(xué)科研中有關(guān)數(shù)據(jù)的收集、整理和分析的應(yīng)用學(xué)科。收集、整理和分析的應(yīng)用學(xué)科。1.學(xué)會駕馭變異性(學(xué)會駕馭變異性(variatio

4、n) 變異性是社會和生物醫(yī)學(xué)中的普遍現(xiàn)象。變異性是社會和生物醫(yī)學(xué)中的普遍現(xiàn)象。 WHO報告中國期望壽命:平均報告中國期望壽命:平均 71(歲)(歲) 實際上每個人的實際壽命是不確定,有些用現(xiàn)有實際上每個人的實際壽命是不確定,有些用現(xiàn)有的知識可以解釋,有些不能解釋。統(tǒng)計試圖為不能解的知識可以解釋,有些不能解釋。統(tǒng)計試圖為不能解釋的問題(困惑費解的問題)提供線索和依據(jù)。釋的問題(困惑費解的問題)提供線索和依據(jù)。 統(tǒng)計學(xué)就是處理數(shù)據(jù)中變異的科學(xué)。統(tǒng)計學(xué)就是處理數(shù)據(jù)中變異的科學(xué)。為什么要學(xué)習(xí)醫(yī)學(xué)統(tǒng)計學(xué)?為什么要學(xué)習(xí)醫(yī)學(xué)統(tǒng)計學(xué)?The odds of finding two identical fing

5、erprints were 1 in 64 billion.Francis Galton兩個隨機(jī)個體具有相同DNA圖形的概率為310-11;如果同時用兩種探針進(jìn)行比較,兩個個體完全相同的概率小于510-19。每支槍的槍管都有獨一無二的特征,這種特征影響了它所發(fā)射的每一發(fā)子彈。司法彈道學(xué)120名正常成年男子紅細(xì)胞計數(shù)值名正常成年男子紅細(xì)胞計數(shù)值(1012/L) 5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.844.91 5.14 5.25 4.89 4.79 4.90 5.09 4.64 5.14 5.46 4.66 4.204

6、.21 3.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.214.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.054.92 4.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.974.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.224.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.534.83 4

7、.11 3.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.514.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.774.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.692. 設(shè)計你的研究設(shè)計你的研究 隨機(jī)對照試驗,隨機(jī)對照試驗,Randomized Controlled Trial(RCT) 不一定是最好的醫(yī)學(xué)研究方法不一定是最好的醫(yī)學(xué)研究方法, 但是最好的試驗方法。但是最好的試驗方法。 國際生物醫(yī)學(xué)雜志編輯協(xié)會一般要求國

8、際生物醫(yī)學(xué)雜志編輯協(xié)會一般要求(包含了包含了統(tǒng)計學(xué)要求統(tǒng)計學(xué)要求):Uniform Requirements for Manuscripts Submitted to Biomedical Journals國際醫(yī)學(xué)雜志編輯委員會對隨機(jī)對照試驗論文國際醫(yī)學(xué)雜志編輯委員會對隨機(jī)對照試驗論文報告要求報告要求:CONSORT (Consolidated Standards of Reporting Trials) /Statement/revisedstatement.htm#ref53. 論文的統(tǒng)計學(xué)審查論文的統(tǒng)計學(xué)審查論文段(主題)論文

9、段(主題)序號序號論文段(主題)論文段(主題)序號序號題目與摘要題目與摘要1統(tǒng)計學(xué)方法統(tǒng)計學(xué)方法12序言序言2結(jié)果結(jié)果13方法與參與方方法與參與方3招募受試者招募受試者14受試者受試者4基線數(shù)據(jù)基線數(shù)據(jù)15干預(yù)措施干預(yù)措施5納入分析的例數(shù)納入分析的例數(shù)16結(jié)局指標(biāo)結(jié)局指標(biāo)6結(jié)局和估計值結(jié)局和估計值17樣本量樣本量7輔助分析輔助分析18隨機(jī)數(shù)的產(chǎn)生隨機(jī)數(shù)的產(chǎn)生8不良事件不良事件19隨機(jī)分組(密封的方案)隨機(jī)分組(密封的方案)9局限性局限性20隨機(jī)的實施隨機(jī)的實施10可推廣性可推廣性 21盲法盲法11解釋解釋22在全世界報告的在全世界報告的122個關(guān)于個關(guān)于Selective Sero-tonin

10、 Reuptake Inhibitors (SSRI) 抗抑郁作抗抑郁作用的用的RCT研究報告中,僅有一個研究報告中,僅有一個(0.8%)報告報告符合符合CONSORT的描述規(guī)范。的描述規(guī)范。“良好愿望的醫(yī)學(xué)良好愿望的醫(yī)學(xué)”(well-meaning medicine)轉(zhuǎn)入轉(zhuǎn)入“基于證據(jù)的醫(yī)學(xué)基于證據(jù)的醫(yī)學(xué)” (evidence-based medicine,EBM)。所有臨床試驗的結(jié)果都是先有統(tǒng)計學(xué)結(jié)論所有臨床試驗的結(jié)果都是先有統(tǒng)計學(xué)結(jié)論(統(tǒng)計指標(biāo)比較、統(tǒng)計指標(biāo)比較、P 值值),再給出專業(yè)結(jié)論。,再給出專業(yè)結(jié)論。 4. 統(tǒng)計學(xué)結(jié)論是重要的科學(xué)證據(jù)之一統(tǒng)計學(xué)結(jié)論是重要的科學(xué)證據(jù)之一統(tǒng)計學(xué)與數(shù)值

11、計算統(tǒng)計學(xué)與數(shù)值計算n統(tǒng)計學(xué)的結(jié)論是建立在正確的數(shù)值計算的基礎(chǔ)上;統(tǒng)計學(xué)的結(jié)論是建立在正確的數(shù)值計算的基礎(chǔ)上;數(shù)值計算可以由多種途徑完成,如心算、手工計算、數(shù)值計算可以由多種途徑完成,如心算、手工計算、計算器、電腦(統(tǒng)計軟件);計算器、電腦(統(tǒng)計軟件);n使用統(tǒng)計軟件僅僅是解決復(fù)雜統(tǒng)計計算的快速實現(xiàn)使用統(tǒng)計軟件僅僅是解決復(fù)雜統(tǒng)計計算的快速實現(xiàn)問題,其真正的精髓并不在于如何操作軟件,而在問題,其真正的精髓并不在于如何操作軟件,而在于你是否具有足夠的統(tǒng)計學(xué)知識選擇合適的統(tǒng)計方于你是否具有足夠的統(tǒng)計學(xué)知識選擇合適的統(tǒng)計方法,并對結(jié)果作出合理的解釋。法,并對結(jié)果作出合理的解釋。產(chǎn)生的問題:產(chǎn)生的問題:

12、1. 數(shù)據(jù)的可靠性:數(shù)據(jù)的可靠性:數(shù)據(jù)造假問題數(shù)據(jù)造假問題2. 統(tǒng)計方法的選擇:統(tǒng)計方法的選擇:誤用非常嚴(yán)重誤用非常嚴(yán)重舍恩舍恩(Schon)事件事件維克托維克托 尼努夫化學(xué)尼努夫化學(xué)元素發(fā)現(xiàn)造假事件元素發(fā)現(xiàn)造假事件黃禹錫事件黃禹錫事件數(shù)據(jù)造假數(shù)據(jù)造假20052005年年6 6月月9 9日,日,自然自然雜志公布了一份雜志公布了一份令人震驚的調(diào)查結(jié)果。令人震驚的調(diào)查結(jié)果。美國調(diào)查人員對美國調(diào)查人員對3247名科學(xué)家的問卷調(diào)查結(jié)果顯示:名科學(xué)家的問卷調(diào)查結(jié)果顯示: 約約5%的科學(xué)家承認(rèn),由于得到的信息與他們正在進(jìn)的科學(xué)家承認(rèn),由于得到的信息與他們正在進(jìn)行的研究相抵觸,他們曾丟棄某些數(shù)據(jù);行的研究相

13、抵觸,他們曾丟棄某些數(shù)據(jù);10%的科學(xué)家承認(rèn),他們在發(fā)表研究報告時,曾的科學(xué)家承認(rèn),他們在發(fā)表研究報告時,曾不適當(dāng)?shù)貙⒆约夯蛩说拿至袨樽髡?;不適當(dāng)?shù)貙⒆约夯蛩说拿至袨樽髡撸怀^超過15%的科學(xué)家承認(rèn),他們曾改變原來的設(shè)計或的科學(xué)家承認(rèn),他們曾改變原來的設(shè)計或結(jié)果,或忽略一些觀測以便使贊助商滿意。結(jié)果,或忽略一些觀測以便使贊助商滿意。統(tǒng)計方法的誤用統(tǒng)計方法的誤用70%左右的文章有統(tǒng)計學(xué)錯誤;其中,左右的文章有統(tǒng)計學(xué)錯誤;其中,70%的錯誤的錯誤出在初等的、基本的統(tǒng)計學(xué)方法,出在初等的、基本的統(tǒng)計學(xué)方法,30%的錯誤出在的錯誤出在高等的、復(fù)雜的統(tǒng)計學(xué)方法。高等的、復(fù)雜的統(tǒng)計學(xué)方法。1966

14、年,據(jù)對美國醫(yī)師協(xié)會雜志(年,據(jù)對美國醫(yī)師協(xié)會雜志(JAMA)等醫(yī)學(xué))等醫(yī)學(xué)雜志的來稿的統(tǒng)計顯示,雜志的來稿的統(tǒng)計顯示,149篇投稿論文中,僅有篇投稿論文中,僅有28%可以接受,可以接受,67%有統(tǒng)計缺陷但尚可以糾正,有統(tǒng)計缺陷但尚可以糾正,5%不可救藥。不可救藥?!吧锝y(tǒng)計學(xué)者是我們的可貴盟友。生物統(tǒng)計學(xué)生物統(tǒng)計學(xué)者是我們的可貴盟友。生物統(tǒng)計學(xué)不是遠(yuǎn)離我們的數(shù)學(xué),而是現(xiàn)代醫(yī)學(xué)的一門基不是遠(yuǎn)離我們的數(shù)學(xué),而是現(xiàn)代醫(yī)學(xué)的一門基本學(xué)科,就像大廈中的一個支柱本學(xué)科,就像大廈中的一個支柱”。 美國醫(yī)師協(xié)會雜志編輯美國醫(yī)師協(xié)會雜志編輯 “非常痛心地看到,因為數(shù)據(jù)分析的缺陷和非常痛心地看到,因為數(shù)據(jù)分析的

15、缺陷和錯誤,那么多好的生物研究工作面臨著被錯誤,那么多好的生物研究工作面臨著被葬送的危險葬送的危險”。 Yates和和HealyHow to lie with statistics-Darrell Huff如何用統(tǒng)計學(xué)說謊或統(tǒng)計數(shù)字會撒謊如何用統(tǒng)計學(xué)說謊或統(tǒng)計數(shù)字會撒謊n統(tǒng)計這種神秘的語言,在一個用事實說話的社會統(tǒng)計這種神秘的語言,在一個用事實說話的社會里是如此吸引人,但有時它卻被利用并成為惡意里是如此吸引人,但有時它卻被利用并成為惡意夸大或迷惑他人的工具。統(tǒng)計方法和統(tǒng)計術(shù)語是夸大或迷惑他人的工具。統(tǒng)計方法和統(tǒng)計術(shù)語是必不可少的。但必不可少的。但如果不能準(zhǔn)確理解和恰當(dāng)使用這如果不能準(zhǔn)確理解和恰

16、當(dāng)使用這些統(tǒng)計語言,不能正確了解其含義,統(tǒng)計結(jié)果只些統(tǒng)計語言,不能正確了解其含義,統(tǒng)計結(jié)果只能是一堆廢話能是一堆廢話。n統(tǒng)計不僅是一門科學(xué),更是一門藝術(shù)統(tǒng)計不僅是一門科學(xué),更是一門藝術(shù)(加工、處理、加工、處理、升華升華)。統(tǒng)計學(xué)的幾個基本概念統(tǒng)計學(xué)的幾個基本概念n同質(zhì)與變異同質(zhì)與變異n總體與樣本總體與樣本n參數(shù)與統(tǒng)計量參數(shù)與統(tǒng)計量n變量與資料變量與資料n誤差誤差n頻率與概率頻率與概率n同質(zhì)同質(zhì):指事物的性質(zhì)、影響條件或背景相:指事物的性質(zhì)、影響條件或背景相同或非常相近。同或非常相近。 例:調(diào)查例:調(diào)查20102010年上海市年上海市7 7歲男童的身高和體重歲男童的身高和體重 同質(zhì):同質(zhì):201

17、02010年、上海市、年、上海市、7 7歲男童歲男童:同質(zhì)個體間測量結(jié)果的差異。:同質(zhì)個體間測量結(jié)果的差異。 變異:變異: 上海市上海市7 7歲男童的身高和體重各不相同歲男童的身高和體重各不相同5.805.605.405.205.004.804.604.404.204.003.8035302520151050總體總體(population)n定義:根據(jù)研究目的確定的、同質(zhì)的全部研究定義:根據(jù)研究目的確定的、同質(zhì)的全部研究對象的觀測值的全體。對象的觀測值的全體。q如研究如研究18歲男青年的生長發(fā)育情況,指標(biāo)為身高、歲男青年的生長發(fā)育情況,指標(biāo)為身高、體重,則所有體重,則所有18歲男青年的身高測量

18、值為一個總體,歲男青年的身高測量值為一個總體,體重測量值為另一個總體。體重測量值為另一個總體。n有限總體有限總體(finite population) 如如2011年上海市在校大學(xué)生年上海市在校大學(xué)生n無限總體無限總體(infinite population) 如高血壓病人如高血壓病人樣本樣本(sample)n來自總體的部分研究對象的觀測值。來自總體的部分研究對象的觀測值。n抽樣抽樣(sampling):總體中的每個研究單位被抽:總體中的每個研究單位被抽取作為樣本的過程。取作為樣本的過程。n樣本量樣本量(sample size):樣本包含的研究對象的:樣本包含的研究對象的個數(shù)。個數(shù)。Today

19、: 7 April 2022參數(shù)參數(shù):反映:反映總體特征總體特征的的統(tǒng)計指標(biāo),如總體均數(shù)、統(tǒng)計指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差,采用希臘字母標(biāo)準(zhǔn)差,采用希臘字母分別記為分別記為、。固定固定的常數(shù)。的常數(shù)??傮w總體樣本樣本抽取部分觀察單位抽取部分觀察單位 推斷推斷統(tǒng)計量統(tǒng)計量:反映:反映樣本樣本特征的統(tǒng)計指標(biāo),如樣本均數(shù)、標(biāo)特征的統(tǒng)計指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用拉丁字母分別記為準(zhǔn)差,采用拉丁字母分別記為 。 參數(shù)附近波動參數(shù)附近波動的隨機(jī)變量。的隨機(jī)變量。SX、參數(shù)與統(tǒng)計量參數(shù)與統(tǒng)計量 (parameter and statistic)誤差誤差(error)n誤差的定義:實測值與真實值之間的差異誤差的

20、定義:實測值與真實值之間的差異n誤差的分類:誤差的分類:q隨機(jī)誤差隨機(jī)誤差(random error)q非隨機(jī)誤差非隨機(jī)誤差(nonrandom error)n系統(tǒng)誤差系統(tǒng)誤差(systematic error)n非系統(tǒng)誤差非系統(tǒng)誤差(nonsystematic error)隨機(jī)誤差隨機(jī)誤差n由多種尚無法控制的因素引起的誤差。由多種尚無法控制的因素引起的誤差。n無法消除或不可避免,但有規(guī)律可循。無法消除或不可避免,但有規(guī)律可循。n抽樣誤差(抽樣誤差(sampling error)q在抽樣過程中由于抽樣的偶然性而出現(xiàn)的誤差。在抽樣過程中由于抽樣的偶然性而出現(xiàn)的誤差。q表現(xiàn)為總體參數(shù)與樣本統(tǒng)計量的

21、差異,以及多個樣本表現(xiàn)為總體參數(shù)與樣本統(tǒng)計量的差異,以及多個樣本統(tǒng)計量之間的差異。統(tǒng)計量之間的差異。q可用標(biāo)準(zhǔn)誤描述其大小。可用標(biāo)準(zhǔn)誤描述其大小。系統(tǒng)誤差系統(tǒng)誤差n由可知的或可掌握的因素引起的誤差。由可知的或可掌握的因素引起的誤差。n其值恒定不變或遵循一定變化規(guī)律,產(chǎn)生原因其值恒定不變或遵循一定變化規(guī)律,產(chǎn)生原因往往是已知或可能掌握的往往是已知或可能掌握的n理論上可以通過周密的研究設(shè)計和嚴(yán)格的技術(shù)理論上可以通過周密的研究設(shè)計和嚴(yán)格的技術(shù)措施消除,實際操作上要看具體情況。措施消除,實際操作上要看具體情況。q實驗者感覺或操作上的差異;實驗者感覺或操作上的差異;q儀器設(shè)備的測量精度;儀器設(shè)備的測量精

22、度;q抽樣不均勻,分配不隨機(jī)等。抽樣不均勻,分配不隨機(jī)等。n舉例:舉例:用動脈血壓計測量某人血壓用動脈血壓計測量某人血壓( (實際值為實際值為80mmHg)80mmHg),各次測量的均值為,各次測量的均值為100mmHg100mmHg。下圖為。下圖為系統(tǒng)誤差和隨機(jī)誤差的示意圖。系統(tǒng)誤差和隨機(jī)誤差的示意圖。隨機(jī)誤差隨機(jī)誤差80100舒張壓舒張壓(mmHg)系統(tǒng)誤差系統(tǒng)誤差發(fā)發(fā)生生頻頻次次血壓計法測量舒張壓值的分布血壓計法測量舒張壓值的分布非系統(tǒng)誤差非系統(tǒng)誤差n又稱過失誤差又稱過失誤差(gross error)n由研究者偶然失誤造成的誤差。由研究者偶然失誤造成的誤差。n可通過研究者的認(rèn)真檢查核對避

23、免此類誤差??赏ㄟ^研究者的認(rèn)真檢查核對避免此類誤差。q儀器失靈儀器失靈q記錄錯誤(點錯小數(shù)點、指標(biāo)弄錯等)記錄錯誤(點錯小數(shù)點、指標(biāo)弄錯等)確定性現(xiàn)象和不確定現(xiàn)象確定性現(xiàn)象和不確定現(xiàn)象n確定性現(xiàn)象:在一定條件下,必定會發(fā)生的現(xiàn)確定性現(xiàn)象:在一定條件下,必定會發(fā)生的現(xiàn)象。象。q必然事件必然事件(P1)和不可能事件和不可能事件(P0)。n隨機(jī)現(xiàn)象:在同樣條件下會出現(xiàn)兩種或多種結(jié)隨機(jī)現(xiàn)象:在同樣條件下會出現(xiàn)兩種或多種結(jié)果,事先不能確定可能發(fā)生何種結(jié)果的現(xiàn)象。果,事先不能確定可能發(fā)生何種結(jié)果的現(xiàn)象。q在一定條件下可能發(fā)生的事件為隨機(jī)事件在一定條件下可能發(fā)生的事件為隨機(jī)事件(0P1)。頻率與概率頻率與概

24、率n頻率頻率(relative frequency):在相同條件下,獨:在相同條件下,獨立地重復(fù)立地重復(fù)n次試驗,隨機(jī)事件次試驗,隨機(jī)事件A出現(xiàn)出現(xiàn) f 次,則稱次,則稱 f/n 為隨機(jī)事件為隨機(jī)事件A出現(xiàn)的頻率。出現(xiàn)的頻率。實實 驗驗 者者Buffon(法法)k.pearson(英英)k.pearson(英英)投擲次數(shù)投擲次數(shù) 4040 12000 24000“正面正面”次數(shù)次數(shù) 2048 6019 12012 頻頻 率率 0.5069 0.5016 0.5005頻率與概率頻率與概率n概率概率(probability):隨機(jī)事件發(fā)生可能性大小:隨機(jī)事件發(fā)生可能性大小的度量指標(biāo)。的度量指標(biāo)。q

25、當(dāng)當(dāng)n趨近無窮大時,頻率趨近無窮大時,頻率f/n始終在一個常數(shù)左右微始終在一個常數(shù)左右微小擺動,稱該常數(shù)為隨機(jī)事件小擺動,稱該常數(shù)為隨機(jī)事件A的概率的概率q用用 P 表示,表示,0 P 1。q隨著樣本量的增加,頻率越來越接近概率。隨著樣本量的增加,頻率越來越接近概率。q只要觀察單位數(shù)足夠多,可將頻率作為概率的估計只要觀察單位數(shù)足夠多,可將頻率作為概率的估計值。值。Probability = Frequency?Patient: Will I survive this risky operation? Surgeon: Yes, Im absolutely sure that you will

26、survive the operation. Patient: How can you be so sure? Surgeon: Well, 9 out of 10 patients die in this operation, and yesterday my ninth patient died. Surely not變量(變量(variable)n研究者對每個觀察單位的某項特征進(jìn)行觀察研究者對每個觀察單位的某項特征進(jìn)行觀察或測量,該特征稱為變量?;驕y量,該特征稱為變量。n觀察或測量的結(jié)果稱為變量值或觀察值。觀察或測量的結(jié)果稱為變量值或觀察值。n變量值可以是數(shù)值,也可以是某種屬性。變量值可

27、以是數(shù)值,也可以是某種屬性。n變量值構(gòu)成資料(變量值構(gòu)成資料(data)。)。醫(yī)學(xué)研究中常見的資料類型醫(yī)學(xué)研究中常見的資料類型n計量資料計量資料(measurement data)n計數(shù)資料計數(shù)資料(enumeration data)n等級資料等級資料(ranked data)計量資料計量資料n又稱定量資料又稱定量資料(quantitative data),即觀測每個,即觀測每個觀察對象某項指標(biāo)的大小而得到的資料;觀察對象某項指標(biāo)的大小而得到的資料;n必須通過必須通過“量量”才能獲得;才能獲得;n帶有度量衡單位;帶有度量衡單位;n每個個體擁有一個數(shù)值;每個個體擁有一個數(shù)值;n可以轉(zhuǎn)換為等級資料

28、和計數(shù)資料??梢赞D(zhuǎn)換為等級資料和計數(shù)資料。計量資料的類型計量資料的類型n離散型:在一定范圍內(nèi)取值的個數(shù)為有限。離散型:在一定范圍內(nèi)取值的個數(shù)為有限。q如:出生嬰兒數(shù)、死亡人數(shù)等。如:出生嬰兒數(shù)、死亡人數(shù)等。n連續(xù)型:在一定范圍內(nèi)取值的個數(shù)為無限。連續(xù)型:在一定范圍內(nèi)取值的個數(shù)為無限。q如:身高、體重等。如:身高、體重等。計數(shù)資料計數(shù)資料n又稱定性資料又稱定性資料(qualitative data),或稱無序分,或稱無序分類變量類變量(unordered categorical variable),即將,即將觀察單位按某種屬性或類別分組計算各組的例觀察單位按某種屬性或類別分組計算各組的例數(shù),分組

29、匯總各組觀察單位數(shù)后得到的資料。數(shù),分組匯總各組觀察單位數(shù)后得到的資料。n必須通過必須通過“數(shù)數(shù)”才能獲得;才能獲得;n不帶有度量衡單位,每個個體擁有一個屬性。不帶有度量衡單位,每個個體擁有一個屬性。計數(shù)資料的類型計數(shù)資料的類型n兩分類:陽性或陰性;存活或死亡;兩分類:陽性或陰性;存活或死亡; 有效或無效;男性或女性有效或無效;男性或女性n多分類:如血型中的多分類:如血型中的A、B、O、AB四種四種等級資料的特點等級資料的特點n又稱有序分類資料又稱有序分類資料(ordinal categorical data),即,即將觀察單位按某種屬性的大小程度分成等級后分將觀察單位按某種屬性的大小程度分成

30、等級后分組計算各組的例數(shù),分組匯總各組觀察單位數(shù)后組計算各組的例數(shù),分組匯總各組觀察單位數(shù)后得到的資料。得到的資料。n必須先必須先“量量”后后“數(shù)數(shù)”才能獲得;才能獲得;n不帶有度量衡單位,每個個體擁有一個屬性;不帶有度量衡單位,每個個體擁有一個屬性;q如治療效果分為痊愈、有效、無效、惡化等如治療效果分為痊愈、有效、無效、惡化等練習(xí):資料類型的判斷練習(xí):資料類型的判斷病例號病例號年齡年齡(歲歲)性別性別身高身高(cm)血型血型 心電圖心電圖尿尿WBC職業(yè)職業(yè)血血RBC(1012/L)135女女1.65A正常正常教師教師4.67244男男1.74B正常正常工人工人5.21326男男1.80O正常

31、正常職員職員4.10425女女1.61AB正常正常農(nóng)民農(nóng)民3.92541男男1.71A異常異常+工人工人3.49645女女1.58B正常正常+工人工人5.48750女女1.60O異常異常+干部干部6.78828男男1.76AB正常正常+干部干部7.10931女女1.62O正常正常軍人軍人5.24資料類型的轉(zhuǎn)化資料類型的轉(zhuǎn)化n計量資料可以轉(zhuǎn)化為等級資料和計數(shù)資料計量資料可以轉(zhuǎn)化為等級資料和計數(shù)資料q如血壓中收縮壓為計量資料;如血壓中收縮壓為計量資料;q按照按照90160mmHg為界值,可分為低血壓、正常為界值,可分為低血壓、正常血壓、高血壓(等級資料);血壓、高血壓(等級資料);q也可以分為正常

32、和不正常(計數(shù)資料)。也可以分為正常和不正常(計數(shù)資料)。n計量資料的信息最豐富,研究中盡可能收集計量資料的信息最豐富,研究中盡可能收集計量資料。計量資料。 醫(yī)學(xué)統(tǒng)計學(xué)的基本步驟醫(yī)學(xué)統(tǒng)計學(xué)的基本步驟設(shè)計設(shè)計(design) 收集資料收集資料(collection of data) 整理資料整理資料(sorting data) 分析資料分析資料(analysis of data) 一、設(shè)計一、設(shè)計(design)統(tǒng)計設(shè)計:對資料收集、整理和分析全過程總的統(tǒng)計設(shè)計:對資料收集、整理和分析全過程總的設(shè)想和安排。是后續(xù)步驟的依據(jù),是最關(guān)鍵的一設(shè)想和安排。是后續(xù)步驟的依據(jù),是最關(guān)鍵的一環(huán)。是提高觀察或?qū)?/p>

33、驗質(zhì)量的重要保證。環(huán)。是提高觀察或?qū)嶒炠|(zhì)量的重要保證??蒲性O(shè)計科研設(shè)計專業(yè)設(shè)計專業(yè)設(shè)計統(tǒng)計設(shè)計統(tǒng)計設(shè)計成果:先進(jìn)性、創(chuàng)新性成果:先進(jìn)性、創(chuàng)新性 科學(xué)性和可行性科學(xué)性和可行性 研究者在統(tǒng)計設(shè)計過程中的幾個關(guān)鍵問題:研究者在統(tǒng)計設(shè)計過程中的幾個關(guān)鍵問題:(1 1)如何進(jìn)行抽樣,如何安排設(shè)計所規(guī)定的)如何進(jìn)行抽樣,如何安排設(shè)計所規(guī)定的干預(yù)措施?干預(yù)措施?(2 2)要達(dá)到研究目的應(yīng)抽取多少個觀察單位?)要達(dá)到研究目的應(yīng)抽取多少個觀察單位?(3 3)如何在諸多的影響因素中,分離出研究)如何在諸多的影響因素中,分離出研究因素對結(jié)果的效應(yīng)?因素對結(jié)果的效應(yīng)? 二、收集資料二、收集資料(collection

34、of data) 根據(jù)設(shè)計方案,取得準(zhǔn)確可靠的原始數(shù)據(jù),根據(jù)設(shè)計方案,取得準(zhǔn)確可靠的原始數(shù)據(jù),是統(tǒng)計分析的基礎(chǔ)。是統(tǒng)計分析的基礎(chǔ)。 來源來源統(tǒng)計報表資料統(tǒng)計報表資料經(jīng)常性工作記錄經(jīng)常性工作記錄專題調(diào)查或?qū)嶒炑芯繉n}調(diào)查或?qū)嶒炑芯拷y(tǒng)計年鑒和統(tǒng)計數(shù)據(jù)專輯統(tǒng)計年鑒和統(tǒng)計數(shù)據(jù)專輯 三、整理資料三、整理資料(sorting data) 將原始數(shù)據(jù)將原始數(shù)據(jù)凈化、系統(tǒng)化、條理化凈化、系統(tǒng)化、條理化,以便,以便為進(jìn)一步計算和統(tǒng)計分析。為進(jìn)一步計算和統(tǒng)計分析。 凈化凈化是指對原始數(shù)據(jù)的清理、檢查、核對是指對原始數(shù)據(jù)的清理、檢查、核對和糾正錯誤等;和糾正錯誤等; 系統(tǒng)化和條理化系統(tǒng)化和條理化是指根據(jù)研究目的,將

35、原是指根據(jù)研究目的,將原始數(shù)據(jù)合理分組并歸納匯總等。始數(shù)據(jù)合理分組并歸納匯總等。 資料整理包括:資料整理包括:1 1、首先對原始數(shù)據(jù)進(jìn)行核對和檢查、首先對原始數(shù)據(jù)進(jìn)行核對和檢查2 2、設(shè)計分組、設(shè)計分組 質(zhì)量分組:將觀察單位按其屬性或類別歸質(zhì)量分組:將觀察單位按其屬性或類別歸類分組。如性別、職業(yè)分類等。類分組。如性別、職業(yè)分類等。 數(shù)量分組:將觀察單位按數(shù)值大小進(jìn)行分?jǐn)?shù)量分組:將觀察單位按數(shù)值大小進(jìn)行分組。如年齡大小、血壓高低等。組。如年齡大小、血壓高低等。3 3、按分組要求設(shè)計整理表,匯總資料。、按分組要求設(shè)計整理表,匯總資料。 數(shù)據(jù)的預(yù)處理:數(shù)據(jù)的預(yù)處理: 把原始數(shù)據(jù)轉(zhuǎn)化為能被統(tǒng)計軟件識別

36、的把原始數(shù)據(jù)轉(zhuǎn)化為能被統(tǒng)計軟件識別的數(shù)據(jù)集。數(shù)據(jù)集。例:性別:男、女例:性別:男、女 sex: =1(男)(男) =2(女)(女)數(shù)據(jù)錄入工具:數(shù)據(jù)錄入工具:EpiData、Ecxel等等 四、分析資料四、分析資料(analysis of data) 計算有關(guān)統(tǒng)計指標(biāo),反映數(shù)據(jù)的綜合特計算有關(guān)統(tǒng)計指標(biāo),反映數(shù)據(jù)的綜合特征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。統(tǒng)計分析分為:統(tǒng)計分析分為: (1)統(tǒng)計描述)統(tǒng)計描述 (2)統(tǒng)計推斷)統(tǒng)計推斷統(tǒng)計學(xué)發(fā)展簡史統(tǒng)計學(xué)發(fā)展簡史統(tǒng)計學(xué)的發(fā)展史可分為三個時期:統(tǒng)計學(xué)的發(fā)展史可分為三個時期:n17世紀(jì)世紀(jì)70年代年代18世紀(jì)末:古典統(tǒng)計學(xué)世紀(jì)

37、末:古典統(tǒng)計學(xué)n18世紀(jì)末世紀(jì)末19世紀(jì)末:近代統(tǒng)計學(xué)世紀(jì)末:近代統(tǒng)計學(xué)n20世紀(jì)初世紀(jì)初現(xiàn)在:現(xiàn)代統(tǒng)計學(xué)現(xiàn)在:現(xiàn)代統(tǒng)計學(xué)Statisticians are very careful!As a biologist, a physicist, and a statistician are riding on a train through Wisconsin, they pass a herd of cows, one of which is completely white. “Oh look, there are white cows in Wisconsin,” says the biol

38、ogist. “You mean,” says the physicist with an air of superiority, “there is at least one white cow in Wisconsin.” “No,” says the statistician, “there is at least one cow in Wisconsin thats white on at least one side!”現(xiàn)代統(tǒng)計學(xué)的開端現(xiàn)代統(tǒng)計學(xué)的開端nFrancis Galton(1822-1911),維多利亞維多利亞女王時代最博學(xué)的人,女王時代最博學(xué)的人,創(chuàng)用和發(fā)展了創(chuàng)用和發(fā)展了

39、“相關(guān)相關(guān)”與與“回歸回歸”。n平生著書平生著書15種,撰寫各種學(xué)術(shù)論文種,撰寫各種學(xué)術(shù)論文220篇,涉獵范圍包括地理、天文、氣象、篇,涉獵范圍包括地理、天文、氣象、物理、機(jī)械、人類學(xué)、社會學(xué)、統(tǒng)計學(xué)、物理、機(jī)械、人類學(xué)、社會學(xué)、統(tǒng)計學(xué)、教育學(xué)、醫(yī)學(xué)、生理學(xué)、心理學(xué)、遺傳教育學(xué)、醫(yī)學(xué)、生理學(xué)、心理學(xué)、遺傳學(xué)、優(yōu)生學(xué)、指紋學(xué)、音樂、美術(shù)等,學(xué)、優(yōu)生學(xué)、指紋學(xué)、音樂、美術(shù)等,是一位百科全書式的學(xué)者。是一位百科全書式的學(xué)者。生物統(tǒng)計學(xué)生物統(tǒng)計學(xué)派創(chuàng)始人派創(chuàng)始人nKarl Pearson是是Galton的學(xué)生的學(xué)生n開創(chuàng)了統(tǒng)計方法學(xué),把這門開創(chuàng)了統(tǒng)計方法學(xué),把這門學(xué)科由描述性統(tǒng)計改變?yōu)橥茖W(xué)科由描述性統(tǒng)

40、計改變?yōu)橥茢嘈越y(tǒng)計。斷性統(tǒng)計。n創(chuàng)造創(chuàng)造“標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差”術(shù)語,術(shù)語,提出提出 2檢驗、檢驗、線性相關(guān)與回歸。線性相關(guān)與回歸。n1911年,在倫敦大學(xué)創(chuàng)立了年,在倫敦大學(xué)創(chuàng)立了世界首個綜合大學(xué)統(tǒng)計系。世界首個綜合大學(xué)統(tǒng)計系?,F(xiàn)代統(tǒng)計學(xué)的開端現(xiàn)代統(tǒng)計學(xué)的開端現(xiàn)代統(tǒng)計學(xué)之父現(xiàn)代統(tǒng)計學(xué)之父Karl Pearson對相對論的貢獻(xiàn)對相對論的貢獻(xiàn)愛因斯坦愛因斯坦23歲時設(shè)立歲時設(shè)立 Olympia專業(yè)研究組,專業(yè)研究組,向成員推薦的第一本書向成員推薦的第一本書Pearson認(rèn)為自然的法則認(rèn)為自然的法則與觀察者的理解能力有關(guān)。與觀察者的理解能力有關(guān)。自然進(jìn)程的不可逆純粹是自然進(jìn)程的不可逆純粹是相對的概念。一個

41、能以光相對的概念。一個能以光速前進(jìn)的觀察者將看到永速前進(jìn)的觀察者將看到永恒的現(xiàn)在。他推測如果研恒的現(xiàn)在。他推測如果研究者的速度超過了光速將究者的速度超過了光速將會看到時光倒流,就像電會看到時光倒流,就像電影回放一樣。該書介紹的影回放一樣。該書介紹的某些主題后來成為愛因斯某些主題后來成為愛因斯坦理論的部分內(nèi)容。坦理論的部分內(nèi)容。Biometrika shall serve as a means not only of collecting or publishing under one title biological data of a kind not systematically collected or published elsewhere in any other periodical, but also of spreading a knowledge of such statistical theory as may be requisite for their scientific treatment. 19061936 Karl Pears

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論