常見的幾種統(tǒng)計(jì)方法_第1頁
常見的幾種統(tǒng)計(jì)方法_第2頁
常見的幾種統(tǒng)計(jì)方法_第3頁
常見的幾種統(tǒng)計(jì)方法_第4頁
常見的幾種統(tǒng)計(jì)方法_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

關(guān)于常見的幾種統(tǒng)計(jì)方法第1頁,共61頁,2023年,2月20日,星期三前言

學(xué)習(xí)統(tǒng)計(jì)學(xué)方法,主要目的在于建立統(tǒng)計(jì)學(xué)觀念,提高醫(yī)學(xué)統(tǒng)計(jì)學(xué)思維,學(xué)會運(yùn)用統(tǒng)計(jì)學(xué)理論和方法充分挖掘資料中蘊(yùn)含的信息,恰如其分地進(jìn)行理性概括,并據(jù)此寫出嚴(yán)謹(jǐn)?shù)难芯繄?bào)告和學(xué)術(shù)論文。

第2頁,共61頁,2023年,2月20日,星期三呋喃硝胺

100人西米替丁

100人療效85人療效90人

例如:某醫(yī)生比較兩種療法對活動期十二指腸球部潰瘍的療效。據(jù)此能否立即下結(jié)論,呋喃硝胺的療效高于西米替?。康?頁,共61頁,2023年,2月20日,星期三顯效有效無效合計(jì)單純西藥925640冠心靈1918542冠心靈與單純西藥療效對比

問題:某醫(yī)師用“冠心靈”治療冠心病,其療效是否優(yōu)于單純西藥?第4頁,共61頁,2023年,2月20日,星期三授課提綱醫(yī)學(xué)統(tǒng)計(jì)學(xué)概述統(tǒng)計(jì)工作的基本步驟統(tǒng)計(jì)資料的類型醫(yī)學(xué)統(tǒng)計(jì)中的基本概念常用的幾種統(tǒng)計(jì)方法第5頁,共61頁,2023年,2月20日,星期三一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)概述

定義

是用統(tǒng)計(jì)學(xué)原理和方法研究生物醫(yī)學(xué)問題的一門學(xué)科。醫(yī)學(xué)統(tǒng)計(jì)方法在醫(yī)學(xué)研究中的運(yùn)用主要有三個方面:第6頁,共61頁,2023年,2月20日,星期三一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)概述①以正確的方式收集數(shù)據(jù),如實(shí)驗(yàn)設(shè)計(jì)、調(diào)查設(shè)計(jì)等。②描述數(shù)據(jù)的統(tǒng)計(jì)特征,如數(shù)據(jù)化簡、統(tǒng)計(jì)指標(biāo)的選擇與計(jì)算、統(tǒng)計(jì)結(jié)果的表達(dá)等。③統(tǒng)計(jì)分析及得出正確結(jié)論,如根據(jù)概率分布,對實(shí)驗(yàn)和觀察結(jié)果存在的差異和關(guān)聯(lián)作出統(tǒng)計(jì)推斷。

第7頁,共61頁,2023年,2月20日,星期三工作生活中常見的統(tǒng)計(jì)學(xué)問題如何判斷藥物的療效?(假設(shè)檢驗(yàn))明天是否下雨?體育彩票能否中獎?(概率論)子女為什么象父母,其強(qiáng)度有多大?(相關(guān)與回歸)美國的民意測驗(yàn)是如何進(jìn)行的?(設(shè)計(jì),抽樣)中國的市場調(diào)查的可信性有多大?(現(xiàn)場調(diào)查)

統(tǒng)計(jì)學(xué)是對令人困惑費(fèi)解的數(shù)字問題做出設(shè)想的藝術(shù)。第8頁,共61頁,2023年,2月20日,星期三

醫(yī)學(xué)論文中的統(tǒng)計(jì)學(xué)問題60年代到80年代,國外醫(yī)學(xué)雜志調(diào)查結(jié)果:有統(tǒng)計(jì)錯誤的論文20%~72%。1996年對4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會系列雜志占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。第9頁,共61頁,2023年,2月20日,星期三

60年代到80年代,國外醫(yī)學(xué)雜志調(diào)查表明:20%~72%的論文有統(tǒng)計(jì)錯誤。

1984年對《中華醫(yī)學(xué)雜志》、《中華內(nèi)科雜志》、《中華外科雜志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文的調(diào)查結(jié)果為:相對數(shù)誤用占11.2%,抽樣方法誤用占15.9%,統(tǒng)計(jì)圖表誤用占11.7%1996年對4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會系列雜志占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。

2001年《中華預(yù)防醫(yī)學(xué)雜志》:中華醫(yī)學(xué)會系列雜志誤用約54%(1995)。1996年,有機(jī)構(gòu)對申報(bào)科技成果的4586篇科研論文分析,統(tǒng)計(jì)方法使用率為76%。醫(yī)學(xué)論文中統(tǒng)計(jì)運(yùn)用錯誤,除了影響論文的科學(xué)性,還可能導(dǎo)致嚴(yán)重的倫理學(xué)問題。

第10頁,共61頁,2023年,2月20日,星期三

偽造統(tǒng)計(jì)數(shù)據(jù)違反科學(xué)道德1976年NewScience雜志關(guān)于科研舞弊行為的調(diào)查(1)74%的調(diào)查表反映有不正當(dāng)修改數(shù)據(jù)的情況(2)17%拼湊實(shí)驗(yàn)結(jié)果(3)7%憑空捏造數(shù)據(jù)(4)2%故意曲解結(jié)果第11頁,共61頁,2023年,2月20日,星期三

二、統(tǒng)計(jì)工作的基本步驟設(shè)計(jì)收集資料整理資料分析資料第12頁,共61頁,2023年,2月20日,星期三1.專業(yè)設(shè)計(jì):選題、建立假說、確定研究對象和技術(shù)方法等→個性

2.統(tǒng)計(jì)設(shè)計(jì):圍繞專業(yè)設(shè)計(jì)確定統(tǒng)計(jì)設(shè)類型、樣本大小、分組方法、統(tǒng)計(jì)分析指標(biāo)及統(tǒng)計(jì)分析方法。

(一)設(shè)計(jì)

第13頁,共61頁,2023年,2月20日,星期三

(二)收集資料

(一)資料來源第一手資料①

經(jīng)常性:統(tǒng)計(jì)報(bào)表(死亡登記、疫情報(bào)告等),工作記錄(病歷、化驗(yàn));②一時性:專題調(diào)查、實(shí)驗(yàn)或臨床試驗(yàn)。第二手資料:已公布的資料,如全國、全省衛(wèi)生統(tǒng)計(jì)資料。第14頁,共61頁,2023年,2月20日,星期三(二)收集資料

(二)資料要求

1.完整:觀察單位及觀察項(xiàng)目完整。

觀察單位:最基本的獲取數(shù)據(jù)的單元??梢允且粋€體,亦可以是一個單位、家庭、地區(qū),一批樣品,一個采樣點(diǎn)。

2.準(zhǔn)確:即真實(shí)、可靠。真實(shí)是統(tǒng)計(jì)學(xué)的靈魂。

3.及時:即時限性。如人口普查規(guī)定調(diào)查開始日期和截止日期。第15頁,共61頁,2023年,2月20日,星期三(三)整理資料

整理資料即原始數(shù)據(jù)的條理化、系統(tǒng)化的過程。所采取的手段→合理化分組,目的→實(shí)現(xiàn)專業(yè)目標(biāo)。質(zhì)分組:按事物的屬性或性質(zhì)分組→分類變量;量分組:按數(shù)據(jù)的大小→數(shù)值變量。第16頁,共61頁,2023年,2月20日,星期三(四)分析資料

1.統(tǒng)計(jì)描述:用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖表對資料的數(shù)量特征及分布規(guī)律進(jìn)行測定和描述。

2.統(tǒng)計(jì)推斷:用樣本信息推斷總體特征:①參數(shù)估計(jì)。②假設(shè)檢驗(yàn)。第17頁,共61頁,2023年,2月20日,星期三

三、統(tǒng)計(jì)資料的類型

有三種類型的資料:

計(jì)量資料,計(jì)數(shù)資料,等級資料基本概念:變量及變量值,研究者對每個觀察單位的某項(xiàng)特征進(jìn)行觀察和測量,這種特征稱為變量,變量的測得值叫變量值(也叫觀察值),稱為資料。按變量值的性質(zhì)可將資料分為定量資料和定性資料。第18頁,共61頁,2023年,2月20日,星期三1.計(jì)量資料定義:通過度量衡的方法,測量每一個觀察單位的某項(xiàng)研究指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。特點(diǎn):有度量衡單位多為連續(xù)性資料(通過測量得到)如患者的身高(cm)、體重(kg)、血壓(mmHg)、脈搏(次/分)、紅細(xì)胞計(jì)數(shù)(1012/L)第19頁,共61頁,2023年,2月20日,星期三定義:將全體觀測單位按照某種性質(zhì)或特征分組,然后再分別清點(diǎn)各組觀察單位的個數(shù)。特點(diǎn):沒有度量衡單位多為間斷性資料(通過枚舉或記數(shù)得來)如膚色(黑、白)、血型(ABO)、職業(yè)(工農(nóng)兵)、性別(男女)

2.計(jì)數(shù)資料第20頁,共61頁,2023年,2月20日,星期三

定義:介于計(jì)量資料和計(jì)數(shù)資料之間的一種資料,通過半定量方法測量得到。特點(diǎn):每一個觀察單位沒有確切值各組之間有性質(zhì)上的差別或程度上的不同。①癌癥分期:早、中、晚。②藥物療效:治愈、好轉(zhuǎn)、無效、死亡。③尿蛋白:,,,++,+++及以上3.等級資料第21頁,共61頁,2023年,2月20日,星期三對觀察對象按屬性或類型分組計(jì)數(shù)所得的資料。每個對象之間沒有量的差異,只有質(zhì)的不同。

資料的類型

計(jì)量資料(數(shù)值變量或定量資料)

計(jì)數(shù)資料(無序分類變量或定性資料)

等級資料(有序分類變量或半定量資料)

對每一觀察對象用定量的方法,測定某項(xiàng)指標(biāo)所得的資料。一般有度量衡單位,每個對象之間有量的區(qū)別。

對觀察對象按屬性或類型程度的不同分組計(jì)數(shù),但各屬性或類型之間又有程度的差別。

第22頁,共61頁,2023年,2月20日,星期三

(1)不同類型的資料采用的統(tǒng)計(jì)分析方法不同;(2)三類資料類型可以相互轉(zhuǎn)化。

注意:第23頁,共61頁,2023年,2月20日,星期三例:某地調(diào)查高血壓的患病情況。每人的血壓:以mmHg計(jì)計(jì)量資料以舒張壓≥90mmHg為高血壓,結(jié)果在1000人中有10名高血壓患者,990名非高血壓患者,整理后的資料

計(jì)數(shù)資料按低血壓、正常、高血壓分組所得資料。等級資料第24頁,共61頁,2023年,2月20日,星期三四、統(tǒng)計(jì)學(xué)中的基本概念(一)總體與樣本1、總體(population)

根據(jù)研究目的所確定的同質(zhì)的所有觀察單位某項(xiàng)變量值的集合。

有關(guān)總體的三個要點(diǎn):研究目的、同質(zhì)的、全體第25頁,共61頁,2023年,2月20日,星期三觀察對象:該地2002年全部正常成人同質(zhì):

同一地區(qū)、同一年份、同為正常成人全體:該地2002年全部正常成人白細(xì)胞數(shù)目的:了解某地2002年正常成人白細(xì)胞數(shù)觀察單位:每個人

觀察值:測得的白細(xì)胞數(shù)例如:了解某地2002年正常成人白細(xì)胞數(shù)第26頁,共61頁,2023年,2月20日,星期三四、統(tǒng)計(jì)學(xué)中的基本概念(二)變異:同質(zhì)基礎(chǔ)上個體值之間的差異,稱為變異。同質(zhì):指觀察單位或觀察指標(biāo)受共同因素制約的部分。例如,同種族、同年齡、同性別的健康人,在相同的條件下測其脈搏、呼吸、體溫等生理指標(biāo)可以有很大差異。第27頁,共61頁,2023年,2月20日,星期三四、統(tǒng)計(jì)學(xué)中的基本概念(三)參數(shù)和統(tǒng)計(jì)量

1.參數(shù):總體指標(biāo)。

2.統(tǒng)計(jì)量:樣本指標(biāo)。(四)抽樣誤差

1.定義:在統(tǒng)計(jì)學(xué)上把由抽樣造成的樣本統(tǒng)計(jì)量和總體參數(shù)之間的差異或者是各個樣本統(tǒng)計(jì)量之間的差異統(tǒng)稱為抽樣誤差。

第28頁,共61頁,2023年,2月20日,星期三四、統(tǒng)計(jì)學(xué)中的基本概念(五)概率概率:是描述隨機(jī)事件發(fā)生的可能性大小的數(shù)值。(1)必然事件:P(A)=1(2)不可能事件:P(A)=0(3)隨機(jī)事件(偶然事件):0<P(A)<1(4)小概率事件:P≤0.05或P≤0.01第29頁,共61頁,2023年,2月20日,星期三t檢驗(yàn)不是處理計(jì)數(shù)資料的萬能方法第30頁,共61頁,2023年,2月20日,星期三雙向無序,兩個分類變量皆為無序分類變量,一般用卡方檢驗(yàn)。單向有序資料,采用秩和檢驗(yàn)。雙向有序且屬性相同,研究目的通常是分析兩種檢測方法的一致性,此時應(yīng)用一致性檢驗(yàn)。雙向有序?qū)傩圆煌?,根?jù)具體情況可選擇秩和檢驗(yàn),等級相關(guān)分析或者線性趨勢檢驗(yàn)??ǚ綑z驗(yàn)不是處理計(jì)數(shù)資料的萬能方法第31頁,共61頁,2023年,2月20日,星期三卡方檢驗(yàn)第32頁,共61頁,2023年,2月20日,星期三秩和檢驗(yàn)或Ridit分析第33頁,共61頁,2023年,2月20日,星期三原則:選擇最恰當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)準(zhǔn)確描述資料的特征。非正態(tài)分布計(jì)量資料正態(tài)分布計(jì)數(shù)資料

率或比第34頁,共61頁,2023年,2月20日,星期三

X2檢驗(yàn)

X2檢驗(yàn)或稱卡方檢驗(yàn),是一種用途較廣的假設(shè)檢驗(yàn)方法,常用于檢驗(yàn)兩個或多個樣本率及構(gòu)成比之間有無差別,還用來檢驗(yàn)配對定性資料及兩種屬性或特征之間是否有關(guān)系等。第35頁,共61頁,2023年,2月20日,星期三2檢驗(yàn)的適用資料兩組樣本率的比較;多組樣本率的比較;兩組或多組構(gòu)成比的比較;配對設(shè)計(jì)下兩分類資料檢驗(yàn)。第36頁,共61頁,2023年,2月20日,星期三一、四格表資料的檢驗(yàn)四格表資料的檢驗(yàn)主要用于兩個樣本率(或構(gòu)成比)的假設(shè)檢驗(yàn),一般制成表6-2的計(jì)算格式(以陽性和陰性為例)。第37頁,共61頁,2023年,2月20日,星期三表6-2四格表資料檢驗(yàn)計(jì)算表組別陽性數(shù)陰性數(shù)合計(jì)甲組aba+b乙組cdc+d合計(jì)a+cb+da+b+c+d=n第38頁,共61頁,2023年,2月20日,星期三X2檢驗(yàn)的基本公式為理論頻數(shù)T

條件:n>40,T>=5第39頁,共61頁,2023年,2月20日,星期三四格表檢驗(yàn)專用公式省去計(jì)算T值第40頁,共61頁,2023年,2月20日,星期三例6.7以例6.6資料為例表6-3用藥組和對照組流感發(fā)病率的比較組別

發(fā)病人數(shù)

未發(fā)病人數(shù)合計(jì)用藥組14(20)86(80)100對照組30(24)90(96)120合計(jì)44176220第41頁,共61頁,2023年,2月20日,星期三兩種方法計(jì)算結(jié)果第42頁,共61頁,2023年,2月20日,星期三結(jié)果判斷X2臨界值:X20.05,1=3.84,

請記?。篨20.01,1=6.63,X2=u2

本例:X2=4.125>X20.05,1=3.84,兩組差別有統(tǒng)計(jì)學(xué)意義。與前面的結(jié)論相同。第43頁,共61頁,2023年,2月20日,星期三四格表值的校正

條件:(1)任一格的1≤T<5,且n≥40時,需計(jì)算校正值。(2)任一格的T<1或n≤40時,用確切概率計(jì)算法?;竟綄S霉降?4頁,共61頁,2023年,2月20日,星期三例6.8

某醫(yī)師用甲、乙兩療法治療小兒單純性消化不良,治療結(jié)果如表6-4,問兩療法的治愈率是否相等?表6-4甲、乙兩療法治療小兒單純性消化不良的治愈率比較組別

發(fā)病人數(shù)

未發(fā)病人數(shù)合計(jì)用藥組26(28.8)7(4.2)33對照組36(33.2)2(4.8)38合計(jì)62971第45頁,共61頁,2023年,2月20日,星期三計(jì)算結(jié)果及判斷本例:X2=2.71<X20.05,1=3.84本例若對X2值不校正,α=4.06,得P<0.05,結(jié)論正好相反。第46頁,共61頁,2023年,2月20日,星期三三、行×列表的檢驗(yàn)行×列表(R×C表)的檢驗(yàn)主要用于解決多個樣本率或多個樣本構(gòu)成比的比較以及有序分類資料的關(guān)聯(lián)性檢驗(yàn)。

式中n為總例數(shù),A為每格子的實(shí)際頻數(shù),nR、nC分別為與某格子實(shí)際頻數(shù)(A)同行、同列的合計(jì)數(shù)。第47頁,共61頁,2023年,2月20日,星期三

行×列表資料的檢驗(yàn)的注意事項(xiàng)1.理論數(shù)不宜太小,一般不宜有1/5以上格子的理論頻數(shù)小于5,或有一個理論頻數(shù)小于1。對理論數(shù)太小有三種處理方法:①最好增加樣本含量以增大理論頻數(shù);根本的方法。②刪去理論頻數(shù)太小的行和列;此法不好。③將理論頻數(shù)較小的行或列與鄰行或鄰列合并以增大理論頻數(shù)。但后兩法可能會損失信息,第48頁,共61頁,2023年,2月20日,星期三

行×列表資料的檢驗(yàn)的注意事項(xiàng)2.當(dāng)多個樣本率(或構(gòu)成比)比較的檢驗(yàn),結(jié)論為拒絕檢驗(yàn)假設(shè),只能認(rèn)為各總體率(或總體構(gòu)成比)之間不全相等,但不能認(rèn)為彼此間都不相等。若要比較彼此間的差別,可用下述的行×列表的分割法。3.對于行×列表單向等級資料(單向有序資料)組間的比較,宜用第八章秩和檢驗(yàn),如作卡方檢驗(yàn)法只說明各處理組的效應(yīng)在構(gòu)成比上有無差異,而不能說明組間整體效應(yīng)的差異。第49頁,共61頁,2023年,2月20日,星期三t檢驗(yàn)與u檢驗(yàn)的應(yīng)用條件兩組數(shù)值變量資料比較;小樣本時用t檢驗(yàn),要求資料為隨機(jī)樣本并服從正態(tài)分布;大樣本時用u檢驗(yàn),仍要求資料為隨機(jī)樣本,但正態(tài)性條件可以放寬;在兩樣本均數(shù)比較的t和u檢驗(yàn)中,要求兩組總體方差相等,即方差齊性;組間要求具有均衡可比性。第50頁,共61頁,2023年,2月20日,星期三

單樣本均數(shù)的t檢驗(yàn)對于總體標(biāo)準(zhǔn)差未知的小樣本數(shù)據(jù)(n<60),單樣本均數(shù)的假設(shè)檢驗(yàn)采用t檢驗(yàn),計(jì)算公式為第51頁,共61頁,2023年,2月20日,星期三

例通過以往大規(guī)模調(diào)查,已知某地新生兒出生體重均數(shù)為3.30kg。從該地難產(chǎn)兒中隨機(jī)抽取35名新生兒作為研究樣本,平均出生體重為3.42k

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論