第1-2章緒論及計量資料描述_第1頁
第1-2章緒論及計量資料描述_第2頁
第1-2章緒論及計量資料描述_第3頁
第1-2章緒論及計量資料描述_第4頁
第1-2章緒論及計量資料描述_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

醫(yī)學(xué)統(tǒng)計學(xué)

(medicalstatistics)溫州醫(yī)學(xué)院環(huán)境與公共衛(wèi)生學(xué)院葉曉蕾1學(xué)習(xí)要求1、掌握常見的統(tǒng)計分析方法的適用范圍和注意事項,了解其分析思想,能熟練運用統(tǒng)計學(xué)知識解決科研工作中一些常見的統(tǒng)計學(xué)問題。2、能針對資料的特點,選用恰當(dāng)、高效的統(tǒng)計分析方法,并且能比較熟練運用統(tǒng)計軟件(如SPSS等)對數(shù)據(jù)進(jìn)行統(tǒng)計分析,從而得到可靠的結(jié)果和科學(xué)的結(jié)論。3、學(xué)會在收集、整理、分析統(tǒng)計資料過程中提出系統(tǒng)解決方案的能力。2理論教學(xué)內(nèi)容(共32學(xué)時)學(xué)時數(shù)1緒論、計量資料統(tǒng)計描述42總體均數(shù)的估計與假設(shè)檢驗43多個樣本均數(shù)比較的方差分析44多因素試驗的方差分析、重復(fù)測量設(shè)計的方差分析45計數(shù)資料的統(tǒng)計描述、二項分布、X2檢驗46秩和檢驗、雙變量回歸與相關(guān)47多元線性回歸、Logistic回歸48生存分析、統(tǒng)計總結(jié)43第一章

緒論4一、什么叫統(tǒng)計學(xué)?

運用概率論和數(shù)理統(tǒng)計原理研究(隨機(jī))事物或現(xiàn)象的群體數(shù)量特征,從而揭示其內(nèi)在規(guī)律的一門學(xué)科。是正確認(rèn)識世界的一種重要手段。5統(tǒng)計學(xué)的地位生物醫(yī)學(xué)實驗室研究臨床研究流行病學(xué)研究公共衛(wèi)生管理……尋求統(tǒng)計學(xué)家的合作美國國立衛(wèi)生研究院(NIH)的基金申請要求合作者有統(tǒng)計學(xué)家,并必須有統(tǒng)計設(shè)計與分析的內(nèi)容。統(tǒng)計學(xué)——是一門方法學(xué)6根據(jù)對國內(nèi)外公開發(fā)表的醫(yī)藥衛(wèi)生論文中的統(tǒng)計錯誤調(diào)查:

粗略估計,70%左右的文章有統(tǒng)計學(xué)錯誤,其中70%的錯誤出現(xiàn)在基本的統(tǒng)計學(xué)方法,30%的錯誤出現(xiàn)在高級的、復(fù)雜的統(tǒng)計學(xué)方法。論文中的統(tǒng)計學(xué)錯誤是學(xué)習(xí)統(tǒng)計學(xué)極好的反面教材7觀察單位的特征—變量

變量的測定值—變量值(資料)

定量資料(計量資料)(quantitativedata)

分類資料(categoricaldata)

無序分類(unorderedcategories)(計數(shù)資料)二項分類

多項分類

有序分類(orderedcategories)(等級資料)二、統(tǒng)計資料的類型8定量資料(計量資料)(quantitativedata)

用定量方法測定得到,有大小之分,有度量衡單位。例某年某市抽樣調(diào)查的120名5歲女孩身高(cm),資料如下:105.5118.6110.5104.2110.9107.9108.199.1104.8116.5110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.199.6109.3107.5108.6100.6108.8103.895.3104.4102.7101.0112.1118.7…………………………104.1109.1108.8111.0106.8120.2105.8103.1105.0115.09分類資料(categoricaldata)

將觀察單位按屬性或類型分組計數(shù)所得的資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩?。無序分類(unorderedcategories)

(計數(shù)資料)

二項分類10

多項分類11有序分類(orderedcategories)(等級資料)12

表100例高血壓患者治療后臨床記錄患者年齡性別治療組舒張壓體溫療效編號

X1

X2

X3

X4X5

X6137男A11.2737.5顯效

245女B12.5337.0有效

343男A10.9336.5有效

459女B14.6737.8無效┆10054男B16.8037.6無效13案例:大學(xué)生傷害調(diào)查研究casevariable14資料間的相互轉(zhuǎn)化例:以人為單位,測得一群人Hb值(g/L),此資料為

;按Hb量的多少分為:<60(重度貧血),60~(中度貧血),90~(輕度貧血),120~160(正常)及>160(Hb增高)。此時資料為

。按Hb正常和異常分為兩類,此資料為

;分類資料數(shù)量化:性別:男—0女—1貧血程度:Hb增高—1,正常—2,輕度貧血—3,中度貧血—4,重度貧血—5。15三、統(tǒng)計工作的步驟設(shè)計收集資料整理資料分析資料1)專業(yè)設(shè)計2)統(tǒng)計設(shè)計1)統(tǒng)計報表2)醫(yī)療衛(wèi)生工作記錄3)專題調(diào)查和實驗1)對數(shù)據(jù)檢查、核對2)按分析要求分組、匯總1)統(tǒng)計描述2)統(tǒng)計推斷16第二章

定量資料的統(tǒng)計描述17例2.2某年某市抽樣調(diào)查的120名5歲女孩身高(cm),資料如下105.5118.6110.5104.2110.9107.9108.199.1104.8116.5110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.199.6109.3107.5108.6100.6108.8103.895.3104.4102.7101.0112.1118.7……………………………………124.0……………104.1109.1108.8111.0106.8120.2105.8103.1105.0115.0第一節(jié)頻數(shù)分布18定量資料的頻數(shù)表和頻數(shù)圖(直方圖)圖2.1某市城區(qū)120名5歲女孩身高頻數(shù)分布表2.2某市120名5歲女孩身高頻數(shù)表組段(cm)頻數(shù)(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-1251合計120191、頻數(shù)分布的特征(1)集中趨勢(centraltendency)(2)離散趨勢(dispersion)20(1)對稱分布其中一種常見的類型為正態(tài)分布。(2)偏態(tài)分布有正(左)偏態(tài)、負(fù)(右)偏態(tài)之分。2、頻數(shù)分布的類型21表2.2某市120名5歲女孩身高頻數(shù)表組段(cm)頻數(shù)(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-1251合計1202223第二節(jié)集中趨勢的描述——平均數(shù)24常用平均數(shù)的意義及其應(yīng)用場合平均數(shù)意義應(yīng)用場合均數(shù)平均數(shù)量水平應(yīng)用甚廣,最適用于對稱分布,特別是正態(tài)分布幾何均數(shù)平均增減倍數(shù)①等比資料;②對數(shù)正態(tài)分布資料中位數(shù)位次居中的觀察值水平①偏態(tài)資料;②分布不明資料;③分布一端或兩端出現(xiàn)不確定值251.均數(shù)(mean):

應(yīng)用:正態(tài)分布或近似正態(tài)分布的定量資料。

計算:1)直接法:2)加權(quán)法:式中:f—各組段的頻數(shù)(相同觀察值的個數(shù))

X—各組段的組中值=(下限值+上限值)/2SPSS262.幾何均數(shù)(geometricmean):G計算:(1)直接法:(2)加權(quán)法27

例:6份血清的抗體效價為1:10,1:20,1:40,1:80,1:80,1:160,求其平均效價。

先求平均效價的倒數(shù):該6份血清抗體的平均效價為1:45。SPSS28(2)加權(quán)法:例SPSS29

應(yīng)用:(1)變量值呈倍數(shù)關(guān)系(2)對數(shù)正態(tài)分布何謂對數(shù)正態(tài)分布?已知:X1,X2,……Xn呈偏態(tài)分布。設(shè):Y1=lgX1,Y2=lgX2,……Yn=lgXn。則:Y1,Y2,……Yn呈正態(tài)分布。

此時,將對數(shù)值還原為原始數(shù)值,則:303.中位數(shù)(median):M概念:是一組由小到大按順序排列的觀察值中位次居中的數(shù)值。計算:(1)直接法:某病患者發(fā)病潛伏期為2、3、3、3、4、5、6、9、16天,求中位數(shù)。若在第20天又發(fā)現(xiàn)1例患者呢?n為奇數(shù)時,n為偶數(shù)時,31(2)頻數(shù)表法:

利用百分位數(shù)計算公式進(jìn)行計算.

百分位數(shù)(PX)是一種位置指標(biāo),PX將一組觀察值分為兩部分, 有X%的觀察值比它小,有(1-X)%的觀察值比它大。中位數(shù)是一個特定的百分位數(shù),即M=P50

。

32百分位數(shù)計算公式:33例2.5某市大氣中SO2的日平均濃度(μg/m3),求M、P25、P75、P95。M=P50=104.17P25=69.12P75=145.97P95=258.12求M:同理:34應(yīng)用:(1)偏態(tài)分布資料;(2)資料分布一端或兩端有未確定值。集中趨勢的描述35例:SPSS36第三節(jié)離散趨勢的描述37描述離散程度的常用指標(biāo)全距(極差)

(R)2、四分位數(shù)間距(Q)3、方差(

2S2)和標(biāo)準(zhǔn)差(、S)4、變異系數(shù)(CV)意義指標(biāo)數(shù)值越小,說明觀察值的變異度越小,平均數(shù)的代表性越好。381.全距(極差)(range,R)意義:

反映一組同質(zhì)觀察值個體差異的范圍。計算:R=Xmax-XminR甲=8;R乙=12;R丙=8。

缺點:(1)不能反映組內(nèi)其它觀察值的變異度。(2)樣本含量越大,則全距可能也越大。392.四分位數(shù)間距(interquartilerange,IQR)

即P75-P25

四分位數(shù)可看作是一組同質(zhì)觀察值居中的50%變量值的變異范圍。與全距比較有何優(yōu)點?不受極值影響,較穩(wěn)定。應(yīng)用:(1)偏態(tài)分布;(2)資料一端或兩端有未確定值。第三節(jié)離散趨勢的描述403.方差(variance,

2,

S2)和標(biāo)準(zhǔn)差(standarddeviation,S)

414.標(biāo)準(zhǔn)差:

標(biāo)準(zhǔn)差或方差越大,說明個體差異越大,則均數(shù)的代表性越差。?應(yīng)用:

對稱分布,尤其是正態(tài)分布第三節(jié)離散趨勢的描述42樣本標(biāo)準(zhǔn)差(S)直接法:加權(quán)法:

S2稱為——

樣本方差

式中n-1稱為自由度,用希臘字母表示。SPSS43?應(yīng)用:(1)比較單位不同的幾組資料的變異程度(2)比較均數(shù)相差懸殊的幾組資料的變異程度5.變異系數(shù)(CV)44

例某地調(diào)查120名5歲女孩,其身高均數(shù)為110.15cm,標(biāo)準(zhǔn)差為5.86cm;其體重均數(shù)為17.71kg,標(biāo)準(zhǔn)差為1.44kg,試比較兩者變異度。說明體重的變異程度較身高大。45第四節(jié)

正態(tài)分布及其應(yīng)用46一、正態(tài)分布的概念47(1)在橫軸上方,均數(shù)處最高,為單峰分布(2)以均數(shù)為中心,左右對稱(3)有兩個參數(shù),μ

和σ。X~N(μ,σ)(4)正態(tài)曲線下面積分布有一定規(guī)律二、正態(tài)分布的圖形與特征4849三、正態(tài)曲線下面積分布的規(guī)律正態(tài)曲線下某一區(qū)間的面積占總面積的百分?jǐn)?shù)有何意義?即該區(qū)間的例數(shù)占總例數(shù)的百分?jǐn)?shù)(頻數(shù)分布)或觀察值落在該區(qū)間的概率。5051四、標(biāo)準(zhǔn)正態(tài)分布X~N(0,1)——標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)化變換:u~N(0,1)標(biāo)準(zhǔn)正態(tài)曲線下的面積,φ(u)值(P.695附表1)u=z52五、正態(tài)分布的應(yīng)用1.估計頻數(shù)分布2.制定參考值范圍3.質(zhì)量控制4.統(tǒng)計處理方法的基礎(chǔ)53估計頻數(shù)分布例2.2出生體重低于2500克為低體重兒。若由某項研究得某地嬰兒出生體重均數(shù)為3100克,標(biāo)準(zhǔn)差為300克,估計該地當(dāng)年出生低體重兒所占比例。出生體重X~N(3100,300)查附表1得:φ(-2.00)=0.0228即X≤2500的比例為2.28%。54制定參考值范圍1)一定數(shù)量(n>100)符合條件的觀察對象2)選定適當(dāng)?shù)陌俜纸缦蓿?/p>

如80%、90%、95%和99%,常用為95%。3)確定單側(cè)或雙側(cè)55若取95%界限,雙側(cè):P2.5~P97.5

單側(cè):若高不正常,則<P95

若低不正常,則>P54)方法:a:正態(tài)分布法若取95%界限,雙側(cè):單側(cè):若高不正常,則<若低不正常,則>b:百分位數(shù)法5657如何判斷資料是否呈正態(tài)分布?頻數(shù)表和頻數(shù)圖P-P圖或Q-Q圖正態(tài)性檢驗581.區(qū)分計量資料與計數(shù)資料

實例1:“小兒皮膚血管瘤雌、孕激素受體的研究”(中華××××雜志×年×月第3期)。該研究采用免疫組化方法對毛細(xì)血管瘤、混合型血管瘤、海綿狀血管瘤、淋巴管瘤及正常皮膚組織的雌激素受體ER、孕激素受體PR進(jìn)行檢測。全部標(biāo)本經(jīng)10%福爾馬林固定,常規(guī)石蠟包埋。每例選一典型蠟塊,4-6切片,進(jìn)行免疫組化染色,高倍鏡下每例腫瘤區(qū)內(nèi)計數(shù)500個細(xì)胞,計數(shù)ER、PR陽性細(xì)胞百分率,資料見表1。計量資料統(tǒng)計描述實例作者采用卡方檢驗比較各組間的差異。

分析:一般認(rèn)為帶有“率”的資料就是定性資料,似應(yīng)判斷為定性資料。然而問題的關(guān)鍵在于,原作者的觀察單位并不是細(xì)胞本身,而是每一個病例標(biāo)本,作者關(guān)心的是4種疾病病例標(biāo)本和一組正常人標(biāo)本的ER、PR陽性細(xì)胞率之均值是否相同,從每一個病例標(biāo)本中得到的是ER和PR的陽性細(xì)胞率,他們是具體的數(shù)值,因而應(yīng)屬于定量資料。

結(jié)論:判斷資料性質(zhì)的關(guān)鍵是把資料還原為基本觀察單位的具體取值形式,而不要被資料的表現(xiàn)所迷惑。本資料的受試對象為病例標(biāo)本,測量指標(biāo)為“陽性細(xì)胞百分率”,因而應(yīng)為定量資料。

實例2:某研究人員為了評價一項新的治療方法的效果,將8個病人隨機(jī)等分為兩組,分別接受兩種治療方法(傳統(tǒng)方法、新方法)。由于療效不適合用客觀指標(biāo)直接測量,因此,研究者請專家為不同組的病人治療效果進(jìn)行評分,最低為0分,最高為4分,分?jǐn)?shù)越高說明治療效果越好。各組得分結(jié)果的原始記錄如下,見表2:63作者將上述實驗結(jié)果表達(dá)如下:

傳統(tǒng)方法組:1.05±0.19(n=4)

新方法治療組:2.15±0.44(n=4)64

分析:評分一般情況下是可以當(dāng)作計量資料的,比如學(xué)生考試成績就是一種評分,可以用來表示。但本例中的評分嚴(yán)格來說是一種等級資料。當(dāng)作計數(shù)資料進(jìn)行統(tǒng)計描述和處理更為合適。65662.判斷資料是否服從正態(tài)分布實例3:“血清腫瘤標(biāo)志在結(jié)直腸癌診斷中的應(yīng)用”(中華檢驗醫(yī)學(xué)雜志2000年1月第1期)。該研究探討4種血清腫瘤標(biāo)志在結(jié)直腸癌診斷、手術(shù)效果評價、轉(zhuǎn)移復(fù)發(fā)監(jiān)測中的應(yīng)用價值。文章研究CEA、CA19-9、CA72-4和CA242四項腫瘤標(biāo)志在患者手術(shù)前、手術(shù)后及轉(zhuǎn)移復(fù)發(fā)方面差異有無顯著意義,分別檢測了58例手術(shù)前患者,30例手術(shù)后患者及19例轉(zhuǎn)移復(fù)發(fā)患者,測量其4項指標(biāo),資料見表4。作者采用了方差分析和t檢查進(jìn)行統(tǒng)計學(xué)處理。表4手術(shù)前后4項腫瘤標(biāo)志檢測結(jié)果項目術(shù)前(n=58)術(shù)后(n=30)轉(zhuǎn)移復(fù)發(fā)(n=19)CEA(μg/L)34.0±79.02.0±1.288.0±107.0CA1929(×103u/L)209.0±739.011.0±10.9212.0±529.0CA7224(×103u/L)7.2±4.84.3±2.89.8±

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論