第1-2章緒論及計(jì)量資料描述_第1頁(yè)
第1-2章緒論及計(jì)量資料描述_第2頁(yè)
第1-2章緒論及計(jì)量資料描述_第3頁(yè)
第1-2章緒論及計(jì)量資料描述_第4頁(yè)
第1-2章緒論及計(jì)量資料描述_第5頁(yè)
已閱讀5頁(yè),還剩87頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

醫(yī)學(xué)統(tǒng)計(jì)學(xué)

(medicalstatistics)溫州醫(yī)學(xué)院環(huán)境與公共衛(wèi)生學(xué)院葉曉蕾1學(xué)習(xí)要求1、掌握常見(jiàn)的統(tǒng)計(jì)分析方法的適用范圍和注意事項(xiàng),了解其分析思想,能熟練運(yùn)用統(tǒng)計(jì)學(xué)知識(shí)解決科研工作中一些常見(jiàn)的統(tǒng)計(jì)學(xué)問(wèn)題。2、能針對(duì)資料的特點(diǎn),選用恰當(dāng)、高效的統(tǒng)計(jì)分析方法,并且能比較熟練運(yùn)用統(tǒng)計(jì)軟件(如SPSS等)對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從而得到可靠的結(jié)果和科學(xué)的結(jié)論。3、學(xué)會(huì)在收集、整理、分析統(tǒng)計(jì)資料過(guò)程中提出系統(tǒng)解決方案的能力。2理論教學(xué)內(nèi)容(共32學(xué)時(shí))學(xué)時(shí)數(shù)1緒論、計(jì)量資料統(tǒng)計(jì)描述42總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn)43多個(gè)樣本均數(shù)比較的方差分析44多因素試驗(yàn)的方差分析、重復(fù)測(cè)量設(shè)計(jì)的方差分析45計(jì)數(shù)資料的統(tǒng)計(jì)描述、二項(xiàng)分布、X2檢驗(yàn)46秩和檢驗(yàn)、雙變量回歸與相關(guān)47多元線(xiàn)性回歸、Logistic回歸48生存分析、統(tǒng)計(jì)總結(jié)43第一章

緒論4一、什么叫統(tǒng)計(jì)學(xué)?

運(yùn)用概率論和數(shù)理統(tǒng)計(jì)原理研究(隨機(jī))事物或現(xiàn)象的群體數(shù)量特征,從而揭示其內(nèi)在規(guī)律的一門(mén)學(xué)科。是正確認(rèn)識(shí)世界的一種重要手段。5統(tǒng)計(jì)學(xué)的地位生物醫(yī)學(xué)實(shí)驗(yàn)室研究臨床研究流行病學(xué)研究公共衛(wèi)生管理……尋求統(tǒng)計(jì)學(xué)家的合作美國(guó)國(guó)立衛(wèi)生研究院(NIH)的基金申請(qǐng)要求合作者有統(tǒng)計(jì)學(xué)家,并必須有統(tǒng)計(jì)設(shè)計(jì)與分析的內(nèi)容。統(tǒng)計(jì)學(xué)——是一門(mén)方法學(xué)6根據(jù)對(duì)國(guó)內(nèi)外公開(kāi)發(fā)表的醫(yī)藥衛(wèi)生論文中的統(tǒng)計(jì)錯(cuò)誤調(diào)查:

粗略估計(jì),70%左右的文章有統(tǒng)計(jì)學(xué)錯(cuò)誤,其中70%的錯(cuò)誤出現(xiàn)在基本的統(tǒng)計(jì)學(xué)方法,30%的錯(cuò)誤出現(xiàn)在高級(jí)的、復(fù)雜的統(tǒng)計(jì)學(xué)方法。論文中的統(tǒng)計(jì)學(xué)錯(cuò)誤是學(xué)習(xí)統(tǒng)計(jì)學(xué)極好的反面教材7觀(guān)察單位的特征—變量

變量的測(cè)定值—變量值(資料)

定量資料(計(jì)量資料)(quantitativedata)

分類(lèi)資料(categoricaldata)

無(wú)序分類(lèi)(unorderedcategories)(計(jì)數(shù)資料)二項(xiàng)分類(lèi)

多項(xiàng)分類(lèi)

有序分類(lèi)(orderedcategories)(等級(jí)資料)二、統(tǒng)計(jì)資料的類(lèi)型8定量資料(計(jì)量資料)(quantitativedata)

用定量方法測(cè)定得到,有大小之分,有度量衡單位。例某年某市抽樣調(diào)查的120名5歲女孩身高(cm),資料如下:105.5118.6110.5104.2110.9107.9108.199.1104.8116.5110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.199.6109.3107.5108.6100.6108.8103.895.3104.4102.7101.0112.1118.7…………………………104.1109.1108.8111.0106.8120.2105.8103.1105.0115.09分類(lèi)資料(categoricaldata)

將觀(guān)察單位按屬性或類(lèi)型分組計(jì)數(shù)所得的資料。其觀(guān)察值是定性的,表現(xiàn)為互不相容的類(lèi)別或?qū)傩?。無(wú)序分類(lèi)(unorderedcategories)

(計(jì)數(shù)資料)

二項(xiàng)分類(lèi)10

多項(xiàng)分類(lèi)11有序分類(lèi)(orderedcategories)(等級(jí)資料)12

表100例高血壓患者治療后臨床記錄患者年齡性別治療組舒張壓體溫療效編號(hào)

X1

X2

X3

X4X5

X6137男A11.2737.5顯效

245女B12.5337.0有效

343男A10.9336.5有效

459女B14.6737.8無(wú)效┆10054男B16.8037.6無(wú)效13案例:大學(xué)生傷害調(diào)查研究casevariable14資料間的相互轉(zhuǎn)化例:以人為單位,測(cè)得一群人Hb值(g/L),此資料為

;按Hb量的多少分為:<60(重度貧血),60~(中度貧血),90~(輕度貧血),120~160(正常)及>160(Hb增高)。此時(shí)資料為

。按Hb正常和異常分為兩類(lèi),此資料為

;分類(lèi)資料數(shù)量化:性別:男—0女—1貧血程度:Hb增高—1,正?!?,輕度貧血—3,中度貧血—4,重度貧血—5。15三、統(tǒng)計(jì)工作的步驟設(shè)計(jì)收集資料整理資料分析資料1)專(zhuān)業(yè)設(shè)計(jì)2)統(tǒng)計(jì)設(shè)計(jì)1)統(tǒng)計(jì)報(bào)表2)醫(yī)療衛(wèi)生工作記錄3)專(zhuān)題調(diào)查和實(shí)驗(yàn)1)對(duì)數(shù)據(jù)檢查、核對(duì)2)按分析要求分組、匯總1)統(tǒng)計(jì)描述2)統(tǒng)計(jì)推斷16第二章

定量資料的統(tǒng)計(jì)描述17例2.2某年某市抽樣調(diào)查的120名5歲女孩身高(cm),資料如下105.5118.6110.5104.2110.9107.9108.199.1104.8116.5110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.199.6109.3107.5108.6100.6108.8103.895.3104.4102.7101.0112.1118.7……………………………………124.0……………104.1109.1108.8111.0106.8120.2105.8103.1105.0115.0第一節(jié)頻數(shù)分布18定量資料的頻數(shù)表和頻數(shù)圖(直方圖)圖2.1某市城區(qū)120名5歲女孩身高頻數(shù)分布表2.2某市120名5歲女孩身高頻數(shù)表組段(cm)頻數(shù)(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-1251合計(jì)120191、頻數(shù)分布的特征(1)集中趨勢(shì)(centraltendency)(2)離散趨勢(shì)(dispersion)20(1)對(duì)稱(chēng)分布其中一種常見(jiàn)的類(lèi)型為正態(tài)分布。(2)偏態(tài)分布有正(左)偏態(tài)、負(fù)(右)偏態(tài)之分。2、頻數(shù)分布的類(lèi)型21表2.2某市120名5歲女孩身高頻數(shù)表組段(cm)頻數(shù)(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-1251合計(jì)1202223第二節(jié)集中趨勢(shì)的描述——平均數(shù)24常用平均數(shù)的意義及其應(yīng)用場(chǎng)合平均數(shù)意義應(yīng)用場(chǎng)合均數(shù)平均數(shù)量水平應(yīng)用甚廣,最適用于對(duì)稱(chēng)分布,特別是正態(tài)分布幾何均數(shù)平均增減倍數(shù)①等比資料;②對(duì)數(shù)正態(tài)分布資料中位數(shù)位次居中的觀(guān)察值水平①偏態(tài)資料;②分布不明資料;③分布一端或兩端出現(xiàn)不確定值251.均數(shù)(mean):

應(yīng)用:正態(tài)分布或近似正態(tài)分布的定量資料。

計(jì)算:1)直接法:2)加權(quán)法:式中:f—各組段的頻數(shù)(相同觀(guān)察值的個(gè)數(shù))

X—各組段的組中值=(下限值+上限值)/2SPSS262.幾何均數(shù)(geometricmean):G計(jì)算:(1)直接法:(2)加權(quán)法27

例:6份血清的抗體效價(jià)為1:10,1:20,1:40,1:80,1:80,1:160,求其平均效價(jià)。

先求平均效價(jià)的倒數(shù):該6份血清抗體的平均效價(jià)為1:45。SPSS28(2)加權(quán)法:例SPSS29

應(yīng)用:(1)變量值呈倍數(shù)關(guān)系(2)對(duì)數(shù)正態(tài)分布何謂對(duì)數(shù)正態(tài)分布?已知:X1,X2,……Xn呈偏態(tài)分布。設(shè):Y1=lgX1,Y2=lgX2,……Yn=lgXn。則:Y1,Y2,……Yn呈正態(tài)分布。

此時(shí),將對(duì)數(shù)值還原為原始數(shù)值,則:303.中位數(shù)(median):M概念:是一組由小到大按順序排列的觀(guān)察值中位次居中的數(shù)值。計(jì)算:(1)直接法:某病患者發(fā)病潛伏期為2、3、3、3、4、5、6、9、16天,求中位數(shù)。若在第20天又發(fā)現(xiàn)1例患者呢?n為奇數(shù)時(shí),n為偶數(shù)時(shí),31(2)頻數(shù)表法:

利用百分位數(shù)計(jì)算公式進(jìn)行計(jì)算.

百分位數(shù)(PX)是一種位置指標(biāo),PX將一組觀(guān)察值分為兩部分, 有X%的觀(guān)察值比它小,有(1-X)%的觀(guān)察值比它大。中位數(shù)是一個(gè)特定的百分位數(shù),即M=P50

。

32百分位數(shù)計(jì)算公式:33例2.5某市大氣中SO2的日平均濃度(μg/m3),求M、P25、P75、P95。M=P50=104.17P25=69.12P75=145.97P95=258.12求M:同理:34應(yīng)用:(1)偏態(tài)分布資料;(2)資料分布一端或兩端有未確定值。集中趨勢(shì)的描述35例:SPSS36第三節(jié)離散趨勢(shì)的描述37描述離散程度的常用指標(biāo)全距(極差)

(R)2、四分位數(shù)間距(Q)3、方差(

2S2)和標(biāo)準(zhǔn)差(、S)4、變異系數(shù)(CV)意義指標(biāo)數(shù)值越小,說(shuō)明觀(guān)察值的變異度越小,平均數(shù)的代表性越好。381.全距(極差)(range,R)意義:

反映一組同質(zhì)觀(guān)察值個(gè)體差異的范圍。計(jì)算:R=Xmax-XminR甲=8;R乙=12;R丙=8。

缺點(diǎn):(1)不能反映組內(nèi)其它觀(guān)察值的變異度。(2)樣本含量越大,則全距可能也越大。392.四分位數(shù)間距(interquartilerange,IQR)

即P75-P25

四分位數(shù)可看作是一組同質(zhì)觀(guān)察值居中的50%變量值的變異范圍。與全距比較有何優(yōu)點(diǎn)?不受極值影響,較穩(wěn)定。應(yīng)用:(1)偏態(tài)分布;(2)資料一端或兩端有未確定值。第三節(jié)離散趨勢(shì)的描述403.方差(variance,

2,

S2)和標(biāo)準(zhǔn)差(standarddeviation,S)

414.標(biāo)準(zhǔn)差:

標(biāo)準(zhǔn)差或方差越大,說(shuō)明個(gè)體差異越大,則均數(shù)的代表性越差。?應(yīng)用:

對(duì)稱(chēng)分布,尤其是正態(tài)分布第三節(jié)離散趨勢(shì)的描述42樣本標(biāo)準(zhǔn)差(S)直接法:加權(quán)法:

S2稱(chēng)為——

樣本方差

式中n-1稱(chēng)為自由度,用希臘字母表示。SPSS43?應(yīng)用:(1)比較單位不同的幾組資料的變異程度(2)比較均數(shù)相差懸殊的幾組資料的變異程度5.變異系數(shù)(CV)44

例某地調(diào)查120名5歲女孩,其身高均數(shù)為110.15cm,標(biāo)準(zhǔn)差為5.86cm;其體重均數(shù)為17.71kg,標(biāo)準(zhǔn)差為1.44kg,試比較兩者變異度。說(shuō)明體重的變異程度較身高大。45第四節(jié)

正態(tài)分布及其應(yīng)用46一、正態(tài)分布的概念47(1)在橫軸上方,均數(shù)處最高,為單峰分布(2)以均數(shù)為中心,左右對(duì)稱(chēng)(3)有兩個(gè)參數(shù),μ

和σ。X~N(μ,σ)(4)正態(tài)曲線(xiàn)下面積分布有一定規(guī)律二、正態(tài)分布的圖形與特征4849三、正態(tài)曲線(xiàn)下面積分布的規(guī)律正態(tài)曲線(xiàn)下某一區(qū)間的面積占總面積的百分?jǐn)?shù)有何意義?即該區(qū)間的例數(shù)占總例數(shù)的百分?jǐn)?shù)(頻數(shù)分布)或觀(guān)察值落在該區(qū)間的概率。5051四、標(biāo)準(zhǔn)正態(tài)分布X~N(0,1)——標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)化變換:u~N(0,1)標(biāo)準(zhǔn)正態(tài)曲線(xiàn)下的面積,φ(u)值(P.695附表1)u=z52五、正態(tài)分布的應(yīng)用1.估計(jì)頻數(shù)分布2.制定參考值范圍3.質(zhì)量控制4.統(tǒng)計(jì)處理方法的基礎(chǔ)53估計(jì)頻數(shù)分布例2.2出生體重低于2500克為低體重兒。若由某項(xiàng)研究得某地嬰兒出生體重均數(shù)為3100克,標(biāo)準(zhǔn)差為300克,估計(jì)該地當(dāng)年出生低體重兒所占比例。出生體重X~N(3100,300)查附表1得:φ(-2.00)=0.0228即X≤2500的比例為2.28%。54制定參考值范圍1)一定數(shù)量(n>100)符合條件的觀(guān)察對(duì)象2)選定適當(dāng)?shù)陌俜纸缦蓿?/p>

如80%、90%、95%和99%,常用為95%。3)確定單側(cè)或雙側(cè)55若取95%界限,雙側(cè):P2.5~P97.5

單側(cè):若高不正常,則<P95

若低不正常,則>P54)方法:a:正態(tài)分布法若取95%界限,雙側(cè):?jiǎn)蝹?cè):若高不正常,則<若低不正常,則>b:百分位數(shù)法5657如何判斷資料是否呈正態(tài)分布?頻數(shù)表和頻數(shù)圖P-P圖或Q-Q圖正態(tài)性檢驗(yàn)581.區(qū)分計(jì)量資料與計(jì)數(shù)資料

實(shí)例1:“小兒皮膚血管瘤雌、孕激素受體的研究”(中華××××雜志×年×月第3期)。該研究采用免疫組化方法對(duì)毛細(xì)血管瘤、混合型血管瘤、海綿狀血管瘤、淋巴管瘤及正常皮膚組織的雌激素受體ER、孕激素受體PR進(jìn)行檢測(cè)。全部標(biāo)本經(jīng)10%福爾馬林固定,常規(guī)石蠟包埋。每例選一典型蠟塊,4-6切片,進(jìn)行免疫組化染色,高倍鏡下每例腫瘤區(qū)內(nèi)計(jì)數(shù)500個(gè)細(xì)胞,計(jì)數(shù)ER、PR陽(yáng)性細(xì)胞百分率,資料見(jiàn)表1。計(jì)量資料統(tǒng)計(jì)描述實(shí)例作者采用卡方檢驗(yàn)比較各組間的差異。

分析:一般認(rèn)為帶有“率”的資料就是定性資料,似應(yīng)判斷為定性資料。然而問(wèn)題的關(guān)鍵在于,原作者的觀(guān)察單位并不是細(xì)胞本身,而是每一個(gè)病例標(biāo)本,作者關(guān)心的是4種疾病病例標(biāo)本和一組正常人標(biāo)本的ER、PR陽(yáng)性細(xì)胞率之均值是否相同,從每一個(gè)病例標(biāo)本中得到的是ER和PR的陽(yáng)性細(xì)胞率,他們是具體的數(shù)值,因而應(yīng)屬于定量資料。

結(jié)論:判斷資料性質(zhì)的關(guān)鍵是把資料還原為基本觀(guān)察單位的具體取值形式,而不要被資料的表現(xiàn)所迷惑。本資料的受試對(duì)象為病例標(biāo)本,測(cè)量指標(biāo)為“陽(yáng)性細(xì)胞百分率”,因而應(yīng)為定量資料。

實(shí)例2:某研究人員為了評(píng)價(jià)一項(xiàng)新的治療方法的效果,將8個(gè)病人隨機(jī)等分為兩組,分別接受兩種治療方法(傳統(tǒng)方法、新方法)。由于療效不適合用客觀(guān)指標(biāo)直接測(cè)量,因此,研究者請(qǐng)專(zhuān)家為不同組的病人治療效果進(jìn)行評(píng)分,最低為0分,最高為4分,分?jǐn)?shù)越高說(shuō)明治療效果越好。各組得分結(jié)果的原始記錄如下,見(jiàn)表2:63作者將上述實(shí)驗(yàn)結(jié)果表達(dá)如下:

傳統(tǒng)方法組:1.05±0.19(n=4)

新方法治療組:2.15±0.44(n=4)64

分析:評(píng)分一般情況下是可以當(dāng)作計(jì)量資料的,比如學(xué)生考試成績(jī)就是一種評(píng)分,可以用來(lái)表示。但本例中的評(píng)分嚴(yán)格來(lái)說(shuō)是一種等級(jí)資料。當(dāng)作計(jì)數(shù)資料進(jìn)行統(tǒng)計(jì)描述和處理更為合適。65662.判斷資料是否服從正態(tài)分布實(shí)例3:“血清腫瘤標(biāo)志在結(jié)直腸癌診斷中的應(yīng)用”(中華檢驗(yàn)醫(yī)學(xué)雜志2000年1月第1期)。該研究探討4種血清腫瘤標(biāo)志在結(jié)直腸癌診斷、手術(shù)效果評(píng)價(jià)、轉(zhuǎn)移復(fù)發(fā)監(jiān)測(cè)中的應(yīng)用價(jià)值。文章研究CEA、CA19-9、CA72-4和CA242四項(xiàng)腫瘤標(biāo)志在患者手術(shù)前、手術(shù)后及轉(zhuǎn)移復(fù)發(fā)方面差異有無(wú)顯著意義,分別檢測(cè)了58例手術(shù)前患者,30例手術(shù)后患者及19例轉(zhuǎn)移復(fù)發(fā)患者,測(cè)量其4項(xiàng)指標(biāo),資料見(jiàn)表4。作者采用了方差分析和t檢查進(jìn)行統(tǒng)計(jì)學(xué)處理。表4手術(shù)前后4項(xiàng)腫瘤標(biāo)志檢測(cè)結(jié)果項(xiàng)目術(shù)前(n=58)術(shù)后(n=30)轉(zhuǎn)移復(fù)發(fā)(n=19)CEA(μg/L)34.0±79.02.0±1.288.0±107.0CA1929(×103u/L)209.0±739.011.0±10.9212.0±529.0CA7224(×103u/L)7.2±4.84.3±2.89.8±

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論