本科統(tǒng)計(jì)復(fù)習(xí)課件_第1頁
本科統(tǒng)計(jì)復(fù)習(xí)課件_第2頁
本科統(tǒng)計(jì)復(fù)習(xí)課件_第3頁
本科統(tǒng)計(jì)復(fù)習(xí)課件_第4頁
本科統(tǒng)計(jì)復(fù)習(xí)課件_第5頁
已閱讀5頁,還剩132頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)教學(xué)的指導(dǎo)思想強(qiáng)調(diào)重點(diǎn):基本概念和常用統(tǒng)計(jì)方法注意難點(diǎn):理解和應(yīng)用中經(jīng)常出錯(cuò)的地方突出應(yīng)用:統(tǒng)計(jì)設(shè)計(jì)、方法選擇、數(shù)據(jù)處理、結(jié)果表達(dá)第1頁,共137頁。第一章 醫(yī)學(xué)統(tǒng)計(jì)學(xué)中的基本概念 第2頁,共137頁。第一章 緒論 第3頁,共137頁。1. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義運(yùn)用統(tǒng)計(jì)學(xué)的原理和方法,研究醫(yī)學(xué)科研中有關(guān)數(shù)據(jù)的搜集、整理和分析的應(yīng)用科學(xué)。第4頁,共137頁。2. 統(tǒng)計(jì)學(xué)的幾個(gè)基本概念同質(zhì)和變異觀察單位總體與樣本變量與資料誤差頻率與概率 第5頁,共137頁。(1)同質(zhì)和變異(Homogeneity, Variation)同質(zhì):屬于同一類別或具有相似觀察值的全部個(gè)體。2008年 廣州市 7歲

2、男孩 的 身高變異(Variation):在同質(zhì)基礎(chǔ)上的個(gè)體差異。2008年 廣州市 7歲 男孩 的 身高第6頁,共137頁。(2)觀察單位a case or an observation統(tǒng)計(jì)研究中的最基本單位,如:1個(gè)人、 1頭動(dòng)物1份樣品、1個(gè)細(xì)胞1個(gè)家庭、1所醫(yī)院第7頁,共137頁。(3)總體與樣本Population and Sample總體:根據(jù)研究目的而確定的同質(zhì)觀察單位的全體,或同質(zhì)的所有觀察單位某種觀察值的集合。廣州2008年7歲正常男童的身高測(cè)量值 (有限總體)研究保列治治療慢性前列腺增生患者的療效(無限總體)樣本:從總體中隨機(jī)抽得的部分觀察單位,其實(shí)測(cè)值的集合。第8頁,共1

3、37頁。(4)變量 Variable 能表現(xiàn)觀察單位變異性的某項(xiàng)指標(biāo),如13歲女孩的身高(cm):160.2,性別(男性,女性)、血型(O,A,B,AB)血清反應(yīng)強(qiáng)度:、+、+、+、+第9頁,共137頁。(5)資料類型計(jì)量資料計(jì)數(shù)資料等級(jí)資料第10頁,共137頁。計(jì)量資料又稱定量資料(quantitative data)或數(shù)值變量資料為測(cè)定每個(gè)觀察單位某項(xiàng)指標(biāo)的大小而獲得的資料,一般有度量衡單位 。如身高(cm)、脈搏(次/分)。根據(jù)觀察值是否連續(xù)?連續(xù)型(continuous)離散型(discrete)第11頁,共137頁。計(jì)數(shù)資料又稱定性資料(qualitative data)或無序分類變

4、量資料是將觀察單位按某種屬性分組計(jì)數(shù)和匯總后得到的資料。表現(xiàn)為互不相容的屬性,各類別之間無程度上的差別。二分類:如性別男、女,試驗(yàn)結(jié)果的陽性、陰性多分類:如血型A 、 B 、 AB 、 O第12頁,共137頁。等級(jí)資料又稱半定量資料,或有序分類變量資料(ordinal data)是將觀察單位按某種屬性的不同程度分成等級(jí)后,分組計(jì)數(shù),分類匯總各組觀察單位后而得到的資料。測(cè)量值不能準(zhǔn)確定量,僅能大致分為幾個(gè)等級(jí)。各等級(jí)之間有程度上的差別。如:化驗(yàn)結(jié)果(、+、+、+、+)疼痛(無,輕、中、重、劇烈)療效(治愈、顯效、好轉(zhuǎn)、無效)第13頁,共137頁。變量間的轉(zhuǎn)化由計(jì)量資料轉(zhuǎn)化為計(jì)數(shù)和等級(jí)資料:如脈搏

5、數(shù)正常(60次/分100次/分) 異常(100次/分)緩脈( P5 單側(cè)上限 +1.64s P95第33頁,共137頁。第四章 抽樣誤差與假設(shè)檢驗(yàn) 第34頁,共137頁。1.均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤抽樣誤差(sampling error):由個(gè)體變異產(chǎn)生,抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異,或同一總體的若干樣本統(tǒng)計(jì)量間的差異。標(biāo)準(zhǔn)誤(standard error):樣本均數(shù)的標(biāo)準(zhǔn)差,也稱均數(shù)的標(biāo)準(zhǔn)誤,說明均數(shù)抽樣誤差的大小。第35頁,共137頁。2. 樣本均數(shù)的抽樣分布從正態(tài)總體中隨機(jī)抽樣,樣本均數(shù)服從正態(tài)分布。從偏態(tài)總體中隨機(jī)抽樣,當(dāng)n足夠大時(shí),樣本均數(shù)也服從正態(tài)分布。第36頁,共137頁。

6、3. t 分 布 的 概 念當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可作正態(tài)變量的t轉(zhuǎn)換: t分布與標(biāo)準(zhǔn)正態(tài)分布的聯(lián)系:t分布只有1個(gè)參數(shù):自由度(=n-1)。 逐漸增大時(shí),t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布。當(dāng)=時(shí),t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布了。 第37頁,共137頁。4. t界值表的使用橫標(biāo)目:自由度(1,2,3,)縱標(biāo)目:概率P(單側(cè):0.25,0.20, 0.0005) (雙側(cè):0.50,0.40, 0.001)t界值:一側(cè)尾部面積為單側(cè)概率,兩側(cè)尾部面積之和稱為雙側(cè)概率。當(dāng)=9時(shí),雙側(cè)概率=0.05時(shí),查t界值表得t0.05/2, 9 = 2.262 第38頁,共137頁。附表2 t分布界值表自由度概率P單側(cè)

7、:0.050.0250.010.005雙側(cè):0.100.050.020.0116.31412.70631.82163.65722.924.3036.9659.92591.8332.2622.8213.250301.6972.0422.4572.7501001.6601.9842.3642.6261.6451.9602.3262.576第39頁,共137頁。5. 總體均數(shù)95%置信區(qū)間的涵義某地12歲男孩身高均數(shù)的95%可信區(qū)間為(138.3,141.0)cm。從理論上說,做100次抽樣,可計(jì)算得100個(gè)置信區(qū)間,平均有95個(gè)置信區(qū)間包括總體均數(shù),只有5個(gè)置信區(qū)間不包括總體均數(shù)。這種估計(jì)方法會(huì)冒

8、5%犯錯(cuò)誤的風(fēng)險(xiǎn)。第40頁,共137頁。6. 均數(shù)的可信區(qū)間與參考值范圍的區(qū)別區(qū)別總體均數(shù)可信區(qū)間參考值范圍含義按預(yù)先給定的概率95%,或(1-),確定的包含未知總體參數(shù)的可能范圍。正常人的解剖、生理、生化等各種數(shù)據(jù)的波動(dòng)范圍。計(jì)算公式用途總體均數(shù)的區(qū)間估計(jì)判定正常和異常的參考標(biāo)準(zhǔn)第41頁,共137頁。7. 標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別區(qū)別標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤含義說明一組計(jì)量資料的離散程度。標(biāo)準(zhǔn)差越小,說明離散程度越?。粯颖纠龜?shù)越大,標(biāo)準(zhǔn)差越趨于穩(wěn)定。反映均數(shù)抽樣誤差的大小。標(biāo)準(zhǔn)誤越小,說明樣本均數(shù)與總體均數(shù)越接近;樣本例數(shù)越大,標(biāo)準(zhǔn)誤越小。計(jì)算公式用途描述離散程度計(jì)算標(biāo)準(zhǔn)誤計(jì)算參考值范圍描述抽樣誤差大小計(jì)算

9、可信區(qū)間進(jìn)行假設(shè)檢驗(yàn)第42頁,共137頁。8. 假設(shè)檢驗(yàn)的基本原理例5.1 以往通過大規(guī)模調(diào)查已知某地一般新生兒出生體重均值為3.30kg。從該地難產(chǎn)兒中隨機(jī)抽取35名新生兒作為研究樣本,平均出生體重為3.42kg,標(biāo)準(zhǔn)差為0.40kg。問該地難產(chǎn)兒出生體重是否與一般新生兒體重不同?某地一般新生兒出生體重均值 0=3.30 kg某地難產(chǎn)新生兒出生體重均值已知總體未知總體 X3.42kgS= 0.40kgn=35第43頁,共137頁。樣本均數(shù)與已知總體均數(shù)不等可能有兩種原因造成(1) 0 ,抽樣誤差所致:該地難產(chǎn)兒與一般新生兒平均出生體重相同 。(2) 0,除了抽樣誤差外,還有其它因素所致:該地

10、難產(chǎn)兒與一般新生兒平均出生體重不同 。 這種不同,有多大的可能性由抽樣誤差造成?如果抽樣誤差造成的可能性很小,則認(rèn)為 0 先假設(shè) 0 ,看由于抽樣誤差造成的可能性(P值)有多大?怎樣計(jì)算P值的大小呢?第44頁,共137頁。怎樣計(jì)算P值的大小呢?若假設(shè) 0 ,則可用公式計(jì)算t值,由t值求得P值。如果樣本均數(shù)與0相差較遠(yuǎn),t值就大,P值就小。當(dāng)P小于或等于預(yù)先規(guī)定的概率值(如0.05),則為小概率事件,即在一次抽樣中發(fā)生的可能性很小,如果它發(fā)生了,則有理由懷疑原假設(shè) 0可能不成立,認(rèn)為其對(duì)立面 0成立。該結(jié)論的正確性冒著犯5%錯(cuò)誤的風(fēng)險(xiǎn)。t0.05/2,34=2.032第45頁,共137頁。附表2

11、 t分布界值表(P195)自由度概率P=n-1單側(cè):0.050.0250.010.005雙側(cè):0.100.050.020.0116.31412.70631.82163.65722.924.3036.9659.92591.8332.2622.8213.250111.7962.2012.7183.106341.6912.0322.4412.7281001.6601.9842.3642.6261.6451.9602.3262.576第46頁,共137頁。2. 假設(shè)檢驗(yàn)的基本步驟建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)選定檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量確定P值,作出推斷結(jié)論第47頁,共137頁。(1) 建立檢驗(yàn)假設(shè),確定檢驗(yàn)

12、水準(zhǔn)檢驗(yàn)假設(shè),用H0表示 H0 : 假設(shè)未知總體均數(shù)等于已知總體均數(shù) =0 或假設(shè)兩個(gè)總體均數(shù)相等 1 =2備擇假設(shè),用H1表示:若H0被拒絕,則該假設(shè)成立。 0 或 1 2確定檢驗(yàn)水準(zhǔn):確定H0成立,但被拒絕的概率的界值。它確定了小概率事件的大小,常取 =0.05。第48頁,共137頁。(2) 選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)資料類型、設(shè)計(jì)方案、檢驗(yàn)方法的適用條件等 ,選擇適當(dāng)?shù)臋z驗(yàn)方法和統(tǒng)計(jì)量。第49頁,共137頁。(3) 確定P值,作出推斷結(jié)論(1)P值的含義: 指從H0規(guī)定的總體隨機(jī)抽得(或)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值(如t)的概率。(2)判斷準(zhǔn)則:當(dāng)P 時(shí),拒絕H0,接受H1,認(rèn)為差

13、異有統(tǒng)計(jì)學(xué)意義(統(tǒng)計(jì)結(jié)論) ;可認(rèn)為不同或不等(專業(yè)結(jié)論)當(dāng)P時(shí),不拒絕H0,認(rèn)為差異無統(tǒng)計(jì)學(xué)意義(統(tǒng)計(jì)結(jié)論)。還不能認(rèn)為不同或不等(專業(yè)結(jié)論)第50頁,共137頁。第五章 t 檢驗(yàn) 第51頁,共137頁。1. t檢驗(yàn)的種類單樣本t檢驗(yàn)配對(duì)樣本均數(shù)t檢驗(yàn)兩獨(dú)立樣本均數(shù)t檢驗(yàn)第52頁,共137頁。2. 單樣本 t 檢驗(yàn)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0:=0 ,該地難產(chǎn)兒與一般新生兒平均出生體重相同 H1:0,該地難產(chǎn)兒與一般新生兒平均出生體重不同=0.05計(jì)算檢驗(yàn)統(tǒng)計(jì)量第53頁,共137頁。 確定P值,作出推斷結(jié)論=34, t=1.77,查附表2,t界值表,得t0.05/2,34=2.032,因?yàn)?/p>

14、t 0.05。按=0.05水準(zhǔn),不拒絕H0。根據(jù)現(xiàn)有樣本信息,尚不能認(rèn)為該地難產(chǎn)兒與一般新生兒平均出生體重不同。第54頁,共137頁。3. 配對(duì)樣本均數(shù) t 檢驗(yàn)配對(duì)設(shè)計(jì):兩個(gè)同質(zhì)受試對(duì)象分別接受兩種不同的處理同一受試對(duì)象分別接受兩種不同的處理同一受試對(duì)象處理前后第55頁,共137頁。4. 兩獨(dú)立樣本均數(shù) t 檢驗(yàn)分別從兩個(gè)研究總體中隨機(jī)抽取樣本,然后比較兩組的平均效應(yīng);隨機(jī)抽取實(shí)驗(yàn)對(duì)象,將其隨機(jī)分成兩組,分別接受兩種不同處理,然后比較兩組的平均效應(yīng)。第56頁,共137頁。5. t 檢驗(yàn)的應(yīng)用條件n較小時(shí)(如n1或n260),理論上要求樣本取自正態(tài)總體兩小樣本均數(shù)比較時(shí),要求兩總體方差相等。第

15、57頁,共137頁。6. 假設(shè)檢驗(yàn)中兩類錯(cuò)誤I型錯(cuò)誤,即檢驗(yàn)水準(zhǔn)。拒絕了實(shí)際上成立的H0 。一般取0.05。II型錯(cuò)誤,。接受了實(shí)際上不成立的 H0。 檢驗(yàn)效能, power of a test ,1。兩總體確有差異,按規(guī)定檢驗(yàn)水準(zhǔn)能發(fā)現(xiàn)該差異的能力。第58頁,共137頁。第六章 方 差 分 析 第59頁,共137頁。1. 方差分析的基本原理 第60頁,共137頁。總變異 = 組間變異 + 組內(nèi)變異表6.1 糖尿病患者、IGT異常及正常人的載脂蛋白測(cè)定結(jié)果糖尿病IGT正常人85.7096.00144.00105.20124.50117.00111.0099.00159.00106.50120.

16、00115.00均數(shù)105.45(11)102.39(9)122.80(10)第61頁,共137頁。全部實(shí)驗(yàn)結(jié)果存在三種不同的變異F= MS組間 / MS組內(nèi)總變異:全部實(shí)驗(yàn)數(shù)據(jù)大小不等。組間變異:各處理組的樣本均數(shù)也大小不等:用表示MS組間表示組內(nèi)變異:各處理組內(nèi)部觀察值大小不等 用MS組內(nèi)表示第62頁,共137頁。F= MS組間 / MS組內(nèi)如果各樣本均數(shù)來自同一總體(0: m1=m2 =mk),即 各組均數(shù)之間無差別,則組間變異與組內(nèi)變異均只能反映隨機(jī)誤差,這時(shí)的F 值應(yīng)接近1。若各樣本均數(shù)不是來自同一總體,組間變異應(yīng)較大, F 值將明顯大于1,則不能認(rèn)為組間的變異僅反映隨機(jī)誤差,也就是

17、認(rèn)為處理因素有作用。第63頁,共137頁。2. 完全隨機(jī)設(shè)計(jì)的方差分析表6-2 三組足球運(yùn)動(dòng)員(36名)的第一秒用力肺活量(L)對(duì)照組藥物組I藥物組II3.253.713.493.373.693.673.343.533.533.393.693.413.213.533.573.693.253.653.333.673.373.573.493.213.313.873.333.653.613.493.233.453.323.313.523.41第64頁,共137頁。3. 隨機(jī)區(qū)組設(shè)計(jì)的方差分析先將全部受試對(duì)象按某種或某些特征分為若干個(gè)區(qū)組(block),使每個(gè)區(qū)組內(nèi)的觀察對(duì)象隨機(jī)地接受研究因素某一水平

18、的處理。不同藥物作用后小白鼠肉瘤重量(g) 區(qū)組A藥B藥C藥合計(jì)10.820.650.511.9820.730.540.231.5030.430.340.281.0540.410.210.310.9350.680.430.241.35均數(shù)0.6140.434 0.314 SS總=SS處理+SS區(qū)組+SS誤差第65頁,共137頁。4.多個(gè)樣本均數(shù)間的兩兩比較多個(gè)樣本均數(shù)每?jī)蓚€(gè)均數(shù)間的兩兩比較常用的統(tǒng)計(jì)方法是:SNK(組數(shù)多少均可) Bonferroni(組數(shù)少,4組以內(nèi)),Tukey (組數(shù)多,5組以上) ,Tamhanes T2(方差不齊,結(jié)論較保守) 。多個(gè)實(shí)驗(yàn)組與一個(gè)對(duì)照組均數(shù)間的兩兩比較

19、常用的統(tǒng)計(jì)方法是Dunnett - t 。第66頁,共137頁。Multiple Comparisons第67頁,共137頁。第七章 相對(duì)數(shù)及其應(yīng)用 第68頁,共137頁。1. 相對(duì)數(shù)的概念及計(jì)算率構(gòu)成比相對(duì)比計(jì)數(shù)資料的統(tǒng)計(jì)描述常用相對(duì)數(shù)第69頁,共137頁。(1)率定義:說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。是兩個(gè)絕對(duì)數(shù)之比,與時(shí)間有關(guān)系。公式: 某時(shí)期內(nèi)發(fā)生某現(xiàn)象的觀察單位數(shù)率= 比例基數(shù) 同期可能發(fā)生某現(xiàn)象的觀察單位總數(shù) 比例基數(shù): %、 %o 、 1/萬、 1/10萬比例基數(shù)的選擇:習(xí)慣用法;保留12位整數(shù) 第70頁,共137頁。 發(fā)病率: 一般用于急性病調(diào)查例:某地2000年急性甲肝流行,10

20、00人中有50人發(fā)病,則: 甲肝發(fā)病率=50/1000 100%=5% 第71頁,共137頁。 患病率:一般用于慢性病調(diào)查例:2003年某工廠職工體檢,2000名受檢者中患高血壓的有20人,則: 高血壓患病率=20/2000 100%=10%第72頁,共137頁。 同年內(nèi)死亡總?cè)藬?shù)粗死亡率 = 1000%o 某年平均人口數(shù) 同年內(nèi)某死因死亡人數(shù)某死因死亡率 = 100000/10萬 某年平均人口數(shù) 因某病死亡人數(shù)某病病死率 = 100% 同期某病病人數(shù)第73頁,共137頁。非典死亡率高不高?人民日?qǐng)?bào)(2003年04月25日第十四版) “非典死亡率在5左右,同普通肺炎的死亡率差不多?!边@是本報(bào)記

21、者日前采訪北京協(xié)和醫(yī)院呼吸科主任蔡柏薔教授時(shí),蔡教授一再強(qiáng)調(diào)的。分析:該結(jié)論對(duì)嗎?病死率?死亡率?第74頁,共137頁。(2) 構(gòu)成比定義:表示事物內(nèi)部某一部分的個(gè)體數(shù)與各部分個(gè)體數(shù)的總和之比。分子是分母的一部分,與時(shí)間無關(guān)系。 公式: 某一組成部分的觀察單位數(shù) 構(gòu)成比 = 100% 同一事物各部分的觀察單位總數(shù)第75頁,共137頁。 構(gòu)成比的兩個(gè)特點(diǎn)同一事物的k個(gè)構(gòu)成比之和為100%各構(gòu)成部分之間相互影響某部分自身數(shù)值的變化其它部分?jǐn)?shù)值的變化第76頁,共137頁。(3)相對(duì)比定義:兩個(gè)有關(guān)指標(biāo)之比, 常用倍數(shù)或百分?jǐn)?shù)表示。兩個(gè)指標(biāo)的量綱可以相同,也可以不同,但互不包含。 公式: 甲指標(biāo) 相對(duì)

22、比= (或 100%) 乙指標(biāo)計(jì)算相對(duì)比的兩個(gè)指標(biāo)可以是絕對(duì)數(shù)、相對(duì)數(shù)、平均數(shù)。第77頁,共137頁。 舉例:性別比: 男:女 中國(guó)人口比例為1.06 :1某城區(qū)與郊區(qū)肺癌死亡率之比:城區(qū)為19.3910萬,郊區(qū)為9.99 10萬,則19.399.99=1.94 或 9.99 19.39 100%=55.52%醫(yī)院的門診人次與床位數(shù)之比:三級(jí)甲等醫(yī)院一般應(yīng)達(dá)到 46:1第78頁,共137頁。2. 應(yīng)用相對(duì)數(shù)應(yīng)注意的問題不要把構(gòu)成比與率相混淆分母不宜過小要注意資料的可比性:除了要比較的處理因素外,其他條件應(yīng)基本相同對(duì)樣本率或構(gòu)成比的比較應(yīng)作假設(shè)檢驗(yàn)比較兩個(gè)內(nèi)部構(gòu)成不同的資料,要注意使用率的標(biāo)準(zhǔn)化

23、第79頁,共137頁。已婚育齡婦女不同情況下放環(huán)失敗率的比較放環(huán)情況放環(huán)人數(shù)失敗人數(shù)失敗人數(shù)比失敗率(%)人工流產(chǎn)后 255 78 61.9 30.6月經(jīng)后 87 39 31.0 44.8哺乳期 17 9 7.1 52.9合計(jì) 359 126 100.0 35.1第80頁,共137頁。 3. 率的標(biāo)準(zhǔn)誤率的抽樣誤差:由抽樣造成的樣本率和總體率的差別。率的標(biāo)準(zhǔn)誤:描述率的抽樣誤差大小,公式為:第81頁,共137頁。4. 總體率的區(qū)間估計(jì) 由樣本率P(X/n)估計(jì)總體率的1-可信區(qū)間。正態(tài)近似法查表法第82頁,共137頁。第八章 2檢驗(yàn) 第83頁,共137頁。1. 2檢驗(yàn)的主要用途 (chi-sq

24、uare Test)推斷兩個(gè)或兩個(gè)以上的總體率(或構(gòu)成比)之間有無差別,兩個(gè)分類變量之間有無關(guān)聯(lián)。第84頁,共137頁。(1)兩個(gè)樣本率比較表1 兩組降低顱內(nèi)壓有效率的比較組別有效無效合計(jì)有效率(%)試驗(yàn)組99510495.20對(duì)照組75219678.18合計(jì)1742620087.00第85頁,共137頁。(2)多個(gè)樣本率比較表2 三種療法有效率的比較 療法有效無效合計(jì)有效率(%)物理療法組199720696.60藥物治療組1641818290.11外用膏藥組1182614481.94合計(jì)4815153290.41第86頁,共137頁。(3)雙向無序分類資料的關(guān)聯(lián)性檢驗(yàn)表3 某地5801人的血

25、型ABO血型MN血型MNMN合計(jì)A4314909021823B3884108001598AB4955879502032合87頁,共137頁。(4)配對(duì)資料:兩種檢測(cè)結(jié)果有無差別?表7-3 兩種方法的檢測(cè)結(jié)果 免疫熒光法 乳膠凝集法 合計(jì)+11(a)12(b)232(c)33(d)35合計(jì)134558免疫:23/ 58= 0.397乳膠:13 /58= 0.224第88頁,共137頁。 2. 兩個(gè)樣本率比較時(shí)的方法選擇基本公式: 專用公式: 應(yīng)用條件:n40,T5。 校正公式: 應(yīng)用條件:n40,1T5。 確切概率法 應(yīng)用條件: n 40,或 T 1第89頁,共137頁

26、。3. 行列表2檢驗(yàn)時(shí)的注意事項(xiàng)當(dāng)有1/5及以上格子的理論頻數(shù)T5,或有1個(gè)格子T1時(shí),應(yīng)該與相鄰組合并(但要合理),或增加樣本例數(shù)。結(jié)論為拒絕H0,是認(rèn)為各總體率不等或不全相等(其中至少有兩個(gè)總體率不等)。若為單向有序行列表,當(dāng)指標(biāo)(效應(yīng))分組是有序時(shí),一般用秩和檢驗(yàn)分析更為適宜。雙向有序行列表不適合用2檢驗(yàn)進(jìn)一步的兩兩比較,可用行列表的分割。第90頁,共137頁。第九章 非參數(shù)檢驗(yàn) 第91頁,共137頁。1. 非參數(shù)統(tǒng)計(jì)的適用情況等級(jí)資料偏態(tài)分布或分布不明(尤其n 0為正相關(guān), r0為負(fù)相關(guān),|r|愈接近1,說明兩變量關(guān)系愈密切。總體相關(guān)系數(shù)用表示第106頁,共137頁。3. 線性相關(guān)系數(shù)

27、的假設(shè)檢驗(yàn)r0.8012是樣本相關(guān)系數(shù)即使X、Y的總體相關(guān)系數(shù)為零,但由于抽樣誤差,其樣本相關(guān)系數(shù)r也不一定為零,因此需作是否為零的假設(shè)檢驗(yàn)。根據(jù) r 做總體相關(guān)系數(shù) 是否為0的假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)方法查r 界值表t 檢驗(yàn)第107頁,共137頁。4. 進(jìn)行線性相關(guān)分析的注意事項(xiàng)首先繪制散點(diǎn)圖兩個(gè)變量都服從正態(tài)分布對(duì)樣本相關(guān)系數(shù)要進(jìn)行假設(shè)檢驗(yàn)相關(guān)系數(shù)有統(tǒng)計(jì)學(xué)意義不等于兩者存在因果關(guān)系。第108頁,共137頁。5. 線性回歸的 基本概念當(dāng)一個(gè)變量X改變時(shí),另一個(gè)變量Y也相應(yīng)改變:稱X為自變量(independent variable)稱Y為因變量(dependent variable)當(dāng)這兩個(gè)變量之間

28、存在直線關(guān)系時(shí),不僅可以用相關(guān)系數(shù)表示變量Y與X線性關(guān)系的密切程度,也可以用一個(gè)直線方程Y=a+bX表示Y與X的線性關(guān)系。尋求一個(gè)直線方程來描述兩個(gè)變量間依存變化近似的線性數(shù)量關(guān)系,稱線性回歸關(guān)系。第109頁,共137頁。6. 線性回歸方程的形式a為常數(shù)項(xiàng)(constant),是直線的截距;b為回歸系數(shù)(regression coefficient),是直線的斜率。它的統(tǒng)計(jì)學(xué)意義是:X 每增(減)一個(gè)單位,Y平均改變b個(gè)單位。 為給定X時(shí)Y的估計(jì)值 第110頁,共137頁。7. 線性回歸方程的應(yīng)用確定兩變量間是否存在依存關(guān)系,利用回歸方程描述X和Y之間的數(shù)量關(guān)系利用回歸方程對(duì)Y進(jìn)行估計(jì)由易測(cè)變

29、量估計(jì)難測(cè)變量,如由體重估計(jì)體表面積由現(xiàn)在的變量值來預(yù)測(cè)將來的變量值如用孕期28周時(shí)的宮底高度(X)預(yù)測(cè)新生兒體重(Y)第111頁,共137頁。8. 線性回歸方程的假設(shè)檢驗(yàn) 即使X、Y的總體回歸系數(shù)為零,但由于抽樣誤差,其樣本回歸系數(shù)b也不一定為零,因此需作是否為零的假設(shè)檢驗(yàn)。只有0,所擬合的樣本直線回歸方程才有意義??蛇M(jìn)行樣本回歸系數(shù)b和總體回歸系數(shù)0比較的方差分析 或t檢驗(yàn)。 第112頁,共137頁。 9. 線性相關(guān)與回歸的區(qū)別資料要求:回歸要求因變量Y服從正態(tài)分布,自變量X可以選定,也可以服從正態(tài)分布;相關(guān)要求兩個(gè)變量都服從正態(tài)分布。兩個(gè)變量之間的關(guān)系:線性相關(guān)表示兩個(gè)變量之間的相互關(guān)系

30、是雙向的回歸則反映兩個(gè)變量之間的依存關(guān)系,是單向的。b和r意義:b表示X每增(減)一個(gè)單位,Y平均改變b個(gè)單位r說明具有直線關(guān)系的兩個(gè)變量間相關(guān)關(guān)系的密切程度與相關(guān)方向。第113頁,共137頁。10. 直線回歸與相關(guān)的聯(lián)系b 和 r 的正負(fù)號(hào)一致,假設(shè)檢驗(yàn)等價(jià)(t r = t b)相關(guān)回歸可以互相解釋 確定系數(shù)(Coefficient of determination ) R2=r2=SS回/SS總 例如: r=0.20,n=100時(shí),可按檢驗(yàn)水準(zhǔn)0.05拒絕H0,接受H1,認(rèn)為兩變量有相關(guān)關(guān)系。 但 r =(0.20)2 = 0.04,表示回歸平方和在總平方和中僅占4%,說明兩變量間的相關(guān)系

31、數(shù)實(shí)際意義不大。第114頁,共137頁。11. 應(yīng)用線性回歸時(shí)應(yīng)注意的問題不能把毫無關(guān)聯(lián)的兩種現(xiàn)象作回歸分析。散點(diǎn)圖有助于判斷觀察點(diǎn)的分布(直線趨勢(shì)或曲線趨勢(shì)?),還能提示資料又無可疑異常點(diǎn)。對(duì)樣本回歸系數(shù)應(yīng)進(jìn)行假設(shè)檢驗(yàn)直線回歸方程的實(shí)用范圍一般以自變量的取值范圍為限,應(yīng)避免外延。要推斷兩變量間相關(guān)的緊密程度,樣本含量必須很大,如n 100 ?;貧w關(guān)系不一定是因果關(guān)系。第115頁,共137頁。12. 等級(jí)相關(guān)rank correlation,其中Spearman correlation 最常用應(yīng)用條件:X和Y都為隨機(jī)變量,但不服從雙變量正態(tài)分布(如相對(duì)數(shù)、等級(jí)變量)。公式: 當(dāng)n50時(shí),可查r

32、 s 界值表進(jìn)行假設(shè)檢驗(yàn)。第116頁,共137頁。第十二章 統(tǒng)計(jì)表與統(tǒng)計(jì)圖 第117頁,共137頁。1. 統(tǒng)計(jì)表的結(jié)構(gòu)標(biāo)題:表號(hào)??jī)?nèi)容?位置?標(biāo)目:橫標(biāo)目:描述的對(duì)象,位于表的左側(cè),向右說明各行數(shù)字的涵義 縱標(biāo)目:描述的指標(biāo),位于表的右側(cè),向下說明各列數(shù)字的涵義 線條:幾條線?粗細(xì)?數(shù)字:小數(shù)點(diǎn)和位數(shù)?某格缺失數(shù)據(jù)?無數(shù)據(jù)?備注:文字和說明表1 2004年全國(guó)傳染病死亡數(shù)居前五位的病種病種死亡例數(shù)構(gòu)成比狂犬病2651 37.07肺結(jié)核1435 20.07乙型肝炎 783 10.95艾滋病 741 10.36新生兒破傷風(fēng) 300 4.20其它1241 17.35合計(jì)7151100.00第118頁

33、,共137頁。2. 統(tǒng)計(jì)表的種類簡(jiǎn)單表:研究對(duì)象僅按1個(gè)變量分組(分類變量的不同類別,如研究對(duì)象只按性別分組;或連續(xù)變量的不同水平,如研究對(duì)象只按年齡組分組)第119頁,共137頁。 復(fù)合表(組合表):研究對(duì)象按2個(gè)及以上變量分組,如研究對(duì)象按病型和療法分組。一般把其中主要的或分項(xiàng)較多的變量作為橫標(biāo)目,其余變量安排在縱標(biāo)目。表4 甲、乙兩種療法治療某病的治愈率比較病型甲療法乙療法病人數(shù)治愈數(shù)治愈率(%)病人數(shù)治愈數(shù)治愈率(%)普通型30018060.0100 6565.0重型100 3535.030012541.7合計(jì)40021553.840019047.5第120頁,共137頁。3. 編制統(tǒng)

34、計(jì)表的注意事項(xiàng)統(tǒng)計(jì)表不一定是唯一的內(nèi)容:龐雜線條:粗細(xì)不分,有豎線和斜線數(shù)字:不準(zhǔn)確,數(shù)字位數(shù)未對(duì)齊標(biāo)題:不明確,不精練標(biāo)目:橫標(biāo)目、縱標(biāo)目 安排不當(dāng)假設(shè)檢驗(yàn)結(jié)果的表達(dá):統(tǒng)計(jì)量與 P 值問題第121頁,共137頁。4. 常用統(tǒng)計(jì)圖的用途及繪制要點(diǎn)條圖(bar chart)線圖(line chart )直方圖(histogram)誤差條圖(error bar )箱圖(boxplot )構(gòu)成圖:圓圖(pie chart )散點(diǎn)圖(scatterplot )第122頁,共137頁。第十三章 醫(yī)學(xué)實(shí)驗(yàn)設(shè)計(jì)與診斷試驗(yàn)的評(píng)價(jià) 第123頁,共137頁。處理因素是人為設(shè)置的。受試對(duì)象接受何種處理因素是隨機(jī)分配而定的。1. 實(shí)驗(yàn)研究的特點(diǎn)第124頁,共137頁。2. 實(shí)驗(yàn)研究設(shè)計(jì)的三個(gè)基本要素例: 用某 降壓藥 治療 高血壓病人, 觀察其 血壓值的下降

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論