統(tǒng)計(jì)方法介紹_第1頁(yè)
統(tǒng)計(jì)方法介紹_第2頁(yè)
統(tǒng)計(jì)方法介紹_第3頁(yè)
統(tǒng)計(jì)方法介紹_第4頁(yè)
統(tǒng)計(jì)方法介紹_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)方法介紹,根據(jù)不同的資料類型及不同的統(tǒng)計(jì)要求選擇不同的統(tǒng)計(jì)方法。,資料類型:,資料一般可分成三大類:計(jì)量資料、計(jì)數(shù)資料和等級(jí)資料。 (1)計(jì)量資料: 它是測(cè)量每個(gè)觀察單位某項(xiàng)指標(biāo)值的大小所得的資料。 (2)計(jì)數(shù)資料:將觀察單位按某種屬性或類別分組計(jì)數(shù),得到各類別觀察單位計(jì)數(shù)的資料,稱為計(jì)數(shù)資料。 (3)等級(jí)資料又稱為半定量資料:將觀察單位按某種屬性的不同程度分組計(jì)算所得出的各個(gè)不同程度的觀察單位計(jì)數(shù)的資料。,統(tǒng)計(jì)分析方法: (1)統(tǒng)計(jì)描述:指用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)表、統(tǒng)計(jì)圖等方法,對(duì)資料的數(shù)量特征及其分布規(guī)律進(jìn)行描述。 (2)統(tǒng)計(jì)推斷:指用樣本推斷總體,主要是假設(shè)檢驗(yàn),例如檢驗(yàn):兩個(gè)總體均數(shù)是否

2、有差異,兩總體率是否有差異,兩個(gè)因素之間是否有關(guān)。 (3)因素之間的關(guān)系:如相關(guān)和回歸分析等。,一. 計(jì)量資料的描述性統(tǒng)計(jì),1. 計(jì)量資料的描述性統(tǒng)計(jì)指標(biāo)包括: (1)集中位置的指標(biāo),用以描述觀察值的平均水平。 如算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)等。 (2)資料變異的指標(biāo),用以描述觀察值間參差不齊的程度,即離散度或稱變異度。 如全距、標(biāo)準(zhǔn)差、方差、變異系數(shù)、四分位數(shù)間距等。,(1)算術(shù)平均數(shù),簡(jiǎn)稱為均數(shù)。觀察值全部相加再除以總例數(shù)。均數(shù)適用于服從對(duì)稱分布的計(jì)量資料,尤其是正態(tài)分布的資料 (2)幾何均數(shù)。用G表示, 為觀察值的總乘積開n 次方根。常用對(duì)數(shù)計(jì)算,求對(duì)數(shù)值的均數(shù)。再查反對(duì)數(shù)得出G

3、。幾何均數(shù)適用于成倍數(shù)關(guān)系的資料,如抗體滴度、效價(jià)等,也用于對(duì)數(shù)正態(tài)分布的資料如某些傳染病的潛伏期、細(xì)菌計(jì)數(shù)等。 (3)中位數(shù):用M表示,它將總體或樣本的全部觀察 值分成兩部分,每部分各有50%個(gè)觀察值。,中位數(shù)計(jì)算方法為:先將原始觀察值按由小到大順序排列后,位次處于中間的那個(gè)觀察值為中位數(shù)。觀察值數(shù)為奇數(shù)時(shí),處于中間的那個(gè)數(shù)為中位數(shù),偶數(shù)時(shí)處于中間的兩個(gè)數(shù)的均數(shù)為中位數(shù)。 中位數(shù)適用于表示任何分布資料的平均水平。但常用于非正態(tài)分布資料。由于中位數(shù)不受個(gè)別特大,特小數(shù)值的影響, 因此它比均數(shù)穩(wěn)健,常用于資料分布不明,或明顯偏態(tài), 或分布的一端無確定值的情況。,(4)百分位數(shù):第X百分位數(shù)以Px

4、表示,它將全部觀察值分成二個(gè)部分,其中有x%個(gè)觀察值小于Px, (100-x)%個(gè)觀察值大于Px。 用途:1.描述一組資料在各個(gè)百分位置上的水平,用一組百分位數(shù)如P5,P25, P50, P75, P95,可以描述總體或樣本的分布特征,如集中位置、變異度等。 2.確定醫(yī)學(xué)正常值范圍。,X%,(100-X)%,PX,P25稱為第1四分位數(shù);記為Q1。 P50稱為第2四分位數(shù);記為Q2,就是中位數(shù)M P75稱為第3四分位數(shù);記為Q3。,(5)全距:是最大與最小觀察值之差。 全距計(jì)算方便,但僅利用最大與最小二個(gè)數(shù)據(jù)來代表全部數(shù)據(jù)的離散程度,信息利用差。全距受特大與特小值影響大,不穩(wěn)定。 通常:最小值

5、最大值, 如:3.9805.875,(6)標(biāo)準(zhǔn)差與方差: 標(biāo)準(zhǔn)差常用SD表示,方差是標(biāo)準(zhǔn)差的平方。標(biāo)準(zhǔn)差是一種常用的離散指標(biāo),結(jié)合均數(shù)能給出正態(tài)分布的特征。實(shí)際應(yīng)用時(shí)常以均數(shù)標(biāo)準(zhǔn)差的寫法綜合觀察值的集中和離散特征。 (7)變異系數(shù):變異系數(shù)是一種離散指標(biāo),簡(jiǎn)記為CV,它是標(biāo)準(zhǔn)差與均數(shù)之比,用百分?jǐn)?shù)表達(dá)。 由于CV無量度單位,而且消除了原始資料的平均水平的影響,因此常用于比較量度單位不相同的指標(biāo)或者平均水平相差懸殊的指標(biāo)的變異程度。,(8)四分位數(shù)間距: 四分位數(shù)間距是第3四分位數(shù)與第1四分位 數(shù)之差,即P75P25。 四分位數(shù)間距受特大值或特小值影響小, 較穩(wěn)定。 中位數(shù)和四分位數(shù)間距相結(jié)合常

6、用于表示 非正態(tài)分布資料的平均水平和離散程度。,t檢驗(yàn)也稱為Student t檢驗(yàn)。主要用于兩組計(jì)量資料比較的顯著性檢驗(yàn)。包括:樣本均數(shù)與總體均數(shù)的比較,兩配對(duì)樣本均數(shù)的比較和非配對(duì)兩樣本均數(shù)的比較。,二.t檢驗(yàn),樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn) 檢驗(yàn)樣本是否來自均數(shù)為0的已知總體 。 如:要研究現(xiàn)在13歲男孩的身高是否比20年前的13歲男孩高。 20年前的13歲男孩平均身高為1.30?,F(xiàn)測(cè)量了13歲男孩100名平均身高為1.35,標(biāo)準(zhǔn)差為0.12,要檢驗(yàn)現(xiàn)在13歲男孩身高的總體均數(shù)是否高于1.30。,2. 配對(duì)t檢驗(yàn),處理前后的比較 例號(hào) 用藥前 用藥后 1 118 112 2 110 98

7、10 122 108 治療前后舒張壓的改變,兩種處理的比較 對(duì)子號(hào) A藥 B藥 1 0.2 -0.1 2 1.0 1.8 10 0.4 0.8 兩種藥物治療白細(xì)胞降低療效的比較(表中為白細(xì)胞升高數(shù))。,團(tuán)體t檢驗(yàn) 用于非配對(duì)兩樣本均數(shù)的比較。 如:兩組雌鼠,分別飼以高蛋白和低蛋白飼料, 8周后記錄各鼠體重增加量(克)如下,問兩組動(dòng)物增重的均數(shù)差別是否顯著? 高蛋白組: 134 146 104 119 124 161 107 83 113 129 97 123 低蛋白組: 70 118 101 85 107 132 94,t檢驗(yàn)的條件 1. 樣本均數(shù)和總體均數(shù)比較的t檢驗(yàn): 樣本來自正態(tài)分布的總

8、體。 2 . 配對(duì)t檢驗(yàn): 差值的總體為正態(tài)分布。 3 . 團(tuán)體t檢驗(yàn): 1)兩個(gè)樣本都來自正態(tài)分布的總體。 2)兩個(gè)總體方差相等。,t檢驗(yàn)條件不滿足時(shí)的對(duì)策,1. 進(jìn)行變量變換,如對(duì)數(shù)變換,變換成正態(tài)分布后再進(jìn)行t檢驗(yàn)。 2. 用非參數(shù)檢驗(yàn)的方法。 3 . 兩樣本比較的t檢驗(yàn)時(shí),如正態(tài)分布但方差不齊,可用t檢驗(yàn)。,方差分析主要用于檢驗(yàn)計(jì)量資料中兩個(gè)或兩個(gè)以上樣本均數(shù)間差別的顯著性。 常見的錯(cuò)誤是進(jìn)行各組之間的兩兩t檢驗(yàn)。這將增加第一類誤差的概率。 兩組以上均數(shù)的比較不能用兩兩t檢驗(yàn),而必須用方差分析。如差別有統(tǒng)計(jì)學(xué)意義,然后再進(jìn)一步用SNK等方法作兩兩比較。,三. 方差分析,例: 小白鼠給藥

9、前后發(fā)生咳嗽的推遲時(shí)間(秒) 復(fù)方 復(fù)方 可待因 40 50 60 15 -10 30 -5 105 77 例數(shù) 15 15 10 均值 31.67 44 60.7 ,隨機(jī)單位組設(shè)計(jì)方差分析: 欲比較因素的K個(gè)水平的各變量均值,同時(shí)控制另一個(gè)因素的作用。試驗(yàn)設(shè)計(jì)時(shí),先將受試對(duì)象按其它控制因素性質(zhì)相同或相近者組成單位組,每個(gè)單位組有K個(gè)受試對(duì)象,分別隨機(jī)分配至因素的K個(gè)水平上。這時(shí)每個(gè)水平的受試對(duì)象不僅數(shù)量相同, 而且性質(zhì)亦相同或相近,就能縮小誤差,提高實(shí)驗(yàn)效率。它是兩樣本配對(duì)試驗(yàn)的擴(kuò)大。, 單位組 處理1 處理2 . 處理k 1 X11 X12 . X1k 2 X21 X22 . X2k .

10、b Xb1 Xb2 Xbk ,大白鼠注射不同劑量雌激素后的子宮重量(g) 雌激素劑量(g/100g) 大白鼠種系 0.2 0.4 0.8 A 106 116 145 B 42 68 115 C 70 111 133 D 42 63 87 ,欲比較一個(gè)因素中K個(gè)水平的各均數(shù),同時(shí)要控制另二個(gè)因素作用時(shí),可用拉丁方設(shè)計(jì) 的方差分析。 要同時(shí)研究幾個(gè)因素的作用,同時(shí)要考察因素間的交互作用,可用析因設(shè)計(jì)的方差分析。,協(xié)方差分析: 在各種試驗(yàn)設(shè)計(jì)中,對(duì)主要變量Y 研究時(shí),常希望其他可能影響Y的變量保持基本一致,以達(dá)到均衡可比。 例如:比較幾種藥物的降壓作用,各試驗(yàn)組在原始血壓、性別、年齡等指標(biāo)應(yīng)無顯著差

11、異。 有時(shí)這些變量不能控制,須在統(tǒng)計(jì)分析時(shí),通過一定方法來消除這些變量的影響后,再對(duì)主要變量y作出統(tǒng)計(jì)推斷。 如果所控制的變量是分類變量時(shí),可用多因素的方差分析。,當(dāng)要控制的變量是連續(xù)型變量時(shí),可用協(xié)方差分析。 稱這些影響變量為協(xié)變量,消除協(xié)變量的影響后,或?qū)f(xié)變量化成相等后,對(duì)y的修正均數(shù)所作的方差分析稱為協(xié)方差分析。 例如:比較幾種不同飼料對(duì)動(dòng)物體重增加的作用,可把動(dòng)物的進(jìn)食量作為協(xié)變量。 比較大學(xué)生和運(yùn)動(dòng)員的肺活量時(shí),可把身高作為協(xié)變量。 比較治療后二組舒張壓的大小,可把治療前的舒張壓作為協(xié)變量。,如:比較初生至三周歲兒童男女兩組體表面積Y之間有無差異,以身高X1和體重X2為協(xié)變量比較對(duì)

12、身高和體重修正后的體表面積修正均數(shù)。,四. 計(jì)數(shù)資料的描述性統(tǒng)計(jì): 率和構(gòu)成比是計(jì)數(shù)資料的主要描述性指標(biāo)。 率說明某種現(xiàn)象發(fā)生的頻率或強(qiáng)度,其公式為: 率=某現(xiàn)象實(shí)際發(fā)生的例數(shù)/某現(xiàn)象可能發(fā)生的例數(shù)。 常見的率有發(fā)病率、患病率、死亡率、痊愈率、有效率等。 構(gòu)成比表示事物或現(xiàn)象內(nèi)部各構(gòu)成部分的比重,通常以100作為比例基數(shù), 故常稱為百分比。 構(gòu)成比=事物內(nèi)部某一構(gòu)成部分的觀察單位數(shù)/事物內(nèi)部各組成部分的觀察單位總數(shù) 。 如性別的構(gòu)成比,病種的構(gòu)成比,職業(yè)的構(gòu)成比等。,構(gòu)成比和率是兩個(gè)不同的相對(duì)數(shù),用途不一樣,不能混淆。最容易犯的錯(cuò)誤是把構(gòu)成比當(dāng)作率來用。 用率作比較時(shí),應(yīng)注意其可比性。應(yīng)審慎思

13、考影響的因素,不能憑表面數(shù)值貿(mào)然下結(jié)論。對(duì)于內(nèi)部構(gòu)成不同的兩個(gè)率,應(yīng)先作標(biāo)準(zhǔn)化處理,才能進(jìn)行比較, 這稱為率的標(biāo)準(zhǔn)化,經(jīng)標(biāo)準(zhǔn)化后的率稱為標(biāo)準(zhǔn)化率。,例:某醫(yī)院門診部近視眼患者情況: 職業(yè) 患者人數(shù) 所占比例() 工人 1500 50.00 農(nóng)民 1000 33.33 學(xué)生 250 8.33 干部 250 8.33 結(jié)論為:工人患近視眼最多,其次是農(nóng)民,學(xué)生和干部患近視眼都比較少。,正確的調(diào)查方法: 職業(yè) 調(diào)查人數(shù) 患者人數(shù) 患病率() 工人 2000 100 5.00 農(nóng)民 2000 100 5.00 學(xué)生 1000 100 10.00 干部 1000 100 10.00 ,五. 四格表和行列

14、表卡方檢驗(yàn) 四格表和行列表卡方檢驗(yàn)用于兩個(gè)或多個(gè)率或構(gòu)成比差異的顯著性檢驗(yàn)以及兩種屬性間獨(dú)立性檢驗(yàn)。,兩種藥物治療某病有效率的比較 藥物 有效 無效 合計(jì) 有效率 西藥 63 16 79 79.75 中藥 47 7 54 87.04 合計(jì) 110 23 133 82.71 兩組有效率的差異是否有統(tǒng)計(jì)學(xué)意義?, 有效 無效 合計(jì) 有效率 西藥組 63 16 79 79.75 中藥組 47 7 54 87.04 中西結(jié)合 65 3 68 95.59 合計(jì) 175 26 201 ,二個(gè)或多個(gè)構(gòu)成比的比較或兩個(gè)屬性之間有無關(guān)系: 血 型 民族 A B O AB 合計(jì) 傣族 f11 f12 f13 f1

15、4 n1+ 佤族 f21 f22 f23 f24 n2+ 土家族 f31 f32 f33 f34 n3+ 合計(jì) n+1 n+2 n+3 n+4 n ,六. 非參數(shù)統(tǒng)計(jì) 在統(tǒng)計(jì)推斷中,如t檢驗(yàn),方差分析等,假定樣本所來自的總體分布為已知的函數(shù)形式,但其中有的參數(shù)為未知,統(tǒng)計(jì)推斷的目的就是對(duì)這些未知參數(shù)進(jìn)行估計(jì)或檢驗(yàn)。這類統(tǒng)計(jì)推斷方法稱為參數(shù)統(tǒng)計(jì)。 非參數(shù)統(tǒng)計(jì)是一種不依賴總體分布的具體形式的統(tǒng)計(jì)方法。,優(yōu)點(diǎn): (1)適用于任何總體分布。 (2)計(jì)算簡(jiǎn)便。 (3)易于理解和掌握。 (4)可應(yīng)用于不能精確測(cè)量的資料,如等級(jí)資料。 缺點(diǎn): (1)對(duì)適宜用參數(shù)方法的資料,若用非參數(shù)處理,常損失部分信息,降

16、低效率。 (2)雖然許多非參數(shù)法計(jì)算簡(jiǎn)便,但不少問題的計(jì)算,特別樣本較大時(shí),比較繁雜。,1.符號(hào)秩和檢驗(yàn)用于配對(duì)資料。相當(dāng)于配對(duì)t檢驗(yàn)。 2.兩樣本秩和檢驗(yàn),又稱Wilcoxon秩和檢驗(yàn),適用于未配對(duì)樣本的差異顯著性檢驗(yàn)。 相當(dāng)于團(tuán)體t檢驗(yàn)。 3. Kruskal Wallis 檢驗(yàn)(KW檢驗(yàn)) 用于兩個(gè)以上樣本的比較,相當(dāng)于方差分析。 4. Friedman秩和檢驗(yàn)用于試驗(yàn)按隨機(jī)單位組設(shè)計(jì)時(shí)的秩和檢驗(yàn)。,七. 等級(jí)資料 等級(jí)資料的描述性統(tǒng)計(jì)和計(jì)數(shù)治療相同,是率和構(gòu)成比。 等級(jí)資料的顯著性檢驗(yàn)都用非參數(shù)檢驗(yàn)。,八. 考察兩指標(biāo)間有無關(guān)系,1. 兩指標(biāo)均為正態(tài)計(jì)量指標(biāo)用相關(guān)系數(shù)。 2. 兩指標(biāo)為

17、非正態(tài)計(jì)量指標(biāo)用秩相關(guān)系數(shù)。 3. 兩指標(biāo)均為等級(jí)指標(biāo)用秩相關(guān)系數(shù)。 4. 兩指標(biāo)為計(jì)數(shù)指標(biāo)用列聯(lián)系數(shù),卡方檢驗(yàn)。 5. 一個(gè)為等級(jí)指標(biāo),另一個(gè)為計(jì)量指標(biāo)用秩相關(guān)系數(shù),或者用方差分析。 6. 一個(gè)為計(jì)數(shù)指標(biāo),另一個(gè)為計(jì)量指標(biāo)用 t 檢驗(yàn)或者方差分析。,如要分析一個(gè)連續(xù)的正態(tài)變量(應(yīng)變量)和其他幾個(gè)變量(自變量)間有無關(guān)系。用多元相關(guān)和多元回歸分析。 如要分析一個(gè)二值變量(反應(yīng)變量)和其他幾個(gè)變量(協(xié)變量)間有無關(guān)系。用LOGISTIC回歸分析。,九. 生存分析,對(duì)于腫瘤等疾病的療效及預(yù)后的考核常常不用通常的治愈率、好轉(zhuǎn)率等表示,而用生存期表示。 生存分析是指對(duì)于生存期這一變量進(jìn)行分析的一系列特

18、殊的統(tǒng)計(jì)分析方法。 生存期從某個(gè)標(biāo)準(zhǔn)時(shí)刻(發(fā)病、確診、開始治療或手術(shù)等)算起至死亡為止的存活時(shí)間。,生存期不同于一般指標(biāo)的兩個(gè)特點(diǎn): (1)有截尾數(shù)據(jù)。 (2)生存期不服從正態(tài)分布。 生存分析起先只用于分析生存期,但以后又發(fā)展成可分析一切從某種起始事件達(dá)到某終點(diǎn)事件所經(jīng)歷的時(shí)間跨度。如:起效時(shí)間,緩解時(shí)間,等。,生存時(shí)間不一定專用于死與活的情況,生存時(shí)間(存活時(shí)間)可定義為從某種起始事件到達(dá)某終點(diǎn)事件所經(jīng)歷的時(shí)間跨度。例如急性白血病病人從治療開始到復(fù)發(fā)為止之間的緩解期;冠心病病人在兩次發(fā)作之間的時(shí)間間隔;已作輸卵管結(jié)扎的婦女從施行輸卵管吻合手術(shù)后至受孕的時(shí)間間隔;在流行病學(xué)研究中,從開始接觸危險(xiǎn)因素到發(fā)病所經(jīng)歷的時(shí)間等都可作為生存時(shí)間用作生存分析。 有時(shí)還收集一些有關(guān)因素(稱為自變量或協(xié)變量), 以分析這些協(xié)變量是否對(duì)生存時(shí)間有影響,影響的大小,是縮短或延

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論