衛(wèi)生統(tǒng)計學(xué)的基本概念課件_第1頁
衛(wèi)生統(tǒng)計學(xué)的基本概念課件_第2頁
衛(wèi)生統(tǒng)計學(xué)的基本概念課件_第3頁
衛(wèi)生統(tǒng)計學(xué)的基本概念課件_第4頁
衛(wèi)生統(tǒng)計學(xué)的基本概念課件_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

馬林茂

中國疾病預(yù)防控制中心公共衛(wèi)生監(jiān)測與信息服務(wù)中心衛(wèi)生統(tǒng)計研究室衛(wèi)生統(tǒng)計學(xué)的基本概念和基本統(tǒng)計檢驗

醫(yī)學(xué)科學(xué)院防預(yù)國中一、衛(wèi)生統(tǒng)計學(xué)的意義

衛(wèi)生統(tǒng)計學(xué)的定義

衛(wèi)生統(tǒng)計是用統(tǒng)計學(xué)的原理和方法研究醫(yī)藥衛(wèi)生領(lǐng)域中數(shù)據(jù)的搜集、整理與分析的一門應(yīng)用性學(xué)科。2.衛(wèi)生統(tǒng)計學(xué)的主要內(nèi)容

(1)衛(wèi)生統(tǒng)計學(xué)的基本原理和方法,包括研究設(shè)計和數(shù)據(jù)處理的理論和方法。

(2)健康統(tǒng)計、醫(yī)學(xué)人口統(tǒng)計、疾病統(tǒng)計和生長發(fā)育統(tǒng)計。(3)衛(wèi)生服務(wù)統(tǒng)計。3.學(xué)習(xí)衛(wèi)生統(tǒng)計學(xué)應(yīng)注意的問題

要以掌握衛(wèi)生統(tǒng)計學(xué)的基本知識、基本概念、基本原理和使用各種基本方法的注意事項和適用條件為主。要理解計算公式的統(tǒng)計思想。在學(xué)習(xí)各種統(tǒng)計方法時,不必深究公式的推導(dǎo),應(yīng)該把精力放在聯(lián)系實際,應(yīng)用衛(wèi)生統(tǒng)計學(xué)的知識、方法和解決本專業(yè)的實際問題上。二、統(tǒng)計工作的步驟衛(wèi)生統(tǒng)計工作的步驟包括:統(tǒng)計研究設(shè)計、搜集資料。整理資料和分析資料。統(tǒng)計研究設(shè)計的內(nèi)容包括:資料搜集、整理和分析的全過程。資料來源包括:1.衛(wèi)生統(tǒng)計報表2.經(jīng)常性工作記錄3.專題調(diào)查或?qū)嶒炑芯空碣Y料是凈化原始數(shù)據(jù),使其系統(tǒng)化、條理化。分析資料即通過計算統(tǒng)計指標(biāo),反映數(shù)據(jù)的綜合特征。統(tǒng)計分析可分為統(tǒng)計描述和統(tǒng)計推斷兩個部分。三、統(tǒng)計學(xué)中的幾個基本概念

1

觀察單位是獲得數(shù)據(jù)的最小單位。觀察單位可以是人、標(biāo)本、家庭、國家等。2變異是統(tǒng)計工作的前提。統(tǒng)計研究的就是有變異性的事物,沒有變異當(dāng)然就無所謂統(tǒng)計,然而在任何相同條件下,個體間始終存在著一定的差異。3.

變量和變量值變量是觀察單位的某項特征。4.

變量類型根據(jù)觀察值的性質(zhì)不同可以把變量分為數(shù)值變量和分類變量。1)數(shù)值變量(又稱定量變量):是以計量方式所得到的觀察結(jié)果,一般都帶有度量衡單位。2)分類變量(又稱定性變量或字符變量):分類變量的變量值是代表互不相容類別或?qū)傩缘淖址?.總體與樣本1)總體:是根據(jù)研究目的確定的性質(zhì)相同的所有觀察單位某種變量值的集合體2)樣本:是總體內(nèi)隨機(jī)抽取的一部分。在理解這一概念時要注意樣本是為研究總體時而抽取的。因此為了使樣本具有一定的代表性,抽取樣本時必須遵循隨機(jī)化原則從總體中抽取總體單位,構(gòu)成樣本,這樣樣本才具有代表性。

6.概率概率是事件發(fā)生的可能性大小的量度,通常以符號P表示,當(dāng)某實際事件肯定發(fā)生時稱為必然事件,其概率P=1;當(dāng)某事件不可能發(fā)生時稱為不可能事件,其概率P=0;當(dāng)某事件在一定條件下可能發(fā)生也不可能發(fā)生時稱為隨機(jī)事件,其概率在0<P<1的范圍內(nèi)。

7.誤差誤差是指測得值與真值之差或樣本指標(biāo)與總體指標(biāo)之差,從誤差的性質(zhì)來看,可以分為兩大類,即偶然誤差和系統(tǒng)誤差。1)偶然誤差(又稱隨機(jī)誤差):包括抽樣誤差和隨機(jī)測量誤差。抽樣誤差是指由于抽樣造成樣本指標(biāo)與總體指標(biāo)之差,這是由于總體內(nèi)各觀察單位存在著個體差異,在這種偶然因素的影響下,不可避免地會出現(xiàn)樣本結(jié)構(gòu)不同于總體結(jié)構(gòu),因而樣本指標(biāo)也就不會等于總體指標(biāo),但是當(dāng)不斷增加樣本含量時,可以縮小抽樣誤差。2)系統(tǒng)誤差:是指由確定的原因引起的觀察值與真值之間或樣本指標(biāo)與總體指標(biāo)之間的偏差。8.參數(shù)和統(tǒng)計量總體的指標(biāo)稱為參數(shù),樣本的指標(biāo)稱為統(tǒng)計量。9.統(tǒng)計推斷根據(jù)樣本資料所提供的信息,對總體的特征作出推斷,稱為統(tǒng)計推斷。統(tǒng)計推斷包括兩個方面:(1)參數(shù)估計參數(shù)估計是根據(jù)樣本資料所提供的信息,對總體指標(biāo)的大小或所在范圍作出估計。這種估計又分為點(diǎn)估計和區(qū)問估計兩種。①點(diǎn)估計:是對總體指標(biāo)作出一個定值的估計,雖然能給人一個明確的數(shù)量概念,但這只是一個近似值,常常不能滿足實際工作的需要。②區(qū)間估計:是估計總體參數(shù)所在的范圍以及在這個范圍內(nèi)包含總體參數(shù)的可能性的大小。(2)假設(shè)檢驗首先對總體指標(biāo)作出一個假設(shè),然后根據(jù)樣本資料所提供的信息及有關(guān)統(tǒng)計量分布理論,對這個假設(shè)作出拒絕或不拒絕的判斷。假設(shè)檢驗有許多種,根據(jù)其所計算的統(tǒng)計量不同而命名,如t檢驗、U檢驗。F檢驗、2檢驗等。四、數(shù)值資料的統(tǒng)計描述1頻數(shù)分布表

首先應(yīng)編制頻數(shù)分布表以了解其分布狀況,頻數(shù)就是觀察值的個數(shù)。頻數(shù)分布就是觀察值在其所取值的范圍內(nèi)分布的情況。2頻數(shù)分布類型

數(shù)值資料常見的頻數(shù)分布類型有三種,如何區(qū)分關(guān)鍵是看分布高峰的位置。

1)正態(tài)分布型頻數(shù)分布的高峰位于中央,圖形左右對稱。正態(tài)分布屬于此類型。2)正偏態(tài)分布型頻數(shù)分布的高峰偏左,圖形左右不對稱,即觀察值較小的一端集中了較多的頻數(shù)。3)負(fù)偏態(tài)分布型頻數(shù)分布的高峰偏右,圖形左右不對稱,即觀察值較大的一端集中了較多的頻數(shù)。3集中趨勢指標(biāo)集中趨勢指標(biāo)又稱平均數(shù),它反映了觀察值的集中位置或平均水平,是觀察值的典型水平或代表值。常用的集中趨勢指標(biāo)有算術(shù)均數(shù)(均數(shù))、幾何均數(shù)和中位數(shù)等?,F(xiàn)把各種平均指標(biāo)的應(yīng)用條件歸納如下表各平均指標(biāo)的應(yīng)用條件指標(biāo)適用條件計算公式算術(shù)平均數(shù)

常用于描述對稱型分布,尤其是正態(tài)分布資料的集中趨勢

幾何均數(shù)常用于描述對數(shù)正態(tài)分布資料和觀察值呈等比數(shù)列資料的集中趨勢

中位數(shù)常用于描述偏態(tài)分布資料、一端或兩端無界的資料、頻數(shù)分布類型不清楚的集中趨勢五、離散程度指標(biāo)

離散程度指標(biāo)又稱變異程度指標(biāo)。它反映觀察值之間參差不齊的程度。常用的離散程度指標(biāo)有極差、標(biāo)準(zhǔn)差和變異系數(shù)等?,F(xiàn)將離散程度指標(biāo)、計算公式及主要優(yōu)缺點(diǎn)歸納在下表中。指標(biāo)計算公式主要優(yōu)缺點(diǎn)極差R=Xmax-Xmin計算簡單,易理解:反映了觀察值的變異,離均差平方和反映變量值間的變異,難理解,受觀察值個數(shù)影響不利比較方差反映變量值間的變異,不受觀察值個數(shù)影響單位是原單位的平方,不易理解標(biāo)準(zhǔn)差反映變量值間的變異,不受觀察值個數(shù)影響,單位與原單位相同,是常用的離散程度指標(biāo)之一,在多組資料比較時,受到單位不同和均數(shù)相差較大時的影響變異系數(shù)兩組和多組資料比較變異程度,如均數(shù)相差過大或觀察單位不同時用變異系數(shù)比較六、正態(tài)分布曲線的特征及規(guī)律正態(tài)分布曲線是一條高峰位于中央即均數(shù)所在處)兩側(cè)逐漸下降并完全對稱,兩端永遠(yuǎn)不與橫軸相交的鐘型曲線。正態(tài)曲線的特征是整個曲線都在橫軸的上方,均數(shù)處最高;以均數(shù)為中心,左右對稱。正態(tài)分布曲線有兩個重要參數(shù),即和,決定曲線的位置,決定曲線的形狀。七、正態(tài)分布曲線下面積分布規(guī)律:1.一般正態(tài)分布

。范圍內(nèi)的面積占總面積的68.27%

1.96范圍內(nèi)的面積占總面積的95.00%

2.58范圍內(nèi)的面積占總面積的99.00%2.標(biāo)準(zhǔn)正態(tài)分布(標(biāo)準(zhǔn)正態(tài)分布中=0,=1)-1~1(0土1)之間的面積占總面積的68.27%-1.96~1.96(0土1.96)之間的面積占總面積的95.00%-2.58~2.58(0土12.58)之間的面積占總面積的99.00%八、正態(tài)性檢驗 醫(yī)學(xué)上有許多資料是近似正態(tài)分布的,但也有不少與正態(tài)分布相差較大。判斷原始數(shù)據(jù)是否偏離正態(tài)分布,可用正態(tài)性檢驗。正態(tài)性檢驗方法有多種,下面列出幾種常用的方法:1)正態(tài)概率紙法 這是一種粗略而簡便的方法,它既適用于樣本含量較小時,也可適用于樣本含量較大或分組資料的正態(tài)性檢驗。2)偏度與峰度檢驗 正態(tài)分布有一定的峰度(Kurtosis),且理論上是左右對稱的。來自正態(tài)分布總體的樣本資料峰度不應(yīng)過高或過低,偏度(Skewness)也不應(yīng)太大。通常以g1表示偏度,g2表示峰度,我們可以計算出g1與g2及其標(biāo)準(zhǔn)誤

及,然后作u檢驗。g1、g2、、和u的計算公式為:

式中X為變量值,f為相同X的個數(shù),n為樣本例數(shù)。上式無論n的大小均適用。

理論上,總體偏度系數(shù)1=0為對稱,1>0為正偏態(tài),1<0為負(fù)偏態(tài);總體峰度系數(shù)2=0為正態(tài)峰,2>0為尖峰態(tài),2<0為平闊峰。g1及g2為統(tǒng)計量,有抽樣誤差,其標(biāo)準(zhǔn)誤的計算法如下:g1和g2的抽樣分布近似正態(tài)分布,故在算得及后,可按下式計算檢驗統(tǒng)計量u值,用u檢驗推斷資料的正態(tài)性。偏度:峰度:u值服從正態(tài)分布,因而按u=1.96與2.58進(jìn)行判斷,,p<0.01,3)W檢驗(3n50) 如果不需知道偏離正態(tài)分布的類型,且樣本含量在50以下時,可用W檢驗。查統(tǒng)計量w的p分位數(shù)表。4)D檢驗 如果不需知道偏離正態(tài)分布的類型,且樣本含量在50以上時,可用D檢驗。D檢驗的計算公式如下:九、標(biāo)準(zhǔn)差的應(yīng)用

標(biāo)準(zhǔn)差用來描述觀察值間的變異程度(離散程度),用于正態(tài)或近似正態(tài)分布資料,標(biāo)準(zhǔn)差結(jié)合均數(shù)描述分布特征。標(biāo)準(zhǔn)差主要用來衡量觀察值間的離散(或變異)程度。標(biāo)準(zhǔn)差還還可以用于計算變異系數(shù),變異系數(shù)又稱離散系數(shù),它是標(biāo)準(zhǔn)差對均數(shù)的相對百分?jǐn)?shù),故又有相對標(biāo)準(zhǔn)差之稱。十、總體均數(shù)的可信區(qū)間的估計1.小樣本均數(shù)可信區(qū)間的估計通式:總體均數(shù)的可信區(qū)間為:,=1-P。P 為可信度又稱置信概率,如總體均數(shù)95%的可信區(qū)間P=0.95,則=1-P=0.05,為自由度,t是自由度等于時的t的界值。常用的可信區(qū)間公式:

95%的可信區(qū)問:

99%的可信區(qū)間:計算時特別注意公式中的標(biāo)準(zhǔn)誤而不是標(biāo)準(zhǔn)差。2.大樣本均數(shù)可信區(qū)間的估計

95%的可信區(qū)間:

99%的可信區(qū)間:十一、兩種檢驗與兩類錯誤1)單側(cè)檢驗與雙側(cè)檢驗 在進(jìn)行t檢驗時,如果其目的在于檢驗兩個總體均數(shù)是相等(即1=2)還是不相等(即12),例如檢驗?zāi)撤N新降壓藥與常用的降壓藥效力是否相同?就是說:新藥效力比舊藥好,或新藥效力比舊藥差以及新藥和舊藥效力相同,都有可能。在這種情況下,只要t的絕對值大于t0.05(),即可認(rèn)為均數(shù)差別有統(tǒng)計意義,統(tǒng)計上稱這種檢驗為雙側(cè)檢驗( Two-tailedtest)(或雙尾檢驗)。 如果我們已知新藥效力不可能低于舊藥效力,這時無效假設(shè)H0:1=2,備擇假設(shè)為H1:1>2。因而,t0.05的界值只需考慮一側(cè)的界限即可,統(tǒng)計上稱為單側(cè)檢驗(或單尾檢驗)(Onetailedtest)。2)第一類錯誤與第二類錯誤我們根據(jù)t檢驗或其他統(tǒng)計檢驗結(jié)果作出的判斷,并不是百分之百正確的。有兩種可能的錯誤存在;一為假陽性錯誤( falsepositiveerror),統(tǒng)計上稱為第一類錯誤(TypeIerror)就是無效假設(shè)(H0;

1=2)原本是正確的,但被拒絕接受,誤判為有差別。與此相反,是假陰性錯誤(falsenegativeerror),統(tǒng)計上稱為第二類錯誤(typeIIerorr)。就是:無效假設(shè)(如H0:=0)原本是不正確的(實際上應(yīng)是H0:=1),但所算得的統(tǒng)計量t沒有超過t0.05的水平從而接受了無效假設(shè),錯誤地得出無差別的結(jié)論。

十二、t檢驗的意義

t檢驗主要用于兩個均數(shù)的比較,它能夠判斷進(jìn)行比較的均數(shù)的差別是由于抽樣誤差引起,還是總體就有差別。十三、t檢驗的步驟1)建立假設(shè)和確定檢驗水準(zhǔn)H0(無效假設(shè)):假設(shè)比較指標(biāo)的差別是由于抽樣誤差引起的。H1(備擇假設(shè)):假設(shè)比較指標(biāo)的差別是總體的差別。2)計算t值根據(jù)統(tǒng)計資料的類型、適用條件、分析目的計算適當(dāng)?shù)慕y(tǒng)計量t值。3)確定P值P值是H0存在的概率,根據(jù)自由度與P值確定相對應(yīng)的t界值,比較所得t值大于相應(yīng)的界值時,P小于相應(yīng)的概率P。4)判斷結(jié)果P拒絕H0,可以認(rèn)為比較指標(biāo)的差別是總體的差別;P>接受H0,可以認(rèn)為比較指標(biāo)的差別是抽樣誤差引起。十三、常用的t檢驗1)進(jìn)行t檢驗時首先應(yīng)正確認(rèn)識資料的類型和t檢驗的適用條件,t檢驗是數(shù)值資料的假設(shè)檢驗方法,應(yīng)用于樣本均數(shù)與總體均數(shù)的比較及兩樣本均數(shù)間的比較,所以要進(jìn)行t檢驗需檢查資料是否符合以下條件:①資料是數(shù)值資料;②分析目的是對兩均數(shù)進(jìn)行比較;③具備t檢驗的應(yīng)用條件,即資料具有正態(tài)性,如兩樣本均數(shù)比較還需要兩樣本方差具有齊同性。2)正確選擇具體公式,計算t值如以上三條資料均具備,就說明可以進(jìn)行t檢驗,然后進(jìn)一步選擇具體的t檢驗方法。其具體方法有:(l)樣本均數(shù)與總體均數(shù)比較的t檢驗,資料中有一個,另一個是0。

(2)配對比較的t檢驗,資料常見的有以下三種:①配對資料,常將條件基本相同的受試對象配成對子,每對中的兩個受試對象分別給予不同的處理,比較不同處理的差別。②同一批對象試驗前后對比資料,是對一批觀察對象分別測定試驗前后某項指標(biāo)的數(shù)值進(jìn)行比較,目的是看該處理(試驗)有無作用。③對同一批樣本中的每一個樣本分別用不同方法處理,比較不同方法有無差別。以上三種資料假設(shè)檢驗都是用配對t檢驗。配對t檢驗實際也是單一樣本均數(shù)(差數(shù)的樣本均數(shù))與總體均數(shù)(差數(shù)的總體均數(shù))比較,所以它和樣本均數(shù)比較的t檢驗一樣,只要求資料具有正態(tài)性。(3)兩小樣本均數(shù)比較的t檢驗,兩小樣本比較的t檢驗,既要求資料具有正態(tài)性,又要求兩樣本方差具有齊同性。(4)兩樣本均數(shù)比較的u檢驗,兩樣本均數(shù)比較時,如n1和n2均大于100,可用u檢驗。

u檢驗的唯一條件是樣本含量足夠大。不要求正態(tài)性和方差齊性。十四、進(jìn)行t檢驗時應(yīng)注意的問題1)正確理解差別的統(tǒng)計意義差別有統(tǒng)計意義,是說從統(tǒng)計的角度看,差別可能是總體的差別;差別無統(tǒng)計意義時是說從統(tǒng)計的角度看差別可能是抽樣誤差引起的。差別有無統(tǒng)計意義與差別大小不同,不能認(rèn)為差別有統(tǒng)計意義就是差別大,無統(tǒng)計意義就是差別小。2)對比資料應(yīng)有可比性對比資料除對比因素不同外,其它凡影響比較指標(biāo)的一切因素應(yīng)盡可能齊同,這樣資料才有可比性。3)要滿足t檢驗的應(yīng)用條件t檢驗要求資料具有正態(tài)性,樣本間方差要有齊同性。配對和樣本與總體比較的t檢驗,因是單一樣本,只要求資料具有正態(tài)性。兩小樣本的t檢驗,兩個條件均應(yīng)達(dá)到才能進(jìn)行t檢驗。必要時應(yīng)做正態(tài)性檢驗和方差齊性檢驗。4)正確計算統(tǒng)計量t值根據(jù)資料的類型、特征和統(tǒng)計分析目的,正確選擇t檢驗的具體方法,計算t值。5)正確理解t檢驗結(jié)論的概率性t檢驗結(jié)論不管拒絕還是接受H0都不是100%正確的,t檢驗常出現(xiàn)二種錯誤,一是H0是正確的,根據(jù)P≤α拒絕了它,稱第Ⅰ類錯誤,第Ⅰ類錯誤的概率用α表示,α取決于檢驗水準(zhǔn)。二是H0是不正確的,而P>α接受了它,稱第Ⅱ類錯誤,第Ⅱ類錯誤的概率用β表示,其β值不易確定,但α越大,β越小,增加樣本含量可同時減少α和β。6.正確地確定單側(cè)和雙側(cè)檢驗根據(jù)專業(yè)知識,在統(tǒng)計分析前就應(yīng)確定用單側(cè)檢驗還是用雙側(cè)檢驗。十四、方差分析1、方差分析的應(yīng)用范圍

方差分析是一個把平方之和劃分為各項與已經(jīng)承認(rèn)的變差來源相關(guān)聯(lián)的分離的算術(shù)過程,在所有各種研究領(lǐng)域中,只要數(shù)據(jù)是定量測得的,都可以根據(jù)具體情況選擇這種方法。方差分析主要應(yīng)用于:①兩個或多個樣本均數(shù)的比較;②分離各有關(guān)因素并分別估計其對變異的影響;③分析兩因素或多因素的交互作用;④方差齊性檢驗等。方差分析主要包括:①完全隨機(jī)設(shè)計的方差分析:實驗研究資料的方差分析;調(diào)查研究資料的方差分析;已知樣本均數(shù)和標(biāo)準(zhǔn)差的方差分析。②隨機(jī)區(qū)組(配伍組)設(shè)計資料的方差分析③均數(shù)間的兩兩比較。學(xué)習(xí)時應(yīng)正確掌握各種不同情況下的方差分析方法的不同點(diǎn)和共同點(diǎn)。

2、完全隨機(jī)設(shè)計資料的方差分析

方差分析的關(guān)鍵是把資料中數(shù)據(jù)間的變異(總變異)根據(jù)設(shè)計時的要求,分離成各種不同因素的變異,完全隨機(jī)設(shè)計資料則是把總變異分離為組間變異和組內(nèi)變異,然后對組間變異和組內(nèi)變異進(jìn)行比較,鑒于可比性的要求,把組間變異和組內(nèi)變異用組間均方和組內(nèi)均方表示。總變異的離均差平方和:

組間變異的離均差平方和:組內(nèi)變異的離均差平方和:SS組內(nèi)=SS總-SS組間完全隨機(jī)設(shè)計資料的分析步驟如下:1)建立假設(shè)和確定檢驗水準(zhǔn):H0:1=2=3==kH1:123k=0.05(雙側(cè))。2)求F值F值是方差之比,方差等于離均差平方和除以自由度,因此求F值要先求離均差平方和及自由度。3)計算

①計算離均差平方和;計算組間變異的離均差平方和;計算組內(nèi)變異的離均差平方和。②計算自由度、均方和F值(1)計算自由度總自由度:總=N-1組間自由度:組間=k-1組內(nèi)自由度:組內(nèi)=N-k(2)計算均方:樣本的方差又稱均方,以符號MS表示,是離均差平方和除以自由度所得。組間均方:MS組間=SS組內(nèi)/組間組內(nèi)均方:MS組內(nèi)=SS組內(nèi)/組內(nèi)(3)計算F值F=MS組間/MS組內(nèi)結(jié)果見下表。變異來源MSF總變異N-1組間變異K-1組內(nèi)變異SS組內(nèi)=SS總-SS組間N-K③確定P值根據(jù)自由度1和2查F界值表,將F值與所查得的F界值作比較,確定P值。④判斷結(jié)果按=0.05水準(zhǔn),作出拒絕H0或接受H1的判斷。在計算F值時,我們把組間均方作為分子,而把組內(nèi)均方作為分母,如果組間均方略小于組內(nèi)均方,則F值就小于1,此時不必查F界值表就可以確定P>0.05;如果組間均方遠(yuǎn)小于組內(nèi)均方,則F值就遠(yuǎn)小于1,這是異常情況,應(yīng)從實驗設(shè)計或?qū)嶒灁?shù)據(jù)的搜集及具體計算等方面查明原因。

隨機(jī)區(qū)組(配伍組)設(shè)計資料的方差分析

隨機(jī)區(qū)組設(shè)計資料的方差分析不同于完全隨機(jī)設(shè)計資料的方差分析,是由于其設(shè)計“時,把受試對象進(jìn)行了區(qū)組(配伍組)設(shè)計,每個區(qū)組內(nèi)的受試對象除了接受的處理不同外,其他條件都是基本一致的,因此,其總變異就可以分離為處理組間變異、區(qū)組間變異和誤差變異,而完全隨機(jī)設(shè)計的組內(nèi)變異相當(dāng)于區(qū)組間變異和誤差變異,兩者不能分離。由于采用了區(qū)組設(shè)計,可以進(jìn)一步把誤差分解,所以區(qū)組設(shè)計的資料其實驗效應(yīng)比完全隨機(jī)設(shè)計的試驗效應(yīng)更容易顯現(xiàn)出來。其變異的表示形式仍然是以均方的形式表現(xiàn)的。隨機(jī)區(qū)組設(shè)計資料的方差分析步驟與完全隨機(jī)基本相同,具體計算內(nèi)容如下表:變異來源SSMSF總變異N-1處理組間變異K-1區(qū)組間變異b-1誤差SS組內(nèi)=SS總-SS組間(k-1)(b-1)

多個均數(shù)間的兩兩比較

方差分析的結(jié)論是對整體而言的。經(jīng)方差分析,如果各個均數(shù)之間差別無統(tǒng)計意義,則無需作進(jìn)一步統(tǒng)計處理。如果各個均數(shù)間差別有統(tǒng)計意義,并非意味著任何兩個均數(shù)間的差別都有統(tǒng)計意義。如欲了解任何兩個均數(shù)間的差別是否都有統(tǒng)計意義,還應(yīng)作進(jìn)一步分析。這種分析稱為兩兩比較或多重比較。兩兩比較有多種方法。(-)q檢驗法檢驗步驟如下:1).建立假設(shè)和確定檢驗水準(zhǔn)H0:任何兩個均數(shù)相同,即A=B。H1:任何兩個均數(shù)不相同或不全相同。=0.05(雙側(cè))2).計算q值

其中:各組觀察值個數(shù)相等各組觀察值個數(shù)不等3)根據(jù)誤差自由度及組數(shù)。查q界值表,確定P值。4)判斷結(jié)果隨機(jī)區(qū)組設(shè)計資料的方差分析,在判斷處理組間和區(qū)組間均數(shù)的差別有統(tǒng)計意義后,也可按上述方法做處理組間和區(qū)組間均數(shù)的兩兩比較在實際工作中,人們可能會問,既然方差分析后還要做兩兩比較,何不直接用多個兩組間均數(shù)之差的t檢驗,來代替方差分析及其兩兩比較?回答是否定的。因為這樣做與原整體設(shè)計思想不符,不能充分利用由總變異與總剩余誤差所提供的信息,降低了檢驗效率,有可能把本來有統(tǒng)計意義的差別判斷為無統(tǒng)計意義的差別。另一方面,由于做多次t檢驗,檢驗水準(zhǔn)被提高了,增加了犯Ⅰ類錯誤的概率,即有可能把本來沒有統(tǒng)計意義的差別判斷為有統(tǒng)計意義的差別。(二)q’檢驗以上介紹的兩兩比較是任意兩組的比較,有時只需了解各處理組與同一對照組樣本均數(shù)間的差別有無統(tǒng)計意義,而對于處理組之間的兩兩比較不感興趣,這時可采用Dunnettt檢驗法(或稱q’檢驗法),其檢驗統(tǒng)計量Dunnettt按下式計算。式中、 為任一處理組及對照組C的樣本均數(shù)MS誤差為方差分析中誤差的均方,nA、nC為任意處理組A及對照組C的樣本含量方差分析的基本條件與數(shù)據(jù)變換(-)方差分析的基本條件用來作方差分析的資料必須滿足一定的條件。1)方差齊性2)正態(tài)性方差分析資料必須滿足以上條件。如果資料不能滿足上述要求,則進(jìn)行方差分析就失去理論依據(jù)。在這種情況下,雖然方差分析的計算照樣可以進(jìn)行,但所得結(jié)論是不可信的(二)方差齊性檢驗在方差分析之前,要作多個樣本方差齊性檢驗,有關(guān)兩個樣本方差的齊性檢驗參見t檢驗。多個樣本方差齊性檢驗,常用即Bartlett2檢驗。

變量變換當(dāng)資料不能滿足方差分析基本條件時(如方差不齊、偏態(tài)等),可將變量經(jīng)適當(dāng)方式變換,變換后的新數(shù)據(jù)若滿足了方差分析的基本條件,就可用這些新數(shù)據(jù)作方差分析。1)對數(shù)變換當(dāng)多個樣本均數(shù)作比較時,若方差不齊,特別是各樣本標(biāo)準(zhǔn)差隨均數(shù)增大而增大,致使各樣本變異系數(shù)很接近時,可采用對數(shù)變換法變換原始數(shù)據(jù)。2)百分?jǐn)?shù)平方根反正弦變換在醫(yī)學(xué)和衛(wèi)生學(xué)研究中,常以百分?jǐn)?shù)資料(如患病率、感染率、檢出率等)作t檢驗或方差分析這時可采用百分?jǐn)?shù)平方很反正弦變換,變換的方法是將各組中每一個百分?jǐn)?shù)開方,然后求其反正弦函數(shù),即將P變換為,經(jīng)過這樣變換,新的變量可能成為或接近正態(tài)分布并達(dá)到方差齊性??ǚ剑?)檢驗

2檢驗是一種對分類資料進(jìn)行假設(shè)檢驗的重要方法之一。它常用于兩個或多個樣本率(或構(gòu)成比)的比較、列聯(lián)表資料的相關(guān)分析及頻數(shù)分布擬合優(yōu)度的檢驗。

2檢驗最常用于作樣本率或構(gòu)成比的比較,按照資料設(shè)計類型不同,可將這—類假設(shè)檢驗分為:四格表資料2檢驗;行列表資料2檢驗;配對資料2檢驗等。1、四格表資料2檢驗檢驗步驟如下:1)建立假設(shè)和確定檢驗水準(zhǔn)2)計算2值(1)計算2值的基本公式:(2)計算2值的專用公式:

(3)計算2值的校正公式:2、行×列表資料2檢驗2×2表是最簡單的行×列表,習(xí)慣上把行數(shù)>2和(或)列數(shù)>2的表稱為行×列表。實際工作中行×列表又可分為R×2表,2×C表和R×C表。行×列表資料2檢驗方法上述三種行×列表資料的2檢驗均可用基本公式計算2值,也可用下列專用公式計算2值,后者較簡便。

式中:n為總例數(shù),A為實際數(shù),nRnc為與實際數(shù)對應(yīng)的行合計數(shù)與列合計數(shù)。行×列表2檢驗的注意事項1)作行×列表資料2檢驗時,允許有1/5以下的格子理論數(shù)小于5,如果有1/5以上的格子理論數(shù)小于5或有理論數(shù)小于1時,需將鄰近組合并,使理論數(shù)增大。合并時應(yīng)注意合并是否合理。2)行×列表資料2檢驗結(jié)果,如果有統(tǒng)計意義,并不表示任何兩組之間差別都有統(tǒng)計意義。3)配對資料2檢驗和數(shù)值資料一樣,分類資料也有成組與配對之分,前面是對兩組或多組的資料進(jìn)行2

檢驗。配對分類資料是將觀察單位一一配對,對每一對觀察單位分別觀察某分類變量的表現(xiàn),或?qū)γ恳挥^察單位給予不同的處理,觀察其結(jié)果,或同一觀察單位先后給予兩種不同的處理。(1)建立假設(shè)和確定檢驗水準(zhǔn)H0:b=c(因a和d為結(jié)果完全相同的部分,不必考慮)。H1:b≠C=0.05(2)計算2值

如果b+C<40,則用下面的校正公式計算:4)分類資料分層分析------MH2檢驗MH2檢驗是由Mantel-haenszel提出,用于處理分層資料,以便控制混雜因素干擾的一種合并時2檢驗方法。MH2檢驗的值,可采用下式計算。5)四格表資料的確切概率法四格表資料在下列情況:①四格表資料中有任何一個格子的理數(shù)T<1,N<40;②四格表資料2檢驗時,所得p值十分鄰近檢驗水準(zhǔn)的界值,可以直接計算其概率作出判斷。四格表資料確切概率的計算公式為:作單側(cè)檢驗時,單側(cè)概率P大于為無統(tǒng)計意義,不拒絕H0,單側(cè)檢驗P小于為有統(tǒng)計意義,拒絕H0,接受H1;作雙側(cè)檢驗時,還應(yīng)計算另一側(cè)概率P,以兩側(cè)概率之和與比較,作出判斷。如前所述,作單側(cè)檢驗還是作雙側(cè)檢驗,應(yīng)根據(jù)專業(yè)知識并在檢驗之前確定。直線相關(guān)與回歸

一、直線相關(guān)(-)直線相關(guān)的概念直線相關(guān)又稱簡單相關(guān),它是從數(shù)量上研究兩變量間相互關(guān)系密切程度的一種統(tǒng)計方法。直線相關(guān)研究的是現(xiàn)象間數(shù)量上的相關(guān)關(guān)系。相關(guān)關(guān)系是指現(xiàn)象的變量間存在著一定的依存關(guān)系,但與函數(shù)關(guān)系不同,它不能由一個變量的數(shù)值去精確地求出另一個變量的數(shù)值。(二)相關(guān)系數(shù)的意義和計算1)相關(guān)系數(shù)的意義相關(guān)系數(shù)是線性相關(guān)條件下用來說明兩個變量間相關(guān)關(guān)系的密切程度和方向的一個統(tǒng)計指標(biāo)。相關(guān)系數(shù)沒有單位,用r表示樣本相關(guān)系數(shù),ρ表示總體相關(guān)系數(shù),r是ρ的估計值,相關(guān)系數(shù)的數(shù)值范圍為-1≤r≤1,r值為正表示正相關(guān),r值為負(fù)表示負(fù)相關(guān),r值等于零為零相關(guān),在相關(guān)系數(shù)具有統(tǒng)計意義的前提下,|r|愈接近1,表示相關(guān)程度愈密切,|r|等于1為完全相關(guān)。2)相關(guān)系數(shù)的計算積差法相關(guān)系數(shù)的計算公式為:計算步驟:(1)作散點(diǎn)圖據(jù)原始資料作散點(diǎn)圖,如基本上呈直線趨勢,則可作直線相關(guān)分析。(2)計算∑X、∑Y、∑X2、∑Y2、∑XY。(3)計算X、Y的離均差平方和及離均差積之和lXX、lYY、IXY。(4)計算相關(guān)系數(shù)按積差法相關(guān)系數(shù)計算公式計算r。建立假設(shè)和確定檢驗水準(zhǔn)HO:X、Y兩變量之間無直線相關(guān)關(guān)系,即ρ=0。H1:X、Y兩變量之間存在直線相關(guān)關(guān)系,即ρ≠0。

=0.05。等級相關(guān)等級相關(guān)分析是一種非參數(shù)統(tǒng)計分析方法,它適用于下列資料:①X或Y變量中的一個或兩個不服從正態(tài)分布;②X或Y變量中一個或兩個為未知分布的變量;③X或Y變量中一個或兩個具有半定量性質(zhì)。Spearman等級相關(guān)法為等級相關(guān)分析最常用的方法。等級相關(guān)系數(shù)rs的計算式中:d為每對觀察值X、Y的秩次之差,n為對子數(shù),rs為等級相關(guān)系數(shù)。

直線回歸

(-)直線回歸的概念直線回歸又稱簡單回歸,它是描述與分析兩變量間線性依存關(guān)系的一種統(tǒng)計方法。直線回歸以直線方程描述兩變量間的線性依存關(guān)系,但與數(shù)學(xué)上完全確定的函數(shù)關(guān)系不同,這種直線方程具有某種不確定性,稱為直線回歸方程。用下式表示:(二)直線回歸方程的求法回歸方程的求法實際上就是a、b的求法。常用最小二乘法原理,使估計誤差平方和(剩余平方和)最小。計算公式如下:由最小二乘法導(dǎo)出的回歸方程有兩個性質(zhì),第一,由此方程決定的回歸直線,各實測的Y值與Y的估計值之差(即實測點(diǎn)至回歸直線的縱向距離)的平方和為最小;第二,該回歸線一定通過Y和X的均數(shù)的交點(diǎn)?;貧w系數(shù)假設(shè)檢驗樣本回歸系數(shù)也有一個抽樣誤差的問題。因此當(dāng)樣本回歸系數(shù)不等于0時,就應(yīng)考慮到這個不等于0的回歸系數(shù)是否有可能因抽樣誤差而獲得的。這就是說要對樣本回歸系數(shù)作假設(shè)檢驗。但是對于同一資料已經(jīng)進(jìn)行了相關(guān)系數(shù)假設(shè)檢驗,表明X、Y兩變量間存在相關(guān)關(guān)系,就可不進(jìn)行回歸系數(shù)的假設(shè)檢驗。方差分析法是作回歸系數(shù)假設(shè)檢驗常用的方法。方差分析法作回歸系數(shù)假設(shè)檢驗,統(tǒng)計量F值的計算公式:

SS回為回歸平方和;是在Y總平方和中,由于X與Y的直線關(guān)系,使Y的變異減少的部分。SS回越大,回歸的效果越好。SS剩為剩余平方和,它反映除X對Y的線性影響之外,其他一切可以對Y發(fā)生影響的因素對于Y變異的作用,即無法用X的影響來解釋的Y的變異。通常是指隨機(jī)誤差所造成的Y的變異。SS剩越小,X與Y的線性關(guān)系越好,其估計誤差越小。根據(jù)因變量Y的平方和劃分的原理,SS剩=SS總-SS回作相關(guān)與回歸分析時應(yīng)注意的問題

1)不要把相關(guān)關(guān)系都說成是因果關(guān)系相關(guān)系數(shù)用來描述變量間的密切程度和方向,但不能說明相關(guān)的實質(zhì)。兩事物間存在相關(guān)關(guān)系,可能是因果關(guān)系,也可能是伴隨關(guān)系。要確認(rèn)事物間的因果關(guān)系必須通過深入調(diào)查和實驗研究,從專業(yè)理論方面加以論證。在臨床醫(yī)學(xué)、衛(wèi)生學(xué)中,許多因果關(guān)系正是在相關(guān)關(guān)系所提供線索的基礎(chǔ)上,經(jīng)過深入研究后才確定的。2)不要把相關(guān)的顯著性程度誤解為密切程度相關(guān)的顯著性程度(即統(tǒng)計意義的程度)和相關(guān)的密切程度是兩個不同的概念。變量間相關(guān)的顯著性程度高(例如P<0.01),是指在判斷事物間具有相關(guān)關(guān)系時,犯第I類錯誤的可能性小。而相關(guān)的密切程度的高低,是在相關(guān)系數(shù)具有顯著性意義的前提下,根據(jù)相關(guān)系數(shù)的絕對值的大小來判斷兩變量的密切程度。3)相關(guān)分析前應(yīng)大致了解兩變量的分布情況相關(guān)分析前,應(yīng)通過散點(diǎn)圖或相關(guān)表等大致了解兩變量是否直線相關(guān)、是否均呈正態(tài)分布,否則不應(yīng)作積差法相關(guān)分析,可進(jìn)行等級相關(guān)分析。

4)作回歸分析時應(yīng)恰當(dāng)確定自變量與因變量進(jìn)行回歸分析時,首先應(yīng)確定自變量和因變量,一般情況下應(yīng)把變異程度小的或易測的變量作為自變量X,變異程度較大的或難測的變量作為因變量Y。

5)不要任意延長回歸直線直線回歸方程反映自變量X一定范圍內(nèi),與因變量Y之間的直線關(guān)系,超出了自變量取值的范圍,X與Y之間未必一定是直線關(guān)系。因此,在使用直線回歸方程進(jìn)行預(yù)測時,自變量X的取值,不應(yīng)超出建立方程時X取值的范圍。

6)回歸方程的使用有一定的條件回歸方程是在一定的條件下(時間、地點(diǎn)、方法、測量儀器等等)建立的,當(dāng)條件發(fā)生變化時,原回歸方程則不宜繼續(xù)使用,而應(yīng)建立新的回歸方程以代之。

7)注意相關(guān)分析與回歸分析的聯(lián)系與區(qū)別相關(guān)分析與回歸分析都是分析兩變量間關(guān)系的統(tǒng)計方法,兩者的意義和計算方法上有密切聯(lián)系。但它們的任務(wù)不同。相關(guān)分析主要分析變量間相互關(guān)系的密切程度,而回歸分析主要是分析兩變量間定量的依存關(guān)系,應(yīng)正確選擇使用。統(tǒng)計表統(tǒng)計表是用來表達(dá)數(shù)據(jù)資料和統(tǒng)計分析結(jié)果的一種表格。一個編制合理的統(tǒng)計表可以代替冗長的文字?jǐn)⑹?,便于對指?biāo)的計算、分析和對比。統(tǒng)計表的基本結(jié)構(gòu)及制表要求1.統(tǒng)計表的基本結(jié)構(gòu)包括標(biāo)題、標(biāo)目(橫標(biāo)目、縱標(biāo)目)、線條和數(shù)字。2.編制統(tǒng)計表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論