生物統(tǒng)計學與流行病學小整理V1.0-2_第1頁
生物統(tǒng)計學與流行病學小整理V1.0-2_第2頁
生物統(tǒng)計學與流行病學小整理V1.0-2_第3頁
生物統(tǒng)計學與流行病學小整理V1.0-2_第4頁
生物統(tǒng)計學與流行病學小整理V1.0-2_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生物統(tǒng)計學與流行病學小整理V1.0 鐘京諭 20150628一 名詞解釋1.檢驗效能power of test(2)1-稱為檢驗效能(power of test),它是指當兩總體確有差別,按規(guī)定的檢驗水準a 所能發(fā)現該差異的能力。2.ROC曲線 ROC curve(2)將飾演的測量值以真陽性率(靈敏度)為縱坐標,假陽性率(1-特異度)為橫坐標繪制的曲線??梢越沂久舾行院吞禺愋缘南嗷リP系,曲線下面積越大,診斷準確性越高。3.暴露 expose指研究對象接觸過某種待研究的物質、具備某種待研究的特征(如年齡、性別及遺傳等)或行為(如吸煙)。可以以暴露因素為標準可以區(qū)分暴露與非暴露組,研究暴

2、露與疾病之間的聯系可以用于猜測、揭示、檢驗病因。4.出生隊列分析 birth cohort study有相同出生年代的一組人群可以稱之為出生隊列,將這群范圍明確的人群按照是否暴露于某個因素及其暴露程度分為暴露和非暴露組,然后進行前瞻性隨訪,觀察不同隊列人群中出現的結局頻率的差異,分析暴露因素與結局的關系,檢驗病因假設。5.混雜偏倚 confounding bias在研究暴露與疾病的練習室,假如有一種外界因素既與研究疾病的危險因素相聯系,又在個比較組中分布不同,這個因素稱為混雜變量,因此而產生的偏倚稱為混雜偏倚。6.傷殘調整壽命年 disability adjusted life year, D

3、ALY是指從發(fā)病到死亡所損失的全部健康壽命年,包括因早死所致的壽命損失年(YLL)和疾病所致傷殘引起的健康壽命損失年(YLD)兩部分。DALY是生命數量和生命質量以時間為單位的綜合度量,是疾病經濟負擔評價和測量指標。7.變異系數 coefficient of variation, CV用于觀察指標單位不同或均數相差較大時兩組資料變異程度的比較。用CV 表示。計算:標準差/均數*100%8.決定系數 coefficient of correlation相關系數的平方,相關系數是用以反映變量之間相關關系密切程度的統(tǒng)計指標9.入院率偏倚 admission rate bias屬于

4、流行病學中病例對照研究的一種選擇偏倚。指以醫(yī)院為基礎的病例對照研究中,目標疾病的入院率因待研究的暴露因素的存在與否或暴露水平的不同而存在差異,由此而引起的誤差。10.人群歸因危險度population attributive risk是指總人群發(fā)病率中歸因于暴露的部分二 簡答(老師說要考引用的題目,但下面這些看一看應該也是可以的吧)1.醫(yī)學統(tǒng)計學方法的基本步驟:(1)設計:統(tǒng)計工作中最關鍵的一環(huán)。(2)收集資料:主要有四個來源:統(tǒng)計報表;登記和報告卡(單);日常醫(yī)療衛(wèi)生工作記錄;專題調查或實驗。(3)整理資料(4)分析資料:統(tǒng)計描述;統(tǒng)計推斷。 2.正態(tài)分布的特征

5、:(2)(1)正態(tài)分布曲線在橫軸上方均數處最高;(2)正態(tài)分布以均數為中心左右對稱;(3)正態(tài)分布曲線下面積的分布有一定的規(guī)律;(4)正態(tài)分布有兩個參數:均數是位置參數,決定正態(tài)曲線的中心位置;是形狀參數,決定正態(tài)曲線的陡峭或扁平程度,越小曲線越陡峭,越大曲線越扁平。 3.t分布的特點:(1)以0為中心左右對稱;(2)曲線形態(tài)與自由度大小有關,自由度越小,t分布曲線越平坦,曲線中間越低,兩側尾部翹得越高;自由度越大,t分布曲線越接近正態(tài)分布曲線。 4.制定醫(yī)學參考值范圍的基本原則:(1)抽取樣本含量足夠大的正常人;(2)對抽取的正常人進行準確統(tǒng)一的測定,控制測量誤差;(3)

6、判斷是否需要分組指定參考值范圍;(4)決定參考值范圍的單側或雙側界值;(5)選擇適當的百分界值。 5.標準誤的應用:(1)反映樣本均數的可靠性以及抽樣誤差的大?。藴收`大,表示抽樣誤差大,則樣本均數估計總體均數的可靠性差;反之,標準誤小,抽樣誤差小,樣本均數估計總體均數的可靠性好。)(2)估計總體均數的置信區(qū)間;(3)用于均數的假設檢驗。 6.假設檢驗的一般步驟:(1)建立假設(無效假設和備擇假設)和確定檢驗水準; (2)選擇檢驗方法和計算檢驗統(tǒng)計量;(3)確定P值,做出推斷結論。 7.1 t檢驗與u檢驗的應用條件:t檢驗:(1)未知且樣本例數n較??;(

7、2)要求樣本來自正態(tài)分布的總體;(3)作兩樣本均數比較時還要求兩樣本的總體方差相等(方差齊性)u檢驗:(1)已知或未知,但樣本含量n較大(一般大于100);(2)要求樣本來自正態(tài)分布的總體;(3)作兩樣本均數比較時還要求兩樣本的總體方差相等(方差齊性) 7.2 各種檢驗(2)1.t檢驗適用于計量資料、正態(tài)分布、方差具有齊性的兩組間小樣本比較。包括配對資料間、樣本與均數間、兩樣本均數間比較三種,三者的計算公式不能混淆。2.t'檢驗應用條件與t檢驗大致相同,但t檢驗用于兩組間方差不齊時,t檢驗的計算公式實際上是方差不齊時t檢驗的校正公式。3.U檢驗應用條件與t檢驗基本一致,只是當

8、大樣本時用U檢驗,而小樣本時則用t檢驗,t檢驗可以代替U檢驗。4.方差分析用于正態(tài)分布、方差齊性的多組間計量比較。常見的有單因素分組的多樣本均數比較及雙因素分組的多個樣本均數的比較,方差分析首先是比較各組間總的差異,如總差異有顯著性,再進行組間的兩兩比較,組間比較用q檢驗或LST檢驗等。5.X2檢驗是計數資料主要的顯著性檢驗方法。用于兩個或多個百分比(率)的比較。常見以下幾種情況:四格表資料、配對資料、多于2行*2列資料及組內分組X2檢驗。6.符號檢驗、秩和檢驗和Ridit檢驗三者均屬非參數統(tǒng)計方法,共同特點是簡便、快捷、實用??捎糜诟鞣N非正態(tài)分布的資料、未知分布資料及半定量資料的分析。其主要

9、缺點是容易丟失數據中包含的信息。所以凡是正態(tài)分布或可通過數據轉換成正態(tài)分布者盡量不用這些方法。8.假設檢驗的注意事項:(1)注意資料的可比性;(2)注意選用的假設檢驗方法的應用條件;(3)結論不能絕對化;(4)正確區(qū)分差別有無統(tǒng)計意義和有無專業(yè)意義的實際意義;(5)u檢驗和t檢驗理論上要求樣本來自正態(tài)分布的總體,還要注意方差齊性。 9.應用相對數的注意事項:(1)分母不宜過小,觀察例數足夠多;(2)正確區(qū)分構成比和率(構成比是結構指標,率是頻率指標);(3)進行相對數比較時,資料要具有可比性;(4)兩樣本率的比較需要進行假設檢驗;(5)分母不同的率不能簡單相加求平均率。 1

10、0.為什么要率標準化:采用統(tǒng)一的標準,對內部構成不同的各組頻率進行調整和對比,消除資料內部構成不同的影響,使資料在統(tǒng)一標準下具有可比性,避免錯誤結論。 11.非參數檢驗適用的資料:(1)總體分布為偏態(tài)或分布形式未知;(2)等級資料;(3)個別數據偏大或數據的某一端無確定的數值;(4)各總體方差不齊。 12.非參數檢驗的優(yōu)缺點:優(yōu)點:不需考慮總體的分布情況,應用范圍廣,方法簡單;缺點:犯第二類錯誤的可能性增加。 13.直線回歸分析中注意的問題及其應用:(1)兩變量間的要有實際意義,不能把毫無關聯的兩種現象作回歸分析;(2)作回歸分析時,一般以“因”的變量為X,以“果

11、”的變量為Y,若變量之間無因果關系,則以容易測定、較穩(wěn)定或變異較小者為X;(3)因變量必須服從正態(tài)分布。若自變量和因變量都是隨機變量則雙變量都要滿足正態(tài)分布;(4)回歸方程只有經過假設檢驗拒絕了無效假設后才有意義;(5)實際應用中回歸方程的適用范圍一般以自變量X的取值范圍為限,不宜超出此范圍。 應用:(1)描述兩變量間的依存關系;(2)利用回歸方程進行預測和統(tǒng)計控制。 14.直線回歸和直線相關的聯系與區(qū)別:(1)聯系:(1)同一資料的相關系數r和回歸系數b的假設檢驗等價;(2)相關系數r和回歸系數b同正同負,r=0時b=0;(3)相關和回歸可相互解釋(決定系數r2)區(qū)別:(

12、1)相關表示相互(雙向)關系,回歸表示依存(單向)關系;(2)當X和Y都是隨機變量,可以進行相關和回歸分析;當Y是隨機變量X是控制變量,理論上只能作回歸分析;(3)直線相關的雙變量都需服從正態(tài)分布;直線回歸Y需服從正態(tài)分布,X不一定。 15.統(tǒng)計表的結構和注意事項:(1)列表的總原則:結構簡單,層次分明,內容安排合理,重點突出,數據準確結構和基本要求:(1)標題:簡明扼要,列在表的上端中央(2)標目:橫標目在表左側,說明研究對象;縱標目在表上端,說明各統(tǒng)計指標(3)線條:三線格形式,頂線、底線及隔開縱標目與數字的橫線,禁用斜線和豎線(4)數字:使用阿拉伯數字,位數對齊,小數點位數一致

13、,表內不留空格,如缺失可用“”或“”來表示,若數值為“0”,則填寫“0”(5)說明:特殊情況下需要備注說明時,用“*”標出,寫在表外下面。 16.生存分析中出現截尾值的原因:(1)失訪;(2)到研究結束時終點事件仍未發(fā)生;(3)研究對象因研究以外的其他原因死亡,如車禍等意外或與研究無關的疾病等。三 計算1.配對設計資料的t檢驗(4)2.隊列分析(3)3.線性相關系數及其假設檢驗(2)4.(病例對照)壽命表法計算累計生存率5.用直接法求標準化率6.樣本均數和總體均數u檢驗附:一 名解 醫(yī)學統(tǒng)計學: 是用統(tǒng)計學原理和方法研究生物醫(yī)學問題的一門學科。他包括了研究設計、數據收集、整

14、理、分析以及分析結果的正確解釋和表達。 統(tǒng)計描述:用統(tǒng)計指標、統(tǒng)計圖表對資料的數量特征及分布規(guī)律進行客觀的描述和表達。統(tǒng)計推斷:在一定的置信度和概率保證下,用樣本信息推斷總體特征:  參數估計:用樣本的指標去推斷總體相應的指標  假設檢驗:由樣本的差異推斷總體之間是否可能存在的差異 同質:一個總體中有許多個體,他們之所以共同成為人們研究的對象,必定存在共性,我們說一些個體處于同一總體,就是指他們大同小異,具有同質性。 總體(population)是根據研究目的確定的同質的觀察單位的全體,更確切的說,是同質的所有觀察單位某種觀察值(變量值)的集合

15、。總體可分為有限總體和無限總體??傮w中的所有單位都能夠標識者為有限總體,反之為無限總體。樣本:從總體中隨機抽取部分觀察單位,其測量結果的集合稱為樣本(sample)。樣本應具有代表性。所謂有代表性的樣本,是指用隨機抽樣方法獲得的樣本。 隨機抽樣:隨機抽樣(random sampling)是指按照隨機化的原則(總體中每一個觀察單位都有同等的機會被選入到樣本中),從總體中抽取部分觀察單位的過程。隨機抽樣是樣本具有代表性的保證。 變異:在自然狀態(tài)下,個體間測量結果的差異稱為變異(variation)。變異是生物醫(yī)學研究領域普遍存在的現象。嚴格的說,在自然狀態(tài)下,任何兩個患者或研究

16、群體間都存在差異,其表現為各種生理測量值的參差不齊。 (1)計量資料:對每個觀察單位用定量的方法測定某項指標量的大小,所得的資料稱為計量資料(measurement data)。計量資料亦稱定量資料、測量資料。.其變量值是定量的,表現為數值大小,一般有度量衡單位。(2)計數資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數稱為計數資料(count data)。計數資料亦稱定性資料或分類資料。其觀察值是定性的,表現為互不相容的類別或屬性。(3)等級資料:將觀察單位按測量結果的某種屬性的不同程度分組,所得各組的觀察單位數,稱為等級資料(ordinal data)。 概率:概

17、率(probability)又稱幾率,是度量某一隨機事件A發(fā)生可能性大小的一個數值,記為P(A),P(A)越大,說明A事件發(fā)生的可能性越大。0P(A)1。 頻率:在相同的條件下,獨立重復做n 次試驗,事件A 出現了m 次,則比值m/n 稱為隨機事件A 在n 次試驗中出現的頻率(freqency)。當試驗重復很多次時P(A)= m/n。 隨機誤差(random error)又稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的誤差。它受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機的變化。誤差變量一般服從正態(tài)分布。隨機誤差可以通過統(tǒng)計處理來估計。 抽樣誤差(sampling e

18、rror )是指樣本統(tǒng)計量與總體參數的差別。在總體確定的情況下,總體參數是固定的常數,統(tǒng)計量是在總體參數附近波動的隨機變量。 系統(tǒng)誤差:系統(tǒng)誤差(systematic error)是指由于儀器未校正、測量者感官的某種偏差、醫(yī)生掌握療效標準偏高或偏低等原因,使觀察值不是分散在真值的兩側,而是有方向性、系統(tǒng)性或周期性地偏離真值。系統(tǒng)誤差可以通過實驗設計和完善技術措施來消除或使之減少。 隨機變量:隨機變量(random variable)是指取指不能事先確定的觀察結果。隨機變量的具體內容雖然是各式各樣的,但共同的特點是不能用一個常數來表示,而且,理論上講,每個變量的取值服從特定的

19、概率分布。 參數:參數(paramater)是指總體的統(tǒng)計指標,如總體均數、總體率等??傮w參數是固定的常數。多數情況下,總體參數是不易知道的,但可通過隨機抽樣抽取有代表性的樣本,用算得的樣本統(tǒng)計量估計未知的總體參數。 統(tǒng)計量:統(tǒng)計量(statistic)是指樣本的統(tǒng)計指標,如樣本均數、樣本率等。樣本統(tǒng)計量可用來估計總體參數??傮w參數是固定的常數,統(tǒng)計量是在總體參數附近波動的隨機變量。 頻數表(frequency table)用來表示一批數據各觀察值或在不同取值區(qū)間的出現的頻繁程度(頻數)。 算術均數(arithmetic mean)描述一組數據在數量上的

20、平均水平??傮w均數用表示,樣本均數用X 表示。 幾何均數(geometric mean)用以描述對數正態(tài)分布或數據呈倍數變化資料的水平。記為G。 中位數(median)Md將一組觀察值由小到大排列,n 為奇數時取位次居中的變量值;為偶數時,取位次居中的兩個變量的平均值。反映一批觀察值在位次上的平均水平。 極差(range)亦稱全距,即最大值與最小值之差,用于資料的粗略分析,其計算簡便但穩(wěn)定性較差。 百分位數(percentile)是將n 個觀察值從小到大依次排列,再把它們的位次依次轉化為百分位。百分位數的另一個重要用途是確定醫(yī)學參考值范圍。 四

21、分位數間距(inter-quartile range)是由第3 四分位數和第1 四分位數相減計算而得,常與中位數一起使用,描述偏態(tài)分布資料的分布特征,較極差穩(wěn)定。 方差(variance):方差表示一組數據的平均離散情況,由離均差的平方和除以樣本個數得到。 標準差(standard deviation)是方差的正平方根,使用的量綱與原量綱相同,適用于近似正態(tài)分布的資料,大樣本、小樣本均可,最為常用。 變異系數(coefficient of variation)用于觀察指標單位不同或均數相差較大時兩組資料變異程度的比較。用CV 表示。計算:標準差/均數*100%&#

22、160; 統(tǒng)計推斷:通過樣本指標來說明總體特征,這種從樣本獲取有關總體信息的過程稱為統(tǒng)計推斷(statistical inference)。 抽樣誤差:由個體變異產生的,抽樣造成的樣本統(tǒng)計量與總體參數的差異,稱為抽樣誤差(sampling error)。 標準誤及X s :通常將樣本統(tǒng)計量的標準差稱為標準誤(standard error of mean,SEM ),它反映了樣本均數間的離散程度,也反映了樣本均數與總體均數的差異,說明均數抽樣誤差的大小。 可信區(qū)間:按預先給定的概率確定的包含未知總體參數的可能范圍。該范圍稱為總體參數的可信區(qū)間(confid

23、ence interval,CI)。 參數估計:指用樣本指標值(統(tǒng)計量)估計總體指標值(參數)。 假設檢驗中P 的含義:指從H0 規(guī)定的總體隨機抽得等于及大于(或等于及小于)現有樣本獲得的檢驗統(tǒng)計量值的概率。 I 型錯誤(type I error ),指拒絕了實際上成立的H0,這類“棄真”的錯誤稱為I 型錯誤,其概率大小用表示。II 型錯誤(type II error),指接受了實際上不成立的H0,這類“存?zhèn)巍钡恼`稱為II 型錯誤,其概率大小用表示。 檢驗效能:1-稱為檢驗效能(power of test),它是指當兩總體確有差別,按規(guī)定的檢驗水準a 所

24、能發(fā)現該差異的能力。 率(rate)又稱頻率指標,說明一定時期內某現象發(fā)生的頻率或強度。計算公式為:發(fā)生某現象的觀察單位數/可能發(fā)生某現象的觀察單位總數*100%,表示方式有:百分率(%)、千分率()等。 構成比(proportion)又稱構成指標,說明某一事物內部各組成部分所占的比重或分布。計算公式為:某一組成部分的觀察單位數/同一事物各組成部分的觀察單位總數*100%,表示方式有:百分數等。 比(ratio)又稱相對比,是A、B 兩個有關指標之比,說明A 是B 的若干倍或百分之幾。計算公式為:A/B ,表示方式有:倍數或分數等。 非參數統(tǒng)計:針對某些

25、資料的總體分布難以用某種函數式來表達,或者資料的總體分布的函數式是未知的,只知道總體分布是連續(xù)型的或離散型的,用于解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計分析方法。 參數統(tǒng)計:通常要求樣本來自總體分布型是已知的(如正態(tài)分布),在這種假設的基礎上,對總體參數(如總體均數)進行估計和檢驗,稱為參數統(tǒng)計(parametric statistics) 秩次:變量值按照從小到大順序所編的秩序號稱為秩次(rank)。 秩和:各組秩次的合計稱為秩和(rank sum),是非參數檢驗的基本統(tǒng)計量。 直線回歸(linear regression)建立一個描述應變量

26、依自變量變化而變化的直線方程,并要求各點與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基本、最簡單的一種,故又稱簡單回歸(simple regression)。 回歸系數(regression coefficient )即直線的斜率(slope),在直線回歸方程中用b 表示,b 的統(tǒng)計意義為X每增(減)一個單位時,Y平均改變b 個單位。 相關系數r:用以描述兩個隨機變量之間線性相關關系的密切程度與相關方向的統(tǒng)計指標。 二 相關概念 醫(yī)學科研數據統(tǒng)計分析大致分以下4個步驟。1.1 數據整理1.2 統(tǒng)計描述1.3 統(tǒng)計推斷1.4 結果表達 

27、 頻數表的制作求全距R找到資料中的最大值A和最小值B計算全距R,劃分組段確定組數   確定組距確定各組段的上下限下限(lower limit)     上限(upper limit)第一組段,其下限可取小于最小觀察值得數半開半閉區(qū)間   -  ,-  ) 畫表 頻數分布表和頻數分布圖的用途 揭示頻數分布的特征集中趨勢集中趨勢是指一組數據向某一個位置聚集或集中的傾向。離散趨勢離散趨勢反映的是一組數據的分散性和變異度,即各個數據離開集中位置的程度。便于觀察數據

28、的分布類型正態(tài)分布 集中趨勢的指標:均數離散趨勢的指標:標準差偏態(tài)分布集中趨勢的指標:中位數離散趨勢的指標:四分位間距   算術平均數幾何平均數中位數符號XGM含義各觀察值相加除以觀察值的個數所得之商。N各觀察值的乘積開n次方所得之根一組觀察值按順序排列,居中者。應用條件正態(tài)或近似正態(tài)分布對數正態(tài)分布極偏態(tài)或分布不清的資料計算公式   說明加權法計算中X值的含義 中位數為百分位數的特例 標準差的意義和用途說明資料的離散趨勢(或變異程度),標準差的值越大,說明變異程度越大,均數的代表性越差. &#

29、160;   標準差與原始數據的單位一致,在科技論文報告中,均數與標準差經常被同時用來描述資料的集中趨勢與離散趨勢。用于計算變異系數用于計算標準誤結合均值與正態(tài)分布的規(guī)律,估計參考值的范圍。 變異系數(coefficient of variation)適用范圍1觀察指標單位不同,如身高、體重不同單位資料2均數相差懸殊 變異系數的特點及相應的用途沒有單位n  反映標準差占均數的百分比或標準差是均數的幾倍n  可用來比較度量衡單位不同的資料的變異度 不受平均水平的影響n  反映的是以均數為基數的相對變異的大小n

30、0; 比較均數相差懸殊的資料的變異度 變異指標小結1極差較粗,適合于任何分布2標準差與均數的單位相同,最常用,適合于近似正態(tài)分布3變異系數主要用于單位不同或均數相差懸殊資料4平均指標和變異指標分別反映資料的不同特征,常配套使用如正態(tài)分布:均數、標準差; 偏態(tài)分布:中位數、四分位間距 相對數使用應注意的問題1.根據需要正確選擇相對數,常見錯誤是以構成比代率。2.分母應當夠大。分母小于20時可靠性較差。如果分母太小,宜用絕對數表示。3.計算觀察單位數不等的幾個率的平均率時,不能將幾個率直接相加求平均率。4.要注意其內部構成是否相同。若內部構成不同的資料,應先進行率的標準化后再比

31、。5.根據樣本數據計算的強度相對數,要考慮抽樣誤差的影響。 中心極限定理 central limit theorem即使從非正態(tài)總體中抽取樣本,所得均數分布仍近似呈正態(tài)。隨著樣本量的增大, 樣本均數的變異范圍也逐漸變窄。 標準誤標準誤越大,樣本均數的分布越分散,樣本均數與總體均數的差別越大,抽樣誤差越大,由樣本均數估計總體均數的可靠性越小。反之亦然。標準誤反映了樣本均數間的離散程度,也反映了樣本均數與總體均數的差異。標準誤與標準差成正比,當總體中各觀測值變異很小時,樣本均數與總體均數的差異小,抽樣誤差小。標準誤 與樣本含量的平方根成反比,樣本含量越大,抽樣誤差越小 

32、;t分布同一概率下,自由度越大,|t|越??;同一自由度下,|t|越大,概率P值越?。煌蛔杂啥认?,雙側概率為單側概率的2倍時,所對應的t界值相等;當自由度趨向于時的t界值即為相應概率下的Z值。 統(tǒng)計推斷的任務就是用樣本信息推論總體特征。 1、點(值)估計( 近似值)用相應的樣本統(tǒng)計量直接作為其總體參數的估計值。2、 區(qū)間估計(近似范圍)按預先給定的概率(1-)所確定的包含未知總體參數的一個范圍  區(qū)別點總體均數可信區(qū)間參考值范圍 含 義按預先給定的概率,確定未知參數m 的可能范圍。實際上,一次抽樣算得的可信區(qū)間要么包含了總體均數,要么

33、不包含。但可以說:當a=0.05時,95%CI估計正確的概率為0.95,估計錯誤的概率小于或等于0.05,即有95%的可能性包含了總體均數。“正常人”的解剖,生理,生化某項指標的波動范圍。 總體均數的波動范圍個體值的波動范圍計算公式s未知n較?。簊已知, 或s未知但n>60:正態(tài)分布: *偏態(tài)分布:PXP100-X 用途 總體均數的區(qū)間估計絕大多數(如95%)觀察對象某項指標的分布范圍 假設檢驗有三個基本步驟:    建立假設和確定檢驗水準,通常選=0.05   計算檢驗統(tǒng)計量&

34、#160;  確定P 值和做出統(tǒng)計推斷結論       所有的假設檢驗都按照這三個步驟進行,各種檢驗方法的差別在于第步計算的檢驗統(tǒng)計量不同。 H0和H1的涵義及注意事項 1.檢驗假設是針對總體,而非樣本;2.H0和H1是互相對立,不是可有可無,而是缺一不可;3. H0無效假設,通常是某兩個或多個總體參數相相同,或總體參數之差為0,或某資料服從某一分布等等;4.假設檢驗主要是圍繞H0進行的,當H0被拒絕時,則接受H15. 備選假設應該按照實際世界所代表的方向來確定,即它通常是被認為可能比零假設更符合數據所代

35、表的現實。 H1的內容反映出單側還是雙側即H1成立客觀實際假設檢驗的結果拒絕H0不拒絕H0H0成立I型錯誤(a)推斷正確(1-a)H0不成立推斷正確(1-b)II型錯誤(b)減少I型錯誤的主要方法:假設檢驗時設定a 值。減少II型錯誤的主要方法:提高檢驗效能。 方差分析應用條件: 總體正態(tài)且方差相等樣本獨立、隨機方差分析的結果拒絕H0,接受H1,不能說明各組總體均數間兩兩都有差別。如果要分析哪些兩組間有差別,可進行多個均數間的多重比較 卡方檢驗目的:    推斷兩個總體率或構成比之間有無差別        多個總體率或構成比之間有無差別        多個樣本率的多重比較        兩個分類變量之間有無關聯性        頻數分布擬合優(yōu)度的檢驗。應用:計數資料檢驗統(tǒng)計量 c2值反映了實際頻數與理論頻數的吻合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論