版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精選優(yōu)質文檔-傾情為你奉上醫(yī)學統(tǒng)計學知識點梳理醫(yī)學統(tǒng)計學: 是用統(tǒng)計學原理和方法研究生物醫(yī)學問題的一門學科。他包括了研究設計、數(shù)據(jù)收集、整理、分析以及分析結果的正確解釋和表達。統(tǒng)計描述:用統(tǒng)計指標、統(tǒng)計圖表對資料的數(shù)量特征及分布規(guī)律進行客觀的描述和表達。統(tǒng)計推斷:在一定的置信度和概率保證下,用樣本信息推斷總體特征: 參數(shù)估計:用樣本的指標去推斷總體相應的指標 假設檢驗:由樣本的差異推斷總體之間是否可能存在的差異同質:一個總體中有許多個體,他們之所以共同成為人們研究的對象,必定存在共性,我們說一些個體處于同一總體,就是指他們大同小異,具有同質性??傮w(popul
2、ation)是根據(jù)研究目的確定的同質的觀察單位的全體,更確切的說,是同質的所有觀察單位某種觀察值(變量值)的集合??傮w可分為有限總體和無限總體??傮w中的所有單位都能夠標識者為有限總體,反之為無限總體。樣本:從總體中隨機抽取部分觀察單位,其測量結果的集合稱為樣本(sample)。樣本應具有代表性。所謂有代表性的樣本,是指用隨機抽樣方法獲得的樣本。隨機抽樣:隨機抽樣(random sampling)是指按照隨機化的原則(總體中每一個觀察單位都有同等的機會被選入到樣本中),從總體中抽取部分觀察單位的過程。隨機抽樣是樣本具有代表性的保證。變異:在自然狀態(tài)下,個體間測量結果的差異稱為變異(variati
3、on)。變異是生物醫(yī)學研究領域普遍存在的現(xiàn)象。嚴格的說,在自然狀態(tài)下,任何兩個患者或研究群體間都存在差異,其表現(xiàn)為各種生理測量值的參差不齊。(1)計量資料:對每個觀察單位用定量的方法測定某項指標量的大小,所得的資料稱為計量資料(measurement data)。計量資料亦稱定量資料、測量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。(2)計數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計數(shù)資料(count data)。計數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或屬性。(3)等級資料:將觀察單位按測量結果的某種屬性的不同程度分組,所得各組
4、的觀察單位數(shù),稱為等級資料(ordinal data)。概率:概率(probability)又稱幾率,是度量某一隨機事件A發(fā)生可能性大小的一個數(shù)值,記為P(A),P(A)越大,說明A事件發(fā)生的可能性越大。0P(A)1。頻率:在相同的條件下,獨立重復做n 次試驗,事件A 出現(xiàn)了m 次,則比值m/n 稱為隨機事件A 在n 次試驗中出現(xiàn)的頻率(freqency)。當試驗重復很多次時P(A)= m/n。隨機誤差(random error)又稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的誤差。它受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機的變化。誤差變量一般服從正態(tài)分布。隨機誤差可以通過統(tǒng)計處理來估計。抽
5、樣誤差(sampling error )是指樣本統(tǒng)計量與總體參數(shù)的差別。在總體確定的情況下,總體參數(shù)是固定的常數(shù),統(tǒng)計量是在總體參數(shù)附近波動的隨機變量。系統(tǒng)誤差:系統(tǒng)誤差(systematic error)是指由于儀器未校正、測量者感官的某種偏差、醫(yī)生掌握療效標準偏高或偏低等原因,使觀察值不是分散在真值的兩側,而是有方向性、系統(tǒng)性或周期性地偏離真值。系統(tǒng)誤差可以通過實驗設計和完善技術措施來消除或使之減少。隨機變量:隨機變量(random variable)是指取指不能事先確定的觀察結果。隨機變量的具體內容雖然是各式各樣的,但共同的特點是不能用一個常數(shù)來表示,而且,理論上講,每個變量的取值服從特
6、定的概率分布。參數(shù):參數(shù)(paramater)是指總體的統(tǒng)計指標,如總體均數(shù)、總體率等??傮w參數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過隨機抽樣抽取有代表性的樣本,用算得的樣本統(tǒng)計量估計未知的總體參數(shù)。統(tǒng)計量:統(tǒng)計量(statistic)是指樣本的統(tǒng)計指標,如樣本均數(shù)、樣本率等。樣本統(tǒng)計量可用來估計總體參數(shù)??傮w參數(shù)是固定的常數(shù),統(tǒng)計量是在總體參數(shù)附近波動的隨機變量。頻數(shù)表(frequency table)用來表示一批數(shù)據(jù)各觀察值或在不同取值區(qū)間的出現(xiàn)的頻繁程度(頻數(shù))。算術均數(shù)(arithmetic mean)描述一組數(shù)據(jù)在數(shù)量上的平均水平??傮w均數(shù)用表示,樣本均數(shù)用X 表示
7、。幾何均數(shù)(geometric mean)用以描述對數(shù)正態(tài)分布或數(shù)據(jù)呈倍數(shù)變化資料的水平。記為G。中位數(shù)(median)Md將一組觀察值由小到大排列,n 為奇數(shù)時取位次居中的變量值;為偶數(shù)時,取位次居中的兩個變量的平均值。反映一批觀察值在位次上的平均水平。極差(range)亦稱全距,即最大值與最小值之差,用于資料的粗略分析,其計算簡便但穩(wěn)定性較差。百分位數(shù)(percentile)是將n 個觀察值從小到大依次排列,再把它們的位次依次轉化為百分位。百分位數(shù)的另一個重要用途是確定醫(yī)學參考值范圍。四分位數(shù)間距(inter-quartile range)是由第3 四分位數(shù)和第1 四分位數(shù)相減計算而得,常
8、與中位數(shù)一起使用,描述偏態(tài)分布資料的分布特征,較極差穩(wěn)定。方差(variance):方差表示一組數(shù)據(jù)的平均離散情況,由離均差的平方和除以樣本個數(shù)得到。標準差(standard deviation)是方差的正平方根,使用的量綱與原量綱相同,適用于近似正態(tài)分布的資料,大樣本、小樣本均可,最為常用。變異系數(shù)(coefficient of variation)用于觀察指標單位不同或均數(shù)相差較大時兩組資料變異程度的比較。用CV 表示。計算:標準差/均數(shù)*100%統(tǒng)計推斷:通過樣本指標來說明總體特征,這種從樣本獲取有關總體信息的過程稱為統(tǒng)計推斷(statistical inference)。抽樣誤差:由個
9、體變異產(chǎn)生的,抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差異,稱為抽樣誤差(sampling error)。標準誤及X s :通常將樣本統(tǒng)計量的標準差稱為標準誤(standard error of mean,SEM ),它反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異,說明均數(shù)抽樣誤差的大小??尚艆^(qū)間:按預先給定的概率確定的包含未知總體參數(shù)的可能范圍。該范圍稱為總體參數(shù)的可信區(qū)間(confidence interval,CI)。參數(shù)估計:指用樣本指標值(統(tǒng)計量)估計總體指標值(參數(shù))。假設檢驗中P 的含義:指從H0 規(guī)定的總體隨機抽得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗統(tǒng)計量值的概
10、率。I 型錯誤(type I error ),指拒絕了實際上成立的H0,這類“棄真”的錯誤稱為I 型錯誤,其概率大小用表示。II 型錯誤(type II error),指接受了實際上不成立的H0,這類“存?zhèn)巍钡恼`稱為II 型錯誤,其概率大小用表示。檢驗效能:1-稱為檢驗效能(power of test),它是指當兩總體確有差別,按規(guī)定的檢驗水準a 所能發(fā)現(xiàn)該差異的能力。率(rate)又稱頻率指標,說明一定時期內某現(xiàn)象發(fā)生的頻率或強度。計算公式為:發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù)*100%,表示方式有:百分率(%)、千分率()等。構成比(proportio
11、n)又稱構成指標,說明某一事物內部各組成部分所占的比重或分布。計算公式為:某一組成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù)*100%,表示方式有:百分數(shù)等。比(ratio)又稱相對比,是A、B 兩個有關指標之比,說明A 是B 的若干倍或百分之幾。計算公式為:A/B ,表示方式有:倍數(shù)或分數(shù)等。非參數(shù)統(tǒng)計:針對某些資料的總體分布難以用某種函數(shù)式來表達,或者資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,用于解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計分析方法。參數(shù)統(tǒng)計:通常要求樣本來自總體分布型是已知的(如正態(tài)分布),在這種假設的基礎上,對總體參數(shù)(如總體均數(shù))
12、進行估計和檢驗,稱為參數(shù)統(tǒng)計(parametric statistics)秩次:變量值按照從小到大順序所編的秩序號稱為秩次(rank)。秩和:各組秩次的合計稱為秩和(rank sum),是非參數(shù)檢驗的基本統(tǒng)計量。直線回歸(linear regression)建立一個描述應變量依自變量變化而變化的直線方程,并要求各點與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基本、最簡單的一種,故又稱簡單回歸(simple regression)。回歸系數(shù)(regression coefficient )即直線的斜率(slope),在直線回歸方程中用b 表示,b 的統(tǒng)計意義為X每增(減)一個單位時,Y
13、平均改變b 個單位。相關系數(shù)r:用以描述兩個隨機變量之間線性相關關系的密切程度與相關方向的統(tǒng)計指標。二 相關概念醫(yī)學科研數(shù)據(jù)統(tǒng)計分析大致分以下4個步驟。1.1 數(shù)據(jù)整理1.2 統(tǒng)計描述1.3 統(tǒng)計推斷1.4 結果表達頻數(shù)表的制作· 求全距R· 找到資料中的最大值A和最小值B· 計算全距R,· 劃分組段· 確定組數(shù) · 確定組距· 確定各組段的上下限· 下限(lower limit) 上限(upper limit)· 第一組段,其下限可
14、取小于最小觀察值得數(shù)· 半開半閉區(qū)間 - ,- )· 畫表頻數(shù)分布表和頻數(shù)分布圖的用途· 揭示頻數(shù)分布的特征· 集中趨勢· 集中趨勢是指一組數(shù)據(jù)向某一個位置聚集或集中的傾向。· 離散趨勢· 離散趨勢反映的是一組數(shù)據(jù)的分散性和變異度,即各個數(shù)據(jù)離開集中位置的程度。· 便于觀察數(shù)據(jù)的分布類型· 正態(tài)分布 · 集中趨勢的指標:均數(shù)· 離散趨勢的指標:標準差· 偏態(tài)分布· 集中趨勢的指標:中位數(shù)· 離散趨勢
15、的指標:四分位間距 算術平均數(shù)幾何平均數(shù)中位數(shù)符號XGM含義各觀察值相加除以觀察值的個數(shù)所得之商。N各觀察值的乘積開n次方所得之根一組觀察值按順序排列,居中者。應用條件正態(tài)或近似正態(tài)分布對數(shù)正態(tài)分布極偏態(tài)或分布不清的資料計算公式 說明加權法計算中X值的含義 中位數(shù)為百分位數(shù)的特例 標準差的意義和用途0. 說明資料的離散趨勢(或變異程度),標準差的值越大,說明變異程度越大,均數(shù)的代表性越差. 標準差與原始數(shù)據(jù)的單位一致,在科技論文報告中,均數(shù)與標準差經(jīng)常被同時用來描述資料的
16、集中趨勢與離散趨勢。0. 用于計算變異系數(shù)1. 用于計算標準誤2. 結合均值與正態(tài)分布的規(guī)律,估計參考值的范圍。變異系數(shù)(coefficient of variation)適用范圍1觀察指標單位不同,如身高、體重不同單位資料2均數(shù)相差懸殊變異系數(shù)的特點及相應的用途· 沒有單位n 反映標準差占均數(shù)的百分比或標準差是均數(shù)的幾倍n 可用來比較度量衡單位不同的資料的變異度· 不受平均水平的影響n 反映的是以均數(shù)為基數(shù)的相對變異的大小n 比較均數(shù)相差懸殊的資料的變異度變異指標小結1極差較粗,適合于任何分布2標準差與均數(shù)的單位
17、相同,最常用,適合于近似正態(tài)分布3變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4平均指標和變異指標分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標準差; 偏態(tài)分布:中位數(shù)、四分位間距相對數(shù)使用應注意的問題1.根據(jù)需要正確選擇相對數(shù),常見錯誤是以構成比代率。2.分母應當夠大。分母小于20時可靠性較差。如果分母太小,宜用絕對數(shù)表示。3.計算觀察單位數(shù)不等的幾個率的平均率時,不能將幾個率直接相加求平均率。4.要注意其內部構成是否相同。若內部構成不同的資料,應先進行率的標準化后再比。5.根據(jù)樣本數(shù)據(jù)計算的強度相對數(shù),要考慮抽樣誤差的影響。中心極限定理 central limit theorem即使
18、從非正態(tài)總體中抽取樣本,所得均數(shù)分布仍近似呈正態(tài)。隨著樣本量的增大, 樣本均數(shù)的變異范圍也逐漸變窄。標準誤標準誤越大,樣本均數(shù)的分布越分散,樣本均數(shù)與總體均數(shù)的差別越大,抽樣誤差越大,由樣本均數(shù)估計總體均數(shù)的可靠性越小。反之亦然。標準誤反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異。標準誤與標準差成正比,當總體中各觀測值變異很小時,樣本均數(shù)與總體均數(shù)的差異小,抽樣誤差小。標準誤 與樣本含量的平方根成反比,樣本含量越大,抽樣誤差越小t分布同一概率下,自由度越大,|t|越??;同一自由度下,|t|越大,概率P值越?。煌蛔杂啥认?,雙側概率為單側概率的2倍時,所對應的t界值相等;當自由度
19、趨向于時的t界值即為相應概率下的Z值。統(tǒng)計推斷的任務就是用樣本信息推論總體特征。 1、點(值)估計( 近似值)用相應的樣本統(tǒng)計量直接作為其總體參數(shù)的估計值。2、 區(qū)間估計(近似范圍)按預先給定的概率(1-)所確定的包含未知總體參數(shù)的一個范圍區(qū)別點總體均數(shù)可信區(qū)間參考值范圍 含 義按預先給定的概率,確定未知參數(shù)m 的可能范圍。實際上,一次抽樣算得的可信區(qū)間要么包含了總體均數(shù),要么不包含。但可以說:當a=0.05時,95%CI估計正確的概率為0.95,估計錯誤的概率小于或等于0.05,即有95%的可能性包含了總體均數(shù)?!罢H恕钡慕馄剩?,生化某項指標的波
20、動范圍。 總體均數(shù)的波動范圍個體值的波動范圍計算公式s未知n較?。簊已知, 或s未知但n>60:正態(tài)分布: *偏態(tài)分布:PXP100-X 用途 總體均數(shù)的區(qū)間估計絕大多數(shù)(如95%)觀察對象某項指標的分布范圍 假設檢驗有三個基本步驟: 建立假設和確定檢驗水準,通常選=0.05 計算檢驗統(tǒng)計量 確定P 值和做出統(tǒng)計推斷結論 所有的假設檢驗都按照這三個步驟進行,各種檢驗
21、方法的差別在于第步計算的檢驗統(tǒng)計量不同。H0和H1的涵義及注意事項 1.檢驗假設是針對總體,而非樣本;2.H0和H1是互相對立,不是可有可無,而是缺一不可;3. H0無效假設,通常是某兩個或多個總體參數(shù)相相同,或總體參數(shù)之差為0,或某資料服從某一分布等等;4.假設檢驗主要是圍繞H0進行的,當H0被拒絕時,則接受H15. 備選假設應該按照實際世界所代表的方向來確定,即它通常是被認為可能比零假設更符合數(shù)據(jù)所代表的現(xiàn)實。H1的內容反映出單側還是雙側 即H1成立客觀實際假設檢驗的結果拒絕H0不拒絕H0H0成立I型錯誤(a)推斷正確(1-a)H0不成立推斷正確(1-b)II型錯誤(b
22、)減少I型錯誤的主要方法:假設檢驗時設定a 值。減少II型錯誤的主要方法:提高檢驗效能。方差分析應用條件: 總體正態(tài)且方差相等樣本獨立、隨機方差分析的結果拒絕H0,接受H1,不能說明各組總體均數(shù)間兩兩都有差別。如果要分析哪些兩組間有差別,可進行多個均數(shù)間的多重比較卡方檢驗目的: 推斷兩個總體率或構成比之間有無差別 多個總體率或構成比之間有無差別 多個樣本率的多重比較
23、0; 兩個分類變量之間有無關聯(lián)性 頻數(shù)分布擬合優(yōu)度的檢驗。應用:計數(shù)資料檢驗統(tǒng)計量 c2值反映了實際頻數(shù)與理論頻數(shù)的吻合程度。自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,v=1,即在周邊合計數(shù)固定的情況下,4個基本數(shù)據(jù)當中只有一個可以自由取值。參數(shù)統(tǒng)計(parametric statistics):總體分布型已知,對總體參數(shù)進行估計或檢驗正態(tài)分布、二項分布、泊松分布等的檢驗不可用參數(shù)檢驗的情形:不
24、符合正態(tài)分布要求或方差齊性要求變量變換后方差仍不齊或非正態(tài)分布總體分布未知需找到不依賴于總體分布的方法應用非參數(shù)檢驗的情況:1.不滿足正態(tài)和方差齊性條件的小樣本資料2.總體分布類型不明的小樣本資料3.一端或二端是不確定數(shù)值(如0.002、 65等)的資料(必選)4.單向(雙向)有序列聯(lián)表資料5.各種資料的初步分析雙變量計量資料:每個個體有兩個變量值 總體:無限或有限對變量值 樣本:從總體隨機抽取的n對變量值 (X1,Y1), (X2,Y2), , (Xn,Yn) 目的:研究X和Y的數(shù)量關系 方法:相關與回歸簡單、基本:直線相關、直線回歸相關系數(shù)又稱Pearson積矩相關系數(shù),說明具有直線關系的兩變量間相關的密切程度與相關方向相關系數(shù)沒有測量單位,其值為-1r1r0表示正相關,r0表示負相關,r=1 或r= -1為完全相關,r=0為零相關即無直線關系線性相關分析的注意事項1.線性相關表示兩個變量之間的關系是雙向的,分析變量之間的關系,須首先繪制散點圖,散
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 1《我們愛整潔》說課稿-2023-2024學年道德與法治一年級下冊統(tǒng)編版
- 19《只有一個地球》(說課稿)-2024-2025學年統(tǒng)編版語文六年級上冊
- 二零二五年度學長主導的讀書活動策劃與執(zhí)行合同3篇
- 必修4 第五單元 文化傳承與文化創(chuàng)新-高中政治單元說課稿
- 二零二五年度新能源產(chǎn)業(yè)園物業(yè)運營管理合同范本3篇
- 2025年粵教版七年級物理上冊月考試卷含答案
- 2025年上教版六年級英語下冊階段測試試卷
- 2025年度科研合作聘用合同(技術成果轉化)3篇
- 2025年度海洋工程設備檢修與保養(yǎng)合同2篇
- Unit 2 My schoolbag Part A Lets spell (說課稿)-2024-2025學年人教PEP版英語四年級上冊
- 南充化工碼頭管網(wǎng)施工方案(初稿)
- 2023年消防接警員崗位理論知識考試參考題庫(濃縮500題)
- GB/T 30285-2013信息安全技術災難恢復中心建設與運維管理規(guī)范
- 魯濱遜漂流記閱讀任務單
- 第一章 運營管理概論1
- 《創(chuàng)意繪畫在小學美術教育中的應用(論文)6000字》
- 主體結構驗收匯報材料T圖文并茂
- 管理學原理(南大馬工程)
- 過一個有意義的寒假課件
- 施工現(xiàn)場裝配式集裝箱活動板房驗收表
- 電力業(yè)擴工程竣工驗收單
評論
0/150
提交評論