




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、衛(wèi)生統(tǒng)計學基礎知識健康管理師培訓公共衛(wèi)生導論流行病學:研究疾病在人群中分布特點的一門方法學醫(yī)學統(tǒng)計學:流行病學得出科學結(jié)論所必需的方法。什么是統(tǒng)計學(Statistics)?統(tǒng)計學是科學(Science)研究的一種方法學。是對數(shù)字收集、整理和解釋的科學。主要是通過對樣本的推論來分析總體的特征。統(tǒng)計學按照應用的領域分為不同分支學科:衛(wèi)生統(tǒng)計學、理論統(tǒng)計學、經(jīng)濟統(tǒng)計學、社會統(tǒng)計學、人口統(tǒng)計學、生物統(tǒng)計學等歷史上著名的統(tǒng)計學家統(tǒng)計學建立在17世紀概率論的基礎上18世紀誕生了世界上最偉大的統(tǒng)計學家19、20世紀出現(xiàn)了大量的統(tǒng)計學家20世紀計算機的出現(xiàn)是統(tǒng)計學飛速發(fā)展的前提。皮埃爾德費馬布萊茲帕斯卡卡爾
2、弗里德里希高斯Johann Gregor Mendel, Karl Pearson,Ronald Aylmer Fisher, Jerzy Neyman統(tǒng)計應用軟件開源的(免費):R商業(yè)的(收費):SPSS(PASW), Stata, S-PLUS, SAS, MATLAB 這些都為統(tǒng)計學的廣泛應用提供了條件,也對我們的工作質(zhì)量提出了要求!要學習什么?了解一些統(tǒng)計學的基本概念。統(tǒng)計學的思維。明白一些統(tǒng)計學的術語。知道用哪些統(tǒng)計學方法。知道怎么解釋統(tǒng)計結(jié)果。學會如何歸納統(tǒng)計結(jié)論。進一步了解:哪些統(tǒng)計學方法不能用?用這種方法容易出現(xiàn)哪些錯誤?對一個結(jié)果采用不同的統(tǒng)計方法進行比較,驗證。7統(tǒng)計工作的
3、步驟第一步設計(design):第二步收集資料(collection of data):第三步整理資料(sorting data):第四步分析資料(analysis of data):試驗設計、實施后的數(shù)據(jù)分析過程面對一個問題(一堆數(shù)據(jù))- 想得到一個什么結(jié)論(了解哪些問題)- 需要哪些數(shù)據(jù) - 使用什么方法 - 這種方法是否適合這些數(shù)據(jù) - 這個方法有哪些優(yōu)缺點 - 通過這個得出的結(jié)果是否有實際意義、與事實相符、符合邏輯 - 從一堆結(jié)果中選出對自己有用的條目 - 形成結(jié)論基本概念和術語總體與樣本、個體總體(Population):根據(jù)研究目的確定的研究對象的全體。當研究有具體而明確的指標時,
4、總體是指該項變量值的全體??傮w可大、可小。大到宇宙、小到一個班級。樣本(Sample):或稱抽樣??傮w中的一部分。好的抽樣能近似地反映總體的特征。個體(Individual):總體中的單個觀察單位(Observation unit)?;蛘叻Q為一個樣本。抽樣(sample)表達的是一個動作,一個過程。個體表達的是一個靜止的物體??傮w表達的是一個不可測的動態(tài)全體。例子:為了了解某地2029歲健康女性血紅蛋白的正常值范圍,現(xiàn)隨機調(diào)查了該地2000名2029歲的健康女性,并對其血紅蛋白進行測量,請問本次調(diào)查的總體是?樣本是什么?個體是什么?2. 變量(Variable)與變異(Variation)變量
5、:一個觀察單位(個體)所表現(xiàn)的特征。比如,身高、體重、血壓特征:一次抽樣中,所有個體的變量值的集合為這個樣本的特征。變量、個體、樣本變異:針對同一個特征,個體間的差異。比如,每個人的身高都有差異。變異產(chǎn)生的原因:來源于未知的、已知的,可以控制的和不可控制原因。比如,身高產(chǎn)生差異的原因有歸根結(jié)底,統(tǒng)計學其實就是在研究變異。3. 誤差(Error)與偏倚(Bias)誤差:在研究中得到的錯誤的結(jié)果(定性概念);測量值與(理論)真實值之差(定量概念)。誤差按性質(zhì)可分為系統(tǒng)誤差和隨機誤差/抽樣誤差。隨機誤差:由隨機性產(chǎn)生,無方向性,無法完全避免。系統(tǒng)誤差:由一個可識別的來源造成。比如人為主觀因素、比如測
6、量工具的缺陷。有方向性(始終一個方向)。原則上可以避免。隨機變化系統(tǒng)誤差舒張壓(mm Hg)8090真實舒張壓(動脈內(nèi)置管)一般的測量方法(血壓計)Difference between Radom error and Systematic error隨機誤差系統(tǒng)誤差來源客觀存在主觀造成方向性無(不可預測)始終一個方向消除可能性無法完全消除可以消除,并應盡可能消除解決方法增加樣本量,取平均值改進設備,方法,流程偏倚(Bias)在數(shù)據(jù)的收集、分析、解釋、發(fā)表、監(jiān)測等所有過程中,由于系統(tǒng)性的原因?qū)е掠^察結(jié)果推論與真實情況存在的差異。偏倚就是系統(tǒng)誤差。偏倚的類型選擇偏倚(Selection bias)
7、信息偏倚(Information / Measurement bias)混雜偏倚(Confounding bias)4. 概率與小概率事件概念:描述隨機事件發(fā)生的可能性大小的數(shù)值,常用 P 來表示。大小:P 的大小在0和1之間,越接近于1,說明發(fā)生的可能性越大,越接近于0,說明發(fā)生的可能性越小。統(tǒng)計學中的許多結(jié)論是帶有概率性質(zhì)的,通常一個事件的發(fā)生小于5%,就叫小概率事件。頻率:在實際工作中,當觀察單位的例數(shù)足夠多時,可以用頻率來代替概率。頻率是概率的估計值。 統(tǒng)計分析的兩件事統(tǒng)計工作的兩件事:描述性、探索性統(tǒng)計描述(Statistical description)統(tǒng)計推斷(Statistic
8、al inference)統(tǒng)計描述:數(shù)據(jù)加工、整理。生成統(tǒng)計指標(Statistic)、統(tǒng)計表格、統(tǒng)計圖形,對資料的數(shù)量特征及分布規(guī)律進行描述和檢驗。統(tǒng)計推斷:從樣本的信息推斷總體的特征。-用于描述總體特征的指標稱為參數(shù)(Parameter)-通過樣本計算得到的特征指標稱為統(tǒng)計量(Statistic)統(tǒng)計推斷分成兩種工作:參數(shù)估計和假設檢驗參數(shù)估計(parameter estimation)分為點估計和區(qū)間估計點估計:用樣本的一個統(tǒng)計量值來估計總體的參數(shù)值。比如平均身高、治愈率。區(qū)間估計:通過可信區(qū)間(confidence interval)來估計總體參數(shù)值在一個范圍內(nèi)的概率。常用95% CI
9、。假設檢驗(hypothesis testing)先提出假設(試驗設計),再檢驗假設的正確性。-比如提出一個假設:較高職稱的干部因為工作壓力導致血壓升高??萍壐刹?VS. 處級干部到底是由工作壓力引起的,還是其他原因(年齡、性別、肥胖)?假設檢驗的步驟結(jié)論的表述I類錯誤與II類錯誤客觀實際主觀推斷拒絕H0不拒絕H0H0成立推斷正確H0不成立推斷正確描述性統(tǒng)計分析認識你的數(shù)據(jù)變量的類型一般分為兩類:定量數(shù)據(jù)(quantitative data)和定性數(shù)據(jù)(qualitative data)數(shù)量變量分類變量計量變量無等級計數(shù)變量和有等級分類變量(ordinal category)。定量數(shù)據(jù)定性資料
10、別名1數(shù)值變量分類變量別名2連續(xù)性變量間斷性變量無等級有等級別名3計量資料計數(shù)資料分類等級變量特點有度量衡單位無度量衡單位例子身高、體重性別,種族疾病嚴重程度一、對定量數(shù)據(jù)(連續(xù)變量)的統(tǒng)計描述定量資料:年齡、身高、體重、血壓、血脂、血糖數(shù)據(jù)的特點:連續(xù)性的數(shù)字,分布有一定的特征。頻數(shù)及其分布100名18歲健康女大學生身高的頻數(shù)分布身高組段劃記頻數(shù) f 1541121561111415811111,11111,11116011111,11111,1111316211111,11111,11111,11111,112216411111,11111,11111,11111916611111,111
11、11,111111516811111,111191701111417217411合 計10037頻數(shù):當匯總大量的數(shù)據(jù)時,把數(shù)據(jù)按區(qū)段分組,其中每個組的數(shù)據(jù)個數(shù),稱為該組的頻數(shù)。頻數(shù)表(頻數(shù)分布):表示各組及它們對應的組頻數(shù)的表格稱為頻數(shù)表或頻數(shù)分布。通過直方圖可以直觀地了解頻數(shù)的分布。39頻數(shù)分布的兩個特征: 集中程度與離散程度頻數(shù)分布的類型: 對稱分布與偏態(tài)分布(集中位置偏向小的一側(cè)叫正偏態(tài),反之叫負偏態(tài))頻數(shù)表的主要用途: 1. 揭示分布類型 2. 發(fā)現(xiàn)特大值和特小值 3. 計算集中趨勢指標與離散趨勢指標40集中程度集中程度:表示大多數(shù)數(shù)值落在什么位置。對集中程度的特征描述用平均值:算數(shù)
12、平均值(均數(shù),Mean)幾何均數(shù)(Geometric mean)中位數(shù)(Median)算數(shù)平均數(shù)幾何均數(shù)意義:N個數(shù)值的乘積開N次方即為這N個數(shù)的幾何均數(shù)。表示:G 計算:應用:原始數(shù)據(jù)分布不對稱,經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料。例如抗體滴度。443.中位數(shù)、百份位數(shù)(percentile)、眾數(shù)(mode)應用范圍離散程度統(tǒng)計學研究的對象是富于變化的事物,同一總體中的各個體之間存在著變異,同質(zhì)各觀察值之間具有的相互偏離、彌散的趨向,這種趨向叫離散趨勢。 描述離散程度的常用指標:全距(極差,Range)四分位數(shù)間距( Quartile range)方差 (Variance)標準差(Standar
13、d deviation)變異系數(shù) (coefficient of variation, CV)計算方法方差(Variance) 描述定量資料分布離散程度的指標之一,它反映了各觀察單位與均數(shù)之間的離散程度。適用于對稱分布的計量資料,包括正態(tài)分布和近似正態(tài)分布的計量資料。總體方差的計算樣本方差的計算 標準差(Standard deviation)標準差是方差的算術平方根,與方差的應用條件相同,適用于對稱分布的計量資料包括正態(tài)分布和近似正態(tài)分布的資料。計算方法變異系數(shù)(Coefficient of Variation)變異系數(shù):標準差與均數(shù)之比。描述了數(shù)據(jù)的變異相對于其平均水平的大小??捎糜诒容^單位
14、不同或者均數(shù)大小相差懸殊的多組數(shù)據(jù)之間的離散程度正態(tài)分布(高斯分布)正態(tài)分布是對稱分布的一種理想狀態(tài)。57正態(tài)分布的特征標準正態(tài)曲線下的面積與橫軸數(shù)值的關系非標準正態(tài)曲線下的面積與橫軸數(shù)值的關系正態(tài)分布用于正常參考值的估計正態(tài)分布的意義正態(tài)分布是參數(shù)檢驗的基礎。參數(shù)檢驗包括t-test,ANOVA(方差分析)等。如果一個大樣本符合正態(tài)分布(近似正態(tài)),或者一個隨機抽樣的小樣本來自一個正態(tài)分布的總體,這時候才能夠采用正態(tài)分布。樣本的正態(tài)性檢驗觀察法(圖示法)1、P-P圖如果資料服從正態(tài)分布,則樣本點應圍繞第一象限的對角線分布。2、Q-Q圖如果資料服從正態(tài)分布,則樣本點應該呈一條圍繞第一象限對角線
15、的直線。以上兩種方法以Q-Q圖為佳,效率較高。3、直方圖判斷方法:是否以鐘形分布,同時可以選擇輸出正態(tài)性曲線。4、箱式圖判斷方法:觀測離群值和中位數(shù)。5、莖葉圖判斷方法:類似直方圖計算法1.偏度系數(shù)(Skewness)和峰度系數(shù)(Kurtosis)除以各自的標準誤2.非參數(shù)檢驗方法包括適用于大樣本的Kolmogorov-Smirnov檢驗(D檢驗)和適用于小樣本的Shapiro- Wilk (W 檢驗)二、對定性數(shù)據(jù)(分類變量)的統(tǒng)計描述定性資料:性別、種族、膚色、血型、患病與否、治愈與否、有無并發(fā)癥數(shù)據(jù)的特點:間斷性,可以用“是/否,輕/中/重,A/B/C/D,1/2/3/4/5”表示。分類資料的描述絕對數(shù),或稱計數(shù)(count)相對數(shù):兩個數(shù)值之比。分為:構(gòu)成比(proportion),指一事物內(nèi)部某一組成部分所占的比重。 學歷 人數(shù)構(gòu)成比(%)本科 99 0.14大專 1248 1.74中專53521 72.65無學歷18763 25.47合計73667100.00某地1992年護理人員學歷構(gòu)成2.率(rate):在某一事件中,實際發(fā)生某一現(xiàn)象的觀察數(shù)與可能會發(fā)生該現(xiàn)象的總觀察數(shù)之比。用于說明某現(xiàn)象發(fā)生的頻率或強度。如:患病率、發(fā)病率、感染率、治愈率、死亡率、病死率 2022/7/2170病名平均人口數(shù)人數(shù)死亡率(1/10萬)高血
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025廣告工程合同
- 2025標準版上海倉庫租賃合同書
- 2025租賃合同(先付租金后使用)
- 一般承攬合同
- 彩票人工縮水服務合同范本
- 2025二級建造師建設工程施工管理考點知識:合同變更與現(xiàn)場簽證與合同價款期中支付
- 2025年度裝修合同范本
- 2025(范本)設備采購合同
- 廣東房屋借住協(xié)議書
- 避險安置協(xié)議書范文
- 湖南省炎德英才名校聯(lián)考聯(lián)合體2024-2025學年高二下學期3月月考-數(shù)學+答案
- 2025年高考作文備考之題目解析及范文:“搭子”
- 蔬菜水果食材配送服務投標方案(技術方案)
- 中醫(yī)內(nèi)科學知到課后答案智慧樹章節(jié)測試答案2025年春浙江中醫(yī)藥大學
- 第二單元第10課《小型網(wǎng)絡的搭建》教學設計 2023-2024學年浙教版(2023)初中信息技術七年級上冊
- 《高效能NLP溝通技巧》課件
- 電力應急物資儲備與管理
- 中國公民健康素養(yǎng)-基本知識與技能(2024年版)試題及答案
- 【語文】第三單元整本書閱讀《駱駝祥子》圈點、批注、做筆記課件-2024-2025學年統(tǒng)編版語文七年級下冊
- 新目錄監(jiān)理規(guī)劃2025
- 2024年天翼云認證運維工程師考試復習題庫(含答案)
評論
0/150
提交評論