醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、醫(yī)學(xué)統(tǒng)計學(xué)復(fù) 習(xí)醫(yī)學(xué)統(tǒng)計中的基本概念醫(yī)學(xué)統(tǒng)計工作的內(nèi)容實驗設(shè)計 收集資料整理資料 分析資料資料的類型醫(yī)學(xué)統(tǒng)計資料一般可分為計量資料計量資料和計數(shù)資料計數(shù)資料兩大類。不同的統(tǒng)計資料應(yīng)采用不同的統(tǒng)計分析方法??傮w和樣本總體是同質(zhì)的個體所構(gòu)成的全體。從總體中抽取部分個體的過程稱為抽樣,所抽得的部分成為樣本 從總體中抽取樣本要遵循科學(xué)原則 一個樣本應(yīng)具有 “代表性”符合總體規(guī)定 “隨機(jī)性”每個個體被抽取有相同的 概率 “可靠性”實驗結(jié)果要有可重復(fù)性二個樣本之間應(yīng)具有可比性 誤差 系統(tǒng)誤差 隨機(jī)測量誤差 抽樣誤差 頻率與概率 頻率是發(fā)生某現(xiàn)象的觀察單位數(shù)占可能發(fā)生該現(xiàn)象的觀察單位總數(shù)的比值。概率是描寫某

2、一事件發(fā)生的可能性大小的一個量度。用表示某一事件, 表示該事件可能發(fā)生的概率,可記為(A) 計量資料的統(tǒng)計描述 頻數(shù)表與直方圖平均水平 算術(shù)均數(shù)適用于對稱分布,尤其是正態(tài) 分布資料 幾何均數(shù)適用于幾何級數(shù)分布的資料 中位數(shù)適用于偏態(tài)、分布不明、分布末 端無確定值資料變異程度 標(biāo)準(zhǔn)差和方差 四分位數(shù)間距等 變異系數(shù) CV正態(tài)分布正態(tài)分布 正態(tài)分布的密度函數(shù) 222)(21)(XeXfX正態(tài)分布的兩個參數(shù):均數(shù)標(biāo)準(zhǔn)差-5-4-3-2-101234596.196.158.258.2%0.99%0.95%3.68正態(tài)分布曲線下的面積 -4-3-2-101234567123321三種不同均值的正態(tài)分布

3、-5-4-3-2-1012345123321三種不同標(biāo)準(zhǔn)差的正態(tài)分布抽樣誤差與假設(shè)檢驗抽樣誤差與假設(shè)檢驗 抽樣誤差不可避免樣本均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤 總體均數(shù)的估計 參數(shù)估計是指由樣本指標(biāo)值(統(tǒng)計量)估計總體指標(biāo)值(參數(shù)),是統(tǒng)計推斷的一個重要內(nèi)容。常用的估計方法有兩種:點估計和區(qū)間估計。 區(qū)間估計的概念可信區(qū)間亦稱置信區(qū)間,是指按預(yù)先給定的概率估計未知總體均數(shù)的可能范圍。事先給定的概率1-稱為可信度 可信區(qū)間有兩個要素:1.準(zhǔn)確度2.精密度 假設(shè)檢驗的基本概念 假設(shè)檢驗是統(tǒng)計推斷的另一個重要內(nèi)容,亦稱顯著性檢驗假設(shè)檢驗的基本思想假設(shè)檢驗的步驟 建立檢驗假設(shè)并確定檢驗水準(zhǔn) 選擇檢驗方法、計算統(tǒng)

4、計量 確定概率值 作出推斷結(jié)論 假設(shè)檢驗中的兩類錯誤第一類錯誤(拒絕實際上成立的假設(shè))第二類錯誤(不拒絕實際不成立的假設(shè))犯兩類錯誤的可能性大小若想同時降低犯兩類錯誤的可能,增加樣本例數(shù)u檢驗大樣本均數(shù)與某一已知總體均數(shù)比較的u檢驗兩個樣本均數(shù)比較的u檢驗t檢驗小樣本均數(shù)與總體均數(shù)比較的t檢驗兩個小樣本均數(shù)比較的t檢驗配對資料的t檢驗方差齊性檢驗t檢驗t檢驗t檢驗的適用條件:總體服從正態(tài)分布,且不知總體標(biāo)準(zhǔn)誤,而用樣本標(biāo)準(zhǔn)誤代替標(biāo)準(zhǔn)誤進(jìn)行計算兩小樣本均數(shù)進(jìn)行比較時,方差齊,用t檢驗;方差不齊,用t檢驗。t 檢驗例例 根據(jù)大量調(diào)查,已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在某山區(qū)隨機(jī)調(diào)查2

5、5名健康男子,求得脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.0次/分。能否認(rèn)為該山區(qū)的成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)? 1.H0 : = 0 H1: 0 或 0 或 0 =0.05 2.833. 125/0 . 6722 .74XSXt3. 查 t 界值表:自由度為24 1.7111.8332.064 對應(yīng) 0.05P0.104. 單側(cè)概率0.025P0.05 按0.05水準(zhǔn)拒絕H0,差異有統(tǒng)計學(xué)意義??烧J(rèn)為該山區(qū)健康成年男子脈搏數(shù)高于一般成年男子脈搏數(shù)。此例也可以做區(qū)間估計,總體均數(shù)應(yīng)大于 74.2-2.064*6.0/5顯著性檢驗有雙側(cè)檢驗和單側(cè)檢驗,一般認(rèn)為雙側(cè)檢驗較穩(wěn)妥,故較

6、常用運(yùn)用雙側(cè)檢驗還是單側(cè)檢驗與專業(yè)對事物的認(rèn)識有關(guān),與檢驗的目的有關(guān)。假設(shè)檢驗與區(qū)間估計的關(guān)系可信區(qū)間不僅能回答差別有無統(tǒng)計學(xué)意義,而且還能提示差別有無實際意義。可信區(qū)間只能在預(yù)先規(guī)定的概率即檢驗水準(zhǔn)的前提下進(jìn)行計算,而假設(shè)檢驗?zāi)軌颢@得一較為確切的概率值。故將二者結(jié)合起來,才是對假設(shè)檢驗問題的完整分析。原理相同,具體統(tǒng)計方法各異如上例,首先這是計量資料,然后確定這是正態(tài)分布,只有一個樣本,而且是小樣本(n50),不知道總體方差,這是就要用 t 檢驗既可以做假設(shè)檢驗,也可以做區(qū)間估計 所用方法是相同的,核心用的是同一個統(tǒng)計量的計算公式從正態(tài)分布總體中隨機(jī)抽樣得到多個樣本均數(shù),它們服從正態(tài)分布,經(jīng)

7、u變換,XX服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)XSX服從自由度=n-1的t分布 統(tǒng)計學(xué)家對兩樣本均數(shù)比較時,對是否需進(jìn)行方差齊性檢驗有不同的看法,有的認(rèn)為不必都做方差齊性檢驗。有人提出當(dāng)一個樣本的方差是另一個樣本方差3倍以上,可認(rèn)為兩總體方差不齊。有的認(rèn)為若樣本含量較大時(如n1和n2均大于100),可不必做方差齊性檢驗。 方差分析方差分析 對于來自兩個正態(tài)總體的樣本均數(shù)的比較,可以用第五章介紹的t檢驗和u檢驗,但在實際工作中經(jīng)常會遇到多個來自正態(tài)總體的樣本均數(shù)的比較,這就需要用方差分析 方差分析的應(yīng)用條件是:各樣本相互獨(dú)立,且均來自總體方差具有齊性的正態(tài)分布 方差分析的基本思想方差分析的基本思想是

8、將全部觀察值的總變異按影響實驗結(jié)果的諸因素分解為若干部分變異,構(gòu)造出反映各部分變異作用的統(tǒng)計量,之后構(gòu)造假設(shè)檢驗統(tǒng)計量 F F ,實現(xiàn)對總體均數(shù)的推斷。具體公式見書 方差分析可進(jìn)行成組設(shè)計的多個樣本均數(shù)比較,也叫完全隨機(jī)設(shè)計,是單因素設(shè)計;也可進(jìn)行配伍組設(shè)計的多個樣本均數(shù)比較,也稱隨機(jī)區(qū)組設(shè)計,是配對設(shè)計的擴(kuò)充。成組設(shè)計可分析一個因素,即處理因素;配伍組設(shè)計可分析兩個因素,即處理因素和配伍因素一般來說,成組設(shè)計方差分析的效率比配伍組設(shè)計低多個樣本均數(shù)的兩兩比較 在多個樣本均數(shù)的比較中,如果經(jīng)方差分析得到p0.05,按0.05的水準(zhǔn)拒絕H0,接受 H1,表明多個總體均數(shù)不全相同,但并不清楚多個總

9、體均數(shù)中究竟哪些總體均數(shù)不相同,若要解決這個問題,則需進(jìn)一步作兩兩比較。 方法較多,常用具體方法、公式見書如只有兩個樣本,一般用t檢驗,但用方差分析,與t檢驗作用是完全一樣的。且樣本多于兩個,不可兩兩之間用t檢驗代替方差分析,這樣會使犯第一類錯誤的概率增大,即可能把本來無差別的總體均數(shù)誤認(rèn)為有差別Ft 相對數(shù)及其應(yīng)用相對數(shù)及其應(yīng)用 率 表示某種現(xiàn)象發(fā)生的頻率和強(qiáng)度構(gòu)成比表示事物內(nèi)部各個組成部分所占整體的比重 比例基數(shù)有可能數(shù)某事物或現(xiàn)象發(fā)生的所際數(shù)某事物或現(xiàn)象發(fā)生的實率%100個體數(shù)之和某事物內(nèi)部的整體數(shù)量個體數(shù)數(shù)量某事物內(nèi)部某一部分的構(gòu)成比相對數(shù)使用應(yīng)注意的問題 不要把構(gòu)成比與率相混淆 使用

10、相對數(shù)時,分母不宜過小要注意資料的可比性 要注意使用率的標(biāo)準(zhǔn)化 比較兩個樣本率或構(gòu)成比時,應(yīng)考慮存在抽樣誤差,對于樣本之間的差異應(yīng)作統(tǒng)計學(xué)檢驗 標(biāo)準(zhǔn)化法當(dāng)兩組資料進(jìn)行比較時,如果其內(nèi)部不同小組率有明顯差別而且個小組的內(nèi)部構(gòu)成也明顯不同,直接比較兩個總率是不合理的。標(biāo)準(zhǔn)化率計算的關(guān)鍵是選擇統(tǒng)一的標(biāo)準(zhǔn)構(gòu)成標(biāo)準(zhǔn)構(gòu)成的選擇方法有三種:1。在比較的兩組資料中任選一組資料的內(nèi)部構(gòu)成作為標(biāo)準(zhǔn)構(gòu)成;2。兩組資料各部分之和組成的構(gòu)成作為標(biāo)準(zhǔn)構(gòu)成;3。選擇有代表性的、較穩(wěn)定的、數(shù)量較大的人群,例如世界的、全國的、全省的、本地區(qū)的或本單位歷年累計的數(shù)據(jù),從中得到標(biāo)準(zhǔn)構(gòu)成。計數(shù)資料的統(tǒng)計推斷率(或構(gòu)成比)的抽樣誤差l

11、標(biāo)準(zhǔn)誤np)1 (nPPSp)1 ( 率的標(biāo)準(zhǔn)誤和可信區(qū)間總體率的可信區(qū)間(當(dāng)n足夠大,且p和1-p均不太小,p的分布接近正態(tài)分布,可用正態(tài)分布處理區(qū)間估計和假設(shè)檢驗nppSp)1 ( ),(2/2/ppSupSup2 2檢驗檢驗 基本公式為自由度為 (行-1)*(列-1)RCRCRCTTA22)(2 2檢驗的用途檢驗的用途推斷兩個總體的率及多個總體的率或總體構(gòu)成比之間有無差別兩個屬性或兩個變量間有無關(guān)聯(lián)性頻數(shù)分布的擬合優(yōu)度檢驗兩個率比較時,如果其資料既符合u檢驗的條件,又符合 檢驗的條件,可任選一種進(jìn)行檢驗,檢驗結(jié)果是相同的。22 2檢驗注意事項檢驗注意事項分析四格表資料時,應(yīng)注意連續(xù)性校正

12、問題 當(dāng)1=T=40時,用連續(xù)性校正 T1或n40時,用Fisher精確概率法對于行乘列表 理論數(shù)不能太小,T5的格子數(shù)不能超過全部格子的五分之一 注意是否有有序變量存在,如有,需用別的方法檢驗配對計數(shù)資料的 檢驗同一研究對象用不同方法進(jìn)行實驗或調(diào)查,然后觀察陽性和陰性的個數(shù)如28份咽喉涂抹標(biāo)本把每份標(biāo)本分別接種在甲、乙兩種白喉桿菌培養(yǎng)基上,觀察在兩種培養(yǎng)基上生長情況,結(jié)果如下,甲、乙兩種培養(yǎng)基中都呈陽性的11份,都呈陰性的7份,甲培養(yǎng)基中陽性而在乙培養(yǎng)基中陰性的3分,乙培養(yǎng)基中陽性而在甲培養(yǎng)基中陰性的7分。這就是配對計數(shù)資料。在兩個培養(yǎng)基中性質(zhì)效果不同的合計數(shù)低于或等于40時,要進(jìn)行校正2秩

13、和檢驗秩和檢驗 通常適用于下述資料: 總體分布為偏態(tài)或分布形式未知的計量資料(尤其在30的情況下)。 等級資料。 個別數(shù)據(jù)偏大或數(shù)據(jù)的某一端無確定的數(shù)值。如“150mg”等,只有一個下限或上限,而沒有具體數(shù)值。 各組離散程度相差懸殊,即各總體方差不齊。配對資料的秩和檢驗成組資料的秩和檢驗多組資料的秩和檢驗l完全隨機(jī)化設(shè)計資料l配伍組設(shè)計資料非參數(shù)檢驗方法的優(yōu)點是適應(yīng)性強(qiáng),但此時由于損失了部分信息,檢驗效率降低了。即在資料服從正態(tài)分布的前提下,當(dāng)H0不真時,非參數(shù)檢驗方法不如參數(shù)檢驗方法能靈敏地拒絕H0,換句話說犯第二類錯誤的可能性大于參數(shù)檢驗法。因此,對于適合參數(shù)檢驗的資料,最好還是用參數(shù)檢驗

14、。線性相關(guān)與回歸 線性相關(guān)要求該兩個變量都是正態(tài)分布資料。線性相關(guān)可用統(tǒng)計量相關(guān)系數(shù)來定量地描述。 相關(guān)系數(shù)表明了二變量之間的伴隨關(guān)系線性回歸要求變量 Y 服從正態(tài)分布回歸方程式說明了兩變量之間依存變化的數(shù)量關(guān)系注:作直線相關(guān)與回歸問題前先要做散點圖,有直線趨勢才可繼續(xù)作。作直線相關(guān)與回歸問題后應(yīng)對相關(guān)系數(shù)或回歸系數(shù)做假設(shè)檢驗。同一資料,相關(guān)系數(shù)和回歸系數(shù)的檢驗結(jié)果是相同的,可用較為簡便的相關(guān)系數(shù)的檢驗代替對回歸系數(shù)進(jìn)行的檢驗相關(guān)分析和回歸訪成績適用于樣本的原始數(shù)據(jù)范圍之內(nèi),出了這個范圍,不能得出兩變量的相關(guān)關(guān)系和原來的回歸關(guān)系例題是非題研究人員測量了100例患者外周血的紅細(xì)胞數(shù),所得資料為計

15、數(shù)資料錯。外周血的紅細(xì)胞數(shù)是對血液中紅細(xì)胞含量的測量值,測量單位是(109/L),屬計量資料進(jìn)行兩均數(shù)差別的假設(shè)檢驗時,當(dāng)P0.05時,則接受H0,認(rèn)為兩總體均數(shù)無差別。錯。當(dāng)P0.05時,我們對兩均數(shù)總體無差別這一結(jié)論無任何概率保證,因此不能貿(mào)然下無差別的結(jié)論。正確的說法是,按所取的檢驗水準(zhǔn),拒絕H0(接受H1)的統(tǒng)計證據(jù)不足。通常單側(cè)檢驗比雙側(cè)檢驗更為靈敏,更易檢驗出差別,以此宜廣泛采用。錯。單側(cè)檢驗的使用應(yīng)以專業(yè)知識為依據(jù),它充分利用了另一側(cè)的不可能性,故檢出率高,但應(yīng)慎用。四個樣本率作比較,2)3(05. 02可認(rèn)為各總體率均不相等錯。應(yīng)為均不相等或不全相等選擇題對兩樣本作均數(shù)比較時,

16、已知兩樣本例數(shù)均小于30,總體方差不齊,且呈偏態(tài)分布,宜用( )。A. t 檢驗B. u 檢驗C. 秩和檢驗D. F 檢驗C在方差分析中,對3個未知總體均數(shù)的關(guān)系不了解, =0.05水平上3組均數(shù)的比較,( )。A. 可以兩兩作 t 檢驗,犯第一類錯誤的概率等于B. 可以兩兩作 t 檢驗,只要計算正確不會出現(xiàn) 的矛盾結(jié)論C. 不可兩兩作t 檢驗,因為這種做法犯第一類錯誤的概率將超過D. 不可兩兩作t 檢驗,因為這種做法犯第二類錯誤的概率將增大323121,C以下檢驗方法中,不屬于非參數(shù)檢驗法的是( )。A. t 檢驗B. 符號檢驗C. Kruskal-Wallis檢驗D. Wilcoxon檢驗A完全隨即設(shè)計資料的方差分析中,必然有( )。A. SS組內(nèi)SS組間B. MS組間50,大樣本,故可認(rèn)為近似正態(tài)分布90/2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論