醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第三版復(fù)習(xí)總結(jié)

上傳人：3*** IP屬地：湖北上傳時間：2021-10-29 格式：DOC 頁數(shù)：26 大?。?31KB 積分：30 舉報(bào) 版權(quán)申訴

醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第三版復(fù)習(xí)總結(jié)_第2頁

醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第三版復(fù)習(xí)總結(jié)_第3頁

醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第三版復(fù)習(xí)總結(jié)_第4頁

醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第三版復(fù)習(xí)總結(jié)_第5頁

已閱讀5頁，還剩21頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一章緒論統(tǒng)計(jì)的三大特征：實(shí)用性、豐富性、公平性總體（population）：l 是根據(jù)研究目的確定的、同質(zhì)的全部研究對象中所有觀察單位某種變量值的集合。l 同質(zhì)基礎(chǔ)：時間、空間、條件等l （1）有限總體(finite population)：有限觀察單位l （2）無限總體(infinite population)：很多為無限總體。樣本l 根據(jù)隨機(jī)化原則從總體中抽取的一定數(shù)量（sample size)的個體，稱為樣本（sample），用樣本信息來推斷總體特征。l 從總體中抽取部分個體的過程稱為抽樣（sampling)。同質(zhì)（homogeneity）l 是指影響被研究指標(biāo)的非實(shí)驗(yàn)因素相同。變異

2、（variation, variablility ）l 同質(zhì)基礎(chǔ)上的各觀察單位（亦稱為個體）之間的差異為變異。如同性別、同年齡、同民族、同地區(qū)兒童的身高有高有低，稱為身高的變異。參數(shù)（parameter)和統(tǒng)計(jì)量（statistic)l 總體的統(tǒng)計(jì)指標(biāo)稱為參數(shù)。如：總體均數(shù)（µ)，總體發(fā)病率，總體死亡率，等，l 樣本的統(tǒng)計(jì)指標(biāo)稱為統(tǒng)計(jì)量如：樣本均數(shù)(x)，樣本發(fā)病率，樣本死亡率，等，l 統(tǒng)計(jì)學(xué)上用不同的符號表示。誤差（error）觀察值與實(shí)際值的差異，成為誤差。分為：過失誤差；系統(tǒng)誤差；隨機(jī)測量誤差；隨機(jī)抽樣誤差；（1）過失誤差(mistaken error)：過失所致的誤差（不認(rèn)

3、真，錯誤判斷，記錄等原因）；（2）系統(tǒng)誤差（systematic error)：儀器未校準(zhǔn)所致的誤差（統(tǒng)一偏高，或偏低）；這兩類誤差可以避免。（3）隨機(jī)測量誤差（random measurement error):不同觀察者或同一觀察者多次觀察值的不相同。這種誤差不可避免。（4）抽樣誤差（sampling error):總體中存在個體變異，抽樣研究中所抽取的樣本，只包含總體中一部分個體，因而樣本均數(shù)（或率）往往不等于總體均數(shù)（或率），表現(xiàn)為多次抽樣的樣本均數(shù)或率不同。這種由抽樣引起的差異稱為抽樣誤差。抽樣誤差愈小，用樣本推斷總體的精確度愈高；反之，其精確度愈低。由于生物的個體變異是客觀存在的

4、，因而抽樣誤差是不可避免的，但抽樣誤差有一定的規(guī)律性。小概率事件定理：“小概率事件一次抽樣不可能發(fā)生” 變量及變量值l 變量（variable):觀察對象的特征或指標(biāo)。對變量進(jìn)行取值所采用的工具或標(biāo)準(zhǔn)成為測量尺度（scale)。l 測量的結(jié)果稱為變量值(value of variable) 或觀察值（observed value, measurements)。隨機(jī)化（randomization)使總體中的每個個體有均等的機(jī)會成為樣本觀察單位的過程，稱為隨機(jī)化。l 隨機(jī)抽樣旨在避免人的主觀性，讓機(jī)遇起作用，以反映總體的客觀情況。常用：抽簽法，隨機(jī)數(shù)目表法，計(jì)算器隨機(jī)數(shù)法；單純隨機(jī)抽樣(simpl

5、e random sampling):總體全部觀察單位編號，再用隨機(jī)數(shù)字法或抽簽法；整群抽樣cluster sampling:直接由若干個群組成的總體中隨機(jī)抽取若干個群，再對被抽取的每個群的全部觀察單位加以調(diào)查。系統(tǒng)抽樣systematic sampling:( 間隔抽樣,機(jī)械抽樣)先將總體觀察單位按某順序號分成n個部分，再從第一部分抽第k號觀察單位，依次用此相等間隔機(jī)械地從每一部分各抽一個觀察單位組成樣本。分層抽樣stratified sampling:先按某種特征將總體分為若干組別、類型、區(qū)域，再從每一層內(nèi)隨機(jī)抽樣，組成樣本。l 抽樣誤差：分層抽樣<系統(tǒng)抽樣<單純隨機(jī)抽樣<

6、;整群抽樣第二章統(tǒng)計(jì)資料的收集和整理一、資料的類型根據(jù)是否定量劃分：（1）計(jì)量資料（measurement data)用定量方法測量每個觀察單位的某項(xiàng)指標(biāo)，所得的數(shù)值資料為計(jì)量資料，亦稱數(shù)值變量資料。一般有度量衡單位。常用：平均數(shù)，標(biāo)準(zhǔn)差，t檢驗(yàn)，方差分析，相關(guān)與回歸等分析。（2）計(jì)數(shù)資料(enumeration data)將觀察單位按某種屬性或類別分組，然后清點(diǎn)各組的觀察單位數(shù)，為計(jì)數(shù)資料（亦稱分類變量資料，無序分類資料）。常用：率、構(gòu)成比、卡方檢驗(yàn)等（3）等級資料（ranked data) 將觀察單位按某種屬性的不同程度分組，所得各組的觀察單位數(shù)為等級資料，亦稱有序分類資料。常用：

7、率、構(gòu)成比、秩和檢驗(yàn)等。三者聯(lián)系：等級資料與計(jì)數(shù)資料不同：屬性的分組有程度差別，各組大小順序排列；等級資料與計(jì)量資料不同：每個觀察單位未確切定量，稱為半定量資料。介于計(jì)量資料與計(jì)數(shù)資料之間。計(jì)量資料計(jì)數(shù)資料等級資料調(diào)查設(shè)計(jì)和實(shí)驗(yàn)設(shè)計(jì)調(diào)查設(shè)計(jì)一般包括專業(yè)設(shè)計(jì)和統(tǒng)計(jì)設(shè)計(jì)。實(shí)驗(yàn)設(shè)計(jì)(experiment design) 醫(yī)學(xué)實(shí)驗(yàn)的基本要素包括處理因素、受試對象和實(shí)驗(yàn)效應(yīng)三部分。實(shí)驗(yàn)設(shè)計(jì)應(yīng)遵循對照（空白對照，試驗(yàn)對照，安慰劑對照，配對對照，組間對照）、隨機(jī)、重復(fù)（即樣本例數(shù)）的原則。頻數(shù)分布表（frequency distribution table)l 用途：（1）揭示頻數(shù)的分布特征：兩個重要

8、特征：l 集中趨勢（central tendency):數(shù)值高低不等，但中等水平的人數(shù)最多。l 離散趨勢（tendency of dispersion):數(shù)值之間參差不齊；逐漸變大（或變?。┑娜藬?shù)漸少。向兩端分散。第三章計(jì)量資料的統(tǒng)計(jì)描述集中趨勢central tendency平均數(shù)（average)：用于描述數(shù)值變量資料的集中趨勢（平均水平）。特點(diǎn)：簡明概括，便于比較。包括：算術(shù)平均數(shù)，幾何平均數(shù)，中位數(shù)，百分位數(shù)1、算術(shù)平均數(shù)（arithmetic mean)一組變量值之和除以變量值個數(shù)所得的商,簡稱均數(shù)?？傮w均數(shù)µ，樣本均數(shù)x表示。適用條件：資料成正態(tài)分布（或近似正態(tài)，或?qū)ΨQ

9、分布）。計(jì)算方法：直接法，加權(quán)法均數(shù)的兩個重要屬性：（1）各離均差（各觀察值與均數(shù)之差）的總和等于零。（2）離均差的平方和小于各個觀察值X與任何數(shù)a(a 不等于均數(shù))之差的平方和。均數(shù)是一組觀察值理想的代表值。均數(shù)的應(yīng)用：（1）只能在合理分布的基礎(chǔ)上，對同質(zhì)事物求均數(shù)才有意義，才能反映事物的特性。（2）均數(shù)最適用于對稱分布，尤其是正態(tài)分布資料。此時，均數(shù)位于分布的中央，能反映觀察值的集中趨勢。2、幾何均數(shù)geometric mean G將n個觀察值的乘積再開n次方的方根（或各觀察值對數(shù)值均值的反對數(shù)）。適用條件：（1）觀察值為非對稱分布，差距較大，用算術(shù)均數(shù)表示其平均水平會受少數(shù)特大或特小值

10、影響；（2）數(shù)值按大小順序排列后，各觀察值呈倍數(shù)關(guān)系或近似倍數(shù)關(guān)系。如：抗體滴度，藥物效價等；（3）觀察值不能有0；（4）觀察值不能同時有正值和負(fù)值。幾何均數(shù)的應(yīng)用：（1）常用于等比級數(shù)資料，滴度，效價，衛(wèi)生事業(yè)平均發(fā)展速度，人口幾何增長，對數(shù)正態(tài)分布資料；（2）同一組資料求得的幾何均數(shù)小于算術(shù)均數(shù)。3、中位數(shù)（median, M) ：位于中間位置上的數(shù)值。把一組觀察值，按大小順序排列，位置居中的變量值（奇數(shù)個）或位置居中的兩個變量值的均值（偶數(shù)個）。是位置指標(biāo)，以中位數(shù)為界，將觀察值分為兩半，有一半比它大，一般比它小。適用于：（1）資料偏態(tài)分布；（2）兩端無確定數(shù)值；（3）資料分布不清楚；如

11、：潛伏期，毒物測定值等用中位數(shù)表示其集中趨勢。5、百分位數(shù)(percentile, P)：位于某個百分位置上的數(shù)值。把一組數(shù)據(jù)從小到大排列，分成100等份，各等份含1%的觀察值，處在分割界線上的數(shù)值，就是百分位數(shù)，Pr 表示。百分位數(shù)將總體或樣本的全部觀察值分為兩部分，理論上有r%的觀察值比它小，有（100-r）%的觀察值比它大。如含量為n的樣本，P5即表示：理論上有n5%個觀察值比P5小，有n95%個觀察值比P5大。一般說，分布中部的百分位數(shù)相當(dāng)穩(wěn)定，具有較好代表性，靠近兩端的百分位數(shù)，只在樣本含量足夠大時，才穩(wěn)定，故，樣本量不夠大時，不應(yīng)取太近兩端的百分位數(shù)。常用的百分位數(shù)：5，25，75

12、，95 分位數(shù)。百分位數(shù)常用于確定醫(yī)學(xué)正常值范圍（normal range)。中位數(shù)是特定的百分位數(shù)。四者的比較：中位數(shù)常用于描述偏態(tài)分布資料的集中趨勢，它反映居中位置的變量值的大小。不受特大，特小值的影響，只受位置居中的觀察值的影響，因而不夠敏感。而均數(shù)，幾何均數(shù)是由全部觀察值綜合計(jì)算出的，敏感性好。但理論上，中位數(shù)等于算術(shù)均數(shù)。百分位數(shù)常用于描述一組資料在某百分位置上的水平和分布特征。多個百分位數(shù)結(jié)合使用，可更全面地描述總體或樣本的分布特征，包括位置大小和變異度。離散趨勢tendency of dispersion常用指標(biāo)：全距，四分位數(shù)間距，方差，標(biāo)準(zhǔn)差，變異系數(shù)1、全距（Range)：

13、極大與極小值之差。全距大，資料離散程度大，但易受極端值大小的影響。樣本量越大，抽到極端值的可能性越大，全距可能會越大。故：全距不宜單獨(dú)使用。2、四分位數(shù)間距（quartile interval Q)：將一組資料分為四等份，上四分位數(shù)P75和下四分位數(shù)P25之差，叫四分位數(shù)間距。意義：Q越大，離散程度越大，通常用于描述偏態(tài)分布資料的離散程度。優(yōu)點(diǎn)：比全距穩(wěn)定；若資料一端或兩端無確切數(shù)值，只能選擇Q作為離散指標(biāo)。缺點(diǎn)：未考慮全部觀察值，不能全面反映資料離散趨勢。3、方差（variance)和標(biāo)準(zhǔn)差(standard deviation SD)對總體而言，為了克服極差和四分位數(shù)間距的缺點(diǎn)，要描述資料

14、的離散趨勢，必須考慮到各個觀察值，離均差的平方和是最好的指標(biāo)，意義：方差，標(biāo)準(zhǔn)差越大，變異程度越大。其值越小，觀察值的離散度越小，用均數(shù)反映平均水平的代表性越好。標(biāo)準(zhǔn)差應(yīng)用：（1）反映一組觀察值的離散程度：數(shù)值單位相同：直接比較標(biāo)準(zhǔn)差; 數(shù)值單位不同：計(jì)算變異系數(shù);變異系數(shù)（coefficient of variation, CV) 也稱離散系數(shù)（coefficient of dispersion)標(biāo)準(zhǔn)差與均數(shù)之比用百分?jǐn)?shù)表示。公式：常用于比較度量單位不同或均數(shù)相差懸殊的資料的變異。同時考慮了均數(shù)和標(biāo)準(zhǔn)差，更客觀。比如：身高，體重的變異比較（2）估計(jì)變量值的頻數(shù)分布：（3）計(jì)算標(biāo)準(zhǔn)誤（4）估

15、計(jì)醫(yī)學(xué)正常值范圍：雙側(cè)：均數(shù)± 1.96倍標(biāo)準(zhǔn)差（95%）單側(cè)：均數(shù)± 1.645倍標(biāo)準(zhǔn)差（95%）正態(tài)分布(normal distribution)概念：頻數(shù)分布以均數(shù)為中心，左右兩側(cè)基本對稱，靠近均數(shù)兩側(cè)頻數(shù)較多，離均數(shù)愈遠(yuǎn)，頻數(shù)愈少，形成一個中間多，兩側(cè)逐漸減少的對稱分布。是一種連續(xù)型分布。又稱高斯分布. 正態(tài)分布用N(µ ,)表示，其位置與均數(shù)有關(guān)，形狀與標(biāo)準(zhǔn)差有關(guān)。標(biāo)準(zhǔn)正態(tài)分布:為了應(yīng)用方便，常將式進(jìn)行變量變換，即：u變換. 所得到的新變量u的分布即為標(biāo)準(zhǔn)正態(tài)分布。u的含義：變量到均數(shù)間的距離相當(dāng)于標(biāo)準(zhǔn)差的倍數(shù)。u變換后，=0，=1，使原來的正態(tài)分布變

16、換為標(biāo)準(zhǔn)正態(tài)分布（standard normal distribution）亦稱u分布。正態(tài)分布的特征和分布規(guī)律：簡答（1）曲線在x軸的上方，與x軸不相交，當(dāng)x=時，曲線位于最高點(diǎn)。 f(u=0)=0.3989（2）曲線關(guān)于直線x=左右對稱。（3）正態(tài)分布有兩個參數(shù):均數(shù),標(biāo)準(zhǔn)差;標(biāo)準(zhǔn)正態(tài)的參數(shù)分別為:0, 1。（4）正態(tài)分布的面積分布有一定規(guī)律。正態(tài)曲線下面積的分布規(guī)律正態(tài)曲線下，橫軸上一定區(qū)間的面積,等于該區(qū)間的頻數(shù)發(fā)生的概率（即所有隨機(jī)事件發(fā)生的概率）。正態(tài)曲線下面積的分布規(guī)律的應(yīng)用：一、確定醫(yī)學(xué)參考值范圍意義:是正常人指標(biāo)測定值的波動范圍，可用于劃分正常，或異常。步驟：1、抽樣 2、

17、控制測量誤差 3、取單側(cè)或雙側(cè) 4、選定合適的百分界限 5、資料正態(tài)性檢驗(yàn) 6、進(jìn)行參考值估計(jì)補(bǔ)充：常用方法：正態(tài)分布法（正態(tài)分布），對數(shù)正態(tài)分布法（對數(shù)正態(tài)分布或近似正態(tài)分布），百分位數(shù)法（偏態(tài)分布）二、確定概率分布三、質(zhì)量控制第四章均數(shù)的抽樣誤差和 t分布一、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差sampling error of mean由于總體中存在個體變異，抽樣研究中所抽取的樣本，只包含總體中一部分個體，因而樣本均數(shù)（或率）往往不等于總體均數(shù)（或率），樣本均數(shù)之間也互不相等，這種由抽樣引起的差異稱為均數(shù)的抽樣誤差。用樣本均數(shù)的標(biāo)準(zhǔn)差來估計(jì)，稱標(biāo)準(zhǔn)誤（standard error)。即

18、總體標(biāo)準(zhǔn)差和樣本例數(shù)的比值，通常以樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計(jì)值標(biāo)準(zhǔn)誤越大，均數(shù)的抽樣誤差越大，樣本均數(shù)與總體均數(shù)間的差異越大。S區(qū)別簡答是方差的平方根。說明一組數(shù)據(jù)在其周圍的分散情況（變異程度）。反映對這組數(shù)值的代表性。是均數(shù)的標(biāo)準(zhǔn)差。說明一組均數(shù)在“均數(shù)的均數(shù)”(總體均數(shù))周圍的分散情況。反映用樣本均數(shù)代表總體均數(shù)的可靠性。表示抽樣誤差的大小。標(biāo)準(zhǔn)誤的應(yīng)用1、用來衡量抽樣誤差的大小: 標(biāo)準(zhǔn)誤越小，樣本均數(shù)與總體均數(shù)越接近，樣本均數(shù)的可信度越高；2、結(jié)合標(biāo)準(zhǔn)正態(tài)分布與 t 分布曲線下的面積規(guī)律，估計(jì)總體均數(shù)的置信區(qū)間。3、用于假設(shè)檢驗(yàn)。二、t 分布（t-distribution) 標(biāo)準(zhǔn)化

19、的均數(shù)的分布t分布曲線特征簡答： t分布是一簇對稱于0的單峰分布曲線。自由度越?。ㄏ喈?dāng)于標(biāo)準(zhǔn)差大），曲線的中間越低，兩邊越高；隨自由度增大， t分布曲線逐漸逼近于標(biāo)準(zhǔn)正態(tài)分布曲線。當(dāng)自由度無窮大時， t分布就是標(biāo)準(zhǔn)正態(tài)分布曲線。每一條t分布曲線，都對應(yīng)于相應(yīng)的自由度。t分布曲線下的面積規(guī)律：與標(biāo)準(zhǔn)正態(tài)曲線下的面積規(guī)律相似：在某一個自由度下，兩側(cè)外部總面積為5%的界限的t值稱為t0.05/2(),把兩側(cè)外部總面積為1%的界限的t值稱為t0.01/2()。因此，中部占95%面積的t值范圍：t0.05/2()- t0.05/2(),中部占99%面積的t值范圍：t0.01/2()- t0.0

20、1/2()。使用t值表注意：同一自由度下, P越小，t值越大；P值相同時，自由度越大，t越??；當(dāng)自由度無窮大時，t值與u值相等。這也是u分布與t分布的區(qū)別。t分布的主要應(yīng)用：總體均數(shù)置信區(qū)間估計(jì)； t檢驗(yàn)；三、總體均數(shù)置信區(qū)間的估計(jì) 統(tǒng)計(jì)推斷：參數(shù)估計(jì)，假設(shè)檢驗(yàn) 參數(shù)估計(jì)：點(diǎn)估計(jì)（point estimation):用樣本統(tǒng)計(jì)量作為對總體參數(shù)的估計(jì)值() 。比如均數(shù)的估計(jì)。區(qū)間估計(jì)(interval estimation)：根據(jù)選定的置信度估計(jì)總體均數(shù)所在的區(qū)間（a< <b) . a, b 為置信限（可信限）。置信度（confidence level): 在估計(jì)總體均數(shù)的置

21、信區(qū)間時，如果可能估計(jì)錯誤的概率為，那么估計(jì)正確的概率為1- , 即為置信度. 常用: 95%, 99%.置信區(qū)間（confidence interval, CI) 根據(jù)置信度估計(jì)得到的區(qū)間，稱為置信區(qū)間。區(qū)間兩端的界限值即置信限置信區(qū)間估計(jì)方法： 1、總體標(biāo)準(zhǔn)差已知參照u分布 2、總體標(biāo)準(zhǔn)差未知，樣本例數(shù)(>50)足夠大，也可參考u分布進(jìn)行 3、總體標(biāo)準(zhǔn)差未知，樣本例數(shù)較小，按t分布原理，依據(jù)自由度，查出某個概率相應(yīng)的t界值95%置信區(qū)間的意義：理論上，用一次抽樣所得的樣本均數(shù)估計(jì)總體均數(shù)，犯錯誤的概率為5%. 或進(jìn)行100次抽樣，可算得100個置信區(qū)間，平均有95個置信區(qū)間包括客

22、觀存在的總體均數(shù)，只有5個置信區(qū)間未包括總體均數(shù)。置信區(qū)間與正常值范圍：簡答95%正常值范圍一般是指同質(zhì)總體內(nèi)包括95%個體值的估計(jì)范圍，若總體為正態(tài)分布95%置信區(qū)間是指按照95%置信度估計(jì)的總體參數(shù)的可能范圍，常按照下式計(jì)算。前者用標(biāo)準(zhǔn)差，后者用標(biāo)準(zhǔn)誤。第五章假設(shè)檢驗(yàn)，u， t-檢驗(yàn)假設(shè)檢驗(yàn)基本思想：先對總體的參數(shù)或分布作出某種假設(shè)，如假設(shè)總體均數(shù)（或總體率）為一定值，兩總體均數(shù)（或總體率）相等，總體服從正態(tài)分布或兩總體分布相同等。然后，用適當(dāng)方法根據(jù)樣本對總體提供的信息，推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕。其結(jié)果將有助于研究者作出決策，采取措施假設(shè)檢驗(yàn)步驟：簡答1、建立檢驗(yàn)假設(shè)和設(shè)定檢驗(yàn)

23、水準(zhǔn)無效假設(shè)（null hypothesis) H0：假設(shè)差異僅由抽樣誤差所致，而兩個總體參數(shù)相同。是從反證法的思想提出的。備擇假設(shè)（alternative hypothesis), H1：即差別不僅是由抽樣誤差所致，而且總體參數(shù)不同。H1是和H0相聯(lián)系的，對立的假設(shè)。確定檢驗(yàn)水準(zhǔn)（size of a test) 也叫顯著性水準(zhǔn)（significance level）：用表示。即：拒絕了實(shí)際上成立的H0的概率；一般取0.05，或0.01. 2、計(jì)算統(tǒng)計(jì)量根據(jù)研究設(shè)計(jì)類型，資料特征，統(tǒng)計(jì)方法的適用條件，選擇和計(jì)算統(tǒng)計(jì)量。3、確定概率P值，作出統(tǒng)計(jì)推斷結(jié)論計(jì)算統(tǒng)計(jì)量后，判斷在H0成立條件下，出現(xiàn)

24、該統(tǒng)計(jì)量或更大統(tǒng)計(jì)量的概率。如果P大于，是接受H0的區(qū)間；如果大于或等于界值的范圍，P小于或等于，是拒絕H0的區(qū)間。雙側(cè)，單側(cè)檢驗(yàn)：比較及選擇原則，單選或簡答根據(jù)專業(yè)知識，可能大于，也可能小于 0，稱雙側(cè)檢驗(yàn)；若認(rèn)為大于、等于不可能小于 0（或相反），為單側(cè)檢驗(yàn)。若不能確定單側(cè)的情況，應(yīng)采用雙側(cè)檢驗(yàn)。在同一t值的界限上單側(cè)檢驗(yàn)的概率僅相當(dāng)于雙側(cè)檢驗(yàn)概率的一半。因此，總體均數(shù)間確有差別時，單側(cè)檢驗(yàn)比雙側(cè)檢驗(yàn)更易得出差別有統(tǒng)計(jì)意義的結(jié)論。對同一資料進(jìn)行檢驗(yàn)，有可能雙側(cè)檢驗(yàn)無統(tǒng)計(jì)意義而單側(cè)檢驗(yàn)有統(tǒng)計(jì)意義。但用單側(cè)還是雙側(cè)檢驗(yàn)，必須事先根據(jù)專業(yè)知識予以確定，不能等到計(jì)算完t值以后再主觀選定選擇原

25、則：雙側(cè)檢驗(yàn)永遠(yuǎn)是正確的單側(cè)檢驗(yàn)只有在少數(shù)情況下才是合適的即使要做單側(cè)檢驗(yàn)，也必須事先確定單側(cè)檢驗(yàn)：有某種傾向時使用；雙側(cè)檢驗(yàn)：沒有任何傾向；第一類錯誤與第二類錯誤簡答-比較選擇假陽性錯誤（false positive error），統(tǒng)計(jì)上稱為第一類錯誤（type I error），用表示。即無效假設(shè)（H0:u=u0）是正確的，但被拒絕，誤判為有差別（棄真錯誤）。統(tǒng)計(jì)學(xué)上定P0.05為有意義，即在統(tǒng)計(jì)推斷上允許犯假陽性錯誤的概率為5%。當(dāng)無效假設(shè)正確時，在100次抽樣中，可以有5次推斷是錯誤的。同樣，如果定P0.01為有意義，即犯假陽性錯誤的概率為1%。故統(tǒng)計(jì)學(xué)上有意義的界限實(shí)際

26、上就是允許犯第一類錯誤的界限。假陰性錯誤(false negative error),統(tǒng)計(jì)學(xué)上稱為第二類錯誤(type II error)。即無效假設(shè)（H0:u=u0）不正確，實(shí)際上應(yīng)是H1:uu0,但算得的統(tǒng)計(jì)量t沒有超過t0.05的水平從而接受了無效假設(shè)，錯誤地得出無差別的結(jié)論（取偽錯誤）。用b表示。I類錯誤：雖然無效假設(shè)為真，但由于抽到了較大（檢驗(yàn)統(tǒng)計(jì)量）的樣本，使得P值小于檢驗(yàn)水準(zhǔn)而導(dǎo)致被拒絕。II類錯誤：雖然無效假設(shè)為假，但由于抽到了較?。z驗(yàn)統(tǒng)計(jì)量）的樣本，使得P值大于檢驗(yàn)水準(zhǔn)而導(dǎo)致不被拒絕。第一類錯誤減小，第二類錯誤的概率就增大了。選擇統(tǒng)計(jì)學(xué)意義水平，應(yīng)考慮兩類錯誤對所要研

27、究事物的影響哪一個重要。一般來說，定0.05為有統(tǒng)計(jì)學(xué)意義的水平是比較適宜的。其他條件不變，增大樣本含量可使第二類錯誤的概率減小。同時正確的實(shí)驗(yàn)設(shè)計(jì)能夠減少抽樣誤差，提高檢驗(yàn)效能。P值的正確理解選擇簡答P值是指在無效假設(shè)的前提下，得到觀察到的量（或更極端的量）的概率。P值越小說明無效假設(shè)越不可靠。或者說，P值越小就越有理由推翻無效假設(shè)。至于P值是否屬于“小”，一般根據(jù)事先確定的檢驗(yàn)水準(zhǔn)a來判斷的。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。實(shí)際差別與統(tǒng)計(jì)學(xué)意義簡答統(tǒng)計(jì)學(xué)意義：如果總體均數(shù)相同，抽到這樣大統(tǒng)計(jì)量的可能性很小，可以拒絕 H0。但并不意味兩總體均數(shù)差別很大。樣本量很大時，即使

28、均數(shù)差別不大，統(tǒng)計(jì)學(xué)意義卻顯著。樣本小時，即使均數(shù)差別很大，統(tǒng)計(jì)學(xué)意義卻不顯著。u檢驗(yàn)和t檢驗(yàn)簡答兩者比較：u檢驗(yàn)條件：總體標(biāo)準(zhǔn)差已知，資料服從正態(tài)分布情況下（1）樣本均數(shù)與總體均數(shù)比較（2）兩大樣本均數(shù)的比較；t檢驗(yàn)條件：用于樣本量小、總體標(biāo)準(zhǔn)差未知時（1）樣本與總體均數(shù)比較（2）配對設(shè)計(jì)資料比較（3）兩樣本均數(shù)比較（同時要求兩樣本的總體方差相同，服從正態(tài)分布）配對資料：配對設(shè)計(jì)：兩樣本中的觀察值由于存在某種聯(lián)系而一一對應(yīng)結(jié)成對子（matching)的情況.常用配對方式：簡答 1、同一受試對象處理前后的比較：高血壓治療前后的血壓值，或每一名病人有一對數(shù)據(jù)； 2、同一對象身體不同部位測定值

29、比較：如左右臂皮膚的敏感試驗(yàn)，測得紅斑直徑； 3、同一樣品兩種不同方法測定結(jié)果：兩種儀器，兩名化驗(yàn)員，兩種條件等； 4、成對設(shè)計(jì)：動物配對后隨機(jī)分到兩組后的測定結(jié)果；第六章方差分析（一）概念，思想，應(yīng)用，變異分解概念：方差分析是檢驗(yàn)兩個或兩個以上樣本均數(shù)間差別無統(tǒng)計(jì)意義的統(tǒng)計(jì)檢驗(yàn)方法。前提條件：各組總體均數(shù)為正態(tài)分布，方差齊。方差分析的基本思想是：將所有測量值間的總變異按照其變異的來源分解為多個部份，然后進(jìn)行比較，評價由某種因素所引起的變異是否具有統(tǒng)計(jì)學(xué)意義。方差分析主要用于：1、均數(shù)差別的顯著性檢驗(yàn) 2、分離各有關(guān)因素并估計(jì)其對總變異的作用 3、分析因素間的交互作用，4、方差齊性檢驗(yàn)。優(yōu)點(diǎn)

30、：1、不受對比組數(shù)的限制； 2、可同時分析多個因素作用； 3、可分析因素間的相互作用； 4、靈敏度高； 5、結(jié)論較準(zhǔn)確均方：變異程度除與離均差平方和的大小有關(guān)外，還與其自由度有關(guān)，由于各部分自由度不等，因此各部分離均差平方和不能直接比較，須將各部分離均差平方和除以相應(yīng)自由度，其比值稱為均方差，簡稱均方(mean square，MS)。MS組內(nèi)：組內(nèi)均方，l組內(nèi)/n組內(nèi)MS組間：組間均方, l組間/n組間總變異（total variation）：全部測量值Xij與總均數(shù) 間的差異 å（xij-x)2，v=N-1=nk-1組間變異（ between group variation ）：各

31、組的均數(shù)Xi 與總均數(shù)間的差異 å n（xi-x )2, v=k-1組內(nèi)變異（within group variation )：每組的每個測量值Xij與該組均數(shù)的差異å（xij-xi)2, v=k(n-1)F值：FMS組間/MS組內(nèi)F界值：F0.05（n1，n2） F³ F0.05（n1，n2）, p£0.05公式是在H0成立的條件下進(jìn)行的，即MS組間與MS組內(nèi)差別應(yīng)該很小， F值應(yīng)該接近于1。均數(shù)間的相互比較Student-Newman-Keuls（SNK-q 檢驗(yàn)）法:適用于任意兩組間進(jìn)行比較Dunnett-t 檢驗(yàn)：適用于多個實(shí)驗(yàn)組與同一個對照組的

32、比較LSD-t 檢驗(yàn)：稱最小顯著性差異t 檢驗(yàn)，適用于對多組中某一對或幾對在專業(yè)上有特殊意義的均數(shù)進(jìn)行比較。三種方法是一致的，但并非等價，實(shí)際應(yīng)用中應(yīng)根據(jù)設(shè)計(jì)選取，不可多種方法一起使用，然后選取有利的結(jié)果。拉丁設(shè)計(jì)定義：對于兩個以上的標(biāo)志進(jìn)行方差分析，而且各種標(biāo)志的水平數(shù)相同，采用拉丁方設(shè)計(jì)。其優(yōu)點(diǎn)是可以從較少的實(shí)驗(yàn)數(shù)據(jù)，獲取較多的信息。但設(shè)計(jì)要求各因素的水平數(shù)必須相等，在實(shí)際應(yīng)用時有一定局限性。而且，當(dāng)各因素間有交互作用時，該設(shè)計(jì)不合適。拉丁方是以拉丁字母排列的方陣的簡稱。方差齊性檢驗(yàn)多個方差齊性的Bartlett 法此外,Levene 檢驗(yàn)法對原數(shù)據(jù)是否為正態(tài)不靈敏，比較穩(wěn)健,也常常采用

33、。方差分析中的數(shù)據(jù)轉(zhuǎn)換：選擇或簡答（1）平方根轉(zhuǎn)換x´=Ö x 當(dāng)x<10時， x´=Ö x 1 或x´=Ö x 1/2常用于服從普哇松分布的資料（方差隨均數(shù)而變；二項(xiàng)分布中方差隨率變化）（2）平方根反正弦轉(zhuǎn)換二項(xiàng)分布中率的比較， x´=arc sin Ö x （3）對數(shù)轉(zhuǎn)換對于均數(shù)與標(biāo)準(zhǔn)差呈正比關(guān)系的資料x´=lgx 或 x´=lg（x1）（x>0)方差分析（二）概念及方差分析表當(dāng)實(shí)驗(yàn)的處理是由兩個或兩個以上的因素，每個因素至少有兩個水平的全面組合時，稱之為析因?qū)嶒?yàn)。一、2

34、´2析因?qū)嶒?yàn)（factorial experiment)設(shè)計(jì)兩個因素，每個因素有兩個水平的實(shí)驗(yàn)設(shè)計(jì)。單獨(dú)效應(yīng)：是指其它因素的水平固定時，同一因素不同水平間的差別。主效應(yīng)：指某一因素各水平間的平均差別。交互效應(yīng)：某因素的各個單獨(dú)效應(yīng)隨另一因素水平的變化而變化，且相互間的差別超出隨機(jī)波動的范圍時，稱者兩個因素間存在交互作用或效應(yīng)。如果AB兩因素的聯(lián)合效應(yīng)不等于A與B的單獨(dú)效應(yīng)之和，則A,B存在交互效應(yīng)，若大于則有協(xié)同作用，若小于則為拮抗作用。二、2×2×2析因設(shè)計(jì) 是指有三個因素，每個因素有兩個水平的實(shí)驗(yàn)設(shè)計(jì)。第七章直線回歸與相關(guān)(1) 依存關(guān)系：應(yīng)變量(depen

35、dent variable)Y隨自變量(independent variable)X變化而變化。回歸分析(2) 互依關(guān)系: 應(yīng)變量Y與自變量 X間的彼此關(guān)系相關(guān)分析第一節(jié) 直線回歸（ linear regression 線性回歸)1直線回歸的概念：直線回歸是分析兩變量間線性依存變化的數(shù)量關(guān)系。2. 函數(shù)關(guān)系與回歸關(guān)系：前者是確定關(guān)系，后者是不確定關(guān)系直線回歸的任務(wù)：就是找出一條最能描述變量間非確定性數(shù)量關(guān)系的一條直線，此直線為回歸直線，相應(yīng)的直線方程稱為直線回歸方程( linear regression equation)。對資料的要求：自變量 x ：正態(tài)總體中的隨機(jī)變量或指定變量因變

36、量 y ：服從正態(tài)分布的隨機(jī)變量標(biāo)準(zhǔn)估計(jì)誤差各實(shí)際值Y與估計(jì)值有一定的誤差，稱為估計(jì)誤差。各實(shí)際點(diǎn)與回歸線縱軸方向的離散程度，可以用類似求標(biāo)準(zhǔn)差的式子進(jìn)行計(jì)算，即標(biāo)準(zhǔn)估計(jì)誤差a b的意義：考a 為回歸直線在 y 軸上的截距，即與Y軸交點(diǎn)的縱坐標(biāo)(X0)。b 為回歸系數(shù)，即回歸直線的斜率；其統(tǒng)計(jì)學(xué)意義是 x 增加（減）一個單位，y 平均變動 b 個單位b>0，Y隨X的增大而增大（減少而減少）斜上； b<0，Y隨X的增大而減?。p少而增加）斜下； b=0，Y與X無直線關(guān)系水平。 b越大，表示Y隨X變化越快，直線越陡峭。3直線回歸方程參數(shù)的計(jì)算最小二乘法原則 (least

37、square method)：使各實(shí)際散點(diǎn)（Y）到直線（）的縱向距離的平方和最小。即使（殘差或剩余值）最小殘差(residual)或剩余值，即實(shí)測值Y與假定回歸線上的估計(jì)值的縱向距離回歸系數(shù)的檢驗(yàn)方法：方差分析法各種變異分解-重點(diǎn) SS總，的離均差平方和(total sum of squares)，未考慮與的回歸關(guān)系時的總變異。 SS剩，為剩余平方和(residual sum of squares)，對的線性影響之外的一切因素對的變異，即總變異中，無法用解釋的部分。SS剩越小，回歸效果越好。 SS回，為回歸平方和(regression sum of squares)，由于與的直線關(guān)系而使變異

38、減小的部分,即總變異中，可以用解釋的部分。SS回越大，回歸效果越好。 t檢驗(yàn)法 S b 為樣本回歸系數(shù)標(biāo)準(zhǔn)誤；S yx 為剩余標(biāo)準(zhǔn)差同一組資料作直線相關(guān)與回歸時 tb 與 tr 等值回歸系數(shù)的標(biāo)準(zhǔn)誤 b為總體回歸系數(shù)b 的估計(jì)值，其誤差為Sb 決定系數(shù)：回歸平方和與總平方和之比，大小反映了回歸貢獻(xiàn)的相對程度，也就是在Y的總變異中回歸關(guān)系所能解釋的百分比?？傮w回歸線的95%置信帶，與個體y值比較即µ (x=xi)的可信區(qū)間方差由Y 及 b (x - x)的方差兩部分構(gòu)成個體Yi 值的范圍預(yù)測與總體回歸線比較直線回歸方程的應(yīng)用描述兩變量的依存數(shù)量關(guān)系利用回歸方程進(jìn)行預(yù)測利用回歸方程進(jìn)行控

39、制第二直線相關(guān) ( linear correlation )簡單相關(guān)(simple correlation)，用于雙變量正態(tài)分布資料。進(jìn)行直線相關(guān)分析的基本任務(wù)在于根據(jù)x、y的實(shí)際觀測值計(jì)算表示兩個相關(guān)變量x與y線性相關(guān)程度和性質(zhì)的統(tǒng)計(jì)指標(biāo)相關(guān)系數(shù)r，并進(jìn)行顯著性檢驗(yàn)。 1直線相關(guān)的概念直線相關(guān)是研究兩變量 x、y 之間協(xié)同變化的線性關(guān)系的分析方法。2對資料的要求 x、y 都是正態(tài)分布資料的隨機(jī)變量。3相關(guān)系數(shù) （correlation coefficient ，r ) * 表示方法： -1 £ r £ 1意義：描述兩個變量直線相關(guān)的方向與密切程度的指標(biāo)。4、直線回歸

40、與直線相關(guān)的聯(lián)系與區(qū)別簡答區(qū)別：1）意義直線回歸反映兩變量的依存關(guān)系；直線相關(guān)反映兩變量的相互關(guān)系。2）對資料的要求直線回歸：自變量是正態(tài)總體的隨機(jī)變量或指定變量，y 一定是正態(tài)總體的隨機(jī)變量；直線相關(guān)：兩變量均為正態(tài)總體的隨機(jī)變量。聯(lián)系：1）同一組資料的 r 與 b 的正負(fù)符號是一致的；2）同一組資料的 r 和 b 的假設(shè)檢驗(yàn)結(jié)果是一致的，即 t r = t b。3）兩變量間有相關(guān)關(guān)系，不一定有因果關(guān)系；但兩變量間有因果關(guān)系，一定有相關(guān)關(guān)系。第三節(jié) Spearman 秩相關(guān)適用資料：不服從雙變量正態(tài)分布總體分布類型未知原始數(shù)據(jù)用等級表示等級相關(guān)系數(shù)r

41、s（即Spearman Correlation Coefficient）反映兩變量間相關(guān)的密切程度與方向第八章相對數(shù)計(jì)數(shù)資料的統(tǒng)計(jì)描述一、常用相對數(shù)（relative number) 1、比（ ratio）又稱對比指標(biāo)或相對比，表示兩個有聯(lián)系的同類指標(biāo)之比，常用倍數(shù)或百分?jǐn)?shù)表示。2、比例(proportion)又稱構(gòu)成指標(biāo)，表示某一事物內(nèi)部各組成部分所占的比重或分布，常用百分?jǐn)?shù)表示。、率（rate）：又稱頻率指標(biāo)，表示某現(xiàn)象發(fā)生的頻率或強(qiáng)度，比例基數(shù)用k表示，據(jù)習(xí)慣定，一般至少保留12為整數(shù)。包括%、1/萬、1/10萬二、醫(yī)學(xué)中常用的相對數(shù)指標(biāo)1、醫(yī)學(xué)人口統(tǒng)計(jì)指標(biāo)（1）人口總數(shù)（2）人口

42、構(gòu)成（3）人口生育自然增長率粗出生率粗死亡率（4）人口死亡粗死亡率（總死亡率） mortality rate2、反映疾病發(fā)生水平的頻率指標(biāo)（疾病統(tǒng)計(jì)指標(biāo)）重點(diǎn)發(fā)病率（ incidence rate)某病發(fā)病率（一定時期某病新發(fā)生的病例數(shù)/同時期內(nèi)可能發(fā)生某病的人口數(shù)）´K（1）時期：指觀察所包括的時間范圍，通常為年或月；（2）新發(fā)生的病例數(shù)：指第一次發(fā)生某種疾病，以第一次就診為準(zhǔn)。（3）可能發(fā)生“某病”：指存在發(fā)生某病的危險性和條件（流行病學(xué)上為暴露人群）?；疾÷?prevalence rate) 指在某時點(diǎn)接受醫(yī)學(xué)檢查時，可能發(fā)生某病的全體受檢人群中被發(fā)現(xiàn)的某病病人現(xiàn)患新、

43、舊病例數(shù)。某病患病率（檢查時發(fā)現(xiàn)的某病現(xiàn)患病例數(shù)/ 該時點(diǎn)受檢人口數(shù)）´K適用于病程較長的疾病的統(tǒng)計(jì)，反映某種疾病在一定人群中流行的規(guī)?；蛩讲∷缆剩╢atality)某病死亡率（觀察期間內(nèi)因某病死亡人數(shù)/同期某病病人總數(shù)）´ K三、應(yīng)用相對數(shù)應(yīng)注意的問題簡答l 1，計(jì)算率和構(gòu)成比的分母不宜過?。悍駝t樣本率不穩(wěn)定，易造成錯覺；l 2，不要將構(gòu)成比作率分析；l 3，求平均率時不能直接將幾個率相加求其合并率或平均率，而應(yīng)以總發(fā)生數(shù)除以總可能發(fā)生例數(shù)。l 4，應(yīng)注意資料的可比性資料是否存在偏性當(dāng)內(nèi)部結(jié)構(gòu)不同的相對數(shù)間進(jìn)行比較時，若比較合計(jì)率，應(yīng)計(jì)算標(biāo)準(zhǔn)化率。率的抽樣誤差與標(biāo)準(zhǔn)誤l

44、率的抽樣誤差：由抽樣造成的樣本率和總體率的差別稱為率的抽樣誤差。率的總體標(biāo)準(zhǔn)誤用sp表示 sp的樣本估計(jì)值為率的樣本標(biāo)準(zhǔn)誤sp 總體率的區(qū)間估計(jì)當(dāng)np³5和n(1-p）³5時，樣本率p近似服從均數(shù)為p、標(biāo)準(zhǔn)誤為sP的正態(tài)分布，當(dāng)總體率未知時， sp用估計(jì)值sp取代總體率的假設(shè)檢驗(yàn)(u檢驗(yàn))l 適用條件：1. 適用于一個樣本率與一個總體率的比較，或兩個樣本率間的比較。而不能用于多個率或構(gòu)成比資料的比較；2. 要求樣本量較大，一般np與n（1-p）均大于5，率的分布近似于正態(tài)分布。率的標(biāo)準(zhǔn)化直接，間接比較，標(biāo)準(zhǔn)選擇1. 標(biāo)準(zhǔn)化法(Standardization)的意義當(dāng)比

45、較兩個總率時,如果兩組內(nèi)部某種能影響指標(biāo)水平的重要特征的構(gòu)成上有差別,往往造成總率的升高或下降,影響兩個總率的對比;因此要設(shè)法消除其內(nèi)部構(gòu)成的差異,使之能合理地進(jìn)行比較,所用的方法稱為標(biāo)準(zhǔn)化法。標(biāo)準(zhǔn)化法即在一個指定的標(biāo)準(zhǔn)構(gòu)成條件下進(jìn)行率的比對的方法。目的：采用統(tǒng)一的標(biāo)準(zhǔn)構(gòu)成以消除內(nèi)部構(gòu)成不同對總率的影響，使標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化總率具有可比性。(1).選擇標(biāo)準(zhǔn)人口：a. 應(yīng)選擇有代表性、較穩(wěn)定的、數(shù)量較大的人群b. 將比較的兩組（或多組）的人口數(shù)合并作為標(biāo)準(zhǔn)組c. 選其中一組（選人口數(shù)較多組）作為標(biāo)準(zhǔn)組、直接法:以標(biāo)準(zhǔn)人口構(gòu)成與實(shí)際的年齡組別死亡率求得一個調(diào)整死亡率。2、間接法:采用標(biāo)準(zhǔn)年齡組別死亡

46、率與相互比較的兩組年齡組別人口數(shù)計(jì)算求得的死亡率。第九章卡方檢驗(yàn)（一）概念：檢驗(yàn)兩組（或幾組）率或構(gòu)成比差異是否有統(tǒng)計(jì)意義（樣本量不限）。行與列兩個順序變量之間是否相關(guān)。卡方檢驗(yàn)的基本思想反映了實(shí)際頻數(shù)和理論頻數(shù)吻合的程度。如果檢驗(yàn)假設(shè)成立，則實(shí)際頻數(shù)與理論頻數(shù)之差一般不會很大，出現(xiàn)大的卡方值的概率是很小的基本公式： n =(R-1)(C-1)X2檢驗(yàn)的專用公式法連續(xù)性較正公式: 條件:當(dāng)四格表中有任一格子理論數(shù)1T<5,同時總例數(shù)n40, 配對四格表資料x2檢驗(yàn) 配對四格表資料的關(guān)聯(lián)性分析四格表精確檢驗(yàn)法條件：四格表資料中若 n<40,或有任一格子理論數(shù)T<1?；舅?/p>

47、想: 是在周邊合計(jì)數(shù)不變的條件下，表格中實(shí)際頻數(shù)各種組合的概率。P值=所有小于等于樣本點(diǎn)概率的各種組合的概率之和. 行× 列表資料的x2檢驗(yàn)適用條件：l 當(dāng) R>2 or C>2l 兩個以上的率的比較l 兩個或多個構(gòu)成比的比較l 按兩種屬性分類的頻數(shù)表資料的關(guān)聯(lián)性分析計(jì)算公式：行× 列表分類資料的關(guān)聯(lián)性分析Pearson列聯(lián)系數(shù)r : 列聯(lián)表卡方檢驗(yàn)的注意事項(xiàng)：(1) R*C 表中4/5以上格子的理論數(shù)應(yīng)該>5; 假設(shè)1/5以上格子理論數(shù)小于，a. 增加實(shí)驗(yàn)樣本含量b. 相鄰行或列數(shù)字合并;C.刪除所在行或列的數(shù)據(jù)D.直接計(jì)算概率(2) x2 檢驗(yàn)的結(jié)果接

48、受1時僅提示所比較的各組總體來說有差別，但不能表示其間任一兩者間有差別，也不表示差別的強(qiáng)度（3）對于順序變量，用秩和檢驗(yàn)更合適卡方檢驗(yàn)（二）多個樣本率間的多重比較Bonferroni法：行乘列表資料的分類和相應(yīng)檢驗(yàn)?zāi)康募胺椒ǎ篈、對于雙向無序行乘列表資料若研究目的為多個樣本率（或構(gòu)成比）的比較，可用行列表資料的檢驗(yàn)；若研究目的為分析兩個分類變量之間有無關(guān)聯(lián)性以及關(guān)系的密切程度時，可用行列表資料的檢驗(yàn)以及Pearson列聯(lián)系數(shù)進(jìn)行分析。 B、單向有序行乘列表資料有兩種形式一種是表資料中的分組變量（如年齡）是有序的，而指標(biāo)變量（如傳染病的類型）是無序的。其研究目的通常是分析不同年齡組各種傳染

49、病的構(gòu)成情況，此種單向有序表資料可用行列表資料的檢驗(yàn)進(jìn)行分析。另一種情況是表資料中的分組變量（如療法）為無序的，而指標(biāo)變量（如療效按等級分組）是有序的（列為順序變量）。其研究目的為比較不同療法的療效，此種單向有序表資料宜用行平均分檢驗(yàn)或秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)進(jìn)行分析。C、雙向有序?qū)傩韵嗤男谐肆斜碣Y料資料中的兩個分類變量皆為有序且屬性相同。實(shí)際上是配對四格表資料的擴(kuò)展，即水平數(shù)3或以上的配伍資料，如用兩種檢測方法同時對同一批樣品的測定結(jié)果。其研究目的通常是分析兩種檢測方法的一致性，此時宜用一致性檢驗(yàn)或稱Kappa檢驗(yàn)。D、雙向有序?qū)傩圆煌男谐肆斜碣Y料資料中兩個分類變量皆為有序的，但屬性不同，對

50、于該類資料，若研究目的為分析不同年齡組患者療效之間有無差別時，可把它視為單向有序表料，選用秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)；若研究目的為分析兩個有序分類變量間是否存在相關(guān)關(guān)系，宜用行列平均分檢驗(yàn)計(jì)算或等級相關(guān)分析（spearman等級相關(guān)）或Pearson積矩相關(guān)分析。若研究目的為分析兩個有序分類變量間是否存在線性變化趨勢，宜用有序分組資料的線性趨勢檢驗(yàn)。E、多層列聯(lián)表的分析 -Mantel-Haenszel Analysis分層分析，按資料多來源（多中心，多地區(qū)），性別，年齡等分層校正。多層2´ r:分層分析時，每層有一個2´ r表形成多層2 ´ r表。求校正的c2SMH加

51、權(quán)c2檢驗(yàn) -（率的Cochran檢驗(yàn)）內(nèi)部構(gòu)成不同的兩個率差別的統(tǒng)計(jì)意義檢驗(yàn)，用此法最合適！第十章二項(xiàng)分布與普哇松分布三種分布的比較二項(xiàng)分布：從陽性率為的總體中隨機(jī)抽取許多大小為n的樣本，則出現(xiàn)陽性數(shù)為x（x=0，1，2，3，n）的樣本的分布呈二項(xiàng)分布。二項(xiàng)分布的條件：1、各事件是相互獨(dú)立的2、各事件是相互排斥的，適于非遺傳，非傳染性疾病二項(xiàng)分布的形態(tài)：當(dāng)陽性率0.5時，分布是對稱的；當(dāng)0.5時，分布是偏態(tài)的，但n增大時可趨于對稱；1、n > 50且np和n（1-p）均5時（同率utest），二項(xiàng)分布近似正態(tài)分布： 1）可信區(qū)間：可用p±1.96Sp 2）樣本率與總體

52、率，樣本率之間的比較用utest2、一般當(dāng)n<5時，二項(xiàng)分布是偏的，不能用以上方法二項(xiàng)分布的應(yīng)用：1、計(jì)算概率大小，判斷療效2、求總體率的可信區(qū)間：n<50且 np 和n(1-p)均<5時,須用二項(xiàng)分布法求可信區(qū)間3、研究家族聚集性：各戶居民家屬中實(shí)際病例數(shù)X的分布與按二項(xiàng)分布公式求得的理論病例數(shù)的分布一致(P>0.05)，則不能認(rèn)為該病具有家族聚集性。普哇松分布是指單位時間，單位空間或單位容積中顆粒數(shù)或某罕見事件發(fā)生數(shù)的概率分布。條件：各事件是相互獨(dú)立的與二項(xiàng)分布的比較：（1）當(dāng)總體比例很小，樣本含量n趨向于無窮大時（重復(fù)次數(shù)n>100，每次出現(xiàn)概率&l

53、t;0.01）,二項(xiàng)分布趨向于Poission分布；（2）兩種分布均要求各事件是相互獨(dú)立的，均屬離散型分布特征：1、 Poission分布的方差等于其平均數(shù)2=，表示Poission分布變量的變異程度2、 Poission分布的特征取決于其平均數(shù)，平均數(shù)越大（>50），Poission分布越接近正態(tài)分布。（二項(xiàng)，Poission，正態(tài)三角）二項(xiàng)分布正態(tài)分布n>100, but p<0.01 均數(shù)越大 (>50) Poisson分布3、可加性：如果x1，x2，xn是從Poission分布總體中（可以是相同或不同的總體）隨機(jī)抽取的樣本中的計(jì)數(shù)，則它們之和也服從Poi

54、ssion分布；4、總數(shù)的分布也屬Poission分布：每小格的計(jì)數(shù)是Poission分布，共有400個格子計(jì)數(shù)。若以此400格為一單元進(jìn)行觀察，則每400格的計(jì)數(shù)的分布也屬Poission分布?？傮w均數(shù)的可信區(qū)間：1、當(dāng)樣本計(jì)數(shù)x50時，用Poission分布法即查表法2、當(dāng)x50時，用近似正態(tài)分布法（1.96，2.58）計(jì)數(shù)差別的檢驗(yàn)：1、樣本計(jì)數(shù)與總體計(jì)數(shù)：（1）較小時，Poission分布確切概率法（2）較大時（>50）,近似正態(tài)法 ; 2、兩樣本計(jì)數(shù)（不同情況采用不同公式）：（1）時間或體積單位相同；又包括x1，x2>20和x1，x2（5，20）（2）時間或體積單位不同第十一章非參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)：以特定的總體分布為前提，對總體參數(shù)進(jìn)行假設(shè)檢驗(yàn)的一類檢驗(yàn)方法非參數(shù)檢驗(yàn)：與參數(shù)檢驗(yàn)比較，及優(yōu)缺點(diǎn)是一種不依賴于總體分布的具體形式的統(tǒng)計(jì)方法，其比較的是分布，而不是參數(shù)，不受總體參數(shù)的影響。非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)：（1）適用范圍廣：適用于任意分布分布不明，偏態(tài)，方差不齊，半定量資料，數(shù)據(jù)一端無界限資料（2）收集資料方便：可使用“等級”，“符號”等評定結(jié)果（3）有較好的穩(wěn)健性缺點(diǎn)：對適用參數(shù)檢驗(yàn)的資料，采用非參數(shù)檢驗(yàn)，則會損失信息，在小樣本時降低檢驗(yàn)效能Power（即檢驗(yàn)出相同大小的差異需要較多例數(shù)）配對資料：符號等級檢驗(yàn)

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第三版復(fù)習(xí)總結(jié)

文檔簡介

溫馨提示

最新文檔

評論

醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第三版 復(fù)習(xí)總結(jié)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第三版復(fù)習(xí)總結(jié)