版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第一章 緒論統(tǒng)計(jì)的三大特征:實(shí)用性、豐富性、公平性總體(population):l 是根據(jù)研究目的確定的、同質(zhì)的全部研究對象中所有觀察單位某種變量值的集合。l 同質(zhì)基礎(chǔ):時間、空間、條件等l (1)有限總體(finite population):有限觀察單位l (2)無限總體(infinite population):很多為無限總體。樣本l 根據(jù)隨機(jī)化原則從總體中抽取的一定數(shù)量(sample size)的個體,稱為樣本(sample),用樣本信息來推斷總體特征。l 從總體中抽取部分個體的過程稱為抽樣(sampling)。同質(zhì)(homogeneity)l 是指影響被研究指標(biāo)的非實(shí)驗(yàn)因素相同。變異
2、(variation, variablility )l 同質(zhì)基礎(chǔ)上的各觀察單位(亦稱為個體)之間的差異為變異。如同性別、同年齡、同民族、同地區(qū)兒童的身高有高有低,稱為身高的變異。參數(shù)(parameter)和統(tǒng)計(jì)量(statistic)l 總體的統(tǒng)計(jì)指標(biāo)稱為參數(shù)。如:總體均數(shù)(µ),總體發(fā)病率,總體死亡率,等,l 樣本的統(tǒng)計(jì)指標(biāo)稱為統(tǒng)計(jì)量如:樣本均數(shù)(x),樣本發(fā)病率,樣本死亡率,等,l 統(tǒng)計(jì)學(xué)上用不同的符號表示。誤差(error) 觀察值與實(shí)際值的差異,成為誤差。分為:過失誤差;系統(tǒng)誤差;隨機(jī)測量誤差;隨機(jī)抽樣誤差;(1)過失誤差(mistaken error):過失所致的誤差(不認(rèn)
3、真,錯誤判斷,記錄等原因);(2)系統(tǒng)誤差(systematic error):儀器未校準(zhǔn)所致的誤差(統(tǒng)一偏高,或偏低);這兩類誤差可以避免。(3)隨機(jī)測量誤差(random measurement error):不同觀察者或同一觀察者多次觀察值的不相同。 這種誤差不可避免。(4)抽樣誤差(sampling error):總體中存在個體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個體,因而樣本均數(shù)(或率)往往不等于總體均數(shù)(或率),表現(xiàn)為多次抽樣的樣本均數(shù)或率不同。這種由抽樣引起的差異稱為抽樣誤差。抽樣誤差愈小,用樣本推斷總體的精確度愈高;反之,其精確度愈低。由于生物的個體變異是客觀存在的
4、,因而抽樣誤差是不可避免的,但抽樣誤差有一定的規(guī)律性。小概率事件定理:“小概率事件一次抽樣不可能發(fā)生” 變量及變量值l 變量(variable):觀察對象的特征或指標(biāo)。對變量進(jìn)行取值所采用的工具或標(biāo)準(zhǔn)成為測量尺度(scale)。l 測量的結(jié)果稱為變量值(value of variable) 或觀察值(observed value, measurements)。隨機(jī)化(randomization)使總體中的每個個體有均等的機(jī)會成為樣本觀察單位的過程,稱為隨機(jī)化。l 隨機(jī)抽樣旨在避免人的主觀性,讓機(jī)遇起作用,以反映總體的客觀情況。常用:抽簽法,隨機(jī)數(shù)目表法,計(jì)算器隨機(jī)數(shù)法;單純隨機(jī)抽樣(simpl
5、e random sampling):總體全部觀察單位編號,再用隨機(jī)數(shù)字法或抽簽法;整群抽樣cluster sampling:直接由若干個群組成的總體中隨機(jī)抽取若干個群,再對被抽取的每個群的全部觀察單位加以調(diào)查。系統(tǒng)抽樣systematic sampling:( 間隔抽樣,機(jī)械抽樣)先將總體觀察單位按某順序號分成n個部分,再從第一部分抽第k號觀察單位,依次用此相等間隔機(jī)械地從每一部分各抽一個觀察單位組成樣本。分層抽樣stratified sampling:先按某種特征將總體分為若干組別、類型、區(qū)域,再從每一層內(nèi)隨機(jī)抽樣,組成樣本。l 抽樣誤差:分層抽樣<系統(tǒng)抽樣<單純隨機(jī)抽樣<
6、;整群抽樣第二章 統(tǒng)計(jì)資料的收集和整理一、資料的類型根據(jù)是否定量劃分:(1)計(jì)量資料(measurement data)用定量方法測量每個觀察單位的某項(xiàng)指標(biāo),所得的數(shù)值資料為計(jì)量資料,亦稱數(shù)值變量資料。一般有度量衡單位。 常用:平均數(shù),標(biāo)準(zhǔn)差,t檢驗(yàn),方差分析,相關(guān)與回歸 等分析。(2)計(jì)數(shù)資料(enumeration data)將觀察單位按某種屬性或類別分組,然后清點(diǎn)各組的觀察單位數(shù),為計(jì)數(shù)資料(亦稱分類變量資料,無序分類資料)。常用:率、構(gòu)成比、卡方檢驗(yàn)等(3)等級資料 (ranked data) 將觀察單位按某種屬性的不同程度分組,所得各組的觀察單位數(shù)為等級資料,亦稱有序分類資料。常用:
7、率、構(gòu)成比、秩和檢驗(yàn)等。三者聯(lián)系:等級資料與計(jì)數(shù)資料不同:屬性的分組有程度差別,各組大小順序排列;等級資料與計(jì)量資料不同:每個觀察單位未確切定量,稱為半定量資料。介于計(jì)量資料與計(jì)數(shù)資料之間。計(jì)量資料 計(jì)數(shù)資料 等級資料調(diào)查設(shè)計(jì)和實(shí)驗(yàn)設(shè)計(jì)調(diào)查設(shè)計(jì)一般包括專業(yè)設(shè)計(jì)和統(tǒng)計(jì)設(shè)計(jì)。實(shí)驗(yàn)設(shè)計(jì)(experiment design) 醫(yī)學(xué)實(shí)驗(yàn)的基本要素包括處理因素、受試對象和實(shí)驗(yàn)效應(yīng)三部分。實(shí)驗(yàn)設(shè)計(jì)應(yīng)遵循對照(空白對照,試驗(yàn)對照,安慰劑對照,配對對照,組間對照)、隨機(jī)、重復(fù)(即樣本例數(shù))的原則 。頻數(shù)分布表(frequency distribution table)l 用途:(1)揭示頻數(shù)的分布特征:兩個重要
8、特征:l 集中趨勢(central tendency):數(shù)值高低不等,但中等水平的人數(shù)最多。l 離散趨勢(tendency of dispersion):數(shù)值之間參差不齊;逐漸變大(或變?。┑娜藬?shù)漸少。向兩端分散。第三章 計(jì)量資料的統(tǒng)計(jì)描述集中趨勢central tendency平均數(shù)(average):用于描述數(shù)值變量資料的集中趨勢(平均水平)。特點(diǎn):簡明概括,便于比較。包括:算術(shù)平均數(shù),幾何平均數(shù),中位數(shù),百分位數(shù)1、算術(shù)平均數(shù)(arithmetic mean)一組變量值之和除以變量值個數(shù)所得的商,簡稱均數(shù)??傮w均數(shù)µ,樣本均數(shù)x表示。適用條件:資料成正態(tài)分布(或近似正態(tài),或?qū)ΨQ
9、分布)。計(jì)算方法:直接法,加權(quán)法均數(shù)的兩個重要屬性:(1)各離均差(各觀察值與均數(shù)之差)的總和等于零。(2)離均差的平方和小于各個觀察值X與任何數(shù)a(a 不等于均數(shù))之差的平方和。均數(shù)是一組觀察值理想的代表值。均數(shù)的應(yīng)用:(1)只能在合理分布的基礎(chǔ)上,對同質(zhì)事物求均數(shù)才有意義,才能反映事物的特性。(2)均數(shù)最適用于對稱分布,尤其是正態(tài)分布資料。此時,均數(shù)位于分布的中央,能反映觀察值的集中趨勢。2、幾何均數(shù)geometric mean G將n個觀察值的乘積再開n次方的方根(或各觀察值對數(shù)值均值的反對數(shù))。適用條件: (1)觀察值為非對稱分布,差距較大,用算術(shù)均數(shù)表示其平均水平會受少數(shù)特大或特小值
10、影響;(2)數(shù)值按大小順序排列后,各觀察值呈倍數(shù)關(guān)系或近似倍數(shù)關(guān)系。如:抗體滴度,藥物效價等;(3)觀察值不能有0;(4)觀察值不能同時有正值和負(fù)值。幾何均數(shù)的應(yīng)用:(1)常用于等比級數(shù)資料,滴度,效價,衛(wèi)生事業(yè)平均發(fā)展速度,人口幾何增長,對數(shù)正態(tài)分布資料;(2)同一組資料求得的幾何均數(shù)小于算術(shù)均數(shù)。3、中位數(shù)(median, M) :位于中間位置上的數(shù)值。把一組觀察值,按大小順序排列,位置居中的變量值(奇數(shù)個)或位置居中的兩個變量值的均值(偶數(shù)個)。是位置指標(biāo),以中位數(shù)為界,將觀察值分為兩半,有一半比它大,一般比它小。適用于:(1)資料偏態(tài)分布;(2)兩端無確定數(shù)值;(3)資料分布不清楚;如
11、:潛伏期,毒物測定值等用中位數(shù)表示其集中趨勢。5、百分位數(shù)(percentile, P):位于某個百分位置上的數(shù)值。把一組數(shù)據(jù)從小到大排列,分成100等份,各等份含1%的觀察值,處在分割界線上的數(shù)值,就是百分位數(shù),Pr 表示。百分位數(shù)將總體或樣本的全部觀察值分為兩部分,理論上有r%的觀察值比它小,有(100-r)%的觀察值比它大。如含量為n的樣本,P5即表示:理論上有n5%個觀察值比P5小,有n95%個觀察值比P5大。一般說,分布中部的百分位數(shù)相當(dāng)穩(wěn)定,具有較好代表性,靠近兩端的百分位數(shù),只在樣本含量足夠大時,才穩(wěn)定,故,樣本量不夠大時,不應(yīng)取太近兩端的百分位數(shù)。常用的百分位數(shù):5,25,75
12、,95 分位數(shù)。百分位數(shù)常用于確定醫(yī)學(xué)正常值范圍(normal range)。中位數(shù)是特定的百分位數(shù)。四者的比較:中位數(shù)常用于描述偏態(tài)分布資料的集中趨勢,它反映居中位置的變量值的大小。不受特大,特小值的影響,只受位置居中的觀察值的影響,因而不夠敏感。而均數(shù),幾何均數(shù)是由全部觀察值綜合計(jì)算出的,敏感性好。但理論上,中位數(shù)等于算術(shù)均數(shù)。百分位數(shù)常用于描述一組資料在某百分位置上的水平和分布特征。多個百分位數(shù)結(jié)合使用,可更全面地描述總體或樣本的分布特征,包括位置大小和變異度。離散趨勢tendency of dispersion常用指標(biāo):全距,四分位數(shù)間距,方差,標(biāo)準(zhǔn)差,變異系數(shù)1、全距(Range):
13、極大與極小值之差。全距大,資料離散程度大,但易受極端值大小的影響。樣本量越大,抽到極端值的可能性越大,全距可能會越大。故:全距不宜單獨(dú)使用。2、四分位數(shù)間距(quartile interval Q):將一組資料分為四等份,上四分位數(shù)P75和下四分位數(shù)P25之差,叫四分位數(shù)間距。意義:Q越大,離散程度越大,通常用于描述偏態(tài)分布資料的離散程度。優(yōu)點(diǎn):比全距穩(wěn)定;若資料一端或兩端無確切數(shù)值,只能選擇Q作為離散指標(biāo)。缺點(diǎn):未考慮全部觀察值,不能全面反映資料離散趨勢。3、方差(variance)和標(biāo)準(zhǔn)差(standard deviation SD)對總體而言,為了克服極差和四分位數(shù)間距的缺點(diǎn),要描述資料
14、的離散趨勢,必須考慮到各個觀察值,離均差的平方和是最好的指標(biāo),意義:方差,標(biāo)準(zhǔn)差越大,變異程度越大。其值越小,觀察值的離散度越小,用均數(shù)反映平均水平的代表性越好。標(biāo)準(zhǔn)差應(yīng)用:(1)反映一組觀察值的離散程度: 數(shù)值單位相同:直接比較標(biāo)準(zhǔn)差; 數(shù)值單位不同:計(jì)算變異系數(shù);變異系數(shù)(coefficient of variation, CV) 也稱離散系數(shù)(coefficient of dispersion)標(biāo)準(zhǔn)差與均數(shù)之比用百分?jǐn)?shù)表示。公式:常用于比較度量單位不同或均數(shù)相差懸殊的資料的變異。同時考慮了均數(shù)和標(biāo)準(zhǔn)差,更客觀。比如:身高,體重的變異比較(2)估計(jì)變量值的頻數(shù)分布:(3)計(jì)算標(biāo)準(zhǔn)誤(4)估
15、計(jì)醫(yī)學(xué)正常值范圍:雙側(cè):均數(shù)± 1.96倍標(biāo)準(zhǔn)差(95%)單側(cè):均數(shù)± 1.645倍標(biāo)準(zhǔn)差(95%)正態(tài)分布(normal distribution)概念: 頻數(shù)分布以均數(shù)為中心,左右兩側(cè)基本對稱,靠近均數(shù)兩側(cè)頻數(shù)較多,離均數(shù)愈遠(yuǎn),頻數(shù)愈少,形成一個中間多,兩側(cè)逐漸減少的對稱分布。是一種連續(xù)型分布。又稱高斯分布. 正態(tài)分布用N(µ ,)表示,其位置與均數(shù)有關(guān),形狀與標(biāo)準(zhǔn)差有關(guān)。標(biāo)準(zhǔn)正態(tài)分布:為了應(yīng)用方便,常將式進(jìn)行變量變換,即:u變換. 所得到的新變量u的分布即為標(biāo)準(zhǔn)正態(tài)分布。u的含義:變量到均數(shù)間的距離相當(dāng)于標(biāo)準(zhǔn)差的倍數(shù)。u變換后,=0,=1,使原來的正態(tài)分布變
16、換為標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution)亦稱u分布。正態(tài)分布的特征和分布規(guī)律:簡答 (1)曲線在x軸的上方,與x軸不相交,當(dāng)x=時,曲線位于最高點(diǎn)。 f(u=0)=0.3989(2)曲線關(guān)于直線x=左右對稱。(3)正態(tài)分布有兩個參數(shù):均數(shù),標(biāo)準(zhǔn)差;標(biāo)準(zhǔn)正態(tài)的參數(shù)分別為:0, 1。(4)正態(tài)分布的面積分布有一定規(guī)律。正態(tài)曲線下面積的分布規(guī)律正態(tài)曲線下,橫軸上一定區(qū)間的面積,等于該區(qū)間的頻數(shù)發(fā)生的概率(即所有隨機(jī)事件發(fā)生的概率)。正態(tài)曲線下面積的分布規(guī)律的應(yīng)用:一、確定醫(yī)學(xué)參考值范圍意義:是正常人指標(biāo)測定值的波動范圍,可用于劃分正常,或異常。步驟:1、抽樣 2、
17、控制測量誤差 3、取單側(cè)或雙側(cè) 4、選定合適的百分界限 5、資料正態(tài)性檢驗(yàn) 6、進(jìn)行參考值估計(jì)補(bǔ)充:常用方法:正態(tài)分布法(正態(tài)分布),對數(shù)正態(tài)分布法(對數(shù)正態(tài)分布或近似正態(tài)分布),百分位數(shù)法(偏態(tài)分布)二、確定概率分布三、質(zhì)量控制第四章 均數(shù)的抽樣誤差和 t分布一、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差sampling error of mean由于總體中存在個體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個體,因而樣本均數(shù)(或率)往往不等于總體均數(shù)(或率),樣本均數(shù)之間也互不相等,這種由抽樣引起的差異稱為均數(shù)的抽樣誤差。用樣本均數(shù)的標(biāo)準(zhǔn)差來估計(jì),稱標(biāo)準(zhǔn)誤(standard error)。即
18、總體標(biāo)準(zhǔn)差和樣本例數(shù)的比值,通常以樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計(jì)值標(biāo)準(zhǔn)誤越大,均數(shù)的抽樣誤差越大,樣本均數(shù)與總體均數(shù)間的差異越大。S區(qū)別簡答是方差的平方根。說明一組數(shù)據(jù)在其周圍的分散情況(變異程度)。反映對這組數(shù)值的代表性。是均數(shù)的標(biāo)準(zhǔn)差。 說明一組均數(shù)在“均數(shù)的均數(shù)”(總體均數(shù))周圍的分散情況。反映用樣本均數(shù)代表總體均數(shù)的可靠性。表示抽樣誤差的大小。標(biāo)準(zhǔn)誤的應(yīng)用1、用來衡量抽樣誤差的大小: 標(biāo)準(zhǔn)誤越小,樣本均數(shù)與總體均數(shù)越接近,樣本均數(shù)的可信度越高;2、結(jié)合標(biāo)準(zhǔn)正態(tài)分布與 t 分布曲線下的面積規(guī)律,估計(jì)總體均數(shù)的置信區(qū)間。3、用于假設(shè)檢驗(yàn)。二、t 分布(t-distribution) 標(biāo)準(zhǔn)化
19、的均數(shù)的分布t分布曲線特征簡答: t分布是一簇對稱于0的單峰分布曲線。 自由度越?。ㄏ喈?dāng)于標(biāo)準(zhǔn)差大),曲線的中間越低,兩邊越高;隨自由度增大, t分布曲線逐漸逼近于標(biāo)準(zhǔn)正態(tài)分布曲線。 當(dāng)自由度無窮大時, t分布就是標(biāo)準(zhǔn)正態(tài)分布曲線。 每一條t分布曲線,都對應(yīng)于相應(yīng)的自由度。t分布曲線下的面積規(guī)律:與標(biāo)準(zhǔn)正態(tài)曲線下的面積規(guī)律相似: 在某一個自由度下,兩側(cè)外部總面積為5%的界限的t值稱為t0.05/2(),把兩側(cè)外部總面積為1%的界限的t值稱為t0.01/2()。 因此,中部占95%面積的t值范圍:t0.05/2()- t0.05/2(),中部占99%面積的t值范圍:t0.01/2()- t0.0
20、1/2()。使用t值表注意: 同一自由度下, P越小,t值越大;P值相同時,自由度越大,t越小;當(dāng)自由度無窮大時,t值與u值相等。這也是u分布與t分布的區(qū)別。t分布的主要應(yīng)用: 總體均數(shù)置信區(qū)間估計(jì); t檢驗(yàn);三、總體均數(shù)置信區(qū)間的估計(jì) 統(tǒng)計(jì)推斷:參數(shù)估計(jì),假設(shè)檢驗(yàn) 參數(shù)估計(jì): 點(diǎn)估計(jì)(point estimation):用樣本統(tǒng)計(jì)量作為對總體參數(shù)的估計(jì)值() 。比如均數(shù)的估計(jì)。 區(qū)間估計(jì)(interval estimation):根據(jù)選定的置信度估計(jì)總體均數(shù)所在的區(qū)間(a< <b) . a, b 為置信限(可信限)。置信度(confidence level): 在估計(jì)總體均數(shù)的置
21、信區(qū)間時,如果可能估計(jì)錯誤的概率為 ,那么估計(jì)正確的概率為1- , 即為置信度. 常用: 95%, 99%.置信區(qū)間(confidence interval, CI) 根據(jù)置信度估計(jì)得到的區(qū)間,稱為置信區(qū)間。區(qū)間兩端的界限值即置信限置信區(qū)間估計(jì)方法: 1、總體標(biāo)準(zhǔn)差已知參照u分布 2、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)(>50)足夠大,也可參考u分布進(jìn)行 3、總體標(biāo)準(zhǔn)差未知,樣本例數(shù)較小,按t分布原理,依據(jù)自由度,查出某個概率相應(yīng)的t界值95%置信區(qū)間的意義: 理論上,用一次抽樣所得的樣本均數(shù)估計(jì)總體均數(shù),犯錯誤的概率為5%. 或進(jìn)行100次抽樣,可算得100個置信區(qū)間,平均有95個置信區(qū)間包括客
22、觀存在的總體均數(shù),只有5個置信區(qū)間未包括總體均數(shù)。置信區(qū)間與正常值范圍:簡答95%正常值范圍一般是指同質(zhì)總體內(nèi)包括95%個體值的估計(jì)范圍,若總體為正態(tài)分布95%置信區(qū)間是指按照95%置信度估計(jì)的總體參數(shù)的可能范圍,常按照下式計(jì)算。 前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。第五章 假設(shè)檢驗(yàn),u, t-檢驗(yàn)假設(shè)檢驗(yàn)基本思想: 先對總體的參數(shù)或分布作出某種假設(shè),如假設(shè)總體均數(shù)(或總體率)為一定值,兩總體均數(shù)(或總體率)相等,總體服從正態(tài)分布或兩總體分布相同等。 然后,用適當(dāng)方法根據(jù)樣本對總體提供的信息,推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕。其結(jié)果將有助于研究者作出決策,采取措施假設(shè)檢驗(yàn)步驟:簡答1、建立檢驗(yàn)假設(shè)和設(shè)定檢驗(yàn)
23、水準(zhǔn)無效假設(shè)(null hypothesis) H0:假設(shè)差異僅由抽樣誤差所致,而兩個總體參數(shù)相同。是從反證法的思想提出的。備擇假設(shè)(alternative hypothesis), H1: 即差別不僅是由抽樣誤差所致,而且總體參數(shù)不同。H1是和H0相聯(lián)系的,對立的假設(shè)。確定檢驗(yàn)水準(zhǔn)(size of a test) 也叫顯著性水準(zhǔn)(significance level):用表示。即:拒絕了實(shí)際上成立的H0的概率;一般取0.05,或0.01. 2、計(jì)算統(tǒng)計(jì)量根據(jù)研究設(shè)計(jì)類型,資料特征,統(tǒng)計(jì)方法的適用條件,選擇和計(jì)算統(tǒng)計(jì)量。3、確定概率P值,作出統(tǒng)計(jì)推斷結(jié)論計(jì)算統(tǒng)計(jì)量后,判斷在H0成立條件下,出現(xiàn)
24、該統(tǒng)計(jì)量或更大統(tǒng)計(jì)量的概率。如果P大于,是接受H0的區(qū)間;如果大于或等于界值的范圍,P小于或等于,是拒絕H0的區(qū)間。雙側(cè),單側(cè)檢驗(yàn):比較及選擇原則,單選或簡答根據(jù)專業(yè)知識, 可能大于,也可能小于 0,稱雙側(cè)檢驗(yàn);若認(rèn)為大于、等于不可能小于 0(或相反),為單側(cè)檢驗(yàn)。若不能確定單側(cè)的情況,應(yīng)采用雙側(cè)檢驗(yàn)。 在同一t值的界限上單側(cè)檢驗(yàn)的概率僅相當(dāng)于雙側(cè)檢驗(yàn)概率的一半。因此,總體均數(shù)間確有差別時,單側(cè)檢驗(yàn)比雙側(cè)檢驗(yàn)更易得出差別有統(tǒng)計(jì)意義的結(jié)論。對同一資料進(jìn)行檢驗(yàn),有可能雙側(cè)檢驗(yàn)無統(tǒng)計(jì)意義而單側(cè)檢驗(yàn)有統(tǒng)計(jì)意義。但用單側(cè)還是雙側(cè)檢驗(yàn),必須事先根據(jù)專業(yè)知識予以確定,不能等到計(jì)算完t值以后再主觀選定 選擇原
25、則: 雙側(cè)檢驗(yàn)永遠(yuǎn)是正確的 單側(cè)檢驗(yàn)只有在少數(shù)情況下才是合適的 即使要做單側(cè)檢驗(yàn),也必須事先確定 單側(cè)檢驗(yàn):有某種傾向時使用; 雙側(cè)檢驗(yàn):沒有任何傾向;第一類錯誤與第二類錯誤簡答-比較選擇 假陽性錯誤(false positive error),統(tǒng)計(jì)上稱為第一類錯誤(type I error),用表示。 即無效假設(shè)(H0:u=u0)是正確的,但被拒絕,誤判為有差別(棄真錯誤)。統(tǒng)計(jì)學(xué)上定P0.05為有意義,即在統(tǒng)計(jì)推斷上允許犯假陽性錯誤的概率為5%。當(dāng)無效假設(shè)正確時,在100次抽樣中,可以有5次推斷是錯誤的。同樣,如果定P0.01為有意義,即犯假陽性錯誤的概率為1%。故統(tǒng)計(jì)學(xué)上有意義的界限實(shí)際
26、上就是允許犯第一類錯誤的界限。 假陰性錯誤(false negative error),統(tǒng)計(jì)學(xué)上稱為第二類錯誤(type II error)。 即無效假設(shè)(H0:u=u0)不正確,實(shí)際上應(yīng)是H1:uu0,但算得的統(tǒng)計(jì)量t沒有超過t0.05的水平從而接受了無效假設(shè),錯誤地得出無差別的結(jié)論(取偽錯誤)。用b表示。I類錯誤:雖然無效假設(shè)為真,但由于抽到了較大(檢驗(yàn)統(tǒng)計(jì)量)的樣本,使得P值小于檢驗(yàn)水準(zhǔn)而導(dǎo)致被拒絕。II類錯誤:雖然無效假設(shè)為假,但由于抽到了較小(檢驗(yàn)統(tǒng)計(jì)量)的樣本,使得P值大于檢驗(yàn)水準(zhǔn)而導(dǎo)致不被拒絕。第一類錯誤減小,第二類錯誤的概率就增大了。 選擇統(tǒng)計(jì)學(xué)意義水平,應(yīng)考慮兩類錯誤對所要研
27、究事物的影響哪一個重要。一般來說,定0.05為有統(tǒng)計(jì)學(xué)意義的水平是比較適宜的。其他條件不變,增大樣本含量可使第二類錯誤的概率減小。同時正確的實(shí)驗(yàn)設(shè)計(jì)能夠減少抽樣誤差,提高檢驗(yàn)效能。P值的正確理解選擇簡答P值是指在無效假設(shè)的前提下,得到觀察到的量(或更極端的量)的概率。P值越小說明無效假設(shè)越不可靠?;蛘哒f,P值越小就越有理由推翻無效假設(shè)。至于P值是否屬于“小”,一般根據(jù)事先確定的檢驗(yàn)水準(zhǔn)a來判斷的。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。實(shí)際差別與統(tǒng)計(jì)學(xué)意義簡答 統(tǒng)計(jì)學(xué)意義:如果總體均數(shù)相同,抽到這樣大統(tǒng)計(jì)量的可能性很小,可以拒絕 H0。但并不意味兩總體均數(shù)差別很大。 樣本量很大時,即使
28、均數(shù)差別不大,統(tǒng)計(jì)學(xué)意義卻顯著。 樣本小時,即使均數(shù)差別很大,統(tǒng)計(jì)學(xué)意義卻不顯著。u檢驗(yàn)和t檢驗(yàn)簡答兩者比較:u檢驗(yàn)條件: 總體標(biāo)準(zhǔn)差已知,資料服從正態(tài)分布情況下(1)樣本均數(shù)與總體均數(shù)比較(2)兩大樣本均數(shù)的比較;t檢驗(yàn)條件:用于樣本量小、總體標(biāo)準(zhǔn)差未知時(1)樣本與總體均數(shù)比較(2)配對設(shè)計(jì)資料比較(3)兩樣本均數(shù)比較(同時要求兩樣本的總體方差相同,服從正態(tài)分布)配對資料:配對設(shè)計(jì):兩樣本中的觀察值由于存在某種聯(lián)系而一一對應(yīng)結(jié)成對子(matching)的情況.常用配對方式:簡答 1、同一受試對象處理前后的比較:高血壓治療前后的血壓值,或每一名病人有一對數(shù)據(jù); 2、同一對象身體不同部位測定值
29、比較:如左右臂皮膚的敏感試驗(yàn),測得紅斑直徑; 3、同一樣品兩種不同方法測定結(jié)果:兩種儀器,兩名化驗(yàn)員,兩種條件等; 4、成對設(shè)計(jì):動物配對后隨機(jī)分到兩組后的測定結(jié)果;第六章 方差分析(一)概念,思想,應(yīng)用,變異分解概念:方差分析是檢驗(yàn)兩個或兩個以上樣本均數(shù)間差別無統(tǒng)計(jì)意義的統(tǒng)計(jì)檢驗(yàn)方法。前提條件:各組總體均數(shù)為正態(tài)分布,方差齊。方差分析的基本思想是:將所有測量值間的總變異按照其變異的來源分解為多個部份,然后進(jìn)行比較,評價由某種因素所引起的變異是否具有統(tǒng)計(jì)學(xué)意義。方差分析主要用于:1、均數(shù)差別的顯著性檢驗(yàn) 2、分離各有關(guān)因素并估計(jì)其對總變異的作用 3、分析因素間的交互作用,4、方差齊性檢驗(yàn)。優(yōu)點(diǎn)
30、:1、不受對比組數(shù)的限制; 2、可同時分析多個因素作用; 3、可分析因素間的相互作用; 4、靈敏度高; 5、結(jié)論較準(zhǔn)確均方:變異程度除與離均差平方和的大小有關(guān)外,還與其自由度有關(guān),由于各部分自由度不等,因此各部分離均差平方和不能直接比較,須將各部分離均差平方和除以相應(yīng)自由度,其比值稱為均方差,簡稱均方(mean square,MS)。MS組內(nèi):組內(nèi)均方,l組內(nèi)/n組內(nèi)MS組間:組間均方, l組間/n組間總變異(total variation):全部測量值Xij與總均數(shù) 間的差異 å(xij-x)2,v=N-1=nk-1組間變異( between group variation ):各
31、組的均數(shù)Xi 與總均數(shù)間的差異 å n(xi-x )2, v=k-1組內(nèi)變異(within group variation ):每組的每個測量值Xij與該組均數(shù)的差異å(xij-xi)2, v=k(n-1)F值:FMS組間/MS組內(nèi)F界值:F0.05(n1,n2) F³ F0.05(n1,n2), p£0.05公式是在H0成立的條件下進(jìn)行的,即MS組間與MS組內(nèi)差別應(yīng)該很小, F值應(yīng)該接近于1。均數(shù)間的相互比較Student-Newman-Keuls(SNK-q 檢驗(yàn))法:適用于任意兩組間進(jìn)行比較Dunnett-t 檢驗(yàn):適用于多個實(shí)驗(yàn)組與同一個對照組的
32、比較LSD-t 檢驗(yàn):稱最小顯著性差異t 檢驗(yàn),適用于對多組中某一對或幾對在專業(yè)上有特殊意義的均數(shù)進(jìn)行比較。 三種方法是一致的,但并非等價,實(shí)際應(yīng)用中應(yīng)根據(jù)設(shè)計(jì)選取,不可多種方法一起使用,然后選取有利的結(jié)果。拉丁設(shè)計(jì)定義:對于兩個以上的標(biāo)志進(jìn)行方差分析,而且各種標(biāo)志的水平數(shù)相同,采用拉丁方設(shè)計(jì)。其優(yōu)點(diǎn)是可以從較少的實(shí)驗(yàn)數(shù)據(jù),獲取較多的信息。但設(shè)計(jì)要求各因素的水平數(shù)必須相等,在實(shí)際應(yīng)用時有一定局限性。而且,當(dāng)各因素間有交互作用時,該設(shè)計(jì)不合適。拉丁方是以拉丁字母排列的方陣的簡稱。方差齊性檢驗(yàn)多個方差齊性的Bartlett 法此外,Levene 檢驗(yàn)法對原數(shù)據(jù)是否為正態(tài)不靈敏,比較穩(wěn)健,也常常采用
33、。方差分析中的數(shù)據(jù)轉(zhuǎn)換:選擇或簡答(1) 平方根轉(zhuǎn)換x´=Ö x 當(dāng)x<10時, x´=Ö x 1 或x´=Ö x 1/2常用于服從普哇松分布的資料(方差隨均數(shù)而變;二項(xiàng)分布中方差隨率變化)(2) 平方根反正弦轉(zhuǎn)換二項(xiàng)分布中率的比較, x´=arc sin Ö x (3) 對數(shù)轉(zhuǎn)換對于均數(shù)與標(biāo)準(zhǔn)差呈正比關(guān)系的資料x´=lgx 或 x´=lg(x1) (x>0)方差分析(二)概念及方差分析表當(dāng)實(shí)驗(yàn)的處理是由兩個或兩個以上的因素,每個因素至少有兩個水平的全面組合時,稱之為析因?qū)嶒?yàn)。一、2
34、´2析因?qū)嶒?yàn)(factorial experiment)設(shè)計(jì)兩個因素,每個因素有兩個水平的實(shí)驗(yàn)設(shè)計(jì)。單獨(dú)效應(yīng):是指其它因素的水平固定時,同一因素不同水平間的差別。主效應(yīng):指某一因素各水平間的平均差別。交互效應(yīng):某因素的各個單獨(dú)效應(yīng)隨另一因素水平的變化而變化,且相互間的差別超出隨機(jī)波動的范圍時,稱者兩個因素間存在交互作用或效應(yīng)。如果AB兩因素的聯(lián)合效應(yīng)不等于A與B的單獨(dú)效應(yīng)之和,則A,B存在交互效應(yīng),若大于則有協(xié)同作用,若小于則為拮抗作用。二、2×2×2析因設(shè)計(jì) 是指有三個因素,每個因素有兩個水平的實(shí)驗(yàn)設(shè)計(jì)。第七章 直線回歸與相關(guān)(1) 依存關(guān)系:應(yīng)變量(depen
35、dent variable)Y隨自變量(independent variable)X變化而變化。 回歸分析(2) 互依關(guān)系: 應(yīng)變量Y與自變量 X間的彼此關(guān)系 相關(guān)分析第一節(jié) 直線回歸 ( linear regression 線性回歸)1直線回歸的概念:直線回歸是分析兩變量間線性依存變化的數(shù)量關(guān)系。2. 函數(shù)關(guān)系與回歸關(guān)系:前者是確定關(guān)系,后者是不確定關(guān)系直線回歸的任務(wù):就是找出一條最能描述變量間非確定性數(shù)量關(guān)系的一條直線,此直線為回歸直線,相應(yīng)的直線方程稱為直線回歸方程( linear regression equation)。對資料的要求:自變量 x :正態(tài)總體中的隨機(jī)變量或指定變量 因變
36、量 y :服從正態(tài)分布的隨機(jī)變量標(biāo)準(zhǔn)估計(jì)誤差各實(shí)際值Y與估計(jì)值 有一定的誤差,稱為估計(jì)誤差。各實(shí)際點(diǎn)與回歸線縱軸方向的離散程度,可以用類似求標(biāo)準(zhǔn)差的式子進(jìn)行計(jì)算,即標(biāo)準(zhǔn)估計(jì)誤差a b的意義:考a 為回歸直線在 y 軸上的截距,即與Y軸交點(diǎn)的縱坐標(biāo)(X0)。b 為回歸系數(shù),即回歸直線的斜率;其統(tǒng)計(jì)學(xué)意義是 x 增加(減)一個單 位,y 平均變動 b 個單位b>0,Y隨X的增大而增大(減少 而減少) 斜上; b<0,Y隨X的增大而減?。p少 而增加) 斜下; b=0,Y與X無直線關(guān)系 水平。 b越大,表示Y隨X變化越快,直線越陡峭。3直線回歸方程參數(shù)的計(jì)算最小二乘法原則 (least
37、square method):使各實(shí)際散點(diǎn)(Y)到直線()的縱向距離的平方和最小。即使(殘差或剩余值)最小殘差(residual)或剩余值,即實(shí)測值Y與假定回歸線上的估計(jì)值的縱向距離 回歸系數(shù)的檢驗(yàn)方法:方差分析法各種變異分解-重點(diǎn) SS總,的離均差平方和(total sum of squares),未考慮與的回歸關(guān)系時的總變異。 SS剩,為剩余平方和(residual sum of squares),對的線性影響之外的一切因素對的變異,即總變異中,無法用解釋的部分。SS剩越小,回歸效果越好。 SS回,為回歸平方和(regression sum of squares),由于與的直線關(guān)系而使變異
38、減小的部分,即總變異中,可以用解釋的部分。SS回越大,回歸效果越好。 t檢驗(yàn)法 S b 為樣本回歸系數(shù)標(biāo)準(zhǔn)誤;S yx 為剩余標(biāo)準(zhǔn)差同一組資料作直線相關(guān)與回歸時 tb 與 tr 等值回歸系數(shù)的標(biāo)準(zhǔn)誤 b為總體回歸系數(shù)b 的估計(jì)值,其誤差為Sb 決定系數(shù):回歸平方和與總平方和之比,大小反映了回歸貢獻(xiàn)的相對程度,也就是在Y的總變異中回歸關(guān)系所能解釋的百分比??傮w回歸線的95%置信帶,與個體y值比較即µ (x=xi)的可信區(qū)間方差由Y 及 b (x - x)的方差兩部分構(gòu)成個體Yi 值的范圍預(yù)測與總體回歸線比較直線回歸方程的應(yīng)用描述兩變量的依存數(shù)量關(guān)系利用回歸方程進(jìn)行預(yù)測利用回歸方程進(jìn)行控
39、制第二 直線相關(guān) ( linear correlation )簡單相關(guān)(simple correlation),用于雙變量正態(tài)分布資料。進(jìn)行直線相關(guān)分析的基本任務(wù)在于根據(jù)x、y的實(shí)際觀測值計(jì)算表示兩個相關(guān)變量x與y線性相關(guān)程度和性質(zhì)的統(tǒng)計(jì)指標(biāo)相關(guān)系數(shù)r,并進(jìn)行顯著性檢驗(yàn)。 1直線相關(guān)的概念 直線相關(guān)是研究兩變量 x、y 之間協(xié)同變化的線性關(guān)系 的分析方法。2對資料的要求 x、y 都是正態(tài)分布資料的隨機(jī)變量。3相關(guān)系數(shù) (correlation coefficient ,r ) * 表示方法: -1 £ r £ 1意義:描述兩個變量直線相關(guān)的方向與密切程度的指標(biāo)。4、直線回歸
40、與直線相關(guān)的聯(lián)系與區(qū)別簡答區(qū)別:1)意義直線回歸反映兩變量的依存關(guān)系;直線相關(guān)反映兩變量的相互關(guān)系。2)對資料的要求直線回歸:自變量是正態(tài)總體的隨機(jī)變量或指定變量,y 一定是正態(tài)總體的隨機(jī)變量;直線相關(guān):兩變量均為正態(tài)總體的隨機(jī)變量。聯(lián)系:1)同一組資料的 r 與 b 的正負(fù)符號是一致的;2)同一組資料的 r 和 b 的假設(shè)檢驗(yàn)結(jié)果是一致的,即 t r = t b。3)兩變量間有相關(guān)關(guān)系,不一定有因果關(guān)系;但兩變量間有因果關(guān)系,一定有相關(guān)關(guān)系。第三節(jié) Spearman 秩相關(guān)適用資料: 不服從雙變量正態(tài)分布 總體分布類型未知 原始數(shù)據(jù)用等級表示等級相關(guān)系數(shù)r
41、s(即Spearman Correlation Coefficient)反映兩變量間相關(guān)的密切程度與方向 第八章 相對數(shù)計(jì)數(shù)資料的統(tǒng)計(jì)描述一、常用相對數(shù)(relative number) 1、比( ratio)又稱對比指標(biāo)或相對比,表示兩個有聯(lián)系的同類指標(biāo)之比,常用倍數(shù)或百分?jǐn)?shù)表示。2、比例(proportion)又稱構(gòu)成指標(biāo),表示某一事物內(nèi)部各組成部分所占的比重或分布,常用百分?jǐn)?shù)表示。、率(rate):又稱頻率指標(biāo),表示某現(xiàn)象發(fā)生的頻率或強(qiáng)度,比例基數(shù)用k表示,據(jù)習(xí)慣定,一般至少保留12為整數(shù)。包括%、1/萬、1/10萬二、 醫(yī)學(xué)中常用的相對數(shù)指標(biāo)1、醫(yī)學(xué)人口統(tǒng)計(jì)指標(biāo)(1)人口總數(shù)(2)人口
42、構(gòu)成(3)人口生育 自然增長率粗出生率粗死亡率(4)人口死亡 粗死亡率(總死亡率) mortality rate2、反映疾病發(fā)生水平的頻率指標(biāo)(疾病統(tǒng)計(jì)指標(biāo))重點(diǎn)發(fā)病率 ( incidence rate)某病發(fā)病率(一定時期某病新發(fā)生的病例數(shù)/同時期內(nèi)可能發(fā)生某病的人口數(shù))´K(1) 時期:指觀察所包括的時間范圍,通常為年或月;(2)新發(fā)生的病例數(shù):指第一次發(fā)生某種疾病,以第一次就診為準(zhǔn)。(3)可能發(fā)生“某病”:指存在發(fā)生某病的危險性和條件(流行病學(xué)上為暴露人群)。患病率(prevalence rate) 指在某時點(diǎn)接受醫(yī)學(xué)檢查時,可能發(fā)生某病的全體受檢人群中被發(fā)現(xiàn)的某病病人現(xiàn)患新、
43、舊病例數(shù)。某病患病率(檢查時發(fā)現(xiàn)的某病現(xiàn)患病例數(shù)/ 該時點(diǎn)受檢人口數(shù))´K適用于病程較長的疾病的統(tǒng)計(jì),反映某種疾病在一定人群中流行的規(guī)?;蛩讲∷缆剩╢atality)某病死亡率(觀察期間內(nèi)因某病死亡人數(shù)/同期某病病人總數(shù))´ K三、應(yīng)用相對數(shù)應(yīng)注意的問題簡答l 1,計(jì)算率和構(gòu)成比的分母不宜過?。悍駝t樣本率不穩(wěn)定,易造成錯覺;l 2,不要將構(gòu)成比作率分析;l 3,求平均率時不能直接將幾個率相加求其合并率或平均率,而應(yīng)以總發(fā)生數(shù)除以總可能發(fā)生例數(shù)。l 4,應(yīng)注意資料的可比性資料是否存在偏性當(dāng)內(nèi)部結(jié)構(gòu)不同的相對數(shù)間進(jìn)行比較時,若比較合計(jì)率,應(yīng)計(jì)算標(biāo)準(zhǔn)化率。率的抽樣誤差與標(biāo)準(zhǔn)誤l
44、 率的抽樣誤差:由抽樣造成的樣本率和總體率的差別稱為率的抽樣誤差。率的總體標(biāo)準(zhǔn)誤用sp表示 sp的樣本估計(jì)值為率的樣本標(biāo)準(zhǔn)誤sp 總體率的區(qū)間估計(jì)當(dāng)np³5和n(1-p)³5時,樣本率p近似服從均數(shù)為p、標(biāo)準(zhǔn)誤為sP的正態(tài)分布,當(dāng)總體率未知時, sp用估計(jì)值sp取代 總體率的假設(shè)檢驗(yàn)(u檢驗(yàn))l 適用條件:1. 適用于一個樣本率與一個總體率的比較,或兩個樣本率間的比較。而不能用于多個率或構(gòu)成比資料的比較;2. 要求樣本量較大, 一般np與n(1-p)均大于5,率的分布近似于正態(tài)分布。率的標(biāo)準(zhǔn)化直接,間接比較,標(biāo)準(zhǔn)選擇1. 標(biāo)準(zhǔn)化法(Standardization)的意義當(dāng)比
45、較兩個總率時,如果兩組內(nèi)部某種能影響指標(biāo)水平的重要特征的構(gòu)成上有差別,往往造成總率的升高或下降,影響兩個總率的對比;因此要設(shè)法消除其內(nèi)部構(gòu)成的差異,使之能合理地進(jìn)行比較,所用的方法稱為標(biāo)準(zhǔn)化法。標(biāo)準(zhǔn)化法即在一個指定的標(biāo)準(zhǔn)構(gòu)成條件下進(jìn)行率的比對的方法。目的:采用統(tǒng)一的標(biāo)準(zhǔn)構(gòu)成以消除內(nèi)部構(gòu)成不同對總率的影響,使標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化總率具有可比性。(1).選擇標(biāo)準(zhǔn)人口:a. 應(yīng)選擇有代表性、較穩(wěn)定的、數(shù)量較大的人群b. 將比較的兩組(或多組)的人口數(shù)合并作為標(biāo)準(zhǔn)組c. 選其中一組(選人口數(shù)較多組)作為標(biāo)準(zhǔn)組、直接法:以標(biāo)準(zhǔn)人口構(gòu)成與實(shí)際的年齡組別死亡率求得一個調(diào)整死亡率。2、間接法:采用標(biāo)準(zhǔn)年齡組別死亡
46、率與相互比較的兩組年齡組別人口數(shù)計(jì)算求得的死亡率。第九章 卡方檢驗(yàn)(一)概念: 檢驗(yàn)兩組(或幾組)率或構(gòu)成比差異是否有統(tǒng)計(jì)意義(樣本量不限)。行與列兩個順序變量之間是否相關(guān)??ǚ綑z驗(yàn)的基本思想反映了實(shí)際頻數(shù)和理論頻數(shù)吻合的程度。如果檢驗(yàn)假設(shè)成立,則實(shí)際頻數(shù)與理論頻數(shù)之差一般不會很大,出現(xiàn)大的卡方值的概率是很小的基本公式: n =(R-1)(C-1)X2檢驗(yàn)的專用公式法連續(xù)性較正公式: 條件:當(dāng)四格表中有任一格子理論數(shù)1T<5,同時總例數(shù)n40, 配對四格表資料x2檢驗(yàn) 配對四格表資料的關(guān)聯(lián)性分析 四格表精確檢驗(yàn)法條件:四格表資料中若 n<40,或有任一格子理論數(shù)T<1?;舅?/p>
47、想: 是在周邊合計(jì)數(shù)不變的條件下,表格中實(shí)際頻數(shù)各種組合的概率。P值=所有小于等于樣本點(diǎn)概率的各種組合的概率之和. 行× 列表資料的x2檢驗(yàn)適用條件:l 當(dāng) R>2 or C>2l 兩個以上的率的比較l 兩個或多個構(gòu)成比的比較l 按兩種屬性分類的頻數(shù)表資料的關(guān)聯(lián)性分析計(jì)算公式:行× 列表分類資料的關(guān)聯(lián)性分析Pearson列聯(lián)系數(shù)r : 列聯(lián)表卡方檢驗(yàn)的注意事項(xiàng):(1) R*C 表中4/5以上格子的理論數(shù)應(yīng)該>5; 假設(shè)1/5以上格子理論數(shù)小于,a. 增加實(shí)驗(yàn)樣本含量b. 相鄰行或列數(shù)字合并;C.刪除所在行或列的數(shù)據(jù)D.直接計(jì)算概率(2) x2 檢驗(yàn)的結(jié)果接
48、受1時僅提示所比較的各組總體來說有差別,但不能表示其間任一兩者間有差別,也不表示差別的強(qiáng)度 (3)對于順序變量,用秩和檢驗(yàn)更合適卡方檢驗(yàn)(二)多個樣本率間的多重比較Bonferroni法: 行乘列表資料的分類和相應(yīng)檢驗(yàn)?zāi)康募胺椒ǎ篈、對于雙向無序行乘列表資料若研究目的為多個樣本率(或構(gòu)成比)的比較,可用行列表資料的檢驗(yàn);若研究目的為分析兩個分類變量之間有無關(guān)聯(lián)性以及關(guān)系的密切程度時,可用行列表資料的檢驗(yàn)以及Pearson列聯(lián)系數(shù)進(jìn)行分析。 B、單向有序行乘列表資料 有兩種形式一種是表資料中的分組變量(如年齡)是有序的,而指標(biāo)變量(如傳染病的類型)是無序的。其研究目的通常是分析不同年齡組各種傳染
49、病的構(gòu)成情況,此種單向有序表資料可用行列表資料的檢驗(yàn)進(jìn)行分析。另一種情況是表資料中的分組變量(如療法)為無序的,而指標(biāo)變量(如療效按等級分組)是有序的(列為順序變量)。其研究目的為比較不同療法的療效,此種單向有序表資料宜用行平均分檢驗(yàn)或秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)進(jìn)行分析。C、雙向有序?qū)傩韵嗤男谐肆斜碣Y料 資料中的兩個分類變量皆為有序且屬性相同。實(shí)際上是配對四格表資料的擴(kuò)展,即水平數(shù)3或以上的配伍資料,如用兩種檢測方法同時對同一批樣品的測定結(jié)果。其研究目的通常是分析兩種檢測方法的一致性,此時宜用一致性檢驗(yàn)或稱Kappa檢驗(yàn)。D、雙向有序?qū)傩圆煌男谐肆斜碣Y料資料中兩個分類變量皆為有序的,但屬性不同,對
50、于該類資料,若研究目的為分析不同年齡組患者療效之間有無差別時,可把它視為單向有序表料,選用秩轉(zhuǎn)換的非參數(shù)檢驗(yàn);若研究目的為分析兩個有序分類變量間是否存在相關(guān)關(guān)系,宜用行列平均分檢驗(yàn)計(jì)算或等級相關(guān)分析(spearman等級相關(guān))或Pearson積矩相關(guān)分析。 若研究目的為分析兩個有序分類變量間是否存在線性變化趨勢,宜用有序分組資料的線性趨勢檢驗(yàn)。E、多層列聯(lián)表的分析 -Mantel-Haenszel Analysis分層分析,按資料多來源(多中心,多地區(qū)),性別,年齡等分層校正。多層2´ r:分層分析時,每層有一個2´ r表形成多層2 ´ r表。求校正的c2SMH加
51、權(quán)c2檢驗(yàn) -(率的Cochran檢驗(yàn))內(nèi)部構(gòu)成不同的兩個率差別的統(tǒng)計(jì)意義檢驗(yàn),用此法最合適!第十章 二項(xiàng)分布與普哇松分布三種分布的比較二項(xiàng)分布:從陽性率為的總體中隨機(jī)抽取許多大小為n的樣本,則出現(xiàn)陽性數(shù)為x(x=0,1,2,3,n)的樣本的分布呈二項(xiàng)分布。二項(xiàng)分布的條件:1、 各事件是相互獨(dú)立的2、 各事件是相互排斥的,適于非遺傳,非傳染性疾病二項(xiàng)分布的形態(tài):當(dāng)陽性率0.5時,分布是對稱的;當(dāng)0.5時,分布是偏態(tài)的,但n增大時可趨于對稱;1、n > 50且np和n(1-p)均5時(同率utest),二項(xiàng)分布近似正態(tài)分布: 1)可信區(qū)間:可用p±1.96Sp 2) 樣本率與總體
52、率,樣本率之間的比較用utest2、一般當(dāng)n<5時,二項(xiàng)分布是偏的,不能用以上方法二項(xiàng)分布的應(yīng)用:1、 計(jì)算概率大小,判斷療效2、 求總體率的可信區(qū)間:n<50且 np 和n(1-p)均<5時,須用二項(xiàng)分布法求可信區(qū)間3、 研究家族聚集性:各戶居民家屬中實(shí)際病例數(shù)X的分布與按二項(xiàng)分布公式求得的理論病例數(shù)的分布一致(P>0.05),則不能認(rèn)為該病具有家族聚集性。普哇松分布是指單位時間,單位空間或單位容積中顆粒數(shù)或某罕見事件發(fā)生數(shù)的概率分布。條件:各事件是相互獨(dú)立的與二項(xiàng)分布的比較:(1) 當(dāng)總體比例很小,樣本含量n趨向于無窮大時(重復(fù)次數(shù)n>100,每次出現(xiàn)概率&l
53、t;0.01),二項(xiàng)分布趨向于Poission分布;(2) 兩種分布均要求各事件是相互獨(dú)立的,均屬離散型分布特征:1、 Poission分布的方差等于其平均數(shù)2=,表示Poission分布變量的變異程度2、 Poission分布的特征取決于其平均數(shù),平均數(shù)越大(>50),Poission分布越接近正態(tài)分布。(二項(xiàng),Poission,正態(tài)三角) 二項(xiàng)分布 正態(tài)分布n>100, but p<0.01 均數(shù)越大 (>50) Poisson分布3、 可加性:如果x1,x2,xn是從Poission分布總體中(可以是相同或不同的總體)隨機(jī)抽取的樣本中的計(jì)數(shù),則它們之和也服從Poi
54、ssion分布;4、 總數(shù)的分布也屬Poission分布:每小格的計(jì)數(shù)是Poission分布,共有400個格子計(jì)數(shù)。若以此400格為一單元進(jìn)行觀察,則每400格的計(jì)數(shù)的分布也屬Poission分布??傮w均數(shù)的可信區(qū)間:1、 當(dāng)樣本計(jì)數(shù)x50時,用Poission分布法即查表法2、 當(dāng)x50時,用近似正態(tài)分布法(1.96,2.58)計(jì)數(shù)差別的檢驗(yàn):1、 樣本計(jì)數(shù)與總體計(jì)數(shù):(1)較小時,Poission分布確切概率法(2)較大時(>50),近似正態(tài)法 ; 2、 兩樣本計(jì)數(shù)(不同情況采用不同公式):(1)時間或體積單位相同;又包括x1,x2>20和x1,x2(5,20)(2)時間或體積單位不同第十一章 非參數(shù)檢驗(yàn)參數(shù)檢驗(yàn):以特定的總體分布為前提,對總體參數(shù)進(jìn)行假設(shè)檢驗(yàn)的一類檢驗(yàn)方法非參數(shù)檢驗(yàn):與參數(shù)檢驗(yàn)比較,及優(yōu)缺點(diǎn)是一種不依賴于總體分布的具體形式的統(tǒng)計(jì)方法,其比較的是分布,而不是參數(shù),不受總體參數(shù)的影響。非參數(shù)檢驗(yàn)的優(yōu)點(diǎn):(1) 適用范圍廣:適用于任意分布分布不明,偏態(tài),方差不齊,半定量資料,數(shù)據(jù)一端無界限資料(2) 收集資料方便:可使用“等級”,“符號”等評定結(jié)果(3) 有較好的穩(wěn)健性缺點(diǎn):對適用參數(shù)檢驗(yàn)的資料,采用非參數(shù)檢驗(yàn),則會損失信息,在小樣本時降低檢驗(yàn)效能Power(即檢驗(yàn)出相同大小的差異需要較多例數(shù))配對資料:符號等級檢驗(yàn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年剪輯師用工勞動合同
- 商場專柜聯(lián)營協(xié)議書
- 個體與個體之間的借款協(xié)議文本
- 2024年教師勞動合同協(xié)議書
- 2024年肉雞飼料購銷合同全文-
- 消防行業(yè)勞務(wù)合同樣例
- 投標(biāo)保密承諾書轉(zhuǎn)讓協(xié)議2024年
- 廣東省新鮮果蔬采購合同協(xié)議模板
- 集體土地上房屋搬遷補(bǔ)償協(xié)議
- 企業(yè)環(huán)境清潔臨時工雇傭合同
- 物聯(lián)網(wǎng)技術(shù)在軍事上的應(yīng)用與現(xiàn)代戰(zhàn)爭教案
- 常州高級中學(xué)2022-2023學(xué)年高一上學(xué)期期中質(zhì)量檢查物理試題(解析版)
- 簡愛英文版課件
- 職業(yè)道德與商業(yè)道德培訓(xùn)
- 學(xué)科教研基地匯報(bào)材料
- 剪刀式升降車的安全管理試題及答案
- 神經(jīng)性頭痛的護(hù)理查房
- 鋰電池應(yīng)急預(yù)案
- 高考說題英語說題比賽課件
- 個人借款開結(jié)清證明范本
- 第二章生活計(jì)劃與理財(cái) 第三節(jié)家庭理財(cái)技巧 課件 云教版勞動與技術(shù)課
評論
0/150
提交評論