醫(yī)學(xué)統(tǒng)計(jì)課件_第1頁
醫(yī)學(xué)統(tǒng)計(jì)課件_第2頁
醫(yī)學(xué)統(tǒng)計(jì)課件_第3頁
醫(yī)學(xué)統(tǒng)計(jì)課件_第4頁
醫(yī)學(xué)統(tǒng)計(jì)課件_第5頁
已閱讀5頁,還剩244頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

醫(yī)學(xué)統(tǒng)計(jì)學(xué)概論數(shù)理統(tǒng)計(jì)試驗(yàn)設(shè)計(jì)企業(yè)管理質(zhì)量控制人口統(tǒng)計(jì)經(jīng)濟(jì)預(yù)測農(nóng)業(yè)育種其它……量子力學(xué)遺傳統(tǒng)計(jì)生物統(tǒng)計(jì)氣象預(yù)報(bào)醫(yī)療診斷藥品檢定醫(yī)學(xué)統(tǒng)計(jì)學(xué)是用數(shù)理統(tǒng)計(jì)的原理和方法,結(jié)合醫(yī)藥學(xué)實(shí)際,研究醫(yī)藥科學(xué)中隨機(jī)事件統(tǒng)計(jì)規(guī)律的學(xué)科。

為什么要學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)?(why)

怎樣學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)?(how)

醫(yī)學(xué)統(tǒng)計(jì)學(xué)的基本思想?(what)

為什么要學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)?(why)例1:某大學(xué)校醫(yī)院用銀楂丹桃合劑治療高血壓患者,治療前后舒張壓數(shù)據(jù)(Kpa),對比如表,怎樣判斷該中藥治療高血壓是有效還是無效,需要一定的理論和方法,才能從8人的調(diào)查數(shù)據(jù)推理到任何高血壓患者服用后的療效。13.614.917.217.316.514.214.514.611.915.317.214.611.512.213.813.4治療前治療后

怎樣學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)?(how)

1.不注重原理、公式推導(dǎo),以具體應(yīng)用為主

2.重點(diǎn)記住各統(tǒng)計(jì)方法的應(yīng)用條件。學(xué)習(xí)一種

統(tǒng)計(jì)軟件去實(shí)現(xiàn)。

3.結(jié)合實(shí)驗(yàn)數(shù)據(jù)、習(xí)題學(xué)習(xí)如何應(yīng)用統(tǒng)計(jì)方法1.SPSS(StatisticalProgramforSocialSciences)社會(huì)科學(xué)統(tǒng)計(jì)程序2.SAS(STATISTICALANALYSISSYSTEM)統(tǒng)計(jì)分析軟件3.minitab,statistica等4.DPS(DataProcessingSystem)中文數(shù)據(jù)處理系統(tǒng)6.卡方檢驗(yàn)計(jì)算器,正交設(shè)計(jì)助手II3.15.JMTJFX簡明統(tǒng)計(jì)分析10.31總體樣本數(shù)據(jù)設(shè)計(jì)收集整理、分析推斷

醫(yī)學(xué)統(tǒng)計(jì)學(xué)的基本思想?(what)1.總體:是指研究對象的全體。(有限總體,無限總體)2.個(gè)體:組成總體的每個(gè)單元稱為個(gè)體。3.樣本:在一個(gè)總體X中抽取n個(gè)個(gè)體稱為總體X的一個(gè)容量為n的樣本。樣本容量n是指樣本中含有個(gè)體的數(shù)目,也稱樣本的大小。(小樣本,大樣本)

定義:對觀察對象用測量工具或測量標(biāo)準(zhǔn)得到的數(shù)據(jù).

例如:體重與身高、中藥中的有效成分含量特點(diǎn):有度量衡單位;(通過測量得到)多為連續(xù)變量(可取非整數(shù))

(1)

計(jì)量資料(定量資料)統(tǒng)計(jì)資料類型(2)計(jì)數(shù)資料(定性資料)

定義:把觀察對象按不同屬性或類別分組計(jì)數(shù)的數(shù)據(jù).

特點(diǎn):多為離散變量(取整數(shù))例:調(diào)查339名50歲以上的人的吸煙習(xí)慣與患慢性氣管炎病的數(shù)據(jù)而建立如下列聯(lián)表,試探討吸煙與患慢性氣管炎之間的關(guān)系。組別吸煙不吸煙患病組4313健康組162121(3)

等級(jí)資料定義:將觀察單位按某種屬性的不同程度分組計(jì)數(shù),得到各組觀察單位的個(gè)數(shù)稱為等級(jí)資料。分類嚴(yán)重?zé)o效好轉(zhuǎn)痊愈合計(jì)對照組648613020300處理組12513821026499合計(jì)18922434046799統(tǒng)計(jì)量:由總體中隨機(jī)抽取樣本而計(jì)算的相應(yīng)指標(biāo)。概率:是某一事件中發(fā)生的可能性大小的數(shù)值表示。記為P(A)P≤0.05與P≤0.01都可稱為小概率事件。統(tǒng)計(jì)設(shè)計(jì)搜集資料整理資料分析資料推廣應(yīng)用分析資料統(tǒng)計(jì)描述統(tǒng)計(jì)推斷:變量關(guān)系參數(shù)估計(jì)、假設(shè)檢驗(yàn)第二章計(jì)量資料的統(tǒng)計(jì)分析刻畫資料取值的平均水平和離散程度的數(shù)值§2.1總體數(shù)字特征

總體均數(shù)(數(shù)學(xué)期望)記為EX或MX,

反映總體取值的集中趨勢、平均水平。

總體方差記作DX??傮w標(biāo)準(zhǔn)差反映總體取值的離散程度、穩(wěn)定程度。Def.

標(biāo)準(zhǔn)差與均數(shù)值之比為變異系數(shù)(相對標(biāo)準(zhǔn)差)

例:據(jù)調(diào)查某地18歲男子身高均數(shù)為165.08cm,標(biāo)準(zhǔn)差為4.98cm,體重均數(shù)為51.60kg,標(biāo)準(zhǔn)差為5.01kg,試比較該地男子身高和體重波動(dòng)度哪個(gè)大一些?3.02%,9.71%一般的變異系數(shù)小于5%時(shí)認(rèn)為數(shù)據(jù)資料較穩(wěn)定。X與Y取值單位不同、均數(shù)相差懸殊如身高、體重,血壓、血糖總體變異系數(shù)

比較幾組資料的變異程度,若各組資料的單位不全相同,或均數(shù)相差懸殊時(shí),用變異系數(shù)??偨Y(jié):方差、標(biāo)準(zhǔn)差、變異系數(shù)統(tǒng)成為變異指標(biāo)。共同點(diǎn):值小表示變量值密集,值大表示變量值分散。樣本均數(shù):

設(shè)有容量為n的樣本,則稱為樣本均數(shù),亦可寫成:或

統(tǒng)計(jì)量§2.2樣本的數(shù)字特征二.樣本方差、樣本標(biāo)準(zhǔn)差、樣本變異系數(shù):

設(shè)有容量為n的樣本則稱為樣本方差;S稱為樣本標(biāo)準(zhǔn)差(SD);

稱為樣本變異系數(shù)或相對標(biāo)準(zhǔn)差(RSD).

統(tǒng)計(jì)量三.樣本標(biāo)準(zhǔn)誤(SE):樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差,反映平均的抽樣誤差大小。

用樣本標(biāo)準(zhǔn)差代替:例如:樣本均數(shù)的標(biāo)準(zhǔn)差為樣本均數(shù)的標(biāo)準(zhǔn)誤(SEM)。用來表示。(表示偏離總體均數(shù)的程度)集中趨勢樣本均數(shù)中位數(shù)居中位置的值眾數(shù)頻率最大的值離散程度樣本方差樣本標(biāo)準(zhǔn)差樣本變異系數(shù)樣本均數(shù)標(biāo)準(zhǔn)誤極差最大與最小值之差25%、75%位置值四分位數(shù)幾何均數(shù)單峰、鐘型、對稱曲線。位置參數(shù)、形狀參數(shù)1.正態(tài)分布(normaldistribution)。記為:§2.3統(tǒng)計(jì)學(xué)中的幾種重要分布

當(dāng)稱為標(biāo)準(zhǔn)正態(tài)分布2.標(biāo)準(zhǔn)正態(tài)分布

-xx0u

/2稱u分布雙側(cè)界值

u

稱u分布單側(cè)界值

右邊與左邊曲線下面積和為α

右邊曲線下面積為α

u

服從參數(shù)為n-1的分布,記.其中參數(shù)n-1稱為自由度(df),它表示上式中自由變化的量的個(gè)數(shù)。3.單組正態(tài)樣本的分布

若為正態(tài)總體的一個(gè)樣本,有服從自由度為n-1的t分布,記為4.單組正態(tài)樣本的t分布

設(shè)為正態(tài)總體的一個(gè)樣本,

則有5.F分布服從自由度為的F分布,

記作設(shè)為總體的樣本,為總體的樣本,樣本方差為,則10

數(shù)理統(tǒng)計(jì)的基本問題是根據(jù)樣本所提供的信息,對總體的分布以及分布的數(shù)字特征作出統(tǒng)計(jì)推斷。參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷區(qū)間估計(jì)點(diǎn)估計(jì)§2.4正態(tài)資料的參數(shù)估計(jì)與假設(shè)檢驗(yàn)一.正態(tài)總體參數(shù)點(diǎn)估計(jì)二.正態(tài)總體參數(shù)區(qū)間估計(jì)三.正態(tài)資料的假設(shè)檢驗(yàn)1.單組正態(tài)資料的假設(shè)檢驗(yàn)2.兩組正態(tài)資料的假設(shè)檢驗(yàn)一.正態(tài)總體參數(shù)點(diǎn)估計(jì)

已知分布的類型,估計(jì)未知參數(shù)。(例如當(dāng),但是未知的,可以用來估計(jì))注:稱為待估計(jì)參數(shù)

稱為估計(jì)值例1開胸順氣丸崩解時(shí)間X~N(μ,σ).隨機(jī)抽取5丸崩解時(shí)間為:36,40,32,41,36(min),作μ及σ2的點(diǎn)估計(jì)。定義:對于給定的,計(jì)算出一個(gè)區(qū)間,使它能夠包含未知的總體參數(shù),則稱此區(qū)間是參數(shù)的置信度為1-α的置信區(qū)間(置信域CI).數(shù)值較小的稱為置信下界(下限)、數(shù)值較大的稱為置信上界(上限)。

二.正態(tài)總體參數(shù)的區(qū)間估計(jì)注:1.置信區(qū)間是總體參數(shù)的估計(jì)范圍,判斷有把握的概率為置信度1-

,犯錯(cuò)誤的概率為顯著水平

2.顯著水平常用

=0.05、

=0.01,也可用

=0.1等

,設(shè)X1,X2,…,Xn

為簡單抽樣樣本,為已知,μ的置信度1-

的置信區(qū)間為例2《傷寒論》中使用桂枝的39張?zhí)幏街?桂枝用量服從σ為3g的正態(tài)分布,根據(jù)樣本均數(shù)8.14g,顯著水平0.05,估計(jì)桂枝用量μ的置信區(qū)間。μ的置信度0.95的置信區(qū)間為=(7.1984,9.0816)

假設(shè)檢驗(yàn)對總體分布中的某些未知參數(shù)或分布的形式作某種假設(shè)然后通過抽取的樣本,對假設(shè)的正確性進(jìn)行判斷的問題例1通宣理肺丸的丸重服從正態(tài)分布。若標(biāo)準(zhǔn)差

=2

mg,規(guī)定標(biāo)準(zhǔn)丸重38

mg。從一批中隨機(jī)抽取

100

丸,樣本均數(shù)=37.5

mg,該批藥丸是否合格.

前提是正態(tài)分布且σ2已知,記μ0=38猜想μ≠μ0反設(shè)μ=μ0,稱為備擇假設(shè)或?qū)α⒓僭O(shè),記作

稱為零假設(shè)或原假設(shè),記作雙側(cè)檢驗(yàn):單側(cè)檢驗(yàn):右檢驗(yàn)單側(cè)檢驗(yàn):左檢驗(yàn)單組正態(tài)資料的假設(shè)檢驗(yàn)1.單組正態(tài)資料的假設(shè)檢驗(yàn)1,設(shè)X1,X2,…,Xn

為簡單抽樣樣本,為已知,H0:μ=μ0

檢驗(yàn)假設(shè)的步驟:1.建立原假設(shè)及備擇假設(shè);2.計(jì)算統(tǒng)計(jì)量;3.給定顯著水平,確定臨界值;4.進(jìn)行比較,得統(tǒng)計(jì)結(jié)論。注:2.顯著性水平的高低表示下結(jié)論的可靠程度的高低。在0.01水平下否定無效假設(shè)的可靠程度為99%,而在0.05水平下否定無效假設(shè)的可靠程度為95%。

1.稱為顯著性水平或檢驗(yàn)水準(zhǔn)。α=0.10,0.05,0.01。3.在P≤α?xí)r,拒絕H0,接受H1

。統(tǒng)計(jì)結(jié)論:“有統(tǒng)計(jì)學(xué)意義”

4.在P>α?xí)r,不能拒絕H0

統(tǒng)計(jì)結(jié)論:“無統(tǒng)計(jì)學(xué)意義”u

/2稱u分布雙側(cè)界值

u

稱u分布單側(cè)界值

右邊與左邊曲線下面積和為α

右邊曲線下面積為α

u例某廠生產(chǎn)一種抗生素,據(jù)經(jīng)驗(yàn),生產(chǎn)正常時(shí),抗生素主要指標(biāo),某天為檢驗(yàn)生產(chǎn)是否正常隨機(jī)抽測50瓶,

測得mg,問該日生產(chǎn)是否正常?工作不正常單側(cè)檢驗(yàn)----右檢驗(yàn)(左檢驗(yàn))例:某藥廠生產(chǎn)某種藥丸,要求有效期不得低于1000

天,現(xiàn)從某一天生產(chǎn)的藥丸中隨機(jī)抽取25丸,測得其有效期平均值為950天。已知該中藥丸的有效期服從標(biāo)準(zhǔn)差為100天的正態(tài)分布,試在顯著水平0.05下檢驗(yàn)這天生產(chǎn)的藥丸有效期的均值是否小于1000天。有效期低前提信息H1H0統(tǒng)計(jì)量方法拒絕域W正態(tài)分布σ2已知≠μ0μ≠μ=μ0雙側(cè)檢驗(yàn)>μ0μ>μ0右側(cè)檢驗(yàn)<μ0μ<μ0左側(cè)檢驗(yàn)正態(tài)分布且σ已知,選用u統(tǒng)計(jì)量稱為均數(shù)μ的u檢驗(yàn)

前提信息H1H0統(tǒng)計(jì)量方法拒絕域W正態(tài)分布σ2未知≠μ0μ≠μ=μ0雙側(cè)檢驗(yàn)>μ0μ>μ0右側(cè)檢驗(yàn)<μ0μ<μ0左側(cè)檢驗(yàn)正態(tài)分布且σ未知,選用t統(tǒng)計(jì)量稱為均數(shù)μ的t檢驗(yàn)

一.SPSS主要窗口1.數(shù)據(jù)編輯窗:主要有建立新的數(shù)據(jù)文件,編輯和顯示已有數(shù)據(jù)文件等功能(由數(shù)據(jù)窗口(DataView)和變量窗口(VariableView)組成)2.結(jié)果輸出窗

利用SPSS軟件進(jìn)行數(shù)據(jù)分析1.將數(shù)據(jù)錄入SPSS并整理加工;2.進(jìn)行必要的預(yù)分析(分布圖、均數(shù)標(biāo)準(zhǔn)差的描述等),以確定應(yīng)采用的檢驗(yàn)方法;3.按題目要求進(jìn)行統(tǒng)計(jì)分析;4.SPSS分析結(jié)果的閱讀和解釋。1.將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存變量類型:數(shù)值型、字符型(String)、日期型(date)數(shù)值型:標(biāo)準(zhǔn)型(Numeric)默認(rèn)寬度(Width):8位=整數(shù)部分+小數(shù)點(diǎn)+小數(shù)部分位數(shù)小數(shù)(decimals):默認(rèn)是2位。字符型(String)輸入變量字符的最大個(gè)數(shù)(Characters):默認(rèn)8位不能參與運(yùn)算、區(qū)分大小寫

數(shù)據(jù)的正態(tài)性檢驗(yàn)493488483490454435412437334495519549525553585632395415451453485481490497503436547524551598400418441451487481492497505512537522554385402411439448490466467498507517546532575593404431446441480465482498505515542536573429443449485468481500510505544534578524449451470470478502512503544525568415458458487471476502517507549524564569541534498515497473475480456456490410461454470473478493514512541544558554378531500509495483470485417500517503534546416520例2.4

某地148名正常人血糖數(shù)據(jù)(單位mmol/l),分析其分布規(guī)律。問題:判斷是否服從正態(tài)分布?1.將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存血糖的正態(tài)性.sav可通過AnalyzeDescriptiveStatistics下的P-PPlots

和Q-QPlots通過qq圖和pp圖判斷正態(tài)性。(越在直線附近正態(tài)性越好)變量窗口定義變量1.將數(shù)據(jù)錄入SPSS并整理加工變量窗口定義變量數(shù)據(jù)窗口錄入數(shù)據(jù)通過“Analyze”|“DescriptiveStatistics”|“Explore”(探索性)2.進(jìn)行必要的預(yù)分析(分布圖、均數(shù)標(biāo)準(zhǔn)差的描述等),以確定應(yīng)采用的檢驗(yàn)方法。主對話框Dependent:因變量列表FactorList:因子列表(分組變量)※

3.通過“Analyze”|“DescriptiveStatistics”|“Explore”(探索性)Statistics(統(tǒng)計(jì)量)二級(jí)對話框“Descriptive”(描述性)可輸出基本統(tǒng)計(jì)量,且可輸出置信區(qū)間范圍“Plot”(繪制)設(shè)置選擇“Normality….”(正態(tài)性檢驗(yàn))分析結(jié)果輸出(均數(shù))(均值的95%的置信區(qū)間)(中位數(shù))(方差)(標(biāo)準(zhǔn)差)(極差)(四分位間距)(偏度)(峰度)結(jié)果分析:值越接近0,正態(tài)性越好。P(sig.)>0.05,則說明滿足正態(tài)性。2024/4/6160血糖值的P-P圖血糖值的Q-Q圖

均數(shù)比較(CompareMeans)1.Means過程2.One-SampleTTest過程3.Independent-SamplesTTest過程4.Paired-SamplesTTest過程Analyze菜單為例,其中最常用的子菜單:

DiscriptiveStatisticsCompareMeansGeneralLinearModelCorrelateRegression(截圖01.jpg)

均數(shù)比較(CompareMeans)菜單AnalyzeCompareMeans

Means過程:對準(zhǔn)備比較的各組計(jì)算描述指標(biāo),進(jìn)行預(yù)分析,也可直接比較。One-SampleTTest過程:進(jìn)行樣本均數(shù)與已知總體※

均數(shù)的比較。

Independent-SamplesTTest過程:進(jìn)行兩樣本均數(shù)差※

別的比較,即通常所說的兩組資料的t檢驗(yàn)。

Paired-SamplesTTest過程:進(jìn)行配對資料的顯著性檢驗(yàn),※即配對t檢驗(yàn)。

One-WayANOVA過程(下章內(nèi)容):進(jìn)行兩組及多組樣※

本均數(shù)的比較,即成組設(shè)計(jì)的方差分析,還可進(jìn)行隨后的兩兩多重比較。

One-SampleTTest過程:進(jìn)行樣本均數(shù)與已知總體均數(shù)的比較(即單個(gè)總體均數(shù)的檢驗(yàn))。

例:正常疫苗平均抗體強(qiáng)度為1.9,已知16人體注射某麻疹疫苗后測得抗體強(qiáng)度為1.2,2.5,1.9,1.5,2.7,1.7,2.2,2.2,3.0,2.4,1.8,2.6,3.1,2.3,2.4,2.1,根據(jù)樣本能否證實(shí)該廠產(chǎn)品的疫苗平均抗體強(qiáng)度仍為1.9?目的:檢驗(yàn)問題:數(shù)據(jù)是否服從正態(tài)分布?是參數(shù)檢驗(yàn)(One-SampleTTest過程)否非參數(shù)檢驗(yàn)“Nonparametrictest”利用第二章的DescriptiveStatisticsExplore(探索性)模塊原理X1,X2,…,Xn為總體X~N(μ,σ2)簡單隨機(jī)樣本

實(shí)現(xiàn)步驟:(2)正態(tài)性檢驗(yàn):Analyze|DescriptiveStatistics|Explore(探索性)將“抗體強(qiáng)度”加入“Depedent”框;選擇“Normality….”(正態(tài)性檢驗(yàn))(1).將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存抗體強(qiáng)度.sav

結(jié)果輸出和討論:分析:由于抗體強(qiáng)度的K.S和S.W對應(yīng)的P值均>0.05,

不拒絕原假設(shè),即認(rèn)為抗體強(qiáng)度數(shù)據(jù)服從正態(tài)分布Q-Q圖(3)參數(shù)檢驗(yàn):菜單“Analyze”|“CompareMeans”|“One-SamplesTTest”【Options鈕】ConfidenceInterval框輸入需要計(jì)算的均數(shù)差值可信區(qū)間范圍,默認(rèn)為95%。【上方Test框】用于選入需要分析的變量?!鞠路絋est框】在此處輸入已知的總體均數(shù),默認(rèn)值為0。本題為1.9點(diǎn)擊【Option鈕】最后點(diǎn)擊【Continue鈕】輸出結(jié)果

結(jié)果輸出和討論:<1>檢驗(yàn):結(jié)論:P=0.024<0.05,拒絕原假設(shè)。<2>若進(jìn)行區(qū)間估計(jì):在【下方Test框】填0,結(jié)論:置信區(qū)間在下為(1.9488,2.5012)問題:1.動(dòng)物實(shí)驗(yàn)來鑒定使用或不使用某種藥物;

2.臨床試驗(yàn)比較新藥和舊藥的療效;

3.制藥工業(yè)中的新舊工藝之間的比較。思路:1.試驗(yàn)分為兩組一組為處理組,一組為對照組;一種為甲種處理,一種為乙種處理;

2.以兩組的數(shù)據(jù)對兩個(gè)總體的參數(shù)作顯著性檢驗(yàn)兩組正態(tài)資料的假設(shè)檢驗(yàn)配對比較的四種情況:

1.同一對象處理前后的數(shù)據(jù)

同一批患者治療前后的某些生理生化指標(biāo),

進(jìn)行比較,以觀察藥物的療效;

2.同一對象兩個(gè)部位的數(shù)據(jù)

同一人或動(dòng)物體的兩側(cè)器官,一側(cè)為對照,

另一側(cè)為藥物處理;

3.同一對象接受兩種不同處理同一樣品分為兩份在不同的條件下進(jìn)行試驗(yàn)。

4.兩個(gè)同質(zhì)對象接受兩種處理動(dòng)物的同源配對試驗(yàn);兩個(gè)正態(tài)總體的配對比較

2.已知假設(shè)兩種處理效果相同,μ1=μ2,即μ1-μ2=0例:某中醫(yī)使用中藥清木香治療高血壓患者,治療前后的情況,對比如表,問該中藥治療高血壓是否有效舒張壓(kPa)治療前治療后

差數(shù)d

清木香有降壓作用

Paired-SamplesTTest過程:進(jìn)行配對資料的顯著性檢驗(yàn),即配對t檢驗(yàn)。

用于檢驗(yàn)兩個(gè)相關(guān)樣本是否來自相同均值的正態(tài)總體例:一種新上市的減肥茶需要做市場調(diào)查,對35個(gè)消費(fèi)者進(jìn)行了測試,分別統(tǒng)計(jì)了這35個(gè)受試者服用減肥茶前后的體重?cái)?shù)據(jù),形成35個(gè)配對,試說明減肥茶是否有效。服藥前7595829110087919086879888服藥后71.59080.38793.675.4677387.3829485.9828792939584838987908295857988.59087.780797185896767服藥前服藥后818386939596978188859579757484.990.49387787874.986服藥前服藥后目的:檢驗(yàn)問題1:兩組數(shù)據(jù)是否均服從正態(tài)分布?是否非參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)(Paired-SamplesTTest過程)

操作步驟:(2)正態(tài)性檢驗(yàn):AnalyzeDescriptiveStatisticsExplore(探索性)(1).將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存減肥茶配對比較.sav分析結(jié)論:可以認(rèn)為服從正態(tài)分布(3)檢驗(yàn)利用Paired-SamplesTTest過程菜單“Analyze”|“CompareMeans”|“Paired-SamplesTTest”命令【PairedVariable框】:用于選入希望進(jìn)行比較的一對或幾對變量。注意:這里的量詞是“對”而不是“個(gè)”。選入變量需要成對的選入,選中兩個(gè)成對變量,再單擊

將其選入。如果只選中一個(gè)變量,則

按鈕為灰色,不可用。同時(shí)選中“服用減肥茶的體重”和“服用減肥茶后的體重”兩個(gè)變量,按選入【PairedVariables框】before-after點(diǎn)擊【Options鈕】【Options鈕】和One-SamplesTTest對話框的

Options鈕完全相同,根據(jù)置信區(qū)間要求的顯著水平選擇。點(diǎn)擊【OK鈕】得到輸出結(jié)果

輸出結(jié)果和分析:

分析:從直觀上可以看出受試者體重在服用減肥茶前后是有差異的分析:相關(guān)系數(shù)(C)為0.559,P≈0.00048<0.01,說明兩個(gè)變量之間高度相關(guān)。

結(jié)果輸出和分析:分析:變量before和變量after相減后的平均值(mean)為

7.2471,95%的置信區(qū)間為(4.94622,9.54521)配對檢驗(yàn)t值為6.404,P=0.000<0.01,拒絕原假設(shè),可以認(rèn)為兩變量間差異有極顯著意義,認(rèn)為減肥茶的效果是極顯著的。優(yōu)點(diǎn):減少試驗(yàn)中個(gè)體差異,體現(xiàn)試驗(yàn)本質(zhì)。缺點(diǎn):有時(shí)配對不便。

成組比較(兩獨(dú)立樣本比較):不易于配對比較,或比較不同種樣品、藥品的療效成分含量時(shí)可以作組與組比較。

Independent-SamplesTTest過程:進(jìn)行兩樣本均數(shù)差別的比較,即通常所說的兩組資料的t檢驗(yàn)。例:某克山病區(qū)測得11例克山病患者與13名健康人的血磷值(mmol/L)如下,問該地急性克山病患者與健康人的血磷值是否不同?患者:0.841.051.201.201.391.531.671.801.872.072.11健康人:0.540.640.640.750.760.811.161.201.341.351.481.561.87特點(diǎn):兩變量間是獨(dú)立關(guān)系目的:檢驗(yàn)問題1:數(shù)據(jù)是否服從正態(tài)分布?是否非參數(shù)檢驗(yàn)(“Nonparametrictest”)參數(shù)檢驗(yàn)(Independent-SamplesTTest過程)(1).載入數(shù)據(jù)“1.1克山病.sav”菜單“File”|“Open”|“data”|選入“1.1克山病.sav”截圖05.jpg(2)正態(tài)性檢驗(yàn):分析:無論患者組還是健康組P>0.05,所以可以認(rèn)為服從正態(tài)分布(3)檢驗(yàn)利用Independent-SamplesTTest過程菜單“Analyze”|“CompareMeans”|“Independent-SamplesTTest

”命令A(yù)nalyze|DescriptiveStatistics|Explore(探索性)

結(jié)果輸出和討論:【Cutpoint框】用于連續(xù)型的定距型變量。輸入分割點(diǎn),大于該值一組,小于該值另一組?!綩ptions鈕】和One-SamplesTTest對話框的Options鈕完全相同截圖06-09.jpg【Test框】用于選入需要分析的變量。【Groups框】用于選入分組變量。注意選入變量后還要定義需比較的組別

結(jié)果輸出和討論:結(jié)論:F=0.032,P=0.86>0.05,認(rèn)為方差齊。又因?yàn)閠=2.524,P=0.019<0.05,所以拒絕原假設(shè),認(rèn)為患者組和健康組的血磷值有顯著性不同。練習(xí)1:試比較例3-1中不同年齡同學(xué)的體重的平均值和標(biāo)準(zhǔn)差。例為研究乙醇濃度對提取浸膏量的影響,某中藥廠取乙醇50%、60%、70%、90%、95%五個(gè)濃度作試驗(yàn),判斷五個(gè)濃度所得浸膏量是否不同。水平觀測值50%60%70%90%95%6767554260695035796481709070798898969166因素:在試驗(yàn)過程中,影響試驗(yàn)結(jié)果的條件叫做因素(因子)常用大寫字母A,B,C表示。…水平:把因素在試驗(yàn)中可能處的狀態(tài)稱做因素的水平.常用表示該因素的字母加上足標(biāo)表示。方差分析的適用范圍

在生產(chǎn)和科學(xué)實(shí)驗(yàn)中,影響結(jié)果的因素往往有很多。要知道哪個(gè)因素對結(jié)果有顯著的影響時(shí)用方差分析。方差分析用于兩個(gè)及兩個(gè)以上總體均值差異的顯著性檢驗(yàn)。4.若拒絕了原假設(shè)進(jìn)一步作兩兩間多重比較:LSD-t檢驗(yàn),Dunnett-t檢驗(yàn),SNK-q檢驗(yàn)。方差分析表方差F值拒絕域方差來源離差平方和組間組內(nèi)總和自由度1.先進(jìn)行正態(tài)性檢驗(yàn)方差分析的步驟2.進(jìn)行方差齊性檢驗(yàn)(Bartlett卡方檢驗(yàn)法、Levene檢驗(yàn))3.進(jìn)行方差分析,給出方差分析表結(jié)論:當(dāng)統(tǒng)計(jì)量時(shí),則拒絕假設(shè),

認(rèn)為在顯著水平下,因素各水平間差異有顯著意義,否則,不拒絕假設(shè),認(rèn)為水平間差異沒有顯著意義。稱為組內(nèi)離差平方和稱為組間離差平方和組間方差和組內(nèi)方差分別為LSD-t法(最小顯著性差異法(事前多重比較檢驗(yàn)法)):

H0:μi=μj,

檢驗(yàn)與是否相同的多重比較檢驗(yàn)法Dunnett-t法(新復(fù)極差法):多個(gè)實(shí)驗(yàn)組與一個(gè)對照組比較的多重比較檢驗(yàn)法H0:μi=SNK-q法:(Student,Newma,Keuls姓氏縮寫)H0:μi=μj檢驗(yàn)μi與μj是否相同的多重比較檢驗(yàn)法(事后多重比較檢驗(yàn)法)3.2SPSS實(shí)現(xiàn)單因素方差分析的方法※

One-WayANOVA過程(單因素簡單方差分析)【菜單“Analyze”|“CompareMeans”】Univariate過程(單變量多因素方差分析)【菜單“Analyze”|“GeneralLinearModel”】Multivariate過程(多變量多因素方差分析)RepeatedMeasure過程(重復(fù)測量方差分析)VarianceComponent過程(方差估計(jì)分析)One-WayANOVA過程(單因素簡單方差分析)用于進(jìn)行兩組以上樣本均數(shù)的比較,即成組設(shè)計(jì)的方差分析。如果做了相應(yīng)選擇,還可進(jìn)行隨后的兩兩比較。例3-1某研究者擬探討枸杞多糖(LBP)對酒精性脂肪肝(AFL)大鼠GSH的影響,將36只大鼠隨機(jī)分成甲、乙、丙三組,甲組為正常組12只,其余24只用乙醇灌胃10周造成慢性AFL模型后,隨機(jī)分成兩組,乙(LBP治療組)12只,丙(戒酒組)12只,8周后測量GSH值,問三種處理方式大鼠的GSH值是否相同。目的:檢驗(yàn)問題:數(shù)據(jù)是否服從正態(tài)分布(需提前進(jìn)行)?方差是否齊?是參數(shù)檢驗(yàn)(One-WayANOVA過程)否數(shù)據(jù)轉(zhuǎn)換或進(jìn)行非參數(shù)檢驗(yàn)否是是否拒絕結(jié)束進(jìn)行多重檢驗(yàn)

實(shí)現(xiàn)步驟:(1).將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存Group,GSH保存為:“GSH.sav”(2)正態(tài)性檢驗(yàn):Analyze|DescriptiveStatistics|Explore(探索性)將“GSH”加入“Depedent”框;“Group”加入“FactorList”框。選擇“Normality….”(正態(tài)性檢驗(yàn))

結(jié)果輸出和討論:分析:可見無論是K.S檢驗(yàn)還是S.W檢驗(yàn)GSH值

P>0.05,所以GSH值數(shù)據(jù)均服從正態(tài)分布。(3)One-WayANOVA過程(單因素方差分析)(在此步將進(jìn)行方差齊性檢驗(yàn)、方差分析和多重檢驗(yàn))菜單“Analyze”|“CompareMeans”|“One-WayANOVA”菜單“Analyze”|“CompareMeans”|“One-WayANOVA”將“GSH”加入上方“DepedentList”框;“Group”加入下方“Factor”框。【Factor框】【DependentList框】選入需要分析的因變量,可選入多個(gè)結(jié)果變量。選入需要比較的分組因素,只能選入一個(gè)?!綜ontrast鈕】用于對精細(xì)趨勢檢驗(yàn)和精確兩兩比較的選項(xiàng)進(jìn)行定義,較少使用。點(diǎn)擊“PostHoc”鈕【PostHocMultipleComparisons對話框】用于選擇進(jìn)行各組間兩兩比較的方法【EqualVariancesAssumed復(fù)選框組】

當(dāng)各組方差齊時(shí)可用的兩兩比較方法

(14種)常用:LSD、S-N-KBonferroni、Turkey、Sheffe、Dunnett方法。勾選“LSD”,點(diǎn)擊“Continue”返回【EqualVariancesNotAssumed復(fù)選框組】當(dāng)各組方差不齊時(shí)可用的兩兩比較方法,共有4種.(一般認(rèn)為“Game-Howell”方法較好,但由于統(tǒng)計(jì)學(xué)對此尚無定論,所以建議方差不齊時(shí)使用非參數(shù)方法。)點(diǎn)擊“Option”鈕【Statistics復(fù)選框組】

常用【Descriptive】統(tǒng)計(jì)描述【Homogeneity-of-variance】

方差齊性檢驗(yàn)?!綧eansplot復(fù)選框】用各組均數(shù)做圖,以直觀的了解它們的差異?!綧issingValues單選框組】

定義分析中對缺失值的處理方法勾選“Descriptive”、

“Homogeneity-of-variance”、“Meansplot”三項(xiàng)?!獭獭厅c(diǎn)擊“Continue”鈕返回點(diǎn)擊“OK”鈕輸出結(jié)果

結(jié)果輸出和討論:分析:得出各組的均數(shù)、標(biāo)準(zhǔn)差、均數(shù)標(biāo)準(zhǔn)誤、均數(shù)的95%的置信區(qū)間,還有最小值、最大值。方差齊性檢驗(yàn)分析:統(tǒng)計(jì)量值為0.015,P=0.985>0.5,不拒絕原假設(shè),即可以認(rèn)為方差齊的。(因?yàn)橐炎C明了各水平既服從正態(tài)分布又是方差齊的,所以可以進(jìn)行方差分析)方差分析表分析:F=23.845,P=0.000<0.05,拒絕原假設(shè),即可以認(rèn)為三種處理方式大鼠的GSH值不全相等。LSD法進(jìn)行多重檢驗(yàn)分析:可見戒酒組大鼠的GSH值與正常組大鼠的GSH值差異是顯著的,戒酒組大鼠的GSH值與LBP治療組GSH值差異顯著。均數(shù)分布圖3.3兩因素的方差分析(Two-wayANOVA)Univariate子過程(單變量多因素方差分析)】

【菜單“Analyze”|“GeneralLinearModel”|=SSe+SSA+SSB

基本原理:=SSe+SSA+SSB+SSA×B或H0A:μ1=μ2=…=μrH0B:τ1=τ2=…=τs案例2:對8窩小白鼠,每窩各取同體重的3只,分別喂A,B,C三種不同的營養(yǎng)素,三周后體重增量結(jié)果如表所示,試判斷不同營養(yǎng)素和不同窩的小白鼠體重增量是否不同。水平12345678ABC50.1047.8053.1063.5071.2041.4061.9042.2058.2048.5053.8064.2068.4045.7053.0039.8064.5062.4058.6072.5079.3038.4051.2046.2053.9053.9559.1457.6052.9055.1766.7372.9741.8355.3742.73

目的:檢驗(yàn)H0A:μ1=μ2=…=μr問題:數(shù)據(jù)是否服從正態(tài)分布?(各因素下進(jìn)行)是參數(shù)檢驗(yàn)(Univariate子過程)否數(shù)據(jù)轉(zhuǎn)換或進(jìn)行非參數(shù)檢驗(yàn)否是是否拒絕H0A結(jié)束進(jìn)行相應(yīng)因素下的多重檢驗(yàn)各因素下方差是否齊?和H0BH0B:τ1=τ2=…=τs操作步驟:Univariate子過程(單變量多因素方差分析)】

【菜單“Analyze”|“GeneralLinearModel”|(1).將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存保存為:“3.2兩因素方差分析數(shù)據(jù).sav”變量名:體重、不同營養(yǎng)素(1:甲素、2:乙素、3:丙素)分窩(1-8:1窩-8窩)(2)正態(tài)性檢驗(yàn):Analyze|DescriptiveStatistics|Explore(探索性)不同營養(yǎng)素下正態(tài)性檢驗(yàn)結(jié)果:

結(jié)果輸出和討論:不同窩下正態(tài)性檢驗(yàn)結(jié)果:

有四種不同來源的家兔4只,在同一室溫下,測其血糖值,以每100ml血中含葡萄糖的mg表示,(mg%),試判斷不同來源的家兔其正常血糖值之間有無差異.家兔IIIIIIIV來源1234

為考察工藝對花粉中的氨基酸百分含量的影響,某藥廠用四種不同工藝對花粉進(jìn)行處理,測得氨基酸百分含量如下表,試判斷四種不同工藝處理間的氨基酸百分比含量有無顯著差異。試驗(yàn)號(hào)酸處理堿處理破壁水浸后醇提為研究乙醇濃度對提取浸膏量的影響,某中藥廠取乙醇50%、60%、70%、90%、95%五個(gè)濃度作試驗(yàn),判斷五個(gè)濃度所得浸膏量是否不同。水平觀測值50%60%70%90%95%6767554260695035796481709070798898969166進(jìn)行Shapiro-Wilk正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)、方差分析、LSD多重檢驗(yàn),并給出各組均數(shù)的散點(diǎn)圖。最后寫出相應(yīng)結(jié)論。某醫(yī)院用三種不同療法治療同種疾病,以體溫降至正常所需要的天數(shù)為指標(biāo),15例患者體溫降至正常所需要的天數(shù)資料如下,試問:治療方法的不同對患者體溫的療效是否有顯著影響?例數(shù)甲法乙法丙法15572559357947795779平均天數(shù)5.86.68.6考察溫度對某藥物有效成分得率的影響,選了五種不同的溫度,在同意溫度下各做了三次實(shí)驗(yàn),結(jié)果見表,試問溫度的不同是否影響該成分的得率?溫度編號(hào)

60oC65oC70oC75oC80oC190979684842929396838638892938882平均得率9094958584

為考察中藥葛根對心臟功能的影響,配制每100ml含葛根1g,1.5g,3g,5g的藥液,用來測定大鼠離體心臟在藥液中7—8分鐘時(shí)間內(nèi)心臟冠脈血流量,數(shù)據(jù)如下:試推斷葛根對心臟功能是否有顯著影響?例1:某醫(yī)院收得乙型腦炎重癥病人204例,隨機(jī)分成兩組,分別用同樣的中草藥方劑治療,但其中一組加一定量的人工牛黃,每個(gè)病人根據(jù)治療方法和治療效果進(jìn)行分類,得出如下表格:4.1列聯(lián)表原理療法

療效合計(jì)治愈未愈不加牛黃324678加牛黃7650126合計(jì)10896204列聯(lián)表:觀測數(shù)據(jù)按兩個(gè)或更多屬性(定性變量)分類時(shí)所列出的頻數(shù)表。R×C列聯(lián)表:分類頻數(shù)排成R行C列的列聯(lián)表。2×2表:二行二列的列聯(lián)表,又稱四格表。列聯(lián)表分析:使用列聯(lián)表進(jìn)行分類資料的檢驗(yàn)?!p向無序單向有序雙向有序且屬性不同列聯(lián)表雙向有序且屬性相同設(shè)不加牛黃組治愈總體率為,加牛黃組治愈總體率為檢驗(yàn)即“療法”與“療效”獨(dú)立

1.雙向無序表獨(dú)立性檢驗(yàn)雙向無序列聯(lián)表:兩個(gè)分類變量分類標(biāo)志無數(shù)值大小與先后順序之分。療法

療效合計(jì)治愈未愈不加牛黃324678加牛黃7650126合計(jì)10896204若拒絕H0:X與Y獨(dú)立(即兩組總體率相同)

實(shí)際頻數(shù)Oij與理論頻數(shù)Eij的差異是隨機(jī)誤差,用Pearson卡方統(tǒng)計(jì)量

反映實(shí)際Oij與理論Eij吻合程度注意:上述檢驗(yàn)適用于雙向無序的表(df≠1)

分組標(biāo)志無數(shù)量大小和先后順序之分。分析的目的是考察兩個(gè)屬性之間是否獨(dú)立。

療效療法

中醫(yī)

西醫(yī)痊愈顯效合計(jì)687372638835好轉(zhuǎn)無:2.若R×C列聯(lián)表中理論頻數(shù)出現(xiàn)小于1,或理論頻數(shù)出現(xiàn)小于5的格數(shù)超過總格數(shù)1/5時(shí),必須增大樣本例數(shù);

或把理論頻數(shù)太小的行,列與性質(zhì)相近的鄰行,列合并;

或刪去理論頻數(shù)太小的行,列。最小理論頻數(shù)=最小行合計(jì)頻數(shù)﹒最小列合計(jì)頻數(shù)/總頻數(shù)1.雙向無序列聯(lián)表計(jì)算卡方統(tǒng)計(jì)量常用單側(cè)檢驗(yàn)。3.多個(gè)總體率比較的卡方檢驗(yàn),若結(jié)論為拒絕原假設(shè),只能認(rèn)為總體率之間不全等,不能說明任意兩個(gè)總體率有無差別,需做多重比較。例:判斷患鼻咽癌與血型有無關(guān)系分類A型血B型血O型血AB型血合計(jì)患癌者648613020300健康人12513821026499合計(jì)18922434046799第一行合計(jì)數(shù),第四列合計(jì)數(shù)最小,最小理論頻數(shù)H0:“患癌”與“血型”獨(dú)立,H1:“患癌”與“血型”不獨(dú)立df=(2-1)(4-1)=3,單側(cè)概率P>0.05,不能以α=0.05水準(zhǔn)的單側(cè)檢驗(yàn)拒絕H0,總體率的差異無統(tǒng)計(jì)意義,不能認(rèn)為患鼻咽癌與血型不獨(dú)立。2.四格表獨(dú)立性檢驗(yàn)

例1:某醫(yī)院收得乙型腦炎重癥病人204例,隨機(jī)分成兩組,分別用同樣的中草藥方劑治療,但其中一組加一定量的人工牛黃,每個(gè)病人根據(jù)治療方法和治療效果進(jìn)行分類,得出如下表格:療法

療效合計(jì)治愈未愈不加牛黃324678加牛黃7650126合計(jì)10896204雙向無序四格表(1)N≥40,理論頻數(shù)≥5(2)N≥40,理論頻數(shù)小于5(但≥1),用校正卡方統(tǒng)計(jì)量(3)N<40或理論頻數(shù)小于1,不能使用卡方檢驗(yàn),應(yīng)使用Fisher精確檢驗(yàn),稱為四格表確切概率法。列聯(lián)表的原假設(shè)是兩個(gè)變量X和Y相互獨(dú)立,計(jì)算卡方統(tǒng)計(jì)量,當(dāng)此統(tǒng)計(jì)量很大時(shí)否定原假設(shè)。df=1

療法

療效合計(jì)治愈未愈不加牛黃324678加牛黃7650126合計(jì)10896204“療法”與“療效”獨(dú)立(即兩組治愈率相同)N=204>40統(tǒng)計(jì)結(jié)論:“療法”與“療效”不獨(dú)立(即兩組治愈率不同)專業(yè)結(jié)論:加人工牛黃組療效高于不加人工牛黃組的療效。4.2Crosstabs過程例:調(diào)查339名50歲以上的人的吸煙習(xí)慣與患慢性氣管炎病的數(shù)據(jù)而建立如下列聯(lián)表,試探討吸煙與患慢性氣管炎之間的關(guān)系。組別吸煙不吸煙患病組4313健康組162121目的:檢驗(yàn)變量X與Y是獨(dú)立的輸入數(shù)據(jù)個(gè)案加權(quán)列聯(lián)表分析(weight

by

cases過程)結(jié)果分析(Crosstabs過程)

實(shí)現(xiàn)步驟:(1).將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存smoke:吸煙情況;result:結(jié)果;count:頻數(shù);保存為:“吸煙與慢性支氣管炎的關(guān)系.sav”(2).個(gè)案加權(quán)在SPSS系統(tǒng)中,列聯(lián)表的輸入多采用頻數(shù)表格的方式,如果要對此類數(shù)據(jù)進(jìn)行卡方分析等,必須采用個(gè)案加權(quán)(weight

by

cases)進(jìn)行數(shù)據(jù)處理后才能使用相關(guān)的統(tǒng)計(jì)方法。菜單“Data”|“WeightCases”命令點(diǎn)擊“WeightCasesby單選框”,選中“Freqency”:選入“頻數(shù)[count]”。單擊OK鈕菜單“Analyze”|“DescriptiveStatistics”|“Crosstabs”命令(3)列聯(lián)表分析將“結(jié)果[result]”點(diǎn)入“Row(s)”框,將“吸煙情況[smoke]”點(diǎn)入“Cloumn(s)”框。點(diǎn)擊“Statistics”鈕。

【Statistics鈕】用于定義所需計(jì)算的統(tǒng)計(jì)量。點(diǎn)擊“Chi-square復(fù)選框”,計(jì)算值

;選擇“Nominal”里的“ContingencyCoefficient”計(jì)算Pearson列聯(lián)相關(guān)系數(shù)。點(diǎn)擊“continue”鈕回到上一對話框點(diǎn)擊”Cells”按鈕【Cells按鈕】:用于定義列聯(lián)表單元格中需要計(jì)算的指標(biāo)。勾選“Counts復(fù)選框組”中的輸出實(shí)際觀察數(shù)“Observed”和理論數(shù)“Expected”選擇“Percentages”里的“column”計(jì)算列百分比。點(diǎn)擊“Continue”按鈕返回上一層對話框。點(diǎn)擊”O(jiān)K”按鈕

結(jié)果輸出和討論:分析:處理記錄缺失值情況報(bào)告,可見所有數(shù)據(jù)均是有效值。分析:給出了2×2列聯(lián)表,其中表中給出了實(shí)際觀測值和理論值。不吸煙者的患癌率9.7%吸煙者的患癌率21.0%給出了4種檢驗(yàn)方法的結(jié)論。其中,1)PearsonChi-Square

即常用的卡方檢驗(yàn)2)ContinuityCorrection

連續(xù)性校正的卡方值

3)LikelihoodRatio

似然比卡方檢驗(yàn)4)Fisher'sExactTest:Fisher's確切概率法(N≥40,理論頻數(shù)≥5)(N≥40,理論頻數(shù)小于5(但≥1))(N<40或理論頻數(shù)小于1)分析:由于最小理論值為22.14,N=339>40,所以選用普通的卡方檢驗(yàn)。所以有理由拒絕吸煙與患病是獨(dú)立的原假設(shè),即認(rèn)為吸煙與患支氣管炎是有關(guān)的。計(jì)算Pearson列聯(lián)相關(guān)系數(shù)r=0.147例:甲乙兩種療法治療某病,問兩法療效有無差別組別有效無效合計(jì)甲法14115乙法7310合計(jì)21425N=25<40,F(xiàn)isher'sExactTest:Fisher's確切概率法H0:“方法”與“療效”獨(dú)立,H1:“方法”與“療效”不獨(dú)立

雙向有序表的檢驗(yàn)例:用甲乙兩種方法檢查鼻咽癌患者93例,兩法都是陽性的45例,都是陰性的20例,甲法陽性但乙法陰性的22例,甲法陰性但乙法陽性的6例。組別乙+乙-合計(jì)甲+452267甲-62026合計(jì)5142931.雙向有序且屬性相同表(配對四格表)的檢驗(yàn)

兩個(gè)分類變量的標(biāo)志完全一樣且有序排列相同,是相關(guān)樣本數(shù)據(jù)構(gòu)成的列聯(lián)表。O12+O21≥40用吻合卡方統(tǒng)計(jì)量,df=1O12+O21<40用校正卡方統(tǒng)計(jì)量,df=1吻合性檢驗(yàn)或McNemar檢驗(yàn):H0:“方法”與“陽率”獨(dú)立,H1:“方法”與“陽率”不獨(dú)立df=1,查統(tǒng)計(jì)用表,χ2>6.6349=χ20.01(1),單側(cè)概率P<0.01,以

=0.01水準(zhǔn)的單側(cè)檢驗(yàn)拒絕H0,只能認(rèn)為“方法”與“陽性率”不獨(dú)立

差異有統(tǒng)計(jì)意義,認(rèn)為甲法的陽性檢出率高于乙法O12+O21=22+6=28<40,使用校正卡方檢驗(yàn)一致性檢驗(yàn)(Kappa檢驗(yàn))

:觀察一致率:兩種分類結(jié)果一致的觀察頻數(shù)理論一致率:兩種分類結(jié)果一致的理論頻數(shù)K=1,說明兩種分類結(jié)果完全一致K0.75,說明一致程度相當(dāng)滿意。K0.4,說明一致程度尚可。K=0,說明兩次判斷的結(jié)果是機(jī)遇造成的。菜單“Analyze”|“DescriptiveStatistics”|“Crosstabs”命令例:用腦神經(jīng)生成素方案治療急性腦出血所致腦神經(jīng)功能障礙,判斷三種方案的療效有無差異。2.雙向有序且屬性不同表的檢驗(yàn)

用藥基本痊愈顯著好轉(zhuǎn)無效合計(jì)A(5-7天)57108B(10-12天)91074C(21-30天)161031好轉(zhuǎn)單向有序R×C表,兩個(gè)分類變量一個(gè)無序,另一個(gè)有序。雙向有序且屬性不同的R×C表,兩個(gè)分類變量均有序但屬性不同,不宜用卡方檢驗(yàn),應(yīng)選用與有序性有聯(lián)系的對應(yīng)分析或線性趨勢檢驗(yàn)(或后面學(xué)習(xí)的非參數(shù)檢驗(yàn))。分組變量有序(如年齡),指標(biāo)變量無序(如傳染病類型),用卡方檢驗(yàn)分析不同年齡組傳染病的構(gòu)成。分組變量無序(如療法),指標(biāo)變量有序(如療效)用Ridit分析或非參數(shù)秩和檢驗(yàn)分析不同療法的療效。例測某地10名三歲兒童的體重X(kg)與體表面積Y(10-1m2),體重11.011.812.012.313.113.714.414.915.216.0體表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411判斷X和Y是否是線性相關(guān)的。5.1相關(guān)分析原理1.直線相關(guān):(1)兩個(gè)變量均服從正態(tài)分布

總體相關(guān)系數(shù):樣本相關(guān)系數(shù):r絕對值愈接近1,兩個(gè)變量間的線性相關(guān)越密切r絕對值越接近0,兩個(gè)變量間的線性相關(guān)越不密切性質(zhì):Pearson簡單相關(guān)分析相關(guān)系數(shù)的檢驗(yàn)原假設(shè)則:()×(2)如果不服從正態(tài)分布,則應(yīng)考慮變量變換,或采用等級(jí)相關(guān)來分析。Spearman等級(jí)相關(guān)Kendall等級(jí)相關(guān)注:列聯(lián)表可用“Crosstabs過程”中的“ContingencyCoefficient”

計(jì)算Pearson列聯(lián)相關(guān)系數(shù)2.曲線相關(guān):兩變量存在相關(guān)趨勢,但非線性,而是呈某種可能的曲線趨勢。一般都先將變量變換,再將趨勢變換為直線來分析,或者采用曲線回歸方法來分析。5.2Bivariate過程例某次體檢中抽取12名學(xué)生的體重和血壓,現(xiàn)通過相關(guān)分析過程來觀測學(xué)生的體重與血壓是否相關(guān)?體重68485660835662597758血壓95988796110155135128113168目的:檢驗(yàn)問題:兩變量數(shù)據(jù)是否服從正態(tài)分布?(需提前進(jìn)行)是Pearson相關(guān)分析否數(shù)據(jù)轉(zhuǎn)換或進(jìn)行等級(jí)相關(guān)分析

實(shí)現(xiàn)步驟:1.將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存weight:體重;pressure:血壓;保存為:“體重與血壓.sav”2.正態(tài)性檢驗(yàn):Analyze|DescriptiveStatistics|Explore(探索性)可以認(rèn)為體重值、血壓值服從正態(tài)分布?!綱ariables框】用于選入需要進(jìn)行相關(guān)分析的變量,至少需要選入兩個(gè)?!綜orrelationCoefficients

復(fù)選框組】用于選擇需要計(jì)算的相關(guān)分析指標(biāo)?!綟lagsignificantcorrelations】用于確定是否在結(jié)果中用星號(hào)標(biāo)記有統(tǒng)計(jì)學(xué)意義的相關(guān)系數(shù),一般選中。此時(shí)P<0.05的系數(shù)值旁會(huì)標(biāo)記一個(gè)星號(hào),P<0.01的則標(biāo)記兩個(gè)星號(hào)。將“體重[weight]”、“血壓[pressure]”點(diǎn)入“Variables”框,點(diǎn)擊“Options”按鈕。

3.相關(guān)分析過程菜單“Analyze”|“Correlate

”|“Bivariate”命令【Options鈕】彈出Options對話框,選擇需要計(jì)算的描述統(tǒng)計(jì)量和統(tǒng)計(jì)分析:選擇“Meansandstandarddeviations”,點(diǎn)擊“Continue”返回上一層對話框。點(diǎn)擊“OK”按鈕

結(jié)果輸出和討論:分析:左圖給出了體重和血壓的平均值、標(biāo)準(zhǔn)差和樣本數(shù)目。分析:Pearson相關(guān)系數(shù)r為-0.112,即兩者是微弱相關(guān)的,但P=0.728>0.05,所以不能認(rèn)為二者相關(guān)。即不存在直線相關(guān)關(guān)系。(反映了觀測值總的分散程度)(回歸平方和

)反映了回歸值的分散程度(由于線性影響引起的離散性)(剩余平方和)反映了觀測值偏離回歸直線的程度(由于隨機(jī)誤差引起的離散性)5.3回歸分析原理F檢驗(yàn):

H0:β=0()當(dāng)時(shí):或決定系數(shù)R2=SS回/SS總=1-SS剩/SS總

0≤R2≤1,越接近于1,回歸效果越好。臨床:R2≥0.7就認(rèn)為回歸效果不錯(cuò)高精度醫(yī)藥實(shí)驗(yàn)研究:R2>0.9R2=r2一元線性回歸方程中:越接近于1,回歸效果越好。校正決定系數(shù)1-MS剩/MS總例測某地10名三歲兒童的體重X(kg)與體表面積Y(10-1m2),體重11.011.812.012.313.113.714.414.915.216.0體表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411做體表Y關(guān)于體重X的回歸方程。做散點(diǎn)圖建立回歸方程并檢驗(yàn)

實(shí)現(xiàn)步驟:保存為:“體重與體表.sav”x:體重;y:體表;1.將數(shù)據(jù)錄入SPSS并整理加工定義變量輸入數(shù)據(jù)保存2.利用Scatter/Dot命令做散點(diǎn)圖菜單“Graphs”|“LegacyDialogs”|“Scatter/Dot”點(diǎn)擊“simple

scatter”命令,點(diǎn)擊“Define”按鈕。將“體重[x]”變量選入“XAxis”框,將“體表[y]”選入“YAxis”框中,點(diǎn)擊“OK”按鈕輸出結(jié)果。(2)正態(tài)性檢驗(yàn):Analyze|DescriptiveStatistics|Explore(探索性)3.Regression過程菜單“Analyze”|“Regression

”|“l(fā)inear”命令將“體表[y]”選入【Dependent框】;將“體重[x]”選入【Independent(s)框】中,點(diǎn)擊“Statistics”按鈕Enter

強(qiáng)迫進(jìn)入Stepwise

逐步回歸Remove

只出不進(jìn)Backward

向后剔除,只出不進(jìn)Forward

向前選擇,只進(jìn)不出【Modelfit】輸出復(fù)相關(guān)系數(shù)R,其平方,校正決定系數(shù)和標(biāo)準(zhǔn)差,以及方差分析表。選擇“Estimates”、“Confidenceinterval”、“Modelfit”、“Descriptives”,點(diǎn)擊“continue”返回?!綞stimates】

輸出有關(guān)回歸系數(shù)和相關(guān)測量【Confidenceinterval】輸出回歸系數(shù)95%的置信區(qū)間【Descriptives】描述性統(tǒng)計(jì)量點(diǎn)擊“OK”按鈕輸出結(jié)果分析:給出了體表和體重的均數(shù)和標(biāo)準(zhǔn)差情況。分析:此表給出了體重和體表的相關(guān)系數(shù)陣和P值。

結(jié)果輸出和討論:分析:R=0.918(即相關(guān)系數(shù)r),決定系數(shù)校正的決定系數(shù)為0.823,估計(jì)值的標(biāo)準(zhǔn)誤差為0.17434分析:可見回歸平方和為1.301,剩余平方和為0.243,F(xiàn)=42.798,P=0.000<0.05,拒絕原假設(shè),認(rèn)為是線性相關(guān)的,即回歸方程有意義。分析:非標(biāo)準(zhǔn)化系數(shù),t統(tǒng)計(jì)量分別為5.616和6.542,其P值分別為0.001和0.000,均小于0.005,有顯著性意義。其回歸方程為

多元線性回歸分析

研究在線性相關(guān)條件下,兩個(gè)或兩個(gè)以上自變量對一個(gè)因變量的數(shù)量變化關(guān)系,稱為多元線性回歸分析。多元線性回歸模型是一元線性回歸模型的擴(kuò)展,其基本原理與一元線性回歸模型類似,在計(jì)算上更為復(fù)雜,一般需借助計(jì)算機(jī)來完成。是偏回歸系數(shù)編號(hào)載脂蛋白AI(mg/dl)載脂蛋白B(mg/dl)載脂蛋白E(mg/dl)載脂蛋白C(mg/dl)膽固醇含量(mg/dl)11731067.014.76221391326.417.84331981126.916.78141181387.115.7395139948.613.651617516012.120.365713115411.221.54081581419.729.642有研究認(rèn)為血清中高密度脂蛋白降低是引起動(dòng)脈硬化的一個(gè)重要原因,現(xiàn)測量了30名被懷疑患有動(dòng)脈硬化的就診患者的載脂蛋白AⅠ、載脂蛋白B、載脂蛋白E、載脂蛋白C和高密度脂蛋白中的膽固醇含量,資料見表,分析四種載脂蛋白對高密度脂蛋白中膽固醇含量的影響。91581377.418.256101321517.517.237111621106.015.9701214411310.142.841131621377.220.756141691298.516.758151291386.310.1471616614811.533.449171851186.017.569181551216.120.457191751114.127.274201361109.426.039211531338.516.965221101499.524.74023160865.310.857241121238.016.634251471108.518.454262041226.121.072271311026.613.451281701278.424.7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論