




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第四章 定量資料的統(tǒng)計描述第四章 定量資料的統(tǒng)計描述 【習(xí)題解析】一、思考題1. 均數(shù)、中位數(shù)、幾何均數(shù)三者的相同點是都用于描述定量資料的集中趨勢,。不同點:均數(shù)用于單峰對稱分布,特別是正態(tài)分布或近似正態(tài)分布的資料;幾何均數(shù)用于變量值間呈倍數(shù)關(guān)系的偏態(tài)分布資料,特別是變量經(jīng)過對數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料;中位數(shù)用于不對稱分布資料、兩端無確切值的資料、分布不明確的資料。2. 同一資料的標準差不一定小于均數(shù)。均數(shù)描述的是一組同質(zhì)定量變量的平均水平,而標準差是描述單峰對稱分布資料離散程度最常用的指標。標準差大,表示觀察值之間變異大,即一組觀察值的分布較分散;標準差小,表示觀察值之間變異小
2、,即一組觀察值的分布較集中。若標準差遠大于均數(shù)表明數(shù)據(jù)離散程度較大,可能為偏態(tài)分布,此時應(yīng)考慮改用其他指標來描述資料的集中趨勢。3. 極差、四分位數(shù)間距、標準差、變異系數(shù)四者的相同點是都用于描述資料的離散程度。不同點:極差可用于描述單峰對稱分布小樣本資料的離散程度,或用于初步了解資料的變異程度;四分位數(shù)間距可用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度;標準差用于描述正態(tài)分布或近似正態(tài)分布資料的離散程度;變異系數(shù)用于比較幾組計量單位不同或均數(shù)相差懸殊的正態(tài)分布資料的離散程度。4. 正態(tài)分布的特征:正態(tài)曲線在橫軸上方均數(shù)處最高;正態(tài)分布以均數(shù)為中心,左右對稱;正態(tài)分布有兩個參數(shù),
3、即位置參數(shù)和形態(tài)參數(shù);正態(tài)曲線下的面積分布有一定的規(guī)律,正態(tài)曲線與橫軸間的面積恒等于1。曲線下區(qū)間內(nèi)的面積為95.00%;區(qū)間內(nèi)的面積為99.00%。5通過大量調(diào)查證實符合正態(tài)分布的變量或近似正態(tài)分布的變量,可按正態(tài)分布曲線下面積分布的規(guī)律制定醫(yī)學(xué)參考值范圍;服從對數(shù)正態(tài)分布的變量,可對觀察值取對數(shù)后按正態(tài)分布法算出醫(yī)學(xué)參考值范圍的對數(shù)值,然后求其反對數(shù)即可;對于經(jīng)正態(tài)性檢驗不服從正態(tài)分布的變量,應(yīng)采用百分位數(shù)法制定醫(yī)學(xué)參考值范圍。二、案例辨析題統(tǒng)計描述時,常見錯誤是對定量資料的描述均采用均數(shù)、標準差,。正確做法是根據(jù)資料分布類型和特點,計算相應(yīng)的集中趨勢指標和離散程度指標。本資料的血清總膽固
4、醇的頻數(shù)分布圖如下:頻數(shù)圖4-1 血清甘油三酯(TG)的頻數(shù)分布可見資料呈負偏態(tài)分布,不宜使用均數(shù)和標準差來描述其集中趨勢和離散程度,而應(yīng)計算中位數(shù)和四分位數(shù)間距,計算結(jié)果為:集中趨勢指標 (mmol/L)離散程度指標 四分位數(shù)間距= (mmol/L) 三、最佳選擇題1. B 2. E 3. B 4. C 5. D 6. E 7. A 8. D 9. D四、綜合分析題1. 解:輸出結(jié)果頻數(shù)圖4-4 尿總砷的頻數(shù)分布圖 由圖4-4可見,該資料集中位置偏向左側(cè),為正偏態(tài)分布,考慮作對數(shù)變換。頻數(shù)輸出結(jié)果 圖4-5 尿總砷對數(shù)的頻數(shù)分布圖由圖可見lgx分布近似對稱,可認為燃煤型砷中毒患者尿總砷含量近
5、似服從對數(shù)正態(tài)分布。(2) 燃煤型砷中毒患者尿總砷的含量近似服從對數(shù)正態(tài)分布,故應(yīng)計算幾何均數(shù)。輸出結(jié)果結(jié)果中的Mean表示尿總砷對數(shù)值的均數(shù)為1.1831,求其反對數(shù),得到幾何均數(shù)。2. 解: (1) 已知健康人的血清TC服從正態(tài)分布,故采用正態(tài)分布法制定95%的參考值范圍。下限:(mmol/L) 上限:(mmol/L)該市4555歲健康男性居民的血清總膽固醇的95%參考值范圍為2.96 mmol/L6.72mmol/L。(2) 4555歲健康男性居民的血清總膽固醇分布為非標準正態(tài)分布,需作標準化變換后,查表確定正態(tài)分布曲線下面積。由于是大樣本,可用樣本均數(shù)和樣本標準差作為總體均數(shù)和總體標準
6、差的點估計值。查標準正態(tài)分布曲線下的面積表(附表2)得: 該市4555歲健康男性居民中,血清總膽固醇在3.25mmol/L5.25mmol/L范圍內(nèi)的比例為61.79%。 (3) 作標準化變換查標準正態(tài)分布曲線下的面積表(附表2)得:該市4555歲健康男性居民中,血清總膽固醇低于3.80mmol/L所占的比例為14.01%。3. 解:輸出結(jié)果50 60 70 80 90 100 110 120 130 140 150 頻數(shù) 跟骨硬度指數(shù)圖4-8 跟骨硬度指數(shù)的頻數(shù)分布圖由圖4-8可見資料呈負偏態(tài)分布,因為跟骨硬度指數(shù)過高或過低均為異常,故應(yīng)使用百分位數(shù)法,制定雙側(cè)95%參考值范圍。輸出結(jié)果St
7、atisticsSINValid120 Missing0Percentiles2.558.0167 97.5143.6618即該地區(qū)3035歲健康女性的SI的95%參考值范圍為(58.02, 143.66)。第五章 定性資料的統(tǒng)計描述【習(xí)題解析】一、思考題1計算相對數(shù)應(yīng)時有足夠的觀察單位數(shù);分析時不能以構(gòu)成比代替率;計算觀察單位數(shù)不等的幾個率的合計率或平均率時,不能簡單地把各組率相加求其平均值而得,而應(yīng)該分別將分子和分母合計,再求出合計率或平均率;相對數(shù)的比較應(yīng)注意其可比性,如果內(nèi)部構(gòu)成不同,應(yīng)計算標準化率;樣本率或樣本構(gòu)成比的比較應(yīng)作假設(shè)檢驗。2. 率是指某現(xiàn)象實際發(fā)生數(shù)與某時間點或某時間段
8、可能發(fā)生該現(xiàn)象的觀察單位總數(shù)之比,用以說明該現(xiàn)象發(fā)生的頻率或強度。構(gòu)成比是指事物內(nèi)部某一組成部分觀察單位數(shù)與同一事物各組成部分的觀察單位總數(shù)之比,以說明事物內(nèi)部各組成部分所占的比重,不能說明某現(xiàn)象發(fā)生的頻率或強度大小。兩者在實際應(yīng)用時容易混淆,要注意區(qū)別。3. 如對死亡率的年齡構(gòu)成標準化,當已知被標化組的年齡別死亡率時,宜采用直接法計算標準化率;當不知道被標化組的年齡別死亡率,只有年齡別人口數(shù)和死亡總數(shù)時,可采用間接法。4. 常用的動態(tài)數(shù)列分析指標有:絕對增長量、發(fā)展速度與增長速度、平均發(fā)展速度與平均增長速度。絕對增長量是指事物現(xiàn)象在一定時期增長的絕對值;發(fā)展速度與增長速度都是相對比指標,用以
9、說明事物現(xiàn)象在一定時期的速度變化;平均發(fā)展速度是指一定時期內(nèi)各環(huán)比發(fā)展速度的平均值,用以說明事物在一定時期內(nèi)逐年的平均發(fā)展程度;平均增長速度是說明事物在一定時期內(nèi)逐年的平均增長程度。5. 標準化法的目的是通過選擇同一參照標準,消除混雜因素的影響,使算得的標準化率具有可比性。但標準化率并不代表真實水平,選擇的標準不同,計算出的標準化率也不相同。因此,標準化率僅用于相互間的比較,實際水平應(yīng)采用未標化率來反映。樣本的標準化率是樣本指標,亦存在抽樣誤差,若要比較其代表的總體標準化率是否相同,需作假設(shè)檢驗。注意標準化方法的選用。如對死亡率的年齡構(gòu)成標準化,當已知被標化組的年齡別死亡率時,宜采用直接法計算
10、標準化率。但當被標化組各年齡段人口數(shù)太少,年齡別死亡率波動較大時,宜采用間接法。各年齡組率若出現(xiàn)明顯交叉,或呈非平行變化趨勢時,則不適合采用標準化法,宜分層比較各年齡組率。此外,對于因其它條件不同,而非內(nèi)部構(gòu)成不同引起的不可比性問題,標準化法難以解決。二、案例辨析題該結(jié)論不正確。因為該醫(yī)生所計算的指標是構(gòu)成比,只能說明98例女性生殖器潰瘍患者中,3種病原體感染所占的比重,不能說明女性3種病原體感染發(fā)生的頻率或強度,該醫(yī)生犯了以構(gòu)成比代替率的錯誤。三、最佳選擇題1. B 2. A 3. D 4. E 5. D 6. D 7. C 8. C 9. B四、綜合分析題1. 解:表5-3 經(jīng)常吸煙與慢性
11、阻塞性肺病(COPD)的關(guān)系分 組調(diào)查人數(shù)經(jīng)常吸煙經(jīng)常吸煙率(%)是否COPD患者35623112564.89非COPD患者47918329638.20COPD患者的經(jīng)常吸煙率:231/356100%=64.89%非COPD患者經(jīng)常吸煙率:183/479100%=38.20%COPD患者的經(jīng)常吸煙率比非COPD患者高26.69%還需進一步對作假設(shè)檢驗(見第十一章),若經(jīng)檢驗有統(tǒng)計學(xué)意義,可以認為經(jīng)常吸煙與慢性阻塞性肺病(COPD)有一定的關(guān)系。 輸出結(jié)果2. 解: 表5-4 某地居民19982004年某病死亡率(1/10萬)動態(tài)變化年份符號死亡率絕對增長量發(fā)展速度增長速度 累計逐年定基比環(huán)比定
12、基比環(huán)比1998a0160.51999a1144.2-16.3-16.30.900.90-0.10-0.102000a2130.0-30.5-14.20.810.90-0.19-0.102001a3120.2-40.3-9.80.750.92-0.25-0.082002a485.6-74.9-34.60.530.71-0.47-0.292003a569.5-91.0-16.10.430.81-0.57-0.192004a638.5-122.0-31.00.240.55-0.76-0.45該病死亡率的平均發(fā)展速度該病死亡率的平均增長速度3. 解:因為該地男、女性的年齡構(gòu)成有所不同,為了消除年齡構(gòu)
13、成的不同對HBsAg陽性率的影響,應(yīng)先進行標準化再進行比較。根據(jù)本題資料,以男、女合計為標準人口,已知被標化組的年齡別陽性率,采用直接法計算標準化陽性率。表5-5 直接法計算某地不同年齡、性別人群的HBsAg標準化陽性率(%)年齡組標準人口數(shù)男性女性原陽性率預(yù)期陽性數(shù)原陽性率預(yù)期陽性數(shù) 010812.3024.902.3225.092014732.7139.972.7240.024015466.0693.636.4699.866014087.52105.858.60121.04合 計5508(N)5.11264 ()4.86286()男性HBsAg標準化陽性率: 女性HBsAg標準化陽性率:
14、可見,經(jīng)標準化后女性HBsAg陽性率高于男性。輸出結(jié)果注:將SPSS輸出的sp1的和除以sp的和,得男性HBsAg標準化陽性率;sp2的和除以sp的和,得女性HBsAg標準化陽性率。第六章 總體均數(shù)的估計【習(xí)題解析】一、思考題1抽樣研究中,由于同質(zhì)總體中的個體間存在差異,即個體變異,因而從同一總體中隨機抽取若干樣本,樣本均數(shù)往往不等于總體均數(shù),且各樣本均數(shù)之間也存在差異。這種由個體變異產(chǎn)生的、隨機抽樣引起的樣本均數(shù)與總體均數(shù)間的差異稱均數(shù)的抽樣誤差。決定均數(shù)抽樣誤差大小的因素主要為樣本含量和標準差。2樣本均數(shù)的抽樣分布的特點有:各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)之間存在差異;樣本均數(shù)服從正態(tài)
15、分布;樣本均數(shù)的變異范圍較原變量的變異范圍??;隨著樣本含量的增加,樣本均數(shù)的變異范圍逐漸縮小。3標準差與標準誤的區(qū)別在于:計算公式:標準差為,標準誤為;統(tǒng)計學(xué)意義:標準差越小,說明個體值相對越集中,均數(shù)對數(shù)據(jù)的代表性越好;而標準誤越小,說明樣本均數(shù)的分布越集中,樣本均數(shù)與總體均數(shù)的差別越小,抽樣誤差越小,由樣本均數(shù)估計總體均數(shù)的可靠性越大;用途:標準差用于描述個體值的變異程度,標準誤用于描述均數(shù)的抽樣誤差大小。標準差與標準誤的聯(lián)系:當樣本量一定時,標準誤隨標準差的增加而增加,公式為:。4數(shù)理統(tǒng)計的中心極限定理:從均數(shù)為,標準差為的正態(tài)總體中進行獨立隨機抽樣,其樣本均數(shù)服從均數(shù)為,標準差為的正態(tài)
16、分布;即使是從非正態(tài)總體中進行獨立隨機抽樣,當樣本含量逐漸增加時,其樣本均數(shù)的分布逐漸逼近于均數(shù)為,標準差為的正態(tài)分布。越大,抽樣誤差越大,由樣本均數(shù)估計總體均數(shù)的可靠性越小。反之,越小,抽樣誤差越小,由樣本均數(shù)估計總體均數(shù)的可靠性越大。計算總體均數(shù)置信區(qū)間的通式為:;當樣本含量較大時,例如,分布近似標準正態(tài)分布,可用值代替值,作為置信區(qū)間的近似計算,相應(yīng)的置信度為時,總體均數(shù)的置信區(qū)間為:。5置信區(qū)間與醫(yī)學(xué)參考值范圍的區(qū)別見表6-1。表6-1 均數(shù)的置信區(qū)間與醫(yī)學(xué)參考值范圍的區(qū)別區(qū)別均數(shù)的置信區(qū)間醫(yī)學(xué)參考值范圍意義按一定的置信度()估計的總體均數(shù)所在的區(qū)間范圍大多數(shù)“正常人”的某項解剖、生理
17、、生化指標的波動范圍計算公式未知:()未知而n較大:()已知:()正態(tài)分布法: 雙側(cè)95%的參考值范圍為()偏態(tài)分布法:單側(cè)下限95%的參考值范圍為單側(cè)上限95%的參考值范圍為用途用于總體均數(shù)的估計或假設(shè)檢驗判斷觀察對象的某項指標正常與否,為臨床診斷提供參考二、案例辨析題該學(xué)生誤用醫(yī)學(xué)參考值范圍的公式來計算總體均數(shù)的95%置信區(qū)間,正確計算公式為:,二者的主要區(qū)別在于,計算醫(yī)學(xué)參考值范圍時應(yīng)該用“標準差”,計算置信區(qū)間時應(yīng)該用標準誤。根據(jù)置信區(qū)間的公式算得2005年該市7歲男孩身高的95%置信區(qū)間為(122.01,122.99)。 三、最佳選擇題1C 2E 3E 4A 5E 6A 7E 8B
18、四、綜合分析題1解:由于該樣本為小樣本,故用公式估計總體均數(shù)95%置信區(qū)間為(8.27, 10.03)mm/h;用公式估計總體均數(shù)99%置信區(qū)間為(7.96, 10.34)mm/h。輸出結(jié)果Descriptives StatisticStd. Error紅細胞沉降率Mean9.1481.4256395% Confidence Interval for MeanLower Bound8.2697 Upper Bound10.0266 5% Trimmed Mean9.1795 Median9.4288 Variance4.529 Std. Deviation2.12816 Minimum5.01
19、 Maximum12.68 Range7.67 Interquartile Range2.73 Skewness-.250.464Kurtosis-.429.902DescriptivesStatisticStd. Error紅細胞沉降率Mean9.1481.4256399% Confidence Interval for MeanLower Bound7.9576 Upper Bound10.3386 5% Trimmed Mean9.1795 Median9.4288 Variance4.529 Std. Deviation2.12816 Minimum5.01 Maximum12.68
20、Range7.67 Interquartile Range2.73 Skewness-.250.464Kurtosis-.429.9022解:抽樣誤差為1.82;由于該樣本為大樣本, 故用公式估計正常人ET含量的95%置信區(qū)間為(77.43, 84.57)ng/L。輸出結(jié)果Descriptives StatisticStd. Error血漿內(nèi)皮素Mean80.98911.8203395% Confidence Interval for MeanLower Bound77.3771 Upper Bound84.6010 5% Trimmed Mean80.8639 Median79.5837 V
21、ariance331.362 Std. Deviation18.20334 Minimum34.02 Maximum129.20 Range95.17 Interquartile Range21.75 Skewness.182.241Kurtosis.140.4783解:由于兩樣本均為小樣本, 故用公式估計總體均數(shù)95%置信區(qū)間,肺心病組血液二氧化碳分壓的95%置信區(qū)間為(7.86 , 13.10)kpa;慢性支氣管炎合并肺氣腫組血液二氧化碳分壓的95%置信區(qū)間為(5.41 , 6.83)kpa。由于方差不齊,應(yīng)當選擇方差不齊時的結(jié)果。兩組患者的血液二氧化碳分壓差值的95%置信區(qū)間為(1.66
22、, 7.05)kpa,該區(qū)間不包含0,可以認為肺心病患者與慢性支氣管合并肺氣腫患者的均數(shù)不同,肺心病患者較高。輸出結(jié)果Descriptives 組別 StatisticStd. Error二氧化碳壓肺心病組Mean10.47821.2656495% Confidence Interval for MeanLower Bound7.8600 Upper Bound13.0964 5% Trimmed Mean10.2266 Median10.3473 Variance38.444 Std. Deviation6.20035 Minimum1.59 Maximum24.30 Range22.71
23、Interquartile Range7.13 Skewness.615.472Kurtosis-.030.918慢性支氣管炎合并肺氣腫組Mean6.1228.3380995% Confidence Interval for MeanLower Bound5.4151 Upper Bound6.8304 5% Trimmed Mean6.1266 Median6.0160 Variance2.286 Std. Deviation1.51198 Minimum2.93 Maximum9.25 Range6.32 Interquartile Range1.78 Skewness-.081.512K
24、urtosis.192.992Group Statistics 組別NMeanStd. DeviationStd. Error Mean二氧化碳壓肺心病組2410.47826.200351.26564 慢性支氣管炎合并肺氣腫組206.12281.51198.33809Independent Samples Test Levenes Test for Equality of Variancest-test for Equality of MeansFSig.tdfSig. Mean DifferenceStd. Error Difference95% Confidence Interval of
25、 the Difference LowerUpper二氧化碳壓Equal variances assumed17.431.0003.06142.0044.355471.422901.483947.22700Equal variances not assumed 3.32526.238.0034.355471.310021.663877.04706第八章 t檢驗【習(xí)題解析】一、思考題1理論根據(jù)是小概率事件和小概率反證法。值表示成立時,出現(xiàn)等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計量的概率。則表示在成立的前提下,得到現(xiàn)有樣本統(tǒng)計量的概率為小概率事件,所以拒絕。2檢驗中是選擇單側(cè)檢驗還是雙側(cè)檢驗,需要根
26、據(jù)專業(yè)知識來確定。例如,根據(jù)專業(yè)知識能確定未知總體均數(shù)不會大(小)于標準值(單樣本檢驗),則可用單側(cè)檢驗,否則,采用雙側(cè)檢驗。3配對檢驗的應(yīng)用條件是資料為配對設(shè)計,且數(shù)據(jù)差值服從正態(tài)分布。4理論上講應(yīng)取得大一些,如0.10或0.20,目的是減少犯II型錯誤的概率;在實際應(yīng)用中,常取。5變量變換的目的在于使變換后的資料滿足正態(tài)分別或方差齊性等條件,便于進一步的統(tǒng)計分析。6可以,大樣本兩組均數(shù)的Z檢驗是兩組均數(shù)比較檢驗的近似。二、案例辨析題該醫(yī)生的分析結(jié)果是錯誤的。正確作法應(yīng)是分別將甲、乙兩藥各自治療前后的血沉值作差值,比較兩組差值的均值是否有差別,具體步驟如下:(1) 正態(tài)性檢驗分別對甲、乙兩種
27、藥物治療前后的血沉差值進行正態(tài)性檢驗。甲藥: 乙藥: 故,甲藥、乙藥兩組資料的差值均服從正態(tài)分布。(2) 方差齊性檢驗1) 建立檢驗假設(shè),確定檢驗水準 ,兩差值總體方差相等 ,兩差值總體方差不等2)計算檢驗統(tǒng)計量 3) 確定值,作出統(tǒng)計推斷 查界值表(附表4),得,按的水準,不拒絕,差異不具有統(tǒng)計學(xué)意義,尚不能認為兩差值總體方差不等。(3) 以差值為資料,作兩組均值檢驗1) 建立檢驗假設(shè),確定檢驗水準:,即甲、乙兩種藥物的療效無差別:,即甲、乙兩種藥物的療效有差別2) 計算檢驗統(tǒng)計量3) 確定P值,作出統(tǒng)計推斷查界值表(附表3),得,按水準,拒絕,接受,差異具有統(tǒng)計學(xué)意義,可認為甲、乙兩種藥物
28、的療效有差別。由于乙種藥物治療前后血沉值的差值較大(均數(shù)為5.8),故乙藥物治療效果要好于甲藥。輸出結(jié)果三、最佳選擇題1.E 2.C 3.C 4.B 5.E 6.E 7.C 四、綜合分析題1. 解:本題應(yīng)進行單樣本檢驗,可按如下步驟完成:(1) 資料的正態(tài)性檢驗 ,故資料服從正態(tài)分布。(2) 單樣本檢驗 1) 建立檢驗假設(shè),確定檢驗水準,即該山區(qū)成年男子的脈搏與一般成年男子脈搏無差別,即該山區(qū)成年男子的脈搏與一般成年男子脈搏有差別2) 計算檢驗統(tǒng)計量由原始資料計算得:,于是3) 確定P值,作出統(tǒng)計推斷查界值表(附表3),得,按水準,拒絕,接受,差異有統(tǒng)計學(xué)意義,可以認為該山區(qū)成年男子脈搏與一般
29、成年男子脈搏有差別。輸出結(jié)果2解:本題應(yīng)采用配對檢驗,完成步驟如下:(1) 分別作甲、乙兩藥治療前后差值的正態(tài)性檢驗 由案例辨析題中的結(jié)論可知,資料均服從正態(tài)分布。 (2) 對甲、乙兩藥分別作配對檢驗 甲藥:1) 建立檢驗假設(shè),確定檢驗水準,即甲藥治療前后血沉值無差別,即甲藥治療前后血沉值有差別2) 計算檢驗統(tǒng)計量3) 確定P值,作出統(tǒng)計推斷查界值表(附表3),得,按水準,拒絕,差異有統(tǒng)計學(xué)意義,即甲藥降低血沉有效。乙藥:1) 建立檢驗假設(shè),確定檢驗水準,即乙藥治療前后血沉值無差別,即乙藥治療前后血沉值有差別2) 計算檢驗統(tǒng)計量 3) 確定P值,作出統(tǒng)計推斷查界值表(附表3),得,按水準,拒絕
30、,差異有統(tǒng)計學(xué)意義,即乙藥降低血沉有效。輸出結(jié)果3解:本題資料為抗體滴度數(shù)據(jù),一般服從對數(shù)正態(tài)分布,宜采用成組設(shè)計的兩小樣本幾何均數(shù)比較的檢驗。(1) 將原始數(shù)據(jù)取常用對數(shù)值后分別記為、(2) 正態(tài)性檢驗用SPSS統(tǒng)計軟件算得變量、的正態(tài)性檢驗結(jié)果。: : 故,兩組資料均服從正態(tài)分布。(3) 方差齊性檢驗1) 建立檢驗假設(shè),確定檢驗水準,兩總體方差相等 ,兩總體方差不等2) 計算檢驗統(tǒng)計量 ,于是3) 確定值,作出統(tǒng)計推斷查界值表(附表4),得。按水準,拒絕,差異有統(tǒng)計學(xué)意義,故可認為兩總體方差不相等。(4) 兩樣本均數(shù)()的檢驗1) 建立檢驗假設(shè),確定檢驗水準 兩總體幾何均數(shù)的對數(shù)值相等 兩
31、總體幾何均數(shù)的對數(shù)值不等2) 計算檢驗統(tǒng)計量 3) 確定值,作出統(tǒng)計推斷查界值表(附表3),得。按水準,拒絕,接受,差異有統(tǒng)計學(xué)意義,可認為兩組的平均效價有差別。輸出結(jié)果第十章 二項分布和Poisson分布及其應(yīng)用 【習(xí)題解析】一、思考題1. Bernoulli試驗的適用條件如下:每次試驗只會發(fā)生兩種互斥結(jié)果之一,即兩種互斥結(jié)果的概率之和恒等于1;在相同的試驗條件下,每次試驗產(chǎn)生某種結(jié)果(如“陽性”)的概率固定不變;重復(fù)試驗是互相獨立的,即任何一次試驗結(jié)果的出現(xiàn)不會影響其它試驗結(jié)果出現(xiàn)的概率。2. Poisson分布的性質(zhì)如下:總體均數(shù)與總體方差相等;當n很大,而很小,且為常數(shù)時,Poisso
32、n分布可看作是二項分布的極限分布;當增大時,Poisson分布漸近正態(tài)分布,一般而言,時,Poisson分布資料可作為正態(tài)分布處理;Poisson分布具備可加性,即對于服從Poisson分布的m個互相獨立的隨機變量,它們之和也服從Poisson分布,且其均數(shù)為這m個隨機變量的均數(shù)之和;的大小決定了Poisson分布的圖形特征。3. 隨機變量X服從二項分布,是指在n重Bernoulli試驗中,發(fā)生某種結(jié)果(如“陽性”)的次數(shù)的一種概率分布,其恰好發(fā)生X個陽性的概率為() ,且總有 。而隨機變量X服從Poisson分布,是指X滿足:取值范圍為;相應(yīng)的概率為 ,且總有 。在總體率很小,而樣本含量(試
33、驗次數(shù))n趨向于無窮大時,二項分布近似于Poisson分布。因此, Poisson分布可看作是二項分布的一種極限情況,可用來描述小概率事件的發(fā)生規(guī)律。 4. 二項分布、Poisson分布和正態(tài)分布間的聯(lián)系為:在n很大,而很小,且為常數(shù)時,二項分布的極限分布為Poisson分布;在n較大、不接近0也不接近1時,二項分布近似正態(tài)分布,而相應(yīng)的樣本率p的分布也近似正態(tài)分布。當增大時,Poisson分布漸近正態(tài)分布,一般而言,20時,Poisson分布資料可作為正態(tài)分布處理。二、案例辨析題不正確。溶液中的細菌數(shù)可以認為服從Poisson分布,當其“單位容積”所含細菌數(shù)時,可采用正態(tài)近似法估計總體均數(shù)的
34、()置信區(qū)間。但本例溶液的“單位容積”為10ml,應(yīng)先用正態(tài)近似法估計出該溶液每10ml所含細菌數(shù)的95%置信區(qū)間,再除以10即得到每1ml所含細菌數(shù)的95%置信區(qū)間。由式(10.16)可得,每10ml該溶液所含細菌數(shù)的95%置信區(qū)間為,故每1ml該溶液所含細菌數(shù)的95%置信區(qū)間為。三、最佳選擇題1. A2. C3. B4. E5. C6. E7. E8. C四、綜合分析題1. 解:本例可認為治療有效人數(shù)X服從二項分布,根據(jù)研究目的,選用單側(cè)檢驗。其假設(shè)檢驗步驟為:(1) 建立檢驗假設(shè),確定檢驗水準H0:,該藥新劑型的療效等于常規(guī)劑型H1:,該藥新劑型的療效優(yōu)于常規(guī)劑型單側(cè) (2) 計算概率本
35、例,(3) 作出統(tǒng)計推斷由結(jié)果可見,按水準,不拒絕H0,差異無統(tǒng)計學(xué)意義,尚不能認為該藥新劑型能增加療效。2. 解:本例中,乳腺癌患病人數(shù)可認為服從Poisson分布,兩個樣本的觀察單位數(shù)不相等,以10000人為一個單位,則,。設(shè)甲、乙兩地婦女乳腺癌的患病率分別為和,其假設(shè)檢驗步驟為:(1) 建立檢驗假設(shè),確定檢驗水準H0:,兩地婦女乳腺癌患病率相等H1:,甲地婦女乳腺癌患病率高于乙地單側(cè) (2) 計算檢驗統(tǒng)計量(3) 作出統(tǒng)計推斷查t界值表(附表3 ),得,按水準,不拒絕H0,差異無統(tǒng)計學(xué)意義,尚不能認為甲地婦女乳腺癌的患病率高于乙地。第十一章 檢驗【習(xí)題解析】一、思考題1. 檢驗的基本思想
36、:在成立的條件下,推算出各個格子的理論頻數(shù)T,然后利用理論頻數(shù)T和實際頻數(shù)A構(gòu)造統(tǒng)計量,反映實際頻數(shù)與理論頻數(shù)的吻合程度。若無效假設(shè)成立,則各個格子的A與T相差不應(yīng)該很大,即統(tǒng)計量不應(yīng)該很大。A與T相差越大,值越大,相對應(yīng)的P值越小,當,則越有理由認為無效假設(shè)不成立,繼而拒絕,作出統(tǒng)計推斷。由于格子越多,值也會越大,因而考慮值大小的意義時,應(yīng)同時考慮格子數(shù)的多少(嚴格地說是自由度的大小),這樣值才能更準確地反映A與T的吻合程度。檢驗可用于:獨立樣本兩個或多個率或構(gòu)成比的比較,配對設(shè)計兩樣本率的比較,頻數(shù)分布的擬合優(yōu)度檢驗,線性趨勢檢驗等。2. 對不同設(shè)計類型的資料,檢驗的應(yīng)用條件不同: (1)
37、 獨立樣本四格表的檢驗1) 當,且時,用非連續(xù)性校正的檢驗?;?) 當,且有時,用連續(xù)性校正的檢驗或用四格表的確切概率法。 或 3) 當或時,用四格表的確切概率法。(2) 獨立樣本列聯(lián)表檢驗的專用公式為:1) 不宜有1/5以上格子的理論頻數(shù)小于5,或有1個格子的理論頻數(shù)小于1。2) 結(jié)果為有序多分類變量的RC列聯(lián)表,在比較各處理組的平均效應(yīng)有無差別時,應(yīng)該用秩和檢驗或Ridit檢驗。(3) 配對四格表的檢驗1) 當時,。2) 當時,需作連續(xù)性校正,。3. 四格表的Z檢驗和檢驗的聯(lián)系,體現(xiàn)在:能用四格表Z檢驗進行兩樣本率比較的資料,都可以用檢驗。四格表的雙側(cè)Z檢驗與檢驗是完全等價的,兩個統(tǒng)計量的
38、關(guān)系為,相對應(yīng)的界值的關(guān)系為。4. 擬合優(yōu)度檢驗是根據(jù)樣本的頻數(shù)分布檢驗其總體是否服從某特定的理論分布。按照該理論分布計算的頻數(shù)稱為理論頻數(shù);從樣本觀察到的頻數(shù)稱為實際頻數(shù)。利用檢驗,推斷實際頻數(shù)與理論頻數(shù)的吻合程度。5. 檢驗的理論是基于分布,但是只有在大樣本時檢驗統(tǒng)計量才近似服從分布,才能使用檢驗公式。如四格表資料,若,且有時,尚可以校正檢驗統(tǒng)計量使其近似服從分布;當時,這種近似性就很差,檢驗就不適用了,只能用確切概率法。二、案例辨析題該研究的試驗設(shè)計和統(tǒng)計分析方法均存在不合理的地方。試驗設(shè)計方面:樣本含量偏小。該研究者在臨床試驗設(shè)計之初,就應(yīng)該嚴格按照臨床試驗設(shè)計要求,進行樣本含量的估計
39、,以保證足夠的檢驗效能。此外,由于急性細菌性下呼吸道感染,某些癥狀療效的判斷可能易受主觀因素的影響,因此應(yīng)采用盲法。統(tǒng)計分析方面:由于樣本含量小于40,不能采用檢驗,應(yīng)采用四格表的確切概率法。具體步驟為:1. 建立檢驗假設(shè),確定檢驗水準:,即兩種抗生素治療急性細菌性下呼吸道感染的有效率相同:,即兩種抗生素治療急性細菌性下呼吸道感染的有效率不同2. 計算概率:在周邊合計不變的條件下,以最小行、列合計所對應(yīng)的格子為基礎(chǔ),其取值的變動范圍為從0到最小周邊合計。本例中,將甲藥治療無效對應(yīng)的格子的取值從0增至10,可得到11個四格表,并按第1個格子的值由小到大排列,結(jié)果見下表。表11-4 Fisher確
40、切概率法計算用表序號i有效無效14100.00003160 2590.001071513680.011991424770.063971335860.181911246950.2910511571040.2668010681130.13860979*1220.0389888101310.0053379111400.00027610* 表11-1數(shù)據(jù)按下式計算各四格表的概率,結(jié)果見表11-4最后一列。3. 確定P值,作出統(tǒng)計推斷將小于等于原四格表概率的所有四格表對應(yīng)的概率相加,得到雙側(cè)概率 按水準,不拒絕,差異無統(tǒng)計學(xué)意義,尚不能認為兩種抗生素治療急性細菌性下呼吸道感染的療效有差別。該結(jié)果與該研究
41、者的結(jié)論相反。因此,在統(tǒng)計分析時應(yīng)注意所選方法的應(yīng)用條件。三、最佳選擇題1. A 2. E 3. D 4. E 5. D 6. A 7. E 8. B 9. B 10. C四、綜合分析題1. 解:(1) 資料整理后的表格為表11-5 A、B兩種抗生素治療單純性尿路感染的療效組別有效無效合計有效率(%)抗生素A37 54288.10 抗生素B29134269.05 合計66188478.57 (2) 該研究屬于完全隨機設(shè)計,所得資料為二分類資料。(3) 由于該資料為分類資料,欲比較A、B兩藥的有效率,宜選用獨立樣本四格表的檢驗。具體步驟為:1) 建立檢驗假設(shè),確定檢驗水準:,即兩種抗生素治療單純
42、性尿路感染的有效率相同:,即兩種抗生素治療單純性尿路感染的有效率不同2) 計算檢驗統(tǒng)計量本題中最小行、列合計對應(yīng)的格子為采用抗生素A治療無效者或抗生素B治療無效者,其理論頻數(shù),故采用四格表專用公式: 3) 確定P值,作出統(tǒng)計推斷查界值表(附表9),得,按水準,拒絕,接受,差異有統(tǒng)計學(xué)意義,可以認為兩種抗生素治療單純性尿路感染的療效不同,A藥的有效率高于B藥。輸出結(jié)果2. 解:(1) 資料整理后的表格為表11-6 兩種CT對煤工塵肺肺氣腫的檢查結(jié)果螺旋CTHRCT合計有無有73275無71421合計801696 (2) 該研究屬于配對設(shè)計,所得數(shù)據(jù)為分類資料。(3) 該資料為分類資料,欲比較螺旋
43、CT和HRCT在煤工塵肺肺氣腫檢出方面有無差異,宜選用配對四格表的檢驗。具體步驟為:1) 建立檢驗假設(shè),確定檢驗水準:,即兩種CT檢出煤工塵肺肺氣腫的結(jié)果無差異:,即兩種CT檢出煤工塵肺肺氣腫的結(jié)果有差異2) 計算檢驗統(tǒng)計量本題,應(yīng)采用配對四格表檢驗的校正公式: 3) 確定P值,作出統(tǒng)計推斷查界值表(附表9),得,按水準,不拒絕,差異無統(tǒng)計學(xué)意義,尚不能認為兩種CT煤工塵肺肺氣腫的檢出率有差異。 輸出結(jié)果3. 解:本題資料為分類資料,欲比較3種方案治療單純性肥胖的有效率有無差異,宜選用獨立樣本列聯(lián)表的檢驗。具體步驟為:1) 建立檢驗假設(shè),確定檢驗水準:,即3種方案治療單純性肥胖的有效率相同:3
44、種方案治療單純性肥胖的有效率不全相同2) 計算檢驗統(tǒng)計量最小理論頻數(shù),故直接將數(shù)據(jù)帶入獨立樣本列聯(lián)表檢驗的公式: 3) 確定P值,作出統(tǒng)計推斷查界值表(附表9),得,按水準,不拒絕,差異無統(tǒng)計學(xué)意義,尚不能認為3種方案治療單純性肥胖的有效率不同。輸出結(jié)果4. 解:(1) 該資料為分類資料,欲比較兩藥治療胃潰瘍的療效構(gòu)成比有無差異,宜選用獨立樣本列聯(lián)表的檢驗。先將資料整理成下表形式:表11-7 兩種藥物治療治療胃潰瘍的療效組別痊愈顯效進步無效合計試驗組20(58.82)6(17.65)4(11.76)4(11.76)34(100)對照組16(47.06)4(11.76)8(23.53)6(17.
45、65)34(100)合計3610121068假設(shè)檢驗的具體步驟為:1) 建立檢驗假設(shè),確定檢驗水準:兩藥治療胃潰瘍的療效構(gòu)成比相同:兩藥治療胃潰瘍的療效構(gòu)成比不同2) 計算檢驗統(tǒng)計量最小理論頻數(shù),故直接將數(shù)據(jù)帶入獨立樣本列聯(lián)表檢驗的公式: 3) 確定P值,作出統(tǒng)計推斷查界值表(附表9),得,按水準,不拒絕,差異無統(tǒng)計學(xué)意義,尚不能認為兩藥治療胃潰瘍的療效構(gòu)成比不同。(2) 若比較兩藥有效率有無差異,宜選用獨立樣本四格表的檢驗。按題意將資料整理成下表形式:表11-8 兩種藥物治療治療胃潰瘍的療效組別有效無效合計試驗組26 834對照組20 1434合計462268(3) 若比較兩藥治療胃潰瘍的療
46、效大小,宜選用秩和檢驗。因為本題中治療效果呈等級變化,由于檢驗未考慮“療效”的等級順序,因此經(jīng)檢驗只能說明各處理效應(yīng)的構(gòu)成比是否有差別。而秩和檢驗考慮了“療效”的等級順序,用于比較療效大小比檢驗更合理。輸出結(jié)果以上是問題(1)的SPSS分析過程。問題(2)的SPSS分析過程請參見本章綜合分析題的第1題,問題(3)的SPSS分析過程請參見第十二章相關(guān)內(nèi)容。第十三章 雙變量關(guān)聯(lián)性分析【習(xí)題解析】一、思考題1雙變量關(guān)聯(lián)性分析的目的在于推斷從某一總體中隨機抽取的同一份樣本觀測出的兩個變量間是否存在關(guān)聯(lián)性,以及這種關(guān)聯(lián)性的密切程度如何。關(guān)聯(lián)性只反映變量間數(shù)量上的關(guān)系,但數(shù)量上的關(guān)聯(lián)并不表示專業(yè)上的因果關(guān)
47、系,是否確為因果關(guān)系還需結(jié)合專業(yè)知識、因果邏輯上的時間先后順序等作進一步判定。 222列聯(lián)表的關(guān)聯(lián)性分析與兩樣本率比較的檢驗的數(shù)據(jù)形式非常相似,檢驗的公式以及應(yīng)用條件也完全相同。但區(qū)別在于:兩樣本率比較的檢驗是從兩個總體中分別抽取樣本,兩樣本有各自的頻數(shù)分布,所檢驗的是兩總體的率是否相同;而22列聯(lián)表的關(guān)聯(lián)性分析是從同一個總體中進行隨機抽樣,對樣本中的每個個體考察其兩個變量的關(guān)系,檢驗兩個分類變量之間是否存在關(guān)聯(lián)性或者說是否獨立。3P值越小,說明越有理由拒絕,犯I型錯誤的概率越小。相關(guān)系數(shù)r經(jīng)假設(shè)檢驗有統(tǒng)計學(xué)意義且得到非常小的P值,表示有足夠的理由認為兩變量總體相關(guān)系數(shù),只能定性回答兩變量是否
48、存在直線相關(guān),并非意味著其直線相關(guān)的強度。若要定量回答相關(guān)性的強弱,需結(jié)合樣本相關(guān)系數(shù)r的大小和總體相關(guān)系數(shù)的置信區(qū)間來說明。4區(qū)別:Pearson積矩相關(guān)適用于二元正態(tài)分布資料,Spearman秩相關(guān)適用于不服從正態(tài)分布、總體分布未知、存在極端值或原始數(shù)據(jù)用等級表示的資料。Pearson積矩相關(guān)是基于原始數(shù)據(jù)進行統(tǒng)計分析,而Spearman秩相關(guān)是將原始數(shù)據(jù)進行秩變換后進行統(tǒng)計分析。Pearson積矩相關(guān)是參數(shù)檢驗方法,而Spearman秩相關(guān)不以特定的總體分布為前提,為非參數(shù)檢驗的方法。聯(lián)系:兩種相關(guān)系數(shù)的取值都介于-1和1之間,無單位,小于 0 為負相關(guān),大于0為正相關(guān)。用原始數(shù)據(jù)的秩次
49、來計算Pearson相關(guān)系數(shù),得到的即為Spearman秩相關(guān)系數(shù)。二、案例辨析題該案例是對同一樣本的兩個分類變量之間的關(guān)聯(lián)性進行分析,檢驗的計算方式不變,結(jié)果仍為84.533,但下結(jié)論時最好不要從“不同年齡的AKP酶反應(yīng)活性不同”演繹到“兩變量有關(guān)系”,而應(yīng)為“按=0.05水準,拒絕,可認為年齡與AKP酶反應(yīng)活性之間有關(guān)”。此外,可結(jié)合列聯(lián)系數(shù)說明其關(guān)聯(lián)強度,。由于年齡與AKP酶反應(yīng)活性都是有序分類變量,可考慮進行Spearman秩相關(guān)分析,得,單側(cè),可認為隨著年齡的增加,AKP酶反應(yīng)活也降低。三、最佳選擇題1. B 2. C 3. C 4.D 5.A 6.B 7.B 8.C 9. D四、綜
50、合分析題1解:(1) 由散點圖(略)結(jié)合兩個變量的正態(tài)性檢驗,可進行直線相關(guān)分析。由式(13.1)分別算出但需進行假設(shè)檢驗以推斷總體上這種相關(guān)是否存在。(2) 檢驗相關(guān)是否具有統(tǒng)計學(xué)意義1) 建立檢驗假設(shè),確定檢驗水準:,即血漿清蛋白含量及血紅蛋白含量之間無直線相關(guān)關(guān)系 :,即血漿清蛋白含量及血紅蛋白含量之間有直線相關(guān)關(guān)系2) 計算檢驗統(tǒng)計量由式(13.4)和式(13.5)得3) 確定P值,作出統(tǒng)計推斷查t界值表(附表3),得,按=0.05水準,拒絕,接受,可以認為該病成年男性患者血漿清蛋白含量與血紅蛋白含量呈正相關(guān)關(guān)系。輸出結(jié)果血紅蛋白含量血漿清蛋白含量(3) 結(jié)果解釋通過對血漿清蛋白和血紅蛋白兩變量的正態(tài)性檢驗可以看出:兩者的P值分別為0.200,0. 200,可以認為兩變量都服從正態(tài)分布,故進行Pearson積矩相關(guān)分析。兩者相關(guān)系數(shù)為0.916,按水準拒絕,可以認為該病成年男性患者血漿清蛋白和血紅蛋白兩變量呈正相關(guān)關(guān)系。 2解:此問題屬于配對設(shè)計列聯(lián)表的關(guān)聯(lián)性分析。(1) 建立檢驗假設(shè),確定檢驗水準:甲法和乙法之間互相獨立:甲法和乙法之間互相關(guān)聯(lián)(2) 計算檢驗統(tǒng)計量將表13-3中數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 龍江龍牌酒企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 智能烤箱烘焙教程行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 床上用紡織品超市企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 模塊化建筑臨時住房行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 汽車空調(diào)壓縮機企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 水晶獎杯企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報告
- 福建省廈門市2024-2025學(xué)年高一上學(xué)期期末語文試題
- 內(nèi)燃機等原動機批發(fā)企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報告
- 醫(yī)護人員勞動合同續(xù)簽示范
- 二零二五年度關(guān)于解除交通事故案件律師代理協(xié)議書
- 不銹鋼容器制造通用標準工藝守則
- 照明燈具統(tǒng)計表
- 杭州市居住房屋出租安全管理若干規(guī)定
- 2022年江西工業(yè)貿(mào)易職業(yè)技術(shù)學(xué)院職業(yè)適應(yīng)性測試題庫及答案解析
- 給水排水管道工程質(zhì)量通病以及防治
- 計算機視覺全套課件
- 中國聯(lián)通IMS接口規(guī)范 第三分冊:Sh接口 V1.0
- protel完全教程(原理圖部分)
- 迎澤公園文化廣場歌詞匯集
- 環(huán)境化學(xué)物的毒性作用及其影響因素
- Q∕GDW 12176-2021 反竊電監(jiān)測終端技術(shù)規(guī)范
評論
0/150
提交評論