醫(yī)學統(tǒng)計學答案_第1頁
醫(yī)學統(tǒng)計學答案_第2頁
醫(yī)學統(tǒng)計學答案_第3頁
醫(yī)學統(tǒng)計學答案_第4頁
醫(yī)學統(tǒng)計學答案_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第四章 定量資料的統(tǒng)計描述第四章 定量資料的統(tǒng)計描述 【習題解析】一、思考題1. 均數、中位數、幾何均數三者的相同點是都用于描述定量資料的集中趨勢,。不同點:均數用于單峰對稱分布,特別是正態(tài)分布或近似正態(tài)分布的資料;幾何均數用于變量值間呈倍數關系的偏態(tài)分布資料,特別是變量經過對數變換后呈正態(tài)分布或近似正態(tài)分布的資料;中位數用于不對稱分布資料、兩端無確切值的資料、分布不明確的資料。2. 同一資料的標準差不一定小于均數。均數描述的是一組同質定量變量的平均水平,而標準差是描述單峰對稱分布資料離散程度最常用的指標。標準差大,表示觀察值之間變異大,即一組觀察值的分布較分散;標準差小,表示觀察值之間變異小

2、,即一組觀察值的分布較集中。若標準差遠大于均數表明數據離散程度較大,可能為偏態(tài)分布,此時應考慮改用其他指標來描述資料的集中趨勢。3. 極差、四分位數間距、標準差、變異系數四者的相同點是都用于描述資料的離散程度。不同點:極差可用于描述單峰對稱分布小樣本資料的離散程度,或用于初步了解資料的變異程度;四分位數間距可用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度;標準差用于描述正態(tài)分布或近似正態(tài)分布資料的離散程度;變異系數用于比較幾組計量單位不同或均數相差懸殊的正態(tài)分布資料的離散程度。4. 正態(tài)分布的特征:正態(tài)曲線在橫軸上方均數處最高;正態(tài)分布以均數為中心,左右對稱;正態(tài)分布有兩個參數,

3、即位置參數和形態(tài)參數;正態(tài)曲線下的面積分布有一定的規(guī)律,正態(tài)曲線與橫軸間的面積恒等于1。曲線下區(qū)間內的面積為95.00%;區(qū)間內的面積為99.00%。5通過大量調查證實符合正態(tài)分布的變量或近似正態(tài)分布的變量,可按正態(tài)分布曲線下面積分布的規(guī)律制定醫(yī)學參考值范圍;服從對數正態(tài)分布的變量,可對觀察值取對數后按正態(tài)分布法算出醫(yī)學參考值范圍的對數值,然后求其反對數即可;對于經正態(tài)性檢驗不服從正態(tài)分布的變量,應采用百分位數法制定醫(yī)學參考值范圍。二、案例辨析題統(tǒng)計描述時,常見錯誤是對定量資料的描述均采用均數、標準差,。正確做法是根據資料分布類型和特點,計算相應的集中趨勢指標和離散程度指標。本資料的血清總膽固

4、醇的頻數分布圖如下:頻數圖4-1 血清甘油三酯(TG)的頻數分布可見資料呈負偏態(tài)分布,不宜使用均數和標準差來描述其集中趨勢和離散程度,而應計算中位數和四分位數間距,計算結果為:集中趨勢指標 (mmol/L)離散程度指標 四分位數間距= (mmol/L) 三、最佳選擇題1. B 2. E 3. B 4. C 5. D 6. E 7. A 8. D 9. D四、綜合分析題1. 解:輸出結果頻數圖4-4 尿總砷的頻數分布圖 由圖4-4可見,該資料集中位置偏向左側,為正偏態(tài)分布,考慮作對數變換。頻數輸出結果 圖4-5 尿總砷對數的頻數分布圖由圖可見lgx分布近似對稱,可認為燃煤型砷中毒患者尿總砷含量近

5、似服從對數正態(tài)分布。(2) 燃煤型砷中毒患者尿總砷的含量近似服從對數正態(tài)分布,故應計算幾何均數。輸出結果結果中的Mean表示尿總砷對數值的均數為1.1831,求其反對數,得到幾何均數。2. 解: (1) 已知健康人的血清TC服從正態(tài)分布,故采用正態(tài)分布法制定95%的參考值范圍。下限:(mmol/L) 上限:(mmol/L)該市4555歲健康男性居民的血清總膽固醇的95%參考值范圍為2.96 mmol/L6.72mmol/L。(2) 4555歲健康男性居民的血清總膽固醇分布為非標準正態(tài)分布,需作標準化變換后,查表確定正態(tài)分布曲線下面積。由于是大樣本,可用樣本均數和樣本標準差作為總體均數和總體標準

6、差的點估計值。查標準正態(tài)分布曲線下的面積表(附表2)得: 該市4555歲健康男性居民中,血清總膽固醇在3.25mmol/L5.25mmol/L范圍內的比例為61.79%。 (3) 作標準化變換查標準正態(tài)分布曲線下的面積表(附表2)得:該市4555歲健康男性居民中,血清總膽固醇低于3.80mmol/L所占的比例為14.01%。3. 解:輸出結果50 60 70 80 90 100 110 120 130 140 150 頻數 跟骨硬度指數圖4-8 跟骨硬度指數的頻數分布圖由圖4-8可見資料呈負偏態(tài)分布,因為跟骨硬度指數過高或過低均為異常,故應使用百分位數法,制定雙側95%參考值范圍。輸出結果St

7、atisticsSINValid120 Missing0Percentiles2.558.0167 97.5143.6618即該地區(qū)3035歲健康女性的SI的95%參考值范圍為(58.02, 143.66)。第五章 定性資料的統(tǒng)計描述【習題解析】一、思考題1計算相對數應時有足夠的觀察單位數;分析時不能以構成比代替率;計算觀察單位數不等的幾個率的合計率或平均率時,不能簡單地把各組率相加求其平均值而得,而應該分別將分子和分母合計,再求出合計率或平均率;相對數的比較應注意其可比性,如果內部構成不同,應計算標準化率;樣本率或樣本構成比的比較應作假設檢驗。2. 率是指某現象實際發(fā)生數與某時間點或某時間段

8、可能發(fā)生該現象的觀察單位總數之比,用以說明該現象發(fā)生的頻率或強度。構成比是指事物內部某一組成部分觀察單位數與同一事物各組成部分的觀察單位總數之比,以說明事物內部各組成部分所占的比重,不能說明某現象發(fā)生的頻率或強度大小。兩者在實際應用時容易混淆,要注意區(qū)別。3. 如對死亡率的年齡構成標準化,當已知被標化組的年齡別死亡率時,宜采用直接法計算標準化率;當不知道被標化組的年齡別死亡率,只有年齡別人口數和死亡總數時,可采用間接法。4. 常用的動態(tài)數列分析指標有:絕對增長量、發(fā)展速度與增長速度、平均發(fā)展速度與平均增長速度。絕對增長量是指事物現象在一定時期增長的絕對值;發(fā)展速度與增長速度都是相對比指標,用以

9、說明事物現象在一定時期的速度變化;平均發(fā)展速度是指一定時期內各環(huán)比發(fā)展速度的平均值,用以說明事物在一定時期內逐年的平均發(fā)展程度;平均增長速度是說明事物在一定時期內逐年的平均增長程度。5. 標準化法的目的是通過選擇同一參照標準,消除混雜因素的影響,使算得的標準化率具有可比性。但標準化率并不代表真實水平,選擇的標準不同,計算出的標準化率也不相同。因此,標準化率僅用于相互間的比較,實際水平應采用未標化率來反映。樣本的標準化率是樣本指標,亦存在抽樣誤差,若要比較其代表的總體標準化率是否相同,需作假設檢驗。注意標準化方法的選用。如對死亡率的年齡構成標準化,當已知被標化組的年齡別死亡率時,宜采用直接法計算

10、標準化率。但當被標化組各年齡段人口數太少,年齡別死亡率波動較大時,宜采用間接法。各年齡組率若出現明顯交叉,或呈非平行變化趨勢時,則不適合采用標準化法,宜分層比較各年齡組率。此外,對于因其它條件不同,而非內部構成不同引起的不可比性問題,標準化法難以解決。二、案例辨析題該結論不正確。因為該醫(yī)生所計算的指標是構成比,只能說明98例女性生殖器潰瘍患者中,3種病原體感染所占的比重,不能說明女性3種病原體感染發(fā)生的頻率或強度,該醫(yī)生犯了以構成比代替率的錯誤。三、最佳選擇題1. B 2. A 3. D 4. E 5. D 6. D 7. C 8. C 9. B四、綜合分析題1. 解:表5-3 經常吸煙與慢性

11、阻塞性肺病(COPD)的關系分 組調查人數經常吸煙經常吸煙率(%)是否COPD患者35623112564.89非COPD患者47918329638.20COPD患者的經常吸煙率:231/356100%=64.89%非COPD患者經常吸煙率:183/479100%=38.20%COPD患者的經常吸煙率比非COPD患者高26.69%還需進一步對作假設檢驗(見第十一章),若經檢驗有統(tǒng)計學意義,可以認為經常吸煙與慢性阻塞性肺病(COPD)有一定的關系。 輸出結果2. 解: 表5-4 某地居民19982004年某病死亡率(1/10萬)動態(tài)變化年份符號死亡率絕對增長量發(fā)展速度增長速度 累計逐年定基比環(huán)比定

12、基比環(huán)比1998a0160.51999a1144.2-16.3-16.30.900.90-0.10-0.102000a2130.0-30.5-14.20.810.90-0.19-0.102001a3120.2-40.3-9.80.750.92-0.25-0.082002a485.6-74.9-34.60.530.71-0.47-0.292003a569.5-91.0-16.10.430.81-0.57-0.192004a638.5-122.0-31.00.240.55-0.76-0.45該病死亡率的平均發(fā)展速度該病死亡率的平均增長速度3. 解:因為該地男、女性的年齡構成有所不同,為了消除年齡構

13、成的不同對HBsAg陽性率的影響,應先進行標準化再進行比較。根據本題資料,以男、女合計為標準人口,已知被標化組的年齡別陽性率,采用直接法計算標準化陽性率。表5-5 直接法計算某地不同年齡、性別人群的HBsAg標準化陽性率(%)年齡組標準人口數男性女性原陽性率預期陽性數原陽性率預期陽性數 010812.3024.902.3225.092014732.7139.972.7240.024015466.0693.636.4699.866014087.52105.858.60121.04合 計5508(N)5.11264 ()4.86286()男性HBsAg標準化陽性率: 女性HBsAg標準化陽性率:

14、可見,經標準化后女性HBsAg陽性率高于男性。輸出結果注:將SPSS輸出的sp1的和除以sp的和,得男性HBsAg標準化陽性率;sp2的和除以sp的和,得女性HBsAg標準化陽性率。第六章 總體均數的估計【習題解析】一、思考題1抽樣研究中,由于同質總體中的個體間存在差異,即個體變異,因而從同一總體中隨機抽取若干樣本,樣本均數往往不等于總體均數,且各樣本均數之間也存在差異。這種由個體變異產生的、隨機抽樣引起的樣本均數與總體均數間的差異稱均數的抽樣誤差。決定均數抽樣誤差大小的因素主要為樣本含量和標準差。2樣本均數的抽樣分布的特點有:各樣本均數未必等于總體均數;樣本均數之間存在差異;樣本均數服從正態(tài)

15、分布;樣本均數的變異范圍較原變量的變異范圍??;隨著樣本含量的增加,樣本均數的變異范圍逐漸縮小。3標準差與標準誤的區(qū)別在于:計算公式:標準差為,標準誤為;統(tǒng)計學意義:標準差越小,說明個體值相對越集中,均數對數據的代表性越好;而標準誤越小,說明樣本均數的分布越集中,樣本均數與總體均數的差別越小,抽樣誤差越小,由樣本均數估計總體均數的可靠性越大;用途:標準差用于描述個體值的變異程度,標準誤用于描述均數的抽樣誤差大小。標準差與標準誤的聯系:當樣本量一定時,標準誤隨標準差的增加而增加,公式為:。4數理統(tǒng)計的中心極限定理:從均數為,標準差為的正態(tài)總體中進行獨立隨機抽樣,其樣本均數服從均數為,標準差為的正態(tài)

16、分布;即使是從非正態(tài)總體中進行獨立隨機抽樣,當樣本含量逐漸增加時,其樣本均數的分布逐漸逼近于均數為,標準差為的正態(tài)分布。越大,抽樣誤差越大,由樣本均數估計總體均數的可靠性越小。反之,越小,抽樣誤差越小,由樣本均數估計總體均數的可靠性越大。計算總體均數置信區(qū)間的通式為:;當樣本含量較大時,例如,分布近似標準正態(tài)分布,可用值代替值,作為置信區(qū)間的近似計算,相應的置信度為時,總體均數的置信區(qū)間為:。5置信區(qū)間與醫(yī)學參考值范圍的區(qū)別見表6-1。表6-1 均數的置信區(qū)間與醫(yī)學參考值范圍的區(qū)別區(qū)別均數的置信區(qū)間醫(yī)學參考值范圍意義按一定的置信度()估計的總體均數所在的區(qū)間范圍大多數“正常人”的某項解剖、生理

17、、生化指標的波動范圍計算公式未知:()未知而n較大:()已知:()正態(tài)分布法: 雙側95%的參考值范圍為()偏態(tài)分布法:單側下限95%的參考值范圍為單側上限95%的參考值范圍為用途用于總體均數的估計或假設檢驗判斷觀察對象的某項指標正常與否,為臨床診斷提供參考二、案例辨析題該學生誤用醫(yī)學參考值范圍的公式來計算總體均數的95%置信區(qū)間,正確計算公式為:,二者的主要區(qū)別在于,計算醫(yī)學參考值范圍時應該用“標準差”,計算置信區(qū)間時應該用標準誤。根據置信區(qū)間的公式算得2005年該市7歲男孩身高的95%置信區(qū)間為(122.01,122.99)。 三、最佳選擇題1C 2E 3E 4A 5E 6A 7E 8B

18、四、綜合分析題1解:由于該樣本為小樣本,故用公式估計總體均數95%置信區(qū)間為(8.27, 10.03)mm/h;用公式估計總體均數99%置信區(qū)間為(7.96, 10.34)mm/h。輸出結果Descriptives StatisticStd. Error紅細胞沉降率Mean9.1481.4256395% Confidence Interval for MeanLower Bound8.2697 Upper Bound10.0266 5% Trimmed Mean9.1795 Median9.4288 Variance4.529 Std. Deviation2.12816 Minimum5.01

19、 Maximum12.68 Range7.67 Interquartile Range2.73 Skewness-.250.464Kurtosis-.429.902DescriptivesStatisticStd. Error紅細胞沉降率Mean9.1481.4256399% Confidence Interval for MeanLower Bound7.9576 Upper Bound10.3386 5% Trimmed Mean9.1795 Median9.4288 Variance4.529 Std. Deviation2.12816 Minimum5.01 Maximum12.68

20、Range7.67 Interquartile Range2.73 Skewness-.250.464Kurtosis-.429.9022解:抽樣誤差為1.82;由于該樣本為大樣本, 故用公式估計正常人ET含量的95%置信區(qū)間為(77.43, 84.57)ng/L。輸出結果Descriptives StatisticStd. Error血漿內皮素Mean80.98911.8203395% Confidence Interval for MeanLower Bound77.3771 Upper Bound84.6010 5% Trimmed Mean80.8639 Median79.5837 V

21、ariance331.362 Std. Deviation18.20334 Minimum34.02 Maximum129.20 Range95.17 Interquartile Range21.75 Skewness.182.241Kurtosis.140.4783解:由于兩樣本均為小樣本, 故用公式估計總體均數95%置信區(qū)間,肺心病組血液二氧化碳分壓的95%置信區(qū)間為(7.86 , 13.10)kpa;慢性支氣管炎合并肺氣腫組血液二氧化碳分壓的95%置信區(qū)間為(5.41 , 6.83)kpa。由于方差不齊,應當選擇方差不齊時的結果。兩組患者的血液二氧化碳分壓差值的95%置信區(qū)間為(1.66

22、, 7.05)kpa,該區(qū)間不包含0,可以認為肺心病患者與慢性支氣管合并肺氣腫患者的均數不同,肺心病患者較高。輸出結果Descriptives 組別 StatisticStd. Error二氧化碳壓肺心病組Mean10.47821.2656495% Confidence Interval for MeanLower Bound7.8600 Upper Bound13.0964 5% Trimmed Mean10.2266 Median10.3473 Variance38.444 Std. Deviation6.20035 Minimum1.59 Maximum24.30 Range22.71

23、Interquartile Range7.13 Skewness.615.472Kurtosis-.030.918慢性支氣管炎合并肺氣腫組Mean6.1228.3380995% Confidence Interval for MeanLower Bound5.4151 Upper Bound6.8304 5% Trimmed Mean6.1266 Median6.0160 Variance2.286 Std. Deviation1.51198 Minimum2.93 Maximum9.25 Range6.32 Interquartile Range1.78 Skewness-.081.512K

24、urtosis.192.992Group Statistics 組別NMeanStd. DeviationStd. Error Mean二氧化碳壓肺心病組2410.47826.200351.26564 慢性支氣管炎合并肺氣腫組206.12281.51198.33809Independent Samples Test Levenes Test for Equality of Variancest-test for Equality of MeansFSig.tdfSig. Mean DifferenceStd. Error Difference95% Confidence Interval of

25、 the Difference LowerUpper二氧化碳壓Equal variances assumed17.431.0003.06142.0044.355471.422901.483947.22700Equal variances not assumed 3.32526.238.0034.355471.310021.663877.04706第八章 t檢驗【習題解析】一、思考題1理論根據是小概率事件和小概率反證法。值表示成立時,出現等于及大于(或等于及小于)現有樣本統(tǒng)計量的概率。則表示在成立的前提下,得到現有樣本統(tǒng)計量的概率為小概率事件,所以拒絕。2檢驗中是選擇單側檢驗還是雙側檢驗,需要根

26、據專業(yè)知識來確定。例如,根據專業(yè)知識能確定未知總體均數不會大(小)于標準值(單樣本檢驗),則可用單側檢驗,否則,采用雙側檢驗。3配對檢驗的應用條件是資料為配對設計,且數據差值服從正態(tài)分布。4理論上講應取得大一些,如0.10或0.20,目的是減少犯II型錯誤的概率;在實際應用中,常取。5變量變換的目的在于使變換后的資料滿足正態(tài)分別或方差齊性等條件,便于進一步的統(tǒng)計分析。6可以,大樣本兩組均數的Z檢驗是兩組均數比較檢驗的近似。二、案例辨析題該醫(yī)生的分析結果是錯誤的。正確作法應是分別將甲、乙兩藥各自治療前后的血沉值作差值,比較兩組差值的均值是否有差別,具體步驟如下:(1) 正態(tài)性檢驗分別對甲、乙兩種

27、藥物治療前后的血沉差值進行正態(tài)性檢驗。甲藥: 乙藥: 故,甲藥、乙藥兩組資料的差值均服從正態(tài)分布。(2) 方差齊性檢驗1) 建立檢驗假設,確定檢驗水準 ,兩差值總體方差相等 ,兩差值總體方差不等2)計算檢驗統(tǒng)計量 3) 確定值,作出統(tǒng)計推斷 查界值表(附表4),得,按的水準,不拒絕,差異不具有統(tǒng)計學意義,尚不能認為兩差值總體方差不等。(3) 以差值為資料,作兩組均值檢驗1) 建立檢驗假設,確定檢驗水準:,即甲、乙兩種藥物的療效無差別:,即甲、乙兩種藥物的療效有差別2) 計算檢驗統(tǒng)計量3) 確定P值,作出統(tǒng)計推斷查界值表(附表3),得,按水準,拒絕,接受,差異具有統(tǒng)計學意義,可認為甲、乙兩種藥物

28、的療效有差別。由于乙種藥物治療前后血沉值的差值較大(均數為5.8),故乙藥物治療效果要好于甲藥。輸出結果三、最佳選擇題1.E 2.C 3.C 4.B 5.E 6.E 7.C 四、綜合分析題1. 解:本題應進行單樣本檢驗,可按如下步驟完成:(1) 資料的正態(tài)性檢驗 ,故資料服從正態(tài)分布。(2) 單樣本檢驗 1) 建立檢驗假設,確定檢驗水準,即該山區(qū)成年男子的脈搏與一般成年男子脈搏無差別,即該山區(qū)成年男子的脈搏與一般成年男子脈搏有差別2) 計算檢驗統(tǒng)計量由原始資料計算得:,于是3) 確定P值,作出統(tǒng)計推斷查界值表(附表3),得,按水準,拒絕,接受,差異有統(tǒng)計學意義,可以認為該山區(qū)成年男子脈搏與一般

29、成年男子脈搏有差別。輸出結果2解:本題應采用配對檢驗,完成步驟如下:(1) 分別作甲、乙兩藥治療前后差值的正態(tài)性檢驗 由案例辨析題中的結論可知,資料均服從正態(tài)分布。 (2) 對甲、乙兩藥分別作配對檢驗 甲藥:1) 建立檢驗假設,確定檢驗水準,即甲藥治療前后血沉值無差別,即甲藥治療前后血沉值有差別2) 計算檢驗統(tǒng)計量3) 確定P值,作出統(tǒng)計推斷查界值表(附表3),得,按水準,拒絕,差異有統(tǒng)計學意義,即甲藥降低血沉有效。乙藥:1) 建立檢驗假設,確定檢驗水準,即乙藥治療前后血沉值無差別,即乙藥治療前后血沉值有差別2) 計算檢驗統(tǒng)計量 3) 確定P值,作出統(tǒng)計推斷查界值表(附表3),得,按水準,拒絕

30、,差異有統(tǒng)計學意義,即乙藥降低血沉有效。輸出結果3解:本題資料為抗體滴度數據,一般服從對數正態(tài)分布,宜采用成組設計的兩小樣本幾何均數比較的檢驗。(1) 將原始數據取常用對數值后分別記為、(2) 正態(tài)性檢驗用SPSS統(tǒng)計軟件算得變量、的正態(tài)性檢驗結果。: : 故,兩組資料均服從正態(tài)分布。(3) 方差齊性檢驗1) 建立檢驗假設,確定檢驗水準,兩總體方差相等 ,兩總體方差不等2) 計算檢驗統(tǒng)計量 ,于是3) 確定值,作出統(tǒng)計推斷查界值表(附表4),得。按水準,拒絕,差異有統(tǒng)計學意義,故可認為兩總體方差不相等。(4) 兩樣本均數()的檢驗1) 建立檢驗假設,確定檢驗水準 兩總體幾何均數的對數值相等 兩

31、總體幾何均數的對數值不等2) 計算檢驗統(tǒng)計量 3) 確定值,作出統(tǒng)計推斷查界值表(附表3),得。按水準,拒絕,接受,差異有統(tǒng)計學意義,可認為兩組的平均效價有差別。輸出結果第十章 二項分布和Poisson分布及其應用 【習題解析】一、思考題1. Bernoulli試驗的適用條件如下:每次試驗只會發(fā)生兩種互斥結果之一,即兩種互斥結果的概率之和恒等于1;在相同的試驗條件下,每次試驗產生某種結果(如“陽性”)的概率固定不變;重復試驗是互相獨立的,即任何一次試驗結果的出現不會影響其它試驗結果出現的概率。2. Poisson分布的性質如下:總體均數與總體方差相等;當n很大,而很小,且為常數時,Poisso

32、n分布可看作是二項分布的極限分布;當增大時,Poisson分布漸近正態(tài)分布,一般而言,時,Poisson分布資料可作為正態(tài)分布處理;Poisson分布具備可加性,即對于服從Poisson分布的m個互相獨立的隨機變量,它們之和也服從Poisson分布,且其均數為這m個隨機變量的均數之和;的大小決定了Poisson分布的圖形特征。3. 隨機變量X服從二項分布,是指在n重Bernoulli試驗中,發(fā)生某種結果(如“陽性”)的次數的一種概率分布,其恰好發(fā)生X個陽性的概率為() ,且總有 。而隨機變量X服從Poisson分布,是指X滿足:取值范圍為;相應的概率為 ,且總有 。在總體率很小,而樣本含量(試

33、驗次數)n趨向于無窮大時,二項分布近似于Poisson分布。因此, Poisson分布可看作是二項分布的一種極限情況,可用來描述小概率事件的發(fā)生規(guī)律。 4. 二項分布、Poisson分布和正態(tài)分布間的聯系為:在n很大,而很小,且為常數時,二項分布的極限分布為Poisson分布;在n較大、不接近0也不接近1時,二項分布近似正態(tài)分布,而相應的樣本率p的分布也近似正態(tài)分布。當增大時,Poisson分布漸近正態(tài)分布,一般而言,20時,Poisson分布資料可作為正態(tài)分布處理。二、案例辨析題不正確。溶液中的細菌數可以認為服從Poisson分布,當其“單位容積”所含細菌數時,可采用正態(tài)近似法估計總體均數的

34、()置信區(qū)間。但本例溶液的“單位容積”為10ml,應先用正態(tài)近似法估計出該溶液每10ml所含細菌數的95%置信區(qū)間,再除以10即得到每1ml所含細菌數的95%置信區(qū)間。由式(10.16)可得,每10ml該溶液所含細菌數的95%置信區(qū)間為,故每1ml該溶液所含細菌數的95%置信區(qū)間為。三、最佳選擇題1. A2. C3. B4. E5. C6. E7. E8. C四、綜合分析題1. 解:本例可認為治療有效人數X服從二項分布,根據研究目的,選用單側檢驗。其假設檢驗步驟為:(1) 建立檢驗假設,確定檢驗水準H0:,該藥新劑型的療效等于常規(guī)劑型H1:,該藥新劑型的療效優(yōu)于常規(guī)劑型單側 (2) 計算概率本

35、例,(3) 作出統(tǒng)計推斷由結果可見,按水準,不拒絕H0,差異無統(tǒng)計學意義,尚不能認為該藥新劑型能增加療效。2. 解:本例中,乳腺癌患病人數可認為服從Poisson分布,兩個樣本的觀察單位數不相等,以10000人為一個單位,則,。設甲、乙兩地婦女乳腺癌的患病率分別為和,其假設檢驗步驟為:(1) 建立檢驗假設,確定檢驗水準H0:,兩地婦女乳腺癌患病率相等H1:,甲地婦女乳腺癌患病率高于乙地單側 (2) 計算檢驗統(tǒng)計量(3) 作出統(tǒng)計推斷查t界值表(附表3 ),得,按水準,不拒絕H0,差異無統(tǒng)計學意義,尚不能認為甲地婦女乳腺癌的患病率高于乙地。第十一章 檢驗【習題解析】一、思考題1. 檢驗的基本思想

36、:在成立的條件下,推算出各個格子的理論頻數T,然后利用理論頻數T和實際頻數A構造統(tǒng)計量,反映實際頻數與理論頻數的吻合程度。若無效假設成立,則各個格子的A與T相差不應該很大,即統(tǒng)計量不應該很大。A與T相差越大,值越大,相對應的P值越小,當,則越有理由認為無效假設不成立,繼而拒絕,作出統(tǒng)計推斷。由于格子越多,值也會越大,因而考慮值大小的意義時,應同時考慮格子數的多少(嚴格地說是自由度的大小),這樣值才能更準確地反映A與T的吻合程度。檢驗可用于:獨立樣本兩個或多個率或構成比的比較,配對設計兩樣本率的比較,頻數分布的擬合優(yōu)度檢驗,線性趨勢檢驗等。2. 對不同設計類型的資料,檢驗的應用條件不同: (1)

37、 獨立樣本四格表的檢驗1) 當,且時,用非連續(xù)性校正的檢驗。或2) 當,且有時,用連續(xù)性校正的檢驗或用四格表的確切概率法。 或 3) 當或時,用四格表的確切概率法。(2) 獨立樣本列聯表檢驗的專用公式為:1) 不宜有1/5以上格子的理論頻數小于5,或有1個格子的理論頻數小于1。2) 結果為有序多分類變量的RC列聯表,在比較各處理組的平均效應有無差別時,應該用秩和檢驗或Ridit檢驗。(3) 配對四格表的檢驗1) 當時,。2) 當時,需作連續(xù)性校正,。3. 四格表的Z檢驗和檢驗的聯系,體現在:能用四格表Z檢驗進行兩樣本率比較的資料,都可以用檢驗。四格表的雙側Z檢驗與檢驗是完全等價的,兩個統(tǒng)計量的

38、關系為,相對應的界值的關系為。4. 擬合優(yōu)度檢驗是根據樣本的頻數分布檢驗其總體是否服從某特定的理論分布。按照該理論分布計算的頻數稱為理論頻數;從樣本觀察到的頻數稱為實際頻數。利用檢驗,推斷實際頻數與理論頻數的吻合程度。5. 檢驗的理論是基于分布,但是只有在大樣本時檢驗統(tǒng)計量才近似服從分布,才能使用檢驗公式。如四格表資料,若,且有時,尚可以校正檢驗統(tǒng)計量使其近似服從分布;當時,這種近似性就很差,檢驗就不適用了,只能用確切概率法。二、案例辨析題該研究的試驗設計和統(tǒng)計分析方法均存在不合理的地方。試驗設計方面:樣本含量偏小。該研究者在臨床試驗設計之初,就應該嚴格按照臨床試驗設計要求,進行樣本含量的估計

39、,以保證足夠的檢驗效能。此外,由于急性細菌性下呼吸道感染,某些癥狀療效的判斷可能易受主觀因素的影響,因此應采用盲法。統(tǒng)計分析方面:由于樣本含量小于40,不能采用檢驗,應采用四格表的確切概率法。具體步驟為:1. 建立檢驗假設,確定檢驗水準:,即兩種抗生素治療急性細菌性下呼吸道感染的有效率相同:,即兩種抗生素治療急性細菌性下呼吸道感染的有效率不同2. 計算概率:在周邊合計不變的條件下,以最小行、列合計所對應的格子為基礎,其取值的變動范圍為從0到最小周邊合計。本例中,將甲藥治療無效對應的格子的取值從0增至10,可得到11個四格表,并按第1個格子的值由小到大排列,結果見下表。表11-4 Fisher確

40、切概率法計算用表序號i有效無效14100.00003160 2590.001071513680.011991424770.063971335860.181911246950.2910511571040.2668010681130.13860979*1220.0389888101310.0053379111400.00027610* 表11-1數據按下式計算各四格表的概率,結果見表11-4最后一列。3. 確定P值,作出統(tǒng)計推斷將小于等于原四格表概率的所有四格表對應的概率相加,得到雙側概率 按水準,不拒絕,差異無統(tǒng)計學意義,尚不能認為兩種抗生素治療急性細菌性下呼吸道感染的療效有差別。該結果與該研究

41、者的結論相反。因此,在統(tǒng)計分析時應注意所選方法的應用條件。三、最佳選擇題1. A 2. E 3. D 4. E 5. D 6. A 7. E 8. B 9. B 10. C四、綜合分析題1. 解:(1) 資料整理后的表格為表11-5 A、B兩種抗生素治療單純性尿路感染的療效組別有效無效合計有效率(%)抗生素A37 54288.10 抗生素B29134269.05 合計66188478.57 (2) 該研究屬于完全隨機設計,所得資料為二分類資料。(3) 由于該資料為分類資料,欲比較A、B兩藥的有效率,宜選用獨立樣本四格表的檢驗。具體步驟為:1) 建立檢驗假設,確定檢驗水準:,即兩種抗生素治療單純

42、性尿路感染的有效率相同:,即兩種抗生素治療單純性尿路感染的有效率不同2) 計算檢驗統(tǒng)計量本題中最小行、列合計對應的格子為采用抗生素A治療無效者或抗生素B治療無效者,其理論頻數,故采用四格表專用公式: 3) 確定P值,作出統(tǒng)計推斷查界值表(附表9),得,按水準,拒絕,接受,差異有統(tǒng)計學意義,可以認為兩種抗生素治療單純性尿路感染的療效不同,A藥的有效率高于B藥。輸出結果2. 解:(1) 資料整理后的表格為表11-6 兩種CT對煤工塵肺肺氣腫的檢查結果螺旋CTHRCT合計有無有73275無71421合計801696 (2) 該研究屬于配對設計,所得數據為分類資料。(3) 該資料為分類資料,欲比較螺旋

43、CT和HRCT在煤工塵肺肺氣腫檢出方面有無差異,宜選用配對四格表的檢驗。具體步驟為:1) 建立檢驗假設,確定檢驗水準:,即兩種CT檢出煤工塵肺肺氣腫的結果無差異:,即兩種CT檢出煤工塵肺肺氣腫的結果有差異2) 計算檢驗統(tǒng)計量本題,應采用配對四格表檢驗的校正公式: 3) 確定P值,作出統(tǒng)計推斷查界值表(附表9),得,按水準,不拒絕,差異無統(tǒng)計學意義,尚不能認為兩種CT煤工塵肺肺氣腫的檢出率有差異。 輸出結果3. 解:本題資料為分類資料,欲比較3種方案治療單純性肥胖的有效率有無差異,宜選用獨立樣本列聯表的檢驗。具體步驟為:1) 建立檢驗假設,確定檢驗水準:,即3種方案治療單純性肥胖的有效率相同:3

44、種方案治療單純性肥胖的有效率不全相同2) 計算檢驗統(tǒng)計量最小理論頻數,故直接將數據帶入獨立樣本列聯表檢驗的公式: 3) 確定P值,作出統(tǒng)計推斷查界值表(附表9),得,按水準,不拒絕,差異無統(tǒng)計學意義,尚不能認為3種方案治療單純性肥胖的有效率不同。輸出結果4. 解:(1) 該資料為分類資料,欲比較兩藥治療胃潰瘍的療效構成比有無差異,宜選用獨立樣本列聯表的檢驗。先將資料整理成下表形式:表11-7 兩種藥物治療治療胃潰瘍的療效組別痊愈顯效進步無效合計試驗組20(58.82)6(17.65)4(11.76)4(11.76)34(100)對照組16(47.06)4(11.76)8(23.53)6(17.

45、65)34(100)合計3610121068假設檢驗的具體步驟為:1) 建立檢驗假設,確定檢驗水準:兩藥治療胃潰瘍的療效構成比相同:兩藥治療胃潰瘍的療效構成比不同2) 計算檢驗統(tǒng)計量最小理論頻數,故直接將數據帶入獨立樣本列聯表檢驗的公式: 3) 確定P值,作出統(tǒng)計推斷查界值表(附表9),得,按水準,不拒絕,差異無統(tǒng)計學意義,尚不能認為兩藥治療胃潰瘍的療效構成比不同。(2) 若比較兩藥有效率有無差異,宜選用獨立樣本四格表的檢驗。按題意將資料整理成下表形式:表11-8 兩種藥物治療治療胃潰瘍的療效組別有效無效合計試驗組26 834對照組20 1434合計462268(3) 若比較兩藥治療胃潰瘍的療

46、效大小,宜選用秩和檢驗。因為本題中治療效果呈等級變化,由于檢驗未考慮“療效”的等級順序,因此經檢驗只能說明各處理效應的構成比是否有差別。而秩和檢驗考慮了“療效”的等級順序,用于比較療效大小比檢驗更合理。輸出結果以上是問題(1)的SPSS分析過程。問題(2)的SPSS分析過程請參見本章綜合分析題的第1題,問題(3)的SPSS分析過程請參見第十二章相關內容。第十三章 雙變量關聯性分析【習題解析】一、思考題1雙變量關聯性分析的目的在于推斷從某一總體中隨機抽取的同一份樣本觀測出的兩個變量間是否存在關聯性,以及這種關聯性的密切程度如何。關聯性只反映變量間數量上的關系,但數量上的關聯并不表示專業(yè)上的因果關

47、系,是否確為因果關系還需結合專業(yè)知識、因果邏輯上的時間先后順序等作進一步判定。 222列聯表的關聯性分析與兩樣本率比較的檢驗的數據形式非常相似,檢驗的公式以及應用條件也完全相同。但區(qū)別在于:兩樣本率比較的檢驗是從兩個總體中分別抽取樣本,兩樣本有各自的頻數分布,所檢驗的是兩總體的率是否相同;而22列聯表的關聯性分析是從同一個總體中進行隨機抽樣,對樣本中的每個個體考察其兩個變量的關系,檢驗兩個分類變量之間是否存在關聯性或者說是否獨立。3P值越小,說明越有理由拒絕,犯I型錯誤的概率越小。相關系數r經假設檢驗有統(tǒng)計學意義且得到非常小的P值,表示有足夠的理由認為兩變量總體相關系數,只能定性回答兩變量是否

48、存在直線相關,并非意味著其直線相關的強度。若要定量回答相關性的強弱,需結合樣本相關系數r的大小和總體相關系數的置信區(qū)間來說明。4區(qū)別:Pearson積矩相關適用于二元正態(tài)分布資料,Spearman秩相關適用于不服從正態(tài)分布、總體分布未知、存在極端值或原始數據用等級表示的資料。Pearson積矩相關是基于原始數據進行統(tǒng)計分析,而Spearman秩相關是將原始數據進行秩變換后進行統(tǒng)計分析。Pearson積矩相關是參數檢驗方法,而Spearman秩相關不以特定的總體分布為前提,為非參數檢驗的方法。聯系:兩種相關系數的取值都介于-1和1之間,無單位,小于 0 為負相關,大于0為正相關。用原始數據的秩次

49、來計算Pearson相關系數,得到的即為Spearman秩相關系數。二、案例辨析題該案例是對同一樣本的兩個分類變量之間的關聯性進行分析,檢驗的計算方式不變,結果仍為84.533,但下結論時最好不要從“不同年齡的AKP酶反應活性不同”演繹到“兩變量有關系”,而應為“按=0.05水準,拒絕,可認為年齡與AKP酶反應活性之間有關”。此外,可結合列聯系數說明其關聯強度,。由于年齡與AKP酶反應活性都是有序分類變量,可考慮進行Spearman秩相關分析,得,單側,可認為隨著年齡的增加,AKP酶反應活也降低。三、最佳選擇題1. B 2. C 3. C 4.D 5.A 6.B 7.B 8.C 9. D四、綜

50、合分析題1解:(1) 由散點圖(略)結合兩個變量的正態(tài)性檢驗,可進行直線相關分析。由式(13.1)分別算出但需進行假設檢驗以推斷總體上這種相關是否存在。(2) 檢驗相關是否具有統(tǒng)計學意義1) 建立檢驗假設,確定檢驗水準:,即血漿清蛋白含量及血紅蛋白含量之間無直線相關關系 :,即血漿清蛋白含量及血紅蛋白含量之間有直線相關關系2) 計算檢驗統(tǒng)計量由式(13.4)和式(13.5)得3) 確定P值,作出統(tǒng)計推斷查t界值表(附表3),得,按=0.05水準,拒絕,接受,可以認為該病成年男性患者血漿清蛋白含量與血紅蛋白含量呈正相關關系。輸出結果血紅蛋白含量血漿清蛋白含量(3) 結果解釋通過對血漿清蛋白和血紅蛋白兩變量的正態(tài)性檢驗可以看出:兩者的P值分別為0.200,0. 200,可以認為兩變量都服從正態(tài)分布,故進行Pearson積矩相關分析。兩者相關系數為0.916,按水準拒絕,可以認為該病成年男性患者血漿清蛋白和血紅蛋白兩變量呈正相關關系。 2解:此問題屬于配對設計列聯表的關聯性分析。(1) 建立檢驗假設,確定檢驗水準:甲法和乙法之間互相獨立:甲法和乙法之間互相關聯(2) 計算檢驗統(tǒng)計量將表13-3中數據

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論