第5講假設檢驗1北京大學醫(yī)學部,統計學基礎,統計學課件_第1頁
第5講假設檢驗1北京大學醫(yī)學部,統計學基礎,統計學課件_第2頁
第5講假設檢驗1北京大學醫(yī)學部,統計學基礎,統計學課件_第3頁
第5講假設檢驗1北京大學醫(yī)學部,統計學基礎,統計學課件_第4頁
第5講假設檢驗1北京大學醫(yī)學部,統計學基礎,統計學課件_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第第 5 5 講講 參數參數假設檢驗假設檢驗 假設檢驗是統計推斷的另一種方式,它與區(qū)間假設檢驗是統計推斷的另一種方式,它與區(qū)間 估計的差別主要在于:區(qū)間估計是用給定的大估計的差別主要在于:區(qū)間估計是用給定的大 概率推斷出總體參數的范圍,而假設檢驗是以概率推斷出總體參數的范圍,而假設檢驗是以 小概率為標準,對總體的狀況所做出的假設進小概率為標準,對總體的狀況所做出的假設進 行判斷。假設檢驗與區(qū)間估計結合起來,構成行判斷。假設檢驗與區(qū)間估計結合起來,構成 完整的統計推斷內容。假設檢驗分為兩類:一完整的統計推斷內容。假設檢驗分為兩類:一 類是參數假設檢驗,另一類是非參數假設檢驗。類是參數假設檢驗,另

2、一類是非參數假設檢驗。 本章討論參數檢驗方法。本章討論參數檢驗方法。 第五講第五講 參數假設檢驗參數假設檢驗第一節(jié)第一節(jié) 假設檢驗的基本思想假設檢驗的基本思想 一、小概率原理一、小概率原理 二、假設檢驗的一些基本概念二、假設檢驗的一些基本概念問題討論問題討論某種藥物有強烈作用,按規(guī)定每片有效成分含某種藥物有強烈作用,按規(guī)定每片有效成分含量均值為量均值為0.50.5mgmg,標準差為標準差為0.010.01mgmg。假定藥片。假定藥片有效成分含量服從正態(tài)分布。問怎樣判斷這個有效成分含量服從正態(tài)分布。問怎樣判斷這個廠家的產品是否符合要求?廠家的產品是否符合要求?要解決的問題:是否合格?要解決的問題

3、:是否合格??0.5 ?0.01 有效成分含量為隨機變量有效成分含量為隨機變量問題問題3 3: 時,能否說明產品不合格?時,能否說明產品不合格?討論討論判斷方法:抽樣判斷方法:抽樣問題問題1 1 抽樣方法?抽樣方法?問題問題2 2 樣本容量?樣本容量?估計估計x s 0.5x 隨機抽樣模擬隨機抽樣模擬1 1假設假設: :藥品符合要求藥品符合要求= =0 0=0.5;=0.5;data a1; n=12;sigma=0.01;mu=0.5;seed=1325; k=20; do j=1 to k; do i=1 to n; x=sigma*rannor(seed)+mu;/*xN(mu,sigm

4、a2)*/ output; end;end;proc means mean; var x; class j; output out=b1 mean=xmean;run;隨機抽樣模擬隨機抽樣模擬1 1隨機抽樣模擬隨機抽樣模擬2 2假設假設: :藥品不符合要求藥品不符合要求0 0=0.5;=0.5;8data a2; n=12;sigma=0.01;mu=0.49; seed=1325; k=20; do j=1 to k; do i=1 to n; x=sigma*rannor(seed)+mu;/*xN(mu,sigma2)*/ output; end;end;proc means mean;

5、 var x; class j; output out=b2 mean=xmean;run;隨機抽樣模擬隨機抽樣模擬2 2例例5.1 5.1 某種藥物有強烈作用,按規(guī)定有效成某種藥物有強烈作用,按規(guī)定有效成分含量為分含量為0.50.5mg/mg/片。今隨機抽取某廠生產的這片。今隨機抽取某廠生產的這種藥品種藥品1212片,測得平均有效含量為片,測得平均有效含量為0.49380.4938mgmg。假定藥片有效成分含量服從標準差為假定藥片有效成分含量服從標準差為0.010.01mgmg的的正態(tài)分布正態(tài)分布。問這個廠家的產品是否符合要求?。問這個廠家的產品是否符合要求?例例5.15.1解解 該藥廠此藥

6、品的有效成分含量為該藥廠此藥品的有效成分含量為X. .考慮兩個假設考慮兩個假設: :( (a) )該藥廠的此藥品符合要求該藥廠的此藥品符合要求= =0 0=0.5;=0.5;( (b) )該藥廠的此藥品不符合要求該藥廠的此藥品不符合要求0 0=0.5.=0.5.例例5.15.1樣本均值樣本均值 與與0.50.5有差異有差異, ,差異產差異產生的兩種情形生的兩種情形: :0.4938x (1 1)抽樣誤差抽樣誤差(2 2) 抽樣誤差抽樣誤差0.5 0.5 2(,0.01)0.5/12XN0.450.500.550.60204060801001201400.500.550.602040608010

7、0120140討論討論樣本均值樣本均值 與與0.50.5有差異有差異, ,差異產生的原因差異產生的原因: :x(1 1)標準差為標準差為0.010.01mgmg 隨機誤差隨機誤差(2 2)隨機抽取隨機抽取 抽樣誤差抽樣誤差(3 3)0.5 討論討論=0.50.5 |0.5|X 小小大大尋找界值尋找界值c0.50.5大大|Xcm m-|Xcm m-(|)cPXmama-常-常一、小概率原理一、小概率原理例例5.1 5.1 某種藥物有強烈作用,按規(guī)定有效成某種藥物有強烈作用,按規(guī)定有效成分含量為分含量為0.50.5mg/mg/片。今隨機抽取某廠生產的這片。今隨機抽取某廠生產的這種藥品種藥品1212

8、片,測得平均有效含量為片,測得平均有效含量為0.49380.4938mgmg。假定藥片有效成分含量服從標準差為假定藥片有效成分含量服從標準差為0.010.01mgmg的的正態(tài)分布正態(tài)分布。問這個廠家的產品是否符合要求?。問這個廠家的產品是否符合要求?(1 1)假設假設=0.50.5(2 2)確定不利于假設)確定不利于假設=0.5 的范圍的范圍|0.5|Xc- - =0.50.5 |0.5|X 小小大大0.50.5大大(3 3)定義小概率事件)定義小概率事件概率小于概率小于=0.05的事件為小概率事件。的事件為小概率事件。(|)PXca am m-常-常確定確定“界界”的規(guī)則:的規(guī)則:2XPun

9、 (4)計算)計算“界界c”|0.5|0.050.01120.0112XcP- - = =20.01(,)20.51XN|0.5|0.05P Xc- - = =(0,1)N0.05 21.960.0112cu= = =1.960.01120.0057c= =椿椿(5)根據當前樣本數據作推斷)根據當前樣本數據作推斷判定判定=0.50.5不成立不成立, ,即認為即認為0.5.0.5.|0.5| |0.49380.5|0.00620.0057xc- -= =- -= = = =0.0520.50.49380.5| |2.14771.960.010.0112xun-=“反證法反證法” ” + +小概率

10、原理小概率原理矛盾!矛盾!假設假設=0.50.5不成立,不成立,0.50.5。結論結論:理論上:理論上:若假設若假設=0.50.5成立成立事實上事實上:|0.5| |0.49380.5|0.00620.0057xc-=-=事件事件 為小概率事件為小概率事件 0.50.0057Xc- - = =事件事件 不是小概率事件不是小概率事件0.50.0057Xc- - = =二、二、假設檢驗的一些基本概念假設檢驗的一些基本概念總體的均數是否等于一個特定的值:總體的均數是否等于一個特定的值:兩個總體分布的均數是否相等:兩個總體分布的均數是否相等:隨機變量隨機變量X是否服從二項分布:是否服從二項分布:( ,

11、 )XB n p12m mm m= =0m mm m= =關于總體的種種假設稱為關于總體的種種假設稱為統計假設統計假設(statistical hypothesis)(statistical hypothesis)1.1.統計假設統計假設 例例12mmmm= =測得測得140140例例3030歲以上的冠心病病人血清膽固醇為歲以上的冠心病病人血清膽固醇為220.7220.742.242.2,另有,另有487487名同齡非冠心病者血清名同齡非冠心病者血清膽固醇為膽固醇為175.4175.430.630.6,想了解冠心病病人的血,想了解冠心病病人的血清膽固醇是否較高?清膽固醇是否較高?12mmmm

12、統計假設統計假設 例例12pp= =某醫(yī)師研究洛賽克治療消化性潰瘍的療效,以某醫(yī)師研究洛賽克治療消化性潰瘍的療效,以泰胃美作為對照,觀察結果如下:泰胃美作為對照,觀察結果如下:藥物藥物有效病例有效病例無效病例無效病例總總病例數病例數泰胃美泰胃美363624246060(60%60%)洛賽克洛賽克54546 66060(90%90%)121212 ( or )pppppp統計假設統計假設 例例在冠心病普查中,研究冠心病與眼底動脈硬化在冠心病普查中,研究冠心病與眼底動脈硬化兩者之間是否存在一定的關系?兩者之間是否存在一定的關系?眼底動脈眼底動脈硬化級別硬化級別診斷結果診斷結果合計合計正常正??梢煽?/p>

13、疑冠心病冠心病0 034034011116 6357357I I737313136 69292IIII及以上及以上10010020201919139139合計合計513513444431315885882.2.假設檢驗假設檢驗利用樣本提供的信息判斷假設是否成立的利用樣本提供的信息判斷假設是否成立的統計方法,稱為統計方法,稱為假設檢驗假設檢驗( (hypothesis testing).hypothesis testing).總體的均數是否等于一個特定的值:總體的均數是否等于一個特定的值:兩個總體分布的均數是否相等:兩個總體分布的均數是否相等:隨機變量隨機變量X是否服從二項分布:是否服從二項分布

14、:( , )XB n p12m mm m= =0m mm m= =3.3.原假設與備擇假設原假設與備擇假設原假設原假設( (null hypothesis,null hypothesis,零假設零假設):):H0 0 : :=0.50.5備擇假設備擇假設( (alternative hypothesis):alternative hypothesis): H1 1 : :0.50.53.3.原假設與備擇假設原假設與備擇假設假設假設=0.5=0.5成立成立2( , )XN (0,1)XNn /2XPuna am ma as s禳禳镲镲- -镲镲 = =睚睚镲镲镲镲鉿鉿0.51.960.050.0

15、1 12XP禳禳镲镲- -镲镲 = =睚睚镲镲镲镲鉿鉿概率小于概率小于=0.05的事件為小概率事件。的事件為小概率事件。? 事件事件 為小概率事件為小概率事件0.5|1.960.01 12XU 3.3.原假設與備擇假設原假設與備擇假設0.49380.5x 0 0H0:=0.5, H1:0.5.H0:0.5, H1:=0.5.不能用一個例子去證明一個結論,因此用一個樣不能用一個例子去證明一個結論,因此用一個樣本(例子)本(例子)不能證明不能證明一個命題(假設)。但是可一個命題(假設)。但是可以用一個例子(樣本)以用一個例子(樣本)推翻推翻一個命題。一個命題。由由 確定確定c c時時 4. 4.

16、檢驗統計量檢驗統計量|0.5|0.05PXc-=-=0.05/20.50.050.0112XPu禳禳镲镲- -镲镲 = =睚睚镲镲镲镲鉿鉿0.50.0112XU 檢驗統計量檢驗統計量5.5.顯著性水平顯著性水平統計學上的結論統計學上的結論:在在=0.05=0.05的水平上的水平上, ,拒絕假設拒絕假設=0.50.5, ,認為認為0.50.5. .即認為該廠的此藥的有效成分含量與規(guī)定的水即認為該廠的此藥的有效成分含量與規(guī)定的水平平0.50.5的差異有差異有統計學意義統計學意義( (statistical statistical significance)significance). .顯著性水平

17、顯著性水平( (significance level)significance level)檢驗水平檢驗水平( (level of test)level of test) 給定檢驗水平給定檢驗水平,檢驗統計量,檢驗統計量( (即即 ) )的可的可能取值范圍被分成兩部分:小概率區(qū)域與大概能取值范圍被分成兩部分:小概率區(qū)域與大概率區(qū)域。小概率區(qū)域就是概率不超過率區(qū)域。小概率區(qū)域就是概率不超過的區(qū)域的區(qū)域,是零假設的拒絕區(qū)域;大概率區(qū)域是概率為,是零假設的拒絕區(qū)域;大概率區(qū)域是概率為 1-1-的區(qū)域,是零假設的接受區(qū)域。的區(qū)域,是零假設的接受區(qū)域。 X拒絕域:拒絕域:22(,)uu 或或2200(,

18、)uunn。 o2u2u-22nu222nu200002u2u 20un 20un 0問題:問題:1. 1. 假設檢驗要解決的是什么樣的問題?假設檢驗要解決的是什么樣的問題?2.2.在例在例5.15.1中給的條件中給的條件“正態(tài)分布正態(tài)分布”起的什么作起的什么作用?如果沒有這個條件能否解決例用?如果沒有這個條件能否解決例5.15.1的問題?的問題?3.3.為什么在例為什么在例5.15.1中樣本均值不等于規(guī)定的值時中樣本均值不等于規(guī)定的值時還不能說生產不合格?在解決例還不能說生產不合格?在解決例5.15.1問題的過程問題的過程中哪里反映了對產生差異來源的考慮?中哪里反映了對產生差異來源的考慮?4

19、.4.這里的這里的“反證法反證法”是嚴格的邏輯上的反證?是嚴格的邏輯上的反證?5.5.例例5.15.1中取不同的檢驗水平中取不同的檢驗水平, ,結論會有什么變結論會有什么變化么?如果有變化,那么這樣的檢驗方法還有化么?如果有變化,那么這樣的檢驗方法還有意義么?意義么?問題問題1 11. 1. 假設檢驗(假設檢驗(hypothesis testhypothesis test)要解決的是要解決的是什么樣的問題?什么樣的問題?利用樣本的信息判斷一些關于總體的假設是否利用樣本的信息判斷一些關于總體的假設是否成立成立( , )XB n p12m mm m= =0m mm m= =問題問題2 22.2.在

20、例在例5.15.1中給的條件中給的條件“正態(tài)分布正態(tài)分布”起的什么作起的什么作用?如果沒有這個條件能否解決例用?如果沒有這個條件能否解決例5.15.1的問題的問題例例5.1 5.1 某種藥物有強烈作用,按規(guī)定有效成某種藥物有強烈作用,按規(guī)定有效成分含量為分含量為0.50.5mg/mg/片。今隨機抽取某廠生產的這片。今隨機抽取某廠生產的這種藥品種藥品1212片,測得平均有效含量為片,測得平均有效含量為0.49380.4938mgmg。假定藥片有效成分含量服從標準差為假定藥片有效成分含量服從標準差為0.010.01mgmg的的正態(tài)分布正態(tài)分布。問這個廠家的產品是否符合要求?。問這個廠家的產品是否符

21、合要求?(3)定義小概率事件:)定義小概率事件:=0.05例例5.15.1(1 1)假設)假設=0.50.5:0. | 5|Xc- 0.50.05PXc- - = =0.011.9612c= =(2)確定不利的范圍:)確定不利的范圍:(4)計算)計算“界界”值。值。2(, 0.)0.501XN20.01(, 20.5)1XN問題問題3 33.3.為什么在例為什么在例5.15.1中樣本均值不等于規(guī)定的值時中樣本均值不等于規(guī)定的值時還不能說生產不合格?在解決例還不能說生產不合格?在解決例5.15.1問題的過程問題的過程中哪里反映了對產生差異來源的考慮?中哪里反映了對產生差異來源的考慮?樣本均值樣本

22、均值 與與0.50.5有差異有差異, ,差異產生的原因差異產生的原因: :x(1 1)標準差為標準差為0.010.01mgmg 隨機誤差隨機誤差(2 2)隨機抽取隨機抽取 抽樣誤差抽樣誤差(3 3)0.5 例例5.15.1樣本均值樣本均值 與與0.50.5有差異有差異, ,差異產生的差異產生的兩種情形兩種情形: :0.4938x (1 1) 抽樣誤差抽樣誤差(2 2) 抽樣誤差抽樣誤差0.5 0.5 2(,0.01)0.5/12XN0.05/20.50.050.01 12XPu禳禳镲镲- -镲镲 = =睚睚镲镲镲镲鉿鉿絕對差值抽樣誤差問題問題4 4矛盾!矛盾!假設假設=0.50.5不成立,不成

23、立,0.50.5。結論結論:理論上:理論上:假設假設=0.50.5事實上事實上:|0.5| |0.49380.5|0.00620.0057xc-=-=事件事件 為小概率事件為小概率事件0.50.0057Xc- - = =事件事件 不是小概率事件不是小概率事件0.50.0057Xc- - = =4.4.這里的這里的“反證法反證法”是嚴格的邏輯上的反證?是嚴格的邏輯上的反證?0.050.05水平上拒絕原假設水平上拒絕原假設H0 : =0.50.51.960.0112X- - 0.4943 0.5057Xor XH0:=0.50.5 H1:0.50.50.50.5H1:0.50.5隨機抽樣模擬隨機抽

24、樣模擬1 1藥品符合要求藥品符合要求= =0 0=0.5;=0.5;0.4943 0.5057XorX在在=0.010.01的水平上的水平上, ,不拒絕假設不拒絕假設=0.50.5. .問題問題5 50.0122.580.010.50.0112XPu禳禳镲镲- -镲镲 = = =睚睚镲镲镲镲鉿鉿0.01 0.4938x 0.0120.49380.52.14772.580.0112u- -= = = =0.5 問題問題5 5在在=0.050.05的水平上的水平上, ,拒絕假設拒絕假設=0.50.5. .在在=0.01=0.01的水平上的水平上, ,不拒絕假設不拒絕假設=0.5=0.5. .的大小

25、決定檢驗結論的性質的大小決定檢驗結論的性質440.05/20.01/ 26. 6. 檢驗的檢驗的-p-p值值樣本當前值樣本當前值 0.52.1477u0.0112XP驏驏- -琪琪琪琪 = =琪琪琪琪桫桫0.4938x 檢驗統計量當前值檢驗統計量當前值 0.52.14770.0112xu- -= -= -概率概率 檢驗的檢驗的-p-p值值p-p-值就是拒絕原假設所需的最低顯著性水平值就是拒絕原假設所需的最低顯著性水平p-p-值判斷的原則是:如果值判斷的原則是:如果p-p-值小于給定的顯值小于給定的顯著性水平著性水平,則拒絕原假設;否則,接受原,則拒絕原假設;否則,接受原假設?;蛘?,更直觀來說就

26、是:如果假設?;蛘撸庇^來說就是:如果p-p-值很值很小,拒絕原假設,小,拒絕原假設,p-p-值很大,接受原假設。值很大,接受原假設。0.05/20.01/ 2/ 2p0.050.05水平上拒絕原假設水平上拒絕原假設H0 : =0.50.51.960.0112X- - 0.4943 0.5057Xor X拒絕原假設時可能犯的錯誤拒絕原假設時可能犯的錯誤7.7.兩類錯誤兩類錯誤第第類錯誤類錯誤48隨機抽樣模擬隨機抽樣模擬1 1藥品符合要求藥品符合要求= =0 0=0.5;=0.5;0.4943 0.5057XorX 第第類錯誤類錯誤不拒絕原假設不拒絕原假設拒絕原假設拒絕原假設原假設原假設H0成

27、立成立正確正確 第第I I類錯誤類錯誤第第I I類錯誤類錯誤:拒絕了正確的原假設:拒絕了正確的原假設棄真錯誤棄真錯誤PP拒絕拒絕H0| |H0真真 第第類錯誤的概率類錯誤的概率7.7.兩類錯誤兩類錯誤犯第犯第類錯誤的概率類錯誤的概率00|PHH拒拒真真拒絕原假設拒絕原假設H0 : =0.5/20.50.01 12Xua a- - /20.50.50.0112XPua am m- -= = = =a a= =在在=0.050.05的水平上的水平上, ,拒絕域:拒絕域:在在=0.01=0.01的水平上的水平上, ,拒絕域:拒絕域:檢驗水平檢驗水平0.4926 0.5074XorX 拒絕域0.494

28、3 0.5057XorX =拒絕原假設的時犯第一類錯誤的拒絕原假設的時犯第一類錯誤的 概率的上限概率的上限1-1-的大小反映拒絕原假設時的大小反映拒絕原假設時的把握的把握 性、可靠性性、可靠性接受原假設時可能犯的錯誤接受原假設時可能犯的錯誤不拒絕原假設不拒絕原假設H0 : =0.50.05/20.51.960.0112Xu- - = =0.49430.5057X 第第類錯誤類錯誤隨機抽樣模擬隨機抽樣模擬2 2藥品不符合要求藥品不符合要求=0.490.49430.5057X 健健康康人人)(7.0P Xb b= = 00類錯誤類錯誤 把實際上有減輕疼痛作用的新藥判把實際上有減輕疼痛作用的新藥判定為沒有減輕疼痛的作用定為沒有減輕疼痛的作用. .檢驗的功效檢驗的功效 新藥實際上對新藥實際上對OAOA病人的疼痛有病人的疼痛有減輕的作用而我們也判定新藥是有效的概率減輕的作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論