第章兩樣本的非參數(shù)檢驗(yàn)課件_第1頁(yè)
第章兩樣本的非參數(shù)檢驗(yàn)課件_第2頁(yè)
第章兩樣本的非參數(shù)檢驗(yàn)課件_第3頁(yè)
第章兩樣本的非參數(shù)檢驗(yàn)課件_第4頁(yè)
第章兩樣本的非參數(shù)檢驗(yàn)課件_第5頁(yè)
已閱讀5頁(yè),還剩75頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章 兩樣本非參數(shù)檢驗(yàn)在單樣本非參數(shù)檢驗(yàn)中,研究者可以解決諸如一個(gè)總體的中心是否等于一個(gè)已知的值,某個(gè)隨機(jī)變量是否服從某種特定的分布,某個(gè)序列是否具有隨機(jī)性等問題。然而在實(shí)際中,更受注意的往往是比較兩個(gè)總體的位置參數(shù)。比如,兩種訓(xùn)練方法中哪一種更出成績(jī),兩種汽油中哪一種污染更小,兩種營(yíng)銷策略中哪種更有效,兩種藥物哪一種的治療效果更好等等,這就需要使用兩樣本的非參數(shù)方法,第三章中所介紹的方法大都適用。1編輯版pppt第三章 兩樣本非參數(shù)檢驗(yàn)在單樣本非參數(shù)檢驗(yàn)中,研究者可以解決在抽取樣本時(shí)有兩種形式:相關(guān)的和獨(dú)立的。若第一次抽樣的所有樣本某一屬性的測(cè)量結(jié)果,不影響第二次抽樣的所有樣本同一屬性的測(cè)

2、量結(jié)果,則這種抽樣是獨(dú)立的,若第一次抽樣的測(cè)量結(jié)果影響另一次抽樣測(cè)量結(jié)果,則這種抽樣是相關(guān)的。為了避免或者盡量減少由于其他因素影響引起的兩組之間的附加差異,得到更準(zhǔn)確地結(jié)論,研究中通常采用兩個(gè)相關(guān)的樣本。2編輯版pppt在抽取樣本時(shí)有兩種形式:相關(guān)的和獨(dú)立的。若第一次抽樣的所有樣相關(guān)樣本的獲取有兩種方式:1.讓每一研究對(duì)象做自身的對(duì)照者2.將研究對(duì)象兩兩配對(duì),分別給每一對(duì)兩個(gè)成員以不同的處理。在進(jìn)行配對(duì)時(shí),應(yīng)讓每一對(duì)在可能影響處理結(jié)果的其他因素方面盡量相似,以盡量避免和減少附加差異。一般來說,用研究對(duì)象自身作為對(duì)照者要優(yōu)于配對(duì)方法,因?yàn)樵谂鋵?duì)過程中很難完全控制住其他的影響因素。兩個(gè)相關(guān)樣本的非

3、參數(shù)檢驗(yàn)方法主要有符號(hào)檢驗(yàn)法和Wilcoxon符號(hào)秩和檢驗(yàn)法。3編輯版pppt相關(guān)樣本的獲取有兩種方式:3編輯版pppt利用兩個(gè)相關(guān)樣本進(jìn)行研究,對(duì)于某些問題是很方便的。但現(xiàn)實(shí)中要做到很好配對(duì)并不容易。若由于配對(duì)不當(dāng)或無法配對(duì),就要使用兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)方法:Brown-Mood檢驗(yàn)法,Mann-Whitney-Wilcoxon檢驗(yàn)法,Wald-Wolfowitz游程檢驗(yàn)法, 檢驗(yàn)法,Kolmogorov-Smirnov檢驗(yàn)法等。兩個(gè)獨(dú)立樣本可以各自從兩個(gè)總體中隨機(jī)抽選獲得,也可以對(duì)隨機(jī)抽樣的一個(gè)樣本諸元素隨機(jī)分別實(shí)施兩種處理而形成。4編輯版pppt利用兩個(gè)相關(guān)樣本進(jìn)行研究,對(duì)于某些問題

4、是很方便的。但現(xiàn)實(shí)中要本章主要介紹兩個(gè)相關(guān)樣本和兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)方法,包括:3.1 符號(hào)檢驗(yàn)法(相關(guān)樣本)3.2 Wilcoxon符號(hào)秩和檢驗(yàn)法(相關(guān)樣本)3.3 Brown-Mood檢驗(yàn)法(獨(dú)立樣本)3.4 Mann-Whitney-Wilcoxon檢驗(yàn)法(獨(dú)立樣本)3.5 Wald-Wolfowitz游程檢驗(yàn)法(獨(dú)立樣本)3.6 檢驗(yàn)法(獨(dú)立樣本)3.7 Kolmogorov-Smirnov檢驗(yàn)法(獨(dú)立樣本)5編輯版pppt本章主要介紹兩個(gè)相關(guān)樣本和兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)方法,包括3.1 符號(hào)檢驗(yàn)法(Sign Test)3.1.1 基本思路與檢驗(yàn)步驟(同第二章)設(shè)有兩個(gè)連續(xù)總體x

5、,y,累積的分布函數(shù)分別為F(x),F(y)。隨機(jī)的分別從兩個(gè)總體中抽取數(shù)目為n的樣本數(shù)據(jù), 和 將它們 配對(duì)得到 若研究的問題是它們是否具有相同的分布,即F(x)=F(y)是否成立,由于x,y的總體分布未知,而研究者也不關(guān)心它們的具體分布形式,只是關(guān)心分布是否相同,因而可以采用位置參數(shù)進(jìn)行判斷。若兩個(gè)樣本的總體具有相同的分布,則中位數(shù)應(yīng)相同,即在n個(gè)數(shù)對(duì)中,Xi大于yi的個(gè)數(shù)與Xi小于yi的個(gè)數(shù)應(yīng)相差不大。6編輯版pppt3.1 符號(hào)檢驗(yàn)法(Sign Test)3.1.1 基本思檢驗(yàn)步驟:(1)提出假設(shè)7編輯版pppt檢驗(yàn)步驟:(1)提出假設(shè)7編輯版pppt(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量8編輯版ppp

6、t(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量8編輯版pppt(3)確定拒絕域9編輯版pppt(3)確定拒絕域9編輯版pppt3.1.2 應(yīng)用例.為幫助學(xué)生通過自學(xué)提高對(duì)知識(shí)的掌握,有關(guān)專家編輯了符合教學(xué)大綱的教學(xué)參考資料。為了研究“教學(xué)參考資料對(duì)于指導(dǎo)學(xué)生自學(xué)是否有效”這一問題,隨機(jī)選取了15名學(xué)生進(jìn)行測(cè)試,學(xué)生使用參考資料前的試卷(A)得分與使用參考資料后的試卷(B)得分列在下表內(nèi)(A卷與B卷的范圍,內(nèi)容與難度相當(dāng)):10編輯版pppt3.1.2 應(yīng)用例.為幫助學(xué)生通過自學(xué)提高對(duì)知識(shí)的掌握,有3.1.2 應(yīng)用學(xué)生編號(hào)123456789101112131415A卷成績(jī)707070707575757575787675

7、797275B卷成績(jī)758070767175828670808075808383這些資料能否說明參考資料能夠促進(jìn)學(xué)生掌握知識(shí)11編輯版pppt3.1.2 應(yīng)用學(xué)生編號(hào)1234567891011121312編輯版pppt12編輯版pppt3.2 Wilcoxon符號(hào)秩和檢驗(yàn)法( Wilcoxon Signed-Rank Test)13編輯版pppt3.2 Wilcoxon符號(hào)秩和檢驗(yàn)法( Wilcoxon檢驗(yàn)步驟:14編輯版pppt檢驗(yàn)步驟:14編輯版pppt(3)確定拒絕域a.根據(jù)檢驗(yàn)統(tǒng)計(jì)量W和a查Wilcoxon符號(hào)秩和檢驗(yàn)表以得到在零假設(shè)下的 值 如果 小于給定的顯著性水平,拒絕零假設(shè);反

8、之不能拒絕零假設(shè)。b.如果n很大,要用正態(tài)近似,得到一個(gè)與W有關(guān)的正態(tài)隨機(jī)變量z值,再查正態(tài)分布表得到 值,最后將 與a作比較。15編輯版pppt(3)確定拒絕域15編輯版pppt例1根據(jù)3.1.2中的例題,利用Wilcoxon檢驗(yàn)法檢驗(yàn)參考資料能否促進(jìn)學(xué)生掌握知識(shí)(a=0.05)3.2.2 應(yīng)用16編輯版pppt例1根據(jù)3.1.2中的例題,利用Wilcoxon檢驗(yàn)法檢驗(yàn)參17編輯版pppt17編輯版pppt用A,B兩種材料生產(chǎn)的產(chǎn)品其壽命檢測(cè)記錄如下:例2:18編輯版pppt用A,B兩種材料生產(chǎn)的產(chǎn)品其壽命檢測(cè)記錄如下:例2:18編輯產(chǎn)品編號(hào)A材料B材料產(chǎn)品編號(hào)A材料B材料116001610

9、11152015052163015501216431650315801560131530150841560157214148614705159015881514741480616201620161480147571610160517162815888165016361814921510915791590191556149010151015202016251568產(chǎn)品使用壽命統(tǒng)計(jì)表 單位:小時(shí)試分析兩種材料對(duì)產(chǎn)品的使用壽命由無顯著性影響(a=0.05)19編輯版pppt產(chǎn)品編號(hào)A材料B材料產(chǎn)品編號(hào)A材料B材料116001610120編輯版pppt20編輯版pppt21編輯版pppt21編輯版pp

10、pt3.3 Brown-Mood檢驗(yàn)法Brown-Mood檢驗(yàn)法是一種位置參數(shù)檢驗(yàn),主要用來檢驗(yàn)兩個(gè)獨(dú)立樣本的中位數(shù)是否相同。和位置參數(shù)相同零假設(shè)的表述方法:1.P(XY)=P(XY)=1/2 2.分布函數(shù)F(X)=F(Y) 3.X+a和Y同分布,且有:當(dāng)a大于時(shí),XY4.中位數(shù)22編輯版pppt3.3 Brown-Mood檢驗(yàn)法Brown-Mood檢驗(yàn)法假設(shè) 和 是兩個(gè)相互獨(dú)立的隨機(jī)樣本,來自兩個(gè)總體X和Y,其相應(yīng)的中位數(shù)為 和 。我們關(guān)注的問題是,兩個(gè)總體的位置參數(shù) = 是否成立。零假設(shè) 成立的情況下,由m個(gè)X、n個(gè)Y可以組成一個(gè)觀測(cè)值數(shù)為m十nN的混合樣本,其樣本中位數(shù)為 , 應(yīng)該對(duì)于兩

11、個(gè)總體樣本數(shù)據(jù)說都處于中間位置。與符號(hào)檢驗(yàn)思想相似,如果任何一個(gè)樣本中大于 或小于 的數(shù)目過多或過少,我們就有理由懷疑零假設(shè)的真實(shí)性。3.3.1 檢驗(yàn)思想與檢驗(yàn)方法23編輯版pppt假設(shè) 和 是兩個(gè)相互獨(dú)若a或者b過大或過小,則有理由懷疑原假設(shè)。令A(yù)表示列聯(lián)表中左上角取值a的x樣本中大于 的變量,則A為我們的檢驗(yàn)統(tǒng)計(jì)量。由初等概率可知,在m, n及t固定時(shí),A分布在零假設(shè)下為超幾何分布(對(duì)于不超過m的k): x y 總和 27編輯版pppt27編輯版pppt實(shí)際運(yùn)用中p值的計(jì)算Excel中的超幾何分布函數(shù):HYPGEOMDIST(sample_s,number_sample,populatio

12、n_s,number_population)Sample_s 樣本中成功的次數(shù)A。 Number_sample 樣本容量T。 Population_s 樣本總體中成功的次數(shù)m。 Number_population 樣本總體的容量N。Hypgeomdist(A,t,m,N)=R程序:P(Aa)=phyper(a,m,n,a+b)28編輯版pppt實(shí)際運(yùn)用中p值的計(jì)算Excel中的超幾何分布函數(shù):28編輯版3.3.2 檢驗(yàn)的大樣本近似根據(jù)超幾何分布的性質(zhì),可以檢驗(yàn)統(tǒng)計(jì)量的性質(zhì):29編輯版pppt3.3.2 檢驗(yàn)的大樣本近似根據(jù)超幾何分布的性質(zhì),可以檢驗(yàn)1960年匈牙利學(xué)者Hajek證明了以下結(jié)論:

13、1.Z的漸進(jìn)分布為N(0,1)分布;2.Z2為 分布,其漸進(jìn)分布為 分布。30編輯版pppt1960年匈牙利學(xué)者Hajek證明了以下結(jié)論:30編輯版pp3.3.2 檢驗(yàn)的大樣本近似31編輯版pppt3.3.2 檢驗(yàn)的大樣本近似31編輯版pppt3.3.3 假設(shè)檢驗(yàn)步驟如果P值小于給定的顯著性水平,拒絕“兩個(gè)數(shù)列的中位數(shù)相同”的假設(shè)。檢驗(yàn)步驟可歸結(jié)為下表:嚴(yán)格的說,在 時(shí)因A不對(duì)稱,雙邊檢驗(yàn)結(jié)果不那么理想。零假設(shè):備擇假設(shè):檢驗(yàn)統(tǒng)計(jì)量 值 A A A32編輯版pppt3.3.3 假設(shè)檢驗(yàn)步驟如果P值小于給定的顯著性水平,拒絕“3.3.3 應(yīng)用33編輯版pppt3.3.3 應(yīng)用33編輯版pppt3

14、.3.3 應(yīng)用34編輯版pppt3.3.3 應(yīng)用34編輯版pppt3.4 WMW檢驗(yàn)Wilcoxon-Mann-Whitney檢驗(yàn)譯作維爾科克森曼惠特尼檢驗(yàn),簡(jiǎn)稱WMW檢驗(yàn),這種方法不考慮總體分布的具體形式,只需假定兩個(gè)獨(dú)立的相比較的總體有相同或相似的的連續(xù)分布,分布不需要對(duì)稱。WMW檢驗(yàn)的精確度較高,在正態(tài)總體情況下使用可以達(dá)到參數(shù)檢驗(yàn)方法t檢驗(yàn)法功效的95%的精度;如果是偏態(tài)總體,它的精度還要高于t檢驗(yàn)法。相比brown-mood檢驗(yàn),不僅利用了樣本的符號(hào)信息,也利用了相對(duì)大小信息。35編輯版pppt3.4 WMW檢驗(yàn)Wilcoxon-Mann-Whitney3.4.1檢驗(yàn)方法的思想W統(tǒng)計(jì)

15、量將兩個(gè)樣本混合在一起,并按從小到大的順序排列起來,得到混合順序樣本:在混合樣本中,將各數(shù)值排序得到它們 的秩。令 和 分別為 和 在混合樣本中的秩, 和 分別為 和 的總和(秩和):如果 為真,則 與 應(yīng)較均勻地分布在混合順序樣本中,這 N個(gè)觀察值能夠被看作是來自共同總體的一個(gè)單一的隨機(jī)樣本。兩個(gè)樣本的秩和將相差不大。36編輯版pppt3.4.1檢驗(yàn)方法的思想W統(tǒng)計(jì)量將兩個(gè)樣本混合在一起,并顯然,如果x的秩大部分都小于y的秩( 很?。?,則表明x樣本的值偏小,我們就有理由懷疑混合子樣是一個(gè)隨機(jī)的混合樣本, 不能成立。同理,如果 很小, 也不能成立??梢?, 和 都可以用作檢驗(yàn)統(tǒng)計(jì)量,一般取兩者中

16、較小的一個(gè)作為檢驗(yàn)統(tǒng)計(jì)量,記作 ,W被稱為Wilcoxon秩和統(tǒng)計(jì)量(Wilconxon Rank-Sum Statistics),該統(tǒng)計(jì)量是由Wilconxon于1945年提出的。37編輯版pppt顯然,如果x的秩大部分都小于y的秩( 很小),則表3.4.2 檢驗(yàn)方法的思想U(xiǎn)統(tǒng)計(jì)量Mann-Whitney與1947年提出了U檢驗(yàn)量,我們也可以用U來檢驗(yàn)零假設(shè)。這里定義 為所有X觀察值在混合樣本中超過Y觀察值的個(gè)數(shù), 為所有Y觀察值在混合樣本中大于X觀察值的個(gè)數(shù),U為 和 中較小者,即 。若 成立, 與 的差別不會(huì)很大,U不會(huì)太小。如果U很小,我們就有理由懷疑 。實(shí)際上,檢驗(yàn)統(tǒng)計(jì)量W和U等價(jià),

17、二者之間只是一個(gè)線性變換關(guān)系,一般將其統(tǒng)稱為Wilconxon-Mann-Whitney統(tǒng)計(jì)量。38編輯版pppt3.4.2 檢驗(yàn)方法的思想U(xiǎn)統(tǒng)計(jì)量Mann-Whitnem=n=2情形下統(tǒng)計(jì)量的可能取值39編輯版ppptm=n=2情形下統(tǒng)計(jì)量的可能取值39編輯版pppt40編輯版pppt40編輯版pppt41編輯版pppt41編輯版pppt1. 為離散分布。其中 的最大值為n(n+1)/2+mn,最小值為n(n+1)/2。2. 都是中心對(duì)稱的。其中, 的中心為n(N+1)/2。統(tǒng)計(jì)量的性質(zhì)42編輯版pppt1. 為離散分布。統(tǒng)計(jì)量的性質(zhì)42編輯P值的計(jì)算43編輯版ppptP值的計(jì)算43編輯版p

18、pptm=n=2情形下統(tǒng)計(jì)量的可能取值44編輯版ppptm=n=2情形下統(tǒng)計(jì)量的可能取值44編輯版pppt3.4.2 正態(tài)逼近45編輯版pppt3.4.2 正態(tài)逼近45編輯版pppt打 結(jié)46編輯版pppt打 結(jié)46編輯版pppt檢驗(yàn)步驟47編輯版pppt檢驗(yàn)步驟47編輯版pppt3.4.3 應(yīng)用例:兩種材料制成同一零件,隨機(jī)抽取19件作疲勞強(qiáng)度測(cè)試,得到如下結(jié)果: A材料:82 64 53 61 59 83 76 55 70 73 B材料:80 60 65 91 86 84 77 93 75 試問兩種材料制造的零件,其疲勞強(qiáng)度有無顯著差異(=5%)48編輯版pppt3.4.3 應(yīng)用例:兩種材

19、料制成同一零件,隨機(jī)抽取19件作疲3.4.3 應(yīng)用(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量 秩 和1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 數(shù) 據(jù)A材料B材料53 55 59 61 64 70 73 76 82 83 60 65 75 77 80 84 86 91 9349編輯版pppt3.4.3 應(yīng)用(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量 秩 和1 3.4.3 應(yīng)用R程序:wilcox.test(x,y)50編輯版pppt3.4.3 應(yīng)用R程序:wilcox.test(x,y)503.4.4 練習(xí)今測(cè)得甲、乙兩礦灰分含量(%)資料如下: 甲:3.75 4.3 3.95 3.8

20、 3.85 乙:3.9 4.05 4.1 4.0 試用Wilcoxon-Mann-Whitney檢驗(yàn)法判定甲乙兩礦的灰分有無顯著差異(=0.05) 51編輯版pppt3.4.4 練習(xí)今測(cè)得甲、乙兩礦灰分含量(%)資料如下:53.5 Wald-Wolfowitz 游程檢驗(yàn)( Wald-Wolfowitz Runs Test)Mann-Whitney-Wilcoxon檢驗(yàn)主要應(yīng)用于檢驗(yàn)兩個(gè)樣本是否來自具有相同位置的總體,是對(duì)兩個(gè)總體在集中趨勢(shì)方面有無差異的一種考察,而不研究其它類型方面的差異。 Wald-Wolfowitz 游程檢驗(yàn)則可以考察任何一種差異。 Wald-Wolfowitz Runs

21、Test譯為沃爾德-沃爾福威茨連串檢驗(yàn)或游程檢驗(yàn),簡(jiǎn)稱W-W串檢驗(yàn)。52編輯版pppt3.5 Wald-Wolfowitz 游程檢驗(yàn)( Wald3.5.1 基本方法與檢驗(yàn)步驟設(shè)有x, y兩個(gè)總體具有連續(xù)分布,其累積分布函數(shù)分別為F (x)和F (y)。如果想知道兩個(gè)總體是否存在某種差異,可以用“兩個(gè)總體分布相同”作為零假設(shè)。為此,需要從x中隨機(jī)抽取m個(gè)數(shù)據(jù) , 從y中隨機(jī)抽取n個(gè)數(shù)據(jù) , 數(shù)據(jù)的測(cè)量層次至少要是定序尺度。將兩個(gè)獨(dú)立樣本的m + n=N個(gè)數(shù)據(jù)混合排序,并確定序列的游程(取自同一樣本的一串相連的數(shù)據(jù))。如果零假設(shè)為真,則兩個(gè)樣本的數(shù)據(jù)期望能相互混合地排列,游程數(shù)會(huì)相對(duì)較大。若x的游

22、程或y的游程過長(zhǎng),也就是來自同一總體的數(shù)據(jù)在有序的序列中過多地相互連接,則游程數(shù)將會(huì)相當(dāng)少,數(shù)據(jù)不支持 。故序列的游程數(shù)據(jù)可以作為檢驗(yàn)統(tǒng)計(jì)量。 53編輯版pppt3.5.1 基本方法與檢驗(yàn)步驟設(shè)有x, y兩個(gè)總體具有連續(xù)3.5.1 基本方法與檢驗(yàn)步驟54編輯版pppt3.5.1 基本方法與檢驗(yàn)步驟54編輯版pppt3.5.2 應(yīng)用例 研究者想知道“問題按難易次序提問是否影響學(xué)生正確回答的能力”。今從全校學(xué)生中隨機(jī)抽取一個(gè)班的學(xué)生,隨機(jī)地將學(xué)生分為兩組,讓第一組的學(xué)生做A卷(問題從易到難),第二組學(xué)生做B卷(問題從難到易)??荚嚤豢刂圃谕耆嗤臈l件下進(jìn)行,評(píng)分結(jié)果如下: A卷 83 82 84

23、 96 90 64 91 71 75 72 B卷 42 61 52 78 69 81 75 78 78 65 試問在0.05顯著性水平下“問題按難易次序提問是否影響學(xué)生正確回答的能力”?55編輯版pppt3.5.2 應(yīng)用例 研究者想知道“問題按難易次序提問是否影3.5.2 應(yīng)用解:(1)提出假設(shè) :F(X)=F(Y) (兩種提問方式對(duì)學(xué)生成績(jī)無影響) : F(X)F(Y) (兩種提問方式會(huì)造成學(xué)生成績(jī)的差異) (2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量 u=642 52 61 64 65 69 71 72 75 75 78 78 78 81 82 83 84 90 91 96 y y y x y y x x x y

24、 y y y y x x x x x x56編輯版pppt3.5.2 應(yīng)用解:(1)提出假設(shè)42 52 61 63.5.2 應(yīng)用(3)作出決策 根據(jù)m=10,n=10,=0.05查表得: 因?yàn)?,所以拒絕 ,可以認(rèn)為在 下提問的順序?qū)W(xué)生正確回答問題的能力有影響(也可以計(jì)算或查P值判斷)。 57編輯版pppt3.5.2 應(yīng)用(3)作出決策57編輯版pppt3.5.2 應(yīng)用注意:如果出現(xiàn)同分,分值來自同一樣本,游程數(shù)u不會(huì)受到影響;但若同分值來自不同樣本,u就可能會(huì)受到影響,并影響最后的結(jié)論。因此,在運(yùn)用Wald-Wolfowitz游程檢驗(yàn)時(shí),若同分值來自兩個(gè)不同的樣本,一般應(yīng)將各種排序的可能性

25、都進(jìn)行考察,分別計(jì)算每種情況下的游程總數(shù)u,并查找相應(yīng)的P值。如果得出的結(jié)論一致,表明同分沒有帶來什么問題;如果得出的結(jié)論不一致,可以將n個(gè)P值求簡(jiǎn)單平均數(shù),以此作為是否拒絕H的依據(jù)。如果同分在兩個(gè)樣本之間多次出現(xiàn),u實(shí)際上是不確定的,因而不宜采用Wald-Wolfowitz游程檢驗(yàn)。58編輯版pppt3.5.2 應(yīng)用注意:如果出現(xiàn)同分,分值來自同一樣本,游程數(shù)3.5.3 練習(xí)某年華北五省市區(qū)的GDP指數(shù)為: 109.2 114.3 113.5 111.0 112.7 華東七省的GDP指數(shù)為: 113.0 112.2 112.7 114.4 115.4 113.4 112.2試問:在 下,利用

26、 Wald-Wolfowitz游程檢驗(yàn)法檢驗(yàn)華北五省的GDP指數(shù)與華北七省的GDP指數(shù)分布是否相同?59編輯版pppt3.5.3 練習(xí)某年華北五省市區(qū)的GDP指數(shù)為:59編輯版p3.6 兩樣本的 檢驗(yàn) 單樣本的 檢驗(yàn)可以推廣到兩個(gè)獨(dú)立樣本的總體差異性的檢驗(yàn)。 問題: 分別從兩個(gè)分布函數(shù)為 和 的總體中,隨機(jī)抽取 和 個(gè)樣本數(shù)據(jù),利用樣本值推斷兩個(gè)總體是否具有某中差異。為了對(duì)假設(shè)作出判定,所需要的數(shù)據(jù)是兩個(gè)樣本,測(cè)量層次最低可為定類尺度。60編輯版pppt3.6 兩樣本的 檢驗(yàn) 單樣本的 3.6.1 基本方法與檢驗(yàn)步驟61編輯版pppt3.6.1 基本方法與檢驗(yàn)步驟61編輯版pppt3.6.1

27、基本方法與檢驗(yàn)步驟用聯(lián)表表示為: 組 別 觀察頻數(shù) 合計(jì) 期望頻數(shù) 1 2 r合計(jì) N62編輯版pppt3.6.1 基本方法與檢驗(yàn)步驟用聯(lián)表表示為: 3.6.1 基本方法與檢驗(yàn)步驟63編輯版pppt3.6.1 基本方法與檢驗(yàn)步驟63編輯版pppt3.6.1 基本方法與檢驗(yàn)步驟64編輯版pppt3.6.1 基本方法與檢驗(yàn)步驟64編輯版pppt3.6. 2 應(yīng)用例:為了研究已婚和獨(dú)身婦女請(qǐng)假和工作時(shí)間是否有差異,研究者隨機(jī)抽取了100名已婚婦女和200名獨(dú)身婦女,調(diào)查她們?cè)谝荒陜?nèi)請(qǐng)假和工作的情況,得到了下列數(shù)據(jù):注:沒有工作的時(shí)間不包括正常休假(如懷孕、住院等);獨(dú)身婦女一組包括離婚、分居、喪偶但

28、身邊無子女在一起生活的婦女。試問能否在0.05的顯著性水平下認(rèn)為已婚婦女比獨(dú)身婦女更容易請(qǐng)假而從事的工作時(shí)間更少?無工作日數(shù)分組已婚婦女(人)獨(dú)身婦女(人) 03 47 811 1215 1619 20以上 60 21 11 4 2 2 130 50 10 6 3 1 合 計(jì) 100 20065編輯版pppt3.6. 2 應(yīng)用例:為了研究已婚和獨(dú)身婦女請(qǐng)假和工作時(shí)間是3.6.2 應(yīng)用66編輯版pppt3.6.2 應(yīng)用66編輯版ppptxf1f2fi.e1e20-36013019063.33126.670.17510.08754-721507123.6747.330.30120.15068-11

29、1110217.0014.002.28571.142912-1546103.336.670.13480.067316-192352.675.330.66250.331920以上213合計(jì)1002003003.55931.7802Q=3.5593+1.7802=5.8395 df=5-1=4Q統(tǒng)計(jì)量計(jì)算表67編輯版ppptxf1f2fi.e1e20-36013019063.3312(3)做出決策68編輯版pppt(3)做出決策68編輯版pppt3.6.3 練習(xí)學(xué)生按性別和考試成績(jī)分組的調(diào)查數(shù)據(jù)如下:試判斷在0.05的顯著性水平下學(xué)生的考試成績(jī)是否與性別有關(guān)? 成績(jī) 人數(shù) 性別 及 格 不及格 合

30、計(jì) 男 女 2600 2180 130 90 2730 2270 合 計(jì) 4780 220 500069編輯版pppt3.6.3 練習(xí)學(xué)生按性別和考試成績(jī)分組的調(diào)查數(shù)據(jù)如下: 3.7 Kolmogorov-Smirnov檢驗(yàn)單樣本的Kolmogorov-Smirnov檢驗(yàn)可以推廣應(yīng)用于兩個(gè)獨(dú)立樣本。兩樣本的Kolmogorov-Smirnov檢驗(yàn),簡(jiǎn)稱Smirnov擬合優(yōu)度檢驗(yàn),主要用于檢驗(yàn)兩個(gè)獨(dú)立樣本是否抽自兩個(gè)相同分布的總體,也為其基本思路和檢驗(yàn)步驟與單樣本的K-S檢驗(yàn)完全一致,只是在檢驗(yàn)時(shí)需要將前面的假設(shè)改為:70編輯版pppt3.7 Kolmogorov-Smirnov檢驗(yàn)單樣本的Ko

31、 是第一個(gè)樣本的經(jīng)驗(yàn)分布函數(shù),它可以用第一個(gè)樣本觀察值小于等于的x的次數(shù)除以總次數(shù)m (m為第一個(gè)樣本的數(shù)據(jù)個(gè)數(shù))求得; 是第二個(gè)樣本的經(jīng)驗(yàn)分布函數(shù),它可以用第二個(gè)樣本觀察值小于等于x的次數(shù)除以總次數(shù)n(n為第二個(gè)樣本的數(shù)據(jù)個(gè)數(shù))求得。若兩個(gè)總體是連續(xù)的,檢驗(yàn)統(tǒng)計(jì)量 的抽樣分布已知。當(dāng) 為真時(shí), 應(yīng)該很小,與其相應(yīng)的概率和臨界值可以在Smirnov檢驗(yàn)臨界值(王書第306頁(yè))中查到,它滿足: 。當(dāng)時(shí),不能拒絕 ;當(dāng) 時(shí),拒絕 。 3.7.1 兩樣本K-S檢驗(yàn)基本思想71編輯版pppt 是第一個(gè)樣本的經(jīng)驗(yàn)分布函數(shù),它可以用第一個(gè)樣本觀察72編輯版pppt72編輯版pppt雙側(cè)檢驗(yàn)對(duì)于總體分布的任

32、何一種差異,如位置差異(集中趨勢(shì))、離散度差異、偏斜度差異等都很敏感。K-S檢驗(yàn)的單側(cè)檢驗(yàn)則用來檢驗(yàn)?zāi)骋豢傮w值是否大于或小于另一總體的值。其假設(shè)為: 或其檢驗(yàn)統(tǒng)計(jì)量是: 73編輯版pppt雙側(cè)檢驗(yàn)對(duì)于總體分布的任何一種差異,如位置差異(集中趨勢(shì))、例1:隨即抽取9個(gè)遠(yuǎn)郊縣和7個(gè)近郊縣調(diào)查其近10年的人口增長(zhǎng)速度(%): 近郊縣:3.1 2.1 8.2 2.7 3.4 7.9 3.2 遠(yuǎn)郊縣:5.3 3.7 5.8 3.5 4.8 5.6 6.8 9.3 10.3 根據(jù)這些資料,能否認(rèn)為近郊縣比遠(yuǎn)郊縣的人口增長(zhǎng)速度低? 解(1)提出假設(shè)3.7.2 兩樣本K-S檢驗(yàn)實(shí)例74編輯版pppt例1:隨即抽取9個(gè)遠(yuǎn)郊縣和7個(gè)近郊縣調(diào)查其近10年的人口增

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論