




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
23.K-S分布檢驗與正態(tài)性檢驗(一)假設檢驗什么是假設檢驗?實際中,我們只能得到抽取的樣本(部分)的統(tǒng)計結果,要進一步推斷總體(全部)的特征,但是這種推斷必然有可能犯錯,犯錯的概率為多少時應該接受這種推斷呢?為此,統(tǒng)計學家就開發(fā)了一些統(tǒng)計方法進行統(tǒng)計檢定,通過把所得到的統(tǒng)計檢定值,與統(tǒng)計學家樹立了一些隨機變量的概率分布進行對比,我們可以知道在百分之多少的機遇下會得到目前的結果。倘若經比較后發(fā)現(xiàn),涌現(xiàn)這結果的機率很少,即是說,是在時機很少、很罕有的情況下才出現(xiàn);那我們便可以有信念地說,這不是巧合,該推斷結果是具有統(tǒng)計學上的意義的。否則,就是推斷結果不具有統(tǒng)計學意義。假設檢驗的基本思想——小概率反證法思想小概率思想是指小概率事件(P<a,a=0.05或0.01)在一次試驗中基本上不會發(fā)生。反證法思想是先提出原假設(H0),再用適當?shù)慕y(tǒng)計方法確定假設成立的可能性(P值)大小,如可能性?。≒Wa),則認為原假設不成立,若可能性大,則還不能認為備擇假設(H1)成立。原假設與備擇假設原假設與備擇假設是完備且相互獨立的事件組,一般,原假設(H0)—-研究者想收集證據予以反對的假設;備擇假設(H1)—-研究者想收集證據予以支持的假設;假設檢驗的P值,就是在H0為真時,觀察到的差異來源于抽樣誤差的可能性大小。假設檢驗判斷方法有:臨界值法、P值檢驗法。四、假設檢驗分類及步驟(以t檢驗為例)雙側檢驗.原假設H0:-與備擇假設H1:pWp0;.根據樣本數(shù)據計算出統(tǒng)計量t的觀察值t0;in.p值=p{iti三itoi}=t0的雙側尾部的面積;W.若P值Wa(在雙尾部分),則在顯著水平a下拒絕H0;若P值,a,則在顯著水平。下接受H0;注意:a為臨界值,看P值在不在陰影部分(拒絕域),空白部分為接受域。臨界值樣本統(tǒng)計量臨界值置信水平抽樣分布拒絕人拒絕一左側檢驗.原假設H0:口,備擇假設H1:…0;.根據樣本數(shù)據計算出統(tǒng)計量t的觀察值t0(<0);in.p值=P{twt0}=t0的左側尾部的面積;W.若P值Wa(在左尾部分),則在顯著水平a下拒絕H0;若P值,a,則在顯著水平。下接受H0;右側檢驗.原假設H0:哼燈備擇假設H1:四邛0;.根據樣本數(shù)據計算出統(tǒng)計量t的觀察值t0(>0);n.p值=P{t三t0}=t0的右側尾部的面積;W.若P值Wa(在右尾部分),則在顯著水平a下拒絕H0;若P值,a,則在顯著水平。下接受H0;樣本統(tǒng)計量臨界值觀察到的樣本統(tǒng)計量抽樣分布埋侑水平右側檢驗(二)K-S分布檢驗Kolmogorov-Smirnov檢驗,用來檢驗一組樣本數(shù)據是否服從某已知分布,或兩組樣本數(shù)據是否服從相同分布。用函數(shù)ks.test()實現(xiàn),基本格式為:ks.test(x,y,...,alternative=,exact=NULL)其中,x為樣本數(shù)據;y為分布名(此時…為該分布的參數(shù))或樣本數(shù)據;alternative設置是"two.sided,雙側檢驗(默認)、"less"左側檢驗、"greater”右側檢驗;exact設置是否計算精確p值,默認NULL。1.K-S單樣本總體分布檢驗用來檢驗樣本數(shù)據是否服從某已知分布。它是一種基于經驗分布函數(shù)的檢驗,令D=supIF(x)-F(x)In n0n其中,F(xiàn)(x)為一組隨機樣本的累計概率分布函數(shù),F(xiàn)(x)為真實的分n0布函數(shù)。當nT6時,D的極限分布滿足:n工(-1)jexp(—2j2九2),九〉0P{JnD〈九}fK(九)二1n j=-80, X<0原假設H:F二F即分布相同;備擇假設H:二者分布不同。0n0 *1X=c(420,500,920,1380,1510,1650,1760,2100,2300,2350)#某設備10次無故障工作時間的數(shù)據lambdav-mean(X)lambda[1]1489ks.test(x,"pexp”,1/lambda)#檢驗是否服從參數(shù)為1/1489的指數(shù)分布One-sampleKolmogorov-Smirnovtestdata:XD=0.30418,p-value=0.2563alternativehypothesis:two-sidedP值=0.2563>0.05,接受原假設H0,即服從指數(shù)分布。2.兩獨立樣本K-S同分布檢驗假定有分別來自兩個獨立總體的兩個樣本,要檢驗是否服從同一分布。設兩個樣本的樣本量分別為n和n,累積經驗分布函數(shù)分別為12F(x)和F(x),令D=F(x)-F(x),則統(tǒng)計量1 2 j1j2jZ二maxIDI.:nin2
jjnn+n1 2近似服從正態(tài)分布。原假設H:F二F服從同一分布;備擇假設H:不服從同一分012 1布。xx=c(0.61,0.29,0.06,0.59,-1.73,-0.74,0.51,-0.56,0.39,1.64,0.05,-0.06,0.64,-0.82,0.37,1.77,1.09,-1.28,2.36,1.31,1.05,-0.32,-0.40,1.06,-2.47)yy=c(2.20,1.66,1.38,0.20,0.36,0.00,0.96,1.56,0.44,1.50,-0.30,0.66,2.31,3.29,-0.27,-0.37,0.38,0.70,0.52,-0.71)ks.test(xx,yy)#檢驗兩組數(shù)據是否服從同一分布Two-sampleKolmogorov-Smirnovtestdata:xxandyyD=0.23,p-value=0.5286alternativehypothesis:two-sidedP值=0.5286>0.05,接受原假設,即兩組數(shù)據服從同一分布。注1:在做K-S檢驗時,有時會有錯誤提示"Kolmogorov-Smirnov檢驗里不應該有連結”,這是因為K-S檢驗只對連續(xù)CDF有效,而連續(xù)CDF中出現(xiàn)相同值的概率為0,因此R會報錯。這也提醒我們,在做正態(tài)性檢驗之前,要先對數(shù)據進行描述性分析,對數(shù)據整體要先有個大致的認識,這也才后續(xù)才能選擇正確的檢驗方法。注2:K-S檢驗主要用于定量數(shù)據,而卡方同質性檢驗主要用于分類數(shù)據。(三)正態(tài)性檢驗原假設H0:服從正態(tài)分布;備擇假設H1:不服從正態(tài)分布一、Shapiro-Wilk檢驗(W檢驗)適合在樣本量8WnW50時使用。W檢驗是建立在次序統(tǒng)計量的基礎上,對n個獨立觀測值按非降排序,記為X,X,,X,檢驗統(tǒng)計量:12n[Zna(x —X)]2^W= in+1-i i… Zn(X-X)2i=1i當總體分布為正態(tài)分布時,W值應該接近于1。用函數(shù)shapiro.test()實現(xiàn),基本格式為:shapiro.test(x)其中,x為樣本數(shù)據。attach(mtcars)shapiro.test(mpg)Shapiro-Wilknormalitytestdata:mpgW=0.94756,p-value=0.1229detach(mtcars)P值=0.1229>0.05,接受原假設,即服從正態(tài)分布。二、Kolmogorov-Smirnov檢驗(D檢驗)適合在樣本量50WnWl000時使用。即將前文的K-S單樣本總體分布檢驗的已知分布,設為正態(tài)分布即可。或者使用Lilliefor檢驗,它是Kolmogorov-Smirnov正態(tài)性檢驗修正,使用nortest包中的函數(shù)lillie.test()實現(xiàn)?;靖袷綖椋簂illie.test(x)其中x為樣本數(shù)據。library(nortest)attach(mtcars)lillie.test(mpg)Lilliefors(Kolmogorov-Smirnov)normalitytestdata:mpgD=0.1263,p-value=0.2171detach(mtcars)P值=0.2171>0.05,接受原假設,即服從正態(tài)分布。三、Jarque-Bera正態(tài)性檢驗是基于偏度和峰度的聯(lián)合分布檢驗法。記偏度為S,峰度為K,則統(tǒng)計量:JB=n-k-(S2+K)~X2(2)6 4用tseries包中的使用函數(shù)jarque.bera.test()實現(xiàn),基本格式:jarque.bera.test(x)其中,x為樣本數(shù)據。library(tseries)attach(mtcars)jarque.bera.test(mpg)JarqueBeraTestdata:mpgX-squared=2.2412,df=2,p-value=0.3261detach(mtcars)P值=0.2412>0.05,接受原假設,即服從正態(tài)分布。注:還可以使用nromtest包中的函數(shù)jb.norm.test()和ajb.norm.test(),前者參數(shù)除了x之外,多了一個蒙特卡羅模擬值,默認是2000,后者是J-B檢驗的修正,主要解決JB統(tǒng)計量收斂速度慢的缺點。四、其它正態(tài)性檢驗nortest包中還提供了:AD正態(tài)性檢驗函數(shù)ad.test(x),計算統(tǒng)計量A值(越接近0越服從正態(tài)分布)和P值。Cramer-vonMises正態(tài)性檢驗函數(shù)cvm.test(x)Pearson卡方正態(tài)性檢驗函數(shù)pearson.test(x)Shapiro-Francia正態(tài)性檢驗函數(shù)sf.test(x)五、多元正態(tài)性檢驗W檢驗shapiro.test()可推廣到多元正態(tài)性檢驗,使用mvnormtest包中的函數(shù)mshapiro.test()或者使用Q-Q圖檢驗,若有一個pX1的多元正態(tài)隨機向量x,均值為u,協(xié)方差矩陣為2,那么x與u的馬氏距離的平方服從自由度為p的卡方分布。Q-Q圖展示卡方分布的分位數(shù),橫縱坐標分別是樣本量與馬氏距離平方值。如果點全部落在斜率為1、截距項為0的直線上,則表明數(shù)據服從多元正態(tài)分布。library(MASS)attach(UScereal)y<-cbind(calories,fat,sugars)head(y)caloriesfatsugars[1,]212.12123.03030318.18182[2,]212.12123.03030315.15151[3,]100.00000.0000000.00000[4,]146.66672.66666713.33333[5,]110.00000.00000014.00000[6,]173.33332.66666710.66667#mshapiro.test()函數(shù)檢驗多元正態(tài)性library(mvnormtest)mshapiro.test(t(y))#注意要對y轉置Shapiro-Wilknormalitytestdata:ZW=0.6116,p-value=7.726e-12#Q-Q圖檢驗多元正態(tài)性centerv-colMeans(y)n<-nrow(y)p<-ncol(y)cov<-cov(y)d<-mahalanobis(y,center,cov)coord
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45231-2025智能床
- 全新合伙人合同:創(chuàng)始股東權利與義務
- 雙方戒煙合同責任書
- 船舶所有權變更合同
- 合同離婚改革:軍人家庭權益保障
- 5電磁鐵(教學設計)-2024-2025學年六年級上冊科學教科版
- 項目融資及還款合同書范例
- 住宅租賃安全責任合同條款
- 知識產權保護及商業(yè)秘密合同范本
- 租賃合同模板范本:貨物運輸設備
- 2024-2025年第二學期學校教導處工作計劃(二)
- 2025年蘇州衛(wèi)生職業(yè)技術學院高職單招職業(yè)技能測試近5年常考版參考題庫含答案解析
- 二零二五年度博物館場地租賃與文物保護合作協(xié)議3篇
- 2025年春新人教版歷史七年級下冊全冊課件
- 2024年鐘山職業(yè)技術學院高職單招語文歷年參考題庫含答案解析
- 駱駝祥子-(一)-劇本
- 魏晉南北朝時期中外文化的交流
- 漁業(yè)行業(yè)智能化海洋牧場養(yǎng)殖方案
- 《工程勘察設計收費標準》(2002年修訂本)
- 《債權法教學》課件
- 太傻天書(完整版)
評論
0/150
提交評論