第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件_第1頁
第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件_第2頁
第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件_第3頁
第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件_第4頁
第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件_第5頁
已閱讀5頁,還剩125頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章

單樣本非參數(shù)檢驗(yàn)第二章

單樣本非參數(shù)檢驗(yàn)12.1符號檢驗(yàn)和分位數(shù)推斷2.2Cox-Stuart趨勢檢驗(yàn)2.3游程檢驗(yàn)2.4Wilcoxon符號秩檢驗(yàn)2.5正態(tài)記分檢驗(yàn)2.6分布的一致性檢驗(yàn)2.7相對效率比較2.1符號檢驗(yàn)和分位數(shù)推斷22.1符號檢驗(yàn)2.1符號檢驗(yàn)3符號檢驗(yàn)的統(tǒng)計(jì)量為符號檢驗(yàn)。設(shè)隨機(jī)變量X1,…,Xn是從某個(gè)總體X中抽出的簡單隨機(jī)樣本。且分布函數(shù)F(X)在X=0是連續(xù)的。假設(shè)檢驗(yàn)問題檢驗(yàn)的統(tǒng)計(jì)量可以取符號檢驗(yàn)的統(tǒng)計(jì)量為符號檢驗(yàn)。設(shè)隨機(jī)變量X1,…,4在原假設(shè)為真的條件下,有服從參數(shù)為n和的二項(xiàng)分布b(n,0.5)。由于原假設(shè)為時(shí),B應(yīng)該不太大,也不太小,如果B太大或太小,應(yīng)該拒絕原假設(shè)。對于顯著性,求c1和c2,有拒絕區(qū)域?yàn)?在原假設(shè)為真的條件下,有服從參數(shù)為n和的二項(xiàng)5

精確的符號檢驗(yàn)是指檢驗(yàn)的p值是有精確的概率給出的。我們利用正號和負(fù)號的數(shù)目,來檢驗(yàn)?zāi)臣僭O(shè),這是一種最簡單的非參數(shù)方法。聯(lián)合國人員在世界上66個(gè)大城市的生活花費(fèi)指數(shù)(以紐約市1996年12月為100)按自小至大的次序排列如下(這里北京的指數(shù)為99)。2.1.1.精確中位數(shù)的符號檢驗(yàn)精確的符號檢驗(yàn)是指檢驗(yàn)的p值是有精確的概率給出的。我6

667578808181828383838384858586868686878788888888888989898990909191919192939396969697

99100101102103103104104104105106109109110110110111113115116117118155192

這個(gè)總體的中間水平是多少?北京使在該水平之上還是之下?(北京為99)第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件7通常在正態(tài)總體分布的假設(shè)下,關(guān)于總體均值的假設(shè)檢驗(yàn)和區(qū)間估計(jì)是用與t檢驗(yàn)有關(guān)的方法進(jìn)行的。然而,在本例中,總體分布是未知的。為此,首先看該數(shù)據(jù)的直方圖從圖中很難說這是什么分布。

假定用總體中位數(shù)來表示中間位置,這意味著樣本點(diǎn),取大于M的的概率應(yīng)該與取小于M的概率相等。所研究的問題,可以看作是只有兩種可能“成功”或“失敗”。通常在正態(tài)總體分布的假設(shè)下,關(guān)于總體均值的假設(shè)8成功:X-M大于零,即大于中位數(shù)M,記為“+”;失?。篨-M小于零,即小于中位數(shù)M,記為“-”。令S+=得正符號的數(shù)目

S—=得負(fù)符號得數(shù)目可以知道S+或S—均服從二項(xiàng)分布B(65,0.5)。則和可以用來作檢驗(yàn)的統(tǒng)計(jì)量。其假設(shè)為:成功:X-M大于零,即大于中位數(shù)M,記為“+”;9對于左側(cè)檢驗(yàn),當(dāng)零假設(shè)為真的下,應(yīng)該不大不小。當(dāng)過小,即只有少數(shù)的觀測值大于假定值,則可能假定值太大,目前總體真實(shí)中位數(shù)可能要小一些。如果,則拒絕原假設(shè)。對于左側(cè)檢驗(yàn),當(dāng)零假設(shè)為真的下,應(yīng)該不大不小。10對于右側(cè)檢驗(yàn),當(dāng)零假設(shè)為真的下,應(yīng)該不大不小。當(dāng)過大,即有多數(shù)的觀測值大于,則可能假定值太小,目前總體的真實(shí)中位數(shù)可能要大一些。如果,則拒絕原假設(shè)。對于右側(cè)檢驗(yàn),當(dāng)零假設(shè)為真的下,應(yīng)該不11

檢驗(yàn)統(tǒng)計(jì)量S+=23S+=23P-值

=0.01242=0.0248檢驗(yàn)的結(jié)果拒絕零假設(shè)拒絕零假設(shè)結(jié)論中位數(shù)小于99中位數(shù)不等于99

檢驗(yàn)統(tǒng)計(jì)量S+=23S+=23P-值122.大樣本的情形當(dāng)樣本容量足夠大,我們可以利用二項(xiàng)分布的近似來對該問題進(jìn)行檢驗(yàn)。因?yàn)橛?jì)數(shù)統(tǒng)計(jì)量在原假設(shè)為真時(shí),服從b(n,0.5)。且其均值為0.5n,方差為0.25n。則檢驗(yàn)的統(tǒng)計(jì)量為

當(dāng)B<n/2,+0.5;當(dāng)B>n/2,-0.5。這個(gè)加或減一個(gè)常數(shù)的原因是使得其估計(jì)出的p值更接近近似值。舉例如下。假設(shè)x服從b(20,0.7),用二項(xiàng)分布和其正態(tài)近似求其x大于12的概率比較其結(jié)果。2.大樣本的情形當(dāng)樣本容量足夠大,我們可以利用二13精確概率近似概率1近似概率2精確概率近似概率1近似概率214

15第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件162.2Cox-Stuart趨勢檢驗(yàn)

人們經(jīng)常要看某項(xiàng)發(fā)展的趨勢.但是從圖表上很難看出是遞增,遞減,還是大致持平.請看下面例子.我國自1985年到1996年出口和進(jìn)口的差額(balance)為(以億美元為單位)—149.0119.737.777.5—66.087.480.543.5122.254.0167.0122.2從這個(gè)數(shù)字,我們能否說這個(gè)差額總的趨勢是增長,還是減,還是都不明顯呢?下圖為該數(shù)據(jù)的點(diǎn)圖.從圖可以看出,總趨勢似乎是增長,但1993年有個(gè)低谷;這個(gè)低谷能否說明總趨勢并不是增長的呢?我們希望能進(jìn)行檢驗(yàn).2.2Cox-Stuart趨勢檢驗(yàn)

人們經(jīng)17第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件18三種假設(shè):

怎么進(jìn)行這些檢驗(yàn)?zāi)?可以把每一個(gè)觀察值和相隔大約n/2的另一個(gè)觀察值配對比較;因此大約有n/2個(gè)對子.然后看增長的對子和減少的對子各有多少來判斷總的趨勢.具體做法為取和。這里三種假設(shè):怎么進(jìn)行這些檢驗(yàn)?zāi)?可以把每一個(gè)觀察19在這個(gè)例子中n=12,因而c=6。這6個(gè)對子為(x1,x7),(x2,x8),(x3,x9),(x4,x10),(x5,xl1),(x6,x12)在這個(gè)例子中n=12,因而c=6。這6個(gè)對子為20用每一對的兩元素差Di=xi-xi+c的符號來衡量增減。令S+為正Di=xi-xi+c的數(shù)目,而令S-為負(fù)的Di=xi-xi+c的數(shù)。顯然當(dāng)正號太多時(shí),即S+很大時(shí)(或S-很小時(shí)),有下降趨勢,反之,則有增長趨勢.在沒有趨勢的零假設(shè)下它們應(yīng)服從二項(xiàng)分布b(6,0.5),這里n為對子的數(shù)目(不包含差為0的對子).該檢驗(yàn)在某種意義上是符號檢驗(yàn)的一個(gè)特例.用每一對的兩元素差Di=xi-xi+c的21類似于符號檢驗(yàn),對于上面1,2,3三種檢驗(yàn),分別取檢驗(yàn)統(tǒng)計(jì)量K=S+,K=S-和K=min(S+,S-).在本例中,這6個(gè)數(shù)據(jù)對的符號為5負(fù)1正,所以我們不能拒絕原假設(shè)。假設(shè)統(tǒng)計(jì)量

P值K=min(S+,S-)P(K<k)K=min(S+,S-)P(K<k)K=min(S+,S-)2P(K<k)類似于符號檢驗(yàn),對于上面1,2,3三種檢驗(yàn),分別取22游程檢驗(yàn)是樣本的隨機(jī)性檢驗(yàn),其用途很廣。例如當(dāng)我們要考察生產(chǎn)中出現(xiàn)次品出現(xiàn)是隨機(jī)的,還是成群的,一個(gè)時(shí)間序列是平穩(wěn)的還是非平穩(wěn)的,模型的隨機(jī)干擾項(xiàng)是否是白噪聲等都可以通過游程檢驗(yàn)來確定。2.3游程檢驗(yàn)游程檢驗(yàn)是樣本的隨機(jī)性檢驗(yàn),其用途很廣。例23第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件24第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件25第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件26從生產(chǎn)線上抽取產(chǎn)品檢驗(yàn),是否應(yīng)采用頻繁抽取小樣本的方法。在一個(gè)剛剛建成的制造廠內(nèi),質(zhì)檢員需要設(shè)計(jì)一種抽樣方法,以保證質(zhì)量檢驗(yàn)的可靠性。生產(chǎn)線上抽取的產(chǎn)品可以分成兩類,有瑕疵,無瑕疵。檢驗(yàn)費(fèi)用與受檢產(chǎn)品數(shù)量有關(guān)。一般情況下,有毛病的產(chǎn)品如果是成群出現(xiàn)的,則要頻繁抽取小樣本,進(jìn)行檢驗(yàn)。如果有毛病的產(chǎn)品是隨機(jī)產(chǎn)生的,則每天以間隔較長地抽取一個(gè)大樣本?,F(xiàn)隨機(jī)抽了30件產(chǎn)品,按生產(chǎn)線抽取的順序排列:0000111111111111110001111111檢驗(yàn)瑕疵的產(chǎn)品是隨機(jī)出現(xiàn)的嗎?

有瑕疵的產(chǎn)品是隨機(jī)出現(xiàn)有瑕疵的產(chǎn)品是成群出現(xiàn)從生產(chǎn)線上抽取產(chǎn)品檢驗(yàn),是否應(yīng)采用頻繁抽取小樣27隨機(jī)抽取的一個(gè)樣本,其觀察值按某種順序排列,如果研究所關(guān)心的問題是:被有序排列的兩種類型符號是否隨機(jī)排列,則可以建立雙側(cè)備擇.假設(shè)組為H0:序列是隨機(jī)的

H1:序列不是隨機(jī)的如果關(guān)心的是序列是否具有某種傾向,則應(yīng)建立單側(cè)備擇,假設(shè)組為H0:序列是隨機(jī)的

H1:序列具有混合的傾向

H0:序列是隨機(jī)的H1:序列具有成群的傾向游程:連續(xù)出現(xiàn)的具有相同特征的樣本點(diǎn)為一個(gè)游程。隨機(jī)抽取的一個(gè)樣本,其觀察值按某種順序排列,如果28檢驗(yàn)統(tǒng)計(jì)量。在H0為真的情況下,兩種類型符號出現(xiàn)的可能性相等,其在序列中是交互的。相對于一定的m和n,序列游程的總數(shù)應(yīng)在一個(gè)范圍內(nèi)。若游程的總數(shù)過少,表明某一游程的長度過長,意味著有較多的同一符號相連,序列存在成群的傾向;若游程總數(shù)過多,表明游程長度很短,意味著兩個(gè)符號頻繁交替,序列具有混合的傾向。選擇的檢驗(yàn)統(tǒng)計(jì)量為

R=游程的總數(shù)目檢驗(yàn)統(tǒng)計(jì)量。在H0為真的情況下,兩種類型符號出現(xiàn)的29游程R的分布為:可以做如下的考慮:游程R的分布為:可以做如下的考慮:30

先在m+n個(gè)抽屜里隨機(jī)選擇m個(gè),抽出的抽屜里放入“1”,沒有的放入“0”,所有可能基本的基本事件數(shù)為:有種。

或先在m+n個(gè)抽屜里隨機(jī)選擇n個(gè),抽出的抽屜里放入“0”,沒有的放入“1”,所有可能基本的基本事件數(shù)為:有種。先在m+n個(gè)抽屜里隨機(jī)選擇m個(gè),抽出的抽屜里放入311、必定有k+1個(gè)“1”構(gòu)成的游程和k個(gè)“0”構(gòu)成的游程;2、或必定有k+1個(gè)“0”構(gòu)成的游程和k個(gè)“1”構(gòu)成的游程。如果游程數(shù)為奇數(shù)R=2K+1,這意味著:1、必定有k+1個(gè)“1”構(gòu)成的游程和k個(gè)“032這就必須在m-1個(gè)位置中插入K個(gè)“隔離元”,使有“1”有k+1個(gè)游程,可以有種,同樣可以在n-1個(gè)“0”的n-1個(gè)空位上插入K-1個(gè)“隔離元”,有種。共有有利基本事件數(shù)。這就必須在m-1個(gè)位置中插入K個(gè)“隔離元”33在第二種情形下,有故:同理在第二種情形下,有同理34備擇假設(shè)P值序列具有混合的傾向右尾概率序列具有聚類的傾向左尾概率序列是非隨機(jī)的較小的左尾概率的兩倍備擇假設(shè)P值序列具有混合的傾向右尾概率序列具有聚類的傾向左尾35

n1是0的個(gè)數(shù),n2是1的個(gè)數(shù)。

質(zhì)量檢查人員對某車間生產(chǎn)的螺栓進(jìn)行抽樣檢查,依次檢查了50個(gè)。以“0”代表不合格,“1”代表合格。檢查結(jié)果如下:1111110111011111111101011110111111111110111101110.問不合格品的分布是否是隨機(jī)的?a=0.05。n1是0的個(gè)數(shù),n2是1的個(gè)數(shù)。36在實(shí)際問題中,不一定都遇到只有0或1的二元數(shù)據(jù)。但可以轉(zhuǎn)化為二元數(shù)據(jù)。工廠全面質(zhì)量管理中,按規(guī)定其中位數(shù)為9.865生產(chǎn)出的20個(gè)生產(chǎn)工件的某一尺寸按順序?yàn)椋瑔柍叽绲淖兓请S機(jī)的嗎?12.279.9210.8111.7911.871111110.9011.2210.8010.339.30111109.818.859.328.679.32000009.539.588.947.8910.7700001在實(shí)際問題中,不一定都遇到只有0或1的二元數(shù)據(jù)。37NEXTNEXT38

例如,在我國的工業(yè)和商業(yè)企業(yè)隨機(jī)抽出22家進(jìn)行資產(chǎn)負(fù)債率行業(yè)間的差異比較。有如下資料:這兩個(gè)行業(yè)的負(fù)債水平是否相等。首先,設(shè)“1”為工業(yè),“2”為商業(yè),將兩個(gè)行業(yè)的數(shù)據(jù)排序,得行業(yè)編號得游程:1111121111222111222222工業(yè)647655825982707561647383商業(yè)7780806593918491848686例如,在我國的工業(yè)和商業(yè)39第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件40人工模擬的白噪聲序列的游程檢驗(yàn)人工模擬的白噪聲序列的游程檢驗(yàn)41人工模擬的隨機(jī)游走序列的游程檢驗(yàn)人工模擬的隨機(jī)游走序列的游程檢驗(yàn)42人工模擬的ar(1)序列的游程檢驗(yàn)人工模擬的ar(1)序列的游程檢驗(yàn)43上證指數(shù)xtLn(xt)Ln(xt-1)收益率919.446.82..899.616.806.82-.021803876.506.786.80-.026025898.176.806.78.024423896.416.806.80-.001961906.986.816.80.011723918.406.826.81.012513929.526.836.82.012035907.856.816.83-.023589916.726.826.81.009723915.016.826.82-.001867942.446.856.83.014245收益率是隨機(jī)序列上證指數(shù)xtLn(xt)Ln(xt-1)收益率919.44644第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件45第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件462.4單樣本的Wilcoxon符號秩檢驗(yàn)Wilcoxon符號秩檢驗(yàn)是檢驗(yàn)關(guān)于中位數(shù)對稱的總體的中位數(shù)是否等于某個(gè)特定值,檢驗(yàn)的假設(shè):2.4單樣本的Wilcoxon符號秩檢驗(yàn)47檢驗(yàn)的步驟:1.計(jì)算,它們代表這些樣本點(diǎn)到的距離;2.把上面的n個(gè)絕對值排序,并找出它們的n個(gè)秩;如果有相同的樣本點(diǎn),每個(gè)點(diǎn)取平均秩(如1,4,4,5的秩為1,2.5,2.5,4);檢驗(yàn)的步驟:1.計(jì)算484.雙邊檢驗(yàn),在零假設(shè)下,和應(yīng)差不多.因而,當(dāng)其中之一非常小時(shí),應(yīng)懷疑零假設(shè);取檢驗(yàn)統(tǒng)計(jì)量T=min(,);

關(guān)于非參數(shù)統(tǒng)計(jì)分析,對統(tǒng)計(jì)量選擇的說明:對于左側(cè)檢驗(yàn),統(tǒng)計(jì)量值很小時(shí),拒絕原假設(shè)。如果左側(cè)檢驗(yàn)的備擇假設(shè)被接受,T-大,而T+小,故取T+為統(tǒng)計(jì)量。對于右側(cè)檢驗(yàn),統(tǒng)計(jì)量的值很大時(shí),拒絕原假設(shè)。如果右側(cè)檢驗(yàn)的備擇假設(shè)被接受,T+大,而T-小,故取T-為統(tǒng)計(jì)量4.雙邊檢驗(yàn)49第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件505.根據(jù)得到的T值,查Wilcoxon符號秩檢驗(yàn)的分布表以得到在零假設(shè)下P值.如果n很大要用正態(tài)近似:得到一個(gè)與T有關(guān)的正態(tài)隨機(jī)變量Z的值,再查表得P值或直接用計(jì)算機(jī)得到P值。5.根據(jù)得到的T值,查Wilcoxon符51Wilcoxon符號秩檢驗(yàn)表假設(shè)檢驗(yàn)的統(tǒng)計(jì)量P值

檢驗(yàn)統(tǒng)計(jì)量Z=-2.5725Z=-2.5725P-值=0.0052=0.01檢驗(yàn)的結(jié)果拒絕零假設(shè)拒絕零假設(shè)結(jié)論中位數(shù)小于99中位數(shù)不等于99Wilcoxon符號秩檢驗(yàn)表假設(shè)檢驗(yàn)的統(tǒng)計(jì)量P值

檢驗(yàn)統(tǒng)計(jì)52第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件53

打結(jié)的情況.在許多情況下,數(shù)據(jù)中有相同的數(shù)字,稱為結(jié)(tie).結(jié)中數(shù)字的秩為它們按升冪排列后位置的平均值.比如2.5,3.1,3.1,6.3,10.4這五個(gè)數(shù)的秩為1,2.5,2.5,4,5。也就是說,處于第二和第三位置的兩個(gè)3.1得到秩(2十3)/2=2.5.這樣的秩稱為中間秩。如果結(jié)多了,零分布的大樣本公式就不準(zhǔn)了。因此,在公式中往往要作修正。打結(jié)的情況.在許多情況下,數(shù)據(jù)中有相54其中用τi表示第i個(gè)結(jié)的性同觀測值的個(gè)數(shù)。用g表示結(jié)的個(gè)數(shù)。觀測值2247778999910秩1.51.5355579.59.59.59.512結(jié)統(tǒng)計(jì)量τi2—3—4—其中用τi表示第i個(gè)結(jié)的性同觀測值的個(gè)數(shù)。用g表示552.5正態(tài)得分檢驗(yàn)

(一)思想在各種各樣的秩檢驗(yàn)中,檢驗(yàn)的統(tǒng)計(jì)量為秩的函數(shù),而秩本身在沒有結(jié)時(shí)是有限個(gè)自然數(shù)的排列,它的分布是均勻分布。人們自然會(huì)用其他分布的樣本。自然我們會(huì)想到正態(tài)分布。正態(tài)記分檢驗(yàn)的基本思想就是把升冪排列的秩Ri用升冪排列的正態(tài)分位點(diǎn)來替代。我們在Wilcoxon符號檢驗(yàn)的基礎(chǔ)上,建立線性符號秩統(tǒng)計(jì)量在Wilcoxon符號檢驗(yàn)的基礎(chǔ)上,建立線性符號秩統(tǒng)計(jì)量

2.5正態(tài)得分檢驗(yàn)(一)思想56正態(tài)記分檢驗(yàn)的基本思想就是:把升冪排列的秩用升冪排列的正態(tài)分位點(diǎn)來替代。首先將按升冪排列,記秩為正態(tài)記分檢驗(yàn)的基本思想就是:把升冪排列的57例如Wilcoxon統(tǒng)計(jì)量為Wilcoxon記分函數(shù)1n-1n累積概率1/(n+1)(n-1)/(n+1)n/(n+1)正態(tài)記分函數(shù)例如Wilcoxon統(tǒng)計(jì)量為Wilcoxon1n-1n累積58正態(tài)積分檢驗(yàn)的統(tǒng)計(jì)量為:正態(tài)積分檢驗(yàn)的統(tǒng)計(jì)量為:59(二)檢驗(yàn)

檢驗(yàn)的假設(shè)為:(二)檢驗(yàn)檢驗(yàn)的假設(shè)為:60則檢驗(yàn)的統(tǒng)計(jì)量為

則檢驗(yàn)的統(tǒng)計(jì)量為61例、下面的數(shù)據(jù)是亞洲10個(gè)國家的新生兒死亡率(‰)33

363115964657788例、下面的數(shù)據(jù)是亞洲10個(gè)國家的新生兒死亡率(62

符號秩

平方33110.090909-1.33518-1.335181.78270136220.181818-0.90846-0.908460.82529531330.272727-0.60459-0.604590.365523151940.363636-0.34876-0.348760.12163192550.454545-0.11419-0.114190.01303862860.5454550.1141850.1141850.01303843070.6363640.3487560.3487560.121631653180.7272730.6045850.6045850.365523774390.8181820.9084580.9084580.8252958854100.9090911.3351781.3351781.782701合計(jì)6.21637633110.090909-1.33518-1.33563第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件64接受原假設(shè)。接受原假設(shè)。65第二章

單樣本非參數(shù)檢驗(yàn)第二章

單樣本非參數(shù)檢驗(yàn)662.1符號檢驗(yàn)和分位數(shù)推斷2.2Cox-Stuart趨勢檢驗(yàn)2.3游程檢驗(yàn)2.4Wilcoxon符號秩檢驗(yàn)2.5正態(tài)記分檢驗(yàn)2.6分布的一致性檢驗(yàn)2.7相對效率比較2.1符號檢驗(yàn)和分位數(shù)推斷672.1符號檢驗(yàn)2.1符號檢驗(yàn)68符號檢驗(yàn)的統(tǒng)計(jì)量為符號檢驗(yàn)。設(shè)隨機(jī)變量X1,…,Xn是從某個(gè)總體X中抽出的簡單隨機(jī)樣本。且分布函數(shù)F(X)在X=0是連續(xù)的。假設(shè)檢驗(yàn)問題檢驗(yàn)的統(tǒng)計(jì)量可以取符號檢驗(yàn)的統(tǒng)計(jì)量為符號檢驗(yàn)。設(shè)隨機(jī)變量X1,…,69在原假設(shè)為真的條件下,有服從參數(shù)為n和的二項(xiàng)分布b(n,0.5)。由于原假設(shè)為時(shí),B應(yīng)該不太大,也不太小,如果B太大或太小,應(yīng)該拒絕原假設(shè)。對于顯著性,求c1和c2,有拒絕區(qū)域?yàn)?在原假設(shè)為真的條件下,有服從參數(shù)為n和的二項(xiàng)70

精確的符號檢驗(yàn)是指檢驗(yàn)的p值是有精確的概率給出的。我們利用正號和負(fù)號的數(shù)目,來檢驗(yàn)?zāi)臣僭O(shè),這是一種最簡單的非參數(shù)方法。聯(lián)合國人員在世界上66個(gè)大城市的生活花費(fèi)指數(shù)(以紐約市1996年12月為100)按自小至大的次序排列如下(這里北京的指數(shù)為99)。2.1.1.精確中位數(shù)的符號檢驗(yàn)精確的符號檢驗(yàn)是指檢驗(yàn)的p值是有精確的概率給出的。我71

667578808181828383838384858586868686878788888888888989898990909191919192939396969697

99100101102103103104104104105106109109110110110111113115116117118155192

這個(gè)總體的中間水平是多少?北京使在該水平之上還是之下?(北京為99)第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件72通常在正態(tài)總體分布的假設(shè)下,關(guān)于總體均值的假設(shè)檢驗(yàn)和區(qū)間估計(jì)是用與t檢驗(yàn)有關(guān)的方法進(jìn)行的。然而,在本例中,總體分布是未知的。為此,首先看該數(shù)據(jù)的直方圖從圖中很難說這是什么分布。

假定用總體中位數(shù)來表示中間位置,這意味著樣本點(diǎn),取大于M的的概率應(yīng)該與取小于M的概率相等。所研究的問題,可以看作是只有兩種可能“成功”或“失敗”。通常在正態(tài)總體分布的假設(shè)下,關(guān)于總體均值的假設(shè)73成功:X-M大于零,即大于中位數(shù)M,記為“+”;失?。篨-M小于零,即小于中位數(shù)M,記為“-”。令S+=得正符號的數(shù)目

S—=得負(fù)符號得數(shù)目可以知道S+或S—均服從二項(xiàng)分布B(65,0.5)。則和可以用來作檢驗(yàn)的統(tǒng)計(jì)量。其假設(shè)為:成功:X-M大于零,即大于中位數(shù)M,記為“+”;74對于左側(cè)檢驗(yàn),當(dāng)零假設(shè)為真的下,應(yīng)該不大不小。當(dāng)過小,即只有少數(shù)的觀測值大于假定值,則可能假定值太大,目前總體真實(shí)中位數(shù)可能要小一些。如果,則拒絕原假設(shè)。對于左側(cè)檢驗(yàn),當(dāng)零假設(shè)為真的下,應(yīng)該不大不小。75對于右側(cè)檢驗(yàn),當(dāng)零假設(shè)為真的下,應(yīng)該不大不小。當(dāng)過大,即有多數(shù)的觀測值大于,則可能假定值太小,目前總體的真實(shí)中位數(shù)可能要大一些。如果,則拒絕原假設(shè)。對于右側(cè)檢驗(yàn),當(dāng)零假設(shè)為真的下,應(yīng)該不76

檢驗(yàn)統(tǒng)計(jì)量S+=23S+=23P-值

=0.01242=0.0248檢驗(yàn)的結(jié)果拒絕零假設(shè)拒絕零假設(shè)結(jié)論中位數(shù)小于99中位數(shù)不等于99

檢驗(yàn)統(tǒng)計(jì)量S+=23S+=23P-值772.大樣本的情形當(dāng)樣本容量足夠大,我們可以利用二項(xiàng)分布的近似來對該問題進(jìn)行檢驗(yàn)。因?yàn)橛?jì)數(shù)統(tǒng)計(jì)量在原假設(shè)為真時(shí),服從b(n,0.5)。且其均值為0.5n,方差為0.25n。則檢驗(yàn)的統(tǒng)計(jì)量為

當(dāng)B<n/2,+0.5;當(dāng)B>n/2,-0.5。這個(gè)加或減一個(gè)常數(shù)的原因是使得其估計(jì)出的p值更接近近似值。舉例如下。假設(shè)x服從b(20,0.7),用二項(xiàng)分布和其正態(tài)近似求其x大于12的概率比較其結(jié)果。2.大樣本的情形當(dāng)樣本容量足夠大,我們可以利用二78精確概率近似概率1近似概率2精確概率近似概率1近似概率279

80第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件812.2Cox-Stuart趨勢檢驗(yàn)

人們經(jīng)常要看某項(xiàng)發(fā)展的趨勢.但是從圖表上很難看出是遞增,遞減,還是大致持平.請看下面例子.我國自1985年到1996年出口和進(jìn)口的差額(balance)為(以億美元為單位)—149.0119.737.777.5—66.087.480.543.5122.254.0167.0122.2從這個(gè)數(shù)字,我們能否說這個(gè)差額總的趨勢是增長,還是減,還是都不明顯呢?下圖為該數(shù)據(jù)的點(diǎn)圖.從圖可以看出,總趨勢似乎是增長,但1993年有個(gè)低谷;這個(gè)低谷能否說明總趨勢并不是增長的呢?我們希望能進(jìn)行檢驗(yàn).2.2Cox-Stuart趨勢檢驗(yàn)

人們經(jīng)82第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件83三種假設(shè):

怎么進(jìn)行這些檢驗(yàn)?zāi)?可以把每一個(gè)觀察值和相隔大約n/2的另一個(gè)觀察值配對比較;因此大約有n/2個(gè)對子.然后看增長的對子和減少的對子各有多少來判斷總的趨勢.具體做法為取和。這里三種假設(shè):怎么進(jìn)行這些檢驗(yàn)?zāi)?可以把每一個(gè)觀察84在這個(gè)例子中n=12,因而c=6。這6個(gè)對子為(x1,x7),(x2,x8),(x3,x9),(x4,x10),(x5,xl1),(x6,x12)在這個(gè)例子中n=12,因而c=6。這6個(gè)對子為85用每一對的兩元素差Di=xi-xi+c的符號來衡量增減。令S+為正Di=xi-xi+c的數(shù)目,而令S-為負(fù)的Di=xi-xi+c的數(shù)。顯然當(dāng)正號太多時(shí),即S+很大時(shí)(或S-很小時(shí)),有下降趨勢,反之,則有增長趨勢.在沒有趨勢的零假設(shè)下它們應(yīng)服從二項(xiàng)分布b(6,0.5),這里n為對子的數(shù)目(不包含差為0的對子).該檢驗(yàn)在某種意義上是符號檢驗(yàn)的一個(gè)特例.用每一對的兩元素差Di=xi-xi+c的86類似于符號檢驗(yàn),對于上面1,2,3三種檢驗(yàn),分別取檢驗(yàn)統(tǒng)計(jì)量K=S+,K=S-和K=min(S+,S-).在本例中,這6個(gè)數(shù)據(jù)對的符號為5負(fù)1正,所以我們不能拒絕原假設(shè)。假設(shè)統(tǒng)計(jì)量

P值K=min(S+,S-)P(K<k)K=min(S+,S-)P(K<k)K=min(S+,S-)2P(K<k)類似于符號檢驗(yàn),對于上面1,2,3三種檢驗(yàn),分別取87游程檢驗(yàn)是樣本的隨機(jī)性檢驗(yàn),其用途很廣。例如當(dāng)我們要考察生產(chǎn)中出現(xiàn)次品出現(xiàn)是隨機(jī)的,還是成群的,一個(gè)時(shí)間序列是平穩(wěn)的還是非平穩(wěn)的,模型的隨機(jī)干擾項(xiàng)是否是白噪聲等都可以通過游程檢驗(yàn)來確定。2.3游程檢驗(yàn)游程檢驗(yàn)是樣本的隨機(jī)性檢驗(yàn),其用途很廣。例88第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件89第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件90第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件91從生產(chǎn)線上抽取產(chǎn)品檢驗(yàn),是否應(yīng)采用頻繁抽取小樣本的方法。在一個(gè)剛剛建成的制造廠內(nèi),質(zhì)檢員需要設(shè)計(jì)一種抽樣方法,以保證質(zhì)量檢驗(yàn)的可靠性。生產(chǎn)線上抽取的產(chǎn)品可以分成兩類,有瑕疵,無瑕疵。檢驗(yàn)費(fèi)用與受檢產(chǎn)品數(shù)量有關(guān)。一般情況下,有毛病的產(chǎn)品如果是成群出現(xiàn)的,則要頻繁抽取小樣本,進(jìn)行檢驗(yàn)。如果有毛病的產(chǎn)品是隨機(jī)產(chǎn)生的,則每天以間隔較長地抽取一個(gè)大樣本?,F(xiàn)隨機(jī)抽了30件產(chǎn)品,按生產(chǎn)線抽取的順序排列:0000111111111111110001111111檢驗(yàn)瑕疵的產(chǎn)品是隨機(jī)出現(xiàn)的嗎?

有瑕疵的產(chǎn)品是隨機(jī)出現(xiàn)有瑕疵的產(chǎn)品是成群出現(xiàn)從生產(chǎn)線上抽取產(chǎn)品檢驗(yàn),是否應(yīng)采用頻繁抽取小樣92隨機(jī)抽取的一個(gè)樣本,其觀察值按某種順序排列,如果研究所關(guān)心的問題是:被有序排列的兩種類型符號是否隨機(jī)排列,則可以建立雙側(cè)備擇.假設(shè)組為H0:序列是隨機(jī)的

H1:序列不是隨機(jī)的如果關(guān)心的是序列是否具有某種傾向,則應(yīng)建立單側(cè)備擇,假設(shè)組為H0:序列是隨機(jī)的

H1:序列具有混合的傾向

H0:序列是隨機(jī)的H1:序列具有成群的傾向游程:連續(xù)出現(xiàn)的具有相同特征的樣本點(diǎn)為一個(gè)游程。隨機(jī)抽取的一個(gè)樣本,其觀察值按某種順序排列,如果93檢驗(yàn)統(tǒng)計(jì)量。在H0為真的情況下,兩種類型符號出現(xiàn)的可能性相等,其在序列中是交互的。相對于一定的m和n,序列游程的總數(shù)應(yīng)在一個(gè)范圍內(nèi)。若游程的總數(shù)過少,表明某一游程的長度過長,意味著有較多的同一符號相連,序列存在成群的傾向;若游程總數(shù)過多,表明游程長度很短,意味著兩個(gè)符號頻繁交替,序列具有混合的傾向。選擇的檢驗(yàn)統(tǒng)計(jì)量為

R=游程的總數(shù)目檢驗(yàn)統(tǒng)計(jì)量。在H0為真的情況下,兩種類型符號出現(xiàn)的94游程R的分布為:可以做如下的考慮:游程R的分布為:可以做如下的考慮:95

先在m+n個(gè)抽屜里隨機(jī)選擇m個(gè),抽出的抽屜里放入“1”,沒有的放入“0”,所有可能基本的基本事件數(shù)為:有種。

或先在m+n個(gè)抽屜里隨機(jī)選擇n個(gè),抽出的抽屜里放入“0”,沒有的放入“1”,所有可能基本的基本事件數(shù)為:有種。先在m+n個(gè)抽屜里隨機(jī)選擇m個(gè),抽出的抽屜里放入961、必定有k+1個(gè)“1”構(gòu)成的游程和k個(gè)“0”構(gòu)成的游程;2、或必定有k+1個(gè)“0”構(gòu)成的游程和k個(gè)“1”構(gòu)成的游程。如果游程數(shù)為奇數(shù)R=2K+1,這意味著:1、必定有k+1個(gè)“1”構(gòu)成的游程和k個(gè)“097這就必須在m-1個(gè)位置中插入K個(gè)“隔離元”,使有“1”有k+1個(gè)游程,可以有種,同樣可以在n-1個(gè)“0”的n-1個(gè)空位上插入K-1個(gè)“隔離元”,有種。共有有利基本事件數(shù)。這就必須在m-1個(gè)位置中插入K個(gè)“隔離元”98在第二種情形下,有故:同理在第二種情形下,有同理99備擇假設(shè)P值序列具有混合的傾向右尾概率序列具有聚類的傾向左尾概率序列是非隨機(jī)的較小的左尾概率的兩倍備擇假設(shè)P值序列具有混合的傾向右尾概率序列具有聚類的傾向左尾100

n1是0的個(gè)數(shù),n2是1的個(gè)數(shù)。

質(zhì)量檢查人員對某車間生產(chǎn)的螺栓進(jìn)行抽樣檢查,依次檢查了50個(gè)。以“0”代表不合格,“1”代表合格。檢查結(jié)果如下:1111110111011111111101011110111111111110111101110.問不合格品的分布是否是隨機(jī)的?a=0.05。n1是0的個(gè)數(shù),n2是1的個(gè)數(shù)。101在實(shí)際問題中,不一定都遇到只有0或1的二元數(shù)據(jù)。但可以轉(zhuǎn)化為二元數(shù)據(jù)。工廠全面質(zhì)量管理中,按規(guī)定其中位數(shù)為9.865生產(chǎn)出的20個(gè)生產(chǎn)工件的某一尺寸按順序?yàn)椋瑔柍叽绲淖兓请S機(jī)的嗎?12.279.9210.8111.7911.871111110.9011.2210.8010.339.30111109.818.859.328.679.32000009.539.588.947.8910.7700001在實(shí)際問題中,不一定都遇到只有0或1的二元數(shù)據(jù)。102NEXTNEXT103

例如,在我國的工業(yè)和商業(yè)企業(yè)隨機(jī)抽出22家進(jìn)行資產(chǎn)負(fù)債率行業(yè)間的差異比較。有如下資料:這兩個(gè)行業(yè)的負(fù)債水平是否相等。首先,設(shè)“1”為工業(yè),“2”為商業(yè),將兩個(gè)行業(yè)的數(shù)據(jù)排序,得行業(yè)編號得游程:1111121111222111222222工業(yè)647655825982707561647383商業(yè)7780806593918491848686例如,在我國的工業(yè)和商業(yè)104第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件105人工模擬的白噪聲序列的游程檢驗(yàn)人工模擬的白噪聲序列的游程檢驗(yàn)106人工模擬的隨機(jī)游走序列的游程檢驗(yàn)人工模擬的隨機(jī)游走序列的游程檢驗(yàn)107人工模擬的ar(1)序列的游程檢驗(yàn)人工模擬的ar(1)序列的游程檢驗(yàn)108上證指數(shù)xtLn(xt)Ln(xt-1)收益率919.446.82..899.616.806.82-.021803876.506.786.80-.026025898.176.806.78.024423896.416.806.80-.001961906.986.816.80.011723918.406.826.81.012513929.526.836.82.012035907.856.816.83-.023589916.726.826.81.009723915.016.826.82-.001867942.446.856.83.014245收益率是隨機(jī)序列上證指數(shù)xtLn(xt)Ln(xt-1)收益率919.446109第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件110第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件1112.4單樣本的Wilcoxon符號秩檢驗(yàn)Wilcoxon符號秩檢驗(yàn)是檢驗(yàn)關(guān)于中位數(shù)對稱的總體的中位數(shù)是否等于某個(gè)特定值,檢驗(yàn)的假設(shè):2.4單樣本的Wilcoxon符號秩檢驗(yàn)112檢驗(yàn)的步驟:1.計(jì)算,它們代表這些樣本點(diǎn)到的距離;2.把上面的n個(gè)絕對值排序,并找出它們的n個(gè)秩;如果有相同的樣本點(diǎn),每個(gè)點(diǎn)取平均秩(如1,4,4,5的秩為1,2.5,2.5,4);檢驗(yàn)的步驟:1.計(jì)算1134.雙邊檢驗(yàn),在零假設(shè)下,和應(yīng)差不多.因而,當(dāng)其中之一非常小時(shí),應(yīng)懷疑零假設(shè);取檢驗(yàn)統(tǒng)計(jì)量T=min(,);

關(guān)于非參數(shù)統(tǒng)計(jì)分析,對統(tǒng)計(jì)量選擇的說明:對于左側(cè)檢驗(yàn),統(tǒng)計(jì)量值很小時(shí),拒絕原假設(shè)。如果左側(cè)檢驗(yàn)的備擇假設(shè)被接受,T-大,而T+小,故取T+為統(tǒng)計(jì)量。對于右側(cè)檢驗(yàn),統(tǒng)計(jì)量的值很大時(shí),拒絕原假設(shè)。如果右側(cè)檢驗(yàn)的備擇假設(shè)被接受,T+大,而T-小,故取T-為統(tǒng)計(jì)量4.雙邊檢驗(yàn)114第二章非參數(shù)統(tǒng)計(jì)分析(研究)課件1155.根據(jù)得到的T值,查Wilcoxon符號秩檢驗(yàn)的分布表以得到在零假設(shè)下P值.如果n很大要用正態(tài)近似:得到一個(gè)與T有關(guān)的正態(tài)隨機(jī)變量Z的值,再查表得P值或直接用計(jì)算機(jī)得到P值。5.根據(jù)得到的T值,查Wilcoxon符11

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論