《應(yīng)用統(tǒng)計分析》課件-第5章 非參數(shù)檢驗_第1頁
《應(yīng)用統(tǒng)計分析》課件-第5章 非參數(shù)檢驗_第2頁
《應(yīng)用統(tǒng)計分析》課件-第5章 非參數(shù)檢驗_第3頁
《應(yīng)用統(tǒng)計分析》課件-第5章 非參數(shù)檢驗_第4頁
《應(yīng)用統(tǒng)計分析》課件-第5章 非參數(shù)檢驗_第5頁
已閱讀5頁,還剩177頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第5章非參數(shù)檢驗5.1概述5.2單樣本檢驗5.3兩個獨立樣本的非參數(shù)檢驗5.4多獨立樣本檢驗5.5多配對樣本檢驗5.6SPSS應(yīng)用舉例12引入案例9所高校排名的總體分布是未知的,且已獲得的排名數(shù)據(jù)較少,要想得出嚴謹?shù)慕Y(jié)論,參數(shù)檢驗已不再適用。為了解決這樣的問題,我們須引入新的檢驗方法,即非參數(shù)檢驗。第1節(jié)概述5.1.1概念5.1.2基本思想5.1.3秩5.1.4非參數(shù)檢驗的優(yōu)點及不足35.1.1概念4第4章介紹了假設(shè)檢驗的基本原理以及適用場景,在利用參數(shù)假設(shè)檢驗時,我們是在假定總體分布已知或樣本量較大的情形下進行分析的。而在許多情況下,總體的參數(shù)是未知的,這就需要引入另一類統(tǒng)計分析方法,稱之為非參數(shù)檢驗。定義5.1非參數(shù)檢驗(nonparametrictesting):無需假定總體分布的具體形式,僅僅依賴于數(shù)據(jù)觀測值的相對大小(秩)或零假設(shè)下等可能的概率等與數(shù)據(jù)本身的具體總體分布無關(guān)的性質(zhì)進行的檢驗。5.1.2基本思想5非參數(shù)檢驗的核心思想是將原始數(shù)據(jù)在計量尺度上進行降級,把數(shù)值型數(shù)據(jù)看作品質(zhì)型數(shù)據(jù)來分析,通常利用原始數(shù)據(jù)的秩和頻數(shù)進行推斷檢驗,在構(gòu)造檢驗統(tǒng)計量時通常也不需要對總體的分布有清晰的了解,只需將概率模型視為初等概率模型即可,因此適用性強。另一方面,由于分析過程中數(shù)據(jù)在計量尺度上的降級,導(dǎo)致信息利用率下降,數(shù)據(jù)中包含的部分關(guān)鍵信息可能丟失,因此通常非參數(shù)檢驗功效較低。5.1.3秩6Xi149218173813227Ri75198246103這下面一行數(shù)據(jù)(記為Ri)就是上面一行數(shù)據(jù)Xi的秩。假定有隨機變量Xi,其觀測值如下:5.1.3秩7利用秩的大小進行推斷就避免了不知道背景分布的困難,檢驗的適用面廣,這也是非參數(shù)檢驗的優(yōu)點。在多數(shù)非參數(shù)檢驗中,明顯地或隱含地利用了秩的性質(zhì),但也有部分非參數(shù)檢驗方法沒有涉及秩的性質(zhì)。5.1.3秩8為在計量尺度上實現(xiàn)原始數(shù)據(jù)的降級,通常利用秩的性質(zhì),用數(shù)據(jù)的秩次代替原始數(shù)據(jù)信息來進行推斷檢驗。定義5.2數(shù)據(jù)的秩(rank):將所有觀察值按照從小到大的順序排列并逐一編號,規(guī)定每個觀測值在排列中所對應(yīng)的編號為該觀測值的秩;對于數(shù)值相同的觀測值,將它們的序號的平均數(shù)作為秩。5.1.4非參數(shù)檢驗的優(yōu)點及不足9相比于參數(shù)檢驗,非參數(shù)檢驗有以下優(yōu)點:在總體分布未知或樣本容量較小的情況下,非參數(shù)檢驗?zāi)芙鉀Q參數(shù)檢驗無法解決的問題。非參數(shù)檢驗具有穩(wěn)健性特征。非參數(shù)檢驗的方法更加靈活,能夠在大多數(shù)場合使用,不僅可以應(yīng)用于定距、定比變量的檢驗,也適用于定序、定類變量的檢驗。對樣本數(shù)據(jù)的測量水平以及來源要求不高,使得數(shù)據(jù)收集的過程更加簡單。非參數(shù)檢驗的計算較為簡單,不需要有堅實的數(shù)學(xué)基礎(chǔ)即可掌握。5.1.4非參數(shù)檢驗的優(yōu)點及不足10雖然非參數(shù)檢驗在總體未知時效率要比傳統(tǒng)方法高,有時高很多,但與參數(shù)檢驗相比,由于它放寬了應(yīng)用的尺度,因此也存在固有的不足:非參數(shù)檢驗對總體的限制較少,適用于大多數(shù)數(shù)據(jù)樣本,但方法也就缺乏針對性,在檢驗的過程中往往會丟失部分信息,其有效性并不如參數(shù)檢驗。當樣本容量較小時,檢驗得到的結(jié)果有較大偏差;而當樣本容量較大時,非參數(shù)檢驗的計算變得繁瑣復(fù)雜。5.1.4非參數(shù)檢驗的優(yōu)點及不足11非參數(shù)檢驗是對總體的分布不作任何限制的統(tǒng)計檢驗,故非參數(shù)檢驗又稱為自由(免)分布檢驗。正因為如此,非參數(shù)檢驗成為管理科學(xué)中應(yīng)用較為廣泛的一種統(tǒng)計檢驗方法。非參數(shù)檢驗通常適用于總體分布尚未了解或樣本數(shù)量較小的情形;參數(shù)檢驗適用于總體分布清晰或樣本數(shù)量較大的情形。是否使用非參數(shù)檢驗方法,需要根據(jù)對總體分布的了解程度來確定,綜合分析樣本數(shù)據(jù)以及總體特征,根據(jù)兩種方法的特點作出最優(yōu)的選擇。第2節(jié)單樣本檢驗5.2.1總體分布的擬合優(yōu)度檢驗5.2.2變量值隨機性檢驗單樣本非參數(shù)檢驗是在樣本總體未知的情況下,對單個總體的分布形態(tài)等進行推斷的方法。本節(jié)將詳細介紹單個總體問題的分析原理以及解決方案。125.2.1總體分布的擬合優(yōu)度檢驗13定義5.3總體分布的擬合優(yōu)度檢驗(thegoodnessoffittest):通過對樣本數(shù)據(jù)進行分析,采用一定的檢驗方法對樣本的總體分布與預(yù)期的總體分布進行檢驗,判斷兩者是否在讓人滿意的程度下吻合的方法。依據(jù)總體的分布情況,將樣本觀察結(jié)果進行劃分,計算出分類變量中各類別的期望頻數(shù),與分布的觀察頻數(shù)相對比,判斷期望頻數(shù)與觀察頻數(shù)是否有顯著差異,從而達到對分類變量進行分析的目的。5.2.1總體分布的擬合優(yōu)度檢驗14為什么需要知道總體分布?參數(shù)統(tǒng)計學(xué)推斷方法(如t檢驗、F檢驗)均以服從某一分布(如正態(tài)分布)為假定條件。實際工作中需要了解樣本觀察頻數(shù)(Observedfrequency,簡記為O)是否與某一理論頻數(shù)(Expectedfrequency,簡記為E)相符。5.2.1總體分布的擬合優(yōu)度檢驗15總體分布的擬合優(yōu)度檢驗的基本思想和步驟:將觀測值劃分為k組,分別記為事件A1,A2,…,AK-1,Ak;計算n次觀測值中每組的觀測頻數(shù),記為實際頻數(shù)Oi;在假定總體分布情況的基礎(chǔ)上,計算每組的理論頻數(shù)Ei;根據(jù)變量的分布規(guī)律或概率運算法則,計算每組的理論頻率為Pi;檢驗Oi與Ei的差異顯著性,判斷兩者之間的不符合度,作出拒絕原假設(shè)或不拒絕原假設(shè)的決定。

卡方檢驗16判斷樣本觀察頻數(shù)(Observedfrequency)與理論(期望)頻數(shù)(Expectedfrequency)之差是否由抽樣誤差所引起。原理

卡方檢驗17引入皮爾遜統(tǒng)計量:該統(tǒng)計量近似服從自由度的卡方分布。其中:a為假定的分布中需要利用樣本進行估計的參數(shù)個數(shù);n為樣本容量;k為樣本觀測值的分組組數(shù);

Oi為實際頻數(shù);Ei為理論頻數(shù);

Pi為理論概率。注意:理論頻數(shù)Ei不宜過?。ㄈ绮恍∮?),否則需要合并組段!

卡方檢驗18χ2分布(chi-squaredistribution)

卡方檢驗19一、樣本的總體分布為離散型分析步驟:建立假設(shè):

H0:樣本所屬的總體服從該理論離散分布;

H1:樣本所屬的總體不服從該理論離散分布,確定顯著性水平α,整理數(shù)據(jù),計算統(tǒng)計量的值,其自由度,查卡方分布表獲得拒絕域,作出決策。

卡方檢驗20【例5.1】早餐是一日三餐中最重要的一餐,某機構(gòu)為研究大學(xué)生的飲食規(guī)律,隨機抽取60名大學(xué)生,對其一周內(nèi)不吃早餐的天數(shù)進行調(diào)査,調(diào)査結(jié)果如下,試問:大學(xué)生不吃早餐的天數(shù)是否服從λ=4的泊松分布?(α=0.05)解:步驟一:建立假設(shè)。

H0:大學(xué)生不吃早餐的天數(shù)服從λ=4的泊松分布;

H1:大學(xué)生不吃早餐的天數(shù)不服從λ=4的泊松分布;

步驟二:將觀測值進行分組,列出各組的實際頻數(shù)與理論頻數(shù)。

若大學(xué)生不吃早餐的天數(shù)服從λ=4的泊松分布,則理論概率

卡方檢驗21處理后的數(shù)據(jù)如表所示:步驟三:列出并計算χ2統(tǒng)計量,做出決策。其中χ2分布的自由度v=4-1-1=2,查表得出,,因此我們不拒絕零假設(shè),認為大學(xué)生一周內(nèi)不吃早餐的天數(shù)沒有顯著違背λ=4的泊松分布。

卡方檢驗22總結(jié)本例通過對一周內(nèi)不吃早餐的大學(xué)生人數(shù)進行統(tǒng)計,并利用卡方檢驗的方法,在顯著性水平α=0.05的情況下,認為大學(xué)生不吃早餐的天數(shù)情況沒有顯著違背λ=4的泊松分布。以此給出了在樣本總體分布為離散型的情況下,對離散型總體進行擬合優(yōu)度檢驗的方法及步驟。

卡方檢驗23二、樣本的總體分布為連續(xù)型分析步驟:建立假設(shè):

H0:樣本所屬的總體服從該理論連續(xù)分布;

H1:樣本所屬的總體不服從該理論連續(xù)分布,將數(shù)據(jù)進行分組,記錄各個組別的觀測頻數(shù),査閱指定分布的頻數(shù)分布表來獲得各組的理論頻數(shù),計算統(tǒng)計量的值,查卡方分布表獲得拒絕域,最后作出決策。

卡方檢驗24【例5.2】為研究當下幼兒的生長發(fā)育情況,某機構(gòu)隨機抽取了150名4歲兒童進行身高調(diào)査,以下為150名4歲兒童的身高(cm),請檢驗其是否服從正態(tài)分布。(α=0.05)解:步驟一:對樣本觀測值進行分析,推斷兒童身高的總體分布為正態(tài)分布,設(shè)立原假設(shè)與備擇假設(shè)。

H0:兒童的身高服從正態(tài)分布;H1:不服從正態(tài)分布,

卡方檢驗25步驟二:對觀測值進行分組,列出各組的實際頻數(shù)和理論頻數(shù),對所需的量進行計算。為便于直接從標準正態(tài)分布中查出理論概率值??蓪ψ兞恐颠M行標準化處理。經(jīng)整理,得出下表所示數(shù)據(jù),此外,樣本平均值,樣本標準差S=15.688。

卡方檢驗26步驟三:列出并計算χ2統(tǒng)計量,作出決策。其中,χ2分布的自由度為v=7-1-2=4,由表5-4可知,在α=0.05的顯著性水平下,即不拒絕原假設(shè),認為兒童的身高沒有顯著違背正態(tài)分布。

卡方檢驗27總結(jié):本例對150名4歲幼兒的身高進行了統(tǒng)計,顯然身高數(shù)據(jù)為連續(xù)型數(shù)據(jù),在顯著性水平α=0.05的情況下,利用卡方檢驗的方法,認為幼兒的身高沒有顯著違背正態(tài)分布。以此給出了在樣本總體分布為連續(xù)型的情況下,對連續(xù)型總體進行擬合優(yōu)度檢驗的方法及步驟。

卡方檢驗28擬合優(yōu)度卡方檢驗的問題分組不同,擬合的結(jié)果可能不同。需要有足夠的樣本含量。對于連續(xù)型變量的優(yōu)度擬合,卡方檢驗并不是理想的方法。其他擬合檢驗方法是:

Kolmogorov-Smirnov檢驗Kolmogorov-Smirnov檢驗29由柯爾莫哥洛夫(Kolmogorov)和斯米爾諾夫(Smirnov)提出,通常用來檢驗一個數(shù)據(jù)的觀測經(jīng)驗分布是否已知的理論分布。主要應(yīng)用于有計量單位的連續(xù)數(shù)據(jù)和定性數(shù)據(jù)。適用于大樣本。原理:尋找最大距離(Distance),所以常簡稱為D法。Kolmogorov-Smirnov檢驗30經(jīng)驗分布:假設(shè)為來自總體X的一組容量為n的樣本,其樣本觀測值用

來表示,將它們從小到大進行排序,結(jié)果記為其中,表示為第k小的數(shù),定義如下函數(shù)為總體X的經(jīng)驗分布函數(shù)。Kolmogorov-Smirnov檢驗31要檢驗采集到的樣本是否來自一個指定的分布F(x),我們先假定樣本的真實分布為F0(x),給出以下原假設(shè)和備擇假設(shè):H0:對于所有x,

F(x)=F0(x),H1:對于至少一個x,

F(x)≠F0(x)構(gòu)造K-S統(tǒng)計量如下:其中,

Fn(x)為該組數(shù)據(jù)總體的經(jīng)驗分布。比較實際頻數(shù)與理論頻數(shù)的累積概率間的差距,找出最大距離D,根據(jù)D值來判斷實際頻數(shù)分布是否服從理論頻數(shù)分布。Kolmogorov-Smirnov檢驗32分析步驟:分析樣本觀測值,指定觀測值的理論分布函數(shù)形式,建立假設(shè)檢驗;由樣本數(shù)據(jù)計算經(jīng)驗分布函數(shù)以及理論分布函數(shù),代入計算;查表確定臨界值;作出決策。若經(jīng)過計算,得到,則要拒絕原假設(shè);否則認為擬合是令人滿意的,即樣本總體分布為指定的理論分布。Kolmogorov-Smirnov檢驗33【例5.3】在一定的實驗條件下,某研究組對葡糖氧化酶(GOD)的活性進行檢測,檢測的數(shù)據(jù)如下:試問:在實驗條件下,葡糖氧化酶(GOD)的活性是否服從正態(tài)分布?(α=0.05)解:步驟一:提出假設(shè)。

H0:GOD活性總體服從正態(tài)分布

H1:GOD活性總體不服從正態(tài)分布步驟二:對數(shù)據(jù)進行處理,得到經(jīng)驗分布函數(shù)與理論分布函數(shù),計算檢驗統(tǒng)計量。Kolmogorov-Smirnov檢驗34將GOD的活性記為X,計算得到樣本均值為8.0040,標準差S=0.9371,為便于直接從標準正態(tài)分布表中查出理論概率值,可對變量值進行標準化處理:Kolmogorov-Smirnov檢驗35步驟三:計算統(tǒng)計量,做出決策。由表中數(shù)據(jù)和,統(tǒng)計量D=0.12737,當α=0.05時,不拒絕零假設(shè),GOD活性分布為正態(tài)分布,擬合滿足要求。Kolmogorov-Smirnov檢驗36總結(jié):本例利用了K-S檢驗對葡糖氧化酶(GOD)的活性進行擬合優(yōu)度檢驗,在α=0.05的情況下,認為葡糖氧化酶(GOD)的活性沒有顯著違背正態(tài)分布。以此給出了K-S檢驗用于檢驗一個經(jīng)驗分布是否符合某種理論分布的一般分析步驟。

二項分布檢驗37在現(xiàn)實生活中有很多的取值是兩類的,如人群的男性和女性、產(chǎn)品的合格和不合格、學(xué)生的三好學(xué)生和非三好學(xué)生、投擲硬幣的正面和反面。這時,如果某一類情況出現(xiàn)的概率是P,另一類情況出現(xiàn)的概率就是1-P。這是伯努利試驗,特定事件的概率滿足二項分布。二項分布檢驗就是通過樣本觀測數(shù)據(jù)來檢驗總體是否服從指定概率為P的二項分布。

二項分布檢驗38分析步驟:提出假設(shè),并設(shè)置顯著性水平:

H0:樣本所屬的總體服從指定概率為P的二項分布;

H1:樣本所屬的總體不服從指定概率為P的二項分布,構(gòu)造統(tǒng)計量,當樣本容量與各個按檢驗假設(shè)計算的理論頻數(shù)Ei都足夠大時,有:其自由度v=組數(shù)-1-估計的參數(shù)個數(shù)。計算統(tǒng)計量并作出決策。

二項分布檢驗39【例5.4】某研究機構(gòu)為驗證“紅綠色弱和色盲屬于遺傳獲得”這一結(jié)論,在某地隨機抽取并調(diào)査了150戶3口之家,結(jié)果全家無該疾病的有99戶,家庭中1人患色弱或色盲的有23戶,2人患病的有19戶,3人全患病的有9戶。試問:該病是否可通過遺傳獲得?(α=0.05)解:若家庭成員之間的發(fā)病與否(X)互不影響,則X服從二項分布(兩種互斥結(jié)果、試驗條件不變、各次試驗獨立),也就表明色弱和色盲為后天性疾病,不通過遺傳獲得。步驟一:提出假設(shè)。

H0:色弱和色盲患病與否服從二項分布,即為后天性疾?。?/p>

H1:色弱和色盲患病與否不服從二項分布,即可遺傳獲得。

二項分布檢驗40步驟二:構(gòu)造統(tǒng)計量,將實驗數(shù)據(jù)列為表格的形式,計算統(tǒng)計以及檢驗過程所需要的其他量,如表所示。理論概率:理論家庭數(shù)=150

理論概率,根據(jù)實際頻數(shù)和理論頻數(shù)計算χ2值,其自由度v=組數(shù)-1-估計的參數(shù)個數(shù)=3-1-1=1。由于發(fā)病人數(shù)為2和3的理論家庭頻數(shù)較小,因此合并為一個組段進行分析。

二項分布檢驗41步驟三:作出是否拒絕原假設(shè)的決定。查表可以得到,經(jīng)計算得到的統(tǒng)計量,因此拒絕零假設(shè)H0,認為備擇假設(shè)H1顯著,認為患紅綠色弱和色盲顯著不服從二項分布,即認為該病可以通過遺傳獲得。

二項分布檢驗42總結(jié):二項分布檢驗是一種通過樣本來檢驗總體是否服從指定概率為P的二項分布的分析方法,適用于二值數(shù)據(jù)。在本例中,患病與不患病情況僅為兩類,在顯著性水平α=0.05的情況下,利用二項分布檢驗的方法,認為患病情況不服從二項分布,即認為家庭成員之間的發(fā)病相互影響。

似然比檢驗43第4章已闡述了單側(cè)檢驗的缺陷,而似然比檢驗不受這樣的缺陷約束,它既可以進行雙側(cè)檢驗,也能夠直接對總體分布進行假設(shè)檢驗。似然比檢驗由奈曼和皮爾遜于1928年提出,它是一種用于檢測某個假設(shè)是否有效的檢驗方法。假設(shè)為某總體的概率密度函數(shù),為來自該總體的樣本,則樣本的似然函數(shù)可以表示為:在此,設(shè)為k維參數(shù)空間,,定義:同樣的,設(shè),定義:

似然比檢驗44完成L0和L1的定義后,我們考慮假設(shè)檢驗問題,建立假設(shè):定義似然比如下:上述和分別是H0與H1成立時的極大似然估計。我們在

較大時拒絕原假設(shè)。需要注意的有以下兩點:兩似然函數(shù)的比值是樣本觀察值的函數(shù),不包含任何未知參數(shù)。當H0成立時,隨著n的增大而依分布收斂于。

似然比檢驗45分析步驟:建立假設(shè)如下:構(gòu)造似然比根據(jù)給定的顯著性水平α,確定拒絕域,作出決策。

似然比檢驗46【例5.5】(分布的似然比檢驗)設(shè)有樣本,考慮以下檢驗問題:設(shè)原假設(shè)和備擇假設(shè)分別為:H0:樣本來自正態(tài)分布,其密度函數(shù)為H1:樣本來自雙參數(shù)指數(shù)分布族,其密度函數(shù)為其中,。

似然比檢驗47當原假設(shè)成立時,極大似然估計為:而當備擇假設(shè)成立時:所以該檢驗問題的似然比為:其中,

似然比檢驗48因為關(guān)于D嚴格增加,所以拒絕域可取為。由于其中,因此,不論原假設(shè)為真還是備擇假設(shè)為真,D的分布皆與μ和σ無關(guān)。

似然比檢驗49【例5.6】用似然比檢驗導(dǎo)出正態(tài)總體的幾個檢驗:設(shè)樣本取自指數(shù)分部總體,其密度函數(shù)為試求顯著性檢驗問題(取顯著性水平為α)。解:確定拒絕域由于當H0為真時,總體,從而,進一步地,拒絕域為W。

單樣本非參檢驗的方法比較50卡方檢驗一般要求待檢驗樣本有較大的樣本容量,采用的是分組比較,即將樣本數(shù)據(jù)分組,逐組與理論分布的概率函數(shù)的對應(yīng)區(qū)間比較,一般適用于一個因素的多項分類的數(shù)據(jù)分析,常用于離散變量的相關(guān)性分析以及擬合優(yōu)度檢驗。二項分布檢驗是卡方檢驗的一個特例,只能對產(chǎn)品的合格和不合格、投擲硬幣的正面和反面等問題進行檢驗。單樣本K-S檢驗比較適合于連續(xù)型數(shù)據(jù)的分析,采用的是對樣本的累計概率函數(shù)和理論分布的累計概率函數(shù)進行比較,是一種擬合優(yōu)度的檢驗方法,其檢驗功效比較強。5.2.2變量值隨機性檢驗51在進行實際的統(tǒng)計分析時,我們常常需要考慮一組時間序列數(shù)據(jù)中某個觀測值的出現(xiàn)是否與順序無關(guān),這關(guān)系到每個數(shù)據(jù)之間是否相互獨立。從非參數(shù)角度考察,如果出現(xiàn)數(shù)據(jù)具有某一變化趨勢或者周期性變化規(guī)律,就表示數(shù)據(jù)間不是相互獨立的。這類問題可以轉(zhuǎn)化為0-1序列或類型出現(xiàn)的隨機性問題。變量值的隨機性檢驗亦稱為“觀測結(jié)果隨機性檢驗”、“樣本隨機性檢驗”,是隨機性假設(shè)“n次觀測結(jié)果構(gòu)成簡單隨機樣本”的一類統(tǒng)計檢驗。在進行統(tǒng)計推斷中,常用的變量值隨機性檢驗方法有:游程檢驗、反演總數(shù)檢驗、遞差檢驗、遞差符號游程檢驗、臨界點頻數(shù)檢驗、相長度檢驗、相頻數(shù)檢驗。5.2.2變量值隨機性檢驗52游程檢驗又稱為“連貫性檢驗”,是根據(jù)樣本標志表現(xiàn)排列所形成的游程的多少進行判斷的檢驗方法。關(guān)于隨機性的游程檢驗方法可用于檢驗一個二值變量的這兩個值的出現(xiàn)是否是隨機的。我們隨機抽取一個樣本,其觀測值按某種順序排列,若我們所關(guān)心的問題是有序排列的兩類取值是否是隨機排列的,則可以提出假設(shè):

H0:數(shù)據(jù)出現(xiàn)的順序是隨機的;H1:數(shù)據(jù)出現(xiàn)的順序是不隨機的。若我們關(guān)心的問題是序列是否具有某種傾向,則可以提出假設(shè):

H0:序列是隨機的;H1:序列具有混合的傾向?;?/p>

H0:序列是隨機的;H1:序列具有成群的傾向。5.2.2變量值隨機性檢驗53【例】擲硬幣試驗,這是一個伯努利試驗,計硬幣正面朝上為1,反面朝上為0,下面是由0和1組成的一個樣本:0010011111010011100000000其中,連續(xù)出現(xiàn)的同一類型取值稱為一個游程,即相同的0(或相同的1)在一起稱為一個游程(單獨的0或1也算)。游程中所包含的字符個數(shù)的多少稱為游程的長度。這組數(shù)據(jù)中有5個0組成的游程和4個1組成的游程,一共是R=9個游程。其中0的個數(shù)為m=15,而1的個數(shù)為n=10,游程長度為25。5.2.2變量值隨機性檢驗54出現(xiàn)0和1這樣一個過程可以看成是參數(shù)為某未知概率p的伯努利試驗,可通過0和1分布的集中程度來判斷隨機性的大小。但在給定了0的個數(shù)m和1的個數(shù)n之后,在0和1的出現(xiàn)是在隨機的零假設(shè)之下,R的條件分布就與這個參數(shù)無關(guān)了。根據(jù)初等概率論的知識,游程R的分布可以寫成:(令N=m+n)這樣就可以計算出在零假設(shè)下有關(guān)R的概率,以及進行有關(guān)檢驗了。5.2.2變量值隨機性檢驗55當m和n較小時,可以構(gòu)造檢驗p值:在給定顯著性水平α的條件下,若p值<α,我們可拒絕零假設(shè),反之則不拒絕零假設(shè)。當m和n很大時,需要對R進行進一步討論。在零假設(shè)下,可以證明得到:可構(gòu)造統(tǒng)計量:5.2.2變量值隨機性檢驗56統(tǒng)計量Z服從均值為0、方差為1的標準正態(tài)分布,因此可通過正態(tài)分布表獲得p值。若p值<α,則拒絕零假設(shè),反之則不拒絕零假設(shè)。由上可知,當p值足夠大時,不拒絕零假設(shè);當p值小于顯著性水平α時,將認為備擇假設(shè)顯著。在某些情況下,序列存在混合或成群的傾向,當序列存在混合的傾向(游程大)時,H1對應(yīng)的p值為Z的右尾概率,即p=P(R≥r);當序列存在成群的傾向(游程小)時,H1對應(yīng)的p值為Z的左尾概率,即p=P(R≤r)。5.2.2變量值隨機性檢驗57游程檢驗并不僅僅用于只取兩個值的變量,它還可以用于某個連續(xù)變量的取值小于某個值及大于該值的個數(shù)(類似于0和1的個數(shù))是否隨機的問題。【例】從某裝罐機出來的30罐辣醬的重量(單位:g)如下:試問:該裝瓶機是否正常工作?解:首先需要驗證大于和小于中位數(shù)的個數(shù)是否是隨機的(零假設(shè)為這種個數(shù)的出現(xiàn)是隨機的)。經(jīng)分析,可得中位數(shù)為70.2,如果把小于中位數(shù)的記為0,把大于中位數(shù)的記為1,上面數(shù)據(jù)變成下面的0-1序列:5.2.2變量值隨機性檢驗58分析步驟:建立假設(shè),確定顯著性水平α。找出觀測值的中位數(shù),將隨機變量轉(zhuǎn)換成取值為0或1的二值變量,計算游程R。對樣本量進行判斷,査游程檢驗臨界值表獲得臨界值,作出決策。5.2.2變量值隨機性檢驗59【例5.7】某工廠決定對產(chǎn)品的參數(shù)進行嚴格管控,為研究工件產(chǎn)品尺寸的不同是由隨機性因素造成的還是由非隨機性因素造成的,現(xiàn)從一批工件中隨機抽取18件,測量得到它們的尺寸(單位:cm)如下:試問:工件尺寸的不同是否是由隨機性因素造成的?(α=0.05)解:步驟一:提出假設(shè)。

H0:工件尺寸的不同是由隨機性因素造成的;

H1:工件尺寸的不同是由非隨機性因素造成的。5.2.2變量值隨機性檢驗60步驟二:計算中位數(shù),將工件尺寸轉(zhuǎn)換為0或1,計算游程R。計算得到中位數(shù)為3.385,將小于3.385的觀測值記為0,大于3.385的觀測值記為1,得到序列:計算得到游程R=11。步驟三:査表獲得臨界值,作出決策。在顯著性水平α=0.05的條件下,查表得到臨界值Rα=6,而11>6,因此接受零假設(shè),認為工件尺寸的不同是由隨機性因素造成的。5.2.2變量值隨機性檢驗61總結(jié):隨機性的游程檢驗是變量值的隨機性檢驗方法的一種,可判斷樣本數(shù)據(jù)有序排列的兩類取值是否是隨機的。在本例中,我們將工件尺寸數(shù)據(jù)轉(zhuǎn)換為0-1數(shù)據(jù),在顯著性水平α=0.05的條件下進行游程檢驗,最終認為工件尺寸的不同是由隨機性因素造成的。以此給出了隨機性游程檢驗的一般分析步驟。第3節(jié)兩個獨立樣本的非參數(shù)檢驗5.3.1Wilcoxon-Mann-WhitneyU檢驗5.3.2兩獨立樣本的K-S檢驗5.3.3兩獨立樣本的游程檢驗5.3.4兩獨立樣本的極端反應(yīng)檢驗625.3.1Wilcoxon-Mann-WhitneyU檢驗63Wilcoxon-Mann-WhitneyU檢驗又稱為Wilcoxon(或稱Mann-Whitney)秩和檢驗,可用于對兩個總體分布進行比較判斷,其零假設(shè)為兩組獨立樣本所屬的總體分布無顯著差異。它的原理如下:假定第一個樣本有m個觀測值,第二個有n個觀測值。把兩個樣本混合之后把這m+n個觀測值升冪排序,記下每個觀測值在混合排序下面的秩。之后分別把兩個樣本所得到的秩相加。記第一個樣本觀測值的秩的和為WX而第二個樣本秩的和為WY。這兩個值可以互相推算,稱為Wilcoxon統(tǒng)計量。該統(tǒng)計量的分布和兩個總體分布具體類型無關(guān)。由此分布可以得到p-值。直觀上看,如果WX與WY之中有一個顯著地大,則可以選擇拒絕零假設(shè)。該檢驗需要的唯一假定就是兩個總體的分布有類似的形狀(不一定對稱)。5.3.1Wilcoxon-Mann-WhitneyU檢驗64秩和檢驗原理:設(shè)分別從兩個未知的總體獨立、隨機地抽取容量為n1和n2的樣本,把樣本容量較小的總體稱為總體Ⅰ。如果兩樣本容量相等,就把任意一個總體稱作總體Ⅰ,另一個總體稱作總體Ⅱ,這里不妨設(shè)n1

≤n2。現(xiàn)將兩個樣本混合起來,并按數(shù)據(jù)的大小,從小到大排列編號,每個數(shù)值的編號就是它的秩次。如果混合樣本中有若干個相同的數(shù)值,則把它們的秩次進行簡單算術(shù)平均,用此平均值作為這些數(shù)值的秩次,計算來自總體Ⅰ的n1個數(shù)據(jù)在混合樣本中的秩次之和,記為T。5.3.1Wilcoxon-Mann-WhitneyU檢驗65顯然T最小的可能值是:T最大的可能值是如果兩個總體分布無顯著差異,則T值不應(yīng)太大或太小,而應(yīng)該在中間值(T1+T2)/2附近波動;如果總體Ⅰ分布于總體Ⅱ的右邊,T將接近其最大值T2;如果總體Ⅰ位于總體Ⅱ的左邊,T將接近于它的最小值T1。因此,我們可以用秩和T作為檢驗的統(tǒng)計量。5.3.1Wilcoxon-Mann-WhitneyU檢驗66方法一:當n1和n2都不超過10時,查“秩和檢驗表”確定臨界值;方法二:當n1和n2都超過10時,秩和T服從正態(tài)分布:在進行統(tǒng)計推斷前,先對T進行標準化變換,再利用標準正態(tài)分布表,確定檢驗的臨界值。5.3.1Wilcoxon-Mann-WhitneyU檢驗67分析步驟:假設(shè)n1=“總體I樣本觀察值的項數(shù)”,n2=“總體樣本Ⅱ觀察值的項數(shù)”。設(shè)樣本容量較小的一組為總體I,其對應(yīng)的樣本容量為n1,另一個總體稱作總體Ⅱ;T1=“總體I樣本各項秩之和的最小值”,T2=“總體I樣本各項秩之和的最大值”,T=“總體I樣本各項秩之和的實際值”。建立假設(shè):H0:總體I與總體II無差異;H1:總體I與總體II有差異。將兩組樣本數(shù)據(jù)混合,并按照數(shù)據(jù)大小的升序進行編號,數(shù)據(jù)對應(yīng)的序號即為該數(shù)據(jù)的秩。計算n1、n2、T1、T2、T。5.3.1Wilcoxon-Mann-WhitneyU檢驗68分析步驟:確定檢驗的臨界值。當n1和n2都不超過10時,查秩和檢驗表確定臨界值;當n1和n2都超過10時,秩和T服從正態(tài)分布。

在顯著性水平α已確定的情況下,對其進行標準化后即可得到臨界值。作出決策。5.3.1Wilcoxon-Mann-WhitneyU檢驗69【例5.8】有A、B兩家廠商供應(yīng)同一種電燈泡,兩家商品的價格與技術(shù)指標一致,但使用壽命是否一致有待檢驗。現(xiàn)在分別從兩家廠商生產(chǎn)的產(chǎn)品中抽出樣本,測定產(chǎn)品使用壽命如下(單位:月):以0.05的顯著性水平,檢驗兩家廠商電燈泡壽命是否有差異。5.3.1Wilcoxon-Mann-WhitneyU檢驗70解:步驟一:建立假設(shè)。原假設(shè)是兩廠商生產(chǎn)的電燈泡壽命沒有差異,平均壽命相同;備選假設(shè)是平均壽命不相同,是雙側(cè)檢驗。5.3.1Wilcoxon-Mann-WhitneyU檢驗71步驟二:求樣本觀測值秩的和。將樣本觀測值混合,并按升序進行排序編號:以上數(shù)據(jù)下畫橫線的為B廠商產(chǎn)品壽命。B廠商產(chǎn)品樣本容量小,設(shè)為總體I,n1=5。A廠商產(chǎn)品是總體II,n2=6。總體I的秩和為:5.3.1Wilcoxon-Mann-WhitneyU檢驗72步驟三:確定拒絕域。在顯著性水平α=0.05的條件下,進行雙側(cè)檢驗,查秩和檢驗表,n1=5,n2=6,得臨界值T1(α)=20,T2(α)=40。步驟四:比較秩和與臨界值大小。比較結(jié)果為:20<29.5<40,即T1(α)<T<T2(α)。步驟五:判斷是否拒絕零假設(shè)。樣本落入接受域,所以接受原假設(shè),樣本數(shù)據(jù)證明A、B兩廠商產(chǎn)品的壽命沒有顯著差異。5.3.1Wilcoxon-Mann-WhitneyU檢驗73總結(jié):Wilcoxon-Mann-WhitneyU檢驗可用于檢驗兩組獨立樣本所屬的總體分布是否存在顯著差異,一般適用于等級資料以及兩端無確定值的資料。在本例中,對A、B廠家燈泡壽命進行了統(tǒng)計,在α=0.05的情況下,利用Wilcoxon-Mann-WhitneyU檢驗方法,認為兩廠商生產(chǎn)的燈泡壽命無顯著差異。以此給出了Wilcoxon-Mann-WhitneyU檢驗的一般分析步驟。5.3.2兩獨立樣本的K-S檢驗74單樣本的K-S檢驗主要用于研究單一總體是否服從某一假定分布的問題。但有時在統(tǒng)計學(xué)研究中,需要判斷兩個獨立總體是否具有相同的分布形式,這時我們需要應(yīng)用兩個獨立樣本的K-S檢驗。與單樣本的K-S檢驗一樣,兩個獨立樣本的K-S檢驗也是根據(jù)經(jīng)驗分布函數(shù)理論,采用了與單樣本K-S檢驗類似的統(tǒng)計量,主要應(yīng)用于有計量單位的連續(xù)數(shù)據(jù)和定性數(shù)據(jù),因此在應(yīng)用上單樣本與兩個獨立樣本問題在推斷檢驗中有類似的過程。5.3.2兩獨立樣本的K-S檢驗75假定有分別來自兩個獨立總體的兩個樣本,現(xiàn)在我們想要檢驗它們背后的總體分布相同的零假設(shè),可以進行兩個獨立樣本的K-S檢驗。其基本原理完全和單樣本情況一樣,只不過需要把檢驗統(tǒng)計量中零假設(shè)的分布換成另一個樣本的經(jīng)驗分布。假定為來自分布為Fn(x)總體的樣本觀測值,為來自分布為Fm(y)的樣本觀測值,即兩個樣本容量分別為n和m。Fn

與Fm分別為對應(yīng)樣本所屬總體的經(jīng)驗分布函數(shù)。現(xiàn)在我們需要研究的問題是,如何驗證兩經(jīng)驗分布函數(shù)相同。5.3.2兩獨立樣本的K-S檢驗76為利用兩個獨立樣本的K-S檢驗解決上述問題,常建立假設(shè):

H0:兩個獨立樣本對應(yīng)的總體分布不存在差異;

H1:兩個獨立樣本對應(yīng)的總體分布存在差異。構(gòu)造兩個獨立樣本的K-S檢驗統(tǒng)計量為:利用以上統(tǒng)計量,可以進行假設(shè)檢驗。在查K-S檢驗臨界表時,我們需明確兩個樣本的樣本容量m和n。在給定的顯著性水平α下,查找臨界值。若統(tǒng)計量D的值大于臨界值,落入拒絕域,則我們可認為兩個獨立樣本對應(yīng)的總體分布存在顯著差異。5.3.2兩獨立樣本的K-S檢驗77需要指出的是:現(xiàn)假定兩個樣本總體的樣本容量分別為n1和n2,用S1(X)和S2(X)分別表示兩個樣本的經(jīng)驗分布函數(shù)。再記,可構(gòu)造近似服從正態(tài)分布的檢驗統(tǒng)計量如下:分析步驟:建立假設(shè),確定顯著性水平α。對兩個樣本總體的觀測值進行整理,計算得到統(tǒng)計量D的值。查表得到臨界值,作出決策。5.3.2兩獨立樣本的K-S檢驗78【例5.9】為研究某品牌的兩款藍牙耳機在市場上的顧客年齡維度是否服從相同分布,藍牙耳機經(jīng)銷商對于使用這兩款耳機的用戶進行了調(diào)查,調(diào)查數(shù)據(jù)如下(單位:歲):試問:在市場上的兩款藍牙耳機顧客年齡分布是否相同?(α=0.05)解:步驟一:建立假設(shè)。

H0:在市場上的兩款藍牙耳機顧客年齡分布相同;

H1:在市場上的兩款藍牙耳機顧客年齡分布存在差異。5.3.2兩獨立樣本的K-S檢驗79步驟二:整理數(shù)據(jù),計算統(tǒng)計量D的值。使用耳機1的用戶數(shù)與使用耳機2的用戶數(shù)相等,n=m=8。5.3.2兩獨立樣本的K-S檢驗80步驟三:査表獲得臨界值,作出決策。在顯著性水平α=0.05的條件下,査表得拒絕區(qū)域為D>0.625,統(tǒng)計量D的值未落入拒絕域,不拒絕零假設(shè),認為在市場上的兩款藍牙耳機顧客年齡分布沒有顯著差異。總結(jié):兩個獨立樣本的K-S檢驗的基本思想與單樣本情況下類似,根據(jù)經(jīng)驗分布函數(shù)理論,適用于有計量單位的連續(xù)數(shù)據(jù)和定性數(shù)據(jù),與單樣本情況下一致。本例對使用兩款耳機的用戶年齡進行了統(tǒng)計,在顯著性水平α=0.05的條件下,認為兩款藍牙耳機顧客年齡分布沒有顯著差異。以此給出了兩獨立樣本的K-S檢驗的一般分析步驟。5.3.3兩獨立樣本的游程檢驗

(Wald-Wolfwitzrunstest)81Wald-Wolfowitz游程檢驗(Wald-Wolfowitzrunstest)和K-S檢驗共同關(guān)注的問題是兩個樣本所代表的總體是否服從相同分布,但是我們所采取的方法不一樣。Wald-Wolfowitz游程檢驗把兩個樣本混合之后,按照大小次序排列,一個樣本的觀測值在一起的為一個游程,一般可用于研究定量數(shù)據(jù)。與單樣本的游程問題類似,我們可以根據(jù)游程個數(shù)R得出兩個樣本在排序中是否隨機出現(xiàn)的結(jié)論。82分析步驟:建立假設(shè):

H0:兩個樣本來自的總體服從相同分布;

H1:兩個樣本來自的總體服從不同分布。將兩組樣本混合,按照升序進行排序,并標明組號。按照組號計算游程的個數(shù)R。查游程數(shù)檢驗表,確定拒絕域。若R落入拒絕域,則拒絕原假設(shè),否則不拒絕原假設(shè)。若兩組分布相同,樣本值分布應(yīng)較為分散,相互交叉,故游程數(shù)R較多。因此,R較大時,我們一般不拒絕原假設(shè),否則拒絕原假設(shè)。5.3.3兩獨立樣本的游程檢驗

(Wald-Wolfwitzrunstest)83【例5.10】在兩次十分鐘的體育課堂上的小游戲中,對12名6歲男孩和12名6歲女孩進行觀察,在這兩個時間段內(nèi)對每個孩子在游戲中表現(xiàn)出來的活潑程度進行評分,結(jié)果如下:利用這兩組評分進行如下檢驗:表現(xiàn)出的活潑程度存在性別差異。5.3.3兩獨立樣本的游程檢驗

(Wald-Wolfwitzrunstest)84解:步驟一:建立假設(shè):

H0:男孩和女孩表現(xiàn)出的活潑程度不存在性別差異;

H1:男孩和女孩表現(xiàn)出的活潑程度存在性別差異。步驟二:將兩組數(shù)據(jù)混合,按照升序排列,標明組號,并計算游程R。5.3.3兩獨立樣本的游程檢驗

(Wald-Wolfwitzrunstest)5.3.3兩獨立樣本的游程檢驗

(Wald-Wolfwitzrunstest)85步驟三:確認拒絕域,判斷是否拒絕原假設(shè)。由以上數(shù)據(jù)可知,游程數(shù)R=4,又已知兩個樣本容量均為12,記為m=12,n=12,査分布表,R=4落入拒絕域,因此我們拒絕原假設(shè),即認為男孩和女孩表現(xiàn)出的活潑程度存在性別差異。總結(jié):Wald-Wolfowitz游程檢驗主要關(guān)心的問題為兩個獨立樣本的總體分布是否一致,利用的是游程檢驗的方法。本例對12名男孩和12名女孩在游戲中的活潑程度評分進行了統(tǒng)計,利用Wald-Wolfowitz游程檢驗的方法,認為活潑程度評分存在性別差異。以此給出了Wald-Wolfowitz游程檢驗的一般分析步驟。5.3.4兩個獨立樣本的極端反應(yīng)檢驗86與Wilcoxon-Mann-WhitneyU檢驗、K-S檢驗以及游程檢驗不同,極端反應(yīng)檢驗是從另一個角度判斷兩個獨立樣本是否服從同一分布的一種檢驗方法,一般可用于研究定量數(shù)據(jù)。其基本原理是將其中一組樣本總體作為控制樣本(對照組),另一組樣本總體作為實驗樣本,在進行檢驗時,以控制樣本作為對照,檢驗實驗樣本相對于控制樣本是否出現(xiàn)了極端反應(yīng)。若實驗樣本相對于控制樣本未出現(xiàn)極端反應(yīng),則可認為兩組樣本對應(yīng)的總體分布無顯著差異;若實驗樣本相對于控制樣本出現(xiàn)極端反應(yīng),則可認為兩組樣本對應(yīng)的總體分布存在顯著差異。5.3.4兩個獨立樣本的極端反應(yīng)檢驗87跨度(SPAN)我們將兩組樣本混合并按照從小到大的順序進行排序,記錄每個觀測值的秩,隨后找出并記錄控制樣本的最低秩與最高秩,可計算跨度S=控制樣本的最高秩-控制樣本的最低秩+1。若計算得到的跨度不為整數(shù),則對其進行四舍五入得到整數(shù)。有時為控制極端值對推斷結(jié)果的影響,可先去掉樣本中最極端的兩個觀測值,然后計算跨度,此時稱該跨度為截頭跨度。若得到跨度或截頭跨度較小,則表明兩組樣本無法充分混合,可認為實驗樣本相對于控制樣本存在極端反應(yīng),即可認為兩組樣本對應(yīng)的總體分布存在顯著差異。5.3.4兩個獨立樣本的極端反應(yīng)檢驗88在利用極端反應(yīng)檢驗進行實際的統(tǒng)計學(xué)推斷時,我們常建立假設(shè):

H0:無極端反應(yīng)現(xiàn)象,認為兩個樣本對應(yīng)的總體具有相同的分布范圍(不存在兩極分化);

H1:存在極端反應(yīng)現(xiàn)象,即認為兩個樣本對應(yīng)的總體的分布范圍存在差異(存在兩極分化)。假定我們從兩個獨立總體X、Y中分別抽取了兩個樣本x1,x2,…,xm和y1,y2,…,yn,將總體X對應(yīng)的樣本作為實驗樣本,將總體Y對應(yīng)的樣本作為控制樣本。將兩組樣本混合并進行排序,找出控制樣本的最低秩與最高秩之間包含的觀測值,計算得到得分跨度S。記m、n分別為控制樣本和實驗樣本的樣本數(shù),令g=S-m+2h,構(gòu)造統(tǒng)計量如下:5.3.4兩個獨立樣本的極端反應(yīng)檢驗89其中,一般情況下h=0,當h

≠0時以上公式依然適用。我們可利用以上統(tǒng)計量進行推斷檢驗,在給定顯著性水平α的條件下,若,則可拒絕零假設(shè);否則不拒絕零假設(shè)。分析步驟:建立假設(shè),確定顯著性水平α。確定控制樣本和實驗樣本,計算跨度,進而計算檢驗統(tǒng)計量P。將檢驗統(tǒng)計量P的值與顯著性水平α進行比較,作出決策。5.3.4兩個獨立樣本的極端反應(yīng)檢驗90【例5.11】學(xué)校為激發(fā)部分學(xué)生的學(xué)習熱情,計劃在實驗班內(nèi)實施“以愛好為導(dǎo)向”的教學(xué)方法。學(xué)校預(yù)期該方法將大幅提高部分學(xué)生的學(xué)習成績,而也將有部分學(xué)生成績下降,產(chǎn)生兩極分化現(xiàn)象。現(xiàn)學(xué)校為研究這一問題,在實驗班中隨機抽取了7名同學(xué),記錄他們接受新的教學(xué)方法前后的考試成績,將接受新教學(xué)方法前學(xué)生成績記為A,接受新教學(xué)方法后學(xué)生成績記為B。接受新教學(xué)方法前后學(xué)生的成績?nèi)缦拢涸噯枺翰捎眯陆虒W(xué)方法是否會引起學(xué)生成績兩極分化?(α=0.05)5.3.4兩個獨立樣本的極端反應(yīng)檢驗91解:步驟一:建立假設(shè),確定顯著性水平α=0.05。

H0:采用新教學(xué)方法不會引起學(xué)生成績兩極分化;

H1:采用新教學(xué)方法將會引起學(xué)生成績兩極分化。步驟二:根據(jù)控制樣本和實驗樣本,計算跨度與統(tǒng)計量P,作出決策。記控制樣本數(shù)量為m,實驗樣本數(shù)量為n,n=m=7,標注了秩的學(xué)生成績?nèi)缦拢?.3.4兩個獨立樣本的極端反應(yīng)檢驗92跨度S:計算統(tǒng)計量P:得到P>α,因此我們不拒絕零假設(shè),認為采用新教學(xué)方法不會引起學(xué)生成績兩極分化。5.3.4兩個獨立樣本的極端反應(yīng)檢驗93總結(jié):極端反應(yīng)檢驗是一種通過對極端反應(yīng)的觀察,推斷兩個獨立樣本是否服從同一分布的檢驗方法。在本例中,對學(xué)生成績進行了統(tǒng)計,利用極端反應(yīng)檢驗方法,對控制樣本與實驗樣本進行跨度上的比較。以此給出了極端反應(yīng)檢驗的一般分析步驟。第4節(jié)多獨立樣本檢驗94在實際的統(tǒng)計學(xué)應(yīng)用中,我們可能需要對來自多個總體的數(shù)據(jù)進行研究并嘗試找出它們的內(nèi)在關(guān)系,但這樣的數(shù)據(jù)對應(yīng)的總體分布往往是我們不熟悉的,因此要運用非參數(shù)檢驗的方法對數(shù)據(jù)所屬的總體進行推斷。通過分析樣本數(shù)據(jù),利用多樣本的非參數(shù)檢驗方法,可推斷樣本來自的多個獨立總體的分布是否存在顯著差異。一般通過推斷多個獨立總體的均值或中位數(shù)是否存在顯著差異來判斷多個獨立總體是否存在顯著差異。第4節(jié)多獨立樣本檢驗5.4.1K-W檢驗5.4.2中位數(shù)檢驗5.4.3Jonkheere-Terpstra檢驗955.4.1K-W檢驗96運用K-W檢驗的目的在于檢驗多個總體的位置參數(shù)是否一樣,其檢驗的基本思想與Wilcoxon-Mann-Whitney檢驗類似,可認為它是一個將兩個獨立樣本的Wilcoxon-Mann-Whitney檢驗推廣到3個或多個樣本總體的檢驗方法。假定有k個總體,我們先將從這k個總體獲得的樣本混合并進行排序,記各個總體觀測值的秩之和為Ri,i=1,…,k。顯然,如果這些Ri相差較大,就可以認為它們位置參數(shù)相同的零假設(shè)不妥(備選假設(shè)為各個位置參數(shù)不全相等)。5.4.1K-W檢驗97現(xiàn)在,假定這些樣本有連續(xù)分布F1,F2,…,Fk,我們要研究的是這k個總體的分布是否相同,推斷所需要用的數(shù)據(jù)為k個獨立的樣本總體,其樣本容量分別為n1,n2,…,nk。建立零假設(shè)為H0:F1=F2=…=Fk,備擇假設(shè)為H1:Fi(x)=F(x+qi),i=1,2,…,k,這里F為某連續(xù)分布函數(shù),而且這些參數(shù)qi并不相等。于是,定義K-W檢驗統(tǒng)計量如下:式中,ni為第i個樣本總體的樣本量,N為各個樣本量之和(總樣本量)。5.4.1K-W檢驗98需注意,如果觀測值中有大小一樣的數(shù)值,這個公式會有稍微的變化。

式中,為觀測數(shù)值大小相等的統(tǒng)計量,稱為結(jié)統(tǒng)計量;g為觀測數(shù)值大小相等的統(tǒng)計量的個數(shù),稱為結(jié)的個數(shù)。5.4.1K-W檢驗99K-W檢驗統(tǒng)計量在位置參數(shù)相同的零假設(shè)下服從漸近的自由度為k-1的c2分布。當樣本容量不太大時,該統(tǒng)計量的臨界值可通過査表得出;當樣本容量較大時,可認為檢驗統(tǒng)計量近似服從自由度為k-1的c2分布。利用K-W檢驗統(tǒng)計量的性質(zhì),可進行推斷檢驗,當統(tǒng)計量的值落入拒絕域時,我們將拒絕零假設(shè)。5.4.1K-W檢驗100分析步驟:建立假設(shè)。

H0:F1(x),F2(x),…,Fk(x)都相等;

H1:Fj(x)中至少有兩個不相等,j=1,2,…,k。

若偏重于對各個總體的位置參數(shù)進行考察,則建立的假設(shè)為:

H0:θ1=

θ2=…=

θk;

H1:θj中至少有兩個不相等,j=1,2,…,k。整理樣本數(shù)據(jù),計算檢驗統(tǒng)計量H。判斷是否拒絕零假設(shè)。

若,則不拒絕H0,認為k組樣本對應(yīng)的總體分布相等。

若,則拒絕H1,認為總體分布不全相等。5.4.1K-W檢驗101【例5.12】為檢驗4種教學(xué)方法對學(xué)生的影響是否存在顯著差異,學(xué)校將班上的30名同學(xué)隨機分為4個小組,對4個小組分別采用不同的教學(xué)方法進行授課,并通過月考進行檢驗。學(xué)生月考成績?nèi)缦拢涸噯枺哼@4種教學(xué)方法對學(xué)生成績的影響是否存在顯著差異?(α=0.05)5.4.1K-W檢驗102解:步驟一:建立假設(shè)。,認為4種教學(xué)方法對學(xué)生成績的影響無顯著差異;中至少有兩個不相等,j=l,2,3,4,認為4種教學(xué)方法對學(xué)生成績的影響存在顯著差異。步驟二:計算檢驗統(tǒng)計量H。5.4.1K-W檢驗103步驟三:查卡方分布表可獲得臨界值,作出決策。查表可知,,比較可得到,因此不拒絕零假設(shè),即認為這4種教學(xué)方法對學(xué)生成績的影響無顯著差異??偨Y(jié):K-W檢驗一般用于檢驗多個總體的位置參數(shù)是否一樣,與Wilcoxon-Mann-Whitney檢驗類似,適用于等級資料以及兩端無確定值的資料。本例中,對4組接受不同教學(xué)方法的學(xué)生的成績情況進行了統(tǒng)計,在顯著性水平α=0.05的情況下,利用K-W檢驗,認為4種不同的教學(xué)方法對學(xué)生成績的影響無顯著差異。以此給出了K-W檢驗運用于多獨立樣本情況下的一般分析步驟。5.4.2中位數(shù)檢驗104在單樣本檢驗的問題中,我們常常關(guān)注的是總體的中心是否等于一個預(yù)期的值。但在實際問題中,我們更多時候是研究多個樣本的位置參數(shù)。進行中位數(shù)檢驗時,在有多個獨立樣本的情況下,我們希望通過判斷這多個樣本的中位數(shù)是否相等來檢驗這多個樣本總體的位置參數(shù)是否相等。中位數(shù)檢驗一般用于分析定量數(shù)據(jù)。建立假設(shè)時,零假設(shè)是這些樣本所代表的總體的中位數(shù)相等,備選假設(shè)是這些中位數(shù)不全相等。5.4.2中位數(shù)檢驗105假定有k個獨立的總體,分別從這k個總體中隨機抽出樣本,ni為第i個樣本的樣本量(i=1,2,…,k),將所有樣本量之和記為N。先將來自這k個總體的樣本混合,從小到大排序,找出它們的中位數(shù)。再計算每個總體中小于該中位數(shù)的觀測值個數(shù)O1i(i=1,2,…,k),以及每個總體中大于該中位數(shù)的觀測值個數(shù)O2i

(i=1,2,…,k)。將Oji列入數(shù)據(jù)表的第j行第i列,形成一個由元素Oji組成的2×k表(i=1,2,…,k,j=1,2)。其列總和為ni(i=1,2,…,k),兩個行總和為各樣本小于總中位數(shù)的觀測值總數(shù)R1=O11+O12+…+O1k及各樣本總體大于總中位數(shù)的觀測值總數(shù)R2=O21+O22+…+O2k。5.4.2中位數(shù)檢驗106這顯然是一個列聯(lián)表,可以用皮爾遜Pearsonc2統(tǒng)計量,即其中,列聯(lián)表c2統(tǒng)計量的自由度=(行數(shù)-1)(列數(shù)-1)=(2-1)(k-1)=k-1。利用以上統(tǒng)計量可進行假設(shè)檢驗:當皮爾遜c2統(tǒng)計量的值大于査表得到的臨界值時,拒絕零假設(shè)。5.4.2中位數(shù)檢驗107分析步驟:建立假設(shè),確認顯著性水平α。

H0:k個總體的中位數(shù)相等(k個總體沒有顯著差異);

H1:k個總體的中位數(shù)不完全相等(k個總體存在顯著差異)。將k組樣本進行混合排序,找出這組觀測值的中位數(shù),分別計算每個總體中小于和大于該中位數(shù)的觀測值的個數(shù)O1i、O2i(i=1,2,…,k),以及各樣本小于和大于總中位數(shù)的觀測值總和R1、R2,列出列聯(lián)表。計算c2統(tǒng)計量。査分布表獲得拒絕域,若落入拒絕域,則拒絕原假設(shè),否則不拒絕原假設(shè)。5.4.2中位數(shù)檢驗108【例5.13】這里收集了22名職工的年收入情況,其中12名來自企業(yè)I,另外10名職工來自企業(yè)Ⅱ,他們的年薪如下:(單位:萬元)試問:兩個企業(yè)職工年薪的多少有顯著差異嗎?(α=0.05)5.4.2中位數(shù)檢驗109解:步驟一:建立假設(shè)。

H0:這兩個企業(yè)職工的工資沒有差異;

H1:這兩個企業(yè)職工的工資有顯著差異。步驟二:將兩個企業(yè)職工的年薪進行混合排序,找出中位數(shù),分別計算O1i,O2i,R1,R2,列出列聯(lián)表。易得中位數(shù)為24(萬元)。5.4.2中位數(shù)檢驗110步驟三:計算c2統(tǒng)計量。自由度為(2-1)*(2-1)=1。步驟四:査表獲得拒絕域,作出決策。在α=0.05的情況下,統(tǒng)計量c2落入拒絕域,因此拒絕原假設(shè),認為兩企業(yè)職工的工資存在顯著差異。

5.4.2中位數(shù)檢驗111總結(jié):中位數(shù)檢驗通過對多個樣本的中位數(shù)進行比較,來推斷這多個樣本總體的位置參數(shù)是否相等,一般適用于定量數(shù)據(jù)。在本例中,對來自兩個企業(yè)的22名職工的薪資情況進行了統(tǒng)計,利用中位數(shù)檢驗的方法,在顯著性水平0.05的情況下,認為兩企業(yè)的工資存在顯著差異。以此給出了中位數(shù)檢驗的一般分析步驟。5.4.3Jonkheere-Terpstra檢驗112一般的假設(shè)檢驗問題涉及雙邊檢驗和單邊檢驗,類似地,在多獨立樣本情況下,我們同樣會遇到這樣的問題。Jonkheere-Terpstra檢驗的基本思想與K-W檢驗類似,零假設(shè)都為各個總體的位置參數(shù)相同,適用于等級資料以及兩端無確定值的資料。但不同的是,Jonkheere-Teipstra檢驗中的備選假設(shè)應(yīng)設(shè)為各個總體的位置參數(shù)按升冪排列(如為降冪排列,將總體編號顛倒順序即為升冪排列),與K-W檢驗相比,Jonkheere-Terpstra檢驗具有更強的勢。5.4.3Jonkheere-Terpstra檢驗113在小樣本情況下,假定k個獨立樣本(總體)分別來自有著同樣形狀的連續(xù)分布函數(shù),將各個獨立總體的位置參數(shù)(如中位數(shù))記為,假定k個樣本的樣本容量分別為ni,

i=1,2,…,k,令xij為來自第i個樣本的第j個獨立觀測值(i=1,2…k;

j=1,2,…,ni)。在此基礎(chǔ)上,觀測值xij可寫為以下線性模型:式中,

i=1,2…k,;j=1,2,…,ni;

隨機干擾項服從同一分布。5.4.3Jonkheere-Terpstra檢驗114在利用K-W檢驗解決實際問題時,我們常建立假設(shè)如下:

至少有一個不相等(i=1,2,…,k)當樣本總體的位置參數(shù)可能呈上升趨勢時,K-W檢驗不再適用,我們需利用Jonkheere-Terpstra檢驗,在檢驗中應(yīng)將備擇假設(shè)設(shè)定為各個總體的位置參數(shù)按升冪排列:(其中至少有一個不等式成立)。若位置參數(shù)呈現(xiàn)出下降趨勢,可將總體編號順序顛倒,顛倒后即為升冪排列。5.4.3Jonkheere-Terpstra檢驗115Jonckheere-Terpstra檢驗是先在每兩個樣本的所有觀測值之間比較,計算第i個樣本觀測值中小于第j個樣本觀測值的對子數(shù):在此基礎(chǔ)上,構(gòu)造如下統(tǒng)計量:我們可利用統(tǒng)計量J進行假設(shè)檢驗,在給定顯著性水平α的情況下,查表獲得臨界值,若統(tǒng)計量J的值大于臨界值,則拒絕零假設(shè)。5.4.3Jonkheere-Terpstra檢驗116在大樣本情況下,Jonckheere-Terpstra檢驗量J可正態(tài)近似為即在H0成立的條件下,當,且時,服從均值為0、方差為1的標準正態(tài)分布,其中,。利用這樣的性質(zhì),可進行假設(shè)檢驗,在顯著性水平α給定的條件下,

若,則拒絕零假設(shè)。5.4.3Jonkheere-Terpstra檢驗117分析步驟:建立假設(shè),確認顯著性水平α。

(其中至少一個等式不成立)計算第i個樣本觀測值中小于第j個樣本觀測值的對子數(shù)Uij。將所有的Uij在i<j的范圍內(nèi)求和計算出統(tǒng)計量J的值,即査表獲得臨界值,若統(tǒng)計量J的值大于臨界值落入拒絕域,則拒絕零假設(shè),作出接受備擇假設(shè)的決定。5.4.3Jonkheere-Terpstra檢驗118【例5.14】在一次藥物臨床試驗中,三種藥物對于小白鼠體重的影響如表5-9所示(控制其他變量相同)。試問:在顯著性水平α=0.01的條件下,能否認為這三種藥物對于小白鼠體重的影響相同?5.4.3Jonkheere-Terpstra檢驗119解:步驟一:建立假設(shè)。由于三種藥物對于小白鼠體重的影響的位置參數(shù)可能呈上升趨勢,因此建立假設(shè)為:認為三種藥物對于小白鼠體重的影響的位置參數(shù)相同;認為三種藥物對于小白鼠體重的影響的位置參數(shù)呈上升趨勢。5.4.3Jonkheere-Terpstra檢驗120步驟二:整理數(shù)據(jù),計算統(tǒng)計量。易得到U12=25,U23=14,U13=20,對三者進行求和得到J=25+14+20=59。步驟三:查表獲得臨界值,判斷是否接受零假設(shè)。在(n1,n2,n3)=(5,5,4)的情況下,査表得P(J≥58)=0.0009,即對于α>0.001可以拒絕零假設(shè),因此接受備擇假設(shè),認為三種藥物對于小白鼠體重的影響的位置參數(shù)呈上升趨勢。5.4.3Jonkheere-Terpstra檢驗121總結(jié):Jonkheere-Terpstra檢驗通過對樣本位置顯現(xiàn)的趨勢進行觀察,來推斷多個總體間的分布關(guān)系,適用于等級資料以及兩端無確定值的資料。在本例中,對注射不同藥物后的小白鼠的體重進行統(tǒng)計,利用Jonkheere-Terpstra檢驗的方法,在顯著性水平α=0.01的條件下,可得到以上的結(jié)論。以此給出了Jonkheere-Terpstra檢驗的一般分析步驟。第5節(jié)多配對樣本檢驗5.5.1兩配對樣本的非參數(shù)檢驗5.5.2多配對樣本的非參數(shù)檢驗122配對樣本檢驗主要包括兩配對樣本的非參數(shù)檢驗以及多配對樣本的非參數(shù)檢驗。配對樣本檢驗適用于在總體分布未知的情況下,推斷樣本來自的兩個或多個相關(guān)配對總體的分布是否存在顯著差異,可用于分析定性數(shù)據(jù)和定量數(shù)據(jù)。本節(jié)將對兩配對樣本的非參數(shù)檢驗以及多配對樣本的非參數(shù)檢驗進行詳細介紹。5.5.1兩配對樣本的非參數(shù)檢驗123兩配對樣本的非參數(shù)檢驗一般用于研究同一對象對于兩種不同處理方法的效果比較或同一對象在處理前后的對比。進行兩配對樣本的非參數(shù)檢驗的主要方法有:①McNcmar變化顯著性檢驗;②符號檢驗;③Wilcoxon符號平均秩檢驗。McNemar變化顯著性檢驗124McNemar檢驗是一種常用的顯著性檢驗。McNemar變化顯著性檢驗往往將研究對象自身作為對照者,檢驗其“前后”的變化是否顯著,要求研究的樣本數(shù)據(jù)為二分類數(shù)據(jù),若被檢驗的變量不為二值變量,則需要運用一些手段進行轉(zhuǎn)換得到二值變量。在進行一般的統(tǒng)計學(xué)推斷中,McNemar變化顯著性檢驗通常用于研究二項分布總體。其基本原理為通過對兩組樣本處理前后頻率變化的研究,來推斷二項分布的概率值。McNemar變化顯著性檢驗125在利用McNemar變化顯著性檢驗解決實際問題時,我們通常建立假設(shè)如下:

H0:樣本來自的兩配對總體分布相同;

H1:樣本來自的兩配對總體分布存在差異。假定一個二值變量X,其取值為0或1(如消費者對某產(chǎn)品的滿意與否、學(xué)生認為學(xué)習的重要與否),現(xiàn)有一組實驗對象,我們對這一對象進行某種處理,記處理前得到的樣本為處理前樣本,處理后得到的樣本為處理后樣本,記錄各種情況下的頻數(shù),記為a、b、c、d,列出列聯(lián)表(見表5-10)。McNemar變化顯著性檢驗126在零假設(shè)條件下,應(yīng)有a+b=a+c以及c+d=b+d,整理易得b=c。在大樣本情況下,我們構(gòu)造卡方統(tǒng)計量如下:其自由度v=(2-1)(2-1)=1,利用該統(tǒng)計量可以進行假設(shè)檢驗。McNemar變化顯著性檢驗127分析步驟:建立假設(shè),確定顯著性水平α。

H0:樣本來自的兩配對總體分布不存在差異;

H1:樣本來自的兩配對總體分布存在差異。整理數(shù)據(jù),列出列聯(lián)表。計算χ2統(tǒng)計量的值,查表獲得拒絕域,判斷是否拒絕零假設(shè)。McNemar變化顯著性檢驗128【例5.15】某公司計劃引入一批新設(shè)備,為此選取100名員工,在進行新設(shè)備介紹的前后,公司就引入新設(shè)備的必要性進行調(diào)查,調(diào)查結(jié)果如表5-11所示。試問:介紹前后員工對于引進新設(shè)備的態(tài)度有變化嗎?(α=0.05)。McNemar變化顯著性檢驗129解:步驟一:建立假設(shè)。

H0:介紹前后員工態(tài)度無變化;

H1:介紹前后員工態(tài)度發(fā)生變化。步驟二:整理數(shù)據(jù),分析列聯(lián)表,計算c2統(tǒng)計量的值,作出決策。當α=0.05時,查表得臨界值為3.84,c2統(tǒng)計量的值落入拒絕域,因此拒絕零假設(shè),認為介紹前后員工態(tài)度發(fā)生顯著變化。McNemar變化顯著性檢驗130總結(jié):McNemar檢驗要求研究的對象為二分類數(shù)據(jù),用于判斷兩配對總體的分布關(guān)系。在本例中,對宣講后員工的態(tài)度情況進行了統(tǒng)計,利用McNemar檢驗的方法,在顯著性水平α=0.05的情況下,認為態(tài)度發(fā)生顯著變化。以此給出了McNemar檢驗的一般分析步驟。

符號檢驗131如果需要對非二值的連續(xù)變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論