第7章 不同群體的差異比較抽樣調(diào)查課件_第1頁(yè)
第7章 不同群體的差異比較抽樣調(diào)查課件_第2頁(yè)
第7章 不同群體的差異比較抽樣調(diào)查課件_第3頁(yè)
第7章 不同群體的差異比較抽樣調(diào)查課件_第4頁(yè)
第7章 不同群體的差異比較抽樣調(diào)查課件_第5頁(yè)
已閱讀5頁(yè),還剩168頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章不同群體的差異比較第一節(jié)假設(shè)檢驗(yàn)概述主要內(nèi)容掌握假設(shè)檢驗(yàn)的概念、基本思想和步驟;熟悉假設(shè)檢驗(yàn)的分類;假設(shè)檢驗(yàn)的兩類錯(cuò)誤和注意事項(xiàng);正態(tài)性檢驗(yàn)的原理和方法;了解假設(shè)檢驗(yàn)的思維方法和數(shù)據(jù)轉(zhuǎn)換的方法。7.1.1假設(shè)檢驗(yàn)的概念、基本思想和步驟1、假設(shè)檢驗(yàn)的原因由于個(gè)體差異的存在,即使從同一總體中嚴(yán)格的隨機(jī)抽樣,X1、X2、X3、X4、、、,不同。 因此,X1、X2不同有兩種(而且只有兩種)可能:(1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。(2)分別所代表的總體均數(shù)不同。2、假設(shè)檢驗(yàn)的目的判斷是由于何種原因造成的不同,以做出決策。3.假設(shè)檢驗(yàn)的思想方法假設(shè)檢驗(yàn)是用小概率事件原理做邏輯判斷的一種思想方法:通過(guò)統(tǒng)計(jì)學(xué)的計(jì)算分析,在某個(gè)假設(shè)(H0)條件下,發(fā)生事件A的可能性不到0.05,而在實(shí)際的研究中,一次抽樣就發(fā)生了事件A,那么研究者就認(rèn)為所做假設(shè)(H0)不成立。4.假設(shè)檢驗(yàn)思想的剖析

假設(shè)檢驗(yàn)的基本思想類似于邏輯論證的反證法。它的程序是在檢驗(yàn)一個(gè)假設(shè)是否成立時(shí),先假定這個(gè)假設(shè)成立,如果由此導(dǎo)出一個(gè)不合理的現(xiàn)象(出理了小概率事件),就拒絕這個(gè)假設(shè);如果沒(méi)有導(dǎo)出不合理的現(xiàn)象(未出理小概率事件),則不能拒絕原來(lái)假設(shè)。數(shù)學(xué)中邏輯論的反證法是由假設(shè)推導(dǎo)出與公理、定理或已知條件相矛盾的結(jié)論。從而推翻假設(shè)。統(tǒng)計(jì)中的假設(shè)檢驗(yàn)則是由假設(shè)推出一個(gè)概率事件(并不是絕對(duì)矛盾)而拒絕假設(shè)。從這里也看拒絕假設(shè)還是一個(gè)犯錯(cuò)誤的概率。只是這個(gè)概率很小而已。5.假設(shè)檢驗(yàn)的一般步驟一、建立假設(shè)二、確定檢驗(yàn)水準(zhǔn)三、選擇統(tǒng)計(jì)分析方法及計(jì)算統(tǒng)計(jì)量四、求p值五、做統(tǒng)計(jì)結(jié)論一、建立假設(shè)假設(shè)有兩種:1.檢驗(yàn)假設(shè)或無(wú)效假設(shè),記做H0(假設(shè)比較的樣本來(lái)自相同的總體,它們的差別僅是由于抽樣誤差引起)2.備擇假設(shè),記做H1,即假設(shè)比較的樣本的差別不是抽樣誤差引起的,而是來(lái)自不同的總體。如:

H0:

H1:二、確定檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn),用希臘字母α表示。顯著性水平(

)就是我們用來(lái)區(qū)分大概率事件和小概率事件的標(biāo)準(zhǔn),是人為規(guī)定的。當(dāng)某事件發(fā)生的概率小于

時(shí),則認(rèn)為該事件為小概率事件,是不太可能發(fā)生的事件。通常

取0.05或0.01。α為犯第一類錯(cuò)誤的概率,第一類錯(cuò)誤即為拒絕了實(shí)際上成立的H0。

三、選擇統(tǒng)計(jì)方法和計(jì)算統(tǒng)計(jì)量根據(jù)資料的類型選擇選擇不同的統(tǒng)計(jì)方法,并計(jì)算不同的統(tǒng)計(jì)量。如兩個(gè)樣本均數(shù)的假設(shè)檢驗(yàn),樣本均數(shù)與總體均數(shù)的假設(shè)檢驗(yàn)選用t檢驗(yàn)法,計(jì)算t值多個(gè)均數(shù)的假設(shè)檢驗(yàn),選用方差分析,計(jì)算F值四、求p值意義:如果總體狀況和H0一致,樣本信息支持H0的概率。具體來(lái)說(shuō):如果H0成立,抽得現(xiàn)有樣本差別的概率P,亦就是現(xiàn)有樣本差別是由于抽樣原因引起的概率P。將計(jì)算得到的u值或t值與查表得到u

或t,ν,比較,得到P值的大小。如果|u|>u

或|t|>u

,則P<

;如果|u|<u

或|t|<u

,則P>

。五、推斷結(jié)果(1)如果p>

,認(rèn)為在檢驗(yàn)假設(shè)H0成立的條件下,得到等于或大于現(xiàn)有統(tǒng)計(jì)量u值或t值的可能性大于

,不屬于小概率事件,則不拒絕H0,差別無(wú)統(tǒng)計(jì)學(xué)意義,結(jié)論是不認(rèn)為兩總體均數(shù)不相等。

(2)如果p<

,我們認(rèn)為在檢驗(yàn)假設(shè)H0成立的條件下,得到等于或大于現(xiàn)有統(tǒng)計(jì)量u值或t值的可能性小于

,可判斷為小概率事件,則拒絕H0,接受H1,差別有統(tǒng)計(jì)意義,結(jié)論是兩總體均數(shù)不相等,或者某一總體均數(shù)大于(或小于)另一總體均數(shù)。假設(shè)檢驗(yàn)的結(jié)果α為0.05或0.01作為檢驗(yàn)水準(zhǔn)是人為的,可根據(jù)需要選擇。接受檢驗(yàn)假設(shè)拒絕檢驗(yàn)假設(shè)正確理解結(jié)論的概率性(都隱含著犯錯(cuò)誤的可能性):(1)接受H0,拒絕H1,并非H1絕對(duì)不成立,只是H1成立的機(jī)會(huì)較??;(2)拒絕H0,接受H1,也并非絕對(duì)H0絕對(duì)不成立,也只是成立的概率較小。7.1.2假設(shè)檢驗(yàn)的兩類錯(cuò)誤不拒絕H0拒絕H0

推斷結(jié)論和兩類錯(cuò)誤實(shí)際情況

檢驗(yàn)結(jié)果H0真

第類錯(cuò)誤

結(jié)論正確(1—)

H0不真

結(jié)論正確(1—)第Ⅱ類錯(cuò)誤

型錯(cuò)誤:拒絕了實(shí)際上成立的H0,這類“棄真”錯(cuò)誤稱為

型錯(cuò)誤,其概率大小用表示。Ⅱ

型錯(cuò)誤:“接受”了實(shí)際上不成立的H0

,這類“存?zhèn)巍卞e(cuò)誤稱為Ⅱ

型錯(cuò)誤,其概率大小用表示通常情況下Ⅱ型錯(cuò)誤未知對(duì)于一般的假設(shè)檢驗(yàn):

定為0.05(或0.01),

的大小取決于H1。通常情況下,比較總體間有無(wú)差異并不知道,即H1不明確,

值的大小無(wú)法確定,也就是說(shuō),對(duì)于一般的假設(shè)檢驗(yàn),我們并不知道犯Ⅱ型錯(cuò)誤的概率

有多大。

當(dāng)樣本容量n一定時(shí),越小,越大;越大,越小。在實(shí)際工作中,往往通過(guò)去控制。I型錯(cuò)誤與II型錯(cuò)誤示意圖(以單側(cè)u檢驗(yàn)為例)

間的關(guān)系減少(增加)I型錯(cuò)誤(),將會(huì)增加(減少)II型錯(cuò)誤(),增大n同時(shí)降低

ab檢驗(yàn)效能(powerofatest)1–

稱為假設(shè)檢驗(yàn)功效,也稱把握度。意義:兩總體確有差別,被檢出有差別的能力如:1–=0.90,則意味著當(dāng)H0不成立時(shí),理論上在每100次抽樣中,在檢驗(yàn)水準(zhǔn)上平均有90次能拒絕H0

假設(shè)檢驗(yàn)的注意事項(xiàng)一、事先進(jìn)行嚴(yán)密的統(tǒng)計(jì)學(xué)設(shè)計(jì)基本原則:對(duì)照、隨機(jī)、重復(fù)、均衡。沒(méi)有對(duì)照就沒(méi)有鑒別。隨機(jī):就是總體中的同質(zhì)單位,都有同等機(jī)會(huì)被抽到,隨機(jī)可以保證樣本對(duì)總體有代表性,避免主管偏向性。重復(fù):就是適當(dāng)?shù)臉颖竞?,樣本含量過(guò)少不能發(fā)現(xiàn)規(guī)律性,過(guò)多造成浪費(fèi),樣本含量根據(jù)實(shí)驗(yàn)或抽樣調(diào)查要求,可查表或按公式計(jì)算求得。均衡:亦就是除處理因素外,其他因素都應(yīng)保持基本相同。單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)兩者是研究者根據(jù)分析目的和專業(yè)知識(shí)等信息采用的兩種不同檢驗(yàn)形式。如:要了解新研制的某中藥對(duì)肝炎的治療效果。如果試驗(yàn)組是在西藥治療的基礎(chǔ)上加新研制的中藥,中西藥的療效不會(huì)低于西藥組,就可以用單側(cè)檢驗(yàn),雙側(cè)檢驗(yàn)特別適用于對(duì)預(yù)試驗(yàn)結(jié)果進(jìn)行分析。在同一檢驗(yàn)水準(zhǔn)下,單側(cè)檢驗(yàn)比雙側(cè)檢驗(yàn)的界值小,單側(cè)拒絕域比雙側(cè)的拒絕域大,比雙側(cè)檢驗(yàn)更易得出拒絕H0,從而得出差別有統(tǒng)計(jì)學(xué)意義。靈活確定

水準(zhǔn)一般取=0.05對(duì)于組間方差齊性檢驗(yàn)或資料的正態(tài)性檢驗(yàn),研究者期望得到陰性結(jié)果,為了減少假陰性結(jié)果二類錯(cuò)誤,由于一類錯(cuò)誤和二類錯(cuò)誤呈反比關(guān)系,取0.10,0.20或更大較為適宜。根據(jù)樣本特點(diǎn),選用不同假設(shè)檢驗(yàn)方法(1)計(jì)量資料的兩均數(shù)進(jìn)行比較時(shí),一般可選用t檢驗(yàn)和u檢驗(yàn)。對(duì)兩小樣本均數(shù)比較必須滿足兩個(gè)條件:正態(tài)性和方差齊性。(2)計(jì)數(shù)資料的率或構(gòu)成比比較可選用檢驗(yàn)(3)等級(jí)資料可選用秩和檢驗(yàn)正確理解統(tǒng)計(jì)推斷的意義統(tǒng)計(jì)推斷的結(jié)論是依據(jù)現(xiàn)有的設(shè)計(jì)、現(xiàn)有的研究方法與條件、現(xiàn)有的資料及其分析目的和要求,所取的檢驗(yàn)水準(zhǔn),所采用的統(tǒng)計(jì)分析方法等所做出的具有相應(yīng)概率意義的解釋,不宜將結(jié)論的意義擴(kuò)展或縮小。假設(shè)檢驗(yàn)的結(jié)論不能絕對(duì)化統(tǒng)計(jì)結(jié)論是具有概率性質(zhì)的推論,不能使用“證明”、“肯定”、“一定”、“說(shuō)明”等詞。有統(tǒng)計(jì)學(xué)意義時(shí)不一定有專業(yè)意義。若樣本足夠大或標(biāo)準(zhǔn)差特別小,即使兩均數(shù)間相差很小,也可能得出P≤0.05的結(jié)果。結(jié)合專業(yè)知識(shí)作出推論假設(shè)檢驗(yàn)?zāi)軌驇椭芯空咦龀鲚^合理的推斷,但不能代替研究者做出專業(yè)結(jié)論。CI與假設(shè)檢驗(yàn)的區(qū)別和聯(lián)系CI推斷參數(shù)值的范圍;由于CI給出了具體的數(shù)量范圍,即可回答差別有無(wú)顯著的統(tǒng)計(jì)學(xué)意義,還可提示差別有無(wú)實(shí)際意義。.假設(shè)檢驗(yàn)判斷各參數(shù)間有無(wú)質(zhì)的不同,可以獲得較為確切的概率值。7.1.3正態(tài)性檢驗(yàn)與數(shù)據(jù)轉(zhuǎn)換對(duì)數(shù)值變量進(jìn)行假設(shè)檢驗(yàn)時(shí)應(yīng)先進(jìn)行正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn),必要時(shí)還需要對(duì)資料進(jìn)行數(shù)據(jù)轉(zhuǎn)換,已使資料滿足數(shù)值變量資料統(tǒng)計(jì)方法的應(yīng)用條件——正態(tài)性和方差齊性。第二節(jié)統(tǒng)計(jì)檢驗(yàn)的前期工作——對(duì)數(shù)據(jù)分布特征的檢驗(yàn)7.2.1正態(tài)性檢驗(yàn)矩法D檢驗(yàn)法Jarque-Bera檢驗(yàn)圖方法非參數(shù)檢驗(yàn)方法矩法偏度系數(shù)和峰度系數(shù)偏度系數(shù)g1表示分布的對(duì)稱性g1=0:對(duì)稱g1>0:正偏態(tài)g1<0:負(fù)偏態(tài)峰度系數(shù)g2表示峰型g2=0:正態(tài)峰g2>0:尖峭峰g2<0:平闊峰若g1=0且g2=0則為正態(tài)分布D檢驗(yàn)法計(jì)算步驟(頻數(shù)表資料)無(wú)效假設(shè)H0:總體服從正態(tài)分布計(jì)算統(tǒng)計(jì)量D值其中,x

為各組組中值,f為各組頻數(shù),T

為各組平均秩次,n

為總例數(shù)查D界限值表,做出結(jié)論Jarque-Bera檢驗(yàn)(偏度和峰度的聯(lián)合分布檢驗(yàn)法)檢驗(yàn)統(tǒng)計(jì)量為JB=JB過(guò)大或過(guò)小時(shí),拒絕原假設(shè)。圖方法1、P-P圖以樣本的累計(jì)頻率作為橫坐標(biāo),以按照正態(tài)分布計(jì)算的相應(yīng)累計(jì)概率作為縱坐標(biāo),做散點(diǎn)圖。如果資料服從整體分布,則樣本點(diǎn)應(yīng)圍繞第一象限的對(duì)角線分布。

2、Q-Q圖以樣本的分位數(shù)作為橫坐標(biāo),以按照正態(tài)分布計(jì)算的相應(yīng)分位點(diǎn)作為縱坐標(biāo),把樣本表現(xiàn)為直角坐標(biāo)系的散點(diǎn)。如果資料服從正態(tài)分布,則樣本點(diǎn)應(yīng)該呈一條圍繞第一象限對(duì)角線的直線。以上兩種方法以Q-Q圖為佳,效率較高。3、直方圖,是否以鐘形分布。4、箱式圖,觀測(cè)離群值和中位數(shù)。5、莖葉圖,類似與直方圖,但實(shí)質(zhì)不同。7.2.2軟件操作Descriptive–Explore考察“統(tǒng)計(jì)分析案例”的“男、女”“環(huán)境分?jǐn)?shù)”的正態(tài)分布Analyze-NonparametricTest-K-s考察“統(tǒng)計(jì)分析案例”的“男、女”“環(huán)境分?jǐn)?shù)”的正態(tài)分布,分組用Split–FileGraph-Legacy“環(huán)境分?jǐn)?shù)”的正態(tài)分布,”“性別”分類,”年級(jí)聚類“第三節(jié)兩個(gè)獨(dú)立樣本差異的顯著性檢驗(yàn)——兩個(gè)群體差異的比較之一平均數(shù)差異的顯著性檢驗(yàn)方差齊性條件下,平均數(shù)差異顯著性檢驗(yàn)方差不齊性獨(dú)立小樣本平均數(shù)差異的顯著性檢驗(yàn)假設(shè)檢驗(yàn)方差齊性檢驗(yàn)總體方差未知,獨(dú)立樣本t檢驗(yàn)的完整過(guò)程方差齊性條件下,平均數(shù)差異顯著性檢驗(yàn)的統(tǒng)計(jì)量及計(jì)算公式平均數(shù)差異的顯著性檢驗(yàn)時(shí),統(tǒng)計(jì)量的基本計(jì)算公式為:H0:μ1=μ2

表示之差的標(biāo)準(zhǔn)差⑴兩樣本相關(guān)⑵兩樣本獨(dú)立1.兩總體正態(tài),總體標(biāo)準(zhǔn)差已知總體標(biāo)準(zhǔn)差已知條件下,平均數(shù)之差的抽樣分布服從正態(tài)分布2兩總體正態(tài),標(biāo)準(zhǔn)差未知,方差齊性,n1或n2小于30總體標(biāo)準(zhǔn)差未知條件下,平均數(shù)之差的抽樣分布服從t分布。計(jì)算公式為:(1)兩樣本相關(guān)

還可以計(jì)算為:(2)兩樣本獨(dú)立總體標(biāo)準(zhǔn)差未知條件下,平均數(shù)之差的抽樣分布服從t分布,但樣本容量較大,t分布接近于正態(tài)分布,可以以Z近似處理,因此以Z′作為檢驗(yàn)統(tǒng)計(jì)量,計(jì)算公式為:

3.兩總體非正態(tài),n1和n2大于30(或50)

(1)兩樣本相關(guān)(2)兩樣本獨(dú)立不能對(duì)平均數(shù)差異進(jìn)行顯著性檢驗(yàn)。4.兩總體非正態(tài),小樣本

方差不齊性獨(dú)立小樣本平均數(shù)差異的顯著性檢驗(yàn)

對(duì)于方差不齊性的獨(dú)立小樣本,平均數(shù)差異的顯著性可能由兩方面的原因造成:一是兩平均數(shù)確實(shí)存在顯著差異;二是兩總體方差之間存在顯著差異。當(dāng)兩總體的方差之間差異顯著時(shí),運(yùn)用一般的t檢驗(yàn)不準(zhǔn)確,需要進(jìn)行特別的檢驗(yàn)。1.統(tǒng)計(jì)量及計(jì)算公式

總體方差不齊性的兩個(gè)獨(dú)立樣本平均數(shù)之差的標(biāo)準(zhǔn)誤,可用兩個(gè)樣本方差分別估計(jì)出的兩個(gè)平均數(shù)標(biāo)準(zhǔn)誤平方之和再開(kāi)方來(lái)表示。這時(shí)樣本平均數(shù)之差與相應(yīng)總體平均數(shù)之差的離差統(tǒng)計(jì)量,既不是Z分布,也不是t分布,而是與t分布相近似的t′分布。

這種檢驗(yàn)方法被稱為柯克蘭—柯克斯t檢(Cochran

-Cox),其統(tǒng)計(jì)量的計(jì)算公式為:

2.t′臨界值的計(jì)算公式方差齊性檢驗(yàn)

方差齊性檢驗(yàn)是對(duì)兩總體方差是否齊性(即是否一致或是否存在顯著性差異)進(jìn)行的檢驗(yàn)。方差齊性檢驗(yàn)的統(tǒng)計(jì)量是F,其概率分布遵循F分布。

當(dāng)總體方差未知時(shí),對(duì)獨(dú)立小樣本進(jìn)行t檢驗(yàn)的完整過(guò)程有兩種方式:總體方差未知,獨(dú)立樣本t檢驗(yàn)的完整過(guò)程1.先做方差齊性檢驗(yàn)方差齊性檢驗(yàn)方差齊性方差不齊性t檢驗(yàn)t′檢驗(yàn)2.先按方差齊性進(jìn)行差異檢驗(yàn)方差齊性獨(dú)立樣本t檢驗(yàn)差異不顯著接受差異不顯著的檢驗(yàn)結(jié)論差異顯著方差齊性檢驗(yàn)方差齊性方差不齊性t′檢驗(yàn)接受差異顯著的檢驗(yàn)結(jié)論非參數(shù)檢驗(yàn)方法Kolmogorov-Smirnov檢驗(yàn)(D檢驗(yàn))Shapiro-Wilk(W檢驗(yàn))Mann-WhitneyutestWald-WolfowitzrunTestMosesextremereactionstestIndependent–SampleTtest”男、女””環(huán)境變量“,演示“學(xué)習(xí)狀態(tài)”cutpoint男女”環(huán)境變量‘兩獨(dú)立樣本K-S檢驗(yàn),Transform-RankcasesTesttype選項(xiàng)應(yīng)用第四節(jié)兩個(gè)配對(duì)樣本差異的顯著性檢驗(yàn)——兩個(gè)群體差異的比較之二配對(duì)資料t檢驗(yàn)(Paired-SamplesTTest)資料類型:兩個(gè)同質(zhì)對(duì)象接受不同處理;同一受試對(duì)象分別接受不同的處理,同一受試對(duì)象處理前后。條件:差值d服從正態(tài)分布。一般的,配對(duì)樣本T檢驗(yàn)用于檢驗(yàn)兩個(gè)相關(guān)的樣本是否來(lái)自具有相同均值的總體,實(shí)質(zhì)是檢驗(yàn)差值變量的均值與0之間差異的顯著性。計(jì)算公式Spss操作:在菜單欄中Analyze|CompareMeans|Paired-SamplesTTest非參數(shù)檢驗(yàn)兩個(gè)非正態(tài)總體的差異SigntestWilcoxonSigned-ranktestMcNemartestMarginalHomogeneitytest操作途徑Analyze-NonparametricTests-2Related-Samples例子“技術(shù)培訓(xùn)效果比較”,前后考評(píng)分?jǐn)?shù)案例11、學(xué)生對(duì)教學(xué)改革態(tài)度的分析(onesample)某校在對(duì)實(shí)行掛牌上課教學(xué)改革措施的效果評(píng)價(jià)中,隨機(jī)抽選了60位學(xué)生進(jìn)行態(tài)度調(diào)查,他們的10項(xiàng)態(tài)度量表的態(tài)度反映資料如下:掛牌上課態(tài)度反映得分(X)人數(shù)(f)10—2020—3030—4040—5050—6060—702610122010合計(jì)60案例1

(1分表示“很不同意”,7分表示“很同意”,將10項(xiàng)態(tài)度分累加后得一總態(tài)度分,這種量叫7級(jí)李克累加量表):試計(jì)算:(1)學(xué)生態(tài)度得分的平均值和標(biāo)準(zhǔn)差;(2)構(gòu)造學(xué)生態(tài)度得分平均值的98%置信區(qū)間。操作步驟:(1)定義變量X(轉(zhuǎn)換-計(jì)算變量,表達(dá)式…)和f,X為組中值,輸入數(shù)據(jù)資料;(2)選擇DataWeightCases,加權(quán)個(gè)案,頻率變量,確定。(3)選擇AnalyzeComparemeansone-sampleTTest(4)將變量X放入Test欄中(5)激活子對(duì)話框,置信度為98%,單擊按鈕,返回one-sampleTTest主對(duì)話框;(6)單擊按鈕執(zhí)行。Options…ContinueOKT-Test

結(jié)論:表1:學(xué)生態(tài)度得分的平均值為47分,標(biāo)準(zhǔn)差為13.6295分.表2:以98%的置信區(qū)間估計(jì)學(xué)生總體態(tài)度得分平均值的置信區(qū)間為(42.7925,51.2075)從中可以反映出學(xué)生對(duì)掛牌上課這一教改措施普遍贊成,但并不十分擁護(hù),可見(jiàn)還需進(jìn)一步改進(jìn)和完善.案例2___電視廣告平均受益量的估計(jì)2、某電視臺(tái)廣告部想要估計(jì)一下各企業(yè)在該電臺(tái)的黃金時(shí)間播放電視廣告后的一個(gè)月內(nèi)的平均受益量.為此他們抽取了33家播放廣告的同類企業(yè)的隨機(jī)樣本,資料如下:該電視臺(tái)想以95%的置信度宣布平均受益量(平均利潤(rùn)增長(zhǎng)量),試構(gòu)造適當(dāng)?shù)闹眯艆^(qū)間.案例2數(shù)據(jù)企業(yè)序號(hào)1234567891011利潤(rùn)增量(萬(wàn)元)7.38.67.76.59.48.37.110.25.49.28.8企業(yè)序號(hào)1213131415161718192021利潤(rùn)增量(萬(wàn)元)9.76.94.311.28.28.77.69.16.68.58.9企業(yè)序號(hào)2324252627282930313233利潤(rùn)增量(萬(wàn)元)10.412.814.67.511.76.013.213.69.05.99.6解:該電視臺(tái)宣布的平均受益量應(yīng)是最小受益量,故構(gòu)造置信下限.設(shè)X為企業(yè)利潤(rùn)增量.操作步驟:

(1)定義變量X輸入數(shù)據(jù)資料;(2)選擇AnalyzeComparemeansone-sampleTTest(3)將變量X放入Test欄中(4)激活子對(duì)話框,置信度改為90%,單擊按鈕,返回one-sampleTTest主對(duì)話框;(5)單擊OK按鈕執(zhí)行Options…ContinueT-Test結(jié)論:表1:33家平均受益量為8.8636萬(wàn)元,標(biāo)準(zhǔn)差為2.4027萬(wàn)元.表2:該項(xiàng)電視臺(tái)可以95%的置信度宣布在該電臺(tái)黃金時(shí)間做廣告給企業(yè)帶來(lái)的平均受益量至少在8.1552萬(wàn)元以上.注意:此題是作業(yè)。實(shí)例分析3___新舊電池使用壽命比較(Independent)

某一個(gè)新的制造過(guò)程可以增加電池的使用壽命,假設(shè)電池使用壽命服從正態(tài)分布.在新電池中隨機(jī)抽取15個(gè),而在舊電中隨機(jī)抽取12個(gè)同時(shí)測(cè)試其使用壽命,資料如下:新舊兩種電池平均使用壽命之差95%的置信區(qū)間.新電池(日):18.2\10.4\12.6\18.0\11.7\15.0\24.0\17.6\23.6\24.8\19.3\20.5\19.8\17.1\16.3舊電池(日):12.1\17.5\8.6\13.9\7.8\15.1\17.9\10.6\13.8\14.2\15.3\11.6解:已知的原始數(shù)據(jù)是總體服從正態(tài)分布的兩個(gè)獨(dú)立樣本。設(shè)X代表電池使用壽命,g代表分組號(hào)操作步驟:(1)定義變量X和g,輸入數(shù)據(jù)資料,新舊電池壽命數(shù)據(jù)全部輸入X同一列中,g分別取1和2,新電池組號(hào)為1,舊電池組號(hào)為2(2)選擇AnalyzeCompareMeansIndependent-SamplesTTest,打開(kāi)Independent-SamplesTTest對(duì)話框(3)將變量X放入Test欄中(4)激活DefineGroups按鈕,打開(kāi)該對(duì)話框Groups1中輸入1Groups2中輸入2,單擊Continue返回主對(duì)話框;(5)單擊OK按鈕執(zhí)行T-Test結(jié)論:表1:得出兩個(gè)獨(dú)立樣本各自的均值,標(biāo)準(zhǔn)差以及平均標(biāo)準(zhǔn)誤差.新電池的平均使用壽命明顯長(zhǎng)于舊電池。表2:可以看出新舊電池平均使用壽命之差的95%的置信區(qū)間為:若兩個(gè)樣本方差相等則為(2.4454,8.6746);若兩個(gè)樣本方差不等則為(2.5437,8.5763)實(shí)例分析4___吸煙有害廣告作用的分析(Paired)

形形色色的廣告已深入到社會(huì)各個(gè)方面,與人民生活密不可分.成功的廣告將留給人們較深的印象,并帶給企業(yè)豐厚的回報(bào),如何鑒定廣告的效果,如何選擇最佳的廣告制作,對(duì)此西方國(guó)家更多地采用統(tǒng)計(jì)方法來(lái)判斷,舉例如下:為了研究吸煙有害廣告對(duì)吸煙者減少吸煙量甚至戒煙是否有作用,從某吸煙者中隨機(jī)抽取33位吸煙者,調(diào)查他們?cè)谟^看廣告前后的每天吸煙量(支)數(shù)據(jù)如下表.試問(wèn)影片對(duì)他們的吸煙量有無(wú)產(chǎn)生作用?為了支持你的答案,請(qǐng)構(gòu)造一個(gè)99%的置信區(qū)間.吸煙者編號(hào)1234567891011看前X1(支)看后X2(支)20181515141011101213161219152620221716799吸煙者編號(hào)1213141516171819202122看前X1(支)看后X2(支)1710333425208441401910263016163120271862吸煙者編號(hào)2324252627282930313233看前X1(支)看后X2(支)13112422222548504134669133827251129102821解:配對(duì)樣本的試驗(yàn),比較觀看前后平均數(shù)的大小可解決第一個(gè)問(wèn)題,求出兩平均數(shù)之差的99%的雙側(cè)置信區(qū)間可解答第二個(gè)問(wèn)題.操作步驟:1)定義變量X1和X2,輸入數(shù)據(jù);(2)選擇AnalyzeComparemeansPaired-samplesTTest(3)將變量X1和X2放入Test欄中(4)激活Options…子對(duì)話框,置信度改為99%,單擊Continue按鈕,返回Paired-samplesTTest主對(duì)話框;(5)單擊OK按鈕執(zhí)行T-Test結(jié)論:表1:顯示觀看影片前的平均每日吸煙量約為21.5758支.觀看影片后的平均每日吸煙量約為17.5758支,說(shuō)明該影片發(fā)生了作用.表2:反映了影片觀看前與后存在著顯著相關(guān)關(guān)系,相關(guān)系數(shù)為0.878.表3:顯示了前后兩個(gè)總體平均每日吸煙量之差的99%置信區(qū)間為(1.4888,6.5112),這意味著不管隨機(jī)抽到哪幾對(duì)樣本單位做調(diào)查,均有99%的把握保證,觀看影片前的平均每日吸煙量大于觀看影片后的平均每日吸煙量之差在(1.4888支至6.5112支之間,即大約在2—7支之間.第五節(jié)單因素方差分析—多個(gè)群體差異的比較之一7.5.1一個(gè)完整的單因素方差分析實(shí)例Step1正態(tài)性檢驗(yàn)Step2方差齊性檢驗(yàn)Step3方差檢驗(yàn)(方差分析表)Step4追蹤分析:多重比較Step5區(qū)間估計(jì)理論準(zhǔn)備方差齊性檢驗(yàn):理論準(zhǔn)備方差齊性檢驗(yàn):理論準(zhǔn)備方差齊性檢驗(yàn):“統(tǒng)計(jì)案例”不同年級(jí)“環(huán)境利用水平”的方差分析書本,注意“對(duì)比”contrast提高:?jiǎn)我蛩刂貜?fù)測(cè)量案例假設(shè)你是某個(gè)企業(yè)的HR,你觀察到員工似乎在周一的情緒比較糟糕,而到了周五(周末前)則明顯好轉(zhuǎn)。員工私下里也會(huì)討論什么“星期一綜合癥”之類的話題,于是,你找到一個(gè)調(diào)查員工快樂(lè)水平的包含20個(gè)項(xiàng)目(均為“是”或“否”選項(xiàng))測(cè)量表,選擇“是”越多表示快樂(lè)水平越高。在這個(gè)準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)中,自變量包含三個(gè)水平(k=3):1)星期一;2)星期三;3)星期五。你隨機(jī)從公司里抽取了6(n=6)名員工來(lái)完成這個(gè)研究,最后,收集到的數(shù)據(jù)如下表所示:案例數(shù)據(jù)假設(shè)設(shè)置虛無(wú)假設(shè)表述的是工作周不同的時(shí)間點(diǎn)對(duì)員工心情沒(méi)有影響,亦即不管在星期幾,員工的心情都是一樣開(kāi)心的。對(duì)應(yīng)的備擇假設(shè)表述的是,員工的心情受到所處的工作周的時(shí)間點(diǎn)的影響,即H0:μ1=μ2=μ3H1:以上三個(gè)均值不全相等。下面是計(jì)算步驟:第一步:總變異分解SST=∑Xij2-(∑Xij)2/N =247.11SSBG=∑X*j2/nj-(∑Xij)2/N=31.44SSwg=SST-SSBG =215.67公式1公式2公式3第二步:移除個(gè)別差異導(dǎo)致的變異計(jì)算被試間的平方和。將數(shù)據(jù)中每個(gè)被試當(dāng)做是一個(gè)處理,那么每個(gè)“處理”(被試)下面有三個(gè)分?jǐn)?shù),然后同樣使用ANOVA中計(jì)算處理間變異的公式(在這里k=6,而每組內(nèi)n=3)這個(gè)平方和提供了對(duì)個(gè)別差異的一個(gè)量度,將個(gè)別差異的變異從處理內(nèi)變異中減去,就得到F比率分母部分的誤差(殘差)平方和。 =36.67-31.44=5.23(SSerror=SSwithin-SSbetweensubjects)各個(gè)平方和對(duì)應(yīng)的自由度第一步:dft=N-1=18-1=17dfbg=k-1=3-1=2dfwg=N-k=18-3=15第二步:dfsubject=n-1=6-1=5dferror=dfwithin-dfsubject=15-5=-10計(jì)算對(duì)應(yīng)的均方和F比率247.11215.6731.445.23210.440.52315.7230.06方差分析表多重比較法拒絕H0,接受H1,表示總體均數(shù)不全相等哪兩兩均數(shù)之間相等?哪兩兩均數(shù)之間不等?————>需要進(jìn)一步作多重比較。方差分析結(jié)果不拒絕H0,表示拒絕總體均數(shù)相等的證據(jù)不足,

————>分析終止。

常用多重比較法

最小顯著差數(shù)法(Leastsignificantdifference,簡(jiǎn)稱LSD法)

水平數(shù),每個(gè)樣本的容量,都相等。

q法(又稱SNK(student-Newman-Keuls)檢驗(yàn)法)q測(cè)驗(yàn)方法是將r個(gè)平均數(shù)由大到小排列后,根據(jù)所比較的兩個(gè)處理平均數(shù)的差數(shù)是幾個(gè)平均數(shù)間的極差分別確定最小顯著極差LSRα值的。下面介紹2個(gè)改進(jìn)的最小顯著極差法

級(jí)極差的檢驗(yàn)

Tukey法(又稱honestlysignificantdifference,簡(jiǎn)稱HSD

)這里顯然指兩個(gè)均值差異的比較,Tukey對(duì)法似乎有不同的版本。

Bonferroni法Bonferroni法是根據(jù)所比較的兩個(gè)處理平均數(shù)的個(gè)數(shù)k,將檢驗(yàn)水平縮小k倍成為真實(shí)比較水平,確定是幾個(gè)平均數(shù)間的極差分別確定最小顯著差數(shù)LSDα值的。由“2”知,這里顯然指兩個(gè)均值差異的比較。

多重比較法選擇1.試驗(yàn)事先確定比較的標(biāo)準(zhǔn),凡是與對(duì)照相比較,或與預(yù)定要比較的對(duì)象比較,一般可選用最小顯著差數(shù)法LSDa法;2.根據(jù)否定一個(gè)正確的H0和接受一個(gè)不正確的H0的相對(duì)重要性來(lái)決定。參考以下觀點(diǎn):根據(jù)試驗(yàn)的側(cè)重點(diǎn)選擇。三種方法的顯著尺度不相同,LSD法最低,HSD法次之,SNK法最高。故對(duì)于試驗(yàn)結(jié)論事關(guān)重大或有嚴(yán)格要求時(shí),用SNK法,一般試驗(yàn)可采用HSD法。當(dāng)比較次數(shù)不多時(shí),Bonferroni法的效果較好;但當(dāng)比較次數(shù)較多(例如在10次以上)時(shí),則由于其檢驗(yàn)水準(zhǔn)選擇得過(guò)低,結(jié)論偏于保守。第六節(jié)多個(gè)樣本的非參數(shù)檢驗(yàn)——多個(gè)群體差異的比較之二

6.0什么是非參數(shù)檢驗(yàn)?和數(shù)據(jù)本身的總體分布無(wú)關(guān)的檢驗(yàn)稱為非參數(shù)檢驗(yàn)--不假定總體的具體背景分布形式;--多根據(jù)數(shù)據(jù)觀測(cè)值的相對(duì)大小建立檢驗(yàn)統(tǒng)計(jì)量,然后找到在零假設(shè)下這些統(tǒng)計(jì)量的分布,看這些統(tǒng)計(jì)量的數(shù)據(jù)實(shí)現(xiàn)是否在零假設(shè)下屬于小概率事件。t-檢驗(yàn)、方差分析、相關(guān)、回歸的顯著性檢驗(yàn),都需要利用總體分布的信息,因此這些檢驗(yàn)都稱為參數(shù)檢驗(yàn)而非參數(shù)檢驗(yàn)由于不涉及總體參數(shù),也不依賴于總體分布的形式,因此它與總體分布狀況無(wú)關(guān),因此非參數(shù)檢驗(yàn)又稱為無(wú)分布檢驗(yàn)(distribution-freetest)非參數(shù)檢驗(yàn)是利用樣本數(shù)據(jù)之間的大小比較以及大小順序,對(duì)2個(gè)或多個(gè)樣本所屬總體是否相同進(jìn)行檢驗(yàn)非參數(shù)檢驗(yàn)常用在以下情況:(1)樣本所在總體的分布狀況未知,或知之甚少無(wú)法肯定總體分布的性質(zhì)(2)樣本觀測(cè)值明顯偏離正態(tài)分布,因而不具備參數(shù)檢驗(yàn)的應(yīng)用條件非參數(shù)檢驗(yàn)具有以下優(yōu)點(diǎn):計(jì)算簡(jiǎn)便、直觀、易于掌握、檢驗(yàn)速度快非參數(shù)檢驗(yàn)的效率在資料符合參數(shù)檢驗(yàn)的條件時(shí),非參數(shù)檢驗(yàn)的效率始終低于參數(shù)檢驗(yàn)法,這是因?yàn)椋悍菂?shù)檢驗(yàn)法沒(méi)有充分利用已知的總體分布信息也沒(méi)有充分利用樣本提供的信息,因而非參數(shù)檢驗(yàn)的功效較低,犯Ⅱ型錯(cuò)誤的可能性較大6.1多個(gè)樣本的非參數(shù)檢驗(yàn)的統(tǒng)計(jì)學(xué)定義和計(jì)算公式定義:多獨(dú)立樣本非參數(shù)檢驗(yàn)分析樣本數(shù)據(jù)是推斷樣本來(lái)自的多個(gè)獨(dú)立總體分布是否存在顯著差異。SPSS多獨(dú)立樣本非參數(shù)檢驗(yàn)一般推斷多個(gè)獨(dú)立總體的均值或中位數(shù)是否存在顯著差異。多獨(dú)立樣本的簡(jiǎn)判:在一個(gè)總體中抽取樣本對(duì)其他總體中抽取樣本沒(méi)有影響。1.多獨(dú)立樣本的中位數(shù)檢驗(yàn)(Median)多獨(dú)立樣本的中位數(shù)檢驗(yàn)通過(guò)對(duì)多組數(shù)據(jù)的分析推斷多個(gè)獨(dú)立總體分布是否存在顯著差異。原假設(shè)H0:樣本來(lái)自的多個(gè)獨(dú)立總體的中位數(shù)無(wú)顯著差異。

SPSS中有3種多獨(dú)立樣本非參數(shù)檢驗(yàn)方法基本思想:如果各組樣本的測(cè)定數(shù)據(jù)的分布無(wú)差異,那么各組獨(dú)立樣本的中位數(shù)無(wú)顯著差異,也就是可以說(shuō)各組樣本擁有共同的中位數(shù)。這個(gè)共同的中位數(shù)在每組樣本中都應(yīng)該處于中間位置。故可檢驗(yàn)其中位數(shù)上下各有觀察值數(shù)目的差異在各組之間是否有統(tǒng)計(jì)意義,從而作出統(tǒng)計(jì)推斷。檢驗(yàn)計(jì)算步驟以及檢驗(yàn)統(tǒng)計(jì)量:1.將各組樣本(A、B…)資料混合由小到大排列。求混合資料的中位數(shù)md。2.對(duì)每一樣本分別計(jì)數(shù)超過(guò)共同中位數(shù)以及小于等于共同中位數(shù)的數(shù)據(jù)個(gè)數(shù)。列成表格。4.用卡方檢驗(yàn)法或精確概率法(理論頻數(shù)小于5時(shí))進(jìn)行檢驗(yàn)。第1組樣本第2組樣本…第k組樣本混合樣本>md的個(gè)數(shù)O11(E11)O12(E12)O1k(E1k)N1≤md的個(gè)數(shù)O21(E21)O22(E22)O2k(E2k)N2O1i(O2i):第i組樣本中,觀測(cè)到>(≤)md的個(gè)案數(shù)。N1(N2):混合樣本中,>(≤)md的個(gè)案數(shù)。N=N1+N2E1i(E2i):第i組樣本中,>(≤)md的期望個(gè)案數(shù)。ni:第i組樣本的樣本容量。(各個(gè)子樣遵從兩項(xiàng)分布,其中的參數(shù)估計(jì)有混合樣本獲得。)

當(dāng)Eij都大于5時(shí),構(gòu)造卡方統(tǒng)計(jì)量給出檢驗(yàn):2.多獨(dú)立樣本的K-W檢驗(yàn)多獨(dú)立樣本的Kruskal-Waillis檢驗(yàn),是一種推廣的平均秩檢驗(yàn)。原假設(shè)H0:樣本來(lái)自的多個(gè)獨(dú)立總體的分布(的位置參數(shù))無(wú)顯著差異?;痉椒ǎ菏紫葘⒍嘟M樣本數(shù)混合按升序排列,并求出每個(gè)觀察值的秩,然后對(duì)各組樣本的秩分別求出平均值。如果各組樣本的平均秩大致相等,則可以認(rèn)為多個(gè)獨(dú)立總體的分布沒(méi)有顯著差異。如果各樣本的平均秩相差很大,則不能認(rèn)為多個(gè)獨(dú)立總體的分布無(wú)顯著差異。考察處理間平方和占總方差的比重:K-W檢驗(yàn)統(tǒng)計(jì)量:K-W檢驗(yàn)統(tǒng)計(jì)量:ni:第i組樣本的樣本容量。N:混合樣本的總樣本容量。:第i組樣本的平均秩。:平均秩(N+1)/2。SPSS編秩的方法:Transform/rankcases此過(guò)程可以進(jìn)行樣本編秩,秩的累計(jì)頻率等數(shù)值計(jì)算。3.多獨(dú)立樣本的Jonkheere-Terpstra檢驗(yàn)多獨(dú)立樣本的Jonkheere-Terpstra檢驗(yàn)用于分析樣本來(lái)自的多個(gè)獨(dú)立總體分布(的位置參數(shù)是否具有方向性)是否存在顯著差異。原假設(shè)H0:樣本來(lái)自的多個(gè)獨(dú)立總體的分布無(wú)顯著差異。備擇假設(shè)是呈某種方向性的,要求樣本的變化按此方向性進(jìn)行,例如通過(guò)觀察,按大小順序編號(hào)。檢驗(yàn)統(tǒng)計(jì)量:Uij:第i組樣本觀察值小于第j組樣本觀察值的個(gè)數(shù)。(從后半部分顯示這里是針對(duì)可能有結(jié)的情形的。)其實(shí),這里計(jì)算的J-T統(tǒng)計(jì)量是按照組號(hào)(1,2,3)。按照組序號(hào)的不同順序可以計(jì)算出所有的J-T值,進(jìn)而可以得到J-T的均值E(J)和方差D(J),于是自然的想利用漸近正態(tài)性。研究問(wèn)題隨機(jī)抽取3個(gè)班級(jí)的學(xué)生,得到21個(gè)學(xué)生成績(jī)樣本,如表6.2所示,問(wèn)3個(gè)班級(jí)學(xué)生總體成績(jī)是否存在顯著差異?6.2SPSS中實(shí)現(xiàn)過(guò)程舉例表6.2 3個(gè)班級(jí)學(xué)生成績(jī)學(xué)生成績(jī)所屬班級(jí)學(xué)生成績(jī)所屬班級(jí)60.00190.00270.00196.00271.00170.00280.00185.00375.00192.00365.00197.00390.00196.00380.00288.00385.00289.00381.00280.00383.002spss實(shí)現(xiàn)步驟圖6.2-1在菜單中選擇“KIndependentSamples”命令圖6.2-2“TestsforSeveralIndependentSamples”對(duì)話框設(shè)置分組變量及其取值范圍。定義檢驗(yàn)變量三種可選的檢驗(yàn)方法同前。注意小樣本情況下選擇精確檢驗(yàn)圖6.2-3“SeveralIndependentSamples:DefineRange”對(duì)話框定義最小組序號(hào)和最大組序號(hào)6.3結(jié)果和討論(1)多獨(dú)立樣本K-W檢驗(yàn)結(jié)果如下兩表所示。(2)多獨(dú)立樣本中位數(shù)檢驗(yàn)結(jié)果如下兩表所示。Oij值列表。作業(yè)中需要按照第8頁(yè)ppt的表格那樣注明Eij的值此時(shí)不宜參看正態(tài)近似檢驗(yàn)。需要選擇精確檢驗(yàn)。(3)多獨(dú)立樣本Jonckheere-Terpstra檢驗(yàn)結(jié)果

KindependentSamples分析“統(tǒng)計(jì)案例”不同年級(jí)學(xué)生的“環(huán)境利用”KRelatedSamples分析“專家組對(duì)學(xué)習(xí)教學(xué)評(píng)價(jià)”不同年級(jí)學(xué)生的“環(huán)境利用”KRelatedSamplesCochranQ“學(xué)生對(duì)教師評(píng)價(jià)”多個(gè)相關(guān)樣本的非參數(shù)檢驗(yàn)Friedman秩和檢驗(yàn)Kruskal-Wallis檢驗(yàn)是針對(duì)完全隨機(jī)試驗(yàn)數(shù)據(jù)的非參數(shù)分析方法,在隨機(jī)區(qū)組情形下,可以用類似的兩因素秩方差分析法。Friedman秩和檢驗(yàn)假定這些樣本有連續(xù)分布F1,…,Fk,F(xiàn)為某連續(xù)分布函數(shù),形式上,零假設(shè)為H0:F1=…=Fk,備選假設(shè)為Ha:Fi(x)=F(x+qi),i=1,…,k,諸參數(shù)qi并不相等(實(shí)質(zhì)是關(guān)于位置qi的檢驗(yàn)。)由于區(qū)組的影響,要首先在每一個(gè)區(qū)組中計(jì)算各個(gè)處理的秩;再把每一個(gè)處理在各區(qū)組中的秩相加.如果Rij表示在j個(gè)區(qū)組中第i個(gè)處理的秩。則秩按照處理而求得的和為

這樣做的目的是在每個(gè)區(qū)組內(nèi)比較處理。例如,同個(gè)年齡段中比較藥品的療效比不分年齡來(lái)比較療效要合理;在同一個(gè)部位比較不同的材料要比混合起來(lái)比較要合理等等。Friedman秩和檢驗(yàn)

Friedman統(tǒng)計(jì)量定義為第一個(gè)式子表明,如果各個(gè)處理(水平)很不一樣,和的平方就會(huì)很大,結(jié)果就顯著。第二個(gè)公式是為了計(jì)算方便而導(dǎo)出的。它有近似的(有k-1個(gè)自由度的)c2分布。

注意:當(dāng)區(qū)組數(shù)較大或處理組數(shù)較小時(shí),效果不好,需要用aligned-rankstestorHodges-_lehmmann檢驗(yàn)。(處理間平方和出于總方差的估計(jì)值,再乘上一個(gè)校正系數(shù)(k-1)/k)Kendall協(xié)同系數(shù)檢驗(yàn)在實(shí)踐中,常需要按照某些特定的性質(zhì)來(lái)多次對(duì)一些個(gè)體進(jìn)行評(píng)估或排序;比如幾個(gè)(m個(gè))評(píng)估機(jī)構(gòu)對(duì)一些(n個(gè))學(xué)校進(jìn)行排序。人們想要知道,這些機(jī)構(gòu)的不同結(jié)果是否一致。如果很不一致,則該評(píng)估多少有些隨機(jī),意義不大。換句話說(shuō),這里想要檢驗(yàn)的零假設(shè)是:這些對(duì)于不同學(xué)校的排序是不相關(guān)的或者是隨機(jī)的;而備選假設(shè)為:這些對(duì)不同學(xué)校的排序是正相關(guān)的或者是多少一致的。Kendall協(xié)同系數(shù)檢驗(yàn)正式提法假設(shè)k個(gè)變量,每個(gè)變量對(duì)應(yīng)n個(gè)觀測(cè)值,即為在中的秩。假設(shè)檢驗(yàn)問(wèn)題:Kendall協(xié)同系數(shù)檢驗(yàn)思路一個(gè)機(jī)構(gòu)對(duì)n個(gè)體的秩和為1+2+…+n=n(n+1)/2;所有m個(gè)機(jī)構(gòu)對(duì)所有個(gè)體評(píng)估的總秩為mn(n+1)/2;于是每個(gè)個(gè)體的平均秩為m(n+1)/2。如果記第i個(gè)個(gè)體的m個(gè)秩和為Ri(i=1,…,n),那么,如果評(píng)估是隨機(jī)的,這些Ri與平均秩的差別不會(huì)很大,反之差別會(huì)很大,也就是說(shuō)下面的個(gè)體的總秩與平均秩的偏差的平方和S很大。S定義為S與Kendall協(xié)同系數(shù)(Kendall’sCoefficientofConcordance)W是成比例的(Friedman檢驗(yàn)統(tǒng)計(jì)量的標(biāo)準(zhǔn)化)實(shí)際檢驗(yàn)時(shí),可以查零分布表在n固定,時(shí):可以利用漸進(jìn)性進(jìn)行檢驗(yàn),對(duì)于有打結(jié)情況的數(shù)據(jù),需要用調(diào)整公式計(jì)算。當(dāng)各個(gè)個(gè)體顯著不同時(shí),若他們的秩不存在顯著差異,則意味著評(píng)委的打分存在隨意性,評(píng)分標(biāo)準(zhǔn)不一致(如果各個(gè)評(píng)委的評(píng)判標(biāo)準(zhǔn)是一致的,那么某個(gè)個(gè)體將獲得一致的分?jǐn)?shù),也就是說(shuō),評(píng)委給出的若干個(gè)評(píng)分的秩應(yīng)完全相同,這就必然會(huì)導(dǎo)致各個(gè)體得分的秩有較大的差異。關(guān)于二元響應(yīng)的Cochran檢驗(yàn)

前面討論了兩因子方差分析問(wèn)題的Friedman秩和檢驗(yàn)。但是當(dāng)觀測(cè)值只取諸如0或1兩個(gè)可能值時(shí),由于有太多同樣的數(shù)目(只有0和1),排序的意義就很成問(wèn)題了。Cochran1950年提出Cochran檢驗(yàn)。零假設(shè):各個(gè)總體分布相同(或各個(gè)處理發(fā)生概率相等)。實(shí)例:關(guān)于瓶裝飲用水的調(diào)查20名顧客對(duì)4種瓶裝飲用水進(jìn)行了認(rèn)可(記為1)和不認(rèn)可(記為0)的表態(tài)。問(wèn)這幾種瓶裝水在顧客眼中是否有區(qū)別?這里的零假設(shè)是這些瓶裝水(作為處理)在(作為區(qū)組的)顧客眼中沒(méi)有區(qū)別。下表是數(shù)據(jù),每一行為20個(gè)顧客對(duì)某一飲料的20個(gè)觀點(diǎn)(0或1)。最后一列中Ni為認(rèn)可總數(shù),而最后一行為每個(gè)顧客給出的4個(gè)觀點(diǎn)中認(rèn)可數(shù)的總和Li。最后一行的最后的元素為總認(rèn)可數(shù)N。如果Ni和這些Ni的均值的差距很大,那么這些處理(水平)就很不一樣了。用Ni

表示第i個(gè)處理所得到的“1”的個(gè)數(shù),而Lj為第j個(gè)區(qū)組(第j個(gè)顧客)所給的“1”的個(gè)數(shù),所有“1”的總數(shù)記為N。

二元響應(yīng)的Cochran檢驗(yàn)思路Cochran檢驗(yàn)統(tǒng)計(jì)量(Cochran’sQ)假定有k個(gè)處理和b個(gè)區(qū)組,零假設(shè)下各處理發(fā)生的概率相等,則Ni為兩項(xiàng)分布,大樣本下,Ni近似為正態(tài)分布,

則近似卡方分布,經(jīng)過(guò)一系列推理與最后的系數(shù)修正,得到Cochran’sQ:當(dāng)k固定時(shí),Q在b很大時(shí)有近似的自由度為k-1的c2分布。

Spearman秩相關(guān)檢驗(yàn)檢驗(yàn)問(wèn)題設(shè)樣本來(lái)自總體:

設(shè)是在中的秩,是在中的秩。秩的簡(jiǎn)單相關(guān)系數(shù):

秩相關(guān)系數(shù)可簡(jiǎn)化為:檢驗(yàn)在零假設(shè)成立時(shí),服從自由度為的t分布。時(shí)表示正相關(guān)。在存在重復(fù)數(shù)據(jù)的時(shí)候,可以采用平均秩,節(jié)不多的時(shí)候,T仍然可以采用。在大樣本情況下,可以采用正態(tài)近似進(jìn)行檢驗(yàn):在出現(xiàn)打結(jié)的時(shí)候,需要使用修正公式計(jì)算。當(dāng)相關(guān)檢驗(yàn)Kendall(1938)提出一種類似于Spearman秩相關(guān)的檢驗(yàn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論