版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第章計數(shù)數(shù)據(jù)的統(tǒng)計分析:二項式檢驗及分析第一節(jié)二項實驗與二項分布一二項實驗二項實驗的任務(wù)是,讓被試根據(jù)某種原則把兩類事物分開,或者把事物分為兩種類別。例如,呈現(xiàn)給被試兩條長度相差不多的線段,讓被試選出較長的一條;呈現(xiàn)兩個強度相差不大的聲音,讓被試分辨哪個聲音強一些。在這樣的實驗中,研究者想明確被試的正確判斷是反映出他真的具有某種辨別能力,還是反映出猜測的結(jié)果。二項實驗通常需要進行多次,每次實驗結(jié)果只有兩種可能,即正確與錯誤或者是某種情況與非某種情況。當多次實驗結(jié)果的正確次數(shù)超過一定數(shù)量,即僅憑機遇得到這種結(jié)果的概率很小的時候,我們就有理由相信被試具備某種判斷力。假定某人聲稱自己有“千里眼”功能,可以看到封閉容器里的東西。心理學家要對此進行驗證,可以使用二項實驗方法,每次向被試呈現(xiàn)兩個一模一樣的密封盒子,其中一只盒子里有東西,讓被試判斷東西在哪只盒子里。如果被試沒有其聲稱的“千里眼”功能,他僅憑機遇一次判斷正確的概率為1/2,二次實驗都判斷正確的概率為1/2*1/2,n次實驗都正確的概率為(1/2)n。假設(shè)我們做了5次這樣的實驗,僅憑機遇,5次判斷都正確的概率已經(jīng)小于0.05。如果被試5次都正確的話,我們就可以相信他有“千里眼”功能了。對上述二項實驗,我們可以改變設(shè)計方法,用多個密封盒子,比如用3個,其中有一只盒子里放東西,讓被試判斷東西在哪只盒子里。這時,僅憑機遇,被試一次判斷正確的概率變?yōu)?/3,n次都正確的概率為(1/3)n。另外,我們也可以用多個密封盒子,比如5個,在其中兩個盒子里放東西,讓被試選擇出一只放有東西的盒子。這時,僅憑機遇,被試一次選擇正確的概率為2/5,n次選擇都正確的概率為(2/5)n。二二項實驗的基本條件二項實驗每次呈現(xiàn)的實驗刺激并非一定要求是兩個,可以是一個,二個或者多個,被試任何一次的反應(yīng)只能有兩種結(jié)果,即成功與失敗,或者A與非A。上述是二項實驗的基本條件之一。二項實驗第二個基本條件是,要有n次實驗,n是預(yù)先給定的任一正整數(shù)。心理學家要通過二項實驗及二項分布知識進行假設(shè)檢驗工作,通常需要將設(shè)計好的二項實驗進行反復多次的實驗,然后根據(jù)二項實驗結(jié)果隨機分布的概率模型,計算被試反應(yīng)結(jié)果憑機遇可能性的大小,從而推測被試是否具有某種判斷能力。二項實驗第三個基本條件是,各次實驗之間要相互獨立,也就是說各次實驗之間不能相互產(chǎn)生影響。如果實驗假設(shè)某此實驗被試選擇了刺激1或?qū)Υ碳?做出了反應(yīng),那么接下來的實驗就不能再選擇刺激1或?qū)Υ碳?做出反應(yīng)。這樣的設(shè)定造成實驗之間的相互影響,不符合二項實驗的基本條件。二項實驗第四個基本條件是,每次實驗其成功或失敗概率恒定,即n次實驗的成功概率或失敗概率相同,并且每次實驗成功與失敗概率和為1。這個條件很重要,如果每次實驗成功概率不等,那么實驗結(jié)果就無法用二項分布公式來解釋。例如在“千里眼”問題的實驗中,如果我們設(shè)計了5只盒子,只在其中一只里放東西,并讓被試做判斷,那么在接下來的各項試驗中,就不能再做變化,保證各次實驗成功概率都為1/5。根據(jù)二項實驗的條件,能力測驗或知識測試的選擇題通常也可以設(shè)計為二項實驗,用二項分布知識回答被試是否具有某項能力或者某方面的知識。例如有10道單選題,每題都有相同數(shù)量的選項,假如5項僅有一個選項正確,僅憑機遇選對一題的概率都為1/5,這10道單選題測驗可以看成一個n=10的二項實驗。再例如,有10道多選題,每題都有相同數(shù)量的選項,假定有5個選項,每項只有一種正確選擇,僅憑機遇選對一題的概率都為1=1/31,這10道多選題測驗也可以看成一個n=10的二項實驗。三二項實驗各種成功次數(shù)的概率分布二項分布是用來描述二項實驗各種成功次數(shù)的概率分布情況的,例如有一個重復n次的二項實驗,僅憑機遇對0次至n次的概率所形成的分布為二項分布。由于二項分布描述自然數(shù)的概率,因此屬于離散型數(shù)據(jù)概率分布。二項分布有何規(guī)律性?讓我們首先看看n=2和n=3的二項實驗情形。設(shè)定p為二項實驗每次僅憑機遇判斷正確的概率,q為失敗概率,當p=q=1/2并且n=2時,憑機遇該二項實驗有下述各種可能結(jié)果:對對(第一次對、第二次也對)、對錯、錯對、錯錯。因此,僅憑機遇兩次都對的概率為1/2×1/2=1/4,對一次的概率為1/2×1/2+1/2×1/2=1/2,對0次的概率為(即兩次皆錯的概率)1/2×1/2=1/4。對2次、1次、0次的概率正好分別是二項式(1/2+1/2)2展開的三項值,即(1/2+1/2)2=1/4+1/2+1/4。當p=q=1/2并且n=3時,憑機遇此二項實驗有下述各種可能結(jié)果:對對對、對對錯、對錯對、錯對對、錯錯對、錯對錯、對錯錯、錯錯錯8種情況,3次實驗對3次的概率為1/2×1/2×1/2=1/8,對2次的概率為1/2×1/2×1/2+1/2×1/2×1/2+1/2×1/2×1/2=3×1/8,對1次的概率也為3×1/8,對0次的概率為1/8,對3次、2次、1次和0次的概率正好分別是二項式(1/2+1/2)3展開的四項值,即:==。對于任何二項實驗,設(shè)定p和q,以及實驗的次數(shù)n,僅憑機遇對n次至0次的概率正好是二項式(p+q)n展開式對應(yīng)的各項值,即:=(x=0,1...n)。四二項分布的應(yīng)用以“千里眼”問題為例,為明確某人是否有“千里眼”功能,心理學家設(shè)計4只密封盒子,在1只盒子里放東西,讓被試判斷東西在哪只盒子里,實驗共做10次,憑機遇每次判斷正確的概率為1/4,即p=1/4,q=3/4。根據(jù)二項分知識,10次皆對的概率為:=(1/4)10=0.00000095,9次對的概率為0.000029,8次對的概率為0.00039,7次對的概率為,6次對的概率為0.016,5次對的概率為0.058。被試判斷正確6次及以上的概率為0.016+0.0031+0.00039+0.000029+0.00000095=0.0195,即被試僅憑機遇能夠判斷6次及以上正確的概率僅為0.0195,低于0.05顯著水平。通過實驗,如果被試判斷正確次數(shù)為6次或者超過6次,我們就可以做出統(tǒng)計結(jié)論:被試具有“千里眼”功能。當然,被試也有可能憑機遇碰巧猜對6次或6次以上,但這樣可能性很小,概率低于5%。如果被試真的是碰巧猜對6次或6次以上,那么我們就犯下統(tǒng)計錯誤,但犯下這種錯誤的概率很低,小于5%。第二節(jié)用正態(tài)分布模型求解二項分布概率一二項實驗數(shù)據(jù)符合正態(tài)分布的條件二項實驗數(shù)據(jù)可以用二項分布知識解釋,二項分布是離散型數(shù)據(jù)分布,其概率直方圖是躍階式的。當p=q時,圖形對稱,當pq時,直方圖呈偏態(tài)。如果二項分布滿足p<q,且np5(或者p>q,且nq5)時,二項分布接近正態(tài)分布,可以用正態(tài)分布知識求解二項分布的概率。這時x變量(即n次二項實驗僅憑機遇正確判斷的次數(shù))具有如下性質(zhì):無數(shù)被試參與該二項實驗,總體正確判斷次數(shù)的平均值=np,標準差=,且x變量的分布于=np,=的正態(tài)分布接近。在此需要提示注意的是,接近的概念不是說x變量的分布與對應(yīng)=np,=的正態(tài)分布相似。x變量的分布屬于離散分布,而正態(tài)分布屬于連續(xù)分布?!敖咏币庵?,此時,x變量的相對概率密度與對應(yīng)正態(tài)分布計算的概率密度接近。也就是說通過二項分布計算出的超過某x值(是自然數(shù))的概率,與通過對應(yīng)正態(tài)分布計算出的超過同樣x值的概率十分接近。有了上述二項分布的性質(zhì),我們可以借助正態(tài)分布求解二項分布的概率,這樣可以避免二項分布的繁瑣計算。二利用正態(tài)分布求二項分布概率以“千里眼”問題為例,設(shè)計2只盒子,其中一只盒子放有東西,讓被試判斷東西放在哪只盒子里,實驗共做10次,每次憑機遇猜對的概率為1/2。通過實驗解釋二項判斷的結(jié)果是基于隨機的猜測,還是基于真實的判斷力。此題p=q=1/2,np5,所以二項分布接近正態(tài)分布,對應(yīng)正態(tài)分布的=np=101/2=5,==1.58。依據(jù)正態(tài)分布概率(查表可知)Z=1.645時,該點一下包含了全體的95%,該點的原始分值x=+1.645=7.6。這意味,在此正態(tài)分布中,大于7.6分值的概率小于5%。由于二項分布為離散分布,不可能有7.6次正確判斷次數(shù),取x值為8時,在此二項分布中,大于8分值的概率同樣小于5%(取x值為7時,大于7分的概率大于5%,因此不能取x值為7)。通過正態(tài)分布計算,被試猜對8次及以上的概率小于5%,因此,可以推測說,猜對8次及以上者,僅憑機遇的可能性小于5%,此概率很小,我們有理由相信這樣的人有“千里眼”功能。利用正態(tài)分布求解二項分布概率,只有在滿足相關(guān)條件的時候才可以這么做。如果條件不滿足,我們只能老老實實通過二項分布求解概率。例如在二項分布應(yīng)用的題目中,p=1/4,n=10,np=2.5<5,此時二項分布與正態(tài)分布相差甚遠,不能再用正態(tài)分布求解概率了。第三節(jié)百分比及百分比差值檢驗二項實驗的數(shù)據(jù),有時是用比例來表示的。另外,在二分變量的調(diào)查研究中,屬于定義情況的個案數(shù)量通常也是用比例來反映的。上述比例表示的變量都是只有兩種類別的分類變量,本節(jié)內(nèi)容主要介紹此類型數(shù)據(jù)的推論分析。一百分比檢驗百分比檢驗適用于處理單一樣本或一種條件下二分變量比例的研究結(jié)果。例如,有人聲稱大白鼠有右轉(zhuǎn)彎的偏好。動物心理學家用T型迷津做研究,發(fā)現(xiàn)一只大白鼠64次實驗中,有42次向右轉(zhuǎn),右轉(zhuǎn)百分比為65.6%。根據(jù)這個二項實驗結(jié)果,能不能說大白鼠有右轉(zhuǎn)彎偏好(注:實驗控制好了其他額外變量)。再例如,某糖果廠為孩子試制了兩種圖案不同的糖果包裝紙去征求孩子的意見,在一個包含200個孩子的樣本中,有140個孩子喜歡甲種包裝紙,喜歡甲種包裝紙的人數(shù)占調(diào)查總?cè)藬?shù)的70%。根據(jù)這個調(diào)查結(jié)果,是否可以說孩子對甲種包裝紙有所偏愛呢?上述兩個例子就涉及到百分比分析問題。(一)樣本百分比分布比例和頻數(shù)是可以互換的,比例分布實際上屬于二項分布。當樣本容量較小時,可以用頻數(shù)進行二項式檢驗,比例進行的檢驗通常用于處理大樣本情況。在大樣本情況下,常用正態(tài)分布表示二項分布的近似值。假設(shè)總體具有某種屬性的比例為p,不具有某種屬性的概率為q,從該總體隨機抽取容量為n的樣本,可以計算出樣本具有某種屬性的個案比例,用p’表示容量為n的樣本中具有某種屬性的個案所占比例,當nP5(p<q)或nq5(p>q)時,樣本比率p’的分布接近一個正態(tài)分布,該正態(tài)分布的平均數(shù)和標準差的計算方法見公式(6.1)和(6.2)。公式(6.1)和(6.2)同頻數(shù)表示的二項分布接近的正態(tài)分布參數(shù)計算公式有聯(lián)系,是在原公式的右邊分別除以n,完成將頻數(shù)轉(zhuǎn)換為比率。=p(6.1)或=(6.2)(二)總體比例的區(qū)間估計對于一個無限總體或非常大的總體,要想了解其總體具有某特征的比例,我們通常采取隨機抽樣的方法抽取一個樣本并計算出樣本比例,然后根據(jù)樣本比例符合的統(tǒng)計模型來說明總體比例的置信區(qū)間,這點很像平均數(shù)的區(qū)間估計。前面我們剛剛介紹了,當樣本量足夠大時,nP5時,樣本比例分布可以借助正態(tài)分布模型來說明。根據(jù)正態(tài)分布的知識,總體比例的置信區(qū)間可由公式(6.3)計算。=p=(6.3)具體計算時,由于總體的p和q不知,此時可以用和代換p和q。下面是一個具體的例子。為了知道某大學男女生的比例,我們按照隨機抽樣原則,在該大學學生管理處隨機抽取50個同學,結(jié)果顯示男生30人,女生20人,問該大學男生比率95%的置信區(qū)間。根據(jù)已知條件,可得==0.6(男生的樣本比例),==0.4(女生的樣本比例)。由于n>5,可以借用正態(tài)分布模型,即公式(6.3)推論置信區(qū)間。由=1.96,===0.0693,P的0.95置信區(qū)間為:P=0.61.960.0693=0.46~0.74。由此可以推知該大學男生比例在0.46~0.74之間,作此推論錯誤概率為0.05,為小概率。(三)比例的假設(shè)檢驗比例的假設(shè)檢驗?zāi)康脑谟?,通過運用樣本比例分布模型,推測樣本是否來自已知總體,即研究的樣本與已知總體是否有顯著差異性。根據(jù)樣本比例分布知識,在已知總體的p和q確定后,當np5或時,從該總體隨機抽取樣本,其的分布可借用前面所講的正態(tài)模型來說明。如果我們所研究的某個樣本屬于該總體的一個隨機樣本,那么該樣本統(tǒng)計量在該總體屬性比例0.95或0.99置信區(qū)間內(nèi)屬正常,而超出這個區(qū)間屬異常。當與已知總體的P相差較大,處于小概率的極端位置,我們便推論該樣本不屬于已知總體,做此推論犯錯誤的概率很小,僅為0.05或0.01。比例假設(shè)檢驗的一般步驟是,首先提出虛無假設(shè)“研究樣本屬于已知總體的一個隨機樣本”;然后根據(jù)已知總體其樣本分布符合的正態(tài)分布模型,考察樣本的比例是否超出0.95或0.99置信區(qū)間,如果超出置信區(qū)間,就做出不屬于該總體的結(jié)論,即接受備選假設(shè)“研究樣本不屬于已知總體的一個隨機樣本”。下面以大白鼠轉(zhuǎn)彎偏好問題為例,來說明比例的假設(shè)檢驗過程。干擾因素被控制之后,大白鼠在T型迷津里行走,如果沒有轉(zhuǎn)彎的偏好,總體上看其左右轉(zhuǎn)彎的概率是相同的,都為50%。假設(shè)我們對一只大白鼠的64次實驗為總體的一個隨機樣本,該假設(shè)為虛無假設(shè),即“大白鼠無右轉(zhuǎn)彎偏好”。根據(jù)前面所講的正態(tài)分布模型,可以計算出。0.5,=0.656===0.0625由實驗得到統(tǒng)計量=0.656,用該正態(tài)分布表示二項分布的近似值,計算出在樣本分布中的Z值,Z值的計算方法是:查正態(tài)分布表,Z=2.50時,較小部分的面積為0.0062。由于現(xiàn)在要檢驗的是大白鼠偏好右轉(zhuǎn)彎,而不是有向左或向右轉(zhuǎn)彎偏好,因此要選擇單側(cè)檢驗。通過假設(shè)檢驗分析,我們可以在0.01水平上推翻虛無假設(shè),認為大白鼠有很顯著的右轉(zhuǎn)彎偏好。上例正好遇到總體的p=q=0.50的情況,實踐上p可以不等于q,這同樣可以按上述的過程進行假設(shè)檢驗,只要注意把相應(yīng)的p,q及n值代入公式計算相關(guān)指標就行了。二兩個樣本比例差異的顯著性檢驗比例差異的顯著性檢驗適用于處理兩個樣本比例的實驗結(jié)果,通過兩個樣本比例差異的分析來推論兩個樣本是否來自同一個總體。心理學研究時常遇到兩個樣本比例之間的比較,例如將一群被試隨機分成兩組,分別包含n1和n2個被試,其中一組被試接受態(tài)度轉(zhuǎn)變培訓,另一組被試接受與某種態(tài)度轉(zhuǎn)變無關(guān)的其它培訓。培訓結(jié)束后對每名被試進行態(tài)度調(diào)查,實驗的目的在于分析兩組被試肯定態(tài)度的比例是否有顯著的差異性。如果經(jīng)檢驗差異顯著,那就說明態(tài)度轉(zhuǎn)變培訓起到了改變被試態(tài)度的作用。分析上述實驗結(jié)果,需要用到兩個樣本比例差異的抽樣分布模型,有了這個模型就可以解釋差異是否達到顯著水平。(一)兩個樣本比例差異的抽樣分布模型從總體比例分別為和的兩個總體中,隨機抽取樣本容量為n1和n2的兩個樣本,得到兩個樣本比例,當時,統(tǒng)計量的分布近似正態(tài)分布,該正態(tài)分布的參數(shù)分別為公式(6.4)和(6.5)。(6.4)(6.5)如果總體和不知,可分別用兩個樣本的代替和,公式(6.5)可寫為公式(6.6)。(6.6)在比例差異的假設(shè)檢驗中,虛無假設(shè)通常是=,即兩個樣本來自同一總體。如果=,這時兩個樣本比例差值分布的平均值為0;其分布的標準差計算不再單獨用,而是用加權(quán)比例平均數(shù)()。(6.7)(6.8)將公式(6.8)代入公式(6.7)得公式(6.9)。(6.9)如果公式(6.9)變?yōu)楣剑?.10)。(6.10)在此需要指出,上述關(guān)于兩個樣本比例差值分布的知識是針對兩個獨立樣本來說的,也就是講兩個樣本沒有相關(guān)關(guān)系。兩個獨立樣本比例差異的顯著性檢驗兩個獨立樣本比例差異的顯著性檢驗一般步驟是:提出虛無假設(shè),或(設(shè)定值),即兩個樣本代表的總體比例相同或相差一個之前設(shè)定的值;根據(jù)前面所講的兩個獨立樣本比例差值抽樣分布知識,求出;計算出實驗樣本比例差值的標準分數(shù),計算公式為(6.11);最后查正態(tài)分布表,看Z值是否達到顯著水平,并做出推論。(6.11)比例差異的檢驗也有單側(cè)和雙側(cè)檢驗的區(qū)別。雙側(cè)檢驗的虛無假設(shè)是或,備選假設(shè)是或;單側(cè)檢驗的虛無假設(shè)是或,備選假設(shè)是或。雙側(cè)檢驗時,需查Z值對應(yīng)的雙側(cè)面積;單側(cè)檢驗時,需查Z值對應(yīng)的單側(cè)面積。下面兩個例題具體說明此類檢驗的過程。例題一:以態(tài)度轉(zhuǎn)變培訓問題為例,80名受試者被隨機分為兩組,50人接受態(tài)度轉(zhuǎn)變培訓,另30人接受其它培訓。培訓結(jié)束后進行態(tài)度調(diào)查,調(diào)查結(jié)果顯示,態(tài)度轉(zhuǎn)變培訓組受試者持肯定態(tài)度比例為84%;其它培訓組受試者持肯定態(tài)度比率為60%。問態(tài)度轉(zhuǎn)變培訓是否起到轉(zhuǎn)變態(tài)度的效果?此例具體分析是:設(shè)和分別為態(tài)度轉(zhuǎn)變培訓組和其它內(nèi)容培訓組總體持肯定態(tài)度的比例,虛無假設(shè)是,即態(tài)度轉(zhuǎn)變培訓沒有顯著提高持肯定態(tài)度的比例,推論屬于單側(cè)檢驗。將,,代入公式(6.8),得,再將、和、值代入公式(6.7),得最后把,代入公式(6.11),得查正態(tài)分布表可知,Z=24.00時,Z對應(yīng)的單側(cè)面積遠遠小于0.01,因此在0.01水平上,兩個組比例差異達到顯著。統(tǒng)計的結(jié)論是,態(tài)度轉(zhuǎn)變培訓起到了顯著效果。例題二:將上例做一改變,假定一公司提出要求,態(tài)度轉(zhuǎn)變培訓要達到接受態(tài)度轉(zhuǎn)變培訓后總體上積極態(tài)度的比率高出沒有接受態(tài)度轉(zhuǎn)變培訓總體5個百分點以上。已知和(接受態(tài)度轉(zhuǎn)變培訓組)為100和80%,和為150和60%,問結(jié)果是否達到公司要求?例題二的具體分析:虛無假設(shè)為,即態(tài)度轉(zhuǎn)變培訓沒有達到總體上提高積極態(tài)度5個百分點的要求,檢驗也屬于單側(cè)檢驗。與例題一不同,例題二計算的公式用公式(6.6),不要求加權(quán)值。最后把=0.80,=0.60,=0.01和=0.05代入公式(6.11),得查正態(tài)分布表可知,Z=2.65時,Z對應(yīng)的單側(cè)面積0.01,因此在0.01水平上顯著,統(tǒng)計結(jié)論是,態(tài)度轉(zhuǎn)變培訓顯著提高總體積極態(tài)度比例5個百分點以上。兩個相關(guān)樣本比率差異的顯著性檢驗前述兩個樣本比例差值分布的知識,是針對兩個獨立樣本來講的,它不符合兩個相關(guān)樣本比例差異的顯著性檢驗。因此,相關(guān)樣本的檢驗還需要尋找其它方法。在心理學研究中,有時會考慮安排同一組被試在不同條件下做實驗,這時實驗結(jié)果的數(shù)據(jù)之間就有了相關(guān)關(guān)系。對于分類變量的研究也存在該種情況,例如在前面的例子中,我們?yōu)檠芯繎B(tài)度轉(zhuǎn)變培訓是否有提高肯定態(tài)度比例的效果,可以在培訓前后對同一組受試者進行態(tài)度測查,看看前后兩次調(diào)查結(jié)果中持肯定態(tài)度的比例是否有變化。這樣的實驗結(jié)果就需要進行兩個相關(guān)樣本比例差異的顯著性檢驗。上述相關(guān)樣本的實驗結(jié)果可以整理成22的表格,表格一般形式如下:實驗條件一實驗條件二 是某種情況非某種情況是某種情況BAA+B非某種情況DCC+DB+DA+CA表示同一組被試中,第一條件是某種情況而第二條件下卻為非某種情況的人數(shù);B表示同一組被試中,第一條件下是某種情況且第二條件下也是某種情況的人數(shù);C和D表示的意義類推。根據(jù)上表,兩次調(diào)查得到的是某種情況的比例分別為(A+B)/n和(B+D)/n。那么就有兩次調(diào)查比例差值的計算形式:從差值計算公式可以看出,兩次調(diào)查比例的差值只與A和D有關(guān)。因此在這種比例差異的顯著性檢驗中只需要考慮A和D的數(shù)值。從總體上看,如果A=D,那么總體比例就無差異。根據(jù)表,A和D分別表示兩種條件下兩種不一致個體的數(shù)量:A反映第一種條件為肯定而第二種條件轉(zhuǎn)為否定的個案數(shù)量;D反映第一張條件為否定而第二種條件轉(zhuǎn)為肯定的個案數(shù)量。當總體上有A=D時,樣本觀察到的A和D的分布符合二項分布,該二項分布的p=q=,A+D=k為二項實驗的次數(shù),A與D是否有顯著差異可以借助二次分布的知識解釋。當kp即(A+D)時,二項分布接近正態(tài)分布,A與D的顯著性推論分析就轉(zhuǎn)變成正態(tài)分布模型解釋。樣本分布的Z計算公式:(6.12)公式(6.12)實際是二項分布近似正態(tài)分布條件下Z檢驗公式的具體化,下面以態(tài)度轉(zhuǎn)變培訓問題為例來說明具體分析過程,假設(shè)研究的數(shù)據(jù)如下:培訓前培訓后肯定人數(shù)否定人數(shù) 肯定人數(shù)55(B)5(A)否定人數(shù)15(D)25(C)將A和D代入公式(6.12),得Z>1.96,因此可以推論培訓有顯著的效果。上述分析過程只適合k10的情況,當k<10時,二項分布與相應(yīng)的正態(tài)分布差別較大,此時應(yīng)采用二項展開式具體計算。第四節(jié)一個變量多種分類數(shù)據(jù)及兩個分類變量的推論分析:檢驗。一檢驗概述(一)檢驗的數(shù)據(jù)特征二項式檢驗以及與二項式檢驗相關(guān)的比例檢驗,主要用來分析只有兩種分類的單個分類變量實驗或調(diào)查的結(jié)果。當兩種分類結(jié)果以頻數(shù)表示時,分析采用二項式檢驗;當兩種分類結(jié)果以比例表示時,分析采用比例檢驗方法。在心理學實際研究中,我們常遇到一些分類變量,它有兩種以上的分類,并且在一項具體研究中分類變量也不僅僅只有一個。這樣的單變量多種分類的結(jié)果,以及多個分類變量的實驗結(jié)果,其分析不能再用上述的二項式檢驗和比例檢驗方法。在介紹概率分布知識時,我們提到一些計數(shù)數(shù)據(jù)的分布也符合c2分布,c2檢驗將借助c2分布模型處理多種分類以及多個分類變量的實驗結(jié)果。例如:某學院有5個專業(yè),也就是說該學院專業(yè)變量有5個分類,這5個專業(yè)在校學生數(shù)可以調(diào)查出來,假設(shè)從全國來看類似學院5個專業(yè)學生人數(shù)基本一致,問該學院情況是否和全國類似學院一樣?(即5個專業(yè)學生人數(shù)基本一致)。再例如,從某學院隨機抽取n名學生,調(diào)查他們的性別和專業(yè)兩個方面的屬性(即兩個變量),性別和專業(yè)屬于分類變量,性別有兩個分類,專業(yè)有5個分類,調(diào)查結(jié)果為男女人數(shù)分布和5個專業(yè)人數(shù)分布,問5個專業(yè)的人數(shù)分布是否有男女差別?上述兩個例題的數(shù)據(jù)分析就會用到c2檢驗法。c2檢驗的內(nèi)容c2檢驗的內(nèi)容主要有配合度卡方檢驗(goodness-of-fitc2test)和獨立性卡方檢驗(c2testofindependence)兩個方面。配合度檢驗用于分析單個分類變量實際觀察到的不同類別頻數(shù)分布,是否與假設(shè)或期望總體的頻數(shù)分布一致。獨立性檢驗用于分析兩個分類變量的實驗結(jié)果,回答一個變量不同類別的頻數(shù)分布是否與另一個分類變量不同類別有關(guān)系這個問題。這兩種c2檢驗分別對應(yīng)于前面所舉的兩個例子的數(shù)據(jù)分析。配合度檢驗配合度檢驗需要滿足的基本假設(shè)條件配合度檢驗適用于分析單個多類變量的實驗結(jié)果,這種實驗數(shù)據(jù)應(yīng)滿足三個條件:(1)不同分類之間要相互排除;(2)觀察是獨立的;(3)樣本要足夠大。只有同時滿足上面3個條件,c2配合度檢驗的結(jié)果才可以說明問題。不同分類之間要相互排除,是說在歸類時每個被試或調(diào)查對象只能歸為n個分類中的某一類,而不能同時屬于兩類甚至更多的類別。就某些分類變量來說,例如性別、婚姻狀態(tài)等,每個受試對象客觀上只能屬于某個類別。而對于另外一些分類變量來說,例如在校大學生所屬專業(yè)變量,每個受試對象實際上可能同時屬于兩個專業(yè),在這種情況,也應(yīng)當保證每個受試者只屬于某個專業(yè)的學生,只有這樣才符合c2檢驗的條件。因此,在c2檢驗過程中,各種類別頻數(shù)之和與被試人數(shù)正好相等。觀察要是獨立的,意指判斷各類別的標準要一致,也就是說每個受試對象除了要研究的原因外不能有其他的限制性因素影響其所屬類別。例如,在研究大學生專業(yè)人數(shù)的分布問題時,我們想知道大學生專業(yè)選擇是否有偏好,此時,每個受試對象應(yīng)能夠在n個專業(yè)中自由選擇,而不能特別設(shè)定某個專業(yè)只有達到某一標準時才能選擇。c2檢驗還要求樣本的容量要足夠大,足夠大的一般原則是,樣本大小滿足每種分類的期望頻數(shù)不少于5。如果期望頻數(shù)過小,c2值計算易產(chǎn)生過大的誤差。配合度檢驗過程讓我們以一個簡單的例子來說明c2配合度檢驗任務(wù)。某大學要求每個學生第一學年結(jié)束之后,必須在5個體育項目中選擇一項作為體育課程的學習內(nèi)容。某個學院的輔導員對該學院同學選擇不同體育項目的人數(shù)感興趣,想知道本院學生選擇情況與學??傮w情況是否一致。假設(shè)學校限定每個同學只能選擇一項,并且選擇是自由的;該假設(shè)保證不同項目群體之間是排斥的,并且選擇不受特殊限制的。表6.1是該學院同學選擇的結(jié)果。表6.1某學院300名同學選修體育項目人數(shù)體育項目觀測頻數(shù)網(wǎng)球O1=3羽毛球O2=45乒乓球O3=77籃球O4=90足球O5=85TotalT=300從上表可以看出,籃球是同學們選擇最多的項目,而網(wǎng)球最少。這種情況是否與全校的情況一致?換句話說,該學院的調(diào)查數(shù)據(jù)分布于全校的模式是否匹配呢?表6.2同時反映出觀測頻數(shù)和期望頻數(shù)。表中全校的比率pi表示全校所有選修體育項目的同學中各項目選擇人數(shù)占總?cè)藬?shù)的比率,例如全校中有25%的人選擇了籃球,表中期望頻數(shù)表示按照全校的比率情況計算出來的頻數(shù),例如,按照全校25%的比率,該學院300人中應(yīng)有75人選擇籃球項目。表6.2某學院300名同學選修體育項目觀測頻數(shù)與期望頻數(shù)體育項目觀測頻數(shù)全校選修比率期望頻數(shù)(pi×T)網(wǎng)球O1=3p1=0.05E1=0.05×300=15羽毛球O2=45p2=0.30E2=0.30×300=90乒乓球O3=77p3=0.25E3=0.25×300=75籃球O4=90p4=0.25E4=0.25×300=75足球O5=85p5=0.15E5=0.15×300=45Total3001.00300從表6.2可以看出,觀測頻數(shù)與期望頻數(shù)有一些差別。例如,該學院同學中選修網(wǎng)球和羽毛球的人數(shù)比期望人數(shù)少,而選修乒乓球、籃球和足球的人數(shù)比期望人數(shù)多?,F(xiàn)在我們可以提出這個問題:上述觀測頻數(shù)與期望評述之間的差別是因為隨機抽樣誤差造成,還是確實存在著統(tǒng)計上的顯著性?回答這個問題,就需要借助c2配合度檢驗了。公式(6.13)定義了c2值,Oi表示各類別觀測頻數(shù),Ei表示各類別期望頻數(shù)。根據(jù)公式如果觀測頻數(shù)與期望頻數(shù)之間的差別僅反映出隨機誤差,那么c2值將相對較?。蝗绻^測頻數(shù)期望頻數(shù)之間的差別不足以用隨機誤差原因來解釋,那么c2值將會相對較大。(6.13)c2值大到什么程度才可以說不是隨機誤差原因能解釋的?也就是說c2值大到什么程度才可以拒絕虛無假設(shè)“觀測頻數(shù)與某個總體定義的期望頻數(shù)相匹配”?這個問題的回答需要用到c2分布模型。c2分布是一系列分布,其具體形態(tài)由自由度決定,公式(6.14)是c2配合度檢驗的自由度計算公式,自由度比分類數(shù)少一,即:(6.14)在上述例題里,總共有5個項目分類,因此自由度為df=4(df=5-1)。有了自由度就可以通過查c2分布表(附表)確定c2檢驗的臨界值,當觀測c2值等于或大于臨界c2值,我們將拒絕虛無假設(shè)。c2檢驗與我們后面將要講到的方差分析一樣,是一個沒有方向的,公共性質(zhì)的檢驗,因此,檢驗時要查c2表的單側(cè)臨界值。c2檢驗的結(jié)果不能指明觀測數(shù)與期望數(shù)差異的具體位置,也就是說在哪個具體類別上觀測數(shù)與期望數(shù)有顯著差異。將表6.2的數(shù)據(jù)代入公式(6.13),計算出觀測c2值為70.17。查自由度為4的c2分布表,得0.05水平的臨界c2值為9.49。觀測c2值大于臨界c2值,拒絕虛無假設(shè),接受備擇假設(shè)。統(tǒng)計結(jié)論是,某學院學生選修體育項目的頻數(shù)分布與學??傮w情況不匹配,即不一致。在上面的例題中,根據(jù)總體定義的各分類期望概率不同,各分類的期望頻數(shù)也各不相同。在另外一些研究情境中,我們會遇到期望頻數(shù)相同的情況。下面舉一例說明此種情況的c2配合度檢驗問題。一位糖果銷售商人想知道,兒童對紅、綠、藍、黃4種顏色的糖果包裝紙是否有偏好,他在一大型幼兒園隨機地調(diào)查了400多名兒童。這400多名兒童對紅、綠、藍、黃4種顏色包裝紙選擇結(jié)果是:紅色有78人、綠色有105人、藍色有98人、黃色有119人。選擇中要求每名兒童只選擇一種自己喜歡的顏色,問該調(diào)查結(jié)果是否說明兒童有偏好?從總體看,如果兒童不存在偏好,那么各類選擇的期望頻數(shù)應(yīng)一樣,都是100人,即(105+98+78+119)÷4=100。將本題的觀測頻數(shù)和期望頻數(shù)帶入公式(6.13),計算觀測c2值:本例題有4種分類,c2檢驗自由度df=k-1=4-1=3。查自由度為3的c2分布表,得0.05水平的臨界c2值為7.82。觀測c2值大于臨界c2值,拒絕虛無假設(shè)“觀測頻數(shù)與期望頻數(shù)匹配”。統(tǒng)計結(jié)論是,兒童對4種顏色糖果包裝紙有顯著偏好。從數(shù)據(jù)看,選擇黃色的人數(shù)較多。接下來,我們對c2匹配度檢驗過程做出總結(jié):(1)提出虛無假設(shè)“觀測頻數(shù)與總體定義的期望頻數(shù)匹配或一致”,同時提出備擇假設(shè)“觀測頻數(shù)與總體定義的期望頻數(shù)不匹配或不一致”;(2)根據(jù)總體定義情況,計算出各類別的期望頻數(shù);(3)用c2計算公式求出觀測的c2值;(4)用自由度計算公式,計算c2分布的自由度df=k-1,根據(jù)自由度查c2表,得出0.05或0.01水平的臨界c2值;(5)比較觀測c2值和臨界c2值,當觀測c2值大于或等于臨界c2值時,拒絕虛無假設(shè),反之就接受虛無假設(shè);(6)寫出統(tǒng)計結(jié)論。獨立性檢驗c2配合度檢驗可以處理單個分類變量的實驗結(jié)果,c2檢驗的邏輯同樣可以擴展到處理兩個分類變量的實驗結(jié)果,檢驗兩個分類變量之間是否獨立,這就是我們將要講的c2獨立性檢驗的問題。接下來,讓我們看一個采用c2獨立性檢驗的簡單例題,了解獨立性檢驗的具體過程。為了解大學生在考研問題上是否有男女差異,即考研選擇是否與性別有關(guān),一名學生管理工作者在其關(guān)心的大學生群體中,隨機選取了50名女生和50名男生,并調(diào)查他(她)們是否考研,調(diào)查結(jié)果顯示,女生有35人決定考研,男生有15人決定考研。上述例題的研究涉及性別和考研選擇兩個分類變量,每個變量各有2個分類,其調(diào)查結(jié)果可以整理成一個交叉表,交叉表的單元數(shù)為兩個分類變量類別數(shù)的乘積,即2×2=4(單元數(shù))。表6.3反映了本次調(diào)查的結(jié)果。表6.3說明c2獨立性檢驗的例題數(shù)據(jù)類別考研不考研總計女O11=35O12=15R1=50男O21=10O22=40R2=50總計C1=45C2=55T=100同c2配合度一樣,c2獨立性檢驗也要確定每個單元的期望頻數(shù)。期望頻數(shù)是假設(shè)兩個分類變量無關(guān)情況下,按照調(diào)查得到的各種情況的比例和人數(shù)計算出來的,獨立性檢驗各單元期望頻數(shù)的計算公式是:(6.15)公式中,Ri和Ci表示某一行和某一列觀測總數(shù),T表示全部觀測總體,Eij表示某一單元的期望頻數(shù)。根據(jù)期望頻數(shù)計算公式,我們把各單元的期望頻數(shù)計算出來,并填入交叉表6.3。表中Oij表示各單元觀測到的頻數(shù)。如果兩個變量之間沒有聯(lián)系,即相互是獨立的,那么每
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海外國語大學《國畫人物繪本》2023-2024學年第一學期期末試卷
- 上海體育大學《傳感器實驗》2023-2024學年第一學期期末試卷
- 乘法和加減法的混合運算教案孟坤
- 2025化工產(chǎn)品合同范文
- 印刷現(xiàn)狀評估報告范文
- 上海視覺藝術(shù)學院《危機傳播管理》2023-2024學年第一學期期末試卷
- 藥學專業(yè)業(yè)務(wù)報告范文
- 村鎮(zhèn)現(xiàn)場勘察報告范文
- 懷孕辭職報告范文簡短
- 庫管的述職報告范文
- 地彈簧行業(yè)分析
- 不動產(chǎn)抵押登記手續(xù)
- 公安機關(guān)執(zhí)法執(zhí)勤規(guī)范用語
- 如何發(fā)揮采購在公司高質(zhì)量發(fā)展中作用
- 2023-2024學年湖南省長沙市雨花區(qū)外研版(三起)五年級上冊期末質(zhì)量檢測英語試卷
- 監(jiān)理質(zhì)量評估報告
- 《中國封建社會》課件
- 藥物代謝動力學-中國藥科大學中國大學mooc課后章節(jié)答案期末考試題庫2023年
- 血液科護士的營養(yǎng)與膳食指導
- 短視頻實習運營助理
- 互聯(lián)網(wǎng)醫(yī)療服務(wù)創(chuàng)業(yè)計劃書
評論
0/150
提交評論