心理測(cè)量的信度_第1頁(yè)
心理測(cè)量的信度_第2頁(yè)
心理測(cè)量的信度_第3頁(yè)
心理測(cè)量的信度_第4頁(yè)
心理測(cè)量的信度_第5頁(yè)
已閱讀5頁(yè),還剩67頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章 心理測(cè)量的信度 n第一節(jié) 什么是信度 n第二節(jié) 估計(jì)信度的方法 n第三節(jié) 影響信度系數(shù)的因素 n一、信度的意義n二、信度系數(shù)的作用 n backn一、信度的意義n信度即測(cè)驗(yàn)的可靠性,指的是測(cè)量的一致性程度。 n信度受隨機(jī)誤差的影響,隨機(jī)誤差越大,信度越低。 n在測(cè)量學(xué)中,信度被定義為:一組測(cè)量分?jǐn)?shù)的真變異數(shù)與總變異數(shù)(實(shí)得變異數(shù))的比率。即n (公式51)n式中 代表信度系數(shù), 代表真分?jǐn)?shù)的變異數(shù), 代表實(shí)得分?jǐn)?shù)的變異數(shù),即總變異數(shù)。xtxxssr22xxrts2xs2n根據(jù)公式51,信度還可以表示為:n (公式52) xexxssr221 n這個(gè)定義有兩點(diǎn)要注意:n(1)信度是一組測(cè)

2、量分?jǐn)?shù)的特性,不是某個(gè)測(cè)量分?jǐn)?shù)的特性。是對(duì)一個(gè)人測(cè)量多次或?qū)σ粋€(gè)群體進(jìn)行測(cè)量得到一組測(cè)量分?jǐn)?shù)的特性n(2)真分?jǐn)?shù)的變異數(shù)不能直接測(cè)量,因此信度是一個(gè)理論上構(gòu)想的概念,只能根據(jù)一組實(shí)得分?jǐn)?shù)進(jìn)行估計(jì)。 n對(duì)于信度系數(shù),還應(yīng)該注意以下幾點(diǎn):n(1)在不同的情況下,對(duì)于不同的樣本,采用不同的方法會(huì)得到不同的信度系數(shù),因此一個(gè)測(cè)驗(yàn)可能不止一個(gè)信度系數(shù)。n(2)信度系數(shù)只是對(duì)測(cè)量分?jǐn)?shù)不一致程度的估計(jì),并沒(méi)有指出不一致的原因。n(3)獲得較高的信度系數(shù)并不是心理測(cè)量有效的充分條件,只是一個(gè)必要條件。 backn1.評(píng)價(jià)測(cè)驗(yàn)n信度系數(shù)是衡量測(cè)驗(yàn)好壞的一個(gè)重要的技術(shù)指標(biāo)。 n一般能力與學(xué)績(jī)測(cè)驗(yàn)的信度系數(shù)為0.9

3、0以上,有的可以達(dá)到0.95;標(biāo)準(zhǔn)智力測(cè)驗(yàn)的信度系數(shù)應(yīng)達(dá)到0.85以上,個(gè)性和興趣測(cè)驗(yàn)的信度系數(shù)可稍低,一般應(yīng)達(dá)到0.700.80,(也有人認(rèn)為興趣、性格、價(jià)值觀等人格測(cè)驗(yàn)的信度系數(shù),通常在0.800.85或更高些)。當(dāng)信度系數(shù)小于0.70時(shí),不能用測(cè)驗(yàn)來(lái)對(duì)個(gè)人進(jìn)行評(píng)價(jià),也不能用來(lái)進(jìn)行團(tuán)體間的比較;當(dāng)信度系數(shù)大于0.70時(shí),可用來(lái)進(jìn)行團(tuán)體間的比較;大于0.85時(shí),可以用來(lái)鑒別個(gè)人。 n2.用來(lái)估計(jì)個(gè)人的測(cè)驗(yàn)分?jǐn)?shù)(真分?jǐn)?shù))n由于誤差的存在,一個(gè)人通過(guò)測(cè)量得到的分?jǐn)?shù)很難等于真分?jǐn)?shù)。理論上,我們可以對(duì)一個(gè)人施測(cè)無(wú)數(shù)次,然后求得所得分?jǐn)?shù)的平均數(shù)和標(biāo)準(zhǔn)差。在這個(gè)假設(shè)的分布里,平均數(shù)就是這個(gè)人的真分?jǐn)?shù),標(biāo)

4、準(zhǔn)差則為誤差大小的指標(biāo)。 xn在實(shí)際工作中,我們用一組被試(人數(shù)足夠多)兩次施測(cè)的結(jié)果來(lái)代替對(duì)同一個(gè)人反復(fù)施測(cè),以估計(jì)測(cè)量誤差的變異數(shù)。此時(shí),個(gè)人在兩次測(cè)驗(yàn)中的分?jǐn)?shù)差異就是測(cè)量誤差。據(jù)此可制成誤差分?jǐn)?shù)的分布。這個(gè)分布的標(biāo)準(zhǔn)差(誤差分誤差分布的標(biāo)準(zhǔn)差布的標(biāo)準(zhǔn)差)我們稱之為測(cè)量的標(biāo)準(zhǔn)誤測(cè)量的標(biāo)準(zhǔn)誤,是表示測(cè)量誤差的大小的指標(biāo),其計(jì)算公式為:n (公式54)n式中se表示測(cè)量的標(biāo)準(zhǔn)誤,即誤差分布的標(biāo)準(zhǔn)差;sx表示一次測(cè)量分?jǐn)?shù)的標(biāo)準(zhǔn)差;rxx表示信度系數(shù)。xxxrsse1n我們可以用測(cè)量的標(biāo)準(zhǔn)誤來(lái)估計(jì)個(gè)人測(cè)驗(yàn)的真分?jǐn)?shù)的大小。 n如果選用95的可靠性水平(置信水平),即顯著性水平(a值)為.05,真分?jǐn)?shù)

5、有95的可能落入x se ,即x 1.96 se的范圍之內(nèi),也可以寫成x1.96se t x1.96 se,se則用公式54代入?;蛴?的可能落入這范圍之外。這實(shí)際上也表明了再測(cè)時(shí)分?jǐn)?shù)改變的可能范圍。 2zn例1,已知wisc-r的標(biāo)準(zhǔn)差為15,信度系數(shù)為0.95,對(duì)一名12歲的兒童實(shí)施該測(cè)驗(yàn)后,iq為110,那么他的真分?jǐn)?shù)在95的可靠度要求下,變動(dòng)范圍應(yīng)是多大? n注意幾點(diǎn):n(1)se對(duì)真分?jǐn)?shù)做的是區(qū)間估計(jì),不可能由此得到一個(gè)確切的點(diǎn)。這就是說(shuō),測(cè)驗(yàn)分?jǐn)?shù)不是一個(gè)定點(diǎn),而是具有一定的分布范圍。因此,兩次測(cè)驗(yàn)分?jǐn)?shù)之間存在差異是很正常的。n(2)置信水平確定后,估計(jì)的精度主要取決于se,se越小

6、,范圍越小,估計(jì)就越精確,反之也然。n(3)真分?jǐn)?shù)不能等同于真正能力或心理特質(zhì),真分?jǐn)?shù)中包括了系統(tǒng)誤差。 n3.用來(lái)對(duì)兩種測(cè)驗(yàn)分?jǐn)?shù)進(jìn)行比較n來(lái)自不同測(cè)驗(yàn)的原始分?jǐn)?shù)是無(wú)法直接進(jìn)行比較的,只有將它們轉(zhuǎn)換成相同尺度的標(biāo)準(zhǔn)分?jǐn)?shù)才能進(jìn)行比較。n如,某班期末考試,小明的數(shù)學(xué)成績(jī)是80分,語(yǔ)文成績(jī)是70分。另外,已知小明所在班級(jí)的數(shù)學(xué)平均成績(jī)是70分,標(biāo)準(zhǔn)差是10分,語(yǔ)文平均成績(jī)是60分,標(biāo)準(zhǔn)差是7分 。n我們可以用“差異的標(biāo)準(zhǔn)誤”來(lái)檢驗(yàn)差異的顯著性。n差異的標(biāo)準(zhǔn)誤的公式為:n (公式55)n 為差異的標(biāo)準(zhǔn)誤,s為相同尺度的標(biāo)準(zhǔn)分?jǐn)?shù)的標(biāo)準(zhǔn)差,z分?jǐn)?shù)為1,t分?jǐn)?shù)為10。 、 分別為兩個(gè)測(cè)驗(yàn)的信度系數(shù)。n先將原

7、始分?jǐn)?shù)化成標(biāo)準(zhǔn)分?jǐn)?shù),然后將兩個(gè)標(biāo)準(zhǔn)分?jǐn)?shù)的差異與1.96sed(0.05顯著性水平)進(jìn)行比較,如果其絕對(duì)值大于此值,則差異顯著,否則差異不顯著。yyxxdrrssesese22221dseyyrxxrn例2,某校五年級(jí)進(jìn)行了兩次數(shù)學(xué)測(cè)驗(yàn),小張第一次考了85分,此次數(shù)學(xué)測(cè)驗(yàn)?zāi)昙?jí)平均分是77分,標(biāo)準(zhǔn)差是8分,此次測(cè)驗(yàn)的信度系數(shù)是0.84;第二次考了95分,此次數(shù)學(xué)測(cè)驗(yàn)?zāi)昙?jí)平均分是81分,標(biāo)準(zhǔn)差是10分,此次測(cè)驗(yàn)的信度系數(shù)是0.91;問(wèn)小張這兩次數(shù)學(xué)測(cè)驗(yàn)的成績(jī)是否有顯著差異? n backn一、再測(cè)信度n二、復(fù)本信度n三、等值穩(wěn)定性系數(shù)n四、內(nèi)部一致性系數(shù) n五、評(píng)分者信度 n總結(jié)總結(jié)n練習(xí)練習(xí)n b

8、ackn再測(cè)信度(test-retest reliability) ,也叫重測(cè)信度,也叫穩(wěn)定性系數(shù)。用同一個(gè)測(cè)驗(yàn),對(duì)同一組被試前后施測(cè)兩次,對(duì)兩次測(cè)驗(yàn)分?jǐn)?shù)求相關(guān),其相關(guān)系數(shù)就叫再測(cè)信度。其計(jì)算公式(皮爾遜積差相關(guān)公式的變式)為:n (公式56)n式中x1、x2為同一被試的兩次測(cè)驗(yàn)分?jǐn)?shù), 、 為全體被試兩次測(cè)驗(yàn)的平均數(shù),s1、s2為兩次測(cè)驗(yàn)的標(biāo)準(zhǔn)差,n為被試人數(shù)。n再測(cè)法的模式是:施測(cè) 適當(dāng)時(shí)距 再施測(cè)212121ssxxnxxrxx1x2xn例2:假設(shè)有一份主觀幸福感調(diào)查表,先后兩次施測(cè)于10名學(xué)生,時(shí)間間隔為半年,結(jié)果如表所示,求該測(cè)驗(yàn)的重測(cè)信度。(為了便于理解和計(jì)算,本章估計(jì)信度的例子都是

9、小樣組,實(shí)際應(yīng)用時(shí)應(yīng)采用大樣組。)n表51 某幸福感調(diào)查表的兩次測(cè)試結(jié)果n 測(cè)驗(yàn)被試12345678910x1 16151313111010987x21616141211911867n計(jì)算再測(cè)信度必須注意幾個(gè)問(wèn)題:n(1)所測(cè)量的特性必須是穩(wěn)定的。當(dāng)然絕對(duì)的穩(wěn)定是不可能的,但應(yīng)該是比較穩(wěn)定的。n(2)遺忘和練習(xí)的效果基本上相互抵消。n在做第一次測(cè)驗(yàn)時(shí),被試可能會(huì)獲得某種技巧,但只要間隔時(shí)間適度,這種練習(xí)的效果會(huì)基本上被遺忘掉。n再測(cè)信度要考慮時(shí)間間隔的問(wèn)題。到底多長(zhǎng)合適呢?一般來(lái)說(shuō),無(wú)論對(duì)于那種被試,初測(cè)與再測(cè)的間隔最好不要超過(guò)六個(gè)月。 n(3)再測(cè)法適用于速度測(cè)驗(yàn)而不適用于難度測(cè)驗(yàn)。 n(4

10、)應(yīng)注意提高被試者的積極性。 back n復(fù) 本 信 度 ( a l t e r n a t e f o r m reliability),也稱等值性系數(shù)(coefficient of equivalence)n用兩個(gè)平行(等值)的測(cè)驗(yàn)對(duì)同一組被試施測(cè),得到兩組測(cè)驗(yàn)分?jǐn)?shù),求這兩組測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù),這就是復(fù)本信度。因?yàn)檫@反應(yīng)了兩個(gè)測(cè)驗(yàn)的等值程度,因此又稱等值性系數(shù)。計(jì)算方法與再測(cè)法是一樣的。n復(fù)本信度的模式是:復(fù)本a 最短時(shí)距 復(fù)本b n例3:假設(shè)用a、b兩型創(chuàng)造力復(fù)本測(cè)驗(yàn)對(duì)初中一年級(jí)10個(gè)學(xué)生施測(cè)。結(jié)果見(jiàn)表52。n表52 某創(chuàng)造力復(fù)本測(cè)驗(yàn)測(cè)試結(jié)果 測(cè)驗(yàn)被試12345678910x1 2019

11、1918171614131210x22020181615171211139n復(fù)本信度應(yīng)用時(shí)應(yīng)注意以下幾點(diǎn):n(1)復(fù)本信度的關(guān)鍵在于兩個(gè)量表必須等值,即必須具有相同的難度、區(qū)分度、長(zhǎng)度、題型等。 n(2)兩次測(cè)驗(yàn)的時(shí)距應(yīng)盡可能短促,以便避免知識(shí)的積累、練習(xí)效應(yīng)等因素的影響。 n(3)由于量表的兩個(gè)復(fù)份在許多方面近似,所以信度系數(shù)有稍稍偏高的傾向。 n(4)被試易出現(xiàn)疲勞、失去積極性等反應(yīng),還會(huì)出現(xiàn)遷移。這些稱為順序效應(yīng),為了抵消順序效應(yīng),可隨機(jī)分配一半被試先做復(fù)本a再做復(fù)本,另一半被試先做復(fù)本再做復(fù)本a,以平衡順序效應(yīng)。n(5)復(fù)本法只能減少而不能完全排除練習(xí)和記憶的影響。n(6)對(duì)于許多測(cè)驗(yàn)

12、來(lái)說(shuō),建立復(fù)本是相當(dāng)困難的。 backn三、等值穩(wěn)定性系數(shù)n等值穩(wěn)定性系數(shù)是用兩個(gè)平行的(等值的)測(cè)驗(yàn),間隔適當(dāng)時(shí)距施測(cè)于同一組被試得到兩組測(cè)驗(yàn)分?jǐn)?shù),求這兩組測(cè)驗(yàn)分?jǐn)?shù)的相關(guān),其相關(guān)系數(shù)就是等值穩(wěn)定性系數(shù)。n等值穩(wěn)定性系數(shù)的模式是:n測(cè)驗(yàn)a 適當(dāng)時(shí)距 測(cè)驗(yàn)bn計(jì)算方法同穩(wěn)定性系數(shù)和等值性系數(shù)。n等值穩(wěn)定性系數(shù)也是采用復(fù)本對(duì)被試施測(cè),但等值性系數(shù)的測(cè)驗(yàn)要求兩次測(cè)驗(yàn)的時(shí)間間隔盡可能短,而計(jì)算等值穩(wěn)定性系數(shù)的兩次測(cè)驗(yàn)卻要求有一個(gè)適當(dāng)?shù)臅r(shí)距。 n優(yōu)點(diǎn):n(1)因兩次測(cè)試有適當(dāng)?shù)臅r(shí)間間隔,減少了復(fù)本法中的練習(xí)、疲勞效應(yīng)。n(2)只要時(shí)間間隔適當(dāng),可用于計(jì)算穩(wěn)定性不高的心理特質(zhì)的測(cè)驗(yàn)的信度。n注意:n等值穩(wěn)

13、定性信度系數(shù)的值一般要比等值性系數(shù)和穩(wěn)定性系數(shù)要低。n等值穩(wěn)定性系數(shù)是測(cè)驗(yàn)信度的最嚴(yán)格的考察,得到的是信度系數(shù)的下限。n backn利用一次測(cè)驗(yàn)所獲得的資料來(lái)計(jì)算信度系數(shù)。這樣計(jì)算出來(lái)的信度系數(shù)反應(yīng)的是測(cè)驗(yàn)內(nèi)部的一致性,即測(cè)驗(yàn)項(xiàng)目的同質(zhì)性,叫做內(nèi)部一致性系數(shù)或同質(zhì)性系數(shù)。n(一)分半法(分半信度) n(二)其它計(jì)算內(nèi)部一致性系數(shù)的方法 n back n分半信度(split-half reliability):分半信度就是將測(cè)驗(yàn)題目分成等值的兩半,分半求出量表題目的總分,再計(jì)算兩部分總分的相關(guān)系數(shù)。 n分半的方法很多,常見(jiàn)的方法是把一個(gè)量表按題目番號(hào)分為兩半,一半是奇數(shù)題,另一半數(shù)偶數(shù)題。求出每

14、個(gè)人的奇數(shù)題的總得分和偶數(shù)題的總得分,然后求出奇數(shù)題總得分和偶數(shù)題總得分的相關(guān)系數(shù),最后對(duì)相關(guān)系數(shù)進(jìn)行校正。 n校正公式有:n(1)斯皮爾曼布朗(spearman-brown)公式(公式57)n 式中, 是兩半測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù),為整個(gè)測(cè)驗(yàn)的信度估計(jì)值。 hhhhxxrrr12hhrxxrn 采用斯皮爾曼布朗(spearman-brown)公式進(jìn)行校正時(shí),假定兩半測(cè)驗(yàn)等值,亦即兩半測(cè)驗(yàn)具有相同的平均數(shù)和標(biāo)準(zhǔn)差。當(dāng)假定不能滿足時(shí),可以采用下面兩個(gè)公式來(lái)估計(jì)信度。n弗朗那根公式:n (公式58)n式中, 、 分別為兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù), 為測(cè)驗(yàn)總分的變異數(shù)。r為信度值。 xbasssr22212a

15、s2bs2xs2n盧倫公式:n (公式59)n式中, 為兩半測(cè)驗(yàn)分?jǐn)?shù)之差的變異數(shù), 為測(cè)驗(yàn)總分的變異數(shù)。r為信度值。 xdssr221 ds2xs2n例4:有一個(gè)由100題構(gòu)成的量表施測(cè)于10個(gè)高三學(xué)生。測(cè)驗(yàn)一次后,應(yīng)試者即畢業(yè)離?!,F(xiàn)在怎樣評(píng)介測(cè)驗(yàn)結(jié)果的信度? n(1)計(jì)算出每個(gè)應(yīng)試者的奇數(shù)題總分(x1)和偶數(shù)題總分(x2),見(jiàn)表53。n 得分被試12345678910x1 38373841403638394035x237373639393438393936n采用分半信度應(yīng)注意以下幾個(gè)問(wèn)題:n(1)若用分半法時(shí),以按奇數(shù)題和偶數(shù)題分半為宜。n(2)在使用斯皮爾曼布朗公式時(shí)要求全體被試在兩半測(cè)

16、驗(yàn)上的得分的變異數(shù)相等。當(dāng)一個(gè)測(cè)驗(yàn)不宜分成對(duì)等的兩半時(shí)分半信度不宜采用。n(2)當(dāng)試卷中存在任選題時(shí),不宜采用分半法。速度測(cè)驗(yàn)也不宜采用分半法。因?yàn)樗俣葴y(cè)驗(yàn)中試題的難度低,被試得分的多少主要是看答題的多少,分半法易使得分相同,從而夸大分半法的信度估計(jì)。n(3)如遇到有牽連的項(xiàng)目或一組解決同一問(wèn)題的項(xiàng)目時(shí),這些項(xiàng)目應(yīng)放在同一半,否則會(huì)高估信度的值。n(4)將一個(gè)測(cè)驗(yàn)分成兩半的方法很多(如,按題號(hào)的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半等),因此,一個(gè)測(cè)驗(yàn)可以有多個(gè)分半信度值。提供分半信度值時(shí),要說(shuō)明分半的方法。n backn分半法實(shí)際上是對(duì)測(cè)驗(yàn)內(nèi)部一致性的一個(gè)粗略估計(jì)。但對(duì)于同一個(gè)測(cè)驗(yàn)分

17、半的方法是很多的,而且用不同的分半方法求出的分半信度都不一樣,因此分半信度不是最好的內(nèi)部一致性的估計(jì)。為了彌補(bǔ)分半法的不足,可以采用其它的方法。 n1.庫(kù)德理查遜公式(kr20公式)n庫(kù)德(kuder)、理查遜(richardson)針對(duì)分半法的不足,提出以項(xiàng)目統(tǒng)計(jì)量為轉(zhuǎn)移,利用項(xiàng)目統(tǒng)計(jì)量來(lái)計(jì)算信度。稱為k-r20公式。n (公式510)n式中k表示構(gòu)成測(cè)驗(yàn)的題目數(shù),pi為通過(guò)第i題的人數(shù)比例,qi為未通過(guò)第i題的人數(shù)比例, 為測(cè)驗(yàn)總分的變異數(shù)。 xiikrsqpkkr22011xs2n例5:有一種包含6個(gè)問(wèn)題的測(cè)驗(yàn),10個(gè)應(yīng)試者的得分如表54(答對(duì)得1分,答錯(cuò)得0分),試估計(jì)應(yīng)試者反應(yīng)的一致

18、性程度。 n2. 庫(kù)德理查遜另一公式(kr21公式)n當(dāng)測(cè)驗(yàn)項(xiàng)目難度接近時(shí)可以采用庫(kù)德理查遜提出的簡(jiǎn)便公式,稱為kr21公式。nkr21公式為:n (公式511)n式中k表示構(gòu)成測(cè)驗(yàn)的題目數(shù), 為測(cè)驗(yàn)總分的平均數(shù), 為測(cè)驗(yàn)總分的變異數(shù)。xxkrskxkxksr2221) 1()(xs2xn3.克倫巴赫(cronbach)的系數(shù)n庫(kù)德理查遜公式只適用于兩級(jí)記分的測(cè)驗(yàn),而對(duì)多級(jí)記分的測(cè)驗(yàn),則可以采用克倫巴赫(cronbach)的系數(shù),克倫巴赫的系數(shù)對(duì)兩級(jí)記分的測(cè)驗(yàn)也是適用的。其計(jì)算公式為:n (公式511)n式中,k為測(cè)驗(yàn)的題目數(shù), 為某一測(cè)驗(yàn)題目分?jǐn)?shù)的變異數(shù), 為測(cè)驗(yàn)總分的變異數(shù)。xisskk2

19、211is2xs2n例6:有一種包含6個(gè)論文式題目的測(cè)驗(yàn),對(duì)5個(gè)應(yīng)試者施行,得分見(jiàn)下表55,試求該測(cè)驗(yàn)的信度。 n表 5-5 被試在測(cè)驗(yàn)上的得分n 題號(hào)被試abcde17118111126978936106894811683571181111671181111n五、評(píng)分者信度(scorer reliability)評(píng)分者信度:隨機(jī)抽取部分試卷,由兩個(gè)或多個(gè)評(píng)分者獨(dú)立按評(píng)分標(biāo)準(zhǔn)打分,然后求其間的相關(guān),所得的相關(guān)系數(shù)即為評(píng)分者信度。 n評(píng)分者信度的計(jì)算:n1.評(píng)分者為兩個(gè)人時(shí)n若是連續(xù)變量的評(píng)分,且分布是正態(tài)則計(jì)算皮爾遜積差相關(guān)系數(shù)(可用計(jì)算機(jī)直接計(jì)算)。n若是等級(jí)評(píng)定或雖是等距或等比的數(shù)據(jù)但分布

20、非正態(tài),則計(jì)算斯皮爾曼等級(jí)相關(guān)。n斯皮爾曼等級(jí)相關(guān)公式:n (公式512)n式中d為各對(duì)偶等級(jí)之差, 是各d平方之和,n為等級(jí)數(shù)目。) 1(6122nndrr2dn當(dāng)有相同的等級(jí)出現(xiàn)時(shí),計(jì)算斯皮爾曼等級(jí)相關(guān)的公式為:n (公式513)n , ;n , n式中,n為成對(duì)數(shù)據(jù)數(shù)目,n為相等等級(jí)數(shù)目。 222222yxdyxrrcxcnnx123212) 1(2nncxycnny123212) 1(2nncyn例7:甲乙兩位教師評(píng)閱10份試卷,他們對(duì)每一試卷各自所評(píng)的分?jǐn)?shù)列入下表56,問(wèn)這兩位教師評(píng)分的一致性如何?n表 56 兩位教師對(duì)10份試卷的評(píng)分試卷得分名次甲評(píng)分乙評(píng)分甲評(píng)分乙評(píng)分a9493b

21、9092c8692d8670e7282f7076g6865h6676i6468j6160n2.2.評(píng)分者為多個(gè)時(shí)評(píng)分者為多個(gè)時(shí)n采 用 肯 德 爾 和 諧 系 數(shù) ( k e n d a l l coefficient of concordance)來(lái)估計(jì)信度系數(shù)n (公式514)n式中,w為和諧系數(shù),k為評(píng)分者人數(shù),n為被評(píng)對(duì)象數(shù),ri為每一對(duì)象被評(píng)的等級(jí)之和。nnknrrwii3222121n出現(xiàn)相同等級(jí)時(shí)采用下面的公式:n (公式515)n式中,w為和諧系數(shù),k為評(píng)分者人數(shù),n為被評(píng)對(duì)象數(shù),ri為每一對(duì)象被評(píng)的等級(jí)之和,n為相同等級(jí)數(shù)目。tknnknrrwii)(1213222123nn

22、tn例8:六位教師各自評(píng)閱相同的五篇作文,每位教師給每一篇作文都評(píng)了等級(jí)(共五等),并列入下表57。求六位老師所評(píng)等級(jí)的一致性程度。n表5-7評(píng)分者k6試卷編號(hào)(n=5)12345a35241b35241c34152d35142e35241f35241riri2n例9:三位教師評(píng)閱四份試卷,所評(píng)等級(jí)列入下表58。他們所評(píng)的等級(jí)的一致性程度怎樣?評(píng)卷教師k3作文編號(hào)(n4)1234張3142王2141李2232rin3.肯德?tīng)柡椭C系數(shù)w的檢驗(yàn)n(1)當(dāng)3 n 7時(shí),查心理與教育統(tǒng)計(jì)學(xué)的附表10,肯德?tīng)杦系數(shù)顯著性臨界n值表,用 值查表。n(2)當(dāng)n 7,將所得w值代入下式n (公式516)n n

23、查卡方分布表。 backnrrsii22wnk) 1(21 ndfn總結(jié):n再測(cè)信度:估計(jì)信度中跨時(shí)間的一致性n復(fù)本信度:估計(jì)測(cè)驗(yàn)跨形式的一致性n等值穩(wěn)定性系數(shù):估計(jì)測(cè)驗(yàn)跨時(shí)間和形式的一致性n內(nèi)部一致性系數(shù):估計(jì)測(cè)驗(yàn)跨項(xiàng)目或兩個(gè)分半測(cè)驗(yàn)之間的一致性n評(píng)分者信度:估計(jì)測(cè)驗(yàn)跨評(píng)分者的一致性n各種方法具有不同的意義,每一種信度系數(shù)不能代替其他的信度系數(shù),所以編制或使用測(cè)驗(yàn)時(shí),應(yīng)該盡可能收集各種信度證據(jù)。 back n一、分?jǐn)?shù)分布范圍的影響n 相關(guān)系數(shù)受分?jǐn)?shù)分布范圍的影響,圖51表明了分?jǐn)?shù)范圍對(duì)相關(guān)系數(shù)的影響。第一次測(cè)驗(yàn)驗(yàn)測(cè)次二第n其分?jǐn)?shù)范圍越廣,信度系數(shù)就越大。反之也然。 n上述關(guān)系也可從公式n中看

24、出,一個(gè)測(cè)驗(yàn)的誤差變異主要來(lái)自主試、施測(cè)環(huán)境、評(píng)分的客觀性、被試等因素,當(dāng)除被試外的另一些因素固定后,受測(cè)團(tuán)體越是異質(zhì),所得分?jǐn)?shù)變異越大,信度系數(shù)越大。因此,信度系數(shù)與團(tuán)體的異質(zhì)性有關(guān)。 221xexxssrn團(tuán)體異質(zhì)性不同,分?jǐn)?shù)的標(biāo)準(zhǔn)差亦不同。當(dāng)將測(cè)驗(yàn)用于標(biāo)準(zhǔn)差不同的團(tuán)體時(shí),可用下面的公式(克萊公式)推算出新的信度系數(shù):n (公式517)n式中s0為信度系數(shù)已知的分布的標(biāo)準(zhǔn)差,sn為信度系數(shù)未知的分布的標(biāo)準(zhǔn)差,r00為原團(tuán)體的信度,rnn為異質(zhì)程度不同的團(tuán)體的信度。20020)1 (1nnnsrsrn例10:一記憶力測(cè)驗(yàn)實(shí)施于某市全體初中生,其分?jǐn)?shù)的標(biāo)準(zhǔn)差為10,信度系數(shù)為0.90,若將該測(cè)

25、驗(yàn)施測(cè)于初二年級(jí),其分?jǐn)?shù)的標(biāo)準(zhǔn)差為6。求初二年級(jí)的信度系數(shù)的估計(jì)值。n由于信度系數(shù)與被試樣本的異質(zhì)程度有關(guān),因此,在編制測(cè)驗(yàn)時(shí),應(yīng)把常模團(tuán)體按年齡、性別、文化程度、職業(yè)、愛(ài)好等分為更為同質(zhì)的亞團(tuán)體,并分別報(bào)告每個(gè)亞團(tuán)體的信度系數(shù),這樣測(cè)驗(yàn)才能適用于各種團(tuán)體。 n二、測(cè)驗(yàn)長(zhǎng)度的影響n測(cè)驗(yàn)的長(zhǎng)度,即題目的數(shù)量,也是影響信度系數(shù)的一個(gè)因素。n題目數(shù)量越多,信度越高。 n增加測(cè)驗(yàn)長(zhǎng)度的效果可以用斯皮爾曼布朗公式的通式來(lái)計(jì)算:n (公式518)n式中k為改變后的長(zhǎng)度與原來(lái)長(zhǎng)度之比,為原測(cè)驗(yàn)的信度, 為測(cè)驗(yàn)長(zhǎng)度是原來(lái)的k倍時(shí)的信度估計(jì)。xxxxkkrkkrr) 1(1xxrkkrn例11:有一個(gè)包括10個(gè)題目的測(cè)驗(yàn),信度為0.50,若把測(cè)驗(yàn)增加到50個(gè)題目,其信度將增加到多少? n用同樣方法可以算出題目數(shù)量繼續(xù)增加時(shí)相關(guān)系數(shù)的值見(jiàn)表59n表59 題目數(shù)量對(duì)相關(guān)系數(shù)的影響題 目數(shù)量1050100200300400500相 關(guān)系數(shù)0.500.830.910.950.9680.9760.980n由表5-9可以看出,增加題目數(shù)量可以提高信度,但并非多多益善。測(cè)驗(yàn)過(guò)長(zhǎng)是得不償失的:(1)測(cè)驗(yàn)過(guò)長(zhǎng),編制測(cè)驗(yàn)要浪費(fèi)較多的時(shí)間和

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論