特殊兒童測驗(yàn)的信度與效度分析-信度檢測_第1頁
特殊兒童測驗(yàn)的信度與效度分析-信度檢測_第2頁
特殊兒童測驗(yàn)的信度與效度分析-信度檢測_第3頁
特殊兒童測驗(yàn)的信度與效度分析-信度檢測_第4頁
特殊兒童測驗(yàn)的信度與效度分析-信度檢測_第5頁
已閱讀5頁,還剩100頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

測量的信度信度(reliability):測量結(jié)果的穩(wěn)定性程度。定義1:一組測量分?jǐn)?shù)的真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)得變異數(shù)的比率定義2:一組測量分?jǐn)?shù)的真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)相關(guān)系數(shù)的平方定義3:一個測驗(yàn)與任一個平行測驗(yàn)的相關(guān)系數(shù)信度的作用1、評價測驗(yàn)的好壞,反映隨機(jī)誤差的大小。注:系統(tǒng)誤差與信度無關(guān)。2、解釋個人測驗(yàn)的分?jǐn)?shù),X–1.96SE≤T≤X+1.96SE,標(biāo)準(zhǔn)誤SE=,Sx:所得分?jǐn)?shù)標(biāo)準(zhǔn)差,rxx:測驗(yàn)信度。3、比較兩種測驗(yàn),差異的標(biāo)準(zhǔn)誤SEd=S:相同尺度標(biāo)準(zhǔn)分?jǐn)?shù)的標(biāo)準(zhǔn)差,rxx,rYY:兩個測驗(yàn)的信度。信度系數(shù)的估計重測信度:同一個測驗(yàn)對同一組被試施測兩次,兩次測驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)。前提:測量的心理特質(zhì)必須穩(wěn)定,遺忘與練習(xí)效果基本抵消,兩次施測間隔期間被試沒有更多的學(xué)習(xí)或訓(xùn)練。優(yōu)缺點(diǎn):能提供測驗(yàn)結(jié)果是否隨時間變化,預(yù)測被試將來行為的依據(jù)。容易受練習(xí)、記憶的影響。副本信度:同一組被試在兩個平行測驗(yàn)上得分的相關(guān)系數(shù)。同時施測:等值性系數(shù)前后施測:穩(wěn)定性與等值性系數(shù)前提:兩份測驗(yàn)在題目內(nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語、完成時間等相似。在時間、成本上要有條件做兩個測驗(yàn)。優(yōu)缺點(diǎn):只能減少而不能完全排除練習(xí)、記憶的影響。平行測驗(yàn)難找。分半信度:將一個測驗(yàn)分成相等的兩半,被試在這兩半測驗(yàn)得分的相關(guān)系數(shù)。計算時注意校正:兩半方差同質(zhì):斯皮爾曼-布朗公式:r=2rhh/(1+rhh),rhh:兩半分?jǐn)?shù)間的相關(guān)系數(shù)。兩半方差不同質(zhì):弗朗那根(Flanagan)公式:盧侖(Rulon)公式:Sa2、Sb2:兩半測驗(yàn)的方差,Sd2:兩測驗(yàn)分?jǐn)?shù)差的方差前提:一次施測,沒有副本,測驗(yàn)可分成兩半。特點(diǎn):同一測驗(yàn)可以有多個分半信度值。同質(zhì)性信度:測驗(yàn)內(nèi)部所有題目的一致性程度。評分者信度:多個評分者給同一批被試評分的一致性程度??系聽柡椭C系數(shù)信度的影響因素被試越異質(zhì),信度越高rn=ro:原被試信度,So2:原被試方差,Sn2:新被試方差

信度的影響因素條目數(shù)適當(dāng)增加,信度提高rkk=K:測驗(yàn)改變后長度與原長度之比,rxx:原測驗(yàn)信度,rkk:新測驗(yàn)信度團(tuán)體平均水平太高或太低,信度降低主試不按規(guī)定施測,評分標(biāo)準(zhǔn)不一,信度降低測試情境測驗(yàn)條目越多,信度越高,時間過長,信度降低,難度過大或過易,信度降低兩次測驗(yàn)間隔時間越短,信度越高信度改進(jìn)適當(dāng)增加測驗(yàn)長度難度接近正態(tài)分布,控制在中等水平提高項(xiàng)目區(qū)分度選取恰當(dāng)?shù)谋辉噲F(tuán)體主試、評分者、場地歷年真題(華東師大2002)某測驗(yàn)的被試為2—5年級的小學(xué)生,已知信度是0.85,標(biāo)準(zhǔn)差為10,現(xiàn)欲知道僅用于4年級時信度是多少,4年級的標(biāo)準(zhǔn)差是5。歷年真題(華南師大2001)已知某量表的分半信度為0.63,請算出原長度的信度系數(shù)。 解:rkk==1.26/1.63=0.77歷年真題將測驗(yàn)對等分半后,兩半測驗(yàn)得分的相關(guān)系數(shù)為0.60,校正后該測驗(yàn)的分半信度是(B)(2007,全國統(tǒng)考) A.0.70B.0.75C.0.80D.0.85什么是測驗(yàn)的信度?影響信度的主要因素有哪些?(2007,全國統(tǒng)考) 答:(1)信度是測量結(jié)果的穩(wěn)定性或一致性程度。 (2)影響因素:被試、主試、施測情境、測量工具、施測時間間隔、評分計分測量的信度與效度本章提要:信度的概念與估計方法提高信度的方法效度及其與信度的關(guān)系效度的種類與估計方法提高效度的方法第一節(jié)測量信度一、什么是信度1.信度的描述定義信度(reliability)是指測量結(jié)果的穩(wěn)定性和可靠性程度。2.信度的測量學(xué)定義(操作性定義)3.誤差方差與信度的關(guān)系二、信度的估計方法(一)重測信度(test-retestreliability)1.含義與計算重測信度是指用同一量表對同一組被試測試兩次所得結(jié)果的一致程度,其大小等于同一組被試在兩次測驗(yàn)上所得分?jǐn)?shù)的積差相關(guān)系數(shù)。即:2.重測信度使用的條件(1)所測量的心理特質(zhì)必須是穩(wěn)定的(2)遺忘和練習(xí)的效果基本上相互抵消(3)在兩次測試時間間隔內(nèi),被試在所要測查的心理特質(zhì)方面沒有其他的學(xué)習(xí)和練習(xí)3.計算重測信度應(yīng)注意的問題(1)兩次測驗(yàn)時間間隔要適當(dāng)(2)應(yīng)提高被試的積極性(3)適宜于人格測驗(yàn)與速度測驗(yàn),不適合于智力等難度測驗(yàn)(二)復(fù)本信度(Alternate-formreliability)1.含義與計算是指兩個平行測驗(yàn)測量同一批被試所得結(jié)果的一致程度,其大小等于同一組被試在兩個復(fù)本測驗(yàn)上所得分?jǐn)?shù)的積差相關(guān)系數(shù)。計算公式同重測信度。兩個復(fù)本測驗(yàn)實(shí)施的時間不同,復(fù)本信度所表達(dá)的含義略有不同。(1)等值性系數(shù)如果兩個復(fù)本測驗(yàn)是同時連續(xù)測試的,則稱這種復(fù)本信度為等值性系數(shù)。等值性系數(shù)的大小主要反映著兩個復(fù)本測驗(yàn)的題目差別帶來的變異情況。(2)穩(wěn)定性與等值性系數(shù)如果兩個復(fù)本測驗(yàn)是相距一段時間分兩次測試,則稱這種復(fù)本信度為穩(wěn)定性與等值性系數(shù)。此時兩個題目間的差別、兩次施測情境、被試特質(zhì)水平等方面的差別都會成為測驗(yàn)結(jié)果不一致的原因。2.復(fù)本信度使用的條件(1)兩個測驗(yàn)必須在項(xiàng)目的內(nèi)容、形式、數(shù)量、難易、時限、指導(dǎo)語等方面相同或相似。(2)兩次測驗(yàn)的時間間隔要適當(dāng)。局限:(1)復(fù)本法只能減少而不能排除練習(xí)和記憶效應(yīng)。(2)對于許多測驗(yàn)來說要建立復(fù)本是非常困難的。(三)分半信度(Split-halfreliability)1.含義與計算是指將一個測驗(yàn)分成對等的兩半后,所有被試在這兩半上得分的一致性。分半信度信度與等值性系數(shù)的解釋一樣,即可以把對等的兩半測驗(yàn)看成是最短時距內(nèi)施測的兩個平行測驗(yàn)。分半信度描述的是兩半題目間的一致性,所以也叫內(nèi)部一致性系數(shù)。注意題目分半的方法:按題號奇偶性分半、按題目難度分半、按題目內(nèi)容分半等。計算方法與復(fù)本信度類似,但被試在兩半測驗(yàn)上得分的相關(guān)系數(shù)只是半個測驗(yàn)的信度,所以必須用斯皮爾曼—布朗公式加以校正:2.使用的前提條件和范圍分半信度通常是在只能施測一次或沒有復(fù)本的情況下使用。其中使用斯皮爾曼—布朗公式時要求全體被試在兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)相等。當(dāng)測驗(yàn)無法分成對等的兩半時,無法使用。(四)同質(zhì)性信度(Homogeneityreliability)1.含義同質(zhì)性信度也叫內(nèi)部一致性系數(shù),它是測驗(yàn)內(nèi)部所有題目間的一致性程度。這里的一致性有兩種含義:一是所有題目都測的是同一種心理特質(zhì),二是所有題目得分之間都具有較高的正相關(guān)。同質(zhì)性信度就是一個測驗(yàn)所測內(nèi)容或特質(zhì)的相同程度。實(shí)際上α系數(shù)是所有可能分半信度的平均值,但它是測驗(yàn)信度的一個下界值,即α系數(shù)值大,測量信度必然高,但α系數(shù)值小,卻不能判斷測量信度不高。例題:某態(tài)度量表共7道題目,100個被試在各題上得分的方差分別是0.81,0.82,0.80,0.86,0.88,0.79,0.89,測驗(yàn)總分的方差是26.00,計算該測量的信度。(五)評分者信度(Scorerreliability)1.含義與計算評分者信度指的是多個評分者給同一批人的答卷進(jìn)行評分的一致性程度。對于主觀試題,不同的評分者給出的分?jǐn)?shù)是不等的,這樣會造成誤差,如何降低評分者信度是心理測量的重要任務(wù)之一。當(dāng)評分者人數(shù)為2時,評分者信度等于兩個評分者給同一批被試答卷所給分?jǐn)?shù)的相關(guān)系數(shù)。如果是多個評分者,評分者信度采用肯德爾和諧系數(shù)進(jìn)行估計。三、信度的作用(一)評價測驗(yàn)信度是測量過程中所存在的隨機(jī)誤差大小的反映。信度低,測量隨機(jī)誤差大,測量結(jié)果就會與真分?jǐn)?shù)發(fā)生較大偏離。信度是衡量一個測驗(yàn)好壞的重要指標(biāo)之一,測驗(yàn)的信度達(dá)到多少才可以接受呢?一般來講,能力與成就測驗(yàn)的信度應(yīng)該在0.90以上,人格測量信度系數(shù)應(yīng)該在0.80以上。測量中的系統(tǒng)誤差與信度無關(guān)。(二)解釋分?jǐn)?shù)1.解釋個人測驗(yàn)分?jǐn)?shù)的意義從理論上講,一個人的真分?jǐn)?shù)本來是用同一測驗(yàn)對他反復(fù)施測所得的平均值,其誤差則是這些實(shí)測值的標(biāo)準(zhǔn)差。但實(shí)際上,這是做不到的。實(shí)際的做法是用一個團(tuán)體(人數(shù)足夠多)兩次施測得結(jié)果來代替對同一個人的反復(fù)施測,以估計測量誤差的變異數(shù)。此時每個人兩次測量的分?jǐn)?shù)之差構(gòu)成一個新的分布,這個分布的標(biāo)準(zhǔn)差就是測量的標(biāo)準(zhǔn)誤,它是此次測量中誤差大小的客觀指標(biāo),有了這一指標(biāo),就可以對團(tuán)體中任何一個人的測驗(yàn)成績做出恰當(dāng)?shù)慕忉尅?.不同測驗(yàn)分?jǐn)?shù)的比較四、影響測量信度的主要因素測量信度是測量過程中隨機(jī)誤差大小的反映,隨機(jī)誤差大,信度就低,隨機(jī)誤差小,信度就高。因此,在測量過程中凡是能引起測量隨機(jī)誤差的因素都會影響測量信度。影響信度的幾種主要因素為:(一)被試方面就單個被試而言,其身心健康狀況、應(yīng)試動機(jī)、注意水平、作答態(tài)度等會影響測量信度。就團(tuán)體而言,團(tuán)體的異質(zhì)程度與分?jǐn)?shù)的分布密切相關(guān),一個團(tuán)體越是異質(zhì),其分?jǐn)?shù)分布范圍越大,計算出來的信度系數(shù)值越高,這樣會高估真正的信度值。當(dāng)團(tuán)體內(nèi)部水平相差不大(同質(zhì))時,其得分分布必然會狹窄,以相關(guān)為基礎(chǔ)計算出來的信度值必然小,可能會低估真正的信度值。此外若團(tuán)體的平均數(shù)太高或太低,同樣使測驗(yàn)的總分分布變窄,低估測驗(yàn)的真正信度。(二)主試者方面就主試者而言,若不按指導(dǎo)手冊中的規(guī)定施測,或故意制造緊張氣氛,或給考生一定的暗示、協(xié)助等,測量信度會大大降低。就閱卷評分者而言,若評分標(biāo)準(zhǔn)掌握不一,或前后標(biāo)準(zhǔn)不統(tǒng)一,甚至隨心所欲,則也會降低測量信度。(三)施測情境方面實(shí)施測驗(yàn)時,環(huán)境是否安靜,光線和通風(fēng)狀況是否良好,所需設(shè)備是否齊全,桌面是否合乎要求等都可能影響到測量信度。(四)測量工具方面測量的取樣、測驗(yàn)的長度、難度等是影響測量信度的主要因素或關(guān)鍵因素。一般來說,測驗(yàn)越長,信度值越高。這是因?yàn)椋簻y驗(yàn)加長,能夠改進(jìn)項(xiàng)目取樣的代表性,從而能夠更好地反映受測者的真實(shí)水平。測驗(yàn)的項(xiàng)目越多,每個項(xiàng)目上得隨機(jī)誤差會相互抵消。測驗(yàn)太難或太容易,都會降低測驗(yàn)的信度。(五)兩次施測之間的時間間隔計算重測信度、穩(wěn)定性與等值性系數(shù)時,兩次測驗(yàn)相隔時間越短,其信度值可能會越大;兩次測驗(yàn)相隔時間越長,其信度值可能會越小。五、提高測量信度的常用方法(一)適當(dāng)增加測驗(yàn)的長度增加新項(xiàng)目必須與原試卷中的所有項(xiàng)目同質(zhì),新增項(xiàng)目必須適度。(二)使測驗(yàn)中題目的難度接近正態(tài)分布,并控制在中等難度(三)努力提高測驗(yàn)試題的區(qū)分度(四)選取適當(dāng)?shù)谋辉噲F(tuán)體(五)主試者嚴(yán)格按照要求去做同學(xué)好!仔細(xì)思考這些問題幫助我們更好理解本次課的內(nèi)容。為什么我們對特殊兒童測量的結(jié)果有差異?為什么我們不能每次對特殊兒童測量精確?為什么我們用不同的量表就有不同的結(jié)果?為什么有時間測量的結(jié)果與實(shí)際情況不符?為什么我們需要規(guī)定所有測驗(yàn)的都標(biāo)準(zhǔn)化?為什么我們規(guī)定給定測量結(jié)果一個區(qū)間值?誤差是由測量中與目的無關(guān)的因素引起的不準(zhǔn)確或不一致的效應(yīng)。由于各種原因,使我們對特殊兒童進(jìn)行測量時產(chǎn)生了測量誤差,使我們不能準(zhǔn)確地、穩(wěn)定地、全面地反映該特殊的本質(zhì)心理特征。

這種情況是無法完全避免的,只能采用數(shù)學(xué)的方法把它消去。

這種無法去除的東西,我們稱之為“誤差”。測驗(yàn)中隨機(jī)誤差、系統(tǒng)誤差、過失誤差總是錯綜復(fù)雜地存在著,因而造成了測驗(yàn)數(shù)據(jù)的波動性或變異性,使我們不能準(zhǔn)確測量。測量誤差可分為三類:隨機(jī)誤差是由于測驗(yàn)中的一些偶然因素引起,而又不容易控制的誤差。系統(tǒng)誤差就是觀測過程中服從確定規(guī)律性的誤差。由于測驗(yàn)條件不同,造成不同的有一定規(guī)律性的誤差。過失誤差。明顯歪曲實(shí)驗(yàn)結(jié)果的誤差成為過失誤差,它是由于實(shí)驗(yàn)觀測過程中的過失造成的。為控制各種誤差,為此必須要了解誤差的來源。測量的誤差來源:測驗(yàn)內(nèi)部測驗(yàn)內(nèi)部的誤差主要來源于題目取樣。施測過程物理環(huán)境主試者方面、意外干擾評分計分。受測者本身應(yīng)試動機(jī)測驗(yàn)焦慮學(xué)習(xí)、發(fā)展與教育測驗(yàn)經(jīng)驗(yàn)練習(xí)效應(yīng)反應(yīng)方式生理變化真分?jǐn)?shù)是一個非常重要的概念。測驗(yàn)真分?jǐn)?shù):真分?jǐn)?shù)的操作定義是:經(jīng)過無數(shù)次測量所得的平均值。用公式表示:X=T+EX為實(shí)得分?jǐn)?shù)或觀測分?jǐn)?shù),T是假設(shè)的真分?jǐn)?shù),E是測量誤差。這是在一個特定人身上實(shí)得分?jǐn)?shù)、真分?jǐn)?shù)和測量誤差之間的關(guān)系。測量誤差的性質(zhì):1.誤差可能是正的,也可能是負(fù)的。2.如果對一個人測量無數(shù)次,其平均誤差為0;3.真分?jǐn)?shù)和測量誤差是相互獨(dú)立的;4.誤差分?jǐn)?shù)和實(shí)得分?jǐn)?shù)的相關(guān)為0。一組測驗(yàn)分?jǐn)?shù)之間的變異性是由與測量目的有關(guān)的變異數(shù)、穩(wěn)定的但是出自無關(guān)來源的變異數(shù)和測量誤差變異數(shù)所決定的。在一個團(tuán)體中,由于每個人的誤差都是隨機(jī)的,方向不同,只要團(tuán)體足夠大,其誤差便會相互抵消。==一個團(tuán)體的平均真分?jǐn)?shù)該團(tuán)體中所有被試實(shí)得分?jǐn)?shù)的平均值測驗(yàn)的信度與效度分析——測驗(yàn)的信度同學(xué)好!上課前我們來思考幾個問題。如何減少對特殊兒童檢測的誤差?在檢測中誤差有什么明顯的特征?檢測結(jié)果分?jǐn)?shù)變化太大怎么處理?檢測結(jié)果與實(shí)際情況有差距怎辦?信度:指測量工具的穩(wěn)定性、一致性。不要理解成可信程度。測驗(yàn)的信度:定義指的是測量結(jié)果的穩(wěn)定性程度(或叫可靠性)。也指同一被試在不同時間內(nèi)用同一測驗(yàn)(或用另一套相等的測驗(yàn))重復(fù)測量,所得結(jié)果的一致程度。理論定義傳統(tǒng)的信度理論認(rèn)為,每一個測驗(yàn)的實(shí)得分?jǐn)?shù)(X)總是由真實(shí)分?jǐn)?shù)(T)和誤差(E)兩個部份構(gòu)成的。公式為:X=T+E操作定義一組測量分?jǐn)?shù)的真分?jǐn)?shù)變異數(shù)(方差ST2)與總變異數(shù)(總方差、實(shí)得分?jǐn)?shù)的方差SX2)的比率,或者是真實(shí)分?jǐn)?shù)方差占總方差的的百分比。rxx=ST2/SX2你理解了三者之間的關(guān)系了嗎。信度的指標(biāo):信度系數(shù)真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值,公式是:rxx=ST/SX=ptx2信度指數(shù)真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)的標(biāo)準(zhǔn)差的比值。信度指數(shù)的平方就是信度系數(shù)。標(biāo)準(zhǔn)誤個人測驗(yàn)分?jǐn)?shù)的變異量。測量的標(biāo)準(zhǔn)誤與信度之間呈反比關(guān)系。用一組被試兩次測量結(jié)果來代替同一個人反復(fù)實(shí)測。共有4種解釋,都非常重要。信度與測驗(yàn)分?jǐn)?shù)的解釋:解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)比較信度可以接受的水平解釋個人分?jǐn)?shù)的意義比較不同測驗(yàn)分?jǐn)?shù)的差異信度系數(shù)可以解釋為總的方差中有多少比例是由真實(shí)分?jǐn)?shù)的方差決定的,也就是測驗(yàn)的總變異中真分?jǐn)?shù)造成的變異占百分之幾。一般的能力測驗(yàn)和成就測驗(yàn)的信度系數(shù)都在0.90以上;人格測驗(yàn)、興趣、態(tài)度、價值觀等測驗(yàn)的信度一般在0.80-0.85。一是估計真實(shí)分?jǐn)?shù)的范圍;二是了解實(shí)得分?jǐn)?shù)再測時可能的變化情形。評價兩個不同測驗(yàn)的分?jǐn)?shù)是否有明顯差異。比較包括兩個人不同分?jǐn)?shù)的差別和同一被試在兩個測驗(yàn)上的差別。這個例題是估計真實(shí)分?jǐn)?shù)的范圍!例題一:假設(shè)在一個智力測驗(yàn)中某個被試的IQ為100,這是否反映了他的真實(shí)水平?如果再測一次他的分?jǐn)?shù)將改變多少?已知該智力測驗(yàn)的標(biāo)準(zhǔn)差是15,信度系數(shù)為0.89,則其IQ的測量標(biāo)準(zhǔn)誤和可能范圍分別是多少?題解:SE=15=5.0Q=100±1.96x5=100±9.8≈90~110我們可以說這個被試的真實(shí)IQ有95%的可能性落在90與110之間。即若再測一次,他的智商低于90、高于110的可能性不超過5%。這個例題是評價兩個不同測驗(yàn)的分?jǐn)?shù)是否有明顯差異!例題二:某被試在韋氏成人智力測驗(yàn)中言語智商為102,操作智商為108。已知兩個分?jǐn)?shù)都是以100為平均數(shù),15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)分?jǐn)?shù)。假設(shè)言語測驗(yàn)和操作測驗(yàn)的分半信度分別為0.97和0.93。問其操作智商是否顯著高于言語智商呢?題解:首先計算出差異分?jǐn)?shù)的標(biāo)準(zhǔn)誤:在統(tǒng)計上,經(jīng)常要求兩個分?jǐn)?shù)的差異程度達(dá)到0.05的顯著水平,才能承認(rèn)不是誤差的影響。因此,將差異標(biāo)準(zhǔn)誤(4.74)乘以1.96,結(jié)果為9.29,這表明個體在韋氏測驗(yàn)兩個得分的差異高于大約10分,才能達(dá)到0.05顯著水平。上述被試的分?jǐn)?shù)差異(108-102=6<10)是不顯著的。下課了!請您及時復(fù)習(xí)。特殊兒童檢測信度信度(reliability)一、什么是信度定義:指的是測量結(jié)果的穩(wěn)定性程度(或叫可靠性)。也指同一被試在不同時間內(nèi)用同一測驗(yàn)(或用另一套相等的測驗(yàn))重復(fù)測量,所得結(jié)果的一致程度。1、理論定義:傳統(tǒng)的信度理論認(rèn)為,每一個測驗(yàn)的實(shí)得分?jǐn)?shù)(X)總是由真實(shí)分?jǐn)?shù)(T)和誤差(E)兩個部份構(gòu)成的,公式為:X=T+E討論一組測驗(yàn)分?jǐn)?shù)的特性時,可用方差導(dǎo)出具體分?jǐn)?shù),公式:(測驗(yàn)實(shí)得分?jǐn)?shù)的方差)=(測驗(yàn)真分?jǐn)?shù)的方差)+(測驗(yàn)誤差的方差)信度與測驗(yàn)分?jǐn)?shù)的解釋(一)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān):信度系數(shù)可以解釋為總的方差中有多少比例是由真實(shí)分?jǐn)?shù)的方差決定的,也就是測驗(yàn)的總變異中真分?jǐn)?shù)造成的變異占百分之幾。(二)比較信度可以接受的水平:一般的能力測驗(yàn)和成就測驗(yàn)的信度系數(shù)都在0.90以上;人格測驗(yàn)、興趣、態(tài)度、價值觀等測驗(yàn)的信度一般在0.80-0.85。一般原則是:當(dāng)<0.70時,測驗(yàn)不能用于對個人作出評價或預(yù)測,而且不能作團(tuán)體比較;當(dāng)0.70≤<0.85時,可用于團(tuán)體比較;當(dāng)≥0.85時,才能用來鑒別或預(yù)測個人成績或作為。(三)解釋個人分?jǐn)?shù)的意義:從信度可以解釋個人分?jǐn)?shù)的意義,這是測量標(biāo)準(zhǔn)誤的應(yīng)用。它有兩個作用:一是估計真實(shí)分?jǐn)?shù)的范圍;二是了解實(shí)得分?jǐn)?shù)再測時可能的變化情形。(四)比較不同測驗(yàn)分?jǐn)?shù)的差異:測量標(biāo)準(zhǔn)誤和測驗(yàn)信度在評價兩個不同測驗(yàn)的分?jǐn)?shù)是否有明顯差異時也非常重要。這種比較包括兩個人不同分?jǐn)?shù)的差別和同一被試在兩個測驗(yàn)上的差別。信度的類型及估計方法(一)重測信度(再測信度)(test-retestreliabity)1、含義與計算:又稱穩(wěn)定性系數(shù)。他的計算方法是采用重測法,即使用同一測驗(yàn),在同樣條件下對同一組被試前后施測兩次測驗(yàn),求兩次得分間的相關(guān)系數(shù)。(二)復(fù)本信度

(Alternate-formreliability)1、含義與計算:含義:又稱等值性系數(shù)。它是以兩個平行或復(fù)本的測驗(yàn)(等值但題目不同)來測量同一群體,然后求得被試在兩個測驗(yàn)上得分的相關(guān)系數(shù),這個相關(guān)系數(shù)就代表了復(fù)本信度的高低。復(fù)本信度反映的是測驗(yàn)在內(nèi)容上的等值性,故稱等值性系數(shù)。復(fù)本信度的高低關(guān)鍵取決于復(fù)本測驗(yàn)的選擇。(三)分半信度(split-halfreliability)1、含義與計算指采用分半法估計所得的信度系數(shù)。這種方法估計信度系數(shù)只需一種測驗(yàn)形式,實(shí)施一次測驗(yàn)。通常是在測驗(yàn)實(shí)施后將測驗(yàn)按奇、偶數(shù)分為等值的兩半,并分別計算每位被試在兩半測驗(yàn)上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。常見的是將測題按其序列號的奇偶分,這種分法的前提是:測題并非隨機(jī)排列,而是按某種順序(如難度)排列;如果隨機(jī)排列的題目,則必須是所有題目平等的(要么難度相等,要么性質(zhì)一樣);如果測驗(yàn)有多個分量表,應(yīng)該在分量表內(nèi)部排好順序,再把各分量表分兩半組合起來求相關(guān)。2、計算(1)兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)相等(方差齊性)先計算兩半測驗(yàn)的積差相關(guān)系數(shù),再進(jìn)行校正。常用的修正公式是:斯皮爾曼-布朗公式:(2)兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)不等(方差不齊),可采用:弗朗那根公式或盧倫公式中的任一一個。(四)同質(zhì)性信度

(homogeneityreliability)1、含義:指測驗(yàn)內(nèi)部所有題目間的一致性。題目的一致性有兩層含義:其一是指所有題目都測的是同一種心理特質(zhì);其二是指所有題目之間都具有較高的正相關(guān)??傊?,同質(zhì)性信度就是一個測驗(yàn)所測內(nèi)容或特質(zhì)的相同程度。2、測量同質(zhì)性的基本公式:3、庫德-理查遜公式:

適用于客觀性試題(0、1記分)3、克倫巴赫系數(shù)(多重記分測驗(yàn))(五)評分者信度(scorerreliability)1、含義與計算:指的是多個評分者給同一批人的答卷進(jìn)行評分的一致性程度。是用于測量不同評分者之間所產(chǎn)生的誤差。式中W為和諧系數(shù),K為評分者的人數(shù),N為被評對象數(shù),RI為每一對象被評的等級總和。這是一個統(tǒng)計表,記住之后就能有效控制誤差!一.各種信度系數(shù)相應(yīng)誤差方差的來源內(nèi)容取樣時間和內(nèi)容取樣內(nèi)容取樣內(nèi)容的異質(zhì)性評分者之間的差異復(fù)本信度(連續(xù)施測)

復(fù)本信度(間隔施測)分半信度同質(zhì)性信度評分者信度時間取樣重測信度信度系數(shù)類型誤差方差來源樣本團(tuán)體的特征對測驗(yàn)結(jié)果的影響很大!二.影響信度的因素(一)樣本團(tuán)體的特征分?jǐn)?shù)分布當(dāng)分布范圍增大時,其信度估計就較高;當(dāng)分布范圍減小時,相關(guān)系數(shù)隨之下降,信度值則較低。異質(zhì)性若獲得信度的取樣團(tuán)體較為異質(zhì)的話,往往會高估測驗(yàn)的信度,相反則會低估測驗(yàn)的信度。平均水平對于不同水平的團(tuán)體,題目具有不同的難度,每個題目在難度上的微小差異累計起來便會影響信度。所以我們應(yīng)該選擇測驗(yàn)長度比較大的測驗(yàn)!二.影響信度的因素(二)測驗(yàn)的長度代表性測驗(yàn)越長,測驗(yàn)的測題取樣或內(nèi)容取樣越有代表性。猜測性測驗(yàn)越長,被試的猜測因素影響就越小。隨機(jī)性測驗(yàn)的項(xiàng)目越多,在每個項(xiàng)目上的隨機(jī)誤差就可以相互抵消。所以我們應(yīng)該選擇測驗(yàn)長度比較大的測驗(yàn)!二.影響信度的因素(三)測驗(yàn)的難度難度對信度的影響只存在于某些測驗(yàn)中,如智力測驗(yàn)、成就測驗(yàn)、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論