測(cè)驗(yàn)信度效度_第1頁(yè)
測(cè)驗(yàn)信度效度_第2頁(yè)
測(cè)驗(yàn)信度效度_第3頁(yè)
測(cè)驗(yàn)信度效度_第4頁(yè)
測(cè)驗(yàn)信度效度_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、心理測(cè)驗(yàn)客觀性的常用指標(biāo) 11、信度: reliability 2、 效度;validity3、 項(xiàng)目分析(難度和鑒別力)21、信度 指測(cè)驗(yàn)結(jié)果的可靠程度。只有測(cè)驗(yàn)結(jié)果接近或等于實(shí)際真值,或多次測(cè)驗(yàn)結(jié)果十分接近,就可以認(rèn)為測(cè)驗(yàn)結(jié)果是可靠的。 科學(xué)的東西必須能夠重復(fù),兩次測(cè)驗(yàn)的結(jié)果必須具有一定的一致性,差異比較小,信度問(wèn)題實(shí)質(zhì)是一組被試兩次測(cè)驗(yàn)結(jié)果的一致性問(wèn)題。測(cè)驗(yàn)的可靠性,是指對(duì)某一群體而言,不是針對(duì)某一個(gè)被試而言。 信度高低可以用相關(guān)系數(shù)來(lái)表示。3 信度的作用和意義作用:1)解釋預(yù)測(cè)個(gè)人分?jǐn)?shù)的意義 2)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)間的關(guān)系 3)確定測(cè)驗(yàn)好壞的一個(gè)指標(biāo);最理想 r=1.00意義:1)

2、信度系統(tǒng)為樣本測(cè)驗(yàn)分?jǐn)?shù)的總方差中有多少比例是真分?jǐn)?shù)方差,也就是測(cè)驗(yàn)的總變異中真分?jǐn)?shù)造成的變異占百分之幾2)測(cè)量的標(biāo)準(zhǔn)誤是有多大可能性真實(shí)分?jǐn)?shù)在某一分?jǐn)?shù)范圍內(nèi)。并且可以預(yù)測(cè)實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情況。4 信度估計(jì)方法 (1)重測(cè)信度 考慮誤差來(lái)源是時(shí)間取樣,主要針對(duì)時(shí)間變量,采集數(shù)據(jù)方法是對(duì)同一組被試間隔一定的時(shí)間相同的測(cè)驗(yàn)重復(fù)測(cè)試一次,計(jì)算方法是積差相關(guān)法,求得首測(cè)與再測(cè)這兩次測(cè)驗(yàn)的相關(guān) 。時(shí)間間隔選擇依測(cè)驗(yàn)性質(zhì)和目的而定。 不是所有測(cè)驗(yàn)都可以計(jì)算重測(cè)信度,如:智力測(cè)驗(yàn),成就測(cè)驗(yàn);重測(cè)信度只反映了隨機(jī)誤差的影響,而不是反映被試心理特點(diǎn)的長(zhǎng)期變化。5(2)復(fù)本信度 又叫等值性系統(tǒng),考慮誤差來(lái)源

3、是內(nèi)容取樣,采集數(shù)據(jù)方法:給被試施測(cè)兩個(gè)內(nèi)容等值但題目不同的測(cè)驗(yàn),即:一個(gè)測(cè)驗(yàn)有平行的兩個(gè)版本測(cè)驗(yàn)A、B,先作A式測(cè)驗(yàn),在最短時(shí)間內(nèi)再作測(cè)驗(yàn)B式,求兩組數(shù)值的相關(guān),計(jì)算積差相關(guān)法。 復(fù)本信度的高低反映兩個(gè)互為復(fù)本的測(cè)驗(yàn)等價(jià)的程度,而不是反映一個(gè)測(cè)驗(yàn)本身受隨機(jī)誤差影響的大小,關(guān)鍵取決于復(fù)本測(cè)驗(yàn)的選擇。6(3)分半信度(內(nèi)在一致性信度) 劈半信度或折半信度,如智力測(cè)驗(yàn),成就測(cè)驗(yàn),是一種將測(cè)驗(yàn)分成等值的兩半來(lái)求相關(guān)系統(tǒng)的信度。考察一個(gè)測(cè)驗(yàn)內(nèi)容兩伴題目測(cè)量的是否同一個(gè)心理特點(diǎn)或行為。采集數(shù)據(jù)方法:一次測(cè)驗(yàn)結(jié)束后,將測(cè)驗(yàn)按一定標(biāo)準(zhǔn)分為等值的兩半,分別計(jì)算每位被試在兩半測(cè)驗(yàn)上的分?jǐn)?shù),求出相關(guān)系數(shù),計(jì)算用積

4、差相關(guān)法。 常用的方法是將一個(gè)測(cè)驗(yàn)分裂為兩個(gè)假定相等而獨(dú)立的部分,然后計(jì)算這兩部分的得分相關(guān)系數(shù)(如奇偶項(xiàng)),之后再用斯皮爾曼布朗公式(2r/1+r)估計(jì)整個(gè)測(cè)驗(yàn)的信度。7(4)同質(zhì)性信度 同質(zhì)性信度:考慮測(cè)驗(yàn)內(nèi)容是否異質(zhì),同質(zhì)性是測(cè)同一種心理行質(zhì)或行為,測(cè)驗(yàn)所有題目間性質(zhì)的一致性,同質(zhì)性是測(cè)驗(yàn)單一特質(zhì)的必要條件。判別標(biāo)準(zhǔn):題目間呈高正相關(guān)。數(shù)據(jù)采集方法:施測(cè)一次測(cè)驗(yàn),算出所有題的得分,求出各題目的相關(guān), 同質(zhì)性信度也是一種構(gòu)思效度,或叫結(jié)構(gòu)效度。8(5)評(píng)分者信度 評(píng)分信度:考慮測(cè)驗(yàn)隨機(jī)誤差來(lái)源是評(píng)分者間的差別,由評(píng)分者造成,用積差相關(guān)法求得不同評(píng)分者所評(píng) 分值間的相關(guān)。 2個(gè)評(píng)分者用斯皮爾

5、曼等級(jí)相關(guān)法,3人以上用肯德?tīng)柡椭C系統(tǒng)。9影響信度的因素 1) 樣本特征:樣本團(tuán)體得分分布的影響,樣本越分散信度越高;樣本團(tuán)體異質(zhì)性的影響,異質(zhì)性越高信度越高;樣本團(tuán)體平均能力水平的影響,平均能力越低信度越高2) 測(cè)驗(yàn)的長(zhǎng)度:測(cè)驗(yàn)越長(zhǎng)題目越多,測(cè)驗(yàn)的內(nèi)容取樣就越有代表性;測(cè)驗(yàn)越長(zhǎng)被試的猜測(cè)因素影響越小,信度就高。3) 測(cè)驗(yàn)的難度:測(cè)驗(yàn)難度對(duì)信度有間接影響。對(duì)于人格測(cè)驗(yàn)、興趣、態(tài)度、價(jià)值觀等測(cè)驗(yàn),不存在難度問(wèn)題。從理論上說(shuō),只有難度水平為50%時(shí),才能使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大,求得的信度也最高。4) 測(cè)量的時(shí)間間隔:時(shí)間間隔只對(duì)重測(cè)信度和不同時(shí)測(cè)量的復(fù)本有影響,時(shí)間越短信度值越高。102、 效度

6、它表示一個(gè)測(cè)驗(yàn)實(shí)際測(cè)量出所測(cè)特性或功能的真實(shí)性程度,或它指一個(gè)測(cè)驗(yàn)真正確實(shí)地測(cè)量到它所欲測(cè)量的東西的程度。含義:1)測(cè)驗(yàn)測(cè)量什么? 2)測(cè)驗(yàn)對(duì)測(cè)量目標(biāo)的測(cè)量精確度和真實(shí)性是多少? 同一測(cè)驗(yàn)中其它條件相同時(shí),效度必然低于信度。往往效度比信度更重要。11 鑒別一個(gè)測(cè)驗(yàn)的好壞,首要的指標(biāo)就是效度。 效度是針對(duì)測(cè)驗(yàn)?zāi)康亩缘摹2煌瑴y(cè)驗(yàn)有不同的目的。比如智力測(cè)驗(yàn),如果用來(lái)測(cè)驗(yàn)智力就可能是高效的,用來(lái)測(cè)驗(yàn)性格則肯定是無(wú)效的。所以在使用心理測(cè)驗(yàn)時(shí)必須明白測(cè)驗(yàn)的目的。12效度估計(jì)方法 (1)內(nèi)容效度 表示測(cè)驗(yàn)所選的題目(測(cè)題)符合所欲測(cè)驗(yàn)內(nèi)容的程度。是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為總體取樣的適當(dāng)性程度。能力傾向和人

7、格測(cè)驗(yàn)不適合作內(nèi)容效度確定內(nèi)容效度的方法: 邏輯法:專家判斷,專家對(duì)測(cè)驗(yàn)題目進(jìn)行考核,看測(cè)驗(yàn)是否能夠測(cè)出所要測(cè)的內(nèi)容; 經(jīng)驗(yàn)法:經(jīng)驗(yàn)判斷,通過(guò)實(shí)踐檢查測(cè)驗(yàn)?zāi)芊駵y(cè)出欲測(cè)的內(nèi)容。 統(tǒng)計(jì)法:統(tǒng)計(jì)分析,通過(guò)統(tǒng)計(jì)學(xué)對(duì)項(xiàng)目進(jìn)行分析。13(2)結(jié)構(gòu)效度 也叫構(gòu)想效度,表示測(cè)驗(yàn)實(shí)際測(cè)量出所欲測(cè)量的心理結(jié)構(gòu)或特征的程度。用一個(gè)結(jié)構(gòu)框架去衡量效度。構(gòu)思效度無(wú)單一指標(biāo),由各方面證據(jù)累積直接來(lái)作出評(píng)價(jià)。 確定方法:測(cè)驗(yàn)內(nèi)部方法,測(cè)驗(yàn)間方法,效標(biāo)效度研究,實(shí)驗(yàn)和觀察法驗(yàn)證 14(3)效標(biāo)關(guān)聯(lián)效度 又稱效標(biāo)效度,實(shí)證效度或準(zhǔn)則關(guān)聯(lián)效度。它是測(cè)驗(yàn)分?jǐn)?shù)與作為效標(biāo)的另一獨(dú)立測(cè)驗(yàn)結(jié)果之間的一致性程度;或測(cè)驗(yàn)總分?jǐn)?shù)與外在標(biāo)準(zhǔn)之間的

8、相關(guān)程度,反映的是用測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)如何的有效性程度。 同時(shí)效度:效標(biāo)資料與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得。主要用來(lái)查明新編測(cè)驗(yàn)的效度。 預(yù)測(cè)效度:效標(biāo)分?jǐn)?shù)在測(cè)驗(yàn)之后相當(dāng)長(zhǎng)時(shí)間獲得。主要用來(lái)評(píng)價(jià)測(cè)驗(yàn)的預(yù)測(cè)能力。反映從測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)任何效標(biāo)情境或一段時(shí)間后被試的行為表現(xiàn)程度 常用效標(biāo):學(xué)業(yè)成就,臨床診斷,實(shí)際工作表現(xiàn),特殊訓(xùn)練成績(jī),效標(biāo)團(tuán)體比較,先前有效測(cè)驗(yàn),等級(jí)評(píng)定。15(4)表面效度 它是一個(gè)測(cè)驗(yàn)看起來(lái)好像是測(cè)量所要測(cè)的東西的程度,不是效度,不反映測(cè)驗(yàn)正測(cè)量的東西,只是外行人的一種評(píng)價(jià)。16影響效度的因素 1) 測(cè)驗(yàn)本身因素,包括:測(cè)驗(yàn)題目質(zhì)量,測(cè)驗(yàn)長(zhǎng)度,測(cè)驗(yàn)實(shí)施中的干擾,被試因素,增加測(cè)驗(yàn)

9、誤差,降低測(cè)驗(yàn)效應(yīng)。 2) 測(cè)驗(yàn)施測(cè)的樣本性質(zhì),樣本同質(zhì)性越高,效度越低。不同團(tuán)體對(duì)同一測(cè)驗(yàn)反應(yīng)可能不同;同一測(cè)驗(yàn),效度團(tuán)體性質(zhì)不同;樣本團(tuán)體的異質(zhì)性 3) 效標(biāo)的性質(zhì):若其它條件一樣,所測(cè)量的行為或心理特質(zhì)與效標(biāo)行為或特質(zhì)越相似,效度系統(tǒng)就越高17信度和效度的關(guān)系 St2=Sco2+Ssp2+Se2 St2 :總分變差。 Sco2 :由所測(cè)量的心理特性引起的主要變差。 Ssp2 :由與所測(cè)量的特性無(wú)關(guān)的其它個(gè)別性質(zhì)所造成的變差(系統(tǒng)誤差引起的變差)。 Se2 :誤差變異。 rtt=(Sco2+Ssp2) / St2 ; Val= Sco2 / St218信度和效度的關(guān)系說(shuō)明:相同:信度和效度

10、是以相關(guān)系統(tǒng)來(lái)表示的不同:涉及的誤差不同,信度僅考慮偶然的隨機(jī)誤差占測(cè)驗(yàn)總變異的比例;效度則還包括與測(cè)驗(yàn)無(wú)關(guān)但穩(wěn)定的測(cè)量誤差聯(lián)系:1)信度是效度的必要而非充分條件,信度越高,效度不一定越高2)效度是受信度制約的,在同一個(gè)測(cè)驗(yàn)里其信度必然高于效度,至少相等。193、項(xiàng)目分析(難度和鑒別力) 測(cè)驗(yàn)的好壞與項(xiàng)目(測(cè)題)的選擇有很大的關(guān)系,好的測(cè)題是鑒別力高并且難度適宜的項(xiàng)目。項(xiàng)目分析三內(nèi)容1) 誘答分析:每個(gè)項(xiàng)目只有一個(gè)正確答案其余均為誘答。2) 難度分析:通過(guò)率:回答某個(gè)項(xiàng)目的樣本中,正確回答該項(xiàng)目的人數(shù)P=R/N*100。3) 鑒別力分析:鑒別力是對(duì)于所測(cè)量的心理特性的區(qū)分能力。20(1)項(xiàng)目難度 項(xiàng)目難度是衡量測(cè)題難易水平的數(shù)量指標(biāo)。估計(jì)項(xiàng)目難度的方法通常是以被試通過(guò)每個(gè)項(xiàng)目的百分比來(lái)決定的,如果一個(gè)項(xiàng)目通過(guò)百分比太高或太低,說(shuō)明該項(xiàng)目太易或太難,一般情況下這兩個(gè)項(xiàng)目應(yīng)該刪除。 通過(guò)率:回答某個(gè)項(xiàng)目的樣本中,正確回答該項(xiàng)目的人數(shù)P=R/N*100, 項(xiàng)目的平均難度接近0.50,各項(xiàng)目難度在0.50

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論