




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
測(cè)量學(xué)信效度第1頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度一、信度的定義
信度是指同一被試者在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)重復(fù)測(cè)量,所得結(jié)果的一致程度。信度有高有低,因?yàn)樗艿秸`差的影響
第2頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月二、誤差1、抽樣誤差2、系統(tǒng)誤差:與測(cè)驗(yàn)?zāi)康臒o(wú)關(guān),但恒定的存在于每次測(cè)量中,又稱常定誤差。3、測(cè)量誤差:與測(cè)驗(yàn)?zāi)康臒o(wú)關(guān)的,但見(jiàn)偶然因素引起,使得幾次測(cè)量結(jié)果不一致,且這種結(jié)果是無(wú)系統(tǒng)的,隨機(jī)的。故稱為隨機(jī)誤差。信度受隨機(jī)誤差的影響,不受系統(tǒng)誤差的影響。第3頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月二、測(cè)量誤差和真分?jǐn)?shù)理論
1.物理測(cè)量的測(cè)量誤差實(shí)測(cè)重量(克)X真正重量(克)T
誤差(克)E121021920-12730-34140151501∑1501500x
(平均數(shù))30300第4頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月二、測(cè)量誤差和真分?jǐn)?shù)理論
2.真分?jǐn)?shù)理論(1)真分?jǐn)?shù)的定義真分?jǐn)?shù)被定義為受測(cè)者經(jīng)過(guò)同一測(cè)驗(yàn)的多次重復(fù)測(cè)試而得的測(cè)驗(yàn)分?jǐn)?shù)的期望值.(2)真分?jǐn)?shù)理論的基本方程式:X=T+E意即一個(gè)測(cè)驗(yàn)的實(shí)得分?jǐn)?shù)(X)總是由真實(shí)分?jǐn)?shù)(T)和誤差(E)兩部分構(gòu)成的。第5頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月二、測(cè)量誤差和真分?jǐn)?shù)理論
我們討論一組分?jǐn)?shù)的特性時(shí),可用方差代表具體分?jǐn)?shù):X=T+ES2X=S2T+S2E在測(cè)量理論中,信度被定義為:一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)方差與測(cè)驗(yàn)實(shí)測(cè)分?jǐn)?shù)方差的比率:rxx=s2T/s2X信度系數(shù)
第6頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月三、信度的指標(biāo)
信度的指標(biāo)有兩大類共三種表示方法:㈠、信度系數(shù)與信度指數(shù)大部分情況下,信度是以信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。常常是同一被試樣本所得的兩組資料的相關(guān),理論上說(shuō)就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值,
rxx=r2xt=s2T/s2x真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)的標(biāo)準(zhǔn)差的比值,稱信度指數(shù),信度指數(shù)的平方就是信度系數(shù)
rxt=sT/sX第7頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月三、信度的指標(biāo)
(二)測(cè)量的標(biāo)準(zhǔn)誤信度系數(shù)僅表示一組測(cè)量的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,但并沒(méi)有直接指出個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異量。由于存在誤差,一個(gè)人所得分?jǐn)?shù)有時(shí)比真分?jǐn)?shù)高,有時(shí)比真分?jǐn)?shù)低,有時(shí)二者相等。我們可以用一組被試兩次測(cè)量結(jié)果來(lái)代替對(duì)同一個(gè)人的反復(fù)施測(cè),于是有了信度的另一個(gè)指標(biāo)SE為測(cè)量的標(biāo)準(zhǔn)誤,測(cè)量的標(biāo)準(zhǔn)誤與信度之間有互為消長(zhǎng)的關(guān)系:信度越高,標(biāo)準(zhǔn)誤越??;信度越低,標(biāo)準(zhǔn)誤越大。S2X=S2T+S2Erxx=1-S2E/s2XSE=SX√1-rxx測(cè)量的標(biāo)準(zhǔn)誤:可視作典型的受測(cè)者的真分?jǐn)?shù)和經(jīng)過(guò)無(wú)數(shù)次重復(fù)測(cè)試所得的觀測(cè)分?jǐn)?shù)之間的差異的標(biāo)準(zhǔn)差.第8頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度評(píng)估的方法
一、重測(cè)信度(test-retestreliability)
又稱穩(wěn)定性系數(shù)。它的計(jì)算方法是采用重測(cè)法,即使用同一測(cè)驗(yàn),在同樣條件下對(duì)同一組被試者前后施測(cè)兩次測(cè)驗(yàn),求兩次得分間的相關(guān)系數(shù)。
第9頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月例、某幸福感調(diào)查表的兩次測(cè)試結(jié)果測(cè)驗(yàn)被試12345678910x116151313111010987x21616141211911867第10頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月相關(guān)結(jié)果第11頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度評(píng)估的方法一、重測(cè)信度(test-retestreliability)優(yōu)點(diǎn)、缺點(diǎn)重測(cè)法估計(jì)信度的注意事項(xiàng)1、兩次測(cè)驗(yàn)的時(shí)間間隔要適當(dāng),2~4W2、重測(cè)法適合速度和人格測(cè)驗(yàn),不適合難度測(cè)驗(yàn)3、應(yīng)注意提高被測(cè)的積極性
第12頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度評(píng)估的方法二、復(fù)本信度(alternate-formreliability)
又稱等值性系數(shù)。它是以兩個(gè)等值但題目不同的測(cè)驗(yàn)(復(fù)本)來(lái)測(cè)量同一群體,然后求得被試者在兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù),這個(gè)相關(guān)系數(shù)就代表了復(fù)本信度的高低。測(cè)驗(yàn)復(fù)份A→
測(cè)驗(yàn)復(fù)份B
第13頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度評(píng)估的方法復(fù)本信度的優(yōu)點(diǎn)是能夠避免重測(cè)信度的一些問(wèn)題,如記憶效果、學(xué)習(xí)效應(yīng)等。但也有其局限性:其一,如果測(cè)量的行為易受練習(xí)的影響,那復(fù)本信度只能減少而不能完全消除這種影響;其二,由于第二個(gè)測(cè)驗(yàn)只改變了題目的內(nèi)容,已經(jīng)掌握的解題原則,可以很容易地遷移到同類問(wèn)題。第14頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度評(píng)估的方法三、內(nèi)部一致性信度(internalconsistencyreliability)內(nèi)部一致性信度系數(shù)主要反映的是題目之間的關(guān)系,表示測(cè)驗(yàn)?zāi)軌驕y(cè)量相同內(nèi)容或特質(zhì)的程度。第15頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度評(píng)估的方法三、內(nèi)部一致性信度㈠分半信度(split-halfreliability)
分半信度指采用分半法估計(jì)所得的信度系數(shù)。這種方法估計(jì)信度系數(shù)只需一種測(cè)驗(yàn)形式,實(shí)施一次測(cè)驗(yàn)。通常是在測(cè)驗(yàn)實(shí)施后將測(cè)驗(yàn)按奇、偶數(shù)分為等值的兩半,并分別計(jì)算每位被試在兩半測(cè)驗(yàn)上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。第16頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度評(píng)估的方法三、內(nèi)部一致性信度㈡同質(zhì)性信度(homogeneityreliability)
同質(zhì)性主要代表測(cè)驗(yàn)內(nèi)部所有題目間的一致性。當(dāng)各個(gè)測(cè)題的得分有較高的正相關(guān)時(shí),不論題目的內(nèi)容和形式如何,則測(cè)驗(yàn)為同質(zhì)的。幾個(gè)計(jì)算同質(zhì)性信度的公式如下:1.庫(kù)德-理查遜公式2.克倫巴赫α系數(shù):0.1記分第17頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度評(píng)估的方法
四、評(píng)分者信度(scorerreliability)
用于測(cè)量不同評(píng)分者之間所產(chǎn)生的誤差。為了衡量評(píng)分者之間信度高低,可隨機(jī)抽取若干份測(cè)驗(yàn)卷,由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分,然后再根據(jù)每份測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān),即得評(píng)分者信度。一般要求在成對(duì)的受過(guò)訓(xùn)練的評(píng)分者之間平均一致性達(dá)0.90以上,才認(rèn)為評(píng)分是客觀的。第18頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋
一、解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)信度系數(shù)可以解釋為測(cè)驗(yàn)的總變異中,真分?jǐn)?shù)造成變異占百分之幾。如,當(dāng)rxx=0.90時(shí),我們可以說(shuō)實(shí)得分?jǐn)?shù)中有90%的變異是真分?jǐn)?shù)造成的,僅10%來(lái)自測(cè)驗(yàn)的誤差。rxx=1.00,則表示完全沒(méi)有測(cè)量誤差,所有的變異均來(lái)自真實(shí)分?jǐn)?shù).第19頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋二、確定信度可以接受的水平
一個(gè)測(cè)驗(yàn)究竟信度多高才合適,才讓人滿意呢?當(dāng)然,最理想的情況是rxx=1.00,但實(shí)際上是辦不到的。根據(jù)多年的研究結(jié)果,一般的能力測(cè)驗(yàn)和成就測(cè)驗(yàn)的信度系數(shù)都在0.90以上,有的可以達(dá)0.95;而人格測(cè)驗(yàn)、興趣、態(tài)度、價(jià)值觀等測(cè)驗(yàn)的信度一般在0.80~0.85或更高些。一般原則是:當(dāng)rxx<0.70時(shí),測(cè)驗(yàn)不能用于對(duì)個(gè)人做出評(píng)價(jià)或預(yù)測(cè),而且不能作團(tuán)體比較;當(dāng)0.70≤rxx<0.85時(shí),可用于團(tuán)體比較;當(dāng)rxx≥0.85時(shí),才能用來(lái)鑒別或預(yù)測(cè)個(gè)人成績(jī)或作為。
(幾種心理測(cè)驗(yàn)的信度系數(shù)見(jiàn)書(shū)P379)
第20頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋三、解釋個(gè)人分?jǐn)?shù)的意義從信度可以解釋個(gè)人分?jǐn)?shù)的意義,這就是測(cè)量標(biāo)準(zhǔn)誤的應(yīng)用。它有兩個(gè)作用:(一)是估計(jì)真實(shí)分?jǐn)?shù)的范圍;(二)是了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化范圍。人們一般采用95%的概率水平,其置信區(qū)間為:
X―1.96SE<XT≤X+1.96SE
就是說(shuō),我們以95%的把握認(rèn)為受測(cè)者的真分?jǐn)?shù)落在X±1.96SE的范圍內(nèi),或有5%的可能性落在范圍之外。第21頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋三、解釋個(gè)人分?jǐn)?shù)的意義(二)了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化范圍。例一被測(cè)的IQ100,其標(biāo)準(zhǔn)差15,信度系數(shù)0.91,問(wèn)IQ的真分?jǐn)?shù)范圍是多少,再測(cè)時(shí)他的IQ將在什么范圍?第22頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋四、比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異測(cè)量標(biāo)準(zhǔn)誤和測(cè)驗(yàn)信度在評(píng)價(jià)兩個(gè)不同測(cè)驗(yàn)的分?jǐn)?shù)是否有明顯差異時(shí)也非常重要。這種比較包括兩個(gè)人不同分?jǐn)?shù)的差別和同一被試在兩個(gè)測(cè)驗(yàn)上的差別。
SEd=s√2-rxx-rYYSEd為差異的標(biāo)準(zhǔn)誤,S代表兩個(gè)測(cè)驗(yàn)使用的標(biāo)準(zhǔn)差,要求相同。rxx.rYY分別代表兩測(cè)驗(yàn)的信度系數(shù)第23頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋四、比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異例:某被試在韋氏智測(cè)中VIQ是102,PIQ是110,已知兩分?jǐn)?shù)都是以100分為均數(shù),15為標(biāo)準(zhǔn)差,假如VIQ和PIQ的分半信度分別為0.87、0.88,問(wèn)PIQ是否顯著高于VIQ?一般采用95%的概率水平,1.96×SEd=第24頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月影響信度的因素
一、樣本特征
㈠、樣本團(tuán)體異質(zhì)性的影響:分?jǐn)?shù)范圍越寬,信度系數(shù)越高,分?jǐn)?shù)范圍越窄,這樣分?jǐn)?shù)的變異量(方差)會(huì)降低,信度系數(shù)rxx會(huì)減少:計(jì)算信度的公式:
rxx=S2T/s2X㈡、樣本團(tuán)體平均能力水平的影響。。
第25頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月影響信度的因素二、測(cè)驗(yàn)長(zhǎng)度測(cè)驗(yàn)長(zhǎng)度,亦即測(cè)驗(yàn)的數(shù)量,也是影響信度系數(shù)的一個(gè)因素。一般來(lái)說(shuō),在一個(gè)測(cè)驗(yàn)中增加同質(zhì)的題目,可以使信度提高。第一,測(cè)驗(yàn)越長(zhǎng),測(cè)驗(yàn)的測(cè)題取樣或內(nèi)容取樣就越有代表性。第二,測(cè)驗(yàn)越長(zhǎng),被試的猜測(cè)因素影響就越小。
第26頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月影響信度的因素如果我們希望用增長(zhǎng)測(cè)驗(yàn)的方式提高測(cè)驗(yàn)的信度以達(dá)到某種理想值,通過(guò)斯皮爾曼-布朗公式可計(jì)算出最少應(yīng)增加的題數(shù)。K=rkk(1-rxx)/rxx(1-rkk)K是測(cè)驗(yàn)題目增加后是原來(lái)題目的倍數(shù)rxx是長(zhǎng)度已知測(cè)驗(yàn)的信度rkk是長(zhǎng)度未知測(cè)驗(yàn)的信度例:某測(cè)驗(yàn)有10個(gè)項(xiàng)目,信度是0.6,問(wèn)測(cè)驗(yàn)應(yīng)增加到多少項(xiàng)目,才能使信度達(dá)到0.90?第27頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月影響信度的因素三、測(cè)驗(yàn)難度太難→猜測(cè)→信度低太易→分?jǐn)?shù)接近→信度低難度多少最合適?應(yīng)根據(jù)受測(cè)者的不同能力水平第28頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月影響信度的因素四、時(shí)間間隔間隔時(shí)間短→信度高間隔時(shí)間長(zhǎng)→信度低
第29頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月效度rxx=s2T/s2x=1-s2e/s2xs2x=s2T+s2e測(cè)量的效度除了與隨機(jī)誤差有關(guān)外,還有一與測(cè)量目的無(wú)關(guān)的因子引起的系統(tǒng)誤差,不影響測(cè)量的一致性,但影響了測(cè)驗(yàn)的準(zhǔn)確性。s2x=
s2v+s2i+s2er2xY=s2v/s2x﹀s2T
第30頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月效度的概念
一、效度的定義
效度是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度,或者簡(jiǎn)單地說(shuō)是指一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性。測(cè)量的效度除受隨機(jī)誤差影響外,還受系統(tǒng)誤差的影響。第31頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月二、效度的性質(zhì)
㈠、效度具有相對(duì)性任何測(cè)驗(yàn)的效度是針對(duì)一定的目的來(lái)說(shuō)的㈡、效度具有連續(xù)性第32頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月效度評(píng)估的方法效度分為三大類:即內(nèi)容效度構(gòu)想效度效標(biāo)效度。第33頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月
一、內(nèi)容效度(content-relatedvalidity)
定義:內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)欲測(cè)的內(nèi)容或行為取樣的適用程度。
第34頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月一個(gè)測(cè)驗(yàn)要具備較好的內(nèi)容效度必須滿足兩個(gè)條件:要確定內(nèi)容范圍,并使測(cè)驗(yàn)的全部項(xiàng)目在此范圍內(nèi)。測(cè)驗(yàn)項(xiàng)目應(yīng)是已界定的內(nèi)容范圍的代表性樣本。雙向細(xì)目表P401第35頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月內(nèi)容效度的評(píng)估方法
1.專家判斷法2.統(tǒng)計(jì)分析法相關(guān)(兩個(gè)評(píng)分者之間的一致性)再測(cè)法(抑郁量表)3.經(jīng)驗(yàn)推測(cè)法Gessel量表第36頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月內(nèi)容效度的特性
1.內(nèi)容效度與所有效度的性質(zhì)一樣,不是普遍適用的
2.內(nèi)容效度經(jīng)常與表面效度(facevalidity)混淆。
3.在編制測(cè)驗(yàn)時(shí),表面效度是一個(gè)必須考慮的特性。(最高行為、典型行為測(cè)驗(yàn))
第37頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月二、構(gòu)想效度
㈠、構(gòu)想效度的概念是1954年提出來(lái)的,有人也翻譯成構(gòu)思效度或結(jié)構(gòu)效度。它主要涉及的是心理學(xué)的理論概念問(wèn)題,是指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想或特質(zhì)的程度,即測(cè)驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語(yǔ)或構(gòu)想,解釋的程度如何。第38頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月構(gòu)想效度的估計(jì)方法1。對(duì)測(cè)驗(yàn)本身的分析這類方法是通過(guò)研究測(cè)驗(yàn)內(nèi)部結(jié)構(gòu)來(lái)界定理論構(gòu)想,從而為構(gòu)思效度提供證據(jù)。測(cè)驗(yàn)的內(nèi)容:16PF\WAIS測(cè)驗(yàn)的內(nèi)部一致性指標(biāo)分析被試對(duì)題目的反應(yīng)特點(diǎn):社會(huì)贊許性第39頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月構(gòu)想效度的估計(jì)方法2.測(cè)驗(yàn)間的相互比較
求同效度:通過(guò)分析幾個(gè)測(cè)驗(yàn)間的相互關(guān)系,找出其共同之處,進(jìn)而推斷這些測(cè)驗(yàn)測(cè)量的特質(zhì)是什么,也可以確定這些測(cè)驗(yàn)構(gòu)思效度如何。(成熟的和待研究的)
區(qū)分效度(discriminatevalidity):是構(gòu)思效度的又一個(gè)證據(jù)。一個(gè)有效的測(cè)驗(yàn)不僅應(yīng)與其他測(cè)量同一構(gòu)思的測(cè)驗(yàn)有相關(guān),而且還必須與測(cè)量不同構(gòu)思的測(cè)驗(yàn)無(wú)相關(guān)。
因素分析法(factoranalysis):也是建立構(gòu)思效度的常用方法。通過(guò)對(duì)一組測(cè)驗(yàn)進(jìn)行因素分析,可以找到影響測(cè)驗(yàn)分?jǐn)?shù)的共同因素,這種因素可能就是我們要測(cè)量的心理特質(zhì)(意志品質(zhì))。第40頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月構(gòu)想效度的估計(jì)方法3.效標(biāo)效度的研究效標(biāo):就是被預(yù)測(cè)的行為
一個(gè)測(cè)驗(yàn)若效標(biāo)效度理想,那么該測(cè)驗(yàn)所預(yù)測(cè)的效標(biāo)的性質(zhì)和種類就可以作為分析測(cè)驗(yàn)構(gòu)思效度的指標(biāo)。第41頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月構(gòu)想效度的估計(jì)方法4.實(shí)驗(yàn)法和觀察法證實(shí)觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異也是驗(yàn)證構(gòu)思效度的方法。根據(jù)所要測(cè)量的特質(zhì)的得到證實(shí),那就給構(gòu)思效度提供了證據(jù)。(抑郁癥病人的干預(yù)前后)第42頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月三、效標(biāo)效度效標(biāo)效度(criterion-relatedvalidity)㈠、什么是效標(biāo)效度效標(biāo)效度又稱實(shí)證效度,反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。第43頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月三、效標(biāo)效度
一個(gè)好的效標(biāo)必須具備以下條件:
①必須能最有效地反映測(cè)驗(yàn)的目標(biāo),即效標(biāo)測(cè)量本身必須有效;②、效標(biāo)必須具有較高的信度,穩(wěn)定可靠,不隨時(shí)間等因素而變化;③、效標(biāo)可以客觀地加以測(cè)量,可用數(shù)據(jù)或等級(jí)來(lái)表示;④、效標(biāo)測(cè)量的方法簡(jiǎn)單,省時(shí)省力,經(jīng)濟(jì)實(shí)用。第44頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月㈡、效標(biāo)效度的評(píng)估方法
1.相關(guān)法:相關(guān)法是評(píng)估效標(biāo)效度最常用的方法,它是求測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)資料間的相關(guān),這一相關(guān)系數(shù)稱為效度系數(shù)。第45頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月㈡、效標(biāo)效度的評(píng)估方法
2.區(qū)分法:區(qū)分法是檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。(見(jiàn)P389圖)第46頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月㈡、效標(biāo)效度的評(píng)估方法
3.命中率法命中率法是當(dāng)測(cè)驗(yàn)用來(lái)做取舍的依據(jù)時(shí),用其正確決定的比例作為效度指標(biāo)的一種方法。(P390表)第47頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月效度的功能
一、預(yù)測(cè)誤差效度系數(shù)的實(shí)際意義常常是以決定性系數(shù)(r2)來(lái)表示,也就是相關(guān)系數(shù)的平方。如測(cè)驗(yàn)的效度是0.8,則測(cè)驗(yàn)的總方差中有0.64的方差來(lái)自測(cè)驗(yàn)分?jǐn)?shù)的方差,即測(cè)驗(yàn)分?jǐn)?shù)正確預(yù)測(cè)的比例是0.64.(大學(xué)入學(xué)后第一年英語(yǔ)成績(jī)有64%的方差可以由高考英語(yǔ)成績(jī)加以解釋)預(yù)測(cè)估計(jì)的標(biāo)準(zhǔn)誤SestSest=sY√1-r2xyr2xy是效度系數(shù)的平方也就是決定性系數(shù),sY是效標(biāo)成績(jī)的標(biāo)準(zhǔn)差√1-r2xy表示誤差引起的變異在高考成績(jī)總變異中所占的比率稱為無(wú)關(guān)系數(shù)估計(jì)的標(biāo)準(zhǔn)誤Sest在0~sy使用Sest預(yù)測(cè)真正效標(biāo)分?jǐn)?shù)
第48頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月舉例某考生高考時(shí)的英語(yǔ)成績(jī)120分,效度系數(shù)0.60,標(biāo)準(zhǔn)差是15,試問(wèn)該考生在大學(xué)一年級(jí)時(shí)的英語(yǔ)成績(jī)會(huì)在什么范圍?(定為95%的概率水平)第49頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月效度的功能
二、預(yù)測(cè)效標(biāo)分?jǐn)?shù)
如果X與Y呈直線相關(guān),通過(guò)回歸方程,就可以從X變量推估出Y變量值。也就是我們知道了一個(gè)人的測(cè)驗(yàn)分?jǐn)?shù),將其回歸方程式,就可以對(duì)他的效標(biāo)分?jǐn)?shù)作出估計(jì)。第50頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月效度的功能
三、預(yù)測(cè)效率指數(shù)Sest=sy√1-r2xy(無(wú)關(guān)系數(shù))K=Sest/sy=√1-r2xy1-K為預(yù)測(cè)效率的指標(biāo),用E表示E=100(1-K)E值表示使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差。(一個(gè)測(cè)驗(yàn)的效度系數(shù)為0.80)第51頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月影響效度的因素
一、測(cè)驗(yàn)本身的因素
測(cè)驗(yàn)取材的代表性、測(cè)驗(yàn)題量、試題類型、難度、區(qū)分度以及編排方式等都會(huì)影響效度。
第52頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月影響效度的因素
要保證測(cè)驗(yàn)具有較高效度,要做好以下幾點(diǎn):
1.測(cè)驗(yàn)材料必須對(duì)整個(gè)內(nèi)容具有代表性;
2.測(cè)題設(shè)計(jì)時(shí)應(yīng)盡量避免容易引起誤差的題型(針對(duì)成就測(cè)驗(yàn),如是非題);
3.測(cè)題難度要適中,具有較高的區(qū)分度;
4.測(cè)驗(yàn)長(zhǎng)度要恰當(dāng),即要有一定的測(cè)題量;增加測(cè)驗(yàn)題量可以提高測(cè)驗(yàn)的效度
5.測(cè)題的排列按先易后難順序。第53頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月影響效度的因素二、測(cè)驗(yàn)實(shí)施中的干擾因素(一)、主試的影響因素測(cè)驗(yàn)實(shí)施過(guò)程中主試的因素會(huì)影響效度(二)、被試的影響因素被試在測(cè)驗(yàn)時(shí)的興趣、動(dòng)機(jī)、情緒、態(tài)度和身心狀況、健康狀態(tài)以及是否充分合作與盡力而為等,都會(huì)影響被試在測(cè)驗(yàn)情境中的反應(yīng),因而影響測(cè)驗(yàn)結(jié)果的效度。被試的反應(yīng)定勢(shì)也會(huì)降低測(cè)驗(yàn)的效度。第54頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月影響效度的因素三、樣本團(tuán)體的性質(zhì)
㈠、樣本團(tuán)體的異質(zhì)性㈡、干涉變量樣本團(tuán)體的性質(zhì)對(duì)效度的影響還表現(xiàn)在:對(duì)于不同性質(zhì)的團(tuán)體,同一測(cè)驗(yàn)的效度會(huì)有很大的不同。這些性質(zhì)包括年齡、性別、教育水平、智力、動(dòng)機(jī)、興趣、職業(yè)和任何有關(guān)的特征。第55頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月影響效度的因素
四、效標(biāo)的性質(zhì)
效標(biāo)效度是以測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)系數(shù)來(lái)表示的,因此效標(biāo)的性質(zhì)如何,在評(píng)價(jià)測(cè)驗(yàn)的效度時(shí)是值得考慮的。
1.效標(biāo)與測(cè)驗(yàn)分?jǐn)?shù)之間的關(guān)系是否線性關(guān)系。
2.效標(biāo)測(cè)量本身的可靠性第56頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月項(xiàng)目的難度
一、定義難度(difficulty),顧名思義,是指項(xiàng)目的難易程度。通過(guò)人數(shù)越多,難度越低。
P=R/N×100%
P代表項(xiàng)目的難度,R代表通過(guò)該項(xiàng)目的人數(shù),N代表總?cè)藬?shù)。第57頁(yè),課件共66頁(yè),創(chuàng)作于2023年2月項(xiàng)目的難度
二、計(jì)算方法
㈠、二值計(jì)分1、直接用公式計(jì)算難度,P=R/N×100%2、當(dāng)被試人比較多時(shí),將被試按總分高低排列分成三組(Kelley提出的27%分法)P=(PH+PL)/2
注意:選擇題時(shí)受機(jī)遇作用的影響。吉爾福特提出一個(gè)難度的校正公式(P369)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人自助循環(huán)貸款合同范本
- 東莞抵押合同范本
- 申報(bào)課題書(shū)怎么寫(xiě)
- 畜牧課題申報(bào)書(shū)范文
- 原材料海外采購(gòu)合同范本
- 課題申報(bào)書(shū)樣板
- 光伏承建合同范本
- 公程合同范本
- 申報(bào)書(shū)課題設(shè)計(jì)論證
- 全面提升國(guó)際化水平的實(shí)施方案
- 教科版六年級(jí)科學(xué)下冊(cè)全冊(cè)全套課件【完整版】
- 2023年江蘇省五年制專轉(zhuǎn)本英語(yǔ)統(tǒng)考真題(試卷+答案)
- 型瀝青攪拌樓技術(shù)規(guī)格書(shū)
- 下載完整版的離婚協(xié)議書(shū)
- 2023年云南省中考物理試題(含答案)
- 小兒麻醉術(shù)前準(zhǔn)備課件
- 急診科運(yùn)用PDCA循環(huán)縮短嚴(yán)重創(chuàng)傷病人在搶救室的停留時(shí)間品管圈成果匯報(bào)
- 國(guó)家企業(yè)技術(shù)中心附件要求說(shuō)明
- 大數(shù)據(jù)思維與技術(shù)知到章節(jié)答案智慧樹(shù)2023年北京理工大學(xué)
- 中等專業(yè)學(xué)校畢業(yè)生登記表
- 淺析小學(xué)英語(yǔ)主題意義探究下的單元整體教學(xué) 論文
評(píng)論
0/150
提交評(píng)論