人事測評的心理測量學(xué)基礎(chǔ)_第1頁
人事測評的心理測量學(xué)基礎(chǔ)_第2頁
人事測評的心理測量學(xué)基礎(chǔ)_第3頁
人事測評的心理測量學(xué)基礎(chǔ)_第4頁
人事測評的心理測量學(xué)基礎(chǔ)_第5頁
已閱讀5頁,還剩127頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

二、心理特質(zhì)的可測性l

Thorndike“凡客觀存在的事物都有其數(shù)量?!眑

McCall“凡有數(shù)量的東西都可以測量。”第二節(jié)測量誤差及其來源一、測量誤差的含義由那些與測量目的無關(guān)的因素導(dǎo)致的不一致和不準(zhǔn)確的測量效應(yīng)。二、測量誤差的種類系統(tǒng)誤差:測量工具本身引起的誤差(可控);隨機(jī)誤差:由不穩(wěn)定因素引起的誤差(不可控)。三、測量誤差的來源(一)測量工具(測驗(yàn)內(nèi)部)引起的誤差1題目取樣2指導(dǎo)語3難度4時(shí)限5測驗(yàn)復(fù)本不等值(二)由測量對象引起的誤差1測驗(yàn)的經(jīng)驗(yàn)2練習(xí)因素3應(yīng)試動(dòng)機(jī)4測驗(yàn)焦慮5反應(yīng)定勢6生理因素(三)由施測過程引起的誤差1物理環(huán)境2主試者方面3意外干擾4評分計(jì)分第三節(jié)真分?jǐn)?shù)及其有關(guān)的假設(shè)一、真分?jǐn)?shù)的含義真分?jǐn)?shù)(TrueScore):一個(gè)測量工具在沒有測量誤差時(shí),所得到的純正值。操作定義:經(jīng)過無數(shù)次測量所得到的平均值。觀察分?jǐn)?shù)(ObservedScore):實(shí)際的測量分?jǐn)?shù)(外顯的混合分?jǐn)?shù))二、數(shù)學(xué)模型及其假設(shè)X=T+E

測量誤差的假設(shè):Σ(X)=T或Σ(E)=0ρ(T,E)=0ρ(E1,E2)=0

SX2=ST2+SE2ST2=SV2+SI2

SX2=SV2+SI2+SE2SV2SI2SE2SX2ST2

第六章測量信度第一節(jié)信度概述一、什么是信度?信度(reliability)是指測量結(jié)果的一致性程度,也叫測量的可靠性。操作定義:rxx=ST2/SX2

rXX=ρTX2

rXX=ρXX’注意:(1)信度指的是一組測驗(yàn)分?jǐn)?shù)或一系列測量的特性,而不是個(gè)人分?jǐn)?shù)的特性;(2)真分?jǐn)?shù)的變異數(shù)是不能直接測量的,因此信度是一個(gè)理論上構(gòu)想的概念,只能根據(jù)一組實(shí)得分?jǐn)?shù)作出估計(jì)。注意:(1)信度有多種。(2)同一種信度也會(huì)因樣本、測查時(shí)間不同而有多個(gè)。(3)信度只是對測量分?jǐn)?shù)一致性的估計(jì),但并沒有指出不一致的原因。(4)獲得較高的信度只是測驗(yàn)有效的必要條件。三、信度的作用信度是測量過程中所存在的隨機(jī)誤差大小的反映

1.信度可以用來解釋個(gè)人測驗(yàn)分?jǐn)?shù)的意義

SE=SX√1-rXX

真分?jǐn)?shù)的置信區(qū)間(95%)=X±1.96SE

2.信度可以幫助進(jìn)行不同測驗(yàn)分?jǐn)?shù)的比較第二節(jié)信度的估計(jì)方法一、重測信度1.含義和計(jì)算重測信度(test-retestreliability)是指用同一量表對同一組被試施測兩次所得結(jié)果的一致性程度。皮爾遜積差相關(guān)系數(shù)誤差來源:測量時(shí)間不同所帶來的隨機(jī)誤差2.使用的前提條件所測量的心理特質(zhì)必須是穩(wěn)定的;練習(xí)和遺忘的效果基本上相互抵消;在兩次施測的間隔時(shí)期內(nèi),被試在所要測查的心理特質(zhì)方面沒有獲得更多的學(xué)習(xí)和訓(xùn)練。二、復(fù)本信度1.含義和計(jì)算復(fù)本信度(Alternate-formreliability)是指兩個(gè)平行的測驗(yàn)測量同一批被試所得結(jié)果的一致性程度。皮爾遜積差相關(guān)系數(shù)等值性系數(shù):兩個(gè)復(fù)本測驗(yàn)是同時(shí)連續(xù)施測的穩(wěn)定等值系數(shù)(重測復(fù)本信度):兩個(gè)復(fù)本測驗(yàn)是相距一段時(shí)間分兩次施測的。

2.使用的前提條件l

兩測驗(yàn)真正平行;l

被試要有條件接受兩個(gè)測驗(yàn)。三、分半信度1.含義和計(jì)算分半信度(split-halfreliability)是指將一個(gè)測驗(yàn)分成對等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。

校正后的皮爾遜積差相關(guān)系數(shù)

校正公式:斯皮爾曼-布朗公式rxx=2rhh/(1+rhh)常見的分半方法是按測題序號奇偶分半:

測驗(yàn)題目按某種順序(如難度)排列;

如果是隨機(jī)排列的題目,則必須是所有題目是平等的(要么難度相等,要么性質(zhì)一致,是測同一個(gè)心理特質(zhì)的);

如果測驗(yàn)有多個(gè)分量表,應(yīng)在分量表內(nèi)部排好順序,再把各分量表的兩半組合起來求相關(guān)。弗朗那根公式:rxx=2[1-(Sa2+Sb2)/Sx2]盧侖公式:rxx=1-Sd2/Sx2

2.使用的前提條件一個(gè)測驗(yàn)可以分為對等的兩半時(shí)四、同質(zhì)性信度1.含義同質(zhì)性信度(homogeneityreliability),也叫內(nèi)部一致性系數(shù),是指測驗(yàn)內(nèi)部所有題目間的一致性程度。

2.計(jì)算及適用范圍

rxx=K/rij[1+(K-1)rij]KR20公式:rxx=[K/(K-1)][1-(Σpiqi)/Sx2]pi為答對第i題的人數(shù)的比例;qi為答錯(cuò)第i題的人數(shù)的比例。K為題目數(shù),Sx2為測驗(yàn)總分的變異。KR21公式:rxx=[K/(K-1)][1-(Kpq)/Sx2]

克龍巴赫α系數(shù):α

=[K/(K-1)][1-(ΣSi2)/Sx2]

荷伊特信度:rxx=1-MS人×題/MS人因子分析一般用于預(yù)測的測驗(yàn)或?qū)W績測驗(yàn)可不考慮同質(zhì)性。而驗(yàn)證理論構(gòu)想時(shí)必須考慮同質(zhì)性。因此,同質(zhì)性不但與信度有關(guān),還與效度有關(guān)。五、評分者信度1.含義和計(jì)算評分者信度(scorerreliability)是指多個(gè)評分者給同一批人的答卷進(jìn)行評分的一致性程度。

2人時(shí):相關(guān)系數(shù)多人時(shí):肯德爾和諧系數(shù)W=12[ΣRi2-(ΣRi)2/N]/[K2(N3-N)](評分者人數(shù)K=3~20;被評者人數(shù)N=3~7時(shí),查W表檢驗(yàn))

RI為第i個(gè)被試被評的水平等級之和信度誤差變異來源重測信度時(shí)間取樣復(fù)本信度(連續(xù)施測)內(nèi)容取樣復(fù)本信度(間隔施測)時(shí)間與內(nèi)容取樣分半信度內(nèi)容取樣同質(zhì)性信度內(nèi)容取樣和內(nèi)容的異質(zhì)性評分者信度評分者間的差異各種信度系數(shù)相應(yīng)誤差變異的來源第三節(jié)提高測量信度的方法一、影響測量信度的主要因素(一)被試方面被試團(tuán)體同質(zhì)性越高(個(gè)體差異越小),所得相關(guān)系數(shù)(信度)就越低。被試團(tuán)體異質(zhì)性越高(個(gè)體差異越大),所得相關(guān)系數(shù)(信度)就越高。

(二)主試方面

指導(dǎo)語、態(tài)度、期望、評分主觀等(三)施測情境(四)測量工具測驗(yàn)長度:測驗(yàn)越長,信度越高。測驗(yàn)難度:過難或過易都會(huì)使個(gè)體間得分差異減小,降低信度。測驗(yàn)內(nèi)容:試題取樣不當(dāng),內(nèi)部一致性低,題意模糊,信度則低。(五)兩次施測的間隔時(shí)間間隔時(shí)間越短,信度越高;間隔時(shí)間越長,信度越低。二、提高測量信度的常用方法1.適當(dāng)增加測驗(yàn)的長度2.使測驗(yàn)中所有試題的難度接近正態(tài)分布,并控制在中等水平3.努力提高測驗(yàn)試題的區(qū)分度4.選取恰當(dāng)?shù)谋辉噲F(tuán)體,提高測驗(yàn)在各同質(zhì)性較強(qiáng)的亞團(tuán)體上的信度5.主試者嚴(yán)格執(zhí)行施測規(guī)程,評分者嚴(yán)格按照標(biāo)準(zhǔn)給分,施測場地按測驗(yàn)手冊的要求進(jìn)行布置,減少無關(guān)因素的干擾第四節(jié)信度的特殊問題一、速度測驗(yàn)的信度問題因?yàn)樗俣葴y驗(yàn)的題目難度都很低,所以不能用奇偶分半求分半信度;可以將測驗(yàn)分兩半來施測。因?yàn)閹缀醪豢赡馨杨}目做完,所以同質(zhì)性信度不適用??梢杂弥販y信度和復(fù)本信度。二、標(biāo)準(zhǔn)參照測驗(yàn)的信度問題總體越同質(zhì),相關(guān)系數(shù)越低。所以,用通常的方法來算標(biāo)準(zhǔn)參照測驗(yàn)的信度是不適當(dāng)?shù)???梢杂脧?fù)本,通過人數(shù)的百分比差別越小,信度越高。三、分測驗(yàn)的信度除整個(gè)測驗(yàn)的信度外,各個(gè)分測驗(yàn)也應(yīng)有信度,否則,從分測驗(yàn)得分來做推論就會(huì)出問題。四、差異的信度比較兩門課成績的差異,若兩門課的信度都不可靠時(shí),二者的差別更不可靠。五、行為改變(變遷)的測量行為改變:要求測驗(yàn)對分?jǐn)?shù)的差異越敏感越好信度:二者的矛盾難以調(diào)和信度好壞的判斷標(biāo)準(zhǔn)標(biāo)準(zhǔn)化能力或?qū)W績測驗(yàn):>0.90人格測驗(yàn):>0.80教師自編學(xué)績測驗(yàn):>0.60測驗(yàn)使用時(shí)的信度標(biāo)準(zhǔn)一般來說,當(dāng)信度<0.70,測驗(yàn)不能用于對個(gè)人作出評價(jià)與預(yù)測,而且不能作團(tuán)體間比較;當(dāng)0.70≤信度<0.85時(shí),可用于團(tuán)體比較;當(dāng)信度≥0.85時(shí),才能用來鑒別或預(yù)測個(gè)人成績。測量效度第一節(jié)效度概述一、什么是效度效度(validity)是指一個(gè)測驗(yàn)或量表實(shí)際能測出其所要測的心理特質(zhì)的程度。(1)效度是一個(gè)相對的概念:每個(gè)測量工具都有自己的目的。(2)效度是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。(3)判斷一個(gè)測量是否有效要從多方面收集證據(jù)操作定義:效度=SV2/SX2=rXY2SV2SI2SE2SX2ST2

二、效度與信度的關(guān)系(一)信度高是效度高的必要而非充分的條件一個(gè)測驗(yàn)效度高,其信度也必然高;但一個(gè)測驗(yàn)信度高,其效度不一定高。

(二)測驗(yàn)的效度受它的信度制約rXY≤rXX一個(gè)測驗(yàn)的信度必然比效度高,至少相等。第二節(jié)內(nèi)容效度一、內(nèi)容效度的性質(zhì)內(nèi)容效度(contentvalidity)是指測驗(yàn)題目對有關(guān)內(nèi)容或行為取樣的適當(dāng)程度,即一個(gè)測驗(yàn)實(shí)際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。因此,一個(gè)測驗(yàn)要有內(nèi)容效度必須具備兩個(gè)條件:(1)要有定義完好的內(nèi)容范圍(2)測驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。二、內(nèi)容效度的確定方法(一)邏輯分析法:專家判斷根據(jù)自己的知識經(jīng)驗(yàn)對量表的有效性(邏輯性)作出判斷,也稱邏輯效度。為使內(nèi)容效度的判斷過程更客觀,一般采用下列步驟:①確定測驗(yàn)內(nèi)容的總體范圍;②編制雙向細(xì)目表;③編制評定量表,從測驗(yàn)內(nèi)容所測的技能、題目對所定義的范圍的覆蓋率、各種題目數(shù)量和分?jǐn)?shù)的比例以及題目形式的適當(dāng)性等方面,對測驗(yàn)作出總的評價(jià)。(二)統(tǒng)計(jì)方法:用兩個(gè)測驗(yàn)復(fù)本來測同一批被試,若相關(guān)高,則內(nèi)容效度可能高,但若相關(guān)低,則說明必有一個(gè)測驗(yàn)缺乏內(nèi)容效度。

(三)經(jīng)驗(yàn)法:再測法前測→教學(xué)→后測如果后測成績優(yōu)于前測成績,說明該測驗(yàn)具有一定的內(nèi)容效度。三、內(nèi)容效度的特點(diǎn)和評價(jià)1.適用范圍:內(nèi)容效度主要應(yīng)用于成就測驗(yàn),也適合于某些用于選拔和分類的職業(yè)測驗(yàn)。但不適用于能力傾向測驗(yàn)和人格測驗(yàn)。時(shí)間性2.缺乏理想的數(shù)量指標(biāo)3.內(nèi)容效度不是表面效度表面效度(surfacevalidity):外行人對某個(gè)測驗(yàn)從表面上看好像是測某種心理特質(zhì)的程度。并不是一種真正的效度。人格測驗(yàn)要求表面效度不宜過高。第三節(jié)結(jié)構(gòu)效度一、構(gòu)想效度的定義結(jié)構(gòu)效度(structurevalidity)是指一個(gè)測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)或特質(zhì)的程度,或者說測驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。

特點(diǎn):(1)具有不同理論構(gòu)思的測驗(yàn),其結(jié)構(gòu)效度是無法進(jìn)行比較的;(2)結(jié)構(gòu)效度有時(shí)很難獲得;(3)結(jié)構(gòu)效度沒有單一的指標(biāo),是由各方面的證據(jù)累積起來進(jìn)行評價(jià)的。二、結(jié)構(gòu)效度的確定方法結(jié)構(gòu)效度確立的一般步驟:(1)提出理論框架;(2)依據(jù)理論框架推演出有關(guān)測驗(yàn)成績的假設(shè);(3)用邏輯或?qū)嵶C的方法來證明假設(shè)。具體方法:(1)測驗(yàn)內(nèi)部尋找證據(jù)法l分析測驗(yàn)的內(nèi)容效度:若內(nèi)容效度高,說明其結(jié)構(gòu)效度也高;l分析被試對題目反應(yīng)的特點(diǎn):有無社會(huì)稱許性的題目,如“當(dāng)事情不順我意時(shí),我時(shí)常動(dòng)怒?!睂υ擃}的回答,也許反映不了要測的性格。l計(jì)算測驗(yàn)的同質(zhì)性信度:分半信度、α系數(shù)、KR20、KR21(2)測驗(yàn)之間尋找證據(jù)法l

相容效度:新老測驗(yàn)之間的相關(guān)(兩測驗(yàn)測的是同一心理特質(zhì))。若相關(guān)高,則說明新測驗(yàn)可能有較高的效度。l

區(qū)分效度:新老測驗(yàn)之間的相關(guān)(兩測驗(yàn)測的不是同一心理特質(zhì)),若相關(guān)低,則說明新測驗(yàn)可能有較高的效度。l

因子分析法:得出的因素符合理論的構(gòu)思,說明效度高。(3)考察測驗(yàn)的實(shí)證效度法l

根據(jù)效標(biāo)把被試分組,考察其得分差異。l根據(jù)測驗(yàn)得分差異把被試分組,考察其所測特質(zhì)(行為表現(xiàn))的差異。(4)多種特質(zhì)-多種方法矩陣法方法:1、2、3特質(zhì):A、B、CMultitrait-multimethodmatrix

多特質(zhì)多方法矩陣

Method1TeacherratingMethod2TestsMethod3Observers’ratingA1B1C1A2B2C2A3B3C3M1A1誠實(shí)(.89)B1攻擊性.43(.89)C1智力.36.32(.76)M2A2誠實(shí).62.03.20(.93)B2攻擊性.22.70.13.40(.94)C2智力.10.13.64.22.30(.84)M3A3誠實(shí).59.11.02.60.20.21(.94)B3攻擊性.14.82-.16.13.61.23.30(.92)C3智力.21.10.72.06.19.52.49.36(.85)rofdifferentmethod/sametrait:

ConvergentvalidityReliabilityWhenrsmdt>rdmdt

MethodbiasDiscriminantvalidityrdmdtofdifferentmethod/differenttraitrsmdtofsamemethod/differenttrait(5)搜集某些變異上的證據(jù)智力隨年齡變化而變化三、對構(gòu)想效度的評價(jià)1.有些構(gòu)想概念模糊,缺乏一致的定義2.沒有明確的操作步驟與程序3.沒有單一的數(shù)量指標(biāo)第四節(jié)實(shí)證效度一、實(shí)證效度的定義實(shí)證效度是指一個(gè)測驗(yàn)對處于特定情境中的個(gè)體的行為進(jìn)行估計(jì)的有效性。被估計(jì)的行為是檢驗(yàn)測驗(yàn)效度的標(biāo)準(zhǔn),簡稱效標(biāo)。所以,實(shí)證效度又稱效標(biāo)關(guān)聯(lián)效度(criterion-relatedvalidity)。

同時(shí)效度(concurrentvalidity):測驗(yàn)分?jǐn)?shù)與效標(biāo)資料是同時(shí)收集的。預(yù)測效度(predictivevalidity):先獲得測驗(yàn)分?jǐn)?shù),隔一段時(shí)間后,再收集效標(biāo)資料。二、效標(biāo)(1)效標(biāo)與效標(biāo)測量效標(biāo)(criterion)就是衡量一個(gè)測驗(yàn)是否有效的外在標(biāo)準(zhǔn)。

觀念效標(biāo):理論定義,如“大學(xué)的成功”

效標(biāo)測量:操作定義,如大學(xué)成績

常用的效標(biāo):學(xué)業(yè)成就、臨床診斷、實(shí)際工作表現(xiàn)、特殊訓(xùn)練成績、不同團(tuán)體的總體表現(xiàn)、先前有效的測驗(yàn)、等級評定。(2)效標(biāo)的特性a.多樣性:一個(gè)測驗(yàn)可能有不同的觀念效標(biāo),同一個(gè)觀念效標(biāo)又可能有不同的效標(biāo)測量。b.復(fù)雜性:幾乎每一種效標(biāo)行為都由多種特質(zhì)構(gòu)成,包含復(fù)雜的成分。c.特殊性:即使一個(gè)普通的效標(biāo),在應(yīng)用時(shí)也有特殊性。d.時(shí)間性:近期效標(biāo)與最后效標(biāo)(3)效標(biāo)測量的條件a.有效性:效標(biāo)測量能真正反映觀念效標(biāo)。b.可靠性:有較高的信度c.客觀性:效標(biāo)測量必須能真正反映觀念效標(biāo),防止效標(biāo)污染。

效標(biāo)污染(criterioncontamination)是指評定者知道被試的測驗(yàn)分?jǐn)?shù),因而影響到對效標(biāo)的客觀評定。d.實(shí)用性:經(jīng)濟(jì)實(shí)用三、實(shí)證效度的確定方法(1)相關(guān)法測驗(yàn)分?jǐn)?shù)與效標(biāo)測量之間的相關(guān)系數(shù)。

(2)區(qū)分法測驗(yàn)→工作→效標(biāo)測量(工作成績)按工作成績分高低兩組,如工作成績高,測驗(yàn)得分也高;工作成績低,測驗(yàn)得分也低,說明該測驗(yàn)是有一定效度的。工作表現(xiàn)測驗(yàn)成績合格不合格合格AC不合格BD(3)命中率總命中率=(A+D)/(A+B+C+D)正命中率=A/(A+C)(4)功利率對使用測驗(yàn)所需的費(fèi)用和所得到的收益進(jìn)行比較,看是否利大于弊。一個(gè)測驗(yàn)如果簡單易行,省時(shí)省錢,不經(jīng)過特殊訓(xùn)練的人也能掌握,又適合于團(tuán)體施測,那么,即使效度低一些,也會(huì)有人使用。反之,只有效度極高,能給人帶來很大好處時(shí),才會(huì)使用。第五節(jié)提高測量效度的方法一、影響測量效度的因素1.測驗(yàn)的構(gòu)成

測驗(yàn)長度與效度的關(guān)系:

r(Kx)y=Krxy/√K(1-rxx+Krxx)

2.測驗(yàn)的實(shí)施過程3.接受測驗(yàn)的被試常模團(tuán)體的同質(zhì)性影響到對被試測驗(yàn)得分的解釋,進(jìn)而影響到測驗(yàn)的效度。測驗(yàn)偏倚(testbias)是指用不適用于被試的標(biāo)準(zhǔn)來解釋被試的測驗(yàn)得分,因而造成解釋的偏差。4.所選效標(biāo)的性質(zhì)測量行為與所選效標(biāo)的相似性越高,效度越高。測驗(yàn)分?jǐn)?shù)與效標(biāo)行為之間是否是線性關(guān)系,如果不是線性關(guān)系,求皮爾遜相關(guān)就會(huì)低估效度。效標(biāo)本身的測量越可靠,效度就可能越高。5.測量的信度二、提高測量效度的方法(1)精心編制測驗(yàn)量表,避免出現(xiàn)較大的系統(tǒng)誤差(2)妥善組織測驗(yàn),控制隨機(jī)誤差(3)創(chuàng)設(shè)標(biāo)準(zhǔn)的應(yīng)試情境,讓每個(gè)被試都能發(fā)揮正常的水平(4)選好正確的效標(biāo),定好恰當(dāng)?shù)男?biāo)測量,正確地使用有關(guān)公式第六節(jié)效度資料的概化所謂概化,是指在一定條件下得出的結(jié)論能否適用于其他情況。測驗(yàn)的效度和信度一樣,都與特定情境有關(guān),只有在具體情境下的效度,而沒有籠統(tǒng)談?wù)撃骋粶y驗(yàn)的效度。一、效度概化的幾個(gè)方面1預(yù)測源的概化使用同一測驗(yàn)的不同復(fù)本是否同樣有效?同一測驗(yàn)對不同分?jǐn)?shù)水平的人的預(yù)測是否同樣有效?2效標(biāo)的概化采用不同種類或不同時(shí)距的效標(biāo),測驗(yàn)是否同樣有效?對于效標(biāo)的不同分?jǐn)?shù)水平是否預(yù)測得一樣好?3施測情境的概化不同的施測者、不同的施測條件以及在不同的指導(dǎo)語或心向下做測驗(yàn)是否同樣有效?4被試團(tuán)體的概化測驗(yàn)對于取自同一總體的另一樣本是否同樣有效?測驗(yàn)對于不同性別、不同年齡、不同教育水平、不同社會(huì)經(jīng)濟(jì)地位、不同地區(qū)、不同民族、不同學(xué)校、不同職業(yè)的被試是否同樣有效?5建立效度方法的概化用不同方法得到的效度指標(biāo)是否一致?不同的效度之間是否有矛盾?二、交叉效度分析交叉效度分析是考察效度概化能力的一種方法,只涉及被試樣本的概化。這種方法是對兩個(gè)獨(dú)立取自同一總體的樣本分別建立預(yù)測源-效標(biāo)關(guān)系,看從一個(gè)樣本中得到的效度資料是否適用于另一樣本。計(jì)算測驗(yàn)效度所依據(jù)的樣本必須與選擇項(xiàng)目所依據(jù)的被試樣本不同。如果使用同一樣本,則會(huì)使效度系數(shù)假性的高。實(shí)質(zhì)是循環(huán)論證。測驗(yàn)的項(xiàng)目分析項(xiàng)目分析包括定性分析和定量分析。定性分析包括考慮內(nèi)容效度、題目編寫的恰當(dāng)性和有效性等;定量分析主要是指題目難度和區(qū)分度的測量。對項(xiàng)目進(jìn)行篩選和修訂,可以提高測驗(yàn)的信度和效度。第一節(jié)測驗(yàn)的難度一、難度(difficulty)的意義難度,指項(xiàng)目的難易程度。在最高作為測驗(yàn)中,稱為“難度”,而在典型作為測驗(yàn)中,則指“通俗性”。兩者都是指在總體中,能夠正確或確切回答某項(xiàng)目的人數(shù)。二、難度的計(jì)算(一)二分法記分項(xiàng)目的難度1.通過率

P=R/N

2.極端分組法(上下27%)

P=(PH+PL)/2

(二)非二分法記分項(xiàng)目的難度

P=X/XmaxX為所有被試在該項(xiàng)目上的平均得分,Xmax為該項(xiàng)目的滿分。三、測驗(yàn)難度水平的確定效標(biāo)參照測驗(yàn)、掌握測驗(yàn):不考慮難度;選拔測驗(yàn):難度=錄取率;

對于選擇題來說,難度一般應(yīng)大于猜測概率;無論是速度測驗(yàn),還是難度測驗(yàn),一般都應(yīng)防止被試得滿分,因?yàn)闈M分的意義是不明確的。

大體而言,難度為0.50時(shí)最理想,此時(shí)項(xiàng)目具有最大的鑒別力。但在實(shí)際操作中,讓所有項(xiàng)目難度都到達(dá)0.50困難很大,而且也不必要,一般只需使項(xiàng)目的平均難度接近0.50,而各個(gè)項(xiàng)目的難度在0.50±0.20之間變化。四、難度的等距變換根據(jù)正態(tài)分布表,將難度P作為正態(tài)曲線下的面積,轉(zhuǎn)換成相應(yīng)的Z分?jǐn)?shù),這就是等距量表。

P

Y0ZZYP.00.39894.00000.50.35207.191461.00.24197.341341.50.12952.433191.96.05844.475002.00.05399.477252.50.01753.493792.58.01431.495063.00.00443.498653.50.00087.499773.99.00014.49997美國教育服務(wù)中心以Δ作為難度指標(biāo):Δ=13+4Z

P=.0013Z=+3Δ=25P=.16Z=+1Δ=17P=.50Z=0Δ=13P=.84Z=-1Δ=9P=.9987Z=-3Δ=1五、難度對測驗(yàn)的影響(一)測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的分布形態(tài)

難度大,正偏態(tài)

難度低,負(fù)偏態(tài)(二)測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的離散程度測驗(yàn)過難或過易,分?jǐn)?shù)全距縮小,信度降低。P=0.50時(shí)最佳第二節(jié)測驗(yàn)的區(qū)分度一、區(qū)分度的意義區(qū)分度(discrimination)是指測驗(yàn)項(xiàng)目對被試心理品質(zhì)水平差異的區(qū)分能力或鑒別能力。

項(xiàng)目的區(qū)分度是測驗(yàn)是否有效的“指示器”。二、區(qū)分度的計(jì)算(一)項(xiàng)目鑒別指數(shù)法1.鑒別指數(shù)(indexofdiscrimination,D)的計(jì)算D=PH-PL取值范圍:-1~+1鑒別指數(shù)題目評價(jià)0.40以上很好0.30~0.39良好,修改會(huì)更好0.20~0.29尚可,仍需修改0.19以下差,必須淘汰2.極端組的劃分27%規(guī)則一般情況下,取上下25%~33%均可。樣本少時(shí),可以取50%注意:由于計(jì)算機(jī)的方便使用,可以上下50%作為劃分高低組的標(biāo)準(zhǔn),或者多分幾組,對區(qū)分度和難度作詳細(xì)分析。因?yàn)橹蝗∩舷聝啥?,只利用了一部分資料,浪費(fèi)了很多信息,有可能得出錯(cuò)誤結(jié)論。(二)相關(guān)法(項(xiàng)目-總分相關(guān))1.點(diǎn)二列相關(guān)Xp-Xqrpb=√pqSt

2.二列相關(guān)Xp-XqpqXp-Xtprb=?或rb=?StySty3.φ相關(guān)ad-bcrφ=√(a+b)(c+d)(a+c)(b+d)

4.積差相關(guān)(三)項(xiàng)目特征曲線(itemcharacteristiccurve,ICC)項(xiàng)目特征曲線描述了效標(biāo)分?jǐn)?shù)不同的被試在該項(xiàng)目上的通過率。曲線坡度越陡,鑒別力越好,預(yù)測的誤差越小。率概的目項(xiàng)答回確正1.000.000.50低中高能力鑒別力較好低中高能力率概的目項(xiàng)答回確正1.000.000.50低中高能力率概的目項(xiàng)答回確正1.000.000.50鑒別力為負(fù)鑒別力較低率概的目項(xiàng)答回確正1.000.000.50低中高能力ABC難度不同的3個(gè)項(xiàng)目的ICC多項(xiàng)選擇中每個(gè)選項(xiàng)的ICC率概的目項(xiàng)答回確正1.000.000.50低中高能力ABCD三、區(qū)分度與難度的關(guān)系難度(P)區(qū)分度(D)1.0000.900.200.800.400.700.600.600.800.5010.400.800.300.600.200.400.100.200.000難度和區(qū)分度都是針對一定團(tuán)體而言的。一般來說,較難的項(xiàng)目對高水平被試區(qū)分度高,較易的項(xiàng)目對低水平被試的區(qū)分度高。四、區(qū)分度的相對性(一)不同的計(jì)算方法,所得區(qū)分值不同

區(qū)分度有幾種計(jì)算方法?

(二)樣本容量大小影響相關(guān)法區(qū)分度值的大小

樣本越大,區(qū)分度越……(三)分組標(biāo)準(zhǔn)影響鑒別指數(shù)

分組越極端,區(qū)分度越……(四)被試樣本的同質(zhì)性程度影響區(qū)分度值的大小

樣本越同質(zhì),區(qū)分度越……第三節(jié)項(xiàng)目分析的特殊問題一、多重選擇題的項(xiàng)目分析(誘答分析)對于多重選擇題,除了分析難度和區(qū)分度外,還要對每個(gè)選項(xiàng)進(jìn)行分析。下列哪一個(gè)最有可能是偏執(zhí)型精神分裂癥患者的次級癥狀:A幻聽B癱瘓C記憶喪失D厭食

如果所有被試都選擇某一正確的選項(xiàng),說明該選項(xiàng)……如果沒有一個(gè)被試選擇某個(gè)錯(cuò)誤選項(xiàng),說明該選項(xiàng)……如果所有被試都選擇某個(gè)錯(cuò)誤選項(xiàng),說明該選項(xiàng)……如果高分組被試的選擇集中在兩個(gè)選項(xiàng)上,說明該選項(xiàng)……如果高分組和低分組對正確選項(xiàng)的選擇沒有區(qū)別,說明該選項(xiàng)……如果所有被試都未回答某個(gè)題目,說明該題……如果選擇各個(gè)選項(xiàng)的人數(shù)幾乎相等,說明該題……二、速度測驗(yàn)的項(xiàng)目分析對前面部分的測驗(yàn)項(xiàng)目,難度和區(qū)分度都……對后面部分的測驗(yàn)項(xiàng)目,難度和區(qū)分度都……三、標(biāo)準(zhǔn)參照測驗(yàn)的項(xiàng)目分析在標(biāo)準(zhǔn)參照測驗(yàn)中,無須考慮項(xiàng)目的難度和區(qū)分度,只要項(xiàng)目的內(nèi)容很重要就行。也可以通過比較教學(xué)或訓(xùn)練的前測和后測結(jié)果來進(jìn)行項(xiàng)目分析,用來說明教學(xué)或訓(xùn)練的效果以及項(xiàng)目編制是否適當(dāng)。四、項(xiàng)目-團(tuán)體的相互作用具有不同性質(zhì)(性別、種族、職業(yè)等)的團(tuán)體,在測驗(yàn)得分上也存在差異,即同樣的項(xiàng)目可能有不同的難度。如果測驗(yàn)要求對所有個(gè)體都相對“公平”,那么,就應(yīng)該排除那些有利于或不利于不同性質(zhì)的亞團(tuán)體的項(xiàng)目;如果測驗(yàn)的目的就是為了考察不同亞團(tuán)體的差異,那么,就應(yīng)選擇使團(tuán)體差異盡可能大的題目。五、有效性與可靠性的矛盾同質(zhì)性信度要求項(xiàng)目之間有高相關(guān),各項(xiàng)目的難度均等;對于預(yù)測效度來說,因?yàn)樾?biāo)的變異范圍較大,如果項(xiàng)目越同質(zhì),那么效標(biāo)關(guān)聯(lián)效度則低;因此,效標(biāo)關(guān)聯(lián)效度要求各項(xiàng)目之間要有一定的差異,即項(xiàng)目之間相關(guān)低,這樣才能保證測驗(yàn)得分與效標(biāo)之間有高相關(guān),即高的效標(biāo)關(guān)聯(lián)效度。因此,對于多數(shù)心理測驗(yàn)來說,項(xiàng)目之間中等程度的相關(guān),可使二者調(diào)和,獲得較為滿意的(同質(zhì)性)信度和(效標(biāo)關(guān)聯(lián))效度。心理測驗(yàn)的編制第一節(jié)編制心理測驗(yàn)的基本程序一、確定測驗(yàn)?zāi)康模ㄒ唬┟鞔_測量對象

年齡、性別、職業(yè)、受教育程度、經(jīng)濟(jì)狀況、民族、文化背景等。(二)明確測量目標(biāo)

心理變量或行為特征。必須有操作定義,目標(biāo)要非常具體。(三)明確測量用途

用于描述、還是診斷,或用于預(yù)測?二、制定編題計(jì)劃通常是一張雙向細(xì)目表,指出測驗(yàn)所包含的內(nèi)容和要測定的各種技能,以及對每一個(gè)內(nèi)容和技能的相對重視程度。例:小學(xué)自然常識測驗(yàn)編題計(jì)劃知識理解應(yīng)用分析綜合評價(jià)合計(jì)生物世界35632120資源利用23311010動(dòng)力與機(jī)械23420112物質(zhì)與能量56832125氣象24322013宇宙25410012地球2221108合計(jì)1828301388100三、編輯測驗(yàn)項(xiàng)目(一)收集測驗(yàn)資料(1)資料要豐富(2)資料要有普遍性(3)資料要有趣味性

(二)選擇項(xiàng)目形式

紙筆測驗(yàn)還是操作測驗(yàn)?是客觀題還是主觀題?概念和原理的記憶——簡答題辨別和判斷——選擇題綜合運(yùn)用——論文題幼兒——口頭測驗(yàn)文盲、半文盲、聾啞——操作測驗(yàn)人多、經(jīng)費(fèi)有限——團(tuán)體測驗(yàn)人少——個(gè)體測驗(yàn)(三)編寫測驗(yàn)項(xiàng)目題目范圍要與雙向細(xì)目表一致;題目數(shù)量要比最終所需要的數(shù)量多,以便篩選或編制復(fù)本;題目的難度應(yīng)有一定的分布范圍;用詞力求清楚明白。四、試測與項(xiàng)目分析試測取樣施測過程與施測情景時(shí)限可稍寬一些記錄被試的各種反應(yīng)。項(xiàng)目分析質(zhì)的分析:內(nèi)容取樣、題目的思想性、表達(dá)是否清楚量的分析:難度、區(qū)分度、備選項(xiàng)分析五、合成測驗(yàn)(一)測驗(yàn)項(xiàng)目的選擇指標(biāo)有三:要選擇那些能夠測量所要測量的東西的項(xiàng)目;難度區(qū)分度(二)測驗(yàn)項(xiàng)目的編排

并列直進(jìn)式混合螺旋式(三)編制復(fù)本

各份復(fù)本必須等值。等值要符合下列條件:各份測驗(yàn)測量的是同一種心理特性。各份測驗(yàn)具有相同的內(nèi)容和形式。各份測驗(yàn)的題目不應(yīng)重復(fù)。各份測驗(yàn)題目數(shù)量相等,難度和區(qū)分度大體相同。各份測驗(yàn)的分?jǐn)?shù)分布(平均數(shù)和標(biāo)準(zhǔn)差)大致相等。復(fù)本編好后,應(yīng)再測一次,以確保各份測驗(yàn)的等值。六、測驗(yàn)標(biāo)準(zhǔn)化測驗(yàn)的標(biāo)準(zhǔn)化是指測驗(yàn)的編制、實(shí)施、評分以及分?jǐn)?shù)解釋都有統(tǒng)一的標(biāo)準(zhǔn),以減少無關(guān)因素對測驗(yàn)的影響。(一)測驗(yàn)內(nèi)容指測驗(yàn)內(nèi)容對所有被試都一樣。(二)施測過程測驗(yàn)情景指導(dǎo)語時(shí)限(三)測驗(yàn)評分為使評分盡可能客觀,有三點(diǎn)要求:對被試反應(yīng)的及時(shí)和清楚的記錄。特別是對口試和操作測驗(yàn)。要有一張標(biāo)準(zhǔn)答案或正確反應(yīng)的表格,即計(jì)分鍵。將被試的反應(yīng)和計(jì)分鍵比較,對反應(yīng)進(jìn)行分類。(四)測驗(yàn)分?jǐn)?shù)的解釋常模參照標(biāo)準(zhǔn)參照:內(nèi)容參照,結(jié)果參照七、鑒定測驗(yàn)(一)信度(二)效度(三)測驗(yàn)量表與常模

八、編寫測驗(yàn)說明書測驗(yàn)的目的和功用;編制測驗(yàn)的理論背景以及選擇題目的根據(jù)和測驗(yàn)的構(gòu)成;測驗(yàn)的實(shí)施方法、時(shí)限及注意事項(xiàng);測驗(yàn)的標(biāo)準(zhǔn)答案和評分方法;測驗(yàn)的信度和效度資料;常模資料。第二節(jié)測驗(yàn)題目的編制技術(shù)一、命題的一般原則試題要符合測驗(yàn)的目的。內(nèi)容取樣要有代表性。題目格式不要使被試產(chǎn)生誤解。文句要簡明扼要,既排除與解題無關(guān)的因素,又不可遺漏解題所依據(jù)的必要條件。要避免使用艱深的字詞。應(yīng)有不致引起爭論的確定答案(創(chuàng)造力測驗(yàn)、人格測驗(yàn)除外)。各個(gè)題目必須彼此獨(dú)立,不可互相牽連,不要使一個(gè)題目的回答影響另一個(gè)題目的回答。題目中不可含有暗示本題或其他題正確答案的線索。題目內(nèi)容不要超出受測團(tuán)體的知識和能力。所提問題應(yīng)避免涉及社會(huì)禁忌與個(gè)人隱私。施測與評分省時(shí)。二、測題的種類及編制固定應(yīng)答型題目,即客觀題,包括:選擇題、是非題、匹配題等。自由應(yīng)答型題目,即主觀題,包括:填充題、簡答題、應(yīng)用題、論文題、聯(lián)想題、操作題等。(一)選擇題題干+選項(xiàng)(正確選項(xiàng)與誘答選項(xiàng))多項(xiàng)條件選擇題:例如:已知小明的心理年齡是8歲4個(gè)月,實(shí)際年齡是9歲,其智商是多少?(a)85(b)90(c)92(d)92.6(e)100類別選擇題例如:艾森克是著名的_______心理學(xué)家。(a)兒童(b)工程(c)管理(d)人格(e)社會(huì)異類選擇題例如:下面哪位與其他人不屬于同一類人?(a)小布什(b)普京(c)胡錦濤(d)希拉克(e)科爾多項(xiàng)是非選擇題例如:下面兩個(gè)陳述哪一個(gè)正確?(1)2008年奧運(yùn)會(huì)在北京舉行。(2)美國首都是費(fèi)城。(a)1和2都對(b)1對2錯(cuò)(c)1錯(cuò)2對(d)都錯(cuò)因果條件選擇題例如:如果測驗(yàn)的真方差增加,但誤差方差不變,結(jié)果是:(a)測驗(yàn)信度增加(b)測驗(yàn)信度下降(c)測驗(yàn)總方差減小(d)測驗(yàn)的信度和總方差不變選擇題的優(yōu)點(diǎn):適用范圍廣;計(jì)分客觀;題意明確。缺點(diǎn):編制誘答選項(xiàng)較難;答案固定,測量范圍有限。編寫選擇題的原則:題干所提的問題必須明確選項(xiàng)要簡短,必要的敘述或相同的修飾語應(yīng)放在題干中;每個(gè)選項(xiàng)的性質(zhì)要一致;選項(xiàng)最好按邏輯順序排列;選項(xiàng)之間不應(yīng)有重疊;誘答選項(xiàng)的錯(cuò)誤不要太明顯;不要把選項(xiàng)夾在題干中間;每題只能圍繞一個(gè)中心,不能有歧義。(二)是非題每題只包含一個(gè)概念,避免兩個(gè)以上的概念在同一題中出現(xiàn),造成題目似是而非,或半對半錯(cuò)。避免使用具有暗示性的特殊詞語,如“絕對”、“完全”、“有時(shí)”、“可能”等。盡量采用正面肯定的敘述,避免反面陳述或雙重否定的句子。如“生物沒有不是由細(xì)胞組成的?!薄笆恰迸c“非”的題數(shù)應(yīng)大致相等,且隨機(jī)排列。(三)論文題對答題有時(shí)間限制;不要有任選的題目,因?yàn)閮深}很難做到等值;客觀、統(tǒng)一的評分細(xì)則。測驗(yàn)的實(shí)施和計(jì)分第一節(jié)測驗(yàn)的實(shí)施一、測驗(yàn)實(shí)施前的準(zhǔn)備工作向被試預(yù)告測驗(yàn):測驗(yàn)的時(shí)間、地點(diǎn)、內(nèi)容,讓被試做好心理準(zhǔn)備。熟悉測驗(yàn)程序:測驗(yàn)內(nèi)容、施測步驟、記分方法、分?jǐn)?shù)解釋。準(zhǔn)備測驗(yàn)材料。準(zhǔn)備測驗(yàn)環(huán)境:通風(fēng)、采光、噪聲、桌椅高度、桌面大小、掛牌以防止意外干擾等。熟悉測驗(yàn)的指導(dǎo)語:告訴被試如何選擇反應(yīng)形式(劃勾還是涂黑),說明時(shí)間限制,例題演示,有時(shí)告知被試測驗(yàn)?zāi)康摹6?、測驗(yàn)的具體實(shí)施按測驗(yàn)手冊要求實(shí)施測驗(yàn)??刂茰y驗(yàn)焦慮,不講威嚇被試的話。與被試建立良好的協(xié)調(diào)關(guān)系(rapport)。及時(shí)和清楚地記錄被試的反應(yīng)。對特殊問題有所準(zhǔn)備(如作弊、被試不配合等)。第二節(jié)測驗(yàn)的計(jì)分和分?jǐn)?shù)的合成一、計(jì)分的一般程序(一)計(jì)分的基本步驟1及時(shí)和清楚地記錄被試的反應(yīng)2制作標(biāo)準(zhǔn)答案,也稱計(jì)分鍵3將反應(yīng)和計(jì)分鍵相比較,給反應(yīng)歸類或賦予分?jǐn)?shù)值(二)論文題計(jì)分盲審多個(gè)主試評分細(xì)分計(jì)分標(biāo)準(zhǔn)(三)客觀題計(jì)分人工計(jì)分和機(jī)器計(jì)分猜測校正公式S=R-W/(K-1)

S—校正后的分?jǐn)?shù);R—被試答對的題目數(shù);W—被試答錯(cuò)的題目數(shù);K—選擇項(xiàng)目數(shù)是否需要對猜測進(jìn)行校正?贊成的理由:反對的理由:(二)測驗(yàn)分?jǐn)?shù)的合成1分?jǐn)?shù)合成的種類(1)項(xiàng)目的組合把各個(gè)題目得分相加,得到量表分或分測驗(yàn)分。分等量加權(quán)和不等量加權(quán)。(2)分測驗(yàn)或量表的組合把各個(gè)分測驗(yàn)得分相加,得到量表總分。(3)測驗(yàn)或預(yù)測源的組合

同時(shí)運(yùn)用多個(gè)測驗(yàn)得分進(jìn)行預(yù)測2分?jǐn)?shù)合成的方法(1)臨床診斷——直覺合成

從整體上進(jìn)行的定性分析,靈活性強(qiáng),有針對性。(2)加權(quán)求和合成單位加權(quán):各原始分相加Xc=X1+X2+X3+……+Xn等量加權(quán):如果各個(gè)分?jǐn)?shù)重要性相等,用標(biāo)準(zhǔn)分相加即可;Zc=Z1+Z2+Z3+……+Zn如果各個(gè)分?jǐn)?shù)的重要性不一樣,就要根據(jù)重要性不同,賦予不同的權(quán)重,即加權(quán)系數(shù)。Zc=W1Z1+W2Z2+W3Z3+……+WnZn(3)多重回歸用多種預(yù)測源分?jǐn)?shù)(測驗(yàn)分?jǐn)?shù))來預(yù)測未來結(jié)果。?=a+b1x1+b2x2+b3x3+……+bnxn

(4)多重分段高中畢業(yè)合格→政審合格→體檢合格→高考合格→錄取不合格不合格不合格不合格↓↓↓↓淘汰淘汰淘汰淘汰(5)輪廓分析(剖面圖分析)在MMPI中,如果在量表2和量表7上分?jǐn)?shù)高,即27/72,說明抑郁、焦慮不安,有神經(jīng)癥。測驗(yàn)結(jié)果的解釋原始分?jǐn)?shù)與導(dǎo)出分?jǐn)?shù)原始分?jǐn)?shù)(rawscore):將被試的反應(yīng)與標(biāo)準(zhǔn)答案相比較而獲得的測驗(yàn)分?jǐn)?shù)。原始分?jǐn)?shù)本身沒有多大意義。導(dǎo)出分?jǐn)?shù)(derivedscore):按照一定的規(guī)則,針對原始分進(jìn)行統(tǒng)計(jì)處理后獲得的分?jǐn)?shù)。導(dǎo)出分?jǐn)?shù)具有一定參照點(diǎn)和單位,可以相互比較。根據(jù)解釋分?jǐn)?shù)時(shí)的參照標(biāo)準(zhǔn)不同,可以將導(dǎo)出分?jǐn)?shù)分為兩大類:常模參照分?jǐn)?shù)標(biāo)準(zhǔn)參照分?jǐn)?shù):包括內(nèi)容參照分?jǐn)?shù),結(jié)果參照分?jǐn)?shù)。第一節(jié)參照常模的分?jǐn)?shù)解釋參照常模解釋分?jǐn)?shù),通常是將被試的分?jǐn)?shù)直接或間接地以在某個(gè)團(tuán)體中的相對等級或相對位置來表示。這個(gè)用來比較的參照團(tuán)體,稱為常模團(tuán)體(normgroup)。常模團(tuán)體的分?jǐn)?shù)分布,就是常模(norm)。一、常模團(tuán)體的組成(一)常模團(tuán)體的性質(zhì)由具有共同特征的人所組成的一組群體,或是該群體的一個(gè)樣本。任何一個(gè)測驗(yàn),都有許多可能的常模團(tuán)體。在制定常模時(shí),首先要確定常模團(tuán)體。在對常模參照分?jǐn)?shù)做解釋時(shí),也必須首先考慮常模團(tuán)體的組成。(二)確定常模團(tuán)體的注意事項(xiàng)1群體構(gòu)成的界限必須明確對每個(gè)常模團(tuán)體的性質(zhì)和特征的簡短且明確的描述。2常模團(tuán)體必須是所測群體的代表性樣本克服取樣偏差,采用正確的取樣方法:隨機(jī)取樣,系統(tǒng)抽樣,分層取樣。3取樣的過程必須明確且有詳盡的描述在測驗(yàn)手冊中,有關(guān)取樣的大小、取樣方法、取樣時(shí)間等的說明和描述,越明確、越詳盡越好。4樣本大小要適當(dāng)從統(tǒng)計(jì)學(xué)原理上說,樣本是越大越好,但考慮到經(jīng)濟(jì)、實(shí)用,樣本數(shù)量也不能無限擴(kuò)大。樣本大小可以根據(jù)以下幾方面來確定:

常模總體的數(shù)目??傮w數(shù)目小,則樣本數(shù)目也小;總體數(shù)目大,樣本數(shù)目也應(yīng)大。一般來說,樣本最好應(yīng)有30~100人;如果是全國性常模,一般應(yīng)有2000~3000人為宜。

總體性質(zhì)。總體性質(zhì)越復(fù)雜,樣本容量就越大。

測驗(yàn)結(jié)果的精確度。精確度要求越高,樣本量就越大。5常模團(tuán)體必須是近時(shí)的。6注意一般常模與特殊常模的結(jié)合二、常模參照分?jǐn)?shù)(normreferencedscore)主要有:發(fā)展量表、商數(shù)、百分位、標(biāo)準(zhǔn)分?jǐn)?shù)四大類。(一)發(fā)展量表1.心理年齡(mentalage)(智力年齡)指被試智力發(fā)展水平的年齡。單位是年(或歲)和12個(gè)等距的月。年齡量表最基本的假設(shè)是,隨年齡的增長,所測量的特質(zhì)有系統(tǒng)的改變。因此,不適用于成人。年齡量表的基本要素:(1)題目:可區(qū)分不同年齡組;(2)常模團(tuán)體:由各個(gè)年齡被試組成的有代表性樣本;(3)常模表2.年級當(dāng)量(gradeequivalents)即年級常模,用年級代替年齡,指把學(xué)生的測驗(yàn)成績與各年級學(xué)生的平均成績比較,看他相當(dāng)于幾年級的水平。年級常模的單位通常為10個(gè)月間隔。如5年級的分布為5-0到5-9。年級當(dāng)量只適用于一般課程,不適合只學(xué)1~2年的課程。年級當(dāng)量只適用于解釋本學(xué)年的水平,不適用于跨學(xué)年的。如一個(gè)五年級學(xué)生的年級當(dāng)量為8,并不能說他已經(jīng)掌握了8年級的課程。3.發(fā)展順序量表(ordinalscales)格塞爾發(fā)展順序量表格塞爾認(rèn)為,嬰幼兒的行為系統(tǒng)的建立是一個(gè)有次序的過程,反映了神經(jīng)系統(tǒng)的不斷成長和功能的分化,因而可以把每個(gè)成熟階段的行為模式作為智能診斷的依據(jù)。4周16周28周40周52周不能控制頭部,仰臥姿勢左右不對稱頸可豎直,頭微搖動(dòng),仰臥姿勢左右對稱扶起獨(dú)坐,身體前傾可獨(dú)坐,爬行,扶著物件站立攙一手行走,搖擺皮亞杰量表用特定的任務(wù)來揭示兒童發(fā)展處于哪個(gè)階段。發(fā)展量表的優(yōu)點(diǎn):以年齡或年級當(dāng)量為單位來報(bào)告分?jǐn)?shù),易于被人理解??膳c同輩團(tuán)體做直接比較。為個(gè)人內(nèi)比較與縱向研究提供了基礎(chǔ)。缺點(diǎn):只適用于隨年齡發(fā)生系統(tǒng)變化的心理特質(zhì)的測量,對成人不合適。只適用于在典型環(huán)境下成長的兒童。發(fā)展量表的單位在各年齡、各年級并不相等,無法做代數(shù)運(yùn)算。獲得同樣的年齡或年級當(dāng)量分?jǐn)?shù),并不一定具有相同的智力或?qū)W業(yè)成就。(二)商數(shù)(quotient)1.比率智商IQ=100(MA/CA)缺點(diǎn):實(shí)齡是等距的,而智齡不等距(智力發(fā)展不是直線的)計(jì)算成人智商時(shí),以多大實(shí)齡作為除數(shù)?智力生長何時(shí)達(dá)到頂點(diǎn)?不同年齡組,比率智商分?jǐn)?shù)具有不同的標(biāo)準(zhǔn)差,因而相同的比率智商對于不同年齡具有不同的意義。2.教育商數(shù)

EQ=100(EA/CA)兒童所受的教育相當(dāng)于某個(gè)年齡兒童所受教育的平均水平,則他的教育年齡就是幾歲。3.成就商數(shù)AQ=100(EQ/IQ)用于說明智力發(fā)展與教育發(fā)展是否同步。(三)百分位1百分等級(percentilerank)概念某個(gè)分?jǐn)?shù)的百分等級就是得分低于這個(gè)分?jǐn)?shù)的人數(shù)的百分比。百分等級指示個(gè)體在常模團(tuán)體中的相對位置。百分等級越低,個(gè)體所處的地位越低。計(jì)算(1)未分組分?jǐn)?shù)資料100R-50PR=100-N(2)分組分?jǐn)?shù)資料100(X-L)fPR=?+FbNi2百分點(diǎn)相對于某一百分等級的分?jǐn)?shù)點(diǎn)叫百分點(diǎn)或百分位數(shù)。3十分位百分點(diǎn)將分?jǐn)?shù)分布分成100個(gè)等份。十分位是將分?jǐn)?shù)分成10個(gè)等份。十分位提供一個(gè)10級的等級量表,每一級包括10%的分?jǐn)?shù)。

百分位的評價(jià)優(yōu)點(diǎn):容易計(jì)算,容易解釋。對于各種被試和各種測驗(yàn)普遍適用。缺點(diǎn):缺少相等單位,屬于順序量表,不能做加減乘除運(yùn)算。(四)標(biāo)準(zhǔn)分?jǐn)?shù)(standardscore)1Z分?jǐn)?shù)。

X-XZ=S不僅具有可比性,還具有可加性。Z=0SZ=1,-3

~+3

約占總體的99.73%。除了Z分?jǐn)?shù)外,還可以把Z分?jǐn)?shù)轉(zhuǎn)換成T分?jǐn)?shù)、標(biāo)準(zhǔn)九、離差智商等。轉(zhuǎn)換方法:線性轉(zhuǎn)換:從正態(tài)到正態(tài)非線性轉(zhuǎn)換:從偏態(tài)到正態(tài)(通過百分等級)2T分?jǐn)?shù)紀(jì)念Terman和Thorndike。

T=10?Z+50平均數(shù)為50,標(biāo)準(zhǔn)差為104離差智商(deviationIQ)IQ=100+15Z5CEEB分?jǐn)?shù)(CollegeEntranceExaminationBoard)美國大學(xué)入學(xué)考試委員會(huì)分?jǐn)?shù)

CEEB分?jǐn)?shù)=500+100Z6EPT分?jǐn)?shù)

EPT分?jǐn)?shù)=90+20Z標(biāo)準(zhǔn)分?jǐn)?shù)變式的評價(jià)優(yōu)點(diǎn):轉(zhuǎn)換成等距量表,使進(jìn)一步統(tǒng)計(jì)分析成為可能。都可以轉(zhuǎn)換成百分等級,使得不同分?jǐn)?shù)之間可以進(jìn)行比較。缺點(diǎn):外行難以理解;如果非正態(tài)分布,不同變式的分?jǐn)?shù)之間無法比較與求和。、幾種導(dǎo)出分?jǐn)?shù)間的相互關(guān)系三、呈現(xiàn)常模資料的方法(一)轉(zhuǎn)化表轉(zhuǎn)化表的3個(gè)基本要素:原始分、導(dǎo)出分、常模團(tuán)體的特征描述。1.簡單轉(zhuǎn)化表

2.復(fù)雜轉(zhuǎn)化表(二)剖析圖(三)常態(tài)百分位圖表分?jǐn)?shù)以百分等級來表示,而分?jǐn)?shù)軸的距離以標(biāo)準(zhǔn)分?jǐn)?shù)為單位。把百分等級與標(biāo)準(zhǔn)分結(jié)合起來使用,具有雙重優(yōu)點(diǎn)。語文推理2770******************數(shù)字能力2370*********************語文+數(shù)字5070******************抽象推理4085*********************文書速度與正確2915*********************機(jī)械推理4545*********************空間關(guān)系3065*********************拼寫6260*********************語言應(yīng)用2655*********************原始百分百分位分?jǐn)?shù)位15102025304050607075809095991510202530

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論