人事測評的心理測量學(xué)基礎(chǔ)

上傳人：1*** IP屬地：云南上傳時(shí)間：2025-03-24 格式：PPT 頁數(shù)：132 大小：396KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩127頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

二、心理特質(zhì)的可測性l

Thorndike“凡客觀存在的事物都有其數(shù)量?！眑

McCall“凡有數(shù)量的東西都可以測量。”第二節(jié)測量誤差及其來源一、測量誤差的含義由那些與測量目的無關(guān)的因素導(dǎo)致的不一致和不準(zhǔn)確的測量效應(yīng)。二、測量誤差的種類系統(tǒng)誤差：測量工具本身引起的誤差（可控）；隨機(jī)誤差：由不穩(wěn)定因素引起的誤差（不可控）。三、測量誤差的來源（一）測量工具（測驗(yàn)內(nèi)部）引起的誤差1題目取樣2指導(dǎo)語3難度4時(shí)限5測驗(yàn)復(fù)本不等值（二）由測量對象引起的誤差1測驗(yàn)的經(jīng)驗(yàn)2練習(xí)因素3應(yīng)試動(dòng)機(jī)4測驗(yàn)焦慮5反應(yīng)定勢6生理因素（三）由施測過程引起的誤差1物理環(huán)境2主試者方面3意外干擾4評分計(jì)分第三節(jié)真分?jǐn)?shù)及其有關(guān)的假設(shè)一、真分?jǐn)?shù)的含義真分?jǐn)?shù)（TrueScore）：一個(gè)測量工具在沒有測量誤差時(shí)，所得到的純正值。操作定義：經(jīng)過無數(shù)次測量所得到的平均值。觀察分?jǐn)?shù)（ObservedScore）：實(shí)際的測量分?jǐn)?shù)（外顯的混合分?jǐn)?shù)）二、數(shù)學(xué)模型及其假設(shè)X=T+E

測量誤差的假設(shè)：Σ（X）=T或Σ（E）=0ρ（T，E）=0ρ（E1，E2）=0

SX2=ST2+SE2ST2=SV2+SI2

SX2=SV2+SI2+SE2SV2SI2SE2SX2ST2

第六章測量信度第一節(jié)信度概述一、什么是信度？信度（reliability）是指測量結(jié)果的一致性程度，也叫測量的可靠性。操作定義：rxx=ST2/SX2

rXX=ρTX2

rXX=ρXX’注意：（1）信度指的是一組測驗(yàn)分?jǐn)?shù)或一系列測量的特性，而不是個(gè)人分?jǐn)?shù)的特性；（2）真分?jǐn)?shù)的變異數(shù)是不能直接測量的，因此信度是一個(gè)理論上構(gòu)想的概念，只能根據(jù)一組實(shí)得分?jǐn)?shù)作出估計(jì)。注意：（1）信度有多種。（2）同一種信度也會(huì)因樣本、測查時(shí)間不同而有多個(gè)。（3）信度只是對測量分?jǐn)?shù)一致性的估計(jì)，但并沒有指出不一致的原因。（4）獲得較高的信度只是測驗(yàn)有效的必要條件。三、信度的作用信度是測量過程中所存在的隨機(jī)誤差大小的反映

1．信度可以用來解釋個(gè)人測驗(yàn)分?jǐn)?shù)的意義

SE=SX√1-rXX

真分?jǐn)?shù)的置信區(qū)間（95%）=X±1.96SE

2．信度可以幫助進(jìn)行不同測驗(yàn)分?jǐn)?shù)的比較第二節(jié)信度的估計(jì)方法一、重測信度1．含義和計(jì)算重測信度（test-retestreliability）是指用同一量表對同一組被試施測兩次所得結(jié)果的一致性程度。皮爾遜積差相關(guān)系數(shù)誤差來源：測量時(shí)間不同所帶來的隨機(jī)誤差2．使用的前提條件所測量的心理特質(zhì)必須是穩(wěn)定的；練習(xí)和遺忘的效果基本上相互抵消；在兩次施測的間隔時(shí)期內(nèi)，被試在所要測查的心理特質(zhì)方面沒有獲得更多的學(xué)習(xí)和訓(xùn)練。二、復(fù)本信度1．含義和計(jì)算復(fù)本信度（Alternate-formreliability）是指兩個(gè)平行的測驗(yàn)測量同一批被試所得結(jié)果的一致性程度。皮爾遜積差相關(guān)系數(shù)等值性系數(shù)：兩個(gè)復(fù)本測驗(yàn)是同時(shí)連續(xù)施測的穩(wěn)定等值系數(shù)（重測復(fù)本信度）：兩個(gè)復(fù)本測驗(yàn)是相距一段時(shí)間分兩次施測的。

2．使用的前提條件l

兩測驗(yàn)真正平行；l

被試要有條件接受兩個(gè)測驗(yàn)。三、分半信度1．含義和計(jì)算分半信度（split-halfreliability）是指將一個(gè)測驗(yàn)分成對等的兩半后，所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。

校正后的皮爾遜積差相關(guān)系數(shù)

校正公式：斯皮爾曼-布朗公式rxx=2rhh/（1+rhh）常見的分半方法是按測題序號奇偶分半：

測驗(yàn)題目按某種順序（如難度）排列；

如果是隨機(jī)排列的題目，則必須是所有題目是平等的（要么難度相等，要么性質(zhì)一致，是測同一個(gè)心理特質(zhì)的）；

如果測驗(yàn)有多個(gè)分量表，應(yīng)在分量表內(nèi)部排好順序，再把各分量表的兩半組合起來求相關(guān)。弗朗那根公式：rxx=2[1-（Sa2+Sb2）/Sx2]盧侖公式：rxx=1-Sd2/Sx2

2．使用的前提條件一個(gè)測驗(yàn)可以分為對等的兩半時(shí)四、同質(zhì)性信度1．含義同質(zhì)性信度（homogeneityreliability），也叫內(nèi)部一致性系數(shù)，是指測驗(yàn)內(nèi)部所有題目間的一致性程度。

2．計(jì)算及適用范圍

rxx=K/rij[1+（K-1）rij]KR20公式：rxx=[K/（K-1）][1-（Σpiqi）/Sx2]pi為答對第i題的人數(shù)的比例；qi為答錯(cuò)第i題的人數(shù)的比例。K為題目數(shù)，Sx2為測驗(yàn)總分的變異。KR21公式：rxx=[K/（K-1）][1-（Kpq）/Sx2]

克龍巴赫α系數(shù)：α

=[K/（K-1）][1-（ΣSi2）/Sx2]

荷伊特信度：rxx=1-MS人×題/MS人因子分析一般用于預(yù)測的測驗(yàn)或?qū)W績測驗(yàn)可不考慮同質(zhì)性。而驗(yàn)證理論構(gòu)想時(shí)必須考慮同質(zhì)性。因此，同質(zhì)性不但與信度有關(guān)，還與效度有關(guān)。五、評分者信度1．含義和計(jì)算評分者信度（scorerreliability）是指多個(gè)評分者給同一批人的答卷進(jìn)行評分的一致性程度。

2人時(shí)：相關(guān)系數(shù)多人時(shí)：肯德爾和諧系數(shù)W=12[ΣRi2-（ΣRi）2/N]/[K2（N3-N）]（評分者人數(shù)K=3~20；被評者人數(shù)N=3~7時(shí)，查W表檢驗(yàn)）

RI為第i個(gè)被試被評的水平等級之和信度誤差變異來源重測信度時(shí)間取樣復(fù)本信度（連續(xù)施測）內(nèi)容取樣復(fù)本信度（間隔施測）時(shí)間與內(nèi)容取樣分半信度內(nèi)容取樣同質(zhì)性信度內(nèi)容取樣和內(nèi)容的異質(zhì)性評分者信度評分者間的差異各種信度系數(shù)相應(yīng)誤差變異的來源第三節(jié)提高測量信度的方法一、影響測量信度的主要因素（一）被試方面被試團(tuán)體同質(zhì)性越高（個(gè)體差異越小），所得相關(guān)系數(shù)（信度）就越低。被試團(tuán)體異質(zhì)性越高（個(gè)體差異越大），所得相關(guān)系數(shù)（信度）就越高。

（二）主試方面

指導(dǎo)語、態(tài)度、期望、評分主觀等（三）施測情境（四）測量工具測驗(yàn)長度：測驗(yàn)越長，信度越高。測驗(yàn)難度：過難或過易都會(huì)使個(gè)體間得分差異減小，降低信度。測驗(yàn)內(nèi)容：試題取樣不當(dāng)，內(nèi)部一致性低，題意模糊，信度則低。（五）兩次施測的間隔時(shí)間間隔時(shí)間越短，信度越高；間隔時(shí)間越長，信度越低。二、提高測量信度的常用方法1.適當(dāng)增加測驗(yàn)的長度2.使測驗(yàn)中所有試題的難度接近正態(tài)分布，并控制在中等水平3.努力提高測驗(yàn)試題的區(qū)分度4.選取恰當(dāng)?shù)谋辉噲F(tuán)體，提高測驗(yàn)在各同質(zhì)性較強(qiáng)的亞團(tuán)體上的信度5.主試者嚴(yán)格執(zhí)行施測規(guī)程，評分者嚴(yán)格按照標(biāo)準(zhǔn)給分，施測場地按測驗(yàn)手冊的要求進(jìn)行布置，減少無關(guān)因素的干擾第四節(jié)信度的特殊問題一、速度測驗(yàn)的信度問題因?yàn)樗俣葴y驗(yàn)的題目難度都很低，所以不能用奇偶分半求分半信度；可以將測驗(yàn)分兩半來施測。因?yàn)閹缀醪豢赡馨杨}目做完，所以同質(zhì)性信度不適用?？梢杂弥販y信度和復(fù)本信度。二、標(biāo)準(zhǔn)參照測驗(yàn)的信度問題總體越同質(zhì)，相關(guān)系數(shù)越低。所以，用通常的方法來算標(biāo)準(zhǔn)參照測驗(yàn)的信度是不適當(dāng)?shù)??？梢杂脧?fù)本，通過人數(shù)的百分比差別越小，信度越高。三、分測驗(yàn)的信度除整個(gè)測驗(yàn)的信度外，各個(gè)分測驗(yàn)也應(yīng)有信度，否則，從分測驗(yàn)得分來做推論就會(huì)出問題。四、差異的信度比較兩門課成績的差異，若兩門課的信度都不可靠時(shí)，二者的差別更不可靠。五、行為改變（變遷）的測量行為改變：要求測驗(yàn)對分?jǐn)?shù)的差異越敏感越好信度：二者的矛盾難以調(diào)和信度好壞的判斷標(biāo)準(zhǔn)標(biāo)準(zhǔn)化能力或?qū)W績測驗(yàn)：>0.90人格測驗(yàn)：>0.80教師自編學(xué)績測驗(yàn)：>0.60測驗(yàn)使用時(shí)的信度標(biāo)準(zhǔn)一般來說，當(dāng)信度<0.70，測驗(yàn)不能用于對個(gè)人作出評價(jià)與預(yù)測，而且不能作團(tuán)體間比較；當(dāng)0.70≤信度<0.85時(shí)，可用于團(tuán)體比較；當(dāng)信度≥0.85時(shí)，才能用來鑒別或預(yù)測個(gè)人成績。測量效度第一節(jié)效度概述一、什么是效度效度（validity）是指一個(gè)測驗(yàn)或量表實(shí)際能測出其所要測的心理特質(zhì)的程度。（1）效度是一個(gè)相對的概念：每個(gè)測量工具都有自己的目的。（2）效度是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。（3）判斷一個(gè)測量是否有效要從多方面收集證據(jù)操作定義：效度=SV2/SX2=rXY2SV2SI2SE2SX2ST2

二、效度與信度的關(guān)系（一）信度高是效度高的必要而非充分的條件一個(gè)測驗(yàn)效度高，其信度也必然高；但一個(gè)測驗(yàn)信度高，其效度不一定高。

（二）測驗(yàn)的效度受它的信度制約rXY≤rXX一個(gè)測驗(yàn)的信度必然比效度高，至少相等。第二節(jié)內(nèi)容效度一、內(nèi)容效度的性質(zhì)內(nèi)容效度（contentvalidity）是指測驗(yàn)題目對有關(guān)內(nèi)容或行為取樣的適當(dāng)程度，即一個(gè)測驗(yàn)實(shí)際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。因此，一個(gè)測驗(yàn)要有內(nèi)容效度必須具備兩個(gè)條件：（1）要有定義完好的內(nèi)容范圍（2）測驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。二、內(nèi)容效度的確定方法（一）邏輯分析法：專家判斷根據(jù)自己的知識經(jīng)驗(yàn)對量表的有效性（邏輯性）作出判斷，也稱邏輯效度。為使內(nèi)容效度的判斷過程更客觀，一般采用下列步驟：①確定測驗(yàn)內(nèi)容的總體范圍；②編制雙向細(xì)目表；③編制評定量表，從測驗(yàn)內(nèi)容所測的技能、題目對所定義的范圍的覆蓋率、各種題目數(shù)量和分?jǐn)?shù)的比例以及題目形式的適當(dāng)性等方面，對測驗(yàn)作出總的評價(jià)。（二）統(tǒng)計(jì)方法：用兩個(gè)測驗(yàn)復(fù)本來測同一批被試，若相關(guān)高，則內(nèi)容效度可能高，但若相關(guān)低，則說明必有一個(gè)測驗(yàn)缺乏內(nèi)容效度。

（三）經(jīng)驗(yàn)法：再測法前測→教學(xué)→后測如果后測成績優(yōu)于前測成績，說明該測驗(yàn)具有一定的內(nèi)容效度。三、內(nèi)容效度的特點(diǎn)和評價(jià)1.適用范圍：內(nèi)容效度主要應(yīng)用于成就測驗(yàn)，也適合于某些用于選拔和分類的職業(yè)測驗(yàn)。但不適用于能力傾向測驗(yàn)和人格測驗(yàn)。時(shí)間性2.缺乏理想的數(shù)量指標(biāo)3.內(nèi)容效度不是表面效度表面效度（surfacevalidity）：外行人對某個(gè)測驗(yàn)從表面上看好像是測某種心理特質(zhì)的程度。并不是一種真正的效度。人格測驗(yàn)要求表面效度不宜過高。第三節(jié)結(jié)構(gòu)效度一、構(gòu)想效度的定義結(jié)構(gòu)效度（structurevalidity）是指一個(gè)測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)或特質(zhì)的程度，或者說測驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。

特點(diǎn)：（1）具有不同理論構(gòu)思的測驗(yàn)，其結(jié)構(gòu)效度是無法進(jìn)行比較的；（2）結(jié)構(gòu)效度有時(shí)很難獲得；（3）結(jié)構(gòu)效度沒有單一的指標(biāo)，是由各方面的證據(jù)累積起來進(jìn)行評價(jià)的。二、結(jié)構(gòu)效度的確定方法結(jié)構(gòu)效度確立的一般步驟：（1）提出理論框架；（2）依據(jù)理論框架推演出有關(guān)測驗(yàn)成績的假設(shè)；（3）用邏輯或?qū)嵶C的方法來證明假設(shè)。具體方法：（1）測驗(yàn)內(nèi)部尋找證據(jù)法l分析測驗(yàn)的內(nèi)容效度：若內(nèi)容效度高，說明其結(jié)構(gòu)效度也高；l分析被試對題目反應(yīng)的特點(diǎn)：有無社會(huì)稱許性的題目，如“當(dāng)事情不順我意時(shí)，我時(shí)常動(dòng)怒?！睂υ擃}的回答，也許反映不了要測的性格。l計(jì)算測驗(yàn)的同質(zhì)性信度：分半信度、α系數(shù)、KR20、KR21（2）測驗(yàn)之間尋找證據(jù)法l

相容效度：新老測驗(yàn)之間的相關(guān)（兩測驗(yàn)測的是同一心理特質(zhì)）。若相關(guān)高，則說明新測驗(yàn)可能有較高的效度。l

區(qū)分效度：新老測驗(yàn)之間的相關(guān)（兩測驗(yàn)測的不是同一心理特質(zhì)），若相關(guān)低，則說明新測驗(yàn)可能有較高的效度。l

因子分析法：得出的因素符合理論的構(gòu)思，說明效度高。（3）考察測驗(yàn)的實(shí)證效度法l

根據(jù)效標(biāo)把被試分組，考察其得分差異。l根據(jù)測驗(yàn)得分差異把被試分組，考察其所測特質(zhì)（行為表現(xiàn)）的差異。（4）多種特質(zhì)-多種方法矩陣法方法：1、2、3特質(zhì)：A、B、CMultitrait-multimethodmatrix

多特質(zhì)多方法矩陣

Method1TeacherratingMethod2TestsMethod3Observers’ratingA1B1C1A2B2C2A3B3C3M1A1誠實(shí)(.89)B1攻擊性.43(.89)C1智力.36.32(.76)M2A2誠實(shí).62.03.20(.93)B2攻擊性.22.70.13.40(.94)C2智力.10.13.64.22.30(.84)M3A3誠實(shí).59.11.02.60.20.21(.94)B3攻擊性.14.82-.16.13.61.23.30(.92)C3智力.21.10.72.06.19.52.49.36(.85)rofdifferentmethod/sametrait:

ConvergentvalidityReliabilityWhenrsmdt>rdmdt

MethodbiasDiscriminantvalidityrdmdtofdifferentmethod/differenttraitrsmdtofsamemethod/differenttrait（5）搜集某些變異上的證據(jù)智力隨年齡變化而變化三、對構(gòu)想效度的評價(jià)1.有些構(gòu)想概念模糊，缺乏一致的定義2.沒有明確的操作步驟與程序3.沒有單一的數(shù)量指標(biāo)第四節(jié)實(shí)證效度一、實(shí)證效度的定義實(shí)證效度是指一個(gè)測驗(yàn)對處于特定情境中的個(gè)體的行為進(jìn)行估計(jì)的有效性。被估計(jì)的行為是檢驗(yàn)測驗(yàn)效度的標(biāo)準(zhǔn)，簡稱效標(biāo)。所以，實(shí)證效度又稱效標(biāo)關(guān)聯(lián)效度（criterion-relatedvalidity）。

同時(shí)效度（concurrentvalidity）：測驗(yàn)分?jǐn)?shù)與效標(biāo)資料是同時(shí)收集的。預(yù)測效度（predictivevalidity）：先獲得測驗(yàn)分?jǐn)?shù)，隔一段時(shí)間后，再收集效標(biāo)資料。二、效標(biāo)（1）效標(biāo)與效標(biāo)測量效標(biāo)（criterion）就是衡量一個(gè)測驗(yàn)是否有效的外在標(biāo)準(zhǔn)。

觀念效標(biāo)：理論定義，如“大學(xué)的成功”

效標(biāo)測量：操作定義，如大學(xué)成績

常用的效標(biāo)：學(xué)業(yè)成就、臨床診斷、實(shí)際工作表現(xiàn)、特殊訓(xùn)練成績、不同團(tuán)體的總體表現(xiàn)、先前有效的測驗(yàn)、等級評定。（2）效標(biāo)的特性a.多樣性：一個(gè)測驗(yàn)可能有不同的觀念效標(biāo)，同一個(gè)觀念效標(biāo)又可能有不同的效標(biāo)測量。b.復(fù)雜性：幾乎每一種效標(biāo)行為都由多種特質(zhì)構(gòu)成，包含復(fù)雜的成分。c.特殊性：即使一個(gè)普通的效標(biāo)，在應(yīng)用時(shí)也有特殊性。d.時(shí)間性：近期效標(biāo)與最后效標(biāo)（3）效標(biāo)測量的條件a.有效性：效標(biāo)測量能真正反映觀念效標(biāo)。b.可靠性：有較高的信度c.客觀性：效標(biāo)測量必須能真正反映觀念效標(biāo)，防止效標(biāo)污染。

效標(biāo)污染（criterioncontamination）是指評定者知道被試的測驗(yàn)分?jǐn)?shù)，因而影響到對效標(biāo)的客觀評定。d.實(shí)用性：經(jīng)濟(jì)實(shí)用三、實(shí)證效度的確定方法（1）相關(guān)法測驗(yàn)分?jǐn)?shù)與效標(biāo)測量之間的相關(guān)系數(shù)。

（2）區(qū)分法測驗(yàn)→工作→效標(biāo)測量（工作成績）按工作成績分高低兩組，如工作成績高，測驗(yàn)得分也高；工作成績低，測驗(yàn)得分也低，說明該測驗(yàn)是有一定效度的。工作表現(xiàn)測驗(yàn)成績合格不合格合格AC不合格BD（3）命中率總命中率=（A+D）/（A+B+C+D）正命中率=A/（A+C）（4）功利率對使用測驗(yàn)所需的費(fèi)用和所得到的收益進(jìn)行比較，看是否利大于弊。一個(gè)測驗(yàn)如果簡單易行，省時(shí)省錢，不經(jīng)過特殊訓(xùn)練的人也能掌握，又適合于團(tuán)體施測，那么，即使效度低一些，也會(huì)有人使用。反之，只有效度極高，能給人帶來很大好處時(shí)，才會(huì)使用。第五節(jié)提高測量效度的方法一、影響測量效度的因素1．測驗(yàn)的構(gòu)成

測驗(yàn)長度與效度的關(guān)系：

r（Kx）y=Krxy/√K（1-rxx+Krxx）

2．測驗(yàn)的實(shí)施過程3．接受測驗(yàn)的被試常模團(tuán)體的同質(zhì)性影響到對被試測驗(yàn)得分的解釋，進(jìn)而影響到測驗(yàn)的效度。測驗(yàn)偏倚（testbias）是指用不適用于被試的標(biāo)準(zhǔn)來解釋被試的測驗(yàn)得分，因而造成解釋的偏差。4．所選效標(biāo)的性質(zhì)測量行為與所選效標(biāo)的相似性越高，效度越高。測驗(yàn)分?jǐn)?shù)與效標(biāo)行為之間是否是線性關(guān)系，如果不是線性關(guān)系，求皮爾遜相關(guān)就會(huì)低估效度。效標(biāo)本身的測量越可靠，效度就可能越高。5．測量的信度二、提高測量效度的方法（1）精心編制測驗(yàn)量表，避免出現(xiàn)較大的系統(tǒng)誤差（2）妥善組織測驗(yàn)，控制隨機(jī)誤差（3）創(chuàng)設(shè)標(biāo)準(zhǔn)的應(yīng)試情境，讓每個(gè)被試都能發(fā)揮正常的水平（4）選好正確的效標(biāo)，定好恰當(dāng)?shù)男?biāo)測量，正確地使用有關(guān)公式第六節(jié)效度資料的概化所謂概化，是指在一定條件下得出的結(jié)論能否適用于其他情況。測驗(yàn)的效度和信度一樣，都與特定情境有關(guān)，只有在具體情境下的效度，而沒有籠統(tǒng)談?wù)撃骋粶y驗(yàn)的效度。一、效度概化的幾個(gè)方面1預(yù)測源的概化使用同一測驗(yàn)的不同復(fù)本是否同樣有效？同一測驗(yàn)對不同分?jǐn)?shù)水平的人的預(yù)測是否同樣有效？2效標(biāo)的概化采用不同種類或不同時(shí)距的效標(biāo)，測驗(yàn)是否同樣有效？對于效標(biāo)的不同分?jǐn)?shù)水平是否預(yù)測得一樣好？3施測情境的概化不同的施測者、不同的施測條件以及在不同的指導(dǎo)語或心向下做測驗(yàn)是否同樣有效？4被試團(tuán)體的概化測驗(yàn)對于取自同一總體的另一樣本是否同樣有效？測驗(yàn)對于不同性別、不同年齡、不同教育水平、不同社會(huì)經(jīng)濟(jì)地位、不同地區(qū)、不同民族、不同學(xué)校、不同職業(yè)的被試是否同樣有效？5建立效度方法的概化用不同方法得到的效度指標(biāo)是否一致？不同的效度之間是否有矛盾？二、交叉效度分析交叉效度分析是考察效度概化能力的一種方法，只涉及被試樣本的概化。這種方法是對兩個(gè)獨(dú)立取自同一總體的樣本分別建立預(yù)測源-效標(biāo)關(guān)系，看從一個(gè)樣本中得到的效度資料是否適用于另一樣本。計(jì)算測驗(yàn)效度所依據(jù)的樣本必須與選擇項(xiàng)目所依據(jù)的被試樣本不同。如果使用同一樣本，則會(huì)使效度系數(shù)假性的高。實(shí)質(zhì)是循環(huán)論證。測驗(yàn)的項(xiàng)目分析項(xiàng)目分析包括定性分析和定量分析。定性分析包括考慮內(nèi)容效度、題目編寫的恰當(dāng)性和有效性等；定量分析主要是指題目難度和區(qū)分度的測量。對項(xiàng)目進(jìn)行篩選和修訂，可以提高測驗(yàn)的信度和效度。第一節(jié)測驗(yàn)的難度一、難度（difficulty）的意義難度，指項(xiàng)目的難易程度。在最高作為測驗(yàn)中，稱為“難度”，而在典型作為測驗(yàn)中，則指“通俗性”。兩者都是指在總體中，能夠正確或確切回答某項(xiàng)目的人數(shù)。二、難度的計(jì)算（一）二分法記分項(xiàng)目的難度1．通過率

P=R/N

2．極端分組法（上下27%）

P=（PH+PL）/2

（二）非二分法記分項(xiàng)目的難度

P=X/XmaxX為所有被試在該項(xiàng)目上的平均得分，Xmax為該項(xiàng)目的滿分。三、測驗(yàn)難度水平的確定效標(biāo)參照測驗(yàn)、掌握測驗(yàn)：不考慮難度；選拔測驗(yàn)：難度=錄取率；

對于選擇題來說，難度一般應(yīng)大于猜測概率；無論是速度測驗(yàn)，還是難度測驗(yàn)，一般都應(yīng)防止被試得滿分，因?yàn)闈M分的意義是不明確的。

大體而言，難度為0.50時(shí)最理想，此時(shí)項(xiàng)目具有最大的鑒別力。但在實(shí)際操作中，讓所有項(xiàng)目難度都到達(dá)0.50困難很大，而且也不必要，一般只需使項(xiàng)目的平均難度接近0.50，而各個(gè)項(xiàng)目的難度在0.50±0.20之間變化。四、難度的等距變換根據(jù)正態(tài)分布表，將難度P作為正態(tài)曲線下的面積，轉(zhuǎn)換成相應(yīng)的Z分?jǐn)?shù)，這就是等距量表。

Y0ZZYP.00.39894.00000.50.35207.191461.00.24197.341341.50.12952.433191.96.05844.475002.00.05399.477252.50.01753.493792.58.01431.495063.00.00443.498653.50.00087.499773.99.00014.49997美國教育服務(wù)中心以Δ作為難度指標(biāo)：Δ=13+4Z

P=.0013Z=+3Δ=25P=.16Z=+1Δ=17P=.50Z=0Δ=13P=.84Z=-1Δ=9P=.9987Z=-3Δ=1五、難度對測驗(yàn)的影響（一）測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的分布形態(tài)

難度大，正偏態(tài)

難度低，負(fù)偏態(tài)（二）測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的離散程度測驗(yàn)過難或過易，分?jǐn)?shù)全距縮小，信度降低。P=0.50時(shí)最佳第二節(jié)測驗(yàn)的區(qū)分度一、區(qū)分度的意義區(qū)分度（discrimination）是指測驗(yàn)項(xiàng)目對被試心理品質(zhì)水平差異的區(qū)分能力或鑒別能力。

項(xiàng)目的區(qū)分度是測驗(yàn)是否有效的“指示器”。二、區(qū)分度的計(jì)算（一）項(xiàng)目鑒別指數(shù)法1．鑒別指數(shù)（indexofdiscrimination，D）的計(jì)算D=PH-PL取值范圍：-1~+1鑒別指數(shù)題目評價(jià)0.40以上很好0.30~0.39良好，修改會(huì)更好0.20~0.29尚可，仍需修改0.19以下差，必須淘汰2．極端組的劃分27%規(guī)則一般情況下，取上下25%~33%均可。樣本少時(shí)，可以取50%注意：由于計(jì)算機(jī)的方便使用，可以上下50%作為劃分高低組的標(biāo)準(zhǔn)，或者多分幾組，對區(qū)分度和難度作詳細(xì)分析。因?yàn)橹蝗∩舷聝啥?，只利用了一部分資料，浪費(fèi)了很多信息，有可能得出錯(cuò)誤結(jié)論。（二）相關(guān)法（項(xiàng)目-總分相關(guān)）1．點(diǎn)二列相關(guān)Xp-Xqrpb=√pqSt

2．二列相關(guān)Xp-XqpqXp-Xtprb=?或rb=?StySty3．φ相關(guān)ad-bcrφ=√(a+b)(c+d)(a+c)(b+d)

4．積差相關(guān)（三）項(xiàng)目特征曲線（itemcharacteristiccurve,ICC）項(xiàng)目特征曲線描述了效標(biāo)分?jǐn)?shù)不同的被試在該項(xiàng)目上的通過率。曲線坡度越陡，鑒別力越好，預(yù)測的誤差越小。率概的目項(xiàng)答回確正1.000.000.50低中高能力鑒別力較好低中高能力率概的目項(xiàng)答回確正1.000.000.50低中高能力率概的目項(xiàng)答回確正1.000.000.50鑒別力為負(fù)鑒別力較低率概的目項(xiàng)答回確正1.000.000.50低中高能力ABC難度不同的3個(gè)項(xiàng)目的ICC多項(xiàng)選擇中每個(gè)選項(xiàng)的ICC率概的目項(xiàng)答回確正1.000.000.50低中高能力ABCD三、區(qū)分度與難度的關(guān)系難度（Ｐ）區(qū)分度（Ｄ）1.0000.900.200.800.400.700.600.600.800.5010.400.800.300.600.200.400.100.200.000難度和區(qū)分度都是針對一定團(tuán)體而言的。一般來說，較難的項(xiàng)目對高水平被試區(qū)分度高，較易的項(xiàng)目對低水平被試的區(qū)分度高。四、區(qū)分度的相對性（一）不同的計(jì)算方法，所得區(qū)分值不同

區(qū)分度有幾種計(jì)算方法？

（二）樣本容量大小影響相關(guān)法區(qū)分度值的大小

樣本越大，區(qū)分度越……（三）分組標(biāo)準(zhǔn)影響鑒別指數(shù)

分組越極端，區(qū)分度越……（四）被試樣本的同質(zhì)性程度影響區(qū)分度值的大小

樣本越同質(zhì)，區(qū)分度越……第三節(jié)項(xiàng)目分析的特殊問題一、多重選擇題的項(xiàng)目分析（誘答分析）對于多重選擇題，除了分析難度和區(qū)分度外，還要對每個(gè)選項(xiàng)進(jìn)行分析。下列哪一個(gè)最有可能是偏執(zhí)型精神分裂癥患者的次級癥狀：A幻聽B癱瘓C記憶喪失D厭食

如果所有被試都選擇某一正確的選項(xiàng)，說明該選項(xiàng)……如果沒有一個(gè)被試選擇某個(gè)錯(cuò)誤選項(xiàng)，說明該選項(xiàng)……如果所有被試都選擇某個(gè)錯(cuò)誤選項(xiàng)，說明該選項(xiàng)……如果高分組被試的選擇集中在兩個(gè)選項(xiàng)上，說明該選項(xiàng)……如果高分組和低分組對正確選項(xiàng)的選擇沒有區(qū)別，說明該選項(xiàng)……如果所有被試都未回答某個(gè)題目，說明該題……如果選擇各個(gè)選項(xiàng)的人數(shù)幾乎相等，說明該題……二、速度測驗(yàn)的項(xiàng)目分析對前面部分的測驗(yàn)項(xiàng)目，難度和區(qū)分度都……對后面部分的測驗(yàn)項(xiàng)目，難度和區(qū)分度都……三、標(biāo)準(zhǔn)參照測驗(yàn)的項(xiàng)目分析在標(biāo)準(zhǔn)參照測驗(yàn)中，無須考慮項(xiàng)目的難度和區(qū)分度，只要項(xiàng)目的內(nèi)容很重要就行。也可以通過比較教學(xué)或訓(xùn)練的前測和后測結(jié)果來進(jìn)行項(xiàng)目分析，用來說明教學(xué)或訓(xùn)練的效果以及項(xiàng)目編制是否適當(dāng)。四、項(xiàng)目-團(tuán)體的相互作用具有不同性質(zhì)（性別、種族、職業(yè)等）的團(tuán)體，在測驗(yàn)得分上也存在差異，即同樣的項(xiàng)目可能有不同的難度。如果測驗(yàn)要求對所有個(gè)體都相對“公平”，那么，就應(yīng)該排除那些有利于或不利于不同性質(zhì)的亞團(tuán)體的項(xiàng)目；如果測驗(yàn)的目的就是為了考察不同亞團(tuán)體的差異，那么，就應(yīng)選擇使團(tuán)體差異盡可能大的題目。五、有效性與可靠性的矛盾同質(zhì)性信度要求項(xiàng)目之間有高相關(guān)，各項(xiàng)目的難度均等；對于預(yù)測效度來說，因?yàn)樾?biāo)的變異范圍較大，如果項(xiàng)目越同質(zhì)，那么效標(biāo)關(guān)聯(lián)效度則低；因此，效標(biāo)關(guān)聯(lián)效度要求各項(xiàng)目之間要有一定的差異，即項(xiàng)目之間相關(guān)低，這樣才能保證測驗(yàn)得分與效標(biāo)之間有高相關(guān)，即高的效標(biāo)關(guān)聯(lián)效度。因此，對于多數(shù)心理測驗(yàn)來說，項(xiàng)目之間中等程度的相關(guān)，可使二者調(diào)和，獲得較為滿意的（同質(zhì)性）信度和（效標(biāo)關(guān)聯(lián)）效度。心理測驗(yàn)的編制第一節(jié)編制心理測驗(yàn)的基本程序一、確定測驗(yàn)?zāi)康模ㄒ唬┟鞔_測量對象

年齡、性別、職業(yè)、受教育程度、經(jīng)濟(jì)狀況、民族、文化背景等。（二）明確測量目標(biāo)

心理變量或行為特征。必須有操作定義，目標(biāo)要非常具體。（三）明確測量用途

用于描述、還是診斷，或用于預(yù)測？二、制定編題計(jì)劃通常是一張雙向細(xì)目表，指出測驗(yàn)所包含的內(nèi)容和要測定的各種技能，以及對每一個(gè)內(nèi)容和技能的相對重視程度。例：小學(xué)自然常識測驗(yàn)編題計(jì)劃知識理解應(yīng)用分析綜合評價(jià)合計(jì)生物世界35632120資源利用23311010動(dòng)力與機(jī)械23420112物質(zhì)與能量56832125氣象24322013宇宙25410012地球2221108合計(jì)1828301388100三、編輯測驗(yàn)項(xiàng)目（一）收集測驗(yàn)資料（1）資料要豐富（2）資料要有普遍性（3）資料要有趣味性

（二）選擇項(xiàng)目形式

紙筆測驗(yàn)還是操作測驗(yàn)？是客觀題還是主觀題？概念和原理的記憶——簡答題辨別和判斷——選擇題綜合運(yùn)用——論文題幼兒——口頭測驗(yàn)文盲、半文盲、聾啞——操作測驗(yàn)人多、經(jīng)費(fèi)有限——團(tuán)體測驗(yàn)人少——個(gè)體測驗(yàn)（三）編寫測驗(yàn)項(xiàng)目題目范圍要與雙向細(xì)目表一致；題目數(shù)量要比最終所需要的數(shù)量多，以便篩選或編制復(fù)本；題目的難度應(yīng)有一定的分布范圍；用詞力求清楚明白。四、試測與項(xiàng)目分析試測取樣施測過程與施測情景時(shí)限可稍寬一些記錄被試的各種反應(yīng)。項(xiàng)目分析質(zhì)的分析：內(nèi)容取樣、題目的思想性、表達(dá)是否清楚量的分析：難度、區(qū)分度、備選項(xiàng)分析五、合成測驗(yàn)（一）測驗(yàn)項(xiàng)目的選擇指標(biāo)有三：要選擇那些能夠測量所要測量的東西的項(xiàng)目；難度區(qū)分度（二）測驗(yàn)項(xiàng)目的編排

并列直進(jìn)式混合螺旋式（三）編制復(fù)本

各份復(fù)本必須等值。等值要符合下列條件：各份測驗(yàn)測量的是同一種心理特性。各份測驗(yàn)具有相同的內(nèi)容和形式。各份測驗(yàn)的題目不應(yīng)重復(fù)。各份測驗(yàn)題目數(shù)量相等，難度和區(qū)分度大體相同。各份測驗(yàn)的分?jǐn)?shù)分布（平均數(shù)和標(biāo)準(zhǔn)差）大致相等。復(fù)本編好后，應(yīng)再測一次，以確保各份測驗(yàn)的等值。六、測驗(yàn)標(biāo)準(zhǔn)化測驗(yàn)的標(biāo)準(zhǔn)化是指測驗(yàn)的編制、實(shí)施、評分以及分?jǐn)?shù)解釋都有統(tǒng)一的標(biāo)準(zhǔn)，以減少無關(guān)因素對測驗(yàn)的影響。（一）測驗(yàn)內(nèi)容指測驗(yàn)內(nèi)容對所有被試都一樣。（二）施測過程測驗(yàn)情景指導(dǎo)語時(shí)限（三）測驗(yàn)評分為使評分盡可能客觀，有三點(diǎn)要求：對被試反應(yīng)的及時(shí)和清楚的記錄。特別是對口試和操作測驗(yàn)。要有一張標(biāo)準(zhǔn)答案或正確反應(yīng)的表格，即計(jì)分鍵。將被試的反應(yīng)和計(jì)分鍵比較，對反應(yīng)進(jìn)行分類。（四）測驗(yàn)分?jǐn)?shù)的解釋常模參照標(biāo)準(zhǔn)參照：內(nèi)容參照，結(jié)果參照七、鑒定測驗(yàn)（一）信度（二）效度（三）測驗(yàn)量表與常模

八、編寫測驗(yàn)說明書測驗(yàn)的目的和功用；編制測驗(yàn)的理論背景以及選擇題目的根據(jù)和測驗(yàn)的構(gòu)成；測驗(yàn)的實(shí)施方法、時(shí)限及注意事項(xiàng)；測驗(yàn)的標(biāo)準(zhǔn)答案和評分方法；測驗(yàn)的信度和效度資料；常模資料。第二節(jié)測驗(yàn)題目的編制技術(shù)一、命題的一般原則試題要符合測驗(yàn)的目的。內(nèi)容取樣要有代表性。題目格式不要使被試產(chǎn)生誤解。文句要簡明扼要，既排除與解題無關(guān)的因素，又不可遺漏解題所依據(jù)的必要條件。要避免使用艱深的字詞。應(yīng)有不致引起爭論的確定答案（創(chuàng)造力測驗(yàn)、人格測驗(yàn)除外）。各個(gè)題目必須彼此獨(dú)立，不可互相牽連，不要使一個(gè)題目的回答影響另一個(gè)題目的回答。題目中不可含有暗示本題或其他題正確答案的線索。題目內(nèi)容不要超出受測團(tuán)體的知識和能力。所提問題應(yīng)避免涉及社會(huì)禁忌與個(gè)人隱私。施測與評分省時(shí)。二、測題的種類及編制固定應(yīng)答型題目，即客觀題，包括：選擇題、是非題、匹配題等。自由應(yīng)答型題目，即主觀題，包括：填充題、簡答題、應(yīng)用題、論文題、聯(lián)想題、操作題等。（一）選擇題題干+選項(xiàng)（正確選項(xiàng)與誘答選項(xiàng)）多項(xiàng)條件選擇題：例如：已知小明的心理年齡是8歲4個(gè)月，實(shí)際年齡是9歲，其智商是多少？(a)85(b)90(c)92(d)92.6(e)100類別選擇題例如：艾森克是著名的_______心理學(xué)家。(a)兒童(b)工程(c)管理(d)人格(e)社會(huì)異類選擇題例如：下面哪位與其他人不屬于同一類人？(a)小布什(b)普京(c)胡錦濤(d)希拉克(e)科爾多項(xiàng)是非選擇題例如：下面兩個(gè)陳述哪一個(gè)正確？（1）2008年奧運(yùn)會(huì)在北京舉行。（2）美國首都是費(fèi)城。(a)1和2都對(b)1對2錯(cuò)(c)1錯(cuò)2對(d)都錯(cuò)因果條件選擇題例如：如果測驗(yàn)的真方差增加，但誤差方差不變，結(jié)果是：(a)測驗(yàn)信度增加(b)測驗(yàn)信度下降(c)測驗(yàn)總方差減小(d)測驗(yàn)的信度和總方差不變選擇題的優(yōu)點(diǎn)：適用范圍廣；計(jì)分客觀；題意明確。缺點(diǎn)：編制誘答選項(xiàng)較難；答案固定，測量范圍有限。編寫選擇題的原則：題干所提的問題必須明確選項(xiàng)要簡短，必要的敘述或相同的修飾語應(yīng)放在題干中；每個(gè)選項(xiàng)的性質(zhì)要一致；選項(xiàng)最好按邏輯順序排列；選項(xiàng)之間不應(yīng)有重疊；誘答選項(xiàng)的錯(cuò)誤不要太明顯；不要把選項(xiàng)夾在題干中間；每題只能圍繞一個(gè)中心，不能有歧義。（二）是非題每題只包含一個(gè)概念，避免兩個(gè)以上的概念在同一題中出現(xiàn)，造成題目似是而非，或半對半錯(cuò)。避免使用具有暗示性的特殊詞語，如“絕對”、“完全”、“有時(shí)”、“可能”等。盡量采用正面肯定的敘述，避免反面陳述或雙重否定的句子。如“生物沒有不是由細(xì)胞組成的?！薄笆恰迸c“非”的題數(shù)應(yīng)大致相等，且隨機(jī)排列。（三）論文題對答題有時(shí)間限制；不要有任選的題目，因?yàn)閮深}很難做到等值；客觀、統(tǒng)一的評分細(xì)則。測驗(yàn)的實(shí)施和計(jì)分第一節(jié)測驗(yàn)的實(shí)施一、測驗(yàn)實(shí)施前的準(zhǔn)備工作向被試預(yù)告測驗(yàn)：測驗(yàn)的時(shí)間、地點(diǎn)、內(nèi)容，讓被試做好心理準(zhǔn)備。熟悉測驗(yàn)程序：測驗(yàn)內(nèi)容、施測步驟、記分方法、分?jǐn)?shù)解釋。準(zhǔn)備測驗(yàn)材料。準(zhǔn)備測驗(yàn)環(huán)境：通風(fēng)、采光、噪聲、桌椅高度、桌面大小、掛牌以防止意外干擾等。熟悉測驗(yàn)的指導(dǎo)語：告訴被試如何選擇反應(yīng)形式（劃勾還是涂黑），說明時(shí)間限制，例題演示，有時(shí)告知被試測驗(yàn)?zāi)康摹６?、測驗(yàn)的具體實(shí)施按測驗(yàn)手冊要求實(shí)施測驗(yàn)?？刂茰y驗(yàn)焦慮，不講威嚇被試的話。與被試建立良好的協(xié)調(diào)關(guān)系（rapport）。及時(shí)和清楚地記錄被試的反應(yīng)。對特殊問題有所準(zhǔn)備（如作弊、被試不配合等）。第二節(jié)測驗(yàn)的計(jì)分和分?jǐn)?shù)的合成一、計(jì)分的一般程序（一）計(jì)分的基本步驟1及時(shí)和清楚地記錄被試的反應(yīng)2制作標(biāo)準(zhǔn)答案，也稱計(jì)分鍵3將反應(yīng)和計(jì)分鍵相比較，給反應(yīng)歸類或賦予分?jǐn)?shù)值（二）論文題計(jì)分盲審多個(gè)主試評分細(xì)分計(jì)分標(biāo)準(zhǔn)（三）客觀題計(jì)分人工計(jì)分和機(jī)器計(jì)分猜測校正公式S=R-W/（K-1）

S—校正后的分?jǐn)?shù)；R—被試答對的題目數(shù)；W—被試答錯(cuò)的題目數(shù)；K—選擇項(xiàng)目數(shù)是否需要對猜測進(jìn)行校正？贊成的理由：反對的理由：（二）測驗(yàn)分?jǐn)?shù)的合成1分?jǐn)?shù)合成的種類（1）項(xiàng)目的組合把各個(gè)題目得分相加，得到量表分或分測驗(yàn)分。分等量加權(quán)和不等量加權(quán)。（2）分測驗(yàn)或量表的組合把各個(gè)分測驗(yàn)得分相加，得到量表總分。（3）測驗(yàn)或預(yù)測源的組合

同時(shí)運(yùn)用多個(gè)測驗(yàn)得分進(jìn)行預(yù)測2分?jǐn)?shù)合成的方法（1）臨床診斷——直覺合成

從整體上進(jìn)行的定性分析，靈活性強(qiáng)，有針對性。（2）加權(quán)求和合成單位加權(quán)：各原始分相加Xc=X1+X2+X3+……+Xn等量加權(quán)：如果各個(gè)分?jǐn)?shù)重要性相等，用標(biāo)準(zhǔn)分相加即可；Zc=Z1+Z2+Z3+……+Zn如果各個(gè)分?jǐn)?shù)的重要性不一樣，就要根據(jù)重要性不同，賦予不同的權(quán)重，即加權(quán)系數(shù)。Zc=W1Z1+W2Z2+W3Z3+……+WnZn（3）多重回歸用多種預(yù)測源分?jǐn)?shù)（測驗(yàn)分?jǐn)?shù)）來預(yù)測未來結(jié)果。?=a+b1x1+b2x2+b3x3+……+bnxn

（4）多重分段高中畢業(yè)合格→政審合格→體檢合格→高考合格→錄取不合格不合格不合格不合格↓↓↓↓淘汰淘汰淘汰淘汰（5）輪廓分析（剖面圖分析）在MMPI中，如果在量表2和量表7上分?jǐn)?shù)高，即27/72，說明抑郁、焦慮不安，有神經(jīng)癥。測驗(yàn)結(jié)果的解釋原始分?jǐn)?shù)與導(dǎo)出分?jǐn)?shù)原始分?jǐn)?shù)（rawscore）：將被試的反應(yīng)與標(biāo)準(zhǔn)答案相比較而獲得的測驗(yàn)分?jǐn)?shù)。原始分?jǐn)?shù)本身沒有多大意義。導(dǎo)出分?jǐn)?shù)（derivedscore）：按照一定的規(guī)則，針對原始分進(jìn)行統(tǒng)計(jì)處理后獲得的分?jǐn)?shù)。導(dǎo)出分?jǐn)?shù)具有一定參照點(diǎn)和單位，可以相互比較。根據(jù)解釋分?jǐn)?shù)時(shí)的參照標(biāo)準(zhǔn)不同，可以將導(dǎo)出分?jǐn)?shù)分為兩大類：常模參照分?jǐn)?shù)標(biāo)準(zhǔn)參照分?jǐn)?shù)：包括內(nèi)容參照分?jǐn)?shù)，結(jié)果參照分?jǐn)?shù)。第一節(jié)參照常模的分?jǐn)?shù)解釋參照常模解釋分?jǐn)?shù)，通常是將被試的分?jǐn)?shù)直接或間接地以在某個(gè)團(tuán)體中的相對等級或相對位置來表示。這個(gè)用來比較的參照團(tuán)體，稱為常模團(tuán)體（normgroup）。常模團(tuán)體的分?jǐn)?shù)分布，就是常模（norm）。一、常模團(tuán)體的組成（一）常模團(tuán)體的性質(zhì)由具有共同特征的人所組成的一組群體，或是該群體的一個(gè)樣本。任何一個(gè)測驗(yàn)，都有許多可能的常模團(tuán)體。在制定常模時(shí)，首先要確定常模團(tuán)體。在對常模參照分?jǐn)?shù)做解釋時(shí)，也必須首先考慮常模團(tuán)體的組成。（二）確定常模團(tuán)體的注意事項(xiàng)1群體構(gòu)成的界限必須明確對每個(gè)常模團(tuán)體的性質(zhì)和特征的簡短且明確的描述。2常模團(tuán)體必須是所測群體的代表性樣本克服取樣偏差，采用正確的取樣方法：隨機(jī)取樣，系統(tǒng)抽樣，分層取樣。3取樣的過程必須明確且有詳盡的描述在測驗(yàn)手冊中，有關(guān)取樣的大小、取樣方法、取樣時(shí)間等的說明和描述，越明確、越詳盡越好。4樣本大小要適當(dāng)從統(tǒng)計(jì)學(xué)原理上說，樣本是越大越好，但考慮到經(jīng)濟(jì)、實(shí)用，樣本數(shù)量也不能無限擴(kuò)大。樣本大小可以根據(jù)以下幾方面來確定：

常模總體的數(shù)目?？傮w數(shù)目小，則樣本數(shù)目也小；總體數(shù)目大，樣本數(shù)目也應(yīng)大。一般來說，樣本最好應(yīng)有30~100人；如果是全國性常模，一般應(yīng)有2000~3000人為宜。

總體性質(zhì)。總體性質(zhì)越復(fù)雜，樣本容量就越大。

測驗(yàn)結(jié)果的精確度。精確度要求越高，樣本量就越大。5常模團(tuán)體必須是近時(shí)的。6注意一般常模與特殊常模的結(jié)合二、常模參照分?jǐn)?shù)（normreferencedscore）主要有：發(fā)展量表、商數(shù)、百分位、標(biāo)準(zhǔn)分?jǐn)?shù)四大類。（一）發(fā)展量表1．心理年齡（mentalage）（智力年齡）指被試智力發(fā)展水平的年齡。單位是年（或歲）和12個(gè)等距的月。年齡量表最基本的假設(shè)是，隨年齡的增長，所測量的特質(zhì)有系統(tǒng)的改變。因此，不適用于成人。年齡量表的基本要素：（1）題目：可區(qū)分不同年齡組；（2）常模團(tuán)體：由各個(gè)年齡被試組成的有代表性樣本；（3）常模表2．年級當(dāng)量(gradeequivalents)即年級常模，用年級代替年齡，指把學(xué)生的測驗(yàn)成績與各年級學(xué)生的平均成績比較，看他相當(dāng)于幾年級的水平。年級常模的單位通常為10個(gè)月間隔。如5年級的分布為5-0到5-9。年級當(dāng)量只適用于一般課程，不適合只學(xué)1~2年的課程。年級當(dāng)量只適用于解釋本學(xué)年的水平，不適用于跨學(xué)年的。如一個(gè)五年級學(xué)生的年級當(dāng)量為8，并不能說他已經(jīng)掌握了8年級的課程。3.發(fā)展順序量表(ordinalscales)格塞爾發(fā)展順序量表格塞爾認(rèn)為，嬰幼兒的行為系統(tǒng)的建立是一個(gè)有次序的過程，反映了神經(jīng)系統(tǒng)的不斷成長和功能的分化，因而可以把每個(gè)成熟階段的行為模式作為智能診斷的依據(jù)。4周16周28周40周52周不能控制頭部，仰臥姿勢左右不對稱頸可豎直，頭微搖動(dòng)，仰臥姿勢左右對稱扶起獨(dú)坐，身體前傾可獨(dú)坐，爬行，扶著物件站立攙一手行走，搖擺皮亞杰量表用特定的任務(wù)來揭示兒童發(fā)展處于哪個(gè)階段。發(fā)展量表的優(yōu)點(diǎn)：以年齡或年級當(dāng)量為單位來報(bào)告分?jǐn)?shù)，易于被人理解?？膳c同輩團(tuán)體做直接比較。為個(gè)人內(nèi)比較與縱向研究提供了基礎(chǔ)。缺點(diǎn)：只適用于隨年齡發(fā)生系統(tǒng)變化的心理特質(zhì)的測量，對成人不合適。只適用于在典型環(huán)境下成長的兒童。發(fā)展量表的單位在各年齡、各年級并不相等，無法做代數(shù)運(yùn)算。獲得同樣的年齡或年級當(dāng)量分?jǐn)?shù)，并不一定具有相同的智力或?qū)W業(yè)成就。（二）商數(shù)(quotient)1．比率智商IQ=100（MA/CA）缺點(diǎn)：實(shí)齡是等距的，而智齡不等距（智力發(fā)展不是直線的）計(jì)算成人智商時(shí)，以多大實(shí)齡作為除數(shù)？智力生長何時(shí)達(dá)到頂點(diǎn)？不同年齡組，比率智商分?jǐn)?shù)具有不同的標(biāo)準(zhǔn)差，因而相同的比率智商對于不同年齡具有不同的意義。2.教育商數(shù)

EQ=100（EA/CA）兒童所受的教育相當(dāng)于某個(gè)年齡兒童所受教育的平均水平，則他的教育年齡就是幾歲。3．成就商數(shù)AQ=100（EQ/IQ）用于說明智力發(fā)展與教育發(fā)展是否同步。（三）百分位1百分等級（percentilerank）概念某個(gè)分?jǐn)?shù)的百分等級就是得分低于這個(gè)分?jǐn)?shù)的人數(shù)的百分比。百分等級指示個(gè)體在常模團(tuán)體中的相對位置。百分等級越低，個(gè)體所處的地位越低。計(jì)算（1）未分組分?jǐn)?shù)資料100R-50PR=100-N（2）分組分?jǐn)?shù)資料100（X-L）fPR=?+FbNi2百分點(diǎn)相對于某一百分等級的分?jǐn)?shù)點(diǎn)叫百分點(diǎn)或百分位數(shù)。3十分位百分點(diǎn)將分?jǐn)?shù)分布分成100個(gè)等份。十分位是將分?jǐn)?shù)分成10個(gè)等份。十分位提供一個(gè)10級的等級量表，每一級包括10%的分?jǐn)?shù)。

百分位的評價(jià)優(yōu)點(diǎn)：容易計(jì)算，容易解釋。對于各種被試和各種測驗(yàn)普遍適用。缺點(diǎn)：缺少相等單位，屬于順序量表，不能做加減乘除運(yùn)算。（四）標(biāo)準(zhǔn)分?jǐn)?shù)(standardscore)1Z分?jǐn)?shù)。

X-XZ=S不僅具有可比性，還具有可加性。Z=0SZ=1，-3

~+3

約占總體的99.73%。除了Z分?jǐn)?shù)外，還可以把Z分?jǐn)?shù)轉(zhuǎn)換成T分?jǐn)?shù)、標(biāo)準(zhǔn)九、離差智商等。轉(zhuǎn)換方法：線性轉(zhuǎn)換：從正態(tài)到正態(tài)非線性轉(zhuǎn)換：從偏態(tài)到正態(tài)（通過百分等級）2T分?jǐn)?shù)紀(jì)念Terman和Thorndike。

T=10?Z+50平均數(shù)為50，標(biāo)準(zhǔn)差為104離差智商(deviationIQ)IQ=100+15Z5CEEB分?jǐn)?shù)（CollegeEntranceExaminationBoard）美國大學(xué)入學(xué)考試委員會(huì)分?jǐn)?shù)

CEEB分?jǐn)?shù)=500+100Z6EPT分?jǐn)?shù)

EPT分?jǐn)?shù)=90+20Z標(biāo)準(zhǔn)分?jǐn)?shù)變式的評價(jià)優(yōu)點(diǎn)：轉(zhuǎn)換成等距量表，使進(jìn)一步統(tǒng)計(jì)分析成為可能。都可以轉(zhuǎn)換成百分等級，使得不同分?jǐn)?shù)之間可以進(jìn)行比較。缺點(diǎn)：外行難以理解；如果非正態(tài)分布，不同變式的分?jǐn)?shù)之間無法比較與求和。、幾種導(dǎo)出分?jǐn)?shù)間的相互關(guān)系三、呈現(xiàn)常模資料的方法（一）轉(zhuǎn)化表轉(zhuǎn)化表的3個(gè)基本要素：原始分、導(dǎo)出分、常模團(tuán)體的特征描述。1．簡單轉(zhuǎn)化表

2．復(fù)雜轉(zhuǎn)化表（二）剖析圖（三）常態(tài)百分位圖表分?jǐn)?shù)以百分等級來表示，而分?jǐn)?shù)軸的距離以標(biāo)準(zhǔn)分?jǐn)?shù)為單位。把百分等級與標(biāo)準(zhǔn)分結(jié)合起來使用，具有雙重優(yōu)點(diǎn)。語文推理2770******************數(shù)字能力2370*********************語文+數(shù)字5070******************抽象推理4085*********************文書速度與正確2915*********************機(jī)械推理4545*********************空間關(guān)系3065*********************拼寫6260*********************語言應(yīng)用2655*********************原始百分百分位分?jǐn)?shù)位15102025304050607075809095991510202530

人人文庫> 全部分類> 教育資料 > 中學(xué)教育

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

人事測評的心理測量學(xué)基礎(chǔ)

文檔簡介

溫馨提示

最新文檔

評論

人事測評的心理測量學(xué)基礎(chǔ)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔