心理測(cè)量學(xué)知識(shí)-教材()_第1頁(yè)
心理測(cè)量學(xué)知識(shí)-教材()_第2頁(yè)
心理測(cè)量學(xué)知識(shí)-教材()_第3頁(yè)
心理測(cè)量學(xué)知識(shí)-教材()_第4頁(yè)
心理測(cè)量學(xué)知識(shí)-教材()_第5頁(yè)
已閱讀5頁(yè),還剩194頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章心理測(cè)量學(xué)知識(shí)國(guó)家職業(yè)資格培訓(xùn)-心理咨詢師云南大學(xué)解亞寧小測(cè)驗(yàn)1、知識(shí)分測(cè)驗(yàn)分為16算術(shù)分測(cè)驗(yàn)分為7數(shù)字符號(hào)分測(cè)驗(yàn)分為4積木圖案分測(cè)驗(yàn)分為7這是什么測(cè)驗(yàn)的結(jié)果?此結(jié)果是如何得到的?如何分析和報(bào)告此結(jié)果?小測(cè)驗(yàn)2、N維度T分為60E維度T分為40P維度T分為50L維度T分為65這是什么測(cè)驗(yàn)的結(jié)果?如何分析和報(bào)告此結(jié)果?小測(cè)驗(yàn)3、SCL90總平均分為1.2SCL90抑郁因子分為3.3SCL90焦慮因子分為2.3SCL90其余因子分在0-1之間這是什么測(cè)驗(yàn)的結(jié)果?此結(jié)果是如何得到的?如何分析和報(bào)告此結(jié)果?心理咨詢師國(guó)家職業(yè)標(biāo)準(zhǔn)

國(guó)家職業(yè)資格三級(jí)

—心理咨詢員心理咨詢師國(guó)家職業(yè)標(biāo)準(zhǔn)

國(guó)家職業(yè)資格三級(jí)

—心理咨詢員心理咨詢師國(guó)家職業(yè)標(biāo)準(zhǔn)

國(guó)家職業(yè)資格三級(jí)

—心理咨詢員心理咨詢師國(guó)家職業(yè)標(biāo)準(zhǔn)

國(guó)家職業(yè)資格三級(jí)

—心理咨詢員心理咨詢師國(guó)家職業(yè)標(biāo)準(zhǔn)

國(guó)家職業(yè)資格三級(jí)

—心理咨詢員相關(guān)知識(shí)心理咨詢師國(guó)家職業(yè)標(biāo)準(zhǔn)

國(guó)家職業(yè)資格二級(jí)

—心理咨詢師心理咨詢師國(guó)家職業(yè)標(biāo)準(zhǔn)

國(guó)家職業(yè)資格二級(jí)

—心理咨詢師心理咨詢師國(guó)家職業(yè)標(biāo)準(zhǔn)

國(guó)家職業(yè)資格二級(jí)

—心理咨詢師學(xué)習(xí)內(nèi)容

〔05年版教材324-392〕第一節(jié)概述第二節(jié)測(cè)驗(yàn)的常模第三節(jié)測(cè)驗(yàn)的信度第四節(jié)測(cè)驗(yàn)的效度第五節(jié)工程分析第六節(jié)測(cè)驗(yàn)編制的一般程序第七節(jié)心理測(cè)驗(yàn)的使用第一節(jié)概述第一單元測(cè)量與測(cè)量量表定義3元素:事物、數(shù)字、法那么測(cè)量2要素:參照點(diǎn)、單位分類4量表:命名、順序、等距、等比一、什么是測(cè)量?“測(cè)量〞——是依據(jù)一定法那么用數(shù)字對(duì)事物加以確定。測(cè)量構(gòu)成的3個(gè)根本元素事物:能力、人格、外顯行為。數(shù)字:有區(qū)分性、系列或等級(jí)性、可加性法那么:規(guī)那么、方法,理論依據(jù)和指標(biāo)。

二、測(cè)量要素參照點(diǎn)事物的起點(diǎn)絕對(duì)零點(diǎn)和參照零點(diǎn)單位有確定定義有相同價(jià)值三、測(cè)量量表

斯蒂文思〔S.S.Stevens)將測(cè)量從低級(jí)到高級(jí)劃分成四種水平命名量表只是用數(shù)字來(lái)代表事物或把事物歸類。順序量表分等或排出順序。無(wú)相等單位,無(wú)絕對(duì)零點(diǎn)。等距量表有大小關(guān)系,有相等單位,無(wú)絕對(duì)零點(diǎn)。等比量表有相等單位,有絕對(duì)零點(diǎn)。第一節(jié)概述第一單元測(cè)量與測(cè)量量表第二單元心理測(cè)驗(yàn)的根本概念心理測(cè)驗(yàn)定義四特點(diǎn)心理測(cè)驗(yàn)性質(zhì)三特性心理測(cè)驗(yàn)定義有四個(gè)特點(diǎn)工具特點(diǎn):測(cè)驗(yàn)是引起某種行為的工具。行為樣本特點(diǎn):測(cè)驗(yàn)是通過(guò)行為樣本間接地推知被試者的心理特征。標(biāo)準(zhǔn)化特點(diǎn):是指測(cè)驗(yàn)編制、實(shí)施、計(jì)分和測(cè)驗(yàn)分?jǐn)?shù)解釋的一致性,即對(duì)所有被試來(lái)說(shuō)施測(cè)的條件都相同。常模特點(diǎn):一組有代表性的被試群體的測(cè)驗(yàn)分?jǐn)?shù)。測(cè)驗(yàn)分?jǐn)?shù)只有與他人的成績(jī)或常模比較才具有意義。二、心理測(cè)驗(yàn)的性質(zhì)間接性根據(jù)對(duì)測(cè)驗(yàn)工程的反響推論心理特質(zhì);相對(duì)性結(jié)果是與團(tuán)體行為進(jìn)行比較而言;客觀性工程、實(shí)施與評(píng)分和解釋標(biāo)準(zhǔn)化;第一節(jié)概述第一單元測(cè)量與測(cè)量量表第二單元心理測(cè)驗(yàn)的根本概念第三單元心理測(cè)驗(yàn)分類5種分類:功能分類性質(zhì)分類嚴(yán)謹(jǐn)程度分類測(cè)驗(yàn)方式分類測(cè)驗(yàn)要求分類第三單元心理測(cè)驗(yàn)的分類一、按測(cè)驗(yàn)功能分類

智力測(cè)驗(yàn)特殊能力測(cè)驗(yàn)人格測(cè)驗(yàn)二、按測(cè)驗(yàn)的材料分類

文字測(cè)驗(yàn)操作測(cè)驗(yàn)三、按測(cè)驗(yàn)材料的嚴(yán)謹(jǐn)程度分類

客觀測(cè)驗(yàn)投射測(cè)驗(yàn)四、按測(cè)驗(yàn)的方式分類

個(gè)別測(cè)驗(yàn)團(tuán)體測(cè)驗(yàn)五、按測(cè)驗(yàn)的要求分類

最高行為測(cè)驗(yàn)典型行為測(cè)驗(yàn)一、按測(cè)驗(yàn)的功能分類智力測(cè)驗(yàn)Binet-Simon智力測(cè)驗(yàn)、Stanford-Binet智力量表、Wechsler兒童和成人智力量表等。特殊能力測(cè)驗(yàn)職業(yè)性向測(cè)驗(yàn)、音樂、繪畫能力測(cè)驗(yàn)等人格測(cè)驗(yàn)問卷法——MMPI、16PF、EPQ等;投射法——羅夏墨跡測(cè)驗(yàn)、主體統(tǒng)覺測(cè)驗(yàn)〔TAT〕二、按測(cè)驗(yàn)材料的性質(zhì)分類文字測(cè)驗(yàn)Binet-Simon智力測(cè)驗(yàn)、Stanford-Binet智力量表、Wechsler兒童、成人智力量表中的言語(yǔ)量表、MMPI、16PF、EPQ等。非文字測(cè)驗(yàn)羅夏墨跡測(cè)驗(yàn)、主體統(tǒng)覺測(cè)驗(yàn)〔TAT〕、Wechsler兒童、成人智力量表中的操作量表、Raven測(cè)驗(yàn)等。三、按測(cè)驗(yàn)材料的嚴(yán)謹(jǐn)程度分類客觀測(cè)驗(yàn)Binet-Simon智力測(cè)驗(yàn)、Stanford-Binet智力量表、Wechsler兒童、成人智力量表MMPI、16PF、EPQ等。投射測(cè)驗(yàn)羅夏墨跡測(cè)驗(yàn)、主體統(tǒng)覺測(cè)驗(yàn)〔TAT〕、自由聯(lián)想測(cè)驗(yàn)、句子完成測(cè)驗(yàn)。四、按測(cè)驗(yàn)的方式分類個(gè)別測(cè)驗(yàn)Binet-Simon智力測(cè)驗(yàn)、Stanford-Binet智力量表、Wechsler兒童、成人智力量表羅夏墨跡測(cè)驗(yàn)、主體統(tǒng)覺測(cè)驗(yàn)〔TAT〕等。團(tuán)體測(cè)驗(yàn)MMPI、16PF、EPQ。五、按測(cè)驗(yàn)的要求分類最高作為測(cè)驗(yàn)

Binet-Simon智力測(cè)驗(yàn)、Stanford-Binet智力量表、Wechsler兒童、成人智力量表、Raven測(cè)驗(yàn)等。典型行為測(cè)驗(yàn)MMPI、16PF、EPQ。第一節(jié)概述第一單元測(cè)量與測(cè)量量表第二單元心理測(cè)驗(yàn)的根本概念第三單元心理測(cè)驗(yàn)分類第四單元錯(cuò)誤與正確的測(cè)驗(yàn)觀3個(gè)錯(cuò)誤觀2個(gè)正確觀一、測(cè)驗(yàn)的錯(cuò)誤觀測(cè)驗(yàn)萬(wàn)能論測(cè)驗(yàn)解決一切問題,分?jǐn)?shù)絕對(duì)化。測(cè)驗(yàn)無(wú)用論測(cè)驗(yàn)侵犯?jìng)€(gè)人隱私、違背民主原那么。為宿命論和種族歧視提供依據(jù)。測(cè)驗(yàn)單一論心理測(cè)驗(yàn)等于智力測(cè)驗(yàn)二、正確的測(cè)驗(yàn)觀測(cè)驗(yàn)是重要心理學(xué)研究方法、決策輔助工具;測(cè)驗(yàn)作為研究方法和工具尚不完善;第一節(jié)概述第一單元測(cè)量與測(cè)量量表第二單元心理測(cè)驗(yàn)的根本概念第三單元心理測(cè)驗(yàn)分類第四單元錯(cuò)誤與正確的測(cè)驗(yàn)觀第五單元咨詢中常用測(cè)驗(yàn)及其應(yīng)用智力測(cè)驗(yàn)人格測(cè)驗(yàn)評(píng)定量表咨詢中常用的三類測(cè)驗(yàn)及其應(yīng)用智力測(cè)驗(yàn)中國(guó)比內(nèi)測(cè)驗(yàn)、韋氏量表、Raven測(cè)驗(yàn)等;求助者有特殊要求及有可疑智力障礙時(shí)使用。人格測(cè)驗(yàn)EPQ、16PF、MMPI等;了解求助者人格及是否有精神異常。評(píng)定量表精神病評(píng)定量表、病癥評(píng)定量表等;了解心理障礙存在與否、程度及病情演變。第一節(jié)概述第一單元測(cè)量與測(cè)量量表(2,3,4)第二單元心理測(cè)驗(yàn)的根本概念(3,4)第三單元心理測(cè)驗(yàn)分類(5)第四單元錯(cuò)誤與正確的測(cè)驗(yàn)觀(2,3)第五單元咨詢中常用測(cè)驗(yàn)及其應(yīng)用(3)第六單元心理測(cè)驗(yàn)開展史三個(gè)十年四個(gè)開展方面第二節(jié)測(cè)驗(yàn)的常模第一單元常模團(tuán)體3W,1H什么是常模團(tuán)體常模團(tuán)體的條件常模團(tuán)體的取樣方法常模團(tuán)體的分?jǐn)?shù)表達(dá)形式一、常模團(tuán)體的性質(zhì)〔What〕什么是常模團(tuán)體:是由具有某種共同特征的人所組成的一個(gè)群體,或者是該群體的一個(gè)樣本。常模團(tuán)體的組成:確定一般總體--確定目標(biāo)總體--確定樣本。例:大學(xué)生價(jià)值觀研究一般總體-大學(xué)生目標(biāo)總體-各大學(xué)的學(xué)生樣本-不同性別、年齡和專業(yè)的大學(xué)生群體常模團(tuán)體的標(biāo)準(zhǔn):性別、年齡、年級(jí)、教育水平、職業(yè)、社會(huì)經(jīng)濟(jì)地位、種族二、常模團(tuán)體的條件〔Who〕常模團(tuán)體的構(gòu)成必須要明確界定必須由具有共同特征的人組成的群體(性別、年齡、年級(jí)、教育水平、職業(yè)、社會(huì)經(jīng)濟(jì)地位、種族);常模團(tuán)體的獲取必須具有代表性隨機(jī)取樣、分層抽樣。樣本大小要適當(dāng)總體只有幾十個(gè)人,那么需要100%的樣本;總體數(shù)目大的樣本,最低不少于30-100人;全國(guó)常模應(yīng)有2000-3000人。常模團(tuán)體會(huì)隨時(shí)空的變化而變化常模要定期修訂;要選擇時(shí)空較為接近的常模。三、常模團(tuán)體的取樣方法〔How〕簡(jiǎn)單隨機(jī)抽樣在簡(jiǎn)單隨機(jī)抽樣中,每個(gè)人或抽樣單位都有相同的時(shí)機(jī)作為常模中的一局部。系統(tǒng)抽樣有時(shí)在總體數(shù)目為N的情況下,假設(shè)要選擇K分之一的被試作為樣本,那么可以在抽樣范圍內(nèi)選擇每個(gè)第K個(gè)人來(lái)構(gòu)成樣本。分組抽樣有時(shí)總體數(shù)目較大,無(wú)法進(jìn)行編號(hào),而且群體又有多樣性,這時(shí)可以先將群體進(jìn)行分組,再在組內(nèi)進(jìn)行隨機(jī)取樣。分層抽樣它是先將目標(biāo)總體按某種變量〔如年齡〕分成假設(shè)干層次,再?gòu)母鲗哟沃须S機(jī)抽取假設(shè)干被試,最后把各層的被試組合成常模樣本。包括分層比例抽樣和分層非比例抽樣四、常模團(tuán)體的分?jǐn)?shù)表達(dá)形式〔What〕常模分?jǐn)?shù)由常模樣本的測(cè)驗(yàn)原始分?jǐn)?shù)按一定的規(guī)那么轉(zhuǎn)換出來(lái)的導(dǎo)出分?jǐn)?shù)。它有參照點(diǎn)和單位。例:IQ、韋氏智力量表的分測(cè)驗(yàn)量表分、T分?jǐn)?shù)等。常模指常模分?jǐn)?shù)構(gòu)成的分布。如心理測(cè)量手冊(cè)中的原始分?jǐn)?shù)與導(dǎo)出分?jǐn)?shù)的轉(zhuǎn)換表。解釋測(cè)驗(yàn)分?jǐn)?shù)的根底。一般常模特殊常模第二節(jié)測(cè)驗(yàn)的常模第一單元常模團(tuán)體第二單元常模類型開展常模百分位常模標(biāo)準(zhǔn)分常模智商一、開展常模許多心理特質(zhì)是隨時(shí)間〔年齡〕變化而開展的。將被測(cè)者的成績(jī)與各種開展水平人群平均表現(xiàn)相比較,這種常模即開展常模,該量表亦稱年齡量表。開展順序量表測(cè)驗(yàn)條目〔能力或行為〕按出現(xiàn)的早晚排列,完成該條目說(shuō)明到達(dá)相應(yīng)的年齡水平。葛塞爾嬰幼兒發(fā)育量表:包括運(yùn)動(dòng)水平、適應(yīng)性、語(yǔ)言、社會(huì)性四個(gè)方面。一個(gè)人在采用年齡量表方式編制的智力測(cè)驗(yàn)上得到的分?jǐn)?shù),簡(jiǎn)稱智齡。計(jì)算方法每個(gè)條目代表一定的年〔月〕齡,將所通過(guò)的條目折算出月齡,然后相加計(jì)算出智力年齡。如比內(nèi)量表。以標(biāo)準(zhǔn)化樣本每個(gè)年齡組平均原始分?jǐn)?shù)作為常模,被試者從測(cè)驗(yàn)中得到原始分?jǐn)?shù)與其比較,從而確定智齡。智力年齡心理年齡的分?jǐn)?shù)計(jì)算確定根底年齡全部題目都通過(guò)的那組題目所代表的年齡確定心理年齡將在所有更高年齡水平上通過(guò)的題目,用月份計(jì)算,加在根底年齡上例:某兒童6歲組題目全部通過(guò),7歲組通過(guò)4題,8歲組通過(guò)3題,9歲組通過(guò)2題?!?936年陸志韋修訂版〕智齡:6+〔4×2+3×2+2×2〕/12=7歲6個(gè)月一、開展常模年級(jí)當(dāng)量〔年級(jí)量表〕即年級(jí)水平,指各年級(jí)常模樣本的平均原始得分?!矃⒖唇滩?40頁(yè)例〕二、百分位常模百分位常模包括百分等級(jí)、百分點(diǎn)、四分位數(shù)和十分位數(shù)。

百分位常模分?jǐn)?shù)的計(jì)算及解釋百分等級(jí)百分等級(jí)是應(yīng)用最廣泛的表示測(cè)驗(yàn)分?jǐn)?shù)的方法,百分等級(jí)指出的是個(gè)體在常模團(tuán)體中所處的位置百分等級(jí)的計(jì)算未分組資料

PR=100-(100R-50)/N

R指某人原始分排列的順序數(shù)N指樣本總?cè)藬?shù)舉例:小東在30名同學(xué)中語(yǔ)文成績(jī)是80分,排列第5名,其百分等級(jí)多少?

PR=100-(100×5-50)/30=85正態(tài)分布與標(biāo)準(zhǔn)分關(guān)系百分點(diǎn)百分點(diǎn)用于計(jì)算處于某一百分比例的人相對(duì)應(yīng)的測(cè)驗(yàn)分?jǐn)?shù)是多少,因而在分?jǐn)?shù)量表上,相對(duì)于某一百分等級(jí)的分?jǐn)?shù)點(diǎn)就叫百分點(diǎn)或百分位數(shù)計(jì)算方法〔直線內(nèi)插法〕舉例:高考的最高分為695,其百分等級(jí)為100,最低分為103分,百分等級(jí)為1,求百分等級(jí)80所對(duì)應(yīng)的分?jǐn)?shù)是多少?公式:C指上限百分等級(jí)SC上限百分等級(jí)對(duì)應(yīng)的分?jǐn)?shù)F指下限百分等級(jí)SF下限百分等級(jí)對(duì)應(yīng)的分?jǐn)?shù)X百分等級(jí)PP根據(jù)百分等級(jí),要求的對(duì)應(yīng)分?jǐn)?shù)PP=575.420/(695-PP)=79/(PP-103)79(695-PP)=20(PP-103)〔等號(hào)兩側(cè)交叉相乘〕54905-79PP=20PP-206054905+2060=20PP+79PP56965=99PPPP=56965/99PP=575.4百分點(diǎn)例題計(jì)算部驟〔因式分解〕四分位數(shù)

百分位數(shù)的變式,將量表分4等份,1~25%、26~50%、51~75%和76~100%四段。十分位數(shù)

百分位數(shù)的變式,將量表分成10份,1~10%為第一段,91~100%為第十段。三、標(biāo)準(zhǔn)分?jǐn)?shù)常模標(biāo)準(zhǔn)分?jǐn)?shù)是將原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來(lái)的量表。因?yàn)樗母締挝皇菢?biāo)準(zhǔn)差,所以叫標(biāo)準(zhǔn)分?jǐn)?shù)。1.線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)根本公式為:常見的標(biāo)準(zhǔn)分?jǐn)?shù)有z分?jǐn)?shù)、Z分?jǐn)?shù)〔Z=A+BZ〕、T分?jǐn)?shù)、標(biāo)準(zhǔn)九分?jǐn)?shù)、離差智商〔IQ〕等。2.非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)z’分?jǐn)?shù)對(duì)每個(gè)原始分?jǐn)?shù)值計(jì)算累積百分比;在常態(tài)曲線面積表中,求出對(duì)于該百分比的標(biāo)準(zhǔn)〔z’〕分?jǐn)?shù)。線性轉(zhuǎn)換的標(biāo)準(zhǔn)分:

Z=A+Bz非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分:原始分百分等級(jí)常態(tài)分布的離均值〔查常態(tài)曲線面積表〕

求出對(duì)應(yīng)的z分?jǐn)?shù)常見的標(biāo)準(zhǔn)分形式根本形式z分:z=(X–X)/SDX為任一原始分X為樣本平均數(shù)SD為樣本標(biāo)準(zhǔn)差常用標(biāo)準(zhǔn)分Z分?jǐn)?shù)Z=A+BzA為量表的平均數(shù)〔根據(jù)需要指定的常數(shù)〕B為量表的標(biāo)準(zhǔn)差〔根據(jù)需要指定的常數(shù)〕z為根本形式的z分舉例:韋氏智力量表智商的平均值為100(A),標(biāo)準(zhǔn)差為15(B)。某人的全量表分高于常模1個(gè)標(biāo)準(zhǔn)差,問其FIQ應(yīng)為多少?115(IQ)=100+15×1T分?jǐn)?shù)T分?jǐn)?shù)由麥克爾于1939年提出,有紀(jì)念推孟和桑代克之意T分?jǐn)?shù)目前表示任何常態(tài)化和非常態(tài)化的轉(zhuǎn)換標(biāo)準(zhǔn)系統(tǒng),量表分平均值固定為50,量表分標(biāo)準(zhǔn)差固定為10。許多人格問卷均采用T分量表,如MMPI、EPQT=50+10(X–X)/SD或T=50+10z50(A)為T分?jǐn)?shù)〔量表分〕的平均值10(B)為T分?jǐn)?shù)〔量表分〕的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)九分1~9分的九級(jí)分?jǐn)?shù)量表,平均值為5、標(biāo)準(zhǔn)差為2。標(biāo)準(zhǔn)9分=5+2(X–X)/SD或標(biāo)準(zhǔn)9分=5+2z標(biāo)準(zhǔn)十分 1~10分的十級(jí)分?jǐn)?shù)量表,平均值為5、標(biāo)準(zhǔn)差為1.5。卡特爾16PF標(biāo)準(zhǔn)10分=5+1.5(X–X)/SD或標(biāo)準(zhǔn)10分=5+1.5z舉例:〔16PF〕30歲女性被試樂群性得分為15分,常模平均值為10.90、標(biāo)準(zhǔn)差3.23,其量表分是多少?標(biāo)準(zhǔn)二十分1~19分的分?jǐn)?shù)量表,平均值為10、標(biāo)準(zhǔn)差為3。韋氏智力量表標(biāo)準(zhǔn)20分=10+3(X–X)/SD或標(biāo)準(zhǔn)20分=10+3z舉例:〔WAIS-RC〕16歲被試算術(shù)分測(cè)驗(yàn)得分為15分,常模平均值為12.73、標(biāo)準(zhǔn)差3.55,其量表分是多少?四、智商及其意義比率智商

離差智商智商的計(jì)算及其意義最早的比內(nèi)–西蒙量表用心理年齡來(lái)表示智力的上下測(cè)驗(yàn)題目的安排完全按難度排列,某條目在某年齡組中50%能通過(guò),該條目就被當(dāng)成該年齡組的題目。比率智商比率IQ=MA〔心理年齡〕/CA〔實(shí)足年齡〕×100比率智商的缺乏之處個(gè)體智力的增長(zhǎng)與年齡的關(guān)系并非一直呈直線關(guān)系,因此不適合于成人。比率智商的分?jǐn)?shù)在不同年齡組具有不同的意義。離差智商是一種以年齡組為樣本計(jì)算而得的標(biāo)準(zhǔn)分?jǐn)?shù),為了使其與傳統(tǒng)的比率智商根本一致,一般研究者將離差智商的平均值定為100。韋克斯勒智力量表的標(biāo)準(zhǔn)差定在15IQ=100+15(X–X)/SD或IQ=100+15z斯坦福-比內(nèi)量表的標(biāo)準(zhǔn)差定在16IQ=100+16(X–X)/SD或IQ=100+16z常模標(biāo)準(zhǔn)分轉(zhuǎn)換表在實(shí)際工作中,測(cè)驗(yàn)編制者會(huì)采用某種標(biāo)準(zhǔn)分公式計(jì)算出與原始分相對(duì)應(yīng)的標(biāo)準(zhǔn)分,并編制成原始分轉(zhuǎn)換標(biāo)準(zhǔn)分等值表,附在手冊(cè)上方便使用。每個(gè)測(cè)驗(yàn)采用何種標(biāo)準(zhǔn)分,以及量表分的平均值和標(biāo)準(zhǔn)差均可從測(cè)驗(yàn)手冊(cè)中查到。舉例〔C-WYCSI〕4歲城市兒童,言語(yǔ)分量表得分42分,常模平均值為49.94、標(biāo)準(zhǔn)差11.58,其言語(yǔ)IQ是多少?第二節(jié)測(cè)驗(yàn)的常模第一單元常模團(tuán)體第二單元常模類型第三單元常模分?jǐn)?shù)表示方法轉(zhuǎn)換表法剖面圖法2種常模分?jǐn)?shù)表示方法轉(zhuǎn)換表或常模表又稱常模表,最簡(jiǎn)單、根本的表示方法。將測(cè)驗(yàn)的原始分轉(zhuǎn)換成相對(duì)應(yīng)的常模分?jǐn)?shù)〔如百分位、標(biāo)準(zhǔn)分、T分等〕〔P346〕剖面圖將測(cè)驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來(lái),如韋氏智力量表剖面圖(P346)。剖面圖能直觀地表示出被試在各分測(cè)驗(yàn)上的表現(xiàn)及相對(duì)位置。第三節(jié)測(cè)驗(yàn)的信度第一單元信度的概念2種定義3個(gè)指標(biāo)一、信度的定義1、通俗的定義即測(cè)量的可靠性、一致性或穩(wěn)定性,指對(duì)同一被試者在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)重復(fù)測(cè)量,所得結(jié)果的一致性程度。2、測(cè)量學(xué)定義——理論定義信度為一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)方差〔變異數(shù)〕和總方差〔實(shí)得分?jǐn)?shù)的方差〕的比率。

2、測(cè)量學(xué)定義——操作定義X=T+E二、信度的指標(biāo)

1、信度系數(shù)——常用相關(guān)系數(shù)來(lái)表示,通常是同一被試樣本所得的兩組資料的相關(guān)。它表示實(shí)得分?jǐn)?shù)的變異數(shù)中有多少比例是由真分?jǐn)?shù)的變異決定的,例如rXX=0.9意指變異的90%來(lái)自真分?jǐn)?shù)的差異。

相關(guān)系數(shù):表示相關(guān)程度的統(tǒng)計(jì)學(xué)指標(biāo)相關(guān)系數(shù)取值于–1.00~+1.00之間。負(fù)值表示負(fù)相關(guān),正值表示正相關(guān)?!?〞表示兩個(gè)變量之間完全沒有關(guān)系,“1〞表示兩個(gè)變量之間呈現(xiàn)一對(duì)一的關(guān)系。相關(guān)系數(shù)不是等距的度量值,因此在比較時(shí)只能說(shuō)絕對(duì)值大者比絕對(duì)值小者相關(guān)更密切一些。相關(guān)系數(shù)與其他統(tǒng)計(jì)量一樣也存在抽樣誤差,因此其統(tǒng)計(jì)學(xué)意義也應(yīng)進(jìn)行顯著性檢驗(yàn)。相關(guān)分析計(jì)算兩種具有相關(guān)關(guān)系的不同現(xiàn)象之間關(guān)系程度的統(tǒng)計(jì)學(xué)方法,結(jié)果用相關(guān)系數(shù)表示。二、信度的指標(biāo)

信度系數(shù)相關(guān)系數(shù)信度指數(shù)信度系數(shù)的根底,是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)標(biāo)準(zhǔn)差的比值。二、信度的指標(biāo)測(cè)量標(biāo)準(zhǔn)誤——測(cè)驗(yàn)分?jǐn)?shù)的變異量,信度越高,標(biāo)準(zhǔn)誤越??;信度越低,標(biāo)準(zhǔn)誤越大。第三節(jié)測(cè)驗(yàn)的信度第一單元信度的概念第二單元信度評(píng)估方法4種方法:重測(cè)信度復(fù)本信度內(nèi)部一致性信度評(píng)分者信度

重測(cè)信度——同一測(cè)驗(yàn)、同一組被試,前后兩次施測(cè),求兩次測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)。舉例:10名學(xué)生兩次測(cè)驗(yàn)的成績(jī)?nèi)缦?,求它們之間的相關(guān)?第1次成績(jī):86587964885855823275第2次成績(jī):88568976856847764575思考題:

1、如何進(jìn)行重測(cè)信度檢驗(yàn)獲得相應(yīng)的相關(guān)系數(shù)?2、重測(cè)方法的優(yōu)點(diǎn)、缺點(diǎn)?一、重測(cè)信度〔test-retestreliability〕復(fù)本信度——等值平行的測(cè)驗(yàn)叫復(fù)本,計(jì)算同一組被試在兩個(gè)復(fù)本測(cè)驗(yàn)上得分的相關(guān)系數(shù),這個(gè)系數(shù)就是復(fù)本信度系數(shù)。思考題:1、如何進(jìn)行復(fù)本信度檢驗(yàn)并獲得相應(yīng)的相關(guān)系數(shù)?2、復(fù)本信度的優(yōu)點(diǎn)、缺點(diǎn)?二、復(fù)本信度〔alternate-formrelaibility〕1、要有兩份或以上真正平行的測(cè)驗(yàn),即在題目?jī)?nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語(yǔ)、時(shí)限以及所用例題、公式和測(cè)驗(yàn)等其他方面都相同或相似。2、被試有條件接受兩個(gè)測(cè)驗(yàn)。復(fù)本信度使用前提條件:〔一〕分半信度〔split-halfreliability〕將測(cè)驗(yàn)題目對(duì)等分開,計(jì)算兩半測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)。注意:所用的公式仍然可以采用積差相關(guān)公式,但由于分半后題量地方減少會(huì)導(dǎo)致信度被低估,因此,要對(duì)信度系數(shù)加以修訂。常用斯皮爾曼—布朗的公式三、內(nèi)部一致性信度舉例〔例3〕:

10名被試者在一個(gè)有10個(gè)條目的測(cè)驗(yàn)中得分如下,求該測(cè)驗(yàn)的分半信度?被試測(cè)驗(yàn)題目得分單號(hào)得分雙號(hào)得分單雙之差1234567891012221221001761221121001004403222212111178-1410010000001105120100000013-2622122111107617221211000045-18222201101065192222211000752102211211001651合計(jì)18171315119633350482信度系數(shù)修訂方法:1、斯皮爾曼-布郎公式校正公式rxx=2rhh/〔1+rhh〕rhh——兩半分?jǐn)?shù)的相關(guān)系數(shù),rxx——測(cè)驗(yàn)在原長(zhǎng)度時(shí)的信度估計(jì)。缺陷:該公式假設(shè)兩半測(cè)驗(yàn)分?jǐn)?shù)的變異相等,如兩半測(cè)驗(yàn)分?jǐn)?shù)的變異不等值時(shí)可采用以下公式:2、弗郎那根〔Flanagan〕公式:

rxx=2[1-〔Sa2+Sb2)/Sx2]

Sa2、Sb2——兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù),Sx2——測(cè)驗(yàn)總分的變異數(shù)。3、盧倫〔Lulon〕公式:rxx=1-Sd2/Sx2Sd2——兩半測(cè)驗(yàn)分?jǐn)?shù)之差的變異數(shù),Sx2——整個(gè)測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)。同質(zhì)信度——測(cè)驗(yàn)內(nèi)部所有題目間分?jǐn)?shù)的一致性。

〔二〕同質(zhì)信度〔homogeneityreliability〕1、庫(kù)德〔G.K.Kuder〕—理查遜〔M.W.Richardson〕公式〔1〕K-R20公式:rkk=[K/〔K-1〕][1-(∑piqi)/Sx2]K——題目數(shù)Pi——通過(guò)第i個(gè)題目的人數(shù)比例qi——未通過(guò)第i個(gè)題目的人數(shù)比例Sx2——為測(cè)驗(yàn)總分的變異數(shù)。注:適用答對(duì)一題得一分,答錯(cuò)無(wú)分的測(cè)驗(yàn)。同質(zhì)信度的計(jì)算方法:〔2〕K-R21公式:

pi——題目的平均通過(guò)率qi——1-piK——題目數(shù)Sx2為測(cè)驗(yàn)總分的變異數(shù)注:適用各題難度相近的情況;當(dāng)題目難度相差大時(shí),所求信度系數(shù)有低估傾向。2、克倫巴赫α系數(shù)

α=[K/〔K-1〕][1-〔∑Si2〕/Sx2]Si2——某工程分?jǐn)?shù)的變異數(shù);其它字母意義同k-R20公式,當(dāng)題目以二分法記分時(shí),∑Si2=∑Piqi,所以K-R20公式為α系數(shù)的特例。注:1、適用多重記分的測(cè)驗(yàn);上述公式不適用速度測(cè)驗(yàn)。2、庫(kù)德-理查遜公式和克倫巴赫α系數(shù)所求得的信度通常比分半信度低。評(píng)定者信度——兩個(gè)或多個(gè)評(píng)分者之間評(píng)分的一致性。計(jì)算方法:

1、兩個(gè)評(píng)分者的一致性的計(jì)算計(jì)算每份試卷兩個(gè)評(píng)閱人打出分?jǐn)?shù)的相關(guān)系數(shù),一般要求在0.9以上,才被認(rèn)為是客觀的。四、評(píng)定者信度2、多個(gè)評(píng)分者時(shí)的一致性計(jì)算方法——肯德爾和諧系數(shù)

當(dāng)多評(píng)分者、多對(duì)象并以等級(jí)法記分時(shí),用肯德爾和諧系數(shù)計(jì)算。

K——評(píng)分者的人數(shù);N——被評(píng)的對(duì)象數(shù);Ri——第i個(gè)被評(píng)對(duì)象的被評(píng)等級(jí)之和。當(dāng)K為3~20人,N為3~7人時(shí),可通過(guò)直接查W表檢驗(yàn),當(dāng)實(shí)際計(jì)算的W值大于表中的相應(yīng)數(shù)值時(shí),說(shuō)明評(píng)分所得信度較高。當(dāng)N大于7時(shí),可計(jì)算x2值,作x2檢驗(yàn)x2=K〔N-1〕W,查df=N-1時(shí)的x2值表,如到達(dá)顯著水平,W也算到達(dá)顯著水平。評(píng)分中如果有相同等級(jí)出現(xiàn)時(shí),可用下公式:W=12[∑Ri2-(∑Ri)2/N]/[K2(N2-N)-K∑∑(n3-n)/12)]n——相同等級(jí)的個(gè)數(shù),其他與前面公式相同。

123456A253027202832B222621202530C152018142122舉例:

設(shè)有A、B、C三位教師給6篇作文評(píng)分,結(jié)果如下,試求評(píng)分者信度。

123456A524631B425631

C534621Ri147131883〔1〕將所評(píng)分?jǐn)?shù)轉(zhuǎn)化為得分等級(jí),并求出每一篇文章所得等級(jí)之和;K=3,N=6∑Ri=14+7+13+18+8+3=63(2)帶入公式計(jì)算后,W≈0.95,經(jīng)查表小于103.9,在.05水平不顯著,由此認(rèn)定評(píng)分者的一直性程度低.各種信度系數(shù)相應(yīng)誤差變異的來(lái)源信度系數(shù)類型誤差變異來(lái)源再測(cè)信度時(shí)間取樣復(fù)本信度〔連續(xù)施測(cè)〕內(nèi)容取樣復(fù)本信度〔間隔施測(cè)〕時(shí)間內(nèi)容取樣分半信度內(nèi)容取樣同質(zhì)信度內(nèi)容異質(zhì)性評(píng)分者信度評(píng)分者間差異第三節(jié)測(cè)驗(yàn)的信度第一單元信度的概念第二單元信度評(píng)估方法第三單元信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋四個(gè)方面一、解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)信度系數(shù)可以解釋在總的方差中有多少比例是由真實(shí)分?jǐn)?shù)的方差決定的;信度系數(shù)也同樣說(shuō)明了測(cè)量的誤差比例是多少;信度系數(shù)的分布為0.00~1.00范圍,代表了從缺乏信度到完全可信的所有狀況。二、確定信度可以接受的水平當(dāng)rxx<0.7時(shí),測(cè)驗(yàn)不能用于對(duì)個(gè)人做出評(píng)價(jià)或預(yù)測(cè),而且不能做團(tuán)體比較;當(dāng)0.70≤rxx<0.85時(shí),可用于團(tuán)體比較;當(dāng)rxx≥0.85時(shí),可用來(lái)鑒別或預(yù)測(cè)個(gè)人的成績(jī)或作為。新編的測(cè)驗(yàn)信度應(yīng)高于原有的同類測(cè)驗(yàn)或相似測(cè)驗(yàn)。參見教材P352的幾種心理測(cè)驗(yàn)的信度系數(shù)幾種心理測(cè)驗(yàn)的信度系數(shù)測(cè)驗(yàn)類型信度低中高成套成就測(cè)驗(yàn)0.660.920.98學(xué)術(shù)能力測(cè)驗(yàn)0.560.900.97成套傾向性測(cè)驗(yàn)0.460.880.96客觀人格測(cè)驗(yàn)0.460.850.97興趣測(cè)驗(yàn)0.420.840.93態(tài)度量表0.470.790.98三、解釋個(gè)人分?jǐn)?shù)的意義測(cè)量標(biāo)準(zhǔn)誤的應(yīng)用意義估計(jì)真實(shí)分?jǐn)?shù)的范圍;了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能變化情形。SE—測(cè)量的標(biāo)準(zhǔn)誤;Sx—所得分?jǐn)?shù)的標(biāo)準(zhǔn)差;rxx—測(cè)驗(yàn)的信度。注:該方法只能用同質(zhì)性信度來(lái)計(jì)算。在95%或然水平上真分?jǐn)?shù)的置信區(qū)間:X-1.96SE<XT≤X+1.96SE說(shuō)明大約有95%是可能性說(shuō)明,真分?jǐn)?shù)落在所得分?jǐn)?shù)的±1.96SE的范圍內(nèi)。例題:某被試的IQ為100,這是否反映了他的真實(shí)水平?如果再測(cè)一次,他的分?jǐn)?shù)將改變多少?該測(cè)驗(yàn)的標(biāo)準(zhǔn)差為15,信度系數(shù)為0.84,其被試的IQ的可能范圍是多少?〔答案見教材P353〕四、比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異差異分?jǐn)?shù)標(biāo)準(zhǔn)誤:可比較兩個(gè)人不同分?jǐn)?shù)的差異或同一個(gè)人在兩個(gè)測(cè)驗(yàn)上的差異。

SEd—差異的標(biāo)準(zhǔn)誤;S—兩個(gè)測(cè)驗(yàn)使用的標(biāo)準(zhǔn)差,要求相同。例題:〔見教材P353〕。第三節(jié)測(cè)驗(yàn)的信度第一單元信度的概念第二單元信度評(píng)估方法第三單元信度對(duì)測(cè)驗(yàn)分?jǐn)?shù)的解釋第四單元影響信度的因素四個(gè)方面第四單元影響信度的因素一、樣本的影響樣本團(tuán)體異質(zhì)性的影響同質(zhì)易得低相關(guān),易低估;異質(zhì)易得高相關(guān),易高估。樣本團(tuán)體平均能力水平的影響能力水平低的團(tuán)體信度相對(duì)低。二、測(cè)驗(yàn)長(zhǎng)度同質(zhì)性題目的增加,可提高測(cè)驗(yàn)信度;測(cè)驗(yàn)越長(zhǎng),內(nèi)容取樣越具有代表性;測(cè)驗(yàn)越長(zhǎng),被試的猜測(cè)影響因素就越小。確定測(cè)驗(yàn)長(zhǎng)度所遵循的原那么:增加測(cè)驗(yàn)長(zhǎng)度的效果應(yīng)遵循報(bào)酬遞減率原那么。測(cè)題數(shù)目的計(jì)算斯皮爾曼-布朗公式的導(dǎo)出公式:K—改變后的長(zhǎng)度與原長(zhǎng)度之比;γxx——原測(cè)驗(yàn)的信度;γkk—測(cè)驗(yàn)長(zhǎng)度是原來(lái)K倍時(shí)的信度估計(jì);例題:〔見教材P355〕第四單元影響信度的因素三、測(cè)驗(yàn)難度只存在某些測(cè)驗(yàn)中,如智力測(cè)驗(yàn)、成就測(cè)驗(yàn)等,對(duì)人格測(cè)驗(yàn)、興趣測(cè)驗(yàn)等沒有難度問題。從理論上說(shuō),只有平均難度水平為0.50時(shí),測(cè)驗(yàn)分?jǐn)?shù)分布的范圍最大,求得的信度也最高。太難或太易時(shí)信度減低。洛得〔Lord〕提出的各類選擇題的理想平均難度:五擇一題為0.70;四擇一題為0.74;三擇一題為0.77;是非題為0.85。第四單元影響信度的因素四、時(shí)間間隔對(duì)重測(cè)信度和重測(cè)復(fù)本信度有影響;兩次測(cè)驗(yàn)間隔時(shí)間越短,信度系數(shù)越大;間隔時(shí)間越長(zhǎng),信度系數(shù)越小。第四節(jié)測(cè)驗(yàn)的效度第一單元效度的概念2種定義2種性質(zhì)問題:什么是效度?檢驗(yàn)效度的方法有那些?效度檢驗(yàn)常用那些統(tǒng)計(jì)分析方法?如何進(jìn)行效度檢驗(yàn)?1、通俗的定義效度指的是測(cè)量的準(zhǔn)確性,即一個(gè)測(cè)驗(yàn)或量具能夠測(cè)量出其所要測(cè)量的東西的程度。效度是科學(xué)測(cè)量工具最重要的必備條件,一個(gè)測(cè)驗(yàn)假設(shè)無(wú)效度,那么無(wú)論其具有任何優(yōu)點(diǎn),一律無(wú)法發(fā)揮其真正的功能。一、效度的定義2、測(cè)量學(xué)的定義〔1〕理論定義——效度是指在一個(gè)測(cè)量中,與測(cè)量目的有關(guān)的真實(shí)方差〔變異、變化〕與總方差〔變異、變化〕的比率,〔2〕操作定義——用公式表示,即:rxy2=SV2/SX2SV2代表有效方差,SX2代表總方差,rxy2代表測(cè)量的效度系數(shù)。Sx2=SV2+SI2+SE2ST2=SV2+SI2一個(gè)測(cè)驗(yàn)的效度說(shuō)明,在一組測(cè)驗(yàn)分?jǐn)?shù)中,有多少比例的方差〔變異數(shù)、變化〕是由測(cè)驗(yàn)所要測(cè)量的變因引起的,其結(jié)果用效度系數(shù)表示。二、效度的性質(zhì)效度具有相對(duì)性相對(duì)某一目標(biāo)的有效性效度具有連續(xù)性反映有效性程度上下第四節(jié)測(cè)驗(yàn)的效度第一單元效度的概念第二單元效度評(píng)估的方法3類方法:內(nèi)容效度設(shè)想效度效標(biāo)效度一、內(nèi)容效度〔一〕什么是內(nèi)容效度內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為范圍取樣的適當(dāng)性。由于這種測(cè)驗(yàn)的效度主要同測(cè)驗(yàn)的內(nèi)容有關(guān),所以叫內(nèi)容效度。

〔二〕內(nèi)容效度的評(píng)估方法1、專家判斷法

請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容的符合性做出判斷,看測(cè)驗(yàn)題目是否代表規(guī)定的內(nèi)容。因?yàn)檫@是一個(gè)邏輯分析的過(guò)程,也叫邏輯效度。

1、專家判斷法——具體操作步驟①定義測(cè)驗(yàn)總體范圍,描述相關(guān)知識(shí)與技能及所用材料的來(lái)源。②編制雙向細(xì)目表,確定各種內(nèi)容所占比例,標(biāo)出每個(gè)條目設(shè)計(jì)所測(cè)內(nèi)容。③制定一個(gè)相應(yīng)的評(píng)定量表來(lái)評(píng)價(jià)效度,如測(cè)驗(yàn)包括的內(nèi)容、技能、材料的重要程度、條目對(duì)內(nèi)容的實(shí)用性等。請(qǐng)每位評(píng)定者對(duì)各方面進(jìn)行評(píng)價(jià),然后總合所有評(píng)定者的評(píng)價(jià)?!捕炒_定內(nèi)容效度的方法1、專家判斷法2、統(tǒng)計(jì)分析法

復(fù)本分析法——內(nèi)容效度可由一組被試在取自同樣內(nèi)容范圍的兩個(gè)測(cè)驗(yàn)復(fù)本上得分之相關(guān)來(lái)作數(shù)量估計(jì)。如果相關(guān)低,說(shuō)明其中至少有一個(gè)缺乏內(nèi)容效度。如果相關(guān)高,一般推論測(cè)驗(yàn)有內(nèi)容效度。當(dāng)然也可能兩個(gè)測(cè)驗(yàn)取樣有同樣或相似的偏差。評(píng)分者一致性分析再測(cè)分析——先將測(cè)驗(yàn)施測(cè)于某個(gè)團(tuán)體,該團(tuán)體對(duì)測(cè)驗(yàn)所包含的內(nèi)容僅具有最少量的知識(shí)因而得分很低。讓這個(gè)團(tuán)體參與有關(guān)材料的教學(xué)和培訓(xùn),結(jié)束后再進(jìn)行測(cè)驗(yàn)。如果成績(jī)提高,說(shuō)明測(cè)驗(yàn)測(cè)量的是課堂上所教的內(nèi)容,推論測(cè)驗(yàn)具有較高的內(nèi)容效度。二、內(nèi)容效度〔二〕確定內(nèi)容效度的方法1、專家判斷法2、統(tǒng)計(jì)分析法3、經(jīng)驗(yàn)推測(cè)法例如,經(jīng)驗(yàn)說(shuō)明測(cè)驗(yàn)成績(jī)隨年齡提高,因此分析測(cè)驗(yàn)成績(jī)或題目通過(guò)率與年齡大小的關(guān)系,如果測(cè)驗(yàn)分和題目通過(guò)率隨年齡而提高,那么說(shuō)明測(cè)驗(yàn)內(nèi)容有效。二、內(nèi)容效度〔三〕內(nèi)容效度的特點(diǎn)1、外表效度與內(nèi)容效度外表效度是由外行對(duì)測(cè)驗(yàn)作外表上的檢查所確定的;內(nèi)容效度是由夠資格的專家詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)而建立的。前者只考慮題目與測(cè)量目的之間明顯的、直接的關(guān)系;后者那么同時(shí)考慮題目與測(cè)量目的和內(nèi)容總體之間邏輯的微妙關(guān)系。2、內(nèi)容效度的應(yīng)用最高行為測(cè)驗(yàn)〔如能力測(cè)驗(yàn)〕要求有較高的外表效度,以使受測(cè)驗(yàn)者具有較強(qiáng)的動(dòng)機(jī),盡最大的努力完成。典型行為測(cè)驗(yàn)〔如人格測(cè)驗(yàn)〕卻要求較低的外表效度,如果受試者很容易就從題目上看出測(cè)題的目的,就可能作出假的反響。二、設(shè)想效度〔一〕什么是設(shè)想效度設(shè)想效度就是測(cè)驗(yàn)對(duì)某一理論概念或特質(zhì)測(cè)量的程度,即測(cè)驗(yàn)的結(jié)果能否證實(shí)或解釋某一理論的假設(shè)、術(shù)語(yǔ)或設(shè)想,解釋的程度如何,也稱結(jié)構(gòu)效度。確定設(shè)想效度的根本步驟先從某一設(shè)想的理論出發(fā),提出各項(xiàng)心理功能或行為的根本假設(shè)。據(jù)此設(shè)計(jì)和編制測(cè)驗(yàn),實(shí)施測(cè)驗(yàn),對(duì)結(jié)果采用相關(guān)和因素分析等方法,檢驗(yàn)測(cè)驗(yàn)結(jié)果是否符合理論假設(shè)。例:智力測(cè)驗(yàn)的結(jié)構(gòu)效度確實(shí)定〔1〕從一般智力理論,提出下面假設(shè):智力隨年齡增長(zhǎng);智力與學(xué)業(yè)成就有密切的關(guān)系;〔2〕根據(jù)上面的假設(shè)編制智力測(cè)驗(yàn),對(duì)測(cè)量數(shù)據(jù)進(jìn)行以下分析:測(cè)試者的分?jǐn)?shù)隨年齡的相關(guān);智力與學(xué)業(yè)的相關(guān)?!捕炒_定設(shè)想效度的方法

1、對(duì)測(cè)驗(yàn)本身的分析〔1〕測(cè)驗(yàn)內(nèi)容效度有時(shí)可以作為測(cè)驗(yàn)的結(jié)構(gòu)效度的證據(jù)。比方編制語(yǔ)文能力測(cè)驗(yàn)時(shí),對(duì)內(nèi)容范圍的界定描述為:對(duì)詞匯下定義對(duì)語(yǔ)言作類比推理在句子中正確運(yùn)用文字的能力。這實(shí)際上就是對(duì)“語(yǔ)文能力〞的設(shè)想下了定義?!捕炒_定設(shè)想效度的方法

1、對(duì)測(cè)驗(yàn)本身的分析〔2〕考察測(cè)驗(yàn)的同質(zhì)性通過(guò)計(jì)算被試在每個(gè)題目上的反響與測(cè)驗(yàn)總分的相關(guān)或分測(cè)驗(yàn)分?jǐn)?shù)與總分的相關(guān),以及α系數(shù)、庫(kù)德-理查遜系數(shù)等內(nèi)部一致性的指標(biāo),可以推估測(cè)驗(yàn)是測(cè)單一特質(zhì)還是測(cè)多種特質(zhì),從而確定測(cè)驗(yàn)的設(shè)想效度的上下。〔二〕確定設(shè)想效度的方法

1、對(duì)測(cè)驗(yàn)本身的分析〔3〕分析被試對(duì)題目作反響的過(guò)程通過(guò)被試的操作,詢問他如何處理題目,通過(guò)必要的統(tǒng)計(jì)處理分析,發(fā)現(xiàn)有些什么樣的變量影響反響,因而可確定測(cè)驗(yàn)是否測(cè)量了所要測(cè)的特質(zhì)。比方,人格測(cè)驗(yàn)有這樣的題目——“我總是防止批評(píng)別人的言行。〞通過(guò)分析,發(fā)現(xiàn)對(duì)這類題目的反響受道德觀念的影響,不單純是人格特質(zhì)內(nèi)容,設(shè)想效度會(huì)降低?!捕炒_定設(shè)想效度的方法1、對(duì)測(cè)驗(yàn)本身的分析2、測(cè)驗(yàn)間相互比較〔1〕相容效度計(jì)算與另一個(gè)效度的同類測(cè)驗(yàn)的相關(guān)。思考:如何進(jìn)行?〔二〕確定設(shè)想效度的方法1、對(duì)測(cè)驗(yàn)本身的分析2、測(cè)驗(yàn)間相互比較〔1〕相容效度〔2〕區(qū)分效度一個(gè)測(cè)驗(yàn)不僅應(yīng)與其他測(cè)量同樣設(shè)想的測(cè)驗(yàn)相關(guān),而且還必須與測(cè)量不同設(shè)想的測(cè)驗(yàn)無(wú)相關(guān)。測(cè)驗(yàn)要有效,必須測(cè)量與其他變量無(wú)關(guān)的獨(dú)立設(shè)想。用這種方法確定的效度叫區(qū)分效度。相關(guān)越低,區(qū)分度越大。〔二〕確定設(shè)想效度的方法1、對(duì)測(cè)驗(yàn)本身的分析2、測(cè)驗(yàn)間相互比較〔1〕相容效度〔2〕區(qū)分效度〔3〕因素分析法建立設(shè)想效度的常用方法是因素分析。通過(guò)對(duì)一組測(cè)驗(yàn)進(jìn)行因素分析,可以找到影響測(cè)驗(yàn)分?jǐn)?shù)的共同因素,每個(gè)因素在共同因素上的負(fù)荷量,稱為設(shè)想效度的指標(biāo)。思考題:如何進(jìn)行因素分析?〔二〕確定設(shè)想效度的方法1、對(duì)測(cè)驗(yàn)本身的分析2、測(cè)驗(yàn)間相互比較3、效標(biāo)效度的研究證明

〔1〕根據(jù)效標(biāo)〔如學(xué)習(xí)成績(jī)、診斷標(biāo)準(zhǔn)〕選取不同的被試,形成相對(duì)照的兩組,再比較兩組被試的測(cè)驗(yàn)成績(jī),假設(shè)測(cè)驗(yàn)分?jǐn)?shù)很好地將兩組分開,那么說(shuō)明其設(shè)想效度不錯(cuò)?!?〕將被試分成高分組和低分組〔例如按學(xué)習(xí)成績(jī)分組〕,檢查被試行為特點(diǎn)是否與理論構(gòu)思〔例如智力水平上下〕相吻合,如果吻合,說(shuō)明該測(cè)驗(yàn)的構(gòu)思效度不錯(cuò)。〔3〕根據(jù)心理的開展變化特點(diǎn)驗(yàn)證構(gòu)思效度〔例如智力的年齡變化特點(diǎn)〕?!捕炒_定設(shè)想效度的方法1、對(duì)測(cè)驗(yàn)本身的分析2、測(cè)驗(yàn)間相互比較3、效標(biāo)效度的研究證明4、實(shí)驗(yàn)法和觀察法證實(shí)

觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異,也是驗(yàn)證設(shè)想效度的方法〔例如學(xué)習(xí)訓(xùn)練對(duì)學(xué)業(yè)成就成績(jī)的影響〕。某考試焦慮測(cè)驗(yàn)及其設(shè)想——考試焦慮是當(dāng)考試結(jié)果對(duì)個(gè)人有重大意義時(shí)的一種害怕失敗的緊張情緒。有效的考試焦慮測(cè)驗(yàn)應(yīng)當(dāng)能反映出這種情緒變化??疾爝@測(cè)驗(yàn)是否有設(shè)想效度。設(shè)計(jì)幾種實(shí)驗(yàn)情境〔見下頁(yè)〕設(shè)想效度檢驗(yàn)例:設(shè)計(jì)1:比較不同重要性考試時(shí)該測(cè)驗(yàn)的分?jǐn)?shù)按照設(shè)想,重要考試時(shí)焦慮分?jǐn)?shù)高平時(shí)考試前實(shí)施此焦慮測(cè)驗(yàn)重要考試之前實(shí)施該焦慮測(cè)驗(yàn)比較兩次分?jǐn)?shù),如重要考試前的焦慮分?jǐn)?shù)顯著提高,就說(shuō)明這個(gè)測(cè)驗(yàn)對(duì)測(cè)量考試焦慮是有效的。設(shè)計(jì)2:兩場(chǎng)考試的測(cè)驗(yàn)分?jǐn)?shù)的比較舉行兩場(chǎng)考試,使被試相信一場(chǎng)考試關(guān)系重大,一場(chǎng)考試無(wú)關(guān)要緊。挑選兩組被試,高焦慮組和低焦慮組。比較考試成績(jī),出現(xiàn)下述情況,說(shuō)明測(cè)驗(yàn)有設(shè)想效度:焦慮分?jǐn)?shù)高組學(xué)生,如在第一場(chǎng)考試中成績(jī)比平時(shí)有所下降,在第二場(chǎng)考試中卻能正常發(fā)揮。焦慮分?jǐn)?shù)低組學(xué)生,無(wú)論在哪場(chǎng)考試都發(fā)揮正常。設(shè)計(jì)3:收集相關(guān)事件證據(jù)為測(cè)驗(yàn)分?jǐn)?shù)的比較指標(biāo)收集被試在經(jīng)歷一場(chǎng)重大考試時(shí)的生理心理參數(shù)作為焦慮的指標(biāo)將其同焦慮測(cè)驗(yàn)分?jǐn)?shù)比較相關(guān)高證明焦慮測(cè)驗(yàn)測(cè)量了焦慮這個(gè)特質(zhì)。收集某些變異上的證據(jù)假設(shè)一個(gè)特質(zhì)被定義為隨學(xué)習(xí)或成熟而改變,那么測(cè)量該特質(zhì)的測(cè)驗(yàn)分?jǐn)?shù)應(yīng)該隨著年齡的增長(zhǎng)而遞增。由此,我們根據(jù)分?jǐn)?shù)的變異便可知道一個(gè)測(cè)驗(yàn)是否具有設(shè)想效度。〔三〕對(duì)設(shè)想效度的評(píng)價(jià)優(yōu)點(diǎn):設(shè)想效度這一概念提出的最大奉獻(xiàn)是把著眼點(diǎn)放在提出假設(shè)、檢驗(yàn)假設(shè)上,因此使心理測(cè)驗(yàn)不再只是作實(shí)際決定的輔助工具,同時(shí)還成為開展心理學(xué)理論的重要工具。缺點(diǎn):有些設(shè)想概念模糊,缺乏一致的定義。同樣的設(shè)想可能有不同名稱;同樣的概念可能有不同解釋理解。確定效度時(shí)沒有明確的操作步驟與程序。沒有單一的數(shù)量指標(biāo)來(lái)描述有效程度。三、效標(biāo)效度〔實(shí)證效度〕〔一〕什么是效標(biāo)效度指一個(gè)測(cè)驗(yàn)對(duì)處于特定情境中的個(gè)體的行為進(jìn)行預(yù)測(cè)時(shí)的有效性。被預(yù)測(cè)的行為是檢驗(yàn)測(cè)驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。所以實(shí)證效度也叫效標(biāo)效度。例如:用大學(xué)入學(xué)成績(jī)預(yù)測(cè)大學(xué)生的學(xué)習(xí)成績(jī)用職業(yè)測(cè)驗(yàn)預(yù)測(cè)工作能力用人格測(cè)驗(yàn)預(yù)測(cè)哪種人容易得精神病等。效標(biāo)與效標(biāo)測(cè)量

1、效標(biāo)——所謂效標(biāo)就是衡量測(cè)驗(yàn)有效性的參照標(biāo)準(zhǔn),指的是可以直接、獨(dú)立測(cè)量的我們所感興趣的行為。

常見的效標(biāo)有:學(xué)業(yè)成就:如在校成績(jī)、學(xué)業(yè)測(cè)驗(yàn)分?jǐn)?shù)、學(xué)歷等可以作為智力和學(xué)習(xí)能力測(cè)驗(yàn)的效標(biāo)。等級(jí)評(píng)定:如對(duì)學(xué)習(xí)成績(jī)、智力、人格、工作等表現(xiàn)可以通過(guò)判斷評(píng)定一個(gè)量數(shù),用來(lái)作為各有關(guān)測(cè)驗(yàn)的效標(biāo)。臨床診斷:臨床觀察診斷的結(jié)果可以作為智力、人格等測(cè)驗(yàn)的效標(biāo)。效標(biāo)與效標(biāo)測(cè)量2、效標(biāo)測(cè)量——將觀念上的效標(biāo)用可操作的測(cè)量確定下來(lái)。例如:對(duì)于大學(xué)入學(xué)測(cè)驗(yàn)來(lái)說(shuō),我們感興趣的或要預(yù)測(cè)的行為是“大學(xué)的成功〞,即入大學(xué)后能否學(xué)得好?!按髮W(xué)的成功〞就是觀念效標(biāo),我們必須要數(shù)量化或操作化。比方大學(xué)的成績(jī)常常就用來(lái)作為對(duì)“大學(xué)的成功〞的測(cè)量,所以,大學(xué)成就就是效標(biāo)測(cè)量。一個(gè)好的效標(biāo)必須具備的條件:效標(biāo)必須能最有效地反映測(cè)驗(yàn)的目標(biāo);效標(biāo)穩(wěn)定、可靠,具有較高的信度;效標(biāo)可以客觀地加以測(cè)量,可用數(shù)據(jù)或等級(jí)來(lái)表示;效標(biāo)測(cè)量的方法簡(jiǎn)單,經(jīng)濟(jì)實(shí)用。

效標(biāo)效度是通過(guò)考察測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)的經(jīng)驗(yàn)關(guān)系確定的,一般都可以通過(guò)統(tǒng)計(jì)分析得到一個(gè)數(shù)量指標(biāo),所以也叫統(tǒng)計(jì)效度。

常用統(tǒng)計(jì)方法有:相關(guān)法、分組法、預(yù)期表法、命中率法、功利率法等?!捕炒_定效標(biāo)效度的方法1、相關(guān)法最常用來(lái)建立實(shí)證效度的方法是求測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量之間的相關(guān),所得到的數(shù)量指標(biāo)稱為效度系數(shù)。測(cè)驗(yàn)成績(jī)或分?jǐn)?shù)同效標(biāo)都是連續(xù)變量時(shí),使用積差相關(guān)法。當(dāng)測(cè)驗(yàn)分?jǐn)?shù)是連續(xù)變量,而效標(biāo)是等級(jí)評(píng)定時(shí),可用賈斯朋〔Juspen〕多系列相關(guān)公式計(jì)算。當(dāng)測(cè)驗(yàn)分?jǐn)?shù)是連續(xù)變量,而效標(biāo)是二分變量時(shí),可用點(diǎn)二列相關(guān)或二列相關(guān)公式計(jì)算。當(dāng)測(cè)驗(yàn)與效標(biāo)都是二分變量時(shí),可用皮爾遜余弦π法計(jì)算四分相關(guān)。以上幾種方法的運(yùn)算公式可參考?心理與教育統(tǒng)計(jì)?〔張厚燦粲、孟慶茂〕。相關(guān)法求效度的優(yōu)缺點(diǎn):優(yōu)點(diǎn):提供一個(gè)統(tǒng)計(jì)指標(biāo)以總結(jié)預(yù)測(cè)源與效標(biāo)間的關(guān)系??衫没貧w方程式來(lái)預(yù)測(cè)每個(gè)人的期望效標(biāo)成績(jī)。效度系數(shù)為大家廣泛接受,便于比較研究。缺點(diǎn):假設(shè)預(yù)測(cè)源與效標(biāo)的關(guān)系不是直線的,那么必須采用特殊的相關(guān)法。測(cè)驗(yàn)結(jié)果不能提供有關(guān)取舍正確性的指標(biāo)。2、區(qū)分法檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。檢驗(yàn)平均數(shù)測(cè)驗(yàn)錄取一批工人,工作一段后,根據(jù)工作成績(jī)〔產(chǎn)品數(shù)量、質(zhì)量〕分成稱職和不稱職兩組,然后再檢查當(dāng)初的測(cè)驗(yàn)分?jǐn)?shù),用t檢驗(yàn)看兩組在測(cè)驗(yàn)的平均分?jǐn)?shù)上有無(wú)顯著的差異,如果有,說(shuō)明測(cè)驗(yàn)有預(yù)測(cè)作用,否那么就沒效。2、區(qū)分法檢驗(yàn)平均數(shù)時(shí)應(yīng)注意當(dāng)團(tuán)體數(shù)量大時(shí),很小的一點(diǎn)平均數(shù)的差異都會(huì)有顯著意義,此時(shí)測(cè)驗(yàn)區(qū)分這些團(tuán)體的實(shí)際價(jià)值就很小。為了防止上述問題,必須把兩組的平均分?jǐn)?shù)、標(biāo)準(zhǔn)差、重疊量以及平均分?jǐn)?shù)的差異在統(tǒng)計(jì)學(xué)上的顯著性一并報(bào)告。3、命中率當(dāng)測(cè)驗(yàn)用來(lái)作取舍的根據(jù)時(shí),其有效性的指標(biāo)就是正確決定的比例。預(yù)測(cè)源分?jǐn)?shù)確定一個(gè)臨界分?jǐn)?shù)〔分?jǐn)?shù)線〕,高于分?jǐn)?shù)線者接受,低于分?jǐn)?shù)線拒絕。在效標(biāo)方面根據(jù)情況確定一個(gè)標(biāo)準(zhǔn),高于標(biāo)準(zhǔn)為成功,低于標(biāo)準(zhǔn)為失敗。此時(shí)可以得到預(yù)測(cè)命中表。具體內(nèi)容詳見教材P364。第四節(jié)測(cè)驗(yàn)的效度第一單元效度度的概念〔2種定義、2種性質(zhì)〕第二單元效度評(píng)估的方法〔3類方法〕第三單元效度的功能3種功能:預(yù)測(cè)誤差預(yù)測(cè)效標(biāo)分?jǐn)?shù)預(yù)測(cè)效率指數(shù)一、預(yù)測(cè)誤差效度系數(shù)的實(shí)際意義常用決定性系數(shù)來(lái)表示,即相關(guān)系數(shù)的平方,它表示正確預(yù)測(cè)或解釋的效標(biāo)方差占總方差的比例。例如,測(cè)驗(yàn)的效度是0.80,意味著測(cè)驗(yàn)的總方差中有64%的方差是測(cè)驗(yàn)分?jǐn)?shù)的方差,即測(cè)驗(yàn)分?jǐn)?shù)正確預(yù)測(cè)的比例是64%。一、預(yù)測(cè)誤差標(biāo)準(zhǔn)誤表達(dá)法Sest—標(biāo)準(zhǔn)誤Sy—效標(biāo)成績(jī)的標(biāo)準(zhǔn)差rxy—效標(biāo)系數(shù)標(biāo)準(zhǔn)誤的解釋:真正效標(biāo)分?jǐn)?shù)落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±1Sest的范圍內(nèi),有68%的可能性;落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±1.96Sest的范圍內(nèi),有95%的可能性;落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±2.58Sest的范圍內(nèi),有99%的可能性。二、預(yù)測(cè)效標(biāo)分?jǐn)?shù)最常用的是Y對(duì)X的回歸方程:

Y—預(yù)測(cè)的效標(biāo)分?jǐn)?shù)a—縱軸的截距,用來(lái)糾正平均數(shù)的差異;bxy—斜率,Y向X回歸的系數(shù);X—測(cè)驗(yàn)的分?jǐn)?shù)三、預(yù)測(cè)效率指數(shù)預(yù)測(cè)效率指數(shù)用E表示,它說(shuō)明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差。例如,E=40,意為預(yù)測(cè)誤差僅為隨機(jī)猜測(cè)所產(chǎn)生誤差的60%,即在估計(jì)效標(biāo)分?jǐn)?shù)時(shí)減少了40%的誤差。E=100〔1-K〕K為無(wú)關(guān)系數(shù),說(shuō)明預(yù)測(cè)源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無(wú)關(guān)的程度。

第四節(jié)測(cè)驗(yàn)的效度第一單元效度度的概念〔2種定義、2種性質(zhì)〕第二單元效度評(píng)估的方法〔3類方法〕第三單元效度的功能〔3種功能〕第四單元影響效度的因素4類因素:第四單元影響效度的因素

一、測(cè)驗(yàn)本身的因素〔材料、題型、難度、長(zhǎng)度、排列〕二、測(cè)驗(yàn)實(shí)施中的干擾因素〔主試、被試〕三、樣本團(tuán)體的性質(zhì)1、樣本團(tuán)體的異質(zhì)性2、干預(yù)變量四、效標(biāo)的性質(zhì)第五節(jié)工程分析第一單元工程的難度一、難度的定義

二、計(jì)算方法

三、難度水平確實(shí)定第二單元工程的區(qū)分度

一、區(qū)分度的定義

二、計(jì)算方法三、區(qū)分度與難度的關(guān)系工程分析測(cè)驗(yàn)的工程分析包括定性分析和定量分析定性分析:測(cè)驗(yàn)的內(nèi)容效度、題目編寫的恰當(dāng)性和有效性定量分析:對(duì)題目的難度和區(qū)分度進(jìn)行分析工程分析的目的通過(guò)選擇和修改測(cè)驗(yàn)題目,提高測(cè)驗(yàn)的信度和效度。第一單元工程的難度一、定義難度〔difficulty〕,指工程的難易程度,能力測(cè)驗(yàn)中一個(gè)重要的指標(biāo)。在人格測(cè)驗(yàn)中,類似的指標(biāo)是“通俗性〞。即取自相同總體樣本中,能在答案方向上答復(fù)該題的人數(shù)。兩種指標(biāo)的計(jì)算方法是相同的難度的指標(biāo)通常以通過(guò)率表示易度?P值大時(shí),難度?P值小時(shí),難度?

一、工程的難度一、定義二、計(jì)算方法二分法記分的工程〔1、0記分〕-直接計(jì)算法公式〔通過(guò)率〕:P=R/N×100%P指工程的難度〔通過(guò)率〕R答對(duì)或通過(guò)該工程的人數(shù)N全體被試人數(shù)舉例:答復(fù)某題時(shí),10名被試中8人答對(duì),其難度為:P=8/10×100%=80%

二分法記分的工程〔1、0記分〕

樣本例數(shù)較大時(shí)的計(jì)算方法根據(jù)測(cè)驗(yàn)總成績(jī)將被試分為三組高分組〔NH〕:分?jǐn)?shù)最高的27%中間組:分?jǐn)?shù)居中的46%低分組〔NL〕:分?jǐn)?shù)最低的27%計(jì)算高分和低分組的通過(guò)率計(jì)算兩組平均通過(guò)率作為難度指標(biāo)公式:P=(PH+PL)/2P指難度〔通過(guò)率〕PH指高分組通過(guò)率PL指低分組通過(guò)率舉例:某測(cè)驗(yàn)條目高分組通過(guò)率為85%,中間組通過(guò)率為52%,低分組通過(guò)率為35%,問平均通過(guò)率是多少?吉爾福特難度矯正公式〔因?yàn)檫x擇題易受到猜測(cè)的影響,備選答案越少,機(jī)遇的作用越大,越不能反映真實(shí)難度,吉爾福特的校正公式用于對(duì)此進(jìn)行校正?!矯P—矯正后的通過(guò)率P—實(shí)際得到的通過(guò)率K—備選答案的數(shù)目非二分法計(jì)分工程的平均分計(jì)算法X為全體受試者在該題目上的平均分?jǐn)?shù),Xmax為該題的總分值。

舉例:計(jì)算難度〔通過(guò)率〕某題平均得分1.8分,最高分2分,通過(guò)率:P=1.8/2.0×100%=90三、難度水平確實(shí)定〔一〕工程的難度P值越接近0.50,區(qū)別力越高;試題的平均難度應(yīng)接近0.50,各題難度分布應(yīng)該在0.50±0.20之間;測(cè)驗(yàn)用于選拔或診斷時(shí),應(yīng)較多項(xiàng)選擇擇難度值接近錄取率的工程;例:錄取率20%時(shí),難度20%。對(duì)于選擇題來(lái)說(shuō),P值一般應(yīng)大于概率水平〔P值等于概率,說(shuō)明題目過(guò)難或不清;P值小于概率,說(shuō)明題目有問題〕?!捕硿y(cè)驗(yàn)的難度〔與分?jǐn)?shù)分布的關(guān)系〕測(cè)驗(yàn)的難度取決于組成測(cè)驗(yàn)工程的難度通過(guò)觀察測(cè)驗(yàn)分?jǐn)?shù)的分布,可以進(jìn)行直觀檢驗(yàn)。如果測(cè)驗(yàn)難度適中,分?jǐn)?shù)的分布應(yīng)當(dāng)接近常態(tài)分布;如果測(cè)驗(yàn)偏難,分布呈正偏態(tài)〔圖5-4,A〕如果測(cè)驗(yàn)偏容易,分布呈負(fù)偏態(tài)〔圖5-4,B〕測(cè)驗(yàn)偏難或容易時(shí),可以通過(guò)增加或減少不同難易程度的條目來(lái)解決。某些測(cè)驗(yàn)〔如標(biāo)準(zhǔn)參照測(cè)驗(yàn)〕允許測(cè)驗(yàn)分?jǐn)?shù)呈偏態(tài)分布。正偏負(fù)偏第二單元工程的區(qū)分度一、定義指測(cè)驗(yàn)工程對(duì)所測(cè)量的心理特性的區(qū)分程度或鑒別能力。區(qū)分度取值在-1~+1之間;工程得分與實(shí)際能力水平之間相關(guān)系數(shù)越大,區(qū)分度越高。區(qū)分度低意味工程不能區(qū)分受試水平,影響效度。確定區(qū)分度的方法包括鑒別指數(shù)法和相關(guān)法?!惨弧宠b別指數(shù)法當(dāng)效標(biāo)測(cè)量是一個(gè)連續(xù)變量時(shí),可從分布的兩端〔各占27%〕選出高分組〔H〕和低分組〔L〕,然后計(jì)算高分組和低分組在該工程的通過(guò)率,這兩個(gè)百分?jǐn)?shù)之間的差異就提供了題目區(qū)分度的指標(biāo)。D=PH-PLD為鑒別指數(shù)PH為高分組某工程通過(guò)人數(shù)百分比PL低分組某工程通過(guò)人數(shù)百分比。D值越大,工程區(qū)分度越高,工程越有效。二、計(jì)算方法例:32名被試在4個(gè)題目的得分被試題1題2題3題4總分被試題1題2題3題4總分11111417110022111141810102311114191100241111420011025101132111002611103221000171110323010018110132410001911103250100110110132600101111110327100011211002280100113101022900000141001230000001511002310000016011023200000計(jì)算鑒別指數(shù)按總分排序確定高、低分組分組人數(shù)=32×0.27≈9人高分組:1~9號(hào)低分組:24~32號(hào)分別計(jì)算高、低分組在各題的通過(guò)率P1H=9÷9=1.00P1L=2÷9=0.22P2H=8÷9=0.89P2L=2÷9=0.22P3H=8÷9=0.89P3L=1÷9=0.11P4H=6÷9=0.67P4L=0÷9=0.00分別計(jì)算各題鑒別指數(shù)D1=1.00-0.22=0.78D2=0.89-0.22=0.67D3=0.89-0.11=0.78D4=0.67-0.00=0.67鑒別指數(shù)〔D〕題目評(píng)價(jià)0.40非常優(yōu)良0.30~0.39良好,如能改進(jìn)更佳0.20~0.29尚可,仍須修改0.19以下劣等,必須淘汰L.Ebel提出的鑒別指數(shù)標(biāo)準(zhǔn)〔二〕相關(guān)法計(jì)算區(qū)分度常用的方法是相關(guān)法,即以某一條目得分與效標(biāo)成績(jī)或測(cè)驗(yàn)總分進(jìn)行相關(guān)運(yùn)算。相關(guān)系數(shù)越高,說(shuō)明該條目越具有區(qū)分功能。常用于工程分析的相關(guān)方法點(diǎn)二列相關(guān)二列相關(guān)Ф相關(guān)1、點(diǎn)二列相關(guān)〔1〕適用性:適用于一個(gè)變量是連續(xù)變量,另一個(gè)是二分變量的資料。例如,某工程答對(duì)記1分,答錯(cuò)記0分,那么此工程為二分變量,而總分為連續(xù)變量?!?〕計(jì)算公式:

2、二列相關(guān)適用于兩個(gè)連續(xù)測(cè)量的變量,但其中有一個(gè)變量由于某種原因被分成兩個(gè)類別?!?〕工程分?jǐn)?shù)連續(xù),效標(biāo)或測(cè)驗(yàn)總分為上下或及格與不及格兩類?!?〕效標(biāo)連續(xù),工程分?jǐn)?shù)分為對(duì)、錯(cuò)或通過(guò)、不通過(guò)兩類。二列相關(guān)公式:Xp—通過(guò)該工程被試的平均效標(biāo)分?jǐn)?shù)Xq—未通過(guò)該工程被試的平均效標(biāo)分?jǐn)?shù)P—通過(guò)該工程的人數(shù)百分比q—未通過(guò)該工程的人數(shù)百分比St—全體被試效標(biāo)分?jǐn)?shù)的標(biāo)準(zhǔn)差y—正態(tài)分布下p與q分割點(diǎn)正態(tài)曲線的高度例子:15名被試在某測(cè)驗(yàn)第1題上的作答情況〔通過(guò)1分,未通過(guò)0分〕與效標(biāo)分?jǐn)?shù)見下表:學(xué)生序號(hào)123456789101112131415效標(biāo)分?jǐn)?shù)657031498050351681697855779042第1題得分010110100110110P=8/15=0.5333q=1-p=0.4667Xp=548/8=68.5Xq=334/7=47.71Z0.000.05...0.080.391.02.03.0p0.000.0190.03180.150.34130.47720.4986y0.39890.39840.397670.37040.24190.05390.00433、φ相關(guān)(1〕適用性:適用兩個(gè)變量都是二分變量。一些連續(xù)變量也可以用此方法計(jì)算相關(guān)系數(shù)。φ相關(guān)不要求變量呈正態(tài)分布。用該系數(shù)作為區(qū)分度指標(biāo)時(shí),要求題目反響和效標(biāo)量都是二分變量?!?〕公式:45名考生考取大學(xué)的人數(shù)和在某題上通過(guò)的人數(shù)見下表:升學(xué)情況題考取未考取合計(jì)目通過(guò)13〔A〕7〔B〕20反未通過(guò)5〔C〕20〔D〕25應(yīng)合計(jì)182745例題:三、區(qū)分度與難度的關(guān)系工程通過(guò)率P鑒別指數(shù)D1.000.00.90.20.70.60.501.00.30.60.10.200.00.00三、區(qū)分度與難度的關(guān)系區(qū)分度與難度的關(guān)系區(qū)分度與難度有密切的關(guān)系難度為0.5時(shí),區(qū)分度最高難度較高或較低時(shí),區(qū)分度中等非常高或非常低的難度時(shí),區(qū)分度也很低不同水平被試中區(qū)分度與難度的關(guān)系較難的題目對(duì)高水平被試有較高的區(qū)分度中等難度的題目對(duì)中水平被試有較高的區(qū)分度較容易的題目對(duì)低水平被試有較高的區(qū)分度平均難度0.5左右,能保持整體較好的區(qū)分度。第六節(jié)測(cè)驗(yàn)編制的一般程序第一單元測(cè)驗(yàn)的目標(biāo)分析第二單元測(cè)題的編寫第三單元測(cè)驗(yàn)的編排和組織第一單元測(cè)驗(yàn)的目標(biāo)分析一、測(cè)驗(yàn)的對(duì)象明確測(cè)量對(duì)象二、測(cè)驗(yàn)的用途〔描述、診斷、選拔、預(yù)測(cè)〕顯示性測(cè)驗(yàn)預(yù)測(cè)性測(cè)驗(yàn)三、測(cè)驗(yàn)的目標(biāo)工作分析對(duì)特定概念下定義確定測(cè)驗(yàn)的具體內(nèi)容確定哪些

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論