心理測(cè)量學(xué)課件_第1頁(yè)
心理測(cè)量學(xué)課件_第2頁(yè)
心理測(cè)量學(xué)課件_第3頁(yè)
心理測(cè)量學(xué)課件_第4頁(yè)
心理測(cè)量學(xué)課件_第5頁(yè)
已閱讀5頁(yè),還剩883頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

心理測(cè)量概論心理測(cè)量學(xué)

心理測(cè)量的基本性質(zhì)

1測(cè)驗(yàn)的類型與功能

2測(cè)驗(yàn)的編制與實(shí)施

3心理測(cè)量發(fā)展簡(jiǎn)史

4心理測(cè)量學(xué)

心理測(cè)量的基本性質(zhì)

第一節(jié)心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)

DBCA升學(xué)升級(jí)要測(cè)驗(yàn)

應(yīng)聘謀職要測(cè)驗(yàn)執(zhí)業(yè)上崗要測(cè)驗(yàn)晉職晉級(jí)要測(cè)驗(yàn)

人生的每個(gè)關(guān)鍵時(shí)刻都要用到測(cè)驗(yàn)心理測(cè)量應(yīng)用的普遍性一、心理測(cè)量學(xué)一、心理測(cè)量應(yīng)用的普遍性(續(xù))

1

2

3

4評(píng)估人的心理發(fā)展水平有心理成熟測(cè)驗(yàn)評(píng)估人的智力發(fā)展水平有智力測(cè)驗(yàn)

評(píng)估人的心理健康水平有心理健康測(cè)驗(yàn)評(píng)估人的人格特征有人格測(cè)驗(yàn)人心理的各個(gè)側(cè)面都有測(cè)驗(yàn)心理測(cè)量學(xué)一、心理測(cè)量應(yīng)用的普遍性(續(xù))5評(píng)估人的教育水平有教育成就測(cè)驗(yàn)

6評(píng)估人的職業(yè)能力有執(zhí)業(yè)資格測(cè)驗(yàn)7評(píng)估人的學(xué)術(shù)能力有學(xué)術(shù)性向測(cè)驗(yàn)

三百六十行,行行有測(cè)驗(yàn)心理測(cè)量學(xué)一、心理測(cè)量應(yīng)用的普遍性(續(xù))需要更多的專業(yè)人員

社會(huì)發(fā)展和進(jìn)步的標(biāo)志

心理測(cè)量發(fā)展

心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)二、心理的可測(cè)性人的心理非物質(zhì),人的心理可測(cè)嗎?

心理測(cè)量學(xué)二、心理的可測(cè)性(續(xù))孟子:權(quán),然后知輕重;度,然后知長(zhǎng)短。物皆然,心為甚。桑代克:凡客觀存在的事物都有其數(shù)量。麥考爾:凡有其數(shù)量的事物都可以測(cè)量。心理測(cè)量學(xué)二、心理的可測(cè)性(續(xù))辯證唯物主義的觀點(diǎn):

人的外顯行為客觀存在,可以感覺、知覺,進(jìn)而可以測(cè)量。心理學(xué)的研究證明:

可以通過測(cè)量人的外顯行為而推測(cè)人的心理。

心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)三、心理測(cè)量的間接性心理測(cè)量是一種間接測(cè)量。間接測(cè)量必須找準(zhǔn)中介媒質(zhì)。物理測(cè)量也有間接測(cè)量:測(cè)氣溫中介媒質(zhì):水銀心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)三、心理測(cè)量的間接性(續(xù))心理測(cè)量的中介媒質(zhì):人的外顯行為外顯行為:種類眾多而且復(fù)雜多變心理測(cè)量的間接測(cè)量難度更大。心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)四、心理測(cè)量的定義廣義測(cè)量定義:

測(cè)量是依據(jù)一定的法則使用量具對(duì)事物的特征進(jìn)行定量描述的過程。心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)四、心理測(cè)量的定義心理測(cè)量定義:

依據(jù)一定的心理學(xué)理論,使用測(cè)驗(yàn)對(duì)人的心理品質(zhì)進(jìn)行定量描述的活動(dòng)。心理測(cè)量學(xué)四、心理測(cè)量的定義(續(xù))定義理解1、心理測(cè)量依據(jù)的法則:心理學(xué)理論心理測(cè)量學(xué)四、心理測(cè)量的定義(續(xù))定義理解(續(xù))2、心理測(cè)量工具:測(cè)驗(yàn)。測(cè)驗(yàn)的本質(zhì):一個(gè)一個(gè)精心設(shè)計(jì)、精心編排,被稱為“題目”的行為刺激組成,“測(cè)驗(yàn)”內(nèi)容千差萬別,形式林林總總。

心理測(cè)量學(xué)四、心理測(cè)量的定義(續(xù))定義理解(續(xù))3、測(cè)量的對(duì)象:人的心理品質(zhì)。心理品質(zhì)具有內(nèi)隱性,概念具有抽象性心理測(cè)量所測(cè)的心理品質(zhì)實(shí)際上是人們的某種理論“構(gòu)念”我們還要在所測(cè)對(duì)象為何物的界定上下功夫。心理測(cè)量學(xué)四、心理測(cè)量的定義(續(xù))定義理解(續(xù))4、心理測(cè)量的結(jié)果:對(duì)象的定量描述作為現(xiàn)代科學(xué)的心理測(cè)量學(xué),涉及多門學(xué)科。心理測(cè)量學(xué)四、心理測(cè)量的定義(續(xù))1“心理測(cè)量”:多指一項(xiàng)活動(dòng)、一個(gè)過程。2“心理測(cè)驗(yàn)”:多指一樣工具,一個(gè)測(cè)量文本偶爾當(dāng)動(dòng)詞用3“心理評(píng)估”:指獲取了測(cè)量結(jié)果信息后根據(jù)某種標(biāo)準(zhǔn)做出狀態(tài)優(yōu)劣判斷的活動(dòng)。

區(qū)別本書三詞用法差異心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)五、心理測(cè)量的心理影響性心理影響性:無論主觀愿望是什么,只要實(shí)施測(cè)量,就會(huì)給被測(cè)量者的心理發(fā)展帶來影響。影響可能是積極的,也可能是消極的,可能是短期的,也可能是長(zhǎng)期的。心理測(cè)量學(xué)五、心理測(cè)量的心理影響性(續(xù))積極的心理影響:教育測(cè)量:準(zhǔn)確評(píng)價(jià),激勵(lì)學(xué)習(xí)。經(jīng)歷測(cè)量也是學(xué)習(xí),有助于提高。心理測(cè)量學(xué)五、心理測(cè)量的心理影響性(續(xù))積極的心理影響:人格測(cè)驗(yàn):了解人格,促使人格健康發(fā)展,促使行為被人悅納。心理測(cè)量學(xué)五、心理測(cè)量的心理影響性(續(xù))積極的心理影響:能力傾向測(cè)驗(yàn):了解特長(zhǎng),選擇和分配合適工作,人、崗和諧匹配。心理測(cè)量學(xué)五、心理測(cè)量的心理影響性(續(xù))消極的心理影響:誤用和濫用,使用質(zhì)量低劣的測(cè)驗(yàn)夸大教育考試的作用:為應(yīng)試而學(xué)習(xí),忽視綜合素質(zhì)發(fā)展。頻繁施行教育考試,學(xué)生疲于應(yīng)付,身心受摧殘。心理測(cè)量學(xué)五、心理測(cè)量的心理影響性(續(xù))消極的心理影響(續(xù)):不科學(xué)解釋智力測(cè)驗(yàn):盲目樂觀,迷失方向或自暴自棄,喪失動(dòng)力。不合理使用人格測(cè)驗(yàn):傷害自尊,甚至導(dǎo)致人格分裂。心理測(cè)量學(xué)五、心理測(cè)量的心理影響性(續(xù))消極的心理影響(續(xù)):使用質(zhì)量低劣測(cè)驗(yàn):對(duì)被試做出錯(cuò)誤的描述,引發(fā)嚴(yán)重后果。結(jié)論:編制、選擇和使用測(cè)驗(yàn)都要非常慎重。

心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)六、心理測(cè)量的工具及其特性測(cè)驗(yàn)的本質(zhì):任何測(cè)量工具都是有參照點(diǎn)和測(cè)量單位的數(shù)字系統(tǒng)。在心理測(cè)量學(xué)中也把它叫做量表。量表的兩要素:參照點(diǎn)、測(cè)量單位心理測(cè)量學(xué)六、心理測(cè)量的工具及其特性(續(xù))參照點(diǎn):測(cè)量的起點(diǎn),也稱零點(diǎn)。參照點(diǎn)分類:絕對(duì)零點(diǎn):絕對(duì)理解相對(duì)零點(diǎn):測(cè)值零只能說品質(zhì)處于“零點(diǎn)”這個(gè)狀態(tài)有絕對(duì)零點(diǎn)的測(cè)量比只有相對(duì)零點(diǎn)的測(cè)量性能更好優(yōu)良測(cè)量單位:有統(tǒng)一的意義,有恒定的價(jià)值。心理測(cè)量學(xué)六、心理測(cè)量的工具及其特性(續(xù))心理測(cè)量量表兩要素的特點(diǎn):參照點(diǎn)是人為的測(cè)量的單位要經(jīng)過統(tǒng)計(jì)處理才能有統(tǒng)一意義,有恒定價(jià)值心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)七、心理測(cè)量誤差存在的普遍性與嚴(yán)重性測(cè)量的誤差:測(cè)量所得值與欲測(cè)品質(zhì)實(shí)際值之間的差異值。誤差的區(qū)別:誤差的性質(zhì)誤差的大小誤差的來源誤差控制的難度心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)七、心理測(cè)量誤差存在的普遍性與嚴(yán)重性心理與教育測(cè)量誤差:不僅存在而且還非常的嚴(yán)重。測(cè)量研究主要任務(wù):研究如何控制測(cè)量的誤差。

心理測(cè)量學(xué)七、測(cè)量誤差存在的普遍性與嚴(yán)重性(續(xù))(一)測(cè)量誤差的類型隨機(jī)誤差:所得值與實(shí)際值之間大小和方向都會(huì)隨機(jī)變化的差異值。系統(tǒng)誤差:所得值與實(shí)際值之間的那種大小和方向都不變的差異值。心理測(cè)量學(xué)七、測(cè)量誤差存在的普遍性與嚴(yán)重性(續(xù))(一)測(cè)量誤差的類型(續(xù))特點(diǎn):誤差與實(shí)際測(cè)量值共居一體、混淆難分。任務(wù):將它們分離出來,評(píng)估它們的大小,研究控制辦法。心理測(cè)量學(xué)七、測(cè)量誤差存在的普遍性與嚴(yán)重性(續(xù))(二)測(cè)量誤差形成的原因1、心理品質(zhì)的特殊性內(nèi)隱、抽象,造成對(duì)目標(biāo)認(rèn)識(shí)不清晰,導(dǎo)致誤差不穩(wěn)定,波動(dòng)起伏,導(dǎo)致誤差。受測(cè)者未掌握正確作答技能,致使作答不能代表真實(shí)水平。受測(cè)者故意掩飾。致使評(píng)價(jià)出現(xiàn)誤差。心理測(cè)量學(xué)七、測(cè)量誤差存在的普遍性與嚴(yán)重性(續(xù))2、使用質(zhì)量不高的測(cè)量工具人的外顯行為與人的心理品質(zhì)只具備相關(guān)關(guān)系所測(cè)外顯行為不是欲測(cè)心理品質(zhì)的代表性行為測(cè)驗(yàn)項(xiàng)目只“刺激”出了欲測(cè)心理品質(zhì)的一部分行為外顯行為不清晰、不穩(wěn)定心理測(cè)量學(xué)(二)測(cè)量誤差形成的原因(續(xù))3、施測(cè)過程和施測(cè)環(huán)境安排控制不好施測(cè)過程沒有統(tǒng)一要求,測(cè)試指導(dǎo)語(yǔ)沒有統(tǒng)一版本,作答起始時(shí)間和長(zhǎng)短不統(tǒng)一,測(cè)試時(shí)的內(nèi)外環(huán)境令被試不能集中精力測(cè)試過程失控、紀(jì)律混亂,舞弊。心理測(cè)量學(xué)(二)測(cè)量誤差形成的原因(續(xù))4、主試的不良品質(zhì)主試對(duì)所測(cè)心理品質(zhì)的理解有誤主試實(shí)施的程序有誤評(píng)分標(biāo)準(zhǔn)掌握不準(zhǔn)確心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)

八、心理測(cè)量誤差控制的理論與技術(shù)概述目標(biāo)真分?jǐn)?shù),記為V,是測(cè)量者所追求的測(cè)量值。隨機(jī)誤差分?jǐn)?shù),記為E非目標(biāo)真分?jǐn)?shù)(系統(tǒng)誤差分?jǐn)?shù)):記為I目標(biāo)真分?jǐn)?shù)與非目標(biāo)真分?jǐn)?shù)合在一起稱為真分?jǐn)?shù),記為T。心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)

九、心理測(cè)量誤差控制的理論與技術(shù)概述(續(xù))心理與教育測(cè)量學(xué)假設(shè):

進(jìn)而有:心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)

九、心理測(cè)量誤差控制的理論與技術(shù)概述(續(xù))在三者都相互獨(dú)立的假設(shè)下,推得以下兩公式:

心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)

九、心理測(cè)量誤差控制的理論與技術(shù)概述(續(xù))信度:真分?jǐn)?shù)方差在觀察分?jǐn)?shù)方差中所占的比,記為:效度:目標(biāo)真分?jǐn)?shù)方差在觀察分?jǐn)?shù)方差中所占的比記為;

心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)

九、心理測(cè)量誤差控制的理論與技術(shù)概述(續(xù))心理測(cè)量的誤差控制的任務(wù):努力控制測(cè)量的隨機(jī)誤差,提高測(cè)量的信度。努力控制測(cè)量的隨機(jī)誤差和系統(tǒng)誤差,提高測(cè)量的效度。心理測(cè)量學(xué)第一節(jié)心理測(cè)量的基本性質(zhì)

九、心理測(cè)量誤差控制的理論與技術(shù)概述(續(xù))經(jīng)典測(cè)量理論(ClassicalTestTheory,CTT)。其他理論:項(xiàng)目反應(yīng)理論(ItemResponseTheory,,TRT)概化理論(JeneralizabilityTheory,GT)心理測(cè)量學(xué)第一章心理測(cè)量概論測(cè)驗(yàn)的類型與功能

第二節(jié)心理測(cè)量學(xué)第二節(jié)測(cè)驗(yàn)的類型與功能

一、按所測(cè)心理品質(zhì)不同分類(一)能力測(cè)驗(yàn)1.智力測(cè)驗(yàn)(IntelligenceTest):

測(cè)量人的一般認(rèn)知能力水平高低的測(cè)驗(yàn)。智力測(cè)驗(yàn)的結(jié)果比較穩(wěn)定。測(cè)量理論與技術(shù)研究最早涉及領(lǐng)域心理測(cè)量學(xué)(一)能力測(cè)驗(yàn)(續(xù))1斯坦福-比內(nèi)量表2韋克斯勒智力量表3瑞文推理測(cè)驗(yàn)著名智力測(cè)驗(yàn)

心理測(cè)量學(xué)(一)能力測(cè)驗(yàn)(續(xù))2.能力傾向測(cè)驗(yàn)(AptitudeTest):能力傾向測(cè)驗(yàn)類型:一般能力傾向測(cè)驗(yàn):測(cè)量個(gè)體在多種能力上的潛在優(yōu)勢(shì)的測(cè)驗(yàn)。

特殊能力傾向測(cè)驗(yàn):測(cè)量個(gè)體在音樂、繪畫等特殊能力上的潛在優(yōu)勢(shì)的測(cè)驗(yàn)。心理測(cè)量學(xué)(一)能力測(cè)驗(yàn)(續(xù))2.能力傾向測(cè)驗(yàn)(續(xù)):能力傾向特點(diǎn):依賴于先天,與生活經(jīng)驗(yàn)有關(guān),一般不受專門教學(xué)或訓(xùn)練影響。

能力傾向測(cè)驗(yàn)性質(zhì):測(cè)值相對(duì)穩(wěn)定,具有預(yù)測(cè)功能。心理測(cè)量學(xué)(一)能力測(cè)驗(yàn)(續(xù))3.成就測(cè)驗(yàn)(AchievementTests):成就測(cè)驗(yàn)特點(diǎn):

在特定領(lǐng)域?yàn)闄z測(cè)應(yīng)試者對(duì)有關(guān)知識(shí)和技能的掌握程度而設(shè)計(jì)的測(cè)驗(yàn)。教學(xué)和訓(xùn)練會(huì)明顯改變成就測(cè)驗(yàn)的結(jié)果。成就測(cè)驗(yàn)類型:學(xué)科成就測(cè)驗(yàn)、綜合成就測(cè)驗(yàn)、診斷測(cè)驗(yàn)心理測(cè)量學(xué)(一)能力測(cè)驗(yàn)(續(xù))具體性越來越強(qiáng)抽象性越來越弱穩(wěn)定性越來越差

智力測(cè)驗(yàn)

能力傾向測(cè)驗(yàn)

成就測(cè)驗(yàn)?zāi)芰y(cè)驗(yàn)類型特征:心理測(cè)量學(xué)一、按所測(cè)心理品質(zhì)不同分類(續(xù))(二)人格測(cè)驗(yàn)人格測(cè)驗(yàn)(PersonalityTest):測(cè)量個(gè)體人格的獨(dú)特性和傾向性特征的測(cè)驗(yàn)。心理學(xué)人格概念特征:概念非常廣泛,涉及所有情感和非智力因素。應(yīng)用較廣的人格測(cè)驗(yàn):自陳人格測(cè)驗(yàn)、人格投射測(cè)驗(yàn)。心理測(cè)量學(xué)(二)人格測(cè)驗(yàn)(續(xù))1艾森克人格問卷(EPQ)2明尼蘇達(dá)多相人格調(diào)查表(MMPI).3卡特爾16種人格因素測(cè)驗(yàn)(16PF)

著名自陳人格測(cè)驗(yàn)

心理測(cè)量學(xué)(二)人格測(cè)驗(yàn)(續(xù))1羅夏墨跡測(cè)驗(yàn)(RIT)著名投射測(cè)驗(yàn)

2主題統(tǒng)覺測(cè)驗(yàn)(TAT)心理測(cè)量學(xué)(二)人格測(cè)驗(yàn)(續(xù))4句字完成測(cè)驗(yàn)3詞語(yǔ)聯(lián)想測(cè)驗(yàn)其他投射測(cè)驗(yàn)

心理測(cè)量學(xué)第二節(jié)測(cè)驗(yàn)的類型與功能

二、按對(duì)被試評(píng)價(jià)時(shí)所用的參照標(biāo)準(zhǔn)不同分類對(duì)被試評(píng)價(jià)所用的參照標(biāo)準(zhǔn):相對(duì)標(biāo)準(zhǔn)、絕對(duì)標(biāo)準(zhǔn)應(yīng)用相對(duì)標(biāo)準(zhǔn)的稱作為常模參照測(cè)驗(yàn)應(yīng)用絕對(duì)標(biāo)準(zhǔn)的稱作為標(biāo)準(zhǔn)參照測(cè)驗(yàn)心理測(cè)量學(xué)二、按評(píng)價(jià)參照標(biāo)準(zhǔn)不同分類

(一)常模參照測(cè)驗(yàn)(Norm-ReferencedTest)定義:以個(gè)體在團(tuán)體中的相對(duì)地位來評(píng)價(jià)個(gè)體發(fā)展水平的測(cè)驗(yàn)。心理測(cè)量學(xué)二、按評(píng)價(jià)參照標(biāo)準(zhǔn)不同分類

(一)常模參照測(cè)驗(yàn)性質(zhì):執(zhí)行可高可低的相對(duì)難度標(biāo)準(zhǔn),難度的高低決定于團(tuán)體本身的水平??赡苁挂恍└呃?、高競(jìng)爭(zhēng)性測(cè)驗(yàn)難度失控。團(tuán)體水平發(fā)生變化,常模參照測(cè)驗(yàn)要重新修訂。心理測(cè)量學(xué)二、按評(píng)價(jià)參照標(biāo)準(zhǔn)不同分類

(二)標(biāo)準(zhǔn)參照測(cè)驗(yàn)(Criterion-ReferencedTest)定義:以個(gè)體水平是否達(dá)到測(cè)驗(yàn)領(lǐng)域某一固定標(biāo)準(zhǔn)來評(píng)價(jià)個(gè)體發(fā)展水平的測(cè)驗(yàn)。心理測(cè)量學(xué)二、按評(píng)價(jià)參照標(biāo)準(zhǔn)不同分類

(二)標(biāo)準(zhǔn)參照測(cè)驗(yàn)(續(xù))性質(zhì):使用絕對(duì)標(biāo)準(zhǔn),不因很多個(gè)體都已達(dá)到而提高標(biāo)準(zhǔn),也不因很多個(gè)體都未達(dá)到而降低標(biāo)準(zhǔn)。各種專業(yè)資格測(cè)驗(yàn)都屬于標(biāo)準(zhǔn)參照測(cè)驗(yàn)。心理測(cè)量學(xué)二、按評(píng)價(jià)參照標(biāo)準(zhǔn)不同分類

按評(píng)價(jià)參照標(biāo)準(zhǔn)不同分類小結(jié):常模參照和標(biāo)準(zhǔn)參照區(qū)分:理論上絕對(duì),實(shí)際應(yīng)用中有二者兼具的。附:潛力參照測(cè)驗(yàn):定義:以個(gè)體可能達(dá)到的水平來評(píng)價(jià)個(gè)體已經(jīng)達(dá)到水平的測(cè)驗(yàn)。性質(zhì):符合對(duì)個(gè)體進(jìn)行自身激勵(lì)的評(píng)價(jià)思想。

心理測(cè)量學(xué)第二節(jié)測(cè)驗(yàn)的類型與功能

三、標(biāo)準(zhǔn)化測(cè)驗(yàn)與非標(biāo)準(zhǔn)化測(cè)驗(yàn)標(biāo)準(zhǔn)化測(cè)驗(yàn):四個(gè)方面的標(biāo)準(zhǔn)化要求測(cè)驗(yàn)編制過程標(biāo)準(zhǔn)化測(cè)驗(yàn)實(shí)施標(biāo)準(zhǔn)化測(cè)驗(yàn)評(píng)分標(biāo)準(zhǔn)化測(cè)驗(yàn)分?jǐn)?shù)解釋標(biāo)準(zhǔn)化心理測(cè)量學(xué)四個(gè)方面的標(biāo)準(zhǔn)化編制過程標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化測(cè)驗(yàn)編制步驟(六步):測(cè)驗(yàn)?zāi)繕?biāo)分解編制方案設(shè)計(jì)命題征題心理測(cè)量學(xué)四個(gè)方面的標(biāo)準(zhǔn)化編制過程標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化測(cè)驗(yàn)編制步驟(續(xù)):測(cè)試分析分?jǐn)?shù)體系設(shè)計(jì)與制作測(cè)驗(yàn)使用指導(dǎo)書編寫心理測(cè)量學(xué)四個(gè)方面的標(biāo)準(zhǔn)化編制過程標(biāo)準(zhǔn)化編制質(zhì)量的標(biāo)準(zhǔn)化:

測(cè)驗(yàn)信度效度要求每個(gè)題目的質(zhì)量要求心理測(cè)量學(xué)四個(gè)方面的標(biāo)準(zhǔn)化(續(xù))測(cè)驗(yàn)實(shí)施標(biāo)準(zhǔn)化:對(duì)主試的要求對(duì)被試的要求對(duì)測(cè)試場(chǎng)所內(nèi)外環(huán)境的要求測(cè)試過程順序的要求心理測(cè)量學(xué)四個(gè)方面的標(biāo)準(zhǔn)化(續(xù))測(cè)驗(yàn)評(píng)分標(biāo)準(zhǔn)化:試題要有公認(rèn)的科學(xué)答案有統(tǒng)一規(guī)范的評(píng)分標(biāo)準(zhǔn)心理測(cè)量學(xué)四個(gè)方面的標(biāo)準(zhǔn)化(續(xù))測(cè)驗(yàn)分?jǐn)?shù)解釋標(biāo)準(zhǔn)化:測(cè)驗(yàn)的報(bào)告分?jǐn)?shù)要有明確的解釋方法和解釋依據(jù)。常模參照測(cè)驗(yàn):配有解釋常模,可以確定每個(gè)分?jǐn)?shù)在團(tuán)體中的確切地位。標(biāo)準(zhǔn)參照測(cè)驗(yàn):配有合格分?jǐn)?shù)線以確定每個(gè)分?jǐn)?shù)的合格與否

。心理測(cè)量學(xué)標(biāo)準(zhǔn)化測(cè)驗(yàn)(續(xù))標(biāo)準(zhǔn)化概念說明:標(biāo)準(zhǔn)化主要都是為了控制測(cè)量的隨機(jī)誤差和系統(tǒng)誤差。教育與心理測(cè)量中“標(biāo)準(zhǔn)化”可以理解為是一系列的嚴(yán)格標(biāo)準(zhǔn),也可以理解為是一個(gè)過程—測(cè)驗(yàn)的標(biāo)準(zhǔn)化過程。實(shí)際應(yīng)用的測(cè)驗(yàn)是否是標(biāo)準(zhǔn)化測(cè)驗(yàn)必須嚴(yán)格鑒別。心理測(cè)量學(xué)標(biāo)準(zhǔn)化測(cè)驗(yàn)(續(xù))標(biāo)準(zhǔn)化測(cè)驗(yàn)特點(diǎn):編制要求嚴(yán)格,測(cè)驗(yàn)編制周期長(zhǎng),人財(cái)物投入大,測(cè)驗(yàn)設(shè)計(jì)要求面向盡量大的被試群體,使用的針對(duì)性、靈活性常常不能滿足要求。心理測(cè)量學(xué)三、標(biāo)準(zhǔn)化測(cè)驗(yàn)與非標(biāo)準(zhǔn)化測(cè)驗(yàn)(續(xù))非標(biāo)準(zhǔn)化測(cè)驗(yàn)特點(diǎn):編制目的明確、測(cè)試對(duì)象熟悉、內(nèi)容設(shè)計(jì)針對(duì)性強(qiáng)、方法靈活多變、編程短不能輕視自編測(cè)驗(yàn)的作用,同時(shí)也要努力提高自編測(cè)驗(yàn)的編制質(zhì)量心理測(cè)量學(xué)第二節(jié)測(cè)驗(yàn)的類型與功能

四、計(jì)算機(jī)化測(cè)驗(yàn)與非計(jì)算機(jī)化測(cè)驗(yàn)(一)計(jì)算機(jī)化測(cè)驗(yàn)的發(fā)展計(jì)算機(jī)化測(cè)驗(yàn):被試在計(jì)算機(jī)前根據(jù)指令進(jìn)行作答計(jì)算機(jī)化測(cè)驗(yàn)特點(diǎn):實(shí)施方便、反饋及時(shí),測(cè)驗(yàn)效率高。非計(jì)算機(jī)化測(cè)驗(yàn)--傳統(tǒng)的紙筆測(cè)驗(yàn),還有用武之地。心理測(cè)量學(xué)(二)幾種常見的計(jì)算機(jī)化測(cè)驗(yàn)基于計(jì)算機(jī)的測(cè)驗(yàn)(Computer-BasedTest,CBT)。由計(jì)算機(jī)出題,要求被試在計(jì)算機(jī)前操作作答。各種基于計(jì)算機(jī)的測(cè)驗(yàn)對(duì)計(jì)算機(jī)的利用程度會(huì)有很大不同。除了計(jì)算機(jī)的形式,基于計(jì)算機(jī)的測(cè)驗(yàn)的方法、理念與傳統(tǒng)紙筆測(cè)驗(yàn)無本質(zhì)不同。心理測(cè)量學(xué)(二)幾種常見的計(jì)算機(jī)化測(cè)驗(yàn)計(jì)算機(jī)化自適應(yīng)測(cè)驗(yàn)(ComputerizedAdaptTest,CAT)。一種新的測(cè)驗(yàn)理念:改變傳統(tǒng)測(cè)驗(yàn)千人一面形式針對(duì)被試的水平即時(shí)調(diào)題、即時(shí)施測(cè)、即時(shí)反饋、即時(shí)估算。同時(shí)提高測(cè)驗(yàn)的效率和準(zhǔn)確率。實(shí)現(xiàn)條件:新的測(cè)驗(yàn)理論指導(dǎo)、使用計(jì)算機(jī)。優(yōu)點(diǎn)明顯,但技術(shù)上也還需進(jìn)一步完善心理測(cè)量學(xué)(二)幾種常見的計(jì)算機(jī)化測(cè)驗(yàn)基于網(wǎng)絡(luò)的測(cè)驗(yàn)(Internet-bestTest,IBT)基于計(jì)算機(jī)的測(cè)驗(yàn)或計(jì)算機(jī)化自適應(yīng)測(cè)驗(yàn)采用網(wǎng)絡(luò)的形式實(shí)施遠(yuǎn)程測(cè)試,則稱其為基于網(wǎng)絡(luò)的測(cè)驗(yàn)?;诰W(wǎng)絡(luò)的測(cè)驗(yàn)是當(dāng)前計(jì)算機(jī)化測(cè)驗(yàn)發(fā)展的最高形式。心理測(cè)量學(xué)五、其它分類

(一)最佳行為測(cè)驗(yàn)和典型行為測(cè)驗(yàn)最佳行為測(cè)驗(yàn):作答時(shí)必須盡能力找到最佳答案。典型行為測(cè)驗(yàn):作答時(shí)要根據(jù)自己平時(shí)怎么想、怎么做如實(shí)作答。能力測(cè)驗(yàn)是最佳行為測(cè)驗(yàn),自陳式人格測(cè)驗(yàn)是典型行為測(cè)驗(yàn)。典型行為測(cè)驗(yàn)的誤差控制更為困難心理測(cè)量學(xué)五、其它分類

(二)個(gè)別測(cè)驗(yàn)與團(tuán)體測(cè)驗(yàn)個(gè)別測(cè)驗(yàn)應(yīng)用:面向特殊被試或在測(cè)試中主被試間需不斷交流的測(cè)驗(yàn)。個(gè)別測(cè)驗(yàn)特點(diǎn):耗時(shí)費(fèi)力,一般能用團(tuán)體測(cè)驗(yàn)就不用個(gè)別測(cè)驗(yàn)。教育測(cè)驗(yàn)大多采用團(tuán)體測(cè)驗(yàn),但也有例外。心理測(cè)驗(yàn)采用個(gè)別測(cè)驗(yàn)的要多一些。心理測(cè)量學(xué)五、其它分類

(三)難度測(cè)驗(yàn)與速度測(cè)驗(yàn)(四)文字測(cè)驗(yàn)與非文字測(cè)驗(yàn)(五)主觀題測(cè)驗(yàn)與客觀題測(cè)驗(yàn)(六)預(yù)測(cè)測(cè)驗(yàn)(七)行為情境判斷測(cè)驗(yàn)(八)內(nèi)隱聯(lián)想測(cè)驗(yàn)心理測(cè)量學(xué)第二節(jié)測(cè)驗(yàn)的類型與功能

測(cè)驗(yàn)類型豐富:反應(yīng)社會(huì)需求的復(fù)雜性和旺盛性。測(cè)量學(xué)者的任務(wù):開發(fā)出更多更好的測(cè)驗(yàn)來滿足社會(huì)的各種需求。心理測(cè)量學(xué)第一章心理測(cè)量概論測(cè)驗(yàn)的編制與實(shí)施

第三節(jié)心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制明確用于:招聘、晉職升級(jí)決策?診斷、評(píng)價(jià)?了解品質(zhì)還是做合格決策?

明確:測(cè)能力、人格?能力屬哪個(gè)層次?人格哪個(gè)側(cè)面?探明品質(zhì)結(jié)構(gòu)明確:測(cè)驗(yàn)對(duì)象的社會(huì)身份、身心特點(diǎn)、分布的范圍與數(shù)量。

測(cè)驗(yàn)的對(duì)象是誰(shuí)?

測(cè)何種心理品質(zhì)?

測(cè)驗(yàn)結(jié)果作何用?

(一)確定測(cè)驗(yàn)?zāi)康?-回答三個(gè)問題心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(二)設(shè)計(jì)測(cè)驗(yàn)編制方案、制定測(cè)驗(yàn)編制計(jì)劃目標(biāo):設(shè)計(jì)一個(gè)科學(xué)、詳細(xì)、可行的測(cè)驗(yàn)編制方案科學(xué):方案從目標(biāo)到內(nèi)容、到方法都要符合心理學(xué)和心理測(cè)量學(xué)原理可行:其一是科學(xué)意義上的可行、其二是主客觀條件意義上的可行心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(二)設(shè)計(jì)測(cè)驗(yàn)編制方案、制定測(cè)驗(yàn)編制計(jì)劃(續(xù))

測(cè)驗(yàn)編制方案的內(nèi)容:測(cè)驗(yàn)的方法測(cè)驗(yàn)的類型題型及其分布題量及其分布分?jǐn)?shù)系統(tǒng)量評(píng)價(jià)法測(cè)驗(yàn)質(zhì)量總體目標(biāo)編制流程設(shè)計(jì)和要求心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(三)題目編寫測(cè)驗(yàn)題目:基本元素,主體材料。題目類型:客觀題、主觀題題型性質(zhì)和功能:各有不同,有互補(bǔ)傾向。編寫要求:發(fā)揮題型功能,測(cè)出欲測(cè)心理品質(zhì)心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(三)題目編寫(續(xù))題干編寫:內(nèi)容科學(xué)、語(yǔ)言精練。作答要求編寫:語(yǔ)言準(zhǔn)確無歧義、信號(hào)強(qiáng)烈醒目??陀^題:正確項(xiàng)唯一正確,迷惑項(xiàng)有適度迷惑力。主觀題:保證答案科學(xué)性、評(píng)分標(biāo)準(zhǔn)的客觀性。題量分布:題型分布、品質(zhì)或內(nèi)容分布、題目難度分布。

心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(四)測(cè)試分析測(cè)試分析目的:評(píng)估和篩選試題評(píng)估篩選指標(biāo):定性指標(biāo)、定量指標(biāo)。分析決策:留用、修改留用、修改再測(cè)、淘汰心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(四)測(cè)試分析(續(xù))定性指標(biāo):題目的科學(xué)性、所測(cè)心理品質(zhì)的相符性、答案的正確性、表述的準(zhǔn)確性等等。定量指標(biāo):題目定性質(zhì)量?jī)?yōu)劣的量化指標(biāo)有各自的定義和計(jì)算方法,有各自的質(zhì)量?jī)?yōu)劣標(biāo)準(zhǔn)心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(四)測(cè)試分析(續(xù))測(cè)試對(duì)象:代表性的樣本,有足夠容量,與正式測(cè)試相同的動(dòng)機(jī)水平,在似真環(huán)境中進(jìn)行。心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(五)組卷組卷要求:1、保證入選試題高質(zhì)量2、嚴(yán)格按照設(shè)計(jì)好的各種題量分布選調(diào)試題。3、試題順序:題型順序、難度順序、心理品質(zhì)層次順序。目的:有效控制測(cè)驗(yàn)的系統(tǒng)誤差。心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(六)信、效度調(diào)查試卷整體質(zhì)量調(diào)查:信度和效度。信度:只需測(cè)驗(yàn)自身數(shù)據(jù)效度:還需要測(cè)驗(yàn)外部的一些相關(guān)憑證調(diào)查目標(biāo):信效度證據(jù)足夠且都達(dá)到一定標(biāo)準(zhǔn)。

心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(七)編制測(cè)驗(yàn)分?jǐn)?shù)系統(tǒng)原始分?jǐn)?shù):以測(cè)驗(yàn)內(nèi)容為參照背景,不方便比較分?jǐn)?shù)轉(zhuǎn)換:1、獲取以被試群體為參照背景的分?jǐn)?shù)。2、獲取以某種客觀標(biāo)準(zhǔn)為參照背景的分?jǐn)?shù)。報(bào)告分?jǐn)?shù):方便比較、方便理解和解釋。心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(八)編寫測(cè)驗(yàn)使用手冊(cè):指導(dǎo)正確使用手冊(cè)內(nèi)容(10項(xiàng)):1、測(cè)驗(yàn)?zāi)康呐c性質(zhì)說明;2、適用對(duì)象說明;3、測(cè)驗(yàn)內(nèi)容結(jié)構(gòu)、題型結(jié)構(gòu)介紹;心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(八)編寫測(cè)驗(yàn)使用手冊(cè):指導(dǎo)正確使用手冊(cè)內(nèi)容(續(xù)):4、測(cè)驗(yàn)編制方法介紹;5、測(cè)驗(yàn)施測(cè)方法說明;6、評(píng)分方法與標(biāo)準(zhǔn)說明;7、測(cè)試對(duì)象范圍、數(shù)量、來源、抽樣方法說明;心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(八)編寫測(cè)驗(yàn)使用手冊(cè):指導(dǎo)正確使用手冊(cè)內(nèi)容(續(xù)):8、測(cè)驗(yàn)信、效度報(bào)告;9、分?jǐn)?shù)系統(tǒng)編制方法及分?jǐn)?shù)解釋方法介紹;10、測(cè)驗(yàn)使用人員資質(zhì)要求說明。心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(九)編制測(cè)驗(yàn)備份測(cè)驗(yàn)備份:正式測(cè)驗(yàn)的平行復(fù)份。平行復(fù)份不同處:表面文字內(nèi)容相同處:所測(cè)心理品質(zhì)內(nèi)容結(jié)構(gòu)難度結(jié)構(gòu)題型結(jié)構(gòu)信度效度心理測(cè)量學(xué)一、測(cè)驗(yàn)的編制(九)編制測(cè)驗(yàn)備份(續(xù))測(cè)驗(yàn)備份目的:應(yīng)付突發(fā)事件特殊研究需要取得更可靠結(jié)果測(cè)驗(yàn)備份的編制:

與正式測(cè)驗(yàn)有完全相同的過程和標(biāo)準(zhǔn)。心理測(cè)量學(xué)二、測(cè)驗(yàn)的實(shí)施(一)選擇測(cè)驗(yàn)測(cè)驗(yàn)內(nèi)容和報(bào)告分?jǐn)?shù)形式是否符合測(cè)驗(yàn)?zāi)康模繙y(cè)驗(yàn)形式和方法是否適合被試心身特點(diǎn)?測(cè)驗(yàn)的信度和效度是否達(dá)到標(biāo)準(zhǔn)?有無所需特殊資質(zhì)技術(shù)人員?心理測(cè)量學(xué)二、測(cè)驗(yàn)的實(shí)施(二)實(shí)際施測(cè)施測(cè)相對(duì)簡(jiǎn)單:教育測(cè)驗(yàn)、團(tuán)體測(cè)驗(yàn)、紙筆測(cè)驗(yàn)施測(cè)較為復(fù)雜:心理測(cè)驗(yàn)、個(gè)別測(cè)驗(yàn)、操作測(cè)驗(yàn)規(guī)范目的:控制各種可能誤差,提高測(cè)驗(yàn)信效度。心理測(cè)量學(xué)二、測(cè)驗(yàn)的實(shí)施(二)實(shí)際施測(cè)(續(xù))施測(cè)要求:由具備相應(yīng)資質(zhì)的技術(shù)人員實(shí)施按照測(cè)驗(yàn)指導(dǎo)書的要求按步驟實(shí)施規(guī)范:測(cè)驗(yàn)環(huán)境布置指導(dǎo)語(yǔ)宣講測(cè)驗(yàn)材料發(fā)放測(cè)驗(yàn)進(jìn)程控制心理測(cè)量學(xué)二、測(cè)驗(yàn)的實(shí)施(三)評(píng)分評(píng)分要求:按照測(cè)驗(yàn)指導(dǎo)書規(guī)定的方法和標(biāo)準(zhǔn)進(jìn)行客觀題交由計(jì)算機(jī)評(píng)分,主觀題主要采用人工評(píng)閱心理測(cè)驗(yàn):具備相應(yīng)資質(zhì)的技術(shù)人員評(píng)閱大規(guī)模教育測(cè)驗(yàn):篩選閱卷員嚴(yán)格培訓(xùn)統(tǒng)一評(píng)分標(biāo)準(zhǔn)閱卷質(zhì)量監(jiān)控網(wǎng)上閱卷系統(tǒng)電子閱卷員系統(tǒng)心理測(cè)量學(xué)二、測(cè)驗(yàn)的實(shí)施(四)測(cè)驗(yàn)結(jié)果解釋注意常模參照測(cè)驗(yàn)與標(biāo)準(zhǔn)參照測(cè)驗(yàn)報(bào)告的不同。解釋要有辯證思維,不要絕對(duì)化,更不要標(biāo)簽化。善于在個(gè)體內(nèi)部作比較,強(qiáng)調(diào)優(yōu)勢(shì)品質(zhì),鼓勵(lì)改善劣勢(shì)品質(zhì)。以發(fā)展的眼光解釋測(cè)驗(yàn)結(jié)果,防止負(fù)面影響。心理測(cè)量學(xué)第三節(jié)測(cè)驗(yàn)的編制與實(shí)施

三、測(cè)驗(yàn)編制與實(shí)施中的法律與道德問題(一)為維護(hù)社會(huì)公平而努力保證測(cè)驗(yàn)質(zhì)量因?yàn)闇y(cè)量嚴(yán)重不準(zhǔn)導(dǎo)致決策不公,是測(cè)量工作者的法律與道德責(zé)任。心理測(cè)量學(xué)三、編制與實(shí)施中的法律與道德問題為了保證測(cè)驗(yàn)質(zhì)量,要防止:因粗制濫造而導(dǎo)致測(cè)驗(yàn)結(jié)果嚴(yán)重不準(zhǔn);題目?jī)?nèi)容有文化、職業(yè)或宗教偏見;某些群體數(shù)據(jù)失實(shí)、或缺失,導(dǎo)致常模失準(zhǔn)。心理測(cè)量學(xué)三、編制與實(shí)施中的法律與道德問題為了保證測(cè)驗(yàn)質(zhì)量,要防止(續(xù)):因不精心或別有用心而選用粗制濫造的測(cè)驗(yàn);因不精心或別有用心而導(dǎo)致測(cè)試過程失控。無相應(yīng)資質(zhì)人員主持測(cè)驗(yàn)。心理測(cè)量學(xué)三、編制與實(shí)施中的法律與道德問題(二)為保護(hù)個(gè)人權(quán)益而尊重測(cè)驗(yàn)對(duì)象的選擇要征求被試是否愿意參加測(cè)驗(yàn),沒有權(quán)利強(qiáng)迫個(gè)體參加測(cè)驗(yàn)。要尊重被試的作答選擇,不能干涉被試的作答。使用被試信息和怎么使用被試信息都要有被試的授權(quán)。心理測(cè)量學(xué)三、編制與實(shí)施中的法律與道德問題(三)為保證測(cè)驗(yàn)的安全而嚴(yán)守測(cè)驗(yàn)的秘密測(cè)驗(yàn)泄密后果嚴(yán)重:能力測(cè)驗(yàn)泄密,造成虛高能力評(píng)價(jià)。人格測(cè)驗(yàn)泄密,造成虛假的人格評(píng)價(jià)。高競(jìng)爭(zhēng)性測(cè)驗(yàn)泄密,造成社會(huì)不公。心理測(cè)量學(xué)三、編制與實(shí)施中的法律與道德問題(三)嚴(yán)守測(cè)驗(yàn)的秘密(續(xù))重要測(cè)驗(yàn)為國(guó)家機(jī)密,受法律保護(hù)。為了尊重著作權(quán),維護(hù)社會(huì)公正,遵守職業(yè)道德有義務(wù)保證測(cè)驗(yàn)的安全、嚴(yán)守測(cè)驗(yàn)的秘密,不向他人傳送任何測(cè)驗(yàn)信息。心理測(cè)量學(xué)三、編制與實(shí)施中的法律與道德問題1心理測(cè)驗(yàn)管理?xiàng)l例中國(guó)心理學(xué)會(huì)有關(guān)測(cè)驗(yàn)的兩個(gè)重要文件:2心理測(cè)驗(yàn)工作者的道德準(zhǔn)則心理測(cè)量學(xué)第一章心理測(cè)量概論心理測(cè)量發(fā)展簡(jiǎn)史

第四節(jié)心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史一、中國(guó)古代的心理測(cè)量思想(一)個(gè)體差異及其可測(cè)性思想(二)人才的內(nèi)涵及其測(cè)量方法(三)心理與教育測(cè)量的實(shí)踐活動(dòng)心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史(一)個(gè)體差異及其可測(cè)性思想孔子:“性相近,習(xí)相遠(yuǎn)?!?;孟子:“權(quán),然后知輕重;度,然后知長(zhǎng)短。物皆然,心為甚。”心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史(二)人才的內(nèi)涵及其測(cè)量方法三國(guó)時(shí)的魏人劉劭:“夫圣賢之所美,莫美乎聰明。聰明之所貴,莫貴乎知人。知人誠(chéng)智,則眾材得其序,而庶績(jī)之業(yè)興矣?!彼讶说男袨楸憩F(xiàn)概括為9種,稱為“九征”。提出“八觀”和“五視”的觀察方法識(shí)別人才。心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史(三)心理測(cè)量的實(shí)踐活動(dòng)孔子:將人的智力分成三個(gè)等級(jí),即中上之人、中人和中下之人;不得中行而與之,必也狂狷乎?狂者進(jìn)取,狷者有所不為也。董仲舒:“一手畫方,一手畫圓,莫能成?!眲③浚骸度宋镏尽肺髦埽骸皣?guó)學(xué)”心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史古代中國(guó)心理測(cè)量的特點(diǎn):1.描述性的,定性的,而非定量的;2.分類式的;3.注重對(duì)人作整體的鑒定和評(píng)價(jià),并傾向于和人的道德品質(zhì)聯(lián)系起來;4.具有強(qiáng)烈的應(yīng)用性質(zhì)。心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史二、現(xiàn)代心理測(cè)量在西方國(guó)家的產(chǎn)生與發(fā)展(一)心理測(cè)量的產(chǎn)生是社會(huì)的需要(二)心理測(cè)量的早期探索者(三)心理測(cè)量的發(fā)展(四)心理測(cè)量發(fā)展的當(dāng)代趨勢(shì)心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史(一)心理測(cè)量的產(chǎn)生是社會(huì)的需要工業(yè)革命成功后,對(duì)勞動(dòng)力的需求急劇增加;19世紀(jì),科學(xué)的發(fā)展和歐洲人道主義思想的廣泛傳播。心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史(二)心理測(cè)量的早期探索者1.德國(guó):馮特(W.Wundt)2.英國(guó):高爾頓(F.Galton)3.美國(guó):卡特爾(JamesM.Cattell)4.法國(guó):比納(A.Binet)和西蒙(T.Simon)心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史(三)心理測(cè)量的發(fā)展斯坦福大學(xué)推孟(L.M.Terman)教授1916年修訂斯坦福-比納量表;桑代克(E.L.Thorndike)編制了第一個(gè)標(biāo)準(zhǔn)化的教育成就測(cè)驗(yàn);人格測(cè)驗(yàn)的先驅(qū)克雷佩林(E.Kraepelin),他最早用自由聯(lián)想測(cè)驗(yàn)來診斷精神病患者。心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史(四)心理測(cè)量發(fā)展的當(dāng)代趨勢(shì)1.實(shí)驗(yàn)法和測(cè)驗(yàn)法相結(jié)合,產(chǎn)生了信息加工測(cè)驗(yàn);2.計(jì)算機(jī)測(cè)試代替紙筆測(cè)試;3.項(xiàng)目反應(yīng)理論和概化理論等現(xiàn)代測(cè)量理論的產(chǎn)生;4.新一代測(cè)驗(yàn)理論心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史三、現(xiàn)代心理測(cè)量在中國(guó)的發(fā)展(一)二十世紀(jì)前半葉的初步繁榮(二)二十世紀(jì)后半葉的再度繁榮與發(fā)展心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史(一)二十世紀(jì)前半葉的初步繁榮對(duì)西方心理測(cè)驗(yàn)量表的介紹和翻譯,以及修訂和編制了多種智力測(cè)驗(yàn)、人格測(cè)驗(yàn)及教育測(cè)驗(yàn);出版的有關(guān)心理測(cè)量方面的著作達(dá)到了20多種。心理測(cè)量學(xué)第四節(jié)心理測(cè)量發(fā)展簡(jiǎn)史(二)二十世紀(jì)后半葉的再度繁榮與發(fā)展1.理論方面的發(fā)展經(jīng)典測(cè)量理論、項(xiàng)目反應(yīng)理論、概化理論、新一代測(cè)驗(yàn)理論2.心理測(cè)量的實(shí)踐作用測(cè)驗(yàn)編制、教育及社會(huì)考試、人才選拔和人事測(cè)評(píng)心理測(cè)量學(xué)本章小結(jié)

心理測(cè)量學(xué)研究?jī)?nèi)容:如何編制測(cè)驗(yàn),如何實(shí)施測(cè)驗(yàn),如何控制測(cè)量誤差,提高測(cè)驗(yàn)質(zhì)量。心理測(cè)量學(xué)本章小結(jié)心理測(cè)量主要性質(zhì):心理測(cè)量是間接測(cè)量。測(cè)量有兩個(gè)要素,心理與教育測(cè)量的參照點(diǎn)是相對(duì)的,測(cè)量單位很難恒定。任何測(cè)量都有誤差,測(cè)量的誤差包括隨機(jī)誤差和系統(tǒng)誤差兩種。心理測(cè)驗(yàn)依據(jù)不同指標(biāo)可做許多不同分類。

心理測(cè)量學(xué)本章小結(jié)測(cè)量學(xué)工作者的社會(huì)責(zé)任:測(cè)量學(xué)者關(guān)注測(cè)驗(yàn)編制與實(shí)施中的法律與道德問題。測(cè)量學(xué)者還從測(cè)量及測(cè)量學(xué)發(fā)展史中汲取經(jīng)驗(yàn)和教訓(xùn),升華品質(zhì)與修養(yǎng)。心理測(cè)量學(xué)本章小結(jié)測(cè)量學(xué)工作者的社會(huì)責(zé)任:測(cè)量學(xué)者關(guān)注測(cè)驗(yàn)編制與實(shí)施中的法律與道德問題。測(cè)量學(xué)者還從測(cè)量及測(cè)量學(xué)發(fā)展史中汲取經(jīng)驗(yàn)和教訓(xùn),升華品質(zhì)與修養(yǎng)。心理測(cè)量學(xué)本章小結(jié)測(cè)量學(xué)發(fā)展的啟示:我國(guó)測(cè)量活動(dòng)歷史悠久現(xiàn)代測(cè)量學(xué)發(fā)端于西方心理測(cè)量學(xué)者還從測(cè)量以及測(cè)量學(xué)的發(fā)展歷史中汲取經(jīng)驗(yàn)和教訓(xùn),升華品質(zhì)與修養(yǎng)。心理測(cè)量學(xué)第一章心理測(cè)量概論討論題:1、為什么說人的心理是可測(cè)的,心理可測(cè)的意義何在?2、分析心理測(cè)量誤差的類型與來源,試說控制方法。3、你從心理測(cè)量發(fā)展歷史的介紹中感悟到了什么?心理測(cè)量學(xué)第一章心理測(cè)量概論本章參考文獻(xiàn)[1]安妮?安娜斯塔西,蘇珊娜?厄比納著,廖小春,竺培梁譯.心理測(cè)驗(yàn)[M].杭州:浙江教育出版社,2001.[2]金瑜.心理測(cè)量[M].上海:華東師范大學(xué)出版社,2001.[3]戴海崎,張鋒,陳雪楓.心理與教育測(cè)量[M].廣州:暨南大學(xué)出版社,2003.[4]鄭日昌,蔡永紅,周益群.心理測(cè)量學(xué)[M].北京:人民教育出版社,1999.第一節(jié)信度概述

一、信度與測(cè)量誤差1.經(jīng)典測(cè)量理論的假設(shè)式中,X為觀察分?jǐn)?shù),T為一般真分?jǐn)?shù),E為隨機(jī)誤差分?jǐn)?shù),V為目標(biāo)真分?jǐn)?shù),I為非目標(biāo)真分?jǐn)?shù)(系統(tǒng)誤差)。

第一節(jié)信度的概述一、信度與測(cè)量誤差2.信度的定義測(cè)量追求的初步目標(biāo):T占X的比例越大越好。測(cè)量追求的終極目標(biāo):V占X的比例越大越好。第一節(jié)信度的概述當(dāng)T占X的比例很大時(shí),那么測(cè)值就會(huì)是穩(wěn)定的。一般來說,穩(wěn)定的測(cè)值是可靠的、可信的,因此,信度可被認(rèn)為是測(cè)量結(jié)果的穩(wěn)定性程度。一、信度與測(cè)量誤差2.信度的定義第一節(jié)信度的概述信度(reliability)是指在不同時(shí)間,使用同一測(cè)驗(yàn),或者使用兩個(gè)不同項(xiàng)目的等值測(cè)驗(yàn),抑或在其他不同的測(cè)試條件下,對(duì)同一組被試實(shí)施兩次或多次測(cè)試所得分?jǐn)?shù)的一致性。測(cè)驗(yàn)信度表示測(cè)驗(yàn)分?jǐn)?shù)中個(gè)體差異可歸因于所測(cè)特質(zhì)中“真實(shí)”差異的程度,以及可歸因于隨機(jī)誤差的程度。二、信度的統(tǒng)計(jì)定義1.經(jīng)典測(cè)量理論假設(shè)的推論第一節(jié)信度的概述二、信度的統(tǒng)計(jì)定義2.信度的統(tǒng)計(jì)定義定義1:信度是被試團(tuán)體真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)方差之比定義2:信度是被試團(tuán)體真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)相關(guān)系數(shù)的平方定義3:信度是一個(gè)測(cè)驗(yàn)X(A卷)與它的任意一個(gè)平行測(cè)驗(yàn)(B卷)的相關(guān)系數(shù)第一節(jié)信度的概述三、描述信度的指標(biāo)1.經(jīng)典測(cè)量理論的信度系數(shù)信度系數(shù)是表示測(cè)量結(jié)果的穩(wěn)定性程度的指標(biāo)。記為:第一節(jié)信度的概述信度系數(shù)的值域:[0,1]沒有百分之百可靠的測(cè)量,因此,rXX=1只是理論上的值,實(shí)際當(dāng)中是不會(huì)存在的。?相關(guān)系數(shù)的值域是[-1,+1],信度系數(shù)的值域:[0,1],為什么?三、描述信度的指標(biāo)1.經(jīng)典測(cè)量理論的信度系數(shù)(1)重測(cè)信度(test-retestcoefficients),是指用同一個(gè)量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的一致性程度,其大小等于同一組被試在兩次測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。(2)復(fù)本信度(alternative--formcoefficients),是指兩個(gè)平行的測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致性程度,其大小等于同一批被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。(3)內(nèi)部一致性系數(shù)(internalconsistencycoefficients)也叫同質(zhì)性信度(homogeneityreliability),是指測(cè)驗(yàn)內(nèi)部所有題目間的一致性程度,主要的計(jì)算方法有KR20公式、KR21公式、克龍巴赫α系數(shù),以及荷伊特信度等。第一節(jié)信度的概述三、描述信度的指標(biāo)2.經(jīng)典測(cè)量理論的測(cè)量標(biāo)準(zhǔn)誤測(cè)量標(biāo)準(zhǔn)誤差(standarderrorofmeasurement)是測(cè)量誤差的假設(shè)分布的標(biāo)準(zhǔn)差。用下列公式能夠容易地計(jì)算測(cè)量標(biāo)準(zhǔn)誤差:第一節(jié)信度的概述式中,SDt表示測(cè)驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn)差,rXX表示信度系數(shù)。3.概化理論的概化系數(shù)(generaliabilitycoefficients)4.IRT的測(cè)驗(yàn)信息函數(shù)(testinformationfunction)四、分析測(cè)驗(yàn)信度應(yīng)注意的問題1.針對(duì)測(cè)驗(yàn)類型選用恰當(dāng)指標(biāo)(1)傳統(tǒng)的信度概念適合于常模參照測(cè)驗(yàn),這種測(cè)驗(yàn)的主要目的是為了區(qū)分個(gè)體在特定特征上所表現(xiàn)出的差異性。個(gè)體在測(cè)驗(yàn)分?jǐn)?shù)中表現(xiàn)出的差異范圍越大,該測(cè)驗(yàn)的信度也就越高。第一節(jié)信度的概述四、分析測(cè)驗(yàn)信度應(yīng)注意的問題1.針對(duì)測(cè)驗(yàn)類型選用恰當(dāng)指標(biāo)(2)標(biāo)準(zhǔn)參照測(cè)驗(yàn)(內(nèi)容參照或領(lǐng)域參照測(cè)驗(yàn))的目標(biāo)是要確定被試是否達(dá)到或未達(dá)到某個(gè)標(biāo)準(zhǔn),從而將個(gè)體分到不同的組別:“達(dá)標(biāo)”和“未達(dá)標(biāo)”。這種情況下,傳統(tǒng)的重測(cè)信度、復(fù)本信度以及內(nèi)部一致性系數(shù)就不再適用。標(biāo)準(zhǔn)參照測(cè)驗(yàn)可根據(jù)具體情況分別采用如下指標(biāo):適用于簡(jiǎn)單的掌握與否的兩分決策,即所有的分類誤差都被認(rèn)為同樣嚴(yán)重而不管它們離開臨界分?jǐn)?shù)的距離。在這種情況下,可以使用平行型式進(jìn)行再測(cè),以便得出在兩次測(cè)驗(yàn)上得到相同決策的個(gè)體的百分比,進(jìn)一步可算得分類一致性系數(shù)(coefficientofagreement)。

第一節(jié)信度的概述四、分析測(cè)驗(yàn)信度應(yīng)注意的問題1.針對(duì)測(cè)驗(yàn)類型選用恰當(dāng)指標(biāo)不僅僅關(guān)心對(duì)掌握者和未掌握者的質(zhì)的區(qū)分,同時(shí)也在分?jǐn)?shù)連續(xù)體上描述了關(guān)于掌握和未掌握的量的差異。這類信度主要采用K2(X,T)指標(biāo):

第一節(jié)信度的概述式中,、分別為被試總體在測(cè)驗(yàn)上的真分?jǐn)?shù)方差和觀測(cè)分?jǐn)?shù)方差;、分別為真分?jǐn)?shù)和觀測(cè)分?jǐn)?shù)的平均值;ng為測(cè)驗(yàn)題目數(shù),c是以做對(duì)題目百分比表示的區(qū)分標(biāo)準(zhǔn)。四、分析測(cè)驗(yàn)信度應(yīng)注意的問題1.針對(duì)測(cè)驗(yàn)類型選用恰當(dāng)指標(biāo)K2(X,T)值越大,說明觀測(cè)分與區(qū)分標(biāo)準(zhǔn)分?jǐn)?shù)(劃界分?jǐn)?shù))之間的差異代表真分?jǐn)?shù)的對(duì)應(yīng)差異量的可能性越大,因而觀測(cè)分與劃界分?jǐn)?shù)的差異就越能反映真實(shí)能力上的差異。換言之,測(cè)驗(yàn)就更可信。就單個(gè)測(cè)驗(yàn)的結(jié)果而言,K2(X,T)的計(jì)算公式如下:第一節(jié)信度的概述式中,是由庫(kù)德-理查德KR20公式求出的信度系數(shù),其余符號(hào)意義同前。四、分析測(cè)驗(yàn)信度應(yīng)注意的問題1.針對(duì)測(cè)驗(yàn)類型選用恰當(dāng)指標(biāo)(3)在純速度測(cè)驗(yàn)(speedtest)中,個(gè)體差異完全取決于速度,此時(shí),就無法恰當(dāng)?shù)亟忉屖y(cè)一次測(cè)驗(yàn)的信度系數(shù)。如果條件許可,可采用重測(cè)法或是復(fù)本法,這是比較合適的。分半法也可以使用,但是此時(shí)的分半是按時(shí)間分半,而不是按照項(xiàng)目來分半。也就是,兩半分?jǐn)?shù)必須根據(jù)分別規(guī)定時(shí)間的兩個(gè)半測(cè)驗(yàn)。例如,可以把奇偶項(xiàng)目分別印制在兩張卷上,每組項(xiàng)目的用時(shí)為全測(cè)驗(yàn)的一半。這種方法等于在同一時(shí)間實(shí)施了兩個(gè)等值測(cè)驗(yàn)。

第一節(jié)信度的概述四、分析測(cè)驗(yàn)信度應(yīng)注意的問題1.針對(duì)測(cè)驗(yàn)類型選用恰當(dāng)指標(biāo)還有一種替代實(shí)施兩個(gè)半測(cè)驗(yàn)的方法,就是把總時(shí)間四等分,算出每段時(shí)間的分?jǐn)?shù)。這種方法簡(jiǎn)便易行,施測(cè)時(shí)每當(dāng)主試發(fā)出事先安排的信號(hào),就要測(cè)驗(yàn)參加進(jìn)在他們正在做的項(xiàng)目上打個(gè)記號(hào)。然后,把第一段和第四段時(shí)間內(nèi)答對(duì)的項(xiàng)目數(shù)相加,得出一個(gè)半測(cè)驗(yàn)分?jǐn)?shù);把第二段和第三段時(shí)間內(nèi)答對(duì)的項(xiàng)目數(shù)相加,得出另一個(gè)半測(cè)驗(yàn)分?jǐn)?shù)。四段時(shí)間如此相加,往往可以平衡練習(xí)、疲勞和其他因素的累積效應(yīng)。特別是當(dāng)項(xiàng)目難度水平前后一致,而不是逐漸增加時(shí),這種方法尤其令人滿意。第一節(jié)信度的概述四、分析測(cè)驗(yàn)信度應(yīng)注意的問題2.信度的報(bào)告(1)任何一個(gè)信度系數(shù)是針對(duì)引起測(cè)驗(yàn)誤差的特定因素而言的。有多少種影響測(cè)驗(yàn)分?jǐn)?shù)的條件,就有多少種測(cè)驗(yàn)信度,因此,報(bào)告信度時(shí),應(yīng)該詳細(xì)說明測(cè)試樣本的特性和所報(bào)告的信度類型。在信度報(bào)告時(shí)只是報(bào)告信度系數(shù),而缺乏說明估算系數(shù)的方法細(xì)節(jié),推導(dǎo)系數(shù)時(shí)所用的被試群體的特征,以及獲取數(shù)據(jù)當(dāng)時(shí)的施測(cè)條件,等等,這種信度報(bào)告是不合格的。

第一節(jié)信度的概述四、分析測(cè)驗(yàn)信度應(yīng)注意的問題2.信度的報(bào)告(2)沒有一個(gè)單一的、最優(yōu)的方法來量化信度,沒有一個(gè)單獨(dú)的指數(shù)能恰當(dāng)?shù)乇磉_(dá)所有的相關(guān)事實(shí),沒有一個(gè)單獨(dú)的研究方法在所有的情形下都是最佳選擇,且測(cè)驗(yàn)編制者也不應(yīng)局限于將某一種方法運(yùn)用到任何一種測(cè)量手段上去。所以,測(cè)驗(yàn)編制者在報(bào)告測(cè)驗(yàn)信度時(shí),可以從多方面予以報(bào)告。

第一節(jié)信度的概述四、分析測(cè)驗(yàn)信度應(yīng)注意的問題2.信度的報(bào)告(3)提供詳細(xì)的信度分析報(bào)告,讓了解相關(guān)知識(shí)的人能夠?qū)Y(jié)果進(jìn)行評(píng)定,并能夠重復(fù)信度分析的過程。

例如,簡(jiǎn)單說一句“某測(cè)驗(yàn)的信度是0.92”是不能接受的。較恰當(dāng)?shù)恼f法是“某測(cè)驗(yàn)的信度系數(shù)為0.92,該數(shù)值是通過計(jì)算一份能力測(cè)驗(yàn)間隔兩周兩次測(cè)試成績(jī)的相關(guān)系數(shù)得出的。數(shù)據(jù)來源是從某市隨機(jī)抽取的500名小學(xué)5年級(jí)的學(xué)生施測(cè)……”。第一節(jié)信度的概述五、信度的標(biāo)準(zhǔn)與作用1.信度是評(píng)價(jià)測(cè)驗(yàn)質(zhì)量的重要指標(biāo)之一。測(cè)驗(yàn)類型

信度系數(shù)

低中高學(xué)業(yè)成就測(cè)驗(yàn)0.660.920.98學(xué)術(shù)能力測(cè)驗(yàn)0.560.900.97特殊能力傾向測(cè)驗(yàn)0.260.880.96人格測(cè)驗(yàn)0.460.850.97興趣測(cè)驗(yàn)0.420.840.93態(tài)度測(cè)驗(yàn)0.470.790.98注:表中數(shù)據(jù)來源,LewisR.Aiken:Psychologicaltestingandassessment(eighthedition),AllynandBacon,Inc,1994.第一節(jié)信度的概述五、信度的標(biāo)準(zhǔn)與作用2.信度是測(cè)量過程中所存在的隨機(jī)誤差大小的反映。第一節(jié)信度的概述例如,我們已知高考文科試卷的總信度rXX

=0.965,文科考生總分的標(biāo)準(zhǔn)差為53.42,那么,文科考試成績(jī)的標(biāo)準(zhǔn)誤為:3.信度可以用來解釋個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的意義——測(cè)量標(biāo)準(zhǔn)誤。如果某生的考試成績(jī)?yōu)?95分,在置信度為0.95時(shí),其真分?jǐn)?shù)的置信區(qū)間為:五、信度的標(biāo)準(zhǔn)與作用4.信度可以幫助進(jìn)行不同測(cè)驗(yàn)分?jǐn)?shù)的比較。第一節(jié)信度的概述考察兩個(gè)分?jǐn)?shù)的差異是否可靠,是否真有差異的問題。比如,某人的物理成績(jī)是否真的優(yōu)于化學(xué)?某人的數(shù)學(xué)技能本學(xué)期是否真有進(jìn)步?某人在韋氏智力量表上操作智商與言語(yǔ)智商的差異是否真有顯著意義等。

當(dāng)兩測(cè)驗(yàn)的方差相等時(shí),差異分?jǐn)?shù)的信度系數(shù)可用如下公式求出:式中,rXXdiff是差異分?jǐn)?shù)的信度系數(shù);rXX和rYY是兩個(gè)測(cè)驗(yàn)各自的信度系數(shù);rXY是兩測(cè)驗(yàn)間的相關(guān)系數(shù)。五、信度的標(biāo)準(zhǔn)與作用4.信度可以幫助進(jìn)行不同測(cè)驗(yàn)分?jǐn)?shù)的比較。第一節(jié)信度的概述差異分?jǐn)?shù)的測(cè)量標(biāo)準(zhǔn)誤可用如下公式求出:式中,SEdiff是差異分?jǐn)?shù)的測(cè)量標(biāo)準(zhǔn)誤;rXX和rYY是兩個(gè)測(cè)驗(yàn)各自的信度系數(shù);SD是兩測(cè)驗(yàn)間使用的相同的標(biāo)準(zhǔn)差。在比較分?jǐn)?shù)之前,必須將兩個(gè)測(cè)驗(yàn)分?jǐn)?shù)轉(zhuǎn)為具有相同量表的標(biāo)準(zhǔn)分?jǐn)?shù)。五、信度的標(biāo)準(zhǔn)與作用4.信度可以幫助進(jìn)行不同測(cè)驗(yàn)分?jǐn)?shù)的比較。第一節(jié)信度的概述例如,在韋氏成人智力量表中,言語(yǔ)和操作分測(cè)驗(yàn)的信度為0.97和0.93,而它們的智商的平均數(shù)為100,標(biāo)準(zhǔn)差為15,故言語(yǔ)和操作智商差數(shù)的標(biāo)準(zhǔn)誤為:因?yàn)?.74×1.96=9.29,因此,言語(yǔ)和操作智商相差10分時(shí),在0.05水平上,我們說存在顯著差異。若要在0.01水平上作出差異顯著的結(jié)論,就要相差13分。?測(cè)驗(yàn)分?jǐn)?shù)的比較與平均數(shù)差異顯著性檢驗(yàn)是一回事嗎?第二節(jié)信度的種類

與評(píng)估方法詳細(xì)介紹第一節(jié)中提出的各種信度估計(jì)方法的計(jì)算。一、重測(cè)信度1.含義同一個(gè)測(cè)量工具在兩個(gè)不同時(shí)間對(duì)同一組被試施測(cè)所得結(jié)果的一致性程度。重測(cè)信度主要考察了一個(gè)測(cè)量工具是否能夠保證在不同時(shí)間測(cè)量結(jié)果的一致性,他反映了測(cè)量工具的結(jié)果受到時(shí)間間隔因素影響的大小。一般來說,重測(cè)的時(shí)間間隔越短,那么各種施測(cè)情境的變化就越小,重測(cè)信度系數(shù)就會(huì)越大。重測(cè)信度系數(shù)較大時(shí),說明該測(cè)量工具前、后兩次的測(cè)量結(jié)果比較一致。結(jié)果具有較好的跨時(shí)間上的穩(wěn)定性。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法一、重測(cè)信度2.評(píng)估方法重測(cè)信度的大小可以通過計(jì)算測(cè)量工具的重測(cè)系數(shù)(test-retestcoefficient)或叫穩(wěn)定性系數(shù)(coefficientofstability)來標(biāo)志。具體來說,就是求取同一組被試在兩個(gè)不同時(shí)間施測(cè)同一個(gè)測(cè)量工具所得結(jié)果分?jǐn)?shù)的相關(guān)系數(shù)。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法一、重測(cè)信度3.應(yīng)用條件測(cè)量工具所測(cè)量的個(gè)體心理特質(zhì)在時(shí)間上應(yīng)該是相對(duì)穩(wěn)定的。測(cè)量工具所測(cè)量的個(gè)體心理特質(zhì)應(yīng)該不存在明顯的練習(xí)效應(yīng)和遺忘效應(yīng)。在兩次施測(cè)間隔期間不應(yīng)該進(jìn)行專門的訓(xùn)練和培訓(xùn),以保證重測(cè)信度反映的是隨機(jī)因素的影響效應(yīng)。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法一、重測(cè)信度4.使用重測(cè)信度時(shí)需要注意的問題兩次施測(cè)時(shí)間間隔的長(zhǎng)短會(huì)影響重測(cè)信度系數(shù)估計(jì)值的大小,因此,在報(bào)告重測(cè)信度系數(shù)時(shí)應(yīng)該報(bào)告間隔的時(shí)間長(zhǎng)度。應(yīng)該根據(jù)已有的相關(guān)研究結(jié)論考慮所測(cè)心理特質(zhì)本身的穩(wěn)定性程度,以確定前后兩次施測(cè)時(shí)間的間隔究竟應(yīng)該多長(zhǎng)比較合適時(shí),不應(yīng)該隨便選擇間隔時(shí)間的長(zhǎng)短。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法二、復(fù)本信度1.含義兩個(gè)平行的測(cè)驗(yàn)(復(fù)本測(cè)驗(yàn))測(cè)量同一批被試所得結(jié)果的一致性程度。復(fù)本信度反映了由于題目的不同以及時(shí)間間隔所導(dǎo)致的測(cè)量誤差。平行測(cè)驗(yàn)或復(fù)本測(cè)驗(yàn)指的是兩個(gè)在題目?jī)?nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語(yǔ)、時(shí)限以及所用的例題、公式和測(cè)驗(yàn)等其他方面都相同或相似的測(cè)驗(yàn)。也就是用不同的題目測(cè)量同樣的內(nèi)容而且其測(cè)驗(yàn)結(jié)果的平均值和標(biāo)準(zhǔn)差都相同的兩個(gè)測(cè)驗(yàn)。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法二、復(fù)本信度2.評(píng)估方法復(fù)本信度的估計(jì)過程就是計(jì)算同一批被試在兩個(gè)平行的復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù),也叫作等價(jià)系數(shù)(coefficientofequivalence)。測(cè)試設(shè)計(jì):同時(shí)測(cè)試和延時(shí)測(cè)試。同時(shí)測(cè)試是在同一個(gè)時(shí)間段內(nèi)進(jìn)行測(cè)試,而延時(shí)測(cè)試則是在兩個(gè)時(shí)間段進(jìn)行測(cè)試,同時(shí)測(cè)試可能會(huì)存在作答疲勞的效應(yīng),而延時(shí)測(cè)試則可能會(huì)存在學(xué)習(xí)或培訓(xùn)效應(yīng)。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法二、復(fù)本信度3.應(yīng)用條件要構(gòu)造出兩份或兩份以上真正平行的測(cè)驗(yàn);計(jì)算復(fù)本信度需要對(duì)同一批被試測(cè)試兩份平行測(cè)驗(yàn),這就需要掌握一個(gè)合理的時(shí)間安排。應(yīng)該盡量在測(cè)試結(jié)果報(bào)告中,詳盡地說明兩次測(cè)試的時(shí)間間隔、測(cè)試順序安排、測(cè)試過程中被試的有關(guān)測(cè)驗(yàn)經(jīng)歷等。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法三、內(nèi)部一致性信度1.含義內(nèi)部一致性信度主要評(píng)價(jià)了測(cè)驗(yàn)各隨機(jī)組成部分之間是否測(cè)量了相同的心理特質(zhì),因此,它反映的是題目?jī)?nèi)容的抽樣一致性程度。具體估計(jì)方法主要包括分半信度評(píng)估法、庫(kù)德-理查森信度評(píng)估法、克龍巴赫Alpha系數(shù)評(píng)估法。與重測(cè)信度和復(fù)本信度不同,在估計(jì)測(cè)驗(yàn)的內(nèi)部一致性信度時(shí),只要用同一個(gè)測(cè)驗(yàn)對(duì)一批被試測(cè)試一次。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法三、內(nèi)部一致性信度2.分半信度含義我們總是可以把一個(gè)測(cè)驗(yàn)的所有題目隨機(jī)地劃分成對(duì)半的兩個(gè)部分,然后估計(jì)所有被試在這兩個(gè)部分題目上得分的一致性程度,這樣得到的測(cè)驗(yàn)一致性估計(jì)稱為分半信度。分半信度評(píng)價(jià)了測(cè)驗(yàn)兩個(gè)隨機(jī)組成部分的題目是否測(cè)量了相同的心理特質(zhì)。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法三、內(nèi)部一致性信度2.分半信度評(píng)估方法計(jì)算出被試在測(cè)驗(yàn)兩個(gè)隨機(jī)組成部分的題目上得分之間的相關(guān)系數(shù)。由于在用分半測(cè)驗(yàn)得分計(jì)算相關(guān)系數(shù)時(shí),測(cè)驗(yàn)題量被縮短,信度系數(shù)需要通過以下這個(gè)公式對(duì)分半相關(guān)系數(shù)進(jìn)行矯正而得到。為兩個(gè)分半測(cè)驗(yàn)之間的相關(guān)系數(shù),為完整長(zhǎng)度測(cè)驗(yàn)的信度系數(shù)估計(jì)值。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法三、內(nèi)部一致性信度2.分半信度評(píng)估方法另外一個(gè)估計(jì)分半信度系數(shù)的方法是Rulon公式,他只需要計(jì)算所有被試在兩部分測(cè)驗(yàn)上得分之差的方差以及總分方差:式中,為完整測(cè)驗(yàn)的信度估計(jì)值,為被試在兩部分測(cè)驗(yàn)上得分之差的方差,為完整測(cè)驗(yàn)總分方差。

Rulon公式中分子方差反映了由于題目不同等條件帶來的誤差方差,他與總方差之比反映了誤差方差在總方差中所占的比例。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法三、內(nèi)部一致性信度2.分半信度使用時(shí)需注意的問題在估計(jì)測(cè)驗(yàn)的分半信度時(shí),雖然要求把一個(gè)測(cè)驗(yàn)的所有題目隨機(jī)地劃分成對(duì)半的兩個(gè)部分,但是在實(shí)踐中對(duì)測(cè)驗(yàn)分半時(shí),為了盡量減少無關(guān)因素的影響,通常需要考慮題型、題分、題目測(cè)試先后順序等因素的平衡問題,比如按照題目順序奇偶分半就是一個(gè)經(jīng)常選擇的方法第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法三、內(nèi)部一致性信度3.庫(kù)德-理查森信度含義在估計(jì)分半信度時(shí),把一個(gè)測(cè)驗(yàn)的題目分成兩半的方式是非常多的。而每種分半方式得到的信度估計(jì)值總會(huì)存在一些差異,但我們無法知道究竟哪種分半結(jié)果所得到的信度估計(jì)值是最合適的。估計(jì)所有可能的分半信度系數(shù)的平均數(shù),作為完整測(cè)驗(yàn)的內(nèi)部一致性最佳估計(jì)值。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法三、內(nèi)部一致性信度3.庫(kù)德-理查森信度評(píng)估方法:所有分半信度系數(shù)的平均數(shù)的估計(jì)方法。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法三、內(nèi)部一致性信度3.庫(kù)德-理查森信度使用條件Kuder-Richardson信度系數(shù)的估計(jì)只能針對(duì)1、0記分題型,對(duì)于其他題型需要使用更加一般化的估計(jì)方法。K-R21公式假設(shè)測(cè)驗(yàn)中所有項(xiàng)目的難度是相同的。Kuder-Richardson信度反映的是項(xiàng)目間一致性程度,他會(huì)嚴(yán)重地受到測(cè)驗(yàn)所測(cè)行為特質(zhì)的同質(zhì)性程度的影響。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法三、內(nèi)部一致性信度4.Cronbach’sAlpha系數(shù)含義是一種比Kuder-Richardson方法更加一般化的信度估計(jì)方法,它可以針對(duì)各種記分方式的題型進(jìn)行估計(jì)。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法三、內(nèi)部一致性信度4.Cronbach’sAlpha系數(shù)評(píng)估方法第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法公式中,k是測(cè)驗(yàn)題目個(gè)數(shù),是被試在題目i上得分的方差,是被試測(cè)驗(yàn)總分方差。三、內(nèi)部一致性信度4.Cronbach’sAlpha系數(shù)使用條件可以估計(jì)各種記分方式的測(cè)驗(yàn)內(nèi)部一致性信度系數(shù),是更一般化的測(cè)驗(yàn)內(nèi)部一致性信度系數(shù)估計(jì)方法。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法四、評(píng)分者信度1.含義在評(píng)價(jià)通過主觀評(píng)分方式得到的分?jǐn)?shù)時(shí),我們必須了解不同的評(píng)分者在評(píng)價(jià)被試作答反應(yīng)時(shí)給的分?jǐn)?shù)值的一致性程度(信度)。一般的客觀型題目在評(píng)分時(shí)很少出現(xiàn)誤差,然而,對(duì)于諸如作文測(cè)驗(yàn)、語(yǔ)言類測(cè)驗(yàn)、以及其他的評(píng)價(jià)性測(cè)驗(yàn)(如人格特質(zhì)評(píng)級(jí)、投射測(cè)驗(yàn)評(píng)分等),這些測(cè)驗(yàn)類型的評(píng)分過程就顯得非常主觀。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法四、評(píng)分者信度2.評(píng)估方法兩個(gè)評(píng)分者時(shí):計(jì)算這兩個(gè)評(píng)分者評(píng)定分?jǐn)?shù)之間的相關(guān)系數(shù)。多個(gè)評(píng)價(jià)者評(píng)價(jià)同一批被試:計(jì)算和諧系數(shù)。第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法五、信度系數(shù)及其估計(jì)方法小結(jié)1.測(cè)試次數(shù)和測(cè)試卷份數(shù)與信度系數(shù)估計(jì)方法第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法測(cè)試次數(shù)測(cè)試卷份數(shù)1份2份1次分半信度Kuder-Richardson信度Alpha系數(shù)復(fù)本信度(同時(shí)測(cè)試)2次重測(cè)信度復(fù)本信度(延時(shí)測(cè)試)五、信度系數(shù)及其估計(jì)方法小結(jié)2.各種信度估計(jì)方法的誤差方差來源第二節(jié)測(cè)驗(yàn)信度的種類與評(píng)估方法復(fù)本信度(延時(shí)測(cè)試)復(fù)本信度(延時(shí)測(cè)試)重測(cè)信度復(fù)本信度(同時(shí)測(cè)試)復(fù)本信度(延時(shí)測(cè)試)分半信度Kuder-Richardson

和Alpha系數(shù)評(píng)分者信度時(shí)間間隔題目?jī)?nèi)容時(shí)間間隔與題目?jī)?nèi)容題目?jī)?nèi)容題目?jī)?nèi)容與心理行為特質(zhì)的同質(zhì)性評(píng)分者間差異第三節(jié)測(cè)量的隨機(jī)誤差控制一、影響測(cè)量信度的因素影響測(cè)量信度的因素施測(cè)間隔的時(shí)間被試主試施測(cè)情境測(cè)量工具第三節(jié)測(cè)量的隨機(jī)誤差控制二、提高測(cè)驗(yàn)信度的常用方法提高測(cè)驗(yàn)信度的常用方法規(guī)范施測(cè)程度、統(tǒng)一施測(cè)環(huán)境適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度控制試題的難度分布努力提高每道題的區(qū)分度維持測(cè)驗(yàn)的同質(zhì)性努力提高測(cè)驗(yàn)在被試中各個(gè)同質(zhì)亞團(tuán)體上的信度保證被試有充裕的作答時(shí)間嚴(yán)格控制評(píng)分誤差第三節(jié)測(cè)量的隨機(jī)誤差控制第四節(jié)評(píng)分者信度及

評(píng)分誤差的控制一、評(píng)分誤差存在的嚴(yán)重性嚴(yán)重到什么程度?歷史教授的答案被評(píng)閱為“不及格”高考作文《一幅漫畫的啟示》,67位評(píng)閱者,6至25分都有,最高分與最低分相差19分1984年,高考作文評(píng)分調(diào)查,438位老師,4篇作文,。最高得分為41.25,最低分為20.75,標(biāo)準(zhǔn)差為2.98。1985年,對(duì)1984年的四篇作文再研究,347位老師(有部分年參加研究的老師),最高得分為42.5,最低分為24.75,標(biāo)準(zhǔn)差為3.3。第四節(jié)評(píng)分者信度及評(píng)分誤差控制二、評(píng)分者信度定義:多個(gè)評(píng)分者對(duì)同一批答卷評(píng)分結(jié)果的一致性程度。估計(jì)方法:①兩位評(píng)分者評(píng)同一批試卷;②三位或三位以上評(píng)分者評(píng)同一批試卷第四節(jié)評(píng)分者信度及評(píng)分誤差控制三、評(píng)分誤差產(chǎn)生的原因試題原因評(píng)分者原因?qū)I(yè)知識(shí)水平不夠評(píng)判能力不夠個(gè)性傾向心理狀態(tài)客觀效應(yīng)“名片”、“光環(huán)”、“對(duì)比”、“先后”環(huán)境、組織管理的原因第四節(jié)評(píng)分者信度及評(píng)分誤差控制四、控制評(píng)分誤差的方法控制試題作答反應(yīng)方向與范圍預(yù)先制訂好評(píng)分細(xì)則閱卷人員要選擇、要培訓(xùn)流水作業(yè)分因素評(píng)分組織復(fù)查要求評(píng)分者自覺防止各種客觀效應(yīng)的影響大規(guī)模閱卷可考慮采用統(tǒng)計(jì)手段控制第四節(jié)評(píng)分者信度及評(píng)分誤差控制下次上課再見!提高信度的方法——適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度為什么增加測(cè)驗(yàn)的長(zhǎng)度,會(huì)提高信度?測(cè)驗(yàn)長(zhǎng)度的增加與信度的提高不是等比例的提高信度的方法——適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度增加測(cè)驗(yàn)長(zhǎng)度與信度提高之間關(guān)系的公式:例:有一包含10題的測(cè)驗(yàn),其信度系數(shù)為0.30,若把測(cè)驗(yàn)增加到原測(cè)驗(yàn)長(zhǎng)度的3倍,那么新測(cè)驗(yàn)的信度系數(shù)應(yīng)該是多少?例:原測(cè)驗(yàn)共10題,信度系數(shù)為0.30,如要把測(cè)驗(yàn)信度系數(shù)提高到0.94,需要把原測(cè)驗(yàn)延長(zhǎng)多少倍?增加多少題?返回兩位評(píng)分者評(píng)同一批試卷的評(píng)分者信度例:甲、乙兩位教師評(píng)閱10份試卷,他們對(duì)每一試卷各自所評(píng)分?jǐn)?shù)如下表,問這兩位教師評(píng)分的一致性如何?返回試卷得分D=甲-乙等級(jí)等級(jí)之差甲評(píng)分乙評(píng)分甲乙A94931110B9092-222.5-0.5C8692-63.52.51D8670163.573.5E8682-10541F7076-665.50.5G6865379-2H6676-1085.52.5I6468-4981J6160110100心理測(cè)量學(xué)

測(cè)量效度概述1測(cè)量工具效度驗(yàn)證的方法2測(cè)量的系統(tǒng)誤差控制3心理測(cè)量學(xué)

測(cè)量效度概述1心理測(cè)量學(xué)測(cè)量效度概述

什么是效度測(cè)量工具測(cè)量了他所希望測(cè)量的心理特質(zhì)或行為特征的效果和程度。效度總是與一定的測(cè)量目標(biāo)相聯(lián)系的。我們稱為某測(cè)量工具進(jìn)行效度驗(yàn)證的過程為效度證據(jù)的獲取過程,簡(jiǎn)稱為效度驗(yàn)證。心理測(cè)量學(xué)測(cè)量效度概述效度與信度的關(guān)系信度研究的是測(cè)量結(jié)果的穩(wěn)定性問題,效度研究的是測(cè)量結(jié)果的準(zhǔn)確性問題。測(cè)量的信度只受到隨機(jī)誤差或非系統(tǒng)測(cè)量誤差的影響,而測(cè)量效度會(huì)同時(shí)受到隨機(jī)誤差和系統(tǒng)測(cè)量誤差的影響。一個(gè)測(cè)量工具可能是非常穩(wěn)定(信度高),但卻是無效的,因?yàn)樗c測(cè)量的目標(biāo)之間產(chǎn)生了系統(tǒng)性的偏差;當(dāng)然,一個(gè)完全不穩(wěn)定的測(cè)量工具也不可能是有效的。心理測(cè)量學(xué)第三章測(cè)量效度與系統(tǒng)誤差控制測(cè)量工具效度驗(yàn)證的方法2心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法根據(jù)測(cè)量目標(biāo)的不同,對(duì)測(cè)量工具進(jìn)行效度驗(yàn)證的方法主要有三種:基于所測(cè)內(nèi)容的效度驗(yàn)證方法。基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法?;谛?biāo)關(guān)聯(lián)性的效度驗(yàn)證方法。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)內(nèi)容的效度驗(yàn)證方法含義就是要對(duì)測(cè)量工具本身的具體內(nèi)容進(jìn)行系統(tǒng)性的查驗(yàn),以確定這些內(nèi)容是不是測(cè)量目標(biāo)特質(zhì)或行為領(lǐng)域的一個(gè)有代表性的樣本。主要應(yīng)用學(xué)業(yè)成就測(cè)驗(yàn)、職業(yè)資格測(cè)驗(yàn),還如人員選拔與安置中的工作樣本測(cè)驗(yàn)。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)內(nèi)容的效度驗(yàn)證方法評(píng)估方法確定測(cè)量目標(biāo)的全域范圍及各部分內(nèi)容權(quán)重。確定一批有經(jīng)驗(yàn)的領(lǐng)域?qū)<?,在深入培?xùn)的基礎(chǔ)上,要求他們按照已確定的測(cè)量全域范圍及各部分內(nèi)容權(quán)重,初步分析測(cè)試題目的代表性,并對(duì)題目測(cè)量的被試作答的內(nèi)部心理過程進(jìn)行初步分析。進(jìn)行實(shí)測(cè),根據(jù)測(cè)試數(shù)據(jù)分析和被試作答過程分析,全面驗(yàn)證測(cè)量工具的效度。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)內(nèi)容的效度驗(yàn)證方法關(guān)于測(cè)量工具的表面效度嚴(yán)格來說,表面效度并不符合效度的定義,因?yàn)樗从车牟皇菍?shí)際要測(cè)量的目標(biāo)是什么,或?qū)δ繕?biāo)測(cè)量的程度如何,而反映的是,測(cè)量工具從表面上看測(cè)量了什么。表面效度關(guān)心的是測(cè)量的友好性和與公眾的和諧關(guān)系。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效標(biāo):它是獨(dú)立于測(cè)量工具并可以從實(shí)踐中獲得的被試的行為特征表現(xiàn),用于驗(yàn)證測(cè)量工具的有效性。根據(jù)測(cè)量工具與效標(biāo)兩者結(jié)果獲得的時(shí)間間隔的不同,基于效標(biāo)關(guān)聯(lián)性的效度證據(jù)采集可以有同時(shí)性設(shè)計(jì)與預(yù)測(cè)性設(shè)計(jì)兩種方法。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效度證據(jù)采集的預(yù)測(cè)性設(shè)計(jì)方法含義:驗(yàn)證現(xiàn)有測(cè)量評(píng)價(jià)結(jié)果與將來才可能獲取的效標(biāo)評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)程度。主要應(yīng)用:人員選拔、安置類型的測(cè)量工具心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效度證據(jù)采集的預(yù)測(cè)性設(shè)計(jì)方法首先,獲取被試在當(dāng)前測(cè)量工具上的評(píng)價(jià)結(jié)果,如測(cè)驗(yàn)分?jǐn)?shù)、等級(jí)評(píng)定;然后,間隔一定的時(shí)間,采集被試在預(yù)測(cè)目標(biāo)(效標(biāo))上的評(píng)價(jià)結(jié)果;最后,分析以上這兩個(gè)評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)性程度,這種關(guān)聯(lián)性程度的分析方法常用的有以下幾種:相關(guān)分析區(qū)分能力分析命中率分析心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效度證據(jù)采集的同時(shí)性設(shè)計(jì)方法含義:對(duì)同時(shí)獲得的測(cè)量工具評(píng)價(jià)結(jié)果與效標(biāo)評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)性程度進(jìn)行分析。主要應(yīng)用經(jīng)常用于評(píng)價(jià)測(cè)量工具診斷被試當(dāng)前心理特質(zhì)狀態(tài)的效果。在許多情形下,效度證據(jù)采集的同時(shí)性設(shè)計(jì)方法會(huì)替代預(yù)測(cè)性設(shè)計(jì)方法。評(píng)估方法心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法的影響因素群體的一致性或同質(zhì)性程度:應(yīng)該盡量擴(kuò)大被試群體的異質(zhì)性,避免低估測(cè)驗(yàn)的真實(shí)效度。測(cè)驗(yàn)長(zhǎng)度:一般來說,測(cè)驗(yàn)長(zhǎng)度越長(zhǎng),測(cè)試結(jié)果越穩(wěn)定,效度系數(shù)會(huì)傾向于越高。效標(biāo)污染心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法估計(jì)標(biāo)準(zhǔn)誤指的是測(cè)量工具實(shí)際測(cè)量的結(jié)果與預(yù)先設(shè)定的測(cè)量目標(biāo)之間相互偏離的程度,而效度驗(yàn)證的過程就是要考察這種偏離程度的大小。從實(shí)際應(yīng)用范圍及計(jì)算過程的便利性角度看,估計(jì)標(biāo)準(zhǔn)誤的實(shí)際應(yīng)用更多的是基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法中。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法估計(jì)標(biāo)準(zhǔn)誤是表現(xiàn)為相關(guān)系數(shù)的效度系數(shù);是效標(biāo)評(píng)定分?jǐn)?shù)的標(biāo)準(zhǔn)差。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法含義:對(duì)測(cè)量工具測(cè)量了心理學(xué)中某種特質(zhì)或特質(zhì)結(jié)構(gòu)的程度進(jìn)行驗(yàn)證的方法。主要應(yīng)用:各種心理測(cè)驗(yàn),如智力測(cè)驗(yàn)、人格測(cè)驗(yàn)、焦慮測(cè)驗(yàn)、成就動(dòng)機(jī)測(cè)驗(yàn)等。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法評(píng)估方法專家判斷分析法主要依靠專家的主觀專業(yè)經(jīng)驗(yàn)。盡量減少專家主觀隨意性的影響。德爾菲法。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法評(píng)估方法測(cè)驗(yàn)內(nèi)部一致性分析法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證的一個(gè)重要證據(jù)來源。這個(gè)方法的實(shí)質(zhì)是,測(cè)驗(yàn)總分本身是用于評(píng)價(jià)所測(cè)心理結(jié)構(gòu)的效度最好的效標(biāo)。相關(guān)分析法:求取每個(gè)項(xiàng)目與測(cè)驗(yàn)總分之間的相關(guān)系數(shù),如果項(xiàng)目—測(cè)驗(yàn)相關(guān)顯著,表明該項(xiàng)目與總測(cè)驗(yàn)的結(jié)構(gòu)是一致的。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法評(píng)估方法測(cè)驗(yàn)內(nèi)部一致性分析法對(duì)照組比較法:按照被試的測(cè)驗(yàn)總分,選出一個(gè)高分組被試和一個(gè)低分組被試,然后,比較高分組被試與低分組被試在各個(gè)項(xiàng)目上的作答表現(xiàn),如果高分組被試的通過比例顯著大于低分組被試的通過比例,表明該項(xiàng)目與總測(cè)驗(yàn)的結(jié)構(gòu)是一致的。心理測(cè)量學(xué)基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法評(píng)估方法測(cè)驗(yàn)內(nèi)部一致性分析法很明顯,測(cè)驗(yàn)內(nèi)部一致性證據(jù)保證的是測(cè)驗(yàn)結(jié)構(gòu)的同質(zhì)性或單一性。測(cè)驗(yàn)內(nèi)部一致性證據(jù)的作用是有限的,因?yàn)樗吘篃o法證明該測(cè)驗(yàn)究竟測(cè)量了什么結(jié)構(gòu)。測(cè)量工具效度驗(yàn)證的方法心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法評(píng)估方法與現(xiàn)有研究結(jié)論一致性的分析法通過分析新開發(fā)測(cè)量工具測(cè)試結(jié)果是否與已有研究結(jié)論相一致。在許多傳統(tǒng)智力測(cè)驗(yàn)中,成長(zhǎng)發(fā)展性變化證據(jù)是測(cè)驗(yàn)效度的一個(gè)重要證據(jù)。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法評(píng)估方法與其他測(cè)量工具的相關(guān)分析法求取新開發(fā)測(cè)量工具與另一個(gè)已經(jīng)被公認(rèn)為有效的測(cè)量工具之間的相關(guān)關(guān)系,是證明新開發(fā)測(cè)量工具測(cè)量了相同內(nèi)容結(jié)構(gòu)的一個(gè)有效證據(jù)。求取新開發(fā)測(cè)量工具與另一個(gè)測(cè)量工具之間的相關(guān)關(guān)系,有時(shí)候也被用于證明該測(cè)量工具沒有受到其他無關(guān)心理因素的影響。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法其他評(píng)估方法因素分析法因素分析方法是基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法中幾乎最為常用的一種方法,他很適合用于鑒別測(cè)量工具所測(cè)的心理特質(zhì)結(jié)構(gòu)。實(shí)際上,因素分析方法是一種分析觀察數(shù)據(jù)之間相關(guān)矩陣的統(tǒng)計(jì)分析技術(shù)。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法其他評(píng)估方法聚合與區(qū)分效度驗(yàn)證分析法為了驗(yàn)證測(cè)量工具所測(cè)的心理結(jié)構(gòu),我們不僅必須提供關(guān)于它與另外一個(gè)理論上應(yīng)該存在高相關(guān)的測(cè)量工具之間存在高相關(guān)的實(shí)際證據(jù),同時(shí),也需要提供關(guān)于它與另外的無關(guān)變量之間不存在顯著相關(guān)的證據(jù)。多特質(zhì)—多方法矩陣分析法心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法其他評(píng)估方法實(shí)驗(yàn)介入分析法通過實(shí)驗(yàn)的方法考察某些重要變量的介入是否對(duì)被試測(cè)量分?jǐn)?shù)產(chǎn)生顯著影響。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法其他評(píng)估方法結(jié)構(gòu)方程建模分析法除了鑒別測(cè)量的潛在結(jié)構(gòu)之外,對(duì)這些潛在特質(zhì)結(jié)構(gòu)本身之間的關(guān)系以及它們之間的影響路徑進(jìn)行考察,同樣是非常重要的。分析潛在特質(zhì)結(jié)構(gòu)之間的關(guān)系及其與效標(biāo)變量之間的路徑,有利于我們更深入理解所測(cè)特質(zhì)的作用機(jī)制。這種分析過程可以用結(jié)構(gòu)方程建模的方式進(jìn)行。心理測(cè)量學(xué)測(cè)量工具效度驗(yàn)證的方法基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法其他評(píng)估方法尋求當(dāng)代認(rèn)知心理學(xué)證據(jù)的分析方法基于信息加工理論的研究方法為我們深入理解人類問題解決的加工過程提供了更豐富的證據(jù)。認(rèn)知加工模型讓我們了解完成某種認(rèn)知任務(wù)的智能過程、這個(gè)過程的組織方式、涉及的知識(shí)內(nèi)容、這些知識(shí)在記憶中的表征形式及其提取模式,這些研究無疑會(huì)讓我們對(duì)人類心理特質(zhì)結(jié)構(gòu)的認(rèn)知更加深入。心理測(cè)量學(xué)第三章測(cè)量效度與系統(tǒng)誤差控制測(cè)量的系統(tǒng)誤差控制3心理測(cè)量學(xué)測(cè)量的系統(tǒng)誤差控制影響測(cè)量工具有效性的因素測(cè)量的心理特質(zhì)本身的特點(diǎn)有些心理特質(zhì)至今研究不夠深入,概念界定還不清晰。有些心理特質(zhì)本身不太穩(wěn)定。測(cè)量工具的建構(gòu)過程建構(gòu)過程應(yīng)遵循嚴(yán)謹(jǐn)?shù)膽B(tài)度才能建構(gòu)出優(yōu)良的測(cè)量工具,避免出現(xiàn)系統(tǒng)偏差。心理測(cè)量學(xué)測(cè)量的系統(tǒng)誤差控制影響測(cè)量工具有效性的因素測(cè)量工具本身的信度信度是效度的必要條件。效度驗(yàn)證時(shí)的被試群體相同的一個(gè)測(cè)量工具,可能會(huì)因?yàn)闇y(cè)量對(duì)象特性的不同而測(cè)量到不同的心理特質(zhì)結(jié)構(gòu)。作為用相關(guān)系數(shù)表示的效度系數(shù),希望參與效度驗(yàn)證的被試群體越異質(zhì)越好。心理測(cè)量學(xué)引子心理測(cè)量的工具是測(cè)驗(yàn),而題目則是構(gòu)成測(cè)驗(yàn)的基石,因此研究題目的性能及其編制至關(guān)重要,它直接影響測(cè)量工具(即測(cè)驗(yàn))的信度及效度,進(jìn)而影響測(cè)量的準(zhǔn)確性。在實(shí)際工作中,人們應(yīng)如何來編制測(cè)驗(yàn)題目?如何評(píng)價(jià)測(cè)驗(yàn)題目質(zhì)量的好差呢?本章將對(duì)這些問題做出回答。心理測(cè)量學(xué)測(cè)驗(yàn)題目性能與題目編制測(cè)驗(yàn)題目類型、功能與題目編制1測(cè)驗(yàn)題目的難度與難度分布控制2測(cè)驗(yàn)題目的區(qū)分度與區(qū)分度的提高3測(cè)驗(yàn)題目的猜測(cè)度與猜測(cè)控制4選擇題的選項(xiàng)分析與選項(xiàng)修改5題目功能差異與測(cè)量偏差控制6

測(cè)驗(yàn)題目的類型功能與編制

第一節(jié)心理測(cè)量學(xué)第一節(jié)一、測(cè)驗(yàn)題目類型題目主要可分為客觀題和主觀題兩大類??陀^題一般有標(biāo)準(zhǔn)唯一的答案,被試的作答只有與標(biāo)準(zhǔn)答案完全一致才視為答對(duì),否則視為答錯(cuò)。主觀題無標(biāo)準(zhǔn)唯一答案,只有一個(gè)參考答案,被試的作答與參考答案相近或基本一致就可視為答對(duì)。心理測(cè)量學(xué)客觀題主要包括選擇題(含自陳式選擇題)、填空題、是非判斷題、匹配題、行為情景判斷題等。主觀題主要包括名詞解釋、簡(jiǎn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論