第五章：心理測(cè)量學(xué)知識(shí)

上傳人：f*** IP屬地：江蘇上傳時(shí)間：2023-10-25 格式：PPT 頁數(shù)：160 大?。?.09MB 積分：38 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩155頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章：心理測(cè)量學(xué)知識(shí)第一節(jié)：概述第一單元：測(cè)量與測(cè)量量表一、什么是測(cè)量測(cè)量就是依據(jù)一定的法則用數(shù)字對(duì)事物加以確定。包括三個(gè)主要的元素：（1）事物；（2）數(shù)字：（3）法則“事物”指的是我們要測(cè)量的對(duì)象；“數(shù)字”是代表某一事物或事物某一屬性的量；“法則”是測(cè)量所依據(jù)的規(guī)則和方法；有好壞之分。絲綢、體重、智力；氣味、標(biāo)準(zhǔn)物、視力和聽力。真假多重多聰明（一）參照點(diǎn)，即確定事物量的計(jì)算起點(diǎn)有兩種參照點(diǎn)，即絕對(duì)零點(diǎn)（理想）、相對(duì)零點(diǎn)（二）單位，即測(cè)量的基本要求好的單位必須具備兩個(gè)條件：一為有確定的意義；二為有相同的價(jià)值心理測(cè)量的單位，一般無統(tǒng)一單位，也不符合等距的要求二、測(cè)量要素：即參照點(diǎn)和單位50元人民幣與10美元相比，那個(gè)多？1公里與1英里相比，那個(gè)長(zhǎng)（0.6214）？三、測(cè)量量表在一個(gè)定有單位和參照點(diǎn)的連續(xù)體上把事物的屬性表現(xiàn)出來，這個(gè)連續(xù)體稱為量表。

根據(jù)量表的精確程度,測(cè)量從低級(jí)到高級(jí)分成四種水平：（一）命名量表用數(shù)字來代表事物或把事物歸類。1、代號(hào)；2、類別白人黑人黃人男人女人類別代號(hào)（二）順序量表包含類別和大??；用于分等或排出順序。如：“<“、”>”名次名次胖瘦高矮（三）等距量表不但有大小而且數(shù)字有相等的單位，可以做加、減運(yùn)算（四）等比量表有相等單位又有絕對(duì)零點(diǎn)，數(shù)值可做加、減、乘、除運(yùn)算

統(tǒng)計(jì)心理測(cè)量：順序量表---------〉等距量表方法長(zhǎng)度體積第二單元：心理測(cè)驗(yàn)的基本概念一、心理測(cè)驗(yàn)的定義所謂心理測(cè)驗(yàn)，就是依據(jù)心理學(xué)理論，使用一定的操作程序，通過觀察人的少數(shù)有代表性的行為，對(duì)于貫穿在人的全部行為活動(dòng)中的心理特點(diǎn)做出推論和數(shù)量化分析的一種科學(xué)手段。測(cè)量行為、行為樣本、標(biāo)準(zhǔn)化、常模二、心理測(cè)驗(yàn)的性質(zhì)間接性（外顯行為----〉心理特質(zhì)）相對(duì)性（沒有絕對(duì)的標(biāo)準(zhǔn)，只是確定個(gè)人在序列的位置）客觀性（標(biāo)準(zhǔn)化：過程、評(píng)分、轉(zhuǎn)換和解釋等）第三單元：心理測(cè)驗(yàn)的分類一、按測(cè)驗(yàn)的功能分類：智力測(cè)驗(yàn)、特殊能力測(cè)驗(yàn)、人格測(cè)驗(yàn)韋氏兒童智力量表:言語測(cè)驗(yàn)和操作測(cè)驗(yàn).言語測(cè)驗(yàn)包括理解測(cè)驗(yàn).其中的題目是:如果你把小朋友的皮球弄丟了,你應(yīng)該怎么辦?為什么政府要派人到肉食加工廠去檢驗(yàn)肉類產(chǎn)品?

國(guó)家設(shè)立人民代表大會(huì)有哪些好處?職業(yè)指導(dǎo)的測(cè)驗(yàn)中有個(gè)尋找字、符差異的測(cè)驗(yàn)：長(zhǎng)江——長(zhǎng)工BOOK——BOOT

756246——756346

愛德華個(gè)人偏好量表里的題目：A我喜歡問些明知?jiǎng)e人回答不出來的問題。B我喜歡告訴別人怎樣做他們的工作。二、按測(cè)驗(yàn)材料的性質(zhì)分類：文字測(cè)驗(yàn)、操作測(cè)驗(yàn)在中小學(xué)生團(tuán)體智力測(cè)驗(yàn)中的文字測(cè)驗(yàn)題目：下面五樣?xùn)|西中哪一樣最不象其他四樣？A襪子B衣服C鞋子D皮包E帽子中國(guó)比奈測(cè)驗(yàn)中的操作測(cè)驗(yàn)題目：三、按測(cè)驗(yàn)材料的嚴(yán)謹(jǐn)程度分類：客觀測(cè)驗(yàn)、投射測(cè)驗(yàn)艾森克個(gè)性問卷中的題目：你喜歡跳降落傘嗎？是否兒童主體統(tǒng)覺測(cè)驗(yàn)中的題目：四、按測(cè)驗(yàn)的方式分類：個(gè)別測(cè)驗(yàn)、團(tuán)體測(cè)驗(yàn)五、按測(cè)驗(yàn)的要求分類：最高作為測(cè)驗(yàn)、典型行為測(cè)驗(yàn)韋氏兒童智力測(cè)驗(yàn)中的背數(shù)測(cè)驗(yàn)題目：順背3-8-6

6-1-23-4-1-7

6-1-5-88-4-2-3-9

5-2-1-8-63-8-9-1-7-4

7-9-6-4-8-35-1-7-4-2-3-8

9-8-5-2-1-6-31-6-4-5-9-7-6-3

2-9-7-6-3-1-5-45-3-8-7-1-2-4-6-9

4-2-6-9-1-7-8-3-57-5-1-3-2-6-9-1-8-7-

4-1-9-2-4-7-8-3-1-5韋氏兒童智力測(cè)驗(yàn)中的背數(shù)測(cè)驗(yàn)題目倒背2-5

6-35-7-4

2-5-97-2-9-6-

8-4-9-34-1-3-5-7

9-7-8-5-21-6-5-2-9-8

3-6-7-1-9-48-5-9-2-3-4-2

4-5-7-9-2-8-16-9-1-6-3-2-5-8-8

3-1-7-9-5-4-8-2MMPI里的題目：有時(shí)我會(huì)哭一陣，笑一陣，連自己也不能控制。是否假如不是有人和我作對(duì)，我一定會(huì)有更大的成就。是否第四單元：糾正錯(cuò)誤的測(cè)驗(yàn)觀一、錯(cuò)誤的測(cè)驗(yàn)觀（一）測(cè)驗(yàn)萬能論（二）測(cè)驗(yàn)無用論其一，某些人格測(cè)驗(yàn)侵犯了個(gè)人隱私，違背民主原則。其二，測(cè)驗(yàn)為宿命論和種族歧視提供了心理學(xué)依據(jù)（三）心理測(cè)驗(yàn)即智力測(cè)驗(yàn)二、正確的測(cè)驗(yàn)觀（一）心理測(cè)驗(yàn)是重要的心理學(xué)研究方法之一，是決策的輔助工具（二）心理測(cè)驗(yàn)作為研究方法和測(cè)量工具尚不完善心理測(cè)驗(yàn)的最大問題是理論基礎(chǔ)不夠堅(jiān)實(shí)

-------既要承認(rèn)心理測(cè)驗(yàn)的不完善，又要科學(xué)的自信的使用心理測(cè)驗(yàn)。第五單元心理測(cè)驗(yàn)在心理咨詢中的應(yīng)用3類常用心理測(cè)驗(yàn)：一、智力測(cè)驗(yàn)中國(guó)比內(nèi)量表（吳天敏）、WAIS-RC、C-WISC、C-WYCSI（龔耀先）、WISC-CR（林傳鼎）、SPM（張厚粲）、CRT（李丹）等二、人格測(cè)驗(yàn)

EPQ、16PF、MMPI等三、心理評(píng)定量表精神病評(píng)定量表、躁狂狀態(tài)評(píng)定量表、抑郁量表、焦慮量表、恐怖量表等。心理測(cè)驗(yàn)在咨詢和治療中并不是必不可少的環(huán)節(jié)。一般來講，心理測(cè)驗(yàn)應(yīng)在咨詢關(guān)系尚未建立之前實(shí)施，進(jìn)入正式的心理咨詢程序之后，要盡量避免心理測(cè)驗(yàn)。也有例外。第六單元心理測(cè)驗(yàn)的發(fā)展史

始于漢代、興于隋唐的科舉取士制度一、科學(xué)心理測(cè)驗(yàn)的產(chǎn)生與發(fā)展心理測(cè)驗(yàn)的開端---19世紀(jì)80年代，英國(guó)

F.Galton

為了研究差異的遺傳性，便設(shè)計(jì)了測(cè)量差異的方法。為心理測(cè)量，奠定統(tǒng)計(jì)學(xué)基礎(chǔ)。心理測(cè)驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)中---1890年，美國(guó)J.M.Cattell在《心理》雜志上發(fā)表《心理測(cè)驗(yàn)與測(cè)量》

世界上第一個(gè)正式的心理測(cè)驗(yàn)----1905年，法國(guó)A.Binet在《心理學(xué)年報(bào)》上發(fā)表了一篇文章，題為《診斷異常兒童智力的新方法》

在此以后，心理測(cè)驗(yàn)主要有以下幾個(gè)方面的發(fā)展：

1、操作測(cè)驗(yàn)的發(fā)展

2、團(tuán)體智力測(cè)驗(yàn)的發(fā)展如陸軍甲種和乙種智力測(cè)驗(yàn)

3、能力傾向測(cè)驗(yàn)的發(fā)展如D.Wechsler所編的智力量表

4、人格測(cè)驗(yàn)的發(fā)展二、現(xiàn)代心理測(cè)驗(yàn)在我國(guó)的發(fā)展第二節(jié)測(cè)驗(yàn)的常模（常模的定義）

第一單元常模團(tuán)體一、常模團(tuán)體的性質(zhì)（一個(gè)人是否胖、內(nèi)向、聰明等與其常模團(tuán)體有關(guān)。）常模團(tuán)體是由具有某種共同特征的人所組成的一個(gè)群體，或者是該群體的一個(gè)樣本。常模團(tuán)體用一個(gè)標(biāo)準(zhǔn)的、規(guī)范的分?jǐn)?shù)表示出來，以提供比較的基礎(chǔ)。任何一個(gè)測(cè)驗(yàn)都有許多可能的常模團(tuán)體。制訂和解釋應(yīng)考慮。如智力測(cè)驗(yàn)有各年齡常模。常模團(tuán)體必須能夠代表該總體，包括：確定一般總體、確定目標(biāo)總體、確定樣本。無論是測(cè)驗(yàn)的編制者還是使用者，主要關(guān)心的是常模團(tuán)體的成員。（大學(xué)生的家長(zhǎng)給孩子每月400元的生活費(fèi)是高還是低？）二、常模團(tuán)體的條件（一）群體的構(gòu)成必須明確界定必須清楚說明所要測(cè)量的群體的性質(zhì)與特征（二）常模團(tuán)體必須是所測(cè)群體的代表性樣本小團(tuán)體：全選，平均分作為常模；大團(tuán)體：用隨機(jī)取樣或分層取樣的方法。（三）樣本的大小要適當(dāng)（關(guān)鍵是要有代表性）幾十個(gè)人的團(tuán)體：全部；總體數(shù)目大：不小于30或100個(gè)的樣本數(shù)目；全國(guó)性常模：2000—3000人（四）標(biāo)準(zhǔn)化樣組是一定時(shí)空的產(chǎn)物注意選擇較為新近的常模三、取樣的方法

取樣即從目標(biāo)人群中選擇有代表性的樣本。隨機(jī)抽樣：每個(gè)個(gè)案被抽取的機(jī)會(huì)均等非隨機(jī)抽樣抽樣方法：（一）簡(jiǎn)單隨機(jī)抽樣

a按隨機(jī)表順序,b先編號(hào)再隨機(jī)選擇（二）系統(tǒng)抽樣總體數(shù)目為N，選擇K分之一（組距）作為樣本。要求目標(biāo)總體無序可排，也無等級(jí)結(jié)構(gòu)存在（三）分組抽樣：總體數(shù)目大，群體有多樣性，分組

---組內(nèi)隨機(jī)取樣。（四）分層抽樣：目標(biāo)總體按某種變量分層---層內(nèi)隨機(jī)取樣。分層比例抽樣、分層非比例抽樣四、常模分?jǐn)?shù)與常模（一）常模分?jǐn)?shù)常模分?jǐn)?shù)就是施測(cè)常模樣本被試后，將被試者的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。通過將被試的反應(yīng)與標(biāo)準(zhǔn)答案相比較而獲得的測(cè)驗(yàn)分?jǐn)?shù)叫原始分?jǐn)?shù)。

導(dǎo)出分?jǐn)?shù)具有一定的參照點(diǎn)和單位，它實(shí)際上是一個(gè)有意義的測(cè)驗(yàn)量表，它與原始分?jǐn)?shù)等值，可以進(jìn)行比較（二）常模常模分?jǐn)?shù)構(gòu)成的分布，就是常模（norm），是解釋心理測(cè)驗(yàn)分?jǐn)?shù)的基礎(chǔ)。一般常模、特殊常模第二單元常模的類型一、發(fā)展常模（年齡量表）（縱向比較）將個(gè)人的成績(jī)與各種發(fā)展水平的人的平均表現(xiàn)相比較，根據(jù)這種平均表現(xiàn)所制成的量表就是發(fā)展常模。（一）發(fā)展順序量表它告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育正常，相應(yīng)能力或行為早于某年齡出現(xiàn)，說明發(fā)育超前，否則即為發(fā)育滯后。葛塞爾發(fā)展程序表（按月份顯示兒童各方面的大致發(fā)展水平）瑞士皮亞杰的發(fā)展理論16周28周40周48周（二）智力年齡一個(gè)兒童在年齡量表上所得的分?jǐn)?shù)，代表他的智力水平的年齡。這種分?jǐn)?shù)叫做智力年齡，簡(jiǎn)稱智齡。比內(nèi)—西蒙一個(gè)人的智齡并不一定和他的實(shí)齡相符。

年齡量表的基本要素（三）年級(jí)當(dāng)量即年級(jí)量表，測(cè)驗(yàn)結(jié)果說明屬哪一年級(jí)的水平。在教育成就測(cè)驗(yàn)中最常用二、百分位常模（橫向比較）

百分位常模包括百分等級(jí)和百分點(diǎn)、四分位數(shù)和十分位數(shù)。（一）、百分等級(jí)

是指在常模樣本中低于這個(gè)分?jǐn)?shù)的人數(shù)百分比。未分組資料的百分等級(jí)計(jì)算：

PR=100-（100*R-50）/N

其中R是原始分?jǐn)?shù)排列順序數(shù)，N是指總?cè)藬?shù)（樣本的總?cè)藬?shù)）。例題見341頁。百分等級(jí)

（二）百分點(diǎn)也稱百分位數(shù)，計(jì)算處于某一百分比例的人對(duì)應(yīng)的測(cè)驗(yàn)分?jǐn)?shù)是多少。在分?jǐn)?shù)量表上，相對(duì)于某一百分等級(jí)的分?jǐn)?shù)點(diǎn)就叫百分點(diǎn)或百分位數(shù)。計(jì)算根據(jù)直線內(nèi)插法進(jìn)行。見341頁。（三）四分位數(shù)和十分位數(shù)四分位數(shù)是將量表分成四等分，相當(dāng)于百分等級(jí)的25％、50％和75％對(duì)應(yīng)的三個(gè)百分分成的四段。十分位數(shù)也可以依此類推出，1％～10％為第一段，91％一100%為第十段。三、標(biāo)準(zhǔn)分常模標(biāo)準(zhǔn)分常模是將原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表。如z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)、標(biāo)準(zhǔn)九分?jǐn)?shù)、離差智商(IQ)等。常態(tài)化（一）線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)

z分?jǐn)?shù)為最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)：

z分?jǐn)?shù)的另一種形式：Z=A+Bz

（二）非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)（略）當(dāng)原始分?jǐn)?shù)不是常態(tài)分布時(shí)，也可以使之常態(tài)化，這一轉(zhuǎn)換過程就是非線性的。計(jì)算步驟如下：

1．對(duì)每個(gè)原始分?jǐn)?shù)值計(jì)算累積百分比；

2．在常態(tài)曲線面積表中，求出對(duì)應(yīng)于該百分比的z分?jǐn)?shù)。所得的z分?jǐn)?shù)可將分布分成幾部分，我們稱之為z`分?jǐn)?shù)，以區(qū)別由線性轉(zhuǎn)換所求得的z分?jǐn)?shù)。例如：T分?jǐn)?shù)=50+10z`四、智商及其意義

比內(nèi)—西蒙智力測(cè)驗(yàn)中用“心理年齡”（mentalage,簡(jiǎn)稱MA)來表示被試智力的高低。

計(jì)算方法例如：實(shí)際年齡7歲，心理年齡10歲實(shí)際年齡13歲，心理年齡10歲缺點(diǎn)：不同年齡兒童間無法比較。（一）比率智商

1916年，美國(guó)斯坦福大學(xué)推孟教授以比率智商（IQ）來表示測(cè)驗(yàn)的結(jié)果：

IQ=(MA/CA)*100例如：IQ=10歲/7歲*100=143IQ=10歲/13歲*100=77

缺點(diǎn)：

1、個(gè)體智力增長(zhǎng)是一個(gè)由快到慢再到停止的過程，即心理年領(lǐng)與實(shí)足年齡并不同步增長(zhǎng)。

2、不同年齡組兒童的比率智商分布情況不一樣，相同比率智商分?jǐn)?shù)在不同年齡就具有不同意義。（二）離差智商是一種以年齡組為樣本計(jì)算而得到的標(biāo)準(zhǔn)分?jǐn)?shù)，表示的是個(gè)體智力在年齡組中所處的位置。具體公式如下：

IQ=100+15z`=100+15（X-）/SD

在實(shí)際中，通常根據(jù)原始分?jǐn)?shù)在常模表上按其年齡直接查出智商。從不同測(cè)驗(yàn)獲得的離差智商只有當(dāng)標(biāo)準(zhǔn)差相同或接近時(shí)才可以比較。

以100為平均數(shù)不同標(biāo)準(zhǔn)差下每一IQ組距正態(tài)曲線下個(gè)案百分比:

百分?jǐn)?shù)分布分組分?jǐn)?shù)SD=12SD=14SD=15SD=16SD=18130以上0.71.62.23.15.1120-1294.36.36.77.58.5110-11915.21616.115.815.4100-10929.826.12523.62190-9929.826.12523.62180-8915.21616.115.815.470-794.36.36.77.58.570以下0.71.62.23.15.1總

計(jì)100100100100100

幾種導(dǎo)出分?jǐn)?shù)間的相互關(guān)系第三單元常模分?jǐn)?shù)的表示方法一、轉(zhuǎn)換表法（常模表）一個(gè)轉(zhuǎn)換表顯示出一個(gè)特定的標(biāo)準(zhǔn)化樣組的原始分?jǐn)?shù)與其相對(duì)應(yīng)的一個(gè)等值分?jǐn)?shù)—百分位、標(biāo)準(zhǔn)分?jǐn)?shù)、T分?jǐn)?shù)或者其它任何分?jǐn)?shù)。簡(jiǎn)單的轉(zhuǎn)換表，如表5-2。復(fù)雜的轉(zhuǎn)換表，如表5-3。二、剖面圖法剖面圖是將測(cè)驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來。第三節(jié)測(cè)驗(yàn)的信度第一單元信度的概念一、信度的定義信度是指同一被試者在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)（或用另一套相等的測(cè)驗(yàn)）重復(fù)測(cè)量，所得結(jié)果的一致程度。

信度只受隨機(jī)誤差的影響。系統(tǒng)誤差產(chǎn)生恒定效應(yīng)，不影響信度。隨機(jī)誤差：情緒、身體、環(huán)境等

系統(tǒng)誤差：測(cè)驗(yàn)等

X（實(shí)得分?jǐn)?shù)）=T（真實(shí)分?jǐn)?shù)）＋E（誤差）

S2X（實(shí)得分?jǐn)?shù)的方差）

=S2T（真分?jǐn)?shù)的方差）+S2E（誤差的方差）信度的理論定義：

rxx=S2T/

S2X

信度的操作定義：

rxx=（S2X-S2E）/S2X=1-S2E/S2X

二、信度的指標(biāo)（一）信度系數(shù)與信度指數(shù)信度是以信度系數(shù)為指標(biāo)，它是一種相關(guān)系數(shù)。常常是同一被試樣本所得的兩組資料的相關(guān)，理論上說就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值。

信度系數(shù)

信度指數(shù)(二)測(cè)量標(biāo)準(zhǔn)誤理論上，無數(shù)次測(cè)驗(yàn)，平均數(shù)就是這個(gè)人的真分?jǐn)?shù)，而標(biāo)準(zhǔn)差則為測(cè)量誤差的指標(biāo)。用一組被試兩次測(cè)量結(jié)果來代替同一個(gè)人的反復(fù)施測(cè)。信度的另一個(gè)指標(biāo)，測(cè)量的標(biāo)準(zhǔn)誤公式是：

SE為測(cè)量標(biāo)準(zhǔn)誤；Sx為所得分?jǐn)?shù)的標(biāo)準(zhǔn)差；rxx為相關(guān)系數(shù)第二單元信度評(píng)估的方法不同的信度反映測(cè)驗(yàn)誤差的不同來源一、重測(cè)信度（test—retestreliability），又稱穩(wěn)定性系數(shù)

間隔時(shí)間：2-4周，最好小于6個(gè)月優(yōu)點(diǎn)：能提供有關(guān)測(cè)驗(yàn)是否隨時(shí)間而變異的資料，可作為被試將來行為表現(xiàn)的依據(jù)。缺點(diǎn)：易受練習(xí)和記憶的影響二、復(fù)本信度(alternate-formreliability)，又稱等值性系數(shù)如果兩個(gè)復(fù)本的施測(cè)相隔一段時(shí)間，則稱重測(cè)復(fù)本信度或穩(wěn)定與等值系數(shù)。優(yōu)點(diǎn)：能夠避免重測(cè)信度的一些問題，如記憶效果、學(xué)習(xí)效應(yīng)等。缺點(diǎn)：

1、如果測(cè)量的行為易受練習(xí)的影響，則復(fù)本信度只能減少而不能完全消除這種影響；

2、已掌握的解題原則，可以遷移到同類問題中；

3、對(duì)于許多測(cè)驗(yàn)來說，建立副復(fù)本是十分困難的。三、內(nèi)部一致性信度（internalconsistencyreliability）主要反映的是題目之間的關(guān)系，表示測(cè)驗(yàn)?zāi)軌驕y(cè)量相同內(nèi)容或特質(zhì)的程度。

(一)分半信度(split—halfreliability)

計(jì)算分半信度常采用積差相關(guān)方法計(jì)算。分半法經(jīng)常會(huì)低估信度（在其他條件相同的情況下，測(cè)驗(yàn)越長(zhǎng)，信度越高），常采用斯皮爾曼—布朗公式修正：

斯皮爾曼一布朗公式為經(jīng)驗(yàn)公式，它的假設(shè)條件是兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)相等。當(dāng)假設(shè)不成立時(shí)，可采用弗朗那根(Flanagan)或盧倫(Kulon)公式直接求得測(cè)驗(yàn)的信度系數(shù)。(二)同質(zhì)性信度(homogeneityreliability)

同質(zhì)性主要代表測(cè)驗(yàn)內(nèi)部所有題目間的一致性。

1、庫德一理查遜公式：適用于答對(duì)一題記一分，答錯(cuò)無分的測(cè)題。常用的是K—R20公式，在各測(cè)題難度相同或近似的情況下，還可采用計(jì)算更為簡(jiǎn)便的K—R21公式。

2、克倫巴赫系數(shù)：適用于多重記分的測(cè)題。四、評(píng)分者信度（scorerreliability）用于測(cè)量不同評(píng)分者之間所產(chǎn)生的誤差。抽取若干份測(cè)驗(yàn)卷，由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分，然后再根據(jù)每份測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān)，即得評(píng)分者信度。

一般要求在成對(duì)的受過訓(xùn)練的評(píng)分者之間平均一致性達(dá)0.90以上，才認(rèn)為評(píng)分是客觀的。當(dāng)多個(gè)評(píng)分者評(píng)定多個(gè)對(duì)象，并以等級(jí)法紀(jì)分時(shí)，可采用肯德爾和諧系數(shù)（w）作為評(píng)分者信度的估計(jì)。

第三單元信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋一、解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)信度系數(shù)可以解釋為總的方差中有多少比例是由真實(shí)分?jǐn)?shù)的方差決定的，也就是測(cè)量的總變異中真分?jǐn)?shù)造成的變異占百分之幾，同時(shí)也告訴我們，測(cè)量的誤差比例是多少。二、確定信度可以接受的水平能力測(cè)驗(yàn)、成就測(cè)驗(yàn)信度系數(shù)可達(dá)到0.9—0.95；人格測(cè)驗(yàn)、興趣、態(tài)度、價(jià)值觀等測(cè)驗(yàn)的信度可達(dá)到0.8—0.85或更高一些。當(dāng)rxx<0.70時(shí)，測(cè)驗(yàn)不能用于對(duì)個(gè)人作出評(píng)價(jià)或預(yù)測(cè)，不能做團(tuán)體比較；當(dāng)0.70≤rxx<0.85時(shí)，可用于團(tuán)體比較；當(dāng)rxx≥0.85時(shí)，才能用來鑒別或預(yù)測(cè)個(gè)人成績(jī)或作為。新編的測(cè)驗(yàn)信度應(yīng)高于原有的同類測(cè)驗(yàn)或相似測(cè)驗(yàn)。三、解釋個(gè)人分?jǐn)?shù)的意義

信度有兩個(gè)作用：

1.估計(jì)真實(shí)分?jǐn)?shù)的范圍；

2.了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情形。測(cè)量標(biāo)準(zhǔn)誤可以通過第一次測(cè)驗(yàn)的結(jié)果及信度估計(jì)得到：

人們一般采用95％的或然水平，其置信區(qū)間為：例題：見353頁。

四、比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異比較：兩個(gè)人不同分?jǐn)?shù)的差別同一被試在兩個(gè)測(cè)驗(yàn)上的差別

兩個(gè)測(cè)驗(yàn)的標(biāo)準(zhǔn)差要求相同。第四單元影響信度的因素一、樣本特征

(一)樣本團(tuán)體異質(zhì)性的影響若獲得信度的取樣團(tuán)體較為異質(zhì)的話，往往會(huì)高估測(cè)驗(yàn)的信度，相反則會(huì)低估測(cè)驗(yàn)的信度。（二）樣本團(tuán)體平均能力水平的影響對(duì)于不同水平的團(tuán)體，題目具有不同的難度，每個(gè)題目在難度上的微小差異累積起來便會(huì)影響信度。二、測(cè)驗(yàn)長(zhǎng)度在一個(gè)測(cè)驗(yàn)中增加同質(zhì)的題目，可以使信度提高。第一，測(cè)驗(yàn)越長(zhǎng)，測(cè)驗(yàn)的測(cè)題取樣或內(nèi)容取樣就越有代表性。第二，測(cè)驗(yàn)越長(zhǎng)，被試的猜測(cè)因素影響就越小。假若我們希望用增加測(cè)驗(yàn)的方式提高測(cè)驗(yàn)的信度以達(dá)到某種理想值，通過斯皮爾曼—布朗公式的導(dǎo)出公式就可計(jì)算出最少應(yīng)增加的題數(shù)。例題見355頁三、測(cè)驗(yàn)難度難度對(duì)信度的影響，只存在于某些測(cè)驗(yàn)中。若測(cè)驗(yàn)對(duì)某團(tuán)體太難或太易，則分?jǐn)?shù)范圍將縮小，從而使信度降低。從理論上說，只有平均難度水平為50%時(shí)，才能使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大，求得的信度也最高。洛德（Lord)提出在學(xué)績(jī)測(cè)驗(yàn)中，為了保證其可靠性，各類選擇題的理想平均難度為：五擇一測(cè)題，0.70；四擇一測(cè)題，0.74；三擇一測(cè)題，0.77；是非題，0.85；四、時(shí)間間隔時(shí)間間隔只對(duì)重測(cè)信度和不同時(shí)測(cè)量時(shí)的復(fù)本信度（重測(cè)復(fù)本信度）有影響，對(duì)其余的信度來說不存在時(shí)間間隔問題。以再測(cè)法或復(fù)本法求信度，兩次測(cè)驗(yàn)相隔時(shí)間越短，其信度系數(shù)越大；間隔時(shí)間越久，其他變因介入的可能性越大，受外界的影響也越大，信度系數(shù)便越低。第四節(jié)測(cè)驗(yàn)的效度第一單元效度的概念一、效度的定義在心理測(cè)驗(yàn)中，效度是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度，或者簡(jiǎn)單地說，是指一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性。效度的定義也可以通過真分?jǐn)?shù)的概念和方差分析方法加以說明。

效度被定義二、效度的性質(zhì)（一）效度具有相對(duì)性任何測(cè)驗(yàn)的效度是對(duì)一定的目標(biāo)來說的，或者說測(cè)驗(yàn)只有用于與測(cè)驗(yàn)?zāi)繕?biāo)一致的目的和場(chǎng)合才會(huì)有效。

(二)效度具有連續(xù)性測(cè)驗(yàn)效度通常用相關(guān)系數(shù)表示，它只有程度上的不同，而沒有“全有”或“全無”的區(qū)別。效度是針對(duì)測(cè)驗(yàn)結(jié)果而言的。第二單元效度評(píng)估的方法一、內(nèi)容效度（content—relatedvalidity）（一）什么是內(nèi)容效度內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性，從而確定測(cè)驗(yàn)是否是所預(yù)測(cè)量的行為領(lǐng)域的代表性取樣。編制有較高內(nèi)容效度的心理測(cè)驗(yàn)，1.明確所測(cè)量的心理特性的概念，并劃定出與這種心理特性有關(guān)的行為。2.測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。3.要求內(nèi)容效度的測(cè)驗(yàn)，并不一定要求測(cè)驗(yàn)為同質(zhì)的。如智力測(cè)驗(yàn)。（二）內(nèi)容效度的評(píng)估方法1、專家判斷法內(nèi)容效度有時(shí)又稱“邏輯效度”（logicalvalidity）。使不同專家對(duì)測(cè)驗(yàn)的判斷一致的步驟：（1）定義好測(cè)驗(yàn)內(nèi)容的總體范圍，描述有關(guān)的知識(shí)與技能及所用材料的來源；（2）編制雙向細(xì)目表，確定內(nèi)容和技能各自所占的比例，并由測(cè)驗(yàn)編制者確定各題所測(cè)的是何種內(nèi)容與技能；（3）制定評(píng)定量表來測(cè)量測(cè)驗(yàn)的整個(gè)效度。2、統(tǒng)計(jì)分析法兩個(gè)評(píng)分者之間評(píng)定的一致性。內(nèi)容效度可由一組被試在獨(dú)立取自同樣內(nèi)容范圍的兩個(gè)測(cè)驗(yàn)副本上得分之相關(guān)來做估計(jì)。再測(cè)法也可用于內(nèi)容效度的評(píng)估。3、經(jīng)驗(yàn)推測(cè)法通過實(shí)踐來檢驗(yàn)效度（如對(duì)兒童發(fā)展量表的檢驗(yàn)）。（三）內(nèi)容效度的特性與所有效度的性質(zhì)一樣，不是普遍適用的，而是根據(jù)具體情況分析得來。與測(cè)驗(yàn)定義的使用者有關(guān)有時(shí)間上的特定性要區(qū)分內(nèi)容效度和表面效度；

最高行為的測(cè)驗(yàn)要求有較高的表面效度，典型行為測(cè)驗(yàn)卻要求較低的表面效度。二、構(gòu)想效度（construct-relatedvalidity）（一）什么是構(gòu)想效度（構(gòu)思效度、結(jié)構(gòu)效度）指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想或特質(zhì)的程度，即測(cè)驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想，解釋的程度如何。某一構(gòu)想的理論某一心理特質(zhì)的假設(shè)設(shè)計(jì)和編制測(cè)驗(yàn)，施測(cè)相關(guān)或因素分析，驗(yàn)證與理論假設(shè)的符合程度（二）構(gòu)想效度的估計(jì)方法1、對(duì)測(cè)驗(yàn)本身的分析這類方法是通過研究測(cè)驗(yàn)內(nèi)部結(jié)構(gòu)來界定理論構(gòu)想，從而為構(gòu)思效度提供證據(jù)。內(nèi)容效度可以作為構(gòu)思效度的證據(jù)。內(nèi)部一致性指標(biāo)：推斷測(cè)驗(yàn)是測(cè)量單一特制還是測(cè)量多種特質(zhì)。有時(shí)分析被試者對(duì)題目的反應(yīng)特點(diǎn)也可以作為構(gòu)思效度的證據(jù)。如果對(duì)測(cè)題的反應(yīng)包括了社會(huì)贊許和道德評(píng)判，不一定能反映被試者的行為，則影響構(gòu)思效度。2、測(cè)驗(yàn)間的相互比較通過分析幾個(gè)測(cè)驗(yàn)間的相互關(guān)系，找出其共同之處，進(jìn)而推斷這些測(cè)驗(yàn)測(cè)量的特質(zhì)，以確定這些測(cè)驗(yàn)構(gòu)思效度。相容效度(congruentvalidity）

：與其他測(cè)量同一構(gòu)思的測(cè)驗(yàn)有相關(guān)。其中一個(gè)是新測(cè)驗(yàn)，另一個(gè)是已有效度證據(jù)的成熟測(cè)驗(yàn)，兩者測(cè)量的是同一種心理特質(zhì)。假如相關(guān)高，說明新測(cè)驗(yàn)所測(cè)量的特質(zhì)確實(shí)是老測(cè)驗(yàn)所反映的特質(zhì)或行為。因?yàn)閮蓽y(cè)驗(yàn)的相關(guān)系數(shù)的平方即是兩組測(cè)驗(yàn)分?jǐn)?shù)所共同解釋的變異大小，所以稱這一相關(guān)為相容效度。

區(qū)分效度（discriminatevalidity）：必須與測(cè)量不同構(gòu)思的測(cè)驗(yàn)無相關(guān)。

因素分析法(factoranalysis)：可以找到影響測(cè)驗(yàn)分?jǐn)?shù)的共同因素。3、效標(biāo)效度的研究證明

一個(gè)測(cè)驗(yàn)若效標(biāo)效度理想，那么該測(cè)驗(yàn)所預(yù)測(cè)的效標(biāo)的性質(zhì)和種類就可以作為分析測(cè)驗(yàn)構(gòu)思效度的指標(biāo)?？梢愿鶕?jù)效標(biāo)選取不同的被試形成相對(duì)照的兩組；也可以根據(jù)測(cè)驗(yàn)分?jǐn)?shù)分成高分組與低分組。另一種證實(shí)構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。4、實(shí)驗(yàn)法和觀察法證實(shí)觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異也是驗(yàn)證構(gòu)思效度的方法。三、效標(biāo)效度(criterion—relatedvalidity)(一)什么是效標(biāo)效度（實(shí)證效度）效標(biāo)效度反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn)，簡(jiǎn)稱效標(biāo)。根據(jù)效標(biāo)資料是否與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得，又可分為同時(shí)效度和預(yù)測(cè)效度。前者與用來診斷現(xiàn)狀的測(cè)驗(yàn)有關(guān)（如心理特征的評(píng)估及診斷），后者與預(yù)測(cè)將來結(jié)果的測(cè)驗(yàn)有關(guān)（如用于選拔、分組的）。一個(gè)好的效標(biāo)必須具備以下條件（略）效標(biāo)必須能最有效地反映測(cè)驗(yàn)的目標(biāo)，即效標(biāo)測(cè)量本身必須有效；效標(biāo)必須具有較高的信度，穩(wěn)定可靠，不隨時(shí)間等因素而變化；效標(biāo)可以客觀地加以測(cè)量，可用數(shù)據(jù)或等級(jí)來表示；效標(biāo)測(cè)量的方法簡(jiǎn)單，省時(shí)省力，經(jīng)濟(jì)實(shí)用。例如：GRE的成績(jī)能預(yù)測(cè)將來能否取得學(xué)位，說明GRE能測(cè)量大學(xué)畢業(yè)生的專業(yè)基礎(chǔ)和能力。（二）效標(biāo)效度的評(píng)估方法效標(biāo)效度有多種評(píng)估方法，下面介紹3種常用的方法：1、相關(guān)法：測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)資料間的相關(guān)系數(shù)，稱為效度系數(shù)。

a.積差相關(guān)法：前者和后者都為連續(xù)變量

b.點(diǎn)二列相關(guān)法：連續(xù)變量和真正的二分變量二列相關(guān)法：連續(xù)變量和人為的二分變量

c.賈斯朋(Juspen)多系列相關(guān)法：連續(xù)變量和等級(jí)評(píng)定變量2、區(qū)分法：檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效的區(qū)分有效標(biāo)所定義的團(tuán)體的一種方法。計(jì)算公式如下：

問題：組間平均數(shù)差異在統(tǒng)計(jì)上的顯著性取決于團(tuán)體的大小。3、命中率法：當(dāng)測(cè)驗(yàn)用來做取舍的依據(jù)時(shí)，用其正確決定的比例作為效度指標(biāo)的一種方法。測(cè)驗(yàn)分?jǐn)?shù)：確定一個(gè)臨界分?jǐn)?shù)（即分?jǐn)?shù)線）。效標(biāo)資料：根據(jù)實(shí)際的工作或?qū)W習(xí)成績(jī)，確定一合格標(biāo)準(zhǔn)。

效標(biāo)成績(jī)

測(cè)驗(yàn)預(yù)測(cè)失?。ā┏晒Γ?）成功（+）（A）失誤（B）命中失敗（—）（C）命中（D）失誤

命中率的計(jì)算有兩種方法：

總命中率

正命中率第三單元效度的功能一、預(yù)測(cè)誤差效度系數(shù)的實(shí)際意義常常以決定性系數(shù)來表示，意旨相關(guān)系數(shù)的平方。它表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋的效標(biāo)的方差占總方差的比例。估計(jì)的標(biāo)準(zhǔn)誤。是指所有具有某一測(cè)驗(yàn)分?jǐn)?shù)的被試其效度分?jǐn)?shù)(Y)分布的標(biāo)準(zhǔn)差，也即預(yù)測(cè)誤差大小的估計(jì)值，是對(duì)真正分?jǐn)?shù)估計(jì)的誤差大小。二、預(yù)測(cè)效標(biāo)分?jǐn)?shù)在測(cè)驗(yàn)工作中，人們感興趣的是從測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)效標(biāo)成績(jī)，最常用的是Y對(duì)X的回歸方程：三、預(yù)測(cè)效率指數(shù)無關(guān)系數(shù)K值大小表明預(yù)測(cè)源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無關(guān)的程度。預(yù)測(cè)效率的指數(shù)E＝100（1－K）

E值大小表明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差。

例題見366頁。第四單元影響效度的因素

影響效度的因素很多，凡能產(chǎn)生隨機(jī)誤差和系統(tǒng)誤差的因素都會(huì)降低測(cè)驗(yàn)的效度。一、測(cè)驗(yàn)本身的因素

測(cè)驗(yàn)取材的代表性、測(cè)驗(yàn)長(zhǎng)度、試題類型、難度、區(qū)分度以及編排方式等都會(huì)影響效度。保證測(cè)驗(yàn)較高效度要點(diǎn)：測(cè)驗(yàn)材料必須對(duì)整個(gè)內(nèi)容具有代表性；測(cè)題設(shè)計(jì)時(shí)應(yīng)盡量避免容易引起誤差的題型(如是非題)；測(cè)題難度要適中，具有較高的區(qū)分度；測(cè)驗(yàn)長(zhǎng)度要恰當(dāng)，即要有一定的測(cè)題量；測(cè)題的排列按先易后難順序。二、測(cè)驗(yàn)實(shí)施中的干擾因素

(一)主試的影響因素測(cè)驗(yàn)實(shí)施過程中主試的因素會(huì)影響效度。必須按標(biāo)準(zhǔn)化的規(guī)定實(shí)施測(cè)驗(yàn)。效標(biāo)效度，測(cè)驗(yàn)與效標(biāo)二者實(shí)施時(shí)間間隔越長(zhǎng)，測(cè)驗(yàn)與效標(biāo)越容易受到很多機(jī)遇因素的影響。測(cè)驗(yàn)情境，如場(chǎng)地的布置、材料的準(zhǔn)備、測(cè)驗(yàn)場(chǎng)所有無噪音和其他干擾因素等也會(huì)影響到測(cè)驗(yàn)的效度。

(二)被試的影響因素

被試在測(cè)驗(yàn)時(shí)的興趣、動(dòng)機(jī)、情緒、態(tài)度和身心狀況、健康狀態(tài)以及是否充分合作與盡力而為等，都會(huì)影響被試在測(cè)驗(yàn)情境中的反應(yīng)，因而影響測(cè)驗(yàn)結(jié)果的效度。被試的反應(yīng)定勢(shì)也會(huì)降低測(cè)驗(yàn)的效度。三、樣本團(tuán)體的性質(zhì)測(cè)驗(yàn)的效度和樣本團(tuán)體的特點(diǎn)具有很大的關(guān)系。同一測(cè)驗(yàn)對(duì)于不同的樣本團(tuán)體其效度有很大的不同，因此在作效度分析時(shí)，必須選擇具有代表性的被試團(tuán)體。(一)樣本團(tuán)體的異質(zhì)性．與信度系數(shù)一樣，如果其他條件相同，樣本團(tuán)體越同質(zhì)，分?jǐn)?shù)分布范圍越小，測(cè)驗(yàn)效度就越低；樣本團(tuán)體越越異質(zhì)，分?jǐn)?shù)分布范圍越大，測(cè)驗(yàn)效度就越高。其中有兩種情況會(huì)影響樣本團(tuán)體的異質(zhì)性：

只以選拔上的被試為樣本團(tuán)體參加效度研究，降低了測(cè)驗(yàn)的效度。

選拔標(biāo)準(zhǔn)太高，樣本團(tuán)體的同質(zhì)性增加，降低了測(cè)驗(yàn)的效度。(二)干涉變量對(duì)于不同性質(zhì)的團(tuán)體，同一測(cè)驗(yàn)的效度會(huì)有很大的不同。這些性質(zhì)包括年齡、性別、教育水平、智力、動(dòng)機(jī)、興趣、職業(yè)和任何有關(guān)的特征。測(cè)量學(xué)上稱這些特征為干涉變量（moderatorvariable）。

美國(guó)心理學(xué)家吉賽利（E.E.Ghiselli）提出的如何找出干涉變量的方法：用回歸方程求得每個(gè)人的預(yù)測(cè)效標(biāo)分?jǐn)?shù)，將該分?jǐn)?shù)與實(shí)際效標(biāo)分?jǐn)?shù)相比較，獲得分?jǐn)?shù)D。如果D的絕對(duì)值很大，說明測(cè)驗(yàn)中可能存在干涉變量。根據(jù)本團(tuán)體的組成分析，找出對(duì)照組，分別計(jì)算效度，找出干涉變量。對(duì)于預(yù)測(cè)團(tuán)體，根據(jù)某些易見的干涉變量將其區(qū)分為預(yù)測(cè)性高和預(yù)測(cè)性低的兩個(gè)亞團(tuán)體。對(duì)于預(yù)測(cè)性高的團(tuán)體，獲得的測(cè)驗(yàn)效度會(huì)有所提高。

四、效標(biāo)的性質(zhì)

效標(biāo)效度是以測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)系數(shù)來表示的。效標(biāo)的性質(zhì)需要考慮：效標(biāo)與測(cè)驗(yàn)分?jǐn)?shù)之間的關(guān)系是否是線性關(guān)系效標(biāo)測(cè)量本身有可靠性第五節(jié)項(xiàng)目分析測(cè)驗(yàn)的項(xiàng)目分析：定性分析，包括考慮內(nèi)容效度，題目編寫的恰當(dāng)性和有效性等；定量分析，主要是對(duì)題目難度和區(qū)分度等進(jìn)行分析。通過項(xiàng)目分析，可以選擇和修改測(cè)驗(yàn)題目，以提高測(cè)驗(yàn)的信度和效度。第一單元項(xiàng)目的難度一、定義難度(difficulty)，是指項(xiàng)目的難易程度。能力測(cè)驗(yàn)---反映難度水平的指標(biāo)非能力測(cè)驗(yàn)---類似的指標(biāo)是“通俗性”難度的指標(biāo)：以答對(duì)或通過該題的人數(shù)百分比來表示：也稱易度：P值大小與難度高低成反比。難度的指標(biāo)：被試者未通過每個(gè)項(xiàng)目的人數(shù)百分比二、計(jì)算方法（一）二分法記分的項(xiàng)目選擇題，通過記1分，錯(cuò)誤記0分?？芍苯佑霉?—31計(jì)算難度。當(dāng)被試人數(shù)較多時(shí)，則可根據(jù)測(cè)驗(yàn)總成績(jī)將被試分成三組：分?jǐn)?shù)最高的27％被試為高分組，分?jǐn)?shù)最低的27％被試為低分組，中間46％的被試為中間組。分別計(jì)算高分組和低分組的通過率，以兩組通過率的平均值作為每一題的難度。其公式為：

為了平衡機(jī)遇對(duì)難度的影響，吉爾福特提出了一個(gè)難度的校正公式：（二）非二分記分的項(xiàng)目當(dāng)測(cè)驗(yàn)項(xiàng)目為問答題或不能用二分法記分的形式時(shí)，一般用下面的公式計(jì)算難度。三、難度水平的確定(一)項(xiàng)目的難度進(jìn)行難度分析的主要目的是為了篩選項(xiàng)目，項(xiàng)目的難度多高合適，取決于測(cè)驗(yàn)的目的、性質(zhì)以及項(xiàng)目的形式。當(dāng)測(cè)驗(yàn)用于選拔或診斷時(shí)，應(yīng)該比較多地選擇難度值接近錄取率的項(xiàng)目。選擇題P值一般應(yīng)大于概率水平，是非題難度為0.73，四選一為0.63較合適。（二）測(cè)驗(yàn)的難度測(cè)驗(yàn)的難度直接依賴于組成測(cè)驗(yàn)的項(xiàng)目的難度。通過考察測(cè)驗(yàn)分?jǐn)?shù)的分布，可以對(duì)測(cè)驗(yàn)的難度做出直觀檢驗(yàn)。A為正偏態(tài)分布，即大多數(shù)得分集中在低端，說明編制的測(cè)驗(yàn)對(duì)于所要研究的樣本團(tuán)夠來說偏難，因此必須增加較低難度的項(xiàng)目；B為負(fù)偏態(tài)分布，測(cè)驗(yàn)過易，必須增加有較高難度的項(xiàng)目。第二單元項(xiàng)目的區(qū)分度一、定義

項(xiàng)目區(qū)分度(itemdiscrimination)，也叫鑒別力，是指測(cè)驗(yàn)項(xiàng)目對(duì)被試的心理特性的區(qū)分能力。如果一個(gè)項(xiàng)目，實(shí)際水平高的被試能順利通過，而實(shí)際水平低的被試不能通過．那么我們就可以認(rèn)為該項(xiàng)目有較高的區(qū)分度。項(xiàng)目區(qū)分度是評(píng)價(jià)項(xiàng)目質(zhì)量和篩選項(xiàng)目的主要指標(biāo)，也是影響測(cè)驗(yàn)效度的重要因素。區(qū)分度取值范圍介于-1.00至+1.00之間。二、計(jì)算方法

在估計(jì)項(xiàng)目區(qū)分度時(shí)，常用其他指標(biāo)替代實(shí)際能力水平，其中用的最多的時(shí)測(cè)驗(yàn)總分。

（一）鑒別指數(shù)按測(cè)驗(yàn)總分高低排列答卷；確定高分組與低分組，每一組取答卷總數(shù)的27％分別計(jì)算高分組與低分組在該項(xiàng)目上的通過率或得分率按下列公式估計(jì)出項(xiàng)目的鑒別指數(shù)：

美國(guó)測(cè)驗(yàn)專家伊貝爾（L.Ebel）提出用鑒別指數(shù)評(píng)價(jià)項(xiàng)目性能的標(biāo)準(zhǔn)。如下表：(二）相關(guān)法計(jì)算區(qū)分度最常用的方法是相關(guān)法，即以某一項(xiàng)目分?jǐn)?shù)與效標(biāo)成績(jī)或測(cè)驗(yàn)總分的相關(guān)作為該項(xiàng)目區(qū)分度的指標(biāo)。點(diǎn)二列相關(guān)：適用與一類變量為二分稱名變量，另一類變量為連續(xù)變量的成對(duì)變量的相關(guān)計(jì)算。二列相關(guān)：適用于兩個(gè)連續(xù)變量，但其中一個(gè)變量被人為分成兩類。Φ相關(guān)法：適用于兩個(gè)變量均為二分稱名變量。三、區(qū)分度與難度的關(guān)系

如果每一個(gè)項(xiàng)目的難度均處于0.50，有可能大多趨向于有關(guān)的內(nèi)容或技能，結(jié)果造成項(xiàng)目同質(zhì)性提高。在極端的情況下，有可能50％的被試全部通過各項(xiàng)目得滿分，另外50％的被試全部為0分，形成U形分布，這樣反而降低總分的區(qū)分能力。如果測(cè)驗(yàn)的所有項(xiàng)目都是中等難度，只有項(xiàng)目的內(nèi)在相關(guān)為0時(shí)，整個(gè)測(cè)驗(yàn)才能產(chǎn)生常態(tài)分布?？紤]到一般測(cè)驗(yàn)項(xiàng)目之間具有某種程度的相關(guān)，難度的分布廣一些，梯度多一些，是合乎需要的。難度和區(qū)分度都是相對(duì)的，較難的項(xiàng)目對(duì)高水平的被試區(qū)分度高，較易的項(xiàng)目對(duì)水平低的被試區(qū)分度高，中等難度的項(xiàng)目對(duì)中等水平的被試區(qū)分度高。對(duì)被試總體較難或較易的項(xiàng)目，對(duì)水平高或水平低的被試便成了中等難度。

人的大多數(shù)心理特性呈常態(tài)分布，項(xiàng)目難度的分布也以常態(tài)分布為好，即特別難與特別易的項(xiàng)目少些，接近中等難度的項(xiàng)目多些，而所有項(xiàng)目的平均難度為0.50。這樣不僅能保證多數(shù)項(xiàng)目具有較高的區(qū)分度，而且可以保證整個(gè)測(cè)驗(yàn)對(duì)被試具有較高的區(qū)分能力。第六節(jié)測(cè)驗(yàn)的編制的一般程序第一單元測(cè)驗(yàn)的目標(biāo)分析一、測(cè)驗(yàn)的對(duì)象明確測(cè)驗(yàn)編成后要用于的團(tuán)體。應(yīng)了解受測(cè)者的年齡、受教育程度和社會(huì)經(jīng)濟(jì)以及閱讀水平等。在測(cè)驗(yàn)編制及建立常模過程中還應(yīng)考慮文化背景的影響。如韋氏智力測(cè)驗(yàn)，分城市式和農(nóng)村式。二、測(cè)驗(yàn)的用途明確測(cè)驗(yàn)的用途：描述、診斷，或是選拔和預(yù)測(cè)。用途不同，編制測(cè)驗(yàn)時(shí)的取材范圍以及試題難度等也不盡相同。根據(jù)測(cè)驗(yàn)的用途分類：顯示和預(yù)測(cè)。測(cè)驗(yàn)就有顯示性測(cè)驗(yàn)和預(yù)測(cè)性測(cè)驗(yàn)。(一)顯示性測(cè)驗(yàn)顯示性測(cè)驗(yàn)是指測(cè)驗(yàn)題目和所要測(cè)量的心理特征相似的測(cè)驗(yàn)。例如成就測(cè)驗(yàn)。顯示性測(cè)驗(yàn)（古德納夫）：樣本測(cè)驗(yàn)和標(biāo)記測(cè)驗(yàn)。題目取自一個(gè)很明確的總體的測(cè)驗(yàn)即是樣本測(cè)驗(yàn)，例如測(cè)量學(xué)生的四則混合運(yùn)算能力題目取自一個(gè)全開放的總體的測(cè)驗(yàn)即是標(biāo)記測(cè)驗(yàn)，例如智力測(cè)驗(yàn)。如果被試在智力測(cè)驗(yàn)上得分高，而且在實(shí)際生活中確實(shí)也很聰明，那么這個(gè)測(cè)驗(yàn)就算是智力的比較好的標(biāo)記，因?yàn)樗赋隽嘶驑?biāo)記了所取樣總體的性質(zhì)。(二)預(yù)測(cè)性測(cè)驗(yàn)預(yù)測(cè)性測(cè)驗(yàn)是指預(yù)測(cè)一些沒被測(cè)量的行為的測(cè)驗(yàn)。例如GRE中的詞匯測(cè)驗(yàn)，能預(yù)測(cè)被試將來在大學(xué)里的學(xué)業(yè)表現(xiàn)。編制預(yù)測(cè)性測(cè)驗(yàn)最關(guān)心的是測(cè)驗(yàn)分?jǐn)?shù)與預(yù)測(cè)行為之間的關(guān)系，要搞清楚哪些因素可以預(yù)測(cè)。顯示性測(cè)驗(yàn)和預(yù)測(cè)性測(cè)驗(yàn)的區(qū)分并不是絕對(duì)的，有時(shí)是統(tǒng)一的。如高考，是樣本測(cè)驗(yàn)，又是預(yù)測(cè)測(cè)驗(yàn)。三、測(cè)驗(yàn)的目標(biāo)心理測(cè)驗(yàn)的目標(biāo)是指編制的測(cè)驗(yàn)測(cè)量什么樣的心理變量或行為特征。目標(biāo)分析過程：測(cè)驗(yàn)編制者對(duì)測(cè)驗(yàn)?zāi)繕?biāo)加以分析，將其目標(biāo)轉(zhuǎn)換成可操作的術(shù)語。

目標(biāo)分析以測(cè)驗(yàn)不同而異，一般可分為三種情況：(一)工作分析對(duì)于選拔和預(yù)測(cè)功用的預(yù)測(cè)性測(cè)驗(yàn)，它的主要任務(wù)就是要對(duì)所預(yù)測(cè)的行為活動(dòng)作具體分析，我們稱之為任務(wù)分析或工作分析。這種分析包括兩個(gè)步驟：第一是確定：心理特征和行為-------要預(yù)測(cè)的活動(dòng)達(dá)到成功，如職業(yè)興趣測(cè)驗(yàn)中的打字項(xiàng)目，假定手指的靈活性、手眼協(xié)調(diào)等能力是打字必需的；證卷公司選錄入員。通過參閱前人的工作從理論上分析通過對(duì)已經(jīng)錄用或已經(jīng)成功的人員的行為分析確定測(cè)驗(yàn)的能力、技能或特質(zhì)--------選擇測(cè)量的題目。第二是建立衡量被試是否成功的標(biāo)準(zhǔn)，即效標(biāo)。是鑒別測(cè)驗(yàn)的預(yù)測(cè)能力是否有效的重要指標(biāo)。好經(jīng)理的標(biāo)準(zhǔn)：每天洗頭、刮胡子、衣著整齊、出門總開汽車，還是思路清晰、頭腦清醒、IQ為140？(二)對(duì)特定概念下定義定義要測(cè)量的心理或行為特質(zhì)-----包含的維量（行為表現(xiàn)或測(cè)量）。例如創(chuàng)造力的測(cè)量，有人將創(chuàng)造力定義為發(fā)散思維的能力，即對(duì)規(guī)定的刺激產(chǎn)生大量的、變化的、獨(dú)特的反應(yīng)。根據(jù)此操作定義，創(chuàng)造力則應(yīng)該從反應(yīng)的流暢性、靈活性、獨(dú)創(chuàng)性和詳盡性四個(gè)方面來測(cè)量。(三)確定測(cè)驗(yàn)的具體內(nèi)容顯示測(cè)驗(yàn)的目標(biāo)分析的主要任務(wù)是確定顯示的內(nèi)容和技能，從中取樣。成就測(cè)驗(yàn)的內(nèi)容分析過程主要體現(xiàn)在雙向細(xì)目表的編制過程中。這是一個(gè)由測(cè)量的內(nèi)容材料維度和行為目標(biāo)維度所構(gòu)成的表格，它能幫助成就測(cè)驗(yàn)的編制者決定應(yīng)該選擇哪些方面的題目以及各題目所占的比例。表5—8小學(xué)自然常識(shí)測(cè)驗(yàn)雙向細(xì)目表

行為目標(biāo)教材內(nèi)容獲得基本知識(shí)了解原理原則應(yīng)用原理原則分析因果關(guān)系綜合成有系統(tǒng)見解建立評(píng)價(jià)標(biāo)準(zhǔn)合計(jì)生物世界資源利用動(dòng)力和機(jī)械物質(zhì)特性與能量氣象宇宙地球3225222533645263483423123211210220110110002010122513128合計(jì)1828301383100第二單元測(cè)題的編寫編制測(cè)驗(yàn)題目涉及到從寫出、編輯，到預(yù)試、修改等這樣一個(gè)循環(huán)過程。在得到一套令人滿意的測(cè)題之前，這些步驟是不斷重復(fù)的。一、搜集資料測(cè)驗(yàn)計(jì)劃編好后，就要搜集有關(guān)資料作為命題取材的依據(jù)，一個(gè)測(cè)驗(yàn)的好壞和測(cè)驗(yàn)材料的選擇適當(dāng)與否有密切關(guān)系。題目的來源可分為三個(gè)方面：(一)已出版的標(biāo)準(zhǔn)測(cè)驗(yàn)從已經(jīng)出版的各種標(biāo)準(zhǔn)測(cè)驗(yàn)中選擇合適的題目。比如MMPI的簡(jiǎn)本；敵意量表，來自于MMPI；成就測(cè)驗(yàn)，題目可來源于課本、參考書、講義和課題討論等素材。(二)理論和專家的經(jīng)驗(yàn)理論和專家經(jīng)驗(yàn)有時(shí)也可以作為題目的來源之一，比如要編制態(tài)度量表，那么理論上不少對(duì)態(tài)度的類型、性質(zhì)維度、定義等等的描述就可以轉(zhuǎn)換成題目，或用具體的例子。(三)臨床觀察和記錄臨床觀察也可以作為題目的來源，各種觀察量表或檢核表很多都是來源于觀察到的行為表現(xiàn)，對(duì)于人格測(cè)驗(yàn)而言，其題目就是臨床上描述人格的術(shù)語或詞匯。比如MMPI的題目就是從病歷記錄中篩選出來的。二、命題的一般原則編制測(cè)驗(yàn)題目，類型繁多、功能各異、性質(zhì)不一，詳細(xì)說明每一種題目的具體編制方法實(shí)屬不能，但一般原則還是有的。這些原則可以從內(nèi)容、文字、理解和社會(huì)敏感性四個(gè)方面來考慮。(一)內(nèi)容方面要求題目的內(nèi)容符合測(cè)驗(yàn)的目的，避免貪多而亂出題目；內(nèi)容取樣要有代表性，符合測(cè)驗(yàn)計(jì)劃的內(nèi)容，比例適當(dāng)；題目間內(nèi)容相互獨(dú)立，互不牽連，切忌一個(gè)題目的答案影響對(duì)另一個(gè)題目的回答。(二)文字方面使用準(zhǔn)確的當(dāng)代語言，避免使用生僻的字句或詞匯；語句要簡(jiǎn)明扼要，既排除與答案無關(guān)的因素，又不要遺漏答題所依據(jù)的必要條件；一句話說明一個(gè)概念，不要使用兩個(gè)或兩個(gè)以上的觀念，意義必須明確，不得暖昧或含糊，盡量少使用雙重否定句。(三)理解方面題目應(yīng)有確切的答案，除創(chuàng)造力測(cè)驗(yàn)和人格測(cè)驗(yàn)外不應(yīng)具有引起爭(zhēng)議的可能；題目的內(nèi)容不要超出受測(cè)團(tuán)體的知識(shí)水平和理解能力；題目的格式要不被人誤解。(四)社會(huì)敏感性方面應(yīng)盡量避開社會(huì)敏感性問題（性關(guān)系、性觀念及自殺等），如涉及社會(huì)禁忌或個(gè)人隱私的題目不應(yīng)使用。編制涉及這類社會(huì)敏感性問題測(cè)驗(yàn)的策略(Phillips，D．L．)：1．命題時(shí)假定被試具有某種行為，使他不得不在確實(shí)沒有該行為時(shí)才否定，可避免否定答案過多的傾向。如：“你平均多久才手淫一次，每月一次?每周一次?每天一次?從不?”2．命題時(shí)假定規(guī)范不一致，如“有些醫(yī)生認(rèn)為吸煙有害，而另一些醫(yī)生則認(rèn)為吸煙有益，你認(rèn)為呢?”3．指出該行為是常見的，雖然是違規(guī)的，如“多數(shù)人在看色情電影時(shí)有性沖動(dòng)，你呢?”三、測(cè)題的編制要領(lǐng)根據(jù)對(duì)被試的要求不同對(duì)心理測(cè)驗(yàn)的題目進(jìn)行分類：提供型和選擇型題目。提供型題目給出正確答案，如論文提、問答題、填充題。選擇型題目要求在有限的幾個(gè)答案中選擇正確的答案，如選擇題、是非題、匹配題等。(一)選擇題題干就是呈現(xiàn)一個(gè)問題的情境，一般由直接問句或不完全的陳述句構(gòu)成。選項(xiàng)就是問題的多種可能答案，常常是包含一個(gè)正確答案，若干(一般是1-5個(gè))錯(cuò)誤答案，其中錯(cuò)誤的答案叫“誘答”，是為了迷惑那些無法確定答案的被試。1．題干所提的問題必須明確，盡量使用簡(jiǎn)單而且明晰的詞語。做到題干意義完整，即使被試不看選項(xiàng)亦能完全理解。不要在題干中夾有選項(xiàng)，或者摻有不切題的內(nèi)容。2．選項(xiàng)切忌冗長(zhǎng)，要簡(jiǎn)明扼要。選項(xiàng)中共同用到的詞語刪掉，放到題干中去，可使題意更明確，同時(shí)減少被試看題時(shí)間。3．每題只給一個(gè)正確答案，其他屬誘答。若是找最合適的答案，則應(yīng)用這樣的問句：“下列答案中哪個(gè)最合適?”以免引起困惑。4．各選項(xiàng)長(zhǎng)度應(yīng)相等，盡量不要有長(zhǎng)有短。同時(shí)，選項(xiàng)與題干的聯(lián)系要非常密切。誘答也必須一致，以免被試很容易就排除了誘答項(xiàng)目。5．避免題干用詞與選項(xiàng)用詞一致，否則成了選擇答案的線索。正確答案有修飾用語或用正規(guī)的詞語，而誘答選項(xiàng)均沒有，也會(huì)給被試提供線索，應(yīng)避免?！皼Q不”、“從來”、“所有”、“惟一”、“絕對(duì)”等詞，不適用于選項(xiàng)中。6．選項(xiàng)最好用同一形式。如同是人名，同是日期，同是物理現(xiàn)象等等，長(zhǎng)度最好相等。選項(xiàng)的排列最好隨機(jī)，除非本身有邏輯順序。(二)是非題是非題又叫正誤題，是指出一個(gè)論點(diǎn)要被試判斷是否正確，或是從是非兩個(gè)答案做出選擇，因此可以把是非題看作是兩個(gè)備選答案的選擇題。例：(1)你常常會(huì)主動(dòng)地去做一些有意義的習(xí)題嗎?是□否□

(2)你常常主動(dòng)給朋友寫信或打電話嗎?是□否□編制是非題應(yīng)注意：1．內(nèi)容應(yīng)以有意義的概念、事實(shí)或基本原則為基礎(chǔ)，不要在敘述中出現(xiàn)瑣碎的細(xì)節(jié)或無關(guān)的話語，不要照抄原文。2．每道題只能包含一個(gè)概念，避免兩個(gè)或兩個(gè)以上的概念出現(xiàn)在同一個(gè)題目中，造成“半對(duì)半錯(cuò)”或“似是而非”的情況。3．盡量避免否定的敘述，尤其是要避免用雙重否定的敘述。因?yàn)榉穸ǖ臄⑹龀?huì)被人誤認(rèn)為是肯定的敘述，將“不”字忽略，雙重否定尤其容易使人困惑，不如直接采用肯定的敘述為佳。4．若是表達(dá)意見的題目，最好說明意見的來源和根據(jù)，以便測(cè)出被試是否了解某個(gè)人或某些人的意見、信念或價(jià)值觀念等。5．“是”、“非”題的數(shù)目應(yīng)有適應(yīng)比例，基本相等，且要隨機(jī)排列。“是”、“非”題目的編寫在長(zhǎng)度和復(fù)雜性上應(yīng)盡量保持一致。(三)簡(jiǎn)答題簡(jiǎn)答題是提供型題目，它要求被試用一個(gè)正確的詞或句子來完成或填充一個(gè)未完成句子的空白，或者是提供一個(gè)正確的答案。有時(shí)將前者稱之為填充題，后者稱之為簡(jiǎn)答題。例：世界上第一個(gè)智力測(cè)驗(yàn)是由

與

編制的。(填充題)夏天為什么要穿淺顏色的衣服，不穿深顏色的衣服?(簡(jiǎn)答題)編制簡(jiǎn)答題有三條原則：1．宜用問句形式。

人人文庫> 全部分類> 專業(yè)文獻(xiàn) > 醫(yī)學(xué)資料

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第五章：心理測(cè)量學(xué)知識(shí)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第五章：心理測(cè)量學(xué)知識(shí)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔