心理測量學電子教案

上傳人：浪*** IP屬地：河北上傳時間：2024-05-02 格式：PDF 頁數(shù)：109 大小：10.36MB 積分：12 舉報 版權申訴

已閱讀5頁，還剩104頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

心理測量學

Psychological

Testing

課程說明

（一）課程性質

本課程適合于大學本科心理學、教育科學等專業(yè)的本科生及研

究生教育。本課程的學習將有助于實驗設計、教育評價、心理與

教育統(tǒng)計學等學科的學習，是培養(yǎng)學生科學研究及掌握研究方法

的基礎性學科。

（二）教學目的

通過學習，要求學生掌握心理測量的基本知識、心理測量的編制

和實施、以及良好測量所要求具備的基本條件。更重要的是，通

過本課程的學習要使學生熟練掌握不同心理測量的實際應用。

（三）教學內容

本課程的主要教學內容有：心理測量的基本內涵及其評價和測量

的一般步驟和方法兩部分。內容涉及一般測量解析，測量的要素

及量表類型，測驗信、效度、難度和區(qū)分度，測量的一般步驟和

方法，智力測驗、人格測驗等心理測驗，以及心理測量的綜合應

用和心理測量理論的新發(fā)展等內容。

（四）教學時數(shù)

54個課時

（五）教學方式

課堂教學與實踐應用相結合。

第一編心理測量的基本內涵及其評價

第一章緒論

教學要點：

通過本章的學習，了解測量的基本性質及其要素，測量量表的四種

水平，心里測量的本質、基本條件及功能，心里測量的發(fā)展以及心

理測量的道德準則等內容，對心理測量有一個概括化的了解。

教學時數(shù)：［10學時］

教學內容：

一、一般測量解析

1.測量(Measurement)概論

2.測量的分類

3.心理測量的種類

(1)以測量對象來分，(2)以測量的目的來分，(3)以測量的方式

來分類，(4)以項目結構或組成形式來分，(5)按評價參照的

標準分類

4.測量與測驗(Test)、考試(Examination)>評價(Evaluation)聯(lián)系

與區(qū)別

二、測量的要素及量表類型

1.測量的要素

識記：單位(Unit),參照點(ReferencePoint),量表(Scale)

2.量表類型

(1)稱名量表

稱名變量只說明某一事物與其他事物在名稱、類別或屬性上的不

同，并不說明事物與事物之間差異的大小、順序的先后及質的優(yōu)

劣。

(2)順序變量

順序變量是指可以就事物的某一屬性的多少或大小按次序將各

事物加以排列的變量，具有等級性和次序性的特點。

(3)等距變量

等距變量除能表明量的相對大小外，還具有相等的單位。

(4)比率變量

比率變量除了具有量的大小、相等單位外，還有絕對零點。

三、心理測量的本質、基本條件及功能

1.心理測量的本質

2.編制心理測驗的基本條件

3.心理測量的功能

(1)理論研究功能，(2)實際應用功能

四、心理測量發(fā)展簡史

1.主觀經驗性考試階段(1864年以前)

2.客觀標準化測驗階段(1864年一1940年)

3.觀測驗的深入發(fā)展階段(1940年一)

4.西方心理測量的發(fā)展

5.心理測驗在我國的發(fā)展

五、心理測量的道德準則

1.心理測量工作者的素質要求

(1)心理測量工作的知識結構.(2)對心理測量的態(tài)度

2.心理測量工作者的道德準則

(1)測驗的保密和控制原則(2)測驗中個人隱私的保護

考核要求：

1.心理測量的種類

2.測量與測驗(Test)、考試(Examination)、評價(Evaluation)聯(lián)系

與區(qū)別

3.測量的要素及量表類型

單位，參照點，量表，稱名量表，順序變量，等距變量，比率變量

4.心理測量的本質、基本條件及功能

5.心理測量發(fā)展簡史

第二章經典測驗理論的基本假設

教學要點：

通過本章的學習，掌握經典測驗理論的基本假設，心里特之及其

特性，心里測量的誤差和種類，以及真分數(shù)的含義等內容。

教學時數(shù)：［6學時］

教學內容：

一、心理特質(Trait)及其可測性假設

1.經典測驗(ClassicalTestTheory,CTT)理論

2.特質假設

二、測量誤差及其來源

1.測量誤差的含義

2.誤差種類

識記：隨機誤差，系統(tǒng)誤差

3.誤差來源

（1）來自心理測量工具，（2）來自測量對象，（3）來自實測過程

二、真分數(shù)模型及其假設

1.真分數(shù)的含義

2.真分數(shù)數(shù)學模型解析

領會：（1）幾個推理，（2）CTT的基本含義，（3）CTT的基本公式

3.經典測驗理論的不足

考核要求：

1.心理特質（Trait）及其可測性假設

2.測量誤差及其來源

3.真分數(shù)模型及其假設

4.經典測驗理論的不足

第三章測驗信度

教學要點：

通過本章的學習，掌握信度的意義，信度系數(shù)的計算，了解影響

信度的主要因素以及提高信度的常用方法等內容。

教學時數(shù)：［4學時］

教學內容:

一、信度的意義

1.信度指實測值和真值相差的程度

2.信度指統(tǒng)計量與參數(shù)之間的接近程度

3.信度是指一種測驗對相同的應試者再次測驗時引起同樣反應的程

度

二、信度系數(shù)的計算

1.穩(wěn)定性系數(shù)

2.等值性系數(shù)

3.等值穩(wěn)定性系數(shù)

4.內部一致性系數(shù)

5.評分者的信度系數(shù)

三、提高測驗信度的方法

1.信度系數(shù)以多大為宜

2.影響信度的因素

3.提高測驗信度的方法

考核要求：

1.信度的意義

2.信度系數(shù)的計算

識記：穩(wěn)定性系數(shù)，等值性系數(shù)，等值穩(wěn)定性系數(shù)，內部一致性系

數(shù)，評分者的信度系數(shù)

3.提高測驗信度的方法

請列舉一些你所使用過或接觸過的量表

思考：量表的作用是什么？

你如何解釋下述現(xiàn)象？

一個很聰明的孩子，測得智商是80分

一個學習很好的學生，考試成績?yōu)?0分

一個人緣很好的人，人際關系測量低于常模值

量表幫助我們了解心理現(xiàn)象（心理特質），就像尺子幫助我們測量身

高。

思考:我們如何知道我們有多高？

有兩個工具：尺子/秤

尺子的數(shù)據(jù)與我們的目測更一致，而秤盤的數(shù)據(jù)則與我們的目測不一

致。因此，尺子是測量身高的有效工具一效度。

什么材料的尺子？一鋼鐵（熱脹冷縮）

涉及到一致性的問題。一信度

?物理不等于數(shù)學

?1.70與1.7的關系

?總結：量表是我們用來了解心理特質的工具，但這個工具是有誤

差的。誤差要控制在一個許可的范圍內。

?什么是誤差？

?誤差的種類？

?誤差是在測量中與目的無關的變因所產生的不準確或不一致的效

應。

?誤差分為隨機誤差和系統(tǒng)誤差。

?高爾頓的智力觀

?比奈的智力觀

?判斷題、選擇題和問答題

?SX2=ST2+SE2

ST2=SV2+SI2

SX2=SV2+SI2+SE2

?穩(wěn)定性\可靠性\一致性

?信度乃是一個被測團體真分數(shù)的變異數(shù)與實得分數(shù)的變異數(shù)之

比。

?rXX=ST2/SX2

?信度乃是一個被測團體真分數(shù)與實得分數(shù)的相關系數(shù)的平方。

?rXX=P2TX

?思考：相關系數(shù)的平方？

?信度乃是一個測驗X與它的任意一個平行測驗X，的相關系數(shù)。

?rXX=PXXz

?重測信度(論st-RetestReliability)

?定義：同一量表，同一被試群體，在不同時間，兩次施測，求其

相關。

?實質：表示測驗結果的穩(wěn)定性。故稱之為穩(wěn)定性系數(shù)

(CoefficientofStability)

?形式：施測一適當時間一再施測

?間隔時間越長，穩(wěn)定性系數(shù)越低。適宜時間間隔依照測驗目的、

性質及被試特點而定。幾分鐘至幾年。

?年幼兒童，間隔要??；年長群體，間隔可大。智力測驗的間隔不

能太短，成就測驗的間隔不能太長。

?一般間隔時間不超過六個月。（即不能讓被試記住上一次測驗的內

容，又不能讓其特質發(fā)生變化，或對所學知識產生遺忘）

?在一般情況下，間隔施測的副本信度最低，因為很多因素有機會

影響到分數(shù)。相反，校正過的分半相關，因為影響的因素少，所得

的信度估計為最高。

?實際上，有多少種誤差來源，便有

?多少種估計信度的方法。一個測驗哪種誤差大，便應該用哪種誤

差估計。有時一個測驗需要有幾種信度系數(shù)，這樣我們就把總分數(shù)

的變異數(shù)分成不同的分支。

?假設對100個六年級學生以兩個月的時間間隔先后施測一個創(chuàng)造

力測驗的A\B兩個復本，所得的等值性與穩(wěn)定性系數(shù)為0.70。我

們還根據(jù)被試對每個復本的反應計算出分半信度為0.80（先計算

每個復本的分半相關系數(shù)。將二者平均后再用斯皮爾曼-布朗公式

校正）。同時，我們讓另一個評分者隨機抽取50份卷子另外評分,

得到評分者信度為0.92。然后，我們對這三種方法所產生的誤差

變異進行分析。

一個假想測驗的誤差變異來源分析

信度類型誤差變異量誤差變異來源

復本信度（間隔施測）1-0.70=0.30時間與內容取樣

分半信度1-0.80=0.20內容取樣

上述二者差異0.30-0.20=0.10時間取樣

評分者信度1-0.92=0.08評分者差異

誤差變異總和0.20+0.10+0.08=0.38

真實變異1-0.38=0.62

一個假想測驗的誤差變異來源分析

真實變異誤差變異

時間上的穩(wěn)定性,復本之間的一致性,評分者之間的一致性

時間取樣誤差內容取樣誤差評分者間差異

62%20%10%8%

第四章測驗的效度

教學要點：

通過本章的學習，掌握效度的含義，效度估計方法，了解影響信度

與效度的關系，影響效度的因素以及提高信度的幾種方法等內容。

教學時數(shù)：［10學時］

教學內容：

一、效度概述

1.效度的一般定義及其內涵

效度是指測驗的準確性，即測驗能夠測出他們所欲測的特質的程度。

2.效度的統(tǒng)計與原理

3.效度的信度關系

(1)高效度，高信度(2)高信度，低效度(3)低信度，低效度

二、效度的估計

1966年美國心理學會在《教育心理測驗值標準》中將效度分為三大

類：

1.內容效度(ContentValidity)

內容效度指測驗實際測到的內容與所要測量的內容之間的吻合程度。

2.結構效度(ConstructValidity)

結構效度是指測驗對于被稱作構想的某一理論概念或特質測量的程

度。

3.實證效度(CriterionrelatedValidity)

實證效度是指一個測驗對處于特定情景中的個體的行為進行估計的

有效性。

三、提高測量效度的方法

1.各種測量效度的要求

2.提高效度的方法

(1)控制系統(tǒng)誤差，(2)精心編制量表，(3)妥善組織測驗，

(4)擴充樣本容量，(5)適當增加測驗的長度

3.效度的一般定義及其內涵

效度是指測驗的準確性，即測驗能夠測出他們所欲測的特質的程

度。

4.效度的統(tǒng)計與原理

5.效度與信度的關系

（1）高效度，高信度（2）高信度，低效度（3）低信度，低效度

四、效度的估計

1966年美國心理學會在《教育心理測驗值標準》中將效度分為三

大類：

1.內容效度（ContentValidity）

內容效度指測驗實際測到的內容與所要測量的內容之間的吻合程

度。

2.結構效度（ConstructValidity）

結構效度是指測驗對于被稱作構想的某一理論概念或特質測量的

程度。

3.實證效度（CriterionrelatedValidity）

實證效度是指一個測驗對處于特定情景中的個體的行為進行估計

的有效性。

五、提高測量效度的方法

1.各種測量效度的要求

2.提高效度的方法

（1）控制系統(tǒng)誤差，（2）精心編制量表，（3）妥善組織測驗，（4）

擴充樣本容量，（5）適當增加測驗的長度

考核要求：

1.效度的一般定義及其內涵

2.效度的統(tǒng)計與原理

3.效度與度的信度關系

4.效度的估計

內容效度，結構效度，實證效度

5.提高測量效度的方法

第五章測驗的難度和區(qū)分度

教學要點：

通過本章的學習，掌握測驗難度和區(qū)分度的含義，以及難度、區(qū)分

度的計算，了解難度、區(qū)分度對測驗質量的影響等內容。

教學時數(shù)：［10學時］

教學內容：

一、測驗難度的計算

1.計算難度的基本公式

(1)以試題通過率計算難度：P=R/N,(2)用平均數(shù)計算試題的

難度

2.用極端分組法計算難度

二、難度的轉換

難度轉換的方法

三、測驗題目難度水平的確定

四、區(qū)分度的定義

1.定義：區(qū)分度是指測驗對于考生實際水平的區(qū)分度程度或鑒別

能力。

2.區(qū)分度與測驗信度、難度的關系

五、區(qū)分度計算

1.極端分組法計算

(1)客觀題計算，(2)論文題計算

2.用內部一致性系數(shù)(InternalConsistency)計算區(qū)分度

(1)用點二列相關計算區(qū)分度

(2)用二列相關計算區(qū)分度

(3)用①相關計算區(qū)分度

(4)用四分相關計算區(qū)分度

(5)用皮爾遜相關法計算區(qū)分度

(6)D(鑒別指數(shù))的經驗標準

考核要求：

1.測驗難度的計算

2.計算難度的基本公式

3.難度的轉換

4.測驗題目難度水平的確定

5.區(qū)分度的含義

6.區(qū)分度與測驗信度、難度的關系

7.區(qū)分度計算

用極端分組法計算，用內部一致性系數(shù)(InternalConsistency)

計算區(qū)分度

第二編測量的一般步驟和方法

第六章測驗的編制與實施

教學要點：

通過本章的學習，掌握編制測驗的基本程序，測驗的實施過程及須

注意的事項等內容。

教學時數(shù)：［10學時］

教學內容：

第一節(jié)編制心理與教育測驗的基本程序

一、確定測驗的目的

1.明確測量對象

2.明確測量目標

3.明確測量用途

二、制定編題計劃

三、編輯測驗項目

1.收集測驗資料

2.選擇項目形式

3.編寫測驗項目

四、測驗與項目分析

1.預測

2.項目分析

五、合成測驗

1.測驗項目的選擇

2.測驗項目的編排

3.編制副本

六、測驗標準化

1.測驗內容

2.實測過程

3.測驗評分

4.測驗分數(shù)解釋

七、鑒定測驗

1.信度

2.效度

3.測驗量表與常模

八、編寫測驗說明書

第二節(jié)測驗的實施

一、測驗的實施過程

1.實測前的準備工作

2.指導語

3.測驗情境

4.測驗焦慮

5.與受測者建立良好的協(xié)調關系

6.評分技術

二、測驗分數(shù)的解釋

1.如何看待測驗分數(shù)的意義

2.如何向受測者報告測驗分數(shù)

考核要求：

1.編制測驗的基本程序

確定測驗的目的，制定編題計劃，編輯測驗項目，測驗與項目分

析，合成測驗，測驗標準化，鑒定測驗，編寫測驗說明書

2.測驗的實施過程及須注意的事項等內容

3.測驗分數(shù)的解釋

第七章測驗分數(shù)的解釋與應用

教學要點：

通過本章的學習，掌握測驗分數(shù)的類型，常模及常模類型，以及測驗

分數(shù)的解釋和常模的應用等內容。

教學時數(shù)：［4學時］

教學內容：

一、分數(shù)與常模

1.分數(shù)的種類和含義

識記：（1）原始分數(shù)，（2）導出分數(shù)

2.常模

3.年齡常模

4.年級常模

5.百分等級常模

6.標準分數(shù)常模

二、測驗的等值

1.測驗等值的實質

2.測驗等值的條件

（1）同質性，（2）等信度，（3）公平性，（4）可遞推性，

（5）對稱性，（6）樣本不變性

3.測驗等值的基本算法

識記：（1）百分位等值（2）線性等值

4.常用等值設計

5.測驗等值誤差估計

考核要求：

1.分數(shù)

原始分數(shù)，導出分數(shù)

2.常模

年齡常模，年級常模，百分等級常模，標準分數(shù)常模

3.測驗的等值的實質與條件

4.測驗等值的基本算法：百分位等值，線性等值

第八章測驗的項目分析

項目分析包括定性分析和定量分析。定性分析包括考慮內容效度、

題目編寫的恰當性和有效性等；定量分析主要是指題目難度和區(qū)分

度的測量。

對項目進行篩選和修訂，可以提高測驗的信度和效度。

第一節(jié)測驗的難度

一、難度（difficulty）的意義

難度，指項目的難易程度。

在最高作為測驗中，稱為''難度〃，而在典型作為測驗中，則指''通

俗性〃。兩者都是指在總體中，能夠正確或確切回答某項目的人數(shù)。

二、難度的計算

（一）二分法記分項目的難度

1.通過率

P=R/N

2.極端分組法（上下27%）

P=（PH+PL）/2

（二）非二分法記分項目的難度

P=X/Xmax

X為所有被試在該項目上的平均得分，Xmax為該項目的滿分。

三、測驗難度水平的確定

§效標參照測驗、掌握測驗：不考慮難度；

§選拔測驗：難度=錄取率；

§對于選擇題來說，難度一般應大于猜測概率；

§無論是速度測驗，還是難度測驗，一般都應防止被試得滿分，因

為滿分的意義是不明確的。

大體而言，難度為0.50時最理想，此時項目具有最大的鑒別力。

但在實際操作中，讓所有項目難度都到達0.50困難很大，而且也

不必要，一般只需使項目的平均難度接近0.50,而各個項目的難

度在0.50土0.20之間變化。

四、難度的等距變換

根據(jù)正態(tài)分布表，將難度P作為正態(tài)曲線下的面積，轉換成相應的

Z分數(shù)，這就是等距量表。

PY0Z

美國教育服務中心以△作為難度指標：

△=13+4Z

P=.0013Z=+3△=25

P=.16Z=+1△=17

P=.50Z=0△二13

P=.84Z=-1△=9

P=.9987Z=-3△=1

五、難度對測驗的影響

（一）測驗難度影響測驗分數(shù)的分布形態(tài)

§難度大，正偏態(tài)

§難度低，負偏態(tài)

（二）測驗難度影響測驗分數(shù)的離散程度

測驗過難或過易，分數(shù)全距縮小，信度降低。P=0.50時最佳

第二節(jié)測驗的區(qū)分度

一、區(qū)分度的意義

區(qū)分度（discrimination）是指測驗項目對被試心理品質水平差異的

區(qū)分能力或鑒別能力。

項目的區(qū)分度是測驗是否有效的''指示器〃。

二、區(qū)分度的計算

（一）項目鑒別指數(shù)法

1.鑒別指數(shù)（indexofdiscrimination,D）的計算

D=PH-PL

取值范圍：+1

2.極端組的劃分

27%規(guī)則

一般情況下，取上下25%~33%均可。

樣本少時，可以取50%

注意：

由于計算機的方便使用，可以上下50%作為劃分高低組的標準，或

者多分凡組，對區(qū)分度和難度作詳細分析。因為只取上下兩端，只

利用了一部分資料，浪費了很多信息，有可能得出錯誤結論。

（二）相關法（項目-總分相關）

1.點二列相關

Xp-Xq

rpb=VpqSt

2.二列相關

Xp-XqpqXp-Xtp

rb=

或rb=StSt

3.(p相關

ad-bc

r(p=

V(a+b)(c+d)(a+c)(b+d)

4.四分相關

5.項目和總分相關重疊的校正

當測驗項目超過20個項目時，校正法通常毫無意義。

rtpSt-Sprpq=VSt2+Sp2-2rtpStSp

(三)項目特征曲線(itemcharacteristiccurve,ICC)

項目特征曲線描述了效標分數(shù)不同的被試在該項目上的通過率。

曲線坡度越陡，鑒別力越好，預測的誤差越小。

三、區(qū)分度與難度的關系

難度和區(qū)分度都是針對一定團體而言的。

一般來說，較難的項目對高水平被試區(qū)分度高，較易的項目對

低水平被試的區(qū)分度高。

四、區(qū)分度的相對性

(一)不同的計算方法，所得區(qū)分值不同

區(qū)分度有幾種計算方法？

(二)樣本容量大小影響相關法區(qū)分度值的大小

樣本越大，區(qū)分度越……

(三)分組標準影響鑒別指數(shù)

分組越極端，區(qū)分度越……

（四）被試樣本的同質性程度影響區(qū)分度值的大小

樣本越同質，區(qū)分度越……

第三節(jié)項目分析的特殊問題

一、多重選擇題的項目分析（誘答分析）

對于多重選擇題，除了分析難度和區(qū)分度外，還要對每個選項進行

分析。

下列哪一個最有可能是偏執(zhí)型精神分裂癥患者的次級癥狀：

A幻聽

B癱瘓

C記憶喪失

D厭食

§如果所有被試都選擇某一正確的選項，說明該選項……

§如果沒有一個被試選擇某個錯誤選項，說明該選項……

§如果所有被試都選擇某個錯誤選項，說明該選項……

§如果高分組被試的選擇集中在兩個選項上，說明該選項……

§如果高分組和低分組對正確選項的選擇沒有區(qū)別，說明該選項……

§如果所有被試都未回答某個題目，說明該題……

§如果選擇各個選項的人數(shù)幾乎相等，說明該題……

二、速度測驗的項目分析

§對前面部分的測驗項目，難度和區(qū)分度都……

§對后面部分的測驗項目，難度和區(qū)分度都……

三、標準參照測驗的項目分析

§在標準參照測驗中，無須考慮項目的難度和區(qū)分度，只要項目的內

容很重要就行。

§也可以通過比較教學或訓練的前測和后測結果來進行項目分析，用

來說明教學或訓練的效果以及項目編制是否適當。

四、項目-團體的相互作用

§具有不同性質（性別、種族、職業(yè)等）的團體，在測驗得分上也

存在差異，即同樣的項目可能有不同的難度。

§如果測驗要求對所有個體都相對''公平"，那么，就應該排除那些有

利于或不利于不同性質的亞團體的項目；

§如果測驗的目的就是為了考察不同亞團體的差異，那么，就應選

擇使團體差異盡可能大的題目。

五、有效性與可靠性的矛盾

?同質性信度要求項目之間有高相關，各項目的難度均等；

?對于預測效度來說，因為效標的變異范圍較大，如果項目越同質，

那么效標關聯(lián)效度則低；因此，效標關聯(lián)效度要求各項目之間要有一

定的差異，即項目之間相關低，這樣才能保證測驗得分與效標之間有

高相關，即高的效標關聯(lián)效度。

因此，對于多數(shù)心理測驗來說，項目之間中等程度的相關，可使

二者調和，獲得較為滿意的（同質性）信度和（效標關聯(lián)）效度。

第九章學績測驗

第一節(jié)學績測驗概述

一、學績測驗的性質

最高作為測驗可以分為：學績測驗、能力測驗、能力傾向測驗。

學績，指經過一定的教學或訓練后所學到的東西，是在一個比較明確

的、相對限定的范圍內的學習結果。

能力傾向指學習的能力，是在給予適當?shù)臋C會時獲得某種知識或技能

的能力。

能力介于學績和能力傾向之間，指的是當前的知識或技能的水平，既

有正式學習的，也有非正式學習的結果，既包括學術技能，又包

括非學術技能。

學績測驗用來描述現(xiàn)狀，指明一個人已經學會了什么和能做什么。

二、學績測驗的基本假設

1學績測驗所測量的知識和技術的范圍能明確界定。

2測驗所測量的是研究者認為重要的東西，而不是與測量目的無關的

東西。

3被試有同樣的機會學習測驗所包含的材料。

三、學績測驗的分類

（一）按測驗的編制方法分

教師自編課堂測驗，標準化學績測驗

（二）按測驗內容分

單科測驗，多科測驗

單元測驗，總測驗

（三）按測驗的用途分

考察性測驗，診斷性測驗，準備性測驗，選拔與安置測驗，職業(yè)水平

測驗，用于研究的測驗

（四）按測驗評分的參照系分

常模參照性測驗，目標參照性測驗

（五）按測驗的題型分

客觀測驗，論文式測驗

四、學績測驗的應用

1反饋功能

2診斷功能

3輔助教學管理

4研究工具

5人才選拔與安置

第二節(jié)標準化學績測驗

一、標準化學績測驗的基本要求

1命題組卷標準化

測驗目標，試題的措辭、難度、區(qū)分度，題型比例、題量

2施測標準化

環(huán)境、時間、指導語、主試

3評分標準化

標準答案、評分細則、評分者人數(shù)

4測驗分數(shù)解釋標準化

是常模參照還是目標參照

二、標準化學績測驗的編制

由學科專家與測驗編制專家共同完成，其步驟與一般心理測驗

的編制程序相同。

（一）確定測驗目的，選定測驗編制的方法

考察還是診斷，常模參照還是目標參照

（二）分析測量目標，擬訂測驗編制計劃

雙向細目表，題型，題量

（三）編題征題與選題組卷

編題征題一試測一組卷

（四）調查測驗質量參數(shù)，編制測驗常模

難度、區(qū)分度、信度、效度、常模

（五）編寫測驗指導書，正式出版發(fā)行

三、國外常用標準化學績測驗簡介

（一）斯坦福成就測驗

?綜合性學績測驗

?適用范圍：1~9年級

?內容：詞匯、閱讀理解、拼字、聽理解、詞匯學習技能、語言、

數(shù)學概念、數(shù)學計算、數(shù)學應用、社會科學常識、自然科學常識

斯坦福早期學校成就測驗（適用于幼兒園和小學一年級）

斯坦福學業(yè)技能測驗（適用于8~12年級）

導出分數(shù)：百分等級、標準九、年級當量、量表分數(shù)、正態(tài)曲線當量

分測驗信度均在0.80以上。

（二）關鍵數(shù)學算術診斷測驗

適用范圍：學前兒童~小學六年級

q測驗內容：

?內容塊：數(shù)學、分數(shù)、幾何、符號

?運算塊：加法、減法、乘法、除法、心算、數(shù)字推理

?應用塊：文字題、補充、金錢、測量、時間

q診斷：

?總體水平診斷

?分塊水平診斷

?分測驗水平診斷

?項目水平診斷

四、標準化學績測驗的題庫建設

一個高質量的題庫應具有的性質：

?有一種科學的測量理論；

?貯備一定數(shù)量的試題，所有試題品質優(yōu)良，技術參數(shù)完備；

?題庫內部結構層次清楚、分類嚴謹，試題檢索方便；

?題庫管理方便，可控性強，易于維護更新；

?保密性強。

五、我國高考的標準化試驗

第三節(jié)教師自編課堂測驗

一、教師自編課堂測驗的特點

?測驗形式靈活多變，與測驗目的完全一致

?測驗內容與教材內容完全一致

?測驗難度切合學生的實際水平

?測驗編制簡易快速

二、教師自編課堂測驗的步驟與方法

?審查測驗目的

?制定測驗編制計劃

?命題與組卷

三、教師自編課堂測驗應注意的問題

?教師要深入研究教材，深入研究學生

?要維護準確穩(wěn)定的合格標準

?要客觀評價自己的命題技術，合理使用各種題型

?要注意總結命題經驗，提高命題技術

?要盡量控制評分誤差，防止簡單粗糙

?要做一些定量分析研究

第十章能力測驗（上）

第一節(jié)智力測驗的理論基礎

（一）什么是智力？

§Spearman（1904,1923）：智力是一種普遍的能力，它主要涉及

聯(lián)系的引出(eduction)和相關的引出。

§Binet&Simon(1905)：智力是正確進行理解、判斷和推理的能

力。

§Terman(1916)：智力是形成概念，并且抓住其重要性的能力。

§Thorndike(1921)：智力是從真理或事實角度產生良好反應的能

力。

§Thurstone(1921)：智力是抑制本能反應，靈活地想象不同反應,

并且把修改后的本能反應轉換為外顯行為的能力。

§Wechsler(1939)：智力是個體有目的地行動，理性地思考以及有

效地應付環(huán)境的總體能力。

§Piaget(1972)：智力是總括性的術語，指用來適應物理和社會環(huán)

境的認知結構的組織和平衡的高級形式。

§Sternberg(1985)：智力是指自動信息加工和產生適合于新情況

的行為的心理能量，它包括元成分、操作成分和知識獲得成分。

§Eysenck(1986)：智力是將信息無錯地傳遞過皮層的能力。

§Gardner(1986)：智力是解決問題，制造在某些文化范圍內有價

值的產品的能力或技術。

共同點：

w智力是適應環(huán)境的能力

w智力是通過經驗進行學習的能力

W智力是人們在獲得知識和運用知識解決實際問題時所必須具備的

心理條件或特征。

Boring(1923):智力就是智力測驗所測量的東西。

Sternberg等(1981)的研究

專家認為：語詞能力、問題解決能力和實際智能最重要

外行認為：實際問題解決能力、語詞能力和社會能力最重要

(二)智力的理論

Galton和感覺敏銳度

1.二因素論

Spearman的一般因素(G)和特殊因素(S)

2.多因素論

Thurstone的群因素(語文理解、言語流暢性、推理、空間想象、

數(shù)字、記憶、知覺速度)

3.二維結構模型

希萊辛格和古特曼(1966)

第一維：言語能力、數(shù)學能力、圖形和空間能力

第二維：規(guī)則應用能力、規(guī)則歸類的能力、學術成就

4.Cattell的流體智力與晶體智力

5.Gardner的多元智力理論

言語、邏輯-數(shù)學、空間、音樂、身體運動、社交、自知

6.Sternberg智力的認知心理學理論

智力成分：元成分、操作成分、知識獲得成分

智力情境：適應環(huán)境、塑造環(huán)境、選擇新環(huán)境

智力經驗：處理新任務、自動化加工

7.其他：

情緒智力（EQ）、成功智力、實踐性智力（practicalintelligence）

第二節(jié)個體智力測驗

一、比內量表

（一）比內-西蒙量表

1.1905年量表

?世界上第一個智力量表；

?內容：30道題（記憶、言語、理解、手工操作）。

?題目排列方式：從易到難。

?指標：通過項目數(shù)。如白癡最多只能通過6項，低能的成人可通

過7~15項。

?眼睛是否隨動的物體移動。

?用觸覺刺激喚起抓握反應。

?用視覺刺激喚起抓握反應。

?辨認食物。

?搜尋食物。

?執(zhí)行簡單的命令和模仿簡單的手勢。

?認識物體。

?認識圖片。

?列舉圖片中的人物和物體。

?比較兩條線的長短。

?復述兩個數(shù)字。

?比較兩個重量。

?暗示。

?解說物體與人物的名稱。

?復述句子。

?說出二物的不同點。

?記憶圖片中的物體。

?靠記憶重畫圖片。

?復述數(shù)字。

?說出二物的相同點。

?比較線的長短。

?比較重量。

?重量記憶。

?說出同韻字。

?填詞。

?用三個詞造句。

?對答問句。

?交換長短針的位置。

?剪紙。

?抽象名詞的定義。

2.1908年量表

內容：增至59道題。

方式：把測驗項目按年齡分組。每一歲一組。每個年齡組項目數(shù)

量不等，最多8項，最少3項。

?年齡范圍：3~13歲。

?指標：智力年齡。

3.1911年量表

?題目：刪舊補新，但總數(shù)仍為59題。

?增設一個成年組。

?除4歲組僅有4個項目外，其他每個年齡組一律為5項，便于計

算。

q對比內-西蒙量表的評價

§成就：

(1)比西量表是第一個采用復雜任務來測量高級心理過程的測驗。

以前的測驗主要測量感知覺、運動等低級心理過程。

(2)比西量表首次采用年齡作為智力的標準，這樣可以對測驗作出

通俗易懂的解釋。

(3)比西量表首次從整體上測量智力，也就是測量智力的普通因素,

而以往心理學家把感覺辨別力、記憶力、注意力等割裂開來測量。

§不足：

(1)施測和記分沒有標準化。

(2)常模團體的代表性不夠，因而有些項目的安排位置不當。

(3)測驗項目過少。

(二)斯坦福-比內量表

1.斯坦福-比內量表的發(fā)展

(1)1916年量表

?在修改基礎上增設39個新項目，達到90個項目。

?最早對施測和記分提供了詳細的指導語。

?引入了智力商數(shù)的概念(比率智商)。

?適用年齡：3~13歲。

?樣本：1000名兒童和400名成人。

(2)1937年量表

?由L和M兩個等值型量表構成

?年齡范圍擴大：1.5~18歲

?樣本：3184名1.5~18歲兒童，但僅限城市白人

(3)1960年量表

?合并了L和M兩型中最好的項目，改為單一量表。

?年齡：2~成人

?離差智商

?4498名1.5~18歲兒童(1937年量表的施測對象)。

(4)1972年量表

?測驗內容未變；

?取樣范圍擴大(地區(qū)、社會階層、經濟狀況、民族)。

共2100名被試，其中2~5.5歲每半歲選100名，6~18歲每一歲

選100名。

2.斯比量表的信度和效度

(1)信度

?復本信度：L和M相關在0.83~0.95之間。

?再測信度：高于0.90。

（2）效度

?內容效度：測驗內容屬于公認的智力范疇。

?效標關聯(lián)效度：與學業(yè)成績、受教育年限的相關在0.4~0.75之間。

?結構效度：假設智力發(fā)展隨年齡增長，先快后慢（證據(jù)：隨年齡

增長，再測穩(wěn)定性逐步提高）；

存在G因素（證據(jù)：各項目與測驗總分的平均相關為0.66）

（三）中國比內測驗

陸志偉和吳天敏1924年、1936年、1982年三次修訂

內容：51題

指標：離差智商

年齡范圍：2歲~18歲

?生活常識

?知覺速度及觀察力

?空間知覺力和想象力

?記憶力

?語言能力

?判斷推理能力

二、韋克斯勒（Wechsler）智力測驗

生平：1896年出生于羅馬尼亞，6歲遷居美國。一戰(zhàn)期間從事心

理測驗工作，用陸軍甲、乙種測驗、斯比量表來甄選新兵，積累

了豐富的經驗。1919年去倫敦大學，師從Spearman和Pearson,

接受G因素理論。1920~1922年在巴黎與西蒙有過接觸。1925

年，在哥倫比亞大學獲博士學位，論文《情緒反應的測量》。

1932~1967年，任紐約貝爾韋精神病院的主任心理學家。

編制背景：尋找一種測量成人智力的有效方式。當時的智力測驗存在

下列問題：

?測驗項目引不起成人的興趣；

?過多的項目涉及語詞的操作；

?指導語過分強調速度，犧牲了準確性；

?計算心理年齡，不適合成人測驗要求。

刈=測驗者的實際測驗分數(shù)-這一年齡測驗者的平均測驗分數(shù)

韋氏智力測驗家族：

1939年，韋克斯勒-貝利弗測驗

1946年，韋克斯勒-貝利弗測驗H

1949年，韋克斯勒兒童智力量表（WISC）

1955年，韋克斯勒成人智力量表（WAIS）

1967年，韋克斯勒學前和小學兒童智力量表（WPPSI）

1974年，韋克斯勒兒童智力量表修訂版（WISC-R）

1981年，韋克斯勒成人智力量表修訂版（WAIS-R）

1989年，韋克斯勒學前和小學兒童智力量表（WPPSI-R）

1991年，韋克斯勒兒童智力量表第三版（WISC-III）

韋氏測驗的特點:

(1)10~12個分測驗：使用多個分測驗，不僅可以得到總IQ,還可

以分析個體在智力上的強項和弱點；

(2)言語量表和操作量表各由5~6個分測驗組成，可以單獨評價言

語或操作的各項智力成分，體現(xiàn)了左右腦功能的整合，而且可以

顯示個體的職業(yè)能力傾向。

(3)共同的IQ計分系統(tǒng)：對所有測驗和所有年齡組，IQ平均為100,

標準差為15。而且每個分測驗的平均分為10,標準差接近3分。

這樣就可以比較被試的各項分測驗分數(shù)，了解其相對強弱。

(4)不同年齡組有相同的分測驗：例如，WAIS-R,WISC-R,WPPSI-R

有相同的8個核心分測驗。這不僅方便施測者，而且有助于測驗

之間的相互比較。

韋克斯勒測驗的分測驗

(1)常識(information)

33個一般知識性問題，如''誰發(fā)現(xiàn)了美洲？如我國的首都在哪

里？兒童節(jié)是哪一天？〃

得分越高，說明興趣越廣泛，好奇心強，長時記憶好。

把該測驗放在首位，容易與被試建立關系，不易引起被試的緊張

和厭煩。

(2)數(shù)字廣度(digitspan)

分順背和倒背兩部分(2位到9位數(shù))。

主要測查瞬時記憶能力。對智力低者，測其智力；對智力高者，

測其注意力。

按0或1計分，總分為兩部分之和。

智力高者在該項上得分未必高，有時倒背可能會高于順背成績。

腦功能障礙者一般得分較低。但對有些白癡學者，能輕易得高

(3)詞匯(vocabulary)

要求被試定義和解釋通過視覺或聽覺呈現(xiàn)給他們的字詞的一般

意義。例如''什么是杯子？什么是美麗？”

該測驗與抽象概括能力有關。年齡大的、智力高的、受教育程度

高的、經歷豐富的人，其得分高。

問題是計分困難。答案分四級：

一級：用同義詞，且能說明二者的細微差別；

二級：具體運用詞匯來造句；

三級：望文生義，作字面解釋；

四級：做手勢或指實物給主試看。

一級計2分，二級計1分，三四級計0分。

(4)算術(arithmetic)

簡單項目主要是加減法運算。難一些的問題需要對問題進行分

析，并運用兩種以上的算術運算。

主要測量基本的數(shù)理知識和數(shù)學思維、推理能力。

(5)理角星(comprehension)

容易的題目主要測常識，如''為什么人要穿衣服？〃

難的項目需要了解社會、文化傳統(tǒng)，如''為什么最高法院任命終

身法官？”

該分測驗能反映被試對于社會價值取向、風俗、倫理道德是否理

解和適應，在臨床上可以鑒別腦器質性障礙的病人。

(6)類同(similarities)

讓被試區(qū)分物體、事實和觀念的重要的相似性與不重要的相似

性，如''襯衫和襪子有什么相似的地方？"測查個體的邏輯思維、

抽象思維、分析和概括能力。

(7)填圖(picturecompletion)

要求被試回答圖中缺少了什么重要成分。主要測的是記憶、細節(jié)

注意能力和視覺敏銳性。

具有病態(tài)觀念的患者往往將自己的思想投射到測驗中去。智力落

后者的填圖成績很差。

(8)句子(sentences)

要求被試逐字重復主試大聲讀出的句子。

測查注意和記憶能力。

(9)幾何圖形(geometricdesign)

10個圖案，每個圖形由一個圓、一個正方形和一個菱形組成，

讓兒童復寫。

(10)動物房(animalpegs)

把某種顏色的圓錐(黑、白、黃、藍)放到合適的動物(狗、小

雞、貓、魚)的洞里。測查學習能力、手的靈活性、維持注意的

能力。

(一)韋氏成人智力量表

共有11個分測驗，其中6個言語量表（常識、數(shù)字廣度、詞匯、

算術、理解和類同），5個操作量表（填圖、圖片排列、積木圖

案、物體拼湊、數(shù)字符號）

q信度和效度

?背數(shù)和數(shù)字符號分測驗計算復本信度，其余部分計算分半信度，

為0.88~0.98

?結構效度:''從各個方面來測量智力，而不是測量不同類型的智力。〃

因素分析表明，有50%的變異來自智力一般因素；各分測驗之間

和分量表之間存在普遍的顯著的正相關，表明智力G因素滲透于

智力行為的各個方面。

?內容效度：測驗項目均取自或參照前人成功用過的量表（比內量

表、陸軍a和b）編制。

?效標關聯(lián)效度：與斯比量表的相關0.80；文職人員的言語智商高

于操作智商，技術工人則相反。

（一）韋氏成人智力量表

共有11個分測驗，其中6個言語量表（常識、數(shù)字廣度、詞匯、

算術、理解和類同），5個操作量表（填圖、圖片排列、積木圖

案、物體拼湊、數(shù)字符號）

q信度和效度

?背數(shù)和數(shù)字符號分測驗計算復本信度，其余部分計算分半信度，

為0.88~0.98

?結構效度:''從各個方面來測量智力，而不是測量不同類型的智力?！?/p>

因素分析表明，有50%的變異來自智力一般因素；各分測驗之間

和分量表之間存在普遍的顯著的正相關，表明智力G因素滲透于

智力行為的各個方面。

?內容效度：測驗項目均取自或參照前人成功用過的量表（比內量

表、陸軍a和b）編制。

?效標關聯(lián)效度：與斯比量表的相關0.80；文職人員的言語智商高

于操作智商，技術工人則相反。

（二）韋氏兒童智力量表

?12個分測驗：5個言語測驗（常識、類同、算術、詞匯、理解），

5個操作測驗（填圖、圖片排列、積木圖案、拼圖、譯瑪），2個備

用測驗（背數(shù)和迷津）。

?適用年齡：6~16歲

?分半信度：0.70~0.86

?再測信度：0.65-0.88

?效標關聯(lián)效度：以年齡為效標，得分隨年齡增長而提高。與學績

測驗或其他學業(yè)行為的相關為0.50-0.60；與斯比量表的相關為

0.60~0.71

?結構效度：發(fā)現(xiàn)智力一般因素的存在

q韋克斯勒兒童智力量表（WISC-R）中國修訂本

?修訂者：林傳鼎、張厚粲等（1983年）

?模：中等以上城市（3000人）

?修訂原則：測題要適合中國兒童的特點；改動的測題盡可能與原

題性質類似、難度接近。主要改動有：

（1）我國社會中不常見的或我國兒童不熟悉的測題內容，如''一個銀

幣等于幾便士？"'美國成年男子平均身高是多少？”

（2）不合我國國情的，如''為什么把錢交給慈善機關比施舍給街頭乞

丐好？〃

（3）由于語種不同，翻譯后在難度上發(fā)生變化的，如''三月過后是幾

月？內啤酒和黃酒的共同點是什么？〃

（4）凡外國人名、貨幣名稱以及圖片上的人物等盡量使之中國化。

言語量表：常識、背數(shù)、詞匯、算術、理解、類同

操作量表：填圖、圖畫排列、積木圖案、拼圖、譯碼、迷津

（三）韋氏幼兒智力量表（WPPSI）

?年齡：4~6.5歲

?11個分測驗：5個言語測驗（常識、理解、詞匯、算術、類同），

5個操作測驗（填圖、迷津、積木圖案、句子復述），2個備用測驗

（動物房、幾何圖案）。

?分半信度：

?再測信度

?結構效度：G

?效標關聯(lián)效度：與斯比量表的相關

?對韋氏量表的評價

優(yōu)點：

（1）具有復雜的結構，能夠較好地反映智力的整體和各個側面；

(2)各年齡組都接受相同的分測驗，可以相互比較，并節(jié)省指導測

驗的時間；

(3)用離差智商代替比率智商，克服了計算成人智商的困難。

(4)采用因素分析法研究結構效度更具有理論意義。

(5)各量表之間相互銜接，適用的年齡范圍可以從幼兒直到老年。

缺點：

(1)施測程序復雜費時；

(2)對于測量智力極高或極低的被試不大適用；

(3)缺乏充分的效度資料。

第三節(jié)團體智力測驗

一、陸軍測驗

一戰(zhàn)時在Yerkes領導下編制。

q陸軍甲種(a)測驗

?8個分測驗：

照令行事、算術、常識、異同(同反義詞)、字句重組、填數(shù)、類

比推理、理解

?效度：與軍官評定、斯比量表、教師評定、學業(yè)成績的相關

q陸軍乙種(B)測驗

?7個分測驗：迷津、立方體分析、補足數(shù)列、譯碼、數(shù)字校對、圖

畫補缺、幾何形分析

?測試對象：母語非英語的被試和文盲被試

?效度：與甲種測驗的相關

二、瑞文推理測驗

（一）瑞文推理測驗的產生與發(fā)展

1.瑞文標準推理測驗

?6歲以上

?5個系列，60個項目

A組測知覺辨別力、圖形比較、圖形想象

B組測類同、比較、圖形組合

C組測比較、推理、圖形組合

D組測系列關系、圖套組合

E組測套合、互換等抽象思維能力

2.瑞文彩圖推理測驗

?5~11歲

?3個系列，36個項目

3.瑞文高級推理測驗

?適合于高智力成人

?第一套12個項目，第二套36個項目

（二）瑞文標準推理測驗中國修訂本

修訂者：張厚粲（1985年）

取樣：大、中、小城市

年齡：5歲~成人

信度：分半信度、再測信度

效度：與WISC-RC、高考成績的相關。

聯(lián)合型瑞文測驗（CRT,CombinedRaven'sTest）

（彩色+標準）

團體施測的適用范圍：三年級以上，65歲以下

三、認知能力測驗桑代克

初級型：口頭、詞匯、關系概念、多重智力和數(shù)量概念

文字測驗：詞匯、句子填充、語詞分類、語詞類推

數(shù)量測驗：數(shù)的大小比較、數(shù)列補充、建立關系

非文字測驗：圖形分類、圖形推理、圖形綜合

第四節(jié)嬰幼兒智力測驗

一、蓋塞爾發(fā)展順序量表

§適用年齡：出生~36個月

§方式：自然情景下對兒童的觀察

§測試工具：響鈴、三色環(huán)、撥浪鼓、積木、搖鈴、蠟筆和紙、皮

球、顏色板等

§評定內容：

?動作：分大動作和細動作。大動作指身體的姿態(tài)、頭的平衡、坐、

立、爬、走、跑、跳，細動作指手指的運用。

?言語：聽、理解和表達

?環(huán)境適應：如對物體和環(huán)境的精細感覺、協(xié)調能力

?社會應答：與人交往

§診斷依據(jù)：每個成熟階段的行為模式。

§指標：DQ（發(fā)育商數(shù)）=測得的成熟年齡/實際年齡

2歲小孩的動作發(fā)育：逐頁翻書、疊起7~8塊積木、用積木接成火

車、把盛滿水的杯子給人、學畫圈、能說出4樣畫片的名稱、踢球、

跑且不摔交

嬰幼兒智能發(fā)育階段初步檢查表

關鍵年齡成熟階段動作能應物能言語能應人能

4周仰臥不能控制頭部，仰臥姿勢左右不對稱眼光能短暫跟

隨人、物，給玩具立即放棄面部無表情，喉頭作微聲凝

視四周，''傾聽聲音"

16周仰臥頸可豎直，頭微搖動，仰臥姿勢左右對稱開始接

近有響聲的玩具，注視手中有響聲的玩具發(fā)出咕咕聲，出

聲笑動微笑迎人，玩弄己手

28周坐扶起獨坐，身體前傾伸手拿玩具，能將玩具自一手

遞交他手呼號，哭時作''姆姆〃聲將足置于口中

40周坐可獨坐，爬行，扶著物件站立能將兩樣玩具放在一

起，平指摘小丸能呼爸爸媽媽，除爸媽外能說另一字懂

得成人逗玩，能自己吃餅干

52周運動攙一手行走，搖擺能把方木置于杯中，試堆疊二方

木能說二字，對''給我"二字有反應穿衣時能合作

15月運動獨自行走，微有搖擺；自坐于小椅子中堆疊二塊方

木；能把6塊方木置于杯內能用4~6個字能指出并說

出所需之物，摸玩具

18月運動獨自行走，自坐于小椅子中堆疊3~4塊方木，模仿

一劃能用10字言語(無任何意義)白天能控制大小便；

能攜帶及抱娃娃

2歲幼兒園前期能跑，自行上下樓梯堆疊6~7塊方木，模仿

畫圓圈。能說2~3字短語，能說3~5張畫片中物名白天預

示大小便，能照顧娃娃入睡

3歲幼兒園前期能騎三輪腳踏車，能一足短暫獨立模仿疊方木

成品字形、房屋型，模仿畫十字能成句，能說出姓名、性別能

自己吃食物，能自己穿襪解扣。

二、丹佛發(fā)展篩選測驗

(DenverDevelopmentalScreeninglest,DDST)

年齡：6歲以內

評定內容：

個人-社會行為、精細動作、語言、大運動

三、貝雷嬰兒發(fā)展量表

(BayleyScalesofInfantDevelopment)

心理量表：知覺、記憶、學習、問題解決、發(fā)音、初步的語言交流、

初步的抽象思維

運動量表：大動作和精細動作

行為記錄：情緒、社會行為、注意廣度、目標定向等。

q嬰幼兒測驗的預測效度

缺乏長期的預測效度：1歲內嬰兒的測驗分數(shù)對預測3~4歲的智商有

一定的效度，但對長期預測幾乎不起作用；

對缺陷兒童的診斷非常有效。

對兒童以后的智力發(fā)展，父母受教育的程度及社會經濟地位要比嬰兒

測驗的分數(shù)更有預測力。

第五節(jié)傳統(tǒng)智力測驗中的幾個問題

（一）傳統(tǒng)智力測驗的結構效度

不同智力測驗有著不同的理論基礎，其結構也不同，解釋也不同,

因此，應針對不同情況選擇不同量表，也不能籠統(tǒng)地說一個人的

智力如何。

（二）傳統(tǒng)智力測驗的功能

還不夠精細，無法精確診斷。

不能貼標簽，更主要的是要解決問題。

（三）傳統(tǒng)智力測驗的公平性

1.性別差異

傳統(tǒng)智力測驗中有利于男性和女性的項目的不平衡

2.職業(yè)差異

經歷對智力的影響

3.文化和教育差異

城鄉(xiāng)差別、種族差別

能否編制出絕對公平的測驗？

4.年齡（時代）差異：人是不是越來越聰明？

（四）傳統(tǒng)智力測驗的預測效度（智商的穩(wěn)定性與不穩(wěn)定性）

1.智力隨年齡成熟而發(fā)展

?不同年齡的智力成分是否相同？

?智力是隨年齡而增長的嗎？

?一個人的智商是否終身不變？

?早期智力開發(fā)有無必要？

2.智力隨環(huán)境而變化

智力中的遺傳與環(huán)境的關系

同一家庭中成長的孩子，其所處的環(huán)境是否相同？

3.智力隨個性特質的不同而產生不同變化

人格、動機、情緒對智力發(fā)展的影響，而傳統(tǒng)智力測驗沒有考慮這

些因素的影響。

學習困難兒童在自我批評和自我監(jiān)控方面尤為不足。

高智商的人，其智力發(fā)展速率快。

積極的人格（進取心、面對挫折的態(tài)度）能促進智力的成長。

第十一章能力測驗（下）

第一節(jié)能力傾向測驗

一、能力傾向測驗的產生原因

1智力測驗的局限

大部分智力測驗只測量了言語能力和數(shù)目及抽象符號的關系能力，

無法測得一些具體的能力。

2個體能力傾向的差異

3因素分析技術的發(fā)展

4來自實際的需要

二、能力傾向測驗的特點

1能力傾向測驗的預測目的性更強

能力傾向測驗預測失敗比預測成功更準確

2測驗的編制

每個分測驗針對一種能力，應該是相互獨立的。

重視特殊團體常模的建立

3測驗結果的解釋

注意被試與常模性質之間的差異。

三、具體能力傾向測驗介紹

(一)學術能力傾向測驗(SAT)

美國的高考測驗

語言：反義詞、句子填充、類比推理、閱讀理解

數(shù)學：算術、代數(shù)、幾何

(二)分辨能力傾向測驗(DifferentialAptitudelest,DAT)

適用于初中和高中學生的教育咨詢及就業(yè)指導

?言語推理

?數(shù)的能力

?抽象思維

?文書速度與準確性

?機械推理

?空間關系

?語言運用：拼寫

?語言運用：文法

（三）一般能力傾向成套測驗（GATB）

綜合式職業(yè)性向測驗（36個職業(yè)群常模）。

?一般智力：

?言語能力

?數(shù)的能力

?空間關系理解力

?形狀知覺能力

?文書知覺能力

?動作協(xié)調能力

?手指靈巧性

?手部靈巧性

第二節(jié)特殊能力測驗

一、音樂能力測驗

（一）西肖爾音樂才能測驗

音調、音量、時間音程、節(jié)奏、音色、音調

（二）音樂能力測驗圖

（1）T測驗：音調形象（旋律、和聲）

（2）R測驗：節(jié)奏形象（速度、節(jié)拍）

（3）S測驗：音樂感受（短句、平衡、風格等）

二、美術能力測驗

（一）梅爾美術判斷力測驗

包括10對的繪畫作品，一幅是公認的名畫，另一幅稍作改動，要求

被試判斷哪一幅更好。

（二）格雷福斯圖案判斷測驗

由90套二維或三維的空間抽象圖案組成，每一套包括2~3個同一圖

案的變式，它們在整體性、平衡性、對稱性等方面有所區(qū)別，要求被

試判斷哪一圖案更好。

（三）霍恩美術能力問卷

包括兩部分：（1）要求被試畫出20種常見的物體或幾何圖形；

（2）在長方框規(guī)定的基本線條內作圖。

三、機械能力測驗

（一）空間關系測驗

1.明尼蘇達機械拼合測驗

要求被試拼排隨機擺放的機械物體。

2.明尼蘇達空間關系測驗

要求被試盡快將木塊放入相應的幾何形狀的槽中。

3.明尼蘇達書面形式拼板測驗

包括64道選擇題，每題包括一個分解幾何圖形題和5個拼湊成整

體的選擇圖案，要求被試選擇正確的答案。

（二）Bennett機械理解能力測驗

適用范圍：9~12年級

限時：30分鐘

測量對實際情況中對機械關系和物理定律的理解。

第三節(jié)創(chuàng)造力測驗

一、發(fā)散思維研究與創(chuàng)造力測驗

二、吉爾福特發(fā)散思維測驗

1詞語流暢：迅速寫出包含一個指定字母的單詞。

2觀念流暢：迅速列舉屬于某一種類的事物的名稱，如''能燃燒的液

體〃有……

3聯(lián)想流暢：列舉近義詞。

4表達流暢：寫出每個詞都以指定字母開頭的四詞句。如

、'K—U—Y—I","KeepUpYourInterest“''KillUselessYellowInsects”

5非常用途：報紙可以用于……

6解釋比喻：''一個女人的美麗就像秋天，它……〃

7效用測驗：盡可能列舉一件東西的各種用途

8故事命題：

9推斷結果：''假若人們不再需要睡眠，會出現(xiàn)什么情況？"

10職業(yè)象征：蠟燭一老師

11圖形組合：類似七巧板，包括4種形狀（圓、三角形、長方形、

梯形），可以重復使用，可以改變大小。

12繪圖：把一簡單圖形復雜化，組成盡可能多的各種物體的圖形。

13火柴問題：

14裝飾：以盡可能多的不同設計修飾一般物體的輪廓圖。

三、托倫斯創(chuàng)造性思維測驗

（一）言語的創(chuàng)造性思維測驗

包括7項活動：

1發(fā)問：呈現(xiàn)一張圖畫，要求列舉為了了解圖中之事而需要詢問的

所有問題。

2猜測原因：列舉圖中之事發(fā)生的所有可能原因。

3猜測結果：列舉圖中之事的所有可能結果。

4產品改進：對給定玩具提出改進意見。

5非凡用途：列舉某物不同尋常的可能用途。

6不平凡的疑問：對活動5中所示物體提出不同尋常的疑問。

7推想結果：列舉一種假想事件的所有可能結果。

從流暢性、變通性、獨特性三個方面計分。

（二）圖形的創(chuàng)造性思維測驗

1建構圖畫

要求被試把一張邊緣為曲線的顏色鮮明的紙片貼在一張空白紙上，

然后以此為出發(fā)點，畫一個非同尋常的能說明一段有興趣的振奮人

心的故事的圖畫。

2完成圖畫：利用少量不規(guī)則的線條畫出物體的略圖。

3利用成對的短平行線（A本）或圓（B本）盡可能多地畫出不同的圖。

從流暢性、變通性、獨特性、精確性4個方面來評分。

第十二章人格測量

第一節(jié)人格測量的一般問題

一、人格與人格測量

人格是與社會行為有關的心理特質的總和，包括需要、動機、興

趣、愛好、感情、態(tài)度、性格、氣質、價值觀、人際關系等。人

格有下面四個特征：

?獨特性

?穩(wěn)定性

?統(tǒng)合性(整體性)

?功能性

在心理測驗領域中，人格測驗尚處于搖籃

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

心理測量學電子教案

文檔簡介

溫馨提示

最新文檔

評論

心理測量學電子教案

文檔簡介

溫馨提示

最新文檔

評論

相關文檔