心理咨詢師3級考試-5心理測量學_第1頁
心理咨詢師3級考試-5心理測量學_第2頁
心理咨詢師3級考試-5心理測量學_第3頁
心理咨詢師3級考試-5心理測量學_第4頁
心理咨詢師3級考試-5心理測量學_第5頁
已閱讀5頁,還剩239頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第五章心理測量學第一單元測量與測量量表一、什么是測量測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。三個主要的元素:(1)事物;(2)數(shù)字;(3)法則。所謂“事物”,指的是我們要測量的對象,更準確地說,就是引起我們興趣的事物的屬性或特征。所謂“數(shù)字”,是代表某一事物或事物某一屬性的量。區(qū)分性--1與2等級性或位次性--3>2>1等距性--3-2=1、2-1=1可加性所謂“法則”,代表的是測量所依據(jù)的方法和規(guī)則真題(2007年11月)50、關于測量,正確的說法是()。(A)測量就是心理測量(B)就是依據(jù)一定的法則用數(shù)字對事物加以確定(C)就是用數(shù)字來描述事物的法則(D)就是用一些題目或數(shù)字來描述事物的屬性二、測量要素(一)參照點確定事物的量,必須有一個計算的起點參照點有兩種:絕對零點人定的參照點,即相對零點(二)單位好的單位必須具備兩個條件:確定的意義相同的價值真題(2006年11月)*101、任何測量都應該具備的要素是()。(A)量表(B)參照點(C)等級(D)單位三、測量量表斯蒂文斯(S·S·Stevens)將測量從低級到高級分成四種水平,即命名量表、順序量表、等距量表和等比量表(一)命名量表如1代表男,2代表女(二)順序量表如學生的考試名次、工資級別、能力等級、對某事物的喜愛程度等。數(shù)字僅表示等級,并不表示某種屬性的真正量或絕對值。真題(2006年11月)55、我們通常將學生的考試結果按名次排除,這些名次屬于()變量。(A)命名(B)順序(C)等距(D)等比(三)等距量表有相等的單位,沒有絕對的零點數(shù)值可以相互做加、減運算0度并不意味著沒有溫度(四)等比量表

有相等的單位,有絕對的零點可以做加、減、乘、除運算。心理測量是在順序量表上進行的。真題(2006年11月)*50、其數(shù)值可以進行加、減、乘、除運算的量表是()。(A)命名量表(B)順序量表(C)等距量表(D)等比量表第二單元心理測驗的基本概念一、心理測驗的定義二、心理測驗的性質(zhì)一、心理測驗的定義所謂心理測驗,就是依據(jù)心理學理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為,對于貫穿在人的全部行為活動中的心理特點做出推論和數(shù)量化分析的一種科學手段。二、心理測驗的性質(zhì)(一)間接性特質(zhì)是構成人格的最小單位,是激發(fā)與指導個體的各種反應的恒常的心理結構。(二)心理測量的相對性(三)客觀性測驗的刺激是客觀的。反應的量化是客觀的。結果推論是客觀的。第三單元心理測驗的分類一、按測驗的功能分類二、按測驗材料的性質(zhì)分類三、按測驗材科的嚴謹程度分類四、按測驗的方式分類五、按測驗的要求分類一、按測驗的功能分類(一)智力測驗(二)特殊能力測驗(三)人格測驗二、按測驗材料的性質(zhì)分類(一)文字測驗(二)操作測驗也稱非文字測驗。三、按測驗材科的嚴謹程度分類(一)客觀測驗(二)投射測驗四、按測驗的方式分類(一)個別測驗(二)團體測驗五、按測驗的要求分類(一)最高作為測驗(二)典型行為測驗真題(2006年5月)*110、按測驗的要求分類,可將測驗分為()。(A)最高作為測驗(B)典型行為測驗(C)主觀測驗(D)客觀測驗第四單元糾正錯誤的測驗觀一、錯誤的測驗觀二、正確的測驗觀心理測驗的意義錯誤的測驗觀萬能論無用論等同智力測驗正確的測驗觀研究方法決策輔助工具尚不完善真題(2006年5月)58、錯誤的測驗觀不包括()。(A)測驗萬能論(B)測驗無用論(C)心理測驗即智力測驗(D)測驗是輔助工具真題(2007年5月)103、正確的測驗觀包括()。(A)心理測驗是重要的心理學研究方法之一,是決策的輔助工具(B)做心理測驗時態(tài)度要正確(C)心理測驗作為研究方法和測量工具尚不完整(D)“一考完終身”說明心理測驗非常重要第五單元心理咨詢中的應用心理特性和行為問題的正確評估和診斷。三類心理測驗

智力測驗人格測驗心理評定量表真題(2007年5月)104、人格測驗包括()。(A)EPQ(B)MMPI(C)16PF(D)CRT第六單元心理測驗的發(fā)展史專欄中國古代的心理測驗思想一、科學心理測驗的產(chǎn)生與發(fā)展高爾頓(F·Galton)卡特爾比內(nèi)(A·Binet)二、現(xiàn)代心理測驗在我國的發(fā)展一、科學心理測驗的產(chǎn)生與發(fā)展高爾頓(F·Galton)提出人的不同氣質(zhì)特點和智能是按身體特點的不同而遺傳的。為了研究差異的遺傳性,便設計了測量差異的方法。為心理測驗奠定了統(tǒng)計學基礎。他第一個提出了相關的概念卡特爾的貢獻:心理測驗第一次出現(xiàn)于心理學文獻中心理學應立足于實驗與測量心理測驗應有一個統(tǒng)一的標準

比內(nèi)(A·Binet)世界上第一個正式的心理測驗。20世紀以后,心理測驗主要有以下幾個方面的發(fā)展:1.操作測驗的發(fā)展2.團體智力測驗的發(fā)展3.能力傾向測驗的發(fā)展4.人格測驗的發(fā)展二、現(xiàn)代心理測驗在我國的發(fā)展近些年來我國的心理學家正在致力于測驗本土化第二節(jié)測驗的常模第一單元常模團體一、常模團體的性質(zhì)常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。常模的選擇主要是基于對測驗將要施測的總體的認識,常模團體必須能夠代表該總體。包括:確定一般總體、確定目標總體、確定樣本。二、常模團體的條件(一)群體的構成必須明確界定(二)常模團體必須是所測群體的代表性樣本(三)樣本的大小要適當在實際工作中,應從經(jīng)濟的或?qū)嵱玫目赡苄院蜏p少誤差這兩方面來綜合考慮樣本的大小一般最低不小于30或100個。全國性常模,一般應有2000~3000人為宜。樣本大小適當?shù)年P鍵是樣本要有代表性。(四)標準化樣組是一定時空的產(chǎn)物在選擇合適常模時,要注意選擇較為新近的常模。真題(2007年5月,2007年11月)50、常模樣本量一般不小于()。(A)100或500(B)800或1000(C)20或25(D)30或100真題(2006年11月)*51、樣本大小適當?shù)年P鍵是樣本要有()。(A)代表性(B)特殊性(C)相關性(D)可比性三、取樣的方法取樣即從目標人群中選擇有代表性的樣本。下列幾種抽樣方法:(一)簡單隨機抽樣(二)系統(tǒng)抽樣(三)分組抽樣(四)分層抽樣真題(2006年5月)*58、常用的抽樣方法不包括()。(A)簡單隨機抽樣(B)系統(tǒng)抽樣(C)分層抽樣(D)標準化抽樣(一)簡單隨機抽樣

按照隨機表順序選擇被試構成樣本(二)系統(tǒng)抽樣系統(tǒng)抽樣的關鍵是計算組距

系統(tǒng)抽樣要求目標總體無序可排,也無等級結構存在。真題(2007年11月)51、系統(tǒng)抽樣法的關鍵是計算()。(A)樣本量(B)總體(C)隨機數(shù)(D)組距真題(2006年11月)*103、系統(tǒng)抽樣要求()。(A)目標總體有序可排(B)存在等級結構(C)目標總體無序可排(D)無等級結構存在(三)分組抽樣先將群體進行分組,再在組內(nèi)進行隨機取樣。(四)分層抽樣采用分層抽樣時,總體被分為同質(zhì)的、互不重迭的若干子總體(層),然后,在每一個層中獨立地抽取樣本。(一)常模常模分數(shù)構成的分布,就是通常所說的常模(norm),它是解釋心理測驗分數(shù)的基礎。常模有一般常模與特殊常模之分。對于某些特殊的群體來說,情況很具有特殊,我們就需要制定特殊常模四、常模分數(shù)與常模(二)常模分數(shù)常模分數(shù)就是施測常模樣本被試后,將被試者的原始分數(shù)按一定規(guī)則轉(zhuǎn)換出來的導出分數(shù)。導出分數(shù)的特性:與原始分數(shù)等值有意義等單位帶參照點真題(2007年05月)*105、導出分數(shù)的特性是()。(A)與原始分數(shù)等值(B)等單位(C)具有意義(D)具有參照點第二單元常模的類型一、發(fā)展常模亦稱年齡量表在年齡量表中,個人的分數(shù)指出他的行為在按正常途徑發(fā)展方面處于什么樣的發(fā)展水平。發(fā)展順序量表可以告訴人們某兒童的發(fā)育與其年齡相比正常超前滯后(一)發(fā)展順序量表最早的一個范例是葛塞爾發(fā)展程序表按月份顯示兒童在運動水平、適應性、語言、社會性四個方面的大致發(fā)展水平。16周,能使頭保持平衡皮亞杰最著名的工作就是對守恒概念的研究。通常兒童到5歲時才會理解質(zhì)量守恒;6歲才會掌握重量守恒;7歲時才有容量守恒概念。(二)智力年齡比內(nèi)-西蒙量表中首先使用智力年齡的概念。一個兒童在年齡量表上所得的分數(shù),就是最能代表他的智力水平的年齡。這種分數(shù)叫做智力年齡,簡稱智齡。吳天敏修訂的比內(nèi)-西蒙量表中,每個年齡都有6個測題,答對每題則得智齡2個月某兒童通過了4歲組的全部題目,5歲組通過3題,6歲組通過2題,7歲組通過1題,其智齡為5歲智齡=基礎年齡與在較高年齡水平的題目上獲得的附加月份之和。(三)年級當量也稱年級量表,測驗結果說明被試屬于哪一年級的水平。常模樣本中6年級的算術平均分為35,某兒童在算術測驗中也得35分,那么就有“該兒童的算術是6年級水平”二、百分位常模百分位常模包括百分等級和百分點(Percentilerankandpoint)、四分位數(shù)(quartiles)和十分位數(shù)(deciles)。(一)百分等級一個測驗分數(shù)的百分等級是指在常模樣本中低于這個分數(shù)的人數(shù)百分比。55的百分等級表示在常模樣本中有55%的人比這個分數(shù)低真題(2007年11月)52、百分等級55的分數(shù)表示在常模本中有55%的人比這個分數(shù)()。(A)低(B)相等(C)高(D)以上都不正確百分等級=〔(低于某個原始分數(shù)的累計人數(shù)+得到該分數(shù)的人數(shù)的一半)/N〕×100

王紅在30名同學中物理成績是80分,排列第五名,則其百分等級為85%

[R是原始分數(shù)排列順序,n是總?cè)藬?shù)](二)百分點(百分位數(shù))在分數(shù)量表上,相對于某一百分等級的分數(shù)點就叫百分點或百分位數(shù)。高考的最高分為650,其百分等級為100,最低分為105,百分等級為1,要錄取20%的學生進入大學,百分等級為80的百分位數(shù)540(三)四分位數(shù)和十分位數(shù)四分位數(shù)是將量表分成四等份,相當于百分等級的25%、50%和75%對應的三個點分成的四段。十分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到?。┡判蚝螅?個點將全部數(shù)據(jù)分為10等份,與9個分割點上相對應的數(shù)據(jù)稱為十分位數(shù)。1%~10%為第一段三、標準分常模常見的標準分數(shù)有:z分數(shù)、Z分數(shù)、T分數(shù)、標準九分數(shù)、離差智商(IQ)等。標準分數(shù)可以通過線性轉(zhuǎn)換,也可以通過非線性轉(zhuǎn)換得到(一)線性轉(zhuǎn)換的標準分數(shù)z(公式5-2)其中X為任一原始分數(shù),為樣本平均數(shù),SD為樣本標準差。Z=A+Bz(公式5-3)加上一個常數(shù)(A)是為了去掉負值,乘以一個常數(shù)(B)是為了使單位變小從而去掉小數(shù)點。真題(2006年11月)52、式中SD為()。

(A)任一原始分數(shù)(B)樣本平均數(shù)(C)樣本標準差(D)標準分數(shù)真題(2006年5月)60、Z=A+BZ式中為轉(zhuǎn)換后的標準分數(shù),A、B為根據(jù)需要指定的常數(shù)。加上一個常數(shù)是為了去掉(),乘以一個常數(shù)是為了使單位變小從而去掉小數(shù)點。(A)整數(shù)(B)小數(shù)(C)負值(D)分值(二)非線性轉(zhuǎn)換的標準分數(shù)當原始分數(shù)不是常態(tài)分布時,也可以使之常態(tài)化,這一轉(zhuǎn)換過程就是非線性的常態(tài)化過程主要是將原始分數(shù)轉(zhuǎn)化為百分等級,再將百分等級轉(zhuǎn)化為常態(tài)分布上相應的離均值,并可以表示為任何平均數(shù)和標準差。真題(2006年11月)*52、當原始分數(shù)不是常態(tài)分布時,也可以使之常態(tài)化,這一轉(zhuǎn)換過程是()。(A)線性的(B)非線性的(C)直接的(D)間接的當以50為平均數(shù)(即加上一個常數(shù)50),以10為標準差(乘以一個常數(shù)10)來表示時,通常叫做T分數(shù),即:T=50+10×(公式5-4)最早使用T分數(shù)的是麥柯爾標準九分(standardnine)是另一較知名的標準分數(shù)系統(tǒng),其量表是個9級的分數(shù)量表。它是以5為平均數(shù),以2為標準差的一個分數(shù)量表標準十分平均數(shù)為5,標準差為1.5;標準二十分平均數(shù)為10,標準差為3。真題(2006年5月)61、標準十分,平均數(shù)為(),標準差為()。(A)6:2(B)5:1.5(C)6:1.5(D)7:1.5四、智商及其意義若心理年齡高于其生理年齡,則智力較一般兒童高,若心理年齡低于其生理年齡,則智力較一般兒童低。但在使用中發(fā)現(xiàn),單純用心理年齡來表示智力高低的方法缺乏不同年齡兒童間的可比性(一)比率智商比率智商(IQ)被定義為心理年齡(MA)與實足年齡(CA)之比。(公式5-5)由于個體智力增長是一個由快到慢再到停止的過程,即心理年齡與實足年齡并不同步增長,所以比率智商并不適合于年齡較大的被試(二)離差智商是一種以年齡組為樣本計算而得的標準分數(shù)韋克斯勒將離差智商的平均數(shù)定為100,標準差定為15。離差智商建立在統(tǒng)計學的基礎之上,離差智商表示的是個體智力在年齡組中所處的位置,因而是表示智力高低的一種理想的指標

(公式5-6)從不同測驗獲得的離差智商只有當標準差相同或接近時才可以比較真題(2007年5月)51、韋克斯勒將離差智商的平均數(shù)定為100,標準差定為()。(A)17(B)15(C)11(D)13真題(2007年05月)*50、()表示的是個體智力在年齡組中所處的位置。(A)離差智商(B)比率智商(C)百分等級(D)標準九分數(shù)真題(2006年5月)62、是()的計算公式。(A)比率智商(B)標準分數(shù)(C)標準差(D)離差智商專欄幾種導出分數(shù)間的相互關系第三單元常模分數(shù)的表示方法一、轉(zhuǎn)換表法最簡單而且最基本的表示常模的方法就是轉(zhuǎn)換表,有時也叫常模表。測驗的使用者利用轉(zhuǎn)換表可將原始分數(shù)轉(zhuǎn)換為與其對應的導出分數(shù),從而對測驗的分數(shù)作出有意義的解釋。二、剖面圖剖面圖是將測驗分數(shù)的轉(zhuǎn)換關系用圖形表示出來。從剖面圖上可以很直觀地看出被試在各個分測驗上的表現(xiàn)及其相對的位置。真題(2006年5月)63、最簡單而且最基本的表示常模的方法是(),有時也叫常模表。(A)轉(zhuǎn)換表(B)分布表(C)對照表(D)都不是真題(2007年11月)53、()可以將測驗分數(shù)的轉(zhuǎn)換關系用圖形表示出來,便于直觀地看出被試者在各個分測驗上的表現(xiàn)及其相對位置。(A)條形圖(B)直方圖(C)剖面圖(D)餅狀圖補充

常模的構成要素為:原始分數(shù)、導出分數(shù)、對常模團體的有關描述。發(fā)展量表中的年齡量表最基本的假設是所測量的特質(zhì)隨年齡有系統(tǒng)地改變。所以,它的基本要素是:一組可以區(qū)分不同年齡組的題目、一個常模團體、常模表。第三節(jié)測驗的信度

第一單元信度的概念一、信度的定義信度是指同一被試者在不同時間內(nèi)用同一測驗(或用另一套相等的測驗)重復測量,所得結果的一致程度。信度只受隨機誤差的影響。在測量理論中,信度被定義為:一組測量分數(shù)的真分數(shù)方差與總方差(實得分數(shù)的方差)的比率。即:(公式5-9)真題(2007年5月)55、信度只受()的影響。(A)系統(tǒng)誤差(B)隨機誤差(C)恒定效應(D)概化作用二、信度的指標(一)信度系數(shù)與信度指數(shù)

(公式5-11)信度指數(shù)的平方就是信度系數(shù)。(二)測量標準誤(所有樣本均值的標準差)

(公式5-13)信度越高,標準誤越??;信度越低,標準誤越大。真題(2006年11月)*104、公式中SE為測量的標準誤,SX是所得分數(shù)的標準差,rxx為測驗的信度系數(shù)。從公式中可以看出,測量的標準誤與信度之間的關系是()。(A)信度越低,標準誤越小(B)信度越低,標準誤越大(C)信度越高,標準誤越大(D)信度越高,標準誤越小第二單元信度評估的方法一、重測信度二、復本信度三、內(nèi)部一致性信度四、評分者信度一、重測信度(test-retestreliabllity)使用同一測驗,在同樣條件下對同一組被試者前后施測兩次測驗,求兩次得分間的相關系數(shù),叫重測信度,又稱穩(wěn)定性系數(shù)。由于人的多數(shù)心理特征如智力、性格、興趣等,具有相對的穩(wěn)定性,間隔一段時間,不會有很大變化。真題(2006年11月)102、使用同一測驗,在同樣條件下對同一組被試者前后施測兩次測驗,求兩次得分間的相關系數(shù)同,叫(),又稱()。(A)復本信度(B)重測信度(C)穩(wěn)定性系數(shù)(D)分半信度一般是兩周到四周較宜,間隔時間最好不超過六個月。二、復本信度(alternate-formliability)以兩個等值但題目不同的測驗(復本)來測量同一群體,然后求得被試者在兩個測驗上得分的相關系數(shù)復本信度反映的是測驗在內(nèi)容上的等值性,故又稱等值性系數(shù)。真題(2006年5月)*59、復本信度又稱等值性系數(shù)。它是以兩個等值但題目不同的測驗(復本)來測量同一群體,然后求得被試者在兩個測驗上得分的相關系數(shù)。復本信度反映的是測驗在()上的等值性。(A)時間(B)題目(C)評分(D)內(nèi)容如果兩個復本的施測相隔一段時間,則稱重測復本信度或穩(wěn)定與等值系數(shù)。復本信度局限性:其一,如果測量的行為易受練習的影響,則復本信度只能減少而不能完全消除這種影響;其二,由于第二個測驗只改變了題目的內(nèi)容,已經(jīng)掌握的解題原則,可以很容易地遷移到同類問題。最后,對于許多測驗來說,建立復本是十分困難的。

三、內(nèi)部一致性信度(一)分半信度(split-h(huán)alfreliability)通常是在測驗實施后將測驗按奇、偶數(shù)分為等值的兩半,并分別計算每位被試在兩半測驗上的得分,求出這兩半分數(shù)的相關系數(shù)。這個相關系數(shù)就代表了兩半測驗內(nèi)容取樣的一致程度(公式5-14)式中為一半分數(shù)的相關系數(shù),為測驗在原長度時的信度估計值。真題(2006年11月)*53、斯皮爾曼一布朗公式:式中rhh為()的相關系數(shù),rxx為測驗在原長度時的信度估計值。(A)全測驗(B)原測驗(C)兩半測驗間(D)全部分數(shù)(二)同質(zhì)性信度(homogeneityreliability)代表測驗內(nèi)部所有題目間的一致性。即使所有題目看起來好像測量同一特質(zhì),但相關很低或為負相關時,則測驗為異質(zhì)的。真題(2006年11月)53、同質(zhì)性信度主要代表測驗內(nèi)部()間的一致性。(A)兩半測驗(B)所有題目(C)題目與分測驗(D)分測驗真題(2007年11月)54、同質(zhì)性信度主要代表測驗內(nèi)部()間的一致性。(A)兩半測驗(B)題目與分測驗(C)所有題目(D)分測驗庫德-理查遜公式只適用于答對一題記一分,答錯無分的測題(0,1記分)--是非題,不適用于多重記分的測題四、評分者信度隨機抽取若干份測驗卷,由兩位評分者按評分標準分別給分,然后再根據(jù)每份測驗卷的兩個分數(shù)計算相關,即得評分者信度。一般要求在成對的受過訓練的評分者之間平均一致性達0.90以上,才認為評分是客觀的。實際上有多少誤差的來源,便有多少估計信度的方法。真題(2007年5月)52、一般要求在成對的受過訓練的評分者之間平均一致性達到()以上,才認為評分是客觀的。(A)0.70(B)0.80(C)0.90(D)1.00第三單元信度與測驗分數(shù)的解釋一、解釋真分數(shù)與實得分數(shù)的相關二、確定信度可以接受的水平三、解釋個人分數(shù)的意義四、比較不同測驗分數(shù)的差異一、解釋真分數(shù)與實得分數(shù)的相關在極端的情況下,如有rxx=1.00,則表示完全沒有測量誤差,所有的變異均來自真實分數(shù);若有rxx=0,則所有的變異和差別都反映的是測量誤差。二、確定信度可以接受的水平一般原則是:當rxx<0.70時,測驗不能用于對個人做出評價或預測,而且不能作團體比較;當0.70≤rxx<0.85時,可用于團體比較;當rxx≥0.85時,才能用來鑒別或預測個人成績或作為。三、解釋個人分數(shù)的意義兩個作用其一是估計真實分數(shù)的范圍;其二是了解實得分數(shù)再測時可能的變化情形。人們一般采用95%的或然率(概率)水平,其置信區(qū)間為:

(公式5-16)大約有95%的可能性真分數(shù)落在所得分數(shù)±1.96Se的范圍內(nèi),或有5%的可能性落在范圍之外。四、比較不同測驗分數(shù)的差異差異分數(shù)的標準誤公式為:

(公式5-17)甲被試在韋氏成人智力測驗中言語智商為102,操作智商為110。已知兩個分數(shù)都是以100為平均數(shù),15為標準差的標準分數(shù)。假設言語測驗和操作測驗的分半信度分別為0.87和0.88,那么其操作智商不顯著高于言語智商第四單元影響信度的因素一、樣本特征一般而言,若獲得信度的取樣團體較為異質(zhì)的話,往往會高估測驗的信度,相反則會低估測驗的信度。(一)樣本團體異質(zhì)性的影響(二)樣本團體平均能力水平的影響對于不同水平的團體,題目具有不同的難度,每個題目在難度上的微小差異累計起來便會影響信度。真題(2006年11月)*54、一般而言,若獲得信度的取樣團體較為異質(zhì)的話,往往會()測驗的信度。(A)高估(B)低估(C)忽略(D)不清楚真題(2007年05月,2007年05月)*55、若取樣團體較為異質(zhì)的話,一般會()測驗的信度。(A)高估(B)低估(C)提升(D)降低真題(2007年11月)*52、對于不同平均能力水平的團體,題目的()會影響信度系數(shù)。(A)難度(B)長度(C)信度(D)效度二、測驗長度一般來說,在一個測驗中增加同質(zhì)的題目,可以便信度提高。第一,測驗越長,測驗的測題取樣或內(nèi)容取樣就越有代表性。第二,測驗越長,被試的猜測因素影響就越小。

增加測驗長度的效果應遵循報酬遞減率原則有時反而會引起被試的疲勞和反感而降低可靠性。

一個包括40個題目的測驗信度為0.80,欲將信度提高到0.90,問至少需要增加60個題目三、測驗難度洛德(Lord)提出在學績測驗中,為了保證其可靠性,各類選擇題的理想平均難度為:五擇一測題,0.70;四擇一測題,0.74;三擇一測題,0.77;是非題,0.85。四、時間間隔以再測法或復本法求信度,兩次測驗相隔時間越短,其信度系數(shù)越大;真題(2007年5月,2006年5月)53、以再測法或復本法求信度,兩次測驗相隔時間越短,其信度系數(shù)()。(A)越大(B)越低(C)越?。―)不變第四節(jié)測驗的效度一、效度的定義效度是指所測量的與所要測量的心理特點之間符合的程度,或者簡單地說是指一個心理測驗的準確性。在測驗理論中,效度被定義為在一組測量中,與測量目標有關的方差(或稱有效方差)與總方差的比率,即:(公式5-21)真題(2007年05月)*54、在測驗理論中,效度被定義為在一組測量中,與測量目標有關的真實方差與()的比率。(A)系統(tǒng)誤差(B)誤差(C)隨機誤差(D)總方差二、效度的性質(zhì)(一)效度具有相對性在評鑒測驗的效度時,必須考慮其目的與功能。(二)效度具有連續(xù)性真題(2007年11月)102、效度具有相對性,因此在評鑒測驗的效度時,必須考慮測驗的()。(A)信度(B)目的(C)功能(D)長度信度和效度的關系一、信度是效度的必要而非充分條件二、效度是受信度制約的第二單元效度評估的方法美國心理學會在1974年所發(fā)行的《教育與心理測量之標準》一書中將效度分為三大類:即內(nèi)容效度、構想效度和效標效度。一、內(nèi)容效度(content-relatedvalidity)(一)什么是內(nèi)容效度內(nèi)容效度指的是測驗題目對有關內(nèi)容或行為取樣的適用性,從而確定測驗是否是所欲測量的行為領域的代表性取樣。(二)內(nèi)容效度的評估方法1.專家判斷法最常用的方法是請有關專家對測驗題目與原定內(nèi)容的符合性做出判斷,看測驗的題目是否代表規(guī)定的內(nèi)容。又稱“邏輯效度”。真題(2007年11月)*55、內(nèi)容效度有時又稱()。(A)構想效度(B)效標效度(C)區(qū)分效度(D)邏輯效度為了使內(nèi)容效度的確定過程更為客觀,彌補不同專家對同一測驗的判斷可能不一致,可采用如下幾個步驟:(1)定義好測驗內(nèi)容的總體范圍(2)編制雙向細目表(3)制定評定量表來測量測驗的整個效度

2.統(tǒng)計分析法例如計算兩個評分者之間評定的一致性兩個測驗復本上得分之相關再測法

3.經(jīng)驗推測法真題(2007年5月,2007年11月)105、內(nèi)容效度的評估方法有()。(A)專家判斷法(B)雙向細目表法(C)統(tǒng)計分析法(D)經(jīng)驗推測法(三)內(nèi)容效度的特性表面效度是由外行對測驗作表面上的檢查確定的在編制測驗時,表面效度是一個必須考慮的特性。例如,最高行為的測驗要求有較高的表面效度真題(2006年11月)54、在編制測驗時,表面效度是要考慮的重要特性。如果編制最高行為測驗,除了內(nèi)容效度,也要求有()。(A)較高的表面效度(B)較好的專家判斷(C)較好的外行判斷(D)主觀性二、構想效度(一)什么是構想效度構思效度,還有人叫結構效度。它主要涉及的是心理學的理論概念問題指測驗能夠測量到理論上的構想或特質(zhì)的程度測驗的結果是否能證實或解釋某一理論的假設、術語或構想,解釋的程度如何。

(二)構想效度的估計方法1.對測驗本身的分析構思效度的證據(jù)測驗的內(nèi)容效度測驗的內(nèi)部一致性指標分析被試者對題目的反應特點

2.測驗間的相互比較相容效度計算兩種測驗之間得分的相關,其中一個測驗是有研究效度的,另一個是已有效度證據(jù)的成熟的測驗,但兩者測量的是同一種心理特質(zhì)。假如相關高,說明新測驗所測量的特質(zhì)確實是老測驗所反映的特質(zhì)或行為,這種方法叫相容效度區(qū)分效度因素分析法

3.效標效度的研究證明4.實驗法和觀察法證實真題(2007年11月)105、構想效度的估計方法包括()。(A)對測驗本身的分析(B)測驗間的相互比較(C)效標效度的研究證明(D)實驗法和觀察法證實三、效標效度(一)什么是效標效度被預測的行為是檢驗效度的標準,簡稱效標。根據(jù)效標資料是否與測驗分數(shù)同時獲得,又可分為同時效度和預測效度兩類。一個好的效標必須具備以下條件:(1)效標必須能最有效地反映測驗的目標,即效標測量本身必須有效;(2)效標必須具有較高的信度,穩(wěn)定可靠,不隨時間等因素而變化;(3)效標可以客觀地加以測量,可用數(shù)據(jù)或等級來表示;(4)效標測量的方法簡單,省時省力,經(jīng)濟實用。(二)效標效度的評估方法1.相關法:積差相關法點二列相關二列相關賈斯朋(Juspen)多系列相關

2.區(qū)分法:區(qū)分法是檢驗測驗分數(shù)能否有效地區(qū)分由效標所定義的團體的一種方法。真題(2006年5月)64、()是檢驗測驗分數(shù)能否有效地區(qū)分由效標所定義的團體的一種方法。(A)相關法(B)區(qū)分法(C)命中率法(D)失誤法3.命中率法:正確的預測(決定)為命中,命中的情況包括:預測成功而且實際也成功預測失敗且實際上也失敗

真題(2006年11月)105、效標的主要評估方法有()。(A)命中率法(B)區(qū)分法(C)失誤法(D)相關法第三單元效度的功能一、預測誤差效度系數(shù)常常以決定性系數(shù)來表示,意旨相關系數(shù)的平方,它表示測驗正確預測或解釋的效標的方差占總方差的比例。標準誤

即決定系數(shù)二、預測效標分數(shù)

(公式5-26)

是預測的效標分數(shù)真題(2006年11月)55、式中是()。(A)預測的效標分數(shù)(B)縱軸的截距(C)斜率(D)測驗分數(shù)三、預測效度指數(shù)E值大小表明使用測驗比盲目猜測能減少多少誤差如果一個測驗的效度系數(shù)為0.80,E=40,這表明由于該測驗的使用,使得我們在估計被試的效標分數(shù)時減少了40%的誤差。第四單元影響效度的因素一、測驗本身的因素1.測驗材料必須對整個內(nèi)容具有代表性;2.測題設計時應盡量避免容易引起誤差的題型(如是非題);3.測題難度要適中,具有較高的區(qū)分度;4.測驗長度要恰當,即要有一定的測題量;5.測題的排列按先易后難順序。真題(2006年5月)110、要保證測驗具有較高效度,測驗本身的因素要做到()。(A)測驗材料必須對整個內(nèi)容具有代表性(B)測驗設計時應盡量避免容易引起誤差的題型(如是非題)(C)測驗難度要適中,具有較高的區(qū)分度(D)測驗長度要恰當,測題的排列應先易后難二、測驗實施中的干擾因素(一)主試的影響因素測驗情景其他干擾因素(二)被試的影響因素三、樣本團體的性質(zhì)(一)樣本團體的異質(zhì)性如果其他條件相同,樣本團體越同質(zhì),分數(shù)分布范圍越小,測驗效度就越低;(二)干涉變量年齡、性別、教育水平、智力、動機、興趣、職業(yè)和任何有關的特征。由于這些特征的影響,使得測驗對于不同的團體具有不同的預測能力,故測量學上稱這些特征為干涉變量(moderatorvariahle)。真題(2007年11月)*53、如果其他條件相同,樣本團體越同質(zhì),分數(shù)分布范圍越小,測驗效度就越()。(A)高(B)低(C)大(D)接近美國心理學家吉賽利(LE·Ghiselli)提出的如何找出干涉變量的一套方法1.用回歸方程求得每個人的預測效標分數(shù),將該分數(shù)與實際效標分數(shù)相比較,獲得差異分數(shù)D。如果D的絕對值很大,說明測驗中可能存在干涉變量。2.根據(jù)樣本團體的組成分析,找出對照組,分別計算效度,從而找出干涉變量。3.對于預測團體,根據(jù)某些易見的干涉變量將其區(qū)分為預測性高和預測性低的兩個亞團體。對于預測性高的團體,獲得的測驗效度會有所提高。四、效標的性質(zhì)皮爾遜積差相關系數(shù)的前題是假設兩個變量的關系是線性的分布。效標測量的可靠性即效標測量的信度。第五節(jié)項目分析測驗的項目分析包括定性分析和定量分析兩個方面。定性分析包括考慮內(nèi)容效度,題目編寫的恰當性和有效性等;定量分析主要是指對題目難度和區(qū)分度等進行分析。第一單元項目的難度一、定義難度(difficulty),顧名思義,是指項目的難易程度。在非能力測驗(如人格測驗)中,類似的指標是“通俗性”難度的指標通常以通過率表示,即以答對或通過該題的人數(shù)百分比來表示:(公式5-31)在200名學生中,答對某項目的人數(shù)為120人,則該項目的難度為0.6通過人數(shù)越多(即P值越大),難度越低;真題(2007年05月)*53、在能力測驗中通常有反映難度水平的指標,在非能力測驗中類似的指標稱為()。(A)流暢性(B)靈活性(C)通俗性(D)相似性真題(2007年11月)55、項目的難易程度,用P表示。P值越(),難度越低。(A)大(B)低(C)?。―)接近于0二、計算方法(一)二分法記分的項目

(公式5-32)在370名被試者中,選為高分組和低分組的被試者各有100人,其中高分組有70人答對第1題,低分組有40人答對第1題,則第1題的難度為0.55吉爾福特提出難度的校正公式(二)非二分記分的項目

(公式5-34)數(shù)學測驗的第7題滿分為15分,該題考生的平均得分為9.6分,則該題的難度為0.64三、難度水平的確定(一)項目的難度選擇題目時,最好使試題的平均難度接近0.50,而各題難度在0.50士0.20之間。(二)測驗的難度如果被試樣本具有代表性,對于中等難度的測驗,其測驗總分應該接近常態(tài)分配。第二單元項目的區(qū)分度一、定義項目區(qū)分度(itemdiscrimination),也叫鑒別力,是指測驗項目對被試的心理特性的區(qū)分能力。真題(2007年5月)54、項目區(qū)分度也叫(),是指測驗項目對被試者的心理特性的區(qū)分能力。(A)難度(B)鑒別力(C)信度(D)效度二、計算方法(一)鑒別指數(shù)主要步驟如下:1.按測驗總分高低排列答卷;2.確定高分組與低分組,每一組取答卷總數(shù)的27%;3.分別計算高分組與低分組在該項目上的通過率或得分率;4.按下列公式估計出項目的鑒別指數(shù);(公式5-35)

(二)相關法計算區(qū)分度最常用的方法是相關法1.點二列相關:點二列相關適用于一類變量為二分稱名變量,另一類變量為連續(xù)變量的成對變量的相關計算2.二列相關:二列相關適用于兩個連續(xù)變量,但其中一個變量被人為分成兩類。3.Ф相關法:Ф相關法適用于兩個變量均為二分稱名變量三、區(qū)分度與難度的關系一般來說,較難的項目對高水平的被試區(qū)分度高,較易的項目對水平低的被試區(qū)分度高,中等難度的項目對中等水平的被試區(qū)分度高。項目難度的分布也以常態(tài)分布為好,這樣不僅能保證多數(shù)項目具有較高的區(qū)分度,而且可以保證整個測驗對被試具有較高的區(qū)分能力真題(2006年5月)57、難度與區(qū)分度的關系,一般來說,較難的項目對高水平的被試者區(qū)分(),中等難度的項目對中等水平的被試者區(qū)分度高。(A)中等(B)一般(C)高(D)低真題(2006年5月,2007年05月)*63、項目難度的分布一般以()分布為好。這樣不僅能保證多數(shù)項目具有較高的區(qū)分度,而且可以保證整個測驗對被試者具有較高的區(qū)分能力。(A)正偏態(tài)(B)負偏態(tài)(C)峰態(tài)(D)常態(tài)第六節(jié)測驗編制的一般程序第一單元測驗的目標分析一、測驗的對象二、測驗的用途三、測驗的目標一、測驗的對象只有對受測者的年齡、受教育程度和社會經(jīng)濟以及閱讀水平等心中有數(shù),編制測驗時才能有的放矢。二、測驗的用途所編出的測驗是要對被試做描述,還是做診斷,亦或是選拔和預測,(一)顯示性測驗顯示性測驗是指測驗題目和所要測量的心理特征相似的測驗。古德納夫曾經(jīng)在顯示性測驗內(nèi)部又加以區(qū)分,將其分為樣本測驗和標記測驗。(二)預測性測驗三、測驗的目標心理測驗的目標是指編制的測驗是測什么的,即用來測量什么樣的心理變量或行為特征。分三種情況:(一)工作分析包括兩個步驟第一是確定哪些心理特征和行為可以使要預測的活動達到成功第二是建立衡量被試是否成功的標準

(二)對特定概念下定義(三)確定測驗的具體內(nèi)容第二單元測題的編寫一、搜集資科題目的來源可分為三個方面:(一)已出版的標準測驗(二)理論和專家的經(jīng)驗(三)臨床觀察和記錄真題(2006年11月)50、心理測驗題目的來源應該排除()。(A)直接翻譯國外測驗的題目(B)已出版的標準測驗(C)理論和專家的經(jīng)驗(D)臨床觀察和記錄二、命題的一般原則從內(nèi)容、文字、理解和社會敏感性四個方面來考慮(一)內(nèi)容方面內(nèi)容符合測驗的目的避免貪多而亂出題目內(nèi)容取樣要有代表性題目間內(nèi)容相互獨立

真題(2007年11月)*102、心理測驗命題在內(nèi)容方面的要求包括()。

(A)內(nèi)容符合測驗的目的(B)題目數(shù)量盡可能多些(C)內(nèi)容取樣要有代表性(D)題目間內(nèi)容相互獨立(二)文字方面使用準確的當代語言

語句要簡明扼要

排除與答案無關的因素

最好是一句話說明一個概念真題(2006年5月)*109、心理測驗命題在文字方面的主要要求是()。(A)使用準確的當代語言(B)語句簡明扼要(C)排除與答案無關的因素(D)最好是一句話說明一個概念(三)理解方面有確切的答案除創(chuàng)造力測驗和人格測驗外不應具有引起爭議的可能內(nèi)容不要超出受測團體的知識水平和理解能力題目要不被人誤解

(四)社會敏感性方面菲力普(Phillips,D.L.)列舉了幾條策略值得參考:1.命題時假定被試具有某種行為2.命題時假定規(guī)范不一致3.指出該行為是常見的,雖然是違規(guī)的真題(2007年11月)*103、對于涉及社會敏感性問題的測驗,菲力普(Phillips,D.L.)認為可以采取一些鼓勵被試者作出真實回答的策略,這些策略包括()。(A)命題時假定被試者具有某種行為(B)命題時假定規(guī)范不一致(C)涉及社會禁忌或個人隱私的題目不使用(D)指出該行為是常見的,雖然是違規(guī)的三、測題的編制要領可以分為兩大類:提供型(supply)和選擇型(selection)題目。(一)選擇題由兩部分構成:題干(stem)和選項(options,alternatives)。對選擇題,我們既要編好題干,也要編好選項,有幾點必須注意:1.題干所提的問題必須明確2.選項切忌冗長,要簡明扼要。3.每題只給一個正確答案4.各選項長度應相等5.避免題干用詞與選項用詞一致6.選項最好用同一形式

(二)是非題編制是非題應注意:1.內(nèi)容應以有意義的概念、事實或基本原則為基礎2.每道題只能包含一個概念3.盡量避免否定的敘述,尤其是要避免用雙重否定的敘述

4.若是表達意見的題目,最好說明意見的來源和根據(jù)5.“是”、“非”題的數(shù)目應有適應比例,基本相等

(三)簡答題編制簡答題有三條原則:l.宜用問句形式2.如果是填充形式,空格不宜太多3.每題應只有一個正確答案

(四)操作題編制操作測驗有四條原則:1.明確所要測量的目標,并將其操作化。2.盡量選擇真實性程度較高的項目。3.指導語要簡明扼要4.制定評分標準,確定計分方法

真題(2007年05月,2007年11月)*103、編制操作測驗的原則有()(A)將測量目標操作化(B)盡量選真實度高的項目(C)指導語要簡明扼要(D)制訂評分的方法與標準第三單元測驗的編排和組織一、合成測驗(一)選擇與審定試題1.選擇試題形式在選擇題目形式時,需要考慮以下幾點:(1)測驗的目的和材料的性質(zhì)(2)接受測驗的團體的特點(3)各種實際因素

2.審定題目審定試題要注意以下幾個問題:(1)題目的范圍應與測驗計劃所列的內(nèi)容技能雙向細目表相一致(2)題目的數(shù)量要比最后所需的數(shù)目多一倍至幾倍(3)題目的難度必須符合測驗目的的需要。(4)題目的說明必須清楚明白。

(二)測題的編排測驗編排的一般原則:1.測題的難度排列宜逐步上升。2.盡可能將同類型的測題組合在一起。3.注意根據(jù)各種類型測題本身的特點排列題目。兩種常見的排列方式。1.并列直進式:2.混合螺旋式:真題(2006年5月,2006年11月)109、測題常見的排列方式有()。(A)并列直進式(B)公共汽車式(C)混合螺旋式(D)專列式二、預測與項目分析(一)預測預測應注意以下幾個問題:1.預測對象應取自將來正式測驗準備應用的群體。2.預測的實施過程與情境應力求與將來正式測驗時的情況相近似。3.預測的時限可稍寬一些,最好使每個被試都能將題目做完。4.在預測過程中,應對被試的反應情形隨時加以記錄

(二)項目分析三、信度和效度考察(一)信度(二)效度四、常模制訂五、編寫指導手冊測驗指導手冊的內(nèi)容有:1.測驗的目的和功用。2.測驗編制的理論背景3.如何實施測驗的說明。4.測驗的標準答案和記分標準。5.常模資料6.測驗的基本特征第七節(jié)心理測驗的使用第一單元主試的資格一、知識結構主試者的知識結構是指開展心理測驗工作所必須具備的基礎知識和與專業(yè)相關的知識。還應根據(jù)自己的工作領域具備相應的本行業(yè)的專業(yè)知識。二、專業(yè)理論知識和專業(yè)技能(一)專業(yè)理論知識包括要求主試者對心理測驗的特點和性質(zhì)、它的作用和局限性有清楚的認識;了解測驗的基本特征,如信度、效度、難度和區(qū)分度等心理測量學指標;熟悉保證心理測驗標準化的必要性等。

(二)專業(yè)技能熟悉有關測驗的內(nèi)容、適用范圍、測驗程序和記分方法等。三、職業(yè)道德(一)測驗的保密和控制使用(二)測驗中個人隱私的保護真題(2006年11月)104、測驗主試者的職業(yè)道德包括()。(A)測驗的保密(B)測驗的控制使用(C)測驗中個人隱私的保護(D)對測驗特別熟悉第二單元測驗的選擇選擇測驗必須注意兩個方面。一、所選測驗必須適合測量的目的二、所選測驗必須符合心理測量學的要求真題(2007年11月)*105、選擇測驗要注意所先測驗必須()。(A)適合主試者的要求(B)適合測量的目的(C)符合心理測量學的要求(D)適合主試者的職業(yè)道德要求第三單元測驗前的準備工作一、測驗前的準備工作準備工作主要包括以下幾個方面。(一)預告測驗(二)準備測驗材料(三)熟悉測驗指導語(四)熟悉測驗的具體程序二、測驗中主試的職責首先,應按照指導語的要求實施測驗其次,測驗前不講太多無關的話。第三,對于被試的反應,主試不應做出點頭、皺眉、搖頭等暗示性反應第四,對特殊問題要有心理準備三、建立協(xié)調(diào)關系這種關系指的是主試和被試之間一種友好的、合作的、能促使被試最大限度地做好測驗的一種關系,叫協(xié)調(diào)關系。第四單元測驗實施的程序及要素一、指導語(一)對被試的指導語一般由以下內(nèi)容組成:1.如何選擇反應形式(劃“√”、口答、書寫等);2.如何記錄這些反應(答卷紙、錄音、錄像等);3.時間限制;4.如果不能確定正確反應時該如何操作(是否允許猜測等);5.例題6.有時告知被試測驗目的。(二)對主試的指導語真題(2007年5月)102、測驗指導語一般由()等內(nèi)容組成。(A)如何選擇反應形式(B)如何記錄這些反應(C)時間限制(D)給例題,有時告知被試者測驗目的二、時限大多數(shù)典型行為測驗是不受時間限制的但在最高作為測驗中,速度是需要考慮的重要因素之一。真題(2006年11月)51、一般來說,心理測驗除()以外,都有時限。(A)最高作為測驗(B)速度測驗(C)典型行為測驗(D)智力測驗三、測驗的環(huán)境條件對于測驗的環(huán)境條件首先,必須完全遵從測驗手冊的要求;其次,是記錄下任何意外的測驗環(huán)境因素;第三,在解釋測驗結果時也必須考慮這一因素。真題(2007年

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論