第五章:心理測量學(xué)知識_第1頁
第五章:心理測量學(xué)知識_第2頁
第五章:心理測量學(xué)知識_第3頁
第五章:心理測量學(xué)知識_第4頁
第五章:心理測量學(xué)知識_第5頁
已閱讀5頁,還剩155頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第五章:心理測量學(xué)知識第一節(jié):概述第一單元:測量與測量量表一、什么是測量測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。包括三個主要的元素:(1)事物;(2)數(shù)字:(3)法則“事物”指的是我們要測量的對象;“數(shù)字”是代表某一事物或事物某一屬性的量;“法則”是測量所依據(jù)的規(guī)則和方法;有好壞之分。絲綢、體重、智力;氣味、標(biāo)準(zhǔn)物、視力和聽力。真假多重多聰明(一)參照點,即確定事物量的計算起點有兩種參照點,即絕對零點(理想)、相對零點(二)單位,即測量的基本要求好的單位必須具備兩個條件:一為有確定的意義;二為有相同的價值心理測量的單位,一般無統(tǒng)一單位,也不符合等距的要求二、測量要素:即參照點和單位50元人民幣與10美元相比,那個多?1公里與1英里相比,那個長(0.6214)?三、測量量表在一個定有單位和參照點的連續(xù)體上把事物的屬性表現(xiàn)出來,這個連續(xù)體稱為量表。

根據(jù)量表的精確程度,測量從低級到高級分成四種水平:(一)命名量表用數(shù)字來代表事物或把事物歸類。1、代號;2、類別白人黑人黃人男人女人類別代號(二)順序量表包含類別和大??;用于分等或排出順序。如:“<“、”>”名次名次胖瘦高矮(三)等距量表不但有大小而且數(shù)字有相等的單位,可以做加、減運算(四)等比量表有相等單位又有絕對零點,數(shù)值可做加、減、乘、除運算

統(tǒng)計心理測量:順序量表---------〉等距量表方法長度體積第二單元:心理測驗的基本概念一、心理測驗的定義所謂心理測驗,就是依據(jù)心理學(xué)理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為,對于貫穿在人的全部行為活動中的心理特點做出推論和數(shù)量化分析的一種科學(xué)手段。測量行為、行為樣本、標(biāo)準(zhǔn)化、常模二、心理測驗的性質(zhì)間接性(外顯行為----〉心理特質(zhì))相對性(沒有絕對的標(biāo)準(zhǔn),只是確定個人在序列的位置)客觀性(標(biāo)準(zhǔn)化:過程、評分、轉(zhuǎn)換和解釋等)第三單元:心理測驗的分類一、按測驗的功能分類:智力測驗、特殊能力測驗、人格測驗韋氏兒童智力量表:言語測驗和操作測驗.言語測驗包括理解測驗.其中的題目是:如果你把小朋友的皮球弄丟了,你應(yīng)該怎么辦?為什么政府要派人到肉食加工廠去檢驗肉類產(chǎn)品?

國家設(shè)立人民代表大會有哪些好處?職業(yè)指導(dǎo)的測驗中有個尋找字、符差異的測驗:長江——長工BOOK——BOOT

756246——756346

愛德華個人偏好量表里的題目:A我喜歡問些明知別人回答不出來的問題。B我喜歡告訴別人怎樣做他們的工作。二、按測驗材料的性質(zhì)分類:文字測驗、操作測驗在中小學(xué)生團體智力測驗中的文字測驗題目:下面五樣?xùn)|西中哪一樣最不象其他四樣?A襪子B衣服C鞋子D皮包E帽子中國比奈測驗中的操作測驗題目:三、按測驗材料的嚴(yán)謹(jǐn)程度分類:客觀測驗、投射測驗艾森克個性問卷中的題目:你喜歡跳降落傘嗎?是否兒童主體統(tǒng)覺測驗中的題目:四、按測驗的方式分類:個別測驗、團體測驗五、按測驗的要求分類:最高作為測驗、典型行為測驗韋氏兒童智力測驗中的背數(shù)測驗題目:順背3-8-6

6-1-23-4-1-7

6-1-5-88-4-2-3-9

5-2-1-8-63-8-9-1-7-4

7-9-6-4-8-35-1-7-4-2-3-8

9-8-5-2-1-6-31-6-4-5-9-7-6-3

2-9-7-6-3-1-5-45-3-8-7-1-2-4-6-9

4-2-6-9-1-7-8-3-57-5-1-3-2-6-9-1-8-7-

4-1-9-2-4-7-8-3-1-5韋氏兒童智力測驗中的背數(shù)測驗題目倒背2-5

6-35-7-4

2-5-97-2-9-6-

8-4-9-34-1-3-5-7

9-7-8-5-21-6-5-2-9-8

3-6-7-1-9-48-5-9-2-3-4-2

4-5-7-9-2-8-16-9-1-6-3-2-5-8-8

3-1-7-9-5-4-8-2MMPI里的題目:有時我會哭一陣,笑一陣,連自己也不能控制。是否假如不是有人和我作對,我一定會有更大的成就。是否第四單元:糾正錯誤的測驗觀一、錯誤的測驗觀(一)測驗萬能論(二)測驗無用論其一,某些人格測驗侵犯了個人隱私,違背民主原則。其二,測驗為宿命論和種族歧視提供了心理學(xué)依據(jù)(三)心理測驗即智力測驗二、正確的測驗觀(一)心理測驗是重要的心理學(xué)研究方法之一,是決策的輔助工具(二)心理測驗作為研究方法和測量工具尚不完善心理測驗的最大問題是理論基礎(chǔ)不夠堅實

-------既要承認(rèn)心理測驗的不完善,又要科學(xué)的自信的使用心理測驗。第五單元心理測驗在心理咨詢中的應(yīng)用3類常用心理測驗:一、智力測驗中國比內(nèi)量表(吳天敏)、WAIS-RC、C-WISC、C-WYCSI(龔耀先)、WISC-CR(林傳鼎)、SPM(張厚粲)、CRT(李丹)等二、人格測驗

EPQ、16PF、MMPI等三、心理評定量表精神病評定量表、躁狂狀態(tài)評定量表、抑郁量表、焦慮量表、恐怖量表等。心理測驗在咨詢和治療中并不是必不可少的環(huán)節(jié)。一般來講,心理測驗應(yīng)在咨詢關(guān)系尚未建立之前實施,進入正式的心理咨詢程序之后,要盡量避免心理測驗。也有例外。第六單元心理測驗的發(fā)展史

始于漢代、興于隋唐的科舉取士制度一、科學(xué)心理測驗的產(chǎn)生與發(fā)展心理測驗的開端---19世紀(jì)80年代,英國

F.Galton

為了研究差異的遺傳性,便設(shè)計了測量差異的方法。為心理測量,奠定統(tǒng)計學(xué)基礎(chǔ)。心理測驗第一次出現(xiàn)于心理學(xué)文獻中---1890年,美國J.M.Cattell在《心理》雜志上發(fā)表《心理測驗與測量》

世界上第一個正式的心理測驗----1905年,法國A.Binet在《心理學(xué)年報》上發(fā)表了一篇文章,題為《診斷異常兒童智力的新方法》

在此以后,心理測驗主要有以下幾個方面的發(fā)展:

1、操作測驗的發(fā)展

2、團體智力測驗的發(fā)展如陸軍甲種和乙種智力測驗

3、能力傾向測驗的發(fā)展如D.Wechsler所編的智力量表

4、人格測驗的發(fā)展二、現(xiàn)代心理測驗在我國的發(fā)展第二節(jié)測驗的常模(常模的定義)

第一單元常模團體一、常模團體的性質(zhì)(一個人是否胖、內(nèi)向、聰明等與其常模團體有關(guān)。)常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。常模團體用一個標(biāo)準(zhǔn)的、規(guī)范的分?jǐn)?shù)表示出來,以提供比較的基礎(chǔ)。任何一個測驗都有許多可能的常模團體。制訂和解釋應(yīng)考慮。如智力測驗有各年齡常模。常模團體必須能夠代表該總體,包括:確定一般總體、確定目標(biāo)總體、確定樣本。無論是測驗的編制者還是使用者,主要關(guān)心的是常模團體的成員。(大學(xué)生的家長給孩子每月400元的生活費是高還是低?)二、常模團體的條件(一)群體的構(gòu)成必須明確界定必須清楚說明所要測量的群體的性質(zhì)與特征(二)常模團體必須是所測群體的代表性樣本小團體:全選,平均分作為常模;大團體:用隨機取樣或分層取樣的方法。(三)樣本的大小要適當(dāng)(關(guān)鍵是要有代表性)幾十個人的團體:全部;總體數(shù)目大:不小于30或100個的樣本數(shù)目;全國性常模:2000—3000人(四)標(biāo)準(zhǔn)化樣組是一定時空的產(chǎn)物注意選擇較為新近的常模三、取樣的方法

取樣即從目標(biāo)人群中選擇有代表性的樣本。隨機抽樣:每個個案被抽取的機會均等非隨機抽樣抽樣方法:(一)簡單隨機抽樣

a按隨機表順序,b先編號再隨機選擇(二)系統(tǒng)抽樣總體數(shù)目為N,選擇K分之一(組距)作為樣本。要求目標(biāo)總體無序可排,也無等級結(jié)構(gòu)存在(三)分組抽樣:總體數(shù)目大,群體有多樣性,分組

---組內(nèi)隨機取樣。(四)分層抽樣:目標(biāo)總體按某種變量分層---層內(nèi)隨機取樣。分層比例抽樣、分層非比例抽樣四、常模分?jǐn)?shù)與常模(一)常模分?jǐn)?shù)常模分?jǐn)?shù)就是施測常模樣本被試后,將被試者的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。通過將被試的反應(yīng)與標(biāo)準(zhǔn)答案相比較而獲得的測驗分?jǐn)?shù)叫原始分?jǐn)?shù)。

導(dǎo)出分?jǐn)?shù)具有一定的參照點和單位,它實際上是一個有意義的測驗量表,它與原始分?jǐn)?shù)等值,可以進行比較(二)常模常模分?jǐn)?shù)構(gòu)成的分布,就是常模(norm),是解釋心理測驗分?jǐn)?shù)的基礎(chǔ)。一般常模、特殊常模第二單元常模的類型一、發(fā)展常模(年齡量表)(縱向比較)將個人的成績與各種發(fā)展水平的人的平均表現(xiàn)相比較,根據(jù)這種平均表現(xiàn)所制成的量表就是發(fā)展常模。(一)發(fā)展順序量表它告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育正常,相應(yīng)能力或行為早于某年齡出現(xiàn),說明發(fā)育超前,否則即為發(fā)育滯后。葛塞爾發(fā)展程序表(按月份顯示兒童各方面的大致發(fā)展水平)瑞士皮亞杰的發(fā)展理論16周28周40周48周(二)智力年齡一個兒童在年齡量表上所得的分?jǐn)?shù),代表他的智力水平的年齡。這種分?jǐn)?shù)叫做智力年齡,簡稱智齡。比內(nèi)—西蒙一個人的智齡并不一定和他的實齡相符。

年齡量表的基本要素(三)年級當(dāng)量即年級量表,測驗結(jié)果說明屬哪一年級的水平。在教育成就測驗中最常用二、百分位常模(橫向比較)

百分位常模包括百分等級和百分點、四分位數(shù)和十分位數(shù)。(一)、百分等級

是指在常模樣本中低于這個分?jǐn)?shù)的人數(shù)百分比。未分組資料的百分等級計算:

PR=100-(100*R-50)/N

其中R是原始分?jǐn)?shù)排列順序數(shù),N是指總?cè)藬?shù)(樣本的總?cè)藬?shù))。例題見341頁。百分等級

(二)百分點也稱百分位數(shù),計算處于某一百分比例的人對應(yīng)的測驗分?jǐn)?shù)是多少。在分?jǐn)?shù)量表上,相對于某一百分等級的分?jǐn)?shù)點就叫百分點或百分位數(shù)。計算根據(jù)直線內(nèi)插法進行。見341頁。(三)四分位數(shù)和十分位數(shù)四分位數(shù)是將量表分成四等分,相當(dāng)于百分等級的25%、50%和75%對應(yīng)的三個百分分成的四段。十分位數(shù)也可以依此類推出,1%~10%為第一段,91%一100%為第十段。三、標(biāo)準(zhǔn)分常模標(biāo)準(zhǔn)分常模是將原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表。如z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)、標(biāo)準(zhǔn)九分?jǐn)?shù)、離差智商(IQ)等。常態(tài)化(一)線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)

z分?jǐn)?shù)為最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù):

z分?jǐn)?shù)的另一種形式:Z=A+Bz

(二)非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)(略)當(dāng)原始分?jǐn)?shù)不是常態(tài)分布時,也可以使之常態(tài)化,這一轉(zhuǎn)換過程就是非線性的。計算步驟如下:

1.對每個原始分?jǐn)?shù)值計算累積百分比;

2.在常態(tài)曲線面積表中,求出對應(yīng)于該百分比的z分?jǐn)?shù)。所得的z分?jǐn)?shù)可將分布分成幾部分,我們稱之為z`分?jǐn)?shù),以區(qū)別由線性轉(zhuǎn)換所求得的z分?jǐn)?shù)。例如:T分?jǐn)?shù)=50+10z`四、智商及其意義

比內(nèi)—西蒙智力測驗中用“心理年齡”(mentalage,簡稱MA)來表示被試智力的高低。

計算方法例如:實際年齡7歲,心理年齡10歲實際年齡13歲,心理年齡10歲缺點:不同年齡兒童間無法比較。(一)比率智商

1916年,美國斯坦福大學(xué)推孟教授以比率智商(IQ)來表示測驗的結(jié)果:

IQ=(MA/CA)*100例如:IQ=10歲/7歲*100=143IQ=10歲/13歲*100=77

缺點:

1、個體智力增長是一個由快到慢再到停止的過程,即心理年領(lǐng)與實足年齡并不同步增長。

2、不同年齡組兒童的比率智商分布情況不一樣,相同比率智商分?jǐn)?shù)在不同年齡就具有不同意義。(二)離差智商是一種以年齡組為樣本計算而得到的標(biāo)準(zhǔn)分?jǐn)?shù),表示的是個體智力在年齡組中所處的位置。具體公式如下:

IQ=100+15z`=100+15(X-)/SD

在實際中,通常根據(jù)原始分?jǐn)?shù)在常模表上按其年齡直接查出智商。從不同測驗獲得的離差智商只有當(dāng)標(biāo)準(zhǔn)差相同或接近時才可以比較。

以100為平均數(shù)不同標(biāo)準(zhǔn)差下每一IQ組距正態(tài)曲線下個案百分比:

百分?jǐn)?shù)分布分組分?jǐn)?shù)SD=12SD=14SD=15SD=16SD=18130以上0.71.62.23.15.1120-1294.36.36.77.58.5110-11915.21616.115.815.4100-10929.826.12523.62190-9929.826.12523.62180-8915.21616.115.815.470-794.36.36.77.58.570以下0.71.62.23.15.1總

計100100100100100

幾種導(dǎo)出分?jǐn)?shù)間的相互關(guān)系第三單元常模分?jǐn)?shù)的表示方法一、轉(zhuǎn)換表法(常模表)一個轉(zhuǎn)換表顯示出一個特定的標(biāo)準(zhǔn)化樣組的原始分?jǐn)?shù)與其相對應(yīng)的一個等值分?jǐn)?shù)—百分位、標(biāo)準(zhǔn)分?jǐn)?shù)、T分?jǐn)?shù)或者其它任何分?jǐn)?shù)。簡單的轉(zhuǎn)換表,如表5-2。復(fù)雜的轉(zhuǎn)換表,如表5-3。二、剖面圖法剖面圖是將測驗分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來。第三節(jié)測驗的信度第一單元信度的概念一、信度的定義信度是指同一被試者在不同時間內(nèi)用同一測驗(或用另一套相等的測驗)重復(fù)測量,所得結(jié)果的一致程度。

信度只受隨機誤差的影響。系統(tǒng)誤差產(chǎn)生恒定效應(yīng),不影響信度。隨機誤差:情緒、身體、環(huán)境等

系統(tǒng)誤差:測驗等

X(實得分?jǐn)?shù))=T(真實分?jǐn)?shù))+E(誤差)

S2X(實得分?jǐn)?shù)的方差)

=S2T(真分?jǐn)?shù)的方差)+S2E(誤差的方差)信度的理論定義:

rxx=S2T/

S2X

信度的操作定義:

rxx=(S2X-S2E)/S2X=1-S2E/S2X

二、信度的指標(biāo)(一)信度系數(shù)與信度指數(shù)信度是以信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。常常是同一被試樣本所得的兩組資料的相關(guān),理論上說就是真分?jǐn)?shù)方差與實得分?jǐn)?shù)的方差的比值。

信度系數(shù)

信度指數(shù)(二)測量標(biāo)準(zhǔn)誤理論上,無數(shù)次測驗,平均數(shù)就是這個人的真分?jǐn)?shù),而標(biāo)準(zhǔn)差則為測量誤差的指標(biāo)。用一組被試兩次測量結(jié)果來代替同一個人的反復(fù)施測。信度的另一個指標(biāo),測量的標(biāo)準(zhǔn)誤公式是:

SE為測量標(biāo)準(zhǔn)誤;Sx為所得分?jǐn)?shù)的標(biāo)準(zhǔn)差;rxx為相關(guān)系數(shù)第二單元信度評估的方法不同的信度反映測驗誤差的不同來源一、重測信度(test—retestreliability),又稱穩(wěn)定性系數(shù)

間隔時間:2-4周,最好小于6個月優(yōu)點:能提供有關(guān)測驗是否隨時間而變異的資料,可作為被試將來行為表現(xiàn)的依據(jù)。缺點:易受練習(xí)和記憶的影響二、復(fù)本信度(alternate-formreliability),又稱等值性系數(shù)如果兩個復(fù)本的施測相隔一段時間,則稱重測復(fù)本信度或穩(wěn)定與等值系數(shù)。優(yōu)點:能夠避免重測信度的一些問題,如記憶效果、學(xué)習(xí)效應(yīng)等。缺點:

1、如果測量的行為易受練習(xí)的影響,則復(fù)本信度只能減少而不能完全消除這種影響;

2、已掌握的解題原則,可以遷移到同類問題中;

3、對于許多測驗來說,建立副復(fù)本是十分困難的。三、內(nèi)部一致性信度(internalconsistencyreliability)主要反映的是題目之間的關(guān)系,表示測驗?zāi)軌驕y量相同內(nèi)容或特質(zhì)的程度。

(一)分半信度(split—halfreliability)

計算分半信度常采用積差相關(guān)方法計算。分半法經(jīng)常會低估信度(在其他條件相同的情況下,測驗越長,信度越高),常采用斯皮爾曼—布朗公式修正:

斯皮爾曼一布朗公式為經(jīng)驗公式,它的假設(shè)條件是兩半測驗分?jǐn)?shù)的變異數(shù)相等。當(dāng)假設(shè)不成立時,可采用弗朗那根(Flanagan)或盧倫(Kulon)公式直接求得測驗的信度系數(shù)。(二)同質(zhì)性信度(homogeneityreliability)

同質(zhì)性主要代表測驗內(nèi)部所有題目間的一致性。

1、庫德一理查遜公式:適用于答對一題記一分,答錯無分的測題。常用的是K—R20公式,在各測題難度相同或近似的情況下,還可采用計算更為簡便的K—R21公式。

2、克倫巴赫系數(shù):適用于多重記分的測題。四、評分者信度(scorerreliability)用于測量不同評分者之間所產(chǎn)生的誤差。抽取若干份測驗卷,由兩位評分者按評分標(biāo)準(zhǔn)分別給分,然后再根據(jù)每份測驗卷的兩個分?jǐn)?shù)計算相關(guān),即得評分者信度。

一般要求在成對的受過訓(xùn)練的評分者之間平均一致性達(dá)0.90以上,才認(rèn)為評分是客觀的。當(dāng)多個評分者評定多個對象,并以等級法紀(jì)分時,可采用肯德爾和諧系數(shù)(w)作為評分者信度的估計。

第三單元信度與測驗分?jǐn)?shù)的解釋一、解釋真實分?jǐn)?shù)與實得分?jǐn)?shù)的相關(guān)信度系數(shù)可以解釋為總的方差中有多少比例是由真實分?jǐn)?shù)的方差決定的,也就是測量的總變異中真分?jǐn)?shù)造成的變異占百分之幾,同時也告訴我們,測量的誤差比例是多少。二、確定信度可以接受的水平能力測驗、成就測驗信度系數(shù)可達(dá)到0.9—0.95;人格測驗、興趣、態(tài)度、價值觀等測驗的信度可達(dá)到0.8—0.85或更高一些。當(dāng)rxx<0.70時,測驗不能用于對個人作出評價或預(yù)測,不能做團體比較;當(dāng)0.70≤rxx<0.85時,可用于團體比較;當(dāng)rxx≥0.85時,才能用來鑒別或預(yù)測個人成績或作為。新編的測驗信度應(yīng)高于原有的同類測驗或相似測驗。三、解釋個人分?jǐn)?shù)的意義

信度有兩個作用:

1.估計真實分?jǐn)?shù)的范圍;

2.了解實得分?jǐn)?shù)再測時可能的變化情形。測量標(biāo)準(zhǔn)誤可以通過第一次測驗的結(jié)果及信度估計得到:

人們一般采用95%的或然水平,其置信區(qū)間為:例題:見353頁。

四、比較不同測驗分?jǐn)?shù)的差異比較:兩個人不同分?jǐn)?shù)的差別同一被試在兩個測驗上的差別

兩個測驗的標(biāo)準(zhǔn)差要求相同。第四單元影響信度的因素一、樣本特征

(一)樣本團體異質(zhì)性的影響若獲得信度的取樣團體較為異質(zhì)的話,往往會高估測驗的信度,相反則會低估測驗的信度。(二)樣本團體平均能力水平的影響對于不同水平的團體,題目具有不同的難度,每個題目在難度上的微小差異累積起來便會影響信度。二、測驗長度在一個測驗中增加同質(zhì)的題目,可以使信度提高。第一,測驗越長,測驗的測題取樣或內(nèi)容取樣就越有代表性。第二,測驗越長,被試的猜測因素影響就越小。假若我們希望用增加測驗的方式提高測驗的信度以達(dá)到某種理想值,通過斯皮爾曼—布朗公式的導(dǎo)出公式就可計算出最少應(yīng)增加的題數(shù)。例題見355頁三、測驗難度難度對信度的影響,只存在于某些測驗中。若測驗對某團體太難或太易,則分?jǐn)?shù)范圍將縮小,從而使信度降低。從理論上說,只有平均難度水平為50%時,才能使測驗分?jǐn)?shù)分布范圍最大,求得的信度也最高。洛德(Lord)提出在學(xué)績測驗中,為了保證其可靠性,各類選擇題的理想平均難度為:五擇一測題,0.70;四擇一測題,0.74;三擇一測題,0.77;是非題,0.85;四、時間間隔時間間隔只對重測信度和不同時測量時的復(fù)本信度(重測復(fù)本信度)有影響,對其余的信度來說不存在時間間隔問題。以再測法或復(fù)本法求信度,兩次測驗相隔時間越短,其信度系數(shù)越大;間隔時間越久,其他變因介入的可能性越大,受外界的影響也越大,信度系數(shù)便越低。第四節(jié)測驗的效度第一單元效度的概念一、效度的定義在心理測驗中,效度是指所測量的與所要測量的心理特點之間符合的程度,或者簡單地說,是指一個心理測驗的準(zhǔn)確性。效度的定義也可以通過真分?jǐn)?shù)的概念和方差分析方法加以說明。

效度被定義二、效度的性質(zhì)(一)效度具有相對性任何測驗的效度是對一定的目標(biāo)來說的,或者說測驗只有用于與測驗?zāi)繕?biāo)一致的目的和場合才會有效。

(二)效度具有連續(xù)性測驗效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。效度是針對測驗結(jié)果而言的。第二單元效度評估的方法一、內(nèi)容效度(content—relatedvalidity)(一)什么是內(nèi)容效度內(nèi)容效度指的是測驗題目對有關(guān)內(nèi)容或行為取樣的適用性,從而確定測驗是否是所預(yù)測量的行為領(lǐng)域的代表性取樣。編制有較高內(nèi)容效度的心理測驗,1.明確所測量的心理特性的概念,并劃定出與這種心理特性有關(guān)的行為。2.測驗題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。3.要求內(nèi)容效度的測驗,并不一定要求測驗為同質(zhì)的。如智力測驗。(二)內(nèi)容效度的評估方法1、專家判斷法內(nèi)容效度有時又稱“邏輯效度”(logicalvalidity)。使不同專家對測驗的判斷一致的步驟:(1)定義好測驗內(nèi)容的總體范圍,描述有關(guān)的知識與技能及所用材料的來源;(2)編制雙向細(xì)目表,確定內(nèi)容和技能各自所占的比例,并由測驗編制者確定各題所測的是何種內(nèi)容與技能;(3)制定評定量表來測量測驗的整個效度。2、統(tǒng)計分析法兩個評分者之間評定的一致性。內(nèi)容效度可由一組被試在獨立取自同樣內(nèi)容范圍的兩個測驗副本上得分之相關(guān)來做估計。再測法也可用于內(nèi)容效度的評估。3、經(jīng)驗推測法通過實踐來檢驗效度(如對兒童發(fā)展量表的檢驗)。(三)內(nèi)容效度的特性與所有效度的性質(zhì)一樣,不是普遍適用的,而是根據(jù)具體情況分析得來。與測驗定義的使用者有關(guān)有時間上的特定性要區(qū)分內(nèi)容效度和表面效度;

最高行為的測驗要求有較高的表面效度,典型行為測驗卻要求較低的表面效度。二、構(gòu)想效度(construct-relatedvalidity)(一)什么是構(gòu)想效度(構(gòu)思效度、結(jié)構(gòu)效度)指測驗?zāi)軌驕y量到理論上的構(gòu)想或特質(zhì)的程度,即測驗的結(jié)果是否能證實或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。某一構(gòu)想的理論某一心理特質(zhì)的假設(shè)設(shè)計和編制測驗,施測相關(guān)或因素分析,驗證與理論假設(shè)的符合程度(二)構(gòu)想效度的估計方法1、對測驗本身的分析這類方法是通過研究測驗內(nèi)部結(jié)構(gòu)來界定理論構(gòu)想,從而為構(gòu)思效度提供證據(jù)。內(nèi)容效度可以作為構(gòu)思效度的證據(jù)。內(nèi)部一致性指標(biāo):推斷測驗是測量單一特制還是測量多種特質(zhì)。有時分析被試者對題目的反應(yīng)特點也可以作為構(gòu)思效度的證據(jù)。如果對測題的反應(yīng)包括了社會贊許和道德評判,不一定能反映被試者的行為,則影響構(gòu)思效度。2、測驗間的相互比較通過分析幾個測驗間的相互關(guān)系,找出其共同之處,進而推斷這些測驗測量的特質(zhì),以確定這些測驗構(gòu)思效度。相容效度(congruentvalidity)

:與其他測量同一構(gòu)思的測驗有相關(guān)。其中一個是新測驗,另一個是已有效度證據(jù)的成熟測驗,兩者測量的是同一種心理特質(zhì)。假如相關(guān)高,說明新測驗所測量的特質(zhì)確實是老測驗所反映的特質(zhì)或行為。因為兩測驗的相關(guān)系數(shù)的平方即是兩組測驗分?jǐn)?shù)所共同解釋的變異大小,所以稱這一相關(guān)為相容效度。

區(qū)分效度(discriminatevalidity):必須與測量不同構(gòu)思的測驗無相關(guān)。

因素分析法(factoranalysis):可以找到影響測驗分?jǐn)?shù)的共同因素。3、效標(biāo)效度的研究證明

一個測驗若效標(biāo)效度理想,那么該測驗所預(yù)測的效標(biāo)的性質(zhì)和種類就可以作為分析測驗構(gòu)思效度的指標(biāo)??梢愿鶕?jù)效標(biāo)選取不同的被試形成相對照的兩組;也可以根據(jù)測驗分?jǐn)?shù)分成高分組與低分組。另一種證實構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。4、實驗法和觀察法證實觀察實驗前和實驗后分?jǐn)?shù)的差異也是驗證構(gòu)思效度的方法。三、效標(biāo)效度(criterion—relatedvalidity)(一)什么是效標(biāo)效度(實證效度)效標(biāo)效度反映的是測驗預(yù)測個體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測的行為是檢驗效度的標(biāo)準(zhǔn),簡稱效標(biāo)。根據(jù)效標(biāo)資料是否與測驗分?jǐn)?shù)同時獲得,又可分為同時效度和預(yù)測效度。前者與用來診斷現(xiàn)狀的測驗有關(guān)(如心理特征的評估及診斷),后者與預(yù)測將來結(jié)果的測驗有關(guān)(如用于選拔、分組的)。一個好的效標(biāo)必須具備以下條件(略)效標(biāo)必須能最有效地反映測驗的目標(biāo),即效標(biāo)測量本身必須有效;效標(biāo)必須具有較高的信度,穩(wěn)定可靠,不隨時間等因素而變化;效標(biāo)可以客觀地加以測量,可用數(shù)據(jù)或等級來表示;效標(biāo)測量的方法簡單,省時省力,經(jīng)濟實用。例如:GRE的成績能預(yù)測將來能否取得學(xué)位,說明GRE能測量大學(xué)畢業(yè)生的專業(yè)基礎(chǔ)和能力。(二)效標(biāo)效度的評估方法效標(biāo)效度有多種評估方法,下面介紹3種常用的方法:1、相關(guān)法:測驗分?jǐn)?shù)與效標(biāo)資料間的相關(guān)系數(shù),稱為效度系數(shù)。

a.積差相關(guān)法:前者和后者都為連續(xù)變量

b.點二列相關(guān)法:連續(xù)變量和真正的二分變量二列相關(guān)法:連續(xù)變量和人為的二分變量

c.賈斯朋(Juspen)多系列相關(guān)法:連續(xù)變量和等級評定變量2、區(qū)分法:檢驗測驗分?jǐn)?shù)能否有效的區(qū)分有效標(biāo)所定義的團體的一種方法。計算公式如下:

問題:組間平均數(shù)差異在統(tǒng)計上的顯著性取決于團體的大小。3、命中率法:當(dāng)測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標(biāo)的一種方法。測驗分?jǐn)?shù):確定一個臨界分?jǐn)?shù)(即分?jǐn)?shù)線)。效標(biāo)資料:根據(jù)實際的工作或?qū)W習(xí)成績,確定一合格標(biāo)準(zhǔn)。

效標(biāo)成績

測驗預(yù)測失?。ā┏晒Γ?)成功(+)(A)失誤(B)命中失敗(—)(C)命中(D)失誤

命中率的計算有兩種方法:

總命中率

正命中率第三單元效度的功能一、預(yù)測誤差效度系數(shù)的實際意義常常以決定性系數(shù)來表示,意旨相關(guān)系數(shù)的平方。它表示測驗正確預(yù)測或解釋的效標(biāo)的方差占總方差的比例。估計的標(biāo)準(zhǔn)誤。是指所有具有某一測驗分?jǐn)?shù)的被試其效度分?jǐn)?shù)(Y)分布的標(biāo)準(zhǔn)差,也即預(yù)測誤差大小的估計值,是對真正分?jǐn)?shù)估計的誤差大小。二、預(yù)測效標(biāo)分?jǐn)?shù)在測驗工作中,人們感興趣的是從測驗分?jǐn)?shù)預(yù)測效標(biāo)成績,最常用的是Y對X的回歸方程:三、預(yù)測效率指數(shù)無關(guān)系數(shù)K值大小表明預(yù)測源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無關(guān)的程度。預(yù)測效率的指數(shù)E=100(1-K)

E值大小表明使用測驗比盲目猜測能減少多少誤差。

例題見366頁。第四單元影響效度的因素

影響效度的因素很多,凡能產(chǎn)生隨機誤差和系統(tǒng)誤差的因素都會降低測驗的效度。一、測驗本身的因素

測驗取材的代表性、測驗長度、試題類型、難度、區(qū)分度以及編排方式等都會影響效度。保證測驗較高效度要點:測驗材料必須對整個內(nèi)容具有代表性;測題設(shè)計時應(yīng)盡量避免容易引起誤差的題型(如是非題);測題難度要適中,具有較高的區(qū)分度;測驗長度要恰當(dāng),即要有一定的測題量;測題的排列按先易后難順序。二、測驗實施中的干擾因素

(一)主試的影響因素測驗實施過程中主試的因素會影響效度。必須按標(biāo)準(zhǔn)化的規(guī)定實施測驗。效標(biāo)效度,測驗與效標(biāo)二者實施時間間隔越長,測驗與效標(biāo)越容易受到很多機遇因素的影響。測驗情境,如場地的布置、材料的準(zhǔn)備、測驗場所有無噪音和其他干擾因素等也會影響到測驗的效度。

(二)被試的影響因素

被試在測驗時的興趣、動機、情緒、態(tài)度和身心狀況、健康狀態(tài)以及是否充分合作與盡力而為等,都會影響被試在測驗情境中的反應(yīng),因而影響測驗結(jié)果的效度。被試的反應(yīng)定勢也會降低測驗的效度。三、樣本團體的性質(zhì)測驗的效度和樣本團體的特點具有很大的關(guān)系。同一測驗對于不同的樣本團體其效度有很大的不同,因此在作效度分析時,必須選擇具有代表性的被試團體。(一)樣本團體的異質(zhì)性.與信度系數(shù)一樣,如果其他條件相同,樣本團體越同質(zhì),分?jǐn)?shù)分布范圍越小,測驗效度就越低;樣本團體越越異質(zhì),分?jǐn)?shù)分布范圍越大,測驗效度就越高。其中有兩種情況會影響樣本團體的異質(zhì)性:

只以選拔上的被試為樣本團體參加效度研究,降低了測驗的效度。

選拔標(biāo)準(zhǔn)太高,樣本團體的同質(zhì)性增加,降低了測驗的效度。(二)干涉變量對于不同性質(zhì)的團體,同一測驗的效度會有很大的不同。這些性質(zhì)包括年齡、性別、教育水平、智力、動機、興趣、職業(yè)和任何有關(guān)的特征。測量學(xué)上稱這些特征為干涉變量(moderatorvariable)。

美國心理學(xué)家吉賽利(E.E.Ghiselli)提出的如何找出干涉變量的方法:用回歸方程求得每個人的預(yù)測效標(biāo)分?jǐn)?shù),將該分?jǐn)?shù)與實際效標(biāo)分?jǐn)?shù)相比較,獲得分?jǐn)?shù)D。如果D的絕對值很大,說明測驗中可能存在干涉變量。根據(jù)本團體的組成分析,找出對照組,分別計算效度,找出干涉變量。對于預(yù)測團體,根據(jù)某些易見的干涉變量將其區(qū)分為預(yù)測性高和預(yù)測性低的兩個亞團體。對于預(yù)測性高的團體,獲得的測驗效度會有所提高。

四、效標(biāo)的性質(zhì)

效標(biāo)效度是以測驗分?jǐn)?shù)與效標(biāo)測量的相關(guān)系數(shù)來表示的。效標(biāo)的性質(zhì)需要考慮:效標(biāo)與測驗分?jǐn)?shù)之間的關(guān)系是否是線性關(guān)系效標(biāo)測量本身有可靠性第五節(jié)項目分析測驗的項目分析:定性分析,包括考慮內(nèi)容效度,題目編寫的恰當(dāng)性和有效性等;定量分析,主要是對題目難度和區(qū)分度等進行分析。通過項目分析,可以選擇和修改測驗題目,以提高測驗的信度和效度。第一單元項目的難度一、定義難度(difficulty),是指項目的難易程度。能力測驗---反映難度水平的指標(biāo)非能力測驗---類似的指標(biāo)是“通俗性”難度的指標(biāo):以答對或通過該題的人數(shù)百分比來表示:也稱易度:P值大小與難度高低成反比。難度的指標(biāo):被試者未通過每個項目的人數(shù)百分比二、計算方法(一)二分法記分的項目選擇題,通過記1分,錯誤記0分。可直接用公式5—31計算難度。當(dāng)被試人數(shù)較多時,則可根據(jù)測驗總成績將被試分成三組:分?jǐn)?shù)最高的27%被試為高分組,分?jǐn)?shù)最低的27%被試為低分組,中間46%的被試為中間組。分別計算高分組和低分組的通過率,以兩組通過率的平均值作為每一題的難度。其公式為:

為了平衡機遇對難度的影響,吉爾福特提出了一個難度的校正公式:(二)非二分記分的項目當(dāng)測驗項目為問答題或不能用二分法記分的形式時,一般用下面的公式計算難度。三、難度水平的確定(一)項目的難度進行難度分析的主要目的是為了篩選項目,項目的難度多高合適,取決于測驗的目的、性質(zhì)以及項目的形式。當(dāng)測驗用于選拔或診斷時,應(yīng)該比較多地選擇難度值接近錄取率的項目。選擇題P值一般應(yīng)大于概率水平,是非題難度為0.73,四選一為0.63較合適。(二)測驗的難度測驗的難度直接依賴于組成測驗的項目的難度。通過考察測驗分?jǐn)?shù)的分布,可以對測驗的難度做出直觀檢驗。A為正偏態(tài)分布,即大多數(shù)得分集中在低端,說明編制的測驗對于所要研究的樣本團夠來說偏難,因此必須增加較低難度的項目;B為負(fù)偏態(tài)分布,測驗過易,必須增加有較高難度的項目。第二單元項目的區(qū)分度一、定義

項目區(qū)分度(itemdiscrimination),也叫鑒別力,是指測驗項目對被試的心理特性的區(qū)分能力。如果一個項目,實際水平高的被試能順利通過,而實際水平低的被試不能通過.那么我們就可以認(rèn)為該項目有較高的區(qū)分度。項目區(qū)分度是評價項目質(zhì)量和篩選項目的主要指標(biāo),也是影響測驗效度的重要因素。區(qū)分度取值范圍介于-1.00至+1.00之間。二、計算方法

在估計項目區(qū)分度時,常用其他指標(biāo)替代實際能力水平,其中用的最多的時測驗總分。

(一)鑒別指數(shù)按測驗總分高低排列答卷;確定高分組與低分組,每一組取答卷總數(shù)的27%分別計算高分組與低分組在該項目上的通過率或得分率按下列公式估計出項目的鑒別指數(shù):

美國測驗專家伊貝爾(L.Ebel)提出用鑒別指數(shù)評價項目性能的標(biāo)準(zhǔn)。如下表:(二)相關(guān)法計算區(qū)分度最常用的方法是相關(guān)法,即以某一項目分?jǐn)?shù)與效標(biāo)成績或測驗總分的相關(guān)作為該項目區(qū)分度的指標(biāo)。點二列相關(guān):適用與一類變量為二分稱名變量,另一類變量為連續(xù)變量的成對變量的相關(guān)計算。二列相關(guān):適用于兩個連續(xù)變量,但其中一個變量被人為分成兩類。Φ相關(guān)法:適用于兩個變量均為二分稱名變量。三、區(qū)分度與難度的關(guān)系

如果每一個項目的難度均處于0.50,有可能大多趨向于有關(guān)的內(nèi)容或技能,結(jié)果造成項目同質(zhì)性提高。在極端的情況下,有可能50%的被試全部通過各項目得滿分,另外50%的被試全部為0分,形成U形分布,這樣反而降低總分的區(qū)分能力。如果測驗的所有項目都是中等難度,只有項目的內(nèi)在相關(guān)為0時,整個測驗才能產(chǎn)生常態(tài)分布??紤]到一般測驗項目之間具有某種程度的相關(guān),難度的分布廣一些,梯度多一些,是合乎需要的。難度和區(qū)分度都是相對的,較難的項目對高水平的被試區(qū)分度高,較易的項目對水平低的被試區(qū)分度高,中等難度的項目對中等水平的被試區(qū)分度高。對被試總體較難或較易的項目,對水平高或水平低的被試便成了中等難度。

人的大多數(shù)心理特性呈常態(tài)分布,項目難度的分布也以常態(tài)分布為好,即特別難與特別易的項目少些,接近中等難度的項目多些,而所有項目的平均難度為0.50。這樣不僅能保證多數(shù)項目具有較高的區(qū)分度,而且可以保證整個測驗對被試具有較高的區(qū)分能力。第六節(jié)測驗的編制的一般程序第一單元測驗的目標(biāo)分析一、測驗的對象明確測驗編成后要用于的團體。應(yīng)了解受測者的年齡、受教育程度和社會經(jīng)濟以及閱讀水平等。在測驗編制及建立常模過程中還應(yīng)考慮文化背景的影響。如韋氏智力測驗,分城市式和農(nóng)村式。二、測驗的用途明確測驗的用途:描述、診斷,或是選拔和預(yù)測。用途不同,編制測驗時的取材范圍以及試題難度等也不盡相同。根據(jù)測驗的用途分類:顯示和預(yù)測。測驗就有顯示性測驗和預(yù)測性測驗。(一)顯示性測驗顯示性測驗是指測驗題目和所要測量的心理特征相似的測驗。例如成就測驗。顯示性測驗(古德納夫):樣本測驗和標(biāo)記測驗。題目取自一個很明確的總體的測驗即是樣本測驗,例如測量學(xué)生的四則混合運算能力題目取自一個全開放的總體的測驗即是標(biāo)記測驗,例如智力測驗。如果被試在智力測驗上得分高,而且在實際生活中確實也很聰明,那么這個測驗就算是智力的比較好的標(biāo)記,因為它指出了或標(biāo)記了所取樣總體的性質(zhì)。(二)預(yù)測性測驗預(yù)測性測驗是指預(yù)測一些沒被測量的行為的測驗。例如GRE中的詞匯測驗,能預(yù)測被試將來在大學(xué)里的學(xué)業(yè)表現(xiàn)。編制預(yù)測性測驗最關(guān)心的是測驗分?jǐn)?shù)與預(yù)測行為之間的關(guān)系,要搞清楚哪些因素可以預(yù)測。顯示性測驗和預(yù)測性測驗的區(qū)分并不是絕對的,有時是統(tǒng)一的。如高考,是樣本測驗,又是預(yù)測測驗。三、測驗的目標(biāo)心理測驗的目標(biāo)是指編制的測驗測量什么樣的心理變量或行為特征。目標(biāo)分析過程:測驗編制者對測驗?zāi)繕?biāo)加以分析,將其目標(biāo)轉(zhuǎn)換成可操作的術(shù)語。

目標(biāo)分析以測驗不同而異,一般可分為三種情況:(一)工作分析對于選拔和預(yù)測功用的預(yù)測性測驗,它的主要任務(wù)就是要對所預(yù)測的行為活動作具體分析,我們稱之為任務(wù)分析或工作分析。這種分析包括兩個步驟:第一是確定:心理特征和行為-------要預(yù)測的活動達(dá)到成功,如職業(yè)興趣測驗中的打字項目,假定手指的靈活性、手眼協(xié)調(diào)等能力是打字必需的;證卷公司選錄入員。通過參閱前人的工作從理論上分析通過對已經(jīng)錄用或已經(jīng)成功的人員的行為分析確定測驗的能力、技能或特質(zhì)--------選擇測量的題目。第二是建立衡量被試是否成功的標(biāo)準(zhǔn),即效標(biāo)。是鑒別測驗的預(yù)測能力是否有效的重要指標(biāo)。好經(jīng)理的標(biāo)準(zhǔn):每天洗頭、刮胡子、衣著整齊、出門總開汽車,還是思路清晰、頭腦清醒、IQ為140?(二)對特定概念下定義定義要測量的心理或行為特質(zhì)-----包含的維量(行為表現(xiàn)或測量)。例如創(chuàng)造力的測量,有人將創(chuàng)造力定義為發(fā)散思維的能力,即對規(guī)定的刺激產(chǎn)生大量的、變化的、獨特的反應(yīng)。根據(jù)此操作定義,創(chuàng)造力則應(yīng)該從反應(yīng)的流暢性、靈活性、獨創(chuàng)性和詳盡性四個方面來測量。(三)確定測驗的具體內(nèi)容顯示測驗的目標(biāo)分析的主要任務(wù)是確定顯示的內(nèi)容和技能,從中取樣。成就測驗的內(nèi)容分析過程主要體現(xiàn)在雙向細(xì)目表的編制過程中。這是一個由測量的內(nèi)容材料維度和行為目標(biāo)維度所構(gòu)成的表格,它能幫助成就測驗的編制者決定應(yīng)該選擇哪些方面的題目以及各題目所占的比例。表5—8小學(xué)自然常識測驗雙向細(xì)目表

行為目標(biāo)教材內(nèi)容獲得基本知識了解原理原則應(yīng)用原理原則分析因果關(guān)系綜合成有系統(tǒng)見解建立評價標(biāo)準(zhǔn)合計生物世界資源利用動力和機械物質(zhì)特性與能量氣象宇宙地球3225222533645263483423123211210220110110002010122513128合計1828301383100第二單元測題的編寫編制測驗題目涉及到從寫出、編輯,到預(yù)試、修改等這樣一個循環(huán)過程。在得到一套令人滿意的測題之前,這些步驟是不斷重復(fù)的。一、搜集資料測驗計劃編好后,就要搜集有關(guān)資料作為命題取材的依據(jù),一個測驗的好壞和測驗材料的選擇適當(dāng)與否有密切關(guān)系。題目的來源可分為三個方面:(一)已出版的標(biāo)準(zhǔn)測驗從已經(jīng)出版的各種標(biāo)準(zhǔn)測驗中選擇合適的題目。比如MMPI的簡本;敵意量表,來自于MMPI;成就測驗,題目可來源于課本、參考書、講義和課題討論等素材。(二)理論和專家的經(jīng)驗理論和專家經(jīng)驗有時也可以作為題目的來源之一,比如要編制態(tài)度量表,那么理論上不少對態(tài)度的類型、性質(zhì)維度、定義等等的描述就可以轉(zhuǎn)換成題目,或用具體的例子。(三)臨床觀察和記錄臨床觀察也可以作為題目的來源,各種觀察量表或檢核表很多都是來源于觀察到的行為表現(xiàn),對于人格測驗而言,其題目就是臨床上描述人格的術(shù)語或詞匯。比如MMPI的題目就是從病歷記錄中篩選出來的。二、命題的一般原則編制測驗題目,類型繁多、功能各異、性質(zhì)不一,詳細(xì)說明每一種題目的具體編制方法實屬不能,但一般原則還是有的。這些原則可以從內(nèi)容、文字、理解和社會敏感性四個方面來考慮。(一)內(nèi)容方面要求題目的內(nèi)容符合測驗的目的,避免貪多而亂出題目;內(nèi)容取樣要有代表性,符合測驗計劃的內(nèi)容,比例適當(dāng);題目間內(nèi)容相互獨立,互不牽連,切忌一個題目的答案影響對另一個題目的回答。(二)文字方面使用準(zhǔn)確的當(dāng)代語言,避免使用生僻的字句或詞匯;語句要簡明扼要,既排除與答案無關(guān)的因素,又不要遺漏答題所依據(jù)的必要條件;一句話說明一個概念,不要使用兩個或兩個以上的觀念,意義必須明確,不得暖昧或含糊,盡量少使用雙重否定句。(三)理解方面題目應(yīng)有確切的答案,除創(chuàng)造力測驗和人格測驗外不應(yīng)具有引起爭議的可能;題目的內(nèi)容不要超出受測團體的知識水平和理解能力;題目的格式要不被人誤解。(四)社會敏感性方面應(yīng)盡量避開社會敏感性問題(性關(guān)系、性觀念及自殺等),如涉及社會禁忌或個人隱私的題目不應(yīng)使用。編制涉及這類社會敏感性問題測驗的策略(Phillips,D.L.):1.命題時假定被試具有某種行為,使他不得不在確實沒有該行為時才否定,可避免否定答案過多的傾向。如:“你平均多久才手淫一次,每月一次?每周一次?每天一次?從不?”2.命題時假定規(guī)范不一致,如“有些醫(yī)生認(rèn)為吸煙有害,而另一些醫(yī)生則認(rèn)為吸煙有益,你認(rèn)為呢?”3.指出該行為是常見的,雖然是違規(guī)的,如“多數(shù)人在看色情電影時有性沖動,你呢?”三、測題的編制要領(lǐng)根據(jù)對被試的要求不同對心理測驗的題目進行分類:提供型和選擇型題目。提供型題目給出正確答案,如論文提、問答題、填充題。選擇型題目要求在有限的幾個答案中選擇正確的答案,如選擇題、是非題、匹配題等。(一)選擇題題干就是呈現(xiàn)一個問題的情境,一般由直接問句或不完全的陳述句構(gòu)成。選項就是問題的多種可能答案,常常是包含一個正確答案,若干(一般是1-5個)錯誤答案,其中錯誤的答案叫“誘答”,是為了迷惑那些無法確定答案的被試。1.題干所提的問題必須明確,盡量使用簡單而且明晰的詞語。做到題干意義完整,即使被試不看選項亦能完全理解。不要在題干中夾有選項,或者摻有不切題的內(nèi)容。2.選項切忌冗長,要簡明扼要。選項中共同用到的詞語刪掉,放到題干中去,可使題意更明確,同時減少被試看題時間。3.每題只給一個正確答案,其他屬誘答。若是找最合適的答案,則應(yīng)用這樣的問句:“下列答案中哪個最合適?”以免引起困惑。4.各選項長度應(yīng)相等,盡量不要有長有短。同時,選項與題干的聯(lián)系要非常密切。誘答也必須一致,以免被試很容易就排除了誘答項目。5.避免題干用詞與選項用詞一致,否則成了選擇答案的線索。正確答案有修飾用語或用正規(guī)的詞語,而誘答選項均沒有,也會給被試提供線索,應(yīng)避免?!皼Q不”、“從來”、“所有”、“惟一”、“絕對”等詞,不適用于選項中。6.選項最好用同一形式。如同是人名,同是日期,同是物理現(xiàn)象等等,長度最好相等。選項的排列最好隨機,除非本身有邏輯順序。(二)是非題是非題又叫正誤題,是指出一個論點要被試判斷是否正確,或是從是非兩個答案做出選擇,因此可以把是非題看作是兩個備選答案的選擇題。例:(1)你常常會主動地去做一些有意義的習(xí)題嗎?是□否□

(2)你常常主動給朋友寫信或打電話嗎?是□否□編制是非題應(yīng)注意:1.內(nèi)容應(yīng)以有意義的概念、事實或基本原則為基礎(chǔ),不要在敘述中出現(xiàn)瑣碎的細(xì)節(jié)或無關(guān)的話語,不要照抄原文。2.每道題只能包含一個概念,避免兩個或兩個以上的概念出現(xiàn)在同一個題目中,造成“半對半錯”或“似是而非”的情況。3.盡量避免否定的敘述,尤其是要避免用雙重否定的敘述。因為否定的敘述常會被人誤認(rèn)為是肯定的敘述,將“不”字忽略,雙重否定尤其容易使人困惑,不如直接采用肯定的敘述為佳。4.若是表達(dá)意見的題目,最好說明意見的來源和根據(jù),以便測出被試是否了解某個人或某些人的意見、信念或價值觀念等。5.“是”、“非”題的數(shù)目應(yīng)有適應(yīng)比例,基本相等,且要隨機排列?!笆恰?、“非”題目的編寫在長度和復(fù)雜性上應(yīng)盡量保持一致。(三)簡答題簡答題是提供型題目,它要求被試用一個正確的詞或句子來完成或填充一個未完成句子的空白,或者是提供一個正確的答案。有時將前者稱之為填充題,后者稱之為簡答題。例:世界上第一個智力測驗是由

編制的。(填充題)夏天為什么要穿淺顏色的衣服,不穿深顏色的衣服?(簡答題)編制簡答題有三條原則:1.宜用問句形式。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論