1-5心理測(cè)量學(xué)框架(3級(jí)心理咨詢師重點(diǎn)知識(shí)點(diǎn)自己整理)_第1頁(yè)
1-5心理測(cè)量學(xué)框架(3級(jí)心理咨詢師重點(diǎn)知識(shí)點(diǎn)自己整理)_第2頁(yè)
1-5心理測(cè)量學(xué)框架(3級(jí)心理咨詢師重點(diǎn)知識(shí)點(diǎn)自己整理)_第3頁(yè)
1-5心理測(cè)量學(xué)框架(3級(jí)心理咨詢師重點(diǎn)知識(shí)點(diǎn)自己整理)_第4頁(yè)
1-5心理測(cè)量學(xué)框架(3級(jí)心理咨詢師重點(diǎn)知識(shí)點(diǎn)自己整理)_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、心理測(cè)量學(xué)知識(shí)第一節(jié)概述第一單元測(cè)量與測(cè)量量表一、什么是測(cè)量測(cè)量就是依據(jù)一定的法則用數(shù)字對(duì)事物加以確定。 測(cè)量的三個(gè)元素 事物:測(cè)量的對(duì)象,更確切的說,就是引起我們興趣的事物的屬性和 特征。數(shù)字:某一事物或該事物某一屬性的量, 具有區(qū)分性、序列或等級(jí)性、 等距性、可加性法則:測(cè)量所依據(jù)的規(guī)則和方法。二、測(cè)量的基本要素1.參照點(diǎn):確定事物的量,須有一個(gè)計(jì)算的起點(diǎn),這個(gè)起點(diǎn)叫參照點(diǎn)。絕對(duì)零點(diǎn) :(絕對(duì)參照點(diǎn))重量、長(zhǎng)度等,0 即無,表示什么都測(cè)不到。 相對(duì)零點(diǎn):(相對(duì)參照點(diǎn))人定的 0,海拔高度,溫度, 0IQ=0 0歲兒童一般的智力 心理測(cè)量的單位不夠完善:既無統(tǒng)一的單位,也不符合等距的要求。三

2、、測(cè)量量表命名量表用數(shù)字來代表個(gè)別事物或歸類。如運(yùn)動(dòng)員編號(hào),或用 1代表男, 2代表女。數(shù)字只用來標(biāo)記或分類,而不能做數(shù)量化分析,不能比大小,也不能作四則運(yùn)算順序量表數(shù)字不僅代表類別, 還指明類別的大小某種屬性的程度。 用于分等或排出順序,無相等單位,無絕對(duì)零點(diǎn),如考試第 1 名,2名等距量表 不但有大小關(guān)系,且有相同單位,但無絕對(duì)零點(diǎn),可做加減運(yùn)算,不 能乘除, 200度比 100度,但不能說 200度是 100度的 2倍,0度是 人為定的相對(duì)零點(diǎn)等比量表最高水平的量表,有絕對(duì)零點(diǎn),可做四則運(yùn)算。 心理測(cè)量一般用順序量表。第二單元 心理測(cè)量的基本概念心理測(cè)量的定義依據(jù)心理學(xué)理論, 使用一定的

3、操作程序, 通過觀察人的少數(shù)有代表性 的行為,對(duì)于貫穿在人的全部行為活動(dòng)中的心理特點(diǎn)做出推論和數(shù)量 化的一種科學(xué)手段。1 心理測(cè)量的對(duì)象是人的行為。 2 只對(duì)少數(shù)經(jīng)過慎重選擇的行為樣本 進(jìn)行觀察,來間接推知受測(cè)者的心理特征。 3 為具有可比性,施測(cè)條 件要一致。 4 個(gè)人在測(cè)驗(yàn)中所得到的原始分?jǐn)?shù)并不具有任何意義,只 有將與其他人的分?jǐn)?shù)或常模相比才有意義。心理測(cè)量的性質(zhì)間接性、相對(duì)性、客觀性(一)間接性 :只能通過一個(gè)人對(duì)測(cè)驗(yàn)項(xiàng)目的反應(yīng)來推論出他 的心理特質(zhì)。 特質(zhì)是個(gè)人對(duì)刺激作反應(yīng)的一種內(nèi)在傾向。 是個(gè)體特有 的、穩(wěn)定的、可辯別的特征,它又是一個(gè)抽象產(chǎn)物,一個(gè)構(gòu)思,而不 是一個(gè)直接測(cè)量到的有實(shí)

4、體的個(gè)人特點(diǎn)。(二)相對(duì)性 :對(duì)人的行為做比較,沒有絕對(duì)標(biāo)準(zhǔn)。(三)客觀性:包括( 1)測(cè)驗(yàn)的刺激是客觀的; (2)對(duì)反應(yīng)的 量化是客觀的;(3)對(duì)結(jié)論的推論是客觀的。測(cè)驗(yàn)的客觀性實(shí)際上就 是測(cè)驗(yàn)的標(biāo)準(zhǔn)化問題。 包括測(cè)驗(yàn)用的項(xiàng)目或作業(yè)標(biāo)準(zhǔn)化、 評(píng)分記分的 原則和手段的標(biāo)準(zhǔn)化、分?jǐn)?shù)轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化。 測(cè)驗(yàn)的客觀性不包括 ()的客觀性。絕對(duì)的標(biāo)準(zhǔn) 特質(zhì):是個(gè)體特有的、穩(wěn)定的、可辨別的特征。 第三單元心理測(cè)驗(yàn)的分類 最高行為測(cè)驗(yàn) 有正確答案,智力測(cè)驗(yàn)和成就測(cè)驗(yàn)屬于最高行為測(cè)驗(yàn) 典型行為測(cè)驗(yàn) 沒有正確答案,各種人格測(cè)驗(yàn)均為典型行為測(cè)驗(yàn) 第四單元 糾正錯(cuò)誤的測(cè)驗(yàn)觀 測(cè)驗(yàn)萬(wàn)能論 測(cè)驗(yàn)無用論 心理測(cè)驗(yàn)

5、即智力測(cè)驗(yàn)第五單元 心理測(cè)驗(yàn)在心理咨詢中的作用一智力測(cè)驗(yàn)二人格測(cè)驗(yàn) 三心理評(píng)定量表 第六單元 心理測(cè)量的發(fā)展史 科學(xué)心理測(cè)驗(yàn)的產(chǎn)生與發(fā)展 高爾頓: 首先倡導(dǎo)科學(xué)心理測(cè)驗(yàn), 使用了測(cè)量差異, 心理測(cè)驗(yàn)的開端 他的學(xué)生皮爾遜:積差相關(guān)法卡特爾: 1890 年卡特爾在心理雜志上發(fā)表“心理測(cè)驗(yàn)與測(cè)量”第一 次心理測(cè)驗(yàn)名詞的出現(xiàn)比內(nèi):第一個(gè)正式的心理測(cè)驗(yàn) 第二節(jié)測(cè)驗(yàn)的常模 第一單元常模團(tuán)體 常模團(tuán)體是由具有某種共同特征的人所組成的一個(gè)群體, 或者是該群 體的一個(gè)樣本。先確定一般總體,再確定目標(biāo)總體,最后確定樣本。 常模團(tuán)體的條件1群體的構(gòu)成必須明確界定 2 代表性樣本 3 大小要適當(dāng)。總體數(shù)目小, 只有

6、幾十個(gè)人,則需要 100%的樣本。如果總體數(shù)目大,相應(yīng)的樣本 也大,一般最低不小于 30或 100個(gè)。全國(guó)性常模,一般應(yīng)有 20003000 人為宜。在實(shí)際工作中, 應(yīng)從經(jīng)濟(jì)的或?qū)嵱玫目赡苄院蜏p少誤差這兩 個(gè)方面來綜合考慮樣本的大小。 4 是一定時(shí)空的產(chǎn)物,注意選擇新近的常模取樣的方法(一)簡(jiǎn) 單隨機(jī)抽樣(二)系統(tǒng)抽樣(等距抽樣)(三)分 組抽樣(四)分層抽樣常模與常模分?jǐn)?shù)全國(guó)常模 區(qū)域常模 特殊常模原始分?jǐn)?shù) 導(dǎo)出分?jǐn)?shù)1 常模分?jǐn)?shù): 施測(cè)常模樣本被試后, 將被試者的原始分?jǐn)?shù)按一定規(guī)則 轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。2 原始分?jǐn)?shù):被試的反應(yīng)與標(biāo)準(zhǔn)答案相比較而得到的測(cè)驗(yàn)分?jǐn)?shù)叫原始 分。3 導(dǎo)出分?jǐn)?shù):由原始分

7、數(shù)構(gòu)成的分布轉(zhuǎn)換而來的分?jǐn)?shù)叫導(dǎo)出分?jǐn)?shù)。 第二單元 常模的類型一、發(fā)展常模(年齡量表)(一)發(fā)展順序量表葛塞爾發(fā)展程序表 按月份顯示兒童在運(yùn)動(dòng)水平、適應(yīng)性、語(yǔ)言、社會(huì)性四個(gè)方面的大致 水平。4 周,控制眼睛, 16 周,能使頭保持平衡, 28 周,能用手抓 握,40 周能控制軀干,坐立或爬行, 52周,控制腳的運(yùn)動(dòng),站立和Q土牡行走等。皮亞杰:5 歲理解質(zhì)量守恒, 6 歲掌握重量守恒, 7 歲容量守恒(二)智力年齡基礎(chǔ)年齡加高年齡水平的題目上獲得的附加月份之和。高年齡每道題 得2個(gè)月智齡。(三)年紀(jì)當(dāng)量(年級(jí)量表)以10個(gè)月為單位,為1年級(jí)二、百分位常模百分等級(jí)一個(gè)分?jǐn)?shù)的百分等級(jí)是指在常模樣本中

8、低于這個(gè)分?jǐn)?shù)的人數(shù)百分比。85表示有85%的人比這個(gè)分?jǐn)?shù)低百分點(diǎn)(百分位數(shù))百分點(diǎn)則是計(jì)算處于某一百分比例的人對(duì)應(yīng)的測(cè)驗(yàn)分?jǐn)?shù)是多少。四分位數(shù)和十分位數(shù)四分位數(shù)是將量表分成四等分,相當(dāng)于百分等級(jí)25%, 50%, 75%對(duì)應(yīng)的三個(gè)百分點(diǎn)分成的四段。三、標(biāo)準(zhǔn)分常模標(biāo)準(zhǔn)分常模是將原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表,因基本單位是標(biāo)準(zhǔn)差,所以叫標(biāo)準(zhǔn)分?jǐn)?shù)。標(biāo)準(zhǔn)差SD SQRT(刀(X-Xi) 2) 方差刀(XX) 2(一)線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)z =(Xsd)x為原始分?jǐn)?shù),X為樣本平均數(shù),SD為樣本標(biāo)準(zhǔn)差,z為某一分?jǐn)?shù)與平均數(shù)之差是標(biāo)準(zhǔn)差的幾倍??赡茇?fù),可 能是小數(shù)。Z=A+Bz,加上常數(shù)A是

9、為了去掉負(fù)數(shù),乘以常數(shù)是去掉小數(shù)點(diǎn)使 單位變小。不改變?cè)瓉淼牡染嚓P(guān)系。T分?jǐn)?shù)50 10 (加50平均數(shù),乘10標(biāo)準(zhǔn)差)九分 52十分5.51.5二十分103離差智商100 15(1)建立在統(tǒng)計(jì)學(xué)基礎(chǔ)之上;(2)它表示的是個(gè)體智力水平年齡組中所處的位置;(3)是表示智力高低的一種理想指標(biāo)。(二)非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)當(dāng)原始分?jǐn)?shù)不是常態(tài)分布時(shí),也可以通過非線性轉(zhuǎn)換使之常態(tài)化。 常 態(tài)化過程主要是將原始分?jǐn)?shù)轉(zhuǎn)化為百分等級(jí),再將百分等級(jí)轉(zhuǎn)化為常 態(tài)分布上相應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)。四、智商比率智商IQ二MA/CA*100, MA心理年齡,CA實(shí)足年齡離差智商平均數(shù)100,標(biāo)準(zhǔn)差15IQ=100+15( X-X) /

10、SD第三單元常模分?jǐn)?shù)的表現(xiàn)方法第三節(jié)測(cè)驗(yàn)的信度第一單元信度的概念信度:是指同一受測(cè)者在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)(或用另一套相等的測(cè)驗(yàn)) 重復(fù)測(cè)量,所得結(jié)果的一致程度。信度受隨機(jī)誤差影響,誤差式,信 度低。信度的指標(biāo)信度指數(shù)信度指數(shù)的平方就是信度系數(shù)測(cè)量一次,得到一個(gè)分?jǐn)?shù)的同時(shí),便有一個(gè)誤差,測(cè)多少次就有多少 次誤差。誤差組成了一組數(shù)據(jù),其標(biāo)準(zhǔn)差就是標(biāo)準(zhǔn)誤SE= Sx - rxxSE標(biāo)準(zhǔn)誤 Sx準(zhǔn)差 rxx彳信度系測(cè)量的標(biāo)準(zhǔn)誤和信度是互為消長(zhǎng)的關(guān)系,信度越高,標(biāo)準(zhǔn)誤越小,信 度越低,標(biāo)準(zhǔn)誤越大。第二單元信度評(píng)估的方法一、重測(cè)信度穩(wěn)定性系數(shù)兩到四周,間隔最好不超過 6個(gè)月二、復(fù)本信度等值性系數(shù)它是以兩

11、個(gè)等值但題目不同的測(cè)驗(yàn)來測(cè)量同一群體,然后求得 受測(cè)者在兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)。如果兩個(gè)復(fù)本的施測(cè)相隔一段時(shí)間,則稱重測(cè)復(fù)本信度或穩(wěn)定與等值 系數(shù)。復(fù)本信度的缺點(diǎn):(1)如果測(cè)量的行為易受練習(xí)的影響,則復(fù) 本信度只能減少而不能完全消除這種影響;(2)由于第二個(gè)測(cè)驗(yàn)只改變了題的內(nèi)容,已經(jīng)掌握的解題原則可以遷移到同類的問題;(3)對(duì)于許多測(cè)驗(yàn)來說,建立復(fù)本是十分困難的。三、內(nèi)部一致性信度分半信度同質(zhì)性信度測(cè)驗(yàn)內(nèi)部所有題目間的一致性,當(dāng)各個(gè)題目的得分有較高的正相關(guān)時(shí), 不論題目的內(nèi)容和形式如何,其測(cè)驗(yàn)是同質(zhì)的。幾個(gè)計(jì)算同質(zhì)性信度的公式如下:(1)庫(kù)德-理查遜公式(用于0、1記分)計(jì)算同質(zhì)性信度,常

12、用的是K-R20公式,在各測(cè)題難度相同或近似的情況下,還可采用計(jì)算更 為簡(jiǎn)便的K-R21公式。K-R20公式、K-R21公式有別于克倫巴赫a系數(shù)的是,它們只能 用于()。是非題(2 )克倫巴赫a系數(shù)(不適用于多重記分)四、評(píng)分者信度測(cè)量不同評(píng)分者之間產(chǎn)生的誤差。要求平均一致性達(dá)到 0.90以上, 才認(rèn)為評(píng)分是客觀的。 當(dāng)多個(gè)評(píng)分者評(píng)定多個(gè)對(duì)象,并以等級(jí)法記 分時(shí),可采用肯德爾和諧系數(shù)作為評(píng)分者信度的估計(jì)。第三單元信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋當(dāng)rxx0.70,不可靠不能用,當(dāng)0.70rxx0.85才用來鑒別升預(yù)測(cè)個(gè)人成績(jī)或作為。SE=Sx1 - rxx SE標(biāo)準(zhǔn)誤rxx測(cè)驗(yàn)的信度解釋個(gè)人分?jǐn)?shù)的意義95%

13、的概率水平,X-1.96SEXtWX+1.96SE這就是說,大約有 95%的可能性真分?jǐn)?shù)落在所得分?jǐn)?shù)1.96SE的范圍內(nèi)。比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異例:某人韋氏測(cè)驗(yàn) VIQ= 102, PIQ= 112,言語(yǔ)與操作測(cè)驗(yàn)的信度分 別為)0.87和0.88,操作智商是否顯著高于言語(yǔ)智商?解:求出 SEd= Sv2 xx r yy=15v2 -.87 0.88=7.5求出 Xa =1.96 SEd= 1.96X 7.5= 14.7實(shí)際的差為112102= 10 Xa ,所有兩者差異不顯著SEd標(biāo)準(zhǔn)誤,S標(biāo)準(zhǔn)差rxx ryy信度系數(shù)第四單元影響信度的因素一、樣本特征(一)樣本團(tuán)體異質(zhì)性的影響若獲得信度的取

14、樣團(tuán)體較為異質(zhì)的話,往往會(huì)高估測(cè)驗(yàn)的信度, 相反則會(huì)低估測(cè)驗(yàn)的信度。(二)樣本團(tuán)體平均能力水平的影響因?yàn)槊總€(gè)題目具有不同的難度,對(duì)幼年者和能力水平較低者,其 信度值相對(duì)較低。二、測(cè)驗(yàn)長(zhǎng)度(一)測(cè)驗(yàn)越長(zhǎng),測(cè)題取樣或內(nèi)容取樣越有代表性(二)測(cè)驗(yàn)越長(zhǎng),被試的猜測(cè)因素影響就越小。(三)測(cè)驗(yàn)太長(zhǎng),有時(shí)反而會(huì)引起被試者疲勞和反感而降低可靠性。 斯皮爾曼 -布朗公式 通過斯皮爾曼 -布朗公式的導(dǎo)出公式可計(jì)算出最少應(yīng)增加的題數(shù): (公式 5-18)。例:一個(gè)包括 40 個(gè)題目的測(cè)驗(yàn)信度為 0.80,欲將信度提高到 0.90, 問至少需要增加多少題目?根據(jù)斯皮爾曼布朗公式: K=0.90(10.80)/ 0.8

15、0(10.90)=2.25 即要取得 0.90 的信度,測(cè)驗(yàn)長(zhǎng)度就為原來的 2.25,即需要增加40 X 2.25=90 個(gè)題目,90-40=50。三、測(cè)驗(yàn)難度 (地板效應(yīng)與天花板效應(yīng))洛德(Lord)提出在學(xué)績(jī)測(cè)驗(yàn)中,為了保證其可靠性,各類選擇 題的理想平均難度為:五擇一測(cè)題, 0.70;四擇一測(cè)題, 0.74;三擇 一測(cè)題, 0.77;是非題, 0.85。只有平均難度水平為 50時(shí),才能使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大。四、時(shí)間間隔:兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度系數(shù)越大注意事項(xiàng)斯皮爾曼 -布朗公式為校正分半信度的經(jīng)驗(yàn)公式,它的假設(shè)是兩 半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)相等。當(dāng)假設(shè)不成立時(shí),可以采用弗朗那根(Fla

16、nagar)公式或盧倫(kulon)公式之一,直接求得測(cè)驗(yàn)的信度系 數(shù)。對(duì)于一些復(fù)雜的、 異質(zhì)的心理學(xué)變量, 采用單一的同質(zhì)性測(cè)驗(yàn)是不行的,因而常常采用若干個(gè)相對(duì)異質(zhì)的分測(cè)驗(yàn)第四節(jié) 測(cè)驗(yàn)的效度 美國(guó)心理學(xué)會(huì)在 1974 年發(fā)行的教育與心理測(cè)量之標(biāo)準(zhǔn) 一書 中將效度分為:( 1)內(nèi)容效度;(2)構(gòu)想效度;(3)效標(biāo)效度。 第一單元 效度的概念(有效性或者說準(zhǔn)確性)一、效度的定義 : 在心理測(cè)驗(yàn)中,效度是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符 合的程度,或者簡(jiǎn)單地說是指一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性。 (是科學(xué)測(cè)量 工具重要的必備條件) 。因?yàn)闇y(cè)驗(yàn)分?jǐn)?shù)的總方差等于真實(shí)方差與誤差方差之和 (公式 5-8 ),

17、而真實(shí)方差又分成兩部分,即有關(guān)方差與無關(guān)的但穩(wěn)定的方差: (公 式 5-19 )以公式 5-19 代入公式 5-8 得:(公式 5-20 )在測(cè)驗(yàn)理論中, 效度被定義為在一組測(cè)量中, 與測(cè)量目標(biāo)有關(guān)的 真實(shí)方差(或稱有效方差)與總方差的比率,即: (公式 5-21 )二、效度的性質(zhì)1. 效度具有相對(duì)性 任何測(cè)驗(yàn)的效度是對(duì)一定的目標(biāo)來說的, 或者說測(cè)驗(yàn)只有用于與測(cè)驗(yàn) 目標(biāo)一致的目的和場(chǎng)合才會(huì)有效。 效度具有相對(duì)性,在評(píng)鑒測(cè)驗(yàn)的效度時(shí),必須考慮測(cè)驗(yàn)的(目的) 與(功能)。2. 效度具有連續(xù)性測(cè)驗(yàn)效度通常用相關(guān)系數(shù)表示, 它只有程度上的不同, 而沒有“全有”或“全無”的區(qū)別。效度是針對(duì)測(cè)驗(yàn)結(jié)果的。

18、測(cè)驗(yàn)效度是“測(cè)驗(yàn)結(jié)果”的有效性程度。信度考慮的是隨機(jī)誤差,效度還包括與測(cè)驗(yàn)無關(guān)但穩(wěn)定的測(cè)量誤差。1 信度是效度的必要而非充分條件。 2 效度受信度制約。 效度高,信度必然高,當(dāng)信度高時(shí),效度不一定高,且效度不會(huì)超過 信度的平方根。第二單元 效度評(píng)估的方法一、內(nèi)容效度( content-related validity )什么是內(nèi)容效度: 內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性, 從而 確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。內(nèi)容效度的評(píng)估方法: (確定)1專家判斷法 (描述性語(yǔ)言) 請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容的符合性做出判斷, 看測(cè)驗(yàn)的 題目是否代表規(guī)定的內(nèi)容。 如果專家

19、認(rèn)為測(cè)驗(yàn)題目恰當(dāng)?shù)卮砹怂鶞y(cè) 內(nèi)容,則測(cè)驗(yàn)具有內(nèi)容效度。由這種估計(jì)效度的方法,是一個(gè)邏輯分 析的過程,所以內(nèi)容效度又稱“邏輯效度” 。為了使內(nèi)容效度內(nèi)容確定過程更為客觀 , 彌補(bǔ)專家的不足 , 可采 用如下幾個(gè)步驟:(1)定義好測(cè)驗(yàn)內(nèi)容的總體范圍,描述有關(guān)的知識(shí)與技能及所 用材料的來源;2)編制雙向細(xì)目,確定內(nèi)容和技能各自所占比例,并由測(cè)驗(yàn) 編制者確定各題所測(cè)是何種內(nèi)容與技能;(3)制定評(píng)定量表來測(cè)量測(cè)驗(yàn)的整個(gè)效度。2統(tǒng)計(jì)分析法 :包括( 1)對(duì)評(píng)分者一致性的評(píng)定; (2)兩個(gè)測(cè)驗(yàn)復(fù)本的相關(guān)性和課 程內(nèi)容的學(xué)習(xí)等分析; (3)再測(cè)法。3經(jīng)驗(yàn)推測(cè)法 :通過實(shí)踐來檢驗(yàn)效度。內(nèi)容效度的特性:內(nèi)容效度

20、經(jīng)常與表面效度( face validity )混淆。表面效度是 由外行對(duì)測(cè)驗(yàn)作表面上的檢查確定的, 它不反映測(cè)驗(yàn)實(shí)際測(cè)量的東西, 只是指測(cè)驗(yàn)表面上看來好像是測(cè)量所要測(cè)的東西; 內(nèi)容效度是由夠資 格的判斷者(專家)詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)而建立的。 最高行為測(cè)驗(yàn)注重表面效度,測(cè)典型行為時(shí)則應(yīng)該把表面效度 降低,盡量不讓你知道在測(cè)試的內(nèi)容。 這就是內(nèi)容效度與表面效度的 區(qū)別。二、構(gòu)想效度( construct-related validity )構(gòu)想效度指 (1)測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想或特質(zhì)的程度, (2) 即測(cè)驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、 術(shù)語(yǔ)或構(gòu)想, 解釋 的程度如何。(3

21、)涉及的是心理學(xué)的理論概念問題。 (4)構(gòu)思效度。構(gòu)想效度的估計(jì)方法:1 .對(duì)測(cè)驗(yàn)本身的分析:可以作為構(gòu)想效度的證據(jù)有:測(cè)驗(yàn)的 內(nèi)容有效;測(cè)驗(yàn)內(nèi)部一致性;被試者對(duì)題目的反應(yīng)特點(diǎn) 2 .測(cè)驗(yàn)間的相互比較: (1)相容效度:與其他測(cè)量同一構(gòu)思 的測(cè)驗(yàn)有相關(guān);( 2)區(qū)分效度:與測(cè)量不同構(gòu)思的測(cè)驗(yàn)無相關(guān): (3) 因素分析法:種因素與原先的理論構(gòu)思一致, 則說明構(gòu)思效度很高。 ) 3 效標(biāo)效度的研究證明4 實(shí)驗(yàn)法和觀察法證實(shí)三、效標(biāo)效度( criterion-related validity )什么是效標(biāo)效度效標(biāo)效度又稱實(shí)證效度, 反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行 為表現(xiàn)的有效性程度。 根據(jù)效標(biāo)資

22、料是否與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得, 又可 分為同時(shí)效度和預(yù)測(cè)效度兩類。一個(gè)好的效標(biāo)必須具備以下條件: 效標(biāo)必須能最有效地反映測(cè)驗(yàn)的目標(biāo), 即效標(biāo)測(cè)量本身必須有 效; 效標(biāo)必須具有較高的信度, 穩(wěn)定可靠,不隨時(shí)間等因素而變化; 效標(biāo)可以客觀地加以測(cè)量,可用數(shù)據(jù)或等級(jí)來表示; 效標(biāo)測(cè)量的方法簡(jiǎn)單,省時(shí)省力,經(jīng)濟(jì)實(shí)用。效標(biāo)效度的評(píng)估方法1相關(guān)法:相關(guān)法是評(píng)估效標(biāo)效度最常用的方法, 它是求測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)資料間 的相關(guān),這一相關(guān)系數(shù)稱為效度系數(shù)。效度系數(shù)的計(jì)算:積差相關(guān)法;點(diǎn)二列公式;二列公式;賈思朋多系列公式。 2區(qū)分法:區(qū)分法是檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的 一種方法。3命中率法 : 命中率

23、法是當(dāng)測(cè)驗(yàn)用來做取舍的依據(jù)時(shí),用其正確決定的比例 作為效度指標(biāo)的一種方法。四種情況:預(yù)測(cè)成功而且實(shí)際也成功;預(yù) 測(cè)成功但實(shí)際上失??; 預(yù)測(cè)失敗而事實(shí)成功; 預(yù)測(cè)失敗且實(shí)際上也失 敗。稱正確的預(yù)測(cè)為命中,不正確的預(yù)測(cè)為失誤。命中率高低常隨劃分測(cè)驗(yàn)分?jǐn)?shù)成功與失敗的臨界分?jǐn)?shù)的高低面 變化。臨界分?jǐn)?shù)越高,正命中率也越高;反之,臨界分?jǐn)?shù)越低,則正 命中率也越低。第三單元 效度的功能一、預(yù)測(cè)誤差 :效度系數(shù)的實(shí)際意義常常以決定性系數(shù)來表示,意指相關(guān)系數(shù) 的平方,它表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋的效標(biāo)的方差占總方差的比 例。決定系數(shù)是效度系數(shù)的平方。二、預(yù)測(cè)效標(biāo)分?jǐn)?shù) :如果 X 與 Y 兩變量呈直線相關(guān),只要確定出

24、二者間的回歸方程, 就可以從一個(gè)變量推估出另一個(gè)變量。三、預(yù)測(cè)效率指數(shù)E=100( 1-K) k 無關(guān)系數(shù) P386預(yù)測(cè)效率指數(shù) E 值的大小表明使用測(cè)驗(yàn)比盲目猜測(cè)能減少誤差,如一個(gè)測(cè)驗(yàn)的效度系數(shù)為 0、80, E=40,這表明由于該測(cè)驗(yàn)的使用,使得我們?cè)诠烙?jì)被試的效標(biāo)分?jǐn)?shù)時(shí)減少了( 40)的誤差。第四單元 影響效度的因素一、測(cè)驗(yàn)本身的因素 :(1)測(cè)驗(yàn)取材的代表性;(2)測(cè)驗(yàn)長(zhǎng)度;(3)試題類型、難度; (4)區(qū)分度以及編排方式等都會(huì)影響效度。二、測(cè)驗(yàn)實(shí)施中的干擾因素主試的影響因素被試的影響因素三、樣本團(tuán)體的性質(zhì) 樣本團(tuán)體的異質(zhì)性 :樣本團(tuán)體越同質(zhì),分?jǐn)?shù)頒布分布范圍越小, 測(cè)驗(yàn)效度就越低;樣

25、本團(tuán)體越異質(zhì),分?jǐn)?shù)分布范圍越大,測(cè)驗(yàn)效度就 越高。 一般而言,若獲得信度的取樣團(tuán)體較為異質(zhì)的話, 往往會(huì) (高估) 測(cè)驗(yàn)的信度,否則就會(huì)低估測(cè)驗(yàn)的信度 干涉變量: 對(duì)于不同性質(zhì)的團(tuán)體,同一測(cè)驗(yàn)的效度會(huì)有很大的不同。 美國(guó)心理學(xué)家吉塞利提出如何找出干涉變量的方法:1 、用回歸方程求得每個(gè)人的預(yù)測(cè)效標(biāo)分?jǐn)?shù),將該分?jǐn)?shù)與實(shí)際效 標(biāo)分?jǐn)?shù)相比較,獲得差異數(shù) D。如果D的絕對(duì)值很大,說明測(cè)驗(yàn)中的 可能存在干涉變量。2 、根據(jù)樣本團(tuán)體的組成分析,找出對(duì)照組,分別計(jì)算效度,從而找出干涉變量3 、對(duì)于欲測(cè)團(tuán)體,根據(jù)某些易見的干涉變量將其區(qū)分為預(yù)測(cè)性 高和預(yù)測(cè)性低的兩個(gè)團(tuán)體。對(duì)于預(yù)測(cè)性團(tuán)體低的,存在干涉變量。四、效

26、標(biāo)的性質(zhì)效標(biāo)與測(cè)驗(yàn)分?jǐn)?shù)之間的關(guān)系是否是線性關(guān)系是很重要的因素。 皮 爾遜積差相關(guān)系數(shù)的前題條件是假設(shè)兩個(gè)變量的關(guān)系是線性分布。 如 果是非線性分布則皮爾遜積差相關(guān)系數(shù)會(huì)低估相關(guān)的大小。效標(biāo)測(cè)量本身的可靠性是值得考慮的一個(gè)問題。 效標(biāo)測(cè)量的可靠 性即效標(biāo)測(cè)量的信度。(信度與效度的關(guān)系: 信度是效度的必要而非充分的條件, 效 度是受信度的制約。) 第五節(jié) 項(xiàng)目分析包括定性分析和定量分析兩個(gè)方面, 定性分析包括考慮內(nèi)容和效 度,題目編寫的恰當(dāng)和有效性等; 定量分析主要是指對(duì)題目難度和區(qū) 分度等。第一單元 項(xiàng)目的難度一、定義難度( difficulty ),顧名思義,是指項(xiàng)目的難易程度。在能力 測(cè)驗(yàn)中

27、通常需要一個(gè)反映難度水平的指標(biāo), 在非能力測(cè)驗(yàn) (如人格測(cè) 驗(yàn))中,類似的指標(biāo)是“通俗性” 。 難度的指標(biāo)通常以通過率表示, 即以答對(duì)或通過該題的人數(shù)百分比來表示 (公式5-31 ): P二R/NK 100% (用P代表,P值越大,難度越低)二、計(jì)算方法二分法記分的項(xiàng)目:通過記1分,錯(cuò)誤記0分,對(duì)這類題目可 直接用公式 5-31 計(jì)算難度。當(dāng)被試人數(shù)較多時(shí), 則可根據(jù)測(cè)驗(yàn)的總成績(jī)將被試分成三組: 分 數(shù)最高的 27被試為高分組,分?jǐn)?shù)最低的 27被試為低分組,中間 46的被試為中間組。 分別計(jì)算高分組和低分組的通過率, 經(jīng)兩組通 過率的平均值作為每一題的難度。 (公式 5-32 )由于選擇題允許

28、猜測(cè), 所以通過率可能因機(jī)遇作用變大, 吉爾福 特提出了一個(gè)難度校正公式(公式 5-33 ): CP=KP-1/K-1非二分記分的項(xiàng)目當(dāng)測(cè)驗(yàn)項(xiàng)目為問題答題或不能用二分法記分的形式時(shí), 一般用下 面的公式計(jì)算難度。(公式 5-34 ) P390三、難度水平的確定項(xiàng)目的難度:P 值越接近 0 或接近 1,越無法區(qū)分被試間能力的差異。相反, P 值越接近于 0.50 ,區(qū)別力越高。在選擇題目時(shí),最好使試題平均難度接近 050,而各題難度在 0 50020 之間。當(dāng)測(cè)驗(yàn)用于選拔或診斷時(shí), 應(yīng)該較多地選擇難度值接近錄取率的 項(xiàng)目。如錄取率 20%,則難度應(yīng)確定為 20%.對(duì)于選擇題來說, P 值一般應(yīng)大

29、于概率水平。對(duì)是非題其難度值應(yīng)該 為 075最為合適;而對(duì)于四選一題,其難度值約為 063 時(shí)最為合適。 洛德 (Lord) 提出在學(xué)績(jī)測(cè)驗(yàn)中,為了保證其可靠性,各類選擇 題的理想平均難度為:五擇一測(cè)題, 070;四擇一測(cè)題, 074;三 擇一測(cè)題, 077;二擇一題, () 。 0.85 測(cè)驗(yàn)的難度如果樣本具有代表性, 對(duì)于中等難度的應(yīng)該接近常態(tài)分配。 但有 些測(cè)驗(yàn),如掌握性測(cè)驗(yàn)或標(biāo)準(zhǔn)參照測(cè)驗(yàn), 分?jǐn)?shù)分布出現(xiàn)偏態(tài)是允許的。 數(shù)學(xué)測(cè)驗(yàn)的第 7 題滿分為 15 分,該題考生的平均分為 9.6 分, 測(cè)該題的難度為 (0.64)=9.6/15P二R/NX 100% 在340個(gè)學(xué)生中,答對(duì)項(xiàng)目的人數(shù)

30、為 120人, 則該項(xiàng)目的難度為 (0.35)在 700 名被試者中選為高分組和低分組的被試者各有 100 人,其中 高分組有 70 人答對(duì)第一題, 低分組有 40 人答對(duì)第一題, 則第一題的 難度為( 0.55)第二單元 項(xiàng)目的區(qū)分度一、定義項(xiàng)目區(qū)分度( item discrimination ), 也叫鑒別力,是指測(cè)驗(yàn)項(xiàng) 目對(duì)被試的心理特性的區(qū)分能力。區(qū)分度取值范圍介于 -1 至+1 之間,假如項(xiàng)目得分與實(shí)際能力水 平之間呈負(fù)相關(guān),則區(qū)分度為負(fù)值;若呈正相關(guān),則區(qū)分度為正值; 相關(guān)系數(shù)越大,區(qū)分度越高。當(dāng)區(qū)分度為負(fù)值時(shí),則意味著被試實(shí)際 能力越高,該項(xiàng)目的得分反而越低,這種情況一般很少發(fā)生

31、,如果出現(xiàn),該項(xiàng)目應(yīng)該淘汰。二、計(jì)算方法在理論上,項(xiàng)目區(qū)分度是以項(xiàng)目得分高低與實(shí)際能力水平高低之 間的相關(guān)來表示。而實(shí)際能力用的最多的是測(cè)驗(yàn)總分。計(jì)算項(xiàng)目難?度的公式:(1) P=R/NX 100% ; (2) P=( PH PZ / 2;( 3) P X 100%?maxX為全體受測(cè)者在該題上的平均分,Xmax為該題的滿分(P390頁(yè))鑒別指數(shù) (注意排列順序)1 、按測(cè)驗(yàn)總分高低排列答卷;2、確定高分組與低分組,每一組取答卷總數(shù) 27%;3 、分別計(jì)算高分組與低分組在該項(xiàng)目上的通過率或得分率;4、按下列公式估計(jì)項(xiàng)目的鑒別指數(shù):(公式5-35) : D=PPL, 高分組與低分組通過率1965

32、 年,美國(guó)專家伊貝爾提出評(píng)價(jià)項(xiàng)目性能標(biāo)準(zhǔn)是:0.40以上為“很好” ;0.30-0.39為“良好,修改后會(huì)更佳” ;0.20-0.29為 “尚可,但需修改” ;0.19以下為“差,必須淘汰”。相關(guān)法(記住它的方法及適用范圍)計(jì)算區(qū)分度最常用的方法。即以某一項(xiàng)目分?jǐn)?shù)與效標(biāo)成績(jī)或測(cè)驗(yàn) 總分的相關(guān)作為該項(xiàng)目區(qū)分的指標(biāo)。 相關(guān)越高,表明項(xiàng)目越具有區(qū)分 的功能。1 .點(diǎn)二列相關(guān):適用于一類變量為二分變量,另一類變量為連 續(xù)變量的成對(duì)變量相關(guān)的計(jì)算。2 .二列相關(guān):適用于兩個(gè)連續(xù)變量,但其中一個(gè)變量被人為分成兩類3 .相關(guān)法:適用于兩個(gè)變量均為二分稱名變量。若將測(cè)驗(yàn)總 分按及格、不及格或錄取、淘汰劃分,便

33、可計(jì)算相關(guān)系數(shù)。4 、積差相關(guān)三、區(qū)分度與難度的關(guān)系 總體上說,中等難度的項(xiàng)目區(qū)分度最高。一般說來, 較難的項(xiàng)目對(duì)高水平的被試區(qū)分度高, 較易的項(xiàng) 目對(duì)水平低的被試區(qū)分度高, 中等難的項(xiàng)目對(duì)中等水平的被試區(qū)分度 高。第六節(jié) 測(cè)驗(yàn)編制的一般程序第一單元 測(cè)驗(yàn)的目標(biāo)分析一、測(cè)驗(yàn)的對(duì)象 :年齡、受教育程度、社會(huì)經(jīng)濟(jì)、閱讀水平等。二、測(cè)驗(yàn)的用途 :描述、診斷、選拔、預(yù)測(cè)。顯示性測(cè)驗(yàn):指測(cè)驗(yàn)題目和所要測(cè)量的心理特征相似的測(cè) 驗(yàn)。如成就測(cè)驗(yàn)。 古德納夫分為:樣本測(cè)驗(yàn)和標(biāo)記測(cè)驗(yàn)。樣本測(cè)驗(yàn)題目取自一個(gè)很明確的總體的測(cè)驗(yàn)。 如測(cè)綜合運(yùn)算 能力。標(biāo)記測(cè)驗(yàn)題目取自一個(gè)全開放的總體的測(cè)驗(yàn)。如智力測(cè)驗(yàn)。預(yù)測(cè)性測(cè)驗(yàn):指預(yù)

34、測(cè)一些沒被測(cè)量的行為的測(cè)驗(yàn)。如GRE中的詞匯測(cè)驗(yàn)。 項(xiàng)目難度的分布一般以(常態(tài))分布為好,這樣不僅能保證多 數(shù)項(xiàng)目有較多的區(qū)分度, 而且可以保證整個(gè)測(cè)驗(yàn)對(duì)被試者有較高的區(qū) 分力。 三、測(cè)驗(yàn)的目標(biāo) :是指編制的目標(biāo)是用來測(cè)什么的,即用來測(cè) 什么樣的心理變量或心理特征。工作分析 對(duì)于選拔和預(yù)測(cè)功用的預(yù)測(cè)性測(cè)驗(yàn),它的主要 任務(wù)就是要對(duì)所預(yù)測(cè)的行為活動(dòng)作具體的分析, 稱之為任務(wù)分析或工 作分析。包括兩個(gè)步驟:第一是確定哪些心理特征和行為可能使要預(yù)測(cè)的活動(dòng)達(dá)到成功; 第二是建立衡量被試是否成功的標(biāo)準(zhǔn), 這個(gè)標(biāo)準(zhǔn)我們稱之為效標(biāo)。 對(duì)特定概念下定義 如果測(cè)驗(yàn)是為了測(cè)量某種特殊的心理 品質(zhì)或特點(diǎn),那么測(cè)驗(yàn)編制

35、者就必須給所要測(cè)量的心理或行為特質(zhì)下 定義,然后必須發(fā)現(xiàn)該特質(zhì)所包含的維量將通過什么行為表現(xiàn)出來或 怎樣進(jìn)行測(cè)量。確定測(cè)驗(yàn)的具體內(nèi)容 如果測(cè)驗(yàn)是描述性的顯示測(cè)驗(yàn),它 的目標(biāo)分析的主要任務(wù)則是確定顯示的內(nèi)容和技能,從中取樣。 目標(biāo)分析包括:( 1)工作分析;( 2)對(duì)特定的概念下定義; (3)確 定測(cè)驗(yàn)的具體內(nèi)容。 第二單元 測(cè)題的編寫一、搜集資料(避免直接翻譯國(guó)外的測(cè)驗(yàn)題)已出版的標(biāo)準(zhǔn)測(cè)驗(yàn)理論和專家的經(jīng)驗(yàn)臨床觀察和記錄二、命題 的一般原則內(nèi)容方面 :(1)題目的內(nèi)容符合測(cè)驗(yàn)的目的; (2)內(nèi)容的取 樣要有代表性;(3)題目間的內(nèi)容相互獨(dú)立。文字方面 :(1)使用當(dāng)代語(yǔ)言;(2)語(yǔ)句要簡(jiǎn)明扼要;

36、 (3) 最好一句話一個(gè)概念。 (3)排除與答案無關(guān)的因素。理解方面 :(1)題目要有確切答案; (2)題目的內(nèi)容不超出 受測(cè)團(tuán)體的知識(shí)水平和理解能力; (3)題目格式不要被人誤解; (4) 除創(chuàng)造力測(cè)驗(yàn)與人格測(cè)驗(yàn)外,不應(yīng)具有引起爭(zhēng)議的可能。社會(huì)敏感性方面: 盡量避開社會(huì)敏感性問題, 如涉及社會(huì)禁忌 或個(gè)人隱私的題目不應(yīng)使用。如必須涉及時(shí),菲力普列舉了幾條策略供參考:1 、命題時(shí)假設(shè)被試具有某種行為,使他不得不在確實(shí)沒有該行 為時(shí)才否定,可避免否定答案過多的傾向。如: “你平均多久才手淫 一次,每月一次?每周一次?每天一次?從不?”2 、命題時(shí)假定規(guī)范不一致,如“有些醫(yī)生認(rèn)為吸煙有害,而另 一

37、些醫(yī)生認(rèn)為吸煙有益,你認(rèn)為呢?”3 、提出該行為是常見的,雖然是違規(guī)的,如“多數(shù)人在看色情 電影時(shí)有性沖動(dòng),你呢?”三、測(cè)題的編制要領(lǐng)(分提供性和選擇性兩大類題目)1.選擇題:由兩部分構(gòu)成:題干和選項(xiàng)。選擇題注意事項(xiàng):1)題干所提的問題必須明確, 盡量使用簡(jiǎn)單而且明晰的詞語(yǔ)(2)選項(xiàng)切忌冗長(zhǎng),要簡(jiǎn)明扼要。(3)每題只給一個(gè)正確答案,其它屬誘答。(4)各選項(xiàng)長(zhǎng)度應(yīng)相等。(5)避免題干用詞與選項(xiàng)用詞一致 。(6)選項(xiàng)最好用同一形式2.是非題。是非題又叫正誤題, 是指出一個(gè)論點(diǎn)要被試判斷是否正確, 或是 從是非兩個(gè)答案做出選擇, 因此可以把是非題看作是兩個(gè)備選答案的 選擇題編制是非題應(yīng)注意:(1)內(nèi)

38、容應(yīng)以有意義的概念、事實(shí)或基本原則為基礎(chǔ)。(2)每道題只能包含一個(gè)概念。(3)盡量避免否定的敘述,尤其是要避免用雙重否定的敘述。(4)若是表達(dá)意見的題目,最好說明意見的來源和根據(jù)。(5)“是”、“非”題目的數(shù)目應(yīng)有適應(yīng)的比例,基本相等,且要 隨機(jī)排列。 在編制是非題時(shí), “是”、“非”題大致相等或答“否”題略多, 是控制肯定定勢(shì)的有效方法。 3.簡(jiǎn)答題在客觀測(cè)驗(yàn)試題中, 只有簡(jiǎn)答題是提供型題目, 它要求被試用一 個(gè)正確的詞或句子來完成或填充一個(gè)未完成句子的空白, 或者是提供 一個(gè)正確的答案。有時(shí)將前者稱之為填充題,后者稱之為簡(jiǎn)答題。編制簡(jiǎn)答題三原則:(1)宜用問句形式。如果使用未完成的句子,則

39、空格盡量放在最后。(2)如果是填充形式,空格不宜太多,過多空格會(huì)使題意不明 確,并且所空出的應(yīng)該是關(guān)鍵詞句。(3)每題應(yīng)只有一個(gè)正確答案,而且答案要簡(jiǎn)短而具體。對(duì)不完整的答案,應(yīng)事先規(guī)定評(píng)分標(biāo)準(zhǔn)。4.操作題操作題是介于一般認(rèn)知結(jié)果的紙筆測(cè)驗(yàn)和在未來真實(shí)情境的實(shí) 際活動(dòng)之間的測(cè)驗(yàn),是讓被試實(shí)際操作,如畫圖、走迷津、拼配物體 等,可作為紙筆測(cè)驗(yàn)題的補(bǔ)充。編制操作測(cè)驗(yàn)的四條原則:(1)明確所要測(cè)量的目標(biāo),并將其操作化;(2)盡量選擇真實(shí)性較高的項(xiàng)目;(3)指導(dǎo)語(yǔ)要簡(jiǎn)明扼要,并有具體的要求;(4)制定評(píng)分標(biāo)準(zhǔn),確定計(jì)分方法。第三單元 測(cè)驗(yàn)的編排和組織一、合成測(cè)驗(yàn)選擇與審定試題1.選擇試題形式選擇題目時(shí)

40、,需要考慮的幾點(diǎn):(1)測(cè)驗(yàn)的目的和材料的性質(zhì)(2)接受測(cè)驗(yàn)的團(tuán)體的特點(diǎn)(3)各種實(shí)際因素2.審定題目審定題目要注意以下幾個(gè)問題:(1)題目的范圍應(yīng)與測(cè)驗(yàn)計(jì)劃所列的內(nèi)容技能雙向目表一致;(2)題目的數(shù)量要比最后所需數(shù)目多一倍至幾倍,以備篩選和 編制復(fù)份;(3)題目的難度必須符合測(cè)驗(yàn)?zāi)康牡男枰?;?)題目的說明必須清楚明白。測(cè)題的編排測(cè)驗(yàn)編排的一般原則:1 、測(cè)題的難度排列宜逐步上升。2 、盡可能將同類型的測(cè)題組合在一起。3 、注意根據(jù)各種類型測(cè)量題本身的特點(diǎn)排列題目。 常見的兩種排列方式:1 、并列直進(jìn)式:是將整個(gè)測(cè)驗(yàn)按試題材料的性質(zhì)歸為若干分測(cè) 驗(yàn),在同一分測(cè)驗(yàn)的試題則依其難度由易到難排列。

41、 如韋克斯勒的成 人、兒童和幼兒三個(gè)智力量表。2、混合螺旋式:是先將種類試題依難度分成若干不同的層次,再將 不同性質(zhì)的試題予以組合,作交叉式的排列,其難度則漸次升進(jìn)。如 比內(nèi) - 西蒙智力量表。 測(cè)驗(yàn)編排的一般原則應(yīng)排除 () 答案混合排列 二、測(cè)驗(yàn)的預(yù)試預(yù)測(cè)預(yù)測(cè)應(yīng)注意以下幾個(gè)問題:1 、預(yù)測(cè)對(duì)象應(yīng)取自將來正式測(cè)驗(yàn)準(zhǔn)備應(yīng)用的群體。2 、預(yù)測(cè)的時(shí)限過程與情境應(yīng)力求與將來正式測(cè)驗(yàn)時(shí)的情況相近 似。3 、預(yù)測(cè)的時(shí)限可稍放寬一些, 最好 使每個(gè)被試都能將題目做完。4 、在預(yù)測(cè)過程中,應(yīng)對(duì)被試的反應(yīng)情形隨時(shí)加以記錄。項(xiàng)目分析對(duì)項(xiàng)目的分析包括質(zhì)的分析和量的分析兩個(gè)方面。 前者是從內(nèi)容 取樣的適切性、 題目

42、的思想性以及表達(dá)是否清楚等方面加以評(píng)鑒; 后 者是對(duì)預(yù)測(cè)結(jié)果進(jìn)行統(tǒng)計(jì)分析,確定題目的難度、區(qū)分度、備選答案 的合適度等。三、信度和效度考察信度效度四、常模制訂測(cè)驗(yàn)分?jǐn)?shù)必須與某種參照系統(tǒng)比較,方能顯出它所代表的意義。 多數(shù)心理測(cè)驗(yàn)是把個(gè)人所得的分?jǐn)?shù)與代表一般人同類行為的分?jǐn)?shù)相 比較,以判別其所得分?jǐn)?shù)的高低。此處的“代表一般人同類行為的分 數(shù)”,即為“常?!?。五、編寫指導(dǎo)手冊(cè)測(cè)驗(yàn)指導(dǎo)手冊(cè)的內(nèi)容有:1 測(cè)驗(yàn)的目的和功用。2 測(cè)驗(yàn)編制的理論背景以及測(cè)驗(yàn)中的材料是根據(jù)什么原則、應(yīng) 用什么方法選擇出來的,許多手冊(cè)還提供選擇題目的統(tǒng)計(jì)指標(biāo)。3 如何實(shí)施測(cè)驗(yàn)的說明。4 測(cè)驗(yàn)的標(biāo)準(zhǔn)答案和記分標(biāo)準(zhǔn)。5 常模資料,

43、包括常模表、常模適用的團(tuán)體及對(duì)測(cè)驗(yàn)分?jǐn)?shù)如何 做解釋。6 測(cè)驗(yàn)的基本特征,包括難度、鑒別力、信度、效度和因素分 析的資料,以及這些資料取得的條件和情境, 包括調(diào)查的樣本和時(shí)間。第七節(jié) 心理測(cè)驗(yàn)的使用第一單元 主試的資格 主試者的知識(shí)結(jié)構(gòu)包括: (1)本行業(yè)專業(yè)知識(shí);(2)心理學(xué)基 礎(chǔ)知識(shí);(3)心理學(xué)專業(yè)理論知識(shí); (4)心理測(cè)驗(yàn)專業(yè)技能 一、知識(shí)結(jié)構(gòu)二、專業(yè)理論知識(shí)和專業(yè)技能專業(yè)理論知識(shí) : (1)了解測(cè)驗(yàn)的特點(diǎn)和性質(zhì); ( 2)熟悉它 的作用的局限性;(3)了解測(cè)驗(yàn)的基本特征;(4)熟悉測(cè)驗(yàn)標(biāo)準(zhǔn)化的 必要。專業(yè)技能 :具備專業(yè)技能與經(jīng)驗(yàn);經(jīng)過專業(yè)訓(xùn)練;熟悉有關(guān) 測(cè)驗(yàn)的(1)內(nèi)容;(2)適用范

44、圍;(3)測(cè)驗(yàn)程序;(4)記分方法等。三、職業(yè)道德(主試者)(一)測(cè)驗(yàn)的保密(二)測(cè)驗(yàn)中個(gè)人隱私的保護(hù)(三)測(cè)驗(yàn)的控制使用 第二單元 測(cè)驗(yàn)的選擇一、所選測(cè)驗(yàn)必須適合測(cè)量的目的二、所選測(cè)驗(yàn)必須符合心理測(cè)量學(xué)的要求 第三單元 測(cè)驗(yàn)前的準(zhǔn)備及注意事項(xiàng)一、測(cè)驗(yàn)前的準(zhǔn)備工作預(yù)告測(cè)驗(yàn)準(zhǔn)備測(cè)驗(yàn)材料熟悉測(cè)驗(yàn)指導(dǎo)語(yǔ)熟悉測(cè)驗(yàn)的具體程序二、測(cè)驗(yàn)中主試的職責(zé)1 、應(yīng)按照指導(dǎo)語(yǔ)的要求實(shí)施測(cè)驗(yàn);2 、測(cè)驗(yàn)前不講太多無關(guān)緊要的話;3 、對(duì)于被試的反應(yīng),不帶任何暗示;4 、對(duì)特殊問題要有心理準(zhǔn)備, 應(yīng)沉著冷靜、機(jī)智、靈活地應(yīng)付。三、建立協(xié)調(diào)關(guān)系協(xié)調(diào)關(guān)系( rapport )是一個(gè)專業(yè)術(shù)語(yǔ),在臨床心理咨詢、心理 治療中經(jīng)常用到

45、。第四單元 測(cè)驗(yàn)實(shí)施的程序及要素一、指導(dǎo)語(yǔ)(一)對(duì)被試的指導(dǎo)語(yǔ)1 、如何選擇反應(yīng)形式(劃、口答、書寫);2 、如何記錄這些反應(yīng)(答卷紙、錄音、錄象) ;3 、時(shí)間限制;4 、如果不能確定正確反應(yīng)時(shí)該如何操作(是否允許猜測(cè)等) ;5 、例題(當(dāng)題比較生疏時(shí),給出附有正確答案的例題十分必要) ;6 、有時(shí)告知被試測(cè)驗(yàn)?zāi)康?。(二)?duì)主試指導(dǎo)語(yǔ)二、時(shí)限 大多數(shù)典型行為的測(cè)驗(yàn)不受時(shí)限時(shí)間的限制。 一般說來,心理測(cè)驗(yàn)除(典型行為測(cè)驗(yàn))以外,都有時(shí)限。 三、測(cè)驗(yàn)的環(huán)境條件 首先必須完全遵從測(cè)驗(yàn)手冊(cè)的要求; 其次是記錄下任何意外的測(cè)驗(yàn)環(huán)境因素; 第三,在解釋測(cè)驗(yàn)結(jié)果時(shí)也必須考慮這一因素。第五單元 被試誤差及控

46、制方法一、應(yīng)試技巧與練習(xí)效應(yīng)(一)應(yīng)試技巧“測(cè)驗(yàn)油子”:能覺察也正確答案與錯(cuò)誤答案的細(xì)小差別;懂得合理分配測(cè)驗(yàn)時(shí)間; 常常是各種題型都見過, 多數(shù)情況下會(huì)比 他們能力相當(dāng)?shù)狈y(cè)驗(yàn)經(jīng)驗(yàn)或技巧的被試者獲得更好的分?jǐn)?shù); ( 4) 熟悉測(cè)驗(yàn)的程序。(二)練習(xí)效應(yīng)1 、教育背景較差、經(jīng)驗(yàn)較少或智力較高者,其受練習(xí)效應(yīng)的影 響較大;2 、著重速度的測(cè)驗(yàn),練習(xí)效應(yīng)為明顯;3 、重復(fù)實(shí)施的測(cè)驗(yàn),受練習(xí)效應(yīng)影響的程度要大于復(fù)本測(cè)驗(yàn);4 、兩次測(cè)驗(yàn)之間的時(shí)距越大,練習(xí)效應(yīng)越小,相距三個(gè)月以上 練習(xí)效應(yīng)可忽略不計(jì);5 、一般的平均練習(xí)效應(yīng),約在 1/5 個(gè)標(biāo)準(zhǔn)差以下,并且僅限于 第一次與第二次重測(cè),第三次以后練習(xí)

47、效應(yīng)增加不明顯。 二、動(dòng)機(jī)與焦慮因素(一)應(yīng)試動(dòng)機(jī)在測(cè)量成就、智力和能力傾向等變量時(shí),只有被試動(dòng)機(jī)強(qiáng)烈,才 可能盡力回答,取得好成績(jī)。在測(cè)量態(tài)度、興趣及人格等典型行為時(shí),若給人以好的印象,會(huì) 使測(cè)驗(yàn)分?jǐn)?shù)降低;若給人以差的印象,則會(huì)使測(cè)驗(yàn)分?jǐn)?shù)升高。 (二)測(cè)驗(yàn)焦慮一般說來,適度的焦慮會(huì)使人的興奮性提高,注意力增強(qiáng),提高 反應(yīng)速度,從而提高智力測(cè)驗(yàn)、成就測(cè)驗(yàn)和能力傾向測(cè)驗(yàn)的成績(jī)。測(cè)驗(yàn)焦慮的影響因素:1 、能力高的人,測(cè)驗(yàn)焦慮一般較低,而對(duì)自己能力沒有把握的人,測(cè)驗(yàn)焦慮較高;2 、抱負(fù)水平過高,求勝心切的人,測(cè)驗(yàn)焦慮較高;3 、具有某種人格特點(diǎn),如缺乏自信、患得患失、情緒不穩(wěn)定的 人易產(chǎn)生測(cè)驗(yàn)焦慮;4 、測(cè)驗(yàn)成績(jī)與被試的關(guān)系重大,或被試受到的壓力過大,容易 使其產(chǎn)生測(cè)驗(yàn)焦慮;5 、經(jīng)常接受測(cè)驗(yàn)的人焦慮較低,而對(duì)測(cè)驗(yàn)程序不熟悉,尤其是 測(cè)驗(yàn)中采取了新的題目形式或?qū)嵤┏绦驎?huì)增加測(cè)驗(yàn)焦慮。三、反應(yīng)定勢(shì)反應(yīng)定勢(shì)亦稱反應(yīng)風(fēng)格, 是獨(dú)立于測(cè)驗(yàn)內(nèi)容的反應(yīng)傾向, 即由于 每個(gè)人回答問題的習(xí)慣不同, 而使能力相同的被試得到不同的測(cè)驗(yàn)分 數(shù)。(一)求“快”與求“精確”的反應(yīng)定勢(shì) 除非反應(yīng)速度“本身即為重要的研究目標(biāo),否則應(yīng)讓被試者 充分的時(shí)間反應(yīng),同時(shí)應(yīng)該注明每題的答題時(shí)間,以減少求“快”與 求“精確”的定勢(shì)影響。 (二)喜好正面答題的反應(yīng)定勢(shì)(肯定定

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論