心理測量課件_第1頁
心理測量課件_第2頁
心理測量課件_第3頁
心理測量課件_第4頁
心理測量課件_第5頁
已閱讀5頁,還剩383頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

心理測量總論

第一節(jié)

心理測量的歷史

第二節(jié)心理測量的性質(zhì)

第三節(jié)心理測驗(yàn)的種類

第四節(jié)心理測驗(yàn)的用途

一、心理測量在中國的發(fā)展

二、西方心理測量發(fā)展的歷史

back1.中國古代對心理測量的貢獻(xiàn)

中國古代的醫(yī)書《皇帝內(nèi)經(jīng)》

孔子

孟子中國古代最值得稱道的心理測量的實(shí)踐活動是初萌于商周,興盛于隋唐的科舉取士制度

2.中國現(xiàn)代心理測量的發(fā)展

1915年,克雷頓在中國南方的廣州曾對500名兒童進(jìn)行心理測驗(yàn)

1916年樊炳清首次向國人介紹比奈-西蒙量表

我國測驗(yàn)運(yùn)動,從“五四”前后至1928年是發(fā)展極為昌盛的時期,中國測驗(yàn)史上的一些著名學(xué)者也正是在這一時期開展了他們的首創(chuàng)性的工作

在艾偉、陸志偉、陳鶴琴、肖孝嶸等的倡議下,中國測驗(yàn)學(xué)會于1931年6月在南京正式成立,在第一次年會上,通過了《中國測驗(yàn)學(xué)會簡章》,產(chǎn)生了理事會

從五四時期開始到40年代末,除抗日戰(zhàn)爭期間,中國的心理測驗(yàn)工作從未間斷過,并涉及廣泛的領(lǐng)域。

從1949年至1978年近三十年間,心理測驗(yàn)處于停止發(fā)展時期

1979年春,心理學(xué)家林傳鼎、吳天敏和張厚餐教授在武漢舉辦了第一個全國性的心理測驗(yàn)培訓(xùn)班,這是測驗(yàn)工作恢復(fù)的開始。

back

1.心理測驗(yàn)的先驅(qū)

在西方,對人的個別差異的重視起因于18世紀(jì)天文學(xué)上的一個偶然事件。

著名美國學(xué)者波林(E.G.boring)指出:“在測驗(yàn)領(lǐng)域,19世紀(jì)80年代是高爾頓的10年,90年代是卡特爾的10年,20世紀(jì)的頭10年則是比奈的10年。高爾頓(FrancisGalton)1884年,高爾頓在倫敦的國際博覽會上設(shè)立了一個“人體測量實(shí)驗(yàn)室”,參觀者只要付三個便士就可以有關(guān)自己身體素質(zhì)的信息高爾頓在他的實(shí)驗(yàn)室里發(fā)明了許多測量儀器

高爾頓最重要的貢獻(xiàn)之一,就是把統(tǒng)計(jì)方法應(yīng)用到對個別差異的資料的分析之中,他創(chuàng)造了一種簡單的計(jì)算相關(guān)系數(shù)的方法,后來被他的學(xué)生皮爾遜繼承和發(fā)展,創(chuàng)立了積差相關(guān)公式

卡特爾(J.M.Cattell)在1890年,在《心理》雜志上發(fā)表《心理測驗(yàn)和測量》一文,首創(chuàng)了“心理測驗(yàn)”(mentaltest)這個術(shù)語,并報導(dǎo)了他所編制的一套能力測驗(yàn)在大學(xué)生身上的應(yīng)用結(jié)果。

比奈(A.Binet)1903年,比奈的《智力的實(shí)驗(yàn)研究》問世。比奈與其助手西蒙(T.Simon)合作完成了世界上第一個智力測驗(yàn)量表――比奈-西蒙量表(Binet-SimonScale)。1905年,他們在《心理學(xué)年報》上發(fā)表了《診斷異常兒童的新方法》一文,介紹了該量表,史稱1905年量表。比西量表的問世,吸引了全世界心理學(xué)家的注意,在短時期內(nèi)迅速傳播到世界許多國家。僅在美國,就有好幾種修訂版本相繼問世,其中最著名的首推斯坦福大學(xué)的推孟(Terman)教授在1916年修訂的S-B量表(Stanford-Binet)量表。

2.心理測驗(yàn)的發(fā)展

(1)編制出一批操作測驗(yàn)(2)編制出團(tuán)體智力測驗(yàn)(3)多重能力傾向測驗(yàn)逐漸受到重視(4)卡特爾的學(xué)生桑代克等人利用心理測驗(yàn)原理,編制了第一批標(biāo)準(zhǔn)化的教育測驗(yàn)(5)心理測驗(yàn)發(fā)展的另一領(lǐng)域涉及情感適應(yīng)、人際關(guān)系、動機(jī)、興趣、態(tài)度、性格等人格特點(diǎn)的測量。(6)60年代后,由于認(rèn)知心理學(xué)的崛起,將實(shí)驗(yàn)法與測驗(yàn)法結(jié)合,產(chǎn)生了信息加工測驗(yàn)

back一、心理測量的定義

依據(jù)一定的心理學(xué)和教育學(xué)理論,使用一定的操作過程,對人的心理特質(zhì)和教育成就進(jìn)行定量描述的過程。二、心理測量的特性

間接性相對性客觀性測量的客觀性:實(shí)際上就是測量的標(biāo)準(zhǔn)化問題

測驗(yàn)內(nèi)容的標(biāo)準(zhǔn)化施測條件的標(biāo)準(zhǔn)化評分標(biāo)準(zhǔn)的標(biāo)準(zhǔn)化分?jǐn)?shù)的轉(zhuǎn)換和解釋的標(biāo)準(zhǔn)化,要制定測驗(yàn)常模

back一、根據(jù)測量的對象分類

二、根據(jù)測驗(yàn)的人數(shù)來分

三、根據(jù)測驗(yàn)的材料來分

四、以測量的目的不同,對教育測量進(jìn)行分類

五、根據(jù)測驗(yàn)的難度對測驗(yàn)進(jìn)行分類

六、根據(jù)測驗(yàn)結(jié)果的解釋模式來分

back能力測驗(yàn)智力測驗(yàn)和特殊能力測驗(yàn)實(shí)際能力測驗(yàn)和能力傾向測驗(yàn)成就測驗(yàn)人格測驗(yàn)

back個別測驗(yàn)優(yōu)點(diǎn):精確度高適用于一些特殊對象缺點(diǎn):效率低主試需要嚴(yán)格的訓(xùn)練和素養(yǎng),一般人不易掌握團(tuán)體測驗(yàn)優(yōu)點(diǎn):效率高缺點(diǎn):精確度受到影響,某些特殊的群體不適合用團(tuán)體測驗(yàn)

back語言或文字測驗(yàn)

測驗(yàn)材料以語言或文字的形式呈現(xiàn),被試也用語言或文字做答。

效率高。但這種測驗(yàn)不能應(yīng)用于有語言困難的人。還有,對不同語言背景條件下的個體的心理特質(zhì)進(jìn)行比較時,也存在者局限性。

操作性測驗(yàn)

此類測驗(yàn)題目不是用文字來呈現(xiàn),而是用圖畫、符號或?qū)嵨铮ㄈ绶e木、工具)等作為測驗(yàn)材料,無需使用文字作答。優(yōu)點(diǎn):不受文化因素的限制,適用于文盲和聾啞人等特殊群體。但不易團(tuán)體實(shí)施,費(fèi)時較多,效率不高。

back預(yù)測測驗(yàn)也稱安置測驗(yàn)。測驗(yàn)的目的是測量受測者在某方面將來可能達(dá)到的水平和成就

形成性測驗(yàn)?zāi)康脑谟诹私馐軠y者在教育過程中知識、技能等方面的形成情況總結(jié)性測驗(yàn)在一門學(xué)科或一項(xiàng)教育活動結(jié)束后舉行的測驗(yàn),目的是為了了解學(xué)生對這門學(xué)科知識和技能的掌握情況

診斷性測驗(yàn)?zāi)康氖菫榱税l(fā)現(xiàn)受測者在學(xué)習(xí)、思想上存在的問題,以便對癥下藥,改進(jìn)教學(xué),提高教育質(zhì)量

back速度測驗(yàn)

這種測驗(yàn)的題目比較容易,一般都不超過受測者的能力和知識水平,目的在于測量學(xué)生完成某種作業(yè)的速度、掌握知識技能的熟練程度、反應(yīng)速度等。

難度測驗(yàn)

這類測驗(yàn)由許多難度不同的題目組成,考題中既有考生會作的題目,也有考生不可能或很少可能做好的題目,目的在于鑒定考生可能達(dá)到的最高水平

back常模參照測驗(yàn)將受測者的測驗(yàn)分?jǐn)?shù)與他所在的群體的平均分?jǐn)?shù)進(jìn)行比較,看其在這個團(tuán)體中所處的位置。

標(biāo)準(zhǔn)參照測驗(yàn)將受測者的測驗(yàn)分?jǐn)?shù)與某種標(biāo)準(zhǔn)來進(jìn)行比較,看受測者有沒有達(dá)到這個標(biāo)準(zhǔn)。

back一、用于心理診斷二、選拔人才和人員安置三、為心理輔導(dǎo)和心理咨詢服務(wù)四、改進(jìn)教學(xué)、管理的輔助手段五、心理與教育科研的重要手段總之,心理測驗(yàn)可以應(yīng)用于多個領(lǐng)域,除了心理學(xué)界和教育界,心理測驗(yàn)已逐漸深入我國的醫(yī)學(xué)界、企業(yè)界、組織人事部門、司法部門等許多應(yīng)用領(lǐng)域,對社會產(chǎn)生了重大影響。

(一)明確測驗(yàn)?zāi)繕?biāo)

(二)明確測驗(yàn)對象

年齡教育水平文化背景

(三)明確測驗(yàn)用途

back電視對于顯微鏡就象電話對于——a放大器

b微加工器c電報符號d麥克風(fēng)e擴(kuò)音器

back一個測量推理能力的題目:數(shù)學(xué)是工具就如同計(jì)算機(jī)是——a機(jī)器b工具c科學(xué)d鍵盤e程序

back例,請同學(xué)們看書P16。表2-1小學(xué)自然常識測驗(yàn)編制計(jì)劃

獲得基本知識理解原理原則應(yīng)用原理原則分析因果關(guān)系綜合成系統(tǒng)見解建立評價標(biāo)準(zhǔn)合計(jì)生物世界35632120資源利用23321010動力和機(jī)械23410112物質(zhì)、物性與能量56832125氣象24322013宇宙25410012地球2221108合計(jì)1828301383100編制計(jì)劃有兩個用途:1.在測驗(yàn)的編制階段,可以知道每個項(xiàng)目應(yīng)該編多少題目,編哪些種類的題目2.題目編好后,可以用來核對,測題是否全面,是否真正代表了所要測量的領(lǐng)域,核對重要的方面有沒有遺漏3.根據(jù)表中百分比確定每類項(xiàng)目的分?jǐn)?shù)

back(一)搜集有關(guān)資料(二)選擇項(xiàng)目形式(三)編寫和修訂項(xiàng)目

back(一)搜集有關(guān)資料

1.資料要豐富

有關(guān)所要測量的心理特質(zhì)的理論同行已經(jīng)編制的有關(guān)測量這種心理特質(zhì)的國內(nèi)外量表

訪問專家、教師、在一線工作的有關(guān)人員,征求他們的意見,收集與測題有關(guān)的資料

了解受測群體的實(shí)際情況

2.資料要有普遍性所選擇的材料應(yīng)該具有文化公平性。如,對于智力測驗(yàn)來講,所收集的資料對于不同文化背景、不同經(jīng)濟(jì)地位、不同地區(qū)的個人和團(tuán)體應(yīng)該是公平的。

back

(二)選擇項(xiàng)目形式

鮑勃海姆(Popham)曾將語言(文字)測驗(yàn)的項(xiàng)目形式分成兩種類型:要求被試選擇的和要求被試回答的,也有人稱之為選擇型和供應(yīng)型。在成就測驗(yàn)中,也分成客觀性試題和非客觀性試題。這兩種項(xiàng)目形式的最大區(qū)別是,前者提供被選答案,后者讓被試自己寫出答案。前者的常用形式有,選擇題和判斷題,匹配題也屬于這一種。后者的常用形式有簡答題和論述題,作文題也是屬于這一種。

幾種常用的項(xiàng)目形式介紹

判斷題選擇題簡答題論述題

back判斷題喜歡在大庭廣眾之下發(fā)表自己的見解。是否

學(xué)習(xí)是一種苦差事。同意介于兩者之間不同意

非常同意比較同意一般比較不同意非常不同意等級評定項(xiàng)目

優(yōu)點(diǎn):出題容易;回答方便。缺點(diǎn):對于教育測驗(yàn)來講,只適合考察學(xué)生對簡單知識的理解;易受猜測因素的影響。編制判斷題應(yīng)注意以下幾點(diǎn):(1)內(nèi)容應(yīng)以有意義的事實(shí)、概念或原理為基礎(chǔ),避免無關(guān)緊要的問題或瑣碎的細(xì)節(jié)。(2)每題只應(yīng)包含一個觀念,避免兩個以上的觀念在同一題中出現(xiàn),從而造成似是而非或半對半錯。如,我怕見生人,但有時也參加聚會。(3)論點(diǎn)要簡明扼要,意義明確,不要有艱深難懂的詞句或含糊不確定的文字描述。(4)避免使用具有暗示性的特殊詞句。(5)盡量采用正面肯定的敘述。(6)肯定和否定的題數(shù)應(yīng)大致相等,且隨機(jī)排列。(7)題數(shù)不能太少。

back七點(diǎn)量表,就是將行為程度分成七個等級。如,給小朋友講了一個故事:有個小朋友叫小林。校長到小林的班上點(diǎn)名要小林和其他三名同學(xué)代表班級參加學(xué)校的一個唱歌比賽。凡是參加唱歌比賽的同學(xué)都可以得到一份精美的紀(jì)念品。但是小林的歌唱得并不好。小林想:如果我去參加唱歌比賽,我們班肯定會輸。如果我說我病了,就不必參加比賽了,這樣就會有唱得更好的同學(xué)頂替我,班級就能得到好名次。但是如果我不參加,就得不到那份精美的紀(jì)念品。于是,當(dāng)校長要小林準(zhǔn)備參加唱歌比賽時,小林決定為班級考慮。雖然小林沒有生病,但他告訴校長:“我今天病了,不能參加唱歌比賽?!眴栴}:小林這樣說好不好?××××××O★★★★★★

back請你選擇一種喜歡的顏色?綠色茶色紫色藍(lán)色紅色橘色白色黃色智力測驗(yàn)(主要是測量推理能力)編制中使用的選擇題(1)貓頭鷹是鳥正如白鯊是——

a動物b魚類c鳥類d爬行動物(2)平地與土丘的關(guān)系就如同峽谷與——的關(guān)系。a溝壑b山谷c叢林d河流e高山優(yōu)點(diǎn):適用范圍廣,既可以適用于文字和數(shù)字的材料,也可以適用于圖形的材料;評分簡單、省時、客觀;相比于判斷題更少受猜測因素的影響。缺點(diǎn):編擬迷惑答案比較困難;無法測量出被試的言語表達(dá)能力和概括、組織能力,這與簡答題、論述題相比是不足的;盡管選擇題減少了機(jī)遇的影響,但猜測的影響仍然不能完全排除。編制選擇題時要注意以下幾點(diǎn):(1)題干的陳述要簡單明確,避免出現(xiàn)不切題的內(nèi)容(2)題干后面的選項(xiàng)或答案的數(shù)目愈多,被試愈不易猜對,普遍采用四個或五個答案(3)

一個測驗(yàn)中每個題干后面,答案的數(shù)目要一律,如,每題都是四個或五個答案(4)

錯的答案不要錯得太明顯,要有一定的似真性(5)一個題干后面的答案,不管是正確的還是迷惑的,要么都是簡單的,要么都是詳細(xì)的,務(wù)求長度大致相等,不要在簡單的答案中參雜一兩個詳細(xì)的答案。(6)答案以簡短為宜,相同的字詞宜置于題干中,這樣不但可以使題意清楚,而且可以減少被試的閱讀時間(7)

少用“以上皆非”和“以上皆是”的答案(8)

各題之間不能提供正確或錯誤的線索(9)對的答案和錯的答案要隨機(jī)排列,使被試無法猜測,減少系統(tǒng)誤差

back簡答題:簡答題要求被試用一段文字來完成測題。優(yōu)點(diǎn):編制簡單;不易受猜測因素的影響;在教育測驗(yàn)中能測量多種認(rèn)知目標(biāo),如對知識的記憶、理解、應(yīng)用。缺點(diǎn):評分沒有客觀題方便,不夠客觀;不能測量對知識的組織能力、綜合應(yīng)用知識的能力、評介能力和創(chuàng)造能力等。

back論述題:簡答題若對其范圍不加限定就變成了論述題。這兩者的區(qū)別不僅在于長度,還在于它們所起的作用。簡答題最適合測量對實(shí)際知識的記憶和理解,而論述題最適合測量組織能力、綜合能力和文字表達(dá)能力、評介能力和創(chuàng)造能力,對于論述題來講,光憑記憶是不能完成的。優(yōu)點(diǎn):編制容易;不允許猜測和簡單背誦,能測量復(fù)雜的能力。缺點(diǎn):評分難度大,不夠客觀;題目少,取樣缺乏代表性。

back測驗(yàn)編制經(jīng)驗(yàn)豐富者在編制測題時,往往會考慮以下幾個測題的來源:直接選自國內(nèi)外優(yōu)秀的相關(guān)的測驗(yàn);修改前人的測驗(yàn)中的有關(guān)的測題;自己編寫1.編寫測驗(yàn)項(xiàng)目時應(yīng)注意以下幾點(diǎn)(1)測驗(yàn)項(xiàng)目的取樣應(yīng)當(dāng)具有代表性(2)測驗(yàn)項(xiàng)目的取材范圍要同編題計(jì)劃所列項(xiàng)目范圍一致。(3)測驗(yàn)項(xiàng)目的難度應(yīng)該有一定的分布范圍(4)編寫測驗(yàn)項(xiàng)目的用語要力求精練簡短,淺顯明了。(5)初編題目的數(shù)量要多于最終所需要的數(shù)量,以便篩選和編制復(fù)本2.智力測驗(yàn)的簡單介紹(1)智力測驗(yàn)項(xiàng)目編寫

A類比推理項(xiàng)目優(yōu)點(diǎn)難度水平易控制,在實(shí)際關(guān)系上,這類項(xiàng)目既可以和顯而易見的事物構(gòu)成簡單關(guān)系,又可以和不明顯的事物,甚至初看起來沒有關(guān)系,然而卻反映著某一規(guī)律的抽象對象構(gòu)成復(fù)雜關(guān)系。由于客觀事物存在著普遍聯(lián)系,所有能夠用來編制類比推理項(xiàng)目的材料幾乎是無窮的。

go例1,和的關(guān)系就如同和——的關(guān)系abcde例2英語字母G和J的關(guān)系就象M和——的關(guān)系aP

bOcNdLeK例3D相對于W就像L相對于——aObNcTdReH例425對于10相當(dāng)于53對于——a2b8c31d15e24

backB排除性項(xiàng)目排除性項(xiàng)目是指在項(xiàng)目編寫過程中,將很多同類事物,如詞匯、形狀、數(shù)字、物體等排列在一起,讓被試挑出不符合同類的那一個干擾項(xiàng)目。例1麻雀烏鴉鵝蝙蝠燕子例22463104835

例3C順序項(xiàng)目順序項(xiàng)目是以事物的前后順序、復(fù)雜程度、遞增或遞減關(guān)系為標(biāo)準(zhǔn)而設(shè)計(jì)的項(xiàng)目,要求被試根據(jù)關(guān)系填上相應(yīng)的項(xiàng)目。例1

12,15,17,20,22,_____

back

(一)預(yù)測測題初步確定以后,在小樣本范圍內(nèi)試測,以得到有關(guān)測題優(yōu)劣的質(zhì)的信息和量的指標(biāo),為增刪項(xiàng)目提供依據(jù)。預(yù)測時應(yīng)注意以下幾點(diǎn):(1)預(yù)測對象應(yīng)取自將來準(zhǔn)備應(yīng)用的群體,要有代表性。在教育測驗(yàn)上,通常以370人為宜,智力測驗(yàn)至少要30人。如果測題的項(xiàng)目過多,在保證樣本代表性的前提下,可以考慮對不同樣組的被試實(shí)施不同的分測驗(yàn)。(2)預(yù)測力求按正規(guī)的要求進(jìn)行,使其與將來正式的情況相近似。(3)預(yù)測的時限可適當(dāng)放寬,最好使每個實(shí)驗(yàn)者都能將項(xiàng)目做完。(4)在預(yù)測過程中,應(yīng)隨時記錄被試的反應(yīng)情況(二)項(xiàng)目分析項(xiàng)目分析包括質(zhì)的分析和量的分析兩個方面。質(zhì)的分析是主要是看內(nèi)容取樣是否適當(dāng),具有代表性;是否有題意不清之處等。量的分析是對預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)分析,確定項(xiàng)目的難度和區(qū)分度以及被選答案的適宜性。復(fù)核。

back(一)項(xiàng)目的選擇項(xiàng)目的選擇的標(biāo)準(zhǔn)首先是鑒別力要高。埃貝爾(I.Ebel)提出的標(biāo)準(zhǔn)在根據(jù)鑒別力所選出的一系列的項(xiàng)目的基礎(chǔ)上,再依據(jù)難度指數(shù)選擇合適的項(xiàng)目。因?yàn)橹械入y度的項(xiàng)目能產(chǎn)生最大的變差,故最好應(yīng)選擇難度介于0.35-0.65之間的測題,而后還需要選出少數(shù)較難和較易的測題,這樣使整個難度分布近似常態(tài)分布。

如果是人格測驗(yàn)、態(tài)度測驗(yàn)和心理健康測驗(yàn)等,所需的不是難度,則對難度的要求不高,一般為0.1-0.3

根據(jù)鑒別力和難度選出合適的項(xiàng)目后,應(yīng)該再次對照編制計(jì)劃,看看比例有無失調(diào)

考慮測驗(yàn)的長度問題,一個測驗(yàn)應(yīng)該包括多少測題才比較合適,要考慮測驗(yàn)的時限、受測者的年齡、測驗(yàn)的性質(zhì)等

go表2-1測題的鑒別指數(shù)與優(yōu)劣評鑒鑒別力D測題評鑒0.40以上優(yōu)良0.30-0.39良好,如能修改則更好0.20-0.29尚可,仍需修改0.19以下劣,必須淘汰(二)項(xiàng)目的編排

測驗(yàn)一般有二種編排方式:并列直進(jìn)式:這種方式按照測驗(yàn)的性質(zhì)將測題組成若干分測驗(yàn),同一分測驗(yàn)中的測題按其難度由易到難排列混合螺旋式:將各類測題依照難度或年齡分成若干層次,再將不同性質(zhì)的測題加以組合,作交叉式排列,難度則漸次上升。(三)編造復(fù)本編造復(fù)本就是編制幾個等值的測驗(yàn)。復(fù)本等值必須符合以下幾個條件:(1)

各份測驗(yàn)測量的是同一種心理特質(zhì)。(2)

各份測驗(yàn)包含相同的內(nèi)容范圍,但題目不應(yīng)有重復(fù)。(3)

各份測驗(yàn)題型相同,題目數(shù)量相等,并且有大體相同的難度分布。只要有足夠數(shù)量的題目,編造復(fù)本的手續(xù)是很簡單的。先將所有選出的項(xiàng)目按難度由大到小或從小到大排列,次序?yàn)?、2、3、4、5、6、7、8、9……,如果要分成兩個等值的復(fù)本,則A本:1、4、5、8、9……B本:2、3、6、7、10……如果要分成三個等值的復(fù)本,則A本:1、6、7、12、13……B本:2、5、8、11、14……C本:3、4、9、10、15……

back測驗(yàn)內(nèi)容的標(biāo)準(zhǔn)化施測條件的標(biāo)準(zhǔn)化評分標(biāo)準(zhǔn)的標(biāo)準(zhǔn)化分?jǐn)?shù)的轉(zhuǎn)換和解釋的標(biāo)準(zhǔn)化,要制定測驗(yàn)常模

back測驗(yàn)編好后,要對其測驗(yàn)的可靠性和有效性加以評估,這就是測驗(yàn)的信度和效度問題。信度是指測驗(yàn)的可靠性效度是指測驗(yàn)的有效性,即有沒有測量到所要測量的心理特質(zhì)。

back一、難度的意義二、難度的計(jì)算三、難度與測驗(yàn)分?jǐn)?shù)的分布四、項(xiàng)目難度分布與信度的關(guān)系

back一、項(xiàng)目難度的意義項(xiàng)目難度(ItemDifficulty)指測驗(yàn)項(xiàng)目的難易程度。

back

(一)計(jì)算難度的基本公式(二)用極端分組法計(jì)算難度

(三)項(xiàng)目難度受機(jī)遇影響的校正(四)項(xiàng)目難度的等距量表

back(一)計(jì)算難度的基本公式1.以答對的百分比(或稱通過率)來計(jì)算難度對0、1兩級記分的測題:(公式3-1)

P為項(xiàng)目的難度;R為通過該項(xiàng)目的人數(shù);N為參加測驗(yàn)的總?cè)藬?shù)。例1,100人參加某一測驗(yàn),其中第2題和第6題通過的人數(shù)分別為20人和30人,求第2題和第6題的難度。2.當(dāng)測題不是兩級記分時,計(jì)算難度的公式為(公式3-2)其中,

為全體被試在該項(xiàng)目上的平均得分;表示該項(xiàng)目的滿分。例2,某語文測驗(yàn)第五題的滿分為12分,這道題考生的平均得分為8.5分,問該題的難度是多少?

back(二)用極端分組法計(jì)算難度

具體步驟如下:第一步:先依測驗(yàn)總分的高低,按由高到低的順序,依次排列試卷;第二步:從得分最高的一份試卷開始依次向下選出全部試卷的27%,作為高分組第三步:從得分最低的一份試卷開始依次向上選出全部試卷的27%,作為低分組第四步:按下列公式計(jì)算難度(公式3-3)式中,P為難度;PH為高分組在該項(xiàng)目上的通過率;

PL為低分組在該項(xiàng)目上的通過率。

例3,某一次數(shù)學(xué)測驗(yàn),100名學(xué)生中,高分組和低分組各有27人。其中高分組答對第一題的共有20人,低分組答對第一題的共有10人。請計(jì)算第一題的難度。

back(三)項(xiàng)目難度受機(jī)遇影響的校正在是非題和選擇題中,由于允許猜測,被選答案的數(shù)目越少,機(jī)遇的作用越大,就越不能反映項(xiàng)目的真實(shí)難度。為平衡機(jī)遇對難度的影響,可用下面的公式校正:(公式3-4)其中,CP:校正后的難度;P:未校正時的難度;K:為是非題和選擇題選項(xiàng)的數(shù)目。例4,一個五擇一的測題,未校正前的難度指數(shù)為0.50,一個四擇一的測題,未校正前的難度指數(shù)為0.53,請問校正后哪一題的難度大?

back(四)項(xiàng)目難度的等距量表(難度轉(zhuǎn)換)1.使用項(xiàng)目難度等距量表的理由百分量表是等級量表,不是等距量表,缺乏相等的單位,也不能由各項(xiàng)目的難度來計(jì)算整份試卷的平均難度。例如,1、2、3三個項(xiàng)目的難度指數(shù)分別為0.50、0.40、0.302.方法先將某題的通過率視作正態(tài)曲線下的面積,然后查正態(tài)分布表找出正態(tài)曲線右側(cè)的面積所對應(yīng)的Z分?jǐn)?shù)。這一Z分?jǐn)?shù)就可視為該題的標(biāo)準(zhǔn)難度。

16%84%-3320-2-1134%例5,某題的通過率為84%,求該題的標(biāo)準(zhǔn)難度。練習(xí):請同學(xué)們計(jì)算一下上述三個項(xiàng)目的標(biāo)準(zhǔn)難度

Δ(delta)量表標(biāo)準(zhǔn)難度(美國教育測驗(yàn)服務(wù)中心(ETS))。Δ值可以用以下公式計(jì)算:

Δ=13+4Z(公式3-5)希臘字母Δ表示標(biāo)準(zhǔn)化難度指數(shù),Z為標(biāo)準(zhǔn)分?jǐn)?shù)。Δ值是一個均數(shù)為13,標(biāo)準(zhǔn)差為4的正態(tài)分布。例6求難度指數(shù)為0.50、0.40、0.30的標(biāo)準(zhǔn)難度指數(shù)(Δ值)Δ的取值范圍:標(biāo)準(zhǔn)正態(tài)分布的全距一般包括6個標(biāo)準(zhǔn)差的距離,即從-3到+3,當(dāng)Z=-3時,表明通過率達(dá)到99.87%,這種情況極少發(fā)生,此時Δ=1;當(dāng)Z=3時,表明通過率為0.13%,也是不大可能出現(xiàn)的情況,此時Δ=25。Δ的取值范圍是1~25。

back

測驗(yàn)的難度直接依賴于組成測驗(yàn)的項(xiàng)目的難度。通過考察測驗(yàn)分?jǐn)?shù)的分布,可以對測驗(yàn)的難度作出直觀的分析。若測驗(yàn)項(xiàng)目的難度普遍較大,被試的得分普遍較低,使測驗(yàn)分?jǐn)?shù)集中在低分段,其分?jǐn)?shù)的分布呈正偏態(tài);若測驗(yàn)項(xiàng)目的難度普遍較低,被試的得分普遍較高,使測驗(yàn)分?jǐn)?shù)集中在高分段,其分?jǐn)?shù)的分布呈負(fù)偏態(tài)。圖3-2測驗(yàn)分?jǐn)?shù)的正偏態(tài)分布圖3-3測驗(yàn)分?jǐn)?shù)的負(fù)偏態(tài)分布當(dāng)測驗(yàn)的分?jǐn)?shù)(預(yù)試結(jié)果)呈偏態(tài)分布時,可以通過改變項(xiàng)目難度的比例對測驗(yàn)的難度加以調(diào)整,通常,如果被試的取樣具有代表性,對于中等難度的測驗(yàn),其分?jǐn)?shù)的分布呈現(xiàn)正態(tài)分布。

back四、項(xiàng)目難度分布與信度的關(guān)系過難和過易的測驗(yàn),會使測驗(yàn)分?jǐn)?shù)的分布相對集中于高分段和低分段,從而縮小分?jǐn)?shù)的分布范圍。分?jǐn)?shù)分布范圍影響信度,范圍越廣,信度越高,分?jǐn)?shù)分布范圍越小,信度越小。1965年,艾伯爾用三套測驗(yàn)進(jìn)行研究,發(fā)現(xiàn)當(dāng)難度集中在0.50附近時,分?jǐn)?shù)分布的范圍較廣。總結(jié):一般能力測驗(yàn)和成就測驗(yàn)的平均難度在0.50左右為宜。出現(xiàn)偏態(tài)情況時,宜對項(xiàng)目進(jìn)行調(diào)整,以使測驗(yàn)分?jǐn)?shù)的分布接近正態(tài)。但項(xiàng)目難度還與測驗(yàn)的目的有關(guān),正偏態(tài)分布適合于篩選性測驗(yàn)(如選拔性測驗(yàn)、競爭性測驗(yàn)),達(dá)標(biāo)考試屬于負(fù)偏態(tài)分布。

back一、項(xiàng)目區(qū)分度的意義二、項(xiàng)目區(qū)分度的計(jì)算

back一、項(xiàng)目區(qū)分度的意義項(xiàng)目區(qū)分度(ItemDiscrimination),又稱項(xiàng)目的鑒別力,指項(xiàng)目得分對被試心理特質(zhì)水平的區(qū)分能力或稱鑒別能力。

back

(一)項(xiàng)目鑒別指數(shù)法(二)相關(guān)分析法1.點(diǎn)二列相關(guān)(Pointbiserialcorrelation)2.二列相關(guān)(biserialcorrelation)3.積差相關(guān)練習(xí)

back(一)項(xiàng)目鑒別指數(shù)法這是項(xiàng)目區(qū)分度分析的一種簡便方法,比較測驗(yàn)總分高分組和低分組在某一項(xiàng)目上的通過率的差異,作為項(xiàng)目鑒別指數(shù)。計(jì)算公式為:(公式3-5)其中,D為鑒別指數(shù),PH為高分組在該項(xiàng)目上的通過率,PL為低分組在該項(xiàng)目上的通過率。D值越大,項(xiàng)目的區(qū)分度越大,反之也然。例6,某高中物理測驗(yàn),被試共18人,高分組和低分組各取總?cè)藬?shù)的27%,則兩組各為5人,第五題高分組5人全部答對,低分組只有1人答對,計(jì)算該題的鑒別指數(shù)。

back1.點(diǎn)二列相關(guān)(Pointbiserialcorrelation)適用資料:兩列變量中,有一列為等距或等比的數(shù)據(jù)而且其總體分布為正態(tài),另一列變量只是名義上的變量,按事物的性質(zhì)劃分為兩類;有時一個變量是雙峰分布也可以劃分為二分名義變量。計(jì)算點(diǎn)二列相關(guān)的公式是:(公式3-6)rpb:點(diǎn)二列相關(guān)系數(shù);

:答對該題的被試在總分上(或效標(biāo)分?jǐn)?shù)上)的平均得分;

:答錯該題的被試在總分上(或效標(biāo)分?jǐn)?shù)上)的平均得分;St:全體被試的總分(或效標(biāo)分?jǐn)?shù))的標(biāo)準(zhǔn)差;P:為答對該題的人數(shù)百分比;q:答錯該題的人數(shù)百分比,q=1-p。點(diǎn)二列相關(guān)系數(shù)的顯著性檢驗(yàn):對與進(jìn)行差異的t檢驗(yàn),如果差異顯著,表明相關(guān)系數(shù)顯著;如果差異不顯著,表明相關(guān)系數(shù)不顯著。如果樣本容量較大(n>50),也可以用下面的近似方法:時,認(rèn)為在.05水平上顯著;時,認(rèn)為在.01水平上顯著。例6,下表是某學(xué)校的15名學(xué)生在一次數(shù)學(xué)測驗(yàn)中的總分和第一題的得分情況,請計(jì)算第一題的區(qū)分度。

表3-115名學(xué)生的數(shù)學(xué)測驗(yàn)成績

back學(xué)生123456789101112131415測驗(yàn)總分908180787770696555504942353110第一題得分1011111000101002.二列相關(guān)(biserialcorrelation)兩個變量都是正態(tài)連續(xù)變量,其中一個變量被人為地分成兩類。測驗(yàn)總分或效標(biāo)分?jǐn)?shù)、某個測驗(yàn)項(xiàng)目的分?jǐn)?shù)都是連續(xù)變量,其中一個變量被人為地分成兩類,可以是測驗(yàn)總分或效標(biāo)分?jǐn)?shù)被人為地分成兩類,也可以是某個項(xiàng)目的分?jǐn)?shù)被人為地分成兩類。點(diǎn)二列相關(guān)和二列相關(guān)的區(qū)分是,二分的變量總體是否為正態(tài),正態(tài)則用二列相關(guān),非正態(tài)則用點(diǎn)二列相關(guān)。計(jì)算二列相關(guān)的公式是:(公式3-7)

rb:二列相關(guān)系數(shù);

:答對該題的被試在總分上(或效標(biāo)分?jǐn)?shù)上)的平均得分;

:答錯該題的被試在總分上(或效標(biāo)分?jǐn)?shù)上)的平均得分;St全體被試的總分(或效標(biāo)分?jǐn)?shù)的標(biāo)準(zhǔn)差);p為答對該題的人數(shù)百分比;q答錯該題的人數(shù)百分比,q=1-p;y為正態(tài)分布下答對百分比所在位置的曲線高度。

二列相關(guān)的顯著性檢驗(yàn):用Z檢驗(yàn)。

(公式3-8)

例7,下表是某學(xué)校的15名學(xué)生在一次語文測驗(yàn)中的總分和作文題的得分情況,作文題被人為地分成兩種情況,37以上算通過,37分以下算沒有通過。請計(jì)算作文題的區(qū)分度。表3-215名學(xué)生的語文測驗(yàn)成績

back學(xué)生123456789101112131415測驗(yàn)總分908180787770696555504942353110作文題得分1011111000101003.積差相關(guān)適用資料:兩列數(shù)據(jù)都是測量的數(shù)據(jù);兩列變量各自總體的分布都呈正態(tài),即正態(tài)雙變量。

例8:下表是30個學(xué)生一次語文測驗(yàn)的分?jǐn)?shù),試計(jì)算作文題的區(qū)分度。

學(xué)生12345678910測驗(yàn)總分78656681554882798388作文題得分41343038262043444142學(xué)生11121314151617181920測驗(yàn)總分55578768554667777273作文題得分23264131302526313233學(xué)生21222324252627282930測驗(yàn)總分78777484426145636661作文題得分39363243193318333530練習(xí)1:下表是30個學(xué)生一次測驗(yàn)的分?jǐn)?shù),試計(jì)算第三題的難度;若第三題是是非題,答案分對和錯,請計(jì)算其區(qū)分度;若第三題是作文題,人為地將其分成通過和不通過,請計(jì)算其區(qū)分度。

學(xué)生12345678910測驗(yàn)總分85736298763542768485第3題得分1001110011學(xué)生11121314151617181920測驗(yàn)總分96945382796453844765第3題得分1101011101學(xué)生21222324252627282930測驗(yàn)總分51649732468881765332第3題得分0111011011練習(xí)2:下表是某大學(xué)學(xué)生的一次普通心理學(xué)期末考試的成績總分和某一論述題的得分(滿分為15分),請計(jì)算這一論述題的難度和區(qū)分度。學(xué)生12345678910測驗(yàn)總分88868581776254535662論述題得分1211109876555學(xué)生11121314151617181920測驗(yàn)總分68915268646378777479論述題得分61256667777學(xué)生21222324252627282930測驗(yàn)總分71586536566984858788論述題得分7554568888練習(xí)3:某一心理測驗(yàn)1、2、3、4四個項(xiàng)目的難度分別為0.73、0.25、0.67、0.19,請分別計(jì)算這幾個項(xiàng)目的標(biāo)準(zhǔn)難度Δ值。答案:-0.62(-0.61)——10.52左右;0.68——15.72;-0.44——11.24,0.88——16.52

back一、區(qū)分度與難度的關(guān)系

二、項(xiàng)目的選擇

back表3-3D的最大值與項(xiàng)目難度的關(guān)系項(xiàng)目通過率1.000.900.700.600.500.400.300.100D的最大值00.200.600.801.000.800.600.200從此表我們可以看出,難度越接近于0.50,項(xiàng)目潛在的區(qū)分度越大,而難度越接近1.00或0時,項(xiàng)目的潛在區(qū)分度越小。因此,在常模參照測驗(yàn)中,要提高區(qū)分度,最好讓項(xiàng)目保持中等程度的難度。如果我們想使我們的所測驗(yàn)到的心理特質(zhì)的分?jǐn)?shù)分布呈正態(tài),我們考慮難度選擇項(xiàng)目時,應(yīng)使項(xiàng)目的難度分布也呈正態(tài)分布,特別難和特別容易的題目少一些,中等難度的項(xiàng)目多一些,而所有項(xiàng)目的平均難度要保持在0.50左右。

back

1.根據(jù)難度挑選項(xiàng)目

項(xiàng)目的難度分布也呈正態(tài)分布,特別難和特別容易的題目少一些,中等難度的項(xiàng)目多一些,在編制測驗(yàn)時一般要求項(xiàng)目的難度在0.20~0.80之間,而所有項(xiàng)目的平均難度要保持在0.50左右。當(dāng)題目之間正相關(guān)時,題目難度值應(yīng)分布得廣些但平均難度應(yīng)以0.50為好。當(dāng)題目有猜測可能時,題目的P值應(yīng)適當(dāng)加大。一般能力測驗(yàn)和成就測驗(yàn)的平均難度在0.50左右為宜。出現(xiàn)偏態(tài)情況時,宜對項(xiàng)目進(jìn)行調(diào)整,以使測驗(yàn)分?jǐn)?shù)的分布接近正態(tài)。但項(xiàng)目難度還與測驗(yàn)的目的有關(guān),正偏態(tài)分布適合于篩選性測驗(yàn)。此時項(xiàng)目的難度和整個測驗(yàn)的難度應(yīng)該偏高。選拔性測驗(yàn)還要考慮錄取率。達(dá)標(biāo)考試屬于負(fù)偏態(tài)分布,此時項(xiàng)目的難度和整個測驗(yàn)的難度應(yīng)該偏低。標(biāo)準(zhǔn)參照能力測驗(yàn)P=1.0或P=0有可能也是好題。人格測驗(yàn)

P≧0.95或P≦0.05的題目考慮刪除2.根據(jù)區(qū)分度挑選項(xiàng)目

表2-1測題的鑒別指數(shù)與優(yōu)劣評鑒

鑒別力D測題評鑒0.40以上優(yōu)良0.30-0.39良好,如能修改則更好0.20-0.29尚可,仍需修改0.19以下劣,必須淘汰埃貝爾(I.Ebel)的標(biāo)準(zhǔn)是針對鑒別指數(shù)的,如果區(qū)分度是用相關(guān)系數(shù)計(jì)算得來的,則挑選項(xiàng)目的最低標(biāo)準(zhǔn)是不低于相應(yīng)的臨界值。

3.對選擇題的選項(xiàng)進(jìn)行分析

(1)如果正確的被選答案被所有被試選擇,則說明該題目太容易或者題目中可能提供了某種暗示。(2)如果某個錯誤答案沒有一個被試選擇,說明該項(xiàng)目不具迷惑性,錯得過于明顯,一般來說,除非有2%以上的人選擇,否則這個被選答案應(yīng)該修改。(3)如果所有被試都選擇了同一個錯誤答案,可能是編制測驗(yàn)時把答案定錯了,也可能是教學(xué)中發(fā)生了錯誤。(4)如果高分組被試的選擇集中在兩個答案上,二者選擇率相近,說明該題可能有兩個正確答案或另一個答案也有一定的道理。(5)如果高分組對正確答案的選擇與低分組相等或低于后者,說明考察的東西與水平無關(guān)。(6)如果一個題目被試未答人數(shù)過多或選擇各個被選答案的人數(shù)相等,則說明題目過難或題意不清,使得被試無法做答或憑猜測作答。

例8,表3-4是一張2道4重選擇題的項(xiàng)目分析表。被試共100人,高低分組共有27人。表中兩道題的正確答案都是B。表3-42道4重選擇題的項(xiàng)目分析表題號分組選項(xiàng)A選項(xiàng)B選項(xiàng)C選項(xiàng)D未答PD

1高分組224040

0.72

0.26低分組1160812高分組9124050.56-0.04低分組318405一、誤差(error)的定義和種類

誤差是在測量中與目的無關(guān)的因素所產(chǎn)生的不準(zhǔn)確的或不一致的結(jié)果。

定義的后半部分從準(zhǔn)確性和一致性兩方面對誤差做了區(qū)分。準(zhǔn)確性和一致性的關(guān)系可以用射擊靶環(huán)來說明。假設(shè)有A、B、C三支槍,對準(zhǔn)靶面中心固定位置后各放9槍,所得結(jié)果見圖4-1。

ABC圖4-1準(zhǔn)確性和一致性的關(guān)系

隨機(jī)誤差:由與測量目的無關(guān)的偶然因素引起的變化無規(guī)律的誤差。大小和方向的變化完全是隨機(jī)的,無規(guī)律可循。系統(tǒng)誤差:由與測量目的無關(guān)的因素引起的恒定的有規(guī)律的誤差。穩(wěn)定地存在于每一次測量中。二、真分?jǐn)?shù)(truescore)

真分?jǐn)?shù):指一種測量工具在測量沒有誤差時得到的純正值。

操作定義:無數(shù)次測量所得結(jié)果的平均值。

經(jīng)典測量理論(ClassicalTestTheory,CTT)的數(shù)學(xué)模型:經(jīng)典測量理論假定:實(shí)得分?jǐn)?shù)、真分?jǐn)?shù)、測量誤差存在下述線性關(guān)系,用公式表示如下:

X=T+E

(公式4-1)式中X為實(shí)得分?jǐn)?shù)或觀測分?jǐn)?shù),T為假設(shè)的真分?jǐn)?shù),E為測量誤差。

關(guān)于測量誤差還有如下假設(shè):(1)如果對一個人測量無數(shù)次,其誤差之和為0,平均誤差為0,即(2)

誤差與真分?jǐn)?shù)相互獨(dú)立,即(3)一個團(tuán)體的平均真分?jǐn)?shù)等于該團(tuán)體中所有被試實(shí)得分?jǐn)?shù)的平均值。(4)對于一個團(tuán)體來說,實(shí)得分?jǐn)?shù)、真分?jǐn)?shù)、和測量誤差之間有如下關(guān)系:(公式4-2)

真分?jǐn)?shù)的變異可以分成兩個部分:與測驗(yàn)?zāi)康挠嘘P(guān)的變異(有效的變異數(shù)ValidVariance)和與測驗(yàn)?zāi)康臒o關(guān)的變異(無效的變異數(shù)InvalidVariance),即(公式4-3)式中,是與測量目的有關(guān)的變異數(shù),即有效的變異數(shù);是與測量目的無關(guān)的變異數(shù),即無效的變異數(shù)。將公式4-3代入公式4-2得下列公式:(公式4-4)

back

(一)測量工具引起的誤差

(二)施測過程引起的誤差

(三)被測對象引起的誤差

back心理測量工具往往是一套量表。當(dāng)量表在測出人的某種心理特質(zhì)時,若項(xiàng)目所測的東西與我們所欲測的目的之間出現(xiàn)偏差,則測量會出現(xiàn)誤差。

back

1.施測環(huán)境:施測現(xiàn)場的溫度、光線、聲音、桌面的好壞、空間的寬窄都可能產(chǎn)生影響。

2.施測時限:時限沒有嚴(yán)格控制,過寬或過緊都會使測驗(yàn)結(jié)果存在誤差。

3.主試因素:主試的年齡、性別、外表、言談舉止、表情動作、對測驗(yàn)過程的熟悉程度都可能會對測驗(yàn)結(jié)果產(chǎn)生一定的影響。

4.意外干擾:在施測環(huán)境復(fù)雜,特別是受測者較多時,容易發(fā)生意外情況。

5.評分記分

back1.應(yīng)試動機(jī)受測者對測驗(yàn)的動機(jī)不同,會導(dǎo)致不同的作答態(tài)度、注意力、持久性和反應(yīng)速度,從而影響測驗(yàn)成績。動機(jī)效應(yīng)在人格測驗(yàn)中也有表現(xiàn)。2.測驗(yàn)焦慮測驗(yàn)焦慮是指受測者在應(yīng)試前和測試過程中出現(xiàn)的一種緊張的、不愉快的情緒體驗(yàn)。一般出現(xiàn)在能力和成就測驗(yàn)對于人格測驗(yàn)如果主試沒有講清測驗(yàn)?zāi)康暮统霈F(xiàn)不合適的表情動作,也會使受測者產(chǎn)生焦慮,尤其對于年齡較小的兒童和本身有焦慮特質(zhì)的個體。焦慮和作業(yè)成績的關(guān)系呈倒形的V字曲線,適度的焦慮可以提高作業(yè)成績,焦慮水平太高和太低都不利于受測者水平的發(fā)揮。圖4-2焦慮對測驗(yàn)成績的影響

3.測驗(yàn)經(jīng)驗(yàn)當(dāng)使用一種新的測驗(yàn)形式的時候,由于被測者不熟悉,缺乏測驗(yàn)經(jīng)驗(yàn)可能會影響測驗(yàn)成績。4.練習(xí)效應(yīng)有些測驗(yàn)需要第二次應(yīng)用,甚至多次應(yīng)用。比如,在開始一項(xiàng)教學(xué)改革前對學(xué)生的能力和學(xué)習(xí)成績進(jìn)行前測,過半個學(xué)期后進(jìn)行后測,看看成績或能力有沒有提高。這時就會存在練習(xí)效應(yīng)。在能力測驗(yàn)方面,練習(xí)效果的研究大體獲得了以下結(jié)論:(1)

練習(xí)對于智力較高者,效果較為顯著。(2)

著重速度的測驗(yàn),練習(xí)效果較明顯。(3)再做同一個測驗(yàn)要比做復(fù)本的練習(xí)效果顯著。(4)兩次測驗(yàn)之間的時距越大,練習(xí)效果越小,相距三個月以上,練習(xí)效果可以忽略不計(jì)。(5)一般的平均練習(xí)效果,約在個標(biāo)準(zhǔn)差以下,但第二次再測時,練習(xí)效果即接近于零。一、信度的意義二、信度系數(shù)的作用

back一、信度的意義信度即測驗(yàn)的可靠性,指的是測量的一致性程度。

信度受隨機(jī)誤差的影響,隨機(jī)誤差越大,信度越低。

在測量學(xué)中,信度被定義為:一組測量分?jǐn)?shù)的真變異數(shù)與總變異數(shù)(實(shí)得變異數(shù))的比率。即(公式5-1)式中代表信度系數(shù),代表真分?jǐn)?shù)的變異數(shù),代表實(shí)得分?jǐn)?shù)的變異數(shù),即總變異數(shù)。根據(jù)公式5-1,信度還可以表示為:(公式5-2)

這個定義有兩點(diǎn)要注意:(1)信度是一組測量分?jǐn)?shù)的特性,不是某個測量分?jǐn)?shù)的特性。是對一個人測量多次或?qū)σ粋€群體進(jìn)行測量得到一組測量分?jǐn)?shù)的特性(2)真分?jǐn)?shù)的變異數(shù)不能直接測量,因此信度是一個理論上構(gòu)想的概念,只能根據(jù)一組實(shí)得分?jǐn)?shù)進(jìn)行估計(jì)。

對于信度系數(shù),還應(yīng)該注意以下幾點(diǎn):(1)在不同的情況下,對于不同的樣本,采用不同的方法會得到不同的信度系數(shù),因此一個測驗(yàn)可能不止一個信度系數(shù)。(2)信度系數(shù)只是對測量分?jǐn)?shù)不一致程度的估計(jì),并沒有指出不一致的原因。(3)獲得較高的信度系數(shù)并不是心理測量有效的充分條件,只是一個必要條件。back1.評價測驗(yàn)信度系數(shù)是衡量測驗(yàn)好壞的一個重要的技術(shù)指標(biāo)。

一般能力與學(xué)績測驗(yàn)的信度系數(shù)為0.90以上,有的可以達(dá)到0.95;標(biāo)準(zhǔn)智力測驗(yàn)的信度系數(shù)應(yīng)達(dá)到0.85以上,個性和興趣測驗(yàn)的信度系數(shù)可稍低,一般應(yīng)達(dá)到0.70~0.80,(也有人認(rèn)為興趣、性格、價值觀等人格測驗(yàn)的信度系數(shù),通常在0.80~0.85或更高些)。當(dāng)信度系數(shù)小于0.70時,不能用測驗(yàn)來對個人進(jìn)行評價,也不能用來進(jìn)行團(tuán)體間的比較;當(dāng)信度系數(shù)大于0.70時,可用來進(jìn)行團(tuán)體間的比較;大于0.85時,可以用來鑒別個人。

2.用來估計(jì)個人的測驗(yàn)分?jǐn)?shù)(真分?jǐn)?shù))由于誤差的存在,一個人通過測量得到的分?jǐn)?shù)很難等于真分?jǐn)?shù)。理論上,我們可以對一個人施測無數(shù)次,然后求得所得分?jǐn)?shù)的平均數(shù)和標(biāo)準(zhǔn)差。在這個假設(shè)的分布里,平均數(shù)就是這個人的真分?jǐn)?shù),標(biāo)準(zhǔn)差則為誤差大小的指標(biāo)。

在實(shí)際工作中,我們用一組被試(人數(shù)足夠多)兩次施測的結(jié)果來代替對同一個人反復(fù)施測,以估計(jì)測量誤差的變異數(shù)。此時,個人在兩次測驗(yàn)中的分?jǐn)?shù)差異就是測量誤差。據(jù)此可制成誤差分?jǐn)?shù)的分布。這個分布的標(biāo)準(zhǔn)差(誤差分布的標(biāo)準(zhǔn)差)我們稱之為測量的標(biāo)準(zhǔn)誤,是表示測量誤差的大小的指標(biāo),其計(jì)算公式為:(公式5-4)式中SE表示測量的標(biāo)準(zhǔn)誤,即誤差分布的標(biāo)準(zhǔn)差;Sx表示一次測量分?jǐn)?shù)的標(biāo)準(zhǔn)差;rxx表示信度系數(shù)。我們可以用測量的標(biāo)準(zhǔn)誤來估計(jì)個人測驗(yàn)的真分?jǐn)?shù)的大小。

如果選用95%的可靠性水平(置信水平),即顯著性水平(a值)為.05,,真分?jǐn)?shù)有95%的可能落入X±SE,即X±1.96SE的范圍之內(nèi),也可以寫成X-1.96SE

T

X+1.96SE,SE則用公式5-4代入?;蛴?%的可能落入這范圍之外。這實(shí)際上也表明了再測時分?jǐn)?shù)改變的可能范圍。

例1,已知WISC-R的標(biāo)準(zhǔn)差為15,信度系數(shù)為0.95,對一名12歲的兒童實(shí)施該測驗(yàn)后,IQ為110,那么他的真分?jǐn)?shù)在95%的可靠度要求下,變動范圍應(yīng)是多大?

注意幾點(diǎn):(1)SE對真分?jǐn)?shù)做的是區(qū)間估計(jì),不可能由此得到一個確切的點(diǎn)。這就是說,測驗(yàn)分?jǐn)?shù)不是一個定點(diǎn),而是具有一定的分布范圍。因此,兩次測驗(yàn)分?jǐn)?shù)之間存在差異是很正常的。(2)置信水平確定后,估計(jì)的精度主要取決于SE,SE越小,范圍越小,估計(jì)就越精確,反之也然。(3)真分?jǐn)?shù)不能等同于真正能力或心理特質(zhì),真分?jǐn)?shù)中包括了系統(tǒng)誤差。

3.用來對兩種測驗(yàn)分?jǐn)?shù)進(jìn)行比較來自不同測驗(yàn)的原始分?jǐn)?shù)是無法直接進(jìn)行比較的,只有將它們轉(zhuǎn)換成相同尺度的標(biāo)準(zhǔn)分?jǐn)?shù)才能進(jìn)行比較。如,某班期末考試,小明的數(shù)學(xué)成績是80分,語文成績是70分。另外,已知小明所在班級的數(shù)學(xué)平均成績是70分,標(biāo)準(zhǔn)差是10分,語文平均成績是60分,標(biāo)準(zhǔn)差是7分。我們可以用“差異的標(biāo)準(zhǔn)誤”來檢驗(yàn)差異的顯著性。差異的標(biāo)準(zhǔn)誤的公式為:(公式5-5)為差異的標(biāo)準(zhǔn)誤,S為相同尺度的標(biāo)準(zhǔn)分?jǐn)?shù)的標(biāo)準(zhǔn)差,Z分?jǐn)?shù)為1,T分?jǐn)?shù)為10。、分別為兩個測驗(yàn)的信度系數(shù)。先將原始分?jǐn)?shù)化成標(biāo)準(zhǔn)分?jǐn)?shù),然后將兩個標(biāo)準(zhǔn)分?jǐn)?shù)的差異與1.96SEd(0.05顯著性水平)進(jìn)行比較,如果其絕對值大于此值,則差異顯著,否則差異不顯著。例2,某校五年級進(jìn)行了兩次數(shù)學(xué)測驗(yàn),小張第一次考了85分,此次數(shù)學(xué)測驗(yàn)?zāi)昙壠骄质?7分,標(biāo)準(zhǔn)差是8分,此次測驗(yàn)的信度系數(shù)是0.84;第二次考了95分,此次數(shù)學(xué)測驗(yàn)?zāi)昙壠骄质?1分,標(biāo)準(zhǔn)差是10分,此次測驗(yàn)的信度系數(shù)是0.91;問小張這兩次數(shù)學(xué)測驗(yàn)的成績是否有顯著差異?

back一、再測信度二、復(fù)本信度三、等值穩(wěn)定性系數(shù)四、內(nèi)部一致性系數(shù)

五、評分者信度

總結(jié)練習(xí)

back再測信度(Test-RetestReliability)

,也叫重測信度,也叫穩(wěn)定性系數(shù)。用同一個測驗(yàn),對同一組被試前后施測兩次,對兩次測驗(yàn)分?jǐn)?shù)求相關(guān),其相關(guān)系數(shù)就叫再測信度。其計(jì)算公式(皮爾遜積差相關(guān)公式的變式)為:(公式5-6)式中X1、X2為同一被試的兩次測驗(yàn)分?jǐn)?shù),、為全體被試兩次測驗(yàn)的平均數(shù),S1、S2為兩次測驗(yàn)的標(biāo)準(zhǔn)差,N為被試人數(shù)。再測法的模式是:施測適當(dāng)時距再施測例2:假設(shè)有一份主觀幸福感調(diào)查表,先后兩次施測于10名學(xué)生,時間間隔為半年,結(jié)果如表所示,求該測驗(yàn)的重測信度。(為了便于理解和計(jì)算,本章估計(jì)信度的例子都是小樣組,實(shí)際應(yīng)用時應(yīng)采用大樣組。)表5-1某幸福感調(diào)查表的兩次測試結(jié)果

測驗(yàn)被試12345678910X1

16151313111010987X21616141211911867計(jì)算再測信度必須注意幾個問題:(1)所測量的特性必須是穩(wěn)定的。當(dāng)然絕對的穩(wěn)定是不可能的,但應(yīng)該是比較穩(wěn)定的。(2)遺忘和練習(xí)的效果基本上相互抵消。在做第一次測驗(yàn)時,被試可能會獲得某種技巧,但只要間隔時間適度,這種練習(xí)的效果會基本上被遺忘掉。再測信度要考慮時間間隔的問題。到底多長合適呢?一般來說,無論對于那種被試,初測與再測的間隔最好不要超過六個月。

(3)再測法適用于速度測驗(yàn)而不適用于難度測驗(yàn)。

(4)應(yīng)注意提高被試者的積極性。back

復(fù)本信度(AlternateFormReliability),也稱等值性系數(shù)(CoefficientofEquivalence)用兩個平行(等值)的測驗(yàn)對同一組被試施測,得到兩組測驗(yàn)分?jǐn)?shù),求這兩組測驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù),這就是復(fù)本信度。因?yàn)檫@反應(yīng)了兩個測驗(yàn)的等值程度,因此又稱等值性系數(shù)。計(jì)算方法與再測法是一樣的。復(fù)本信度的模式是:復(fù)本A最短時距復(fù)本B

例3:假設(shè)用A、B兩型創(chuàng)造力復(fù)本測驗(yàn)對初中一年級10個學(xué)生施測。結(jié)果見表5-2。表5-2某創(chuàng)造力復(fù)本測驗(yàn)測試結(jié)果

測驗(yàn)被試12345678910X1

20191918171614131210X22020181615171211139復(fù)本信度應(yīng)用時應(yīng)注意以下幾點(diǎn):(1)復(fù)本信度的關(guān)鍵在于兩個量表必須等值,即必須具有相同的難度、區(qū)分度、長度、題型等。

(2)兩次測驗(yàn)的時距應(yīng)盡可能短促,以便避免知識的積累、練習(xí)效應(yīng)等因素的影響。

(3)由于量表的兩個復(fù)份在許多方面近似,所以信度系數(shù)有稍稍偏高的傾向。

(4)被試易出現(xiàn)疲勞、失去積極性等反應(yīng),還會出現(xiàn)遷移。這些稱為順序效應(yīng),為了抵消順序效應(yīng),可隨機(jī)分配一半被試先做復(fù)本A再做復(fù)本B,另一半被試先做復(fù)本B再做復(fù)本A,以平衡順序效應(yīng)。(5)復(fù)本法只能減少而不能完全排除練習(xí)和記憶的影響。(6)對于許多測驗(yàn)來說,建立復(fù)本是相當(dāng)困難的。

back三、等值穩(wěn)定性系數(shù)等值穩(wěn)定性系數(shù)是用兩個平行的(等值的)測驗(yàn),間隔適當(dāng)時距施測于同一組被試得到兩組測驗(yàn)分?jǐn)?shù),求這兩組測驗(yàn)分?jǐn)?shù)的相關(guān),其相關(guān)系數(shù)就是等值穩(wěn)定性系數(shù)。等值穩(wěn)定性系數(shù)的模式是:測驗(yàn)A適當(dāng)時距測驗(yàn)B計(jì)算方法同穩(wěn)定性系數(shù)和等值性系數(shù)。等值穩(wěn)定性系數(shù)也是采用復(fù)本對被試施測,但等值性系數(shù)的測驗(yàn)要求兩次測驗(yàn)的時間間隔盡可能短,而計(jì)算等值穩(wěn)定性系數(shù)的兩次測驗(yàn)卻要求有一個適當(dāng)?shù)臅r距。

優(yōu)點(diǎn):(1)因兩次測試有適當(dāng)?shù)臅r間間隔,減少了復(fù)本法中的練習(xí)、疲勞效應(yīng)。(2)只要時間間隔適當(dāng),可用于計(jì)算穩(wěn)定性不高的心理特質(zhì)的測驗(yàn)的信度。注意:等值穩(wěn)定性信度系數(shù)的值一般要比等值性系數(shù)和穩(wěn)定性系數(shù)要低。等值穩(wěn)定性系數(shù)是測驗(yàn)信度的最嚴(yán)格的考察,得到的是信度系數(shù)的下限。

back利用一次測驗(yàn)所獲得的資料來計(jì)算信度系數(shù)。這樣計(jì)算出來的信度系數(shù)反應(yīng)的是測驗(yàn)內(nèi)部的一致性,即測驗(yàn)項(xiàng)目的同質(zhì)性,叫做內(nèi)部一致性系數(shù)或同質(zhì)性系數(shù)。(一)分半法(分半信度)

(二)其它計(jì)算內(nèi)部一致性系數(shù)的方法

back

分半信度(Split-halfreliability):分半信度就是將測驗(yàn)題目分成等值的兩半,分半求出量表題目的總分,再計(jì)算兩部分總分的相關(guān)系數(shù)。

分半的方法很多,常見的方法是把一個量表按題目番號分為兩半,一半是奇數(shù)題,另一半數(shù)偶數(shù)題。求出每個人的奇數(shù)題的總得分和偶數(shù)題的總得分,然后求出奇數(shù)題總得分和偶數(shù)題總得分的相關(guān)系數(shù),最后對相關(guān)系數(shù)進(jìn)行校正。

校正公式有:(1)斯皮爾曼-布朗(Spearman-Brown)公式(公式5-7)式中,是兩半測驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù),為整個測驗(yàn)的信度估計(jì)值。

采用斯皮爾曼-布朗(Spearman-Brown)公式進(jìn)行校正時,假定兩半測驗(yàn)等值,亦即兩半測驗(yàn)具有相同的平均數(shù)和標(biāo)準(zhǔn)差。當(dāng)假定不能滿足時,可以采用下面兩個公式來估計(jì)信度。弗朗那根公式:(公式5-8)式中,、分別為兩半測驗(yàn)分?jǐn)?shù)的變異數(shù),為測驗(yàn)總分的變異數(shù)。r為信度值。

盧倫公式:(公式5-9)式中,為兩半測驗(yàn)分?jǐn)?shù)之差的變異數(shù),為測驗(yàn)總分的變異數(shù)。r為信度值。

例4:有一個由100題構(gòu)成的量表施測于10個高三學(xué)生。測驗(yàn)一次后,應(yīng)試者即畢業(yè)離?!,F(xiàn)在怎樣評介測驗(yàn)結(jié)果的信度?

(1)計(jì)算出每個應(yīng)試者的奇數(shù)題總分(X1)和偶數(shù)題總分(X2),見表5-3。

得分被試12345678910X1

38373841403638394035X237373639393438393936采用分半信度應(yīng)注意以下幾個問題:(1)若用分半法時,以按奇數(shù)題和偶數(shù)題分半為宜。(2)在使用斯皮爾曼-布朗公式時要求全體被試在兩半測驗(yàn)上的得分的變異數(shù)相等。當(dāng)一個測驗(yàn)不宜分成對等的兩半時分半信度不宜采用。(2)當(dāng)試卷中存在任選題時,不宜采用分半法。速度測驗(yàn)也不宜采用分半法。因?yàn)樗俣葴y驗(yàn)中試題的難度低,被試得分的多少主要是看答題的多少,分半法易使得分相同,從而夸大分半法的信度估計(jì)。(3)如遇到有牽連的項(xiàng)目或一組解決同一問題的項(xiàng)目時,這些項(xiàng)目應(yīng)放在同一半,否則會高估信度的值。(4)將一個測驗(yàn)分成兩半的方法很多(如,按題號的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半等),因此,一個測驗(yàn)可以有多個分半信度值。提供分半信度值時,要說明分半的方法。

back分半法實(shí)際上是對測驗(yàn)內(nèi)部一致性的一個粗略估計(jì)。但對于同一個測驗(yàn)分半的方法是很多的,而且用不同的分半方法求出的分半信度都不一樣,因此分半信度不是最好的內(nèi)部一致性的估計(jì)。為了彌補(bǔ)分半法的不足,可以采用其它的方法。1.庫德-理查遜公式(K-R20公式)庫德(Kuder)、理查遜(Richardson)針對分半法的不足,提出以項(xiàng)目統(tǒng)計(jì)量為轉(zhuǎn)移,利用項(xiàng)目統(tǒng)計(jì)量來計(jì)算信度。稱為K-R20公式。(公式5-10)式中k表示構(gòu)成測驗(yàn)的題目數(shù),pi為通過第i題的人數(shù)比例,qi為未通過第i題的人數(shù)比例,為測驗(yàn)總分的變異數(shù)。

例5:有一種包含6個問題的測驗(yàn),10個應(yīng)試者的得分如表5-4(答對得1分,答錯得0分),試估計(jì)應(yīng)試者反應(yīng)的一致性程度。

2.庫德-理查遜另一公式(K-R21公式)當(dāng)測驗(yàn)項(xiàng)目難度接近時可以采用庫德-理查遜提出的簡便公式,稱為K-R21公式。K-R21公式為:

(公式5-11)式中k表示構(gòu)成測驗(yàn)的題目數(shù),為測驗(yàn)總分的平均數(shù),為測驗(yàn)總分的變異數(shù)。3.克倫巴赫(Cronbach)的α系數(shù)庫德-理查遜公式只適用于兩級記分的測驗(yàn),而對多級記分的測驗(yàn),則可以采用克倫巴赫(Cronbach)的α系數(shù),克倫巴赫的α系數(shù)對兩級記分的測驗(yàn)也是適用的。其計(jì)算公式為:(公式5-11)式中,K為測驗(yàn)的題目數(shù),為某一測驗(yàn)題目分?jǐn)?shù)的變異數(shù),

為測驗(yàn)總分的變異數(shù)。例6:有一種包含6個論文式題目的測驗(yàn),對5個應(yīng)試者施行,得分見下表5-5,試求該測驗(yàn)的信度。

表5-5被試在測驗(yàn)上的得分

題號被試ABCDE17118111126978936106894811683571181111671181111五、評分者信度(ScorerReliability)評分者信度:隨機(jī)抽取部分試卷,由兩個或多個評分者獨(dú)立按評分標(biāo)準(zhǔn)打分,然后求其間的相關(guān),所得的相關(guān)系數(shù)即為評分者信度。

評分者信度的計(jì)算:1.評分者為兩個人時若是連續(xù)變量的評分,且分布是正態(tài)則計(jì)算皮爾遜積差相關(guān)系數(shù)(可用計(jì)算機(jī)直接計(jì)算)。若是等級評定或雖是等距或等比的數(shù)據(jù)但分布非正態(tài),則計(jì)算斯皮爾曼等級相關(guān)。斯皮爾曼等級相關(guān)公式:(公式5-12)式中D為各對偶等級之差,是各D平方之和,N為等級數(shù)目。當(dāng)有相同的等級出現(xiàn)時,計(jì)算斯皮爾曼等級相關(guān)的公式為:(公式5-13),;,式中,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論