心理學(xué)考研之心理測量學(xué)筆記_第1頁
心理學(xué)考研之心理測量學(xué)筆記_第2頁
心理學(xué)考研之心理測量學(xué)筆記_第3頁
心理學(xué)考研之心理測量學(xué)筆記_第4頁
心理學(xué)考研之心理測量學(xué)筆記_第5頁
已閱讀5頁,還剩94頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

------------------------------------------------------------------------心理學(xué)考研之心理測量學(xué)筆記心理測量學(xué)第一章心理測量的歷史要了解當(dāng)代心理學(xué)的各個領(lǐng)域不可不了解心理測驗(yàn),因?yàn)闇y驗(yàn)是在當(dāng)代心理學(xué)的各個領(lǐng)域從事理論研究和實(shí)際應(yīng)用的重要手段。要研究心理測驗(yàn),不可不考察它的發(fā)生發(fā)展的歷史。第一節(jié)心理測量在我國有著悠久的歷史測驗(yàn)的歷史根源雖然無從考究,但中國人最早使用測驗(yàn),也最重視測驗(yàn),這一點(diǎn)是舉世公認(rèn)的。一、我國古代的心理測驗(yàn)早在2500多年前,我國古代教育家孔子就曾根據(jù)自己的觀察評定學(xué)生的個別差異,把人分為中人、中人以上和中人以下,這實(shí)際上相當(dāng)于測量學(xué)中的命名量表和次序量表。所謂“中人以上可以語上也,中人以下不可以語上也”,就是說智力比普通人高的可以給他高等教育,智力比普遍人低的不能給他高等教育。比孔子稍晚的孟子也說過:“權(quán),然后知輕重;度,然后知短長。物皆然,心為甚”這就明確指出了心理現(xiàn)象進(jìn)行測量的必要和可能。三國時劉劭著的《人物志》一書,提出了心理觀察的一條基本原理,即“觀其感變,以審常度。”意思是霉根據(jù)一個人的行為變化便可推測他的一般心理特點(diǎn)。并提出通過詞,以回答法(“應(yīng)贊”)為手段來觀察人的智力。這是一部論述能力問題的古代專著。1937年美國人把它譯成英文,書名為《人類能力的研究》。6世紀(jì)初,南朝人劉勰在《新論?專學(xué)篇》甲提到,“使左手畫方,右手畫圓,無一時俱成”,“由心不兩用則手不并運(yùn)也”。這是世界上最早的心理測驗(yàn),比西方分心測驗(yàn)的出現(xiàn)要早1300多年。世界上最早的嬰兒發(fā)展測驗(yàn)也出自中國民間,自6世紀(jì)中葉以來,“周歲試兒”在我國江南就已經(jīng)成為風(fēng)俗?!额伿霞矣?xùn)》作者顏之推在《風(fēng)操篇》中對此做了詳細(xì)記載:“江南風(fēng)俗,兒生一期(一周歲),為制新衣,盥浴裝飾。男則用弓矢紙筆,女則刀尺針縷,并加飲食之物及珍寶服玩,置之兒前,觀其發(fā)意所取以驗(yàn)貪廉、智愚,名之為試兒?!泵绹纳w塞爾(A?Gese11)到本世紀(jì)20年代才用類似方法在實(shí)驗(yàn)室條件下記錄幼兒的動作和順應(yīng)行為等方面的發(fā)展。顏之推還根據(jù)心理與行為的密切關(guān)系強(qiáng)調(diào)客觀了解心理的可能,在《名實(shí)篇》中寫道,“人之虛實(shí)真假在于心,無不見乎跡?!弊詮乃鍩蹌?chuàng)行開科取仕,科舉制度在我國通行了1300多。年。目前西方言語測驗(yàn)中常見的填字和類比,相當(dāng)于我國科舉考試中的貼經(jīng)和對偶,早在7世紀(jì)的唐代就有了。歐美各國通過考試選拔官吏的方法是18世紀(jì)末、19世紀(jì)初從我國學(xué)去的。清朝后期出現(xiàn)的益智圖(通稱七巧板),形狀大小不同的七塊小板能夠組成近百種的生物和實(shí)物圖樣,這可以看作是創(chuàng)造力測驗(yàn)的最早方案之一。七巧板的操作屬于典型的發(fā)散式思維活動,操作的成果是形象轉(zhuǎn)化(見圖1—1),值得高度重視。我國民間流行的九連環(huán),其設(shè)計(jì)之巧妙,也可以和現(xiàn)代的魔方、魔棍相媲美《見圖1—2》。西方直到1914年才有五巧板。后來劉湛恩先生用英文寫了《中國人用的非文字智力測驗(yàn)》一書,把七巧板、九連環(huán)介紹到國外,武德沃斯(Woodworth)對九連環(huán)極為贊賞,把它稱作“中阻式的述津”。最近,五巧板、七巧板已經(jīng)發(fā)展成為紙筆測驗(yàn),可應(yīng)用于團(tuán)體,測試方便,計(jì)分準(zhǔn)確,已達(dá)到標(biāo)準(zhǔn)化程度。二、民主革命時期測驗(yàn)運(yùn)動的發(fā)展清朝末年,心理學(xué)由西方傳人我國。1914年有人在廣東測驗(yàn)了500名兒童的記憶和比喻理解。1920年,北京高等師范學(xué)校和南京高等師范學(xué)校建立了我國最早的兩所心理實(shí)驗(yàn)室。廖世承和陳鶴琴在南京高師開設(shè)測驗(yàn)課,并用心理測驗(yàn)試測投考該校的學(xué)生。這便是我國正式開始的科學(xué)心理測驗(yàn)。1921年他倆正式出版《智力測驗(yàn)法》一書。1922年,比奈量表由費(fèi)培杰譯成中文,并在江、浙二省的一些小學(xué)生中進(jìn)行過測驗(yàn)。同年美國測驗(yàn)專家麥柯爾(W?A?Mocall)博士應(yīng)中華教育改進(jìn)社聘請來華講學(xué),在他的指導(dǎo)下,北京師范大學(xué)、北京大學(xué)、燕京大學(xué)、北京女子高等師范、東南大學(xué)等校的教授和學(xué)生開始編制測驗(yàn)。據(jù)麥?zhǔn)险f:當(dāng)時中國心理學(xué)家所編造的各種測驗(yàn)“至少都與美國的水平相等,有許多竟比美國的為優(yōu)?!?923年,在教育改進(jìn)社的主持下,進(jìn)行了全國小學(xué)教育調(diào)查,調(diào)查地區(qū)包括22個城市和11個鄉(xiāng)鎮(zhèn),測驗(yàn)了92000個兒童。這個大規(guī)模的調(diào)查,引起了當(dāng)時教育界對測驗(yàn)的注意。1924年,陸志韋先生發(fā)表了《訂正比奈西蒙智力測驗(yàn)說明書》,30年代又與吳天敏再次做了修訂;1931年中國測驗(yàn)學(xué)會成立。1932年《測驗(yàn)》雜志創(chuàng)刊。根據(jù)不完全的資料統(tǒng)計(jì),到抗日戰(zhàn)爭前夕,我國心理學(xué)工作者制訂或改編出合乎標(biāo)準(zhǔn)的智力測驗(yàn)和人格測驗(yàn)約20種,教育測驗(yàn)50多種。如廖世承團(tuán)體智力測驗(yàn),陳鶴琴圖形智力測驗(yàn),劉湛恩非文字智力測驗(yàn),以及肖孝嶸修訂的墨跋量表和畫人測驗(yàn)(原編制者美F?L.Goode-?nongh)、艾偉修訂的賓特納智慧測驗(yàn)等。在這一時期,測量工作者能比較正確地估計(jì)測驗(yàn)的效用和價值,并不滿足于已有的方法和技術(shù),因而力圖改進(jìn)和提高。但是抗日戰(zhàn)爭爆發(fā)后,絕大多數(shù)人不得不中斷或推遲當(dāng)時所進(jìn)行的工作。解放前共出版心理的研究、王征葵的《態(tài)度濺量法》、沈有乾的《心理與測驗(yàn)》、王書林的《心理與教育測量》、陳選善的《教育測驗(yàn)》、艾偉的《小學(xué)兒童能力測驗(yàn)》、孫幫正的《心理與教育測驗(yàn)》等。林傳鼎先生指出:“民主革命時期我國心理學(xué)家在測驗(yàn)領(lǐng)域至少做了兩方面有益的工作:一是為當(dāng)時的語文教學(xué)改革提供科學(xué)根據(jù)。二是為探索我國青少年兒童心理特點(diǎn)積累一些客觀材料?!比?、心理測驗(yàn)在科學(xué)的春天中復(fù)蘇解放后的近30年,由于多方面原因,心理測驗(yàn)一直成為禁區(qū)。粉碎“四人幫”后,心理測驗(yàn)才在科學(xué)的春天中復(fù)蘇。1979年,林傳鼎,張厚粲等參考國外材料編制了少年兒童學(xué)習(xí)能力測驗(yàn).同年,中國心理學(xué)會在天津開會時,醫(yī)學(xué)心理專業(yè)委員會成立了心理測驗(yàn)協(xié)作組,建議由湖南醫(yī)學(xué)院龔耀先主持修訂韋氏成人智力量表。1980年初,北京師大心理學(xué)系首次開設(shè)心理測量課。同年5月,中國心理學(xué)會實(shí)驗(yàn)心理學(xué)專業(yè)委員會在武漢召開了全國心理測驗(yàn)研究協(xié)作會議,決定由林傳鼎,張厚粲主持修訂韋氏兒童智力量表,吳天敏主持修訂比奈量表。經(jīng)過三年的努力,這些測驗(yàn)已基本修訂完成。在這期間中國科學(xué)院心理研究所和北。京安定醫(yī)院等單位協(xié)作修訂了明尼蘇達(dá)多相個性調(diào)查表,北京大學(xué)心理系陳仲庚先生等修訂了艾森克人格問卷,北京師大心理系編制了鑲嵌圖形測驗(yàn),還有其它許多單位也編制或修訂了一些心理測驗(yàn),如注意測驗(yàn)、記憶測驗(yàn)、氣質(zhì)測驗(yàn)、嬰幼兒發(fā)展測驗(yàn)等,并在編制創(chuàng)造思維能力測驗(yàn)方面做了一些有益的嘗試。隨著心理測量教學(xué)和研究工作的開展,心理測驗(yàn)開始在實(shí)際部門應(yīng)用,如飛行員的選拔,運(yùn)動員的選材、精神病的診斷、兒童多動癥以及超常與智力落后兒童的檢查等都用到心理測驗(yàn)。1983年初,在昆明召開的普通心理,實(shí)驗(yàn)心理專業(yè)年會上,就測驗(yàn)問題進(jìn)行了討論??偨Y(jié)了近幾年測驗(yàn)工作中的經(jīng)驗(yàn),找出了問題,明確了方向。1984年末,在北京召開的第五屆全國心理學(xué)年會上,成立了—測驗(yàn)工作委員會,加強(qiáng)了對測驗(yàn)工作的指導(dǎo)。第二節(jié)科學(xué)心理測驗(yàn)的產(chǎn)生與發(fā)展一心理測驗(yàn)的產(chǎn)生是社會的需要在西方一些國家,工業(yè)革命成功后,對勞動力的需要急劇增加,工廠大量采用童工,許多地方官與工廠主訂約,每雇20個童工,必需帶一個低能者。第—個用科學(xué)方法研究低能者的是法國醫(yī)生意太(Itard)。他的學(xué)生沈干(Seguin)繼承其師半途而廢的事業(yè),用生理訓(xùn)練法進(jìn)行了多年試驗(yàn),并于1837年創(chuàng)辦了第一所專門教育智力落后兒童的學(xué)校。后來,其他一些歐美國家也陸續(xù)設(shè)立低能學(xué)?;蛟谄胀▽W(xué)校設(shè)特別班。在這種情況下,單靠長期觀察和社會公認(rèn)來鑒別智力落后兒童就很不夠了。1864年,沈干出版了《白癡:用生理學(xué)方法來診斷與治療》一書,介紹了在感覺辨別力和運(yùn)動控制力方面訓(xùn)練落后兒童的方法,其中的一些方法如形式板被后來的非言語智力測驗(yàn)所采用。19世紀(jì),由于社會上對智力落后和精神失常者實(shí)行人道主義在歐洲和美洲開設(shè)了一些護(hù)理精神病人的特別醫(yī)院,因而急需確定收護(hù)標(biāo)準(zhǔn)和客觀化的分類方法,首先必須區(qū)分精神錯亂者與智力落后者。法國醫(yī)生伊斯奎洛爾(Esquirol)經(jīng)過種種嘗試最后斷定:一個人駕駛語言的能力,是他智力水平的最可靠的標(biāo)志。另外,隨著工業(yè)的發(fā)展,社會分工日益精細(xì),因而有了專才訓(xùn)練與職業(yè)指導(dǎo)的需要,這也是促使測驗(yàn)發(fā)展的重要因素。特別是后來各種特殊能力傾向測驗(yàn)更是直接應(yīng)實(shí)踐的需要而產(chǎn)生的。二、心理測驗(yàn)起源于個別差異的研究世界上的事物千差萬別,既是同一種事物,也有個別差異,沒有任何兩個物體是完全相同的。身有胖瘦,面有俊丑,而人心之不同,更是勝過其面。有個別差異,才有測量的必要。科學(xué)家最初發(fā)現(xiàn)人的心理的個體差異的重要性是起因于天文學(xué)上的一個事件。1796年,英國格林威治天文臺的皇家天文學(xué)家N?馬斯基林因?yàn)橹纸饍?nèi)布魯克觀察量體通過的晚間比自己遲0.2秒,認(rèn)為他“師心自用,不依法行事”而將他辭退。此事在20年后受到另一天文學(xué)家貝塞爾的注意,他通過研究認(rèn)為,這是一種不可避免的個人觀察的誤差。于是引起了學(xué)者們對個別差異的研究。但是,當(dāng)時的心理學(xué)家們并不關(guān)心個別差異的測量。直到19世紀(jì)末時,心理物理學(xué)的發(fā)展才促進(jìn)了對心理現(xiàn)象的量的測定。1879年,馮特(W?Wundt)在萊比錫大學(xué)設(shè)立第一所心理實(shí)驗(yàn)室。這一時期的實(shí)驗(yàn)心理學(xué)家長于生理學(xué)和物理學(xué),主要目標(biāo)是要發(fā)現(xiàn)人類行為的一般趨勢,注意的焦點(diǎn)是行為的共同性而不是它的差異性。但是在研究中發(fā)現(xiàn),對于同一刺激;各人的反應(yīng)常常不同。起初以為這是由于實(shí)驗(yàn)手續(xù)上的錯誤。經(jīng)過長時間的實(shí)驗(yàn)才認(rèn)識到,此種差異并非由于偶然的錯誤,而是由于個人間能力上的真正差別。于是,引起了個別差異的研究。要研究個別差異必須有測量工具,由此便引起了測量運(yùn)動。另一方面,早期的心理實(shí)驗(yàn)提出了嚴(yán)格控制觀察條件的要求。例如,在一個測量反應(yīng)時的實(shí)驗(yàn)中,給予被試者的指導(dǎo)語可能明顯地提高或降低被試者的反應(yīng)速度。再如,周圍環(huán)境的照度和色調(diào)可能明顯地改變視覺刺激物的形象。這表明,只有在標(biāo)準(zhǔn)狀況下被試者所作的觀察報告才是有價值的。這種程序的控制為測驗(yàn)的標(biāo)準(zhǔn)化打下了基礎(chǔ)。三、心理測驗(yàn)的早期嘗試首先倡導(dǎo)測驗(yàn)運(yùn)動的是優(yōu)生學(xué)創(chuàng)始人、英國生物學(xué)家和心理學(xué)家弗蘭西斯,高爾頓爵士(FrancisGdllon)。1869年,他出版了《遺傳的天才》一書,提出人的能力是由遺傳而來,并設(shè)想人的能力的分布是常態(tài)的,其差異是可以測量的。他在調(diào)查遺傳問題的過程中,認(rèn)識到有必要測量那些有親緣關(guān)系和沒有親緣關(guān)系的人們的特性,以確定其相似程度。為此,高爾頓促使一些學(xué)校保存了對學(xué)生所進(jìn)行的系統(tǒng)測量記錄。他還在1884年國際博覽會上設(shè)立了一個人類測量實(shí)驗(yàn)室,參觀者付三個便士就可以測量到自己的某些身體素質(zhì)和視聽覺的敏銳性:肌肉力量、反應(yīng)時以及其他一些簡單的感覺一運(yùn)動功能,博覽會閉幕后,這個實(shí)驗(yàn)室遷到倫敦的南圣頓博物院,在這里繼續(xù)開辦了六年之久。用這種方法系統(tǒng)積累了關(guān)于簡單心理過程方面的個別差異的大量資料。高爾頓設(shè)計(jì)了許多簡單的測驗(yàn),如判斷線條長短與物體輕重。等。他受17世紀(jì)英國教育家洛克“一切知識來之感官”的觀點(diǎn)的影響,企圖由各種感覺辨別力的測量結(jié)果以推估個人智力的高低。他在1883年出版的《人的能力研究》一書中說:“外部世界”的信息是通過我們的感覺到達(dá)我們大腦的。我們的感覺越敏銳,獲得的信息便越多,獲得的信息越多,我們的判斷與思維便越有用武之地”。高爾頓還注意到,白癡對于熱、冷,痛鑒別能力較低。這一觀察結(jié)果使他進(jìn)一步確信,感覺辨別力“基本上是心智能力中最高的能力”。高爾頓還是應(yīng)用等級評定量表、問卷法以及自由聯(lián)想法的先驅(qū)。他的另一個很重要的貢獻(xiàn)是把統(tǒng)計(jì)方法應(yīng)用于對個別差異資料的分析。他將以前數(shù)學(xué)家們所研究出來的統(tǒng)計(jì)技術(shù)改造為簡單形式,使那些未經(jīng)專門訓(xùn)練的調(diào)查者也能使用。他不但擴(kuò)充了古特萊特(Guetelet)的百分位法,還創(chuàng)造了一種粗淺的計(jì)算相關(guān)系數(shù)的方法。他的學(xué)生卡爾?皮爾遜(Karl.Pearson)推進(jìn)其事業(yè),創(chuàng)立積差相關(guān)法,成為測驗(yàn)學(xué)者寸步不能離的工具。在心理測驗(yàn)的發(fā)展史上,美國心理學(xué)家J?M?卡特爾(J?M?Cattell)占據(jù)了一個特別突出的位置。卡特爾早年留學(xué)于德國,從師馮特。他將新興的實(shí)驗(yàn)心理學(xué)與剛剛興起的測驗(yàn)運(yùn)動結(jié)合起來,不顧先生的反對,完成了題為《反應(yīng)時的個別差異》的博士論文。1888年,在劍橋大學(xué)任教期間,與高爾頓過從甚密,深受其影響,在差異測量方面的興趣得到加強(qiáng)?;孛篮?,執(zhí)賓夕法尼亞大學(xué)心理學(xué)之教鞭,合馮、高二氏之學(xué),以各種心理測驗(yàn)來研究個別差異。他在自己的實(shí)驗(yàn)室內(nèi)編制測驗(yàn)五十個,包括測量肌肉力量、運(yùn)動速度、痛感受性、視聽敏度,重量辨別力、反應(yīng)時、記憶力以及類似的一些項(xiàng)目。他于1890年發(fā)表的《心理測驗(yàn)與測量》一文,描述了這些測驗(yàn)。這篇論文首創(chuàng)了“心理測驗(yàn)”這個術(shù)語,還由高爾頓加上了一篇附錄表示支持。在此文中,卡特爾說:“心理學(xué)若不立足于實(shí)驗(yàn)與測量上,決不能夠有自然科學(xué)之準(zhǔn)確?!庇终f:“心理測驗(yàn)若有一普遍的標(biāo)準(zhǔn),則其科學(xué)的與實(shí)際的價值一定可增加不少?!彼?dāng)時就極力主張測驗(yàn)手續(xù)和考試方法應(yīng)有統(tǒng)一規(guī)定,并要有常模以便比較。所有這些都是測量學(xué)上的重要觀念。但他的測驗(yàn)皆脫胎于馮特的實(shí)驗(yàn)室,測量的大多是感知和運(yùn)動過程。對同一個人來說;—幾項(xiàng)測驗(yàn)的結(jié)果往往很不一致,而且測驗(yàn)得分與老師評定的智力;等級或?qū)W習(xí)成績相關(guān)極低。因此在教育上缺乏實(shí)用價值。這啟發(fā)后來的研究者探索其他途徑來研究智力的差異。早在1889年,厄恩(Oehro)曾編制十組測驗(yàn),測量知覺、記憶、聯(lián)想和運(yùn)動機(jī)能。1892年波爾頓(Bolton)用數(shù)字:測量兒童的記憶力。1895年包爾登(Bourdon)發(fā)明勾消測驗(yàn),其結(jié)果雖與智力關(guān)系不大,但此法現(xiàn)在依然通行。1897年艾賓浩斯《Ebbinghaus)用算術(shù)運(yùn)算,記憶廣度、句子填充測驗(yàn)施測于小學(xué)生,最復(fù)雜的要數(shù)句子填充,其結(jié)果與學(xué)業(yè)成績十分相符,這大有別于卡特爾的低級心理過程的測驗(yàn)。1903年,克來(Kelly)已有以智齡為常模的思想,可惜此后來深深加研究。列舉這些人的貢獻(xiàn)是為了說明,科學(xué)的心理測驗(yàn)不是哪一個人獨(dú)立造的,而是時代發(fā)展的必然產(chǎn)物。四、比奈的貢獻(xiàn)著名美國學(xué)者波林(E?G?Boring)指出;在測驗(yàn)領(lǐng)域中.“19世紀(jì)80年代是高爾頓的10年,90年代是卡特爾的10年,20世紀(jì)頭10年則是比奈的10年。比奈(A?Binet),1857年生于法國尼斯市,其父為醫(yī)生,其母為藝術(shù)家。比奈在青年時學(xué)習(xí)醫(yī)學(xué),卻對心理學(xué)更有興趣,1886年發(fā)表第一部著作《推理心理學(xué)》,1889年同享利?博尼(H.Beaunis)在索那建立第一所法國心理實(shí)驗(yàn)室,后任實(shí)驗(yàn)室主任,1891年發(fā)表《個性的變化》一書,后來他還對一些著名的計(jì)算家、棋手和盲棋手的思維活動做了研究,1895年他創(chuàng)辦第一份法國心理學(xué)雜志《心理學(xué)年報》,同年他與享利聯(lián)名發(fā)表文章,批評當(dāng)時流行的測驗(yàn)太偏重于感覺,過于集中在測量簡單的、特定的能力方面。他們認(rèn)為,測量比較復(fù)雜的功能,不必苛求精確度,因?yàn)檫@些功能的個別差異是較大的。1898年比奈在哲學(xué)雜志上發(fā)表《個性心理學(xué)中的測量》一文,提到許多測驗(yàn),如畫方形,比較線的長短,記憶數(shù)目,詞句重組,回答含有道德判斷的問題,了解抽象文章的意義,折紙等等,后來有許多采用在他的量表中。在這篇文章中,他還提出心理測量的根本原理在于將個人的行為與他人比較以歸類,這是近代測驗(yàn)理論的基本思想。1903年,他的另一本著作《智辦的實(shí)驗(yàn)研究》問世,在此書中他所講的智力是廣義的,包含一切高等心理過程,并且表現(xiàn)在推理,判斷以及運(yùn)用舊經(jīng)驗(yàn)解決新問題的行為上,他以自己的兩個女兒作為被試者,所用的測驗(yàn)有填字、圖片解釋等。有些后來亦用于他的量表中。1904年法國教育部委派許多醫(yī)學(xué)家、教育家與科學(xué)家組織一個委員會,專門研究公立學(xué)校中低能班之管理法。比奈亦是委員之一。他決心將測驗(yàn)的理論研究變?yōu)閷?shí)際的應(yīng)用,不顧眾人的反對,極力主張用測驗(yàn)法去辨別有心理缺陷的兒童。經(jīng)過細(xì)心研究,次年與其助手西蒙(T?Simon)在《心理學(xué)年報》上發(fā)表一篇論文,題為《診斷異常兒童智力的新方法》,在這篇文章中介紹的就是第一個智力量表——比西量表。1905年的量表有30個由易到難排列的項(xiàng)目,可用來測量各種各樣的能力,特別側(cè)重于判斷,理解,推理,亦即比奈所謂智力的基本組成部分。雖然這些測驗(yàn)也包括了感、知覺的內(nèi)容,但其中言語部分所占的比例遠(yuǎn)較同時代的其他測驗(yàn)為大。不過該量表比較粗糙。1908年做了修訂,采用智力年齡的方法計(jì)算成績,并建立了常模,這是心理測驗(yàn)史上的一個創(chuàng)新。1911年做了第二次修訂,就在這一年比奈不幸謝世,終年54歲。比奈的成功不是偶然的,他曾經(jīng)測量過人的頭蓋骨,研究過面相、手相和字相,他是費(fèi)了許多工夫,試了許多方法,走了許多歧路,才得到成功的。目前世界上的智力測驗(yàn)為數(shù)眾多,其基本原理和主要方法都是由比奈奠定的,在心理測量的發(fā)展史上,比奈的貢獻(xiàn)是不可磨滅的。因此,美國心理學(xué)家賓特納(R.Pintner)說:“在心理學(xué)史上,假使我們稱馮特為實(shí)驗(yàn)心理學(xué)的鼻祖,我們不得不稱比奈為心理智力測量的鼻祖。”五、心理測驗(yàn)的發(fā)展比西量表問世后,迅即傳至世界各地。各種語言的版本紛紛出現(xiàn),其中最著名的是美國斯坦福大學(xué)推孟(L.M,Terman)教授1916修訂的斯比量表,其最大的改變是采用了智商的觀念。早在1911年,德國漢堡大學(xué)心理學(xué)家斯騰(Stern)就曾提出用兒童的心理年齡除以實(shí)足年齡所得的“心理商數(shù)”來表示聰明程度。推孟在修訂比西量表時將其改稱為“智商”,從此智商一詞便為全世界所熟悉。心理測驗(yàn)運(yùn)動自本世紀(jì)初興起,20年代進(jìn)入狂熱,40年代達(dá)到頂峰,50年低轉(zhuǎn)向穩(wěn)步發(fā)展。在此期間測驗(yàn)主要有以下幾方面的發(fā)展:(一)編制出一批操作測驗(yàn),既可彌補(bǔ)語言文字量表在理論上的缺陷,又可以用于文盲和有言語障礙的人,非文字量表以賓特納所編的最好。(二)編制出團(tuán)體智力測驗(yàn),擴(kuò)大了測驗(yàn)的應(yīng)用范圍。促進(jìn)團(tuán)體智力測驗(yàn)發(fā)展的原因,是第一次世界大戰(zhàn)時美國軍隊(duì)對官兵選拔和分派兵種的需要,在推孟的研究生奧蒂斯(A?S?Otis)所編團(tuán)體測驗(yàn)的基礎(chǔ)上發(fā)展出軍用甲,乙兩種測驗(yàn),對200多萬官兵進(jìn)行了智力檢查。戰(zhàn)后此種測驗(yàn)經(jīng)改造廣泛用于民間,為教育與工商各界普遍采用。(三)多重能力傾向測驗(yàn)逐漸受到重視。早在一次世界大戰(zhàn)前,一些特殊能力(如音樂,美術(shù)、機(jī)械等廠傾向測驗(yàn)已經(jīng)在實(shí)際應(yīng)用中得到發(fā)展。30年代后,隨著因素分析理論的發(fā)展,多項(xiàng)能力傾向測驗(yàn)在二次大戰(zhàn)后編制出來,這種成套測驗(yàn)為分析個人心理品質(zhì)的內(nèi)部結(jié)構(gòu)提供了適用的工具。普通能力傾向(智力)測驗(yàn)也向多元分析形式發(fā)展。主要代表是美國學(xué)者韋科斯勒(D?Wechsler)所編制的兒童智力量表(1949),成人智力量表(1955)和學(xué)前智力量表(1967)。其特點(diǎn)一是用離差智商代替比率智商,二是由各個分測驗(yàn)結(jié)果可以得到言語,操作和全量表三個分?jǐn)?shù),即可以區(qū)分個別間差異,也可以評定個別內(nèi)差異。對人的智力的描述,從籠統(tǒng)地談聰明。不聰明,轉(zhuǎn)向區(qū)分智力的不同側(cè)面。說明人人皆有所長和所短。(四)正當(dāng)心理學(xué)家們忙于發(fā)展智力測驗(yàn)的時候,傳統(tǒng)的學(xué)??荚囈舱谶M(jìn)行一場改革,卡特爾的學(xué)生桑代克(E.LThorndike)等人,利用心理測驗(yàn)原理,編造了第一批標(biāo)準(zhǔn)化的教育測驗(yàn)。因此后人尊稱他為教育測驗(yàn)之鼻祖。一些專門的教育測驗(yàn)機(jī)構(gòu)也在一些國家陸續(xù)成立起來,美國教育測驗(yàn)中心成立于1947年,是目前世界上最大的測驗(yàn)編制和研究機(jī)構(gòu)。它有心理學(xué)家,教育學(xué)家和各方面的學(xué)科專家2000余人,并配有現(xiàn)代化的計(jì)算設(shè)備。(五)心理測驗(yàn)的另一領(lǐng)域涉及情感適應(yīng)、人際關(guān)系、動機(jī)、興趣、態(tài)度、性格等人格特點(diǎn)。人格測驗(yàn)的先驅(qū)是克瑞普林(E?Kraepelin),他最早用自由聯(lián)想測驗(yàn)來診斷精神病人。人格問卷或自陳量表的原型是1917年武德沃斯設(shè)計(jì)用于士兵的個人資料調(diào)查表,以后一直被奉為情緒適應(yīng)調(diào)查表的范本。而1921年問世的羅夏克(RorschacA)墨跡測驗(yàn)則是投射測驗(yàn)的發(fā)端。人格測驗(yàn)后來也發(fā)展到要求數(shù)量化,如明尼蘇達(dá)多相個性調(diào)查表等。(六)60年代后,由于認(rèn)知心理學(xué)的崛起,將實(shí)驗(yàn)法與測驗(yàn)法結(jié)合,產(chǎn)生了信息加工測驗(yàn),為了解心理能力提供了一些補(bǔ)充方法,使心理測驗(yàn)出現(xiàn)了新的發(fā)展趨勢??v觀心理測驗(yàn)的發(fā)展歷史,可看出以下幾點(diǎn):(一)先是以解剖生理特征為根據(jù),而后轉(zhuǎn)向?qū)π闹腔顒拥臏y量。(二)由測量簡單的感知能力,發(fā)展到測量復(fù)雜的認(rèn)知能力。(三)由籠統(tǒng)的單一量數(shù)以評定個別間差異的觀念,轉(zhuǎn)變?yōu)橐远鄠€量數(shù)兼顧個別差異與個別內(nèi)差異的觀念。(四)心理測量學(xué)是隨著實(shí)驗(yàn)心理學(xué)的發(fā)展而產(chǎn)生的,二者在發(fā)展過程中由合到分,最后又走到一起來了。目前的心理測驗(yàn)雖然看起來很簡單,卻是經(jīng)過幾代心理學(xué)家用了近一個世紀(jì)的時間反復(fù)探索才找到的,其發(fā)展主要受了兩方面因素的影響。一是心理學(xué)理論的發(fā)展。1904年英國心理學(xué)家斯皮爾曼(C.Spearman)提出智力的二因論,認(rèn)為人類智力可分為普通因素和特殊因素二部分,比奈測驗(yàn)所測得的只是普通因素。后來人們又對特殊因素發(fā)生興趣,而編出各種特殊能力測驗(yàn)。30年代智力的多因論興起,瑟斯頓(L?L?Thurstone)由因素分析求得七種基本的心理能力,隨之發(fā)展出一批多重能力側(cè)向測驗(yàn)。60年代美國南加州大學(xué)教授吉爾福特(J?P?Guilord)的智力結(jié)構(gòu)理論代之而起,提出發(fā)散思維為智力的因素之一,從而開拓測量創(chuàng)造力的新領(lǐng)域。二是統(tǒng)計(jì)學(xué)方法的進(jìn)步。早期的心理測驗(yàn)主要應(yīng)用相關(guān)法進(jìn)行研究。30年代后,因素分析法盛行,不但推進(jìn)了能力測驗(yàn)的發(fā)展,還促進(jìn)了人格理論與人格測驗(yàn)的發(fā)展,卡特爾16種人格因素測驗(yàn)就是采用因素分析法編制的。當(dāng)代信息加工測驗(yàn)的發(fā)展與一系列新的數(shù)學(xué)模式的提出是同計(jì)算機(jī)的應(yīng)用分不開的。第二章心理測量的性質(zhì)與功能第一節(jié)心理測量的性質(zhì)美國心理學(xué)家桑代克和教育測量學(xué)家麥柯爾在幾十年前曾先后提出“凡客觀存在的事物都有其數(shù)量”,“凡有數(shù)量的東西都可以測量”。對物理現(xiàn)象的測量由來已久,其可能性已為世人所公認(rèn)。對心理現(xiàn)象測量的可能性,直到現(xiàn)在尚受到一些人的懷疑。隨著科學(xué)的發(fā)展,技術(shù)的進(jìn)步,人們不但對物體的長度,重量,溫度以及時間,空間,運(yùn)動等物理特性做出了越來越精確的測量,而且不斷地嘗試著對人的感知,記憶,思維、想象、注意、情緒以及能力,氣質(zhì)、性格等心理特性進(jìn)行測量,并摸索出了一些方法,加深了對人類心理現(xiàn)象的了解,促進(jìn)了心理學(xué)理論的發(fā)展。唯心主義者把人的心理歸結(jié)為靈魂的活動。靈魂,自然是神秘不可測的。辯證唯物主義認(rèn)為,心理是腦的機(jī)能,是客觀現(xiàn)實(shí)的反映。人的心里既是主觀的,又是客觀的。其客觀性不但表現(xiàn)在心理的產(chǎn)生具有客觀的物質(zhì)基礎(chǔ)(外界刺激和腦的生理過程),還表現(xiàn)在心理要通過各種活動或行為表現(xiàn)出來。心理的客觀性,存在性決定了心理的可知性、可測性。譬如我們平時說的“怕”這種心理現(xiàn)象,雖不是物質(zhì)實(shí)體,但也是—種客觀存在,伴隨有一系列生理變化,并能用儀器測量出來。從脈博,呼吸、心跳,血壓,皮膚電及外顯行為的改變,便可以推測其“怕”的程度。當(dāng)然,由于心理現(xiàn)象本身十分復(fù)雜,目前的測量方法尚未完善,心理測量無論就其可靠性和準(zhǔn)確性都遠(yuǎn)不如物理測量。但測得不—準(zhǔn)不等于不能測,現(xiàn)在不能測不等于將來不能測。不承認(rèn)心理現(xiàn)象的可測性,是唯心主義的不可知論。一、什么是測量(一)測量的定義簡單地說,測量就是根據(jù)一定的法則用數(shù)字對事物加以確定。所謂“一定的法則”,指的是在測量時所采用的規(guī)則或方法。例如,用秤測物體的重量,依據(jù)的是杠桿原理,用溫度計(jì)測物體的溫度,依據(jù)的是熱脹冷縮規(guī)律,用尺子測物體的長度,是把尺子的零點(diǎn)對準(zhǔn)物體的一端,看物體的另一端所對著的刻度,測量人的智力,是根據(jù)智力理論編制測驗(yàn),看被試者在測驗(yàn)上的得分,如此等等。使用好的法則,可以得到準(zhǔn)確的測量效果,使用壞的法則,則會得到不準(zhǔn)確的測量效果。許多事物易于測量,因其使用的法則易于確立和遵守,心理現(xiàn)象難以測量,是因?yàn)槲覀兒茈y設(shè)計(jì)清晰而良好的法則。隨著人類認(rèn)識的發(fā)展,測量法則不斷完善,測量也就越來越真確。所謂“事物”,指的是我們所感興趣的東西,說得更明確些,是引起我們興趣的事物的屬性或特征。測量就是確定這些屬性或特征的差異。人與人的差別不只表現(xiàn)在有高有矮,有強(qiáng)有弱,有人跑得快、有人跳得高等身體外貌和體力特點(diǎn)上,也表現(xiàn)在較為抽象的心理能力和人格特點(diǎn)方面。例如有人活潑好動,有人沉靜安詳,有人勇敢豪放,有人謙遜細(xì)心,有人過目不忘,有人思維敏捷,有人精于數(shù)理工程,有人擅長文學(xué)藝術(shù)等等。所有這些特性都是心理測量的對象。所謂“數(shù)字”,是個比數(shù)值意義更廣泛的概念,可以表示數(shù)量,也可以不表示數(shù)量。一般說來,用數(shù)字對事物加以確定,就是確定出一個事物或事物的某一屬性的量。但有時也可把數(shù)字當(dāng)作一種事物的符號,而不反映事物的量,如“1班、2班、3班……”等。通常人們說的測量,指的是前一種情況,即根據(jù)特定的法則,采用一定的操作程序,給事物確定出一種數(shù)量化的價值。(二)測量的要素1.參照點(diǎn)要確定事物的量,必須有一個計(jì)算的起點(diǎn),這個起點(diǎn)叫參照點(diǎn)。參照點(diǎn)不同,測量的結(jié)果便無法相互比較。參照點(diǎn)有兩種:一種是絕對的零點(diǎn),如測量輕重、長短,都以零點(diǎn)為參照點(diǎn),即以“恰恰沒有一點(diǎn)重量”、“恰恰沒有一點(diǎn)長度”為計(jì)算的起點(diǎn)。另一種人定的參照點(diǎn),如以海平面為測量陸地高度的起點(diǎn),以冰點(diǎn)為測量溫度的起點(diǎn),這些都是人定的參照點(diǎn)。理想的參照點(diǎn)是絕對零點(diǎn)。心理測量中所用的參照點(diǎn)都是人定的,此種參照點(diǎn)有一個極大的限制,就是從該點(diǎn)起計(jì)算的數(shù)值不能以“倍數(shù)”的方式解釋。如甲的智商為100,乙的智商為50,不能說甲的智力是乙的二倍,因?yàn)闆]有零智力。這個道理雖然簡單,但往往為人們所忽略,因而常常對測驗(yàn)分?jǐn)?shù)做出不恰當(dāng)?shù)慕忉?。測量長度以米、厘米等為單位,測量重量以公斤、克等為單位,測量時間以分、秒等為單位。沒有單位,數(shù)量的多少、大小便無法表示。好的單位須符合兩個條件,一為有確定意義,即同一單位在大家看來意義相同,不允許有不同的解釋。二為有相等的價值,即第一單位與第二單位間的距離等于第二單位與第三單位間的距離。上述測量長度、重量與時間所的單位符合這兩個條件,而心理和教育測量所用的單位則不等值。如智齡是年齡作為智力的單位,因?yàn)橹橇Πl(fā)展的速度先快后,4歲與5歲之間的差別,明顯大于14歲與15歲之間的差別。(三)測量的量表要測量某個事物,必須先有一個定有單位和參照點(diǎn)的連續(xù)體,將要測的每個事物放在這個連續(xù)體的適當(dāng)位置上,看他們距參照點(diǎn)的遠(yuǎn)近,便會得到一個測量值.這種連續(xù)體就叫量表。由于制定量表的單位和參照點(diǎn)的種類不同,量表的種類也不同,根據(jù)測量的精確程度,其蒂文斯(S。S.Sfepens)將測量從低級到高級有分成四種水平,高級量表除包括低級量表的條件假設(shè)和功能外,還有本身的特點(diǎn)。1.命名量表這是測量水平最低的一種,只是用數(shù)字來代表事物或把事物歸類。因?yàn)檫@里的數(shù)字沒有數(shù)量化的關(guān)系,所以也有人認(rèn)為它不能算是測量。這種量表又可分為兩種,(1)代號——用數(shù)字來代表個別事物,如學(xué)生和運(yùn)動員的編號等。(2)類別——用數(shù)字來代表具有某一屬性的事物的全體,即把某些事物確定到不同性質(zhì)的類別里,如用1代表男,用2代表女,或用不同數(shù)字代表不同職業(yè)等。在命名量表中,數(shù)字只用來作標(biāo)記和分類,而不能作數(shù)量化分析,既不能說A>B>C,也不能做加,減,乘,除的運(yùn)算。它所適用的統(tǒng)計(jì)有次數(shù)、眾數(shù)、百分比、偶發(fā)事物相關(guān)(如四分相關(guān),相關(guān))以及x2考驗(yàn)等。2.二次序量表它比命名量表水平高,不但指明類別的大小或含有某種屬性的多少,如學(xué)生的考試名次、工資級別、能力等級、對某事物時喜愛程度等等。這里的數(shù)字包含有數(shù)量關(guān)系,代表符號是“>”,如A>B>C等,主要用于分等(當(dāng)然也包含了分類)。在次序量表中,既無相等單位,又無絕對零點(diǎn),數(shù)字僅表示等級。并不表示某種屬性的真正量或絕對值。它所適用的統(tǒng)計(jì)有中位數(shù),百分位數(shù)、斯皮爾蔓等級相關(guān)系數(shù)和肯德爾和諧系數(shù)等,但不能做加、減、乘、除運(yùn)算。3.等距量表它比次序量表又進(jìn)一步,不但有大小關(guān)系,而且一定數(shù)量的差異在整個量表的所有部分都是相等的,也就是具有相等的單位,其數(shù)值可相互做加、減運(yùn)算,但沒有絕對的零點(diǎn),因此不能做乘除運(yùn)算。典型例子是溫度計(jì),10℃與15℃的差別,同15℃與20℃的差別是一樣的,我們可以說某物溫度比另一物高多少,但不能說某物溫度是另一物的多少倍,因?yàn)樗牧泓c(diǎn)是人定的,0℃并不意味著沒有溫度。等距量表的數(shù)值加或減一個常數(shù)或用一個常數(shù)乘或除,不會破壞原來數(shù)據(jù)之間的關(guān)系,因此一個量表上的數(shù)值可以轉(zhuǎn)換為另一個具有不同單位的量表上的數(shù)值,而且?guī)讉€不同單位的測值可以轉(zhuǎn)換到一個通用量表上以便于比較。如攝氏10度可以轉(zhuǎn)換華氏50度。用此種量表獲得的數(shù)值可計(jì)算平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)、階層相關(guān),并作T和F檢驗(yàn)。4.比率量表是最高水平的量表,既有相等單位又有絕對零點(diǎn)。此種量表在物理測量中容易見到,長度、重量、時間等都是。所得的數(shù)值可做加,減,乘、除運(yùn)算。如體重:甲80公斤,乙40公斤,我們既可以說甲的體重比乙多40公斤,也可以說甲的體重是乙的2倍。比率量表所適用的統(tǒng)計(jì)除上述幾種外,還可以計(jì)算幾何均數(shù)及變異系數(shù)等。由于大多數(shù)心理特征難以找到有意義的零點(diǎn),所以本書不討論用比率量表進(jìn)行的測量。二、什么是心理測量所謂心理測量,就是根據(jù)一定的法則用數(shù)字對人的行為加以確定。即依據(jù)一定的心理學(xué)理論,使用一定的操作程序,給人的行為確定出一種數(shù)量化的價值。本書中所討論的心理數(shù)量,是以測驗(yàn)作為工具的測量,而不是用實(shí)驗(yàn),觀察等方法對心理現(xiàn)象的測量。(一)測驗(yàn)的定義“測驗(yàn)”一詞雖為大家所熟悉,但要給測驗(yàn)下一個嚴(yán)格的定義卻并不容易。目前,關(guān)于測驗(yàn)有許多定義,筆者較為贊成美國心理與教育測量學(xué)家布朗(F?G?Brown)的說法:測驗(yàn)是“測量一個行為樣本的系統(tǒng)程序”。通俗地說,心理測驗(yàn)就是通過觀察人的少數(shù)有代表性的行為,對于貫穿在人的全部行為活動中的心理特點(diǎn)作出推論和數(shù)量化分析一種科學(xué)手段。首先,測驗(yàn)測量的是人的行為,嚴(yán)格地講,只是測量了做測驗(yàn)的行為,也就是一個人對測驗(yàn)題目所進(jìn)行的反應(yīng)。在這個意義上可以說,測驗(yàn)即引起某種行為的工具。其次,一個測驗(yàn)不可能包含所要測量的行為領(lǐng)域的所有可能的題目,它所包含的只是全部可能題目的一個樣本。當(dāng)然,也有例外的情況;例如對幼兒施測一個10以內(nèi)數(shù)字的加法測驗(yàn),就可以包括兩個一位數(shù)字加法的全部各種組合。但這種情況是極少的,由于測驗(yàn)只是測量一個行為樣本,因此測驗(yàn)題目的取樣必須有代表性,而且在用同一領(lǐng)域的另一個等值的樣本時,應(yīng)該得到同樣的分?jǐn)?shù)。第三,在編制、施測、評分和解釋方面依據(jù)一套系統(tǒng)的程序。這種按照嚴(yán)格的科學(xué)程序去編制和使用的測驗(yàn)稱之為標(biāo)準(zhǔn)化測驗(yàn)。標(biāo)準(zhǔn)化有三點(diǎn)好處,一是可以減少無關(guān)因素測驗(yàn)?zāi)康牡挠绊?,使測量準(zhǔn)確、客觀。二是有統(tǒng)一標(biāo)準(zhǔn),便于對不同人的測驗(yàn)成績進(jìn)行比較和交流。三是同一份測驗(yàn)可用于許多人并可反復(fù)使用,較為經(jīng)濟(jì)。我們平時說的考試也是用來測量人的某種行為,藉以判定個別差異的工具,它們與測驗(yàn)的主要差別在于沒有標(biāo)準(zhǔn)化,或標(biāo)準(zhǔn)化程度較低。通常只憑教師各自經(jīng)驗(yàn)出題施測和評分,對分?jǐn)?shù)的解釋也帶有主觀隨意性。而測驗(yàn)不但要通過統(tǒng)計(jì)分析等科學(xué)程序編制出符合測驗(yàn)?zāi)康牡念}目,并有嚴(yán)格的實(shí)施程序與計(jì)分方法,而且要有關(guān)于測驗(yàn)的信度、效度以及如何解釋分?jǐn)?shù)的說明。(二)心理測量屬于哪一種水平的測量一個標(biāo)準(zhǔn)化測驗(yàn)除了有一系列測題外,還有一個或幾個標(biāo)定得很好的量表,每個量表是一組符號或一組數(shù)量,用來描寫所測量的特性的擁有程度。這些量表是屬于哪一級水平呢?一般說來,心理測量是在次序量表上進(jìn)行的。因?yàn)閷τ谌说闹橇Α⑿愿?、興趣、態(tài)度等來說,絕對零點(diǎn)是難以確定的。有人從智力發(fā)展曲線推定出智力的、絕對零點(diǎn)是在出生前三個月,亦即受孕后六個月,這個時期恰恰相當(dāng)于胎兒開始活動,中樞神經(jīng)系統(tǒng)開始控制肌肉運(yùn)動這樣一個成熟的時期。但此說尚未得到普遍承認(rèn)。即便在某一學(xué)科的考試中得了零分,也不能認(rèn)為被試在此學(xué)科方面的知識和能力為零。而且,在心理測量中,相等單位是很難獲得的,例如,假定一個測驗(yàn)包含50個個難度不同的題目,每題1分,我們能否說10分和15分的差別與45分和50分的差別相等?表面看來,都是5分之差,似乎是相等的,但仔細(xì)考慮一下就會發(fā)現(xiàn),45—50之差比10—15之差要大些,因?yàn)閺?5分提高到50分,要求再答對5個較難的題目,而從10分提高到1—5分卻只要求再做對5個相對容易的題目。所以此量表實(shí)際上并沒有相等間隔或單位。雖然心理現(xiàn)象適合在次序量表上進(jìn)行測量,但大多數(shù)心理學(xué)家喜歡把測驗(yàn)成績表現(xiàn)在等距量表上。盡管目前在心理測驗(yàn)中還無法直接制定出等距量表,但可以采用統(tǒng)計(jì)方法把測驗(yàn)分?jǐn)?shù)轉(zhuǎn)換到一個有相等單位的量表上,最通常的轉(zhuǎn)換方法是轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)。即把次序量表轉(zhuǎn)變成以標(biāo)準(zhǔn)差為單位的等距量表。(三)心理測量的性質(zhì)把心理測量同物理測量等量齊觀,是導(dǎo)致人們對心理測驗(yàn)產(chǎn)生種種誤解的原因。心理測量與物理測量有同也有異,總的看來,心理現(xiàn)象比物理現(xiàn)象更復(fù)雜,更難以測量。1.心理測量的間接性科學(xué)發(fā)展到今天,我們還無法直接測量人的心理,只能測量人的外顯行為,也就是說,我們只能通過一個人對測驗(yàn)題目的反應(yīng)來推論出他的心理特質(zhì)。所謂特質(zhì)是描述一組內(nèi)部相關(guān)或內(nèi)在聯(lián)系的行為時所使用的術(shù)語,是在遺傳與環(huán)境影響下,個人對刺激作反應(yīng)的一種內(nèi)在傾向。例如,一個人喜歡閱讀機(jī)械雜志,喜歡觀看各種機(jī)器運(yùn)轉(zhuǎn),熱心為別人修理鐘表、自行車,由此我們便可推論此人具有機(jī)械興趣的特質(zhì)??梢?,特質(zhì)乃是個體特有的(與他人不同)、穩(wěn)定的(表現(xiàn)于多種情況)、可辨別的(可與其他特征分開)特征。但它又是一個抽象的產(chǎn)物,一個構(gòu)想,而不是一個被直接測量到的有實(shí)體的個人特點(diǎn)。由于特質(zhì)是從行為模式中推論出來的,所以心理測量永遠(yuǎn)是間接的。對這種間接測量有人持懷疑態(tài)度,認(rèn)為所測量的不是所要要測的東西。實(shí)際上,這種間接測量的方法不僅在心理測量中采用,在生理學(xué)上,巴甫洛夫用狗的唾夜分泌推測大腦的高級神經(jīng)活動,也是一種間接的測量。人的心理活動與行為具有因果關(guān)系,由“果”推測“因”,這是科學(xué)研究的基本方法之一。2.心理測量的相對性在對人的行為做比較時,沒有絕對的標(biāo)準(zhǔn),亦即沒有絕對零點(diǎn),我們有的只是一個連續(xù)的行為序列;所謂測量就是看每個人處在這個序列的什么位置上,由此測得一個人智力的高低興趣的大小等,都是與所在團(tuán)體的大多數(shù)人的行為或某種人為確定的標(biāo)準(zhǔn)相比較而言的。3.心理測量的客觀性客觀性是對一切測量的基本要求。在心理測量中要控制的變量比物理測量多得多,要做到客觀頗不容易。測驗(yàn)的客觀性實(shí)際上就是測驗(yàn)的標(biāo)準(zhǔn)化問題;量具必須標(biāo)準(zhǔn)化,這是對一切測量的共同要求。經(jīng)過長期的努力探索,測驗(yàn)的標(biāo)準(zhǔn)化即客觀性已經(jīng)有了很大改進(jìn)。首先,測驗(yàn)用的題目或作業(yè)、施測說明、施測者的言語態(tài)度及施測時的物理環(huán)境等,均經(jīng)過標(biāo)準(zhǔn)化,測驗(yàn)的刺激是客觀的。特別是對測驗(yàn)項(xiàng)目的選擇不是隨意的,而是在預(yù)測基礎(chǔ)上,通過統(tǒng)計(jì)分析(難度、區(qū)分度等)確定的。其次,評分計(jì)分的原則和手續(xù)經(jīng)過了標(biāo)準(zhǔn)化,對反應(yīng)的量化是客觀的。評分方面的客觀性測驗(yàn)種類和題目類型而異。一般說來,投射測驗(yàn)的客觀性差些,而選擇題的客觀性較好,因此后者有時又叫客觀測驗(yàn)。最后,分?jǐn)?shù)的轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化,對結(jié)果的推論是客觀的。測驗(yàn)常模是通過對總體的代表性樣本的預(yù)測確定的,測驗(yàn)的信度和效度也在一定程度上經(jīng)過實(shí)踐的檢驗(yàn),依據(jù)這些資料所做出的推論,自然較為可靠和客觀。心理測驗(yàn)的客觀性雖然尚需進(jìn)一步提高,但它畢竟是測量人的心理特性的較為客觀、較為科學(xué)的方法,目前,還沒有更有效、更實(shí)用的方法能夠取代它。第二節(jié)心理測驗(yàn)的種類及功能心理測驗(yàn)是判定個別差異的工具,個別差異包括很多方面,并可在不同的目的與不同的情境下去研究,這就使測驗(yàn)具有了不同的類別和功用。一、心理測驗(yàn)的種類心理測驗(yàn)的分類隨采用的標(biāo)準(zhǔn)不同而有所不同。(一)按測驗(yàn)的功能分類1.能力測驗(yàn)?zāi)芰σ辉~,其含義頗為籠統(tǒng)。從心理測驗(yàn)的觀點(diǎn)看,可將其分為實(shí)際能力與潛在能力。實(shí)際能力是指個人當(dāng)前“所能為者”,即代表個人已有的知識、經(jīng)驗(yàn)與技能,是正式與非正式學(xué)習(xí)或訓(xùn)練的結(jié)果。潛在能力指個人將來,嚴(yán)可能為者”,是在給予一定的學(xué)習(xí)機(jī)會時,某種行為可能達(dá)到的水平。有人只把測量實(shí)際能力的測驗(yàn)稱作能力測驗(yàn),而把測量潛在能力的測驗(yàn)稱作能力傾向測驗(yàn)。實(shí)際上二者很難分清。能力測驗(yàn)又可進(jìn)一步分為普通能力測驗(yàn)與特殊能力測驗(yàn)。前者即通常說的智力測驗(yàn),后者多用于測量個人在音樂、美術(shù)、體育、機(jī)械、飛行等方面的特殊才能。2.學(xué)績測驗(yàn)主要用于測量個人(或團(tuán)體)經(jīng)過某種正式教育或訓(xùn)練之后對知識和技能掌握的程度。因?yàn)樗鶞y得的主要是學(xué)習(xí)成績,所以稱作學(xué)績測驗(yàn)。最常見的是學(xué)校中的學(xué)科測驗(yàn)。無論學(xué)績測驗(yàn)還是能力測驗(yàn)(包括能力傾向測驗(yàn)),所測得的都是個人在其先天條件下經(jīng)由后天學(xué)習(xí)的結(jié)果。不過學(xué)習(xí)成績測驗(yàn)多是測量有計(jì)劃的或比較確知的情境(如學(xué)校)下學(xué)習(xí)的結(jié)果,而能力測驗(yàn),特別是能力傾向測驗(yàn)則是測量較少控制的或不大確知的情境中學(xué)得的結(jié)果,也就是在個人生活中經(jīng)驗(yàn)累積的結(jié)果。3.人格測驗(yàn)人格測驗(yàn)主要用于測量性可知、氣質(zhì)、興趣、態(tài)度、品德、情緒、動機(jī)、信念等方面的個性心理特征,亦即個性中除能力以外的部分。(二)按測驗(yàn)的對象分類1.個別測驗(yàn)個別測驗(yàn)每次僅以一位受測者為對象,通常是由一位主測者與一位受測者在面對面的情形下舉行。此類測驗(yàn)的優(yōu)點(diǎn)在于主測者對受測者的行為反應(yīng)有較多的觀察與控制機(jī)會尤其對某些人(如幼兒及文盲)不能使用文字而只能由主試者記錄其反應(yīng)時,就非采用面對面的個別測驗(yàn)不可。個別測驗(yàn)的主要缺點(diǎn)是時間不經(jīng)濟(jì),不能在短時間內(nèi)經(jīng)由測驗(yàn)收集到大量的資料,而且個別測驗(yàn)手續(xù)復(fù)雜,主持者需要較高的訓(xùn)練與素養(yǎng),一般人不易掌握。2.團(tuán)體測驗(yàn)團(tuán)體測驗(yàn)是在同一時間內(nèi)由一位主測者(必要時可配幾名助手)短時間內(nèi)收集到大量資料,因此在教育上被廣泛采用。團(tuán)體測驗(yàn)的缺點(diǎn)是是受測者的行為不易控制,容易產(chǎn)生測量誤差。(三)按測驗(yàn)材料分類1.文字測驗(yàn)文字測驗(yàn)所用的是文字材料,受測者用文字作答,所以也稱其缺點(diǎn)是容易受被測者文化的影響,因而對不同教育背景下的人使用時,其有效性將降低,甚至無法使用。2.非文字測驗(yàn)非文字測驗(yàn)也稱操作測驗(yàn)。測驗(yàn)題目屬于對圖形、實(shí)物、工具、摸型的辨認(rèn)和操作,無需使用文字作答,所以不受文化因素的限制,可用于學(xué)前兒童和不識字的成人。此種測驗(yàn)的缺點(diǎn)是大多不宜團(tuán)體實(shí)施,在時間上不經(jīng)濟(jì)。(四),按測驗(yàn)的目的分類1.描述性測驗(yàn)測驗(yàn)的目的在于對個人或團(tuán)體的能力、性格、興趣、知識水平等進(jìn)行描述。2.診斷性測驗(yàn)?zāi)康脑谟趯€人或團(tuán)體的某種行為問題進(jìn)行診斷。3.預(yù)示性測驗(yàn)?zāi)康脑谟趶臏y驗(yàn)分?jǐn)?shù)預(yù)示一個人將來的表現(xiàn)和所能達(dá)到的水平。(五)按測驗(yàn)的難度和時限分類1.速度測驗(yàn)題目數(shù)量多,并嚴(yán)格限制時間,主要測量反應(yīng)速度。此種測驗(yàn)題目較為容易,一般都沒有超出被試的能力水平,但因時限較短,幾乎每個被試都不能做完所有題目。在純粹的速度測驗(yàn)中,分?jǐn)?shù)完全依賴于工作的速度。2.難度測驗(yàn)包含各種不同難度的題目,由易到難排列,其中有一些極難的題目,幾乎所有被試都解答不了。但作答時間較為充裕,使每個受測者都有機(jī)會做所有的題目,并在規(guī)定時間內(nèi)做完會做的題目,因此測量的是解答難題的最高能力。(六)按測驗(yàn)的要求分類1.最高行為測驗(yàn)此種測驗(yàn)要求受測者盡可能做出最好的回答,主要與認(rèn)知過程有關(guān),有正確答案。能力測驗(yàn)、學(xué)績測驗(yàn)均屬最高行為測驗(yàn)。2.典型行為測驗(yàn)此種測驗(yàn)要求受測者按通常的習(xí)慣方式做出反應(yīng),沒有正確答案。一般說來,人格測驗(yàn)測量的均屬典型行為。(七)按測驗(yàn)的性質(zhì)分類1.構(gòu)造性測在此種測驗(yàn)中,所呈現(xiàn)的刺激和受測者的任務(wù)是明確的。2.投射性測驗(yàn)在此種測驗(yàn)中,刺激沒有明確意義,問題模糊,對被試的反應(yīng)也沒有明確規(guī)定。(八)按測驗(yàn)的應(yīng)用分類1.教育測驗(yàn)教育部門是測驗(yàn)應(yīng)用最廣的領(lǐng)域,許多能力和人格測都可在學(xué)校中應(yīng)用,但用得最多的的是學(xué)績測驗(yàn),平時說的教育測驗(yàn),主要指后者。2.職業(yè)測驗(yàn)主要用于人員選拔和安置,可以是能力和學(xué)績測驗(yàn),也可以用人格測驗(yàn).3.臨床測驗(yàn)主要用于醫(yī)務(wù)部門。許多能力和人格測驗(yàn)可用來檢查智力障礙或精神疾病,為臨床診斷和心理咨詢工作服務(wù)。以上幾種分類都是相對的,同一個測驗(yàn)采用不同的標(biāo)準(zhǔn),可能歸為不同的類別。二、心理測驗(yàn)的功能心理測驗(yàn)的基本功能是測量個體差異或同一個體在不同場合下的反應(yīng)。測驗(yàn)在實(shí)際工作和理論研究中有著廣泛的應(yīng)用。(一)測驗(yàn)在實(shí)際工作中的應(yīng)用1.選材在教育、工業(yè)、軍事、藝術(shù)、體育等部門,人們經(jīng)常面臨著選材問題,也就是要辨認(rèn)那些具有最大成功可能性的人。世人常常感嘆伯樂之不常有,實(shí)際上僅僅依靠個人經(jīng)驗(yàn)來識別人才,是學(xué)生,也可用于評價教師和教學(xué)方法,既可用于評價個人,也可用于評價集體。測驗(yàn)還有助于人們的自我了解和自我評價一種原始方式,不能滿足當(dāng)代社會對各種各樣不同人才的大量需要。根據(jù)對各種活動的分析,找出各種活動所要求的心理模式,然后根據(jù)這些特征設(shè)計(jì)出各種能力、人格和學(xué)績測驗(yàn),預(yù)測人們從事各種活動的適宜性,可以提高人才選拔和職業(yè)訓(xùn)練的效率。例如,美國1942年制定全套方案對飛行員進(jìn)行選拔,結(jié)果淘汰率由65%下降到36%。我國近年來制定的《學(xué)習(xí)飛行能力預(yù)測方法》,從注意廣度,視覺鑒別,運(yùn)算能力、地標(biāo)識別,圖形記憶等幾方面進(jìn)行測驗(yàn),大大減少了人力,物力的浪費(fèi)。2.安置在學(xué)校對學(xué)生如何按能力分班以做到因材施教、早出人才;在工廠和部隊(duì)如何根據(jù)每個人的特長分配工作和兵種,以做到人盡其才,提高勞動生產(chǎn)率和部隊(duì)?wèi)?zhàn)斗力。借助于心理測驗(yàn),可以使我們在人和工作之間做出較好的匹配,避免亂點(diǎn)鴛鴦譜。3.診斷對于智力落后者的鑒別是促進(jìn)心理測驗(yàn)發(fā)展的原動力之一,直到今天,在臨床上對各種智能缺陷、精神疾病和腦功能障礙的診斷仍是某些心理測驗(yàn)的主要用途。測驗(yàn)的診斷功能不只限于臨床,在教育工作中還可以用測驗(yàn)來發(fā)現(xiàn)學(xué)生適應(yīng)不良的原因和學(xué)習(xí)困難之所在,搞清是缺乏某種特殊能力,還是某方面的知識沒有掌握,亦或是性格不良,從而采取適當(dāng)?shù)膸椭脱a(bǔ)救措施。專門為某一學(xué)科編制的診斷測驗(yàn)還可以確定學(xué)生所犯錯誤的類型,找出每個學(xué)生在學(xué)習(xí)中的弱點(diǎn),以決定采用什么方法彌補(bǔ)。4.評價測驗(yàn)可以評價人們在學(xué)習(xí)和能力上的差異,人格的特點(diǎn)以及相對長處和弱點(diǎn),評價兒童已達(dá)到的發(fā)展階段等。既可用于評價5.咨詢各種學(xué)業(yè),能力,興趣、性格測驗(yàn)可以服務(wù)于升學(xué),就業(yè)指導(dǎo),還可探察人的情緒困擾和人格障礙,為當(dāng)事人的自我決策和行為矯正提供參考意見。用測驗(yàn)來解決實(shí)際問題時,要注意測驗(yàn)資料只是作決定時要考慮的一個因素,而不是充分的條件,要作出一個好的決策還必須考慮其它方面的信息。(二)測驗(yàn)在理論研究中的應(yīng)用1.搜集資料幾乎所有的心理學(xué)領(lǐng)域都涉及到個別差異問題,而測驗(yàn)是用來搜集有關(guān)資料的一個簡便易行而又較為可靠的方法。譬如對智力的發(fā)展速率、智力的個別差異,團(tuán)體差異以及影響智力發(fā)展的環(huán)境和遺傳因素等問題的研究,大量資料都是由測驗(yàn)得到的。2.建立和檢驗(yàn)假說心理學(xué)中的許多理論是在測驗(yàn)資料的基礎(chǔ)上提出來的,并且用測驗(yàn)來檢驗(yàn)。心理測驗(yàn)在基本理論的研究中所起的作用是不容忽視的。如智力結(jié)構(gòu)理論的提出和發(fā)展,智力測驗(yàn)就起了重要作用。在教育工作中,不同教育措施的效果也要靠測驗(yàn)來比較和檢驗(yàn)。3.實(shí)驗(yàn)分組在心理學(xué)研究中,常用測驗(yàn)來對被試進(jìn)行實(shí)驗(yàn)分組,以達(dá)到等組化的要求??傊?,心理測驗(yàn)充實(shí)了研究心理學(xué)的方法,不但推動了心理學(xué)理論的發(fā)展,面且使心理學(xué)更好地為實(shí)際服務(wù)。第三節(jié)正確地對待和使用測驗(yàn)—、對測驗(yàn)的錯誤看法自測驗(yàn)問世以來,人們對其毀譽(yù)不一。對測驗(yàn)的效能存在兩種極端看法:(一)測驗(yàn)完美無缺有的人高估測驗(yàn)的效能,對測驗(yàn)奉若神明,單純依靠測驗(yàn)做各種決定,而不考慮從其他方面來的信息。他們迷信分?jǐn)?shù),把測驗(yàn)分?jǐn)?shù)絕對化,甚至把測驗(yàn)分?jǐn)?shù)的微小差異也看作具有重大的實(shí)際意義。特別是在20年代,隨著團(tuán)體測驗(yàn)的興起,測驗(yàn)在西方風(fēng)靡一時、泛濫成災(zāi),忽略了測驗(yàn)還只是個粗糙的工具。當(dāng)測驗(yàn)結(jié)果與那些毫無根據(jù)的期望大相徑庭的時候,對測驗(yàn)的失望、懷疑,乃致敵視情緒便油然而生。這一狂熱運(yùn)動實(shí)際上反而延宕了心理測驗(yàn)的進(jìn)一步發(fā)展。(二)測驗(yàn)無用且有害心理測驗(yàn)在其發(fā)展過程中不斷受到人們的批評。測驗(yàn)的反對者認(rèn)為測驗(yàn)是根本無用的,依靠測驗(yàn)往往會做出許多錯誤的決定。在西方對測驗(yàn)的另一種批評是,某些人格測驗(yàn)侵犯了個人秘密,違背民主原則。他們認(rèn)為人的個性和態(tài)度是自己的事,與學(xué)習(xí)或工作的成功無關(guān),不應(yīng)該在作實(shí)際決定時加以考慮。美國加利福尼亞州的立法機(jī)關(guān)通過的一條法令規(guī)定:凡涉及學(xué)生“家長或監(jiān)護(hù)人的個人信仰、私生活、家庭生活、品格或宗教方面的問題,禁止施行任何測驗(yàn),問卷,調(diào)查或檢查……除非書面通知學(xué)生的家長或保護(hù)人,說明需要施行這樣的測驗(yàn)、問卷、調(diào)查或檢查,并得到他們以書面形式所表示的同意……”人們對測驗(yàn)批評最強(qiáng)烈的問題是:測驗(yàn)為宿命論和種族歧視、階級壓迫提供心理學(xué)依據(jù)。近年來對此問題國際上已取得漸趨一致的看法。人們普遍認(rèn)為,這不是測驗(yàn)本身的過錯,測驗(yàn)是一個工具,測的是人的心理的差異,至于這個差異是先天的還是后天的,這要看使用者持哪種心理學(xué)理論,而與測量工具無關(guān)?,F(xiàn)在大多數(shù)人認(rèn)為測驗(yàn)測量的是教育成就和現(xiàn)有能力,是遺傳與環(huán)境,成熟與學(xué)習(xí)相互作用的結(jié)果。至于測驗(yàn)為少數(shù)種族主義者和統(tǒng)治者所利用,這種情況確實(shí)存在。早期的智力測驗(yàn)由于內(nèi)容多是白人和城市中產(chǎn)階級所熟悉的材料,黑人和勞動人民在測驗(yàn)上得分較低。于是有人便得出了黑人和勞動人民天生愚笨的結(jié)論。但此種觀點(diǎn)很快就受到正直的心理學(xué)家的批判。譬如,美國明尼蘇達(dá)大學(xué)心理學(xué)教授歐文?戈茨曼(I?Gotte—Sman),就曾明確指出:“美洲黑人和其他美國人的平均智商之間的差異,幾乎完全可以用從胎兒起直至整個一生的處境不利來說明。”對文化背影影響測驗(yàn)分?jǐn)?shù)的問題已經(jīng)研究了很多年,最初,有些研究者企圖發(fā)展排除文化影響的測驗(yàn),可是人們很快就認(rèn)識到這是行不通的,于是又轉(zhuǎn)向編制所謂文化公平的測驗(yàn)。還有人根據(jù)亞文化群的特點(diǎn),為不同文化背景的團(tuán)體編出不同的量表。所有這些努力都取得了一定的效果,我們認(rèn)為所謂公平只是相對的,更重要的是找出造成各個團(tuán)體文化差異的因素,然后再去設(shè)法消除它。過去,某些人腦子里有這樣一個公式:心理測驗(yàn)=智力測驗(yàn)=智商=遺傳決定論,這實(shí)在是對測驗(yàn)的一種誤解,正是這種誤解,使心理測驗(yàn)蒙受了長期的不白之冤。二、對測驗(yàn)的正確態(tài)度(一)測驗(yàn)是研究心理學(xué)的一個重要方法和作決策的輔助工具。俄國化學(xué)家門捷列夫說過:“從開始有測量的時候,才開始有科學(xué)?!睆男睦韺W(xué)的發(fā)展史來看,心理測驗(yàn)是在心理學(xué)由思辯科學(xué)轉(zhuǎn)向?qū)嶒?yàn)科學(xué)后產(chǎn)生的,對行為的客觀測量代替了內(nèi)省法,這是—個進(jìn)步,是繼實(shí)驗(yàn)法之后,在心理學(xué)研究方法上的又一次唯物主義嘗試。測驗(yàn)法較之觀察法和舊法考試更推確、更客觀。同時由于測驗(yàn)對被試的取樣大,并能研究較為復(fù)雜和高級的心理現(xiàn)象。因而可彌補(bǔ)實(shí)驗(yàn)法的某些不足。有人承認(rèn)通過測驗(yàn)法所得到的心理學(xué)理論,卻反對測驗(yàn)法本身,實(shí)在是一件很荒唐的事,但是,我們也應(yīng)看到,測驗(yàn)不是鑒別個別差異的唯一方法,更不是萬能方法。任何一種方法都有自己的長處和短處,測驗(yàn)的作用是有限的,只有把各種方法結(jié)合起來,才能對人的心理現(xiàn)象做出全面的考察。當(dāng)現(xiàn)實(shí)需要我們做出決定時,我們應(yīng)當(dāng)采用最有效的信息,如果它能從測驗(yàn)分?jǐn)?shù)得到,那就使用測驗(yàn),如果別的方法能提供更好的信息,那就不用測驗(yàn),重要的是對各種方法的功效做出評價,權(quán)衡利弊,盡可能公正地客觀地采用最理想的程序?,F(xiàn)在的問題是,我們一方面責(zé)難心理測驗(yàn)不準(zhǔn)確、不可靠、不科學(xué),另一方面卻又大量使用更不準(zhǔn)確,更不可靠、科學(xué)性更差的舊法考試。在升學(xué),就業(yè)、招工,晉級、長工資、授學(xué)位時用一些未經(jīng)標(biāo)準(zhǔn)化的測驗(yàn)來作篩選,甚至以一次考試定終身。自己的東西因?yàn)橛闷饋眄樖?,盡管有許多弊端,也舍不得丟掉,別人的東西,盡管有某些長處,因?yàn)樽砸巡皇煜?,便拒之門外。崇洋媚外,月亮也是外國的圓,固然不對,但閉關(guān)自守,抱殘守缺,也未必好.正確的態(tài)度應(yīng)該象魯迅先生說的那樣,對外國一切好的東西都采取拿來主義,為我所用。(二)測驗(yàn)作為一個研究手段和測量工具尚不完善心理測驗(yàn)無論在理論上和方法上都存在不少問題,絕不能認(rèn)為測驗(yàn)分?jǐn)?shù)對于人們的能力和人格提供了非常準(zhǔn)確可靠的指標(biāo),在對測驗(yàn)分?jǐn)?shù)作解釋,尤其是對個別人做預(yù)測時必須十分小心。在某些情況下,測驗(yàn)使人做出了錯誤的決定,但在更多的情況下,測驗(yàn)?zāi)転槲覀兲峁┯闷渌椒ǖ貌坏降挠杏眯畔?。我們不?yīng)該重犯倒洗澡水把孩子也潑掉的錯誤。心理測驗(yàn)的主要問題是缺乏堅(jiān)實(shí)的理論基礎(chǔ),關(guān)于智力和人格目前還沒有統(tǒng)一的定義和理論。有人可能會質(zhì)問心理學(xué)家,你們連什么是智力和人格都沒搞清就想要測量它們,豈不荒唐?我們說這種情況在科學(xué)史上是屢見不鮮的。譬如,在對萬有引力定律、一無所知時,人們僅根據(jù)簡單的杠桿知識就能稱物體的重量,在認(rèn)識到物體受熱分子運(yùn)動加速以前,人們僅根據(jù)熱脹冷縮這一現(xiàn)象就可以測量物體的溫度。正是由于秤和溫度計(jì)等測量工具的發(fā)明與使用,促進(jìn)了對物理現(xiàn)象的研究,發(fā)展了物理學(xué)理論。世界上第一把石斧絕不會削鐵如泥,世界上第一桿秤也絕不會量出一克的千萬分之一。任何一個工具只有在使用中才能發(fā)現(xiàn)它的弊端,從而不斷改進(jìn)和完善。如果當(dāng)初因?yàn)槌硬粔驕?zhǔn),刀不夠快就禁止使用,那么今天的電子天平和金屬切割機(jī)就絕不會產(chǎn)生。(三)為了更好發(fā)揮測驗(yàn)的效能,必須防止測驗(yàn)的亂編濫用測驗(yàn)是個有用的工具,但對測驗(yàn)的使用必須加以控制。測驗(yàn)之所以遭到一些人的反對,除了測驗(yàn)本身的問題外,在很大程度上是由于測驗(yàn)的誤用帶來嚴(yán)重的社會后果,敗壞了測驗(yàn)的信譽(yù)。為此,美國心理學(xué)會于1954年制訂了《心理學(xué)家的道德準(zhǔn)則》和《心理測驗(yàn)與診斷方法的技術(shù)建議》兩個文件,對測驗(yàn)的發(fā)行和實(shí)施原則做了明確規(guī)定,對使用者的資格也做了嚴(yán)格的限制。前車之覆,后車之鑒。目前,測驗(yàn)在我國剛剛興起,我們應(yīng)該一開始就強(qiáng)調(diào)它的科學(xué)性、嚴(yán)肅性,使之沿著正確方向發(fā)展。為了防止測驗(yàn)的亂編濫用,要注意以下幾個問題:1.測驗(yàn)的編制和修訂要注意科學(xué)性編制和修訂心理測驗(yàn)是一項(xiàng)十分復(fù)雜的工作,必須由有關(guān)領(lǐng)域的專家來主持。他們不但要對該領(lǐng)域(如智力、人格等)的心理學(xué)理論有較深造詣,而且要通曉測驗(yàn)的基本原理和編制技術(shù)。對心理學(xué)和測量學(xué)一竅不通或一知半解就來編制或修訂測驗(yàn)是應(yīng)該禁止的。測驗(yàn)的首要條件是標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化測驗(yàn)在編制時要遵循特定的程序,不但要有統(tǒng)一的內(nèi)容、施測程序和評分方法,而且要有較高的效度和信度,還要有解釋分?jǐn)?shù)的常模資料或其他參照標(biāo)準(zhǔn)。即使國外廣為流行的測驗(yàn),在引進(jìn)時也必須根據(jù)試測結(jié)果修訂常模和某些不合適的題目,簡單照搬或僅憑主觀經(jīng)驗(yàn)稍加更改就拿來應(yīng)用,是很危險的。2.測驗(yàn)的出版和發(fā)行要嚴(yán)加控制對于大多數(shù)心理測驗(yàn)來說,泄露測驗(yàn)內(nèi)容,可能會使測驗(yàn)失效。因此,對測驗(yàn)的出版發(fā)行必須嚴(yán)加控制。不應(yīng)在科普讀物上發(fā)表測驗(yàn)題目,在一般公開發(fā)行的書籍上,(包括某些教科書)介紹能力或教育測驗(yàn)需要舉例時,最好用模擬題目。編制和修訂一個測驗(yàn)需要很長時間,有的測驗(yàn)經(jīng)過幾十年的使用和反復(fù)修訂已漸趨完善,一旦公開發(fā)表,便整個報廢。某些人格測驗(yàn)對題目的保密要求雖然不象能力測驗(yàn)?zāi)菢訌?qiáng),但廣為散發(fā)也會增加誤用的可能性,造成不良的社會后果。為了保護(hù)測驗(yàn),防止測驗(yàn)失密,不讓一般人熟悉測驗(yàn)內(nèi)容,需要有相應(yīng)的出版法來保證。正式發(fā)行的測驗(yàn),必須備有詳細(xì)的測驗(yàn)手冊或說明書,不僅要講清施測和計(jì)分方法,而且應(yīng)提供足夠的信息以使得人們能對測驗(yàn)本身做出評價,沒有效度和信度資料的測驗(yàn)是不能發(fā)行的。目前在一些科普刊物上登載的測驗(yàn)多半是游藝性的,不能正式拿來使用。在宣傳和介紹測驗(yàn)時要實(shí)事求是地講清測驗(yàn)適用范圍,指出其不足和局限,不要夸大測驗(yàn)的功能。3.測驗(yàn)使用者要具備一定的資格測驗(yàn)的選擇、施測、計(jì)分和解釋都必須由受過專門訓(xùn)練的心理學(xué)工作者,教育工作者或醫(yī)生來進(jìn)行。一般說來,個別施測的智力測驗(yàn)和大部分人格測驗(yàn)對使用者的要求較高,而學(xué)績測驗(yàn)的使用者只要受過初步訓(xùn)練即可。測驗(yàn)的使用者既要有能力,又要恪守一定的職業(yè)道德。在宣傳和分析測驗(yàn)結(jié)果時要謹(jǐn)慎行事,要考慮對當(dāng)事人可能產(chǎn)生的影響,在一般情況下,告訴當(dāng)事人的應(yīng)是對結(jié)果的解釋,而不是簡單宣布一個分?jǐn)?shù),要保護(hù)受測者的利益,如對測驗(yàn)結(jié)果保密等,如果發(fā)現(xiàn)受測者在能力、人格或?qū)W習(xí)上存在某種問題,要給以輔導(dǎo)和幫助,并盡可能提供相應(yīng)的教育和治療上的措施,把診斷與矯正結(jié)合起來。我國著名心理學(xué)家陳立先生在一篇文章中談了對測驗(yàn)的看法,他在充分肯定測驗(yàn)是一個有用工具的前提下,特別表示了對目前社會上亂編、濫用測驗(yàn)的關(guān)切。每一個心理測量工作者必須牢記陳老的告誡。4.要學(xué)習(xí)和宣傳測量理論亂編濫用測驗(yàn)的根源在于不懂測量理論。為了解決這個問題,有必要提倡心理學(xué)和教育學(xué)工作者學(xué)點(diǎn)測量學(xué)對廣大教師宣傳和普及測量理論,促進(jìn)考試科學(xué)化,亦屬當(dāng)務(wù)之急。對國外測量理論和測驗(yàn)一樣,也要加以適當(dāng)改造,使之適合我國國情。第三章心理測驗(yàn)的編制工欲善其事,必先利其器。為了在研究工作和實(shí)踐中更好地發(fā)揮測驗(yàn)的效能,首先要編制出各種高質(zhì)量的、合用的測驗(yàn)。第一節(jié)編制測驗(yàn)的一般程序編造測驗(yàn)的方法,依測驗(yàn)的性質(zhì)而異。不同類型,不同用途的測驗(yàn),編制的具體過程是不同的。但由于測驗(yàn)原理大體相同,因而可以概括出一套通用的編制程序??偟恼f來,編制心理測驗(yàn)一般要經(jīng)過以下幾個步驟,確定測驗(yàn)的目的,制定編題計(jì)劃,編輯題目,題目的試測與分析,集合成測驗(yàn),將測驗(yàn)標(biāo)準(zhǔn)化,對測驗(yàn)的鑒定,編寫測驗(yàn)說明書。一、確定測驗(yàn)的目的(一)測量對象在編造測驗(yàn)前首先要明確測量對象,也就是該測驗(yàn)編成后要用于哪些團(tuán)體。只有對受測者的年齡、智力水平、社會經(jīng)濟(jì)和文化背景以及閱讀水平等心中有數(shù),編制測驗(yàn)時才能有的放矢。(二)測量目標(biāo)所編的測驗(yàn)用來測量什么,是測能力、人格,還是學(xué)業(yè)成就,也是必須首先考慮的問題。不但要明確測量的目標(biāo),還要對測量目標(biāo)加以分析,將此目標(biāo)轉(zhuǎn)換成可操作的術(shù)語,即將目標(biāo)具體化。如美國著名測驗(yàn)學(xué)家瑟斯頓通過因素分析,將智力分解為七種基本心理能力:語文理解——閱讀時了解文義的能力。語詞流暢——正確迅速拼字與敏捷聯(lián)想詞義的能力數(shù)字運(yùn)算——正確而迅速使用數(shù)字解答算術(shù)問題的能力??臻g關(guān)系——運(yùn)用感覺器官及知覺經(jīng)驗(yàn)正確判斷空間方向及各種關(guān)系的能力。機(jī)械記憶——對事物強(qiáng)記的能力。知覺速度——迅速而正確地觀察與辨別事物的能力。一般推理——根據(jù)已知條件推理判斷的能力。瑟斯頓根據(jù)上述七種因素于1941年編成了“基本心理能力測驗(yàn)”又如,在60年代后期,人們開始對測量創(chuàng)造力發(fā)生興趣。作為指導(dǎo)測驗(yàn)編制的操作定義,有人將創(chuàng)造力看作發(fā)散思維的能力,即對規(guī)定的刺激產(chǎn)生大量的、變化的、獨(dú)特反應(yīng)的能力,據(jù)此定義從反應(yīng)的流暢性、變通性(靈活多變)和獨(dú)創(chuàng)性三方面來測量創(chuàng)造力。(三)測量目的所編出的測驗(yàn)是要對被試做描述,還是做診斷,亦或是選拔和預(yù)測,這一點(diǎn)也是在測驗(yàn)編制前就應(yīng)明確的。目的不同,編制測驗(yàn)時的取材范圍以及試題難度等也不盡同。譬如,中學(xué)畢業(yè)考試的目的是考察學(xué)生是否掌握了中學(xué)階段所學(xué)的各學(xué)科的基本知識,在命題時主要注意取材的代表性,不必過多參考慮題目的難度。而大學(xué)入學(xué)測驗(yàn)的目的是把學(xué)生作區(qū)分,以便擇優(yōu)錄取,因此試題取樣的代表性并不重要(在我國,高考實(shí)際上還具有左右中學(xué)教學(xué)的指揮棒作用,所以應(yīng)考慮題目取樣是否符合教學(xué)大綱),但必須根據(jù)錄取率來確定適當(dāng)?shù)碾y度。而一個學(xué)科診斷測驗(yàn),則只要能找出學(xué)生學(xué)習(xí)困難之所在就可以了,對題目的難度和取樣的代表性都不必考慮。二、制定編題計(jì)劃編題計(jì)劃,實(shí)際上就是編制測驗(yàn)的藍(lán)圖,通常是一張雙向細(xì)目表,指出測驗(yàn)所包含的內(nèi)容和要測定的各種技能,以及對每一個內(nèi)容、技能的相對重視程度。不同的測驗(yàn)有不同的內(nèi)容和技能,對于學(xué)績測驗(yàn)來說,所謂內(nèi)容就是某一學(xué)科教材中的各個課題;所謂技能,就是在教學(xué)中要達(dá)到的行為目標(biāo)。美國心理學(xué)家布魯姆(B?S?BlJoom)最早提出教育目標(biāo)的分類問題。他把學(xué)習(xí)的心理活動過程分成認(rèn)知、精神運(yùn)動和情感三個領(lǐng)域,又把認(rèn)知領(lǐng)域具體分為知道(記憶事實(shí)、條件、方法、原理等的能力)、理解、應(yīng)用、分析、綜合、評價六個層次。在布魯姆等人編的《教育目標(biāo)的分類》一書中,為每個認(rèn)知層次提供了許多題目范例。后來人們一般就依據(jù)布魯姆的認(rèn)知性行為目標(biāo)編擬學(xué)科試題,以測量學(xué)生的學(xué)習(xí)結(jié)果。表3—1是一個小學(xué)高年級自然常識測驗(yàn)的編題計(jì)劃。表中的數(shù)字代表每一類題目所占的百分比,這些比例反映著每一個內(nèi)容及目標(biāo)的相對重要性。在編制標(biāo)準(zhǔn)化的學(xué)績測驗(yàn)時,這種雙向細(xì)目表是由學(xué)科專家和有經(jīng)驗(yàn)的教師,在對教材和教學(xué)大綱仔細(xì)分析的基礎(chǔ)上,經(jīng)過集體討論制定的,以確保分類合理,比例恰當(dāng)。表3一1小學(xué)自然常識測驗(yàn)編題計(jì)劃獲得基本知識理解原理原則應(yīng)用原理原則分析因果關(guān)系綜合成系統(tǒng)見解建立評價標(biāo)準(zhǔn)合計(jì)生物世界35632120資源利用23311010動力和機(jī)械23420112物質(zhì)、物性與能量56832125氣象24322013宇宙25410012地球2221108合計(jì)1828301388100測驗(yàn)計(jì)劃有兩個用途:(一)在編題階段,測驗(yàn)計(jì)劃指出應(yīng)該寫多少和寫哪些種類的題目;題目編好后可將題目的實(shí)際分布情況與測驗(yàn)計(jì)劃對照,以確定測驗(yàn)題目是否恰當(dāng)?shù)卮砹怂獪y量的領(lǐng)域,核對重要方面的內(nèi)容是否有遺漏。(二)在記分時可按表中百分比確定每類題目的分?jǐn)?shù)。三、編輯項(xiàng)目或題目(一)搜集有關(guān)資料測驗(yàn)計(jì)劃編好后,就要搜集有關(guān)資料作為命題取材的依據(jù),一個測驗(yàn)的好壞和測驗(yàn)材料的選擇適當(dāng)與否有密切關(guān)系。為此要注意以下幾個問題:1.材料要豐富資料搜集愈齊全,命題工作便愈順利,這樣測驗(yàn)內(nèi)容便不致有所偏頗,而且能提高行為樣本的代表性。如編制人格測驗(yàn),搜集的資料應(yīng)包括:人格的主要理論,用于描述人格的術(shù)語,臨床觀察的資料,以及其它人格調(diào)查表的題目等。2.材料要有普遍性所選擇的材料對測驗(yàn)對象要盡可能公平,即受測者都有相等的學(xué)習(xí)機(jī)會。譬如,編制標(biāo)準(zhǔn)化的學(xué)科成績測驗(yàn)時,要以統(tǒng)一的教學(xué)大綱和統(tǒng)編教材作為題目來源,不能只考慮個別教師的意見,而要考慮大多數(shù)教師和專家的意見。在編制智力測驗(yàn)時則要盡量避免特殊知識經(jīng)驗(yàn)和文化水平的影響。(二)選擇項(xiàng)目形式測驗(yàn)編制者還必須確定題目的表現(xiàn)方式,是紙筆測驗(yàn)還是操作測驗(yàn),是只要受測者認(rèn)出正確答案,還是需要他自己做出正確答案。在大多數(shù)情況下,任何題目都可以用幾種形式呈現(xiàn),問題是如何選擇“最優(yōu)的’形式(各種題目形式的比較和編題原則,在下一節(jié)詳細(xì)討論)。在一個測驗(yàn)中,可以采用一種形式,也可以采用幾種形式。在選擇題目形式時,要考慮以下幾點(diǎn),1.測驗(yàn)的目的和材料的性質(zhì)如果要考察學(xué)生對概念和原理的記憶,適于用簡答題,要考察對事物的辨別和判斷,適于用選擇題,而要考察綜合運(yùn)用知識的能力,則適于用論文題。2.接受測驗(yàn)的團(tuán)體的特點(diǎn)如對幼兒宜用口頭測驗(yàn),對于文盲識字不多的人不宜采用要求讀和寫的項(xiàng)目,而對有言語缺陷的人(如聾啞,口吃)則要盡量采用操作項(xiàng)目。3.各種實(shí)際因素譬如,當(dāng)被試人數(shù)過多,測驗(yàn)時間和經(jīng)費(fèi)又有限時,宜用選擇題進(jìn)行團(tuán)體紙筆測驗(yàn),而人數(shù)步,時間充裕,又有某些實(shí)驗(yàn)器和設(shè)備,則可用操作測驗(yàn)。我國的廖世承、陳鶴琴先生幾十年前曾提出以下幾條選擇測驗(yàn)形式的原則:使被試者容易明了測驗(yàn)作法;在做測驗(yàn)時不會弄錯;做法簡明省時,計(jì)分省時省力;經(jīng)濟(jì)。(三)編寫和修訂題目制定測題的過程包括,寫出、編輯、預(yù)試和修改等一系列過程。在獲得一個令人滿意的測題之前,這些步驟是不斷重復(fù)的。在這個過程中,編制者和有關(guān)方面專家要對題目反復(fù)審察修訂,改正意義不明確的詞語,取消一些重復(fù)的和不合用的題目。然后將初步滿意的題目集起來組成一個預(yù)備測驗(yàn)。編寫題目要注意以下幾個問題。1.題目的范圍要與測驗(yàn)計(jì)劃所列的內(nèi)容技能雙維表相一致。2.題目的數(shù)量要比最后所需的數(shù)目多一倍至幾倍,以備篩選和編制復(fù)份。3.題目的難度必須符合測驗(yàn)?zāi)康牡男枰?.題目的說明必須清楚明白。四、項(xiàng)目的試測和分析初步篩選出的項(xiàng)目雖然在內(nèi)容和形式上符合要求,但是否具有適當(dāng)?shù)碾y度與鑒別作用,必須通過實(shí)踐來檢驗(yàn),也就是要通過預(yù)測進(jìn)行項(xiàng)目分析,為進(jìn)一步篩選題目提供客觀依據(jù)。(一)試測項(xiàng)目性能之優(yōu)劣,不能僅憑測驗(yàn)編制者主觀的臆測來決定,必須將初步篩選出的項(xiàng)目結(jié)合成一種或幾種預(yù)備測驗(yàn),經(jīng)過實(shí)際的試測而得客觀性資料。預(yù)測應(yīng)注意以下幾個問題:1.預(yù)測對象應(yīng)取自將來正式測驗(yàn)準(zhǔn)備應(yīng)用的群體。例如,對于一個學(xué)績測驗(yàn)來說,進(jìn)行預(yù)備測驗(yàn)的學(xué)生必須和測驗(yàn)所指定的被試屬于同一個年級。并且具有相同的課程背景。取樣時應(yīng)注意其代表性,人數(shù)不必太多,亦不可過少。2.預(yù)測的實(shí)施過程與情境應(yīng)力求與將來正式測驗(yàn)時的情況相近似。3.預(yù)測的時限可稍寬一些,最好使每個受試者都能將題目做完。以搜集較充分的反應(yīng)資料,使統(tǒng)計(jì)分析的結(jié)果更為可靠。4.在預(yù)測過程中,應(yīng)對受試者的反應(yīng)情形隨時加以記錄,如在不同時限內(nèi)一般受試者所完成的題數(shù)、題意不清之處及其他有關(guān)問題。預(yù)測的目的在于獲得被試對題目如何反應(yīng)的資料,它既能提供哪些題目意義不清,容易引起誤解等質(zhì)量方面的信息,又能提供關(guān)于題目好壞的數(shù)量指標(biāo),而且通過預(yù)測還可以發(fā)現(xiàn)一些原來想不到的情況,如檢驗(yàn)時限長合適,在施測過程中還有哪些條件需要進(jìn)一步控制等。(二)項(xiàng)目分析對項(xiàng)目的分析包括質(zhì)的分析和量的分析兩個方面。前者是從內(nèi)容取樣的適切性,題目的思想性以及表達(dá)否清楚等方面加以評鑒,后者是對預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)分析,確定題目的難度、區(qū)分度、備選答案的合適度等。編制一套測驗(yàn),只依據(jù)一次預(yù)測的結(jié)果所作的題目分析是不夠的。由于預(yù)測的被試樣本可能會有取樣誤差,故由此得到的項(xiàng)目分析結(jié)果未必完全可靠;為了檢驗(yàn)所選出的項(xiàng)目的性能是否真正符合要求,通常需再選取來自同一總體的另一樣本再測一次,并根據(jù)其結(jié)果進(jìn)行第二次項(xiàng)目分析,看兩次分析結(jié)果是否一致。如果某個題目前后差距較大,說明該題的性能值得懷疑。這種在兩個獨(dú)立樣本中進(jìn)行項(xiàng)目分析的過程叫做復(fù)核。關(guān)于項(xiàng)目分析方面的問題,將在第七章詳細(xì)討論。五、合成測驗(yàn)經(jīng)過預(yù)測和項(xiàng)目分析,對各個題目的性能已有可靠的資料作為評價的根據(jù),下一步就可以選出性能優(yōu)良的題目加以適當(dāng)?shù)木幣?,組合成測驗(yàn)。(一)項(xiàng)目的選擇在選擇項(xiàng)目時,不但要考慮項(xiàng)目分析所提供的資料,還要考慮測驗(yàn)的目的、性質(zhì)與功能。最好的題目,就是只測定所需要的特征,并能對該特征加以有效區(qū)分的難度合適的題目。首先是要測定所需要的特征,如果我們想測定語言推理能力,就不要包括主要測量閱讀能力或算術(shù)知識的項(xiàng)目。題目性能好壞是相對的,不同的測驗(yàn)對題目的難度和區(qū)分度有不同的要求。一般說來,題目的區(qū)分度越高越好,這是選擇題目的一條重要標(biāo)準(zhǔn)。特別是對于選拔測驗(yàn),此條尤為重要。但有時根據(jù)需要也可以保留個別鑒別力不高的題目。如在學(xué)科成就測驗(yàn)中有些內(nèi)容十分重要,即使區(qū)分度低一些,也要包括在內(nèi)。選擇題目的另一個指標(biāo)是難度.難度多大合適并無一個絕對標(biāo)準(zhǔn),而要根據(jù)測驗(yàn)?zāi)康膩泶_定。有的要求難一些,有的則要求容易一些,有的可不考慮難度,就是同一張?jiān)嚲恚}目難度也可以不同,只要整個測驗(yàn)的平均難度符合測驗(yàn)要求即可。根據(jù)題目分析資料選出的題目,還要與測驗(yàn)計(jì)劃(雙向細(xì)目表)再次對照,看看在材料內(nèi)容以及所測量的認(rèn)知技能上的比率是否與計(jì)劃相符,必要時須加以適當(dāng)調(diào)整。此外題目的數(shù)量還必須適合于所限定的時間。(二)項(xiàng)目的編排項(xiàng)目選出之后,必須根據(jù)測驗(yàn)的目的與性質(zhì),并考慮受試者作答時的心理反應(yīng)方式,加以合理安排。在測驗(yàn)開頭應(yīng)該有一,兩個十分容易的題目,以使受測者熟悉作答程序,解除緊張情緒,建立信心,進(jìn)入測驗(yàn)情境。對試題的總的編排原則是要由易到難。這樣可避免受測者在難題上耽擱時間太多,而影響對后面問題的解答。在測驗(yàn)最后可有少數(shù)難度較大的題目,以測出受測者的最高水平。下面是兩種常見的排列方式:1.并列直進(jìn)式此種方式是將整個測驗(yàn)按試題材料的性質(zhì)歸為若干分測驗(yàn),在同一分測驗(yàn)的試題,則依其難度由易到難排列。2.混合螺旋式此種方式是先將各類試題依難度分成若干不同的層次,再將不同性質(zhì)的試題予以組合,作交叉式的排列,其難度則漸次升進(jìn)。此種排列的優(yōu)點(diǎn)是,受試者對各類試題循序作答,從而維持作答的興趣。(三)編造復(fù)本為增加實(shí)際的效用,一種測驗(yàn)至少要有等值的兩份,份數(shù)越多,使用起來愈便利。例如,我

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論