




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
心理測量學2024/3/20心理測量學2心理測量概論心理測量的基本性質
1測驗的類型與功能
2測驗的編制與實施
3心理測量發(fā)展簡史
42024/3/20心理測量學3心理測量概論心理測量的基本性質
第一節(jié)一、心理測量應用的普遍性二、心理的可測性三、心理測量的間接性四、心理測量的定義五、心理測量的心理影響性六、心理測量的工具及其特性七、心理測量誤差存在的普遍性與嚴重性八、心理測量誤差控制的理論與技術概述2024/3/20心理測量學4DBCA升學升級要測驗
應聘謀職要測驗執(zhí)業(yè)上崗要測驗晉職晉級要測驗
人生的每個關鍵時刻都要用到測驗心理測量應用的普遍性一、2024/3/20心理測量學5
1
2
3
4評估人的心理發(fā)展水平有心理成熟測驗評估人的智力發(fā)展水平有智力測驗評估人的心理健康水平有心理健康測驗評估人的人格特征有人格測驗人的心理的各個側面都有測驗2024/3/20心理測量學65評估人的教育水平有教育成就測驗
6評估人的職業(yè)能力有執(zhí)業(yè)資格測驗7評估人的學術能力有學術性向測驗
三百六十行,行行有測驗2024/3/20心理測量學7需要更多的專業(yè)人員
社會發(fā)展和進步的標志
心理測量發(fā)展
2024/3/20心理測量學8二、心理的可測性人的心理非物質,人的心理可測嗎?
2024/3/20心理測量學9孟子:權,然后知輕重;度,然后知長短。物皆然,心為甚。桑代克:凡客觀存在的事物都有其數(shù)量。麥考爾:凡有其數(shù)量的事物都可以測量。2024/3/20心理測量學10辯證唯物主義的觀點:
人的外顯行為客觀存在,可以感覺、知覺,進而可以測量。心理學的研究證明:
可以通過測量人的外顯行為而推測人的心理。
2024/3/20心理測量學11三、心理測量的間接性心理測量是一種間接測量。間接測量必須找準中介媒質。物理測量也有間接測量:測氣溫中介媒質:水銀
心理測量的中介媒質:人的外顯行為。外顯行為:種類眾多而且復雜多變。心理測量的間接測量難度更大。2024/3/20心理測量學12四、心理測量的定義廣義測量定義:測量是依據(jù)一定的法則使用量具對事物的特征進行定量描述的過程。心理測量定義:依據(jù)一定的心理學理論,使用測驗對人的心理品質進行定量描述的活動。2024/3/20心理測量學13定義理解:1、心理測量依據(jù)的法則:心理學理論2、心理測量工具:測驗。測驗的本質:一個一個精心設計、精心編排,被稱為“題目”的行為刺激組成,“測驗”內容千差萬別,形式林林總總。3、測量的對象:人的心理品質。心理品質具有內隱性,概念具有抽象性。4、心理測量的結果:對象的定量描述。2024/3/20心理測量學141“心理測量”:多指一項活動、一個過程。2“心理測驗”:多指一樣工具,一個測量文本偶爾當動詞用3“心理評估”:指獲取測量結果信息后根據(jù)某種標準做出狀態(tài)優(yōu)劣判斷的活動。
區(qū)別本書三詞用法差異2024/3/20心理測量學15五、心理測量的心理影響性心理影響性:無論主觀愿望是什么,只要實施測量,就會給被測量者的心理發(fā)展帶來影響。影響可能是積極的,也可能是消極的,可能是短期的,也可能是長期的。積極的心理影響:教育測量:準確評價,激勵學習;經(jīng)歷測量也是學習,有助于提高。人格測驗:了解人格,促使人格健康發(fā)展,促使行為被人悅納。能力傾向測驗:了解特長,選擇和分配合適工作,人、崗和諧匹配。2024/3/20心理測量學16消極的心理影響:誤用和濫用,使用質量低劣的測驗。夸大教育考試的作用:為應試而學習,忽視綜合素質發(fā)展。頻繁施行教育考試,學生疲于應付,身心受摧殘。不科學解釋智力測驗:盲目樂觀,迷失方向或自暴自棄,喪失動力。不合理使用人格測驗:傷害自尊,甚至導致人格分裂。使用質量低劣測驗:對被試做出錯誤的描述,引發(fā)嚴重后果。結論:編制、選擇和使用測驗都要非常慎重。2024/3/20心理測量學17六、心理測量的工具及其特性測驗的本質:任何測量工具都是有參照點和測量單位的數(shù)字系統(tǒng)。在心理測量學中也把它叫做量表。量表的兩要素:參照點、測量單位參照點:測量的起點,也稱零點。
絕對零點:絕對理解;相對零點:零只能說品質處于“零點”狀態(tài)。有絕對零點的測量比只有相對零點的測量性能更好。2024/3/20心理測量學18優(yōu)良測量單位:有統(tǒng)一的意義,有恒定的價值。心理測量量表兩要素的特點:參照點是人為的。測量的單位要經(jīng)過統(tǒng)計處理才能有統(tǒng)一意義,有恒定價值。2024/3/20心理測量學19七、心理測量誤差存在的普遍性與嚴重性測量的誤差:測量所得值與欲測品質實際值之間的差異值。誤差的區(qū)別:誤差的性質誤差的大小誤差的來源誤差控制的難度心理與教育測量誤差:不僅存在而且還非常的嚴重。測量研究主要任務:研究如何控制測量的誤差。
2024/3/20心理測量學20(一)測量誤差的類型隨機誤差:所得值與實際值之間大小和方向都會隨機變化的差異值。系統(tǒng)誤差:所得值與實際值之間的那種大小和方向都不變的差異值。特點:誤差與實際測量值共居一體、混淆難分。任務:將它們分離出來,評估它們的大小,研究控制辦法。2024/3/20心理測量學21(二)測量誤差形成的原因1、心理品質的特殊性內隱、抽象,造成對目標認識不清晰,導致誤差不穩(wěn)定,波動起伏,導致誤差;受測者未掌握正確作答技能,致使作答不能代表真實水平;受測者故意掩飾。致使評價出現(xiàn)誤差。2、使用質量不高的測量工具人的外顯行為與人的心理品質只具備相關關系;所測外顯行為不是欲測心理品質的代表性行為;測驗項目只“刺激”出了欲測心理品質的一部分行為;外顯行為不清晰、不穩(wěn)定。2024/3/20心理測量學223、施測過程和施測環(huán)境安排控制不好施測過程沒有統(tǒng)一要求;測試指導語沒有統(tǒng)一版本;作答起始時間和長短不統(tǒng)一;測試時的內外環(huán)境令被試不能集中精力;測試過程失控、紀律混亂,舞弊。4、主試的不良品質主試對所測心理品質的理解有誤主試實施的程序有誤;評分標準掌握不準確2024/3/20心理測量學23八、心理測量誤差控制的理論與技術概述目標真分數(shù),記為V,是測量者所追求的測量值。隨機誤差分數(shù),記為E非目標真分數(shù)(系統(tǒng)誤差分數(shù)):記為I目標真分數(shù)與非目標真分數(shù)合在一起稱為真分數(shù),記為T。2024/3/20心理測量學24心理與教育測量學假設:
進而有:在三者都相互獨立的假設下,推得以下兩公式:
2024/3/20心理測量學25信度:真分數(shù)方差在觀察分數(shù)方差中所占的比,記為:效度:目標真分數(shù)方差在觀察分數(shù)方差中所占的比記為:
心理測量的誤差控制任務:努力控制測量的隨機誤差,提高測量的信度。努力控制測量的隨機誤差和系統(tǒng)誤差,提高測量的效度。
2024/3/20心理測量學26經(jīng)典測量理論(ClassicalTestTheory,CTT)。其他理論:項目反應理論(ItemResponseTheory,,TRT)概化理論(JeneralizabilityTheory,GT)2024/3/20心理測量學27心理測量概論測驗的類型與功能
第二節(jié)一、按所測心理品質不同分類二、按對被試評價時所用的參照標準不同分類三、標準化測驗與非標準化測驗四、計算機化測驗與非計算機化測驗2024/3/20心理測量學28一、按所測心理品質不同分類(一)能力測驗1.智力測驗(IntelligenceTest):
測量人的一般認知能力水平高低的測驗。智力測驗的結果比較穩(wěn)定。測量理論與技術研究最早涉及領域2024/3/20心理測量學291斯坦福-比內量表2韋克斯勒智力量表3瑞文推理測驗著名智力測驗
2024/3/20心理測量學302.能力傾向測驗(AptitudeTest):能力傾向測驗類型:(1)一般能力傾向測驗:測量個體在多種能力上的潛在優(yōu)勢的測驗。(2)特殊能力傾向測驗:音樂、繪畫等特殊能力的測驗。能力傾向特點:依賴于先天,與生活經(jīng)驗有關,一般不受專門教學或訓練影響。
能力傾向測驗性質:測值相對穩(wěn)定,具有預測功能。2024/3/20心理測量學313.成就測驗(AchievementTests):特點:
在特定領域為檢測應試者對有關知識和技能的掌握程度而設計的測驗。教學和訓練會明顯改變成就測驗的結果。類型:學科成就測驗、綜合成就測驗、診斷測驗2024/3/20心理測量學32具體性越來越強抽象性越來越弱穩(wěn)定性越來越差
智力測驗
能力傾向測驗
成就測驗能力測驗類型特征:2024/3/20心理測量學33(二)人格測驗(PersonalityTest)測量個體人格的獨特性和傾向性特征的測驗。心理學人格概念特征:概念非常廣泛,涉及所有情感和非智力因素。應用較廣的人格測驗:自陳人格測驗、人格投射測驗。2024/3/20心理測量學341艾森克人格問卷(EPQ)2明尼蘇達多相人格調查表(MMPI)3卡特爾16種人格因素測驗(16PF)
著名自陳人格測驗
2024/3/20心理測量學351羅夏墨跡測驗(RIT)著名投射測驗
2主題統(tǒng)覺測驗(TAT)2024/3/20心理測量學364句字完成測驗3詞語聯(lián)想測驗其他投射測驗
2024/3/20心理測量學37二、按對被試評價時所用的參照標準不同分類對被試評價所用的參照標準:相對標準、絕對標準應用相對標準的稱作為常模參照測驗應用絕對標準的稱作為標準參照測驗2024/3/20心理測量學38二、按評價參照標準不同分類
(一)常模參照測驗(Norm-ReferencedTest)定義:以個體在團體中的相對地位來評價個體發(fā)展水平的測驗。性質:執(zhí)行可高可低的相對難度標準,難度的高低決定于團體本身的水平;可能使一些高利害、高競爭性測驗難度失控;團體水平發(fā)生變化,常模參照測驗要重新修訂。2024/3/20心理測量學39二、按評價參照標準不同分類
(二)標準參照測驗(Criterion-ReferencedTest)定義:以個體水平是否達到測驗領域某一固定標準來評價個體發(fā)展水平的測驗。性質:使用絕對標準,不因很多個體都已達到而提高標準,也不因很多個體都未達到而降低標準;各種專業(yè)資格測驗都屬于標準參照測驗。2024/3/20心理測量學40小結:常模參照和標準參照區(qū)分:理論上絕對,實際應用中有二者兼具的。附:潛力參照測驗:定義:以個體可能達到的水平來評價個體已經(jīng)達到水平的測驗。性質:符合對個體進行自身激勵的評價思想。
2024/3/20心理測量學41三、標準化測驗與非標準化測驗標準化概念說明:標準化主要都是為了控制測量的隨機誤差和系統(tǒng)誤差。教育與心理測量中“標準化”可以理解為是一系列的嚴格標準,也可以理解為是一個過程—
測驗的標準化過程。實際應用的測驗是否是標準化測驗必須嚴格鑒別。標準化測驗:四個方面的標準化要求測驗編制過程標準化測驗實施標準化測驗評分標準化測驗分數(shù)解釋標準化2024/3/20心理測量學42四個方面的標準化(1)編制過程標準化標準化測驗編制步驟(六步):測驗目標分解編制方案設計命題征題測試分析分數(shù)體系設計與制作測驗使用指導書編寫
編制質量的標準化:測驗信度效度要求每個題目的質量要求2024/3/20心理測量學43(2)測驗實施標準化:對主試的要求對被試的要求對測試場所內外環(huán)境的要求測試過程順序的要求(3)測驗評分標準化:試題要有公認的科學答案有統(tǒng)一規(guī)范的評分標準2024/3/20心理測量學44(4)測驗分數(shù)解釋標準化:測驗的報告分數(shù)要有明確的解釋方法和解釋依據(jù)。常模參照測驗:配有解釋常模,可以確定每個分數(shù)在團體中的確切地位。標準參照測驗:配有合格分數(shù)線以確定每個分數(shù)的合格與否
。2024/3/20心理測量學45標準化測驗特點:編制要求嚴格,測驗編制周期長;人財物投入大,測驗設計要求面向盡量大的被試群體;使用的針對性、靈活性常常不能滿足要求。非標準化測驗特點:編制目的明確、測試對象熟悉;內容設計針對性強、方法靈活多變、編程短;不能輕視自編測驗的作用,同時努力提高自編測驗的編制質量。2024/3/20心理測量學46四、計算機化測驗與非計算機化測驗(一)計算機化測驗的發(fā)展計算機化測驗:被試在計算機前根據(jù)指令進行作答。計算機化測驗特點:實施方便、反饋及時,測驗效率高。非計算機化測驗--傳統(tǒng)的紙筆測驗,還有用武之地。2024/3/20心理測量學47(二)幾種常見的計算機化測驗基于計算機的測驗(Computer-BasedTest,CBT)。由計算機出題,要求被試在計算機前操作作答。各種基于計算機的測驗對計算機的利用程度有很大不同。除了計算機的形式,基于計算機的測驗的方法、理念與傳統(tǒng)紙筆測驗無本質不同。2024/3/20心理測量學48計算機化自適應測驗(ComputerizedAdaptTest,CAT)。一種新的測驗理念:改變傳統(tǒng)測驗千人一面形式。針對被試的水平即時調題、即時施測、即時反饋、即時估算。同時提高測驗的效率和準確率。實現(xiàn)條件:新的測驗理論指導、使用計算機。優(yōu)點明顯,但技術上也還需進一步完善。2024/3/20心理測量學49基于網(wǎng)絡的測驗(Internet-bestTest,IBT)基于計算機的測驗或計算機化自適應測驗采用網(wǎng)絡的形式實施遠程測試,則稱其為基于網(wǎng)絡的測驗?;诰W(wǎng)絡的測驗是當前計算機化測驗發(fā)展的最高形式。2024/3/20心理測量學50五、其它分類
(一)最佳行為測驗和典型行為測驗最佳行為測驗:作答時必須盡能力找到最佳答案。典型行為測驗:作答時要根據(jù)自己平時怎么想、怎么做如實作答。能力測驗是最佳行為測驗,自陳式人格測驗是典型行為測驗。典型行為測驗的誤差控制更為困難。2024/3/20心理測量學51(二)個別測驗與團體測驗個別測驗應用:面向特殊被試或在測試中主被試間需不斷交流的測驗。個別測驗特點:耗時費力,一般能用團體測驗就不用個別測驗。教育測驗大多采用團體測驗,但也有例外。心理測驗采用個別測驗的要多一些。2024/3/20心理測量學52(三)難度測驗與速度測驗(四)文字測驗與非文字測驗(五)主觀題測驗與客觀題測驗(六)預測測驗(七)行為情境判斷測驗(八)內隱聯(lián)想測驗2024/3/20心理測量學53小結:測驗類型豐富:反應社會需求的復雜性和旺盛性。測量學者的任務:開發(fā)出更多更好的測驗滿足社會的各種需求。2024/3/20心理測量學54心理測量概論測驗的編制與實施
第三節(jié)2024/3/20心理測量學55一、測驗的編制明確用于:招聘、晉職升級決策?診斷、評價?了解品質還是做合格決策?
明確:測能力、人格?能力屬哪個層次?人格哪個側面?探明品質結構明確:測驗對象的社會身份、身心特點、分布的范圍與數(shù)量。
測驗的對象是誰?
測何種心理品質?
測驗結果作何用?
(一)確定測驗目的--回答三個問題2024/3/20心理測量學56(二)設計測驗編制方案、制定測驗編制計劃目標:設計一個科學、詳細、可行的測驗編制方案科學:方案從目標到內容、方法都要符合心理學和心理測量學原理。可行:科學意義上的可行、主客觀條件意義上的可行。測驗編制方案的內容:測驗的方法測驗的類型題型及其分布題量及其分布分數(shù)系統(tǒng)量評價法測驗質量總體目標編制流程設計和要求2024/3/20心理測量學57(三)題目編寫測驗題目:基本元素,主體材料。題目類型:客觀題、主觀題。題型性質和功能:各有不同,有互補傾向。編寫要求:發(fā)揮題型功能,測出欲測心理品質。題干編寫:內容科學、語言精練。作答要求編寫:語言準確無歧義、信號強烈醒目??陀^題:正確項唯一正確,迷惑項有適度迷惑力。主觀題:保證答案科學性、評分標準的客觀性。題量分布:題型分布、品質或內容分布、題目難度分布。
2024/3/20心理測量學58一、測驗的編制(四)測試分析測試分析目的:評估和篩選試題評估篩選指標:定性指標、定量指標。分析決策:留用、修改留用、修改再測、淘汰定性指標:題目的科學性、所測心理品質的相符性、答案的正確性、表述的準確性等等。2024/3/20心理測量學59定量指標:題目定性質量優(yōu)劣的量化指標有各自的定義和計算方法、有各自的質量優(yōu)劣標準測試對象:代表性的樣本,有足夠容量,與正式測試相同的動機水平,在似真環(huán)境中進行。2024/3/20心理測量學60(五)組卷組卷要求:1、保證入選試題高質量。2、嚴格按照設計好的各種題量分布選調試題。3、試題順序:題型順序、難度順序、心理品質層次順序。目的:有效控制測驗的系統(tǒng)誤差。(六)信、效度調查試卷整體質量調查:信度和效度。信度:只需測驗自身數(shù)據(jù)效度:還需要測驗外部的一些相關憑證調查目標:信效度證據(jù)足夠且都達到一定標準。
2024/3/20心理測量學61(七)編制測驗分數(shù)系統(tǒng)原始分數(shù):以測驗內容為參照背景,不方便比較。分數(shù)轉換:
1、獲取以被試群體為參照背景的分數(shù)。
2、獲取以某種客觀標準為參照背景的分數(shù)。報告分數(shù):方便比較、理解和解釋。2024/3/20心理測量學62一、測驗的編制(八)編寫測驗使用手冊:指導正確使用手冊內容(10項):1、測驗目的與性質說明;2、適用對象說明;3、測驗內容結構、題型結構介紹;4、測驗編制方法介紹;5、測驗施測方法說明;6、評分方法與標準說明;7、測試對象范圍、數(shù)量、來源、抽樣方法說明;8、測驗信、效度報告;9、分數(shù)系統(tǒng)編制方法及分數(shù)解釋方法介紹;10、測驗使用人員資質要求說明。2024/3/20心理測量學63(九)編制測驗備份測驗備份:正式測驗的平行復份。平行復份不同處:表面文字內容相同處:所測心理品質內容結構難度結構題型結構信度效度測驗備份目的:應付突發(fā)事件特殊研究需要取得更可靠結果測驗備份的編制:
與正式測驗有完全相同的過程和標準。2024/3/20心理測量學64二、測驗的實施(一)選擇測驗測驗內容和報告分數(shù)形式是否符合測驗目的?測驗形式和方法是否適合被試心身特點?測驗的信度和效度是否達到標準?有無所需特殊資質技術人員?2024/3/20心理測量學65(二)實際施測施測相對簡單:教育測驗、團體測驗、紙筆測驗施測較為復雜:心理測驗、個別測驗、操作測驗規(guī)范目的:控制各種可能誤差,提高測驗信效度。施測要求:由具備相應資質的技術人員實施按照測驗指導書的要求按步驟實施規(guī)范:測驗環(huán)境布置指導語宣講
測驗材料發(fā)放測驗進程控制
2024/3/20心理測量學66(三)評分評分要求:按照測驗指導書規(guī)定的方法和標準進行客觀題交由計算機評分,主觀題主要采用人工評閱心理測驗:具備相應資質的技術人員評閱大規(guī)模教育測驗:篩選閱卷員嚴格培訓
統(tǒng)一評分標準閱卷質量監(jiān)控網(wǎng)上閱卷系統(tǒng)電子閱卷員系統(tǒng)
2024/3/20心理測量學67(四)測驗結果解釋注意常模參照測驗與標準參照測驗報告的不同。解釋要有辯證思維,不要絕對化,更不要標簽化。善于在個體內部作比較,強調優(yōu)勢品質,鼓勵改善劣勢品質。以發(fā)展的眼光解釋測驗結果,防止負面影響。2024/3/20心理測量學68三、測驗編制與實施中的法律與道德問題(一)為維護社會公平而努力保證測驗質量。因為測量嚴重不準導致決策不公,是測量工作者的法律與道德責任。為了保證測驗質量,要防止:因粗制濫造導致測驗結果不準;題目內容有文化、職業(yè)或宗教偏見;某些群體數(shù)據(jù)失實或缺失,導致常模失準;因不精心或別有用心而選用粗制濫造的測驗;因不精心或別有用心而導致測試過程失控;無相應資質人員主持測驗。2024/3/20心理測量學69(二)為保護個人權益而尊重測驗對象的選擇要征求被試是否愿意參加測驗,沒有權利強迫個體參加測驗。要尊重被試的作答選擇,不能干涉被試的作答。使用被試信息及如何使用都要有被試的授權。2024/3/20心理測量學70(三)為保證測驗的安全而嚴守測驗的秘密
測驗泄密后果嚴重:能力測驗泄密,造成虛高能力評價。人格測驗泄密,造成虛假的人格評價。高競爭性測驗泄密,造成社會不公。重要測驗為國家機密,受法律保護。為了尊重著作權,維護社會公正,遵守職業(yè)道德有義務保證測驗的安全、嚴守測驗的秘密,不向他人傳送任何測驗信息。2024/3/20心理測量學711心理測驗管理條例中國心理學會有關測驗的兩個重要文件:2心理測驗工作者的道德準則2024/3/20心理測量學72心理測量概論心理測量發(fā)展簡史
第四節(jié)2024/3/20心理測量學73一、中國古代的心理測量思想(一)個體差異及其可測性思想孔子:“性相近,習相遠?!保幻献樱骸皺啵缓笾p重;度,然后知長短。物皆然,心為甚?!?/p>
(二)人才的內涵及其測量方法三國時的魏人劉劭:“夫圣賢之所美,莫美乎聰明。聰明之所貴,莫貴乎知人。知人誠智,則眾材得其序,而庶績之業(yè)興矣。”他把人的行為表現(xiàn)概括為9種,稱為“九征”。提出“八觀”和“五視”的觀察方法識別人才。2024/3/20心理測量學74(三)心理測量的實踐活動孔子:將人的智力分成三個等級,即中上之人、中人和中下之人;不得中行而與之,必也狂狷乎?狂者進取,狷者有所不為也。董仲舒:“一手畫方,一手畫圓,莫能成?!眲③浚骸度宋镏尽肺髦埽骸皣鴮W”2024/3/20心理測量學75古代中國心理測量的特點:1.描述性的,定性的,而非定量的;2.分類式的;3.注重對人作整體的鑒定和評價,并傾向于和人的道德品質聯(lián)系起來;4.具有強烈的應用性質。2024/3/20心理測量學76二、現(xiàn)代心理測量在西方國家的產(chǎn)生與發(fā)展(一)心理測量的產(chǎn)生是社會的需要(二)心理測量的早期探索者(三)心理測量的發(fā)展(四)心理測量發(fā)展的當代趨勢2024/3/20心理測量學77(一)心理測量的產(chǎn)生是社會的需要工業(yè)革命成功后,對勞動力的需求急劇增加;19世紀,科學的發(fā)展和歐洲人道主義思想的廣泛傳播。(二)心理測量的早期探索者1.德國:馮特(W.Wundt)2.英國:高爾頓(F.Galton)3.美國:卡特爾(JamesM.Cattell)4.法國:比納(A.Binet)和西蒙(T.Simon)2024/3/20心理測量學78(三)心理測量的發(fā)展斯坦福大學推孟(L.M.Terman)教授1916年修訂斯坦福-比納量表;桑代克(E.L.Thorndike)編制了第一個標準化的教育成就測驗;人格測驗的先驅克雷佩林(E.Kraepelin),他最早用自由聯(lián)想測驗來診斷精神病患者。2024/3/20心理測量學79(四)心理測量發(fā)展的當代趨勢1.實驗法和測驗法相結合,產(chǎn)生了信息加工測驗;2.計算機測試代替紙筆測試;3.項目反應理論和概化理論等現(xiàn)代測量理論產(chǎn)生;4.新一代測驗理論。2024/3/20心理測量學80三、現(xiàn)代心理測量在中國的發(fā)展(一)二十世紀前半葉的初步繁榮介紹和翻譯西方心理測驗量表,修訂和編制了多種智力測驗、人格測驗及教育測驗;出版的有關心理測量方面的著作達到了20多種。(二)二十世紀后半葉的再度繁榮與發(fā)展1.理論發(fā)展:經(jīng)典測量理論、項目反應理論、概化理論、新一代測驗理論。2.實踐作用:測驗編制、教育及社會考試、人才選拔和人事測評。2024/3/20心理測量學81本章小結
心理測量學研究內容:如何編制測驗;如何實施測驗;如何控制測量誤差,提高測驗質量。2024/3/20心理測量學82本章小結心理測量主要性質:心理測量是間接測量。測量有兩個要素,心理與教育測量的參照點是相對的,測量單位很難恒定。任何測量都有誤差,測量的誤差包括隨機誤差和系統(tǒng)誤差兩種。心理測驗依據(jù)不同指標可做許多不同分類。
2024/3/20心理測量學83本章小結測量學工作者的社會責任:測量學者關注測驗編制與實施中的法律與道德問題。測量學者還從測量及測量學發(fā)展史中汲取經(jīng)驗和教訓,升華品質與修養(yǎng)。測量學者關注測驗編制與實施中的法律與道德問題。測量學者還從測量及測量學發(fā)展史中汲取經(jīng)驗和教訓,升華品質與修養(yǎng)。2024/3/20心理測量學84本章小結測量學發(fā)展的啟示:我國測量活動歷史悠久?,F(xiàn)代測量學發(fā)端于西方。心理測量學者還從測量以及測量學的發(fā)展歷史中汲取經(jīng)驗和教訓,升華品質與修養(yǎng)。2024/3/20心理測量學85討論:1.為什么說人的心理是可測的,心理可測的意義何在?2.分析心理測量誤差的類型與來源,試說控制方法。3.你從心理測量發(fā)展歷史的介紹中感悟到了什么?
測量信度與隨機誤差控制第一節(jié)信度概述一、信度與測量誤差1.經(jīng)典測量理論的假設上式中,X為觀察分數(shù),T為一般真分數(shù),E為隨機誤差分數(shù),V為目標真分數(shù),I為非目標真分數(shù)(系統(tǒng)誤差)。
第一節(jié)信度的概述一、信度與測量誤差2.信度的定義測量追求的初步目標:T占X的比例越大越好。測量追求的終極目標:V占X的比例越大越好。第一節(jié)信度的概述當T占X的比例很大時,那么測值就會是穩(wěn)定的。一般來說,穩(wěn)定的測值是可靠的、可信的,因此,信度可被認為是測量結果的穩(wěn)定性程度。一、信度與測量誤差2.信度的定義第一節(jié)信度的概述信度(reliability)是指在不同時間,使用同一測驗,或者使用兩個不同項目的等值測驗,抑或在其他不同的測試條件下,對同一組被試實施兩次或多次測試所得分數(shù)的一致性。測驗信度表示測驗分數(shù)中個體差異可歸因于所測特質中“真實”差異的程度,以及可歸因于隨機誤差的程度。二、信度的統(tǒng)計定義1.經(jīng)典測量理論假設的推論第一節(jié)信度的概述2.信度的統(tǒng)計定義定義1:信度是被試團體真分數(shù)方差與實得分數(shù)方差之比定義2:信度是被試團體真分數(shù)與實得分數(shù)相關系數(shù)的平方定義3:信度是一個測驗X(A卷)與它的任意一個平行測驗(B卷)的相關系數(shù)第一節(jié)信度的概述三、描述信度的指標1.經(jīng)典測量理論的信度系數(shù)信度系數(shù)是表示測量結果的穩(wěn)定性程度的指標。記為:第一節(jié)信度的概述信度系數(shù)的值域:[0,1]沒有百分之百可靠的測量,因此,rXX=1只是理論上的值,實際當中是不存在的。?相關系數(shù)的值域是[-1,+1],信度系數(shù)的值域:[0,1],為什么?1.經(jīng)典測量理論的信度系數(shù)(1)重測信度(test-retestcoefficients),是指用同一個量表對同一組被試施測兩次所得結果的一致性程度,其大小等于同一組被試在兩次測驗上所得分數(shù)的相關系數(shù)。(2)復本信度(alternative--formcoefficients),是指兩個平行的測驗測量同一批被試所得結果的一致性程度,其大小等于同一批被試在兩個復本測驗上所得分數(shù)的相關系數(shù)。(3)內部一致性系數(shù)(internalconsistencycoefficients)也叫同質性信度(homogeneityreliability),是指測驗內部所有題目間的一致性程度,主要的計算方法有KR20公式、KR21公式、克龍巴赫α系數(shù),以及荷伊特信度等。第一節(jié)信度的概述2.經(jīng)典測量理論的測量標準誤測量標準誤差(standarderrorofmeasurement)是測量誤差的假設分布的標準差。用下列公式能夠容易地計算測量標準誤差:第一節(jié)信度的概述式中,SDt表示測驗分數(shù)的標準差,rXX表示信度系數(shù)。3.概化理論的概化系數(shù)(generaliabilitycoefficients)4.IRT的測驗信息函數(shù)(testinformationfunction)四、分析測驗信度應注意的問題1.針對測驗類型選用恰當指標(1)傳統(tǒng)的信度概念適合于常模參照測驗,這種測驗的主要目的是為了區(qū)分個體在特定特征上所表現(xiàn)出的差異性。個體在測驗分數(shù)中表現(xiàn)出的差異范圍越大,該測驗的信度也就越高。第一節(jié)信度的概述(2)標準參照測驗(內容參照或領域參照測驗)的目標是要確定被試是否達到或未達到某個標準,從而將個體分到不同的組別:“達標”和“未達標”。這種情況下,傳統(tǒng)的重測信度、復本信度以及內部一致性系數(shù)就不再適用。標準參照測驗可根據(jù)具體情況分別采用如下指標:適用于簡單的掌握與否的兩分決策,即所有的分類誤差都被認為同樣嚴重而不管它們離開臨界分數(shù)的距離。在這種情況下,可以使用平行型式進行再測,以便得出在兩次測驗上得到相同決策的個體的百分比,進一步可算得分類一致性系數(shù)(coefficientofagreement)。
第一節(jié)信度的概述不僅僅關心對掌握者和未掌握者的質的區(qū)分,同時也在分數(shù)連續(xù)體上描述了關于掌握和未掌握的量的差異。這類信度主要采用K2(X,T)指標:
第一節(jié)信度的概述式中,、分別為被試總體在測驗上的真分數(shù)方差和觀測分數(shù)方差;、分別為真分數(shù)和觀測分數(shù)的平均值;ng為測驗題目數(shù),c是以做對題目百分比表示的區(qū)分標準。K2(X,T)值越大,說明觀測分與區(qū)分標準分數(shù)(劃界分數(shù))之間的差異代表真分數(shù)的對應差異量的可能性越大,因而觀測分與劃界分數(shù)的差異就越能反映真實能力上的差異。換言之,測驗就更可信。就單個測驗的結果而言,K2(X,T)的計算公式如下:第一節(jié)信度的概述式中,是由庫德-理查德KR20公式求出的信度系數(shù),其余符號意義同前。(3)在純速度測驗(speedtest)中,個體差異完全取決于速度,此時就無法恰當?shù)亟忉屖y一次測驗的信度系數(shù)。如果條件許可,可采用重測法或是復本法,這是比較合適的。分半法也可以使用,但是此時的分半是按時間分半,而不是按照項目來分半。也就是,兩半分數(shù)必須根據(jù)分別規(guī)定時間的兩個半測驗。例如,可以把奇偶項目分別印制在兩張卷上,每組項目的用時為全測驗的一半。這種方法等于在同一時間實施了兩個等值測驗。
第一節(jié)信度的概述還有一種替代實施兩個半測驗的方法,就是把總時間四等分,算出每段時間的分數(shù)。這種方法簡便易行,施測時每當主試發(fā)出事先安排的信號,就要測驗參加進在他們正在做的項目上打個記號。然后,把第一段和第四段時間內答對的項目數(shù)相加,得出一個半測驗分數(shù);把第二段和第三段時間內答對的項目數(shù)相加,得出另一個半測驗分數(shù)。四段時間如此相加,往往可以平衡練習、疲勞和其他因素的累積效應。特別是當項目難度水平前后一致,而不是逐漸增加時,這種方法尤其令人滿意。第一節(jié)信度的概述2.信度的報告(1)任何一個信度系數(shù)是針對引起測驗誤差的特定因素而言的。有多少種影響測驗分數(shù)的條件,就有多少種測驗信度,因此,報告信度時應該詳細說明測試樣本的特性和所報告的信度類型。在信度報告時只是報告信度系數(shù),而缺乏說明估算系數(shù)的方法細節(jié),推導系數(shù)時所用的被試群體的特征,以及獲取數(shù)據(jù)當時的施測條件,等等,這種信度報告是不合格的。
第一節(jié)信度的概述(2)沒有一個單一的、最優(yōu)的方法來量化信度,沒有一個單獨的指數(shù)能恰當?shù)乇磉_所有的相關事實,沒有一個單獨的研究方法在所有的情形下都是最佳選擇,且測驗編制者也不應局限于將某一種方法運用到任何一種測量手段上去。所以,測驗編制者在報告測驗信度時,可以從多方面予以報告。
第一節(jié)信度的概述(3)提供詳細的信度分析報告,讓了解相關知識的人能夠對結果進行評定,并能夠重復信度分析的過程。
例如,簡單說一句“某測驗的信度是0.92”是不能接受的。較恰當?shù)恼f法是“某測驗的信度系數(shù)為0.92,該數(shù)值是通過計算一份能力測驗間隔兩周兩次測試成績的相關系數(shù)得出的。數(shù)據(jù)來源是從某市隨機抽取的500名小學5年級的學生施測……”。第一節(jié)信度的概述五、信度的標準與作用1.信度是評價測驗質量的重要指標之一。測驗類型
信度系數(shù)
低中高學業(yè)成就測驗0.660.920.98學術能力測驗0.560.900.97特殊能力傾向測驗0.260.880.96人格測驗0.460.850.97興趣測驗0.420.840.93態(tài)度測驗0.470.790.98注:表中數(shù)據(jù)來源,LewisR.Aiken:Psychologicaltestingandassessment(eighthedition),AllynandBacon,Inc,1994.第一節(jié)信度的概述2.信度是測量過程中所存在的隨機誤差大小的反映。第一節(jié)信度的概述例如,我們已知高考文科試卷的總信度rXX
=0.965,文科考生總分的標準差為53.42,那么,文科考試成績的標準誤為:3.信度可以用來解釋個人測驗分數(shù)的意義——測量標準誤。如果某生的考試成績?yōu)?95分,在置信度為0.95時,其真分數(shù)的置信區(qū)間為:4.信度可以幫助進行不同測驗分數(shù)的比較。第一節(jié)信度的概述考察兩個分數(shù)的差異是否可靠,是否真有差異的問題。比如,某人的物理成績是否真的優(yōu)于化學?某人的數(shù)學技能本學期是否真有進步?某人在韋氏智力量表上操作智商與言語智商的差異是否真有顯著意義等。
當兩測驗的方差相等時,差異分數(shù)的信度系數(shù)可用如下公式求出:式中,rXXdiff是差異分數(shù)的信度系數(shù);rXX和rYY是兩個測驗各自的信度系數(shù);rXY是兩測驗間的相關系數(shù)。4.信度可以幫助進行不同測驗分數(shù)的比較。第一節(jié)信度的概述差異分數(shù)的測量標準誤可用如下公式求出:式中,SEdiff是差異分數(shù)的測量標準誤;rXX和rYY是兩個測驗各自的信度系數(shù);SD是兩測驗間使用的相同的標準差。在比較分數(shù)之前,必須將兩個測驗分數(shù)轉為具有相同量表的標準分數(shù)。第一節(jié)信度的概述例如,在韋氏成人智力量表中,言語和操作分測驗的信度為0.97和0.93,而它們的智商的平均數(shù)為100,標準差為15,故言語和操作智商差數(shù)的標準誤為:因為4.74×1.96=9.29,因此,言語和操作智商相差10分時,在0.05水平上,我們說存在顯著差異。若要在0.01水平上作出差異顯著的結論,就要相差13分。?測驗分數(shù)的比較與平均數(shù)差異顯著性檢驗是一回事嗎?第二節(jié)信度的種類與評估方法一、重測信度1.含義同一個測量工具在兩個不同時間對同一組被試施測所得結果的一致性程度。重測信度主要考察了一個測量工具是否能夠保證在不同時間測量結果的一致性,他反映了測量工具的結果受到時間間隔因素影響的大小。一般來說,重測的時間間隔越短,那么各種施測情境的變化就越小,重測信度系數(shù)就會越大。重測信度系數(shù)較大時,說明該測量工具前、后兩次的測量結果比較一致。結果具有較好的跨時間上的穩(wěn)定性。第二節(jié)測驗信度的種類與評估方法2.評估方法重測信度的大小可以通過計算測量工具的重測系數(shù)(test-retestcoefficient)或叫穩(wěn)定性系數(shù)(coefficientofstability)來標志。具體來說,就是求取同一組被試在兩個不同時間施測同一個測量工具所得結果分數(shù)的相關系數(shù)。第二節(jié)測驗信度的種類與評估方法3.應用條件測量工具所測量的個體心理特質在時間上應該是相對穩(wěn)定的。測量工具所測量的個體心理特質應該不存在明顯的練習效應和遺忘效應。在兩次施測間隔期間不應該進行專門的訓練和培訓,以保證重測信度反映的是隨機因素的影響效應。第二節(jié)測驗信度的種類與評估方法4.使用重測信度時需要注意的問題兩次施測時間間隔的長短會影響重測信度系數(shù)估計值的大小,因此,在報告重測信度系數(shù)時應該報告間隔的時間長度。應該根據(jù)已有的相關研究結論考慮所測心理特質本身的穩(wěn)定性程度,以確定前后兩次施測時間的間隔究竟應該多長比較合適時,不應該隨便選擇間隔時間的長短。第二節(jié)測驗信度的種類與評估方法二、復本信度1.含義兩個平行的測驗(復本測驗)測量同一批被試所得結果的一致性程度。復本信度反映了由于題目的不同以及時間間隔所導致的測量誤差。平行測驗或復本測驗指的是兩個在題目內容、數(shù)量、形式、難度、區(qū)分度、指導語、時限以及所用的例題、公式和測驗等其他方面都相同或相似的測驗。也就是用不同的題目測量同樣的內容而且其測驗結果的平均值和標準差都相同的兩個測驗。第二節(jié)測驗信度的種類與評估方法2.評估方法復本信度的估計過程就是計算同一批被試在兩個平行的復本測驗上所得分數(shù)的相關系數(shù),也叫作等價系數(shù)(coefficientofequivalence)。測試設計:同時測試和延時測試。同時測試是在同一個時間段內進行測試,而延時測試則是在兩個時間段進行測試,同時測試可能會存在作答疲勞的效應,而延時測試則可能會存在學習或培訓效應。第二節(jié)測驗信度的種類與評估方法3.應用條件要構造出兩份或兩份以上真正平行的測驗;計算復本信度需要對同一批被試測試兩份平行測驗,這就需要掌握一個合理的時間安排。應該盡量在測試結果報告中,詳盡地說明兩次測試的時間間隔、測試順序安排、測試過程中被試的有關測驗經(jīng)歷等。第二節(jié)測驗信度的種類與評估方法三、內部一致性信度1.含義內部一致性信度主要評價了測驗各隨機組成部分之間是否測量了相同的心理特質,因此,它反映的是題目內容的抽樣一致性程度。具體估計方法主要包括分半信度評估法、庫德-理查森信度評估法、克龍巴赫Alpha系數(shù)評估法。與重測信度和復本信度不同,在估計測驗的內部一致性信度時,只要用同一測驗對一批被試測試一次。第二節(jié)測驗信度的種類與評估方法2.分半信度含義我們總是可以把一個測驗的所有題目隨機地劃分成對半的兩個部分,然后估計所有被試在這兩個部分題目上得分的一致性程度,這樣得到的測驗一致性估計稱為分半信度。分半信度評價了測驗兩個隨機組成部分的題目是否測量了相同的心理特質。第二節(jié)測驗信度的種類與評估方法2.分半信度評估方法計算出被試在測驗兩個隨機組成部分的題目上得分之間的相關系數(shù)。由于在用分半測驗得分計算相關系數(shù)時,測驗題量被縮短,信度系數(shù)需要通過以下這個公式對分半相關系數(shù)進行矯正而得到。為兩個分半測驗之間的相關系數(shù),為完整長度測驗的信度系數(shù)估計值。第二節(jié)測驗信度的種類與評估方法2.分半信度評估方法另外一個估計分半信度系數(shù)的方法是Rulon公式,他只需要計算所有被試在兩部分測驗上得分之差的方差以及總分方差:式中,為完整測驗的信度估計值,為被試在兩部分測驗上得分之差的方差,為完整測驗總分方差。
Rulon公式中分子方差反映了由于題目不同等條件帶來的誤差方差,他與總方差之比反映了誤差方差在總方差中所占的比例。第二節(jié)測驗信度的種類與評估方法2.分半信度使用時需注意的問題在估計測驗的分半信度時,雖然要求把一個測驗的所有題目隨機地劃分成對半的兩個部分,但是在實踐中對測驗分半時,為了盡量減少無關因素的影響,通常需要考慮題型、題分、題目測試先后順序等因素的平衡問題,比如按照題目順序奇偶分半就是一個經(jīng)常選擇的方法第二節(jié)測驗信度的種類與評估方法3.庫德-理查森信度含義在估計分半信度時,把一個測驗的題目分成兩半的方式是非常多的。而每種分半方式得到的信度估計值總會存在一些差異,但我們無法知道究竟哪種分半結果所得到的信度估計值是最合適的。估計所有可能的分半信度系數(shù)的平均數(shù),作為完整測驗的內部一致性最佳估計值。第二節(jié)測驗信度的種類與評估方法3.庫德-理查森信度評估方法:所有分半信度系數(shù)的平均數(shù)的估計方法。第二節(jié)測驗信度的種類與評估方法3.庫德-理查森信度使用條件Kuder-Richardson信度系數(shù)的估計只能針對1、0記分題型,對于其他題型需要使用更加一般化的估計方法。K-R21公式假設測驗中所有項目的難度是相同的。Kuder-Richardson信度反映的是項目間一致性程度,他會嚴重地受到測驗所測行為特質的同質性程度的影響。第二節(jié)測驗信度的種類與評估方法4.Cronbach’sAlpha系數(shù)含義是一種比Kuder-Richardson方法更加一般化的信度估計方法,它可以針對各種記分方式的題型進行估計。第二節(jié)測驗信度的種類與評估方法4.Cronbach’sAlpha系數(shù)評估方法第二節(jié)測驗信度的種類與評估方法公式中,k是測驗題目個數(shù),是被試在題目i上得分的方差,是被試測驗總分方差。4.Cronbach’sAlpha系數(shù)使用條件可以估計各種記分方式的測驗內部一致性信度系數(shù),是更一般化的測驗內部一致性信度系數(shù)估計方法。第二節(jié)測驗信度的種類與評估方法四、評分者信度1.含義在評價通過主觀評分方式得到的分數(shù)時,我們必須了解不同的評分者在評價被試作答反應時給的分數(shù)值的一致性程度(信度)。一般的客觀型題目在評分時很少出現(xiàn)誤差,然而,對于諸如作文測驗、語言類測驗、以及其他的評價性測驗(如人格特質評級、投射測驗評分等),這些測驗類型的評分過程就顯得非常主觀。第二節(jié)測驗信度的種類與評估方法2.評估方法兩個評分者時:計算這兩個評分者評定分數(shù)之間的相關系數(shù)。多個評價者評價同一批被試:計算和諧系數(shù)。第二節(jié)測驗信度的種類與評估方法五、信度系數(shù)及其估計方法小結1.測試次數(shù)和測試卷份數(shù)與信度系數(shù)估計方法第二節(jié)測驗信度的種類與評估方法測試次數(shù)測試卷份數(shù)1份2份1次分半信度Kuder-Richardson信度Alpha系數(shù)復本信度(同時測試)2次重測信度復本信度(延時測試)2.各種信度估計方法的誤差方差來源第二節(jié)測驗信度的種類與評估方法信度估計方法誤差方差來源重測信度復本信度(同時測試)復本信度(延時測試)分半信度Kuder-Richardson
和Alpha系數(shù)評分者信度時間間隔題目內容時間間隔與題目內容題目內容題目內容與心理行為特質的同質性評分者間差異第三節(jié)測量的隨機誤差控制一、影響測量信度的因素影響測量信度的因素施測間隔的時間被試主試施測情境測量工具第三節(jié)測量的隨機誤差控制二、提高測驗信度的常用方法提高測驗信度的常用方法規(guī)范施測程序、統(tǒng)一施測環(huán)境適當增加測驗的長度控制試題的難度分布努力提高每道題的區(qū)分度維持測驗的同質性努力提高測驗在被試中各個同質亞團體上的信度保證被試有充裕的作答時間嚴格控制評分誤差第三節(jié)測量的隨機誤差控制提高信度的方法——適當增加測驗的長度為什么增加測驗的長度,會提高信度?測驗長度的增加與信度的提高不是等比例的提高信度的方法——適當增加測驗的長度增加測驗長度與信度提高之間關系的公式:例:有一包含10題的測驗,其信度系數(shù)為0.30,若把測驗增加到原測驗長度的3倍,那么新測驗的信度系數(shù)應該是多少?例:原測驗共10題,信度系數(shù)為0.30,如要把測驗信度系數(shù)提高到0.94,需要把原測驗延長多少倍?增加多少題?返回第四節(jié)評分者信度及
評分誤差的控制一、評分誤差存在的嚴重性嚴重到什么程度?歷史教授的答案被評閱為“不及格”高考作文《一幅漫畫的啟示》,67位評閱者,6至25分都有,最高分與最低分相差19分。1984年,高考作文評分調查,438位老師,4篇作文,。最高得分為41.25,最低分為20.75,標準差為2.98。1985年,對1984年的四篇作文再研究,347位老師(有部分1985年參加研究的老師),最高得分為42.5,最低分為24.75,標準差為3.3。第四節(jié)評分者信度及評分誤差控制二、評分者信度定義:多個評分者對同一批答卷評分結果的一致性程度。估計方法:①兩位評分者評同一批試卷;②三位或三位以上評分者評同一批試卷第四節(jié)評分者信度及評分誤差控制兩位評分者評同一批試卷的評分者信度例:甲、乙兩位教師評閱10份試卷,他們對每一試卷各自所評分數(shù)如下表,問這兩位教師評分的一致性如何?返回試卷得分D=甲-乙等級等級之差甲評分乙評分甲乙A94931110B9092-222.5-0.5C8692-63.52.51D8670163.573.5E8682-10541F7076-665.50.5G6865379-2H6676-1085.52.5I6468-4981J6160110100多位評分者評同一批試卷的評分者信度例:六位教師各自評閱相同的5篇作文,每位教師給每一篇作文都評了等級(共5等)并列入下表,問這六位教師評分的一致性如何?返回作文評分者12345A35241B35241C34152D35142E35241F35241∑182910258三、評分誤差產(chǎn)生的原因試題原因評分者原因專業(yè)知識水平不夠評判能力不夠個性傾向心理狀態(tài)客觀效應“名片”、“光環(huán)”、“對比”、“先后”環(huán)境、組織管理的原因第四節(jié)評分者信度及評分誤差控制四、控制評分誤差的方法控制試題作答反應方向與范圍預先制訂好評分細則閱卷人員要選擇、要培訓流水作業(yè)分因素評分組織復查要求評分者自覺防止各種客觀效應的影響大規(guī)模閱卷可考慮采用統(tǒng)計手段控制第四節(jié)評分者信度及評分誤差控制測量效度與系統(tǒng)誤差控制心理測量學測量效度與系統(tǒng)誤差控制測量效度概述1測量工具效度驗證的方法2測量的系統(tǒng)誤差控制3心理測量學測量效度與系統(tǒng)誤差控制測量效度概述1心理測量學測量效度概述
什么是效度測量工具測量了他所希望測量的心理特質或行為特征的效果和程度。效度總是與一定的測量目標相聯(lián)系的。我們稱為某測量工具進行效度驗證的過程為效度證據(jù)的獲取過程,簡稱為效度驗證。心理測量學測量效度概述效度與信度的關系信度研究的是測量結果的穩(wěn)定性問題,效度研究的是測量結果的準確性問題。測量的信度只受到隨機誤差或非系統(tǒng)測量誤差的影響,而測量效度會同時受到隨機誤差和系統(tǒng)測量誤差的影響。一個測量工具可能是非常穩(wěn)定(信度高),但卻是無效的,因為他與測量的目標之間產(chǎn)生了系統(tǒng)性的偏差;當然,一個完全不穩(wěn)定的測量工具也不可能是有效的。信度是效度的必要條件,但不是充分條件。心理測量學測量效度與系統(tǒng)誤差控制測量工具效度驗證的方法2心理測量學測量工具效度驗證的方法根據(jù)測量目標的不同,對測量工具進行效度驗證的方法主要有三種:基于所測內容的效度驗證方法——內容效度基于所測心理結構的效度驗證方法——結構效度基于效標關聯(lián)性的效度驗證方法——效標關聯(lián)效度心理測量學測量工具效度驗證的方法基于所測內容的效度驗證方法含義就是要對測量工具本身的具體內容進行系統(tǒng)性的查驗,以確定這些內容是不是測量目標特質或行為領域的一個有代表性的樣本。內容效度需要注意的兩個問題:測量工具測量的是否正是調查人員想要測量的那種行為;測量工具是否提供了相關行為的適當樣品。主要應用學業(yè)成就測驗、職業(yè)資格測驗,還如人員選拔與安置中的工作樣本測驗。心理測量學心理測量學測量工具效度驗證的方法基于所測內容的效度驗證方法專家判斷:確定測量目標的全域范圍及各部分內容權重。確定一批有經(jīng)驗的領域專家,在深入培訓的基礎上,要求他們按照已確定的測量全域范圍及各部分內容權重,初步分析測試題目的代表性,并對題目測量的被試作答的內部心理過程進行初步分析。進行實測,根據(jù)測試數(shù)據(jù)分析和被試作答過程分析,全面驗證測量工具的效度。心理測量學其他方法還有:心理測量學測量工具效度驗證的方法基于所測內容的效度驗證方法關于測量工具的表面效度嚴格來說,表面效度并不符合效度的定義,因為他反映的不是實際要測量的目標是什么,或對目標測量的程度如何,而反映的是,測量工具從表面上看測量了什么。表面效度關心的是測量的友好性和與公眾的和諧關系。表面效度的高低,取決于測驗的目的和性質。智力測驗VS人格測驗心理測量學測量工具效度驗證的方法基于效標關聯(lián)性的效度驗證方法效標:它是獨立于測量工具并可以從實踐中獲得的被試的行為特征表現(xiàn),用于驗證測量工具的有效性。例如,用百米成績預測跳遠成績,用焦慮量表預測某運動員賽前焦慮水平等。根據(jù)測量工具與效標兩者結果獲得的時間間隔的不同,基于效標關聯(lián)性的效度證據(jù)采集可以有同時性設計(同時效度)與預測性設計(預測效度)兩種方法。心理測量學測量工具效度驗證的方法基于效標關聯(lián)性的效度驗證方法效度證據(jù)采集的預測性設計方法含義:驗證現(xiàn)有測量評價結果與將來才可能獲取的效標評價結果之間的關聯(lián)程度。主要應用:人員選拔、安置類型的測量工具心理測量學測量工具效度驗證的方法基于效標關聯(lián)性的效度驗證方法效度證據(jù)采集的預測性設計方法首先,獲取被試在當前測量工具上的評價結果,如測驗分數(shù)、等級評定;然后,間隔一定的時間,采集被試在預測目標(效標)上的評價結果;最后,分析以上這兩個評價結果之間的關聯(lián)性程度,這種關聯(lián)性程度的分析方法常用的有以下幾種:相關分析區(qū)分能力分析命中率分析心理測量學高校自主招生能否選拔真正優(yōu)秀的學子自主招生指部分高校在統(tǒng)一高考的基礎上,拿出一定比例的招生名額,通過高校自主選拔考試,選拔出具有一定學科特長和創(chuàng)新潛質的優(yōu)秀畢業(yè)生。人大完善招生制度自主招生各環(huán)節(jié)均建立評委庫近日,中國人民大學在本科招生網(wǎng)增設了公開公示的專欄,第一時間在網(wǎng)上公示了高水平運動員、藝術特長生資格生名單與其專業(yè)成績、所享優(yōu)惠政策等信息,并公布了學校最新修訂的《中國人民大學本科生招生信息公開公示辦法》等制度和管理辦法。心理測量學測量工具效度驗證的方法基于效標關聯(lián)性的效度驗證方法效度證據(jù)采集的同時性設計方法含義:對同時獲得的測量工具評價結果與效標評價結果之間的關聯(lián)性程度進行分析。主要應用經(jīng)常用于評價測量工具診斷被試當前心理特質狀態(tài)的效果。在許多情形下,效度證據(jù)采集的同時性設計方法會替代預測性設計方法。評估方法心理測量學測量工具效度驗證的方法基于效標關聯(lián)性的效度驗證方法基于效標關聯(lián)性的效度驗證方法的影響因素群體的一致性或同質性程度:應該盡量擴大被試群體的異質性,避免低估測驗的真實效度。測驗長度:一般來說,測驗長度越長,測試結果越穩(wěn)定,效度系數(shù)會傾向于越高。效標污染心理測量學測量工具效度驗證的方法基于效標關聯(lián)性的效度驗證方法估計標準誤指的是測量工具實際測量的結果與預先設定的測量目標之間相互偏離的程度,而效度驗證的過程就是要考察這種偏離程度的大小。從實際應用范圍及計算過程的便利性角度看,估計標準誤的實際應用更多的是基于效標關聯(lián)性的效度驗證方法中。心理測量學測量工具效度驗證的方法基于效標關聯(lián)性的效度驗證方法估計標準誤是表現(xiàn)為相關系數(shù)的效度系數(shù);是效標評定分數(shù)的標準差。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法含義:對測量工具測量了心理學中某種特質或特質結構的程度進行驗證的方法。主要應用:各種心理測驗,如智力測驗、人格測驗、焦慮測驗、成就動機測驗等。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法評估方法專家判斷分析法主要依靠專家的主觀專業(yè)經(jīng)驗。盡量減少專家主觀隨意性的影響。德爾菲法。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法評估方法測驗內部一致性分析法基于所測心理結構的效度驗證的一個重要證據(jù)來源。這個方法的實質是,測驗總分本身是用于評價所測心理結構的效度最好的效標。相關分析法:求取每個項目與測驗總分之間的相關系數(shù),如果項目—測驗相關顯著,表明該項目與總測驗的結構一致。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法評估方法測驗內部一致性分析法對照組比較法:按照被試的測驗總分,選出一個高分組被試和一個低分組被試,然后,比較高分組被試與低分組被試在各個項目上的作答表現(xiàn),如果高分組被試的通過比例顯著大于低分組被試的通過比例,表明該項目與總測驗的結構是一致的。心理測量學基于所測心理結構的效度驗證方法評估方法測驗內部一致性分析法很明顯,測驗內部一致性證據(jù)保證的是測驗結構的同質性或單一性。測驗內部一致性證據(jù)的作用是有限的,因為他畢竟無法證明該測驗究竟測量了什么結構。測量工具效度驗證的方法心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法評估方法與現(xiàn)有研究結論一致性的分析法通過分析新開發(fā)測量工具測試結果是否與已有研究結論一致。在許多傳統(tǒng)智力測驗中,成長發(fā)展性變化證據(jù)是測驗效度的一個重要證據(jù)。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法評估方法與其他測量工具的相關分析法求取新開發(fā)測量工具與另一個已經(jīng)被公認為有效的測量工具之間的相關關系,是證明新開發(fā)測量工具測量了相同內容結構的一個有效證據(jù)。求取新開發(fā)測量工具與另一個測量工具之間的相關關系,有時候也被用于證明該測量工具沒有受到其他無關心理因素的影響。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法其他評估方法因素分析法因素分析方法是基于所測心理結構的效度驗證方法中幾乎最為常用的一種方法,他很適合用于鑒別測量工具所測的心理特質結構。實際上,因素分析方法是一種分析觀察數(shù)據(jù)之間相關矩陣的統(tǒng)計分析技術。心理測量學心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法其他評估方法聚合與區(qū)分效度驗證分析法為了驗證測量工具所測的心理結構,我們不僅必須提供關于它與另外一個理論上應該存在高相關的測量工具之間存在高相關的實際證據(jù),同時,也需要提供關于它與另外的無關變量之間不存在顯著相關的證據(jù)。多特質—多方法矩陣分析法心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法其他評估方法實驗介入分析法通過實驗的方法考察某些重要變量的介入是否對被試測量分數(shù)產(chǎn)生顯著影響。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法其他評估方法結構方程建模分析法除了鑒別測量的潛在結構之外,對這些潛在特質結構本身之間的關系以及它們之間的影響路徑進行考察,同樣是非常重要的。分析潛在特質結構之間的關系及其與效標變量之間的路徑,有利于我們更深入理解所測特質的作用機制。這種分析過程可以用結構方程建模的方式進行。心理測量學廣告品牌態(tài)度的影響因素模型心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法其他評估方法尋求當代認知心理學證據(jù)的分析方法基于信息加工理論的研究方法為我們深入理解人類問題解決的加工過程提供了更豐富的證據(jù)。認知加工模型讓我們了解完成某種認知任務的智能過程、這個過程的組織方式、涉及的知識內容、這些知識在記憶中的表征形式及其提取模式,這些研究無疑會讓我們對人類心理特質結構的認知更加深入。心理測量學測量效度與系統(tǒng)誤差控制測量的系統(tǒng)誤差控制3心理測量學測量的系統(tǒng)誤差控制影響測量工具有效性的因素測量的心理特質本身的特點有些心理特質至今研究不夠深入,概念界定還不清晰。有些心理特質本身不太穩(wěn)定。測量工具的建構過程建構過程應遵循嚴謹?shù)膽B(tài)度才能建構出優(yōu)良的測量工具,避免出現(xiàn)系統(tǒng)偏差。心理測量學測量的系統(tǒng)誤差控制影響測量工具有效性的因素測量工具本身的信度信度是效度的必要條件。效度驗證時的被試群體相同的一個測量工具,可能會因為測量對象特性的不同而測量到不同的心理特質結構。作為用相關系數(shù)表示的效度系數(shù),希望參與效度驗證的被試群體越異質越好。心理測量學測量的系統(tǒng)誤差控制影響測量工具有效性的因素效標的選取效標本身的信度及其有效性是非常關鍵的。其他因素測驗形式、測驗長度、測試過程的組織、評價者的經(jīng)驗、記分方式、訪談中主試的經(jīng)驗等。心理測量學測驗題目的性能與題目編制心理測量學江西師大心理與教育統(tǒng)計測量中心引子
心理測量的工具是測驗,而題目則是構成測驗的基石,因此研究題目的性能及其編制至關重要,它直接影響測量工具(即測驗)的信度及效度,進而影響測量的準確性。在實際工作中,人們應如何來編制測驗題目?如何評價測驗題目質量的好差呢?本章將對這些問題做出回答。心理測量學江西師大心理與教育統(tǒng)計測量中心測驗題目性能與題目編制測驗題目類型、功能與題目編制1測驗題目的難度與難度分布控制2測驗題目的區(qū)分度與區(qū)分度的提高3測驗題目的猜測度與猜測控制4選擇題的選項分析與選項修改5題目功能差異與測量偏差控制6測驗題目的性能與題目編制測驗題目的類型、功能與編制
第一節(jié)心理測量學江西師大心理與教育統(tǒng)計測量中心一、測驗題目類型題目主要可分為客觀題和主觀題兩大類??陀^題一般有標準唯一的答案,被試的作答只有與標準答案完全一致才視為答對,否則視為答錯。主觀題無標準唯一答案,只有一個參考答案,被試的作答與參考答案相近或基本一致就可視為答對。心理測量學江西師大心理與教育統(tǒng)計測量中心客觀題主要包括選擇題(含自陳式選擇題)、填空題、是非判斷題、匹配題、行為情景判斷題等。主觀題主要包括名詞解釋、簡答題、計算題、證明題、論述題、案例分析題、作文題等。心理測量學江西師大心理與教育統(tǒng)計測量中心單項選擇題多項選擇題自陳式選擇題是非判斷題名詞解釋題簡答題計算題證明題論述題案例分析題組合題行為情景判斷題心理測量學江西師大心理與教育統(tǒng)計測量中心二、選擇題1、定義:選擇題指給出題干及備選項,要求被試根據(jù)題干從備選項中選出正確選項的題目。單項選擇題指只有唯一正確選項的選擇題。2、特點功能:①評分標準明確,評分客觀,有利于減少評分帶來的評分誤差。②有利于對基礎知識和基本技能進行考查。心理測量學江西師大心理與教育統(tǒng)計測量中心③選擇題適合考查較低層次的能力,如識記能力、較低的理解能力等,而不宜考查較高層次的能力,如綜合能力、創(chuàng)造性和獨立思維能力。④選擇題的命題技術要求較高,尤其是干擾項的設置。心理測量學江西師大心理與教育統(tǒng)計測量中心3、選擇題編制題干要描述清楚。應讓答題者明白問題是什么,希望答題者解決什么。題干中應盡量避免出現(xiàn)與考核內容無關的材料。設問應盡量正向,盡量少出現(xiàn)如“下面哪個是不對的?”的設問。心理測量學江西師大心理與教育統(tǒng)計測量中心題干文字的字體應盡量一致,以減輕考生的閱讀負擔。備選項應避免出現(xiàn)邏輯上的包含關系。備選項的長度、結構、語言表達要盡量一致。增加干擾項的迷惑性。干擾項的設置應能反應考生缺乏特定的知識或技能。心理測量學江西師大心理與教育統(tǒng)計測量中心三、填空題1、特點功能:①考查的能力層次范圍比較廣,主要考核識記和理解能力。②填空題要求考生把問題的最后答案或結論正確無誤地表達出來,在一定程度上是對考生的嚴謹、嚴密、認真、細致的工作作風和科學態(tài)度的檢查。③評分簡單,誤差也相對要小。④填空題只要求考生寫出最后答案,而不必寫出解題的具體過程。因此,從試卷上看不出考生的推理、分析等思考過程。心理測量學江西師大心理與教育統(tǒng)計測量中心2、填空題編制試題的空格處應考查有意義的關鍵性內容或詞語。每小題的空格數(shù)不宜過多,填寫的字數(shù)也不能太多??崭癫糠纸y(tǒng)一用下劃線表示,長度應能滿足答題需要若空格處考核計算能力并要求填寫數(shù)字,應在空格后標明數(shù)字的單位。心理測量學江西師大心理與教育統(tǒng)計測量中心三、論述題與計算題1、定義:論述題指對某一問題或議題進行綜合論述的題目。它用于考查被試分析、綜合、評價直至創(chuàng)新、創(chuàng)造等高層次能力。計算題指主要是通過計算或運算來解答的題目。計算題內容量有大有小,常常用于考查被試的應用能力。一般要求給出條件完備無冗余,答案唯一。心理測量學江西師大心理與教育統(tǒng)計測量中心2、特點功能:
①論述題有利于考生獨立地、創(chuàng)造性地解題。試題的能力考查涉及的知識面可以比較大,而且要求考生通過分析去找出所涉及的知識并找出它們的內在聯(lián)系。試題從定性分析到
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 碳納米管紗線的金屬化工藝及其應用研究
- 旋風分離器內顆粒對氣相的湍流調制機理研究
- 肺部感染的監(jiān)測與護理
- 代理酒廠產(chǎn)品合同范例
- 下游交易合同范例
- 倉儲外包出租合同范例
- 上海建筑施工合同范例
- bot投資合同范例
- app開發(fā)協(xié)議合同范例
- 寫土方合同范例
- 2023年安徽審計職業(yè)學院單招職業(yè)適應性測試題庫及答案解析
- LS/T 3311-2017花生醬
- 蘇教版二年級科學下冊第10課《認識工具》教案(定稿)
- GB/T 40262-2021金屬鍍膜織物金屬層結合力的測定膠帶法
- GB/T 3279-2009彈簧鋼熱軋鋼板
- GB/T 16823.3-2010緊固件扭矩-夾緊力試驗
- 應用文寫作-第四章公務文書(請示報告)課件
- Premiere-視頻剪輯操作-課件
- PDCA降低I類切口感染發(fā)生率
- 麻醉藥理學阿片類鎮(zhèn)痛藥PPT
- 新湘版小學科學四年級下冊教案(全冊)
評論
0/150
提交評論