第四講測(cè)量的基本理論_第1頁(yè)
第四講測(cè)量的基本理論_第2頁(yè)
第四講測(cè)量的基本理論_第3頁(yè)
第四講測(cè)量的基本理論_第4頁(yè)
第四講測(cè)量的基本理論_第5頁(yè)
已閱讀5頁(yè),還剩79頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四講測(cè)量的基本理論第1頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)1.概化理論簡(jiǎn)介

一、概化理論的發(fā)展(一)概化理論的發(fā)展思路概化理論(GeneralizabilityTheory,GT)是經(jīng)典理論宏觀發(fā)展,重在研究誤差控制、研究測(cè)驗(yàn)整體設(shè)計(jì)。第2頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)1、測(cè)驗(yàn)分?jǐn)?shù)方差的測(cè)量學(xué)意義測(cè)驗(yàn)分?jǐn)?shù)方差有目標(biāo)分?jǐn)?shù)方差和誤差分?jǐn)?shù)方差之區(qū)別。如:被試真正能力水平間的分?jǐn)?shù)方差是目標(biāo)分?jǐn)?shù)方差。同一被試不同次測(cè)驗(yàn)分?jǐn)?shù)間的方差是誤差方差。同一作品多個(gè)評(píng)分間的方差也是誤差方差。第3頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)2、誤差來(lái)源的多樣性與總分方差結(jié)構(gòu)的復(fù)雜性測(cè)量誤差的原因多方面,誤差方差的種類(lèi)多種??偡址讲罱Y(jié)構(gòu)復(fù)雜:不同來(lái)源的誤差方差與目標(biāo)分?jǐn)?shù)方差共存。第4頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)3、經(jīng)典測(cè)驗(yàn)理論處理分?jǐn)?shù)方差的辦法假定X=T+E,然后有:再定義信度為:

第5頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)優(yōu)點(diǎn):定義了隨機(jī)誤差,可設(shè)法估計(jì)其大小。缺點(diǎn):沒(méi)有能告訴我們誤差由哪些原因造成,各種原因造成的誤差各有多大。第6頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)

4、概化理論的研究目的探清總分方差結(jié)構(gòu)、區(qū)分誤差原因,明確各種誤差大小,找到最優(yōu)設(shè)計(jì)方案。第7頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)(二)概化理論發(fā)展的理論與技術(shù)基礎(chǔ)1、經(jīng)典測(cè)驗(yàn)理論概化理論與經(jīng)典測(cè)驗(yàn)理論相比,不同之處多于相同之處。2、方差分量分析依靠方差分量分析將總分方差分解、定性。第8頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)(三)概化理論發(fā)展史用方差分量分析研究測(cè)量誤差的歷史可以追溯到20世紀(jì)上半葉。公認(rèn)的GT正式誕生的標(biāo)志物是克朗巴赫等的專(zhuān)著《行為測(cè)量的可靠性》的正式出版。第9頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)二、概化理論基本框架(一)概化理論的測(cè)驗(yàn)情境關(guān)系說(shuō)為了探清測(cè)驗(yàn)誤差的來(lái)源、類(lèi)型、大小,必須建立一個(gè)理論模型。第10頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)概化理論模型的建立依賴(lài)于對(duì)測(cè)驗(yàn)情境關(guān)系的詳細(xì)調(diào)查。測(cè)驗(yàn)情境關(guān)系是指測(cè)量目標(biāo)與各測(cè)量側(cè)面所組成的一種關(guān)系結(jié)構(gòu)。

第11頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)1、測(cè)量目標(biāo)測(cè)量目標(biāo):測(cè)量者希望通過(guò)測(cè)量用測(cè)量值描繪的心理品質(zhì)。確定測(cè)量目標(biāo)的方法:?jiǎn)枴皽y(cè)誰(shuí)”和“測(cè)什么”。一般一場(chǎng)測(cè)量目標(biāo)只能一個(gè)研究同一測(cè)量問(wèn)題測(cè)量目標(biāo)一經(jīng)確定不能改變。第12頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)2、測(cè)量側(cè)面測(cè)量側(cè)面:測(cè)量的條件。測(cè)量側(cè)面水平:測(cè)量條件的不同水平。測(cè)量側(cè)面類(lèi)型:隨機(jī)側(cè)面固定側(cè)面第13頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)固定側(cè)面的優(yōu)點(diǎn):測(cè)量的誤差會(huì)減小,測(cè)量的信度會(huì)提高。固定側(cè)面的缺點(diǎn):固定側(cè)面成目標(biāo)的一部分,測(cè)量結(jié)果拓廣受限。第14頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)3、概化理論下的真分?jǐn)?shù)概念經(jīng)典測(cè)驗(yàn)理論認(rèn)為個(gè)體真分?jǐn)?shù)只能有一個(gè)。概化理論認(rèn)為在不同測(cè)量條件下會(huì)有不同的真分?jǐn)?shù)。第15頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)測(cè)驗(yàn)情境關(guān)系說(shuō)結(jié)論:情境關(guān)系中的測(cè)量目標(biāo)、測(cè)量側(cè)面、側(cè)面的水平變化,會(huì)引起測(cè)驗(yàn)誤差的來(lái)源,誤差的大小、真分?jǐn)?shù)的種類(lèi)以及測(cè)驗(yàn)信度的變化,進(jìn)而引起測(cè)驗(yàn)分?jǐn)?shù)的解釋范圍發(fā)生變化。第16頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)(二)測(cè)驗(yàn)設(shè)計(jì)的模型與種類(lèi) 測(cè)驗(yàn)設(shè)計(jì)的任務(wù)(兩個(gè)方面):(1)界定測(cè)量目標(biāo)和測(cè)量側(cè)面的個(gè)數(shù)及名稱(chēng)、意義,確定各側(cè)面的水平數(shù)。(2)設(shè)計(jì)數(shù)據(jù)采集方法。第17頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)數(shù)據(jù)采集方法類(lèi)型:以側(cè)面數(shù)分:

單側(cè)面設(shè)計(jì)、雙側(cè)面設(shè)計(jì)、多側(cè)面設(shè)計(jì)第18頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)以數(shù)據(jù)結(jié)構(gòu)分:交叉設(shè)計(jì):測(cè)量目標(biāo)在所有側(cè)面的各個(gè)水平上被測(cè)量。如p×I、p×i×r

第19頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)嵌套設(shè)計(jì):測(cè)量目標(biāo)在一個(gè)或多個(gè)側(cè)面的部分水平以下被測(cè)量。如p:r、p:r:s混合設(shè)計(jì):既有交叉,又有嵌套的測(cè)驗(yàn)設(shè)計(jì)。如i×(p:r)

第20頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)數(shù)據(jù)采集設(shè)計(jì)原則:數(shù)據(jù)充分體現(xiàn)測(cè)量目標(biāo)與各個(gè)測(cè)量側(cè)面及各側(cè)面相互之間關(guān)系側(cè)面數(shù)、水平數(shù)的設(shè)置要符合客觀的測(cè)驗(yàn)情境;能獲得充分的數(shù)據(jù)信息;簡(jiǎn)化模型、節(jié)約投入。施測(cè)時(shí)要控制設(shè)計(jì)之外的各種無(wú)關(guān)變量。第21頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)(三)G研究

G研究目的:用方差分量分析,定量估計(jì)觀察領(lǐng)域中測(cè)量目標(biāo)方差和各個(gè)測(cè)量側(cè)面方差,以及其間的交互作用的方差。第22頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)方差分量分析(二步):1、分解總體方差為測(cè)量目標(biāo)主效應(yīng)方差、各測(cè)量側(cè)面主效應(yīng)方差和各種交互效應(yīng)方差。2、應(yīng)用樣本方差估計(jì)各種效應(yīng)的期望均方差。第23頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)各種期望均方差性質(zhì):測(cè)量目標(biāo)效應(yīng)期望均方差:測(cè)量目標(biāo)個(gè)體差異的描寫(xiě)量;各測(cè)量側(cè)面效應(yīng)期望均方差:各側(cè)面對(duì)目標(biāo)干擾程度描寫(xiě)量,就是誤差;各交互效應(yīng)期望均方差:各側(cè)面對(duì)目標(biāo)的交互干擾程度描寫(xiě)量,也是誤差。第24頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)(四)D研究D研究的目的:在G研究的基礎(chǔ)上,在原設(shè)計(jì)的測(cè)驗(yàn)情境關(guān)系范圍之內(nèi),分析比較各種可能的測(cè)驗(yàn)方案,由研究者結(jié)合實(shí)際,優(yōu)選實(shí)施方案。第25頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)D研究調(diào)整原方案獲取新方案的方法:1、固定原測(cè)驗(yàn)情境關(guān)系中的某一個(gè)或某幾個(gè)側(cè)面。2、改變?cè)瓬y(cè)驗(yàn)情境關(guān)系中的一個(gè)或某幾個(gè)測(cè)量側(cè)面的水平數(shù)。3、改變?cè)瓬y(cè)驗(yàn)情境關(guān)系中某些測(cè)量側(cè)面的結(jié)構(gòu)關(guān)系。第26頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)D研究的統(tǒng)計(jì)分析步驟(兩步)1、估計(jì)拓廣領(lǐng)域(新測(cè)驗(yàn)方案)下各種效應(yīng)期望方差。2、估計(jì)新方案下測(cè)驗(yàn)誤差的總體指標(biāo)和測(cè)驗(yàn)質(zhì)量指標(biāo),以提供比較依據(jù)。第27頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)測(cè)驗(yàn)誤差指標(biāo):1、相對(duì)誤差指標(biāo):所有與測(cè)量目標(biāo)有關(guān)的交互效應(yīng)方差之和,2、絕對(duì)誤差指標(biāo):除目標(biāo)主效應(yīng)方差之外的所有效應(yīng)方差之和。第28頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)測(cè)驗(yàn)質(zhì)量綜合指標(biāo):1、概化系數(shù)G;目標(biāo)效應(yīng)方差與目標(biāo)效應(yīng)方差加相對(duì)誤差方差之和的比。2、相依系數(shù):目標(biāo)效應(yīng)方差與目標(biāo)效應(yīng)方差加絕對(duì)誤差方差之和的比。第29頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)D研究的最后工作:根據(jù)綜合指標(biāo),找出最優(yōu)測(cè)驗(yàn)設(shè)計(jì)方案。第30頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)概化理論分析常用軟件:

GENOVA

或mGENOVA。第31頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)三、概化理論評(píng)價(jià)優(yōu)點(diǎn):1、概化理論是一套全新的測(cè)驗(yàn)誤差分析方法,而且非常精細(xì)。2、概化理論引進(jìn)了測(cè)驗(yàn)設(shè)計(jì)的思想和方法。3、概化理論具有嚴(yán)謹(jǐn)?shù)目茖W(xué)理論體系。第32頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月心理測(cè)量學(xué)缺點(diǎn):1、概化理論本質(zhì)上還是抽樣,研究本身會(huì)有誤差。2、計(jì)算方法相對(duì)復(fù)雜,給應(yīng)用帶來(lái)一定困難。第33頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月2·

項(xiàng)目反應(yīng)理論介紹第34頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月內(nèi)容提要:項(xiàng)目反應(yīng)理論的發(fā)展IRT的基本理論體系項(xiàng)目反應(yīng)模型計(jì)算機(jī)程序IRT的應(yīng)用、優(yōu)點(diǎn)與不足第35頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(一)、經(jīng)典測(cè)驗(yàn)理論一、項(xiàng)目反應(yīng)理論的發(fā)展:(二)、項(xiàng)目反應(yīng)理論的發(fā)展第36頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月1、CTT的理論體系很完善,是其他測(cè)驗(yàn)理論賴(lài)以產(chǎn)生的基石。優(yōu)點(diǎn)有:理論方法體系相對(duì)完整前提假設(shè)比較弱所涉及到的數(shù)學(xué)模型以及參數(shù)的概念和估計(jì)方法易理解和掌握標(biāo)準(zhǔn)化技術(shù)在控制測(cè)驗(yàn)誤差等方面有明顯的效果(一)、經(jīng)典測(cè)驗(yàn)理論第37頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月基本假設(shè)難以成立:①真分?jǐn)?shù)與觀測(cè)分?jǐn)?shù)間存在線性關(guān)系的假定不合理;②平行測(cè)驗(yàn)的假設(shè)難以成立;③誤差與真分?jǐn)?shù)獨(dú)立的假設(shè)難以滿足。2、CTT在理論體系和方法體系方面存在許多其本身難以克服的缺點(diǎn),具體表現(xiàn)為:項(xiàng)目統(tǒng)計(jì)量嚴(yán)重依賴(lài)于測(cè)驗(yàn)所實(shí)施的被試樣組。第38頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月被試測(cè)驗(yàn)分?jǐn)?shù)依賴(lài)于所施測(cè)項(xiàng)目的難度。

測(cè)驗(yàn)信度觀存在嚴(yán)重問(wèn)題。CTT的信度是針對(duì)被試全體的,只代表平均測(cè)量精度,假設(shè)所有被試測(cè)量標(biāo)準(zhǔn)誤相等,而實(shí)際上,不同能力水平的被試不可能具有同樣的測(cè)量標(biāo)準(zhǔn)誤。缺乏預(yù)測(cè)力對(duì)測(cè)驗(yàn)等值、適應(yīng)性測(cè)驗(yàn)、標(biāo)準(zhǔn)參照性測(cè)驗(yàn)的編制等問(wèn)題不能給以滿意的解決。第39頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月盡管存在以上缺點(diǎn),CTT仍在廣泛地應(yīng)用。CTT、IRT和概化理論是當(dāng)今最有影響的三種測(cè)驗(yàn)理論。簡(jiǎn)單地說(shuō),IRT在處理微觀問(wèn)題(即被試水平與答題目之間的實(shí)質(zhì)性關(guān)系)時(shí)優(yōu)勢(shì)明顯,CTT在處理中觀問(wèn)題(如處理常見(jiàn)的標(biāo)準(zhǔn)化考試等)時(shí)方便易懂,GT則在處理宏觀問(wèn)題(如對(duì)結(jié)果作推論)時(shí)更顯出色。三種測(cè)驗(yàn)理論體系有內(nèi)在聯(lián)系,各有長(zhǎng)短,應(yīng)相互促進(jìn),互相補(bǔ)充。第40頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(二)、項(xiàng)目反應(yīng)理論的發(fā)展由于項(xiàng)目特征曲線(ICC)對(duì)項(xiàng)目反應(yīng)理論的產(chǎn)生具有重要意義,所以在講項(xiàng)目反應(yīng)理論的產(chǎn)生和發(fā)展問(wèn)題時(shí),一般都追溯到1905年比奈和西蒙編制第一個(gè)智力量表時(shí)的工作,他們當(dāng)時(shí)所使用的作業(yè)成績(jī)隨年齡增長(zhǎng)而提高的散點(diǎn)圖與現(xiàn)在的ICC曲線十分類(lèi)似。第41頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月IRT的真正創(chuàng)立者是美國(guó)心理測(cè)量學(xué)家洛德(Lord)。1952年,洛德發(fā)表博士論文《一個(gè)測(cè)驗(yàn)分?jǐn)?shù)的理論》,提出了IRT的第一個(gè)數(shù)學(xué)模型(Two-parameterNormalOgiveModel,雙參數(shù)正態(tài)卵形曲線模型)及其參數(shù)的估計(jì)方法,并把該模型應(yīng)用到了學(xué)業(yè)成績(jī)和態(tài)度測(cè)量工作之中。第42頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(一)、概念(二)、基本思想及基本思路(三)、基本理論假設(shè)二、IRT的基本理論體系第43頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(一)、概念項(xiàng)目反應(yīng)理論(ItemResponseTheory,簡(jiǎn)稱(chēng)IRT),又稱(chēng)潛在特質(zhì)理論(LatentTraitTheory)或項(xiàng)目特征曲線理論(ItemCharacteristicCurseTheory),是為了克服經(jīng)典測(cè)驗(yàn)理論(CTT)的局限而提出的現(xiàn)代測(cè)驗(yàn)理論。從測(cè)驗(yàn)的內(nèi)部或微觀方面入手,采取數(shù)學(xué)建模和統(tǒng)計(jì)調(diào)整的方法,重點(diǎn)討論被試的能力水平與測(cè)驗(yàn)項(xiàng)目之間的實(shí)質(zhì)性關(guān)系,測(cè)驗(yàn)的每一個(gè)項(xiàng)目都有自己的項(xiàng)目特征曲線,描述了每一個(gè)特定能力水平的被試答對(duì)或答錯(cuò)該項(xiàng)目的概率。第44頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(二)、基本思想及基本思路潛在特質(zhì):把表現(xiàn)在一個(gè)人身上所特有的相對(duì)穩(wěn)定的行為方式稱(chēng)為心理特質(zhì)(trait),由于這種心理特質(zhì)是隱含于其行為之中的,所以也稱(chēng)做潛在特質(zhì)。第45頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月與CTT一樣,IRT也認(rèn)為被試的潛在特質(zhì)是不能被觀察和測(cè)量的,但卻可以通過(guò)其外顯行為表現(xiàn)出來(lái)。不同的是,CTT是以被試對(duì)所有測(cè)驗(yàn)項(xiàng)目的反應(yīng)總和(測(cè)驗(yàn)總分)為顯變量來(lái)預(yù)測(cè)被試的潛在特質(zhì)的,并不認(rèn)為被試對(duì)單個(gè)項(xiàng)目的反應(yīng)與其特質(zhì)間有任何有意義的聯(lián)系。第46頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月IRT則認(rèn)為被試的能力與其對(duì)某一特定項(xiàng)目的反應(yīng)(以正確或錯(cuò)誤反應(yīng)概率表示)有某種函數(shù)關(guān)系存在,確定這種關(guān)系就是IRT的基本思想和出發(fā)點(diǎn)。所以IRT可以被理解為一種探討被試對(duì)項(xiàng)目的反應(yīng)與其潛在特質(zhì)間關(guān)系的概率性方法。第47頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月用θ表示被試的潛在特質(zhì)或能力,用Pi(θ)表示其對(duì)項(xiàng)目i正確反應(yīng)概率,項(xiàng)目反應(yīng)理論的關(guān)鍵就是確定θ與Pi(θ)間的函數(shù)關(guān)系。第48頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月表1某個(gè)項(xiàng)目假設(shè)的項(xiàng)目特征曲線1.000.000.50潛在特質(zhì):θ

正確反應(yīng)的概率:Pi(θ)第49頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月潛在特質(zhì)空間(LatentTraitSpace)對(duì)于某一特殊行為的發(fā)展起作用的所有潛在特質(zhì)的集合。第50頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月維度在潛在特質(zhì)空間中互相獨(dú)立的潛在特質(zhì)的個(gè)數(shù)。一個(gè)K維的潛在特質(zhì)空間可以表示為:H=(θ1,θ2,θ3,...,θk)總之,潛在特質(zhì)理論是一切心理測(cè)量理論研究的基礎(chǔ)。第51頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月1、潛在特質(zhì)空間的單維性假設(shè)2、局部獨(dú)立性假設(shè)3、項(xiàng)目特征曲線假設(shè)4、非速度性假設(shè)(三)、基本理論假設(shè)第52頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月1、潛在特質(zhì)空間的單維性假設(shè)(unidimensionality)潛在特質(zhì)空間單維性指測(cè)驗(yàn)測(cè)量的是單一的特質(zhì)而非多元特質(zhì),即被試對(duì)測(cè)驗(yàn)中任一項(xiàng)目的反應(yīng)是其單一特質(zhì)θ的函數(shù)。第53頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月如何判斷是否滿足單維性假設(shè)?因素分析的方法當(dāng)因素分析抽取的第一個(gè)公共因素解釋的變異遠(yuǎn)大于第二個(gè)公共因素時(shí),就可認(rèn)為測(cè)驗(yàn)是單維的。第54頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月但嚴(yán)格的單維性是大多數(shù)測(cè)量工具都難以滿足的,這也是IRT受到批評(píng)的主要原因。所以,解決測(cè)驗(yàn)的單維性問(wèn)題及建立多維反應(yīng)模型是IRT將要研究的任務(wù)之一。第55頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月在項(xiàng)目反應(yīng)理論中,常用一般的統(tǒng)計(jì)依存性和統(tǒng)計(jì)獨(dú)立性概念來(lái)討論項(xiàng)目間關(guān)系。2、局部獨(dú)立性假設(shè)(localindependence)Pi(+):表示正確回答第i個(gè)項(xiàng)目的概率Pi(-):表示答錯(cuò)第個(gè)i項(xiàng)目的概率Pj(+):表示正確回答第j個(gè)項(xiàng)目的概率Pj(-):表示答錯(cuò)第j個(gè)項(xiàng)目的概率第56頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月P(+,+)表示正確回答第i和第j個(gè)項(xiàng)目的概率同理,……。根據(jù)以上定義,在下列條件下,兩個(gè)項(xiàng)目得分在統(tǒng)計(jì)上是獨(dú)立的。第57頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月P(+,+)=Pi(+)Pj(+)P(+,-)=Pi(+)Pj(-)P(-,+)=Pi(-)Pj(+)P(-,-)=Pi(-)Pj(-)如果四個(gè)等式中的任何一個(gè)不成立,則這兩個(gè)項(xiàng)目在統(tǒng)計(jì)上就是依存的。第58頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月例:如果Pi(+)=.8Pi(-)=.2

Pj(+)=.6Pj(-)=.4那么當(dāng)且僅當(dāng)P(+,+)=.48P(+,-)=.32P(-,+)=.12P(-,-)=.08時(shí)兩個(gè)項(xiàng)目才獨(dú)立。實(shí)際就是指,如果兩個(gè)項(xiàng)目的每種反應(yīng)模式的概率,僅僅根據(jù)對(duì)每個(gè)項(xiàng)目正確與不正確反應(yīng)的概率就能計(jì)算出來(lái),那么項(xiàng)目之間便是獨(dú)立的。第59頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月如何理解局部獨(dú)立性假設(shè)呢?由于這種獨(dú)立性是針對(duì)特定的θ值的被試而言的,所以稱(chēng)為“局部”。例:假設(shè)1000名能力相同的被試參加某一能力測(cè)驗(yàn),600名被試答對(duì)了項(xiàng)目i,400名答錯(cuò)了;這1000名被試對(duì)項(xiàng)目j的正確反應(yīng)概率與對(duì)項(xiàng)目i的正確反應(yīng)概率統(tǒng)計(jì)上是獨(dú)立的。總之,同一特質(zhì)水平的被試回答某一項(xiàng)目時(shí)不受其他項(xiàng)目的影響。第60頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月3、項(xiàng)目特征曲線假設(shè)IRT假定正確反應(yīng)概率Pi(θ)與θ間存在規(guī)律性的變化關(guān)系,這種關(guān)系可以用一個(gè)數(shù)學(xué)函數(shù)的形式表示出來(lái),這一函數(shù)稱(chēng)為項(xiàng)目反應(yīng)函數(shù)(ItemResponseFunction),項(xiàng)目特征曲線(ICC)就是這一函數(shù)的圖像。第61頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月大量事實(shí)證明,對(duì)兩級(jí)記分的項(xiàng)目,被試的能力水平與他對(duì)項(xiàng)目的反應(yīng)之間呈S型的曲線關(guān)系,而且這一關(guān)系具有相當(dāng)?shù)钠毡樾浴型ICC具有一些共同點(diǎn),即都有一條Y=1的上漸近線和一條Y=c(c≥0)的下漸進(jìn)線,且是嚴(yán)格單調(diào)上升的,一條ICC的形狀取決于三個(gè)變量:下漸近線的高度,曲線拐點(diǎn)的位置及拐點(diǎn)處的斜率。這三個(gè)變量恰好相當(dāng)于三個(gè)項(xiàng)目參數(shù):猜測(cè)參數(shù)ci,難度參數(shù)bi和區(qū)分度參數(shù)ai。第62頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月1.000.000.50θPi(θ)上漸近線下漸近線c拐點(diǎn)切線b第63頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(1)難度參數(shù)bi在一條ICC中,bi等于曲線在拐點(diǎn)處的θ值。當(dāng)猜測(cè)參數(shù)ci=0(曲線的下漸近線為0)時(shí),bi等于Pi(θ)=0.50時(shí)的θ值,因?yàn)閷?duì)一條完整的ICC,拐點(diǎn)恰好是曲線的中點(diǎn)和對(duì)稱(chēng)點(diǎn)。當(dāng)ci>0時(shí),P(θ)=(1+c)/2第64頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月在IRT中,bi表示一個(gè)項(xiàng)目的難度,其取值范圍一般在-3.0到+3.0之間。bi越大,表示項(xiàng)目的難度越大。1.000.000.50θPi(θ)b1b2項(xiàng)目1項(xiàng)目2第65頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月從上圖可以看出,項(xiàng)目2比項(xiàng)目1更難些,因?yàn)槟芰ο嗤耐唤M被試對(duì)項(xiàng)目1的正確反應(yīng)概率要大于對(duì)項(xiàng)目2的正確反應(yīng)概率。在其他條件不變的情況下,增大項(xiàng)目的難度會(huì)使ICC向右平移。第66頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(2)區(qū)分度參數(shù)ai在一條ICC中,ai的大小決定曲線在拐點(diǎn)bi處的陡度。ai很大時(shí),在bi附近能力θ的增加會(huì)導(dǎo)致正確反應(yīng)概率Pi(θ)有很快的增長(zhǎng);ai很小時(shí),在bi附近能力θ的等量增加不會(huì)導(dǎo)致正確反應(yīng)概率Pi(θ)有明顯的增長(zhǎng)。ai的取值范圍通常在0.30~2之間。第67頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月圖區(qū)分度參數(shù)ai對(duì)正確反應(yīng)概率的影響1.000.000.50θPi(θ)b項(xiàng)目1項(xiàng)目2第68頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月ai越大,曲線在bi附近就會(huì)越陡,項(xiàng)目在bi附近的區(qū)分能力就越大,但在遠(yuǎn)離bi的區(qū)域,曲線就會(huì)變得越平坦,項(xiàng)目的區(qū)分能力就越低。也就是說(shuō),區(qū)分度參數(shù)ai大的項(xiàng)目對(duì)能力水平接近bi的被試有較大的區(qū)分能力,而對(duì)能力水平遠(yuǎn)大于或小于bi的被試區(qū)分能力小。相反,區(qū)分度參數(shù)ai小的項(xiàng)目則在能力分布更廣泛范圍內(nèi)對(duì)被試都有一定的區(qū)分能力。第69頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(3)猜測(cè)參數(shù)ci被試完全憑機(jī)遇答對(duì)項(xiàng)目i的概率即是該項(xiàng)目的猜測(cè)參數(shù)ci。注意:CTT中沒(méi)有猜測(cè)參數(shù),IRT引入此概念是為了提高對(duì)能力估計(jì)的精度。對(duì)包含m個(gè)選擇項(xiàng)的選擇題,其猜測(cè)參數(shù)ci一般接近1/m。ci的取值范圍一般在0~0.50之間。第70頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月二級(jí)評(píng)分IRT模型多級(jí)評(píng)分IRT模型連續(xù)型IRT模型三、項(xiàng)目反應(yīng)模型第71頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(一)、正態(tài)卵形模型(NormalOgiveModel)正態(tài)卵形模型將項(xiàng)目特征曲線視為一條S形正態(tài)累積函數(shù)曲線,相應(yīng)的數(shù)學(xué)模型即是正態(tài)累積分布函數(shù)??煞譃槿齾?shù)、雙參數(shù)和單參數(shù)模型三種。第72頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(1)三參數(shù)正態(tài)卵形模型表達(dá)式為:ai、bi、ci,y為正態(tài)曲線縱線的高度,dy表示對(duì)y積分,∫為積分符號(hào),上下角表示積分的范圍,求從z=-∞到z=ai(θ-bi)范圍內(nèi)正態(tài)曲線下的累積面積。第73頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月(2)雙參數(shù)正態(tài)卵形模型當(dāng)猜測(cè)參數(shù)為0時(shí),三參數(shù)變成了雙參數(shù)。(3)單參數(shù)正態(tài)卵形模型當(dāng)ci=0,ai=1時(shí),雙參數(shù)變成了單參數(shù)。第74頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月由于正態(tài)卵形模型中的積分運(yùn)算不易進(jìn)行,伯恩鮑姆(Birnbaum,1957)在洛德正態(tài)卵形模型的基礎(chǔ)上提出了邏輯斯蒂模型。(二)、邏輯斯蒂模型(LogisticModels)邏輯斯蒂模型避免了復(fù)雜的積分運(yùn)算,在估計(jì)能力和項(xiàng)目參數(shù)時(shí)要簡(jiǎn)便得多。邏輯斯蒂模型是使用最廣的模型,其次是正態(tài)卵形模型。第75頁(yè),課件共84頁(yè),創(chuàng)作于2023年2月邏輯斯蒂模型也包括三參數(shù)、雙參數(shù)和單參數(shù)模型三種。(1)三參數(shù)邏輯斯蒂模型的表達(dá)式:ai、bi、ci分別為區(qū)分度參數(shù)、難度參數(shù)、猜測(cè)參數(shù),含義與正態(tài)卵形模型相同。第76頁(yè),課件共84頁(yè),創(chuàng)作于2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論