經(jīng)典測量理論、概化、項(xiàng)目反應(yīng)理論_第1頁
經(jīng)典測量理論、概化、項(xiàng)目反應(yīng)理論_第2頁
經(jīng)典測量理論、概化、項(xiàng)目反應(yīng)理論_第3頁
經(jīng)典測量理論、概化、項(xiàng)目反應(yīng)理論_第4頁
經(jīng)典測量理論、概化、項(xiàng)目反應(yīng)理論_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、經(jīng)典測量理論(classical test theory,CTT)2022-4-1119041904年斯皮爾曼首次提出了經(jīng)典測量理論,年斯皮爾曼首次提出了經(jīng)典測量理論,19501950年,美國學(xué)者格立克森(年,美國學(xué)者格立克森(GulliksenGulliksen)出版了)出版了“Theory of Mental TestsTheory of Mental Tests”一書,標(biāo)志著經(jīng)典一書,標(biāo)志著經(jīng)典測驗(yàn)理論的成熟。測驗(yàn)理論的成熟。經(jīng)典測量理論主要是以真實(shí)分?jǐn)?shù)模型經(jīng)典測量理論主要是以真實(shí)分?jǐn)?shù)模型 (true (true score model)score model)為基礎(chǔ)為基礎(chǔ), ,圍繞被試

2、對(duì)試題的應(yīng)答結(jié)果圍繞被試對(duì)試題的應(yīng)答結(jié)果( (觀測分?jǐn)?shù)觀測分?jǐn)?shù)) )和被試所具有的真實(shí)的心理特質(zhì)和被試所具有的真實(shí)的心理特質(zhì)( (真分真分?jǐn)?shù)數(shù)) )之間存在的誤差進(jìn)行分析之間存在的誤差進(jìn)行分析, ,發(fā)展并形成了包括發(fā)展并形成了包括信度、效度、區(qū)分度、等值等概念在內(nèi)的比較完信度、效度、區(qū)分度、等值等概念在內(nèi)的比較完整的心理與教育測量理論體系整的心理與教育測量理論體系, ,故經(jīng)典測量理論又故經(jīng)典測量理論又稱為真分?jǐn)?shù)理論。稱為真分?jǐn)?shù)理論。2022-4-11X=T+E任何一個(gè)測驗(yàn)成績都看做是真分?jǐn)?shù)和測量誤差之和,這是經(jīng)典測量理論的基本思想。真分?jǐn)?shù)理論的基本假設(shè):在討論范圍內(nèi)在討論范圍內(nèi), ,真分?jǐn)?shù)具有

3、某種程度的穩(wěn)定性真分?jǐn)?shù)具有某種程度的穩(wěn)定性, ,即真分?jǐn)?shù)不即真分?jǐn)?shù)不變變, ,是常數(shù);是常數(shù);測量誤差的期望值為測量誤差的期望值為0,0,即即E=0E=0;測量誤差與真分?jǐn)?shù)相互獨(dú)立測量誤差與真分?jǐn)?shù)相互獨(dú)立, ,真分?jǐn)?shù)與測量誤差相關(guān)為真分?jǐn)?shù)與測量誤差相關(guān)為0 0;不同測量誤差之間的相關(guān)為不同測量誤差之間的相關(guān)為0 0;平行性假設(shè)平行性假設(shè): :以相同的程度測量同一心理特質(zhì)的測驗(yàn)稱為平行測驗(yàn)。以相同的程度測量同一心理特質(zhì)的測驗(yàn)稱為平行測驗(yàn)。每個(gè)平行測驗(yàn)的平均數(shù)相等每個(gè)平行測驗(yàn)的平均數(shù)相等, ,等于同一心理特質(zhì)等于同一心理特質(zhì), ,即真分?jǐn)?shù);測量誤差即真分?jǐn)?shù);測量誤差的平均數(shù)相等的平均數(shù)相等, ,且

4、等于且等于0 0;測量誤差方差相等。;測量誤差方差相等。2022-4-11根據(jù)上面的假設(shè),可以將真分?jǐn)?shù)定義為:一個(gè)被試在某一測量中無限多次測量的均值或數(shù)學(xué)期望,即經(jīng)典測量理論的優(yōu)點(diǎn)與局限性經(jīng)典測量理論的優(yōu)點(diǎn)與局限性 優(yōu)點(diǎn):優(yōu)點(diǎn): 在在2020世紀(jì)大部分年代里世紀(jì)大部分年代里, ,心理與教育測量的理心理與教育測量的理論與實(shí)踐一直建立在真分?jǐn)?shù)模型基礎(chǔ)上。論與實(shí)踐一直建立在真分?jǐn)?shù)模型基礎(chǔ)上。 真分?jǐn)?shù)模型是以弱假設(shè)為基礎(chǔ)的真分?jǐn)?shù)模型是以弱假設(shè)為基礎(chǔ)的, , 采用的計(jì)算采用的計(jì)算公式簡單明了、淺顯易懂公式簡單明了、淺顯易懂, ,能夠?qū)y試結(jié)果做能夠?qū)y試結(jié)果做出合理的解釋出合理的解釋, ,并且可操作性強(qiáng)

5、并且可操作性強(qiáng), ,便于在實(shí)際測便于在實(shí)際測驗(yàn)情境驗(yàn)情境( (尤其是小規(guī)模資料尤其是小規(guī)模資料) )中實(shí)施中實(shí)施, ,能滿足人能滿足人們對(duì)將測試作為一種選拔工具的需要們對(duì)將測試作為一種選拔工具的需要, ,在測驗(yàn)在測驗(yàn)實(shí)際工作中有著較強(qiáng)影響力實(shí)際工作中有著較強(qiáng)影響力, ,并發(fā)揮著重要的并發(fā)揮著重要的指導(dǎo)作用。指導(dǎo)作用。局限性:局限性:2022-4-11(1 1)信度估計(jì)精確性不高)信度估計(jì)精確性不高 經(jīng)典測量理論對(duì)信度的假設(shè)是建立在平行測驗(yàn)的概念假設(shè)上的,但很難找到兩個(gè)測驗(yàn)的測量誤差完全相等,不可能要求每位受試者接受同一份測驗(yàn)無數(shù)次,而每次測量間都彼此獨(dú)立不相關(guān)。因此平行測驗(yàn)的理論假設(shè)很難滿足。

6、在平行測驗(yàn)條件不滿足的情況下,估計(jì)的各種信度可能有較大誤差。(2 2)各參數(shù)估計(jì)受樣本依賴性太大)各參數(shù)估計(jì)受樣本依賴性太大 難度、區(qū)分度和信度等各項(xiàng)指標(biāo),依賴于它們所來自的特定的被試樣本。這些指標(biāo)會(huì)因接受測驗(yàn)的受試者樣本的不同而不同,因此,同一份試卷很難獲得一致的難度、區(qū)分度或信度。2022-4-11(3 3)等測量標(biāo)準(zhǔn)誤差難做到)等測量標(biāo)準(zhǔn)誤差難做到 真分?jǐn)?shù)模型已經(jīng)指出測量誤差的存在,以一個(gè)相同的測量標(biāo)準(zhǔn)誤作為每位受試者的測量誤差,顯然不適當(dāng)。當(dāng)測驗(yàn)施測于能力水平高于(或低于)測驗(yàn)難度的被試時(shí)就容易產(chǎn)生較大的測量誤差,且誤差會(huì)隨著被試水平與測驗(yàn)難度距離的增加而變大。(4 4)能力量表與難度

7、量表不配套)能力量表與難度量表不配套 在經(jīng)典測量理論中,被試能力量表是卷面總分,項(xiàng)目的難度量表是題目難度。因而不能提供不同能力水平的被試如何對(duì)項(xiàng)目進(jìn)行反應(yīng)的預(yù)測信息,找不到驗(yàn)證某個(gè)項(xiàng)目是否匹配某種能力水平被試的計(jì)量方法,這使得在選題時(shí)帶有一定盲目性,失去了精確指導(dǎo)測驗(yàn)編制的作用。概化理論(generalizability theory, GT)2022-4-11克朗巴赫等人(Cronbach)于1972年出版的The Dependability of Behavioral Measurement一書是概化理論形成的標(biāo)志。GT是關(guān)于行為測量的可信賴度的統(tǒng)計(jì)學(xué)理論。概括性:分?jǐn)?shù)能夠推論的范圍。分?jǐn)?shù)

8、能夠推論的范圍??尚刨嚩龋和茝V應(yīng)用時(shí),推廣或概括化的準(zhǔn)確程推廣應(yīng)用時(shí),推廣或概括化的準(zhǔn)確程度。度。2022-4-11GT理論的基本思想是,任何測量都處在一定的情境關(guān)系之中,應(yīng)該從測量的情境關(guān)系中具體地考察測量工作,提出了多種真分?jǐn)?shù)與多種不同的信度系數(shù)的觀念,并設(shè)計(jì)了一套方法去系統(tǒng)辯明與實(shí)驗(yàn)性研究多種誤差方差的來源。用“全域分?jǐn)?shù)”(Universe Score)代替“真分?jǐn)?shù)”(True Score) ,用“概括化系數(shù),G系數(shù)”(Generalizability Coefficent)代替了“信度”。2022-4-11概化理論把全域分?jǐn)?shù)方差對(duì)總方差的比稱為為概括力系數(shù)(簡稱G系數(shù))。而總方差可以分

9、成全域分?jǐn)?shù)方差2(p)和誤差分?jǐn)?shù)方差2()。概化理論的研究程序2022-4-11G G研究研究(G study):(G study):測量的測量的過程中有哪些因素會(huì)影過程中有哪些因素會(huì)影響被試的測量結(jié)果。響被試的測量結(jié)果。測量目標(biāo)主效應(yīng)方差、測測量目標(biāo)主效應(yīng)方差、測量面的主效應(yīng)方差、各種量面的主效應(yīng)方差、各種交互效應(yīng)方差。交互效應(yīng)方差。D D研究研究(D study)(D study)概化系數(shù)概化系數(shù)可信賴指數(shù)可信賴指數(shù)2022-4-11測量工作中要加以認(rèn)識(shí)和應(yīng)用的心理特質(zhì)水平是測量目標(biāo)。而構(gòu)成測量條件與具體情境關(guān)系的因素,稱為測量側(cè)面(Facets of Measurement)。測量側(cè)面又

10、分為隨機(jī)側(cè)面和固定側(cè)面。進(jìn)行測驗(yàn)的標(biāo)準(zhǔn)化就是對(duì)某些測量側(cè)面進(jìn)行固定。固定測量側(cè)面可以減少測量誤差,但卻會(huì)使測量目標(biāo)變得更為局限,這樣,測驗(yàn)所得的分?jǐn)?shù)就不能再推廣到原來那么寬廣的范圍了。GTGT與與CTTCTT的幾點(diǎn)比較的幾點(diǎn)比較2022-4-11(1 1)CTTCTT要求嚴(yán)格平行測驗(yàn)的要求嚴(yán)格平行測驗(yàn)的“強(qiáng)假設(shè)強(qiáng)假設(shè)”,即兩個(gè)平行測驗(yàn)的,即兩個(gè)平行測驗(yàn)的實(shí)測分?jǐn)?shù)必須具有相同的平均數(shù)和方差,否則無法確定測驗(yàn)實(shí)測分?jǐn)?shù)必須具有相同的平均數(shù)和方差,否則無法確定測驗(yàn)信度的意義;而信度的意義;而GTGT只要求隨機(jī)平行的只要求隨機(jī)平行的“弱假設(shè)弱假設(shè)”,所謂隨機(jī),所謂隨機(jī)平行測驗(yàn)是指隨機(jī)取自同一題庫的長度相

11、同的測驗(yàn)。因而平行測驗(yàn)是指隨機(jī)取自同一題庫的長度相同的測驗(yàn)。因而CTTCTT的應(yīng)用范圍受到許多限制,而的應(yīng)用范圍受到許多限制,而GTGT的應(yīng)用范圍則更廣泛,的應(yīng)用范圍則更廣泛,應(yīng)用也更合理。應(yīng)用也更合理。(2 2)CTTCTT把測驗(yàn)分?jǐn)?shù)簡單劃分為真分?jǐn)?shù)和誤差分?jǐn)?shù)兩個(gè)部分,把測驗(yàn)分?jǐn)?shù)簡單劃分為真分?jǐn)?shù)和誤差分?jǐn)?shù)兩個(gè)部分,誤差分?jǐn)?shù)是單一的、含混的、隨機(jī)的,這就導(dǎo)致不能有效地誤差分?jǐn)?shù)是單一的、含混的、隨機(jī)的,這就導(dǎo)致不能有效地解釋影響人的心理活動(dòng)因素的多樣性,從而在實(shí)踐上對(duì)控制解釋影響人的心理活動(dòng)因素的多樣性,從而在實(shí)踐上對(duì)控制誤差缺乏有效指導(dǎo)。誤差缺乏有效指導(dǎo)。GTGT采用方差分析方法,充分考慮了影

12、響采用方差分析方法,充分考慮了影響分?jǐn)?shù)的所有誤差來源,并進(jìn)一步提出絕對(duì)誤差和相對(duì)誤差的分?jǐn)?shù)的所有誤差來源,并進(jìn)一步提出絕對(duì)誤差和相對(duì)誤差的劃分及其對(duì)絕對(duì)誤差和相對(duì)誤差的度量。劃分及其對(duì)絕對(duì)誤差和相對(duì)誤差的度量。2022-4-11(3 3) CTT CTT主要關(guān)注的是個(gè)體之間的差異,而主要關(guān)注的是個(gè)體之間的差異,而GTGT除除了個(gè)體之間的差異以外,還關(guān)注個(gè)體的絕對(duì)水平。了個(gè)體之間的差異以外,還關(guān)注個(gè)體的絕對(duì)水平。(4 4)在)在CTTCTT中,測量誤差的估計(jì)方法導(dǎo)致同一個(gè)測中,測量誤差的估計(jì)方法導(dǎo)致同一個(gè)測量量表往往表現(xiàn)出多種測量信度并存現(xiàn)象,如重量量表往往表現(xiàn)出多種測量信度并存現(xiàn)象,如重測信度

13、、復(fù)本信度、同質(zhì)信度等,這些信度系數(shù)測信度、復(fù)本信度、同質(zhì)信度等,這些信度系數(shù)之間沒有必然的內(nèi)在關(guān)系。而之間沒有必然的內(nèi)在關(guān)系。而GTGT則采用具有內(nèi)在則采用具有內(nèi)在邏輯關(guān)系的概化系數(shù)、可靠性系數(shù)或信噪比等指邏輯關(guān)系的概化系數(shù)、可靠性系數(shù)或信噪比等指數(shù)來反映各種因素可能對(duì)測驗(yàn)分?jǐn)?shù)的影響程度。數(shù)來反映各種因素可能對(duì)測驗(yàn)分?jǐn)?shù)的影響程度。2022-4-11盡管盡管CTTCTT和和GTGT之間存在著基礎(chǔ)性差異,但是在之間存在著基礎(chǔ)性差異,但是在某種程度上,某種程度上,GTGT仍然可以看做是通過應(yīng)用適當(dāng)仍然可以看做是通過應(yīng)用適當(dāng)?shù)姆讲罘治龅姆讲罘治鯝NOVAANOVA程序?qū)Τ绦驅(qū)TTCTT的一種拓展。

14、的一種拓展。由于統(tǒng)計(jì)計(jì)算相當(dāng)繁雜,前在我國還處于實(shí)驗(yàn)由于統(tǒng)計(jì)計(jì)算相當(dāng)繁雜,前在我國還處于實(shí)驗(yàn)研究階段,在面試、考核等主觀性測評(píng)中有一研究階段,在面試、考核等主觀性測評(píng)中有一些應(yīng)用。些應(yīng)用。項(xiàng)目反應(yīng)理論(item response theory,IRT)2022-4-11無論是CTT還是GT,其測驗(yàn)內(nèi)容的選擇、項(xiàng)目參數(shù)的獲得和常模的制定,都是通過抽取一定的樣本(行為樣本或被試樣本)實(shí)現(xiàn),二者都建立在隨機(jī)抽樣理論基礎(chǔ)之上。它們的局限性主要表現(xiàn)在以下四個(gè)方面:(1 1)測量結(jié)果的應(yīng)用范圍有限。)測量結(jié)果的應(yīng)用范圍有限。(2 2)測量分?jǐn)?shù)賴性于具體的測驗(yàn)(內(nèi)容)。)測量分?jǐn)?shù)賴性于具體的測驗(yàn)(內(nèi)容)。(

15、3 3)測量參數(shù)依賴于被試樣本。)測量參數(shù)依賴于被試樣本。(4 4)信度估計(jì)的精確性不高。)信度估計(jì)的精確性不高。2022-4-11 項(xiàng)目反應(yīng)理論也稱項(xiàng)目特征曲線理論或潛在特質(zhì)理論,它是依據(jù)一定的數(shù)學(xué)模型,用項(xiàng)目特征參數(shù)估計(jì)潛在特質(zhì)的一種測量理論。該理論中最重要的兩個(gè)基本概念是“潛在特質(zhì)”和“項(xiàng)目特征曲線”。項(xiàng)目反應(yīng)理論的基本假設(shè)項(xiàng)目反應(yīng)理論的基本假設(shè)17(一)潛在特質(zhì)空間假說(一)潛在特質(zhì)空間假說潛在特質(zhì)空間是指由心理學(xué)中的潛在特質(zhì)組潛在特質(zhì)空間是指由心理學(xué)中的潛在特質(zhì)組成的抽象空間。如果考生在測驗(yàn)項(xiàng)目上的反應(yīng)成的抽象空間。如果考生在測驗(yàn)項(xiàng)目上的反應(yīng)是有是有K K種潛在特質(zhì)所決定的,那么這些

16、潛在特種潛在特質(zhì)所決定的,那么這些潛在特征就定義了一個(gè)征就定義了一個(gè)K K維潛在空間,考生的各個(gè)潛維潛在空間,考生的各個(gè)潛在特質(zhì)分?jǐn)?shù)綜合起來,就決定了該考生在該潛在特質(zhì)分?jǐn)?shù)綜合起來,就決定了該考生在該潛在空間的位置。如果影響考生測驗(yàn)分?jǐn)?shù)的所有在空間的位置。如果影響考生測驗(yàn)分?jǐn)?shù)的所有重要的心理特質(zhì)都被確定了,那么該潛在空間重要的心理特質(zhì)都被確定了,那么該潛在空間就稱為完全潛在空間。就稱為完全潛在空間。 2022-4-11目前比較成熟的大多數(shù)項(xiàng)目反應(yīng)模型都假設(shè)完全目前比較成熟的大多數(shù)項(xiàng)目反應(yīng)模型都假設(shè)完全潛在空間是單維的,即只有一種潛在特質(zhì)決定了潛在空間是單維的,即只有一種潛在特質(zhì)決定了考生對(duì)項(xiàng)目

17、的反應(yīng),也就是說組成某個(gè)測驗(yàn)的所考生對(duì)項(xiàng)目的反應(yīng),也就是說組成某個(gè)測驗(yàn)的所有項(xiàng)目都是測量的同一個(gè)心理變量。有項(xiàng)目都是測量的同一個(gè)心理變量。單維單維項(xiàng)目反應(yīng)理論項(xiàng)目反應(yīng)理論多維目反應(yīng)理論多維目反應(yīng)理論(二)局部獨(dú)立性假設(shè)(二)局部獨(dú)立性假設(shè)2022-4-11指某個(gè)考生對(duì)于某個(gè)項(xiàng)目的正確概率不會(huì)受到他對(duì)于指某個(gè)考生對(duì)于某個(gè)項(xiàng)目的正確概率不會(huì)受到他對(duì)于該測驗(yàn)中其他項(xiàng)目反應(yīng)的影響,也就是說只有考生的該測驗(yàn)中其他項(xiàng)目反應(yīng)的影響,也就是說只有考生的特質(zhì)水平和項(xiàng)目的特性會(huì)影響到考生對(duì)該項(xiàng)目的反應(yīng)。特質(zhì)水平和項(xiàng)目的特性會(huì)影響到考生對(duì)該項(xiàng)目的反應(yīng)。在實(shí)際的教育和心理測量問題中在實(shí)際的教育和心理測量問題中, ,

18、如果前一個(gè)項(xiàng)目的如果前一個(gè)項(xiàng)目的內(nèi)容為后一個(gè)項(xiàng)目的正確反應(yīng)提供暗示或其它有效的內(nèi)容為后一個(gè)項(xiàng)目的正確反應(yīng)提供暗示或其它有效的信息信息, , 局部獨(dú)立性的假設(shè)就會(huì)遭到破壞局部獨(dú)立性的假設(shè)就會(huì)遭到破壞, , 例如所謂的例如所謂的鏈狀試題就會(huì)出現(xiàn)這種情況。鏈狀試題就會(huì)出現(xiàn)這種情況。局部獨(dú)立性是建立在統(tǒng)計(jì)的意義上的,對(duì)每一個(gè)測驗(yàn)局部獨(dú)立性是建立在統(tǒng)計(jì)的意義上的,對(duì)每一個(gè)測驗(yàn)者來說者來說, , 對(duì)整個(gè)試題作出某種反應(yīng)的概率等于對(duì)組成對(duì)整個(gè)試題作出某種反應(yīng)的概率等于對(duì)組成試卷的每個(gè)項(xiàng)目的反應(yīng)的概率的乘積。試卷的每個(gè)項(xiàng)目的反應(yīng)的概率的乘積。(三)項(xiàng)目特征曲線假設(shè)(三)項(xiàng)目特征曲線假設(shè)2022-4-11項(xiàng)目反

19、應(yīng)理論的一個(gè)關(guān)鍵就是在被試者對(duì)項(xiàng)目作出項(xiàng)目反應(yīng)理論的一個(gè)關(guān)鍵就是在被試者對(duì)項(xiàng)目作出的反應(yīng)或作出反應(yīng)的概率與被測試者的潛在特質(zhì)之的反應(yīng)或作出反應(yīng)的概率與被測試者的潛在特質(zhì)之間建立某種函數(shù)關(guān)系。所謂的項(xiàng)目特征曲線間建立某種函數(shù)關(guān)系。所謂的項(xiàng)目特征曲線(item charecteristic curve, ICC), , 就是相應(yīng)函數(shù)關(guān)系的圖象。就是相應(yīng)函數(shù)關(guān)系的圖象。項(xiàng)目反應(yīng)理論之所以要作出項(xiàng)目特征曲線形式的假項(xiàng)目反應(yīng)理論之所以要作出項(xiàng)目特征曲線形式的假設(shè)設(shè), , 是因?yàn)轫?xiàng)目反應(yīng)理論的建立不是首先從理論上是因?yàn)轫?xiàng)目反應(yīng)理論的建立不是首先從理論上推導(dǎo)出函數(shù)關(guān)系的存在推導(dǎo)出函數(shù)關(guān)系的存在, , 而是先

20、假定有某種形式的而是先假定有某種形式的項(xiàng)目特征曲線項(xiàng)目特征曲線, , 然后找出滿足相應(yīng)曲線的函數(shù)形式。然后找出滿足相應(yīng)曲線的函數(shù)形式。所以所以, , 關(guān)于項(xiàng)目特征曲線的特征形式的假設(shè)實(shí)際上關(guān)于項(xiàng)目特征曲線的特征形式的假設(shè)實(shí)際上就是對(duì)未來函數(shù)關(guān)系的假設(shè)。就是對(duì)未來函數(shù)關(guān)系的假設(shè)。項(xiàng)目特征曲線有項(xiàng)目特征曲線有3 3個(gè)特點(diǎn):個(gè)特點(diǎn):2022-4-111.1.人的潛在特質(zhì)量表應(yīng)定義在正負(fù)無窮的區(qū)域內(nèi);人的潛在特質(zhì)量表應(yīng)定義在正負(fù)無窮的區(qū)域內(nèi);2.2.被試在項(xiàng)目上正確作答的概率被試在項(xiàng)目上正確作答的概率P P()取值在)取值在0,10,1區(qū)間之內(nèi);區(qū)間之內(nèi);3.3.若題目質(zhì)量好,則被試的正確作答率應(yīng)隨被

21、試若題目質(zhì)量好,則被試的正確作答率應(yīng)隨被試的特質(zhì)水平的提高而提高,項(xiàng)目特征曲線應(yīng)是的特質(zhì)水平的提高而提高,項(xiàng)目特征曲線應(yīng)是一條從負(fù)無窮到正無窮的遞增曲線。一條從負(fù)無窮到正無窮的遞增曲線。三、項(xiàng)目反應(yīng)模型三、項(xiàng)目反應(yīng)模型2022-4-11IRTIRT 模型是一種數(shù)學(xué)模型模型是一種數(shù)學(xué)模型, 它的特點(diǎn)是以概率的概它的特點(diǎn)是以概率的概念來解釋應(yīng)試者對(duì)試題的反應(yīng)和其潛在能力特質(zhì)之念來解釋應(yīng)試者對(duì)試題的反應(yīng)和其潛在能力特質(zhì)之間的關(guān)系。間的關(guān)系。IRTIRT 的模型有的模型有2020余種余種, 但比較常用的有但比較常用的有洛德提出的著名的正態(tài)卵形模型和伯恩鮑姆提出的洛德提出的著名的正態(tài)卵形模型和伯恩鮑姆提

22、出的邏輯斯蒂模型邏輯斯蒂模型( Logistic( Logistic模型模型) )。這兩種函數(shù)模型在計(jì)算結(jié)果上并無大的區(qū)別這兩種函數(shù)模型在計(jì)算結(jié)果上并無大的區(qū)別, 所繪所繪制的曲線也大體相同制的曲線也大體相同, 然而然而, 在實(shí)際中大多采用后在實(shí)際中大多采用后者。其中主要有以下兩個(gè)方面的原因:首先是它形者。其中主要有以下兩個(gè)方面的原因:首先是它形式上的簡潔式上的簡潔, 更具數(shù)學(xué)模型的特點(diǎn);更具數(shù)學(xué)模型的特點(diǎn); 其次是它便于其次是它便于用對(duì)數(shù)關(guān)系作處理用對(duì)數(shù)關(guān)系作處理, 因而模型的項(xiàng)目質(zhì)量參數(shù)和能因而模型的項(xiàng)目質(zhì)量參數(shù)和能力參數(shù)估計(jì)起來較為方便。力參數(shù)估計(jì)起來較為方便。邏輯斯蒂模型( Logis

23、tic模型)2022-4-11由于Logistic 模型相對(duì)比較簡單, 準(zhǔn)確性較高,計(jì)算量較其他模型小, 因此在建立自適應(yīng)考試系統(tǒng)時(shí), 常采用Logistic 模型。由于參數(shù)的不同, 分為單參數(shù)、雙參數(shù)和三參數(shù),其中以三參數(shù)的Logistic模型最為常用, 由于計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展, 對(duì)考試的準(zhǔn)確性的要求也越來越高, 對(duì)三參數(shù)的Logistic 模型的研究也比較成熟, 現(xiàn)在逐步趨向使用三參數(shù)模型。()1( )1iiiiiDabcPce 式中 表示能力為的被試在項(xiàng)目上正確作答的概率; 表示被試的能力; 表示項(xiàng)目 的難度參數(shù); 表示自然對(duì)數(shù)之底=2.71828; D表示量表因字常數(shù)=1.7; 表

24、示項(xiàng)目 的區(qū)分度參數(shù); 表示項(xiàng)目 的偽隨機(jī)水平參數(shù),習(xí)慣稱猜測參數(shù)。 ( )iPibieiaiici()1( )1iiDbPe()1( )1iiiDabPe2022-4-11項(xiàng)目反應(yīng)理論的優(yōu)點(diǎn):項(xiàng)目反應(yīng)理論的優(yōu)點(diǎn):2022-4-11( )特質(zhì)水平的估計(jì)可以從任何一組項(xiàng)目屬性已知的項(xiàng)目中得出。( )項(xiàng)目屬性直接與測驗(yàn)行為聯(lián)系在一起。( )自變量,即特質(zhì)水平和項(xiàng)目屬性,可以不借助額外數(shù)據(jù)而分別估計(jì)。四、項(xiàng)目反應(yīng)理論的應(yīng)用四、項(xiàng)目反應(yīng)理論的應(yīng)用- -計(jì)算機(jī)自適應(yīng)測驗(yàn)計(jì)算機(jī)自適應(yīng)測驗(yàn)2022-4-11computerized adaptive testingcomputerized adaptive testing(CATCAT)是建立在項(xiàng)目反應(yīng)理)是建立在項(xiàng)目反應(yīng)理論基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論