版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
項(xiàng)目反應(yīng)理論簡介華東師范大學(xué)心理系文劍冰項(xiàng)目反應(yīng)理論簡介華東師范大學(xué)心理系1經(jīng)典測量理論(CTT)經(jīng)典測量理論的假設(shè)X=T+E經(jīng)典測量理論的信度經(jīng)典測量理論的效度經(jīng)典測量理論的試題參數(shù)經(jīng)典測量理論的測驗(yàn)編制經(jīng)典測量理論(CTT)經(jīng)典測量理論的假設(shè)2經(jīng)典測量理論的假設(shè)觀察分?jǐn)?shù)=真分?jǐn)?shù)+誤差分?jǐn)?shù)X=T+E觀察分?jǐn)?shù)與誤差分?jǐn)?shù)之間互相獨(dú)立誤差分?jǐn)?shù)的平均數(shù)為0多次測量的誤差分?jǐn)?shù)之間相關(guān)為0經(jīng)典測量理論的假設(shè)觀察分?jǐn)?shù)=真分?jǐn)?shù)+誤差分?jǐn)?shù)3經(jīng)典測量理論的信度信度的概念“真實(shí)分?jǐn)?shù)方差在觀測分?jǐn)?shù)方差中所占的比率”信度系數(shù)的估計方法重測信度(穩(wěn)定性系數(shù))復(fù)本信度(等值性系數(shù))內(nèi)部一致性信度評分者信度信度系數(shù)的應(yīng)用經(jīng)典測量理論的信度信度的概念4經(jīng)典測量理論的試題參數(shù)難度指標(biāo)(通過率或得分率P值)區(qū)分度指標(biāo)(鑒別力指數(shù)D或相關(guān)系數(shù)r)D=PH-PL經(jīng)典測量理論的試題參數(shù)難度指標(biāo)(通過率或得分率P值)5經(jīng)典測量理論的測驗(yàn)編制假設(shè)被試的特質(zhì)是正態(tài)分布,從而測驗(yàn)總分的分布也是正態(tài)測驗(yàn)分?jǐn)?shù)盡可能區(qū)分被試,因此測驗(yàn)總分的變異程度越大越好測驗(yàn)中試題的難度中等為好,區(qū)分度越大越好經(jīng)典測量理論的測驗(yàn)編制假設(shè)被試的特質(zhì)是正態(tài)分布,從而測驗(yàn)總分6經(jīng)典測量理論的缺陷參數(shù)依賴于樣本能力量表與難度量表不統(tǒng)一對于所有被試的測量誤差相等無法反應(yīng)潛在特質(zhì)與被試作答之間的關(guān)系在測驗(yàn)編制問題上的困惑經(jīng)典測量理論的缺陷參數(shù)依賴于樣本7準(zhǔn)備知識標(biāo)準(zhǔn)分?jǐn)?shù)Z>0,高于平均,Z<0,低于平均P(-1.96<Z<1.96)=0.950P(-3<Z<3)=0.997準(zhǔn)備知識標(biāo)準(zhǔn)分?jǐn)?shù)8A11101000116B01011110106C10101101117D11100000014E11110110107F11000010115G11101100117H01111011118I10001001104J01100010014總7873645387A11101000116B01011110106C101019項(xiàng)目反應(yīng)理論(IRT)項(xiàng)目反應(yīng)理論(ItemResponseTheory)三個理論假設(shè)單維性假設(shè)局部獨(dú)立性假設(shè)項(xiàng)目反應(yīng)模型(項(xiàng)目特征函數(shù))
項(xiàng)目反應(yīng)理論(IRT)項(xiàng)目反應(yīng)理論10項(xiàng)目反應(yīng)模型單參數(shù)模型(Rasch模型)雙參數(shù)模型三參數(shù)模型項(xiàng)目反應(yīng)模型單參數(shù)模型(Rasch模型)11項(xiàng)目反應(yīng)模型的參數(shù)單參數(shù)模型雙參數(shù)模型三參數(shù)模型項(xiàng)目反應(yīng)模型的參數(shù)單參數(shù)模型雙參數(shù)模型12參數(shù)的含義(a)參數(shù)的含義(a)13參數(shù)的含義(a)參數(shù)的含義(a)14參數(shù)的含義(b)參數(shù)的含義(b)15參數(shù)的含義(b)參數(shù)的含義(b)16參數(shù)的含義(c)極低能力被試答對的概率為0c=0參數(shù)的含義(c)極低能力被試答對的概率為017參數(shù)的含義(c)低能力被試可能答對的可能性不為0C=0.2參數(shù)的含義(c)低能力被試18單參數(shù)模型單參數(shù)模型19雙參數(shù)模型雙參數(shù)模型20三參數(shù)模型三參數(shù)模型21項(xiàng)目反應(yīng)模型參數(shù)的估計試題試題參數(shù)考生對試題的回答abc1234511.000.250.101100020.501.320.101001031.601.250.1010110項(xiàng)目反應(yīng)模型參數(shù)的估計試題試題參數(shù)考生對試題的回答abc1222項(xiàng)目反應(yīng)模型參數(shù)的估計反應(yīng)模式(110)的概率:L=P1P2Q3極大似然估計和貝葉斯估計(聯(lián)合后驗(yàn)分布的眾數(shù))試題試題參數(shù)考生能力abc0.501.001.5011.000.250.10似然函數(shù)值20.501.320.100.2050.2350.15031.601.250.10項(xiàng)目反應(yīng)模型參數(shù)的估計反應(yīng)模式(110)的概率:試題試題參數(shù)23對θ=0.5時似然函數(shù)的計算對θ=0.5時似然函數(shù)的計算24能力參數(shù)的估計方法極大似然法(ML)使已知反應(yīng)模式的似然函數(shù)值達(dá)到最大MAP(MaximumaPosteriori)使后驗(yàn)概率函數(shù)值達(dá)到最大EAP(ExpectedaPosteriori)后驗(yàn)概率函數(shù)值的平均數(shù)能力參數(shù)的估計方法極大似然法(ML)25估計項(xiàng)目參數(shù)的方法聯(lián)合極大似然估計法(JMLE)邊際極大似然估計法(MMLE)條件極大似然估計法(CMLE)聯(lián)合估計時標(biāo)尺的建立(通常設(shè)能力均數(shù)為0)P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2)=P(2;2.0,1.35,0.2)估計項(xiàng)目參數(shù)的方法聯(lián)合極大似然估計法(JMLE)26參數(shù)估計時標(biāo)尺的建立P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2)=P(2;2.0,-0.15,0.2)通常將被試能力平均值設(shè)定為0參數(shù)估計時標(biāo)尺的建立P(0.5;1.0,-0.8,0.2)=27信息函數(shù)試題信息函數(shù)測驗(yàn)信息函數(shù)(試題信息函數(shù)之和)信息函數(shù)試題信息函數(shù)28信息函數(shù)(例)試題試題參數(shù)abc11.801.000.0020.801.000.0031.801.000.2541.80-1.500.0051.20-0.500.1060.400.500.15信息函數(shù)(例)試題試題參數(shù)abc11.801.000.00229信息函數(shù)的性質(zhì)同一試題信息函數(shù)隨著所測被試能力的不同而不同;同時試題信息函數(shù)受試題自身特征的影響。a,b相同的試題,c值大的信息量小。a值大的試題,只是在較窄的區(qū)間內(nèi)提供的信息量多,a值小的試題,對能力的估計提供幫助不大,但是廣泛地分布在較寬區(qū)間試題提供信息量最大的位置,是在接近試題難度(比難度稍大)之處信息函數(shù)的性質(zhì)同一試題信息函數(shù)隨著所測被試能力的不同而不同;30模型-資料的擬合度檢驗(yàn)卡方檢驗(yàn)將被試按能力分組,模型-資料的擬合度檢驗(yàn)卡方檢驗(yàn)31項(xiàng)目反應(yīng)理論的特點(diǎn)與優(yōu)點(diǎn)非線性、非確定性的模型參數(shù)獨(dú)立于所使用的樣本試題難度與被試能力的統(tǒng)一對于不同能力的被試測量誤差也不同提出測驗(yàn)編制的指導(dǎo)原則項(xiàng)目反應(yīng)理論的特點(diǎn)與優(yōu)點(diǎn)非線性、非確定性的模型32IRT的其他模型單維多等級模型等級反應(yīng)模型(GRM)分部評分模型(PCM)多維模型能力有不同的維度,試題的區(qū)分度(/難度),在相應(yīng)的維度上的取值不同IRT的其他模型單維多等級模型33項(xiàng)目反應(yīng)理論的應(yīng)用測驗(yàn)編制計算機(jī)化自適應(yīng)測驗(yàn)測驗(yàn)等值測驗(yàn)偏差項(xiàng)目反應(yīng)理論的應(yīng)用測驗(yàn)編制34測驗(yàn)偏差測驗(yàn)偏差(Bias)或項(xiàng)目功能差異(DifferentialItemFunctioning,DIF)來自不同族群的能力相同被試,在試題上答對的概率不同,則說存在項(xiàng)目功能差異測驗(yàn)偏差測驗(yàn)偏差(Bias)或項(xiàng)目功能差異(Differen35項(xiàng)目偏差與項(xiàng)目功能差異項(xiàng)目偏差(itembias):如果來自不同團(tuán)體的具有相同能力的個體對某題正確回答的概率不同,那么這道題就存在偏差。但是“偏差”一詞常用于社會學(xué)中,且?guī)в信袛嗪驮u價含義,把“偏差”這詞語應(yīng)用于統(tǒng)計學(xué)中不適合。項(xiàng)目功能差異(DifferentialItemFunctioning)指的是在控制團(tuán)體能力之后,一個項(xiàng)目在不同團(tuán)體中顯示的不同統(tǒng)計特性。項(xiàng)目影響(itemimpact)是指目標(biāo)組與參照組在某題上的差異真的是由于兩者在測驗(yàn)所測的能力上有差異。項(xiàng)目偏差與項(xiàng)目功能差異項(xiàng)目偏差(itembias):如36非一致性DIF非一致性DIF37一致性DIF一致性DIF38項(xiàng)目反應(yīng)理論的常用軟件BILOG二級記分,單參,雙參,三參模型MULTILOG多級記分,GRM,PARSCALE多級記分,GRM,PCM,GPCM項(xiàng)目反應(yīng)理論的常用軟件BILOG39BILOG-MG的使用BILOG-MG的使用40數(shù)據(jù)的準(zhǔn)備數(shù)據(jù)文件是ASCII碼的文本文件至少包含ID和答題情況數(shù)據(jù)的準(zhǔn)備數(shù)據(jù)文件是ASCII碼的文本文件41BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;TitlelineBILOG程序文件(*.BLM)IRTcalibrat42BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;數(shù)據(jù)文件名個人ID位數(shù)模型參數(shù)個數(shù)保存外部文件BILOG程序文件(*.BLM)IRTcalibrat43BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;保存試題參數(shù),被試參數(shù),CTT結(jié)果,測驗(yàn)信息函數(shù)BILOG程序文件(*.BLM)IRTcalibrat44BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;(分)測驗(yàn)題數(shù)BILOG程序文件(*.BLM)IRTcalibrat45BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;omit文件名總題數(shù)選項(xiàng)個數(shù)標(biāo)準(zhǔn)答案文件名BILOG程序文件(*.BLM)IRTcalibrat46BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;FORTRAN語言讀數(shù)據(jù)的格式A,X,T,I,/BILOG程序文件(*.BLM)IRTcalibrat47BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;試題參數(shù)估計時的設(shè)定畫出擬合度差(p<=指定數(shù)值)的試題BILOG程序文件(*.BLM)IRTcalibrat48BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;被試能力估計時的設(shè)定1-ML2-EAP(缺省)3-MAP0-不做重新標(biāo)刻(缺省)1-按scale和location線性變換3-按樣本的L和S重新標(biāo)刻3-EAP時潛變量以L為均數(shù)S為標(biāo)準(zhǔn)差測驗(yàn)信息曲線BILOG程序文件(*.BLM)IRTcalibrat49BILOG結(jié)果文件(*.PH1)
ITEMSTATISTICSFORSUBTESTTEST0001ITEM*TESTCORRELATIONITEMNAME#TRIED#RIGHTPCTLOGITPEARSONBISERIAL-------------------------------------------------------------------------1ITEM0001480.0395.082.3-1.540.3180.4682ITEM0002480.0357.074.4-1.070.3060.4153ITEM0003480.0444.092.5-2.510.2520.4694ITEM0004480.0321.066.9-0.700.4680.6085ITEM0005480.0292.060.8-0.440.1190.1516ITEM0006480.0265.055.2-0.210.1620.2047ITEM0007480.0315.065.6-0.650.2880.3728ITEM0008480.0247.051.5-0.060.3910.4909ITEM0009480.0178.037.10.530.1280.16310ITEM0010480.0253.052.7-0.110.4060.509CTT的試題參數(shù)Ln[(1-p)/p]BILOG結(jié)果文件(*.PH1)ITEMSTATIS50BILOG結(jié)果文件(*.PH2)
CYCLE15;LARGESTCHANGE=0.00007
SUBTESTTEST0001;ITEMPARAMETERSAFTERCYCLE15ITEMINTERCEPTSLOPETHRESHOLDLOADINGASYMPTOTECHISQDFS.E.S.E.S.E.S.E.S.E.(PROB)-------------------------------------------------------------------------------ITEM0001|1.785|0.922|-1.936|0.678|0.000|2.28.0|0.147*|0.146*|0.265*|0.107*|0.000*|(0.9758)||||||ITEM0002|1.214|0.816|-1.487|0.632|0.000|3.49.0|0.118*|0.124*|0.224*|0.096*|0.000*|(0.9469)||||||
IRT的試題參數(shù)-Slope*thresholdSlope/sqrt(1+slope^2)BILOG結(jié)果文件(*.PH2)CYCLE151BILOG結(jié)果文件(*.PH3)
GROUPSUBJECTIDENTIFICATIONMARGINALWEIGHTTESTTRIEDRIGHTPERCENTABILITYS.E.PROB--------------------------------------------------------------------------111||1.00TEST0001804657.50|-0.45950.1175|0.00112||1.00TEST0001804657.50|-0.50950.2318|0.00113||1.00TEST0001802835.00|-1.77410.4445|0.00114||1.00TEST0001805872.50|-0.21570.3886|0.00
115||1.00TEST0001805771.25|0.03780.4430|0.00116||1.00TEST0001802025.00|-2.27540.2127|0.00117||1.00TEST0001806378.75|0.43640.1461|0.00118||1.00TEST0001806581.25|0.52050.2539|0.00被試的能力參數(shù)BILOG結(jié)果文件(*.PH3)GROUPSUB52試題參數(shù)文件(*.PAR)BILOG保存的外部文件試題參數(shù)文件(*.PAR)被試能力估計文件(*.SCO)數(shù)據(jù)格式與PH2和PH3文件中基本相同試題參數(shù)文件(*.PAR)BILOG保存的外部文件53項(xiàng)目反應(yīng)理論簡介華東師范大學(xué)心理系文劍冰項(xiàng)目反應(yīng)理論簡介華東師范大學(xué)心理系54經(jīng)典測量理論(CTT)經(jīng)典測量理論的假設(shè)X=T+E經(jīng)典測量理論的信度經(jīng)典測量理論的效度經(jīng)典測量理論的試題參數(shù)經(jīng)典測量理論的測驗(yàn)編制經(jīng)典測量理論(CTT)經(jīng)典測量理論的假設(shè)55經(jīng)典測量理論的假設(shè)觀察分?jǐn)?shù)=真分?jǐn)?shù)+誤差分?jǐn)?shù)X=T+E觀察分?jǐn)?shù)與誤差分?jǐn)?shù)之間互相獨(dú)立誤差分?jǐn)?shù)的平均數(shù)為0多次測量的誤差分?jǐn)?shù)之間相關(guān)為0經(jīng)典測量理論的假設(shè)觀察分?jǐn)?shù)=真分?jǐn)?shù)+誤差分?jǐn)?shù)56經(jīng)典測量理論的信度信度的概念“真實(shí)分?jǐn)?shù)方差在觀測分?jǐn)?shù)方差中所占的比率”信度系數(shù)的估計方法重測信度(穩(wěn)定性系數(shù))復(fù)本信度(等值性系數(shù))內(nèi)部一致性信度評分者信度信度系數(shù)的應(yīng)用經(jīng)典測量理論的信度信度的概念57經(jīng)典測量理論的試題參數(shù)難度指標(biāo)(通過率或得分率P值)區(qū)分度指標(biāo)(鑒別力指數(shù)D或相關(guān)系數(shù)r)D=PH-PL經(jīng)典測量理論的試題參數(shù)難度指標(biāo)(通過率或得分率P值)58經(jīng)典測量理論的測驗(yàn)編制假設(shè)被試的特質(zhì)是正態(tài)分布,從而測驗(yàn)總分的分布也是正態(tài)測驗(yàn)分?jǐn)?shù)盡可能區(qū)分被試,因此測驗(yàn)總分的變異程度越大越好測驗(yàn)中試題的難度中等為好,區(qū)分度越大越好經(jīng)典測量理論的測驗(yàn)編制假設(shè)被試的特質(zhì)是正態(tài)分布,從而測驗(yàn)總分59經(jīng)典測量理論的缺陷參數(shù)依賴于樣本能力量表與難度量表不統(tǒng)一對于所有被試的測量誤差相等無法反應(yīng)潛在特質(zhì)與被試作答之間的關(guān)系在測驗(yàn)編制問題上的困惑經(jīng)典測量理論的缺陷參數(shù)依賴于樣本60準(zhǔn)備知識標(biāo)準(zhǔn)分?jǐn)?shù)Z>0,高于平均,Z<0,低于平均P(-1.96<Z<1.96)=0.950P(-3<Z<3)=0.997準(zhǔn)備知識標(biāo)準(zhǔn)分?jǐn)?shù)61A11101000116B01011110106C10101101117D11100000014E11110110107F11000010115G11101100117H01111011118I10001001104J01100010014總7873645387A11101000116B01011110106C1010162項(xiàng)目反應(yīng)理論(IRT)項(xiàng)目反應(yīng)理論(ItemResponseTheory)三個理論假設(shè)單維性假設(shè)局部獨(dú)立性假設(shè)項(xiàng)目反應(yīng)模型(項(xiàng)目特征函數(shù))
項(xiàng)目反應(yīng)理論(IRT)項(xiàng)目反應(yīng)理論63項(xiàng)目反應(yīng)模型單參數(shù)模型(Rasch模型)雙參數(shù)模型三參數(shù)模型項(xiàng)目反應(yīng)模型單參數(shù)模型(Rasch模型)64項(xiàng)目反應(yīng)模型的參數(shù)單參數(shù)模型雙參數(shù)模型三參數(shù)模型項(xiàng)目反應(yīng)模型的參數(shù)單參數(shù)模型雙參數(shù)模型65參數(shù)的含義(a)參數(shù)的含義(a)66參數(shù)的含義(a)參數(shù)的含義(a)67參數(shù)的含義(b)參數(shù)的含義(b)68參數(shù)的含義(b)參數(shù)的含義(b)69參數(shù)的含義(c)極低能力被試答對的概率為0c=0參數(shù)的含義(c)極低能力被試答對的概率為070參數(shù)的含義(c)低能力被試可能答對的可能性不為0C=0.2參數(shù)的含義(c)低能力被試71單參數(shù)模型單參數(shù)模型72雙參數(shù)模型雙參數(shù)模型73三參數(shù)模型三參數(shù)模型74項(xiàng)目反應(yīng)模型參數(shù)的估計試題試題參數(shù)考生對試題的回答abc1234511.000.250.101100020.501.320.101001031.601.250.1010110項(xiàng)目反應(yīng)模型參數(shù)的估計試題試題參數(shù)考生對試題的回答abc1275項(xiàng)目反應(yīng)模型參數(shù)的估計反應(yīng)模式(110)的概率:L=P1P2Q3極大似然估計和貝葉斯估計(聯(lián)合后驗(yàn)分布的眾數(shù))試題試題參數(shù)考生能力abc0.501.001.5011.000.250.10似然函數(shù)值20.501.320.100.2050.2350.15031.601.250.10項(xiàng)目反應(yīng)模型參數(shù)的估計反應(yīng)模式(110)的概率:試題試題參數(shù)76對θ=0.5時似然函數(shù)的計算對θ=0.5時似然函數(shù)的計算77能力參數(shù)的估計方法極大似然法(ML)使已知反應(yīng)模式的似然函數(shù)值達(dá)到最大MAP(MaximumaPosteriori)使后驗(yàn)概率函數(shù)值達(dá)到最大EAP(ExpectedaPosteriori)后驗(yàn)概率函數(shù)值的平均數(shù)能力參數(shù)的估計方法極大似然法(ML)78估計項(xiàng)目參數(shù)的方法聯(lián)合極大似然估計法(JMLE)邊際極大似然估計法(MMLE)條件極大似然估計法(CMLE)聯(lián)合估計時標(biāo)尺的建立(通常設(shè)能力均數(shù)為0)P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2)=P(2;2.0,1.35,0.2)估計項(xiàng)目參數(shù)的方法聯(lián)合極大似然估計法(JMLE)79參數(shù)估計時標(biāo)尺的建立P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2)=P(2;2.0,-0.15,0.2)通常將被試能力平均值設(shè)定為0參數(shù)估計時標(biāo)尺的建立P(0.5;1.0,-0.8,0.2)=80信息函數(shù)試題信息函數(shù)測驗(yàn)信息函數(shù)(試題信息函數(shù)之和)信息函數(shù)試題信息函數(shù)81信息函數(shù)(例)試題試題參數(shù)abc11.801.000.0020.801.000.0031.801.000.2541.80-1.500.0051.20-0.500.1060.400.500.15信息函數(shù)(例)試題試題參數(shù)abc11.801.000.00282信息函數(shù)的性質(zhì)同一試題信息函數(shù)隨著所測被試能力的不同而不同;同時試題信息函數(shù)受試題自身特征的影響。a,b相同的試題,c值大的信息量小。a值大的試題,只是在較窄的區(qū)間內(nèi)提供的信息量多,a值小的試題,對能力的估計提供幫助不大,但是廣泛地分布在較寬區(qū)間試題提供信息量最大的位置,是在接近試題難度(比難度稍大)之處信息函數(shù)的性質(zhì)同一試題信息函數(shù)隨著所測被試能力的不同而不同;83模型-資料的擬合度檢驗(yàn)卡方檢驗(yàn)將被試按能力分組,模型-資料的擬合度檢驗(yàn)卡方檢驗(yàn)84項(xiàng)目反應(yīng)理論的特點(diǎn)與優(yōu)點(diǎn)非線性、非確定性的模型參數(shù)獨(dú)立于所使用的樣本試題難度與被試能力的統(tǒng)一對于不同能力的被試測量誤差也不同提出測驗(yàn)編制的指導(dǎo)原則項(xiàng)目反應(yīng)理論的特點(diǎn)與優(yōu)點(diǎn)非線性、非確定性的模型85IRT的其他模型單維多等級模型等級反應(yīng)模型(GRM)分部評分模型(PCM)多維模型能力有不同的維度,試題的區(qū)分度(/難度),在相應(yīng)的維度上的取值不同IRT的其他模型單維多等級模型86項(xiàng)目反應(yīng)理論的應(yīng)用測驗(yàn)編制計算機(jī)化自適應(yīng)測驗(yàn)測驗(yàn)等值測驗(yàn)偏差項(xiàng)目反應(yīng)理論的應(yīng)用測驗(yàn)編制87測驗(yàn)偏差測驗(yàn)偏差(Bias)或項(xiàng)目功能差異(DifferentialItemFunctioning,DIF)來自不同族群的能力相同被試,在試題上答對的概率不同,則說存在項(xiàng)目功能差異測驗(yàn)偏差測驗(yàn)偏差(Bias)或項(xiàng)目功能差異(Differen88項(xiàng)目偏差與項(xiàng)目功能差異項(xiàng)目偏差(itembias):如果來自不同團(tuán)體的具有相同能力的個體對某題正確回答的概率不同,那么這道題就存在偏差。但是“偏差”一詞常用于社會學(xué)中,且?guī)в信袛嗪驮u價含義,把“偏差”這詞語應(yīng)用于統(tǒng)計學(xué)中不適合。項(xiàng)目功能差異(DifferentialItemFunctioning)指的是在控制團(tuán)體能力之后,一個項(xiàng)目在不同團(tuán)體中顯示的不同統(tǒng)計特性。項(xiàng)目影響(itemimpact)是指目標(biāo)組與參照組在某題上的差異真的是由于兩者在測驗(yàn)所測的能力上有差異。項(xiàng)目偏差與項(xiàng)目功能差異項(xiàng)目偏差(itembias):如89非一致性DIF非一致性DIF90一致性DIF一致性DIF91項(xiàng)目反應(yīng)理論的常用軟件BILOG二級記分,單參,雙參,三參模型MULTILOG多級記分,GRM,PARSCALE多級記分,GRM,PCM,GPCM項(xiàng)目反應(yīng)理論的常用軟件BILOG92BILOG-MG的使用BILOG-MG的使用93數(shù)據(jù)的準(zhǔn)備數(shù)據(jù)文件是ASCII碼的文本文件至少包含ID和答題情況數(shù)據(jù)的準(zhǔn)備數(shù)據(jù)文件是ASCII碼的文本文件94BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;TitlelineBILOG程序文件(*.BLM)IRTcalibrat95BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;數(shù)據(jù)文件名個人ID位數(shù)模型參數(shù)個數(shù)保存外部文件BILOG程序文件(*.BLM)IRTcalibrat96BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;保存試題參數(shù),被試參數(shù),CTT結(jié)果,測驗(yàn)信息函數(shù)BILOG程序文件(*.BLM)IRTcalibrat97BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;(分)測驗(yàn)題數(shù)BILOG程序文件(*.BLM)IRTcalibrat98BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;omit文件名總題數(shù)選項(xiàng)個數(shù)標(biāo)準(zhǔn)答案文件名BILOG程序文件(*.BLM)IRTcalibrat99BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;FORTRAN語言讀數(shù)據(jù)的格式A,X,T,I,/BILOG程序文件(*.BLM)IRTcalibrat100BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;試題參數(shù)估計時的設(shè)定畫出擬合度差(p<=指定數(shù)值)的試題BILOG程序文件(*.BLM)IRTcalibrat101BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;被試能力估計時的設(shè)定1-ML2-EAP(缺省)3-MAP0-不做重新標(biāo)刻(缺省)1-按scale和location線性變換3-按樣本的L和S重新標(biāo)刻3-EAP時潛變量以L為均數(shù)S為標(biāo)準(zhǔn)差測驗(yàn)信息曲線BILOG程序文件(*.BLM)IRTcalibrat102BILOG結(jié)果文件(*.PH1)
ITEMSTATISTICSFORSUBTESTTEST0001ITEM*TESTCORRELATIONITEMNAME#TRIED#RIGHTPCTLOGITPEARSONBISERIAL-------------------------------------------------------------------------1ITEM0001480.0395.082.3-1.540.3180.4682ITEM0002480.0357.074.4-1.070.3060.4153ITEM0003480.0444.092.5-2.510.2520.4694ITEM0004480.0321.066.9-0.700.4680.6085ITEM0005480.0292.060.8-0.440.1190.1516ITEM0006480.0265.055.2-0.210.1620.2047ITEM0007480.0315.065.6-0.650.2880.3728ITEM0008480.0247.051.5-0.060.3910.4909ITEM0009480.0178.037.10.530.1280.16310ITEM0010480.0253.052.7-0.110.4060.509CTT的試題參數(shù)Ln[(1-p)/p]BILOG結(jié)果文件(*.PH1)ITEMSTATIS103BILOG結(jié)果文件(*.PH2)
CYCLE15;LARGESTCHANGE=0.00007
SUBTESTTEST0001;ITEMPARAMETERSAFTERCYCLE15ITEMINTERCEPTSLOPETHRESHOLDLOADINGASYMPTOTECHISQDFS.E.S.E.S.E.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年簡化版協(xié)議授權(quán)委托書模板
- 2025年幼兒園戶外活動場地平整與設(shè)施安裝合同范本3篇
- 二零二五年度個人債務(wù)轉(zhuǎn)讓協(xié)議范本:債務(wù)清償與風(fēng)險防范3篇
- 2024版工作合同模板集錦
- 二零二五年度InvitrogenGeneArt生物試劑銷售代理合作協(xié)議2篇
- 2024年跨國界技術(shù)合作協(xié)議
- 2025年度白酒品牌加盟及產(chǎn)品回購保障合同3篇
- 二零二五年度健康扶貧捐贈協(xié)議書范本3篇
- 2025版美團(tuán)外賣配送員權(quán)益保障與培訓(xùn)服務(wù)協(xié)議3篇
- 2025年租賃型倉儲物流合同2篇
- 昆蟲的農(nóng)業(yè)和經(jīng)濟(jì)價值
- 天津市部分區(qū)2023-2024學(xué)年六年級上學(xué)期期末數(shù)學(xué)試卷
- 長期照護(hù)服務(wù)流程
- 精心打造東北大學(xué)近四年C語言理論考試試題及答案
- 醫(yī)院規(guī)劃發(fā)展部社會工作科職責(zé)
- 《Power Bi應(yīng)用》課程標(biāo)準(zhǔn)
- 《瘋狂動物城》全本臺詞中英文對照
- 幼兒園的品格與道德教育主題班會課件
- 2024抗菌藥物分級管理及臨床合理應(yīng)用考核試題及答案
- 儲能系統(tǒng)的應(yīng)急預(yù)案措施
- 論海瀾之家存貨管理的問題、成因及其對策
評論
0/150
提交評論