項目反應(yīng)理論簡介課件

上傳人：文*** IP屬地：貴州上傳時間：2023-01-04 格式：PPT 頁數(shù)：106 大?。?80.51KB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩101頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

項目反應(yīng)理論簡介華東師范大學(xué)心理系文劍冰項目反應(yīng)理論簡介華東師范大學(xué)心理系1經(jīng)典測量理論（CTT）經(jīng)典測量理論的假設(shè)X＝T＋E經(jīng)典測量理論的信度經(jīng)典測量理論的效度經(jīng)典測量理論的試題參數(shù)經(jīng)典測量理論的測驗編制經(jīng)典測量理論（CTT）經(jīng)典測量理論的假設(shè)2經(jīng)典測量理論的假設(shè)觀察分數(shù)＝真分數(shù)＋誤差分數(shù)X＝T＋E觀察分數(shù)與誤差分數(shù)之間互相獨立誤差分數(shù)的平均數(shù)為0多次測量的誤差分數(shù)之間相關(guān)為0經(jīng)典測量理論的假設(shè)觀察分數(shù)＝真分數(shù)＋誤差分數(shù)3經(jīng)典測量理論的信度信度的概念“真實分數(shù)方差在觀測分數(shù)方差中所占的比率”信度系數(shù)的估計方法重測信度（穩(wěn)定性系數(shù)）復(fù)本信度（等值性系數(shù)）內(nèi)部一致性信度評分者信度信度系數(shù)的應(yīng)用經(jīng)典測量理論的信度信度的概念4經(jīng)典測量理論的試題參數(shù)難度指標（通過率或得分率P值）區(qū)分度指標（鑒別力指數(shù)D或相關(guān)系數(shù)r）D＝PH－PL經(jīng)典測量理論的試題參數(shù)難度指標（通過率或得分率P值）5經(jīng)典測量理論的測驗編制假設(shè)被試的特質(zhì)是正態(tài)分布，從而測驗總分的分布也是正態(tài)測驗分數(shù)盡可能區(qū)分被試，因此測驗總分的變異程度越大越好測驗中試題的難度中等為好，區(qū)分度越大越好經(jīng)典測量理論的測驗編制假設(shè)被試的特質(zhì)是正態(tài)分布，從而測驗總分6經(jīng)典測量理論的缺陷參數(shù)依賴于樣本能力量表與難度量表不統(tǒng)一對于所有被試的測量誤差相等無法反應(yīng)潛在特質(zhì)與被試作答之間的關(guān)系在測驗編制問題上的困惑經(jīng)典測量理論的缺陷參數(shù)依賴于樣本7準備知識標準分數(shù)Z>0，高于平均，Z<0，低于平均P(-1.96<Z<1.96)=0.950P(-3<Z<3)=0.997準備知識標準分數(shù)8A11101000116B01011110106C10101101117D11100000014E11110110107F11000010115G11101100117H01111011118I10001001104J01100010014總7873645387A11101000116B01011110106C101019項目反應(yīng)理論（IRT）項目反應(yīng)理論（ItemResponseTheory）三個理論假設(shè)單維性假設(shè)局部獨立性假設(shè)項目反應(yīng)模型（項目特征函數(shù)）

項目反應(yīng)理論（IRT）項目反應(yīng)理論10項目反應(yīng)模型單參數(shù)模型（Rasch模型）雙參數(shù)模型三參數(shù)模型項目反應(yīng)模型單參數(shù)模型（Rasch模型）11項目反應(yīng)模型的參數(shù)單參數(shù)模型雙參數(shù)模型三參數(shù)模型項目反應(yīng)模型的參數(shù)單參數(shù)模型雙參數(shù)模型12參數(shù)的含義（a）參數(shù)的含義（a）13參數(shù)的含義（a）參數(shù)的含義（a）14參數(shù)的含義（b）參數(shù)的含義（b）15參數(shù)的含義（b）參數(shù)的含義（b）16參數(shù)的含義（c）極低能力被試答對的概率為0c=0參數(shù)的含義（c）極低能力被試答對的概率為017參數(shù)的含義（c）低能力被試可能答對的可能性不為0C=0.2參數(shù)的含義（c）低能力被試18單參數(shù)模型單參數(shù)模型19雙參數(shù)模型雙參數(shù)模型20三參數(shù)模型三參數(shù)模型21項目反應(yīng)模型參數(shù)的估計試題試題參數(shù)考生對試題的回答abc1234511.000.250.101100020.501.320.101001031.601.250.1010110項目反應(yīng)模型參數(shù)的估計試題試題參數(shù)考生對試題的回答abc1222項目反應(yīng)模型參數(shù)的估計反應(yīng)模式（110）的概率：L＝P1P2Q3極大似然估計和貝葉斯估計（聯(lián)合后驗分布的眾數(shù)）試題試題參數(shù)考生能力abc0.501.001.5011.000.250.10似然函數(shù)值20.501.320.100.2050.2350.15031.601.250.10項目反應(yīng)模型參數(shù)的估計反應(yīng)模式（110）的概率：試題試題參數(shù)23對θ=0.5時似然函數(shù)的計算對θ=0.5時似然函數(shù)的計算24能力參數(shù)的估計方法極大似然法（ML）使已知反應(yīng)模式的似然函數(shù)值達到最大MAP（MaximumaPosteriori）使后驗概率函數(shù)值達到最大EAP（ExpectedaPosteriori）后驗概率函數(shù)值的平均數(shù)能力參數(shù)的估計方法極大似然法（ML）25估計項目參數(shù)的方法聯(lián)合極大似然估計法（JMLE）邊際極大似然估計法（MMLE）條件極大似然估計法（CMLE）聯(lián)合估計時標尺的建立（通常設(shè)能力均數(shù)為0）P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2)=P(2;2.0,1.35,0.2)估計項目參數(shù)的方法聯(lián)合極大似然估計法（JMLE）26參數(shù)估計時標尺的建立P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2)=P(2;2.0,-0.15,0.2)通常將被試能力平均值設(shè)定為0參數(shù)估計時標尺的建立P(0.5;1.0,-0.8,0.2)=27信息函數(shù)試題信息函數(shù)測驗信息函數(shù)（試題信息函數(shù)之和）信息函數(shù)試題信息函數(shù)28信息函數(shù)（例）試題試題參數(shù)abc11.801.000.0020.801.000.0031.801.000.2541.80-1.500.0051.20-0.500.1060.400.500.15信息函數(shù)（例）試題試題參數(shù)abc11.801.000.00229信息函數(shù)的性質(zhì)同一試題信息函數(shù)隨著所測被試能力的不同而不同；同時試題信息函數(shù)受試題自身特征的影響。a,b相同的試題，c值大的信息量小。a值大的試題，只是在較窄的區(qū)間內(nèi)提供的信息量多，a值小的試題，對能力的估計提供幫助不大，但是廣泛地分布在較寬區(qū)間試題提供信息量最大的位置，是在接近試題難度（比難度稍大）之處信息函數(shù)的性質(zhì)同一試題信息函數(shù)隨著所測被試能力的不同而不同；30模型-資料的擬合度檢驗卡方檢驗將被試按能力分組，模型-資料的擬合度檢驗卡方檢驗31項目反應(yīng)理論的特點與優(yōu)點非線性、非確定性的模型參數(shù)獨立于所使用的樣本試題難度與被試能力的統(tǒng)一對于不同能力的被試測量誤差也不同提出測驗編制的指導(dǎo)原則項目反應(yīng)理論的特點與優(yōu)點非線性、非確定性的模型32IRT的其他模型單維多等級模型等級反應(yīng)模型（GRM）分部評分模型（PCM）多維模型能力有不同的維度，試題的區(qū)分度（/難度），在相應(yīng)的維度上的取值不同IRT的其他模型單維多等級模型33項目反應(yīng)理論的應(yīng)用測驗編制計算機化自適應(yīng)測驗測驗等值測驗偏差項目反應(yīng)理論的應(yīng)用測驗編制34測驗偏差測驗偏差（Bias）或項目功能差異（DifferentialItemFunctioning，DIF）來自不同族群的能力相同被試，在試題上答對的概率不同，則說存在項目功能差異測驗偏差測驗偏差（Bias）或項目功能差異（Differen35項目偏差與項目功能差異項目偏差（itembias）：如果來自不同團體的具有相同能力的個體對某題正確回答的概率不同，那么這道題就存在偏差。但是“偏差”一詞常用于社會學(xué)中，且?guī)в信袛嗪驮u價含義，把“偏差”這詞語應(yīng)用于統(tǒng)計學(xué)中不適合。項目功能差異（DifferentialItemFunctioning）指的是在控制團體能力之后，一個項目在不同團體中顯示的不同統(tǒng)計特性。項目影響（itemimpact）是指目標組與參照組在某題上的差異真的是由于兩者在測驗所測的能力上有差異。項目偏差與項目功能差異項目偏差（itembias）：如36非一致性DIF非一致性DIF37一致性DIF一致性DIF38項目反應(yīng)理論的常用軟件BILOG二級記分，單參，雙參，三參模型MULTILOG多級記分，GRM，PARSCALE多級記分，GRM，PCM，GPCM項目反應(yīng)理論的常用軟件BILOG39BILOG-MG的使用BILOG-MG的使用40數(shù)據(jù)的準備數(shù)據(jù)文件是ASCII碼的文本文件至少包含ID和答題情況數(shù)據(jù)的準備數(shù)據(jù)文件是ASCII碼的文本文件41BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;TitlelineBILOG程序文件(*.BLM)IRTcalibrat42BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;數(shù)據(jù)文件名個人ID位數(shù)模型參數(shù)個數(shù)保存外部文件BILOG程序文件(*.BLM)IRTcalibrat43BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;保存試題參數(shù)，被試參數(shù)，CTT結(jié)果，測驗信息函數(shù)BILOG程序文件(*.BLM)IRTcalibrat44BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;（分）測驗題數(shù)BILOG程序文件(*.BLM)IRTcalibrat45BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;omit文件名總題數(shù)選項個數(shù)標準答案文件名BILOG程序文件(*.BLM)IRTcalibrat46BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;FORTRAN語言讀數(shù)據(jù)的格式A,X,T,I,/BILOG程序文件(*.BLM)IRTcalibrat47BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;試題參數(shù)估計時的設(shè)定畫出擬合度差（p<=指定數(shù)值）的試題BILOG程序文件(*.BLM)IRTcalibrat48BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;被試能力估計時的設(shè)定1-ML2-EAP(缺省)3-MAP0-不做重新標刻(缺省)1-按scale和location線性變換3-按樣本的L和S重新標刻3-EAP時潛變量以L為均數(shù)S為標準差測驗信息曲線BILOG程序文件(*.BLM)IRTcalibrat49BILOG結(jié)果文件(*.PH1)

ITEMSTATISTICSFORSUBTESTTEST0001ITEM*TESTCORRELATIONITEMNAME#TRIED#RIGHTPCTLOGITPEARSONBISERIAL-------------------------------------------------------------------------1ITEM0001480.0395.082.3-1.540.3180.4682ITEM0002480.0357.074.4-1.070.3060.4153ITEM0003480.0444.092.5-2.510.2520.4694ITEM0004480.0321.066.9-0.700.4680.6085ITEM0005480.0292.060.8-0.440.1190.1516ITEM0006480.0265.055.2-0.210.1620.2047ITEM0007480.0315.065.6-0.650.2880.3728ITEM0008480.0247.051.5-0.060.3910.4909ITEM0009480.0178.037.10.530.1280.16310ITEM0010480.0253.052.7-0.110.4060.509CTT的試題參數(shù)Ln[(1-p)/p]BILOG結(jié)果文件(*.PH1)ITEMSTATIS50BILOG結(jié)果文件(*.PH2)

CYCLE15;LARGESTCHANGE=0.00007

SUBTESTTEST0001;ITEMPARAMETERSAFTERCYCLE15ITEMINTERCEPTSLOPETHRESHOLDLOADINGASYMPTOTECHISQDFS.E.S.E.S.E.S.E.S.E.(PROB)-------------------------------------------------------------------------------ITEM0001|1.785|0.922|-1.936|0.678|0.000|2.28.0|0.147*|0.146*|0.265*|0.107*|0.000*|(0.9758)||||||ITEM0002|1.214|0.816|-1.487|0.632|0.000|3.49.0|0.118*|0.124*|0.224*|0.096*|0.000*|(0.9469)||||||

IRT的試題參數(shù)-Slope*thresholdSlope/sqrt(1+slope^2)BILOG結(jié)果文件(*.PH2)CYCLE151BILOG結(jié)果文件(*.PH3)

GROUPSUBJECTIDENTIFICATIONMARGINALWEIGHTTESTTRIEDRIGHTPERCENTABILITYS.E.PROB--------------------------------------------------------------------------111||1.00TEST0001804657.50|-0.45950.1175|0.00112||1.00TEST0001804657.50|-0.50950.2318|0.00113||1.00TEST0001802835.00|-1.77410.4445|0.00114||1.00TEST0001805872.50|-0.21570.3886|0.00

115||1.00TEST0001805771.25|0.03780.4430|0.00116||1.00TEST0001802025.00|-2.27540.2127|0.00117||1.00TEST0001806378.75|0.43640.1461|0.00118||1.00TEST0001806581.25|0.52050.2539|0.00被試的能力參數(shù)BILOG結(jié)果文件(*.PH3)GROUPSUB52試題參數(shù)文件(*.PAR)BILOG保存的外部文件試題參數(shù)文件(*.PAR)被試能力估計文件(*.SCO)數(shù)據(jù)格式與PH2和PH3文件中基本相同試題參數(shù)文件(*.PAR)BILOG保存的外部文件53項目反應(yīng)理論簡介華東師范大學(xué)心理系文劍冰項目反應(yīng)理論簡介華東師范大學(xué)心理系54經(jīng)典測量理論（CTT）經(jīng)典測量理論的假設(shè)X＝T＋E經(jīng)典測量理論的信度經(jīng)典測量理論的效度經(jīng)典測量理論的試題參數(shù)經(jīng)典測量理論的測驗編制經(jīng)典測量理論（CTT）經(jīng)典測量理論的假設(shè)55經(jīng)典測量理論的假設(shè)觀察分數(shù)＝真分數(shù)＋誤差分數(shù)X＝T＋E觀察分數(shù)與誤差分數(shù)之間互相獨立誤差分數(shù)的平均數(shù)為0多次測量的誤差分數(shù)之間相關(guān)為0經(jīng)典測量理論的假設(shè)觀察分數(shù)＝真分數(shù)＋誤差分數(shù)56經(jīng)典測量理論的信度信度的概念“真實分數(shù)方差在觀測分數(shù)方差中所占的比率”信度系數(shù)的估計方法重測信度（穩(wěn)定性系數(shù)）復(fù)本信度（等值性系數(shù)）內(nèi)部一致性信度評分者信度信度系數(shù)的應(yīng)用經(jīng)典測量理論的信度信度的概念57經(jīng)典測量理論的試題參數(shù)難度指標（通過率或得分率P值）區(qū)分度指標（鑒別力指數(shù)D或相關(guān)系數(shù)r）D＝PH－PL經(jīng)典測量理論的試題參數(shù)難度指標（通過率或得分率P值）58經(jīng)典測量理論的測驗編制假設(shè)被試的特質(zhì)是正態(tài)分布，從而測驗總分的分布也是正態(tài)測驗分數(shù)盡可能區(qū)分被試，因此測驗總分的變異程度越大越好測驗中試題的難度中等為好，區(qū)分度越大越好經(jīng)典測量理論的測驗編制假設(shè)被試的特質(zhì)是正態(tài)分布，從而測驗總分59經(jīng)典測量理論的缺陷參數(shù)依賴于樣本能力量表與難度量表不統(tǒng)一對于所有被試的測量誤差相等無法反應(yīng)潛在特質(zhì)與被試作答之間的關(guān)系在測驗編制問題上的困惑經(jīng)典測量理論的缺陷參數(shù)依賴于樣本60準備知識標準分數(shù)Z>0，高于平均，Z<0，低于平均P(-1.96<Z<1.96)=0.950P(-3<Z<3)=0.997準備知識標準分數(shù)61A11101000116B01011110106C10101101117D11100000014E11110110107F11000010115G11101100117H01111011118I10001001104J01100010014總7873645387A11101000116B01011110106C1010162項目反應(yīng)理論（IRT）項目反應(yīng)理論（ItemResponseTheory）三個理論假設(shè)單維性假設(shè)局部獨立性假設(shè)項目反應(yīng)模型（項目特征函數(shù)）

項目反應(yīng)理論（IRT）項目反應(yīng)理論63項目反應(yīng)模型單參數(shù)模型（Rasch模型）雙參數(shù)模型三參數(shù)模型項目反應(yīng)模型單參數(shù)模型（Rasch模型）64項目反應(yīng)模型的參數(shù)單參數(shù)模型雙參數(shù)模型三參數(shù)模型項目反應(yīng)模型的參數(shù)單參數(shù)模型雙參數(shù)模型65參數(shù)的含義（a）參數(shù)的含義（a）66參數(shù)的含義（a）參數(shù)的含義（a）67參數(shù)的含義（b）參數(shù)的含義（b）68參數(shù)的含義（b）參數(shù)的含義（b）69參數(shù)的含義（c）極低能力被試答對的概率為0c=0參數(shù)的含義（c）極低能力被試答對的概率為070參數(shù)的含義（c）低能力被試可能答對的可能性不為0C=0.2參數(shù)的含義（c）低能力被試71單參數(shù)模型單參數(shù)模型72雙參數(shù)模型雙參數(shù)模型73三參數(shù)模型三參數(shù)模型74項目反應(yīng)模型參數(shù)的估計試題試題參數(shù)考生對試題的回答abc1234511.000.250.101100020.501.320.101001031.601.250.1010110項目反應(yīng)模型參數(shù)的估計試題試題參數(shù)考生對試題的回答abc1275項目反應(yīng)模型參數(shù)的估計反應(yīng)模式（110）的概率：L＝P1P2Q3極大似然估計和貝葉斯估計（聯(lián)合后驗分布的眾數(shù)）試題試題參數(shù)考生能力abc0.501.001.5011.000.250.10似然函數(shù)值20.501.320.100.2050.2350.15031.601.250.10項目反應(yīng)模型參數(shù)的估計反應(yīng)模式（110）的概率：試題試題參數(shù)76對θ=0.5時似然函數(shù)的計算對θ=0.5時似然函數(shù)的計算77能力參數(shù)的估計方法極大似然法（ML）使已知反應(yīng)模式的似然函數(shù)值達到最大MAP（MaximumaPosteriori）使后驗概率函數(shù)值達到最大EAP（ExpectedaPosteriori）后驗概率函數(shù)值的平均數(shù)能力參數(shù)的估計方法極大似然法（ML）78估計項目參數(shù)的方法聯(lián)合極大似然估計法（JMLE）邊際極大似然估計法（MMLE）條件極大似然估計法（CMLE）聯(lián)合估計時標尺的建立（通常設(shè)能力均數(shù)為0）P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2)=P(2;2.0,1.35,0.2)估計項目參數(shù)的方法聯(lián)合極大似然估計法（JMLE）79參數(shù)估計時標尺的建立P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2)=P(2;2.0,-0.15,0.2)通常將被試能力平均值設(shè)定為0參數(shù)估計時標尺的建立P(0.5;1.0,-0.8,0.2)=80信息函數(shù)試題信息函數(shù)測驗信息函數(shù)（試題信息函數(shù)之和）信息函數(shù)試題信息函數(shù)81信息函數(shù)（例）試題試題參數(shù)abc11.801.000.0020.801.000.0031.801.000.2541.80-1.500.0051.20-0.500.1060.400.500.15信息函數(shù)（例）試題試題參數(shù)abc11.801.000.00282信息函數(shù)的性質(zhì)同一試題信息函數(shù)隨著所測被試能力的不同而不同；同時試題信息函數(shù)受試題自身特征的影響。a,b相同的試題，c值大的信息量小。a值大的試題，只是在較窄的區(qū)間內(nèi)提供的信息量多，a值小的試題，對能力的估計提供幫助不大，但是廣泛地分布在較寬區(qū)間試題提供信息量最大的位置，是在接近試題難度（比難度稍大）之處信息函數(shù)的性質(zhì)同一試題信息函數(shù)隨著所測被試能力的不同而不同；83模型-資料的擬合度檢驗卡方檢驗將被試按能力分組，模型-資料的擬合度檢驗卡方檢驗84項目反應(yīng)理論的特點與優(yōu)點非線性、非確定性的模型參數(shù)獨立于所使用的樣本試題難度與被試能力的統(tǒng)一對于不同能力的被試測量誤差也不同提出測驗編制的指導(dǎo)原則項目反應(yīng)理論的特點與優(yōu)點非線性、非確定性的模型85IRT的其他模型單維多等級模型等級反應(yīng)模型（GRM）分部評分模型（PCM）多維模型能力有不同的維度，試題的區(qū)分度（/難度），在相應(yīng)的維度上的取值不同IRT的其他模型單維多等級模型86項目反應(yīng)理論的應(yīng)用測驗編制計算機化自適應(yīng)測驗測驗等值測驗偏差項目反應(yīng)理論的應(yīng)用測驗編制87測驗偏差測驗偏差（Bias）或項目功能差異（DifferentialItemFunctioning，DIF）來自不同族群的能力相同被試，在試題上答對的概率不同，則說存在項目功能差異測驗偏差測驗偏差（Bias）或項目功能差異（Differen88項目偏差與項目功能差異項目偏差（itembias）：如果來自不同團體的具有相同能力的個體對某題正確回答的概率不同，那么這道題就存在偏差。但是“偏差”一詞常用于社會學(xué)中，且?guī)в信袛嗪驮u價含義，把“偏差”這詞語應(yīng)用于統(tǒng)計學(xué)中不適合。項目功能差異（DifferentialItemFunctioning）指的是在控制團體能力之后，一個項目在不同團體中顯示的不同統(tǒng)計特性。項目影響（itemimpact）是指目標組與參照組在某題上的差異真的是由于兩者在測驗所測的能力上有差異。項目偏差與項目功能差異項目偏差（itembias）：如89非一致性DIF非一致性DIF90一致性DIF一致性DIF91項目反應(yīng)理論的常用軟件BILOG二級記分，單參，雙參，三參模型MULTILOG多級記分，GRM，PARSCALE多級記分，GRM，PCM，GPCM項目反應(yīng)理論的常用軟件BILOG92BILOG-MG的使用BILOG-MG的使用93數(shù)據(jù)的準備數(shù)據(jù)文件是ASCII碼的文本文件至少包含ID和答題情況數(shù)據(jù)的準備數(shù)據(jù)文件是ASCII碼的文本文件94BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;TitlelineBILOG程序文件(*.BLM)IRTcalibrat95BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;數(shù)據(jù)文件名個人ID位數(shù)模型參數(shù)個數(shù)保存外部文件BILOG程序文件(*.BLM)IRTcalibrat96BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;保存試題參數(shù)，被試參數(shù)，CTT結(jié)果，測驗信息函數(shù)BILOG程序文件(*.BLM)IRTcalibrat97BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;（分）測驗題數(shù)BILOG程序文件(*.BLM)IRTcalibrat98BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;omit文件名總題數(shù)選項個數(shù)標準答案文件名BILOG程序文件(*.BLM)IRTcalibrat99BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;FORTRAN語言讀數(shù)據(jù)的格式A,X,T,I,/BILOG程序文件(*.BLM)IRTcalibrat100BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;試題參數(shù)估計時的設(shè)定畫出擬合度差（p<=指定數(shù)值）的試題BILOG程序文件(*.BLM)IRTcalibrat101BILOG程序文件(*.BLM)IRTcalibrationofchineseandmathsscore.>COMMENT>GLOBALDFN=‘C:\YAN2.DAT',NIDW=5,NPARM=2,SAVE;>SAVESCO=‘YAN2.SCO',PARM=‘YAN2.PAR',TST=‘YAN2.TST‘,IST=‘YAN2.IST’;>LENGTHNITEMS=(80);>INPUTNTOT=80,NALT=4,KFN=‘KEY.TXT’,OFN=‘OMIT.TXT’;(5A1,80A1)>CALIBNQPT=40,CYC=100,NEW=30,CRIT=.001,PLOT=0;>SCOREMET=2,IDIST=0,RSC=0,INF=1;被試能力估計時的設(shè)定1-ML2-EAP(缺省)3-MAP0-不做重新標刻(缺省)1-按scale和location線性變換3-按樣本的L和S重新標刻3-EAP時潛變量以L為均數(shù)S為標準差測驗信息曲線BILOG程序文件(*.BLM)IRTcalibrat102BILOG結(jié)果文件(*.PH1)

CYCLE15;LARGESTCHANGE=0.00007

SUBTESTTEST0001;ITEMPARAMETERSAFTERCYCLE15ITEMINTERCEPTSLOPETHRESHOLDLOADINGASYMPTOTECHISQDFS.E.S.E.S.E.

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

項目反應(yīng)理論簡介課件

文檔簡介

溫馨提示

最新文檔

評論

項目反應(yīng)理論簡介課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔