應(yīng)用于考試中的IRT參數(shù)估計(jì)簡(jiǎn)化程序設(shè)計(jì)

上傳人：h*** IP屬地：天津上傳時(shí)間：2023-01-19 格式：DOCX 頁(yè)數(shù)：4 大小：13.59KB 積分：12 舉報(bào) 版權(quán)申訴

應(yīng)用于考試中的IRT參數(shù)估計(jì)簡(jiǎn)化程序設(shè)計(jì)_第2頁(yè)

應(yīng)用于考試中的IRT參數(shù)估計(jì)簡(jiǎn)化程序設(shè)計(jì)_第3頁(yè)

應(yīng)用于考試中的IRT參數(shù)估計(jì)簡(jiǎn)化程序設(shè)計(jì)_第4頁(yè)

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用于考試中的IRT參數(shù)估計(jì)簡(jiǎn)化程序設(shè)計(jì)朱寧寧目前，越來(lái)越多的考試都應(yīng)用項(xiàng)目反應(yīng)理論ItemResponseTheory,稱簡(jiǎn)IRT)作為題目分析、題庫(kù)建設(shè)以及分?jǐn)?shù)估計(jì)等方面的主要方法。但是，這一方法因?yàn)榫哂刑嗟臄?shù)理統(tǒng)計(jì)內(nèi)涵，以至不容易被人掌握。而且，目前用于IRT參數(shù)估計(jì)的軟件雖然不少，比如有BIGSTEPS、PARSCALE、BILOG以及MULTILOG等Embretson&Reise,2000),但是作為商業(yè)軟件，這些工具都有特定的應(yīng)用范圍和條件，并且功能過(guò)于復(fù)雜，設(shè)計(jì)的目的主要是供研究者使用的，并不容易為一般應(yīng)用者所掌握。這些問題的存在，導(dǎo)致了我國(guó)考試界對(duì)IRT技術(shù)了解不深和應(yīng)用不廣。實(shí)際上，對(duì)于計(jì)劃要在考試中使用IRT技術(shù)的廣大考試管理者和實(shí)施者而言，他們更希望有一個(gè)易于使用，并能滿足一般數(shù)據(jù)處理要求的IRT參數(shù)估計(jì)程序，以便能將現(xiàn)在的考試系統(tǒng)提升到一個(gè)新的更有效的水平上，并能適應(yīng)現(xiàn)代計(jì)算機(jī)技術(shù)不斷進(jìn)步的要求。本研究使用邊緣極大似然估計(jì)MMLE)的方法進(jìn)行項(xiàng)目參數(shù)的估計(jì)，并用貝葉斯法Bayes)期望后驗(yàn)估計(jì)EAP)的方法進(jìn)行結(jié)果分?jǐn)?shù)參數(shù)估計(jì)Baker，1992)，設(shè)計(jì)出一個(gè)功能簡(jiǎn)化的用于二級(jí)計(jì)分的2PL模型的參數(shù)估計(jì)程序，簡(jiǎn)稱MyPro。這一程序的特點(diǎn)是：使用簡(jiǎn)便，嵌入性較強(qiáng)。1模型簡(jiǎn)介二級(jí)計(jì)分的2PL模型項(xiàng)目特征曲線可表示為：Pi(l/2)其中，Zij=j—i為題目區(qū)分讀，Ni為題目的難度。2.MyPro與Bilog在估計(jì)結(jié)果上的對(duì)比BILOG(Mislevy&Bock，1990)是用于二級(jí)計(jì)分的項(xiàng)目反應(yīng)理論模型參數(shù)估計(jì)的流行工具，這個(gè)程序已經(jīng)有適用于Windows平臺(tái)的版本，可完全通過(guò)菜單設(shè)置參數(shù)，來(lái)完成1PL、2PL和3PL的IRT模型的參數(shù)估計(jì)。在本研究中，使用的對(duì)比程序就是BILOGC3.11版）°BILOG-3程序使用流行的（MMLE）方法來(lái)進(jìn)行項(xiàng)目參數(shù)的估計(jì)，默認(rèn)用（EAP）方法進(jìn)行特質(zhì)參數(shù)的估計(jì)。下面，用蒙特卡洛（MonteCarlo）模擬方法，將MyPro與Bilog—3加以對(duì)比，以觀察其可用性。首先模擬10次考試數(shù)據(jù)：每次考試有3000個(gè)考生參加，試卷的題量為50題。其中，題目鑒別度A采用Log正態(tài)分布加以模擬，題目難度B采用正態(tài)分布模擬。能力值Theta也使用正態(tài)分布模擬。受測(cè)者的應(yīng)答情況采用2PL模型加以模擬（由于模型本身即要求數(shù)據(jù)的一維性，因此模擬的數(shù)據(jù)已經(jīng)符合模型的要求，不必再進(jìn)行模型符合性的相關(guān)檢驗(yàn)）。得到10組受測(cè)者應(yīng)答矩陣以后，分別使用MyPro和Bilog—3進(jìn)行參數(shù)的估計(jì)。MyPro和Bilog—3方法得到A值、B值和THETA值的各10組數(shù)據(jù)，將這些數(shù)據(jù)分別和初始模擬的A值、B值和THETA值進(jìn)行比較，分別計(jì)算出每一組的誤差的標(biāo)準(zhǔn)差的平均值，以之作為估計(jì)誤差。結(jié)果如表1所示：從表1中可以發(fā)現(xiàn)：（1）將MyPro和Bilog-3的估計(jì)結(jié)果與模擬的初值進(jìn)行誤差分析，發(fā)現(xiàn)兩個(gè)程序的估計(jì)的準(zhǔn)確性水平較為一致?？烧J(rèn)為這兩種程序的估計(jì)具有同樣的準(zhǔn)確性。（2）通過(guò)對(duì)比MyPro和Bilog-3兩種程序的估計(jì)結(jié)果，發(fā)現(xiàn)兩個(gè)程序的估計(jì)結(jié)果的差異較小?？烧J(rèn)為兩種程序的估計(jì)結(jié)果之間具有一致性。從模擬研究結(jié)果觀察，MyPro這個(gè)參數(shù)估計(jì)程序，雖然距離Bilog的復(fù)雜性還有很大的差距，但是已經(jīng)達(dá)到了可用的標(biāo)準(zhǔn)。需要使用者注意的是:和Bilog等程序一樣，MyPro簡(jiǎn)化程序沒有包含IRT模型假設(shè)檢驗(yàn)過(guò)程,因此需要用戶預(yù)先保證輸入MyPro的數(shù)據(jù)是符合IRT的模型假設(shè)的（可通過(guò)DIMTEST或DETECT等程序考察數(shù)據(jù)的特征）。3MyPro的用法介紹MyPro這個(gè)程序包含兩個(gè)功能：MyPro.MMLE和MyPro.EAP，分別用于估計(jì)項(xiàng)目參數(shù)估計(jì)和能力參數(shù)。用戶可選擇需要的功能，分別進(jìn)行調(diào)用。MyPro.MMLE包含三個(gè)參數(shù)：vData,lMNC和dJD。最簡(jiǎn)單的情況下，用戶只需要輸入vData這個(gè)參數(shù)，這是考生在每個(gè)題目上的得分?jǐn)?shù)據(jù)，按照以下形式排列（n名考生，m個(gè)題目）：其中，1MNC用于設(shè)定最大的迭代次數(shù)（默認(rèn)為100），dJD用于估計(jì)精度（默認(rèn)為0.001），這兩個(gè)參數(shù)都是可選的。估計(jì)結(jié)束以后，會(huì)生成一個(gè)結(jié)果文件：EM.LOG。包含A與B參數(shù)的估計(jì)值，及其卡方檢驗(yàn)結(jié)果。使用者可直接調(diào)用項(xiàng)目參數(shù)估計(jì)的這些結(jié)果。下面舉例說(shuō)明如何用一個(gè)Windows的腳本運(yùn)行這一程序：setMyPro=Server.CreateObject（"IRT.MyPro"）MyPro.MMLEvDataMyPro.EAP也包含三個(gè)參數(shù)：vData，vA和vB。這三個(gè)參數(shù)都是必需的，vData參數(shù)包含某個(gè)考生在每個(gè)題目上的得分?jǐn)?shù)據(jù)，如下所示（考生x,在m個(gè)題目上的回答）：Kxl，Kx2，…，Kxi，…，KxmvA表示題目的區(qū)分度，vB表示題目的難度（m個(gè)題目）：A1，A2，…，Aj，…，AmB1，B2，…，Bj，…，Bm估計(jì)結(jié)束后，能直接返回Theta值（此即為考生的能力值），以及信息量和誤差情況。在實(shí)際使用中,如預(yù)先不知道項(xiàng)目的區(qū)分度和難度值，可先通過(guò)前面的項(xiàng)目參數(shù)估計(jì)過(guò)程獲得這些參數(shù)，然后再計(jì)算Theta值。下面舉例說(shuō)明如何用一個(gè)Windows的腳本運(yùn)行這一程序：setMyPro=Server.CreateObject("IRT.MyPro")sValue=MyPro.EAP(vData,vA,vB)從上面的例子可以看到，無(wú)論是進(jìn)行項(xiàng)目參數(shù)估計(jì)，還是對(duì)能力參數(shù)進(jìn)行估計(jì)，都只要通過(guò)簡(jiǎn)單兩行代碼即可完成調(diào)用，省去了用戶的很多麻煩。4小結(jié)由于此程序作為動(dòng)態(tài)鏈接庫(kù)的形式發(fā)布，因此可以在Windows95/98/Me，NT，windows2000以及XP中都能被使用。這個(gè)庫(kù)程序可以被其它IRT應(yīng)用軟件所調(diào)用，也能被計(jì)算機(jī)化考試的服務(wù)器直接調(diào)用，甚至可以被整合到客戶端的應(yīng)用中，以提高服務(wù)器的效率。本研究以二級(jí)計(jì)分的2PL模型為例，說(shuō)明了模塊化IRT的參數(shù)估計(jì)方法后，能為大家方便地使用。但是具體的考試還會(huì)涉及多級(jí)計(jì)分的題目、時(shí)間限制題目以及多選題等等，與此相關(guān)的IRT模型及其參數(shù)估計(jì)方法就更為繁瑣。本文只是拋磚引玉，希望國(guó)內(nèi)的考試研究者能夠開發(fā)出更多類似的應(yīng)用程序，以便使IRT技術(shù)為國(guó)內(nèi)考試方面的具體應(yīng)用提供基礎(chǔ)性的幫助，為中國(guó)教育考試的科學(xué)化做出貢獻(xiàn)。參考文獻(xiàn)1.Baker，F(xiàn).B.(1992).Itemresponsetheoryparameterestimationtechniques.MarcelDekker.Inc.Embretson，S.E.，&Reise，S.P.(2000).Itemresponsetheoryforpsychologists.LondonLaweenceErlbawnAssociates.2.M

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

應(yīng)用于考試中的IRT參數(shù)估計(jì)簡(jiǎn)化程序設(shè)計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

應(yīng)用于考試中的IRT參數(shù)估計(jì)簡(jiǎn)化程序設(shè)計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔