第9章 測驗(yàn)等值_第1頁
第9章 測驗(yàn)等值_第2頁
第9章 測驗(yàn)等值_第3頁
第9章 測驗(yàn)等值_第4頁
第9章 測驗(yàn)等值_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第九章測驗(yàn)等值心理測量學(xué)測驗(yàn)等值概述1常用等值資料采集方法設(shè)計2測驗(yàn)分?jǐn)?shù)等值關(guān)系計算的基本方法3心理測量學(xué)測驗(yàn)等值概述1心理測量學(xué)測驗(yàn)等值概述DBCA測驗(yàn)等值的含義測驗(yàn)等值的條件等值步驟等值誤差測驗(yàn)等值的含義

測驗(yàn)、考試被作為一種尺度來對人的心理特質(zhì)進(jìn)行測量。這種尺度應(yīng)該具有穩(wěn)定性。不同的考試版本之間應(yīng)該具有一致性。對于同一個測量對象,不能用這個版本測量得到一個度量,用另一個版本測量卻得到相差很大的另一個度量。

心理測量學(xué)測驗(yàn)等值的含義

盡管我們在命題過程中總是盡量保持考試難度的穩(wěn)定性,但不同試卷之間在難度、信度、分?jǐn)?shù)分布方面的差別很難完全避免的。這種差別不僅會影響到測驗(yàn)的質(zhì)量,影響到評價標(biāo)準(zhǔn)的客觀性,而且會使參加考試時間不同、使用試卷不同的考生受到不公平的對待。心理測量學(xué)測驗(yàn)等值的含義

這樣,就需要將具有不同難度、分?jǐn)?shù)分布的試卷的分?jǐn)?shù)轉(zhuǎn)換到一個統(tǒng)一的量尺之上,采用統(tǒng)一的量尺對應(yīng)考者進(jìn)行測量。這種將一個測驗(yàn)的不同版本的分?jǐn)?shù)統(tǒng)一在一個量表上的過程即等值(Equating)。心理測量學(xué)測驗(yàn)等值的條件心理測量學(xué)

測驗(yàn)等值必須滿足的要求與條件測驗(yàn)所測心理結(jié)構(gòu)或特性的同一性等信度測驗(yàn)等值轉(zhuǎn)換關(guān)系的公平性測驗(yàn)等值轉(zhuǎn)換關(guān)系的可遞推性測驗(yàn)等值的條件心理測量學(xué)

測驗(yàn)等值必須滿足的要求與條件(續(xù))測驗(yàn)等值轉(zhuǎn)換關(guān)系的對稱性測驗(yàn)等值轉(zhuǎn)換關(guān)系對總體的惟一性或稱樣本不變性

在測驗(yàn)等值處理中,如果待等值測驗(yàn)?zāi)芡耆仙鲜?個條件,則等值的結(jié)果將令人滿意。等值步驟心理測量學(xué)

兩測驗(yàn)形式之間的等值關(guān)系,必須依據(jù)等值條件去尋找這一隱性等值關(guān)系,并用某種形式將其顯示出來。

揭示兩測驗(yàn)形式的等值關(guān)系,實(shí)現(xiàn)測驗(yàn)等值應(yīng)該按一定步驟進(jìn)行。等值步驟心理測量學(xué)測驗(yàn)等值步驟(七步)確定等值目的編制測驗(yàn)復(fù)份選擇一種數(shù)據(jù)采集的設(shè)計方法貫徹數(shù)據(jù)采集設(shè)計方案等值步驟心理測量學(xué)選擇一個或多個等值的操作性定義,以確定擬予等值的測驗(yàn)形式之間存在什么關(guān)系。選擇一種或多種統(tǒng)計估計方法評價等值結(jié)果

測驗(yàn)等值的步驟一般依據(jù)以上七步完成,有時個別步驟的順序可能會有所調(diào)整,但總體上不會有很大變化。等值誤差心理測量學(xué)

等值完成后必須對等值結(jié)果進(jìn)行評價。評價等值關(guān)系可靠性與準(zhǔn)確性的指標(biāo)是等值關(guān)系中所包含等值誤差的大小。等值誤差有兩類:隨機(jī)等值誤差與系統(tǒng)等值誤差。測驗(yàn)誤差不可避免一樣,等值誤差也是不可避免的。等值誤差心理測量學(xué)影響等值誤差的主要因素被等值測驗(yàn)的同質(zhì)性被等值測驗(yàn)之間的難度差別被等值測驗(yàn)分?jǐn)?shù)的分布特點(diǎn),包括偏度、峰度等被等值測驗(yàn)的單維性等值誤差心理測量學(xué)影響等值誤差的主要因素(續(xù))鉚題對測驗(yàn)的代表性,或錨題分?jǐn)?shù)與測驗(yàn)分?jǐn)?shù)的相關(guān)用于等值估計的考生樣本的容量用于等值估計的考生樣本分?jǐn)?shù)分布的相似性等值誤差心理測量學(xué)影響等值誤差的主要因素(續(xù))測驗(yàn)長度鉚題數(shù)量鉚題在測驗(yàn)中的位置實(shí)際的影響因素可能更多。等值還會受到測驗(yàn)所關(guān)注的分?jǐn)?shù)段、測驗(yàn)?zāi)康膶Ψ謹(jǐn)?shù)精確性的要求水平、測驗(yàn)分?jǐn)?shù)的應(yīng)用、計算條件等多種因素的影響。心理測量學(xué)常用等值資料采集方法設(shè)計2常用等值資料采集方法設(shè)計1單組設(shè)計2隨機(jī)等組設(shè)計3鉚測驗(yàn)—非等組設(shè)計單組設(shè)計

單組設(shè)計:即把擬予等值的兩個或多個測驗(yàn)同時向同一被試組施測,然后借助于同一被試組把擬予等值的測驗(yàn)聯(lián)系起來,這時兩組測驗(yàn)分?jǐn)?shù)的差異主要是由于兩個測驗(yàn)的難度不同而引起的,因而從理論上來說這種等值設(shè)計既簡單又無抽樣誤差。但實(shí)際上由于練習(xí)效應(yīng)、疲勞及厭倦等因素的影響,會給等值結(jié)果帶來誤差。心理測量學(xué)隨機(jī)等組設(shè)計

隨機(jī)等組設(shè)計:從同一總體中隨機(jī)抽取兩組考生,這兩組考生被認(rèn)為在能力分布上是相同的或很接近,讓這兩組考生分別接受兩份不同測驗(yàn)X和Y,然后估計兩測驗(yàn)形式的等值關(guān)系。這種設(shè)計方案可克服練習(xí)效應(yīng)和疲勞等因素的不利影響。這種數(shù)據(jù)采集設(shè)計有一個假設(shè),即兩被試樣本的總體分布是相同的。由于從同一總體抽樣,因此,不考慮其間的抽樣誤差,這一假設(shè)比較容易得到滿足。心理測量學(xué)鉚測驗(yàn)—非等組設(shè)計

鉚測驗(yàn)—非等組設(shè)計:在測驗(yàn)編制時另外編制一組測驗(yàn)試題,這些試題被稱為共同題,也稱為鉚(anchor)題。在數(shù)據(jù)采集時,鉚測驗(yàn)題即對第一組被試施測,又對第二組被試施測。心理測量學(xué)等值設(shè)計方法圖示單組設(shè)計樣本測

驗(yàn)XYP?

?隨機(jī)等組設(shè)計樣本測

驗(yàn)XYP1

?P2

?鉚測驗(yàn)—非等組設(shè)計樣本測

驗(yàn)XVYP1

?

?q1

?

?心理測量學(xué)心理測量學(xué)測驗(yàn)分?jǐn)?shù)等值關(guān)系計算的基本方法3測驗(yàn)分?jǐn)?shù)等值關(guān)系計算的基本方法心理測量學(xué)線性等值等百分位等值鉚測驗(yàn)非等組設(shè)計下的等值關(guān)系計算方法線性等值心理測量學(xué)

在單組設(shè)計或隨機(jī)等組設(shè)計下的兩個分?jǐn)?shù),一個在測驗(yàn)形式x上,另一個在測驗(yàn)形式y(tǒng)上,如果它們的標(biāo)準(zhǔn)分?jǐn)?shù)相等,這兩個分?jǐn)?shù)就被認(rèn)為是等值的。線性等值心理測量學(xué)

用數(shù)學(xué)公式表示,所謂測驗(yàn)分?jǐn)?shù)x等值于測驗(yàn)分?jǐn)?shù)y,即有下式成立:

改寫為:

其中:等百分位等值心理測量學(xué)

在單組設(shè)計或隨機(jī)等組設(shè)計下的兩個分?jǐn)?shù),一個在測驗(yàn)形式x上,另一個在測驗(yàn)形式y(tǒng)上,如果這兩個分?jǐn)?shù)有相同的百分等級,那么這兩個分?jǐn)?shù)就被認(rèn)為是等值的。按照這個原理,尋找與x

分?jǐn)?shù)等值的y

分?jǐn)?shù),只要找到與x

分?jǐn)?shù)有相等百分等級的y分?jǐn)?shù)就可以。等百分位等值心理測量學(xué)

對于測驗(yàn)x的每個一分?jǐn)?shù),可根據(jù)公式在x測驗(yàn)分布中先求出與其對應(yīng)的百分等級,然后在y測驗(yàn)上求取具有該百分等級的分?jǐn)?shù)。即在兩個測驗(yàn)上就有相同百分等級的分?jǐn)?shù)就是等值分?jǐn)?shù)。心理測量學(xué)百分等級計算公式為:根據(jù)百分等級計算測驗(yàn)分?jǐn)?shù)公式為:鉚測驗(yàn)非等組設(shè)計計算心理測量學(xué)

讓兩個被試組分別參加兩個形式的測驗(yàn),在兩個測驗(yàn)中有部分項(xiàng)目是共同的——鉚題,這樣兩組被試被鉚題鉚接在一起。使用該設(shè)計可以采用線性等值方法來完成等值計算。鉚測驗(yàn)非等組設(shè)計計算心理測量學(xué)鉚測驗(yàn)非等組設(shè)計線性等值方法計算公式如下:

其中,是x測驗(yàn)向全體被試t施測時的平均數(shù)與標(biāo)準(zhǔn)差的估計值,是y測驗(yàn)向全體被試t施測時的平均數(shù)與標(biāo)準(zhǔn)差的估計值。心理測量學(xué)如果兩組被試能力差異不大,四項(xiàng)估計值為:

心理測量學(xué)

其中,

是只參加測驗(yàn)x被試的平均數(shù)和標(biāo)準(zhǔn)差,

是只參加測驗(yàn)y被試的平均數(shù)和標(biāo)準(zhǔn)差,

是鉚測驗(yàn)向全體被試t施測得到的平均數(shù)和標(biāo)準(zhǔn)差,

是既參加測驗(yàn)x又參加鉚測驗(yàn)被試的平均數(shù)和標(biāo)準(zhǔn)差,

是即參加測驗(yàn)y又參加鉚測驗(yàn)被試的平均數(shù)和標(biāo)準(zhǔn)差,

是測驗(yàn)x對測驗(yàn)v的回歸系數(shù),

是測驗(yàn)y對測驗(yàn)v的回歸系數(shù)。心理測量學(xué)如果兩組被試能力有差異,這四項(xiàng)估計值為:式中,、、與分別是各個測驗(yàn)的信度系數(shù)。本章小結(jié)心理測量學(xué)

測驗(yàn)等值是測驗(yàn)公平性的保證,其在測驗(yàn)實(shí)施、編制與結(jié)果分析,題庫的建立,不同單位、地區(qū)、時間所測學(xué)科成績的比較等方面,都是極為必要的。本章小結(jié)心理測量學(xué)

如果不進(jìn)行等值處理,不同時間舉行的考試的成績之間不具備可比性,評價標(biāo)準(zhǔn)或證書授予標(biāo)準(zhǔn)會受到試卷難度起伏的影響。這種狀況,不僅影響到選拔效率和人員素質(zhì),而且對考生也是很不公平的。本章小結(jié)心理測量學(xué)

等值研究的意義并不局限于保證考試公平。今天,為了避免命題和試卷編制中的盲目性和偶然性,國內(nèi)許多考試機(jī)構(gòu)都在致力于建設(shè)題庫。實(shí)現(xiàn)基于項(xiàng)目反應(yīng)理論(ItemResponseTheory,簡稱IRT)的題目參數(shù)等值是建設(shè)科學(xué)化、大規(guī)模題庫的前提。

本章小結(jié)心理測量學(xué)

基于經(jīng)典測驗(yàn)理論(ClassicalTesingTheory,簡稱CTT)之上的等值方法只能實(shí)現(xiàn)不同試卷之間的等值,滿足“試卷庫”建設(shè)的需要,很難實(shí)現(xiàn)在統(tǒng)一的量尺上標(biāo)定試題難度和區(qū)分度的任務(wù),很難滿足大規(guī)模題庫建設(shè)的需要。參考文獻(xiàn)心理測量學(xué)參考文獻(xiàn)[1]葉佩華等譯:測驗(yàn)等值,廣東高教出版社1988年出版。[2]漆書青、戴海琦、丁樹良編著:現(xiàn)代教育與心理測量學(xué)原理,江西師大心理與教育統(tǒng)計測量中心2002年出版。[3]漆書青編著:現(xiàn)代測量理論在考試中的應(yīng)用,華中師范大學(xué)出版社2003年出版。參考文獻(xiàn)心理測量學(xué)參考文獻(xiàn)(續(xù))[4]戴海琦、張峰、陳雪楓編著:心理與教育測量,暨南大學(xué)出版社2006年出版。[5]戴海琦.錨題題型與等值估計方法對等值的影響.心理學(xué)報,2002,34(4):367-370。[6]羅照盛.經(jīng)典測量理論等值的誤差研究.心理科學(xué),2000,23(4):494–501。參考文獻(xiàn)心理測量學(xué)參考文獻(xiàn)(續(xù))[7]Angoff,W.H.(1971).Scales,norms,andequivalentscores.InR.L.Thorndike(Ed.),Educationalmeasurement(2nded.)(pp.508-600).[8]Washington,DC:AmericanCouncilonEducation.PsychologicalMeasurement,14,313-321.參考文獻(xiàn)心理測量學(xué)參考文獻(xiàn)(續(xù))[9]Lord,F.M.(1980)Applicationsofitemresponsetheorytopracticaltestingproblems,Lawrence-ErlbaumAssociates.[10]Michael.J.Kolen&RobertL.Brennan.TestEquating,Scaling,andLinking:MethodsandPractices(2nded.)NewYork:Springer,2004.參考文獻(xiàn)心理測量學(xué)參考文獻(xiàn)(續(xù))[11]Kolen,M.J.(19

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論