第五章 測驗的項目分析_第1頁
第五章 測驗的項目分析_第2頁
第五章 測驗的項目分析_第3頁
第五章 測驗的項目分析_第4頁
第五章 測驗的項目分析_第5頁
已閱讀5頁,還剩65頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章測驗的項目分析

(Itemanalysis)

第一節(jié)項目難度分析第二節(jié)項目的區(qū)分度分析第三節(jié)猜測問題和猜測率第四節(jié)多重選擇題的項目分析本章提要:.測驗項目難度的意義,難度指標的計算及項目難度對測驗的影響。.測驗項目區(qū)分度的意義,區(qū)分度的求法、區(qū)分度對測驗質量的影響。.測驗猜測問題的紛爭。.多重選擇題的項目分析方法。項目分析就是根據(jù)試測結果對組成測驗的各個題目(項目)進行分析,從而評價題目好壞、對題目進行篩選。包括質的分析和量的分析,如下表表

研究生入學考試英語近3年數(shù)據(jù)對比分析項目1999年2000年2001年平均分43.1056.6145.31標準差12.0013.5013.10難度0.430.570.45第一節(jié)測驗的難度一、難度的意義二、難度的計算三、難度水平的確定四、難度的等距轉換五、難度對測驗的影響一、難度的意義項目難度(ItemDifficulty)指測驗項目的難易程度。定量刻畫被試作答一個題目所遇到的困難程度的量數(shù),就叫難度系數(shù),也叫難度值,常用P表示。能力測驗:項目的難易水平非能力測驗:“通俗性”或者“流行性”水平(popularitylevel)。難度分析,是對項目的難度進行估計以確定適宜的難度。

二、難度的計算測驗的計分方法不同,項目難度的計算方法也不同。

(一)二分法記分項目的難度1.通過率以答對或通過該項目的人數(shù)的百分比來表示:P=R/N(5.1)式中,P代表項目難度,N為全體被試數(shù),R為答對通過該項目的人數(shù)。

例1,在200個學生中,答對某項目的人數(shù)為120人,則該項目的難度是多少?例2,100人參加某一測驗,其中第2題和第6題通過的人數(shù)分別為20人和30人,求第2題和第6題的難度。

2.極端分組法

具體步驟如下:第一步:先依測驗總分的高低,按由高到低的順序,依次排列試卷;第二步:從得分最高的一份試卷開始依次向下選出全部試卷的27%,作為高分組第三步:從得分最低的一份試卷開始依次向上選出全部試卷的27%,作為低分組第四步:按下列公式計算難度P=(PH+PL)/2或P=1/2(RH/NH+RL/NL)式中PH,PL分別表示高分組和低分組的通過率;RH,RL表示高分組和低分組通過該項目的人數(shù);NH,NL分別代表高分組和低分組的人數(shù)。

例如,在370名被試中,選為高分組和低分組的被試各有100人,其中高分組有70人答對第1題,低分組有40人答對第1題,則第1題的難度是多少?(二)非二分法記分項目的難度當項目以多值計分時,難度等于平均分與滿分之比。例如:設某一問答題滿分是20分,全體考生在該題上所得的平均分為10分,則該題的難度為:P==10/20=0.50三、測驗難度水平的確定

了解被試在某方面知識技能的掌握情況,可以不必過多地考慮難度。選拔錄用人員,項目的難度應控制在接近錄取率左右。四、難度的等距變換通過率是以何種量表水平表示難度?1、使用項目難度等距量表的理由

第一,測題的難度一般用答對某題的人數(shù)比率或百分比表示。百分量表是等級量表,不是等距量表。因此不能比較題目之間的具體差異。第二,難度量表是反序而行的,P值越大,項目越容易,轉換成等距量表后更清晰明了。2、轉換為等距量表的方法查標準正態(tài)分布表,將以等級量表表示的P值轉換成具有相等單位σ的等距量表Z值。

P值作為正態(tài)曲線下面積時,要從右向左而行。轉換好的Z值在平均數(shù)以下是負數(shù)。為了避免負號出現(xiàn)的情況,使用Δ

。先將某題的通過率視作正態(tài)曲線下的面積,然后查正態(tài)分布表找出正態(tài)曲線右側的面積所對應的Z分數(shù)。這一Z分數(shù)就可視為該題的標準難度。16%84%-3320-2-1134%例,某題的通過率為84%,求該題的標準難度。練習:請同學們計算一下上述三個項目的標準難度轉換好的Z值在平均數(shù)以下是負數(shù)。為了避免負號出現(xiàn)的情況,使用Δ

?!鳎?3+4·Z(6.4)式中,△表示題目難度,Z表示由P值轉換得來的標準分數(shù)。

Δ=13+4ZΔ:常態(tài)化等距難度指標,13為平均數(shù),4為標準差,Z為以σ為單位的Z值。如,上面所舉的例中,其Δ難度值為:題目A:通過率P=0.84Z=-1Δ=13+4×(-1)=9

題目B:通過率P=0.16Z=1Δ=13+4×1=17

題目C:通過率P=0.50Z=0Δ=13+4×0=13

如果一個題目幾乎所有被試都通過(99.8%),

則其Z=-3,Δ=13+4×(-3)=1

如果一個題目答對的人很少(0.13%),

則其Z=3,Δ=13+4×3=25對一般教師來說,只要計算出P值即可。但如果要作更精確的統(tǒng)計分析,則就需要計算出具有等距量表性質的△值。

五、難度對測驗的影響

難度分析的主要目的是篩選項目,項目的難度水平取決于:測驗的目的測驗的作用項目形式測驗目的教育工作中,若測驗的目的是為了了解被試在某方面知識技能掌握的情況,可以不必過多的考慮難度。大多數(shù)測驗希望能較準確地測量個體之間的差別,選擇題目時,最好使試題的平均難度接近0.50,而各題難度在0.50±0.20之間。一般能力測驗和成就測驗的平均難度在0.50左右比較合適。篩選性測驗(選拔性,競爭性測驗)則要采用難度接近錄取率的項目。測驗的作用對于選擇題而言,P值一般應大于概率水平對于是非題而言,其難度值應該為0.75最為合適對于四擇一題目,其難度值約為0.63時最為合適項目的形式五、難度對測驗的影響整個測驗的難度取決于組成這個測驗的各個試題的難度。整個測驗難度水平的確定,需要根據(jù)測驗分數(shù)的分布作出。(一)測驗難度影響測驗分數(shù)的分布形態(tài)

難度大,正偏態(tài)

難度低,負偏態(tài)(二)測驗難度影響測驗分數(shù)的離散程度測驗過難或過易,分數(shù)全距縮小,信度降低。P=0.50時最佳第二節(jié)測驗的區(qū)分度一、區(qū)分度的定義二、區(qū)分度的估計方法三、區(qū)分度和難度的關系四、區(qū)分度的相對性一、區(qū)分度的意義項目區(qū)分度(itemdiscrimination)是指測驗項目對于所測量的心理屬性的鑒別能力和區(qū)分程度,也稱鑒別力。項目的區(qū)分度是測驗是否有效的“指示器”。二、區(qū)分度的估計方法

(一)鑒別指數(shù)法(二)相關法(三)項目特征曲線(一)項目鑒別指數(shù)法這種方法較適合于二分法記分的測驗項目。1.鑒別指數(shù)的計算當效標成績是連續(xù)變量時,可以從分數(shù)分布的兩端各選擇27%的被試,分別計算出每道題目上的各自的通過率,二者之差就是鑒別度指數(shù)(D),即:D=PH一PL式中PH與PL分別為高分組與低分組在該項目上的通過率。例如:高分組在某一項目的通過率為0.75,低分組的通過率為0.35,則該項目的鑒別指數(shù)是多少?例,某高中物理測驗,被試共18人,高分組和低分組各取總人數(shù)的27%,則兩組各為5人,第五題高分組5人全部答對,低分組只有1人答對,計算該題的鑒別指數(shù)。

D值是鑒別項目測量有效性的指標,D值越高,項目越有效。1965年,美國測驗專家R.L.Ebel根據(jù)長期經驗提出用鑒別指數(shù)評價題目性能的標準如下表所示。

2.極端組的劃分27%規(guī)則一般情況下,取上下25%~33%均可。樣本少時,可以取50%注意:由于計算機的方便使用,可以上下50%作為劃分高低組的標準,或者多分幾組,對區(qū)分度和難度作詳細分析。因為只取上下兩端,只利用了一部分資料,浪費了很多信息,有可能得出錯誤結論。(二)相關法1.點二列相關(Pointbiserialcorrelation)適用資料:兩列變量中,有一列為等距或等比的數(shù)據(jù)而且其總體分布為正態(tài),另一列變量只是名義上的變量,按事物的性質劃分為兩類;有時一個變量是雙峰分布也可以劃分為二分名義變量。計算點二列相關的公式是:(公式3-6)rpb:點二列相關系數(shù);

:答對該題的被試在總分上(或效標分數(shù)上)的平均得分;

:答錯該題的被試在總分上(或效標分數(shù)上)的平均得分;St:全體被試的總分(或效標分數(shù))的標準差;P:為答對該題的人數(shù)百分比;q:答錯該題的人數(shù)百分比,q=1-p。點二列相關系數(shù)的顯著性檢驗:對與進行差異的t檢驗,如果差異顯著,表明相關系數(shù)顯著;如果差異不顯著,表明相關系數(shù)不顯著。如果樣本容量較大(n>50),也可以用下面的近似方法:時,認為在.05水平上顯著;時,認為在.01水平上顯著。例:下表有20個學生語文測驗總分以及在作文題和一個選擇題上的得分情況,假設作文37分(包括37分)算通過,試計算作文題的區(qū)分度。

解:2.二列相關(biserialcorrelation)兩個變量都是正態(tài)連續(xù)變量,其中一個變量被人為地分成兩類。測驗總分或效標分數(shù)、某個測驗項目的分數(shù)都是連續(xù)變量,其中一個變量被人為地分成兩類,可以是測驗總分或效標分數(shù)被人為地分成兩類,也可以是某個項目的分數(shù)被人為地分成兩類。點二列相關和二列相關的區(qū)分是,二分的變量總體是否為正態(tài),正態(tài)則用二列相關,非正態(tài)則用點二列相關。計算二列相關的公式是:(公式3-7)

rb:二列相關系數(shù);

:答對該題的被試在總分上(或效標分數(shù)上)的平均得分;

:答錯該題的被試在總分上(或效標分數(shù)上)的平均得分;St全體被試的總分(或效標分數(shù)的標準差);p為答對該題的人數(shù)百分比;q答錯該題的人數(shù)百分比,q=1-p;y為正態(tài)分布下答對百分比所在位置的曲線高度。

二列相關的顯著性檢驗:用Z檢驗。

(公式3-8)

例如:根據(jù)上例的資料,計算選擇題的區(qū)分度。解:3.φ相關

φ相關的統(tǒng)計方法適用于兩個變量是二點分配的資料,即兩個變量都是二分名義變量。在用φ系數(shù)作為區(qū)分度指標時,要求項目反應與效標變量都是二分狀態(tài)。一般是根據(jù)效標成績或測驗總分的高分組和低分組,通過和未通過某一項目的人數(shù)列成的四格表來計算。計算公式為:rφ=(ad-bc)/式中rφ為φ的相關系數(shù),a,b,c,d分別為四格表中四項所包含的人次數(shù)。例用表6.2數(shù)據(jù)為資料,測驗總分以60分以上為升級,60分以下者為留級,就可以歸類為下列的2×2表。假設以升學情況作為效標,此題對于學生的區(qū)分度為多少?4.積差相關

對于論文式測驗題目,因得分具有連續(xù)性,在被試團體較大時,可以認為項目分數(shù)服從正態(tài)分布??蓪㈨椖康梅峙c效標分數(shù)求積差相關系數(shù)以得到項目的區(qū)分度。(三)項目特征曲線(itemcharacteristiccurve,ICC)項目特征曲線描述了效標分數(shù)不同的被試在該項目上的通過率。曲線坡度越陡,鑒別力越好,預測的誤差越小。率概的目項答回確正1.000.000.50低中高能力鑒別力較好低中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論