第八章項目分析_第1頁
第八章項目分析_第2頁
第八章項目分析_第3頁
第八章項目分析_第4頁
第八章項目分析_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第八章人員測評項目分析

項目分析是指根據試測結果對組成測評的各個題目(項目)進行分析,從而評價題目好壞、對題目進行篩選的程序和方法。

第一節(jié)測評的難度分析

難度,就是指題目的難易程度。

對于能力測評,指難度水平的指標。對于非能力測評指是否容易被人看懂和回答。

一.通過率即以答對或通過該題的人數百分比。公式:其中,P為試題難度;N為全體被試人數;R為答對或通過該題的人數。

1.難度的計算若試題為二分法計分(即答對計1分,答錯計0分),P值可以直接采用公式上述計算。當被試人數較多時,則可以根據測評總成績將被試分成三組:分數最高的27%被試為高分組,分數最低的27%的被試為低分組,中間46%的被試為中間組。分別計算高分組和低分組的通過率,再求試題的難度。或

其中,P代表難度,PH和PL分別代表高分組和低分組通過率;RH和RL分別代表高分組和低分組通過該題的人數;NH和NL分別代表高分組和低分組的人數。

例如:在100名被試中,選為高分組和低分組的被試各有27人,其中高分組有20人答第一題,低分組有10人答對第一題,則第一題的難度為:

2.選擇題的難度修正在采用多項選擇題的測評中,由于猜測的因素,被試的得分可能會比被試的真實得分要高。為了平衡選項數目對難度的影響,吉爾福德提出了一個難度的校正公式:其中,CP為校正后的通過率,P為實際得到的通過率,K為選項的數目。

假定某題有75%的被試通過,如果該題有5個選項,則CP=0.69;4個選項時,CP=0.67;是非題時(2個選項),CP=050。選項數目很大、猜測概率很小時,CP的值就會很接近P值。

二.等距量表的難度指標δ

Δб以通過率作為難度指標,實際上是以順序量表來表示難度。如有3個試題,第1、2、3題通過的人數分別為全體被試的60%、40%、20%,雖然它們的相差數值相同(20%),卻無法確定題目1與2之間的難度差別是否等于題目2和3之間的難度差別。因此,需要計算等距量表的難度指標。

如果被試的得分呈正態(tài)分布,則可以根據正態(tài)曲線表,將試題的難度轉換成具有相等單位的等距量表,即分數。

在正態(tài)分布情形下,平均數之上或之下一個標準差的距離約占全體人數的34%。因此,如果在一個測評中,題A通過率為84%(P=0.84),從上圖中該題的難度為一1б;題B的通過人數只有16%,則這個題目的難度為+1б;題C剛好有50%的被試通過,難度為0。較難的題目難度為正值,簡單的題目為負值。根據正態(tài)曲線表,我們可以查出任何通過率值相對的值。

-3б-2б-1б+1б+2б+3б0

將分數轉換成另一種單位的等距量表,采用的難度指標:

A=13+4X

其中,A為正態(tài)化等距難度值;13為平均數,4為標準差的單位,X為正態(tài)化Z分數值。例如,上例中,題A的通過率為0.84,

X值為-1б,則

A=13+4(-1)=9;題B的難度值為0.16,X為+1б,A=13+4(+1)=17;題C,A=13。如果一個題目幾乎所有被試都通過(99.8%),則其X值為-3б。,Δ=1;如果某題答對的人數極少(0.13%),則X值為+3б,Δ=25。因此,Δ量表是以25為上限,1為下限的等距量表,面值越大,則難度越高,面值越小,難度越低。

三、測評難度的確定1.題目難度水平的確定P值越接近于0或接近于1,越無法區(qū)分被試間能力的差異。相反,P值越接近于0.50,區(qū)別力越高。

2.測評難度水平的確定整個測評的難度取決于組成測評的各個試題的難度,需要根據測評分數的分布確定。如果被試樣本具有代表性,則測評結果也應符合正態(tài)分布的模型。如果得分多數偏高或偏低,則為偏態(tài)分布。

第二節(jié)測評的項目鑒別度分析

項目鑒別度是指測評項目對于所測查的心理特性的鑒別能力和區(qū)分程度。鑒別度分析可以從項目效度和內部一致性兩方面分析。

項目效度分析主要以效標為依據,考察被試在每個試題上的反應與其在效標上表現的相關程度,即每個試題所測查的行為是否反映了被試在效標上的表現。鑒別度分析的指標有相關系數和鑒別度指數兩種。

1.相關系數這里的相關系數指項目通過率與效標成績的相關系數。

相關越高,表明項目越具有區(qū)分的功能。

1)通常情況下,項目的分數以二分法計分,如答對計1分,答錯計0分,而效標成績可能是連續(xù)的分數。求兩之間的相關,應采用點列相關系數:

其中,Xp代表通過該題的被試的平均效標成績,Xq代表未通過該題的被試的平均效標成績。p代表通過該題的人數百分比,q代表未通過該題的人數百分比;S代表全體被試的效標成績的標準差。

2)如果被試在試題上的反應也是正態(tài)分布,只是由于人為方法分成通過或未通過兩種情形,則可以采用二列相關公式:

其中,y是正態(tài)分布下答對百分比(p)所在位置的曲線的縱軸值。3)在有些情況下,對沒有通過某題被試的效標成績不感興趣時,則可用總人數的結果進行計算,上述公式可以轉換成:

其中,XT為所有被試的平均效標成績。

2.鑒別度指數鑒別度指數,是比較效標得分高和得分低的兩組被試在項目通過率上的差值:D=PH-PL當效標成績是連續(xù)變量時,可從分數分布的兩端各選擇27%的被試組成高、低分組,再分別計算兩組每道題目上的通過率,二者之差就是各題目的鑒別度指數D。D值是鑒別題目測評效標有效性的指標,D值越高,題目越有效。當D=1.00時,高分組全部通過,低分組全部失敗。當D=0時,則高分組和低分組通過的人數相同。

內部一致性分析

項目和總分的相關

有時在進行項目分析時,難以找到合適的效標,這時可以采用測評的總分代替效標,考察每個試題和總分的一致性,即叫做項目—總分分析。內部一致性的計算方法與項目效度相同,是用總分替代外在效標成績。

第三節(jié)測評的誘答分析

誘答就是指題目中除正確選項外的其他錯誤選項。誘答分析是指系統考察測試題目,主要目的在于避免猜測的影響,使題目真正反映應試者的真實情況。對于能力測評而言,其測評目的是對能力強和能力弱的被試進行區(qū)別。應該使不知道正確答案的被試對題目各個選項隨機選擇,每個選項被不知道答案的被試選擇的概率相同。對于以選擇題為形式的人格測評來說,沒有“誘答”問題。但是,對各個選項的分析也是必要的。在人格測評,尤其是在自陳量表的人格測驗中,選項的設計要力求避免社會贊許傾向。

誘答分析的方法首先,我們來看一個實例,這是一項能力測評中的一個題目:例:適合關系式|x-a|≤b(b>0)的點的集合是:

A.-a≤x≤aB.a—b≤x≤a+bC.-b≤x≤bD.x≥a+b

答案:?。

選擇每個選項的人數為:

A:12B:46C:12D:26

選擇每個選項的人數百分比為:

A:12.5%B:47.9%C:12.5%D:27.1%

題目的誘答是否合適,是觀測該題目的鑒別度指數D值。如果D值為正,往往意味著高分組傾向于選擇正確答案,而低分組傾向于選擇誘答;D值的大小表明了這種傾向性的程度。

進行誘答分析的最一般的方法,就是分別計算每個選項被選擇的次數。每個誘答被選擇的理想百分比=答錯的百分比/誘答數目。上例為17.3%。

在設計誘答時,要注意避免兩種情況:第一,不要出現過于容易被排除的誘答,這會使不知道正確答案的被試猜測正確的概率提高;第二,不要出現過于似真的選項,即欺騙性誘答。概念與思考題:

難度分析、鑒別度指數、欺騙性誘答、項目鑒別度、項目—

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論