下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
考試質(zhì)量分析中的統(tǒng)計量數(shù)處理
過去,考試只是評分、評分和計算平均值,很少很少科學(xué)評價分數(shù)的可靠性和有效性。因此,有必要根據(jù)教育測量學(xué)和教育統(tǒng)計學(xué)的基本原理和方法,對原始分數(shù)進行處理和解釋,只有這樣才能對考生的真實水平以及對試題和試卷的質(zhì)量做出科學(xué)的比較和評價。筆者編制了名為Examanls(Examinationanalysis)的考試質(zhì)量分析專用軟件,簡要介紹考試質(zhì)量分析中,有關(guān)考試分數(shù)處理和解釋的基本原理及各統(tǒng)計量數(shù)的意義和優(yōu)缺點,以利于考試質(zhì)量分析的普及和推廣。1.分布分布的描述和分析1.1頻率分布算法根據(jù)統(tǒng)計學(xué)的中心極限定理,只要考生足夠多,他們的水平一般應(yīng)接近正態(tài)分布。判斷考分是否近似正態(tài)分布,最直觀和有效的方法是把考分的頻率分布曲線與均值和方差相同的正態(tài)分布曲線加以比較。但一般常見的考試,由于數(shù)據(jù)過少(只有數(shù)十到一二百名考生),分數(shù)分組不可能太細(否則大多數(shù)組別的頻率將會是零,從而顯示不出分數(shù)分布的規(guī)律性),不可能畫出光滑的頻率分布曲線,而只能代之以頻數(shù)多邊形或直方圖。Examanls提供傳統(tǒng)的按優(yōu)、良、中、及格和不及格分組的頻數(shù)直方圖(根據(jù)不同用戶的需要,也可提供等組距頻數(shù)直方圖)。頻數(shù)多邊形或直方圖雖然能給出分數(shù)分布的直觀圖像,但如需深入了解和準(zhǔn)確描述分數(shù)分布的全貌和特征,并與正態(tài)分布進行定量的比較,則必須進一步整理原始分數(shù)并計算出描述分數(shù)分布特征的各種統(tǒng)計量數(shù)。1.2集中量數(shù)的使用集中量數(shù)是描述一批分數(shù)的集中趨勢的量數(shù)。集中量數(shù)可用于參加同一考試的不同班級之間的比較。Examanls提供平均數(shù)、中數(shù)和眾數(shù)三個描述集中趨勢的統(tǒng)計量數(shù)。1.2.1考生數(shù)n本文中的平均數(shù)指的就是平均分,即原始分數(shù)的算術(shù)平均數(shù):其中xi是第i個考生的原始分數(shù),n是考生數(shù)。平均數(shù)具有嚴密、可靠、代表性強、容易計算和易于理解等優(yōu)點。其缺點是易受極端數(shù)值的影響,從而損害其代表性。1.2.2中數(shù)中數(shù)中數(shù)(又稱中值或中位數(shù))是指把所有考生的原始分數(shù)從高到代排列時,處于中間位置上的那個分數(shù)(如果考生人數(shù)為偶數(shù),則中數(shù)取處于中間位置的那兩個分數(shù)的平均值)。中數(shù)具有意義明確,不受極端數(shù)值影響的優(yōu)點。一旦平均數(shù)由于極端數(shù)值的存在而失去代表性時,中數(shù)則可作為這批數(shù)據(jù)的代表數(shù)值。中數(shù)的缺點是缺乏靈敏性,不如平均數(shù)可靠,不能用代數(shù)方法計算。1.2.3眾數(shù)可是的特點眾數(shù)(又稱為范數(shù)或密集數(shù))是原始分數(shù)中出現(xiàn)次數(shù)最多的分數(shù)。眾數(shù)只有在考生人數(shù)較多,且有明顯集中趨勢時才有意義。在考生人數(shù)較少的情況下,可能會沒有眾數(shù),也可能會出現(xiàn)兩個或兩個以上的眾數(shù)。然而,這些情況出現(xiàn)的幾率會隨著考生人數(shù)的增加而減少,因此在正常情況下,大型考試的眾數(shù)往往是惟一的。Examanls通過計算機的直接“觀察”得出眾數(shù)。眾數(shù)的特點是用頻數(shù)的多少來反映集中趨勢,不受極端數(shù)值的影響,其頻數(shù)在總體中所占的比重越大,其代表性也就越強;其缺點是在反映集中趨勢上不如平均數(shù)可靠,而且不能用代數(shù)方法準(zhǔn)確計算。1.3集中量數(shù)的代表性差異量數(shù)是描述一批分數(shù)的差異程度或離散趨勢的統(tǒng)計量數(shù)。集中量數(shù)是一個點,表示各分數(shù)圍繞該點而分布;差異量數(shù)則是一段距離,表示各分數(shù)與某一量數(shù)或與中心點間相差的統(tǒng)計距離。只有知道了差異量數(shù),才能了解集中量數(shù)的代表性。差異量數(shù)越大,集中量數(shù)的代表性就越小,反之亦然。Examanls提供全矩和標(biāo)準(zhǔn)差兩個描述離散趨勢的差異量數(shù)。1.3.1測試卷的基本結(jié)果應(yīng)符合以下四全距(又稱為極差或兩極差)是包含全部分數(shù)在內(nèi)的最小區(qū)間長度,即一批分數(shù)中的最高分數(shù)xmax與最低分數(shù)xmin之差:全矩在一定意義上反映了這批考生在學(xué)業(yè)水平上的最大差距。因此,如果xmax等于滿分分數(shù),或者xmin等于0分(或者兩者同時成立),則表明這份試卷無法測出考生水平的最大差距。要適當(dāng)調(diào)整部分試題的難度,才能測出考生真正的全矩。全矩具有計算簡單、意義明確的優(yōu)點,其缺點是完全取決于最高和最低這兩個極端分數(shù),而沒有反映出處于兩者之間的各分數(shù)的差異狀況,因此,用它來描述離散趨勢的代表性是很差的。1.3.2考試全距和標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是最為常用的、非常優(yōu)良的差異量數(shù),它能精確地描述分數(shù)分布的離散程度,其定義為:在分數(shù)呈正態(tài)分布時,全距約為6個標(biāo)準(zhǔn)差。在考生人數(shù)不太多的情況下,全距接近或超過滿分分數(shù)的1/2,而標(biāo)準(zhǔn)差約為全距的1/5~1/4時,分數(shù)的離散程度比較合理。如果全距和標(biāo)準(zhǔn)差都很小,則表明考生水平相近(既沒有拔尖的,也沒有太差的),或表明這份試卷未能測量出考生在學(xué)業(yè)水平上實際存在的差距。一般對于有數(shù)十(或更多)人參加的考試,第一種情況是十分罕見的。因此,一旦發(fā)現(xiàn)差異量數(shù)過小,首先應(yīng)從試卷上找原因。如果全距和標(biāo)準(zhǔn)差都很大,就表明考生的發(fā)展很不平衡(水平很高和水平很低的考生均不少,相對而言,處于平均分附近考生的則不算太多),這種高離散的情況在實踐中也是不多見的。1.4字段號形態(tài)量數(shù)是定量描述分布偏離正態(tài)程度的統(tǒng)計量數(shù)。Examanls提供偏態(tài)系數(shù)和峰態(tài)系數(shù)兩類形態(tài)量數(shù)。1.4.1偏態(tài)系數(shù)和次中心動差相對數(shù)如果分數(shù)呈對稱性分布(包括正態(tài)分布),其平均數(shù)、中數(shù)和眾數(shù)是重合的。一旦三者錯開,則表明分數(shù)偏離對稱分布。偏態(tài)系數(shù)就是描述分數(shù)偏離對稱分布程度的統(tǒng)計量數(shù)。Examanls提供用平均數(shù)—眾數(shù)比較法偏態(tài)相對數(shù)以及第三次中心動差相對數(shù)(即對均值的三階中心矩)來表示的兩個偏態(tài)系數(shù),其計算公式分別為:比較法只適用于微偏(分布曲線仍呈鐘形)的情況,動差法則既可用于微偏,也可用于極偏(分布曲線呈U形或J形)的情況。對稱分布的偏態(tài)系數(shù)S(包括Sx和Sm)為零;S>0為正偏態(tài)分布(對鐘形分布,一般會有X>Md>M0),表明分數(shù)高于平均分的考生比例小于50%;S<0為負偏態(tài)分布(對鐘形分布,一般會有M0>Md>X),表明分數(shù)高于平均分的考生比例大于50%。三種分布曲線的形狀如圖1所示。1.4.2正態(tài)分布曲線峰態(tài)系數(shù)是描述頻數(shù)分布曲線高峰形態(tài)(高聳程度)的統(tǒng)計量數(shù),一般以正態(tài)分布的高峰作為比較的標(biāo)準(zhǔn)。峰態(tài)可以用第四中心次動差相對數(shù)(即對均值的四階中心距)來描述。由于正態(tài)分布的第四次動差相對數(shù)等于3,習(xí)慣上把峰態(tài)系數(shù)定義為:K=0為正態(tài)高峰;K>0表示該分布曲線比正態(tài)分布曲線陡峭,為尖頂高峰;K<0則表示該分布曲線比正態(tài)分布曲線平緩,為平頂高峰(見圖2)。Examanls根據(jù)偏態(tài)系數(shù)和峰態(tài)系數(shù)的不同搭配,提供多種評價語句,顯示其對分數(shù)分布狀態(tài)的綜合評語,一旦出現(xiàn)嚴重偏離正態(tài)的情況,Examanls就會顯示警告語句,并提示出現(xiàn)這種情況的可能原因。根據(jù)Examanls提供的集中量數(shù)、差異量數(shù)和形態(tài)量數(shù)及其對分數(shù)分布狀況的評語,就能詳盡而精確地了解分數(shù)分布的全貌和特征,從而可以對考試的總體情況做出正確的判斷和評價。2.考試成績的表示方法、初始得分和導(dǎo)出得分2.1考生的學(xué)業(yè)水平和原始分數(shù)不高用百分制表示的原始分數(shù)無疑是使用最廣泛的成績表示法。然而,原始分數(shù)并不具有可比性,即使在同一考試中,原始分數(shù)和考生的學(xué)業(yè)水平也不存在簡單的比例關(guān)系。為正確解釋分數(shù)的意義和進行比較,就必須把原始分數(shù)轉(zhuǎn)換成具有比例量表性質(zhì)的導(dǎo)出分數(shù),從而得出有益于教學(xué)決策的信息。Examanls提供原始分數(shù)、名次、百分等級分、標(biāo)準(zhǔn)分、正態(tài)標(biāo)準(zhǔn)分和T分數(shù)等六種學(xué)生成績的表示方法,供用戶選擇。2.2百分等級分與原始分數(shù)把考生按原始分數(shù)從高到低順次排列,各考生所對應(yīng)的序號(原始分數(shù)相同的考生共占同一個序號)就是考生的名次。名次雖然能說明各考生在全體考生中所處的絕對位置,但名次的價值是隨考生人數(shù)的不同而不同的。顯然,30人的小班中的第十名和120人的大班中第十名是不能等值而論的。百分等級分更能夠反映出考生所處地位的相對位置量數(shù),它定義為比該考生成績差的考生占考生總數(shù)的百分比。在上述例子中(如果不存在并列第十名的話)前者的百分等級分只有66.7%,而后者則高達91.7%。百分等級分不但能確定各考生在全體中的相對位置,而且還能給出一些有關(guān)分數(shù)分布的信息。例如,把任意兩個原始分數(shù)所對應(yīng)的百分等級分相減,就可以知道成績處于這兩個原始分數(shù)之間(左開右閉區(qū)間)內(nèi)的考生比例。值得注意的是,名次或百分等級分與原始分數(shù)不是成比例的(或者說前兩者的單位不是等值的)。一般說來,在高分與低分兩個極端,名次和百分等級分對原始分數(shù)的反應(yīng)遲鈍,原始分數(shù)要有比較大的變化,名次或百分等級分才會跳動一個檔次;相反,在峰值分數(shù)附近它們反應(yīng)十分敏感,原始分數(shù)有一點點變化也會引起名次和百分等級分的極大波動。單位的不等值導(dǎo)致不能對名次和百分等級分進行代數(shù)處理。使用下文介紹的正態(tài)化標(biāo)準(zhǔn)分或T分數(shù)則能避免這個缺陷。2.3標(biāo)準(zhǔn)分的變分為比較測量結(jié)果,必須有一個等值的單位和一個特定的參照點。原始分數(shù)之所以不能直接進行比較,是因為分數(shù)的單位并不等值。不同的考試(由于難度不同)分數(shù)的單位固然不同,就連同一份試卷中的不同試題的分數(shù)單位也是不等值(甚至可以說是無定值)的。為使分數(shù)之間能夠進行比較,必須找到一個不變的測量參照點和一個對同批考生參加所有的考試都保持等值的測量單位。根據(jù)統(tǒng)計學(xué)原理,引入變換:可把一般的正態(tài)分布函數(shù)化為標(biāo)準(zhǔn)正態(tài)分布函數(shù)。標(biāo)準(zhǔn)正態(tài)分布函數(shù)的平均值恰好是0,其標(biāo)準(zhǔn)差恰好是1,這正好可以作為對任何正態(tài)分布都不變的參考點和等值單位。Z稱為標(biāo)準(zhǔn)分(或Z分數(shù)),它代表分數(shù)X距離平均分有多少個標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)分可用于不同考試、不同考生、甚至不同科目的考試之間進行相對位置的比較。例如,某考生數(shù)學(xué)和英語考試的原始分數(shù)分別為85和73分,而兩次考試的平均分分別為68和55分,標(biāo)準(zhǔn)差分別為12分和8分。如果只看原始分數(shù),人們可能會認為該考生的數(shù)學(xué)學(xué)得比英語好,然而,一旦變換為標(biāo)準(zhǔn)分:Z數(shù)=1.42和Z英=2.25,即可發(fā)現(xiàn),原來該考生的英語成績在班上的相對位置實際上比數(shù)學(xué)要高得多。從引入過程可知,僅當(dāng)分數(shù)呈(或接近)正態(tài)分布時,標(biāo)準(zhǔn)分才有其作為比較標(biāo)準(zhǔn)的意義。一旦分數(shù)分布較為嚴重地偏離正態(tài),就必須把標(biāo)準(zhǔn)分正態(tài)化后才能用于比較。為方便用戶,避免查找正態(tài)概率積分表的麻煩,Examanls采用曲線擬合法和比例插值法直接計算出各考生的正態(tài)化標(biāo)準(zhǔn)分(與其標(biāo)準(zhǔn)分并列顯示,通過比較可進一步了解分布偏離正態(tài)的程度)。正態(tài)化標(biāo)準(zhǔn)分(下文簡稱為標(biāo)準(zhǔn)分或Z分數(shù))不但具有可比性,而且還具有可加性,可以接受各種代數(shù)處理。例如,可以計算考生各門考試的加權(quán)平均標(biāo)準(zhǔn)分,從而確定各考生的總體學(xué)業(yè)水平在全體中的相對位置。標(biāo)準(zhǔn)分的意義明確、內(nèi)涵豐富是教育測量學(xué)中一個常用的導(dǎo)出分數(shù)。標(biāo)準(zhǔn)分的主要缺點是有負數(shù)和小數(shù)(對于正態(tài)分布而言,標(biāo)準(zhǔn)分多在-3到+3之間,而且往往是小數(shù));另外,標(biāo)準(zhǔn)分的0代表考生的分數(shù)等于平均分(而不是0分)等等,一般人對這種表示方法會感到不習(xí)慣,從而會給以后的統(tǒng)計分析帶來一定的麻煩。采用T分數(shù)就可以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 甘肅2025年甘肅省中醫(yī)藥研究院招聘高層次人才3人筆試歷年參考題庫附帶答案詳解
- 2025版智慧醫(yī)療健康項目承包服務(wù)合同2篇
- 昆明2025年云南昆明市五華區(qū)云銅中學(xué)合同制教師招聘筆試歷年參考題庫附帶答案詳解
- 新疆2025年新疆昌吉州引進人才65人筆試歷年參考題庫附帶答案詳解
- 2025年度個人住房公積金貸款合同(異地購房)4篇
- 2024年滬科新版九年級歷史上冊月考試卷
- 2025年浙教版九年級地理下冊階段測試試卷
- 2025年粵教滬科版八年級歷史上冊月考試卷
- 2025年度個人二手房翻新裝修工程合同書
- 2025年蘇人新版六年級語文下冊階段測試試卷
- 河北省滄州市五縣聯(lián)考2024-2025學(xué)年高一上學(xué)期期末英語試卷(含答案含含聽力原文無音頻)
- 邊防通行證委托書
- 腫瘤護士培訓(xùn)課件
- 《浸沒式液冷冷卻液選型要求》
- 中醫(yī)基礎(chǔ)理論-肝
- 小學(xué)外來人員出入校門登記表
- 《土地利用規(guī)劃學(xué)》完整課件
- GB/T 25283-2023礦產(chǎn)資源綜合勘查評價規(guī)范
- 《汽車衡全自動智能稱重系統(tǒng)》設(shè)計方案
- 義務(wù)教育歷史課程標(biāo)準(zhǔn)(2022年版)
- GB/T 2550-2016氣體焊接設(shè)備焊接、切割和類似作業(yè)用橡膠軟管
評論
0/150
提交評論