義務(wù)教育學(xué)校紙筆考試等第化評(píng)價(jià)的緣由、技術(shù)與意義_第1頁(yè)
義務(wù)教育學(xué)校紙筆考試等第化評(píng)價(jià)的緣由、技術(shù)與意義_第2頁(yè)
義務(wù)教育學(xué)校紙筆考試等第化評(píng)價(jià)的緣由、技術(shù)與意義_第3頁(yè)
義務(wù)教育學(xué)校紙筆考試等第化評(píng)價(jià)的緣由、技術(shù)與意義_第4頁(yè)
義務(wù)教育學(xué)校紙筆考試等第化評(píng)價(jià)的緣由、技術(shù)與意義_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

摘要:義務(wù)教育學(xué)??荚嚪?jǐn)?shù)評(píng)價(jià)誤差較大,并被廣泛用于排名排序,違背了素質(zhì)教育的初衷。順應(yīng)新時(shí)代教育評(píng)價(jià)改革和“雙減”政策要求,在全面實(shí)施2022年版義務(wù)教育課程方案及各學(xué)科課程標(biāo)準(zhǔn)的背景下,義務(wù)教育學(xué)校應(yīng)努力破除傳統(tǒng)的考試分?jǐn)?shù)評(píng)價(jià),對(duì)總分實(shí)施等第化評(píng)價(jià),有效促進(jìn)學(xué)生學(xué)業(yè)與身心健康協(xié)同發(fā)展。等第劃分必須科學(xué)合規(guī)、合情合理,可通過(guò)吸納Angoff法和Bookmark法的優(yōu)點(diǎn),改良傳統(tǒng)的固定分?jǐn)?shù)法和百分位分?jǐn)?shù)法,應(yīng)用比較科學(xué)、可操作的簡(jiǎn)約型等第劃分技術(shù),提高等第化評(píng)價(jià)的準(zhǔn)確性。關(guān)鍵詞:學(xué)??荚?;等第評(píng)價(jià);等第劃分;Angoff法;Bookmark法鑒于義務(wù)教育學(xué)校紙筆考試采用傳統(tǒng)的分?jǐn)?shù)評(píng)價(jià)、排名排序評(píng)價(jià)存在諸多弊端,為切實(shí)扭轉(zhuǎn)這種不科學(xué)的教育評(píng)價(jià)導(dǎo)向,全面深化義務(wù)教育教學(xué)改革,促進(jìn)義務(wù)教育內(nèi)涵發(fā)展和質(zhì)量提升,有效減輕學(xué)生作業(yè)負(fù)擔(dān)和校外培訓(xùn)負(fù)擔(dān),中共中央、國(guó)務(wù)院在2020年印發(fā)了《深化新時(shí)代教育評(píng)價(jià)改革總體方案》,中共中央辦公廳、國(guó)務(wù)院辦公廳在2021年印發(fā)了《關(guān)于進(jìn)一步減輕義務(wù)教育階段學(xué)生作業(yè)負(fù)擔(dān)和校外培訓(xùn)負(fù)擔(dān)的意見(jiàn)》,教育部在2021年印發(fā)了《義務(wù)教育質(zhì)量評(píng)價(jià)指南》和《義務(wù)教育學(xué)??荚嚬芾淼耐ㄖ贰⒃?022年印發(fā)了2022年版義務(wù)教育課程方案及各學(xué)科課程標(biāo)準(zhǔn),以上政策文件均要求義務(wù)教育學(xué)校提高教育評(píng)價(jià)的科學(xué)性、專業(yè)性、客觀性,克服“唯分?jǐn)?shù)”的傾向,取消分?jǐn)?shù)評(píng)價(jià),實(shí)施考試成績(jī)等第化評(píng)價(jià)。2022年8月,浙江省教育廳發(fā)布了《關(guān)于小學(xué)生綜合評(píng)價(jià)改革的指導(dǎo)意見(jiàn)》,在地方上率先開(kāi)展了小學(xué)生綜合評(píng)價(jià)改革,著力推行“等級(jí)加評(píng)語(yǔ)”的評(píng)價(jià)方式。面對(duì)國(guó)家和地方層面對(duì)義務(wù)教育學(xué)校提出的等第化評(píng)價(jià)改革要求,很多校長(zhǎng)和學(xué)科教師思想上轉(zhuǎn)不過(guò)彎來(lái),不知道如何科學(xué)實(shí)施等第化評(píng)價(jià)。為此,筆者進(jìn)行了相關(guān)的理論探析。一、義務(wù)教育學(xué)校紙筆考試等第化評(píng)價(jià)的緣由必要的考試是教學(xué)工作的重要環(huán)節(jié)。針對(duì)義務(wù)教育學(xué)??荚嚕逃堪l(fā)布的《義務(wù)教育學(xué)??荚嚬芾淼耐ㄖ诽岢隽嗽S多明確的要求,如:小學(xué)一二年級(jí)不進(jìn)行紙筆考試,義務(wù)教育其他年級(jí)由學(xué)校每學(xué)期組織一次期末考試,初中年級(jí)從不同學(xué)科的實(shí)際出發(fā),可適當(dāng)安排一次期中考試;各地不得面向小學(xué)各年級(jí)和初中非畢業(yè)年級(jí)組織區(qū)域性或跨校際的考試;學(xué)校和班級(jí)不得組織周考、月考、單元考試等其他各類考試,也不得以測(cè)試、測(cè)驗(yàn)、限時(shí)練習(xí)、學(xué)情調(diào)研等各種名義變相組織考試;等等。義務(wù)教育學(xué)校采用紙筆考試的做法由來(lái)已久,問(wèn)題客觀存在;改用等第化評(píng)價(jià)方式不僅有政策依據(jù),而且有其不得不改的理由。(一)學(xué)校分?jǐn)?shù)評(píng)價(jià)的專業(yè)性不強(qiáng)當(dāng)前義務(wù)教育學(xué)校分?jǐn)?shù)評(píng)價(jià)專業(yè)性不強(qiáng),主要表現(xiàn)在以下三個(gè)方面。首先,教師命題能力低下,導(dǎo)致義務(wù)教育學(xué)校很難研制出高質(zhì)量的試卷。目前,大部分義務(wù)教育學(xué)校教師沒(méi)有經(jīng)過(guò)系統(tǒng)的命題技術(shù)培訓(xùn),也沒(méi)有參與過(guò)區(qū)域性統(tǒng)考命題工作,甚至不知道什么樣的試題是合格的試題、什么樣的試卷是合格的試卷。教學(xué)實(shí)踐中,一些教師只能簡(jiǎn)單地模仿或套用區(qū)域統(tǒng)考試卷或者其他名校試卷,依樣畫(huà)葫蘆地參考這些試卷的題型結(jié)構(gòu)、試題排序、題量分布和分?jǐn)?shù)結(jié)構(gòu)進(jìn)行學(xué)??荚嚸},而很少研究一份試卷對(duì)所考查的知識(shí)、能力和素養(yǎng)的內(nèi)容結(jié)構(gòu)效度,很少研究試題的難度及其區(qū)分度的結(jié)構(gòu),很少研究試題賦分技術(shù)和評(píng)分細(xì)則,等等。其次,試卷研制流程不規(guī)范,導(dǎo)致義務(wù)教育學(xué)校的試卷整體質(zhì)量低下。一份優(yōu)質(zhì)試卷的產(chǎn)生,須經(jīng)歷命題方案研制、雙向細(xì)目表研制、試題挑選與研制、組卷磨卷、審核定稿五個(gè)基本環(huán)節(jié)。雖然學(xué)校和教師都很重視考試,但是重視的是考試的安排及其分?jǐn)?shù)評(píng)價(jià),而不是命題流程的規(guī)范和命題的質(zhì)量。由于學(xué)??荚嚧螖?shù)較多,且各備課組人力有限,通常情況下各備課組每次命題只有一兩人參與;即便有審核者,審核者常常也只是做一遍試卷,對(duì)試題中的學(xué)科性錯(cuò)誤、答案是否正確進(jìn)行把關(guān)。由于教師日常工作量都比較大,命題者常常會(huì)省去制訂命題方案和雙向細(xì)目表這兩個(gè)流程,直接模仿他人試卷進(jìn)行挑題組卷。在命題流程和試卷質(zhì)量缺乏監(jiān)管的背景下,學(xué)??荚嚨脑囶}難度常常參差不齊,一些中學(xué)甚至常常出現(xiàn)學(xué)校考試難度高于中考的現(xiàn)象,有時(shí)還會(huì)出現(xiàn)一些不合格試題等命題的信效度問(wèn)題。最后,試卷批改過(guò)程不嚴(yán)謹(jǐn),會(huì)加大義務(wù)教育學(xué)??荚嚨脑u(píng)分誤差。一道標(biāo)準(zhǔn)的試題由題干(或情境)、設(shè)問(wèn)、答案和評(píng)分標(biāo)準(zhǔn)構(gòu)成。學(xué)校教師在命題的時(shí)候,常常會(huì)忽略了評(píng)分標(biāo)準(zhǔn)的設(shè)置。在沒(méi)有評(píng)分標(biāo)準(zhǔn)的情況下,極易產(chǎn)生不同閱卷者扣分尺寸不統(tǒng)一的問(wèn)題。在批改計(jì)算題、問(wèn)答題等題目時(shí),閱卷教師的主觀性、隨意性更大。此外,學(xué)校教師的閱卷任務(wù)較重。他們不像中考那樣只改一道小題,而常常需要批改一大組試題,因此通常不能保障試卷批改的精度。加上一般學(xué)校沒(méi)有像中考那樣設(shè)計(jì)雙評(píng)機(jī)制,可以對(duì)個(gè)別閱卷教師的評(píng)分誤差進(jìn)行及時(shí)糾偏,這便進(jìn)一步導(dǎo)致了這些學(xué)校試卷批改精度的下降。作為學(xué)科教學(xué)質(zhì)量的測(cè)量工具,義務(wù)教育學(xué)??荚嚤仨毦邆漭^高的信效度。然而,教師命題能力低下、命題過(guò)程粗放,勢(shì)必導(dǎo)致試卷質(zhì)量低劣,加上批改過(guò)程不嚴(yán)謹(jǐn),有可能會(huì)加大考試分?jǐn)?shù)的誤差,因此,這樣的學(xué)校考試常常不能精準(zhǔn)反映學(xué)生的學(xué)科水平高低。比如,學(xué)??荚嚦煽?jī)94分的學(xué)生的學(xué)科水平未必高于92分的學(xué)生的學(xué)科水平;排序?yàn)榈?0名的學(xué)生的學(xué)科水平未必高于第55名學(xué)生的學(xué)科水平。(二)等第化評(píng)價(jià)更加有利于學(xué)生的全面發(fā)展教育部辦公廳印發(fā)的《關(guān)于加強(qiáng)義務(wù)教育學(xué)??荚嚬芾淼耐ㄖ访鞔_規(guī)定:“義務(wù)教育學(xué)??荚嚸鎸?duì)的是未成年學(xué)生,主要發(fā)揮診斷學(xué)情教情、改進(jìn)加強(qiáng)教學(xué)、評(píng)價(jià)教學(xué)質(zhì)量等方面功能,除初中畢業(yè)生升高中考試(學(xué)業(yè)水平考試)外,其他考試不具有甄別、選拔功能?!保?]義務(wù)教育學(xué)校組織的各學(xué)科考試都是過(guò)程性考試,不是終結(jié)性考試;是低利害的考試,不是高利害的考試;是標(biāo)準(zhǔn)參照考試,不是常模參照考試;是過(guò)關(guān)性考試,不是選拔性考試。高利害考試、常模參照考試、選拔性考試、甄別性考試采用分?jǐn)?shù)評(píng)價(jià)方式,需要使用考試分?jǐn)?shù)給學(xué)生排名排序;低利害考試、標(biāo)準(zhǔn)參照考試、過(guò)關(guān)性考試、非選拔性和非甄別性考試沒(méi)有必要采取分?jǐn)?shù)評(píng)價(jià)的方式。教育部《關(guān)于加強(qiáng)義務(wù)教育學(xué)校考試管理的通知》要求義務(wù)教育階段學(xué)校期中期末考試實(shí)行等級(jí)評(píng)價(jià),一般分4至5個(gè)等級(jí)。國(guó)家義務(wù)教育質(zhì)量監(jiān)測(cè)將小學(xué)評(píng)價(jià)分為優(yōu)秀、合格、待合格3個(gè)等級(jí),初中分為優(yōu)秀、良好、合格、待合格4個(gè)等級(jí)。參考國(guó)家義務(wù)教育質(zhì)量監(jiān)測(cè)的做法和《關(guān)于加強(qiáng)義務(wù)教育學(xué)??荚嚬芾淼耐ㄖ芬?,筆者以為,小學(xué)階段的學(xué)??荚囋u(píng)價(jià)可以分為3至4個(gè)等級(jí),初中可以分為4至5個(gè)等級(jí)。各學(xué)??梢愿鶕?jù)本校的學(xué)生規(guī)模確定考試的等第層級(jí)數(shù):學(xué)生規(guī)模較大的,考試等第的層級(jí)可以多一些;學(xué)生規(guī)模較小的,考試等第的層級(jí)可以少一些。國(guó)家義務(wù)教育質(zhì)量監(jiān)測(cè)學(xué)科考試的性質(zhì)和功能與義務(wù)教育學(xué)校組織的各學(xué)科期中、期末考試相似。根據(jù)義務(wù)教育學(xué)校期中、期末考試的性質(zhì)和功能,采取等第化評(píng)價(jià)不僅可以有效評(píng)價(jià)學(xué)校的教學(xué)質(zhì)量,而且更加有利于學(xué)生的全面發(fā)展。二、兩種需要改良的學(xué)??荚嚨鹊趧澐址x務(wù)教育學(xué)校采用等第化評(píng)價(jià)方式,存在兩種較為常見(jiàn)的等第劃分法,一種是傳統(tǒng)的固定分?jǐn)?shù)法,另一種是百分位分?jǐn)?shù)法。目前來(lái)看,兩種等第劃分法都有待改良。(一)傳統(tǒng)的固定分?jǐn)?shù)劃分法很多學(xué)校傳統(tǒng)上以60分、70分、80分和90分作為學(xué)生成績(jī)合格、一般、良好和優(yōu)秀的劃界分?jǐn)?shù),而不管試卷中考了什么、試題的難度如何。事實(shí)證明:60分并不能成為判斷學(xué)生合格與否的“金”標(biāo)準(zhǔn),它較適用于預(yù)先設(shè)置通過(guò)率(常模參照測(cè)驗(yàn))的以選拔為目的的測(cè)驗(yàn)類型。而將60分作為標(biāo)準(zhǔn)參照測(cè)驗(yàn)的劃界分?jǐn)?shù)是一種主觀性的劃定,在許多情形下并不適合對(duì)學(xué)生進(jìn)行科學(xué)的評(píng)價(jià)[2]。同理,用70分、80分、90分劃線來(lái)區(qū)分一般、良好和優(yōu)秀也不夠科學(xué)、合理。根據(jù)這種等第劃分方法,如果整卷試題難度較大,評(píng)定為優(yōu)秀和良好的學(xué)生人數(shù)就會(huì)比較少,評(píng)定為合格和待合格的學(xué)生人數(shù)就會(huì)比較多;如果整卷試題難度較小,就會(huì)出現(xiàn)相反的現(xiàn)象。從橫向比較來(lái)看,同一次考試(如期末考試)不同學(xué)科考試的等第比例結(jié)構(gòu)差異較大,有可能會(huì)出現(xiàn)語(yǔ)文A很多、英語(yǔ)A很少等學(xué)科不均衡、不合理的現(xiàn)象。從縱向比較來(lái)看,也很容易出現(xiàn)同一個(gè)學(xué)生同一個(gè)學(xué)科前后兩次考試成績(jī)等第的異常變化現(xiàn)象,而變化的歸因很有可能是整卷試題的難度發(fā)生了變化,而不是學(xué)生學(xué)業(yè)真實(shí)的進(jìn)步或退步。因此,用傳統(tǒng)的固定分?jǐn)?shù)劃分等第不足以真實(shí)反映學(xué)生學(xué)業(yè)的進(jìn)步或退步。盡管這種傳統(tǒng)的固定分?jǐn)?shù)劃分法操作簡(jiǎn)便,但因?yàn)槿狈茖W(xué)依據(jù)而嚴(yán)重?fù)p害了考試的效度和信度,所以必須改良。(二)百分位分?jǐn)?shù)劃分法當(dāng)前各省(自治區(qū)、直轄市)統(tǒng)一實(shí)施的學(xué)業(yè)水平考試大多將百分位分?jǐn)?shù)作為分類的依據(jù),縣級(jí)學(xué)科考試也常常采用百分位分?jǐn)?shù)等第劃分法。一種情況為各等第比率一樣,如A(優(yōu)秀)、B(良好)、C(中等)、D(合格)、E(待合格)各占20%。另一種情況為各等第比率不一樣,如A(優(yōu)秀)占10%、B(良好)占20%、C(中等)占30%、D(合格)占35%或以上、E(待合格)占5%或以下。這兩種百分位分?jǐn)?shù)劃分法,劃出的等第結(jié)果與試卷難度無(wú)關(guān),與考試內(nèi)容無(wú)關(guān),具有縱向、橫向可比性,可用于增值性評(píng)價(jià)。但是,按照以上等第劃分法,不管試卷難度及學(xué)生課程目標(biāo)達(dá)成度,各等第整齊劃一,依然存在很大的弊端。簡(jiǎn)單來(lái)說(shuō),即便全體學(xué)生實(shí)際上都達(dá)到了課標(biāo)的要求,也會(huì)有20%或5%的學(xué)生被評(píng)定為E(待合格);即便全體學(xué)生實(shí)際上都沒(méi)有達(dá)到課標(biāo)要求,也有80%或95%的學(xué)生被評(píng)定為合格及以上等第,甚至還有20%的學(xué)生可能被評(píng)定為優(yōu)秀。百分位分?jǐn)?shù)劃分法實(shí)際上采用的是常模參照考試的做法,本質(zhì)上是將學(xué)生的表現(xiàn)與其他學(xué)生進(jìn)行比較,而這并不符合當(dāng)下基于課程標(biāo)準(zhǔn)的學(xué)??荚囋u(píng)價(jià)要求。可以說(shuō),它完全違背了基于標(biāo)準(zhǔn)的教育考試的初衷。因此,用百分位分?jǐn)?shù)劃分法劃分考試等第的做法,同樣必須改良。三、義務(wù)教育學(xué)??荚嚨鹊趧澐值娜N技術(shù)(一)Angoff法劃分技術(shù)美國(guó)心理學(xué)家威廉·安戈夫(WilliamAngoff)于1971年提出的Angoff法,是目前教育測(cè)量學(xué)中應(yīng)用十分廣泛的一種等第標(biāo)準(zhǔn)設(shè)置方法。該方法可根據(jù)各學(xué)科專家任務(wù)的不同進(jìn)一步細(xì)分為概率法和對(duì)錯(cuò)法兩種?!案怕史ā币髮W(xué)科專家判斷各等第表現(xiàn)考生能夠正確解答某題的概率值,概率值在0—1之間;“對(duì)錯(cuò)法”要求學(xué)科專家判斷各等第表現(xiàn)考生能否做對(duì)某題,能正確回答的題目賦值1,不能正確回答的賦值0,沒(méi)有中間值[3]。Angoff法的操作步驟有三個(gè):(1)形成最低能力(各等第)表現(xiàn)考生的概念;(2)學(xué)科專家判定測(cè)驗(yàn)的每一個(gè)題目并賦值(“概率法”賦值范圍為0—1之間的某一個(gè)數(shù)值,“對(duì)錯(cuò)法”賦值為0或1);(3)求出各學(xué)科專家對(duì)各等第最低能力表現(xiàn)考生判斷的總分,其平均值即各等第劃界分?jǐn)?shù)[4]。Angoff法常用于大型考試的劃界分?jǐn)?shù)設(shè)置,但該法側(cè)重0、1計(jì)分題目的劃界分?jǐn)?shù)設(shè)置,并不適用于多級(jí)計(jì)分的題目類型。Angoff法最大的優(yōu)點(diǎn)是直觀,且相對(duì)容易理解,評(píng)判結(jié)果數(shù)據(jù)的收集和分析也比較容易,但是對(duì)學(xué)科專家的學(xué)科教育測(cè)量能力要求很高,包括專家對(duì)學(xué)科課程標(biāo)準(zhǔn)的把握能力、對(duì)教學(xué)目標(biāo)的理解能力、對(duì)教與學(xué)效果的預(yù)測(cè)能力等。大部分一線教師很難對(duì)試題不同等第學(xué)生的得分率進(jìn)行精準(zhǔn)判斷,導(dǎo)致題目賦值誤差較大。因此,義務(wù)教育學(xué)??荚囋u(píng)價(jià)不建議直接采用這種等第劃分技術(shù)。(二)Bookmark法劃分技術(shù)Bookmark法最早是由Mitzel等在2001年進(jìn)行系統(tǒng)描述的基于項(xiàng)目反應(yīng)理論的設(shè)置標(biāo)準(zhǔn)等第劃界分?jǐn)?shù)的方法[5]10,是一種比較新的重要的標(biāo)準(zhǔn)設(shè)置方法[5]16,是近年來(lái)特別是在美國(guó)的K-12教育評(píng)價(jià)中得到廣泛應(yīng)用[5]11的一種標(biāo)準(zhǔn)設(shè)置方法。Bookmark法一般分為4個(gè)操作步驟。(1)采用項(xiàng)目反應(yīng)理論(IRT)對(duì)試題進(jìn)行項(xiàng)目反應(yīng)分析,將試題按照項(xiàng)目反應(yīng)理論難度從易到難進(jìn)行排列,每道試題放置一頁(yè),組成像書(shū)一樣的題冊(cè)。(2)有關(guān)學(xué)科專家以考試題目材料的難度參數(shù)值為基礎(chǔ),按照試題冊(cè)的順序討論每道題目,判斷等第中最低能力的考生答對(duì)所討論題目的概率是否在2/3以上:如果低于2/3,則評(píng)判專家在相應(yīng)的題目上放置書(shū)簽,以此作為設(shè)置劃界分?jǐn)?shù)的依據(jù)。(3)專家們反饋并討論第一次書(shū)簽放置結(jié)果,再次放置書(shū)簽。(4)向所有學(xué)科專家呈現(xiàn)所有書(shū)簽放置結(jié)果,參照前兩輪步驟開(kāi)展第三次討論,放置書(shū)簽,結(jié)束B(niǎo)ookmark程序,或者視情況再進(jìn)行第四輪、第五輪討論。此外,若加以延伸,可按照相同的步驟設(shè)置良好、優(yōu)秀等多重分?jǐn)?shù)線[5]11。在國(guó)內(nèi)的考試機(jī)構(gòu)中,掌握Bookmark法的人不多,相關(guān)研究文獻(xiàn)和實(shí)際應(yīng)用也較少。需要說(shuō)明的是,要想采用Bookmark法,必須利用項(xiàng)目反應(yīng)理論(IRT)對(duì)試題進(jìn)行項(xiàng)目反應(yīng)分析[5]11,而這是大部分學(xué)校教師難以做到的。因此,義務(wù)教育學(xué)??荚囋u(píng)價(jià)不建議采用這種等第劃分技術(shù)。(三)簡(jiǎn)約型等第劃分技術(shù)學(xué)科成績(jī)等第具有一定程度的標(biāo)簽效應(yīng),合適的等第評(píng)價(jià)對(duì)學(xué)生學(xué)習(xí)具有激勵(lì)和促進(jìn)作用。等第評(píng)價(jià)相對(duì)于分?jǐn)?shù)評(píng)價(jià)而言,雖然具有明顯的模糊性,但是仍然不能隨意化和主觀化,必須講究科學(xué)性、專業(yè)性和客觀性。面對(duì)常態(tài)化的期中、期末紙筆考試等第劃分工作,在各備課組教師普遍缺乏學(xué)科教育評(píng)價(jià)專業(yè)技能的情況下,義務(wù)教育學(xué)校不能簡(jiǎn)單模仿國(guó)家教育質(zhì)量監(jiān)測(cè)、省級(jí)教育質(zhì)量監(jiān)測(cè)和市級(jí)教育質(zhì)量監(jiān)測(cè)的做法采取Angoff法、Bookmark法等專業(yè)性很強(qiáng)的等第劃分技術(shù),必須找到一種更簡(jiǎn)易且更具可操作性的等第劃分技術(shù)。筆者團(tuán)隊(duì)基于Angoff法和Bookmark法,結(jié)合義務(wù)教育學(xué)校一線教師考試評(píng)價(jià)能力和評(píng)價(jià)工作的特點(diǎn),研制出了一種具有一定程度科學(xué)性和可操作性的簡(jiǎn)約型等第劃分技術(shù),該技術(shù)有下面三個(gè)操作步驟。第一步,構(gòu)建校本化等第結(jié)構(gòu)模型。校本化等第結(jié)構(gòu)模型有兩類。第一類模型側(cè)重客觀性評(píng)估功能。學(xué)??筛鶕?jù)多年來(lái)市級(jí)教育質(zhì)量監(jiān)測(cè)、省市中考、縣域期末統(tǒng)考中本校學(xué)生各等第占比數(shù)據(jù)和本校學(xué)生生源實(shí)際,擬建本校不同學(xué)段學(xué)生各等第比率結(jié)構(gòu)模型。平時(shí)學(xué)??荚嚫鞯鹊谇闆r分布可以與該模型相近。例如,若模型中A占34%、B占41%、C占22%、E占3%,則平??荚囍锌砂碅占35%、B占40%、C占20%、E占5%的比率結(jié)構(gòu)進(jìn)行設(shè)置。鑒于義務(wù)教育學(xué)校實(shí)行的是“劃片招生,就近入學(xué)”的政策,生源情況相對(duì)穩(wěn)定,這種基于大規(guī)模考試數(shù)據(jù)的模型也就相對(duì)可靠。第二類模型側(cè)重考試評(píng)價(jià)的促進(jìn)功能和激勵(lì)功能[6]。如:小學(xué)階段待合格比例約在5%以下,一二年級(jí)優(yōu)秀率約在70%及以上,三四年級(jí)優(yōu)秀率約在60%及以上,五六年級(jí)優(yōu)秀率約在50%及以上;初中階段待合格率比例約在10%以下、建議5%以下,七年級(jí)優(yōu)秀率約在50%以上,八年級(jí)優(yōu)秀率約在40%以上,九年級(jí)優(yōu)秀率約在30%以上。顯然,第二類模型的優(yōu)秀率和良好率比較高,待合格率很低,具有顯著的標(biāo)簽功能,會(huì)發(fā)生皮格馬利翁效應(yīng)。第二步,參考Angoff法、Bookmark法初擬劃線分。這一步,需要做好以下幾項(xiàng)工作。(1)統(tǒng)計(jì)難度值??荚囬喚砗?,統(tǒng)計(jì)每一道試題的得分率和得分值,同時(shí)按照校本化等第結(jié)構(gòu)模型計(jì)算不同等第學(xué)生的每一道試題的得分率和得分值,并按全體學(xué)生的難度大小由易到難排序,形成excel電子表;這些數(shù)據(jù)將成為學(xué)科專家的重要參考。(2)組建學(xué)科專家組。人數(shù)3—7個(gè),以本備課組教師為主,其他備課組教師為輔。如果都是本備課組教師,容易出現(xiàn)自我利益化傾向,從而影響劃線的公正性和客觀性。學(xué)科專家盡量選用有三年及以上教齡的比較優(yōu)秀的教師,優(yōu)先選用參與過(guò)命題、具有一定命題能力的教師。(3)作答試卷。統(tǒng)一時(shí)間、統(tǒng)一場(chǎng)所,組織學(xué)科專家作答試卷,并預(yù)測(cè)不同等級(jí)學(xué)生每一道試題的最低得分率。(4)研讀標(biāo)準(zhǔn)。當(dāng)場(chǎng)組織專家研讀本學(xué)科課程標(biāo)準(zhǔn)中的學(xué)業(yè)質(zhì)量水平描述和教學(xué)要求,微調(diào)自己對(duì)試題的預(yù)測(cè)值。(5)初擬劃線分。匯總統(tǒng)計(jì)各專家各試題的評(píng)價(jià)得分率、平均分和等第劃線分。組織學(xué)科專家討論交流,分析大家的預(yù)測(cè)數(shù)據(jù)和實(shí)考數(shù)據(jù),研討交流,初擬各等第劃線分。第三步,折中擬定各等第劃線分。先按校本化等第結(jié)構(gòu)模型,計(jì)算各等第的劃線分。再將專家組的預(yù)測(cè)劃線分和等第結(jié)構(gòu)模型進(jìn)行比較,取兩者平均值。例如,專家組劃線結(jié)果A占27%,等第結(jié)構(gòu)模型中A占31%,則本次考試可初擬A為29%。然后根據(jù)試卷難度、區(qū)分度、信效度、分?jǐn)?shù)分布和傳統(tǒng)習(xí)慣等因素,將各等第劃線分調(diào)整到最佳狀態(tài)。例如,把初擬的A占29%微調(diào)為占30%,根據(jù)30%的比率逆向劃定分?jǐn)?shù)線;同理,重新確定各等第劃線分,評(píng)定所有學(xué)生的等第。在這個(gè)環(huán)節(jié),要合理微調(diào)A(優(yōu)秀)和E(待合格)的劃線分。如果試卷難度很小,沒(méi)有60分以下的學(xué)生,則E(待合格)可以沒(méi)有;若96分以上學(xué)生很多,比率明顯超過(guò)等第結(jié)構(gòu)模型值,也可以都認(rèn)定為A(優(yōu)秀)。四、義務(wù)教育學(xué)校考試等第化評(píng)價(jià)的意義(一)有利于學(xué)生的身心健康根據(jù)考試分?jǐn)?shù)排名排序,異化分?jǐn)?shù)橫向比較,已經(jīng)成為當(dāng)下教學(xué)評(píng)價(jià)的頑疾。義務(wù)教育學(xué)校存在考試結(jié)果使用不當(dāng)?shù)韧怀鰡?wèn)題,違背素質(zhì)教育導(dǎo)向,造成學(xué)生應(yīng)考?jí)毫^(guò)大、心理負(fù)擔(dān)過(guò)重,損害了學(xué)生的身心健康?!翱伎伎迹蠋煹姆▽?;分分分,學(xué)生的命根?!边@種落后的考試觀和評(píng)價(jià)觀已經(jīng)嚴(yán)重影響了學(xué)生的身心健康。尤其是小學(xué)生,他們對(duì)數(shù)據(jù)差異特別敏感,相差一分,就感覺(jué)相差很大,會(huì)誤以為自己水平顯著低于別人,以為自己的學(xué)習(xí)成效不如他人,從而產(chǎn)生學(xué)習(xí)焦慮。又因?yàn)橥脂F(xiàn)象比較多,差異一兩分,位次排名有可能相差幾十名,會(huì)在無(wú)形中增加學(xué)生的心理負(fù)擔(dān)。再說(shuō),學(xué)校考試成績(jī)相差兩三分,都在誤差范圍以內(nèi)。消除分?jǐn)?shù)化評(píng)價(jià)是應(yīng)對(duì)“甄別與選拔功能”釜底抽薪的重要舉措,是“減負(fù)”最有效的手段之一。為了嚴(yán)格遵守評(píng)價(jià)的倫理規(guī)范,尊重學(xué)生人格,保護(hù)學(xué)生自尊心,學(xué)校對(duì)學(xué)生必須采取等第化評(píng)價(jià)。采取等第化評(píng)價(jià),沒(méi)有了排名排序,則有利于學(xué)生消除“與他人比較”“分分計(jì)較”的思想;也會(huì)大幅度減少考試作弊現(xiàn)象,有利于學(xué)生“誠(chéng)實(shí)”品格的養(yǎng)成;還會(huì)大幅度降低學(xué)生之間的學(xué)業(yè)競(jìng)爭(zhēng),有利于學(xué)生之間的合作學(xué)習(xí)。(二)有利于教師面向全體學(xué)生因材施教傳統(tǒng)的分?jǐn)?shù)評(píng)價(jià),導(dǎo)致教師普遍存在“第一名”“前三名”“前十名”的升學(xué)思想。如果班級(jí)中出現(xiàn)了“第一名”,就會(huì)標(biāo)榜出了“狀元”;如果班級(jí)中出現(xiàn)了“第二名”,就會(huì)鼓勵(lì)并大力支持“第二名”在下次考試中爭(zhēng)當(dāng)“狀元”;如果班級(jí)中出現(xiàn)了“第三名”,就會(huì)自我標(biāo)榜進(jìn)入了“前三甲”;如果班級(jí)中出現(xiàn)了“第四名”,就會(huì)鼓勵(lì)并大力支持“第四名”在下次考試中力爭(zhēng)進(jìn)入“前三甲”;如果班級(jí)中出現(xiàn)了“第十名”,就會(huì)標(biāo)榜進(jìn)入了“前十名”;如果班級(jí)中出現(xiàn)了“第十一名、第十二名”,就會(huì)鼓勵(lì)并大力支持他們?cè)谙麓慰荚囍辛?zhēng)進(jìn)入“前十名”。通常情況下,前十幾名學(xué)生的學(xué)科水平都處于同一個(gè)水平層次,沒(méi)有必要鼓勵(lì)和支持他們開(kāi)展過(guò)度的學(xué)業(yè)競(jìng)爭(zhēng)。在這種傳統(tǒng)的升學(xué)思想指引下,分?jǐn)?shù)評(píng)價(jià)誤導(dǎo)了一線教師格外關(guān)注優(yōu)等生的培育,而忽略了大量中等生和部分后進(jìn)生的培育。采取等第化評(píng)價(jià)以后,教師的關(guān)注對(duì)象將不再

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論