教育測量與評(píng)價(jià)_第1頁
教育測量與評(píng)價(jià)_第2頁
教育測量與評(píng)價(jià)_第3頁
教育測量與評(píng)價(jià)_第4頁
教育測量與評(píng)價(jià)_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

教育測量與評(píng)價(jià)(總14頁)-CAL-FENGHAI.-(YICAI)-CompanyOnel-CAL-本頁僅作為文檔封面,使用請(qǐng)直接刪除第一章、教育測量與評(píng)價(jià)的學(xué)科發(fā)展教育測量與評(píng)價(jià)教育測量1、 測量:根據(jù)法則給事物賦予數(shù)量。(史蒂文斯)測量:客觀事物及其屬性;所依據(jù)的規(guī)則或方法;數(shù)量化的結(jié)果。2、 教育測量:廣義:對(duì)于教育領(lǐng)域內(nèi)的事物或現(xiàn)象,根據(jù)一定的客觀標(biāo)準(zhǔn),作縝密地考核,并依據(jù)一定的規(guī)則將考核的結(jié)果予以數(shù)量的描述。狹義:是指對(duì)學(xué)生某些學(xué)科經(jīng)過學(xué)習(xí)和訓(xùn)練之后,所獲得的知識(shí)、技能的測量。又稱成就測量、學(xué)業(yè)成績測量或?qū)W科測量。3、 教育測量的特點(diǎn):間接性和推斷性測量對(duì)象的模糊性和測量誤差的不可避免性量表具有多樣性,結(jié)果具有相對(duì)抽象性測量目的的針對(duì)性教育評(píng)價(jià)評(píng)價(jià):評(píng):評(píng)定;價(jià):價(jià)值一一教育價(jià)值教育評(píng)價(jià):注重效果:美國的泰勒;注重資料的獲得:美國的克龍巴赫、斯塔弗爾比姆;注重評(píng)價(jià)方法、手段:中國的張秀理、日本的長谷川容1、教育評(píng)價(jià)的概念:教育評(píng)價(jià)是評(píng)價(jià)者對(duì)教育活動(dòng)或行為主客體價(jià)值關(guān)系、價(jià)值實(shí)現(xiàn)過程、結(jié)果及其意義的一種認(rèn)識(shí)活動(dòng)過程,其核心內(nèi)容是揭示教育活動(dòng)或行為中的客體對(duì)主體的需要、目標(biāo)的價(jià)值意義。教育測量與評(píng)價(jià)的關(guān)系聯(lián)系:教育測量就是指根據(jù)一定的理論、規(guī)則,運(yùn)用一定的測量工具對(duì)教育現(xiàn)象進(jìn)行數(shù)量化描述的過程教育評(píng)價(jià)是對(duì)教育現(xiàn)象狀態(tài)和價(jià)值的判斷,這一判斷是以對(duì)評(píng)價(jià)對(duì)象的客觀描述為前提的,沒有對(duì)評(píng)價(jià)對(duì)象的客觀描述,就不會(huì)有對(duì)評(píng)價(jià)對(duì)象價(jià)值的客觀判斷教育測量是教育評(píng)價(jià)的基礎(chǔ),教育評(píng)價(jià)要在教育測量所獲得的客觀信息的基礎(chǔ)上進(jìn)行.同時(shí),教育測量的結(jié)果要通過評(píng)價(jià)才能獲得實(shí)際意義.教育測量與評(píng)價(jià)的區(qū)別:第一,測量是對(duì)事物數(shù)量特征的獲得。而教育評(píng)價(jià)則是對(duì)教育現(xiàn)象客體的價(jià)值進(jìn)行判斷。第二,教育測量是一種純客觀的過程,其突出特點(diǎn)是客觀性。而教育評(píng)價(jià)則具有兩種屬性,即客觀性和主觀性第三,測量的任務(wù)是對(duì)事物的量的認(rèn)識(shí),而評(píng)價(jià)作為一種認(rèn)識(shí)活動(dòng),是人的意識(shí)對(duì)實(shí)踐活動(dòng)及其結(jié)果的綜合反映,它反映的是活動(dòng)的過程和終點(diǎn),又是新的實(shí)踐活動(dòng)的起點(diǎn)。教育測量與評(píng)價(jià)的產(chǎn)生與發(fā)展過程:一.教育測量的產(chǎn)生1904年以前(教育測量的萌芽期)中國的科舉制(隋煬帝大業(yè)二年,公元606年)科舉制的特征:逐級(jí)考核、制度完備、考場嚴(yán)格、命題規(guī)范科舉制的考核方法:口試、貼經(jīng)、墨義、策間、詩賦產(chǎn)生在中國、發(fā)展在西方美國賀拉斯曼1845年將“筆試”引入美國英國費(fèi)舍在1864年《作業(yè)量表集》美國賴斯在1897年的《拼字實(shí)驗(yàn)》1904—1915年教育測量的開拓期:美國桑代克的巨著《精神與社會(huì)測量導(dǎo)論》問世。標(biāo)志著以科學(xué)理論為指導(dǎo)的教育測量理論的誕生。桑代克在這本巨著中提出:無論什么東西,只要存在,總存在于數(shù)量之中麥克爾提出:任何東西,存在于數(shù)量中的,都可以被測量這就是后來人們說的“凡存在的東西必有數(shù)量;凡有數(shù)量的東西都可以測量”這兩句話,看成是構(gòu)成一切測驗(yàn)和量化評(píng)價(jià)的公理。1909年,桑代克根據(jù)“等距原理”發(fā)明了編制量表的單位,編制了標(biāo)準(zhǔn)化的測驗(yàn)量表。年教育測量的興盛期:在桑代克的影響下,教育測量的運(yùn)動(dòng)轟轟烈烈的開展測驗(yàn)品種有算術(shù)測驗(yàn)、書法測驗(yàn)、學(xué)科測驗(yàn)、智力測驗(yàn)、個(gè)性測驗(yàn)、興趣測驗(yàn)等,在數(shù)量上已有3000多種標(biāo)準(zhǔn)化測驗(yàn)的問世年教育測量的批判期:對(duì)教育測量批判的原因:教育測量雖然能使教育成就定量化、客觀化、標(biāo)準(zhǔn)化;但畢竟不能測量出人的學(xué)力和人格的全部內(nèi)容。第一次大戰(zhàn)以后,人們的教育觀點(diǎn)發(fā)生了很大的變化,不在將教育看成是單純的傳授知識(shí),而是將人的全面發(fā)展作為教育目標(biāo)。而人的全面的重要因素如:社會(huì)道德、人的情緒態(tài)度、動(dòng)機(jī)興趣、鑒賞力等是不能光靠測量的。教育測量存在的弊端:為測量而測量,盲目追求量化,忽視教育服務(wù)對(duì)象的整體目標(biāo)與價(jià)值。教育測量的理論基礎(chǔ)只有心理學(xué)、統(tǒng)計(jì)學(xué)和測量學(xué),而沒有教育學(xué)原理。二.教育評(píng)價(jià)的產(chǎn)生1、教育評(píng)價(jià)產(chǎn)生的社會(huì)背景:1929-1933年席卷美國、波及全球的經(jīng)濟(jì)大蕭條社會(huì)與教育危機(jī)四起生產(chǎn)過剩、工廠倒閉、工人下崗學(xué)校因經(jīng)濟(jì)不景氣,部分學(xué)校關(guān)閉,有些學(xué)校的班級(jí)減少。整個(gè)社會(huì)和教育皆處于反省之中1930年美國有25%的失業(yè),青年近乎100%找不到工作,1910年14—17歲的青年17%上大學(xué),而到1930年上升到51%。有相當(dāng)一部分人上高中并不想上大學(xué),而當(dāng)時(shí)的美國高中設(shè)課就是為了上大學(xué)服務(wù)的,為此中學(xué)設(shè)課與失業(yè)青年的需求就產(chǎn)生了尖銳的矛盾2、教育評(píng)價(jià)的起源:美國進(jìn)步主義聯(lián)盟負(fù)責(zé)人艾欽于1933—1940年領(lǐng)導(dǎo)了中學(xué)課程改革實(shí)驗(yàn)研究,其中課程評(píng)價(jià)委員會(huì)由俄亥俄州的州立大學(xué)教授泰勒主持,這就是美國教育歷史上著名的“八年研究”,也是教育評(píng)價(jià)問世的開始。八年研究的內(nèi)容:泰勒教授選了30所參加實(shí)驗(yàn)的高中學(xué)生,對(duì)這些學(xué)生進(jìn)行了4年中學(xué)、4年大學(xué)學(xué)習(xí)的追蹤研究,歷時(shí)“八年”,這也是“八年”研究的由來。當(dāng)時(shí)選進(jìn)步學(xué)校和和傳統(tǒng)學(xué)校學(xué)生各1475人,按性別、年齡、種族、學(xué)業(yè)能力傾向、家庭、社會(huì)環(huán)境、職業(yè)興趣和嗜好等基本原則進(jìn)行一一配對(duì),進(jìn)行比較。評(píng)價(jià)是八年研究的有機(jī)組成部分,泰勒認(rèn)為課程計(jì)劃和編制必須回答以下四個(gè)基本問題1、 應(yīng)幫助學(xué)生達(dá)到什么目標(biāo)?2、 為達(dá)到目標(biāo)應(yīng)幫助學(xué)生學(xué)習(xí)那些預(yù)期的知識(shí)?3、 怎樣組織學(xué)習(xí)過程才能使學(xué)生的學(xué)習(xí)成效最大?4、 怎樣評(píng)價(jià)教學(xué)方案結(jié)果發(fā)現(xiàn):來自實(shí)驗(yàn)的學(xué)生在大學(xué)四年中,每年獲學(xué)術(shù)性榮譽(yù)略多;具有更強(qiáng)的理智、好奇心和學(xué)習(xí)動(dòng)機(jī);思維更精密、更系統(tǒng)、更客觀;對(duì)教育的意義有更清晰的看法;對(duì)新情況有更強(qiáng)的應(yīng)變能力;具有更有效的解決問題的辦法;更多的參加有組織的學(xué)習(xí)團(tuán)體;獲得非學(xué)術(shù)的榮譽(yù)更多些;對(duì)職業(yè)的選擇有更好的定向;更積極的關(guān)注全國和全世界的事物。新舊課程比較結(jié)論:前三項(xiàng)經(jīng)統(tǒng)計(jì)檢驗(yàn)均存在顯著性差異記憶活動(dòng)傳統(tǒng)的高于進(jìn)步學(xué)校,但經(jīng)統(tǒng)計(jì)檢驗(yàn)兩者沒有顯著性差異教育評(píng)價(jià)的問世:八年研究后泰勒等人的研究結(jié)論是:舊課程及其教育測驗(yàn)是教科書主義,測驗(yàn)內(nèi)容只是要求學(xué)生記誦教材中的知識(shí),是片面的,不能反映學(xué)生的全面發(fā)展。泰勒提出:以全面發(fā)展的教育目標(biāo)為核心和依據(jù)的兩條相互依存的原理,即課程編制原理和評(píng)價(jià)活動(dòng)原理,也就是泰勒原理教育評(píng)價(jià)的創(chuàng)始人一泰勒:在八年工作報(bào)告中第一次提出教育評(píng)價(jià)這個(gè)報(bào)告被稱為“劃時(shí)代的教育評(píng)價(jià)宣言”宣布了教育評(píng)價(jià)的誕生給出了教育評(píng)價(jià)的原理、方法和手段奠定了泰勒---教育評(píng)價(jià)之父的地位同時(shí)也迎來了美國教育史上“泰勒時(shí)期的到來”3、 評(píng)價(jià)的發(fā)展:1940-1957年教育評(píng)價(jià)的平穩(wěn)期:特點(diǎn):教育評(píng)價(jià)的理論在不斷的進(jìn)行深入研究布魯姆完成教育目標(biāo)分類學(xué)教育評(píng)價(jià)活動(dòng)沒有普及這與當(dāng)時(shí)美國的歷史背景有關(guān),二戰(zhàn)后,美國處于“籌劃與享受生活的時(shí)代”。社會(huì)對(duì)教育的發(fā)展很少提出新的要求。1957—1972批判泰勒模式時(shí)期:特點(diǎn):1957年前蘇聯(lián)的人造衛(wèi)星上天引發(fā)美國對(duì)教育的不滿開始批判泰勒教育模式1972——現(xiàn)在專業(yè)化時(shí)期特點(diǎn):高等學(xué)校出現(xiàn)了許多教育評(píng)價(jià)的碩士、博士、博士后專業(yè)點(diǎn)各類教育評(píng)價(jià)研究中心紛紛建立如:美國有西密執(zhí)安大學(xué)評(píng)價(jià)中心、洛杉磯加里福尼亞大學(xué)研究中心等教育評(píng)價(jià)專著、雜志大量出版如:《評(píng)價(jià)研究》《評(píng)價(jià)評(píng)論》《評(píng)價(jià)信息》等4、 教育測量與評(píng)價(jià)的發(fā)展趨勢及特點(diǎn)教育測量的政治性得到強(qiáng)化教育測量的重心發(fā)生了變化教育測量的理論得到飛躍發(fā)展計(jì)算機(jī)技術(shù)的發(fā)展提高了測驗(yàn)的效率測驗(yàn)的統(tǒng)計(jì)模型為教育測量學(xué)科發(fā)展提供強(qiáng)有力的理論支持更加重視測量結(jié)果的解釋教育測量內(nèi)容的發(fā)展:評(píng)價(jià)方法由注重相對(duì)評(píng)價(jià)轉(zhuǎn)向重視絕對(duì)評(píng)價(jià)重視教育目標(biāo)研究教育評(píng)價(jià)研究中不斷引入新的研究方法越來越重視發(fā)展性教育評(píng)價(jià)理念和被評(píng)價(jià)者的參與越來越重視元評(píng)價(jià)越來越重視對(duì)評(píng)價(jià)結(jié)果的全面解釋和慎重處理第二章、教育測量與評(píng)價(jià)的基本原理教育評(píng)價(jià)與測量的類型一、 教育評(píng)價(jià)的分類1、 根據(jù)評(píng)價(jià)對(duì)象的層次和內(nèi)容來劃分:宏觀評(píng)價(jià):指對(duì)影響到全社會(huì)的那些指導(dǎo)、規(guī)范教育活動(dòng)的各種因素進(jìn)行的評(píng)價(jià)。微觀評(píng)價(jià):指對(duì)某項(xiàng)具體的教育活動(dòng)過程,對(duì)實(shí)施、管理教育活動(dòng)的組織與個(gè)人.對(duì)教育活動(dòng)指向的具體對(duì)象等內(nèi)容進(jìn)行的評(píng)價(jià)2、 按評(píng)價(jià)內(nèi)容的復(fù)合程度來劃分:單項(xiàng)評(píng)價(jià):指針對(duì)教育評(píng)價(jià)對(duì)象某一方面狀況進(jìn)行的評(píng)價(jià)。綜合評(píng)價(jià):指對(duì)評(píng)價(jià)對(duì)象狀況的方方面面作整體評(píng)價(jià)。3、 按評(píng)價(jià)的功能及用途來劃分:診斷性評(píng)價(jià):為使教育活動(dòng)的形式、內(nèi)容、過程等更適合活動(dòng)對(duì)象的自身?xiàng)l件及需要而進(jìn)行的評(píng)價(jià)。如:摸底考試。形成性評(píng)價(jià):在教育活動(dòng)過程中為不斷了解活動(dòng)進(jìn)行的狀況以便能及時(shí)對(duì)活動(dòng)進(jìn)行調(diào)整,進(jìn)而提高活動(dòng)質(zhì)量進(jìn)行的評(píng)價(jià)。如:單元測驗(yàn)。終結(jié)性評(píng)價(jià):指對(duì)教育活動(dòng)的效果進(jìn)行的評(píng)價(jià)。如:期末考試4、 按評(píng)價(jià)參照的標(biāo)準(zhǔn)來劃分:相對(duì)評(píng)價(jià):根據(jù)評(píng)價(jià)對(duì)象的實(shí)際狀況設(shè)定評(píng)價(jià)標(biāo)準(zhǔn)。評(píng)價(jià)標(biāo)準(zhǔn)在被評(píng)對(duì)象群體內(nèi)部產(chǎn)生。絕對(duì)評(píng)價(jià):依據(jù)某種需要或要求設(shè)定評(píng)價(jià)標(biāo)準(zhǔn)。評(píng)價(jià)標(biāo)準(zhǔn)在被評(píng)對(duì)象群體外部產(chǎn)生,且標(biāo)準(zhǔn)固定。個(gè)體內(nèi)差異評(píng)價(jià):以評(píng)價(jià)對(duì)象某一狀況作為設(shè)定評(píng)價(jià)標(biāo)準(zhǔn)依據(jù)的評(píng)價(jià)。5、 按評(píng)價(jià)主體來劃分:他人評(píng)價(jià):由活動(dòng)實(shí)施者以外的人作為評(píng)價(jià)主體進(jìn)行的評(píng)價(jià)。自我評(píng)價(jià):由活動(dòng)實(shí)施者作為評(píng)價(jià)主體進(jìn)行的評(píng)價(jià)。6、 按評(píng)價(jià)方法來劃分:定性評(píng)價(jià):采用開放的形式來獲取評(píng)價(jià)信息、對(duì)評(píng)價(jià)結(jié)果的性質(zhì)進(jìn)行說明的評(píng)價(jià)活動(dòng)。定量評(píng)價(jià):采用結(jié)構(gòu)式的方法,預(yù)先設(shè)定操作化的評(píng)價(jià)內(nèi)容,收集評(píng)價(jià)對(duì)象可以量化的信息,得出數(shù)量化結(jié)果的評(píng)價(jià)活動(dòng)。二、 教育測量的分類1、根據(jù)測驗(yàn)?zāi)繕?biāo)來劃分成就測驗(yàn):目標(biāo)在于測量學(xué)生在各學(xué)習(xí)階段學(xué)到了什么,旨在檢測教育目標(biāo)希望學(xué)生能達(dá)到的具體行為。如:學(xué)科測驗(yàn)如:教學(xué)階段測驗(yàn)(診斷和總結(jié)性測驗(yàn))能力測驗(yàn):旨在測量個(gè)體的不因外界環(huán)境影響而輕易改變的、較穩(wěn)定的、表現(xiàn)在認(rèn)知能力方面的心理特質(zhì).比如觀察力、記憶力、理解力、概括力、空間能力、判斷推理能力等等。也被稱為“智力測驗(yàn)”。能力傾向測驗(yàn):目的在于測量學(xué)生的潛在學(xué)習(xí)能力及學(xué)術(shù)發(fā)展趨向。潛在能力是指個(gè)體從未來教育或訓(xùn)練中可能受益的能力。這類測驗(yàn)主要用于預(yù)測學(xué)生的未來成就和能力,從而可以幫助決策者和學(xué)生自己選擇合適的學(xué)校、專業(yè)及最佳職業(yè)。能力傾向測驗(yàn)分為:一般學(xué)習(xí)能力測驗(yàn)、特殊能力傾向測驗(yàn)。2、 根據(jù)測驗(yàn)分?jǐn)?shù)的解釋標(biāo)準(zhǔn)來劃分常模參照測驗(yàn):目的在于考查被試的個(gè)體差異,一般用于衡量被試相對(duì)水平的,以選拔為目的的大規(guī)模測驗(yàn)。標(biāo)準(zhǔn)參照測驗(yàn):目的在于考查被試是否已達(dá)到某種標(biāo)準(zhǔn)。一般用于以教學(xué)目標(biāo)為標(biāo)準(zhǔn)考查學(xué)生實(shí)際水平的測驗(yàn)。常模團(tuán)體總體要明確常模團(tuán)體必須是被試總體的一個(gè)代表性樣本樣本的大小要適當(dāng)注意常模團(tuán)體的更新測驗(yàn)手冊(cè)中必須詳盡描述取樣過程常模參照測驗(yàn)與標(biāo)準(zhǔn)參照測驗(yàn)的比較:1、 從考試的目的和用途來看,它們都通過測量學(xué)生的學(xué)習(xí)成績,考查其優(yōu)劣,但常模參照性測驗(yàn)將考生成績做橫向比較,著眼于個(gè)別差異,主要用于選拔性測驗(yàn)和總結(jié)性測驗(yàn)等。2、 從考核目標(biāo)的陳述來看,都明確具體,為編制測驗(yàn)提供依據(jù),但常模參照性測驗(yàn)可采用一般目標(biāo)或具體目標(biāo),而標(biāo)準(zhǔn)參照性測驗(yàn)必須采取非常具體且詳細(xì)的目標(biāo)。3、 從題型的選擇和題目的分配來看,都需采用各種不同題型,試題必須是教學(xué)目標(biāo)的有代表性的樣本;常模參照性測驗(yàn)多采用選擇題,題目分散在全學(xué)科的全部知識(shí)領(lǐng)域內(nèi),題目按從易到難的順序排列;標(biāo)準(zhǔn)參照性測驗(yàn)較少依賴選擇題,題目分別分布在一定目標(biāo)中,題目按教學(xué)目標(biāo)順序排列即可。4、 從考試及考題的質(zhì)量要求來看,它們都按照標(biāo)準(zhǔn)化考試的編制原則,保證考試有較高的信度和效度;常模參照測驗(yàn)題目要求難易適中,強(qiáng)調(diào)題目的鑒別力,測驗(yàn)信度的估計(jì)適合用統(tǒng)計(jì)方法;標(biāo)準(zhǔn)參照測驗(yàn)的題目和學(xué)習(xí)結(jié)果直接聯(lián)系,不強(qiáng)調(diào)題目的鑒別力,測驗(yàn)信度的估計(jì)不適合用統(tǒng)計(jì)方法。5、 從解釋考試結(jié)果的依據(jù)及分?jǐn)?shù)的意義來看,兩種考試各有其依據(jù);常模參照性測驗(yàn)的常模是解釋分?jǐn)?shù)的標(biāo)準(zhǔn),用地位量數(shù)表示考生在團(tuán)體中的相對(duì)位置;標(biāo)準(zhǔn)參照性測驗(yàn)中教學(xué)目標(biāo)是解釋分?jǐn)?shù)的標(biāo)準(zhǔn),以考生完成題目數(shù)量的百分比來表示考生的學(xué)習(xí)效果。3、 根據(jù)教育測量的標(biāo)準(zhǔn)化程度來劃分:標(biāo)準(zhǔn)化測驗(yàn):指測驗(yàn)的編制、實(shí)施、記分、分?jǐn)?shù)的解釋有統(tǒng)一標(biāo)準(zhǔn)和嚴(yán)格規(guī)定的大規(guī)模的測驗(yàn)標(biāo)準(zhǔn)化測驗(yàn)的程序:確定考試目的;編制考試藍(lán)圖(命題雙向細(xì)目表);命題、組卷、試測、入庫;實(shí)測;評(píng)分,統(tǒng)計(jì)分析;寫出指導(dǎo)書。教師自編測驗(yàn):教師根據(jù)教學(xué)情況自己編制測題對(duì)學(xué)生進(jìn)行的測驗(yàn)。4、 以測量人數(shù)多少來劃分:團(tuán)體測驗(yàn)個(gè)人測驗(yàn)5、 根據(jù)所使用的材料和形式來劃分:語言文字測驗(yàn)非語言文字測驗(yàn)教育測量與評(píng)價(jià)量表心理學(xué)家史蒂文斯根據(jù)測量的精確程度把量表從低級(jí)到高級(jí)分成名稱量表、順序量表、等距量表和比率量表。名稱量表:意義:依照某種法則給事物及屬性指派名稱或類別的量表。功能:區(qū)分性。數(shù)量化結(jié)果的含義:不能比較大小。適用的統(tǒng)計(jì)方法:次數(shù)的統(tǒng)計(jì),如次數(shù)、眾數(shù)、百分比、離散相關(guān)、卡方檢驗(yàn)等。順序量表:含義:依照某種法則給事物或人的心理現(xiàn)象指派名稱或類別,還可以將分類結(jié)果按數(shù)量大小進(jìn)行排序。功能:區(qū)分性、順序性數(shù)量化結(jié)果的含義:比較大小,不能進(jìn)行運(yùn)算。適用的統(tǒng)計(jì)方法:中位數(shù)、百分位數(shù)、等級(jí)相關(guān)系數(shù)、肯德爾和諧系數(shù)以及秩次的方差分析。等距量表(區(qū)間量表):含義:在給事物及屬性指派數(shù)字和符號(hào)時(shí),要求各數(shù)字或等級(jí)之間的差距是相同的,即具有相等的單位。功能:區(qū)分性、順序性、等距性數(shù)量化結(jié)果的含義:不僅能分類、排序,還可以進(jìn)行加減運(yùn)算。適用的統(tǒng)計(jì)方法:均數(shù)、標(biāo)準(zhǔn)差、相關(guān)系數(shù),t、F檢驗(yàn)等比率量表:含義:有相等單位和絕對(duì)零點(diǎn)的量表。功能:區(qū)分性、順序性、等距性、絕對(duì)零點(diǎn)。數(shù)量化結(jié)果的含義:可以進(jìn)行加減乘除四則運(yùn)算。適用的統(tǒng)計(jì)方法:均數(shù)、幾何平均數(shù)、標(biāo)準(zhǔn)差、相關(guān)系數(shù),變異系數(shù)、t、F檢驗(yàn)等。教育測量與評(píng)價(jià)的基本原則1、 教育測量與評(píng)價(jià)原則的性質(zhì)(1) 教育測量與評(píng)價(jià)原則是在教育測量與評(píng)價(jià)實(shí)踐活動(dòng)中總結(jié)出來的具有普遍性問題基礎(chǔ)上提出的。(2) 教育測量與評(píng)價(jià)原則反映了人們對(duì)開展教育測量與評(píng)價(jià)活動(dòng)的總體要求。(3) 教育測量與評(píng)價(jià)原則具有相對(duì)穩(wěn)定性。2、基本原則(1)方向性原則:指通過評(píng)價(jià)內(nèi)容和標(biāo)準(zhǔn)等的制定、評(píng)價(jià)過程的側(cè)重、評(píng)價(jià)結(jié)果的肯定與否定等推動(dòng)教育活動(dòng)貫徹國家的教育方針,進(jìn)而滿足社會(huì)需求,保持良性發(fā)展的方向。(2) 客觀性原則:指評(píng)價(jià)主體要以真實(shí)的資料為基礎(chǔ),對(duì)教育活動(dòng)過程和成果作出客觀的價(jià)值判斷。(3) 激勵(lì)性原則:指教育評(píng)價(jià)應(yīng)促使評(píng)價(jià)對(duì)象形成繼續(xù)努力或在進(jìn)一步的活動(dòng)中改善不足之處,提高活動(dòng)效果的動(dòng)機(jī)或期望。(4) 計(jì)劃性原則:指教育評(píng)價(jià)活動(dòng)的開展及教育評(píng)價(jià)活動(dòng)過程應(yīng)根據(jù)教育活動(dòng)的開展而有計(jì)劃有序地進(jìn)行。(5) 實(shí)效性原則:指教育評(píng)價(jià)過程應(yīng)根據(jù)評(píng)價(jià)的目的與內(nèi)容、評(píng)價(jià)對(duì)象的具體情況、具體的社會(huì)環(huán)境背景等作出切合實(shí)際的評(píng)價(jià)計(jì)劃,采用適宜的評(píng)價(jià)方法使評(píng)價(jià)能有效地對(duì)教育活動(dòng)提供指導(dǎo)與幫助。(6) 平等性原則:指教育評(píng)價(jià)實(shí)施者應(yīng)以與評(píng)價(jià)對(duì)象共同探討教育活動(dòng)得失的平等身份進(jìn)入評(píng)價(jià)活動(dòng),使評(píng)價(jià)對(duì)象將評(píng)價(jià)者作為朋友接受其評(píng)價(jià),采納其意見或建議。第三章、編制教育測驗(yàn)的一般原理和方法布魯姆的教育目標(biāo)分類系統(tǒng)把教育目標(biāo)分成三個(gè)領(lǐng)域:1、認(rèn)知領(lǐng)域;2、情感領(lǐng)域;3、動(dòng)作技能領(lǐng)域。1、認(rèn)知領(lǐng)域目標(biāo)分類:布盧姆把認(rèn)知領(lǐng)域的教育目標(biāo)分為六級(jí):知道、領(lǐng)會(huì)、運(yùn)用、分析、綜合、評(píng)價(jià)。1、 知道:指對(duì)先前學(xué)習(xí)過的知識(shí)材料的簡單回憶.“知道”又叫“知識(shí)”,是認(rèn)知領(lǐng)域中最低水平的認(rèn)知結(jié)果,它所要求的心理過程主要是記憶。2、 領(lǐng)會(huì)領(lǐng)會(huì)亦稱理解或領(lǐng)悟,是指將一種語言準(zhǔn)確地轉(zhuǎn)化成另一種語言。它又可分為轉(zhuǎn)化、解釋和推斷三種。3、 運(yùn)用指在具體的情境中使用抽象概念,是對(duì)所學(xué)知識(shí)的初步運(yùn)用.運(yùn)用代表了較高水平的理解,比如用二元一次方程解答工程性質(zhì)的應(yīng)用題,又如把其它文獻(xiàn)中已經(jīng)提出來的新論點(diǎn)用來引證自己類似的實(shí)驗(yàn)結(jié)果。4、 分析指將一種傳播內(nèi)容分解成為它的組成因素和組成部分,以便弄清各種觀念之間的關(guān)系。5、 綜合指將各種要素及組成部分組成一個(gè)整體,以構(gòu)成更為清楚的模式或結(jié)構(gòu)。綜合強(qiáng)調(diào)的是創(chuàng)造能力。6、 評(píng)價(jià)指為了一定的目的,對(duì)某些觀念和方法等的價(jià)值作出判斷。包含根據(jù)內(nèi)部準(zhǔn)則判斷和依據(jù)外部準(zhǔn)則判斷兩方面的內(nèi)容。2、對(duì)布魯姆教育目標(biāo)分類的評(píng)價(jià):-從教育目標(biāo)劃分標(biāo)準(zhǔn)來看,布魯姆所用的標(biāo)準(zhǔn)是測量學(xué)的,無論是知識(shí)、領(lǐng)會(huì)、應(yīng)用、分析、綜合還是評(píng)價(jià)每一個(gè)教育目標(biāo)都是圍繞著如何測量或操作的角度提出的。-布魯姆的教育目標(biāo)分類便于全面描述教學(xué)目標(biāo)和評(píng)定教學(xué),但未揭示各級(jí)層次的智力技能的心理機(jī)制,因而無法指導(dǎo)教師用什么方法或提供什么學(xué)習(xí)條件來實(shí)現(xiàn)教學(xué)目標(biāo)。-總結(jié):教育目標(biāo)分類系統(tǒng)對(duì)認(rèn)知領(lǐng)域中的教學(xué)目標(biāo)由低到高進(jìn)行劃分,符合能力由簡單到復(fù)雜發(fā)展原則。認(rèn)知領(lǐng)域分類標(biāo)準(zhǔn)是測量學(xué)的,有利于指導(dǎo)學(xué)習(xí)結(jié)果的測量與評(píng)價(jià)。3、測驗(yàn)題目類型與測量功能:-測驗(yàn)題目分類:選擇型和供答型。-選擇型一般要求被試在幾個(gè)選項(xiàng)中選擇正確的答案,如是非題、匹配題、選擇題等,后者要求被試自己提供答案,如論文題、簡答題、填空題等。-若根據(jù)被試作答的范圍和評(píng)分方法不同,又可分為主觀性試題和客觀性試題。客觀性試題主要是因?yàn)樵u(píng)分客觀而得名,它的正確答案在測驗(yàn)前就已準(zhǔn)備好,不同評(píng)分者各自獨(dú)立評(píng)分,所得結(jié)果基本上是相同的??陀^性試題一般適用于測量知識(shí)的掌握、理解、應(yīng)用、分析幾個(gè)層次的教學(xué)目標(biāo)??陀^性試題的答案明確,作答簡便,因而在限定的時(shí)間內(nèi)測驗(yàn)可以包含足夠數(shù)量的試題,能保證對(duì)知識(shí)內(nèi)容的覆蓋。主觀性試題主要包括論述題、操作題和作文題等。它們適合于測量較高層次的教學(xué)目標(biāo),尤其適合于測量綜合、評(píng)價(jià)等目標(biāo)層次。主觀性試題鼓勵(lì)被試積極地組織所學(xué)的資料,表達(dá)自己的觀點(diǎn)。被試在作答時(shí),耗費(fèi)的時(shí)間較長,在限定的時(shí)間內(nèi),試題數(shù)量不可能太多,對(duì)知識(shí)的覆蓋面較小。由于沒有明確統(tǒng)一的標(biāo)準(zhǔn)答案,評(píng)分易受評(píng)閱者的主觀因素影響,因而誤差較大。一、客觀性試題的類型及其編寫技巧選擇題結(jié)構(gòu)選擇題是由一個(gè)題干和幾個(gè)選項(xiàng)組成。題十一般是問題或待完成的句子,選項(xiàng)是幾個(gè)真假不明的答案,讓被試從中選出正確的答案。優(yōu)缺點(diǎn)優(yōu)點(diǎn):(1)可以用來測量學(xué)生各種不同層次的學(xué)習(xí)結(jié)果。評(píng)分標(biāo)準(zhǔn)統(tǒng)一、客觀,可以利用電腦評(píng)卷,提高評(píng)卷的速度和自動(dòng)化水平。可以加大試題容量,抽取廣泛有效的代表性樣本,使試題覆蓋的知識(shí)范圍廣。有利于考查被試思維的敏捷性和準(zhǔn)確的判斷力。采用大量的似真選擇項(xiàng)使結(jié)果易于診斷,通過對(duì)學(xué)生錯(cuò)誤選項(xiàng)的分析便于發(fā)現(xiàn)學(xué)生在學(xué)習(xí)中存在的問題,以便及時(shí)糾正。缺點(diǎn):編制選擇題較花費(fèi)時(shí)間,且需要專門的命題技巧。難以考核被試完全的推理能力、綜合運(yùn)用所學(xué)知識(shí)的能力、有效的總結(jié)能力、嚴(yán)密的表述能力和寫作能力和被試的發(fā)散思維(或求異思維)能力。無法測量被試的思維(解題)過程。被試可以憑猜測而選中正確答案。編寫原則題干意義完整并能表達(dá)一個(gè)確定的問題。題干簡明,盡量不使用過于復(fù)雜的字詞與語句結(jié)構(gòu),也不要使用過長的語句。題干盡量不使用否定結(jié)構(gòu)。誘答項(xiàng)應(yīng)具有似真性。使用學(xué)生共同的錯(cuò)誤觀念或過失來作為誘答項(xiàng)。以學(xué)生慣用的模糊性用語敘述誘答項(xiàng)。在正確選項(xiàng)和誘答項(xiàng)中使用同樣“精確的”、“重要性”等詞語來敘述。誘答項(xiàng)的長度和措辭的復(fù)雜性與正確選項(xiàng)相似。在誘答項(xiàng)中使用額外的線索。如固定的用詞,具有科學(xué)味道的答案,以及和題干有語義上的聯(lián)系等。保持選項(xiàng)之間的同質(zhì)性。不能對(duì)正確答案有任何暗示同一測驗(yàn)中每一個(gè)測驗(yàn)試題之間應(yīng)相互獨(dú)立避免牽連選項(xiàng)的文字表述,力求簡短精煉。⑻應(yīng)盡量避免“以上皆是”、“以上皆非”的選項(xiàng)是非題是非題又叫做二項(xiàng)選擇題,它通常是給被試一個(gè)句子要被試作出正誤的判斷。1、 優(yōu)點(diǎn):編制容易。(2)記分客觀,取樣廣泛。缺點(diǎn):僅能測量知識(shí)層次中最基本的結(jié)果,無法測量高層次的學(xué)習(xí)結(jié)果。受猜測因素的影響很大。編寫原則考核的內(nèi)容應(yīng)是重要的知識(shí),應(yīng)有考核價(jià)值。題目應(yīng)多是測量理解能力,而不應(yīng)測驗(yàn)記憶性的知識(shí),更不要直接抄錄教科書中的句子。一個(gè)題目中只能有一個(gè)中心問題,或一個(gè)重要概念,避免兩個(gè)以上的概念在同一題中出現(xiàn)。試題應(yīng)做到是非界限分明,用詞準(zhǔn)確,避免模棱兩可的語句。題目陳述應(yīng)簡單明了,避免使用復(fù)雜的句子結(jié)構(gòu),以減少因被試的閱讀能力而對(duì)測量產(chǎn)生的不良影響,應(yīng)盡量采用正面敘述,避免用否定和雙重否定的語句。填空題1、 優(yōu)缺點(diǎn):填空題可用來考查被試對(duì)知識(shí)的記憶和理解能力,在診斷性測驗(yàn)中特別適用。受被試猜測的影響小,評(píng)分比較客觀。但填空題偏重于測量被試的知識(shí)記憶程度,使用過多容易養(yǎng)成被試死記硬背的習(xí)慣。2、 編制原則:題意要明確、限定要嚴(yán)密,使空白處應(yīng)填的答案是唯一的。(2)空白中所填寫的應(yīng)是關(guān)鍵詞語,并且要和上下文有密切的關(guān)系題目中空白地方不能太多,以免句子變得支離破碎,不利于被試?yán)斫忸}意。通常一個(gè)填空題不應(yīng)超過兩個(gè)空白。盡量將空白放在句子的后面或中間,而不要放在句子開頭。所有空白處的線段長度應(yīng)當(dāng)一致,不能隨正確答案文字的多少而長短不一,以免產(chǎn)生暗示作用。若答案是數(shù)字,應(yīng)指明單位和數(shù)字的精確程度。簡答題特點(diǎn)簡答題適合測量被試對(duì)基本知識(shí)、概念和原理的掌握、記憶情況。編制較為簡單、靈活,可以從不同角度、不同方向考慮,增大對(duì)知識(shí)考核的準(zhǔn)確度和深度,并且不受猜測因素的影響。但其無法考核綜合、分析、評(píng)價(jià)等高層次的教學(xué)目標(biāo);且評(píng)分也不夠客觀,有不同程度的正確或部分正確的答案而影響評(píng)分的客觀性。編制原則:問題的敘述要明確,要確實(shí)能使被試用簡單的語言來回答。問題的答案應(yīng)該只有一個(gè),并且答案要簡短具體。避免出只考機(jī)械記憶的題,應(yīng)注重知識(shí)的應(yīng)用。在考查某公式的應(yīng)用時(shí),不要給太復(fù)雜的數(shù)字,以免給計(jì)算帶來麻煩。盡可能使用直接問句來提出問題。二、主觀性試題的類型及其編寫要領(lǐng)(一)論述題論述題就是向被試提出問題,需要被試用自己的語言組成一份較長答案的試題。1、 優(yōu)點(diǎn):可以用來進(jìn)行高層次的、復(fù)雜的學(xué)習(xí)結(jié)果的測量,可以用在各種學(xué)科領(lǐng)域,特別適用于社會(huì)科學(xué)、人文科學(xué)等。可以增進(jìn)學(xué)生的思考、應(yīng)用及解決問題的能力,對(duì)于被試的學(xué)習(xí)態(tài)度和學(xué)習(xí)方式可以產(chǎn)生積極的影響。可以促進(jìn)學(xué)生寫作能力的提高。試題的編制比較容易,并且受猜測因素的影響很小。缺點(diǎn):由于論述題一般都比較大,在一次考試中試題的數(shù)量不可能有很多,因此,其取樣范圍比較小且不均勻,影響測驗(yàn)的效度。評(píng)分的主觀性強(qiáng)。因被試回答過于自由,回答方向又不盡相同,難于測得預(yù)期結(jié)果,重點(diǎn)容易失控。被試作答和評(píng)分閱卷都相當(dāng)費(fèi)時(shí)。編制原則:試題應(yīng)該用來測量較高層次的教學(xué)目標(biāo)。如要求學(xué)生提出理由、解釋變量間的關(guān)系、描述與評(píng)價(jià)資料、有系統(tǒng)地陳述結(jié)論等。要明確而系統(tǒng)地陳述問題,使被試能清楚地了解題目的要求。應(yīng)采用答案具有統(tǒng)一定論的試題。一般不允許被試選擇問題回答。為避免被試將時(shí)間集中在某一個(gè)他所不會(huì)做的題目上而影響對(duì)其他題目的回答,因此而影響考試成績的真實(shí)性,最好在題目中能給出回答本題所需的參考時(shí)間。(二)作文題作文是對(duì)人的邏輯思維、形象思維、書面表達(dá)等多種能力的一種綜合考查。編制原則:根據(jù)考試的目的和需要確定考試作文的文體要求。根據(jù)社會(huì)的需要、現(xiàn)實(shí)生活和學(xué)生的實(shí)際設(shè)計(jì)命題。要根據(jù)被試的特點(diǎn)確定選材范圍與寫作意圖,在確定選材和寫作意圖時(shí),要考慮對(duì)所有被試都是公平的,并且試題應(yīng)符合被試的心理特征。要給被試以發(fā)揮的余地。第四章試卷質(zhì)量分析與評(píng)價(jià)質(zhì)量分析:項(xiàng)目分析:難度、區(qū)分度整體分析:信度、效度1、難度的含義:指測題的難易程度,是指題目對(duì)學(xué)生知識(shí)和能力水平的適合程度的指標(biāo)。用P表示。難度的計(jì)算:1、 題目分?jǐn)?shù)為二分變量:正確率P=R/N答對(duì)人數(shù)/全體人數(shù)適用題型:選擇題、填空題、判斷題等\?丁二平均得分.尸二 *2、 題目分?jǐn)?shù)為多分值:得分率,上*...由’擇適用題型:填空題、簡答題、論述題、計(jì)算題、作文題等難度取值范圍:0-1之間卷面難度:試卷包含的所有試題難度的平均數(shù)。常模參照測驗(yàn)難度取值范圍:試題:之間;卷面:之間基于難度的題目分析:-難度過低與過高的題目原則上要淘汰,但屬于必考的知識(shí)點(diǎn),需重新命題,提高命題的難度-由于出現(xiàn)科學(xué)性錯(cuò)誤而導(dǎo)致難度不符,需重新命題-命題、內(nèi)容均無大問題但難度不符的題目需進(jìn)行詳細(xì)分析找出原因所在2、區(qū)分度的含義:是指測驗(yàn)題目對(duì)學(xué)業(yè)水平不同的考生的區(qū)分程度或鑒別能力。區(qū)分度的計(jì)算方遂_1、點(diǎn)二列相施m-X一PbStp為該題答對(duì)人數(shù)比例;4為該題未答對(duì)人數(shù)比例為該題答對(duì)者總分的平均分為該題未答對(duì)者總分平均分為所有考生總分的標(biāo)準(zhǔn)差適用題型:選擇題、判斷題等例、已知一測驗(yàn)中某選擇題的通過率為,答對(duì)者的測驗(yàn)總分平均為76分,答錯(cuò)者的測驗(yàn)總分平均為63分,全體被試總分的標(biāo)準(zhǔn)差為16分,求該選擇題的區(qū)分度。

76—63 13.——r= 以上非常優(yōu)良良好,如能改進(jìn)更好尚可,用時(shí)需作改進(jìn)以下 劣,必須淘汰或改進(jìn)以提高區(qū)分度難度與區(qū)分度的關(guān)系:沒有難度,就沒有區(qū)分度;試題的難度適中,則區(qū)分度較高;難度系數(shù)過大或過小,試題的區(qū)分度都不會(huì)很好。3、信度的含義:信度就是測量結(jié)果的可靠程度。也可認(rèn)為是測量結(jié)果的穩(wěn)定性程度。物理測量有信度,心理和教育測量也有信度。常模參照測驗(yàn)信度的估計(jì)方法:重測信度:(1)含義:用同一個(gè)量表(或測驗(yàn))對(duì)同一組被試施測兩次,所以上非常優(yōu)良良好,如能改進(jìn)更好尚可,用時(shí)需作改進(jìn)以下 劣,必須淘汰或改進(jìn)以提高區(qū)分度難度與區(qū)分度的關(guān)系:沒有難度,就沒有區(qū)分度;試題的難度適中,則區(qū)分度較高;難度系數(shù)過大或過小,試題的區(qū)分度都不會(huì)很好。3、信度的含義:信度就是測量結(jié)果的可靠程度。也可認(rèn)為是測量結(jié)果的穩(wěn)定性程度。物理測量有信度,心理和教育測量也有信度。常模參照測驗(yàn)信度的估計(jì)方法:重測信度:(1)含義:用同一個(gè)量表(或測驗(yàn))對(duì)同一組被試施測兩次,所得結(jié)果的一致性程度。(2) 計(jì)算:同一組被試在兩次測驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)表示。(積差相關(guān)或點(diǎn)二列相關(guān))(3) 基本假設(shè):測量對(duì)象的特質(zhì)短期內(nèi)不會(huì)隨著時(shí)間的推移而改變。pb16 16對(duì)計(jì)算得到的區(qū)分度值應(yīng)該再進(jìn)行統(tǒng)計(jì)檢驗(yàn)(根據(jù)測驗(yàn)人數(shù),查相關(guān)系數(shù)顯著X表示所有被試的測題得分Y表示所有被試的測驗(yàn)得分性臨界值表),才能說明試題區(qū)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論