




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、Revisedasof23November2021第一章、教育測量與評價的學科開展教育測量與評價一.教育測量1、測量:根據(jù)法那么給事物賦予數(shù)量.史蒂文斯測量:客觀事物及其屬性;所依據(jù)的規(guī)那么或方法;數(shù)量化的結果.2、教育測量:廣義:對于教育領域內的事物或現(xiàn)象,根據(jù)一定的客觀標準,作縝密地考核,并依據(jù)一定的規(guī)那么將考核的結果予以數(shù)量的描述.狹義:是指對學生某些學科經過學習和練習之后,所獲得的知識、技能的測量.又稱成就測量、學業(yè)成績測量或學科測量.3、教育測量的特點:O1.間接性和推斷性O2.測量對象的模糊性和測量誤差的不可防止性O3.量表具有多樣性,結果具有相對抽象性O4.測量目的的針對性二.教
2、育評價評價:評:評定;價:價值教育價值教育評價:注重效果:美國的泰勒;注重資料的獲得:美國的克龍巴赫、斯塔弗爾比姆;注重評價方法、手段:中國的張秀理、日本的長谷川容1、教育評價的概念:教育評價是評價者對教育活動或行為主客體價值關系、價值實現(xiàn)過程、結果及其意義的一種熟悉活動過程,其核心內容是揭示教育活動或行為中的客體對主體的需要、目標的價值意義.三.教育測量與評價的關系O聯(lián)系:教育測量就是指根據(jù)一定的理論、規(guī)那么,運用一定的測量工具對教育現(xiàn)象進行數(shù)量化描述的過程教育評價是對教育現(xiàn)象狀態(tài)和價值的判斷,這一判斷是以對評價對象的客觀描述為前提的,沒有對評價對象的客觀描述,就不會有對評價對象價值的客觀判
3、斷O教育測量是教育評價的根底,教育評價要在教育測量所獲得的客觀信息的根底上進行.同時,教育測量的結果要通過評價才能獲得實際意義.教育測量與評價的區(qū)別:O第一,測量是對事物數(shù)量特征的獲得.而教育評價那么是對教育現(xiàn)象客體的價值進行判斷.O第二,教育測量是一種純客觀的過程,其突出特點是客觀性.而教育評價那么具有兩種屬性,即客觀性和主觀性O第三,測量的任務是對事物的量的熟悉,而評價作為一種熟悉活動,是人的意識對實踐活動及其結果的綜合反映,它反映的是活動的過程和終點,又是新的實踐活動的起點.教育測量與評價的產生與開展過程:一.教育測量的產生1904年以前教育測量的萌芽期中國的科舉制隋煬帝大業(yè)二年,公元6
4、06年科舉制的特征:逐級考核、制度完備、考場嚴格、命題標準科舉制的考核方法:口試、貼經、墨義、策間、詩賦O產生在中國、開展在西方美國賀拉斯曼1845年將“筆試引入美國英國費舍在1864年?作業(yè)量表集?美國賴斯在1897年的?拼字實驗?19041915年教育測量的開拓期:O美國桑代克的巨著?精神與社會測量導論?問世.標志著以科學理論為指導的教育測量理論的誕生.O桑代克在這本巨著中提出:無論什么東西,只要存在,總存在于數(shù)量之中O麥克爾提出:任何東西,存在于數(shù)量中的,都可以被測量O這就是后來人們說的“凡存在的東西必有數(shù)量;凡有數(shù)量的東西都可以測量O這兩句話,看成是構成一切測驗和量化評價的公理.o19
5、09年,桑代克根據(jù)“等距原理創(chuàng)造了編制量表的單位,編制了標準化的測驗量表.年教育測量的興盛期:O在桑代克的影響下,教育測量的運動轟轟烈烈的開展O測驗品種有算術測驗、書法測驗、學科測臉、智力測驗、個性測驗、興趣測驗等,在數(shù)量上已有3000多種O標準化測驗的問世年教育測量的批判期:對教育測量批判的原因:O教育測量雖然能使教育成就定量化、客觀化、標準化;但畢竟不能測量出人的學力和人格的全部內容.O第一次大戰(zhàn)以后,人們的教育觀點發(fā)生了很大的變化,不在將教育看成是單純的傳授知識,而是將人的全面開展作為教育目標.而人的全面的重要因素如:社會道德、人的情緒態(tài)度、動機興趣、鑒賞力等是不能光靠測量的.教育測量存
6、在的弊端:O為測量而測量,盲目追求量化,無視教育效勞對象的整體目標與價值.O教育測量的理論根底只有心理學、統(tǒng)計學和測量學,而沒有教育學原理.二.教育評價的產生1、教育評價產生的社會背景:O19291933年席卷美國、涉及全球的經濟大蕭條O社會與教育危機四起O生產過剩、工廠倒閉、工人下崗O學校因經濟不景氣,局部學校關閉,有些學校的班級減少.O整個社會和教育皆處于反省之中O1930年美國有25%的失業(yè),青年近乎100%找不到工作,1910年1417歲的青年17%上大學,而到1930年上升到51%.O有相當一局部人上高中并不想上大學,而當時的美國高中設課就是為了上大學效勞的,為此中學設課與失業(yè)青年的
7、需求就產生了鋒利的矛盾2、教育評價的起源:美國進步主義聯(lián)盟負責人艾欽于1933-1940年領導了中學課程改革實驗研究,其中課程評價委員會由俄亥俄州的州立大學教授泰勒主持,這就是美國教育歷史上著名的“八年研究,也是教育評價問世的開始.八年研究的內容:O泰勒教授選了30所參加實險的高中學生,對這些學生進行了4年中學、4年大學學習的追蹤研究,歷時“八年,這也是“八年研究的由來.O當時選進步學校和和傳統(tǒng)學校學生各1475人,按性別、年齡、種族、學業(yè)水平傾向、家庭、社會環(huán)境、職業(yè)興趣和嗜好等根本原那么進行一一配對,進行比擬.評價是八年研究的有機組成局部,泰勒認為課程方案和編制必須答復以下四個根本問題O1
8、、應幫助學生到達什么目標O2、為到達目標應幫助學生學習那些預期的知識O3、怎樣組織學習過程才能使學生的學習成效最大O4、怎樣評價教學方案結果發(fā)現(xiàn):O來自實驗的學生在大學四年中,每年獲學術性榮譽略多;O具有更強的理智、好奇心和學習動機;O思維更精密、更系統(tǒng)、更客觀;O對教育的意義有更清楚的看法;O對新情況有更強的應變水平;O具有更有效的解決問題的方法;O更多的參加有組織的學習團體;O獲得非學術的榮譽更多些;O對職業(yè)的選擇有更好的定向;O更積極的關注全國和全世界的事物.新舊課程比擬結論:O前三項經統(tǒng)計檢驗均存在顯著性差異O記憶活動傳統(tǒng)的高于進步學校,但經統(tǒng)計檢驗兩者沒有顯著性差異教育評價的問世:O
9、八年研究后泰勒等人的研究結論是:舊課程及其教育測驗是教科書主義,測驗內容只是要求學生記誦教材中的知識,是片面的,不能反映學生的全面開展.O泰勒提出:以全面開展的教育目標為核心和依據(jù)的兩條相互依存的原理,即課程編制原理和評價活動原理,也就是泰勒原理教育評價的創(chuàng)始人一泰勒:O在八年工作報告中第一次提出教育評價O這個報告被稱為“劃時代的教育評價宣言O宣布了教育評價的誕生O給出了教育評價的原理、方法和手段O奠定了泰勒一教育評價之父的地位O同時也迎來了美國教育史上“泰勒時期的到來3、評價的開展:19401957年教育評價的平穩(wěn)期:特點:O教育評價的理論在不斷的進行深入研究O布魯姆完成教育目標分類學O教育
10、評價活動沒有普及O這與當時美國的歷史背景有關,二戰(zhàn)后,美國處于“籌劃與享受生活的時代.O社會對教育的開展很少提出新的要求.19571972批判泰勒模式時期:特點:.1957年前蘇聯(lián)的人造衛(wèi)星上天O引發(fā)美國對教育的不滿O開始批判泰勒教育模式1972現(xiàn)在專業(yè)化時期特點:O高等學校出現(xiàn)了許多教育評價的碩士、博士、博士后專業(yè)點O各類教育評價研究中央紛紛建立O如:美國有西密執(zhí)安大學評價中央、洛杉磯加里福尼亞大學研究中央等O教育評價專著、雜志大量出版O如:?評價研究?評價評論?評價信息?等4、教育測量與評價的開展趨勢及特點O教育測量的政治性得到強化O教育測量的重心發(fā)生了變化O教育測量的理論得到飛躍開展O計
11、算機技術的開展提升了測驗的效率O測驗的統(tǒng)計模型為教育測量學科開展提供強有力的理論支持O更加重視測量結果的解釋教育測量內容的開展:O評價方法由注重相對評價轉向重視絕對評價O重視教育目標研究O教育評價研究中不斷引入新的研究方法O越來越重視開展性教育評價理念和被評價者的參與O越來越重視元評價O越來越重視對評價結果的全面解釋和慎重處理第二章、教育測量與評價的根本原理教育評價與測量的類型一、教育評價的分類1、根據(jù)評價對象的層次和內容來劃分:宏觀評價:指對影響到全社會的那些指導、標準教育活動的各種因素進行的評價.微觀評價:指對某項具體的教育活動過程,對實施、治理教育活動的組織與個人.對教育活動指向的具體對
12、象等內容進行的評價2、按評價內容的復合程度來劃分:單項評價:指針對教育評價對象某一方面狀況進行的評價.綜合評價:指對評價對象狀況的方方面面作整體評價.3、按評價的功能及用途來劃分:診斷性評價:為使教育活動的形式、內容、過程等更適合活動對象的自身條件及需要而進行的評價.如:摸底測試.形成性評價:在教育活動過程中為不斷了解活動進行的狀況以便能及時對活動進行調整,進而提升活動質量進行的評價.如:單元測驗.終結性評價:指對教育活動的效果進行的評價.如:期末測試4、按評價參照的標準來劃分:相對評價:根據(jù)評價對象的實際狀況設定評價標準.評價標準在被評對象群體內部產生.絕對評價:依據(jù)某種需要或要求設定評價標
13、準.評價標準在被評對象群體外部產生,旦標準固定.個體內差異評價:以評價對象某一狀況作為設定評價標準依據(jù)的評價.5、按評價主體來劃分:他人評價:由活動實施者以外的人作為評價主體進行的評價.自我評價:由活動實施者作為評價主體進行的評價.6、按評價方法來劃分:定性評價:采用開放的形式來獲取評價信息、對評價結果的性質進行說明的評價活動.定量評價:采用結構式的方法,預先設定操作化的評價內容,收集評價對象可以量化的信息,得出數(shù)量化結果的評價活動.二、教育測量的分類1、根據(jù)測驗目標來劃分成就測驗:目標在于測量學生在各學習階段學到了什么,旨在檢測教育目標希望學生能到達的具體行為.如:學科測驗如:教學階段測驗診
14、斷和總結性測驗水平測驗:旨在測量個體的不因外界環(huán)境影響而輕易改變的、較穩(wěn)定的、表現(xiàn)在認知水平方面的心理特質.比方觀察力、記憶力、理解力、概括力、空間水平、判斷推理水平等等.也被稱為“智力測臉水平傾向測驗:目的在于測量學生的潛在學習水平及學術開展趨向.潛在水平是指個體從未來教育或練習中可能受益的水平.這類測驗主要用于預測學生的未來成就和水平,從而可以幫助決策者和學生自己選擇適宜的學校、專業(yè)及最正確職業(yè).水平傾向測驗分為:一般學習水平測驗、特殊水平傾向測驗.2、根據(jù)測驗分數(shù)的解釋標準來劃分常模參照測驗:目的在于考查被試的個體差異,一般用于衡量被試相對水平的,以選拔為目的的大規(guī)模測驗.標準參照測驗:
15、目的在于考查被試是否已到達某種標準.一般用于以教學目標為標準考查學生實際水平的測驗.常模團體 總體要明確 常模團體必須是被試總體的一個代表性樣本 樣本的大小要適當 注意常模團體的更新 測驗手冊中必須詳盡描述取樣過程常模參照測驗與標準參照測驗的比擬:1、從測試的目的和用途來看,它們都通過測量學生的學習成績,考查其優(yōu)劣,但常模參照性測驗將考生成績做橫向比擬,著眼于個別差異,主要用于選拔性測驗和總結性測驗等.2、從考核目標的陳述來看,都明確具體,為編制測驗提供依據(jù),但常模參照性測驗可采用一般目標或具體目標,而標準參照性測驗必須采取非常具體且詳細的目標.3、從題型的選擇和題目的分配來看,都需采用各種不
16、同題型,試題必須是教學目標的有代表性的樣本;常模參照性測驗多采用選擇題,題目分散在全學科的全部知識領域內,題目按從易到難的順序排列;標準參照性測驗較少依賴選擇題,題目分別分布在一定目標中,題目按教學目標順序排列即可.4、從測試及考題的質量要求來看,它們都根據(jù)標準化測試的編制原那么,保證測試有較高的信度和效度;常模參照測驗題目要求難易適中,強調題目的鑒別力,測驗信度的估計適合用統(tǒng)計方法;標準參照測驗的題目和學習結果直接聯(lián)系,不強調題目的鑒別力,測驗信度的估計不適合用統(tǒng)計方法.5、從解釋測試結果的依據(jù)及分數(shù)的意義來看,兩種測試各有其依據(jù);常模參照性測驗的常模是解釋分數(shù)的標準,用地位量數(shù)表示考生在團
17、體中的相對位置;標準參照性測驗中教學目標是解釋分數(shù)的標準,以考生完成題目數(shù)量的百分比來表示考生的學習效果.3、根據(jù)教育測量的標準化程度來劃分:標準化測驗:指測驗的編制、實施、記分、分數(shù)的解釋有統(tǒng)一標準和嚴格規(guī)定的大規(guī)模的測驗標準化測驗的程序:確定測試目的;編制測試藍圖命題雙向細目表;命題、組卷、試測、入庫;實測;評分,統(tǒng)計分析;寫出指導書.教師自編測驗:教師根據(jù)教學情況自己編制測題對學生進行的測險.4、以測量人數(shù)多少來劃分: 團體測驗 個人測驗5、根據(jù)所使用的材料和形式來劃分: 語言文字測驗 非語言文字測驗教育測量與評價量表心理學家史蒂文斯根據(jù)測量的精確程度把量表從低級到高級分成名稱量表、順序
18、量表、等距量表和比率量表.名稱量表: 意義:依照某種法那么給事物及屬性指派名稱或類別的量表. 功能:區(qū)分性. 數(shù)量化結果的含義:不能比擬大小. 適用的統(tǒng)計方法:次數(shù)的統(tǒng)計,如次數(shù)、眾數(shù)、百分比、離散相關、卡方檢驗等.順序量表: 含義:依照某種法那么給事物或人的心理現(xiàn)象指派名稱或類別,還可以將分類結果按數(shù)量大小進行排序. 功能:區(qū)分性、順序性 數(shù)量化結果的含義:比擬大小,不能進行運算. 適用的統(tǒng)計方法:中位數(shù)、百分位數(shù)、等級相關系數(shù)、肯德爾和諧系數(shù)以及秩次的方差分析.等距量表區(qū)間量表: 含義:在給事物及屬性指派數(shù)字和符號時,要求各數(shù)字或等級之間的差距是相同的,即具有相等的單位. 功能:區(qū)分性、順
19、序性、等距性 數(shù)量化結果的含義:不僅能分類、排序,還可以進行加減運算. 適用的統(tǒng)計方法:均數(shù)、標準差、相關系數(shù),t、F檢驗等比率量表: 含義:有相等單位和絕對零點的量表. 功能:區(qū)分性、順序性、等距性、絕對零點. 數(shù)量化結果的含義:可以進行加減乘除四那么運算. 適用的統(tǒng)計方法:均數(shù)、幾何平均數(shù)、標準差、相關系數(shù),變異系數(shù)、t、F檢驗等.教育測量與評價的根本原那么1、教育測量與評價原那么的性質(1)教育測量與評價原那么是在教育測量與評價實踐活動中總結出來的具有普遍性問題根底上提出的.(2)教育測量與評價原那么反映了人們對開展教育測量與評價活動的總體要求.(3)教育測量與評價原那么具有相對穩(wěn)定性.
20、2、根本原那么(1)方向性原那么:指通過評價內容和標準等的制定、評價過程的側重、評價結果的肯定與否認等推動教育活動貫徹國家的教育方針,進而滿足社會需求,保持良性開展的方向.(2)客觀性原那么:指評價主體要以真實的資料為根底,對教育活動過程和成果作出客觀的價值判斷.(3)鼓勵性原那么:指教育評價應促使評價對象形成繼續(xù)努力或在進一步的活動中改善缺乏之處,提升活動效果的動機或期望.(4)方案性原那么:指教育評價活動的開展及教育評價活動過程應根據(jù)教育活動的開展而有方案有序地進行.(5)實效性原那么:指教育評價過程應根據(jù)評價的目的與內容、評價對象的具體情況、具體的社會環(huán)境背景等作出切合實際的評價方案,采
21、用適宜的評價方法使評價能有效地對教育活動提供指導與幫助.(6)平等性原那么:指教育評價實施者應以與評價對象共同探討教育活動得失的平等身份進入評價活動,使評價對象將評價者作為朋友接受其評價,采納其意見或建議.第三章、編制教育測驗的一般原理和方法布魯姆的教育目標分類系統(tǒng)把教育目標分成三個領域:1、認知領域;2、情感領域;3、動作技能領域.1、認知領域目標分類:布盧姆把認知領域的教育目標分為六級:知道、領會、運用、分析、綜合、評價.1、知道:指對先前學習過的知識材料的簡單回憶“知道又叫“知識,是認知領域中最低水平的認知結果,它所要求的心理過程主要是記憶.2、領會領會亦稱理解或領悟,是指將一種語言準確
22、地轉化成另一種語言.它又可分為轉化、解釋和推斷三種.3、運用指在具體的情境中使用抽象概念,是對所學知識的初步運用.運用代表了較高水平的理解,比方用二元一次方程解答工程性質的應用題,又如把其它文獻中已經提出來的新論點用來引證自己類似的實驗結果.指將一種傳播內容分解成為它的組成因素和組成局部,以便弄清各種觀念之間的關系.5、綜合指將各種要素及組成局部組成一個整體,以構成更為清楚的模式或結構.綜合強調的是創(chuàng)造水平.6、評價指為了一定的目的,對某些觀念和方法等的價值作出判斷.包含根據(jù)內部準那么判斷和依據(jù)外部準那么判斷兩方面的內容.2、對布魯姆教育目標分類的評價: 從教育目標劃分標準來看,布魯姆所用的標
23、準是測量學的,無論是知識、領會、應用、分析、綜合還是評價每一個教育目標都是圍繞著如何測量或操作的角度提出的. 布魯姆的教育目標分類便于全面描述教學目標和評定教學,但未揭示各級層次的智力技能的心理機制,因而無法指導教師用什么方法或提供什么學習條件來實現(xiàn)教學目標. 總結:教育目標分類系統(tǒng)對認知領域中的教學目標由低到高進行劃分,符合水平由簡單到復雜開展原那么.認知領域分類標準是測量學的,有利于指導學習結果的測量與評價.3、測驗題目類型與測量功能:測驗題目分類:選擇型和供答型.選擇型一般要求被試在幾個選項中選擇正確的答案,如是非題、匹配題、選擇題等,后者要求被試自己提供答案,如論文題、簡做題、填空題等
24、.假設根據(jù)被試作答的范圍和評分方法不同,又可分為主觀性試題和客觀性試題,客觀性試題主要是由于評分客觀而得名,它的正確答案在測驗前就已準備好,不同評分者各自獨立評分,所得結果根本上是相同的.客觀性試題一般適用于測量知識的掌握、理解、應用、分析幾個層次的教學目標.客觀性試題的答案明確,作答簡便,因而在限定的時間內測驗可以包含足夠數(shù)量的試題,能保證對知識內容的覆蓋.主觀性試題主要包括論述題、操作題和作文題等.它們適合于測量較高層次的教學目標,尤其適合于測量綜合、評價等目標層次.主觀性試題鼓勵被試積極地組織所學的資料,表達自己的觀點.被試在作答時,消耗的時間較長,在限定的時間內,試題數(shù)量不可能太多,對
25、知識的覆蓋面較小.由于沒有明確統(tǒng)一的標準答案,評分易受評閱者的主觀因素影響,因而誤差較大.一、客觀性試題的類型及其編寫技巧一選擇題1 ,結構選擇題是由一個題干和幾個選項組成.題干一般是問題或待完成的句子,選項是幾個真假不明的答案,讓被試從中選出正確的答案.以學生慣用的模糊性用語表達誘答項.在正確選項和誘答項中使用同樣“精確的、“重要性等詞語來表達.誘答項的長度和措辭的復雜性與正確選項相似.在誘答項中使用額外的線索.如固定的用詞,具有科學味道的答案,以及和題干有語義上的聯(lián)系等.保持選項之間的同質性.(5)不能對正確答案有任何暗示同一測驗中每一個測驗試題之間應相互獨立防止牽連選項的文字表述,力求簡
26、短精煉.(8)應盡量防止“以上皆是、“以上皆非的選項(二)是非題是非題又叫做二項選擇題,它通常是給被試一個句子要被試作出正誤的判斷.1、優(yōu)點:編制容易.(2)記分客觀,取樣廣泛.缺點:(1)僅能測量知識層次中最根本的結果,無法測量高層次的學習結果.(2)受猜想因素的影響很大.2 .編寫原那么(1)考核的內容應是重要的知識,應有考核價值.(2)題目應多是測量理解水平,而不應測驗記憶性的知識,更不要直接抄錄教科書中的句子.(3)一個題目中只能有一個中央問題,或一個重要概念,防止兩個以上的概念在同一題中出現(xiàn).(4)試題應做到是非界限清楚,用詞準確,防止模棱兩可的語句.(5)題目陳述應簡單明了,防止使
27、用復雜的句子結構,以減少因被試的閱讀能力而對測量產生的不良影響,應盡量采用正面表達,防止用否認和雙重否認的語句.(三)填空題1、優(yōu)缺點:填空題可用來考查被試對知識的記憶和理解水平,在診斷性測驗中特別適用.受被試猜想的影響小,評分比擬客觀.但填空題偏重于測量被試的知識記憶程度,使用過多容易養(yǎng)成被試死記硬背的習慣.2、編制原那么:(1)題意要明確、限定要嚴密,使空白處應填的答案是唯一的.空白中所填寫的應是關鍵詞語,并且要和上下文有密切的關系(3)題目中空白地方不能太多,以免句子變得支離破碎,不利于被試理解題意.通常一個填空題不應超過兩個空白.(4)盡量將空白放在句子的后面或中間,而不要放在句子開頭
28、.(5)所有空白處的線段長度應當一致,不能隨正確答案文字的多少而長短不一,以免產生暗示作用.假設答案是數(shù)字,應指明單位和數(shù)字的精確程度.(四)簡做題簡做題適合測量被試對根本知識、概念和原理的掌握、記憶情況.編制較為簡單、靈活,可以從不同角度、不同方向考慮,增大對知識考核的準確度和深度,并且不受猜想因素的影響.但其無法考核綜合、分析、評價等高層次的教學目標:且評分也不夠客觀,有不同程度的正確或局部正確的答案而影響評分的客觀性.2.編制原那么:(1)問題的表達要明確,要確實能使被試用簡單的語言來答復.(2)問題的答案應該只有一個,并且答案要簡短具體.(3)防止出只考機械記憶的題,應注重知識的應用.
29、(4)在考查某公式的應用時,不要給太復雜的數(shù)字,以免給計算帶來麻煩.(5)盡可能使用直接問句來提出問題.二、主觀性試題的類型及其編寫要領(一)論述題論述題就是向被試提出問題,需要被試用自己的語言組成一份較長答案的試題.1、優(yōu)點:(1)可以用來進行高層次的、復雜的學習結果的測量,可以用在各種學科領域,特別適用于社會科學、人文科學等.(2)可以增進學生的思考、應用及解決問題的水平,對于被試的學習態(tài)度和學習方式可以產生積極的影響.(3)可以促進學生寫作水平的提升.試題的編制比擬容易,并且受猜想因素的影響很小.缺點:(1)由于論述題一般都比擬大,在一次測試中試題的數(shù)量不可能有很多,因此,其取樣范圍比擬
30、小且不均勻,影響測驗的效度.(2)評分的主觀性強.(3)因被試答復過于自由,答復方向又不盡相同,難于測得預期結果,重點容易失控.(4)被試作答和評分閱卷都相當費時.2.編制原那么:(1)試題應該用來測量較高層次的教學目標.如要求學生提出理由、解釋變量間的關系、描述與評價資料、有系統(tǒng)地陳述結論等.(2)要明確而系統(tǒng)地陳述問題,使被試能清楚地了解題目的要求.(3)應采用答案具有統(tǒng)一定論的試題.(4)一般不允許被試選擇問題答復.(5)為防止被試將時間集中在某一個他所不會做的題目上而影響對其他題目的答復,因此而影響測試成績的真實性,最好在題目中能給出答復此題所需的參考時間.(二)作文題作文是對人的邏輯
31、思維、形象思維、書面表達等多種水平的一種綜合考查.編制原那么:(1)根據(jù)測試的目的和需要確定測試作文的文體要求.根據(jù)社會的需要、現(xiàn)實生活和學生的實際設計命題.(3)要根據(jù)被試的特點確定選材范圍與寫作意圖,在確定選材和寫作意圖時,要考慮對所有被試都是公平的,并且試題應符合被試的心理特征.(4)要給被試以發(fā)揮的余地.第四章試卷質量分析與評價質量分析:工程分析:難度、區(qū)分度整體分析:信度、效度1、難度的含義:指測題的難易程度,是指題目對學生知識和水平水平的適合程度的指標.用P表示.難度的計算:1、題目分數(shù)為二分變量:正確率P=R/N答對人數(shù)/全體人數(shù)適用題型:選擇題、填空題、判斷題等.又二平均得分二
32、2、題目分數(shù)為多分值:得分率4',皿丁丁總分值適用題型:填空題、簡做題、論述題、計算題、作文題等難度取值范圍:0-1之間卷面難度:試卷包含的所有試題難度的平均數(shù).常模參照測驗難度取值范圍:試題:之間;卷面:之間基于難度的題目分析:難度過低與過高的題目原那么上要淘汰,但屬于必考的知識點,需重新命題、提升命題的難度由于出現(xiàn)科學性錯誤而導致難度不符,需重新命題命題、內容均無大問題但難度不符的題目需進行詳細分析找出原因所在2、區(qū)分度的含義:是指測驗題目對學業(yè)水平不同的考生的區(qū)分程度或鑒別能力.區(qū)分度的計田,營二"1、點二列彳S,P為該題答對人數(shù)比例;q為該題未答對人數(shù)比例為該題答對者
33、總分的平均分為該題未答對者總分平均分為所有考生總分的標準差適用題型:選擇題、判斷題等例、一測驗中某選擇題的通過率為,答對者的測驗總分平均為76分,答錯者的測驗總分平均為63分,全體被試總分的標準差為16分,求該選擇題的區(qū)分度.rph=.?j0.5x(l-0.5)=7025=0.41對計算得到的區(qū)分度值應該再進行統(tǒng)計檢驗(根據(jù)測驗人數(shù),查相關系數(shù)顯著性臨界值表),才能說明試題區(qū)分度的上下.2、積差相3rSxSyX表示所有被試的測題得分Y表示所有被試的測驗得分填空題、簡做題、論述題、計算題、作文題等3、兩端分組法D=P-PD為鑒別指數(shù)H為高分組在該題的難度L為低分組在該題的難度高分組:總分排序前27%的人低分組:總分排序后27%的人適用范圍:被試人數(shù)太多時測驗的區(qū)分度的估計例、10000名,成績排序前2700名的學生在第三題答復正確的人數(shù)為2500人,%2500cqq名體0500答正確的人數(shù)為500人,根據(jù)兩端分ru=0.93匕=0.1927002700組法計算第三題的區(qū)分度.D=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 22068-2025汽車空調用電動壓縮機總成
- 新能源汽車動力電池及零部件檢測合同
- 商品分銷代理合同
- 承攬合同是何種類型合同
- 商業(yè)空間裝修設計合同2025
- 中保人壽個人養(yǎng)老金保險合同范本
- 兼職人員聘用合同(試聘版)
- 正式合同樣本:電子產品供貨合同
- 礦產銷售合同
- 5 草船借箭(教學設計)2023-2024學年統(tǒng)編版語文五年級下冊
- 2025年天津三源電力集團限公司社會招聘33人高頻重點模擬試卷提升(共500題附帶答案詳解)
- 西安2025年陜西西安音樂學院專任教師招聘20人筆試歷年參考題庫附帶答案詳解
- 課題申報參考:養(yǎng)老金融在三支柱養(yǎng)老金體系中的作用機制與路徑仿真研究
- 2024-2025學年第二學期學校團委工作計劃(附2月-6月安排表)
- 2025年江蘇商貿職業(yè)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 科技與教育的融合小學科學探究式學習的實踐案例
- 川教版2024-2025學年六年級下冊信息技術全冊教案
- HYT 087-2005 近岸海洋生態(tài)健康評價指南
- (2024年)面神經炎課件完整版
- 玻璃水鉆行業(yè)需求分析及生產工藝流程
評論
0/150
提交評論