教育測量與評價(期末復習重點)_第1頁
教育測量與評價(期末復習重點)_第2頁
教育測量與評價(期末復習重點)_第3頁
教育測量與評價(期末復習重點)_第4頁
教育測量與評價(期末復習重點)_第5頁
已閱讀5頁,還剩147頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章教育(jiàoyù)測量的質量指標衡量教育測量的質量,可采用四個指標(zhǐbiāo):信度主要對整個測量而言。效度難度主要對測量的項目而言。區(qū)分度精品資料第一節(jié)信度一、信度概念信度是指測量結果的穩(wěn)定性或可靠性程度。用同一種工具反復測同一種特質對象,結果的一致性程度就叫信度一般地說,一個好的測量必須具有(jùyǒu)較高的信度,也就是說,一個好的測量工具,只要遵守操作規(guī)則,其結果就不應隨工具的使用者或使用時間等方面的變化而發(fā)生較大的變化?;蛘哒f,測驗的抗干擾能力強,誤差因素控制得好,測值的一致性高,就叫信度高,人們感覺可靠。精品資料可以從以下三個方面去理解測量的信度P29:信度指實測值(X)和真值(T)相差(xiānɡchà)的程度信度是指統(tǒng)計量與參數(shù)之間的接近程度信度指兩次重復測量或等值測量之間的關聯(lián)程度。精品資料三、信度的估計方法(fāngfǎ)(信度類型)1、重復信度(再測信度)指的是同一個量表對同一組被試施測兩次所得結果的一致性程度。其大小等于同一組被試在兩次測驗上所得分數(shù)的相關系數(shù),一般采用積差相關的公式(gōngshì)來計算。(板書、推導該公式(gōngshì))精品資料積差相關的使用條件:兩個(liǎnɡɡè)變量的總體都呈正態(tài)分布,至少是單峰對稱的分布。作此判斷需要總體分布的卡方檢驗。必須是成對數(shù)據(jù),每對數(shù)據(jù)之間相互獨立兩個(liǎnɡɡè)變量之間呈線性關系,可由散布圖的形狀來決定。精品資料精品資料例一用一個算術四則的速度測驗12個小學生,得分記為X,為了考察測量結果的可靠性,于3個月后再測一次,得分記為Y,問測驗結果是否(shìfǒu)可靠?學生序號123456789101112X202021222323232425262627Y202121202323252526262729精品資料在使用重測法計算(jìsuàn)穩(wěn)定性系數(shù)時,應注意以下問題:1、信度的取值范圍為[0,1],當信度值較大時,說明前后兩次測量結果比較一致;2、兩次測驗之間的時間間隔要適宜。太長,身心發(fā)展、遺忘、環(huán)境改變等使信度降低(jiàngdī);太短,練習與記憶等提高了成績,信度降低(jiàngdī)。精品資料3、重測法適用于速度測驗而不適用于難度測驗;因被試很難記憶(jìyì)第一次,而難度測驗相反。還適用于運動技能的測驗。4、適用于異質測驗,即一個測驗包含幾個不同的部分,分別測量不同的心理特質。因為這種測試不適于計算內部一致性信度。4、應注意提高被試者的積極性。精品資料2、復本(fùběn)信度指的是兩個平等的測驗測量同一批被試所得結果的一致性程度。其大小等于同一批被試在兩個復本測驗上所得分數(shù)的相關系數(shù)。所謂復本測驗是指在格式、內容、題型、題數(shù)、難度、指導語說明、施測要求(yāoqiú)等方面都一致(或相等)的兩份或多份測驗。精品資料例二以A、B兩型英語(yīnɡyǔ)復本測驗對初中三年級10個學生施測,為避免由測驗施測順序所造成的誤差,其中5個學生先做A型測驗,休息15分鐘后,再做B型測驗;而另5個學生先做B型測驗,休息15分鐘后,再做A型測驗。10個學生A型測驗結果記為X,B型測驗結果記為Y,其測驗的復本信度如何?學生序號12345678910X19191817161515141312Y20171818171513151212精品資料復本(fùběn)信度的優(yōu)缺點表現(xiàn):優(yōu)點:1、兩個復本在同時使用時,可以避免再測信息的一些缺點如首測對再測在記憶、練習、效果的影響,間隔期間獲得新知識的影響,兩次施測的環(huán)境不同和被試主觀狀態(tài)不同的影響,以及為了應付測驗所作訓練的影響等。反映究竟是不是真正(zhēnzhèng)的平行測驗;換言之,反映了測驗內容造成的誤差。精品資料2、測驗的兩個(liǎnɡɡè)復本,如果在不同的時間使用,其信度既可以反映被試在不同時間的穩(wěn)定性,又可以反映測驗內容的一致性。換言之,既反映了時間影響,又反映了測驗內容的抽樣誤差。這種同時兼顧試題抽樣與時間影響的信度,稱為等值穩(wěn)定性系數(shù),與其他信度系數(shù)相比,該系數(shù)最小,也就是說,此種復本信度是對信度最嚴格的檢驗。3、在追蹤研究或探討某些影響測驗成績的因素時,大多使用復本測驗,分析復本信度。精品資料缺點(quēdiǎn):1、編制(biānzhì)兩個完全相等的測驗是很困難的,如果兩個復本過份相似,則變成再測形式,而過分不相似,又使等值的條件不存在;2、兩個復本測驗有可能在某種程度上測量了不同的性質,這就會低估測驗的信度;(因內容造成的誤差)。3、被試同時接受性質相似的兩個測驗,可能減少完成測驗的積極性;4、雖然兩個復本測驗的題目材料不同,但被試一旦掌握了解題的某一模式,就能觸類旁通,有可能失去復本的意義。精品資料3.1、同質(tónɡzhì)信度之分半信度就是將測驗分半,被試在每一半測驗上所得分數(shù)的相關系數(shù)。反映了2半題目間的一致性。分半的方法很多,如,按題號奇偶,按難度、按題目內容。無論如何分半,都要在分開后做微調,最終目的是分成對等的兩半。如果做不到對等,就不適合求分半信度。在實際運用中,由于題目一般是按難度大小排列,采用奇偶分半可以使兩半測驗的題目在難度上基本(jīběn)相等,因此常被采納。精品資料分半后,計算每個被試在兩個分半測驗分數(shù)的積差相關系數(shù),由于(yóuyú)只是半個測驗之間的信度,故,再用斯皮爾曼—布朗公式加以校正。3.2同質信度之庫德爾-理查森信度適合于全部二分計分題測驗的內部一致性信度分析。常用的兩個公式有:(板書,P33)精品資料例三對初中一年級學生進行地理成績測驗(cèyàn),每答對1題得1分,答錯1題得0分,其測驗(cèyàn)結果如下表,試估計該測驗(cèyàn)的庫德-理查森信度?學生序號題序123456總分110000012100100230000112411100035010011361110003711110048111100491101115101111116pqpq精品資料請比較兩個公式所算出來的值當測驗中所有的試題難度都一樣,或平均難度接近0.50時,兩個公式所估計出來的信度值將相等(xiāngděng)。但是,當測驗中所有試題難度值極不相同時,差距將較大。一般KR21比KR20信度值小。精品資料4、論文式測驗信度論文沒有嚴格評分標準,同樣題目,不同應試者回答與得分不一樣,可用克龍巴赫阿爾法系數(shù)公式(gōngshì)。P34該公式(gōngshì)適用于:測驗題型多并非都是2分計分題時。板書公式(gōngshì)請閱讀,并解釋公式(gōngshì)含義。精品資料例4用一個(yīɡè)包含6個論文式試題的測驗,測5個被試,結果如下,試求該測驗的信度?題序學生序號12345某題得分方差136165243323334121425212514454646532總分1728161917精品資料精品資料精品資料四、提高信度的方法(一)信度系數(shù)(xìshù)多大為宜?學科測驗0.9以上;智力測驗0.8以上;品德測驗,達到0.6就不錯了。精品資料作業(yè)(zuòyè)1、用某量表測驗10名學生,得分記為X,為了(wèile)考察結果的可靠性,于15天后用原量表對這10個學生重測一次,得分記為Y,問測驗結果是否可靠?學生序號12345678910X810961075794Y9101061084894精品資料2、對10名應試者先進行某種測驗X,隔適當時間(shíjiān)后(半年),再進行內容、范圍、難度類似的第二次測驗Y,試求測驗的復本信度?應試者12345678910X9101061084894Y4979435324精品資料3、有一個由100題構成的量表施行于10個高三學生(分數(shù)(fēnshù)見下表)。測驗一次后,學生即畢業(yè)離校,現(xiàn)怎樣評價測驗結果的信度?學生序號12345678910奇X38373841403638394035偶Y37373639393438393936精品資料四、提高(tígāo)信度的方法1、影響測量信度的主要因素自行閱讀P34-35,請同學們討論、解釋。(1)測量工具(gōngjù)方面(對照教材重點解釋)(2)主試、施測情境方面(對照教材舉例)(3)被試方面(同上)(4)兩次施測的間隔時間方面精品資料2、提高測量信度的常用(chánɡyònɡ)方法閱讀p36-37,請學生解釋:(1)適當增加測驗的長度(2)測驗的難度要適中(3)測驗的內容應盡量同質(不同質是如何(rúhé)影響信度的?)(4)測驗的程序應統(tǒng)一(5)測驗的時間要充分(6)測驗的評分要盡量做到客觀化,減少評分誤差精品資料第二節(jié)效度一、什么是效度效度是指測量結果的準確性和有效性的程度。也可以說是測量是否達到了預期的目的(mùdì)。1、效度是一個相對的概念。測量的效度是相對一定的測量目的(mùdì)而言的2、一種測量的效度只是高或低的問題測量結果總是有一定效度的,只是效度高低不同罷了。3、教育領域的效度問題比其他領域的測量更重要。精品資料二、效度的理論公式板書P39及參考書P58重申變量和的方差運算公式目標真分數(shù)、非目標真分數(shù)根據(jù)(gēnjù)理論公式,怎樣才算測量效度高?請同學們回答。

精品資料三、效度的估計(gūjì)效度估計就是多方尋找證據(jù)(zhèngjù)來證明一個測驗的有效性程度的過程。(一)內容效度就是指測驗題目樣本對于應測內容與行為領域的代表性程度。也就是說,測驗的內容范圍、材料與所要測量的內容范圍、教育目標是否相符合;測驗中測題所引起的行為是否是所要測量的屬性的明確反應。為了使測驗的內容具有有效性,成為所欲測量內容的一個具有代表性的行為樣本,在編制測驗時,就要考慮建立內容效度的問題。精品資料2、內容效度的估計(gūjì)邏輯分析法其工作思路是請有關專家對測驗題目與應測內容范圍的吻合程度作出判斷。把所有題目按考試內容和考查目標分布進行雙向分類,形成實際的“題目雙向分類表”。與事先預定(yùdìng)的“命題雙向分類表”作比較,看是否偏離了原命題計劃。精品資料精品資料內容效度主要應用于成就測驗、學科測驗。內容效度不適合(shìhé)用于能力傾向和人格測驗。精品資料(二)結構(jiégòu)效度結構:心理學或社會學上的一種理論構想或特質。本身(běnshēn)觀察不到,也無法直接測量,但學術理論假設它是存在的。舉例:結構效度:測量能測出這種結構的程度精品資料(1)結構(jiégòu)效度的特點結構效度的大小完全取決于事先假定的心理特質理論,一旦人們對同一種心理特質有著不同的定義或假設,則會使得關于特質測驗的結構效度的研究結果無法比較。比如(bǐrú)智力精品資料(2)建立(jiànlì)結構效度的步驟A、提出理論假設;B、根據(jù)假定結構,導出各項關于心理功能或行為的基本假設。擬定測題,編制測驗;C、以測驗結果為根據(jù)來驗證假設結構中的各種因素是否成立。例如(lìrú)智力P42精品資料測量甲與其他理論上認為應該與之有關(yǒuguān)的其他測量有顯著相關。與其他理論上認為不應該與之有關(yǒuguān)的其他測量沒有顯著相關。與內容效度不同,結構效度主要用于智力測驗、人格測驗等一些心理測驗方面。精品資料(三)效標關聯(lián)(guānlián)效度是以測驗分數(shù)和效標之間的相關系數(shù)來表示測驗效度高低的方法。什么是效標?例如:某年全國高考物理學科的測驗效度,可用大學一年級物理學科的測驗分數(shù)為效標,然后求同一組學生(xuésheng)高考物理得分與大一物理得分之間的相關,此相關系數(shù)就是該年高考物理測驗的效標關聯(lián)效度系數(shù)。精品資料效標不僅隨測驗的種類不同而不同,而且可能隨時間而改變,現(xiàn)在是一個好的成功的效標,將來就不一定是。所以,為某個測驗選擇一個最有效的效標,這是最重要的事情。教育測驗的效標,可采用各學科成績和教師評定的結果;智力測驗的效標,可采用學科成績、教師評判的結果、學生總成績、受教育年限、年齡以及其他事物;能力傾向測驗的效標,可采用特殊課程或特殊訓練的成績;職業(yè)興趣測驗的效標,可采用從業(yè)人員實際服務成績或記錄;人格測驗的效標,可采用被試以后行為(xíngwéi)或臨床資料。精品資料效標關聯(lián)效度的種類

同時效度預測效度效標關聯(lián)的計算方法:計算相關系數(shù)(多采用積差相關法,略)P41,其他(qítā)方法參閱教育統(tǒng)計學教材精品資料2、提高測量(cèliáng)效度的方法P44對效度系數(shù)的要求:P42,閱讀1分鐘控制系統(tǒng)誤差精心(jīngxīn)編制測驗量表擴充樣本的容量(增加樣本對總體的代表性)合理處理效度和信度的關系(信度是效度的前提,效度不大于信度的平方根)妥善組織測驗適當增加測驗長度精品資料三、難度(nádù)難度是指試題(shìtí)的難易程度。一道試題(shìtí),如果大部分被試都能答對,則該題的難度就小;如果大部分被試都不能答對,則該題的難度就大。難度由被試群體整體水平所確定。是相對概念。精品資料難度(nádù)的計算(一)基本公式1、客觀題難度的計算P=R/NR為答對該試題人數(shù),N為參加測驗總人數(shù)例1:在100個學生中,答對第一(dìyī)題的30人,答對第二題的60人,求第一(dìyī)、二道題的難度?比較這兩道題誰比誰難?精品資料2、主觀題難度(nádù)的計算例2:某道論述題滿分12分,所有考生在這道題上的平均得分為3.6分,求該題的難度?例3:語文(yǔwén)測驗第五題最高得分為12分,這道題考生的平均得分是8.5分,求該題難度?例4:60人參加考試,某題滿分為12分,正確得分累積是480分,求該題難度?精品資料(2)極端(jíduān)分組法客觀題步驟:將測驗總分進行(jìnxíng)高低排序(由高到低)進行(jìnxíng)高低分組(各取27%),并計算某題的得分率求兩組的平均值公式:P=(PH+PL)/2PH為高分組答對該題的百分比;PL為低分組答對該題的百分比。精品資料例5某區(qū)域1000人參加考試,試卷第一題高分組180人答對,低分組60人答對,求該題難度?如果該題滿分為10分,高分組得分(défēn)總數(shù)為2100分,低分組得分(défēn)總數(shù)為830分,求該題難度?精品資料論文題的步驟:將測驗總分進行高低(gāodī)排序(由高到低)進行高低(gāodī)分組(各取25%)分別為高分組、低分組編制每道試題的分析表按下列公式計算難度:P=板書P48精品資料例某道論文(lùnwén)題,高分組得分總和40分,低分組得分總和15分,40人參加考試,此題最高得分為5分,最低得分為2分,則此題的難度為P48:精品資料2、難度(nádù)的分析與控制(1)難度分析進行(jìnxíng)難度分析的主要目的是為了篩選題目。A、測驗題目難度水平的確定測驗題目難度水平的適當與否,取決于測驗的目的、性質和題目的形成。當P值接近于0或接近于1時,即被試在該題上全部答對或全部答錯,則該題無法提供個體的信息。而只當P值接近于0.50時,題目才能把被試作最大的程度的區(qū)分。(離散程度最大)對于常模參照性測驗,大多數(shù)難度在0.3-0.7之間,平均0.5。但對于奧林匹克競賽或補習功課的學生,例外。精品資料B、測驗難度(nádù)對分數(shù)分布的影響測驗的難度直接依賴于組成測驗的題目的難度,通過考察測驗分數(shù)的分布,可以對測驗的難度做出直觀檢查。由于(yóuyú)人的心理特性值多數(shù)呈正態(tài)分布,因此當測驗目的在于測量個體差異時,若被試樣本具有代表性,則其結果應呈正態(tài)分布。測驗分數(shù)背離正態(tài)分布有兩種情況:其一是題目難度普遍較大,被試得分普遍較低,使得低分端出現(xiàn)高峰,呈正偏態(tài);其二是題目難度普遍較小,被試的得分普遍較高,使得高分端出現(xiàn)高峰,呈負偏態(tài)。精品資料(2)難度(nádù)的控制一般說來,影響題目難度的主要因素有:考察知識點的多少;考察能力的復雜程度或層次(céngcì)的高低;考生對題目的熟悉態(tài)度;命題的技巧。難度控制:正確估計考生水平與否;弄清弄懂各知識點與否;掌握命題技巧與否。精品資料四、區(qū)分度(一)區(qū)分度的含義指測驗題目對考生實際水平的區(qū)分程度或鑒別能力。如一道題,學業(yè)水平、實際能力都較高的考生都答對了;而學業(yè)水平、實際能力都較低的考生都答錯了,則可認為該題目有好的區(qū)分度。區(qū)分度分析主要以效能為依據(jù),考察考生在每個題目上反應(fǎnyìng)與其在效標上的表現(xiàn)之間的相關程度。區(qū)分度(D)的取值范圍介于-1.00—+1.00之間,值越大,區(qū)分度的效果越佳。區(qū)分度D>0為正區(qū)分,D<0為負區(qū)分,D=0為零區(qū)分區(qū)分度與測驗信度、難度的關系,請自行閱讀P51。精品資料(二)區(qū)分度的計算(jìsuàn)1、極端分組法(1)客觀性試題D=PH-PL例6:有道(yǒudào)試題,高分組有70%學生通過,低分組有30%的學生通過;而另一道題,高分組有40%學生通過,低分組有70%學生通過,求兩題的各自區(qū)分度?P51精品資料(2)主觀題D=(XH-XL)/N(H-L)XH為高分組得分(défēn)總數(shù)XL為低分組得分(défēn)總數(shù)H為該道題的最高分L為該道題的最低分N為應試總人數(shù)的25%。精品資料例7高分組低分組得分(défēn)X人次f得分(défēn)X人次f545043413231212310110004此題最高得分(défēn)5分,最低得分(défēn)0分精品資料2、相關(xiāngguān)法點二列相關法例8:15個學生在數(shù)學測驗中得分記錄(jìlù)如下,計算數(shù)學測驗中第一題的區(qū)分度?學生123456789101112131415測驗657031498050351081697855779042第一題010110100110110精品資料二列相關例9:已知一測驗中某選擇題的通過率為0.5,答對者的測驗總分平均(píngjūn)為76分,答錯者的測驗總分平均(píngjūn)為63分,全體被試20人總分的標準差為16,求該題的區(qū)分度?精品資料(三)提高(tígāo)區(qū)分度的方法1、使題目的難度適中,使整個考試難度適中題目的難度適中可使區(qū)分度達到最大值,因此(yīncǐ),使難度適中是提高區(qū)分度的重要方法。2、著重考察復雜的學習結果使高能學生得高分或低能學生得低分,使分數(shù)盡量分布在整個分數(shù)量尺上。3、掌握區(qū)分度的評價標準。P53,評價標準表精品資料第三章測驗目標定義1、深入分析課程教學目標;閱讀5分鐘后,請合上課本描繪教育目的、教學目標、課程目標、單元教學目標、課時(kèshí)教學目標、知識點教學目標、行為目標、學習目標及程序教學諸概念之間的關系。雙向細目表的概念內容類的概念P76,認真閱讀3分鐘。目標層次的概念精品資料第四章教育評價方案的編制與實施第二節(jié)教育評價方案的制定一、教育評價指標體系的的構建(一)教育評價指標體系的結構1、框架指標體系的構成:指標集、評價標準、量化符號。板書解釋(jiěshì)“評價對象”與“指標”的相對性2、模型一般模型:評價普遍現(xiàn)象分類模型:評價特殊現(xiàn)象舉例:“一間中學,教師的教學工作”精品資料一般模型與分類模型的相對性,例如:“一間中學,教師的教學工作”“一間中學,中學的全面工作”指標體系由指標、評價標準和量化符號組成3、指標(與“評價對象”相對)必達指標與期望指標對教師學歷、設備等設置;違紀(wéijì)犯罪率最低限度;表彰、獎項穩(wěn)定性指標與變動性指標“教學方法”/“德育”,“計算機輔助教學”軟指標與硬指標設備、場地/辦學特色,決策水平精品資料初擬評價指標頭腦風暴/因素分解/理論推演/篩選評價指標(1)經(jīng)驗法:理由充分否?/主次/指標關系(近似(jìnsì)、交叉、因果、矛盾等)/去難存易,刪繁就簡(2)統(tǒng)計調查:按5檔給專家問卷,統(tǒng)計“很重要”“重要”人數(shù)比例,按人數(shù)比例高低排列,刪除三分之二或四分之三。精品資料4、標準概念:達標程度/末級指標必須明確規(guī)定評價(píngjià)標準從內容上分:效能標準:效果標準和效率標準職責標準素質標準從參照點分:社會標準;規(guī)范性法則,參照點在外部科學標準:社會學或自然法則,參照點在內部精品資料5、量化符號權數(shù):一般把同一級指標群集視為整體,權值1分數(shù):指標賦分;等級賦分標度:達到標準的程度,說明什么(shénme)樣的程度屬于什么(shénme)等級。表示方法有:描述性語言,如,好、中、差;量化形式,如,用分數(shù)閾劃分,100-90屬于優(yōu)秀,89-75屬于良好。精品資料(二)教育評價指標體系的建造1、信度和效度信度:a、同一評價者用同一指標體系去重復評價某一對象,所得結果的一致程度(chéngdù);(再測信度)b、不同評價者用同一指標體系在相隔較短的時間去評價同一對象,看一致性程度(chéngdù)。(評分者信度)c、同一評價者、使用多種指標體系,幾乎同時評價同一對象,考察結果的真實程度(chéngdù)(一致程度(chéngdù))(復份信度)精品資料一般來說,指標內涵客觀;指標與指標之間相互獨立;硬指標比例大;評價標準的規(guī)定明確,等級間的界限分明,信度就高。如果軟指標多;指標、等級間界限模糊(móhu),評價者較難區(qū)分指標之間的差異,難以掌握評判準則,則會降低信度。效度:考察的是,我們所要評的,與指標體系能評的之間的關系。越接近,說明指標體系各要素(指標、標準、量化符號)的設置越準確,越有代表性。哪些做法影響效度?P102精品資料2、方法前人的啟示:量表與問卷/泰勒的“教育目標”以及目標達到的評價(píngjià)模式/“行為目標”的研究/教育目標分類學及教育評價(píngjià)的研究成果/我國的有關探索等。P103(1)掌握構建教育評價(píngjià)指標體系的依據(jù):理念問題/實證問題。P103(2)掌握評價(píngjià)對象逐級分解的方法。對內涵的理解正確、深刻。如“師德”指標。/理解、分解的多路向性/抓大放小原則/實施評價(píngjià)指標的可行性/精品資料(3)掌握評價等級和標準確定的方法。等級數(shù)應根據(jù)指標的類型和性質來確定。/四級分等,兩級定標的簡便方法。標準:根據(jù)不同類型指標的不同特點,綜合運用,如“教改實驗”、“教師隊伍結構”/各等級規(guī)定的評價標準,界限要清楚。(4)掌握指標與等級數(shù)值分配的方法。集體討論、咨詢、同行專家意見、調查研究,注重程序。參與人員必須:a、知識經(jīng)驗、判斷鑒別力;b、明確賦值依據(jù)和原則;c、認真(rènzhēn)嚴謹精品資料二、教育評價方案的編制以評價指標體系的撰寫為核心1、期望評語(píngyǔ)式編寫法2、積分評語(píngyǔ)式編寫法(1)等分積分評語(píngyǔ)式(2)累計積分評語(píngyǔ)式精品資料精品資料精品資料精品資料精品資料精品資料精品資料復習(fùxí):設計教育評價指標體系實操(一)確立目標與指標1、目標目標即目的,泛指人們(rénmen)從事活動所達到的目的。2、指標簡單地說,指標是用來反映、測量和說明上一級項目的下一級項目。是目標一個方面的規(guī)定,它是具體的、可測量的、行為化和操作化的目標。精品資料(二)選擇(xuǎnzé)指標體系的結構1、直線式結構(jiégòu)二級指標11一級指標1二級指標12二級指標21一級指標2二級指標22二級指標31一級指標3二級指標32精品資料例1:小學生最優(yōu)發(fā)展(fāzhǎn)的整體評價指標體系思想品德思想素質科學(kēxué)素質性格情趣愛好小審美素質美的感受和鑒賞學美的表達和創(chuàng)造生學業(yè)成績最知識素質知識結構優(yōu)百科知識面發(fā)自學能力展能力素質自理生活能力人際交往和組織能力體態(tài)和機能身體素質運動能力衛(wèi)生保健精品資料2、樹狀式結構(jiégòu)一級指標(zhǐbiāo)一級指標一級指標總目標二級指標精品資料例2:學生(xuésheng)主體性的基本結構主體性自主性主動性創(chuàng)造性自尊自信自我調控獨立判斷決斷自覺自理成就動機競爭意識興趣和求知欲主動參與社會適應性創(chuàng)新意識創(chuàng)造性思維能力動手實踐能力精品資料(三)教育評價指標體系建立(jiànlì)的步驟和方法1、步驟:(1)分解目標,提出初擬指標(2)歸類合并,進行篩選(3)專家評判(píngpàn)(4)預試修訂精品資料(1)分解目標(mùbiāo),提出初擬指標一般較為注意指標(zhǐbiāo)的科學性、完備性,唯恐掛一漏了或包羅不盡。這些指標(zhǐbiāo)不僅是較為粗疏的,數(shù)量也可能是比較多的。精品資料方法(fāngfǎ)(1)頭腦風暴法是利用頭腦積極思維,進行智力碰撞,激發(fā)智慧的靈感,從而提出評價指標的一種常用方法。(2)因素分解法是一種將評價指標按照(ànzhào)評價對象本身的邏輯結構逐級進行分解,把分解出來的主要因素作為評價指標的方法。應當注意:分解出來的因素,從高到低逐層縮小內涵,越往下層次指標越明確、越具體、范圍越小,越可以觀測。(3)理論推演法是根據(jù)有關學科的理論推演出評價指標的方法。(4)典型研究法是通過少數(shù)典型事例進行研究而設計評價指標的方法。精品資料(2)歸類合并(hébìng),進行篩選在初擬指標中,有的能反映評價對象的本質,有的則未必;有的算得上主要(zhǔyào)因素,有的可能只是次要因素。各因素之間出現(xiàn)交叉、重復、包含、矛盾、因果等關系,也難以避免,必須對初擬指標進行歸類合并和篩選,以達到“少而精”的要求。精品資料篩選(shāixuǎn)指標的方法(1)經(jīng)驗法一般遵循以下幾個要點:A、理由是否充分或必要判斷每項指標是否是必要的,缺了它有什么不好,保留它有什么理由,被保留的要有充分的依據(jù),在指標體系中,屬于非要不可的因素。B、取主舍次區(qū)分每項指標反映評價對象本質的程度,保留能反映本質的主要因素,舍棄不能充分反映本質的次要因素。C、從各指標之間的關系上進行比較內涵相同或近似的合并,內涵交叉的保留其一;有因果關系的,保留“因”而去掉“果”;相互矛盾的保留既符合方針、政策規(guī)定又切合當?shù)貙嶋H(shíjì)的指標。D、去難存易,刪繁就簡確實難測的指標可以舍棄;指標內涵復雜的,盡量求其單一。精品資料(3)專家(zhuānjiā)評判這是指標設計從設計者手中走向管理實踐(shíjiàn)的重要步驟。專家通常包括評價理論研究者、上級領導、富有經(jīng)驗的教育行政干部、教師等。專家評判可采用個別訪問、座談、問卷征詢、現(xiàn)場調查等方式,應根據(jù)不同情況選擇。精品資料調查(diàochá)統(tǒng)計法是在調查獲取資料的基礎上進行統(tǒng)計的方法。其具體的做法是:把初擬指標制成問卷,發(fā)給有關(yǒuguān)專家和有經(jīng)驗的教育工作者,請他們對初擬指標每一項作出判斷。一般分為五檔,即很重要、重要、一般、可要可不要、不要。答卷者在每項指標后記上自己判斷該項指標相比之下的重要程度(只能定一個檔次),然后,收回問卷,統(tǒng)計“很重要”、“重要”兩檔的人數(shù)比例,按評為“很重要”、“重要”人數(shù)比例由高到低順序排列,把低于某數(shù)值(一般低于三分之二或四分之三處作為劃界)的指標刪除,就得到篩選的指標。精品資料(4)預試修訂(xiūdìng)指標體系經(jīng)過篩選、修訂,初步確定以后,可以同評定標準相匹配,選點在小范圍試驗,看是否可行(kěxíng),試驗后對指標體系再作修改,然后投入使用。精品資料例3:學校(xuéxiào)領導班子評價指標體系的建立1、首先分4個層次提出了16項指標(1)政治素質(政治理論和政策水平、思想品德修養(yǎng)、事業(yè)心和責任感)(2)業(yè)務素質(文化專業(yè)達標、教育理論修養(yǎng)、管理實踐經(jīng)驗)(3)工作效能(職務與能力相稱、分工明確和各盡其責(ɡèjìnqízé)、團結協(xié)作、指揮靈便、工作效率高)(4)工作作風(深入實際、發(fā)揚民主、決策果斷、以身作則、開拓精神)精品資料2、把以上16項指標,分為五檔(很重要、重要、一般、可要可不要、不要),分別征詢意見,獲得以下結果:政治素質(事業(yè)心和責任感1、政治理論和政策水平3、思想品德修養(yǎng)11)業(yè)務素質(教育理論修養(yǎng)2、管理實踐經(jīng)驗10)工作效能(團結協(xié)作5、分工(fēngōng)明確和各盡其責8、工作效率高9)工作作風(決策果斷4、以身作則6、開拓精神7、發(fā)揚民主12)精品資料第五章教育評價(píngjià)的方法第一節(jié)教育評價方法概觀絕對評價法相對評價法個體內差異評價法定性分析(dìngxìngfēnxī)評價法定性綜合判斷法行為目標評價法臨床督導評價法精品資料指標評分法確定評價指標權重的方法(1)關鍵特征調查法(2)兩兩比較法(3)專家評判(píngpàn)平均法(4)倍數(shù)比較法精品資料精品資料精品資料精品資料精品資料等級換分法把具體(jùtǐ)項目的等級評定換算成分數(shù),然后將各項分數(shù)相加,滿分100.具體(jùtǐ)做法:1、大項目,分數(shù)和(X+Y+Z):100;2、某個大項目(X)再細分若干具體(jùtǐ)項目(x1,x2,x3),為x1,x2,x3分配分數(shù);3、將x1(或x2、x3)分等級(評語論域v),每一等級需確定具體(jùtǐ)的評價標準:合格/不合格;優(yōu)/中/劣;...4、將各等地折算成分數(shù)。如x1滿分11分,則可將優(yōu)算成11分,良-9分,中-7分,差-5分。5、將各項目得分相加。精品資料加權平均法權重分配方法(fāngfǎ)已經(jīng)介紹;自行閱讀3分鐘即可。模糊綜合評判法P137再介紹精品資料集體綜合評價法主要用于思想品德評價1、確定德育評價的具體項目(X+Y+Z)2、對每一個具體如X項目評分(100分):自評、他評。3、板書公式S=(r1+r2+r3+......rn)/Nr為每一德育項目自評分數(shù),N為項目數(shù)Fi=(∑Li-Si)/(R-1)Fi表示對思想品德的集體綜合評價,Li表示集體中每個成員(chéngyuán)對評價對象作出的評價(各個項目得分的平均數(shù));Si表示自我總評價分,R表示被試人數(shù)。精品資料案例:先打分,再計算(jìsuàn)同學甲分數(shù)同學乙分數(shù)......尊敬師長學習態(tài)度遵紀守法團結互助集體觀念社會活動勞動態(tài)度平均分

精品資料第三節(jié)處理教育評價信息的方法一、定性分析描述法(一)等級評定法:制定評分等級及評定標準。應用到如操行、能力、職稱、學校等級等方面。(二)評語鑒定法:單方面、多方面評語法/簡易、結論明晰,能對一些模糊現(xiàn)象進行描述鑒定,解決了一些定量(dìngliàng)研究不能解決的問題,但難以客觀,信度和效度較低。精品資料(三)寫實分析法:集事實資料/整理、描述資料,一般先概括描述一般情況,再描述典型事例/分析評價:簡要、中肯、抓住本質。寫實法的優(yōu)點是有依據(jù),新都高。缺點是全面地收集資料很難,耗時多。二、定量分析評判法(一)統(tǒng)計分析評判法自行(zìxíng)閱讀P135-137的平均數(shù)、加權平均數(shù)、標準差、標準分數(shù)、T分數(shù)內容,8分鐘。精品資料(二)模糊綜合評判簡介補充概念:隸屬度若對論域(研究的范圍)U中的任一元素x,都有一個數(shù)A(x)∈[0,1]與之對應,則稱A為U上的模糊集,A(x)稱為x對A的隸屬度。當x在U中變動時,A(x)就是(jiùshì)一個函數(shù),稱為A的隸屬函數(shù)。隸屬度A(x)越接近于1,表示x屬于A的程度越高,A(x)越接近于0表示x屬于A的程度越低。用取值于區(qū)間[0,1]的隸屬函數(shù)A(x)表征x屬于A的程度高低,這樣描述模糊性問題比起經(jīng)典集合論更為合理。舉例精品資料例如,對于模糊集A={高個子},如果論域是“成年男性”,則可構造隸屬函數(shù)如圖所示:板書確定因素論域X={x1,x2,…,xn}(如全班學生)和評語論域Y={y1(如侏儒),y2(矮子),…,ym(巨人)},其中xi表示問題中所考慮的因素(i=1,2,…,n),yj表示要判斷(pànduàn)的等級(j=1,2,…,m)。則稱X與Y之間的模糊關系矩陣精品資料為單因素評判(單單只是一個個因素,未涉及(shèjí)“綜合”之意,即,只有各行向量有意義,整個矩陣沒意義),其中行向量(ri1,ri2,…,rim)是考慮單因素xi在Y上的評判,rij稱為因素xi對評價等級yi的隸屬度,R為Y上模糊子集。設X上的模糊子集A表示因素xi在本問題的加權數(shù)(也稱權重),則合成稱為對各因素的綜合評判,且bj=板書(四種之一)(j=1,2,...m)精品資料其中算符“∨”為取大,“∧”為取小,稱為扎德算子。與矩陣乘法運算順序相同。舉例P57及A為1行m列矩陣的例子,請同學來算。當b1=b2=…=bm時,稱綜合評判全同失效(shīxiào);當b1,b2,…bm中至少有兩個相等的最大分量時,稱綜合評判義性失效(shīxiào)。書上例題講解,P139精品資料例:根據(jù)某生測評表用1、4模型(móxíng)進行模糊綜合評判 優(yōu)秀良好 一般 較差 差道德觀念 0.25 0.54 0.18 0.03 0尊敬師長 0.39 0.50 0.08 0.030學習態(tài)度 0.64 0.25 0.08 0.03 0尊紀守法 0.58 0.39 0.03 0 0團結互助 0.08 0.50 0.31 0.08 0.03集體觀念 0.10 0.64 0.18 0.05 0.03社會活動 0.20 0.52 0.23 0.05 0勞動態(tài)度 0.41 0.37 0.14 0.08 0權重分配:A=(0.18,0.14,0.14,0.13,0.09,0.12,0.12,0.08)精品資料教育評價結果的合成方法(1)單純普通數(shù)據(jù)的合成加權平均(píngjūn),逐級向上,直到在一級指標上歸并為一個合成的分值。舉例(2)單純模糊數(shù)據(jù)的合成方法A、多級模糊綜合評判法1、對末級(二級)指標進行第一次綜合評判:W、R合成。如上例“某課堂教學質量”2、將二級指標對一級指標所形成的若干綜合評判結果(即第一次綜合評判結果)組成一個新的模糊矩陣。如“某課堂教學質量”再加上...3、將新矩陣與一級指標權重向量合成計算綜合評判結果。精品資料B、二維加權綜合合成法P143縱向(zònɡxiànɡ)加權/橫向加權板書畫圖:精品資料精品資料(3)混合數(shù)據(jù)的合成方法(fāngfǎ)1、普通數(shù)據(jù)轉模糊數(shù)據(jù)2、模糊數(shù)據(jù)轉換成普通數(shù)據(jù)精品資料第六章教育測量結果的整理、轉換與組合第一節(jié)教育測量數(shù)據(jù)的特點與種類數(shù)據(jù)的特點:波動性、規(guī)律性數(shù)據(jù)種類:點計數(shù)據(jù)、度量數(shù)據(jù)//間斷性數(shù)據(jù)、連續(xù)型數(shù)據(jù)//類別變量、等級變量、等距變量、比率變量教育測量數(shù)據(jù)的特點:1、多屬等級變量;2、多屬主觀(zhǔguān)的;3、多屬隨機的(概率為1則為確定性);4、模糊性精品資料第二節(jié)教育測量分數(shù)的初步整理一、統(tǒng)計表的結構(自學(zìxué)2分鐘)二、頻數(shù)分布表的編制由同學自習5分鐘后,上臺講解書本例題。精品資料第三節(jié)教育測量分數(shù)(fēnshù)的轉換原始分(卷面分)的缺點:意義模糊,不能直接比較導出分數(shù)(fēnshù):由原始分轉換而成,如標準分、T分數(shù)(fēnshù)、百分等級分數(shù)(fēnshù)等。精品資料一、標準分方差概念:隨機變量離差平方的數(shù)學期望樣本方差?計算P153的方差公式例題P155,自學5分鐘例題:甲、乙、丙、丁四人在某次語文考試中分別(fēnbié)得72、60、48、90,而全體學生的語文平均分60,標準差12分,求四人相應的標準分數(shù)。精品資料例題:對某校高二學生進行期中(qīzhōnɡ)學習質量測驗,語文、數(shù)學和英語成績的平均分數(shù)分別是80、70、85,標準差分別為10分、15分、12分。若某學生三科成績分別為85、82、90分,問該生成績哪一科最好?精品資料標準分數(shù)Z的性質與特點1、均值0,標準差1。(補充證明,概率論P97)Z=0表示成績(chéngjì)與平均數(shù)相等;2、有相對0點作參照點,有相等單位的導出分數(shù),可加減;3、由于是對原始分數(shù)的線性變換,所以不改變原始分數(shù)的分布形態(tài)(其證明同1);4、若原始分數(shù)接近正態(tài)分布,則標準分范圍大致在-4—+4之間。課后思考:常模團體不服從正態(tài)分布則不能直接用標準分數(shù),怎么辦?自行查找資料。精品資料標準(biāozhǔn)分的進一步轉換1、T分數(shù):10Z+502、標準(biāozhǔn)九:2Z+5標準(biāozhǔn)9分與其他評分制的相互關系(P139)3、CEEB分數(shù)(美國大學入學考試報告分數(shù)):500+100Z4、TOEFL:500+70Z5、IQ=100+15Z精品資料精品資料三、百分等級分數(shù)概念(gàiniàn)計算:100-(100R-50)/N例1、52名同學考試,甲第4名,求其百分等級分數(shù)。例2、52名同學考試,甲、乙、丙、丁戊己庚辛壬癸共10人并列第4名,求其百分等級分數(shù)。精品資料百分等級常模建立方法基本思想:把某個測驗分數(shù)分布的全距劃分為100個等級,建立原始分與百分等級間的一一對應關系。步驟:1、從高到低排列2、逐個統(tǒng)計次數(shù)3、計算“以下累計次數(shù)”4、計算“以下累計相對次數(shù)”5、將第四步換成百分制以P154的36個分數(shù)為例,示范(shìfàn)1例,其余同學們自己算。精品資料基于分組歸類數(shù)據(jù)建立百分等級常模方法:編制“成績次數(shù)分布統(tǒng)計表”——只不過是在P154頁的表的基礎上增加(zēngjiā)“相對次數(shù)”、“累計次數(shù)”、“累積相對次數(shù)”等條目。計算公式:(100/N)*[Fb+f(X-Lb)/i]N為常模團體總人數(shù),X為原分數(shù),Lb為X所在組別的組下限,F(xiàn)b為小于Lb的各組次數(shù)之和,f為X所在組的次數(shù),i為組距。請計算P154頁例子中,67分、89分的百分等級。精品資料幾種(jǐzhǒnɡ)標準分數(shù)關系圖手繪,參考書P140P219精品資料第十六章課程(kèchéng)評價第二節(jié)課程評價模式的演變課程評價模式:評價人員或研究人員依據(jù)某種教育思想、課程理念或特定的評價目的選取一種或幾種評價途徑所建立起的相對完整的評價體系。它介于評價理論與具體的評價方法之間,既涉及(shèjí)標準又涉及(shèjí)方法,既包含了評價者的評價取向,也規(guī)定了評價的具體操作方式。精品資料精品資料精品資料回顧P22-23,“八年研究”。3分鐘目標模式的觀點:在《課程與教學的基本原理》一書中,泰勒認為,一個有效的課程必須回答四個問題:1、學校應力求達到何種教育目標。2、要為學生(xuésheng)提供怎樣的教育經(jīng)驗(學習經(jīng)驗),才能達到這些目標。3、如何有效地組織好這些教育經(jīng)驗;4、我們如何確定這些教育目標正在實現(xiàn)。精品資料泰勒的主要(zhǔyào)觀點:評估的過程從本質上說就是判斷課程和教學計劃在多大程度上實現(xiàn)了教育目標的過程。評價應針對學生的行為而進行,因為教育尋求的正是學生行為的改變。評價應是任意一段時間內做的一次以上的評價,因為評價要反映的是行為的變化,而這種變化必須通過更多的評價對比才能反映出來。精品資料精品資料評價步驟:1、建立課程計劃的目的和目標;2、以具體行為(xíngwéi)和具體內容的方式闡述每個目標;3、確定使用目標的情景;4、確定情景呈現(xiàn)的方式;5、確定獲取信息的記錄方式;6、收集反映學生行為(xíngwéi)變化的信息;7、將收集到的信息與行為(xíngwéi)目標作比較。有學者將其簡化為四步:確定教育目標、設計評價情景、選擇和編制評價工具、分析評價結果。精品資料實例:目標(mùbiāo)評價模式在體育專業(yè)背越式跳高教學中的應用首先,確定教學目標(mùbiāo):背越式跳高學習結束時,學生獲得一定的技能和能力;其次,進行任務分析:精品資料再次,設計和實施教學過程。進行任務分析后,對不同的教學單元實施教學,確認學生在各個環(huán)節(jié)應當實現(xiàn)的目標行為。最后,評價環(huán)節(jié):教學過程中對技能目標進行形成性評價至最終總結性評價,確認其實現(xiàn)課程目標的程度。目標模式的功能(gōngnéng):1、修訂課程與教學計劃;2、進一步明確教育目標;3、影響教學與學習;4、可診斷出學生學習狀況。精品資料精品資料精品資料泰勒模式的特點及局限局限:1、對目標自身的合理性缺乏評價;2、只觀察了預期目標是否達到,非預期效果沒有評價;3、所定目標多數(shù)為教育管理者提出的,沒有考慮學生的需要(xūyào);4、不應用統(tǒng)一的目標來評價自由發(fā)展的人;5、重結果輕過程。精品資料結論:泰勒模式第一次指出了教育目標、課程設計和評價過程之間存在著密切聯(lián)系。泰勒認為,評價的目的要比較全面地檢驗學習經(jīng)驗在實際上是否起作用(zuòyòng),指導教師去引起所期望的那種結果。泰勒模式風靡全球,即使在評價模式多樣化的今天,也有舉足輕重的地位。精品資料CIPP模式課程評價的CIPP模式即背景-輸入-過程-成果模式(context-input—process—product),是美國教育評價學家斯塔夫爾比姆倡導的課程評價模式。該模式于20世紀60年代后期發(fā)展起來。主要觀點:評價不應該局限于評定課程目標的達成程度,而應該是為課程決策者提供有用的信息。如:“評價最重要的目的不是(bùshi)證明,而是改善?!薄霸u價是提供有用資料以作決定的歷程”精品資料背景評價:提供整個課程方案運行的各種依據(jù)和信息,了解評價對象的需要與課程目標之間的一致性程度,以調節(jié)現(xiàn)存的目的(mùdì)及其優(yōu)先秩序。輸入評價:對可供選擇的各種課程計劃評價擇優(yōu),即可行性的評價。過程評價:對計劃實施情況進行不斷檢查,描述課程實施情況,為決策者的修正提供可靠信息。成果評價:測量、解釋和判斷課程方案的實效,幫助決策者決定課程方案終止、修正還是繼續(xù)實施。精品資料優(yōu)點:1、將目標本身也列入評價對象范圍;2、重視形成性評價,強調為決策提供信息,使評價活動(huódòng)更具有方向性和實用性;3、評價教育的全過程,相對全面;4、目的不是簡單評價一個方案的好壞,而是決策,所以研究者相對客觀。精品資料目標游離模式斯里克文(M.Scriven)提出。它針對目標模式忽視非預期效應的弊端提出來的。他說,“對目的的考慮和評價是一個不必要的,而且很可能是有害的步驟”。因為目標評價很容易使評價人受方案既定目的的約束,限制了評價的范圍,削弱了評價的意義。他建議把評價的重點由“方案想干什么”轉移到“方案實際干了什么”上來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論