教育測(cè)量與評(píng)價(jià)考試重點(diǎn)版_第1頁(yè)
教育測(cè)量與評(píng)價(jià)考試重點(diǎn)版_第2頁(yè)
教育測(cè)量與評(píng)價(jià)考試重點(diǎn)版_第3頁(yè)
教育測(cè)量與評(píng)價(jià)考試重點(diǎn)版_第4頁(yè)
教育測(cè)量與評(píng)價(jià)考試重點(diǎn)版_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、課程性質(zhì)和教學(xué)要求課程的性質(zhì): 教育測(cè)量與評(píng)價(jià) 是教育測(cè)量學(xué)與教育評(píng)價(jià)學(xué)內(nèi)容的整合并側(cè)重于教育測(cè)量的一門(mén)綜合性教育課程,它著力探討對(duì)教育教學(xué)效果進(jìn)行測(cè)量、評(píng)價(jià)的原理和方法,是一門(mén)帶有綜合性、技術(shù)性、實(shí)踐性、應(yīng)用性等特征的應(yīng)用性學(xué)科,是實(shí)現(xiàn)教育科學(xué)研究與教育管理科學(xué)化所必須借助的一門(mén)科學(xué),也是教育學(xué)專業(yè)和小學(xué)教育專業(yè)所開(kāi)設(shè)的一門(mén)必修專業(yè)基礎(chǔ)課程。教學(xué)目標(biāo)和要求 :理解教育測(cè)量與評(píng)價(jià)的基本概念、原理和方法,能正確使用各類標(biāo)準(zhǔn)化的教育測(cè)驗(yàn)、會(huì)作測(cè)驗(yàn)質(zhì)量分析、能正確解釋分?jǐn)?shù)的含義,并學(xué)會(huì)運(yùn)用這些知識(shí),對(duì)學(xué)校教育、教學(xué)和研究實(shí)踐中的實(shí)際問(wèn)題,做出比較正確與合理的判斷和評(píng)價(jià),以促進(jìn)教育管理現(xiàn)代化、教育研究

2、科學(xué)化。第一章 教育測(cè)量與評(píng)價(jià)的學(xué)科發(fā)展教育測(cè)量與評(píng)價(jià)的基本問(wèn)題教育測(cè)量與評(píng)價(jià)的發(fā)展歷史教育測(cè)量與評(píng)價(jià)的學(xué)科地位和作用1 .測(cè)量的定義史蒂文斯曾對(duì)測(cè)量作出以下定義: “就其廣義來(lái)說(shuō),測(cè)量是按照法則給事物指派數(shù)字。 ”我國(guó)有些學(xué)者認(rèn)為: “測(cè)量是對(duì)客觀事物進(jìn)行某種數(shù)量化的測(cè)定” , “測(cè)量是按照一定的法 則,用數(shù)字方式對(duì)事物的屬性進(jìn)行描述的過(guò)程”本書(shū)的觀點(diǎn):從廣義上講,測(cè)量就是根據(jù)某些法則與程序,用數(shù)字對(duì)事物在量上的規(guī)定性予以確定和描述的過(guò)程。從以上對(duì)測(cè)量所下的各種定義可以看出,這種對(duì)事物進(jìn)行區(qū)分的過(guò)程,必須是按照一定法則的,區(qū)分的結(jié)果必須能夠用數(shù)字的方式進(jìn)行描述的。2 .測(cè)量的要素( 1)測(cè)量

3、的量具測(cè)量的量具是指依據(jù)某些科學(xué)原理和法則,發(fā)展出合適的量具或制定出科學(xué)的測(cè)量方案。( 2)測(cè)量的單位不同的測(cè)量所采用的單位是不同的。理想的測(cè)量單位必須符合兩個(gè)條件:要有確定的意義;要有相等的價(jià)值。教育測(cè)量的單位不夠完善,既無(wú)統(tǒng)一的單位,也不符合等距的要求。( 3)測(cè)量的參照點(diǎn)量的參照點(diǎn)系測(cè)量的起點(diǎn)。要確定事物的量,必須有一個(gè)測(cè)量的起點(diǎn),這個(gè)起點(diǎn)就叫做測(cè)量的參照點(diǎn)。參照點(diǎn)有兩種類型: 絕對(duì)參照點(diǎn)(絕對(duì)零點(diǎn)); 相對(duì)參照點(diǎn)(相對(duì)零點(diǎn))。理想的參照點(diǎn)是絕對(duì)參照點(diǎn),但教育測(cè)量中很難找到絕對(duì)零點(diǎn),多采用人為指定的相對(duì)零點(diǎn)。3.教育測(cè)量的定義與特點(diǎn)教育測(cè)量的定義教育測(cè)量,就是針對(duì)學(xué)校教育影響下學(xué)生各方面

4、的發(fā)展,側(cè)重從量的規(guī)定性上予以確定和描述的過(guò)程。教育測(cè)量的特點(diǎn)( 1)本書(shū)的觀點(diǎn): 間接性和推斷性; 測(cè)量對(duì)象的模糊性和測(cè)量誤差的不可避免性; 量表具有多樣性,結(jié)果具有相對(duì)抽象性。( 2)其他的觀點(diǎn):有人概括為: 間接性; 相對(duì)性。(金瑜)有人概括為: 間接性; 相對(duì)性; 客觀性。(鄭日昌)有人概括為: 間接性; 不確定性; 明確的目的性。(朱德全、宋乃慶)4 .量表及其種類量表的概念量表(量尺)是指確定了測(cè)量單位和參照點(diǎn)并具有取值系統(tǒng)的測(cè)量工具。量表的類型由于事物的屬性(特征)不同,以及所制定的規(guī)則不同,致使用數(shù)的屬性來(lái)描述事物屬性(特征)所達(dá)到的程度不同,這就產(chǎn)生了不同測(cè)量水平的問(wèn)題。史蒂

5、文斯根據(jù)對(duì)測(cè)量結(jié)果數(shù)量化描述的不同水平,將測(cè)量分成四種不同水平:稱名測(cè)量、順序測(cè)量、等距測(cè)量、比率測(cè)量。這四種不同水平的測(cè)量產(chǎn)生了相應(yīng)的四種類型的量表。5 .稱名量表和順序量表稱名量表(命名量表或名稱量表或類別量表)稱名量表是最低水平的測(cè)量量表,它只是用數(shù)字代表事物或用數(shù)字對(duì)事物進(jìn)行分類。在這種情況下,數(shù)字只是事物的符號(hào),而沒(méi)有任何數(shù)量的意義。適合于對(duì)稱名量表進(jìn)行統(tǒng)計(jì)分析的統(tǒng)計(jì)方法有百分比、次數(shù)、眾數(shù)和X 2檢驗(yàn)。順序量表(等級(jí)量表)順序量表是次低水平的測(cè)量量表,它不僅能夠指代事物類別,而且能夠表明不同類別的大小、等級(jí)或事物具有某種特征的程度。在順序量表中,數(shù)字只表示等級(jí)、大小和程度的順序,它

6、既沒(méi)有相等的單位,也沒(méi)有絕對(duì)的零點(diǎn)。適合于對(duì)順序量表進(jìn)行統(tǒng)計(jì)分析的方法有中數(shù)、百分位數(shù)、等級(jí)相關(guān)系數(shù)和肯德?tīng)柡椭C系數(shù)等。6 .等距量表和比率量表等距量表等距量表是較高水平的測(cè)量量表,它不僅能夠指代事物的類別、等級(jí),而且具有相等的單位。適合于對(duì)等距量表進(jìn)行統(tǒng)計(jì)分析的方法有平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)系數(shù)以及t 檢驗(yàn)和 F檢驗(yàn)。比率量表(等比量表)比率量表是最高水平的測(cè)量量表,它除了具有類別、等級(jí)、等距的特征外,還具有絕對(duì)零點(diǎn)。適合于對(duì)比率量表進(jìn)行統(tǒng)計(jì)分析的方法除了與等距量表相同外,還有幾何平均數(shù)、變異系數(shù)。7 .教育測(cè)量屬于哪一種水平的測(cè)量,為什么?答: ( 1)教育測(cè)量屬于順序測(cè)量的水平。(2)

7、從所使用的參照點(diǎn)來(lái)說(shuō),教育測(cè)量領(lǐng)域的參照點(diǎn)均為相對(duì)參照點(diǎn); 從所使用的單位來(lái)說(shuō),教育測(cè)量的單位遠(yuǎn)沒(méi)有其他測(cè)量的單位成熟和完善,既無(wú)統(tǒng)一的單位,也不符合等距的要求。8.教育評(píng)價(jià)的概念(如何理解“教育評(píng)價(jià)”的含義?)評(píng)價(jià)的含義廣義的講,評(píng)價(jià)泛指衡量、判斷人物或事物的價(jià)值。教育評(píng)價(jià)的定義對(duì)于什么是教育評(píng)價(jià),專家、學(xué)者至今沒(méi)有一個(gè)統(tǒng)一的認(rèn)識(shí)。但具有代表性的觀點(diǎn)有以 下幾種:格蘭朗德:評(píng)價(jià)是為了確定學(xué)生達(dá)到教學(xué)目標(biāo)的程度,收集、分析和解釋信息的系統(tǒng)過(guò) 程;評(píng)價(jià)包括對(duì)學(xué)生的定量描述和定性描述兩方面。斯塔費(fèi)爾比姆:評(píng)價(jià)是一種規(guī)定、獲取和提供敘述性和判斷性的過(guò)程。這些信息涉及研 究對(duì)象的目標(biāo)、設(shè)計(jì)、實(shí)施和影響

8、的價(jià)值及優(yōu)缺點(diǎn),以便指導(dǎo)如何決策、滿足教學(xué)效能核 定的需要,并增加對(duì)研究對(duì)象的了解。美國(guó)教育評(píng)價(jià)標(biāo)準(zhǔn)委員會(huì):評(píng)價(jià)是某些現(xiàn)象的價(jià)值如優(yōu)缺點(diǎn)的系統(tǒng)調(diào)查,為教育決策提 供依據(jù)的過(guò)程。泰勒:評(píng)價(jià)評(píng)價(jià)的過(guò)程在本質(zhì)上是確定課程和教學(xué)大綱在實(shí)際上實(shí)現(xiàn)教育目標(biāo)的程度的 過(guò)程。德雷斯:所謂評(píng)價(jià),就是決定某種活動(dòng)、目的及程序的價(jià)值的過(guò)程。橋本重治:評(píng)價(jià)是與教育的目標(biāo)和價(jià)值有明確關(guān)系的概念,是按照教育目標(biāo)和價(jià)值觀對(duì) 學(xué)生的學(xué)習(xí)成果及教育計(jì)劃的效果等進(jìn)行測(cè)量的過(guò)程。布魯姆:評(píng)價(jià)乃是系統(tǒng)地收集證據(jù)用以確定學(xué)習(xí)者實(shí)際上是否發(fā)生某些變化,確定學(xué)生 個(gè)體變化的數(shù)量或程度。我國(guó)學(xué)者黃光揚(yáng):教育評(píng)價(jià)是指按照一定的價(jià)值標(biāo)準(zhǔn)和教育目

9、標(biāo),利用測(cè)量和非測(cè)量的種種方法系統(tǒng)地收集資料信息對(duì)學(xué)生的發(fā)展變化及其影響學(xué)生發(fā)展變化的各種要素進(jìn)行價(jià) 值分析和價(jià)值判斷,并為教育決策提供依據(jù)的過(guò)程。從上述對(duì)“評(píng)價(jià)”概念在教育教學(xué)活動(dòng)情境下的各種描述中不難發(fā)現(xiàn),教育評(píng)價(jià)包含以下幾個(gè)共同的要點(diǎn): 強(qiáng)調(diào)以教育目標(biāo)為標(biāo)準(zhǔn)的價(jià)值判斷過(guò)程; 強(qiáng)調(diào)運(yùn)用多種方法系統(tǒng)收集資料和信息; 教育評(píng)價(jià)的內(nèi)容既要以是教育計(jì)劃、也要以是學(xué)生的學(xué)習(xí)結(jié)果,也要以是某種教育現(xiàn)象、教學(xué)活動(dòng)、教育目的或教育程序; 強(qiáng)調(diào)為學(xué)生發(fā)展和教育決策服務(wù)。9 .教育測(cè)量與教育評(píng)價(jià)的關(guān)系測(cè)量與評(píng)價(jià)既有聯(lián)系又有區(qū)別。教育評(píng)價(jià)最根本的特征是做出價(jià)值判斷。而教育測(cè)量過(guò)程的完結(jié),在給出數(shù)量事實(shí)的描述與判

10、斷之后,不一定都要做出價(jià)值判斷。從這個(gè)意義上說(shuō), 教育測(cè)量可以為教育評(píng)價(jià)提供價(jià)值判斷的基本數(shù)量事實(shí), 教育測(cè)量是教育評(píng)價(jià)的基礎(chǔ);而教育評(píng)價(jià)往往是教育測(cè)量過(guò)程的繼續(xù),是對(duì)測(cè)量結(jié)果的解釋與應(yīng)用,并朝著價(jià)值判斷與釋放教育功能的方向拓展。10 .思考題:教育測(cè)量與教育評(píng)價(jià)有何區(qū)別?答 :( 1)教育評(píng)價(jià)最根本的特征是做出價(jià)值判斷。而教育測(cè)量在給出數(shù)量事實(shí)的描述與判斷之后,不一定都要做出價(jià)值判斷。( 2)教育測(cè)量可以為教育評(píng)價(jià)提供價(jià)值判斷的基本數(shù)量事實(shí),教育測(cè)量是教育評(píng)價(jià)的基礎(chǔ);而教育評(píng)價(jià)往往是教育測(cè)量過(guò)程的待續(xù),是對(duì)測(cè)量結(jié)果的解釋與應(yīng)用,并朝著價(jià)值判斷與釋放教育功能的方向拓展。11 .教育評(píng)價(jià)與教育評(píng)

11、估的關(guān)系教育評(píng)價(jià)與教育評(píng)估這兩個(gè)概念既有聯(lián)系又有區(qū)別。第一,英語(yǔ)詞源不同(教育評(píng)價(jià)通常用 “education evaluation 表示,教育評(píng)估通常用 “ educational assessmen展示),其意義則多少有所差別;第二,源出相同(教育測(cè)量運(yùn)動(dòng)、美國(guó)著名的“八年研究” ) ,它們肯定有想通與交叉之處;第三,漢語(yǔ)詞義相近( “評(píng)估”一詞,含有“評(píng)判” 、 “評(píng)量” 、 “估測(cè)” 、“估算” 等意思; 教育評(píng)估可能有價(jià)值判斷, 也可能沒(méi)有價(jià)值判斷) , 它們?cè)趦?nèi)容上有交叉,也有區(qū)別;22.教育測(cè)量與評(píng)價(jià)的發(fā)展歷史( 1)中國(guó)是考試制度的發(fā)源地( 2)中國(guó)科舉制度的世界地位( 3)教

12、育測(cè)量學(xué)科的誕生( 4)教育測(cè)量運(yùn)動(dòng)的蓬勃開(kāi)展( 5)美國(guó)的“八年研究”是教育評(píng)價(jià)的催生劑( 6)教育測(cè)量與評(píng)價(jià)理論的發(fā)展1)教育測(cè)量與評(píng)價(jià)是現(xiàn)代教育科學(xué)研究的三大領(lǐng)域之一;( 2)教育測(cè)量與評(píng)價(jià)在教育改革中具有重要的作用;( 3)教育改革呼喚教育測(cè)量與評(píng)價(jià)更加科學(xué)化;( 4)教育測(cè)量與評(píng)價(jià)是教師的專業(yè)素養(yǎng)和能力。第二章 教育測(cè)量與評(píng)價(jià)的類型和功能教育測(cè)量與評(píng)價(jià)的主要類型教育測(cè)量與評(píng)價(jià)的主要功能1 .教育測(cè)量與評(píng)價(jià)的類型2 .按測(cè)量與評(píng)價(jià)在教學(xué)中運(yùn)用的時(shí)機(jī)分類,教育測(cè)量與評(píng)價(jià)可分為:( 1)形成性測(cè)量與評(píng)價(jià): 形成性測(cè)量與評(píng)價(jià)是在教學(xué)活動(dòng)過(guò)程中經(jīng)常實(shí)施的,其目的:其一,教師藉此獲得教學(xué)過(guò)程中連

13、續(xù)性的反饋,了解學(xué)生的學(xué)習(xí)效果、學(xué)習(xí)歷程、學(xué)習(xí)特點(diǎn)、學(xué)習(xí)困難等信息,作為隨時(shí)修正自己教學(xué)的參考;其二,學(xué)生根據(jù)反饋的結(jié)果獲知自己學(xué)習(xí)后的表現(xiàn)情況,從而肯定或修正自己以后的學(xué)習(xí)方式。( 2)診斷性測(cè)量與評(píng)價(jià): 診斷性測(cè)量與評(píng)價(jià)是對(duì)經(jīng)常表現(xiàn)出學(xué)習(xí)困難的學(xué)生所作的測(cè)量與評(píng)價(jià),它的目的是對(duì)個(gè)人的問(wèn)題行為及其原因進(jìn)行診斷。診斷性測(cè)量與評(píng)價(jià)多半是在形成性測(cè)量與評(píng)價(jià)之后實(shí)施。3)終結(jié)性測(cè)量與評(píng)價(jià):終結(jié)性測(cè)量與評(píng)價(jià)是用于教學(xué)結(jié)束后,其目的:其一,在教學(xué)目標(biāo)之下,檢查學(xué)生一學(xué)期的學(xué)業(yè)達(dá)到了什么樣程度,從而判斷教學(xué)效果的得失;其二,根據(jù)終結(jié)性測(cè)量與評(píng)價(jià)的結(jié)果,評(píng)定學(xué)生的學(xué)業(yè)成績(jī),并將評(píng)定結(jié)果通知學(xué)生家長(zhǎng)或記入檔案

14、。3 .按解釋測(cè)量結(jié)果或評(píng)價(jià)結(jié)果時(shí)的參照點(diǎn)分類,教育測(cè)量與評(píng)價(jià)可分為:( 1)常模參照測(cè)量與評(píng)價(jià):常模參照測(cè)量與評(píng)價(jià)是將被試水平與測(cè)驗(yàn)常模相比較,以評(píng)價(jià)被試在團(tuán)體中的相對(duì)地位的一種測(cè)量與評(píng)價(jià)類型。( 2)標(biāo)準(zhǔn)參照測(cè)量與評(píng)價(jià)(目標(biāo)參照測(cè)量與評(píng)價(jià)):標(biāo)準(zhǔn)參照測(cè)量與評(píng)價(jià)是將被試的表現(xiàn)與既定的教育目標(biāo)或行為標(biāo)準(zhǔn)相比較,以評(píng)價(jià)被試在多大程度上達(dá)到該標(biāo)準(zhǔn)。( 3) 潛力參照測(cè)量與評(píng)價(jià): 潛力參照測(cè)量與評(píng)價(jià)是將被試實(shí)際水平與其自身潛在水平(潛力)相比較,以評(píng)價(jià)被試有無(wú)充分發(fā)揮自身潛力為目的。在強(qiáng)調(diào)人性化、動(dòng)態(tài)化和個(gè)別化的現(xiàn)代教育測(cè)評(píng)潮流下,潛力參照測(cè)量與評(píng)價(jià)理應(yīng)發(fā)揮更大的作用3.按測(cè)量與評(píng)價(jià)被試行為表現(xiàn)的性

15、質(zhì)分類,教育測(cè)量與評(píng)價(jià)可分為:( 1)最佳行為測(cè)量與評(píng)價(jià):最佳行為測(cè)量與評(píng)價(jià)是以測(cè)量最佳行為表現(xiàn)為目的。凡是以成就或能力的高低為評(píng)價(jià)基礎(chǔ)的,都屬于最佳行為測(cè)量與評(píng)價(jià)。( 2) 典型行為測(cè)量與評(píng)價(jià): 典型行為測(cè)量與評(píng)價(jià)的目的不在測(cè)量與評(píng)價(jià)被試能力的高低,而是測(cè)量與評(píng)價(jià)其是否具備某種(或某些)典型行為。在這些測(cè)量過(guò)程,希望被試以其平常的典型狀況來(lái)回答,無(wú)所謂正確與錯(cuò)誤之分。在重視學(xué)生個(gè)性發(fā)展和全人教育的現(xiàn)代教育理念下,典型測(cè)量與評(píng)價(jià)的方法具有特殊的意義。1)智力測(cè)量與評(píng)價(jià):智力測(cè)量與評(píng)價(jià)的目的在于測(cè)量被試的智力并對(duì)被試的智力發(fā)展水平和特點(diǎn)做出評(píng)價(jià)。( 2)能力傾向測(cè)量與評(píng)價(jià):能力傾向測(cè)量與評(píng)價(jià)的目

16、的在于測(cè)量與評(píng)價(jià)個(gè)人的潛在才能,預(yù)測(cè)個(gè)人的能力發(fā)展傾向。能力傾向測(cè)量與評(píng)價(jià)一般可分為兩種:一種是關(guān)于一般能力傾向的測(cè)量與評(píng)價(jià), 旨在探測(cè)個(gè)人多方面的潛能; 另一種是特殊能力傾向測(cè)量與評(píng)價(jià),旨在探測(cè)個(gè)人某方面的特殊潛在能力。( 3)成就測(cè)量與評(píng)價(jià):成就測(cè)量與評(píng)價(jià)的目的在于測(cè)量并評(píng)價(jià)個(gè)人在接受教育或訓(xùn)練后的成就。成就測(cè)量與評(píng)價(jià)有兩種類型:一是學(xué)科成就測(cè)驗(yàn),旨在測(cè)量與評(píng)價(jià)被試在某一科目上的學(xué)習(xí)成就;二是綜合成就測(cè)驗(yàn),旨在測(cè)量與評(píng)價(jià)被試在多個(gè)學(xué)科或綜合學(xué)科上學(xué)習(xí)成就。( 4)人格測(cè)量與評(píng)價(jià)(個(gè)性測(cè)量與評(píng)價(jià)) :人格測(cè)量與評(píng)價(jià)的目的在于測(cè)量與評(píng)價(jià)被試的人格心理特征,諸如氣質(zhì)、性格、興趣、態(tài)度、動(dòng)機(jī)、適應(yīng)

17、性等方面的心理特征。用于人格測(cè)量與評(píng)價(jià)的量具主要分為兩類:一類是自陳人格問(wèn)卷;另一類是投射測(cè)驗(yàn)。5 .按測(cè)量與評(píng)價(jià)的對(duì)象分類,教育測(cè)量與評(píng)價(jià)可分為:( 1)個(gè)別測(cè)量與評(píng)價(jià):個(gè)別測(cè)量與評(píng)價(jià)是指同一主試在同一時(shí)間內(nèi)只能測(cè)量一個(gè)被試。這種形式的測(cè)量與評(píng)價(jià),主試對(duì)被試行為反應(yīng)有較多的觀察和控制機(jī)會(huì),主試與被試有更多的交流,這可讓主試獲得更多的信息,也可以建立較融洽的主被試合作關(guān)系,有利于測(cè)量與評(píng)價(jià)的進(jìn)行。但是個(gè)別測(cè)量與評(píng)價(jià)費(fèi)時(shí)、費(fèi)力,特別是主試必須經(jīng)過(guò)嚴(yán)格的訓(xùn)練才能勝任。2)團(tuán)體測(cè)量與評(píng)價(jià):團(tuán)體測(cè)量與評(píng)價(jià)是指在同一時(shí)間內(nèi)由一位主試測(cè)量許多位被試。這種形式的測(cè)量與評(píng)價(jià)突出的優(yōu)點(diǎn)是節(jié)省時(shí)間,可以在短時(shí)期內(nèi)

18、收集到大量的測(cè)量數(shù)據(jù)。但由于同一時(shí)間內(nèi)接受測(cè)量的被試多,不易有效地控制被試的行為,容易產(chǎn)生測(cè)量誤差,從而影響測(cè)量的信度和效度。6 .按測(cè)量與評(píng)價(jià)的材料(測(cè)驗(yàn)材料)分類,教育測(cè)量與評(píng)價(jià)可分為:( 1)文字測(cè)量與評(píng)價(jià)(文字測(cè)驗(yàn)、紙筆測(cè)驗(yàn)) :文字測(cè)量與評(píng)價(jià)的測(cè)驗(yàn)內(nèi)容是以文字的形式表現(xiàn)的,被試也用文字作答的一種測(cè)量與評(píng)價(jià)的方式。對(duì)于不同教育背景的被試,這種測(cè)量與評(píng)價(jià)的有效性將受到一定程度的影響。( 2)非文字測(cè)量與評(píng)價(jià)(非文字測(cè)驗(yàn)、操作測(cè)驗(yàn)) :非文字測(cè)量與評(píng)價(jià)的測(cè)驗(yàn)內(nèi)容是通過(guò)圖形、儀器、工具、實(shí)物、模型等形式表現(xiàn)的,被試通過(guò)指認(rèn)、手工操作向主試提供答案的一種測(cè)量與評(píng)價(jià)的方式。這種形式的測(cè)量與評(píng)價(jià)不

19、受或較少受文化背景的影響與限制。7 .按測(cè)量與評(píng)價(jià)量具有的標(biāo)準(zhǔn)化程度分類,教育測(cè)量與評(píng)價(jià)可分為:( 1)標(biāo)準(zhǔn)化測(cè)量與評(píng)價(jià)(標(biāo)準(zhǔn)化測(cè)驗(yàn)) :標(biāo)準(zhǔn)化測(cè)量與評(píng)價(jià)的測(cè)驗(yàn)是指由測(cè)量專家嚴(yán)格按照測(cè)驗(yàn)編制程序而精心編制的一種測(cè)驗(yàn)。通常標(biāo)準(zhǔn)化測(cè)驗(yàn)都具有一定的編制程序,包括試題的抽樣,難度、區(qū)分度指標(biāo)分析,明確的施測(cè)指導(dǎo)語(yǔ)和施測(cè)程度,計(jì)分標(biāo)準(zhǔn),解釋分?jǐn)?shù)的常模,以及信度、效度等指標(biāo)資料。( 2)非標(biāo)準(zhǔn)化測(cè)量與評(píng)價(jià):非標(biāo)準(zhǔn)化測(cè)量與評(píng)價(jià)的測(cè)驗(yàn)編制相對(duì)自由,沒(méi)有嚴(yán)格按照測(cè)驗(yàn)編制程序進(jìn)行。教師自編測(cè)驗(yàn)常由教師依照自己的教學(xué)需要和教學(xué)目標(biāo)而自行編制的測(cè)驗(yàn),是一種非標(biāo)準(zhǔn)化測(cè)驗(yàn)。2.教育測(cè)量與評(píng)價(jià)的功能( 1)實(shí)現(xiàn)教育判斷的功

20、能教育測(cè)量與評(píng)價(jià)的最基本、最原始、最現(xiàn)實(shí)、最普遍的功能,就是實(shí)現(xiàn)教育判斷,具體來(lái)說(shuō)就是實(shí)現(xiàn)測(cè)量評(píng)定、事實(shí)判斷、價(jià)值判斷、問(wèn)題診斷和區(qū)分選拔等功能。( 2)改進(jìn)教師教學(xué)的功能通過(guò)教育測(cè)量與評(píng)價(jià)的結(jié)果,教師能夠了解學(xué)生的起點(diǎn)行為,作為改進(jìn)教學(xué)、補(bǔ)救教與學(xué)的依據(jù),確保教學(xué)目標(biāo)的達(dá)到,從而充分發(fā)揮其改進(jìn)教師教學(xué)的功能。( 3)促進(jìn)學(xué)生學(xué)習(xí)的功能教育測(cè)量與評(píng)價(jià)具有激勵(lì)學(xué)生的學(xué)習(xí)動(dòng)機(jī)、幫助學(xué)生的記憶和促進(jìn)遷移、促進(jìn)學(xué)生自我評(píng)價(jià)等促進(jìn)學(xué)生學(xué)習(xí)的功能。( 4)行使教育管理的功能教育測(cè)量與評(píng)價(jià)具有控制、指揮、導(dǎo)向、計(jì)劃、檢查、考核、評(píng)估和監(jiān)督等方面的作用,通過(guò)對(duì)教師、目標(biāo)和過(guò)程等方面管理來(lái)行使其教育管理的功能。

21、第三章 教育測(cè)量與評(píng)價(jià)的質(zhì)量特性教育測(cè)量與評(píng)價(jià)的信度教育測(cè)量與評(píng)價(jià)的效度教育測(cè)量與評(píng)價(jià)中項(xiàng)目的難度教育測(cè)量與評(píng)價(jià)中項(xiàng)目的區(qū)分度1 .信度的意義信度是指測(cè)量結(jié)果的穩(wěn)定性程度,記為 rXX 。換一句話說(shuō),信度是指用同一測(cè)量工具反復(fù)測(cè)量同一種物質(zhì)對(duì)象所得多次測(cè)量結(jié)果間的一致性程度。測(cè)驗(yàn)信度是對(duì)測(cè)驗(yàn)工具及其操作的整體質(zhì)量的一種量度, 是測(cè)驗(yàn)性能的重要質(zhì)量指標(biāo)。如果測(cè)驗(yàn)本身抗干擾能力強(qiáng),測(cè)驗(yàn)實(shí)施過(guò)程各方面誤差因素都控制得好,多次施測(cè)所得分?jǐn)?shù)(測(cè)值)的一致性就高,那么測(cè)量信度高,人們?cè)谑褂盟脺y(cè)值時(shí)就會(huì)感覺(jué)可靠。2 .信度的統(tǒng)計(jì)定義定義1:信度是一個(gè)被測(cè)團(tuán)體真分?jǐn)?shù)方差與觀察分?jǐn)?shù)方差之比。即:r XX=(2

22、T / (2X定義2:信度是一個(gè)被試團(tuán)體的真分?jǐn)?shù)與觀察分?jǐn)?shù)的相關(guān)系數(shù)的平方。即:r XX= &TX定義 3: 信度是一個(gè)被試團(tuán)體在測(cè)驗(yàn)X( A 卷) 上的觀察分?jǐn)?shù)與在測(cè)驗(yàn)X 的任意一個(gè) “平行測(cè)驗(yàn)" X' (B卷)上觀察分?jǐn)?shù)的相關(guān)系數(shù)。即: r XX=必X'3 .重測(cè)信度(穩(wěn)定性系數(shù))( 1)重測(cè)信度是指用一個(gè)量表(測(cè)驗(yàn)或評(píng)價(jià)表)對(duì)同一組被施測(cè)兩次所得結(jié)果的一致性程度,其大小等于同一組被試在兩次測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。( 2)重測(cè)信度基本假設(shè):某測(cè)驗(yàn)所要測(cè)量的潛在特質(zhì),短期內(nèi)不會(huì)隨著時(shí)間推移而改變。3)重測(cè)信度適用于異質(zhì)性測(cè)驗(yàn)(一個(gè)測(cè)驗(yàn)包括幾個(gè)不同的部分,這

23、幾個(gè)部分分別測(cè)量幾個(gè)不同的心理特質(zhì), 它們之間可能并不存在相關(guān)或相關(guān)較低) , 也適用于速度測(cè)驗(yàn)和運(yùn)動(dòng)技能測(cè)驗(yàn)。4 .復(fù)本信度(等值性系數(shù)或等值穩(wěn)定性系數(shù))( 1)復(fù)本信度是指兩個(gè)平行測(cè)驗(yàn)(在試題格式、題數(shù)、難度、指導(dǎo)語(yǔ)說(shuō)明、施測(cè)要求等方面都相當(dāng),并且都用來(lái)測(cè)量相同潛在特質(zhì)或?qū)傩?,但試題又是不相同的測(cè)驗(yàn))測(cè)量同一批被試所得結(jié)果的一致性程度,其大小等于同一批被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。( 2)實(shí)施復(fù)本測(cè)驗(yàn)的方式:一是在同一個(gè)時(shí)間連續(xù)施測(cè)(此時(shí)所得的復(fù)本信度叫等值性系數(shù)) ,二是間隔一段時(shí)間后施測(cè)(此時(shí)所得復(fù)本信度叫等值穩(wěn)定性系數(shù)) 。( 3) 使用復(fù)本信度首先要構(gòu)造出兩份或兩份以上的

24、真正的平行測(cè)驗(yàn)。 這是一個(gè)很難達(dá)到的條件。另外,重測(cè)信度的一些不足,在復(fù)本信度中仍然存在,需要加以克服。( 4)復(fù)本信度不僅適用于難度測(cè)驗(yàn),也是估計(jì)速度測(cè)驗(yàn)信度的好方法。5.同質(zhì)性信度的概念( 1)同質(zhì)性信度(內(nèi)部一致性信度)是指測(cè)驗(yàn)內(nèi)部所有題目間的一致性程度。這里題目間的一致性含有兩層意思:其一是指所有題目測(cè)的是同一種心理特質(zhì);其二是所有題目得分之間都具有較高的正相關(guān)。( 2)同質(zhì)性信度的基本假設(shè):當(dāng)一個(gè)測(cè)驗(yàn)具有較高的同特性信度時(shí),說(shuō)明測(cè)驗(yàn)主要測(cè)的是某一單個(gè)心理特質(zhì),由于眾多的題目測(cè)試了同一心理特質(zhì),那么實(shí)測(cè)結(jié)果就是該特質(zhì)水平的反映。( 3)同質(zhì)性信度不適用于異質(zhì)測(cè)驗(yàn)和速度測(cè)驗(yàn)。6 .同質(zhì)性

25、信度的估計(jì)方法( 1) 分半信度分半信度指是的將一個(gè)測(cè)驗(yàn)分成對(duì)等的兩半后, 所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。分半信度的計(jì)算方法和等值復(fù)本信度的方法類似,只不過(guò)分半信度計(jì)算的是兩個(gè)“半測(cè)驗(yàn)”上得分的相關(guān)系數(shù),只是半個(gè)測(cè)驗(yàn)的信度,還必須用斯皮爾曼布朗公式加以校正。( 2) 庫(kù)德理查遜信度該方法適合于測(cè)驗(yàn)題目全部為二分記分題的測(cè)驗(yàn)的內(nèi)部一致性信度分析。 常用的庫(kù)德理查遜公式有:( 3)克龍巴赫系數(shù)當(dāng)測(cè)驗(yàn)題型較多,并非都是二分記分題時(shí),估計(jì)測(cè)驗(yàn)信度可采用克龍巴赫系數(shù)。其計(jì)算公式為:( 4) 荷伊特信度1941 年荷伊特提出用方差分量比來(lái)估計(jì)測(cè)驗(yàn)內(nèi)部一致性的方法,其估計(jì)值為:7 .評(píng)分者信度評(píng)分

26、者信度的含義評(píng)分者信度是指多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致性程度。評(píng)分者信度的計(jì)算( 1) 當(dāng)評(píng)分者人數(shù)為兩人時(shí), 評(píng)分者信度等于兩個(gè)評(píng)分者給同一批被試的答卷所評(píng)分?jǐn)?shù)的相關(guān)系數(shù)。依據(jù)數(shù)據(jù)形式,可采用不同的相關(guān)系數(shù)計(jì)算方法。( 2)當(dāng)評(píng)分者人數(shù)多于兩人時(shí),評(píng)分者信度可用肯德?tīng)柡椭C系數(shù)進(jìn)行估計(jì)。8 .標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度分析(1 )百分比一致性指標(biāo)(PA)百分比一致性指標(biāo)是指同一測(cè)驗(yàn)或兩平行測(cè)驗(yàn)先后兩次施測(cè), 其對(duì)被試的分類結(jié)果一致的比例。其計(jì)算公式為:(2) K一致性系數(shù)K 一致性系數(shù)是指實(shí)際被評(píng)定為一致的百分比與在理論上被評(píng)定為一致的最大可能次數(shù)百分比的比率。其計(jì)算公式:(3) K2指數(shù)

27、標(biāo)準(zhǔn)參照測(cè)驗(yàn)關(guān)注決斷的可靠性,而這種決斷顯然與被試團(tuán)體的平均水平密切相關(guān)。 在考慮到這個(gè)因素的基礎(chǔ)上, 心理統(tǒng)計(jì)學(xué)家萊芬斯頓提出了 K2 指數(shù)作為考察標(biāo)準(zhǔn)參照測(cè)驗(yàn)信度的指標(biāo)。其計(jì)算公式為:9 .測(cè)量標(biāo)準(zhǔn)誤測(cè)量標(biāo)準(zhǔn)誤的含義測(cè)量標(biāo)準(zhǔn)誤是指測(cè)驗(yàn)中所得測(cè)值偏離真分?jǐn)?shù)的程度,記為SE。測(cè)量標(biāo)準(zhǔn)誤與測(cè)驗(yàn)信度的關(guān)系測(cè)量標(biāo)準(zhǔn)誤的意義測(cè)量標(biāo)準(zhǔn)誤是反映測(cè)量結(jié)果精確性和可靠性的又一指標(biāo),同時(shí)也是人們正確解釋測(cè)驗(yàn)分?jǐn)?shù)的科學(xué)依據(jù)。10 .效度的概念效度的意義效度是指一個(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)量的特性的程度。對(duì)這一概念,我們可以從以下幾個(gè)方面來(lái)理解: 效度始終是針對(duì)一定測(cè)量目的而言的; 效度只有程度上的差異; 效度

28、是針對(duì)測(cè)量結(jié)果而言的; 評(píng)價(jià)一個(gè)測(cè)量是否有效要多角度、多方面地收集證據(jù)。效度的統(tǒng)計(jì)定義效度可定義為目標(biāo)真分?jǐn)?shù)方差與觀察分?jǐn)?shù)方差之比:r XY= 2V / (2X效度與信度的關(guān)系(1 )信度高是效度高的必要而非充分條件(2 )效度系數(shù)不會(huì)大于信度系數(shù)的平方根11 .如何理解“效度”的意義?效度是指一個(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)量的特性的程度。對(duì)這一概念,我們可以從以下幾個(gè)方面來(lái)理解:( 1)效度始終是針對(duì)一定測(cè)量目的而言的;( 2)效度只有程度上的差異;( 3)效度是針對(duì)測(cè)量結(jié)果而言的;( 4)評(píng)價(jià)一個(gè)測(cè)量是否有效要多角度、多方面地收集證據(jù)。12 .內(nèi)容效度內(nèi)容效度的含義及應(yīng)用范圍內(nèi)容效度是指

29、測(cè)驗(yàn)題目樣本對(duì)于應(yīng)測(cè)內(nèi)容與行為領(lǐng)域的代表性程度。 如果是教學(xué)情境下 的成就測(cè)驗(yàn),那么其內(nèi)容效度就是看測(cè)驗(yàn)題目樣本能體現(xiàn)教學(xué)目標(biāo)與教材要求的程度。內(nèi)容效度主要適用于教育測(cè)量(尤其是學(xué)業(yè)成就測(cè)驗(yàn))的情境中,也適合于某些用于選拔和分類的職業(yè)測(cè)驗(yàn),但不適合某些心理測(cè)驗(yàn)(如智力測(cè)驗(yàn)、人格測(cè)驗(yàn)) 。內(nèi)容效度的分析方法 邏輯分析的方法內(nèi)容效度的邏輯分析法,即依靠有關(guān)專家對(duì)測(cè)驗(yàn)題目與應(yīng)測(cè)內(nèi)容范圍的吻合程度作出判斷。 內(nèi)容效度的量化分析方法該方法要求專家在仔細(xì)審閱測(cè)驗(yàn)?zāi)繕?biāo)的基礎(chǔ)上, 獨(dú)立地對(duì)測(cè)驗(yàn)的每個(gè)題目作出判斷: “該題目實(shí)際測(cè)到的內(nèi)容與其欲測(cè)量的目標(biāo)內(nèi)容之間相關(guān)程度如何,并用四點(diǎn)量表(用完全無(wú)關(guān)、有點(diǎn)相關(guān)、

30、相關(guān)較密切、完全相關(guān)來(lái)表示)來(lái)表示這種相關(guān)的程度大小” ;當(dāng)兩位專家完成此項(xiàng)工作后,統(tǒng)計(jì)弱相關(guān)(完全無(wú)關(guān)、有點(diǎn)相關(guān)) 、強(qiáng)相關(guān)(相關(guān)較密切、完全相關(guān))的題目數(shù),則此測(cè)驗(yàn)的內(nèi)容效度系數(shù)為:內(nèi)容效度系數(shù)=D/ ( A+B+C+D ) ( D 表示兩位專家都判定為強(qiáng)相關(guān)的題目數(shù))13 .結(jié)構(gòu)效度結(jié)構(gòu)效度的含義結(jié)構(gòu)效度是指一個(gè)測(cè)驗(yàn)或量表實(shí)際測(cè)到所要測(cè)量的理論結(jié)構(gòu) (結(jié)構(gòu)是指心理學(xué)或社會(huì)學(xué)上的一種理論構(gòu)想或特質(zhì))的程度。結(jié)構(gòu)效度的驗(yàn)證一般步驟 提出有關(guān)理論結(jié)構(gòu)的說(shuō)明,并據(jù)此設(shè)計(jì)測(cè)量用的試題; 提出可以驗(yàn)證該理論結(jié)構(gòu)是存在的假設(shè)說(shuō)明; 采用各種方法收集實(shí)際的資料,以驗(yàn)證第二步提出的假設(shè)的正確性; 收集其他

31、類型的輔助證據(jù),淘汰與理論結(jié)構(gòu)相反的試題,或是修正理論,并重復(fù)第二和第三步,直到下述的假設(shè)得到驗(yàn)證,即測(cè)驗(yàn)的結(jié)構(gòu)效度獲得支持為止。結(jié)構(gòu)效度的驗(yàn)證方法 測(cè)驗(yàn)內(nèi)部尋找證據(jù)法這種方法是通過(guò)研究測(cè)驗(yàn)內(nèi)部結(jié)構(gòu)來(lái)驗(yàn)證測(cè)驗(yàn)的結(jié)構(gòu)效度。 它主要包括內(nèi)容效度、 作答過(guò)程分析、測(cè)驗(yàn)的同質(zhì)性和因素分析等四個(gè)方面。 測(cè)驗(yàn)之間尋找證據(jù)法這一方法的特點(diǎn)是同時(shí)考察兩個(gè)或多個(gè)測(cè)驗(yàn)間的相互關(guān)系,從而來(lái)驗(yàn)證測(cè)驗(yàn)的結(jié)構(gòu)效度。它包括相容效度、聚合效度、區(qū)分效度和“多種特質(zhì)多種方法矩陣法”等具體方法。 考察測(cè)驗(yàn)的實(shí)證效度法如果一個(gè)測(cè)驗(yàn)有實(shí)證效度, 則可以拿該測(cè)驗(yàn)所預(yù)測(cè)的效標(biāo)的性質(zhì)與種類作為該測(cè)驗(yàn)的結(jié)構(gòu)效度指標(biāo),至少可以從效標(biāo)的性質(zhì)與種

32、類來(lái)推論測(cè)量的結(jié)構(gòu)效度。主要方法有差異被試比較法和先后測(cè)試分析法。14.試比較內(nèi)容效度、結(jié)構(gòu)效度、效標(biāo)關(guān)聯(lián)效度的異同相同點(diǎn):三者都是作為檢驗(yàn)測(cè)驗(yàn)有效程度的指標(biāo),都可以作為評(píng)價(jià)一個(gè)測(cè)驗(yàn)優(yōu)劣的標(biāo)準(zhǔn)。不同點(diǎn): 考察的角度不同。內(nèi)容效度是指測(cè)驗(yàn)題目樣本對(duì)于應(yīng)測(cè)內(nèi)容與行為領(lǐng)域的代表性程度。結(jié)構(gòu)效度是指一個(gè)測(cè)驗(yàn)或量表實(shí)際測(cè)到所要測(cè)量的理論結(jié)構(gòu)(結(jié)構(gòu)是指心理學(xué)或社會(huì)學(xué)上的一種理論構(gòu)想或特質(zhì))的程度。效標(biāo)關(guān)聯(lián)效度是指一個(gè)測(cè)驗(yàn)對(duì)于處于特定情境中的個(gè)體行為進(jìn)行預(yù)測(cè)時(shí)的有效性。 應(yīng)用的范圍不同。內(nèi)容效度主要適用于教育測(cè)量(尤其是學(xué)業(yè)成就測(cè)驗(yàn))的情境中,也適合于某些用于選拔和分類的職業(yè)測(cè)驗(yàn),但對(duì)于某些特質(zhì)的心理測(cè)驗(yàn)(

33、如智力測(cè)驗(yàn)、人格測(cè)驗(yàn)) , 內(nèi)容效度并不適合。 結(jié)構(gòu)效度主要用于智力測(cè)驗(yàn)、 人格測(cè)驗(yàn)等一些心理測(cè)驗(yàn)方面。效標(biāo)關(guān)聯(lián)效度適用于能夠找到有效效標(biāo)的測(cè)驗(yàn),常用的效標(biāo)主要有:學(xué)業(yè)成就、等級(jí)評(píng)定、臨床診斷、專門(mén)的訓(xùn)練成績(jī)、實(shí)際的工作表現(xiàn)、對(duì)團(tuán)體的區(qū)分能力以及其它現(xiàn)成的有效測(cè)驗(yàn)。 確定的方法不同。內(nèi)容效度確定的主要方法是邏輯分析法、量化分析法。結(jié)構(gòu)效度確定的主要方法是測(cè)驗(yàn)內(nèi)部尋找證據(jù)法、測(cè)驗(yàn)之間尋找證據(jù)法和考察測(cè)驗(yàn)的實(shí)證效度法;效標(biāo)關(guān)聯(lián)效度確定的主要方法有相關(guān)法、顯著差異法、命中率。15 .難度的概念題目或項(xiàng)目的難度,就是指被試完成題目或項(xiàng)目任務(wù)時(shí)所遇到的困難程度。定量刻畫(huà)被試作答一個(gè)題目的困難程度的量數(shù),

34、就叫做題目的難度系數(shù),也常稱為難度值,用符號(hào)P 表示。16 .難度系數(shù)的計(jì)算方法(1)以全體被試得分率為難度系數(shù)如果一個(gè)題目的難度大,則被試得高分的可能性??;反之,如果題目的難度小,則被試得高分的可能性就大。因此,用得分率可以作為難度系數(shù)的指標(biāo)。其計(jì)算公式為:如果題目是選擇題的話,被試有可能猜對(duì)而得分,因此,對(duì)選擇題的難度系數(shù)有人建議需用下面的公式進(jìn)行校正:CP = (k P-1) / (k -1)(2)以全體被試失分率為難度系數(shù)直接建立在通過(guò)率基礎(chǔ)上的難度系數(shù), P 值越大試題越容易, P 值越小試題越難做。這與人們觀念可能不一致,因此有人提議用失分率q 來(lái)表示難度,計(jì)算公式為: q = 1

35、-P(3 )以兩端組被試得分率的均值為難度系數(shù)該方法是分別計(jì)算高分組(試和低分組(試的得分率, 然后求取二者的平均值作為難度系數(shù),公式為: P = ( PH+PL ) 2以兩端組(試的得分率作為難度系數(shù)的具體計(jì)算步驟: 按(試的總分,將全體(試從高到低進(jìn)行排序; 從高分往下找,找出高分組;由低分往上找,找出低分組。兩組人數(shù)分別占總?cè)藬?shù)的2 7%; 分別計(jì)算高分組、低分組的(試在該題目上的平均得分; 代入公式,分別計(jì)算分組和低分組被試在同一個(gè)題目上的難度系數(shù); 把 PH 和 PL 代入公式 P = (PH+PL ) 2 ,計(jì)算這個(gè)題目的難度系數(shù)。17 .難度的等距變換用上述方法計(jì)算出來(lái)的難度系數(shù)

36、,都屬于順序變量,不具有相等的單位。因此,通過(guò)P 值的比較并不能客觀指出難度之間差異大小,這對(duì)我們作進(jìn)一步的難度分析帶來(lái)了困難。為了解決這個(gè)問(wèn)題, 人們常假設(shè)每個(gè)試題所要測(cè)量的潛在特質(zhì)或能力是呈正態(tài)分布的,然后就可以根據(jù)正態(tài)分布曲線,將試題的難度值P 作為正態(tài)曲線下的(概率)面積,轉(zhuǎn)換成具有相等單位的等距量表,即 Z 分?jǐn)?shù)(標(biāo)準(zhǔn)分?jǐn)?shù)) 。由于標(biāo)準(zhǔn)分?jǐn)?shù)具有相等單位,屬于等距量表。所以,用標(biāo)準(zhǔn)分?jǐn)?shù)作為題目難度的指標(biāo),為進(jìn)一步作難度分析帶來(lái)了一些方便。18 .測(cè)驗(yàn)題目的恰當(dāng)難度和恰當(dāng)難度分布測(cè)驗(yàn)由多個(gè)題目所組成,顯然,所有這些題目的難度取值都應(yīng)該力求恰當(dāng),而且這些題目分布狀態(tài)也應(yīng)合理。究竟怎樣的題目

37、難度與難度分布是合適的,這主要取決于測(cè)驗(yàn)的目的與性質(zhì)。19 .常模參照測(cè)驗(yàn)、標(biāo)準(zhǔn)參照測(cè)驗(yàn)所要求的項(xiàng)目恰當(dāng)難度及難度分布是什么?為什么?(1) 常模參照測(cè)驗(yàn)的項(xiàng)目恰當(dāng)難度是P值盡量接近0.50,因?yàn)橹挥性谶@種情況下題目的區(qū)分性能最好。 常模參照測(cè)驗(yàn)所要求的項(xiàng)目恰當(dāng)難度分布是,圍繞這個(gè)點(diǎn),有一個(gè)適當(dāng)寬的全距。這樣做的原因有以下兩個(gè):一是測(cè)驗(yàn)時(shí),通常希望開(kāi)始有幾個(gè)難度較低的題目來(lái)穩(wěn)定被試情緒, 末尾用幾個(gè)難度稍大的題目以便只有少數(shù)高水平者才能通過(guò), 二是讓全部項(xiàng)目都取0.50的難度,通常難以實(shí)現(xiàn)。當(dāng)然,在允許有適當(dāng)寬的全距的前提下,仍然要力爭(zhēng)大多數(shù)項(xiàng)目難度取值接近0.50。( 2)標(biāo)準(zhǔn)參照測(cè)驗(yàn)的目的

38、是要考察被試的水平是否達(dá)到應(yīng)有要求,因而測(cè)驗(yàn)項(xiàng)目的難度,就不應(yīng)由被試的實(shí)際通過(guò)率來(lái)決定,而應(yīng)由項(xiàng)目的考核要求是否體現(xiàn)了應(yīng)有標(biāo)準(zhǔn)或教學(xué)目標(biāo)來(lái)決定。無(wú)論項(xiàng)目通過(guò)率是高還是低,只要體現(xiàn)了應(yīng)用的標(biāo)準(zhǔn)或教學(xué)目標(biāo),項(xiàng)目的難度就是合理的恰當(dāng)?shù)摹?0 .區(qū)分度的意義題目區(qū)分度是指題目區(qū)別被試水平能力的量度,記為 D 。區(qū)分度的分析方法,大約可以歸納成兩類:一是外在效標(biāo)法,即分析被試在測(cè)驗(yàn)題目上的得分與外在客觀標(biāo)準(zhǔn)上的表現(xiàn)之間的關(guān)系。二是內(nèi)部一致性法。即分析被試在測(cè)題上的得分與在整個(gè)測(cè)驗(yàn)總分之間的一致性程度。區(qū)分度的值域范圍在-1.00 至 +1.00 之間。通常D 為正值,稱作積極區(qū)分; D 為負(fù)值, 稱作消極區(qū)分; D 為 0 , 稱作無(wú)區(qū)分作用。 具有積極區(qū)分作用的項(xiàng)目, 其 D 值越大, 區(qū)分的效果越好。21 .區(qū)分度的計(jì)算( 1)相關(guān)法區(qū)分度的實(shí)質(zhì)是題分與總分的相關(guān), 因此, 各種計(jì)算相關(guān)系數(shù)的方法都可以用于計(jì)算區(qū)分度。但具體采用哪一個(gè),應(yīng)根據(jù)題分、總分的數(shù)據(jù)形式而定。2)高低分組法被試在測(cè)驗(yàn)分?jǐn)?shù)序列中兩端高分、低分組被認(rèn)為是兩個(gè)極端效標(biāo)組。這兩個(gè)極端效標(biāo)組間在特定題目上的反應(yīng)差別程度可以刻

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論