版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一章
緒論第一節(jié)教育測(cè)量與評(píng)價(jià)的基本概念第二節(jié)教育測(cè)量與評(píng)價(jià)的發(fā)展歷史第三節(jié)學(xué)習(xí)教育測(cè)量與評(píng)價(jià)的意義第一節(jié)教育測(cè)量與評(píng)價(jià)的概念一、教育測(cè)量(Educationalmeasurement)教育測(cè)量就是根據(jù)一定的法則用數(shù)字對(duì)教育現(xiàn)象加以描述。法則是指測(cè)量所依據(jù)的規(guī)則和方法。數(shù)字就是代表某一事物屬性的量,數(shù)字也是作為事物的符號(hào),有時(shí)有確定的意義。數(shù)字具有一定意義時(shí)就是數(shù)值,數(shù)值具有區(qū)分性,如:1是1、2是2;具有序列性,如:1<2<3;具有等距性即有可加性.教育測(cè)量具有兩個(gè)基本的要素,即參照點(diǎn)和單位.二、教育測(cè)驗(yàn)(Educationaltesting)測(cè)驗(yàn)就是對(duì)行為樣本進(jìn)行測(cè)量的系統(tǒng)程式。行為是指被試對(duì)測(cè)題所作的反應(yīng)。行為樣本是指一組有代表性的行為。系統(tǒng)程式是指測(cè)驗(yàn)在編制、實(shí)施、評(píng)分、解釋方面都依據(jù)確定的規(guī)則。測(cè)驗(yàn)的類型:標(biāo)準(zhǔn)化與非標(biāo)準(zhǔn)化測(cè)驗(yàn)個(gè)別測(cè)驗(yàn)與團(tuán)體測(cè)驗(yàn)速度測(cè)驗(yàn)與難度測(cè)驗(yàn)客觀測(cè)驗(yàn)與非客觀測(cè)驗(yàn)文字測(cè)驗(yàn)與非文字測(cè)驗(yàn)最高作為測(cè)驗(yàn)與典型作為測(cè)驗(yàn)構(gòu)造性測(cè)驗(yàn)與投射性測(cè)驗(yàn)按測(cè)驗(yàn)的功能可分為:1、智力測(cè)驗(yàn)2、能力傾向測(cè)驗(yàn)3、成就測(cè)驗(yàn)4、人格測(cè)驗(yàn)
按測(cè)驗(yàn)的目的分類1、描述性測(cè)驗(yàn)2、診斷性測(cè)驗(yàn)3、預(yù)測(cè)性測(cè)驗(yàn)三、教育評(píng)價(jià)(Educationalevaluation)
教育評(píng)價(jià)就是按照一定的價(jià)值標(biāo)準(zhǔn),對(duì)教育現(xiàn)象及其變化的主因素進(jìn)行的價(jià)值判斷。對(duì)教育評(píng)價(jià)可從三個(gè)方面來理解:1、教育評(píng)價(jià)的本質(zhì)在於“價(jià)值判斷”,必然要涉及教育價(jià)值問題。所謂教育價(jià)值是指作為客體的教育現(xiàn)象的屬性與主體需要的關(guān)係。教育價(jià)值包括個(gè)體價(jià)值與社會(huì)價(jià)值。2、教育評(píng)價(jià)的對(duì)象是教育現(xiàn)象,特別是受教育者,因而評(píng)價(jià)的重點(diǎn)是學(xué)生。3、教育評(píng)價(jià)的出發(fā)點(diǎn)是價(jià)值準(zhǔn)則。價(jià)值準(zhǔn)則是指評(píng)價(jià)主體對(duì)評(píng)價(jià)對(duì)象進(jìn)行評(píng)價(jià)的依據(jù)四、教育評(píng)估(Educationalassessment)
教育評(píng)估是對(duì)教育現(xiàn)象進(jìn)行評(píng)論估計(jì),不含有價(jià)值的意義。但漢語中特別是口語評(píng)價(jià)與評(píng)估交替使用。教育評(píng)價(jià)中的概念理解誤區(qū)1、把測(cè)量當(dāng)評(píng)價(jià)。即以事實(shí)當(dāng)判斷。2、把評(píng)比當(dāng)評(píng)價(jià)。即把評(píng)定優(yōu)劣當(dāng)作評(píng)定價(jià)值。第二節(jié)教育測(cè)量與評(píng)價(jià)的發(fā)展歷史一、教育測(cè)量的發(fā)展歷史
(一)、教育測(cè)量運(yùn)動(dòng)產(chǎn)生的背景
1、工業(yè)革命的發(fā)展需要專門的職業(yè)訓(xùn)練和職業(yè)輔導(dǎo)。
2、十九世紀(jì)西方社會(huì)開始重視智力落後者和精神失常者,並對(duì)其進(jìn)行診斷和訓(xùn)練。
3、心理學(xué)家開始重視個(gè)別差異的研究。
4、中國(guó)的科舉制度傳入西方,西方各國(guó)建立了現(xiàn)代考試制度。(二)、教育測(cè)量運(yùn)動(dòng)的先驅(qū)
1、心理學(xué)史家波林指出:“在測(cè)驗(yàn)領(lǐng)域中,十九世紀(jì)八十年代是高爾頓的十年,九十年代是卡特爾的十年,二十世紀(jì)頭十年則是比奈的十年。高爾頓是英國(guó)的生物學(xué)家和心理學(xué)家,高爾頓首先用進(jìn)化論的理論研究個(gè)體差異,對(duì)977個(gè)歷史上著名人物的家譜、生活史進(jìn)行了研究。1889年出版了《遺傳的天才》一書,設(shè)計(jì)了多種感覺、運(yùn)動(dòng)強(qiáng)度、反映速度的測(cè)驗(yàn),採(cǎi)用自由聯(lián)想法、問卷法、等級(jí)評(píng)定法,分析個(gè)性差異。
2、卡特兒將實(shí)驗(yàn)心理學(xué)與測(cè)驗(yàn)運(yùn)動(dòng)結(jié)合起來,在自己的實(shí)驗(yàn)室內(nèi)編制了五十多個(gè)測(cè)驗(yàn),對(duì)美國(guó)大批兒童和學(xué)生進(jìn)行了測(cè)量研究,1890年他發(fā)表了《心理測(cè)驗(yàn)與測(cè)量》一文,描述了這些測(cè)驗(yàn),並在該文中首創(chuàng)心理測(cè)驗(yàn)這一術(shù)語。3、智力測(cè)量的鼻祖是法國(guó)心理學(xué)家比奈,他1889年建立了第一個(gè)法國(guó)心理學(xué)實(shí)驗(yàn)室,創(chuàng)辦了第一種法文心理學(xué)雜誌。1903年他以自己的兩個(gè)女兒為被試,用填字、圖片解釋來測(cè)驗(yàn)其智力,發(fā)表了《智力的實(shí)驗(yàn)研究》一書。1904年比奈作為法國(guó)公立學(xué)校中低能班管理委員會(huì)的委員,極力主張用測(cè)驗(yàn)法去辯別心理缺陷兒童。1905年他與助手西蒙發(fā)表了題為“診斷異常兒童智力的新方法”一文,介紹了第一個(gè)智力量表。比西量表有30個(gè)難易不同的專案組成。(三)、教育測(cè)量運(yùn)動(dòng)的發(fā)展教育測(cè)量運(yùn)動(dòng)自本世紀(jì)初興起,二十年代進(jìn)入狂熱,四十年代達(dá)到高峰,五十年代轉(zhuǎn)入穩(wěn)步發(fā)展時(shí)期。這期間的發(fā)展主要有以下特點(diǎn):
1、編制了一批操作測(cè)驗(yàn),以彌補(bǔ)語言文字量表的缺陷??捎渺段拿ず陀姓Z言障礙的人,並進(jìn)行跨文化研究。
2、編制了一批團(tuán)體測(cè)驗(yàn),擴(kuò)大了測(cè)驗(yàn)的應(yīng)用範(fàn)圍,如軍隊(duì)甲種、乙種測(cè)驗(yàn)。3、編制了多維度標(biāo)準(zhǔn)化測(cè)量,如韋科斯勒兒童智力量表(WISC)、成人智力量表(WICS)、學(xué)前智力量表(WPPSI)。
4、編制了標(biāo)準(zhǔn)化的教育成就測(cè)量。在美國(guó)於1944年成立了教育測(cè)驗(yàn)中心(ETS),該中心為目前世界上最大的測(cè)驗(yàn)編制了研究機(jī)構(gòu)。5、發(fā)展了性向測(cè)驗(yàn)、興趣測(cè)驗(yàn)、性格測(cè)驗(yàn)、人格測(cè)驗(yàn)等。(四)、教育測(cè)量的發(fā)展趨勢(shì)
1、統(tǒng)計(jì)與計(jì)算技術(shù)為教育測(cè)量的發(fā)展提供了廣闊的前景。
2、新的測(cè)量理論提高了測(cè)量的精確性和有效性。
3、心理學(xué)理論的發(fā)展特別是認(rèn)知心理學(xué)的發(fā)展為教育測(cè)量提供了堅(jiān)實(shí)的理論基礎(chǔ)。
4、實(shí)驗(yàn)與測(cè)量的關(guān)係更加緊密,相互吸收,相互補(bǔ)充,共同發(fā)展。二、教育評(píng)價(jià)的發(fā)展歷史(一)教育評(píng)價(jià)的萌動(dòng)階段二十世紀(jì)初,教育測(cè)量運(yùn)動(dòng)對(duì)教育評(píng)價(jià)產(chǎn)生了直接的影響,其中影響廣泛的評(píng)價(jià)包括1910年Flexner對(duì)美國(guó)醫(yī)學(xué)教育評(píng)價(jià)所進(jìn)行的研究,Carttler對(duì)大學(xué)研究生院所進(jìn)行的教育評(píng)價(jià)研究,1913年美國(guó)大學(xué)制定了大學(xué)認(rèn)定評(píng)價(jià)體系。
(二)教育評(píng)價(jià)的探索階段從三十年至四十年代,美國(guó)出現(xiàn)了新教育運(yùn)動(dòng),積極推行教育改革,最著名的是“八年研究”。三十年代美國(guó)進(jìn)步主義教育協(xié)會(huì)組織了一個(gè)“中學(xué)與大學(xué)關(guān)係委員會(huì)”。經(jīng)過充分討論,達(dá)成了一致意見,提出了一個(gè)實(shí)驗(yàn)方案。挑選了7所大學(xué)和30多所中學(xué)聯(lián)合實(shí)驗(yàn),要求用八年的時(shí)間完成,時(shí)間為1933年到1940年,故稱“八年研究”?!鞍四暄芯俊毙纬闪薚yler評(píng)價(jià)體系。
(三)教育評(píng)價(jià)的發(fā)展時(shí)期
50年代至60年代,標(biāo)準(zhǔn)化測(cè)驗(yàn)取得了飛速的發(fā)展,促進(jìn)了教育評(píng)價(jià)的進(jìn)一步發(fā)展,1956年出版了Bloom的《教育目標(biāo)分類學(xué):認(rèn)知領(lǐng)域》,1964年出版了Krathwohl的《教育目標(biāo)分類學(xué):情感領(lǐng)域》,教育評(píng)價(jià)進(jìn)一步用於課程研製、課程開發(fā)。
(四)教育評(píng)價(jià)的新生時(shí)期
70年代至80年代,一些國(guó)家通過法律、檔形式規(guī)定了教育評(píng)價(jià)工作,使教育評(píng)價(jià)得到了蓬勃發(fā)展,教育評(píng)價(jià)的研究機(jī)構(gòu)增多,國(guó)際教育評(píng)價(jià)學(xué)會(huì)的會(huì)員國(guó)逐年增多,教育評(píng)價(jià)理論的研究向縱深發(fā)展,不僅注重宏觀研究,而且注重各學(xué)科的專業(yè)性評(píng)價(jià)。教育行政機(jī)構(gòu)更加關(guān)心教育評(píng)價(jià),並作為教育管理工作的一個(gè)基本環(huán)節(jié),重視發(fā)揮評(píng)價(jià)的多種功能。(五)後現(xiàn)代時(shí)期後現(xiàn)代教育評(píng)價(jià)興起於80年代後期,其特徵有二:一是增加了教師在評(píng)價(jià)領(lǐng)域中的權(quán)威,以教師評(píng)價(jià)取代專業(yè)評(píng)價(jià),二是對(duì)某些測(cè)量原則的適切性提出了質(zhì)疑,以開放性的結(jié)論和評(píng)定取代以前的評(píng)價(jià)。第一節(jié)教育測(cè)驗(yàn)編制的一般程式教育測(cè)驗(yàn)的編制一般包括:確定測(cè)驗(yàn)的目的,分析測(cè)量目標(biāo),制定編題藍(lán)圖或計(jì)畫,編輯題目,決定測(cè)驗(yàn)時(shí)間和測(cè)題數(shù)量,確定計(jì)分方法,實(shí)施試測(cè),題目分析,鑒定測(cè)驗(yàn)測(cè)量標(biāo)準(zhǔn),編制測(cè)驗(yàn)量表及說明書,拼題並建立題庫(kù)。一、確定測(cè)驗(yàn)的目的
1、確定測(cè)量對(duì)象
2、確定測(cè)量目標(biāo)(一般要將目標(biāo)轉(zhuǎn)化成可操作的術(shù)語)
3、確定測(cè)量的功用(常與評(píng)價(jià)目標(biāo)結(jié)合在一起)如是診斷性測(cè)驗(yàn)還是選拔性測(cè)驗(yàn)。
二、分析測(cè)量目標(biāo)並制定編題計(jì)畫美國(guó)心理學(xué)家布魯姆(Bloom)最早提出教育目標(biāo)的分類問題。他把學(xué)習(xí)的心理活動(dòng)過程分成認(rèn)知、情感二個(gè)領(lǐng)域。又把認(rèn)知領(lǐng)域具體分為知識(shí)(記憶事實(shí)、條件、方法、原理等的能力)、理解、應(yīng)用、分析、綜合、評(píng)價(jià)六個(gè)層次。布魯姆教育目標(biāo)分類體系詳細(xì)結(jié)構(gòu)如下:1、知識(shí)
1.1具體知識(shí)
1.2處理具體事物方式方法的知識(shí)
1.3學(xué)科領(lǐng)域中的普遍原理和抽象概念的知識(shí)2、理解
2.1轉(zhuǎn)化
2.2解釋
2.3推斷3、應(yīng)用
4.分析
4.1要素分析
4.2關(guān)係分析
4.3組織原理分析
5.綜合
5.1進(jìn)行獨(dú)特的交流
5.1制定計(jì)畫或操作步驟
5.3推導(dǎo)出一套抽象關(guān)係
6.評(píng)價(jià)
6.1依據(jù)內(nèi)在的證據(jù)來判斷
6.2依據(jù)外部準(zhǔn)則來判斷情感領(lǐng)域的目標(biāo)分類1.接受(注意):探討學(xué)習(xí)者是否願(yuàn)意接受或注意學(xué)習(xí)內(nèi)容
1.1覺察是指在提供適當(dāng)機(jī)會(huì)時(shí)學(xué)生對(duì)某些客觀刺激的意識(shí).1.2願(yuàn)意承受特定刺激的行為
1.3控制或選擇的注意,是指有意識(shí)或半意識(shí)的從內(nèi)容或情境中辯別某種特定的刺激.2反應(yīng)所關(guān)心的是學(xué)生受到動(dòng)機(jī)的充分驅(qū)動(dòng),積極地注意學(xué)習(xí)內(nèi)容
2.1默認(rèn)的反應(yīng),這種反應(yīng)強(qiáng)調(diào)行為的被動(dòng)性,一般產(chǎn)生遵從或順從.2.2願(yuàn)意的反應(yīng),學(xué)生完全致力於表現(xiàn)自己的行為,是自己想做或自願(yuàn)去做.2.3滿意的反應(yīng),它關(guān)心的是伴隨著行為有一種滿意的感覺或一種情緒反應(yīng),即愉快、興奮或快樂。3價(jià)值判斷,它一般是指學(xué)習(xí)者對(duì)某事物、某現(xiàn)象或行動(dòng)所產(chǎn)生的意義或價(jià)值。包括個(gè)人的價(jià)值判斷和社會(huì)的價(jià)值判斷。
3.1價(jià)值的接受,它所關(guān)心的是把價(jià)值歸結(jié)為與某種現(xiàn)象、行為、客體等相聯(lián)的東西。
3.2價(jià)值的偏愛,是指對(duì)某價(jià)值的單純接受和參與某一領(lǐng)域的傾向.3.3價(jià)值的信奉,是指毫不懷疑的確信.4組織化:反映相關(guān)的價(jià)值狀態(tài)的價(jià)值體系,它是價(jià)值內(nèi)化的結(jié)果.4.1價(jià)值的概念化,是指價(jià)值的一貫的穩(wěn)定的價(jià)值傾向.4.2價(jià)值體系的組織化,是指把各種價(jià)值組成一個(gè)複合體,形成了一種和諧的內(nèi)在的統(tǒng)一.5價(jià)值或價(jià)值複合體的個(gè)性化,是指各種社會(huì)價(jià)值體系在個(gè)體價(jià)值結(jié)構(gòu)中的位置,並控制著個(gè)體的行為.5.1泛化心向,是指在任何特定的時(shí)候都對(duì)態(tài)度和價(jià)值體系有一種內(nèi)在的一致的心向.5.2個(gè)性化,是內(nèi)化過程的最高水準(zhǔn),它包括隱蔽的現(xiàn)象和外顯的行為的更加廣泛的目標(biāo),是人的宇宙觀、人生觀和世界觀的反應(yīng)。它是一種生活哲學(xué)。動(dòng)作技能領(lǐng)域的教育目標(biāo)分類該目標(biāo)分類是Simpson提出的試驗(yàn)方案,它是通過身體的活動(dòng)來掌握教育目標(biāo)。1知覺:是通過聽覺、視覺、觸覺、味覺、嗅覺的作用,尋求實(shí)現(xiàn)教育目標(biāo)的有效手段。2精神準(zhǔn)備:是指做好完成目標(biāo)的準(zhǔn)備狀態(tài)或進(jìn)行調(diào)整的能力。3接受指導(dǎo)的反應(yīng):是指學(xué)生在接受教師指導(dǎo)時(shí)能模仿典型動(dòng)作的行為,並具有做出適當(dāng)反應(yīng)的能力。4作用過程:是指必要時(shí)形成反應(yīng)所自動(dòng)產(chǎn)生的行為過程。如心理定勢(shì)。5複合動(dòng)作:是指通過複雜的示範(fàn)動(dòng)作來實(shí)現(xiàn)運(yùn)動(dòng)技能的目標(biāo)。6適應(yīng):是指把以學(xué)會(huì)的運(yùn)動(dòng)技能應(yīng)用於新的目標(biāo)之中的能力,即遷移能力。7創(chuàng)作:是指實(shí)行新的動(dòng)作或形成新的動(dòng)作能力的表現(xiàn)。小學(xué)自然常識(shí)測(cè)驗(yàn)編題細(xì)目表
目標(biāo)內(nèi)容識(shí)記理解應(yīng)用分析綜合評(píng)價(jià)合計(jì)生物世界35632120資源利用23311010動(dòng)力機(jī)械23420112物質(zhì)能量56832125氣象24322013宇宙25410012地球2221108合計(jì)1828301383100三、編輯題目(類型、數(shù)量、記分方法)
1、搜集有關(guān)資料(1)材料要豐富(2)材料要有普遍性
2、選擇測(cè)驗(yàn)形式(1)測(cè)驗(yàn)的目的和材料的性質(zhì)(2)接受測(cè)驗(yàn)的團(tuán)體的特點(diǎn)(3)各種實(shí)際因素
3、編定和修訂專案應(yīng)注意:(1)題目的範(fàn)圍要有測(cè)驗(yàn)的計(jì)畫所列內(nèi)容與目標(biāo)相一致。(2)題目的難度符合測(cè)驗(yàn)的目的。(3)題目的說明要清楚明白。四、題目的試用、分析、篩選
1、預(yù)測(cè)(1)預(yù)測(cè)對(duì)象要取自將來正式測(cè)驗(yàn)準(zhǔn)備應(yīng)用的群體。(2)預(yù)試的實(shí)施過程與情境應(yīng)與正試測(cè)驗(yàn)相近似。(3)預(yù)試的時(shí)限可稍寬,儘量使每個(gè)被試答完。(4)預(yù)試過程中被試的反應(yīng)應(yīng)隨時(shí)記錄。
2、專案分析主要包括:確定題目的難度、區(qū)分度、被選答案的合適度。
五、集合成測(cè)驗(yàn)(拼題)(一)試題的選擇最好的題目,就是只測(cè)定所需要的特徵,並能對(duì)該特徵加以有效區(qū)分的難度合適的題目。(二)試題的編排最常見的編排方式是:
1、並列直進(jìn)式
2、混合螺旋式(三)編造複本複本的等值需具備以下幾個(gè)條件:
1、各份測(cè)驗(yàn)測(cè)量的是同一種心理特徵。
2、各份測(cè)驗(yàn)具有相同的內(nèi)容和形式。
3、各份測(cè)驗(yàn)的題目不應(yīng)有重複的地方。
4、各份測(cè)驗(yàn)題目數(shù)量相等,並且有大體相同的難度和區(qū)分度。
5、各份測(cè)驗(yàn)的分?jǐn)?shù)分佈(平均數(shù)和差異度)大致相等。
六將測(cè)驗(yàn)標(biāo)準(zhǔn)化測(cè)驗(yàn)標(biāo)準(zhǔn)化包括以下幾個(gè)方面:(一)內(nèi)容的標(biāo)準(zhǔn)化,即對(duì)所有受測(cè)者施測(cè)相同的或等值的題目。(二)施測(cè)的標(biāo)準(zhǔn)化,即測(cè)驗(yàn)實(shí)施過程要有相同的指導(dǎo)語、時(shí)限和客觀的物理情境。(三)評(píng)分的標(biāo)準(zhǔn)化(四)常模,是測(cè)驗(yàn)使用者解釋測(cè)驗(yàn)分?jǐn)?shù)的依據(jù)。測(cè)驗(yàn)分?jǐn)?shù)必須與常模比較才能顯示出它所代表的意義。建立常模的方法是:它將來要使用測(cè)驗(yàn)的全體對(duì)象中,選擇有代表性的一部分人(稱標(biāo)準(zhǔn)化樣本),對(duì)此樣本施測(cè)並將所得的分?jǐn)?shù)加以統(tǒng)計(jì)整理,得出一個(gè)具有代表性的分?jǐn)?shù)分配,標(biāo)準(zhǔn)化樣本的平均數(shù),即為該測(cè)驗(yàn)的常模。常見的常模有:年齡常模、年級(jí)常模、地域常模、民族常模、職業(yè)常模等。
七測(cè)驗(yàn)的信、效度分析(一)信度指的是測(cè)驗(yàn)的可靠性或一致性。(二)效度就是測(cè)驗(yàn)的有效程度。衡量測(cè)驗(yàn)的有效程度是看測(cè)驗(yàn)所測(cè)量的是不是它所要測(cè)的東西。八編寫測(cè)驗(yàn)說明書一份說明書主要包括:(一)本測(cè)驗(yàn)的目的和功用(二)編制測(cè)驗(yàn)的理論背景以及選擇題目的根據(jù)。(三)測(cè)驗(yàn)的實(shí)施方法、時(shí)限及注意事項(xiàng)。(四)測(cè)驗(yàn)的標(biāo)準(zhǔn)答案和評(píng)分方法(五)常模資料,包括常模表、常模適用的團(tuán)體及對(duì)分?jǐn)?shù)如何做解釋。(六)測(cè)驗(yàn)的信度、效度資料,包括信度係數(shù)、效度係數(shù)以及這些數(shù)據(jù)是什麼情境下得到的。第二節(jié)測(cè)題的編制技術(shù)一、命題的一般原則命題應(yīng)遵循以下原則:1、試題要符合測(cè)驗(yàn)的目的。2、內(nèi)容取樣要有代表性。3、題目格式不要使被試發(fā)生誤解。4、文字要簡(jiǎn)明扼要,即排除與解題無關(guān)的因素,又不可遺漏解題所依據(jù)的必要條件,要避免使用艱深的字詞。5、應(yīng)有不致引起爭(zhēng)論的確定答案(創(chuàng)造力測(cè)驗(yàn)、人格測(cè)驗(yàn)除外。6、各個(gè)試題必須彼此獨(dú)立,不可互相牽連,不要使一個(gè)題目的回答影響另一個(gè)題目的回答。7、題目中不可含有暗示題或其他題正確答案之線索。8、題目?jī)?nèi)容不要超出受測(cè)題體的知識(shí)和能力。9、所提問題應(yīng)避免涉及社會(huì)禁忌與隱私。10、施測(cè)與評(píng)分省時(shí)。二、測(cè)題的種類及編制要領(lǐng)根據(jù)應(yīng)答方式,測(cè)題的種類分為兩大類,即自由應(yīng)答型和固定應(yīng)答型。自由應(yīng)答型題目是讓受測(cè)者用自己的語言或行動(dòng)來對(duì)某一問題做出回答,包括填充題、簡(jiǎn)答題、應(yīng)用題、論文題、聯(lián)想題、操作題等。固定應(yīng)答型題目又稱客觀性題目,是讓受測(cè)者從測(cè)驗(yàn)編制者事先定好的答案中辯認(rèn)出一個(gè)正確答案,包括了多選題、是非題、匹配題等。(一)多選題多選題在結(jié)構(gòu)上包含兩部分,一為題幹,由直接問句或不完全的陳述句所構(gòu)成,另一為選項(xiàng),包含一個(gè)正確答案及若干個(gè)錯(cuò)誤答案。多選題可適用於文字、數(shù)字和圖形等不同性質(zhì)的材料,可以考察記憶、分析、鑒別、推型、理解和應(yīng)用知識(shí)的能力。下邊是幾種常見的變式。1、計(jì)算:例:小明給了弟弟2支鉛筆,自己還剩8支,,小明原來有幾支?(A)4(B)6(C)8(D)102、類比:已知甲和乙的關(guān)係,推出丙和丁的關(guān)係。例:船------水,飛機(jī)------?(A)大地(B)白雲(yún)(C)天空(D)海洋3、找不同類:每一題內(nèi)有幾項(xiàng)屬於同一類事物,只有一項(xiàng)不屬於這一類,要?jiǎng)澣?。例:(A)狗(B)鳥(C)樹(D)魚4、最好理由:幾個(gè)備選答案都是對(duì)的,但其中一個(gè)最好,要把它找出來。例:偷東西的人應(yīng)該受懲罰,因?yàn)椋海ˋ)罰款可使他不敢再犯。(B)偷竊為法律所不容。(C)偷東西的人不是好人。(D)偷竊擾亂社會(huì)治安。多選題的優(yōu)點(diǎn)是:1、單位時(shí)間內(nèi)可以施測(cè)很多專案,從而有保證取樣的廣泛性,使測(cè)驗(yàn)更有效。2、評(píng)分客觀,加上題目數(shù)量多,可以減少隨機(jī)因素的影響,從而能保證測(cè)驗(yàn)的可靠性。3、便於對(duì)題目進(jìn)行分析,易於調(diào)整題目的難度。4、閱卷方便迅速,並可用機(jī)器評(píng)分,被試多時(shí)比較經(jīng)濟(jì)。5、好的題目可存入題庫(kù),重複使用。多選題的缺點(diǎn)是:1、有固定答案,測(cè)不出組織材料的能力、文字表達(dá)能力和創(chuàng)造力。2、題量大,並要為每個(gè)題目考慮幾個(gè)似是而非的答案,因而編寫困難費(fèi)時(shí),需要一定技巧。編擬多選題的要領(lǐng)及原則如下:1、根據(jù)測(cè)驗(yàn)的目的和內(nèi)容來選擇最適當(dāng)?shù)念}型。2、備選答案要簡(jiǎn)略,必要的敘述或相當(dāng)?shù)男揎椪Z應(yīng)全部置於題幹中。3、每題只能環(huán)繞一個(gè)中心,並只有一個(gè)正確答案,該答案在內(nèi)容和形式上不可特別突出,但其正確性必須確鑿無疑。4、題幹應(yīng)當(dāng)包括解題所必須的共同要素,並盡可能做到精煉、準(zhǔn)確、清楚,不要把選項(xiàng)夾在題幹中間。5、錯(cuò)誤答案對(duì)被試具有迷惑性,不要錯(cuò)得太明顯。這種答案可以是人們經(jīng)常出現(xiàn)的錯(cuò)誤,也可以是一般性的誤解和似是而非的內(nèi)容。6、各個(gè)選項(xiàng)在形式上應(yīng)該協(xié)調(diào)一致,或?yàn)閿?shù)字,或?yàn)閳D形,或?yàn)槿嗣?,?yīng)該一律,文字長(zhǎng)短也應(yīng)大體相當(dāng),以免對(duì)正確回答提供線索。7、選項(xiàng)之間不應(yīng)相互重迭,相互包括,相互依賴。8、幾個(gè)選項(xiàng)最好按邏輯順列或隨機(jī)排列。正確答案在每個(gè)位置上出現(xiàn)的次數(shù)要大致相等,且不要形成固定的格式。9、所有選項(xiàng)在邏輯上和語法上都能與題幹相接,否則本來正確的答案,會(huì)因?yàn)檫壿嬌匣蛘Z法上與題幹不一致而放棄。反之,如果干擾答案在邏輯上或語法上與題幹不吻合,被試就會(huì)根據(jù)常識(shí),發(fā)覺它們之間的矛盾而加以排除。10、題幹要儘量創(chuàng)新的情境,文字要自己擬定,避免重複書本上的現(xiàn)成實(shí)例或措詞。(二)是非題是非題是指出一個(gè)論點(diǎn)要被試判斷是否正確,或從是非兩個(gè)答案中做出選擇。是非題回答方便,適於考查學(xué)生對(duì)簡(jiǎn)單觀念或知識(shí)的瞭解,其缺點(diǎn)是易受猜測(cè)因素的影響,重要的材料有時(shí)不能用對(duì)和錯(cuò)簡(jiǎn)單回答,缺乏教育診斷作用,故在能力測(cè)驗(yàn)中應(yīng)用不如多選題廣泛。編擬是非題應(yīng)注意下麵幾點(diǎn):1、內(nèi)容應(yīng)以有意義的事實(shí)、概念或原理為基礎(chǔ),避免無關(guān)重要的問題或瑣碎的細(xì)節(jié)。2、每題應(yīng)只包含一個(gè)觀念,避免兩個(gè)以上的觀念在同一題中出現(xiàn),而造成題目“似是而非”或“半對(duì)半錯(cuò)”。3、論點(diǎn)要簡(jiǎn)明扼要,意義明確,不要有艱深難懂的詞句或含糊不確定的文字?jǐn)⑹觥?、對(duì)論點(diǎn)的陳述要重新組織,不要照搬教科書上的詞句或僅僅加上否定詞就構(gòu)成錯(cuò)誤專案。5、避免使用具有暗示性的特殊字詞,如“絕不”“完全”等。6、儘量採(cǎi)用正面肯定的敘述,避免反面陳述或雙重否定的文句。7、“是”與“非”的題數(shù)應(yīng)大致相等,且隨機(jī)排列。8、題數(shù)不能太少。(三)匹配題匹配題包括並列的兩行,一行為刺激專案,另一行為反應(yīng)專案,被試的任務(wù)是由後者中選出與前者相適合的專案,可以是完全匹配,也可以是不完全匹配。匹配題是選擇題的一種變式,一個(gè)匹配題實(shí)際上就是一套多選題,適用於測(cè)量概念與事實(shí)之間的關(guān)係,其優(yōu)缺點(diǎn)與多選題相同。編制匹配題的要領(lǐng)是:1、一個(gè)題目的各個(gè)刺激專案及各個(gè)反應(yīng)專案應(yīng)在內(nèi)容上同質(zhì),若涉及年代都為年代,涉及地點(diǎn)都為地點(diǎn),涉及符號(hào)都為符號(hào)。2、在指導(dǎo)語中要講匹配依據(jù),告訴被試每個(gè)反應(yīng)可用幾次。3、配對(duì)專案不可過多或過少,如在十對(duì)以下,最好應(yīng)用不完全配合,使反應(yīng)專案比題專案多出一兩個(gè)。以增加其可靠性。4、每個(gè)刺激專案應(yīng)有一個(gè)而且只有一個(gè)反應(yīng)專案相匹配。5、按一定邏輯次序安排反應(yīng)專案,同時(shí)要避免答案的固定格式。6、同一組專案應(yīng)印在同一頁上,以免造成作答時(shí)的困擾。(四)填空題與簡(jiǎn)答題填空題與簡(jiǎn)答題要求的是對(duì)正確答案的回憶,即由被試自己寫出答案。填空題和簡(jiǎn)答題的編寫原則如下:1、填空題目所空出的應(yīng)該是關(guān)鍵字句,並且要和上下文有密切聯(lián)繫,不要空出無關(guān)緊要的字詞。2、一句內(nèi)不要有太多的空白,空白太多,不容易明瞭題意。3、空白最好放在句子的尾部,免得空格多少為答案提供線索。4、測(cè)題句子避免直接引用教科書的措詞。5、問題要具體,範(fàn)圍要確定,要使受測(cè)者知道答案的類型、長(zhǎng)度和確切程度。6、準(zhǔn)備一個(gè)正確答案和可接受的變式的標(biāo)準(zhǔn),如果部分正確也適當(dāng)給分,則要做出更具體的規(guī)定。(五)論文題論文題適合測(cè)驗(yàn)組織能力、綜合能力、文字表達(dá)能力,同時(shí)還可測(cè)量評(píng)價(jià)能力和創(chuàng)造能力。編擬論文題目要注意以下幾點(diǎn):1、要讓被試知道答案的範(fàn)圍和方向。2、最好要求被試在新的情境下,應(yīng)用知識(shí)去解決新的問題。3、題目不要少或大,數(shù)量要適當(dāng)多些,內(nèi)容要適當(dāng)具體些。4、要選用具有可接受的正確答案的題目,不用那些僅測(cè)量意見和態(tài)度的問題。5、在測(cè)驗(yàn)前,對(duì)每一個(gè)題目編制幾個(gè)“理想”的答案,並對(duì)部分正確的問答如何評(píng)分做出盡可能具體的規(guī)定。6、一般不要有任選題,因?yàn)閮蓚€(gè)論文題目很難做到等值。(六)應(yīng)用題應(yīng)用題是敘述一個(gè)具體的情境並提出一些有關(guān)的數(shù)據(jù),讓被試解決所提出的問題。應(yīng)用題適合測(cè)驗(yàn)計(jì)算技能、數(shù)學(xué)和科學(xué)推理,以及運(yùn)用知識(shí)到新情境中的能力。編寫應(yīng)用題要遵循以下原則1、題目的陳述要使被試明白讓他幹什麼,答案應(yīng)以什麼形式出現(xiàn)。2、題目中應(yīng)包括對(duì)解題所需要的一切數(shù)據(jù)和資訊,也可包含一些無關(guān)數(shù)據(jù)和資訊。3、採(cǎi)用新的情境和例子,不要重複過去已用過的。4、應(yīng)向被試指明是否要求寫出解答步驟,以及對(duì)各個(gè)步驟詳細(xì)到什麼程度等。5、對(duì)一個(gè)問題的答案不論正確與否,都不影響另一個(gè)問題的解答。6、文字要通俗易懂,不要變成閱讀理解測(cè)驗(yàn)。(七)操作題在測(cè)驗(yàn)中有些專案是讓被試實(shí)際操作,如畫圖、拼配物體等。制定操作專案的主要原則是:使被試明確知道要他們幹什麼和在什麼條件下幹,如何使用工具以及時(shí)間限制。操作專案可以根據(jù)完成的數(shù)量和錯(cuò)誤次數(shù)客觀記分,有些專案則需要給出評(píng)分標(biāo)準(zhǔn),把整個(gè)操作分成許多部分技能,分別定出評(píng)分標(biāo)準(zhǔn)。第一節(jié)教育評(píng)價(jià)模式的變革
教育評(píng)價(jià)專家古巴和林肯將教育評(píng)價(jià)模式劃分為四代:一、第一代評(píng)價(jià)第一代評(píng)價(jià)興起於19世紀(jì)末至20世紀(jì)30年代,評(píng)價(jià)在本質(zhì)上以測(cè)驗(yàn)或測(cè)量的方式,測(cè)定學(xué)生對(duì)知識(shí)的記憶狀況或某項(xiàng)特質(zhì)。其基本特點(diǎn)是:認(rèn)為評(píng)價(jià)就是測(cè)量,評(píng)價(jià)者的工作就是測(cè)量技術(shù)員的工作——選擇測(cè)量工具、組織測(cè)量、提供測(cè)量數(shù)據(jù)。二、第二代評(píng)價(jià)第二代評(píng)價(jià)興起於20世紀(jì)30年代,這代評(píng)價(jià)認(rèn)為,評(píng)價(jià)在本質(zhì)上是描述——描述教育結(jié)果與教育目標(biāo)相一致的程度。其基本特點(diǎn):認(rèn)為評(píng)價(jià)過程是將教育結(jié)果與預(yù)定的教育目標(biāo)相對(duì)照的過程,是根據(jù)預(yù)定教育目標(biāo)對(duì)教育結(jié)果進(jìn)行客觀描述的過程,評(píng)價(jià)的關(guān)鍵是確定清晰的、可操作的行為目標(biāo);評(píng)價(jià)不等於“考試”和“測(cè)驗(yàn)”,儘管考試和測(cè)驗(yàn)可以成為評(píng)價(jià)的一部分。同第一代相比,評(píng)價(jià)已走上的科學(xué)化的歷程。三、第三代評(píng)價(jià)第三代評(píng)價(jià)萌生於1957年以後,持續(xù)到80年代,其基本特點(diǎn)是:把評(píng)價(jià)視為價(jià)值判斷的過程,評(píng)價(jià)不只是根據(jù)預(yù)定目標(biāo)對(duì)結(jié)果的描述,預(yù)定目標(biāo)本身也需要進(jìn)行價(jià)值判斷;既然目標(biāo)並非評(píng)價(jià)的固定不變的鐵的標(biāo)準(zhǔn),那麼評(píng)價(jià)就應(yīng)當(dāng)走出預(yù)定目標(biāo)的限制,過程本身的價(jià)值也應(yīng)當(dāng)是評(píng)價(jià)的有機(jī)構(gòu)成。
上述三代評(píng)價(jià)的嚴(yán)重缺陷表現(xiàn)在以下方面:
1、管理主義傾向,造成四種不合理的後果。(1)管理者無過失。(2)管理者與評(píng)價(jià)者的關(guān)係有失公平。(3)評(píng)價(jià)者無法在評(píng)價(jià)中維護(hù)自己的利益,闡述自己的見解。(4)管理者用各種辦法保護(hù)自己不受損害,評(píng)價(jià)者則保證使用管理者認(rèn)可的方法。
2、忽視價(jià)值的多元性。
3、過分依賴實(shí)證科學(xué)範(fàn)式。四、第四代評(píng)價(jià)第四代評(píng)價(jià)的中心思想是,認(rèn)為評(píng)價(jià)在本質(zhì)上是一種通過協(xié)商而形成的心理建構(gòu),堅(jiān)持價(jià)值多元性的信念,反對(duì)管理主義傾向。其基本特點(diǎn)是:把評(píng)價(jià)視為評(píng)價(jià)者和被評(píng)價(jià)者“協(xié)商”進(jìn)行的共同心理建構(gòu)過程,評(píng)價(jià)是受“多元主義”價(jià)值觀所支配的;評(píng)價(jià)是一種民主協(xié)商、主體參與的過程,而非評(píng)價(jià)者對(duì)被評(píng)價(jià)者的控制過程,學(xué)生(被評(píng)價(jià)者)也是評(píng)價(jià)評(píng)價(jià)的參與者、評(píng)價(jià)的主體;評(píng)價(jià)的基本方法是“質(zhì)的研究”方法。第二節(jié)教育評(píng)價(jià)的類型一、根據(jù)評(píng)價(jià)機(jī)能分類
1、診斷性評(píng)價(jià),是指在活動(dòng)開始之前,為使其計(jì)畫更加有效的實(shí)施而進(jìn)行的評(píng)價(jià)。也稱為事前評(píng)價(jià)。要求把握被評(píng)價(jià)事物的兩種狀態(tài):一是癥狀診斷;二是原因診斷。
2、形成性評(píng)價(jià),是指在活動(dòng)運(yùn)行的過程中,為使活動(dòng)效果更好而修正本身發(fā)展的進(jìn)程而進(jìn)行的評(píng)價(jià),其目的為了明確活動(dòng)中存在的問題,並加以改進(jìn)。布盧姆認(rèn)為形成性評(píng)價(jià)的任務(wù)是(1)調(diào)整學(xué)習(xí)活動(dòng),(2)強(qiáng)化學(xué)生的學(xué)習(xí),(3)發(fā)現(xiàn)存在的問題,(4)提供學(xué)習(xí)的矯正處方。
3、總結(jié)性評(píng)價(jià),又稱作事後評(píng)價(jià)。是指在活動(dòng)後為判斷其效果而進(jìn)行的評(píng)價(jià)。二、根據(jù)價(jià)值標(biāo)準(zhǔn)分類
1、相對(duì)評(píng)價(jià),是指在團(tuán)體內(nèi)以自己所處的地位同他人相比較而進(jìn)行的評(píng)價(jià)。
2、絕對(duì)評(píng)價(jià),是指以完成既定目標(biāo)的程度而進(jìn)行的評(píng)價(jià)。3、自我評(píng)價(jià),是指在個(gè)人內(nèi)部就其自身的狀態(tài)進(jìn)行縱橫比較所做的價(jià)值判斷。三、根據(jù)評(píng)價(jià)內(nèi)容分類
1、狀況評(píng)價(jià),是指通過現(xiàn)狀分析為選擇目標(biāo)提供依據(jù)而進(jìn)行的評(píng)價(jià)。
2、選擇評(píng)價(jià),是指為完成目標(biāo)而選擇有效途徑所進(jìn)行的評(píng)價(jià)。
3、過程評(píng)價(jià),是指判斷實(shí)施方案有無需要改善的地方所進(jìn)行的評(píng)價(jià)。
4、成果評(píng)價(jià),是指為判斷計(jì)畫實(shí)施所取得的成果而進(jìn)行的評(píng)價(jià)。第三節(jié)教育評(píng)價(jià)模式一、教育評(píng)價(jià)模式的含義模式是指內(nèi)涵在一定的思想取向,並表現(xiàn)為一定的操作規(guī)則和方法步驟的體系。教育評(píng)價(jià)模式是指描述評(píng)價(jià)客體中同一類實(shí)體的共同特徵的示範(fàn)方法。是評(píng)價(jià)主體建立的評(píng)價(jià)參照框架。二、教育評(píng)價(jià)的主要模式(1)資格認(rèn)定模式。資格認(rèn)定模式是對(duì)從事某種活動(dòng)應(yīng)具備的條件或身份等的認(rèn)可方式。這種評(píng)價(jià)模式的著眼點(diǎn)在於判斷條件是否得到滿足,同時(shí)對(duì)可能產(chǎn)生的後果做出必要的預(yù)測(cè)和判斷。(2)品質(zhì)判斷模式。是對(duì)評(píng)價(jià)對(duì)象物的品質(zhì)優(yōu)劣的判斷方式。這種評(píng)價(jià)模式的任務(wù)是判斷教育計(jì)畫實(shí)施所帶來的變化。(3)目標(biāo)成達(dá)模式。是對(duì)既定目標(biāo)到達(dá)程度的判斷方式。這種評(píng)價(jià)模式所要解決的問題,是判斷行為結(jié)果與既定目標(biāo)的距離,以及達(dá)到何種程度。(4)目標(biāo)游離模式。要求脫離預(yù)定目標(biāo),以活動(dòng)的全部實(shí)際結(jié)果為評(píng)價(jià)對(duì)象,盡可能全面客觀的展現(xiàn)這些結(jié)果。(5)優(yōu)秀遴選模式。優(yōu)秀遴選模式是通過評(píng)價(jià)活動(dòng)選拔優(yōu)秀的方式。(6)回應(yīng)模式。以所有與方案有利害關(guān)係或切身利益的人所關(guān)心的問題為中心的一種評(píng)價(jià)。其評(píng)價(jià)問題可以包括:新舊方案哪個(gè)更優(yōu)越?哪個(gè)方案是否更可行?哪些方案容易達(dá)到目的?三、教育評(píng)價(jià)與教育價(jià)值觀(1)目標(biāo)取向評(píng)價(jià)的教育價(jià)值觀,其本質(zhì)是受“科技理性”或“工具理性”的支配,核心是追求對(duì)被評(píng)價(jià)對(duì)象的有效控制和改進(jìn)。第一節(jié)測(cè)驗(yàn)的實(shí)施標(biāo)準(zhǔn)化心理測(cè)驗(yàn)實(shí)施的最基本要求是使所有的被測(cè)者都在相同的條件下去表現(xiàn)自己的真正行為,這就要求使用預(yù)先規(guī)定的施測(cè)批示語,標(biāo)準(zhǔn)的時(shí)間限制,合適的測(cè)施環(huán)境和條件以及實(shí)施過程中可能影響測(cè)試結(jié)果的任何其他因素。一、測(cè)驗(yàn)實(shí)施的程式1、標(biāo)準(zhǔn)化指示語指示語有兩種:一種是對(duì)被試的,一種是對(duì)主試的。2、標(biāo)準(zhǔn)時(shí)限時(shí)限的確定最重要的考慮是測(cè)量目標(biāo)的要求,一般採(cǎi)用嘗試法,即通過預(yù)測(cè)來確定。3、測(cè)驗(yàn)的環(huán)境條件指施測(cè)的周圍環(huán)境,如安靜而寬敞和地點(diǎn),適當(dāng)?shù)墓饩€等等。二、測(cè)驗(yàn)實(shí)施時(shí),主試的職責(zé)
1、測(cè)驗(yàn)前的準(zhǔn)備工作
2、測(cè)驗(yàn)中主試的職責(zé)三、測(cè)驗(yàn)施測(cè)中,被試的反應(yīng)及其影響因素在測(cè)驗(yàn)標(biāo)準(zhǔn)化過程必須考慮被試可能的反應(yīng)和可能的影響因素。
1、測(cè)驗(yàn)的技巧及練習(xí)因素(1)測(cè)驗(yàn)的技巧(2)練習(xí)的效應(yīng)
(3)教學(xué)與輔導(dǎo)因素
2、焦慮和動(dòng)機(jī)因素(1)應(yīng)試動(dòng)機(jī)(2)測(cè)驗(yàn)焦慮
3、反應(yīng)定勢(shì)反應(yīng)定勢(shì)即反應(yīng)的方式或反應(yīng)風(fēng)格,是指獨(dú)立於測(cè)驗(yàn)內(nèi)容的反應(yīng)傾向,即由於每個(gè)人回答問題習(xí)慣的不同,而使得有相同能力的被試獲得不同的分?jǐn)?shù)。第二節(jié)測(cè)驗(yàn)的計(jì)分
一、計(jì)分的一般程式1、計(jì)分的基本步驟和要求基本步驟歸納起來有三步:(1)記錄反應(yīng),即及時(shí)和清楚地記錄被試的反應(yīng)。(2)標(biāo)準(zhǔn)答案,有時(shí)又稱計(jì)分鍵。(3)反應(yīng)和計(jì)分鍵的比較,也就是將反應(yīng)歸類或賦予分?jǐn)?shù)值。2、論文題計(jì)分論文題主要缺點(diǎn)是評(píng)分不夠客觀,計(jì)分經(jīng)常受到評(píng)分者的情感、態(tài)度的影響。常見的誤差有:寬容定勢(shì)和目暈效應(yīng)。寬容定勢(shì)指主試的計(jì)分過於寬鬆,目暈效應(yīng)指給予被試某道題較高的分?jǐn)?shù)僅僅是由於他們?cè)诹硪恍┰囶}上也獲得了高分,即對(duì)被試的一般印象影響到具體某個(gè)問題的評(píng)價(jià)。主觀題計(jì)分的原則是:(1)與測(cè)量目標(biāo)無關(guān)的回答不予計(jì)分,或單獨(dú)給分?jǐn)?shù)。(2)確定標(biāo)準(zhǔn)答案(3)評(píng)分時(shí)最好按題目順序進(jìn)行(4)最好在評(píng)閱時(shí)不知道被試的名字,以減少個(gè)人偏見。(5)可能的話,由兩個(gè)以上的主試來給論文題計(jì)分取其平均值。(6)計(jì)分時(shí)可以給予分?jǐn)?shù)也可以給予等級(jí)評(píng)定。3、客觀題計(jì)分客觀題計(jì)分採(cǎi)用計(jì)分套板以節(jié)省時(shí)間。二、猜測(cè)的較正在客觀題中有一個(gè)重要的問題是:測(cè)驗(yàn)分?jǐn)?shù)確定反映了被試的真實(shí)狀況,還是因?yàn)椴聹y(cè)而獲得的成功?因此,有必要對(duì)猜測(cè)進(jìn)行校正。
1、猜測(cè)修正的性質(zhì)常用的猜測(cè)修正公式為:
S=R-[W/(h-1)]
其中S是正確分?jǐn)?shù),R為被試答對(duì)的題目數(shù),W為被試答錯(cuò)的題目數(shù),h為選項(xiàng)題目。此公式的基本假設(shè)是:被試不知道正確答案時(shí),完全憑藉猜測(cè)作答,所能猜對(duì)的題數(shù)完全依賴隨機(jī)原則。2、猜測(cè)修正的優(yōu)缺點(diǎn)實(shí)際生活中,很少符合上述假設(shè)基礎(chǔ),因此對(duì)公式的應(yīng)用存在很大分歧。第一節(jié)參照常模的分?jǐn)?shù)解釋
參照常模解釋分?jǐn)?shù)通常是將被試的分?jǐn)?shù)直接或間接地以在某個(gè)團(tuán)體中的相對(duì)等級(jí)或相對(duì)位置來表示。這個(gè)用來比較的參照?qǐng)F(tuán)體,稱為常模團(tuán)體。一、常模團(tuán)體
1、常模團(tuán)體的性質(zhì)常模團(tuán)體是具有某種共同特徵的人所組成的一個(gè)群體,它用一個(gè)標(biāo)準(zhǔn)的、規(guī)範(fàn)的分?jǐn)?shù)表示出來,以提供比較的基礎(chǔ)。
對(duì)測(cè)驗(yàn)編制者來說,常模的選擇是基於對(duì)測(cè)驗(yàn)將要施測(cè)的總體的認(rèn)識(shí)。其工作包括:確定一般總體、確定目標(biāo)總體、確定樣本。對(duì)於測(cè)驗(yàn)的使用者的主要問題是:現(xiàn)有的常模團(tuán)體中哪一個(gè)最為合適。
2、在確定和選擇常模時(shí),要注意常模的要求:(1)群體必須明確;(2)常模團(tuán)體必須是所測(cè)群體的代表性樣本;(3)樣本大小要適當(dāng);(4)注意常模的時(shí)間性;(5)注意一般常模與特殊常模的結(jié)合。3、常模團(tuán)體的取樣的要求在確定常模時(shí)常用的取樣方法有:(1)簡(jiǎn)單隨機(jī)抽樣;(2)系統(tǒng)抽樣;(3)分組抽樣;(4)分層抽樣;(5)題目取樣。二、參照常模的類型及解釋常模的類型也就是常模參考分?jǐn)?shù)的類型,通常有:全國(guó)常模、區(qū)域常模和特殊群體常模;另一種方法是:年齡和年級(jí)常模、百分位常模和標(biāo)準(zhǔn)分?jǐn)?shù)常模等。1、發(fā)展常模(1)智力年齡;(2)年級(jí)當(dāng)量(3)發(fā)展順序量表,以行為發(fā)展的次序?yàn)槌D!?/p>
2、百分等級(jí)(1)未分組資料的百分等級(jí)計(jì)算。
PR=100–[(100R-50)/N]R指排名順序,N指總?cè)藬?shù)。
(2)分組資料的百分等級(jí)求法
PR=(100/N)[(X–L)fp/h+Cf]
其中X指任意原始分?jǐn)?shù),L指原始分?jǐn)?shù)所在組的精確下限,fp是該分?jǐn)?shù)所在組的次數(shù),Cf是指L以下的累積次數(shù),h為組距。(3)標(biāo)準(zhǔn)分?jǐn)?shù)常模標(biāo)準(zhǔn)分?jǐn)?shù)是一種有相等單位的量表。標(biāo)準(zhǔn)分?jǐn)?shù)常模包括許多所需的平均數(shù)與標(biāo)準(zhǔn)差的轉(zhuǎn)換分?jǐn)?shù)。
三、常模的表示方法常模的表示方法有兩種:轉(zhuǎn)化表和剖析圖。
1、轉(zhuǎn)化表。它由原始分?jǐn)?shù)表、相對(duì)應(yīng)的導(dǎo)出分?jǐn)?shù)表和對(duì)常模團(tuán)體的具體描述三個(gè)要素組成。
2、剖析圖。它是將測(cè)驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換關(guān)係用圖形表示出來。從剖析圖上可以直觀地看出被試在各個(gè)分測(cè)驗(yàn)上的表現(xiàn)及其對(duì)應(yīng)的位置。第二節(jié)參照效標(biāo)的分?jǐn)?shù)解釋
一、內(nèi)容參照分?jǐn)?shù)內(nèi)容參照分?jǐn)?shù)是依據(jù)被試確定材料內(nèi)容的掌握程度來表示和解釋。
1、掌握分?jǐn)?shù)
2、正確百分?jǐn)?shù)二、信度的作用
1、解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)
2、比較信度可以接受的水準(zhǔn)
3、解釋個(gè)人分?jǐn)?shù)的意義第二節(jié)信度的類型及估計(jì)方法一、重測(cè)信度和複本信度
1、重測(cè)信度,又稱穩(wěn)定性係數(shù),它的計(jì)量方法是採(cǎi)用重測(cè)法,即使用同一測(cè)驗(yàn),在不同時(shí)間對(duì)同一群體施測(cè)兩次,此兩次測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)係數(shù),即為穩(wěn)定性係數(shù)。2、複本信度,它是以兩個(gè)等值但題目不同的測(cè)驗(yàn)來測(cè)量同一個(gè)群體,然後求得被試在這兩個(gè)測(cè)驗(yàn)上得分的相關(guān)係數(shù)。二、內(nèi)部一致性信度內(nèi)部一致性信度係數(shù)主要反映的是題目之間的關(guān)係,表示測(cè)驗(yàn)?zāi)軌驕y(cè)量相同內(nèi)容或特性的程度。
1、分半信度分半信度是指採(cǎi)用分半法估計(jì)所得到的信度係數(shù)。通常是在測(cè)驗(yàn)實(shí)施後將測(cè)驗(yàn)分為等值的兩半,並分別計(jì)算每位被試在兩半測(cè)驗(yàn)上的得分,求出這兩半分?jǐn)?shù)的相關(guān)係數(shù)。這個(gè)相關(guān)係數(shù)就代表了兩半測(cè)驗(yàn)內(nèi)容取樣的一致性程度。(1)分半法中的斯皮爾曼-布朗修正公式為:
rxx=2rnn/(1+rnn)其中,rnn
為兩半測(cè)驗(yàn)的相關(guān)係數(shù),rxx為測(cè)驗(yàn)在原長(zhǎng)度時(shí)的估計(jì)值。它的假設(shè)條件為:兩半測(cè)驗(yàn)的方差相等。(2)蘆倫公式只要求將被試在兩半測(cè)驗(yàn)的分?jǐn)?shù)之差的方差(Sd2)和測(cè)驗(yàn)總分的方差(Sx2)代入如下公式即可直接計(jì)算分半信度。
rxx=1-Sd2/Sx2(3)費(fèi)拉那根公式也可直接計(jì)算分半信度
rxx=2[1-(Sa2+Sb2)/Sx2]
其中,Sa2
與Sb2
是兩個(gè)分測(cè)驗(yàn)分?jǐn)?shù)的方差,Sx2
為總分方差。2、同質(zhì)性信度同質(zhì)性主要代表所有測(cè)驗(yàn)題目得分的一致性。同質(zhì)性是測(cè)量單一特質(zhì)的必要非充分條件。(1)庫(kù)德—理查遜估計(jì)方法
rtt=(k/(k-1))(1-∑pq/σt2))(2)柯龍巴赫α係數(shù)法
rtt=(k/(k-1))(1-∑σi2/σt2)
三、評(píng)分者信度
1、兩評(píng)分者估計(jì)法:可採(cǎi)用積差相關(guān)或等級(jí)相關(guān)來計(jì)算
2、柯龍巴赫估計(jì)法
3、肯德爾和諧係數(shù)法
rtt=ssr/[(1/12)k2(n3-n)]
第三節(jié)影響信度的因素一、樣本團(tuán)體的性質(zhì)影響信度係數(shù)一個(gè)重要因素是所測(cè)樣本團(tuán)體的性質(zhì)。這是因?yàn)椋?、任何相關(guān)係數(shù)都要受到團(tuán)體中分?jǐn)?shù)分佈的影響。2、信度係數(shù)也受到樣本團(tuán)體異質(zhì)性的影響。3、測(cè)驗(yàn)的信度不僅受取樣團(tuán)體中個(gè)別差異範(fàn)圍的影響,也會(huì)由於不同團(tuán)體間平均能力水準(zhǔn)的不同而有所不同。二、測(cè)驗(yàn)的長(zhǎng)度測(cè)驗(yàn)越長(zhǎng),信度值越高,這種影響主要來自兩個(gè)方面:第一,測(cè)驗(yàn)越長(zhǎng),則試題取樣或內(nèi)容取樣越恰到好處當(dāng)。第二,較長(zhǎng)的測(cè)驗(yàn)也不易受到猜測(cè)的影響。三、測(cè)驗(yàn)的難度測(cè)驗(yàn)難度與信度沒有簡(jiǎn)單的對(duì)應(yīng)關(guān)係。但是,當(dāng)測(cè)驗(yàn)分?jǐn)?shù)分佈範(fàn)圍縮小時(shí),測(cè)驗(yàn)的信度降低。只有當(dāng)測(cè)驗(yàn)的難度水準(zhǔn)可以使測(cè)驗(yàn)分?jǐn)?shù)分佈範(fàn)圍最大時(shí),測(cè)驗(yàn)的信度才可能最高。四、測(cè)驗(yàn)的速度測(cè)驗(yàn)中的速度成份會(huì)影響信度係數(shù)的高低,若測(cè)驗(yàn)的速度因素影響較大時(shí),不宜採(cǎi)用分半信度法求。五、測(cè)驗(yàn)專案的同質(zhì)性測(cè)驗(yàn)專案越具有同質(zhì)性,越有對(duì)其信度估計(jì)偏高的可能性,因?yàn)樵绞峭|(zhì),專案間的一致性程度就越高。六、測(cè)驗(yàn)的客觀性越具有客觀性,評(píng)分的結(jié)果越具有一致性,其信度就不受評(píng)分者的影響。的肯定是長(zhǎng)度。但是在教育和心理的測(cè)量中,由於被測(cè)試的對(duì)象非常複雜,只能採(cǎi)用間接測(cè)量的方法,由此就產(chǎn)生了效度的問題。測(cè)量的有效性是良好測(cè)驗(yàn)的最基本條件,一個(gè)缺乏效度的測(cè)量是毫無價(jià)值的。效度的形式化定義是指與測(cè)驗(yàn)?zāi)康挠嘘P(guān)的真實(shí)變異數(shù)Sv2
和實(shí)得分?jǐn)?shù)變異數(shù)Sx2
之比,即效度。
rxy=Sv2/Sx2二、效度的種類美國(guó)心理學(xué)會(huì)1974年發(fā)行的《教育和心理測(cè)驗(yàn)的標(biāo)準(zhǔn)》一書中將效度區(qū)分為內(nèi)容效度、效標(biāo)關(guān)聯(lián)效度和結(jié)構(gòu)效度。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)性化殯儀服務(wù)協(xié)議范本(2024年版)版B版
- 2025年度數(shù)據(jù)中心場(chǎng)地租賃與電力保障服務(wù)合同范本3篇
- 2025版教育機(jī)構(gòu)課程合作與資源共享合同3篇
- 二零二五年度現(xiàn)代化商務(wù)中心設(shè)施維護(hù)服務(wù)合同2篇
- 2024試用期勞動(dòng)合同范本:數(shù)字經(jīng)濟(jì)領(lǐng)域數(shù)據(jù)分析人員入職協(xié)議3篇
- 2024版年度影視制作合同劇本創(chuàng)作與版權(quán)2篇
- 2024版基礎(chǔ)設(shè)施建設(shè)項(xiàng)目承包協(xié)議
- 4 手 鏈(說課稿)蘇教版二年級(jí)下冊(cè)綜合實(shí)踐活動(dòng)
- 二零二五年瓷磚翻新工程委托合同范本2025年度3篇
- 2024私人借款不動(dòng)產(chǎn)抵押標(biāo)準(zhǔn)化協(xié)議模板版
- 高二物理競(jìng)賽霍爾效應(yīng) 課件
- 金融數(shù)學(xué)-(南京大學(xué))
- 基于核心素養(yǎng)下的英語寫作能力的培養(yǎng)策略
- 現(xiàn)場(chǎng)安全文明施工考核評(píng)分表
- 亞什蘭版膠衣操作指南
- 四年級(jí)上冊(cè)數(shù)學(xué)教案 6.1口算除法 人教版
- DB32-T 3129-2016適合機(jī)械化作業(yè)的單體鋼架塑料大棚 技術(shù)規(guī)范-(高清現(xiàn)行)
- 6.農(nóng)業(yè)產(chǎn)值與增加值核算統(tǒng)計(jì)報(bào)表制度(2020年)
- 人工挖孔樁施工監(jiān)測(cè)監(jiān)控措施
- 供應(yīng)商物料質(zhì)量問題賠償協(xié)議(終端)
- 物理人教版(2019)必修第二冊(cè)5.2運(yùn)動(dòng)的合成與分解(共19張ppt)
評(píng)論
0/150
提交評(píng)論