現(xiàn)代教育測量與評價學(xué)_第1頁
現(xiàn)代教育測量與評價學(xué)_第2頁
現(xiàn)代教育測量與評價學(xué)_第3頁
現(xiàn)代教育測量與評價學(xué)_第4頁
現(xiàn)代教育測量與評價學(xué)_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 現(xiàn)代教育測量與評價學(xué)1、一次考試中某生在50名學(xué)生中排名第13名,則該生的百分等級應(yīng)該是 B A13 B 26 C 50 D 742、在現(xiàn)代測驗理論的諸多模式中,最具有優(yōu)越性的是 B A.經(jīng)典測驗理論B項目反應(yīng)理論C心理測驗理論D智力測驗理論3、適合于某些用于選拔和分類的職業(yè)測驗的效度是 B A時間效度 B容效度 C效標(biāo)關(guān)聯(lián)效度 D結(jié)構(gòu)效度4、韋克斯勒智力測驗屬于 B A限時測驗和典型作為測驗 B限時測驗和最高成就測驗C非限時測驗和典型作為測驗 D非限時測驗和最高成就測驗5、測驗被試回憶或辨認(rèn)某些特定事實的能力的認(rèn)知層次是A A知識 B應(yīng)用 C分析 D綜合6、學(xué)生成績測驗的主要類型有安置性測

2、驗、形成性測驗、診斷性測驗和 D A智力測驗 B能力傾向測驗 C人格測驗D總結(jié)性測驗7、學(xué)業(yè)成績是一個 D A.名義變量 B順序變量 C等距變量 D比率變量8、通常認(rèn)為|r|0.2時稱為 A A極低相關(guān) B低相關(guān) C中等相關(guān) D高相關(guān)9、根據(jù)測驗編制程序的嚴(yán)格程度,可以簡單地把學(xué)業(yè)成就測驗分成教師自編課堂成就測驗和 D A標(biāo)準(zhǔn)參照測驗 B紙筆測試 C安置性測驗 D標(biāo)準(zhǔn)化成就測驗10、下面題型中屬于客觀題的是 D A計算題B證明題 C作圖題 D選擇題11、最重要的測驗質(zhì)量指標(biāo)是 A A難度 B區(qū)分度 C梯度D效度12、評價的重點在于“過程”的評價是 B A診斷性評價 B形成性評價 C總結(jié)性評價

3、D整體性評價13、在布魯姆認(rèn)知領(lǐng)域教育目標(biāo)分類中,層次最低的是 D A領(lǐng)會 B應(yīng)用 C分析 D知識14、學(xué)生的英語測驗成績屬于 B A名義量尺 B順序量尺 C等距量尺 D比率量尺15、容效度的評估方法不包含 B A、專家判斷法 B、雙向細(xì)目表法C、統(tǒng)計分析法 D、經(jīng)驗推測法 16、下列幾種效度中,不具有效度真正意義的是 C A結(jié)構(gòu)效度 B容效度 C表面效度 D效標(biāo)關(guān)聯(lián)效度17、學(xué)期初或單元教學(xué)開始時使用的測驗是 A A安置性測驗 B形成性測驗 C終結(jié)性測驗 D能力傾向性測驗18、標(biāo)準(zhǔn)化考試產(chǎn)生于 C A19世紀(jì)末 B20世紀(jì)初 C20世紀(jì)40年代 D20世紀(jì)60年代19、教育測量專家格蘭朗德認(rèn)

4、為,一個完整的評價計劃,可用公式形象地表達(dá),其公式是 C A評價=測量+評定+價值判斷B評價=測量+定量描述+定性判斷 C評價=測量+非測量+價值判斷 D評價=測量+非測量+統(tǒng)計推斷 20、百分等級反映數(shù)據(jù)在其次數(shù)分布中的 A A相對地位 B集中趨勢 C誤差大小 D差異程度 21、一個隨機變量所有取值點的概率之和為 B A 0 B 1 C 2 D 3二、填空題1、教育調(diào)查依據(jù)目的可分為兩類:一是( 常模調(diào)查 ),一是比較調(diào)查。2、“記”是一種感知過程,心理學(xué)上也稱為識記,可分為有意識記與無意識記,也可分為( 機械識記 )與理解識記等。3、泰勒指出:“評價過程在本質(zhì)上是確定課程和教學(xué)大綱在實際上

5、實現(xiàn)( 教育目標(biāo) )的程度的過程”4、所謂指標(biāo)結(jié)構(gòu)性教育評價表,就是根據(jù)評價目標(biāo)逐層分解評價指標(biāo),形成具有評價指標(biāo)體系、( 指標(biāo)權(quán)重結(jié)構(gòu) )以與定性定量具體評價標(biāo)準(zhǔn)的教育評價表。5、有代表性的樣組,也稱為( 常模團體 ),指的是在建立測驗常模過程中實際受測被試樣組,他們代表著一個有明確定義的人群。6、人們在解釋教育測量和評價的結(jié)果時,總是要選擇某種參照點。這樣,教育測量評價可大致分成常模參照、 ( 標(biāo)準(zhǔn)參照 )和潛力參照三種。7、以教育目標(biāo)或標(biāo)準(zhǔn)為參照來評價學(xué)生發(fā)展,需要貫徹“多元的教育目標(biāo)與(多元的評價方法)相適應(yīng)”的原則。8、所謂量表或量尺,指的是確定了測量單位和參照點并具有( 取值系統(tǒng)

6、)的測量工具。9、教育評價表在結(jié)構(gòu)上是由評價指標(biāo)、指標(biāo)權(quán)重與( 評價標(biāo)準(zhǔn) )三部分組成的。10、同質(zhì)性信度也叫( 部一致性系數(shù) )信度,它是指測驗部所有題目間的一致性程度。三、名詞解釋1、教育測量答:教學(xué)測量是考核教學(xué)成效的一種方法,是一種收集資料數(shù)據(jù)的過程。它是借助于一定的教育測量工具與其操作,根據(jù)某種標(biāo)準(zhǔn)和一定的操作程序,將學(xué)生的學(xué)習(xí)行為與結(jié)果確定為一種量值,以表示學(xué)生對所測問題了解的多少。即通過觀察少數(shù)具有代表性的行為或現(xiàn)象來量化描述人的心理特征,為了減少誤差,測驗在編制、施測、評分以與解釋等方面都必須遵循一套系統(tǒng)的程序。2.句子完成測驗答:又稱作填句測驗,去完成的句子(詞干)構(gòu)成,并且

7、這些語句多為 情境性、情緒性的。2、 品德情境測評法 答:指測評者設(shè)置一定的情境和標(biāo)準(zhǔn),并觀察被測評者在該情境中的反應(yīng),根據(jù)事先規(guī)定的標(biāo)準(zhǔn)對被測評者的品德發(fā)展?fàn)顩r做出評價的方法。簡而言之,是指對個體品德的測量與評價。3、 效度 答:即有效性,它是指測量工具或手段能夠準(zhǔn)確測出所需測量的事物的程度。效度是指所測量到的結(jié)果反映所想要考察容的程度,測量結(jié)果與要考察的容越吻合,則效度越高;反之,則效度越低。效度分為三種類型:容效度、準(zhǔn)則效度和結(jié)構(gòu)效度。4、 高考標(biāo)準(zhǔn)分?jǐn)?shù)制度 答:高考標(biāo)準(zhǔn)分?jǐn)?shù)制度由常模量表分?jǐn)?shù)(包括全國常模和省常模)、等值量表分?jǐn)?shù)組成。5.難度 答:難度即測試題目的難易程度一般在能力方面

8、的測試中,它作為衡量測試題目質(zhì)量的主要指標(biāo)之一。它是衡量試題質(zhì)量的一個重要指標(biāo)參數(shù),它和區(qū)分度共同影響并決定試卷的鑒別性。難度:難度指被試完成測驗或量表時所遇到題目的難易程度記為P。難度:指試題的難易程度,即某個試題的通過率(答對或通過試題的人數(shù)比例)5、 常模 答:常模是一種供比較的標(biāo)準(zhǔn)量數(shù),由標(biāo)準(zhǔn)化樣本測試結(jié)果計算而來,即某一標(biāo)準(zhǔn)化樣本的平均數(shù)和標(biāo)準(zhǔn)差。7.教育目標(biāo) 答:教育目標(biāo)(educational goal)就是指所培養(yǎng)的人才應(yīng)達(dá)到的標(biāo)準(zhǔn).這個目標(biāo)可高可低按需而定(教育目標(biāo)是培養(yǎng)人的方向和規(guī)格)。是反映教育目的的,具體而可觀測的變化(或進(jìn)步)。7.真分?jǐn)?shù) 答:值小于1的分?jǐn)?shù),即分子小

9、于分母(二者都是正整數(shù))的分?jǐn)?shù)稱為真分?jǐn)?shù),但等于1不算(那屬于假分?jǐn)?shù))。真分?jǐn)?shù):被試在所測特質(zhì)上客觀具有的水平值。四、簡答題1、簡述羅杰斯關(guān)于健康人格的具體特征答:情感和態(tài)度上是無拘無束的、開放性的,沒有任何東西需要防備;對新的經(jīng)驗有很強的適應(yīng)性,能夠自由地分享這些經(jīng)驗;信任自己的感覺;有自由感;具有高度的創(chuàng)造力。2、簡述課業(yè)考評改革的主要目標(biāo)答:a.首先要實現(xiàn)考試觀向發(fā)展性評價觀的轉(zhuǎn)變,b.要努力實現(xiàn)從重視“掌握性結(jié)果”的評價轉(zhuǎn)變既重視“掌握性結(jié)果”又重視“發(fā)展性結(jié)果”的評價;c.容要從認(rèn)知領(lǐng)域轉(zhuǎn)變到涵蓋學(xué)習(xí)結(jié)果更廣泛的教育目標(biāo)領(lǐng)域上d.要努力實現(xiàn)從表征性分?jǐn)?shù)機制到實質(zhì)性容機制的轉(zhuǎn)變。3、簡

10、述教育測量與評價按照按測量與評價的容如何分類答:1)按運用時機分:形成性測量與評價;診斷性測量與評價;終結(jié)性測量與評價2)按解釋測量結(jié)果或評價結(jié)果時的參照點分類:常模參照測量與評價;標(biāo)準(zhǔn)參照測量與評價3)按測量與評價被試行為表現(xiàn)的性質(zhì)分類:最佳行為測量與評價;典型行為測量與評價4)按量表的標(biāo)準(zhǔn)化程度可分為標(biāo)準(zhǔn)化測驗和非標(biāo)準(zhǔn)化測驗2、 簡述課業(yè)考的主要作用答:1.課業(yè)考評的主要作用:首先,合理的課業(yè)考評制度為學(xué)生發(fā)展提供較明確的目標(biāo)和努力的方向;其次,合理的課業(yè)考評制度將有助于評價學(xué)生的發(fā)展進(jìn)步,從而對教與學(xué)雙方活動起著重要的控制、調(diào)節(jié)和促進(jìn)等作用;再次,課業(yè)考評為學(xué)生心理發(fā)展和學(xué)習(xí)進(jìn)步創(chuàng)造必要

11、的背景和空間,誘發(fā)學(xué)生的學(xué)習(xí)動機和自主發(fā)展的動力;最后,課業(yè)考評在中小學(xué)生個體社會化進(jìn)程中起著控制、調(diào)節(jié)、促進(jìn)和加速的作用。簡述多元智力學(xué)校教育的基本特征答:多元智力理論有下列主要特點:一是多元性。二是文化性。三是差異性。四是實踐性。五是開發(fā)性4、簡述表現(xiàn)性測驗類型 答:(一)口頭測驗(二)論辯或辯論(三)短文題考試(四)寫作測驗(五)過程反應(yīng)題(六)實驗技能教學(xué)考試評價5、 簡述主觀題的編制原則答:1如果測量的行為目標(biāo)能夠用客觀題來測,就盡量不要用主觀題。2挑選的材料應(yīng)該與學(xué)生學(xué)習(xí)經(jīng)歷過的材料有類似性或是全新的材料。3設(shè)計的試題應(yīng)該能夠測量相關(guān)的行為目標(biāo)并且與某一容領(lǐng)域相關(guān)。4應(yīng)該用清晰、明

12、確的語言表述背景材料和問題。5對材料分析題而言,設(shè)計試題應(yīng)該對材料進(jìn)行分析和解釋。6設(shè)計的試題數(shù)應(yīng)該與背景材料的長度相匹配。7對試題的賦分應(yīng)該合理。8對每個問題給以適當(dāng)?shù)耐瓿蓵r間。突出重點 結(jié)合世界 允許發(fā)揮 答案多樣 難度適宜6、簡述在高考中使用原始分?jǐn)?shù)的局限性答:(1)原始分?jǐn)?shù)未能反映考試分?jǐn)?shù)相對于團體的位置信息。(2)不同科目或同一科目不同次考試之間分?jǐn)?shù)可比較差。(3)原始分?jǐn)?shù)不宜直接相加。(4)在高考中不便于控制各科目的權(quán)重。(5)在教育評價時,常提供不客觀、不準(zhǔn)確的信息。6、 簡述常模的用途答:常模的作用是讓測驗者明白測驗結(jié)果分?jǐn)?shù)的意義。心理測驗是一種測量人的心理狀態(tài)的技術(shù)手段,如同

13、一個醫(yī)生量一下你的血壓就可以知道你的血壓是否偏高偏低一樣,心理測驗也希望達(dá)到類似的心理測量的目的。五、論述題1、常模參照測驗、標(biāo)準(zhǔn)參照測驗所要求的項目恰當(dāng)難度與難度分布是什么?為什么?答:(1)常模參照測驗的項目恰當(dāng)難度是P值盡量接近0.50。因為只有在這種情況下,題目區(qū)分性能最好,(2)常模參照測驗所要求的項目恰當(dāng)難度分布是,圍繞P=0.50這個點,有一個適當(dāng)寬的全距。(3)這樣的原因有以下兩個:一是測驗時,通常希望開始有幾個難度較低的題目來穩(wěn)定被試情緒,末尾用幾個難度稍大的題目以便只有少數(shù)高水平者才能通過。(4)二是讓全部項目都取0.50的難度,通常難以實現(xiàn)。當(dāng)然,在允許有適當(dāng)寬的全距的前

14、提下,仍然要力爭大多數(shù)項目難度取值接近0.50。(5)標(biāo)準(zhǔn)參照測驗的目的是要考察被試的水平是否達(dá)到應(yīng)有要求,因而測驗項目的難度,就不應(yīng)由被試的實際通過率來決定,而應(yīng)由項目的考核要否體現(xiàn)應(yīng)有標(biāo)準(zhǔn)或教學(xué)目標(biāo)來決定。(6)無論項目的通過是高還是低,只有體現(xiàn)了應(yīng)用的標(biāo)準(zhǔn)或教學(xué)目標(biāo),項目的難度就是合理的恰當(dāng)?shù)摹?、舉例說明結(jié)構(gòu)效度驗證步驟答:(1)考察測驗的容效度,因為有些測驗對所測容或行為圍的定義或解釋類似于理論構(gòu)想的解釋,所以容效度高實質(zhì)上也說明結(jié)構(gòu)效度高。(2)計算測驗的同質(zhì)性信度的方法來檢測結(jié)構(gòu)效度。若有證據(jù)表明測驗不同質(zhì),則可以斷定該測驗結(jié)構(gòu)效度不高。3)利用相容效度法,考察新編制的測驗與某個已知的能有效測量一樣特質(zhì)的測驗之間的相關(guān)。若兩者相關(guān)較高,則說明新測驗有較高的效度。(4)利用區(qū)分效度法,考察新編測驗與某個已知的能有效測量不同的特質(zhì)的舊測驗間的相關(guān)。若兩者相關(guān)較高,表明測到了其他心理特質(zhì),則新測驗效度不高。(5)對一組測驗進(jìn)行因素分析,找出影響測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論