現(xiàn)代教育測量與評價學_第1頁
現(xiàn)代教育測量與評價學_第2頁
現(xiàn)代教育測量與評價學_第3頁
現(xiàn)代教育測量與評價學_第4頁
現(xiàn)代教育測量與評價學_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、現(xiàn)代教育測量與評價學1、一次考試中某生在50名學生中排名第13名,則該生的百分等級應該是【 B 】A13 B 26 C 50 D 742、在現(xiàn)代測驗理論的諸多模式中,最具有優(yōu)越性的是 【 B 】A.經(jīng)典測驗理論B項目反應理論C心理測驗理論D智力測驗理論3、適合于某些用于選拔和分類的職業(yè)測驗的效度是【 B 】A時間效度 B內(nèi)容效度 C效標關聯(lián)效度 D結構效度4、韋克斯勒智力測驗屬于 【 B 】A限時測驗和典型作為測驗 B限時測驗和最高成就測驗C非限時測驗和典型作為測驗 D非限時測驗和最高成就測驗5、測驗被試回憶或辨認某些特定事實的能力的認知層次是【A 】A知識 B應用 C分析 D綜合6、學生成績

2、測驗的主要類型有安置性測驗、形成性測驗、診斷性測驗和【 D 】A智力測驗 B能力傾向測驗 C人格測驗D總結性測驗7、學業(yè)成績是一個 【 D 】A.名義變量 B順序變量 C等距變量 D比率變量8、通常認為|r|<0.2時稱為 【 A 】A極低相關 B低相關 C中等相關 D高相關9、根據(jù)測驗編制程序的嚴格程度,可以簡單地把學業(yè)成就測驗分成教師自編課堂成就測驗和 【 D 】A標準參照測驗 B紙筆測試 C安置性測驗 D標準化成就測驗10、下面題型中屬于客觀題的是 【 D 】A計算題B證明題 C作圖題 D選擇題11、最重要的測驗質(zhì)量指標是 【 A 】A難度 B區(qū)分度 C梯度D效度12、評價的重點在

3、于“過程”的評價是 【 B 】A診斷性評價 B形成性評價 C總結性評價 D整體性評價13、在布魯姆認知領域教育目標分類中,層次最低的是【 D 】A領會 B應用 C分析 D知識14、學生的英語測驗成績屬于 【 B 】A名義量尺 B順序量尺 C等距量尺 D比率量尺15、內(nèi)容效度的評估方法不包含 【 B 】A、專家判斷法 B、雙向細目表法C、統(tǒng)計分析法 D、經(jīng)驗推測法 16、下列幾種效度中,不具有效度真正意義的是 【 C 】A結構效度 B內(nèi)容效度 C表面效度 D效標關聯(lián)效度17、學期初或單元教學開始時使用的測驗是 【 A 】A安置性測驗 B形成性測驗 C終結性測驗 D能力傾向性測驗18、標準化考試產(chǎn)

4、生于 【 C 】A19世紀末 B20世紀初 C20世紀40年代 D20世紀60年代19、教育測量專家格蘭朗德認為,一個完整的評價計劃,可用公式形象地表達,其公式是 【 C 】 A評價=測量+評定+價值判斷B評價=測量+定量描述+定性判斷 C評價=測量+非測量+價值判斷 D評價=測量+非測量+統(tǒng)計推斷 20、百分等級反映數(shù)據(jù)在其次數(shù)分布中的 【 A 】 A相對地位 B集中趨勢 C誤差大小 D差異程度 21、一個隨機變量所有取值點的概率之和為 【 B 】 A 0 B 1 C 2 D 3二、填空題1、教育調(diào)查依據(jù)目的可分為兩類:一是( 常模調(diào)查 ),一是比較調(diào)查。2、“記”是一種感知過程,心理學上也

5、稱為識記,可分為有意識記與無意識記,也可分為( 機械識記 )與理解識記等。3、泰勒指出:“評價過程在本質(zhì)上是確定課程和教學大綱在實際上實現(xiàn)( 教育目標 )的程度的過程”4、所謂指標結構性教育評價表,就是根據(jù)評價目標逐層分解評價指標,形成具有評價指標體系、( 指標權重結構 )以及定性定量具體評價標準的教育評價表。5、有代表性的樣組,也稱為( 常模團體 ),指的是在建立測驗常模過程中實際受測被試樣組,他們代表著一個有明確定義的人群。6、人們在解釋教育測量和評價的結果時,總是要選擇某種參照點。這樣,教育測量評價可大致分成常模參照、 ( 標準參照 )和潛力參照三種。7、以教育目標或標準為參照來評價學生

6、發(fā)展,需要貫徹“多元的教育目標與(多元的評價方法)相適應”的原則。8、所謂量表或量尺,指的是確定了測量單位和參照點并具有( 取值系統(tǒng) )的測量工具。9、教育評價表在結構上是由評價指標、指標權重及( 評價標準 )三部分組成的。10、同質(zhì)性信度也叫( 內(nèi)部一致性系數(shù) )信度,它是指測驗內(nèi)部所有題目間的一致性程度。三、名詞解釋1、教育測量答:教學測量是考核教學成效的一種方法,是一種收集資料數(shù)據(jù)的過程。它是借助于一定的教育測量工具及其操作,根據(jù)某種標準和一定的操作程序,將學生的學習行為與結果確定為一種量值,以表示學生對所測問題了解的多少。即通過觀察少數(shù)具有代表性的行為或現(xiàn)象來量化描述人的心理特征,為了

7、減少誤差,測驗在編制、施測、評分以及解釋等方面都必須遵循一套系統(tǒng)的程序。2.句子完成測驗答:又稱作填句測驗,去完成的句子(詞干)構成,并且這些語句多為 情境性、情緒性的。2、 品德情境測評法 答:指測評者設置一定的情境和標準,并觀察被測評者在該情境中的反應,根據(jù)事先規(guī)定的標準對被測評者的品德發(fā)展狀況做出評價的方法。簡而言之,是指對個體品德的測量與評價。3、 效度 答:即有效性,它是指測量工具或手段能夠準確測出所需測量的事物的程度。效度是指所測量到的結果反映所想要考察內(nèi)容的程度,測量結果與要考察的內(nèi)容越吻合,則效度越高;反之,則效度越低。效度分為三種類型:內(nèi)容效度、準則效度和結構效度。4、 高考

8、標準分數(shù)制度 答:高考標準分數(shù)制度由常模量表分數(shù)(包括全國常模和省常模)、等值量表分數(shù)組成。5.難度 答:難度即測試題目的難易程度一般在能力方面的測試中,它作為衡量測試題目質(zhì)量的主要指標之一。它是衡量試題質(zhì)量的一個重要指標參數(shù),它和區(qū)分度共同影響并決定試卷的鑒別性。難度:難度指被試完成測驗或量表時所遇到題目的難易程度記為P。難度:指試題的難易程度,即某個試題的通過率(答對或通過試題的人數(shù)比例) 5、 常模 答:常模是一種供比較的標準量數(shù),由標準化樣本測試結果計算而來,即某一標準化樣本的平均數(shù)和標準差。7.教育目標 答:教育目標(educational goal)就是指所培養(yǎng)的人才應達

9、到的標準.這個目標可高可低按需而定(教育目標是培養(yǎng)人的方向和規(guī)格)。是反映教育目的的,具體而可觀測的變化(或進步)。7.真分數(shù) 答:值小于1的分數(shù),即分子小于分母(二者都是正整數(shù))的分數(shù)稱為真分數(shù),但等于1不算(那屬于假分數(shù))。真分數(shù):被試在所測特質(zhì)上客觀具有的水平值。四、簡答題1、簡述羅杰斯關于健康人格的具體特征答:情感和態(tài)度上是無拘無束的、開放性的,沒有任何東西需要防備;對新的經(jīng)驗有很強的適應性,能夠自由地分享這些經(jīng)驗;信任自己的感覺;有自由感;具有高度的創(chuàng)造力。2、簡述課業(yè)考評改革的主要目標答:a.首先要實現(xiàn)考試觀向發(fā)展性評價觀的轉變,b.要努力實現(xiàn)從重視“掌握性結果”的評價轉變既重視“

10、掌握性結果”又重視“發(fā)展性結果”的評價;c.內(nèi)容要從認知領域轉變到涵蓋學習結果更廣泛的教育目標領域上d.要努力實現(xiàn)從表征性分數(shù)機制到實質(zhì)性內(nèi)容機制的轉變 。3、簡述教育測量與評價按照按測量與評價的內(nèi)容如何分類答:1)按運用時機分:形成性測量與評價;診斷性測量與評價;終結性測量與評價2)按解釋測量結果或評價結果時的參照點分類:常模參照測量與評價;標準參照測量與評價3)按測量與評價被試行為表現(xiàn)的性質(zhì)分類:最佳行為測量與評價;典型行為測量與評價4)按量表的標準化程度可分為標準化測驗和非標準化測驗 2、 簡述課業(yè)考的主要作用答:1.課業(yè)考評的主要作用:首先,合理的課業(yè)考評制度為學生

11、發(fā)展提供較明確的目標和努力的方向;其次,合理的課業(yè)考評制度將有助于評價學生的發(fā)展進步,從而對教與學雙方活動起著重要的控制、調(diào)節(jié)和促進等作用;再次,課業(yè)考評為學生心理發(fā)展和學習進步創(chuàng)造必要的背景和空間,誘發(fā)學生的學習動機和自主發(fā)展的動力;最后,課業(yè)考評在中小學生個體社會化進程中起著控制、調(diào)節(jié)、促進和加速的作用。簡述多元智力學校教育的基本特征答:多元智力理論有下列主要特點:一是多元性。二是文化性。三是差異性。四是實踐性。五是開發(fā)性4、簡述表現(xiàn)性測驗類型 答:(一)口頭測驗(二)論辯或辯論(三)短文題考試(四)寫作測驗(五)過程反應題(六)實驗技能教學考試評價5、 簡述主觀題的編制原則答:1如果測量

12、的行為目標能夠用客觀題來測,就盡量不要用主觀題。2挑選的材料應該與學生學習經(jīng)歷過的材料有類似性或是全新的材料。 3設計的試題應該能夠測量相關的行為目標并且與某一內(nèi)容領域相關。 4應該用清晰、明確的語言表述背景材料和問題。 5對材料分析題而言,設計試題應該對材料進行分析和解釋。 6設計的試題數(shù)應該與背景材料的長度相匹配。 7對試題的賦分應該合理。 8對每個問題給以適當?shù)耐瓿蓵r間。突出重點 結合世界 允許發(fā)揮 答案多樣 難度適宜6、簡述在高考中使用原始分數(shù)的局限性答:(1)原始分數(shù)未能反映考試分數(shù)相對于團體的位置信息。(2)不同科目或同一科目不同次考試之間分數(shù)可比較差。(3)原始分數(shù)不宜直接相加。

13、(4)在高考中不便于控制各科目的權重。(5)在教育評價時,常提供不客觀、不準確的信息。 6、 簡述常模的用途答:常模的作用是讓測驗者明白測驗結果分數(shù)的意義。心理測驗是一種測量人的心理狀態(tài)的技術手段,如同一個醫(yī)生量一下你的血壓就可以知道你的血壓是否偏高偏低一樣,心理測驗也希望達到類似的心理測量的目的。五、論述題1、常模參照測驗、標準參照測驗所要求的項目恰當難度及難度分布是什么?為什么?答:(1)常模參照測驗的項目恰當難度是P值盡量接近0.50。因為只有在這種情況下,題目區(qū)分性能最好,(2)常模參照測驗所要求的項目恰當難度分布是,圍繞P=0.50這個點,有一個適當寬的全距。(3)這樣的原

14、因有以下兩個:一是測驗時,通常希望開始有幾個難度較低的題目來穩(wěn)定被試情緒,末尾用幾個難度稍大的題目以便只有少數(shù)高水平者才能通過。(4)二是讓全部項目都取0.50的難度,通常難以實現(xiàn)。當然,在允許有適當寬的全距的前提下,仍然要力爭大多數(shù)項目難度取值接近0.50。(5)標準參照測驗的目的是要考察被試的水平是否達到應有要求,因而測驗項目的難度,就不應由被試的實際通過率來決定,而應由項目的考核要求是否體現(xiàn)應有標準或教學目標來決定。(6)無論項目的通過是高還是低,只有體現(xiàn)了應用的標準或教學目標,項目的難度就是合理的恰當?shù)摹?、舉例說明結構效度驗證步驟答:(1)考察測驗的內(nèi)容效度,因為有些測驗對所測內(nèi)容或行為范圍的定義或解釋類似于理論構想的解釋,所以內(nèi)容效度高實質(zhì)上也說明結構效度高。(2)計算測驗的同質(zhì)性信度的方法來檢測結構效度。若有證據(jù)表明測驗不同質(zhì),則可以斷定該測驗結構效度不高。3)利用相容效度法,考察新編制的測驗與某個已知的能有效測量相同特質(zhì)的測驗之間的相關。若兩者相關較高,則說明新測驗有較高的效度。(4)利用區(qū)分效度法,考察新編測驗與某個已知的能有效測量不同的特質(zhì)的舊測驗間的相關。若兩者相關較高,表明測到了其他心理特質(zhì),則新測驗效度不高。(5)對一組測驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論