教育測量的基本原理與方法課件_第1頁
教育測量的基本原理與方法課件_第2頁
教育測量的基本原理與方法課件_第3頁
教育測量的基本原理與方法課件_第4頁
教育測量的基本原理與方法課件_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

教育測量的基本原理與方法童輝杰博士教授教育測量的基本原理與方法童輝杰一、從兩份載入史冊的評語說起1.黑格爾的老師對他的評價黑格爾是德國的著名哲學(xué)家,18歲進(jìn)入圖賓根大學(xué)(符騰堡州的一所新教神學(xué)院)學(xué)習(xí)。畢業(yè)時,他的老師為黑格爾寫下一段評語:“健康狀況不佳,中等身材,不善辭令,沉默寡言,天賦高,判斷力健全,記憶力強,文字通順,作風(fēng)正派,有時不太用功,神學(xué)有成績,雖然嘗試講道不無熱情,但看來不是一名優(yōu)秀的傳教士。語言知識豐富,哲學(xué)上十分努力。”一、從兩份載入史冊的評語說起1.黑格爾的老師對他的評價2.卡爾·馬克思《中學(xué)畢業(yè)證書》上的評語

一、操行:對待師長和同學(xué)態(tài)度良好。二、才能和勤勉:該生才能優(yōu)異,在古代語、德語和歷史課方面表現(xiàn)了十分令人滿意的勤勉,在數(shù)學(xué)課方面是令人滿意的勤勉;只是在法語方面稍為勤勉。2.卡爾·馬克思《中學(xué)畢業(yè)證書》上的評語三、知識和成績1.語言(1)德語:語法知識和作文都很好。(2)拉丁文:無需準(zhǔn)備就能熟練、細(xì)致地翻譯和解釋中學(xué)選讀的古典作品中比較容易的段落,經(jīng)過適當(dāng)準(zhǔn)備或稍作輔導(dǎo)后,常常能熟練、細(xì)致地翻譯與解釋較難的讀物,尤其是語言本身并不太難和所涉及的事物和思想內(nèi)容都較難懂的讀物。他的作文就內(nèi)容而言,既富于思想,又對事物有深刻的了解,但時常過于冗長,在掌握拉丁文方面達(dá)到了令人相當(dāng)滿意的熟練的程度。三、知識和成績(3)希臘文:對中學(xué)選讀的古典作品的理解,其知識和熟練程度同拉丁文不相上下。(4)法語:語法知識相當(dāng)好,略加輔導(dǎo)就能讀較難的作品??谡Z表述方面達(dá)到了一定的熟練程度。2.學(xué)科(1)宗教知識:對基督教的教義和自誡相當(dāng)清楚,能很好地論證;對基督教的歷史也有一定的了解。(2)數(shù)學(xué):有豐富的知識。(3)歷史和地理:總的來說,具有相當(dāng)令人滿意的知識。(4)物理:知識中等。(3)希臘文:對中學(xué)選讀的古典作品的理解,其知識和熟練程度同因此,本委員會衷心希望將由于得天獨厚而獲得應(yīng)有的美好前程。學(xué)??荚囄瘑T會思維豐富,文學(xué)結(jié)構(gòu)嚴(yán)謹(jǐn),然而有追求與眾不同的形象用語的傾向。——校長維登巴赫因此,本委員會衷心希望將由于得天獨厚而獲得應(yīng)有的美好前程。反思1.我們能為學(xué)生寫出同樣的全面中肯的評語嗎?2.評語是怎樣做出的?3.什么是教育測量與評價?反思1.我們能為學(xué)生寫出同樣的全面中肯的評語嗎?1.我們能為學(xué)生寫出同樣的全面中肯的評語嗎?任何一個普通的老師,都完全能夠看到每一個學(xué)生全面的發(fā)展和特點。如果讓一個老師自主地、自由地對任何一個學(xué)生作出評價,我相信他們都完全可以作出全面的恰當(dāng)?shù)脑u價而不失分寸。那么,是什么東西屏蔽了全體教師的眼光呢?是什么東西不讓這些教師看到學(xué)生的全面發(fā)展呢?無疑就是我們的教育部門的官僚主義和行政取向。領(lǐng)導(dǎo)們那么忙,怎么能夠看到學(xué)生全面的發(fā)展和特點呢?他們也不需要看到、不愿意看到。他們只需要分?jǐn)?shù)!分?jǐn)?shù),多么簡單而好使!1.我們能為學(xué)生寫出同樣的全面中肯的評語嗎?任何一個普通的我們的教育體制表現(xiàn)出兩個特點。一是應(yīng)試主義,只看到考試成績,看不到學(xué)生其它方面的發(fā)展;二是官僚主義和行政取向。正因為教育部門廣泛而深入的官僚主義和行政取向,才造成了一切向分?jǐn)?shù)看的體制。我們的教育體制表現(xiàn)出兩個特點。一是應(yīng)試主義,只看到考試成績,所以說,我們厭倦了應(yīng)試教育這么多年,批評應(yīng)試教育這么多年,一點進(jìn)展也沒有,原因就在于我們竟然沒有看到應(yīng)試教育是怎樣來的。怎么這么多年來沒有人發(fā)現(xiàn)應(yīng)試教育完全是來源于教育部門廣泛而深入的官僚主義與行政取向!教育部門的官僚主義和行政取向?qū)е铝藨?yīng)試教育,這種“異化”的組合一道忽略和抹殺了我們的學(xué)生的生動活潑的天性、豐富多彩的創(chuàng)造性、無限的發(fā)展?jié)撃堋瓍s只需要易于管理的升學(xué)率、需要服從、聽話、刻板、機(jī)械的品質(zhì)。在簡單管理的官僚主義和行政取向的“升學(xué)率”的指揮棒下,全體師生只能服從、聽命,于是高強度的“題海戰(zhàn)術(shù)”,鋪天蓋地的大考小考,永遠(yuǎn)的死記硬背,從小學(xué)的6年,再到中學(xué)的6年……所以才出現(xiàn)今天高校的“陰盛陽衰”現(xiàn)象。所以說,我們厭倦了應(yīng)試教育這么多年,批評應(yīng)試教育這么多年,一2.評語是怎樣做出的?評語是一種非常重要的教育評價。教育評價是依據(jù)教育測量、行為觀測、綜合考察的結(jié)果做出的。2.評語是怎樣做出的?評語是一種非常重要的教育評價。3.什么是教育測量與評價?對受教育者并且同時也對教育者的行為進(jìn)行標(biāo)準(zhǔn)化的量化分析,從而作出客觀的科學(xué)的評價。標(biāo)準(zhǔn)化:(1)測量過程的標(biāo)準(zhǔn)化;(2)領(lǐng)域參照和常模參照標(biāo)準(zhǔn)。量化分析:(1)掌握水平:學(xué)業(yè)成績;(2)標(biāo)準(zhǔn)分(Z,T,IQ,等等)對受教育者:因材施教。對教育者:促進(jìn)教育發(fā)展。3.什么是教育測量與評價?對受教育者并且同時也對教育者的行國外對學(xué)校教育質(zhì)量的評價Horwitz(1979):學(xué)業(yè)成績、自我概念、對學(xué)校的態(tài)度、創(chuàng)造力、獨立性與順從性、好奇感、憂慮與調(diào)節(jié)、控制點、互助性。Hedges等人(1981):成就動機(jī)、調(diào)節(jié)、憂慮、對學(xué)校的態(tài)度、對老師的態(tài)度、互助性、創(chuàng)造力、好奇感、一般思維能力、獨立性與自立性、控制點、自我概念、語言能力、數(shù)學(xué)成績等學(xué)業(yè)成績。國外對學(xué)校教育質(zhì)量的評價Horwitz(197二、從最早的教育測量到今天的教育測量:回顧與反思正是中國孕育了世界上最早的教育測量。在測量史上,世界公認(rèn)人類最早出現(xiàn)的教育測驗,是在中國發(fā)現(xiàn)的。公元前2200年,大禹對官員每三年一次進(jìn)行能力測驗,作為晉升或罷免的依據(jù)。這可以說是人類最早出現(xiàn)的教育測驗。并且,有史料可循的中國漢朝出現(xiàn)的文官選拔考試,也是比西方早了一千多年。漢武帝(公元前156年-公元前87年)時,興辦太學(xué),并開科取士,及至隋唐成為制度。而在歐洲,大學(xué)里出現(xiàn)正式考試是公元1219年的事,文官考試則更是要到1833年后。二、從最早的教育測量到今天的教育測量:回顧與反思正是中國孕育1.中國人這項最早的創(chuàng)新意義何在?大家不要低估了開科取士的偉大意義,這種創(chuàng)舉:一是使用了測量的方法和心理選拔的策略,從而能夠真正公平地選拔到合適的人才,使人力資源的配置達(dá)到優(yōu)化;二是廣開了才路,使有能力的寒門子弟也能夠晉升,為國家效勞,從而開發(fā)了國力。歷史已經(jīng)檢驗了這種創(chuàng)舉的“實證效度”,漢武帝時中國的強盛就能說明問題,漢武帝于是也成了“雄才大略”的一代雄君。所以,其意義比美軍使用“陸軍A、B種智力測驗”還值得稱道。

1.中國人這項最早的創(chuàng)新意義何在?大家不要低估了開科取士的2.為何到后來反而成了僵化的體制?從晚清腐敗的科學(xué)考試今天的應(yīng)試教育。2.為何到后來反而成了僵化的體制?從晚清腐敗的科學(xué)考試3.教育與國家發(fā)展究竟有多大關(guān)系?3.教育與國家發(fā)展究竟有多大關(guān)系?三、信度的原理與方法1.信度的意義假設(shè)有人前幾天給你量過身高,你的身高是175厘米。今天再次給你量了身高,你的身高是165厘米。你作何感想?

根據(jù)這樣的測量,請問,你究竟是多高?你能夠下結(jié)論嗎?顯然,測量誤差很大的測量結(jié)果,是不能夠給出結(jié)論的。三、信度的原理與方法1.信度的意義5位教師對一位學(xué)生的作文評分的結(jié)果是:90、20、70、10、30;請問,這樣的評分能夠相信嗎?

評分從10分到90分,彼此相差太大,評分者信度是很低的。在這樣的情況下,能夠?qū)W(xué)生作出可靠的結(jié)論嗎?評分者信度低,說明教師們或者對評分標(biāo)準(zhǔn)有不同的理解,或者對學(xué)生存有偏見。也就是說,5位教師的評價存在很大的誤差,這樣是不能夠?qū)W(xué)生做出客觀可靠的結(jié)論的。否則就是草菅人命。5位教師對一位學(xué)生的作文評分的結(jié)果是:90、20、70、102.信度的計算信度常以相關(guān)系數(shù)表示:

例如,50個被試第一次測驗與相隔一周后的第二次同樣的測驗,兩次測驗成績的相關(guān)系數(shù)r為0.85。這個相關(guān)系數(shù)表示的是重測信度。有5種信度(重測信度、復(fù)本信度、分半信度、內(nèi)部一致性信度和評分者信度)算法。2.信度的計算信度常以相關(guān)系數(shù)表示:各種信度的含義

信度要說明的問題取樣特點重測信度第一次測驗與第二次測驗是否一致?在不同時間取樣穩(wěn)定性系數(shù)復(fù)本信度不同的復(fù)本在同時或不同時測驗時是否一致?對內(nèi)容與時間取樣等值性及穩(wěn)定性系數(shù)分半信度測驗分為兩半時是否一致?對內(nèi)容取樣同質(zhì)性系數(shù)內(nèi)部一致性系數(shù)測驗的內(nèi)部各個項目之間是否一致?對內(nèi)容取樣同質(zhì)性系數(shù)評分者信度不同的評分者之間的評分一致性如何嗎?對評分者取樣評分者一致性系數(shù)各種信度的含義信度要說明的問題取樣特點重測信度第一次測驗與四、內(nèi)容效度問題通俗地說,或者從字詞的意義上說,內(nèi)容效度就是從測驗的內(nèi)容方面去檢驗測驗的效度。內(nèi)容效度主要去考察被試過去學(xué)得怎么樣和做得怎么樣。內(nèi)容效度檢驗一個測驗是否包括足夠的行為樣本并且有適當(dāng)?shù)谋壤峙?。一是要有足夠的覆蓋面,二是分配的比例必須適當(dāng)。四、內(nèi)容效度問題通俗地說,或者從字詞的意義上說,內(nèi)容效度就是假如關(guān)于高一期末考試的試卷出現(xiàn)爭議?假如關(guān)于高一期末考試的試卷出現(xiàn)爭議?高一數(shù)學(xué)學(xué)過的內(nèi)容必修1內(nèi)容:函數(shù),基本初等函數(shù)1,函數(shù)模型及其應(yīng)用

必修2內(nèi)容:立體幾何初步,空間中的線面關(guān)系,直線與方程,圓與方程

必修3內(nèi)容:算法初步,統(tǒng)計,概率,

必修4內(nèi)容:三角函數(shù),平面向量,三角恒等變換高一數(shù)學(xué)學(xué)過的內(nèi)容必修1內(nèi)容:函數(shù),基本初等函數(shù)1,函數(shù)模型五、標(biāo)準(zhǔn)化問題1.參照的意義原始分?jǐn)?shù)毫無意義。(1)常模參照。(2)領(lǐng)域參照。五、標(biāo)準(zhǔn)化問題1.參照的意義2.領(lǐng)域參照測驗的主要特征是:(1)界定明確的領(lǐng)域與內(nèi)容的范圍。首先一定要界定清楚測驗的領(lǐng)域與內(nèi)容的范圍,例如,過去學(xué)了哪些東西,做了哪些事。(2)根據(jù)明確的領(lǐng)域與內(nèi)容的范圍,確定掌握水平。明確界定了測驗的領(lǐng)域與內(nèi)容范圍之后,就可以確定一個掌握水平。例如,明確了高一某學(xué)期學(xué)過集合、代數(shù)、函數(shù)、幾何這些內(nèi)容,就可以每個部分編制若干道題,總共100分,并確定60分為及格。這分?jǐn)?shù)就對知識與技能的掌握水平。2.領(lǐng)域參照測驗的主要特征是:3.領(lǐng)域參照測驗與常模參照測驗的關(guān)系(1)領(lǐng)域參照測驗可以與常模參照測驗結(jié)合。當(dāng)測驗的領(lǐng)域清晰時,我們可以編制領(lǐng)域參照測驗,也能編制成常模參照測驗。例如,學(xué)業(yè)測驗本來是領(lǐng)域參照測驗,但是,我們可以進(jìn)一步將它發(fā)展成常模參照測驗。那些學(xué)業(yè)標(biāo)準(zhǔn)化測驗就是如此。著名的測驗GRE、托福、美國學(xué)業(yè)評定測驗方案(SAT)、美國大學(xué)測驗方案(SCT)等就是常模參照測驗。(2)常模參照測驗不可編制成領(lǐng)域參照測驗。當(dāng)測驗的領(lǐng)域不清晰時,只能編制常模參照測驗,不能編制領(lǐng)域參照測驗。智力、人格、創(chuàng)造力、心理健康這些領(lǐng)域都是不清晰的,難以明確辨別的,所以,只能編制常模參照測驗,不能編制領(lǐng)域參照測驗。領(lǐng)域都不清晰,談何領(lǐng)域參照?3.領(lǐng)域參照測驗與常模參照測驗的關(guān)系3.常模參照的標(biāo)準(zhǔn)化測驗的應(yīng)用從標(biāo)準(zhǔn)化的學(xué)業(yè)測驗到學(xué)習(xí)風(fēng)格(反省監(jiān)控)、人格(成就動機(jī)和抱負(fù)水平)、認(rèn)知能力(智力)、心理健康(病態(tài)人格、強迫、焦慮、抑郁)……3.常模參照的標(biāo)準(zhǔn)化測驗的應(yīng)用六、幾個展望1.項目反應(yīng)理論與計算機(jī)自適應(yīng)測驗2.大數(shù)據(jù)與教育測量六、幾個展望1.項目反應(yīng)理論與計算機(jī)自適應(yīng)測驗教育測量的基本原理與方法童輝杰博士教授教育測量的基本原理與方法童輝杰一、從兩份載入史冊的評語說起1.黑格爾的老師對他的評價黑格爾是德國的著名哲學(xué)家,18歲進(jìn)入圖賓根大學(xué)(符騰堡州的一所新教神學(xué)院)學(xué)習(xí)。畢業(yè)時,他的老師為黑格爾寫下一段評語:“健康狀況不佳,中等身材,不善辭令,沉默寡言,天賦高,判斷力健全,記憶力強,文字通順,作風(fēng)正派,有時不太用功,神學(xué)有成績,雖然嘗試講道不無熱情,但看來不是一名優(yōu)秀的傳教士。語言知識豐富,哲學(xué)上十分努力?!币?、從兩份載入史冊的評語說起1.黑格爾的老師對他的評價2.卡爾·馬克思《中學(xué)畢業(yè)證書》上的評語

一、操行:對待師長和同學(xué)態(tài)度良好。二、才能和勤勉:該生才能優(yōu)異,在古代語、德語和歷史課方面表現(xiàn)了十分令人滿意的勤勉,在數(shù)學(xué)課方面是令人滿意的勤勉;只是在法語方面稍為勤勉。2.卡爾·馬克思《中學(xué)畢業(yè)證書》上的評語三、知識和成績1.語言(1)德語:語法知識和作文都很好。(2)拉丁文:無需準(zhǔn)備就能熟練、細(xì)致地翻譯和解釋中學(xué)選讀的古典作品中比較容易的段落,經(jīng)過適當(dāng)準(zhǔn)備或稍作輔導(dǎo)后,常常能熟練、細(xì)致地翻譯與解釋較難的讀物,尤其是語言本身并不太難和所涉及的事物和思想內(nèi)容都較難懂的讀物。他的作文就內(nèi)容而言,既富于思想,又對事物有深刻的了解,但時常過于冗長,在掌握拉丁文方面達(dá)到了令人相當(dāng)滿意的熟練的程度。三、知識和成績(3)希臘文:對中學(xué)選讀的古典作品的理解,其知識和熟練程度同拉丁文不相上下。(4)法語:語法知識相當(dāng)好,略加輔導(dǎo)就能讀較難的作品??谡Z表述方面達(dá)到了一定的熟練程度。2.學(xué)科(1)宗教知識:對基督教的教義和自誡相當(dāng)清楚,能很好地論證;對基督教的歷史也有一定的了解。(2)數(shù)學(xué):有豐富的知識。(3)歷史和地理:總的來說,具有相當(dāng)令人滿意的知識。(4)物理:知識中等。(3)希臘文:對中學(xué)選讀的古典作品的理解,其知識和熟練程度同因此,本委員會衷心希望將由于得天獨厚而獲得應(yīng)有的美好前程。學(xué)??荚囄瘑T會思維豐富,文學(xué)結(jié)構(gòu)嚴(yán)謹(jǐn),然而有追求與眾不同的形象用語的傾向?!iL維登巴赫因此,本委員會衷心希望將由于得天獨厚而獲得應(yīng)有的美好前程。反思1.我們能為學(xué)生寫出同樣的全面中肯的評語嗎?2.評語是怎樣做出的?3.什么是教育測量與評價?反思1.我們能為學(xué)生寫出同樣的全面中肯的評語嗎?1.我們能為學(xué)生寫出同樣的全面中肯的評語嗎?任何一個普通的老師,都完全能夠看到每一個學(xué)生全面的發(fā)展和特點。如果讓一個老師自主地、自由地對任何一個學(xué)生作出評價,我相信他們都完全可以作出全面的恰當(dāng)?shù)脑u價而不失分寸。那么,是什么東西屏蔽了全體教師的眼光呢?是什么東西不讓這些教師看到學(xué)生的全面發(fā)展呢?無疑就是我們的教育部門的官僚主義和行政取向。領(lǐng)導(dǎo)們那么忙,怎么能夠看到學(xué)生全面的發(fā)展和特點呢?他們也不需要看到、不愿意看到。他們只需要分?jǐn)?shù)!分?jǐn)?shù),多么簡單而好使!1.我們能為學(xué)生寫出同樣的全面中肯的評語嗎?任何一個普通的我們的教育體制表現(xiàn)出兩個特點。一是應(yīng)試主義,只看到考試成績,看不到學(xué)生其它方面的發(fā)展;二是官僚主義和行政取向。正因為教育部門廣泛而深入的官僚主義和行政取向,才造成了一切向分?jǐn)?shù)看的體制。我們的教育體制表現(xiàn)出兩個特點。一是應(yīng)試主義,只看到考試成績,所以說,我們厭倦了應(yīng)試教育這么多年,批評應(yīng)試教育這么多年,一點進(jìn)展也沒有,原因就在于我們竟然沒有看到應(yīng)試教育是怎樣來的。怎么這么多年來沒有人發(fā)現(xiàn)應(yīng)試教育完全是來源于教育部門廣泛而深入的官僚主義與行政取向!教育部門的官僚主義和行政取向?qū)е铝藨?yīng)試教育,這種“異化”的組合一道忽略和抹殺了我們的學(xué)生的生動活潑的天性、豐富多彩的創(chuàng)造性、無限的發(fā)展?jié)撃堋瓍s只需要易于管理的升學(xué)率、需要服從、聽話、刻板、機(jī)械的品質(zhì)。在簡單管理的官僚主義和行政取向的“升學(xué)率”的指揮棒下,全體師生只能服從、聽命,于是高強度的“題海戰(zhàn)術(shù)”,鋪天蓋地的大考小考,永遠(yuǎn)的死記硬背,從小學(xué)的6年,再到中學(xué)的6年……所以才出現(xiàn)今天高校的“陰盛陽衰”現(xiàn)象。所以說,我們厭倦了應(yīng)試教育這么多年,批評應(yīng)試教育這么多年,一2.評語是怎樣做出的?評語是一種非常重要的教育評價。教育評價是依據(jù)教育測量、行為觀測、綜合考察的結(jié)果做出的。2.評語是怎樣做出的?評語是一種非常重要的教育評價。3.什么是教育測量與評價?對受教育者并且同時也對教育者的行為進(jìn)行標(biāo)準(zhǔn)化的量化分析,從而作出客觀的科學(xué)的評價。標(biāo)準(zhǔn)化:(1)測量過程的標(biāo)準(zhǔn)化;(2)領(lǐng)域參照和常模參照標(biāo)準(zhǔn)。量化分析:(1)掌握水平:學(xué)業(yè)成績;(2)標(biāo)準(zhǔn)分(Z,T,IQ,等等)對受教育者:因材施教。對教育者:促進(jìn)教育發(fā)展。3.什么是教育測量與評價?對受教育者并且同時也對教育者的行國外對學(xué)校教育質(zhì)量的評價Horwitz(1979):學(xué)業(yè)成績、自我概念、對學(xué)校的態(tài)度、創(chuàng)造力、獨立性與順從性、好奇感、憂慮與調(diào)節(jié)、控制點、互助性。Hedges等人(1981):成就動機(jī)、調(diào)節(jié)、憂慮、對學(xué)校的態(tài)度、對老師的態(tài)度、互助性、創(chuàng)造力、好奇感、一般思維能力、獨立性與自立性、控制點、自我概念、語言能力、數(shù)學(xué)成績等學(xué)業(yè)成績。國外對學(xué)校教育質(zhì)量的評價Horwitz(197二、從最早的教育測量到今天的教育測量:回顧與反思正是中國孕育了世界上最早的教育測量。在測量史上,世界公認(rèn)人類最早出現(xiàn)的教育測驗,是在中國發(fā)現(xiàn)的。公元前2200年,大禹對官員每三年一次進(jìn)行能力測驗,作為晉升或罷免的依據(jù)。這可以說是人類最早出現(xiàn)的教育測驗。并且,有史料可循的中國漢朝出現(xiàn)的文官選拔考試,也是比西方早了一千多年。漢武帝(公元前156年-公元前87年)時,興辦太學(xué),并開科取士,及至隋唐成為制度。而在歐洲,大學(xué)里出現(xiàn)正式考試是公元1219年的事,文官考試則更是要到1833年后。二、從最早的教育測量到今天的教育測量:回顧與反思正是中國孕育1.中國人這項最早的創(chuàng)新意義何在?大家不要低估了開科取士的偉大意義,這種創(chuàng)舉:一是使用了測量的方法和心理選拔的策略,從而能夠真正公平地選拔到合適的人才,使人力資源的配置達(dá)到優(yōu)化;二是廣開了才路,使有能力的寒門子弟也能夠晉升,為國家效勞,從而開發(fā)了國力。歷史已經(jīng)檢驗了這種創(chuàng)舉的“實證效度”,漢武帝時中國的強盛就能說明問題,漢武帝于是也成了“雄才大略”的一代雄君。所以,其意義比美軍使用“陸軍A、B種智力測驗”還值得稱道。

1.中國人這項最早的創(chuàng)新意義何在?大家不要低估了開科取士的2.為何到后來反而成了僵化的體制?從晚清腐敗的科學(xué)考試今天的應(yīng)試教育。2.為何到后來反而成了僵化的體制?從晚清腐敗的科學(xué)考試3.教育與國家發(fā)展究竟有多大關(guān)系?3.教育與國家發(fā)展究竟有多大關(guān)系?三、信度的原理與方法1.信度的意義假設(shè)有人前幾天給你量過身高,你的身高是175厘米。今天再次給你量了身高,你的身高是165厘米。你作何感想?

根據(jù)這樣的測量,請問,你究竟是多高?你能夠下結(jié)論嗎?顯然,測量誤差很大的測量結(jié)果,是不能夠給出結(jié)論的。三、信度的原理與方法1.信度的意義5位教師對一位學(xué)生的作文評分的結(jié)果是:90、20、70、10、30;請問,這樣的評分能夠相信嗎?

評分從10分到90分,彼此相差太大,評分者信度是很低的。在這樣的情況下,能夠?qū)W(xué)生作出可靠的結(jié)論嗎?評分者信度低,說明教師們或者對評分標(biāo)準(zhǔn)有不同的理解,或者對學(xué)生存有偏見。也就是說,5位教師的評價存在很大的誤差,這樣是不能夠?qū)W(xué)生做出客觀可靠的結(jié)論的。否則就是草菅人命。5位教師對一位學(xué)生的作文評分的結(jié)果是:90、20、70、102.信度的計算信度常以相關(guān)系數(shù)表示:

例如,50個被試第一次測驗與相隔一周后的第二次同樣的測驗,兩次測驗成績的相關(guān)系數(shù)r為0.85。這個相關(guān)系數(shù)表示的是重測信度。有5種信度(重測信度、復(fù)本信度、分半信度、內(nèi)部一致性信度和評分者信度)算法。2.信度的計算信度常以相關(guān)系數(shù)表示:各種信度的含義

信度要說明的問題取樣特點重測信度第一次測驗與第二次測驗是否一致?在不同時間取樣穩(wěn)定性系數(shù)復(fù)本信度不同的復(fù)本在同時或不同時測驗時是否一致?對內(nèi)容與時間取樣等值性及穩(wěn)定性系數(shù)分半信度測驗分為兩半時是否一致?對內(nèi)容取樣同質(zhì)性系數(shù)內(nèi)部一致性系數(shù)測驗的內(nèi)部各個項目之間是否一致?對內(nèi)容取樣同質(zhì)性系數(shù)評分者信度不同的評分者之間的評分一致性如何嗎?對評分者取樣評分者一致性系數(shù)各種信度的含義信度要說明的問題取樣特點重測信度第一次測驗與四、內(nèi)容效度問題通俗地說,或者從字詞的意義上說,內(nèi)容效度就是從測驗的內(nèi)容方面去檢驗測驗的效度。內(nèi)容效度主要去考察被試過去學(xué)得怎么樣和做得怎么樣。內(nèi)容效度檢驗一個測驗是否包括足夠的行為樣本并且有適當(dāng)?shù)谋壤峙?。一是要有足夠的覆蓋面,二是分配的比例必須適當(dāng)。四、內(nèi)容效度問題通俗地說,或者從字詞的意義上說,內(nèi)容效度就是假如關(guān)于高一期末考試的試卷出現(xiàn)爭議?假如關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論