![第四章 教育測量的質(zhì)量指標(biāo)-效度_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/c3136b8f-e2ea-49cf-899f-17be9269babc/c3136b8f-e2ea-49cf-899f-17be9269babc1.gif)
![第四章 教育測量的質(zhì)量指標(biāo)-效度_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/c3136b8f-e2ea-49cf-899f-17be9269babc/c3136b8f-e2ea-49cf-899f-17be9269babc2.gif)
![第四章 教育測量的質(zhì)量指標(biāo)-效度_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/c3136b8f-e2ea-49cf-899f-17be9269babc/c3136b8f-e2ea-49cf-899f-17be9269babc3.gif)
![第四章 教育測量的質(zhì)量指標(biāo)-效度_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/c3136b8f-e2ea-49cf-899f-17be9269babc/c3136b8f-e2ea-49cf-899f-17be9269babc4.gif)
![第四章 教育測量的質(zhì)量指標(biāo)-效度_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/c3136b8f-e2ea-49cf-899f-17be9269babc/c3136b8f-e2ea-49cf-899f-17be9269babc5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一、效度的意義一、效度的意義 效度(效度(ValidityValidity)測量結(jié)果測量結(jié)果的的準(zhǔn)確性準(zhǔn)確性和和有效性有效性的的程度程度 一個測驗(yàn)或量表實(shí)際能測出其所要測量的特性的程度 記為:r rxyxy一、效度的意義一、效度的意義 第一,效度始終是針對一定的測量目的而言的。第一,效度始終是針對一定的測量目的而言的。 第二,效度是針對測量結(jié)果而言的。第二,效度是針對測量結(jié)果而言的。 第三,效度只有高或低的程度上的差異。第三,效度只有高或低的程度上的差異。 第四,評價一個測量是否有效要多角度、多方第四,評價一個測量是否有效要多角度、多方面地收集證據(jù)。面地收集證據(jù)。 第五,教育測量中,效度問題比
2、在其他領(lǐng)域的第五,教育測量中,效度問題比在其他領(lǐng)域的測量中更為重要。測量中更為重要。一、效度的概念一、效度的概念 這是因?yàn)椋哼@是因?yàn)椋?教育測量的對象大多是精神現(xiàn)象,只能通過對其教育測量的對象大多是精神現(xiàn)象,只能通過對其具有可測性的外部表現(xiàn)(如語言或動作等)的測量,具有可測性的外部表現(xiàn)(如語言或動作等)的測量,以間接認(rèn)識其心理活動、心理特征或知識水平等。以間接認(rèn)識其心理活動、心理特征或知識水平等。 學(xué)生的心理活動、心理特征與其外部表現(xiàn)之間,學(xué)生的心理活動、心理特征與其外部表現(xiàn)之間,一般僅具有相關(guān)關(guān)系而無函數(shù)關(guān)系,外部行為并不一般僅具有相關(guān)關(guān)系而無函數(shù)關(guān)系,外部行為并不能準(zhǔn)確無誤地反映某種心理狀
3、態(tài)。能準(zhǔn)確無誤地反映某種心理狀態(tài)。 教育測量的對象不是物而是有主觀能動性的人。教育測量的對象不是物而是有主觀能動性的人。人能有意識地調(diào)節(jié)自己的外部行為,掩蓋自己的內(nèi)人能有意識地調(diào)節(jié)自己的外部行為,掩蓋自己的內(nèi)心活動,這就增加了認(rèn)識其精神現(xiàn)象的難度。心活動,這就增加了認(rèn)識其精神現(xiàn)象的難度。二、效度的統(tǒng)計定義及其與信度的關(guān)系二、效度的統(tǒng)計定義及其與信度的關(guān)系1 1、效度的統(tǒng)計學(xué)原理、效度的統(tǒng)計學(xué)原理w在實(shí)際測量中,影響效度的主要因素是系統(tǒng)誤差。在實(shí)際測量中,影響效度的主要因素是系統(tǒng)誤差。因而在討論效度時,還必須把真分?jǐn)?shù)方差分解為兩因而在討論效度時,還必須把真分?jǐn)?shù)方差分解為兩個部分,一是潛在真分?jǐn)?shù)方
4、差(個部分,一是潛在真分?jǐn)?shù)方差(V V2 2),另一部分),另一部分是系統(tǒng)誤差分?jǐn)?shù)方差(是系統(tǒng)誤差分?jǐn)?shù)方差(I I2 2) ,它與由隨機(jī)誤差引,它與由隨機(jī)誤差引起的變異(起的變異(E E2 2)不同。)不同。) 22() 12(2222222公式因而,公式EIVxIVT公式即:)之比,)實(shí)得分?jǐn)?shù)方差(潛在真分?jǐn)?shù)方差(定義為所以可以將效度222222222222x2V) 32(1)(xIxxxEIxEIxxVxyxyrrr2 2、效度與信度的關(guān)系、效度與信度的關(guān)系V2I2E2V2I2E2V2I2E2根據(jù)公式(根據(jù)公式(2-22-2)和()和(2-32-3),可將效度與信度的關(guān)),可將效度與信度的
5、關(guān)系圖解于后:系圖解于后:根據(jù)分析,可得結(jié)論如下根據(jù)分析,可得結(jié)論如下:1)1)高信度是高效度的必要條高信度是高效度的必要條件,而非充分條件。件,而非充分條件。2)2)效度系數(shù)不會大于信度系數(shù)的效度系數(shù)不會大于信度系數(shù)的平方根。平方根??梢杂孟率奖硎荆嚎梢杂孟率奖硎荆海┕剑?2xxxyrr高效度、高信度高效度、高信度低效度、高信度低效度、高信度低效度、低信度低效度、低信度三、效度的類別與分析驗(yàn)證法三、效度的類別與分析驗(yàn)證法 19741974年美國心理學(xué)會發(fā)行的年美國心理學(xué)會發(fā)行的教育和心教育和心理測量的標(biāo)準(zhǔn)理測量的標(biāo)準(zhǔn)一書將效度分為三大類:一書將效度分為三大類: 內(nèi)容效度:側(cè)重于測驗(yàn)題目取樣
6、的代表性,內(nèi)容效度:側(cè)重于測驗(yàn)題目取樣的代表性,考查這些題目對所欲測量的內(nèi)容和行為反應(yīng)考查這些題目對所欲測量的內(nèi)容和行為反應(yīng)測量的有效程度。測量的有效程度。 結(jié)構(gòu)效度:側(cè)重于一個測驗(yàn)的能夠測量到心結(jié)構(gòu)效度:側(cè)重于一個測驗(yàn)的能夠測量到心理學(xué)和教學(xué)理論上的抽象概念和特質(zhì)的程度。理學(xué)和教學(xué)理論上的抽象概念和特質(zhì)的程度。 效標(biāo)效度:側(cè)重于測驗(yàn)分?jǐn)?shù)預(yù)測我們所關(guān)心效標(biāo)效度:側(cè)重于測驗(yàn)分?jǐn)?shù)預(yù)測我們所關(guān)心的外在行為的準(zhǔn)確程度。的外在行為的準(zhǔn)確程度。三、效度的類別與分析驗(yàn)證法三、效度的類別與分析驗(yàn)證法 琳恩和格朗蘭德提出效度的四個向度,琳恩和格朗蘭德提出效度的四個向度,即內(nèi)容即內(nèi)容內(nèi)容效度、效標(biāo)關(guān)聯(lián)效度、構(gòu)想內(nèi)
7、容效度、效標(biāo)關(guān)聯(lián)效度、構(gòu)想效度和效度和結(jié)果效度結(jié)果效度。(一)內(nèi)容效度及其分析方法(一)內(nèi)容效度及其分析方法 內(nèi)容效度內(nèi)容效度(Content validityContent validity)又稱合理效度或邏輯程度,是指測驗(yàn)內(nèi)容或行又稱合理效度或邏輯程度,是指測驗(yàn)內(nèi)容或行為取樣的代表性和適當(dāng)程度;即實(shí)測內(nèi)容和預(yù)為取樣的代表性和適當(dāng)程度;即實(shí)測內(nèi)容和預(yù)定測驗(yàn)內(nèi)容之間的一致性程度。定測驗(yàn)內(nèi)容之間的一致性程度。 估計內(nèi)容效度的方法:估計內(nèi)容效度的方法: 邏輯分析法(定性的方法)邏輯分析法(定性的方法) 統(tǒng)計分析法(定量的方法)統(tǒng)計分析法(定量的方法)(一)內(nèi)容效度及其分析方法(一)內(nèi)容效度及其分析
8、方法 邏輯分析法(定性的方法)邏輯分析法(定性的方法) 依據(jù)教材內(nèi)容、教學(xué)大綱的范圍以及教學(xué)目標(biāo)分析測驗(yàn)內(nèi)容,依據(jù)教材內(nèi)容、教學(xué)大綱的范圍以及教學(xué)目標(biāo)分析測驗(yàn)內(nèi)容,檢查測驗(yàn)內(nèi)容究竟在體現(xiàn)教材內(nèi)容和教學(xué)目標(biāo)方面達(dá)到多大程檢查測驗(yàn)內(nèi)容究竟在體現(xiàn)教材內(nèi)容和教學(xué)目標(biāo)方面達(dá)到多大程度度 對每一道題目逐一進(jìn)行審查,以此形成對每一道題目逐一進(jìn)行審查,以此形成“題目雙向細(xì)目表題目雙向細(xì)目表” 與與“命題雙向細(xì)目表命題雙向細(xì)目表”加以對照,以確定試卷的效度加以對照,以確定試卷的效度 統(tǒng)計分析法(定量的方法)統(tǒng)計分析法(定量的方法) 克龍巴赫法(兩套測驗(yàn)試題,對相同被試實(shí)施測試后,計算得克龍巴赫法(兩套測驗(yàn)試題,
9、對相同被試實(shí)施測試后,計算得分的相關(guān)系數(shù))分的相關(guān)系數(shù)) 評分一致性考查法(不同評分者之間評分的一致性程度,即考評分一致性考查法(不同評分者之間評分的一致性程度,即考查評分者信度)查評分者信度) 前后測對比法(根據(jù)前后兩次測驗(yàn)的差異顯著性,確定測驗(yàn)的前后測對比法(根據(jù)前后兩次測驗(yàn)的差異顯著性,確定測驗(yàn)的內(nèi)容效度)內(nèi)容效度)(二)結(jié)構(gòu)效度的驗(yàn)證方法(二)結(jié)構(gòu)效度的驗(yàn)證方法 結(jié)構(gòu)效度結(jié)構(gòu)效度是指一個測量能實(shí)際測量出理論上的是指一個測量能實(shí)際測量出理論上的構(gòu)想或心理特性的程度。它的目的在于用心理構(gòu)想或心理特性的程度。它的目的在于用心理學(xué)的概念來說明分析測驗(yàn)分?jǐn)?shù)的意義,也就是學(xué)的概念來說明分析測驗(yàn)分?jǐn)?shù)
10、的意義,也就是說從心理學(xué)的理論觀點(diǎn)就測驗(yàn)的結(jié)果加以解釋說從心理學(xué)的理論觀點(diǎn)就測驗(yàn)的結(jié)果加以解釋和探討。和探討。 這里的這里的結(jié)構(gòu)結(jié)構(gòu)的含義是心理學(xué)理論所涉及的抽象的含義是心理學(xué)理論所涉及的抽象而屬假設(shè)性的概念、構(gòu)想、特性或變量,如智而屬假設(shè)性的概念、構(gòu)想、特性或變量,如智力、焦慮、機(jī)械能力傾向、成就、動機(jī)等。力、焦慮、機(jī)械能力傾向、成就、動機(jī)等。(二)結(jié)構(gòu)效度的驗(yàn)證方法(二)結(jié)構(gòu)效度的驗(yàn)證方法 建立理論框架建立理論框架 從理論框架出發(fā),提出各種假設(shè)從理論框架出發(fā),提出各種假設(shè) 根據(jù)假設(shè)編制測驗(yàn)根據(jù)假設(shè)編制測驗(yàn) 以邏輯及實(shí)證的方法,檢驗(yàn)結(jié)果是否符合心理學(xué)的理以邏輯及實(shí)證的方法,檢驗(yàn)結(jié)果是否符合心
11、理學(xué)的理論框架及其假設(shè)論框架及其假設(shè) 比如:中學(xué)生數(shù)學(xué)能力的研究比如:中學(xué)生數(shù)學(xué)能力的研究 數(shù)學(xué)能力由分析能力、綜合能力、歸納和演繹能力、數(shù)學(xué)能力由分析能力、綜合能力、歸納和演繹能力、運(yùn)算能力、空間想象能力構(gòu)成;數(shù)學(xué)能力與早期教運(yùn)算能力、空間想象能力構(gòu)成;數(shù)學(xué)能力與早期教育有關(guān);數(shù)學(xué)能力與智力正相關(guān)。育有關(guān);數(shù)學(xué)能力與智力正相關(guān)。 編制測驗(yàn),施測并收集測驗(yàn)結(jié)果編制測驗(yàn),施測并收集測驗(yàn)結(jié)果 分析測驗(yàn)結(jié)果,考查測試的結(jié)構(gòu)效度,考查測驗(yàn)結(jié)分析測驗(yàn)結(jié)果,考查測試的結(jié)構(gòu)效度,考查測驗(yàn)結(jié)果是否支持理論構(gòu)想果是否支持理論構(gòu)想(三)效標(biāo)關(guān)聯(lián)效度的估計方法(三)效標(biāo)關(guān)聯(lián)效度的估計方法 效標(biāo):檢驗(yàn)測驗(yàn)效度的外在的
12、、客觀的標(biāo)準(zhǔn),效標(biāo):檢驗(yàn)測驗(yàn)效度的外在的、客觀的標(biāo)準(zhǔn),即效度的標(biāo)準(zhǔn)即效度的標(biāo)準(zhǔn) 效標(biāo)效度,也稱為效標(biāo)關(guān)聯(lián)效度,也稱為實(shí)證效標(biāo)效度,也稱為效標(biāo)關(guān)聯(lián)效度,也稱為實(shí)證效度效度 驗(yàn)證方法是指一個測驗(yàn)對處于特定情境中的個驗(yàn)證方法是指一個測驗(yàn)對處于特定情境中的個體行為進(jìn)行預(yù)測時的有效性體行為進(jìn)行預(yù)測時的有效性 例:例: 高考成績預(yù)測大學(xué)學(xué)習(xí)成績高考成績預(yù)測大學(xué)學(xué)習(xí)成績 能力傾向測驗(yàn)預(yù)測工作成效能力傾向測驗(yàn)預(yù)測工作成效(三)效標(biāo)關(guān)聯(lián)效度的估計方法(三)效標(biāo)關(guān)聯(lián)效度的估計方法 分類:分類: 同時效度:測驗(yàn)分?jǐn)?shù)與效標(biāo)資料的取得約在同一時同時效度:測驗(yàn)分?jǐn)?shù)與效標(biāo)資料的取得約在同一時間內(nèi)連續(xù)完成,這兩種資料的相關(guān)系
13、數(shù)即為同時效間內(nèi)連續(xù)完成,這兩種資料的相關(guān)系數(shù)即為同時效度度 目的:診斷現(xiàn)狀目的:診斷現(xiàn)狀用全國高考的成績作為效標(biāo)來檢驗(yàn)高中畢業(yè)生會考的成績,計用全國高考的成績作為效標(biāo)來檢驗(yàn)高中畢業(yè)生會考的成績,計算兩者之間的相關(guān)系數(shù)就是會考的同時效度算兩者之間的相關(guān)系數(shù)就是會考的同時效度 預(yù)測效度:測驗(yàn)分?jǐn)?shù)取得一段時間后才獲得效標(biāo)資預(yù)測效度:測驗(yàn)分?jǐn)?shù)取得一段時間后才獲得效標(biāo)資料,計算這兩種資料間的相關(guān)系數(shù)料,計算這兩種資料間的相關(guān)系數(shù) 目的:預(yù)測某個個體將來的行為目的:預(yù)測某個個體將來的行為而用大學(xué)一年級的成績作為效標(biāo)來檢驗(yàn)高考的成績,計算兩者而用大學(xué)一年級的成績作為效標(biāo)來檢驗(yàn)高考的成績,計算兩者的相關(guān)系數(shù)
14、就是高考的預(yù)測效度。的相關(guān)系數(shù)就是高考的預(yù)測效度。效標(biāo)效度的估計方法 相關(guān)法相關(guān)法直接計算測驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)系數(shù)直接計算測驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)系數(shù) 積差相關(guān)、等級相關(guān)、二列相關(guān)等積差相關(guān)、等級相關(guān)、二列相關(guān)等 顯著差異法顯著差異法根據(jù)效標(biāo)測量將被試分為兩個極端組,檢驗(yàn)這兩個組測驗(yàn)分?jǐn)?shù)是根據(jù)效標(biāo)測量將被試分為兩個極端組,檢驗(yàn)這兩個組測驗(yàn)分?jǐn)?shù)是否具有統(tǒng)計學(xué)上的差異顯著性否具有統(tǒng)計學(xué)上的差異顯著性 命中率命中率當(dāng)測驗(yàn)用作取舍決策時,常使用命中率當(dāng)測驗(yàn)用作取舍決策時,常使用命中率相關(guān)概念:總命中率、正命中率、負(fù)命中率相關(guān)概念:總命中率、正命中率、負(fù)命中率總命中率高,則測試的效度高總命中率高,則
15、測試的效度高例:例: 7070人參加的考試,通過測驗(yàn)選取了人參加的考試,通過測驗(yàn)選取了5050人,淘汰了人,淘汰了2020人;選出的人中有人;選出的人中有4040人合格,淘汰的人中有人合格,淘汰的人中有8 8人不合格。該測驗(yàn)的總命中率、正命中率人不合格。該測驗(yàn)的總命中率、正命中率和負(fù)命中率分別是多少?和負(fù)命中率分別是多少?1 1、用積差相關(guān)系數(shù)的方法估計效度、用積差相關(guān)系數(shù)的方法估計效度 積差相關(guān)積差相關(guān),是計算兩個變量線性相關(guān)的一種方法,由英國統(tǒng)計,是計算兩個變量線性相關(guān)的一種方法,由英國統(tǒng)計學(xué)家學(xué)家皮爾遜皮爾遜提出,因此也稱為皮爾遜提出,因此也稱為皮爾遜(Pearson)(Pearson)
16、相關(guān)。要使用相關(guān)。要使用積差相關(guān)必須同時積差相關(guān)必須同時具備如下幾個條件具備如下幾個條件: 兩個變量都是由測量獲得的連續(xù)性數(shù)據(jù),即等距或等比數(shù)據(jù)。兩個變量都是由測量獲得的連續(xù)性數(shù)據(jù),即等距或等比數(shù)據(jù)。 兩個變量的總體都呈正態(tài)分布,或接近正態(tài)分布,至少是單兩個變量的總體都呈正態(tài)分布,或接近正態(tài)分布,至少是單峰對稱分布,當(dāng)然樣本并不一定要正態(tài)。峰對稱分布,當(dāng)然樣本并不一定要正態(tài)。 必須是成對的數(shù)據(jù),而且每對數(shù)據(jù)之間是相互獨(dú)立的,即各必須是成對的數(shù)據(jù),而且每對數(shù)據(jù)之間是相互獨(dú)立的,即各自互不影響,本條件是難以檢驗(yàn)的。自互不影響,本條件是難以檢驗(yàn)的。 兩個變量之間呈線性關(guān)系。一般用描繪散點(diǎn)圖的方式來觀
17、察,兩個變量之間呈線性關(guān)系。一般用描繪散點(diǎn)圖的方式來觀察,最好是先各自轉(zhuǎn)化為最好是先各自轉(zhuǎn)化為Z Z分?jǐn)?shù),單位會統(tǒng)一些。分?jǐn)?shù),單位會統(tǒng)一些。例:例: 某中學(xué)數(shù)學(xué)教研組的教師積多年的教學(xué)法經(jīng)驗(yàn),認(rèn)為剛?cè)肽持袑W(xué)數(shù)學(xué)教研組的教師積多年的教學(xué)法經(jīng)驗(yàn),認(rèn)為剛?cè)敫咧械膶W(xué)生學(xué)習(xí)立體幾何感到困難的主要原因是空間想像力高中的學(xué)生學(xué)習(xí)立體幾何感到困難的主要原因是空間想像力弱。弱。 為了證明這個論點(diǎn),他們讓剛?cè)敫咧械臑榱俗C明這個論點(diǎn),他們讓剛?cè)敫咧械?03103名學(xué)生作名學(xué)生作1010道道題,測量其空間想像力。為避免知道了某些學(xué)生的剛?cè)敫咧蓄},測量其空間想像力。為避免知道了某些學(xué)生的剛?cè)敫咧袝r的成績影響以后考試的評
18、分,試卷暫不評閱。立體幾何學(xué)時的成績影響以后考試的評分,試卷暫不評閱。立體幾何學(xué)完后,進(jìn)行考試,按得分多少把成績分為五等(完后,進(jìn)行考試,按得分多少把成績分為五等(A A、B B、C C、D D、E E)分別得)分別得5 5、4 4、3 3、2 2、1 1分。這時才評閱入學(xué)時的試卷,統(tǒng)分。這時才評閱入學(xué)時的試卷,統(tǒng)計出期末得計出期末得5 5、4 4、3 3、2 2、1 1分者在入學(xué)測驗(yàn)中分別答對分者在入學(xué)測驗(yàn)中分別答對1 1道題道題至至1010道題的人數(shù)(見表道題的人數(shù)(見表2-12-1)。)。 就現(xiàn)有資料,用什么方法可以判斷教師們的意見是否正確?就現(xiàn)有資料,用什么方法可以判斷教師們的意見是否
19、正確?表2-1:(答對的題數(shù))1 2 3 4 5 6 7 8 9 10 所評的等級ABCDE54321 1 3 10 5 4 2 1 6 8 8 4 3 1 2 4 5 9 8 3 1w1 3 2 1 11 1 2 1 1解:(1)設(shè)期末考試的等第為y,空間想像力測驗(yàn)答對的題數(shù)為x,列出二重交叉次數(shù)分布表:X(答對的題數(shù))1 2 3 4 5 6 7 8 9 10 Y所評的等級ABCDE54321 1 3 10 5 4 2 1 6 8 8 4 3 1 2 4 5 9 8 3 1w1 3 2 1 11 1 2 1 125313296合計2 4 10 14 20 20 17 9 5 2103(2)用
20、積差相關(guān)系數(shù)公式計算效度系數(shù):驗(yàn)的得分和的題數(shù)與期末測是指剛?cè)雽W(xué)測驗(yàn)中答對標(biāo)準(zhǔn)差。是期末測驗(yàn)各人得分的對題數(shù)的標(biāo)準(zhǔn)差,是剛?cè)雽W(xué)的測驗(yàn)各題答人得分平均數(shù),是期末測驗(yàn)中的人數(shù)的平均數(shù),道題道題到是剛?cè)雽W(xué)的測驗(yàn)中答對式中公式fxySSyxssyxNfxyryxyx103101)42(/12. 1/)(58. 3103619232331425510394. 1103/ )55. 510(2)55. 52(4)55. 51 (255. 5103210591034221101/)(22222 NyyfSSyySxxNxxfSSyyxxx標(biāo)準(zhǔn)差。是期末測驗(yàn)各人得分的)(人得分平均數(shù),是期末測驗(yàn)中)(道題的人
21、數(shù)的平均數(shù),道題到是剛?cè)雽W(xué)的測驗(yàn)中答對對題數(shù)的標(biāo)準(zhǔn)差,是剛?cè)雽W(xué)的測驗(yàn)各題答式中預(yù)測效度,前者對后者有一定的學(xué)習(xí)成績有較高的相關(guān)體幾何間想像力測驗(yàn)成績與立相關(guān)系數(shù)較大,表明空) 3(699. 012. 194. 158. 355. 5103/22032203) 15( 1) 510(2) 59(4) 58 ( 5) 57(10) 56( 3) 55( 1 xyrfxy二列相關(guān)二列相關(guān) 適用于兩個變量就其實(shí)際含義而言是適用于兩個變量就其實(shí)際含義而言是等距或等比數(shù)據(jù),它們服從正態(tài)分布,等距或等比數(shù)據(jù),它們服從正態(tài)分布,其中一列人為地劃分為兩類。其中一列人為地劃分為兩類。時的縱高。中從左到右概率值為指
22、的是在整個正態(tài)曲線。比,的次數(shù)占總次數(shù)的百分是二分稱名量表中一種量值的標(biāo)準(zhǔn)差。是該例連續(xù)變量全部變平均數(shù)?!毕鄬?yīng)的連續(xù)變量的”或“是二分名稱變量中“或公式pypqpSXXypqSXXrtqptqpb1015)-(2 點(diǎn)二列相關(guān)點(diǎn)二列相關(guān) 適用于一列數(shù)據(jù)為等距或等比且總體服從正態(tài)分布(實(shí)適用于一列數(shù)據(jù)為等距或等比且總體服從正態(tài)分布(實(shí)際上只需要單峰對稱分布,如分布),另一列變量是際上只需要單峰對稱分布,如分布),另一列變量是按事物的性質(zhì)劃分為兩類的變量,也可以是一個雙峰分按事物的性質(zhì)劃分為兩類的變量,也可以是一個雙峰分布,人為劃分為兩類,如文盲與非文盲。這種相關(guān)系數(shù)布,人為劃分為兩類,如文盲與
23、非文盲。這種相關(guān)系數(shù)多用于測驗(yàn)中評價題目的區(qū)分度。對選擇題、判斷題在多用于測驗(yàn)中評價題目的區(qū)分度。對選擇題、判斷題在整個測量中作用作出判斷。整個測量中作用作出判斷。 基本計算公式:基本計算公式:。比,的次數(shù)占總次數(shù)的百分是二分稱名量表中一種量值的標(biāo)準(zhǔn)差。是該例連續(xù)變量全部變平均數(shù)。”相對應(yīng)的連續(xù)變量的”或“是二分名稱變量中“或公式pqpSXXpqSXXrtqptqppb1016)-(2 例:有一位教師自編了一套測驗(yàn)題,用來預(yù)測學(xué)生例:有一位教師自編了一套測驗(yàn)題,用來預(yù)測學(xué)生一年后的某科成績,自編測驗(yàn)按百分制評分,一年一年后的某科成績,自編測驗(yàn)按百分制評分,一年后考試評分只把學(xué)生分為及格者和不及
24、格者。試就后考試評分只把學(xué)生分為及格者和不及格者。試就所獲資料估計自編測驗(yàn)的預(yù)測效度。所獲資料估計自編測驗(yàn)的預(yù)測效度。 解:解:1)1)把兩次測驗(yàn)成績成對排列:把兩次測驗(yàn)成績成對排列:被試者被試者1 12 23 34 45 56 67 78 89 91010 1111121213131414自編測驗(yàn)自編測驗(yàn)的成績(的成績(X X)6767 1010 20 44 60 43 61 10 26 23 30 18 35 2320 44 60 43 61 10 26 23 30 18 35 23一年后考一年后考試成績(試成績(Y Y)1 1 1 0 0 1 1 0 1 0 0 1 1 11 1 1 0
25、 0 1 1 0 1 0 0 1 1 12)計算出二列相關(guān)公式所需統(tǒng)計量計算出二列相關(guān)公式所需統(tǒng)計量:績。不能用來預(yù)測學(xué)生的成極低,個測驗(yàn)結(jié)果的預(yù)測效度相關(guān)系數(shù)極小,說明這)代入公式計算得:。比,的次數(shù)占總次數(shù)的百分是二分稱名量表中一種量值的標(biāo)準(zhǔn)差。是該例連續(xù)變量全部變平均數(shù)。”相對應(yīng)的連續(xù)變量的”或“是二分名稱變量中“或公式0.007 36. 064. 0125.1840.3367.33336. 01,64. 01491125.1840.335302310604467.33923351067016)-(2 pbttqpqptqppbrpqppqpSSXXXXpqSXXr四、提高效度的方法四、
26、提高效度的方法 (一)各種效度系數(shù)的要求(一)各種效度系數(shù)的要求 (二)影響效度的因素(二)影響效度的因素 (三)提高效度的方法:(三)提高效度的方法: 1、控制系統(tǒng)誤差、控制系統(tǒng)誤差 2、精心編制量表、精心編制量表 3、妥善組織測驗(yàn)、妥善組織測驗(yàn) 4、擴(kuò)充樣本的容量和代表性、擴(kuò)充樣本的容量和代表性 5、合理處理效度和信度的關(guān)系、合理處理效度和信度的關(guān)系 6、適當(dāng)增加測驗(yàn)的長度適當(dāng)增加測驗(yàn)的長度表表2.1 測驗(yàn)長度與信度和效度的關(guān)系測驗(yàn)長度與信度和效度的關(guān)系題數(shù)題數(shù)與原測驗(yàn)題數(shù)之比與原測驗(yàn)題數(shù)之比信度系數(shù)信度系數(shù)效度系數(shù)效度系數(shù)1020306012014048012361214480.3000
27、.4620.5620.7200.8370.9110.9540.4000.4960.5480.6190.6680.6790.713第三節(jié) 難度及其計算 一、難度的概念一、難度的概念 1 1、難度是指測量試題的難易程度。、難度是指測量試題的難易程度。 在教育測量中,客觀題的難度一般用正確回在教育測量中,客觀題的難度一般用正確回答試題的人數(shù)與參加測驗(yàn)的總?cè)藬?shù)的比值來答試題的人數(shù)與參加測驗(yàn)的總?cè)藬?shù)的比值來表示。其公式為:表示。其公式為: 例如:在例如:在100100個學(xué)生中,答對第一題的個學(xué)生中,答對第一題的3030人,人,答對第二題的答對第二題的6060人,這兩道題的難度分別是人,這兩道題的難度分別
28、是多少?多少?NRp 2 2、難度對測驗(yàn)的影響、難度對測驗(yàn)的影響 1)測驗(yàn)難度影響分?jǐn)?shù)的分布形態(tài)。 難度值越接近0,測驗(yàn)的難度就越大,測驗(yàn)分?jǐn)?shù)就越是集中在低分端,其分?jǐn)?shù)分布越呈現(xiàn)正偏態(tài);反之,難度值越接近1.00,其難度就越小,測驗(yàn)分?jǐn)?shù)越集中在高分端,分?jǐn)?shù)分布呈負(fù)偏態(tài)。 2)測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的離散程度 測驗(yàn)難度過大過小,都會造成測驗(yàn)分?jǐn)?shù)偏離正態(tài)分布,從而使分?jǐn)?shù)的全距縮小,使測驗(yàn)分?jǐn)?shù)的離散程度變小。 3)測驗(yàn)難度影響測驗(yàn)的鑒別能力 在測驗(yàn)中,考生之間相互配對比較的可能性越多,就越有利于準(zhǔn)確地鑒別考生的不同能力。3 3、測驗(yàn)的適宜難度、測驗(yàn)的適宜難度 難度在難度在0.500.50左右的試題能組
29、成考生之間最多的左右的試題能組成考生之間最多的配對比較次數(shù),能使測驗(yàn)分?jǐn)?shù)的離散指數(shù)達(dá)到配對比較次數(shù),能使測驗(yàn)分?jǐn)?shù)的離散指數(shù)達(dá)到最大值,并能有效地造成測驗(yàn)分?jǐn)?shù)的正態(tài)性。最大值,并能有效地造成測驗(yàn)分?jǐn)?shù)的正態(tài)性。這有兩層意思:這有兩層意思: 一是測驗(yàn)中的各試題的難度,均應(yīng)在一是測驗(yàn)中的各試題的難度,均應(yīng)在0.500.50左右;左右; 二是測驗(yàn)中的試題的難度在二是測驗(yàn)中的試題的難度在0.2-0.80.2-0.8之間,平之間,平均難度應(yīng)在均難度應(yīng)在0.500.50左右。左右。二、難度的計算 (一)計算難度的基本公式(一)計算難度的基本公式 3 3、整個試卷的難度計算、整個試卷的難度計算 試卷的難度是指一
30、份試卷的總體難易程度,其試卷的難度是指一份試卷的總體難易程度,其由試卷中每道題的難度決定。由試卷中每道題的難度決定。 其計算辦法為:將每道題目的難度與滿分值相其計算辦法為:將每道題目的難度與滿分值相乘的積相加,然后將其總和除以試卷的滿分值,乘的積相加,然后將其總和除以試卷的滿分值,所得的商即為整個試卷的難度。所得的商即為整個試卷的難度。二、難度的計算 (一)計算難度的基本公式(一)計算難度的基本公式 1 1、客觀題難度的計算、客觀題難度的計算 NRp 2 2、主觀題難度的計算、主觀題難度的計算表示此題的滿分。)題上的平均得分,表示所有考生在某一道(KKXXp P表示難度指標(biāo),N表示參加考試的總
31、人數(shù),R表示答對某道客觀題的人數(shù)。(二)用極端分組法計算試題的難度(二)用極端分組法計算試題的難度 1 1、用極端分組法計算客觀題的難度、用極端分組法計算客觀題的難度 具體步驟如下:具體步驟如下: 1 1)先按測驗(yàn)總分的高低,按由高到低的順序依次排)先按測驗(yàn)總分的高低,按由高到低的順序依次排列試卷。列試卷。 2 2)從得分最高的一份試卷開始依次向下選出全部試)從得分最高的一份試卷開始依次向下選出全部試卷的卷的27%27%作為高分組;從得分最低的一份試卷開始依作為高分組;從得分最低的一份試卷開始依次向上選出全部試卷的次向上選出全部試卷的27%27%作為低分組。作為低分組。 3 3)按計算公式計算
32、難度)按計算公式計算難度為低分組的難度)為高分組的難度,(L2pppppHLH例題例題:在在100100名學(xué)生中,高分組與低分組名學(xué)生中,高分組與低分組各有各有2727人。其中高分組答對第一題的有人。其中高分組答對第一題的有2020人,低分組答對第一題的有人,低分組答對第一題的有1010人。這人。這道題的難度為多少?道題的難度為多少?計算計算 解:依據(jù)客觀題極端分組法計算公式解:依據(jù)客觀題極端分組法計算公式0.56 227102720 2LHppp2 2、用極端分組法計算論文試題難度、用極端分組法計算論文試題難度步驟如下:步驟如下:1 1)按測驗(yàn)得分排列試卷,確定高分組與低分組,)按測驗(yàn)得分排
33、列試卷,確定高分組與低分組,各占總?cè)藬?shù)的各占總?cè)藬?shù)的25%25%(方法同前)。(方法同前)。2 2)分別為高分組、低分組編制每道試題的分析表。)分別為高分組、低分組編制每道試題的分析表。3 3)按下列公式計算難度,)按下列公式計算難度,為最低分。是這道題的最高分,表示總?cè)藬?shù)的為低分組得分總和,為高分組得分總和,LH%25X)(22LnXLHnnLXXpHLH例:某道論文題,高分組得分總某道論文題,高分組得分總和為和為4040分,低分組得分總和為分,低分組得分總和為1515分,有分,有4040人參加考試,這道題最人參加考試,這道題最高得分為高得分為8 8分,最低得分為分,最低得分為2 2分,分,
34、則此題的難度為多少?則此題的難度為多少?(0.125)計算計算 解:依據(jù)主觀題極端分組法計算公式解:依據(jù)主觀題極端分組法計算公式 =0.125 28%254022%254021540 )(22LHnnLXXpLH第四節(jié)區(qū)分度及其計算 一、區(qū)分度的意義一、區(qū)分度的意義 (一)區(qū)分度(一)區(qū)分度(Discrimination)是指測驗(yàn)對考)是指測驗(yàn)對考生實(shí)際水平的區(qū)分程度,用符號生實(shí)際水平的區(qū)分程度,用符號D表示。又叫鑒表示。又叫鑒別力,它是評價試題質(zhì)量,篩選試題的主要指標(biāo)別力,它是評價試題質(zhì)量,篩選試題的主要指標(biāo)與依據(jù)。與依據(jù)。 區(qū)分又分為正(或積極)區(qū)分(區(qū)分又分為正(或積極)區(qū)分(D0),零
35、區(qū)分),零區(qū)分(D0)和負(fù)(或消極)區(qū)分()和負(fù)(或消極)區(qū)分(D0)。)。 區(qū)分度的高低直接影響到測驗(yàn)的信度和效度。區(qū)分度的高低直接影響到測驗(yàn)的信度和效度。(二)區(qū)分度與測驗(yàn)信度、難度的關(guān)系 1 1、區(qū)分度與信度的關(guān)系(見下表、區(qū)分度與信度的關(guān)系(見下表2.22.2) 這里是假定全部試題的難度均為這里是假定全部試題的難度均為0.500.50時所預(yù)測的信度系數(shù)。時所預(yù)測的信度系數(shù)。 區(qū)分度指的是平均值。區(qū)分度指的是平均值。 可見,要想達(dá)到理想的測驗(yàn)信度,提高區(qū)分度是一可見,要想達(dá)到理想的測驗(yàn)信度,提高區(qū)分度是一 個好辦法。個好辦法。區(qū)分度區(qū)分度信度信度0.12250.12250.160.160
36、.200.200.300.300.400.400.500.500.000.000.420.420.630.630.840.840.9150.9150.9490.949(二)區(qū)分度與難度的關(guān)系 表表2.32.3D D的最大值與試題難度的關(guān)系的最大值與試題難度的關(guān)系 由上表可知,難度適中,可使區(qū)分度達(dá)到最大值。由上表可知,難度適中,可使區(qū)分度達(dá)到最大值。難度難度區(qū)分度的最大值區(qū)分度的最大值1.001.00.90.90.70.70.50.50.30.30.10.10.00.00.00.00.20.20.60.601.001.00.60.60.20.200000二、區(qū)分度的計算 (一)用極端分組法計算
37、區(qū)分度(一)用極端分組法計算區(qū)分度 1、客觀題區(qū)分度的計算:、客觀題區(qū)分度的計算: DPH PL注:將被試依照總分從高到低排列,然后將總分最高的27%和最低的27%的被試分別定為高分組和低分組。) 2、主觀題區(qū)分度的計算:、主觀題區(qū)分度的計算:為最低分。是這道題的最高分,表示總?cè)藬?shù)的為低分組得分總和,為高分組得分總和,LH%25X)(LnXLHnXXDHLH二、區(qū)分度的計算 (一)用極端分組法計算區(qū)分度(一)用極端分組法計算區(qū)分度 1 1、客觀題區(qū)分度的計算:、客觀題區(qū)分度的計算: DPH PL(D D為區(qū)分度,為區(qū)分度,PhPh為高分組通過率,為高分組通過率,PlPl為低分組為低分組通過率。
38、)通過率。)(注:將被試依照總分從高到低排列,然后將總(注:將被試依照總分從高到低排列,然后將總分最高的分最高的27%27%和最低的和最低的27%27%的被試分別定為高分的被試分別定為高分組和低分組。)組和低分組。)二、區(qū)分度的計算二、區(qū)分度的計算 (一)用極端分組法計算區(qū)分度(一)用極端分組法計算區(qū)分度 3、整個試卷的區(qū)分度計算 試卷的區(qū)分度是指一份試卷總體對學(xué)生的區(qū)分程度。 其計算辦法為:將每道題目的區(qū)分度與滿分值相乘的積相加,然后將其總和除以試卷的滿分值,所得的商即為整個試卷的區(qū)分度。(二)用內(nèi)部一致性系數(shù)計算區(qū)分度(二)用內(nèi)部一致性系數(shù)計算區(qū)分度 極端分組法分析通常只在教師編制的課堂測
39、繪極端分組法分析通常只在教師編制的課堂測繪中使用。在標(biāo)準(zhǔn)化的或大規(guī)模的測驗(yàn)中,多采中使用。在標(biāo)準(zhǔn)化的或大規(guī)模的測驗(yàn)中,多采用相關(guān)法分析試題的內(nèi)部一致性。用相關(guān)法分析試題的內(nèi)部一致性。 由于測驗(yàn)總分屬于連續(xù)變量,測驗(yàn)項(xiàng)目(試題)由于測驗(yàn)總分屬于連續(xù)變量,測驗(yàn)項(xiàng)目(試題)多屬二分稱名變量(對、錯或通過、不通過),多屬二分稱名變量(對、錯或通過、不通過),所以,用相關(guān)法計算區(qū)分度時,多采用點(diǎn)二列所以,用相關(guān)法計算區(qū)分度時,多采用點(diǎn)二列相關(guān)、二列相關(guān)、相關(guān)、二列相關(guān)、系數(shù)等方法計算相關(guān)系數(shù)。系數(shù)等方法計算相關(guān)系數(shù)。P80P80頁第頁第1414題題某學(xué)科測驗(yàn),某學(xué)科測驗(yàn),1010名被試得分情況如表名被試
40、得分情況如表3-203-20所示:所示: 被試被試題目題目01 02 03 04 05 06 07 08 09 10123456782 2 0 2 0 0 2 0 2 20 2 2 0 2 0 0 2 0 20 0 2 2 2 0 2 0 0 00 2 0 0 2 0 0 2 2 05 7 4 6 6 2 4 5 3 46 5 5 4 7 1 6 2 4 511 14 9 10 16 5 12 8 10 1310 16 8 12 15 6 15 11 9 8P80P80頁第頁第1414題題某學(xué)科測驗(yàn),某學(xué)科測驗(yàn),1010名被試得分情況如表名被試得分情況如表3-203-20所示:所示: 1 1、
41、計算第、計算第1 1、5 5題的難度與區(qū)分度;題的難度與區(qū)分度; 2 2、用高低分組法計算第、用高低分組法計算第2 2、6 6的難度與的難度與區(qū)分度。區(qū)分度。 3 3、計算該測驗(yàn)的信度。、計算該測驗(yàn)的信度。P80P80頁第頁第1414題題某學(xué)科測驗(yàn),某學(xué)科測驗(yàn),1010名被試得分情況如表名被試得分情況如表3-203-20所示:所示: 被試被試題目題目01 02 03 04 05 06 07 08 09 10123456782 2 0 2 0 0 2 0 2 20 2 2 0 2 0 0 2 0 20 0 2 2 2 0 2 0 0 00 2 0 0 2 0 0 2 2 05 7 4 6 6 2
42、 4 5 3 46 5 5 4 7 1 6 2 4 511 14 9 10 16 5 12 8 10 1310 16 8 12 15 6 15 11 9 8總分總分34 48 30 36 50 14 41 30 30 34P80P80頁第頁第1414題題某學(xué)科測驗(yàn),某學(xué)科測驗(yàn),1010名被試得分情況如表名被試得分情況如表3-203-20所示:所示: 被試被試題目題目01 02 03 04 05 06 07 08 09 10152 2 0 2 0 0 2 0 2 25 7 4 6 6 2 4 5 3 4總分總分34 48 30 36 50 14 41 30 30 341、計算第、計算第1、5題的難度與區(qū)分度;題的難度與區(qū)分度; P1=R/N=6/10=0.6;P5=4.6/7=(假定這道題的滿分為7分) 被試被試題目題目01 02 03 04 05 06 07 08 09 10152 2 0 2 0 0 2 0 2 25 7 4 6 6 2 4 5 3 4總分總分34 48 30 36 50 14 41 30 30 345 . 08 . 981.9410/ )3 . 67 .203 .153 . 137 . 43 .1327 . 0(5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度大數(shù)據(jù)分析技術(shù)顧問聘請協(xié)議
- 二零二五年度游樂園場地租賃與兒童游樂設(shè)施安全標(biāo)準(zhǔn)制定合同
- 二零二五年度房屋貸款房屋買賣合同范本(含家具)
- 施工現(xiàn)場管理制度化
- 施工方案對籃球場材料的要求與選擇
- 高凈值人群海外稅務(wù)籌劃與財富保護(hù)策略
- 現(xiàn)代辦公樓的安全生產(chǎn)隱患識別與處理
- 食堂防火應(yīng)急預(yù)案
- 臨時倉儲保管合同范本
- 2025年跨國資金借貸合同(五)
- Unit6AtthesnackbarStorytimeDiningwithdragons(課件)譯林版英語四年級上冊
- 2023年四川省公務(wù)員錄用考試《行測》真題卷及答案解析
- 機(jī)電一體化系統(tǒng)設(shè)計-第5章-特性分析
- 2025年高考物理復(fù)習(xí)壓軸題:電磁感應(yīng)綜合問題(原卷版)
- 雨棚鋼結(jié)構(gòu)施工組織設(shè)計正式版
- 醫(yī)院重點(diǎn)監(jiān)控藥品管理制度
- 2024尼爾森IQ中國本土快消企業(yè)調(diào)研報告
- 2024年印度辣椒行業(yè)狀況及未來發(fā)展趨勢報告
- 骨科醫(yī)院感染控制操作流程
- 中藥的臨床合理應(yīng)用
- 鑄鋁焊接工藝
評論
0/150
提交評論