版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
教育統(tǒng)計(jì)、測(cè)量與評(píng)價(jià)喀什師范學(xué)院數(shù)學(xué)系石亞峰教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
劉新平劉存?zhèn)b編著概率論基礎(chǔ)推斷性統(tǒng)計(jì)教育測(cè)量教育評(píng)價(jià)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論名詞解釋
1、統(tǒng)計(jì):就是“統(tǒng)而計(jì)之”對(duì)所考察事物的量的取值在其出現(xiàn)的全部范圍內(nèi)作總體的把握,全局性的認(rèn)識(shí)。教育統(tǒng)計(jì):對(duì)教育領(lǐng)域各種現(xiàn)象量的取值從總體上的把握與認(rèn)識(shí),它是為教育工作的良好進(jìn)行,科學(xué)管理、革新發(fā)展服務(wù)的。教育統(tǒng)計(jì)學(xué):社會(huì)科學(xué)中的一門應(yīng)用統(tǒng)計(jì),是數(shù)理統(tǒng)計(jì)跟教育學(xué)、心理學(xué)交叉結(jié)合的產(chǎn)物。
教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論測(cè)量:按一定規(guī)則給對(duì)象在某種性質(zhì)的量尺上指定值。教育測(cè)量:就是給所考察研究的教育現(xiàn)象,按一定的規(guī)則在某種性質(zhì)量尺上指定值
數(shù)據(jù):用數(shù)量或數(shù)字形式表示的資料事實(shí)稱為數(shù)據(jù)。計(jì)數(shù)數(shù)據(jù):是以計(jì)算個(gè)數(shù)或次數(shù)獲得的,多表現(xiàn)為整數(shù)。測(cè)量評(píng)估數(shù)據(jù):借助測(cè)量工具或評(píng)估方法對(duì)事物的某種屬性指派給數(shù)字后所獲數(shù)據(jù)。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
內(nèi)容簡(jiǎn)介
一教育統(tǒng)計(jì)
描述性統(tǒng)計(jì),概率論基礎(chǔ),推斷性統(tǒng)計(jì),
方差分析,回歸分析
二教育測(cè)量
教育測(cè)量概述,測(cè)驗(yàn)的質(zhì)量分析,
考試設(shè)計(jì)與試題編制,
測(cè)驗(yàn)分?jǐn)?shù)的轉(zhuǎn)化與組合,項(xiàng)目反應(yīng)理論
三教育評(píng)價(jià)
教育評(píng)價(jià)概論,教學(xué)評(píng)價(jià),
學(xué)校、教師和學(xué)生的評(píng)價(jià),教育評(píng)價(jià)中的多元分析方法教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論第一章描述性統(tǒng)計(jì)
統(tǒng)計(jì)學(xué)是一門研究數(shù)據(jù)的搜集、整理、分析與推理方法的科學(xué),單純對(duì)一組數(shù)據(jù)的面貌特征進(jìn)行分析研究稱為描述性統(tǒng)計(jì)。在統(tǒng)計(jì)學(xué)中,通過對(duì)樣本的描述來推斷整體的特征,稱為推斷性統(tǒng)計(jì),簡(jiǎn)稱為統(tǒng)計(jì)推斷。根據(jù)樣本信息進(jìn)行統(tǒng)計(jì)推斷時(shí),勢(shì)必要冒導(dǎo)致錯(cuò)誤結(jié)論的風(fēng)險(xiǎn)。教育統(tǒng)計(jì)學(xué)是應(yīng)用數(shù)理統(tǒng)計(jì)方法去研究教育現(xiàn)象的一門應(yīng)用學(xué)科。數(shù)理統(tǒng)計(jì)是指應(yīng)用概率論來研究統(tǒng)計(jì)學(xué)的學(xué)科。教育學(xué)與心理學(xué)中的許多問題借助于統(tǒng)計(jì)學(xué)都可以量化,從而揭示教育規(guī)律和心理規(guī)律。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論數(shù)據(jù)也稱為資料,我們把搜集記錄下來的數(shù)量依據(jù)稱為數(shù)據(jù)。在實(shí)際工作中,一般采用調(diào)查的方法來取得數(shù)據(jù)。把所考慮對(duì)象的全體稱為總體或母體,其中每一個(gè)對(duì)象稱為個(gè)體;而從總體中抽取的一部分個(gè)體稱為樣本或子樣,樣本中所含個(gè)體的數(shù)目稱為樣本容量。樣本分為大樣本(n≥30)和小樣本(n<30);樣本容量的選擇取決于實(shí)驗(yàn)的條件和精度;樣本越大,反映總體的信息越充足,但計(jì)算量也越大,因此樣本容量最好適當(dāng)。
§1.1怎樣獲取數(shù)據(jù)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論抽樣調(diào)查中對(duì)樣本的基本要求:1)能充分反映總體的信息,即每個(gè)個(gè)體被抽到的可能性相同,個(gè)體與個(gè)體之間互不影響,也就是個(gè)體互相獨(dú)立。2)每個(gè)個(gè)體具有和總體相同的本質(zhì)特征,即樣本具有某種代表性,數(shù)學(xué)上稱此為與總體同分布。滿足以上兩條的樣本稱為隨機(jī)樣本,從樣本中抽出一個(gè)隨機(jī)樣本,統(tǒng)計(jì)學(xué)上稱為隨機(jī)抽樣。隨機(jī)抽樣常用的有:
一.簡(jiǎn)單隨機(jī)抽樣(隨機(jī)數(shù)表法;抽簽法)二.分層抽樣三.等距抽樣(個(gè)體排列后,以確定的相等距離抽取隨機(jī)樣本)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論一.數(shù)據(jù)的基本類型(離散型數(shù)據(jù),連續(xù)性數(shù)據(jù))二.頻數(shù)分布表三.累積頻數(shù)分布表四.頻數(shù)分布圖五.累積頻數(shù)分布曲線圖
§1.2頻數(shù)分布教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論描述統(tǒng)計(jì)
補(bǔ)充:常用統(tǒng)計(jì)表、統(tǒng)計(jì)圖及統(tǒng)計(jì)量(一)常用統(tǒng)計(jì)表
1、統(tǒng)計(jì)表的結(jié)構(gòu):由標(biāo)題、項(xiàng)目(標(biāo)目)、數(shù)據(jù)、線條、表注(數(shù)據(jù)來源)組成
1983年我國(guó)普通中學(xué)教師學(xué)歷統(tǒng)計(jì)表
學(xué)歷人數(shù)百分比(%)
大學(xué)本科以上30088711.6
大專畢業(yè)56686321.8
中專畢業(yè)以下172975066.6
合計(jì)2596900100.0
注:引自《中國(guó)教育成就統(tǒng)計(jì)資料》,1984年人民教育出版社標(biāo)題項(xiàng)目線條
數(shù)據(jù)表注教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論(二)常用統(tǒng)計(jì)圖1、統(tǒng)計(jì)圖結(jié)構(gòu):圖題、圖目、圖尺、圖例、圖形、圖注人數(shù)
706050403020101980年1985年1991年某校近十年教師人數(shù)及性別變化圖示男女年份圖例圖形常用統(tǒng)計(jì)表、統(tǒng)計(jì)圖及統(tǒng)計(jì)量圖目圖尺(制圖的尺度線。點(diǎn)、單位的總稱)圖題教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2、統(tǒng)計(jì)圖的類型及繪制要求繪制統(tǒng)計(jì)圖的要求A、根據(jù)數(shù)據(jù)和目的選擇合適的圖形B、圖形所表示的面積或距離要比例適當(dāng)C、表示不同的事物要用不同的顏色與線條類型:1直條圖2圓形圖3曲線圖4直方圖講師42.9%助教28.8%教授0.4%某大學(xué)教師職稱圖副教授21.9%某市7至18歲男女生身高比較圖1.751.701.651.601.551.501.451.40歲789101112131415161718米某校某班50名學(xué)生家庭背景情況比較
2015105人數(shù)其他農(nóng)工商企業(yè)職員公務(wù)與科教人員141615
5
2015105人數(shù)其他農(nóng)工商企業(yè)職員公務(wù)與科教人員141615
5(二)常用統(tǒng)計(jì)圖教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
3、次數(shù)分布表與直方圖
對(duì)一批數(shù)據(jù)按一定次序排列并加以分組、編成反映這群數(shù)據(jù)在各組上出現(xiàn)次數(shù)的統(tǒng)計(jì)表和圖,就是次數(shù)分布表和直方圖。例:一次考試之后,某班48名學(xué)生的成績(jī)?nèi)缦拢?/p>
86,77,63,78,92,72,66,87,75,83,74,47,83,81,76,82,97,69,82,88,71,67,65,75,70,82,77,86,60,93,71,80,76,78,57,95,78,64,79,82,68,74,73,84,76,79,86,68
將該組數(shù)據(jù)整理成次數(shù)分布表與直方圖(二)常用統(tǒng)計(jì)圖*教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
1求全距:R=max{xi}-min{xi}用該組數(shù)據(jù)最大數(shù)減最小數(shù)
2定組數(shù)和組距:數(shù)據(jù)劃分組數(shù)、每組上下限之間距離(全距除以組數(shù))
3列組限:從最高分至最低分以組距為單位依次分組
4歸組劃記:計(jì)算數(shù)據(jù)出現(xiàn)次數(shù),并計(jì)算累積次數(shù)及相對(duì)次數(shù)步驟:例:一次考試之后,某班48名學(xué)生的成績(jī)?nèi)缦拢?6,77,63,78,92,72,66,87,75,83,74,47,83,81,76,82,97,69,82,88,71,67,65,75,70,82,77,86,60,93,71,80,76,78,57,95,78,64,79,82,68,74,73,84,76,79,86,68組限組中值劃記次數(shù)f累積次數(shù)∑f相對(duì)次數(shù)Rf累積相對(duì)次數(shù)∑Rf95908580757065605550459994898479746964595449225912763101
2491830374346474748
0.040.040.100.190.250.150.130.060.0200.020.040.080.180.370.620.770.900.960.980.981.00正正正正正正合計(jì)48481.00次數(shù)分布表
9792878277726762575247K=1.87(n-1)2/5教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論14121086424550556065707580859095100次數(shù)分?jǐn)?shù)
直方圖教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論一.平均數(shù)表示一組數(shù)據(jù)集中的位置,又稱為均數(shù).
1.算術(shù)平均數(shù),
2.加權(quán)平均數(shù),
3.幾何平均數(shù),
4.調(diào)和平均數(shù)
§1.3集中量數(shù)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
3.幾何平均數(shù)
常用來計(jì)算平均增長(zhǎng)率
例某學(xué)校1999年至2001年招生人數(shù)如表所示,求該校平均每年招生的增長(zhǎng)速度。
年份招生人數(shù)19999002000110020011200教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論4、調(diào)和平均數(shù)例2甲每小時(shí)解6題,乙每小時(shí)解3題,兩人各解12題,求平均解題速度。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論4.調(diào)和平均數(shù)一般用于計(jì)算平均速度
例3甲每小時(shí)解4題,乙每小時(shí)解6題,丙每小時(shí)解5題,三人解題數(shù)分別為20,24,21,求平均解題速度。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論二.眾數(shù);三.中數(shù)(中位數(shù)).例表中給出了25個(gè)數(shù)據(jù)的頻數(shù)分布,求平均數(shù)、眾數(shù)與中數(shù).組區(qū)間組中值頻數(shù)75~8077.5170~7572.5365~7067.5560~6562.51055~6057.5450~5552.52教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
§1.4差異量數(shù)用來衡量一組數(shù)據(jù)分散程度的量數(shù)稱為差異量數(shù)。常見的差異量數(shù)有:極差,四分位差,平均差,標(biāo)準(zhǔn)差。一.極差極差=最大值—最小值二.四分位差
四分位差指之差的一半,用來描述頻數(shù)分布中間數(shù)值的分散程度,用Q 表示.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例1求20名學(xué)生一次語文測(cè)驗(yàn)成績(jī)的四分位差.66,67,67,69,70,71,72,73,74,76,85,86,88,88,90,90,92,94,97,98。四.三種集中量數(shù)的比較教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
三.平均差平均差是一個(gè)相對(duì)平均數(shù)來衡量一組數(shù)據(jù)分散程度的差異量,用表示.四.標(biāo)準(zhǔn)差方差標(biāo)準(zhǔn)差教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
標(biāo)準(zhǔn)差是衡量一組數(shù)據(jù)分散程度最有效的量數(shù)。它給出了一組數(shù)據(jù)偏離平均數(shù)程度的大小,標(biāo)準(zhǔn)差越小,這組數(shù)據(jù)偏離平均數(shù)的程度越小,即分布的差異越小.五.變異系數(shù)差異量數(shù)用來衡量一組數(shù)據(jù)的分散程度都帶有計(jì)量單位,不能比較不同單位的兩組數(shù)據(jù)。差異量數(shù)都是絕對(duì)差異量;而變異系數(shù)是相對(duì)差異量。1)極差系數(shù)極差系數(shù)=最大值/最小值2)標(biāo)準(zhǔn)差系數(shù)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例1甲射擊三槍擊中8,7,6
乙射擊三槍擊中5,6,10;問誰的射擊水平高?例2某學(xué)前班6歲男童平均體重為20.50公斤,平均身高為118.20厘米,體重的標(biāo)準(zhǔn)差為1.80公斤,身高的標(biāo)準(zhǔn)差為4.20厘米,試比較體重與身高的差異程度.例3某班學(xué)生第一次數(shù)學(xué)測(cè)驗(yàn)平均分為74.2,標(biāo)準(zhǔn)差為18.5分;第二次測(cè)驗(yàn)平均分為72.5分,標(biāo)準(zhǔn)差為12.5分,試比較兩次數(shù)學(xué)測(cè)驗(yàn)成績(jī)的差異程度。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
第二章概率論基礎(chǔ)
§2.1事件與概率一.事件隨機(jī)試驗(yàn);隨機(jī)事件;事件的關(guān)系.二.概率1.概率的統(tǒng)計(jì)定義事件A的頻率Q(A)=m/n事件A的概率P(A)2.概率的古典定義3.概率的數(shù)學(xué)定義n很大教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例一、二、三班的男女生的人數(shù)如表所示,從中隨機(jī)抽取1人,求該學(xué)生是一班學(xué)生或男生的概率是多少?一班二班三班總計(jì)男23222469女25242271總計(jì)484646140教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論§2.2隨機(jī)變量及常見分布一.隨機(jī)變量1.離散型隨機(jī)變量及概率分布例某學(xué)生參加一項(xiàng)智力競(jìng)賽,共回答3個(gè)問題,求該生答對(duì)題目數(shù)的概率分布列。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.連續(xù)型隨機(jī)變量及概率密度函數(shù)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例3路公共汽車每5分鐘來一趟,其乘客候車時(shí)間X為一隨機(jī)變量,求(1)概率密度函數(shù)p(x);(2)候車時(shí)間不超過3分鐘的概率。
一般地,若隨機(jī)變量X在區(qū)間(a,b)服從均分布,則概率密度為教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論3.隨機(jī)變量的分布函數(shù)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論4.隨機(jī)變量的數(shù)字特征(1)數(shù)學(xué)期望(期望值)數(shù)學(xué)期望是描述隨機(jī)變量取值集中位置的一個(gè)數(shù)。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論(2)標(biāo)準(zhǔn)差教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論(4)協(xié)方差與相關(guān)系數(shù)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論二.二項(xiàng)分布1.伯努利(Bernouli)概型只有兩個(gè)結(jié)果的試驗(yàn)為伯努利試驗(yàn),伯努利試驗(yàn)服從(0--1)分布。n重伯努利概型具有以下兩個(gè)特點(diǎn):教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論三.正態(tài)分布1.正態(tài)概率密度函數(shù)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例1設(shè)隨機(jī)變量X~N(0,1),
求P(X<1.65),P(1.65<X<2.09),P(X>-1.5)
例2設(shè)隨機(jī)變量X~N(60,25),
求(1)P(X>75),P(65<X<80),P(X<60)(2)若α=0.05,F(x)是X的分布函數(shù),
求F(x)的α百分位數(shù),
及F(x)的上α百分位數(shù).教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例3已知某車間工人完成某道工序的時(shí)間服從正態(tài)分布N(10,9),問(1)從該車間工人中任選一人,其完成該道工序的時(shí)間不到7分鐘的概率;(2)為了保證生產(chǎn)連續(xù)進(jìn)行,要求以95%的概率保證該道工序上工人完成工作時(shí)間不多于15分鐘,這一要求能否得到保證?教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.正態(tài)分布及標(biāo)準(zhǔn)正態(tài)分布函數(shù)值表教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論3.標(biāo)準(zhǔn)正態(tài)分布函數(shù)及其應(yīng)用例1某地2002年全國(guó)普通高校統(tǒng)考文科數(shù)學(xué)成績(jī)服從正態(tài)分布,已知期望為42分,標(biāo)準(zhǔn)差為6分,如果某考生得48分,問有多少考生名列該考生之后?(確定超前百分位數(shù),排定名次.所謂超前百分位數(shù),是指列于一個(gè)數(shù)值之后的人在全體中所占的百分?jǐn)?shù)。)例2學(xué)生的學(xué)習(xí)能力一般是服從正態(tài)分布的;如果某校200名初中一年級(jí)學(xué)生按能力分成5組參加某項(xiàng)測(cè)驗(yàn),問各組分別應(yīng)該有多少人?(按能力分組,確定各組人數(shù))教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論4.應(yīng)用于標(biāo)準(zhǔn)分?jǐn)?shù)(1)線性標(biāo)準(zhǔn)分?jǐn)?shù)科目原始分?jǐn)?shù)全體考生標(biāo)準(zhǔn)分?jǐn)?shù)ZT=10Z+50甲乙μ
σ甲乙
甲乙語文7882808-0.250.2547.552.5數(shù)學(xué)45414240.75-0.2557.547.5外語7274746-0.33046.750.0總和1951970.170151.7150.0教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論(2)正態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)(也稱為z分?jǐn)?shù))
先對(duì)原始分?jǐn)?shù)依大小排序,求出每一分?jǐn)?shù)以下的考生占考生總數(shù)的百分比,再利用標(biāo)準(zhǔn)正態(tài)分布函數(shù)值表(附表2)查出對(duì)應(yīng)的值,即為正態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù).教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論回顧與提高教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論回顧與提高教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論正態(tài)隨機(jī)變量的性質(zhì)定理1設(shè),則(1);(2)定理2設(shè),,X與Y獨(dú)立則;從而教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
§3.2抽樣分布定理一.總體和樣本二.樣本分布函數(shù)三.統(tǒng)計(jì)量
統(tǒng)計(jì)學(xué)中稱不含總體未知參數(shù)的樣本的函數(shù)為統(tǒng)計(jì)量,主要包括樣本均值,樣本方差和距.在統(tǒng)計(jì)推斷中,我們將用這些統(tǒng)計(jì)量來對(duì)總體的某些特征作出估計(jì)和檢驗(yàn)。統(tǒng)計(jì)量是統(tǒng)計(jì)推斷中一個(gè)非常重要的概念,當(dāng)我們要了解一個(gè)總體的分布或總體中的某個(gè)參數(shù)時(shí),往往要構(gòu)造一個(gè)統(tǒng)計(jì)量,然后依據(jù)樣本所遵從的總體分布,找到統(tǒng)計(jì)量所應(yīng)遵從的分布,以此對(duì)總體的分布或總體中的某個(gè)參數(shù)作出合理的推斷或檢驗(yàn)。為了方便,不妨把某統(tǒng)計(jì)量的觀察值簡(jiǎn)稱為該統(tǒng)計(jì)量.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例1設(shè)總體服從正態(tài)分布,已知總體的方差為16,從總體中抽取容量為9的樣本,求樣本均值與總體均值之差的絕對(duì)值小于2的概率?教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論四.三種重要的理論分布定理若,則教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論在對(duì)總體方差進(jìn)行檢驗(yàn)和區(qū)間估計(jì)時(shí),必須用到以上兩個(gè)統(tǒng)計(jì)量.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.T分布教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例1設(shè)總體服從正態(tài)分布,從總體中抽取容量為9的樣本,求樣本均值與總體均值之差的絕對(duì)值小于2的概率?如果(1)已知總體的方差為16。(2)總體方差未知,但樣本方差為18.45。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論應(yīng)用此定理,推斷兩個(gè)獨(dú)立正態(tài)總體的方差是否一致。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論補(bǔ)充習(xí)題教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論對(duì)總體方差進(jìn)行推斷.在總體方差未知的條件下對(duì)總體均值進(jìn)行推斷。
五.統(tǒng)計(jì)量的分布1.樣本均值的分布教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論關(guān)于正態(tài)隨機(jī)變量的線性函數(shù)的分布教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論單個(gè)正態(tài)總體的統(tǒng)計(jì)量的分布教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論兩個(gè)正態(tài)總體的統(tǒng)計(jì)量的分布教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
第三章推斷性統(tǒng)計(jì)推斷性統(tǒng)計(jì)的核心是由樣本所提供的信息,對(duì)總體的分布及分布的參數(shù)作出具有一定可信程度的推斷;推斷性統(tǒng)計(jì)有兩種:一種是參數(shù)估計(jì),另一種是假設(shè)檢驗(yàn)。
§
3.1參數(shù)估計(jì)
參數(shù)估計(jì)即根據(jù)樣本估計(jì)出總體的參數(shù);把總體待估參數(shù)記為θ,把用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量稱為估計(jì)量,記為.
參數(shù)估計(jì)分為兩類:第一類是點(diǎn)估計(jì),用一個(gè)統(tǒng)計(jì)量作為總體未知參數(shù)θ的估計(jì)量;第二類是區(qū)間估計(jì),用兩個(gè)統(tǒng)計(jì)量對(duì)總體未知參數(shù)θ所在范圍進(jìn)行估計(jì),使θ位于之間的可能性盡量大。在估計(jì)過程中,我們力求以較大的把握保證估計(jì)的準(zhǔn)確性;抽樣分布定理為進(jìn)行這項(xiàng)工作提供了理論工具。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
點(diǎn)估計(jì)點(diǎn)估計(jì)有兩種方法:距法和最大似然法.1.距法定義以樣本的r階距作為相應(yīng)總體r階距的估計(jì)量,以樣本距的函數(shù)作為總體距的同類函數(shù)的估計(jì)量稱為距法.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例1求總體均值μ和方差的估計(jì)量。2.無偏估計(jì)量定義設(shè)為總體未知參數(shù)θ的一個(gè)估計(jì)量,如果
E=θ,則稱為θ的一個(gè)無偏估計(jì)量有效性:教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論3.最大似然法
最大似然法由于總體分布已知,從而抽出的樣本能充分利用總體分布提供的信息,因而避免了距法的缺陷,應(yīng)用較廣。例1設(shè)總體X服從正態(tài)分布,其中期望和標(biāo)準(zhǔn)差都是未知參數(shù),如果取得觀察值為,求參數(shù)及的最大似然估計(jì)量。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論二.區(qū)間估計(jì)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論下面討論正態(tài)總體的參數(shù)區(qū)間估計(jì)問題例1由以往資料,某校一年級(jí)男生100m跑成績(jī)的標(biāo)準(zhǔn)差為2.1s,現(xiàn)從入學(xué)新生中抽出20名男生,測(cè)得100m跑平均成績(jī)?yōu)?3.5s,求該校一年級(jí)男生100米跑平均成績(jī)?chǔ)痰?5%的置信區(qū)間(假定百米跑成績(jī)X服從正態(tài)分布).教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論1.總體均值的區(qū)間估計(jì)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2)大樣本,總體方差未知,求μ的置信區(qū)間
例3
從某校高一男生中抽取9人,其身高(米)分別為1.70,1.63,1.78,1.55,1.59,1.74,1.72,1.64,1.60.試估計(jì)該校高一男生平均身高所在的范圍。(α=0.05,假定身高服從正態(tài)分布)例2從某區(qū)高中入學(xué)考試學(xué)生中抽取150份語文試卷,算得平均成績(jī)?yōu)?1.5分,方差16.0分,試對(duì)全區(qū)高中入學(xué)考生的平均語文成績(jī)?chǔ)踢M(jìn)行區(qū)間估計(jì)(α=0.01).
教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論3)小樣本,總體方差未知,求μ的置信區(qū)間教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.總體方差的估計(jì)區(qū)間1)已知總體均值μ,求的置信區(qū)間教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例4某校數(shù)學(xué)系入學(xué)新生的高考數(shù)學(xué)成績(jī)一直穩(wěn)定在75分左右,現(xiàn)從一年級(jí)新生中抽取10名,其入學(xué)高考數(shù)學(xué)成績(jī)分別為71,68,75,90,84,60,90,72試估計(jì)該校數(shù)學(xué)系新生高考數(shù)學(xué)成績(jī)的標(biāo)準(zhǔn)差在何范圍?教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例5從某區(qū)隨機(jī)抽取7名7歲的男童,其體重的標(biāo)準(zhǔn)差為2.25公斤,試求某區(qū)7歲男童的體重標(biāo)準(zhǔn)差的95%的置信區(qū)間。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論歸納正態(tài)總體X的參數(shù)區(qū)間估計(jì)1.總體均值μ的區(qū)間估計(jì)
2.總體標(biāo)準(zhǔn)差σ的區(qū)間估計(jì)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論習(xí)題1.某射擊隊(duì)員射擊十槍的成績(jī)是8,9,10,10,8,9,7,8,9,8,試估計(jì)他射擊的總體期望與方差的90%的置信區(qū)間。2.測(cè)某班學(xué)生身高5人,測(cè)得的值為(米)108.5,109.5,110.0,110.5,112.0,假定總體服從正態(tài)分布,且方差為2.5,求總體均值的置信度為0.95的置信區(qū)間。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論3.二項(xiàng)分布總體參數(shù)p的區(qū)間估計(jì)即總體X~b(n,k,p),對(duì)比率P進(jìn)行估計(jì)。(1)小樣本p的置信區(qū)間例某班20人參加一項(xiàng)測(cè)驗(yàn),有15人通過;求p的0.95置信區(qū)間.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論(2)大樣本p的置信區(qū)間教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例6某地區(qū)抽查100名中學(xué)教師,其中具有本科以上的有62人,試估計(jì)該地區(qū)具有本科以上學(xué)歷教師所占比例的范圍(α=0.05)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論設(shè)總體X服從某一分布(不是正態(tài)分布),它的概率函數(shù)或概率密度中含有未知參數(shù)θ,則總體均值與方差顯然都依賴于θ.四、非正態(tài)總體參數(shù)的區(qū)間估計(jì)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
§3.2參數(shù)假設(shè)檢驗(yàn)一.假設(shè)檢驗(yàn)的概念1.假設(shè)參數(shù)假設(shè)指總體分布已知,關(guān)于未知參數(shù)的假設(shè),教育研究中用得最多的是已知總體服從正態(tài)分布,對(duì)總體均值和總體方差作出假設(shè)。
非參數(shù)假設(shè)包括的范圍很廣,可以說,一個(gè)假設(shè)如果不是參數(shù)假設(shè),就稱為非參數(shù)假設(shè).
非參數(shù)假設(shè)一般指關(guān)于總體分布的假設(shè).2.假設(shè)檢驗(yàn)
判斷假設(shè)成立與否的方法叫做假設(shè)檢驗(yàn),最簡(jiǎn)單的檢驗(yàn)是顯著性檢驗(yàn)。所謂顯著性檢驗(yàn)是只對(duì)一個(gè)假設(shè)進(jìn)行檢驗(yàn).教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論3.小概率原理(實(shí)際推斷原理)
概率很小的事件叫做小概率事件。在統(tǒng)計(jì)學(xué)中,概率如低于0.01,0.05或0.10則認(rèn)為?。话堰@些值統(tǒng)一記為α,稱為顯著性水平。小概率原理是指:小概率事件在一次試驗(yàn)中是實(shí)際上不可能發(fā)生的;同樣,大概率事件在一次試驗(yàn)中是實(shí)際上必然會(huì)發(fā)生的.
這個(gè)原理在實(shí)際推斷中的應(yīng)用:如果小概率事件在一次試驗(yàn)中發(fā)生,那么,這是不切合實(shí)際的。4.兩類錯(cuò)誤第一類錯(cuò)誤:稱為“棄真”,記其概率為
第二類錯(cuò)誤:稱為“取偽”,記其概率為教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論犯這兩類錯(cuò)誤的后果通常是不一樣的。對(duì)一定樣本容量n,一般來說,α減少,β則增大;β減少,α則增大;同時(shí),對(duì)于固定的α,適當(dāng)增加樣本容量n可以減小β。5.檢驗(yàn)的一般步驟教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
二.總體均值的檢驗(yàn)(*)雙邊檢驗(yàn)(**)單邊檢驗(yàn)即檢驗(yàn)總體均值是大于樣本均值,或小于樣本均值。例1某校五年級(jí)學(xué)生語文期未成績(jī)X~N(82,16),采用新教學(xué)法后,抽測(cè)10名學(xué)生其平均成績(jī)?yōu)?5分,問采用新教學(xué)法后平均成績(jī)與原來有無顯著差異?教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論原假設(shè)在顯著水平α下關(guān)于原假設(shè)的拒絕域總體方差已知總體方差未知1.單正態(tài)總體均值的假設(shè)檢驗(yàn)表教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例2資料顯示,某區(qū)6歲兒童平均體重為19.2千克?,F(xiàn)在從某幼兒園抽測(cè)10名6歲兒童身高,其體重為:20.1,19.0,19.4,20.5,18.5,19.0,21.0,19.5,19.0,18.0.問該幼兒園6歲兒童平均體重與本區(qū)6歲兒童平均體重有無顯著差異?例3某中學(xué)初中二年級(jí)實(shí)驗(yàn)班30名學(xué)生和普通班40名學(xué)生解應(yīng)用題測(cè)驗(yàn)結(jié)果為實(shí)驗(yàn)班平均成績(jī)?yōu)?9分,普通班平均成績(jī)?yōu)?4分,而實(shí)驗(yàn)班的成績(jī)服從正態(tài)分布,且總體方差為11;普通班的成績(jī)也服從正態(tài)分布,總體方差為9.問實(shí)驗(yàn)班與普通班學(xué)生解應(yīng)用題能力有無顯著差異?樣本均值為19.4,樣本方差為0.76,t=0.69,顯著水平α=0.05
給定α=0.05,計(jì)算得u=6.49教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論3.雙正態(tài)總體,方差未知但相等,獨(dú)立樣本,比較兩總體均值2.雙正態(tài)總體,方差已知,獨(dú)立樣本,比較兩總體均值教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論原假設(shè)在顯著水平α下關(guān)于原假設(shè)的拒絕域兩總體方差已知
方差未知,但相等雙正態(tài)總體均值的假設(shè)檢驗(yàn)表(獨(dú)立樣本)給定α=0.05.經(jīng)計(jì)算知t=15.4教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例6某大學(xué)檢查40名大一男生平均體重為58.5千克,方差為8.1千克;30名大一女生的平均體重為48.0千克,方差為7.4千克;假定男女總體的方差相等,問大一男女學(xué)生的體重有無顯著差異?對(duì)此假定進(jìn)行檢驗(yàn):給定α=0.05.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論4、雙正態(tài)總體,復(fù)查未知,相關(guān)樣本,比較兩總體均值例7某小學(xué)數(shù)學(xué)組為了提高學(xué)生是能力,后半學(xué)期常用新的教學(xué)法在10名學(xué)生中進(jìn)行試驗(yàn),其成績(jī)見表。問此教學(xué)法與原教學(xué)法是否有顯著性差異?學(xué)號(hào)前后170742829036068462645859267575774708909595862107278教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論五.二項(xiàng)分布總體參數(shù)假設(shè)檢驗(yàn)(大樣本)原假設(shè)構(gòu)造統(tǒng)計(jì)量在顯著水平α下的拒絕區(qū)域教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例3設(shè)某種儀器的成功率為p,規(guī)定成功率要到達(dá)0.8才合格.現(xiàn)在抽取40人試用這種儀器,其中30人有效,問這種儀器是否合格?例8某地城區(qū)100人中升入高中的有80人,郊區(qū)80人中升入高中的有58人;問城區(qū)和郊區(qū)畢業(yè)生升入高中的比率有無顯著差異?教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論三.總體方差的檢驗(yàn)1.單正態(tài)總體方差的假設(shè)檢驗(yàn)表原假設(shè)
在顯著水平α下關(guān)于原假設(shè)的拒絕域
總體均值已知
總體均值未知教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例5某大學(xué)外語系新生高考外語成績(jī)服從正態(tài)分布,已知總體標(biāo)準(zhǔn)差為18.經(jīng)一學(xué)期學(xué)習(xí),隨機(jī)抽測(cè)10名學(xué)生,其外語成績(jī)分別為70,78,85,90,69,84,92,88,86,75.(1)問標(biāo)準(zhǔn)差與入學(xué)前相比有無顯著差異(α=0.05)?(2)若已知總體均值為76,問標(biāo)準(zhǔn)差與入學(xué)前相比有無顯著差異(α=0.05)?教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.雙正態(tài)總體方差的假設(shè)檢驗(yàn)表原假設(shè)
在顯著水平α下關(guān)于原假設(shè)的拒絕域
已知兩總體均值
未知總體均值教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論§3.3非參數(shù)假設(shè)檢驗(yàn)一.總體分布的統(tǒng)計(jì)檢驗(yàn)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論1)基本想法2)理論依據(jù)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論3)具體做法教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例1某區(qū)6歲男童的身高x是一總體,現(xiàn)從該區(qū)抽取50名6歲男童,其身高數(shù)據(jù)如表。試作總體x服從正態(tài)分布的擬合檢驗(yàn).組別組區(qū)間組頻數(shù)1108.5以下12108.5~110.533110.5~112.514112.5~114.525114.5~116.566116.5~118.577118.5~120.5118120.5~122.599122.5~124.5510124.5~126.5311126.5以上2總計(jì)50組區(qū)間實(shí)際頻數(shù)理論頻數(shù)114.5以下77.800.640.08114.5~116.566.450.200.03116.5~118.578.251.560.19118.5~120.5118.655.520.64120.5~122.597.651.820.24122.5~124.555.350.120.02124.5以上54.700.090.02總計(jì)501.22教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.K檢驗(yàn)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例某地區(qū)6歲男童身高是一總體,現(xiàn)在從該區(qū)抽取50名6歲男童,其身高(公分)數(shù)據(jù)如表。試作總體服從正態(tài)分布的擬合試驗(yàn)。組別組區(qū)間組頻數(shù)1108.5以下12108.5~110.533110.5~112.514112.5~114.525114.5~116.566116.5~118.577118.5~120.5118120.5~122.599122.5~124.5510124.5~126.5311126.5以上250組中值107.5-2.560.00500.005109.5-2.110.0170.020.003111.5-1.670.0480.080.032113.5-1.220.1110.100.011115.5-0.780.2180.140.078117.5-0.330.3710.260.111119.50.110.5440.400.144121.50.560.7120.620.092123.51.000.8410.800.041125.51.440.9250.900.025127.51.890.9710.960.011教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
二.兩個(gè)樣本是否來自同一總體的檢驗(yàn)
——總體分布未知時(shí),雙總體參數(shù)的檢驗(yàn)1.秩和檢驗(yàn)——秩表示排列的次序,表示樣本數(shù)據(jù)在次序統(tǒng)計(jì)中的地位.秩和檢驗(yàn)選取為統(tǒng)計(jì)量。(1)單樣本問題的檢驗(yàn)(2)雙獨(dú)立樣本問題的檢驗(yàn)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例1甲:91,88,68,83,65,74,73,90
乙:96,63,75,81,72,64.問兩種教學(xué)法結(jié)果有無顯著差異?(α=0.05)秩1234567891011121314甲6568737483889091乙636372758196例2甲:104,110,,106,113,115,111,102,128,110,117.
乙:94,95,103,114,126,95,102,100,98,103,116,105,107教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例5分別測(cè)量10名視力有障礙和12名視力正常的四年級(jí)學(xué)生的IQ得分為A104,110,106,113,115,111,102,128,110,117.B94,103,114,126,95,102,100,98,103,116,105,107試作有視力障礙學(xué)生IQ得分高于視力正常學(xué)生IQ得分的檢驗(yàn)(α=0.05).T=143.5,U=2.66.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)是利用分布統(tǒng)計(jì)量研究總體的兩種分類指標(biāo)是否獨(dú)立的一種非參數(shù)檢驗(yàn)方法.例
贊成
反對(duì)
和中年教師6436100青年教師562480
和12060180教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
第五章回歸分析
§5.1一元線性回歸設(shè)x,y為隨機(jī)變量,如果x與y具有線性相關(guān)關(guān)系,我們的目的是要通過樣本找出x與y之間的近似直線的表達(dá)式
一、如何配直線假定X、y之間存在線性相關(guān)關(guān)系,要配直線,關(guān)鍵在于找出回歸系數(shù)。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例1從某大學(xué)數(shù)學(xué)系一年級(jí)抽出15名學(xué)生,統(tǒng)計(jì)出他們的數(shù)學(xué)分析成績(jī)和高考數(shù)學(xué)成績(jī),如下表。試建立回歸直線方程。高考成績(jī)分析成績(jī)161722707038390455625777468085765818757696467107278116862127480138583146467159093總和10831120372143924900490068897470795158208351844900810085070教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
二、相關(guān)系數(shù)類似于總體相關(guān)系數(shù)r的定義,樣本相關(guān)系數(shù)ρ定義為教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2、平方和分解式教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論三、相關(guān)性檢驗(yàn)由樣本相關(guān)系數(shù)ρ來判斷x與y之間線性相關(guān)密切程度時(shí),ρ的絕對(duì)值到底要多大才可以用回歸直線來表示x與y之間的關(guān)系?也就是說,ρ的絕對(duì)值要大到什么界限,x與y之間的線性相關(guān)性才算顯著?教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例4某小學(xué)在10名學(xué)生中進(jìn)行教學(xué)改革實(shí)驗(yàn),其成績(jī)統(tǒng)計(jì)如下,問學(xué)生速算能力在實(shí)驗(yàn)后有無顯著差異?使用前x使用后y7074829060686264859275757470909558627278總和401304.雙正態(tài)總體,總體方差未知,相關(guān)樣本,比較兩總體均值教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
第六章教育測(cè)量概述
§6.1教育測(cè)量的概念
1918年桑代克:“凡客觀存在的事物都有其數(shù)量”,
1949年麥柯爾:“凡有數(shù)量的事物都可以測(cè)量”。
一.測(cè)量的定義
測(cè)量是指按照某種法則對(duì)測(cè)量對(duì)象的某種屬性給出數(shù)字表達(dá)的過程;即人們對(duì)客觀事物的某種屬性進(jìn)行某種數(shù)量化的測(cè)定。
教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論測(cè)量的三要素?cái)?shù)字具有區(qū)分性、順序性、等距性和可加性.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
二.教育測(cè)量的含義
教育測(cè)量屬于心理測(cè)量的范疇.
教育測(cè)量指,與人的受教育活動(dòng)直接相關(guān)的某些心理屬性為對(duì)象的數(shù)字指派過程。它是心理測(cè)量的原理和方法在教育領(lǐng)域的應(yīng)用。教育測(cè)量有廣義和狹義之分。廣義的教育測(cè)量幾乎包括心理測(cè)量的所有方面。狹義的教育測(cè)量只包括學(xué)業(yè)成績(jī)測(cè)量,也就是對(duì)學(xué)習(xí)結(jié)果即知識(shí)和技能的測(cè)量。
教育測(cè)量就是對(duì)學(xué)生的學(xué)習(xí)能力、學(xué)業(yè)成績(jī)、興趣愛好、思想品德以及教育措施上許多問題的數(shù)量化測(cè)定。
教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.參照點(diǎn)
任何測(cè)量都需要有一個(gè)計(jì)算的起點(diǎn),這個(gè)起點(diǎn)叫做參照點(diǎn).參照點(diǎn)有兩種:1)絕對(duì)的零點(diǎn);例如長(zhǎng)度的起點(diǎn),質(zhì)量的起點(diǎn)等;
2)人定的參照點(diǎn);例如溫度的起點(diǎn),陸地的起點(diǎn)等。最好的起點(diǎn)是絕對(duì)的起點(diǎn),人定的參照點(diǎn)越接近零點(diǎn)越好教育測(cè)量有各種參照點(diǎn):百分制以零分為參照點(diǎn);標(biāo)準(zhǔn)分采用團(tuán)體的平均分為參照點(diǎn);T分?jǐn)?shù)以平均分以下三至五個(gè)標(biāo)準(zhǔn)差為參照點(diǎn)
3.量距
量距是測(cè)量工具的量程;測(cè)量范圍的大小要受到測(cè)量工具量程的限制。
4.量表量表是測(cè)量的工具,是表示量數(shù)的方法。例尺子,天平等.
教育測(cè)量所使用的的量表有四種:類別量表;等距量表;等級(jí)量表;比率量表。1.單位
單位用來表示測(cè)量數(shù)字的多少,它必須有明確的意義和相同的價(jià)值,即每一單位只有一種解釋且不隨測(cè)量數(shù)字的改變而不同。百分制單位,標(biāo)準(zhǔn)分單位,等級(jí)分單位等。三.測(cè)量法則的要素
教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
四、教育測(cè)量的有關(guān)量表簡(jiǎn)介要測(cè)量某種事物,就需要先要有一個(gè)具有單位和參照點(diǎn)的連續(xù)體,然后用這個(gè)連續(xù)體去測(cè)量某種事物,以表示該事物的數(shù)量,這個(gè)連續(xù)體就叫做量表。即所謂量表,是指依據(jù)事物屬性的特性以及所設(shè)的法則,使一組數(shù)字能夠達(dá)到用于描述事物屬性特征的程度水平的標(biāo)準(zhǔn)。
1.類別量表(或稱名量表):如學(xué)號(hào),班級(jí)的編號(hào)等。它依據(jù)法則指派給事物及其屬性類別的數(shù)字僅僅是一種代表符號(hào)或稱呼,沒有數(shù)量大小的含義,亦即僅僅具有區(qū)別性而不具有序列性、等距性、可加性、不能進(jìn)行運(yùn)算。
教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.等級(jí)量表(或順序量表):如名次,等級(jí)等。等級(jí)量表本質(zhì)上也是對(duì)事物進(jìn)行分類,但所得數(shù)值在每一類別中具有有序性或等級(jí)性,卻不具有差距相等和測(cè)量的絕對(duì)零點(diǎn),也不可以進(jìn)行運(yùn)算。3.等距量表(或區(qū)間量表):如百分制分?jǐn)?shù)等。等距量表除具有類別、等級(jí)量表的性質(zhì)外,還要求一定的數(shù)量差距在整個(gè)量表的階梯上都相等,亦即量表各部分的單位相等,而且單位可以細(xì)分、測(cè)值可用實(shí)數(shù)表示。等距量表沒有絕對(duì)零點(diǎn),只有相對(duì)零點(diǎn);因此,只能進(jìn)行加減運(yùn)算,不能進(jìn)行乘除運(yùn)算,它具有區(qū)別性、等級(jí)性及可加性。4.比率量表:理想量表它除了具有類別、等級(jí)、等距量表的特征外,還具有一個(gè)實(shí)際意義上的絕對(duì)零點(diǎn)。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論五、教育測(cè)量的特點(diǎn)1.教育測(cè)量一般是間接測(cè)量2.教育測(cè)量的度量單位的相對(duì)性3.教育測(cè)量的復(fù)雜性教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論〈一〉.以測(cè)量的對(duì)象來分類,教育測(cè)量有:1.學(xué)業(yè)成績(jī)測(cè)驗(yàn):測(cè)量學(xué)生的知識(shí)、技能,如數(shù)學(xué)測(cè)驗(yàn)、語文測(cè)驗(yàn)、讀法測(cè)驗(yàn)等。2.智力測(cè)量:用于測(cè)驗(yàn)學(xué)生的觀察、識(shí)記、分析、判斷、推理等思維活動(dòng)的能力。如詞匯測(cè)驗(yàn)、填圖測(cè)驗(yàn)、辨別測(cè)驗(yàn)、類推測(cè)驗(yàn)、演題測(cè)驗(yàn)等。
3.人格測(cè)驗(yàn):如意志測(cè)驗(yàn)、性格測(cè)驗(yàn)、興趣測(cè)驗(yàn)、情感測(cè)驗(yàn)等。
4.特殊能力測(cè)驗(yàn):如繪畫能力,舞蹈能力等。六.教育測(cè)量的種類教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論〈二〉.以測(cè)驗(yàn)的目的來分類,教育測(cè)量有:1.預(yù)測(cè)測(cè)驗(yàn)(安置測(cè)驗(yàn))2.形成性測(cè)驗(yàn)3.總結(jié)性測(cè)驗(yàn)4.診斷性測(cè)驗(yàn)5.難度測(cè)驗(yàn)6.速度測(cè)驗(yàn)〈三〉以測(cè)量的方式來分類,教育測(cè)量有1.個(gè)人測(cè)驗(yàn)2.團(tuán)體測(cè)驗(yàn)〈四〉以試題的形式來分類,教育測(cè)量有1.客觀性測(cè)驗(yàn)2.論文式測(cè)驗(yàn)3.實(shí)踐性測(cè)驗(yàn)4.情景測(cè)驗(yàn)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論§6.2教育測(cè)量的工具——測(cè)驗(yàn)一.測(cè)驗(yàn)的定義
“測(cè)驗(yàn)是一個(gè)或一群標(biāo)準(zhǔn)的刺激,用以引起人們的行為,根據(jù)此行為以估計(jì)其智力、品德、興趣、學(xué)業(yè)等?!?/p>
“心理測(cè)驗(yàn)實(shí)質(zhì)上是行為樣組的客觀的和標(biāo)準(zhǔn)化的測(cè)量”。測(cè)驗(yàn)是教育測(cè)量的工具,而且是主要的工具;調(diào)查、觀察、評(píng)定、實(shí)驗(yàn)等方法也可以作為教育測(cè)量的工具。二.測(cè)驗(yàn)的分類教育測(cè)量的分類也實(shí)用于測(cè)驗(yàn)的分類。1.依據(jù)測(cè)驗(yàn)的使用規(guī)模分類學(xué)校教育中的測(cè)驗(yàn)又分為(1)配置性測(cè)驗(yàn)(摸底性測(cè)驗(yàn))(2)形成性測(cè)驗(yàn)(診斷——進(jìn)步測(cè)驗(yàn))(3)總結(jié)性測(cè)驗(yàn)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2、依據(jù)測(cè)驗(yàn)分?jǐn)?shù)解釋的參照標(biāo)準(zhǔn)分類1)目標(biāo)參照性測(cè)驗(yàn):以某種目標(biāo)為依據(jù)來進(jìn)行命題和分?jǐn)?shù)解釋的考試.2)常模參照性測(cè)驗(yàn):依據(jù)測(cè)驗(yàn)群體的常模來解釋分?jǐn)?shù)的考試,其目的在于把個(gè)人成績(jī)與他人成績(jī)作初比較。3、依據(jù)測(cè)驗(yàn)功能分類1)能力傾向測(cè)驗(yàn);2)學(xué)業(yè)參加測(cè)驗(yàn);3)人格品德測(cè)驗(yàn)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
三、教育測(cè)驗(yàn)的作用
1)辨別智愚、因材施教、2)選拔人才、指導(dǎo)就業(yè)3)判定成就、實(shí)驗(yàn)分組4、診斷困難、預(yù)測(cè)發(fā)展教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論四、教育測(cè)驗(yàn)的實(shí)施方法學(xué)業(yè)成就測(cè)驗(yàn)的實(shí)施方法有口試、筆試和實(shí)踐考核等。1、口試—提問靈活機(jī)動(dòng),能考察學(xué)生的能力品質(zhì),對(duì)知識(shí)理解的深度、廣度。2、筆試—是一種高效率的考核方法,考試結(jié)果具有可比性。3、實(shí)踐考核—多用于需要實(shí)際操作的學(xué)科,如體育運(yùn)動(dòng)技能,藝術(shù)學(xué)科的表演技巧等。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
§6.3教育測(cè)驗(yàn)的誤差
一.誤差及其種類誤差是測(cè)量值與真實(shí)值之差。它反映了測(cè)量值偏離真實(shí)值的大小和方向,也稱為絕對(duì)誤差。在教育測(cè)量中,把測(cè)驗(yàn)數(shù)據(jù)與學(xué)生真實(shí)水平之間的差距稱為測(cè)驗(yàn)誤差.誤差有兩種形式:一種是由偶然因素引起的不穩(wěn)定的誤差,稱為隨機(jī)誤差;它使得多次測(cè)量結(jié)果不一致,誤差大小和方向是隨機(jī)變化的。另一種是系統(tǒng)誤差,它是與測(cè)驗(yàn)?zāi)康臒o關(guān)的穩(wěn)定因素引起的,它存在于每次測(cè)驗(yàn)中,使得測(cè)驗(yàn)結(jié)果恒定而有規(guī)律的偏離正確值。系統(tǒng)誤差是由測(cè)驗(yàn)方法和測(cè)驗(yàn)條件決定的,它只影響測(cè)驗(yàn)結(jié)果的準(zhǔn)確性;而隨機(jī)誤差既影響測(cè)驗(yàn)結(jié)果的準(zhǔn)確性,又影響測(cè)驗(yàn)結(jié)果的一致性。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
二.真分?jǐn)?shù)與相對(duì)誤差真分?jǐn)?shù)指的是測(cè)驗(yàn)在沒有誤差時(shí)所得的真值。任何測(cè)驗(yàn)都不可能沒有誤差;從理論上來說,無限次測(cè)驗(yàn)結(jié)果的平均值便是真分?jǐn)?shù)。某考生在考試中所得的分?jǐn)?shù)稱為實(shí)得分?jǐn)?shù)或觀察分?jǐn)?shù),根據(jù)誤差的定義知,某考生測(cè)驗(yàn)所得成績(jī)課看作是真分?jǐn)?shù)和誤差分?jǐn)?shù)之和。即教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
三.測(cè)驗(yàn)誤差的來源1.測(cè)驗(yàn)本身引起的誤差2.實(shí)施過程引起的誤差3.被試本身引起的誤差教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論§6.4經(jīng)典測(cè)驗(yàn)理論的基本假設(shè)
一.心理特質(zhì)的可測(cè)性假設(shè)心理特質(zhì)指表現(xiàn)在一個(gè)人身上所特有的相對(duì)穩(wěn)定的那種行為方式.
“凡客觀存在的事物都有其數(shù)量”,
“凡有數(shù)量的事物都可以測(cè)量”。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
二.CTT的數(shù)學(xué)模型及其假設(shè)公理
X=T+E——CTT數(shù)學(xué)模型,E~(0,?)根據(jù)這一模型,Gulliksen于1950年提出了三個(gè)相關(guān)的假設(shè)公理:(1)若一個(gè)人的某種心理特質(zhì)可以用平行的測(cè)驗(yàn)反復(fù)測(cè)量足夠多次,則其實(shí)得分?jǐn)?shù)的平均值會(huì)接近真分?jǐn)?shù),或誤差的平均值會(huì)為零,即(2)誤差與真分?jǐn)?shù)相互獨(dú)立,即兩者之間的相關(guān)系數(shù)為零;(3)各平行測(cè)驗(yàn)上的誤差分?jǐn)?shù)相互獨(dú)立,或個(gè)試題之間的真分?jǐn)?shù)相互獨(dú)立,即教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論三.方差分?jǐn)?shù)的關(guān)系教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
第七章教育測(cè)驗(yàn)的質(zhì)量分析測(cè)驗(yàn)作為教育測(cè)量的工具,必須有良好的質(zhì)量,才能達(dá)到實(shí)際應(yīng)用的目的。測(cè)驗(yàn)的質(zhì)量標(biāo)準(zhǔn),總起來說,就是正確可靠、確實(shí)有效、難易適當(dāng)和鑒別力強(qiáng);這就是衡量教育測(cè)量質(zhì)量的四個(gè)指標(biāo):信度、效度、難度和區(qū)分度;前兩個(gè)指標(biāo)主要是對(duì)整個(gè)測(cè)量而言的,后兩個(gè)指標(biāo)則主要是對(duì)測(cè)量的項(xiàng)目而言的。
§7.1測(cè)驗(yàn)的信度信度的概念
測(cè)驗(yàn)的信度是指測(cè)驗(yàn)結(jié)果的穩(wěn)定性或可靠的程度,亦即測(cè)量的結(jié)果是否真實(shí)、客觀地反映了考生的實(shí)際水平。所謂可靠性是指對(duì)同一對(duì)象進(jìn)行兩次相同測(cè)驗(yàn)所得結(jié)果的一致性和穩(wěn)定性程度。
教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論測(cè)量學(xué)中,信度可定義為真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)方差的比率,即
這表明,真分?jǐn)?shù)方差在實(shí)得分?jǐn)?shù)方差中所占的比值越大,則信度就越高。具體而言,可以從以下三個(gè)方面來理解測(cè)量的信度。1.信度指實(shí)測(cè)值和真值相差的程度x(實(shí)測(cè)值)=T(真值)+E(誤差)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.信度指統(tǒng)計(jì)量與參數(shù)之間的接近程度統(tǒng)計(jì)量是指樣本上的各種數(shù)字特征,參數(shù)是指總體上的各種數(shù)字特征。統(tǒng)計(jì)量越接近參數(shù),這個(gè)統(tǒng)計(jì)量的可靠性便越高.3.信度指兩次重復(fù)測(cè)量或等值測(cè)量之間的關(guān)聯(lián)程度
如果對(duì)同一對(duì)象進(jìn)行兩次重復(fù)測(cè)量或等值測(cè)量后,計(jì)算兩次測(cè)量的相關(guān)系數(shù),相關(guān)系數(shù)越高,說明測(cè)量的信度就越高;反之,就越低。
信度的值在(0~1)之間,稱為信度系數(shù).當(dāng)信度系數(shù)為0.95~0.99時(shí),測(cè)驗(yàn)可靠性很高;當(dāng)信度系數(shù)為0.9~0.94時(shí),是通常能得到的最好結(jié)果;當(dāng)信度系數(shù)為0.8~0.9時(shí),也比較好;當(dāng)信度系數(shù)為0.7以下,表明誤差太大,該測(cè)驗(yàn)不能使用.
教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
信度是測(cè)驗(yàn)的必要條件,它是衡量測(cè)驗(yàn)分?jǐn)?shù)一致性或可靠性的一個(gè)重要指標(biāo),即用一個(gè)或一組測(cè)驗(yàn)對(duì)同一被試群體實(shí)測(cè)多次,所得結(jié)果的一致性程度,以及測(cè)驗(yàn)分?jǐn)?shù)所反映被試真實(shí)水平(即真分?jǐn)?shù))的可靠性程度。
影響信度的主要因素是測(cè)量中的誤差。一般情況下,測(cè)量資料存在三種誤差:一是抽樣誤差,它的估計(jì)值是樣本標(biāo)準(zhǔn)差S與樣本容量n的算術(shù)平方根之比。二是隨機(jī)誤差,它是由偶然因素引起的無規(guī)律的誤差,是由心理屬性的行為反應(yīng)所造成的,它即影響測(cè)驗(yàn)的一致性,又影響測(cè)驗(yàn)的準(zhǔn)確性。三是系統(tǒng)誤差,它是由與測(cè)驗(yàn)?zāi)繕?biāo)無關(guān)的某種常定的因素所引起的恒定的、有規(guī)律性變化的誤差。它不影響測(cè)驗(yàn)結(jié)果的一致性或可靠性,只影響測(cè)量的準(zhǔn)確性。
測(cè)驗(yàn)的穩(wěn)定性主要的研究如何控制隨機(jī)誤差問題。真分?jǐn)?shù)理論的三個(gè)假設(shè):教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論二.信度系數(shù)的計(jì)算(信度的類型)信度是指測(cè)驗(yàn)的可靠性,亦即多次測(cè)驗(yàn)結(jié)果的一致性.在實(shí)際工作中,就是通過對(duì)測(cè)驗(yàn)結(jié)果的一致性程度來計(jì)算信度的;主要有三種1)穩(wěn)定性系數(shù):是估計(jì)測(cè)驗(yàn)中跨時(shí)間的一致性;*2)等值性系數(shù):是估計(jì)測(cè)驗(yàn)中跨形式的一致性;#3)內(nèi)在一致性系數(shù):是估計(jì)測(cè)驗(yàn)中跨項(xiàng)目的一致性;1.穩(wěn)定性系數(shù)(再測(cè)信度)
穩(wěn)定性系數(shù)又稱為再測(cè)系數(shù),它是指用同一測(cè)驗(yàn)試卷,在先后兩個(gè)時(shí)間內(nèi)對(duì)同一組被試進(jìn)行測(cè)驗(yàn),兩次測(cè)驗(yàn)實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)。穩(wěn)定性系數(shù)是估計(jì)信度最簡(jiǎn)單的方法,只需用同一份試卷對(duì)同一組考生測(cè)驗(yàn)兩次即可。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論穩(wěn)定性信度的計(jì)算公式為使用再測(cè)法計(jì)算穩(wěn)定性系數(shù)時(shí),要注意以下問題:(1)兩次測(cè)驗(yàn)之間的時(shí)間間隔要適宜。穩(wěn)定性系數(shù)的大小,常常受兩次測(cè)驗(yàn)的時(shí)間間隔的影響。(2)再測(cè)法只適用于速度測(cè)驗(yàn),而不適用于難度測(cè)驗(yàn).(3)應(yīng)注意提高被試者的積極性。或教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.等值性系數(shù)(復(fù)本信度)
等值性系數(shù)是以兩個(gè)等值(題型、題量、難度、區(qū)分度等相等)但具體內(nèi)容不同的量表,在最短的時(shí)距內(nèi),對(duì)相同的應(yīng)試者先后施測(cè)兩次測(cè)驗(yàn)所獲得的兩組對(duì)應(yīng)分?jǐn)?shù)的相關(guān)系數(shù)。等值性的信息除了有助于判斷某種測(cè)驗(yàn)信度的高低外,對(duì)于評(píng)價(jià)應(yīng)試者對(duì)某種教材掌握的范圍程度,也具有重要意義。常用等值性信度作追蹤研究或探討某些影響測(cè)驗(yàn)成績(jī)的因素。復(fù)本信度不僅適用于難度測(cè)驗(yàn),也適用于速度測(cè)驗(yàn)。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論3.內(nèi)部一致性系數(shù)指同一測(cè)驗(yàn)量表的兩個(gè)部分得分的相關(guān)系數(shù)。計(jì)算內(nèi)部一致性系數(shù)的方法有以下兩種:(1)分半信度分半法是按正常的程序?qū)嵤y(cè)驗(yàn),然后將全部試題分成相等的兩半(通常采用奇偶分半法),根據(jù)各人在這兩半測(cè)驗(yàn)的分?jǐn)?shù)計(jì)算其相關(guān)系數(shù);最后用斯皮爾曼——布朗公式校正,校正公式為其中γ為兩半測(cè)驗(yàn)的相關(guān)系數(shù),為整個(gè)測(cè)驗(yàn)的相關(guān)系數(shù).教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論半分法例1有一個(gè)由100題構(gòu)成的量表施行于10名學(xué)生。怎樣評(píng)價(jià)測(cè)驗(yàn)結(jié)果的信度?
得分被試奇數(shù)題總分偶數(shù)題總分010203040506070809103837384140363839413537373639393438393936144413691444168116001296144415211600122513691269129615211521115614441521152112961406136913681599156012241444152115601260382374146241401414311教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例1若10名學(xué)生奇數(shù)題得分x與偶數(shù)題得分y如下表所示。試求這份整體試卷的分半信度。(135)
采用斯—布朗公式計(jì)算分半信度時(shí),須要假定兩半之間的平均數(shù)、標(biāo)準(zhǔn)差、測(cè)題的難度、區(qū)分度、分布形態(tài)上以及內(nèi)容上都相同;否則,信度估計(jì)就會(huì)有誤差。學(xué)生01020304050607080910偶數(shù)3835212742141428287奇數(shù)303281825152221179教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論弗拉南根(Flanagan)公式與盧龍(Rulon)公式而弗拉南根(Flanagan)公式與盧龍(Rulon)公式無須上述假定即可用來求全卷的信度。弗拉南根公式盧龍公式教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論(2).庫(kù)—理信度系數(shù)公式(客觀題試卷)適用于客觀題試卷的一序列公式較為常用的是教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例2有一個(gè)包含6個(gè)問題的測(cè)驗(yàn),10個(gè)應(yīng)試者得分如下(答對(duì)得1分,答錯(cuò)得0分),試估計(jì)應(yīng)試者反應(yīng)的一致性程度.一二三四.五六和011000001021001002030000112041110003050100113061110003071111004081111004091101115101111116和875544N=61.35S*=2.01平3.30.39教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論(3).論文式測(cè)驗(yàn)的信度——克朗巴赫公式教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
被試題號(hào)ABCDE1234561181111978961068911683118111171181111
4163435753483939364848α系數(shù)公式的應(yīng)用例2有一個(gè)包含6個(gè)論文式題目的測(cè)驗(yàn),對(duì)5個(gè)應(yīng)試者施行,得分列入下表,試求該測(cè)驗(yàn)的信度。教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論(4).評(píng)分者的信度
當(dāng)測(cè)驗(yàn)是論文式試題時(shí),不同評(píng)分者對(duì)同一試卷的評(píng)分結(jié)果不同,有時(shí)差異很大.這時(shí)不宜用α系數(shù)計(jì)算其信度,必須對(duì)評(píng)分者評(píng)分的一致性進(jìn)行估計(jì).(2)三個(gè)以上評(píng)分者評(píng)N份試卷教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論Kendall和諧系數(shù)的應(yīng)用例有六位教師各自評(píng)閱五篇作文,每位教師給每一篇作文都評(píng)了等級(jí)(共五等),并列入下表.問六位教師所評(píng)的等級(jí)的一致性如何?
作文編號(hào)評(píng)分者12345趙35241錢35241孫34152李35142周35241吳35241182910258教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論(5).目標(biāo)參照性測(cè)驗(yàn)的信度系數(shù)1)利文斯頓法(Livingston)2)決策一致性系數(shù)教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論A測(cè)驗(yàn)合格B測(cè)驗(yàn)合格(40)A測(cè)驗(yàn)合格B測(cè)驗(yàn)不合(15)A測(cè)驗(yàn)不合格B測(cè)驗(yàn)合格(5)A測(cè)驗(yàn)不合格B測(cè)驗(yàn)不合格(20)B測(cè)驗(yàn)A測(cè)驗(yàn)R=(40*20-12*8)/[40*20+5*(40+20+15)]=0.62教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論信度的應(yīng)用
信度是主要用途就是判斷測(cè)驗(yàn)的優(yōu)劣:一般能力與學(xué)業(yè)測(cè)驗(yàn)的信度應(yīng)在0.90以上;性格、興趣、態(tài)度等人格測(cè)驗(yàn)的信度應(yīng)在0.80~0.85之間;信度在0.7以下的測(cè)驗(yàn)不能采用。信度還可以用來對(duì)分?jǐn)?shù)作解釋,主要有以下兩方面的應(yīng)用:個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的誤差
信度系數(shù)表明的是一組測(cè)量的實(shí)測(cè)值與真實(shí)值的符合程度,并沒有給出個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異情況。在實(shí)踐中,經(jīng)常用一組考生兩次考試的結(jié)果來估計(jì)誤差的差異。這時(shí)個(gè)人在兩次考試中分?jǐn)?shù)的差異就是測(cè)量的誤差,由此可得出一個(gè)誤差分?jǐn)?shù)的分布,該分布的標(biāo)準(zhǔn)差就是測(cè)量的標(biāo)準(zhǔn)誤差,它是測(cè)量誤差大小的指標(biāo),其公式為:教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論例5教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論2.兩種考試分?jǐn)?shù)的比較
個(gè)人在兩次考試上的差異,可以用差異標(biāo)準(zhǔn)誤來檢驗(yàn)其差異的顯著性.其公式為:例某學(xué)生數(shù)學(xué)考試得52分,物理51分,轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)后,數(shù)學(xué)0.332,物理-1.2035,數(shù)學(xué)考題的信度為0.8227,物理考題的信度為0.86;問數(shù)學(xué)與物理成績(jī)有無顯著差異?教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論信度的應(yīng)用(歸納與整理)2.兩種考試分?jǐn)?shù)的比較1.個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的誤差教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論測(cè)題數(shù)目信度系數(shù)50.20100.33200.55400.67800.801600.893200.946400.97
測(cè)驗(yàn)長(zhǎng)度與信度的關(guān)系教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論提高信度的途徑適當(dāng)增加題量
例原來由6題組成的測(cè)驗(yàn),其信度為0.56,現(xiàn)要求把信度提高到0.8,需要加長(zhǎng)到多少試題?用標(biāo)準(zhǔn)化試題,難度要適中。測(cè)驗(yàn)的內(nèi)容應(yīng)盡量同質(zhì).測(cè)驗(yàn)的時(shí)間要充分,程序要統(tǒng)一。評(píng)分要客觀.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論§7.2測(cè)驗(yàn)的效度
效度的定義
效度是指測(cè)驗(yàn)結(jié)果的有效性或準(zhǔn)確性.所謂有效性,是指一測(cè)驗(yàn)?zāi)軌蛘_地測(cè)量出它所要測(cè)量的特性或功能的程度.
在實(shí)際測(cè)量中,影響效度的主要因素是系統(tǒng)誤差和隨機(jī)誤差.系統(tǒng)誤差真分?jǐn)?shù)方差隨機(jī)誤差有效分?jǐn)?shù)方差效度的定義實(shí)得分?jǐn)?shù)方差教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
效度
信度意義衡量測(cè)驗(yàn)質(zhì)量的數(shù)量性指標(biāo)表示測(cè)驗(yàn)結(jié)果的有效性或準(zhǔn)確性衡量測(cè)驗(yàn)質(zhì)量的數(shù)量性指標(biāo)表示測(cè)驗(yàn)結(jié)果的穩(wěn)定性或一致性或可靠性定義取值范圍
(0,1)
(0,1)兩者的關(guān)系低信度,低效度高信度,低效度高信度,高效度教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論二.效度與信度的關(guān)系
效度是測(cè)量準(zhǔn)確性的量度,信度是測(cè)量結(jié)果一致性或穩(wěn)定性的量度;準(zhǔn)確性與一致性的關(guān)系,可以用靶形圖形象地說明。
結(jié)論
.1)高信度是高效度測(cè)驗(yàn)的一個(gè)必要條件而非充分條件。2)對(duì)一個(gè)測(cè)驗(yàn)來說,效度是第一位重要因素,其次才是信度。3)一個(gè)測(cè)驗(yàn)的效度不能夠超過它的信度的平方根.
即測(cè)驗(yàn)的效度受它的信度所限制;一個(gè)測(cè)驗(yàn)的效度不可能超過它的信度的平方根.教育統(tǒng)計(jì)與測(cè)評(píng)導(dǎo)論
三.效度的估算
1.內(nèi)容效度-適用于學(xué)業(yè)成績(jī)測(cè)驗(yàn)
內(nèi)容效度是指測(cè)驗(yàn)內(nèi)容對(duì)所要測(cè)驗(yàn)的全部?jī)?nèi)容的抽樣代表性程度.
內(nèi)容效度適用于評(píng)價(jià)學(xué)業(yè)成績(jī)測(cè)驗(yàn)和職業(yè)選拔測(cè)驗(yàn),對(duì)目標(biāo)參照測(cè)驗(yàn)更為重要。例如,高一數(shù)學(xué)函數(shù)部分單元測(cè)驗(yàn)必須包含的內(nèi)容有:1)函數(shù)的定義(三要素),定義域,值域;2)函數(shù)的單調(diào)性的含義,求函數(shù)的單調(diào)區(qū)間,證明函數(shù)在給定區(qū)間上的單凋性;3)反函數(shù)的定義和求法,原函數(shù)與反函數(shù)的圖象之間的對(duì)稱關(guān)系;4)指數(shù)與指數(shù)函數(shù)的意義和性質(zhì),指數(shù)函數(shù)的圖象,指數(shù)函數(shù)的應(yīng)用;5)對(duì)數(shù)與對(duì)數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向未來的廣告營(yíng)銷考核試卷
- 項(xiàng)目績(jī)效評(píng)估體系的構(gòu)建與應(yīng)用-洞察分析
- 學(xué)校2025年師德師風(fēng)個(gè)人工作計(jì)劃
- 2024-2025學(xué)年廣東省部分學(xué)校高二上學(xué)期期中聯(lián)考生物試題(解析版)
- 責(zé)任重于泰山心得體會(huì)
- 2024-2025學(xué)年北京市海淀區(qū)高三上學(xué)期11月期中考試生物試題(解析版)
- 文具創(chuàng)業(yè)計(jì)劃書范文
- 探究語義搜索技術(shù)應(yīng)用-洞察分析
- 小學(xué)四年級(jí)上學(xué)期語文教研組工作計(jì)劃
- 體驗(yàn)式旅游消費(fèi)分析-洞察分析
- 工程機(jī)械租賃服務(wù)方案及保障措施 (1)
- 功率因數(shù)調(diào)整電費(fèi)辦法
- 美發(fā)基礎(chǔ)(課堂PPT)
- WordA4信紙(A4橫條直接打印版)
- 藥品庫(kù)存清單(2015年)
- (完整版)會(huì)計(jì)準(zhǔn)則(全文)
- 百家姓全文拼音版A4打印
- 專家論證挖孔樁專項(xiàng)施工方案
- IPC標(biāo)準(zhǔn)解析學(xué)習(xí)課程
- 麻花鉆鉆孔中常見問題的原因和解決辦法
- 部分常用巖土經(jīng)驗(yàn)值
評(píng)論
0/150
提交評(píng)論