版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
教育統(tǒng)計與測量學原理第一頁,共七十九頁,編輯于2023年,星期日教育統(tǒng)計與測量學原理學習教育統(tǒng)計與教育測量的重要意義1、教育統(tǒng)計和測量是認識教育本質的有力武器;2、是分析處理教育工作中各種數(shù)據(jù)資料、進行教育督導與評價的有效工具;3、對教育管理科學化具有重要意義;4、是教育科學研究中,發(fā)現(xiàn)探索教育教學規(guī)律、指導教育教學實踐、為教育行政部門決策提供依據(jù)的重要思想方法;5、是黨和政府制定教育方針、政策以及認清教育事業(yè)和整個國民經濟發(fā)展關系的重要工具。第二頁,共七十九頁,編輯于2023年,星期日
第一部分:教育統(tǒng)計學一、概述
1、什么是教育統(tǒng)計學
2、教育統(tǒng)計學的歷史
3、教育統(tǒng)計學的內容二、描述統(tǒng)計
1、常用的統(tǒng)計表、圖與統(tǒng)計量
2、相關分析
3、正態(tài)分布三、推斷統(tǒng)計
1、相關概念
2、總體平均數(shù)估計
3、平均數(shù)差異的顯著性檢驗四、實驗設計簡介第三頁,共七十九頁,編輯于2023年,星期日一、概述教育統(tǒng)計學概念、發(fā)展歷史、內容
1、概念:教育統(tǒng)計學就是運用數(shù)理統(tǒng)計的原理和方法研究教育問題的一門應用科學。它是研究如何收集、整理、分析和解釋教育方面的數(shù)據(jù),從而表明教育上某些現(xiàn)象的特征及規(guī)律的一門科學,它是處理教育實際工作和進行教育研究以及提高管理質量的科學水平、提高教育質量的重要工具。
教育統(tǒng)計學的主要任務:對教育現(xiàn)象進行調查和實驗,在占有充分數(shù)據(jù)資料的基礎上,經過對數(shù)據(jù)的整理計算、統(tǒng)計分析和統(tǒng)計檢驗等方法,對研究結果予以科學說明。即從數(shù)量方面的研究,來探索教育和心理現(xiàn)象的發(fā)展變化的特征和規(guī)律,或根據(jù)研究結果的數(shù)據(jù)處理、統(tǒng)計推斷,做出正確決策。
第四頁,共七十九頁,編輯于2023年,星期日教育統(tǒng)計學概念、發(fā)展歷史、內容
2、教育統(tǒng)計學發(fā)展史:教育統(tǒng)計學產生于上個世紀初,發(fā)展于五、六十年代,廣泛應用于八十年代以后。(1)國外:20世紀初統(tǒng)計學傳入美國,桑代克(E.L.Thorndike)為了達到“極力以心理學與統(tǒng)計學為工具研究教育學,使教育科學化”的目的,1904年出版世界上第一本有關教育統(tǒng)計學的專著《心理與社會測量導論》。(2)國內:我國的教育統(tǒng)計學是在辛亥革命以后,隨著西方科學技術成就一起被引入。當時的大學教育系和中等師范學校,都把教育統(tǒng)計學作為必修課程,很多學者撰寫專著,如薛鴻志《教育統(tǒng)計方法》(1925)、王書林《教育測驗與統(tǒng)計》(1935)等。1979年隨著全國教育科學規(guī)劃會議的召開,教育統(tǒng)計學恢復了新生,各師范大學又都開設了教育統(tǒng)計學課程。教育部組織葉佩華、萬梅亭、郝德元、陳一百等教授編寫《教育統(tǒng)計學》作為全國通用教材。
經過100多年的發(fā)展,各種教育統(tǒng)計方法已相當豐富。但每一種方法的運用在我國還處于推廣和適用階段,因此不少人對它的作用缺乏足夠的認識,特別是對復雜的教育問題,由于統(tǒng)計方法本身的限制,還有十分重要的實驗設計和統(tǒng)計推斷的問題不能在理論上得到有力解決,還有待于教育學家親自動手來推進統(tǒng)計理論和改進統(tǒng)計工具。第五頁,共七十九頁,編輯于2023年,星期日教育統(tǒng)計學概念、發(fā)展歷史、內容
3、教育統(tǒng)計學的內容:教育統(tǒng)計學按應用分為描述統(tǒng)計、推斷統(tǒng)計、實驗設計(多元統(tǒng)計)三部分內容。
(1)描述統(tǒng)計的主要作用就在于就所關心的教育現(xiàn)象進行全面調查和觀測,然后將所得的大量數(shù)據(jù)加以整理、簡縮、制成圖表;或就這些數(shù)據(jù)的分布特征(如集中趨勢、離散趨勢、相關度等等)計算出具有概括性的數(shù)字作為標志。借助這些概括性的數(shù)字,我們就可以從雜亂無章的數(shù)據(jù)中取得有意義的信息。
(2)推斷統(tǒng)計也叫抽樣統(tǒng)計,它是在描述統(tǒng)計的基礎上發(fā)展起來的。是用抽樣的方法,根據(jù)部分數(shù)據(jù)來推斷一般情況,即通過局部對全局的情況加以推斷的一種方法。它可以幫我們透過現(xiàn)象看到本質,對客觀現(xiàn)象作出本質性的判斷,它是從樣本的研究中得出統(tǒng)計量。來推斷總體的有關特征,以便作出具體的措施和決策。常用的方法有:u檢驗、t檢驗、卡方檢驗和非參數(shù)檢驗,還有多元分析中的主成份分析和因素分析等。(3)實驗設計通常指實驗程序的計劃和安排。而實驗程序的計劃和安排離不開統(tǒng)計和檢驗。
第六頁,共七十九頁,編輯于2023年,星期日二、描述統(tǒng)計
第一章常用統(tǒng)計表、統(tǒng)計圖及統(tǒng)計量(一)常用統(tǒng)計表
1、統(tǒng)計表的結構:由標題、項目(標目)、數(shù)據(jù)、線條、表注(數(shù)據(jù)來源)組成
1983年我國普通中學教師學歷統(tǒng)計表
學歷人數(shù)百分比(%)
大學本科以上30088711.6
大專畢業(yè)56686321.8
中專畢業(yè)以下172975066.6
合計2596900100.0
注:引自《中國教育成就統(tǒng)計資料》,1984年人民教育出版社標題項目線條
數(shù)據(jù)表注第七頁,共七十九頁,編輯于2023年,星期日二、描述統(tǒng)計
第一章常用統(tǒng)計表、圖及統(tǒng)計量數(shù)2、制表的一般要求A、統(tǒng)計表的內容要簡要,最好一個表說明一個中心內容。標題的措詞要簡明扼要,正確說明內容,使人一望便知。B、分項要準確,以能說明問題為主,分項的好壞是決定統(tǒng)計表質量的關鍵,切忌分項太細。C、數(shù)據(jù)是統(tǒng)計表的語言,說明內容,要求準確,書寫整齊,一律用阿拉伯數(shù)字,單位要統(tǒng)一,位數(shù)對齊,有效數(shù)字要一致,表格內不能有空白。D、線條不要太多,表的上下端有頂線與底線,左右兩邊不要用線封死,縱項目用細線格開,橫項目一律不畫線條,合計項目用粗線條或雙線與其它項目分開。第八頁,共七十九頁,編輯于2023年,星期日(二)常用統(tǒng)計圖1、統(tǒng)計圖結構:圖題、圖目、圖尺、圖例、圖形、圖注人數(shù)
706050403020101980年1985年1991年某校近十年教師人數(shù)及性別變化圖示男女年份圖例圖形第一章常用統(tǒng)計表、統(tǒng)計圖及統(tǒng)計量圖目圖尺(制圖的尺度線。點、單位的總稱)圖題第九頁,共七十九頁,編輯于2023年,星期日2、統(tǒng)計圖的類型及繪制要求繪制統(tǒng)計圖的要求A、根據(jù)數(shù)據(jù)和目的選擇合適的圖形B、圖形所表示的面積或距離要比例適當C、表示不同的事物要用不同的顏色與線條類型:1直條圖2圓形圖3曲線圖4直方圖講師42.9%助教28.8%教授0.4%某大學教師職稱圖副教授21.9%某市7至18歲男女生身高比較圖1.751.701.651.601.551.501.451.40歲789101112131415161718米某校某班50名學生家庭背景情況比較
2015105人數(shù)其他農工商企業(yè)職員公務與科教人員141615
5
2015105人數(shù)其他農工商企業(yè)職員公務與科教人員141615
5(二)常用統(tǒng)計圖第十頁,共七十九頁,編輯于2023年,星期日
3、次數(shù)分布表與直方圖
對一批數(shù)據(jù)按一定次序排列并加以分組、編成反映這群數(shù)據(jù)在各組上出現(xiàn)次數(shù)的統(tǒng)計表和圖,就是次數(shù)分布表和直方圖。例:一次考試之后,某班48名學生的成績如下:
86,77,63,78,92,72,66,87,75,83,74,47,83,81,76,82,97,69,82,88,71,67,65,75,70,82,77,86,60,93,71,80,76,78,57,95,78,64,79,82,68,74,73,84,76,79,86,68
將該組數(shù)據(jù)整理成次數(shù)分布表與直方圖(二)常用統(tǒng)計圖*第十一頁,共七十九頁,編輯于2023年,星期日
1求全距:R=max{xi}-min{xi}用該組數(shù)據(jù)最大數(shù)減最小數(shù)
2定組數(shù)和組距:數(shù)據(jù)劃分組數(shù)、每組上下限之間距離(全距除以組數(shù))
3列組限:從最高分至最低分以組距為單位依次分組
4歸組劃記:計算數(shù)據(jù)出現(xiàn)次數(shù),并計算累積次數(shù)及相對次數(shù)
步驟:例:一次考試之后,某班48名學生的成績如下:86,77,63,78,92,72,66,87,75,83,74,47,83,81,76,82,97,69,82,88,71,67,65,75,70,82,77,86,60,93,71,80,76,78,57,95,78,64,79,82,68,74,73,84,76,79,86,68組限組中值劃記次數(shù)f累積次數(shù)∑f相對次數(shù)Rf累積相對次數(shù)∑Rf95908580757065605550459994898479746964595449225912763101
2491830374346474748
0.040.040.100.190.250.150.130.060.0200.020.040.080.180.370.620.770.900.960.980.981.00正正正正正正合計48481.00次數(shù)分布表
9792878277726762575247K=1.87(n-1)2/5第十二頁,共七十九頁,編輯于2023年,星期日14121086424550556065707580859095100次數(shù)分數(shù)
直方圖第十三頁,共七十九頁,編輯于2023年,星期日(三)常用統(tǒng)計量-集中量數(shù)1、集中量數(shù):代表一組數(shù)據(jù)的集中趨勢和典型特征常用的有:平均數(shù)中數(shù)眾數(shù)第一章常用統(tǒng)計表、統(tǒng)計圖及統(tǒng)計量
(1)
平均數(shù)(算數(shù)平均數(shù))X1、X=(X1+X2+---+Xn)/n=(1/n)∑Xi
(原始數(shù)據(jù)公式)2、X=∑fxc/n(分組數(shù)據(jù)公式)xc:組中值f:次數(shù)3、X=(n1x1+n2x2+---+nkxk)/(n1+n2+---nk)(加權平均數(shù)公式)第十四頁,共七十九頁,編輯于2023年,星期日(2)中數(shù)(中位數(shù)):用Md表示,是在一組按大小順序排列的數(shù)據(jù)中位置居中的那個數(shù)。數(shù)據(jù)是奇數(shù)個時,正好是中間位置的數(shù),即第(N+1)/2個那個數(shù);數(shù)據(jù)是偶數(shù)個時,求中間位置兩個數(shù)的平均數(shù)。如:13679
Md=6;36792021Md=(7+9)/2=8(3)眾數(shù):用M0表示,是一組數(shù)據(jù)中次數(shù)出現(xiàn)最多的那個數(shù)。在眾數(shù)不明顯的情況下,一般可看眾數(shù)段,即哪個分數(shù)段的次數(shù)多,就以該段中點值作眾數(shù)。一般用觀察法求得。眾中平眾中平平中眾
正態(tài)分布正偏態(tài)分布負偏態(tài)分布平均數(shù)、中數(shù)、眾數(shù)在數(shù)據(jù)常態(tài)分布中的相對位置第十五頁,共七十九頁,編輯于2023年,星期日2、差異量數(shù):全距平均差標準差
差異量數(shù)是描述次數(shù)分布中“離中趨勢”這一特征的統(tǒng)計量,簡稱“差異量”。一組數(shù)據(jù),若離中趨勢小,則集中量的代表性就大;反之,若離中趨勢大,則集中量的代表性就小。但是,僅考慮集中量數(shù)是不夠的。要了解兩組學生成績分布的全貌,還必須研究兩個組的差異量數(shù)。最常用的差異量有全距、平均差和標準差。
(1)全距(符號為“R”),指一組數(shù)據(jù)中由最大量數(shù)到最小量數(shù)的距離。R小說明離散程度小,比較整齊。
(2)平均差,指一組數(shù)據(jù)內的每個數(shù)與均數(shù)差的絕對值的算術平均數(shù),通常用AD表示。平均差的計算公式為:
常用統(tǒng)計量-差異量數(shù)AD=(1/n)∑Xi-X或AD=(1/n)∑Xi-Md第十六頁,共七十九頁,編輯于2023年,星期日差異量數(shù)-方差與標準差
(3)、標準差:指一組數(shù)據(jù)中每一個數(shù)值與它們的平均數(shù)之差的平方的算術平均數(shù)的平方根,其符號為S(樣本標準差)、總體標準差用σ表示。S的計算公式為:
S越大表明離散程度越大,數(shù)據(jù)不均勻,集中量的代表性小。
方差與標準差除具有平均差的優(yōu)點之外,還具有受抽樣影響小和適于代數(shù)運算等優(yōu)點,是最優(yōu)良的差異量數(shù)。()()()()nxxxxxxxxSn2232221-++-+-+-=…
X
X1X22S2σ表示樣本方差表示總體方差第十七頁,共七十九頁,編輯于2023年,星期日標準差的應用:變異系數(shù)、標準分數(shù)標準差的應用-變異系數(shù)變異系數(shù)計算公式:主要用于:①同一團體不同觀測值離散程度的比較;②對于水平相差較大,但進行的是同一種觀測的各種團體離散程度的比較。例:已知某小學一年級學生的平均體重為25千克,標準差是3.7千克,平均身高110厘米,標準差為6.2厘米,問體重與身高的離散程度那個大?解:CV體重=3.7/25=14.8%
CV身高=6.2/110=5.64%答:通過比較差異系數(shù)可知,體重的分散程度比身高的分散程度大(14.8>5.64)。變異系數(shù)是一種相對差異量,常用cv表示第十八頁,共七十九頁,編輯于2023年,星期日標準差的應用-標準分
標準分數(shù)(又稱Z分數(shù))。它是一種以平均數(shù)為參照點,以標準差為單位的,表示一個分數(shù)在團體分數(shù)中所處位置的量數(shù),其計算方法為:由原始分數(shù)與平均分數(shù)的差除以標準差所得的量數(shù),其符號為“Z”,計算公式是:標準分是以標準差為單位的,故稱為標準分。它是一種相對地位分。標準分有正負之分,一般在[-3,3]中(幾率為99.74%),平均值為零。標準分可比性根據(jù)在于標準正態(tài)分布。
T分數(shù):T=10Z+50(一般20≤T≤80)
E分數(shù):E=20Z+90(一般30≤E≤150)第十九頁,共七十九頁,編輯于2023年,星期日例:有某生三次數(shù)學考試的成績分別為70、57、45,三次考試的班平均分為70、55、42,標準差分別為8、4、5。如何看待該生的三次考試成績?
答:如果僅從原始分數(shù)看,肯定認為第一次最好,其實不然,要計算出各次的標準分數(shù),才能說明問題。根據(jù)公式得出:Z1=(70-70)/8=0Z2=(57-55)/4=0.5Z3=(45-42)/5=0.6這說明,原始分數(shù)為70,其位置正在平均線上,而原始分數(shù)為57的,其位置在平均線上0.5處,而原始分數(shù)為45的,其位置在平均線上0.6處。很顯然第三次成績最好,第一次最差。標準差的應用-標準分第二十頁,共七十九頁,編輯于2023年,星期日標準分數(shù):
運用標準分比較不同教育測驗成績總分的優(yōu)劣,更為合理。例:甲乙兩學生五科考試成績如下,試分析哪名學生成績好些?語文數(shù)學地理歷史政治合計70.014.080850.711.0785.03.590881.430.8655.04.057510.50-1.0042.05.045400.60-0.4070.08.0709002.503423543.243.03兩考生總成績標準分數(shù)計算表
甲生乙生甲生乙生
科目XSXZ
如果按原始分數(shù)乙生總分是354分優(yōu)于甲生的342分總分,但按標準分數(shù)則甲生的3.24分優(yōu)于乙生的3.03分。標準差的應用-標準分第二十一頁,共七十九頁,編輯于2023年,星期日二、描述統(tǒng)計相關分析:研究兩自變量之間的關系緊密程度的過程,統(tǒng)計學上稱為相關分析。事物的變化總是伴隨著一定的量的變化,有些是單變量,有些是雙變量或多變量,也有些是復變量。集中量數(shù)和差異量數(shù)反映的是單變量數(shù)據(jù)特征,相關分析主要研究雙變量數(shù)據(jù)特征。我們都知道事物現(xiàn)象間的相互關系,如果從數(shù)量關系的角度考察,可分為函數(shù)關系和相關關系兩種類型。相關關系可分為正相關、負相關、直線相關、曲線相關、完全相關(函數(shù)關系)、高度相關、低相關和零相關。如:教育經費的投入與教育事業(yè)發(fā)展規(guī)模和速度之間的關系是正相關;復習次數(shù)與遺忘量之間的關系是負相關。相關分析的方法有二:一是圖示法,一為計算法。第二章相關分析圖示法:將兩組觀測值標在坐標系中●●●●●●●●●●●●●●●●曲線相關●●●●●●●●●●●直線相關第二十二頁,共七十九頁,編輯于2023年,星期日二、描述統(tǒng)計相關系數(shù):是描述兩組數(shù)據(jù)之間相關程度的量數(shù)種類有:積差相關系數(shù)、等級相關、點二列相關和φ相關積差相關系數(shù)(皮爾遜系數(shù)):是描述來自正態(tài)總體兩個連續(xù)變量之間線性相關程度的一種相關量數(shù)r=[n∑xy-(∑x)(∑y)]/√[n∑X2-(∑X)2][n∑y2-(∑y)2]
相關系數(shù)的范圍:-1≤r≤1
當r是正值時為正相關;當r是負值時為負相關;r=0為零相關。通常1r≥0.70為高度相關;0.70r≥0.40為較顯著相關
0.40≥r0為低相關。當然在下結論時還要進行顯著性檢驗第二章相關分析對相關系數(shù)的解釋注意以下問題:
A在小樣本中要做顯著性檢驗;B相關系數(shù)大小差異不是絕對的;C相關系數(shù)不是等距的不能進行大小比較;D相關關系不一定是因果關系第二十三頁,共七十九頁,編輯于2023年,星期日第二章相關分析數(shù)學物理英語物理70757675606360638275657544605660525570559097859780894889r=0.91r=0.26例:數(shù)學與物理、物理與英語相關性比較第二十四頁,共七十九頁,編輯于2023年,星期日第三章正態(tài)分布
在社會、教育現(xiàn)象中大多數(shù)隨機變量都呈現(xiàn)是或近似正態(tài)分布的情形。正態(tài)分布是統(tǒng)計理論與統(tǒng)計應用中最重要應用最廣泛的一種分布。正態(tài)曲線的特點11.52.534.56X
Y0.80.60.40.20σ=0.8,μ=1.5、2.5、4.5二、描述統(tǒng)計
一個正態(tài)分布是由總體的平均數(shù)和總體的方差所決定的。1、正態(tài)曲線及其特點正態(tài)分布x~(μ,σ)的密度函數(shù)曲線2①正態(tài)曲線位于x軸上方,以x=μ
為對稱軸,以x軸為漸近線②曲線的位置和形狀取決于μ
值和σ值
,μ決定位置,σ決定形狀。σ越大曲線越矮胖,σ越小曲線越陡峭
③x=μ時曲線處于最高點,即當x=μ時f(μ)=1/
√2σ為最大值
,曲線呈中間高兩邊低的形態(tài)。p正態(tài)曲線方程:f(x)=【1/(√2
●σ)】e-(x-μ)/2σ22其中:是園周率;e是自然對數(shù)的底;x為隨機變量的取值;μ為正態(tài)分布的均值;
σ為正態(tài)分布的方差。2pp第二十五頁,共七十九頁,編輯于2023年,星期日第三章正態(tài)分布2、正態(tài)分布曲線的重要性質:
-3σ-2σ-σ0σ2σ3σ
68.26%95.46%99.73%
從概率的角度而言:觀測數(shù)據(jù)落在(μ+1σ)內的概率為68.26%;落在(μ+2σ)內的概率為95.46%;落在(μ+3σ)內的概率為99.73%。z=(x-μ)/σ標準正態(tài)分布x~(0,1)z、P的意義如:z=1時P=0.3413
z=2時P=0.4772
z=2.5時P=0.4938
z=3時P=0.4987第二十六頁,共七十九頁,編輯于2023年,星期日3、正態(tài)曲線理論的應用(1)推求學生成績中某些分數(shù)的人數(shù)
例:假定500個學生某科成績近似正態(tài)分布,其X=70,σ=10,試問(1)75分以下有多少人(2)85分以上有多少人(3)75-85分之間有多少人。解:(1)z=(75-70)/10=0.5,查正態(tài)分布表中值為0.6915,因此75分以下的學生占69.15%,75分以下的人數(shù)是500X69.15%=346(人)
(2)z=(85-70)/10=1.5,查正態(tài)分布表中值為0.93319,85分以下的學生占93.319%,因此85分以上的學生占100%-93.319%=6.681%,所以85分以上的人數(shù)是500X6.681%=33(人)(3)75分至85分之間,實際上是75分以上至85分以下的范圍,因此85分的百分率減去75分以下的百分率即為所求93.319%-69.15%=24.169%500x24.169%=121(人)
-3σ-2σ-σ0σ2σ3σ
第二十七頁,共七十九頁,編輯于2023年,星期日正態(tài)曲線理論的應用(2)推求某一特定百分率的成績界限
例:某縣對初一年級學生1000名學生進行能力測驗,其結果為X=75,σ=10,現(xiàn)擬根據(jù)此次結果選取25名學生作為“尖子班”培養(yǎng),假定測驗成績近似正態(tài)分布,問多少分以上才能被選到“尖子班”學習。97.5%2.5%X1.96σ7594.6在正態(tài)分布表中查表中值0.975所對應的標準分數(shù),z=1.96,既是說1000名學生中有97.5%的人數(shù)在標準分數(shù)1.96以下,因此有2.5%的人數(shù)在標準分1.96以上,再將標準分數(shù)1.96化為原始分數(shù)得:
1.96X10+75=94.6(分)答:分數(shù)在94.6分以上才能進“尖子班”。分析:“尖子班”的人數(shù)占全年級的百分比為:25/1000=2.5%用標準分計算更容易理解:σxxZ-=Z=1.96=(x-75)/10X=1.96X10+75=94.6(分)第二十八頁,共七十九頁,編輯于2023年,星期日正態(tài)曲線理論的應用(3)分析測驗試題的難度例:某校學生在一次測驗中,第一題的答對率為15%,第二題的答對率為25%,第三題的答對率為35%,假設這三題所測量的能力近似正態(tài)分布,問1、2、3題的難度值各為多少?各題之間的難度差異怎樣?解:試題難度值比較表題號答對率答錯率難度值難度差異
115%85%1.04225%75%0.670.37335%65%0.390.28在正態(tài)分布中,通常是根據(jù)答錯率找出所對應的標準分數(shù)界限值,此值即為該題的難度比值。由左表可知雖然三題的答對率都相差10%,但第二題與第三題的難度差異卻比第一題與第二題的難度差異要小。x0
0.650.750.85
0.390.671.04第二十九頁,共七十九頁,編輯于2023年,星期日三、推斷統(tǒng)計
教育現(xiàn)象和一切客觀物質世界中的現(xiàn)象一樣,不僅存在質的方面,同時也存在量的方面,而且這兩方面是辯證統(tǒng)一的。教育統(tǒng)計學就是在教育現(xiàn)象的質與量中,專門研究其數(shù)量方面特征的重要工具。在建立了以概率論和抽樣方法為主要依據(jù)后,教育統(tǒng)計學便具有了以局部推知全體,以樣本資料推知總體性質的科學推斷功能。根據(jù)樣本信息對總體參數(shù)狀況的推斷有兩種不同形式,既總體參數(shù)估計和假設檢驗,二者既有區(qū)別也有聯(lián)系。第三十頁,共七十九頁,編輯于2023年,星期日三、推斷統(tǒng)計
1、總體和樣本
所要研究對象的全體叫做總體。其中每一個研究對象叫做個體。從總體中抽取的一部分叫做總體的一個樣本,樣本中個體的數(shù)目叫做樣本容量。
例1:對家用電器質量抽查,確定次品率。不能采用全部檢測的方法。例2:全市要檢查初中學生體育鍛煉達標情況,對每名學生一一測試工作量很大,不僅耗費人力、物力和時間,而且沒有必要。有沒有一種科學的方法只抽測一少部分學生,然后根據(jù)這部分學生的測試成績去推知全市中學生的體育達標情況?
2、參數(shù)與統(tǒng)計量
總體參數(shù)是指一切由觀察測定總體的全部個體而得到的統(tǒng)計量數(shù)(μ,σ);樣本統(tǒng)計量是指為估計總體參數(shù)從樣本所得的統(tǒng)計(,s)。第一章相關概念第三十一頁,共七十九頁,編輯于2023年,星期日推斷統(tǒng)計4、抽樣方法3、隨機誤差樣本統(tǒng)計量與總體參數(shù)之間的差距。從某市參加高考的1200名學生中抽取200名試卷組成一個樣本,計算這200份試卷的平均分和標準差,這200份試卷的平均分和標準差與1200名考生的平均分和標準差是有差距的,不同的抽取帶來不同的差距,這種差距稱之為隨機誤差。A、隨機抽樣(抽簽法、隨機數(shù)字法)B、機械抽樣C、分層抽樣D、整群抽樣抽取樣本應遵循的原則。第一總體中每一個個體被抽中的機會均等,即抽中與抽不中純屬偶然;第二任一個體與其它個體在抽取時無聯(lián)帶關系,即抽中的個體與抽不中的個體無關;第三在條件允許的情況下,盡量使樣本容量大一些。
5.小概率事
在隨機事件中,概率很小的事件被稱為小概率事件,習慣上約定在0.05以下,即當P(A)<5%時,則稱A為小概率事件。在統(tǒng)計推斷中認為,小概率事件在一次試驗或觀察中是不可能發(fā)生的。第三十二頁,共七十九頁,編輯于2023年,星期日
第二章
總體平均數(shù)的區(qū)間估計
(總體平均數(shù)的置信區(qū)間)
推斷統(tǒng)計的基本理論之一就是抽樣理論,而推斷統(tǒng)計的任務則是根據(jù)樣本資料來推斷總體的特征,從而揭示總體的本質和規(guī)律。抽樣分布的幾個重要定理(統(tǒng)計推斷的理論依據(jù))
1.從總體中隨機抽出容量為n的一切可能樣本的平均數(shù)的平均數(shù)等于總體的平均數(shù)。E(x)=μ
2.容量為n的平均數(shù)在抽樣分布上的標準差,等于總體標準差除以n的方根。
σx=σn√
3、從正態(tài)總體中,隨機抽取的容量為n的一切可能的樣本平均數(shù)的分布也呈正態(tài)分布。
4、雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。多個樣本平均數(shù)呈正態(tài)分布~N(μ,)xσn√第三十三頁,共七十九頁,編輯于2023年,星期日
第二章
總體平均數(shù)的區(qū)間估計
(總體平均數(shù)的置信區(qū)間)(一)、原總體的方差已知
樣本平均數(shù)的總體分布,在樣本容量很大時其分布近似于正態(tài)分布,樣本平均數(shù)分布的標準差為σ/√n,根據(jù)正態(tài)分布的性質U=(X-μ)/σX
服從正態(tài)分布。對于給定的α值(0<α<1),則稱(1-α)為置信度,可求出滿足P(U>Uα)=1-α。一般取α=0.01或α=0.05,對應的U0.05=1.96U0.01=2.58。置信區(qū)間:α=0.05(x-1.96σ/√n,x+1.96σ/√n)為總體平均數(shù)95%的置信區(qū)間
α=0.01(x-2.58σ/√n,x+2.58σ/√n)為總體平均數(shù)99%的置信區(qū)間根據(jù)樣本平均數(shù)估計總體平均數(shù)的所在區(qū)間,稱為總體平均數(shù)的區(qū)間估計?;驹恚喊匆欢ǜ怕室螅鶕?jù)樣本平均數(shù)估計總體平均數(shù)的所在區(qū)間。01-αα/2
α/2區(qū)間估計示意圖x-1.96σ/√nx+1.96σ/√n
x+1.96σ/√n
01-αα/2
α/2區(qū)間估計示意圖x-1.96σ/√nx+1.96σ/√n
01-αα/2
α/2區(qū)間估計示意圖x-1.96σ/√nx+1.96σ/√n
第三十四頁,共七十九頁,編輯于2023年,星期日(二)、原總體的方差未知
對于總體方差未知且容量n﹥30,則用S代σ相應的有置信區(qū)間為:α=0.05(x-1.96S/√n,x+1.96S/√n)為總體平均數(shù)95%的置信區(qū)間
α=0.01(x-2.58S/√n,x+2.58S/√n)為總體平均數(shù)99%的置信區(qū)間例:從某地區(qū)高考初試的數(shù)學試卷中,隨機抽取40份,分析后得到如下數(shù)據(jù),平均成績?yōu)?1.2,標準差為3.8,問這一地區(qū)初試數(shù)學平均成績在怎樣的范圍內?答:已知X=51.2S=3.8n=40,本題屬于總體方差未知且大樣本n>30,
因此:置信區(qū)間的下限=51.2-1.96x3.8/√40=50
置信區(qū)間的上限=51.2+1.96x3.8/√40=52
這一地區(qū)初試數(shù)學平均成績有95%的可能性在(50,52)范圍內。同理也可以計算出有99%的可能性在(49.6,52.7)范圍內。第三十五頁,共七十九頁,編輯于2023年,星期日
三、推斷統(tǒng)計第三章顯著性檢驗
平均數(shù)差異的顯著性檢驗(Z檢驗與t檢驗)一、顯著性檢驗的基本思想顯著性檢驗是統(tǒng)計推斷的一種方法,它是確定一個具有已知統(tǒng)計量的樣本是不是從已知對應參數(shù)的總體中抽出來的或是兩樣本的統(tǒng)計量是來自同一總體還是來自不同的總體?;驈牧硗獾慕嵌日f,樣本統(tǒng)計量與總體參數(shù)的差異或兩個樣本統(tǒng)計量的差異究竟是由于抽樣所引起的隨機誤差,還是本質上的誤差,這需要檢驗才能加以確定。判斷這種差異是否顯著,要用概率來回答。如果差異是由于抽樣誤差而引起的可能性大,那末兩者的差異就不顯著,反之兩者的差異就顯著。抽樣誤差的概率大小是由顯著性水平來衡量的。通常采用的顯著性水平為0.05或0.01,如果P>0.05為差異不顯著;如果0.05≥P>0.01差異顯著;如果P<0.01則特別顯著。需要注意的是,顯著性檢驗是以隨機樣本為前提的,以概率論原理為基礎的,所以進行檢驗時應注意樣本的隨機性,以及樣本的可比性,觀測指標的所有條件應盡可能相同或基本相同。0
0.0250.025接受假設區(qū)域
0.95拒絕假設區(qū)域拒絕假設區(qū)域第三十六頁,共七十九頁,編輯于2023年,星期日
二、顯著性檢驗的一般方法一般來說,統(tǒng)計檢驗先對總體的分布規(guī)律作出某種假說,然后,根據(jù)樣本提供的信息,對假說作出肯定或否定的決策。具體步驟為:①提出假設。如“假設兩個群體平均數(shù)沒有差別”,其數(shù)學符號為:“H0:μ1=μ2”,這種對群體所作的“無差別”的假設,稱為“零假設”或稱虛無假設,用符號“H0”表示。與此同時實際上存在第二種假設,“兩個總體平均數(shù)有差別”,其符號為:“H1:μ1≠μ2”,稱為備擇假設。顯然,“零假設”與“備擇假設”是兩個對立的假設,肯定是此否定彼。②根據(jù)不同條件和樣本提供的信息即數(shù)據(jù),從零假設出發(fā),代入相應的公式,計算出零假設的概率。③作出統(tǒng)計決斷,根據(jù)“小概率事件實際上不可能性”原理,研究H0成立的概率。如果H0的概率P>
0.05,表示零假設不是一個小概率事件,則H0成立,便否定被擇假設H1從而確定“μ1=μ2”。如果H0的概率p≤0.05,表明是個小概率事件H0不成立,就肯定備擇假設H1的成立,從而確定“μ1≠μ2”。
④結論:當P>0.05時差異不顯著;當0.01≤p≤0.05時差異顯著;當P≤0.01時差異特別顯著。
三、推斷統(tǒng)計第三章顯著性檢驗第三十七頁,共七十九頁,編輯于2023年,星期日推斷統(tǒng)計(顯著性檢驗)三、顯著性檢驗的一般步驟:1、建立檢驗假設(H0:=μ或μ1=μ2)2、選擇和計算統(tǒng)計量(z值或t值)3、確定P值4、判斷結果:當P>0.05為差異不顯著接受檢驗假設當0.05≥P>0.01差異顯著拒絕檢驗假設當P≤0.01差異特別顯著拒絕檢驗假設第三十八頁,共七十九頁,編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(Z檢驗)1、兩個獨立大樣本平均數(shù)差異的顯著性檢驗
Z檢驗是一般用于大樣本(即樣本容量大于30)平均值差異性檢驗的方法。它是用標準正態(tài)分布的理論來推斷差異發(fā)生的概率,從而比較兩個平均數(shù)的差異是否顯著。
Z檢驗公式:例1987年上海市初中三年級語文教學調查中,對男女生語文測試成績作如下統(tǒng)計,試檢驗男女生語文成績是否存在顯著差異,性別人數(shù)總分閱讀寫作平均分標準差平均分標準差平均分標準差男167113.7420.9571.6415.1142.129.73女159118.5219.0974.8714.0144.438.83差值|Z|2.152.002.27抽取的兩個樣本均大于30,屬兩個獨立大樣本平均數(shù)差異的顯著性檢驗,用Z檢驗。差異異常顯著p≤0.01Z≥2.58差異顯著0.05>p>0.011.96≤Z<2.58差異不顯著P>0.05Z<1.96檢驗pz第三十九頁,共七十九頁,編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(Z檢驗)檢驗步驟:①提出零假設z:H0:μ1=μ2即假定男女寫作、閱讀及讀寫總分均無顯著差異,現(xiàn)在的差異是抽樣誤差所致。②計算統(tǒng)計量,代人Z值公式0
0.0250.025接受假設區(qū)域
0.95拒絕假設區(qū)域拒絕假設區(qū)域差異異常顯著p≤0.01Z≥2.58差異顯著0.05>p>0.011.96≤Z<2.58差異不顯著P>0.05Z<1.96檢驗pz第四十頁,共七十九頁,編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(Z檢驗)③計算出的Z值與下表進行對照,作出判斷:|Z|P差異顯著性>1.96<0.05差異顯著>1.96<0.05差異顯著>1.96<0.05差異顯著
因為|Z寫|=2.27,顯然,|Z寫|>1.96,表明概率P≤0.05,男女生寫作成績差異顯著。因為|Z讀|=2.00,顯然,|Z讀|>1.96,表明概率P≤0.05,男女生閱讀成績差異顯著。因為|Z總|=2.15,顯然,|Z總|>1.96,表明概率P≤0.05,男女生語文成績差異顯著。④結論:當P≤0.05時,拒斥H0,肯定H1,1987年調查說明上海市初三語文成績男女生存在顯著差異,女生高于男生。0
0.0250.025接受假設區(qū)域
0.95拒絕假設區(qū)域拒絕假設區(qū)域-1.961.96第四十一頁,共七十九頁,編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(t檢驗)2、小樣本與總體均數(shù)的差異檢驗
t檢驗是用于小樣本(樣本容量小于30)時的平均值差異程度檢驗方法。它是用t分布理論來推斷差異發(fā)生的概率,從而比較兩個平均數(shù)的差異是否顯著。例某校初一年級抽出一組20人,對數(shù)學自學輔導教材進行試驗,期末全年級測試平均成績?yōu)?0分,而這20人的平均分為=77.7,標準差為15,試檢驗實驗效果。本例隨機抽樣樣本容量為20人,屬小樣本,因此適用t檢驗。所謂檢驗實驗效果,就是以樣本(20人)的平均數(shù)與某已知總體平均數(shù)μ之間的差異程度的顯著性檢驗,既檢驗樣本所取自(所代表)的總體的平均數(shù)μ與μ0,是否有差異。t檢驗公式:第四十二頁,共七十九頁,編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(t檢驗)檢驗步驟:①提出零假設:H0:μ=μ0,即假定樣本所代表的總體平均數(shù)與已知平均數(shù)無顯著差異,如有差異僅是抽樣誤差所致。本題μ0=70分②計算檢驗統(tǒng)計量t值。用如下公式式中,=樣本平均數(shù)77.7;μ0=已知總體平均數(shù)70;
s=樣本標準差15;n=樣本容量20,代人公式得第四十三頁,共七十九頁,編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(t檢驗)
③作出判斷。與正態(tài)分布曲線不同,t分布的曲線形式隨自由度大小而不同。“自由度”記作“df”。作總體平均數(shù)的假設檢驗時,統(tǒng)計量t的自由度df=n-1。據(jù)此,本題的df=20-1=19。查t值表,得出理論t值為:
t(19)0.05=2.093再與計算所得t值比較可得:t=2.24>t(19)0.05=2.093依據(jù)《t值與差異顯著性關系》表,推斷H0發(fā)生的概率,作出結論。
t值與差異顯著性關系tP差異顯著性<t(df)0.05>0.05差異不顯著≥t(df)0.05≤0.05差異顯著≥t(df)0.01≤
0.01差異十分顯著因為t=2.31>t(df)0.05,從上表可知,概率P≤0.05時,μ和μ0之間的差異顯著。因此可下結論為:拒斥H0:μ=μ0,而肯定H1:μ≠μ0,又因μ>μ0,故結論表明新教材實驗有成效。第四十四頁,共七十九頁,編輯于2023年,星期日平均數(shù)差異的顯著性檢驗(t檢驗)
3、其它檢驗公式
如果是按同一組樣本不同情況的測試所得的平均值1和2來檢驗平均值的差異程度,其計算公式為:式中,D為兩次測試中每對分數(shù)之差即D=X2-X1。對于兩個獨立的正態(tài)總體,如果已知兩總體方差相等但未知總體方差具體數(shù)值,從中各抽取一隨機樣本,兩樣本平均數(shù)之差將服從自由度為
的t
分布。其檢驗統(tǒng)計量的計算公式
第四十五頁,共七十九頁,編輯于2023年,星期日實驗設計簡述實驗設計:實驗者為了揭示實驗中的自變量與因變量的關系,在實驗之前所作的實驗計劃,通常指實驗程序的計劃和安排。而實驗程序的計劃和安排離不開統(tǒng)計、檢驗。實驗設計的內容:包括怎樣選擇被試(實驗對象),控制那些因素,指出什么假設,觀察那些內容,如何安排實驗步驟,采取何種統(tǒng)計方法來處理和分析實驗結果等等。第四十六頁,共七十九頁,編輯于2023年,星期日例:控制變量指示語(一)目的:通過把指示語作為自變量,觀察被試對反應變量的不同影響,從而了解到不是以指示語為自變量的實驗中控制指示語的重要性。(二)材料:數(shù)學試卷一份,馬表。(三)程序:1按全班被試的數(shù)學程度,分為數(shù)學能力相同的甲、乙兩組。
2主試僅向甲組被試著重指出:你們在運算時必須注意試題中數(shù)字之間的關系,余內容兩者相同。
3主試說明實驗要求,發(fā)給各被試試題一張,覆置桌上。主試發(fā)“預備”口令時,被試把題紙翻轉正面,寫好姓名等項,主試發(fā)“開始”口令時,同時開動馬表,被試答題。
4被試做完題目,立即停筆并問得答題時間,記錄在試題紙上。
5全組做完,主試宣布答案,被試加以核對,并記錄成績,以便整理全組結果。(四)結果:1統(tǒng)計甲乙兩組的平均成績(做對題數(shù)和做題的時間)
2檢驗兩組時間(或成績)差異的顯著性(五)討論:1在本實驗中,你是怎樣發(fā)現(xiàn)題目的規(guī)律的
2指導語在解題中所起作用如何第四十七頁,共七十九頁,編輯于2023年,星期日實驗設計簡述附:數(shù)學試題如下姓名——組別——時間——在下列各數(shù)列后的橫線上,填寫你認為應該填寫的數(shù)字(1)26101418————(2)31248192768————(3)8421————(4)31/4833/4————(5)455667————(6)38131823————(7)134679————(8)72503-2————(9)1346101222————(10)1222428————第四十八頁,共七十九頁,編輯于2023年,星期日第二部分教育測量學原理簡介第一章教育測量概述一教育測量的含義與特點二教育測量發(fā)展的歷史三教育測量的要素和種類四教育測量的功能及對教育測量應持的態(tài)度第二章測驗的信度、效度、難度與區(qū)分度一、測驗的信度二、測驗的效度三、測驗的難度四、測驗的區(qū)分度第三章測驗的編制與實施一、確定測驗目的二、教育目標分類
三、編制測驗雙向細目表四、試題的編制五、試題評分六、試卷的編輯與測驗實施七、試卷分析第四章題型編制的一般原理與方法第四十九頁,共七十九頁,編輯于2023年,星期日第一章教育測量概述
一、教育測量的含義與特點
1、教育測量的含義測量(Measurement):通常指人們對客觀事物進行某種數(shù)量化的測定。測量是以數(shù)量來表述結果的,沒有數(shù)量來表述的結果不能稱為測量。
教育測量(EducationalMcasufement):就是對學生的學習能力、學業(yè)成績、興趣愛好、思想品德以及教育措施上許多問題的數(shù)量化測定。
教育測量主要對學生精神特性的測定。凡物之存在必有其數(shù)量,凡有數(shù)量的東西都可以測量,測不準原理。第五十頁,共七十九頁,編輯于2023年,星期日一、教育測量的含義與特點測量、測驗、考試、評價的聯(lián)系與區(qū)別
測量與測驗:測驗(Test)是引起某種行為的工具,通常是指運用某些儀器、試題來引起人們的某種行為,從而測定人們的某種特性。它是進行數(shù)量化分析和科學推斷的前提和手段。測量比測驗的含義要廣泛,測量不僅包括著運用儀器、試題來進行測定事物的質量與特性,而且還包括著運用調查、觀察等方法來測量事物的質量與特性,測量既包括對事物的測驗,又包含對事物進行數(shù)量化的分析,并對測驗結果進行一定的解釋和評價。
測驗與考試(Examination)也不盡相同。我們平時所說的考試,通常只憑教師自己的經驗去出試題和評分,帶有主觀隨意性。測驗是經過較細致的科學分析才編制出測驗的題目,在測驗的程序和評分方面也有較嚴格的要求??荚囈话阌糜诳己藢W生的學業(yè)成績,測驗不僅用于考核學生的學業(yè)成績,還用于心理特性的測量。
測量與評價(Evalution)既有聯(lián)系,也有區(qū)別。測量強調的是數(shù)量化,評價則是突出價值觀,充分重視對問題的分析與評斷。第五十一頁,共七十九頁,編輯于2023年,星期日一、教育測量的含義與特點2、教育測量的特點
(1)教育測量一般是間接測量我們只能通過學生對測驗題目的反應和一些行為表現(xiàn)運用推理、判斷的方法,來間接的測量出他們的知識水平、智力高低和品德好壞。(2)教育測量的度量單位是相對的學生的學業(yè)成績好壞、智力高低和能力大小等,都是就其在所在團體的整個分數(shù)序列、行為序列中的地位來說的,其測量的分數(shù)單位,并非絕對的。
(3)教育測量是為實現(xiàn)教育目的服務的是為改進教育工作,提高教育質量,更好地實現(xiàn)教育目的服務的。不能脫離教育目的和教材的要求,隨意地制定測驗量表,任意地進行測量。對各種教育測量結果的評價,也都應依據(jù)教育目的的要求來進行。第五十二頁,共七十九頁,編輯于2023年,星期日第一章教育測量概述
二、教育測量發(fā)展的歷史主觀經驗性考試階段(1864年以前)
教育測量起源于我國的科舉考試制度。
客觀標準化測驗階段(1864一1940年)
法國的比納、西蒙,美國的推孟、桑戴克、麥柯爾比納被稱為智力測量的鼻祖,桑戴克被稱為教育測量學的鼻祖客觀測驗的深入發(fā)展階段(1940年-)
過去教育測量多為對學生知識的測量,很少測量學生的心理和品德?,F(xiàn)在的教育測量,不僅重視測量學生的知識,而且重視學生的智力和思想品德的測量。過去教育測量的量表編制多為單一答案的求同式思維,缺乏多種答案的求異式思維,現(xiàn)在教育測量的量表中,也包括有多種答案的求異式思維題和論文題。過去教育測量多用于對學生的學習成績的測量,很少涉及課程設置、教材、教育改革方案等效益方面的測量,現(xiàn)在在教育工作的各個方面都運用教育測量。過去教育工作中的客觀測驗,一般是常模參照測驗,現(xiàn)在教育工作中的客觀測驗,不僅有“常模參照性測驗”,而且有“目標參照性測驗”。第五十三頁,共七十九頁,編輯于2023年,星期日
第一章教育測量概述
三、教育測量的要素和種類單位
教育測量中的單位不是絕對等價值的
參照點
教育測量的參照點都屬于人為設定,從參照點起計算的分數(shù)不能以“倍數(shù)”的方式解釋
量表
具有單位和參照點的連續(xù)體。
教育測量所使用的量表有四種:百分量表、年齡量表、等級量表、T量表
2、教育測量的種類
以測量的對象來分:學業(yè)成績測驗、智力測驗、人格測驗、特殊能力測驗
以測量的目的來分:預測測驗、形成性測驗、總結性測驗、診斷性測驗、難度測驗、速度測驗
以測量的方式來分:個人測驗、團體測驗以試題的形式來分:客觀性測驗、論文式測驗、投射測驗、情景測驗
1、教育測量的要素第五十四頁,共七十九頁,編輯于2023年,星期日第一章教育測量概述
四、教育測量的功能及對教育測量的認識態(tài)度1、教育測量的功能教育測量是改進教學的良好工具教育測量是教育管理的重要手段教育測量是教育研究的重要方法2、對教育測量應有的認識態(tài)度教育測量是一種工具教育測量尚需完善對教育測量應持嚴肅的態(tài)度第五十五頁,共七十九頁,編輯于2023年,星期日教育測量學原理第二章測驗的信度、效度、難度與區(qū)分度
測驗的信度、效度、難度與區(qū)分度是衡量測量質量的基本標準作為教育測量的工具——測驗,它的編制是一項十分復雜的工作,它需要懂得一些教育測量基本知識和基本方法的人來完成。一個連信度、效度、難度和區(qū)分度等教育測量基本概念都不甚了解的人是難以編出高質量的測驗的。從教育測量的理論上來講,一個良好的測驗應該具備以下條件:
測驗的試題與測量的目標吻合測驗的試題應具有代表性測驗的試題有恰當?shù)碾y度和區(qū)分度測驗的試題的語言陳述簡單、明確測驗的結果有效和可靠(即效度、信度高)測驗的實施符合經濟性原則其中測驗的信度、效度、難度和區(qū)分度是衡量測驗質量的基本指標。第五十六頁,共七十九頁,編輯于2023年,星期日測驗的信度、效度、難度與區(qū)分度
一、信度(reliability)
所謂測驗的信度是指測驗的可靠性或者可靠程度。具體地說,測驗的信度是指同一組學生用同一測驗實施兩次后所得分數(shù)的一致性,或者同一組學生經過一次測驗后,用另一個同質的測驗再測一次,這兩次測驗所得分數(shù)的一致性。根據(jù)統(tǒng)計學的基本原理,刻劃測驗的信度有三種方法:
①穩(wěn)定性系數(shù)穩(wěn)定性系數(shù)的求法是:先對某個測驗實施一次,過了一段時間后。再用這個測驗實施一次,然后計算學生在前后再次測驗中所得分數(shù)的相關系數(shù)。這個相關系數(shù)就是穩(wěn)定性系數(shù)。
②等值性系數(shù)等值性系數(shù)的求法是:等值性系數(shù)是以兩個等值(題型、題數(shù)、難度、區(qū)分度相等)但具體內容不同的量表,在最短時距內,對相同應試者先后施測兩次的兩組對應分數(shù)的相關系數(shù)。
③內部一致性系數(shù)
內部一致性系數(shù)的求法是:將一個測驗分數(shù)分為兩個相等而獨立的部分(例如奇數(shù)題和偶數(shù)題),然后求兩者的相關系數(shù)。對于這個相關系數(shù),再用斯皮爾曼-布朗公式r信=2r/1+r來校正。其中r是相關系數(shù),r信就是內部一致性系數(shù)。第五十七頁,共七十九頁,編輯于2023年,星期日測驗的信度、效度、難度與區(qū)分度
在前述三種類型的信度系數(shù)中,前兩個都要學生接受同一(或同質)內容的兩次測驗,這在實際的中小學教育過程中是不現(xiàn)實的。因此,在中小學教育或從事教育科學研究的過程中,信度系數(shù)的計算一般以內部一致系數(shù)為主。測驗的信度是十分重要的,不可靠的測驗是沒有什么意義的,如用一桿秤去稱肉,第一次稱的的重量是1500克,第二次稱得的重量是1000克,那么這種秤還有什么用呢?教育測量也是如此,如用一次去測量學生的數(shù)學學業(yè)水平,第一次測驗的成績是92分,第二次測驗的成績卻只有61分,這樣就無法確定這個學生的數(shù)學學業(yè)水平。當然,這個測驗是根本不可靠的。就測驗的內容而言,學業(yè)成績測驗要求信度系數(shù)在0.9以上,常達到0.95;智力測驗應達到0.85以上;個性測驗和興趣測驗稍低,應在0.7~0.8.第五十八頁,共七十九頁,編輯于2023年,星期日測驗的信度、效度、難度與區(qū)分度
提高測驗信度的方法:①延長測驗的長度。量表題目越少,得分越容易受試題抽樣的偶然因素影響,當然測驗的信度也越低。新增加的試題必須與原試題同質(平均難度一樣)且不使被試感到厭倦。②測驗的難度要適中,同一測驗中的試題難度水平接近。③施測內容盡量單一。不要妄圖在一次測驗中測量被試的所有能力,信度很低。④測驗的時間要充分,使被試從容回答問題。⑤測驗的程序要統(tǒng)一。進行多次測驗,開始時的指導語、回答問題方式、分發(fā)收回試卷的辦法、時間掌握都要盡量一致。⑥評分要客觀。客觀性測驗,評分標準明確有助于提高測驗的信度。主觀性試題,受偶然因素影響大,往往評分者的“量尺”不統(tǒng)一,信度差。⑦加大應試者之間的差異。因為信度系數(shù)的大小與實得分數(shù)成正比,加大被試能力的差異可提高信度。2σ第五十九頁,共七十九頁,編輯于2023年,星期日測驗的信度、效度、難度與區(qū)分度
二、效度(Validity)
所謂測驗的效度是指一個測驗真正能確實測量到它所要測量的東西的程度。它是針對測量的目的和結果而言的。根據(jù)測量的目的,可以把測驗的效度分為內容效度、結構效度和效標關聯(lián)效度三種。
①內容效度
內容效度是指測驗目的代表準備測驗的內容和引起的預期反應所達到的程度。如在教育實驗研究的測量中,“準備測量的內容”是指實驗自變量的變化,“預期反應”是指實驗因變量的變化。目前,對測驗的內容效度沒有恰當?shù)挠嬎惴椒?,尚不能用一個簡單數(shù)字來刻劃它?,F(xiàn)在判斷測驗的內容效度一般是用邏輯分析法或內容分析法。
②結構效度測驗的結構效度是指測驗結果能夠說明教育學和心理學理論的某種結構或特征的程度。它可以理解為測驗實際上測量了準備測量的結構特征所達到的程度。測驗的結構效度問題比較復雜。一般在中小學教育和教育科學研究中所使用的自編測驗是不考慮這個問題的。
③效標關聯(lián)效度
測驗的效標關聯(lián)效度是指測驗結果與作為效標的另一個獨立的測驗結果之間的一致性程度。這種一致性程度一般是用本測驗結果與另一個獨立的測驗結果之間的相關系數(shù)來描述的。那個獨立的測驗結果是用來估計本測驗效度的標準,所以叫做效標。實際上,效標在一定程度上用另一個獨立測驗結果反映本測驗準備測量的某些特征。由于效標是計算測驗的效標關聯(lián)效度的主要依據(jù)。因此,效標必須確實能反映某個方面的特征。只有這樣才能成計算測驗效標關聯(lián)效度的依據(jù)。第六十頁,共七十九頁,編輯于2023年,星期日測驗的信度、效度、難度與區(qū)分度效度的統(tǒng)計定義:提高效度的方法
①控制系統(tǒng)誤差。
②精心編制量表。
③妥善組織測驗
④擴充樣本的容量和代表性。
⑤合理處理信度和效度的關系。從某種意義上講效度比信度更重要第六十一頁,共七十九頁,編輯于2023年,星期日
三、難度:被試完成題目(item)任務時所遇到的困難程度。
在教育測量中,某測驗的難度一般是用正確解答該測驗題的人數(shù)與參與測驗的學生數(shù)的比值來刻劃的。用公式表示即P=R/N其中,P表示某測驗題的難度,R表示答對該測驗題的人數(shù),N表示參加測驗的人數(shù)。難度對測驗有很大的影響。這種影響主要體現(xiàn)在影響測驗成績的分布,影響測驗成績的離散程度;影響測驗的區(qū)分能力等三個方面。難度計算,常用的以下幾個公式:①P=X/W
其中P表示某測驗題的難度,X表示接受測驗的學生在該測驗題上的平均分數(shù),W表示該測驗題的最高得分。②P=PH+PL/2
其中P表示某測驗題的難度,PH表示接受測驗的高分組學生(占總數(shù)的27%)在該測驗題的通過率,PL表示接受測驗的低分組學生(占總數(shù)的27%)在該測驗題的通過率。③P=XH+XL-2NL/2N(H-L)該公式只適宜計算論文式測驗題的難度。其中P表示某測驗題的難度,XH表示接受測驗的高分級學生的得分總數(shù),XL表示接受測驗的低分級學生的得分總數(shù),N表示接受測驗的學生總數(shù)。H表示該測驗題的最高可能得分,L表示該測驗題的最低可能得分。測驗的信度、效度、難度與區(qū)分度第六十二頁,共七十九頁,編輯于2023年,星期日
四、區(qū)分度
區(qū)分度又叫鑒別力,它是測驗對學生實際水平的區(qū)分程度的指標。一個具有良好區(qū)分度的測驗題,實際水平高的學生應該得高分,實際水平低的學生應該得低分。測驗的區(qū)分度有積極區(qū)分度和消極區(qū)分度兩種。積極區(qū)分是指區(qū)分的方向與測驗總分的方向一致的區(qū)分,區(qū)分的方向與測驗部分的方向不一致的區(qū)分是消極區(qū)分。測驗題的區(qū)分度的取值范圍在-100至100之間。如果區(qū)分度是負值,則表示該區(qū)分是消極區(qū)分;如果區(qū)分度為0,則表示
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五農行個人貸款抵押合同資產保全操作流程
- 2025年度綠色建筑項目融資及還款合同3篇
- 二零二五年度農村土地流轉農民公寓產權登記合同
- 2025年度美術作品版權授權與收益分成合同
- 2025個人信用卡透支額度調整合同補充協(xié)議3篇
- 二零二五年度城鄉(xiāng)規(guī)劃編制與實施監(jiān)督合同4篇
- 二零二五年度土地儲備項目土地資源評估委托合同
- 2025年度別墅裝修材料環(huán)保檢測認證合同3篇
- 2025年度建筑工程合同履行與索賠風險防控指南2篇
- 第三人民醫(yī)院二零二五年度肉類配送服務及食品安全監(jiān)控協(xié)議3篇
- 充電樁巡查記錄表
- 阻燃材料的阻燃機理建模
- CJT 511-2017 鑄鐵檢查井蓋
- 配電工作組配電網集中型饋線自動化技術規(guī)范編制說明
- 職業(yè)分類表格
- 2024高考物理全國乙卷押題含解析
- 廣東省深圳高級中學2023-2024學年八年級下學期期中考試物理試卷
- 介入科圍手術期護理
- 青光眼術后護理課件
- 設立工程公司組建方案
- 《物理因子治療技術》期末考試復習題庫(含答案)
評論
0/150
提交評論