教育統(tǒng)計與測評技術(shù)教案_第1頁
教育統(tǒng)計與測評技術(shù)教案_第2頁
教育統(tǒng)計與測評技術(shù)教案_第3頁
教育統(tǒng)計與測評技術(shù)教案_第4頁
教育統(tǒng)計與測評技術(shù)教案_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

教育統(tǒng)計與測評技術(shù)教案總論教育統(tǒng)計與測評技術(shù)實際上涵蓋三門課程:教育統(tǒng)計、教育測量與教育評價。將教育統(tǒng)計、教育測量與教育評價聯(lián)系起來進行研究與探討,這不僅符合三門學科之間的邏輯關(guān)系,更有利于整合三門學科的優(yōu)勢,充分發(fā)揮它們在教育管理、教育教學實踐、教育研究等領(lǐng)域中的作用。無論是從教育管理、教育教學實踐的層面,還是從教育科學研究的層面,教育統(tǒng)計與教育測量都是開展教育評價不可或缺的環(huán)節(jié),它們是教育評價獲得評價信息的必要手段和有力工具。教育測量側(cè)重于為教育評價提供反映事物本質(zhì)狀態(tài)的原始數(shù)據(jù),教育統(tǒng)計著力于對這些數(shù)據(jù)進行整理、分析、描述與推斷,從而提供反映事物本質(zhì)狀態(tài)的統(tǒng)計數(shù)據(jù),依據(jù)這些統(tǒng)計數(shù)據(jù),教育評價才能作出科學、客觀、準確的價值判斷。所以,三者的關(guān)系是:測量統(tǒng)計評價其中,測量是前提,統(tǒng)計是關(guān)鍵,評價是目標。但從學知識的角度來看,了解統(tǒng)計知識則是測量的前提,而掌據(jù)測量知識又是評價的前提,所以我們按統(tǒng)計、測量、評價的順序來開展教學。教育統(tǒng)計第一章概述一、統(tǒng)計學概述(一)何為統(tǒng)計?統(tǒng):匯總起來;總括;全部。計:計算。統(tǒng)計:將數(shù)據(jù)匯總起來加以計算,即對某一現(xiàn)象有關(guān)的數(shù)據(jù)的搜集、匯總、整理、計算和分析等。統(tǒng):搜集、匯總;計:整理、計算、分析。統(tǒng)計學分為研究統(tǒng)計理論的數(shù)理統(tǒng)計學和研究統(tǒng)計實踐的應用統(tǒng)計學兩部分。數(shù)理統(tǒng)計學對統(tǒng)計原理和統(tǒng)計方法進行證明,應用統(tǒng)計學是統(tǒng)計原理和方法就應用于各個實踐領(lǐng)域,如:金融統(tǒng)計學、心理統(tǒng)計學、教育統(tǒng)計學。教育統(tǒng)計學是將統(tǒng)計原理和方法用來研究教育問題的一門應用科學。它研究如何收集、整理、分析由教育調(diào)查和教育實驗所獲得的數(shù)據(jù)資料,并以此為依據(jù),進行科學推斷,提示教育現(xiàn)象所蘊含的客觀規(guī)律的一門科學。(二)統(tǒng)計為何?一為描述,對事物的現(xiàn)狀等加以描述(比如,對某地的男女教師的比率進行描述);二為推斷:對事物的總體性質(zhì)、特點、發(fā)展趨勢等加以推斷(比如,根據(jù)樣本信息推斷總體信息)。(三)如何統(tǒng)計?二、教育統(tǒng)計學概述(一)教育統(tǒng)計的過程1.教育統(tǒng)計資料的收集教育統(tǒng)計資料的來源:觀察、調(diào)查、實驗以及文獻資料,其中主要資料來自于教育調(diào)查和教育實驗。全面性原則、準確性原則、客觀性原則2.教育統(tǒng)計資料的整理用統(tǒng)計表和統(tǒng)計圖對資料分組歸類、檢查核實原始數(shù)據(jù)、計算描述數(shù)據(jù)的特征量等3.教育統(tǒng)計資料的分析對整理后的數(shù)據(jù)進行對照比較、分析新情況、發(fā)現(xiàn)新問題、揭示教育的規(guī)律和發(fā)展趨勢,并將分析研究資料的結(jié)果寫成分析報告。(二)教育統(tǒng)計學的初步概念比如,要對某地的教師情況作一研究,那該地的教師就是被試。被試有多方面的性質(zhì),有的是恒定不變的,稱常量;有的變化的,稱為變量。要對被試的整體中的每一個進行研究,在時間精力上有難度,這就需要從研究對象中抽取一部分出來研究,這一過程稱為抽樣,抽出來的部分稱為樣本。然后,根據(jù)樣本的數(shù)據(jù)去推測總體的數(shù)據(jù),樣本的數(shù)據(jù)稱為統(tǒng)計量,由樣本推測出來的總體的數(shù)據(jù),稱為參數(shù)。抽樣一般以隨機的進行,抽出來的樣本的數(shù)據(jù)可能會與總體有一定的誤差。又如,要對中學生的課堂參與度與其學習成績之間的關(guān)系進行研究。被試被試即為被研究者的簡稱,被試通常也稱為受試或研究對象。如:實驗被試、觀察被試。常量與變量在教育研究中,一些量是可以變化的,我們將之稱為變量,這些量是在性質(zhì)、數(shù)量上可以變化的量以及測量或操縱的因子或條件,如學生年齡、學習內(nèi)容、學習成績、學習能力等。與之相反,一些量是固定不變的,我們將之稱為常量或常數(shù),如圓周率、重力等。變量依其相互關(guān)系,可分為自變量和因變量。自變量是自身變化的量,而因變量是因自變量變而隨之變的量,常將自變量作為實驗因素,又稱實驗因子,它是由實驗者操縱的。因變量是一種假定的結(jié)果變量,是實驗對象在實驗因素和其他控制變量的作用下的反應。比如,將學生的課堂參與度設為自變量,將學生的學習成績設為因變量。自變量與因變量的關(guān)系可以用下式表示:y=f(x)變量依其性質(zhì)不同,可分為品質(zhì)變量和數(shù)量變量。品質(zhì)變量只說明事物的屬性、類別以及等級上的特征,不表示事特之間差異的大小。如學生性別、學生品德(優(yōu)、良、中、差)。數(shù)量變量則用來說明事物數(shù)量上的差異,比如,學生身高、學生學習成績。根據(jù)變量是否成為某特定研究所操作的因子或條件,變量可分為研究變量與非研究變量。研究變量指特定研究所要操作的變量,非研究變量指特定研究所操作變量以外的變量,也稱為無關(guān)變量。比如,研究學生課堂參與度與學習成績的關(guān)系,學生課程參與度就是研究變量,而教材、教師等就是非研究變量。變量根據(jù)其所表示的數(shù)據(jù)的性質(zhì),可分為稱名變量、順序變量、等距變量和比率變量。抽樣、樣本、隨機在教育研究中,所研究的總體包含的數(shù)目往往很多,不宜對總體全部進行研究。例如,我們研究全國中學生課堂參與度與其學習成績的關(guān)系,全國的中學生太多,對這一總體各個學生的課堂參與度都進行研究是很費力、很費時、很困難的,而且不是很現(xiàn)實,為減少研究的困難與麻煩,我們采取從中抽取一部分學生進行研究。這種從總體中抽出一部分個體的方法,我們稱之為抽樣或取樣。所抽出的部分稱之為樣本。樣本中所含的個體的數(shù)目,稱為樣本的容量。如果容量大于30,一般稱之為大樣本;容量小于或等于30,一般稱之為小樣本。抽樣是從總體中抽取一部分進行研究,并根據(jù)樣本研究結(jié)果來推斷總體的特征或規(guī)律。要確保推斷的準確性,樣本要能代表總體,抽樣應遵循隨機原則,否則所抽取的樣本不具代表性。隨機即隨機現(xiàn)象,具有以下三種特性:第一,一次試驗有多種可能結(jié)果,其所有可能結(jié)果是已知的;第二,試驗之前不能預料哪一種結(jié)果會出現(xiàn);第三,在相同的條件下可以重復試驗。比如,拋硬幣,彩票。這種現(xiàn)象稱為隨機現(xiàn)象。隨機現(xiàn)象的每一種結(jié)果叫做一個隨機事件。表示隨機現(xiàn)象各種結(jié)果的變量稱為隨機變量,統(tǒng)計處理的變量都是隨機變量。(1)單純隨機抽樣單純隨機抽樣是從總體中完全隨機地抽取個體的一種方法。單純隨機抽樣可通過抽簽以及隨機數(shù)目表來實現(xiàn)。(2)機械抽樣機械抽樣,又稱為系統(tǒng)抽樣或等距抽樣,是指將總體中的各個個體按一個與研究問題沒有直接關(guān)系的標志(如時間、地區(qū)等)加以排列,然后依據(jù)固定順序或固定間距進行抽樣。比如,要了解某中學高一新生的英語水平,設該校該年級有1000名學生,要抽取100人,可先將這1000名學生按報名先后順序(學號)進行排序,并從1至1000進行編號,然后按1,11,21……號碼的順序和間隔抽取樣本。機械抽樣比單純隨機抽樣更能保證抽到的個體在總體中的分布比較均勻,而單純抽樣比機械抽樣的隨機性強,因為單純隨機抽樣可以由總本內(nèi)所有的個體組成任何可能的樣本,而機械抽樣對上例而言,只有10個可能樣本。在實踐應用中,可以將機械抽樣和隨機抽樣結(jié)合起來使用,如上例先按機械抽樣原則進行分組,再按單純隨機抽樣原則在組內(nèi)進行抽樣。(3)分層抽樣分層抽樣是把總體中各個個體按照一定標志分為不同類型或?qū)哟危缓髲母黝愋椭须S機抽取若干個體,從而構(gòu)成樣本。將總體按照一定標志分類的基本原則是,層內(nèi)之間差異要小,層外之間差異要大,否則就失去分層的意義。例如,對某校友800個學生的學習興趣情況進行調(diào)查研究,擬抽取40個學生作為樣本,即抽樣比率為40/800=1/20。那么,可先根據(jù)一定標準將800個學生分成優(yōu)(160)、良(320人)、中(240人)、差(80人)四個部分,然后從各部分中用單純隨機抽樣或機械抽樣的方法,各抽取1/20,即從優(yōu)等中抽取160×1/20=8(人),從良等中抽取320×1/20=16(人),從中等中抽取240×1/20=12(人),從差等中抽取80×1/20=4(人),組成一個樣本。(4)整群抽樣整群抽樣是以整群為單位而不是以個體為單位來抽取對象的抽樣方法。這種方法的優(yōu)點是便于組織,其缺點是代表性較差,因而采用也較少。比如,調(diào)查某地中學教師的心理狀況,則可將某地所有中學視為若干群體,然后按隨機原則從中抽取幾個群體作為樣本,再對選中群體內(nèi)的所有教師進行調(diào)查,這種方法即是整群抽樣法。統(tǒng)計量與參數(shù)樣本的特征量稱為統(tǒng)計量,如樣本的平均數(shù)、樣本的標準差。由樣本的統(tǒng)計量去估計,推斷出來的相應的總體的特征量,稱為參數(shù)。誤差誤差是測定的觀測值與真值之差,誤差可以分為隨機誤差、系統(tǒng)誤差和抽樣誤差三種。隨機誤差指由與研究目的無關(guān)的難以控制的偶然困素所引起的誤差。比如,研究過程中遇到地震之類的自然災害,又如研究課堂注意力時突然有一美女走進教室。隨機誤差無法完全避免,但是我們可以盡可能地縮小隨機誤差,提高測量和統(tǒng)計的精度。系統(tǒng)誤差指由與研究目的無關(guān)的因素所引起的有規(guī)律性的誤差。比如,皮格馬利翁效應,又如在調(diào)查研究中部分學生往往傾向于選擇“好”的答案,而不是根據(jù)自己的真實情況作答。引起系統(tǒng)誤差的原因很多,我們可以通過認真檢查研究的各個方面來控制與消除系統(tǒng)誤差。抽樣誤差指由于抽樣而產(chǎn)生的誤差,抽樣誤差屬于隨機誤差的范疇,由于它在統(tǒng)計中非常重要,所以人們將之專門列出。比如,抽樣不具代表性。(三)教育統(tǒng)計學在教育研究中的應用教育統(tǒng)計學可能用教育觀觀察、教育調(diào)查、教育實驗、教育文獻研究等的數(shù)據(jù)歸類匯總等,其中主要還是應用于教育調(diào)查和教育實驗研究。1.應用于教育調(diào)查教育調(diào)查是取得客觀的、真實的可靠資料的一條重要途徑。教育調(diào)查的方法和種類較多,就調(diào)查的范圍分,有全面調(diào)查和非全面調(diào)查。全面調(diào)查即對全部對象都加以調(diào)查,如對某地區(qū)中學生的心理健康進行調(diào)查,對某大學畢業(yè)生的社會適應能力進行調(diào)查。全面調(diào)查的優(yōu)點在于可以全面了解某種情況,不足之處在于費時、費力。非全面調(diào)查即從調(diào)查總體中選取一部分個體進行調(diào)查,非全面調(diào)查可以節(jié)省人力、財力和時間。非全面調(diào)查包括抽樣調(diào)查、重點調(diào)查和典型調(diào)查。(1)抽樣調(diào)查前面已講述(2)重點調(diào)查重點調(diào)查的調(diào)查對象在研究總體中所占比重較大,或比重雖不大,但在被研究現(xiàn)象的發(fā)展中起著重大作用。比如,要調(diào)查羌族文化對學校教育的影響,我們就可以重點調(diào)查北川和理縣的學生,因為絕大多數(shù)羌族人都生活在這兩個縣。又如,要調(diào)查四川人的性格特點,我們可以選擇成都進行重點調(diào)查,因為成都對四川的特點有集中的反映。一般說來,按照調(diào)查任務的要求,凡在部分單位或少數(shù)地區(qū)能夠反映所研究的項目和指標時,就可采用重點調(diào)查。在抽樣調(diào)查以前,為了大致了解被調(diào)查單位的一般情況可以進行重點調(diào)查,在抽樣調(diào)查以后,為了深入了解某一單位的情況也可以進行重點調(diào)查。(3)典型調(diào)查典型調(diào)查是研究者根據(jù)需要選擇一部分具有代表性的單位(或個體)進行的調(diào)查。典型調(diào)查可在較短時間內(nèi),用較少的人力、財力和物力,取得較大的效果。比如,要對研究性學習實施情況進行調(diào)查研究,別人主要是總結(jié)成功經(jīng)驗,而你主要想總結(jié)失敗教訓,你就可以選一個失敗的學校作為典型加以研究。這次新課程改革中對一些新課程開展得很好的學校進行調(diào)查研究,也是一種典型調(diào)查。搞好典型調(diào)查,關(guān)鍵是選好典型,要選好典型,必須將對象按照某種標準分類,然后從每一類型中選出具有代表性的典型個體(或單位)。2.應用于教育實驗(1)單組實驗單組實驗是向一組實驗對象施加一個或數(shù)個實驗因子,然后測量其發(fā)生的變化,借以確定實驗因子的效果。比如,教學方法講授法與發(fā)現(xiàn)法對學生學習成績的影響。第一個月第二個月一班學生講授法發(fā)現(xiàn)法統(tǒng)計并比較第一個月學生成績與第二個月學生學習成績的差異是否顯著。單組實驗必須具備以下條件:第一,后一實驗因子與前一實驗因子不發(fā)生影響;第二,其他非實驗因子所產(chǎn)生的影響在實驗前后應保持一致;第三,測驗數(shù)據(jù)準確可靠。單組實驗的優(yōu)點是簡單易行,缺點是后一實驗因子易受前一實驗因子的影響。(2)等組實驗等組實驗是指在兩組條件相當?shù)那闆r下,對之施行不同的實驗處理的實驗方法。比如,要同一個教師所教的兩個班中開展學生課堂參與與學習成績的關(guān)系的研究,一個作為實驗班(教學中讓學生高度參與),一個班作為對照班(教學過程中基本上不讓學生參與)。采用這種實驗方法最關(guān)鍵的一點是兩組的條件要相當。要做到這一點,可采取隨機抽樣法和測驗選擇法。前測后測實驗班不參與參與對照班不參與不參與前測要做到兩個班的差異不顯著,后測若兩個班的差異顯著說明是否參與對學習成績有明顯影響,反之則說明無明顯影響。這種實驗法雖然克服了單組實驗的部分缺點,但它很難做到各組完全相當。(3)輪組實驗輪組實驗是將各實驗因子輪換施行于各組,然后根據(jù)每一因子所產(chǎn)生的變化之總和確實實驗效果。假定有甲、乙兩組學生,有講授法和發(fā)現(xiàn)法兩種教學方法。假定甲組先進行講授法教學,然后進行發(fā)現(xiàn)法教學。假定乙組先進行發(fā)現(xiàn)法教學,然后進行講授法教學。甲組講授法發(fā)現(xiàn)法乙組發(fā)現(xiàn)法講授法將甲組采用講授法時的學習效果和乙組采用講授法時的學習效果作為一組,將甲組采用發(fā)現(xiàn)法時的學習效果和乙組采用發(fā)現(xiàn)法時的學習效果作為一組,將兩組數(shù)據(jù)的統(tǒng)計結(jié)果進行比較看差異是否顯著。輪組實驗是單組實驗的變形,對其結(jié)果的統(tǒng)計分析仍可采用單組實驗的統(tǒng)計方法來處理。具體方法是將把兩個實驗給放在一起作為一組進行統(tǒng)計分析。輪組實驗的優(yōu)點是,減少了無關(guān)因子的干擾;省去了謀求各組相等的麻煩;一定程度上保證了實驗結(jié)果的準確可靠。其缺點是,實驗次數(shù)的增加,使實驗的周期相應增加,帶來了更多多的人力、物力和時間等的花費。第二章描述統(tǒng)計第一節(jié)統(tǒng)計表與統(tǒng)計圖統(tǒng)計表統(tǒng)計表是用來表達統(tǒng)計指標與被說明事物之間數(shù)量關(guān)系的表格。它可以簡化統(tǒng)計資料,便于我們分析、比較、計算、記憶資料。統(tǒng)計表的結(jié)構(gòu)包括:標題、表號、標目、線條、數(shù)字和表注。(1)兩邊不要豎線,中間可要可不要的豎線最好不要(2)有標號、標題,表的標號、標題在上,圖的標號、標題在下(3)指標分界分明,上、下限標明,組距相等(4)具有價值性,表中量化內(nèi)容具有可比性,如百分等級(5)表的設計要有規(guī)律性統(tǒng)計表的基本格式如下:表2.1統(tǒng)計表的基本格式△△△△△△(標題)橫縱標目的總標目縱標目橫標目數(shù)字(一)簡單表參見書上18頁表2.2(二)分組表參見書上18頁表2.3(三)復合表參見書上18頁表2.4(四)頻數(shù)分布表參見書上19頁表2.5統(tǒng)計圖統(tǒng)計圖是用來表示統(tǒng)計指標與被說明的事物之間數(shù)量關(guān)系的圖形。它能使事物的數(shù)量關(guān)系表達得形象直觀,一目了然。一般是根據(jù)統(tǒng)計表繪制統(tǒng)計圖。統(tǒng)計圖的結(jié)構(gòu)包括:標題、圖號、標目、圖形和圖注。統(tǒng)計圖的種類的:表示間斷變量的統(tǒng)計圖(有直條圖、圓形圖)與表示連續(xù)變量的統(tǒng)計圖(有線形圖、直方圖、多過圖、累積多邊形)。(一)直條圖直條圖是用條形的高低或橫向的長短來比較統(tǒng)計數(shù)據(jù)的幾何圖形。它主要是用來比較性質(zhì)相似的間斷性資料。直條圖按圖形中被比資料的組數(shù)不同,可分為單式直條圖和復式直條圖。參見20頁圖2.1和圖2.2。(二)圓形圖圓形圖是反圓按比例分成若干扇形來說明總體結(jié)構(gòu)的幾何圖形。它是用來表示間斷性資料構(gòu)成比的圖形。圓形的面積表示一組數(shù)據(jù)的整體,圖中扇形表示各組成部分所占的比重。各部的比重一般用百分比表示。參見21頁圖2.3。(三)線形圖線形圖是用曲線的高低和斜度表現(xiàn)統(tǒng)計數(shù)據(jù)的幾何圖形。參見21頁圖2.4。(四)直方圖直方圖用面積表示頻數(shù)分布,用各組上下限之間的矩形面積表演示各組頻數(shù)。參見22頁圖2.5。(五)多邊圖如果把以各組組中值為橫坐標,相應的頻數(shù)為縱坐標得出的各點以及橫軸上兩邊各增加一個組終點,用折線順次連接起來,則可以得到多邊圖。參見22頁圖2.6。(六)累積多邊圖如果把以各組下限為橫坐標,下限以前相應的各組累積頻數(shù)為縱坐標得到的各點順次用平滑曲線連接起來,則可得出累積頻數(shù)曲線圖。參見23頁圖2.7。第二節(jié)教育統(tǒng)計的特征量利用統(tǒng)計表和統(tǒng)計圖,我們可能對數(shù)據(jù)的整體情況有一個粗略大致的了解,但對數(shù)據(jù)的一些具體情況還不勝明了,也無法對數(shù)據(jù)進行分析研究。要進一步把握這些數(shù)據(jù)并對此進行分析研究,我們還需要求得一些特征量,以此來解釋數(shù)據(jù)的集中趨勢、離散程度和相關(guān)程度等。1.水平性整體情況集中量單組數(shù)據(jù)2.離散性極端情況差異量相關(guān)、差異區(qū)別只是角度不同,本質(zhì)上一致3.相關(guān)性兩組數(shù)據(jù)的關(guān)系相關(guān)量兩個組的數(shù)據(jù)特征一、集中量集中量是代表一組數(shù)據(jù)典型水平或集中趨勢的量。它反映一組數(shù)據(jù)向某一點集中的情況。常用的集中量有平均數(shù)、中位數(shù)和眾數(shù)。平均數(shù)(大?。形粩?shù)(位置),眾數(shù)(頻率)(一)平均數(shù)1.算術(shù)平均數(shù)算術(shù)平均數(shù)是所有觀察值的總和除以總頻數(shù)所得之商,簡稱平均數(shù)。參見書24頁算術(shù)平均數(shù)的計算方法:原始數(shù)據(jù)法頻數(shù)數(shù)據(jù)法(當一組數(shù)據(jù)數(shù)目較多,而原始數(shù)據(jù)又不知道,只知道頻數(shù)分布表,就可以利用頻數(shù)分布表來求這組數(shù)據(jù)的近似值。比如,知道該年級語文期末成績的頻數(shù)分布情況,要求該年組語文期末考試的平均分。參見書25頁)2.加權(quán)平均數(shù)加權(quán)平均數(shù)是不同比重數(shù)據(jù)(或平均數(shù))的平均數(shù)。比如:專家6(打80分),領(lǐng)導5(打70分),自評4(打75分),學生3(打60分),家長2(打55分),互評1(打50分)。求加權(quán)平均數(shù)的方法:原始數(shù)據(jù)法和頻數(shù)分布表法。參見書26-27頁。幾何平均數(shù)(求增大率或減小率)幾何平均數(shù)是N個數(shù)據(jù)連乘的N次方根。幾何平均數(shù)適用于計算具有遞增(或遞減)性數(shù)據(jù)的集中量。參見書28頁。幾何平均數(shù)是為了矯正算術(shù)平均數(shù)比如,高考人數(shù):5103060240又如,高考人數(shù):100200400,求2000年至2002年該校高考人數(shù)的平均數(shù)及年平均增長率。調(diào)和平均數(shù)調(diào)和平均數(shù)是一組數(shù)據(jù)倒數(shù)的算術(shù)平均數(shù)的倒數(shù),也稱倒數(shù)平均數(shù)。調(diào)和平均數(shù)適用于求平均速率一類問題。參見書29頁。算法:倒數(shù)和的平均數(shù)的倒數(shù)小結(jié):算術(shù)平均數(shù)表示一組數(shù)據(jù)的中心或重心位置,可用于各給數(shù)據(jù)之間集中水平的比較;加權(quán)平均數(shù)用于求不同比重數(shù)據(jù)(或平均數(shù))的平均數(shù);幾何平均數(shù)適用于計算具有遞增(或遞減)性數(shù)據(jù)的集中量;調(diào)和平均數(shù)適用于求平均速率一類的問題。在求平均數(shù)時,應根據(jù)數(shù)據(jù)特點和需要,正確選用各種平均數(shù)的算法。(二)中位數(shù)中位數(shù)是位于依一定順序排列的一給數(shù)據(jù)中央位置的數(shù)值,在這一數(shù)值上、下各分布著一半頻數(shù),常用Md表示。對于分布大致對稱的數(shù)據(jù),中位數(shù)與算術(shù)平均數(shù)十分接近;而當數(shù)據(jù)分面過偏時,用中位數(shù)表示的集中趨勢比算術(shù)平均數(shù)更為合理。中位數(shù)的計算方法:原始數(shù)據(jù)法(如下)、頻數(shù)分布表法(略)將一組原始數(shù)據(jù)依大小順序排列后,若總頻數(shù)為奇數(shù),就以位于中央的數(shù)據(jù)作為中位數(shù);若總頻數(shù)為偶數(shù),則以量中間的兩個數(shù)據(jù)的算術(shù)平均數(shù)作為中位數(shù)。參見書30頁。(三)眾數(shù)在一數(shù)列中出現(xiàn)頻數(shù)最多的一個數(shù)值稱為眾數(shù),常用Mo表示。如果所有數(shù)據(jù)項都不相同,就沒有眾數(shù)。眾數(shù)的計算方法(略)小結(jié):在以上三種集中量中,平均數(shù)(尤其是算術(shù)平均數(shù))集中代表性較好,其次是中位數(shù),然后是眾數(shù)。平均數(shù)優(yōu)于中位數(shù)和眾數(shù)的特點為:平均數(shù)是根據(jù)全體數(shù)據(jù)參與計算得來的,可以作為一組數(shù)數(shù)據(jù)的代表值;簡明易懂;可由無次序的數(shù)據(jù)直接求出;計算公式可用作代數(shù)運算;較穩(wěn)定可靠,受抽樣影響不很大;已知平均數(shù)與頻數(shù)可求出總數(shù)。平均數(shù)也有不足之處:受極端數(shù)據(jù)的影響較大;如有某幾個數(shù)據(jù)不知道就無法求出。中位數(shù)不受極端數(shù)據(jù)的影響,尤其是在一個方向上出現(xiàn)較多的極端數(shù)值時,使用中痊數(shù)作為集中的代表性較好。但由于中位數(shù)只利用了相對位置的信息,所以一般情況下它的集中代表性不如平均數(shù)。眾數(shù)僅利用了數(shù)據(jù)出現(xiàn)頻數(shù)最多的信息,因而在一般情況下其代表性不如平均數(shù)和中位數(shù),但在單峰的偏態(tài)分布中,眾數(shù)的代表性較好。由于平均數(shù)具有較多優(yōu)點,在統(tǒng)計報告中一般都選用平均數(shù)。二、差異量差異量是描述數(shù)據(jù)間彼此差異程度的統(tǒng)計量。差異量可分為絕對差異量和相對差異量。(一)全距全距是一組數(shù)據(jù)中最大值與最小值之差,又稱極差,用R表示。全距只能反映數(shù)據(jù)組的兩極端值的離差程度,不能反映中間數(shù)據(jù)的分布情況。(二)平均差平均差是每個數(shù)據(jù)與該組數(shù)據(jù)的集中量(如算術(shù)平均數(shù),中位數(shù))之間的絕對值的算太平均數(shù),一般用符號AD表示。參見書36頁。平均差考慮到了全部離差,受兩極端數(shù)值影響小,但計算過程中要用絕對值,不便于代數(shù)運算,因而在教育統(tǒng)計中用得不多。(三)標準差平均差計算中要用絕對值,為避免這一不足,人們想到對離差加以平方再開方的方法。一組數(shù)據(jù)離差(偏離平均數(shù)的距離)平方的算術(shù)平均數(shù),稱之為方差。標準差是方差的平方根。方差用σ2表示,標準差用σ表示。標準差的值越大,表明這組數(shù)據(jù)的差異程度越大;標準差的值越小,表明這組數(shù)據(jù)越整齊,分布范圍越小。參見書37頁至38頁。小結(jié):全距反映了一組數(shù)據(jù)兩端的差異,但不能反映中間數(shù)據(jù)的分布情況,平均差雖能反映一組數(shù)據(jù)的整體差異情總,但計算時要用絕對值,不適合代數(shù)運算。標準差具有以下優(yōu)點:(1)標準差反映合部數(shù)值的差異情況;(2)標準差適合于代數(shù)方法運算;(3)標準差受抽樣變動的影響較小。但標準差也有一些缺點,比如,標準差計算較為復雜,結(jié)果易受兩極端數(shù)值的影響。標準差常與平均數(shù)配合使用。參見書40頁至41頁。(四)差異系數(shù)差異系數(shù)是指標準差與算術(shù)平均數(shù)的百分比,差異系數(shù)用CV表示,它沒有單位。差異系數(shù)可用于:第一,比較單位不同的數(shù)據(jù)資料的差異程度;第二,比較單位相同而平均數(shù)相差較大的兩組數(shù)據(jù)的差異程度。參見書41頁至43頁。(五)偏態(tài)系數(shù)(略)相關(guān)量(一)相關(guān)關(guān)系的概念一事物與另一事物之間的關(guān)系有兩種情況,一種是兩事物毫無聯(lián)系,比如,打嗝與地震;一種是兩事物有聯(lián)系。兩事物有聯(lián)系又分為兩種:一種是有嚴格確定的關(guān)系,稱之為函數(shù)關(guān)系;一種是有依存關(guān)系,但不是嚴格確定的關(guān)系,稱之為相關(guān)關(guān)系。比如,智商與學習成績,老師長得漂亮與喜歡她教的課。函數(shù)關(guān)系是一種嚴格確定的關(guān)系,它反映了事物之間所存在的嚴格的依存關(guān)系,其特征是現(xiàn)象與現(xiàn)象之間的關(guān)系是一一對應的,它通常可以用一個數(shù)學表達式準確表達出來,屬于傳統(tǒng)數(shù)學研究的范疇。比如,圓周長等圓周率乘以半徑的平方。相關(guān)關(guān)系是兩組變之間的非確性的關(guān)系,它反映了變量之間不十分嚴格的但依然存在著的依存關(guān)系。相關(guān)關(guān)系是一種大概如此而非絕對如此的關(guān)系,相關(guān)關(guān)系屬統(tǒng)計研究的范疇。如教師教得好與學生學習成績好。相關(guān)分為正相關(guān)、負相關(guān)和零相關(guān)三種。如果兩個變量的變化方向一致,即一個變量值變大時,另一個變量值也隨之變大,或者一個變量值變小時,另一個變量值也隨之變小,稱之為正相關(guān)。如果兩個變量的變化方向相反,即一個變量值變大時,另一個變量值隨之變小,或者一個變量變小時,另一個變量值隨之變大,稱之為負相關(guān)。兩個變量值之間變化方向無一定規(guī)律,稱之為零相關(guān)。相關(guān)關(guān)系一般用相關(guān)系數(shù)(r)表示,它的范轉(zhuǎn)為-1≤r≤1。由r正、負號及絕對值的大小,可以表明兩個變量的之間變化的方向和密切程度。相關(guān)系數(shù)的計算方法很多,常見的有積差相關(guān)、等級相關(guān)、點二列相關(guān)、二列相關(guān)和φ相關(guān)。(二)積差相關(guān)系數(shù)當兩個變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系,表示這兩個變量之間的相關(guān)稱為積差相關(guān)。參見書46至48頁。積差相關(guān)的使用條件是:(1)兩個變量都是連續(xù)性數(shù)據(jù);(2)兩個變量的總體呈正態(tài)分布,或接近正態(tài)分布,至少是單峰對稱的分布;(3)必須是成對的數(shù)據(jù),每對數(shù)據(jù)之間是相互獨立的,而且變量對數(shù)N>30;(4)兩個變量之間呈線性關(guān)系。(三)等級相關(guān)系數(shù)等級相關(guān)是指以等級次序排列或以等級次序表示的變量之間的相關(guān)。主要包括斯皮爾曼二列等級相關(guān)及肯德爾和諧系數(shù)。(四)點二列相關(guān)在兩個變量中,其中一個變量是來自正態(tài)總體的連續(xù)變量,另一個變量為二分量(例如男與女等),這時,表示這兩個變量之間的相關(guān),稱為點二列相關(guān)。(五)二列相關(guān)二列數(shù)據(jù)都來自正態(tài)分布的總體,但其中一列可以人為地分為二分變量(例如合格與不合格,高與低),這時,表示兩個變量之間的相關(guān),稱為二列相關(guān)。(六)φ相關(guān)當二列變量都是二分變量或都可以人為地分成二分變量時,可用φ相關(guān)來計算它們的相關(guān)程度。第三章推斷統(tǒng)計第一節(jié)正態(tài)分布正態(tài)分布又稱常態(tài)分布,它是一種應用廣泛,且相當重要的概率分布。在實際生活中,凡自然狀態(tài)下的整數(shù)數(shù)據(jù)都幾乎是正態(tài)分布。正態(tài)分布是一種“兩頭小,中間大”的分布形態(tài)(象一口鐘)。一、正態(tài)曲線正態(tài)分布的曲線方程為:(參見書63至65頁),x∈(-∞,+∞)標準分Z分,標準分如何得來,。標準分是一個相對分數(shù),能能夠標表示出某一分數(shù)的相對位置。平均數(shù)為0,標準差為1的正態(tài)分布曲線稱為標準正態(tài)分布曲線。標準正態(tài)分布曲線為:正態(tài)曲線有以下特點:1.曲線在Z=0(即平均數(shù))處為最高點;2.曲線以Z=0為軸線,雙側(cè)對稱;3.曲線從最高點賂左左緩慢下降,并無限延伸,但永不與軸線相交;4.標準正態(tài)分布上的平均數(shù)為0,標準差為1,基線上從Z=-3到Z=3有6個標準差的距離,并且多數(shù)數(shù)據(jù)都集中在平均數(shù)附近。5.標準正態(tài)曲線方程為:二、正態(tài)分布表的使用

正態(tài)分布表包括3列,第1列表示曲線底數(shù)即橫坐標的位置,用Z值表示;第2列是縱高Y,用即曲線的高度;第3列是圖3.2所示的陰影部分的面積,用P表示,P值是過Z=0人縱線與過表中某Z點人縱線所夾圖形的面積比率,即相應區(qū)間的隨機變量的概率。Z值表示某數(shù)據(jù)在整個數(shù)據(jù)中的相對位置,Y值表示在一個點上數(shù)據(jù)頻數(shù)的多與寡,P值表示有多少比率的數(shù)據(jù)落入這一區(qū)間。1.已知Z值,求面積(參見書65-66頁)已知Z值求面積有三種情況:(1)求Z=0至某Z值的面積。這種情況直接查表可得面積。如,Z=1.5,P=0.43319;又如,Z=2.9,P=0.49813。(2)求兩個Z值之間的面積。(3)求某Z值以上或以下的面積。2.已知面積,求Z值(參見書66頁)已知面積求Z值也有三種情況:(1)求Z=0以上或以下某一面積對應的Z值。(2)求與正態(tài)曲線上端或下端某一面積對應的Z值。(3)求與正態(tài)曲線下中央部位某一面積相對應的Z值。3.已知Z或P,求縱線正態(tài)曲線的縱線高度Y是橫軸上某Z值的頻率密度(即概率),已知Z或P都可以通過正態(tài)分布表查得Y值。三、正態(tài)分布在測驗記分方面的應用1.將原始分數(shù)轉(zhuǎn)換成標準分數(shù)(參見書67頁)原始分數(shù)往往是絕對分數(shù),可能無法進行比較,無法反映某一分數(shù)在群體中的位置,而標準分數(shù)則是反映數(shù)據(jù)在群體中的相對位置,能進行比較。(考語文100分,數(shù)學99分的例子,語文、數(shù)學分數(shù)無法進行比較的例子)標準分數(shù)是總體中某個原始分數(shù)與平均數(shù)之差,再除以標準差所得的商。其公式為:標準分數(shù)的優(yōu)點:(1)各科標準分的單位是絕對等價的,因此,它具有可加性;(2)標準分數(shù)值的正負和大小,可以反映某一考分在總體中所年的地位,因此,它具有可比性;(3)標準分數(shù)可以作為舍棄異常數(shù)據(jù)的依據(jù),如果Z的絕對值遠大于3,則可考慮舍棄該原始數(shù)據(jù)。標準分的不足:存在多位小數(shù)和負值為克服這一不足,通常將標準分數(shù)加以轉(zhuǎn)換。轉(zhuǎn)換的一般形式為:T=KZ+C2.確定錄取分數(shù)線(參見書67-68頁)由錄取率可以確定錄取分數(shù)線。3.確定等級評定人數(shù)(參見書68頁)4.品質(zhì)評定數(shù)量化(參見書68頁)第二節(jié)總體平均數(shù)的估計這一節(jié)要探討如何用樣體的數(shù)據(jù),即統(tǒng)計量(如樣本平均數(shù)、樣本標準差)去估計總體的數(shù)據(jù),即參數(shù)(如總體平均數(shù)、總體標準差)。一、抽樣分布的概念抽樣分布是指某種統(tǒng)計量(如平均數(shù)和標準差)的概率分布。二、平均數(shù)抽樣分析的幾個定理1.從總體中隨機抽出容量為N的一切可能樣本的平均數(shù)的平均數(shù)等于總體的平均數(shù)。用公式表示為:E(X)=μ2.容量為n的平均數(shù)在抽樣分布上的標準差等于總體標準差除以n的方根。3.從正態(tài)總體中,隨機抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布;即使總體不呈正態(tài)分布,如果樣本容量較大,則樣本平均數(shù)的抽樣分布也接近于正態(tài)分布。三、總體平均數(shù)的參數(shù)估計總體平均數(shù)的參數(shù)估計是指由樣本平均數(shù)對總體平均數(shù)進行的估計。它分為點估計和區(qū)間估計。點估計是指用某一樣本的平均數(shù)的值為估計總體平均數(shù)的值。區(qū)間估計是指以樣本平均數(shù)的抽樣分布為理論依據(jù),按一定要求,由樣本平均數(shù)的值來估計總體平均數(shù)所在的區(qū)間范圍。1.總體標準差已知或總體標準差雖未知,但n>30(參見書70-71頁)2.總體標準差未知且n<30(參見書71-72頁)第三節(jié)幾種常用統(tǒng)計檢驗方法一、統(tǒng)計檢驗的意義在教育研究中,通過教育調(diào)查和教育實驗所獲得的樣本數(shù)據(jù)經(jīng)常遇到有差異。(比如,通過調(diào)查發(fā)現(xiàn)所抽取的樣本中高一男生的數(shù)學成績優(yōu)于女生)但這種差異是來自于真正的總體差異,還是來自于總體本身無差異而是抽樣誤差造成的差異呢?對于這一問題,需要進行統(tǒng)計檢驗。統(tǒng)計檢驗的一個重要內(nèi)容就是要看差異是否顯著,即進行差異顯著性檢驗。檢驗差異是否顯著,需要一個標準來衡量。在所設定的標準下,如果檢驗的結(jié)果屬于差異顯著,那就意味著兩個統(tǒng)計量來自兩個有差異的總體;如果檢驗的結(jié)果屬于差異不顯著,那就意味著兩個統(tǒng)計來自一個總體或兩個沒有差異的總體,或者說這種差異是由抽樣誤差所造成。統(tǒng)計檢驗的核心思想是反證法。統(tǒng)計結(jié)果有無差異必須一定的標準去衡量。一般來說,大家習以概率P<5%和P<1%這兩個標準來衡量。5%和1%等概率稱為顯著性水平,記作。二、假設檢驗的步驟假設檢驗的一般步驟:(1)提出原假設H0,即零假設;(2)選擇和計算教育統(tǒng)計量;(3)對結(jié)定的顯著性水平確定臨界值。(4)將統(tǒng)計量計算的結(jié)果與臨界值比較,從而決定拒絕還是接受原假設。三、統(tǒng)計檢驗的方法統(tǒng)計檢驗有Z檢驗、t檢驗、F檢驗、x2檢驗(一)Z檢驗1.單總體Z檢驗(參見書74頁)單總體Z檢驗是檢驗一個樣本平均數(shù)與一個已知的總體平均數(shù)的差異是否顯著。2.雙總體Z檢驗(參見書75至76頁)雙總體Z檢驗是檢驗兩個樣本平均數(shù)各自代表的總體的差異是否顯著。(二)t檢驗當總體呈正態(tài)分布,如果總體標準差未知,而且樣本容量n<30,那么這時一切可能的樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計量呈t分布。1.單總體t檢驗(參見書76至77頁)單總體t檢驗是檢驗一個樣本平均數(shù)與一已知的總體平均數(shù)的差異是否顯著。2.雙總體t檢驗(參見書77至78頁)雙總體t檢驗是檢驗兩個樣本平均數(shù)與其各自所代表的總體的差異是否顯著。小結(jié):單總體:σ已知時,用Z檢驗σ未知時,用t檢驗雙總體:σ1,σ2已知,且是獨立樣本時,用Z檢驗σ1,σ2未知,且是獨立大樣本時,用Z檢驗σ1,σ2未知,且是獨立小樣本時,用t檢驗σ1,σ2未知,且是相關(guān)樣本時,用t檢驗(三)F檢驗Z檢驗、t檢驗的平均數(shù)差異的顯著性檢驗的前提假設是兩個總體的方差是相同的,至少沒有顯著性差異。對兩個總體的方差是否有顯著性所進行的檢驗稱為方差齊性檢驗,即必須進行F檢驗。1.F分布若從兩個相互獨立的正態(tài)總體中隨機抽取兩個獨立樣本,以此為基礎(chǔ),分別求出兩個相應總體方差的估計值,這兩個總體方差估計值稱為F比值,即F=S12/S22。F比值的抽樣分布稱為F分布,F(xiàn)比值稱為F統(tǒng)計量。2.F檢驗(參見書80至81頁)(四)x2檢驗(參見書81至84頁)x2檢驗是對樣本的頻數(shù)分布所來自的總體分布是否服從某種理論分布或某種假設分布所作的假設檢驗。第四節(jié)方差分析(略)方差分析又叫變異數(shù)分析,它用于對多個平均數(shù)之間的差異進行檢驗。F檢驗是對兩個總體的方差所進行的差異檢驗,而方差分析是對多個平均數(shù)之間的差異進行檢驗。教育測量篇第五章教育測量概述一、什么是教育測量測:檢測、觀測;事物的內(nèi)涵(弄清事物的本質(zhì))量:衡量、度量;事物的外延(將事物數(shù)量化)測量:檢測與衡量,弄清事物的本質(zhì)并將之數(shù)量化。教育測量:按照一定的規(guī)則對教育活動、教育現(xiàn)象等加以數(shù)量化測定的過程。比如,測量一個學生思想品德如何,測量一個學生的學習興趣如何。二、教育測量有何特點教育測量主要是對學生精神特性的測定,對精神特性的測定不同于對物理特性的測定。具體而言,教育測量具有以下特點:(一)教育測量具有間接性精神特性:潛隱于身體內(nèi)部,不能直接觀察、度量。不像物理特性的測量,可能通過直接觀察和度量來達成,學生精神特性的測定,只能通過教育影響在學生行為上的表現(xiàn)以及學生對測試題的反應等,并應用推理和判斷的方法去間接測定這些行為屬性。(二)教育測量具有不確定性精神特性:具有不穩(wěn)定性和變化性教育測量的不確定性是指教育測量所使用的工具的單位具有相對性。(三)教育測量服務于教育目標教育測量既是檢驗教育教學成敗的重要工具,又是改進教育工作,提高教育質(zhì)量的保證。三、教育測量的要素(一)參照點參照點是計算事物數(shù)量的起點,又稱零點,需點有絕對零點和相對零點之分。相對零點是人定的零點,教育測量中所使用的零點幾乎都采用人定的相對零點。比如,智商。相對零點最大的限制是不能以倍數(shù)的方式解釋分數(shù)。(二)單位任何測量都得有單位,如物理測量中的長度以單位米、分米、厘米等,重量單位千克等。教育測量也有單位如百分數(shù)、標準分數(shù)等。(三)量表量表是測量的工具,是參照點和單位的連續(xù)載體。如稱是事物重量的量表,尺子是事物長短的量表,又如教育測量中的智力量表、學習態(tài)度、學習能力量表等。1.稱名量表稱名量表是用一定的數(shù)字對事特的類別加以標識,是與事特的分類相聯(lián)系的量表。如用“1”表示男生,用“0”表示女生。稱名量表,只起到分類的作用。2.順序量表順序量表是表示事物相對關(guān)系(如順序關(guān)系)的數(shù)值特征量的量表。如學業(yè)成績的第一名,第二名等,又如學生品德的優(yōu)、良、中、差。順序量表既能分類,又能排序,但不具有等距性,不能進行運算。3.等距量表等距量表最顯著的特點是等距性,它對事物所作的數(shù)量劃分是等距離的。等距量表具有等距性,但沒有絕對零點。如,水的冰點(溫度量表)等距量表示的數(shù)值可以進行加減運算,但不能進行乘除運算。4.比率量表比率量表又稱絕對量表,它既有相等的單位,即具有等距性,又有絕對零點,它是測量中最高水平的量表。如,重量,長度,身高、體重量表等。比率量表中的數(shù)值可能進行加減乘除計算。四、教育測量有何功能與作用(一)在教學方面的反饋與激勵功能(二)在教育行政管理方面的評鑒與選拔功能(三)在教育科研中的導向與信息提供功能五、什么樣的測量是好的測量(良好測量的特征)(一)信度(可靠性)信度是指可靠性或可靠程度,測量的信度是測量結(jié)果反映被試真實水平和程度。(二)效度(有效性)效度是針對特定的目的而言,測量的效度是指測量出所要測量的特性的程度。(三)難度(難易性)難度是就測驗所含的項目(題目)而言,測驗的難度是指項目(題目)的難易程度。(四)區(qū)分度(鑒別性)區(qū)分度也是就測驗所含的項目(題目)而言,測驗的區(qū)分度是指項目能區(qū)別不同水平的被試的程度。區(qū)分度與難度是有關(guān)系的。一般而言,過高或過低的難度都晚使項目的區(qū)分度較低,項目要有良好的區(qū)分度,難度必須適中。區(qū)分度又影響到效度,若測驗區(qū)分度較低會導致效度低。第六章信度第一節(jié)信度的計算對信度的估計或計算,一般采用相關(guān)分析的方法,即計算出兩種變量的相關(guān)系數(shù)(rxy),用相關(guān)系數(shù)的大小來表示一致性程度的高低。一、再測信度再測信度是用同一測驗試卷,在先后兩個不同時間對同一組被試施測后求得的實得分數(shù)的相關(guān)系數(shù)。再測信度是一種表示測驗穩(wěn)定性的方法,因此可用穩(wěn)定性系數(shù)表示。計算再測信度實際上使用的是重測法。測驗A1適當時距測驗A2實質(zhì)上,再測信度強調(diào)所測特質(zhì)的穩(wěn)定性,求得的穩(wěn)定性系數(shù)本質(zhì)上是考察跨時距上所得分數(shù)的一致性。因此,應注意以下幾個問題:首先,前后測驗的時間間隔要適當。其次,在兩次施測的間隔期內(nèi),被試在所要測查的特質(zhì)方面沒有獲得更多的學習和訓練。再次,再測信度適用于速度測驗而不適用于難度測驗。二、復本信度復本信度是一種表示測驗等值性的方法,因此,復本信度可用等價值性系數(shù)表示。等值性系數(shù)是以兩個等值但具體內(nèi)容不同的量表,在最短時距內(nèi),對相同被試先后施測兩次測驗所獲得的兩組對應分數(shù)的相關(guān)系。測驗A1最短時距測驗B1使用復本法計算等值性系數(shù)是為避免重測法的時間間隔對測驗的影響,復本法十分強調(diào)兩份測驗的平行等值。因此,使用復本法計算等值性系數(shù)時,應注意:1.測驗的同質(zhì)性與等值性2.測驗時距宜短3.測驗的信度系數(shù)有稍微偏大的傾向可以結(jié)合再測信度和復本信度,利用等值穩(wěn)定性系數(shù)來判斷測驗信度。測驗A1適當時距測驗B2在使用等值穩(wěn)定性系數(shù)時應注意:其一,兩個測試試題要具有較高的等值性其二,兩次測驗的時距需要妥善規(guī)定三、內(nèi)部一致性系數(shù)內(nèi)部一致性系數(shù)是同一測驗的各題項(例如分為奇數(shù)題和偶數(shù)題)得分的相關(guān)系數(shù)(一)分半系數(shù)分半法是將一個測驗分為兩個假定相等而獨立的部分來記分,通常以奇數(shù)題為一組,偶數(shù)題為另一組,不宜將前后兩部分分組。分組之后,求兩組分數(shù)的相關(guān)系數(shù),最后用期皮爾曼-布朗公式校正,以求得整個測驗的信度系數(shù)。(二)系數(shù)主觀性試題的評分,沒有嚴格的評分標準,以致對同樣一個題,被試得分各不相同。對于主觀性試題的內(nèi)部一致性系數(shù),可以采用克龍巴赫創(chuàng)造的系數(shù)公式來求。計算內(nèi)部一致性系數(shù)應注意:1.用分半法時,以按奇偶題分半為宜,不宜前后分半2.速度測驗不宜用分半法3.客觀性試題可以用分半法來計算信度,主觀性試題宜用系數(shù)公式計算測驗信度。四、評分者信度當測驗是主觀性試題,且評分者有多人時,不同評分者對同一分試卷評定的分數(shù)或等級常常不同,甚至有較大差異,這時需要考慮評分者之間的一致性問題。評分者信度即評分者評分的一致性系數(shù)。若只有兩人參評N分試卷,或一人先后兩次評N份試卷,可用斯皮爾曼等級相關(guān)方法估計;若三個或三個以上的評分者評N分試卷,則而計算肯德爾和諧系數(shù)以表示信度。五、目標參照測驗的信度(略)六、速度測驗的信度(略)第二節(jié)影響測驗信度的因素影響測驗信度的因素很多,不過根本原因在于測量誤差的影響。一、系統(tǒng)誤差系統(tǒng)誤差是由于量表有問題或評分標準掌握過寬或過嚴等原因?qū)е聹y驗結(jié)果有規(guī)律性的偏大或偏小。因而系統(tǒng)誤差雖然會導致辭測量不準確,但不影響測量結(jié)果的穩(wěn)定性或可靠性,所以不影響測量信度。二、隨機誤差隨機誤差是由于各種偶然因素的影響而使測驗產(chǎn)生的誤差。隨機誤差有可能在第一次測驗中出現(xiàn),而在第二次測驗中不出現(xiàn),這就影響了兩次測驗的一致性系數(shù),從而影響隨機誤差。三、抽樣誤差抽樣誤差是由于測驗中被試之間的差異造成的誤差。被試之間差異程度由標準差或方差來描述。而方差的大小正好反映測驗的信度系數(shù)。第三節(jié)提高測驗信度的方法一、測驗信度與測驗長度的關(guān)系測驗長度增加,測驗信度系數(shù)隨之加大。然而,測驗長度受到測驗時間等因素的限制,在實際應用中應在有限范圍內(nèi)盡可能地增加測驗的長度。二、測驗信度與測驗難度的關(guān)系測驗太難或太易都會使信度降低。應使測量的難度適當,經(jīng)驗表明測驗的難度在0.40-0.70之間是合適的。三、測驗信度與測驗項目的區(qū)分度的關(guān)系項目區(qū)分度提高,測驗信度系數(shù)相應提高。提高項目區(qū)分度是提高測驗信度的有效方法。測驗信度與測驗內(nèi)容同質(zhì)性的關(guān)系測驗內(nèi)容同質(zhì)性越高測驗信度越高。測驗信度與評分客觀性關(guān)系要盡可能客觀地評分測驗信度與測驗程序統(tǒng)一性的關(guān)系測驗程序應前后統(tǒng)一測驗信度與被試差異性的關(guān)系被試差異性增大,信度系數(shù)也隨之增大。加大被試的差異,一方面可增大樣本的容量,另一方面可堅持隨機分層抽樣。第七章效度第一節(jié)效度的估算一、內(nèi)容效度內(nèi)容效度是指測驗內(nèi)容與預定要測的內(nèi)容之間的一致性程度。一致性程度高則效度高,一致性程度低則效度低。比如,要測驗學生的學習能力,學習能力包括識記、理解、應用、分析、綜合以及評價等方面的能力,檢測內(nèi)容效度就可以看測驗內(nèi)容是否反映了這些方面的能力。二、構(gòu)想效度構(gòu)想效度是指測驗成績能夠解釋心理學理論上的某種結(jié)構(gòu)或特質(zhì)的程度。構(gòu)想效度主要適用于心理測驗效度的確定。所謂構(gòu)想,是指心理學理論所涉及的抽象而屬假設性的概念特質(zhì)或變量,如智力,能力傾向、人格結(jié)構(gòu)等。三、效標關(guān)聯(lián)效度效標關(guān)聯(lián)效度是指測驗分數(shù)與作為效標的另一獨立測驗結(jié)果之間的一致性程度。一般是用本測驗與效標測驗去測同一組被試得到的兩組分數(shù)的相關(guān)系數(shù)表示。所謂效標,是檢驗測驗效度的參照標準。第二節(jié)提高測驗效度的方法一、控制系統(tǒng)誤差二、精心編制量表三、有效組織測驗四、擴大樣本的容量擴大樣本的容量,可以增加樣本對總體的代表性,增加代表性便可以抵消測驗的隨機誤差,使測驗更穩(wěn)定可靠。五、合理處理信度與效度的關(guān)系測驗效度要受測驗信度限制,事實上效度的最大值受它的信度所制約。信度是效度的必要條件,雖然信度高的測驗效度不一定高,但效度高的測驗,信度卻一定比較高。六、適當增加測驗的長度增加測驗的長度,能提高測驗的信度,從而使效度得到相應的提高。因此,增加測驗的長度,既能提高測驗信度也能提高測驗效度。不過測驗長度對信度的影響大于其對效度的影響。第八章難度第一節(jié)難度的計算一、客觀性試題計算難度的方法(一)原始定義法當測驗題目是采用二分法記分(即通過記1分,未通過記0分)時,可用公式P=R/N計算項目的難度。為平衡猜測對難度的影響,可用公式CP=(KP-1)/(K-1)校正(二)極端分組法極端分組法是根據(jù)測驗總分按高低次序排列,用兩極端組在某項目上的平均通過率表示項目的難度。極端分給法計算項目難度的公式為:P=(PH+PL)/2用極端分組法計算難度的步驟為:(1)按測驗總分由高到低排序;(2)從高分段向下選出全部試卷的27%作為高分組;(3)從低分段向上選出全部試卷的27%作為低分組;(4)按公式P=(PH+PL)/2計算項目難度值。二、主觀性試題計算難度的方法(一)平均分數(shù)法主觀性試題的難度可用公式P=X/W來計算(二)極端分組法用極端分組法求主觀性試題難度的公式為:P=(XH+XL-2NL)/2N(H-L)基本步驟為:(1)按測驗總分依次排序,確定比例各25%的高分組或低分組;(2)為高分組、低分組分別編制每題得分的分析表;(3)用以上難度公式計算難度值。第二節(jié)難度對測驗的影響一、難度對測驗分數(shù)分布的影響測驗項目的難度值越小,測驗項目的難度就越大,正確回答試題的人數(shù)就越少,測驗分數(shù)就越集中在低分端,其分數(shù)分布越呈正偏態(tài)分布;項目的難度值越大,難度就越小,正確回答試題的人數(shù)就越多,測驗分數(shù)就越集中在高分端,其分數(shù)分布越呈負偏態(tài)分布。二、難度對測驗鑒別力的影響測驗的主要功能之一是鑒別學生水平的高低,適宜的難度可以加大考生得分的差異,從而提高測驗的鑒別力。項目難度值為0.5左右時,測驗得分的方差才可達最大值,而方差越大,測驗的鑒別力越強。三、難度與測驗目的的關(guān)系項目難度應根據(jù)測驗目的來確定,不能認為任何測驗項目的難度值等于0.50最好。一方面,如果每個項目的難度值都等于0.50,會使測驗分數(shù)的分布呈又峰狀態(tài),即50%的人所有題目全部答對,得滿分,50%的人所有題目全部答錯,得零分。所以,最好使測驗題的平平均難度接近0.50,即在0.50加減0.20之間,而不要求每個試題的難度值都等于0.50;另一方面,項目難度不能一概而論,應由測驗目的的需要來確定,如果測驗的目的在于選拔人,則應采用難度值接近錄取率的項目,如果要錄用10%的應聘者,則適宜難度應為0.10,又如要高考要錄取80%的高生,則適宜難度為0.80。第九章區(qū)分度區(qū)分度是測驗對考生實際水平的區(qū)分程度第一節(jié)區(qū)分度對測驗的影響區(qū)分度通常用D表示。D的取值范圍在-1.00和+1.00之間,D值越大,試題的區(qū)分能力越強。當D為正值時,說明試題是積極區(qū)分,即高分組通過率高,低分組通過率低。D為負值時,說明試題是消極區(qū)分,高分組通過率低,低分組通過率高。D為0時,說明試題無區(qū)分作用。一、區(qū)分度與難度的關(guān)系區(qū)分度與難度有著直接關(guān)系,在一定程度上說,難度決定了區(qū)分度。試題難度過大過小,其區(qū)分度都較低。當難度值為1.00或0時,高分組和低分給或全部得滿分,或全部得零分,這時區(qū)分度都為0。調(diào)整難度是提高區(qū)分度的重要方法。雖然試題難度為0.50時區(qū)分度達到最大值,但并不需要所有試題的難度都為0.50,最好是各題難度在0.50加減0.20之間,平均難度接近兩0.50為最佳。二、區(qū)分度與信度關(guān)系測驗中各試題的區(qū)分度D值的平均數(shù)越大,測驗的信度就越高。同時,試題的區(qū)分度是測驗是否具有效度的指示器。項目區(qū)分度應根據(jù)測驗目的而的,若測驗是為了選拔人員,區(qū)分度要求較高,若測驗只是考查學生對知識的掌握情況,可不過多考慮區(qū)分度。第二節(jié)區(qū)分度的計算一、極端分組法極端分組法仍然是依照前面的方法將測驗總分排序,確定一定比例的高分組與低分組,然后根據(jù)高分組和低分組在某項目通過率上的差異比率,最后確定其區(qū)分度指標。(一)客觀性試題區(qū)分度的計算計算公式為:D=PH-PL計算步驟為:(1)按測驗總分由高到低排序(2)確定測驗總分最高的27%的被試為高分組,最低的27%為被試低分組(3)分別求出這兩給被試通過試題的百分比(4)將算得的有關(guān)數(shù)據(jù)代入計算公式(二)主觀性試題區(qū)分度的計算計算公式為:D=(XH-XL)/N(H-L)計算步驟為:(1)按測驗總分由高到低排序(2)確定測驗總分最高的25%的被試為高分組,最低的2%為被試低分組(3)列出試題分析表(4)將有關(guān)數(shù)據(jù)代入?yún)^(qū)分度計算公式二、相關(guān)法用極端分組法求項目區(qū)分度,只使用了高分組和低分組的數(shù)據(jù),中間還有部分數(shù)據(jù)沒有參加計算,因而所得結(jié)果不夠準確。為避免這一不足,可采用相關(guān)法分析項目的內(nèi)部一致性,即以項目分數(shù)與效標分數(shù)(效標分數(shù)不易得到時,則以測驗總分代替)的相關(guān)作為項目區(qū)分度的指標,相關(guān)越高,區(qū)分能力越強。(一)積差相關(guān)當考生在試題上的得分與測驗總分都屬于連續(xù)變量時,可以采用積差相關(guān)法計算試題的區(qū)分度。(二)點二列相關(guān)當測驗的一個變量為連續(xù)變量,另一個變量為真正的二分變量時,要用點二列相關(guān)系數(shù)表示項目的區(qū)分度。(三)二列相關(guān)法當測驗總分和項目分數(shù)均為連續(xù)變量,而其中一個被人為分為兩個類別,欲研究它們之間的關(guān)系就要用二列相關(guān)法。(四)φ相關(guān)法當測驗的兩個變量都是二分變量時,可用φ相關(guān)系數(shù)來表示某項目的區(qū)分度。(五)項目效度分析法前面四種相關(guān)法都用內(nèi)部一致性計算區(qū)分度,測驗項目效度分析是要了解被試對某一試題的反應與外在效標之間的關(guān)系。具體采用什么分析法計算項目區(qū)分度,應根據(jù)測驗的特質(zhì)和種類來決定。如果該測驗所要測的是單一特質(zhì),即測驗量表由同質(zhì)性題目所組成,宜采用內(nèi)部一致性分析方法,如果測驗是用來測量多種不同特質(zhì)的,用來考驗效度的效標也是多種特質(zhì)的組合,則適用項目效度分析法。第十章教育測驗的編制與實施第一節(jié)編制測驗的一般原則一、目的性原則二、典型性原則三、靈活性原則四、科學性原則第二節(jié)編制測驗的一般步驟一、確定測驗目的二、分析教育目標教育目標的分析一般以布盧姆等建立的教育目標分類學為依據(jù)。雙向細目表就是編制測驗的藍圖。編擬測驗雙向細目表的一般步驟為:(1)按照各級教學目標的試題在整份試卷中的一般比例和學生的實際水平進行橫向設計。(2)根據(jù)知識內(nèi)容的重要性和綜合性程度進行縱向設計。(3)根據(jù)縱橫雙向比例把實際得分點分配到中間每個格子中去,這樣就制成了測驗的雙向細目表。三、測驗取材并編擬題目(一)測驗取材要有目的性(二)測驗取材要有代表性(三)測驗取材要有普遍性(四)測驗取材要有鑒別性四、試測與分析五、編制測驗第三節(jié)測驗的編輯與實施一、測驗的編輯(一)試題的檢查(二)試題的編排1.將測驗認知目標相同的試題編排在一起。2.應將同一類型的試題編排在一起。3.應由易到難排列試題。(三)編寫答題說明答題說明一般包括以下內(nèi)容:測驗的目的測驗的時間限制回答試題的方法記分的方法二、測驗的實施(一)測驗前的組織工作印制試卷時,一般可采用兩種形式:其一是分離式試卷,基二是傳統(tǒng)的綜合式試卷。試卷應注意以下事項:不同類型的試題之間,應留出兩行間隔,以達到使考生易讀的效果;多重選擇題的題干與選項不能印在同一行中,每個選項應單獨占一行;一道試題不能分開印在兩頁上,以避免考生來回翻閱試卷,耽誤時間,分散精加,發(fā)生錯誤;試卷上的試題作答空間應該夠用;試卷應統(tǒng)一規(guī)格印制,并力求美觀、經(jīng)濟與實用。(二)測驗的施行(三)試卷的評定教育評價篇第十三章教育評價概述一、什么是評價評價:公平地說人或事物的價值,對人或事物的價值進行判斷。二、教育評價活動的范疇任何一項教育評價工作,必須首先要解決這樣幾個問題:為什么評價,評價誰,誰來評價,用什么依據(jù)來評價,評價什么,如何評價。明確了這幾大問題,教育評價才能科學、有效地實施。(一)為什么評,即教育評價的目的教育評價目的服務于教育目的,改進、優(yōu)化教育活動。(二)評價誰,即教育評價的對象(也稱教育評價的客體)(三)誰來評價,即教育評價的評價者(也稱教育評價的主體)(四)用什么依據(jù)來評價,即教育評價的標準(五)評價什么,即教育評價的內(nèi)容(六)如何評,即教育評價的模式、方法、過程等內(nèi)容三、現(xiàn)代教育評價發(fā)展趨勢及特點(一)評價功能從側(cè)重鑒定走向側(cè)重發(fā)展(二)評價范圍由片面轉(zhuǎn)為全面(三)評價主體由一元走向多元(四)評價過程從封閉走向開放(五)評價方法由單一的定量發(fā)展為定量、定性相結(jié)合四、教育評價的功能與作用(一)導向功能(二)鑒定功能(三)激勵功能(四)改進功能五、教育評價的類型(一)按評價目的分類1.診斷性評價診斷性評價(diagnosticevaluation)又稱為事前評價或準備性評價,它是指在某項活動開始之前,對評價對象的現(xiàn)實狀況、所存問題及問題產(chǎn)生的原因作出的評價。布盧姆認為,診斷性評價就是在學期、學習單元的教學活動開始之前所實施的評價,其目的主要是了解學生是否具備接受新的學習任務所必需的基礎(chǔ)知識、技能和能力;是為了制訂課時教學計劃而進行的評價。2.形成性評價形成性評價(formativeevaluation)是通過診斷教育方案或計劃、教育過程與活動中存在的問題,為正在進行的教育活動提供反饋信息,以提高實踐中正在進行的教育活動的質(zhì)量的評價。3.終結(jié)性評價終結(jié)性評價(summativeevaluation)是指對評價對象在一定時期內(nèi)的比較全面的狀況所進行的評價。(二)按評價的參照標準分類1.相對評價相對評價是指在評價對象群體中選取參照標準,以確定評價對象在群體中的相對位置或與群體中某一個體之間的差距的評價。相對評價的參照標準,一般是該群體的常模,因此,相對評價也被稱作常模參照評價。2.絕對評價絕對評價是指在評價對象的集合外選取某一參照標準,將評價對象與這個標準進行比較,判斷其達到客觀標準程度的評價。絕對評價關(guān)心的是評價對象是否達到了既定的參照標準及其達到程度,因此也稱為目標參照評價。3.個體內(nèi)差異評價個體內(nèi)差異評價是把評價對象集合中各元素的過去和現(xiàn)在相比較,或者對一個元素的若干側(cè)面相互比較。(三)按評價主體分類1.自我評價自我評價又稱內(nèi)部評價,是指被評價者依據(jù)評價原理對照一定的評價標準對自身進行的價值判斷。自我評價的主體可以是個人、團體與組織,如學生的自評、教師的自評、學校的自評等等。2.他人評價他人評價又稱外部評價,是指被評價者以外的人按照一定標準對被評價者進行的價值判斷,如社會評價、領(lǐng)導評價、同行評價、專家評價、行政評價等等。(四)按評價方法分類1.定量評價定量評價是指在評價過程中運用數(shù)學方法去處理、分析信息,取得數(shù)量化評價結(jié)果的一種評價。2.定性評價定性評價是指在評價過程中采用非數(shù)量化的方式,對事物發(fā)展過程和結(jié)果采用觀察和質(zhì)性分析的方法進行描述、分析和評價,作出定性的評價結(jié)論。第十四章教育評價指標體系第一節(jié)教育評價指標體系概述一、教育評價指標體系的內(nèi)涵 (一)評價指標 (二)指標權(quán)重 (三)評價標準 二、制定教育評價指標體系的依據(jù) (一)教育方針、政策和法規(guī) (二)教育評價目標 (三)教育規(guī)律 (四)教育實際 三、制定教育評價指標體系的原則 (一)時代性與導向性原則 (二)科學性和可靠性原則 (三)有效性與可行性原則 (四)完備性與獨立性原則 第二節(jié) 教育評價指標體系設計一、擬定評價指標 (一)初擬指標 1.頭腦風暴法2.因素分解法(二)篩選指標 1.經(jīng)驗法2.調(diào)查統(tǒng)計法二、分配指標權(quán)重 1.專家會議法2.特爾斐法3.層次分析法4.兩兩比較法三、制定評價標準 (一)分解末級指標,形成評價要點 (二)確定等級數(shù)量 (三)確定標號和標度 第十五章教育評價內(nèi)容第一節(jié)學校評價 一、學校評價觀 二、學校評價內(nèi)容 三、學校評價實施 方向定位系統(tǒng),產(chǎn)品輸入系統(tǒng),資源條件系統(tǒng),組織管理系統(tǒng),過程監(jiān)控系統(tǒng),產(chǎn)品輸出系統(tǒng),評價反饋系統(tǒng)。第二節(jié)教師評價一、教師評價觀 二、教師評價內(nèi)容三、教師評價實施 上課、說課、聽課第三節(jié)學生評價一、學生評價觀 二、學生評價內(nèi)容 三、學生評價實施 發(fā)展性評價第十六章教育評價模式教育評價模式是教育研究工作者依據(jù)某種教育理念、教育思想或特定的教育評價目的,選取一種或幾種評價途徑所建立起來的相對完整的評價體系。第一節(jié)目標模式一、目標模式的提出 二、目標模式的基本內(nèi)容 (一)確定教育目標(二)設計評價情境(三)選擇和編制評價工具(四)分析評價結(jié)果目標模式可以進一步具體化為以下幾個步驟:(1)確定教育目標;(2)根據(jù)行為和內(nèi)容來界說每一個目標;(3)確定應用目標的情景;(4)設計呈現(xiàn)情景的方式;(5)設計取得記錄的方式;(6)決定評定時使用的記分單位;(7)決定獲取代表性樣本的手段。三、目標模式的優(yōu)缺點 目標模式的優(yōu)點是:(1)在泰勒主張“用教育評價來代替測驗”的概念下,運用目標分類理論,不僅考察學生對知識的回憶,還考察了理解、應用、綜合等復雜的目標。并且在評價方法上也不只限于紙筆測驗,只要是關(guān)于行為目標是否達成的有效證據(jù),都可以看成是評價的有效方法。目標模式涉及觀察法、訪談法以及對學生作業(yè)和練習的評估等方法。(2)注重目標和注重目標分類,并用行為術(shù)語表達目標,評價目標的標準簡潔明了。(3)通過對學生行為的考察確定達到目標的程度,通過反饋信息,促進教育活動能夠盡可能地逼近教育目標。(4)操作性強,容易見效,且比較經(jīng)濟。目標模式也有很多不足,主要有:(1)評價以目標為中心和依據(jù),評價目標來源于課程目標、教育計劃等,忽視對目標本身合理性的判斷。(2)針對學生的特定行為結(jié)果進行判斷,有些行為結(jié)果被排除在評價之外,因此容易造成教育評價內(nèi)容不全面。(3)教育目標需作行為化表述,可是有的教育目標不易用行為語言恰當表述,像人類情感和意識等因其本身的復雜性,用行為目標來表述難免有簡單化之嫌。(4)對學生行為結(jié)果作評價,重視結(jié)果評價,忽視了過程評價。(5)用統(tǒng)一的目標模式評價每一個人,忽略了人的個性化特征。四、目標模式的運用 第二節(jié)CIPP模式CIPP模式是用四種評價方式的第一個英文字母命名的,即背景評價(Context-evaluation)、輸入評價(Input-evaluation)、過程評價(Process-evaluation)和結(jié)果評價(Product-evaluation)。一、CIPP模式的提出 二、CIPP模式的基本內(nèi)容 (一)背景評價(Context)(二)輸入評價(Input)(三)過程評價(Process)(四)成果評價(Product)三、CIPP模式的優(yōu)缺點CIPP評價模式的優(yōu)點是:(1)根據(jù)現(xiàn)實需要和社會需要,考慮了評價目標的選定及其合理性問題,使目標更符合社會需要,符合實際??朔四繕嗽u價模式的不足。(2)評價貫穿教育活動的始終,使評價成為改進工作,提高教育質(zhì)量的工具。(3)評價的內(nèi)容廣泛,從對教育需要的調(diào)查開始,包括需要、問題、目標、條件、計劃、實施、結(jié)果以及結(jié)果的影響等教育過程的所有階段。對教育過程不同階段、不同方面的評價,評價發(fā)揮著不同的功能,對上述全部內(nèi)容的評價也就

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論