全套課件·《計算機輔助教育測量與評價》1

上傳人：我*** IP屬地：貴州上傳時間：2022-07-21 格式：PPT 頁數(shù)：326 大小：2.17MB 積分：30 舉報 版權申訴

已閱讀5頁，還剩321頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

1、計算機輔助教育測量與評價第一章計算機輔助教育測量與評價概述目錄1.1 教育測量與評價的產(chǎn)生1.2 計算機輔助評價的定義與分類1.3 計算機輔助評價的發(fā)展1.4 第四代教育評價的興起1.1 教育測量與評價的產(chǎn)生 1.1.1 教育測驗的興起 1.1.2 美國的教育測驗運動 1.1.3 “八年研究”與教育評價的誕生教育測驗的興起中國古代科舉考試制度對世界教育、政治、文化，尤其是考試制度產(chǎn)生過重大的影響。在教育界引起人們對測驗問題以極大關注的是著名的萊斯（JMRice）拼字測驗。美國的教育測驗運動教育測驗之所以在本世紀二十年代形成一種運動，表面是針對論文或考試不客觀，實際上，有更為深刻的原因

2、：自然科學的發(fā)展個別差異的研究與統(tǒng)計學在教育上的運用對特殊兒童的研究美國的教育測驗運動美國的教育測驗運動的發(fā)展可分為以下三個時期：19041915年的開拓期 19151930年的興盛期 19301940年教育測驗運動的批判期 “八年研究”與教育評價的誕生為了解決高中課程及教學問題，美國進步主義教育協(xié)會負責人艾欽于19331940年期間領導了一項長達八年之久的中學課程改革運動，這就是美國教育史上著名的“八年研究”“八年研究”與教育評價的誕生為了評價其研究成果，組成了以泰勒為領導的評價委員會。通過這場研究，泰勒和他的同事正式提出了教育評價的概念，即教育評價就是衡量實際活動達到教育目標的程

3、度，測驗是它的手段。 “八年研究”與教育評價的誕生同時，還提出了評價的原則和方法，其基本思想是：教育是改變?nèi)说男袆臃绞降倪^程；教育目標是各種行動方式的變化；教育能夠根據(jù)對該目標實際完成情況的分析進行評價；“八年研究”與教育評價的誕生人的行動是復雜的，所以要從各方面進行評價，它不僅是分析的，而且也是綜合的；作為評價方法僅僅靠用紙和筆的測驗是不充分的，應該采用包括觀察行為在內(nèi)的更為廣泛的方法?！鞍四暄芯俊迸c教育評價的誕生表1.1 新舊課程優(yōu)劣之評價比較 1.2 計算機輔助評價的定義與分類1.2.1 計算機輔助評價（CAA）的定義1.2.2 計算機輔助評價（CAA）的分類計算機輔助評價（CAA

4、）的定義計算機技術和教育測量與評價思想的融合促進了計算機輔助評價（Computer-AssistedAssessment，簡寫為CAA）的發(fā)展，引發(fā)了評價內(nèi)容、方法和形式的深刻變革。簡單地說，凡是借助于計算機程序、軟件和設備進行的測試和評價都屬于計算機輔助評價的研究領域。計算機輔助評價（CAA）的定義計算機輔助評價是指在評價學習者的知識、技能和能力的過程中引入計算機作為工具或手段，主要表現(xiàn)在以下幾方面：在測試的過程中，傳遞材料、評分以及對測試結果進行分析；比較并分析通過試卷搜集到的數(shù)據(jù)；記錄并分析學習者的成就水平，生成測評報告；通過網(wǎng)絡比較、分析和傳送測評信息。計算機輔助評價（CAA）的定

5、義就目前應用現(xiàn)狀來看，CAA支持的評價類型主要包括下面幾種：診斷性，目的是判斷學習者對某個主題的預備知識的掌握程度。自測，學習者檢查自己對某個概念或術語的理解程度。計算機輔助評價（CAA）的定義形成性，目的是提供反饋來指導學習者的學習，這些反饋表明了學習者對某個主題的知識、技能理解和掌握的程度。在CAA中，形成性評價通常采取客觀題的形式，在測評的過程中或者結束立即給出提示和反饋。總結性，總結性評價能夠給出量化分數(shù)，并對學習者在某個領域的成績做出判斷。總結性評價通常是正式的、有組織且有監(jiān)考的評價形式。計算機輔助評價（CAA）的分類按傳遞測評內(nèi)容的手段進行分類，可以分為以下三類：基于試卷的測

6、評基于計算機的測評基于網(wǎng)絡的在線測評計算機輔助評價（CAA）的分類按測評依據(jù)的理論模型進行分類，可以分為以下兩類：經(jīng)典測驗理論項目反應理論計算機輔助評價（CAA）的分類與經(jīng)典測驗理論相比，項目反應理論具有以下兩個優(yōu)點：題目參數(shù)估計更準確；根據(jù)信息函數(shù)可從題庫中抽取符合被試能力的題目進行測試。計算機輔助評價（CAA）的分類按照測評的題型進行分類，可以分為以下三類：客觀題測評操作題測評主觀題測評計算機輔助評價（CAA）的分類客觀性測驗具有以下一些優(yōu)點：測評是客觀的，評價結果具有比較高的可信度；可以快速地給出評價結果；綜合應用多種媒體（圖像、視頻、音頻等），試題的表現(xiàn)形式豐富多樣；在測

7、試的過程中或者測試結束后，可以自動地提供相關的反饋；計算機輔助評價（CAA）的分類可以從題庫中隨機地選擇題目；給學習者提供靈活的自測機會；可自動閱卷，節(jié)省時間，尤其是對大批量學生能快速測評；從試題的呈現(xiàn)、學生答題到閱卷都可以完全由計算機軟件完成，實現(xiàn)無紙化考試。1.3 計算機輔助評價的發(fā)展 1.3.1 從經(jīng)典測驗（CTT）到項目反應理論（IRT）1.3.2 從常模參照測驗到標準參照測驗1.3.3 從學業(yè)成就到能力素質(zhì)測驗1.3.4 從終結性評價到形成性評價從經(jīng)典測驗（CTT）到項目反應理論（IRT）經(jīng)典測量理論、概化理論、項目反應理論是當今主流。一般說來，現(xiàn)在自編量表的測量理論基礎都是這

8、三大理論。經(jīng)典測驗理論對測驗的分析直觀、具體、適用性廣；概化理論對測驗的宏觀分析能力強，適用于測驗分析研究；項目反應理論在控制測驗編制質(zhì)量上，原理科學、計量精確，有廣泛的發(fā)展前途。從經(jīng)典測驗（CTT）到項目反應理論（IRT）經(jīng)典測量理論（Classical Test Theory，簡稱CTT）形成于19世紀末，主要是以真實分數(shù)模型為基礎，借用普通物理測量的基本假設，采用的計算公式簡單明了、淺顯易懂，能夠?qū)y試結果做出合理的解釋，并且可操作性強，便于在實際測驗情境（尤其是小規(guī)模資料）中實施，能滿足人們對將測驗作為一種選拔工具的需要。從經(jīng)典測驗（CTT）到項目反應理論（IRT）概化理論（Ge

9、neralizability Theory,簡稱GT）較之經(jīng)典測量理論具有獨特的優(yōu)勢。它利用方差分析將各類誤差進行分解，可辨明多種誤差來源，從而揭示了測驗變異的影響因素和大小。從經(jīng)典測驗（CTT）到項目反應理論（IRT）項目反應理論(Item ResponseTheory，簡稱IRT)的發(fā)展是建立在潛在特質(zhì)理論的基礎之上的，其主要內(nèi)容就是揭示被試測驗上的反應行為與測驗所測的被試潛在特質(zhì)之間的關系，這種關系的形象描寫就是項目特征曲線。從常模參照測驗到標準參照測驗盡管在1913年，桑代克就已經(jīng)提出了標準參照測驗，但由于受重視個體差異文化的影響，當時大多數(shù)的教育成就測驗都是用來比較某個學生與其

10、他學生的成績，直到20世紀后半葉，標準參照測驗得以快速發(fā)展。布盧姆的掌握學習理論為標準參照測驗的發(fā)展提供了原動力。從學業(yè)成就到能力素質(zhì)測驗 1993年 “少年兒童測驗的應用國際進步之路” 宗旨是促進全世界少年兒童的教育發(fā)展和教育機會的改善，促進有效的、真正為教育實踐服務的評價政策的制定和推行，號召不發(fā)達國家開發(fā)測驗，開展評價，同時倡導發(fā)達國家改進傳統(tǒng)的評價做法，擴大評價的應用。從終結性評價到形成性評價終結性評價的目的并不是為了幫助參與方案的個體學生，而是為了決定方案是成功還是失敗，是繼續(xù)使用、修改還是放棄。形成性評價與測驗反饋和診斷性功能密不可分。當學生完成了教學的每一個單元或階段，測驗

11、成績就能夠反映他們掌握知識的情況，并告知他們是否達到了課程目標，以及他們在哪些方面需要加強。在教師的幫助下，可以使用新的補習材料或方法來促進學習。 1.4 第四代教育評價的興起 1.4.1 第四代教育評價的內(nèi)涵1.4.2 第四代教育評價的主要方法1.4.3 將評價融入學習環(huán)境設計第四代教育評價的內(nèi)涵 “第四代教育評價”的教育評價理論，它是由印地安納大學教育學院教授枯巴（Egong Cuba）和維德比爾特大學副教授林肯（Yvonna Session Lincoln）創(chuàng)立的。他們于1989年合作出版了第四代教育評價一書，較為系統(tǒng)地論述了他們關于教育評價的觀點，依據(jù)各種評價出現(xiàn)的先后時間順序，將教育

12、評價分為四代，并著重闡述了他們所定義的第四代教育評價。他們把教育評價劃分為四個發(fā)展階段，認為每一個階段各有一種理論構建。第四代教育評價的內(nèi)涵第一代教育評價被稱為教育評價的“測量時代”，這一時代從1900到1930年。主要標志是測量理論的形成和測量技術手段的大量應用，以追求評價結果的數(shù)量化、客觀化為主要目的。第二代教育評價被稱為教育評價的“描述時代”。這一時代從1930年到1940年。第二代教育評價的主要特征是對評價結果進行描述。第三代教育評價被稱為教育評價的“判斷時代”，大約從1950年前后開始，到60年代初期。這一代教育評價的特點，是把前兩代沒有涉及到的“價值判斷”引進了教育評價，并視之為教

13、育評價的關鍵，評價者的任務不僅是要運用一定的測量手段搜集評價信息，而且還要制定判斷價值的目標與評價標準，運用一定手段進行價值判斷。第四代教育評價的內(nèi)涵第四代教育評價的內(nèi)容可以概括為以下幾個方面：心理構建論。價值協(xié)調(diào)論。評價結果認同論。應答性模式。對學習資源與學習過程關注程度增大。第四代教育評價的主要方法檔案袋評價檔案袋評價（portfolio assessment）是一種綜合性的過程評價形式。隨著當代信息技術的廣泛應用，出現(xiàn)了各種豐富多彩的電子檔案袋新形式，推動了檔案袋評價的迅速發(fā)展。第四代教育評價的主要方法學習契約學習契約（learning contract）是學生與教師共同設計的一

14、種契約，契約中界定了學生的學習目標、達成學習目標的方法、學習活動進行的時間以及評定學習活動的標準等。第四代教育評價的主要方法反思表評價反思表（reflective form）是以問題或評價條目組成的表單，可以通過預先設計好的問題，使學習者了解到自己學習的完成情況，有效地啟發(fā)學習者的反思，從而增強反思力和自主學習能力。第四代教育評價的主要方法表現(xiàn)評定表現(xiàn)評定（performance assessment）就是通過學生所完成的綜合性的、真實的任務來對學生進行評定，要求學生運用他們的知識和技能去完成綜合的、有意義的任務。第四代教育評價的主要方法動態(tài)評定動態(tài)評定（dynamic as

15、sessment）有兩層含義，“一是跨越多個時間點觀察評定學生的進步與改變情形，了解學生動態(tài)認知歷程與認知能力變化的特點和潛能。二是評價者與被評價者之間產(chǎn)生大量的互動，強調(diào)評價與教學結合，實施個體化的診斷評價與教學補救?！币话阄覀冞\用更多的是第二種含義的動態(tài)評定。將評價融入學習環(huán)境的設計第2章教育測量與評價的基本原理2.1 教育測量與評價的基本問題2.1.1 教育測量及其數(shù)據(jù)類型2.1.2 教育評價及其標準2.1.3 教育評價的類型2.1.4 我國兩種基本的教育評價制度教育測量及其數(shù)據(jù)類型測量:就是根據(jù)某些法則與程序，用數(shù)字對事物在量上的規(guī)定性予以確定和描述的過程。教育測量:是為了了解學

16、生的發(fā)展，尤其是為了評定學習成績而進行的測量活動，其結果提供了課堂教與學兩方面的信息，是學校教育實踐活動的客觀需要。教育測量及其數(shù)據(jù)類型測量中根據(jù)四個不同的性質(zhì)來定義測量量表:區(qū)分性:量表將不同的數(shù)值賦予能力水平不同的測量對象順序性:量表將大的數(shù)值賦予能力水平高的對象，將小數(shù)值賦予能力水平相對較低的測量對象等間距:對象的能力水平差異相等時，賦予的數(shù)值的差異也相等絕對零點:測量對象完全沒有所測量的能力時，賦予其數(shù)值為零教育測量及其數(shù)據(jù)類型心理學家史蒂文斯（S.Stevens）根據(jù)測量的精確程度，將測量量表從低到高劃分為稱名量表、順序量表、等距量表和比率量表。相應地，由這四種量表獲得

17、的數(shù)據(jù)又分別稱為稱名量表數(shù)據(jù)、序量表數(shù)據(jù)、等距量表數(shù)據(jù)和比率量表數(shù)據(jù)。教育測量及其數(shù)據(jù)類型稱名量表和稱名量表數(shù)據(jù)稱名量表（nominal scale）又叫分類量表，它是最低水平的測量量表。稱名量表數(shù)據(jù)通常是用來對某一測量的特征進行分類，即用數(shù)字作為確認的不同類型特征的代碼。稱名量表中數(shù)據(jù)沒有任何量化的性質(zhì)，只是代表不同的類型。用稱名量表只能確定要測量的條件的特征。教育測量及其數(shù)據(jù)類型順序量表和順序量表數(shù)據(jù)順序量表（ordinal scale）是對具有順序規(guī)律的測量特征的不同水平進行賦值的工具，獲得的數(shù)據(jù)稱為順序量表數(shù)據(jù)。對順序量表數(shù)據(jù)進行統(tǒng)計處理獲得的是中數(shù)、百分位數(shù)、等級相關系數(shù)等。相

18、應的假設檢驗包括秩次檢驗、秩次方差檢驗等。教育測量及其數(shù)據(jù)類型等距量表和等距量表數(shù)據(jù)等距量表（interval scale）也是對測量特征的不同水平進行賦值，但與順序量表不同的是，該測量特征的不同水平間的距離或間隔是相等的。由等距量表獲得的數(shù)據(jù)稱為等距量表數(shù)據(jù)。等距量表數(shù)據(jù)除了具有順序量表的特性，即具有區(qū)分性和順序性外，還具有等距性。教育測量及其數(shù)據(jù)類型比率量表和比率量表數(shù)據(jù)比率量表（ratio scale）是最高水平的測量量表。比率量表除了具有區(qū)分性、順序性和等距性外，其最顯著特征是具有絕對零點，即測量對象完全不具備測量的特征或能力時，量表賦予其數(shù)值為零。由比率量表獲得的數(shù)據(jù)稱為比率量

19、表數(shù)據(jù)。教育評價及其標準不同學者對教育評價的定義：泰勒認為，“評價過程在本質(zhì)上是確定課程和教學大綱在實現(xiàn)教育目標的程度的過程。”“是一種確定行為發(fā)生實際變化的程度的過程?！?我國學者認為，“教育評價是按照一定社會和教育性質(zhì)、教育方針和政策，所確立的教育目標、對所實施的各種教育活動的效果、完成教育任務的情況以及學生成績和發(fā)展水平進行科學判定的過程。” 教育評價及其標準一般來說，教育評價應該包含一些基本內(nèi)容：運用多種方法系統(tǒng)收集資料與信息；是一個依據(jù)教育目標進行價值判斷的過程；評價的內(nèi)容是多方面的，強調(diào)為學生發(fā)展和教育決策服務。教育評價及其標準教育評價的標準，就是對教育質(zhì)量與效益的具體規(guī)定

20、。教育評價標準要體現(xiàn)評價的原則，并能用來衡量各項教育工作。它是一定的教育價值觀、質(zhì)量觀、效益觀的具體化或具體體現(xiàn)。教育評價及其標準教育評價標準體系由標準內(nèi)容、標號和標度三個因素構成。標準內(nèi)容是指標準的強度和頻率。強度是指達到指標體系項目要求的程度或各種規(guī)范化行為的優(yōu)劣程度，又稱定性標準。頻率又稱次數(shù)，是指達到指標體系項目要求的數(shù)量或各種規(guī)范化行為的相對次數(shù)，又稱定量標準。教育評價及其標準標號是不同強度和頻率的標記符號，通常用字母（如A、B、C）、文字（如甲、乙、丙）或數(shù)字（如1、2、3）來表示。它沒有獨立的意義，只表示一種分類。標度是評價時測定的單位標準。它可以是定性的（如優(yōu)、良、

21、中、差），也可以是定量的（用數(shù)字表示各處檔次）。教育評價的類型針對不同的評價目的，不同的評價內(nèi)容或從不同的角度，采取不同的劃分方法，教育評價可以劃分為許多不同的類型：按評價基準來劃分按評價的功能來劃分按評價對象的度量方式來劃分其它教育評價類型教育評價的類型按評價基準來劃分：相對評價絕對評價個體內(nèi)差異評價教育評價的類型按評價的功能來劃分：診斷性評價形成性評價總結性評價教育評價的類型按評價對象的度量方式來劃分：定量評價：將評價對象進行數(shù)量化的分析和計算，從而判斷出它的價值。定性評價：將評價對象作概念、程度上的質(zhì)的規(guī)定，然后進行分析評定，以說明評價對象的性質(zhì)或程度。教

22、育評價的類型其它教育評價類型：靜態(tài)評價與動態(tài)評價分析評價與綜合評價軟評價與硬評價最佳行為評價和典型行為評價我國兩種基本的教育評價制度原國家教委于1990年11月和1991年4月分別發(fā)布了普通高等學校教育評估暫行規(guī)定和教育督導暫行規(guī)定，確定了我國兩種基本的教育評價制度，提高了教育管理水平。教育督導制度教育評估制度 2.2 教育評價對象的抽樣技術 2.2.1 抽樣的方法2.2.2 樣本數(shù)量的確定所謂抽樣技術，就是用總體中一部分樣本的特性作為代表去推斷總體特性的方法。當評價信息源數(shù)量較大時，運用抽樣技術不僅能省時、省物和省力，而且還能減少評價信息的誤差，從而提高評價信息的質(zhì)量。抽樣的

23、方法簡單隨機抽樣兩種方法：隨機數(shù)表法、抽簽法分層抽樣兩種方法：等比例分層抽樣、分層最佳抽樣等距抽樣具體操作步聚是：（1）運用抽樣間隔計算公式，確定抽樣間隔；（2）確定起抽號數(shù)；（3）確定被抽取單位。樣本數(shù)量的確定樣本平均數(shù)的抽樣分布確定樣本數(shù)量的基本方法 : 簡單隨機抽樣等距抽樣分層抽樣數(shù)量的確定 2.3 教育評價指標體系的設計2.3.1 指標體系的設計2.3.2 指標體系權集的確定2.3.3 聚類分析及其SPSS操作 2.3 教育評價指標體系的設計指標是目標的具體化。從管理角度而言，它是具體的、可測的、行為化或操作化的目標；從評價角度而言，它是基本標準某一方面的具體規(guī)

24、定，是評價的直接依據(jù)。指標體系的設計提出初擬指標體系：（1）因素分解法（2）頭腦風暴法（3）理論推演法（4）典型研究法指標體系的設計篩選或修訂指標（1）經(jīng)驗法（2）調(diào)查法（3）模糊聚類法指標體系權集的確定權集就是權重集合的簡稱。所謂指標的權重，就是指反映指標在指標體系中重要性程度的數(shù)量。對每項評價指標分配權重，確定其相對重要程度，是教育評價指標設計中不可少的一項工作。指標體系權集的確定專家評定法（1）編制權重征詢表將此表發(fā)給m個專家填寫權重欄。指標體系權集的確定（2）算出每條指標m個專家所給權重的平均值計算公式：式中：i=1，2，n。表示第j位專家賦予第i個指標的權重值

25、，m表示專家人數(shù)。指標體系權集的確定（3）作歸一化處理設： =D，則指標zi的權重為：，（i=1，2， n）。指標體系權集的確定對偶比較法為了確定各指標的權重，可對指標進行逐對比較，并加以評分，重要者記為1分，次重要者記為0分；然后分別計算各指標得分之和，再除以所有指標得分之總和。指標體系權集的確定層次分析法這種方法是由美國學者薩蒂（TLSaaty）首先引入到教育評價領域以解決權重的確定問題的。它通過兩兩比較，區(qū)分出各級指標反映評價對象數(shù)量要求的相對重要程度，給出以數(shù)值表示的判斷，構成判斷矩陣，然后經(jīng)過運算確定同級指標相對重要程度次序的權重。聚類分析及其SPSS操作聚類分

26、析又稱分類分析、群聚分析、集群分析，是將所觀測的事物或觀測事物的指標進行分類的一種統(tǒng)計分析方法。聚類分析的目的是辨認在某些特征上相似的事物，并將這些事物按照這些特征劃分為幾個類，是現(xiàn)代三大統(tǒng)計方法之一。使得同一類中的事物具有較高的同質(zhì)性，不同類中的事物具有較大的異質(zhì)性。聚類分析法與傳統(tǒng)分類方法的主要區(qū)別在于，它是一種數(shù)值分類的方法，分類準則不是事先決定的，而是按照自然類別將空間中的點進行分類。聚類分析及其SPSS操作聚類分析的對象有兩個方面，一個方面是對樣品聚類（稱Q型聚類），另一個方面是對指標進行聚類（稱R型聚類）。Q型聚類分析：用于對所有的被評價對象劃分等級 R型聚類分析：將眾多的指標按

27、其間的相似性分類，以有助于我們確定評價指標。2.4 教育評價資料的搜集與分析 2.4.1 教育評價資料搜集的方法2.4.2 教育評價資料分析的方法教育評價資料搜集的方法測驗法：通過編制一定的試題或設置某種情景，向測驗對象獲取資料的方法。測驗法按試題的形式來分，一般又分為論文式測驗、客觀性測驗、投射測驗和情景測驗。問卷法：評價者根據(jù)評價指標的要求，提出一些問題，擬好題目和表格，以問卷的形式進行調(diào)查，通過調(diào)查對象做題來收集評價信息，它適用于對某些問題進行大面積調(diào)查。教育評價資料搜集的方法根據(jù)回答問卷的方式，問卷可分為結構式和非結構式兩種：結構式主要分為三種：（1）選擇式（2）量表式（3）排

28、列式非結構式主要兩種：（1）填空式（2）自由回答式教育評價資料搜集的方法觀察法：指評價者在一定時間內(nèi)，對評價對象在自然狀態(tài)下的特定行為表現(xiàn)進行觀察、記錄、分析，而獲得第一手事實材料。觀察法一般分為自然觀察和實驗觀察法。訪談法：評價者通過與評價對象的知情者面對面談話，直接收集資料的一種方法。根據(jù)被訪談的人數(shù)不同，訪談法一般可分為個別訪談和集體訪談（座談會）兩種。教育評價資料搜集的方法文獻研究法：評價者通過查閱有關評價對象的文獻，以獲取評價資料的方法。這種方法在教育評價實踐中使用得最普遍，也最為有效。與其他搜集信息方法不同的是，文獻研究法使調(diào)查者與被調(diào)查者在時空上完全隔離開來，不會產(chǎn)生相互

29、作用，因而是一種相對隱蔽的搜集信息的方法。教育評價資料搜集的方法文獻研究的具體步驟有：（1）分類：文獻研究的基本作法是編錄，即根據(jù)文獻呈現(xiàn)出來的內(nèi)容按特定的概念框架對文獻作分類記錄。（2）抽樣：評價者從各個歷史時期、各種類型文獻中，選取具有代表性、典型性的文獻進行分析研究。（3）進行分析研究：根據(jù)文獻資料的性質(zhì)和評價的要求進行內(nèi)容分析或統(tǒng)計數(shù)據(jù)分析教育評價資料分析的方法統(tǒng)計分析法：通過數(shù)學的方法去分析和比較教育評價資料。它通常用于對測量資料的分析。模糊綜合評價法：模糊綜合評價法是把模糊數(shù)學應用于教育評價而形成的一種方法。第3章教育測量與評價的質(zhì)量分析3.1 信度3.1.1 同

30、質(zhì)性信度3.1.2 分半信度3.1.3 再測信度3.1.4 評分者的信度3.1 信度測驗的信度是指測驗結果的可靠性或可靠程度。所謂可靠性是指對同一組對象進行兩次相同測量所得結果的一致性和穩(wěn)定性程度。常用的信度估計方法有：計算測驗內(nèi)部各項目的得分的一致性，得到同質(zhì)性信度；用同一測驗對同一組被試，前后測驗兩次，據(jù)兩次測驗分數(shù)計算其相關系數(shù)，得到再測信度；當一種測驗只能施行一次且沒有復本時，可按測驗題目的奇偶數(shù)分兩半計分，求相關系數(shù)，經(jīng)校正得到分半信度。同質(zhì)性信度同質(zhì)性信度也稱為內(nèi)部一致性信度，是指測驗內(nèi)部所有項目的一致性。常用的估計方法有克倫巴赫系數(shù)等。同質(zhì)性信度對于信度系數(shù)，應該注意以下要

31、點：（1）Cronbach的信度系數(shù)衡量的是測量某一心理結構的一組試題測量結果的可靠程度。（2）理論上說，Cronbach的信度系數(shù)取值范圍在0到1之間，但實際上95%的測量的系數(shù)在0.50到0.90之間。根據(jù)Nunnally（1967），信度系數(shù)的不同范圍，反映出測量量表的不同問題。同質(zhì)性信度信度系數(shù)的解釋（Nunnally，1967）同質(zhì)性信度（3）Cronbach的信度系數(shù)可以表示成試卷的試題數(shù)與試題間平均相關系數(shù)的函數(shù)，即信度系數(shù)的標準化形式：由公式可見，試題數(shù)增加，信度系數(shù)增加。若試題間相關系數(shù)的平均值低，信度系數(shù)就比較低；反之，信度系數(shù)就比較高。同質(zhì)性信度（4）如果信度系數(shù)

32、高，說明試題間的相關系數(shù)平均值比較高，考生在某道試題上得高分，在另一道試題上得高分的概率就比較高，這可能說明這些試題測量的是單一的心理結構。（5）如果信度系數(shù)較低，說明試題間相關系數(shù)平均值較低，這暗示數(shù)據(jù)可能存在多維結構。在這種情況下，需要進行因子分析，確定數(shù)據(jù)維度。然后，對同一維度的試題計算信度系數(shù)。同質(zhì)性信度（6）Cronbach在2004年已經(jīng)提出，不應再將信度系數(shù)看作是考試結果信度的主要衡量指標，應該用標準測量誤差來衡量考試結果的信度。標準測量誤差與信度系數(shù)以及考試的標準偏差相關：分半信度分半信度是在測試以后對測試項目按奇項、偶項或其他標準分成兩半，分別記分，由兩半分數(shù)之間的相關系

33、數(shù)得到信度系數(shù)。分半信度由于分半，所求得的相關系數(shù)只是半個測驗的信度，可能會高估原測驗的信度，因此需要根據(jù)斯皮爾曼布朗公式校正：其中：為兩半測驗分數(shù)的相關系數(shù)。再測信度同一個測驗項目，對同一組人員進行前后兩次測試，兩次測試所得分數(shù)的相關系數(shù)即為再測信度。它反映兩次測驗結果有無變動，也就是測驗分數(shù)的穩(wěn)定程度，故又稱為穩(wěn)定性系數(shù)。再測信度再測信度的計算必須滿足以下幾個假設：（1）所測量的特質(zhì)必須是穩(wěn)定的；（2）遺忘和練習的效果相同；（3）兩次測試期間被試對問題的熟悉情況沒有差別。評分者的信度當測驗是論文式試題時，不同評分者對同一試卷的評分結果不相同，有時差異很大。這時不宜用系數(shù)計算其信度

34、，必須對評分者評分的一致性進行估計，因為此時誤差主要來自評分者的差異。評分者的信度若只有兩人參加評N份試卷，可用斯爾曼等級相關方法計算；若三個以上評分者評N分試卷，則需采用肯德爾（Kendall）和諧系數(shù)來表示信度：式中K為評分者人數(shù)，N為評分的試卷數(shù)，為第i個被評價對象的K個等級之和。3.2 效度 3.2.1 內(nèi)容效度3.2.2 結構效度3.2.3 因素分析的SPSS操作3.2.4 驗證性因素分析的應用例舉3.2.5 效標關聯(lián)效度3.2.6 效度與信度的關系3.2 效度效度是指一個測驗或量表實際能測出其所要測量的特性的程度。測驗或量表就是測量使用的工具。如果一次測量能測出其所要測的特

35、性，那么我們就認為這個測驗或量表是有效的。顯然，效度是測量質(zhì)量的一個極其重要的方面，測量工具如果無效或效度太低，就失去了存在的價值。內(nèi)容效度內(nèi)容效度：測驗題目樣本對于應測內(nèi)容與行為領域的代表性程度。一個測驗具備良好的內(nèi)容效度應滿足兩個條件：測驗內(nèi)容范圍要明確。對學業(yè)成績測驗來說，就是試題要符合教材內(nèi)容和教學大綱，試題不應該超出確定的范圍。試題應是已界定的內(nèi)容范圍的代表性樣本，它應該覆蓋所測內(nèi)容的主要方面，并使各部分題目所占比例適當。結構效度所謂結構，是指心理學或社會學上的一種理論構想或特質(zhì)。它本身觀察不到，并且也無法直接測量到，但學術理論假設它是存在的，以便能夠來解釋和預測個人或團體的行

36、為表現(xiàn)。結構效度就是指測驗成績所能夠解釋心理學或社會學理論上的某種結構或特質(zhì)的程度。因素分析的SPSS操作 SPSS for Windows使用Factor過程進行因子分析，其基本步驟為：（1）計算相關矩陣，判斷是否需要進行因子分析，并采用KMO檢驗及球形檢驗來判斷原始變量是否適合于因子分析。（2）進行因子分析，按一定標準確定提取的因子數(shù)目。（3）考察因子的可解釋性，并在必要時進行因子旋轉(zhuǎn)，以尋求最佳解釋方式。（4）計算并保存因子得分，以便進一步分析使用。驗證性因素分析的應用例舉驗證性因素分析屬于結構方程模型（structural equation modeling；簡稱SEM）的一種次模型

37、，為SEM分析的一種特殊應用。由于SEM的模型界定能夠處理潛在變量的估計與分析，具有高度的理論先驗性，因而若是研究者對于潛在變量的內(nèi)容與屬性，能提出適當?shù)臏y量變量以組成測量模型，借由SEM的分析程序，便可以對潛在變量的結構或影響關系進行有效的分析。效標關聯(lián)效度效標關聯(lián)效度是指測驗分數(shù)與作為效標的另一獨立測驗結果之間的一致性程度。一般是用本測驗分數(shù)與效標測驗結果之間的相關系數(shù)表示。效標是用來檢測效度的參照標準，可用來作效標的變量很多。效標關聯(lián)效度效標關聯(lián)效度可以分為兩種:同時效度:一種測驗的結果與另一大約同時獲得的測驗結果（效標）之間的一致程度，并用兩測驗結果的相關系數(shù)來估算。預測效

38、度:某一測驗結果與另一將來獲得的測驗結果之間的相關程度。效標關聯(lián)效度從效度估計的方法上來看，效標關聯(lián)效度可以用三種方法進行估計: 命中率顯著差異法相關法效度與信度的關系效度是測量準確性的量度，信度是測量結果一致性或穩(wěn)定性的量度，準確性與一致性的關系，亦即效度與信度的關系。若一測驗的信度低，則其效度也不會高；而測驗的信度高時，卻不一定保證效度高。但是，具有高效度的測驗都必定有足夠高信度。所以，高信度是高效度測驗的一個必要條件而非充分條件。3.3 難度 3.3.1 難度系數(shù)的計算辦法3.3.2 難度的轉(zhuǎn)換3.3.3 難度對測驗的影響3.3 難度難度是衡量試題與試卷難易程度的指標，而且

39、是相對于被試的該批考生而言的。定量刻畫被試作答一個題目所遇到的困難程度的量數(shù)，就叫題目的難度系，或稱難度值，用符號P表示。難度系數(shù)的計算辦法客觀試題的難度計算:（1）對于采用二分法記分的題目，難度以通過率來表示：（3-7）難度系數(shù)的計算辦法（2）當被試人數(shù)很多時，可以將被試依照總分從高到低排列，然后將總分最高的27%和最低的27%的被試分別定為高分組和低分組，運用公式（3-7）分別計算兩組的通過率，然后用下式計算該題難度：（3-10）難度系數(shù)的計算辦法 2主觀性試題的難度計算（1）設為被試在某一試題上的平均分，W為該題的滿分，則上式適用于論題題、問答題和計算題等非二分法記分的題目。

40、（3-11）難度系數(shù)的計算辦法（2）當被試人數(shù)很多時，主觀性試題可采用下式計算難度：（3-12）難度系數(shù)的計算辦法 3難度的測前估算在未測試前就估算難度，需要了解影響試題難度的一般因素：熟悉程度信息數(shù)量題目結構變化動態(tài)難度的轉(zhuǎn)換人們常假設每個試題所要測量的潛在特質(zhì)或能力是呈正態(tài)分布的，然后就可以根據(jù)正態(tài)分布曲線，將試題的難度指數(shù)P作為正態(tài)曲線下的（概率）面積，轉(zhuǎn)換成具有相等單位的等距量表，即Z分數(shù)（標準分數(shù)）。由于標準分數(shù)具有相等單位，屬于等距量表。所以，用標準分數(shù)作為題目難度的指標，為進一步作難度分析帶來了一些方便。難度對測驗的影響難度對測驗分數(shù)分布的影響難度對測驗信度的影響

41、難度與測驗目的的關系 3.4 區(qū)分度 3.4.1 區(qū)分度的意義3.4.2 區(qū)分度的計算3.4.3 區(qū)分度對測驗的影響區(qū)分度的意義題目區(qū)分度就是題目區(qū)別被試水平能力的量度，常記為D。測驗多少都帶有將被試的水平加以區(qū)分的意圖，那么構成測驗的每一個題目就應該為這一目標作貢獻，區(qū)分度就是刻畫試題的這種功能的質(zhì)量指標。區(qū)分度的意義區(qū)分度的分析方法，大約可以歸納成兩類：一為外在效標法，即分析被試在測驗題目上的得分與外在客觀標準上的表現(xiàn)之間的關系。另一為內(nèi)部一致性法，即分析被試在測驗題上的得分與在整個測驗總分之間的一致性程度。區(qū)分度的意義區(qū)分度的取值范圍在-1.00至1.00之間。通常D為正值，稱

42、作積極區(qū)分；D為負值，稱作消極區(qū)分；D為0，稱作無區(qū)分作用。具有積極區(qū)分作用的項目，其D值越大，區(qū)分的效果越好。區(qū)分度的計算高低分組法相關法區(qū)分度對測驗的影響區(qū)分度與難度的關系區(qū)分度對測驗的影響區(qū)分度與信度的關系一個良好的測驗，信度必須要高。艾貝爾（R.L.Ebel）的研究表明，整個測驗中各試題的區(qū)分度D值的平均數(shù)越高，測驗的信度就越高。信度是隨區(qū)分度的提高而增長的，且信度增長的速度比區(qū)分度增長還快。所以，要想使得測驗信度達到理想的值，提高各試題區(qū)分度是一個好的途徑。第4章測驗分數(shù)等值及其常模量表的建立4.1 測驗分數(shù)等值及其常模4.1.1 測驗等值的含義4.1.2 測驗分數(shù)等值

43、的方法4.1.3 常模測驗等值的含義測驗等值是指對測量同一心理特質(zhì)的不同測驗的分數(shù)或試題參數(shù)，通過一定的數(shù)學方法，轉(zhuǎn)換成同一單位系統(tǒng)中的量數(shù)，以利于相互比較的方法。測驗等值包括分數(shù)等值和項目參數(shù)等值兩類。測驗等值的含義測驗等值轉(zhuǎn)換一般以兩種形式出現(xiàn)：水平等值：若兩個測驗的難度水平相當，考生能力分布類似時，即時說，它是同一測驗的不同形式，稱為測驗的水平等值。如高考時的正卷與副卷，其副卷是為正卷在某種意外不能使用的情況下備用的，它們兩者的等值是水平等值。垂直等值：當測驗程度水平不同，考生的能力分布也不同時，這一類等值稱為垂直等值。測驗分數(shù)等值的方法線性等值：兩個平行且信度相等的測驗分數(shù)X和

44、Y，假若它們各自導出的標準分數(shù)相等，就可以認為是等值分數(shù)，因此，有：X和Y是兩測驗的原始分數(shù)；、和、分別是兩個測驗上的原始分數(shù)的平均數(shù)與標準差。測驗分數(shù)等值的方法百分位等值：兩個平行且信度相等的測驗分數(shù)X和Y，如果它們在各自的考生組中的百分位數(shù)級相等，就可以認為是等值。隨機地劃分兩組考生A和B，分別計算它們的累積頻率、相對累積頻率，則在A和B兩個組中同一百分位等級所對應的原始分數(shù)，就是等值分數(shù)。測驗分數(shù)等值的方法鉚等值：實際工作中，常采用設置一批共同試題的方法，求取兩個測驗間的等值轉(zhuǎn)換關系，兩個測驗所共用的部分試題稱為鉚題。鉚題的數(shù)量應為全卷的1/5，鉚題在試卷中可以分散、也可以集中，

45、或者作為一個獨立的測驗來施測。常模常模的定義：在教育測量中，測驗的常模，簡稱常模。它是指一個有代表性的樣組在某種測驗上的表現(xiàn)情況，或者說，是一個與被試同類的團體在相同測驗上得分的分布狀況與結構模式。常模常模資料的獲取：通過抽樣獲取一個有代表性的常模團體。進行統(tǒng)計學描述。將原始分數(shù)轉(zhuǎn)換為導出分數(shù)。 4.2 百分等級常模的建立 4.2.1 百分等級常模的意義4.2.2 百分等級常模的建立方法百分等級常模的意義百分等級是一個地位量數(shù)，能夠反映某個測驗分數(shù)在一組數(shù)據(jù)中的相對地位。在學生測驗中，它把學生的原始分數(shù)放在該學生所在群體（比如四年級）的成績中進行比較，以確定該學生在群體中的相對地位之

46、高低。百分等級常模的建立方法用原始分數(shù)直接計算其百分等級用頻數(shù)分布表編制百分等級量表：分為編制頻數(shù)分布表和建立百分等級與原始分數(shù)的等值對照表兩大步驟。4.3 標準分數(shù)常模的建立 4.3.1 標準分數(shù)的定義4.3.2 標準分數(shù)常模的建立方法標準分數(shù)的定義標準分數(shù)是以標準差為單位表示測驗成績與平均分數(shù)之間的距離。線形標準分數(shù)就是原始分數(shù)轉(zhuǎn)換成標準分數(shù)之后，只改變了分布的平均數(shù)和標準差，并不改變分布的形態(tài)。非線性標準分就是正態(tài)化的標準分，也就是原始分數(shù)與正態(tài)化標準分數(shù)的等值對照表，其量表值就是正態(tài)化的標準分數(shù)或非線性的標準數(shù)。標準分數(shù)的定義 1標準分數(shù)ZZ分數(shù)本身就是關于原始分數(shù)X的一種線性

47、變換，因此，Z分數(shù)不改變原始分數(shù)的分布形態(tài)。任何一批原始分數(shù)，轉(zhuǎn)化成Z分數(shù)后，這批Z分數(shù)的平均值為0，標準差為1。在一般情況下，標準分數(shù)Z的取值范圍在-3到+3之間。標準分數(shù)的定義標準分數(shù)Z計算公式：（4-10）式中和分別表示測驗的平均分數(shù)和標準差。標準分數(shù)的定義由于標準分數(shù)Z分值過小，并往往帶有小數(shù)和負值等缺陷，在許多情形下，直接使用不大合乎人們表示分數(shù)的習慣，故通常把標準分數(shù)Z通過線性變換，轉(zhuǎn)到更大的標準分數(shù)量表上，其一般公式為： a和b為選定的兩個常數(shù)，Z為標準分數(shù)，T為線性變換分數(shù)。標準分數(shù)的定義常見的轉(zhuǎn)換分數(shù)有以下幾種：教育與心理測驗中的T分數(shù)：T=50+10Z韋氏智力

48、量表中各分測驗的量表分：T=10+3Z韋氏智力量表智商（離差智商）：IQ=100+15Z美國大學入學考試報告分數(shù)：CEEB=500+100Z為出國人員舉行的英語水平考試：EPT=90+20Z美國教育測驗中心舉辦“托?！笨荚嚕篢OEFL=500+70Z 標準分數(shù)的定義 2.正態(tài)分布下標準分數(shù)Z和百分等級PR之間的關系: 標準分數(shù)Z是與百分等級PR相聯(lián)系的一種相對分數(shù)，在正態(tài)分布下，其對應的百分等級PR與一個以標準分Z為界點的正態(tài)曲線左尾部面積比例數(shù)相對應。這種對應關系由統(tǒng)計學家編制出正態(tài)分布面積表供人們查表確定。通過查正態(tài)分布表，只要簡單計算就可以確定某個Z分數(shù)所對應的百分等級PR。標準分數(shù)的

49、定義 3正態(tài)分布下若干種分數(shù)量表之間的關系標準分數(shù)及其與百分等級和標準分數(shù)之間的關系標準分數(shù)的定義其他多等級評分量表及其對應關系標準分數(shù)常模的建立方法標準分數(shù)常模的建立方法可分為兩個步驟：根據(jù)標準化樣本中每個被試測驗的原始分數(shù)，計算其平均分數(shù)及標準差；根據(jù)公式（4-10）計算原始分數(shù)的Z分數(shù)。第5章測驗分數(shù)的描述統(tǒng)計5.1 頻數(shù)分布5.1.1 數(shù)據(jù)的基本類型5.1.2 頻數(shù)分布表5.1.3 頻數(shù)分析的SPSS例解5.1.4 頻數(shù)分布圖的SPSS操作5.1.5 運用SPSS對多選題的描述統(tǒng)計數(shù)據(jù)的基本類型離散型數(shù)據(jù)：一般指取整數(shù)值的數(shù)量指標。這類數(shù)據(jù)是計數(shù)性的，數(shù)據(jù)之間不能再劃分為更

50、小的單位。連續(xù)型數(shù)據(jù)：一般指經(jīng)過度量和測定而得到的數(shù)量指標。這類數(shù)據(jù)取值可以連續(xù)變化，盡管數(shù)據(jù)本身仍然是數(shù)軸上的點，但數(shù)據(jù)與數(shù)據(jù)之間可以無限細分，也就是數(shù)據(jù)的取值范圍可以充滿一個區(qū)間。頻數(shù)分布表一組數(shù)據(jù)中每個數(shù)據(jù)出現(xiàn)的次數(shù)稱為這個數(shù)據(jù)的頻數(shù)。按頻數(shù)分類列出的一覽表稱為頻數(shù)分布表。頻數(shù)分布表離散型數(shù)據(jù)的頻數(shù)分布表頻數(shù)分布表連續(xù)型數(shù)據(jù)的頻數(shù)分布表頻數(shù)分析的SPSS例解 Descriptive Statistics包括的基本統(tǒng)計分析功能有以下幾個方面：Frequencies過程：適用于連續(xù)型和離散型的隨機變量，除可以輸出均值、中位數(shù)、眾數(shù)、標準差、方差、全距等樣本統(tǒng)計量外，還可以生成頻數(shù)

51、分布表和條形圖、餅圖、直方圖等常用的統(tǒng)計圖。Descriptives過程：適用于連續(xù)型隨機變量，可以輸出均值、標準差、方差、全距等樣本統(tǒng)計量。此外，還可以將原始數(shù)據(jù)標準化后得到的數(shù)據(jù)保存在一個新變量中，以便進一步統(tǒng)計分析。頻數(shù)分析的SPSS例解 Explore過程：該過程主要用于對數(shù)據(jù)分布特點不清時的探索性分析。Crosstabs過程：適用于離散型隨機變量，可以輸出其頻數(shù)分布表，同時還可以進行檢驗和相關分析等。Ratio過程：該過程用于對兩個連續(xù)型隨機變量計算相對比指標。頻數(shù)分布圖的SPSS操作1簡單條形圖的SPSS例解（1）擊選Graphs下的Bar命令。（2）在打開的Bar Chart對話

52、框中，單擊Define按鈕。（即畫簡單條形圖Simple，這是默認選項。）頻數(shù)分布圖的SPSS操作（3）在打開的Defime Simple Bar:Summaries for Groups of Cases對話框中，把“年齡”指定為Category Axis，擊選Bars Represent下的% of cases。（4）單擊OK按鈕?？梢噪p擊輸出結果中的圖，打開圖片編輯器Chart Editor，對圖可做各種編輯。頻數(shù)分布圖的SPSS操作2復式條形圖的SPSS例解（1）擊選Graphs下的Bar命令。（2）在打開的Bar Chart對話框中，擊選Clustered。單擊Define按鈕。（

53、3）在打開的Defime Simple Bar: Summaries for Groups of Cases對話框中，把“年齡”指定為Category Axis，把“性別”指定為Define clusters by，擊選Bars Represent下的N of cases。（4）單擊OK按鈕，即可完成。頻數(shù)分布圖的SPSS操作3頻數(shù)直方圖的SPSS例解頻數(shù)直方圖相當于連續(xù)型數(shù)據(jù)的條形圖，用于表示在某個范圍內(nèi)連續(xù)取值的變量在各組中的頻數(shù)分布。頻數(shù)分布圖的SPSS操作具體步驟：（1）擊選Graphs下的Histogram命令。（2）在打開的Histogram對話框中，將“score”指定為Va

54、riable。（3）擊選Display normal curve（這一步是在直方圖上畫出正態(tài)曲線，以確認數(shù)據(jù)的分布狀態(tài)）。（4）單擊按鈕。這時，SPSS輸出結果產(chǎn)生一個直方圖，但這個直方圖的分組是自動設定的。要按預定的分組畫圖，需要對該圖進行下面的操作修改。頻數(shù)分布圖的SPSS操作（5）雙擊輸出的直方圖打開圖片編輯窗口Chart Editor。（6）雙擊圖形下邊的數(shù)字區(qū)域，打開Properties對話框。擊選scale，設定range取值范圍，取消Auto自動設定功能，將minimum和maximum分別設定為“51.55”和“100”；將major increment和origin分別設定為

55、“10”和“51.55”，并選中display line at origin項，單擊Apply。頻數(shù)分布圖的SPSS操作（7）在打開的Properties對話框中，擊選Histogram Options，在Anchor First Bin欄目下選中Custom value for anchor，并在其右側填入“51.55”，在Bin Sizes欄目下選中Custom，并在Interval width右側輸入“5”（表示組距為5）。（8）單擊Apply按鈕，得到直方圖。頻數(shù)分布圖的SPSS操作4多邊圖和累積頻數(shù)曲線的SPSS例解（1）打開數(shù)據(jù)文件“ch5-2.sav”，用連續(xù)變量頻數(shù)分析方法，

56、可以得到一個頻數(shù)分布表。（2）新建一個數(shù)據(jù)文件，只保留組中值（命名為“score_m”）、頻數(shù)（命名為“f”）和累積頻率百分比（命名為“cum_p”），同時，兩端各增加一個頻數(shù)為零的組。頻數(shù)分布圖的SPSS操作（3）擊選Graphs下的Sequence命令，在打開的Sequence Charts對話框中，以組中值“score_m”為橫軸，用頻數(shù)“f”作時序圖，即將“f”指定為Variables，“score_m”指定為Time Axis Labels，得到多邊圖。（4）以組中值“score_m”為橫軸，用累積頻率百分比“cum_p”作時序圖，得到累積頻率曲線。運用SPSS對多選題的描述統(tǒng)計在

57、SPSS中，對多選題選項結果的分析主要通過調(diào)用Multiple Response過程來分析。多選題的數(shù)據(jù)雖仍屬離散型數(shù)據(jù)，但它比較特殊，在建立SPSS數(shù)據(jù)文件時，可用多重二分法或者多重分類法建立數(shù)據(jù)文件。在多重二分法中，每個多選題為一個變量集，多選題的每個選項為一個變量。運用SPSS對多選題的描述統(tǒng)計建立多選題的數(shù)據(jù)文件后，就可調(diào)用Multiple Respone過程的Frequencies和Crosstabs進行描述分析，分析時有兩個重要指標：應答人數(shù)百分比（Percent of Cases）：選擇某項的人數(shù)占總人數(shù)的比例。應答次數(shù)百分比（Percent of Responses）：選擇

58、某項的次數(shù)占總次數(shù)的比例。5.2 樣本的數(shù)字特征 5.2.1 數(shù)據(jù)分布的集中趨勢5.2.2 數(shù)據(jù)分布的離散程度5.2.3 數(shù)據(jù)分布的形態(tài)5.2.4 計算樣本數(shù)字特征的SPSS例解數(shù)據(jù)分布的集中趨勢反映數(shù)據(jù)分布集中趨勢的數(shù)字特征，也稱為集中量數(shù)，包括眾數(shù)、中位數(shù)和均值等，其中最常用的是均值。眾數(shù)（mode）是指一組數(shù)據(jù)中出現(xiàn)頻率最高的那個數(shù)值，用表示。數(shù)據(jù)分布的集中趨勢中位數(shù)：將變量的取值從小到大排列，如果樣本容量是奇數(shù)，位于正中的那個值稱為中位數(shù)（median），也稱為中值，用表示；如果樣本容量是偶數(shù)，位于正中的兩個數(shù)值的平均值即為中位數(shù)。均值就是通常的算術平均數(shù)（mean），是所有數(shù)據(jù)

59、之和除以數(shù)據(jù)個數(shù)的商，記作，讀為“ 杠”。數(shù)據(jù)分布的離散程度 1全距與四分位差全距也稱極差，是一組數(shù)據(jù)中最大值與最小值的差，用R表示。2方差方差越大，樣本數(shù)據(jù)越離散。在通常的應用中，如果沒有特別說明，方差指的是樣本方差。數(shù)據(jù)分布的離散程度 3標準差樣本方差的算術平方根S稱為樣本標準差，相應地，總體方差的算術平方根稱為總體標準差。與方差相比，標準差最大的優(yōu)點是它和平均數(shù)都與原來的變量有相同的測量單位。標準差是衡量一組數(shù)據(jù)分散程度最有效的量數(shù)。數(shù)據(jù)分布的離散程度 4差異系數(shù) 差異量數(shù)用來衡量一組數(shù)據(jù)的分散程度通常都帶有計量單位。常用的差異系數(shù)有極差系數(shù)、標準差系數(shù)和四分位差系數(shù)等。

60、數(shù)據(jù)分布的形態(tài) 二項分布正態(tài)分布偏態(tài)系數(shù) 峰態(tài)系數(shù) 計算樣本數(shù)字特征的SPSS例解1使用頻數(shù)分析命令（Frequencies）計算數(shù)字特征（1）將要計算的數(shù)據(jù)導入SPSS統(tǒng)計軟件窗口。（2）按照順序依次點擊Analyze、Descriptive Statistics、Frequecies，在出現(xiàn)的 Frequecies對話框中，將要計算的變量，如年齡指定為Variables。計算樣本數(shù)字特征的SPSS例解（3）單擊Statistics按鈕，在打開的Frequecies：Statistics對話框中，點擊Central Tendency下除了Sum以外的選項（描述集中趨勢的統(tǒng)計量）；擊選Di

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

全套課件·《計算機輔助教育測量與評價》1

文檔簡介

溫馨提示

最新文檔

評論

全套課件·《計算機輔助教育測量與評價》1

文檔簡介

溫馨提示

最新文檔

評論

相關文檔