版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、劉經蘭劉經蘭贛南師范學院教育科學學院贛南師范學院教育科學學院(學前教育1101、1102)三教407周二1、2節(jié),周五雙1、2節(jié)n教育統(tǒng)計與測量是一門應用性的學科,學習的過程也是應用的過程,從而提高本門課程的學習效果,更好實現課程的功能。n準備的學習用具:統(tǒng)計功能的計算器,練習本兩本 教育統(tǒng)計篇教育測量篇教育統(tǒng)計篇教育統(tǒng)計篇n 第一講第一講 教育統(tǒng)計緒論教育統(tǒng)計緒論第一節(jié)第一節(jié) 教育統(tǒng)計學概述教育統(tǒng)計學概述研究對象研究對象研究方法研究方法研究內容研究內容研究對象研究對象教育統(tǒng)計學: 應用數理統(tǒng)計學的原理和方法研究教育問題。 主要研究如何收集、整理、分析由教育調查和教育實驗所獲得的數據資料,并以
2、此為依據進行科學推斷,揭示教育現象所蘊涵的客觀規(guī)律。研究方法n研究過程(三階段)資料的收集資料的整理資料的分析研究方法調查實驗全面調查重點調查典型調查抽樣調查單組實驗等組實驗輪組實驗一組對象,若干處理相同條件對象,不同處理一組或多組對象,輪換處理抽樣調查n單純隨機抽樣從調查總體中完全隨機地抽取調查單位或個人。n分層抽樣將總體中每一個個體按照一定的規(guī)則分為不同的類型或層次,然后從各層次中按一定規(guī)則隨機抽取若干樣本。n整群抽樣是抽取的對象以整群為單位而不是以個體不單位的抽樣方法n 機械抽樣P4隨機數的產生隨機數的產生n大小為N的總體中產生樣本量為n的隨機樣本的一個常用的方法是利用隨機數(rando
3、m number)。 n利用隨機數步驟為:(1) 把總體的所有個體編號;(2) 產生n個在0到N之間的隨機數;(3)與如此產生的隨機數中的數目相同的個體則形成了樣本量為n的簡單隨機樣本。n最原始的辦法是擲一種正20面體的均勻材料制成的骰子,標有兩套0到9的數字。每次產生一個0到9的數字。n另一種是查閱隨機數表。在一些傳統(tǒng)的統(tǒng)計教科書后可以找到隨機數表;也有專門的隨機數表的冊子。n今天,多用計算機產生的偽隨機數(pseudo-random number)來代替真正的隨機數。研究內容n描述統(tǒng)計統(tǒng)計圖表統(tǒng)計特征量n推斷統(tǒng)計正態(tài)分布總體均數的估計假設檢驗方差分析n描述統(tǒng)計研究如何對客觀現象的數量特征進
4、行計量、觀察、概括和表述。n用表和圖表示,計算特征量(如平均值)等,所論不超出已有數據。n推斷統(tǒng)計(統(tǒng)計推斷)據數據所提供信息對數據所來自的總體(母體)的性質作推斷,推斷會有錯誤、誤差,用概率論的術語和方法來描述和論證。誤差的產生源于數據有誤差。怎樣盡可能減少推斷的錯誤和誤差,是統(tǒng)計推斷的中心問題。描述統(tǒng)計與推斷統(tǒng)計描述統(tǒng)計與推斷統(tǒng)計n 目的描述數據特征找出數據的基本規(guī)律n內容確定要研究的數量特征設計統(tǒng)計指標(說明這些數量特征的)搜集數據整理數據計算并顯示指標數據描述統(tǒng)計描述統(tǒng)計的主要方法集中量數集中量數: : 描述集中趨勢描述集中趨勢差異量數差異量數: : 描述離散程度描述離散程度相關系數相
5、關系數: : 描述關系程度描述關系程度偏態(tài)系數偏態(tài)系數峰態(tài)系數峰態(tài)系數次數分布圖次數分布圖, 如如直方圖直方圖發(fā)展趨勢折線圖發(fā)展趨勢折線圖相關散點圖相關散點圖描述數據的正態(tài)程度n目的:目的:對總體特征作出推斷。n內容:內容:推斷統(tǒng)計均數差異顯著性檢驗均數差異顯著性檢驗次數分布差異顯著性檢驗次數分布差異顯著性檢驗比例數差異顯著性檢驗比例數差異顯著性檢驗變量間關系顯著性檢驗變量間關系顯著性檢驗描述統(tǒng)計與推斷統(tǒng)計的關系推斷統(tǒng)計推斷統(tǒng)計(利用樣本信息對(利用樣本信息對總體的數量特征進總體的數量特征進行估計和檢驗等)行估計和檢驗等)概率論概率論(包括分布理論、大數(包括分布理論、大數定律和中心極限定理等
6、定律和中心極限定理等)描述統(tǒng)計描述統(tǒng)計(統(tǒng)計數據的搜集、整(統(tǒng)計數據的搜集、整理、顯示和分析等)理、顯示和分析等)總體數據總體數據樣本數據樣本數據第二節(jié) 教育統(tǒng)計學的初步概念n被試n數據與變量n隨機n誤差n抽樣與樣本n定性研究和定量研究n統(tǒng)計量與參數n(一) 隨機變量n(二)總體、樣本和個體n(三)次數、頻率和概率n(四)誤差n(五) 統(tǒng)計量與參數n(六)定性研究與定量研究(一) 隨機變量隨機變量n1、在相同條件下進行的實驗或觀察,其可能結果不止一個,事先無法確定,這類現象稱為隨機現象。具備以下三個條件:n第一,一次試驗有多種可能結果,其所有可能結果是已知的;n第二,試驗之前不能預料哪一種結果
7、會出現;n第三,在相同的條件可以重復試驗。n2、隨機現象的每一種結果叫做一個隨機事件。n3、我們把能表示隨機現象各種結果的變量稱為隨機變量。用X、Y、X1、X24、隨機變量的分類:n實驗數據按由什么觀測方法得來,可劃分為兩大類,n一類是計數數據計數數據,是指計算個數的數據,一般屬性的調查獲得的是此類數據,它具有獨立的分類單位,如人口數、學校數等等,一般都取整數的形式。n另一類測量數據測量數據,是借助于一定的測量工具或一定的測量標準而獲得的,如身高、體重、分數、各種感覺閾等等。 4、隨機變量的分類:n測量數據按其是否等距和有無絕對零點,又可細分為下述四種測量水平:(1)有相等單位又有絕對零點的數
8、據稱為比率變量,如身高、體重、反應時、各種感覺閾值的物理量。(2)有相等單位但無絕對零點的數據,稱為等距變量,如溫度、各種能力分數、智商等。(3)既無相等單位,也無絕對零點,僅表示順序,不能指出其間的差別大小的數據,稱為順序變量。如等級評定、品質等級等等。(4)既無相等單位,也無絕對零點,僅表示其名稱的變量,稱為稱名變量。如名字、學號等等。4、隨機變量的分類:n測量數據按其是否具有連續(xù)性可劃分為n連續(xù)變量與離散變量(二)總體、樣本和個體n總體是指具有某種特征的一類事物的全體又稱母體。構成總體的每個基本單元稱為個體。從總體中抽取一部分個體,稱為總體的一個樣本。 (三)次數、頻率和概率 n1、次數
9、 次數是指某一事件在某一類別中出現的數目,又稱為頻數,一般用符號f表示。n2、頻率 又稱相對次數,即某一事件的次數被總的事件數目除,亦即某一數據出現的次數被這一組數據數目的總數除。頻率常用比例來表達,有時也用百分數表示。f/Nn3、概率又稱機率或然率,常用符號P表示。是指某事件在無限的觀測中所能預料的相對出現的次數。概率常用比例表示。 (四)誤差n測定的觀測值與真值之差稱為誤差.誤差可分為隨機誤差、系統(tǒng)誤差和抽樣誤差三種類別。n隨機誤差指由與研究目的無關的難以控制的偶然因素所引起的誤差。n系統(tǒng)誤差指由與研究目的無關的因素所引起的有規(guī)律性的誤差。n抽樣誤差指由于抽樣而產生的誤差。抽樣誤差屬于隨機
10、誤差的范疇,由于它在統(tǒng)計中的重要地位,所以人們專門列條陳述。(五)(五) 統(tǒng)計量與參數統(tǒng)計量與參數n統(tǒng)計量又稱統(tǒng)計特征數,是根據科研實驗所獲得的一組觀測值計算出來的一些量數,又稱為樣本統(tǒng)計量。n參數又稱總體參數,是指描述一個總體情況的一些統(tǒng)計指標。n統(tǒng)計量和參數所用的名稱基本相同,但符號是不一樣的。 (六)定性研究與定量研究n定性研究是對教育的研究內容進行質的分析,通過分類選取典型例證的方式對信息重新組織和在描述性的基礎上得出結論。n定量研究是指對教育中所包含的信息采用一定的方法、技術進行量的分析。思考與練習題n1、何謂教育統(tǒng)計學?學習它有何意義?n2、什么是隨機變量?教育科學實驗所獲得的數據
11、是否屬于隨機變量?n3、怎樣理解總體、樣本與個體?n4、何謂次數、頻率及概率?n5、統(tǒng)計量與參數之間有何區(qū)別和關系?6、下述一些數據,哪些是測量數據?哪些是計數數據?其數值意味什么?稱名變量,順序變量,等級變量,比率變量n(1)17.0千克 (2)89.85厘米n (3)199.2秒 (4)17人n (5)25本 (6)93.5分n(6)35號 (7)第一名,第二名n(8)3第二講 描述統(tǒng)計n第一節(jié)第一節(jié) 統(tǒng)計表與統(tǒng)計圖統(tǒng)計表與統(tǒng)計圖n第二節(jié)第二節(jié) 教育統(tǒng)計的特征量教育統(tǒng)計的特征量SCORE95.092.590.087.585.082.580.077.575.072.570.067.5SCOR
12、EFrequency3020100Std. Dev = 5.83 Mean = 85.5N = 80.00第一節(jié) 統(tǒng)計表與統(tǒng)計圖n統(tǒng)計表n構成:統(tǒng)計表一般由標題、表號、標目、表注等構成。橫標目的總標目(亦可空白)縱標目(一般設謂語)橫標目數字表的標題 ? ? ? 注腳:說明資料來源等 X X X (頂線)(底線)統(tǒng)計表基本格式編制統(tǒng)計表的要求 n ()表的結構要簡單明了,層次清楚。n ()表的標題要簡明扼要地、確切地反映表的內容,寫在表的上端的中央位置。n ()表的標目有橫、縱標目之分。 一般將統(tǒng)計表所要敘述的主要對象放在橫標目n上,而將用以敘述的統(tǒng)計指標在縱標目上。n ()表內數據排列要整齊
13、,小數點位置要對齊,缺數據格或無數據格要劃斜線。n ()表的標題、標目或數字有未盡之意的地方,應加腳注說明,表中資料的來源應在底線下加以注明。簡單表表2 重慶2中各年高考錄取人數年份1993 19941995 1996 1997 合計高考錄取人數101109110150190560復合表表2。4 某高級中學各年級文理科男女學生人數科別文科理科總計男女男女男女高一12085180110305195高二11090170105280195高三14011019095340205總計3702855453109155954、頻數分布表n對于一組大小不同的數據劃出等距的分組區(qū)間稱為組距(i),然后將數據按其
14、數值大小列入各個相應的組別內,便可以出現一個有規(guī)律的表式。這種統(tǒng)計表又稱之為次數分布表。 編制次數分布表的步驟 n(1)求全距。全距指最大數與最小數之間的差距。 n(2)決定組數與組距。組距是指每一組的間距,用符號i表示 n(3)列出分組區(qū)間。分組區(qū)間又稱為分組階段。n列分組區(qū)間要注意以下幾點:最高組區(qū)間內應能包含最大值的數據,最低組區(qū)間應能含最小值的數據。最高組或最低組的下限最好是組距的整數倍。分組區(qū)間可寫為10一,20一,30一,40一等,但我們l必須明確,實際上各組的精確界限應是9.5一19.499。 n(4)登記次數。依次將數據登記到各個相應的組別內,一般用劃線記數或寫正字的方法。n(
15、5)計算次數(f)。各組的次數計算好后,還要計算總和即總次數。一是為了以后計算的需要,二是為了核對各組總和與數據總數(N)是否相等。n(5)抄錄新表。登記核實后,重新制表。5.累積頻數分布表及累積百分比分布表 表一表一 三(三(2 2)班)班3030名學生語文、數學、英語期末考試成績名學生語文、數學、英語期末考試成績 (三科成績均服從正態(tài)分布) 學號語數英學號語數英學號語數英018793851180727621676571026567741276818222807883037372801366707323848795049486821453576024867775058078761544525
16、325616264067875651649504526687274077580761774818027726966086360581869707328788688095866671973747229828178107074742052435430767585表二:三(2)班30名學生語文成績頻數分布表分組區(qū)間組中值xc簡單頻數f相對次數f/N%累積頻數FbFa累積百分比%90-9513.333013.3380-85723.3329826.6770-751033.3422186060-65723.33122583.3350-5531052893.3340-4526.67230100 x30n課堂
17、練習:n三(2)班30名學生英語成績頻數分布表n利用計算機制表常用的計算機軟件:Excel,SPSS制表n用Excel軟件制表語文語文數學數學英語英語物理物理化學化學政治政治體育體育高三(1)75698976798384高三(2)82659065778976高三(3)72888789856789高三(4)67817981896963二、統(tǒng)計圖n(一)統(tǒng)計圖的功用(一)統(tǒng)計圖的功用n所謂統(tǒng)計圖就是依據數字資料,應用點、線、面、體、色彩導的描繪制成整齊而又規(guī)律,簡明而又知其數量的圖形。統(tǒng)計圖一般采用直角坐標系,橫坐標用來表示事物的組別或自變量X,縱坐標常用來表示事物出現的次數或因變量Y.(二)統(tǒng)計
18、圖的結構與制圖要點(二)統(tǒng)計圖的結構與制圖要點n圖號及圖題 n圖目n圖形圖形 n圖注圖注(三)統(tǒng)計圖的種類(三)統(tǒng)計圖的種類n統(tǒng)計圖可按形狀、數字性質、圖的用途等標志分為多種類別。教育統(tǒng)計中常用的統(tǒng)計圖可按形狀劃分為直條圖、直方圖、曲線圖、圓形圖、散點圖等等。 n統(tǒng)計圖:由標題、圖號標目、圖注等項構成。單式條形圖0204060優(yōu)良及格不及格圖2 。 3 某 中 學考核結果人數第一節(jié) 統(tǒng)計表與統(tǒng)計圖n復式條形圖020406080100高三(1 )高三(2 )高三(3 )高三(4 )語文數學英語物理圓形圖(餅圖)圖2 。 2 某中 學考核成績人數優(yōu)23%良47%及格18%不及格12%優(yōu)良及格不及格
19、圓形圖(餅圖)折線圖圖2 。 5 某 市 教育系統(tǒng)1 9 9 5 - 2 0 0 0年 人 員 平 均 工 資和經費投入變化情況(1 9 9 5 年= 1 )01231995 1996 1997 1998 1999 2000平均工資經費投入4. 線條圖5. 頻數頒布直方圖圖.4中考化學統(tǒng)計成績直方圖6. 累積頻數圖圖.5 2004年中考化學抽樣得分情況累積頻數圖 10 20 30 40 50 60 70 80 90 100圖2.6:高一語文7、面積圖面積圖北京、四川城鎮(zhèn)居民消費性支出比較0.001000.002000.003000.004000.005000.006000.00 食 品 衣 著
20、 家庭設備 醫(yī)療保健 交通和通訊 文化教育 居 住 雜項商品 四 川 北 京 n三(2)班30名學生語文成績簡單直方圖、折線圖、累積次數直方圖、累積次數曲線表二:三(2)班30名學生語文成績頻數分布表分組區(qū)間組中值xc簡單頻數f相對次數f/N%累積頻數FbFa累積百分比%90-9513.333013.3380-85723.3329826.6770-751033.3422186060-65723.33122583.3350-5531052893.3340-4526.67230100 x30n課堂練習:n三(2)班數學和英語成績的次數分布表.相對次數分布表,累積次數分布表和次數直方圖,次數多邊圖和
21、累積次數曲線.n利用計算機制圖常用的計算機軟件:Excel,SPSS制圖n用Excel軟件制圖級 別2001級2000級Count121086420去 向高 校研 究 所企 業(yè)國 家 機 關讀 博中 小 學第二節(jié) 教育統(tǒng)計的特征量n最常用的統(tǒng)計量有三類:n一類是代表一組數據典型水平或集中趨勢的量,即集中量;n另一類是反映一組數據的變異程度或離散程度的量,即差異量n第三類是反映數據的相關程度的量,即相關量。一、集中量n定義:代表一組數據典型水平或集中趨勢的量。平均數n算術平均數原始數據法:頻數分布表法n加權平均數原始數據法頻數分布表法n集中量是代表一組數據典型水平或集中趨勢的量。n常用的集中量有
22、平均數、中位數和眾數。一、平均數n1、算術平均數n2、加權平均數n1、算術平均數n簡稱為平均數或均數(Mean)。,X Ym1、算術平均數n(1)未分組數據平均數的計算方法n(2)數據分組后計算平均數的方法n(3)平均數特點n(4)平均數的意義與應用(1)未分組數據平均數的計算方法(原始數據)n當一組數據未進行統(tǒng)計分類時,若想描述其典型情況,找出其代表值,可計算算術平均數,公式為:n n公式中Xi表示所有數據的和,即Xi=XI+X2+XNnN為數據的個數。. 1niiXXNn例如,求某小組10個學生的數學測驗分數78,79,62,84,90,71,76,83,98,77的平均數。表一表一 三(
23、三(2)班)班30名學生語文、數學、英語期末考試成績名學生語文、數學、英語期末考試成績 (三科成績均服從正態(tài)分布) 學號語數 英學號語數英學號語數英0187938511807276216765710265677412768182228078830373728013667073238487950494868214535760248677750580787615445253256162640678756516495045266872740775807617748180277269660863605818697073287886880958666719737472298281781070747420
24、52435430767585(2)數據分組后計算平均數的方法(頻數分布表)n公式為:ncxfXN表二:三(2)班30名學生語文成績頻數分布表分組區(qū)間組中值xc簡單頻數f相對次數f/N%累積頻數FbFa累積百分比%90-9513.333013.3380-85723.3329826.6770-751033.3422186060-65723.33122583.3350-5531052893.3340-4526.67230100 x30(3)(3)平均數的特點平均數的特點111()nnniiiiixCxCX Cnnn在一組數據中,每一個數據加上一個常數在一組數據中,每一個數據加上一個常數C C,則所得
25、的平均數為原來的平均數加上常數則所得的平均數為原來的平均數加上常數C C。即:。即:()0ixX在一組數據中,每一個數據乘上一個常數在一組數據中,每一個數據乘上一個常數C C,則,則所得的平均數為原來的平均數乘上常數所得的平均數為原來的平均數乘上常數C C。即:。即: 離均差的和等于離均差的和等于0 0。即:。即:11()nniiiixCCxCXnn(4)平均數的意義與應用n算術平均數具備一個良好的集中量數應具備的一些條件:n反應靈敏。n確定嚴密。n簡明易解。n計算簡單。n符合代數方法進一步演算。n較少受抽變動的影響。n缺點:n 易受極端數據的影響。n 若出現模糊不清數據時,無法計算平均數。n
26、此外,必要注意,凡不同質的數據不能計算平均數。2、加權平均數n(1)加權平均數的概念n加權平均數是不同比重數據(平均數),nW表示各觀察值的權數;nX表示具有不同比重的觀察值。iiWiW XMW(2)加權平均數的計算方法n例如,某年級各班的一次數學考試成績如下:一班45人平均分為80;二班50人平均分為70;三班40人平均分為65;四班50人平均分為80;五班60人平均分為65,求全年級的總平均分。iiTin XXnn例2 :某校初一共有3個班,某次語文測驗中,一班50人均分為68,二班45人均分為75,三班40人均分為80,問全校初一語文的平均成績?89.734045508040754568
27、50WX不能用:(不能用:(68+75+80)/3=74.33二、中位數n中數,中數,又稱中點數,中位數。符號為Md中數是指位于一組數據中較大一半與較小一半中間位置的那個數。n中數的求法根據數據是 否分組,而有不同的方法。(一)未分組數據求中數的方法n例1有下列9個數,依大小排列為4、7、8、9、10、11、12、13、14(N=9)n(N+1)/2=5,序列第五的數據是10,則該組數據的中數是10。n例2有下列8個數,依大小排列為:n2、3、5、7、8、10、15、19(N=8)序列為N/2=4者是7,序列為N/2+1=5者為8,則其中數為(7+8)/2=7.5。n從以上兩例可以看出,求中數
28、不受極大值與極小值的影響,而決定中數的關鍵是居中的那幾個數據的數值大小。.(二)次數分布表求中數的方法(了解)n其具體步驟如下:n第一步求N/2,并找到N/2所在的分組區(qū)間;n第二步求含有中數那一區(qū)間以下各區(qū)間的次數和記作Fb;n第三步求N/2與 Fb之差;n第四步求序列為第N/2那一點的值。求中數的公式如下:22,bbm dam dNFM dLifNF aM dLifbbaam d其中F為中數所在組的精確下限L為該組以下各組次數的累加次數F為中數所在組的精確上限L為該組以上各組次數的累加次數f為中數所在組的簡單次數i 為組距, N 為總次數表二:三(2)班30名學生語文成績頻數分布表分組區(qū)間
29、組中值xc簡單頻數f相對次數f/N%累積頻數FbFa累積百分比%90-9513.333013.3380-85723.3329826.6770-751033.3422186060-65723.33122583.3350-5531052893.3340-4526.67230100 x30中數的意義與應用n優(yōu)點:計算簡單,容易理解,中數的概念簡單明了。n缺點:它反應不夠表敏;n計算中數時,受抽樣的影響較大,不如平均數穩(wěn)定;n中數乘以總數與數據的總和不相等;n中數不能作進一步代數運算等等。n在一些特殊情況下,它的應用受到重視。這些特殊情況是:當一組觀測結果中出現兩極端數目時。當次數分布的兩端數據或個別
30、數據不清楚時,只能取中數作為集中趨勢的代表值。當需要快速估計一組數據的代表值是,也常用中數。三、眾數的概念與求法三、眾數的概念與求法 n眾數(Mode)又稱為范數,密集數,通常數等,常用符號M0表示。眾數是指在次數分布中出現次數最多的那個數的數值。 n(一)直接觀察求眾數n(二)用公式法求眾數n(三)眾數的意義與應用n(一)直接觀察求眾數n只憑觀察找出出現次數最多的數據就是眾數。n5、8、9、8、4、3、8、1、8、4(二)用公式法求眾數n1、皮爾遜的經驗法(分數分布為正態(tài)分布)nMo=3Md-2M2、金氏插補法(了解)式中Lb為含眾數這一區(qū)間的精確下限;fa不高于眾數所在組一個組距那一分組區(qū)
31、間的次數;fb不低于眾數所在組一個組距那一分組區(qū)間的次數;I為組距 若fa=fb ,則Mo不次數最多那一區(qū)間的組中值。 這個公式適合次數分布比較偏斜的情況,當然,比較接近正態(tài)分布的出適用。aObabfMLiff眾數的意義與應用n眾數的概念簡單明了,容易理解;n但它不穩(wěn)定,受分組的影響,亦受樣本變動的影響;n反應不夠靈敏,觀察眾數,不嚴格計算而來,用計算方法所得眾數亦是一個估計值。同時不能作進一步代數運算。n眾數也不是一個優(yōu)良的集中量數,應用也不廣泛。n但在下述情況下也常有應用:當需要快速而粗略地尋求一組數據的典型情況時;當一組數據出現同質的情況時,可用眾數表示;3、當次數分布中有兩極端的數目時
32、,有時也用眾數(一般用中數);當粗略估計次數分布的形態(tài)時,有時用平均數與眾數之差,表示次數分布是否偏態(tài)的指標。平均數、中數、眾數之間的關系平均數、中數、眾數之間的關系n在一個正態(tài)分布中,平均數、中數、眾數三者相等,因此在數軸上三點重合。n在正偏態(tài)分布中MMdM。n在負偏態(tài)分布中MMdM。n平均數為一個平衡點,是一組數據的重心。它使數軸保持平衡,即支點兩側的力矩是相等的。n中數:只使其兩側的數據個數相同。n眾數:是指次數出現最多的,即重量較大的那個數據。思考與練習題1、應用算術平均數表示集中趨勢要注意什么問題?2、對于下列數據,使用何種集中量數表示集中趨勢其代表性更好?并計算它們的值。(1)4
33、5 6 6 7 29(2)3 4 5 5 7 5(3)2 3 5 6 7 8 9 3、求下列次數分布的平均數、中數和眾數分組f分組f65-135-3460-430-2155-625-1650-820-1145-1615-940-2410-74、求下列四個年級的總平均成績年級一二三四90.5919294 n236318215200X第二節(jié) 教育統(tǒng)計的特征量n二、差異量:代表一組數據離散程度、變異程度的量。(一)全距(R)n最大值與最小值之差maxminRXX(三) 方差與標準差方差與標準差n方差(Varance)也稱變異數、均方。作為統(tǒng)計量,常用符號S2,x2表示,作為總體參數,常用符號2表示。
34、n標準差(Srandard deviation)即方差的平方根,常用S或SDx表示。若用表示,則是指總體的標準差。1、方差與標準差的計算、方差與標準差的計算2212122121()()()1()1niiniiniiniiXXNXXNXXSnXXSnn問題1: 某班甲乙兩組在一次測驗中的成績分別為65,68,71,72,74(均分為70分)和 30,50,86,90,94(均分為70分)。如何評價兩組的學習情況?又如:某某研究者對實驗班用計算機輔助教又如:某某研究者對實驗班用計算機輔助教學,而對照班仍用傳統(tǒng)的講授方式進行教學,期學,而對照班仍用傳統(tǒng)的講授方式進行教學,期末進行統(tǒng)一測試,兩班學生的
35、成績如下,試比較末進行統(tǒng)一測試,兩班學生的成績如下,試比較兩種授課方式產生的效果有何不同?兩種授課方式產生的效果有何不同? 實實驗驗班班 對對照照班班 8 83 3 8 86 6 8 87 7 7 78 8 7 72 2 7 75 5 7 76 6 9 92 2 8 87 7 7 78 8 9 90 0 8 88 8 7 76 6 8 89 9 8 84 4 8 87 7 8 82 2 9 95 5 7 79 9 7 77 7 8 86 6 8 84 4 8 83 3 8 81 1 9 91 1 9 90 0 8 89 9 8 87 7 8 86 6 8 85 5 8 88 8 8 87 7
36、8 85 5 7 79 9 7 78 8 9 91 1 8 89 9 8 84 4 9 92 2 7 79 9 8 85 5 8 82 2 7 76 6 7 74 4 8 80 0 8 81 1 7 75 5 8 84 4 8 87 7 8 83 3 7 78 8 8 83 3 7 79 9 6 68 8 7 74 4 8 83 3 7 77 7 6 69 9 7 76 6 8 87 7 8 84 4 7 78 8 8 87 7 9 90 0 8 83 3 8 85 5 8 88 8 7 76 6 7 78 8 7 73 3 8 87 7 8 80 0 8 84 4 7 76 6 7 75 5
37、 7 79 9 8 84 4 8 89 9 8 87 7 7 75 5 7 71 1 7 72 2 7 76 6 8 85 5 8 88 8 8 85 5 8 83 3 8 82 2 7 78 8 6 66 6 6 65 5 總平均數=81.81平均分標準差D方差和平方和實驗班(45)83.76 5.471.9529.92 3853324107對照班(46)79.82 6.361.9940.45 3592288544表1:30名學生英語成績頻數分布表分數組中值XC fFb70-7223065-6752860-5292355-5781450-526630求平均數、標準差和方差 2、方差與標準差的
38、意義方差與標準差的意義n方差與標準差是表示一組數據離散程度的最好指標,其值越大,說明離散程度大,其值小,說明數據比較集中,它是統(tǒng)計描述與統(tǒng)計分析中最常應用的差異量數。n它基本具備一個良好的差異量數應具備的條件:(1)反應靈敏;(2)有一定的計算公式嚴密確定;(3)容易計算;(4)適合代數運算;(5)受抽樣變動的影響小,即不同樣本的標準差或方差比較穩(wěn)定;(6)簡單明了;(7)具有可加性。四、差異系數n當所觀測的樣本水平比較接近,而且是對同一個特質使用同一種測量工具進行測量時,要比較不同樣本之間離散程度的大小,一般可直接比較標準差或方慶功的大小。標準差的單位與原數據的單位相同,有時稱它為絕對差異量
39、。n差異系數,又稱變異系數、相對標準差等,通常用符號CV表示,其計算公式如下:n(1)同一團體不同觀測值的離散程度的比較;(2)對于水平相差較大,但進行的是同一觀測的各種團體,進行觀測值離散程度的比較。%100XCVn例題:某校期末考試語文平均成績?yōu)?9.3分,標準差為11.2分;英語平均成績?yōu)?4.8,標準差為13.8分。問哪一學科離散程度大?%2 .16%1003 .692 .11)(語文CV%6 .14%1008 .948 .13)(英語CVn例題:設某考區(qū)已錄取高中學生語文平均分為69分,標準差為12.5分,而未錄取高中的學生語文平均分為40分,標準差為12.5分。比較他們語文成績的離
40、散程度。 CV1=12.5/69 *100%=18.12%; CV2=12.5/40 *100%=31.25%。 未錄取學生的離散程度大。n某市區(qū)入學男童(7歲組)體重的平均值為20.37kg,標準差為2.16kg;身高的平均值為113.64cm,標準差為4.04cm。問身高與體重那個差異大?由公式%100XCV課堂練習:練習練習n1、分別用定義公式及原始數據計算、分別用定義公式及原始數據計算3,5,8,9,10的方差和標準的方差和標準差。差。n2、計算下列資料的方差和標準差。、計算下列資料的方差和標準差。分數分數50-55-60-65-70-75-80-85-90-95-總和總和頻數頻數24
41、6112437191294128n3、2002年測得我國年測得我國17歲學生歲學生400M跑成績,男學生平均數為跑成績,男學生平均數為92.5秒,秒,標準差為標準差為6.72秒,女學生平均數為秒,女學生平均數為117.0秒,標準差為秒,標準差為10.6秒,試比秒,試比較較17男女學生男女學生400M跑成績的離散程度。跑成績的離散程度。第二節(jié) 教育統(tǒng)計的特征量n相關量:用于描述兩個或多個變量間關聯程度的量。相關關系相關系數相關系數:用來描述兩個變量相互之間變化方向及密切程度的數字特征量稱為相關系數。積差相關等級相關點二列相關 相關數學與物理、物理與英語相關性比較數學物理英語物理170757675
42、260636063382756575444605660552557055690978597780894889r0.91 0.26 相關系數與相關程度表一覽表相關系數與相關程度表一覽表| r | 00.30.3|r| 0.50.50.81.0 相關程度零相關微相關切實相關密切相關高度相關完全相關相關關系正相關相關關系零相關負相關積差相關系數n積差相關兩組(N30)的正態(tài)、且呈線性關系的連續(xù)變量之間的相關。積差相關系數的定義公式:積差相關系數的定義公式:YXNYYXXXYr)(積差相關系數的定義n用原始數據計算:用特征量計算:例:P46 backNYYNXXNYXXYr/)(/)(/)(2222Y
43、XNYXNXYr等級相關系數n等級相關系數以等級次序排列或以等級次序表示的變量之間的相關Spearman 二列等級相關:N不一定必須大于30)1(6122NNDrR數學d1物理d2D1704753.50.5260563503822753.5-1.5444760615526557-16901971078038921902.0)17(75.561)1(615.52222NNDrDR由計算器算得例:10個學生數學和物理成績的等級相關分析序號序號數學分數數學分數X X物理分數物理分數Y YX X等級等級Y Y等級等級D DD D2 21949311002909222.5-0.50.25386923.5
44、2.511486703.57-3.512.255728254116707665.50.50.257686579-248667685.52.56.25964689811106160101000N=10N=102684.099102661)1(6122NNDrR點二列相關n在來自總體的兩個變量中,一個變量是連續(xù)變量,另一個變量是兩分變量(男、女;對、錯;及格、不及格),點二列相關研究這樣兩個變量之間的相關關系。pqXXrtqppb相關系數p、q兩類變量的平均值連續(xù)變量的標準差另一類別頻數的比例一類別頻數的比例性別男 男 男 男 女 男 男 女 女 女 男 女 女 男 男成績86 91 90 66
45、58 99 74 88 72 89 62 65 78 67 858098566909186PX756788858qX例:某班期末語文考試,從全體考生中隨機抽取15名學生的考試成績,見下表。問該次考試成績是否與性別有關? P48201. 04 . 06 . 019.127580pqXXrtqppq6 . 0159p4 . 0156q19.12t例題:下表為某一測驗中10名考生的卷面總分和一道選擇題的得分,試求該選擇題的區(qū)分度.(與部分的相關)考生ABCDEFGHIJ選擇題得分1111001001卷面總分75 57 73 65 67 56 63 61 65 6766.667,62.25,5.804
46、66.667 62.250.6 0.45.8040.373pqtpqpqtXXXXrpq由計算器算得:p=0.6,q=0.4, 相關n兩個變量都是二分變量,或者可以人為地分為二分變量時,使用 相關分析其相關程度。另一類數據合計及格不及格一類數據是aba+b否cdc+d合計a+cb+d)()()(dbcadcbabcadr例:從體育達標測驗的學生中隨機抽取60人,其中男、女達標情況見下表,問本次達標測驗是否與性別有關?另一類數據合計達標未達標一類數據男201232女111728合計312960)()()(dbcadcbabcadr232. 02829313211121720254.005.0)5
47、8(r例題:從研究生入學考試中,隨機抽取100人,其大學應屆與歷屆畢業(yè)生錄取情況如下表,問應屆與歷屆大學畢業(yè)生同研究生錄取與否的相關情況如何?0.23應屆錄取未錄取歷屆錄取301848未錄取2032525050100練習練習n1、求以下幾何(、求以下幾何(X)與代數()與代數(Y)的積差相關系數。)的積差相關系數。X 79 75 77 73 79 78 81 76 72 70Y 80 82 76 77 77 84 81 72 70 75 n2、校方尋某一個年級、校方尋某一個年級8位物理教師課堂教學效果位物理教師課堂教學效果所排列的名次所排列的名次(由低到高排),和這由低到高排),和這8個班級學
48、生個班級學生物理統(tǒng)一測驗的平均分數如下表,問教師課堂教物理統(tǒng)一測驗的平均分數如下表,問教師課堂教學效果與學生測驗成績是否存在相關?學效果與學生測驗成績是否存在相關?課堂教師效果得分課堂教師效果得分 4 2 8 7 3 6 1 5各班平均分數各班平均分數 72 54 80 72 63 69 51 69n3、高等教育自學考試已婚與未婚學員的高等數學成績如下、高等教育自學考試已婚與未婚學員的高等數學成績如下表,問婚否與成績是否存在相關?表,問婚否與成績是否存在相關?成績成績72 81 64 93 67 70 78 83 79 71 77 82 80 76 58 66 72 67 74 78 已婚已婚
49、1未婚未婚01 0 0 0 0 1 0 1 1 1 0 0 1 1 1 1 1 1 1 04、從研究生入學考試的學生中,隨機抽取60人,其大學應屆與歷屆畢業(yè)生錄取情況如下表,問應屆與歷屆大學畢業(yè)生同研究生錄取與否的相關情況如何?應屆合計 錄取未錄取歷屆錄取 a20 b1232未錄取C11 d1728合計302960n1、553. 02 . 4317. 3104 .7776105890110, 2 . 4, 4 .77317. 3,76,58901:YXNYXNXYYxxyrNYx得由計算器算第三節(jié) 利用計算機求特征量n利用計算機求集中量n利用計算機求差異量n利用計算機求相關量利用計算機求集中量
50、(一)n計算算術平均值(AVERAGE)步驟:1.建立Excel工作表、點擊fx、選擇常用函數或點擊統(tǒng)計、選擇AVERAGE(算術平均值)、點擊確定。2.點擊數據組表格框、拖動表格、點擊表格框、點擊確定。例:利用計算機求集中量(二)n計算中值(MEDIAN)步驟:1.建立Excel工作表、點擊fx、選擇常用函數或點擊統(tǒng)計、選擇MEDIAN (中值)、點擊確定。2.點擊數據組表格框、拖動表格、點擊表格框、點擊確定。例: Back MODE(眾數)的求法與MEDIAN的求法相似利用計算機求標準差n步驟:1.建立Excel工作表、點擊fx、選擇常用函數或點擊統(tǒng)計、選擇STDEV (標準偏差)、點擊確
51、定。2.點擊數據組表格框、拖動表格、點擊表格框、點擊確定。例: back利用Excel求積差相關系數1.建立Excel工作表、點擊fx、選擇常用函數或點擊統(tǒng)計、選擇CORREL(積差相關系數)、點擊確定。2.點擊數據組表格框(1)、拖動所選數據表格、點擊表格框(1),點擊數據組表格框(2)、拖動所選數據表格、點擊表格框(2)、點擊確定。例:利用問卷收集數據正態(tài)負偏態(tài)正偏態(tài)第三講 推斷統(tǒng)計n第一節(jié) 正態(tài)分布n第二節(jié) 總體平均數的估計n第三節(jié) 幾種常用統(tǒng)計檢驗方法n第四節(jié) 方差分析概概 率率n頻率:隨機事件頻率:隨機事件A在在n次試驗中出現次試驗中出現m次,次,m與與n的比值就是的比值就是隨機事件
52、隨機事件A發(fā)生的頻率。發(fā)生的頻率。n公式:公式:P(A)= m / nn概率:隨著試驗次數概率:隨著試驗次數n的無限增大,隨機事件的無限增大,隨機事件A的頻率穩(wěn)定于的頻率穩(wěn)定于一個常數一個常數P,這個,這個P就是隨機事件就是隨機事件A出現的概率。可表示為:出現的概率??杀硎緸椋簄 P(A) m / nn概率的性質:概率的性質:(1)0 P(A) 1(2)不可能事件的概率等于零。即)不可能事件的概率等于零。即P(v)= 0(3)必然事件的概率等于)必然事件的概率等于1。即。即P(u)= 1第一節(jié) 正態(tài)分布和正態(tài)曲線n最為常見一種概率分布形態(tài),在理論和實踐中均有廣泛的應用。n(一)密度函數n簡記n
53、特征:單峰、對稱2222xenY2,N決定峰高和寬窄。決定分布的中心位置, 標準正態(tài)分布 (standard normal distribution)的兩個參數為:=0,=1 記為 N(0,1) XeAXzNNuXz,21);1 , 0(),(222其中標準正態(tài)分布被轉化為變換:一般正態(tài)分布標準正態(tài)變量經一般正態(tài)分布為一個分布族:N(m,s2) ;標準正態(tài)分布只有一個 N(0,1) ;這樣簡化了應用 dXeXFXX)2()(2221)(221( )2zZ ue u-0.00.10.20.30.40.5-4-3-2-101234zf(X)正態(tài)曲線( normal curve )圖形特點:1. 鐘
54、型2. 中間高3. 兩頭低4. 左右對稱5. 最高處對應于X軸的值就是均數6. 曲線下面積為17. 標準差決定曲線的形狀正態(tài)分布的特征n1、正態(tài)分布的形式是對稱的,(但對稱的不一定是正態(tài)分布),它的對稱軸是過平均數點的垂線。正態(tài)分布中,平均數、中數、眾數三者相等,此點y值最大(0.3989)。n2、正態(tài)分布的中央點(即平均數點)最高,然后逐漸向兩側下降,曲線的形式是先向內彎,然后向外彎,拐點位于正負1個標準差處,曲線兩端向靠近基線處無限延伸,但終不能與基線相交。012-1-2xy-33=0=1n3、正態(tài)曲線下的面積為1,由于它在平均數處左右對稱,故過平均數點的垂線將正態(tài)曲線下的面積劃分為相等的
55、兩部分,即各為0.50。0.00.10.20.30.40.5-4-3-2-101234Xf(X)0.5二、正態(tài)分布表的編制與使用n依據正態(tài)分布的密度函數,編制方法:從Z=O開始,逐漸變化Z分數,計算從Z=0至某一定值之間的概率。012-1-2zy-33=0P=1zYn正態(tài)表一般包括以下三欄:n第一欄表明Z分數單位, 在平均數這一點上Z=0,在平均數以上(即曲線右側)Z分數為正值,在平均數以下(即曲線左側)Z分數為負值。一般正態(tài)表上z分數列到3.99,更詳細的列到5.00。n第二欄為y(即密度函數或比率數)值,即某一Z分數點上的曲線縱坐標的高度,標準正態(tài)曲線下y=0.3989,它是Z=0。這一點
56、上曲線縱坐標具有的最大值或說概率密度值。n第三欄為概率值(常標以P)即不同z分數點與平均數之間的面積與總面積之比。(一)依據Z分數求概率。即已知差度(Z),求面積(P)n1.某Z分數值與平均數(Z=0)之間的概率。nP(0z1)=0.34134=p(-1z0)nP(0z2)=0.47725=p(-2z0)nP(0z3)=0.49865=p(-3z3)=0.5-0.49865=0.00135nP(z1)=0.5+0.34134=0.84134012-1-2zy-33=0P?z3.求兩個Z分數之間的概率。n1 1夾中間面積為夾中間面積為68.26%68.26%,n 即即 P P(1 1Z Z1 1
57、)= 68.26%= 68.26%;n2 2夾中間面積為夾中間面積為95.46%95.46%,n 即即 P P(2 2Z Z2 2)= 95.46%= 95.46%;n3 3夾中間面積為夾中間面積為99.73%99.73%,n 即即 P P(3 3Z Z3 3)= 99.73%= 99.73%;012-1-2zy-33=0P=1z2?z1n(二)從概率(P)求Z分數,即從面積求差度值。這種計算的查表方法有以下幾種情況:n 1、從平均數開始的概率值已知,求Z值。n p(0z1)=0.34134nP(0z2)=0.47725nP(0z1.645)=0.05, Z.05=1.645nP(z 2.33
58、)=0.01, Z.01=2.33nP(z-1.645)=0.05, nP(z-2.33)= 0.01,012-1-2zy-33=0PZ?3、若已知正態(tài)曲線下中央部分的概率,求Z分數是多少n中間面積為中間面積為90%90%,nZ Z.1/2.1/2= =1.645n 即即 P P( 1.645 1.645 Z Z 1.645 1.645 )= 90%= 90%;n中間面積為中間面積為95%95%, nZ Z.05/2.05/2= =1.96n 即即 P P( 1.96 1.96 Z Z 1.96 1.96 )= 95%= 95%;n中間面積為中間面積為99%99%,n Z Z.01/2.01/
59、2= =2.58n 即即 P P( 2.58 2.58 Z Z 2.58 2.58 )= 99%= 99%。012-1-2zy-33=0PZ?n(三)求概率的密度Y,即正態(tài)曲線的高。n 不論已知概率,還是已知Z值,都可從表的第一或第三欄查對應的第二欄。所知的概率是位于正態(tài)曲線的中間部分,還是兩尾端部分。這一點要注意區(qū)分,才能通過P值查表求得正確的概率密度Y。012-1-2zy-33=0PY?記住以下數據:n1夾中間面積為夾中間面積為68.26%,n 即即 P(1Z1)= 68.26%;n2夾中間面積為夾中間面積為95.46%,n 即即 P(2Z2)= 95.46%;n3夾中間面積為夾中間面積為
60、99.73%,n 即即 P(3Z3)= 99.73%;n1.645夾中間面積為夾中間面積為90%,n 即即 P( 1.645 Z 1.645 )= 90%;n1.96夾中間面積為夾中間面積為95%,n 即即 P( 1.96 Z 1.96 )= 95%;n2.58夾中間面積為夾中間面積為99%,n 即即 P( 2.58 Z 2.58 )= 99%。三、正態(tài)分布在測驗記分方面的應三、正態(tài)分布在測驗記分方面的應用用n1、將原始分數轉換成標準分數。n2、確定錄取分數線n3、確定等級評定人數n4、確定在正態(tài)分布下特定分數界限內的考生人數1 1、將原始分數轉換成標準分數。、將原始分數轉換成標準分數。XXZ
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年道路運輸客運從業(yè)資格證繼續(xù)教育試題
- 考點07功能關系能量守恒定律
- 教師資格考試初中體育與健康面試試題與參考答案(2024年)
- 電氣施工方案
- 銀行職工羽毛球興趣小組活動方案
- 個人月工作總結報告
- 大數據征信體系下個人信息保護探討
- 新華書店規(guī)章制度
- 教師資格考試高中地理學科知識與教學能力試卷及答案指導
- 2024年成果共贏:健康顧問業(yè)績分紅合同
- 工程地質調查規(guī)范
- 凈水設備采購務投標方案技術標
- 第15課《誡子書》課件(共31張)語文七年級上冊
- 人教版六年級上冊數學期末看圖列式計算專題訓練
- GB/T 43321-2023銅及銅合金釬焊推薦工藝規(guī)范
- 江蘇省城鎮(zhèn)污水處理廠納管工業(yè)廢水分質處理評估技術指南(試行)
- 機械傷害事故現場的緊急救援和治療措施
- 圍墻監(jiān)控施工方案
- 14S501-2 雙層井蓋圖集
- 廣東省湛江市廉江市第四中學2023-2024學年八年級上學期期中考試物理試題
- 第13課沖出地球(教學課件)六年級科學上冊
評論
0/150
提交評論