劉麗芳 教育統(tǒng)計(jì)學(xué)課件描述統(tǒng)計(jì)_第1頁
劉麗芳 教育統(tǒng)計(jì)學(xué)課件描述統(tǒng)計(jì)_第2頁
劉麗芳 教育統(tǒng)計(jì)學(xué)課件描述統(tǒng)計(jì)_第3頁
劉麗芳 教育統(tǒng)計(jì)學(xué)課件描述統(tǒng)計(jì)_第4頁
劉麗芳 教育統(tǒng)計(jì)學(xué)課件描述統(tǒng)計(jì)_第5頁
已閱讀5頁,還剩209頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

教育統(tǒng)計(jì)學(xué)本學(xué)期主要內(nèi)容第一章緒論第二章數(shù)據(jù)的初步整理第三章集中量第四章差異量第五章相關(guān)關(guān)系第六章抽樣分布及總體平均數(shù)的推斷第七章平均數(shù)差異的顯著性檢驗(yàn)第十章χ2檢驗(yàn)第十一章相關(guān)分析主要內(nèi)容:1.1統(tǒng)計(jì)學(xué)的發(fā)展史簡介1.2教育統(tǒng)計(jì)學(xué)的主要內(nèi)容1.3統(tǒng)計(jì)學(xué)中的基本概念1.4學(xué)習(xí)教育統(tǒng)計(jì)學(xué)的方法第一章緒論1.1.1統(tǒng)計(jì)學(xué)的起源第一階段稱之為“城邦政情”

階段STATISTICS(統(tǒng)計(jì)學(xué))一詞源于法語STATUS(狀態(tài))自中世紀(jì)以來逐漸演變?yōu)楹姓我馕兜腟TATE(國家)。因此,統(tǒng)計(jì)學(xué)包含有對國家狀態(tài)作調(diào)查研究的意義。概率論的起源與發(fā)展。概率論的發(fā)展最早源于賭博

1654年:德.梅勒,帕斯卡,費(fèi)馬(法國)惠更斯(C.Huygens)著《論賭博中的計(jì)算》

1.1統(tǒng)計(jì)學(xué)的發(fā)展史簡介第二階段稱之為“政治算數(shù)”

階段十七世紀(jì),政治算術(shù)統(tǒng)計(jì)學(xué)在英國興起。1690年英國威廉·配弟出版(政治算數(shù))一書作為這個(gè)階段的起始標(biāo)志.K.Pearson(1857~1936),

在前人的基礎(chǔ)上發(fā)展出許多描述統(tǒng)計(jì)方法:頻數(shù)分布、頻數(shù)分布函數(shù)、標(biāo)準(zhǔn)差、相關(guān)等。第三階段稱之為“統(tǒng)計(jì)分析科學(xué)”

階段W.S.Gorsset(戈賽特)(Student)開始研究t分布R.A.Fisher(費(fèi)希爾)統(tǒng)計(jì)推斷學(xué)的創(chuàng)立F分布1.1.2統(tǒng)計(jì)學(xué)的應(yīng)用

當(dāng)今信息時(shí)代,無論社會政治、軍事、經(jīng)濟(jì),還是生物醫(yī)學(xué)、教育心理、工農(nóng)業(yè)生產(chǎn)等各行各業(yè)都有大量的數(shù)據(jù),需要我們進(jìn)行分析,從中挖掘出有用的證據(jù)、消除虛假的信息,發(fā)現(xiàn)事物內(nèi)部的規(guī)律性。

案例1‘非典’中的統(tǒng)計(jì)問題北京血液中心高XX主任介紹:香港醫(yī)務(wù)人員用已康復(fù)者血漿治療20例非典病人無一例死亡,而其對照組20例中,有3人死亡。這表明用康復(fù)病人血漿治療非典病人是有效的。

---摘自<北京日報(bào)>2003.5.28用康復(fù)病人血漿治療非典病人真有效嗎?應(yīng)用統(tǒng)計(jì)分析進(jìn)行卡方(χ2)檢驗(yàn),很快得出結(jié)論:P=0.2308>0.05.經(jīng)過統(tǒng)計(jì)分析,認(rèn)為兩組差別無統(tǒng)計(jì)意義?,F(xiàn)在實(shí)事也不支持原研究者的用康復(fù)病人血漿治療非典病人結(jié)論。案例2離婚案件

1949年,西方某國家曾有過一個(gè)真實(shí)的故事。丈夫到法院要求離婚,唯一的理由是他去海外服兵役50個(gè)星期后,回家發(fā)現(xiàn)妻子在家分娩。法官怎么樣判案?

這樁訴訟案的統(tǒng)計(jì)學(xué)問題是如何判定正常最長妊娠期的時(shí)間。正常妊娠期的統(tǒng)計(jì)分布圖正常妊娠期超過48周的頻率幾乎為零。大部分人會覺得丈夫蒙受了不白之冤,如果當(dāng)時(shí)法官僅通過正常妊娠期分布,會判丈夫勝訴。此時(shí),妻子可能蒙冤,雖然其蒙冤的可能性很小。法官判決法官根據(jù)醫(yī)學(xué)界的證詞,認(rèn)定懷孕50周,盡管不大可能,但仍可能是科學(xué)事實(shí),因此判丈夫敗訴。

在這樁訴訟案中,統(tǒng)計(jì)學(xué)依據(jù)和其它法庭證據(jù)一樣,只能為法官判案提供參考,不能成為唯一的判決依據(jù)。

2000年,法國政府已將統(tǒng)計(jì)學(xué)列入二十一世紀(jì)影響法國社會發(fā)展的十個(gè)重大領(lǐng)域之一。2001年,中國國家教育部為推進(jìn)基礎(chǔ)教育改革而推出新課程標(biāo)準(zhǔn),將統(tǒng)計(jì)學(xué)納入新的小學(xué)數(shù)學(xué)課程。要求小學(xué)生要“經(jīng)歷運(yùn)用數(shù)據(jù)描述信息、作出推理的過程,發(fā)展統(tǒng)計(jì)觀念”。

1.2.1統(tǒng)計(jì)學(xué)與教育統(tǒng)計(jì)學(xué)1.統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)是研究統(tǒng)計(jì)原理和方法的科學(xué)。具體:是研究如何搜集、整理、分析反映事物總體的數(shù)字資料,并以此為依據(jù),對總體特征進(jìn)行推斷的原理和方法。

2.教育統(tǒng)計(jì)學(xué)

教育統(tǒng)計(jì)學(xué)是運(yùn)用數(shù)理統(tǒng)計(jì)的原理和方法研究教育問題的一門應(yīng)用科學(xué)。主要任務(wù):研究如何搜集、整理、分析由教育調(diào)查和教育實(shí)驗(yàn)等途徑所獲得的數(shù)字資料,并以此為依據(jù),進(jìn)行科學(xué)推斷,從而揭示蘊(yùn)含在教育現(xiàn)象中的客觀規(guī)律。1.2教育統(tǒng)計(jì)學(xué)的主要內(nèi)容

教育調(diào)查研究流程提出問題——確定調(diào)查內(nèi)容——確定調(diào)查范圍——進(jìn)行調(diào)查——收集、整理、分析數(shù)據(jù)資料——得出結(jié)論。教育科學(xué)實(shí)驗(yàn)研究流程教育科學(xué)實(shí)驗(yàn):提出問題——界定——確定研究范圍——假說——實(shí)驗(yàn)——收集、整理、分析數(shù)據(jù)資料——得出結(jié)論。教育統(tǒng)計(jì)學(xué)的研究內(nèi)容(1)提供各種統(tǒng)計(jì)方法的應(yīng)用條件。(2)對統(tǒng)計(jì)計(jì)算的結(jié)果進(jìn)行解釋。1.描述統(tǒng)計(jì)

對已獲得的數(shù)據(jù)進(jìn)行整理、概括,顯現(xiàn)其分布特征的統(tǒng)計(jì)方法,稱為描述統(tǒng)計(jì)。常用的描述統(tǒng)計(jì)方法:集中量、差異量、標(biāo)準(zhǔn)分?jǐn)?shù)、相關(guān)量。

2.推斷統(tǒng)計(jì)

根據(jù)樣本所提供的信息,運(yùn)用概率的理論進(jìn)行分析、論證。在一定可靠程度上對總體分布特征進(jìn)行估計(jì)、推測。這種統(tǒng)計(jì)方法成為推斷統(tǒng)計(jì)。3.實(shí)驗(yàn)設(shè)計(jì)

實(shí)驗(yàn)者為了揭示實(shí)驗(yàn)中自變量與因變量的關(guān)系,在實(shí)驗(yàn)前所制訂的實(shí)驗(yàn)計(jì)劃稱為實(shí)驗(yàn)設(shè)計(jì)。

1.2.2教育統(tǒng)計(jì)學(xué)的基本內(nèi)容

資料收集描述統(tǒng)計(jì)推斷統(tǒng)計(jì)概率論經(jīng)常性資料調(diào)查數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)歷史資料測驗(yàn)數(shù)據(jù)統(tǒng)計(jì)圖表集中量差異量相關(guān)量

Z檢驗(yàn)T檢驗(yàn)χ2檢驗(yàn)相關(guān)分析1.2.3教育統(tǒng)計(jì)學(xué)的結(jié)構(gòu)

1.3教育統(tǒng)計(jì)中幾個(gè)基本概念。

1.隨機(jī)現(xiàn)象:它具有以下三個(gè)特征:①一次實(shí)驗(yàn)有多種可能的結(jié)果,其所有可能的結(jié)果是已知的;②試驗(yàn)之前不能預(yù)料哪一種結(jié)果會出現(xiàn);③在相同的條件下可以重復(fù)實(shí)驗(yàn)。2.隨機(jī)事件:隨機(jī)現(xiàn)象的每一種結(jié)果叫做一個(gè)隨機(jī)事件。3.隨機(jī)變量:我們把能表示隨現(xiàn)象各種結(jié)果的變量稱為隨機(jī)變量。所研究的具有某些相同性質(zhì)的全部單位或事件的整體??傮w無限總體:含無限多個(gè)單位。范圍有限總體:含有限個(gè)單位。樣本:亦可稱為抽樣總體,是從總體中抽取部分單位所組成的整體,用以分析總體。樣本中包含個(gè)體的數(shù)目成為樣本的容量,用n表示

二總體和樣本三統(tǒng)計(jì)量和參數(shù)

參數(shù):總體上的各種數(shù)字特征是參數(shù)總體平均值μ總體標(biāo)準(zhǔn)差σ統(tǒng)計(jì)量:樣本上的數(shù)字特征是統(tǒng)計(jì)量樣本平均值樣本標(biāo)準(zhǔn)差σx隨機(jī)抽樣是根據(jù)隨機(jī)原則來抽取樣本單位

.簡單隨機(jī)抽樣方法:在抽樣框中的每個(gè)單位都具有相同的被抽中的機(jī)會,每個(gè)容量相同的樣本被抽中的機(jī)會也是相同的。

亦稱為純隨機(jī)抽樣抽取樣本的方法:有放回抽樣和無放回抽樣。

適合:總體內(nèi)部差異不是很大,規(guī)模也不大的情況。四抽樣方法機(jī)械抽樣方法:抽樣框中的N個(gè)單位被分成k個(gè)系統(tǒng),k等于抽樣框的容量N除以所需的樣本容量n,在抽樣框中前面的k個(gè)個(gè)體或單位中隨機(jī)抽出第一個(gè)樣本單位,然后,可在其后的每隔k個(gè)單位抽取樣本中其余的部分。亦可稱為等距抽樣············例如:從我校11級3000名新生中隨機(jī)抽取300人了解其英語學(xué)習(xí)水平。分層抽樣亦可稱為類型抽樣

方法:將總體全部單位分類,形成若干個(gè)類型組,后從各類型中分別抽取樣本單位,合成樣本??傮wN樣本n······例如,對某校800個(gè)學(xué)生的品德情況進(jìn)行了解,擬取40個(gè)學(xué)生作為樣本。800個(gè)學(xué)生學(xué)科成績優(yōu)(160人):良(320人):中(240人):差(80人):然后從各部分隨機(jī)抽樣。整群抽樣方法:首先把總體中的N個(gè)單位劃分成為若干個(gè)群,并要求每個(gè)群對整個(gè)總體都具有代表性,然后對群進(jìn)行簡單隨機(jī)抽樣,并對抽中群內(nèi)的所有單位進(jìn)行調(diào)查研究。

總體群數(shù)R=16樣本群數(shù)r=4樣本容量ABCDEFGHIJKLMNOPLHPD適用范圍:比簡單隨機(jī)抽樣的方法能節(jié)約更多的成本,特別當(dāng)總體的分布地域非常遼闊時(shí)。思想觀念+學(xué)習(xí)方法

1.4學(xué)習(xí)教育統(tǒng)計(jì)學(xué)的方法

1)思想觀念教育統(tǒng)計(jì)學(xué)不神秘,不可怕,不難學(xué)好。教育統(tǒng)計(jì)學(xué)既很有用,也很有趣。中學(xué)教師專業(yè)成長過程中必須開展教學(xué)研究(論文)2)學(xué)習(xí)方法

2)重視典型案例的系統(tǒng)學(xué)習(xí)重點(diǎn)掌握:基本概念、各種方法使用條件、范圍3)重視理論與課后練習(xí)相結(jié)合第二章數(shù)據(jù)的初步整理§2—1數(shù)據(jù)的來源及種類§2—2統(tǒng)計(jì)表§2—3統(tǒng)計(jì)圖§2—1數(shù)據(jù)的來源及種類

一數(shù)據(jù)的來源1.

經(jīng)常性資料2.

專題性資料(1)教育調(diào)查:現(xiàn)情調(diào)查、回顧調(diào)查和跟蹤調(diào)查(2)教育實(shí)驗(yàn):單組實(shí)驗(yàn)、等組實(shí)驗(yàn)二數(shù)據(jù)的種類1.按數(shù)據(jù)的來源分:點(diǎn)計(jì)數(shù)據(jù)和測量數(shù)據(jù).2.按隨機(jī)變量的取值分:間斷型隨機(jī)變量和連續(xù)型隨機(jī)變量.2.2.1表的基本結(jié)構(gòu)標(biāo)題表號標(biāo)目(橫標(biāo)目、縱標(biāo)目)線條(三欄一豎)數(shù)字(表的主要內(nèi)容)表注§2—2統(tǒng)計(jì)表1.簡單表只列出觀察對象的名稱、地點(diǎn)、時(shí)序或統(tǒng)計(jì)指標(biāo)名稱的統(tǒng)計(jì)表為簡單表。表2.2某年級各班學(xué)生人數(shù)班別一班二班三班四班五班人數(shù)42365045173表2.3某校高三學(xué)生各年高考錄取人數(shù)年份199819992000總和高考錄取人數(shù)1441231253922.2.2統(tǒng)計(jì)表的種類

2.分組表只按一個(gè)標(biāo)志分組的統(tǒng)計(jì)表成為分組表。

表2.5上海市區(qū)幼兒20米跑步用時(shí)年齡組3歲4歲5歲6歲平均秒數(shù)(

)7.717.166.045.533.復(fù)合表按兩個(gè)或兩個(gè)以上標(biāo)志分組的統(tǒng)計(jì)表為復(fù)合表。表2.6本市市區(qū)、郊區(qū)4歲和6歲幼兒守恒能力測定成績統(tǒng)計(jì)表nS4歲市區(qū)16763.3719.17郊區(qū)9166.1518.236歲市區(qū)16791.4719.53郊區(qū)9197.7516.572.3.3.1概念1.頻數(shù)某一個(gè)隨機(jī)事件在n次試驗(yàn)中出現(xiàn)的次數(shù)稱為這個(gè)隨機(jī)事件的頻數(shù)。2.頻數(shù)分布將各種隨機(jī)事件在n次試驗(yàn)中出現(xiàn)的次數(shù)分布,稱為頻數(shù)分布。3.頻數(shù)分布表頻數(shù)分布用表格形式表達(dá)出來,這種表格叫頻數(shù)分布表。2.3.3頻數(shù)分布表列法

例2.1師大附小二年級80個(gè)學(xué)生的身高如下表,并用該數(shù)據(jù)做頻數(shù)分布表。表2.9師大附小二年級80個(gè)學(xué)生的身高1351341291331311311311341251281351271271331301321321291241321221241271311371321331341241281351331311231151321341381241321281361271201251311361271241291291321381251311201211441281331281271301201211221271211251301401211261301221281271251271312.3.3.2連續(xù)變量頻數(shù)分布表的編制

1.求全距

全部數(shù)據(jù)的最大值與最小值之差例:R=最大值—最小值=144—115=29(cm)2.決定組數(shù)與組距

組數(shù)(k):分組的個(gè)數(shù)(一般10~15為宜),具體根據(jù)樣本大小來確定組數(shù),組數(shù)的確定要與組距同時(shí)考慮。例題中決定組數(shù)為10。上例:i=3.決定組限每組的最低值為下限,最高值為上限,列出各組組限時(shí),最低一組應(yīng)包括最小的一個(gè)數(shù)據(jù),最高一組應(yīng)包括最大的一個(gè)數(shù)據(jù)。4.登記頻數(shù)并計(jì)算用劃“正”字法。將數(shù)據(jù)列入相應(yīng)的組距內(nèi),在歸組時(shí)如遇有的數(shù)據(jù)正好等于某組的組限時(shí),可將它歸入數(shù)據(jù)較大的一組。5.計(jì)算頻數(shù)

全部數(shù)據(jù)登記完后,把各組次數(shù)寫在頻數(shù)分布表內(nèi),用“f”表示。表2.10二年級80個(gè)學(xué)生身高的頻數(shù)身高(1)組中值(2)頻數(shù)(3)115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.513810201912421總和801.區(qū)分幾個(gè)概念組中值頻數(shù)(絕對頻數(shù))(f)相對頻數(shù)(比率)(rf)累積(絕對)頻數(shù)(cf)累積相對頻數(shù)(Relcf)2.3.3.3制作累積頻數(shù)和累積百分比分布表

表2.10二年級80個(gè)學(xué)生身高的頻數(shù)、累積頻數(shù)、累積百分比表身高組中值頻數(shù)相對頻數(shù)累積頻數(shù)累積百分比115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.513810201912421.0125.3750.1000.1250.2500.2375.1500.0500.0250.01251412224261737779801.255.0015.0027.5052.5076.2591.2596.2598.75100總和802.累積頻數(shù)和累積百分比分布表

2.3.1表示間斷變量的統(tǒng)計(jì)圖1.直條圖是利用條形的長短比較各種統(tǒng)計(jì)指標(biāo)的大小。繪制手續(xù)簡便、表現(xiàn)形式明確、圖形效果良好。縱排——柱形圖橫排——帶形圖§2—3統(tǒng)計(jì)圖

圖2.1大學(xué)生和高中生對化學(xué)課程的不滿意率(2001年)繪制直條圖注意點(diǎn):圖形的尺度必須以零點(diǎn)為起點(diǎn),同時(shí)尺度上的任何單位必須用相等距離表示。條形的長短表示數(shù)量的多少。各條形的寬度必須相等,各條形之間的間隔應(yīng)一致,一般為條形寬度的一半至一倍比較合適。各條形的排列應(yīng)有一定的順序。直條的頂端和下端不要注寫數(shù)字。在復(fù)合條形圖和條形結(jié)構(gòu)圖中應(yīng)采用不同的線紋或顏色加以區(qū)別并加制圖說明。

2.圓形圖圓形圖的定義是一種經(jīng)常用來說明總體結(jié)構(gòu)的圖形。一個(gè)圓形代表一個(gè)完整的總體,圓形內(nèi)的各個(gè)扇形相當(dāng)于總體的各個(gè)組成部分.

繪制步驟求各組成部分所占百分比.求組成部分的中心角度數(shù).以圓的下半徑(或上半徑)為基線,按被比事物特定順序,根據(jù)各部分的角度數(shù),以順時(shí)針方向,用量角器將圖形分成幾個(gè)扇形.用不同線條或不同顏色將各扇形加以區(qū)別,并在各扇形內(nèi)用簡要文字及百分比加以注明.例2.2將下表11的資料制成圖2表2.11某區(qū)幼兒園家長文化程度統(tǒng)計(jì)表文化程度百分比圓心角初中以下初中高中、中專大專以上40.2%40.8%15.9%3.1%144.72°146.88°57.24°11.16°圖2.2:某區(qū)幼兒園家長文化程度統(tǒng)計(jì)圖1.線形圖定義表示兩個(gè)變量之間的函數(shù)關(guān)系。一種事物隨另一種事物變化的情況;某種事物隨時(shí)間推移的發(fā)展趨勢等。繪制方法先畫一條直角坐標(biāo)系,橫軸表示時(shí)間或自變量,縱軸表示頻數(shù)或因變量。描點(diǎn):用直線連接相鄰兩點(diǎn)。(按時(shí)間順序連成線條即成)2.3.2表示連續(xù)變量的統(tǒng)計(jì)圖

表2.12建國以來某地區(qū)幼兒園人數(shù)統(tǒng)計(jì)表年份人數(shù)(萬)解放前495153552.03.54.04.56.0圖2.3:建國以來,某地區(qū)幼兒園人數(shù)發(fā)展統(tǒng)計(jì)圖1.線形圖注意點(diǎn):繪折線,不畫光滑曲線圖中相比較的線一般不超過五條,圖中不用文字或數(shù)字表示。常用的頻數(shù)分布圖有:直方圖多邊圖累積多邊圖2.頻數(shù)分布圖表2.13二年級80個(gè)學(xué)生身高的頻數(shù)、累積頻數(shù)、累積百分比身高組中值頻數(shù)累積頻數(shù)累積百分比115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.5138102019124211412224261737779801.255.0015.0027.5052.5076.2591.2596.2598.75100總和80直方圖

用面積表示頻數(shù)分布,用各組上下限的矩形面

積表示各組的頻數(shù).

作橫軸:把上表第(1)列的上、下限或第(2)列的組中值分置于橫軸上.表上共有10個(gè)組,而作圖時(shí),須在橫軸的兩端至少各空出一個(gè)組距的位置.作縱軸:在縱軸上表明尺度及其單位,以指示頻數(shù).在縱軸上定出各組頻數(shù)高度,并在各組頻數(shù)高度處劃一橫線與各組上、下限的兩條縱線相交,形成一個(gè)矩形。由于橫軸上各組距之間是連續(xù)的,故各矩形之間不能留空隙。甚至每個(gè)矩形的內(nèi)側(cè)垂線也可以不畫.圖2.5:二年級80個(gè)學(xué)生身高的頻數(shù)分布直方圖特點(diǎn):以縱軸上的高度表示頻數(shù)的多少。繪制:以各組的中點(diǎn)為橫坐標(biāo),以各組的頻數(shù)為縱坐標(biāo)描點(diǎn)并用直線連接,即成。圖形的兩端應(yīng)該引至外側(cè)一組的中點(diǎn)與基線相接。圖2.6:二年級80個(gè)學(xué)生身高的頻數(shù)分布多邊圖多邊圖圖2.7:二年級80個(gè)學(xué)生身高的頻數(shù)分布多邊圖累積頻數(shù)多邊圖的繪制:※作橫軸將學(xué)生身高各組的上、下限分置于橫軸上?!骺v軸在縱軸上標(biāo)明尺度與單位,以指示累積頻數(shù)?!椟c(diǎn)以各組上限為橫坐標(biāo),各組累積頻數(shù)為縱坐標(biāo)描點(diǎn),用弧線連接每相鄰的兩點(diǎn),即成累積頻數(shù)多變圖,圖形左端應(yīng)引至第一組的下限與基線相接。累積頻數(shù)和累積百分比多邊圖

表2.14二年級80個(gè)學(xué)生身高的頻數(shù)、累積頻數(shù)、累積百分比表例圖2.8:二年級80個(gè)學(xué)生身高的累積頻數(shù)和累積百分比分布圖身高組中值頻數(shù)累積頻數(shù)累積百分比115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.5138102019124211412224261737779801.255.0015.0027.5052.5076.2591.2596.2598.75100總和80因?yàn)槔鄯e頻數(shù)和累積百分比圖形都成“S”形,所以統(tǒng)稱為“S”型曲線。S型曲線特殊應(yīng)用是:假如給出橫軸上一個(gè)分值,我們可以找出其百分位置.成績組中值甲組乙組20-22.53125-27.511430-32.562035-37.5101940-42.5182145-47.5212150-52.5291455-57.5281360-62.540565-67.531470-72.532275-77.519080-82.514085-87.510090-92.540總計(jì)266134練習(xí):把下列甲乙兩組學(xué)生化學(xué)成績的分布制在同一直角坐標(biāo)上,以資比較3.1算術(shù)平均數(shù)3.2中位數(shù)3.3眾數(shù)第三章集中量

集中量是代表一組數(shù)據(jù)典型水平或集中趨勢的量。集中量的作用:利用集中量數(shù)可以對各個(gè)總體(或各個(gè)樣本)進(jìn)行比較。集中量的種類:平均數(shù)()中位數(shù)(Md);眾數(shù)(Mo)

集中量的概念及作用

1、概念算術(shù)平均數(shù)通常稱平均數(shù),統(tǒng)計(jì)上簡稱均值或均數(shù),是最重要的集中量數(shù),常用代表總體平均數(shù),代表樣本平均數(shù)。2.公式:(算術(shù)平均數(shù)=)其中:=總和

X=各觀察值

N=觀察值的個(gè)數(shù)3.1.1算術(shù)平均數(shù)概念3.1算術(shù)平均數(shù)1.原始數(shù)據(jù)計(jì)算法例:某幼兒園大班幼兒10名,在某次計(jì)算練習(xí)中成績分別為9,6,8,9,7,6,8,9,7,7。試計(jì)算這些幼兒的計(jì)算練習(xí)的平均成績。3.1.2算術(shù)平均數(shù)計(jì)算解:公式:其中:

表示各組組中值與頻數(shù)乘積之和 表示頻數(shù)總和(=N)2.頻數(shù)分布表計(jì)算法(組中值計(jì)算法)

例:表3.148個(gè)學(xué)生數(shù)學(xué)分?jǐn)?shù)算術(shù)平均數(shù)組中值計(jì)算算術(shù)平均數(shù)是最好的集中量數(shù),因?yàn)樗邆湟粋€(gè)良好的集中量所應(yīng)具備的條件。(1)優(yōu)點(diǎn):○反應(yīng)靈敏:一組數(shù)據(jù)中任何一個(gè)數(shù)值發(fā)生或大或小的變化,所計(jì)算出來的算術(shù)平均數(shù)也會隨之變大變小?!饑?yán)密確定:由同一組數(shù)據(jù)計(jì)算出來的平均數(shù)是同一個(gè)值?!鹩?jì)算簡便:只需四則運(yùn)算?!鹗艹闃幼儎拥挠绊戄^小?!鹗怯?jì)算方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)以及推斷統(tǒng)計(jì)的基礎(chǔ)。(2)缺點(diǎn):○易受兩極端數(shù)值的影響(只要一個(gè)極低值,就會下降,反之則上升)。○一組數(shù)據(jù)中某個(gè)數(shù)值模糊或不確切,就無法計(jì)算其。3.1.2算術(shù)平均數(shù)的應(yīng)用及其特點(diǎn)中位數(shù)是位于依一定大小順序排列的一組數(shù)據(jù)中央位置的數(shù)值,大于及小于這一數(shù)值各有一半數(shù)據(jù)分布。中位數(shù)普遍用符號Md表示,在中位數(shù)前后所包含數(shù)據(jù)的次數(shù)各為50%,即50%的分?jǐn)?shù)在它上面,50%的分?jǐn)?shù)在它下面。3.2.1中位數(shù)概念3.2

中位數(shù)(Md)1.原始數(shù)據(jù)計(jì)算方法將原始數(shù)據(jù)依大小順序排列后,如總頻數(shù)是奇數(shù),就以位于中央的數(shù)據(jù)作為Md.例:有以下7個(gè)數(shù)據(jù),依次從小到大排列:3、5、7、8、9、11、14因?yàn)閿?shù)據(jù)個(gè)數(shù)為奇數(shù),則位于中間的數(shù)值8就是中位數(shù)即:Md=83.2.2中位數(shù)計(jì)算方法2.頻數(shù)分布表計(jì)算法如總頻數(shù)為偶數(shù),則以最中間的的兩個(gè)數(shù)據(jù)的算術(shù)平均數(shù)為中位數(shù)例:有以下8個(gè)數(shù)據(jù),依次從小到大排列

6,9,10,11,12,14,13,17Md=計(jì)算公式:Md=Lmd+(n1)(由小向大計(jì)算)

在這里L(fēng)md表示中位數(shù)所在組的下限N表示總頻數(shù)n1表示小于中位數(shù)所在組下限的頻數(shù)總和i表示頻數(shù)分布表上的組距fmd表示中位數(shù)所在組的頻數(shù)○計(jì)算步驟:求確定中位數(shù)所在組由上往下(或由下往上)累積頻數(shù),直至略大于為止,該組就是中位數(shù)所在組。確定由中位數(shù)所在組取多少個(gè)頻數(shù),就能使由上往下(或下往上的積累頻數(shù)等于,即求n1,n1為小于中位數(shù)所在組下限的頻數(shù)總和)本例中

n1=-23=1計(jì)算中位數(shù)所在組所取頻數(shù)的距離即求(n1)fmd是中位數(shù)所在組的頻數(shù)i=組距本例:()×=0.71將以上求得的結(jié)果與中位數(shù)所在組的下限相加便是中位數(shù)Md=L+(n1)×(由上往下數(shù)的頻數(shù))=80+(-23)×=80.71另:Md=U-(-n2)×(由下往上數(shù)的頻數(shù))U表示中位數(shù)所在組的上限

n2表示大于中位數(shù)所在組上限的頻數(shù)總和本例Md=85-()×=85-=80.71注意:○由上往下計(jì)算Md時(shí),當(dāng)小于某一組下限的累積頻數(shù)正好等于總頻數(shù)的一半,那么,該組的下限是中位數(shù)。○由下往上計(jì)算Md時(shí),大于某一組上限的累積頻數(shù)正好等于那么,該組的上限就是中位數(shù)?!鹬形粩?shù)是百分位數(shù)中的特例。在同一數(shù)據(jù)中按次序位于某一百分位置的數(shù)值,百分位數(shù)一般用(Pp)表示。例:第70百分位數(shù),記作(P70),就是在依次從小到大排列的一組數(shù)據(jù)中小于

這個(gè)數(shù)值的有70%個(gè)頻數(shù),大于這個(gè)數(shù)值有30%個(gè)頻數(shù)的那個(gè)數(shù)值.中位數(shù)(Md)就是第50百分位數(shù),小于它有50%個(gè)頻數(shù),大于它也有50%個(gè)頻數(shù),它是百分位數(shù)中的特例.3.2.3.1百分位數(shù)概念3.2.3

百分位數(shù)(Pp)

在頻數(shù)分布表上可以用內(nèi)插法計(jì)算某個(gè)百分位數(shù),其計(jì)算公式為:Pp=Lp+(p*N-n)在這里:

Pp表示百分位數(shù)

p表示與百分位數(shù)相對應(yīng)的比數(shù)

N表示總頻數(shù)

Lp表示百分位數(shù)所在組的下限

n表示小于百分位數(shù)所在組下限的頻數(shù)總和

fp表示百分位數(shù)所在組的頻數(shù)。

i表示組距。3.2.3.2百分位數(shù)的計(jì)算方法表17:48個(gè)學(xué)生數(shù)學(xué)分?jǐn)?shù)百分位數(shù)計(jì)算表3.3.1眾數(shù)的概念是集中量的一種指標(biāo),用Mo表示,它有理論眾數(shù)和粗略眾數(shù)兩種。理論眾數(shù):是指與頻數(shù)分布曲線最高點(diǎn)相對應(yīng)的橫坐的一點(diǎn).粗略眾數(shù):是指一組數(shù)據(jù)中頻數(shù)出現(xiàn)最多的那個(gè)數(shù)。3.3.眾數(shù)(Mo)1、用觀察法直接尋找粗略眾數(shù)在一組原始數(shù)據(jù)中,頻數(shù)出現(xiàn)最多的那個(gè)數(shù)值就是眾數(shù)?!鹪谝唤M原始數(shù)據(jù)2、4、3、6、4、5、4其中頻數(shù)出現(xiàn)最多的數(shù)值是4,4就是這組數(shù)據(jù)的眾數(shù)?!鹪陬l數(shù)分布表中,頻數(shù)最多一組的組中值就是粗略眾數(shù)3.3.2眾數(shù)的計(jì)算方法2、用公式求理論眾數(shù)的近似值公式:

Mo3Md-2

返回3.4加權(quán)平均數(shù):在有些測量中所得數(shù)據(jù),其單位權(quán)重并不相等.這時(shí)若要計(jì)算平均數(shù),就不能用算術(shù)平均數(shù),而應(yīng)使用加權(quán)平均數(shù),其計(jì)算公式如下:公式中為權(quán)數(shù).所謂權(quán)數(shù),是指各變量在構(gòu)成總體中的相對重要性.例:某課題組在8個(gè)省區(qū)進(jìn)行一項(xiàng)調(diào)查,各省區(qū)的取樣人數(shù)和平均分?jǐn)?shù)見下表,求該項(xiàng)調(diào)查的總平均數(shù)。代碼人數(shù)平均分?jǐn)?shù)162798226860340082467096541180631465761096850088合計(jì)38006653.5幾何平均數(shù)幾何平均數(shù),記做Mg,計(jì)算的基本公式下:其中N為數(shù)據(jù)個(gè)數(shù),Xi為數(shù)據(jù)值◆直接應(yīng)用有一研究者想研究介于S與T二感覺之間的物理刺激是多少,他隨機(jī)選10名被試,讓其調(diào)節(jié)一下可變的物理刺激,使產(chǎn)生的感覺恰介于S與T間,然后測量所調(diào)節(jié)刺激的物理量。10名被試的結(jié)果為:5.7,6.2,6.7,6.9,7.5,8.0,7.6,10.0,15.6,18.0問這10個(gè)被試二感覺之間的那個(gè)感覺的物理刺激量的平均值是多少?應(yīng)用幾何平均數(shù)的變式計(jì)算屬于這種情況有:一組數(shù)據(jù)彼此間變異較大幾乎是按一定的比例變化。如教育經(jīng)費(fèi)的逐年增加數(shù),學(xué)習(xí),閱讀的進(jìn)步數(shù),以及學(xué)生人數(shù)的增長數(shù)等◆學(xué)習(xí)方面的進(jìn)步率

在一項(xiàng)有關(guān)閱讀能力的試驗(yàn)中得到這樣的結(jié)果.閱讀的遍數(shù)與每遍理解的程度依次是:第一遍為40%,第二遍為52%,第三遍為65%,第四遍為75%,第五遍為86%,第六遍為97%,在該實(shí)驗(yàn)研究中被試閱讀能力的平均進(jìn)步率是多少?閱讀能力的平均增加比率又是多少?某校連續(xù)四年的畢業(yè)人數(shù)為:980,1100,1200,1300人,問畢業(yè)生平均增長率是多少?若該校畢業(yè)生一直按此增長率變化,問再過五年后的畢業(yè)人數(shù)是多少?學(xué)生或人口增加率的估計(jì)◆教育經(jīng)費(fèi)增加率某校1950年的教育經(jīng)費(fèi)是10萬元,1982年的教育經(jīng)費(fèi)是121萬元,問該校教育經(jīng)費(fèi)年增長率是多少?若一直按此比例增加,請問1990年該校的教育經(jīng)費(fèi)是多少?◆3.6調(diào)和平均數(shù)調(diào)和平均數(shù)的計(jì)算:在計(jì)算中先將各個(gè)數(shù)據(jù)取倒數(shù)平均,然后再取倒數(shù)平均數(shù),故又稱倒數(shù)平均數(shù).計(jì)算公式是:

調(diào)和平均的應(yīng)用在一個(gè)學(xué)習(xí)實(shí)驗(yàn)中,請六名被試分別完成相同的10道作業(yè)題.這六名被試花費(fèi)的時(shí)間依次是0.8小時(shí),1.0小時(shí),1.2小時(shí),1.5小時(shí),2.5小時(shí),5.0小時(shí).計(jì)算這6名被試平均完成這10道作業(yè)題的速度.第四章差異量4.1差異量的概念4.2全距R4.3方差和標(biāo)準(zhǔn)差4.4差異系數(shù)1、概念表示一組數(shù)據(jù)變異程度或離散程度的量稱為差異量?,F(xiàn)有A、B、C三組測驗(yàn)成績?nèi)缦拢篈組:8、8、9、10、11、12、12(=10)B組:5、6、8、10、12、14、15(=10)C組:1、2、5、10、15、18、19(=10)4.1差異量的概念

差異量越大,表示數(shù)據(jù)分布的范圍越廣,越不整齊.差異量越小,表示數(shù)據(jù)分布越集中,變動范圍越小.常用的差異量指標(biāo)有全距、方差、標(biāo)準(zhǔn)差、差異系數(shù)等.2、特點(diǎn)3、種類1.概念:一組數(shù)據(jù)中最大值與最小值之差,又稱極差.用符號R表示.2.計(jì)算:(1)原始數(shù)據(jù)求全距(R)=最大值-最小值例:兩組學(xué)生某科測驗(yàn)分?jǐn)?shù)分別為:甲組:54、63、72、74、82、88、99、乙組:67、71、73、76、79、82、84、4.2全距

3.頻數(shù)分布表求全距:最大一組與最小一組組中值之差(或)最大一組與最小一組下限之差。表:小學(xué)兩年級80個(gè)學(xué)生身高的全距計(jì)算表身高(1)組中值(2)頻數(shù)(3)累積頻數(shù)(4)計(jì)算全距(5)115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.513810201912421141222426173777980R=143.5-116.5=27或者R=142-115=27總和804.全距的優(yōu)缺點(diǎn):優(yōu)點(diǎn):概念清楚,意義明確,計(jì)算簡便。缺點(diǎn):易受兩個(gè)極端的數(shù)值影響。4.3.1 方差:方差是指離差平方的算術(shù)平均數(shù)。樣本方差用

表示。

表示總體方差4.3.2計(jì)算公式=在這里:X-表示離差〔即每個(gè)數(shù)據(jù)與平均數(shù)的差數(shù)〕

表示離差平方和

N表示總頻數(shù)4.3方差和標(biāo)準(zhǔn)差4.3.3 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差就是離差平方和平均后的方根。樣本標(biāo)準(zhǔn)差用σx表示,總體標(biāo)準(zhǔn)差用σ表示4.3.4計(jì)算公式原始數(shù)據(jù)計(jì)算法:

實(shí)例:在某幼兒園大班中,隨機(jī)抽取21名幼兒,分成甲、乙、丙三組,每組7人,進(jìn)行看圖講述比賽,他們的成績分別為:甲組:9、9、10、11、12、13、13乙組:6、7、9、11、13、15、16丙組:2、3、6、11、16、19、20試求三組幼兒看圖講述成績的標(biāo)準(zhǔn)差三組幼兒成績的標(biāo)準(zhǔn)差。甲組:σx==1.6

乙組:σx

=3.6

丙組:σx

=7.0

解:三組幼兒成績的平均數(shù):

=11;=11;=11

離散程度(S)說明甲組111.6集中(小)數(shù)據(jù)都集中在附近代表性好乙組113.6(居中)一般丙組117.0最分散(大)各數(shù)據(jù)分布廣代表性較差2.頻數(shù)分布表計(jì)算法(用于數(shù)據(jù)較多的分組資料)

公式:

其中:x表示各組組中值f表示各組頻數(shù)

N表示總?cè)藬?shù)

48個(gè)學(xué)生數(shù)學(xué)分?jǐn)?shù)方差、標(biāo)準(zhǔn)差的組中值計(jì)算表57.5分組(1)組中值X(2)頻數(shù)f(3)fx(4)=(2)×(3)

(5)=(2)×(4)利用公式計(jì)算方差、標(biāo)準(zhǔn)差

50-52.5252.5×2

×2

=12.2555-57.5057.5×0

×060-62.5262.5×2

×265-67.5367.5×3

×370-72.5872.5×8

×875-77.5777.5×777.5×780-82.5782.5×7

×785-87.5787.5×7

×790-92.5592.5×5

×595-97.5697.5×6

×6總和483840.00314400f52.5=15062.567.572.582.587.592.597.5(1)優(yōu)點(diǎn):反映靈敏:隨任何一個(gè)數(shù)據(jù)的變化而變化計(jì)算簡單:適合代數(shù)計(jì)算嚴(yán)密確定:一組數(shù)據(jù)的方差以及標(biāo)準(zhǔn)差有確定的值(2)缺點(diǎn):不太容易理解;易受兩極端數(shù)值的影響;有個(gè)別數(shù)值糊涂不清時(shí),無法計(jì)算.4.3.5方差和標(biāo)準(zhǔn)差的應(yīng)用及其優(yōu)缺點(diǎn)例1.根據(jù)調(diào)查,得知1000名16歲男生身高平均為168.88公分。其標(biāo)準(zhǔn)差為6.52,體重平均為48.79公斤,其標(biāo)準(zhǔn)差為6.25,試比較身高與體重哪個(gè)差異大。例2.調(diào)查所得,8歲兒童身高平均為120.27公分。標(biāo)準(zhǔn)差為5,16歲兒童身高平均為168.88公分,標(biāo)準(zhǔn)差為6.52。試比較他們的身高的差異大小。

4.4差異系數(shù)(CV)

1.差異系數(shù)(VC)的概念差異系數(shù)是一種相對差異量數(shù),它是憑借著算術(shù)平均數(shù)來表示兩個(gè)或兩個(gè)以上標(biāo)準(zhǔn)差的相對差異。2.計(jì)算公式CV=×100%差異系數(shù)又稱為相對標(biāo)準(zhǔn)差,在算術(shù)平均數(shù)不為零的情況下:CV越大,表明離散程度越大(數(shù)據(jù)的分布愈分散)CV越小,表明離散程度越小(數(shù)據(jù)的分布愈集中)在這里:CV表示差異系數(shù)表示標(biāo)準(zhǔn)差表示算術(shù)平均數(shù)3.

用途(1) 比較不同單位(現(xiàn)象)的(變異)差異程度CV=×100%=0.0386×100%=3.86%CV×100%=12.81%可見:體重的差異大于身高。(2)比較不同水平的同類現(xiàn)象(單位)的差異程度CVCV可見:8歲組身高差異量雖比16歲組小,但從差異系數(shù)來看,8歲組比16歲組大些。課堂練習(xí):甲組小學(xué)生參加算術(shù)測驗(yàn),平均分?jǐn)?shù)為20.50,標(biāo)準(zhǔn)差為5.24;乙組小學(xué)生參加同樣的測驗(yàn),其平均分?jǐn)?shù)為34.80,標(biāo)準(zhǔn)差是9.62,試比較CV。(3)可判斷特殊差異情況根據(jù)經(jīng)驗(yàn),在教育統(tǒng)計(jì)學(xué)中,衡量學(xué)生德、智、體各方面發(fā)展情況的資料,一般差異系數(shù)(CV)值常在5%~35%間。若〉35%,可懷疑所求得的平均數(shù)是否計(jì)算有誤,若〈5%,可懷疑為S是否計(jì)算有誤.當(dāng)然也有特殊情況,例如3—6歲幼兒單腿立持續(xù)時(shí)間的差異系數(shù)。無論國內(nèi)外,都在64%以上,甚至越過100%4.注意事項(xiàng):(1) 測試尺度上的單位必須是等距的。若不等距,則CV的運(yùn)用無效。(2) 測試尺度的起點(diǎn)必須是絕對零點(diǎn)。

4.5標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)又稱基分?jǐn)?shù)或Z分?jǐn)?shù),是以標(biāo)準(zhǔn)差為一個(gè)原始分?jǐn)?shù)在團(tuán)體中所處位置的相對位置量數(shù).離平均數(shù)有多遠(yuǎn),即表示原始分?jǐn)?shù)在平均數(shù)以上或以下幾個(gè)標(biāo)準(zhǔn)差的位置,從而明確該分?jǐn)?shù)在團(tuán)體中的相對地位的量數(shù),計(jì)算公式為:

標(biāo)準(zhǔn)分?jǐn)?shù)的性質(zhì)1.Z分?jǐn)?shù)無實(shí)際單位,是以平均數(shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為單位的一個(gè)相對量.2.一組原始分?jǐn)?shù)轉(zhuǎn)換得到的Z分?jǐn)?shù)可正可負(fù).3.一組原始數(shù)據(jù)中,各個(gè)Z分?jǐn)?shù)的標(biāo)準(zhǔn)差為1.4.若原始分布呈正態(tài)分布,則轉(zhuǎn)換得到的所有Z分?jǐn)?shù)是均值為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布.標(biāo)準(zhǔn)分?jǐn)?shù)的優(yōu)點(diǎn)1.可比性.2.可加性.3.明確性.4.穩(wěn)定性.標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用Z分?jǐn)?shù)不僅能表明原始分?jǐn)?shù)在分布中的地位,而且能在不同分布的原始分?jǐn)?shù)之間進(jìn)行比較,同時(shí),還能用代數(shù)方法處理,因此,它被教育統(tǒng)計(jì)學(xué)家稱為多學(xué)科表示量數(shù),有著廣泛的用途.1.用于比較幾個(gè)分屬性質(zhì)不同的觀測值在各自數(shù)據(jù)分布中相對位置的高低.2.計(jì)算不同質(zhì)的觀測值的總和或平均值,以表示在團(tuán)體中的相對位置例:A,B兩個(gè)學(xué)生在三種考試中的分?jǐn)?shù)見下表,比較二人分?jǐn)?shù)是否有差別.考試170870902554575134254540

例2:下表是高等學(xué)校入學(xué)考試中兩名考生甲與乙的分?jǐn)?shù),試問據(jù)考試成績應(yīng)該優(yōu)先錄取哪名考生?數(shù)據(jù)表考試科目原始成績?nèi)w考生Z分?jǐn)?shù)甲乙平均分標(biāo)準(zhǔn)差甲乙語文858970101.51.9政治70626551-0.6外語6872698-0.1250.375數(shù)學(xué)53405060.5-1.67理化7287758-0.3751.5總和3483502.51.505

第五章相關(guān)關(guān)系5.1相關(guān)、相關(guān)關(guān)系與散點(diǎn)圖5.2積差關(guān)系5.3等級關(guān)系5.4質(zhì)與量關(guān)系5.5品質(zhì)相關(guān)5.1相關(guān)、相關(guān)關(guān)系與散點(diǎn)圖統(tǒng)計(jì)學(xué)中所講的相關(guān)是指具有相關(guān)關(guān)系的不同現(xiàn)象之間的關(guān)系程度,前提是事物之間的這種聯(lián)系又不能直接做出因果關(guān)系的解釋.相關(guān)有以下三種:1.兩列變量變動方向相同.我們稱之為正相關(guān).如身高與體重.2.兩列變量變動方向相反.我們稱之為正相關(guān).如初學(xué)打字,練習(xí)時(shí)間越長,錯(cuò)誤越少.3.兩列變量沒有關(guān)系,即零相關(guān).如身高與學(xué)業(yè)成就、相貌與人的行為等現(xiàn)象之間的關(guān)系,都屬于零相關(guān)即不相關(guān).相關(guān)關(guān)系的圖表判斷法例:我們給出5名學(xué)生四種測驗(yàn)的分?jǐn)?shù):學(xué)生測驗(yàn)分?jǐn)?shù)ABCD115536410221452651003135166104412506710351149681015.2積差相關(guān)積差相關(guān)是英國統(tǒng)計(jì)學(xué)家皮爾遜于20世紀(jì)初提出的一種計(jì)算相關(guān)的方法,因而被稱為皮爾遜積差相關(guān),簡稱為皮爾遜積差相關(guān).它是一種較為普遍的計(jì)算相關(guān)系數(shù)的方法,也是揭示兩個(gè)變量線性相關(guān)方向和程度最常用和最基本的方法.一般來說,用于計(jì)算積差相關(guān)系數(shù)的數(shù)據(jù)資料需滿足以下條件:

①要求成對的數(shù)據(jù);②兩列變量各自總體的分布都是正態(tài);③兩個(gè)相關(guān)的變量是連續(xù)變量,即數(shù)據(jù)都是觀測變量;④兩列變量間的關(guān)系應(yīng)是直線性的.計(jì)算積差相關(guān)系數(shù)的基本公式一.運(yùn)用標(biāo)準(zhǔn)差與離均差的計(jì)算公式二.運(yùn)用標(biāo)準(zhǔn)分?jǐn)?shù)計(jì)算相關(guān)系數(shù)的公式三.原始觀測值計(jì)算公式

現(xiàn)在我們介紹一個(gè)例題,分別用三種不同的公式.例:下表是10名中學(xué)生身高與體重的測量結(jié)果.問身高與體重的關(guān)系如何?數(shù)據(jù)表被試編號XYXY117050289002500850021734529929220257785316047256002209752041554424025193668205173502992925008650618853353442809996471785031684250089008183493348924018967918052324002704936010165452722520257425總和172548529852523609838915.3等級相關(guān)在心理與教育領(lǐng)域的研究中,有時(shí)收集到的數(shù)據(jù)不是等距或等比的測量數(shù)據(jù),而是具有等級順序的測量數(shù)據(jù).并且有時(shí)總體分布不是正態(tài),不滿足求積差相關(guān)的要求.于是為了解決兩列或兩列以上的變量的相關(guān),就要用等級相關(guān).我們主要介紹兩種等級相關(guān):①斯皮爾曼等級相關(guān);②肯德爾等級相關(guān);斯皮爾曼等級相關(guān)一適用資料積差相關(guān)是對兩個(gè)變量之間相關(guān)強(qiáng)度的標(biāo)準(zhǔn)測量指標(biāo),斯皮爾曼等級相關(guān)則是對皮爾遜相關(guān)系數(shù)的延伸.他是英國心理學(xué)家、統(tǒng)計(jì)學(xué)家斯皮爾曼根據(jù)積差相關(guān)的概念推導(dǎo)出來的,因而有人認(rèn)為斯皮爾曼等級相關(guān)是積差相關(guān)的一種特殊形式.因?yàn)樗鼘?shù)據(jù)總體分布不作要求,這是其優(yōu)點(diǎn)所在,另外,當(dāng)N<30時(shí),計(jì)算比較簡單,等級相關(guān)的缺點(diǎn)是能用積差相關(guān)計(jì)算的資料改成等級相關(guān)計(jì)算精確度要差一些.二計(jì)算公式1.等級差數(shù)法(N<30)2.等級序數(shù)法

斯皮爾曼等級相關(guān)的應(yīng)用例1:現(xiàn)有10人的視,聽兩種感覺道的反應(yīng)時(shí)(單位:毫秒),數(shù)據(jù)見下表.問視,聽反應(yīng)時(shí)是否具有一致性?(X為聽反應(yīng)時(shí),Y為視反應(yīng)時(shí))被試XYD117217975243521401622200431521535141654187189880064513918116-52566195220910-119072122101091190816418267-114291491784400161014617033009總和5555483613.有相同等級時(shí)計(jì)算等級相關(guān)的方法

例:下表示10名學(xué)生的數(shù)學(xué)和語文考試成績,問數(shù)學(xué)與語文成績是否相關(guān)?(X代表語文成績,Y代表數(shù)學(xué)成績)被試XYD159474.56-1.52.2523540101000359424.58-3.512.254575563.52.56.255504975246716311007625533.5-0.50.258474288009434298111068572200N=10肯德爾等級相關(guān)肯德爾等級相關(guān)方法有很多種.這里我們主要介紹適合多列等級變量資料的方法.1.肯德爾W系數(shù)

①適用資料

肯德爾W系數(shù),又稱肯德爾和諧系數(shù),是表示多列等級變量相關(guān)程度的一種方法,適用于兩列以上的等級變量.肯德爾和諧系數(shù)常用符號W表示.

計(jì)算此系數(shù),原始數(shù)據(jù)的獲得一般采用等級評定法,即讓K個(gè)被試對N件事物進(jìn)行等級評定,因此最小的等級序數(shù)為1,最大的為N,這類K列等級變量資料綜合起來求相關(guān),就用肯德爾W系數(shù).②基本公式及計(jì)算W值介于0與1之間,若K個(gè)評價(jià)者意見完全一致,則W=1;若他們的意見有一定的聯(lián)系,又不完全一致,則0<W<1;若其意見完全不一致,則W=0.

例:有10人對紅、橙、黃、綠、青、藍(lán)、紫七種顏色按其喜好程度進(jìn)行等級評價(jià).其中,最喜歡的等級為1,最不喜歡的等級為7,結(jié)果見下表.問這10人對顏色的愛好是否具有一致性?N=7評價(jià)者K=1012345678910紅3523443243331089橙6676757766633969黃5457664454502500綠111222211215225青4344335635401600藍(lán)223111132117289紫7765576577623844總和28013516解:從W值來看,這10個(gè)人對顏色的喜好具有較高的一致性,亦即他們所喜愛的顏色比較一致,喜好的順序可由的大小給出大致情況,其大者等級序數(shù)大,詩人對七種顏色有最喜歡到最不喜歡的順序是:綠、藍(lán)、紅、青、黃、紫、橙.③有相同等級出現(xiàn)時(shí)W的計(jì)算在進(jìn)行等級評定時(shí),常會遇到兩個(gè)或兩個(gè)以上的等級相同,如果遇到這種情況應(yīng)該采用下面的修正公式:

例:五位評分者對七篇作文進(jìn)行評價(jià),評價(jià)等級為1-5,評價(jià)結(jié)果見下表,問評分者之間對標(biāo)準(zhǔn)的掌握是否一致?N=7評價(jià)者K=512345A453.55421.5462.25B111.5216.542.25C2.521.52210.0100D6554525.0625E2.533.52314.0196F5576629.0841G7767734.01156合計(jì)1403422.5解:第六章抽樣分布及總體平均數(shù)的推斷6.1抽樣分布6.2總體平均數(shù)的估計(jì)6.3假設(shè)檢驗(yàn)的基本原理6.4總體平均數(shù)的顯著性檢驗(yàn)上海市初中一年級末數(shù)學(xué)水平的調(diào)查研究,在該研究中假定上海市共有初中一年級學(xué)生為150000人(N人),如果對上海所有初中一年級學(xué)生進(jìn)行統(tǒng)一的標(biāo)準(zhǔn)化的數(shù)學(xué)成績測驗(yàn),其測驗(yàn)的平均成績?yōu)?0分(μ),測驗(yàn)的標(biāo)準(zhǔn)差為9分(σ

)。實(shí)例16.1抽樣分布

6.1.1研究實(shí)例

實(shí)例2某一調(diào)查研究者甲為了節(jié)省調(diào)查研究的成本,現(xiàn)從上海市初中一年級學(xué)生中隨機(jī)抽取500人(n人)進(jìn)行統(tǒng)一的標(biāo)準(zhǔn)化的數(shù)學(xué)成就測驗(yàn),試圖通過這500人的測驗(yàn)結(jié)果來推斷全上海初中一年級學(xué)生的數(shù)學(xué)水平,其測驗(yàn)的平均成績?yōu)?2分(),測驗(yàn)的標(biāo)準(zhǔn)差為8分(σx

)。1、分析上述實(shí)例區(qū)分總體和樣本區(qū)分參數(shù)與統(tǒng)計(jì)量及不同的表達(dá)方式總體參數(shù)樣本統(tǒng)計(jì)量容量Nn平均數(shù)

μ標(biāo)準(zhǔn)差σσx如果我們用上海初一年級150000個(gè)學(xué)生的成績做圖,則構(gòu)成一個(gè)總體分布圖:概率密度或百分比成績?nèi)绻覀冎挥闷渲谐槿〉?00個(gè)學(xué)生的成績做圖,則構(gòu)成一個(gè)樣本分布圖:概率密度或百分比成績2、抽樣分析假定該研究者第一次抽取500人做完調(diào)查研究后,又重新從上海初中一年級學(xué)生中(150000人)抽取500人(n2)進(jìn)行調(diào)查研究,其平均數(shù)為:標(biāo)準(zhǔn)差為:σx2(抽取學(xué)生的過程中,前面抽到的學(xué)生在后面抽取中也可能抽到,但不重復(fù)測驗(yàn))。如果上述過程不斷重復(fù)操作,則可以得到更多的樣本平均數(shù)和標(biāo)準(zhǔn)差,如下表:抽樣次數(shù)樣本容量樣本平均數(shù)樣本標(biāo)準(zhǔn)差1500σx12500σx23500σx3…………i500σxi…………k500σxk…………∝500σx∝如果我們用k(k趨近于無窮大)個(gè)樣本平均數(shù)做頻數(shù)分布圖,則構(gòu)成一個(gè)由樣本平均數(shù)組成的抽樣分布(平均數(shù)抽樣分布)圖:概率密度或百分比抽樣的平均成績由這些抽樣的平均數(shù)構(gòu)成的平均數(shù)由這些抽樣平均數(shù)組成分布的標(biāo)準(zhǔn)差稱為平均數(shù)的標(biāo)準(zhǔn)誤用來表示。標(biāo)準(zhǔn)誤

:某種統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為該統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤。抽樣分布是某一種統(tǒng)計(jì)量的概率分布3、正態(tài)總體中,平均數(shù)的抽樣分布呈正態(tài)1、2、4、偏態(tài)總體中,當(dāng)抽樣容量較大時(shí),平均數(shù)的抽樣分布也呈正態(tài)6.1.2平均數(shù)抽樣分布的幾個(gè)定理

平均數(shù)為:標(biāo)準(zhǔn)差為:離差統(tǒng)計(jì)量是以標(biāo)準(zhǔn)差為單位來度量某一個(gè)個(gè)案值與平均數(shù)間的差異。Z分?jǐn)?shù)就是一種離差統(tǒng)計(jì)量6.1.3樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量的形態(tài)

當(dāng)總體標(biāo)準(zhǔn)差已知時(shí),平均數(shù)的離差統(tǒng)計(jì)量的計(jì)算:當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),平均數(shù)的離差統(tǒng)計(jì)量的計(jì)算:首先根據(jù)樣本標(biāo)準(zhǔn)差(σx)來估計(jì)總體標(biāo)準(zhǔn)差(σ),其估計(jì)值用S來表示。因此,平均數(shù)的標(biāo)準(zhǔn)差為:離差統(tǒng)計(jì)量的表達(dá)形式為:例:某校二年級學(xué)生的英語平均成績?yōu)?8,從中隨機(jī)抽取50人,其平均成績?yōu)?2,標(biāo)準(zhǔn)差為12()。試估計(jì)該校二年級學(xué)生英語成績的標(biāo)準(zhǔn)差,并計(jì)算50人平均成績的離差統(tǒng)計(jì)量。戈賽特(英國數(shù)學(xué)家1876-1937)戈塞特早先在牛津溫切斯特及新(New)學(xué)院學(xué)習(xí)數(shù)學(xué)和化學(xué),后來到都伯林市一家釀酒公司擔(dān)任釀造化學(xué)技師,從事統(tǒng)計(jì)和實(shí)驗(yàn)工作,1906—1907年間,在倫敦大學(xué)學(xué)院生物實(shí)驗(yàn)室做研究,也有機(jī)會和皮爾遜共同研討,此后他們經(jīng)常通信.1905年,戈塞特利用酒廠里大量的小樣本數(shù)據(jù)寫了第一篇論文《誤差法則在釀酒過程中的應(yīng)用》1908年,戈塞特以“學(xué)生(Student)”為筆名在《生物計(jì)量學(xué)》雜志發(fā)表了論文《平均數(shù)的規(guī)律誤差》.t分布及其特點(diǎn)自由度:df表示表6.1中央面積為0.95時(shí)不同自由度t的臨界值自由度2462030∞t值±4.30±2.78±2.45±2.09±2.04±1.96某一個(gè)正態(tài)總體,其平均數(shù)為130,標(biāo)準(zhǔn)差為10。(1)從總體中抽取25人,計(jì)算其平均成績,該平均成績在128到132間的概率有多大;(2)從總體中抽取25人,計(jì)算其平均成績,該平均成績以總體平均數(shù)為中心,95%概率下的分布范圍。若總體平均數(shù)未知,從總體中抽取25人,計(jì)算其平均成績?yōu)?29,按一定概率要求估計(jì)總體參數(shù)μ的變化范圍?!獏^(qū)間估計(jì)例2:例3某小學(xué)10歲兒童身高的標(biāo)準(zhǔn)差為6.25厘米,現(xiàn)從該校隨機(jī)抽出27名10歲兒童,其平均身高為134.2厘米,試估計(jì)該校10歲兒童身高的95%和99%置信區(qū)間.在總體標(biāo)準(zhǔn)差未知,總體呈正態(tài)分布,n無論大小,(或總體不呈正態(tài)分布,n>30)樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計(jì)量呈t分布;t值μ3、總體標(biāo)準(zhǔn)差(σ)未知條件下的區(qū)間估計(jì)

區(qū)間估計(jì)原理例1從某小學(xué)三年級學(xué)生中隨機(jī)抽取12名學(xué)生,其其閱讀能力平均分?jǐn)?shù)為29.917,s=4.100.試估計(jì)該校三年級學(xué)生總體平均成績95%和99%的置信區(qū)間。例2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論