現(xiàn)代心理及教學教育教學方案統(tǒng)計學復習資料練習總結資料_第1頁
現(xiàn)代心理及教學教育教學方案統(tǒng)計學復習資料練習總結資料_第2頁
現(xiàn)代心理及教學教育教學方案統(tǒng)計學復習資料練習總結資料_第3頁
免費預覽已結束,剩余26頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第一章心理與教育統(tǒng)計學基礎知識離散型數(shù)據(jù)連續(xù)型數(shù)據(jù)2、變量、隨機變量、觀測值變量是可以取不同值的量。 統(tǒng)計觀察的指標都是具有變異的指標。當我們用一個量表示這個指標的觀察結果時,這個指標是一個變量。用來表示隨機現(xiàn)象的變量,稱為 隨機變量。一般用大寫的X或Y表示隨機變量。隨機變量所取得的值,稱為 觀測值。一個隨機變量可以有許多個觀測值。3、總體、個體和樣本需要研究的同質對象的全體,稱為 總體。每一個具體研究對象,稱為一個 個體。從總體中抽出的用以推測總體的部分對象的集合稱為樣本。樣本中包含的個體數(shù),稱為樣本的容量n。一般把容量n 30的樣本稱為大樣本;而 n v 30的樣本稱為小樣本。4、統(tǒng)計量和

2、參數(shù)統(tǒng)計指標統(tǒng)計量參數(shù)平均數(shù)標準差S(T相關系數(shù)rP回歸系數(shù)b35、統(tǒng)計誤差誤差是測得值與真值之間的差值。測得值=真值+誤差統(tǒng)計誤差歸納起來可分為兩類:測量誤差與抽樣誤差。由于使用的儀器、 測量方法、讀數(shù)方法等問題造成的測得值與真值之間的誤差,稱為測量誤差。由于隨機抽樣造成的樣本統(tǒng)計量與總體參數(shù)間的差別,稱為抽樣誤差第二章統(tǒng)計圖表一、數(shù)據(jù)的整理在進行整理時,如果沒有充足的理由證明某數(shù)據(jù)是由實驗中的過失造成的,就不能輕易將其排除。對于個別極端數(shù)據(jù)是否該剔除,應遵循三個標準差 法則。二、次數(shù)分布表(一)簡單次(頻)數(shù)分布表(二)相對次數(shù)分布表將次數(shù)分布表中各組的實際次數(shù)轉化為相對次數(shù),即用頻數(shù)比率

3、(f / N)或百分比(丄100 %來表示次數(shù),就可以制成相對次數(shù)分布表N(三)累加次數(shù)分布表(四)雙列次數(shù)分布表雙列次數(shù)分布表又稱相關次數(shù)分布表,是對有聯(lián)系的兩列變量用同一個表表示其次數(shù)分布。所謂有聯(lián)系的兩列變量,一般是指同一組被試中每個被試兩種心理能力的分數(shù)或兩種心 理特點的指標,或同一組被試在兩種實驗條件下獲得的結果。三、次數(shù)分布圖使一組數(shù)據(jù)特征更加直觀和概括,而且還可以對數(shù)據(jù)的分布情況和變動趨勢作粗略的分 析。簡單次(頻)數(shù)分布圖直方圖、次數(shù)多邊形圖 累加次數(shù)分布圖一一累加直方圖、累加曲線(一)簡單次數(shù)分布圖 直方圖(二)簡單次數(shù)分布圖-次數(shù)多邊圖次數(shù)分布多邊形圖(freque ncy

4、 polygo n )是一種表示連續(xù)性隨機變量次數(shù)分布的線形 圖,屬于次數(shù)分布圖。凡是等距分組的可以用直方圖表示的數(shù)據(jù),都可用次數(shù)多邊圖來表示。繪制方法:以各分組區(qū)間的組中值為橫坐標,以各組的頻數(shù)為縱坐標,描點;將各點以 直線連接即構成多邊圖形。(三)累加次數(shù)分布圖一累加直方圖(四)累加次數(shù)分布圖一一累加曲線四、其他統(tǒng)計圖表條形圖:用直條的長短來表示統(tǒng)計項目數(shù)值大小 的圖形,主要是用來比較 性質相似的間 斷型資料。圓形圖:是用于表示 間斷型資料比例 的圖形。圓形的面積表示一組數(shù)據(jù)的整體,圓中扇形的面積表示各組成部分所占的比例。各部分的比例一般用百分比表示。線形圖用來表示 連續(xù)型資料。它能表示兩

5、個變量之間的函數(shù)關系; 一種事物隨另一種事 物變化的情況;某種事物隨時間推移的發(fā)展趨勢等。 基于線形圖,既可對有關統(tǒng)計變量進行 數(shù)量比較,又可分析發(fā)展的趨勢。散點圖是用相同大小圓點的 多少或梳密表示統(tǒng)計資料量大小以及變化趨勢的圖。第三章集中量數(shù) 集中量數(shù)用來表現(xiàn)數(shù)據(jù)資料的典型水平或集中趨勢( central tendency )。 常用的集中量包括算術平均數(shù)、加權平均數(shù)、中位數(shù)和眾數(shù)等等。一、算術平均數(shù)算術平均數(shù)(arithmetic average ) 一般簡稱為平均數(shù) (average )或均數(shù)、均值(mear)。 一般用M,或者用 x表示。算術平均數(shù)是最常用的集中量(一)算術平均數(shù)的計算

6、公式X1 X2XnXi(二)算術平均數(shù)的意義算術平均數(shù)是應用最普遍的一種 集中量。它是真值” (true score )的最佳估計值。 真值是反映某種現(xiàn)象的真實水平的分數(shù)。由于測量過程中的各種偶然因素的影響,真值往往很難得到。在實際測量中,往往采用“ 多次測量,取平均數(shù)”的方法,用平均數(shù)去估計真值。(三)算術平均數(shù)的優(yōu)缺點優(yōu)點:反應靈敏、有公式嚴密確定、簡明易懂、適合代數(shù)運算 缺點:容易受兩極端數(shù)值的影響;一組數(shù)據(jù)中有模糊不清的數(shù)值時無法計算。(四)計算和應用算術平均數(shù)的原則同質性原則:算術平均數(shù)只能用于表示同類數(shù)據(jù)的集中趨勢。平均數(shù)與個體數(shù)值相結合的原則:在解釋個體特征時,既要看平均數(shù),也要

7、結合個體的 數(shù)據(jù)。平均數(shù)與標準差、方差相結合原則:描述一組數(shù)據(jù)時既要分析其集中趨勢,也要分析離散程度。二、中位數(shù)中位數(shù)(median)又稱為中數(shù),是按順序排列的一組數(shù)據(jù)中位于中間位置的數(shù)。中位數(shù) 是常用集中量的一種。一般用Md或Mdn表示(一)中位數(shù)的計算方法 1原始數(shù)據(jù)計算法一組數(shù)據(jù)中無重復數(shù)值的情況XnXn首先將一組數(shù)據(jù)按順序排列n 1若n為奇數(shù),則Md為第-個數(shù);若n為偶數(shù),則Md2、次數(shù)分布表計算法2niMd Lbfb2fMd公式中:Lb為中位數(shù)所在組的精確下限fb為中位數(shù)所在組下限以下的累積頻數(shù)n為數(shù)據(jù)總和fMd為中位數(shù)所在組的頻數(shù)i為組距(二)中位數(shù)的特點及應用中位數(shù)是根據(jù)全部數(shù)據(jù)

8、的個數(shù)來確定其位置的,意義簡明,對按順序排列的數(shù)據(jù)來講,計算中位數(shù)也比較容易。中位數(shù)不受兩端極端數(shù)據(jù)的影響,但反應不靈敏,也不適合進一步代數(shù)運算的要求。一般用于下列情況:1、一組數(shù)據(jù)中有極端數(shù)據(jù)時;2、一組數(shù)據(jù)中有個別數(shù)據(jù)不確切、不清楚時;3、資料屬于等級性質時。三. 眾數(shù)眾數(shù)(mode用Mo表示,有兩種定義:理論眾數(shù)是指與頻數(shù)分布曲線最高點相對應的橫坐標上的一點; 粗略眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個數(shù)。眾數(shù)也是一種集中量,也可用來表示一組數(shù)據(jù)的集中趨勢。 眾數(shù)的計算方法(觀察法尋找粗略眾數(shù))未分組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)即為眾數(shù)。次數(shù)分布表中,頻數(shù)最多那一組數(shù)據(jù)的組中值,即為眾數(shù)。四、算術

9、平均數(shù)、中位數(shù)、眾數(shù)三者的關系在正態(tài)分布中:XMdMo在止偏態(tài)分布中:XMdMo在負偏態(tài)分布中:XMdMo五、其它集中量數(shù)(一)加權平均數(shù)加權平均數(shù)是不同比重數(shù)據(jù)(或平均數(shù))的平均數(shù),一般用種:XwWi XiX wm xWi(二)幾何平均數(shù)n次方根,用Mg或應表示。計幾何平均數(shù)(geometric mean)是n個數(shù)值連乘積的 算公式為:Mgx7xXn當數(shù)據(jù)的分布呈偏態(tài)時,可用幾何平均數(shù)表示該組數(shù)據(jù)的集中趨勢。幾何平均數(shù)的變式lx2 X3Mgn123X1 X2XnXn1兩邊取對數(shù),得1ig MgigXnn 1igX1注意:幾何平均數(shù)計算的是平均的變化情況,如果要計算平均增長率, 需要從幾何平均

10、數(shù)中減去基數(shù)1。幾何平均數(shù)的應用:1. 直接應用基本公式計算幾何平均數(shù).(例有少數(shù)極端數(shù)據(jù),數(shù)據(jù)呈偏態(tài)分布;心理物理學中的等距與等比量表實驗中3-8P72 )2. 應用幾何平均數(shù)的變式計算按一定比例變化的一列數(shù)據(jù),一般用來求平均變化率如平均增長率例3-93-103-11P73(三)調和平均數(shù)調和平均數(shù)(harmonic mean),用符號MH表示.也叫倒數(shù)平均數(shù).公式為:mh 調和平均數(shù)的應用學習速度方面的問題調和平均數(shù)在描述速度方面的集中趨勢時,優(yōu)于其他集中量在有關研究學習速度的實驗設計中,反應指標一般常取兩種形式;1、 工作量固定,記錄各被試完成相同工作所用的時間例3-133-14P762

11、、 學習時間一定,記錄一定時間內各被試完成的工作量,例3-15第四章差異量數(shù)描述數(shù)據(jù)離散程度的統(tǒng)計量稱為差異量。差異量越大,表明數(shù)據(jù)越分散、不集中;差異量越小,表明數(shù)據(jù)越集中,變動范圍越小。一組數(shù)據(jù)的離散程度,常常通過數(shù)據(jù)的離中趨勢特點進行分析。一、全距、四分位距和百分位距(一)全距 R ( range)全距是一組數(shù)據(jù)中的最大值( maximum)與該組數(shù)據(jù)中最小值(minimum)之差,又稱極 差。R= Xmax Xmin(二)百分位差(百分位距) 百分位差是指兩個百分位數(shù)(perce ntile )之差。常用的百分位距有兩種:用幾個百分位距能較好地反映一組數(shù)據(jù)的差異程度。 對于任何一組觀察

12、值,只要任意指定一個位置,就可以求出這個位置的數(shù)應該是多少;-百分位數(shù)相反,如果給出一個數(shù),也可以求出它應該在哪個位置.-百分等級它表明在分布中低于該分,計算公式為QQ3Qi2百分位數(shù)-頻數(shù)分布中相對于某個特定百分點的原始分數(shù), 數(shù)的個案占總頻數(shù)的百分比。百分等級分數(shù)-頻數(shù)分布中低于特定原始分數(shù)的頻數(shù)百分比。(三)四分位距四分位距是第一個四分位數(shù)與第三個四分位數(shù)之差的一半(四)平均差平均差(average deviation 或者mean deviation )是指一組數(shù)據(jù)中,每一個數(shù)據(jù)與 該組數(shù)據(jù)的平均數(shù)離差的絕對值的算術平均數(shù),通常用AD或MD表示。原始數(shù)據(jù)計算公式AD(五)方差和標準差方

13、差(又稱為變異數(shù)、均方)。是表示一組數(shù)據(jù)離散程度的統(tǒng)計指標。一般樣本的方差 用S2表示,總體的方差用2表示。標準差(standard deviation)是方差的算術平方根。一般樣本的標準差用S表示,總體的標準差用表示。標準差和方差是描述數(shù)據(jù)離散程度的最常用的差異量。1、樣本方差及標準差定義公式S2、總體方差及標準差的定義公式是總體b的無偏估計3、原始數(shù)據(jù)的方差與標準差計算S2X2 4、總標準差的合成方差具有 可加性的特點。當已知幾個小組數(shù)據(jù)的方差或標準差時,可以計算幾個小組聯(lián)合在一起的總的方差或標準差。需要注意的是,只有在應用同一種觀測手段, 據(jù)時,才能計算合成方差或標準差。計算公式測量的是

14、同一種特質, 只是樣本不同的數(shù)2ni Xt Xini Si2StSi2ni公式中:S2為總方差,St為總標準差Si為各小組標準差ni為各小組數(shù)據(jù)個數(shù)diXTX;5、方差和標準差的性質方差是對一組數(shù)據(jù)中各種變異的總和的測量,具有可加性和可分解性特點。標準差是一組數(shù)據(jù)方差的算術平方根,它不可以進行代數(shù)計算,但有以下特性: 如果YX C則SySx如果YC X貝ySyC Sx6、方差和標準差的意義方差與標準差是表示一組數(shù)據(jù)離散程度的最好指標,是統(tǒng)計分析中最常用的差異量。標準差具備一個良好的差異量應具備的條件,如:反應靈敏,有公式嚴密確定,簡明易 懂,適合代數(shù)運算等等。應用方差和標準差表示一組數(shù)據(jù)的離散

15、程度,須注意必須是同一類數(shù)據(jù)(即同一種測量工具的測量結果),而且被比較樣本的水平比較接近。7、標準差的應用/ 差異系數(shù)差異系數(shù)(coefficient of variation )是指標準差與其算術平均數(shù)的百分比,它是沒 有單位的相對數(shù)。常以CV表示,其計算公式為:CV = 100%X差異系數(shù)的作用:比較不同單位資料的差異程度比較單位相同而平均數(shù)相差較大的兩組資料的差異程度 可判斷特殊差異情況8、標準差的應用一一標準分數(shù)又稱基分數(shù)或Z分數(shù),是以標準差為單位表示一個原始分數(shù)在團體中所處位置的相對位 置量數(shù)。離平均數(shù)有多遠,即表示原始分數(shù)在平均數(shù)以上或以下幾個標準差的位置,從而明確該分數(shù)在團體中的

16、相對地位的量數(shù)。標準分數(shù)從分數(shù)對平均數(shù)的相對地位、該組分數(shù)的離中趨勢兩個方面來表示原始分數(shù)的地位。1 )標準分數(shù)的計算公式及其性質Z X Xs 沒有實際單位; 可正可負,可為零; 一組原始數(shù)據(jù)中,各個 Z分數(shù)的標準差為1 ; 正態(tài)分布的原始數(shù)據(jù),轉換得到的Z分數(shù)是標準的正態(tài)分布(0, 1)。(2)Z分數(shù)的作用Z分數(shù)可以表明原始分數(shù)在團體中的相對位置,因此稱為相對位置量數(shù)。把原始分數(shù)轉換成Z分數(shù),就把單位不等距的和缺乏明確參照點的分數(shù)轉換成以標準差 為單位、以平均數(shù)為參照點的分數(shù)。(3 )標準分數(shù)的優(yōu)點可比性:標準分數(shù)以團體的平均數(shù)為基準,以標準差為單位,因而具有可比性。 可加性:標準分數(shù)使不同

17、的原始分數(shù)具有相同的參照點,因而具有可加性。明確性:標準分數(shù)較原始分數(shù)的意義更為明確。合理性:標準分數(shù)保證了不同性質的分數(shù)在總分數(shù)中的權重相同,使分數(shù)更合理地 反映事實。第五章相關分析一、相關概述(一)相關的概念兩個變量之間不精確、不穩(wěn)定的變化關系,稱為相關關系。兩個變量之間的變化關系,既表現(xiàn)在變化方向上,又表現(xiàn)在密切程度上。兩個變量之間的變化方向有:正相關:兩個變量的變化方向相同。負相關:兩個變量的變化方向相反。零相關:兩個變量的變化方向無一定規(guī)律。從關系密切程度來看,兩個變量的變化程度可大致分為完全相關:兩個變量的變化程度完全一致。 強相關:兩個變量變化的一致性比較強。中等相關:兩個變量變

18、化的一致程度中等。 弱相關:兩個變量變化的一致性比較差。完全不相關:兩個變量變化程度沒有一致性。(二)相關系數(shù)用來描述兩個變量相互之間變化方向及密切程度的統(tǒng)計指標稱為相關系數(shù),一般樣本的相關系數(shù)用r表示,總體的相關系數(shù)用p表示。相關系數(shù)的取值:-1 r +10l r 1 1相關系數(shù)的符號:“ + ”表示正相關,“”表示負相關。相關系數(shù)的性質相關系數(shù)不是由相等單位度量而來的,因此只能比較大小,不能做任何加、減、乘、除 運算。二、積差相關(一) 積差相關及其適用條件積差相關是英國統(tǒng)計學家皮爾遜(pearson )于20世紀初提出的一種計算相關的方法,因而被稱為皮爾遜積差相關,也稱為積矩相關(pro

19、duct moment correlation)。積差相關適用于:1、兩個變量都是連續(xù)數(shù)據(jù);兩變量總體都為正態(tài)分布;兩變量之間為線性關系。2、成對數(shù)據(jù),樣本容量要大。積差相關條件的判斷方法:連續(xù)變量:根據(jù)得到數(shù)據(jù)的方式判斷,測量數(shù)據(jù)。正態(tài)分布:一般情況下,正常人群的身高、體重、智力水平、心理與教育測驗的結果, 都可按總體正態(tài)分布對待;如果要求比較高,則需要對數(shù)據(jù)進行正態(tài)性檢驗。線性關系:根據(jù)相關散布圖可判斷兩個變量之間是否線性關系。(二) 相關系數(shù)的等距轉換及其合并相關系數(shù)不是等距數(shù)據(jù), 更不是比率數(shù)據(jù),它只能比較相對大小, 不能進行加減乘除運 算。但我們常會遇到需要將取自同一總體的幾個樣本的

20、相關系數(shù)合成、求平均的相關系數(shù)這一問題。這時,可以先將相關系數(shù) r轉換成具有等距單位的 Zr值。三、斯皮爾曼等級相關等級相關(rank correlation )是指以等級次序排列或以等級次序表示的變量之間的相 關。主要包括斯皮爾曼( spearman)二列等級相關和肯德爾和諧系數(shù)(the kan dallcoefficie nt of con corda nee)多列等級相關。(一)斯皮爾曼等級相關的概念及適用條件斯皮爾曼等級相關是等級相關的一種。它適用于兩個以等級次序表示的變量,并不要求兩個變量總體呈正態(tài)分布,也不要求樣本的容量必須大于30。當連續(xù)數(shù)據(jù)不能滿足計算積差相關的條件時,可以轉換

21、成等級數(shù)據(jù)從而計算斯皮爾曼等級相關系數(shù)。四、肯德爾和諧系數(shù)肯德爾等級相關方法有許多種,肯德爾和諧系數(shù)是其中一種??系聽柡椭C系數(shù)常以rW表示,適用于多列等級變量的資料??系聽柡椭C系數(shù)可以反映多個等級變量變化的一致性。肯德爾U系數(shù)與W系數(shù)的適用資料相同。五、質與量的相關(一) 點二列相關適用條件一個變量為正態(tài)、連續(xù)變量,另一個變量為真正的二分名義變量,這兩個變量之間的相關,稱為點二歹U相關( poin t-biserial correlati on)。有時一個變量并非真正的二分變量,而是雙峰分布的變量,也可以用點二列相關來表示。多用于評價是非類測驗題目組成的測驗內部一致性。(二) 二列相關兩個變量

22、都是正態(tài)連續(xù)變量,其中一個變量被人為地劃分成二分變量,表示這兩個變量之間的相關,稱為二列相關(biserail correlati on )。將連續(xù)變量人為劃分為二分變量時,應注意盡量使分界點接近平均數(shù)。教育或心理測驗中問答題的區(qū)分度指標。六、品質相關兩個變量都是按性質劃分成幾種類別,表示這兩個變量之間的相關稱為品質相關。品質相關處理的一般是計數(shù)數(shù)據(jù)而不是連續(xù)數(shù)據(jù),變量劃分為不同的品質類別,主要用于雙向表或稱為列聯(lián)表(Rx C表)。品質相關的方法有多種,最常用的是四分相關、相關和列聯(lián)表相關。第六章概率分布1、概率的定義(一)基本概念概率(probability ):表明隨機事件可能性大小的客觀

23、指標。 概率的兩種定義:后驗概率和先驗概率。后驗概率(或統(tǒng)計概率)隨機事件的頻率:VV ( A )當n無限增大時,隨機事件 概率。先驗概率(古典概率)古典概率模型要求滿足兩個條件: 試驗的所有可能結果是有限的; 每一種可能結果出現(xiàn)的可能性相等。(二)概率的公理系統(tǒng)1. 任何隨機事件A的概率都是在00 時,PZs= 0.5 PZZV 0 時,PZs= 0.5 + PZ.求某一 Z值以下的概率Z0 時,P亠 Z= 0.5 + PZZV 0 時,P亠 Z= 0.5 PZ已知面積(概率)求 Z值.求Z=0以上或以下某一面積對應的Z值:直接查表.求與正態(tài)曲線上端或下端某一面積P相對應的Z值:先用0.5

24、PZ,再查表.求與正態(tài)曲線下中央部位某一面積相對應的Z值:先計算P/ 2,再查表已知概率P或 Z值,求概率密度 Y.直接查正態(tài)分布表就能得到相應的概率密度Y值。.如果由概率P求Y值, 要注意區(qū)分已知概率是位于正態(tài)曲線的中間部分,還是兩尾端部分,才能通過查表求得正確的概率密度。三、 概率分布二項分布(一)二項試驗與二項分布二項分布(bionimal distribution)是一種具有廣泛用途的離散型隨機變量的概率分布,它是由貝努里創(chuàng)始的,因此又稱為貝努里分布。1. 二項試驗滿足以下條件的試驗稱為二項試驗:一次試驗只有兩種可能的結果,即成功和失敗;共有n次試驗,并且n是預先給定的任一正整數(shù); 各

25、次試驗相互獨立,即各次試驗之間互不影響; 各次試驗中成功的概率相等,失敗的概率也相等。2. 二項分布函數(shù)二項分布是一種離散型隨機變量的概率分布。用n次方的二項展開式來表達在 n次二項試驗中成功事件出現(xiàn)的不同次數(shù)(X= 0,1)的概率分布,叫做二項分布函數(shù)。二項展開式的通式(即二項分布函數(shù)):b(x,n, p) C: pX qn X3、二項分布的平均數(shù)和標準差如果二項分布滿足 p q且nq 5 (或者p v q且np 5時,二項分布接近于正態(tài)分 布??捎孟旅娴姆椒ㄓ嬎愣椃植嫉钠骄鶖?shù)和標準差。二項分布的平均數(shù)為:np二項分布的標準差為:、npq4、二項分布的應用二項分布函數(shù)除了用來求成功事件恰好

26、出現(xiàn)X次的概率之外,在教育中主要用來判斷試驗結果的機遇性與真實性的界限。四、 概率分布樣本分布(一)、抽樣分布 區(qū)分三種不同性質的分布: 總體分布:總體內個體數(shù)值的頻數(shù)分布 樣本分布:樣本內個體數(shù)值的頻數(shù)分布 抽樣分布:某一種統(tǒng)計量的概率分布1. 抽樣分布的概念抽樣分布是從同一總體內抽取的不同樣本的統(tǒng)計量的概率分布。 抽樣分布是一個理論的概率分布,是統(tǒng)計推斷的依據(jù)。2. 平均數(shù)抽樣分布的幾個定理從總體中隨機抽出容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。.容量為n的平均數(shù)在抽樣分布上的標準差(即平均數(shù)的標準誤) 除以n的平方根。,等于總體標準差X 、n.從正態(tài)總體中,隨機抽取的容量

27、為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。.雖然總體不呈正態(tài)分布, 如果樣本容量較大, 反映總體卩和6的樣本平均數(shù)的抽樣 分布,也接近于正態(tài)分布。(二)標準誤某種統(tǒng)計量在抽樣分布上的標準差,稱為標準誤。標準誤用來衡量抽樣誤差。小,表明樣本統(tǒng)計量與總體參數(shù)的值越接近,樣本對總體越有代表性,體參數(shù)的可靠度越大。因此,標準誤是統(tǒng)計推斷可靠性的指標。平均數(shù)標準誤的計算1 .總體正態(tài),6已知(不管樣本容量大?。┢骄鶖?shù)的標準誤為:,或總體非正態(tài),(T已知,標準誤越用樣本統(tǒng)計量推斷總大樣本x 2.總體正態(tài),6未知(不管樣本容量大?。?平均數(shù)標準誤的估計值為:,或總體非正態(tài),S(T未知,大樣本(三)平均數(shù)離

28、差統(tǒng)計量的分布1 總體正態(tài),6已知(不管樣本容量大?。?平均數(shù)離差的的抽樣分布呈正態(tài)分布,或總體非正態(tài),(T已知,大樣本Z X_正態(tài)總體,樣本平均數(shù)的抽樣分布X2/Xn2.總體正態(tài),6未知(不管樣本容量大?。?平均數(shù)離差的的抽樣分布呈 t分布,或總體非正態(tài),(T未知,大樣本.t分布的特點形狀與正態(tài)分布曲線相似t分布曲線隨自由度不同而有一簇曲線自由度的計算:自由度是指能夠獨立變化的數(shù)據(jù)個數(shù)。 查t分布表時,需根據(jù)自由度及相應的顯著性水平,并要注意是單側數(shù)據(jù)還是雙側。3.總體6未知,大樣本時的近似處理樣本容量增大后,平均數(shù)的抽樣分布接近于正態(tài)分布,可用正態(tài)分布近似處理:第七章參數(shù)估計一、點估計、區(qū)

29、間估計與標準誤(一)總體參數(shù)估計的基本原理根據(jù)樣本統(tǒng)計量對相應總體參數(shù)所作的估計叫作總體參數(shù)估計??傮w參數(shù)估計分為點估計和區(qū)間估計。由樣本的標準差估計總體的標準差即為點估計;而由樣本的平均數(shù)估計總體平均數(shù) 的取值范圍則為區(qū)間估計。(二)點估計1良好的點估計量應具備的條件無偏性如果一切可能個樣本統(tǒng)計量的值與總體參數(shù)值偏差的平均值為0,這種統(tǒng)計量就是總體參數(shù)的無偏估計量。有效性 當總體參數(shù)不止有一種無偏估計量時,某一種估計量的一切可能樣本值的方差小者為有效性高,方差大者為有效性低。一致性當樣本容量無限增大時, 估計量的值能越來越接近它所估計的總體參數(shù)值,這種估計是總體參數(shù)一致性估計量。充分性一個容

30、量為n的樣本統(tǒng)計量,應能充分地反映全部 n個數(shù)據(jù)所反映的總體的信息。2、點估計量的缺點有偏差沒有提供正確估計的概率,即不能提供估計值與參數(shù)真值的接近程度和可靠程度(三)區(qū)間估計區(qū)間估計可以解決這個問題。區(qū)間估計得出的不是一個單一數(shù)值,而是一個數(shù)值區(qū)間。 它既可以告訴我們參數(shù)的真值在什么范圍內,又能告訴我們參數(shù)的真值落在這個范圍的概率有多大。區(qū)間估計的基礎一一抽樣分布根據(jù)抽樣分布的特點及原理,不同總體條件下,可能會有不同的抽樣分布,則可得 到不同條件下總體參數(shù)的區(qū)間估計的計算方法。區(qū)間估計涉及和置信區(qū)間和顯著性水平。1區(qū)間估計以樣本統(tǒng)計量的抽樣分布(概率分布)為理論依據(jù),按一定概率的要求,由樣本

31、統(tǒng)計量 的值估計總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計。對總體參數(shù)值進行區(qū)間估計,就是要在一定可靠度上求出總體參數(shù)的置信區(qū)間的上下 限。要知道與所要估計的參數(shù)相對應的樣本統(tǒng)計量的值,以及樣本統(tǒng)計量的理論分布;要求出該種統(tǒng)計量的標準誤;要確定在多大的可靠度上對總體參數(shù)作估計,再通過某種理論概率分布表,找出 與某種可靠度相對應的該分布橫軸上記分的臨界值,才能計算出總體參數(shù)的置信區(qū) 間的上下限。置信區(qū)間置信度,即置信概率,是作出某種推斷時正確的可能性(概率)。置信區(qū)間,也稱置信間距(con fide nee in terval,CI)是指在某一置信度時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度。置信區(qū)

32、間是帶有置信概率的取值區(qū)間。顯著性水平對總體平均數(shù)進行區(qū)間估計時,置信概率表示做出正確推斷的可能性,但這種估計還是會有犯錯誤的可能。顯著性水平(sig nificance level)就是指估計總體參數(shù)落在某一區(qū)間時,可能犯錯誤的概率,用符號a表示。P=1 - a2、平均數(shù)區(qū)間估計的基本原理通過樣本的平均數(shù)估計總體的平均數(shù),首先假定該樣本是隨機取自一個正態(tài)分布的母總體(或非正態(tài)總體中的n 30的樣本),而計算出來的實際平均數(shù)是無數(shù)容量為n的樣本平均數(shù)中的一個。根據(jù)樣本平均數(shù)的分布理論,可以對總體平均數(shù)進行估計,并以概率說明其正確的可能性。三、總體平均數(shù)的估計(一)總體平均數(shù)的區(qū)間估計1總體平均

33、數(shù)區(qū)間估計的基本步驟 根據(jù)樣本的數(shù)據(jù),計算樣本的平均數(shù)和標準差; 計算平均數(shù)抽樣分布的標準誤; 確定置信概率或顯著性水平; 根據(jù)樣本平均數(shù)的抽樣分布確定查何種統(tǒng)計表; 計算置信區(qū)間; 解釋總體平均數(shù)的置信區(qū)間。2平均數(shù)區(qū)間估計的計算 總體正態(tài),6已知(不管樣本容量大?。蚩傮w非正態(tài),6已知,大樣本樣本平均數(shù)的分布呈正態(tài),平均數(shù)的置信區(qū)間為:X Zn6未知,大樣本分布近似處理: 總體正態(tài),6未知(不管樣本容量大?。蚩傮w非正態(tài),樣本平均數(shù)的分布為t分布,平均數(shù)的置信區(qū)間為:t df2. n 1 總體正態(tài),6未知,大樣本平均數(shù)的抽樣分布接近于正態(tài)分布,用正態(tài)分布代替X Z_2S- nI小樣本總

34、體非正態(tài),不能進行參數(shù)估計,即不能根據(jù)樣本分布對總體平均數(shù)進行估計。第八章假設檢驗一、假設檢驗的原理(一)、假設檢驗的基本原理利用樣本信息,根據(jù)一定概率,對總體參數(shù)或分布的某一假設作出拒絕或保留的決斷, 稱為假設檢驗。1假設假設檢驗一般有兩互相對立的假設。H0:零假設,或稱原假設、虛無假設(null hypothesis)、解消假設;是要檢驗的對象之間沒有差異的假設。H1:備擇假設(alternative hypothesis ),或稱研究假設、對立假設;是與零假設 相對立的假設,即存在差異的假設。進行假設檢驗時,一般是從零假設出發(fā),以樣本與總體無差異的條件計算統(tǒng)計量的值, 并分析計算結果在抽

35、樣分布上的概率,根據(jù)相應的概率判斷應接受零假設、拒絕研究假設還是拒絕零假設、接受研究假設。2、小概率事件樣本統(tǒng)計量的值在其抽樣分布上出現(xiàn)的概率小于或等于事先規(guī)定的水平,這時就認為小概率事件發(fā)生了。把出現(xiàn)概率很小的隨機事件稱為小概率事件。當概率足夠小時,可以作為從實際可能性上,把零假設加以否定的理由。因為根據(jù)這個 原理認為:在隨機抽樣的條件下,一次實驗竟然抽到與總體參數(shù)值有這么大差異的樣本,可能性是極小的,實際中是罕見的,幾乎是不可能的。3、顯著性水平統(tǒng)計學中把拒絕零假設的概率稱為顯著性水平,用a表示。 顯著性水平也是進行統(tǒng)計推斷時,可能犯錯誤的概率。常用的顯著性水平有兩個:a=0.05 和 a

36、 = 0.01 o4 假設檢驗中的兩類錯誤及其控制對于總體參數(shù)的假設檢驗,有可能犯兩種類型的錯誤,即a錯誤和B錯誤。假設檢驗中的兩類錯誤TO為真H0為假拒絕H0a錯誤正確接受H0正確B錯誤兩類錯誤實際情況H0正確H0錯誤研究結論拒絕H0I型錯誤正確接受H0正確n型錯誤結論(1) 兩類錯誤既有聯(lián)系又有區(qū)別錯誤只在否定H0時發(fā)生錯誤只在接受H0時發(fā)生 錯誤增加錯誤減小錯誤增加錯誤減小(2) n ,2可使兩類錯誤的概率都減小 為了將兩種錯誤同時控制在相對最小的程度,研究者往往通過選擇適當?shù)娘@著性水 平而對a錯誤進行控制,如a= 0.05或= 0.01 o對B錯誤,則一方面使樣本容量增大,另一方面采用

37、合理的檢驗形式(即單側檢驗 或雙側檢驗)來使B誤差得到控制。在確定檢驗形式時, 凡是檢驗是否與假設的總體一致的假設檢驗,a被分散在概率分布曲線的兩端,因此稱為雙側檢驗。雙側檢驗的假設形式為:HO:a=a 0,H1 :卩工卩0凡是檢驗大于或小于某一特定條件的假設檢驗,a是在概率分布曲線的一端,因此稱為單側檢驗。單側檢驗的假設形式為:H0 :卩卩 0, H1:aa 05 假設檢驗的基本步驟一個完整的假設檢驗過程,一般經(jīng)過四個主要步驟:.提出假設.選擇檢驗統(tǒng)計量并計算統(tǒng)計量的值.確定顯著性水平.做出統(tǒng)計結論二、平均數(shù)的顯著性檢驗(一)總體平均數(shù)的顯著性檢驗總體平均數(shù)的顯著性檢驗是指對樣本平均數(shù)與總體

38、平均數(shù)之間的差異進行的顯著性檢 驗。若檢驗的結果差異顯著,可以認為該樣本不是來自當前的總體,而來自另一個、與當前 總體存在顯著差異的總體。即,該樣本與當前的總體不一致。1. 總體平均數(shù)顯著性檢驗的原理檢驗的思路是:假定研究樣本是從平均數(shù)為的總體隨機抽取的,而目標總體的平均數(shù)為卩0,檢驗卩與卩0之間是否存在差異。如果差異顯著,可以認為研究樣本的總體不是平 均數(shù)為卩0的總體,也就是說,研究樣本不是來自平均數(shù)為卩0的總體。2. 總體平均數(shù)顯著性檢驗的步驟一個完整的假設檢驗過程,一般經(jīng)過四個主要步驟:.提出假設.選擇檢驗統(tǒng)計量并計算統(tǒng)計量的值.確定顯著性水平.做出統(tǒng)計結論 .提出假設雙側檢驗的假設形式

39、為: H0:a=a 0, H1 :卩工卩 0單側檢驗的假設形式為: H0:aa 0, H1:卩卩0 (右側檢驗) .選擇檢驗統(tǒng)計量并計算結果直接應用原始數(shù)據(jù)檢驗假設是有困難的,必須借助于根據(jù)樣本構造出來的統(tǒng)計量,而且針對不同的條件,需要選擇不同的檢驗統(tǒng)計量。.確定顯著性水平在假設檢驗中有可能會犯錯誤。如果零假設是正確的, 卻把它當成錯誤的加以拒絕, 就會犯a錯誤。a表示做出統(tǒng)計結論時犯錯誤的概率,稱為顯著性水平。顯著性水平一般為 0.05和0.01 o.做出統(tǒng)計結論根據(jù)已確定的顯著性水平,查統(tǒng)計量的分布表,找到該顯著性水平時統(tǒng)計量的臨界值, 并以計算得到的統(tǒng)計量值與查表得到的臨界值比較,根據(jù)統(tǒng)

40、計決斷規(guī)則做出拒絕或接受零假設的決定。3. 平均數(shù)顯著性檢驗的幾種情形 .總體為正態(tài),總體標準差b已知平均數(shù)的抽樣分布服從正態(tài)分布,以Z為檢驗統(tǒng)計量,其計算公式為:Z X 0 X 0Xn例1:某小學歷屆畢業(yè)生漢語拼音測驗平均分數(shù)為66分,標準差為11.7?,F(xiàn)以同樣的試題測驗應屆畢業(yè)生 (假定應屆與歷屆畢業(yè)生條件基本相同),并從中隨機抽18份試卷,算得平均分為69分,問該校應屆與歷屆畢業(yè)生漢語拼音測驗成績是否一樣?解:H0:a=a 0, H1 :卩工卩 0學生漢語拼音成績可以假定是從正態(tài)總體中抽出的隨機樣本。總體標準差已知,樣本統(tǒng)計量的抽樣分布服從正態(tài),以Z為檢驗統(tǒng)計量1.0969 6611.7

41、18顯著性水平為a =0.05,雙側檢驗查表得Za =1.96,而計算得到的 Z=1.09|Z| VZa,則概率 P 0.05差異不顯著,應在0.05顯著性水平接受零假設結論:該校應屆畢業(yè)生與歷屆畢業(yè)生漢語拼音測驗成績一致,沒有顯著差異。 雙側Z檢驗統(tǒng)計決斷規(guī)則I ZI與臨界值比較P值I Z IV 1.96P 0.051.96 WI Z I V 2.58 0.05 P 0.01I Z I 2.58P 0.05不顯著1.65 W I Z I V 2.33 0.05 P 0.01顯著*檢驗結果I Z I 2.33PW 0.01極其顯著*.總體為正態(tài),總體標準差c未知,樣本容量小于 30平均數(shù)的抽樣

42、分布服從 t分布,以t為檢驗統(tǒng)計量,計算公式為:df n 1X 0 S-Jn 1例3:某區(qū)初三英語統(tǒng)一測驗平均分數(shù)為65,該區(qū)某校20份試卷的平均分數(shù)為 69.8 ,標準差為9.234。問該校初三年級英語平均分數(shù)與全區(qū)是否一樣?.總體標準差c未知,樣本容量大于30平均數(shù)的抽樣分布服從 t分布,但由于樣本容量較大, 平均數(shù)的抽樣分布接近于正態(tài)分布,因此可以用 Z代替t近似處理,計算公式為:.總體非正態(tài),小樣本不能對總體平均數(shù)進行顯著性檢驗。三、平均數(shù)差異的顯著性檢驗平均數(shù)差異顯著性檢驗的統(tǒng)計量及計算公式(一)兩總體正態(tài),兩總體方差已知總體方差已知條件下, 平均數(shù)之差的抽樣分布服從正態(tài)分布,以z作

43、為檢驗統(tǒng)計量, 計 算公式為:Xi X21.兩樣本獨立SEd文Xii2X22nin22兩樣本相關Xi X222122 r 12兩樣本相關的判斷:兩個樣本的數(shù)據(jù)之間存在著對應的關系時,稱兩樣本為相關樣本。常見的情形主要包括三種:一是同一組被試在前后兩次在同一類測驗上的結果;二是同一組被試分別接受兩種不同實驗的測驗結果;三是按條件相同的原則選擇的配對實驗結果。例1:某幼兒園在兒童入園時對 49名兒童進行了比奈智力測驗 (c =16),結果平均智商 為106。一年后再對同組被試施測,結果平均智商分數(shù)為110。已知兩次測驗結果的相關系數(shù)為r=0.74 ,問能否說隨著年齡的增長和一年的教育,兒童智商有了

44、顯著提高?解:HO:卩 1J 2 H1:卩 1 卩 2正常兒童的智力測驗結果,可以認為是從正態(tài)總體中隨機抽出的樣本??傮w標準差已知,而同一組被試前后兩次的測驗成績,屬于相關樣本。因此平均數(shù)之差的抽樣分布服從正態(tài)分布,應選用Z作檢驗統(tǒng)計量,并選擇相關樣本、總體標準差已知的計算公式。X1X2106 110162 162 2 0.74 16 162-34”49提示1=6 2= 16顯著性水平為a =0.05單側檢驗時Z 0.05=1.65 ,Z 0.01=2.33而計算得到的Z =1.71 *Z 0.05 V |Z| VZ 0.0 1,則概率 0.05 P 0.01差異顯著,應在0.05顯著性水平接

45、受零假設結論:可以說隨著年齡的增長和一年的教育,兒童智商有了顯著提高。(二)兩總體正態(tài),兩總體方差未知總體方差未知條件下, 平均數(shù)之差的抽樣分布服從 t分布,以t作為檢驗統(tǒng)計量,計算公式為: t X1 X2SEd_X1 兩樣本獨立,兩總體方差一致X1X2n1 S1n1n2S;n22n1 n2n1 n2dfn1n2 2方差齊性檢驗方差齊性檢驗是對兩總體方差是否齊性(即是否一致或是否存在顯著性差異)進行的檢驗。方差齊性檢驗的統(tǒng)計量是F,其概率分布遵循F分布。若從方差相同的兩個正態(tài)總體中,隨機抽取兩個獨立樣本,相應總體方差的估計值,這兩個總體方差的估計值的比值稱為122實際應用中,常需以樣本方差估計

46、總體方差,因此公式為當兩樣本容量相差不大時,上式可簡化為S以此為基礎,分別求出兩個F比值,其計算公式為F “S2 / 門11gS: / n21S;2、兩樣本獨立,兩總體方差不齊性對于方差不齊性的獨立樣本,平均數(shù)差異的顯著性可能由兩方面的原因造成:一是兩平均數(shù)確實存在顯著差異;二是兩總體方差之間存在顯著差異。當兩總體的方差之間差異顯著時,運用一般的t檢驗不準確,需要進行特別的檢驗??傮w方差不齊性的兩個獨立樣本平均數(shù)之差的標準誤,可用兩個樣本方差分別估計出的兩個平均數(shù)標準誤平方之和再開方來表示。這時樣本平均數(shù)之差與相應總體平均數(shù)之差的離差統(tǒng)計量,既不是Z分布,也不是t分布,而是與t分布相近似的t

47、分布。這種檢驗方法被稱為柯克蘭一柯克斯t檢驗(Cochran-Cox),其統(tǒng)計量的計算公式為X 1X 2S12S 22卜n 11n 21t臨界值的計算公式t SEX1 t df1SEX2 t df2df 1 n11SE: SE223 總體方差未知,獨立樣本和相關樣本(三)兩總體非正態(tài),n1和n2大于30 (或50)總體標準差未知條件下,平均數(shù)之差的抽樣分布服從t分布,接近于正態(tài)分布,可以以Z近似處理,因此以Z作為檢驗統(tǒng)計量,df 2 n 21但樣本容量較大,t分布計算公式為:兩樣本相關X1 X2SEDX.兩樣本獨立X1 X222 2 r12 1 2nX1 X2s2 S;2 r S1 S2X1

48、X22212X1 X2,n1n2(四)總體非正態(tài),小樣本不能對平均數(shù)差異進行顯著性檢驗。第九章方差分析一、方差分析的基本原理及步驟(一)方差分析的基本原理及步驟 1方差分析的基本概念方差:又叫均方,是標準差的平方,是表示變異的量方差分析通過對多組平均數(shù)的差異進行顯著性檢驗, 總變異影響的大小。2、方差分析的基本原理方差分析又稱為變異分析(an alysis of varia neeWaddel Snedecor )提出的一種方法。方差分析通過對多組平均數(shù)的差異進行顯著性檢驗, 總變異影響的大小。3、方差分析的邏輯分析實驗數(shù)據(jù)中不同來源的變異對,ANOVA,是由斯內德克(George分析實驗數(shù)據(jù)中不同來源的變異對方差分析作為一種統(tǒng)計方法,是把實驗數(shù)據(jù)的總變異分解為若干個不同來源的分量。因而它所依據(jù)的基本原理是變異的可加性。在統(tǒng)計分析中,一般用方差來描述變量的變異性。方差分析是將總平

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論