




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
..心理與教育統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)1、數(shù)據(jù)類型稱名數(shù)據(jù)計(jì)數(shù)數(shù)據(jù)離散型數(shù)據(jù)順序數(shù)據(jù)等距數(shù)據(jù)測(cè)量數(shù)據(jù)連續(xù)型數(shù)據(jù)比率數(shù)據(jù)2、變量、隨機(jī)變量、觀測(cè)值變量是可以取不同值的量。統(tǒng)計(jì)觀察的指標(biāo)都是具有變異的指標(biāo)。當(dāng)我們用一個(gè)量表示這個(gè)指標(biāo)的觀察結(jié)果時(shí),這個(gè)指標(biāo)是一個(gè)變量。用來表示隨機(jī)現(xiàn)象的變量,稱為隨機(jī)變量。一般用大寫的X或Y表示隨機(jī)變量。隨機(jī)變量所取得的值,稱為觀測(cè)值。一個(gè)隨機(jī)變量可以有許多個(gè)觀測(cè)值。3、總體、個(gè)體和樣本需要研究的同質(zhì)對(duì)象的全體,稱為總體。每一個(gè)具體研究對(duì)象,稱為一個(gè)個(gè)體。從總體中抽出的用以推測(cè)總體的部分對(duì)象的集合稱為樣本。樣本中包含的個(gè)體數(shù),稱為樣本的容量n。一般把容量n≥30的樣本稱為大樣本;而n<30的樣本稱為小樣本。4、統(tǒng)計(jì)量和參數(shù)統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)量參數(shù)平均數(shù)
μ標(biāo)準(zhǔn)差Sσ相關(guān)系數(shù)rρ回歸系數(shù)bβ5、統(tǒng)計(jì)誤差誤差是測(cè)得值與真值之間的差值。測(cè)得值=真值+誤差統(tǒng)計(jì)誤差歸納起來可分為兩類:測(cè)量誤差與抽樣誤差。由于使用的儀器、測(cè)量方法、讀數(shù)方法等問題造成的測(cè)得值與真值之間的誤差,稱為測(cè)量誤差。由于隨機(jī)抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)間的差別,稱為抽樣誤差第二章統(tǒng)計(jì)圖表一、數(shù)據(jù)的整理在進(jìn)行整理時(shí),如果沒有充足的理由證明某數(shù)據(jù)是由實(shí)驗(yàn)中的過失造成的,就不能輕易將其排除。對(duì)于個(gè)別極端數(shù)據(jù)是否該剔除,應(yīng)遵循三個(gè)標(biāo)準(zhǔn)差法則。次數(shù)分布表〔一簡單次〔頻數(shù)分布表〔二相對(duì)次數(shù)分布表將次數(shù)分布表中各組的實(shí)際次數(shù)轉(zhuǎn)化為相對(duì)次數(shù),即用頻數(shù)比率〔f/N或百分比〔來表示次數(shù),就可以制成相對(duì)次數(shù)分布表〔三累加次數(shù)分布表〔四雙列次數(shù)分布表雙列次數(shù)分布表又稱相關(guān)次數(shù)分布表,是對(duì)有聯(lián)系的兩列變量用同一個(gè)表表示其次數(shù)分布。所謂有聯(lián)系的兩列變量,一般是指同一組被試中每個(gè)被試兩種心理能力的分?jǐn)?shù)或兩種心理特點(diǎn)的指標(biāo),或同一組被試在兩種實(shí)驗(yàn)條件下獲得的結(jié)果。三、次數(shù)分布圖使一組數(shù)據(jù)特征更加直觀和概括,而且還可以對(duì)數(shù)據(jù)的分布情況和變動(dòng)趨勢(shì)作粗略的分析。簡單次〔頻數(shù)分布圖——直方圖、次數(shù)多邊形圖累加次數(shù)分布圖——累加直方圖、累加曲線〔一簡單次數(shù)分布圖--直方圖〔二簡單次數(shù)分布圖-次數(shù)多邊圖次數(shù)分布多邊形圖〔frequencypolygon是一種表示連續(xù)性隨機(jī)變量次數(shù)分布的線形圖,屬于次數(shù)分布圖。凡是等距分組的可以用直方圖表示的數(shù)據(jù),都可用次數(shù)多邊圖來表示。繪制方法:以各分組區(qū)間的組中值為橫坐標(biāo),以各組的頻數(shù)為縱坐標(biāo),描點(diǎn);將各點(diǎn)以直線連接即構(gòu)成多邊圖形?!踩奂哟螖?shù)分布圖—累加直方圖〔四累加次數(shù)分布圖——累加曲線四、其他統(tǒng)計(jì)圖表?xiàng)l形圖:用直條的長短來表示統(tǒng)計(jì)項(xiàng)目數(shù)值大小的圖形,主要是用來比較性質(zhì)相似的間斷型資料。圓形圖:是用于表示間斷型資料比例的圖形。圓形的面積表示一組數(shù)據(jù)的整體,圓中扇形的面積表示各組成部分所占的比例。各部分的比例一般用百分比表示。線形圖用來表示連續(xù)型資料。它能表示兩個(gè)變量之間的函數(shù)關(guān)系;一種事物隨另一種事物變化的情況;某種事物隨時(shí)間推移的發(fā)展趨勢(shì)等?;诰€形圖,既可對(duì)有關(guān)統(tǒng)計(jì)變量進(jìn)行數(shù)量比較,又可分析發(fā)展的趨勢(shì)。散點(diǎn)圖是用相同大小圓點(diǎn)的多少或梳密表示統(tǒng)計(jì)資料量大小以及變化趨勢(shì)的圖。第三章集中量數(shù)集中量數(shù)用來表現(xiàn)數(shù)據(jù)資料的典型水平或集中趨勢(shì)〔centraltendency。常用的集中量包括算術(shù)平均數(shù)、加權(quán)平均數(shù)、中位數(shù)和眾數(shù)等等。一、算術(shù)平均數(shù)算術(shù)平均數(shù)〔arithmeticaverage一般簡稱為平均數(shù)〔average或均數(shù)、均值〔mean。一般用M,或者用表示。算術(shù)平均數(shù)是最常用的集中量〔一算術(shù)平均數(shù)的計(jì)算公式〔二算術(shù)平均數(shù)的意義算術(shù)平均數(shù)是應(yīng)用最普遍的一種集中量。它是"真值"〔truescore的最佳估計(jì)值。真值是反映某種現(xiàn)象的真實(shí)水平的分?jǐn)?shù)。由于測(cè)量過程中的各種偶然因素的影響,真值往往很難得到。在實(shí)際測(cè)量中,往往采用"多次測(cè)量,取平均數(shù)"的方法,用平均數(shù)去估計(jì)真值?!踩阈g(shù)平均數(shù)的優(yōu)缺點(diǎn)優(yōu)點(diǎn):反應(yīng)靈敏、有公式嚴(yán)密確定、簡明易懂、適合代數(shù)運(yùn)算缺點(diǎn):容易受兩極端數(shù)值的影響;一組數(shù)據(jù)中有模糊不清的數(shù)值時(shí)無法計(jì)算?!菜挠?jì)算和應(yīng)用算術(shù)平均數(shù)的原則同質(zhì)性原則:算術(shù)平均數(shù)只能用于表示同類數(shù)據(jù)的集中趨勢(shì)。平均數(shù)與個(gè)體數(shù)值相結(jié)合的原則:在解釋個(gè)體特征時(shí),既要看平均數(shù),也要結(jié)合個(gè)體的數(shù)據(jù)。平均數(shù)與標(biāo)準(zhǔn)差、方差相結(jié)合原則:描述一組數(shù)據(jù)時(shí)既要分析其集中趨勢(shì),也要分析離散程度。二、中位數(shù)中位數(shù)〔median又稱為中數(shù),是按順序排列的一組數(shù)據(jù)中位于中間位置的數(shù)。中位數(shù)是常用集中量的一種。一般用Md或Mdn表示〔一中位數(shù)的計(jì)算方法1、原始數(shù)據(jù)計(jì)算法一組數(shù)據(jù)中無重復(fù)數(shù)值的情況首先將一組數(shù)據(jù)按順序排列;2、次數(shù)分布表計(jì)算法公式中:Lb為中位數(shù)所在組的精確下限fb為中位數(shù)所在組下限以下的累積頻數(shù)n為數(shù)據(jù)總和fMd為中位數(shù)所在組的頻數(shù)i為組距〔二中位數(shù)的特點(diǎn)及應(yīng)用中位數(shù)是根據(jù)全部數(shù)據(jù)的個(gè)數(shù)來確定其位置的,意義簡明,對(duì)按順序排列的數(shù)據(jù)來講,計(jì)算中位數(shù)也比較容易。中位數(shù)不受兩端極端數(shù)據(jù)的影響,但反應(yīng)不靈敏,也不適合進(jìn)一步代數(shù)運(yùn)算的要求。一般用于下列情況:1、一組數(shù)據(jù)中有極端數(shù)據(jù)時(shí);2、一組數(shù)據(jù)中有個(gè)別數(shù)據(jù)不確切、不清楚時(shí);3、資料屬于等級(jí)性質(zhì)時(shí)。三.眾數(shù)眾數(shù)〔mode用Mo表示,有兩種定義:理論眾數(shù)是指與頻數(shù)分布曲線最高點(diǎn)相對(duì)應(yīng)的橫坐標(biāo)上的一點(diǎn);粗略眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)數(shù)。眾數(shù)也是一種集中量,也可用來表示一組數(shù)據(jù)的集中趨勢(shì)。眾數(shù)的計(jì)算方法〔觀察法尋找粗略眾數(shù)未分組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)即為眾數(shù)。次數(shù)分布表中,頻數(shù)最多那一組數(shù)據(jù)的組中值,即為眾數(shù)。四、算術(shù)平均數(shù)、中位數(shù)、眾數(shù)三者的關(guān)系在正態(tài)分布中:在正偏態(tài)分布中:在負(fù)偏態(tài)分布中:五、其它集中量數(shù)〔一加權(quán)平均數(shù)加權(quán)平均數(shù)是不同比重?cái)?shù)據(jù)〔或平均數(shù)的平均數(shù),一般用表示。其計(jì)算公式有兩種:〔二幾何平均數(shù)幾何平均數(shù)〔geometricmean是n個(gè)數(shù)值連乘積的n次方根,用或表示。計(jì)算公式為:當(dāng)數(shù)據(jù)的分布呈偏態(tài)時(shí),可用幾何平均數(shù)表示該組數(shù)據(jù)的集中趨勢(shì)。幾何平均數(shù)的變式兩邊取對(duì)數(shù),得注意:幾何平均數(shù)計(jì)算的是平均的變化情況,如果要計(jì)算平均增長率,需要從幾何平均數(shù)中減去基數(shù)1。幾何平均數(shù)的應(yīng)用:1.直接應(yīng)用基本公式計(jì)算幾何平均數(shù)有少數(shù)極端數(shù)據(jù),數(shù)據(jù)呈偏態(tài)分布;心理物理學(xué)中的等距與等比量表實(shí)驗(yàn)中.〔例[3-8]P722.應(yīng)用幾何平均數(shù)的變式計(jì)算按一定比例變化的一列數(shù)據(jù),一般用來求平均變化率如平均增長率.例[3-9][3-10][3-11]P73〔三調(diào)和平均數(shù)調(diào)和平均數(shù)<harmonicmean>,用符號(hào)MH表示.也叫倒數(shù)平均數(shù).公式為:調(diào)和平均數(shù)的應(yīng)用學(xué)習(xí)速度方面的問題.調(diào)和平均數(shù)在描述速度方面的集中趨勢(shì)時(shí),優(yōu)于其他集中量在有關(guān)研究學(xué)習(xí)速度的實(shí)驗(yàn)設(shè)計(jì)中,反應(yīng)指標(biāo)一般常取兩種形式;1、工作量固定,記錄各被試完成相同工作所用的時(shí)間.例[3-13][3-14]P762、學(xué)習(xí)時(shí)間一定,記錄一定時(shí)間內(nèi)各被試完成的工作量,例[3-15]第四章差異量數(shù)描述數(shù)據(jù)離散程度的統(tǒng)計(jì)量稱為差異量。差異量越大,表明數(shù)據(jù)越分散、不集中;差異量越小,表明數(shù)據(jù)越集中,變動(dòng)范圍越小。一組數(shù)據(jù)的離散程度,常常通過數(shù)據(jù)的離中趨勢(shì)特點(diǎn)進(jìn)行分析。一、全距、四分位距和百分位距〔一全距R〔range全距是一組數(shù)據(jù)中的最大值〔maximum與該組數(shù)據(jù)中最小值〔minimum之差,又稱極差。R=Xmax-Xmin〔二百分位差〔百分位距百分位差是指兩個(gè)百分位數(shù)〔percentile之差。常用的百分位距有兩種:用幾個(gè)百分位距能較好地反映一組數(shù)據(jù)的差異程度。對(duì)于任何一組觀察值,只要任意指定一個(gè)位置,就可以求出這個(gè)位置的數(shù)應(yīng)該是多少;----百分位數(shù)相反,如果給出一個(gè)數(shù),也可以求出它應(yīng)該在哪個(gè)位置.---百分等級(jí)百分位數(shù)--頻數(shù)分布中相對(duì)于某個(gè)特定百分點(diǎn)的原始分?jǐn)?shù),它表明在分布中低于該分?jǐn)?shù)的個(gè)案占總頻數(shù)的百分比。百分等級(jí)分?jǐn)?shù)--頻數(shù)分布中低于特定原始分?jǐn)?shù)的頻數(shù)百分比?!踩姆治痪嗨姆治痪嗍堑谝粋€(gè)四分位數(shù)與第三個(gè)四分位數(shù)之差的一半,計(jì)算公式為〔四平均差平均差〔averagedeviation或者meandeviation是指一組數(shù)據(jù)中,每一個(gè)數(shù)據(jù)與該組數(shù)據(jù)的平均數(shù)離差的絕對(duì)值的算術(shù)平均數(shù),通常用AD或MD表示。原始數(shù)據(jù)計(jì)算公式〔五方差和標(biāo)準(zhǔn)差方差〔又稱為變異數(shù)、均方。是表示一組數(shù)據(jù)離散程度的統(tǒng)計(jì)指標(biāo)。一般樣本的方差用表示,總體的方差用表示。標(biāo)準(zhǔn)差〔standarddeviation是方差的算術(shù)平方根。一般樣本的標(biāo)準(zhǔn)差用S表示,總體的標(biāo)準(zhǔn)差用表示。標(biāo)準(zhǔn)差和方差是描述數(shù)據(jù)離散程度的最常用的差異量。1、樣本方差及標(biāo)準(zhǔn)差定義公式2、總體方差及標(biāo)準(zhǔn)差的定義公式是總體σ的無偏估計(jì)3、原始數(shù)據(jù)的方差與標(biāo)準(zhǔn)差計(jì)算4、總標(biāo)準(zhǔn)差的合成方差具有可加性的特點(diǎn)。當(dāng)已知幾個(gè)小組數(shù)據(jù)的方差或標(biāo)準(zhǔn)差時(shí),可以計(jì)算幾個(gè)小組聯(lián)合在一起的總的方差或標(biāo)準(zhǔn)差。需要注意的是,只有在應(yīng)用同一種觀測(cè)手段,測(cè)量的是同一種特質(zhì),只是樣本不同的數(shù)據(jù)時(shí),才能計(jì)算合成方差或標(biāo)準(zhǔn)差。計(jì)算公式公式中:為總方差,為總標(biāo)準(zhǔn)差Si為各小組標(biāo)準(zhǔn)差ni為各小組數(shù)據(jù)個(gè)數(shù)5、方差和標(biāo)準(zhǔn)差的性質(zhì)方差是對(duì)一組數(shù)據(jù)中各種變異的總和的測(cè)量,具有可加性和可分解性特點(diǎn)。標(biāo)準(zhǔn)差是一組數(shù)據(jù)方差的算術(shù)平方根,它不可以進(jìn)行代數(shù)計(jì)算,但有以下特性:如果則如果則6、方差和標(biāo)準(zhǔn)差的意義方差與標(biāo)準(zhǔn)差是表示一組數(shù)據(jù)離散程度的最好指標(biāo),是統(tǒng)計(jì)分析中最常用的差異量。標(biāo)準(zhǔn)差具備一個(gè)良好的差異量應(yīng)具備的條件,如:反應(yīng)靈敏,有公式嚴(yán)密確定,簡明易懂,適合代數(shù)運(yùn)算等等。應(yīng)用方差和標(biāo)準(zhǔn)差表示一組數(shù)據(jù)的離散程度,須注意必須是同一類數(shù)據(jù)〔即同一種測(cè)量工具的測(cè)量結(jié)果,而且被比較樣本的水平比較接近。7、標(biāo)準(zhǔn)差的應(yīng)用/——差異系數(shù)差異系數(shù)〔coefficientofvariation是指標(biāo)準(zhǔn)差與其算術(shù)平均數(shù)的百分比,它是沒有單位的相對(duì)數(shù)。常以CV表示,其計(jì)算公式為:差異系數(shù)的作用:比較不同單位資料的差異程度比較單位相同而平均數(shù)相差較大的兩組資料的差異程度可判斷特殊差異情況8、標(biāo)準(zhǔn)差的應(yīng)用——標(biāo)準(zhǔn)分?jǐn)?shù)又稱基分?jǐn)?shù)或Z分?jǐn)?shù),是以標(biāo)準(zhǔn)差為單位表示一個(gè)原始分?jǐn)?shù)在團(tuán)體中所處位置的相對(duì)位置量數(shù)。離平均數(shù)有多遠(yuǎn),即表示原始分?jǐn)?shù)在平均數(shù)以上或以下幾個(gè)標(biāo)準(zhǔn)差的位置,從而明確該分?jǐn)?shù)在團(tuán)體中的相對(duì)地位的量數(shù)。標(biāo)準(zhǔn)分?jǐn)?shù)從分?jǐn)?shù)對(duì)平均數(shù)的相對(duì)地位、該組分?jǐn)?shù)的離中趨勢(shì)兩個(gè)方面來表示原始分?jǐn)?shù)的地位。〔1標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算公式及其性質(zhì)①?zèng)]有實(shí)際單位;②可正可負(fù),可為零;③一組原始數(shù)據(jù)中,各個(gè)Z分?jǐn)?shù)的標(biāo)準(zhǔn)差為1;④正態(tài)分布的原始數(shù)據(jù),轉(zhuǎn)換得到的Z分?jǐn)?shù)是標(biāo)準(zhǔn)的正態(tài)分布〔0,1?!?Z分?jǐn)?shù)的作用Z分?jǐn)?shù)可以表明原始分?jǐn)?shù)在團(tuán)體中的相對(duì)位置,因此稱為相對(duì)位置量數(shù)。把原始分?jǐn)?shù)轉(zhuǎn)換成Z分?jǐn)?shù),就把單位不等距的和缺乏明確參照點(diǎn)的分?jǐn)?shù)轉(zhuǎn)換成以標(biāo)準(zhǔn)差為單位、以平均數(shù)為參照點(diǎn)的分?jǐn)?shù)?!?標(biāo)準(zhǔn)分?jǐn)?shù)的優(yōu)點(diǎn)可比性:標(biāo)準(zhǔn)分?jǐn)?shù)以團(tuán)體的平均數(shù)為基準(zhǔn),以標(biāo)準(zhǔn)差為單位,因而具有可比性??杉有裕簶?biāo)準(zhǔn)分?jǐn)?shù)使不同的原始分?jǐn)?shù)具有相同的參照點(diǎn),因而具有可加性。明確性:標(biāo)準(zhǔn)分?jǐn)?shù)較原始分?jǐn)?shù)的意義更為明確。合理性:標(biāo)準(zhǔn)分?jǐn)?shù)保證了不同性質(zhì)的分?jǐn)?shù)在總分?jǐn)?shù)中的權(quán)重相同,使分?jǐn)?shù)更合理地反映事實(shí)。第五章相關(guān)分析一、相關(guān)概述〔一相關(guān)的概念兩個(gè)變量之間不精確、不穩(wěn)定的變化關(guān)系,稱為相關(guān)關(guān)系。兩個(gè)變量之間的變化關(guān)系,既表現(xiàn)在變化方向上,又表現(xiàn)在密切程度上。兩個(gè)變量之間的變化方向有:正相關(guān):兩個(gè)變量的變化方向相同。負(fù)相關(guān):兩個(gè)變量的變化方向相反。零相關(guān):兩個(gè)變量的變化方向無一定規(guī)律。從關(guān)系密切程度來看,兩個(gè)變量的變化程度可大致分為完全相關(guān):兩個(gè)變量的變化程度完全一致。強(qiáng)相關(guān):兩個(gè)變量變化的一致性比較強(qiáng)。中等相關(guān):兩個(gè)變量變化的一致程度中等。弱相關(guān):兩個(gè)變量變化的一致性比較差。完全不相關(guān):兩個(gè)變量變化程度沒有一致性?!捕嚓P(guān)系數(shù)用來描述兩個(gè)變量相互之間變化方向及密切程度的統(tǒng)計(jì)指標(biāo)稱為相關(guān)系數(shù),一般樣本的相關(guān)系數(shù)用r表示,總體的相關(guān)系數(shù)用ρ表示。相關(guān)系數(shù)的取值:-1≤r≤+10≤∣r∣≤1相關(guān)系數(shù)的符號(hào):"+"表示正相關(guān),"-"表示負(fù)相關(guān)。相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)不是由相等單位度量而來的,因此只能比較大小,不能做任何加、減、乘、除運(yùn)算。二、積差相關(guān)〔一積差相關(guān)及其適用條件積差相關(guān)是英國統(tǒng)計(jì)學(xué)家皮爾遜〔pearson于20世紀(jì)初提出的一種計(jì)算相關(guān)的方法,因而被稱為皮爾遜積差相關(guān),也稱為積矩相關(guān)〔productmomentcorrelation。積差相關(guān)適用于:1、兩個(gè)變量都是連續(xù)數(shù)據(jù);兩變量總體都為正態(tài)分布;兩變量之間為線性關(guān)系。2、成對(duì)數(shù)據(jù),樣本容量要大。積差相關(guān)條件的判斷方法:連續(xù)變量:根據(jù)得到數(shù)據(jù)的方式判斷,測(cè)量數(shù)據(jù)。正態(tài)分布:一般情況下,正常人群的身高、體重、智力水平、心理與教育測(cè)驗(yàn)的結(jié)果,都可按總體正態(tài)分布對(duì)待;如果要求比較高,則需要對(duì)數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)。線性關(guān)系:根據(jù)相關(guān)散布圖可判斷兩個(gè)變量之間是否線性關(guān)系?!捕嚓P(guān)系數(shù)的等距轉(zhuǎn)換及其合并相關(guān)系數(shù)不是等距數(shù)據(jù),更不是比率數(shù)據(jù),它只能比較相對(duì)大小,不能進(jìn)行加減乘除運(yùn)算。但我們常會(huì)遇到需要將取自同一總體的幾個(gè)樣本的相關(guān)系數(shù)合成、求平均的相關(guān)系數(shù)這一問題。這時(shí),可以先將相關(guān)系數(shù)r轉(zhuǎn)換成具有等距單位的Zr值。三、斯皮爾曼等級(jí)相關(guān)等級(jí)相關(guān)〔rankcorrelation是指以等級(jí)次序排列或以等級(jí)次序表示的變量之間的相關(guān)。主要包括斯皮爾曼〔spearman二列等級(jí)相關(guān)和肯德爾和諧系數(shù)〔thekandallcoefficientofconcordance多列等級(jí)相關(guān)?!惨凰蛊柭燃?jí)相關(guān)的概念及適用條件斯皮爾曼等級(jí)相關(guān)是等級(jí)相關(guān)的一種。它適用于兩個(gè)以等級(jí)次序表示的變量,并不要求兩個(gè)變量總體呈正態(tài)分布,也不要求樣本的容量必須大于30。當(dāng)連續(xù)數(shù)據(jù)不能滿足計(jì)算積差相關(guān)的條件時(shí),可以轉(zhuǎn)換成等級(jí)數(shù)據(jù)從而計(jì)算斯皮爾曼等級(jí)相關(guān)系數(shù)。四、肯德爾和諧系數(shù)肯德爾等級(jí)相關(guān)方法有許多種,肯德爾和諧系數(shù)是其中一種。肯德爾和諧系數(shù)常以rW表示,適用于多列等級(jí)變量的資料??系聽柡椭C系數(shù)可以反映多個(gè)等級(jí)變量變化的一致性??系聽朥系數(shù)與W系數(shù)的適用資料相同。五、質(zhì)與量的相關(guān)〔一點(diǎn)二列相關(guān)適用條件一個(gè)變量為正態(tài)、連續(xù)變量,另一個(gè)變量為真正的二分名義變量,這兩個(gè)變量之間的相關(guān),稱為點(diǎn)二列相關(guān)〔point-biserialcorrelation。有時(shí)一個(gè)變量并非真正的二分變量,而是雙峰分布的變量,也可以用點(diǎn)二列相關(guān)來表示。多用于評(píng)價(jià)是非類測(cè)驗(yàn)題目組成的測(cè)驗(yàn)內(nèi)部一致性。〔二二列相關(guān)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)變量被人為地劃分成二分變量,表示這兩個(gè)變量之間的相關(guān),稱為二列相關(guān)〔biserailcorrelation。將連續(xù)變量人為劃分為二分變量時(shí),應(yīng)注意盡量使分界點(diǎn)接近平均數(shù)。教育或心理測(cè)驗(yàn)中問答題的區(qū)分度指標(biāo)。六、品質(zhì)相關(guān)兩個(gè)變量都是按性質(zhì)劃分成幾種類別,表示這兩個(gè)變量之間的相關(guān)稱為品質(zhì)相關(guān)。品質(zhì)相關(guān)處理的一般是計(jì)數(shù)數(shù)據(jù)而不是連續(xù)數(shù)據(jù),變量劃分為不同的品質(zhì)類別,主要用于雙向表或稱為列聯(lián)表〔R×C表。品質(zhì)相關(guān)的方法有多種,最常用的是四分相關(guān)、Φ相關(guān)和列聯(lián)表相關(guān)。第六章概率分布一、概率的定義〔一基本概念概率〔probability:表明隨機(jī)事件可能性大小的客觀指標(biāo)。概率的兩種定義:后驗(yàn)概率和先驗(yàn)概率。后驗(yàn)概率〔或統(tǒng)計(jì)概率隨機(jī)事件的頻率:當(dāng)n無限增大時(shí),隨機(jī)事件A的頻率會(huì)穩(wěn)定在一個(gè)常數(shù)P,這個(gè)常數(shù)就是隨機(jī)事件A的概率。先驗(yàn)概率〔古典概率古典概率模型要求滿足兩個(gè)條件:⑴試驗(yàn)的所有可能結(jié)果是有限的;⑵每一種可能結(jié)果出現(xiàn)的可能性相等。〔二概率的公理系統(tǒng)1.任何隨機(jī)事件A的概率都是在0與1之間的正數(shù),即0≤P〔A≤12.不可能事件的概率等于零,即P〔A=03.必然事件的概率等于1,即P〔A=1〔三概率分布類型概率分布〔probabilitydistribution是指對(duì)隨機(jī)變量取不同值時(shí)的概率的描述,一般用概率分布函數(shù)進(jìn)行描述。依不同的標(biāo)準(zhǔn),對(duì)概率分布可作不同的分類。1、離散型分布與連續(xù)型分布依隨機(jī)變量的類型,可將概率分布分為離散型概率分布與連續(xù)型概率分布。心理與教育統(tǒng)計(jì)學(xué)中最常用的離散型分布是二項(xiàng)分布,最常用的連續(xù)型分布是正態(tài)分布。2、經(jīng)驗(yàn)分布與理論分布依分布函數(shù)的來源,可將概率分布分為經(jīng)驗(yàn)分布與理論分布。經(jīng)驗(yàn)分布〔empiricaldistribution是指根據(jù)觀察或?qū)嶒?yàn)所獲得的數(shù)據(jù)而編制的次數(shù)分布或相對(duì)頻率分布。理論分布〔theoreticaldistribution是按某種數(shù)學(xué)模型計(jì)算出的概率分布。3、基本隨機(jī)變量分布與抽樣分布依所描述的數(shù)據(jù)的樣本特性,可將概率分布分為基本隨機(jī)變量分布與抽樣分布〔samplingdistribution?;倦S機(jī)變量分布是隨機(jī)變量各種不同取值情況的概率分布,抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計(jì)量的概率分布。二、概率分布——正態(tài)分布〔一正態(tài)分布特征正態(tài)分布〔normaldistribution也稱為常態(tài)分布,是連續(xù)型隨機(jī)變量概率分布的一種,是在數(shù)理統(tǒng)計(jì)的理論與實(shí)際應(yīng)用中占有最重要地位的一種理論分布。1.正態(tài)分布曲線函數(shù)正態(tài)分布曲線函數(shù)又稱概率密度函數(shù),其一般公式為:公式所描述的正態(tài)曲線,由σ和μ兩個(gè)參數(shù)決定。2、正態(tài)分布的性質(zhì)正態(tài)分布是以為中心的對(duì)稱分配。正態(tài)分布有2個(gè)參數(shù):m<平均數(shù)>以及s<標(biāo)準(zhǔn)差>,其決定了分配的位置及形狀。正態(tài)分布曲線下面的面積總和等于1。正態(tài)分布在時(shí)有一轉(zhuǎn)折點(diǎn)。正態(tài)分布曲線的兩尾無限延伸。正態(tài)分布是一族曲線,標(biāo)準(zhǔn)正態(tài)分布是一條曲線。3、標(biāo)準(zhǔn)正態(tài)分布曲線將標(biāo)準(zhǔn)分?jǐn)?shù)代入正態(tài)曲線函數(shù),并且,令σ=1,則公式變換為標(biāo)準(zhǔn)正態(tài)分布函數(shù):標(biāo)準(zhǔn)正態(tài)分布曲線的特點(diǎn)⑴.曲線在Z=0處達(dá)到最高點(diǎn)⑵.曲線以Z=0處為中心,雙側(cè)對(duì)稱⑶.曲線從最高點(diǎn)向左右緩慢下降,向兩側(cè)無限延伸,但永不與基線相交。⑷.標(biāo)準(zhǔn)正態(tài)分布曲線的平均數(shù)為0,標(biāo)準(zhǔn)差為1。從Z=-3至Z=+3之間幾乎分布著全部數(shù)據(jù)。⑸.曲線的拐點(diǎn)為正負(fù)一個(gè)標(biāo)準(zhǔn)差處。4、正態(tài)分布表的使用已知Z值求概率⑴.求Z=0至某一Z值之間的概率:直接查表⑵.求兩個(gè)Z值之間的概率兩Z值符號(hào)相同:PZ1-Z2=PZ2-PZ1兩Z值符號(hào)相反:PZ1-Z2=PZ2+PZ1⑶.求某一Z值以上的概率Z>0時(shí),PZ-∞=0.5-PZZ<0時(shí),PZ-∞=0.5+PZ⑷.求某一Z值以下的概率Z>0時(shí),P-∞-Z=0.5+PZZ<0時(shí),P-∞-Z=0.5-PZ已知面積〔概率求Z值⑴.求Z=0以上或以下某一面積對(duì)應(yīng)的Z值:直接查表⑵.求與正態(tài)曲線上端或下端某一面積P相對(duì)應(yīng)的Z值:先用0.5-PZ,再查表⑶.求與正態(tài)曲線下中央部位某一面積相對(duì)應(yīng)的Z值:先計(jì)算P/2,再查表已知概率P或Z值,求概率密度Y⑴.直接查正態(tài)分布表就能得到相應(yīng)的概率密度Y值。⑵.如果由概率P求Y值,要注意區(qū)分已知概率是位于正態(tài)曲線的中間部分,還是兩尾端部分,才能通過查表求得正確的概率密度。三、概率分布——二項(xiàng)分布〔一二項(xiàng)試驗(yàn)與二項(xiàng)分布二項(xiàng)分布〔bionimaldistribution是一種具有廣泛用途的離散型隨機(jī)變量的概率分布,它是由貝努里創(chuàng)始的,因此又稱為貝努里分布。1.二項(xiàng)試驗(yàn)滿足以下條件的試驗(yàn)稱為二項(xiàng)試驗(yàn):一次試驗(yàn)只有兩種可能的結(jié)果,即成功和失?。还灿衝次試驗(yàn),并且n是預(yù)先給定的任一正整數(shù);各次試驗(yàn)相互獨(dú)立,即各次試驗(yàn)之間互不影響;各次試驗(yàn)中成功的概率相等,失敗的概率也相等。2.二項(xiàng)分布函數(shù)二項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。用n次方的二項(xiàng)展開式來表達(dá)在n次二項(xiàng)試驗(yàn)中成功事件出現(xiàn)的不同次數(shù)〔X=0,1…的概率分布,叫做二項(xiàng)分布函數(shù)。二項(xiàng)展開式的通式〔即二項(xiàng)分布函數(shù):3、二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差如果二項(xiàng)分布滿足p>q且nq≥5〔或者p<q且np≥5時(shí),二項(xiàng)分布接近于正態(tài)分布。可用下面的方法計(jì)算二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差。二項(xiàng)分布的平均數(shù)為:二項(xiàng)分布的標(biāo)準(zhǔn)差為:4、二項(xiàng)分布的應(yīng)用二項(xiàng)分布函數(shù)除了用來求成功事件恰好出現(xiàn)X次的概率之外,在教育中主要用來判斷試驗(yàn)結(jié)果的機(jī)遇性與真實(shí)性的界限。四、概率分布——樣本分布〔一、抽樣分布區(qū)分三種不同性質(zhì)的分布:總體分布:總體內(nèi)個(gè)體數(shù)值的頻數(shù)分布樣本分布:樣本內(nèi)個(gè)體數(shù)值的頻數(shù)分布抽樣分布:某一種統(tǒng)計(jì)量的概率分布1.抽樣分布的概念抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計(jì)量的概率分布。抽樣分布是一個(gè)理論的概率分布,是統(tǒng)計(jì)推斷的依據(jù)。2.平均數(shù)抽樣分布的幾個(gè)定理⑴.從總體中隨機(jī)抽出容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。⑵.容量為n的平均數(shù)在抽樣分布上的標(biāo)準(zhǔn)差〔即平均數(shù)的標(biāo)準(zhǔn)誤,等于總體標(biāo)準(zhǔn)差除以n的平方根。⑶.從正態(tài)總體中,隨機(jī)抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。⑷.雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布?!捕?biāo)準(zhǔn)誤某種統(tǒng)計(jì)量在抽樣分布上的標(biāo)準(zhǔn)差,稱為標(biāo)準(zhǔn)誤。標(biāo)準(zhǔn)誤用來衡量抽樣誤差。標(biāo)準(zhǔn)誤越小,表明樣本統(tǒng)計(jì)量與總體參數(shù)的值越接近,樣本對(duì)總體越有代表性,用樣本統(tǒng)計(jì)量推斷總體參數(shù)的可靠度越大。因此,標(biāo)準(zhǔn)誤是統(tǒng)計(jì)推斷可靠性的指標(biāo)。平均數(shù)標(biāo)準(zhǔn)誤的計(jì)算1.總體正態(tài),σ已知〔不管樣本容量大小,或總體非正態(tài),σ已知,大樣本平均數(shù)的標(biāo)準(zhǔn)誤為:2.總體正態(tài),σ未知〔不管樣本容量大小,或總體非正態(tài),σ未知,大樣本平均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值為:〔三平均數(shù)離差統(tǒng)計(jì)量的分布1.總體正態(tài),σ已知〔不管樣本容量大小,或總體非正態(tài),σ已知,大樣本平均數(shù)離差的的抽樣分布呈正態(tài)分布正態(tài)總體,樣本平均數(shù)的抽樣分布2.總體正態(tài),σ未知〔不管樣本容量大小,或總體非正態(tài),σ未知,大樣本平均數(shù)離差的的抽樣分布呈t分布t分布的特點(diǎn)⑴.形狀與正態(tài)分布曲線相似⑵.t分布曲線隨自由度不同而有一簇曲線⑶.自由度的計(jì)算:自由度是指能夠獨(dú)立變化的數(shù)據(jù)個(gè)數(shù)。⑷.查t分布表時(shí),需根據(jù)自由度及相應(yīng)的顯著性水平,并要注意是單側(cè)數(shù)據(jù)還是雙側(cè)。3.總體σ未知,大樣本時(shí)的近似處理樣本容量增大后,平均數(shù)的抽樣分布接近于正態(tài)分布,可用正態(tài)分布近似處理:第七章參數(shù)估計(jì)一、點(diǎn)估計(jì)、區(qū)間估計(jì)與標(biāo)準(zhǔn)誤〔一總體參數(shù)估計(jì)的基本原理根據(jù)樣本統(tǒng)計(jì)量對(duì)相應(yīng)總體參數(shù)所作的估計(jì)叫作總體參數(shù)估計(jì)??傮w參數(shù)估計(jì)分為點(diǎn)估計(jì)和區(qū)間估計(jì)。由樣本的標(biāo)準(zhǔn)差估計(jì)總體的標(biāo)準(zhǔn)差即為點(diǎn)估計(jì);而由樣本的平均數(shù)估計(jì)總體平均數(shù)的取值范圍則為區(qū)間估計(jì)。〔二點(diǎn)估計(jì)1、良好的點(diǎn)估計(jì)量應(yīng)具備的條件無偏性如果一切可能個(gè)樣本統(tǒng)計(jì)量的值與總體參數(shù)值偏差的平均值為0,這種統(tǒng)計(jì)量就是總體參數(shù)的無偏估計(jì)量。有效性當(dāng)總體參數(shù)不止有一種無偏估計(jì)量時(shí),某一種估計(jì)量的一切可能樣本值的方差小者為有效性高,方差大者為有效性低。一致性當(dāng)樣本容量無限增大時(shí),估計(jì)量的值能越來越接近它所估計(jì)的總體參數(shù)值,這種估計(jì)是總體參數(shù)一致性估計(jì)量。充分性一個(gè)容量為n的樣本統(tǒng)計(jì)量,應(yīng)能充分地反映全部n個(gè)數(shù)據(jù)所反映的總體的信息。2、點(diǎn)估計(jì)量的缺點(diǎn)有偏差沒有提供正確估計(jì)的概率,即不能提供估計(jì)值與參數(shù)真值的接近程度和可靠程度〔三區(qū)間估計(jì)區(qū)間估計(jì)可以解決這個(gè)問題。區(qū)間估計(jì)得出的不是一個(gè)單一數(shù)值,而是一個(gè)數(shù)值區(qū)間。它既可以告訴我們參數(shù)的真值在什么范圍內(nèi),又能告訴我們參數(shù)的真值落在這個(gè)范圍的概率有多大。區(qū)間估計(jì)的基礎(chǔ)——抽樣分布根據(jù)抽樣分布的特點(diǎn)及原理,不同總體條件下,可能會(huì)有不同的抽樣分布,則可得到不同條件下總體參數(shù)的區(qū)間估計(jì)的計(jì)算方法。區(qū)間估計(jì)涉及和置信區(qū)間和顯著性水平。1、區(qū)間估計(jì)以樣本統(tǒng)計(jì)量的抽樣分布〔概率分布為理論依據(jù),按一定概率的要求,由樣本統(tǒng)計(jì)量的值估計(jì)總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計(jì)。對(duì)總體參數(shù)值進(jìn)行區(qū)間估計(jì),就是要在一定可靠度上求出總體參數(shù)的置信區(qū)間的上下限。⑴要知道與所要估計(jì)的參數(shù)相對(duì)應(yīng)的樣本統(tǒng)計(jì)量的值,以及樣本統(tǒng)計(jì)量的理論分布;⑵要求出該種統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤;⑶要確定在多大的可靠度上對(duì)總體參數(shù)作估計(jì),再通過某種理論概率分布表,找出與某種可靠度相對(duì)應(yīng)的該分布橫軸上記分的臨界值,才能計(jì)算出總體參數(shù)的置信區(qū)間的上下限。置信區(qū)間置信度,即置信概率,是作出某種推斷時(shí)正確的可能性〔概率。置信區(qū)間,也稱置信間距〔confidenceinterval,CI是指在某一置信度時(shí),總體參數(shù)所在的區(qū)域距離或區(qū)域長度。置信區(qū)間是帶有置信概率的取值區(qū)間。顯著性水平對(duì)總體平均數(shù)進(jìn)行區(qū)間估計(jì)時(shí),置信概率表示做出正確推斷的可能性,但這種估計(jì)還是會(huì)有犯錯(cuò)誤的可能。顯著性水平<significancelevel>就是指估計(jì)總體參數(shù)落在某一區(qū)間時(shí),可能犯錯(cuò)誤的概率,用符號(hào)α表示。P=1-α2、平均數(shù)區(qū)間估計(jì)的基本原理通過樣本的平均數(shù)估計(jì)總體的平均數(shù),首先假定該樣本是隨機(jī)取自一個(gè)正態(tài)分布的母總體<或非正態(tài)總體中的n>30的樣本>,而計(jì)算出來的實(shí)際平均數(shù)是無數(shù)容量為n的樣本平均數(shù)中的一個(gè)。根據(jù)樣本平均數(shù)的分布理論,可以對(duì)總體平均數(shù)進(jìn)行估計(jì),并以概率說明其正確的可能性。三、總體平均數(shù)的估計(jì)〔一總體平均數(shù)的區(qū)間估計(jì)1.總體平均數(shù)區(qū)間估計(jì)的基本步驟①.根據(jù)樣本的數(shù)據(jù),計(jì)算樣本的平均數(shù)和標(biāo)準(zhǔn)差;②.計(jì)算平均數(shù)抽樣分布的標(biāo)準(zhǔn)誤;③.確定置信概率或顯著性水平;④.根據(jù)樣本平均數(shù)的抽樣分布確定查何種統(tǒng)計(jì)表;⑤.計(jì)算置信區(qū)間;⑥.解釋總體平均數(shù)的置信區(qū)間。2.平均數(shù)區(qū)間估計(jì)的計(jì)算①總體正態(tài),σ已知〔不管樣本容量大小,或總體非正態(tài),σ已知,大樣本樣本平均數(shù)的分布呈正態(tài),平均數(shù)的置信區(qū)間為:②總體正態(tài),σ未知〔不管樣本容量大小,或總體非正態(tài),σ未知,大樣本樣本平均數(shù)的分布為t分布,平均數(shù)的置信區(qū)間為:③總體正態(tài),σ未知,大樣本平均數(shù)的抽樣分布接近于正態(tài)分布,用正態(tài)分布代替t分布近似處理:④總體非正態(tài),小樣本不能進(jìn)行參數(shù)估計(jì),即不能根據(jù)樣本分布對(duì)總體平均數(shù)進(jìn)行估計(jì)。第八章假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的原理〔一、假設(shè)檢驗(yàn)的基本原理利用樣本信息,根據(jù)一定概率,對(duì)總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷,稱為假設(shè)檢驗(yàn)。1、假設(shè)假設(shè)檢驗(yàn)一般有兩互相對(duì)立的假設(shè)。H0:零假設(shè),或稱原假設(shè)、虛無假設(shè)〔nullhypothesis、解消假設(shè);是要檢驗(yàn)的對(duì)象之間沒有差異的假設(shè)。H1:備擇假設(shè)〔alternativehypothesis,或稱研究假設(shè)、對(duì)立假設(shè);是與零假設(shè)相對(duì)立的假設(shè),即存在差異的假設(shè)。進(jìn)行假設(shè)檢驗(yàn)時(shí),一般是從零假設(shè)出發(fā),以樣本與總體無差異的條件計(jì)算統(tǒng)計(jì)量的值,并分析計(jì)算結(jié)果在抽樣分布上的概率,根據(jù)相應(yīng)的概率判斷應(yīng)接受零假設(shè)、拒絕研究假設(shè)還是拒絕零假設(shè)、接受研究假設(shè)。2、小概率事件樣本統(tǒng)計(jì)量的值在其抽樣分布上出現(xiàn)的概率小于或等于事先規(guī)定的水平,這時(shí)就認(rèn)為小概率事件發(fā)生了。把出現(xiàn)概率很小的隨機(jī)事件稱為小概率事件。當(dāng)概率足夠小時(shí),可以作為從實(shí)際可能性上,把零假設(shè)加以否定的理由。因?yàn)楦鶕?jù)這個(gè)原理認(rèn)為:在隨機(jī)抽樣的條件下,一次實(shí)驗(yàn)竟然抽到與總體參數(shù)值有這么大差異的樣本,可能性是極小的,實(shí)際中是罕見的,幾乎是不可能的。3、顯著性水平統(tǒng)計(jì)學(xué)中把拒絕零假設(shè)的概率稱為顯著性水平,用α表示。顯著性水平也是進(jìn)行統(tǒng)計(jì)推斷時(shí),可能犯錯(cuò)誤的概率。常用的顯著性水平有兩個(gè):α=0.05和α=0.01。4.假設(shè)檢驗(yàn)中的兩類錯(cuò)誤及其控制對(duì)于總體參數(shù)的假設(shè)檢驗(yàn),有可能犯兩種類型的錯(cuò)誤,即α錯(cuò)誤和β錯(cuò)誤。假設(shè)檢驗(yàn)中的兩類錯(cuò)誤
H0為真H0為假拒絕H0α錯(cuò)誤正確接受H0正確β錯(cuò)誤兩類錯(cuò)誤
實(shí)際情況
H0正確H0錯(cuò)誤研究結(jié)論拒絕H0Ⅰ型錯(cuò)誤正確接受H0正確Ⅱ型錯(cuò)誤結(jié)論〔1兩類錯(cuò)誤既有聯(lián)系又有區(qū)別錯(cuò)誤只在否定H0時(shí)發(fā)生錯(cuò)誤只在接受H0時(shí)發(fā)生錯(cuò)誤增加錯(cuò)誤減小錯(cuò)誤增加錯(cuò)誤減小〔2n,2可使兩類錯(cuò)誤的概率都減小.為了將兩種錯(cuò)誤同時(shí)控制在相對(duì)最小的程度,研究者往往通過選擇適當(dāng)?shù)娘@著性水平而對(duì)α錯(cuò)誤進(jìn)行控制,如α=0.05或α=0.01。對(duì)β錯(cuò)誤,則一方面使樣本容量增大,另一方面采用合理的檢驗(yàn)形式〔即單側(cè)檢驗(yàn)或雙側(cè)檢驗(yàn)來使β誤差得到控制。在確定檢驗(yàn)形式時(shí),凡是檢驗(yàn)是否與假設(shè)的總體一致的假設(shè)檢驗(yàn),α被分散在概率分布曲線的兩端,因此稱為雙側(cè)檢驗(yàn)。雙側(cè)檢驗(yàn)的假設(shè)形式為:H0:μ=μ0,H1:μ≠μ0凡是檢驗(yàn)大于或小于某一特定條件的假設(shè)檢驗(yàn),α是在概率分布曲線的一端,因此稱為單側(cè)檢驗(yàn)。單側(cè)檢驗(yàn)的假設(shè)形式為:H0:μ≥μ0,H1:μ<μ0或者H0:μ≤μ0,H1:μ>μ05.假設(shè)檢驗(yàn)的基本步驟一個(gè)完整的假設(shè)檢驗(yàn)過程,一般經(jīng)過四個(gè)主要步驟:⑴.提出假設(shè)⑵.選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算統(tǒng)計(jì)量的值⑶.確定顯著性水平⑷.做出統(tǒng)計(jì)結(jié)論二、平均數(shù)的顯著性檢驗(yàn)〔一總體平均數(shù)的顯著性檢驗(yàn)總體平均數(shù)的顯著性檢驗(yàn)是指對(duì)樣本平均數(shù)與總體平均數(shù)之間的差異進(jìn)行的顯著性檢驗(yàn)。若檢驗(yàn)的結(jié)果差異顯著,可以認(rèn)為該樣本不是來自當(dāng)前的總體,而來自另一個(gè)、與當(dāng)前總體存在顯著差異的總體。即,該樣本與當(dāng)前的總體不一致。1.總體平均數(shù)顯著性檢驗(yàn)的原理檢驗(yàn)的思路是:假定研究樣本是從平均數(shù)為μ的總體隨機(jī)抽取的,而目標(biāo)總體的平均數(shù)為μ0,檢驗(yàn)μ與μ0之間是否存在差異。如果差異顯著,可以認(rèn)為研究樣本的總體不是平均數(shù)為μ0的總體,也就是說,研究樣本不是來自平均數(shù)為μ0的總體。2.總體平均數(shù)顯著性檢驗(yàn)的步驟一個(gè)完整的假設(shè)檢驗(yàn)過程,一般經(jīng)過四個(gè)主要步驟:⑴.提出假設(shè)⑵.選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算統(tǒng)計(jì)量的值⑶.確定顯著性水平⑷.做出統(tǒng)計(jì)結(jié)論⑴.提出假設(shè)雙側(cè)檢驗(yàn)的假設(shè)形式為:H0:μ=μ0,H1:μ≠μ0單側(cè)檢驗(yàn)的假設(shè)形式為:H0:μ≥μ0,H1:μ<μ0〔左側(cè)檢驗(yàn)或者H0:μ≤μ0,H1:μ>μ0〔右側(cè)檢驗(yàn)⑵.選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算結(jié)果直接應(yīng)用原始數(shù)據(jù)檢驗(yàn)假設(shè)是有困難的,必須借助于根據(jù)樣本構(gòu)造出來的統(tǒng)計(jì)量,而且針對(duì)不同的條件,需要選擇不同的檢驗(yàn)統(tǒng)計(jì)量。⑶.確定顯著性水平在假設(shè)檢驗(yàn)中有可能會(huì)犯錯(cuò)誤。如果零假設(shè)是正確的,卻把它當(dāng)成錯(cuò)誤的加以拒絕,就會(huì)犯α錯(cuò)誤。α表示做出統(tǒng)計(jì)結(jié)論時(shí)犯錯(cuò)誤的概率,稱為顯著性水平。顯著性水平一般為0.05和0.01。⑷.做出統(tǒng)計(jì)結(jié)論根據(jù)已確定的顯著性水平,查統(tǒng)計(jì)量的分布表,找到該顯著性水平時(shí)統(tǒng)計(jì)量的臨界值,并以計(jì)算得到的統(tǒng)計(jì)量值與查表得到的臨界值比較,根據(jù)統(tǒng)計(jì)決斷規(guī)則做出拒絕或接受零假設(shè)的決定。3.平均數(shù)顯著性檢驗(yàn)的幾種情形⑴.總體為正態(tài),總體標(biāo)準(zhǔn)差σ已知平均數(shù)的抽樣分布服從正態(tài)分布,以Z為檢驗(yàn)統(tǒng)計(jì)量,其計(jì)算公式為:例1:某小學(xué)歷屆畢業(yè)生漢語拼音測(cè)驗(yàn)平均分?jǐn)?shù)為66分,標(biāo)準(zhǔn)差為11.7。現(xiàn)以同樣的試題測(cè)驗(yàn)應(yīng)屆畢業(yè)生〔假定應(yīng)屆與歷屆畢業(yè)生條件基本相同,并從中隨機(jī)抽18份試卷,算得平均分為69分,問該校應(yīng)屆與歷屆畢業(yè)生漢語拼音測(cè)驗(yàn)成績是否一樣?解:H0:μ=μ0,H1:μ≠μ0學(xué)生漢語拼音成績可以假定是從正態(tài)總體中抽出的隨機(jī)樣本??傮w標(biāo)準(zhǔn)差已知,樣本統(tǒng)計(jì)量的抽樣分布服從正態(tài),以Z為檢驗(yàn)統(tǒng)計(jì)量顯著性水平為α=0.05,雙側(cè)檢驗(yàn)查表得Zα=1.96,而計(jì)算得到的Z=1.09|Z|<Zα,則概率P>0.05差異不顯著,應(yīng)在0.05顯著性水平接受零假設(shè)結(jié)論:該校應(yīng)屆畢業(yè)生與歷屆畢業(yè)生漢語拼音測(cè)驗(yàn)成績一致,沒有顯著差異。雙側(cè)Z檢驗(yàn)統(tǒng)計(jì)決斷規(guī)則∣Z∣與臨界值比較P值顯著性檢驗(yàn)結(jié)果∣Z∣<1.96P>0.05不顯著保留H0,拒絕H11.96≤∣Z∣<2.580.05≥P>0.01顯著*在0.05顯著性水平拒絕H0,接受H1∣Z∣≥2.58P≤0.01極其顯著**在0.01顯著性水平拒絕H0,接受H1單側(cè)Z檢驗(yàn)統(tǒng)計(jì)決斷規(guī)則∣Z∣與臨界值比較P值顯著性檢驗(yàn)結(jié)果∣Z∣<1.65P>0.05不顯著保留H0,拒絕H11.65≤∣Z∣<2.330.05≥P>0.01顯著*在0.05顯著性水平拒絕H0,接受H1∣Z∣≥2.33P≤0.01極其顯著**在0.01顯著性水平拒絕H0,接受H1⑵.總體為正態(tài),總體標(biāo)準(zhǔn)差σ未知,樣本容量小于30平均數(shù)的抽樣分布服從t分布,以t為檢驗(yàn)統(tǒng)計(jì)量,計(jì)算公式為:例3:某區(qū)初三英語統(tǒng)一測(cè)驗(yàn)平均分?jǐn)?shù)為65,該區(qū)某校20份試卷的平均分?jǐn)?shù)為69.8,標(biāo)準(zhǔn)差為9.234。問該校初三年級(jí)英語平均分?jǐn)?shù)與全區(qū)是否一樣?⑶.總體標(biāo)準(zhǔn)差σ未知,樣本容量大于30平均數(shù)的抽樣分布服從t分布,但由于樣本容量較大,平均數(shù)的抽樣分布接近于正態(tài)分布,因此可以用Z代替t近似處理,計(jì)算公式為:⑷.總體非正態(tài),小樣本不能對(duì)總體平均數(shù)進(jìn)行顯著性檢驗(yàn)。三、平均數(shù)差異的顯著性檢驗(yàn)平均數(shù)差異顯著性檢驗(yàn)的統(tǒng)計(jì)量及計(jì)算公式〔一兩總體正態(tài),兩總體方差已知總體方差已知條件下,平均數(shù)之差的抽樣分布服從正態(tài)分布,以Z作為檢驗(yàn)統(tǒng)計(jì)量,計(jì)算公式為:1.兩樣本獨(dú)立2.兩樣本相關(guān)兩樣本相關(guān)的判斷:兩個(gè)樣本的數(shù)據(jù)之間存在著一一對(duì)應(yīng)的關(guān)系時(shí),稱兩樣本為相關(guān)樣本。常見的情形主要包括三種:一是同一組被試在前后兩次在同一類測(cè)驗(yàn)上的結(jié)果;二是同一組被試分別接受兩種不同實(shí)驗(yàn)的測(cè)驗(yàn)結(jié)果;三是按條件相同的原則選擇的配對(duì)實(shí)驗(yàn)結(jié)果。例1:某幼兒園在兒童入園時(shí)對(duì)49名兒童進(jìn)行了比奈智力測(cè)驗(yàn)<σ=16>,結(jié)果平均智商為106。一年后再對(duì)同組被試施測(cè),結(jié)果平均智商分?jǐn)?shù)為110。已知兩次測(cè)驗(yàn)結(jié)果的相關(guān)系數(shù)為r=0.74,問能否說隨著年齡的增長和一年的教育,兒童智商有了顯著提高?解:H0:μ1≤μ2H1:μ1>μ2正常兒童的智力測(cè)驗(yàn)結(jié)果,可以認(rèn)為是從正態(tài)總體中隨機(jī)抽出的樣本??傮w標(biāo)準(zhǔn)差已知,而同一組被試前后兩次的測(cè)驗(yàn)成績,屬于相關(guān)樣本。因此平均數(shù)之差的抽樣分布服從正態(tài)分布,應(yīng)選用Z作檢驗(yàn)統(tǒng)計(jì)量,并選擇相關(guān)樣本、總體標(biāo)準(zhǔn)差已知的計(jì)算公式。提示:σ1=σ2=16顯著性水平為α=0.05單側(cè)檢驗(yàn)時(shí)Z0.05=1.65,Z0.01=2.33而計(jì)算得到的Z=1.71﹡Z0.05<|Z|<Z0.01,則概率0.05>P>0.01差異顯著,應(yīng)在0.05顯著性水平接受零假設(shè)結(jié)論:可以說隨著年齡的增長和一年的教育,兒童智商有了顯著提高?!捕煽傮w正態(tài),兩總體方差未知總體方差未知條件下,平均數(shù)之差的抽樣分布服從t分布,以t作為檢驗(yàn)統(tǒng)計(jì)量,計(jì)算公式為:1.兩樣本獨(dú)立,兩總體方差一致方差齊性檢驗(yàn)方差齊性檢驗(yàn)是對(duì)兩總體方差是否齊性〔即是否一致或是否存在顯著性差異進(jìn)行的檢驗(yàn)。方差齊性檢驗(yàn)的統(tǒng)計(jì)量是F,其概率分布遵循F分布。若從方差相同的兩個(gè)正態(tài)總體中,隨機(jī)抽取兩個(gè)獨(dú)立樣本,以此為基礎(chǔ),分別求出兩個(gè)相應(yīng)總體方差的估計(jì)值,這兩個(gè)總體方差的估計(jì)值的比值稱為F比值,其計(jì)算公式為實(shí)際應(yīng)用中,常需以樣本方差估計(jì)總體方差,因此公式為當(dāng)兩樣本容量相差不大時(shí),上式可簡化為2、兩樣本獨(dú)立,兩總體方差不齊性對(duì)于方差不齊性的獨(dú)立樣本,平均數(shù)差異的顯著性可能由兩方面的原因造成:一是兩平均數(shù)確實(shí)存在顯著差異;二是兩總體方差之間存在顯著差異。當(dāng)兩總體的方差之間差異顯著時(shí),運(yùn)用一般的t檢驗(yàn)不準(zhǔn)確,需要進(jìn)行特別的檢驗(yàn)??傮w方差不齊性的兩個(gè)獨(dú)立樣本平均數(shù)之差的標(biāo)準(zhǔn)誤,可用兩個(gè)樣本方差分別估計(jì)出的兩個(gè)平均數(shù)標(biāo)準(zhǔn)誤平方之和再開方來表示。這時(shí)樣本平均數(shù)之差與相應(yīng)總體平均數(shù)之差的離差統(tǒng)計(jì)量,既不是Z分布,也不是t分布,而是與t分布相近似的t′分布。這種檢驗(yàn)方法被稱為柯克蘭—柯克斯t檢驗(yàn)〔Cochran-Cox,其統(tǒng)計(jì)量的計(jì)算公式為t′臨界值的計(jì)算公式3.總體方差未知,獨(dú)立樣本和相關(guān)樣本〔三兩總體非正態(tài),n1和n2大于30〔或50總體標(biāo)準(zhǔn)差未知條件下,平均數(shù)之差的抽樣分布服從t分布,但樣本容量較大,t分布接近于正態(tài)分布,可以以Z近似處理,因此以Z′作為檢驗(yàn)統(tǒng)計(jì)量,計(jì)算公式為:⑴.兩樣本相關(guān)⑵.兩樣本獨(dú)立〔四總體非正態(tài),小樣本不能對(duì)平均數(shù)差異進(jìn)行顯著性檢驗(yàn)。第九章方差分析一、方差分析的基本原理及步驟〔一方差分析的基本原理及步驟1、方差分析的基本概念方差:又叫均方,是標(biāo)準(zhǔn)差的平方,是表示變異的量方差分析通過對(duì)多組平均數(shù)的差異進(jìn)行顯著性檢驗(yàn),分析實(shí)驗(yàn)數(shù)據(jù)中不同來源的變異對(duì)總變異影響的大小。2、方差分析的基本原理方差分析又稱為變異分析〔analysisofvariance,ANOVA,是由斯內(nèi)德克〔GeorgeWaddelSnedecor提出的一種方法。方差分析通過對(duì)多組平均數(shù)的差異進(jìn)行顯著性檢驗(yàn),分析實(shí)驗(yàn)數(shù)據(jù)中不同來源的變異對(duì)總變異影響的大小。3、方差分析的邏輯方差分析作為一種統(tǒng)計(jì)方法,是把實(shí)驗(yàn)數(shù)據(jù)的總變異分解為若干個(gè)不同來源的分量。因而它所依據(jù)的基本原理是變異的可加性。在統(tǒng)計(jì)分析中,一般用方差來描述變量的變異性。方差分析是將總平方和分解為幾個(gè)不同來源的平方和〔實(shí)驗(yàn)數(shù)據(jù)與平均數(shù)離差的平方和。然后分別計(jì)算不同來源的方差,并計(jì)算方差的比值即F值。根據(jù)F值是否顯著對(duì)幾組數(shù)據(jù)的差異是否顯著作出判斷。4、方差分析的基本過程⑴.提出假設(shè)⑵.選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度快遞配送服務(wù)承包合同
- 二零二五年度農(nóng)業(yè)科技項(xiàng)目合作放棄承諾函合同范本
- 二零二五年度安防產(chǎn)品簡易加工制造合同
- 二零二五年度養(yǎng)老產(chǎn)業(yè)擔(dān)保與借款人服務(wù)協(xié)議
- 二零二五年度私人土地租賃與體育設(shè)施建設(shè)合同
- 基于人工智能技術(shù)的智慧城市規(guī)劃合同書
- 服裝設(shè)計(jì)與制作合同
- 科技部技術(shù)服務(wù)合同
- 互聯(lián)網(wǎng)行業(yè)用戶隱私保護(hù)及免責(zé)協(xié)議
- 物流園區(qū)投資建設(shè)協(xié)議
- 幼兒園中班安全《不動(dòng)手打人》課件
- 遼寧沈陽歷年中考語文現(xiàn)代文之說明文閱讀11篇(含答案)(2003-2022)
- 【正版授權(quán)】 ISO 7241:2023 EN Hydraulic fluid power - Dimensions and requirements of quick-action couplings
- 勞動(dòng)項(xiàng)目一 剪指甲 教案
- 母嬰護(hù)理培訓(xùn)課件
- 2024年江蘇農(nóng)林職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測(cè)試題庫各版本
- 汽車制造企業(yè)物流自動(dòng)化
- 《德伯家的苔絲》
- 保安員培訓(xùn):應(yīng)急處理
- XX附屬中學(xué)集團(tuán)化辦學(xué)三年發(fā)展規(guī)劃
- 金融基礎(chǔ)知識(shí)考試題庫300題(含答案)
評(píng)論
0/150
提交評(píng)論