




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
/華東師大心理統(tǒng)計學(xué)大綱第一章緒論第一節(jié)什么是統(tǒng)計學(xué)和心理統(tǒng)計學(xué)一、什么是統(tǒng)計學(xué)統(tǒng)計學(xué)是研究統(tǒng)計原理和方法的科學(xué)。具體地說,它是研究如何搜集、整理、分析反映事物總體信息的數(shù)字資料,并以此為依據(jù),對總體特征進(jìn)行推斷的原理和方法。統(tǒng)計學(xué)分為兩大類.一類是數(shù)理統(tǒng)計學(xué)。它主要是以概率論為基礎(chǔ),對統(tǒng)計數(shù)據(jù)數(shù)量關(guān)系的模式加以解釋,對統(tǒng)計原理和方法給予數(shù)學(xué)的證明。它是數(shù)學(xué)的一個分支。另一類是應(yīng)用統(tǒng)計學(xué)。它是數(shù)理統(tǒng)計原理和方法在各個領(lǐng)域中的應(yīng)用,如數(shù)理統(tǒng)計的原理和方法應(yīng)用心理學(xué)領(lǐng)域,稱為心理統(tǒng)計學(xué);應(yīng)用統(tǒng)計學(xué)是與研究對象密切結(jié)合的各科專門統(tǒng)計學(xué)。二、統(tǒng)計學(xué)和心理統(tǒng)計學(xué)的內(nèi)容統(tǒng)計學(xué)和心理統(tǒng)計學(xué)的研究內(nèi)容,從不同角度來分,可以分為不同的類型。從具體應(yīng)用的角度來分,可以分成描述統(tǒng)計,推斷統(tǒng)計和實驗設(shè)計三部分.1。描述統(tǒng)計對已獲得的數(shù)據(jù)進(jìn)行整理、概括,顯示其分布特征的統(tǒng)計方法,稱為描述統(tǒng)計。2。推斷統(tǒng)計根據(jù)樣本所提供的信息,運用概率的理論進(jìn)行分析、論證,在一定可靠程度上,對總體分布特征進(jìn)行估計、推測,這種統(tǒng)計方法稱為推斷統(tǒng)計。推斷統(tǒng)計的內(nèi)容包括總體參數(shù)估計和假設(shè)檢驗兩部分。3.實驗設(shè)計實驗者為了揭示試驗中自變量和因變量的關(guān)系,在實驗之前所制定的實驗計劃,稱為實驗設(shè)計。其中包括選擇怎樣的抽樣方式;如何計算樣本容量;確定怎樣的實驗對照形式;如何實現(xiàn)實驗組和對照組的等組化;如何安排實驗因素和如何控制無關(guān)因素;用什么統(tǒng)計方法處理及分析實驗結(jié)果,等等.以上三部分內(nèi)容,不是截然分開,而是相互聯(lián)系的。第二節(jié)統(tǒng)計學(xué)中的幾個基本概念一、隨機(jī)變量具有以下三個特性的現(xiàn)象,成為隨機(jī)變量。第一,一次試驗有多中可能結(jié)果,其所有可能結(jié)果是已知的;第二,試驗之前不能預(yù)料哪一種結(jié)果會出現(xiàn);第三,在相同的條件下可以重復(fù)試驗。隨機(jī)現(xiàn)象的每一種結(jié)果叫做一個隨機(jī)事件.我們把能表示隨機(jī)現(xiàn)象各種結(jié)果的變量稱為隨機(jī)變量。統(tǒng)計處理的變量都是隨機(jī)變量。二、總體和樣本總體是我們所研究的具有共同特性的個體的總和??傮w中的每個單位成為個體。樣本是從總體中抽取的作為觀察對象的一部分個體.當(dāng)總體所包含的個數(shù)有限時,這一總體稱為有限總體。而總體所包含的個數(shù)無限時,則稱為無限總體.樣本中包含的個體數(shù)目稱為樣本的容量,一般用n來表示。一般來說,樣本中個體數(shù)目大于30稱為大樣本,等于或小于30稱為小樣本。在對數(shù)據(jù)進(jìn)行處理時,大樣本和小樣本所用的統(tǒng)計方法不一定相同。三、統(tǒng)計量和參數(shù)樣本上的數(shù)據(jù)特征是統(tǒng)計量.總體上的各種數(shù)字特征是參數(shù)。在進(jìn)行統(tǒng)計推斷時,就是根據(jù)樣本統(tǒng)計量來推斷總體相應(yīng)的參數(shù)。第二章數(shù)據(jù)的初步整理第一節(jié)數(shù)據(jù)的來源、種類及其分類一、統(tǒng)計資料的來源統(tǒng)計資料的來源有兩個方面:1、經(jīng)常性資料2、專題性資料(1)調(diào)查資料(2)實驗資料二、數(shù)據(jù)的種類數(shù)據(jù)是隨機(jī)變量的觀察值。它是用來描述對客觀事物觀察測量的數(shù)值。數(shù)據(jù)的種類不同,統(tǒng)計處理的方法也不同。根據(jù)統(tǒng)計數(shù)據(jù)來源可分為點計數(shù)據(jù)和度量數(shù)據(jù);按隨機(jī)變量取值情況,可分為間斷性隨機(jī)變量的數(shù)據(jù)和連續(xù)性隨機(jī)變量的數(shù)據(jù)。1、點計數(shù)據(jù)和度量數(shù)據(jù)點計數(shù)據(jù)是指計算個數(shù)所獲得的數(shù)據(jù).度量數(shù)據(jù)是指用一定的工具或一定的標(biāo)準(zhǔn)測量所獲得的數(shù)據(jù)。2、間斷性隨機(jī)變量的數(shù)據(jù)和連續(xù)性隨機(jī)變量的數(shù)據(jù)取值個數(shù)有限的數(shù)據(jù),稱為間斷性隨機(jī)變量的數(shù)據(jù).這種數(shù)據(jù)的單位是獨立的,兩個單位之間不能劃分成細(xì)小的單位,一般用整數(shù)表示。取值個數(shù)無限的(不可數(shù)的)數(shù)據(jù),稱為連續(xù)性隨機(jī)變量的數(shù)據(jù)。它們可能的取值范圍能連續(xù)充滿某一個區(qū)間。數(shù)據(jù)的單位之間可以再劃分成無限多個細(xì)小的單位。數(shù)據(jù)可以用小數(shù)表示。三、數(shù)據(jù)的統(tǒng)計分類數(shù)據(jù)的統(tǒng)計分類,是指按照研究對象的本質(zhì)特征,根據(jù)分析研究的目的、任務(wù),以及統(tǒng)計分析時所用統(tǒng)計方法的可能性,將所獲得的數(shù)據(jù)進(jìn)行分組歸類。它是對數(shù)據(jù)進(jìn)行歸納、整理、簡化、概括的第一步,為進(jìn)一步分析研究打下基礎(chǔ).分類的標(biāo)志按形式劃分,可分為性質(zhì)類別和數(shù)量類別。性質(zhì)類別是按事物的不同性質(zhì)進(jìn)行分類。這種分類不表明事物之間的差異.性質(zhì)類別還可以進(jìn)一步分成不同的層次。數(shù)量類別是按數(shù)值大小進(jìn)行分類,并排成順序。在排列順序時,可以直接按數(shù)值大小進(jìn)行排列,也可以用等級順序進(jìn)行排列第二節(jié)統(tǒng)計表一、統(tǒng)計表的結(jié)構(gòu)及其編制的原則和要求。統(tǒng)計表一般由標(biāo)題、表號、標(biāo)目、線條、數(shù)字、表注等項構(gòu)成。標(biāo)題標(biāo)題是表的名稱,應(yīng)確切地、簡明扼要地說明表的內(nèi)容.表號表號是表的序號。標(biāo)目標(biāo)目是表格中對統(tǒng)計數(shù)據(jù)分類的項目。線條線條不宜過多。數(shù)字表內(nèi)數(shù)字必須準(zhǔn)確,一律用阿拉伯?dāng)?shù)字表示,位次對齊,小數(shù)的位數(shù)一致.表注它不是表的必要組成部分。二、統(tǒng)計表的總類1、簡單表只列出觀察對象的名稱、地點、時序或統(tǒng)計指標(biāo)名稱的統(tǒng)計表為簡單表.2、分組表只按一個標(biāo)志分組的統(tǒng)計表為分組表。3、復(fù)合表按兩個或兩個以上標(biāo)志分組的統(tǒng)計表為復(fù)合表.三、頻數(shù)分布表列法1、簡單頻數(shù)分布表(1)間斷變量的頻數(shù)分布表(2)連續(xù)變量的頻數(shù)分布表步驟:①求全距②決定組數(shù)和組距③決定組限決定組限④登記頻數(shù)2、累積頻數(shù)和累積百分比分布表(1)累積頻數(shù)分布表用累積頻數(shù)表示的頻數(shù)分布表稱為累積頻數(shù)分布表。(2)累積百分比分布表累積百分比分布表是累積頻數(shù)分布表的變型。它是用累積百分比表示的頻數(shù)分布表。第三節(jié)統(tǒng)計圖一、統(tǒng)計圖的結(jié)構(gòu)及其繪制規(guī)則統(tǒng)計圖由標(biāo)題、圖號、標(biāo)目、圖形、圖注等項構(gòu)成。下面按其構(gòu)成部分說明繪圖的基本規(guī)則。標(biāo)題圖的名稱應(yīng)簡明扼要,切合圖的內(nèi)容,必要時可注明時間、地點。圖號文章中若有幾幅畫,則需按其出現(xiàn)的先后次序編上序號,寫在圖題的作前方。標(biāo)目對于有縱橫軸的統(tǒng)計圖,應(yīng)在縱橫軸上分別標(biāo)明統(tǒng)計項目及其尺度.圖形圖形線在圖中為最粗,而且要清晰。圖注圖注不是圖中必要組成部分。二、表示間斷變量的統(tǒng)計圖1、直條圖直條圖是用直條的長短表示統(tǒng)計事項數(shù)量的圖形。它主要是用來比較性質(zhì)相似的間斷性資料。2、圓形圖圓形圖是用來表示間斷性資料構(gòu)成比的圖形。三、表示連續(xù)變量的統(tǒng)計圖1、線形圖線形圖用來表示連續(xù)性資料。它能表示兩個變量之間的函數(shù)關(guān)系;一種事物隨另一種事物變化的情況;某種事物隨時間推移的發(fā)展趨勢等。2、頻數(shù)分布圖常用的頻數(shù)分布圖有直方圖、多邊圖和累積多邊圖.(1)直方圖直方圖用面積表示頻數(shù)分布.用各組上下限上的矩形面積表示各組頻數(shù)。(2)多邊圖多邊圖以縱軸上的高度表示頻數(shù)的多少。(3)累積頻數(shù)和累積百分比多邊圖。第三章集中量集中量是代表一組數(shù)據(jù)典型水平或幾種趨勢的量。它能反映頻數(shù)分布中大量數(shù)據(jù)向某一點集中的情況。第一節(jié)算術(shù)平均數(shù)一、算術(shù)平均數(shù)的概念算術(shù)平均數(shù)是所有觀察值得總和除以總頻數(shù)所得之商,簡稱為平均數(shù)或均數(shù)。計算公式為(3.1)。算術(shù)平均數(shù)的特征:(1)觀察值的總和等于算術(shù)平均數(shù)的N倍;(2)各觀察值與其算術(shù)平均數(shù)之差的總和等于零;(3)若一組觀察值是由兩部分(或幾部分)組成,這組觀察值的算術(shù)平均數(shù)可以由組成部分算術(shù)平均數(shù)而求得;二、算術(shù)平均數(shù)的應(yīng)用及其優(yōu)缺點算術(shù)平均數(shù)具備一個良好的集中量所應(yīng)具備的一些條件:(1)反應(yīng)靈敏。(2)嚴(yán)密確定。簡明易懂,計算方便。(3)適合代數(shù)運算。(4)受抽樣變動的影響較小。除此之外,算數(shù)平均數(shù)還有幾個特殊的優(yōu)點:(1)只知一組觀察值的總和及總頻數(shù)就可以求出算術(shù)平均數(shù)(2)用加權(quán)法可以求出幾個平均數(shù)的總平均數(shù)。(3)用樣本數(shù)據(jù)推斷總體集中量時,算術(shù)平均數(shù)最接近于總體集中量的真值,它是總體平均數(shù)的最好估計值.(4)在計算方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)以及進(jìn)行統(tǒng)計推斷時,都要用到它。算術(shù)平均數(shù)的缺點:(1)易受兩極端數(shù)值(極大或極小)的影響。(2)一組數(shù)據(jù)中某個數(shù)值的大小不夠確切時就無法計算其算術(shù)平均數(shù)。第二節(jié)中位數(shù)一、中位數(shù)的概念中位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中央位置的數(shù)值,在這一數(shù)值上、下各有一半頻數(shù)分布著.二、中位數(shù)的計算方法1、原始數(shù)值計算方法將一組原始數(shù)據(jù)依大小順序排列后,若總頻數(shù)為奇數(shù),就以位于中央的數(shù)據(jù)作為中位數(shù);若總頻數(shù)為偶數(shù),則以最中間的兩個數(shù)據(jù)的算術(shù)平均數(shù)作為中位數(shù).2、頻數(shù)分布表計算法若一組原始數(shù)據(jù)已經(jīng)編成了頻數(shù)分布表,可用內(nèi)插法,通過頻數(shù)分布表計算中位數(shù).三、百分位數(shù)的概念及其計算方法百分位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中某一百分位置的數(shù)值。在心理測量中,常通過計算百分位數(shù)來說明、解釋和評價分?jǐn)?shù)在團(tuán)體中所處的位置。計算公式為(3.5)。四、中位數(shù)的應(yīng)用及其優(yōu)缺點中位數(shù)雖然也具備一個良好的集中量所應(yīng)具備的某些條件,例如比較嚴(yán)格確定、簡明易懂,計算簡便,受抽樣變動影響較小,但是它不適合進(jìn)一步的代數(shù)運算。它適用于以下幾種情況:(1)一組數(shù)據(jù)中有特大或特小兩極端數(shù)值時;(2)一組數(shù)據(jù)中有個別數(shù)據(jù)不確切時;(3)資料屬于等級性質(zhì)時。第三節(jié)眾數(shù)一、眾數(shù)的概念眾數(shù)是集中量的一種指標(biāo)。對眾數(shù)有理論眾數(shù)及粗略眾數(shù)兩種定義方法.理論眾數(shù)是指與頻數(shù)分布曲線最高點相對應(yīng)的橫坐標(biāo)上的一點。粗略眾數(shù)是指一組數(shù)據(jù)中頻數(shù)出現(xiàn)最多的那個數(shù)。二、眾數(shù)的計算方法1、用觀察法直接尋找粗略眾數(shù)粗略眾數(shù)不需要計算,可通過觀察直接尋得。2、用公式求理論眾數(shù)的近似值(1)皮爾遜(K.Person)的經(jīng)驗法利用皮爾遜發(fā)現(xiàn)的算術(shù)平均數(shù)、中位數(shù)、眾數(shù)三者關(guān)系來求理論眾數(shù)近似值的經(jīng)驗公式為(3。6)。(2)金氏(W.I。King)插補法當(dāng)頻數(shù)分布呈偏態(tài),即眾數(shù)所在組以上各組頻數(shù)總和與以下各組頻數(shù)總和相差較多時,可以用金氏公式計算眾數(shù),以進(jìn)行比率調(diào)整。其公式為(3.7)。三、眾數(shù)的應(yīng)用及其優(yōu)缺點眾數(shù)雖然簡明易懂,但是它并不具備一個良好的集中量的基本條件。它主要在以下情況下使用:(1)當(dāng)需要快速而粗略地找出一組數(shù)據(jù)的代表值時;(2)當(dāng)需要利用算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者關(guān)系來粗略判斷頻數(shù)分布的形態(tài)時;(3)利用眾數(shù)幫助分析解釋一組頻數(shù)分布是否確實具有兩個頻數(shù)最多的集中點時.第四節(jié)加權(quán)平均數(shù)、幾何平均數(shù)一、加權(quán)平均數(shù)加權(quán)平均數(shù)是不同比重數(shù)據(jù)(或平均數(shù))的平均數(shù).計算公式為(3。8)或(3。9)。二、幾何平均數(shù)幾何平均數(shù)是N個數(shù)值連乘積的N次方根。計算公式為(3。10)。當(dāng)一個數(shù)列的后一個數(shù)據(jù)是以前一個數(shù)據(jù)為基礎(chǔ)成比例增長時,要用幾何平均數(shù)求其平均增長率.三、調(diào)和平均數(shù)調(diào)和平均數(shù)是一組數(shù)據(jù)倒數(shù)的算術(shù)平均數(shù)的倒數(shù),亦稱倒數(shù)平均數(shù).用來表示。調(diào)和平均數(shù)在教育方面主要是用來求學(xué)習(xí)速度。計算公式為(3。11)。第四章差異量第一節(jié)全距、四分位距、百分位距全距全距是一組數(shù)據(jù)中最大值與最小值之差,又稱極差。用R表示。四分位距四分位距的概念為了避免全距受到兩極端數(shù)值影響的缺點,則用依一定順序排列的一組數(shù)據(jù)中間部位百分之五十個頻數(shù)距離的一半作為差異量指標(biāo),即四分位距.公式(4.1)四分位距的計算方法(1)原始數(shù)據(jù)計算法1)先將數(shù)據(jù)從小到大排列好。2)然后根據(jù)求中位數(shù)的方法求出第一個四分位數(shù)和第三個四分位數(shù),將之代入公式(4。1)即為四分位距。(2)頻數(shù)頒布表計算法1)先用內(nèi)插法求出第一個四分位數(shù)及第三個四分位數(shù),然后將之代入公式(4。1)即可。計算與的公式分別為公式(4.2a)和公式(4.2b)。2)然后根據(jù)公式(4。1)計算。3、四分位距的應(yīng)用及其優(yōu)缺點優(yōu)點:四分位位距簡明易懂,計算簡便,較少受兩極端數(shù)值的影響,比全距可靠得多。缺點:但它忽略了左右共數(shù)據(jù)的差異,又不適合代數(shù)運算,因而也限制了它的應(yīng)用。當(dāng)一組數(shù)據(jù)用中位數(shù)表示集中量時,就要用分位距表示差異量。因為它們同屬于百分體系。三、百分位距百分位距是指兩個百分位數(shù)之差.常用的百分位距有兩種:一為第90與第10百分位數(shù)之差,用表示。即依一定順序排列的一組數(shù)據(jù)中間部位個頻數(shù)的距離。一為第93與第7百分位數(shù)之差,用表示,是一組數(shù)據(jù)中間部位個頻數(shù)的距離.第二節(jié)平均差一、平均差的概念所謂平均差,就是每一個數(shù)據(jù)與該組數(shù)據(jù)的中位數(shù)(或算術(shù)平均數(shù))離差的絕對值的算術(shù)平均數(shù)。二、平均差的計算方法用原始數(shù)據(jù)計算平均差的公式為(4.3)三、平均差的優(yōu)缺點平均差意義明確,計算容易,每個數(shù)據(jù)都參加了運算,考慮到全部的離差,反應(yīng)靈敏。但計算要用絕對值,不適合代數(shù)運算。第三節(jié)方差和標(biāo)準(zhǔn)差一、方差和標(biāo)準(zhǔn)差的概念方差是指離差平方的算術(shù)平均數(shù)。其定義公式為(4。5),計算公式是(4.7).標(biāo)準(zhǔn)差是指離差平方和平均后的方根。即方差的平方根。其定義公式為(4。6),計算公式是(4。8)。二、方差和標(biāo)準(zhǔn)差的應(yīng)用及其優(yōu)缺點方差和標(biāo)準(zhǔn)差的優(yōu)點:反應(yīng)靈敏,隨任何一個數(shù)據(jù)的變化而表示;一組數(shù)據(jù)的方差和標(biāo)準(zhǔn)差有確定的值;計算簡單;適合代數(shù)計算,不僅求方差和標(biāo)準(zhǔn)差的過程中可以進(jìn)行代數(shù)運算,而且可以將幾個方差和標(biāo)準(zhǔn)差綜合成一個總的方差和標(biāo)準(zhǔn)差;用樣本數(shù)據(jù)推斷總體差異量時,方差和標(biāo)準(zhǔn)差是最好的估計量。方差和標(biāo)準(zhǔn)差的缺點:不太容易理解;易受兩極端數(shù)值的影響;有個別數(shù)值糊涂不清時,無法計算。與其他差異量指標(biāo)相比,方差和標(biāo)準(zhǔn)差應(yīng)用最為廣泛。它的最直接用途是描述一組數(shù)據(jù)的離散程度,當(dāng)一組數(shù)據(jù)的集中量有算術(shù)平均數(shù)表示時,差異量要用標(biāo)準(zhǔn)差表示。第四節(jié)相對差異量一、相對差異量的概念上述全距、四分位距、平均差及標(biāo)準(zhǔn)差都是帶有與原觀察值相同單位的名數(shù),稱為絕對差異量。這種差異量對兩種單位不同,或單位相同而兩個平均數(shù)相差較大的資料,都無法比較差異的大小,必須用相對差異量(即差異系數(shù))進(jìn)行比較。所謂差異系數(shù)是指標(biāo)準(zhǔn)差與其算術(shù)平均數(shù)的百分比。它是沒有單位的相對數(shù)。其計算公式是(4.11)二、差異系數(shù)的用途1、比較不同單位資料的差異程度2、比較單位相同而平均數(shù)相差數(shù)較大的兩組資料的差異量程度3、可判斷特殊差異情況三、差異系數(shù)的應(yīng)用條件從測驗的理論來說,只有等比量表才使平均數(shù)等于零成為不可能。也就是說,用來測量的量尺,既具有等距的單位,又具有絕對零點,這時所測量出的數(shù)據(jù)其平均數(shù)才不可能等于零,這時才能計算差異系數(shù)。第五節(jié)偏態(tài)量及峰態(tài)量偏態(tài)量及峰態(tài)量是用以描述數(shù)據(jù)分布特征的統(tǒng)計量。一、偏態(tài)量1、利用算術(shù)平均數(shù)與眾數(shù)或中位數(shù)的距離來計算。其公式為(4。12).當(dāng)SK=0,則分布呈對稱形;當(dāng)SK>0時,分布呈正偏態(tài);當(dāng)SK〈0時,分布為負(fù)偏態(tài)。2、根據(jù)動差來計算。其公式為(4.14).二、峰態(tài)量1、用兩個百分位距來計算。其公式為(4.16)。2、根據(jù)動差來計算.其公式為(4.17)。第五章概率及概率分布第一節(jié)概率的一般概念一、概率的定義概率因?qū)で蟮姆椒ú煌袃煞N定義,即后驗概率和先驗概率。1、后驗概率的定義以隨機(jī)事件A在大量重復(fù)試驗中出現(xiàn)的穩(wěn)定頻率值作為隨機(jī)事件A概率的估計值,這樣尋得的概率稱為后驗概率。計算公式是(5.2)。2.先驗概率的定義先驗概率是通過古典概率模型加以定義的,故又稱為古典概率.古典概率模型要求滿足兩個條件:(1)試驗的所有可能結(jié)果是有限的;(2)每一種可能結(jié)果出現(xiàn)的可能性(概率)相等。若所有可能結(jié)果的總數(shù)為n,隨機(jī)事件A包括m個可能結(jié)果,則事件A的概率計算公式為(5.3)。二、概率的性質(zhì)1、任何隨機(jī)事件A的概率都是介于0與1之間的正數(shù);2、不可能事件的概率等于0;3、必然事件的概率等于1。三、概率的加法和乘法1、概率的加法在一次試驗中不可能同時出現(xiàn)的事件稱為互不相容的事件。兩個互不相容事件和的概率,等于這兩個事件概率之和.用公式表示為(5.4)和(5.5)。2。概率的乘法A事件出現(xiàn)的概率不影響B(tài)事件出現(xiàn)的概率,這兩個事件為獨立事件。兩個獨立事件的概率,等于這兩個事件概率的乘積。用公式表示為(5.6)和(5.7)。第二節(jié)二項分布一、二項試驗滿足以下條件的試驗稱為二項試驗:(1)一次試驗只有兩種可能結(jié)果,即成功和失敗;(2)各次試驗相互獨立,互不影響;(3)各次試驗中成功的概率相等。二、二項分布函數(shù)二項分布是一種離散型隨機(jī)變量的概率分布.用n次方的二項展開式來表達(dá)在n次二項試驗中成功事件出現(xiàn)不同次數(shù)(X=0,1,…,n)的概念分布叫做二項分布.二項展開式的通式(5.8)就是二項分布函數(shù),運用這一函數(shù)式可以直接求出成功事件恰好出現(xiàn)X次的概率。三、二項分布圖從二項分布圖可以看出,當(dāng)p=q,不管n多大,二項分布呈對稱形.當(dāng)n很大時,二項分布接近于正態(tài)分布。當(dāng)n趨近于無限大時,正態(tài)分布是二項分布的極限。四、二項分布的平均數(shù)和標(biāo)準(zhǔn)差當(dāng)二項分布接近于正態(tài)分布時,在n次二項實驗中成功事件出現(xiàn)次數(shù)的平均數(shù)和標(biāo)準(zhǔn)差分別可以由公式(5.9)和(5.10)計算而得。五、二項分布的應(yīng)用二項分布函數(shù)除了用來求成功事件恰好出現(xiàn)X次的概率之外,在心理學(xué)中主要用來判斷實驗結(jié)果的機(jī)遇性與真實性的界限。屬于二項分布的問題,若實驗次數(shù)n較大,一般都用正態(tài)分布近似處理。第三節(jié)正態(tài)分布正態(tài)分布是一種連續(xù)型隨機(jī)變量的概率分布。一、正態(tài)曲線1.正態(tài)曲線函數(shù):正態(tài)曲線的函數(shù)式是公式(5.11)。標(biāo)準(zhǔn)正態(tài)分布的函數(shù)式是公式(5。12).2.正態(tài)曲線的特點:(1)曲線在Z=0處為最高點.(2)曲線以Z=0處為中心,雙側(cè)對稱。(3)曲線從最高點向左右緩慢下降,并無限延伸,但永遠(yuǎn)不與基線相交.(4)標(biāo)準(zhǔn)正態(tài)分布上的平均數(shù)為0,標(biāo)準(zhǔn)差為1。(5)曲線從最高點向左右延伸時,在正負(fù)1個標(biāo)準(zhǔn)差是拐點。二、正態(tài)曲線的面積與縱線1、累積正態(tài)分布函數(shù)2、標(biāo)準(zhǔn)正態(tài)分布下面積的求法3、正態(tài)曲線的縱線三、正態(tài)分布在測驗計分方面的應(yīng)用1、將原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)的意義:第一,各科標(biāo)準(zhǔn)分?jǐn)?shù)的單位是絕對等價的;第二、標(biāo)準(zhǔn)分?jǐn)?shù)的正負(fù)和大小可以反映出考生在全體考分中所處的地位。2、確定錄用分?jǐn)?shù)線3、確定等級評定的人數(shù)4、品質(zhì)評定數(shù)量化第六章抽樣分布及總體平均數(shù)的推斷第一節(jié)抽樣分布一、抽樣分布的概念要區(qū)分以下三種不同性質(zhì)的分布:1、總體分布:總體內(nèi)個體數(shù)值的頻數(shù)分布。2、樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布。3、抽樣分布:某一種統(tǒng)計量的概率分布。二、平均數(shù)抽樣分布的幾個定理1、從總體中隨機(jī)抽出容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。公式表示為(6.1).2、容量為n的平均數(shù)在抽樣分布上的標(biāo)準(zhǔn)差,等于總體標(biāo)準(zhǔn)差除以n的方根。公式表示為(6。2)。3、從正態(tài)總體中,隨機(jī)抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布.4、雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。三、樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量的形態(tài)從正態(tài)總體中隨機(jī)抽取的容量為n的一切可能樣本平均數(shù)為中心呈正態(tài)分布。當(dāng)總體標(biāo)準(zhǔn)差已知時,一切可能樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計量呈標(biāo)準(zhǔn)正態(tài)分布(6。3)??傮w標(biāo)準(zhǔn)差σ的無偏估計量S等于樣本統(tǒng)計量σx乘以貝賽耳氏校正數(shù),公式(6。4)。從正態(tài)總體中隨機(jī)抽取容量為n的一切可能樣本平均數(shù)的抽樣分布呈正態(tài)分布.當(dāng)總體標(biāo)準(zhǔn)差σ未知,需用估計值S來代替,于是平均數(shù)標(biāo)準(zhǔn)誤也被平均數(shù)標(biāo)準(zhǔn)誤的估計值所代替,這時一切可能樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計量呈t分布(6.6)。t分布與正態(tài)分布的相似之處:t分布基線上的t值從—∞-+∞;從平均數(shù)等于0處,左側(cè)t值為負(fù),右側(cè)t值為正;曲線以平均數(shù)處為最高點向兩側(cè)逐漸下降,尾部無限延伸,永不與基線相接,呈單峰對稱形。t分布與正態(tài)分布的區(qū)別之處在于:t分布的形態(tài)隨自由度(df=n-1)的變化呈一簇分布形態(tài)(即自由度不同的t分布形態(tài)也不同,見圖6.1)。自由度逐漸增大時,t分布逐漸接近正態(tài)分布.自由度是指總體參數(shù)估計量中變量值獨立自由變化的個數(shù).第二節(jié)總體平均數(shù)的參數(shù)估計一、總體參數(shù)估計的基本原理1、點估計:用某一樣本統(tǒng)計量的值來估計相應(yīng)總體參數(shù)的值叫總體參數(shù)的點估計。點估計的評價標(biāo)準(zhǔn):(1)無偏性:如果一切可能個樣本統(tǒng)計量的值與總體參數(shù)值偏差的平均值為0,這種統(tǒng)計量就是總體參數(shù)的無偏估計量。(2)有效性:當(dāng)總體參數(shù)不止有一種無偏估計量時,某一種估計量的一切可能樣本值的方差小者為有效性高,方差大者為有效性低。(3)一致性:當(dāng)樣本容量無限增大時,估計量的值能越來越接近它所估計的總體參數(shù)值,這種估計量是總體參數(shù)一致性估計量。2、區(qū)間估計:以樣本統(tǒng)計量的抽樣分布(概率分布)為理論依據(jù),按一定概率要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計。區(qū)間估計涉及置信水平和置信區(qū)間。對總體參數(shù)進(jìn)行區(qū)間估計,就是在一定的可靠度上求出總體參數(shù)的置信區(qū)間的上下限,那么有如下步驟:(1)、要知道與所要估計的參數(shù)相對應(yīng)的樣本統(tǒng)計量的值,以及樣本統(tǒng)計量的理論分布;(2)、要求出該種統(tǒng)計量的標(biāo)準(zhǔn)誤;(3)、要確定在多大的可靠度上對總體參數(shù)作估計,再通過查某種理論概率分布表,找出與某種可靠度相對應(yīng)的該分布橫軸上記分的臨界值,才能計算出總體參數(shù)的置信區(qū)間的上下限。二、σ已知條件下總體平均數(shù)的區(qū)間估計當(dāng)總體σ已知,總體呈正態(tài)分布,樣本容量無論大小時,或者當(dāng)總體σ已知,總體雖不呈正態(tài)分布,但樣本容量較大(n〉30)時,樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量均呈正態(tài)分布.區(qū)間估計的計算公式為(6.8)和(6.9)。三、σ未知條件下總體平均數(shù)的區(qū)間估計1、σ未知條件下,總體平均數(shù)的區(qū)間估計的基本原理:當(dāng)總體σ未知,總體呈正態(tài)分布,樣本容量無論大小時,或者當(dāng)總體σ未知,總體雖不呈正態(tài)分布,但樣本容量較大(n〉30)時,樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量均呈t分布。區(qū)間估計的計算公式為(6.10)和(6.11).公式為(6.10)和(6.11)中是平均數(shù)的標(biāo)準(zhǔn)誤的估計量。為了適合各種計算器的使用,可表示為以下三種形式。①②③于是置信限有三種形式:置信下限置信上限①②③2、小樣本的情況:當(dāng)總體標(biāo)準(zhǔn)差未知時,樣本的容量較小,在此條件下,樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量服從分布。總體平均數(shù)置信區(qū)間的上下限用總體標(biāo)準(zhǔn)差的估計值計算。3、大樣本的情況:可以用正態(tài)分布近似處理。第三節(jié)假設(shè)檢驗的基本原理。公式(6。15)利用樣本信息,根據(jù)一定概率,對總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷,稱為假設(shè)檢驗.現(xiàn)以總體參數(shù)的假設(shè)檢驗來簡要、概括地說明它的基本原理。1、當(dāng)對某一總體參數(shù)進(jìn)行假設(shè)檢驗時,首先從該總體中隨機(jī)抽取一個樣本,計算出統(tǒng)計量的值并根據(jù)經(jīng)驗對相應(yīng)的總體參數(shù)提出一個假設(shè)值,這個假設(shè)是說:這個樣本統(tǒng)計量的值是這個假設(shè)總體參數(shù)值的一個隨機(jī)樣本。2、根據(jù)這一假設(shè),可以認(rèn)為,像這樣的一切可能樣本統(tǒng)計量的值,應(yīng)當(dāng)以總體參數(shù)(假設(shè)的)為中心,形成該種統(tǒng)計量的一個抽樣分布,如果這個隨機(jī)樣本統(tǒng)計量的值在其抽樣分布上出現(xiàn)的概率較大,這時只好保留這個假設(shè)。3、如果這個隨機(jī)樣本統(tǒng)計量的值在其抽樣分布上出現(xiàn)的概率極小,根據(jù)概率事件在一次隨機(jī)抽樣中幾乎是不可能發(fā)生的,于是不得不否定這個樣本統(tǒng)計量的值是來自于這個總體參數(shù)值的假設(shè)。一、假設(shè)假設(shè)檢驗一般有兩個相互對立的假設(shè)。即零假設(shè)(或稱原假設(shè)、虛無假設(shè)、解消假設(shè))和備擇假設(shè)(或稱研究假設(shè)、對立假設(shè))。假設(shè)檢驗是從零假設(shè)出發(fā),視其被拒絕的機(jī)會,從而得出決斷.二、小概率事件把出現(xiàn)小概率的隨機(jī)事件稱為小概率事件。小概率事件是否出現(xiàn),這是對假設(shè)作出決斷的依據(jù)。三、顯著性水平拒絕零假設(shè)的概率稱為顯著性水平,用=0。05,=0。01來表示。也可以說,顯著性水平是統(tǒng)計推斷時,可能犯錯誤的概率。人圖中可以看出,顯著性水平越高(值越小),越不容易拒絕零假設(shè),推斷的可靠性越大。顯著性水平和可靠性程度之間的關(guān)系是:兩者之和為1.四、統(tǒng)計決斷的兩類錯誤及其控制如果拒絕了屬于真實的零假設(shè),即如果樣本統(tǒng)計量的總體參數(shù)正是假設(shè)的總體參數(shù),但是由于樣本統(tǒng)計量的值落入了拒絕區(qū)域。而零假設(shè)遭到拒絕,這時就會犯第一類型的錯誤。這種錯誤的可能性大小正是顯著性水平的大小,故又稱這類錯誤為α錯誤。如果保留了屬于不真實的零假設(shè),就會犯第二類型的錯誤。犯這種“假設(shè)屬偽而被保留”的第二類錯誤的概率,等于β值,故又稱這類錯誤為β錯誤。要使第一類錯誤的概率保持在需要的水平上,而控制第二類錯誤的概率,有以下方法:(1)、利用已知的實際總體參數(shù)與假設(shè)參數(shù)值之間的大小關(guān)系,合理安排拒絕領(lǐng)域的位置,選擇雙側(cè)檢驗還是單側(cè)檢驗,左側(cè)檢驗還是右側(cè)檢驗;(2)、加大樣本容量.第四節(jié)總體平均數(shù)的顯著性檢驗總體平均數(shù)的顯著性檢驗的適用公式與相應(yīng)的參數(shù)估計一脈相承。一、σ已知條件下總體平均數(shù)的顯著性檢驗(公式6。3)檢驗步驟:(1)、提出假設(shè)(2)、選擇檢驗統(tǒng)計量并計算其值(3)、確定檢驗形式(4)、統(tǒng)計決斷二、σ未知條件下總體平均數(shù)的假設(shè)檢驗1、小樣本的情況(公式6.16)2、大樣本的情況(公式6.3)平均數(shù)差異的顯著性檢驗平均數(shù)差異顯著性檢驗的基本原理平均數(shù)差異顯著性檢驗的原理首先要對兩個相應(yīng)的總體平均數(shù)之間提出沒有差異零假設(shè)和備擇假設(shè),然后以兩個樣本平均數(shù)差的抽樣分布為理論依據(jù),來考察兩個樣本平均數(shù)之差是否來自于兩個總體平均數(shù)之差的總體。也就是說要看樣本平均數(shù)之差在其抽樣分布上出現(xiàn)的概率如何。當(dāng)樣本平均數(shù)之差較大,大到在其抽樣分布上出現(xiàn)的概率足夠小時,就可以作為從實際可能性上否定零假設(shè)的理由,于是應(yīng)當(dāng)拒絕零假設(shè)而接受備擇假設(shè)。平均數(shù)之差的標(biāo)準(zhǔn)差兩個樣本平均數(shù)之差的抽樣誤差稱為平均數(shù)之差的標(biāo)準(zhǔn)誤。相關(guān)樣本平均數(shù)之差的標(biāo)準(zhǔn)誤:(公式7.3)獨立樣本平均數(shù)之差的標(biāo)準(zhǔn)誤:(公式7。4)上述的相關(guān)樣本和獨立樣本平均數(shù)之差的標(biāo)準(zhǔn)誤,都必須在兩個總體標(biāo)準(zhǔn)差已知時才好應(yīng)用.第二節(jié)相關(guān)樣本平均數(shù)差異的顯著性檢驗兩個樣本內(nèi)個體之間存在著一一對應(yīng)的關(guān)系,這兩個樣本稱為相關(guān)樣本.相關(guān)樣本有以下兩種情況:(1)用同一測驗對同一組被試在試驗前后進(jìn)行兩次測驗,所獲得的兩組測驗結(jié)果是相關(guān)樣本。(2)根據(jù)某些條件基本相同的原則,把被試一一匹配成對,然后將每對被試隨機(jī)地分入實驗組和對照組,對兩組被試施行不同的實驗處理之后,用同一測驗所獲得的測驗結(jié)果,也是相關(guān)樣本.相關(guān)樣本平均數(shù)差異的顯著性檢驗方法和步驟:(1)提出假設(shè)(2)選擇檢驗統(tǒng)計量并計算其值。在小樣本情況下,其檢驗統(tǒng)計量為公式(7。9)、(7。10)、(7.11)。在大樣本情況下用公式(7.12)。(3)確定檢驗形式(4)統(tǒng)計決斷第三節(jié)獨立樣本平均數(shù)差異的顯著性檢驗第四節(jié)方差不齊性獨立樣本平均數(shù)差異的顯著性檢驗兩個樣本內(nèi)的個體是隨機(jī)抽取的,它們之間不存在一一的對應(yīng)關(guān)系,這樣的兩個樣本稱為獨立樣本。一、獨立大樣本平均數(shù)差異的顯著性檢驗兩個樣本容量n1和n1都大于30的獨立樣本稱為獨立大樣本。獨立大樣本平均數(shù)差異的顯著性檢驗所用的公式是(7.16)二、獨立小樣本平均數(shù)差異的顯著性檢驗兩個樣本容量n1和n1均小于30,或其中一個小于30的獨立樣本稱為獨立小樣本.按理說,總體方差未知的兩個獨立樣本,無論樣本容量大小,平均數(shù)之差的標(biāo)準(zhǔn)誤都要用匯合方差來表示。而匯合方差是以兩個相應(yīng)總體方差相等為前提的,所以在進(jìn)行獨立樣本平均數(shù)差異的顯著性檢驗之前,首先要對兩個總體方差是否相等進(jìn)行方差齊性檢驗。獨立小樣本平均數(shù)差異的顯著性檢驗方法:1、方差齊性時:如果兩個獨立樣本的總體方差未知,經(jīng)方差齊性檢驗表明兩個總體方差相等,則統(tǒng)計量公式為(7。23)、(7.24)、(7.25),這三個公式是等價的.2、方差不齊性時:對于方差不齊性的兩個獨立樣本平均數(shù)差異顯著性檢驗,需要用校正的t'作為檢驗統(tǒng)計量,用公式(7.26)、(7.27)、(7.28)來表示。t'的臨界值則用公式(7。29)、(7.30)、(7.31)來計算.第五節(jié)方差齊性檢驗對兩個總體的方差是否有顯著性差異所進(jìn)行的檢驗稱為方差齊性(相等)檢驗.對兩個獨立樣本是否齊性,要進(jìn)行F檢驗。(以便于判斷兩個樣本是否來自于同一個總體)一、F分布若從方差相同的兩個正態(tài)總體中,隨機(jī)抽取兩個獨立樣本,以此為基礎(chǔ),分別求出兩個相應(yīng)總體方差的估計值,這兩個總體方差估計值的比值稱為F比值,F比值的抽樣分布稱為F分布。F分布的形態(tài)隨F比值分子和分母中自由度的變化而形成一簇正偏態(tài)分布。一般情況下,經(jīng)常應(yīng)用的是右側(cè)F檢驗,計算F值時,將大的總體方差估計值作為分子,小的作為分母。二、兩個獨立樣本的方差齊性檢驗檢驗步驟:(1)、提出假設(shè):(2)、選擇檢驗統(tǒng)計量并計算其值用公式(7。35)、(7.36)、(7。37)(3)統(tǒng)計決斷:根據(jù)分子的自由度和分母的自由度查表三、兩個相關(guān)樣本的方差齊性檢驗用公式(7。38)。第八章方差分析第一節(jié)方差分析的基本原理一、方差分析的目的方差分析的基本功能就在于它對多組平均數(shù)差異的顯著性進(jìn)行檢驗的作用。二、方差分析的邏輯組間差異對組內(nèi)差異的比值越大,則各組平均數(shù)的差異就越明顯。通過對組間差異與組內(nèi)差異比值的分析,來推斷幾個相應(yīng)平均數(shù)差異的顯著性,這就是方差分析的邏輯。三、以F檢驗來推斷幾個平均數(shù)差異的顯著性1、總平方和可以分解成組間平方和及組內(nèi)平方和2、總自由度可分解成組間自由度及組內(nèi)自由度3、組間方差與組內(nèi)方差的F比值四、方差分析中的幾個概念實驗中的自變量稱為因素。只有一個自變量的實驗稱為單因素實驗。有兩個或兩個以上自變量的實驗稱為多因素實驗.某一個因素的不同情況稱為因素的“水平”。包括量差或質(zhì)別兩類情況,按各個“水平”條件進(jìn)行的重復(fù)實驗稱為各種處理。第二節(jié)完全隨機(jī)設(shè)計的方差分析為了檢驗?zāi)骋粋€因素多種不同水平間的差異的顯著性,將從同一個總體中隨機(jī)抽取的被試,再隨機(jī)地分入各實驗組,施以各種不同的實驗處理以后,用方差分析法對這多個獨立樣本平均數(shù)差異的顯著性進(jìn)行檢驗,稱為完全隨機(jī)設(shè)計的方差分析.一、n相等的情況:檢驗的步驟:(1)、提出假設(shè)(2)、選擇檢驗統(tǒng)計量并計算其值:用公式(8.4)—(8。6)。(3)、統(tǒng)計決斷二、n不相等的情況用公式(8。7)—(8。8)。運用樣本統(tǒng)計量進(jìn)行組間與組內(nèi)方差的F檢驗在僅有資料的條件下,也可以計算出組間方差和組內(nèi)方差的F比值,對幾組平均數(shù)的差異進(jìn)行方差分析.第三節(jié)隨機(jī)區(qū)組設(shè)計的方差分析用方差分析法對多個相關(guān)樣本平均數(shù)差異所進(jìn)行的顯著性檢驗,稱之為隨機(jī)區(qū)組設(shè)計的方差分析.每一區(qū)組內(nèi)被試的人數(shù)分配有以下三種方式:(1)一個被試作為一個區(qū)組;(2)每一區(qū)組內(nèi)被試的人數(shù)是實驗處理數(shù)的整數(shù)倍;(3)區(qū)組內(nèi)以一個團(tuán)體為一個基本單元。檢驗步驟:(1)提出假設(shè)(2)選擇檢驗統(tǒng)計量并計算其值①計算平方和:由于組內(nèi)平方和可分解成區(qū)組平方和及誤差平方和于是總平方和可分解成組間平方和、區(qū)組平方和、誤差平方和區(qū)組平方和:誤差平方和:②計算自由度:區(qū)組自由度:誤差自由度:③計算方差:組間方差:區(qū)組方差:誤差方差:④計算F值:計算用公式(8.12)(3)統(tǒng)計決斷如果要考察區(qū)組設(shè)計是否有必要,或者考察區(qū)組的劃分是否成功,可以對區(qū)組差異性進(jìn)行F檢驗。公式(8.13)第四節(jié)各個平均數(shù)差異的顯著性檢驗對多組平均數(shù)的逐對差異檢驗,以Newman—Keul提出的q檢驗法(或稱N—K)最為常用。完全隨機(jī)設(shè)計的q檢驗1、各組N相等的情況:公式(8.14)2、各組N不相等的情況:公式(8.15)二、隨機(jī)區(qū)組設(shè)計的q檢驗公式(8.16).第五節(jié)多組方差的齊性檢驗在方差分析的F檢驗中,是以各個實驗組內(nèi)總體方差齊性為前提的。因此,按理應(yīng)該在方差分析之前,要對各個實驗組內(nèi)的總體方差先進(jìn)行齊性檢驗。如果各個實驗組內(nèi)總體方差為齊性,而經(jīng)過F檢驗所得多個樣本所屬總體平均數(shù)差異顯著,這時才可將樣本所屬總體平均數(shù)的差異歸因于各實驗處理的不同所致.如果各個總體的方差不齊,那么經(jīng)過F檢驗所得多個樣本所屬總體平均數(shù)差異顯著的結(jié)果,可能有一部分歸因于各實驗組內(nèi)總體方差不同所致。多組方差的顯著性可以用哈特萊(Hartley)所提出的最大F值檢驗法進(jìn)行齊性檢驗.公式(8。17)。一、N相等的情況:(公式)查F的臨界值,需要根據(jù)三個條件:1、方差的組數(shù)K;2、自由度;3、顯著性水平.二、N不相等的情況:(公式)當(dāng)各組N不相等時,可用容量最大一組N計算自由度。第六節(jié)多因素方差分析簡介一、多因素方差分析的功能多因素方差分析不僅可以檢驗各個因素對因變量作用的顯著性,而且還可以檢驗因素與因素間共同結(jié)合對因變量發(fā)生交互作用的顯著性。二、雙因素完全隨機(jī)設(shè)計方差分析的基本方法若一個實驗有A、B兩個因素,A因素有a和a兩種水平,B因素有b和b兩種水平,現(xiàn)對A因素、B因素以及A與B因素交互作用對實驗結(jié)果影響的顯著性進(jìn)行檢驗,其檢驗的步驟為:(1)提出假設(shè):共有三種假設(shè)①②③(2)確定檢驗統(tǒng)計量A因素的檢驗統(tǒng)計量為:B因素的檢驗統(tǒng)計量為:C因素的檢驗統(tǒng)計量為:①平方和的分解:雙因素與單因素完全隨機(jī)設(shè)計平方和的不同之處在于,組間平方和被分解成A因素、B因素和A*B交互作用三種平方和,即(a)計算SSt、SSb、SSw:為了計算各種平方和,先把ab,ab,ab,ab,看作為單因素完全隨機(jī)設(shè)計的四組分?jǐn)?shù)然后求:總平方和:組間平方和:組內(nèi)平方和:(b)計算SSA、SSB、SSA*B:A因素組間平方和:B因素組間平方和:A*B的組間平方和:②自由度的分解:總自由度:組間自由度:組內(nèi)自由度:組間自由度又可以分解成為A、B和A*B三個部分,即③計算A、B和A*B的方差:④計算F值:A因素:B因素:A*B:(3)統(tǒng)計決斷有時需要進(jìn)一步檢驗A因素的兩種水平a和a在B因素b和b水平上差異的顯著性;或者檢驗B因素b和b在A因素a和a水平上差異的顯著性。仍可用F檢驗法。其簡要步驟如下。①求平方和:A因素在b水平上的平方和為:A因素在b水平上的平方和為:B因素在a水平上的平方和為:B因素在a水平上的平方和為:②計算自由度:③求方差:④計算F值:第九章總體比率的推斷第一節(jié)比率的抽樣分布一、數(shù)據(jù)的特點對點計數(shù)據(jù)的統(tǒng)計推斷,應(yīng)采用總體比率的推斷方法或卡方檢驗.當(dāng)事物僅被劃分成兩類,可用總體比率的推斷進(jìn)行統(tǒng)計推斷;當(dāng)事物被劃分為成兩類以上時,則需用卡方檢驗進(jìn)行統(tǒng)計推斷。當(dāng)然卡方檢驗也可以對僅有兩種類別的資料進(jìn)行統(tǒng)計推斷。二、比率的抽樣分布比率的抽樣分布是二項分布.當(dāng)p=q,無論n的大小,二項分布呈對稱形;當(dāng)p〈q且np≥5,或p〉q且np≥5時,二項分布已經(jīng)開始接近正態(tài)分布。三、比率的標(biāo)準(zhǔn)誤比率的標(biāo)準(zhǔn)誤是由二項分布的標(biāo)準(zhǔn)差除以n而獲得。比率的標(biāo)準(zhǔn)誤:當(dāng)總體比率未知時,需用樣本比率作為總體比率的估計。于是總體比率標(biāo)準(zhǔn)誤的估計量為:第二節(jié)總體比率的區(qū)間估計根據(jù)一定概率的要求,估計總體比率的所在范圍,稱為總體比率的區(qū)間估計。一、正態(tài)近似法公式(9.3):公式(9。4):公式(9.5):二、查表法用附表6已將,的二項分布置信限列入其中.第三節(jié)總體比率的假設(shè)檢驗一、正態(tài)近似法當(dāng)P=Q,無論N的大小;或者NP、NQ其中一個最小頻數(shù)等于或大于5,這時二項分布近似于正態(tài)分布,可以用Z檢驗總體比率的顯著性.檢驗的步驟:(1)提出假設(shè):(2)選擇檢驗統(tǒng)計量并計算其值:公式(9.6):公式(9。7):(將公式(9.6)等號右邊分子和分母乘以N.)二、查表法由于最小頻數(shù)NP=4小于5的二項分布呈偏態(tài),對于總體比率的顯著性檢驗不能用正態(tài)分布處理,可通過查百分率的可信限表(附表6),求二項分布的兩端臨界值加以解決。第四節(jié)總體比率差異的顯著性檢驗一、兩個獨立樣本比率差異的顯著性檢驗兩個獨立樣本比率差異的標(biāo)準(zhǔn)誤:公式(9.8):當(dāng)N1=N2時,公式(9.10):當(dāng)N1不等于N2時,公式(9.9):如果兩個獨立樣本的最小頻數(shù)都等于或大于5,兩個樣本比率之差的抽樣分布也接近于正態(tài),于是可用Z檢驗兩個比率之差的顯著性。其檢驗統(tǒng)計量為公式(9.11)。二、兩個相關(guān)樣本比率差異的顯著性檢驗兩個相關(guān)樣本比率之差的檢驗公式為(9.13):第十章卡方檢驗第一節(jié)χ2及其分布一、卡方檢驗的特點卡方檢驗是對樣本的頻數(shù)分布所來自的總體分布是否服從某種理論分布或某種假設(shè)分布所作的假設(shè)檢驗。即根據(jù)樣本的頻數(shù)分布來推斷總體的分布。它屬于自由分布的非參數(shù)檢驗。它可以處理一個因素分為多種類別,或多種因素各有多種類別的資料。所以,凡是可以應(yīng)用比率進(jìn)行檢驗的資料,都可以用卡方檢驗。二、卡方檢驗的統(tǒng)計量卡方檢驗統(tǒng)計量的基本形式為:公式(10.1):χ2值有以下幾個特點:(1)χ2值具有可加性。(2)χ2值永遠(yuǎn)是正值。(3)χ2值的大小隨實際頻數(shù)與理論頻數(shù)差的大小而變化。三、χ2的抽樣分布χ2分布有以下幾個特點:(1)χ2分布呈正偏態(tài),右側(cè)無限延伸,但永不與基線相交。(2)χ2分布隨自由度的變化而形成一簇分布形態(tài)。自由度越小,χ2分布偏斜度越大;自由度越大,χ2分布形態(tài)越趨于對稱。第二節(jié)單向表的卡方檢驗把實得的點計數(shù)據(jù)按一種分類標(biāo)準(zhǔn)編制成表就是單向表。對于單向表的數(shù)據(jù)所進(jìn)行的卡方檢驗就是單向表的卡方檢驗,即單因素的卡方檢驗。一、按一定比率決定理論頻數(shù)的卡方檢驗注意:單向χ2的自由度一般等于組數(shù)減1,即,因為它受到一個因子的限制。二、一個自由度的卡方檢驗當(dāng)df=1,其中只有一個組的ft<5,就要運用亞茨連續(xù)性校正法公式(10。2):三、頻數(shù)分布正態(tài)性的卡方檢驗(1)提出假設(shè):(2)計算χ2值:①將各組的上下限轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)Z值:②求平均值至各組限間的面積③求各組的正態(tài)面積④將各組的正態(tài)面積與總頻數(shù)相乘,求各組的理論頻數(shù)。(3)統(tǒng)計決斷:正態(tài)χ2檢驗的自由度.這是因為第三節(jié)雙向表的卡方檢驗把實得的點計數(shù)據(jù)按兩種分類標(biāo)準(zhǔn)編制成的表就是雙向表.對雙向表的數(shù)據(jù)進(jìn)行的卡方檢驗,就是雙向表的卡方檢驗,即雙因素的卡方檢驗.在雙向表的卡方檢驗中,如果要判斷兩種分類特征,即兩個因素之間是否有依從關(guān)系,這種檢驗稱為獨立性卡方檢驗。在雙向表卡方檢驗中,如果是判斷幾次重復(fù)實驗的結(jié)果是否相同,這種卡方檢驗稱為同質(zhì)性檢驗.雙向表的獨立性卡方檢驗和同質(zhì)性卡方檢驗,只是檢驗的意義不同,而方法完全相同,都應(yīng)用公式(10。3):公式(10.4):對于同一組數(shù)據(jù)所進(jìn)行的卡方檢驗,有時即可以理解為獨立性卡方檢驗,又可以理解為同質(zhì)性檢驗,兩者無本質(zhì)區(qū)別。注意:rc表的自由度為公式(10。5):第四節(jié)四格表的卡方檢驗一、獨立樣本四格表的卡方檢驗獨立樣本四格表的卡方檢驗,就是雙向表中2*2表的卡方檢驗。它即可以用縮減公式由實際頻數(shù)直接計算χ2值,又可以用上述求理論頻數(shù)的方法計算χ2值。1??s減公式χ2值的計算獨立樣本四格表χ2值的縮減公式為(10.6):2.校正χ2值的計算當(dāng)df=1,樣本容量總和N〈30或N<50時(決定于對檢驗結(jié)果要求的嚴(yán)格程度),應(yīng)對χ2值進(jìn)行亞茨連續(xù)性校正。其校正公式為(10.7):二、相關(guān)樣本四格表的卡方檢驗1??s減公式χ2值的計算相關(guān)樣本四格表χ2值的縮減公式為(10.8):2.校正χ2值的計算當(dāng)df=1,兩個相關(guān)樣本四格表中(b+c)<30或(b+c)<50(決定于對檢驗結(jié)果要求的嚴(yán)格程度),應(yīng)對χ2值進(jìn)行亞茨連續(xù)性校正。其校正公式(10.9):第十一章相關(guān)分析第一節(jié)相關(guān)的意義一、相關(guān)的概念兩個變量之間不精確、不穩(wěn)定的變化關(guān)系稱為相關(guān)關(guān)系.二、相關(guān)系數(shù)用來描述兩個變量相互之間變化方向及密切程度的數(shù)字特征量稱為相關(guān)系數(shù).一般用r表示。相關(guān)系數(shù)的值,僅僅是一個比值.它不是由相等單位度量而來(即不等距),也不是百分比,因此,不能直接作加、減、乘、除。相關(guān)系數(shù)只能描述兩個變量之間的變化方向及密切程度,并不能揭示二者之間的內(nèi)在本質(zhì)聯(lián)系.第二節(jié)積差相關(guān)一、概念及其適用范圍1.積差相關(guān)的概念當(dāng)兩個變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系,表示這兩個變量之間的相關(guān)稱為積差相關(guān)。2.積差相關(guān)使用的條件(1)兩個變量都是由測量獲得的連續(xù)性數(shù)據(jù)。(2)兩個變量的總體都是呈正態(tài)分布,或接近正態(tài)分布。(判斷正態(tài)分布的其中之一的方法是檢驗)(3)必須是成對數(shù)據(jù),而且每對數(shù)據(jù)間相互獨立。(4)兩個變量之間呈線性關(guān)系.(5)要排除共變因素的影響。(6)樣本容量要大于或等于30。3。積差相關(guān)的定義公式:公式(11。1):但是協(xié)方差是帶有具體單位的絕對數(shù)量,它不能與單位不同的資料相比較。為了使協(xié)方差變成相對數(shù),能夠與不同單位的資料相比較,則就有了積差相關(guān)系數(shù)r.公式(11.2):二、積差相關(guān)的幾種計算方法:1。用原始數(shù)據(jù)計算:公式(11.3):2.當(dāng)只有平均數(shù)和標(biāo)準(zhǔn)差時:公式(11。4):公式(11。5):三、相關(guān)系數(shù)的等距轉(zhuǎn)換及其合并:(1)將相關(guān)系數(shù)r轉(zhuǎn)換成Zr:利用r與Zr轉(zhuǎn)換表,根據(jù)r值尋找相應(yīng)的Zr值.(2)求Zr的平均數(shù)Zr:公式(11.7):(3)將Zr轉(zhuǎn)換成r:用r與Zr轉(zhuǎn)換表四、相關(guān)系數(shù)的顯著性檢驗:相關(guān)系數(shù)顯著性檢驗的步驟及方法:1、Ho:P=0條件下,相關(guān)系數(shù)的顯著性檢驗:(1)當(dāng)?shù)那闆r:(當(dāng)時,r的抽樣分布接近于正態(tài)分布,其標(biāo)準(zhǔn)誤為:)檢驗步驟:第十二章回歸分析第一節(jié)一元線性回歸一元線性回歸是指只有一個自變量的線性回歸。一、回歸線一條最能代表散點圖上分布趨勢的直線,這條最優(yōu)擬合線即稱為回歸線。常用的擬合這條回歸線的原則,就是使各點與該線縱向距離的平方和為最小.二、回歸方程確定回歸線的方程稱回歸方程.1.用最小二乘方法求回歸系數(shù)公式(12。2a)或(12.2b).2.求截距公式(12.3a)或(12。3b)。三、用原始數(shù)據(jù)計算回歸系數(shù)公式(12.4a)或(12。4b).第二節(jié)一元線性回歸方程的檢驗一、估計誤差的標(biāo)準(zhǔn)差公式(12。9)。二、一元線性回歸方程檢驗的方法一元線性回歸方程檢驗有三種等效的方法:(1)對回歸方程進(jìn)行方差分析;(2)對兩個變量的相關(guān)系數(shù)進(jìn)行與總體零相關(guān)的顯著性檢驗;(3)對回歸系數(shù)進(jìn)行顯著性檢驗三、一元線性回歸系數(shù)顯著性檢驗方法在回歸線上,當(dāng)與所有自變量X相對應(yīng)的各組因變量Y的殘值都呈正態(tài)分布,并且殘值方差為齊性時,由X估計Y回歸系數(shù)的標(biāo)準(zhǔn)誤為公式(12。11)或(12.12)??梢杂霉?12.13)或公式(12.14)進(jìn)行顯著性檢驗。三、測定系數(shù)測定系數(shù)指回歸平方和在總平方和中所占比例,這個比例越大,意味著誤差平方和所占比例越小,預(yù)測效果就越好。測定系數(shù)同時等于相關(guān)系數(shù)的平方。第三節(jié)一元線性回歸方程的應(yīng)用一、用樣本回歸方程推算因變量的回歸值二、對因變量真值的預(yù)測第四節(jié)多元線性回歸簡介一、二元線性回歸方程1.二元線性回歸方程的意義二元線性回歸方程是指Y對X1與X2的線性回歸方程。2.二元線性回歸方程的建立原理和一元線性回歸方程一樣,二元線性回歸方程也用最小二乘法來確定回歸系數(shù)。用公式(12。25a)和(12。25b)。3.二元線性標(biāo)準(zhǔn)回歸方程為了比較兩個自變量在估計預(yù)測因變量時所起作用的大小,需要將三個變量分別轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù),然后比較由標(biāo)準(zhǔn)分?jǐn)?shù)所建立的標(biāo)準(zhǔn)回歸方程中的兩個標(biāo)準(zhǔn)回歸系數(shù),以此判斷兩個自變量作用的大小.二、二元線性回歸的檢驗二元線性回歸的檢驗包括兩個方面:一是檢驗回歸方程的顯著性;另一是檢驗兩個偏回歸系數(shù)的顯著性.(一)二元線性回歸的檢驗二元線性回歸方程的顯著性有兩種等效的檢驗方法:一是方差分析,二是復(fù)相關(guān)系數(shù)顯著性檢驗.復(fù)相關(guān)系數(shù)表示兩個自變量組合起來與因變量之間的相關(guān)程度??赏ㄟ^對二元測定系數(shù)開平方根得到,然后通過查表進(jìn)行顯著性檢驗。(二)偏回歸系數(shù)的顯著性檢驗兩個偏回歸系數(shù)的顯著性檢驗公式為(12.29a)和(12。29b).三、多元線性回歸方程中自變量的選擇1.從組成回歸方程的所有自變量中選擇最優(yōu)的自變量對所有可能的回歸方程逐一檢驗,選擇一個顯著性程度最強(qiáng)的方程。2.逐步回歸逐步回歸的原理是按每個自變量對因變量的作用,從大到小逐個地引入回歸方程,每引入一個自變量要對回歸方程中的每一個自變量都進(jìn)行顯著性檢驗(即對其偏回歸系數(shù)進(jìn)行顯著性檢驗).這樣逐步地引入自變量,并剔除不顯著的自變量,直至將所有的自變量都引入,并將不顯著的自變量都剔除為止,最后形成的回歸方程就是最優(yōu)方程。第十三章非參數(shù)檢驗假設(shè)檢驗的方法有兩種:參數(shù)檢驗和非參數(shù)檢驗。在實際研究工作中,樣本所屬的總體分布形態(tài)一般是未知的,所獲得的資料也不一定是等距變量或比率變量,因此需要采用新的統(tǒng)計方法進(jìn)行檢驗。這種檢驗方法不要求樣本所屬的總體呈正態(tài)分布,一般也不是對總體進(jìn)行檢驗,故稱之為自由分布的非參數(shù)檢驗方法。非參數(shù)檢驗不僅適用于非正態(tài)總體名義變量和次序變量的資料,而且也適用于正態(tài)總體等距變量和比率變量的資料。故應(yīng)用廣泛,但靈敏度和精確度不如參數(shù)檢驗.第一節(jié)符號檢驗符號檢驗是通過對兩個相關(guān)樣本的每對數(shù)據(jù)之差的符號(正號或負(fù)號)進(jìn)行檢驗,以比較這兩個樣本差異的顯著性。一、小樣本的情況當(dāng)樣本容量較小,n<25時,可用查表法進(jìn)行符號檢驗。(注意:r值越大于r的臨界值,差異越顯著,這與參數(shù)檢驗不同)二、大樣本的情況對差數(shù)的正號與負(fù)號差異的檢驗本屬于二項分布的問題,當(dāng)樣本容量較大,即n>25時,二項分布接近正態(tài)分布,因此可以用正態(tài)分布近似處理,公式用(13。2).符號檢驗的優(yōu)點:無須對所要檢驗的兩個總體分布形態(tài)和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專項購買服務(wù)合同范本
- 公司聘請物業(yè)合同范本
- 2025年安徽道路貨運駕駛員從業(yè)資格證考試題庫
- 前臺用工合同范本
- 辦公桌椅合同范本
- 中標(biāo)平臺合同范本
- 中鐵高速公路合同范本
- 加氣砌塊合同范本
- 勞務(wù)醫(yī)院合同范本
- 公司車輛供貨合同范例
- 2025年湖南鐵路科技職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫參考答案
- 酒店長包房租賃協(xié)議書范本
- 2025年幾內(nèi)亞水泥廠項目投資可行性報告
- 【道法】開學(xué)第一課 課件-2024-2025學(xué)年統(tǒng)編版道德與法治七年級下冊
- 口腔門診分診流程
- 提高設(shè)備基礎(chǔ)預(yù)埋螺栓一次安裝合格率
- 2025年春新外研版(三起)英語三年級下冊課件 Unit2第1課時Startup
- 中華民族共同體概論專家講座第一講中華民族共同體基礎(chǔ)理論
- 2023年浙江省統(tǒng)招專升本考試英語真題及答案解析
- GB 9706.202-2021醫(yī)用電氣設(shè)備第2-2部分:高頻手術(shù)設(shè)備及高頻附件的基本安全和基本性能專用要求
- 幼兒園小足球活動游戲化教學(xué)的研究
評論
0/150
提交評論