版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、1統(tǒng)計學名詞解釋統(tǒng)計學名詞解釋第一章緒論第一章緒論1.1.隨機變量隨機變量:在統(tǒng)計學上,把取值之間不能預料到什么值的變量。2.2.總體總體:又稱母全體、全域,指具有某種特征的一類事物的全體。3.3.個體個體:構(gòu)成總體的每個基本單元稱為個體。4.4.樣本樣本:從總體中抽取的一部分個體,稱為總體的一個樣本。5.5.次數(shù)次數(shù):指某一事件在某一類別中出現(xiàn)的數(shù)目,又稱為頻數(shù)。6.6.頻率頻率:又稱相對次數(shù),即某一事件發(fā)生的次數(shù)被總的事件數(shù)目除,亦即某一數(shù)據(jù)出現(xiàn)的次數(shù)被這一組數(shù)據(jù)總個數(shù)去除。7.7.概率概率:某一事物或某一情在某一總體中出現(xiàn)的比率。8.8.觀測值:觀測值:一旦確定了某個值。就稱這個值為某一
2、變量的觀測值。9.9.參數(shù):參數(shù):又稱為總體參數(shù),是描述一個總體情況的統(tǒng)計指標。10.10. 統(tǒng)計量:統(tǒng)計量:樣本的那些特征值叫做統(tǒng)計量,又稱特征值。第二章統(tǒng)計圖表第二章統(tǒng)計圖表1.1.統(tǒng)計表:統(tǒng)計表:是由縱橫交叉的線條繪制,并將數(shù)據(jù)按照一定的要求整理、歸類、排列、填寫在內(nèi)的一種表格形式。一般由表號、名稱、標目、數(shù)字、表注組成。2 2 統(tǒng)計圖統(tǒng)計圖:一般采用直角坐標系,通常橫軸表示事物的組別或自變量 x,稱為分類軸??v軸表示事物出現(xiàn)的次數(shù)或因變量,稱為數(shù)值軸。一般由圖號及圖題、圖目、圖尺、圖形、圖例、圖組成。3.3. 簡單次數(shù)分布表:依據(jù)每一個分數(shù)值在一列數(shù)據(jù)中出現(xiàn)的次數(shù)或總計數(shù)資料編制成的統(tǒng)
3、計表,適合數(shù)據(jù)個數(shù)和分布范圍比較小的時候用。4.4. 分組次數(shù)分布表分組次數(shù)分布表:數(shù)據(jù)量很大時,應該把所有的數(shù)據(jù)先劃分在若干區(qū)間,然后將數(shù)據(jù)按其數(shù)值大小劃歸到相應區(qū)域的組別內(nèi),分別統(tǒng)計各個組別中包括的數(shù)據(jù)個數(shù),再用列表的形式呈現(xiàn)出來,適合數(shù)據(jù)個數(shù)和分布范圍比較大的時候用。5.5. 分組次數(shù)分布表的編制步驟:分組次數(shù)分布表的編制步驟:(1)求全距(2)定組距和組數(shù)(3)列出分組組距(4)登記次數(shù)(5)計算次數(shù)6.6. 分組次數(shù)分布的意義:分組次數(shù)分布的意義:(1)優(yōu)點:A.可將雜亂無章數(shù)據(jù)排列成序,以發(fā)現(xiàn)各數(shù)據(jù)的出現(xiàn)次數(shù)及分布狀況。B.可顯示一組數(shù)據(jù)的集中情況和差異情況等。(2)缺點:原始數(shù)據(jù)
4、不見了,從而依據(jù)這樣的統(tǒng)計表算出的平均值會與用原始數(shù)據(jù)算出的值有出入,出現(xiàn)誤差,即歸組效應。7.7. 相對次數(shù)分布表:相對次數(shù)分布表:用頻數(shù)比率或百分數(shù)來表示次數(shù)8.8. 累加次數(shù)分布表:累加次數(shù)分布表:把各組的次數(shù)由下而上,或由上而下加在一起。最后一組的累加次數(shù)等于總次數(shù)。29.9. 雙列次數(shù)分布表:雙列次數(shù)分布表:對有聯(lián)系的兩列變量用同一個表表示其次數(shù)分布。10.10.不等距次數(shù)分布表不等距次數(shù)分布表:例如工資級別,年齡分組。11.11. 直方圖:直方圖:以矩形面積表示連續(xù)性隨機變量次數(shù)分布的圖形,又稱等距直方圖,沒畫矩形時的直方圖叫組織圖。橫軸為等距分組點,縱軸為頻數(shù)。12.12. 次數(shù)
5、多邊形圖:次數(shù)多邊形圖:是一種表示連續(xù)性隨機變量次數(shù)分布的線形圖。橫軸為組中值縱軸為頻數(shù)。13.13.累加次數(shù)分布圖:累加次數(shù)分布圖:根據(jù)累加次數(shù)分布表繪制面成,分為:(1)累加直方圖:橫軸為等距分組點,縱軸為累加次數(shù)(2)累加曲線:又稱遞加線,可以連接累加直方圖各組矩形右頂點而來。橫軸為精確上限或精確下限,縱軸為累加次數(shù)。其形狀有以下三種:正偏態(tài)、負偏態(tài)和正態(tài)。例如,若一次測驗大多數(shù)人分數(shù)偏低,只有少數(shù)人才能得高分,也就是少數(shù)人的分數(shù)朝向高分一端,分布即為正偏態(tài)。14.14. 條形圖:條形圖:主要用于表示離散型數(shù)據(jù),用直條長短表示數(shù)量的大小。一個軸為分類軸,一個軸為數(shù)量軸。區(qū)別與直方圖:描述
6、數(shù)據(jù)不同,表示數(shù)據(jù)的方式不同,標尺分點意義不同,圖形形狀不同。15.15. 圓形圖:圓形圖:也叫餅圖,用于表示間斷性資料,表示各部分在整體中所占比重大16.16. 線形圖線形圖(折線圖、曲線圖):(1)更多用于表示連續(xù)數(shù)據(jù)的函數(shù)關系:(2)描述某種現(xiàn)象在時間上的愛展趨勢:(3)描述種二種理多變化的。17.17. 散點圖:散點圖:用圓點多少和分布疏密來表示兩個變量的相關程度18.18. 莖葉圖:莖葉圖:當觀測數(shù)據(jù)不是很多時使用,莖代表觀測值中位數(shù)部分,時代個位數(shù)部分。主要優(yōu)點是既保留了全部原始數(shù)據(jù),又呈現(xiàn)出直方圖的形式,具有次數(shù)分布表與直方圖的雙重優(yōu)點。19.19. 箱型圖箱型圖:是一種用作顯示
7、一組數(shù)據(jù)分散情況的統(tǒng)計圖,主要包含上邊緣,上四分位數(shù),中位數(shù),下四分位數(shù),下邊緣,異常值這六個節(jié)點。第三章集中量數(shù)第三章集中量數(shù)1、集中趨勢:集中趨勢:指數(shù)據(jù)分布中大量數(shù)據(jù)向某方向集中的程度。2、集中量數(shù)集中量數(shù):指描述一組數(shù)據(jù)集中趨勢特點的統(tǒng)計量。3、算術平均數(shù):算術平均數(shù):所有觀察值的總和除以總頻數(shù)得到的商,一般簡稱為平均數(shù)或均數(shù)、均值。一般用字母 M 表示,如果是由 X 變量計算的,就記為X,若由Y 變量求得,則記為Y。4、中數(shù)中數(shù):是按順序排列在一起的一組數(shù)據(jù)中居于中間位置的數(shù),即在這組數(shù)據(jù)中,有一半的數(shù)據(jù)比它大,有一半的數(shù)據(jù)比它小。又稱中點數(shù),中位數(shù),中值,符號為 Md 或 Mdn。
8、5、眾數(shù)眾數(shù):指在次數(shù)分布中出現(xiàn)頻次最多的那個數(shù)的數(shù)值。又稱為范數(shù),密集數(shù),通常數(shù)等,常用符號 M。6、加權平均數(shù)加權平均數(shù):指根據(jù)每個數(shù)據(jù)的權重計算的平均數(shù),解決各個平均數(shù)求整體平均數(shù)之類的問題。7、幾何平均數(shù)幾何平均數(shù):指成幾何級數(shù)增長的變量值的平均數(shù),適合于計算平均比率3和平均發(fā)展速度,又稱對數(shù)平均數(shù)。8、調(diào)和平均數(shù)調(diào)和平均數(shù):指將各個數(shù)據(jù)取倒數(shù)平均后再取倒數(shù)計算得到的平均數(shù),又稱倒數(shù)平均數(shù)。主要用來描述學習速度方面的問題。9、最小平方原理最小平方原理:只有各個變量與平均數(shù)之差的平均和為最小,即每個數(shù)據(jù)與任一常數(shù)包括中數(shù)或眾數(shù)之差的平方和都大于每個數(shù)據(jù)與平均數(shù)之差的平方和。第四章差異量數(shù)
9、第四章差異量數(shù)1. 差異量數(shù)差異量數(shù):也稱離散量數(shù)。就是對一組數(shù)據(jù)的變異性,即離中趨勢特點進行度量和描述的統(tǒng)計量。2. 百分位數(shù)百分位數(shù):指量尺上的一個點,自此點以下,包括數(shù)據(jù)分布中全部數(shù)據(jù)個數(shù)的一定百分比。3. 百分等級百分等級:利用百分位數(shù)的計算公式也可以計算出任意分數(shù)在整個分數(shù)分布中所處的百分位置,稱為該分數(shù)的百分等級。4. 平均差平均差:是次數(shù)分布中所有原始數(shù)據(jù)與平均數(shù)絕對離差的平均值,用 A.D.或 M.D.表示。5. 離均差離均差:表示了每一個觀測值與平均數(shù)的距離大小,正負號說明了重量施于什么方向,離均差的總和為零,標志著完全平衡。有時簡稱為離差或偏差。6. 方差:方差:也稱變異數(shù)
10、、均方。作為統(tǒng)計樣本量,用符號 S2 表示,作為總體參數(shù),用符號。表示。它是每個數(shù)據(jù)與該組數(shù)據(jù)平均數(shù)之差乘方后的均值即離均差平方后的平均數(shù)。7. 標準差:標準差:即方差的平方根,用 s 或 SD 表示,若用。表示,則是指總體的標準差。8. 差異系數(shù):差異系數(shù):又稱變異系數(shù)、相對標準差等,它是一種相對差異量,用 CV表示,為標準差對平均數(shù)的百分比。9. 標準分數(shù)標準分數(shù):又稱基分數(shù)或 Z 分數(shù),是以標準差為單位表示一個原始分數(shù)在團體中所處位置的相對位置量數(shù)。(12 年真題)第五章相關關系第五章相關關系1、相關:相關:事物之間的相互關系大致有三種,.因果關系、共變關系和相關關系;統(tǒng)計學中所講的相關
11、是指具有相關關系的不同現(xiàn)象之間的關系程度,分為正相關、負相關和零相關。2、相關系數(shù)相關系數(shù):是兩列變量間相關程度的數(shù)字表現(xiàn)形式,或者說是用來表示相關關系強度的指標。常用 r 表示樣本相關系數(shù),用希臘字母 P 表示總體參數(shù)。取值情況為-1.00WrW1.00。3、相關分析相關分析:相關密切與否的判定在判定相關是否密切時,要把樣本量大小與相關系數(shù)取值大小綜合起來考慮,一般要經(jīng)過統(tǒng)計檢驗方能確定變量之間是否存在顯著的相關。另外,若是非線性相關關系,而用直線相關計算 r 值,可能很小,但不能說兩變量關系不密切。4、積差相關積差相關:簡稱皮爾遜相關,又稱積距相關。人們把離均差乘方之和除以N 叫做“距”,
12、把 X 的離均差和 Y 的離均差這二者積的總和除以 N,用“積距”概念表示。積差相關是運用較為普遍的計算相關系數(shù)的方法。45、等級相關等級相關:等級相關是以等級次序排列的變量之間的相關,這種相關對變量的總體分布不作要求,故這類相關為非參數(shù)相關。6、質(zhì)量相關質(zhì)量相關:指一列變量為等比或等距的測量變量,另一列變量是按性質(zhì)劃分的變量,求這兩個變量之間的直線相關稱為質(zhì)量相關。它主要包括:點二列相關、二列相關、多系列相關。7、點二列相關點二列相關:如果在兩個變量中,一個變量是等比或等距的測量變量且其總體為正態(tài),另一變量為“二分”稱名變量(如男女、已婚與未婚等),這兩個變量之間的直線相關稱做點二列相關。8
13、、二列相關二列相關:當兩個變量為正態(tài)連續(xù)變量,其中一個變量被人為地劃分為二分變量,這兩個變量之間的相關稱為二列相關。如測驗成績分為及格與不及格,身體狀態(tài)分為健康與不健康兩類。9、多列相關多列相關:兩個正態(tài)連續(xù)變量,其中一個變量被人為地劃分成多種類別,如學習成績被分為優(yōu)、良、中、差四類,表示這兩種變量之間的相關稱為多系列相關。1010、四分相關:兩因素本身都是連續(xù)的正態(tài)變量,分別為人為劃分為兩種不同類、四分相關:兩因素本身都是連續(xù)的正態(tài)變量,分別為人為劃分為兩種不同類別,這類四格表大都用于同一個被試樣本中,分別調(diào)查四個不同因素兩項分類的別,這類四格表大都用于同一個被試樣本中,分別調(diào)查四個不同因素
14、兩項分類的情況情況第六章概率分布第六章概率分布1.1.概率:概率:隨機是指在一定條件下可能出現(xiàn)也可能不出現(xiàn)的,表明隨機事件出現(xiàn)可能性大小的客觀指標就是概率它是概率論研究的主要內(nèi)容。概率的定義有兩種,即后驗概率和先驗概率。2 2 概率的基本性質(zhì):概率的基本性質(zhì):(1)任何一個隨機事件 A 的概率都是非負的。(2) 在一定條件下必然發(fā)生的必然事件的概率為 1。(3) 在一定條件下必然不發(fā)生的時間, 即不可能事件的概率為 0。3 3 互不相容事件互不相容事件:指在一次實驗和調(diào)查中,若事件 A 發(fā)生則事件 B 就一定不發(fā)生,否則二者為相容事件。4.4. 獨立事件:獨立事件:指一個事件的出現(xiàn)對另一個事件
15、的出現(xiàn)不發(fā)生影響。5.5. 概率分布類型概率分布類型:是指對隨機變量取值的概率分布情況用數(shù)學方法(函數(shù))進行描述。主要有離散分布與連續(xù)分布,經(jīng)驗分布與理論分布,基本隨機變量分布與抽樣分布。6.6. (16 年真題正態(tài)分布正態(tài)分布:也稱常態(tài)分布或常態(tài)分配,是連續(xù)隨機變量概率分布的一種,是在數(shù)理統(tǒng)計的理論與實際應用中占有最重要地位的一種理論分布。正態(tài)分布的特征正態(tài)分布的特征: (1)正態(tài)分布的形式是對稱的(但對稱的不一定是正態(tài)的 ,它的對稱軸是經(jīng)過平均數(shù)點的垂線。正態(tài)分布中,平均數(shù),眾數(shù),中數(shù)三者相等,此點 y 值最大。(2)正態(tài)分布的中央點最高,然后逐漸向兩側(cè)下降,曲線的形式是先向內(nèi)彎,然后向外
16、彎,拐點位于正負 1 個標準差處,曲線兩端向靠近基線處無限延伸,但終不能與基線相交。(3) 正態(tài)曲線下的面積為 1,由于它在平均數(shù)處左右對稱,故過平均數(shù)點的垂線將正態(tài)分布下的面積劃分為相等的兩部分,即各為 0.50。(4) 正態(tài)分布為一族分布。它隨隨機變量的平均數(shù),標準差的大小與單位不同5而有不同的分布形態(tài)。(5)正態(tài)分布中各差異量數(shù)值相互間有固定比率。(6)在正態(tài)分布曲線下,標準差與概率有一定的數(shù)量關系。7.7.二項分布:二項分布:又叫貝努里分布,是一種具有廣泛用途的離散型隨機變量的概率分布。具體定義是(次處不太確定):設有 n 次試驗,各次試驗都是彼此獨立的, 每次試驗某事件出現(xiàn)的概率都是
17、 P, 某事件不出現(xiàn)的概率都是 q (等于 1-P) 。需滿足以下條件:需滿足以下條件:(1)任何一次實驗恰好有兩個結(jié)果,成功與失敗,(2)共有 n 次試驗,并且 n 是預先給定的任一正整數(shù),(3)每次試驗各自獨立,各次試驗之間無相互影響。(4)某種結(jié)果出現(xiàn)的概率在任何一次試驗中都是固定的。第七章參數(shù)估計第七章參數(shù)估計1.1. 參數(shù)估計參數(shù)估計: :當在研究中以樣本獲得一組數(shù)據(jù)后,如何通過這組信息,對總體特征進行估計。也就是如何以局部結(jié)果推論總體的情況,稱為總體參數(shù)估計。2.2. 點估計點估計: :是用樣本統(tǒng)計量來估計總體參數(shù),因為樣本統(tǒng)計量為數(shù)軸上某一點值,估計的結(jié)果也以一個點的數(shù)值表示,所
18、以稱為點估計。3.3. 區(qū)間估計區(qū)間估計: :根據(jù)估計量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范圍,它是用數(shù)軸上的一段距離表示未知參數(shù)可能落入的范圍,它雖不具體指出總體參數(shù)等于什么,但能指出未知總體參數(shù)落入某一區(qū)間的概率有多大。(2011 年真題)4.4. 置信區(qū)間置信區(qū)間(置信間距置信間距): :是指在某一位置信度時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度。置信區(qū)間的上下二端點值稱為置信界限。5 5 顯著性水平顯著性水平: :指估計總體參數(shù)落在某一區(qū)間時,可能犯錯誤的概率,用 a 表示。1a 為置信度或置信水平。6 6 區(qū)間估計和假設性檢驗的關系。區(qū)間估計和假設性檢驗的關系。20132013 簡答簡
19、答聯(lián)系:聯(lián)系:1都是根據(jù)樣本信息推斷總體2都是抽樣分布理論為依據(jù),建立在概率論之上的推斷區(qū)別區(qū)別:1參數(shù)估計是以樣本資料估計總體參數(shù)的真值,假設檢驗是以樣本資料檢驗對總體參數(shù)的先驗假設是否成立2區(qū)間估計求得的是以樣本估計值為中心的雙側(cè)置信區(qū)間,假設檢驗既有雙側(cè)檢驗,也有單側(cè)檢驗3區(qū)間估計立足于大概率,假設檢驗立足于小概率7.7.完全隨機設計和隨機區(qū)組設計的關系完全隨機設計和隨機區(qū)組設計的關系完全隨機設計和隨機區(qū)組設計的分組方式不同完全隨機設計和隨機區(qū)組設計的分組方式不同完全隨機設計把被試分為若干組,每組分別接受一種實驗處理,有幾種處理,就相應地有幾組被試,即不同的被試接受不同自變量水平的實驗處
20、理;隨機區(qū)組設計根據(jù)被試特點,將被試分為幾個區(qū)組,再根據(jù)自變量水平數(shù)在每一個區(qū)組內(nèi)劃分若干小區(qū),同一區(qū)組接受不同處理,設計原則是同一區(qū)組被試應盡量同質(zhì),區(qū)組間可以異質(zhì)。6完全隨機設計與隨機區(qū)組設計的設計思想不同完全隨機設計與隨機區(qū)組設計的設計思想不同完全隨機設計為單因素設計,僅考慮處理因素隨機區(qū)組設計為雙因素設計,考慮的因素有兩個,一個是處理因素,一個是區(qū)組因素8.8.估計總體平均數(shù)的步驟估計總體平均數(shù)的步驟詳細請參考 p201 頁第八章假設檢驗第八章假設檢驗1、差異顯著差異顯著:當兩個事物之間出現(xiàn)差異時,有可能是抽樣誤差,也有可能是實質(zhì)性的差異,如果經(jīng)過統(tǒng)計檢驗發(fā)現(xiàn)差異超過了統(tǒng)計學所規(guī)定的某
21、一誤差限度時,則表示差異已經(jīng)不屬于抽樣誤差了,統(tǒng)計上將這樣的情況稱為差異顯著,反之即是差異不顯著。2、假設檢驗假設檢驗:在統(tǒng)計學中,通過的樣本統(tǒng)計量得出的差異做出一般性結(jié)論,判斷總體參數(shù)之間是否存在差異,這種推論過程稱為假設檢驗。3、假設與假設檢驗:假設與假設檢驗:假設一般專指統(tǒng)計學屬于對總體參數(shù)所作的假定性說明。在進行任何一項研究時,都需要根據(jù)已有的經(jīng)驗和理論先對研究結(jié)果作出一種預想的希望證實的假設。這種假設叫科學假設,記作 H1,又叫備擇假設。由于證實遠比證偽困難,在統(tǒng)計學中,不對 H1 的真實性直接檢驗,需要建立與其對立的假設,成為虛無假設,記作 H0。假設檢驗的問題就是要判斷虛無假設是
22、否正確,因此虛無假設就是統(tǒng)計推論的出發(fā)點。注意注意:備擇假設總是要假設對比兩者間是有差異的,例如單總體檢驗樣本均值與總體均值是否有差異時,我們的備擇假設就是 XH 卩,對應備擇假設,虛無假設總是假設兩者并無差異,即表示為 X=卩。4、顯著性水平顯著性水平:指的是拒絕虛無假設的小概率值,用 a 表示。也就是說,如果一件事情發(fā)生的概率小于我們設定的這么一個顯著性水平,我們就將其歸為“小概率事件”,也就是認為它是一件“幾乎不可能發(fā)生”的事件。5、小概率原理:小概率原理:假設檢驗的基本思想是概率性質(zhì)的反證法,基于統(tǒng)計學中廣泛采用的小概率原理,該原理認為“小概率事件在一次實驗中幾乎是不可能發(fā)生的”, 由
23、此假設檢驗首先假定虛無假設為真, 在虛無假設為真的前提下,若導致了違反常理或不合理的現(xiàn)象出現(xiàn),則表明“虛無假設為真”的假定錯誤,必須拒絕虛無假設。而若沒有,那就認為“虛無假設為真”是正確的,即要接受虛無假設。6 6、假設檢驗中的兩類錯誤、假設檢驗中的兩類錯誤(1)(1) I I 類錯誤類錯誤:當 H0 為真,而按照概率法則,需將落入拒絕區(qū)域的假設判定為假,統(tǒng)計學中將這類拒絕 H0 時所犯的錯誤,也叫 a 類錯誤。(2)(2) IIII 類錯誤:類錯誤:如果平均值未落入拒絕區(qū)域,但按照小概率原理,要接受H0(等距拒絕 H1)時,所犯的錯誤,也叫 B 類錯誤。77、差異顯著差異顯著:經(jīng)過檢驗,如果
24、所得差異超過了統(tǒng)計學規(guī)定的某一誤差限度,則表明這個差異已不屬于抽樣誤差,而是總體上確有差異,這種情況叫做差異顯著。8 8、兩類錯誤的關系:、兩類錯誤的關系:(1) a+B 不一定等于 1;(2) 在其他條件不變的情況下,a 與 B 不可能同時減小或增大。(3) 統(tǒng)計檢驗力與兩種密切相關。9 9、影響影響 B B 錯誤的因素錯誤的因素:II 型錯誤與 I 型錯誤不同,影響 B 值大小的因素主要有三:一、在參數(shù)檢驗中,B 依賴于參數(shù)的實際值與假設值之間的距離,兩者相差越大,B 越小;二、a 越小,B 就越大;三、當 a 與 n 固定時,根據(jù)研究問題的性質(zhì)選擇適當?shù)臋z驗類型可以減少 B1010、雙側(cè)
25、檢驗與單側(cè)檢驗、雙側(cè)檢驗與單側(cè)檢驗(1)(1)雙側(cè)檢驗雙側(cè)檢驗:是指推斷差異是否存在,而不斷言差異的方向。其顯著性水平標記為:a=0.05/2 或 a=0.01/2(2)(2)單側(cè)檢驗單側(cè)檢驗:是研究者根據(jù)已有的資料事先能夠預料到誰優(yōu)誰劣,檢驗只是為了進一步確證而選擇的方法。(即是說研究者已經(jīng)不只能夠判斷出“有差異”,而且可以判斷出“A 比 B 好/優(yōu)/大/快”的情況下所采用的方法)1111、假設檢驗的基本步驟、假設檢驗的基本步驟(1) 根據(jù)問題要求,提出虛無假設和備擇假設(2) 選擇適當?shù)臋z驗統(tǒng)計量(3) 規(guī)定顯著水平 a(4) 計算檢驗統(tǒng)計的值(5) 作出決策1212、平均數(shù)的顯著性檢驗:
26、、平均數(shù)的顯著性檢驗:是對樣本平均數(shù)與總體平均數(shù)之間差異進行的顯著性檢驗。樣本類型:分為獨立樣本和相關樣本樣本類型:分為獨立樣本和相關樣本(1)(1)獨立樣本獨立樣本:即兩個互不相關的樣本,往往來自不同總體,即是不同組別間相同性質(zhì)的比較。(2)(2)相關樣本相關樣本:即兩個樣本間是存在某些聯(lián)系的,往往來自同一個總體,即是同一個組內(nèi)產(chǎn)生的兩種不同類別的數(shù)據(jù)。1313、假設檢驗與參數(shù)估計的區(qū)別與聯(lián)系、假設檢驗與參數(shù)估計的區(qū)別與聯(lián)系假設檢驗是當樣本統(tǒng)計量超過一定標準時,就說統(tǒng)計顯著,是檢驗兩事物差異是否顯著的一種方法;而參數(shù)估計是要找到總體值所可能落入的可靠范圍,是利用樣本統(tǒng)計量對總體參數(shù)所作的估計
27、。而作為兩者的代表性指標顯著性水平和置信水平也是從不同角度回答了相同的問題。第九章方差分析第九章方差分析方差分析方差分析又稱作變異分析,它是斯內(nèi)德克為了探討一個因變量和一個或多個自變量之間的關系,1946 年根據(jù)費舍的早期工作發(fā)明的一種檢驗方法。 其主要功能在于分析實驗數(shù)據(jù)中不同來源的變異對總變異的貢獻大小,從而確定實驗中的自8變量是否對因變量有重要影響。1.1.方差分析的適用條件是什么方差分析的適用條件是什么? ?主要用來檢驗什么主要用來檢驗什么? ?答:進行方差分析時有一定的條件限制,數(shù)據(jù)必須滿足以下幾個基本假定條件,否則由它得出的結(jié)論將會產(chǎn)生錯誤。方差分析的適用條件如下(1)(1)總體正
28、態(tài)分布總體正態(tài)分布方差分析同 Z 檢驗及檢驗一樣,也要求樣本必須米自正態(tài)分布的總體。在心理與教育研究領域中,大多數(shù)變量是可以假定其總體服從正態(tài)分布,一般進行方差分析時并不需要去檢驗總體分布的正態(tài)性。當有證據(jù)表明總體分布不是正態(tài)時,可以將數(shù)據(jù)做正態(tài)轉(zhuǎn)化,或采用非參數(shù)檢驗方法(2)(2)變異的相互獨立性變異的相互獨立性總變異可以分解成幾個不同來源的部分,這幾個部分變異的來源在意義上必須明確,而且彼此要相互獨立。(3)(3) 各處理內(nèi)的方差一致各處理內(nèi)的方差一致在方差分析中用 MS 作為總體組內(nèi)方差的估計值, 求組內(nèi)均方 MS.時,相當于將各個處理中的樣本方差合成,它必須滿足的一個前提條件就是,各實
29、驗處理內(nèi)的方差彼此無顯著差異。這一假定若不能滿足,原則上是不能進行方差分析的。方差分析主要用來檢驗兩組或多組資料的總體均數(shù)是否相同,檢驗兩個或多個樣本均數(shù)的差異是否有統(tǒng)計學意義。2.2.簡述方差分析法的步驟簡述方差分析法的步驟答:方差分析法的步驟是(1) 和一般的假設檢驗一樣設立零假設和研究假設;(2) 根據(jù)實驗設計的類型確定各變異源,進行相應的平方和分解,即有幾個變異源就從總平方和中分解出幾個平方和(3) 根據(jù)平方和分解得到各變異源對應的自由度,即進行總自由度的分解;(4) 根據(jù)研究的目的和實驗設計考慮要檢驗什么效應,從而將其對應的平方和比上相應的自由度得到該效應的均方,其中誤差均方必須計算
30、(5) 將各待檢驗效應的均方比上誤差的均方,計算各 F 統(tǒng)計量(6) 將計算來的各 F 統(tǒng)計量值和 F 檢驗的臨界值進行比較得出統(tǒng)計結(jié)論,其中臨界值的分子自由度和分母自由度分別是待檢驗效應的自由度和誤差自由度;(7) 如果效應檢驗結(jié)果顯著,可以進入事后檢驗,即對多水平的自變量進行多重比較考察各水平間的具體差異,如果是多因素方差分析,交互作用效應檢驗顯著,也可以進入簡單效應檢察具體考察交互作用的情況。完全隨機設計的方差分析完全隨機設計的方差分析完全隨機設計的方差分析,就是對單因素組間設計的方差分析。在這種實驗研究設計中,各種處理的分類僅以單個實驗變量為基礎,因而,把它稱為單因素方差分析或單向方差
31、分析。( (一一) ) 各實驗處理組樣本容量相同各實驗處理組樣本容量相同各實驗處理組樣本容量相同時,對于每一種實驗處理而言,它們被重復進行的次數(shù)是相同的。這種情況,也稱之為“等重復”。( (二二) ) 各實驗處理組樣本容量不同各實驗處理組樣本容量不同這種情況又稱作“不等重復”。 進行方差分析的過程與“等重復”情況基本相同。( (三三) )利用樣本統(tǒng)計量進行方差分析利用樣本統(tǒng)計量進行方差分析有時欲分析的資料只有各組的 XI、s 及 n 等樣本特征值,沒有原始數(shù)據(jù),在這種情況下要進行方差分析,關鍵在于對方差分析的思想和基本概念的理解,只要9對平方和、均方等概念真正理解,進行方差分析比用原始數(shù)據(jù)進行
32、方差分析還要簡單。計算公式依據(jù)平方和的定義公式。隨機區(qū)組設計的方差分析隨機區(qū)組設計的方差分析1隨機區(qū)組設計的方差分析,就是重復測量設計的方差分析,或稱為組內(nèi)設計的方差分析。隨機區(qū)組設計指在實驗中將實驗對象按一定的標準劃分為 n 個區(qū)組,使得區(qū)組內(nèi)的實驗對象的個別差異盡可能小,即保證區(qū)組內(nèi)的同質(zhì)性,并使每個區(qū)組均接受所有 K 個處理。且各個區(qū)組內(nèi)每個處理僅有一個觀測。其順序是隨機決定的。2隨機區(qū)組設計根據(jù)被試特點把被試劃分為幾個區(qū)組,再根據(jù)實驗變量的水平數(shù)在每一個區(qū)組內(nèi)劃分為若干個小區(qū),同一區(qū)組隨機接受不同的處理。這類實驗設計的原則是同一區(qū)組內(nèi)的被試應盡量“同質(zhì)”。每一區(qū)組內(nèi)被試的人數(shù)分配大致有
33、三種情況每一區(qū)組內(nèi)被試的人數(shù)分配大致有三種情況: :(1) 一個被試作為一個區(qū)組,這時不同的被試(區(qū)組)均需接受全部 K 個實驗處理。每人接受 K 種實驗處理的順序不同所產(chǎn)生的誤差,應該用一定的方法加以平衡。(2) 每一區(qū)組內(nèi)被試的人數(shù)是實驗處理數(shù)的整數(shù)倍。(3) 區(qū)組內(nèi)的基本單位不是個別被試,而是以一個團體為單位??傊瑢τ诿恳粎^(qū)組而言,它應該接受全部實驗處理;對于每種實驗處理而言,它在不同的區(qū)組中重復的次數(shù)應該相同。3隨機區(qū)組設計由于同一區(qū)組接受所有實驗處理,使實驗處理之間有相關,因此又稱之為相關組設計,或稱被試內(nèi)設計。與完全隨機設計相比,其最大優(yōu)點是考慮到個別差異的影響。這種由于被試之間
34、性質(zhì)不同導致產(chǎn)生的差異就稱為區(qū)組效應。隨機區(qū)組設計可以將這種影響從組內(nèi)變異中分離出來,從而提高效率。但是這種設計也有不足,主要表現(xiàn)為劃分區(qū)組困難,如果不能保證同一區(qū)組內(nèi)盡量同質(zhì),則有出現(xiàn)更大誤差的可能。事后檢驗事后檢驗一般來說,方差分析的主要目的是通過F檢驗討論組間變異在總變異中的作用,借以對兩組以上的平均數(shù)進行差異檢驗,得到一個整體性的檢驗結(jié)果。如果 F 檢驗的結(jié)果表明差異不顯著,說明實驗中的自變量對因變量沒有顯著影響。相反,如果方差分析 F 檢驗的結(jié)果表明差異顯著,拒絕了虛無假設,就表明幾個實驗處理組的兩兩比較中至少有一對平均數(shù)間的差異達到了顯著水平,至于是哪一對,方差分析并沒有回答。虛無
35、假設被拒絕的結(jié)果旦出現(xiàn),就必須對各實驗處理組的多對平均數(shù)進一步分析,做深入比較,判斷究竟是哪一對或哪幾對的差異顯著,哪幾對不顯著,確定兩變量關系的本質(zhì),這就是事后檢驗。這個統(tǒng)計分析過程也被稱作事后多重比較。為什么不能用為什么不能用 t t 檢驗對多個平均數(shù)的差異進行比較檢驗對多個平均數(shù)的差異進行比較同時比較的平均數(shù)越多,其中差異較大的一對所得 t 值超過原定臨界值 L。的概率就越大,這時 a 錯誤的概率將明顯增加,或者說本來達不到顯著性水平的差異就很容易被說成是顯著了,這時用 t 檢驗就不適宜。比如要比較 3 個總體平均數(shù)之間的差異,如果用 t 檢驗就需要比較 3(C3)次,假如每次比較的置信
36、區(qū)間為 95%,那么 3 次比較后檢驗的可靠性就降低為 0.95=0.857。目前,關于多重比較的方法有多種:如 Sche 檢驗法、Newman-Keuls 檢驗法、Dun-can 的多距檢驗法,Tukey 的可靠顯著差異法、費舍的最小顯著差異法等方法。10第十章卡方檢驗第十章卡方檢驗1.1. 卡方檢驗方法卡方檢驗方法:能處理一個因素兩項或者多項分類的實際觀察頻數(shù)與理論頻數(shù)分布是否相一致問題,或說有無顯著差異問題。2.2. 實際頻數(shù)實際頻數(shù):簡稱實計數(shù)或?qū)嶋H數(shù),是指在實驗或調(diào)查中得到的計數(shù)資料,又稱為觀察頻數(shù)。3.3. 理論次數(shù)理論次數(shù):是指根據(jù)概率原理、某種理論、某種理論次數(shù)分布或經(jīng)驗次數(shù)分
37、布計算出來的次數(shù),又稱為期望次數(shù)。4.4. 配合度檢驗配合度檢驗:主要用來檢驗一個因素多項分類的實際觀察數(shù)與某理論次數(shù)是否接近,這種卡方檢驗有時也稱無差假說檢驗。當對連續(xù)數(shù)據(jù)的正太性進行檢驗時,這種檢驗又可稱為正太吻合性檢驗。5.5. 獨立性檢驗獨立性檢驗:用來檢驗兩個或兩個以上因素各種分類之間是否有關聯(lián)或是否具有獨立性的問題。6.6. 同質(zhì)性檢驗同質(zhì)性檢驗:主要目的在于檢定不同人群母體總體在某一個變量的反應是否具有顯著差異。7.7. 期望次數(shù)期望次數(shù):虛無假設成立時的數(shù)值。8.8. 配合度檢驗配合度檢驗:主要用于檢驗單一變量的實際觀察次數(shù)分布與某理論次數(shù)是否有差別。9.9. 獨立性檢驗獨立性
38、檢驗:主要用于兩個或兩個以上因素多項分類的計數(shù)資料分析,也就是研究兩類變量之間的關聯(lián)性和依存性問題。10.10. 同質(zhì)性檢驗:同質(zhì)性檢驗:在教育與心理研究中,經(jīng)常要分析幾種因素之間是否真有實質(zhì)上的差異,或者判斷幾次重復實驗的結(jié)果是否同質(zhì),這類問題的卡方檢驗稱為同質(zhì)性檢驗。11.11. 卡方檢驗用途:卡方檢驗用途:主要用來處理某隨機變量是否服從某種特定分布、兩個樣本的總體分布是否一致、變量之間是否存在關聯(lián)性以及總體分布位置差異檢驗等問題。它也能同時檢驗一個因素兩項或多項分類的實際觀察數(shù)與某理論次數(shù)分布是否相致的問題,或說有無顯著差異問題,即檢驗樣本觀測次數(shù)(或百分比)與理論或總體次數(shù)(或百分比)
39、的差異性。理論次數(shù)的計算是卡方檢驗運算過程理論次數(shù)的計算是卡方檢驗運算過程中的關鍵。中的關鍵。第十一章非參數(shù)檢驗第十一章非參數(shù)檢驗1.1.什么是非參數(shù)檢驗?什么是非參數(shù)檢驗?非參數(shù)檢驗是對總體數(shù)據(jù)分布形態(tài)未知,研究資料大多數(shù)為分類數(shù)據(jù)的數(shù)據(jù)分析。2.2. 非參數(shù)檢驗常用的統(tǒng)計方法有哪些?非參數(shù)檢驗常用的統(tǒng)計方法有哪些?1.秩和檢驗法。秩和檢驗法。秩和就是數(shù)據(jù)等級之和。它是一種建立在秩和基礎上的非參數(shù)方法,用于兩個獨立樣本的檢驗。2.中數(shù)檢驗法中數(shù)檢驗法。用于兩個獨立樣本組之間的非參數(shù)檢驗。3.符號檢驗法。符號檢驗法。最為簡單、直觀,它不要求知道被檢驗總體的分布規(guī)律,僅僅依據(jù)某種特定的正負號數(shù)目
40、多少對總體的、中位數(shù)進行判斷和檢驗。這種方法在單樣本和兩樣本檢驗中均可米用。尤其是對實際中難以用數(shù)值確切表達的問題十分有效。4.等級方差分析等級方差分析。用于多組數(shù)據(jù)的非參數(shù)檢驗。11第十二章線性回歸第十二章線性回歸1.1.回歸分析:回歸分析:通過大量的觀測發(fā)現(xiàn)變量之間存在的統(tǒng)計規(guī)律性,并用一定的數(shù)學模型表示變量相關關系的方法。當只有一個自變量并且統(tǒng)計量成一次函數(shù)的線性關系的回歸分析叫一元線性回歸分析。2 2 最小二乘法:最小二乘法:就是如果散點圖中每一點沿 Y 軸方向到直線的距離的平方和最小,簡單講就是使誤差的平方和最小,則認為這條直線的代表性最好,它的表達式就是所要求的回歸方程。3.3.決定系數(shù)決定系數(shù):指 r 方,表示回歸平方和在總平方和中所占的比例,即回歸引起的變異在總變異中所占的比例。第十三章多變量統(tǒng)計分析簡介第十三章多變量統(tǒng)計分析簡介1.(20152015 真題真題)因素分析:是一種多變量統(tǒng)計分析方法,它
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度家具裝卸與長途運輸服務合同
- 2025年度合同委托授權在智能制造領域的應用協(xié)議
- 2025年度科技研發(fā)項目合同管理及知識產(chǎn)權保護
- 2025年度建筑業(yè)勞動合同范本:施工監(jiān)理人員合同
- 2025年度地鐵工程隧道施工與安全監(jiān)測合同
- 2025年度綜合物流樞紐掛靠工程合同協(xié)議書
- 2025年度公司單位向個人提供租車及培訓服務合同
- 2025年度建筑設備租賃與維修承包合同
- 2025年度個人車輛抵押貸款解除合同范本2篇
- 2025年度房產(chǎn)抵押貸款合同續(xù)貸合同范本
- 《梅大高速茶陽路段“5·1”塌方災害調(diào)查評估報告》專題警示學習
- 2024年09月北京中信銀行北京分行社會招考(917)筆試歷年參考題庫附帶答案詳解
- 《大健康解讀》課件
- 2025年度交通運輸規(guī)劃外聘專家咨詢協(xié)議3篇
- 2024年04月北京中信銀行北京分行社會招考(429)筆試歷年參考題庫附帶答案詳解
- 專項債券培訓課件
- 《會務的組織和管理》課件
- 2024年公司領導在新年動員會上的講話樣本(3篇)
- 2025年中國濕度傳感器行業(yè)深度分析、投資前景、趨勢預測報告(智研咨詢)
- 高中英語新課程標準解讀 (課堂PPT)
- 石灰石石膏濕法脫硫化學分析方案
評論
0/150
提交評論