spss19(中文版)參數(shù)估計與假設檢驗精講[教學材料]_第1頁
spss19(中文版)參數(shù)估計與假設檢驗精講[教學材料]_第2頁
spss19(中文版)參數(shù)估計與假設檢驗精講[教學材料]_第3頁
spss19(中文版)參數(shù)估計與假設檢驗精講[教學材料]_第4頁
spss19(中文版)參數(shù)估計與假設檢驗精講[教學材料]_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第五章,參數(shù)估計與假設檢驗,主要內容,5.1 參數(shù)估計 5.2 假設檢驗 5.3 參數(shù)檢驗與非參數(shù)檢驗 5.4 單樣本T檢驗 5.5 獨立樣本T檢驗 5.6配對樣板T檢驗 5.7單樣本的非參數(shù)檢驗,5.1 統(tǒng)計推斷與假設檢驗,5.1.1 點估計簡介 1.基本概念 點估計用樣本統(tǒng)計量的值直接作為總體參數(shù)的估計值。如用樣本均值直接作為總體均值的估計值,用樣本方差直接作為總體方差的估計值等。 2.常用的點估計方法 (1)矩估計法 (2)極大似然估計法 (3)穩(wěn)健估計法,5.1 統(tǒng)計推斷與假設檢驗,5.1.2 區(qū)間估計簡介 因為點估計直接用樣本估計值作為總體參數(shù)的估計值,沒有提供關于估計精度的任何信息

2、,存在抽樣標準誤差,故提出了未知參數(shù)的區(qū)間估計法。 給出兩個數(shù),指出總體參數(shù)以一定概率位于兩數(shù)所確定的區(qū)間內,這種估計叫做參數(shù)的區(qū)間估計。區(qū)間估計是在點估計的基礎上,給出總體參數(shù)估計的一個范圍,所以區(qū)間估計相對于點估計更加精確,要優(yōu)于點估計,5.1 統(tǒng)計推斷與假設檢驗,5.1.3 參數(shù)估計SPSS實例分析 【例5-1】 從一個正態(tài)總體中隨機抽取容量為8的樣本,各樣本值分別為10,8,12,15,6,13,5,11;求總體均值在95%的置信區(qū)間。 分析:這是一個求總體均值的區(qū)間估計問題,進行總體均值的區(qū)間估計可以采用探索分析或單樣本T檢驗,本例中采用探索分析,具體分析步驟同例4-3,主要內容,5

3、.1 參數(shù)估計 5.2 假設檢驗 5.3 參數(shù)檢驗與非參數(shù)檢驗 5.4 單樣本T檢驗 5.5 獨立樣本T檢驗 5.6配對樣板T檢驗 5.7單樣本的非參數(shù)檢驗,5.2 假設檢驗,5.2.1 基本概念及統(tǒng)計原理 1.統(tǒng)計假設 原假設:被檢驗的假設,通過檢驗可能被接受,也可能被否定;在很多情況下,我們給出一個統(tǒng)計假設僅僅是為了拒絕它。例如,如果我們要判斷給定的一枚硬幣是否均勻,則假設硬幣是均勻的(即p=0.5,其中p是正面出現(xiàn)的概率);類似地,如果我們要判斷一種方法是否優(yōu)于其他的方法,則假設兩種方法之間沒有差異。這樣的假設通常稱為零假設或原假設,記為 。 備擇假設:與原假設對應的假設,只有在原假設被

4、否定后才可接受的假設;例如,如果零假設是 ,則備擇假設是 。備擇假設記為 。 拒絕域、臨界點:當檢驗統(tǒng)計量取某個區(qū)域中的值時,拒絕原假設,則稱該取值區(qū)域為拒絕域,稱拒絕域的邊界點為臨界點,5.2 假設檢驗,5.2.1 基本概念及統(tǒng)計原理 2.顯著性水平與置信水平 顯著性水平:在作假設檢驗時,我們犯第一類錯誤的最大概率稱為檢驗的顯著性水平。這個概率常記為,通常抽樣前就指定好,這樣得到的結果才不會影響我們的選擇。 在實際問題中,顯著性水平可以有多種選擇,但最為普通的是0.05或0.01。例如,如果設計一個決策法則選擇的顯著性水平是0.05(5%),那么在100次中可能有5次機會使我們拒絕本該接受的

5、假設。也就是說,我們大約有95%的把握作出正確的決策。此時,我們說拒絕假設的顯著性水平為0.05,即犯拒絕本應接受的假設這類錯誤的概率是0.05。 置信水平:1- 為置信度或置信水平,5.2 假設檢驗,5.2.1 基本概念及統(tǒng)計原理 3.假設檢驗的兩類錯誤 第一類錯誤:在假設檢驗中拒絕了本來是正確的原假設。 第二類錯誤:在假設檢驗中沒有拒絕錯誤的原假設。 4概率P值 P值是當原假設正確時,觀測到的樣本信息出現(xiàn)的概率。通常用P值與預先設定的顯著性水平值比較,若P值小于顯著性水平,則認為該概率值足夠小,應拒絕原假設。 5單側檢驗與雙側檢驗 雙側檢驗:只強調差異而不強調方向性的檢驗叫雙側檢驗。 單側

6、檢驗:強調某一方向的檢驗叫單側檢驗,5.2 假設檢驗,5.2.2 小概率事件原理 在概率論中我們把發(fā)生概率小到接近于0的事件稱為小概率事件(即在大量重復試驗中出現(xiàn)的頻率非常低)。 在統(tǒng)計學上,把小概率事件看成在一次特定的抽樣中不可能發(fā)生的事件,稱為“小概率事件實際不可能原理”。這是統(tǒng)計學上進行假設檢驗(顯著性檢驗)的基本依據(jù)。根據(jù)這一原理,若某事件在理論上被認為在原假設成立的情況下是個小概率事件,它不會出現(xiàn),而在實際中出現(xiàn)了,我們就推翻原來的假設,認為原假設不成立,從而接受備擇假設,5.2 假設檢驗,5.2.3 假設檢驗的一般步驟 第1步 給出檢驗問題的原假設; 根據(jù)檢驗問題的要求,將需要檢驗

7、的最終結果作為零假設。例如,需要檢驗某學校的高考數(shù)學平均成績是否同往年的平均成績一樣,都為75,由此可做出零假設, 第2步 選擇檢驗統(tǒng)計量; 在統(tǒng)計推斷中,總是通過構造樣本的統(tǒng)計量并計算統(tǒng)計量的概率值進行推斷,一般構造的統(tǒng)計量應服從或近似服從常用的已知分布,例如均值檢驗中最常用的t分布和F分布等。 第3步 規(guī)定顯著性水平,5.2 假設檢驗,5.2.3 假設檢驗的一般步驟 第4步 計算檢驗統(tǒng)計量的觀測值及其發(fā)生的概率值; 在給定零假設前提下,計算統(tǒng)計量的觀測值和相應概率p值。概率p值就是在零假設 成立時檢驗統(tǒng)計量的觀測值發(fā)生的概率,該概率值間接地給出了樣本值在零假設成立的前提下的概率,對此可以依

8、據(jù)一定的標準來判斷其發(fā)生的概率是否為小概率,5.2 假設檢驗,5.2.3 假設檢驗的一般步驟 第5步 在給定顯著性水平條件下,做出統(tǒng)計推斷結果。 這里的顯著性水平指的是當假設正確時被拒絕的概率,即棄真概率,一般取0.01或0.05。當檢驗統(tǒng)計量的概率p值小于顯著性水平時,則認為此時拒絕零假設而犯棄真錯誤的概率小于顯著性水平,即低于預先給定的水平,也就是說犯錯誤的概率小到我們能容忍的范圍,這時可以拒絕零假設;反之,如果檢驗統(tǒng)計量的概率p值大于顯著性水平,如果拒絕零假設,犯棄真錯誤的概率大于預先給定的容忍水平,這時不應該拒絕零假設,主要內容,5.1 參數(shù)估計 5.2 假設檢驗 5.3 參數(shù)檢驗與非

9、參數(shù)檢驗 5.4 單樣本T檢驗 5.5 獨立樣本T檢驗 5.6配對樣板T檢驗 5.7單樣本的非參數(shù)檢驗,5.3 參數(shù)檢驗及非參數(shù)檢驗,5.3.1 參數(shù)檢驗簡介 參數(shù)檢驗的總體分布形式是已知的或假定的,只是一些參數(shù)的取值或范圍未知,分析的主要目的是估計參數(shù)的取值范圍,或對其進行某種統(tǒng)計檢驗。如正態(tài)總體的均值是否與某個值存在顯著差異,兩個總體的均值是否有顯著差異等。 主要包括: 單樣本T檢驗:檢驗單個變量的均值與假設檢驗值之間是否存在差異; 獨立樣本T檢驗:檢驗兩組來自獨立總體的樣本,其獨立總體的均值或中心位置是否一樣; 配對樣本T檢驗:檢驗兩個相關的樣本是否來自具有相同均值的總體,5.3 參數(shù)檢

10、驗及非參數(shù)檢驗,5.3.2 非參數(shù)檢驗簡介 非參數(shù)檢驗是在總體分布未知的情況下,利用樣本數(shù)據(jù)對總體分布形態(tài)等進行推斷的方法,在推斷過程中不涉及有關總體分布的參數(shù),而是檢驗總體某些有關的性質,如總體的分布位置、分布形狀之間的比較等。 與參數(shù)檢驗的原理相同,非參數(shù)檢驗過程也是先根據(jù)問題提出原假設,然后利用統(tǒng)計學原理構造出適當?shù)慕y(tǒng)計量,最后利用樣本數(shù)據(jù)計算統(tǒng)計量的概率P值,與顯著性水平進行比較,得出拒絕或者接受原假設的結論。 非參數(shù)檢驗包括單樣本(O)、獨立樣本(I)、相關樣本(R)的非參數(shù)檢驗,5.3 參數(shù)檢驗及非參數(shù)檢驗,5.3.3 參數(shù)檢驗及非參數(shù)檢驗比較 1參數(shù)檢驗和非參數(shù)檢驗的區(qū)別 參數(shù)檢

11、驗和非參數(shù)檢驗最本質的區(qū)別是:參數(shù)檢驗需要事先確定或假定總體的分布,非參數(shù)檢驗則不需要假定總體的分布,而是直接用樣本來推斷總體的分布。 除此之外,二者之間還可以從很多方面來區(qū)分。 研究的對象和目標不同。 研究的統(tǒng)計量有所不同,主要內容,5.1 參數(shù)估計 5.2 假設檢驗 5.3 參數(shù)檢驗與非參數(shù)檢驗 5.4 單樣本T檢驗 5.5 獨立樣本T檢驗 5.6配對樣板T檢驗 5.7單樣本的非參數(shù)檢驗,5.4 單樣本T檢驗,5.4.1 基本概念及統(tǒng)計原理 1.單樣本T檢驗的概念 單樣本T檢驗利用來自某總體的樣本數(shù)據(jù),推斷該總體的均值與指定的檢驗值之間是否存在顯著性差異,它是對總體均值的假設檢驗。 為此,

12、給出檢驗均值 ,原假設: = ,其中 為總體均值,即認為總體均值與檢驗值 之間無顯著性差異。 。 例如,從新生的入學成績的抽樣數(shù)據(jù)推斷平均成績是否為75分;在人口普查中,某地區(qū)職工今年的平均收入是否和往年的平均收入有顯著差異,5.4 單樣本T檢驗,5.4.1 基本概念及統(tǒng)計原理 2.單樣本T檢驗的檢驗統(tǒng)計量 單樣本T檢驗的前提是總體服從正態(tài)分布 ,其中 為總體均值, 為總體方差。如果樣本容量為n,樣本均值為 ,則 仍服從正態(tài)分布,即: 。 在零假設成立的條件下,均值檢驗使用t統(tǒng)計量,構造的t統(tǒng)計量為: 其中, 用 代入,t統(tǒng)計量服從自由度為n-1的t分布,S為樣本標準差。 在給定原假設的前提下

13、,SPSS將檢驗值代入t統(tǒng)計量,得到檢驗統(tǒng)計量觀測值,以及根據(jù)T分布的分布函數(shù)計算出的概率P值,5.4 單樣本T檢驗,5.4.1 基本概念及統(tǒng)計原理 3.單樣本T檢驗的步驟 在給定樣本來自正態(tài)總體的假設下,單樣本T檢驗作為假設檢驗的一種方法,其基本步驟與假設檢驗的步驟是一樣的,5.4 單樣本T檢驗,5.4.2 單樣本T檢驗SPSS實例分析 【例5-2】 某生產(chǎn)食鹽的生產(chǎn)線,其生產(chǎn)的袋裝食鹽的標準質量為500 g,現(xiàn)隨機抽取10袋,其質量分別為495 g,502 g,510 g,497 g,506 g,498 g,503 g,492 g,504 g,501 g。假設數(shù)據(jù)呈正態(tài)分布,請檢驗生產(chǎn)線的

14、工作情況。 分析:這是一個典型的比較樣本均值和總體均值的T檢驗問題 ; 第1步 數(shù)據(jù)組織:首先建立SPSS數(shù)據(jù)文件,只需建立一個變量“Weight”,錄入相應的數(shù)據(jù)即可,建立的數(shù)據(jù)文件存入文件data5-1.sav中,5.4 單樣本T檢驗,5.4.2 單樣本T檢驗SPSS實例分析 第2步 單樣本T檢驗分析設置 選擇菜單“分析比較均值單樣本T檢驗(S)”,打開 “單樣本T檢驗” 對話框,將變量“weight”移入”檢驗變量”列表框,并輸入檢驗值500; 打開“單樣本T檢驗:選項”對話框 ,設置置信區(qū)間為95%(缺省為95,5.4 單樣本T檢驗,5.4.2 單樣本T檢驗SPSS實例分析 第3步 主

15、要結果及分析: 單樣本統(tǒng)計量表 單樣本T檢驗結果表,本例置信水平為95%,顯著性水平為0.05,從上表中可以看出,雙尾檢測概率P值為0.650,大于0.05,故原假設成立,也就是說,抽樣袋裝食鹽的質量與500克無顯著性差異,有理由相信生產(chǎn)線工作狀態(tài)正常,下表給出了單樣本T檢驗的描述性統(tǒng)計量,包括樣本數(shù)(N)、均值、標準差、均值的標準誤,主要內容,5.1 參數(shù)估計 5.2 假設檢驗 5.3 參數(shù)檢驗與非參數(shù)檢驗 5.4 單樣本T檢驗 5.5 獨立樣本T檢驗 5.6配對樣板T檢驗 5.7單樣本的非參數(shù)檢驗,5.5 獨立樣本T檢驗,5.5.1 基本概念及統(tǒng)計原理 1. 獨立樣本T檢驗的概念 單樣本T

16、檢驗是檢驗樣本均值和總體均值是否有顯著性差異,而兩獨立樣本T檢驗的目的是利用來自某兩個總體的獨立樣本,推斷兩個總體的均值是否存在顯著差異。其原假設H0為 ,即假設兩總體均值相等,備擇假設為 ,即假設兩總體均值不等。 例如,為比較兩種牧草對奶牛的飼養(yǎng)效果,隨機從奶牛群中選取喂養(yǎng)不同牧草的奶牛各10頭記錄每日平均產(chǎn)奶的量,根據(jù)記錄的數(shù)據(jù)推斷兩種牧草對奶牛飼養(yǎng)的效果有無顯著性差異,5.5 獨立樣本T檢驗,5.5.1 基本概念及統(tǒng)計原理 2獨立樣本T檢驗的檢驗統(tǒng)計量 獨立樣本T檢驗的前提是兩個獨立的總體分別服從 和 和 。在零假設成立的條件下,獨立樣本T檢驗使用t統(tǒng)計量。構造獨立樣本T檢驗的t統(tǒng)計量分

17、為兩種情況。 1)當樣本方差相等時,t統(tǒng)計量定義為: 其中 和 分別為兩樣本容量, , 和 分別為兩樣本標準差。該統(tǒng)計量服從自由度為 的t分布,5.5 獨立樣本T檢驗,5.5.1 基本概念及統(tǒng)計原理 2獨立樣本T檢驗的檢驗統(tǒng)計量 2)當樣本方差不等時,t統(tǒng)計量定義為: 可見,獨立樣本T檢驗的結論在很大程度上取決于兩個總體的方差是否相等。這就要求在檢驗兩總體均值是否相等之前,首先應對兩總體方差是否相等進行檢驗,也稱之為方差齊性檢驗,5.5 獨立樣本T檢驗,5.5.1 基本概念及統(tǒng)計原理 3.方差齊性檢驗方法 利用Levene F方差齊性檢驗方法檢驗兩總體方差是否存在顯著差異;首先提出原假設;執(zhí)行

18、檢驗過程中,若概率p 值小于給定的顯著性水平(一般為0.05),則拒絕原假設,認為兩個總體的方差不等;否則認為兩個總體的方差無顯著性差異。 4. 獨立樣本T檢驗的一般步驟 在兩樣本來自正態(tài)總體且相互獨立的假設下,獨立樣本T檢驗作為假設檢驗的一種方法,其基本步驟與假設檢驗的步驟是一樣的,5.5 獨立樣本T檢驗,5.5.2 獨立樣本T檢驗SPSS實例分析 【例5-3】為比較兩種不同品種的玉米的產(chǎn)量,分別統(tǒng)計了8個地區(qū)的單位面積產(chǎn)量,具體數(shù)據(jù)見表5.8。假定樣本服從正態(tài)分布,且兩組樣本相互獨立,試比較在置信度為95%的情況下,兩種玉米產(chǎn)量是否有顯著性差異,5.5 獨立樣本T檢驗,5.5.2 獨立樣本

19、T檢驗SPSS實例分析 第1步 數(shù)據(jù)組織: 在SPSS數(shù)據(jù)文件中建立兩個變量,分別為“品種”、“產(chǎn)量”,度量標準分別為“名義”、“度量”,變量“品種”的值標簽為:a品種A,b品種B,錄入數(shù)據(jù)后,保存名為data5-2.sav的SPSS數(shù)據(jù)文件; 第2步 獨立樣本T檢驗設置: 選擇菜單 “選擇比較均值獨立樣本T檢驗”,打開“獨立樣本T檢驗”對話框,將“產(chǎn)量” 作為要進行T檢驗的變量,將“品種”字段作為分組變量,定義分組變量的兩個分組分別為“a”和“b”。 打開“獨立樣本T檢驗:選項”對話框,具體選項內容及設置與單樣本T檢驗相同,5.5 獨立樣本T檢驗,5.5.2 基本概念及統(tǒng)計原理 第3步 運行

20、結果及分析: 獨立樣本T檢驗的基本描述統(tǒng)計量,上表給出了本例獨立樣本T檢驗的基本描述統(tǒng)計量,包括兩個樣本的均值、標準差和均值的標準誤,5.5 獨立樣本T檢驗,5.5. 基本概念及統(tǒng)計原理 獨立樣本T檢驗結果表,根據(jù)上表“方差方程的 Levene 檢驗”中的sig.為0.752,遠大于設定的顯著性水平0.05,故本例兩組數(shù)據(jù)方差相等。在方差相等的情況下,獨立樣本T檢驗的結果應該看上表中的“假設方差相等”一行,第5列為相應的雙尾檢測概率(Sig.(雙側)為0.332,在顯著性水平為0.05的情況下,T統(tǒng)計量的概率p值大于0.05,故不應拒絕零假設,,即認為兩樣本的均值是相等的,在本例中,不能認為兩

21、種玉米品種的產(chǎn)量有顯著性差異,主要內容,5.1 參數(shù)估計 5.2 假設檢驗 5.3 參數(shù)檢驗與非參數(shù)檢驗 5.4 單樣本T檢驗 5.5 獨立樣本T檢驗 5.6配對樣板T檢驗 5.7單樣本的非參數(shù)檢驗,5. 配對樣本T檢驗,5.6.1 基本概念及統(tǒng)計原理 1配對樣本T檢驗的概念 配對樣本T檢驗用于檢驗兩個相關樣本是否來自相同均值的正態(tài)總體,即推斷兩個總體的均值是否存在顯著差異。 其零假設為 ,其中 和 分別為第一個總體和第二個總體的均值。 配對的概念是指兩個樣本的各樣本值之間存在著對應關系,配對樣本的兩個樣本值之間的配對是一一對應的,并且兩個樣本的容量相同。配對樣本T檢驗與獨立樣本T檢驗的差別之

22、一是要求樣本是配對的。所謂配對樣本可以是個案在“前”、“后”兩種狀態(tài)下某屬性的兩種狀態(tài),也可以是對某事物兩個不同側面或方面的描述。其差別在于抽樣不是相互獨立的,而是互相關聯(lián)的,5. 配對樣本T檢驗,5.6.1 基本概念及統(tǒng)計原理 2配對樣本T檢驗的數(shù)學思想 配對樣本T檢驗須求出每對觀測值之差,所有樣本值的觀測值之差形成一個新的單樣本,顯然,如果兩個樣本的均值沒有顯著差異,則樣本值之差的均值應該接近零,這實際上轉換成了一個單樣本的T檢驗。所以,配對樣本T檢驗就是檢驗差值所來自的總體其均值是否為零,這就要求差值來自的總體服從正態(tài)分布,5.5 配對樣本T檢驗,5.6.1 基本概念及統(tǒng)計原理 3配對樣

23、本T檢驗的檢驗統(tǒng)計量 在配對樣本T檢驗中,設 、 分別為配對樣本。其樣本差值 ,此時檢驗統(tǒng)計量為: 其中 為 的均值,S為 的標準差,n為樣本數(shù),當 時,t統(tǒng)計量服從自由度為n-1的t分布,5. 配對樣本T檢驗,5.6.2 配對樣本T檢驗SPSS實例分析 【例5-4】以下是某大學跆拳道選手15人的平衡訓練的數(shù)據(jù),統(tǒng)計實驗前、后平衡訓練成績是否有差異。 訓練前:86,77,59,79,90,68,85,94,66,72,75,72,69,85,88 訓練后:78,81,76,92,88,76,93,87,62,84,87,95,88,87,80 第1步 數(shù)據(jù)組織:首先建立SPSS數(shù)據(jù)文件,建立兩

24、個變量:“訓練前”、“訓練后”,錄入相應數(shù)據(jù)。 第2步 配對樣本T檢驗設置: 選擇菜單“分析比較均值配對樣本T檢驗”,彈出“配對樣本T檢驗”對話框,同時選中“訓練前”及“訓練后”字段,將其加入“成對變量“列表框; 打開“選項”對話框,指定置信水平和缺失值的處理方法;具體方法在前面已有講述,可以參考前文,5. 配對樣本T檢驗,5.6.2 配對樣本T檢驗SPSS實例分析 第3步 運行結果及分析: 配對樣本T檢驗的基本描述統(tǒng)計量 配對樣本相關性檢驗,左表是配對樣本T檢驗的簡單相關關系檢驗結果。表中顯示訓練前和訓練后兩樣本的相關系數(shù)為0.407,相關系數(shù)的檢驗P值為0.132顯著性水平,接受原假設,可

25、以認為訓練前后的成績沒有明顯的線性關系,5. 配對樣本T檢驗,5.6.2 配對樣本T檢驗SPSS實例分析 第3步 運行結果及分析: 配對樣本T檢驗結果,上表是配對樣本T檢驗的最終結果。sig.(雙側)為雙尾檢驗概率p值在置信水平為95%時,顯著性水平為0.05,由于概率p值為0.041,小于0.05,拒絕零假設,可以認為訓練前后對成績有顯著效果,主要內容,5.1 參數(shù)估計 5.2 假設檢驗 5.3 參數(shù)檢驗與非參數(shù)檢驗 5.4 單樣本T檢驗 5.5 獨立樣本T檢驗 5.6 配對樣板T檢驗 5.7 單樣本的非參數(shù)檢驗,5.7 單樣本的非參數(shù)檢驗,5.7.1 基本概念及統(tǒng)計原理 單樣本非參數(shù)檢驗使

26、用一個或多個非參數(shù)檢驗方法來識別單個總體的分布情況,不需要待檢驗的數(shù)據(jù)呈正態(tài)分布。 SPSS的單樣本非參數(shù)檢驗方法包括卡方檢驗、二項分布檢驗、游程檢驗、K-S檢驗及Wilcoxon符號檢驗五種。 在SPSS 19中,所有單樣本的非參數(shù)檢驗有一些共同的設置。單樣本非參數(shù)檢驗的對話框有三個選項卡,分別為“目標”、“字段”和“設置”,具體設置如下,5.7 單樣本的非參數(shù)檢驗,5.7.1 基本概念及統(tǒng)計原理 (1)“目標”選項卡:用于設置非參數(shù)檢驗的目標,每個不同的選項對應于“設置”選項卡上不同的默認配置,如下圖所示,5.7 單樣本的非參數(shù)檢驗,5.7.1 基本概念及統(tǒng)計原理 (2)“字段”選項卡:用

27、于設定待檢驗變量,5.7 單樣本的非參數(shù)檢驗,5.7.1 基本概念及統(tǒng)計原理 (3)“設置”選項卡:用于設定檢驗方法及對應的選項,如下圖所示,5.7 單樣本的非參數(shù)檢驗,5.7.2 卡方檢驗 1卡方檢驗的概念 也稱卡方擬合優(yōu)度檢驗,它是K.Pearson給出的一種最常用的非參數(shù)檢驗方法,用于檢驗觀測數(shù)據(jù)是否與某種概率分布的理論數(shù)值相符合,進而推斷觀測數(shù)據(jù)是否是來自于該分布的樣本的問題,5.7 單樣本的非參數(shù)檢驗,5.7.2 卡方檢驗 1卡方檢驗的概念 也稱卡方擬合優(yōu)度檢驗,它是K.Pearson給出的一種最常用的非參數(shù)檢驗方法,用于檢驗觀測數(shù)據(jù)是否與某種概率分布的理論數(shù)值相符合,進而推斷觀測數(shù)

28、據(jù)是否是來自于該分布的樣本的問題。 2統(tǒng)計原理 為檢驗實際分布是否與理論分布(期望分布一致),可采用卡方統(tǒng)計量,典型的卡方統(tǒng)計量是Pearson卡方統(tǒng)計量,其公式為,5.7 單樣本的非參數(shù)檢驗,5.7.2 卡方檢驗 分析步驟 第1 步 提出零假設:卡方檢驗的零假設H0是“總體服從某種理論分布”,其對立假設H1是“總體不服從某種理論分布”。 第2步 選擇檢驗統(tǒng)計量:卡方分布選擇的是Pearson卡方統(tǒng)計量。已證明,當n充分大時,它近似地服從自由度為k-1的卡方分布。 第3步 計算檢驗統(tǒng)計量的觀測值和概率p值。 第4步 給出顯著性水平,作出決策,5.7 單樣本的非參數(shù)檢驗,5.7.2 卡方檢驗 4

29、卡方檢驗SPSS實例分析 【例5-5】 某公司質檢負責人欲了解企業(yè)一年內出現(xiàn)的次品數(shù)是否均勻分布在一周的五個工作日中,隨機抽取了90件次品的原始記錄,其結果如下表,問該企業(yè)一周內出現(xiàn)的次品數(shù)是否均勻分布在一周的五個工作日中?(,5.7 單樣本的非參數(shù)檢驗,5.7.2 卡方檢驗 第1步 分析:由于考慮的是次品是否服從均勻分布的問題,故用卡方檢驗。 第2步 數(shù)據(jù)組織:建立SPSS數(shù)據(jù)文件,建立兩個變量:“工作日”、“次品數(shù)”,錄入相應數(shù)據(jù),保存為文件data5-4.sav。 第3步 “次品數(shù)”字段加權處理:通過分析“工作日”及“次品數(shù)”兩個字段的含義及度量標準,確定“工作日”為被分析字段,而“次品

30、數(shù)”表示各工作日出現(xiàn)的頻數(shù),所以應該對“次品數(shù)”進行加權處理。執(zhí)行“數(shù)據(jù)”“加權個案”,打開“加權個案”對話框,按圖5-10所示進行設置,5.7 單樣本的非參數(shù)檢驗,5.7.2 卡方檢驗 第4步 單因素的非參數(shù)檢驗設置:選擇菜單“分析非參數(shù)檢驗單樣本”,在“目標”選項卡選擇“自定義分析”;在“字段”選項卡中選擇“使用定制字段分配”,并將“工作日”字段選入“檢驗字段”;“設置”選項卡中選擇“自定義檢驗”,并選中“比較觀察可能性和假設可能性(卡方檢驗)”,“檢驗選項”及“用戶缺失值”保持默認選項。 第5步 卡方檢驗的選項設置:打開“卡方檢驗選項”對話框,選擇” 所有類別概率相等(V)“選項,5.7

31、 單樣本的非參數(shù)檢驗,5.7.2 卡方檢驗 第6步 運行結果及分析: 卡方檢驗的假設檢驗數(shù)據(jù)摘要,給出了卡方檢驗的原假設為“工作日的類別以相同的概率發(fā)生”,其相伴概率值Sig. = 0.014 0.05,說明應拒絕原假設,因此圖5-12的“決策者”給出“拒絕原假設”的決策,認為工作日的類別是以不同概率發(fā)生的,即認為該企業(yè)一周內出現(xiàn)的次品數(shù)不是均勻分布在一周的五個工作日中,5.7.3 二項分布檢驗 1基本概念 二項分布檢驗正是要通過樣本數(shù)據(jù)檢驗樣本來自的總體是否服從指定的概率為p的二項分布,其零假設H0是:樣本來自的總體與指定的二項分布無顯著性差異。 2統(tǒng)計原理 二項分布檢驗在樣本小于等于30時

32、,按下式計算概率值,5.7 單樣本的非參數(shù)檢驗,5.7 單樣本的非參數(shù)檢驗,5.7.3 二項分布檢驗 在大樣本的情況下,計算的是Z統(tǒng)計量,認為在零假設下,Z統(tǒng)計量服從正態(tài)分布,其計算公式如下,當x小于n/2時,取加號;反之取減號,p為檢驗概率,n為樣本總數(shù),5.7 單樣本的非參數(shù)檢驗,5.7.3 二項分布檢驗 3分析步驟 二項分布檢驗亦是假設檢驗問題,檢驗步驟同前。SPSS會自動計算上述精確概率和近似概率值。如果概率值小于顯著性水平,則拒絕零假設,認為樣本來自的總體與指定的二項分布有顯著差異,反之樣本來自的總體與指定的二項分布無顯著差異,5.7 單樣本的非參數(shù)檢驗,5.7.3 二項分布檢驗SP

33、SS實例分析 【例5-7】有20名學生經(jīng)過新型教學法后測試成績如下表,以90分及以上為優(yōu)秀,請檢驗這20名同學的優(yōu)秀率是否達到了10,第1步 分析:由于成績分為優(yōu)秀與非優(yōu)秀兩種狀態(tài),故應用二項分布檢驗。 第2步 數(shù)據(jù)的組織:數(shù)據(jù)分成一列,其變量名為“成績”,輸入數(shù)據(jù)并保存,5.7 單樣本的非參數(shù)檢驗,5.7.3 二項分布檢驗SPSS實例分析,第3步 單因素的非參數(shù)檢驗設置:選擇菜單“分析非參數(shù)檢驗單樣本”: 將“目標”選項卡選擇“自定義分析”; 在“字段”選項卡中選擇“使用定制字段分配”,并將“成績”字段選入“檢驗字段”; 在“設置”選項卡中選擇“自定義檢驗”,并選中“比較觀察二分類可能性和假

34、設可能性(二項式檢驗)(O)”,“檢驗選項”及“用戶缺失值”保持默認選項; 第4步 進行二項分布檢驗選項設置:打開“二項式選項”對話框,設置“假設比例”為0.9,選擇“定義連續(xù)字段的成功值”中的“定制割點”選項,并設置割點為99,5.7 單樣本的非參數(shù)檢驗,5.7.3 二項分布檢驗SPSS實例分析 第5步 主要結果及分析: 二項式假設檢驗數(shù)據(jù)摘要,單尾檢測的相伴概率Sig.=0.0430.05,因此應拒絕零假設,即小于90分的學生所占的比例與總體分布存在顯著差異,即小于90分的學生所占比例比90%小。這說明優(yōu)秀學生所占的比重是大于10%的,5.7 單樣本的非參數(shù)檢驗,5.7.4 游程檢驗,1基本概念 一 個游程(Run)就是某序列中位于一種符號之前或之后的另一種符號持續(xù)的最大主序列,或者說,一個游程是指某序列中同類元素的一個持續(xù)的最大主集。 主要用于檢驗一個變量兩個值的分布是否呈隨機分布,即檢驗前一個個案是否影響下一個個案的值,如果沒有影響,這一組個案便是隨機的。 例如,30次擲硬幣出現(xiàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論