均值比較與T檢驗(yàn)chap5課件_第1頁(yè)
均值比較與T檢驗(yàn)chap5課件_第2頁(yè)
均值比較與T檢驗(yàn)chap5課件_第3頁(yè)
均值比較與T檢驗(yàn)chap5課件_第4頁(yè)
均值比較與T檢驗(yàn)chap5課件_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章均值比較與T檢驗(yàn)統(tǒng)計(jì)分析常常采取抽樣研究的方法。即從總體中隨機(jī)抽取一定數(shù)量的樣本進(jìn)行研究來(lái)推論總體的特性。由于總體中的每個(gè)個(gè)體間均存在差異,即使嚴(yán)格遵守隨機(jī)抽樣原則也會(huì)由于多抽到一些數(shù)值較大或較小的個(gè)體致使樣本統(tǒng)計(jì)量與總體參數(shù)之間有所不同。由此可以得出這樣的認(rèn)識(shí):均值不相等的兩個(gè)樣本不一定來(lái)自均值不同的總體。能否用樣本均數(shù)估計(jì)總體均數(shù),兩個(gè)變量均數(shù)接近的樣本是否來(lái)自均值相同的總體?換句話說(shuō),兩個(gè)樣本某變量均值不同,其差異是否具有統(tǒng)計(jì)意義,能否說(shuō)明總體差異?這是各種研究工作中經(jīng)常提出的問(wèn)題。這就要進(jìn)行均值比較。進(jìn)行均值比較及檢驗(yàn)的過(guò)程MEANS過(guò)程Ttest過(guò)程單一樣本T檢驗(yàn)獨(dú)立樣本的T檢驗(yàn)配對(duì)樣本的T檢驗(yàn)單因素方差分析SPSS的均值過(guò)程是描述和分析尺度變量(Scale)的一種有用的方法,可以獲得需要分析變量的許多中心趨勢(shì)和離散趨勢(shì)的統(tǒng)計(jì)指標(biāo),同時(shí)它可以對(duì)不同的組別或者交叉組別進(jìn)行比較。當(dāng)觀測(cè)量按一個(gè)分類變量分組時(shí),均值過(guò)程可以進(jìn)行分組計(jì)算。例如:要計(jì)算學(xué)生的平均身高,SEX變量把學(xué)生按性別分為男、女生兩組,均值過(guò)程可以分別計(jì)算男、女生平均身高。注意用于形成分組的變量應(yīng)該是其值數(shù)量少且能明確表明其特征的變量。

一、MEANS過(guò)程

使用均值過(guò)程求若干組的描述統(tǒng)計(jì)量,目的在于比較。因此必須分組求均值。這是與Descriptives過(guò)程不同之處。

MEANS過(guò)程的基本功能是分組計(jì)算指定變量的描述統(tǒng)計(jì)量。包括均值、標(biāo)準(zhǔn)差、總和、觀測(cè)量數(shù)、方差等一系列單變量描述統(tǒng)計(jì)量。也可以從該過(guò)程獲得單因素方差分析、eta和線性相關(guān)檢驗(yàn)。Mean過(guò)程的數(shù)據(jù)文件要求:至少有一個(gè)連續(xù)變量、一個(gè)分類變量(離散變量)。對(duì)連續(xù)變量求其基本描述統(tǒng)計(jì)量。分類變量用來(lái)分組。以30個(gè)學(xué)生的身高為例說(shuō)明操作步驟(學(xué)生身高體重?cái)?shù)據(jù).sav)變量number編號(hào),sex性別,age年齡,height身高,weight體重。相同年齡的男孩和女孩是否身高有所不同?是否身高隨年齡的增長(zhǎng)呈線性關(guān)系?如果解決這樣的問(wèn)題,只建立一個(gè)控制層就不夠了。應(yīng)該考慮,選擇身高作為因變量,分類變量年齡作為第一層控制變量,性別為第二層控制變量。兩個(gè)分類變量分別放在兩層中,且使用選擇項(xiàng)。ANOVAtableandeta:輸出第一層控制變量給出的方差分析表和eta統(tǒng)計(jì)值η和η2

。η統(tǒng)計(jì)量表明因變量和自變量之間聯(lián)系的強(qiáng)度。η2

是組間平方和與總平方和之比。Testforlinearity:線性檢驗(yàn),輸出R和R2,只有在控制變量有基本的控制級(jí),且自變量有三個(gè)水平以上時(shí)才能選用。對(duì)第一層變量的方差分析結(jié)果身高*年齡(方差分析的變量信息):分析不同年齡的身高均值間是否存在顯著性差異;SumofSquares(偏差平方和);df(自由度);Meansquare(均方);F(方差值);sig(P值);BetweenGroups(組間偏差平方和):由兩部分組成:Linearity是由因變量與控制變量之間的線性關(guān)系引起的;Deviationfromlinearity不是由因變量與控制變量之間的線性關(guān)系引起的;WithinGroups(組內(nèi)偏差平方和):各組內(nèi)的變異相對(duì)于組均值的變異;Total(偏差平方和的總和):為組間偏差平方和與組內(nèi)偏差平方和之和。線性檢驗(yàn)結(jié)果R是因變量身高的觀測(cè)值與預(yù)測(cè)值之間的的相關(guān)系數(shù),R值越接近1表明回歸方程的預(yù)測(cè)性越好;Eta:即η值(0~1)說(shuō)明因變量與自變量之間的聯(lián)系程度;EtaSquared:η2為組間偏差平方和與偏差平方和總和之比。練習(xí)題試按性別、年齡對(duì)體重做平均數(shù)分析。單樣本T檢驗(yàn)單樣本T檢驗(yàn)即檢驗(yàn)?zāi)硞€(gè)變量的樣本均值和某指定值(總體均值)之間是否存在著顯著性差異。如果是大樣本的單樣本檢驗(yàn),統(tǒng)計(jì)教科書上稱為U檢驗(yàn),它采用服從正態(tài)分布的U統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量;如果是小樣本并且樣本服從正態(tài)分布,則采用服從t分布的t統(tǒng)計(jì)量進(jìn)行單樣本T檢驗(yàn);否則,采取非參數(shù)檢驗(yàn)。T檢驗(yàn)穩(wěn)健性(Robust)較好,如果樣本分布偏離正態(tài)分布不太嚴(yán)重,也可采用T檢驗(yàn)。二、Ttest過(guò)程1、單一樣本T檢驗(yàn)(One-sampleTTest)

檢驗(yàn)單個(gè)變量的均值是否與給定的常數(shù)(一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過(guò)大量觀察所得的穩(wěn)定值等)之間存在差異。樣本均數(shù)與總體均數(shù)之間的差異顯著性檢驗(yàn)屬于單一樣本T檢驗(yàn)。如果是大樣本的單樣本檢驗(yàn),統(tǒng)計(jì)教科書上稱為U檢驗(yàn),它采用服從正態(tài)分布的U統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量;如果是小樣本并且樣本服從正態(tài)分布,則采用服從t分布的t統(tǒng)計(jì)量進(jìn)行單樣本T檢驗(yàn);否則,采取非參數(shù)檢驗(yàn)。T檢驗(yàn)穩(wěn)健性(Robust)較好,如果樣本分布偏離正態(tài)分布不太嚴(yán)重,也可采用T檢驗(yàn)。例:收集26家保險(xiǎn)公司人員構(gòu)成數(shù)據(jù),希望對(duì)目前保險(xiǎn)公司從業(yè)人員受高等教育程度和年輕化程度進(jìn)行推斷。具體而言,就是推斷具有高等教育水平的員工平均比例是否不低于0.8,年輕人的平均比例是否為0.5,具體數(shù)據(jù)文件名為保險(xiǎn)公司人員構(gòu)成情況.sav計(jì)算具有高等教育水平的員工數(shù),35歲以下員工數(shù)占總員工數(shù)的比例。(利用轉(zhuǎn)換菜單計(jì)算)進(jìn)行單樣本t檢驗(yàn)分析:由于調(diào)查的26家公司,有7家在文化程度變量上有缺失值,因此在選項(xiàng)窗口中選擇【按分析順序排除個(gè)案】進(jìn)行缺失值處理。Confidenceinterval:95%:置信區(qū)間項(xiàng),可以自定義。MissingValues:選擇對(duì)缺失值的處理方法

Excludecasesanalysisbyanalysis:帶有缺失值的觀測(cè)值當(dāng)它與分析有關(guān)時(shí)才被剔除;

Excludecaseslistwise:剔除所有列在Test、Grouping矩形框中的變量帶缺失值的項(xiàng)單樣本T檢驗(yàn)分析結(jié)果95%ConfidenceIntervaloftheDifference(差值的95%置信區(qū)間):95%的置信區(qū)間=均值±1.96標(biāo)準(zhǔn)誤。根據(jù)上表比例總體均值的95%置信區(qū)間是0.745±1.96×0.038即(0.664,0.8255)。由此推出,該范圍與總體均數(shù)之差為0.664-0.8~0.8255-0.8,即表中-0.1358和0.0255的含義。單樣本t檢驗(yàn)中t統(tǒng)計(jì)量的雙尾概率p-為0.168,若顯著性水平a為0.05,則p>a,由此接受原假設(shè),也就是保險(xiǎn)公司員工受高等教育比例顯著高于0.8。(0.8大于95%的置信區(qū)間下限)練習(xí):年輕人比例t檢驗(yàn)操作年輕人比例的基本描述統(tǒng)計(jì)量調(diào)查的26家保險(xiǎn)公司,年輕人比例的平均數(shù)是0.7139,標(biāo)準(zhǔn)差為0.151,標(biāo)準(zhǔn)誤為0.03練習(xí)題已知某水樣中含CaCO3的真值為20.7mg/L,現(xiàn)用某方法重復(fù)測(cè)定該水樣11次CaCO3的含量(mg/L)為:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20.00,23.00,22.00。問(wèn)該方法測(cè)得的均值是否偏高?2、IndependentSampleTtest

(獨(dú)立樣本T檢驗(yàn))獨(dú)立樣本的T檢驗(yàn)用于檢驗(yàn)兩個(gè)不相關(guān)的樣本是否來(lái)自具有相同均值的總體。兩獨(dú)立樣本是指兩個(gè)樣本所來(lái)自的總體相互獨(dú)立,兩個(gè)獨(dú)立樣本各自接受相同的測(cè)量,研究者或分析者的主要目的是分析兩個(gè)獨(dú)立樣本的均值是否有顯著的統(tǒng)計(jì)差異。獨(dú)立樣本T檢驗(yàn)必須注意使用這種檢驗(yàn)的條件是必須具有來(lái)自兩個(gè)不相關(guān)組(非配對(duì))的觀測(cè)量,其均值必須是對(duì)你想在兩組中都計(jì)算的變量的綜合測(cè)度。例如,比較女性和男性的身高,教育從業(yè)者和金融從業(yè)者的起始工資等,都是兩獨(dú)立樣本的例子。

兩獨(dú)立樣本T檢驗(yàn)的前提條件獨(dú)立性:兩樣本所來(lái)自的總體互相獨(dú)立。正態(tài)性:樣本來(lái)自的兩個(gè)總體應(yīng)服從正態(tài)分布。在樣本所來(lái)自的總體不滿足正態(tài)性條件時(shí),如果兩個(gè)樣本的分布形狀相似,它們的樣本量相差不是太大并且樣本量較大,仍然可以應(yīng)用T檢驗(yàn)。方差齊性:待比較的兩個(gè)樣本的方差相同。如果兩個(gè)組的樣本量大致相等,略微偏離了方差齊性對(duì)檢驗(yàn)結(jié)果的精度影響不大。在T檢驗(yàn)中,SPSS提供了方差齊性的Levene檢驗(yàn),當(dāng)方差齊性不滿足時(shí),會(huì)提供方差齊性校正后的T檢驗(yàn)結(jié)果。如果分組樣本彼此不獨(dú)立,例如測(cè)量的是研究對(duì)象用藥前后某項(xiàng)指標(biāo),要求比較用藥前后某項(xiàng)指標(biāo)均值是否有顯著性差異,應(yīng)該使用配對(duì)T檢驗(yàn)的功能(PairedSampleTtest)。如果分組不止兩個(gè),應(yīng)該使用One-WayANOV過(guò)程進(jìn)行單變量方差分析。如果你試圖比較的變量明顯不是正態(tài)分布的,則應(yīng)該考慮使用一種非參數(shù)檢驗(yàn)過(guò)程(Nonparametrictest)。如果想比較的變量是分類變量,應(yīng)該使用Crosstabs功能。例:學(xué)生參加為期三天的計(jì)算機(jī)等級(jí)測(cè)試培訓(xùn),有15名學(xué)生報(bào)名參加A公司的培訓(xùn),12名參加B公司的培訓(xùn),培訓(xùn)結(jié)束后學(xué)生參加測(cè)試,想知道學(xué)生在這兩家公司不同培訓(xùn)方法下,測(cè)試成績(jī)的均值是否存在顯著差異。分析:培訓(xùn)方式A與培訓(xùn)方式B可以看成是兩個(gè)獨(dú)立樣本Spss操作步驟Usespecialvalues使用指定值:按分組變量的值進(jìn)行分組Cutpoint割點(diǎn):當(dāng)分組變量為連續(xù)變量時(shí),選擇該選項(xiàng)后,在后面的矩形框中輸入一個(gè)連續(xù)變量值,將觀測(cè)量分為大于該值和小于該值的兩個(gè)組,檢驗(yàn)在這兩個(gè)組之間進(jìn)行,比較其因變量在兩組的均數(shù)間是否有顯著性差異。Confidenceinterval:95%:置信區(qū)間項(xiàng),可以自定義。MissingValues:選擇對(duì)缺失值的處理方法

Excludecasesanalysisbyanalysis:帶有缺失值的觀測(cè)值當(dāng)它與分析有關(guān)時(shí)才被剔除;

Excludecaseslistwise:剔除所有列在Test、Grouping矩形框中的變量帶缺失值的項(xiàng)分析變量的簡(jiǎn)單描述性統(tǒng)計(jì)量左第一欄為分析變量標(biāo)簽和分類變量標(biāo)簽N觀測(cè)量數(shù)目Mean均值Std.Deviation標(biāo)準(zhǔn)差Std.ErrorMean標(biāo)準(zhǔn)誤參加培訓(xùn)方法A的學(xué)生的平均測(cè)試成績(jī)47.73,低于培訓(xùn)方法B學(xué)生的平均測(cè)試成績(jī)8.77分兩組學(xué)生測(cè)試成績(jī)的標(biāo)準(zhǔn)差相差不大,參加培訓(xùn)方法A的略大獨(dú)立樣本T檢驗(yàn)結(jié)果Levene’sTestforEqualityofVariances:方差齊性檢驗(yàn)F方差值:0.258Sig:P值為0.616>0.05,接受原假設(shè)即方差相等。t-testforEqualityofMeans為T檢驗(yàn)結(jié)果欄t:t值;df:自由度;Sig:顯著性概率即P值=0<0.05,拒絕原假設(shè)u1-u2=0;MeanDifference:兩組均值之差。表現(xiàn)培訓(xùn)方法A學(xué)生平均測(cè)試成績(jī)低于培訓(xùn)方法B學(xué)生成績(jī)8.767;Std.ErrorDifference:差值的標(biāo)準(zhǔn)誤為1.686;95%ConfidenceIntervaloftheDifference:差值的95%置信區(qū)間。在-12.24~-5.294之間,不包括0即兩組均值之差與0有顯著性差異。例題二有29名13歲男生的身高、體重、肺活量數(shù)據(jù)(學(xué)生肺活量數(shù)據(jù).sav),試分析大于等于155cm的與身高小于155cm的兩組男生的肺活量均值是否有顯著差異。分析:155以下和155以上身高的男生平均肺活量顯著性檢驗(yàn)例題二身高大于等于155cm與身高小于155cm的兩組男生的肺活量平均值在95%水平上顯著存在差異。練習(xí)題某克山病區(qū)測(cè)得11例急性克山病患者與13名健康人的血磷值如下:患者:2.60,3.24,3.73,3.73,4.32,5.18,4.73,5.58,5.78,6.40,6.53健康人:1.67,1.98,1.98,2.33,2.34,2.50,3.60,3.73,4.14,4.17,4.57,4.82,5.78問(wèn)該地區(qū)急性克山病患者與健康人的血鱗值是否不同?三、配對(duì)樣本T檢驗(yàn)配對(duì)樣本T檢驗(yàn)(PairedSampleTtest)用于檢驗(yàn)兩個(gè)相關(guān)的樣本是否來(lái)自具有相同均值的總體。這種相關(guān)的或配對(duì)的樣本常常來(lái)自這樣的實(shí)驗(yàn)結(jié)果,在實(shí)驗(yàn)中被觀測(cè)對(duì)象在實(shí)驗(yàn)前后均被觀測(cè)。兩個(gè)變量可以是beforeafter,配對(duì)分析的測(cè)度也不是必須來(lái)自同一個(gè)觀測(cè)對(duì)象。一對(duì)可以兩者組合而成。

進(jìn)行配對(duì)樣本的T檢驗(yàn)要求被比較的兩個(gè)樣本有配對(duì)關(guān)系。要求兩個(gè)樣本均來(lái)自正態(tài)總體。而且均值是對(duì)于檢驗(yàn)有意義的描述統(tǒng)計(jì)量。均值的配對(duì)比較是比較常見(見以下幾個(gè)例子)。同一窩實(shí)驗(yàn)用白鼠按性別、體重相同的配對(duì),再隨機(jī)分到實(shí)驗(yàn)組和對(duì)照組,分別喂加入海藻的飼料和普通飼料,三個(gè)月后,分別將每對(duì)白鼠置于水中,測(cè)量其到溺死前的游泳時(shí)間。比較兩組白鼠游泳時(shí)間均值,從而比較兩種飼料對(duì)抗疲勞的作用。在研究人體各部位體溫是否有差別,一個(gè)人的兩個(gè)部位的溫度構(gòu)成一對(duì)數(shù)據(jù)。測(cè)量若干人的同樣兩個(gè)部位的溫度數(shù)據(jù),可以比較這兩個(gè)部位平均溫度是否有顯著性差異。使用配對(duì)t檢驗(yàn)。

同一組高血壓病人在進(jìn)行體育療法前后,測(cè)量其血壓。每個(gè)病人在體育療法前后的血壓測(cè)量值構(gòu)成觀測(cè)量對(duì)??梢郧筮@組病人體育療法前后血壓平均值。進(jìn)行配對(duì)T檢驗(yàn),分析體育療法對(duì)降血壓的療效。配對(duì)樣本T檢驗(yàn)實(shí)際上是先求出每對(duì)測(cè)量值之差值,對(duì)差值求均值,檢驗(yàn)配對(duì)變量均值之間差異是否顯著。其實(shí)質(zhì)檢驗(yàn)的假設(shè)實(shí)際上是差值的均值與零均值之間差異的顯著性。如果差值均值與零均值無(wú)顯著性差異說(shuō)明配對(duì)變量均值之間無(wú)顯著性差異。配對(duì)樣本T檢驗(yàn)與獨(dú)立樣本T檢驗(yàn)均使用T-TEST過(guò)程,但調(diào)用該過(guò)程的菜單不同,對(duì)數(shù)據(jù)文件結(jié)構(gòu)的要求不同和所使用的命令語(yǔ)句也有區(qū)別。進(jìn)行配對(duì)樣本T檢驗(yàn)的數(shù)據(jù)文件中一對(duì)數(shù)據(jù)必須作為同一個(gè)觀測(cè)量中兩個(gè)變量值。例題一以體育療法治療高血壓的數(shù)據(jù)(體育療法檢驗(yàn).SAV),pretreat:治療前舒張壓(mmHg),posttreat:治療后舒張壓(mmHg

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論