二組資料比較_第1頁
二組資料比較_第2頁
二組資料比較_第3頁
二組資料比較_第4頁
二組資料比較_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

Chap2二組資料比較二組資料比較屬於1factor,2treatments之實驗,分為:

二獨立樣本--1factorcompleterandomizeddesign

二配對樣本--pairedcomparisondesign(是一種blockdesign)分析資料的方法分別為:二獨立樣本--t-test(H0:μ1=μ2)二配對樣本--pairedt-test(H0:μD=μ1-μ2=0)註:上述的t-test用於常態(tài)資料1/11/20231dsn2題例例2.1:調(diào)查二水泥砂漿配方產(chǎn)生的張力強度是否相同(課本p24)

以二配方生產(chǎn)的水泥砂漿各隨機抽取10個樣本,測得張力強度,此二組資料是否獨立?例2.2:比較兩種演算法所需cpu

時間影響cpu時間的另一重要因素是題目的難易度,選擇10題,分別以兩種演算法計算,得到的資料是配對資料。例2.3:比較二硬度機針頭讀數(shù)之差異(課本p49)硬度讀數(shù)和金屬本身的硬度有極大關(guān)係,若取不同的金屬片,得到的差異可能是金屬片的差異,而非針頭的差異,在設(shè)計實驗時,要平衡此nuisancefactor,故取10片金屬片,每片分成二份,分別以二硬度機針頭讀出硬度,這設(shè)計屬於blockdesign,以此得到的資料是配對資料。例2.1屬二獨立資料,例2.2&2.3屬二配對資料1/11/20232dsn2【理論】假設(shè)

Y11,Y12,…,Y1n1isarandomsamplefromN(μ1,σ12),Y21,Y22,…,Y2n2isarandomsamplefromN(μ2,σ22),

andY1i,Y2jareindependent.比較二獨立樣本之分析法注意,在常態(tài)的假設(shè)下,得到:樣本平均數(shù)的分布與常態(tài)分布有關(guān)樣本變異數(shù)的分布與卡方分布有關(guān)樣本平均數(shù)與樣本變異數(shù)互相獨立數(shù)統(tǒng)基本理論說明?1/11/20233dsn2說明?說明?1/11/20234dsn2說明?1/11/20235dsn24.TheEstimateofthestandarderror

針對3項中的二種情況,標(biāo)準(zhǔn)差的估計如下,得到的值稱為標(biāo)準(zhǔn)差standarderror(s.e.),因為此值代表估計時的誤差大小。a.Noassumptionoftheequalityofσ12andσ22註:Si2是σi2

的不偏估計量,且分佈與卡方分布有關(guān)。

但是(s.e.)2的分布並非是卡方分布。說明?說明?1/11/20236dsn2Sp2是σ2

的不偏估計量,且分布與卡方分布有關(guān)。証明?1/11/20237dsn25.TheTestingStatisticsfortestingH0:μ1=μ2

a.Assumeσ12≠σ22(Satterthwaithmethod)1/11/20238dsn2

t~t(n1+n1-2)whenH0istrue証明?1/11/20239dsn26.選擇(a)or選擇(b)?

TestH0:σ12

=σ22

檢定量F=S12/S22;α=0.05

拒絕域C={Fisnotin(F.975;(n1-1,n2-1),F.025;(n1-1,n2-1))}〔原理〕從以上理論知,要檢定二平均數(shù)差異,要分為變異數(shù)相等與不相等,我們要如何知道母體的變異數(shù)是否相等?1/11/202310dsn2TestH0:σ12=σ22vs.H1:σ12

≠σ22RejectH0whenf<F1-α/2orf>Fα/2C.I.:注意:1.上述檢定法之前提皆為Normal假設(shè)。

2.變異數(shù)之F-test對normal假設(shè)比較敏感。註:

F1-α/2;n1,n2=(Fα/2;n2,n1)-1檢定變異數(shù)差異之說明証明?1/11/202311dsn2計算f-值,使f>1,若

f<F.025;(n1,n2)

,假設(shè)二組變異數(shù)相等,使用pooledt-test(b);若

f>F.025;(n1,n2)

,假設(shè)二組變異數(shù)不等,使用Satterthwaite

法(a)。

選擇(a)or(b)之實作

說明檢定

σ1=σ2,和二組的順序無關(guān)

F.975;(n1-1,n2-1)<無法直接由查表得到

F.975;(n1-1,n2-1)<1,F.025;(n1-1,n2-1)>11/11/202312dsn2以上的理論中做了那些假設(shè)(assumption)?比較二組變異數(shù)與比較二組平均數(shù)基本上的差異為何?你覺得是否有意義?

t分佈與F分佈有何關(guān)係?何時使用t-test,何時使用F-test?Think1/11/202313dsn21、預(yù)覽資料

(作比較圖)(i)資料是否有特殊分佈?

(ii)分散度是否有明顯差異?(iii)均值是否有明顯差異?2、檢測資料是否可假設(shè)來自常態(tài)母體

(i)Normalitytest,(ii)檢視Normalprobabilityplot3、決定是否可假設(shè)二組的變異數(shù)相等用F-test,H0:σ12

=σ22,p-value>0.05時,設(shè)變異數(shù)相等4、選擇平均數(shù)差異檢定法

TestH0:μ1=μ2,

變異數(shù)相等時,用pooledt-test

變異數(shù)不等時,用Satterthwaitetest5、必要時計算差異的信賴區(qū)間6、結(jié)論

【二組資料比較的實作過程】1/11/202314dsn2CaseI變異相等時,比較二獨立樣本C.I.forμ1–μ2:TestH0:μ1=μ2vs.H1:μ1≠μ21/11/202315dsn2CaseII變異不相等時,比較二獨立樣本p-value=2P(Tν>|t|)C.I.forμ1–μ2:TestH0:μ1=μ2vs.H1:μ1≠μ21/11/202316dsn2【例2.1】比較改良的與原來的水泥砂漿配方產(chǎn)生的張力強度

變因:二種配方(1,modified,2,unmodified)

觀察值:

張力強度

data:p24

【分析】1.樣本統(tǒng)計量及資料分布:1/11/202317dsn2Box-plot平均數(shù)差是0.278,上圖是否顯示二組有明顯差異?二組變異是否相等?Think1/11/202318dsn22.資料是否來自常態(tài)母體?由Wilk-Shapirotest,二組得到的p-value分別為.3457,及.8153(參考o(jì)utput

cement_Normal),Normalprobabilityplot結(jié)果接近一直線(如下圖),故可假設(shè)二組資料來自常態(tài)。formula1formula21/11/202319dsn23.二組資料變異數(shù)是否相等?查表得F.025,(9,9)=4.03,在α=0.05,可認(rèn)定二組資料變異數(shù)相等(p-value=0.4785,參考sasoutputcement_tt)1/11/202320dsn2t.025;(18)=2.101,拒絕H0.(p-value=0.0422,參考sasoutputcement_tt

)4.二組資料平均數(shù)是否相等?在5%的顯著水準(zhǔn)下,二強度平均數(shù)有顯著差異。註:p-value非常接近0.05,觀察先前的boxplot,是不是吻合?Think1/11/202321dsn25.差異之信賴區(qū)間

Under95%confidencelevel:6.結(jié)論在5%的顯著水準(zhǔn)下,二配方生產(chǎn)的水泥砂漿的張力強度有顯著的差異,以95%之信賴度估計,F(xiàn)ormula2較Formula1

平均強度高.011到.545。請看看報表何處有出現(xiàn)s.e.=0.1271顯著的也就是明顯1/11/202322dsn2Q:如何決定樣本數(shù)?CaseI、控制信賴區(qū)間寬度要求信賴區(qū)間Length<L0,樣本數(shù)應(yīng)取多少?說明:若變異數(shù)未知,以估計值代入。1/11/202323dsn2CaseII、控制型II錯誤之機率(β)要求有1-β的機會能分出差距為δ的情況,樣本數(shù)應(yīng)取多少?說明:事實上,二組的平均數(shù)通常是有差異的,t-test是指出有明顯差異的情況,在α值固定下,二組平均數(shù)差異愈大,被檢定出顯著的機會也愈大,此處的機會就是1-β值。對於差距小的二組,要分出差異,就得有夠大的樣本,我們針對特定的差距,δ,指定一拒絕H0的機會,利用β的公式就可知道樣本數(shù)了。α=P[rejectH0|μ1=μ2],β(δ)=P[acceptH0||μ1–μ2|=δ]β的計算:R={|t|>tα/2},β(δ)=?(與σ有關(guān))1/11/202324dsn2n78910t.0252.179power0.928α=0.05,d=1:【例】:比較水泥砂漿配方之例,假設(shè)平均張力強度的差異是0.5kgf/cm2

時,會對水泥使用上造成影響,所以要求要有很大的機會檢定出二種水泥的平均強度超過此標(biāo)準(zhǔn),若要求有95%機會測出差異,n應(yīng)該多少?d=0.5/2σ,假設(shè)由之前的經(jīng)標(biāo)準(zhǔn)差將不超過0.25,以0.25代入,得到d=1,另由OCcurve查出:n*=2n-1=16,n=9。我們應(yīng)該各抽出9筆資料。n=?1/11/202325dsn2Figure2.12(p.41)

Operatingcharacteristiccurvesforthetwo-sidedt-testwithα=0.05.

(Reproducedwithpermissionfrom"OperatingCharacteristicsfortheCommonStatisticalTestsofSignificance,"

C.L.Ferris,F.E.Grubbs,andC.L.Weaver,AnnalsofMathematicalStatistics,June1946.)OCcurve

:(OperatingCharacteristiccurve)依據(jù)選定的β值可按圖得到適當(dāng)?shù)臉颖緮?shù)。1/11/202326dsn2Data:(x1,y1),…,(xn,yn)LetDi=xi-yi

,i=1,…,n.ThenD1,…,Dnisani.i.d.normalsamplefromapopulationwithmeanμ

=

μx

–μy.Theone-sampletechniquescanbeappliedtoD1,…,Dn比較二配對樣本之分析法【方法】Pairedt-test1/11/202327dsn2【例2.2】

比較兩種演算法所需cpu

時間.觀察值:計算所需時間變因:演算,treatments:演算法(I)、演算法(II)

其他影響因素:題目的難易程度實驗設(shè)計:取10個題目,以二演算法得解,分別記錄cpu

時間。

data:10problemsforbothtypes分析:

用pairedttest1/11/202328dsn2計算二組資料之差

t.025;(9)=2.262,p-value=0.0005

結(jié)論:二組資料平均數(shù)差異顯著.差異之信賴區(qū)間

Under95%confidencelevel:1/11/202329dsn2【例2.3

】HardnessTestingExperiment

主題:比較

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論