實(shí)驗(yàn)設(shè)計(jì)第三講方差分析和回歸分析_第1頁
實(shí)驗(yàn)設(shè)計(jì)第三講方差分析和回歸分析_第2頁
實(shí)驗(yàn)設(shè)計(jì)第三講方差分析和回歸分析_第3頁
實(shí)驗(yàn)設(shè)計(jì)第三講方差分析和回歸分析_第4頁
實(shí)驗(yàn)設(shè)計(jì)第三講方差分析和回歸分析_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

實(shí)驗(yàn)設(shè)計(jì)第三講方差分析和回歸分析第1頁,課件共76頁,創(chuàng)作于2023年2月2簡單比較實(shí)驗(yàn)回顧兩獨(dú)立樣本t檢驗(yàn)小樣本,方差未知,分方差齊和方差不齊兩種情形。兩獨(dú)立樣本Z檢驗(yàn)兩個(gè)總體為正態(tài),且方差已知;或者大樣本情形。配對(duì)樣本t檢驗(yàn)實(shí)質(zhì)轉(zhuǎn)化為一個(gè)總體均值與已知值(0)的比較。第2頁,課件共76頁,創(chuàng)作于2023年2月3假設(shè)兩種配方的方差是相等的,檢驗(yàn)統(tǒng)計(jì)量是,是的一個(gè)估計(jì)量第3頁,課件共76頁,創(chuàng)作于2023年2月4假設(shè)兩種配方的方差不相等,檢驗(yàn)統(tǒng)計(jì)量是,第4頁,課件共76頁,創(chuàng)作于2023年2月5若已知,且在原假設(shè)為真的前提下有第5頁,課件共76頁,創(chuàng)作于2023年2月6第6頁,課件共76頁,創(chuàng)作于2023年2月7本例第7頁,課件共76頁,創(chuàng)作于2023年2月8單側(cè)檢驗(yàn)第8頁,課件共76頁,創(chuàng)作于2023年2月9樣品桿尖1桿尖2di=y1i-y22443158806321724-2899095411045-1第9頁,課件共76頁,創(chuàng)作于2023年2月10配對(duì)樣本的基本模型是桿尖i在樣品j上的讀數(shù)是桿尖i的硬度平均讀數(shù)值是樣品j的硬度效應(yīng)(區(qū)組效應(yīng))第10頁,課件共76頁,創(chuàng)作于2023年2月11計(jì)算第j個(gè)配對(duì)值dj因此,就等價(jià)于當(dāng)用配對(duì)方式出現(xiàn)是,硬度效應(yīng)就會(huì)消失第11頁,課件共76頁,創(chuàng)作于2023年2月12模型轉(zhuǎn)換轉(zhuǎn)化為總體方差未知時(shí),單總體樣本與已知均值u=0的比較t檢驗(yàn)第12頁,課件共76頁,創(chuàng)作于2023年2月13本例第13頁,課件共76頁,創(chuàng)作于2023年2月14配對(duì)與獨(dú)立的比較:置信區(qū)間配對(duì)獨(dú)立第14頁,課件共76頁,創(chuàng)作于2023年2月15關(guān)于方差齊性檢驗(yàn)兩個(gè)正態(tài)總體方差是否相等?當(dāng)H0為真時(shí),第15頁,課件共76頁,創(chuàng)作于2023年2月16第16頁,課件共76頁,創(chuàng)作于2023年2月17平衡設(shè)計(jì)與非平衡設(shè)計(jì)當(dāng)每一種處理的重復(fù)次數(shù)相等的時(shí)候,我們稱這種設(shè)計(jì)為平衡設(shè)計(jì),相應(yīng)的實(shí)驗(yàn)為平衡實(shí)驗(yàn)。反之,如果重復(fù)次數(shù)不相等,則稱之為非平衡設(shè)計(jì)與非平衡實(shí)驗(yàn)。第17頁,課件共76頁,創(chuàng)作于2023年2月18樣本量的有關(guān)問題第18頁,課件共76頁,創(chuàng)作于2023年2月19樣本量與正態(tài)性假設(shè)(一)前述t檢驗(yàn)其實(shí)要求總體符合正態(tài)分布,意味著之前要對(duì)總體是否是正態(tài)總體進(jìn)行一個(gè)所謂的正態(tài)性檢驗(yàn)。當(dāng)樣本量很小時(shí)候,進(jìn)行正態(tài)性檢驗(yàn)的效率本身不高。因此只能根據(jù)常識(shí)判斷是否符合正態(tài)分布。如果是小樣本,總體的確不符合正態(tài)分布,此時(shí)需要用到非參數(shù)檢驗(yàn)的方法,此時(shí)效率更低,而且在小樣本情況下難以得出有效結(jié)論。第19頁,課件共76頁,創(chuàng)作于2023年2月20樣本量與正態(tài)性假設(shè)(二)事實(shí)上,只要實(shí)驗(yàn)數(shù)據(jù)滿足隨機(jī)化原則,即使總體不符合正態(tài)分布,用t檢驗(yàn)方法與非參數(shù)方法檢驗(yàn)結(jié)果總是很接近的。而在大樣本的情況下,即使總體不符合正態(tài)分布,也可以利用中心極限定理認(rèn)為統(tǒng)計(jì)量總是近似符合正態(tài)分布。

因此,總體是否為正態(tài),我們并不太關(guān)注。此約束條件可以放松。第20頁,課件共76頁,創(chuàng)作于2023年2月21樣本量與檢驗(yàn)的效率樣本量越大,檢驗(yàn)的效率越高,即當(dāng)樣本量很大時(shí),即使是細(xì)微的差異,也可能在統(tǒng)計(jì)上是顯著的。但是這在統(tǒng)計(jì)上并非總是需要的,有些統(tǒng)計(jì)上的顯著差異在專業(yè)上也許是無意義的。因此,對(duì)統(tǒng)計(jì)檢驗(yàn)往往不能簡單地關(guān)心兩個(gè)處理之間是否存在差異,而是關(guān)心這種差異是否達(dá)到某種極限。第21頁,課件共76頁,創(chuàng)作于2023年2月22樣本量與檢驗(yàn)的條件等方差檢驗(yàn)的效率要高于異方差,在樣本量較小的條件下,這種差異比較明顯,但是在大樣本的場合下,兩種檢驗(yàn)的效率就非常接近了。但這時(shí)推薦使用異方差的檢驗(yàn)結(jié)果。因?yàn)榈确讲罴僭O(shè)總是“軟”的,總是我們不能“拒絕原假設(shè)”的條件下做出的,而異方差則是硬結(jié)論。可以在任何樣本量下先做異方差條件下的檢驗(yàn),如果此時(shí)都能拒絕原假設(shè),則就不必進(jìn)行等方差條件下的檢驗(yàn)了。若檢驗(yàn)不出顯著差異,則可以進(jìn)行方差齊性檢驗(yàn),再在方差齊的條件下進(jìn)行檢驗(yàn)。第22頁,課件共76頁,創(chuàng)作于2023年2月23方差分析第23頁,課件共76頁,創(chuàng)作于2023年2月24方差分析在實(shí)驗(yàn)設(shè)計(jì)中的作用影響實(shí)驗(yàn)指標(biāo)的因素可以只有一個(gè),也可以有多個(gè),這些稱為factor。各個(gè)因素可以取多個(gè)水平,因此,不同的因素及其不同的水平,都可以看作不同的總體。通過實(shí)驗(yàn)數(shù)據(jù)來分析不同因素和不同水平對(duì)實(shí)驗(yàn)指標(biāo)的影響程度的方法,就是方差分析方法。第24頁,課件共76頁,創(chuàng)作于2023年2月25方差分析的主要內(nèi)容單因素實(shí)驗(yàn)的方差分析雙因素實(shí)驗(yàn)的方差分析多因素實(shí)驗(yàn)的方差分析第25頁,課件共76頁,創(chuàng)作于2023年2月26單因素實(shí)驗(yàn)的方差分析第26頁,課件共76頁,創(chuàng)作于2023年2月27單因素方差分析模型因素水平12…niA1x11x12…x1n1A2x21x22…x2n2……………Aixi1xi2…xini……………Aaxa1xa2…xana第27頁,課件共76頁,創(chuàng)作于2023年2月28模型的三項(xiàng)基本假定正態(tài)性:所有數(shù)據(jù)符合正態(tài)分布;(均值不一定相等)方差齊性:所有數(shù)據(jù)的方差相等;(不同總體的方差相等)隨機(jī)性(所有實(shí)驗(yàn)數(shù)據(jù)相互獨(dú)立,即誤差項(xiàng)相互獨(dú)立)。第28頁,課件共76頁,創(chuàng)作于2023年2月29模型Ai水平下有樣本數(shù)據(jù)xi1,xi2,…,xini來自于正態(tài)總體第29頁,課件共76頁,創(chuàng)作于2023年2月30第30頁,課件共76頁,創(chuàng)作于2023年2月31方差分析的任務(wù)是檢驗(yàn)該線性統(tǒng)計(jì)模型中a個(gè)總體的均值是否相等第31頁,課件共76頁,創(chuàng)作于2023年2月32固定效應(yīng)模型與隨機(jī)效應(yīng)模型簡單了解第32頁,課件共76頁,創(chuàng)作于2023年2月33固定效應(yīng)模型a個(gè)處理(水平)由實(shí)驗(yàn)者具體選定。且滿足約束條件得到的相關(guān)結(jié)論僅適用于分析中所考慮的因素水平,不能推廣至未曾明確考慮的相似處理中。第33頁,課件共76頁,創(chuàng)作于2023年2月34隨機(jī)效應(yīng)模型(方差分量模型)把a(bǔ)個(gè)處理(水平)看作是來自一個(gè)較大的處理總體的一個(gè)隨機(jī)樣本。在此情形下,希望能夠把結(jié)論推廣至總體所有可能的處理當(dāng)中。而不管它在分析中是否明確考慮。此時(shí)是隨機(jī)變量。例如實(shí)驗(yàn)者關(guān)注很多可能水平的因素,若從這多個(gè)水平中隨機(jī)選取a個(gè)水平,則稱因素是隨機(jī)的。第34頁,課件共76頁,創(chuàng)作于2023年2月35總離差平方和的分解水平Ai下的樣本均值樣本數(shù)據(jù)的總均值總離差平方和第35頁,課件共76頁,創(chuàng)作于2023年2月36總離差平方和的分解第36頁,課件共76頁,創(chuàng)作于2023年2月37總離差平方和的分解總離差平方和因素A效應(yīng)平方和,組間差A(yù)i水平下樣本值與樣本均值之間的差異,由于隨機(jī)誤差引起的,稱為誤差平方和第37頁,課件共76頁,創(chuàng)作于2023年2月38總離差平方和的分布H0成立時(shí)(即因素水平效應(yīng)為零時(shí),即所有樣本數(shù)據(jù)來自于同一個(gè)正態(tài)總體)第38頁,課件共76頁,創(chuàng)作于2023年2月39誤差平方和的分布無論H0成立與否第39頁,課件共76頁,創(chuàng)作于2023年2月40因素A效應(yīng)的平方和第40頁,課件共76頁,創(chuàng)作于2023年2月41第41頁,課件共76頁,創(chuàng)作于2023年2月42第42頁,課件共76頁,創(chuàng)作于2023年2月43在原假設(shè)成立的條件下而第43頁,課件共76頁,創(chuàng)作于2023年2月44事實(shí)上第44頁,課件共76頁,創(chuàng)作于2023年2月45在H0成立的條件下,統(tǒng)計(jì)量MeanSquare均方第45頁,課件共76頁,創(chuàng)作于2023年2月46方差來源平方和自由度均方F比因素ASAa-1MSAF=MSA/MSE誤差ESEn-aMSE總和TSTn-1第46頁,課件共76頁,創(chuàng)作于2023年2月47簡化計(jì)算公式P8例題1.1.1思考:請問這里的F檢驗(yàn)是單側(cè)還是雙側(cè)的?第47頁,課件共76頁,創(chuàng)作于2023年2月48完全隨機(jī)化的單因素實(shí)驗(yàn)設(shè)計(jì)例:產(chǎn)品開發(fā)工程師考慮讓合成纖維的抗拉強(qiáng)度增加的方案。根據(jù)經(jīng)驗(yàn),抗拉強(qiáng)度會(huì)受纖維中所含的棉花的比例的影響。而且還知道,若要成品布具有所希望的質(zhì)量特性(受恒壓加工處理),棉花的含量應(yīng)當(dāng)在10-40%之間?,F(xiàn)在決定檢驗(yàn)15%,20%,25%,30%,35%這五種棉花含量水平。每種水平試驗(yàn)5種樣品。a=5,n1=n2=n3=n4=n5=5如何來安排實(shí)驗(yàn)?第48頁,課件共76頁,創(chuàng)作于2023年2月49實(shí)驗(yàn)編號(hào)棉花含量實(shí)驗(yàn)序號(hào)15%1234520%67891025%111213141530%161718192035%2122232425第49頁,課件共76頁,創(chuàng)作于2023年2月50如何進(jìn)行實(shí)驗(yàn)?第50頁,課件共76頁,創(chuàng)作于2023年2月51隨機(jī)抽選序號(hào)進(jìn)行實(shí)驗(yàn)例如利用隨機(jī)數(shù)表選擇序號(hào),直到做完25個(gè)實(shí)驗(yàn)為止。之所以如此進(jìn)行,是為了防止未知的干擾因素對(duì)實(shí)驗(yàn)結(jié)果造成污染。因此即是進(jìn)行所謂的隨機(jī)化。如果依次按照1-25號(hào)做完實(shí)驗(yàn),會(huì)有什么后果?第51頁,課件共76頁,創(chuàng)作于2023年2月52為何說檢驗(yàn)若干個(gè)均值是否相等的恰當(dāng)方法是方差分析?例如前例檢驗(yàn)五個(gè)均值是否相等u1=u2=u3=u4=u5一種做法是可以利用兩個(gè)獨(dú)立樣本的t檢驗(yàn)來檢驗(yàn)所有可能樣本對(duì)需要檢驗(yàn)多少次?假設(shè)檢驗(yàn)犯錯(cuò)誤的概率大為增加:1-0.9510=1-0.60=0.40第52頁,課件共76頁,創(chuàng)作于2023年2月53多重比較

在否定了原假設(shè)之后,并未明確指出哪些均值不同。此時(shí)需要進(jìn)一步比較各組均值之間的差異,即所謂的多重比較。需要檢驗(yàn)個(gè)假設(shè):第53頁,課件共76頁,創(chuàng)作于2023年2月54最小顯著性差異法(LSD)第54頁,課件共76頁,創(chuàng)作于2023年2月55第55頁,課件共76頁,創(chuàng)作于2023年2月56第56頁,課件共76頁,創(chuàng)作于2023年2月57雙邊檢驗(yàn),則當(dāng)就認(rèn)為與有顯著差異就是所謂的最小顯著性差異此時(shí)只需要將每對(duì)均值差的絕對(duì)值與LSD比較,如果大于LSD,就顯著。否則就不顯著。第57頁,課件共76頁,創(chuàng)作于2023年2月58LSD方法的問題可能極大地提高犯第一類錯(cuò)誤的風(fēng)險(xiǎn);有時(shí)候方差分析的F值是顯著的,但利用LSD方法找不到任何有顯著差異的水平對(duì)。即有些差異不一定以兩個(gè)水平的均值之差表現(xiàn)出來。LSD方法與Duncan方法在眾多的多重比較方法中,功效是最強(qiáng)的。第58頁,課件共76頁,創(chuàng)作于2023年2月59正態(tài)性檢驗(yàn)正態(tài)概率紙法殘差圖法第59頁,課件共76頁,創(chuàng)作于2023年2月60正態(tài)概率紙法橫坐標(biāo)等間隔,表示觀察值大?。豢v坐標(biāo)表示觀察值中不超過值x的數(shù)據(jù)個(gè)數(shù)占全部觀察值個(gè)數(shù)的比例;任意兩個(gè)方差相等的正態(tài)分布函數(shù)呈現(xiàn)平行的直線狀。第60頁,課件共76頁,創(chuàng)作于2023年2月61正態(tài)分布右偏分布左偏分布正態(tài)概率紙第61頁,課件共76頁,創(chuàng)作于2023年2月62具體操作檢驗(yàn)x1,x2,…,xm是否來自于正態(tài)總體的一個(gè)樣本。1)把樣本數(shù)據(jù)進(jìn)行排序x(1)≤x(2)≤…≤x(m),一般要求m>8。2)計(jì)算x(j)處的累積概率用修正頻率來估計(jì),計(jì)算出這些估計(jì)值3)把m個(gè)點(diǎn)[x(j),j/(m+1)]逐一點(diǎn)在正態(tài)概率紙張上。4)用目測判斷,若大致在一條直線周圍,則來自于正態(tài)總體,若非,則不是正態(tài)總體。第62頁,課件共76頁,創(chuàng)作于2023年2月63正態(tài)概率紙法的缺陷實(shí)驗(yàn)設(shè)計(jì)中,重復(fù)次數(shù)少于8的情形很多,此時(shí)單獨(dú)就每組樣本數(shù)據(jù)使用正態(tài)概率紙來檢驗(yàn),效果不好。容易判斷失誤;怎么辦第63頁,課件共76頁,創(chuàng)作于2023年2月64可行辦法一:匯總殘差項(xiàng)數(shù)把各組的殘差合并成一個(gè)大樣本之后再利用正態(tài)概率紙法來診斷第64頁,課件共76頁,創(chuàng)作于2023年2月65若ni相同,均為m,則諸殘差來自于同一正態(tài)分布總體因此,在各處理重復(fù)次數(shù)接近時(shí),就可以利用正態(tài)概率紙法,將殘差合并進(jìn)行正態(tài)性檢驗(yàn)。第65頁,課件共76頁,創(chuàng)作于2023年2月66殘差對(duì)原始數(shù)據(jù)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論