




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
時(shí)間反復(fù)無(wú)常,鼓著翅膀飛逝概率論及數(shù)理統(tǒng)計(jì)方差分析與回歸分析概率論及數(shù)理統(tǒng)計(jì)方差分析與回歸分析時(shí)間反復(fù)無(wú)常,鼓著翅膀飛逝概率論及數(shù)理統(tǒng)計(jì)方差分析與回歸分析第八章方差分析與回歸分析§8.1方差分析§8.2多重比較§8.3方差齊性分析§8.4一元線性回歸§8.5一元非線性回歸§8.1方差分析8.1.1問(wèn)題的提出實(shí)際工作中我們經(jīng)常碰到多個(gè)正態(tài)總體均值的比較問(wèn)題,處理這類(lèi)問(wèn)題通常采用所謂的方差分析方法。英語(yǔ)作為世界通用語(yǔ)言是一門(mén)基礎(chǔ)性學(xué)科,其口語(yǔ)交際能力更是一個(gè)人綜合素質(zhì)的體現(xiàn)。然而,在廣大農(nóng)村地區(qū),初中英語(yǔ)教育并沒(méi)有得到良好的重視,并且由于缺乏相應(yīng)的教學(xué)資金和教育人才,農(nóng)村初中英語(yǔ)口語(yǔ)交際教學(xué)一直很薄弱。這極大影響了初中生們的升學(xué)和未來(lái)的發(fā)展。1農(nóng)村初中英語(yǔ)口語(yǔ)交際教學(xué)出現(xiàn)的問(wèn)題1.1缺乏語(yǔ)言環(huán)境農(nóng)村人連普通話都不一定能講,更何況是英語(yǔ)。初中的學(xué)生不管是在學(xué)校還是在家里都缺乏英語(yǔ)口語(yǔ)交際的語(yǔ)言環(huán)境。在學(xué)校也只是英語(yǔ)課的時(shí)候朗讀一下英語(yǔ)單詞,背誦英語(yǔ)課文。其他時(shí)候并沒(méi)有機(jī)會(huì)接觸到英語(yǔ),更何況是用英語(yǔ)和別人交流。由于缺乏一定的語(yǔ)言環(huán)境,導(dǎo)致學(xué)生不敢也不善于用英語(yǔ)與別人交際,英語(yǔ)口語(yǔ)也是比城市的小孩差。1.2英語(yǔ)教師的口語(yǔ)水平低廣大農(nóng)村地區(qū),由于教師工資比城市低,交通又不方便等等,很多優(yōu)秀的外語(yǔ)教育工作者并不會(huì)選擇去農(nóng)村教書(shū)。很多農(nóng)村的英語(yǔ)老師就是當(dāng)?shù)氐囊恍┱莆樟艘稽c(diǎn)英語(yǔ)基礎(chǔ)的人擔(dān)任的。大部分經(jīng)過(guò)專(zhuān)業(yè)訓(xùn)練的外語(yǔ)教師很少留在農(nóng)村教學(xué)。這樣一來(lái),就導(dǎo)致英語(yǔ)教師的口語(yǔ)水平低。老師的口語(yǔ)水平低,那學(xué)生的口語(yǔ)水平自然不高。因此,和城市的小孩比起來(lái),農(nóng)村的小孩受到的外語(yǔ)教育缺失,外語(yǔ)教育資源極度匱乏。1.3注重應(yīng)試技巧少口語(yǔ)培訓(xùn)對(duì)于大山里的小孩來(lái)說(shuō),最大的夢(mèng)想大概就是飛出大山,然后成為一個(gè)城市人,能夠用知識(shí)改變命運(yùn)。因此,大部分的農(nóng)村還是以應(yīng)試教育為主,素質(zhì)教育還沒(méi)有延伸到廣大農(nóng)村地區(qū)。英語(yǔ)考試不考口語(yǔ),對(duì)于農(nóng)村的小孩來(lái)說(shuō)就不會(huì)多練口語(yǔ),因?yàn)樵谒麄兛磥?lái)練了也沒(méi)用,還不如多做幾道題,熟悉做題的規(guī)則。也正是因?yàn)樽⒅貞?yīng)試技巧缺少口語(yǔ)培訓(xùn),因此,農(nóng)村的初中口語(yǔ)交際能力很差,也必須從源頭上進(jìn)行改進(jìn)。1.4聽(tīng)英語(yǔ)機(jī)會(huì)少對(duì)于城市的小孩來(lái)說(shuō),聽(tīng)英語(yǔ)的機(jī)會(huì)還是很多的。一方面可能家長(zhǎng)就會(huì)在家里看美劇英劇等等,因此從小就有一定的聽(tīng)力基礎(chǔ)。另一方面,在街上可能就能碰到老外在講英文。但是在農(nóng)村,這種機(jī)會(huì)非常之少,父母大部分沒(méi)文化,只會(huì)看國(guó)產(chǎn)劇,在街上也碰不到老外。唯一聽(tīng)英語(yǔ)的機(jī)會(huì)估計(jì)就是聽(tīng)英語(yǔ)磁帶,更何況英語(yǔ)磁帶是一種機(jī)械性的播放,特別的無(wú)聊,根本不能引起小孩學(xué)英語(yǔ)的興趣。因此,農(nóng)村的小孩對(duì)于英語(yǔ)應(yīng)該是比較陌生而機(jī)械的。1.5心理障礙農(nóng)村的小孩普遍比較害羞,讓他們?cè)诠妶?chǎng)合講英語(yǔ),他們可能都能臉紅。一方面是因?yàn)槿狈@種大場(chǎng)面的培養(yǎng),另一方面也是由于自身的心理障礙??傆X(jué)得自己講不好很丟臉,也覺(jué)得自己為什么要開(kāi)口講英文。正是由于心理障礙問(wèn)題的存在,英語(yǔ)口語(yǔ)交際才會(huì)出現(xiàn)這樣或者那樣的問(wèn)題??梢?jiàn),對(duì)于初中生的心里建設(shè)是多么重要。2農(nóng)村初中英語(yǔ)口語(yǔ)交際教學(xué)策略2.1創(chuàng)造一定的口語(yǔ)環(huán)境口語(yǔ)環(huán)境對(duì)于一個(gè)初中生的口語(yǔ)訓(xùn)練來(lái)講是非常的。只有一個(gè)良好的口語(yǔ)環(huán)境才能培養(yǎng)出一個(gè)優(yōu)秀的英語(yǔ)口語(yǔ)學(xué)生。對(duì)于一個(gè)外語(yǔ)來(lái)講,需要?jiǎng)?chuàng)造出一定的口語(yǔ)環(huán)境。比如,在英語(yǔ)課堂上,不要只是念課文,講題目,還需要和學(xué)生互動(dòng),讓學(xué)生念課文,讓學(xué)生組團(tuán)模仿課文的對(duì)話等等。還可以創(chuàng)造一些英語(yǔ)場(chǎng)景,讓學(xué)生自己組織并表演出來(lái)。就這樣的在各種外語(yǔ)環(huán)境的熏陶下,學(xué)生的口語(yǔ)交際能力才能提高。2.2引進(jìn)優(yōu)秀的外語(yǔ)教師外語(yǔ)教師會(huì)影響一個(gè)學(xué)生的英語(yǔ)基礎(chǔ),甚至影響其整個(gè)英語(yǔ)生涯。優(yōu)秀的外語(yǔ)教師能夠帶領(lǐng)學(xué)生往正確的方向發(fā)展,能夠糾正學(xué)生的發(fā)音,能夠啟蒙學(xué)生的英語(yǔ)感覺(jué),甚至能夠讓學(xué)生對(duì)外語(yǔ)產(chǎn)生興趣。因此,對(duì)于初中學(xué)生來(lái)說(shuō),一個(gè)優(yōu)秀的外語(yǔ)教師實(shí)在是太重要了。農(nóng)村雖然落后,但是相關(guān)教育部門(mén)可以投入一部分資金引進(jìn)一些比較優(yōu)秀的教師,把優(yōu)秀的人才吸引過(guò)來(lái)。只有這樣才能真正提高學(xué)生的英語(yǔ)口語(yǔ)交際能力。2.3多加強(qiáng)口語(yǔ)培訓(xùn)外語(yǔ)口語(yǔ)能力和其他能力一樣也是需要多練的,只不過(guò)口語(yǔ)交際能力是用嘴巴講,其他的考試能力是用筆練。加強(qiáng)口語(yǔ)培訓(xùn),一方面需要外語(yǔ)老師創(chuàng)造一定的外語(yǔ)環(huán)境,除了在課堂上多與學(xué)生互動(dòng),同時(shí)還應(yīng)當(dāng)布置一些課后的口語(yǔ)作業(yè),在課堂上呈現(xiàn)。另一方面,除了課文的教育,外語(yǔ)教師還可以將國(guó)外的時(shí)事新聞和一些精彩的脫口秀節(jié)目播放給學(xué)生看,并叫他們學(xué)習(xí)模仿和跟讀等等。通過(guò)這一系列的培訓(xùn),學(xué)生的口語(yǔ)交際能力也能得到很大的提高,同時(shí)還開(kāi)闊了學(xué)生的視野。2.4加強(qiáng)學(xué)生的心理建設(shè)農(nóng)村的小孩,比不上城市的小孩生活條件好,同時(shí)也沒(méi)有那么豐富的課外活動(dòng),交際活動(dòng)也參加得少。在講英語(yǔ)時(shí),自身的心理障礙也比較難以克服,因此,很難讓他們開(kāi)口講英語(yǔ)。作為一個(gè)英語(yǔ)老師,學(xué)生的心理需要時(shí)時(shí)關(guān)注,并且在必要的時(shí)刻做一些心理建設(shè)。比如講述自己學(xué)英語(yǔ)的經(jīng)歷,以及讓學(xué)生和自己用英語(yǔ)對(duì)話,接著擴(kuò)展到班級(jí)。只要把學(xué)生的心理障礙克服了,那么練習(xí)英語(yǔ)口語(yǔ)就變得簡(jiǎn)單很多。作為一個(gè)優(yōu)秀的英語(yǔ)老師,應(yīng)當(dāng)首先從心理方面去了解自己的學(xué)生。只有這樣才能從根源上教好書(shū)。信息技術(shù)已經(jīng)廣泛應(yīng)用到生活、工作、學(xué)習(xí)中,培養(yǎng)學(xué)生的信息處理能力成為學(xué)校教育發(fā)展的必然要求。無(wú)論制訂教學(xué)計(jì)劃的出發(fā)點(diǎn)是信息技術(shù)文化觀,還是信息技術(shù)工具論,都把信息技術(shù)學(xué)科教學(xué)作為進(jìn)行信息技術(shù)教育的主要途徑,都強(qiáng)調(diào)通過(guò)在中學(xué)開(kāi)設(shè)信息技術(shù)學(xué)科課程培養(yǎng)學(xué)生的信息技術(shù)意識(shí)和應(yīng)用能力。根據(jù)信息技術(shù)本身的特點(diǎn),信息技術(shù)教學(xué)的思想、方法、模式應(yīng)是先進(jìn)、富有生命力和富有創(chuàng)意的。那么,如何在教學(xué)實(shí)踐中提高信息技術(shù)教學(xué)質(zhì)效呢?一、加強(qiáng)課前預(yù)習(xí)設(shè)計(jì)預(yù)習(xí)是重要的學(xué)習(xí)環(huán)節(jié),可以了解本節(jié)課的重點(diǎn)難點(diǎn)。很多信息技術(shù)教師不重視學(xué)生課前的預(yù)習(xí),再加上學(xué)校的硬件設(shè)備不同,有的學(xué)校有投影設(shè)備,教師可以演示;有的學(xué)校沒(méi)有投影設(shè)備,只能靠教師講。在學(xué)習(xí)過(guò)程中,學(xué)生會(huì)遇到問(wèn)題,在教材中尋找答案可以培養(yǎng)學(xué)生自主學(xué)習(xí)的能力,也可以相互討論,互相學(xué)習(xí)。這些都需要通過(guò)預(yù)習(xí)熟悉教材。1.布置預(yù)習(xí)任務(wù)。學(xué)生很少有預(yù)習(xí)的習(xí)慣,需要教師在上課前一天布置預(yù)習(xí)任務(wù)。內(nèi)容不要太難,讓學(xué)生通讀兩遍教材,了解講課順序。如果教材知識(shí)點(diǎn)較多,譬如在“運(yùn)用函數(shù)”、“絕對(duì)引用”、“相對(duì)引用”等內(nèi)容時(shí),可以自己編寫(xiě)預(yù)習(xí)題,讓學(xué)生總結(jié)概念。2.課前預(yù)習(xí)。信息技術(shù)課容量較大,在教學(xué)過(guò)程中要讓學(xué)生嘗試學(xué)習(xí),還要有充足的時(shí)間練習(xí),課堂教學(xué)時(shí)間比較緊張。為了充分利用時(shí)間,可以在學(xué)生進(jìn)機(jī)房前用三五分鐘預(yù)習(xí)。這種預(yù)習(xí)不需要通篇都看,教師提出教學(xué)重點(diǎn)難點(diǎn),學(xué)生重點(diǎn)閱讀教材。如在《資源管理器窗口》這一節(jié)中“節(jié)點(diǎn)”的概念是本節(jié)的突破口,可布置學(xué)生閱讀教材,了解節(jié)點(diǎn)的概念、節(jié)點(diǎn)符號(hào)的含義。3.預(yù)習(xí)效果的檢查。(1)上課提問(wèn)。在上課時(shí)有目的地提問(wèn)學(xué)生,檢查預(yù)習(xí)效果。好處:教師可以選擇檢查不同的學(xué)生,直接了解預(yù)習(xí)效果,掌握學(xué)生對(duì)于教材的理解程度,調(diào)整教學(xué)進(jìn)度。壞處:檢查面較窄;(2)小組討論。分小組討論本節(jié)課教學(xué)內(nèi)容,由小組成員總結(jié)重難點(diǎn),以及解決方法。好處:調(diào)動(dòng)學(xué)學(xué)生學(xué)習(xí)的積極性,培養(yǎng)學(xué)生交流合作的能力。壞處:不好控制進(jìn)度,容易浪費(fèi)時(shí)間;(3)落實(shí)到紙上。布置學(xué)生將預(yù)習(xí)到重點(diǎn)難點(diǎn),寫(xiě)到紙上,由教師批閱。好處:檢查面大;壞處:容易抄襲。二、有效選擇課堂教學(xué)方法教學(xué)方法的選擇不僅要考慮當(dāng)前的教序任務(wù)、教學(xué)內(nèi)容特點(diǎn)和學(xué)生的特點(diǎn),還要考慮教學(xué)手段、教學(xué)環(huán)境、教師特點(diǎn)等因素??偨Y(jié)起來(lái),選擇教學(xué)方法的依據(jù)主要有以下幾個(gè)方面:1.教學(xué)目的。每節(jié)課都有每節(jié)課的教學(xué)目的,目的不同,就需選擇不同的教學(xué)方法,要選擇與教學(xué)目的相適應(yīng)的能夠達(dá)到教學(xué)目的的教學(xué)方法。例如教師在向?qū)W生傳授新知識(shí)時(shí),采用講授法或演示法;學(xué)生在掌握動(dòng)作技能技巧時(shí),采用練習(xí)法等。2.教學(xué)內(nèi)容。教學(xué)目的是通過(guò)學(xué)生在教學(xué)過(guò)程中掌握特定的教學(xué)內(nèi)容實(shí)現(xiàn)的,各門(mén)學(xué)科都需要根據(jù)該學(xué)科中教學(xué)內(nèi)容的特點(diǎn),采取相應(yīng)的教學(xué)方法,即使某門(mén)學(xué)科教學(xué)進(jìn)程中的某一階段,隨其所教的具體內(nèi)容不同,也要采取不同的具體教學(xué)方法與之相適應(yīng)。例如中學(xué)信息技術(shù)課程常常采取講授與演示相結(jié)合的方法及上機(jī)實(shí)驗(yàn)法,但對(duì)于其中的網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用部分就要根據(jù)具體內(nèi)容,決定采取哪種教學(xué)方法,像網(wǎng)絡(luò)的基本概念,就會(huì)偏重于講授法,對(duì)于因特網(wǎng)所提供的各種信息服務(wù),則偏重于上機(jī)實(shí)驗(yàn)。3.學(xué)生情況。教師的教是為了學(xué)生的學(xué),教學(xué)方法要適應(yīng)學(xué)生的基礎(chǔ)條件和個(gè)性特征。有些學(xué)生對(duì)某種事物有大量的感性知識(shí),教師一講某一現(xiàn)象,學(xué)生就可以理解,不必都用直觀教具進(jìn)行演示,有些學(xué)生缺乏感性認(rèn)識(shí)基礎(chǔ),必須采取直觀演示的方法;對(duì)已有自主學(xué)習(xí)能力的學(xué)生,可以在學(xué)生自學(xué)的基礎(chǔ)上,針對(duì)學(xué)生學(xué)習(xí)中可能遇到的疑難問(wèn)題,運(yùn)用講解法,而對(duì)于尚無(wú)自主學(xué)習(xí)能力的學(xué)生,則需要一個(gè)時(shí)期的自學(xué)輔導(dǎo)訓(xùn)練,待學(xué)生具有一定自學(xué)能力時(shí)再采取在自主學(xué)習(xí)基礎(chǔ)上的有針對(duì)性地講解的方法。4.教師素養(yǎng)。教學(xué)方法的選用,只有適應(yīng)教師的素養(yǎng)條件,能為教師所掌握,才能發(fā)揮作用。有的教學(xué)方法雖好,但教師缺乏必要的素養(yǎng)條件,自己駕馭不了,不能在教學(xué)實(shí)踐中取得良好的效果。例如運(yùn)用啟發(fā)式教學(xué)法,教師對(duì)教學(xué)內(nèi)容的理解必須是有一定深度的,能隨著具體情況,從不同的角度,機(jī)動(dòng)靈活地用不同的語(yǔ)言表述對(duì)問(wèn)題的理解,針對(duì)學(xué)生問(wèn)題的矛盾焦點(diǎn),幾句話就啟迪學(xué)生,使學(xué)生豁然開(kāi)朗;如果教師對(duì)教學(xué)內(nèi)容的理解很膚淺,不能融會(huì)貫通,透徹掌握,只能教條地記住、背熟,那么,利用啟發(fā)談話法時(shí),遇到學(xué)生從各種不同角度提出各種不同的看法,就不會(huì)隨機(jī)應(yīng)變地抓住要點(diǎn)。教學(xué)方法是師生為達(dá)到教學(xué)目的而相互結(jié)合的活動(dòng)方式,包括教師教的方法和學(xué)生學(xué)的方法。教學(xué)中采用什么樣的教學(xué)方法教學(xué)生,對(duì)于把學(xué)生培養(yǎng)成什么樣的人,具有重要作用。這是因?yàn)榻處煹慕谭ㄍ萍s著學(xué)生的學(xué)法,同時(shí)給學(xué)生的智力和個(gè)性以重要的影響??傊诔踔袑?shí)施信息技術(shù)課程教育,需要教師不斷更新教學(xué)理念,積極實(shí)踐探索,以飽滿(mǎn)的熱情投入信息技術(shù)教學(xué),大膽創(chuàng)新,為信息技術(shù)課教學(xué)闖出一片新天地,切實(shí)提高教學(xué)質(zhì)效。時(shí)間反復(fù)無(wú)常,鼓著翅膀飛逝概率論及數(shù)理統(tǒng)計(jì)方差分析與回歸分析1第八章方差分析與回歸分析
§8.1
方差分析§8.2
多重比較§8.3
方差齊性分析§8.4
一元線性回歸§8.5
一元非線性回歸
第八章方差分析與回歸分析§8.1方差分析概率論及數(shù)理統(tǒng)計(jì)方差分析與回歸分析課件概率論及數(shù)理統(tǒng)計(jì)方差分析與回歸分析課件概率論及數(shù)理統(tǒng)計(jì)方差分析與回歸分析課件概率論及數(shù)理統(tǒng)計(jì)方差分析與回歸分析課件8.1.2
單因子方差分析的統(tǒng)計(jì)模型
在例8.1.1中我們只考察了一個(gè)因子,稱(chēng)其為單因子試驗(yàn)。
通常,在單因子試驗(yàn)中,記因子為A,設(shè)其有r個(gè)水平,記為A1,A2,…,Ar,在每一水平下考察的指標(biāo)可以看成一個(gè)總體,現(xiàn)有r個(gè)水平,故有r個(gè)總體,
假定:8.1.2單因子方差分析的統(tǒng)計(jì)模型在例8.每一總體均為正態(tài)總體,記為N(i,
i2),i=1,2,…,r;各總體的方差相同:1
2=22=…=
r2=
2;從每一總體中抽取的樣本是相互獨(dú)立的,即所有的試驗(yàn)結(jié)果yij都相互獨(dú)立。
每一總體均為正態(tài)總體,記為N(i,i2),我們要比較各水平下的均值是否相同,即要對(duì)如下的一個(gè)假設(shè)進(jìn)行檢驗(yàn):H0
:1
=2=…=r(8.1.1)備擇假設(shè)為H1
:1,2,…,r不全相等在不會(huì)引起誤解的情況下,H1通??墒÷圆粚?xiě)。如果H0成立,因子A的r個(gè)水平均值相同,稱(chēng)因子A的r個(gè)水平間沒(méi)有顯著差異,簡(jiǎn)稱(chēng)因子A不顯著;反之,當(dāng)H0不成立時(shí),因子A的r個(gè)水平均值不全相同,這時(shí)稱(chēng)因子A的不同水平間有顯著差異,簡(jiǎn)稱(chēng)因子A顯著。
我們要比較各水平下的均值是否相同,為對(duì)假設(shè)(8.1.1)進(jìn)行檢驗(yàn),需要從每一水平下的總體抽取樣本,設(shè)從第i個(gè)水平下的總體獲得m個(gè)試驗(yàn)結(jié)果,記yij表示第i個(gè)總體的第j次重復(fù)試驗(yàn)結(jié)果。共得如下n=rm個(gè)試驗(yàn)結(jié)果:yij,i=1,2,…,r,j=1,2,…,m,
其中r為水平數(shù),m為重復(fù)數(shù),i為水平編號(hào),j為重復(fù)編號(hào)。
為對(duì)假設(shè)(8.1.1)進(jìn)行檢驗(yàn),需要從每一水平下的總
在水平Ai下的試驗(yàn)結(jié)果yij與該水平下的指標(biāo)均值i一般總是有差距的,記ij=yiji,
ij稱(chēng)為隨機(jī)誤差。于是有yij=
i+ij
(8.1.2)(8.1.2)式稱(chēng)為試驗(yàn)結(jié)果yij的數(shù)據(jù)結(jié)構(gòu)式。
在水平Ai下的試驗(yàn)結(jié)果yij與該水平下的指標(biāo)均值i
單因子方差分析的統(tǒng)計(jì)模型:(8.1.3)
總均值與效應(yīng):稱(chēng)諸i的平均為總均值.稱(chēng)第i水平下的均值i與總均值
的差:
ai=i-為Ai的效應(yīng)。
單因子方差分析的統(tǒng)計(jì)模型:模型(8.1.3)可以改寫(xiě)為
(8.1.8)
假設(shè)(8.1.1)可改寫(xiě)為
H0
:a1
=a2=…=ar=0(8.1.9)
模型(8.1.3)可以改寫(xiě)為8.1.3平方和分解
一、試驗(yàn)數(shù)據(jù)通常在單因子方差分析中可將試驗(yàn)數(shù)據(jù)列成如下頁(yè)表格形式。表8.1.2中的最后二列的和與平均的含義如下:8.1.3平方和分解一、試驗(yàn)數(shù)據(jù)表8.1.2中的最后表8.1.2
單因子方差分析試驗(yàn)數(shù)據(jù)
因子水平
試驗(yàn)數(shù)據(jù)
和
平均
A1y11
y12
…y1mT1A2y21
y22
…y2mT2┆┆┆┆Aryr1
yr2
…yrmTrT表8.1.2單因子方差分析試驗(yàn)數(shù)據(jù)因子水平試驗(yàn)數(shù)據(jù)間是有差異的。數(shù)據(jù)yij與總平均間的偏差可用yij
表示,它可分解為二個(gè)偏差之和(8.1.10)記二、組內(nèi)偏差與組間偏差數(shù)據(jù)間是有差異的。數(shù)據(jù)yij與總平均間的偏差由于(8.1.11)所以yij-僅反映組內(nèi)數(shù)據(jù)與組內(nèi)平均的隨機(jī)誤差,稱(chēng)為組內(nèi)偏差;而(8.1.12)除了反映隨機(jī)誤差外,還反映了第i個(gè)水平的效應(yīng),稱(chēng)為組間偏差。由于在統(tǒng)計(jì)學(xué)中,把k個(gè)數(shù)據(jù)y1,y2,…,yk分別對(duì)其均值=(y1+…+yk)/k的偏差平方和稱(chēng)為k個(gè)數(shù)據(jù)的偏差平方和,它常用來(lái)度量若干個(gè)數(shù)據(jù)分散的程度。三、偏差平方和及其自由度在統(tǒng)計(jì)學(xué)中,把k個(gè)數(shù)據(jù)y1,y2,…,yk分別對(duì)其在構(gòu)成偏差平方和Q的k個(gè)偏差y1
,…,yk
間有一個(gè)恒等式,這說(shuō)明在Q中獨(dú)立的偏差只有k1個(gè)。在統(tǒng)計(jì)學(xué)中把平方和中獨(dú)立偏差個(gè)數(shù)稱(chēng)為該平方和的自由度,常記為f,如Q的自由度為fQ=k1。自由度是偏差平方和的一個(gè)重要參數(shù)。
在構(gòu)成偏差平方和Q的k個(gè)偏差y1,…,yk各yij間總的差異大小可用總偏差平方和
表示,其自由度為fT=n1;四、總平方和分解公式僅由隨機(jī)誤差引起的數(shù)據(jù)間的差異可以用組內(nèi)偏差平方和表示,也稱(chēng)為誤差偏差平方和,其自由度為fe=nr;各yij間總的差異大小可用總偏差平方和四、總平方和分解公式由于組間差異除了隨機(jī)誤差外,還反映了效應(yīng)間的差異,故由效應(yīng)不同引起的數(shù)據(jù)差異可用組間偏差平方和表示,也稱(chēng)為因子A的偏差平方和,其自由度為fA=r1;
由于組間差異除了隨機(jī)誤差外,還反映了效應(yīng)間的差異,故由效應(yīng)不定理8.1.1在上述符號(hào)下,總平方和ST可以分解為因子平方和SA與誤差平方和Se之和,其自由度也有相應(yīng)分解公式,具體為:ST=SA+Se,fT=fA+fe(8.1.16)(8.1.16)式通常稱(chēng)為總平方和分解式。
定理8.1.1在上述符號(hào)下,總平方和ST可以分解偏差平方和Q的大小與自由度有關(guān),為了便于在偏差平方和間進(jìn)行比較,統(tǒng)計(jì)上引入了均方和的概念,它定義為MS=Q/fQ,其意為平均每個(gè)自由度上有多少平方和,它比較好地度量了一組數(shù)據(jù)的離散程度。如今要對(duì)因子平方和SA與誤差平方和Se之間進(jìn)行比較,用其均方和MSA=SA
/fA,MSe=Se
/fe進(jìn)行比較更為合理,故可用作為檢驗(yàn)H0的統(tǒng)計(jì)量。8.1.4檢驗(yàn)方法偏差平方和Q的大小與自由度有關(guān),為了便于在偏差平方和定理8.1.2在單因子方差分析模型(8.1.8)及前述符號(hào)下,有(1)Se/
2~
2(nr),從而E(Se)
=(nr)
2,進(jìn)一步,若H0成立,則有SA/
2~
2(r1)(2)SA與Se獨(dú)立。
定理8.1.2在單因子方差分析模型(8.1.8)及由定理8.1.2,若H0成立,則檢驗(yàn)統(tǒng)計(jì)量F服從自由度為fA和fe的F分布,因此拒絕域?yàn)閃={FF1(fA,fe)},通常將上述計(jì)算過(guò)程列成一張表格,稱(chēng)為方差分析表。表8.1.3
單因子方差分析表來(lái)源平方和自由度均方和F比因子SAfA=r1MSA=SA/fAF=MSA/MSe誤差Sefe=nrMSe=Se/fe總和STfT=n1由定理8.1.2,若H0成立,則檢驗(yàn)統(tǒng)計(jì)量F服從自由度為fA對(duì)給定的,可作如下判斷:若F
F1(fA,fe),則說(shuō)明因子A不顯著。該檢驗(yàn)的p值也可利用統(tǒng)計(jì)軟件求出,若以Y記服從F(fA,fe)的隨機(jī)變量,則檢驗(yàn)的
p值為p=P(YF)。如果F>F1(fA,fe),則認(rèn)為因子A顯著;對(duì)給定的,可作如下判斷:若FF1(fA,fe常用的各偏差平方和的計(jì)算公式如下:
(8.1.19)
一般可將計(jì)算過(guò)程列表進(jìn)行。
常用的各偏差平方和的計(jì)算公式如下:例8.1.2采用例8.1.1的數(shù)據(jù),將原始數(shù)據(jù)減去1000,列表給出計(jì)算過(guò)程:表8.1.4例8.1.2的計(jì)算表水平數(shù)據(jù)(原始數(shù)據(jù)-1000)TiTi2A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363例8.1.2采用例8.1.1的數(shù)據(jù),將原始數(shù)據(jù)減去10利用(8.1.19),可算得各偏差平方和為:把上述諸平方和及其自由度填入方差分析表利用(8.1.19),可算得各偏差平方和為:表8.1.5例8.1.2的方差分析表
來(lái)源平方和自由度均方和F比因子9660.083324830.04173.5948
誤差28215.9584211343.6171總和37876.041723若取=0.05,則F0.95
(2
,21)=3.47,由于F=3.5948>3.47,故認(rèn)為因子A(飼料)是顯著的,即三種飼料對(duì)雞的增肥作用有明顯的差別。
表8.1.5例8.1.2的方差分析表來(lái)源平方和自由度8.1.5參數(shù)估計(jì)
在檢驗(yàn)結(jié)果為顯著時(shí),我們可進(jìn)一步求出總均值、各主效應(yīng)ai和誤差方差2的估計(jì)。
8.1.5參數(shù)估計(jì)在檢驗(yàn)結(jié)果為顯著時(shí),我們可一、點(diǎn)估計(jì)由模型(8.1.8)知諸yij相互獨(dú)立,且yij~N(+ai,2),因此,可使用極大似然方法求出一般平均、各主效應(yīng)ai和誤差方差2的估計(jì):由極大似然估計(jì)的不變性,各水平均值i的極大似然估計(jì)為,由于不是2的無(wú)偏估計(jì),可修偏:
一、點(diǎn)估計(jì)由于,可給出Ai的水平均值i的1-的置信區(qū)間為
其中。
二、置信區(qū)間由于例8.1.3繼續(xù)例8.1.2,此處我們給出諸水平均值的估計(jì)。因子A的三個(gè)水平均值的估計(jì)分別為從點(diǎn)估計(jì)來(lái)看,水平2(以槐樹(shù)粉為主的飼料)是最優(yōu)的。
例8.1.3繼續(xù)例8.1.2,此處我們給出諸水平均值的估誤差方差的無(wú)偏估計(jì)為利用(8.1.23)可以給出諸水平均值的置信區(qū)間。此處,,若?。?.05,則t1-
/2(fe)=t0.95(21
)=2.0796,,于是三個(gè)水平均值的0.95置信區(qū)間分別為誤差方差的無(wú)偏估計(jì)為在單因子試驗(yàn)的數(shù)據(jù)分析中可得到如下三個(gè)結(jié)果:
因子是否顯著;
試驗(yàn)的誤差方差2的估計(jì);
諸水平均值i的點(diǎn)估計(jì)與區(qū)間估計(jì)。
在因子A顯著時(shí),通常只需對(duì)較優(yōu)的水平均值作參數(shù)估計(jì),在因子A不顯著場(chǎng)合,參數(shù)估計(jì)無(wú)需進(jìn)行。在單因子試驗(yàn)的數(shù)據(jù)分析中可得到如下三個(gè)結(jié)果:因子8.1.6重復(fù)數(shù)不等情形單因子方差分析并不要求每個(gè)水平下重復(fù)試驗(yàn)次數(shù)全相等,在重復(fù)數(shù)不等場(chǎng)合的方差分析與重復(fù)數(shù)相等情況下的方差分析極為相似,只在幾處略有差別。
數(shù)據(jù):設(shè)從第i個(gè)水平下的總體獲得mi個(gè)試驗(yàn)結(jié)果,記為yi1
,yi2…,yim,i=1,2,…r,統(tǒng)計(jì)模型為:
(8.1.24)
8.1.6重復(fù)數(shù)不等情形數(shù)據(jù):設(shè)從第i個(gè)水平下的總體獲總均值:諸i的加權(quán)平均(所有試驗(yàn)結(jié)果的均值的平均)(8.1.25)稱(chēng)為總均值或一般平均。
效應(yīng)約束條件:
各平方和的計(jì)算:SA的計(jì)算公式略有不同
總均值:諸i的加權(quán)平均(所有試驗(yàn)結(jié)果的均值的平均)效應(yīng)約例8.1.4
某食品公司對(duì)一種食品設(shè)計(jì)了四種新包裝。為考察哪種包裝最受顧客歡迎,選了10個(gè)地段繁華程度相似、規(guī)模相近的商店做試驗(yàn),其中二種包裝各指定兩個(gè)商店銷(xiāo)售,另二個(gè)包裝各指定三個(gè)商店銷(xiāo)售。在試驗(yàn)期內(nèi)各店貨架排放的位置、空間都相同,營(yíng)業(yè)員的促銷(xiāo)方法也基本相同,經(jīng)過(guò)一段時(shí)間,記錄其銷(xiāo)售量數(shù)據(jù),列于表8.1.6左半邊,其相應(yīng)的計(jì)算結(jié)果列于右側(cè)。
例8.1.4某食品公司對(duì)一種食品設(shè)計(jì)了四種新包裝。表8.1.6銷(xiāo)售量數(shù)據(jù)及計(jì)算表
包裝類(lèi)型
銷(xiāo)售量
miTiTi2/miA11218230450468A2141213339507509A319172135710831091A4243025414581476和n=10T=180表8.1.6銷(xiāo)售量數(shù)據(jù)及計(jì)算表包裝類(lèi)型銷(xiāo)售量miT由此可求得各類(lèi)偏差平方和如下
方差分析表如表8.1.8所示.若?。?.01,查表得F0.01(3,6)=9.78,由于F=11.22>9.78,故我們可認(rèn)為各水平間有顯著差異。
由此可求得各類(lèi)偏差平方和如下若?。?.01,查表得F0.表8.1.7例8.1.4的方差分析表
來(lái)源平方和自由度均方和F比因子A25838611.22誤差e4667.67總和T3049表8.1.7例8.1.4的方差分析表來(lái)源平方和自由由于因子顯著,我們還可以給出諸水平均值的估計(jì)。因子A的四個(gè)水平均值的估計(jì)分別為由此可見(jiàn),第四種包裝方式效果最好。誤差方差的無(wú)偏估計(jì)為由于因子顯著,我們還可以給出諸水平均值的估計(jì)。因子A進(jìn)一步,利用(8.1.23)也可以給出諸水平均值的置信區(qū)間,只是在這里要用不同的mi代替那里相同的m。此處,,若?。?.05,則t1-/2(fe)=t0.95(6)=2.4469,
,于是效果較好的第三和第四個(gè)水平均值的0.95置信區(qū)間分別為
進(jìn)一步,利用(8.1.23)也可以給出諸水平均值的置§8.2
多重比較
8.2.1效應(yīng)差的置信區(qū)間如果方差分析的結(jié)果因子A顯著,則等于說(shuō)有充分理由認(rèn)為因子A各水平的效應(yīng)不全相同,但這并不是說(shuō)它們中一定沒(méi)有相同的。就指定的一對(duì)水平Ai與Aj,我們可通過(guò)求i-j的區(qū)間估計(jì)來(lái)進(jìn)行比較。
§8.2多重比較8.2.1效應(yīng)差的置信區(qū)間由于,故由此給出i-j的置信水平為1-的置信區(qū)間為(8.2.1)其中是2的無(wú)偏估計(jì)。這里的置信區(qū)間與第六章中的兩樣本的t區(qū)間基本一致,區(qū)別在于這里2的估計(jì)使用了全部樣本而不僅僅是兩個(gè)水平Ai,Aj下的觀測(cè)值。由于例8.2.1
繼續(xù)例8.1.2,,fe=21,?。?.05,則t1-/2(fe)=t0.975(21)=2.0796,于是可算出各個(gè)置信區(qū)間為
可見(jiàn)第一個(gè)區(qū)間在0的左邊,所以我們可以概率95%斷言認(rèn)為1
小于2,其它二個(gè)區(qū)間包含0點(diǎn),雖然從點(diǎn)估計(jì)角度看水平均值估計(jì)有差別,但這種差異在0.05水平上是不顯著的。
例8.2.1繼續(xù)例8.1.2,8.2.2多重比較問(wèn)題對(duì)每一組(i,j),(8.2.1)給出的區(qū)間的置信水平都是1,但對(duì)多個(gè)這樣的區(qū)間,要求其同時(shí)成立,其聯(lián)合置信水平就不再是1了。
8.2.2多重比較問(wèn)題譬如,設(shè)E1,…,Ek是k個(gè)隨機(jī)事件,且有
P(Ei)=1,i=1,…,k,則其同時(shí)發(fā)生的概率這說(shuō)明它們同時(shí)發(fā)生的概率可能比1小很多。為了使它們同時(shí)發(fā)生的概率不低于1,一個(gè)辦法是把每個(gè)事件發(fā)生的概率提高到1/k.這將導(dǎo)致每個(gè)置信區(qū)間過(guò)長(zhǎng),聯(lián)合置信區(qū)間的精度很差,一般人們不采用這種方法。
譬如,設(shè)E1,…,Ek是k個(gè)隨機(jī)事件,且有在方差分析中,如果經(jīng)過(guò)F檢驗(yàn)拒絕原假設(shè),表明因子A是顯著的,即r個(gè)水平對(duì)應(yīng)的水平均值不全相等,此時(shí),我們還需要進(jìn)一步確認(rèn)哪些水平均值間是確有差異的,哪些水平均值間無(wú)顯著差異。同時(shí)比較任意兩個(gè)水平均值間有無(wú)明顯差異的問(wèn)題稱(chēng)為多重比較,多重比較即要以顯著性水平同時(shí)檢驗(yàn)如下r(r1)/2個(gè)假設(shè):(8.2.2)
在方差分析中,如果經(jīng)過(guò)F檢驗(yàn)拒絕原假設(shè),表明因子A是直觀地看,當(dāng)H0ij成立時(shí),不應(yīng)過(guò)大,因此,關(guān)于假設(shè)(8.2.2)的拒絕域應(yīng)有如下形式諸臨界值應(yīng)在(8.2.2)成立時(shí)由P(W)=確定。下面分重復(fù)數(shù)相等和不等分別介紹臨界值的確定。
直觀地看,當(dāng)H0ij成立時(shí),
8.2.3重復(fù)數(shù)相等場(chǎng)合的T法
在重復(fù)數(shù)相等時(shí),由對(duì)稱(chēng)性自然可以要求諸cij相等,記為c.記,則由給定條件不難有
8.2.3重復(fù)數(shù)相等場(chǎng)合的T法于是當(dāng)(8.2.2)成立時(shí),1==r=,可推出其中,稱(chēng)為t化極差統(tǒng)計(jì)量,其分布可由隨機(jī)模擬方法得到。于是,其中q1(r,fe)表示q(r,fe)的1分位數(shù),其值在附表8中給出。于是當(dāng)(8.2.2)成立時(shí),1==r=重復(fù)數(shù)相同時(shí)多重比較可總結(jié)如下:對(duì)給定的的顯著性水平,查多重比較的分位數(shù)q(r,fe)表,計(jì)算,比較諸與c的大小,若則認(rèn)為水平Ai與水平Aj間有顯著差異,反之,則認(rèn)為水平Ai與水平Aj間無(wú)明顯差別。這一方法最早由Turkey提出,因此稱(chēng)為T(mén)法。
重復(fù)數(shù)相同時(shí)多重比較可總結(jié)如下:對(duì)給定的的顯著性水平
例8.2.2繼續(xù)例8.1.2,若取=0.05,則查表知q1-0.05(3,21)=3.57,而。所以,認(rèn)為1與2有顯著差別,認(rèn)為1與3無(wú)顯著差別,認(rèn)為2與3有顯著差別這說(shuō)明:1與3之間無(wú)顯著差別,而它們與2之間都有顯著差異。例8.2.2繼續(xù)例8.1.2,若取=0.05,8.2.4重復(fù)數(shù)不等場(chǎng)合的S法在重復(fù)數(shù)不等時(shí),若假設(shè)(8.2.2)成立,則或從而可以要求,在此要求下可推出8.2.4重復(fù)數(shù)不等場(chǎng)合的S法在重復(fù)數(shù)不等時(shí),若假設(shè)可以證明,從而亦即可以證明
例8.2.3在例8.1.4中,我們指出包裝方式對(duì)食品銷(xiāo)量有明顯的影響,此處r=4,fe=6,
,若取=0.05,則F0.95(3,6)=4.76。注意到m1=m4=2,m2=m3=3,故例8.2.3在例8.1.4中,我們指出包裝方式對(duì)食品銷(xiāo)由于這說(shuō)明A1,A2,
A3間無(wú)顯著差異,A1,A2與A4有顯著差異,但A4與A3的差異卻尚未達(dá)到顯著水平。綜合上述,包裝A4銷(xiāo)售量最佳。
由于§8.3方差齊性檢驗(yàn)
在進(jìn)行方差分析時(shí)要求r個(gè)方差相等,這稱(chēng)為方差齊性。理論研究表明,當(dāng)正態(tài)性假定不滿(mǎn)足時(shí)對(duì)F檢驗(yàn)影響較小,即F檢驗(yàn)對(duì)正態(tài)性的偏離具有一定的穩(wěn)健性,而F檢驗(yàn)對(duì)方差齊性的偏離較為敏感。所以r個(gè)方差的齊性檢驗(yàn)就顯得十分必要。所謂方差齊性檢驗(yàn)是對(duì)如下一對(duì)假設(shè)作出檢驗(yàn):(8.3.1)
§8.3方差齊性檢驗(yàn)在進(jìn)行方差分析時(shí)要求r個(gè)方很多統(tǒng)計(jì)學(xué)家提出了一些很好的檢驗(yàn)方法,這里介紹幾個(gè)最常用的檢驗(yàn),它們是:Hartley檢驗(yàn),僅適用于樣本量相等的場(chǎng)合;Bartlett檢驗(yàn),可用于樣本量相等或不等的場(chǎng)合,但是每個(gè)樣本量不得低于5;
修正的Bartlett檢驗(yàn),在樣本量較小或較大、相等或不等場(chǎng)合均可使用。
很多統(tǒng)計(jì)學(xué)家提出了一些很好的檢驗(yàn)方法,這里介紹幾個(gè)最8.3.1Hartley檢驗(yàn)
當(dāng)各水平下試驗(yàn)重復(fù)次數(shù)相等時(shí),即m1=m2==mr=m,Hartley提出檢驗(yàn)方差相等的檢驗(yàn)統(tǒng)計(jì)量:(8.3.2)這個(gè)統(tǒng)計(jì)量的分布無(wú)明顯的表達(dá)式,但在諸方差相等條件下,可通過(guò)隨機(jī)模擬方法獲得H分布的分位數(shù),該分布依賴(lài)于水平數(shù)r和樣本方差的自由度f(wàn)=m1,因此該分布可記為H(r,f),其分位數(shù)表列于附表10上。
8.3.1Hartley檢驗(yàn)當(dāng)各水平下試驗(yàn)重復(fù)直觀上看,當(dāng)H0成立,即諸方差相等(12=22==r2)時(shí),H的值應(yīng)接近于1,當(dāng)H的值較大時(shí),諸方差間的差異就大,H愈大,諸方差間的差異就愈大,這時(shí)應(yīng)拒絕(8.3.1)中的H0。由此可知,對(duì)給定的顯著性水平,檢驗(yàn)H0的拒絕域?yàn)閃={H>H1(r,f)}(8.3.3)其中H1(r,f)為H分布的1分位數(shù)。
直觀上看,當(dāng)H0成立,即諸方差相等(12=22
例8.3.1有四種不同牌號(hào)的鐵銹防護(hù)劑(簡(jiǎn)稱(chēng)防銹劑),現(xiàn)要比較其防銹能力。數(shù)據(jù)見(jiàn)表8.3.1。這是一個(gè)重復(fù)次數(shù)相等的單因子試驗(yàn)。我們考慮用方差分析方法對(duì)之進(jìn)行比較分析,為此,首先要進(jìn)行方差齊性檢驗(yàn)。例8.3.1有四種不同牌號(hào)的鐵銹防護(hù)劑(簡(jiǎn)稱(chēng)防銹劑),本例中,四個(gè)樣本方差可由表8.3.1中諸Qi求出,即由此可得統(tǒng)計(jì)量H的值
在=0.05時(shí),由附表10查得H0.95(4,9)=6.31,由于H<6.31,所以應(yīng)該保留原假設(shè)H0,即認(rèn)為四個(gè)總體方差間無(wú)顯著差異。
本例中,四個(gè)樣本方差可由表8.3.1中諸Qi求出,即8.3.2Bartlett檢驗(yàn)
在單因子方差分析中有r個(gè)樣本,設(shè)第i個(gè)樣本方差為:由于幾何平均數(shù)總不會(huì)超過(guò)算術(shù)平均數(shù),故有GMSe≤MSe
,其中
等號(hào)成立當(dāng)且僅當(dāng)諸si2彼此相等,若諸si2間的差異愈大,則此兩個(gè)平均值相差也愈大。
8.3.2Bartlett檢驗(yàn)在單因子方差分由此可見(jiàn),在比值GMSe/MSe較大時(shí),就意味著諸樣本方差差異較大,從而檢驗(yàn)(8.3.1)表示的一對(duì)假設(shè)的拒絕域應(yīng)是W={lnGMSe/MSe>>d}(8.3.4)Bartlett證明了,檢驗(yàn)的拒絕域?yàn)閃={B>1-2(r-1)}(8.3.8)考慮到這里2分布是近似分布,在諸樣本量mi均不小于5時(shí)使用上述檢驗(yàn)是適當(dāng)?shù)摹?/p>
由此可見(jiàn),在比值GMSe/MSe較大時(shí),就意味著諸樣
例8.3.2為研究各產(chǎn)地的綠茶的葉酸含量是否有顯著差異,特選四個(gè)產(chǎn)地綠茶,其中A1制作了7個(gè)樣品,A2制作了5個(gè)樣品,A3與A4各制作了6個(gè)樣品,共有24個(gè)樣品,按隨機(jī)次序測(cè)試其葉酸含量,測(cè)試結(jié)果如表8.3.3所示。
例8.3.2為研究各產(chǎn)地的綠茶的葉酸含量是否有顯著差異為能進(jìn)行方差分析,首先要進(jìn)行方差齊性檢驗(yàn),從表8.3.3中數(shù)據(jù)可求得s12=2.14,s22=2.83,s32=2.41,s42=1.12,再?gòu)谋?.3.4上查得MSe=2.09,由(8.3.6),可求得
再由(8.3.7),還可求得Bartlett檢驗(yàn)統(tǒng)計(jì)量的值對(duì)給定的顯著性水平=0.05,查表知0.952(41)=7.815。由于B<7.815,故應(yīng)保留原假設(shè)H0,即可認(rèn)為諸水平下的方差間無(wú)顯著差異。
為能進(jìn)行方差分析,首先要進(jìn)行方差齊性檢驗(yàn),從表8.38.3.3修正的Bartlett檢驗(yàn)
針對(duì)樣本量低于5時(shí)不能使用Bartlett檢驗(yàn)的缺點(diǎn),Box提出修正的Bartlett檢驗(yàn)統(tǒng)計(jì)量
(8.3.9)其中B與C如(8.3.7)與(8.3.6)所示,且8.3.3修正的Bartlett檢驗(yàn)針對(duì)樣本量在原假設(shè)H0:12=22==r2成立下,Box還證明了統(tǒng)計(jì)量的近似分布是F分布F(f1,f2),對(duì)給定的顯著性水平,該檢驗(yàn)的拒絕域?yàn)椋?.3.10)其中f2的值可能不是整數(shù),這時(shí)可通過(guò)對(duì)F分布的分位數(shù)表施行內(nèi)插法得到分位數(shù)。
在原假設(shè)H0:12=22==r2成立下,B
例8.3.3
對(duì)例8.3.2中的綠茶葉酸含量的數(shù)據(jù),我們用修正的Bartlett檢驗(yàn)再一次對(duì)等方差性作出檢驗(yàn)。在例8.3.2中已求得:C=1.0856,B=0.970,還可求得:
對(duì)給定的顯著性水平=0.05,在F分布的分位數(shù)表上可查得F0.95(3,682.4)=F0.95(3,)=2.60由于<2.60,故保留原假設(shè)H0,即認(rèn)為四個(gè)水平下的方差間無(wú)顯著差異。
例8.3.3對(duì)例8.3.2中的綠茶葉酸含量的數(shù)據(jù),我們§8.4
一元線性回歸
8.4.1變量間的兩類(lèi)關(guān)系十九世紀(jì),英國(guó)生物學(xué)家兼統(tǒng)計(jì)學(xué)家高爾頓研究發(fā)現(xiàn):其中x表示父親身高,y表示成年兒子的身高(單位:英寸,1英寸=2.54厘米)。這表明子代的平均高度有向中心回歸的意思,使得一段時(shí)間內(nèi)人的身高相對(duì)穩(wěn)定。之后回歸分析的思想滲透到了數(shù)理統(tǒng)計(jì)的其它分支中。
§8.4一元線性回歸8.4.1變量間的兩類(lèi)關(guān)系回歸分析便是研究變量間相關(guān)關(guān)系的一門(mén)學(xué)科。它通過(guò)對(duì)客觀事物中變量的大量觀察或試驗(yàn)獲得的數(shù)據(jù),去尋找隱藏在數(shù)據(jù)背后的相關(guān)關(guān)系,給出它們的表達(dá)形式——回歸函數(shù)的估計(jì)。變量間的相關(guān)關(guān)系不能用完全確切的函數(shù)形式表示,但在平均意義下有一定的定量關(guān)系表達(dá)式,尋找這種定量關(guān)系表達(dá)式就是回歸分析的主要任務(wù)?;貧w分析處理的是變量與變量間的關(guān)系。變量間常見(jiàn)的關(guān)系有兩類(lèi):確定性關(guān)系與相關(guān)關(guān)系?;貧w分析便是研究變量間相關(guān)關(guān)系的一門(mén)學(xué)科。它通過(guò)對(duì)客觀事物8.4.2一元線性回歸模型設(shè)y與x間有相關(guān)關(guān)系,稱(chēng)x為自變量(預(yù)報(bào)變量),y為因變量(響應(yīng)變量),在知道x取值后,y有一個(gè)分布p(yx),我們關(guān)心的是y的均值E(Yx):(8.4.1)這便是y關(guān)于x的理論回歸函數(shù)——條件期望,也就是我們要尋找的相關(guān)關(guān)系的表達(dá)式。通常,相關(guān)關(guān)系可用下式表示
y=f(x)+其中是隨機(jī)誤差,一般假設(shè)~N(0,
2)。
8.4.2一元線性回歸模型
例8.4.1
合金的強(qiáng)度y(×107Pa)與合金中碳的含量x(%)有關(guān)。為研究?jī)蓚€(gè)變量間的關(guān)系。首先是收集數(shù)據(jù),我們把收集到的數(shù)據(jù)記為(xi,yi),i=1,2,,n。本例中,我們收集到12組數(shù)據(jù),列于表8.4.1中
進(jìn)行回歸分析首先是回歸函數(shù)形式的選擇。當(dāng)只有一個(gè)自變量時(shí),通??刹捎卯?huà)散點(diǎn)圖的方法進(jìn)行選擇。例8.4.1合金的強(qiáng)度y(×107Pa)與合金表8.4.1合金鋼強(qiáng)度y與碳含量x的數(shù)據(jù)
序號(hào)x(%)y(×107Pa)序號(hào)x(%)y(×107Pa)10.1042.070.1649.020.1143.080.1753.030.1245.090.1850.040.1345.0100.2055.050.1445.0110.2155.060.1547.5120.2360.0表8.4.1合金鋼強(qiáng)度y與碳含量x的數(shù)據(jù)序號(hào)x(%)y為找出兩個(gè)量間存在的回歸函數(shù)的形式,可以畫(huà)一張圖:把每一對(duì)數(shù)(xi,yi)看成直角坐標(biāo)系中的一個(gè)點(diǎn),在圖上畫(huà)出n個(gè)點(diǎn),稱(chēng)這張圖為散點(diǎn)圖,見(jiàn)圖8.4.1
為找出兩個(gè)量間存在的回歸函數(shù)的形式,可以畫(huà)一張圖:從散點(diǎn)圖我們發(fā)現(xiàn)12個(gè)點(diǎn)基本在一條直線附近,這說(shuō)明兩個(gè)變量之間有一個(gè)線性相關(guān)關(guān)系,這個(gè)相關(guān)關(guān)系可以表示為y=0+1x+(8.4.2)這便是y關(guān)于x的一元線性回歸的數(shù)據(jù)結(jié)構(gòu)式。通常假定
E()=0,Var()=
2(8.4.3)在對(duì)未知參數(shù)作區(qū)間估計(jì)或假設(shè)檢驗(yàn)時(shí),還需要假定誤差服從正態(tài)分布,即
y~N(0+1x,
2)(8.4.4)顯然,假定(8.4.4)比(8.4.3)要強(qiáng)。
從散點(diǎn)圖我們發(fā)現(xiàn)12個(gè)點(diǎn)基本在一條直線附近,這說(shuō)明由于0,1均未知,需要我們從收集到的數(shù)據(jù)(xi,yi),i=1,2,…,n,出發(fā)進(jìn)行估計(jì)。在收集數(shù)據(jù)時(shí),我們一般要求觀察獨(dú)立地進(jìn)行,即假定y1,y2,,yn,相互獨(dú)立。綜合上述諸項(xiàng)假定,我們可以給出最簡(jiǎn)單、常用的一元線性回歸的數(shù)學(xué)模型:(8.4.5)
由于0,1均未知,需要我們從收集到的數(shù)據(jù)(x由數(shù)據(jù)(xi,yi),i=1,2,…,n,可以獲得0,1的估計(jì),稱(chēng)(8.4.6)為y關(guān)于x的經(jīng)驗(yàn)回歸函數(shù),簡(jiǎn)稱(chēng)為回歸方程,其圖形稱(chēng)為回歸直線。給定x=x0后,稱(chēng)為回歸值(在不同場(chǎng)合也稱(chēng)其為擬合值、預(yù)測(cè)值)。
由數(shù)據(jù)(xi,yi),i=1,2,…,n,可以獲得8.4.3回歸系數(shù)的最小二乘估計(jì)
一般采用最小二乘方法估計(jì)模型(8.4.5)中的0,1:令:
應(yīng)該滿(mǎn)足
稱(chēng)這樣得到的稱(chēng)為0,1的最小二乘估計(jì),記為L(zhǎng)SE。
8.4.3回歸系數(shù)的最小二乘估計(jì)一般采用最小最小二乘估計(jì)可以通過(guò)求偏導(dǎo)數(shù)并命其為0而得到:(8.4.7)這組方程稱(chēng)為正規(guī)方程組,經(jīng)過(guò)整理,可得(8.4.8)
最小二乘估計(jì)可以通過(guò)求偏導(dǎo)數(shù)并命其為0而得到:解(8.4.8)可得(8.4.9)這就是參數(shù)的最小二乘估計(jì),其中
解(8.4.8)可得表8.4.2例8.4.2的計(jì)算表
xi=1.90n=12yi=590.5xi2=0.3194xiyi=95.9250yi2=29392.75lxx=0.0186lxy=2.4292lyy=335.2292由此給出回歸方程為:
例8.4.2
使用例8.4.1種合金鋼強(qiáng)度和碳含量數(shù)據(jù),我們可求得回歸方程,見(jiàn)下表.
表8.4.2例8.4.2的計(jì)算表xi=1.90n
定理8.4.1在模型(8.4.5)下,有(1)(2)(3)對(duì)給定的x0,關(guān)于最小二乘估計(jì)的一些性質(zhì)羅列在如下定理之中
定理8.4.1在模型(8.4.5)下,有關(guān)于最小二定理8.4.1說(shuō)明
分別是0,1的無(wú)偏估計(jì);
是E(y0)=0+1x0的無(wú)偏估計(jì);
除外,與是相關(guān)的;
要提高的估計(jì)精度(即降低它們的方差)就要求n大,lxx大(即要求x1,x2,,xn較分散)。
定理8.4.1說(shuō)明分別是0,18.4.4回歸方程的顯著性檢驗(yàn)
在使用回歸方程作進(jìn)一步的分析以前,首先應(yīng)對(duì)回歸方程是否有意義進(jìn)行判斷。如果1=0,那么不管x如何變化,E(y)不隨x的變化作線性變化,那么這時(shí)求得的一元線性回歸方程就沒(méi)有意義,稱(chēng)回歸方程不顯著。如果10,E(y)隨x的變化作線性變化,稱(chēng)回歸方程是顯著的。綜上,對(duì)回歸方程是否有意義作判斷就是要作如下的顯著性檢驗(yàn):H0:1=0vsH1:10拒絕H0表示回歸方程是顯著的。8.4.4回歸方程的顯著性檢驗(yàn)在使用回歸方程一、F檢驗(yàn)采用方差分析的思想,我們從數(shù)據(jù)出發(fā)研究各yi不同的原因。數(shù)據(jù)總的波動(dòng)用總偏差平方和表示。引起各yi不同的原因主要有兩個(gè)因素:其一是H0可能不真,E(y)隨x的變化而變化,從而在每一個(gè)x的觀測(cè)值處的回歸值不同,其波動(dòng)用回歸平方和表示;其二是其它一切因素,包括隨機(jī)誤差、x對(duì)E(y)的非線性影響等,這可用殘差平方和表示。且有如下平方和分解式:ST=SR+Se(8.4.13)
在一元線性回歸中有三種等價(jià)的檢驗(yàn)方法,下面分別加以介紹。一、F檢驗(yàn)在一元線性回歸中有三種等價(jià)的檢驗(yàn)方法,下面分別加定理8.4.2設(shè)yi=i+1
xi
+
i,其中in相互獨(dú)立,且Ei=0,Var(yi)=
2,i=1,,n,沿用上面的記號(hào),有(8.4.14)(8.4.15)這說(shuō)明是
2的無(wú)偏估計(jì)。
關(guān)于SR
和
Se所含有的成分可由如下定理說(shuō)明。
定理8.4.2設(shè)yi=i+1xi+i,其中進(jìn)一步,有關(guān)SR
和
Se的分布,有如下定理。
定理8.4.3
設(shè)y1,y2,,yn相互獨(dú)立,且
yi~N(i+1
xi
,
2),i=1,,n,則在上述記號(hào)下,有(1)Se/
2~2(n2),(2)若H0成立,則有SR/
2~2(1)(3)SR與Se,獨(dú)立(或與Se,獨(dú)立)。
進(jìn)一步,有關(guān)SR和Se的分布,有如下定理。定理8.4.如同方差分析那樣,我們可以考慮采用F比作為檢驗(yàn)統(tǒng)計(jì)量:
在1
=0時(shí),F(xiàn)~F(1,n2),其中fR=1,fe=n2.對(duì)于給定的顯著性水平,拒絕域?yàn)?/p>
FF1-(1,n2)整個(gè)檢驗(yàn)也可列成一張方差分析表。
如同方差分析那樣,我們可以考慮采用F比作為檢驗(yàn)統(tǒng)計(jì)量來(lái)源平方和自由度均方和F比回歸SR=317.2589fA=1MSA=317.2589176.55殘差Se=17.9703fe=10MSe=1.79703總和ST=335.2292fT=11例8.4.3在合金鋼強(qiáng)度的例8.4.2中,我們已求出了回歸方程,這里我們考慮關(guān)于回歸方程的顯著性檢驗(yàn)。經(jīng)計(jì)算有
若取=0.01,則F0.99(1,10)=10<F,因此在顯著性水平0.01下回歸方程是顯著的。
來(lái)源平方和自由度均方和F比回歸SR=317.2589fA=
二、t檢驗(yàn)對(duì)H0:1
=0的檢驗(yàn)也可基于t分布進(jìn)行。由于,因此在H0為真時(shí),有,其中,它可用來(lái)檢驗(yàn)假設(shè)H0。對(duì)給定的顯著性水平,拒絕域?yàn)?由于,稱(chēng)為的標(biāo)準(zhǔn)誤,即的標(biāo)準(zhǔn)差的估計(jì)。
二、t檢驗(yàn)注意到t2=F,因此,t檢驗(yàn)與F檢驗(yàn)是等同的。以例8.4.2中數(shù)據(jù)為例,可以計(jì)算得到若取=0.01,則由于13.2872>3.1698,因此,在顯著性水平0.01下回歸方程是顯著的。
注意到t2=F,因此,t檢驗(yàn)與F檢驗(yàn)是等同的。
三、相關(guān)系數(shù)檢驗(yàn)一元線性回歸方程是反映兩個(gè)隨機(jī)變量x與y間的線性相關(guān)關(guān)系,它的顯著性檢驗(yàn)還可通過(guò)對(duì)二維總體相關(guān)系數(shù)的檢驗(yàn)進(jìn)行。它的一對(duì)假設(shè)是H0:=0vsH1:
0(8.4.18)所用的檢驗(yàn)統(tǒng)計(jì)量為樣本相關(guān)系數(shù)(8.4.19)拒絕域?yàn)閃={rc},其中臨界值c應(yīng)是H0:=0成立下r的分布的1分位數(shù),故記為c=r1-(n2).
三、相關(guān)系數(shù)檢驗(yàn)由樣本相關(guān)系數(shù)的定義可以得到r與F統(tǒng)計(jì)量之間的關(guān)系這表明,r是F的嚴(yán)格單調(diào)增函數(shù),故可以從F分布的1分位數(shù)F1-(1,n2)得到r的1分位數(shù)為由樣本相關(guān)系數(shù)的定義可以得到r與F統(tǒng)計(jì)量之間的關(guān)系譬如,對(duì)=0.01,n=12,F(xiàn)0.99(1,10)=10.04,于是。為實(shí)際使用方便,人們已對(duì)r1-(n-2)編制了專(zhuān)門(mén)的表,見(jiàn)附表9。以例8.4.2中數(shù)據(jù)為例,可以計(jì)算得到若取=0.01,查附表9知r0.99(10)=0.708,由于0.9728>0.708,因此,在顯著性水平0.01下回歸方程是顯著的。
譬如,對(duì)=0.01,n=12,F(xiàn)0.99(1,
在一元線性回歸場(chǎng)合,三種檢驗(yàn)方法是等價(jià)的:在相同的顯著性水平下,要么都拒絕原假設(shè),要么都接受原假設(shè),不會(huì)產(chǎn)生矛盾。
F檢驗(yàn)可以很容易推廣到多元回歸分析場(chǎng)合,而其他二個(gè)則否,所以,F(xiàn)檢驗(yàn)是最常用的關(guān)于回歸方程顯著性檢驗(yàn)的檢驗(yàn)方法。在一元線性回歸場(chǎng)合,三種檢驗(yàn)方法是等價(jià)的:在相同的顯
8.4.5估計(jì)與預(yù)測(cè)
當(dāng)回歸方程經(jīng)過(guò)檢驗(yàn)是顯著的后,可用來(lái)做估計(jì)和預(yù)測(cè)。這是二個(gè)不同的問(wèn)題:(1)當(dāng)x=x0時(shí),尋求均值E(y0)=0+1x0的點(diǎn)估計(jì)與區(qū)間估計(jì)(注意這里E(y0)是常量)是估計(jì)問(wèn)題;(2)當(dāng)x=x0時(shí),y0的觀察值在什么范圍內(nèi)?由于y0是隨機(jī)變量,為此只能求一個(gè)區(qū)間,使y0落在這一區(qū)間的概率為1-,即要求,使稱(chēng)區(qū)間為y0的概率為1-的預(yù)測(cè)區(qū)間,這是預(yù)測(cè)問(wèn)題。
8.4.5估計(jì)與預(yù)測(cè)一、E(y0)的估計(jì)在x=x0時(shí),其對(duì)應(yīng)的因變量y0是一個(gè)隨機(jī)變量,有一個(gè)分布,我們經(jīng)常需要對(duì)該分布的均值給出估計(jì)。由于E(y0)=0+1x0,一個(gè)直觀的估計(jì)應(yīng)為我們習(xí)慣上將上述估計(jì)記為(注意這里表示的是E(y0)的估計(jì),而不表示y0的估計(jì),因?yàn)閥0是隨機(jī)變量,它是沒(méi)有估計(jì)的)。由于分別是0,1的無(wú)偏估計(jì),因此,也是E(y0)的無(wú)偏估計(jì)。
一、E(y0)的估計(jì)為得到E(y0)的區(qū)間估計(jì),我們需要知道的分布。由定理8.4.1,又由定理8.4.3知,Se/
2~2(n-2),且與相互獨(dú)立,故為得到E(y0)的區(qū)間估計(jì),我們需要知道于是E(y0)的1的置信區(qū)間(CI)是(8.4.20)其中(8.4.21)于是E(y0)的1的置信區(qū)間(CI)是
二、y0的預(yù)測(cè)區(qū)間實(shí)用中往往更關(guān)心x=x0時(shí)對(duì)應(yīng)的因變量y0的取值范圍。y0的最可能取值為,于是,我們可以使用以為中心的一個(gè)區(qū)間作為y0的取值范圍。經(jīng)推導(dǎo),的表達(dá)式為(8.4.23)上述預(yù)測(cè)區(qū)間(PI)與E(y0)的置信區(qū)間的差別就在于根號(hào)里多個(gè)1。
二、y0的預(yù)測(cè)區(qū)間預(yù)測(cè)區(qū)間的長(zhǎng)度2與樣本量n、x的偏差平方和lxx、x0到的距離有關(guān)。當(dāng)時(shí),預(yù)測(cè)精度可能變得很差,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 南京郵電大學(xué)《國(guó)際投資與信貸》2023-2024學(xué)年第二學(xué)期期末試卷
- 公共交通線路審批管理制度
- 直埋管施工方案
- 特種陶瓷磨豆?jié){機(jī)問(wèn)卷調(diào)查
- 城市路燈井施工方案
- 江西省新八校聯(lián)考2024-2025學(xué)年高三上學(xué)期1月期末聯(lián)考英語(yǔ)試題【含答案】
- 甘肅省酒泉市2024-2025學(xué)年高一(下)開(kāi)學(xué)生物試卷-(含解析)
- 城市公共廣告施工方案
- 電表安裝施工方案
- 反濾土工布施工方案
- 馬克思恩格斯列寧經(jīng)典著作選讀課件
- 機(jī)械裝配工藝作業(yè)指導(dǎo)書(shū)
- 初中綜合實(shí)踐活動(dòng)《動(dòng)技術(shù)-1探究營(yíng)養(yǎng)與烹飪》培優(yōu)課件
- (完整word版)風(fēng)電項(xiàng)目開(kāi)發(fā)前期工作流程
- 2023年初中升學(xué)考試語(yǔ)文中考漫畫(huà)練習(xí)題123
- 2022屆“一本、二本臨界生”動(dòng)員大會(huì)(2023.5)
- 中小學(xué)生綜合素質(zhì)評(píng)價(jià)表
- 《語(yǔ)文課程標(biāo)準(zhǔn)》義務(wù)教育2022年修訂版【原版】
- 食堂工作人員安全培訓(xùn)內(nèi)容資料
- 體檢報(bào)告單入職體檢模板
- 航運(yùn)公司安全生產(chǎn)應(yīng)急預(yù)案
評(píng)論
0/150
提交評(píng)論