成信工統(tǒng)計(jì)天氣預(yù)報(bào)課件第3章 判別分析_第1頁
成信工統(tǒng)計(jì)天氣預(yù)報(bào)課件第3章 判別分析_第2頁
成信工統(tǒng)計(jì)天氣預(yù)報(bào)課件第3章 判別分析_第3頁
成信工統(tǒng)計(jì)天氣預(yù)報(bào)課件第3章 判別分析_第4頁
成信工統(tǒng)計(jì)天氣預(yù)報(bào)課件第3章 判別分析_第5頁
已閱讀5頁,還剩135頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章判別分析學(xué)習(xí)目的和要求重點(diǎn)難點(diǎn)

授課時數(shù)

基本內(nèi)容學(xué)習(xí)目的和要求

目的:掌握判別分析的基本理論和方法,利用判別方程作氣象預(yù)報(bào)。要求:首先要了解判別分析的概念、特點(diǎn),進(jìn)而掌握相關(guān)分析的定性和定量分析方法,在此基礎(chǔ)上掌握兩種不同判別原則下如何建立判別方程,對判別方程進(jìn)行顯著性檢驗(yàn),怎樣利用判別方程做預(yù)報(bào)。重點(diǎn)難點(diǎn)本部分講解在費(fèi)歇判別準(zhǔn)則和貝葉斯判別準(zhǔn)則的前提下的級別或類別判別分析方法,費(fèi)歇判別準(zhǔn)則的基本概念、多因子二級判別的方法和多級判別的費(fèi)歇準(zhǔn)則的基本含義是本章的教學(xué)重點(diǎn),多級判別、逐步判別是本部分教學(xué)的難點(diǎn)內(nèi)容?;緝?nèi)容1、費(fèi)歇判別準(zhǔn)則(掌握2、多級判別(掌握)3、貝葉斯判別準(zhǔn)則(掌握)4、逐步判別(理解)5、判別分析在氣象中的應(yīng)用(了解)判別分析的含義在氣象預(yù)報(bào)中,為了使用需要,一些預(yù)報(bào)量常常分成若干級別或類別。例如:把降水量資料進(jìn)行劃分,如:暴雨、大雨、中雨、小雨和無雨。什么叫做判別分析?根據(jù)預(yù)報(bào)量的不同類別,選擇一些前期因子,利用在不同類別的樣本內(nèi),尋找因子與預(yù)報(bào)量的關(guān)系,建立針對不同類別的預(yù)報(bào)量方程式,選擇適當(dāng)?shù)呐袆e規(guī)則,判別某個因子觀測樣品所屬的類別來實(shí)現(xiàn)對預(yù)報(bào)量的預(yù)報(bào)。

判別分析有時候也稱為分辨法。3.1費(fèi)歇判別準(zhǔn)則假設(shè)要預(yù)報(bào)晴、雨兩類天氣,選擇兩個前期因子x1及x2例如x1是24h本站氣壓差,x2為溫度露點(diǎn)差。根據(jù)經(jīng)驗(yàn),當(dāng)x1與x2是大值時,第二天常為晴天;反之當(dāng)x1與x2的值較時,第二天常為雨天。判別預(yù)報(bào)的關(guān)鍵問題是如何找到適當(dāng)?shù)呐袆e函數(shù),即如何確定(3.1)式中判別系數(shù)的問題。那么在判別分析中是根據(jù)什么原則來判別系數(shù)呢?思路:規(guī)則:3.1.2判別系數(shù)的確定當(dāng)樣本確定后,不同類別的因子值也已知,如果把式(3.1)代入(3.2)式則就是判別系數(shù)

與的函數(shù)。3.1.3多因子二級判別求判別系數(shù)的標(biāo)準(zhǔn)方程組可類似(3.4)式寫為在解出c1,,…,cp后,計(jì)算判據(jù)仍用(3.5)式,若y>yc報(bào)1級,否則報(bào)2級。舉例說明判別分析過程:例1:取第二章[例2]資料,把1月氣溫小于-4.5°C稱為1級(冷),反之稱為2級(暖)。三個因子變量相應(yīng)地分為兩級樣本,1級樣本容量n1=14,2級樣本容量n2=16,樣本總?cè)萘縩=n1+n2=30,因子數(shù)目p=3.注意凡y>yc報(bào)1級(冷),反之報(bào)2級(暖)。為報(bào)1982年1月氣溫,前期因子值為x1=33.3,x2=9.5,x3=32.0.代入判別函數(shù),算出

y82=-10.19<yc報(bào)1月氣溫偏暖,實(shí)況-4.3°C(高于平均-4.5°C)。3.1.4判別方程的顯著性檢驗(yàn)在下面的假定條件下,可以對二級判別方程作出顯著性檢驗(yàn):(1)每類(組)的觀測值是隨機(jī)選擇的;(2)一個未知的樣品來自兩類中的任一類的概率是相等的;(3)在每一類(組)內(nèi)變量是遵從正態(tài)分布的;(4)兩類(組)組內(nèi)的協(xié)方差陣是相等的;

(5)用于判別方程的觀測值沒有一個是錯分的(即判別方程的分辨線完全將兩類點(diǎn)子區(qū)分開)。對于判別方程中某一因子xk,它可以從兩類總體中抽樣,由于上面假定,兩個總體均方差一樣,再假設(shè)兩總體的數(shù)學(xué)期望一樣,從中抽取兩組樣本,一組容量為n1,另一組容量為n2對p個因子,也可以類似地檢驗(yàn)它們來自的兩類總體是否有顯著差異,假設(shè)它們來自的兩類總體無顯著差異,即各因子在兩類的數(shù)學(xué)期望相等,亦即3.2多級判別在天氣預(yù)報(bào)中,更常用的是多類或多級的預(yù)報(bào),例如除降水量的預(yù)報(bào)可分為:暴雨、大雨、中雨、小雨和無雨等五等級。下面介紹如何利用多個因子進(jìn)行多級判別預(yù)報(bào)。3.2.1判別函數(shù)離差平方和的分解假設(shè)根據(jù)需要,把預(yù)報(bào)量分為G類,取樣本容量為n的樣本,對此樣本,根據(jù)預(yù)報(bào)量的G類級別分為G組,每組樣本容量分別為n1,n2,…,nG。選取P個因子x1,x2,…,xp。

類似二級判斷,由它們的線性組合構(gòu)成一個判別函數(shù),表示為判別函數(shù)的總離差平方和可以表示為3.2.2多級判別的費(fèi)歇準(zhǔn)則類似二級判別的考慮,為了確定(3.1)式判別系數(shù)向量v,可以根據(jù)費(fèi)歇準(zhǔn)則。即要求在p維因子空間的超平面上,各類判別函數(shù)的點(diǎn)子愈密集愈好,類與類之間距離愈遠(yuǎn)愈好。3.2.3判別函數(shù)的性質(zhì)3.2.4判別函數(shù)的顯著性檢驗(yàn)3.2.5決策規(guī)則有了判別函數(shù)之后,要作出預(yù)報(bào)還需要有預(yù)報(bào)判據(jù),在統(tǒng)計(jì)上稱為決策規(guī)則。常用的有兩種決策規(guī)則。1.利用貝葉斯定理求后驗(yàn)概率分布2.距離判別規(guī)則3.2.6多級判別計(jì)算步驟第一步:選擇適當(dāng)因子,并根據(jù)預(yù)報(bào)量類別確定不同類別的樣本,計(jì)算各組因子的平均值和總平均值;第二步:計(jì)算總離差交叉積陣T,組內(nèi)離差交差積陣W及組間離差交叉積陣B;第三步:求的特征值及特征向量,得V陣;第四步:對判別函數(shù)進(jìn)行顯著性檢驗(yàn)以便確定選取多少個判別函數(shù)構(gòu)成判別空間。第五步:計(jì)算各樣品點(diǎn)與各組重心距離并進(jìn)行分類判別。第六步:計(jì)算每一樣品和各組判別函數(shù)重心的距離。

舉例說明例2:對某預(yù)報(bào)量分三類(G=3),選擇四個因子,總樣本容量n=17,資料見表3.1,各組樣本容量分別為n1=7,n2=4,n3=6.1.計(jì)算4個因子的平均值及總平均值,數(shù)值列與表3.2中。

2.計(jì)算總離差交叉積陣T3.3貝葉斯判別準(zhǔn)則3.3.1貝葉斯判別準(zhǔn)則概念

如果把p個因子的所有樣品由預(yù)報(bào)量G個類別劃分為G個組,并把它們看成為以G個總體中抽取的樣本,記這G個總體為A1,A2,…,AG。3.3.2正態(tài)總體的判別3.4逐步判別

在判別分析中,要選擇最佳的判別方法也有預(yù)報(bào)因子的選擇問題或?qū)M(jìn)入判別方程的因子篩選問題。逐步判別就是類似逐步回歸的一種篩選因子方法。3.4.1單個因子判別能力的顯著性檢驗(yàn)由于逐步判別也是一步步考慮引入重要因子,因此首先假設(shè)在判別方程中已進(jìn)入l個因子,考慮在余下p-l個因子中是否可以選擇第k個因子進(jìn)入判別方程。衡量這個因子能否進(jìn)入方程的原則當(dāng)然要看它的判別能力貢獻(xiàn)是否顯著。3.4.2統(tǒng)計(jì)量∧的計(jì)算方法如上所述,無論考察整個方程的判別能力,還是單個因子對判別方程判別能力的貢獻(xiàn),均需作∧統(tǒng)計(jì)量的計(jì)算。3.4.3逐步判別計(jì)算步驟第一步:確定預(yù)報(bào)量級別,相應(yīng)地對因子進(jìn)行分組,計(jì)算各因子組內(nèi)平均值和總平均值;第二步:計(jì)算因子總離差交叉積陣和組內(nèi)交叉積陣T及W;第三步:據(jù)(3.37)及(3.38)式逐步計(jì)算各因子的判別能力,在給定Fα,判據(jù)值下,據(jù)(3.34)及(3.36)式進(jìn)行顯著性檢驗(yàn),確定剔除或引進(jìn)的因子并作對應(yīng)列消去,直到無剔除和無引進(jìn)為止;第四步:據(jù)(3.28)式求判別函數(shù),并對各樣品作判別預(yù)報(bào)。3.4.4非線性逐步判別由預(yù)報(bào)因子的非線性組合構(gòu)成的判別函數(shù),在判別分析中就稱為非線性判別。

在3.3中我們已經(jīng)介紹過如何用貝葉斯準(zhǔn)則來構(gòu)成判別函數(shù),其中假定G類總體分布均遵從正態(tài)分布,且有相同的協(xié)方差陣。將密度函數(shù)表達(dá)式代入判別準(zhǔn)則的判據(jù)(3.26)式后得到如下的表達(dá)式3.4.5回歸逐步判別回歸逐步判別是利用逐步回歸方法建立判別函數(shù)來進(jìn)行判別預(yù)報(bào)量類別的方法。把要建立的G類判別函數(shù)看作為G個新預(yù)報(bào)量,記為y=(y1,y2,…,yG),這G個新預(yù)報(bào)量的序列由原預(yù)報(bào)量的序列產(chǎn)生。例如建立y1的序列是這樣:在預(yù)報(bào)量的樣本中,如果發(fā)現(xiàn)某一個樣品為1類時,相應(yīng)的y1

值取1,否則取0.

類似的建立y2,y3,…,yG序列,它們都是n個樣品的二值序列。3.5判別分析在氣象中的應(yīng)用氣象中存在不少定性的氣象現(xiàn)象,例如龍卷風(fēng)、暴雨、大風(fēng)等等。對于這些現(xiàn)象無法使用定量資料,往往作為類別用判別分析的方法做預(yù)報(bào),所以它也是目前MOS方法中常用的一個方法。實(shí)際上,一些定量的氣象要素也可以化為類別資料來使用此方法。例如Agnew曾把降水量分為四類,即無雨、微雨、中雨及大雨,用多元判別做預(yù)報(bào),并拿相同的因子也用REEP方法作預(yù)報(bào)。把它們的預(yù)報(bào)結(jié)果進(jìn)行多次比較,發(fā)現(xiàn)判別分析效果比較好。二級判別方法簡便,曾為我國臺站氣象工作者常采用的方法。對于多級判別也可化為多次二級判別。例如預(yù)報(bào)雨量,第一次可先分晴、雨二級,若預(yù)報(bào)有雨,再對有雨的樣本,按大雨、小雨作二級判別,若預(yù)報(bào)大雨,再次從其樣本中劃分為大雨和暴雨進(jìn)行二級判別

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論