版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Y設(shè)X,Y是來(lái)自均值向量為,協(xié)方差為的總體G中的p維樣本。則馬氏距離為D(X,Y)=。2試述判別分析的實(shí)質(zhì)。間Rp的k個(gè)子集,如果它們互不相交,且它們的和集為,則稱為的一個(gè)劃分。判別分析問題實(shí)質(zhì)上就是在某種意義上,以最優(yōu)的性質(zhì)對(duì)p維空間構(gòu)造一個(gè)“劃分”,這個(gè)“劃分”就是分別計(jì)算樣本與各個(gè)總體的距離(馬氏距離),將距離近的判別為一類。問題設(shè)有協(xié)方差矩陣∑相等的兩個(gè)總體算新樣品1和2,對(duì)于一個(gè)新的樣品X,要XX1)(Xμ2)Σ1(Xμ2)XΣ1X2XΣ1μ1μ1Σ1μ1(XΣ1X2XΣ1μ2μ2Σ1μ2)2XΣ1(μ2μ1)μ1Σ1μ1μ2Σ1μ2Xμ2)22(Xμ)α2α(Xμ)1/132/132k且Σ12kXΣX1XΣX取IΣ1μ,CGk差矩陣分別是μ1,μ2,,μk和Σ1,Σ2,,Σk,(Xμ)Σ1(Xμ)2μ1ΣXμ2μ1XC)μΣ1μ,1,2,,k。2相應(yīng)的判別規(guī)則為XGi若Wi(X)ma1(IXC)ki1iRRkRGi錯(cuò)判為Gj的概率為jj平均損失為kj1j3/13R的總平均損失為ki1ikki1j1kki1j1kki1qij1C(j|i)Rjfi(x)dxkk(qiC(j|i)fi(x))dxj1Rji1k令qiC(j|i)fi(x)hj(x),i1k則g(R)j1kj1g(R)g(R*)i1j1RiR[hi(x)hj(x)]dx因?yàn)樵赗i上hi(x)hj(x)對(duì)一切j成立,故上式小于或等于零,是貝葉斯判別的解。k個(gè)總體中抽取具有p個(gè)指標(biāo)的樣品觀測(cè)數(shù)據(jù),借助方差分析的思想構(gòu)4/136試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的異同。答:①費(fèi)希爾判別與距離判別對(duì)判別變量的分布類型無(wú)要求。二者只是要求有各類母體的②當(dāng)k=2時(shí),若則費(fèi)希爾判別與距離判別等價(jià)。當(dāng)判別變量服從正態(tài)分布時(shí),二者與貝葉③當(dāng)時(shí),費(fèi)希爾判別用作為共同協(xié)差陣,實(shí)際看成等協(xié)差陣,此與距離判別、貝葉斯判別答:即根據(jù)一定的判別準(zhǔn)則,判定一個(gè)樣本歸屬于哪一類。具體而言,設(shè)有n個(gè)樣本,對(duì)每個(gè)樣本測(cè)得p項(xiàng)指標(biāo)(變量)的數(shù)據(jù),已知每個(gè)樣本屬于k個(gè)類別(或總體)中的某一類,總體。聚類分析是分析如何對(duì)樣品(或變量)進(jìn)行量化分類的問題。在聚類之前,我們并不知道總體,而是通過一次次的聚類,使相近的樣品(或變量)聚合形成總體。通俗來(lái)講,判別答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類,過程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為5/13 (一)明氏距離:dij(q)p(k1kq1/qq1/qq取不同值,分為 (1)絕對(duì)距離(q (2)歐氏距離(qpXjkXjkk12p2Xjk)Xjk)k1k (3)切比雪夫距離( (二)馬氏距離p1k1di(M) (三)蘭氏距離Xj)將變量看作p維空間的向量,一般用 (一)夾角余弦pk1ppXi(X)k1k1 (二)相關(guān)系數(shù)rrpk1kppk1k16/132ppddq2ppddq答:設(shè)dij表示樣品Xi與Xj之間距離,用Dij表示類Gi與Gj之間的距離。 rjr (2)最長(zhǎng)距離法 (3)中間距離法112222 (4)重心法2nqXq)2222 (5)類平均法22GpXjGpXj (6)可變類平均法rr221222122222GjGrXjn22q22r其中是可變的且<1 (7)可變法2122122 (8)離差平方和法222是可變的且<1t1t2Dkrp2pDkpnkq2qDkqk2k2 (1)要考慮所選擇的距離公式在實(shí)際應(yīng)用中有明確的意義。如歐氏距離就有非常明確的空 (2)要綜合考慮對(duì)樣本觀測(cè)數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。如在進(jìn)行聚類分析 (3)要考慮研究對(duì)象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)比較復(fù)雜且?guī)Р煌合到y(tǒng)聚類對(duì)不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K—均值法只能產(chǎn)生指定類數(shù)K聚類法的基本思想。答:K均值法的基本思想是將每一個(gè)樣品分配給最近中心(均值)的類中。系統(tǒng)聚類對(duì)不同7/13pk1kk所以一般不會(huì)使用所有p稱kk稱k1kkkpmk1kpk1為主成分Y1,,Ym的累計(jì)貢獻(xiàn)率,累計(jì)貢獻(xiàn)率表明Y1,,Ym綜合X1,X2,,Xp的能力。通常取m,使得累計(jì)貢獻(xiàn)率達(dá)到一個(gè)較高的百分?jǐn)?shù)(如85%以上)。在“大數(shù)吃小數(shù)”的問題。實(shí)際表明,這種差異有時(shí)很大。我們R采用R代替,8/139/13始坐標(biāo)社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科中都有重要的應(yīng)用。具體來(lái)說,①因子觀子模型中載荷矩陣A的統(tǒng)計(jì)意義。Xiii1,2,,p載荷陣為Aa21ap1aa22aaaaamCov(Xi,Fj)Cov(aikFki,Fj)k1m=Cov(aikFk,Fj)Cov(i,Fj)k12i2mj1ji1,2,,p222i說明變量Xi的方差由兩Fj對(duì)X的貢獻(xiàn)gpi1ij1,2,m表示同一公共因子Fj對(duì)各變量所提供的方差貢獻(xiàn)之總和,它是衡量每一個(gè)公共因子相對(duì)重。計(jì)分析方法的模型。而線性回歸模型回歸分析的目的是設(shè)法找出變量間的依存(數(shù)量)關(guān)系,即 F10 Im012102 DD(ε)0關(guān),方差不要求相等。2p而回歸分析模型滿足(1)正態(tài)性:隨機(jī)誤差(即殘差)e服從均值為0,方差為2的正態(tài)分布;(2)等方差:對(duì)于所有的自變量x,殘差e的條件方差為2,且為常數(shù);(3)獨(dú)10/1311/13 (1)在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關(guān)系數(shù)。 aa(i)(i)(2) (3)如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢為此。,(i)(1)a(i)(1)a(i)(1)a(i)(1)a(i)(1)a(i)(1)a(i(i)(1)a(i)(2)(i)(2)(i(i)(2)i2.Cov(Ui,Vj)001(k1,2,,r)0(ij,i1,2,,r)(ij)(jr)依賴關(guān)系而典型相關(guān)則擴(kuò)展到兩組變量之間的相互依賴在進(jìn)行系統(tǒng)聚類分析時(shí),不同的類間距離計(jì)算方法有何區(qū)別?請(qǐng)舉例說明。距離平方的平均數(shù);可變類平均法將G和合并為新類,反映出和之間的距離的影響;如果中最小的兩類合并,直到所有的樣品歸為一類為止。12/13“維數(shù)”13/13ppYY,Yp的方差之和k1kk所以一般不會(huì)使用所有pkkkpkkkk1kmmmpkk為主成分Y1,,Ym的累計(jì)貢獻(xiàn)率,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中秋佳節(jié)活動(dòng)主持詞(8篇)
- 探究性閱讀教學(xué)之我見
- 單個(gè)水果課件教學(xué)課件
- 《混凝土結(jié)構(gòu)設(shè)計(jì)原理》全套教學(xué)課件
- 影響農(nóng)村信用社發(fā)展的政策性障礙分析
- 輪椅車 第31部分 電動(dòng)輪椅車的鋰離子電池系統(tǒng)和充電器 要求和試驗(yàn)方法 征求意見稿
- 直播招商課件教學(xué)課件
- 金融培訓(xùn)課件教學(xué)課件
- 三年級(jí)數(shù)學(xué)計(jì)算題專項(xiàng)練習(xí)及答案集錦
- 維修水泵機(jī)組合同(2篇)
- 2019新教材人教版生物必修1教材課后習(xí)題答案
- 2024年中國(guó)白酒行業(yè)數(shù)字化轉(zhuǎn)型研究報(bào)告-36氪-202409
- 《學(xué)校主人公:3 校園廣播站》教學(xué)設(shè)計(jì)-2024-2025學(xué)年五年級(jí)上冊(cè)綜合實(shí)踐活動(dòng)滬科黔科版
- 外傷急救包扎技術(shù)說課課件
- 人教版(2024新版)七年級(jí)上冊(cè)英語(yǔ)全冊(cè)語(yǔ)法知識(shí)點(diǎn)講義
- 全國(guó)青島版信息技術(shù)七年級(jí)下冊(cè)專題一第8課三、《高級(jí)統(tǒng)計(jì)-數(shù)據(jù)透視表》教學(xué)設(shè)計(jì)
- 2024年秋季新人教版七年級(jí)數(shù)學(xué)上冊(cè)教學(xué)課件 第五章 一元一次方程 5.3實(shí)際問題與一元一次方程(第4課時(shí))
- 清淡的晚餐(課件)六年級(jí)上冊(cè)勞動(dòng)北京版
- 婦科內(nèi)分泌疾病診斷與治療考核試卷
- 城鎮(zhèn)雨污分流項(xiàng)目可行性研究報(bào)告
- 《19 海濱小城》公開課一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)及反思
評(píng)論
0/150
提交評(píng)論