




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 第1章 緒 論應(yīng)用多元統(tǒng)計(jì)分析 - 1- 多元統(tǒng)計(jì)分析是研究多個(gè)隨機(jī)變量之間相互依賴關(guān)系及內(nèi)在統(tǒng)計(jì)規(guī)律的一門統(tǒng)計(jì)學(xué)科,其內(nèi)容既包括一元統(tǒng)計(jì)理論方法的推廣,也包括多個(gè)隨機(jī)變量特有的一些理論和方法,后者有大量的實(shí)際應(yīng)用背景。 在實(shí)際問題中,涉及到的隨機(jī)變量往往有多個(gè),且這些變量之間又存在一定的聯(lián)系。例如, 一個(gè)國(guó)家的經(jīng)濟(jì)狀況需要用多個(gè)指標(biāo)來刻畫。人的體能需要用年齡、體重、肺活量等多項(xiàng)指標(biāo)來反映。 1.1 多元統(tǒng)計(jì)分析概述 例1.1 考察學(xué)生的學(xué)習(xí)情況時(shí),需要了解學(xué)生在幾個(gè)主要科目的學(xué)習(xí)成績(jī),等等。表1.1給出20名中學(xué)生5門主課期末考試成績(jī)。我們希望根據(jù)表1.1提供的數(shù)據(jù)對(duì)這20名學(xué)生的學(xué)習(xí)情況
2、進(jìn)行評(píng)價(jià)。多元統(tǒng)計(jì)分析概述 如果用一元統(tǒng)計(jì)方法,需要對(duì)各門課程成績(jī)分別分析。這樣處理,由于忽視了課程之間可能存在的相關(guān)性,因此會(huì)丟失許多信息,分析的結(jié)果不能客觀全面地反映學(xué)生的真實(shí)學(xué)習(xí)情況。 如果采用多元分析方法,可以同時(shí)對(duì)多門課程的成績(jī)進(jìn)行綜合分析,給出比較客觀和全面的分析結(jié)果。多元統(tǒng)計(jì)分析概述 多元統(tǒng)計(jì)分析的內(nèi)容和方法主要有以下幾個(gè)方面。 1. 多元統(tǒng)計(jì)理論基礎(chǔ) 包括多維隨機(jī)向量,特別是多維正態(tài)隨機(jī)向量,以及由此定義的各種統(tǒng)計(jì)量的分布及其性質(zhì),多元統(tǒng)計(jì)分布理論。 2. 多元統(tǒng)計(jì)推斷 包括多元正態(tài)總體的參數(shù)估計(jì)和假設(shè)檢驗(yàn)問題,特別是均值向量和協(xié)方差陣的估計(jì)和假設(shè)檢驗(yàn)等問題。 3. 變量之間的
3、相互關(guān)系 (1) 多元回歸分析:分析變量之間的因果關(guān)系,建立一個(gè)變量或幾個(gè)變量與另一些變量的定量關(guān)系式,并用于預(yù)測(cè)或控制。(2) 典型相關(guān)分析:分析兩組變量之間的相關(guān)關(guān)系。多元統(tǒng)計(jì)分析概述 4. 分類與判別問題 (1) 判別分析:根據(jù)觀測(cè)到的樣品數(shù)據(jù)(訓(xùn)練樣本),按相似程度大小對(duì)所考察的樣品或變量進(jìn)行分類(歸類),常稱其為“有監(jiān)督的分類問題”。(2) 聚類分析:對(duì)觀測(cè)到的數(shù)據(jù),按相似程度大小對(duì)樣品或變量進(jìn)行分類。常稱其為“無監(jiān)督的分類問題”。 5. 簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)(降維問題) 將高維數(shù)據(jù)降為低維數(shù)據(jù),使數(shù)據(jù)結(jié)構(gòu)得到有效簡(jiǎn)化,并在此基礎(chǔ)上分析變量之間或樣品之間的復(fù)雜關(guān)系。這類問題的統(tǒng)計(jì)方法包括主成
4、分分析、因子分析以及對(duì)應(yīng)分析,等等。多元統(tǒng)計(jì)分析概述 多元統(tǒng)計(jì)分析起源于20世紀(jì)初,1928年Wishart發(fā)表的一篇論文多元正態(tài)總體樣本協(xié)方差陣的精確分布被公認(rèn)為是多元統(tǒng)計(jì)的開端。之后Fisher、Hotelling、Roy和許寶騄等著名統(tǒng)計(jì)學(xué)家的開創(chuàng)性工作,使多元統(tǒng)計(jì)分析在理論上得到了迅速發(fā)展,并在許多領(lǐng)域得到實(shí)際應(yīng)用。但是,由于使用多元統(tǒng)計(jì)方法解決實(shí)際問題時(shí)需要的計(jì)算量很大,使其發(fā)展受到一定限制。多元統(tǒng)計(jì)分析概述 到了20世紀(jì)中后期,隨著電子計(jì)算機(jī)的出現(xiàn)和發(fā)展,使得多元統(tǒng)計(jì)分析方法在自然科學(xué)和社會(huì)科學(xué)的許多領(lǐng)域得到廣泛的應(yīng)用,并由此帶來其理論的進(jìn)一步發(fā)展。另一方面,不斷提出一些新理論、方
5、法和技術(shù),又促使其應(yīng)用范圍進(jìn)一步擴(kuò)大。21世紀(jì)初,隨著現(xiàn)代信息技術(shù)的高速發(fā)展和廣泛應(yīng)用,人類進(jìn)入了大數(shù)據(jù)時(shí)代。多元統(tǒng)計(jì)分析概述 海量數(shù)據(jù)和超高維數(shù)據(jù)的大量涌現(xiàn),對(duì)統(tǒng)計(jì)理論、方法和技術(shù)的發(fā)展提出新的挑戰(zhàn)。近年來,我國(guó)學(xué)者在多元統(tǒng)計(jì)分析的理論研究和應(yīng)用方面取得了顯著成績(jī),有不少研究工作已達(dá)到國(guó)際領(lǐng)先水平,并形成許多高水平的科研團(tuán)隊(duì),活躍在各個(gè)領(lǐng)域。多元統(tǒng)計(jì)分析概述 1.2 多元數(shù)據(jù)的直觀表示 多元數(shù)據(jù)可以通過圖形直觀表示,以便對(duì)所研究的數(shù)據(jù)的直觀了解。另一方面,對(duì)具體問題的多元分析結(jié)果或過程也可以通過圖形來展示,以便人們對(duì)分析結(jié)果或計(jì)算過程有直觀的理解。本章主要介紹多元數(shù)據(jù)的幾個(gè)常用直觀表示方法,
6、對(duì)于多元分析的結(jié)果或過程的直觀表示方法,將在本書后面幾章介紹的各種多元分析方法中介紹。內(nèi)容與要求內(nèi)容: 包括輪廓圖、散布矩陣圖、均值條形圖、箱線圖、星相圖、臉譜圖、調(diào)和曲線圖等圖形。要求: 要求學(xué)生了解多元數(shù)據(jù)的直觀表示方法及多變量圖形的一些特點(diǎn),并掌握一些復(fù)雜的多元數(shù)據(jù)的圖示技術(shù)。多元數(shù)據(jù)的直觀表示多元數(shù)據(jù)的直觀表示說明與舉例 說明: 圖形有助于對(duì)所研究數(shù)據(jù)的直觀了解,如果能把一些多元數(shù)據(jù)直接繪圖顯示,便可從圖形一目了然看出多元變量之間的關(guān)系。 例1.2 為了研究全國(guó)31個(gè)省、市、自治區(qū)2018年城鎮(zhèn)居民生活消費(fèi)的分布規(guī)律,根據(jù)調(diào)查資料做區(qū)域消費(fèi)類型劃分。多元數(shù)據(jù)的直觀表示 指標(biāo):食品x1:
7、人均食品支出(元/人) 衣著x2:人均衣著商品支出(元/人) 居住x3:人均居住支出(元/人) 生活x4:人均家庭設(shè)備用品及服務(wù)支出(元/人) 交通x5:人均交通和通訊支出(元/人)教育x6:人均娛樂教育文化服務(wù)支出(元/人)醫(yī)療x7:人均醫(yī)療保健支出(元/人) 其他x8:人均雜項(xiàng)商品和服務(wù)支出(元/人)地區(qū)x1x2x3x4x5x6x7x8北京8064.92175.514110.32371.94767.43999.43274.51078.6天津8647.51990.06406.31818.44280.93186.62676.9896.3河北4271.31257.44050.41138.7235
8、5.41734.51540.5373.8山西3688.21261.03228.5855.61845.21940.01635.1356.4內(nèi)蒙古5324.31751.23680.01204.63074.32245.41847.5537.9遼寧5727.81628.14169.51259.42968.22708.02257.1680.2吉林4417.41397.03294.8899.42479.72193.42012.0506.7黑龍江4573.21405.43176.3866.42196.62030.32235.3490.4上海10728.22036.814208.52095.54881.250
9、49.43070.21281.5江蘇6529.81541.06731.21493.33522.82582.62016.4590.4浙江8198.31813.57721.21652.44302.03031.32059.4692.6安徽5414.71137.43941.91041.22082.11810.41224.0392.8福建7572.91212.16130.01223.12923.32194.01234.8505.8江西4809.01074.13795.21047.71872.11813.01000.0381.0山東5030.91391.83928.51394.32834.32174.41
10、627.6398.1河南3959.81172.83512.01054.41838.01769.11541.5321.0湖北5491.31316.24310.61253.22584.12187.51907.9487.0湖南5260.01215.53976.11190.22322.92786.21705.5351.5廣東8480.81135.36643.31440.83423.92750.91520.8658.2廣西4545.7616.73268.5898.22150.11798.91364.6291.9海南6552.2655.93744.0826.61919.02185.51236.1409.2
11、重慶6220.81454.53498.81338.92545.02087.81660.0442.8四川5937.91173.83368.01182.22398.81599.71568.6434.5貴州3792.9934.72760.7878.12408.01660.01083.5280.1云南3983.4789.13081.1859.92212.81772.71267.7283.2西藏4330.51285.22102.6622.31847.7609.3460.1262.6陜西4292.51141.13388.21200.82005.82008.81749.4373.2甘肅4253.31111.
12、53095.0896.91640.71710.31573.9342.4青海4671.61350.62990.0932.02671.41655.61842.0444.0寧夏4234.11388.23014.31067.12724.42139.51727.1420.4新疆4691.61456.02894.31082.82274.41762.51592.6434.9 數(shù)據(jù)輸入:數(shù)據(jù)R語言讀取X=read.table(biao1.2.txt,header=T) 直觀分析:圖示法 pairs(X) #畫散布矩陣圖從該圖可以看出,食品支出與生活用品及服務(wù)支出、教育及文化娛樂支出之間存在顯著線性相關(guān)關(guān)系,而
13、教育及文化娛樂支出又與居住支出、其他支出之間存在顯著線性相關(guān)關(guān)系,等等。多元數(shù)據(jù)的直觀表示 均值條圖 多元數(shù)據(jù)的直觀表示 樣品(行)的均值條圖#按行做均值條形圖barplot(apply(X,1,mean) 均值條圖 多元數(shù)據(jù)的直觀表示 指標(biāo)(列)的均值條圖#按行做均值條形圖barplot(apply(X,2,mean) 箱線圖 多元數(shù)據(jù)的直觀表示 箱線圖 用途:Tukey提出的箱線圖由箱子和其上引出的兩個(gè)尾組成,這種圖用來表示在一定時(shí)間內(nèi)一個(gè)班成績(jī)的變化、物體位置的變化、原材料的變化、產(chǎn)品標(biāo)準(zhǔn)的變化等。 特征:箱線圖可以比較清晰地表示數(shù)據(jù)的分布特征,它由4部分組成。 R語言函數(shù): boxpl
14、ot(X,.) 箱尾圖 多元數(shù)據(jù)的直觀表示boxplot(X) #按列做垂直箱線圖boxplot(X,horizontal=T)#水平箱線圖從該圖可以看出,食品消費(fèi)支出遠(yuǎn)高于其它指標(biāo)的支出。 星相圖 多元數(shù)據(jù)的直觀表示 星相圖 用途:它將每個(gè)變量的各個(gè)觀察單位的數(shù)值表示為一個(gè)圖形,個(gè)觀察單位就有個(gè)圖,每個(gè)圖的每個(gè)角表示每個(gè)變量。 特征:星相圖是雷達(dá)圖的多元表示形式。 R語言函數(shù): stars(X, draw.segments = FALSE,key.loc = NULL,.)星相圖 多元數(shù)據(jù)的直觀表示#簡(jiǎn)單星相圖stars(X) 星相圖 多元數(shù)據(jù)的直觀表示#帶圖例度彩色星相圖stars(X,k
15、ey.loc=c(17,7), draw.segments=T) #加載aplpack包library(aplpack) #按每行7個(gè)做臉譜圖faces(X,ncol.plot=7) 臉譜圖:運(yùn)用樣本各變量值構(gòu)造臉的各部位,通過分析臉部位大小或形狀來 分析各樣本數(shù)據(jù)特征 臉譜圖 多元數(shù)據(jù)的直觀表示#加載mvstats包library(mvstats) plot.andrews(X) 調(diào)和曲線圖:使用高維空間中的一個(gè)樣本對(duì)應(yīng)于二維平面上的一條曲線的方法 分析數(shù)據(jù)特征 調(diào)和曲線圖 多元數(shù)據(jù)的直觀表示#也可以直接從鏡像站加載andrews包繪制調(diào)和曲線圖library(andrews)andrews
16、(X,type=3,clr=5,ymax=3)調(diào)和曲線圖:使用高維空間中的一個(gè)樣本對(duì)應(yīng)于二維平面上的一條曲線的方法 分析數(shù)據(jù)特征 調(diào)和曲線圖 多元數(shù)據(jù)的直觀表示 第2章 多元正態(tài)抽樣分布應(yīng)用多元統(tǒng)計(jì)分析 - 25- 在多元統(tǒng)計(jì)分析中,多元正態(tài)分布占有相當(dāng)重要的地位。這是因?yàn)?,許多實(shí)際問題涉及到的隨機(jī)向量服從正態(tài)分布或近似服從正態(tài)分布;當(dāng)樣本量很大時(shí),許多統(tǒng)計(jì)量的極限分布往往和正態(tài)分布有關(guān)。此外,對(duì)多元正態(tài)分布,理論與實(shí)踐都比較成熟,已有一整套行之有效的統(tǒng)計(jì)推斷方法。 基于這些理由,我們?cè)诮榻B多元統(tǒng)計(jì)分析的種種具體方法之前,首先介紹多元正態(tài)分布的定義、性質(zhì)及多元正態(tài)分布中參數(shù)的估計(jì)問題。第2章
17、多元正態(tài)抽樣分布 多元統(tǒng)計(jì)分析討論的是多變量總體。以p個(gè)隨機(jī)變量作為分量構(gòu)成的向量稱為p維隨機(jī)向量。如果我們同時(shí)對(duì)p個(gè)變量作一次觀測(cè),得到觀測(cè)值 ,它是一個(gè)樣品。如果我們觀察n次得到n個(gè)樣品品 ,而n個(gè)樣品就構(gòu)成一個(gè)樣本。 2.1 隨機(jī)向量 常把n個(gè)樣品排成一個(gè)np矩陣,稱為樣本數(shù)據(jù)矩陣(或樣本資料陣),記為 2.1 隨機(jī)向量 在多元統(tǒng)計(jì)分析理論中涉及到的向量一般都是隨機(jī)向量,或是由多個(gè)隨機(jī)向量構(gòu)成的隨機(jī)矩陣。均值向量和協(xié)方差陣 設(shè) 是一個(gè)隨機(jī)向量。稱向量為隨機(jī)向量X 的均值向量。稱矩陣為隨機(jī)向量X 的協(xié)方差矩陣,其中 。 2.1 隨機(jī)向量均值向量和協(xié)方差陣 設(shè) 是另一個(gè)隨機(jī)向量。稱矩陣為隨機(jī)
18、向量X 與Y 的協(xié)方差矩陣,其中 2.1 隨機(jī)向量均值向量和協(xié)方差陣 若 為X 的協(xié)方差陣,則 稱為X 的相關(guān)陣,其中 若記 ,則有 或 2.1 隨機(jī)向量均值向量和協(xié)方差陣的性質(zhì) 性質(zhì)1. 設(shè)X 和Y 是適當(dāng)維數(shù)的隨機(jī)向量,A和B是適當(dāng)階數(shù)的常數(shù)矩陣,則有 2.1 隨機(jī)向量均值向量和協(xié)方差陣的性質(zhì) 性質(zhì)2. 若X 與Y 相互獨(dú)立,則 ;反之則不一定成立。 性質(zhì)3. 隨機(jī)向量X 的協(xié)方差陣 是對(duì)稱非負(fù)定矩陣。 性質(zhì)4. ,其中L 為非負(fù)定矩陣,稱為 的平方根矩陣,記為 ,即 。 證明 由于 ,利用實(shí)對(duì)稱非負(fù)定矩陣的對(duì)角化原理,存在正交矩陣 ,使得 2.1 隨機(jī)向量均值向量和協(xié)方差陣的性質(zhì) 2.1
19、 隨機(jī)向量其中 這里 為 的特征值, 為 的與 對(duì)應(yīng)的單位正交特征向量。均值向量和協(xié)方差陣的性質(zhì) 性質(zhì)5. ,其中A為列滿秩矩陣,若 則A為非退化矩陣。 定理2.1 設(shè) ,則其中 表示矩陣B 的跡。 2.1 隨機(jī)向量多元正態(tài)分布的定義和性質(zhì) 定義2.1. 設(shè) 為隨機(jī)向量,其中 相互獨(dú)立,同服從標(biāo)準(zhǔn)正態(tài)分布 。設(shè) 為p維常數(shù)向量,A 為 常數(shù)矩陣,則稱向量 所服從的分布為p維正態(tài)分布,并稱X 為p維正態(tài)隨機(jī)向量,記為 ,或簡(jiǎn)記為 ,其中 。 性質(zhì)1. 設(shè) ,B 為 常數(shù)矩陣,d為s維常數(shù)向量。令 ,則 性質(zhì)1說明,正態(tài)隨機(jī)向量的任意線性組合仍然服從正態(tài)分布。 2.2 多元正態(tài)分布多元正態(tài)分布的定
20、義和性質(zhì) 推論2.1.設(shè) 將 分塊為則 。 此推論說明,多元正態(tài)分布的邊緣分布仍為正態(tài)分布。但反之不一定成立(例如見例2.1)。 2.2 多元正態(tài)分布多元正態(tài)分布的定義和性質(zhì) 例2.2.設(shè) 其中求 的分布,這里 2.2 多元正態(tài)分布多元正態(tài)分布的定義和性質(zhì) 性質(zhì)2. 若 ,則 。 此性質(zhì)給出多元正態(tài)分布中參數(shù)的明確統(tǒng)計(jì)意義。 性質(zhì)3. 設(shè) 相互獨(dú)立,且 為任意常數(shù)。則 2.2 多元正態(tài)分布多元正態(tài)分布的定義和性質(zhì) 性質(zhì)4. 設(shè) 則 性質(zhì)5. 設(shè) 則X 的密度函數(shù)為其中 是p維向量。 2.2 多元正態(tài)分布條件分布和獨(dú)立性 設(shè) 將 分塊為由推論2.1可知 定理2.2. 設(shè)則 與 獨(dú)立,當(dāng)且僅當(dāng) 。 2.2 多元正態(tài)分布多元正態(tài)分布的定義和性質(zhì) 定理2.3. 設(shè) 分塊為則給定 時(shí), 的條件分布為其中 2.2 多元正態(tài)分布多元正態(tài)分布的定義和性質(zhì) 推論2.4. 在定理2.3條件下有 (1) 與 相互獨(dú)立; (2) 與 相互獨(dú)立; (3) 其中 2.2 多元正態(tài)分布多元正態(tài)分布的定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)培訓(xùn)合同支付(2025年版)
- 2025年銀期轉(zhuǎn)賬協(xié)議個(gè)人投資者用
- (高清版)DB45∕T 351-2022 綠色食品 水稻生產(chǎn)技術(shù)規(guī)程
- 人教版七年級(jí)上冊(cè)歷史與社會(huì)第四單元 第 五課《城市規(guī)劃的典范:巴西利亞》教學(xué)設(shè)計(jì)2 (2份打包)
- 《第一單元 和計(jì)算機(jī)交朋友:2 玩轉(zhuǎn)鼠標(biāo)》教學(xué)設(shè)計(jì)-2024-2025學(xué)年浙江攝影版(三起)(2020)三年級(jí)上冊(cè)
- (??家族e(cuò)題)2022-2023學(xué)年三年級(jí)上冊(cè)期末核心考點(diǎn)數(shù)學(xué)試卷北師大版
- 第2課 八顆行星(教學(xué)設(shè)計(jì))-2023-2024學(xué)年六年級(jí)下冊(cè)科學(xué) 教科版
- 蘇教版數(shù)學(xué)三年級(jí)上冊(cè)單元測(cè)試卷-第五單元-解決問題的策略(含答案)-
- 2025年湖南吉利汽車職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫及答案一套
- 2025年河南物流職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫匯編
- 2024-2025學(xué)年上學(xué)期上海初中英語七年級(jí)期末模擬試卷2
- 神經(jīng)外科患者臥位管理
- 部編人教版三年級(jí)下冊(cè)語文教案(表格版)
- 民航服務(wù)心理學(xué)教案
- 成人重癥患者人工氣道濕化護(hù)理專家共識(shí)解讀教學(xué)課件
- 起重作業(yè)安全教育培訓(xùn)
- 水果店入職培訓(xùn)
- DB15T3127-2023釀酒葡萄氣候品質(zhì)評(píng)價(jià)
- 一年級(jí)新生家長(zhǎng)會(huì)課件(共25張課件)
- 古詩詞誦讀《客至》課件+2023-2024學(xué)年統(tǒng)編版高中語文選擇性必修下冊(cè)
- 2024年區(qū)塊鏈應(yīng)用操作員職業(yè)技能競(jìng)賽理論參考試題庫(含答案)
評(píng)論
0/150
提交評(píng)論