版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
多元正態(tài)分布第一頁,共五十九頁,2022年,8月28日圖標(biāo)說明
表示:需要注意和溫馨提醒的地方;表示:需要重點(diǎn)掌握的知識點(diǎn);表示:難點(diǎn)內(nèi)容。第二頁,共五十九頁,2022年,8月28日第一章多元正態(tài)分布及其抽樣分布§1.1引言§1.2多元指標(biāo)統(tǒng)計(jì)數(shù)據(jù)及其圖示
§1.3多元正態(tài)分布
§1.4統(tǒng)計(jì)距離和馬氏距離
§1.5多元統(tǒng)計(jì)中常用的分布第三頁,共五十九頁,2022年,8月28日§1.1引言目的:明確多元統(tǒng)計(jì)分析及它能夠解決的主要問題第四頁,共五十九頁,2022年,8月28日一、什么是多元統(tǒng)計(jì)分析1.定義多元統(tǒng)計(jì)分析:研究多個(gè)隨機(jī)變量之間相互依賴關(guān)系及內(nèi)在統(tǒng)計(jì)規(guī)律性的一門統(tǒng)計(jì)學(xué)科。社會(huì)經(jīng)濟(jì)現(xiàn)象,受多種指標(biāo)共同作用和影響的現(xiàn)象幾乎無處不在,利用多元統(tǒng)計(jì)分析方法可以對這樣的復(fù)雜現(xiàn)象進(jìn)行量化分析,從而達(dá)到對研究對象進(jìn)行分類和簡化。舉例第五頁,共五十九頁,2022年,8月28日2.主要內(nèi)容:
多元正態(tài)總體的參數(shù)估計(jì)和假設(shè)檢驗(yàn)以及常用的統(tǒng)計(jì)方法,這些統(tǒng)計(jì)方法包括:多元數(shù)據(jù)圖表示法、聚類分析、判別分析、主成分分析、因子分析、對應(yīng)分析、多重多元回歸分析、典型相關(guān)分析、路徑分析等。第六頁,共五十九頁,2022年,8月28日3、多元統(tǒng)計(jì)分析的產(chǎn)生和發(fā)展1928年——Wishart論文產(chǎn)生20世紀(jì)30年代——理論框架形成20世紀(jì)40年代——開始有限應(yīng)用20世紀(jì)50年代——廣泛應(yīng)用20世紀(jì)60年代——新發(fā)展第七頁,共五十九頁,2022年,8月28日二、多元統(tǒng)計(jì)分析能解決那些類型實(shí)際問題經(jīng)濟(jì)學(xué):如:對全國30市自治區(qū)經(jīng)濟(jì)效益作綜合評價(jià),顯然要選取的指標(biāo)很多。如:固定資產(chǎn)投資完成額、職工工資總額、工業(yè)銷售利稅率等很多指標(biāo),對這些錯(cuò)綜復(fù)雜的綜合指標(biāo)進(jìn)行分析解釋時(shí),可用主成分分析法和因子分析法。工業(yè):如:某服裝廠要生產(chǎn)一批新型服裝,如何確定服裝的主要指標(biāo)及分類的型號?第八頁,共五十九頁,2022年,8月28日教育學(xué):如何對高考的考生成績作因素分析?
……多元統(tǒng)計(jì)分析在農(nóng)業(yè)、醫(yī)學(xué)、體育科學(xué)、生態(tài)學(xué)、地質(zhì)學(xué)、社會(huì)學(xué)、軍事科學(xué)、心理學(xué)等各個(gè)學(xué)科領(lǐng)域都有非常廣泛的用途。第九頁,共五十九頁,2022年,8月28日1、城鎮(zhèn)居民消費(fèi)水平通常用八項(xiàng)指標(biāo)來描述,如人均糧食支出、人均副食支出、人均煙酒茶支出、人均衣著商品支出、人均日用品支出、人均燃料支出、人均非商品支出。這八項(xiàng)指標(biāo)存在一定的線性關(guān)系。為了研究城鎮(zhèn)居民的消費(fèi)結(jié)構(gòu),需要將相關(guān)強(qiáng)的指標(biāo)歸并到一起,這實(shí)際就是對指標(biāo)進(jìn)行聚類分析。2、在企業(yè)經(jīng)濟(jì)效益的評價(jià)中,涉及到的指標(biāo)往往很多,如百元固定資產(chǎn)原值實(shí)現(xiàn)產(chǎn)值、百元固定資產(chǎn)原值實(shí)現(xiàn)利稅、百元資金實(shí)現(xiàn)利稅、百元工業(yè)總產(chǎn)值實(shí)現(xiàn)利稅、百元銷售收入實(shí)現(xiàn)利稅、每噸標(biāo)準(zhǔn)煤實(shí)現(xiàn)工業(yè)產(chǎn)值、每千瓦時(shí)電力實(shí)現(xiàn)工業(yè)產(chǎn)值、全員勞動(dòng)生產(chǎn)率、百元流動(dòng)資金實(shí)現(xiàn)產(chǎn)值。如何將這些具有錯(cuò)綜復(fù)雜關(guān)系的指標(biāo)綜合成幾個(gè)較少的因子,既有利于對問題進(jìn)行分析和解釋,又能便于抓住主要矛盾做出科學(xué)的評價(jià)??捎弥鞒煞址治龊鸵蜃臃治龇?。第十頁,共五十九頁,2022年,8月28日3、某一產(chǎn)品是用兩種不同原料生產(chǎn)的,試問此兩種原料生產(chǎn)的產(chǎn)品壽命有無顯著差異?又比如,若考察某商業(yè)行業(yè)今年和去年的經(jīng)營狀況,這時(shí)需要看這兩年經(jīng)營指標(biāo)的平均水平是否有顯著差異以及經(jīng)營指標(biāo)之間的波動(dòng)是否有顯著差異。可用多元正態(tài)總體均值向量和協(xié)差陣的假設(shè)檢驗(yàn)。4、按現(xiàn)行統(tǒng)計(jì)報(bào)表制度,農(nóng)村家庭純收入是指農(nóng)村常住居民家庭總收入中扣除從事生產(chǎn)和非生產(chǎn)經(jīng)營用支出、稅款和上交承包集體任務(wù)金額以后剩余的、可直接用于進(jìn)行生產(chǎn)的、非生產(chǎn)性建設(shè)投資、生產(chǎn)性消費(fèi)的那一部分收入。如果我們收集某年各個(gè)省、自治區(qū)、直轄市農(nóng)民家庭人均純收入的數(shù)據(jù),可以用相應(yīng)分析,揭示全國農(nóng)民人均純收入的特征以及各省、自治區(qū)、直轄市與各收入指標(biāo)的關(guān)系。第十一頁,共五十九頁,2022年,8月28日5、某醫(yī)院已有100個(gè)分別患有胃炎、肝炎、冠心病、糖尿病等的病人資料,記錄了他們每個(gè)人若干項(xiàng)癥狀指標(biāo)數(shù)據(jù)。如果對于一個(gè)新的病人,當(dāng)也測得這若干項(xiàng)癥狀指標(biāo)時(shí),可以利用判別分析方法判定他患的是哪種病。6、有100種酒,品嘗家可以對每兩種酒進(jìn)行品嘗對比,給出一種相近程度的得分(越相近得分越高,相差越遠(yuǎn)得分越低),希望用這些得分?jǐn)?shù)據(jù)來了解這100種酒之間的結(jié)構(gòu)關(guān)系。這樣的問題就可以用多維標(biāo)度法來解決。7、在地質(zhì)學(xué)中,常常要研究礦石中所含化學(xué)成分之間的關(guān)系。設(shè)在某礦體中采集了60個(gè)標(biāo)本,對每個(gè)標(biāo)本測得20個(gè)化學(xué)成分的含量。我們希望通過對這20個(gè)化學(xué)成分的分析,了解礦體的性質(zhì)和礦體形成的主要原因。第十二頁,共五十九頁,2022年,8月28日8、研究中國七星瓢蟲在黃海、渤海的群聚與近期氣象條件的關(guān)系。對1000個(gè)類似的魚類樣本,如何根據(jù)測量的特征如體重、身長、鰭數(shù)、鰭長、頭寬等,我們可以利用聚類分析方法將這類魚分成幾個(gè)不同品種。9、考古學(xué)家對挖掘出來的人頭蓋骨的高、寬等特征來判斷是男或女,根據(jù)挖掘出的動(dòng)物牙齒的有關(guān)測試指標(biāo),判別它是屬于哪一類動(dòng)物牙齒、是哪一個(gè)時(shí)代的。10、在高考招生工作中,我們知道每個(gè)考生的基本情況,通過分析我們不僅可以了解到學(xué)生喜歡學(xué)習(xí)的科目,還可以進(jìn)一步從考生每門課程的成績,分析出學(xué)生的邏輯思維能力、形象思維能力和記憶力等等對學(xué)習(xí)成績的影響。第十三頁,共五十九頁,2022年,8月28日三、期望達(dá)到的目的學(xué)會(huì)分析多元觀測數(shù)據(jù),對給定多元數(shù)據(jù)能恰當(dāng)選用本書所介紹的方法,結(jié)合統(tǒng)計(jì)軟件進(jìn)行計(jì)算、分析。對所研究問題作出科學(xué)評價(jià)與合理的推斷。清楚理解每種方法所要解決的問題,前提條件和局限性等。比較某些有聯(lián)系方法之間的相似處與差異。第十四頁,共五十九頁,2022年,8月28日四、多元統(tǒng)計(jì)分析的前提條件1.多元統(tǒng)計(jì)分布對資料的分布有一定的要求;2.需要有足夠大的樣本。為什么在統(tǒng)計(jì)學(xué)分析中需要有足夠大的樣本?第十五頁,共五十九頁,2022年,8月28日例甲、乙兩研究者分別用某新藥治療10例和403例老年性氣管炎患者,其療效如下表。
甲治療結(jié)果例數(shù)%
臨床治愈770
未治愈330
合計(jì)10100乙治療結(jié)果例數(shù)%臨床治愈8320未治愈32080合計(jì)403100第十六頁,共五十九頁,2022年,8月28日
臨床上感興趣的問題是新藥治療老年性氣管炎治愈率是多少,而不是10和403例的治愈頻率,
那么應(yīng)用20%,還是70%,以估計(jì)新藥治療老年性氣管炎治愈率呢?
第十七頁,共五十九頁,2022年,8月28日歷史上許多著名科學(xué)家做過拋擲硬幣的試驗(yàn),拋擲硬幣試驗(yàn)結(jié)果如表
━━━━━━━━━━━━━━━━━━━━━
試驗(yàn)者拋擲次數(shù)(n)正面次數(shù)(k)頻率(k/n)─────────────────────DeMorgan204810610.518Buffon4,0402,0480.5069Pearson12,0006,0190.5016Pearson24,00012,0120.5005━━━━━━━━━━━━━━━━━━━━━第十八頁,共五十九頁,2022年,8月28日觀測例數(shù)越少,抽樣誤差越大,樣本的對研究總體的代表性就小。所以,統(tǒng)計(jì)學(xué)中需要足夠多的樣本數(shù)。第十九頁,共五十九頁,2022年,8月28日§1.2多元指標(biāo)統(tǒng)計(jì)數(shù)據(jù)及其圖示目標(biāo):掌握用圖形來直觀表示多元數(shù)據(jù)的方法要求:了解多變量圖示法的作圖方法;利用統(tǒng)計(jì)軟件對多元資料作圖。第二十頁,共五十九頁,2022年,8月28日圖形是直觀而形象的,它可以幫人思維和判斷,當(dāng)只有兩個(gè)變量時(shí),通常有直角坐標(biāo)在平面上點(diǎn)圖,當(dāng)有三個(gè)變量時(shí),雖然可以在三維坐標(biāo)里點(diǎn)圖,但已經(jīng)很不方便了,當(dāng)變量個(gè)數(shù)大于三個(gè)時(shí),就不能用通常的做法作圖,多元數(shù)據(jù)圖示在二〇世紀(jì)七十年代有了較大的突破,本章主要介紹散點(diǎn)圖矩陣,雷達(dá)圖,臉譜圖等多變量圖示法的基本思想及作圖方法。一、多元數(shù)據(jù)圖示第二十一頁,共五十九頁,2022年,8月28日1、散點(diǎn)圖矩陣定義:散點(diǎn)圖矩陣是借助兩變量散點(diǎn)圖做法,它可以看作是一個(gè)大的圖形矩陣,其每一個(gè)非主對角元素的位置上是對應(yīng)的行變量與列變量的散點(diǎn)圖。例一:以Spss軟件自帶的World95.sav資料為例,選擇該數(shù)據(jù)如下幾個(gè)變量作圖:density(人口密度),lifeexpf(女性預(yù)期壽命),lifeexpm(男性預(yù)期壽命),babymort(嬰兒死亡率),gdp_cap(GDP是總資產(chǎn)的倍數(shù)),Calories(每日攝入熱量)第二十二頁,共五十九頁,2022年,8月28日第二十三頁,共五十九頁,2022年,8月28日2、輪廓圖設(shè)變量個(gè)數(shù)為p,觀測次數(shù)為n,第i次觀測值記為輪廓圖:用p個(gè)平行的縱坐標(biāo)代表p個(gè)變量,每個(gè)樣品在圖上有p個(gè)點(diǎn),將它們依次鏈接起來成一折線,此折線圖稱為樣品的輪廓圖第二十四頁,共五十九頁,2022年,8月28日例二.考查北京、上海、天津、重慶四個(gè)直轄市的人均收入情況,選取以下幾個(gè)指標(biāo),具體數(shù)據(jù)如下表一表一第二十五頁,共五十九頁,2022年,8月28日作圖步驟Stepone:作平面坐標(biāo)系,橫坐標(biāo)?。饌€(gè)點(diǎn)表示p個(gè)指標(biāo);
Steptwo:對給定的依次觀測值,在p個(gè)點(diǎn)上的縱坐標(biāo)和它對應(yīng)的變量取值成正比;Stepthree:連接p個(gè)高度的頂點(diǎn)成一條折線,則一次觀測值的輪廓為一條多角折線形。n次觀測值可畫n條折線,構(gòu)成輪廓圖。下面畫出上例的輪廓圖第二十六頁,共五十九頁,2022年,8月28日圖二輪廓圖第二十七頁,共五十九頁,2022年,8月28日
由輪廓圖可以看出:北京,上海的居民收入較高且教相似,平均收入較高,重慶人均收入狀況最差。如果考查樣品較多,畫折線時(shí)圖形中可能出現(xiàn)重復(fù)點(diǎn)多,不便于區(qū)分哪個(gè)樣品對應(yīng)哪條折線,這時(shí)最好多用集中顏色或長短虛線等標(biāo)志來畫出折線第二十八頁,共五十九頁,2022年,8月28日3.雷達(dá)圖雷達(dá)圖:又稱星圖,蜘蛛網(wǎng)圖。作圖步驟:Stepone:作一圓,并把圓周分為p等分;Steptwo:連接圓心和各分點(diǎn),把這p條半徑依次定義為各變量的坐標(biāo)軸,并標(biāo)以適當(dāng)刻度;Stepthree:對給定一次觀測值,把它的p個(gè)分量值分別點(diǎn)在相應(yīng)的坐標(biāo)軸上,然后連接成一個(gè)p邊形,這個(gè)p變形為p元觀測值的圖標(biāo),n次觀測值可以畫出n個(gè)p邊形。第二十九頁,共五十九頁,2022年,8月28日分析:由圖三可看出北京、上海各指標(biāo)都較高,對應(yīng)著一個(gè)較大面積的四邊形,重慶各指標(biāo)最低,面積最小,另外,從圖形輪廓還可以看出,北京、上海、天天津發(fā)展比例類似,而重慶發(fā)展比例和前三個(gè)直轄市較大不同。第三十頁,共五十九頁,2022年,8月28日注意:對于散點(diǎn)圖,輪廓圖,雷達(dá)圖,Excel軟件都提供了此三種圖形繪圖的功能,但它適合于觀測數(shù)據(jù),指標(biāo)較小的情形,這時(shí)可以把各觀測數(shù)據(jù)畫到一張圖里,便于對各指標(biāo)進(jìn)行對比,并且Excel有很好的編輯功能,但是,當(dāng)觀測數(shù)據(jù)較多時(shí),畫到一張圖里就不容易看出各個(gè)圖形,不利于比較,此時(shí)用S-Plus進(jìn)行多元數(shù)據(jù)圖示。第三十一頁,共五十九頁,2022年,8月28日二、多元數(shù)據(jù)表示1、隨機(jī)向量定義1將p個(gè)隨機(jī)變量的整體稱為p維隨機(jī)向量,記為:
表示:對一個(gè)體觀測的p個(gè)變量,觀測n次,可得到如下表二數(shù)據(jù)第三十二頁,共五十九頁,2022年,8月28日表二序號變量…12...n
……...…第三十三頁,共五十九頁,2022年,8月28日因此,樣本資料可用矩陣語言表示為:第三十四頁,共五十九頁,2022年,8月28日2、分布函數(shù)與密度函數(shù)1).一元統(tǒng)計(jì)中分布函數(shù)和密度函數(shù)設(shè)X為一隨機(jī)變量,稱為概率分布函數(shù),記為
第三十五頁,共五十九頁,2022年,8月28日離散型:若隨機(jī)變量在有限或可列個(gè)值上取值,記則稱X為離散型隨機(jī)變量,并稱為X的概率分布連續(xù)型:設(shè),若存在一非負(fù)函數(shù),使得對一切實(shí)數(shù)有:則稱X為連續(xù)型隨機(jī)變量,稱為X的分布密度函數(shù),簡稱密度函數(shù)。其滿足的條件為:(1)(2)第三十六頁,共五十九頁,2022年,8月28日2.多元統(tǒng)計(jì)中分布函數(shù)與密度函數(shù)第三十七頁,共五十九頁,2022年,8月28日第三十八頁,共五十九頁,2022年,8月28日三.隨機(jī)向量的數(shù)字特征1.期望:第三十九頁,共五十九頁,2022年,8月28日均值向量的性質(zhì):其中X,Y為隨機(jī)向量,A,B為常數(shù)矩陣第四十頁,共五十九頁,2022年,8月28日2.隨機(jī)向量X的自協(xié)方差矩陣第四十一頁,共五十九頁,2022年,8月28日3.隨機(jī)向量x和y的協(xié)方差矩陣
若則稱不相關(guān)協(xié)方差矩陣,其性質(zhì)為第四十二頁,共五十九頁,2022年,8月28日多元統(tǒng)計(jì)分析中的許多理論和方法都是建立在正態(tài)分布的基礎(chǔ)上,現(xiàn)實(shí)世界中的許多實(shí)際問題的解決辦法也是以服從正態(tài)分布或近似正態(tài)分布為前提的。因此多元正態(tài)分布是我們必須要掌握的內(nèi)容§1.3多元正態(tài)分布第四十三頁,共五十九頁,2022年,8月28日一、多元正態(tài)分布定義第四十四頁,共五十九頁,2022年,8月28日二元正態(tài)分布第四十五頁,共五十九頁,2022年,8月28日二、多元正態(tài)分布的性質(zhì)第四十六頁,共五十九頁,2022年,8月28日第四十七頁,共五十九頁,2022年,8月28日例若第四十八頁,共五十九頁,2022年,8月28日
§1.4統(tǒng)計(jì)距離和馬氏距離
一.統(tǒng)計(jì)距離(p6)第四十九頁,共五十九頁,2022年,8月28日第五十頁,共五十九頁,2022年,8月28日二.馬氏距離第五十一頁,共五十九頁,2022年,8月28日§1.5多元統(tǒng)計(jì)中常用的分布(p17)統(tǒng)計(jì)分析的目的,概括起來講就是要了解總體分布的特征,統(tǒng)計(jì)分析的出發(fā)點(diǎn)或依據(jù)是樣本,因?yàn)樾畔⑹欠稚⒌綐颖镜拿總€(gè)分量上的,因此直接從樣本出發(fā)來推斷總體是不方便的,為此需要根據(jù)要解決的問題對樣本進(jìn)行加工,把所關(guān)心的總體問題濃縮到一個(gè)不包括未知參數(shù)的樣本函數(shù)中,這個(gè)樣本函數(shù)稱為統(tǒng)計(jì)量。如樣本均值X,樣本離差陣等都是統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布為抽樣分布。在一元統(tǒng)計(jì)中,常用的分布有,在多元統(tǒng)計(jì)中,他們分別發(fā)展為Wishart,和Wilks分布第五十二頁,共五十九頁,2022年,8月28日一、在一元統(tǒng)計(jì)中,若
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 青島恒星科技學(xué)院《康復(fù)護(hù)理學(xué)(Ⅰ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 青島航空科技職業(yè)學(xué)院《社會(huì)調(diào)查方法實(shí)驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 建筑知識課程設(shè)計(jì)
- stm32 adc電壓課程設(shè)計(jì)
- 微課課程設(shè)計(jì)特色
- 兒童減肥飲食計(jì)劃
- 如何用匯報(bào)做出令人難忘的封面和目錄
- 互聯(lián)網(wǎng)公司商業(yè)模式創(chuàng)新探討
- 個(gè)人時(shí)間管理與工作效率提升方法研究
- 兒童漫畫分類課程設(shè)計(jì)
- 企業(yè)清算會(huì)計(jì)報(bào)表(共4表).xls
- 采油工程-典型示功圖分析
- 臥式儲(chǔ)罐焊接結(jié)構(gòu)和工藝設(shè)計(jì)
- 暖通工程施工組織專項(xiàng)設(shè)計(jì)方案
- 鐵路超限超重貨物運(yùn)輸規(guī)則(2012)
- 《如何成為一個(gè)頂尖的銷售人員》(PPT54頁)
- 苯乙烯_馬來酸酐接枝聚乙烯蠟的研究
- SL702015灌溉與排水工程規(guī)范施工質(zhì)量評定表修正
- 船板認(rèn)證基礎(chǔ)知識
- 利用基本不等式求最值的常見方法ppt課件
- 美卓山特維克破碎機(jī)配件2
評論
0/150
提交評論