Chp.2 數(shù)據(jù)分布模型及其應(yīng)用_第1頁
Chp.2 數(shù)據(jù)分布模型及其應(yīng)用_第2頁
Chp.2 數(shù)據(jù)分布模型及其應(yīng)用_第3頁
Chp.2 數(shù)據(jù)分布模型及其應(yīng)用_第4頁
Chp.2 數(shù)據(jù)分布模型及其應(yīng)用_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Chp.2 數(shù)據(jù)分布模型及其應(yīng)用數(shù)據(jù)分布模型及其應(yīng)用 1q問題的提出問題的提出兩個引子兩個引子地質(zhì)研究表明,鉻的含量與砷的含量存在一地質(zhì)研究表明,鉻的含量與砷的含量存在一定關(guān)系,某礦區(qū)取得一批礦樣,測得定關(guān)系,某礦區(qū)取得一批礦樣,測得Cr2O3與與As數(shù)據(jù),你用何種數(shù)學(xué)方法確定它們之間數(shù)據(jù),你用何種數(shù)學(xué)方法確定它們之間的數(shù)學(xué)表達(dá)式,來的數(shù)學(xué)表達(dá)式,來預(yù)測未知區(qū)域的鉻的分布預(yù)測未知區(qū)域的鉻的分布?Chp.2 數(shù)據(jù)分布模型及其應(yīng)用數(shù)據(jù)分布模型及其應(yīng)用 2油藏油藏含油飽和度含油飽和度與儲層的與儲層的滲透率滲透率、孔隙度孔隙度、排驅(qū)壓力排驅(qū)壓力、毛管壓力毛管壓力、孔喉半徑孔喉半徑、孔喉歪度孔喉歪度、孔

2、隙峰度孔隙峰度以及以及束縛水飽和度束縛水飽和度等因素相關(guān)。今等因素相關(guān)。今取得一批上述各項的分析數(shù)據(jù),如何通過數(shù)取得一批上述各項的分析數(shù)據(jù),如何通過數(shù)據(jù)分析,建立隨機因變量與多個隨機自變量據(jù)分析,建立隨機因變量與多個隨機自變量間的數(shù)量關(guān)系,間的數(shù)量關(guān)系,判斷油藏的好壞判斷油藏的好壞,以及,以及預(yù)測預(yù)測新的油氣藏位置新的油氣藏位置?Chp.2 數(shù)據(jù)分布模型及其應(yīng)用數(shù)據(jù)分布模型及其應(yīng)用 為了對地質(zhì)現(xiàn)象(包括地質(zhì)體本身)正確地進(jìn)行數(shù)為了對地質(zhì)現(xiàn)象(包括地質(zhì)體本身)正確地進(jìn)行數(shù)學(xué)抽象,需要充分認(rèn)識其學(xué)抽象,需要充分認(rèn)識其數(shù)學(xué)屬性數(shù)學(xué)屬性。一般地說,地質(zhì)現(xiàn)象的數(shù)學(xué)屬性可以大致地分為一般地說,地質(zhì)現(xiàn)象的數(shù)

3、學(xué)屬性可以大致地分為精精確性確性、隨機性隨機性和和模糊性模糊性三種。三種。地質(zhì)現(xiàn)象的隨機性源于其構(gòu)成復(fù)雜、干擾因素眾多,地質(zhì)現(xiàn)象的隨機性源于其構(gòu)成復(fù)雜、干擾因素眾多,事件的發(fā)展方向和結(jié)果有多種可能性。也就是說,地質(zhì)事件的發(fā)展方向和結(jié)果有多種可能性。也就是說,地質(zhì)運動或地質(zhì)過程是按運動或地質(zhì)過程是按隨機原理隨機原理構(gòu)成的,普遍地受構(gòu)成的,普遍地受概率法概率法則則的支配。的支配。3Chp.2 數(shù)據(jù)分布模型及其應(yīng)用數(shù)據(jù)分布模型及其應(yīng)用 為了更好地了解某一地質(zhì)過程,應(yīng)先確定其為了更好地了解某一地質(zhì)過程,應(yīng)先確定其模式,而這種模式既可以用概率論來描述,同時模式,而這種模式既可以用概率論來描述,同時還可以

4、用數(shù)理統(tǒng)計的方法檢驗。還可以用數(shù)理統(tǒng)計的方法檢驗。顯然,要妥善地處理上述各種問題,應(yīng)當(dāng)借顯然,要妥善地處理上述各種問題,應(yīng)當(dāng)借助研究隨機現(xiàn)象的數(shù)學(xué)工具助研究隨機現(xiàn)象的數(shù)學(xué)工具概率論及數(shù)理統(tǒng)概率論及數(shù)理統(tǒng)計計。4 2.1 基本概念基本概念 必然事件必然事件不可能事件不可能事件隨機事件隨機事件在一定條在一定條件下必然件下必然不會出現(xiàn)不會出現(xiàn)在一定條在一定條件下必然件下必然出現(xiàn)出現(xiàn)可以預(yù)知,具有確定性可以預(yù)知,具有確定性一定條件下可能一定條件下可能實現(xiàn),也可能不實現(xiàn),也可能不能成為現(xiàn)實能成為現(xiàn)實由于地質(zhì)作用的長期性和復(fù)雜性,地質(zhì)過程中產(chǎn)生由于地質(zhì)作用的長期性和復(fù)雜性,地質(zhì)過程中產(chǎn)生的大多數(shù)地質(zhì)現(xiàn)象都

5、可看作是隨機事件。的大多數(shù)地質(zhì)現(xiàn)象都可看作是隨機事件。 “鉆探鉆探到到100m深處見到礦體深處見到礦體”5 2.1 基本概念基本概念 現(xiàn)象:現(xiàn)象:當(dāng)我們在一定的條件下重復(fù)作某一觀測時,會當(dāng)我們在一定的條件下重復(fù)作某一觀測時,會發(fā)現(xiàn)一些現(xiàn)象出現(xiàn)的次數(shù)多些,另一些現(xiàn)象出現(xiàn)的次發(fā)現(xiàn)一些現(xiàn)象出現(xiàn)的次數(shù)多些,另一些現(xiàn)象出現(xiàn)的次數(shù)少些。表明各事件出現(xiàn)的可能性是有大有小的,這數(shù)少些。表明各事件出現(xiàn)的可能性是有大有小的,這自然會使人想到可以用一個數(shù)字來描繪事件出現(xiàn)的可自然會使人想到可以用一個數(shù)字來描繪事件出現(xiàn)的可能性。能性。概率:概率:設(shè)某一隨機事件設(shè)某一隨機事件A在在n次觀測中出現(xiàn)了次觀測中出現(xiàn)了m次,則次

6、,則稱稱m/n為事件為事件A出現(xiàn)的頻率。當(dāng)出現(xiàn)的頻率。當(dāng)n足夠大時,事件足夠大時,事件A的的頻率會穩(wěn)定在某一數(shù)值頻率會穩(wěn)定在某一數(shù)值P附近擺動,數(shù)值附近擺動,數(shù)值P即為事件即為事件A出現(xiàn)的概率,記作出現(xiàn)的概率,記作P(A)=P。在實際研究中,常用事件。在實際研究中,常用事件的頻率近似地表示該事件的概率。的頻率近似地表示該事件的概率。6 2.1 基本概念基本概念 區(qū)間號區(qū)間號123456789金含量金含量ppm0.10.20.20.50.5112255101020205050100-頻數(shù)頻數(shù)203055901358065205500頻率頻率%46111827161341100某礦脈金含量區(qū)間頻數(shù)

7、及頻率分布表某礦脈金含量區(qū)間頻數(shù)及頻率分布表7 2.1 基本概念基本概念 隨機事件概率的性質(zhì)和運算公式隨機事件概率的性質(zhì)和運算公式(1 1)對于任意事件)對于任意事件A A,有,有 0 0P(A)P(A)1 1,P()=1P()=1,P(P()=0)=0(2 2)概率加法公式。若事件)概率加法公式。若事件A A和事件和事件B B互不相容,則有互不相容,則有 P(A+B)=P(A)+P(B)P(A+B)=P(A)+P(B) P(A)+P(P(A)+P( )=1)=1(3 3)條件概率)條件概率A)()()(BPABPBAP8 2.1 基本概念基本概念 為考察某地斷裂構(gòu)造對金礦脈的控制作用,抽取具

8、有代為考察某地斷裂構(gòu)造對金礦脈的控制作用,抽取具有代表性的表性的120個已知單元進(jìn)行統(tǒng)計,結(jié)果如下:個已知單元進(jìn)行統(tǒng)計,結(jié)果如下:(1)有金礦脈出現(xiàn)的單元有)有金礦脈出現(xiàn)的單元有26個,其中:伴隨有個,其中:伴隨有北東北東向向斷裂的單元有斷裂的單元有17個;伴隨有個;伴隨有北西北西向斷裂的單元有向斷裂的單元有7個;伴個;伴隨有隨有東西東西向斷裂的單元有向斷裂的單元有2個。個。(2)只出現(xiàn))只出現(xiàn)北東北東向斷裂的單元有向斷裂的單元有3個。個。(3)只出現(xiàn))只出現(xiàn)北西北西向斷裂的單元有向斷裂的單元有9個。個。(4)只出現(xiàn))只出現(xiàn)東西東西向斷裂的單元有向斷裂的單元有6個。個。(5)沒有礦脈也沒有斷裂

9、的單元有)沒有礦脈也沒有斷裂的單元有76個。個。9 2.1 基本概念基本概念 1)P(礦脈出現(xiàn)礦脈出現(xiàn))=26/120=21.7%;2)P(北東向斷裂出現(xiàn)北東向斷裂出現(xiàn))=(17+3)/120=16.7%;3)P(北西向斷裂出現(xiàn)北西向斷裂出現(xiàn))=(7+9)/120=13.3%;4)P(東西向斷裂出現(xiàn)東西向斷裂出現(xiàn))=(2+6)/120=6.7%; P(北東向斷裂北東向斷裂|礦脈礦脈)=%4 .65%7 .21%2 .14)()(礦脈出現(xiàn)出現(xiàn)礦脈和北東向斷裂同時PP%8 . 7%7 .21%7 . 1)()(礦脈出現(xiàn)出現(xiàn)礦脈和東西向斷裂同時PP P(東西向斷裂東西向斷裂|礦脈礦脈)= P(礦脈礦

10、脈|北東向斷裂北東向斷裂)=%03.85%7 .16%2 .14)()(北東向斷裂出現(xiàn)出現(xiàn)礦脈和北東向斷裂同時PP詳見詳見P1510 2.1 基本概念基本概念 在數(shù)學(xué)及其它應(yīng)用研究中,常用隨機變量來表征隨在數(shù)學(xué)及其它應(yīng)用研究中,常用隨機變量來表征隨機事件的數(shù)量特征。機事件的數(shù)量特征。 隨機變量隨機變量(Random Variable) : 在觀測或試驗中可能取這個或那個數(shù)值,但不能預(yù)在觀測或試驗中可能取這個或那個數(shù)值,但不能預(yù)知一定取什么值的變量,被稱為知一定取什么值的變量,被稱為隨機變量隨機變量。當(dāng)隨機變量。當(dāng)隨機變量取某一個值或落入某個數(shù)值區(qū)間時,便構(gòu)成一個隨機事取某一個值或落入某個數(shù)值區(qū)

11、間時,便構(gòu)成一個隨機事件。件。 11 2.1 基本概念基本概念 分布率分布率(Distribution Law):R.V.所取的值與其概率形成的所取的值與其概率形成的對應(yīng)關(guān)系。對應(yīng)關(guān)系。 222)(21)(xexf122.1 基本概念基本概念R.V.的分類的分類: :(1)離散型離散型R.V.(Discrete R.V.) 只能取有限個或可列無窮個數(shù)值的隨機變量(礦田只能取有限個或可列無窮個數(shù)值的隨機變量(礦田中礦床的個數(shù)、礦床中的礦脈數(shù)、抽查樣品分析的合格中礦床的個數(shù)、礦床中的礦脈數(shù)、抽查樣品分析的合格率等)。常用的率等)。常用的D.R.V.的理論分布有的理論分布有: : 二項分布二項分布(

12、Binomial D.) 泊松分布泊松分布(Poisson D.) 幾何分布幾何分布(Geometric D.) 負(fù)二項分布負(fù)二項分布(Negative binomial D.)132.1 基本概念基本概念R.V.的分類的分類: :(2)連續(xù)型連續(xù)型R.V.(Continuous R.V.) 可以取得某一區(qū)間內(nèi)的一切實數(shù)(地球化學(xué)元素可以取得某一區(qū)間內(nèi)的一切實數(shù)(地球化學(xué)元素含量、礦石品位、厚度、地形高程等),它的取值范含量、礦石品位、厚度、地形高程等),它的取值范圍是一個實數(shù)區(qū)間,是不可列的。圍是一個實數(shù)區(qū)間,是不可列的。 常用的常用的C. R.V.理論分布有:理論分布有: 正態(tài)分布正態(tài)分布

13、(Normal D.) 對數(shù)正態(tài)分布對數(shù)正態(tài)分布(Lognormal D.) 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布(Standard normal D.) 均勻分布均勻分布(Uniform D.) 指數(shù)分布指數(shù)分布(Exponential D.)142.1 基本概念基本概念為了研究為了研究C.R.V.,必須建立以下幾個概念:,必須建立以下幾個概念: 直方圖直方圖(Histogram): R.V.觀測值與該觀測值的出現(xiàn)觀測值與該觀測值的出現(xiàn)頻率的對應(yīng)關(guān)系圖(設(shè)頻率的對應(yīng)關(guān)系圖(設(shè)n=總次數(shù),總次數(shù),m=某值出現(xiàn)次數(shù),某值出現(xiàn)次數(shù),則則m/n=頻率),頻率),f(x)=m/n.15 頻率分布密度曲線頻率分布密

14、度曲線(Frequency Distribution Density Curve):):通過直方圖上各小長方形頂邊連接而成的通過直方圖上各小長方形頂邊連接而成的一條近似曲線。一條近似曲線。 概率分布密度函數(shù)概率分布密度函數(shù)(Probability Distribution Density Function):):簡稱密度函數(shù),從理論上推導(dǎo)出的與頻簡稱密度函數(shù),從理論上推導(dǎo)出的與頻率分布密度曲線相一致的函數(shù)關(guān)系,該函數(shù)稱之為率分布密度曲線相一致的函數(shù)關(guān)系,該函數(shù)稱之為P.D.D.F.。2.1 基本概念基本概念為了研究為了研究C.R.V.,必須建立以下幾個概念:,必須建立以下幾個概念:162.1

15、基本概念基本概念 概率分布函數(shù)概率分布函數(shù)(Probability Distribution Function):):簡稱分布函數(shù),當(dāng)已知簡稱分布函數(shù),當(dāng)已知P.D.D.F.時,便可知時,便可知R.V.落在任落在任一區(qū)間一區(qū)間x1,x2內(nèi)的概率,但它涉及內(nèi)的概率,但它涉及x1、x2兩個值,不便兩個值,不便研究,故引出分布函數(shù):研究,故引出分布函數(shù):xf(t)dtx)P( F(x) 則稱則稱F(x)為為的概率分布函數(shù),稱的概率分布函數(shù),稱f(x)為為的概率分布密度的概率分布密度函數(shù)。函數(shù)。 設(shè)設(shè)為一連續(xù)型為一連續(xù)型R.V.,x為任一實數(shù),若存在非負(fù)可積函為任一實數(shù),若存在非負(fù)可積函數(shù)數(shù)f(x)(

16、即概率分布密度函數(shù)),使得:(即概率分布密度函數(shù)),使得: 172.1 基本概念基本概念 從幾何意義上看,從幾何意義上看,F(xiàn)(x)是是f(x)從從-到到x區(qū)間的一個曲邊梯區(qū)間的一個曲邊梯形的面積,如下圖。形的面積,如下圖。 F(x)的圖形如右圖,可以近似地把累積頻率分布曲線看成的圖形如右圖,可以近似地把累積頻率分布曲線看成是概率分布函數(shù)曲線。是概率分布函數(shù)曲線。 當(dāng)知道當(dāng)知道F(x),可按下式求出,可按下式求出R.V.的任一區(qū)間的任一區(qū)間x1,x2上的概率上的概率P(x1x2)=F(x2)-F(x1)182.1 基本概念基本概念0)(lim)(xFFx1)(lim)(xFFx)()(lim0a

17、FbFab概率分布函數(shù)有下列性質(zhì):概率分布函數(shù)有下列性質(zhì): 概率分布函數(shù)概率分布函數(shù)F(x)是一個非負(fù)的增函數(shù),即對是一個非負(fù)的增函數(shù),即對于任何于任何xlx2均有均有F(x1)F(x2)。192.1 基本概念基本概念母體母體(總體,(總體,Population) 所研究對象的全體所構(gòu)成之集合(所研究對象的全體所構(gòu)成之集合(R.V.取值的全體)取值的全體) 樣本樣本(子樣,(子樣,Sample) 從總體中抽出的一部分個體之集合,子樣中的個體數(shù)從總體中抽出的一部分個體之集合,子樣中的個體數(shù)稱為子樣的大?。ㄈ萘浚Q為子樣的大?。ㄈ萘浚瑂ample size)。)。樣品樣品(個體,(個體,speci

18、men) 組成總體的每個基本單元。組成總體的每個基本單元。 小子樣(容量小子樣(容量3050)。)。 202.2 研究分布率的(地質(zhì))意義研究分布率的(地質(zhì))意義當(dāng)頻率直方圖(當(dāng)頻率直方圖(frequency histogram)完成后,對其最)完成后,對其最基本的研究包括:基本的研究包括:單峰?多峰曲線?單峰?多峰曲線?對稱?偏斜?對應(yīng)的理論分布曲線?對稱?偏斜?對應(yīng)的理論分布曲線?計算各種統(tǒng)計分布特征,如均值(計算各種統(tǒng)計分布特征,如均值(mean)、方差)、方差(variance)、標(biāo)準(zhǔn)差()、標(biāo)準(zhǔn)差(standard V.)、變異系)、變異系數(shù)(數(shù)(coefficient of var

19、iation)等)等。這些研究在地質(zhì)方面對找礦、礦體預(yù)測、勘探方法、地這些研究在地質(zhì)方面對找礦、礦體預(yù)測、勘探方法、地質(zhì)特征研究等均具有重要意義。質(zhì)特征研究等均具有重要意義。 212.2 研究分布率的(地質(zhì))意義研究分布率的(地質(zhì))意義(1)(1) 分布率是地質(zhì)體等研究對象最重要的數(shù)學(xué)特征之一,分布率是地質(zhì)體等研究對象最重要的數(shù)學(xué)特征之一,不同成因、不同類型的地質(zhì)體具有不同的分布函數(shù)。不同成因、不同類型的地質(zhì)體具有不同的分布函數(shù)。1 1) 把試驗分布與理論分布相比,進(jìn)行資源預(yù)測等(某把試驗分布與理論分布相比,進(jìn)行資源預(yù)測等(某區(qū)礦量分布率、實際分布率比較);區(qū)礦量分布率、實際分布率比較);2

20、2) 不同來源(如地層)、但屬同一現(xiàn)象(如元素)的不同來源(如地層)、但屬同一現(xiàn)象(如元素)的試驗數(shù)據(jù)間的比較(地層對比、巖體特征)。試驗數(shù)據(jù)間的比較(地層對比、巖體特征)。 顯然,分布率有重要的鑒別意義及成因意義。顯然,分布率有重要的鑒別意義及成因意義。 222.2 研究分布率的(地質(zhì))意義研究分布率的(地質(zhì))意義(2)(2) 根據(jù)數(shù)據(jù)分布模型以及所研究問題的性質(zhì)進(jìn)行各根據(jù)數(shù)據(jù)分布模型以及所研究問題的性質(zhì)進(jìn)行各種概率估計種概率估計1 1) 評價各種因素對觀測數(shù)據(jù)的影響(各種變量對母評價各種因素對觀測數(shù)據(jù)的影響(各種變量對母體特征的影響);體特征的影響);2 2) 對未觀測到的變量中間值進(jìn)行內(nèi)

21、插;對未觀測到的變量中間值進(jìn)行內(nèi)插;3 3) 確定確定R.V.在在指定區(qū)域內(nèi)出現(xiàn)的概率(如富礦在所有指定區(qū)域內(nèi)出現(xiàn)的概率(如富礦在所有礦體中所占的比例)。礦體中所占的比例)。 232.2 研究分布率的(地質(zhì))意義研究分布率的(地質(zhì))意義(3) 查明分布率是進(jìn)一步進(jìn)行統(tǒng)計分析的基礎(chǔ)查明分布率是進(jìn)一步進(jìn)行統(tǒng)計分析的基礎(chǔ) 1) 選擇適合的統(tǒng)計分析方法;選擇適合的統(tǒng)計分析方法; 2) 確定原始數(shù)據(jù)是否要進(jìn)行預(yù)處理;確定原始數(shù)據(jù)是否要進(jìn)行預(yù)處理; 3) 評價統(tǒng)計分析工作的效果。評價統(tǒng)計分析工作的效果。 242.3 隨機變量的數(shù)字表征隨機變量的數(shù)字表征 隨機變量的某些特征可以用數(shù)字來表征,其中最隨機變量的

22、某些特征可以用數(shù)字來表征,其中最重要的是重要的是平均值平均值、方差方差和和協(xié)方差協(xié)方差。 (1 1)平均值)平均值 平均值是變量自身中心趨勢的一種度量,它反映平均值是變量自身中心趨勢的一種度量,它反映的是隨機變量的集中性質(zhì)。的是隨機變量的集中性質(zhì)。 設(shè)設(shè)離散型離散型隨機變量隨機變量的可能取值為的可能取值為x x1 1,x x2 2,x xn n,P(P(=x=xi i)=P)=Pi i,則,則 稱為稱為的平均值。不難看出,隨機變量的平均值是這的平均值。不難看出,隨機變量的平均值是這個變量所有可能取值個變量所有可能取值以概率為權(quán)的加權(quán)平均以概率為權(quán)的加權(quán)平均。iiiPxE252.3 隨機變量的數(shù)

23、字表征隨機變量的數(shù)字表征 對對連續(xù)型連續(xù)型隨機變量隨機變量,設(shè)它的概率分布密度為,設(shè)它的概率分布密度為P(xP(x) ),則,則dxxxPE)(稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。 稱為稱為的平均值。的平均值。 概率論中,平均值也稱作數(shù)學(xué)期望。概率論中,平均值也稱作數(shù)學(xué)期望。 在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。的計算來估計總體

24、的平均值。262.3 隨機變量的數(shù)字表征隨機變量的數(shù)字表征 1 1)算術(shù)平均值)算術(shù)平均值 設(shè)設(shè)x x1 1,x x2 2,x xn n是樣本容量為是樣本容量為n n的一組觀測值,的一組觀測值,則則 稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。 稱為該樣本的算術(shù)平均值。稱為該樣本的算術(shù)平均值。 不難看出,用以計算算術(shù)平均值的各個觀測值的不難看出,用以計算算術(shù)平均值的各個觀測值的權(quán)因子是相等的,并且都等于權(quán)因子

25、是相等的,并且都等于1/n1/n。niixnx11272.3 隨機變量的數(shù)字表征隨機變量的數(shù)字表征 2 2)加權(quán)平均值)加權(quán)平均值 設(shè)設(shè)x x1 1,x x2 2,x xn n是樣本容量為是樣本容量為n n的一組觀測值,的一組觀測值,f1,f2,fn是和每個觀測值相對應(yīng)的權(quán)因子,則是和每個觀測值相對應(yīng)的權(quán)因子,則 稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。 稱為該樣本的加權(quán)平均值。稱為該樣本的加權(quán)平均值。n

26、iiniiifxfx11權(quán)282.3 隨機變量的數(shù)字表征隨機變量的數(shù)字表征 3 3)幾何平均值)幾何平均值 x x1 1,x x2 2,x xn n是樣本容量為是樣本容量為n n的一組觀測值,則的一組觀測值,則 稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。 稱為該樣本的幾何平均值。稱為該樣本的幾何平均值。 對于變化較大的地質(zhì)體,同一個樣本的算術(shù)平對于變化較大的地質(zhì)體,同一個樣本的算術(shù)平均值和加權(quán)平均值之間相差

27、可達(dá)均值和加權(quán)平均值之間相差可達(dá)3080%。因而,計。因而,計算方法的選擇是影響精度的重要因素之一。算方法的選擇是影響精度的重要因素之一。nnxxxx21權(quán)292.3 隨機變量的數(shù)字表征隨機變量的數(shù)字表征 還有其它一些表征隨機變量集中性質(zhì)的數(shù)字特征:還有其它一些表征隨機變量集中性質(zhì)的數(shù)字特征: 眾數(shù):眾數(shù):是具有最大頻數(shù)是具有最大頻數(shù)( (或頻率或頻率) )的隨機變量的值,的隨機變量的值,一般用一般用M M0 0表示。表示。 中位數(shù):中位數(shù):是把所有觀測值按大小次序排列,位于是把所有觀測值按大小次序排列,位于數(shù)列中間的數(shù)值,一般用數(shù)列中間的數(shù)值,一般用MeMe表示。表示。 當(dāng)觀測值為正態(tài)分布時

28、,當(dāng)觀測值為正態(tài)分布時, ,當(dāng)觀測值為左,當(dāng)觀測值為左不對稱分布時,不對稱分布時, 。當(dāng)觀測值為右不對稱分布。當(dāng)觀測值為右不對稱分布時,時, 。 在實際應(yīng)用中,當(dāng)觀測值中有特大、特小值或數(shù)在實際應(yīng)用中,當(dāng)觀測值中有特大、特小值或數(shù)列兩邊的數(shù)值不夠精確時,觀測值的眾數(shù)或中位數(shù)更列兩邊的數(shù)值不夠精確時,觀測值的眾數(shù)或中位數(shù)更能反映隨機變量的分布特征。能反映隨機變量的分布特征。 稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的

29、平均值。 eMMx0 xMMe00MMxe302.3 隨機變量的數(shù)字表征隨機變量的數(shù)字表征 (2)方差)方差 方差是變量自身變化幅度的一種度量,它反映的方差是變量自身變化幅度的一種度量,它反映的是隨機變量的離散性質(zhì)。是隨機變量的離散性質(zhì)。 對于隨機變量對于隨機變量,-E稱為稱為的離差,各離差平方的的離差,各離差平方的平均值平均值 D=E(-E)2稱為稱為的方差。的方差。 不難看出,方差是對隨機變量的取值與其平均值不難看出,方差是對隨機變量的取值與其平均值之間的偏差情況或分散程度的描述,方差越小,變量之間的偏差情況或分散程度的描述,方差越小,變量越集中分布于平均值附近。越集中分布于平均值附近。

30、在實際應(yīng)用中,用樣本的方差值估計總體的方差。在實際應(yīng)用中,用樣本的方差值估計總體的方差。稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。 312.3 隨機變量的數(shù)字表征隨機變量的數(shù)字表征 (3 3)協(xié)方差)協(xié)方差 設(shè)設(shè)和和是兩個隨機變量,則是兩個隨機變量,則 CoV(,)=E(-E)(-E) 稱為稱為和和的協(xié)方差。的協(xié)方差。 若若、是連續(xù)型變量,具有概率分布是連續(xù)型變量,具有概率分布P(x,y),則,則稱為稱為的

31、平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。 在實際應(yīng)用中,用樣本的協(xié)方差估計總體的協(xié)方差。在實際應(yīng)用中,用樣本的協(xié)方差估計總體的協(xié)方差。 dxdyyxPEExCoV),()(),(322.3 隨機變量的數(shù)字表征隨機變量的數(shù)字表征 設(shè)設(shè)(x1,y1),(x2,y2),(xn,yn)是樣本容量為是樣本容量為n的的一組觀測值,則一組觀測值,則稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也

32、稱作數(shù)學(xué)期望。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。在實際應(yīng)用中,經(jīng)常對樣本觀測值進(jìn)行不同方法的計算來估計總體的平均值。 稱為稱為x、y的協(xié)方差。它是對總體協(xié)方差的無偏估計值。的協(xié)方差。它是對總體協(xié)方差的無偏估計值。)(11)(111niiiiniixyyxnyxnyyxxn332.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布 正態(tài)分布是目前研究得最徹底的一種數(shù)據(jù)分布率,正態(tài)分布是目前研究得最徹底的一種數(shù)據(jù)分布率,許多統(tǒng)計方法多假設(shè)數(shù)據(jù)服從正態(tài)分布。許多統(tǒng)計方法多假設(shè)數(shù)據(jù)服從正態(tài)分布。當(dāng)數(shù)據(jù)不服從正態(tài)分布時,常常將其當(dāng)數(shù)據(jù)不服從正態(tài)分布時,常常將其: 1)變換

33、為正態(tài)分布,或)變換為正態(tài)分布,或 2)選擇穩(wěn)健的統(tǒng)計方法()選擇穩(wěn)健的統(tǒng)計方法(robust stat.)或非參數(shù)統(tǒng)計)或非參數(shù)統(tǒng)計方法(方法(non-parameter, free-distribution)。)。 3435關(guān)于穩(wěn)健統(tǒng)計學(xué)關(guān)于穩(wěn)健統(tǒng)計學(xué)* *問題的提出:問題的提出: 經(jīng)典的統(tǒng)計方法大多以經(jīng)典的統(tǒng)計方法大多以正態(tài)分布假設(shè)及最正態(tài)分布假設(shè)及最小二乘法小二乘法為基礎(chǔ),可是在實際數(shù)據(jù)中特別是地為基礎(chǔ),可是在實際數(shù)據(jù)中特別是地質(zhì)數(shù)據(jù)(如油氣化探數(shù)據(jù))中的離散度大,質(zhì)數(shù)據(jù)(如油氣化探數(shù)據(jù))中的離散度大,偏偏離正態(tài)分布假設(shè)離正態(tài)分布假設(shè)的情況十分普遍。的情況十分普遍。36偏離的原因偏離的

34、原因: a.a.總體服從正態(tài)分布,由于各類誤差(總體服從正態(tài)分布,由于各類誤差(隨隨機誤差機誤差、系統(tǒng)誤差系統(tǒng)誤差、過失誤差過失誤差)或外總體的)或外總體的加入所致;加入所致; b.b.總體本來就不服從正態(tài)分布,如服從總體本來就不服從正態(tài)分布,如服從t t分布、分布、分布、分布、F F分布等。分布等。37后果后果: : 當(dāng)數(shù)據(jù)偏離正態(tài)假設(shè)較明顯時,經(jīng)典的統(tǒng)當(dāng)數(shù)據(jù)偏離正態(tài)假設(shè)較明顯時,經(jīng)典的統(tǒng)計方法常常計方法常常給出不容易覺察的歪曲的甚至錯誤給出不容易覺察的歪曲的甚至錯誤的結(jié)果的結(jié)果。 可見經(jīng)典統(tǒng)計學(xué)方法對偏離正態(tài)分布假設(shè)可見經(jīng)典統(tǒng)計學(xué)方法對偏離正態(tài)分布假設(shè)的情況是非常敏感的。的情況是非常敏感的

35、。 博克斯(博克斯(G GE EP PBoxBox,19531953)把這種現(xiàn)象把這種現(xiàn)象稱之為穩(wěn)健性問題。這就是穩(wěn)健性一詞的由來。稱之為穩(wěn)健性問題。這就是穩(wěn)健性一詞的由來。38 修改統(tǒng)計方法使之更穩(wěn)健,以適應(yīng)修改統(tǒng)計方法使之更穩(wěn)健,以適應(yīng)數(shù)據(jù)偏離統(tǒng)計假設(shè)的情況,是穩(wěn)健統(tǒng)計數(shù)據(jù)偏離統(tǒng)計假設(shè)的情況,是穩(wěn)健統(tǒng)計學(xué)產(chǎn)生和發(fā)展的一個主導(dǎo)思想。各種穩(wěn)學(xué)產(chǎn)生和發(fā)展的一個主導(dǎo)思想。各種穩(wěn)健統(tǒng)計方法的基礎(chǔ)是對位置(即數(shù)據(jù)點健統(tǒng)計方法的基礎(chǔ)是對位置(即數(shù)據(jù)點群的中心)及尺度(即數(shù)據(jù)點群的離散群的中心)及尺度(即數(shù)據(jù)點群的離散度)的穩(wěn)健估計。度)的穩(wěn)健估計。改進(jìn)方法改進(jìn)方法:39 采用中位數(shù)及中位絕對中位差,即采

36、用中位數(shù)及中位絕對中位差,即MADmedxi一一med(xi)0.6746來代替算來代替算術(shù)平均值及標(biāo)準(zhǔn)差作為數(shù)據(jù)平均值及離散術(shù)平均值及標(biāo)準(zhǔn)差作為數(shù)據(jù)平均值及離散度的估計值,可以獲得較好的穩(wěn)健性。度的估計值,可以獲得較好的穩(wěn)健性。 目前已提出目前已提出了了M估計估計(最大似然估計(最大似然估計)、)、L估計估計(有序統(tǒng)計量的線性組合)(有序統(tǒng)計量的線性組合)及及R估計估計(秩估計)。(秩估計)。例如例如2.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布(1)正態(tài)分布)正態(tài)分布定義:若定義:若R.V.的概率密度函數(shù)為:的概率密度函數(shù)為: -x0 則稱則稱服從正態(tài)分布,簡記為服從正態(tài)分布,簡記為

37、N(,2) 222)(21)(xexf402.4 2.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布概率密度曲線正態(tài)分布概率密度曲線 正態(tài)分布累積概率曲線正態(tài)分布累積概率曲線412.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布的概率分布函數(shù)為:正態(tài)分布的概率分布函數(shù)為: (t 為(為(-,x)內(nèi))內(nèi)的任一取值的任一取值)dtexFxt222)(21)(42密度函數(shù)的圖形為鈴形,其特征為:密度函數(shù)的圖形為鈴形,其特征為:2.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布xf(x)1)單峰;)單峰;2)以)以x=為對稱軸的對稱曲線,當(dāng)為對稱軸的對稱曲線,當(dāng)x時,時, f(x

38、)=0,x=處是其拐點;處是其拐點;3)(-,+ )內(nèi)曲線與橫軸圍成的面積等于內(nèi)曲線與橫軸圍成的面積等于1;214)有兩個參數(shù)有兩個參數(shù)和和,若固定,若固定,改變,改變,則形狀不變,位,則形狀不變,位置改變;若置改變;若固定,固定,改變,則由最大值改變,則由最大值f() = 可知,可知,越小,峰值越大,曲線越陡,越小,峰值越大,曲線越陡,集中于集中于附近,附近,越大,峰值越小,曲線越平緩,越大,峰值越小,曲線越平緩,越分散。越分散。 432.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布(2)標(biāo)準(zhǔn)正態(tài)分布)標(biāo)準(zhǔn)正態(tài)分布當(dāng)當(dāng)=0,=1時的正態(tài)分布,即是我們平常所謂的標(biāo)準(zhǔn)時的正態(tài)分布,即是我們平

39、常所謂的標(biāo)準(zhǔn)正態(tài)分布,記為:正態(tài)分布,記為:N(0,1),此時:密度函數(shù)和分布函),此時:密度函數(shù)和分布函數(shù)分別為:數(shù)分別為:dte21x)P(x)e21(x)x2t2x22標(biāo)準(zhǔn)正態(tài)分布的變換方法:標(biāo)準(zhǔn)正態(tài)分布的變換方法:設(shè)設(shè)為非標(biāo)準(zhǔn)的正態(tài)變量,其平均值為為非標(biāo)準(zhǔn)的正態(tài)變量,其平均值為,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為,令令u=(x-)/,并以,并以u代替代替x,則新變量就具有,則新變量就具有N(0,1)分布,變分布,變量量u稱為標(biāo)準(zhǔn)化正態(tài)變量。稱為標(biāo)準(zhǔn)化正態(tài)變量。 442.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布 (2)標(biāo)準(zhǔn)正態(tài)分布)標(biāo)準(zhǔn)正態(tài)分布452.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)

40、分布(3)正態(tài)分布的實際應(yīng)用)正態(tài)分布的實際應(yīng)用現(xiàn)有一銅礦床,現(xiàn)有一銅礦床,Cu品位服從正態(tài)分布,且其平均品位為品位服從正態(tài)分布,且其平均品位為5%,標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差2%,求礦床中,求礦床中Cu品位介于品位介于5.247.5%的概率為多少?的概率為多少?1) 先進(jìn)行標(biāo)準(zhǔn)化:先進(jìn)行標(biāo)準(zhǔn)化:u=(x-)/=(x-5)/2 u1=(5.24-5)/2=0.12 u2=(7.5-5)/2=1.25dxex5 . 724. 5222)5(217.5)P(5.24以上問題即求解:以上問題即求解:de25. 112. 022217.5)P(5.242) 求區(qū)間概率求區(qū)間概率: =F(1.25)-F(0.12)=

41、0.894-0.548=0.346=34.6%即礦床中即礦床中Cu品位介于品位介于5.247.5%的礦石量為的礦石量為34.6% 462.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布 (4)對數(shù)正態(tài)分布)對數(shù)正態(tài)分布 若若R.V.=ln呈正態(tài)分布,則稱呈正態(tài)分布,則稱R.V.服從對數(shù)正態(tài)分服從對數(shù)正態(tài)分布,即布,即 N(,2)且)且=ln,若對數(shù)正態(tài)變量,若對數(shù)正態(tài)變量的密度的密度函數(shù)為函數(shù)為(x),則,則ln的密度函數(shù)呈正態(tài)分布的密度函數(shù)呈正態(tài)分布f(y) 472.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布設(shè)設(shè)x1,x2,為為的觀測值,的觀測值,=ln,則,則)0(0)0(21)(

42、222)(lnxxexfx式中,式中,和和2分別是變量分別是變量=ln的平均值和方差。對的平均值和方差。對數(shù)正態(tài)分布有兩個參數(shù),即數(shù)正態(tài)分布有兩個參數(shù),即niixn1ln1niixn122)(ln11482.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布 現(xiàn)象:現(xiàn)象:大多數(shù)內(nèi)生有色、稀有及貴重金屬礦床中的有用大多數(shù)內(nèi)生有色、稀有及貴重金屬礦床中的有用組分,以及巖石中的微量元素,都具有對數(shù)正態(tài)分布的特征。組分,以及巖石中的微量元素,都具有對數(shù)正態(tài)分布的特征。 原因:原因:這類元素的含量往往受某些起顯著作用的地質(zhì)因這類元素的含量往往受某些起顯著作用的地質(zhì)因素所控制,使它們在空間上的分布極不均勻,

43、致使元素含量素所控制,使它們在空間上的分布極不均勻,致使元素含量在數(shù)學(xué)上因不能滿足中心極限定理的條件而趨于較大的正偏在數(shù)學(xué)上因不能滿足中心極限定理的條件而趨于較大的正偏斜,從而導(dǎo)致隨機變量服從或近似于對數(shù)正態(tài)分布。斜,從而導(dǎo)致隨機變量服從或近似于對數(shù)正態(tài)分布。 處理:處理:對這類地質(zhì)研究對象,就需要按上述思路和方法,對這類地質(zhì)研究對象,就需要按上述思路和方法,在對原始數(shù)據(jù)取對數(shù)之后,再按正態(tài)分布的概率分布密度函在對原始數(shù)據(jù)取對數(shù)之后,再按正態(tài)分布的概率分布密度函數(shù)和分布函數(shù)進(jìn)行計算。數(shù)和分布函數(shù)進(jìn)行計算。492.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布(5)三參數(shù)對數(shù)正態(tài)分布)三參數(shù)對

44、數(shù)正態(tài)分布 當(dāng)當(dāng)y=ln(x)所呈現(xiàn)的不是正態(tài)分布,而基于某個所呈現(xiàn)的不是正態(tài)分布,而基于某個參數(shù)參數(shù)b的的y=ln(x+b)呈正態(tài)分布,則稱該隨機變量服呈正態(tài)分布,則稱該隨機變量服從三參數(shù)正態(tài)分布。從三參數(shù)正態(tài)分布。 正態(tài)分布與對數(shù)正態(tài)分布的關(guān)系:正態(tài)分布與對數(shù)正態(tài)分布的關(guān)系: 設(shè)設(shè)x呈對數(shù)正態(tài)分布,且有呈對數(shù)正態(tài)分布,且有、, ln(x)=y呈正態(tài)分布,且有呈正態(tài)分布,且有e、e,則:,則: =ee+e/2 =2ee-1502.4 正態(tài)分布及對數(shù)正態(tài)分布正態(tài)分布及對數(shù)正態(tài)分布對數(shù)正態(tài)分布的成因:對數(shù)正態(tài)分布的成因:1) 某地質(zhì)變量受綜合因素影響,且某個因素相某地質(zhì)變量受綜合因素影響,且某個

45、因素相對突出;對突出;2) 多次地質(zhì)作用疊加;多次地質(zhì)作用疊加;3) 樣品大小有關(guān)。樣品大小有關(guān)。 512.5 二項分布二項分布(Binomial D.) 該分布專門用于描述非該分布專門用于描述非“成功成功”(A)即)即“失敗失敗”( )兩種試驗結(jié)果的物理模型,它簡單而有用。)兩種試驗結(jié)果的物理模型,它簡單而有用。(1)計算公式)計算公式 當(dāng)當(dāng)R.V.服從下式時,稱服從下式時,稱服從二項分布:服從二項分布: Pn(k)=CnkPk(1-P)n-k式中式中,Pn(k):n次試驗中事件次試驗中事件A出現(xiàn)出現(xiàn)k次的概率次的概率 P:1次試驗中事件次試驗中事件A出現(xiàn)的概率出現(xiàn)的概率 1-P:1次試驗中

46、事件次試驗中事件A不出現(xiàn)的概率不出現(xiàn)的概率 Cnk:為二項式系數(shù),:為二項式系數(shù),Cnk=n!/k!(n-k)!A522.5 二項分布二項分布(Binomial D.)1p)(1pCknkn0kkn當(dāng)當(dāng)k=0,1,2,n時,構(gòu)成一必然事件,故有:時,構(gòu)成一必然事件,故有: 53(2 2)二項分布的性質(zhì))二項分布的性質(zhì)平均數(shù)平均數(shù)=np 方差方差2=np(1-p)2.5 二項分布二項分布(Binomial D.)54(3) 二項分布的圖形二項分布的圖形 二項分布的圖形,取決于兩個方面,其一為事件發(fā)二項分布的圖形,取決于兩個方面,其一為事件發(fā)生的概率生的概率p ,其二為樣本量其二為樣本量n。當(dāng)當(dāng)p

47、=1-p =1/2時,二項分布的圖形是對稱的;時,二項分布的圖形是對稱的;當(dāng)當(dāng)p1/2時,二項分布的圖形呈右偏態(tài);時,二項分布的圖形呈右偏態(tài);當(dāng)當(dāng)p與與1-p不變時,即使不變時,即使p1-p ,但隨著但隨著n的增大,偏的增大,偏態(tài)程度會逐漸降低而趨于對稱。態(tài)程度會逐漸降低而趨于對稱。 2.5 二項分布二項分布(Binomial D.)55二項分布總體不同樣本數(shù)時的抽樣分布二項分布總體不同樣本數(shù)時的抽樣分布 2.5 二項分布二項分布(binomial D.)(4)應(yīng)用實例)應(yīng)用實例已知某鐵礦:已知某鐵礦:TFe45%(富礦)的礦樣占樣品總數(shù)的(富礦)的礦樣占樣品總數(shù)的10%,問,問若取若取3個樣

48、,其中個樣,其中3個、個、2個、個、1個、個、0個個TFe45%(富礦)的樣(富礦)的樣品的概率各為多少?(用于選廠入選品位的預(yù)測和研究)品的概率各為多少?(用于選廠入選品位的預(yù)測和研究)解:已知總樣品中,解:已知總樣品中,TFe45%的樣品占的樣品占10%,即,即P=10%(1次取次取樣中,樣中,TFe45%的概率為的概率為10%) 因而,因而,TFe45%的樣品,即的樣品,即k=3,2,1,0 按上式,按上式,Pn(k)=CnkPk(1-P)n-k 式中式中Cnk=n!/k!(n-k)!562.5 二項分布二項分布(binomial D.)所以所以:3個樣個樣全全為為TFe45%的概率的概

49、率P3(3)= C33 (0.1)3(0.9)3-3=0.001=0.1%3個樣中個樣中2個個TFe45%的概率的概率P3(2)= C23 (0.1)2(0.9)3-2=0.0243=2.43%3個樣中個樣中1個個TFe45%的概率的概率P3(1)= C13 (0.1)1(0.9)3-1=0.243=24.3%3個樣中個樣中0個個TFe45%的概率的概率P3(0)= C03 (0.1)0(0.9)3-0=0.729=72.9%且且 P3(3)+ P3(2)+ P3(1)+ P3(0)=1572.6 泊凇分布泊凇分布(Poissons D.)(1)計算公式)計算公式 設(shè)離散型隨機變量設(shè)離散型隨機

50、變量的可能取值為的可能取值為x x1 1,x x2 2,x xk k,;P P1 1,P P2 2,P Pk k,是是x xk k出現(xiàn)的概率,則出現(xiàn)的概率,則 上式表示,在一定時間(空間)內(nèi),某隨機事件的上式表示,在一定時間(空間)內(nèi),某隨機事件的發(fā)生概率是固定的(即發(fā)生概率是固定的(即),則在給定的時間(空間)內(nèi),),則在給定的時間(空間)內(nèi),該事件發(fā)生指定次數(shù)該事件發(fā)生指定次數(shù)k的概率為的概率為P(k)。ekkPkPk!)()((=npnp00,k=1k=1,2 2,)稱為離散型隨機變量稱為離散型隨機變量服從參數(shù)為服從參數(shù)為的泊凇分布。的泊凇分布。582.6 泊凇分布泊凇分布(Poisso

51、ns D.) 該分布是二項分布的特例,當(dāng)該分布是二項分布的特例,當(dāng)P很小,很小,n很大很大時,用泊凇分布能很好地近似二項分布。時,用泊凇分布能很好地近似二項分布。 泊凇分布的方差泊凇分布的方差DD=,=。 5960二項分布與泊松分布的比較二項分布與泊松分布的比較 由上表可見,二者計算結(jié)果非常接近,當(dāng)由上表可見,二者計算結(jié)果非常接近,當(dāng)n愈大其接近程度愈大其接近程度愈好,但泊松分布的愈好,但泊松分布的P(X)計算較為簡便。計算較為簡便。 XP(X) 二項分布二項分布 泊松分布泊松分布 0123456780.33600.36970.18490.06100.01490.00290.00050.000

52、10.00000.36790.36790.18390.06130.01530.00310.00050.00010.0000合計合計1.0000 1.0000 2.6 泊凇分布泊凇分布(Poissons D.)61(2)Poisson分布的圖形分布的圖形 泊松分布的圖形是由平均數(shù)泊松分布的圖形是由平均數(shù)來確定的。來確定的。當(dāng)當(dāng)較小時,泊松分布不對稱的程度較為顯著,較小時,泊松分布不對稱的程度較為顯著,通常呈左偏分布;通常呈左偏分布;隨著隨著值逐漸增大,泊松分布逐漸趨向?qū)ΨQ,而值逐漸增大,泊松分布逐漸趨向?qū)ΨQ,而且,和二項分布一樣,也逐漸趨向正態(tài)分布。且,和二項分布一樣,也逐漸趨向正態(tài)分布。一般說

53、來,當(dāng)平均數(shù)一般說來,當(dāng)平均數(shù)50時時(有人認(rèn)為有人認(rèn)為20),泊泊松分布就近似于正態(tài)分布。松分布就近似于正態(tài)分布。 622.6 泊凇分布泊凇分布(Poissons D.)(3)應(yīng)用實例)應(yīng)用實例 某火山巖盆地發(fā)育有與閃長玢巖有關(guān)的鐵礦床(點),某火山巖盆地發(fā)育有與閃長玢巖有關(guān)的鐵礦床(點),現(xiàn)將該盆地按現(xiàn)將該盆地按9km2大小劃分成等面積單元大小劃分成等面積單元93個,并統(tǒng)計了含個,并統(tǒng)計了含不同礦床(點)數(shù)的單元的個數(shù)(頻數(shù)),如表所示,問有不同礦床(點)數(shù)的單元的個數(shù)(頻數(shù)),如表所示,問有無發(fā)現(xiàn)新礦床(點)的可能性?無發(fā)現(xiàn)新礦床(點)的可能性?單元內(nèi)礦點數(shù)單元內(nèi)礦點數(shù)kFi觀測頻數(shù)觀測頻數(shù)fi*理論頻數(shù)理論頻數(shù)07268.211521.1243.3320.3400632.6 泊凇分布泊凇分布(Poissons D.) 計算統(tǒng)計量計算統(tǒng)計量 計算出每個單元平均所含礦床(點)數(shù)計算出每個單元平均所含礦床(點)數(shù): =(720+151+42+23+04)/93=0.3118 方差方差2=(0-0.31)272+(1-0.31)215+(2-0.31)214+/(93-1)=0.4342 進(jìn)行假設(shè):進(jìn)行假設(shè):即假定礦點分布服從泊凇分布:即假定礦點分布服從泊凇分布:實測值實測值( (含含0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論