李潔+指數(shù)分布總體的參數(shù)估計(jì)及應(yīng)用_第1頁
李潔+指數(shù)分布總體的參數(shù)估計(jì)及應(yīng)用_第2頁
李潔+指數(shù)分布總體的參數(shù)估計(jì)及應(yīng)用_第3頁
李潔+指數(shù)分布總體的參數(shù)估計(jì)及應(yīng)用_第4頁
李潔+指數(shù)分布總體的參數(shù)估計(jì)及應(yīng)用_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、高 等 教 育 自 學(xué) 考 試畢 業(yè) 論 文指數(shù)分布總體的參數(shù)估計(jì)及應(yīng)用Parameter estimation and application of exponential distribution李 潔Li jie 專 業(yè): 數(shù)學(xué)與應(yīng)用數(shù)學(xué) 主考學(xué)校: 蘭州大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 準(zhǔn)考證號: 432412205023 指導(dǎo)教師姓名職稱: 牛明飛 甘肅省高等教育自學(xué)考試辦公室印制 年 月 日目 錄摘要1引言11指數(shù)分布總體的參數(shù)估計(jì)21.1指數(shù)分布的概念21.2極大似然估計(jì)法32指數(shù)分布總體的應(yīng)用62.1概率與生活的關(guān)系62.2分布總體的概念72.3指數(shù)分布與生活72.4 指數(shù)分布的具體應(yīng)用8參

2、考文獻(xiàn)11指數(shù)分布總體的參數(shù)估計(jì)及應(yīng)用 摘要隨著科學(xué)技術(shù)的迅猛發(fā)展和人類文明的不斷進(jìn)步,數(shù)學(xué)這門古老而傳統(tǒng)的學(xué)科正在越來越顯示出它的強(qiáng)大威力和實(shí)用價值。作為數(shù)學(xué)的一個年輕的分支,概率統(tǒng)計(jì)更是如此。在我們的生活中概率統(tǒng)計(jì)可以說是無處不在,大到國家預(yù)算、小到家庭生活中都有。在概率論中,指數(shù)分布是可靠性工程中一種有用的失效分布,還被常用于描述伺服機(jī)構(gòu)、車輛、電子產(chǎn)品等的壽命,運(yùn)用十分廣泛。指數(shù)分布不僅在生產(chǎn)實(shí)踐中有廣泛的應(yīng)用,而且在科學(xué)研究中有極其重要而特殊的作用。估計(jì)問題是統(tǒng)計(jì)學(xué)的基本問題之一,其中的極大似然估計(jì)法是一種理論上較為優(yōu)良、應(yīng)用范圍較為廣泛的估計(jì)方法,因而在數(shù)理統(tǒng)計(jì)的參數(shù)估計(jì)中占有極為

3、重要的地位。關(guān)鍵字:指數(shù)分布;極大似然估計(jì);壽命分布;指數(shù)分布總體 引言概率統(tǒng)計(jì)中有許多重要的分布。比如正態(tài)分布、泊松分布、幾何分布、卡方分布等。其中指數(shù)分布就是最重要的分布之一。指數(shù)分布由于形式簡潔、性質(zhì)良好,所以經(jīng)常被應(yīng)用在各個領(lǐng)域。指數(shù)分布函數(shù)的一個重要特征是無記憶(Memoryless Property,又稱遺失記憶性)。估計(jì)問題是統(tǒng)計(jì)學(xué)的基本問題之一。在許多情形中,我們已經(jīng)對總體的分布形式有所了解,但對分布中的參數(shù)缺乏認(rèn)識,需要通過樣本信息對參數(shù)進(jìn)行判斷。設(shè)總體X服從F,其中為未知參數(shù),如何通過樣本信息來估計(jì),這類問題即是參數(shù)參數(shù)估計(jì)問題。在概率論中,已經(jīng)涉及到參數(shù)估計(jì)。如捕魚問題,

4、需要估計(jì)魚池中魚的總條數(shù)N,而N正是超幾何分布中的參數(shù)。又如一次合格的考試,學(xué)生成績應(yīng)當(dāng)服從正態(tài)分布N,通過抽樣,如何利用樣本信息來估計(jì)參數(shù)亦是參數(shù)估計(jì)的問題。在生存分析和保障精算中,指數(shù)分布就是一種重要的參數(shù)模型,既然指數(shù)分布如此重要,那就有必要對它進(jìn)行詳細(xì)的研究。同時指數(shù)分布由于只有一個參數(shù),所以對這個唯一參數(shù)的估計(jì)問題也顯得非常重要了。本文就是對指數(shù)分布的一些特殊問題進(jìn)行了較為深入的研究,并在若干情形下對指數(shù)分布唯一的參數(shù)進(jìn)行了估計(jì)。在概率論中,有一種估計(jì)參數(shù)的方法叫極大似然估計(jì)法。即大概率事件在一次試驗(yàn)中幾乎必然發(fā)生,反過來理解,一次試驗(yàn)就發(fā)生的事件往往可以理解為大概率事件。上面提到的

5、捕魚問題,正是用這樣的思想和方法求出了魚池中的總數(shù)N,這種方法正體現(xiàn)了極大的思想。所謂極大似然法,就是以最大的概率來保證估計(jì)的正確性的統(tǒng)計(jì)估值方法。1指數(shù)分布總體的參數(shù)估計(jì)1.1指數(shù)分布的概念設(shè)隨機(jī)變量的分布密度函數(shù)為 則稱服從參數(shù)為的指數(shù)分布。指數(shù)分布也是概率統(tǒng)計(jì)中的一類重要分布,不僅在生產(chǎn)實(shí)踐中有廣泛應(yīng)用,而且在科學(xué)研究中有極其重要的作用,關(guān)鍵在于它具有“無記憶性”。設(shè)隨機(jī)變量服從參數(shù)為的指數(shù)分布,則對于任意的s>0,t>0,有 如果把 理解為壽命,則上式表明,無論某種產(chǎn)品被使用了多長一段時間s,只要還沒有損壞,它能再使用一段時間t的概率與一件新產(chǎn)品能使用到時間t的概率一樣,即

6、這種產(chǎn)品是“永遠(yuǎn)年輕”的。這一點(diǎn)也說明以指數(shù)分布作為壽命分布是有缺陷的。盡管如此,在很多場合人們還是愿意采用這種易于計(jì)算的分布作為產(chǎn)品使用壽命的模型。例1.一個使用了t小時的熱敏電阻在內(nèi)失效的概率是。設(shè)該熱敏電阻的使用壽命是連續(xù)行隨機(jī)變量,求該熱敏電阻的使用壽命分布。解:用表示該熱敏電阻的使用壽命,要求的是由題意得 即 其中稱為的生存函數(shù)。完全類似地,對于t>0,當(dāng)時,有 于是對上面兩式,均除以,在令,得 兩端積分得,t為常數(shù)。再利用,立即可得,于是。求導(dǎo)后得密度函數(shù) 即為指數(shù)分布。1.2極大似然估計(jì)法極大似然估計(jì)法是建立在極大似然原理基礎(chǔ)上的一種統(tǒng)計(jì)方法,它最早是由高斯(C.F.Gau

7、ss)提出的,后來費(fèi)舍爾(R.A.Fisher)重新提出,并且證明了這個方法的一些性質(zhì)。極大似然原理的基本原理的基本思想是:一個隨機(jī)試驗(yàn)有若干個可能的結(jié)果A,B,若在一次試驗(yàn)中,結(jié)果A出現(xiàn),則一般認(rèn)為試驗(yàn)條件對A出現(xiàn)有利,也即A的出現(xiàn)概率很大。下面我們對總體分別為離散型和連續(xù)型兩種情況來闡述極大似然估計(jì)法的具體思想。設(shè)X是離散型總體,總分布律為,其中(為可能取值的范圍)為未知參數(shù)。是來自總體的一個樣本,則的聯(lián)合分布律為設(shè)為樣本的一組觀測值,則樣本的概率是上式是關(guān)于的函數(shù),我們用來表示,則有這一概率隨的變化而變化,把稱作樣本的似然函數(shù)。依據(jù)極大似然原理,我們有以下直觀的想法:既然樣本能取到觀測值

8、,則說明樣本的概率比較大,因此我們只要在中選取的達(dá)到極大值的參數(shù),作為的估計(jì)值。即取使得 這樣得到的的值與樣本的觀測值有關(guān),記為稱為參數(shù)的極大似然估計(jì)量。若X是連續(xù)型總體,其概率密度函數(shù)為f(x; ),其中(為可能的取值范圍)為未知參數(shù),為來自總體的一個樣本,則的聯(lián)合概率密度函數(shù)為設(shè)為樣本的一組觀測值,于是落入觀測值的鄰域內(nèi)的概率近似為它是的函數(shù)。既然在一次抽樣中出現(xiàn),當(dāng)然可以認(rèn)為樣本落到的鄰域的概率比較大,所以我們在中找出使得達(dá)到極大值的值。由于是不依賴于的增量,所以只需求出使得達(dá)到極大值的作為的估計(jì)值,便可得到的極大似然估計(jì)。由此,求極大似然估計(jì)量的問題就歸結(jié)為微分學(xué)中求極大值的問題。在很

9、多情況下,如果關(guān)于可微,利用微積分的知識,這時可通過方程求得。在實(shí)際計(jì)算中,往往通過求的極大值點(diǎn)來求,這是因?yàn)楹瘮?shù)與有相同的極值點(diǎn),故令求出即為的極大似然估計(jì)。例2 設(shè)總體X服從參數(shù)為的指數(shù)分布,試求參數(shù)的極大似然估計(jì)。 解: 由題設(shè),X的密度函數(shù)為 對于一組樣本觀測值,當(dāng)x>0時,有 令 解得 由此得到的極大似然估計(jì)為。2指數(shù)分布總體的應(yīng)用2.1概率與生活的關(guān)系在自然界和現(xiàn)實(shí)生活中,一些事物都是相互聯(lián)系和不斷發(fā)展的。在它們彼此間的聯(lián)系和相互發(fā)展中,根據(jù)它們是否有必然的因果關(guān)系,可以分成兩大類:一類是確定性現(xiàn)象,指在一定條件下,必定會導(dǎo)致某種確定的結(jié)果。如,在標(biāo)準(zhǔn)大氣壓下,水加熱到100

10、攝氏度,就必然會沸騰。事物間的這種聯(lián)系屬于必然性的。另一類是不確定的現(xiàn)象,這類現(xiàn)象在一定條件下的結(jié)果是不確定的。例如,同一個工人在同一臺機(jī)床上加工零件若干個,它們的尺寸總會有一定的差異。又如,在同樣條件下,進(jìn)行小麥品種的人工催芽試驗(yàn),各顆種子的發(fā)芽情況也不盡相同有強(qiáng)弱和早晚之別等。為什么在相同的情況下,會出現(xiàn)這種不確定的結(jié)果呢?這是因?yàn)椋覀冋f的“相同條件”是指一些主要條件來說的,除了這些主要條件外,還會有許多次要條件和偶然因素是人們無法事先預(yù)料的。這類現(xiàn)象,我們無法用必然的因果關(guān)系,對現(xiàn)象的結(jié)果事先做出確定的答案。事物間的這種關(guān)系屬于偶然性的,這種現(xiàn)象叫做偶然現(xiàn)象,或者叫隨機(jī)現(xiàn)象。概率,簡單

11、的說,就是一件事發(fā)生的可能性大小。2.2分布總體的概念在數(shù)理統(tǒng)計(jì)中,我們把研究對象的全體組成的集合稱為總體或母體,而把組成總體的每一個元素稱為個體。比如,某地區(qū)的成年男子組成總體,每一個男子則是一個個體,燈泡廠生產(chǎn)的全部燈泡組成一個總體,而每一個燈泡則是一個個體。這里,總體和個體僅僅是一種籠統(tǒng)的、直觀的描述,按這種說法,總體中的每個個體都是具體的實(shí)物,然而在實(shí)際問題中,人們關(guān)心的往往不是這些實(shí)物本身,而是它的某些數(shù)量指標(biāo)。例如,產(chǎn)品中雜質(zhì)的含量、成年男子的身高或體重、燈泡的壽命照明度等等。當(dāng)總體確定下來以后,我們所關(guān)心的這些指標(biāo)的數(shù)值因個體的不同而不同,其值是不確定的。因此,這些指標(biāo)實(shí)際上表現(xiàn)

12、為隨機(jī)變量,為了討論的方便,我們通常把研究對象的數(shù)量指標(biāo)可能取值的全體看成總體。這樣一來,一個總體即是一個隨機(jī)變量,總體可能取值范圍內(nèi)的每個實(shí)數(shù)便代表一個個體。目的在于將研究對象的特點(diǎn)和變化規(guī)律弄清楚,實(shí)際上也就是把總體的分布函數(shù)弄清楚。對于有效的抽樣方法而言,抽出的個體應(yīng)能“代表”總體。要保證代表性,只要保證按隨機(jī)原則進(jìn)行抽樣就行了;既然抽樣是隨機(jī)進(jìn)行的,抽取一個個體相當(dāng)于一次隨機(jī)實(shí)驗(yàn)。不難想象,由于抽取的個體不確定,實(shí)驗(yàn)結(jié)果也是不確定的,其結(jié)果完全依賴于被抽取的個體,相應(yīng)與這個隨機(jī)實(shí)驗(yàn),我們可以定義一個隨機(jī)變量,抽到的個體的具體值就是的一個取值,顯然隨機(jī)變量與總體X具有相同的分布函數(shù),這種

13、同分布性無疑可保證抽樣的“代表性”。2.3指數(shù)分布與生活 在概率論和統(tǒng)計(jì)學(xué)中,指數(shù)分布可以用來表示獨(dú)立隨機(jī)事件發(fā)生的時間間隔,比如旅客進(jìn)機(jī)場的時間間隔,中文維基百科新條目出現(xiàn)的時間間隔等等。指數(shù)分布經(jīng)常用來描述“壽命”類隨機(jī)變量的分布,例如家電使用壽命,動植物壽命,電話問題里的通話時間等等。 在電子元器件的可靠性研究中,通常用于描述對發(fā)生的缺陷數(shù)或系統(tǒng)故障數(shù)的測量結(jié)果。這種分布表現(xiàn)為均值越小,分布偏斜的越厲害。指數(shù)分布應(yīng)用廣泛,在日本的工業(yè)標(biāo)準(zhǔn)和美國軍用標(biāo)準(zhǔn)中,半導(dǎo)體器件的抽驗(yàn)方案都是采用指數(shù)分布。此外,指數(shù)分布還用來描述大型復(fù)雜系統(tǒng)(如計(jì)算機(jī))的故障間隔時間的失效分布。但是,由于指數(shù)分布具有

14、缺乏“記憶”的特性,因而限制了它在機(jī)械可靠性研究中的應(yīng)用。所謂缺乏“記憶”,是指某種產(chǎn)品或零件經(jīng)過一段時間的工作后,仍然如同新的產(chǎn)品一樣,不影響以后的工作壽命值,或者說,經(jīng)過一段時間的工作之后,該產(chǎn)品的壽命分布與原來還未工作時的壽命分布相同。 “壽命”類分布的方差非常大,以致于已經(jīng)使用的時間是可以忽略不計(jì)的。例如有一種電池標(biāo)稱可以充放電500次(平均壽命),但實(shí)際上,很多充放電次數(shù)數(shù)倍于500次的電池仍然在正常使用,也用很多電池沒有使用幾次就壞了這是正常的,不是廠方欺騙你,是因?yàn)榉讲钐蟮木壒?。隨機(jī)取一節(jié)電池,求它還能繼續(xù)使用300次的概率,我們認(rèn)為與這節(jié)電池是否使用過與曾經(jīng)使用過多少次是沒有

15、關(guān)系的。顯然,指數(shù)分布的這種特性,與機(jī)械零件的疲勞、磨損、腐蝕、蠕變等損傷過程的實(shí)際情況是完全矛盾的,它違背了產(chǎn)品損傷累積和老化這一過程。所以,指數(shù)分布作為機(jī)械零件功能參數(shù)的分布形式是有缺陷的。指數(shù)分布雖然不能作為機(jī)械零件功能參數(shù)的分布規(guī)律,但是,它可以近似地作為高可靠性的復(fù)雜部件、機(jī)器或系統(tǒng)的失效分布模型,特別是在部件或機(jī)器的整機(jī)試驗(yàn)中得到廣泛的應(yīng)用。在實(shí)際中,某系統(tǒng)中連續(xù)發(fā)生兩次故障之間的時間間隔、飛機(jī)在機(jī)場上空等待降落的時間均可用指數(shù)分布來描述。指數(shù)分布在排隊(duì)論和可靠性理論中占有重要地位。有人戲稱服從指數(shù)分布的隨機(jī)變量是“永遠(yuǎn)年輕的”,一個60歲的老人與一個剛出生的嬰兒,他們能夠再活十年

16、的概率是相等的,你相信嗎?如果人的壽命確實(shí)是服從指數(shù)分布的話,回答是肯定的。2.4 指數(shù)分布的具體應(yīng)用鄧培德等提出,我國短歷時暴雨用非年最大值法選樣時,其超過概率符合下面的兩參數(shù)指數(shù)分布 (1)重現(xiàn)期 (2)由于根據(jù)樣本資料用矩法估計(jì)參數(shù)計(jì)算誤差太大,鄧培德等人建議按傳統(tǒng)的做法,以重現(xiàn)期為自變量,雨強(qiáng)為因變量,用最小二乘方方法估算參數(shù)。為此對式(2)兩邊取對數(shù)后求得 (3)由為最小條件得 (4)式中 X雨強(qiáng) 非年最大值法選樣的頻率 重現(xiàn)期 e自然對數(shù)的底 參數(shù), 各符號上面的橫線表示其平均值。前面的指數(shù)分布形式表明,雨強(qiáng)為自變量,超過概率為因變量;而當(dāng)用最小二乘方方法估計(jì)該指數(shù)分布的參數(shù)時,將

17、超過概率作為自變量,雨強(qiáng)作為因變量。根據(jù)相關(guān)分析理論,這一傳統(tǒng)方法盡管滿足了最小的條件,但由此估計(jì)出的參數(shù)a、b,只是式(3)雨強(qiáng)x倚重現(xiàn)期與x完全相關(guān),即實(shí)測雨強(qiáng)及用經(jīng)驗(yàn)式估算的超過概率,沒有測量和抽樣的誤差,點(diǎn)()嚴(yán)格位于曲線上。 “事實(shí)上,水文實(shí)測值是我們在一個按一定次序排列的樣本中具有的唯一現(xiàn)實(shí)值。因此在最優(yōu)化方法中,水文數(shù)量大小應(yīng)該作為自變量,而這個自變量所對應(yīng)的平均重現(xiàn)時段才是要加以估計(jì)的,故重現(xiàn)期必須作為因變量?!币虼?,應(yīng)該由(或)倚X的相關(guān)來估計(jì)參數(shù)x,a和b。據(jù)此提出下面的估計(jì)方法 。設(shè)雨強(qiáng)x的某次觀測值為,由重現(xiàn)期公式估計(jì)的與該雨相對應(yīng)的重現(xiàn)期,由于是由估計(jì)而得到的,顯然它

18、具有比實(shí)測雨強(qiáng)大得多的誤差。與發(fā)布曲線的離差為 根據(jù)回歸分析理論,欲使曲線對觀測點(diǎn)的擬合最佳,必須使離差的平均和為最小,即欲使上式取最小值,須使由于,通常情況下,上二式經(jīng)化簡后得 (5)式(5)就是用曲線回歸方法估計(jì)參數(shù)a,b的公式。它是式(2)在最小二乘方意義上參數(shù)的最優(yōu)估計(jì)。式(5)是一個靜定超越方程,可以用下降法或最優(yōu)化方法求解,用這兩種方法求解需給出與a,b的真值比較較近的初值,以便保證代計(jì)算收斂與減少代次數(shù)。為此,假設(shè)分布曲線通過第3,4兩點(diǎn)的平均位置來初步估計(jì)a,b的值(因的估計(jì)誤差太大,故不采用)。若則由假設(shè)得 求解此聯(lián)立方程得 (6)用式(6)估算出的a、b值可以作為式(5)迭代計(jì)算的初值。 參考文獻(xiàn)1 M費(fèi)史.概率論與數(shù)理統(tǒng)計(jì)M.上海:上海科技出版設(shè),1978;112-114.2呂林根等.解析幾何M.北京:高等教育出版社,1990.206-209.3吳傳志.應(yīng)用概率統(tǒng)計(jì)M.重慶:重慶大學(xué)出版社,20

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論