數(shù)理統(tǒng)計基本概念_第1頁
數(shù)理統(tǒng)計基本概念_第2頁
數(shù)理統(tǒng)計基本概念_第3頁
數(shù)理統(tǒng)計基本概念_第4頁
數(shù)理統(tǒng)計基本概念_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

作出精確而可信的結(jié)論。數(shù)理統(tǒng)計可以分為兩大類:一類是如何科學地安排試驗,-------描述統(tǒng)計學,如:試驗設(shè)計、抽樣方法。另一類是研究如何分析所獲得的隨機數(shù)據(jù),對所研究的問題進行科學的、合理的估計和推斷,盡可能的為采取一定的決策提供依據(jù),-------推斷統(tǒng)計學,如:參數(shù)估計、假設(shè)檢驗等。以獲取有效的隨機數(shù)據(jù)。第二章數(shù)理統(tǒng)計的基本概念100個樣品進行強度測試,于是面臨下列幾個問題:例:某廠生產(chǎn)一型號的合金材料,用隨機的方法選取1、估計這批合金材料的強度均值是多少?(參數(shù)的點估計問題)2、強度均值在什么范圍內(nèi)?(參數(shù)的區(qū)間估計問題)3、若規(guī)定強度均值不小于某個定值為合格,那么這批材料是否合格?(參數(shù)的假設(shè)檢驗問題)4、這批合金的強度是否服從正態(tài)分布?5、若這批材料是由兩種不同工藝生產(chǎn)的,那么不同的工藝對合金強度有否影響?若有影響,哪一種工藝生產(chǎn)的強度較好?(分布檢驗問題)(方差分析問題)6、若這批合金由幾種原料用不同的比例合成,那么如何表達這批合金的強度與原料比例之間的關(guān)系?(回歸分析問題)我們依次討論參數(shù)的點估計、區(qū)間估計、假設(shè)檢驗、方差分析、回歸分析。下面引入一些數(shù)理統(tǒng)計中的術(shù)語。二、統(tǒng)計量一、總體與樣本抽樣和抽樣分布三、幾個常用的分布四、正態(tài)總體統(tǒng)計量的分布1.總體研究對象的某項數(shù)量指標值全體稱為總體(母體)。個體——總體中每個成員(元素)。2.樣本一、總體和樣本對總體做n次重復(fù)獨立觀測,稱為簡單隨機抽樣。抽樣得到的個體稱為樣本。(2)獨立同分布性要求抽取的樣本滿足下面兩點:(1)代表性:簡單隨機抽樣每一個分量Xk與所考察的總體有相同的分布。個體被抽到的可能性相同。從總體中抽取樣本的每一個分量Xk

是隨機的,是相互獨立的隨機變量。(若不特別說明,均指簡單隨機樣本)簡單隨機樣本可以用與總體獨立同分布的n個相互獨立的隨機變量若總體X的分布函數(shù)為聯(lián)合分布函數(shù)為若總體X的分布密度函數(shù)為表示。則其簡單隨機樣本的則其簡單隨機樣本的聯(lián)合密度函數(shù)為離散總體則樣本的分布律我們只能觀察到隨機變量取的值,而見不到隨機變量.3.總體、樣本、樣本值的關(guān)系

事實上我們抽樣后得到的資料都是具體的、確定的值.如我們從某班學生中抽取10人測量身高,得到10個數(shù),它們是樣本取到的值而不是樣本.因而可以由樣本值去推斷總體.總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,去推斷總體的情況--總體分布F(x)的性質(zhì).樣本是聯(lián)系二者的橋梁。統(tǒng)計是從手中已有的資料--樣本值,4.樣本的分布1)樣本的頻數(shù)分布將n個樣本值按從小到大排列,把相同的數(shù)合并,并指出其頻數(shù)(樣本中各數(shù)出現(xiàn)的次數(shù))x頻數(shù)頻率2)樣本的經(jīng)驗分布函數(shù)樣本值:樣本值小于或等于x的個數(shù),作---樣本的經(jīng)驗分布函數(shù)給出了在n次獨立重復(fù)試驗中,事件出現(xiàn)的頻率,具有分布函數(shù)的一切性質(zhì)。如:非降,右連續(xù);由頻數(shù)分布知---n次獨立重復(fù)試驗中,事件發(fā)生的頻率。根據(jù)伯努利大數(shù)定律,這就是我們可以由樣本推斷總體的基本理論依據(jù).格列汶科進一步證明了:當n→∞時,F(xiàn)n(x)以概率1關(guān)于x一致收斂于F(x),即(格列汶科定理)定理告訴我們,當樣本容量n足夠大時,對所有的x,

Fn(x)與F(x)之差的絕對值都很小,這件事發(fā)生的概率為1.定義:設(shè)是來自總體X的一個樣本,為一實值連續(xù)函數(shù),其不包含任何未知參數(shù),則稱為一個統(tǒng)計量。為的觀測值。注:是變量的函數(shù),仍為隨機變量。是一個數(shù)。二、統(tǒng)計量1.統(tǒng)計量

2.幾個常見的統(tǒng)計量樣本均值樣本方差是來自總體X的一個樣本,樣本標準差證明:左邊=樣本k

階原點矩樣本k階中心矩常見統(tǒng)計量的性質(zhì)統(tǒng)計量既然是依賴于樣本的,而后者又是隨機變量,故統(tǒng)計量也是隨機變量,因而就有一定的分布,這個分布叫做統(tǒng)計量的“抽樣分布”

.

三、抽樣分布(1)標準正態(tài)分布X的上α

(0<α<1)分位點記為設(shè)相互獨立,都服從正態(tài)分布N(0,1),

則稱隨機變量:所服從的分布為自由度為n的分布.

對于給定的正數(shù)稱滿足條件為分位點.分布的上的點

分布的分位點上分位點雙側(cè)分位點一般的分布表只列到n=45,n>45時,由記為T~t(n).服從自由度為n的t分布,(3)t分布設(shè)X~N(0,1),Y~則稱變量,且X與Y相互獨立,當n充分大時,其圖形類似于標準正態(tài)分布密度函數(shù)的圖形。

t分布的密度函數(shù)關(guān)于x=0對稱性質(zhì)

t分布的分位點

對于給定的正數(shù)稱滿足條件的點為分位點”。分布的“上(4)F

分布的F分布,n1稱為第一自由度,設(shè)X與Y相互獨立,則稱統(tǒng)計量服從自由度為稱為第二自由度,記作由定義可得性質(zhì)F

分布的分位點對于給定的正數(shù)稱滿足條件為分布的的點上分位點表中所給的都是很小的數(shù),如0.01,0.05等當表中查不出,由性質(zhì)(2)較大時,如0.95,四.正態(tài)總體抽樣分布定理的樣本,則有

定理1(樣本均值的分布)設(shè)X1,X2,…,Xn

是來自正態(tài)總體定理2(樣本方差的分布)設(shè)X1,X2,…,Xn

是取自正態(tài)總體樣本,分別為樣本均值和樣本方差.則有的和相互獨立。

分別是這兩個樣本的均值,且X與Y獨立,是取自X的樣本,樣本,分別是這兩個樣本的樣本方差,則有是取自Y的定理3(兩總體樣本均值差的分布)二、估計量的評選標準一、點估計第三章參數(shù)估計三、區(qū)間估計四、正態(tài)總體均值與方差的區(qū)間估計

參數(shù)估計是統(tǒng)計推斷的基本問題之一,問題中,并不一定要求密度函數(shù),而只要知道參數(shù)在許多實際取值就可以了。考察燈泡廠生產(chǎn)的燈泡質(zhì)量,由于種種隨機易知燈泡使用壽命是隨機變量,記為且

問題:如何估計和?引例:因素的影響,知道了參數(shù)μ,σ2的值,那么壽命X的分布就完全確定了.參數(shù)估計要解決問題:總體分布函數(shù)的形式為已知,需要確定未知參數(shù)。但其中參數(shù)未知時,這類問題稱為參數(shù)估計問題。對于未知參數(shù),如何應(yīng)用樣本所提供的信息去對其一個或多個未知參數(shù)進行估計。對未知參數(shù)估計的兩種方法:通過樣本1、點估計2、區(qū)間估計一、點估計點估計問題:故可用樣本矩來估計總體矩。這個估計方法是英國統(tǒng)計學家K.皮爾遜最早提出的?;驹恚嚎傮w矩是反映總體分布的最簡單的數(shù)字特征,當總體含有待估計參數(shù)時,總體矩是待估計參數(shù)的函數(shù)。樣本取自總體,即樣本矩在一定程度上可以逼近總體矩,(一)矩估計法其中是待估參數(shù)為來自的樣本,存在.設(shè)總體的k階矩則樣本的k階矩(大數(shù)定律)令從中解得k個方程組即為矩估計量。矩估計量的觀察值稱為矩估計值。設(shè)總體X的分布函數(shù)為矩估計的步驟:連續(xù)型離散型例1

設(shè)某炸藥廠一天中發(fā)生著火現(xiàn)象的次數(shù)X服從

例2設(shè)總體在上服從均勻分布,解:由矩法,解得在總體類型已知條件下使用的一種參數(shù)估計方法.(二)極大似然法

選擇一個參數(shù)使得試驗結(jié)果具有最大概率—極大似然法的基本思想.基本思想:若事件發(fā)生了,則認為事件中出現(xiàn)的概率最大。最大似然估計就是在一次抽樣中,若得到觀測值則選取若一試驗有n個可能結(jié)果現(xiàn)做一試驗,在這n個可能結(jié)果作為的估計值,使得當時,樣本出現(xiàn)的概率最大。最大似然估計法:是的一個樣本值(離散型)(1)設(shè)事件發(fā)生的概率為

的函數(shù),形式已知,X的分布律為:

樣本的似然函數(shù)即取使得:與有關(guān),記為稱為參數(shù)的最大似然估計值。稱為參數(shù)的最大似然估計量.達到最大的參數(shù)作為的估計值,現(xiàn)從中挑選使概率樣本的似然函數(shù)說明:用上述求導(dǎo)方法求參數(shù)的MLE有時行不通,這時要用極大似然原則來求.使似然函數(shù)達到最大的即的MLE。

(4)在最大值點的表達式中,用樣本值代入就得參數(shù)的極大似然估計值.(1)由總體分布導(dǎo)出樣本的聯(lián)合分布律

(或聯(lián)合密度);(2)把樣本聯(lián)合分布律(或聯(lián)合密度)中自變量看成已知常數(shù),而把參數(shù)看作自變量,

得到似然函數(shù)L();(3)求似然函數(shù)L()的最大值點(常常轉(zhuǎn)化為求ln

L()的最大值點),即

的MLE;求極大似然估計(MLE)的一般步驟是:似然函數(shù)為:

設(shè)X1,X2,…Xn是取自總體X的一個樣本其中>0,求的極大似然估計.例3對數(shù)似然函數(shù)為解:似然函數(shù)為i=1,2,…,n求導(dǎo)方法無法求參數(shù)的MLE.是對故使達到最大的即的MLE,

取其它值時,是的增函數(shù)由于這時要用極大似然原則來求.由于估計量作為樣本的函數(shù)是一個隨機變量,對于不同的樣本值,估計值也不同,因此評價一個估計量的優(yōu)劣就不能僅由一個觀測值來確定,而要根據(jù)估計量的統(tǒng)計性質(zhì)來評價.通常一個好的估計量其觀測值應(yīng)在待估計參數(shù)的真值附近波動,且波動的幅度越小越好,即要使估計量與待估計參數(shù)在某種統(tǒng)計意義下非?!敖咏?

常用的幾條標準1.無偏性2.有效性3.相合性二、估計量的評選標準而它的期望值等于未知參數(shù)的真值.則稱為的無偏估計.設(shè)是未知參數(shù)的估計量,若1.無偏性

估計量是隨機變量,對于不同的樣本值會得到不同的估計值.我們希望估計值在未知參數(shù)真值附近擺動,定義:無偏性的意義是:用來估計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論