數(shù)理統(tǒng)計(jì)學(xué)的基本概念_第1頁
數(shù)理統(tǒng)計(jì)學(xué)的基本概念_第2頁
數(shù)理統(tǒng)計(jì)學(xué)的基本概念_第3頁
數(shù)理統(tǒng)計(jì)學(xué)的基本概念_第4頁
數(shù)理統(tǒng)計(jì)學(xué)的基本概念_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第六章數(shù)理統(tǒng)計(jì)的基本概念一、教學(xué)要求1 .理解總體、個(gè)體、簡(jiǎn)單隨機(jī)樣本和統(tǒng)計(jì)量的概念,掌握樣本均值、樣本方差及樣本矩的計(jì)算。2 ,了解必分布、t分布和F分布的定義和性質(zhì),了解分位數(shù)的概念并會(huì)查表計(jì)算。3 .掌握正態(tài)總體的某些常用統(tǒng)計(jì)量的分布。4 ,了解最大次序統(tǒng)計(jì)量和最小次序統(tǒng)計(jì)量的分布。本章重點(diǎn):統(tǒng)計(jì)量的概念及其分布。二、主要內(nèi)容1 .總體與個(gè)體我們把研究對(duì)象的全體稱為總體(或母體),把組成總體的每個(gè)成員稱為個(gè)體。在實(shí)際問題中,通常研究對(duì)象的某個(gè)或某幾個(gè)數(shù)值指標(biāo),因而常把總體的數(shù)值指標(biāo)稱為總體。設(shè)x為總體的某個(gè)數(shù)值指標(biāo),常稱這個(gè)總體為總體X。X的分布函數(shù)稱為總體分布函數(shù)。當(dāng)X為離散型隨機(jī)變量

2、時(shí),稱X的概率函數(shù)為總體概率函數(shù)。當(dāng)X為連續(xù)型隨機(jī)變量時(shí),稱X的密度函數(shù)為總體密度函數(shù)。當(dāng)X服從正態(tài)分布“("R時(shí),稱總體X為正態(tài)總體。正態(tài)總體有以下三種類型:(1/未知,但,已知;/未知,但厚已知;(3)月和均未知。2 .簡(jiǎn)單隨機(jī)樣本數(shù)理統(tǒng)計(jì)方法實(shí)質(zhì)上是由局部來推斷整體的方法,即通過一些個(gè)體的特征來推斷總體的特征。要作統(tǒng)計(jì)推斷,首先要依照一定的規(guī)則抽取n個(gè)個(gè)體,然后對(duì)這些個(gè)體進(jìn)行測(cè)試或觀察得到一組數(shù)據(jù)瓦,飛,耳,這一過程稱為抽樣。由于抽樣前無法知道得到的數(shù)據(jù)值,因而站在抽樣前的立場(chǎng)上,設(shè)有可能得到的值為Zh及,n維隨機(jī)向量(幾耳,招)稱為樣本。n稱為樣本容量。(和程一,/)稱為樣本

3、觀測(cè)值。如果樣本('1,乜,",工)滿足3 1)區(qū),二相互獨(dú)立;4 2)耳,耳J'K服從相同的分布,即總體分布;則稱(二.二.')為簡(jiǎn)單隨機(jī)樣本。簡(jiǎn)稱樣本。設(shè)總體X的概率函數(shù)(密度函數(shù))為了5),則樣本(用,過二區(qū))的聯(lián)合概率精品函數(shù)(聯(lián)合密度函數(shù)為)精品j-i3 .統(tǒng)計(jì)量完全由樣本確定的量,是樣本的函數(shù)。即:設(shè)花,為,工.是來自總體X的一個(gè)樣本,乳乙,為,端)是一個(gè)n元函數(shù),如果且中不含任何總體的未知參數(shù),則稱g(X”牙“為一個(gè)統(tǒng)計(jì)量,經(jīng)過抽樣后得到一組樣本觀測(cè)值勺,工口,一,心,則稱目上,孫,心)為統(tǒng)計(jì)量觀測(cè)值或統(tǒng)計(jì)量值。4 .常用統(tǒng)計(jì)量斤=士丫.(1)樣

4、本均值:-“爐=無舊-前二無r1-胃(2)樣本方差:,,.;-:'S二必二J-g3-X2(3)樣本標(biāo)準(zhǔn)差:r它們的觀察值分別為:濃UL題U這些觀察值仍分別稱為樣本均值、樣本方差和樣本標(biāo)準(zhǔn)差。(4)樣本(k階)原點(diǎn)矩1nkAkXi,k1,2,Lnii(5)樣本(k階)中心矩1nk,Bk(XiX),k2,3,Lni1nc其中樣本二階中心矩Bk-(XiX),又稱為未修正樣本萬差ni1(6)順序統(tǒng)計(jì)量將樣本中的各個(gè)分量由小到大的重排成X(1)X(2)LX(n)則稱X(1),X(2),LX(n)為樣本順序統(tǒng)計(jì)量,X(n)X(1)為樣本的極差(7)樣本相關(guān)系數(shù):rxyn_(Xix)(vy)i1SS

5、n_(Xix)(yiy)i1(xix).(yy)ni1,ni1精品其中:x,y分別為數(shù)據(jù)Xi,yi的樣本均值,Sx,Sy分別為樣本a標(biāo)準(zhǔn)差精品5、直方圖與箱線圖(1)直方圖先將所有采集的數(shù)據(jù)進(jìn)行整理,得到順序統(tǒng)計(jì)量,找出其中的最小值x,最大值X(n),即所有的數(shù)據(jù)都落在區(qū)間X(i),X(n)上,現(xiàn)取區(qū)間Xk,X(n)k(其中k可取0.5,1.5等),該區(qū)間能覆蓋區(qū)間X(i),X(n),將區(qū)間X(1)k,X(n)k等(*X(1)k)(X(n)k)1,m在每個(gè)小區(qū)間內(nèi)的數(shù)據(jù)的頻數(shù)在各個(gè)小區(qū)間上做以Xp取Xnp,Xnp1的平均值。特別的:x0.5med,)分為m個(gè)小區(qū)間(先取一個(gè)區(qū)間,其下限比最小的

6、數(shù)據(jù)稍小,其上限比最大的數(shù)據(jù)稍大,然后將這一區(qū)間等分為m個(gè)小區(qū)間,通常n較大時(shí)m取10:20,當(dāng)n50時(shí)則m取5:6。若m取得過大,則會(huì)出現(xiàn)某些區(qū)間內(nèi)頻數(shù)為零,分點(diǎn)通常取比數(shù)據(jù)精度高一位,以避免數(shù)據(jù)落在分點(diǎn)上),小區(qū)間的長(zhǎng)度記為,圖形概括:最小值精品Min,Qi,M,Q3,最大值Max,做法如下:(1)畫一水平數(shù)軸,在軸上標(biāo)記最小值Min,Qi,M,Q3,最大值Max,在數(shù)軸上方畫一個(gè)上下側(cè)平行于數(shù)軸的矩形箱子,箱子的左右兩側(cè)分別位于Qi,Q3的上方,在M點(diǎn)的上方畫一條垂直線段,線段位于箱子的內(nèi)部;(2)自箱子的左側(cè)中點(diǎn)引一條水平線直至最小值上方;在同一水平高度自箱子右側(cè)引一條水平線直至最大值

7、上方。箱線圖完成。在數(shù)據(jù)集中某一個(gè)觀察值不尋常的大于或小于該數(shù)集中的其他數(shù)據(jù),稱為疑似異常值。第一四分位數(shù)Qi與第三四分位數(shù)Q3之間的距離:IQRQ3Qi稱為四分位數(shù)間距,若數(shù)據(jù)小于Q11.5IQR或大于Q31.5IQR,就認(rèn)為他是疑似異常值。將上述箱線圖的做法修改如下:(1)同(1)(2)計(jì)算IQRQ3Qi,若一個(gè)數(shù)據(jù)小于Qi1.5IQR或大于Q31.5IQR,則認(rèn)為它是一個(gè)異常值,并以表示;(3')自箱子的左側(cè)中點(diǎn)引一條水平線直至數(shù)據(jù)中除去疑似異常值之后的最小值上方,再自箱子的右側(cè)中點(diǎn)引一條水平線直至數(shù)據(jù)中除去疑似異常值之后的最大值上方;這樣做出的箱線圖稱為修正箱線圖6關(guān)于分布(1

8、) (Gamma)函數(shù)()0x1exdx(s0)它具有以下運(yùn)算性質(zhì):(1) ();(n)(n1)!,nN;特別地:(1)1(-)x2exdx、2o令、,xtxt2,dx2tdt1 1x1t2t2t2()x2edxgeg2tdt2edtedt27ootox222x2令I(lǐng)edtI(edt)(eds)(edt)2r2derdrI00(2)設(shè)隨機(jī)變量X服從分布,即:X:(,),其密度函數(shù)為:精品f(x)x()x1-cex0qita0,0定理:設(shè)隨機(jī)變量X,Y都服從分布且相互獨(dú)立,即:fY(y),)其密度函數(shù)分別為:1_xfx(x)1ny00y1一eyqitaXY服從參數(shù)為7、經(jīng)驗(yàn)分布函數(shù)設(shè)X1,X2,

9、LXn是總體x00,0qita0,0的分布,即:XY:(的一個(gè)樣本,用S(x),(x)表小Xi,X2,LXn中不大于x的隨機(jī)變量的個(gè)數(shù),定義經(jīng)驗(yàn)分布函數(shù)為:1cFn(x)-S(x),(x)n例題1:設(shè)總體F有一個(gè)樣本值1,2,3則經(jīng)驗(yàn)分布函數(shù)為:0,x1F3(x)%,1x2%,2x31,x3例題2:設(shè)總體F有一個(gè)樣本值1,1,2,則經(jīng)驗(yàn)分布函數(shù)為:0,x1F3(x)23,1x21,x2格里汶科定理:(1933年)對(duì)于任意一實(shí)數(shù)x,當(dāng)n時(shí),F(xiàn)n(x)以概率1收斂于分布函數(shù)F(x)PlimsupFn(x)F(x)01nx8.三個(gè)重要分布(1)/分布設(shè)占四為獨(dú)立標(biāo)準(zhǔn)正態(tài)變量,稱隨機(jī)變量"三

10、'1牛x?+,X?的分布為自由度為n的爐分布,記為U一其密度函數(shù)為:精品nd11-1-2一2x2e2f(x)2n2性質(zhì):(1)若22(n),WE(2)n,D(2)2n因?yàn)閄i:所以:N(0,1)E(Xi)_2E(Xi)E(2)2又D(Xi)其中:E(i1_4E(Xi)0,D(Xi)1D(Xi)1nXi2)n_2(E(Xi)2_4E(Xi)2,(i1,2,Ln)E(Xi4)t4get22dt3tget-t22d(ft2t3gdeT(2)(3)的點(diǎn)(2)t2(t3gde2)t2t3gde2t2?dt3t2t2e萬出t2tde2t2(te萬)t2e2dtt2e2dt32分布的可加性設(shè)i2:2

11、(n1),2:2212:2分布的分位點(diǎn)對(duì)于給定的正數(shù)IP(22(n),并且相互獨(dú)立,則有:2(n1E)(02(n)1),稱滿足條件2(n)為2(n)分布的上t分布2(n)f(x)dx分位點(diǎn)。則稱設(shè)隨機(jī)變量X與Y獨(dú)立,"一期卯)一/3),T-X的分布為自由度n的t分布,記為t分布又稱為學(xué)生氏分布,其密度函數(shù)為:(12)n(n1)2h(t).n(n2)t分布的分位點(diǎn):對(duì)于給定的正數(shù)(01),稱滿足條件P(tJ")t(nj出(n)t(n)的點(diǎn)t(n)為t(n)分布的上分位點(diǎn)。其中:t1精品(3)F分布則稱設(shè)隨機(jī)變量U與V相互獨(dú)立,芝氏”1%裝),V!m的分布為自由度值萬)的F分布

12、,記為產(chǎn)網(wǎng)口巾)。密度函數(shù)為:nn一m(n)(y)2mnm(m)1曳F2m0由定義知:若1則piF(m,n)F分布的分位點(diǎn)對(duì)于給定的正數(shù)(01),稱稱滿足:P(FF(n,m)F(n,m)(y)dy的點(diǎn)心為F分布的口上分位點(diǎn),且有k值死)=一工9抽樣分布(1冶限總體的抽樣分布定理1、設(shè)總體中個(gè)體總數(shù)(也稱總體大小)為N,樣本容量為n(nN)且總體有有限均值,方差2,則(i)E(X)(ii)當(dāng)抽樣是有放回時(shí)當(dāng)抽樣是無放回時(shí)(X)n(X)RnN1.n其中(X)即為X的標(biāo)準(zhǔn)差。(2并正態(tài)總體的抽樣分布設(shè)總體X(不管服從什么分布,只要均值和方差存在)的均值為,方差為2X1,X2,LXn是來自X的一個(gè)樣本

13、,X,s2分別是樣本均值和樣本方差,則有:_2E(X),D(X)一n精品nE(S)E-i1(XX)加1而n1E(S2)E(X:)nE(X2)1n1n(i1n22(Xi2nX)i122222)n()n定理2、設(shè)Xi,X2,LXn是來自正態(tài)總體X:N(,2)的一個(gè)樣本,X是樣本均值,則有:2X(i)X:N(,一);(ii):N(0,1)n、n定理3、設(shè)X1,X2,LXn是來自正態(tài)總體X2)的一個(gè)樣本,X,S2分別是樣本均值和樣本方差,則有:1)(i)(S24n(XiX)2:2(ni1(ll)X與s2相互獨(dú)立。定理4、設(shè)Xi,X2,LXn是來自正態(tài)總體X2)的一個(gè)樣本,X,s2分注:.n(3)雙正態(tài)

14、總體的抽樣分布1)定理5、設(shè)Xi,X2,LXni與Yi,Y2,LYn2分別是來自正態(tài)總體N(1,12”(2,2)的樣本,且這兩個(gè)樣本相互獨(dú)立,設(shè)別是樣本均值和樣本方差,則有:(i)(nTS2口”3)2:2(n)i1精品niXi,Y一Yin2i1是這兩個(gè)樣本的樣本均值;S2有:nini(XiX)2,S21n21n2_(YiY)2分別是這兩個(gè)樣本的樣本方差。則i1其中:證明:(2)(DSW(1)F(n11,n21);(XY)Sw(12).:t(n1n211(n11)S2(n21)S;n22,Sw.S22)2(n11)S2.2(n11),2(n21)S;.2(n21)因?yàn)镾-S;相互獨(dú)立,_2S1)

15、S21(n11)T:F(n1(n21)S;'22(n21)則由1,11)N(2,n1所以(XY)1n2F分布定義22S12s1:F(n1,11)又因?yàn)?1)S22(n11),由2分布的可加性22(R1)S2(n21)S12-)n22)2:N(0,1)(n21)S22(n21)2(n1n22)精品由于U,V相互獨(dú)立,由t分布定義:UV_n1n22(XY)(i2)工工nin2一.一2'.一2(ni1)Si(n21)S222n1n22(XY)(12).sw?1n1n2t(n1n22)三、小結(jié)四、作業(yè)P1814P182913如有侵權(quán)請(qǐng)聯(lián)系告知?jiǎng)h除,感謝你們的配合!精品稱為組距,小區(qū)間的端點(diǎn)稱為組限,數(shù)出數(shù)據(jù)落fi,算出頻率芻(i1,2,Ll),然后自左至右依次n1,2,Ll)為高的小矩形,這樣的圖形就稱其為頻率直方圖。顯然這種小矩形的面積就等于數(shù)據(jù)落在該小區(qū)間的頻率力(i1,2,Ll),n直方圖的外廓曲線接近于總體X的概率密度曲線。(2)p分位數(shù)定義設(shè)有容量為n的樣本觀察值X1,X2,L,Xn,樣本p(0p1)分為數(shù)記為Xp,它具有以下性質(zhì):(1)至少有np個(gè)觀察值小于或等于Xp;(2)至少有n(1p)個(gè)觀察值大于或等于Xp樣本p分位數(shù)可按以下法則求得:將X1,X2,L,Xn按從小到大的順序排成X(1)X(2)LX(n)1°,若np不是整

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論