版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1此幻燈片可在網址http:/上下載第18講2第六章 樣本及抽樣分布3第一節(jié) 總體與樣本4在實際應用中,對一個給定的隨機變量x,通常并不知道它的一些信息。例如,或者不知道它的分布,或者,不知道它的一些數(shù)字特征,如數(shù)學期望,方差,等等。因此,就需要對x做一些隨機試驗,根據隨機試驗的結果,對x的一些信息作出判斷或者估計,得出某些結論,這就是數(shù)理統(tǒng)計。5因此,對于我們要通過一系列隨機試驗來研究的那個隨機變量x,我們叫它總體總體。通常要做多次相互獨立的隨機試驗。在事先要做出計劃,隨機試驗的次數(shù)是多少。事先計劃的隨機試驗的次數(shù)n,我們稱之為樣本容樣本容量量。6對總體x計劃做n次隨機試驗,將要得到n個數(shù),
2、就是試驗結果。但是,在計劃已經做出,試驗還沒有做的時候,我們不知道這n個數(shù)是什么,在這時,這n個數(shù)也是隨機變量,因為試驗是計劃相互獨立地做的,因此這n個隨機變量x1,x2,xn也是相互獨立的,它們都和總體x的分布一樣。稱這n個隨機變量為總體x的樣本樣本。7然后開始實施計劃,也就是對總體x做n次相互獨立的隨機試驗,也可以看成是對樣本x1,x2,xn做一次隨機試驗,當然就得到了n個具體的試驗結果,n個具體的數(shù),用x1,x2,xn來表示,這被稱為樣本x1,x2,xn的樣本值樣本值。8總結性的定義:定義定義 總體總體是一個隨機變量x,樣本樣本是n個相互獨立的與總體同分布的隨機變量x1,x2,xn,其中
3、n稱為樣本容量樣本容量。樣本值樣本值是對x做n次獨立試驗(或對樣本x1,x2,xn做1次試驗)的試驗結果,用x1,x2,xn表示,也叫樣本觀測樣本觀測值值。9若將樣本x1,x2,xn看作是一個n維隨機變量(x1,x2,xn),則(1) 當總體x是離散型隨機變量,可取的值為h1,h2,,若記其分布律為px=x=p(x), 其中x這個自變量是離散地取值h1,h2,,則樣本(x1,x2,xn)的分布律為p*(x1,x2,xn)=p(x1)p(x2)p(xn); (1)其中x1,x2,xn都離散地從h1,h2,中取值.(2) 當總體x是連續(xù)型隨機變量,其概率密度函數(shù)為f(x)時,樣本(x1,x2,xn
4、)的概率密度為f *(x1,x2,xn)=f(x1)f(x2)f(xn) (2)10第二節(jié) 樣本分布函數(shù) 直方圖11一、樣本分布函數(shù)一、樣本分布函數(shù)將總體x的分布函數(shù)f(x)=pxx)(1)稱為總體分布函數(shù). 從總體中抽取容量為n的樣本,得到n個樣本觀測值,若樣本容量n較大,則相同的觀測值可能重復出現(xiàn)若干次,為此,應當把這些觀測值整理,并寫出下面的樣本頻率分布表:觀測值x(1)x(2)x(l)總計頻數(shù)n1n2nln頻率f1f2fl112樣本頻率分布表:觀測值x(1)x(2)x(l)總計頻數(shù)n1n2nln頻率f1f2fl1其中x(1)x(2)x(l) (ln)11(1,2, ),1.iilnii
5、iinfilnnnf13定義定義 設函數(shù)其中和式 是對小于或等于x的一切x(i)的頻率fi求和, 則稱fn(x)是樣本分布函樣本分布函數(shù)數(shù)或經驗分布函數(shù)經驗分布函數(shù).( )(1)( )(1)( )0,( ),(1,2,1)1,(2)iniiixxlxxf xfxxxilx x( ) ixx14易知樣本分布函數(shù)fn(x)具有下列性質:1 0fn(x)1;2 fn(x)是非減函數(shù);3 fn()=0, fn(+)=1;4 fn(x)在每個觀測值x(i)和是右連續(xù)的,點x(i)是fn(x)的跳躍間斷點,fn(x)在該點的躍度就等于頻率fi. 15樣本分布函數(shù)的圖形x(1)x(2)x(i)x(i+1)x
6、(l)xfn(x)116對于任意的實數(shù)x,總體分布函數(shù)f(x)是事件xx的概率; 樣本分布函數(shù)fn(x)是事件xx的頻率. 根據伯努利大數(shù)定理可知, 當n時,對于任意的正數(shù)e, 有l(wèi)im |( )( )|1(3)nnpf xf xe格利汶科(glivenko)進一步證明了,當n時,樣本分布函數(shù)fn(x)與總體分布函數(shù)f(x)之間存在著更密切的近似關系的結論. 這些結論就是我們在數(shù)理統(tǒng)計中可以依據樣本來推斷總體的理論基礎.17二、直方圖二、直方圖數(shù)理統(tǒng)計中研究連續(xù)隨機變量x的樣本分布時,通常需要作出樣本的頻率直方圖(簡稱直方圖),作直方圖的步驟如下:(1) 找出樣本觀測值 x1,x2,xn中的最
7、小值和最大值,分別記作*1x與*2x, (2) 適當選取略小于*1x的值數(shù) a 與略大于*2x的值 b, 并用分點 a=t0t1t2tl1tl=b 把區(qū)間(a,b)分成 l 個子區(qū)間 t0,t1),t1,t2),ti1,ti),tl1,tl). 18第 i 個子區(qū)間的長度為ti=titi1,i=1,2,l. 各子區(qū)間的長度可以相等,也可以不等;若使各子區(qū)間的長度相等,則有ibatl (i=1,2,l). 子區(qū)間的個數(shù) l 一般取為 8 至 15個,太多則由于頻率的隨機擺動而使分布顯得雜亂,太少則難于顯示分布的特征. 此外,為了方便起見,分點 ti應比樣本觀測值 xi多取一位小數(shù). 19(3)
8、把所有樣本觀測值逐個分到各子區(qū)間內,并計算樣本觀測值落在各子區(qū)間的頻數(shù) ni,及頻率(1,2, )iinfiln. (4) 在 ox 軸上截取各子區(qū)間,并以各子區(qū)間為底,以1iiiftt為高作小矩形,各個小矩形的面積si就等于樣本觀測值落在該子區(qū)間內的頻率,即 11()(1,2, )()iiiiiiifsttfiltt20所有小矩形的面積的和等于1:111lliiiisf這樣作出的所有小矩形就構成了直方圖.因為當樣本容量n充分大時,隨機變量x落在各個子區(qū)間ti1,ti)內的頻率近似等于其概率,即1 (1,2, )iiifp txtil所以直方圖大致地描述了總體x的概率分布.21例例 測量100
9、個某種機械零件的質量,得到樣本觀測值如下(單位:g)22設置的分布區(qū)間及統(tǒng)計的頻率如下:接收236.5239.5242.5245.5248.5251.5254.5257.5260.5263.5266.5頻率01591924221161223用excel軟件繪出的直方圖如下:24第三節(jié) 樣本函數(shù)與統(tǒng)計量25為了借助于對樣本觀測值的整理、分析、研究,從而對總體x的某些概率特征作出判斷,往往需要考慮各種適用的樣本函數(shù)g(x1,x2,xn). 因為一組樣本x1,x2,xn可以看作是一個n維隨機變量(x1,x2,xn), 所以任何樣本函數(shù)g(x1,x2,xn)都是n維隨機變量的函數(shù),顯然也是隨機變量.
10、根據樣本x1,x2,xn的觀測值x1,x2,xn計算得到的函數(shù)值g(x1,x2,xn)就是樣本函數(shù)g(x1,x2,xn)的觀測值.26定義定義 若樣本函數(shù)g(x1,x2,xn)中不含有任何未知參數(shù),則稱這類樣本函數(shù)為統(tǒng)計量統(tǒng)計量.27數(shù)理統(tǒng)計中最常用的統(tǒng)計量及其觀測值有:1. 樣本均值 11niixxn (1) 它的觀測值記為 11niixxn (2) 2. 樣本方差2211()1niisxxn (3) 它的觀測值記為2211()1niisxxn (4) 28假設總體x的期望為m, 方差為s2, 則來自總體x的n個樣本x1,x2,xn的期望和方差也就是m和s2, 經常是x的方差我們不知道, 因
11、此定義一個統(tǒng)計量為 u=(x1m)2+(x2m)2+(xnm)2, 稱它偏差平方和偏差平方和, e(u)=ns2, 因此e(u/n)=s2, 可以用u/n來估計x的方差.有的估計問題, m是已知的, 因此可以用這種辦法來估計.但是大多數(shù)的估計問題是m與s2都為未知, 因此被迫用t=(x1 x)2+(x2 x)2+(xnx)229 u=(x1m)2+(x2m)2+(xnm)2, 但是大多數(shù)的估計問題是m與s2都為未知, 因此被迫用t=(x1 x)2+(x2 x)2+(xn x)2來近似u. t被稱為樣本偏差平方和.因此用t/n來估計s2也是一個合理的考慮. 但是t中使用的樣本均值畢竟不是常數(shù)m,
12、 也是一個隨機變量, 這就導致了e(t)=(n1)s2, 因此就用n1去除t得樣本方差s2, 用s2來估計s2.30 u=(x1m)2+(x2m)2+(xnm)2,t=(x1 x)2+(x2 x)2+(xn x)2u中的n個用來平方求和的隨機變量x1m, x2m, , xnm 是相互獨立的, 而且相互獨立還有一個說法就相互間是自由的, 而且有n個相互獨立的隨機變量, 因此就認為自由度是n.31 u=(x1m)2+(x2m)2+(xnm)2,t=(x1 x)2+(x2 x)2+(xn x)2而t中的n個用來求平方和的隨機變量(x1 x),(x2 x),(xn x)卻因為x中同時含有x1,x2,x
13、n的成份而導致它們并不相互獨立, 因此是不自由的, 這n個隨機變量如果不平方就相加, 得1212()()()0nnxxxxxxxxxnx滿足一個方程因此就減少了一個自由.32 u=(x1m)2+(x2m)2+(xnm)2,t=(x1 x)2+(x2 x)2+(xn x)2但是可以證明, 可以對(x1 x),(x2 x),(xn x)做適當?shù)木€性變換, 得到n-1個相互獨立的0均值方差為s2的隨機變量y1,y2, , yn-1, 導致222121ntyyy因此t的n個不是相互獨立的隨機變量的平方和, 相當于n1個相互獨立的隨機變量的平方和, 因此t的自由度是n1. 象這樣的原理只有在更深的數(shù)理統(tǒng)
14、計書中才能夠看到.33 u=(x1m)2+(x2m)2+(xnm)2,t=(x1 x)2+(x2 x)2+(xn x)2t的另一種計算辦法:222112211222211()(2)22nniiiiinniiiinniiiitxxxx xxxxxnxxnxxnxxnx34樣本方差的另一算法: 222111iisxnxn 相應地觀測值為222111niisxnxn 3. 樣本標準差2211()1niissxxn(5) 它的觀測值記為2211()1niissxxn(6) 354. 樣本k階原點矩11,1,2,(7)nkkiiaxkn它的觀測值記為11,1,2,(8)nkkiiaxkn顯然,樣本的一階
15、原點矩就是樣本均值.365. 樣本k階中心矩11() ,1,2,(9)nkkiibxxkn它的觀測值記為11() ,1,2,(10)nkkiibxxkn顯然,樣本一階中心矩恒等于零.37當樣本容量n較大時,相同的樣本觀測值xi往往可能重復出現(xiàn),為了使計算簡化,應先把所得的數(shù)據整理,設得到下表:觀測值xix(1)x(2)x(l)總計頻數(shù)nin1n2nln其中1liinn38觀測值xix(1)x(2)x(l)總計頻數(shù)nin1n2nln于是,樣本均值x, 樣本方差s2及樣本二階中心矩 b2可以分別按下列公式計算: ( )122( )122( )11,(11)1()(12)11()(13)liiiliiiliiixn xnsn xxnbn xxn39顯然,當樣本容量n充分大時,樣本方差s2與樣本二階中心矩b2是近似相等的.( )122( )122( )11,(11)1()(12)11()(13)liiiliiiliiixn xnsn xxnbn xxn4011,1,2,npkkikiaxknm 若總體x的k階矩e(xk)=mk存在, 則當n時 , k=1,2,.這是因為x1,x2,xn獨立且與x同分布, 所以x1k,x2k,xn
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 喉癌多學科綜合治療模式-深度研究
- 旅游承載力與社區(qū)參與-深度研究
- 農村環(huán)境衛(wèi)生整治中的農業(yè)面源污染控制技術-深度研究
- 新發(fā)傳染病的快速響應機制構建-深度研究
- 2025年廣西演藝職業(yè)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 昆蟲群體智能信息處理研究-深度研究
- 2025年廣州鐵路職業(yè)技術學院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 2025年廣州珠江職業(yè)技術學院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 新能源車輛研究-深度研究
- 機電一體化系統(tǒng)集成-深度研究
- 中醫(yī)診療方案腎病科
- 2025年安慶港華燃氣限公司招聘工作人員14人高頻重點提升(共500題)附帶答案詳解
- 人教版(2025新版)七年級下冊數(shù)學第七章 相交線與平行線 單元測試卷(含答案)
- GB/T 44351-2024退化林修復技術規(guī)程
- 完整2024年開工第一課課件
- 從跨文化交際的角度解析中西方酒文化(合集5篇)xiexiebang.com
- 中藥飲片培訓課件
- 醫(yī)院護理培訓課件:《早產兒姿勢管理與擺位》
- 《論文的寫作技巧》課件
- 空氣自動站儀器運營維護項目操作說明以及簡單故障處理
- 2022年12月Python-一級等級考試真題(附答案-解析)
評論
0/150
提交評論