總體均數(shù)的估計ppt課件_第1頁
總體均數(shù)的估計ppt課件_第2頁
總體均數(shù)的估計ppt課件_第3頁
總體均數(shù)的估計ppt課件_第4頁
總體均數(shù)的估計ppt課件_第5頁
已閱讀5頁,還剩47頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第六章 總體均數(shù)的估計,均數(shù)的抽樣誤差與標準誤 t分布 總體均數(shù)的估計,1,為什么進行抽樣?,2,3,抽樣誤差,概念:由個體變異引起的,抽樣造成的樣本統(tǒng)計量與總體參數(shù)之間的差異稱為抽樣誤差(sampling error) 。,4,均數(shù)的抽樣誤差,均數(shù)的抽樣誤差:抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。,5,模擬試驗1,從均數(shù)為4.5,標準差為0.2的正態(tài)總體中作隨機抽樣。當樣本量為20時,隨機抽取100個樣本,其樣本均數(shù)、標準差及其總體均數(shù)的95%置信區(qū)間見表6.1 。 可見:各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)之間存在差異,6,樣本均數(shù)的頻數(shù)分布見表6.2 可見: 樣本均數(shù)的分

2、布很有規(guī)律,圍繞著總體均數(shù)4.5,中間多、兩邊少,左右對稱。,7,模擬試驗1,從均數(shù)為4.5,標準差為0.2的正態(tài)總體中作隨機抽樣,規(guī)定樣本含量分別為5、10、20、50,每種樣本含量均重復抽取1000次,結果可得到4個不同樣本含量的樣本均數(shù)的抽樣分布圖 如圖6.1。 可見:得到的樣本均數(shù)的分布仍然近似服從正態(tài)分布。,8,數(shù)理統(tǒng)計的中心極限定理,從正態(tài)分布N(,2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布。,9,模擬試驗2,從非正態(tài)總體中抽樣,觀察其樣本均數(shù)的抽樣分布。非正態(tài)總體的分布如圖6.2所示。 規(guī)定樣本含量分別為5、10、20、50,每種樣本含量均重復抽取1000次,結果也可

3、得到4個不同樣本含量的樣本均數(shù)的抽樣分布圖(圖6.3)。,10,數(shù)理統(tǒng)計的中心極限定理,即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布。,11,數(shù)理統(tǒng)計的中心極限定理,樣本均數(shù)的總體均數(shù)仍為,樣本均數(shù)的標準差為 。,12,標準誤(standard error),樣本均數(shù)的標準差稱標準誤,是說明均數(shù)抽樣誤差大小的指標, 大,抽樣誤差大;反之, 小,抽樣誤差小 。,13,標準誤,標準誤 的計算: 標準誤 的估計值,14,影響標準誤大小的因素,的大小與成正比 與樣本含量n的平方根成反比,15,抽樣誤差越小,表明樣本均數(shù)與總體均數(shù)越接近,即用樣本均數(shù)估計總體均數(shù)的可靠性越大;反之

4、,抽樣誤差越大,則用樣本均數(shù)估計總體均數(shù)的可靠性越小。,16,P74 例6.1,6.2,17,t分布,t分布的由來 t分布的特征 t分布曲線下的面積,18,t分布的由來,變量變換,總體,樣本均數(shù),中心極限定理,標準正態(tài)分布,變量變換,未知,19,t分布,英國 W.S.Gosset 于1908年以“student”筆名發(fā)表論文,證明它服從自由度為n-1的t分布,20,如果抽取例數(shù)n=5的樣本1000個,每個樣本又都可以按下式計算出一個t值,可將1000個t值編制成頻數(shù)表,作出直方圖,則可得到一條光滑的曲線。 (式6.3 ),21,同理,如果抽取例數(shù)n=15時,仍能得到一條t分布曲線,因此,當n變

5、化時,就可以得到不同的t分布曲線,如圖6.4:,22,圖6.4自由度分別為1、5、的t分布,23,t分布的特征,t分布是一簇曲線。 t分布以0為中心,左右對稱。 其形態(tài)變化與自由度的大小有關。自由度越小,則t值越分散,曲線越低平;自由度逐漸增大時,t分布逐漸逼近u分布(標準正態(tài)分布);當=時,t分布即為u分布。,24,t分布曲線下面積規(guī)律,t分布曲線下總面積仍為1或100% t分布曲線下面積以0為中心左右對稱。,25,t分布曲線下面積規(guī)律,由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個常量,而是隨自由度的大小而變化,如P439附表3 。,26,附表2,t分布

6、表的特點,附表2的橫標目為自由度,縱標目為概率P。一側尾部面積稱為單尾概率,兩側尾部面積之和稱為雙尾概率表中數(shù)字表示 和 確定時,對應的t界值,記作t, 。,27,附表2,t分布表的特點,單尾概率對應的t界值用t, 表示 雙尾概率對應的t界值用t/2, 表示,28,當30時,單側概率P 0.05時 單側t, 1.697 當30時,雙側概率P 0.05時 雙側t/2, 2.042,example,29,example,單側: P( t-t0.05,301.697 )=0.05 P(tt0.05,30 1.697 )=0.05 雙側: P(t-t0.05/2,30)+P(tt0.05/2,30 )

7、=0.05,30,其通式為 單側:P( t-t, )=或P(tt,)= 雙側:P(t-t/2,)+P(tt/2, )= 圖中非陰影部分面積的概率為, P(-t/2,tt/2,)=1-,31,附表2,t分布表的特點,附表2只列出正值,若計算的t值為負值時,可用其絕對值查表 。,32,總體均數(shù)的估計,33,34,統(tǒng)計分析,統(tǒng)計描述,統(tǒng)計推斷,參數(shù)估計,假設檢驗,35,參數(shù)估計,用樣本指標估計總體指標稱為參數(shù)估計,是統(tǒng)計推斷的一個重要方面。,36,總體均數(shù)估計的兩種方法,點估計 區(qū)間估計,37,點估計,是直接用樣本統(tǒng)計量直接作為總體參數(shù)的估計值.,38,點估計的缺點,沒有考慮抽樣誤差,無法評價估計值

8、與真實值之間的差距,39,總體均數(shù)估計的兩種方法,點估計 區(qū)間估計,40,區(qū)間估計,概念:即按預先給定的概率估計參數(shù)所在的范圍。 該范圍亦稱可信區(qū)間(confidence interval, CI) 。,41,區(qū)間估計,結合樣本均數(shù)和標準誤可以確定一個具有較大可信度的包含總體均數(shù)的區(qū)間,該區(qū)間稱為總體均數(shù)的1-可信區(qū)間。 一般取0.05或0.01,42,可信區(qū)間的計算,43,總體標準差未知時,正態(tài)總體N(,2)的樣本均數(shù) 的t變換結果服從t分布:,44,若“砍去”t分布雙側尾部面積0.055,則有95的t值滿足,45,或,移項:,46,可信區(qū)間的計算,未知,且n小 未知,但n足夠大 已知,47,可信區(qū)間的涵義,P80,48,表6.1 從正態(tài)總體N(4.5,0.22)抽到的100份隨機樣本的計算結果(n100),49,可信區(qū)間兩要素,準確度:反映在可信度(1-)的大小上,即可信區(qū)間包含總體均數(shù)的可能性大小,從準確度的角度看,愈接近1愈好,如可信度99%比95%好。 精密度:反映在可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論