統(tǒng)計(jì)學(xué)概論第5章統(tǒng)計(jì)量與抽樣分布_第1頁(yè)
統(tǒng)計(jì)學(xué)概論第5章統(tǒng)計(jì)量與抽樣分布_第2頁(yè)
統(tǒng)計(jì)學(xué)概論第5章統(tǒng)計(jì)量與抽樣分布_第3頁(yè)
統(tǒng)計(jì)學(xué)概論第5章統(tǒng)計(jì)量與抽樣分布_第4頁(yè)
統(tǒng)計(jì)學(xué)概論第5章統(tǒng)計(jì)量與抽樣分布_第5頁(yè)
已閱讀5頁(yè),還剩65頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 5章 統(tǒng)計(jì)量與抽樣分布5.1 常用的抽樣方法5.2 抽樣分布的基本概念 5.3 樣本統(tǒng)計(jì)量的抽樣分布5.4 參數(shù)估計(jì)的基本原理5.5 總體參數(shù)的區(qū)間估計(jì)5.6 樣本容量的確定郭國(guó)慶主編學(xué)習(xí)目標(biāo)理解抽樣方法與抽樣分布估計(jì)量與估計(jì)值的概念點(diǎn)估計(jì)與區(qū)間估計(jì)的區(qū)別評(píng)價(jià)估計(jì)量?jī)?yōu)良性的標(biāo)準(zhǔn)總體均值的區(qū)間估計(jì)方法總體比例的區(qū)間估計(jì)方法樣本容量的確定方法5.1 常用的抽樣方法5.1.1簡(jiǎn)單隨機(jī)抽樣5.1.2分層抽樣5.1.3系統(tǒng)抽樣5.1.4整群抽樣5.1.5多階段抽樣5.2 抽樣分布的基本概念5.2.1 總體分布總體分布就是總體中所有個(gè)體關(guān)于某個(gè)變量(標(biāo)志)的取值所形成的分布。分布的形態(tài)很多,例如鐘型分

2、布、J型分布和U型分布等 1.鐘型分布:鐘形分布的特征是“兩頭小、中間大”, 2. U型分布:特征是:靠近中間的變量值分布的次數(shù)少,靠近兩端的變量值分布的次數(shù)多,形成“兩頭大,中間小”的分布特征。 3.J型分布J形分布的特征是“一邊小,一邊大”,即大部分變量值集中在某一端分布,有兩種類型。(1)正J形分布(2)反J形分布5.2.2 樣本分布樣本分布就是樣本中所有個(gè)體關(guān)于某個(gè)變量的取值所形成的分布。當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布 反映樣本分特征的指標(biāo)叫樣本統(tǒng)計(jì)量,通常用來表示。與總體參數(shù)相對(duì)應(yīng),常見的樣本統(tǒng)計(jì)量也有:樣本均值、樣本比例和樣本方差等.5.2.3 抽樣分布抽樣分布

3、就是樣本統(tǒng)計(jì)量的概率分布,它由樣本統(tǒng)計(jì)量的所有可能取值和與之對(duì)應(yīng)的概率所組成。實(shí)際的抽樣分布是如何形成的呢?它取決于以下三個(gè)因素:總體分布樣本容量 抽樣方法5.3 樣本統(tǒng)計(jì)量的抽樣分布5.3.1 樣本均值的抽樣分布5.3.2 樣本比例的抽樣分布5.3.3 樣本方差的抽樣分布 統(tǒng)計(jì)量1.針對(duì)不同的目的,構(gòu)造不同的樣本函數(shù)2.設(shè)X1, X2, .Xn是從總體 X中抽取的容量為n的一個(gè)樣本,,如果由此構(gòu)造一個(gè)函數(shù)T(X1, X2, .Xn) ,不依賴于任何未知參數(shù),則稱函數(shù)T(X1, X2, .Xn) 是一個(gè)統(tǒng)計(jì)量。 常用統(tǒng)計(jì)量1.均值:2.方差:3.離散系數(shù):容量相同的所有可能樣本的樣本均值的概率

4、分布一種理論概率分布進(jìn)行推斷總體總體均值的理論基礎(chǔ)5.3.1 樣本均值的抽樣分布1. 樣本均值的抽樣分布引例【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體) ,即總體單位數(shù)N=4。4 個(gè)個(gè)體分別為x1=1、x2=2、x3=3 、x4=4 ??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布 (例題分析) 現(xiàn)從總體中抽取n2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n = 2 的樣本(共16個(gè))樣本

5、均值的抽樣分布(例題分析) 計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P (X )1.53.04.03.52.02.5樣本均值的分布與總體分布的比較 = 2.5 2 =1.25總體分布14230.1.2.3抽樣分布P ( X )1.00.1.2.31.53.04.03.52.02.5X2.樣本均值抽樣分布的形式樣本均值抽樣分布的形式與原有總體的分布和樣本量的大小有關(guān)。如果原有總體是正態(tài)分布

6、,那么無論樣本量的大小,樣本均值的抽樣分布都服從正態(tài)分布。如果原有總體的分布是非正態(tài)分布,此時(shí)就要看樣本量的大小了。隨著樣本量的增大(通常n30),不論原來總體是否服從正態(tài)分布,樣本均值的抽樣分布都將趨于正態(tài)分布,其分布的數(shù)學(xué)期望為總體均值,方差為總體方差的1/n。這就是統(tǒng)計(jì)上著名的中心極限定理。樣本均值的抽樣分布與中心極限定理 = 50 =10X總體分布n = 4抽樣分布Xn =16當(dāng)總體服從正態(tài)分布N(,2)時(shí),來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X 的數(shù)學(xué)期望為,方差為2/n。即XN(,2/n)中心極限定理(central limit theorem)當(dāng)樣本容量足夠大時(shí)

7、(n 30) ,樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為 2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布一個(gè)任意分布的總體X當(dāng)為小樣本時(shí)(通常n30為大樣本),s30, 1- 0.95 總體均值在1-置信水平下的置信區(qū)間為在95%的置信水平下該市65歲以上已退休的人每天收聽無線電廣播的時(shí)間在105.84分鐘和114.16分鐘之間。 (二) 正態(tài)總體、未知、小樣本1.假定條件總體服從正態(tài)分布,且方差() 未知小樣本 (n 30)使用 t 分布統(tǒng)計(jì)量總體均值 在1-置信水平下的置信區(qū)間為t 分布 分布是類似正態(tài)

8、分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布 Xt 分布與標(biāo)準(zhǔn)正態(tài)分布的比較t 分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t (df = 13)t (df = 5)Z總體均值的區(qū)間估計(jì)【例】 可口可樂公司生產(chǎn)的雪碧,瓶上標(biāo)明凈容量是500ml,在市場(chǎng)上隨機(jī)抽取了25瓶,測(cè)得到其平均容量為499.5ml,標(biāo)準(zhǔn)差為2.63ml。試求該公司生產(chǎn)的這種瓶裝飲料的平均容量的置信水平為99%的置信區(qū)間(假定飲料的容量服從正態(tài)分布)。 解:已知,樣本容量為n=25,樣本均值 , 樣本標(biāo)準(zhǔn)差為s=2.63 ,又因?yàn)橹眯?/p>

9、水平 ,查自由度為的分布表得 所以瓶裝飲料的平均容量的置信水平為99%的置信區(qū)間為:因此該公司生產(chǎn)的這種瓶裝飲料的平均容量的置信水平為99%的置信區(qū)間為(498.03, 500.97)。5.5.2 總體比例的區(qū)間估計(jì)1.假定條件總體服從二項(xiàng)分布當(dāng)樣本容量足夠大時(shí),即 時(shí),可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量3. 總體比例在1-置信水平下的置信區(qū)間為例題分析【例】 估計(jì)收視率的情況,在一個(gè)由165個(gè)經(jīng)??措娨暤募彝ソM成的隨機(jī)樣本中,調(diào)查指出,有101個(gè)家庭收看某節(jié)目。試用90%的置信區(qū)間估計(jì)所有收看該節(jié)目的家庭的真正比例。對(duì)這個(gè)區(qū)間作出解釋。 解:已知 n=165,p0.612 , z/2=1

10、.645 因此,收看該節(jié)目的家庭的真正比例在0.550到0.674之間。 5.5.3 總體方差的區(qū)間估計(jì)總體方差的區(qū)間估計(jì)【例】 對(duì)某乳品廠生產(chǎn)的袋裝鮮奶質(zhì)量進(jìn)行測(cè)量。隨機(jī)抽出20袋,測(cè)得每袋平均質(zhì)量為250.8g,標(biāo)準(zhǔn)差為1.25g。已知每袋質(zhì)量服從正態(tài)分布,求的置信度為90%的置信區(qū)間。 5.7 樣本容量的確定5.7.1 影響樣本容量的因素 5.7.2 估計(jì)總體均值時(shí)樣本容量的確定5.7.3 估計(jì)總體比例時(shí)樣本容量的確定郭國(guó)慶主編5.7.1 影響樣本容量的因素總體的變異程度 允許誤差的大小 置信水平的大小 抽樣方法不同 估計(jì)總體均值時(shí)樣本容量n為 重復(fù)抽樣樣本容量n與總體方差成正比,與邊際

11、誤差成反比,與可靠性系數(shù)成正比5.7.2 估計(jì)總體均值時(shí)樣本容量的確定 其中:例題分析【例】某食品廠要檢驗(yàn)本月生產(chǎn)的20000袋某產(chǎn)品的重量,根據(jù)以往的資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。如果要求在95.45%的置信度下,平均每袋重量的誤差不超過5克,應(yīng)抽查多少袋產(chǎn)品? 解: 由題意可知N=20000, =25克, E=5克,根據(jù)置信度 , 在重復(fù)抽樣的條件下即應(yīng)抽查97袋產(chǎn)品。根據(jù)比例區(qū)間估計(jì)公式可得樣本容量n為 重復(fù)抽樣5.7.3 估計(jì)總體比例時(shí)樣本容量的確定 E的取值一般小于0.1 未知時(shí),可取最大值0.5其中:估計(jì)總體比例時(shí)樣本容量的確定 (例題分析)【例】 為了檢查某企業(yè)生產(chǎn)的10000個(gè)顯像管的合格率,需要確定樣本的容量。根

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論