抽樣分布與統(tǒng)計(jì)推斷原理PPT學(xué)習(xí)教案

上傳人：鼠*** IP屬地：上海上傳時(shí)間：2022-05-13 格式：PPTX 頁(yè)數(shù)：100 大?。?.13MB 積分：20 舉報(bào) 版權(quán)申訴

抽樣分布與統(tǒng)計(jì)推斷原理PPT學(xué)習(xí)教案_第2頁(yè)

抽樣分布與統(tǒng)計(jì)推斷原理PPT學(xué)習(xí)教案_第3頁(yè)

抽樣分布與統(tǒng)計(jì)推斷原理PPT學(xué)習(xí)教案_第4頁(yè)

抽樣分布與統(tǒng)計(jì)推斷原理PPT學(xué)習(xí)教案_第5頁(yè)

已閱讀5頁(yè)，還剩95頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、會(huì)計(jì)學(xué)1抽樣分布與統(tǒng)計(jì)推斷原理抽樣分布與統(tǒng)計(jì)推斷原理一一概率概率（一）概率的統(tǒng)計(jì)定義（一）概率的統(tǒng)計(jì)定義研究隨機(jī)試驗(yàn)，僅知道可能發(fā)生哪些隨研究隨機(jī)試驗(yàn)，僅知道可能發(fā)生哪些隨機(jī)事件是不夠的，還需了解各種隨機(jī)事件發(fā)機(jī)事件是不夠的，還需了解各種隨機(jī)事件發(fā)生的可能性大小，以揭示這些事件的內(nèi)在的生的可能性大小，以揭示這些事件的內(nèi)在的統(tǒng)計(jì)規(guī)律性，從而指導(dǎo)實(shí)踐。這就要求有一統(tǒng)計(jì)規(guī)律性，從而指導(dǎo)實(shí)踐。這就要求有一個(gè)能夠個(gè)能夠刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo)刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo)，這指標(biāo)應(yīng)該是事件本身所固有的，且不隨，這指標(biāo)應(yīng)該是事件本身所固有的，且不隨人的主觀意志而改變，人們?nèi)说闹饔^意志而改變，

2、人們稱之為概率稱之為概率（probability）。）。事件事件A的概率記為的概率記為P（A）。）。第1頁(yè)/共100頁(yè) 概率的統(tǒng)計(jì)定義概率的統(tǒng)計(jì)定義在相同條件下進(jìn)行在相同條件下進(jìn)行n次重復(fù)試驗(yàn)，如果隨機(jī)事件次重復(fù)試驗(yàn)，如果隨機(jī)事件A發(fā)生的次數(shù)為發(fā)生的次數(shù)為m，那么那么m/n稱為隨機(jī)事件稱為隨機(jī)事件A的的頻率頻率（frequency）；）；當(dāng)試驗(yàn)重復(fù)數(shù)當(dāng)試驗(yàn)重復(fù)數(shù)n逐漸增大時(shí)，隨機(jī)事件逐漸增大時(shí)，隨機(jī)事件A的頻率越來(lái)越穩(wěn)定地接近某一數(shù)值的頻率越來(lái)越穩(wěn)定地接近某一數(shù)值 p ，那么那么就就把把 p稱為隨機(jī)事件稱為隨機(jī)事件A的的概率概率。這這樣樣定定義義的的概概率率稱稱為為

3、統(tǒng)統(tǒng) 計(jì)計(jì) 概概率（率（statistics probability），），或者稱后驗(yàn)概率（或者稱后驗(yàn)概率（posterior probability）第2頁(yè)/共100頁(yè)表表3-1 拋擲一枚硬幣發(fā)生正面朝上的試驗(yàn)記錄拋擲一枚硬幣發(fā)生正面朝上的試驗(yàn)記錄第3頁(yè)/共100頁(yè) 從表從表3-1可看出，隨著實(shí)驗(yàn)次數(shù)的增多，正面朝上這個(gè)事件發(fā)生的頻率越來(lái)越穩(wěn)定地接近可看出，隨著實(shí)驗(yàn)次數(shù)的增多，正面朝上這個(gè)事件發(fā)生的頻率越來(lái)越穩(wěn)定地接近0.5，我們就把，我們就把0.5作為這個(gè)事件的概率。作為這個(gè)事件的概率。在一般情況下，隨機(jī)事件的概率在一般情況下，隨機(jī)事件的概率p是不可能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)是不可

4、能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)n充分大時(shí)隨機(jī)事件充分大時(shí)隨機(jī)事件A的頻率作為該隨機(jī)事件概率的近似值。的頻率作為該隨機(jī)事件概率的近似值。即即 P（A）=pm/n （n充分大）充分大）第4頁(yè)/共100頁(yè)（二（二）概率的性質(zhì)概率的性質(zhì) 1、對(duì)于任何事件、對(duì)于任何事件A，有有0P（A）1； 2、必然事件的概率為必然事件的概率為1，即，即P（）=1； 3、不可能事件的概率為不可能事件的概率為0，即，即P（）=0。第5頁(yè)/共100頁(yè)一個(gè)總體是由一個(gè)隨機(jī)變量的所有可能取值來(lái)構(gòu)成的，而樣本只是這些所有可能取值的一部分一個(gè)總體是由一個(gè)隨機(jī)變量的所有可能取值來(lái)構(gòu)成的，而樣本只是這些所有可能取值的一部分隨機(jī)變量中

5、某一個(gè)值出現(xiàn)的概率，只是隨機(jī)變量一個(gè)側(cè)面的反映，若要全面了解隨機(jī)變量則必須知道隨機(jī)變量中某一個(gè)值出現(xiàn)的概率，只是隨機(jī)變量一個(gè)側(cè)面的反映，若要全面了解隨機(jī)變量則必須知道隨機(jī)變量的全部值隨機(jī)變量的全部值和和各個(gè)值出現(xiàn)的概率各個(gè)值出現(xiàn)的概率，即隨機(jī)變量的概率分布，即隨機(jī)變量的概率分布概率和概率分布是生命科學(xué)研究中由樣本推斷總體的理論基礎(chǔ)概率和概率分布是生命科學(xué)研究中由樣本推斷總體的理論基礎(chǔ) 隨機(jī)變量的種類很多，每一種隨機(jī)變量都有其特定的概率分布。隨機(jī)變量的種類很多，每一種隨機(jī)變量都有其特定的概率分布。連續(xù)型隨機(jī)變量連續(xù)型隨機(jī)變量離散型隨機(jī)變量離散型隨機(jī)變量在一定范圍內(nèi)可連續(xù)取值的變量。在一定

6、范圍內(nèi)可連續(xù)取值的變量。在一定范圍內(nèi)只取有限種可能的值的變量。在一定范圍內(nèi)只取有限種可能的值的變量。正態(tài)分正態(tài)分布布二項(xiàng)分布、泊松分布二項(xiàng)分布、泊松分布二二概率分布概率分布第6頁(yè)/共100頁(yè)1. 正態(tài)分布正態(tài)分布正態(tài)分布（正態(tài)分布（normal distribution）的概念是由德國(guó)數(shù)學(xué)家和天文學(xué)家的概念是由德國(guó)數(shù)學(xué)家和天文學(xué)家Moivre于于1733年首次提出的，由德國(guó)數(shù)學(xué)家年首次提出的，由德國(guó)數(shù)學(xué)家Gauss率先將其應(yīng)用于天文學(xué)研究，故率先將其應(yīng)用于天文學(xué)研究，故正態(tài)分布又稱為正態(tài)分布又稱為Gauss分布（分布（Gaussian distribution）。）。許多生物學(xué)領(lǐng)域（許

7、多生物學(xué)領(lǐng)域（如身高、體重、脈搏、血紅蛋白、血清總膽固醇等如身高、體重、脈搏、血紅蛋白、血清總膽固醇等）的隨機(jī)變量都）的隨機(jī)變量都服從或者近似服從正態(tài)分布或通過(guò)某種轉(zhuǎn)換后服從正態(tài)分布，許多其他類型服從或者近似服從正態(tài)分布或通過(guò)某種轉(zhuǎn)換后服從正態(tài)分布，許多其他類型分布基本上都與正態(tài)分布有關(guān)，它們的極限就是正態(tài)分布。分布基本上都與正態(tài)分布有關(guān)，它們的極限就是正態(tài)分布。1.1 正態(tài)分布的定義正態(tài)分布的定義在日常工作中所遇到的變量大多是連續(xù)型隨機(jī)變量，當(dāng)這一類隨機(jī)變量呈線在日常工作中所遇到的變量大多是連續(xù)型隨機(jī)變量，當(dāng)這一類隨機(jī)變量呈線性時(shí)，往往服從正態(tài)分布性時(shí)，往往服從正態(tài)分布第7頁(yè)/共100頁(yè)

8、連續(xù)型隨機(jī)變量的概率分布第8頁(yè)/共100頁(yè)某地 13 歲女孩 118 人的身高(cm)資料頻數(shù)分布身高組段頻數(shù) 組中值（1）（2） (3) 129 2 130.5 132 2 133.5 135 8 136.5 138 20 139.5 141 26 142.5 144 25 145.5 147 20 148.5 150 9 151.5 153 3 154.5 156 2 157.5 159162 1 160.5 合計(jì) 118 下面我們以某地13歲女孩118人的身高(cm)資料，來(lái)說(shuō)明身高變量服從正態(tài)分布。第9頁(yè)/共100頁(yè)身高(cm)160.5157.5154.5151.5148.5

9、145.5142.5139.5136.5133.5130.5 某地13歲女孩118人身高(cm)頻數(shù)分布圖頻數(shù)3020100第10頁(yè)/共100頁(yè)身高(cm) 某地13歲女孩118人身高(cm)頻數(shù)分布圖頻數(shù)20100第11頁(yè)/共100頁(yè)身高(cm) 某地13歲女孩118人身高(cm)頻數(shù)分布圖頻12頁(yè)/共100頁(yè)身高(cm) 頻數(shù)分布逐漸接近正態(tài)分布示意圖第13頁(yè)/共100頁(yè)和正態(tài)分布相對(duì)應(yīng)的曲線稱為正態(tài)分布密度曲線，簡(jiǎn)稱為正態(tài)曲線。和正態(tài)分布相對(duì)應(yīng)的曲線稱為正態(tài)分布密度曲線，簡(jiǎn)稱為正態(tài)曲線。用來(lái)描述正態(tài)曲線的函數(shù)稱為正態(tài)分布密度函數(shù)用來(lái)描述正態(tài)曲線的函數(shù)稱為正態(tài)分

10、布密度函數(shù) 222)(21)(xexf 總體平均數(shù) 2 總體方差圓周率3.14 總體標(biāo)準(zhǔn)差任何一個(gè)正態(tài)分布均由參數(shù)任何一個(gè)正態(tài)分布均由參數(shù)和和所決定所決定如果一個(gè)隨機(jī)變量如果一個(gè)隨機(jī)變量x服從平均數(shù)為服從平均數(shù)為、方差為方差為2的正態(tài)分布，可記為的正態(tài)分布，可記為xN（，2）。）。e 自然對(duì)數(shù)的底，2.71828第14頁(yè)/共100頁(yè)1.2 正態(tài)分布的特點(diǎn)正態(tài)分布的特點(diǎn) （1）正態(tài)分布曲線以直線）正態(tài)分布曲線以直線x =為對(duì)稱軸，左右完全對(duì)稱為對(duì)稱軸，左右完全對(duì)稱（3）正態(tài)分布曲線有兩個(gè)拐點(diǎn)，拐點(diǎn)座標(biāo)分別為（正態(tài)分布曲線有兩個(gè)拐點(diǎn)，拐點(diǎn)座標(biāo)分別為（-，f（-）和（和（+，f（+），），在這兩

11、個(gè)拐點(diǎn)處曲線改變方向，即曲線在（在這兩個(gè)拐點(diǎn)處曲線改變方向，即曲線在（-，-）和（和（+，+）區(qū)間上是下凹的，在區(qū)間上是下凹的，在-，+區(qū)間內(nèi)是上凸的區(qū)間內(nèi)是上凸的x（2）在在x =處，處，f(x)有最大值有最大值 21)(f第15頁(yè)/共100頁(yè)（4）正態(tài)分布密度曲線的位置由正態(tài)分布密度曲線的位置由決定（決定（為位置參數(shù)），形狀由為位置參數(shù)），形狀由決定（決定（為形狀參數(shù)）為形狀參數(shù)）（5）正態(tài)分布曲線向兩邊無(wú)限延伸，以正態(tài)分布曲線向兩邊無(wú)限延伸，以x軸為漸進(jìn)線，分布從軸為漸進(jìn)線，分布從-到到+ 的大小決定了曲線在的大小決定了曲線在x軸上的位置軸上的位置的大小則決定了曲線的胖瘦程度的大小則決

12、定了曲線的胖瘦程度當(dāng)當(dāng)恒定時(shí)，恒定時(shí)，愈大，則曲線沿愈大，則曲線沿x軸愈向軸愈向右移動(dòng)右移動(dòng)愈小，曲線沿愈小，曲線沿x軸愈向左移動(dòng)軸愈向左移動(dòng)越大表示數(shù)據(jù)越分散，曲線越胖越大表示數(shù)據(jù)越分散，曲線越胖越小表示數(shù)據(jù)越集中，曲線越瘦越小表示數(shù)據(jù)越集中，曲線越瘦第16頁(yè)/共100頁(yè)1.3 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布由正態(tài)分布由和和所決定，不同的所決定，不同的、值就決定了不同的正態(tài)值就決定了不同的正態(tài)分布密度函數(shù)，因此在實(shí)際計(jì)算中很不方便的。需將一般的分布密度函數(shù)，因此在實(shí)際計(jì)算中很不方便的。需將一般的N(，2 2 )轉(zhuǎn)換為轉(zhuǎn)換為=0, 2 2 =1的正態(tài)分布。我們稱的正態(tài)分布。我們稱=0, 2

13、2 =1的正態(tài)分的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布布為標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution) 可見，由正態(tài)分布密度函數(shù)得到標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)：222)(21)(xexf2221)(xexf第17頁(yè)/共100頁(yè)1.4 正態(tài)分布的概率計(jì)算正態(tài)分布的概率計(jì)算根據(jù)概率論原理，可知隨機(jī)變量根據(jù)概率論原理，可知隨機(jī)變量x在區(qū)間（在區(qū)間（a，b）內(nèi)取值的概率是一塊面內(nèi)取值的概率是一塊面積：積： ax bx 面積面積由由0y曲線曲線所圍成的曲邊梯形所組成：所圍成的曲邊梯形所組成： badxxfbxaP)()(隨機(jī)變量隨機(jī)變量x在（在（-，+）間取值的概率為）間取值的概率為1 ，即

14、：，即：1)()(dxxfxP 求隨機(jī)變量x在某一區(qū)段內(nèi)取值的概率就轉(zhuǎn)化成了求由該區(qū)段與相應(yīng)曲線所圍成的曲邊梯形的面積。第18頁(yè)/共100頁(yè)由于正態(tài)分布的概率密度函數(shù)比較復(fù)雜，積分的計(jì)算也比較麻煩，而這些由于正態(tài)分布的概率密度函數(shù)比較復(fù)雜，積分的計(jì)算也比較麻煩，而這些計(jì)算在動(dòng)物科學(xué)研究和生產(chǎn)實(shí)踐中又經(jīng)常會(huì)用到。計(jì)算在動(dòng)物科學(xué)研究和生產(chǎn)實(shí)踐中又經(jīng)常會(huì)用到。最好的解決辦法：將正態(tài)分布最好的解決辦法：將正態(tài)分布轉(zhuǎn)化為轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布，然后根據(jù)標(biāo)準(zhǔn)正態(tài)分標(biāo)準(zhǔn)正態(tài)分布，然后根據(jù)標(biāo)準(zhǔn)正態(tài)分布表（附表布表（附表1）直接查出概率值。）直接查出概率值。（1）標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算

15、附表附表1列出了在標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量列出了在標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量u在區(qū)間在區(qū)間（，u內(nèi)取值的概率：內(nèi)取值的概率： uuudueduufuuP2221)()(第19頁(yè)/共100頁(yè)標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算通式標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算通式第20頁(yè)/共100頁(yè)標(biāo)準(zhǔn)正態(tài)分布函數(shù)表標(biāo)準(zhǔn)正態(tài)分布函數(shù)表第21頁(yè)/共100頁(yè)例例1：若u N（0，1），），求： )64. 0( uP)53. 1( uP)53. 012. 2(uP（1）（2）（3）解：解：（1）)64. 0( uP)53. 012. 2(uP)53. 1( uP7389. 0（2）)53. 1(1uP9370. 010630. 0（3）)12

16、. 2()53. 0(uPuP)12. 2(1 )53. 0(1 uPuP)9830. 01 ()7109. 01 (0170. 02981. 02811. 0第22頁(yè)/共100頁(yè)關(guān)于標(biāo)準(zhǔn)正態(tài)分布，以下幾種概率應(yīng)當(dāng)熟記：關(guān)于標(biāo)準(zhǔn)正態(tài)分布，以下幾種概率應(yīng)當(dāng)熟記：P（-1u1）=0.6826P（-2u2）=0.9545P（-3u3）=0.9973P（-1.96u1.96）=0.95P（-2.58u2.58）=0.99P（u1） u變量在上述區(qū)間以外取值的概率，變量在上述區(qū)間以外取值的概率，即兩尾概率：即兩尾概率：= 1- P（-1u1） = 1-0.6826 = 0.3174 P（u2）=1-

17、P（-2u2）= 0.0455P（u3）= 1-0.9973 = 0.0027P（u1.96）= 1-0.95 = 0.05P（u2.58）= 1-0.99 = 0.01第23頁(yè)/共100頁(yè)（2）正態(tài)分布的概率計(jì)算正態(tài)分布的概率計(jì)算對(duì)于服從任意正態(tài)分布對(duì)于服從任意正態(tài)分布N（,2）的隨機(jī)變量，欲求其在某個(gè)區(qū)間的取值概率，需的隨機(jī)變量，欲求其在某個(gè)區(qū)間的取值概率，需先將它標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)分布先將它標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)分布N（0,1）的隨機(jī)變量，然后查表即可。的隨機(jī)變量，然后查表即可。第24頁(yè)/共100頁(yè)第25頁(yè)/共100頁(yè)第26頁(yè)/共100頁(yè)xu實(shí)質(zhì)：實(shí)質(zhì)：為了能使正態(tài)分布應(yīng)用起來(lái)更方便一些，可

18、以將為了能使正態(tài)分布應(yīng)用起來(lái)更方便一些，可以將x作一變換，令：作一變換，令：變換后的正態(tài)分布密度函數(shù)為：變換后的正態(tài)分布密度函數(shù)為：2221)(ueuf標(biāo)準(zhǔn)正態(tài)分布均具有標(biāo)準(zhǔn)正態(tài)分布均具有=0，2=1的特性的特性如果隨機(jī)變量如果隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布，可記為：服從標(biāo)準(zhǔn)正態(tài)分布，可記為：uN（0，1） u變換變換這個(gè)變換稱為標(biāo)準(zhǔn)化或這個(gè)變換稱為標(biāo)準(zhǔn)化或u變換變換, ,由于由于x是隨機(jī)變量，因此是隨機(jī)變量，因此u也是隨機(jī)變量，也是隨機(jī)變量，所得到的隨機(jī)變量所得到的隨機(jī)變量U也服從也服從正態(tài)分布，因此，由任意正態(tài)分布隨機(jī)變量標(biāo)準(zhǔn)化得到的隨機(jī)變量的標(biāo)準(zhǔn)正態(tài)分布常稱為正態(tài)分布，因此，由任意正態(tài)分布隨

19、機(jī)變量標(biāo)準(zhǔn)化得到的隨機(jī)變量的標(biāo)準(zhǔn)正態(tài)分布常稱為u分布。可分布?？梢姡阂姡旱?7頁(yè)/共100頁(yè)數(shù)學(xué)期望與方差的運(yùn)算數(shù)學(xué)期望與方差的運(yùn)算第28頁(yè)/共100頁(yè)第29頁(yè)/共100頁(yè)隨機(jī)變量的數(shù)學(xué)期望就是指它們的理論均數(shù)，其統(tǒng)計(jì)學(xué)意義就是對(duì)隨機(jī)變量進(jìn)行長(zhǎng)期觀測(cè)所得數(shù)據(jù)的平均數(shù)，因而，數(shù)學(xué)期望只對(duì)長(zhǎng)期或大量觀測(cè)值才有意義，對(duì)于個(gè)別觀測(cè)或試驗(yàn)無(wú)意義。第30頁(yè)/共100頁(yè)例2：設(shè) x N（30，102）試求x 40的概率。解：解：首先將正態(tài)分布首先將正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布，令轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布，令:)103040(uP)40( xP1030 xu則則u服從標(biāo)準(zhǔn)正態(tài)分布，故服從標(biāo)準(zhǔn)正態(tài)分布，故:) 1

20、( uP) 1(1uP8413. 011587. 0第31頁(yè)/共100頁(yè)例3：設(shè)x服從=30.26, =5.102的正態(tài)分布，試求P(21.64x32.98)。解：解：令令10.526.30 xu)10. 526.3098.3210. 526.3010. 526.3064.21()98.3264.21(xPxP第32頁(yè)/共100頁(yè)關(guān)于一般正態(tài)分布，經(jīng)常用到以下幾個(gè)概率：關(guān)于一般正態(tài)分布，經(jīng)常用到以下幾個(gè)概率：P（-x+）= 0.6826P（-2x+2） = 0.9545P（-3x+3） =0.9973P（-1.96x+1.96） = 0.95P（-2.58x+2.58） = 0.99把隨機(jī)

21、變量把隨機(jī)變量x落在平均數(shù)落在平均數(shù)加減不同加減不同倍數(shù)標(biāo)準(zhǔn)差倍數(shù)標(biāo)準(zhǔn)差區(qū)間之外的概率稱為區(qū)間之外的概率稱為兩尾概率（雙側(cè)概率），記作兩尾概率（雙側(cè)概率），記作。對(duì)應(yīng)于兩尾概率可以求得隨機(jī)變量對(duì)應(yīng)于兩尾概率可以求得隨機(jī)變量x小于小于-k或大于或大于+k的概率，稱的概率，稱為一尾概率（單側(cè)概率），記作為一尾概率（單側(cè)概率），記作2。0.3173 0.0455 0.0027 0.05 0.01 /2第33頁(yè)/共100頁(yè)附表2：給出了滿足給出了滿足）uuP(兩尾臨界值兩尾臨界值u 因此，可以根據(jù)兩尾概率因此，可以根據(jù)兩尾概率，由附表由附表2查出相應(yīng)的臨界值查出相應(yīng)的臨界值u。例4：已知 u N（

22、0，1），），試求u： 10. 0(）（）uuPuuP（1）（2）86. 0(）uuuP解：解：（1）10. 0）（）（uuPuuP644854. 110. 0u（2）（）（uuPuuP）（uuuP114. 086. 01475791. 114. 0u第34頁(yè)/共100頁(yè)2. 二項(xiàng)分布二項(xiàng)分布二項(xiàng)分布（二項(xiàng)分布（binomial distribution）是一種最常見的、典型的離散型隨機(jī)是一種最常見的、典型的離散型隨機(jī)變量的概率分布。變量的概率分布。有些試驗(yàn)只有非此即彼兩種結(jié)果，這種由非此即彼的事件構(gòu)成的總體，有些試驗(yàn)只有非此即彼兩種結(jié)果，這種由非此即彼的事件構(gòu)成的總體，稱為二項(xiàng)總體。稱為二

23、項(xiàng)總體。結(jié)果結(jié)果“此此”用變量用變量1表示，表示，概率為概率為 p 結(jié)果結(jié)果“彼彼”用變量用變量0表示，表示，概率為概率為 q pxP ) 1(qxP )0(1qp對(duì)于n次獨(dú)立的試驗(yàn)，如果每次試驗(yàn)結(jié)果出現(xiàn)且只出現(xiàn)對(duì)立事件A與A-中之一，在每次試驗(yàn)中出現(xiàn)A的概率是p（0p5，np、nq較接近時(shí)，接近正態(tài)分布，較接近時(shí)，接近正態(tài)分布，n時(shí)服從正態(tài)分布，即二項(xiàng)分布的極限是正態(tài)分布時(shí)服從正態(tài)分布，即二項(xiàng)分布的極限是正態(tài)分布（5）二項(xiàng)分布的平均數(shù)為：）二項(xiàng)分布的平均數(shù)為： np npq2方差為：方差為：npq標(biāo)準(zhǔn)差為：第37頁(yè)/共100頁(yè)例4：某奶牛場(chǎng)情期受胎率為0.6，該場(chǎng)對(duì)30頭發(fā)情母牛配種

24、，使24頭母牛一次配種受胎的概率為多少？解：解：6 . 0p30n24m)24(30P6242430)4 . 0()6 . 0(C624)4 . 0()6 . 0()2430(2430！0115. 0%15. 1186 . 030 np2 . 74 . 06 . 0302 npq68. 22 . 7npq2.3 二項(xiàng)分布的概率計(jì)算二項(xiàng)分布的概率計(jì)算第38頁(yè)/共100頁(yè)課堂練習(xí)：用某種常規(guī)藥物治療豬瘟的治愈率為0.7，對(duì)20頭患豬瘟的肥育豬進(jìn)行治療，問(wèn)20頭豬中16頭豬治愈的概率是多少？解：解：7 . 0p20n16m)16(20P4161620) 3 . 0()7 . 0(C416) 3 .

25、 0()7 . 0()1620(1620！1295. 0%95.12147 . 020 np2 . 43 . 07 . 0202 npq05. 22 . 4npq第39頁(yè)/共100頁(yè)3. 泊松分布泊松分布當(dāng)二項(xiàng)分布中的當(dāng)二項(xiàng)分布中的n，p0時(shí)，二項(xiàng)分布趨向于一種新的分布時(shí)，二項(xiàng)分布趨向于一種新的分布泊松分布（普哇松分布）泊松分布（普哇松分布）（Poissons distribution）當(dāng)試驗(yàn)次數(shù)（或稱觀測(cè)次數(shù)）很大，而某事件出現(xiàn)的概率很小，則離散型隨機(jī)變量當(dāng)試驗(yàn)次數(shù)（或稱觀測(cè)次數(shù)）很大，而某事件出現(xiàn)的概率很小，則離散型隨機(jī)變量x服從于泊松分布。服從于泊松分布。 3.1 泊松分布的定義泊

26、松分布的定義若隨機(jī)變量若隨機(jī)變量x（x = m）只取零和正整數(shù)值只取零和正整數(shù)值0，1，2，且其概率分布為：，且其概率分布為： )(mxPemm!0其中：其中： = np，是一個(gè)常量，且是一個(gè)常量，且 7182. 2e則稱則稱x服從參數(shù)為服從參數(shù)為的泊松分布，的泊松分布，記為記為x P（）第40頁(yè)/共100頁(yè)n 泊松分布主要是用來(lái)描述小概率事件發(fā)生的概率泊松分布主要是用來(lái)描述小概率事件發(fā)生的概率單位空間中某些野單位空間中某些野生動(dòng)物數(shù)生動(dòng)物數(shù) 畜群中的畸形畜群中的畸形個(gè)體數(shù)個(gè)體數(shù) 畜群中某些遺傳性畜群中某些遺傳性疾病的患病數(shù)疾病的患病數(shù) n 泊松分布不是用來(lái)描述幾乎不可能發(fā)生的事件的概率

27、泊松分布不是用來(lái)描述幾乎不可能發(fā)生的事件的概率山無(wú)棱，天地合山無(wú)棱，天地合南京六月飛雪南京六月飛雪第41頁(yè)/共100頁(yè)（1）泊松分布只有一個(gè)參數(shù)）泊松分布只有一個(gè)參數(shù)，= np。 3.2 泊松分布的特點(diǎn)泊松分布的特點(diǎn) 既是泊松分布的平均值既是泊松分布的平均值，又是方差又是方差2，即：即： 2（2）泊松分布的圖形決定于）泊松分布的圖形決定于，值愈小分布愈偏倚，隨著值愈小分布愈偏倚，隨著的增大，分布的增大，分布趨于對(duì)稱。趨于對(duì)稱。當(dāng)當(dāng)=20時(shí)分布接近于正態(tài)分布；當(dāng)時(shí)分布接近于正態(tài)分布；當(dāng)=50時(shí)，可以認(rèn)為泊松分布呈正態(tài)分時(shí)，可以認(rèn)為泊松分布呈正態(tài)分布。布。第42頁(yè)/共100頁(yè)3.3 泊松分布

28、的概率計(jì)算泊松分布的概率計(jì)算例5：某大型豬場(chǎng)因某種疾病死亡的豬數(shù)呈泊松分布。已知該場(chǎng)平均每年因這種疾病死亡的豬數(shù)為9.5頭，問(wèn)2007年該場(chǎng)因這種疾病死亡的豬數(shù)為15頭的概率是多少？5 . 9解：解：根據(jù)泊松分布的性質(zhì)可知：根據(jù)泊松分布的性質(zhì)可知： 15m)15( xP5 . 915!155 . 9e0265. 02007年該場(chǎng)因這種疾病死亡的豬數(shù)為15頭的概率是2.65%。)(mxPemm!第43頁(yè)/共100頁(yè)第44頁(yè)/共100頁(yè)統(tǒng)計(jì)學(xué)的主要任務(wù)就是研究總體和樣本的關(guān)系：統(tǒng)計(jì)學(xué)的主要任務(wù)就是研究總體和樣本的關(guān)系：從樣本到總體從樣本到總體從總體到樣本從總體到樣本目的就是通過(guò)樣本來(lái)推斷總

29、體。目的就是通過(guò)樣本來(lái)推斷總體。目的就是研究樣本統(tǒng)計(jì)量的分布及其與原總體的關(guān)系目的就是研究樣本統(tǒng)計(jì)量的分布及其與原總體的關(guān)系從特殊到一般，從特殊到一般，從一般到特殊，從一般到特殊，統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷抽樣分布抽樣分布抽樣分布是統(tǒng)計(jì)推斷的基礎(chǔ)，研究抽樣分布的目的就是為了更好地進(jìn)行統(tǒng)計(jì)推斷，并能正確地理解統(tǒng)計(jì)推斷的結(jié)論。第45頁(yè)/共100頁(yè)1. 抽樣分布的概念抽樣分布的概念x樣本平均數(shù)樣本平均數(shù) 和樣本方差和樣本方差S2是描述樣本特征的兩個(gè)最重要的統(tǒng)計(jì)量是描述樣本特征的兩個(gè)最重要的統(tǒng)計(jì)量總體平均數(shù)總體平均數(shù)和總體方差和總體方差2是描述總體特征的兩個(gè)最重要的參數(shù)是描述總體特征的兩個(gè)最重要的參

30、數(shù) 因此，研究總體和樣本的關(guān)系，實(shí)際就是研究：因此，研究總體和樣本的關(guān)系，實(shí)際就是研究： xS2 2 就總體而言，就總體而言，和和2都是常量都是常量從總體中隨機(jī)地抽取若干個(gè)體所組成的樣本，即使每次抽取的樣本容量都相等，從總體中隨機(jī)地抽取若干個(gè)體所組成的樣本，即使每次抽取的樣本容量都相等，每一個(gè)樣本所得到的樣本平均數(shù)每一個(gè)樣本所得到的樣本平均數(shù)也不可能都相等，同時(shí)也不可能就等于總體平均也不可能都相等，同時(shí)也不可能就等于總體平均數(shù)數(shù) 樣本統(tǒng)計(jì)量將隨樣本的不同而有所不同，因而樣本統(tǒng)計(jì)量也是隨機(jī)變量，也有其概率分布樣本統(tǒng)計(jì)量的概率分布稱為抽樣分布（樣本統(tǒng)計(jì)量的概率分布稱為抽樣分布（sampling

31、 distribution）樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱為抽樣誤差樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱為抽樣誤差（sampling error）第46頁(yè)/共100頁(yè)從總體中抽取樣本的過(guò)程稱為抽樣（從總體中抽取樣本的過(guò)程稱為抽樣（sampling）抽樣分為復(fù)置抽樣和不復(fù)置抽樣兩種：抽樣分為復(fù)置抽樣和不復(fù)置抽樣兩種：復(fù)置抽樣指每次抽出一個(gè)個(gè)體后，這個(gè)個(gè)體應(yīng)返回原總體復(fù)置抽樣指每次抽出一個(gè)個(gè)體后，這個(gè)個(gè)體應(yīng)返回原總體不復(fù)置抽樣指每次抽出的個(gè)體不返回原總體不復(fù)置抽樣指每次抽出的個(gè)體不返回原總體對(duì)于無(wú)限總體，或者樣本容量對(duì)于無(wú)限總體，或者樣本容量n與總體容量與總體容量N相比很小時(shí)，返回與否

32、相比很小時(shí)，返回與否都可保證每個(gè)個(gè)體被抽到的機(jī)會(huì)相等，復(fù)置抽樣等同于不復(fù)置抽樣都可保證每個(gè)個(gè)體被抽到的機(jī)會(huì)相等，復(fù)置抽樣等同于不復(fù)置抽樣對(duì)于有限總體，應(yīng)該采取復(fù)置抽樣，否則各個(gè)體被抽到的機(jī)會(huì)就不相對(duì)于有限總體，應(yīng)該采取復(fù)置抽樣，否則各個(gè)體被抽到的機(jī)會(huì)就不相等等在實(shí)際操作中，均為不復(fù)置抽樣在實(shí)際操作中，均為不復(fù)置抽樣在理論研究中則以復(fù)置抽樣為主在理論研究中則以復(fù)置抽樣為主第47頁(yè)/共100頁(yè)2. 樣本平均數(shù)的抽樣分布（樣本平均數(shù)的抽樣分布（p47）2.1 樣本平均數(shù)抽樣分布的概念樣本平均數(shù)抽樣分布的概念從總體容量為從總體容量為N的總體中進(jìn)行抽樣，如果每個(gè)樣本的樣本容量均為的總體中進(jìn)行抽樣，

33、如果每個(gè)樣本的樣本容量均為n，將所將所有這樣的樣本都抽出來(lái)，并計(jì)算出每一個(gè)樣本的平均數(shù)有這樣的樣本都抽出來(lái)，并計(jì)算出每一個(gè)樣本的平均數(shù)原來(lái)的那個(gè)總體，稱為原總體原來(lái)的那個(gè)總體，稱為原總體由樣本平均數(shù)組成的分布稱為樣本平均數(shù)的抽樣分布由樣本平均數(shù)組成的分布稱為樣本平均數(shù)的抽樣分布如果原總體的平均數(shù)為如果原總體的平均數(shù)為，標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為，那么樣本平均數(shù)抽樣總體：那么樣本平均數(shù)抽樣總體：平均數(shù)為：平均數(shù)為：標(biāo)準(zhǔn)差為：標(biāo)準(zhǔn)差為：xx稱為樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)誤差稱為樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)誤差簡(jiǎn)稱為標(biāo)準(zhǔn)誤（簡(jiǎn)稱為標(biāo)準(zhǔn)誤（standard error）由這些樣本平均數(shù)組成的新總體，就稱為樣本

34、平均數(shù)抽樣總體。由這些樣本平均數(shù)組成的新總體，就稱為樣本平均數(shù)抽樣總體。第48頁(yè)/共100頁(yè)標(biāo)準(zhǔn)誤表示平均數(shù)抽樣誤差的大小，反映樣本平均數(shù)與新總體平均數(shù)之間標(biāo)準(zhǔn)誤表示平均數(shù)抽樣誤差的大小，反映樣本平均數(shù)與新總體平均數(shù)之間的離散程度。的離散程度。標(biāo)準(zhǔn)差表示的是原總體中原始數(shù)據(jù)與原總體平均數(shù)的關(guān)系標(biāo)準(zhǔn)差表示的是原總體中原始數(shù)據(jù)與原總體平均數(shù)的關(guān)系標(biāo)準(zhǔn)誤表示的是從原總體中抽取的樣本平均數(shù)與樣本平均數(shù)抽樣總體平標(biāo)準(zhǔn)誤表示的是從原總體中抽取的樣本平均數(shù)與樣本平均數(shù)抽樣總體平均數(shù)的關(guān)系均數(shù)的關(guān)系研究總體與樣本的關(guān)系就轉(zhuǎn)化成了討論原總體與樣本平均數(shù)抽樣總體的關(guān)系：xnx例6：設(shè)有一總體，總體容量為N

35、=3，觀測(cè)值分別為2、4、6，以樣本容量n=2對(duì)該總體進(jìn)行復(fù)置抽樣，證明：（1）x（2）nx第49頁(yè)/共100頁(yè)原總體的總體平均數(shù)為：原總體的總體平均數(shù)為：4364223（1）以樣本容量以樣本容量n = 2對(duì)該總體進(jìn)行復(fù)置對(duì)該總體進(jìn)行復(fù)置抽樣，則樣本平均數(shù)抽樣總體為：抽樣，則樣本平均數(shù)抽樣總體為：樣本平均數(shù)抽樣總體的總體容量樣本平均數(shù)抽樣總體的總體容量為：為： nN49369632x樣本平均數(shù)抽樣總體的總體平均樣本平均數(shù)抽樣總體的總體平均數(shù)為：數(shù)為： 9第50頁(yè)/共100頁(yè)（2）原總體的總體標(biāo)準(zhǔn)差為：原總體的總體標(biāo)準(zhǔn)差為：NxNx2)(23485638NxxNx2)(2樣本平均數(shù)抽樣總體的

36、總體標(biāo)準(zhǔn)差為：樣本平均數(shù)抽樣總體的總體標(biāo)準(zhǔn)差為： 99)36(156234238n第51頁(yè)/共100頁(yè)2.2 樣本平均數(shù)抽樣分布的特點(diǎn)樣本平均數(shù)抽樣分布的特點(diǎn)（1）樣本平均數(shù)抽樣總體的總體平均數(shù)與原總體的總體平均數(shù)相等，）樣本平均數(shù)抽樣總體的總體平均數(shù)與原總體的總體平均數(shù)相等，因此，可用因此，可用代替代替x（2）樣本平均數(shù)抽樣總體的方差與原總體的方差的關(guān)系為）樣本平均數(shù)抽樣總體的方差與原總體的方差的關(guān)系為 nx22（3）當(dāng)隨機(jī)變量）當(dāng)隨機(jī)變量xN（,2）時(shí)，樣本平均數(shù)時(shí)，樣本平均數(shù) n2當(dāng)隨機(jī)變量當(dāng)隨機(jī)變量x不呈正態(tài)分布或分布未知時(shí)，只要樣本容量不呈正態(tài)分布或分布未知時(shí)，只要樣本容量n不斷增大

37、（或不斷增大（或足夠大），則樣本平均數(shù)的分布逐漸趨向于正態(tài)分布，且平均數(shù)為足夠大），則樣本平均數(shù)的分布逐漸趨向于正態(tài)分布，且平均數(shù)為，方差方差為為中心極限定理中心極限定理),(2nNx樣本平均值樣本平均值服從或近似服從正態(tài)分服從或近似服從正態(tài)分布布第52頁(yè)/共100頁(yè)2.3 與與的關(guān)系的關(guān)系xnx（1）（2）表示原總體中各觀測(cè)值的離散程度表示原總體中各觀測(cè)值的離散程度 x表示樣本平均數(shù)抽樣總體中各樣本平均數(shù)的離散程度表示樣本平均數(shù)抽樣總體中各樣本平均數(shù)的離散程度（3）是總體中各觀測(cè)值變異程度的度量值是總體中各觀測(cè)值變異程度的度量值是樣本平均數(shù)抽樣誤差的度量值是樣本平均數(shù)抽樣誤差的度量值

38、是用來(lái)衡量樣本平均數(shù)代表總體平均數(shù)的代表程度的是用來(lái)衡量樣本平均數(shù)代表總體平均數(shù)的代表程度的x（4）稱為標(biāo)準(zhǔn)差，用稱為標(biāo)準(zhǔn)差，用Sd表示表示稱為標(biāo)準(zhǔn)誤，用稱為標(biāo)準(zhǔn)誤，用Se表示表示 x第53頁(yè)/共100頁(yè)3. 標(biāo)準(zhǔn)誤的作用標(biāo)準(zhǔn)誤的作用（1）衡量樣本平均數(shù)間的變異程度）衡量樣本平均數(shù)間的變異程度（2）推斷總體平均數(shù)的可能范圍）推斷總體平均數(shù)的可能范圍標(biāo)準(zhǔn)誤大，說(shuō)明樣本平均數(shù)間的變異程度大標(biāo)準(zhǔn)誤大，說(shuō)明樣本平均數(shù)間的變異程度大標(biāo)準(zhǔn)誤大，用樣本平均數(shù)來(lái)估計(jì)總體平均數(shù)的效果差，樣本平均數(shù)的代表性弱標(biāo)準(zhǔn)誤大，用樣本平均數(shù)來(lái)估計(jì)總體平均數(shù)的效果差，樣本平均數(shù)的代表性弱在通常情況下，可以用樣本標(biāo)準(zhǔn)誤

39、來(lái)估計(jì)在通常情況下，可以用樣本標(biāo)準(zhǔn)誤來(lái)估計(jì)抽抽樣總體標(biāo)準(zhǔn)誤樣總體標(biāo)準(zhǔn)誤nSSx22nSSx 可用樣本平均數(shù)標(biāo)準(zhǔn)誤來(lái)估計(jì)總體平均數(shù)可用樣本平均數(shù)標(biāo)準(zhǔn)誤來(lái)估計(jì)總體平均數(shù)的可能范圍的可能范圍Sx xSx 表示原始數(shù)據(jù)的變異程度的表示原始數(shù)據(jù)的變異程度的是用樣本平均數(shù)來(lái)估計(jì)總體平均數(shù)的可能范圍是用樣本平均數(shù)來(lái)估計(jì)總體平均數(shù)的可能范圍（3）第54頁(yè)/共100頁(yè)4. t-分布分布4.1 t-分布的定義分布的定義設(shè)有服從正態(tài)分布的隨機(jī)變量設(shè)有服從正態(tài)分布的隨機(jī)變量x，正態(tài)分布的標(biāo)準(zhǔn)化公式為：正態(tài)分布的標(biāo)準(zhǔn)化公式為：xu 對(duì)于總體方差對(duì)于總體方差2已知的總體，已知的總體，根據(jù)公式可以計(jì)算出隨機(jī)變量根據(jù)公式可

40、以計(jì)算出隨機(jī)變量x在某一區(qū)在某一區(qū)間內(nèi)出現(xiàn)的概率：間內(nèi)出現(xiàn)的概率： uxu對(duì)于總體方差對(duì)于總體方差2已知的總體，根據(jù)公式可以知道已知的總體，根據(jù)公式可以知道在某一區(qū)間在某一區(qū)間內(nèi)出現(xiàn)的概率，公式為：內(nèi)出現(xiàn)的概率，公式為： xxuxxuxu服從標(biāo)準(zhǔn)正態(tài)分服從標(biāo)準(zhǔn)正態(tài)分布布nx附：附：服從標(biāo)準(zhǔn)正態(tài)分服從標(biāo)準(zhǔn)正態(tài)分布布xu第55頁(yè)/共100頁(yè)假如假如2未知，而且樣本容量又比較?。ㄎ粗覙颖救萘坑直容^?。╪30）時(shí)：時(shí)： 2S2xSx標(biāo)準(zhǔn)化公式可變換為：標(biāo)準(zhǔn)化公式可變換為：xSxtt統(tǒng)計(jì)量組成的分布，就稱為統(tǒng)計(jì)量組成的分布，就稱為t分布（分布（t distribution）不再服從標(biāo)準(zhǔn)正態(tài)分布不

41、再服從標(biāo)準(zhǔn)正態(tài)分布)(dfttt分布是一組曲線，自由度不同，曲線不同，但均以分布是一組曲線，自由度不同，曲線不同，但均以y軸為對(duì)稱軸為對(duì)稱 t分布只有一個(gè)參數(shù)，即自由度分布只有一個(gè)參數(shù)，即自由度 dft分布的平均數(shù)和標(biāo)準(zhǔn)差為：分布的平均數(shù)和標(biāo)準(zhǔn)差為： 0 （df 1） )2/(dfdft（df 2）服從服從t-分布分布nSSx第56頁(yè)/共100頁(yè)4.2 t-分布的特點(diǎn)分布的特點(diǎn)（1）t分布為對(duì)稱分布，關(guān)于分布為對(duì)稱分布，關(guān)于t = 0對(duì)稱；只有一個(gè)峰，峰值在對(duì)稱；只有一個(gè)峰，峰值在t = 0處；與標(biāo)準(zhǔn)正態(tài)分布曲線相比，處；與標(biāo)準(zhǔn)正態(tài)分布曲線相比，t分布曲線頂部略低，兩尾部稍高而平分布曲線頂部略

42、低，兩尾部稍高而平（2）t分布曲線受自由度分布曲線受自由度df 的影響，自由度越小，離散程度越大的影響，自由度越小，離散程度越大（3） t分布的極限是正態(tài)分布。分布的極限是正態(tài)分布。df越大，越大，t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布分布越趨近于標(biāo)準(zhǔn)正態(tài)分布當(dāng)當(dāng)n 30時(shí)，時(shí)，t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很?。环植寂c標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很?。籲 100時(shí)，時(shí)，t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同；分布基本與標(biāo)準(zhǔn)正態(tài)分布相同；n時(shí)，時(shí)，t 分布與標(biāo)準(zhǔn)正態(tài)分布完全一致分布與標(biāo)準(zhǔn)正態(tài)分布完全一致第57頁(yè)/共100頁(yè)4.3 t-分布的概率計(jì)算分布的概率計(jì)算附表附表4 4給出了給出了t t分布的兩尾臨界值分布的兩尾臨界值

43、當(dāng)左尾和右尾的概率之和為當(dāng)左尾和右尾的概率之和為（每（每側(cè)為側(cè)為 /2）時(shí)，）時(shí)，t分布在橫坐標(biāo)上分布在橫坐標(biāo)上的臨界值的絕對(duì)值，記為的臨界值的絕對(duì)值，記為t )()(ttPttP例7：根據(jù)附表4查出相應(yīng)的臨界 t值：（1）df =9，=0.05；（2）df =9，=0.01)9(05. 0t)9(01. 0t261. 2250. 3第58頁(yè)/共100頁(yè)從一個(gè)平均數(shù)為從一個(gè)平均數(shù)為，方差為方差為2的正態(tài)總體中，進(jìn)行獨(dú)立地抽樣，可獲得隨機(jī)變量的正態(tài)總體中，進(jìn)行獨(dú)立地抽樣，可獲得隨機(jī)變量x，則其標(biāo)準(zhǔn)離差：則其標(biāo)準(zhǔn)離差： xu N（0,1）如果連續(xù)進(jìn)行如果連續(xù)進(jìn)行n次獨(dú)立抽樣，可得次獨(dú)立抽樣

44、，可得n個(gè)標(biāo)準(zhǔn)正態(tài)離差個(gè)標(biāo)準(zhǔn)正態(tài)離差ui，對(duì)這對(duì)這n個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差ui進(jìn)行平方求和就得到一個(gè)新的統(tǒng)計(jì)量進(jìn)行平方求和就得到一個(gè)新的統(tǒng)計(jì)量2:2222212niuuuu22)(x5. 2-分布分布5.1 2-分布的定義分布的定義第59頁(yè)/共100頁(yè)222)(xx222) 1(Sn222)(x2)(xx如果用樣本進(jìn)行計(jì)算：如果用樣本進(jìn)行計(jì)算：2)(x由這些由這些2值所組成的一個(gè)分布，就稱之為值所組成的一個(gè)分布，就稱之為2分布（分布（2 distribution）2)(2df22) 1()(Snxx1)(22nxxS第60頁(yè)/共100頁(yè)5.2 2-分布的特點(diǎn)分布的特點(diǎn)（1）2

45、分布的取值范圍為分布的取值范圍為0，+），無(wú)負(fù)值），無(wú)負(fù)值（2）2分布的平均數(shù)為：分布的平均數(shù)為： df2方差為：方差為： dfx222（3）2分布的形狀決定于自由度分布的形狀決定于自由度df 當(dāng)當(dāng)df =1時(shí)，曲線呈反時(shí)，曲線呈反 J 形形隨著隨著df 的增大，曲線漸趨對(duì)稱的增大，曲線漸趨對(duì)稱當(dāng)當(dāng)df 30時(shí)，向正態(tài)分布漸近時(shí)，向正態(tài)分布漸近（4）2還可以定義為理論次數(shù)與觀察次數(shù)間的符合程度還可以定義為理論次數(shù)與觀察次數(shù)間的符合程度（離散型變量）（離散型變量）iiiEEO22)(O 觀察次數(shù) E 理論次數(shù) 第61頁(yè)/共100頁(yè)5.3 2-分布的概率計(jì)算分布的概率計(jì)算附表附表3 3給出

46、了給出了2 2分布的右尾臨界值分布的右尾臨界值當(dāng)右尾概率為當(dāng)右尾概率為時(shí)，時(shí)，2分布在橫坐標(biāo)分布在橫坐標(biāo)上的臨界值的絕對(duì)值，記為上的臨界值的絕對(duì)值，記為2)(22P例8：根據(jù)附表3查出相應(yīng)的右尾臨界2值：（1）df =9，=0.05；（2）df =9，=0.012)9(05. 02)9(01. 0919.16666.21如果計(jì)算左尾概率為如果計(jì)算左尾概率為時(shí)時(shí) 2分布分布的臨界值，只需查右尾概率為的臨界值，只需查右尾概率為1- 的右尾臨界值即可。的右尾臨界值即可。第62頁(yè)/共100頁(yè)6. F-分布分布6.1 F-分布的定義分布的定義從一個(gè)方差從一個(gè)方差2的正態(tài)總體中獨(dú)立地抽取樣本容量

47、分別為的正態(tài)總體中獨(dú)立地抽取樣本容量分別為n1、n2的兩個(gè)樣本，的兩個(gè)樣本，這兩個(gè)樣本的方差分別為：這兩個(gè)樣本的方差分別為：21S22S221121) 1(Sn 則有：則有：222222) 1(Sn 這兩個(gè)這兩個(gè)2變量除以各自的自由度后的比值為：變量除以各自的自由度后的比值為：) 1() 1(222121nn2222221211) 1() 1() 1() 1(nSnnSn2221SSF由一系列由一系列F值所構(gòu)成的分布稱為值所構(gòu)成的分布稱為F分布（分布（F distribution） F F（df1,df2） 222) 1(Sn已計(jì)算已計(jì)算：第63頁(yè)/共100頁(yè)6.2 F-分布的特點(diǎn)分布的特點(diǎn)（

48、1）F分布密度曲線是隨自由度分布密度曲線是隨自由度df1、df2的變化而變化的一簇偏態(tài)曲線的變化而變化的一簇偏態(tài)曲線其形狀隨著其形狀隨著df1、df2的增大逐漸趨于對(duì)稱；的增大逐漸趨于對(duì)稱；（2）F分布的取值范圍是（分布的取值范圍是（0，+），其平均數(shù)：），其平均數(shù)：1F第64頁(yè)/共100頁(yè)6.3 F-分布的概率計(jì)算分布的概率計(jì)算附表附表5 5給出了給出了F F分布的右尾臨界值分布的右尾臨界值當(dāng)右尾概率為當(dāng)右尾概率為時(shí)，時(shí)，2分布在橫坐分布在橫坐標(biāo)上的臨界值的絕對(duì)值，記為標(biāo)上的臨界值的絕對(duì)值，記為F )(FFP例9：根據(jù)附表5查出相應(yīng)的右尾臨界F值：（1）df1 =4， df2 =2

49、0，=0.05；（2） df1 =4， df2 =20，=0.01F0.01（4，20） = 4.43 F0.05（4，20） = 2.87 第65頁(yè)/共100頁(yè)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)參數(shù)估計(jì)參數(shù)估計(jì)統(tǒng)計(jì)學(xué)第66頁(yè)/共100頁(yè)描述統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)第67頁(yè)/共100頁(yè)第68頁(yè)/共100頁(yè)假設(shè)你正在研究平均一個(gè)美國(guó)人一生中要得到多少交通罰單，報(bào)告研究結(jié)果的方法有假設(shè)你正在研究平均一個(gè)美國(guó)人一生中要得到多少交通罰單，報(bào)告研究結(jié)果的方法有以下兩種：以下兩種：“10”或者或者“8到到12之間之間”一、參數(shù)估計(jì)一、參數(shù)估計(jì)第69頁(yè)/共100頁(yè)Gudmund R. Iv

50、ersen第70頁(yè)/共100頁(yè)X22211)(nXXiSn第71頁(yè)/共100頁(yè)2、區(qū)間估計(jì)、區(qū)間估計(jì)1.在點(diǎn)估計(jì)的基礎(chǔ)上，給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍區(qū)間范圍，該區(qū)間由樣本統(tǒng)計(jì)量加減抽樣誤差而得到的2.根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量n比如，某班級(jí)平均分?jǐn)?shù)在7585之間，置信水平是95% 第72頁(yè)/共100頁(yè)第73頁(yè)/共100頁(yè)第74頁(yè)/共100頁(yè)1)(tsxtPx第75頁(yè)/共100頁(yè)第76頁(yè)/共100頁(yè)影響區(qū)間寬度的因素影響區(qū)間寬度的因素1.總體數(shù)據(jù)的離散程度，總體數(shù)據(jù)的離散程度，用用來(lái)測(cè)度來(lái)測(cè)度2. 樣本容量，樣本容量，3. 置信水平置信水平

51、 (1 - )，影響，影響的大小的大小第77頁(yè)/共100頁(yè)統(tǒng)計(jì)假設(shè)檢驗(yàn)又稱為顯著性檢驗(yàn)，是生物統(tǒng)計(jì)學(xué)的核心內(nèi)容，是統(tǒng)計(jì)推斷的主要組成部分統(tǒng)計(jì)推斷（statistical inference）就是通過(guò)樣本特征（統(tǒng)計(jì)量）來(lái)推斷相應(yīng)總體特征（參數(shù)）的方法n 參數(shù)估計(jì)（參數(shù)估計(jì)（parametric estimate）通過(guò)樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法通過(guò)樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法點(diǎn)估計(jì)（點(diǎn)估計(jì)（point estimate）區(qū)間估計(jì)（區(qū)間估計(jì)（interval estimate）直接用樣本統(tǒng)計(jì)量的數(shù)值估計(jì)出相應(yīng)總體參數(shù)具體值的方法直接用樣本統(tǒng)計(jì)量的數(shù)值估計(jì)出相應(yīng)總體參數(shù)具體值的方法在一定的概

52、率保證下（一般為在一定的概率保證下（一般為95%或或99%），根據(jù)樣本統(tǒng)計(jì)量的分布，計(jì)），根據(jù)樣本統(tǒng)計(jì)量的分布，計(jì)算出總體參數(shù)出現(xiàn)的數(shù)值范圍或區(qū)間，用該區(qū)間來(lái)估計(jì)總體參數(shù)的方法算出總體參數(shù)出現(xiàn)的數(shù)值范圍或區(qū)間，用該區(qū)間來(lái)估計(jì)總體參數(shù)的方法參數(shù)估計(jì)是對(duì)總體參數(shù)的參數(shù)估計(jì)是對(duì)總體參數(shù)的定量分析定量分析二、假設(shè)檢驗(yàn)二、假設(shè)檢驗(yàn)第78頁(yè)/共100頁(yè)n 統(tǒng)計(jì)假設(shè)檢驗(yàn)（統(tǒng)計(jì)假設(shè)檢驗(yàn)（hypothesis test）根據(jù)某種實(shí)際需要，對(duì)未知的或不完全知道的總體參數(shù)提出一些假設(shè)，根據(jù)某種實(shí)際需要，對(duì)未知的或不完全知道的總體參數(shù)提出一些假設(shè)，然后根據(jù)樣本觀測(cè)值和統(tǒng)計(jì)量的分布，通過(guò)一定的計(jì)算，再作出在一定然

53、后根據(jù)樣本觀測(cè)值和統(tǒng)計(jì)量的分布，通過(guò)一定的計(jì)算，再作出在一定概率意義上應(yīng)當(dāng)接受哪種假設(shè)的方法。概率意義上應(yīng)當(dāng)接受哪種假設(shè)的方法。統(tǒng)計(jì)假設(shè)檢驗(yàn)的假設(shè)是對(duì)總體提出的，由于最后檢驗(yàn)的結(jié)論只有兩種：統(tǒng)計(jì)假設(shè)檢驗(yàn)的假設(shè)是對(duì)總體提出的，由于最后檢驗(yàn)的結(jié)論只有兩種：要比較的總體參數(shù)間要么存在顯著差異，要么不存在顯著差異要比較的總體參數(shù)間要么存在顯著差異，要么不存在顯著差異統(tǒng)計(jì)假設(shè)檢驗(yàn)是對(duì)總體參數(shù)的統(tǒng)計(jì)假設(shè)檢驗(yàn)是對(duì)總體參數(shù)的定性分析定性分析 1. 統(tǒng)計(jì)假設(shè)檢驗(yàn)的意義統(tǒng)計(jì)假設(shè)檢驗(yàn)的意義以兩個(gè)平均數(shù)之間差異的顯著性檢驗(yàn)以兩個(gè)平均數(shù)之間差異的顯著性檢驗(yàn) t-檢驗(yàn)為例檢驗(yàn)為例現(xiàn)隨機(jī)挑選10名中國(guó)女性和10名韓國(guó)

54、女性，請(qǐng)世界網(wǎng)絡(luò)知名度大賽評(píng)委和觀眾進(jìn)行知名度評(píng)分，試比較哪個(gè)國(guó)家女性知名度更高？第79頁(yè)/共100頁(yè)9.999.859.999.959.989.979.959.95中國(guó)女性的平均得分9.98韓國(guó)女性的平均得分9.91第80頁(yè)/共100頁(yè)兩個(gè)國(guó)家女性的平均得分并不相等，其差值（表面效應(yīng)）為：兩個(gè)國(guó)家女性的平均得分并不相等，其差值（表面效應(yīng)）為： 07. 091. 998. 921 xx根據(jù)兩個(gè)樣本平均數(shù)的差值根據(jù)兩個(gè)樣本平均數(shù)的差值0.07，是否可以給兩個(gè)樣本所在總體的總體平，是否可以給兩個(gè)樣本所在總體的總體平均數(shù)下這樣的結(jié)論：均數(shù)下這樣的結(jié)論：中國(guó)女性總體的平均得分高于韓國(guó)女性總體的平均得分

55、中國(guó)女性比韓國(guó)女性知名度更高如果從經(jīng)典數(shù)學(xué)的角度來(lái)看，答案應(yīng)該是肯定如果從經(jīng)典數(shù)學(xué)的角度來(lái)看，答案應(yīng)該是肯定如果從生物統(tǒng)計(jì)學(xué)的角度來(lái)看，在未經(jīng)過(guò)統(tǒng)計(jì)假設(shè)檢驗(yàn)以前，只能如果從生物統(tǒng)計(jì)學(xué)的角度來(lái)看，在未經(jīng)過(guò)統(tǒng)計(jì)假設(shè)檢驗(yàn)以前，只能說(shuō)說(shuō)“不一定不一定” 事實(shí)上，僅僅憑借樣本平均數(shù)之差不等于事實(shí)上，僅僅憑借樣本平均數(shù)之差不等于0就得出其所屬的總體平均數(shù)不相就得出其所屬的總體平均數(shù)不相等是不可靠的等是不可靠的實(shí)際上，進(jìn)行試驗(yàn)研究的目的并不在于了解樣本的結(jié)果，而是要通過(guò)樣本實(shí)際上，進(jìn)行試驗(yàn)研究的目的并不在于了解樣本的結(jié)果，而是要通過(guò)樣本了解總體，通過(guò)樣本來(lái)推斷總體，從而對(duì)總體給出一個(gè)全面的結(jié)論了解總體

56、，通過(guò)樣本來(lái)推斷總體，從而對(duì)總體給出一個(gè)全面的結(jié)論第81頁(yè)/共100頁(yè)1x2x在統(tǒng)計(jì)學(xué)中，一般用樣本平均數(shù)在統(tǒng)計(jì)學(xué)中，一般用樣本平均數(shù) 、作為統(tǒng)計(jì)假設(shè)檢驗(yàn)的對(duì)象作為統(tǒng)計(jì)假設(shè)檢驗(yàn)的對(duì)象、以樣本平均數(shù)差數(shù)的大小來(lái)對(duì)樣本所在的總體平均數(shù)以樣本平均數(shù)差數(shù)的大小來(lái)對(duì)樣本所在的總體平均數(shù)1與與2是否相同作出是否相同作出統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷以樣本平均數(shù)作為檢驗(yàn)對(duì)象的依據(jù)：離均差平方和為最小，說(shuō)明樣本平均數(shù)與樣本中各個(gè)觀測(cè)值之間相差離均差平方和為最小，說(shuō)明樣本平均數(shù)與樣本中各個(gè)觀測(cè)值之間相差最小，因此，平均數(shù)是一個(gè)樣本資料的最好代表值最小，因此，平均數(shù)是一個(gè)樣本資料的最好代表值樣本平均數(shù)是總體平均數(shù)的

57、無(wú)偏估計(jì)值樣本平均數(shù)是總體平均數(shù)的無(wú)偏估計(jì)值根據(jù)中心極限定理，樣本平均數(shù)服從或逼近正態(tài)分布根據(jù)中心極限定理，樣本平均數(shù)服從或逼近正態(tài)分布實(shí)際上，每個(gè)觀測(cè)值（數(shù)據(jù)）都只是試驗(yàn)的表面效應(yīng)，而表面效應(yīng)一般由兩部分組成：試驗(yàn)的處理效應(yīng)試驗(yàn)的處理效應(yīng) 試驗(yàn)的隨機(jī)誤差試驗(yàn)的隨機(jī)誤差第82頁(yè)/共100頁(yè)樣本中每一觀測(cè)值樣本中每一觀測(cè)值xi也可以被分解成兩部分：也可以被分解成兩部分：處理效應(yīng)：處理效應(yīng)：用總體平均數(shù)用總體平均數(shù)表示表示誤差效應(yīng)：誤差效應(yīng)：用隨機(jī)誤差用隨機(jī)誤差表示表示 iix)(1111nininxnx樣本平均數(shù)為：樣本平均數(shù)為： nin11總體平總體平均數(shù)均數(shù)樣本平均數(shù)的差數(shù)也可

58、分解成樣本平均數(shù)的差數(shù)也可分解成2部分：部分：誤差平誤差平均數(shù)均數(shù))()(221121 xx)()(2121表面表面效應(yīng)效應(yīng)處理處理效應(yīng)效應(yīng)抽樣抽樣誤差誤差第83頁(yè)/共100頁(yè)第84頁(yè)/共100頁(yè)2. 統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本思想與步驟統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本思想與步驟首先根據(jù)具體試驗(yàn)?zāi)康奶岢鲆粋€(gè)假設(shè) 然后在假定該假設(shè)成立（或正確）的前提下進(jìn)行試驗(yàn)，并取得數(shù)據(jù)，接著對(duì)這些資料進(jìn)行統(tǒng)計(jì)分析，獲得該假設(shè)成立的概率最后根據(jù)所獲得的概率值的大小來(lái)判斷假設(shè)是否成立如果所得概率較大，就表明我們沒(méi)有足夠的理由來(lái)否定所作假設(shè)，即必須接受這一假設(shè) 如果所得概率較小，就表明這一假設(shè)不大可能成立，應(yīng)予否定，從而接受其對(duì)立

59、假設(shè) 統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本步驟第85頁(yè)/共100頁(yè)例3-3：通過(guò)以往的大規(guī)模調(diào)查，已知某地成年黑白花奶牛血液中的白細(xì)胞數(shù)為52.3，標(biāo)準(zhǔn)差為5.38，現(xiàn)測(cè)得10頭黑白花牛白細(xì)胞數(shù)分別為53.6，55.3，46.4，57.2，46.0，43.2，48.1，51.1，49.9，44.5； =49.53。試問(wèn)這批黑白花奶牛是否來(lái)自于某地黑白花奶牛總體？x（1）對(duì)所研究的總體提出假設(shè)對(duì)所研究的總體提出假設(shè)研究某一隨機(jī)樣本所在的總體（用研究某一隨機(jī)樣本所在的總體（用表示）和一已知總體（用表示）和一已知總體（用0表示）是表示）是否為同一總體，也就是研究這一隨機(jī)樣本是否來(lái)自于已知總體否為同一總體，也就是研究這

60、一隨機(jī)樣本是否來(lái)自于已知總體假設(shè)：假設(shè)：兩個(gè)總體為同一個(gè)總體（即兩個(gè)總體的總體平均數(shù)相等）兩個(gè)總體為同一個(gè)總體（即兩個(gè)總體的總體平均數(shù)相等）無(wú)效假設(shè)（無(wú)效假設(shè)（null hypothesis）用用H0表示表示即即H0：=0 無(wú)效假設(shè)的含義：無(wú)效假設(shè)就是假設(shè)兩總體的平均數(shù)相等，即H0：3 .52053.49x3.520假設(shè)樣本平均數(shù) 與已知總體平均數(shù) 77. 20 x由抽樣誤差引起的，并不是兩總體之間的真實(shí)差異兩總體之間的差異是由抽樣誤差所引起的第86頁(yè)/共100頁(yè)為了在無(wú)效假設(shè)被否定后有可以被接受的假設(shè)，因此應(yīng)在設(shè)立無(wú)效假設(shè)的同為了在無(wú)效假設(shè)被否定后有可以被接受的假設(shè)，因此應(yīng)在設(shè)立無(wú)

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

抽樣分布與統(tǒng)計(jì)推斷原理PPT學(xué)習(xí)教案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

抽樣分布與統(tǒng)計(jì)推斷原理PPT學(xué)習(xí)教案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔