版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、會(huì)計(jì)學(xué)1抽樣分布與統(tǒng)計(jì)推斷原理抽樣分布與統(tǒng)計(jì)推斷原理一一 概率概率(一)概率的統(tǒng)計(jì)定義(一)概率的統(tǒng)計(jì)定義 研究隨機(jī)試驗(yàn),僅知道可能發(fā)生哪些隨研究隨機(jī)試驗(yàn),僅知道可能發(fā)生哪些隨機(jī)事件是不夠的,還需了解各種隨機(jī)事件發(fā)機(jī)事件是不夠的,還需了解各種隨機(jī)事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計(jì)規(guī)律性,從而指導(dǎo)實(shí)踐。這就要求有一統(tǒng)計(jì)規(guī)律性,從而指導(dǎo)實(shí)踐。這就要求有一個(gè)能夠個(gè)能夠刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo)刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo),這指標(biāo)應(yīng)該是事件本身所固有的,且不隨,這指標(biāo)應(yīng)該是事件本身所固有的,且不隨人的主觀意志而改變,人們?nèi)说闹饔^意志而改變,
2、人們稱之為概率稱之為概率(probability)。)。事件事件A的概率記為的概率記為P(A)。)。第1頁(yè)/共100頁(yè) 概率的統(tǒng)計(jì)定義概率的統(tǒng)計(jì)定義 在相同條件下進(jìn)行在相同條件下進(jìn)行n次重復(fù)試驗(yàn),如果隨機(jī)事件次重復(fù)試驗(yàn),如果隨機(jī)事件A發(fā)生的次數(shù)為發(fā)生的次數(shù)為m,那么那么m/n稱為隨機(jī)事件稱為隨機(jī)事件A的的頻率頻率(frequency););當(dāng)試驗(yàn)重復(fù)數(shù)當(dāng)試驗(yàn)重復(fù)數(shù)n逐漸增大時(shí),隨機(jī)事件逐漸增大時(shí),隨機(jī)事件A的頻率越來(lái)越穩(wěn)定地接近某一數(shù)值的頻率越來(lái)越穩(wěn)定地接近某一數(shù)值 p , 那么那么 就就 把把 p稱為隨機(jī)事件稱為隨機(jī)事件A的的概率概率。 這這 樣樣 定定 義義 的的 概概 率率 稱稱 為為
3、統(tǒng)統(tǒng) 計(jì)計(jì) 概概 率(率(statistics probability),),或者稱后驗(yàn)概率(或者稱后驗(yàn)概率(posterior probability)第2頁(yè)/共100頁(yè)表表3-1 拋擲一枚硬幣發(fā)生正面朝上的試驗(yàn)記錄拋擲一枚硬幣發(fā)生正面朝上的試驗(yàn)記錄 第3頁(yè)/共100頁(yè) 從表從表3-1可看出,隨著實(shí)驗(yàn)次數(shù)的增多,正面朝上這個(gè)事件發(fā)生的頻率越來(lái)越穩(wěn)定地接近可看出,隨著實(shí)驗(yàn)次數(shù)的增多,正面朝上這個(gè)事件發(fā)生的頻率越來(lái)越穩(wěn)定地接近0.5,我們就把,我們就把0.5作為這個(gè)事件的概率。作為這個(gè)事件的概率。 在一般情況下,隨機(jī)事件的概率在一般情況下,隨機(jī)事件的概率p是不可能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)是不可
4、能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)n充分大時(shí)隨機(jī)事件充分大時(shí)隨機(jī)事件A的頻率作為該隨機(jī)事件概率的近似值。的頻率作為該隨機(jī)事件概率的近似值。 即即 P(A)=pm/n (n充分大)充分大)第4頁(yè)/共100頁(yè)(二(二)概率的性質(zhì)概率的性質(zhì) 1、對(duì)于任何事件、對(duì)于任何事件A,有有0P(A)1; 2、必然事件的概率為必然事件的概率為1,即,即P()=1; 3、不可能事件的概率為不可能事件的概率為0,即,即P()=0。第5頁(yè)/共100頁(yè)一個(gè)總體是由一個(gè)隨機(jī)變量的所有可能取值來(lái)構(gòu)成的,而樣本只是這些所有可能取值的一部分一個(gè)總體是由一個(gè)隨機(jī)變量的所有可能取值來(lái)構(gòu)成的,而樣本只是這些所有可能取值的一部分 隨機(jī)變量中
5、某一個(gè)值出現(xiàn)的概率,只是隨機(jī)變量一個(gè)側(cè)面的反映,若要全面了解隨機(jī)變量則必須知道隨機(jī)變量中某一個(gè)值出現(xiàn)的概率,只是隨機(jī)變量一個(gè)側(cè)面的反映,若要全面了解隨機(jī)變量則必須知道隨機(jī)變量的全部值隨機(jī)變量的全部值和和各個(gè)值出現(xiàn)的概率各個(gè)值出現(xiàn)的概率,即隨機(jī)變量的概率分布,即隨機(jī)變量的概率分布 概率和概率分布是生命科學(xué)研究中由樣本推斷總體的理論基礎(chǔ)概率和概率分布是生命科學(xué)研究中由樣本推斷總體的理論基礎(chǔ) 隨機(jī)變量的種類很多,每一種隨機(jī)變量都有其特定的概率分布。隨機(jī)變量的種類很多,每一種隨機(jī)變量都有其特定的概率分布。 連續(xù)型隨機(jī)變量連續(xù)型隨機(jī)變量 離散型隨機(jī)變量離散型隨機(jī)變量 在一定范圍內(nèi)可連續(xù)取值的變量。在一定
6、范圍內(nèi)可連續(xù)取值的變量。在一定范圍內(nèi)只取有限種可能的值的變量。在一定范圍內(nèi)只取有限種可能的值的變量。正態(tài)分正態(tài)分布布 二項(xiàng)分布、泊松分布二項(xiàng)分布、泊松分布 二二 概率分布概率分布第6頁(yè)/共100頁(yè)1. 正態(tài)分布正態(tài)分布 正態(tài)分布(正態(tài)分布(normal distribution)的概念是由德國(guó)數(shù)學(xué)家和天文學(xué)家的概念是由德國(guó)數(shù)學(xué)家和天文學(xué)家Moivre于于1733年首次提出的,由德國(guó)數(shù)學(xué)家年首次提出的,由德國(guó)數(shù)學(xué)家Gauss率先將其應(yīng)用于天文學(xué)研究,故率先將其應(yīng)用于天文學(xué)研究,故正態(tài)分布又稱為正態(tài)分布又稱為Gauss分布(分布(Gaussian distribution)。)。許多生物學(xué)領(lǐng)域(許
7、多生物學(xué)領(lǐng)域(如身高、體重、脈搏、血紅蛋白、血清總膽固醇等如身高、體重、脈搏、血紅蛋白、血清總膽固醇等)的隨機(jī)變量都)的隨機(jī)變量都服從或者近似服從正態(tài)分布或通過(guò)某種轉(zhuǎn)換后服從正態(tài)分布,許多其他類型服從或者近似服從正態(tài)分布或通過(guò)某種轉(zhuǎn)換后服從正態(tài)分布,許多其他類型分布基本上都與正態(tài)分布有關(guān),它們的極限就是正態(tài)分布。分布基本上都與正態(tài)分布有關(guān),它們的極限就是正態(tài)分布。1.1 正態(tài)分布的定義正態(tài)分布的定義 在日常工作中所遇到的變量大多是連續(xù)型隨機(jī)變量,當(dāng)這一類隨機(jī)變量呈線在日常工作中所遇到的變量大多是連續(xù)型隨機(jī)變量,當(dāng)這一類隨機(jī)變量呈線性時(shí),往往服從正態(tài)分布性時(shí),往往服從正態(tài)分布 第7頁(yè)/共100頁(yè)
8、連續(xù)型隨機(jī)變量的概率分布第8頁(yè)/共100頁(yè)某地 13 歲女孩 118 人的身高(cm)資料頻數(shù)分布 身高組段 頻數(shù) 組中值 (1) (2) (3) 129 2 130.5 132 2 133.5 135 8 136.5 138 20 139.5 141 26 142.5 144 25 145.5 147 20 148.5 150 9 151.5 153 3 154.5 156 2 157.5 159162 1 160.5 合計(jì) 118 下面我們以某地13歲女孩118人的身高(cm)資料,來(lái)說(shuō)明身高變量服從正態(tài)分布。第9頁(yè)/共100頁(yè)身高(cm)160.5157.5154.5151.5148.5
9、145.5142.5139.5136.5133.5130.5 某地13歲女孩118人身高(cm)頻數(shù)分布圖頻數(shù)3020100第10頁(yè)/共100頁(yè)身高(cm) 某地13歲女孩118人身高(cm)頻數(shù)分布圖頻數(shù)20100第11頁(yè)/共100頁(yè)身高(cm) 某地13歲女孩118人身高(cm)頻數(shù)分布圖頻12頁(yè)/共100頁(yè)身高(cm) 頻數(shù)分布逐漸接近正態(tài)分布示意圖第13頁(yè)/共100頁(yè)和正態(tài)分布相對(duì)應(yīng)的曲線稱為正態(tài)分布密度曲線,簡(jiǎn)稱為正態(tài)曲線。和正態(tài)分布相對(duì)應(yīng)的曲線稱為正態(tài)分布密度曲線,簡(jiǎn)稱為正態(tài)曲線。 用來(lái)描述正態(tài)曲線的函數(shù)稱為正態(tài)分布密度函數(shù)用來(lái)描述正態(tài)曲線的函數(shù)稱為正態(tài)分
10、布密度函數(shù) 222)(21)(xexf 總體平均數(shù) 2 總體方差 圓周率3.14 總體標(biāo)準(zhǔn)差 任何一個(gè)正態(tài)分布均由參數(shù)任何一個(gè)正態(tài)分布均由參數(shù)和和所決定所決定如果一個(gè)隨機(jī)變量如果一個(gè)隨機(jī)變量x服從平均數(shù)為服從平均數(shù)為、方差為方差為2的正態(tài)分布,可記為的正態(tài)分布,可記為xN(,2)。)。e 自然對(duì)數(shù)的底,2.71828第14頁(yè)/共100頁(yè)1.2 正態(tài)分布的特點(diǎn)正態(tài)分布的特點(diǎn) (1)正態(tài)分布曲線以直線)正態(tài)分布曲線以直線x =為對(duì)稱軸,左右完全對(duì)稱為對(duì)稱軸,左右完全對(duì)稱(3)正態(tài)分布曲線有兩個(gè)拐點(diǎn),拐點(diǎn)座標(biāo)分別為(正態(tài)分布曲線有兩個(gè)拐點(diǎn),拐點(diǎn)座標(biāo)分別為(-,f(-)和(和(+,f(+),),在這兩
11、個(gè)拐點(diǎn)處曲線改變方向,即曲線在(在這兩個(gè)拐點(diǎn)處曲線改變方向,即曲線在(-,-)和(和(+,+) 區(qū)間上是下凹的,在區(qū)間上是下凹的,在-,+區(qū)間內(nèi)是上凸的區(qū)間內(nèi)是上凸的x(2)在在x =處,處,f(x)有最大值有最大值 21)(f第15頁(yè)/共100頁(yè)(4)正態(tài)分布密度曲線的位置由正態(tài)分布密度曲線的位置由決定(決定(為位置參數(shù)),形狀由為位置參數(shù)),形狀由決定(決定(為形狀參數(shù))為形狀參數(shù))(5)正態(tài)分布曲線向兩邊無(wú)限延伸,以正態(tài)分布曲線向兩邊無(wú)限延伸,以x軸為漸進(jìn)線,分布從軸為漸進(jìn)線,分布從-到到+ 的大小決定了曲線在的大小決定了曲線在x軸上的位置軸上的位置的大小則決定了曲線的胖瘦程度的大小則決
12、定了曲線的胖瘦程度當(dāng)當(dāng)恒定時(shí),恒定時(shí),愈大,則曲線沿愈大,則曲線沿x軸愈向軸愈向右移動(dòng)右移動(dòng)愈小,曲線沿愈小,曲線沿x軸愈向左移動(dòng)軸愈向左移動(dòng)越大表示數(shù)據(jù)越分散,曲線越胖越大表示數(shù)據(jù)越分散,曲線越胖越小表示數(shù)據(jù)越集中,曲線越瘦越小表示數(shù)據(jù)越集中,曲線越瘦第16頁(yè)/共100頁(yè)1.3 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布由正態(tài)分布由和和所決定,不同的所決定,不同的、值就決定了不同的正態(tài)值就決定了不同的正態(tài)分布密度函數(shù),因此在實(shí)際計(jì)算中很不方便的。需將一般的分布密度函數(shù),因此在實(shí)際計(jì)算中很不方便的。需將一般的N(,2 2 )轉(zhuǎn)換為轉(zhuǎn)換為=0, 2 2 =1的正態(tài)分布。我們稱的正態(tài)分布。我們稱=0, 2
13、2 =1的正態(tài)分的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布布為標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution) 可見,由正態(tài)分布密度函數(shù)得到標(biāo)準(zhǔn)正態(tài)分布密度函數(shù):222)(21)(xexf2221)(xexf第17頁(yè)/共100頁(yè)1.4 正態(tài)分布的概率計(jì)算正態(tài)分布的概率計(jì)算 根據(jù)概率論原理,可知隨機(jī)變量根據(jù)概率論原理,可知隨機(jī)變量x在區(qū)間(在區(qū)間(a,b)內(nèi)取值的概率是一塊面內(nèi)取值的概率是一塊面積:積: ax bx 面積面積由由0y曲線曲線 所圍成的曲邊梯形所組成:所圍成的曲邊梯形所組成: badxxfbxaP)()(隨機(jī)變量隨機(jī)變量x在(在(-,+)間取值的概率為)間取值的概率為1 ,即
14、:,即:1)()(dxxfxP 求隨機(jī)變量x在某一區(qū)段內(nèi)取值的概率就轉(zhuǎn)化成了求由該區(qū)段與相應(yīng)曲線所圍成的曲邊梯形的面積。 第18頁(yè)/共100頁(yè)由于正態(tài)分布的概率密度函數(shù)比較復(fù)雜,積分的計(jì)算也比較麻煩,而這些由于正態(tài)分布的概率密度函數(shù)比較復(fù)雜,積分的計(jì)算也比較麻煩,而這些計(jì)算在動(dòng)物科學(xué)研究和生產(chǎn)實(shí)踐中又經(jīng)常會(huì)用到。計(jì)算在動(dòng)物科學(xué)研究和生產(chǎn)實(shí)踐中又經(jīng)常會(huì)用到。 最好的解決辦法:將正態(tài)分布最好的解決辦法:將正態(tài)分布轉(zhuǎn)化為轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,然后根據(jù)標(biāo)準(zhǔn)正態(tài)分標(biāo)準(zhǔn)正態(tài)分布,然后根據(jù)標(biāo)準(zhǔn)正態(tài)分布表(附表布表(附表1)直接查出概率值。)直接查出概率值。 (1) 標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算
15、 附表附表1列出了在標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量列出了在標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量u在區(qū)間在區(qū)間(,u內(nèi)取值的概率:內(nèi)取值的概率: uuudueduufuuP2221)()(第19頁(yè)/共100頁(yè)標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算通式標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算通式 第20頁(yè)/共100頁(yè)標(biāo)準(zhǔn)正態(tài)分布函數(shù)表標(biāo)準(zhǔn)正態(tài)分布函數(shù)表 第21頁(yè)/共100頁(yè)例例1:若u N(0,1),),求: )64. 0( uP)53. 1( uP)53. 012. 2(uP(1)(2)(3)解:解:(1))64. 0( uP)53. 012. 2(uP)53. 1( uP7389. 0(2))53. 1(1uP9370. 010630. 0(3))12
16、. 2()53. 0(uPuP)12. 2(1 )53. 0(1 uPuP)9830. 01 ()7109. 01 (0170. 02981. 02811. 0第22頁(yè)/共100頁(yè)關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:P(-1u1)=0.6826P(-2u2)=0.9545P(-3u3)=0.9973P(-1.96u1.96)=0.95P(-2.58u2.58)=0.99P(u1) u變量在上述區(qū)間以外取值的概率,變量在上述區(qū)間以外取值的概率, 即兩尾概率:即兩尾概率:= 1- P(-1u1) = 1-0.6826 = 0.3174 P(u2)=1-
17、P(-2u2)= 0.0455P(u3)= 1-0.9973 = 0.0027P(u1.96)= 1-0.95 = 0.05P(u2.58)= 1-0.99 = 0.01第23頁(yè)/共100頁(yè)(2) 正態(tài)分布的概率計(jì)算正態(tài)分布的概率計(jì)算 對(duì)于服從任意正態(tài)分布對(duì)于服從任意正態(tài)分布N(,2)的隨機(jī)變量,欲求其在某個(gè)區(qū)間的取值概率,需的隨機(jī)變量,欲求其在某個(gè)區(qū)間的取值概率,需先將它標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)分布先將它標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)分布N(0,1)的隨機(jī)變量,然后查表即可。的隨機(jī)變量,然后查表即可。第24頁(yè)/共100頁(yè)第25頁(yè)/共100頁(yè)第26頁(yè)/共100頁(yè)xu實(shí)質(zhì):實(shí)質(zhì):為了能使正態(tài)分布應(yīng)用起來(lái)更方便一些,可
18、以將為了能使正態(tài)分布應(yīng)用起來(lái)更方便一些,可以將x作一變換,令:作一變換,令:變換后的正態(tài)分布密度函數(shù)為:變換后的正態(tài)分布密度函數(shù)為:2221)(ueuf標(biāo)準(zhǔn)正態(tài)分布均具有標(biāo)準(zhǔn)正態(tài)分布均具有=0,2=1的特性的特性如果隨機(jī)變量如果隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布,可記為:服從標(biāo)準(zhǔn)正態(tài)分布,可記為:uN(0,1) u變換變換這個(gè)變換稱為標(biāo)準(zhǔn)化或這個(gè)變換稱為標(biāo)準(zhǔn)化或u變換變換, ,由于由于x是隨機(jī)變量,因此是隨機(jī)變量,因此u也是隨機(jī)變量,也是隨機(jī)變量,所得到的隨機(jī)變量所得到的隨機(jī)變量U也服從也服從正態(tài)分布,因此,由任意正態(tài)分布隨機(jī)變量標(biāo)準(zhǔn)化得到的隨機(jī)變量的標(biāo)準(zhǔn)正態(tài)分布常稱為正態(tài)分布,因此,由任意正態(tài)分布隨
19、機(jī)變量標(biāo)準(zhǔn)化得到的隨機(jī)變量的標(biāo)準(zhǔn)正態(tài)分布常稱為u分布。可分布??梢姡阂姡旱?7頁(yè)/共100頁(yè)數(shù)學(xué)期望與方差的運(yùn)算數(shù)學(xué)期望與方差的運(yùn)算 第28頁(yè)/共100頁(yè)第29頁(yè)/共100頁(yè)隨機(jī)變量的數(shù)學(xué)期望就是指它們的理論均數(shù),其統(tǒng)計(jì)學(xué)意義就是對(duì)隨機(jī)變量進(jìn)行長(zhǎng)期觀測(cè)所得數(shù)據(jù)的平均數(shù),因而,數(shù)學(xué)期望只對(duì)長(zhǎng)期或大量觀測(cè)值才有意義,對(duì)于個(gè)別觀測(cè)或試驗(yàn)無(wú)意義。第30頁(yè)/共100頁(yè)例2:設(shè) x N(30,102)試求x 40的概率。解:解: 首先將正態(tài)分布首先將正態(tài)分布 轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,令轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,令:)103040(uP)40( xP1030 xu則則u服從標(biāo)準(zhǔn)正態(tài)分布,故服從標(biāo)準(zhǔn)正態(tài)分布,故:) 1
20、( uP) 1(1uP8413. 011587. 0第31頁(yè)/共100頁(yè)例3:設(shè)x服從=30.26, =5.102的正態(tài)分布,試求P(21.64x32.98)。 解:解: 令令10.526.30 xu)10. 526.3098.3210. 526.3010. 526.3064.21()98.3264.21(xPxP第32頁(yè)/共100頁(yè)關(guān)于一般正態(tài)分布,經(jīng)常用到以下幾個(gè)概率:關(guān)于一般正態(tài)分布,經(jīng)常用到以下幾個(gè)概率:P(-x+)= 0.6826P(-2x+2) = 0.9545P(-3x+3) =0.9973P(-1.96x+1.96) = 0.95P(-2.58x+2.58) = 0.99把隨機(jī)
21、變量把隨機(jī)變量x落在平均數(shù)落在平均數(shù)加減不同加減不同倍數(shù)標(biāo)準(zhǔn)差倍數(shù)標(biāo)準(zhǔn)差區(qū)間之外的概率稱為區(qū)間之外的概率稱為兩尾概率(雙側(cè)概率),記作兩尾概率(雙側(cè)概率),記作。對(duì)應(yīng)于兩尾概率可以求得隨機(jī)變量對(duì)應(yīng)于兩尾概率可以求得隨機(jī)變量x小于小于-k或大于或大于+k的概率,稱的概率,稱為一尾概率(單側(cè)概率),記作為一尾概率(單側(cè)概率),記作2。0.3173 0.0455 0.0027 0.05 0.01 /2第33頁(yè)/共100頁(yè)附表2: 給出了滿足給出了滿足)uuP(兩尾臨界值兩尾臨界值u 因此,可以根據(jù)兩尾概率因此,可以根據(jù)兩尾概率,由附表由附表2查出相應(yīng)的臨界值查出相應(yīng)的臨界值u。 例4:已知 u N(
22、0,1),),試求u: 10. 0()()uuPuuP(1)(2)86. 0()uuuP解:解:(1)10. 0)()(uuPuuP644854. 110. 0u(2)()(uuPuuP)(uuuP114. 086. 01475791. 114. 0u第34頁(yè)/共100頁(yè)2. 二項(xiàng)分布二項(xiàng)分布 二項(xiàng)分布(二項(xiàng)分布(binomial distribution)是一種最常見的、典型的離散型隨機(jī)是一種最常見的、典型的離散型隨機(jī)變量的概率分布。變量的概率分布。有些試驗(yàn)只有非此即彼兩種結(jié)果,這種由非此即彼的事件構(gòu)成的總體,有些試驗(yàn)只有非此即彼兩種結(jié)果,這種由非此即彼的事件構(gòu)成的總體,稱為二項(xiàng)總體。稱為二
23、項(xiàng)總體。 結(jié)果結(jié)果“此此”用變量用變量1表示,表示, 概率為概率為 p 結(jié)果結(jié)果“彼彼”用變量用變量0表示,表示, 概率為概率為 q pxP ) 1(qxP )0(1qp對(duì)于n次獨(dú)立的試驗(yàn),如果每次試驗(yàn)結(jié)果出現(xiàn)且只出現(xiàn)對(duì)立事件A與A-中之一,在每次試驗(yàn)中出現(xiàn)A的概率是p(0p5,np、nq較接近時(shí),接近正態(tài)分布,較接近時(shí),接近正態(tài)分布,n時(shí)服從正態(tài)分布,即二項(xiàng)分布的極限是正態(tài)分布時(shí)服從正態(tài)分布,即二項(xiàng)分布的極限是正態(tài)分布 (5)二項(xiàng)分布的平均數(shù)為:)二項(xiàng)分布的平均數(shù)為: np npq2方差為:方差為:npq標(biāo)準(zhǔn)差為:第37頁(yè)/共100頁(yè)例4:某奶牛場(chǎng)情期受胎率為0.6,該場(chǎng)對(duì)30頭發(fā)情母牛配種
24、,使24頭母牛一次配種受胎的概率為多少?解:解:6 . 0p30n24m)24(30P6242430)4 . 0()6 . 0(C624)4 . 0()6 . 0()2430(2430!0115. 0%15. 1186 . 030 np2 . 74 . 06 . 0302 npq68. 22 . 7npq2.3 二項(xiàng)分布的概率計(jì)算二項(xiàng)分布的概率計(jì)算第38頁(yè)/共100頁(yè)課堂練習(xí):用某種常規(guī)藥物治療豬瘟的治愈率為0.7,對(duì)20頭患豬瘟的肥育豬進(jìn)行治療,問(wèn)20頭豬中16頭豬治愈的概率是多少? 解:解:7 . 0p20n16m)16(20P4161620) 3 . 0()7 . 0(C416) 3 .
25、 0()7 . 0()1620(1620!1295. 0%95.12147 . 020 np2 . 43 . 07 . 0202 npq05. 22 . 4npq第39頁(yè)/共100頁(yè)3. 泊松分布泊松分布 當(dāng)二項(xiàng)分布中的當(dāng)二項(xiàng)分布中的n,p0時(shí),二項(xiàng)分布趨向于一種新的分布時(shí),二項(xiàng)分布趨向于一種新的分布 泊松分布(普哇松分布)泊松分布(普哇松分布) (Poissons distribution)當(dāng)試驗(yàn)次數(shù)(或稱觀測(cè)次數(shù))很大,而某事件出現(xiàn)的概率很小,則離散型隨機(jī)變量當(dāng)試驗(yàn)次數(shù)(或稱觀測(cè)次數(shù))很大,而某事件出現(xiàn)的概率很小,則離散型隨機(jī)變量x服從于泊松分布。服從于泊松分布。 3.1 泊松分布的定義泊
26、松分布的定義 若隨機(jī)變量若隨機(jī)變量x(x = m)只取零和正整數(shù)值只取零和正整數(shù)值0,1,2,且其概率分布為:,且其概率分布為: )(mxPemm!0其中:其中: = np,是一個(gè)常量,且是一個(gè)常量,且 7182. 2e則稱則稱x服從參數(shù)為服從參數(shù)為的泊松分布,的泊松分布,記為記為x P() 第40頁(yè)/共100頁(yè)n 泊松分布主要是用來(lái)描述小概率事件發(fā)生的概率泊松分布主要是用來(lái)描述小概率事件發(fā)生的概率 單位空間中某些野單位空間中某些野生動(dòng)物數(shù)生動(dòng)物數(shù) 畜群中的畸形畜群中的畸形個(gè)體數(shù)個(gè)體數(shù) 畜群中某些遺傳性畜群中某些遺傳性疾病的患病數(shù)疾病的患病數(shù) n 泊松分布不是用來(lái)描述幾乎不可能發(fā)生的事件的概率
27、泊松分布不是用來(lái)描述幾乎不可能發(fā)生的事件的概率 山無(wú)棱,天地合山無(wú)棱,天地合南京六月飛雪南京六月飛雪第41頁(yè)/共100頁(yè)(1)泊松分布只有一個(gè)參數(shù))泊松分布只有一個(gè)參數(shù),= np。 3.2 泊松分布的特點(diǎn)泊松分布的特點(diǎn) 既是泊松分布的平均值既是泊松分布的平均值,又是方差又是方差2,即:即: 2(2)泊松分布的圖形決定于)泊松分布的圖形決定于,值愈小分布愈偏倚,隨著值愈小分布愈偏倚,隨著的增大,分布的增大,分布趨于對(duì)稱。趨于對(duì)稱。 當(dāng)當(dāng)=20時(shí)分布接近于正態(tài)分布;當(dāng)時(shí)分布接近于正態(tài)分布;當(dāng)=50時(shí),可以認(rèn)為泊松分布呈正態(tài)分時(shí),可以認(rèn)為泊松分布呈正態(tài)分布。布。 第42頁(yè)/共100頁(yè)3.3 泊松分布
28、的概率計(jì)算泊松分布的概率計(jì)算 例5:某大型豬場(chǎng)因某種疾病死亡的豬數(shù)呈泊松分布。已知該場(chǎng)平均每年因這種疾病死亡的豬數(shù)為9.5頭,問(wèn)2007年該場(chǎng)因這種疾病死亡的豬數(shù)為15頭的概率是多少?5 . 9解:解:根據(jù)泊松分布的性質(zhì)可知:根據(jù)泊松分布的性質(zhì)可知: 15m)15( xP5 . 915!155 . 9e0265. 02007年該場(chǎng)因這種疾病死亡的豬數(shù)為15頭的概率是2.65%。)(mxPemm!第43頁(yè)/共100頁(yè)第44頁(yè)/共100頁(yè)統(tǒng)計(jì)學(xué)的主要任務(wù)就是研究總體和樣本的關(guān)系:統(tǒng)計(jì)學(xué)的主要任務(wù)就是研究總體和樣本的關(guān)系: 從樣本到總體從樣本到總體 從總體到樣本從總體到樣本 目的就是通過(guò)樣本來(lái)推斷總
29、體。目的就是通過(guò)樣本來(lái)推斷總體。 目的就是研究樣本統(tǒng)計(jì)量的分布及其與原總體的關(guān)系目的就是研究樣本統(tǒng)計(jì)量的分布及其與原總體的關(guān)系從特殊到一般,從特殊到一般, 從一般到特殊,從一般到特殊, 統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷 抽樣分布抽樣分布 抽樣分布是統(tǒng)計(jì)推斷的基礎(chǔ),研究抽樣分布的目的就是為了更好地進(jìn)行統(tǒng)計(jì)推斷,并能正確地理解統(tǒng)計(jì)推斷的結(jié)論。 第45頁(yè)/共100頁(yè)1. 抽樣分布的概念抽樣分布的概念x樣本平均數(shù)樣本平均數(shù) 和樣本方差和樣本方差S2是描述樣本特征的兩個(gè)最重要的統(tǒng)計(jì)量是描述樣本特征的兩個(gè)最重要的統(tǒng)計(jì)量總體平均數(shù)總體平均數(shù)和總體方差和總體方差2是描述總體特征的兩個(gè)最重要的參數(shù)是描述總體特征的兩個(gè)最重要的參
30、數(shù) 因此,研究總體和樣本的關(guān)系,實(shí)際就是研究:因此,研究總體和樣本的關(guān)系,實(shí)際就是研究: xS2 2 就總體而言,就總體而言,和和2都是常量都是常量 從總體中隨機(jī)地抽取若干個(gè)體所組成的樣本,即使每次抽取的樣本容量都相等,從總體中隨機(jī)地抽取若干個(gè)體所組成的樣本,即使每次抽取的樣本容量都相等,每一個(gè)樣本所得到的樣本平均數(shù)每一個(gè)樣本所得到的樣本平均數(shù)也不可能都相等,同時(shí)也不可能就等于總體平均也不可能都相等,同時(shí)也不可能就等于總體平均數(shù)數(shù) 樣本統(tǒng)計(jì)量將隨樣本的不同而有所不同,因而樣本統(tǒng)計(jì)量也是隨機(jī)變量,也有其概率分布 樣本統(tǒng)計(jì)量的概率分布稱為抽樣分布(樣本統(tǒng)計(jì)量的概率分布稱為抽樣分布(sampling
31、 distribution) 樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱為抽樣誤差樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱為抽樣誤差 (sampling error) 第46頁(yè)/共100頁(yè)從總體中抽取樣本的過(guò)程稱為抽樣(從總體中抽取樣本的過(guò)程稱為抽樣(sampling) 抽樣分為復(fù)置抽樣和不復(fù)置抽樣兩種:抽樣分為復(fù)置抽樣和不復(fù)置抽樣兩種: 復(fù)置抽樣指每次抽出一個(gè)個(gè)體后,這個(gè)個(gè)體應(yīng)返回原總體復(fù)置抽樣指每次抽出一個(gè)個(gè)體后,這個(gè)個(gè)體應(yīng)返回原總體 不復(fù)置抽樣指每次抽出的個(gè)體不返回原總體不復(fù)置抽樣指每次抽出的個(gè)體不返回原總體 對(duì)于無(wú)限總體,或者樣本容量對(duì)于無(wú)限總體,或者樣本容量n與總體容量與總體容量N相比很小時(shí),返回與否
32、相比很小時(shí),返回與否都可保證每個(gè)個(gè)體被抽到的機(jī)會(huì)相等,復(fù)置抽樣等同于不復(fù)置抽樣都可保證每個(gè)個(gè)體被抽到的機(jī)會(huì)相等,復(fù)置抽樣等同于不復(fù)置抽樣 對(duì)于有限總體,應(yīng)該采取復(fù)置抽樣,否則各個(gè)體被抽到的機(jī)會(huì)就不相對(duì)于有限總體,應(yīng)該采取復(fù)置抽樣,否則各個(gè)體被抽到的機(jī)會(huì)就不相等等在實(shí)際操作中,均為不復(fù)置抽樣在實(shí)際操作中,均為不復(fù)置抽樣 在理論研究中則以復(fù)置抽樣為主在理論研究中則以復(fù)置抽樣為主 第47頁(yè)/共100頁(yè)2. 樣本平均數(shù)的抽樣分布(樣本平均數(shù)的抽樣分布(p47)2.1 樣本平均數(shù)抽樣分布的概念樣本平均數(shù)抽樣分布的概念從總體容量為從總體容量為N的總體中進(jìn)行抽樣,如果每個(gè)樣本的樣本容量均為的總體中進(jìn)行抽樣,
33、如果每個(gè)樣本的樣本容量均為n,將所將所有這樣的樣本都抽出來(lái),并計(jì)算出每一個(gè)樣本的平均數(shù)有這樣的樣本都抽出來(lái),并計(jì)算出每一個(gè)樣本的平均數(shù)原來(lái)的那個(gè)總體,稱為原總體原來(lái)的那個(gè)總體,稱為原總體 由樣本平均數(shù)組成的分布稱為樣本平均數(shù)的抽樣分布由樣本平均數(shù)組成的分布稱為樣本平均數(shù)的抽樣分布 如果原總體的平均數(shù)為如果原總體的平均數(shù)為,標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為,那么樣本平均數(shù)抽樣總體:那么樣本平均數(shù)抽樣總體:平均數(shù)為:平均數(shù)為:標(biāo)準(zhǔn)差為:標(biāo)準(zhǔn)差為:xx稱為樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)誤差稱為樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)誤差 簡(jiǎn)稱為標(biāo)準(zhǔn)誤(簡(jiǎn)稱為標(biāo)準(zhǔn)誤(standard error) 由這些樣本平均數(shù)組成的新總體,就稱為樣本
34、平均數(shù)抽樣總體。由這些樣本平均數(shù)組成的新總體,就稱為樣本平均數(shù)抽樣總體。 第48頁(yè)/共100頁(yè)標(biāo)準(zhǔn)誤表示平均數(shù)抽樣誤差的大小,反映樣本平均數(shù)與新總體平均數(shù)之間標(biāo)準(zhǔn)誤表示平均數(shù)抽樣誤差的大小,反映樣本平均數(shù)與新總體平均數(shù)之間的離散程度。的離散程度。 標(biāo)準(zhǔn)差表示的是原總體中原始數(shù)據(jù)與原總體平均數(shù)的關(guān)系標(biāo)準(zhǔn)差表示的是原總體中原始數(shù)據(jù)與原總體平均數(shù)的關(guān)系 標(biāo)準(zhǔn)誤表示的是從原總體中抽取的樣本平均數(shù)與樣本平均數(shù)抽樣總體平標(biāo)準(zhǔn)誤表示的是從原總體中抽取的樣本平均數(shù)與樣本平均數(shù)抽樣總體平均數(shù)的關(guān)系均數(shù)的關(guān)系 研究總體與樣本的關(guān)系就轉(zhuǎn)化成了討論原總體與樣本平均數(shù)抽樣總體的關(guān)系:xnx例6:設(shè)有一總體,總體容量為N
35、=3,觀測(cè)值分別為2、4、6,以樣本容量n=2對(duì)該總體進(jìn)行復(fù)置抽樣,證明: (1)x(2)nx第49頁(yè)/共100頁(yè)原總體的總體平均數(shù)為:原總體的總體平均數(shù)為:4364223(1)以樣本容量以樣本容量n = 2對(duì)該總體進(jìn)行復(fù)置對(duì)該總體進(jìn)行復(fù)置抽樣,則樣本平均數(shù)抽樣總體為:抽樣,則樣本平均數(shù)抽樣總體為: 樣本平均數(shù)抽樣總體的總體容量樣本平均數(shù)抽樣總體的總體容量為:為: nN49369632x樣本平均數(shù)抽樣總體的總體平均樣本平均數(shù)抽樣總體的總體平均數(shù)為:數(shù)為: 9第50頁(yè)/共100頁(yè)(2)原總體的總體標(biāo)準(zhǔn)差為:原總體的總體標(biāo)準(zhǔn)差為:NxNx2)(23485638NxxNx2)(2樣本平均數(shù)抽樣總體的
36、總體標(biāo)準(zhǔn)差為:樣本平均數(shù)抽樣總體的總體標(biāo)準(zhǔn)差為: 99)36(156234238n第51頁(yè)/共100頁(yè)2.2 樣本平均數(shù)抽樣分布的特點(diǎn)樣本平均數(shù)抽樣分布的特點(diǎn)(1)樣本平均數(shù)抽樣總體的總體平均數(shù)與原總體的總體平均數(shù)相等,)樣本平均數(shù)抽樣總體的總體平均數(shù)與原總體的總體平均數(shù)相等,因此,可用因此,可用代替代替x(2)樣本平均數(shù)抽樣總體的方差與原總體的方差的關(guān)系為)樣本平均數(shù)抽樣總體的方差與原總體的方差的關(guān)系為 nx22(3)當(dāng)隨機(jī)變量)當(dāng)隨機(jī)變量xN(,2)時(shí),樣本平均數(shù)時(shí),樣本平均數(shù) n2當(dāng)隨機(jī)變量當(dāng)隨機(jī)變量x不呈正態(tài)分布或分布未知時(shí),只要樣本容量不呈正態(tài)分布或分布未知時(shí),只要樣本容量n不斷增大
37、(或不斷增大(或足夠大),則樣本平均數(shù)的分布逐漸趨向于正態(tài)分布,且平均數(shù)為足夠大),則樣本平均數(shù)的分布逐漸趨向于正態(tài)分布,且平均數(shù)為,方差方差為為中心極限定理中心極限定理),(2nNx樣本平均值樣本平均值 服從或近似服從正態(tài)分服從或近似服從正態(tài)分布布第52頁(yè)/共100頁(yè)2.3 與與 的關(guān)系的關(guān)系xnx(1) (2)表示原總體中各觀測(cè)值的離散程度表示原總體中各觀測(cè)值的離散程度 x表示樣本平均數(shù)抽樣總體中各樣本平均數(shù)的離散程度表示樣本平均數(shù)抽樣總體中各樣本平均數(shù)的離散程度(3)是總體中各觀測(cè)值變異程度的度量值是總體中各觀測(cè)值變異程度的度量值 是樣本平均數(shù)抽樣誤差的度量值是樣本平均數(shù)抽樣誤差的度量值
38、是用來(lái)衡量樣本平均數(shù)代表總體平均數(shù)的代表程度的是用來(lái)衡量樣本平均數(shù)代表總體平均數(shù)的代表程度的x(4)稱為標(biāo)準(zhǔn)差,用稱為標(biāo)準(zhǔn)差,用Sd表示表示 稱為標(biāo)準(zhǔn)誤,用稱為標(biāo)準(zhǔn)誤,用Se表示表示 x第53頁(yè)/共100頁(yè)3. 標(biāo)準(zhǔn)誤的作用標(biāo)準(zhǔn)誤的作用(1)衡量樣本平均數(shù)間的變異程度)衡量樣本平均數(shù)間的變異程度(2)推斷總體平均數(shù)的可能范圍)推斷總體平均數(shù)的可能范圍 標(biāo)準(zhǔn)誤大,說(shuō)明樣本平均數(shù)間的變異程度大標(biāo)準(zhǔn)誤大,說(shuō)明樣本平均數(shù)間的變異程度大 標(biāo)準(zhǔn)誤大,用樣本平均數(shù)來(lái)估計(jì)總體平均數(shù)的效果差,樣本平均數(shù)的代表性弱標(biāo)準(zhǔn)誤大,用樣本平均數(shù)來(lái)估計(jì)總體平均數(shù)的效果差,樣本平均數(shù)的代表性弱 在通常情況下,可以用樣本標(biāo)準(zhǔn)誤
39、來(lái)估計(jì)在通常情況下,可以用樣本標(biāo)準(zhǔn)誤來(lái)估計(jì)抽抽樣總體標(biāo)準(zhǔn)誤樣總體標(biāo)準(zhǔn)誤nSSx22nSSx 可用樣本平均數(shù)標(biāo)準(zhǔn)誤來(lái)估計(jì)總體平均數(shù)可用樣本平均數(shù)標(biāo)準(zhǔn)誤來(lái)估計(jì)總體平均數(shù)的可能范圍的可能范圍Sx xSx 表示原始數(shù)據(jù)的變異程度的表示原始數(shù)據(jù)的變異程度的 是用樣本平均數(shù)來(lái)估計(jì)總體平均數(shù)的可能范圍是用樣本平均數(shù)來(lái)估計(jì)總體平均數(shù)的可能范圍(3)第54頁(yè)/共100頁(yè)4. t-分布分布4.1 t-分布的定義分布的定義設(shè)有服從正態(tài)分布的隨機(jī)變量設(shè)有服從正態(tài)分布的隨機(jī)變量x,正態(tài)分布的標(biāo)準(zhǔn)化公式為:正態(tài)分布的標(biāo)準(zhǔn)化公式為:xu 對(duì)于總體方差對(duì)于總體方差2已知的總體,已知的總體,根據(jù)公式可以計(jì)算出隨機(jī)變量根據(jù)公式可
40、以計(jì)算出隨機(jī)變量x在某一區(qū)在某一區(qū)間內(nèi)出現(xiàn)的概率:間內(nèi)出現(xiàn)的概率: uxu對(duì)于總體方差對(duì)于總體方差2已知的總體,根據(jù)公式可以知道已知的總體,根據(jù)公式可以知道在某一區(qū)間在某一區(qū)間內(nèi)出現(xiàn)的概率,公式為:內(nèi)出現(xiàn)的概率,公式為: xxuxxuxu服從標(biāo)準(zhǔn)正態(tài)分服從標(biāo)準(zhǔn)正態(tài)分布布nx附:附:服從標(biāo)準(zhǔn)正態(tài)分服從標(biāo)準(zhǔn)正態(tài)分布布xu第55頁(yè)/共100頁(yè)假如假如2未知,而且樣本容量又比較?。ㄎ粗覙颖救萘坑直容^?。╪30)時(shí):時(shí): 2S2xSx標(biāo)準(zhǔn)化公式可變換為:標(biāo)準(zhǔn)化公式可變換為:xSxtt統(tǒng)計(jì)量組成的分布,就稱為統(tǒng)計(jì)量組成的分布,就稱為t分布(分布(t distribution) 不再服從標(biāo)準(zhǔn)正態(tài)分布不
41、再服從標(biāo)準(zhǔn)正態(tài)分布)(dfttt分布是一組曲線,自由度不同,曲線不同,但均以分布是一組曲線,自由度不同,曲線不同,但均以y軸為對(duì)稱軸為對(duì)稱 t分布只有一個(gè)參數(shù),即自由度分布只有一個(gè)參數(shù),即自由度 dft分布的平均數(shù)和標(biāo)準(zhǔn)差為:分布的平均數(shù)和標(biāo)準(zhǔn)差為: 0 (df 1) )2/(dfdft(df 2)服從服從t-分布分布nSSx第56頁(yè)/共100頁(yè)4.2 t-分布的特點(diǎn)分布的特點(diǎn)(1)t分布為對(duì)稱分布,關(guān)于分布為對(duì)稱分布,關(guān)于t = 0對(duì)稱;只有一個(gè)峰,峰值在對(duì)稱;只有一個(gè)峰,峰值在t = 0處;與標(biāo)準(zhǔn)正態(tài)分布曲線相比,處;與標(biāo)準(zhǔn)正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平分布曲線頂部略
42、低,兩尾部稍高而平 (2)t分布曲線受自由度分布曲線受自由度df 的影響,自由度越小,離散程度越大的影響,自由度越小,離散程度越大(3) t分布的極限是正態(tài)分布。分布的極限是正態(tài)分布。df越大,越大,t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布分布越趨近于標(biāo)準(zhǔn)正態(tài)分布 當(dāng)當(dāng)n 30時(shí),時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很?。环植寂c標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很?。籲 100時(shí),時(shí),t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;n時(shí),時(shí),t 分布與標(biāo)準(zhǔn)正態(tài)分布完全一致分布與標(biāo)準(zhǔn)正態(tài)分布完全一致第57頁(yè)/共100頁(yè)4.3 t-分布的概率計(jì)算分布的概率計(jì)算附表附表4 4給出了給出了t t分布的兩尾臨界值分布的兩尾臨界值
43、 當(dāng)左尾和右尾的概率之和為當(dāng)左尾和右尾的概率之和為 (每(每側(cè)為側(cè)為 /2)時(shí),)時(shí),t分布在橫坐標(biāo)上分布在橫坐標(biāo)上的臨界值的絕對(duì)值,記為的臨界值的絕對(duì)值,記為t )()(ttPttP例7:根據(jù)附表4查出相應(yīng)的臨界 t值 :(1)df =9,=0.05; (2)df =9,=0.01)9(05. 0t)9(01. 0t261. 2250. 3第58頁(yè)/共100頁(yè)從一個(gè)平均數(shù)為從一個(gè)平均數(shù)為,方差為方差為2的正態(tài)總體中,進(jìn)行獨(dú)立地抽樣,可獲得隨機(jī)變量的正態(tài)總體中,進(jìn)行獨(dú)立地抽樣,可獲得隨機(jī)變量x,則其標(biāo)準(zhǔn)離差:則其標(biāo)準(zhǔn)離差: xu N(0,1)如果連續(xù)進(jìn)行如果連續(xù)進(jìn)行n次獨(dú)立抽樣,可得次獨(dú)立抽樣
44、,可得n個(gè)標(biāo)準(zhǔn)正態(tài)離差個(gè)標(biāo)準(zhǔn)正態(tài)離差ui,對(duì)這對(duì)這n個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差ui進(jìn)行平方求和就得到一個(gè)新的統(tǒng)計(jì)量進(jìn)行平方求和就得到一個(gè)新的統(tǒng)計(jì)量2:2222212niuuuu22)(x5. 2-分布分布5.1 2-分布的定義分布的定義第59頁(yè)/共100頁(yè)222)(xx222) 1(Sn222)(x2)(xx如果用樣本進(jìn)行計(jì)算:如果用樣本進(jìn)行計(jì)算:2)(x由這些由這些2值所組成的一個(gè)分布,就稱之為值所組成的一個(gè)分布,就稱之為2分布(分布(2 distribution)2)(2df22) 1()(Snxx1)(22nxxS第60頁(yè)/共100頁(yè)5.2 2-分布的特點(diǎn)分布的特點(diǎn)(1)2
45、分布的取值范圍為分布的取值范圍為0,+),無(wú)負(fù)值),無(wú)負(fù)值(2)2分布的平均數(shù)為:分布的平均數(shù)為: df2方差為:方差為: dfx222(3)2分布的形狀決定于自由度分布的形狀決定于自由度df 當(dāng)當(dāng)df =1時(shí),曲線呈反時(shí),曲線呈反 J 形形 隨著隨著df 的增大,曲線漸趨對(duì)稱的增大,曲線漸趨對(duì)稱 當(dāng)當(dāng)df 30時(shí),向正態(tài)分布漸近時(shí),向正態(tài)分布漸近 (4)2還可以定義為理論次數(shù)與觀察次數(shù)間的符合程度還可以定義為理論次數(shù)與觀察次數(shù)間的符合程度 (離散型變量)(離散型變量)iiiEEO22)(O 觀察次數(shù) E 理論次數(shù) 第61頁(yè)/共100頁(yè)5.3 2-分布的概率計(jì)算分布的概率計(jì)算附表附表3 3給出
46、了給出了2 2分布的右尾臨界值分布的右尾臨界值 當(dāng)右尾概率為當(dāng)右尾概率為 時(shí),時(shí),2分布在橫坐標(biāo)分布在橫坐標(biāo)上的臨界值的絕對(duì)值,記為上的臨界值的絕對(duì)值,記為2)(22P例8:根據(jù)附表3查出相應(yīng)的右尾臨界2值 : (1)df =9,=0.05;(2)df =9,=0.012)9(05. 02)9(01. 0919.16666.21如果計(jì)算左尾概率為如果計(jì)算左尾概率為 時(shí)時(shí) 2分布分布的臨界值,只需查右尾概率為的臨界值,只需查右尾概率為1- 的右尾臨界值即可。的右尾臨界值即可。第62頁(yè)/共100頁(yè)6. F-分布分布6.1 F-分布的定義分布的定義從一個(gè)方差從一個(gè)方差2的正態(tài)總體中獨(dú)立地抽取樣本容量
47、分別為的正態(tài)總體中獨(dú)立地抽取樣本容量分別為n1、n2的兩個(gè)樣本,的兩個(gè)樣本,這兩個(gè)樣本的方差分別為:這兩個(gè)樣本的方差分別為:21S22S221121) 1(Sn 則有:則有:222222) 1(Sn 這兩個(gè)這兩個(gè)2變量除以各自的自由度后的比值為:變量除以各自的自由度后的比值為:) 1() 1(222121nn2222221211) 1() 1() 1() 1(nSnnSn2221SSF由一系列由一系列F值所構(gòu)成的分布稱為值所構(gòu)成的分布稱為F分布(分布(F distribution) F F(df1,df2) 222) 1(Sn已計(jì)算已計(jì)算:第63頁(yè)/共100頁(yè)6.2 F-分布的特點(diǎn)分布的特點(diǎn)(
48、1)F分布密度曲線是隨自由度分布密度曲線是隨自由度df1、df2的變化而變化的一簇偏態(tài)曲線的變化而變化的一簇偏態(tài)曲線 其形狀隨著其形狀隨著df1、df2的增大逐漸趨于對(duì)稱;的增大逐漸趨于對(duì)稱;(2)F分布的取值范圍是(分布的取值范圍是(0,+),其平均數(shù):),其平均數(shù):1F第64頁(yè)/共100頁(yè)6.3 F-分布的概率計(jì)算分布的概率計(jì)算附表附表5 5給出了給出了F F分布的右尾臨界值分布的右尾臨界值 當(dāng)右尾概率為當(dāng)右尾概率為 時(shí),時(shí),2分布在橫坐分布在橫坐標(biāo)上的臨界值的絕對(duì)值,記為標(biāo)上的臨界值的絕對(duì)值,記為F )(FFP例9:根據(jù)附表5查出相應(yīng)的右尾臨界F值 : (1)df1 =4, df2 =2
49、0,=0.05;(2) df1 =4, df2 =20,=0.01F0.01(4,20) = 4.43 F0.05(4,20) = 2.87 第65頁(yè)/共100頁(yè)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)參數(shù)估計(jì)參數(shù)估計(jì)統(tǒng)計(jì)學(xué)第66頁(yè)/共100頁(yè)描述統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)第67頁(yè)/共100頁(yè)第68頁(yè)/共100頁(yè)假設(shè)你正在研究平均一個(gè)美國(guó)人一生中要得到多少交通罰單,報(bào)告研究結(jié)果的方法有假設(shè)你正在研究平均一個(gè)美國(guó)人一生中要得到多少交通罰單,報(bào)告研究結(jié)果的方法有以下兩種:以下兩種:“10”或者或者“8到到12之間之間”一、參數(shù)估計(jì)一、參數(shù)估計(jì)第69頁(yè)/共100頁(yè)Gudmund R. Iv
50、ersen第70頁(yè)/共100頁(yè)X22211)(nXXiSn第71頁(yè)/共100頁(yè)2、區(qū)間估計(jì)、區(qū)間估計(jì)1.在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減抽樣誤差而得到的2.根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量n比如,某班級(jí)平均分?jǐn)?shù)在7585之間,置信水平是95% 第72頁(yè)/共100頁(yè)第73頁(yè)/共100頁(yè)第74頁(yè)/共100頁(yè)1)(tsxtPx第75頁(yè)/共100頁(yè)第76頁(yè)/共100頁(yè)影響區(qū)間寬度的因素影響區(qū)間寬度的因素1.總體數(shù)據(jù)的離散程度,總體數(shù)據(jù)的離散程度,用用 來(lái)測(cè)度來(lái)測(cè)度2. 樣本容量,樣本容量,3. 置信水平置信水平
51、 (1 - ),影響,影響 的大小的大小第77頁(yè)/共100頁(yè)統(tǒng)計(jì)假設(shè)檢驗(yàn)又稱為顯著性檢驗(yàn),是生物統(tǒng)計(jì)學(xué)的核心內(nèi)容,是統(tǒng)計(jì)推斷的主要組成部分統(tǒng)計(jì)推斷(statistical inference)就是通過(guò)樣本特征(統(tǒng)計(jì)量)來(lái)推斷相應(yīng)總體特征(參數(shù))的方法n 參數(shù)估計(jì)(參數(shù)估計(jì)(parametric estimate) 通過(guò)樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法通過(guò)樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法 點(diǎn)估計(jì)(點(diǎn)估計(jì)(point estimate) 區(qū)間估計(jì)(區(qū)間估計(jì)(interval estimate)直接用樣本統(tǒng)計(jì)量的數(shù)值估計(jì)出相應(yīng)總體參數(shù)具體值的方法直接用樣本統(tǒng)計(jì)量的數(shù)值估計(jì)出相應(yīng)總體參數(shù)具體值的方法在一定的概
52、率保證下(一般為在一定的概率保證下(一般為95%或或99%),根據(jù)樣本統(tǒng)計(jì)量的分布,計(jì)),根據(jù)樣本統(tǒng)計(jì)量的分布,計(jì)算出總體參數(shù)出現(xiàn)的數(shù)值范圍或區(qū)間,用該區(qū)間來(lái)估計(jì)總體參數(shù)的方法算出總體參數(shù)出現(xiàn)的數(shù)值范圍或區(qū)間,用該區(qū)間來(lái)估計(jì)總體參數(shù)的方法 參數(shù)估計(jì)是對(duì)總體參數(shù)的參數(shù)估計(jì)是對(duì)總體參數(shù)的定量分析定量分析 二、假設(shè)檢驗(yàn)二、假設(shè)檢驗(yàn)第78頁(yè)/共100頁(yè)n 統(tǒng)計(jì)假設(shè)檢驗(yàn)(統(tǒng)計(jì)假設(shè)檢驗(yàn)(hypothesis test) 根據(jù)某種實(shí)際需要,對(duì)未知的或不完全知道的總體參數(shù)提出一些假設(shè),根據(jù)某種實(shí)際需要,對(duì)未知的或不完全知道的總體參數(shù)提出一些假設(shè),然后根據(jù)樣本觀測(cè)值和統(tǒng)計(jì)量的分布,通過(guò)一定的計(jì)算,再作出在一定然
53、后根據(jù)樣本觀測(cè)值和統(tǒng)計(jì)量的分布,通過(guò)一定的計(jì)算,再作出在一定概率意義上應(yīng)當(dāng)接受哪種假設(shè)的方法。概率意義上應(yīng)當(dāng)接受哪種假設(shè)的方法。 統(tǒng)計(jì)假設(shè)檢驗(yàn)的假設(shè)是對(duì)總體提出的,由于最后檢驗(yàn)的結(jié)論只有兩種:統(tǒng)計(jì)假設(shè)檢驗(yàn)的假設(shè)是對(duì)總體提出的,由于最后檢驗(yàn)的結(jié)論只有兩種:要比較的總體參數(shù)間要么存在顯著差異,要么不存在顯著差異要比較的總體參數(shù)間要么存在顯著差異,要么不存在顯著差異 統(tǒng)計(jì)假設(shè)檢驗(yàn)是對(duì)總體參數(shù)的統(tǒng)計(jì)假設(shè)檢驗(yàn)是對(duì)總體參數(shù)的定性分析定性分析 1. 統(tǒng)計(jì)假設(shè)檢驗(yàn)的意義統(tǒng)計(jì)假設(shè)檢驗(yàn)的意義 以兩個(gè)平均數(shù)之間差異的顯著性檢驗(yàn)以兩個(gè)平均數(shù)之間差異的顯著性檢驗(yàn) t-檢驗(yàn)為例檢驗(yàn)為例現(xiàn)隨機(jī)挑選10名中國(guó)女性和10名韓國(guó)
54、女性,請(qǐng)世界網(wǎng)絡(luò)知名度大賽評(píng)委和觀眾進(jìn)行知名度評(píng)分,試比較哪個(gè)國(guó)家女性知名度更高?第79頁(yè)/共100頁(yè)9.999.859.999.959.989.979.959.95中國(guó)女性的平均得分9.98韓國(guó)女性的平均得分9.91第80頁(yè)/共100頁(yè)兩個(gè)國(guó)家女性的平均得分并不相等,其差值(表面效應(yīng))為:兩個(gè)國(guó)家女性的平均得分并不相等,其差值(表面效應(yīng))為: 07. 091. 998. 921 xx根據(jù)兩個(gè)樣本平均數(shù)的差值根據(jù)兩個(gè)樣本平均數(shù)的差值0.07,是否可以給兩個(gè)樣本所在總體的總體平,是否可以給兩個(gè)樣本所在總體的總體平均數(shù)下這樣的結(jié)論:均數(shù)下這樣的結(jié)論:中國(guó)女性總體的平均得分高于韓國(guó)女性總體的平均得分
55、中國(guó)女性比韓國(guó)女性知名度更高 如果從經(jīng)典數(shù)學(xué)的角度來(lái)看,答案應(yīng)該是肯定如果從經(jīng)典數(shù)學(xué)的角度來(lái)看,答案應(yīng)該是肯定 如果從生物統(tǒng)計(jì)學(xué)的角度來(lái)看,在未經(jīng)過(guò)統(tǒng)計(jì)假設(shè)檢驗(yàn)以前,只能如果從生物統(tǒng)計(jì)學(xué)的角度來(lái)看,在未經(jīng)過(guò)統(tǒng)計(jì)假設(shè)檢驗(yàn)以前,只能說(shuō)說(shuō)“不一定不一定” 事實(shí)上,僅僅憑借樣本平均數(shù)之差不等于事實(shí)上,僅僅憑借樣本平均數(shù)之差不等于0就得出其所屬的總體平均數(shù)不相就得出其所屬的總體平均數(shù)不相等是不可靠的等是不可靠的 實(shí)際上,進(jìn)行試驗(yàn)研究的目的并不在于了解樣本的結(jié)果,而是要通過(guò)樣本實(shí)際上,進(jìn)行試驗(yàn)研究的目的并不在于了解樣本的結(jié)果,而是要通過(guò)樣本了解總體,通過(guò)樣本來(lái)推斷總體,從而對(duì)總體給出一個(gè)全面的結(jié)論了解總體
56、,通過(guò)樣本來(lái)推斷總體,從而對(duì)總體給出一個(gè)全面的結(jié)論 第81頁(yè)/共100頁(yè)1x2x在統(tǒng)計(jì)學(xué)中,一般用樣本平均數(shù)在統(tǒng)計(jì)學(xué)中,一般用樣本平均數(shù) 、 作為統(tǒng)計(jì)假設(shè)檢驗(yàn)的對(duì)象作為統(tǒng)計(jì)假設(shè)檢驗(yàn)的對(duì)象 、以樣本平均數(shù)差數(shù)的大小來(lái)對(duì)樣本所在的總體平均數(shù)以樣本平均數(shù)差數(shù)的大小來(lái)對(duì)樣本所在的總體平均數(shù)1與與2是否相同作出是否相同作出統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷 以樣本平均數(shù)作為檢驗(yàn)對(duì)象的依據(jù): 離均差平方和為最小,說(shuō)明樣本平均數(shù)與樣本中各個(gè)觀測(cè)值之間相差離均差平方和為最小,說(shuō)明樣本平均數(shù)與樣本中各個(gè)觀測(cè)值之間相差最小,因此,平均數(shù)是一個(gè)樣本資料的最好代表值最小,因此,平均數(shù)是一個(gè)樣本資料的最好代表值 樣本平均數(shù)是總體平均數(shù)的
57、無(wú)偏估計(jì)值樣本平均數(shù)是總體平均數(shù)的無(wú)偏估計(jì)值 根據(jù)中心極限定理,樣本平均數(shù)服從或逼近正態(tài)分布根據(jù)中心極限定理,樣本平均數(shù)服從或逼近正態(tài)分布實(shí)際上,每個(gè)觀測(cè)值(數(shù)據(jù))都只是試驗(yàn)的表面效應(yīng),而表面效應(yīng)一般由兩部分組成: 試驗(yàn)的處理效應(yīng)試驗(yàn)的處理效應(yīng) 試驗(yàn)的隨機(jī)誤差試驗(yàn)的隨機(jī)誤差 第82頁(yè)/共100頁(yè)樣本中每一觀測(cè)值樣本中每一觀測(cè)值xi也可以被分解成兩部分:也可以被分解成兩部分: 處理效應(yīng):處理效應(yīng): 用總體平均數(shù)用總體平均數(shù)表示表示 誤差效應(yīng):誤差效應(yīng): 用隨機(jī)誤差用隨機(jī)誤差表示表示 iix)(1111nininxnx樣本平均數(shù)為:樣本平均數(shù)為: nin11總體平總體平均數(shù)均數(shù)樣本平均數(shù)的差數(shù)也可
58、分解成樣本平均數(shù)的差數(shù)也可分解成2部分:部分:誤差平誤差平均數(shù)均數(shù))()(221121 xx)()(2121表面表面效應(yīng)效應(yīng)處理處理效應(yīng)效應(yīng)抽樣抽樣誤差誤差第83頁(yè)/共100頁(yè)第84頁(yè)/共100頁(yè)2. 統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本思想與步驟統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本思想與步驟 首先根據(jù)具體試驗(yàn)?zāi)康奶岢鲆粋€(gè)假設(shè) 然后在假定該假設(shè)成立(或正確)的前提下進(jìn)行試驗(yàn),并取得數(shù)據(jù),接著對(duì)這些資料進(jìn)行統(tǒng)計(jì)分析,獲得該假設(shè)成立的概率 最后根據(jù)所獲得的概率值的大小來(lái)判斷假設(shè)是否成立 如果所得概率較大,就表明我們沒(méi)有足夠的理由來(lái)否定所作假設(shè),即必須接受這一假設(shè) 如果所得概率較小,就表明這一假設(shè)不大可能成立,應(yīng)予否定,從而接受其對(duì)立
59、假設(shè) 統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本步驟第85頁(yè)/共100頁(yè)例3-3:通過(guò)以往的大規(guī)模調(diào)查,已知某地成年黑白花奶牛血液中的白細(xì)胞數(shù)為52.3,標(biāo)準(zhǔn)差為5.38,現(xiàn)測(cè)得10頭黑白花牛白細(xì)胞數(shù)分別為53.6,55.3,46.4,57.2,46.0,43.2,48.1,51.1,49.9,44.5; =49.53。試問(wèn)這批黑白花奶牛是否來(lái)自于某地黑白花奶牛總體?x(1)對(duì)所研究的總體提出假設(shè)對(duì)所研究的總體提出假設(shè)研究某一隨機(jī)樣本所在的總體(用研究某一隨機(jī)樣本所在的總體(用表示)和一已知總體(用表示)和一已知總體(用0表示)是表示)是否為同一總體,也就是研究這一隨機(jī)樣本是否來(lái)自于已知總體否為同一總體,也就是研究這
60、一隨機(jī)樣本是否來(lái)自于已知總體 假設(shè):假設(shè): 兩個(gè)總體為同一個(gè)總體(即兩個(gè)總體的總體平均數(shù)相等)兩個(gè)總體為同一個(gè)總體(即兩個(gè)總體的總體平均數(shù)相等)無(wú)效假設(shè)(無(wú)效假設(shè)(null hypothesis) 用用H0表示表示 即即H0:=0 無(wú)效假設(shè)的含義:無(wú)效假設(shè)就是假設(shè)兩總體的平均數(shù)相等,即H0:3 .52053.49x3.520假設(shè)樣本平均數(shù) 與已知總體平均數(shù) 77. 20 x由抽樣誤差引起的,并不是兩總體之間的真實(shí)差異 兩總體之間的差異是由抽樣誤差所引起的第86頁(yè)/共100頁(yè)為了在無(wú)效假設(shè)被否定后有可以被接受的假設(shè),因此應(yīng)在設(shè)立無(wú)效假設(shè)的同為了在無(wú)效假設(shè)被否定后有可以被接受的假設(shè),因此應(yīng)在設(shè)立無(wú)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 物業(yè)智能化解決方案
- 精神科新冠肺炎演練
- 我的企業(yè)探索規(guī)劃
- 新課改2025屆高考?xì)v史一輪復(fù)習(xí)考點(diǎn)精練24開創(chuàng)外交新局面含解析
- 磨盤山水庫(kù)供水工程竣工初步驗(yàn)收綜合報(bào)告
- 防火防災(zāi)疏散演練
- 靜脈留置針使用治療管理
- 市政綠化機(jī)械施工合同范本
- 石膏礦建設(shè)土石方施工合同
- 便利店租賃合同:工業(yè)區(qū)
- 醫(yī)療質(zhì)量管理與持續(xù)改進(jìn)記錄表
- 最新《輔酶q10》課件
- 西方醫(yī)學(xué)史概要課件
- 分布式光伏屋頂調(diào)查表
- 新中國(guó)十大元帥!課件
- 幼兒園小朋友認(rèn)識(shí)醫(yī)生和護(hù)士課件
- 2022年消防安全知識(shí)考試題庫(kù)及答案
- 石化項(xiàng)目設(shè)備及管道防腐保溫施工方案
- Unit 1 Food comments 課件-高中英語(yǔ)外研版(2019)必修第二冊(cè)
- 國(guó)開成本會(huì)計(jì)第13章綜合練習(xí)試題及答案
- 2022年烏魯木齊市法院書記員招聘考試題庫(kù)及答案解析
評(píng)論
0/150
提交評(píng)論