版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第第7 7章章 抽樣與抽樣分布抽樣與抽樣分布統(tǒng)計學統(tǒng)計學統(tǒng)計學STATISTICS第第7 7章章 抽樣與抽樣分布抽樣與抽樣分布一、抽樣概述一、抽樣概述二、抽樣分布二、抽樣分布三、三、ExcelExcel在抽樣與抽樣分布中的應用在抽樣與抽樣分布中的應用統(tǒng)計學統(tǒng)計學STATISTICS本章學習目標本章學習目標1.1.理解隨機抽樣、非隨機抽樣兩類不同抽樣方法理解隨機抽樣、非隨機抽樣兩類不同抽樣方法的本質區(qū)別的本質區(qū)別2.2.了解重復抽樣、不重復抽樣下的樣本可能數目了解重復抽樣、不重復抽樣下的樣本可能數目3.3.區(qū)別簡單隨機抽樣、類型抽樣、等距抽樣、整區(qū)別簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣、多
2、階段抽樣等不同的隨機抽樣組織形式群抽樣、多階段抽樣等不同的隨機抽樣組織形式4.4.了解總體分布、樣本分布、抽樣分布的關系,了解總體分布、樣本分布、抽樣分布的關系,明確二項分布、正態(tài)分布、明確二項分布、正態(tài)分布、t t分布、分布、22分布等重要分布等重要分布的特征分布的特征5.5.理解抽樣分布的理論基礎理解抽樣分布的理論基礎6.6.重點掌握樣本均值、樣本比例在不同條件下的重點掌握樣本均值、樣本比例在不同條件下的抽樣分布抽樣分布統(tǒng)計學統(tǒng)計學STATISTICS一、抽樣概述一、抽樣概述(一)(一) 抽樣的方法抽樣的方法(二)(二) 隨機抽樣的組織形式隨機抽樣的組織形式(三)(三) 抽樣方案的設計抽樣
3、方案的設計統(tǒng)計學統(tǒng)計學STATISTICS(一)(一) 抽樣的方法抽樣的方法隨機抽樣隨機抽樣方便抽樣方便抽樣判斷抽樣判斷抽樣自愿樣本自愿樣本滾雪球抽樣滾雪球抽樣定額抽樣定額抽樣非隨機抽樣非隨機抽樣常用的抽樣方法常用的抽樣方法重復抽樣重復抽樣不重復抽樣不重復抽樣考慮順序抽樣考慮順序抽樣不考慮順序抽樣不考慮順序抽樣統(tǒng)計學統(tǒng)計學STATISTICS根據隨機原則從總體中直接抽根據隨機原則從總體中直接抽選部分單位構成樣本的方法。選部分單位構成樣本的方法。也稱概率抽樣也稱概率抽樣特點特點按隨機原則抽取樣本按隨機原則抽取樣本抽取樣本時使每個單位都有一抽取樣本時使每個單位都有一定的機會被抽中定的機會被抽中每個
4、單位被抽中的概率是已知每個單位被抽中的概率是已知的,或是可以計算出來的的,或是可以計算出來的 某一總體單位能否被抽中,與某一總體單位能否被抽中,與其它單位是否被抽中沒有關聯其它單位是否被抽中沒有關聯。 隨機抽樣隨機抽樣統(tǒng)計學統(tǒng)計學STATISTICS重復抽樣重復抽樣從總體從總體N N個單位中隨機抽取一個樣本容量個單位中隨機抽取一個樣本容量為為n n的樣本,每次從總體中抽取一個,并的樣本,每次從總體中抽取一個,并把結果登記下來,又放回總體中重新參把結果登記下來,又放回總體中重新參加下一次的抽選。又稱放回抽樣加下一次的抽選。又稱放回抽樣不重復抽樣不重復抽樣每次從總體中抽選一個單位后就不每次從總體中
5、抽選一個單位后就不再將其放回參加下一次的抽選。又再將其放回參加下一次的抽選。又稱不放回抽樣稱不放回抽樣. .總體單位數總體單位數N N不變,同一單位可能不變,同一單位可能多次被抽中。多次被抽中??傮w單位數減少總體單位數減少n n,同一單位只可,同一單位只可能被抽中一次。能被抽中一次。隨機抽選樣本的方式隨機抽選樣本的方式 統(tǒng)計學統(tǒng)計學STATISTICS考慮順序的重復抽樣考慮順序的重復抽樣nN可能的樣本數目可能的樣本數目不考慮順序的重復抽樣不考慮順序的重復抽樣2NNn不考慮順序的不重復抽樣不考慮順序的不重復抽樣)!(!nNnNCnN考慮順序的不重復抽樣考慮順序的不重復抽樣)!(!nNNAnN考慮
6、各單位的中選順序考慮各單位的中選順序ABBAABBA不考慮各單位的中選不考慮各單位的中選順序。順序。 ABABBABA統(tǒng)計學統(tǒng)計學STATISTICS【例【例1 1】某一總體含有】某一總體含有A A、B B、C C、D D、E E共共5 5個總體單個總體單位,從中隨機抽取位,從中隨機抽取2 2個單位構成樣本,可能的樣本個單位構成樣本,可能的樣本數目有多少?數目有多少? 采用考慮順序的重復抽樣,樣本可能數目為采用考慮順序的重復抽樣,樣本可能數目為5 55=255=25個個 采用不考慮順序的重復抽樣,樣本可能數目為采用不考慮順序的重復抽樣,樣本可能數目為52+552+5)/2=15/2=15個個
7、采用不考慮順序的不重復抽樣,樣本可能數目為采用不考慮順序的不重復抽樣,樣本可能數目為 5 5!/ /(2 2?。?-25-2)?。?10=10個個 采用考慮順序的不重復抽樣,樣本可能數目為采用考慮順序的不重復抽樣,樣本可能數目為5 54=204=20個個 第一次抽中中抽次二第EDCBAEEDECEBEAEEEDDDCDBDADDECDCCCBCACCEBDBCBBBABBEADACABAAAA統(tǒng)計學統(tǒng)計學STATISTICS相對于概率抽樣而言相對于概率抽樣而言抽取樣本時不是依據隨機原則,而是根據抽取樣本時不是依據隨機原則,而是根據研究目的對數據的要求,采用某種方式從研究目的對數據的要求,采用
8、某種方式從總體中抽出部分單位對其實施調查總體中抽出部分單位對其實施調查有方便抽樣、判斷抽樣、自愿樣本、定額有方便抽樣、判斷抽樣、自愿樣本、定額抽樣等方式抽樣等方式 非隨機抽樣非隨機抽樣統(tǒng)計學統(tǒng)計學STATISTICS方便抽樣方便抽樣調查過程中由調查員依據方便的原則,自行確調查過程中由調查員依據方便的原則,自行確定入抽樣本的單位定入抽樣本的單位調查員在街頭、公園、商店等公共場所進行攔調查員在街頭、公園、商店等公共場所進行攔截調查截調查廠家在出售產品柜臺前對路過顧客進行的調查廠家在出售產品柜臺前對路過顧客進行的調查優(yōu)點:容易實施,調查的成本低優(yōu)點:容易實施,調查的成本低缺陷:樣本單位的確定帶有隨意
9、性,樣本無法缺陷:樣本單位的確定帶有隨意性,樣本無法代表有明確定義的總體,調查結果不宜推斷總代表有明確定義的總體,調查結果不宜推斷總體體統(tǒng)計學統(tǒng)計學STATISTICS判斷抽樣判斷抽樣研究人員根據經驗、判斷和對研究對象的了研究人員根據經驗、判斷和對研究對象的了解,有目的選擇一些單位作為樣本解,有目的選擇一些單位作為樣本有重點抽樣,典型抽樣,代表抽樣等方式有重點抽樣,典型抽樣,代表抽樣等方式判斷抽樣是主觀的,樣本選擇的好壞取決于判斷抽樣是主觀的,樣本選擇的好壞取決于調研者的判斷、閱歷、專業(yè)程度和創(chuàng)造性調研者的判斷、閱歷、專業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作抽樣成本比較低,容易操作樣本是人為確
10、定的,沒有依據隨機的原則,樣本是人為確定的,沒有依據隨機的原則,調查結果不能用于對推斷總體調查結果不能用于對推斷總體統(tǒng)計學統(tǒng)計學STATISTICS自愿樣本自愿樣本被調查者自愿參加,成為樣本中的一分子,被調查者自愿參加,成為樣本中的一分子,向調查人員提供有關信息向調查人員提供有關信息例如,參與報刊上和互聯網上刊登的調查問例如,參與報刊上和互聯網上刊登的調查問卷活動,向某類節(jié)目撥打熱線電話等,都屬卷活動,向某類節(jié)目撥打熱線電話等,都屬于自愿樣本于自愿樣本自愿樣本與抽樣的隨機性無關自愿樣本與抽樣的隨機性無關樣本是有偏的樣本是有偏的不能依據樣本的信息推斷總體不能依據樣本的信息推斷總體統(tǒng)計學統(tǒng)計學ST
11、ATISTICS定額抽樣定額抽樣先將體中的所有單位按一定的標志先將體中的所有單位按一定的標志( (變變量量) )分為若干類,然后在每個類中采用分為若干類,然后在每個類中采用方便抽樣或判斷抽樣的方式選取樣本單方便抽樣或判斷抽樣的方式選取樣本單位位操作簡單,可以保證總體中不同類別的操作簡單,可以保證總體中不同類別的單位都能包括在所抽的樣本之中,使得單位都能包括在所抽的樣本之中,使得樣本的結構和總體的結構類似樣本的結構和總體的結構類似抽取具體樣本單位時,不是依據隨機原抽取具體樣本單位時,不是依據隨機原則,屬于非概率抽樣則,屬于非概率抽樣 統(tǒng)計學統(tǒng)計學STATISTICS隨機抽樣與非隨機抽樣的比較隨機
12、抽樣與非隨機抽樣的比較隨機抽樣隨機抽樣依據隨機原則抽選樣本依據隨機原則抽選樣本樣本統(tǒng)計量的理論分布存在樣本統(tǒng)計量的理論分布存在可根據調查的結果推斷總體可根據調查的結果推斷總體非隨機抽樣非隨機抽樣不是依據隨機原則抽選樣本不是依據隨機原則抽選樣本樣本統(tǒng)計量的分布是不確定的樣本統(tǒng)計量的分布是不確定的使用樣本結果推斷總體的效果要差使用樣本結果推斷總體的效果要差一些一些統(tǒng)計學統(tǒng)計學STATISTICS1 1 簡單隨機抽樣純隨機抽樣)簡單隨機抽樣純隨機抽樣)僅適用于規(guī)模不大、分布比較均勻的總體僅適用于規(guī)模不大、分布比較均勻的總體(二隨機抽樣的組織方式(二隨機抽樣的組織方式每個容量為每個容量為n n的樣本都
13、有同等機會的樣本都有同等機會( (概率概率) )被抽中被抽中簡單、直觀,是最簡單、最基本、最符合隨機原簡單、直觀,是最簡單、最基本、最符合隨機原則,但同時也是抽樣誤差最大的抽樣組織形式則,但同時也是抽樣誤差最大的抽樣組織形式一般有抽簽、抓鬮、隨機數碼表、抽樣函數等一般有抽簽、抓鬮、隨機數碼表、抽樣函數等 統(tǒng)計學統(tǒng)計學STATISTICS63271 59986 71744 51102 15141 80714 58683 93108 13554 7994588547 09896 95436 79115 08303 01041 20190 63754 08459 28364 55957 57243
14、83865 09911 19761 66355 40102 26646 60147 1570246276 87453 44790 67122 45573 84358 21625 16999 13385 2278255363 07449 34835 15290 76616 67191 12777 21861 68689 0326369393 92785 49902 58447 42048 30378 87618 26933 40640 1628113186 29431 88190 04588 38733 81290 89541 70290 40113 0824317726 28652 56836
15、 78351 47327 18518 92222 55201 27340 1049336520 64465 05550 30157 82242 29520 69753 72602 23756 5493581628 36100 39254 56835 37636 02421 98063 89641 64953 99337 在隨機數碼表中,可以從任何一個位置、任何方向開始挑選隨機數字在隨機數碼表中,可以從任何一個位置、任何方向開始挑選隨機數字。一旦選擇一個任意起點,就采用事先確定的程序抽取樣本。一旦選擇一個任意起點,就采用事先確定的程序抽取樣本。 隨機數字表摘錄)隨機數字表摘錄)統(tǒng)計學統(tǒng)計學STA
16、TISTICS2 2 類型抽樣分類抽樣或分層抽樣)類型抽樣分類抽樣或分層抽樣) 將總體全部單位分類,形成若干個類型組,然后從將總體全部單位分類,形成若干個類型組,然后從各類型中分別隨機抽取若干單位組成樣本的抽樣形式。各類型中分別隨機抽取若干單位組成樣本的抽樣形式??傮w總體N N樣本樣本n n等比例抽取等比例抽取不等比例抽取不等比例抽取2NkN1N1n2nkn 能使樣本結構更接近于總體結構,提高樣本的能使樣本結構更接近于總體結構,提高樣本的代表性,適宜于單位標志值差異程度較大的總體,代表性,適宜于單位標志值差異程度較大的總體,能同時推斷總體指標和各組的指標能同時推斷總體指標和各組的指標統(tǒng)計學統(tǒng)計
17、學STATISTICS3 3 等距抽樣機械抽樣或系統(tǒng)抽樣)等距抽樣機械抽樣或系統(tǒng)抽樣) 將總體單位按某一標志排序,然后按相等間隔將總體單位按某一標志排序,然后按相等間隔抽取樣本單位構成樣本的抽樣形式抽取樣本單位構成樣本的抽樣形式隨機起點隨機起點半距起點半距起點對稱起點對稱起點(總體單位按某一標志排序)(總體單位按某一標志排序)按無關標志排隊,其抽樣效果相當于簡單隨機抽樣;按無關標志排隊,其抽樣效果相當于簡單隨機抽樣;按有關標志排隊,其抽樣效果相當于類型抽樣。按有關標志排隊,其抽樣效果相當于類型抽樣。統(tǒng)計學統(tǒng)計學STATISTICS4 4 整群抽樣整群抽樣 將總體全部單位分為若干將總體全部單位分
18、為若干“群群”,然后隨機抽,然后隨機抽取一部分取一部分“群群”,被抽中群體的所有單位構成樣本,被抽中群體的所有單位構成樣本的抽樣方式。的抽樣方式。例:總體群數例:總體群數R=16 R=16 樣本群數樣本群數r=4r=4hlpdnnnnnA AB BC CD DE EF FG GH HI IJ JK KL LM MN NO OP PL LH HP PD D樣本容量樣本容量 簡單、方便,能節(jié)省人力、物力、財力和時間,簡單、方便,能節(jié)省人力、物力、財力和時間,但其樣本代表性可能較差,產生的抽樣誤差較大。但其樣本代表性可能較差,產生的抽樣誤差較大。統(tǒng)計學統(tǒng)計學STATISTICS55多階段抽樣多階段抽
19、樣 指分兩個或兩個以上的階段來完成抽取樣本指分兩個或兩個以上的階段來完成抽取樣本單位過程的抽樣方式單位過程的抽樣方式例:在某省有例:在某省有100100多萬農戶,需要抽取多萬農戶,需要抽取10001000戶戶調查農戶生產性投資情況。調查農戶生產性投資情況。 第一階段:從該省所有縣中抽取第一階段:從該省所有縣中抽取5 5個縣個縣 第二階段:從被抽中的第二階段:從被抽中的5 5個縣中各抽個縣中各抽4 4個鄉(xiāng)個鄉(xiāng) 第三階段:從被抽中的第三階段:從被抽中的2020個鄉(xiāng)中各抽個鄉(xiāng)中各抽5 5個村個村 第四階段:從被抽中的第四階段:從被抽中的100100個村中各抽個村中各抽1010戶戶樣本樣本n=100n
20、=10010=1000(10=1000(戶戶) ) 既可以相對節(jié)約人力和物力,又可以利用現成既可以相對節(jié)約人力和物力,又可以利用現成的行政區(qū)劃、組織系統(tǒng)作為劃分各階段的依據,但的行政區(qū)劃、組織系統(tǒng)作為劃分各階段的依據,但抽樣誤差的計算要復雜得多。抽樣誤差的計算要復雜得多。 統(tǒng)計學統(tǒng)計學STATISTICS在實際工作中,選擇適當的抽樣組在實際工作中,選擇適當的抽樣組織方式主要應考慮:織方式主要應考慮:統(tǒng)計學統(tǒng)計學STATISTICS明確明確調查目調查目 的的 明確明確總體及總體及抽樣單位抽樣單位 確定或構確定或構建抽樣框建抽樣框 提出指標提出指標精度要求精度要求 選擇抽樣選擇抽樣組織形式組織形式
21、(三抽樣方案的設計(三抽樣方案的設計 確定確定樣本容量樣本容量 制定制定具體辦法具體辦法步驟步驟 1.1.抽樣方案的設計內容抽樣方案的設計內容統(tǒng)計學統(tǒng)計學STATISTICS2.2.抽樣方案設計的基本原則抽樣方案設計的基本原則(1 1保證實現抽樣隨機性的原則保證實現抽樣隨機性的原則(2 2保證實現最大的抽樣效果原則保證實現最大的抽樣效果原則3.3.抽樣方案設計中的重要問題抽樣方案設計中的重要問題(1 1保證隨機原則的實現保證隨機原則的實現(2 2要考慮樣本容量和結構問題要考慮樣本容量和結構問題 (3 3關于抽樣的組織形式問題關于抽樣的組織形式問題(4 4關于調查費用的問題關于調查費用的問題統(tǒng)計
22、學統(tǒng)計學STATISTICS(一關于分布的幾個概念(一關于分布的幾個概念(二抽樣分布的理論基礎(二抽樣分布的理論基礎(三樣本均值的抽樣分布(三樣本均值的抽樣分布(四樣本比例的抽樣分布(四樣本比例的抽樣分布二、抽樣分布二、抽樣分布統(tǒng)計學統(tǒng)計學STATISTICS總體變量總體變量x x的概率分布,它由變量的概率分布,它由變量x x的所有取值的所有取值和與之相應的概率組成。和與之相應的概率組成。反映總體分布特征的常用指標有總體均值反映總體分布特征的常用指標有總體均值和和總體標準差總體標準差總體分布通常是未知的總體分布通常是未知的總體(一關于分布的幾個概念(一關于分布的幾個概念總體分布總體分布XPNX
23、FPXNFX222)()(N=FP=F/F統(tǒng)計學統(tǒng)計學STATISTICS樣本中各觀察值的概率分布,它由一個樣本的所有觀察值x和與之相應的概率p組成。樣本分布的特征值主要有樣本均值 與樣本標準差s 當樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布 樣本分布樣本分布x統(tǒng)計學統(tǒng)計學STATISTICS樣本統(tǒng)計量樣本均值樣本統(tǒng)計量樣本均值, , 樣本比例,樣本方樣本比例,樣本方差等的概率分布,由各樣本統(tǒng)計量的值和差等的概率分布,由各樣本統(tǒng)計量的值和與之相應的概率組成。與之相應的概率組成。 樣本統(tǒng)計量是隨機變量,其結果來自容量相樣本統(tǒng)計量是隨機變量,其結果來自容量相同的所有可能樣本同的所有可能樣本是
24、一種理論概率分布。提供了樣本統(tǒng)計量穩(wěn)是一種理論概率分布。提供了樣本統(tǒng)計量穩(wěn)定的信息,是進行推斷的理論基礎,也是抽定的信息,是進行推斷的理論基礎,也是抽樣推斷科學性的重要依據樣推斷科學性的重要依據 抽樣分布抽樣分布統(tǒng)計學統(tǒng)計學STATISTICS總體總體樣樣本本樣樣本本樣樣本本抽樣分布的形成過程抽樣分布的形成過程計算樣本統(tǒng)計量計算樣本統(tǒng)計量如:樣本均值如:樣本均值統(tǒng)計學統(tǒng)計學STATISTICS【例】設一個總體,含有【例】設一個總體,含有4個元素個元素(個體個體) ,即總體單位數即總體單位數N=4。4 個個體分別為個個體分別為X1=1、X2=2、X3=3 、X4=4 ??傮w的均值、方差。總體的均
25、值、方差及分布如下及分布如下:總體分布總體分布均值和方差均值和方差5 . 21NXNii25. 1)(122NXNii統(tǒng)計學統(tǒng)計學STATISTICS3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n = 2 的樣本共16個)統(tǒng)計學統(tǒng)計學STATISTICS 計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值x)X樣本均值的抽樣分布1.00.10
26、.20.3P (X )1.53.04.03.52.02.50統(tǒng)計學統(tǒng)計學STATISTICS比較及結論:比較及結論: 1. 樣本均值的均值樣本均值的均值(數學期望數學期望) 等于總體均值等于總體均值 2. 樣本均值的方差等于總體方差的樣本均值的方差等于總體方差的1/n為樣本數目MnMxnixix222122625. 016)5 . 20 . 4()5 . 20 . 1 ()5 . 2160 . 45 . 10 . 11Mxniix統(tǒng)計學統(tǒng)計學STATISTICS總體分布總體分布142300.10.20.3抽樣分布抽樣分布P ( X )1.000.10.20.31.53.04.03.52.02.
27、5X5 . 2x625. 02XP ( X )統(tǒng)計學統(tǒng)計學STATISTICS進展進展 n n 次重復試驗,出現次重復試驗,出現“勝利勝利的次數的次數X X的的概率分布稱為二項分布概率分布稱為二項分布, ,記為:記為:設設X X為為 n n 次重復試驗中事件次重復試驗中事件A A出現的次數,出現的次數,X X 取取 x x 的概率為的概率為P P)!( !),2, 1 ,0(xnxnxnCnxqpCxXPxnxxn式中:二項分布二項分布X = xix1 ,x2 , ,xnP(X =xi)=PiP1 ,P2 , ,Pn),(pnBX重復試驗的條件:重復試驗的條件:一次試驗只有兩個可能結果;一次試
28、驗只有兩個可能結果;試驗可以重復進行;試驗可以重復進行;每一次試驗成功的概率都是每一次試驗成功的概率都是p p。 統(tǒng)計學統(tǒng)計學STATISTICS二項分布的數學期望為二項分布的數學期望為 E ( X ) E ( X ) npnp方差為方差為 D ( X ) D ( X ) npqnpq二項分布的數學期望和方差二項分布的數學期望和方差:統(tǒng)計學統(tǒng)計學STATISTICS 1.1.描述連續(xù)型隨機變量的最重要的分布描述連續(xù)型隨機變量的最重要的分布 2.2.經典統(tǒng)計推斷的基礎經典統(tǒng)計推斷的基礎 3.3.若隨機變量的概率密度函數為:若隨機變量的概率密度函數為:正態(tài)分布正態(tài)分布),(2NXxexfx,21)
29、(222)(則稱則稱X X服從均值為服從均值為、方差為、方差為22的正態(tài)分布,記為的正態(tài)分布,記為 統(tǒng)計學統(tǒng)計學STATISTICS概率密度函數在概率密度函數在x x 的上方,即的上方,即f(x)0f(x)0正態(tài)曲線的最高點在均值正態(tài)曲線的最高點在均值,它也是分布的中位數和,它也是分布的中位數和眾數,即對稱分布眾數,即對稱分布正態(tài)分布是一個分布族,每一特定正態(tài)分布通過均值正態(tài)分布是一個分布族,每一特定正態(tài)分布通過均值和標準差和標準差來區(qū)分。來區(qū)分。 決定了圖形的中心位置決定了圖形的中心位置, , 決定曲線的平緩程度,即寬度決定曲線的平緩程度,即寬度曲線曲線f(x)f(x)相對于均值相對于均值對
30、稱,尾端向兩個方向無限延對稱,尾端向兩個方向無限延伸,且理論上永遠不會與橫軸相交伸,且理論上永遠不會與橫軸相交隨機變量的概率由曲線下的面積給出隨機變量的概率由曲線下的面積給出正態(tài)曲線下的總面積等于正態(tài)曲線下的總面積等于1 1正態(tài)分布的特點正態(tài)分布的特點統(tǒng)計學統(tǒng)計學STATISTICS 和和 對正態(tài)曲線的影響對正態(tài)曲線的影響xCAB統(tǒng)計學統(tǒng)計學STATISTICS正態(tài)分布的概率正態(tài)分布的概率概率是曲線下的面積概率是曲線下的面積! !?d)()(baxxfbxaP統(tǒng)計學統(tǒng)計學STATISTICS正態(tài)分布函數正態(tài)分布函數隨機變量的概率也可以用分布函數隨機變量的概率也可以用分布函數F(x)F(x)來表
31、示來表示分布函數定義為分布函數定義為)(d)()()(xxxxfxXPxF根據分布函數,根據分布函數,P(aXb)P(aXb)可以寫為可以寫為)()(d )()(aFbFxxfbXaPbaf(x)xx0F ( x0 )統(tǒng)計學統(tǒng)計學STATISTICS標準正態(tài)分布標準正態(tài)分布一般的正態(tài)分布取決于均值一般的正態(tài)分布取決于均值和標準差和標準差 計算概率時計算概率時 ,每一個正態(tài)分布都需要有,每一個正態(tài)分布都需要有自己的正態(tài)概率分布表,這種表格是無自己的正態(tài)概率分布表,這種表格是無窮多的窮多的若能將一般的正態(tài)分布轉化為標準正態(tài)若能將一般的正態(tài)分布轉化為標準正態(tài)分布,計算概率時只需要查一張表分布,計算概
32、率時只需要查一張表統(tǒng)計學統(tǒng)計學STATISTICS標準正態(tài)分布函數標準正態(tài)分布函數zzz,e21)(22 標準正態(tài)分布的概率密度函數標準正態(tài)分布的概率密度函數任何一個一般的正態(tài)分布,均可通過下面的線任何一個一般的正態(tài)分布,均可通過下面的線性變換轉化為標準正態(tài)分布性變換轉化為標準正態(tài)分布)1 ,0( NxZ 標準正態(tài)分布的分布函數標準正態(tài)分布的分布函數ztzxxxzde21d)()(2-2統(tǒng)計學統(tǒng)計學STATISTICS標準正態(tài)分布表的使用標準正態(tài)分布表的使用將一個一般的正態(tài)分布轉換為標準正態(tài)分布將一個一般的正態(tài)分布轉換為標準正態(tài)分布計算概率時,只要查標準正態(tài)概率分布表即可計算概率時,只要查標準
33、正態(tài)概率分布表即可對于負的對于負的x x ,可由,可由 (-x) (-x) x x得到得到對于標準正態(tài)分布,即對于標準正態(tài)分布,即X XN(0,1)N(0,1),有,有P (aP (a X X b)b) b b a aP (|X| P (|X| a)a) 2 2 a a 1 1對于一般正態(tài)分布,即對于一般正態(tài)分布,即X XN(N( , , ) ),則有,則有abbXaP)(統(tǒng)計學統(tǒng)計學STATISTICS12. 01052 . 6XZx x =5 =5 =10=106.26.2 =1 =1Z Z 0 00.120.12.0478.0478統(tǒng)計學統(tǒng)計學STATISTICS【例【例3 3】設】設X
34、 XN(0N(0,1)1)分布,求以下概率:分布,求以下概率: (1) P(X 1.5)(1) P(X 2)(2)P(X 2);(3)P(-1X (3)P(-1X 3)3); (4) P(| X | (4) P(| X | 2) 2) 解:解:(1) P(X 1.5) = (1) P(X 2 ) = 1 - P ( X ( 2 ) P ( X 2 ) = 1 - P ( X 2 ) = 1 - 2 ) = 1 -0.9973=0.02270.9973=0.0227 (3) P(-1X (3) P(-1X 3)= P(X 3)= P(X 3)- P(X -1)3)- P(X -1) = = (3
35、)- (3)- (-1)= (-1)= (3) (3) 1- 1-(1)(1) = 0.9987-(1-0.8413)=0.84 = 0.9987-(1-0.8413)=0.84 (4)P(| X | (4)P(| X | 2)=P(-2 2)=P(-2 X X 2)= 2)= (2)- (2)- (-2)(-2) = = (2)- 1-(2)- 1-(2)=2 (2)=2 (2)- (2)- 1=0.95451=0.9545統(tǒng)計學統(tǒng)計學STATISTICS【例【例4 4】設】設X XN(5N(5,32) 32) ,求以下概率,求以下概率 (1) P(X (1) P(X 10) 10) ; (
36、2) P(2X (2) P(2X 10) 0 0,有:,有:1|limnmPn 該定律表明:當重復試驗次數該定律表明:當重復試驗次數n n充分大時,事件充分大時,事件A A發(fā)生的頻率發(fā)生的頻率m/nm/n依概率收斂于事件依概率收斂于事件A A發(fā)生的概率,發(fā)生的概率,即頻率具有穩(wěn)定性。即頻率具有穩(wěn)定性。 大數定律的實踐意義:一是抽樣必須遵循隨機大數定律的實踐意義:一是抽樣必須遵循隨機原則;二是抽樣必須遵循大量原則。原則;二是抽樣必須遵循大量原則。 統(tǒng)計學統(tǒng)計學STATISTICS闡述大量隨機變量之和的極限分布闡述大量隨機變量之和的極限分布是正態(tài)分布的一系列定理的總稱。是正態(tài)分布的一系列定理的總稱
37、。 中心極限定理中心極限定理獨立同分布中心極限定理也稱為列維獨立同分布中心極限定理也稱為列維- -林德伯林德伯格定理):設格定理):設x1,x2,x3x1,x2,x3是獨立同分布的隨機變是獨立同分布的隨機變量序列,且存在有限的數學期望量序列,且存在有限的數學期望和方差和方差,那,那么當么當nn時:時:),(21nnNxnii),(2nNx或:該定理表明該定理表明:不論總體服從什么分布,只要其數學期不論總體服從什么分布,只要其數學期望和方差存在,對這一總體進行重復抽樣,當樣本容望和方差存在,對這一總體進行重復抽樣,當樣本容量充分大時,量充分大時, 或或 就趨近于正態(tài)分布。就趨近于正態(tài)分布。nii
38、x1x中心極限定理中心極限定理統(tǒng)計學統(tǒng)計學STATISTICS當樣本容量足夠大時(n 30) ,樣本均值的抽樣分布逐漸趨于正態(tài)分布 xn 設從均值為設從均值為,方差為,方差為 2 2的一個任意總體中抽取的一個任意總體中抽取容量為容量為n n的樣本,當的樣本,當n n充分大時,樣本均值的抽樣分充分大時,樣本均值的抽樣分布近似服從均值為布近似服從均值為、方差為、方差為2/n2/n的正態(tài)分布的正態(tài)分布一個任意分布的總體 x X統(tǒng)計學統(tǒng)計學STATISTICS統(tǒng)計學統(tǒng)計學STATISTICS中心極限定理的意義在于:當我們的認識中心極限定理的意義在于:當我們的認識對象分布未知時,只要堅持隨機抽取足夠多對
39、象分布未知時,只要堅持隨機抽取足夠多的樣本單位,就可以使樣本統(tǒng)計量服從或近的樣本單位,就可以使樣本統(tǒng)計量服從或近似服從正態(tài)分布,繼而便可運用正態(tài)分布理似服從正態(tài)分布,繼而便可運用正態(tài)分布理論,根據樣本信息來推斷認識對象總體的數論,根據樣本信息來推斷認識對象總體的數量特征。量特征。 統(tǒng)計學統(tǒng)計學STATISTICS在隨機選取容量為在隨機選取容量為n n的樣本時,由樣本均值的所的樣本時,由樣本均值的所有可能取值形成的相對頻數分布有可能取值形成的相對頻數分布一種理論概率分布一種理論概率分布推斷總體均值推斷總體均值的理論基礎的理論基礎(三樣本均值的抽樣分布(三樣本均值的抽樣分布統(tǒng)計學統(tǒng)計學STATIS
40、TICS樣本均值的數學期望樣本均值的數學期望樣本均值的方差樣本均值的方差重復抽樣重復抽樣不重復抽樣不重復抽樣樣本均值的抽樣分布特征樣本均值的抽樣分布特征)(xEnX22122NnNnX統(tǒng)計學統(tǒng)計學STATISTICS3. 樣本均值的標準誤差樣本均值的標準誤差所有可能的樣本均值的標準差,測度所有所有可能的樣本均值的標準差,測度所有樣本均值的離散程度樣本均值的離散程度計算公式為計算公式為1NnNnnxx不重復抽樣:重復抽樣:統(tǒng)計學統(tǒng)計學STATISTICS22已知時已知時, ,樣本均值的抽樣分布樣本均值的抽樣分布 總體是總體是否正態(tài)否正態(tài)分布分布是是小小樣樣本本容容量量n正態(tài)分布正態(tài)分布正態(tài)分布正
41、態(tài)分布非正態(tài)分布非正態(tài)分布統(tǒng)計學統(tǒng)計學STATISTICS闡明:闡明:當總體服從正態(tài)分布時,不論樣本容量多大,樣當總體服從正態(tài)分布時,不論樣本容量多大,樣本均值都服從正態(tài)分布,且樣本均值的數學期望等本均值都服從正態(tài)分布,且樣本均值的數學期望等于總體均值,樣本均值的方差等于總體方差的于總體均值,樣本均值的方差等于總體方差的1/n 1/n 當總體分布為非正態(tài)總體或分布形式未知時,樣當總體分布為非正態(tài)總體或分布形式未知時,樣本容量充分大時一般要求本容量充分大時一般要求n30n30),樣本均值的抽),樣本均值的抽樣分布可以近似地用正態(tài)分布樣分布可以近似地用正態(tài)分布 來描述。來描述。 總體為非正態(tài)總體或
42、分布形式未知,如果樣本容總體為非正態(tài)總體或分布形式未知,如果樣本容量太小,我們無法從理論上探討樣本均值的抽樣分量太小,我們無法從理論上探討樣本均值的抽樣分布布 )1,(2nN統(tǒng)計學統(tǒng)計學STATISTICS的近似概率。小于計算樣本均值9 . 9(1)x的近似概率。大于計算樣本均9 . 9(2)x范圍內的近似概率。在總體均值附近計算樣本均1 . 0(3)x統(tǒng)計學統(tǒng)計學STATISTICS解:根據中心極限定理,不論總體分布是什么形狀,只要樣本足夠大n30時),樣本均值 )1 . 0 ,10(),366 . 0,10(22NxNx即1587.08413.01)1(1)1(1)1()1.0109.91
43、.010()9.9()1(ZPZPxPxP統(tǒng)計學統(tǒng)計學STATISTICS8413.01587.01)9.9(1)9.9()2(xPxP6826. 018413. 021) 1 (2)1 . 0109 . 9()1 . 0101 .10()1 . 0101 .101 . 0101 . 0109 . 9() 1 .109 . 9 () 3 (ZPZPxPxP統(tǒng)計學統(tǒng)計學STATISTICS【例】某廠生產的某種節(jié)能燈管的使用【例】某廠生產的某種節(jié)能燈管的使用壽命服從正態(tài)分布,對某批產品測試的壽命服從正態(tài)分布,對某批產品測試的結果,平均使用壽命為結果,平均使用壽命為10501050小時,標準小時,標
44、準差為差為200200小時。試求:小時。試求: (a a使用壽命在使用壽命在500500小時以下的燈小時以下的燈管占多大比例?管占多大比例? (b b使用壽命在使用壽命在85085014501450小時的小時的燈管占多大比例?燈管占多大比例? (c c以均值為中心,以均值為中心,9595的燈管的的燈管的使用壽命在什么范圍內?使用壽命在什么范圍內?統(tǒng)計學統(tǒng)計學STATISTICS 解:設解:設 X X使用壽命,則使用壽命,則X XN (1050N (1050,2002 )2002 )75.22001050500)500( ZPXP200105014502001050850)1450850( ZP
45、XP95.0392|1050|96.1200|1050| XPXZP(2)(-1)0.977250.158650.8186 95的燈管壽命在均值的燈管壽命在均值392左右即左右即6581442小時小時1(2.75)10.997020.00298統(tǒng)計學統(tǒng)計學STATISTICS22未知時未知時, ,樣本均值的抽樣分布樣本均值的抽樣分布 總體是總體是否正態(tài)否正態(tài)分布分布是是小小樣樣本本容容量量n t分布分布 t分布分布非正態(tài)分布非正態(tài)分布統(tǒng)計學統(tǒng)計學STATISTICS闡明:當總體方差未知時,對于正態(tài)總體無論樣本闡明:當總體方差未知時,對于正態(tài)總體無論樣本容量的大?。蛘呖傮w非正態(tài)或分布形式未知
46、但樣容量的大?。?,或者總體非正態(tài)或分布形式未知但樣本容量充分大時,樣本均值的標準化值服從本容量充分大時,樣本均值的標準化值服從 分布分布)1(nt值得注意的是,當樣本容量逐漸增大時,值得注意的是,當樣本容量逐漸增大時, t分布逐漸分布逐漸逼近標準正態(tài)分布。所以,當樣本容量很大時,除逼近標準正態(tài)分布。所以,當樣本容量很大時,除了可以利用了可以利用 進行相關計算外,也可進行相關計算外,也可以利用以利用 近似服從標準正態(tài)分布來計算近似服從標準正態(tài)分布來計算 )1(ntnsxnsx統(tǒng)計學統(tǒng)計學STATISTICS【例】已知湖南省【例】已知湖南省20092009年的全省糧食總平均畝產年的全省糧食總平均畝
47、產為為600600公斤,其分布形式及方差均未知?,F從全公斤,其分布形式及方差均未知?,F從全省隨機抽取省隨機抽取49004900畝進行調查了解,測得該樣本的畝進行調查了解,測得該樣本的標準差為標準差為400400公斤,求這公斤,求這49004900畝的平均畝產不低畝的平均畝產不低于于620620公斤的概率。公斤的概率。)620(,400,4900,600 xPsn求已知分析:分析:解:糧食單產解:糧食單產x的分布形式及方差均未知,故的分布形式及方差均未知,故以樣本方差代替總體方差,從理論上講,以樣本方差代替總體方差,從理論上講, )1(ntnsx)5.3()5.3()4900400600620(
48、)620()620( tPnsxPnsxPnsnsxPxP則:統(tǒng)計學統(tǒng)計學STATISTICS一般情況下,根據一般情況下,根據t t值與自由度在值與自由度在t t分布表中可以查分布表中可以查找相應的概率。由于這里的找相應的概率。由于這里的t t分布的自由度很大,分布的自由度很大,為為4900-1=48994900-1=4899,這時的,這時的t t分布與標準正態(tài)分布幾乎分布與標準正態(tài)分布幾乎一樣,故可以查標準正態(tài)分布表,得一樣,故可以查標準正態(tài)分布表,得 000233. 0999767. 01)5 . 3()5 . 3()620( zPtPxP結果表明:這結果表明:這49004900畝的平均畝
49、產不低于畝的平均畝產不低于620620公斤的概公斤的概率只有率只有0.0233%0.0233%。 統(tǒng)計學統(tǒng)計學STATISTICS(四樣本比例的抽樣分布(四樣本比例的抽樣分布 1.1.是非標志均值與比例的關系是非標志均值與比例的關系對于是非標志總體對于是非標志總體X X而言,而言,X X的取值只有兩個:的取值只有兩個:0 0和和1 1。設總體的單位數為。設總體的單位數為N N,具有某一特征如產,具有某一特征如產品合格的比例為品合格的比例為,那么:,那么: NNFXF是非標志總體的均值:)1 ()1 ()1 ()(2222NNNFFX是非標志總體的方差:統(tǒng)計學統(tǒng)計學STATISTICS對于是非標
50、志的樣本來說,其取值也是兩個:對于是非標志的樣本來說,其取值也是兩個:0 0和和1 1。設樣本容量為設樣本容量為n n,具有某一特征如產品合格的,具有某一特征如產品合格的比例為比例為p,p,那么:那么: pnnpfxfx是非標志的樣本均值:)1 ()1 ()1 ()(2222ppnpnppnpffxxs是非標志的樣本方差:結論:是非標志的均值等于其比例。結論:是非標志的均值等于其比例。 統(tǒng)計學統(tǒng)計學STATISTICS樣本比例的數學期望樣本比例的數學期望樣本比例的方差樣本比例的方差重復抽樣重復抽樣不重復抽樣不重復抽樣樣本比例的抽樣分布特征樣本比例的抽樣分布特征)(pEnp)1 (21)1 (2
51、NnNnp 樣本比例的抽樣分布是容量相同的所有可能樣本樣本比例的抽樣分布是容量相同的所有可能樣本的樣本比例的概率分布。其分布特征如下:的樣本比例的概率分布。其分布特征如下:統(tǒng)計學統(tǒng)計學STATISTICS容量相同的所有可能樣本的樣本比例的概率分容量相同的所有可能樣本的樣本比例的概率分布布是非標志的總體方差已知,且是非標志的總體方差已知,且 樣本比例的抽樣分布可用正態(tài)分布樣本比例的抽樣分布可用正態(tài)分布近似近似 ,一種理論概率分布一種理論概率分布推斷總體比例推斷總體比例的理論基礎的理論基礎2.2.樣本比例的抽樣分布樣本比例的抽樣分布正態(tài)分布正態(tài)分布時5)1 (, 5nn)1 ,0()1(Nnp)1 (,N統(tǒng)計學統(tǒng)計學STATISTICS【例】假設有一批種子的發(fā)芽率為【例】假設有一批種子的發(fā)芽率為0.7?,F有這種?,F有這種種子種子100顆,試求:顆,試求:(1其中有其中有72顆以上發(fā)芽的概率。顆以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《室內設計空間組織》課件
- 《電源系統(tǒng)的建模》課件
- 《病理心理學》課件
- 通史版2025屆高考歷史二輪總復習第二編考前突破突破一史學入門與史料研讀課件
- 大學生網絡安全教育
- 單位管理制度集合大合集人員管理十篇
- 單位管理制度合并選集【職員管理篇】十篇
- 單位管理制度分享匯編職員管理篇
- 單位管理制度分享大全職工管理
- 單位管理制度范例選集職工管理篇十篇
- 【西平李氏】忠武郡王李晟后裔分布及部分家譜
- 水庫回水計算(實用)
- 人力資源管理概論全套課件
- 伊索寓言-狗和影子課件
- 卸船機用行星減速機的設計-畢業(yè)設計
- 中班美術活動美麗的蝴蝶教案【含教學反思】
- 北師大版九年級數學上冊教學教學工作總結
- 光儲電站儲能系統(tǒng)調試方案
- (完整)小學語文考試專用作文方格紙
- 管理供應商 供應商績效評估
- 煙花爆竹工程設計安全規(guī)范
評論
0/150
提交評論