第四章抽樣分布_第1頁
第四章抽樣分布_第2頁
第四章抽樣分布_第3頁
第四章抽樣分布_第4頁
第四章抽樣分布_第5頁
已閱讀5頁,還剩70頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

2023/2/41第四章概率分布與抽樣2023/2/42第一節(jié)隨機變量的概率分布第二節(jié)大數(shù)定律與中心極限定理第三節(jié)統(tǒng)計量的抽樣分布(54張)第四章抽樣分布2023/2/43

學習目標1.定義和解釋隨機變量及其概率分布2.計算隨機變量的概率和概率分布3.理解正態(tài)分布及其標準化問題;√4.理解大數(shù)定律和中心極限定理;5.掌握常用統(tǒng)計量的抽樣分布;√6.會用Excel計算常見分布的概率?!?023/2/44

重點與難點1.隨機變量概率分布意義的理解2.統(tǒng)計量抽樣分布的若干結(jié)論3.兩類極限定理的意義及其若干結(jié)論4.小樣本的精確分布2023/2/45第一節(jié)隨機變量的概率分布一、隨機變量的定義及其類型

1.隨機變量的定義

2.兩種類型的隨機變量二、隨機變量的概率分布

1.概率分布的含義及意義

2.離散型隨機變量的概率分布

3.連續(xù)型隨機變量的概率分布

4.隨機變量的分布函數(shù)三、幾種常見的概率分布

1.正態(tài)分布

2.小樣本的精確分布2023/2/46一、隨機變量的定義及其類型(一)隨機變量的定義在隨機試驗中,若隨著試驗結(jié)果的不同而隨機地取各種不同的數(shù)值,并且對取每一個數(shù)值或某一范圍內(nèi)的值都有相應的概率,即對任意實數(shù),是隨機事件,且概率存在,則稱為一個隨機變量。(二)兩種類型的隨機變量(按取值的特點不同來劃分)1.離散型隨機變量2.連續(xù)型隨機變量

2023/2/471.離散型隨機變量

如果隨機變量的所有取值是有限個或都可以逐個列舉出來,則稱為離散型隨機變量。例如,擲骰子試驗中“出現(xiàn)的點數(shù)”、質(zhì)量檢驗中從一批產(chǎn)品里“取到次品的個數(shù)”等都是離散型隨機變量。2023/2/482.連續(xù)型隨機變量

如果隨機變量的取值不僅是無窮多個,而是可取到某個區(qū)間或整個數(shù)軸上的一切值,不能夠無遺漏地一一列舉出來,則稱該隨機變量為連續(xù)型隨機變量。例如,一批電子元件的“使用壽命”、抽樣調(diào)查中的“測量誤差”等都是連續(xù)型隨機變量。2023/2/49二、隨機變量的概率分布(一)概率分布的含義及意義1.概率分布的含義隨機變量在其取值范圍內(nèi),取值與取值概率間一一對應的關(guān)系,稱之為隨機變量的概率分布,簡稱分布。2.概率分布的意義描述隨機變量變化的統(tǒng)計規(guī)律。方便地計算任一事件發(fā)生的概率。2023/2/410(二)離散型隨機變量的概率分布

1.離散型隨機變量概率分布的兩種表現(xiàn)形式分布列(律)2.概率函數(shù)2023/2/411概率函數(shù)的數(shù)學性質(zhì)2023/2/412(三)連續(xù)型隨機變量的概率分布(1)

1.連續(xù)型隨機變量的表現(xiàn)方式--密度函數(shù)2023/2/413(三)連續(xù)型隨機變量的概率分布(2)2.密度函數(shù)的數(shù)學性質(zhì)3.事件“”發(fā)生的概率的計算方法2023/2/414(三)連續(xù)型隨機變量的概率分布(3)4.事件“”發(fā)生的概率的幾何意義5.連續(xù)型隨機變量的期望值和方差分別為2023/2/415(四)隨機變量的分布函數(shù)

1.分布函數(shù)的來源離散型隨機變量的分布用概率函數(shù)來描述,連續(xù)型隨機變量的分布用密度函數(shù)來描述,兩者形式不同,表現(xiàn)各異。為了更方便地表現(xiàn)隨機變量的分布,下面引入分布函數(shù)。

2.分布函數(shù)的定義2023/2/416分布函數(shù)的幾何意義及數(shù)學性質(zhì)1.幾何意義2.數(shù)學性質(zhì)2023/2/417隨機變量分布函數(shù)的具體表現(xiàn)2023/2/4182023/2/419(五)連續(xù)型隨機變量的概率分布1.密度函數(shù)的定義2023/2/420(六)常見的連續(xù)型隨機變量的分布---------

正態(tài)分布定義2023/2/421

正態(tài)分布正態(tài)分布的密度函數(shù)圖形是一條以均值為中心的對稱鐘型曲線2023/2/422

正態(tài)分布正態(tài)分布密度函數(shù)的數(shù)學性質(zhì)2023/2/423

正態(tài)分布參數(shù)和對曲線形態(tài)的影響2023/2/424標準正態(tài)分布及其重要意義2023/2/425

正態(tài)分布標準化標準化法2023/2/426標準化法的幾何意義標準化變換實質(zhì)上是作了一個坐標軸的平移和尺度變換,使正態(tài)分布的平均數(shù),標準差。2023/2/427

正態(tài)分布正態(tài)分布表及上側(cè)分位數(shù)2023/2/428

正態(tài)分布

準則2023/2/429

正態(tài)分布(P118)(記住啦)準則示意圖2023/2/430

正態(tài)分布正態(tài)分布的重要意義在隨機理論中,正態(tài)分布是最重要的一種分布,理由如下:⑴它是最常見的一種分布,現(xiàn)實中許多隨機變量服從或近似服從正態(tài)分布。⑵在一定的條件下,正態(tài)分布是其他分布的近似分布。⑶許多有用的分布,特別是小樣本的精確分布是由正態(tài)分布推導出來的。2023/2/431

小樣本的精確分布

1.分布由阿貝(Abbe)于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)分別于1875年和1900年推導出來。2.分布也稱學生氏(Student)分布,是由哥塞特(W.S.Gosset)在1908年首次提出,其重要意義在于提供了小樣本研究方法。3.分布是由統(tǒng)計學家費雪(R.A.Fisher)首次提出的。2023/2/432

分布--定義2023/2/433

分布--密度函數(shù)圖象

2023/2/434

分布--期望和方差及上側(cè)分位數(shù)

2023/2/435

分布--定義2023/2/436

分布--密度函數(shù)圖象2023/2/437

分布--期望和方差及上側(cè)分位數(shù)2023/2/438

分布的上側(cè)分位數(shù)2023/2/439

分布--定義2023/2/440

分布--密度函數(shù)圖象2023/2/441

分布--期望和方差2023/2/442

分布--上側(cè)分位數(shù)2023/2/443常見的概率分布在抽樣推斷中的作用2023/2/444第二節(jié)大數(shù)定律與中心極限定理p119一、大數(shù)定律1.切比雪夫大數(shù)定律2.貝努里大數(shù)定律二、中心極限定理1.林德貝格-勒維中心極限定理2.棣莫弗-拉普拉斯中心極限定理2023/2/445一、大數(shù)定律

大數(shù)定律又稱作大數(shù)法則,是關(guān)于“均值具有穩(wěn)定性”的一類定理。個別事物因偶然因素的影響而產(chǎn)生變異,有各自不同的表現(xiàn),但是,對總體進行大量觀察后平均,就能使偶然因素的影響相互抵消,消除由個別偶然因素引起的極端性影響,從而使總體均值穩(wěn)定下來,反映出事物變化的一般規(guī)律。2023/2/446(一)切比雪夫大數(shù)定律2023/2/447(一)切比雪夫大數(shù)定律2023/2/448(二)貝努里大數(shù)定律

2023/2/449

二、中心極限定理

大數(shù)定律說明了當樣本容量n充分大時,樣本均值趨于總體均值,但并不等于總體均值,說明樣本推斷總體時存在誤差。若要控制推斷誤差,顯然須知樣本均值這一隨機變量的概率分布,可惜大數(shù)定律只提供了推斷方法,并未給出推斷誤差的概率分布。而中心極限定理正好彌補了大數(shù)定律的這一不足。2023/2/450(一)林德貝格-勒維中心極限定理2023/2/451(一)林德貝格-勒維中心極限定理2023/2/452(二)棣莫弗-拉普拉斯()

中心極限定理2023/2/453兩類極限定理的意義1.如果說大數(shù)定律是關(guān)于“均值具有穩(wěn)定性”的一類定律,它提供了樣本估計總體的方法,那么中心極限定理則是關(guān)于“估計誤差概率分布”的一類定理,它不僅提供了估計方法,而且還提供了控制估計誤差的方法。2.中心極限定理還揭示了正態(tài)分布形成的機制,即如果某一個量是許多隨機因素綜合影響迭加形成的,在這許多影響因素中沒有任何一個起著主導作用,那么這個量就是一個服從正態(tài)分布的正態(tài)隨機變量。回歸模型中的隨機誤差項常假定服從正態(tài)分布,其依據(jù)便在于此。2023/2/454第三節(jié)統(tǒng)計量的抽樣分布

(重點)p123-137一、抽樣方式二、樣本與統(tǒng)計量三、抽樣分布1.樣本均值的抽樣分布2.樣本方差的抽樣分布3.樣本成數(shù)的抽樣分布(大樣本情形)注意:

在學習下面內(nèi)容之前,同學們自己一定要去好好復習、理解隨機變量、概率、概率分布、隨機變量的分布函數(shù)、正態(tài)分布、正態(tài)分布標準化、t分布、參數(shù)、統(tǒng)計量等概念的涵義,會查表計算標準正態(tài)分布的概率。2023/2/4552023/2/456

第三節(jié)統(tǒng)計量的抽樣分布

一、抽樣方式

抽樣調(diào)查屬于非全面調(diào)查,抽樣的核心問題是如何保證樣本對總體具有充分的代表性。按是否根據(jù)已知概率抽選樣本單位,抽樣方式可分為概率抽樣和非概率抽樣;統(tǒng)計推斷主要采用概率推斷。按抽取樣本單位后是否放回,抽樣方式又可分為重置抽樣(放回)和不重置抽樣(不放回)。2023/2/457一、抽樣方式P123(一)概率抽樣概率抽樣是按照隨機原則進行抽樣的方式,它不加任何主觀因素,組成總體的每個單位都有被抽中的概率,樣本對總體有很強的代表性。1.概率抽樣的優(yōu)點和不足概率抽樣的優(yōu)點有:(1)調(diào)查結(jié)果可以用來推斷總體;(2)能估算出并能控制抽樣誤差。概率抽樣的不足有:(1)在大多數(shù)案例中,相同規(guī)模的概率抽樣的費用要比非概率抽樣高;(2)概率抽樣比非概率抽樣的技術(shù)要求高,需要更多的時間策劃和實施。2.常用的概率抽樣方法

(1)簡單隨機抽樣,又稱純隨機抽樣,它是抽樣前對總體不加任何分組、劃類、排隊等處理,完全隨機地抽取樣本單位的方法。(2)等距抽樣,又稱機械抽樣或系統(tǒng)抽樣,它是抽樣前將總體各單位按一定標志或次序排隊,然后按相等的距離抽取樣本單位的方法。(3)類型抽樣,又稱分類抽樣或分層抽樣,它是抽樣前將總體單位按其屬性特征分成若干類型或?qū)?,然后在各類型或?qū)又须S機抽取樣本單位的方法。(4)整群抽樣,又稱集團抽樣,它是抽樣前將總體各單位按一定標準分成若干群或組,再從總體中隨機抽取一定數(shù)量的群或組,對抽中的群或組的所有單位進行全面調(diào)查的方法。(5)多階段抽樣,又稱多級抽樣,它是將調(diào)查分成兩個或兩個以上的階段進行抽樣的方法。第一階段先將總體按照一定的規(guī)范分成若干抽樣單位,稱之為一級抽樣單位,再把抽中的一級抽樣單位分成若干更小的二級抽樣單位,從抽中的二級抽樣單位再分三級抽樣單位,…,這樣就形成一個多階段抽樣過程。其特點是,當一次抽樣不能得到樣本單位而總體又超大、復雜時使用。

在抽樣調(diào)查的實際工作中,經(jīng)常是要將幾種抽樣方法結(jié)合起來應用。2023/2/459(二)非概率抽樣

非概率抽樣是按主觀意向進行抽樣的方式,因組成總體的一部分單位沒有被抽中的機會,故容易出現(xiàn)樣本對總體的系統(tǒng)性偏差。一般情況下,非概率抽樣得到的樣本不適宜推斷總體。1.非概率抽樣的特點非概率抽樣的優(yōu)點是簡單易行、成本低、省時間等,在操作上也比概率抽樣簡單。但由于無法排除抽樣者的主觀性,無法客觀地評價樣本的代表性,特別是不能計算和控制抽樣誤差,因此樣本不具有推論總體的性質(zhì)。非概率抽樣多用于探索性研究、預備性研究和總體邊界不清難于實施概率抽樣的研究。實際應用時,采用非概率抽樣的原因包括:(1)受客觀條件的限制,無法采用嚴格的概率抽樣方法;(2)調(diào)查時效性要求高,要迅速取得調(diào)查結(jié)果;(3)調(diào)查對象不確定或者無法確定;(4)總體各單位的標志值差異不大,而且調(diào)查者有豐富的調(diào)查經(jīng)驗等。因概率抽樣與非概率抽樣各有優(yōu)缺點,且各有適宜使用的場合,故在實際應用中,非概率抽樣往往與概率抽樣結(jié)合使用。2.常用的非概率抽樣方法常用的非概率抽樣方法包括方便抽樣、配額抽樣、判斷抽樣和滾雪球抽樣等。2023/2/461(三)重復抽樣和不重復抽樣1.重復抽樣又稱有放回抽樣,它是每次從總體中抽取一個單位,觀察記錄后又放回,再抽取下一個。因此,重復抽樣的樣本是由次相互獨立的連續(xù)試驗所組成的,每次實驗在相同條件下進行,在整個抽樣過程中總體單位數(shù)始終不變,各單位被抽中的概率前后相等。2.不重復抽樣又稱無放回抽樣,它是每次從總體中抽取一個單位,觀察記錄后不放回,再抽取下一個。因此,不重復抽樣的樣本雖由次連續(xù)試驗所組成,而實質(zhì)等于一次同時從總體中抽個單位組成一個樣本,每次實驗不是相互獨立的,在整個抽樣過程中每抽一次總體單位就少一個,各單位被抽中的概率前后不等,越往后被抽中的機會就越大。在實踐中當總體單位數(shù)很大,樣本單位數(shù)相對較小時,可以把不重復抽樣看成重復抽樣,這時的計算比較簡單。2023/2/462二、樣本與統(tǒng)計量

(一)簡單隨機樣本(二)參數(shù)、統(tǒng)計量參數(shù)(parameter)來描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值所關(guān)心的參數(shù)主要有總體均值()、標準差()、總體比例()等總體參數(shù)通常用希臘字母表示統(tǒng)計量(statistic)用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計出來的一些量,是樣本的函數(shù)。(統(tǒng)計量是隨機變量)。所關(guān)心的樣本統(tǒng)計量有樣本均值(x)、樣本標準差(s)、樣本比例(p)等樣本統(tǒng)計量通常用小寫英文字母來表示2023/2/464(三)常用統(tǒng)計量--12023/2/465(三)常用統(tǒng)計量

-22023/2/466(三)常用統(tǒng)計量-32023/2/467補充:三種不同性質(zhì)的分布P129

總體分布:總體中各元素的觀察值所形成的相對頻率分布。

樣本分布:一個樣本中各元素的觀察值所成的相對頻率分布。當樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布。抽樣分布:樣本統(tǒng)計量的概率分布,是一種理論分布在重復選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布2023/2/468補充:抽樣分布(第66-76張)①指樣本統(tǒng)計量的概率分布;②樣本統(tǒng)計量是樣本的函數(shù),依據(jù)不同的樣本計算出來的值是不同的所以統(tǒng)計量是隨機變量樣本均值,樣本比例,樣本方差等;③它的結(jié)果來自容量相同的所有可能樣本;④它提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎,也是抽樣推斷科學性的重要依據(jù) 補充:樣本均值抽樣分布的形成過程【例】設一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為x1=1,x2=2,x3=3,x4=4

??傮w分布、總體的均值、方差及分布如下:總體分布14230.1.2.3均值和方差

補充:現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)總體1、2、3、4樣本總體1、2、3、4

計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布P1853.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值()樣本均值的抽樣分布樣本均值所有可能取值2023/2/472補充:樣本均值的抽樣分布形式(樣本均值的分布與總體分布的比較)

=2.5why?σ2=1.25

的分布形式與原有總體和樣本容量n的大小有關(guān)總體分布14230.1.2.3的抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的抽樣分布與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學期望為μ,方差為σ2/n。即x~N(μ,σ2/n)(記住,已知)2023/2/474中心極限定理

(centrallimittheorem)當樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設從均值為,方差為2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x中心極限定理(centrallimittheorem)x的分布趨于正態(tài)分布的過程樣本均值的數(shù)學期望樣本均值的方差(方差的概率意義在于刻畫了隨機變量取值的分散程度。方差越小,隨機變量的取值越集中在期望值附近。)

重復抽樣不重復抽樣補充:樣本均值抽樣分布的特征(數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論