版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2023/2/41第四章概率分布與抽樣2023/2/42第一節(jié)隨機(jī)變量的概率分布第二節(jié)大數(shù)定律與中心極限定理第三節(jié)統(tǒng)計量的抽樣分布(54張)第四章抽樣分布2023/2/43
學(xué)習(xí)目標(biāo)1.定義和解釋隨機(jī)變量及其概率分布2.計算隨機(jī)變量的概率和概率分布3.理解正態(tài)分布及其標(biāo)準(zhǔn)化問題;√4.理解大數(shù)定律和中心極限定理;5.掌握常用統(tǒng)計量的抽樣分布;√6.會用Excel計算常見分布的概率。√2023/2/44
重點(diǎn)與難點(diǎn)1.隨機(jī)變量概率分布意義的理解2.統(tǒng)計量抽樣分布的若干結(jié)論3.兩類極限定理的意義及其若干結(jié)論4.小樣本的精確分布2023/2/45第一節(jié)隨機(jī)變量的概率分布一、隨機(jī)變量的定義及其類型
1.隨機(jī)變量的定義
2.兩種類型的隨機(jī)變量二、隨機(jī)變量的概率分布
1.概率分布的含義及意義
2.離散型隨機(jī)變量的概率分布
3.連續(xù)型隨機(jī)變量的概率分布
4.隨機(jī)變量的分布函數(shù)三、幾種常見的概率分布
1.正態(tài)分布
2.小樣本的精確分布2023/2/46一、隨機(jī)變量的定義及其類型(一)隨機(jī)變量的定義在隨機(jī)試驗(yàn)中,若隨著試驗(yàn)結(jié)果的不同而隨機(jī)地取各種不同的數(shù)值,并且對取每一個數(shù)值或某一范圍內(nèi)的值都有相應(yīng)的概率,即對任意實(shí)數(shù),是隨機(jī)事件,且概率存在,則稱為一個隨機(jī)變量。(二)兩種類型的隨機(jī)變量(按取值的特點(diǎn)不同來劃分)1.離散型隨機(jī)變量2.連續(xù)型隨機(jī)變量
2023/2/471.離散型隨機(jī)變量
如果隨機(jī)變量的所有取值是有限個或都可以逐個列舉出來,則稱為離散型隨機(jī)變量。例如,擲骰子試驗(yàn)中“出現(xiàn)的點(diǎn)數(shù)”、質(zhì)量檢驗(yàn)中從一批產(chǎn)品里“取到次品的個數(shù)”等都是離散型隨機(jī)變量。2023/2/482.連續(xù)型隨機(jī)變量
如果隨機(jī)變量的取值不僅是無窮多個,而是可取到某個區(qū)間或整個數(shù)軸上的一切值,不能夠無遺漏地一一列舉出來,則稱該隨機(jī)變量為連續(xù)型隨機(jī)變量。例如,一批電子元件的“使用壽命”、抽樣調(diào)查中的“測量誤差”等都是連續(xù)型隨機(jī)變量。2023/2/49二、隨機(jī)變量的概率分布(一)概率分布的含義及意義1.概率分布的含義隨機(jī)變量在其取值范圍內(nèi),取值與取值概率間一一對應(yīng)的關(guān)系,稱之為隨機(jī)變量的概率分布,簡稱分布。2.概率分布的意義描述隨機(jī)變量變化的統(tǒng)計規(guī)律。方便地計算任一事件發(fā)生的概率。2023/2/410(二)離散型隨機(jī)變量的概率分布
1.離散型隨機(jī)變量概率分布的兩種表現(xiàn)形式分布列(律)2.概率函數(shù)2023/2/411概率函數(shù)的數(shù)學(xué)性質(zhì)2023/2/412(三)連續(xù)型隨機(jī)變量的概率分布(1)
1.連續(xù)型隨機(jī)變量的表現(xiàn)方式--密度函數(shù)2023/2/413(三)連續(xù)型隨機(jī)變量的概率分布(2)2.密度函數(shù)的數(shù)學(xué)性質(zhì)3.事件“”發(fā)生的概率的計算方法2023/2/414(三)連續(xù)型隨機(jī)變量的概率分布(3)4.事件“”發(fā)生的概率的幾何意義5.連續(xù)型隨機(jī)變量的期望值和方差分別為2023/2/415(四)隨機(jī)變量的分布函數(shù)
1.分布函數(shù)的來源離散型隨機(jī)變量的分布用概率函數(shù)來描述,連續(xù)型隨機(jī)變量的分布用密度函數(shù)來描述,兩者形式不同,表現(xiàn)各異。為了更方便地表現(xiàn)隨機(jī)變量的分布,下面引入分布函數(shù)。
2.分布函數(shù)的定義2023/2/416分布函數(shù)的幾何意義及數(shù)學(xué)性質(zhì)1.幾何意義2.數(shù)學(xué)性質(zhì)2023/2/417隨機(jī)變量分布函數(shù)的具體表現(xiàn)2023/2/4182023/2/419(五)連續(xù)型隨機(jī)變量的概率分布1.密度函數(shù)的定義2023/2/420(六)常見的連續(xù)型隨機(jī)變量的分布---------
正態(tài)分布定義2023/2/421
正態(tài)分布正態(tài)分布的密度函數(shù)圖形是一條以均值為中心的對稱鐘型曲線2023/2/422
正態(tài)分布正態(tài)分布密度函數(shù)的數(shù)學(xué)性質(zhì)2023/2/423
正態(tài)分布參數(shù)和對曲線形態(tài)的影響2023/2/424標(biāo)準(zhǔn)正態(tài)分布及其重要意義2023/2/425
正態(tài)分布標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化法2023/2/426標(biāo)準(zhǔn)化法的幾何意義標(biāo)準(zhǔn)化變換實(shí)質(zhì)上是作了一個坐標(biāo)軸的平移和尺度變換,使正態(tài)分布的平均數(shù),標(biāo)準(zhǔn)差。2023/2/427
正態(tài)分布正態(tài)分布表及上側(cè)分位數(shù)2023/2/428
正態(tài)分布
準(zhǔn)則2023/2/429
正態(tài)分布(P118)(記住啦)準(zhǔn)則示意圖2023/2/430
正態(tài)分布正態(tài)分布的重要意義在隨機(jī)理論中,正態(tài)分布是最重要的一種分布,理由如下:⑴它是最常見的一種分布,現(xiàn)實(shí)中許多隨機(jī)變量服從或近似服從正態(tài)分布。⑵在一定的條件下,正態(tài)分布是其他分布的近似分布。⑶許多有用的分布,特別是小樣本的精確分布是由正態(tài)分布推導(dǎo)出來的。2023/2/431
小樣本的精確分布
1.分布由阿貝(Abbe)于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)分別于1875年和1900年推導(dǎo)出來。2.分布也稱學(xué)生氏(Student)分布,是由哥塞特(W.S.Gosset)在1908年首次提出,其重要意義在于提供了小樣本研究方法。3.分布是由統(tǒng)計學(xué)家費(fèi)雪(R.A.Fisher)首次提出的。2023/2/432
分布--定義2023/2/433
分布--密度函數(shù)圖象
2023/2/434
分布--期望和方差及上側(cè)分位數(shù)
2023/2/435
分布--定義2023/2/436
分布--密度函數(shù)圖象2023/2/437
分布--期望和方差及上側(cè)分位數(shù)2023/2/438
分布的上側(cè)分位數(shù)2023/2/439
分布--定義2023/2/440
分布--密度函數(shù)圖象2023/2/441
分布--期望和方差2023/2/442
分布--上側(cè)分位數(shù)2023/2/443常見的概率分布在抽樣推斷中的作用2023/2/444第二節(jié)大數(shù)定律與中心極限定理p119一、大數(shù)定律1.切比雪夫大數(shù)定律2.貝努里大數(shù)定律二、中心極限定理1.林德貝格-勒維中心極限定理2.棣莫弗-拉普拉斯中心極限定理2023/2/445一、大數(shù)定律
大數(shù)定律又稱作大數(shù)法則,是關(guān)于“均值具有穩(wěn)定性”的一類定理。個別事物因偶然因素的影響而產(chǎn)生變異,有各自不同的表現(xiàn),但是,對總體進(jìn)行大量觀察后平均,就能使偶然因素的影響相互抵消,消除由個別偶然因素引起的極端性影響,從而使總體均值穩(wěn)定下來,反映出事物變化的一般規(guī)律。2023/2/446(一)切比雪夫大數(shù)定律2023/2/447(一)切比雪夫大數(shù)定律2023/2/448(二)貝努里大數(shù)定律
2023/2/449
二、中心極限定理
大數(shù)定律說明了當(dāng)樣本容量n充分大時,樣本均值趨于總體均值,但并不等于總體均值,說明樣本推斷總體時存在誤差。若要控制推斷誤差,顯然須知樣本均值這一隨機(jī)變量的概率分布,可惜大數(shù)定律只提供了推斷方法,并未給出推斷誤差的概率分布。而中心極限定理正好彌補(bǔ)了大數(shù)定律的這一不足。2023/2/450(一)林德貝格-勒維中心極限定理2023/2/451(一)林德貝格-勒維中心極限定理2023/2/452(二)棣莫弗-拉普拉斯()
中心極限定理2023/2/453兩類極限定理的意義1.如果說大數(shù)定律是關(guān)于“均值具有穩(wěn)定性”的一類定律,它提供了樣本估計總體的方法,那么中心極限定理則是關(guān)于“估計誤差概率分布”的一類定理,它不僅提供了估計方法,而且還提供了控制估計誤差的方法。2.中心極限定理還揭示了正態(tài)分布形成的機(jī)制,即如果某一個量是許多隨機(jī)因素綜合影響迭加形成的,在這許多影響因素中沒有任何一個起著主導(dǎo)作用,那么這個量就是一個服從正態(tài)分布的正態(tài)隨機(jī)變量?;貧w模型中的隨機(jī)誤差項(xiàng)常假定服從正態(tài)分布,其依據(jù)便在于此。2023/2/454第三節(jié)統(tǒng)計量的抽樣分布
(重點(diǎn))p123-137一、抽樣方式二、樣本與統(tǒng)計量三、抽樣分布1.樣本均值的抽樣分布2.樣本方差的抽樣分布3.樣本成數(shù)的抽樣分布(大樣本情形)注意:
在學(xué)習(xí)下面內(nèi)容之前,同學(xué)們自己一定要去好好復(fù)習(xí)、理解隨機(jī)變量、概率、概率分布、隨機(jī)變量的分布函數(shù)、正態(tài)分布、正態(tài)分布標(biāo)準(zhǔn)化、t分布、參數(shù)、統(tǒng)計量等概念的涵義,會查表計算標(biāo)準(zhǔn)正態(tài)分布的概率。2023/2/4552023/2/456
第三節(jié)統(tǒng)計量的抽樣分布
一、抽樣方式
抽樣調(diào)查屬于非全面調(diào)查,抽樣的核心問題是如何保證樣本對總體具有充分的代表性。按是否根據(jù)已知概率抽選樣本單位,抽樣方式可分為概率抽樣和非概率抽樣;統(tǒng)計推斷主要采用概率推斷。按抽取樣本單位后是否放回,抽樣方式又可分為重置抽樣(放回)和不重置抽樣(不放回)。2023/2/457一、抽樣方式P123(一)概率抽樣概率抽樣是按照隨機(jī)原則進(jìn)行抽樣的方式,它不加任何主觀因素,組成總體的每個單位都有被抽中的概率,樣本對總體有很強(qiáng)的代表性。1.概率抽樣的優(yōu)點(diǎn)和不足概率抽樣的優(yōu)點(diǎn)有:(1)調(diào)查結(jié)果可以用來推斷總體;(2)能估算出并能控制抽樣誤差。概率抽樣的不足有:(1)在大多數(shù)案例中,相同規(guī)模的概率抽樣的費(fèi)用要比非概率抽樣高;(2)概率抽樣比非概率抽樣的技術(shù)要求高,需要更多的時間策劃和實(shí)施。2.常用的概率抽樣方法
(1)簡單隨機(jī)抽樣,又稱純隨機(jī)抽樣,它是抽樣前對總體不加任何分組、劃類、排隊(duì)等處理,完全隨機(jī)地抽取樣本單位的方法。(2)等距抽樣,又稱機(jī)械抽樣或系統(tǒng)抽樣,它是抽樣前將總體各單位按一定標(biāo)志或次序排隊(duì),然后按相等的距離抽取樣本單位的方法。(3)類型抽樣,又稱分類抽樣或分層抽樣,它是抽樣前將總體單位按其屬性特征分成若干類型或?qū)?,然后在各類型或?qū)又须S機(jī)抽取樣本單位的方法。(4)整群抽樣,又稱集團(tuán)抽樣,它是抽樣前將總體各單位按一定標(biāo)準(zhǔn)分成若干群或組,再從總體中隨機(jī)抽取一定數(shù)量的群或組,對抽中的群或組的所有單位進(jìn)行全面調(diào)查的方法。(5)多階段抽樣,又稱多級抽樣,它是將調(diào)查分成兩個或兩個以上的階段進(jìn)行抽樣的方法。第一階段先將總體按照一定的規(guī)范分成若干抽樣單位,稱之為一級抽樣單位,再把抽中的一級抽樣單位分成若干更小的二級抽樣單位,從抽中的二級抽樣單位再分三級抽樣單位,…,這樣就形成一個多階段抽樣過程。其特點(diǎn)是,當(dāng)一次抽樣不能得到樣本單位而總體又超大、復(fù)雜時使用。
在抽樣調(diào)查的實(shí)際工作中,經(jīng)常是要將幾種抽樣方法結(jié)合起來應(yīng)用。2023/2/459(二)非概率抽樣
非概率抽樣是按主觀意向進(jìn)行抽樣的方式,因組成總體的一部分單位沒有被抽中的機(jī)會,故容易出現(xiàn)樣本對總體的系統(tǒng)性偏差。一般情況下,非概率抽樣得到的樣本不適宜推斷總體。1.非概率抽樣的特點(diǎn)非概率抽樣的優(yōu)點(diǎn)是簡單易行、成本低、省時間等,在操作上也比概率抽樣簡單。但由于無法排除抽樣者的主觀性,無法客觀地評價樣本的代表性,特別是不能計算和控制抽樣誤差,因此樣本不具有推論總體的性質(zhì)。非概率抽樣多用于探索性研究、預(yù)備性研究和總體邊界不清難于實(shí)施概率抽樣的研究。實(shí)際應(yīng)用時,采用非概率抽樣的原因包括:(1)受客觀條件的限制,無法采用嚴(yán)格的概率抽樣方法;(2)調(diào)查時效性要求高,要迅速取得調(diào)查結(jié)果;(3)調(diào)查對象不確定或者無法確定;(4)總體各單位的標(biāo)志值差異不大,而且調(diào)查者有豐富的調(diào)查經(jīng)驗(yàn)等。因概率抽樣與非概率抽樣各有優(yōu)缺點(diǎn),且各有適宜使用的場合,故在實(shí)際應(yīng)用中,非概率抽樣往往與概率抽樣結(jié)合使用。2.常用的非概率抽樣方法常用的非概率抽樣方法包括方便抽樣、配額抽樣、判斷抽樣和滾雪球抽樣等。2023/2/461(三)重復(fù)抽樣和不重復(fù)抽樣1.重復(fù)抽樣又稱有放回抽樣,它是每次從總體中抽取一個單位,觀察記錄后又放回,再抽取下一個。因此,重復(fù)抽樣的樣本是由次相互獨(dú)立的連續(xù)試驗(yàn)所組成的,每次實(shí)驗(yàn)在相同條件下進(jìn)行,在整個抽樣過程中總體單位數(shù)始終不變,各單位被抽中的概率前后相等。2.不重復(fù)抽樣又稱無放回抽樣,它是每次從總體中抽取一個單位,觀察記錄后不放回,再抽取下一個。因此,不重復(fù)抽樣的樣本雖由次連續(xù)試驗(yàn)所組成,而實(shí)質(zhì)等于一次同時從總體中抽個單位組成一個樣本,每次實(shí)驗(yàn)不是相互獨(dú)立的,在整個抽樣過程中每抽一次總體單位就少一個,各單位被抽中的概率前后不等,越往后被抽中的機(jī)會就越大。在實(shí)踐中當(dāng)總體單位數(shù)很大,樣本單位數(shù)相對較小時,可以把不重復(fù)抽樣看成重復(fù)抽樣,這時的計算比較簡單。2023/2/462二、樣本與統(tǒng)計量
(一)簡單隨機(jī)樣本(二)參數(shù)、統(tǒng)計量參數(shù)(parameter)來描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值所關(guān)心的參數(shù)主要有總體均值()、標(biāo)準(zhǔn)差()、總體比例()等總體參數(shù)通常用希臘字母表示統(tǒng)計量(statistic)用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計出來的一些量,是樣本的函數(shù)。(統(tǒng)計量是隨機(jī)變量)。所關(guān)心的樣本統(tǒng)計量有樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等樣本統(tǒng)計量通常用小寫英文字母來表示2023/2/464(三)常用統(tǒng)計量--12023/2/465(三)常用統(tǒng)計量
-22023/2/466(三)常用統(tǒng)計量-32023/2/467補(bǔ)充:三種不同性質(zhì)的分布P129
總體分布:總體中各元素的觀察值所形成的相對頻率分布。
樣本分布:一個樣本中各元素的觀察值所成的相對頻率分布。當(dāng)樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布。抽樣分布:樣本統(tǒng)計量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布2023/2/468補(bǔ)充:抽樣分布(第66-76張)①指樣本統(tǒng)計量的概率分布;②樣本統(tǒng)計量是樣本的函數(shù),依據(jù)不同的樣本計算出來的值是不同的所以統(tǒng)計量是隨機(jī)變量樣本均值,樣本比例,樣本方差等;③它的結(jié)果來自容量相同的所有可能樣本;④它提供了樣本統(tǒng)計量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 補(bǔ)充:樣本均值抽樣分布的形成過程【例】設(shè)一個總體,含有4個元素(個體)
,即總體單位數(shù)N=4。4
個個體分別為x1=1,x2=2,x3=3,x4=4
??傮w分布、總體的均值、方差及分布如下:總體分布14230.1.2.3均值和方差
補(bǔ)充:現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)總體1、2、3、4樣本總體1、2、3、4
計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布P1853.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值()樣本均值的抽樣分布樣本均值所有可能取值2023/2/472補(bǔ)充:樣本均值的抽樣分布形式(樣本均值的分布與總體分布的比較)
=2.5why?σ2=1.25
的分布形式與原有總體和樣本容量n的大小有關(guān)總體分布14230.1.2.3的抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的抽樣分布與中心極限定理=50
=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x
的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)(記住,已知)2023/2/474中心極限定理
(centrallimittheorem)當(dāng)樣本容量足夠大時(n
30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x中心極限定理(centrallimittheorem)x的分布趨于正態(tài)分布的過程樣本均值的數(shù)學(xué)期望樣本均值的方差(方差的概率意義在于刻畫了隨機(jī)變量取值的分散程度。方差越小,隨機(jī)變量的取值越集中在期望值附近。)
重復(fù)抽樣不重復(fù)抽樣補(bǔ)充:樣本均值抽樣分布的特征(數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建師范大學(xué)《小學(xué)班隊(duì)原理與班主任工作》2022-2023學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《體育保健學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《數(shù)字化教育資源設(shè)計與制作》2022-2023學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《設(shè)計基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《景觀設(shè)計四》2022-2023學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《環(huán)境工程學(xué)科概論》2022-2023學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《公共管理應(yīng)用寫作》2023-2024學(xué)年第一學(xué)期期末試卷
- 智慧產(chǎn)業(yè)園區(qū)發(fā)展、運(yùn)營及實(shí)踐
- 虛擬現(xiàn)實(shí)調(diào)研報告
- 2024屆深圳市重點(diǎn)中學(xué)高三5月階段質(zhì)量檢測試題數(shù)學(xué)試題
- 幼兒園《電從哪里來》教案
- 二年級上冊連續(xù)加減括號混合豎式計算180題
- 空調(diào)投標(biāo)書(范本)
- 第四單元課文復(fù)習(xí)(課件)部編版語文五年級上冊
- 決議公開范文(推薦十九篇)
- 助產(chǎn)士的溝通技巧課件
- 國際理解教育教案
- 健美操訓(xùn)練計劃
- 深基坑安全管理(安全培訓(xùn))課件
- 領(lǐng)導(dǎo)力與團(tuán)隊(duì)管理課件
評論
0/150
提交評論