抽樣分布基本概念-(共55張PPT)課件_第1頁(yè)
抽樣分布基本概念-(共55張PPT)課件_第2頁(yè)
抽樣分布基本概念-(共55張PPT)課件_第3頁(yè)
抽樣分布基本概念-(共55張PPT)課件_第4頁(yè)
抽樣分布基本概念-(共55張PPT)課件_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)學(xué)-從典型案例到問(wèn)題和思想 經(jīng)濟(jì)管理類“十三五”規(guī)劃教材 典型案例【6】第一節(jié) 抽樣分布基本概念 第二節(jié) 幾個(gè)常見(jiàn)的抽樣分布第五章 抽樣分布【典型案例6】如何決定是否購(gòu)買一批蘋果? 俗話說(shuō)“一日一蘋果,醫(yī)生遠(yuǎn)離我?!?假如現(xiàn)在面對(duì)一批蘋果,人們?nèi)绾瘟私馑鼈兛诟械木岛筒町愔?,以便作出是否?gòu)買這批蘋果的決策呢? 人們常用作法:從這批蘋果中隨機(jī)挑出幾個(gè)品嘗后,得出這幾個(gè)蘋果口感的均值和差異值,以此作為這批蘋果口感的均值和差異值,從而作出是否購(gòu)買這批蘋果的決策。 從統(tǒng)計(jì)學(xué)角度來(lái)講,挑出的幾個(gè)蘋果口感的均值和差異值就是樣本平均數(shù)和樣本方差,這批蘋果口感的均值和差異值是總體平均數(shù)和總體方差。 這種用

2、商品質(zhì)量數(shù)據(jù)的樣本平均數(shù)、樣本方差作為總體平均數(shù)、總體方差的作法,是人們購(gòu)買商品時(shí)常用的有效估計(jì)方法,其理論依據(jù)是本章將要學(xué)習(xí)的內(nèi)容?!镜湫桶咐?】如何決定是否購(gòu)買一批蘋果?第一節(jié) 抽樣分布基本概念一、樣本容量和樣本個(gè)數(shù) 二、參數(shù)和統(tǒng)計(jì)量三、抽樣分布四、抽樣分布的數(shù)字特征 總體是研究的所有個(gè)體構(gòu)成的集合,其中的個(gè)體的數(shù)目常用 表示。 從中隨機(jī)抽取部分個(gè)體構(gòu)成一個(gè)樣本,構(gòu)成樣本的個(gè)體的數(shù)目,常用 表示,稱為樣本容量,也稱樣本量。 例如,典型案例6中,一批蘋果有400個(gè),從中抽取8個(gè)進(jìn)行品嘗,那么 ,而 。顯然,從中可以得到很多個(gè)樣本。一、樣本容量和樣本個(gè)數(shù) 從一個(gè)含有N個(gè)個(gè)體的總體中,隨機(jī)抽取樣

3、本容量為n的樣本,可得到很多個(gè)樣本,此即樣本個(gè)數(shù)。 典型案例6中,將400個(gè)蘋果編號(hào),則隨機(jī)抽取的樣本可能是由編號(hào)為18的這8個(gè)蘋果構(gòu)成,也可能是由編號(hào)為101108的8個(gè)蘋果構(gòu)成等等。一、樣本容量和樣本個(gè)數(shù) 參數(shù)是用來(lái)描述總體數(shù)量特征的,如總體均值 、總體比例 、總體方差 等; 統(tǒng)計(jì)量是用來(lái)描述樣本數(shù)量特征的,是由樣本構(gòu)造的函數(shù),如樣本均值 、樣本比例 、樣本方差 等。 由于總體是唯一的、固定不變的,故參數(shù)往往是一個(gè)未知的常數(shù);而樣本不唯一,且一旦抽取出來(lái),就成為已知,故統(tǒng)計(jì)量是隨機(jī)變量,其取值隨著樣本的變化而改變。二、參數(shù)和統(tǒng)計(jì)量 抽樣的目的就是要根據(jù)樣本統(tǒng)計(jì)量去估計(jì)或推斷總體參數(shù)。 比如

4、,常用樣本均值 去推斷總體均值 、用樣本比例 去推斷總體比例 、用樣本方差 去推斷總體方差 。 以上做法的理論依據(jù)就是樣本統(tǒng)計(jì)量的抽樣分布。二、參數(shù)和統(tǒng)計(jì)量 統(tǒng)計(jì)量是隨機(jī)變量。抽樣分布就是統(tǒng)計(jì)量的概率分布。 如樣本均值的概率分布、樣本比例的概率分布、樣本方差的概率分布等都稱為抽樣分布。三、抽樣分布 以下將以樣本均值為例說(shuō)明統(tǒng)計(jì)量的抽樣分布。 【例5-1】設(shè)有一個(gè)總體,含有5個(gè)個(gè)體:10、20、30、40、50,即 。采取重復(fù)抽樣的方式從中抽取樣本容量為2的樣本,即 。 試寫出樣本均值 的抽樣分布。三、抽樣分布 解:由于 =5, =2,從總體中采取重復(fù)抽樣的方式抽取樣本,則樣本共有 =52=25

5、個(gè)。計(jì)算出這25個(gè)樣本的均值 ,其結(jié)果如表5-1所示。樣本序號(hào)樣本個(gè)體樣本均值樣本均值的概率110,1010125210,2015225310,3020325410,4025425510,5030525620,1015720,2020820,3025920,40301020,50354251130,10201230,20251330,30301430,40351530,50403251640,10251740,20301840,30351940,40402040,50452252150,10302250,20352350,30402450,40452550,5050125表5-1 n=2時(shí)樣本

6、均值的抽樣及其取值情況表5-2 =2時(shí)樣本均值 的抽樣分布從而,樣本均值 的概率分布如表5-2所示。三、抽樣分布 10 在例5-1中,若樣本容量n=4,則樣本共有 個(gè),并且例5-1中的總體是一個(gè)非常小的總體,現(xiàn)實(shí)世界中,我們面對(duì)的總體往往很大,進(jìn)而樣本數(shù)目將很可觀,不可能將所有的樣本都抽取出來(lái)。 因此抽樣分布實(shí)質(zhì)上是一種理論分布。它可能是精確的某已知分布,也可能是以某已知分布為極限的極限分布。三、抽樣分布 抽樣分布理論在推斷統(tǒng)計(jì)中具有重要的作用,它是后續(xù)參數(shù)估計(jì)和假設(shè)檢驗(yàn)的理論依據(jù)和基礎(chǔ)。三、抽樣分布 設(shè)總體的平均數(shù)為 ,方差為 ,采取重復(fù)抽樣的方式,從中抽取獨(dú)立同分布的樣本: , 。根據(jù)數(shù)學(xué)

7、期望和方差的性質(zhì),可推出:四、抽樣分布的數(shù)字特征(一)樣本均值的數(shù)字特征(5.1)在例5-1中,樣本均值的平均數(shù)總體均值 樣本均值的方差 總體方差 由于n =2,從而驗(yàn)證了(5.1)的正確性。四、抽樣分布的數(shù)字特征 由式(5.1)可知: 的平均數(shù)為 ,方差為 。隨著 的增大,其方差越來(lái)越小,從而 的取值越來(lái)越向著 靠攏,故用 去估計(jì) 理論依據(jù)成立。 由此可見(jiàn),典型案例6中,人們用挑選出的幾個(gè)蘋果口感的均值去估計(jì)這批蘋果口感的均值的做法是站得住腳的。四、抽樣分布的數(shù)字特征 以上結(jié)論均建立在重復(fù)抽樣情形下,若是在不重復(fù)抽樣情形下,方差需要用系數(shù) 進(jìn)行修正,從而樣本均值的數(shù)字特征為:(5.2)可見(jiàn):

8、用 去估計(jì) 理論依據(jù)同樣成立。四、抽樣分布的數(shù)字特征 比例:總體(或樣本)中具有某種屬性的個(gè)體數(shù)與全部個(gè)體數(shù)之比,總體比例記為 。 現(xiàn)有 ,采取重復(fù)抽樣的方式從中抽取獨(dú)立同分布的樣本: , 。樣本中變量值1出現(xiàn)次數(shù)記為 ,那么變量值1出現(xiàn)次數(shù)所占的比例為 / ,即 為樣本比例。(二)樣本比例的數(shù)字特征四、抽樣分布的數(shù)字特征 根據(jù)數(shù)學(xué)期望和方差的性質(zhì),可推出樣本比例 的數(shù)學(xué)期望、方差與總體的平均數(shù)、方差之間的關(guān)系:(5.3)四、抽樣分布的數(shù)字特征 由式(5.3)可知: 的平均數(shù)為總體比例 ,方差為 。隨著 的增大, 方差越來(lái)越小,從而 的取值越來(lái)越向 靠攏,故用 去估計(jì) 理論依據(jù)成立。 以上結(jié)論

9、均建立在重復(fù)抽樣情形下,若是在不重復(fù)抽樣情形下,當(dāng)樣本容量很大時(shí),方差需要用系數(shù)進(jìn)行修正,從而樣本比例的數(shù)字特征為:(5.4)可見(jiàn):用 去估計(jì) 理論依據(jù)同樣成立。四、抽樣分布的數(shù)字特征 設(shè)總體 的方差為 ,采取重復(fù)抽樣的方式,從中抽取獨(dú)立同分布的樣本: , , 。根據(jù)數(shù)學(xué)期望和方差的性質(zhì),可推出樣本方差的數(shù)學(xué)期望、方差與總體的方差之間的關(guān)系為:(5.5)(三)樣本方差的數(shù)字特征四、抽樣分布的數(shù)字特征 由式(5.5)可知:樣本方差的平均數(shù)為 ,方差為 ,隨著 的增大,其方差越來(lái)越小,從而 的取值越來(lái)越向著 靠攏,故用 去估計(jì) 理論依據(jù)成立。四、抽樣分布的數(shù)字特征 由此可見(jiàn),典型案例6中,人們用挑

10、選出的幾個(gè)蘋果口感的差異值去估計(jì)這批蘋果口感的差異值的做法是站得住腳的。 以上結(jié)論均建立在重復(fù)抽樣情形下,若是在不重復(fù)抽樣情形下,方差需要用系數(shù)進(jìn)行修正,從而樣本方差的數(shù)字特征為:(5.6)可見(jiàn):用 去估計(jì) 理論依據(jù)同樣成立。四、抽樣分布的數(shù)字特征 統(tǒng)計(jì)量抽樣分布的標(biāo)準(zhǔn)差,稱為統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤,也稱標(biāo)準(zhǔn)誤差。 標(biāo)準(zhǔn)誤可用于說(shuō)明抽樣誤差的大小。抽樣誤差是指由抽樣的隨機(jī)性引起的樣本結(jié)果與總體的真實(shí)值之間的差異,它描述的是所有樣本可能的結(jié)果與總體真值之間的平均性差異。若總體標(biāo)準(zhǔn)差未知,可用樣本標(biāo)準(zhǔn)差代替,此時(shí)的標(biāo)準(zhǔn)誤稱為估計(jì)標(biāo)準(zhǔn)誤。(四)標(biāo)準(zhǔn)誤(重點(diǎn))四、抽樣分布的數(shù)字特征 樣本比例的標(biāo)準(zhǔn)誤為 。當(dāng)總

11、體比例 未知時(shí),可用樣本比例代替,此時(shí)得到的標(biāo)準(zhǔn)誤稱為估計(jì)標(biāo)準(zhǔn)誤。四、抽樣分布的數(shù)字特征 樣本方差的標(biāo)準(zhǔn)誤為 。當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差代替,此時(shí)得到的標(biāo)準(zhǔn)誤稱為估計(jì)標(biāo)準(zhǔn)誤。 樣本均值的標(biāo)準(zhǔn)誤為 。當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差代替,此時(shí)得到的標(biāo)準(zhǔn)誤稱為估計(jì)標(biāo)準(zhǔn)誤。一、樣本均值的抽樣分布二、樣本比例的抽樣分布三、樣本方差的抽樣分布四、t分布和F分布第二節(jié) 幾個(gè)常見(jiàn)的抽樣分布 抽樣分布即統(tǒng)計(jì)量的概率分布。本節(jié)將分別對(duì)樣本均值、樣本比例以及樣本方差的抽樣分布作詳細(xì)的討論。 如無(wú)特別說(shuō)明,本章中的抽樣方式均指重復(fù)抽樣。第二節(jié) 幾個(gè)常見(jiàn)的抽樣分布 樣本均值的抽樣分布,就是采取重復(fù)抽樣的方

12、式,選取容量為 的所有樣本,由樣本均值所有可能的取值形成的概率分布。它是推斷總體均值 的理論基礎(chǔ)。 以下分兩種情況來(lái)討論樣本均值 的抽樣分布類型。一、樣本均值的抽樣分布 正態(tài)分布的再生定理:若總體變量 ,從這個(gè)總體中抽取容量為 的樣本,則樣本均值 。 (一)總體服從正態(tài)分布一、樣本均值的抽樣分布正態(tài)分布:若 的概率密度函數(shù)為 (5.7)其中, 和 都是參數(shù),且 ,則稱 服從參數(shù)為 和 的正態(tài)分布,記作 。其概率密度函數(shù)圖見(jiàn)圖5-1。圖5-1 正態(tài)分布概率密度函數(shù)圖一、樣本均值的抽樣分布正態(tài)分布概率密度函數(shù) 的性質(zhì):(1) ,即整個(gè)曲線都在x軸的上方; (2)曲線 相對(duì)于 對(duì)稱,并在 處達(dá)到最大

13、值 ;(3)曲線的陡緩程度由 決定, 越大,曲線越平緩; 越小,曲線越陡峭。(4)當(dāng) 趨于無(wú)窮時(shí),曲線以 軸為漸近線。 正態(tài)分布的概率密度曲線是一條對(duì)稱的鐘型曲線。 決定了圖形的中位置, 決定了圖形中曲線的陡峭程度。 特別地,當(dāng)參數(shù) =0, =1時(shí),這樣的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布,記為 ,其概率密度函數(shù)為:一、樣本均值的抽樣分布 獨(dú)立同分布中心極限定理表明:無(wú)論總體服從何種分布,只要其平均數(shù)和方差存在,那么從中抽取的獨(dú)立同分布樣本 , ,其均值在當(dāng) 很大時(shí),就會(huì)近似服從正態(tài)分布 。(二)總體服從非正態(tài)分布 實(shí)際應(yīng)用中,一般取 ,此時(shí)的樣本稱為大樣本。若為小樣本,且總體分布不是正態(tài)分布,此時(shí)不能按

14、照正態(tài)分布來(lái)處理,要運(yùn)用小樣本的相關(guān)理論來(lái)討論。 圖5-2 樣本均值的抽樣分布圖大樣本小樣本正態(tài)分布非正態(tài)分布總體( )非正態(tài)分布正態(tài)分布一、樣本均值的抽樣分布 根據(jù)本章第一節(jié),在不重復(fù)抽樣情形下,樣本均值的抽樣分布為: (5.8)一、樣本均值的抽樣分布 【例5-2】假設(shè)在一個(gè)飯店門口等待出租車的時(shí)間是服從左偏分布的,均值為12分鐘,標(biāo)準(zhǔn)差為3分鐘?,F(xiàn)從飯店門口隨機(jī)抽取100名顧客并記錄他們等待出租車的時(shí)間,考察100名顧客的平均等待時(shí)間的抽樣分布。一、樣本均值的抽樣分布 解:依題意,總體均值 =12, =3,根據(jù)中心極限定理可知:樣本均值(100名顧客的平均等待時(shí)間)的抽樣分布為: ,即:

15、一、樣本均值的抽樣分布 【例5-3】人口普查發(fā)現(xiàn),某地區(qū)成年男子的身高服從正態(tài)分布N(175, 62),采取重復(fù)抽樣的方式從該地區(qū)抽取64名成年男子構(gòu)成樣本,求樣本均值的平均數(shù)和方差。一、樣本均值的抽樣分布 解:依題意,總體服從正態(tài)分布,且 =175, =62。根據(jù)正態(tài)分布的再生定理,樣本均值 ,即樣本均值的平均數(shù) ,樣本均值的方差 。 樣本比例 的抽樣分布,就是采取重復(fù)抽樣的方式,選取容量為 的所有樣本,由樣本比例 的所有可能的取值形成的概率分布。它是推斷總體比例 的理論基礎(chǔ)。二、樣本比例p的抽樣分布 可以看到,樣本比例是一種特殊的樣本均值。從而,根據(jù)樣本均值的抽樣分布理論可得樣本比例的抽樣

16、分布。 一般地,若能同時(shí)滿足 和 ,就可以認(rèn)為樣本容量很大。 樣本比例 的抽樣分布為:在滿足條件的情況下,即當(dāng)樣本容量很大時(shí) (5.9)二、樣本比例p的抽樣分布 在不重復(fù)抽樣情形下,當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布為: (5.10)二、樣本比例p的抽樣分布 說(shuō)明:在不重復(fù)抽樣情形下,對(duì)于無(wú)限總體也可以按重復(fù)抽樣來(lái)處理,即方差不用修正;對(duì)于有限總體,要用修正系數(shù)修正,另外,若此時(shí) 很大而抽樣比 時(shí),修正系數(shù)趨于1,方差可以按重復(fù)抽樣情形時(shí)(即不用修正)的公式計(jì)算。 樣本方差 的抽樣分布,就是采取重復(fù)抽樣的方式,選取容量為 的所有樣本,由樣本方差 的所有可能的取值形成的概率分布。它是推斷總體方

17、差 的理論基礎(chǔ)。三、樣本方差S2的抽樣分布 設(shè)總體服從均值為 ,方差 的正態(tài)分布, , , 為來(lái)自該總體的樣本,則樣本方差 的抽樣分布為: (5.11)稱 服從自由度為 的 分布(卡方分布)。三、樣本方差S2的抽樣分布 卡方分布:設(shè) , 為來(lái)自于標(biāo)準(zhǔn)正態(tài)總體N(0,1)的樣本,則 服從自由度為 的 分布,記為 ,讀作卡方分布。三、樣本方差S2的抽樣分布圖5-3 卡方分布的概率密度函數(shù)圖三、樣本方差S2的抽樣分布 卡方分布的數(shù)字特征為:若 ,則總體平均數(shù) ,方差 。由卡方分布的數(shù)字特征,可得:(5.12) 在不重復(fù)抽樣情形下,方差為 。三、樣本方差S2的抽樣分布(一) t分布 t分布也稱為學(xué)生氏

18、分布,是戈塞特于1908年在一篇以“Student”(學(xué)生)為筆名的論文中首次提出的。 設(shè) 且 與 相互獨(dú)立,則稱隨機(jī)變量 服從自由度為 的t分布,記作 t 。四、t分布和F分布圖5-4 分布的概率密度函數(shù)圖四、t分布和F分布 分布概率密度函數(shù)曲線是以縱軸為對(duì)稱軸的單峰對(duì)稱圖形,其與標(biāo)準(zhǔn)正態(tài)分布曲線類似, 分布曲線頂部略低,兩尾部稍高而平。自由度 越大, 分布越趨近于標(biāo)準(zhǔn)正態(tài)分布,當(dāng) 時(shí), 分布與標(biāo)準(zhǔn)正態(tài)分布完全一致。四、t分布和F分布分布的數(shù)字特征為: 若 , ,且 與 相互獨(dú)立,則隨機(jī)變量 服從自由度為 的F分布,記作 。其中, 稱為第一自由度, 稱為第二自由度。四、t分布和F分布(一)

19、F分布 F分布是由統(tǒng)計(jì)學(xué)家費(fèi)希爾首次提出的。圖5-5 F分布的概率密度函數(shù)圖四、t分布和F分布 F分布的數(shù)字特征為:若隨機(jī)變量 ,則 四、t分布和F分布; 。 對(duì)于給定的 ,稱滿足條件: 的點(diǎn) 為 分布的上 分位點(diǎn)。有結(jié)論: 。四、t分布和F分布以下是關(guān)于F分布的兩個(gè)常見(jiàn)結(jié)論。 隨機(jī)變量 ,則 。這個(gè)結(jié)論在后面回歸分析的回歸系數(shù)顯著性檢驗(yàn)中有用到。激勵(lì)學(xué)生學(xué)習(xí)的名言格言220、每一個(gè)成功者都有一個(gè)開(kāi)始。勇于開(kāi)始,才能找到成功的路。221、世界會(huì)向那些有目標(biāo)和遠(yuǎn)見(jiàn)的人讓路(馮兩努香港著名推銷商)222、絆腳石乃是進(jìn)身之階。223、銷售世界上第一號(hào)的產(chǎn)品不是汽車,而是自己。在你成功地把自己推銷給別人之前,你必須百分之百的把自己推銷給自己。224、即使爬到最高的山上,一次也只能腳踏實(shí)地地邁一步。225、積極思考造成積極人生,消極思考造成消極人生。226、人之所以有一張嘴,而有兩只耳朵,原因是聽(tīng)的要比說(shuō)的多一倍。227、別想一下造出大海,必須先由小河川開(kāi)始。228、有事者,事竟

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論