《應(yīng)用統(tǒng)計(jì)分析》課件-第3章 參數(shù)估計(jì)_第1頁
《應(yīng)用統(tǒng)計(jì)分析》課件-第3章 參數(shù)估計(jì)_第2頁
《應(yīng)用統(tǒng)計(jì)分析》課件-第3章 參數(shù)估計(jì)_第3頁
《應(yīng)用統(tǒng)計(jì)分析》課件-第3章 參數(shù)估計(jì)_第4頁
《應(yīng)用統(tǒng)計(jì)分析》課件-第3章 參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩132頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第3章參數(shù)估計(jì)3.1參數(shù)估計(jì)概述3.2點(diǎn)估計(jì)3.3區(qū)間估計(jì)3.4樣本容量的確定3.5Bootstrap區(qū)間估計(jì)3.6SPSS應(yīng)用舉例1第1節(jié)參數(shù)估計(jì)概述3.1.1基本思想3.1.2數(shù)據(jù)的適用范圍23.1.1基本思想3統(tǒng)計(jì)推斷的過程樣本總體樣本統(tǒng)計(jì)量如:樣本均值、比例、方差總體均值、比例、方差等3.1.1基本思想4參數(shù)估計(jì):在實(shí)際問題中,我們經(jīng)常需要得知一些總體的總體均值、總體方差、總體比例等數(shù)量特征,如果我們已知總體中的所有數(shù)據(jù)值,就可以通過簡單的統(tǒng)計(jì)描述得到該值。但是,往往會出現(xiàn)總體數(shù)據(jù)數(shù)量太多的情況,在這種情況下我們需要對總體數(shù)據(jù)進(jìn)行抽樣,通過總體中已有的某些樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)。這樣的估計(jì)方法稱為參數(shù)估計(jì)。3.1.1基本思想5

3.1.2數(shù)據(jù)的適用范圍6本章介紹的參數(shù)估計(jì)的方法主要有點(diǎn)估計(jì)法、區(qū)間估計(jì)法、Boostrap區(qū)間估計(jì)法三種。點(diǎn)估計(jì)法:矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法區(qū)間估計(jì):對單總體的均值、比例、方差的分析和對雙總體的均值差、比例差、方差比的研究Bootstrap:經(jīng)驗(yàn)Bootstrap法和Bootstrap百分位法3.1.2數(shù)據(jù)的適用范圍7與比例有關(guān)的估計(jì)問題針對定性數(shù)據(jù)與均值方差有關(guān)的問題則針對定量數(shù)據(jù)。除Boostrap區(qū)間估計(jì)外的其他方法均對總體是大樣本還是小樣本、服從正態(tài)分布有具體要求Boostrap區(qū)間估計(jì)則對數(shù)量與服從分布完全沒有要求第2節(jié)點(diǎn)估計(jì)3.2.1矩估計(jì)法3.2.2順序統(tǒng)計(jì)量法3.2.3最大似然法3.2.4最小二乘法3.2.5評價估計(jì)量的標(biāo)準(zhǔn)83.2點(diǎn)估計(jì)9矩估計(jì)法最小二乘法最大似然法順序統(tǒng)計(jì)量法估計(jì)方法點(diǎn)估計(jì)區(qū)間估計(jì)3.2點(diǎn)估計(jì)10用樣本的估計(jì)量的某個取值直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì);用兩個樣本均值之差直接作為總體均值之差的估計(jì)無法給出估計(jì)值接近總體參數(shù)程度的信息雖然在重復(fù)抽樣條件下,點(diǎn)估計(jì)的均值可望等于總體真值,但由于樣本是隨機(jī)的,抽出一個具體的樣本得到的估計(jì)值很可能不同于總體真值一個點(diǎn)估計(jì)量的可靠性是由它的抽樣標(biāo)準(zhǔn)誤差來衡量的,這表明一個具體的點(diǎn)估計(jì)值無法給出估計(jì)的可靠性的度量3.2.1矩估計(jì)法11當(dāng)想要獲得某總體的k階矩的估計(jì)量(如總體均值:一階矩;總體方差:二階矩)時,可以使用矩估計(jì)法。矩估計(jì)法可以對定量數(shù)據(jù)中的定距數(shù)據(jù)與定比數(shù)據(jù)進(jìn)行處理,且它的估計(jì)量與樣本容量的大小、服從的分布無關(guān)。矩估計(jì)法是英國統(tǒng)計(jì)學(xué)家K.Pearson最早提出的,它的理論基礎(chǔ)是辛欽大數(shù)定律,是基于“替換思想”建立起來的估計(jì)方法。矩估計(jì)法的思路為:用樣本的k階矩作為總體的hk階矩的估計(jì)量,建立含待估計(jì)參數(shù)的方程,從而解出待估計(jì)參數(shù)。3.2.1矩估計(jì)法12記總體k階原點(diǎn)矩為:樣本k階原點(diǎn)矩為:總體k階中心距為:樣本k階中心距為:用上述相應(yīng)的樣本矩去估計(jì)總體矩的估計(jì)方法就是矩估計(jì)法。3.2.1矩估計(jì)法矩估計(jì)法(例題分析)【例3.1】抽樣調(diào)查某班10名同學(xué)“應(yīng)用統(tǒng)計(jì)學(xué)”考試的成績,調(diào)查結(jié)果如下表所示。請用矩估計(jì)法估計(jì)總體的均值和標(biāo)準(zhǔn)差。133.2.1矩估計(jì)法矩估計(jì)法(例題分析)143.2.1矩估計(jì)法矩估計(jì)法(例題分析)15因此,由矩估計(jì)法公式可得3.2.2順序統(tǒng)計(jì)量法16當(dāng)想要使用數(shù)據(jù)排列后某位置的特殊值作為估計(jì)量,則可以使用順序統(tǒng)計(jì)量法。順序統(tǒng)計(jì)量法可以對定量數(shù)據(jù)進(jìn)行排序、分析處理,且估計(jì)量與該數(shù)據(jù)的樣本容量大小、分布情況無關(guān)。順序統(tǒng)計(jì)量估計(jì)是指用順序統(tǒng)計(jì)量或其函數(shù)構(gòu)造的估計(jì),它的基本思想是:將總體中的某樣本的數(shù)據(jù)按照從小到大的順序排列后,選取重新排列后某個位置的值代表總體的未知參數(shù)值。3.2.2順序統(tǒng)計(jì)量法17

3.2.2順序統(tǒng)計(jì)量法18

3.2.2順序統(tǒng)計(jì)量法19

中位數(shù)不受極端值的影響,且滿足各變量與中位數(shù)的離差絕對值之和最小,即

3.2.2順序統(tǒng)計(jì)量法20

3.2.2順序統(tǒng)計(jì)量法順序統(tǒng)計(jì)量法(例題分析)【例3.2】為了估計(jì)某批燈泡的平均壽命μ與燈泡壽命的標(biāo)準(zhǔn)差σ,隨機(jī)抽取7個燈泡測得壽命數(shù)據(jù)為:1575,1503,1346,1630,1575,1453,1650h。試用順序統(tǒng)計(jì)量估計(jì)法估計(jì)μ、σ。213.2.2順序統(tǒng)計(jì)量法順序統(tǒng)計(jì)量法(例題分析)22解:樣本順序統(tǒng)計(jì)量的觀測值為:1364,1453,1530,1575,1575,1630,1650n=7為奇數(shù),所以μ的順序統(tǒng)計(jì)量估計(jì)值為中位數(shù):=x4=1575x7=1650,x1=1364,所以σ的順序統(tǒng)計(jì)量估計(jì)值為極差:R=x7–x1=2863.2.3最大似然法23當(dāng)想要求一個樣本集的相關(guān)概率密度函數(shù)的參數(shù)時,可以使用最大似然法。最大似然法可以對定量數(shù)據(jù)進(jìn)行分析處理。由于涉及概率密度函數(shù),估計(jì)量通常與數(shù)據(jù)服從的分布有關(guān)。當(dāng)想要求一個樣本集的相關(guān)概率密度函數(shù)的參數(shù)時,可以使用最大似然法。最大似然法可以對定量數(shù)據(jù)進(jìn)行分析處理。由于涉及概率密度函數(shù),估計(jì)量通常與數(shù)據(jù)服從的分布有關(guān)。3.2.3最大似然法24設(shè)總體的概率密度為f(x;θ),其中θ為待估計(jì)參數(shù)。設(shè)X,X,…X。是總體的一個隨機(jī)樣本,由于樣本內(nèi)每個元素是相互獨(dú)立的,因此有:其中,L(θ)稱為樣本的似然函數(shù)。3.2.3最大似然法25

3.2.3最大似然法最大似然法(例題分析)26【例3.3】設(shè)總體X的概率密度為:其中θ>-1,是未知參數(shù),X1,X2,…,Xn是來自總體X的一個容量為n的簡單隨機(jī)樣本,是分別用矩估計(jì)和最大似然估計(jì)法求θ的估計(jì)值。3.2.3最大似然法最大似然法(例題分析)273.2.3最大似然法最大似然法(例題分析)28最大似然估計(jì)法:3.2.4最小二乘法29當(dāng)希望求到與數(shù)據(jù)匹配的函數(shù)表達(dá)時,可以使用最小二乘法。最小二乘法可以對定量數(shù)據(jù)中的定距數(shù)據(jù)與定比數(shù)據(jù)進(jìn)行處理,且它的估計(jì)量與樣本容量的大小、服從的分布無關(guān)。最小二乘法可以是研究一組數(shù)據(jù)的特征,也可以研究兩組數(shù)據(jù)的關(guān)系?!岸恕奔雌椒降囊馑迹白钚《朔ā奔础捌椒胶妥钚 狈?。最小二乘法估計(jì)是通過最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配。找到匹配的函數(shù)后,則可求得未知的數(shù)據(jù),且求得的數(shù)據(jù)與實(shí)際數(shù)據(jù)之間誤差的平方和是最小的,如下圖所示。3.2.4最小二乘法30最小二乘法圖示3.2.5評價估計(jì)量的標(biāo)準(zhǔn)31P(

)BA無偏有偏無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)無偏性(unbiasedness)3.2.4最小二乘法最小二乘法(例題分析)32【例3.4】某班學(xué)生每周用于英語學(xué)習(xí)的時間x(單位:h)與數(shù)學(xué)成績y(單位:分)之間的對應(yīng)數(shù)據(jù)如表所示。如果y與x之間有線性關(guān)系,求回歸直線方程3.2.4最小二乘法最小二乘法(例題分析)33解:列出下表并進(jìn)行計(jì)算3.2.4最小二乘法最小二乘法(例題分析)34因此,所求的回歸方程是3.2.5評價估計(jì)量的標(biāo)準(zhǔn)35有效性:對同一總體參數(shù)的兩個無偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效

有效性(efficiency)AB

的抽樣分布

的抽樣分布P(

)3.2.5評價估計(jì)量的標(biāo)準(zhǔn)36一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)一致性(consistency)AB較小的樣本容量較大的樣本容量P(

)第3節(jié)區(qū)間估計(jì)3.3.1區(qū)間估計(jì)概述3.3.2單總體參數(shù)區(qū)間估計(jì)3.3.3雙總體參數(shù)區(qū)間估計(jì)373.3.1區(qū)間估計(jì)概述38在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減估計(jì)誤差而得到根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個概率度量比如,某班級平均分?jǐn)?shù)在75~85之間,置信水平是95%3.3.1區(qū)間估計(jì)概述區(qū)間估計(jì)的圖示

x95%的樣本

-1.96

x

+1.96

x99%的樣本

-2.58

x

+2.58

x90%的樣本

-1.65

x

+1.65

x393.3.1區(qū)間估計(jì)概述置信水平(confidencelevel)將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平表示為(1-

為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應(yīng)的

為0.01,0.05,0.10403.3.1區(qū)間估計(jì)概述置信區(qū)間(confidenceinterval)由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間統(tǒng)計(jì)學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個總體參數(shù)以一定的概率落在這一區(qū)間的表述是錯誤的413.3.1區(qū)間估計(jì)概述置信區(qū)間(95%的置信區(qū)間)重復(fù)構(gòu)造出的20個置信區(qū)間

點(diǎn)估計(jì)值423.3.1區(qū)間估計(jì)概述影響區(qū)間寬度的因素總體數(shù)據(jù)的離散程度,用

來測度樣本容量n,

置信水平(1-

),影響z的大小433.3.2單總體參數(shù)區(qū)間估計(jì)單總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號表示樣本統(tǒng)計(jì)量均值比例方差443.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(大樣本)1. 假定條件總體服從正態(tài)分布,且方差(

2)

已知如果不是正態(tài)分布,可由正態(tài)分布來近似(n

30)2.使用正態(tài)分布統(tǒng)計(jì)量z總體均值

在1-

置信水平下的置信區(qū)間為453.3.2單總體參數(shù)區(qū)間估計(jì)數(shù)據(jù)正態(tài)性的評估方法對數(shù)據(jù)畫出頻數(shù)分布的直方圖或莖葉圖若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與上面給出的正態(tài)曲線應(yīng)該相似求出樣本數(shù)據(jù)的四分位差Qd和標(biāo)準(zhǔn)差s,然后計(jì)算比值Qd/s

。若數(shù)據(jù)近似服從正態(tài)分布,則有

Qd/s

1.3繪制正態(tài)概率圖463.3.2單總體參數(shù)區(qū)間估計(jì)正態(tài)概率圖的繪制(normalprobabilityplots)

正態(tài)概率圖可以在概率紙上繪制,也可以在普通紙上繪制。在普通紙上繪制正態(tài)概率圖的步驟第1步:將樣本觀察值從小到大排列第2步:求出樣本觀察值的標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)zi

。標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)滿足第3步:將zi作為縱軸,xi作為橫軸,繪制圖形,即為標(biāo)準(zhǔn)正態(tài)概率圖473.3.2單總體參數(shù)區(qū)間估計(jì)正態(tài)概率圖的繪制(例題分析)【例】一家電腦公司連續(xù)10天的銷售額(單位:萬元)分別為176,191,214,,220,205,192,201,190,183,185。繪制正態(tài)概率圖,判斷該組數(shù)據(jù)是否服從正態(tài)分布483.3.2單總體參數(shù)區(qū)間估計(jì)正態(tài)概率圖的繪制(例題分析)電腦公司銷售額的正態(tài)概率圖

493.3.2單總體參數(shù)區(qū)間估計(jì)正態(tài)概率圖的判斷503.3.2單總體參數(shù)區(qū)間估計(jì)正態(tài)概率圖的判斷

短尾分布:如果尾部比正常的短,則點(diǎn)所形成的圖形左邊朝直線上方彎曲,右邊朝直線下方彎曲——如果傾斜向右看,圖形呈S型。表明數(shù)據(jù)比標(biāo)準(zhǔn)正態(tài)分布時候更加集中靠近均值。

長尾分布:如果尾部比正常的長,則點(diǎn)所形成的圖形左邊朝直線下方彎曲,右邊朝直線上方彎曲——如果傾斜向右看,圖形呈倒S型。表明數(shù)據(jù)比標(biāo)準(zhǔn)正態(tài)分布時候有更多偏離的數(shù)據(jù)。一個雙峰分布也可能是這個形狀。513.3.2單總體參數(shù)區(qū)間估計(jì)正態(tài)概率圖的判斷

右偏態(tài)分布:右偏態(tài)分布左邊尾部短,右邊尾部長。因此,點(diǎn)所形成的圖形與直線相比向上彎曲,或者說呈U型。把正態(tài)分布左邊截去,也會是這種形狀。

左偏態(tài)分布:左偏態(tài)分布左邊尾部長,右邊尾部短。因此,點(diǎn)所形成的圖形與直線相比向下彎曲。把正態(tài)分布右邊截去,也會是這種形狀。523.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(例題分析)【例3.5】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進(jìn)行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量(單位:g)如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10g。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3533.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(例題分析—正態(tài)性評估)食品重量的正態(tài)概率圖543.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(例題分析)解:已知X~N(

,102),n=25,1-

=95%,z

/2=1.96。根據(jù)樣本數(shù)據(jù)計(jì)算得:。由于是正態(tài)總體,且方差已知??傮w均值

在1-

置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44g~109.28g統(tǒng)計(jì)函數(shù)—CONFIDENCE553.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(例題分析)【例】一家保險(xiǎn)公司收集到由36投保個人組成的隨機(jī)樣本,得到每個投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間36個投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532563.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(例題分析)解:已知n=36,1-

=90%,z

/2=1.645。根據(jù)樣本數(shù)據(jù)計(jì)算得:,總體均值

在1-

置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲573.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(例題分析)【例3.6】從華南理工大學(xué)2020屆本科畢業(yè)生中隨機(jī)抽取30人的畢業(yè)薪酬(單位:元)如下:5858780082208540880080009200854075001100072008220830078007800860088009000875096009430102008100840085407500950085008350825080003.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(例題分析)

即華南理工大學(xué)2020屆本科畢業(yè)生平均畢業(yè)薪酬的置信區(qū)間為8304.34~8793.66元593.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(小樣本)1. 假定條件總體服從正態(tài)分布,但方差(

2)

未知小樣本(n<30)2.使用t

分布統(tǒng)計(jì)量總體均值

在1-

置信水平下的置信區(qū)間為603.3.2單總體參數(shù)區(qū)間估計(jì)t分布

t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z613.3.2單總體參數(shù)區(qū)間估計(jì)t分布(用Excel繪制t分布圖)第1步:在工作表的第1列A2:A62輸入一個等差數(shù)列,初始值為“-3”,步長為“0.1”,終值為“3”第2步:在單元格C1輸入t分布的自由度(如“20”)第3步:在單元格B2輸入公式“=TDIST(-A2,$C$1,1)”,并將其復(fù)制到B3:B32區(qū)域,在B33輸入公式“=TDIST(A33,$C$1,1)”并將其復(fù)制到B34:B62區(qū)域第4步:在單元格C3輸入公“=(B3-B2)*10”,并將其復(fù)制到C4

:C31區(qū)域,在單元格C32輸入公式“=(B32-B33)*10”

并將其復(fù)制到C33:C61區(qū)域第5步:將A2:A62作為橫坐標(biāo),C2:C62作為縱坐標(biāo),根據(jù)“圖表向?qū)А崩L制折線圖623.3.2單總體參數(shù)區(qū)間估計(jì)t分布(用Excel繪制t分布圖)633.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(例題分析)【例3.7】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16只燈泡使用壽命的數(shù)據(jù)151015201480150014501480151015201480149015301510146014601470147064643.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(例題分析-正態(tài)性評估)燈泡壽命的正態(tài)概率圖653.3.2單總體參數(shù)區(qū)間估計(jì)總體均值的區(qū)間估計(jì)(例題分析)解:已知X~N(

,2),n=16,1-

=95%,t

/2=2.131

根據(jù)樣本數(shù)據(jù)計(jì)算得:,

總體均值

在1-

置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8h~1503.2h663.3.2單總體參數(shù)區(qū)間估計(jì)總體比例的區(qū)間估計(jì)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量z3.總體比例

在1-

置信水平下的置信區(qū)間為673.3.2單總體參數(shù)區(qū)間估計(jì)總體比例的區(qū)間估計(jì)(例題分析)68【例3.8】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%3.3.2單總體參數(shù)區(qū)間估計(jì)總體方差的區(qū)間估計(jì)691. 估計(jì)一個總體的方差或標(biāo)準(zhǔn)差2. 假設(shè)總體服從正態(tài)分布3.總體方差

2

的點(diǎn)估計(jì)量為s2,且4.總體方差在1-

置信水平下的置信區(qū)間為3.3.2單總體參數(shù)區(qū)間估計(jì)總體方差的區(qū)間估計(jì)(圖示)70

2

21-

2

總體方差1-

的置信區(qū)間自由度為n-1的

23.3.2單總體參數(shù)區(qū)間估計(jì)總體方差的區(qū)間估計(jì)(例題分析)71【例3.9】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間25袋食品的重量單位:g112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.33.3.2單總體參數(shù)區(qū)間估計(jì)總體方差的區(qū)間估計(jì)(例題分析)72解:已知n=25,1-

=95%,根據(jù)樣本數(shù)據(jù)計(jì)算得

s2=93.21

2置信度為95%的置信區(qū)間為該企業(yè)生產(chǎn)的食品總體重量標(biāo)準(zhǔn)差的的置信區(qū)間為7.54g~13.43g3.3.2單總體參數(shù)區(qū)間估計(jì)單總體參數(shù)區(qū)間估計(jì)(小結(jié))73待估參數(shù)均值比例方差大樣本小樣本大樣本

2分布

2已知

2已知Z分布

2未知Z分布Z分布Z分布

2未知t分布3.3.2單總體參數(shù)區(qū)間估計(jì)未來觀察值的預(yù)測區(qū)間估計(jì)74預(yù)測隨機(jī)變量未來的觀察值,并希望求出各某個未來觀察值的取值范圍,這個范圍就是對某個未來觀察值的預(yù)測區(qū)間估計(jì)預(yù)測誤差的期望為,預(yù)測誤差的方差為未來觀察值經(jīng)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布,當(dāng)用樣本方差s2代替總體方差2后,則服從t分布新觀察值95%的預(yù)測區(qū)間為743.3.3雙總體參數(shù)區(qū)間估計(jì)雙總體參數(shù)區(qū)間估計(jì)7575總體參數(shù)符號表示樣本統(tǒng)計(jì)量均值差比例差方差比3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(大樣本)76761. 假定條件兩個總體都服從正態(tài)分布,

12,

22已知若不是正態(tài)分布,可以用正態(tài)分布來近似(n1

30和n2

30)兩個樣本是獨(dú)立的隨機(jī)樣本2.使用正態(tài)分布統(tǒng)計(jì)量z3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(大樣本)77771.

12,

22已知時,兩個總體均值之差

1-

2在1-

置信水平下的置信區(qū)間為

12,

22未知時,兩個總體均值之差

1-

2在1-

置信水平下的置信區(qū)間為3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(例題分析)7878【例3.10】某地區(qū)教育管理部門想估計(jì)兩所中學(xué)的學(xué)生高考時的英語平均分?jǐn)?shù)之差,為此在兩所中學(xué)獨(dú)立抽取兩個隨機(jī)樣本,有關(guān)數(shù)據(jù)如右表所示。建立兩所中學(xué)高考英語平均分?jǐn)?shù)之差95%的置信區(qū)間

兩個樣本的有關(guān)數(shù)據(jù)中學(xué)1中學(xué)2n1=46n1=33S1=5.8S2=7.2English3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(例題分析)7979解:兩個總體均值之差在1-

置信水平下的置信區(qū)間為兩所中學(xué)高考英語平均分?jǐn)?shù)之差的置信區(qū)間為5.03分~10.97分3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(小樣本:

12=

22

)80801. 假定條件兩個總體都服從正態(tài)分布兩個總體方差未知但相等:

12=

22兩個獨(dú)立的小樣本(n1<30和n2<30)2.總體方差的合并估計(jì)量估計(jì)量

x1-x2的抽樣標(biāo)準(zhǔn)差3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(小樣本:

12=

22

)81兩個樣本均值之差的標(biāo)準(zhǔn)化兩個總體均值之差

1-

2在1-

置信水平下的置信區(qū)間為3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(例題分析)82【例】為估計(jì)兩種方法組裝產(chǎn)品所需時間的差異,分別對兩種不同的組裝方法各隨機(jī)安排12名工人,每個工人組裝一件產(chǎn)品所需的時間(單位:min)如下表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間兩個方法組裝產(chǎn)品所需的時間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5213.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(例題分析—正態(tài)性評估)83兩種方法組裝時間的正態(tài)概率圖

3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(例題分析)84解:根據(jù)樣本數(shù)據(jù)計(jì)算得合并估計(jì)量為兩種方法組裝產(chǎn)品所需平均時間之差的置信區(qū)間為0.14min~7.26min3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(小樣本:

12

22

)851. 假定條件兩個總體都服從正態(tài)分布兩個總體方差未知且不相等:

12

22兩個獨(dú)立的小樣本(n1<30和n2<30)2.使用統(tǒng)計(jì)量3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(小樣本:

12

22

)86

兩個總體均值之差

1-

2在1-

置信水平下的置信區(qū)間為自由度3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(例題分析)87【例】沿用前例。假定第一種方法隨機(jī)安排12名工人,第二種方法隨機(jī)安排8名工人,即n1=12,n2=8,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間兩個方法組裝產(chǎn)品所需的時間方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.2213.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(例題分析)88解:根據(jù)樣本數(shù)據(jù)計(jì)算得自由度為兩種方法組裝產(chǎn)品所需平均時間之差的置信區(qū)間為0.192min~9.058min3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(匹配大樣本)89假定條件兩個匹配的大樣本(n1

30和n2

30)兩個總體各觀察值的配對差服從正態(tài)分布兩個總體均值之差

d=

1-

2在1-

置信水平下的置信區(qū)間為對應(yīng)差值的均值對應(yīng)差值的標(biāo)準(zhǔn)差3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(匹配小樣本)90假定條件兩個匹配的小樣本(n1<30和n2<30)兩個總體各觀察值的配對差服從正態(tài)分布

兩個總體均值之差

d=

1-

2在1-

置信水平下的置信區(qū)間為3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(例題分析)91【例】由10名學(xué)生組成一個隨機(jī)樣本,讓他們分別采用A和B兩套試卷進(jìn)行測試,結(jié)果如右表。試建立兩種試卷分?jǐn)?shù)之差

d=

1-

295%的置信區(qū)間

10名學(xué)生兩套試卷的得分學(xué)生編號試卷A試卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916STATISTICS3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(例題分析—正態(tài)性評估)92兩套試卷分?jǐn)?shù)之差的正態(tài)概率圖3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體均值之差的估計(jì)(例題分析)93解:根據(jù)樣本數(shù)據(jù)計(jì)算得兩種試卷所產(chǎn)生的分?jǐn)?shù)之差的置信區(qū)間為6.33分~15.67分3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體比例之差的區(qū)間估計(jì)941. 假定條件兩個總體服從二項(xiàng)分布可以用正態(tài)分布來近似兩個樣本是獨(dú)立的2. 兩個總體比例之差

1-

2在1-

置信水平下的置信區(qū)間為3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體比例之差的區(qū)間估計(jì)(例題分析)95【例3.11】在某個電視節(jié)目的收視率調(diào)查中,農(nóng)村隨機(jī)調(diào)查了400人,有32%的人收看了該節(jié)目;城市隨機(jī)調(diào)查了500人,有45%的人收看了該節(jié)目。試以90%的置信水平估計(jì)城市與農(nóng)村收視率差別的置信區(qū)間123.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體比例之差的區(qū)間估計(jì)(例題分析)96解:已知

n1=500,n2=400,p1=45%,p2=32%,

1-

=95%,z/2=1.96

1-

2置信度為95%的置信區(qū)間為城市與農(nóng)村收視率差值的置信區(qū)間為6.68%~19.32%3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體方差比的區(qū)間估計(jì)971. 比較兩個總體的方差比用兩個樣本的方差比來判斷如果S12/S22接近于1,說明兩個總體方差很接近如果S12/S22遠(yuǎn)離1,說明兩個總體方差之間存在差異總體方差比在1-

置信水平下的置信區(qū)間為3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體方差比的區(qū)間估計(jì)(圖示)98FF1-

F

總體方差比1-

的置信區(qū)間方差比置信區(qū)間示意圖3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體方差比的區(qū)間估計(jì)(例題分析)99【例3.12】為了研究男女學(xué)生在生活費(fèi)支出(單位:元)上的差異,在某大學(xué)各隨機(jī)抽取25名男學(xué)生和25名女學(xué)生,得到下面的結(jié)果男學(xué)生:女學(xué)生:試以90%置信水平估計(jì)男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間3.3.3雙總體參數(shù)區(qū)間估計(jì)兩個總體方差比的區(qū)間估計(jì)(例題分析)100解:根據(jù)自由度

n1=25-1=24,n2=25-1=24,查得F/2(24)=1.98,F(xiàn)1-/2(24)=1/1.98=0.505

12/22置信度為90%的置信區(qū)間為男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間為0.47~1.843.3.3雙總體參數(shù)區(qū)間估計(jì)雙總體參數(shù)區(qū)間估計(jì)(小結(jié))101待估參數(shù)均值差比例差方差比獨(dú)立大樣本獨(dú)立小樣本匹配樣本獨(dú)立大樣本

12、

22已知

12、

22未知Z分布Z分布

12、

22已知

12、

22未知Z分布

12=

22

12≠

22正態(tài)總體F分布Z分布t分布t分布t分布第4節(jié)樣本容量的確定3.4.1估計(jì)單總體均值時樣本容量的確定3.4.2估計(jì)單總體比例時樣本容量的確定3.4.3估計(jì)雙總體均值差時樣本容量的確定3.4.4估計(jì)雙總體比例差時樣本容量的確定1023.4.1估計(jì)單總體均值時樣本容量的確定103估計(jì)總體均值時樣本容量的確定估計(jì)總體均值時樣本容量n為樣本容量n與總體方差

2、邊際誤差E、可靠性系數(shù)Z或t之間的關(guān)系為與總體方差成正比與邊際誤差的平方成反比與可靠性系數(shù)成正比樣本容量的圓整法則:當(dāng)計(jì)算出的樣本容量不是整數(shù)時,將小數(shù)點(diǎn)后面的數(shù)值一律進(jìn)位成整數(shù),如24.68取25,24.32也取25等等其中:3.4.1估計(jì)總體均值時樣本容量的確定104估計(jì)總體均值時樣本容量的確定(例題分析)

【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計(jì)年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?3.4.1估計(jì)總體均值時樣本容量的確定105估計(jì)總體均值時樣本容量的確定(例題分析)

解:已知

=2000,E=400,1-

=95%,z/2=1.96

應(yīng)抽取的樣本容量為即應(yīng)抽取97人作為樣本3.4.2估計(jì)單總體比例時樣本容量的確定106估計(jì)總體比例時樣本容量的確定根據(jù)比例區(qū)間估計(jì)公式可得樣本容量n為

E的取值一般小于0.1

未知時,可取使方差最大值0.5其中:3.4.2估計(jì)單總體比例時樣本容量的確定107估計(jì)總體比例時樣本容量的確定(例題分析)【例】根據(jù)以往的生產(chǎn)統(tǒng)計(jì),某種產(chǎn)品的合格率約為90%,現(xiàn)要求邊際誤差為5%,在求95%的置信區(qū)間時,應(yīng)抽取多少個產(chǎn)品作為樣本?解:已知

=90%,

=0.05,z/2=1.96,E=5%

應(yīng)抽取的樣本容量為

應(yīng)抽取139個產(chǎn)品作為樣本3.4.3估計(jì)雙總體均值差時樣本容量的確定108估計(jì)雙總體均值差時樣本容量的確定設(shè)n1和n2為來自兩個總體的樣本,并假定n1=n2根據(jù)均值之差的區(qū)間估計(jì)公式可得兩個樣本的容量n為其中:3.4.3估計(jì)雙總體均值差時樣本容量的確定109估計(jì)雙總體均值差時樣本容量的確定(例題分析)【例】一所中學(xué)的教務(wù)處想要估計(jì)試驗(yàn)班和普通班考試成績平均分?jǐn)?shù)差值的置信區(qū)間。要求置信水平為95%,預(yù)先估計(jì)兩個班考試分?jǐn)?shù)的方差分別為:試驗(yàn)班

12=90,普通班

22=120。如果要求估計(jì)的誤差范圍(邊際誤差)不超過5分,在兩個班應(yīng)分別抽取多少名學(xué)生進(jìn)行調(diào)查?English3.4.3估計(jì)雙總體均值差時樣本容量的確定110估計(jì)雙總體均值差時樣本容量的確定(例題分析)解:已知

12=90,22=120,E=5,1-

=95%,z/2=1.96即應(yīng)抽取33人作為樣本3.4.4估計(jì)雙總體比例差時樣本容量的確定111估計(jì)雙總體比例差時樣本容量的確定設(shè)n1和n2為來自兩個總體的樣本,并假定n1=n2根據(jù)比例之差的區(qū)間估計(jì)公式可得兩個樣本的容量n為其中:3.4.4估計(jì)雙總體比例差時樣本容量的確定112估計(jì)雙總體比例差時樣本容量的確定(例題分析)【例】一家瓶裝飲料制造商想要估計(jì)顧客對一種新型飲料認(rèn)知的廣告效果。他在廣告前和廣告后分別從市場營銷區(qū)各抽選一個消費(fèi)者隨機(jī)樣本,并詢問這些消費(fèi)者是否聽說過這種新型飲料。這位制造商想以10%的誤差范圍和95%的置信水平估計(jì)廣告前后知道該新型飲料消費(fèi)者的比例之差,他抽取的兩個樣本分別應(yīng)包括多少人?(假定兩個樣本容量相等)綠色健康飲品3.4.4估計(jì)雙總體比例差時樣本容量的確定113估計(jì)雙總體比例差時樣本容量的確定(例題分析)解:E=10%,1-

=95%,z/2=1.96,由于沒有

的信息,用0.5代替即應(yīng)抽取193位消費(fèi)者作為樣本3.4.4估計(jì)雙總體比例差時樣本容量的確定114估計(jì)雙總體比例差時樣本容量的確定(例題分析)【例3.13】2015年全國1%人口抽樣調(diào)查于2015年11月1日0時,抽樣樣本量約為1600萬。樣本設(shè)計(jì)要求全國出生率、死亡率的相對誤差分別控制在0.6%、0.8%左右,試?yán)帽菊滤鶎W(xué)知識論證1600萬抽樣量的合理性。已知預(yù)估全國出生率為12.07‰,死亡率為7.11‰,人口總數(shù)為13.83億,置信水平為99%3.4.4估計(jì)雙總體比例差時樣本容量的確定115估計(jì)雙總體比例差時樣本容量的確定(例題分析)解:由于全國人口總數(shù)很大,人口抽樣調(diào)查可以看作無限總體抽樣條件

出生率:3.4.4估計(jì)雙總體比例差時樣本容量的確定116估計(jì)雙總體比例差時樣本容量的確定(例題分析)

死亡率:

由以上結(jié)果可知,至少需要抽取2205人,才能同時滿足出生率和死亡率的抽樣誤差要求。 1600萬遠(yuǎn)大于2205,因從樣本容量的角度來看是合理的。第5節(jié)Bootstrap區(qū)間估計(jì)3.5.1基本思想3.5.2經(jīng)驗(yàn)Boottrap法3.5.3Bootstrap百分位法1173.5.1基本思想對于一個未知分布總體均值的推斷,我們必須倚賴中心極限定理和正態(tài)分布的假設(shè)。如果未知分布非常不規(guī)則或樣本數(shù)不足,那么,中心極限定理指出的均值近似為正態(tài)分布便難以成立,而基于t分布計(jì)算出來的均值置信區(qū)間也不夠準(zhǔn)確。因此,在未知分布非常不規(guī)則或樣本數(shù)不足的情況下,需要使用Bootstrap區(qū)間估計(jì)的方法。1183.5.1基本思想Bootstrap的核心思想是:通過使用數(shù)據(jù)本身而估計(jì)從該數(shù)據(jù)中計(jì)算出來的統(tǒng)計(jì)數(shù)據(jù)的變化。即僅僅利用已有的樣本數(shù)據(jù),不對總體的分布做任何假設(shè),來計(jì)算樣本統(tǒng)計(jì)量在估計(jì)總體統(tǒng)計(jì)量時的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論