吳喜之-統(tǒng)計(jì)學(xué)基本概念和方法-總體參數(shù)的區(qū)間估計(jì)_第1頁
吳喜之-統(tǒng)計(jì)學(xué)基本概念和方法-總體參數(shù)的區(qū)間估計(jì)_第2頁
吳喜之-統(tǒng)計(jì)學(xué)基本概念和方法-總體參數(shù)的區(qū)間估計(jì)_第3頁
吳喜之-統(tǒng)計(jì)學(xué)基本概念和方法-總體參數(shù)的區(qū)間估計(jì)_第4頁
吳喜之-統(tǒng)計(jì)學(xué)基本概念和方法-總體參數(shù)的區(qū)間估計(jì)_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、總體均值的區(qū)間估計(jì),點(diǎn)估計(jì)的缺點(diǎn):不能反映估計(jì)的誤差和精確程度 區(qū)間估計(jì):利用樣本統(tǒng)計(jì)量和抽樣分布估計(jì)總體參數(shù)的可能區(qū)間 【例】cjw公司是一家專營(yíng)體育設(shè)備和附件的公司,為了監(jiān)控公司的服務(wù)質(zhì)量,cjw公司每月都要隨即的抽取一個(gè)顧客樣本進(jìn)行調(diào)查以了解顧客的滿意分?jǐn)?shù)。根據(jù)以往的調(diào)查,滿意分?jǐn)?shù)的標(biāo)準(zhǔn)差穩(wěn)定在20分左右。最近一次對(duì)100名顧客的抽樣顯示,滿意分?jǐn)?shù)的樣本均值為82分,試建立總體滿意分?jǐn)?shù)的區(qū)間。 抽樣誤差 抽樣誤差:一個(gè)無偏估計(jì)與其對(duì)應(yīng)的總體參數(shù)之差的絕對(duì)值。 抽樣誤差 = (實(shí)際未知),總體均值的區(qū)間估計(jì)(大樣本n30),要進(jìn)行區(qū)間估計(jì),關(guān)鍵是將抽樣誤差 求解。若 已知,則區(qū)間可表示為:

2、 此時(shí),可以利用樣本均值的抽樣分布對(duì)抽樣誤差的大小進(jìn)行描述。 上例中,已知,樣本容量n=100,總體標(biāo)準(zhǔn)差 ,根據(jù)中心極限定理可知,此時(shí)樣本均值服從均值為 ,標(biāo)準(zhǔn)差為 的正態(tài)分布。 即:,抽樣誤差的概率表述 由概率論可知, 服從標(biāo)準(zhǔn)正態(tài)分布,即, 有以下關(guān)系式成立: 一般稱, 為置信度,可靠程度等,反映估計(jì)結(jié)果的可信程度。若事先給定一個(gè)置信度,則可根據(jù)標(biāo)準(zhǔn)正態(tài)分布找到其對(duì)應(yīng)的臨界值 。進(jìn)而計(jì)算抽樣誤差,若, 則查標(biāo)準(zhǔn)正態(tài)分布表可得, 抽樣誤差 此時(shí)抽樣誤差的意義可表述為:以樣本均值為中心的3.92的區(qū)間包含總體均值的概率是95%,或者說,樣本均值產(chǎn)生的抽樣誤差是3.92或更小的概率是0.95。

3、 常用的置信度還有90%,95.45%,99.73%,他們對(duì)應(yīng)的臨界值分別為1.645,2和3,可以分別反映各自的估計(jì)區(qū)間所對(duì)應(yīng)的精確程度和把握程度。,計(jì)算區(qū)間估計(jì): 在cjw公司的例子中,樣本均值產(chǎn)生的抽樣誤差是3.92或更小的概率是0.95。因此,可以構(gòu)建總體均值的區(qū)間為, 由于,從一個(gè)總體中抽取到的樣本具有隨機(jī)性,在一次偶然的抽樣中,根據(jù)樣本均值計(jì)算所的區(qū)間并不總是可以包含總體均值,它是與一定的概率相聯(lián)系的。如下圖所示:,3.92,3.92,根據(jù)選擇的在 、 、 位置的樣本均值建立的區(qū)間,上圖中,有95%的樣本均值落在陰影部分,這個(gè)區(qū)域的樣本均值3.92的區(qū)間能夠包含總體均值。 因此,總

4、體均值的區(qū)間的含義為,我們有95%的把握認(rèn)為,以樣本均值為中心的3.92的區(qū)間能夠包含總體均值。 通常,稱該區(qū)間為置信區(qū)間,其對(duì)應(yīng)的置信水平為 置信區(qū)間的估計(jì)包含兩個(gè)部分:點(diǎn)估計(jì)和描述估計(jì)精確度的正負(fù)值。也將正負(fù)值稱為誤差邊際或極限誤差,反映樣本估計(jì)量與總體參數(shù)之間的最大誤差范圍。 總結(jié):,計(jì)算區(qū)間估計(jì): 在大多數(shù)的情況下,總體的標(biāo)準(zhǔn)差都是未知的。根據(jù)抽樣分布定理,在大樣本的情況下,可用樣本的標(biāo)準(zhǔn)差s作為總體標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值,仍然采用上述區(qū)間估計(jì)的方法進(jìn)行總體參數(shù)的估計(jì)。,【例 】 斯泰特懷特保險(xiǎn)公司每年都需對(duì)人壽保險(xiǎn)單進(jìn)行審查,現(xiàn)公司抽取36個(gè)壽保人作為一個(gè)簡(jiǎn)單隨即樣本,得到關(guān)于、投保人年齡

5、、保費(fèi)數(shù)量、保險(xiǎn)單的現(xiàn)金值、殘廢補(bǔ)償選擇等項(xiàng)目的資料。為了便于研究,某位經(jīng)理要求了解壽險(xiǎn)投保人總體平均年齡的90%的區(qū)間估計(jì)。,上表是一個(gè)由36個(gè)投保人組成的簡(jiǎn)單隨機(jī)樣本的年齡數(shù)據(jù)?,F(xiàn)求總體的平均年齡的區(qū)間估計(jì)。 分析:區(qū)間估計(jì)包括兩個(gè)部分點(diǎn)估計(jì)和誤差邊際,只需分別求出即可到的總體的區(qū)間估計(jì)。 解:已知 (1)樣本的平均年齡 (2)誤差邊際,樣本標(biāo)準(zhǔn)差 誤差邊際 (3)90%的置信區(qū)間為39.5 2.13 即(37.37,41.63)歲。 注意 (1)置信系數(shù)一般在抽樣之前確定 (2)置信區(qū)間的長(zhǎng)度(準(zhǔn)確度)在置信度一定的情況下,與樣本容量的大小呈反方向變動(dòng),若要提高估計(jì)準(zhǔn)確度,可以擴(kuò)大樣本容

6、量來達(dá)到。,總體均值的區(qū)間估計(jì):小樣本的情況 在小樣本的情況下,樣本均值的抽樣分布依賴于總體的抽樣分布。我們討論總體服從正態(tài)分布的情況。 t分布的圖形和標(biāo)準(zhǔn)正態(tài)分布的圖形類似,如下圖示:,0,標(biāo)準(zhǔn)正態(tài)分布,t分布(自由度為20),t分布(自由度為10),標(biāo)準(zhǔn)正態(tài)分布與t分布的比較,在分布中,對(duì)于給定的置信度,同樣可以通過查表找到其對(duì)應(yīng)的臨界值 ,利用臨界值也可計(jì)算區(qū)間估計(jì)的誤差邊際 因此,總體均值的區(qū)間估計(jì)在總體標(biāo)準(zhǔn)差未知的小樣本情況下可采用下式進(jìn)行: 假定總體服從正態(tài)分布;,【例 】謝爾工業(yè)公司擬采用一項(xiàng)計(jì)算機(jī)輔助程序來培訓(xùn)公司的維修支援掌握及其維修的操作,以減少培訓(xùn)工人所需要的時(shí)間。為了評(píng)

7、價(jià)這種培訓(xùn)方法,生產(chǎn)經(jīng)理需要對(duì)這種程序所需要的平均時(shí)間進(jìn)行估計(jì)。以下是利用新方對(duì)名職員進(jìn)行培訓(xùn)的培訓(xùn)天數(shù)資料。 根據(jù)上述資料建立置信度為的總體均值的區(qū)間估計(jì)。(假定培訓(xùn)時(shí)間總體服從正態(tài)分布)。,解:依題意,總體服從正態(tài)分布,(小樣本),此時(shí)總體方差未知??捎米杂啥葹椋╪-1)=14的t分布進(jìn)行總體均值的區(qū)間估計(jì)。 樣本平均數(shù) 樣本標(biāo)準(zhǔn)差 誤差邊際 95%的置信區(qū)間為,53.87 3.78 即(50.09,57.65)天。,確定樣本容量,確定樣本容量 誤差邊際 其計(jì)算需要已知 若我們選擇了置信度 由此,得到計(jì)算必要樣本容量的計(jì)算公式:,【例】在以前的一項(xiàng)研究美國(guó)租賃汽車花費(fèi)的研究中發(fā)現(xiàn),租賃一輛

8、中等大小的汽車,其花費(fèi)范圍為,從加利福尼亞州的奧克蘭市的每天36美元到康涅狄格州的哈特福德市的每天73.50美元不等,并且租金的標(biāo)準(zhǔn)差為9.65美元。假定進(jìn)行該項(xiàng)研究的組織想進(jìn)行一項(xiàng)新的研究,以估計(jì)美國(guó)當(dāng)前總體平均日租賃中等大小汽車的支出。在設(shè)計(jì)該項(xiàng)新的研究時(shí),項(xiàng)目主管指定對(duì)總體平均日租賃支出的估計(jì)誤差邊際為2美元,置信水平為95%。 解:依題意, 可得 將以上結(jié)果取下一個(gè)整數(shù)(90)即為必要的樣本容量。,說明: 由于總體標(biāo)準(zhǔn)差 在大多數(shù)情況下 是未知的,可以有以下方法取得 的值。 (1)使用有同樣或者類似單元的以前樣本的樣本標(biāo)準(zhǔn)差; (2)抽取一個(gè)預(yù)備樣本進(jìn)行試驗(yàn)性研究。用實(shí)驗(yàn)性樣本的標(biāo)準(zhǔn)差

9、作為 的估計(jì)值。 (3)運(yùn)用對(duì) 值的判斷或者“最好的猜測(cè)”,例如,通??捎脴O差估計(jì) 的近似值。,總體比率的估計(jì),比率的抽樣分布,數(shù)據(jù)的特點(diǎn) 比率屬于點(diǎn)計(jì)數(shù)據(jù),這類數(shù)據(jù)的分布是非正態(tài)的。 對(duì)這類數(shù)據(jù)的統(tǒng)計(jì)推斷有兩種方法,一般來說,當(dāng)事物按性質(zhì)不同被劃分成兩類時(shí),要用總體比率的推斷方法進(jìn)行統(tǒng)計(jì)推斷;當(dāng)事物被劃分為成兩類以上時(shí),則用卡方檢驗(yàn)法。,由于這里假設(shè)事物按性質(zhì)不同分成兩類,所以其中的一類事物發(fā)生比率的抽樣分布屬于二項(xiàng)分布。 假設(shè)有一個(gè)總體,這個(gè)總體中所包含的事件要么具有某種屬性,要么不具有某種屬性,其中具有某種屬性的事件出現(xiàn)的概率為,不具有某種屬性的事件出現(xiàn)的概率為q=1-。,比率的抽樣分布

10、,現(xiàn)在從中隨機(jī)抽取一個(gè)容量為n(n次重復(fù)試驗(yàn))的樣本,算得成功事件出現(xiàn)的比率: p1=x1/n (x表示成功事件出現(xiàn)的次數(shù)) 將樣本還回總體中,再從中隨機(jī)抽取一個(gè)容量為n的樣本,又可以算得一個(gè)成功事件出現(xiàn)的比率: p2=x2/n,比率的抽樣分布,經(jīng)過反復(fù)抽樣,就可以計(jì)算出許多樣本的p值,這些p值就形成了一個(gè)實(shí)驗(yàn)性的比率的抽樣分布。這個(gè)分布的形態(tài)是二項(xiàng)分布。 二項(xiàng)概率分布是進(jìn)行總體比率統(tǒng)計(jì)推斷的理論依據(jù)。,比率的標(biāo)準(zhǔn)誤,比率抽樣分布的標(biāo)準(zhǔn)差,就是比率的標(biāo)準(zhǔn)誤 當(dāng)總體比率已知時(shí): p表示比率的標(biāo)準(zhǔn)誤 p表示總體比率 q=1-p n表示樣本容量(試驗(yàn)重復(fù)次數(shù)),當(dāng)總體比率未知時(shí),需要用樣本比率p=x

11、/n作為總體比率p的點(diǎn)估計(jì)。所以總體比率標(biāo)準(zhǔn)誤的估計(jì)量為: sp表示比率標(biāo)準(zhǔn)誤的估計(jì)量 p表示樣本的比率 q=1-p n表示樣本容量(試驗(yàn)重復(fù)次數(shù)),比率的標(biāo)準(zhǔn)誤,總體比率的區(qū)間估計(jì),以比率的抽樣分布為理論依據(jù),按一定的概率要求估計(jì)總體比率的所在范圍就叫做總體比率的區(qū)間估計(jì)。,正態(tài)近似法,當(dāng)樣本容量n比較大,np和nq中較小的那個(gè)數(shù)等于或大于5時(shí),二項(xiàng)分布已經(jīng)接近于正態(tài)分布,此時(shí)可以按照正態(tài)分布來估計(jì)總體比率0.95和0.99的置信區(qū)間(因?yàn)檫@種方法比較簡(jiǎn)便),這種方法叫做正態(tài)近似法。,正態(tài)近似法,根據(jù)標(biāo)準(zhǔn)正態(tài)分布的規(guī)律,得知 p(-1.96z1.96)=0.95 p(-2.58z2.58)=

12、0.99 將 帶入上式 p(-1.96 1.96)=0.95 p(p-1.96 pp+1.96 )=0.95,從北京市去年的理科考生中隨機(jī)抽取200名考生作為樣本,經(jīng)統(tǒng)計(jì),該樣本高考英語的及格率為0.67,試估計(jì)去年高考北京理科生英語及格率0.95和0.99的置信區(qū)間。,解:,因?yàn)閚=200,nq= 2000.33=665 因此,總體比率0.95的置信區(qū)間為: p(0.67-1.960.0332p0.67+1.960.0332)=0.95 p(0.605p0.735)=0.95,即在去年的高考中,北京理科生英語及格率有95%的可能在0.605至0.735之間,總體比率超出這個(gè)范圍的可能性只有5

13、%。,同理,總體比率0.99的置信區(qū)間為: p(0.67-2.580.0332p0.67+2.580.0332) =0.99 p(0.584p0.756)=0.99 即在去年的高考中,北京理科生英語及格率有99%的可能在0.584至0.756之間,總體比率超出這個(gè)范圍的可能性只有1%。,兩個(gè)總體參數(shù)的區(qū)間估計(jì),兩個(gè)總體參數(shù)的區(qū)間估計(jì),兩個(gè)總體均值之差的區(qū)間估計(jì)(獨(dú)立大樣本),兩個(gè)總體均值之差的估計(jì)(大樣本),1.假定條件 兩個(gè)總體都服從正態(tài)分布,1、 2已知 若不是正態(tài)分布, 可以用正態(tài)分布來近似(n130和n230) 兩個(gè)樣本是獨(dú)立的隨機(jī)樣本 使用正態(tài)分布統(tǒng)計(jì)量 z,兩個(gè)總體均值之差的估計(jì)

14、(大樣本),1.1, 2已知時(shí),兩個(gè)總體均值之差1-2在1- 置信水平下的置信區(qū)間為,1、 2未知時(shí),兩個(gè)總體均值之差1-2在1- 置信水平下的置信區(qū)間為,兩個(gè)總體均值之差的估計(jì)(例題分析),【例】某地區(qū)教育委員會(huì)想估計(jì)兩所中學(xué)的學(xué)生高考時(shí)的英語平均分?jǐn)?shù)之差,為此在兩所中學(xué)獨(dú)立抽取兩個(gè)隨機(jī)樣本,有關(guān)數(shù)據(jù)如右表 。建立兩所中學(xué)高考英語平均分?jǐn)?shù)之差95%的置信區(qū)間,english,兩個(gè)總體均值之差的估計(jì)(例題分析),解: 兩個(gè)總體均值之差在1-置信水平下的置信區(qū)間為,兩所中學(xué)高考英語平均分?jǐn)?shù)之差的置信區(qū)間為 5.03分10.97分,兩個(gè)總體均值之差的區(qū)間估計(jì)(獨(dú)立小樣本),兩個(gè)總體均值之差的估計(jì)(

15、小樣本: 12= 22 ),1.假定條件 兩個(gè)總體都服從正態(tài)分布 兩個(gè)總體方差未知但相等:1=2 兩個(gè)獨(dú)立的小樣本(n130和n230) 總體方差的合并估計(jì)量,估計(jì)量x1-x2的抽樣標(biāo)準(zhǔn)差,兩個(gè)總體均值之差的估計(jì)(小樣本: 12=22 ),兩個(gè)樣本均值之差的標(biāo)準(zhǔn)化,兩個(gè)總體均值之差1-2在1- 置信水平下的置信區(qū)間為,兩個(gè)總體均值之差的估計(jì)(例題分析),【例】為估計(jì)兩種方法組裝產(chǎn)品所需時(shí)間的差異,分別對(duì)兩種不同的組裝方法各隨機(jī)安排12名工人,每個(gè)工人組裝一件產(chǎn)品所需的時(shí)間(分鐘)下如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值

16、的置信區(qū)間,兩個(gè)總體均值之差的估計(jì)(例題分析),解: 根據(jù)樣本數(shù)據(jù)計(jì)算得 合并估計(jì)量為:,兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為 0.14分鐘7.26分鐘,兩個(gè)總體均值之差的估計(jì)(小樣本: 12 22 ),1.假定條件 兩個(gè)總體都服從正態(tài)分布 兩個(gè)總體方差未知且不相等:12 兩個(gè)獨(dú)立的小樣本(n130和n230) 使用統(tǒng)計(jì)量,兩個(gè)總體均值之差的估計(jì)(小樣本: 1222 ),兩個(gè)總體均值之差1-2在1- 置信水平下的置信區(qū)間為,自由度,兩個(gè)總體均值之差的估計(jì)(例題分析),【例】沿用前例。假定第一種方法隨機(jī)安排12名工人,第二種方法隨機(jī)安排8名工人,即n1=12,n2=8 ,所得的有關(guān)數(shù)據(jù)如

17、表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間,兩個(gè)總體均值之差的估計(jì)(例題分析),解: 根據(jù)樣本數(shù)據(jù)計(jì)算得 自由度為:,兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為 0.192分鐘9.058分鐘,兩個(gè)總體比例之差區(qū)間的估計(jì),1.假定條件 兩個(gè)總體服從二項(xiàng)分布 可以用正態(tài)分布來近似 兩個(gè)樣本是獨(dú)立的 2.兩個(gè)總體比例之差p1-p 2在1- 置信水平下的置信區(qū)間為,兩個(gè)總體比例之差的區(qū)間估計(jì),兩個(gè)總體比例之差的估計(jì)(例題分析),【例】在某個(gè)電視節(jié)目的收視率調(diào)查中,農(nóng)村隨機(jī)調(diào)查了400人,有32%的人收看了該節(jié)目;城市隨機(jī)調(diào)查了500人,有45%的人收看了該節(jié)目。試以95%的置信水平估計(jì)城市與農(nóng)村收視率差別的置信區(qū)間,兩個(gè)總體比例之差的估計(jì) (例題分析),解: 已知 n1=500 ,n2=400, p1=45%, p2=32%, 1- =95%, z/2=1.96 1- 2置信度為95%的置信區(qū)間為,城市與農(nóng)村收視率差值的置信區(qū)間為6.68%19.32%,兩個(gè)總體方差比的區(qū)間估計(jì),兩個(gè)總體方差比的區(qū)間估計(jì),1.比較兩個(gè)總體的方差比 用兩個(gè)樣本的方差比來判斷 如果s12/ s22接近于1,說明兩個(gè)總體方差很接近 如果s12/ s22遠(yuǎn)離1,說明兩個(gè)總體方差之間存在差異

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論