版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計(jì)學(xué)─從數(shù)據(jù)到結(jié)論第五章總體參數(shù)的估計(jì)估計(jì)就是根據(jù)你擁有的信息來對(duì)現(xiàn)實(shí)世界進(jìn)行某種判斷。你可以根據(jù)一個(gè)人的衣著、言談和舉止判斷其身份你可以根據(jù)一個(gè)人的臉色,猜出其心情和身體狀況統(tǒng)計(jì)中的估計(jì)也不例外,它是完全根據(jù)數(shù)據(jù)做出的。如果我們想知道北京人認(rèn)可某飲料的比例,人們只有在北京人中進(jìn)行抽樣調(diào)查以得到樣本,并用樣本中認(rèn)可該飲料的比例來估計(jì)真實(shí)的比例。從不同的樣本得到的結(jié)論也不會(huì)完全一樣。雖然真實(shí)的比例在這種抽樣過程中永遠(yuǎn)也不知道;但可以知道估計(jì)出來的比例和真實(shí)的比例大致差多少。從數(shù)據(jù)得到關(guān)于現(xiàn)實(shí)世界的結(jié)論的過程就叫做統(tǒng)計(jì)推斷(statisticalinference)。上面調(diào)查例子是估計(jì)總體參數(shù)(某種意見的比例)的一個(gè)過程。估計(jì)(estimation)是統(tǒng)計(jì)推斷的重要內(nèi)容之一。統(tǒng)計(jì)推斷的另一個(gè)主要內(nèi)容是下一章要引進(jìn)的假設(shè)檢驗(yàn)(hypothesistesting)?!?.1用估計(jì)量估計(jì)總體參數(shù)人們往往先假定某數(shù)據(jù)來自一個(gè)特定的總體族(比如正態(tài)分布族)。而要確定是總體族的哪個(gè)成員則需要知道總體參數(shù)值(比如總體均值和總體方差)。人們于是可以用相應(yīng)的樣本統(tǒng)計(jì)量(比如樣本均值和樣本方差)來估計(jì)相應(yīng)的總體參數(shù)§5.1用估計(jì)量估計(jì)總體參數(shù)一些常見的涉及總體的參數(shù)包括總體均值(m)、總體標(biāo)準(zhǔn)差(s)或方差(s2)和(Bernoulli試驗(yàn)中)成功概率p等(總體中含有某種特征的個(gè)體之比例)。正態(tài)分布族中的成員被(總體)均值和標(biāo)準(zhǔn)差完全確定;Bernoulli分布族的成員被概率(或比例)p完全決定。因此如果能夠?qū)@些參數(shù)進(jìn)行估計(jì),總體分布也就估計(jì)出來了。§5.1用估計(jì)量估計(jì)總體參數(shù)估計(jì)的根據(jù)為總體抽取的樣本。樣本的(不包含未知總體參數(shù)的)函數(shù)稱為統(tǒng)計(jì)量;而用于估計(jì)的統(tǒng)計(jì)量稱為估計(jì)量(estimator)。由于一個(gè)統(tǒng)計(jì)量對(duì)于不同的樣本取值不同,所以,估計(jì)量也是隨機(jī)變量,并有其分布。如果樣本已經(jīng)得到,把數(shù)據(jù)帶入之后,估計(jì)量就有了一個(gè)數(shù)值,稱為該估計(jì)量的一個(gè)實(shí)現(xiàn)(realization)或取值,也稱為一個(gè)估計(jì)值(estimate)?!?.1用估計(jì)量估計(jì)總體參數(shù)這里介紹兩種估計(jì),一種是點(diǎn)估計(jì)(pointestimation),即用估計(jì)量的實(shí)現(xiàn)值來近似相應(yīng)的總體參數(shù)。另一種是區(qū)間估計(jì)(intervalestimation);它是包括估計(jì)量在內(nèi)(有時(shí)是以估計(jì)量為中心)的一個(gè)區(qū)間;該區(qū)間被認(rèn)為很可能包含總體參數(shù)。點(diǎn)估計(jì)給出一個(gè)數(shù)字,用起來很方便;而區(qū)間估計(jì)給出一個(gè)區(qū)間,說起來留有余地;不像點(diǎn)估計(jì)那么絕對(duì)。§5.2點(diǎn)估計(jì)用什么樣的估計(jì)量來估計(jì)參數(shù)呢?實(shí)際上沒有硬性限制。任何統(tǒng)計(jì)量,只要人們覺得合適就可以當(dāng)成估計(jì)量。當(dāng)然,統(tǒng)計(jì)學(xué)家想出了許多標(biāo)準(zhǔn)來衡量一個(gè)估計(jì)量的好壞。每個(gè)標(biāo)準(zhǔn)一般都僅反映估計(jì)量的某個(gè)方面。這樣就出現(xiàn)了按照這些標(biāo)準(zhǔn)定義的各種名目的估計(jì)量(如無偏估計(jì)量等)。另一些估計(jì)量則是由它們的計(jì)算方式來命名的(如最大似然估計(jì)和矩估計(jì)等)。§5.2點(diǎn)點(diǎn)估估計(jì)最常用用的估估計(jì)量量就是是我們們熟悉悉的樣樣本均均值、、樣本本標(biāo)準(zhǔn)準(zhǔn)差(s)和(Bernoulli試試驗(yàn)的的)成成功比比例(x/n);人們用用它們們來分分別估估計(jì)總總體均均值(m)、總總體標(biāo)標(biāo)準(zhǔn)差差(s)和成成功概概率(或總總體中中的比比例)p。這些些在前前面都都已經(jīng)經(jīng)介紹紹過,,大家家也知知道如如何通通過計(jì)計(jì)算機(jī)機(jī)(或或公式式)來來計(jì)算算它們們。§5.2點(diǎn)點(diǎn)估估計(jì)那么,,什么么是好好估計(jì)計(jì)量的的標(biāo)準(zhǔn)準(zhǔn)呢??一種統(tǒng)統(tǒng)計(jì)量量稱為為無偏估估計(jì)量量(unbiasedestimator)。所謂的的無偏性性(unbiasedness)就是::雖然然每個(gè)個(gè)樣本本產(chǎn)生生的估估計(jì)量量的取取值不不一定定等于于參數(shù)數(shù),但但當(dāng)抽抽取大大量樣樣本時(shí)時(shí),那那些樣樣本產(chǎn)產(chǎn)生的的估計(jì)計(jì)量的的均值值會(huì)接接近真真正要要估計(jì)計(jì)的參參數(shù)。?!?.2點(diǎn)點(diǎn)估估計(jì)由于一一般僅僅僅抽抽取一一個(gè)樣樣本,,并且且用該該樣本本的這這個(gè)估估計(jì)量量的實(shí)實(shí)現(xiàn)來來估計(jì)計(jì)對(duì)應(yīng)應(yīng)的參參數(shù),,人們們并不不知道道這個(gè)個(gè)估計(jì)計(jì)值和和要估估計(jì)的的參數(shù)數(shù)差多多少。。因此,,無偏偏性僅僅僅是是非常常多次次重復(fù)復(fù)抽樣樣時(shí)的的一個(gè)個(gè)漸近近概念念。隨機(jī)樣樣本產(chǎn)產(chǎn)生的的樣本本均值值、樣樣本標(biāo)標(biāo)準(zhǔn)差差和Bernoulli試驗(yàn)驗(yàn)的成成功比比例分分別都都是相相應(yīng)的的總體體均值值、總總體標(biāo)標(biāo)準(zhǔn)差差和總總體比比例的的無偏偏估計(jì)計(jì)。§5.2點(diǎn)點(diǎn)估估計(jì)在無偏偏估計(jì)計(jì)量的的類中中,人人們還還希望望尋找找方差差最小小的估估計(jì)量量,稱稱為最最小方方差無無偏估估計(jì)量量。此因?yàn)闉榉讲畈钚≌f說明反反復(fù)抽抽樣產(chǎn)產(chǎn)生的的許多多估計(jì)計(jì)量差差別不不大,,因此此更加加精確確。評(píng)價(jià)一一個(gè)統(tǒng)統(tǒng)計(jì)量量好壞壞的標(biāo)標(biāo)準(zhǔn)很很多;;而且且許多多都涉涉及一一些大大樣本本的極極限性性質(zhì)。。我們們不想想在這這里涉涉及太太多此此方面面的細(xì)細(xì)節(jié)。。§5.3區(qū)區(qū)間間估計(jì)計(jì)當(dāng)描述述一個(gè)個(gè)人的的體重重時(shí),,你一一般可可能不不會(huì)說說這個(gè)個(gè)人是是76.35公公斤你會(huì)說說這個(gè)個(gè)人是是七八八十公公斤,,或者者是在在70公斤斤到80公公斤之之間。。這個(gè)個(gè)范圍圍就是是區(qū)間間估計(jì)計(jì)的例例子。?!?.3區(qū)區(qū)間間估計(jì)計(jì)在抽樣樣調(diào)查查例子子中也也常用用點(diǎn)估估計(jì)加加區(qū)間間估計(jì)計(jì)的說說法。。比如,,為了了估計(jì)計(jì)某電電視節(jié)節(jié)目在在觀眾眾中的的支持持率((即總總體比比例p),某某調(diào)查查結(jié)果果會(huì)顯顯示,,該節(jié)節(jié)目的的“收收視率率為90%,誤誤差是是±3%,,置信信度為為95%””云云云。這這這種種說法法意味味著下下面三三點(diǎn)§5.3區(qū)間間估計(jì)1.樣樣本中的的支持率率為90%,即即用樣本本比例作作為對(duì)總總體比例例的點(diǎn)估估計(jì)2.估估計(jì)范圍圍為90%±3%(±±3%的的誤差),即區(qū)區(qū)間(93%,,87%)。3.如如用類似似的方式式,重復(fù)復(fù)抽取大大量(樣樣本量相相同的))樣本時(shí)時(shí),產(chǎn)生生的大量量類似區(qū)區(qū)間中有有些會(huì)覆覆蓋真正正的p,而有些些不會(huì);;但其中中大約有有95%會(huì)覆蓋蓋真正的的總體比比例。§5.3區(qū)間間估計(jì)這樣得到到的區(qū)間間被稱為為總體比比例p的置信度度(confidencelevel)為95%的置置信區(qū)間間(confidenceinterval)。這里的置置信度又又稱置信水平平或置信系數(shù)數(shù)。顯然置信信度的概概念又是是大量重重復(fù)抽樣樣時(shí)的一一個(gè)漸近近概念。?!?.3區(qū)間間估計(jì)因此說““我們目目前得到到的區(qū)間間(比如如上面的的90%±3%)以概概率0.95覆覆蓋真正正的比例例p”是個(gè)錯(cuò)誤誤的說法法。這里的區(qū)區(qū)間(93%,87%)是固定的的,而總總體比例例p也是是固定的的值。因因此只有有兩種可可能:或或者該區(qū)區(qū)間包含含總體比比例,或或者不包包含;在固定數(shù)數(shù)值之間間沒有任任何概率率可言。?!?.3區(qū)間間估計(jì)例5.1(noodle.txt)某廠家家生產(chǎn)的的掛面包包裝上寫寫明“凈凈含量450克克”。在在用天平平稱量了了商場中中的48包掛面面之后,,得到樣樣本量為為48的的關(guān)于掛掛面重量量(單位位:克))的一個(gè)個(gè)樣本::用計(jì)算機(jī)機(jī)可以很很容易地地得到掛掛面重量量的樣本本均值、、總體均均值的置置信區(qū)間間等等。。下面是是SPSS的輸輸出:該輸出給給出了許許多第三三章引進(jìn)進(jìn)的描述述統(tǒng)計(jì)量量。和估估計(jì)有關(guān)關(guān)的是作作為總體體均點(diǎn)估估計(jì)的樣樣本均值值,它等等于449.01;而而總體均均值的95%置置信區(qū)間間為(447.41,,450.61)§5.3區(qū)間間估計(jì)我們還可可以構(gòu)造造兩個(gè)總總體的均均值(或或比例))之差的的置信區(qū)區(qū)間。如想知道道兩個(gè)地地區(qū)學(xué)生生成績的的差異,,可以建建造兩個(gè)個(gè)地區(qū)成成績均值值之差m1-m2的置信區(qū)區(qū)間。如想比較較一個(gè)候候選人在在不同階階段支持持率的差差異,那那就可構(gòu)構(gòu)造比例例之差p1-p2的置信區(qū)區(qū)間?!?.3區(qū)間間估計(jì)例5.2有兩個(gè)個(gè)地區(qū)大大學(xué)生的的高度數(shù)數(shù)據(jù)(height2.txt)(a)我我們想要要分別得得到這兩兩個(gè)總體體均值和和標(biāo)準(zhǔn)差差的點(diǎn)估估計(jì)(即即樣本均均值和樣樣本標(biāo)準(zhǔn)準(zhǔn)差)和和各總體體均值的的95%置信區(qū)區(qū)間。(b)求求兩個(gè)均均值差m1-m2的點(diǎn)估計(jì)計(jì)和95%置信信區(qū)間。。利用軟軟件很容容易得到到下面結(jié)結(jié)果:§5.3區(qū)間間估計(jì)兩個(gè)總體體均值估估計(jì)量的的樣本均均值分別別為170.56和165.60,,樣本標(biāo)標(biāo)準(zhǔn)差分分別為6.97857和7.55659;;還得到到均值的的置信區(qū)區(qū)間分別別是(168.5767,172.5433),(163.4524,167.7476)??梢缘玫降絻蓚€(gè)樣樣本均值值的差(4.9600),另另外還給給出了兩兩總體均均值差的的95%置信區(qū)區(qū)間(2.073,7.847)。?!?.4關(guān)于于置信區(qū)區(qū)間的注注意點(diǎn)前面提到到,不要要認(rèn)為由由某一樣本本數(shù)據(jù)得到到總體參參數(shù)的某一個(gè)95%置置信區(qū)間間,就以以為該區(qū)間以0.95的概率率覆蓋總總體參數(shù)數(shù)。置信度95%僅僅僅描述述用來構(gòu)構(gòu)造該區(qū)區(qū)間上下下界的統(tǒng)計(jì)量(是隨機(jī)機(jī)的)覆蓋總體體參數(shù)的的概率;;也就是說說,無窮窮次重復(fù)復(fù)抽樣所所得到的的所有區(qū)區(qū)間中有有95%包含參參數(shù)?!?.4關(guān)于于置信區(qū)區(qū)間的注注意點(diǎn)但是把一一個(gè)樣本本數(shù)據(jù)帶帶入統(tǒng)計(jì)計(jì)量的公公式所得得到的一一個(gè)區(qū)間間,只是是這些區(qū)區(qū)間中的的一個(gè)。。這個(gè)非隨隨機(jī)的區(qū)區(qū)間是否否包含那那個(gè)非隨隨機(jī)的總總體參數(shù)數(shù),誰也也不可能能知道。。非隨機(jī)機(jī)的數(shù)目目之間沒沒有概率率可言。。§5.4關(guān)于于置信區(qū)區(qū)間的注注意點(diǎn)置信區(qū)間間的論述述是由區(qū)區(qū)間和置置信度兩兩部分組組成。有些新聞聞媒體報(bào)報(bào)道一些些調(diào)查結(jié)結(jié)果只給給出百分分比和誤誤差(即即置信區(qū)區(qū)間),,并不說說明置信信度,也也不給出出被調(diào)查查的人數(shù)數(shù),這是是不負(fù)責(zé)責(zé)的表現(xiàn)現(xiàn)。因?yàn)榻档偷椭眯哦榷瓤梢允故怪眯艆^(qū)區(qū)間變窄窄(顯得得“精確確”),,有誤導(dǎo)導(dǎo)讀者之之嫌。在在公布調(diào)調(diào)查結(jié)果果時(shí)給出出被調(diào)查查人數(shù)是是負(fù)責(zé)任任的表現(xiàn)現(xiàn)。這樣樣則可以以由此推推算出置置信度((由后面面給出的的公式)),反之之亦然。?!?.4關(guān)于于置信區(qū)區(qū)間的注注意點(diǎn)一個(gè)描述述性例子子:有10000個(gè)人人回答的的調(diào)查顯顯示,同同意某觀觀點(diǎn)人的的比例為為70%(有7000人同意意)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度行政合同行政主體權(quán)力行使與監(jiān)督機(jī)制優(yōu)化4篇
- 2025年度茶葉加盟店加盟商違約責(zé)任及賠償合同
- 2025年度肉雞養(yǎng)殖風(fēng)險(xiǎn)共擔(dān)委托合同
- 2025版爐渣資源化利用項(xiàng)目環(huán)境影響評(píng)價(jià)合同4篇
- 二零二五年度公共設(shè)施裝修合同延期賠償細(xì)則
- 2025年度高端鋁合金門窗設(shè)計(jì)與安裝一體化服務(wù)合同4篇
- 二零二五年度碎石生產(chǎn)承包與質(zhì)量檢測服務(wù)合同
- 2025年度辣椒品牌授權(quán)與銷售代理合同
- 2025年度軌道交通空調(diào)設(shè)備安裝與定期檢修合同
- 專業(yè)駕駛?cè)藛T聘用及管理合同版B版
- 停車場施工施工組織設(shè)計(jì)方案
- GB/T 37238-2018篡改(污損)文件鑒定技術(shù)規(guī)范
- 普通高中地理課程標(biāo)準(zhǔn)簡介(湘教版)
- 河道治理工程監(jiān)理通知單、回復(fù)單范本
- 超分子化學(xué)簡介課件
- 高二下學(xué)期英語閱讀提升練習(xí)(一)
- 易制爆化學(xué)品合法用途說明
- 【PPT】壓力性損傷預(yù)防敷料選擇和剪裁技巧
- 大氣喜慶迎新元旦晚會(huì)PPT背景
- DB13(J)∕T 242-2019 鋼絲網(wǎng)架復(fù)合保溫板應(yīng)用技術(shù)規(guī)程
- 心電圖中的pan-tompkins算法介紹
評(píng)論
0/150
提交評(píng)論