版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計(jì)問題-統(tǒng)計(jì)量及其抽樣散布6.1整體與樣本整體與個(gè)體在一個(gè)統(tǒng)計(jì)問題中,我們把研究對(duì)象的全體稱為整體,構(gòu)成整體的每個(gè)成員稱為個(gè)體。對(duì)多半實(shí)質(zhì)問題。整體中的個(gè)體是一些實(shí)在的人或物。比方,我們要研究某大學(xué)的學(xué)生身高狀況,則該大學(xué)的全體學(xué)生構(gòu)成問題的整體,而每一個(gè)學(xué)生即是一個(gè)個(gè)體。事實(shí)上,每個(gè)學(xué)生有很多特點(diǎn):性別、年紀(jì)、身高、體重、民族、籍貫等。而在該問題中,我們關(guān)懷的不過該校學(xué)生的身高怎樣,對(duì)其余的特點(diǎn)暫不予以考慮。這樣,每個(gè)學(xué)生(個(gè)體)所擁有的數(shù)目指標(biāo)值——身高就是個(gè)體,而將所有身高全體當(dāng)作整體。這樣一來,若拋開實(shí)質(zhì)背景,整體就是一堆數(shù),這堆數(shù)中有大有小,有的出現(xiàn)的時(shí)機(jī)多,有的出現(xiàn)的時(shí)機(jī)少,所以用一個(gè)概率散布去描繪和概括整體是合適的。從這個(gè)意義上看,整體就是一個(gè)散布,而其數(shù)目指標(biāo)就是聽從這個(gè)散布的隨機(jī)變量。此后說“從整體中抽樣”與“從某散布中抽樣”是同一個(gè)意思。[例6-1]觀察某廠的產(chǎn)質(zhì)量量,將其產(chǎn)品只分為合格品與不合格品,并以0記合格品,以1記不合格品,則整體={該廠生產(chǎn)的所有合格品與不合格品}={由0或1構(gòu)成的一堆數(shù)}。若以p表示這堆數(shù)中1的比率(不合格品率),則該整體可由一個(gè)二點(diǎn)散布表示:不一樣的p反應(yīng)了整體間的差別。比如,兩個(gè)生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品整體散布為:我們能夠看到,第一個(gè)工廠的產(chǎn)質(zhì)量量優(yōu)于第二個(gè)工廠。實(shí)質(zhì)中,散布中的不合格品率是未知的,怎樣對(duì)之進(jìn)行預(yù)計(jì)是統(tǒng)計(jì)學(xué)要研究的問題。樣本為了認(rèn)識(shí)整體的散布,我們從整體中隨機(jī)地抽取n個(gè)個(gè)體,記其指標(biāo)值為x1,x2,,xn,則x1,x2,,xn稱為整體的一個(gè)樣本,n稱為樣本容量,或簡稱樣本量,樣本中的個(gè)體稱為樣品。我們第一指出,樣本擁有所謂的二重性:一方面,因?yàn)闃颖臼菑恼w中隨機(jī)抽取的,抽取前沒法預(yù)知它們的數(shù)值,所以,樣本是隨機(jī)變量,用大寫字母X1,X2,,Xn表示;另一方面,樣本在抽取此后經(jīng)觀察就有確立的觀察值,所以,樣本又是一組數(shù)值。此時(shí)用小寫字母x1,x2,,xn表示是合適的。簡單起見,不論是樣本仍是其觀察值,本書中樣本一般均用x1,x2,,xn表示,讀者應(yīng)能從上下文中加以差別。[例6-2]啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640g,,因?yàn)殡S機(jī)性,事實(shí)上不行能使得所有的啤酒凈含量均為640g,現(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī)抽取10瓶測定其凈含量,獲得以下結(jié)果:641635640637642638645643639640這是一個(gè)容量為10的樣本的觀察值。對(duì)應(yīng)的整體為該廠生產(chǎn)的瓶裝啤酒的凈含量。【答疑編號(hào):10060101針對(duì)該題發(fā)問】從整體中抽取樣本時(shí),為使樣本擁有代表性,抽樣一定是隨機(jī)抽樣。往常能夠用隨機(jī)數(shù)表來實(shí)現(xiàn)隨機(jī)抽樣。還要求抽樣一定是獨(dú)立的,即每次的結(jié)果互不影響。在概率論中,在有限整體(只有有限個(gè)個(gè)體的整體)中進(jìn)行有放回抽樣,是獨(dú)立的隨機(jī)抽樣;但是,若為不放回抽樣,則是不獨(dú)立的抽樣。但當(dāng)整體容量N很大但樣本容量n較小時(shí),不放回抽樣能夠近似地看做放回抽樣,即可近似看做獨(dú)立隨機(jī)抽樣。下邊,我們假定抽樣方式總知足獨(dú)立隨機(jī)抽樣的條件。從整體中抽取樣本能夠有不一樣的抽法,為了能由樣本對(duì)整體做出較靠譜的推測,就希望樣本能很好地代表整體。這就需要對(duì)抽樣方法提出一些要求,最常用的“簡單隨機(jī)抽樣”有以下兩個(gè)要求:1)樣本擁有隨機(jī)性,即要求整體中每一個(gè)個(gè)體都有同樣時(shí)機(jī)被選入樣本,這便意味著每同樣品xi與整體X有同樣的散布。2)樣本要有獨(dú)立性,即要求樣本中每同樣品的取值不影響其余樣品的取值,這意味著x1,x2,,xn互相獨(dú)立。用簡單隨機(jī)抽樣方法獲得的樣本稱為簡單隨機(jī)樣本,也簡稱樣本。除非特別指明,本書中的樣本皆為簡單隨機(jī)樣本。于是,樣本x1,x2,,xn能夠當(dāng)作是互相獨(dú)立的擁有同一散布的隨機(jī)變量,其共同分布即為整體散布。設(shè)整體X擁有散布函數(shù)F(x),x1,x2,,xn為取自該整體的容量為n的樣本,則樣本聯(lián)合散布函數(shù)為:若整體擁有密度函數(shù)f(x),則樣本的聯(lián)合密度函數(shù)為若整體X為失散型隨機(jī)變量,則樣本的(聯(lián)合)概率函數(shù)為明顯,往常說的樣本散布是指多維隨機(jī)變量(x1,x2,,xn)的聯(lián)合散布。[例6-3]為預(yù)計(jì)一物品的重量μ,用一架天平重復(fù)丈量n次,得樣本x1,x2,,xn,由于是獨(dú)立重復(fù)丈量,x1,x2,,xn是簡單隨機(jī)樣本。整體的散布即x1的散布(x1,x2,,xn散布同樣)。因?yàn)榉Q量偏差是均值(希望)為零的正態(tài)變量,所以x1可以為聽從正態(tài)散布2x1的概率密度為N(μ,σ)(X1等于物品重量μ)加上稱量偏差,即這樣,樣本散布密度為?!敬鹨删幪?hào):10060102針對(duì)該題發(fā)問】[例6-4]設(shè)某種電燈泡的壽命X聽從指數(shù)散布E(λ),其概率密度為:則來自這一整體的簡單隨機(jī)樣本x1,x2,,xn的樣本散布密度為【答疑編號(hào):10060103針對(duì)該題發(fā)問】[例6-5]考慮電話互換臺(tái)一小時(shí)內(nèi)的呼喊次數(shù)X。求來自這一整體的簡單隨機(jī)樣本x1,x2,,xn的樣本散布?!敬鹨删幪?hào):10060104針對(duì)該題發(fā)問】解由概率論知識(shí),X聽從泊松散布P(λ),其概率函數(shù),(此中x是非負(fù)整數(shù){0,1,2,,k,}中的一個(gè))。進(jìn)而,簡單隨機(jī)樣本x1,x2,,xn的樣本散布為:6.2統(tǒng)計(jì)量及其散布統(tǒng)計(jì)量與抽樣散布樣原來自整體,樣本的觀察值中含有整體各方面的信息,但這些信息較為分別,有時(shí)顯得凌亂無章。為將這些分別在樣本中相關(guān)整體的信息集中起來以反應(yīng)整體的各樣特點(diǎn),需要對(duì)樣本進(jìn)行加工。最常用的加工方法是結(jié)構(gòu)樣本的函數(shù),不一樣的函數(shù)反應(yīng)整體的不一樣特點(diǎn)。定義6-1設(shè)x1,x2,,xn為取自某整體的樣本,若樣本函數(shù)T=T(x1,x2,,xn)中不含有任何未知參數(shù),則稱T為統(tǒng)計(jì)量。統(tǒng)計(jì)量的散布稱為抽樣散布。依據(jù)這必定義,若x12n為樣本,則,2未知,x,,x都是統(tǒng)計(jì)量,而當(dāng)μ,σ時(shí),,等均不是統(tǒng)計(jì)量。樣本均值及其抽樣散布定義6-2設(shè)x1,x2,,xn為取自某整體的樣本,其算術(shù)均勻值稱為樣本均值,一般用表示,即。[例6-6]某單位采集到20名青年人某月的娛樂支出花費(fèi)數(shù)據(jù):79848488929394979899125則該月這20名青年的均勻娛樂支出為【答疑編號(hào):10060105針對(duì)該題發(fā)問】對(duì)于樣本均值的抽樣散布,我們有下邊的定理。定理6-1設(shè)x1,x2,,xn是來自某個(gè)整體X的樣本,為樣本均值。2;(1)若整體散布為N(μσ),則的精準(zhǔn)散布為(2)若整體X散布未知(或不是正態(tài)散布),且E(X)=μ,D(X)=σ2,則當(dāng)樣本容量n較大時(shí),的漸近散布為,這里的漸近散布是指n較大時(shí)的近似散布。證明(1)因?yàn)闉楠?dú)立正態(tài)變量線性組合,故仍聽從正態(tài)散布。此外,故(2)易知為獨(dú)立、同散布的隨機(jī)變量之和,且。由中心極限制理,,此中Φ(x)為標(biāo)準(zhǔn)正態(tài)散布。這表示n較大時(shí)的漸近散布為。樣本方差與樣本標(biāo)準(zhǔn)差定義6-3設(shè)x1,x2,,xn為取自某整體的樣本,則它對(duì)于樣本均值的均勻偏差平方和稱為樣本方差,其算術(shù)根稱為樣本標(biāo)準(zhǔn)差。相對(duì)樣本方差而言,樣本標(biāo)準(zhǔn)差往常更有實(shí)質(zhì)意義,因?yàn)樗c樣本均值擁有同樣的胸懷單位。在上邊定義中,n為樣本容量,稱為偏差平方和,它有3個(gè)不一樣的表達(dá)式:事實(shí)上,,偏差平方和的這[例6-7]在例
3個(gè)表達(dá)式都可用來計(jì)算樣本方差。6-6中,我們已經(jīng)算得,其樣本方差與樣本標(biāo)準(zhǔn)差為,。方法二s=11.5731【答疑編號(hào):10060201針對(duì)該題發(fā)問】往常用第二種方法計(jì)算s2方便很多。下邊的定理給出樣本均值的數(shù)學(xué)希望和方差以及樣本方差的數(shù)學(xué)希望,它不依靠于整體的散布形式。這些結(jié)果在后邊的議論中是實(shí)用的。定理6-2設(shè)整體X擁有二階矩,即2E(x)=μ,D(X)=σ<+∞x1,x2,,xn為從該整體獲得的樣本,和s2分別是樣本均值和樣本方差,則此定理表示,樣本均值的均值與整體均值同樣,而樣本均值的方差是整體方差的。證明因?yàn)?)2)故()式建立。下證(),注意到,而,于是,兩邊各除以n-1,即得()式。值得讀者注意的是:本定理的結(jié)論與整體聽從什么散布沒關(guān)。樣本矩及其函數(shù)樣本均值和樣本方差的更一般的推行是樣本矩,這是一類常有的統(tǒng)計(jì)量。定義6-4設(shè)x1,x2,,xn是樣本,則統(tǒng)計(jì)量()稱為樣本k階原點(diǎn)矩,特別地,樣本一階原點(diǎn)矩就是樣本均值。統(tǒng)計(jì)量()稱為樣本k階中心矩。常有的是k=2的場合,此時(shí)稱為二階樣本中心矩。本書中我們將其記為sn2,以差別樣本方差S2。極大次序統(tǒng)計(jì)量和極小次序統(tǒng)計(jì)量定義6-5設(shè)整體X擁有散布函數(shù)F(x),散布密度f(x),x1,x2,,xn為其樣本,我們分別稱X(1)=min{x12n(n)=max{x12n,x,x},x,x,x}為極小次序統(tǒng)計(jì)量和極大次序統(tǒng)計(jì)量。定理6-3若x(1),x(n)分別為極小、極大次序統(tǒng)計(jì)量,則(1)x(1)的散布函數(shù)F1(x)=1-(1-F(x))n,x(1)的散布密度f1(x)=n-(1-F(x))n-1f(x)(2)x(n)的散布函數(shù)Fn(x)=[F(x)]n,x(n)的散布密度fn(x)=n[F(x)]n-1f(x)證明先求出x(1)及x(n)的散布函數(shù)F1(x)及Fn(x):,,分別對(duì)F1(x),F(xiàn)n(x)求導(dǎo)即得正態(tài)整體的抽樣散布有好多統(tǒng)計(jì)推測是鑒于正態(tài)整體的假定的,以標(biāo)準(zhǔn)正態(tài)變量為基石而結(jié)構(gòu)的三個(gè)有名統(tǒng)計(jì)量(其抽樣散布分別為x2散布,t散布和F散布)在實(shí)踐中有著寬泛的應(yīng)用。這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不單有明確背景,并且其抽樣散布的密度函數(shù)有“明確的表達(dá)式”,它們被稱為統(tǒng)計(jì)中的“三大抽樣散布”。x2散布(卡方散布)定義
6-6
設(shè)X1,X2,,Xn獨(dú)立同散布于標(biāo)準(zhǔn)正態(tài)散布
N(0,1),則x2=x12+xn2的散布稱為自由度為
n的
x2散布,記為
x2~
x2(n)。x2(n)散布的密度函數(shù)見圖6-4當(dāng)隨機(jī)變量22222x~x(n)時(shí),對(duì)給定的α(0<α<1),稱知足p{x>xα(n)}=α的xα(n)}是自由度為n的開方散布的α分位數(shù)。分位數(shù)xα2(n)}能夠從附表4中查到。比如n=10,=0.05,那么從附表4中查得x2(10)=18.307p(x)2>x20.05(10)=p{x2>18.307=0.05注:請(qǐng)讀者注意x2~x2(n)時(shí),n是自由度,不是容量。2.F散布定義6-7設(shè)x1~x2(m),x2~x2(n)X1與X2獨(dú)立,則稱的散布是自由度為m與n的F散布,記為F~F(m,n),此中m稱為分子自由度,n稱為分母自由度。自由度為m與n的F散布的密度函數(shù)的圖像是一個(gè)只取非負(fù)值的偏態(tài)散布(見圖6-5)。當(dāng)隨機(jī)變量F~F(m,n)時(shí),對(duì)給定的α(0<α<1),稱知足P{F>Fα}(m,n)=α的數(shù)Fαm,n)是自由度為m與n的F散布的α分位數(shù)。當(dāng)F~F(m,n)時(shí),有下邊性質(zhì)(不證),這說明()對(duì)小的α,分位為Fα(m,n)能夠從附表5中查到,而分位數(shù)F1-α(m,n)則可經(jīng)過()式獲得?!纠?-8】若取m=10,則n=5,α=0.05,那么從附表5上(m=n1,n=n2)查得F0.05(10,5)=4.74利用()式可獲得【答疑編號(hào):10060202針對(duì)該題發(fā)問】3.t散布定義6-8設(shè)隨機(jī)變量與X1與X2獨(dú)立且X1~N(0,1),X2~X2(n),則稱的散布為自由度為n的t的散布,記為t~t(n).t散布密度函數(shù)的圖像是一個(gè)對(duì)于縱軸對(duì)稱的散布(圖6-6),與標(biāo)準(zhǔn)正態(tài)散布的密度函數(shù)形態(tài)近似,不過峰比標(biāo)準(zhǔn)正態(tài)散布低一些,尾部的概率比標(biāo)準(zhǔn)正態(tài)散布的大一些。圖6-6t散布與N(0,1)的密度函數(shù)當(dāng)隨機(jī)變量t~t(n)時(shí),稱知足P{t>tαα的t散布的α(n)}=α的t(n)是自由度為n分位數(shù),分位數(shù)tαn=10,α=0.05時(shí),從附表3上查得(n)能夠從附表3中查到,比如當(dāng)(10)=1.8125t0.05因?yàn)閠散布的密度函數(shù)對(duì)于0對(duì)稱,故其分位數(shù)有以下關(guān)系:(n)=-t(n)t1-αα比如,t0.95(10)=-t0.05(10)=-1.8125當(dāng)n很大時(shí),(n≥30),t散布能夠用N(0,1)近似P(t>-tα)=1-α,p(t>t1-α)=1-α,∴t1-α=-tα4.一些重要結(jié)論來自一般正態(tài)整體的樣本均值和樣本方差S2的抽樣散布是應(yīng)用最廣的抽樣散布,下邊我們加以介紹。定理6-4設(shè)X1,X2,Xn是來自正態(tài)整體2)的樣本,N(μ,σ其樣本均值和樣本方差分別為:則有1)與s2互相獨(dú)立;2)特別,若(不證)222推論:設(shè),σ1=σ2=σ并記則(不證)本章小結(jié)本章的基本要求是(一)知道整體、樣本、簡單樣本和統(tǒng)計(jì)量的觀點(diǎn)(二)知道統(tǒng)計(jì)量和s2的以下性質(zhì)。22E(s)=σ(三)若x的散布函數(shù)為F(x),散布函數(shù)為f(x),則樣本(x1,x2,xn)的聯(lián)合散布函數(shù)為F(x1)F(x2)F(xn)樣本(x1,x2,xn)的聯(lián)合散布密度為f(x1)f(x2)fxn),樣本(x1,x2,xn)的概率函數(shù),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度特色小鎮(zhèn)場地硬化與文化旅游開發(fā)合同3篇
- 2025年度智慧城市項(xiàng)目公司營銷策劃合同3篇
- 二零二五年度個(gè)人與公司間代收代付房產(chǎn)交易合同范本2篇
- 2025年度全款購置特色民宿買賣合同3篇
- 2025年度公司與員工租車及車輛租賃續(xù)租協(xié)議3篇
- 2025年度汽車租賃公司與個(gè)人汽車租賃風(fēng)險(xiǎn)管理協(xié)議3篇
- 2025年度農(nóng)業(yè)農(nóng)機(jī)智能化控制系統(tǒng)開發(fā)合同2篇
- 二零二五年度緊急物資公路運(yùn)輸保障協(xié)議3篇
- 二零二五年度農(nóng)村機(jī)井承包與水資源高效利用合同
- 2025年度個(gè)人與企業(yè)間房屋購置公對(duì)私借款協(xié)議3篇
- 合規(guī)性評(píng)價(jià)報(bào)告(2022年)
- 大連市小升初手冊(cè)
- 《自然辯證法》課后習(xí)題答案自然辯證法課后題答案
- 中國人民財(cái)產(chǎn)保險(xiǎn)股份有限公司機(jī)動(dòng)車綜合商業(yè)保險(xiǎn)條款
- 燃?xì)夤こ瘫O(jiān)理實(shí)施細(xì)則(通用版)
- E車E拍行車記錄儀說明書 - 圖文-
- 人才梯隊(duì)-繼任計(jì)劃-建設(shè)方案(珍貴)
- 《健身氣功》(選修)教學(xué)大綱
- 王家?guī)r隧道工程地質(zhì)勘察報(bào)告(總結(jié))
- 《昆明的雨》優(yōu)質(zhì)課一等獎(jiǎng)(課堂PPT)
- EHS的組織架構(gòu)和職責(zé)說明(共2頁)
評(píng)論
0/150
提交評(píng)論