




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、6.1 總體與樣本總體與樣本一、總體一、總體 普通我們把研討對(duì)象的全體稱為總體或母體,而普通我們把研討對(duì)象的全體稱為總體或母體,而把每一個(gè)研討對(duì)象稱為個(gè)體把每一個(gè)研討對(duì)象稱為個(gè)體. 例如,在研討某燈泡廠消費(fèi)例如,在研討某燈泡廠消費(fèi)的燈泡質(zhì)量時(shí),該廠消費(fèi)的燈泡全體構(gòu)成的一個(gè)總體,其的燈泡質(zhì)量時(shí),該廠消費(fèi)的燈泡全體構(gòu)成的一個(gè)總體,其中每只燈泡都是個(gè)體;研討某班高等數(shù)學(xué)課程的成果時(shí),中每只燈泡都是個(gè)體;研討某班高等數(shù)學(xué)課程的成果時(shí),該班每個(gè)同窗都是個(gè)體,全體同窗構(gòu)成一個(gè)總體該班每個(gè)同窗都是個(gè)體,全體同窗構(gòu)成一個(gè)總體. 在實(shí)踐問題中,人們主要關(guān)懷的往往是研討對(duì)象的某在實(shí)踐問題中,人們主要關(guān)懷的往往是研
2、討對(duì)象的某個(gè)或某些數(shù)量目的及其在總體中的分布情況個(gè)或某些數(shù)量目的及其在總體中的分布情況. 如研討如研討燈泡的質(zhì)量時(shí),關(guān)注的是燈泡的運(yùn)用壽命這一目的;在研燈泡的質(zhì)量時(shí),關(guān)注的是燈泡的運(yùn)用壽命這一目的;在研討大學(xué)生的體質(zhì)時(shí),那么主要關(guān)懷的是大學(xué)生的身高、體討大學(xué)生的體質(zhì)時(shí),那么主要關(guān)懷的是大學(xué)生的身高、體重、視力等目的重、視力等目的. 由于每個(gè)個(gè)體都有一個(gè)或多個(gè)數(shù)量由于每個(gè)個(gè)體都有一個(gè)或多個(gè)數(shù)量目的值,那么,一切個(gè)體的這些目的值就構(gòu)成一個(gè)集合,目的值,那么,一切個(gè)體的這些目的值就構(gòu)成一個(gè)集合,該集合包含了研討目的在總體中的一切能夠取值該集合包含了研討目的在總體中的一切能夠取值 比如,某廠燈泡的壽命
3、目的,其一切能夠的取值比如,某廠燈泡的壽命目的,其一切能夠的取值就是一切詳細(xì)燈泡壽命值;某班的高等數(shù)學(xué)成果就是一切詳細(xì)燈泡壽命值;某班的高等數(shù)學(xué)成果這一目的的取值就是該班一切同窗的高等數(shù)學(xué)成這一目的的取值就是該班一切同窗的高等數(shù)學(xué)成果數(shù)理統(tǒng)計(jì)中,我們關(guān)懷的并不是每個(gè)個(gè)體的果數(shù)理統(tǒng)計(jì)中,我們關(guān)懷的并不是每個(gè)個(gè)體的詳細(xì)目的特征,而關(guān)懷的正是象某廠燈泡壽命、詳細(xì)目的特征,而關(guān)懷的正是象某廠燈泡壽命、某班高數(shù)成果這樣的總體目的特征要研討總體某班高數(shù)成果這樣的總體目的特征要研討總體的目的,就要進(jìn)展實(shí)驗(yàn)或察看的目的,就要進(jìn)展實(shí)驗(yàn)或察看 由于預(yù)先不知道由于預(yù)先不知道察看到的是哪個(gè)個(gè)體,因此察看到的相應(yīng)目的值
4、察看到的是哪個(gè)個(gè)體,因此察看到的相應(yīng)目的值也就不能預(yù)先確定,完全是隨機(jī)的,這樣,總體也就不能預(yù)先確定,完全是隨機(jī)的,這樣,總體的目的就是一個(gè)隨機(jī)變量,其分布完全描畫了目的目的就是一個(gè)隨機(jī)變量,其分布完全描畫了目的在總體中的分布情況于是,在數(shù)理統(tǒng)計(jì)中就的在總體中的分布情況于是,在數(shù)理統(tǒng)計(jì)中就把總體定義為服從某一分布的隨機(jī)變量把總體定義為服從某一分布的隨機(jī)變量X數(shù)量數(shù)量目的,其概率分布稱為總體的分布,而每個(gè)個(gè)目的,其概率分布稱為總體的分布,而每個(gè)個(gè)體對(duì)應(yīng)隨機(jī)變量體對(duì)應(yīng)隨機(jī)變量X一個(gè)詳細(xì)察看值前面談到的一個(gè)詳細(xì)察看值前面談到的一切個(gè)體的目的值集合就是總體一切個(gè)體的目的值集合就是總體X的一切能夠取的一
5、切能夠取值的集合值的集合二、樣本二、樣本 我們知道,研討總體離不開研討它的體但我們知道,研討總體離不開研討它的體但在許多實(shí)踐問題中,不能夠?qū)σ磺袀€(gè)體逐一進(jìn)展在許多實(shí)踐問題中,不能夠?qū)σ磺袀€(gè)體逐一進(jìn)展研討,而只能從總體中抽取一部分個(gè)體進(jìn)展察看研討,而只能從總體中抽取一部分個(gè)體進(jìn)展察看或?qū)嶒?yàn),根據(jù)對(duì)這部分個(gè)體的察看結(jié)果來推或?qū)嶒?yàn),根據(jù)對(duì)這部分個(gè)體的察看結(jié)果來推斷總體的分布情況斷總體的分布情況 普通地,假設(shè)從總體中按一定規(guī)那么抽取普通地,假設(shè)從總體中按一定規(guī)那么抽取n個(gè)個(gè)體進(jìn)展察看或?qū)嶒?yàn),那么稱這個(gè)個(gè)體進(jìn)展察看或?qū)嶒?yàn),那么稱這n個(gè)個(gè)體個(gè)個(gè)體為總體的一個(gè)樣本為總體的一個(gè)樣本Sample,樣本中所含個(gè)體
6、,樣本中所含個(gè)體的數(shù)目的數(shù)目n稱為樣本容量稱為樣本容量Sample Size,抽取一,抽取一個(gè)樣本的過程稱為抽樣個(gè)樣本的過程稱為抽樣Sampling 本書所涉及的抽樣均指隨機(jī)抽樣,即,在詳本書所涉及的抽樣均指隨機(jī)抽樣,即,在詳細(xì)的抽樣之前,哪些個(gè)體被抽取,不能預(yù)先確定細(xì)的抽樣之前,哪些個(gè)體被抽取,不能預(yù)先確定而應(yīng)由察看或?qū)嶒?yàn)來定假設(shè)用而應(yīng)由察看或?qū)嶒?yàn)來定假設(shè)用 表示樣本表示樣本中的第中的第i個(gè)個(gè)體的數(shù)量目的個(gè)個(gè)體的數(shù)量目的 ,那么一個(gè)容,那么一個(gè)容量為量為n的樣本就可以表示為的樣本就可以表示為 ,這是一個(gè),這是一個(gè)n維隨機(jī)向量假設(shè)用維隨機(jī)向量假設(shè)用 表示表示 的察看值的察看值,那么,那么, 便
7、是樣本便是樣本 的一個(gè)察看的一個(gè)察看值,稱其為樣本察看值或樣本值,它是一組詳細(xì)值,稱其為樣本察看值或樣本值,它是一組詳細(xì)的數(shù)據(jù)今后,為了方便起見,記號(hào)的數(shù)據(jù)今后,為了方便起見,記號(hào) 有時(shí)也表示樣本值,這可以從上下文的聯(lián)絡(luò)來區(qū)有時(shí)也表示樣本值,這可以從上下文的聯(lián)絡(luò)來區(qū)分:假設(shè)在一次詳細(xì)抽樣之前,那么,分:假設(shè)在一次詳細(xì)抽樣之前,那么, 表示樣本,它是一個(gè)表示樣本,它是一個(gè)n維隨機(jī)向量維隨機(jī)向量iX), 2 , 1(ni),(21nXXXixix), 2 , 1(ni),(21nxxx),(21nXXX),(21nXXX),(21nXXX這種情形多出如今實(shí)際研討或推導(dǎo)中;這種情形多出如今實(shí)際研討或
8、推導(dǎo)中;假設(shè)在一次詳細(xì)抽樣之后,那么假設(shè)在一次詳細(xì)抽樣之后,那么 表示樣本值,它是一個(gè)詳細(xì)的數(shù)值向量表示樣本值,它是一個(gè)詳細(xì)的數(shù)值向量在實(shí)踐運(yùn)用中就是這種情形在實(shí)踐運(yùn)用中就是這種情形. 要想由樣本推斷總體,就該當(dāng)使樣本要想由樣本推斷總體,就該當(dāng)使樣本既可以反映出總體的特點(diǎn),又便于數(shù)學(xué)上既可以反映出總體的特點(diǎn),又便于數(shù)學(xué)上的處置為此,要求樣本具有以下兩個(gè)特的處置為此,要求樣本具有以下兩個(gè)特性:性:1同分布性,即,樣本同分布性,即,樣本 的各分的各分量與總體量與總體X有一樣的分布;有一樣的分布;2獨(dú)立性,即,樣本獨(dú)立性,即,樣本 的各分量的各分量相互獨(dú)立相互獨(dú)立),(21nXXX),(21nXXX
9、),(21nXXX 我們把滿足以上兩個(gè)特性的樣本稱為我們把滿足以上兩個(gè)特性的樣本稱為簡(jiǎn)單隨機(jī)樣本,把獲得簡(jiǎn)單隨機(jī)樣本簡(jiǎn)單隨機(jī)樣本,把獲得簡(jiǎn)單隨機(jī)樣本 的過程,稱為簡(jiǎn)單隨機(jī)抽樣的過程,稱為簡(jiǎn)單隨機(jī)抽樣. 由于簡(jiǎn)單隨機(jī)由于簡(jiǎn)單隨機(jī)樣本實(shí)踐上是由一組獨(dú)立同分布的隨機(jī)變樣本實(shí)踐上是由一組獨(dú)立同分布的隨機(jī)變量構(gòu)成的,因此,簡(jiǎn)單隨機(jī)抽樣就是獨(dú)立量構(gòu)成的,因此,簡(jiǎn)單隨機(jī)抽樣就是獨(dú)立地、反復(fù)地對(duì)總體地、反復(fù)地對(duì)總體X做抽樣實(shí)驗(yàn)做抽樣實(shí)驗(yàn). 就詳細(xì)的就詳細(xì)的方法而言,有放回抽樣與不放回抽樣之分方法而言,有放回抽樣與不放回抽樣之分. 對(duì)于有限總體即總體中個(gè)體的數(shù)量有對(duì)于有限總體即總體中個(gè)體的數(shù)量有限,我們通常采用
10、放回抽樣,這樣隨機(jī)限,我們通常采用放回抽樣,這樣隨機(jī)抽取的樣本便是一個(gè)簡(jiǎn)單隨機(jī)樣本;對(duì)于抽取的樣本便是一個(gè)簡(jiǎn)單隨機(jī)樣本;對(duì)于無限總體即總體中個(gè)體的數(shù)量無限,無限總體即總體中個(gè)體的數(shù)量無限,放回抽樣與不放回抽樣幾乎沒什么差別,放回抽樣與不放回抽樣幾乎沒什么差別,因此通常采用不放回抽樣因此通常采用不放回抽樣. 在適用上,即使在適用上,即使對(duì)有限總體對(duì)有限總體 ,只需抽取的,只需抽取的),(21nXXX 的個(gè)體數(shù)目的個(gè)體數(shù)目n與總體中個(gè)體的總數(shù)目與總體中個(gè)體的總數(shù)目N之比之比 很小通常要小于很小通常要小于0.1,仍可用不放回抽,仍可用不放回抽樣,這樣得到的樣本可近似地看成一個(gè)簡(jiǎn)樣,這樣得到的樣本可近
11、似地看成一個(gè)簡(jiǎn)單隨機(jī)樣本單隨機(jī)樣本. 今后,如不特別聲明,我們所說的樣本均今后,如不特別聲明,我們所說的樣本均指簡(jiǎn)單隨機(jī)樣本指簡(jiǎn)單隨機(jī)樣本 由于樣本由于樣本 的各分量獨(dú)立且每的各分量獨(dú)立且每個(gè)分量的分布都與總體個(gè)分量的分布都與總體X的分布一樣,所以,的分布一樣,所以,對(duì)密度函數(shù)對(duì)密度函數(shù) 為的延續(xù)型總體為的延續(xù)型總體X而言,樣而言,樣本本 的結(jié)合密度函數(shù)的結(jié)合密度函數(shù). (6-1)Nn),(21nXXX)(xf),(21nXXXniinxfxxxf121)(),( 而當(dāng)總體而當(dāng)總體X是離散型的且其概率函數(shù)是離散型的且其概率函數(shù) 時(shí),樣本時(shí),樣本 的結(jié)合概率函的結(jié)合概率函數(shù)或分布為數(shù)或分布為.
12、(6-2) 不論是結(jié)合密度函數(shù),還是結(jié)合概率函數(shù),不論是結(jié)合密度函數(shù),還是結(jié)合概率函數(shù),它們都是樣本信息最全面的概括,非常適它們都是樣本信息最全面的概括,非常適宜在某些場(chǎng)所如第七章的參數(shù)估計(jì)中宜在某些場(chǎng)所如第七章的參數(shù)估計(jì)中運(yùn)用但這種概括有時(shí)也不便或也沒必要運(yùn)用但這種概括有時(shí)也不便或也沒必要運(yùn)用,這時(shí)就需求引入能反映樣本信息某運(yùn)用,這時(shí)就需求引入能反映樣本信息某個(gè)側(cè)面的專門特征描寫個(gè)側(cè)面的專門特征描寫. )(xpxXP,21aax),(21nXXX,2211nnxXxXxXPniiniiixpxXP11)(三、統(tǒng)計(jì)量與樣本數(shù)字特征三、統(tǒng)計(jì)量與樣本數(shù)字特征1統(tǒng)計(jì)量統(tǒng)計(jì)量 完全由樣本決議的量就稱為
13、統(tǒng)計(jì)量完全由樣本決議的量就稱為統(tǒng)計(jì)量Statistic,它只依賴于樣本,而不依賴,它只依賴于樣本,而不依賴任何未知參數(shù)統(tǒng)計(jì)量可以看作是對(duì)樣本任何未知參數(shù)統(tǒng)計(jì)量可以看作是對(duì)樣本的一種的一種“加工,是對(duì)樣本中所含有用信息加工,是對(duì)樣本中所含有用信息的一種的一種“提煉和提煉和“集中集中. 比如對(duì)正態(tài)總體比如對(duì)正態(tài)總體 中抽取的樣本中抽取的樣本 來說,每個(gè)來說,每個(gè) 都含有都含有 的信息,而統(tǒng)計(jì)量的信息,而統(tǒng)計(jì)量 就是對(duì)這種就是對(duì)這種信息的一個(gè)集中,在做統(tǒng)計(jì)推斷時(shí),我們信息的一個(gè)集中,在做統(tǒng)計(jì)推斷時(shí),我們),(2N),(21nXXXiXX2樣本數(shù)字特征樣本數(shù)字特征 主要利用的正是這種集中信息的統(tǒng)計(jì)量,
14、而主要利用的正是這種集中信息的統(tǒng)計(jì)量,而不直接利用樣本,可以說,統(tǒng)計(jì)量是進(jìn)展統(tǒng)不直接利用樣本,可以說,統(tǒng)計(jì)量是進(jìn)展統(tǒng)計(jì)推斷的一個(gè)根本工具計(jì)推斷的一個(gè)根本工具. 設(shè)設(shè) 是來自總體是來自總體X的容量為的容量為n的的樣本,為提煉樣本所反映的總體信息,簡(jiǎn)單樣本,為提煉樣本所反映的總體信息,簡(jiǎn)單的方法就是引進(jìn)描寫樣本特征的數(shù)量目的即的方法就是引進(jìn)描寫樣本特征的數(shù)量目的即樣本的數(shù)字特征樣本的數(shù)字特征. 常用的樣本數(shù)字特征有:常用的樣本數(shù)字特征有:1樣本均值樣本均值Sample Mean: 6-3),(21nXXXniiXnX11 它反映了樣本各分量取值的平均形狀,是它反映了樣本各分量取值的平均形狀,是對(duì)樣
15、本位置特征的一個(gè)描寫,可作為總體對(duì)樣本位置特征的一個(gè)描寫,可作為總體均值均值 的一個(gè)近似值的一個(gè)近似值. 2樣本方差樣本方差Sample Variance: ,6-4以及樣本規(guī)范差以及樣本規(guī)范差Sample Standard Deviation或樣本均方差:或樣本均方差: .樣本方差反映了樣本中各分量取值的離散程樣本方差反映了樣本中各分量取值的離散程度,可用來作為總體方差的一個(gè)近似值度,可用來作為總體方差的一個(gè)近似值. 在在)(XEniiXXnS122)(11niiXXnS12)(11詳細(xì)計(jì)算時(shí),通常選用其簡(jiǎn)化公式詳細(xì)計(jì)算時(shí),通常選用其簡(jiǎn)化公式 6-5類似地,還有公式類似地,還有公式 ,其中其
16、中a為恣意常數(shù)為恣意常數(shù). 3樣本的樣本的k階原點(diǎn)矩階原點(diǎn)矩(Sample Raw Moment,Sample Moment): , ;niiXXnS122)(11niiiXXXXn122)2(11niniiiXnXXXn1212211niiXnXn12211niiaXnaXnS1222)()(11nikikXnA11, 2 , 1k顯然,樣本均值顯然,樣本均值 就是樣本的就是樣本的1階原點(diǎn)矩階原點(diǎn)矩 . 4樣本的樣本的k階中心矩階中心矩(Sample Central Moment): , ; 可見,樣本方差可見,樣本方差 與樣本的與樣本的2階中心矩階中心矩 只相差一個(gè)常數(shù)因子:只相差一個(gè)常數(shù)
17、因子: . 為明確這種為明確這種聯(lián)絡(luò)與區(qū)別,樣本的聯(lián)絡(luò)與區(qū)別,樣本的2階中心矩階中心矩 有時(shí)還有時(shí)還可用以下記號(hào)來表示可用以下記號(hào)來表示 . 6-6 X1AkniikXXnB)(11, 3 , 2k2S2B221BnnS2B212)(1niinXXnS6.2 三大統(tǒng)計(jì)分布三大統(tǒng)計(jì)分布 本節(jié)引見數(shù)理統(tǒng)計(jì)中的三個(gè)著名分布,本節(jié)引見數(shù)理統(tǒng)計(jì)中的三個(gè)著名分布,它們?cè)趨?shù)估計(jì)和假設(shè)檢驗(yàn)等統(tǒng)計(jì)推斷問它們?cè)趨?shù)估計(jì)和假設(shè)檢驗(yàn)等統(tǒng)計(jì)推斷問題中有廣泛運(yùn)用題中有廣泛運(yùn)用. 一、一、X平方平方-分布分布定義定義6.1 設(shè)隨機(jī)變量設(shè)隨機(jī)變量 獨(dú)立且服從一樣獨(dú)立且服從一樣分布分布 ,那么稱,那么稱 (6-8) 所服從的
18、分布是自在度為所服從的分布是自在度為n的的 -分布,記分布,記為為 ,稱,稱 為為 -變量變量. 為留念英國(guó)著名為留念英國(guó)著名統(tǒng)計(jì)學(xué)家皮爾統(tǒng)計(jì)學(xué)家皮爾K.Pearson,1857-1936nXXX,21) 1 , 0 (NnininXXXX122221222)(22nn2n2- 分布也稱為皮爾遜分布也稱為皮爾遜 -分布分布. 這是數(shù)理統(tǒng)計(jì)中這是數(shù)理統(tǒng)計(jì)中一個(gè)非常重要的概率分布一個(gè)非常重要的概率分布. 根據(jù)獨(dú)立隨機(jī)變量和的密度公式根據(jù)獨(dú)立隨機(jī)變量和的密度公式(3-27)和數(shù)學(xué)和數(shù)學(xué)歸納法,可以證明:歸納法,可以證明: -分布的概率密度函分布的概率密度函數(shù)為詳見數(shù)為詳見5 ,6-9其中其中 是是
19、-函數(shù),定義見第四章附錄函數(shù),定義見第四章附錄2 圖圖6.1是是 -變量的概率密度函數(shù)變量的概率密度函數(shù)(6-9)在幾種不在幾種不同參數(shù)下的圖像同參數(shù)下的圖像. 22)(2n0, 00,)(21)(22212xxexxfxnnnn)( x2特別地,當(dāng)特別地,當(dāng) 時(shí),時(shí), 服從參數(shù)服從參數(shù) 的指數(shù)的指數(shù)分布分布. 此外,此外, -分布具有以下性質(zhì):分布具有以下性質(zhì):1數(shù)字特征數(shù)字特征. 假設(shè)假設(shè) ,那么,那么 , . 2可加性可加性. 假設(shè)假設(shè) 且且 與與 獨(dú)立,那么獨(dú)立,那么. (6-10) 2n22212)(22nnnEn2nDn22)(121nX)(222nX1X2X)(21221nnXX
20、 為便于今后的運(yùn)用,如今我們引入上側(cè)分為便于今后的運(yùn)用,如今我們引入上側(cè)分位數(shù)的概念位數(shù)的概念. 所謂一個(gè)分布的所謂一個(gè)分布的 -上側(cè)分位數(shù)上側(cè)分位數(shù)就是指這樣一個(gè)數(shù),它使相應(yīng)分布的隨機(jī)就是指這樣一個(gè)數(shù),它使相應(yīng)分布的隨機(jī)變量不小于該數(shù)的概率為變量不小于該數(shù)的概率為 . 比如,假設(shè)記比如,假設(shè)記 -變量變量 的的 -上側(cè)分位數(shù)為,那么滿足上側(cè)分位數(shù)為,那么滿足見圖見圖6.2. 22n對(duì)不太大的對(duì)不太大的n,如,如 60,可用附表,可用附表3查查 的的值,而對(duì)較大的值,而對(duì)較大的n,那么可用,那么可用6-11近似近似計(jì)算計(jì)算 , (6-12) 其中其中 是規(guī)范正態(tài)分布是規(guī)范正態(tài)分布 的的 -上側(cè)
21、分位上側(cè)分位數(shù),可經(jīng)過附表數(shù),可經(jīng)過附表2查出查出. n)(2nUnnn 2)(2U) 1 , 0 (N二、二、t -t -分布分布定義定義6.2 設(shè)設(shè) , ,X與與Y獨(dú)立,獨(dú)立,那么稱那么稱 (6-13) 所服從的分布所服從的分布是自在度為是自在度為n的的t-分布,記作分布,記作 . t -分布分布也稱為學(xué)生分布,是英國(guó)統(tǒng)計(jì)學(xué)家戈塞特也稱為學(xué)生分布,是英國(guó)統(tǒng)計(jì)學(xué)家戈塞特Goset,1876-1937在在1908年年“Student的筆名初次發(fā)表的,這個(gè)分布在數(shù)理統(tǒng)計(jì)的筆名初次發(fā)表的,這個(gè)分布在數(shù)理統(tǒng)計(jì)中也占有重要的位置中也占有重要的位置. 根據(jù)獨(dú)立隨機(jī)變量商的密度公式根據(jù)獨(dú)立隨機(jī)變量商的密度
22、公式(3-32),可以證明過程從略:可以證明過程從略:(6-13)中的中的 概率密度函數(shù)為概率密度函數(shù)為) 1 , 0 (NX)(2nYnYXTn/)( ntTnnT 根據(jù)獨(dú)立隨機(jī)變量商的密度公式根據(jù)獨(dú)立隨機(jī)變量商的密度公式(3-32),可,可以證明過程從略:以證明過程從略:(6-13)中中 的概率的概率密度函數(shù)為密度函數(shù)為 , . (6-14) 另外,另外,t -分布具有以下性質(zhì):分布具有以下性質(zhì):1近似規(guī)范正態(tài)近似規(guī)范正態(tài) 當(dāng)當(dāng) 時(shí),時(shí), 這就是說,當(dāng)這就是說,當(dāng)n充分大時(shí),充分大時(shí),t -分布分布 近似于近似于規(guī)范正態(tài)分布規(guī)范正態(tài)分布 ,但假設(shè),但假設(shè)n較小,這兩較小,這兩個(gè)分布的差別還
23、是比較大的,見圖個(gè)分布的差別還是比較大的,見圖6.3, nT21 22211 )( )()(nnnnnxnxfxn2 221)()(xnexxf)(nt) 1 , 0 (N 其中粗虛線是其中粗虛線是 的密度函數(shù)的密度函數(shù) . 我們我們看到,一切的看到,一切的t -分布密度函數(shù)值在分布密度函數(shù)值在 附附近均未超越的值,而在兩邊的尾部均超越近均未超越的值,而在兩邊的尾部均超越 了的值了的值. 這就是統(tǒng)計(jì)學(xué)中所謂的這就是統(tǒng)計(jì)學(xué)中所謂的“重尾重尾Heavy Trails景象景象. ) 1 , 0(N)(x0 x)(x2數(shù)字特征假設(shè)數(shù)字特征假設(shè) , ,那,那么么 順便指出,自在度為順便指出,自在度為1的
24、的t -分布也稱為柯西分布也稱為柯西Cauchy分布,它以其數(shù)學(xué)期望和方差分布,它以其數(shù)學(xué)期望和方差均不存在而出名見例均不存在而出名見例4.3. 記記t -分布分布 的的 -上側(cè)分位數(shù)為上側(cè)分位數(shù)為 ,附表,附表4給出了不同給出了不同n和和 所對(duì)應(yīng)的所對(duì)應(yīng)的 數(shù)值數(shù)值. 另外,另外,由性質(zhì)由性質(zhì)1知,對(duì)較大的知,對(duì)較大的n比如比如 60 ,可用下式近似,可用下式近似. (6-15) )(ntTn2 n.2 , 0nnDTETnn)(nt)(nt)(ntnUnt)(三、三、F -分布分布定義定義6.3 設(shè)設(shè) 且且X與與Y獨(dú)立,那么稱獨(dú)立,那么稱 (6-16) 所服從的分布是自在度為所服從的分布是
25、自在度為 的的F-分布,記分布,記作作 ,這是為留念英國(guó)著名統(tǒng)計(jì)學(xué)家費(fèi)歇,這是為留念英國(guó)著名統(tǒng)計(jì)學(xué)家費(fèi)歇R.A. Fisher,1890-1962而命名的而命名的F-分布也分布也是數(shù)理統(tǒng)計(jì)的一個(gè)重要分布是數(shù)理統(tǒng)計(jì)的一個(gè)重要分布. 留意到留意到(6-16)的商構(gòu)造,那么根據(jù)隨機(jī)變量商的商構(gòu)造,那么根據(jù)隨機(jī)變量商的密度計(jì)算公式的密度計(jì)算公式3-34可求得可求得F-分布分布 的概率密度函數(shù)為過程從略,詳見的概率密度函數(shù)為過程從略,詳見3, 4)( ),(2212nYnX21/nYnXF ),(21nn),(21nnFF),(21nnF , (6-17) 圖圖6.4是四組不同參數(shù)下該密度函數(shù)的圖像是四
26、組不同參數(shù)下該密度函數(shù)的圖像. 0, 00,1)()()()(22121212121 2112121222,xxxnnxnnnnxfnnnnnnnnn另外,由定義另外,由定義6.3,立刻有以下結(jié)論:,立刻有以下結(jié)論:假設(shè)假設(shè) ,那么,那么 .這個(gè)結(jié)論可用于計(jì)算分布這個(gè)結(jié)論可用于計(jì)算分布 的的 -上側(cè)上側(cè)分位數(shù)分位數(shù) . 詳細(xì)地說,我們有詳細(xì)地說,我們有. (6-18) 現(xiàn)實(shí)上,由現(xiàn)實(shí)上,由 、 以及上以及上側(cè)分位數(shù)的定義可推出側(cè)分位數(shù)的定義可推出),(21nnFF),(112nnFF),(112nnFF),(21nnF),(1),(12121nnFnnFa),(21nnFF),(112nnFF
27、),(1 ),(1 121121nnFFPnnFFP),(1 1121nnFFP)1 (1故故(6-18)式成立式成立. 對(duì)較小的對(duì)較小的 如如0.1、0.05、0.025等,等, 的數(shù)值可由附表的數(shù)值可由附表5查得查得. 但附表但附表5并未給出較并未給出較大時(shí)的數(shù)值,此時(shí),可用公式大時(shí)的數(shù)值,此時(shí),可用公式(6-18)求出求出 . ),(21nnF),(21nnF6.3 抽樣分布抽樣分布 由于統(tǒng)計(jì)量是由樣本決議的,而在一由于統(tǒng)計(jì)量是由樣本決議的,而在一次詳細(xì)的抽樣之前,樣本中的每一個(gè)分量次詳細(xì)的抽樣之前,樣本中的每一個(gè)分量都是隨機(jī)變量,所以,在一次詳細(xì)的抽樣都是隨機(jī)變量,所以,在一次詳細(xì)的抽
28、樣之前,統(tǒng)計(jì)量也是隨機(jī)變量,也有本人的之前,統(tǒng)計(jì)量也是隨機(jī)變量,也有本人的分布分布. 我們稱統(tǒng)計(jì)量的分布為抽樣分布我們稱統(tǒng)計(jì)量的分布為抽樣分布. 下下面,先引見樣本的頻數(shù)分布面,先引見樣本的頻數(shù)分布. 一、樣本的頻數(shù)分布一、樣本的頻數(shù)分布 將樣本值中一切的不同數(shù)值由小到大排將樣本值中一切的不同數(shù)值由小到大排 列列 , 樣本值中取這些值的頻數(shù)分樣本值中取這些值的頻數(shù)分別記為別記為 (應(yīng)有應(yīng)有 ),這,這樣就可得到樣本的頻數(shù)分布:樣就可得到樣本的頻數(shù)分布: 當(dāng)樣本容量較大時(shí),可將樣本值的范圍劃當(dāng)樣本容量較大時(shí),可將樣本值的范圍劃分成假設(shè)干個(gè)長(zhǎng)度相等的間隔,然后計(jì)算分成假設(shè)干個(gè)長(zhǎng)度相等的間隔,然后計(jì)
29、算樣本值落在這些間隔中的頻數(shù),再按上表樣本值落在這些間隔中的頻數(shù),再按上表列出頻數(shù)分布列出頻數(shù)分布. 頻數(shù)分布通常用樣本直方圖頻數(shù)分布通常用樣本直方圖Histogram kxxx21kmmm,21nmmmk21 除頻數(shù)直方圖外,有時(shí)還需思索概率直方除頻數(shù)直方圖外,有時(shí)還需思索概率直方圖,它要求每個(gè)直方條的面積需等于相應(yīng)圖,它要求每個(gè)直方條的面積需等于相應(yīng)間隔上的樣本頻率,這樣直方條的高度就間隔上的樣本頻率,這樣直方條的高度就不再是頻數(shù)了,并且一切直方條面積之和不再是頻數(shù)了,并且一切直方條面積之和等于等于1. 可見,概率直方圖類似于概率密度可見,概率直方圖類似于概率密度函數(shù)的圖像函數(shù)的圖像. 更
30、多的討論這里就不再詳述了更多的討論這里就不再詳述了. 圖圖6.5 樣本直方圖采用樣本直方圖采用1000個(gè)模擬數(shù)據(jù)個(gè)模擬數(shù)據(jù)二、閱歷分布函數(shù)二、閱歷分布函數(shù) 對(duì)恣意實(shí)數(shù)對(duì)恣意實(shí)數(shù) ,定義,定義 , (6-19) 那么稱其為樣本那么稱其為樣本 的閱歷分布函數(shù)的閱歷分布函數(shù)Empirical Distribution Function. 是對(duì)總體是對(duì)總體X的分布函數(shù)的分布函數(shù) 的一個(gè)閱歷模擬的一個(gè)閱歷模擬并且可以驗(yàn)證它還具有分布函數(shù)的根本性并且可以驗(yàn)證它還具有分布函數(shù)的根本性質(zhì):?jiǎn)握{(diào)不減,右延續(xù),質(zhì):?jiǎn)握{(diào)不減,右延續(xù), , . 該當(dāng)留意,當(dāng)給定樣本值該當(dāng)留意,當(dāng)給定樣本值 之后,之后, ) ,(x)
31、,(21nXXX)(xFn)(xFn0)(nF1)(nF),(21nxxx 是具有分布函數(shù)性質(zhì)的普通階梯形函數(shù)是具有分布函數(shù)性質(zhì)的普通階梯形函數(shù)如圖如圖6.6所示,但是對(duì)樣本而言,它卻所示,但是對(duì)樣本而言,它卻是與確定值是與確定值x有關(guān)的隨機(jī)變量,由于對(duì)每個(gè)有關(guān)的隨機(jī)變量,由于對(duì)每個(gè)給定的給定的x,值實(shí)踐上就是在,值實(shí)踐上就是在 該次抽樣中事件該次抽樣中事件 發(fā)生的頻率見發(fā)生的頻率見xX 6-19式,它完全由樣本決議,而樣本式,它完全由樣本決議,而樣本是隨機(jī)的,所以,是隨機(jī)的,所以, 是隨機(jī)變量是隨機(jī)變量. 的的這種雙重性恰好反映了抽樣前后不同的統(tǒng)這種雙重性恰好反映了抽樣前后不同的統(tǒng)計(jì)觀念,請(qǐng)
32、留意領(lǐng)會(huì)計(jì)觀念,請(qǐng)留意領(lǐng)會(huì). 進(jìn)一步地,根據(jù)分布進(jìn)一步地,根據(jù)分布函數(shù)的定義函數(shù)的定義 , 是事件是事件 發(fā)發(fā)生的概率,又生的概率,又 恰是在恰是在n次次“實(shí)驗(yàn)實(shí)驗(yàn)(抽樣抽樣)中事件中事件 發(fā)生的次數(shù),這樣,還有以發(fā)生的次數(shù),這樣,還有以下結(jié)論:下結(jié)論:1 ;2對(duì)恣意給定的對(duì)恣意給定的x和恣意的和恣意的 ,有,有 )(xFn)(xFn)(xXPxF)(xFxX)(xnFnxX )( ,()(xFnBxFnn0 , (6-20) 即即 , ,見定理,見定理5.1的推論的推論2). 可見,當(dāng)樣本容量可見,當(dāng)樣本容量n足夠大時(shí),事件足夠大時(shí),事件 在一次抽樣中幾乎是必然發(fā)生的,根據(jù)實(shí)在一次抽樣中幾乎是必然發(fā)生的,根據(jù)實(shí)踐推斷原理,從而抽樣后得到的踐推斷原理,從而抽樣后得到的 普通普通就可近似就可近似 . 這也是這也是 的一個(gè)重要運(yùn)用的一個(gè)重要運(yùn)用. 關(guān)于關(guān)于 更深化的討論見更深化的討論見4. 另外,根據(jù)第三章討論的隨機(jī)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國(guó)淀粉連續(xù)蒸煮系統(tǒng)數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)氟蟻腙原藥數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 場(chǎng)地硬化施工方案施工方案
- 2025至2030年中國(guó)免水牛皮膠紙數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)仿石雕藝術(shù)造型音箱數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)MC發(fā)光寫字板數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)CD光盤數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年中國(guó)大電流等離子弧焊槍市場(chǎng)調(diào)查研究報(bào)告
- 2025年中國(guó)三甲硅基-1-己炔市場(chǎng)調(diào)查研究報(bào)告
- 2024-2025學(xué)年高中歷史課時(shí)作業(yè)13宗教改革的歷史背景新人教版選修1
- 2024年4月27日浙江省事業(yè)單位招聘《職業(yè)能力傾向測(cè)驗(yàn)》試題
- 物業(yè)管理服務(wù)應(yīng)急響應(yīng)方案
- 呼吸系統(tǒng)疾病病人的麻醉-2
- 專題18 化學(xué)工藝流程綜合題-分離、提純類-五年(2020-2024)高考化學(xué)真題分類匯編(解析版)
- 汽車美容裝潢技術(shù)電子教案 6.3-汽車娛樂類電子產(chǎn)品裝飾
- 風(fēng)車的原理小班課件
- 物業(yè)保潔員勞動(dòng)競(jìng)賽理論知識(shí)考試題庫(kù)500題(含答案)
- 國(guó)家職業(yè)技術(shù)技能標(biāo)準(zhǔn) 4-07-07-01 洗衣師 勞社廳發(fā)20081號(hào)
- 2024年注冊(cè)計(jì)量師-一級(jí)注冊(cè)計(jì)量師考試近5年真題集錦(頻考類試題)帶答案
- 《籃球:行進(jìn)間單手肩上投籃》教案(四篇)
- 醫(yī)學(xué)教案阿爾茨海默病及其他類型癡呆臨床路徑
評(píng)論
0/150
提交評(píng)論