版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1
第七章樣本分布
數(shù)理統(tǒng)計(jì)是研究如何有效地收集、整理和分析帶有隨機(jī)影響的數(shù)據(jù),從而對(duì)所觀察的現(xiàn)象做出推斷或預(yù)測(cè),為決策提供依據(jù)的一門(mén)學(xué)科。在近一個(gè)多世紀(jì)的發(fā)展中,數(shù)理統(tǒng)計(jì)不同程度地滲透到人類(lèi)活動(dòng)的許多領(lǐng)域。人口調(diào)查、稅收預(yù)算、測(cè)量誤差、出生與死亡統(tǒng)計(jì)、保險(xiǎn)業(yè)中賠款額和保險(xiǎn)金的確定等,這些數(shù)理統(tǒng)計(jì)早期主要研究的問(wèn)題,直到現(xiàn)在仍然值得認(rèn)真研究。在近半個(gè)世紀(jì)以來(lái),數(shù)理統(tǒng)計(jì)在理論、方法、應(yīng)用上都有較大的發(fā)展。抽樣調(diào)查、試驗(yàn)設(shè)計(jì)、回歸分析與回歸診斷、多元分析、時(shí)間序列分析、非參數(shù)統(tǒng)計(jì)、統(tǒng)計(jì)決策函數(shù)、統(tǒng)計(jì)計(jì)算、隨機(jī)模擬、探索性數(shù)據(jù)分析等統(tǒng)計(jì)方法相繼產(chǎn)生并在實(shí)踐中普遍使用,把以描述為主的統(tǒng)計(jì)發(fā)展到以推斷為主的統(tǒng)計(jì)。數(shù)理統(tǒng)計(jì)的內(nèi)容已異常豐富,應(yīng)用廣泛,成為當(dāng)前最活躍的學(xué)科之一。2§7.1總體與樣本一、
總體與個(gè)體總體指研究對(duì)象的某項(xiàng)數(shù)量指標(biāo)值的全體。組成總體的每個(gè)元素稱(chēng)為個(gè)體。由于每個(gè)個(gè)體的出現(xiàn)帶有隨機(jī)性,即相應(yīng)的數(shù)量指標(biāo)值的出現(xiàn)帶有隨機(jī)性。從而可把此種數(shù)量指標(biāo)看作隨機(jī)變量,我們用一個(gè)隨機(jī)變量及其分布來(lái)描述總體。為此常用隨機(jī)變量的符號(hào)或分布的符號(hào)X,Y,Z…,F(x)…來(lái)表示總體。例7.1研究某燈泡的使用壽命時(shí),總體可用隨機(jī)變量X來(lái)表示,或用其分布函數(shù)F(x)表示。3二、樣本為了推斷總體分布及其各種特征,就必須從總體中按一定法則抽取若干個(gè)體進(jìn)行觀測(cè)或試驗(yàn),以獲得有關(guān)總體的信息.這一抽取過(guò)程稱(chēng)為抽樣.所抽取的部分個(gè)體稱(chēng)為樣本,樣本中個(gè)體的數(shù)目稱(chēng)為樣本容量.例如容量為n的樣本可以看作是n維隨機(jī)變量(
),其觀察值為(
).例7.2研究某地區(qū)學(xué)齡前兒童發(fā)育情況,人們關(guān)心的是其體重X和身高Y這兩個(gè)數(shù)量指標(biāo),則此總體就可用二維隨機(jī)變量(X,Y)或其聯(lián)合分布函數(shù)F(x,y)表示.4簡(jiǎn)單隨機(jī)抽樣它要求滿(mǎn)足兩點(diǎn):(1)代表性.樣本中每個(gè)個(gè)體與所考慮的總體有相同的分布.即樣本中每個(gè)個(gè)體與總體X具有相同的分布.(2)獨(dú)立性.樣本中每個(gè)個(gè)體取什么值并不影響其它個(gè)體取什么值.即必須是相互獨(dú)立的隨機(jī)變量.由簡(jiǎn)單隨機(jī)抽樣所得到的樣本稱(chēng)為簡(jiǎn)單隨機(jī)樣本.假如總體的分布函數(shù)為F(x),則其簡(jiǎn)單隨機(jī)樣本的聯(lián)合分布函數(shù)為5三、分布族在概率論研究中,隨機(jī)變量的分布總是假設(shè)給定的,但在數(shù)理統(tǒng)計(jì)的研究中,總體的分布是未知的,但總可以假定總體的分布是某一個(gè)分布族的成員.例7.3在研究某批燈泡的質(zhì)量時(shí),若關(guān)心的是其質(zhì)量是否合格,若合格記為0,不合格記為1,因此該總體就可用僅取0和1的隨機(jī)變量X來(lái)表示.顯然,這個(gè)總體的分布就是一個(gè)參數(shù)為p的二點(diǎn)分布b(1,p),由于p未知,故這個(gè)總體分布也是未知的,但可以假定該總體分布是二點(diǎn)分布族
F={b(1,p);0<p<1}6若人們關(guān)心的是燈泡的壽命。這是一個(gè)無(wú)限總體。假如人們根據(jù)過(guò)去的資料知道燈泡的壽命X服從指數(shù)分布,其密度函數(shù)為
所需確定的參數(shù)是λ>0.7四、從樣本去認(rèn)識(shí)總體
⑴
頻數(shù)頻率分布表及其圖示例7.4我們通常飲用的礦泉水有19個(gè)指標(biāo).某市技術(shù)監(jiān)督局一次抽查了58批礦泉水,記錄每一批礦泉水的每個(gè)指標(biāo)是否合格,從中可統(tǒng)計(jì)出每批礦泉水不合格指標(biāo)的個(gè)數(shù)X.這里X是一個(gè)離散型隨機(jī)變量,其一切可能取值為0,1,…19。58批礦泉水的指標(biāo)不合格數(shù)構(gòu)成了一個(gè)容量為58的樣本的觀察值,每個(gè)可取0,1,…,19中某個(gè)值,將它們整理后列成表1.1.18表158批礦泉水不合格指標(biāo)數(shù)的頻率、頻數(shù)分布表910(2)
經(jīng)驗(yàn)分布函數(shù)樣本直方圖可以形象地去描述總體概率密度函數(shù)大致形狀,經(jīng)驗(yàn)分布函數(shù)將可以用來(lái)描述總體分布函數(shù)的大致形狀.定義1.1.1設(shè)總體X的分布函數(shù)為F(x),從中獲得的樣本觀察值為,將它們從小到大排列成,令
稱(chēng)為該樣本的經(jīng)驗(yàn)分布函數(shù).11例7.5寫(xiě)出經(jīng)驗(yàn)分布函數(shù)某食品廠用自動(dòng)裝罐機(jī)生產(chǎn)凈重量為345克的午餐肉罐頭,由于隨機(jī)性,每個(gè)罐頭的凈重有差別,現(xiàn)從中隨機(jī)取10個(gè)罐頭,其凈重如下:344,336,345,342,340,338,344,343,344,343,求經(jīng)驗(yàn)分布函數(shù).12
統(tǒng)計(jì)量及其分布
1.定義1.2.1設(shè)是取自某總體的一個(gè)容量為n的樣本,假如樣本函數(shù)
中不含任何未知參數(shù),則稱(chēng)T為統(tǒng)計(jì)量.統(tǒng)計(jì)量的分布稱(chēng)為抽樣分布.2.常用的幾個(gè)統(tǒng)計(jì)量設(shè)是來(lái)自總體X的樣本⑴樣本均值
樣本均值是反映總體數(shù)學(xué)期望所在位置信息的一個(gè)統(tǒng)計(jì)量,是總體數(shù)學(xué)期望的一個(gè)很好的估計(jì).13⑵樣本方差
樣本標(biāo)準(zhǔn)差
樣本方差與樣本標(biāo)準(zhǔn)差反映了數(shù)據(jù)取值分散與集中的程度,即反映了總體方差與標(biāo)準(zhǔn)差的信息.⑶樣本k階(原點(diǎn))矩樣本k階中心矩
它們分別反映了總體k階(原點(diǎn))矩與k階中心矩的信息.14⑷樣本偏度
SK反映了總體分布密度曲線(xiàn)的對(duì)稱(chēng)性信息.當(dāng)SK>0時(shí),分布的形狀是右尾長(zhǎng),稱(chēng)為正偏的;當(dāng)SK<0時(shí),分布的形狀是左尾長(zhǎng),稱(chēng)為負(fù)偏的.⑸樣本峰度KU反映了總體分布密度曲線(xiàn)在其峰值附近的陡峭程度的信息,當(dāng)KU>0時(shí),分布密度曲線(xiàn)在其峰比正態(tài)分布來(lái)得陡;當(dāng)KU<0時(shí),比正態(tài)分布來(lái)得平坦.15⑹次序統(tǒng)計(jì)量
被稱(chēng)為樣本的第i個(gè)次序統(tǒng)計(jì)量,它是樣本
的滿(mǎn)足如下條件的函數(shù):每當(dāng)樣本得到一組觀察值()時(shí),將它們從小到大排列為
,第i個(gè)值便是
的觀察值,稱(chēng)為該樣本的次序統(tǒng)計(jì)量.又稱(chēng)為該樣本的最小次序統(tǒng)計(jì)量,稱(chēng)為該樣本的最大次序統(tǒng)計(jì)量.16⑺樣本極差
若樣本容量為n,則樣本極差它反映了樣本取值范圍的大小,也反映了總體取值分散與集中的程度.極差常在小樣本(n≤30)場(chǎng)合使用,而在大樣本場(chǎng)合很少在實(shí)際中使用.這是因?yàn)闃O差僅使用了樣本中兩個(gè)極端點(diǎn)的信息,而把中間的信息都丟棄了,當(dāng)樣本容量越大時(shí),丟棄的信息也就越多,從而留下的信息過(guò)少,其使用價(jià)值就不大了.17(8)樣本p分位數(shù)和中位數(shù)
定義
設(shè)是來(lái)自總體
F(x)
樣本,為該樣本的次序統(tǒng)計(jì)量.為該樣本的p分位數(shù)(或p分位點(diǎn)).
稱(chēng)為樣本中位數(shù),
顯然有對(duì)于,稱(chēng)18第一四分位數(shù)第三四分位數(shù)19例2設(shè)是F(x)
的樣本,此種統(tǒng)計(jì)量有個(gè),加起來(lái)平均得:令有從中任選兩個(gè)分量和
分別為總體均值與方差,2021幾種常用的分布族⑴分布Ⅰ定義:1.2.2設(shè)為相互獨(dú)立的隨機(jī)變量,且均服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),則稱(chēng)隨機(jī)變量
服從自由度為n的分布,記作自由度可理解為平方和中獨(dú)立變量的個(gè)數(shù).Ⅱ分布性質(zhì)
(1)設(shè)
,則E(X)=n,D(X)=2n.(2)
可加性:設(shè)
,
,且X與Y獨(dú)立,則22下圖描繪了分布密度函數(shù)在n=5,10,20時(shí)的圖形.23(2)t分布①定義1.2.3:設(shè)X~N(0,1),,且X與Y獨(dú)立,則稱(chēng)隨機(jī)變量
所服從的分布為t分布,記為T(mén)~t(n),稱(chēng)n為自由度.24(3)F分布①定義1.2.4:設(shè)
,
,
且X與Y獨(dú)立,則稱(chēng)隨機(jī)變量
服從自由度為(n,m)的F分布,記作.圖1.2.4描繪了的密度函數(shù)曲線(xiàn)25(4)Γ分布族定義1.2.5:定義在正實(shí)數(shù)上,且用密度函數(shù)表示的概率分布稱(chēng)為Γ分布,記為Γ(α,λ).其中α>0是形狀參數(shù),λ>0是尺度參數(shù).而{Γ(α,λ);α>0,λ>0}就是Γ分布族當(dāng)α=1時(shí)的Γ分布為指數(shù)分布其密度曲線(xiàn)如下:2627Γ分布族性質(zhì)28(5)β分布族定義1.2.6:定義在[0,1]上,且密度函數(shù)表示的概率分布稱(chēng)為β分布記為β(a,b),其中a>0,b>0.而{β(a,b):a>0,b>0}為β分布族. β分布有幾個(gè)重要的特例.當(dāng)a=1,b=1時(shí),β分布就是U(0,1)29隨機(jī)變量的分布的分位點(diǎn)1、設(shè)隨機(jī)變量X~F(x),給定常數(shù):0<<1,若存在,滿(mǎn)足,則稱(chēng)為分布F(x)的上(側(cè))分位點(diǎn).2、設(shè)隨機(jī)變量X~N(0,1),給定常數(shù):0<<1,若存在,滿(mǎn)足,則稱(chēng)為標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位點(diǎn).30標(biāo)準(zhǔn)正態(tài)分布的分位點(diǎn)0.0010.0050.010.0250.050.10
3.0902.5762.3271.961.6451.28231設(shè)X
~2(n),若對(duì)于:0<<1,滿(mǎn)足則稱(chēng)為分布的上分位點(diǎn)。分布分位點(diǎn)32t分布分位點(diǎn)設(shè)T~t(n),若對(duì):0<<1,存在t(n),滿(mǎn)足P{T>t(n)}=,則稱(chēng)t(n)為t(n)的上側(cè)分位點(diǎn).33F—分布的分位點(diǎn)設(shè)F~F(n1,n2)對(duì)于:0<<1,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年可燃易燃易爆危險(xiǎn)品管理制度(二篇)
- 2024年國(guó)企勞動(dòng)合同簡(jiǎn)單版(二篇)
- 2024年幼兒園小班周工作計(jì)劃例文(五篇)
- 2024年實(shí)習(xí)生個(gè)人工作總結(jié)參考樣本(五篇)
- 2024年學(xué)校用電安全管理制度范本(四篇)
- 2024年工程采購(gòu)合同樣本(二篇)
- 2024年小飯店規(guī)章制度(四篇)
- 【《上海H文化傳播有限公司企業(yè)文化建設(shè)探究》6700字(論文)】
- 2024年客服部年度工作計(jì)劃范本(三篇)
- 2024年培訓(xùn)學(xué)校規(guī)章制度模版(二篇)
- 中國(guó)(教育部)留學(xué)服務(wù)中心社會(huì)招聘筆試試題及答案2022
- 幼兒園優(yōu)質(zhì)公開(kāi)課:中班健康《逃生大闖關(guān)》課件
- 白酒基礎(chǔ)知識(shí)培訓(xùn)課件
- 《牢固樹(shù)立國(guó)家安全觀-國(guó)家安全教育學(xué)習(xí)》教案 第11課 科技安全
- 防校園欺凌-課件(共28張PPT)
- 酥性餅干成型機(jī)棍印餅干成型機(jī)安全操作及保養(yǎng)規(guī)程
- 相對(duì)濕度與露點(diǎn)對(duì)照表
- 2023年自考馬克思真題及答案
- 普通高中地理課程標(biāo)準(zhǔn)2004年
- 年產(chǎn)15萬(wàn)噸活性白土和5萬(wàn)噸球團(tuán)膨潤(rùn)土項(xiàng)目可行性研究報(bào)告
- 2023年06月上海市浦東新區(qū)臨港新片區(qū)文員招考聘用上岸筆試歷年難、易錯(cuò)點(diǎn)考題附帶參考答案與詳解
評(píng)論
0/150
提交評(píng)論