數(shù)理統(tǒng)計(jì)總復(fù)習(xí)_第1頁(yè)
數(shù)理統(tǒng)計(jì)總復(fù)習(xí)_第2頁(yè)
數(shù)理統(tǒng)計(jì)總復(fù)習(xí)_第3頁(yè)
數(shù)理統(tǒng)計(jì)總復(fù)習(xí)_第4頁(yè)
數(shù)理統(tǒng)計(jì)總復(fù)習(xí)_第5頁(yè)
已閱讀5頁(yè),還剩136頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章 統(tǒng)計(jì)量及其分布總體與樣本統(tǒng)計(jì)量與抽樣分布次序統(tǒng)計(jì)量及其分布常用的統(tǒng)計(jì)分布第一節(jié) 總體與樣本總體與個(gè)體樣本與樣本分布從樣本去認(rèn)識(shí)總體2. 獨(dú)立性: X1,X2,Xn是相互獨(dú)立的隨機(jī)變量. 最常用的一種抽樣方法叫作“簡(jiǎn)單隨機(jī)抽樣”,它要求抽取的樣本滿足下面兩點(diǎn):1. 代表性: X1,X2,Xn中每一個(gè)與所考察的總體有相同的分布.抽樣方式若總體的分布函數(shù)為F(x),則其簡(jiǎn)單隨機(jī)樣本的聯(lián)合分布函數(shù)為樣本分布解例解例樣本數(shù)據(jù)的整理與顯示 一、頻數(shù)頻率分布表 二、樣本數(shù)據(jù)的圖形顯示 三、經(jīng)驗(yàn)分布函數(shù)第二節(jié) 統(tǒng)計(jì)量與抽樣分布一、統(tǒng)計(jì)量與抽樣分布二、樣本均值及其抽樣分布三、樣本方差與樣本標(biāo)準(zhǔn)差四、樣本

2、矩及其函數(shù)1. 統(tǒng)計(jì)量的定義一、統(tǒng)計(jì)量與抽樣分布是不是實(shí)例12. 幾個(gè)常用統(tǒng)計(jì)量的定義1) 樣本均值其觀察值(1) 樣本矩可用于推斷:E(X).它反映了總體均值的信息定義 設(shè) 為取自某總體的樣本觀察,其算術(shù)平均值稱(chēng)為樣本均值,一般用表示,即 在分組樣本場(chǎng)合,樣本均值的近似公式為 其中k為組數(shù),xi為第i組中值,fi為第i組的頻數(shù)。樣本均值及其抽樣分布定理 若把樣本中的數(shù)據(jù)與樣本均值之差稱(chēng)為偏差,則樣本所用偏差之和為0,即定理 數(shù)據(jù)觀察值與均值的偏差平方和最小,即在形如 的函數(shù)中, 最小,其中c為任意給定常數(shù)。證明 定理:設(shè)總體X的均值為,方差為 ,(X1,X2,Xn)是X的一個(gè)樣本,則有 設(shè)X

3、1,X2,Xn為來(lái)自某個(gè)總體的樣本, 為樣本均值。 則n較大時(shí) 的漸近分布為 ,常記為 這里漸近分布是指n較大時(shí)的近似分布。(1)若總體分布為 則 的分布為 ; (2)若總體分布未知或不是正態(tài)分布,但 2) 樣本方差其觀察值它反映了總體方差的信息可用于推斷:D(X).3) 樣本標(biāo)準(zhǔn)差其觀察值4) 修正樣本方差 X 1,X2,Xn為從該總體得到的樣本, 和分別是樣本均值和樣本方差,則 .定理 設(shè)總體X具有二階矩,即5) 樣本 k 階(原點(diǎn))矩其觀察值6)樣本 k 階中心矩其觀察值特例:特例: 樣本偏度 樣本峰度峰度與偏度第三節(jié) 次序統(tǒng)計(jì)量及其分布次序統(tǒng)計(jì)量的概念次序統(tǒng)計(jì)量的抽樣分布分位數(shù)箱線圖次

4、序統(tǒng)計(jì)量特別地,例如,有 5 個(gè)樣本: X1, X2 , X3 , X4 , X5觀察值: 1, 3, 0, 3, 2 排序成: 0, 1, 2, 3, 3順序統(tǒng)計(jì)量: X(1) ,X(2) ,X(3) ,X(4) ,X(5)定理極差特征R反映了樣本觀察值取值范圍的大小R刻畫(huà)數(shù)據(jù)的離散程度不穩(wěn)健,易受極端值的影響當(dāng)總體為正態(tài)總體時(shí),在小樣本情況下,R可用于估計(jì)總體標(biāo)準(zhǔn)差。 樣本分位數(shù)與樣本中位數(shù)樣本中位數(shù)是樣本按大小次序排列后處在中間位置上的次序統(tǒng)計(jì)量。設(shè)X(1),X (n)是有序樣本,則樣本中位數(shù)m0.5定義為譬如,若n=5,則m0.5 =X(3) ,n=6,則m0.5 =(X(3) + X

5、(4) )。中位數(shù)的特點(diǎn)1. 不受極端值的影響2. 各變量值與中位數(shù)的離差絕對(duì)值之和最小,即箱線圖(box plot)箱線圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me 和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分(位)數(shù)畫(huà)出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接 第四節(jié) 三大抽樣分布卡方分布T分布F分布標(biāo)準(zhǔn)正態(tài)分布的上 分位數(shù) z設(shè) X N (0,1) , 0 1, 稱(chēng)滿足的點(diǎn) z 為X 的上 分位數(shù) z常用的幾個(gè)數(shù)據(jù)1.(175)性質(zhì)1性質(zhì)2定理t 分布又稱(chēng)學(xué)生氏(Student)分布.2.(3

6、11)定理 定理 4 (兩總體均值差的分布) 分別是這兩個(gè)樣本的且X與Y獨(dú)立,X1,X2,是取自X的樣本,取自Y的樣本,分別是這兩個(gè)樣本的樣本方差,均值,則有Y1,Y2,是樣本3.(321) 定理 5 (兩總體方差比的分布) 分別是這兩個(gè)樣本的且X與Y獨(dú)立,X1, X2,是取自X的樣本,取自Y的樣本,分別是這兩個(gè)樣本的樣本方差,均值,則有Y1,Y2,是樣本若Tt(n), 問(wèn)T2服從什么分布?解因?yàn)門(mén)t(n), 可以認(rèn)為其中UN(0,1), V2(n), U22(1), F(1, n). 一個(gè)正態(tài)總體的抽樣分布設(shè)X1,X2,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有兩個(gè)正態(tài)總體的抽

7、樣分布試確定Z的分布. 試確定Z的分布. 例 若Tt(n), 問(wèn)T2服從什么分布?解因?yàn)門(mén)t(n), 可以認(rèn)為其中UN(0,1), V2(n), U22(1), F(1, n). 第二章 參數(shù)估計(jì)點(diǎn)估計(jì)點(diǎn)估計(jì)優(yōu)劣的評(píng)價(jià)標(biāo)準(zhǔn)區(qū)間估計(jì)單側(cè)置信限比例的區(qū)間估計(jì)第一節(jié) 點(diǎn)估計(jì)矩估計(jì)極大似然估計(jì)1. 矩估計(jì)法 其基本思想是用樣本矩估計(jì)總體矩 . 理論依據(jù): 或格列汶科定理 它是基于一種簡(jiǎn)單的“替換”思想建立起來(lái)的一種估計(jì)方法 .是英國(guó)統(tǒng)計(jì)學(xué)家K.皮爾遜最早提出的 .大數(shù)定律 矩估計(jì)法是英國(guó)統(tǒng)計(jì)學(xué)家K.皮爾遜最早提出來(lái)的 .由辛欽定理 ,若總體 的數(shù)學(xué)期望 有限,則有解 總體X的期望為 從而得到方程 所以

8、的矩估計(jì)量為 例 : 設(shè)某炸藥廠一天中發(fā)生著火現(xiàn)象的次數(shù)X服從 解 解得到矩估計(jì)量分別為例3一般的,若總體的k階中心距 存在時(shí),其矩法估計(jì)為樣本的k階中心矩矩估計(jì)法的具體做法如下 設(shè)總體的分布函數(shù)中含有k個(gè)未知參數(shù) , 它的前k階矩 ,i=1,2, ,k從這 k 個(gè)方程中解出j=1,2,kj=1,2,k(3)用諸 的估計(jì)量 Ai 分別代替上式中的諸 , 即可得諸 的矩估計(jì)量 :(4)矩估計(jì)量的觀察值稱(chēng)為矩估計(jì)值 .(1) 求出(2)解 由于 所以由矩法估計(jì),得 解得 所以,參數(shù) 的矩估計(jì)量為 例5 對(duì)容量為n的子樣,求下列密度函數(shù)中參數(shù) 的矩估計(jì)量。解 設(shè) 是總體 的一個(gè)樣本, 設(shè)總體服從區(qū)間

9、上的均勻分布,求參數(shù)的矩估計(jì)量.例6(1)(2)(3)幾個(gè)常見(jiàn)分布的矩估計(jì)泊松分布 () 二項(xiàng)分布 B (N,p),N 已知參數(shù)為 的指數(shù)總體 正態(tài)總體 N (,2 )均勻分布 U (a,b) 極大似然估計(jì)法 思想方法:一次試驗(yàn)就出現(xiàn)的事件有較大的概率 例如: 有兩外形相同的箱子,各裝100個(gè)球 一箱 99個(gè)白球 1 個(gè)紅球 一箱 1 個(gè)白球 99個(gè)紅球現(xiàn)從兩箱中任取一箱, 并從箱中任取一球,結(jié)果所取得的球是白球.答: 第一箱.問(wèn): 所取的球來(lái)自哪一箱?既然在一次試驗(yàn)中得到的樣本值 , 那么樣本取該樣本值的概率應(yīng)較大,所以選取使 這似然函數(shù) 達(dá)到最大的參數(shù)值作為估計(jì)值 , 稱(chēng)為最大似然估計(jì)法.

10、 是樣本的一個(gè)觀測(cè)值, 設(shè)總體的分布律為 的概率為則樣本極大似然估計(jì)法的具體作法求極大似然估計(jì)的一般步驟歸納如下: 解例這一估計(jì)量與矩估計(jì)量是相同的。解 總體X服從參數(shù)為的指數(shù)分布,則有 所以似然函數(shù)為 取對(duì)數(shù) 令 解得的極大似然估計(jì)值為 極大似然估計(jì)量為 例 設(shè)總體 X N (, 2), X1, X2, Xn 是 X的樣本值, 求 , 2 的極大似然估計(jì)。7-26 , 2 的極大似然估計(jì)量分別為似然方程組為7-27極大似然估計(jì)的不變性設(shè) 是 的極大似然估計(jì)值, u( )( )是 的連續(xù)函數(shù), 則 是 u( ) 的極大似然估計(jì)值。 7-35如 在正態(tài)總體N (, 2)中, 2的極大似然估計(jì)值為

11、是 2的連續(xù)函數(shù)故 的極大似然估計(jì)值為lg 的極大似然估計(jì)值為幾個(gè)常見(jiàn)分布的最大似然估計(jì)泊松分布 () 二項(xiàng)分布 B (N,p),N 已知參數(shù)為 的指數(shù)總體 正態(tài)總體 N (,2 )均勻分布 U (a,b)X(1) 、X(n)第二節(jié) 點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn) 對(duì)于同一個(gè)未知參數(shù), 不同的方法得到的估計(jì)量可能不同,于是提出問(wèn)題應(yīng)該選用哪一種估計(jì)量?用什么標(biāo)準(zhǔn)來(lái)評(píng)價(jià)一個(gè)估計(jì)量的好壞?常用標(biāo)準(zhǔn)(3) 一致性(2) 有效性(1) 無(wú)偏性無(wú)偏性則稱(chēng) 為 的無(wú)偏估計(jì) .設(shè)是未知參數(shù) 的估計(jì)量,若證明: 不論 X 服從什么分布,是的無(wú)偏估計(jì)量。證是總體X 的樣本,例1 設(shè)總體X 的 k 階矩存在因而由于2有效性D(

12、 ) D( )則稱(chēng) 較 有效 .都是參數(shù) 的無(wú)偏估計(jì)量,若有設(shè)和 例4:設(shè)(X1,X2, X3)是來(lái)自總體X的一個(gè)樣本,證明下面的三個(gè)估計(jì)量都是總體均值E(X)的無(wú)偏估計(jì)量證明估計(jì)量。若對(duì)于任意的 ,當(dāng)n 時(shí), 定義 設(shè) 是總體參數(shù) 的則稱(chēng)是總體參數(shù) 的相合估計(jì)量。依概率收斂于 , 即 一致性),(21nXXXLqq=0)(lim=-eqqPn均方誤差 設(shè) 是 的估計(jì)量.稱(chēng) 為 的均方誤差.注意到:定義第三節(jié) 區(qū)間估計(jì)區(qū)間估計(jì)的概念一個(gè)總體的區(qū)間估計(jì)兩個(gè)總體的區(qū)間估計(jì) 一、 置信區(qū)間定義:滿足設(shè) 是 一個(gè)待估參數(shù),給定若由樣本X1,X2,Xn確定的兩個(gè)統(tǒng)計(jì)量則稱(chēng)隨機(jī)區(qū)間 是 的置信水平(置信度

13、)為 的置信區(qū)間.分別稱(chēng)為置信下限和置信上限. 由圖1可以看出,這100個(gè)區(qū)間中有91個(gè)包含參數(shù)真值15,另外9個(gè)不包含參數(shù)真值。 圖1 的置信水平為0.90的置信區(qū)間 置信區(qū)間的意義可以解釋如下:如果進(jìn)行N次隨機(jī)抽樣,每次得到的樣本值記為 , k=1,2,.,N ;則我們隨機(jī)地得到N個(gè)區(qū)間( , ),k=1,2,.,N.這N個(gè)區(qū)間中,有的包含參數(shù)的真值,有的不包含.但是,這些區(qū)間中,包含參數(shù)的真值的區(qū)間大約占100( )%.1.設(shè)法構(gòu)造一個(gè)樣本和 的函數(shù) 使得G的分布不依賴于未知參數(shù)。一般稱(chēng)具有這種性質(zhì)的G為樞軸量。2.適當(dāng)?shù)剡x擇兩個(gè)常數(shù) 、 ,使對(duì)給定的 ,有 p樞軸量法3.假如能將 進(jìn)行

14、不等式等價(jià)變形化為 ,則有 這表明 , 是 的 同等置信區(qū)間。一、正態(tài)總體方差已知時(shí)均值的區(qū)間估計(jì)由總體服從正態(tài)分布可得 二、正態(tài)總體方差未知時(shí)均值的區(qū)間估計(jì)均值未知時(shí)方差的區(qū)間估計(jì)一個(gè)總體的區(qū)間估計(jì)兩個(gè)正態(tài)總體均值差的區(qū)間估計(jì) 1.樞軸量 1.樞軸量 置信區(qū)間為 兩個(gè)正態(tài)總體方差之比的區(qū)間估計(jì)(均值未知) 兩個(gè)正態(tài)總體的區(qū)間估計(jì)均值的估計(jì)方差和標(biāo)準(zhǔn)差的估計(jì)(均值未知)第三章 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本概念正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)比率p的檢驗(yàn)p值正態(tài)概率紙 1.假設(shè)(原假設(shè)和備擇假設(shè))假設(shè)是指有一定的理由提出,但有沒(méi)有充足證據(jù)的有關(guān)總體分布參數(shù)的一種看法,在分析之前就必須陳述。原假設(shè):待檢驗(yàn)的假設(shè),

15、又稱(chēng)“0假設(shè)”,記為備擇假設(shè):與原假設(shè)對(duì)立的假設(shè),記為其中原假設(shè):沒(méi)有充分理由不能拒絕備擇假設(shè):沒(méi)有充分理由不能輕易接受一般來(lái)說(shuō),零假設(shè)總是“受到保護(hù)的假設(shè)”,沒(méi)有充分的證據(jù)是不能拒絕零假設(shè)的。 例如,對(duì)一家信譽(yù)很好的工廠的產(chǎn)品進(jìn)行檢驗(yàn),零假設(shè)就應(yīng)該是“產(chǎn)品合格”;在醫(yī)學(xué)界,如果希望推出一種新藥替代原來(lái)長(zhǎng)期使用的藥品,零假設(shè)就是“新藥不比舊藥好”,.單側(cè)假設(shè)的習(xí)慣規(guī)定 1. 檢驗(yàn)質(zhì)量是否合格, H0取合格情形. 2. 在技術(shù)革新后, 檢驗(yàn)參數(shù)是否變大(或變小), H0 取不變大(或不變小)情形, 即保守情形.例 一項(xiàng)研究表明,改進(jìn)生產(chǎn)工藝后,會(huì)使產(chǎn)品的廢品率降低到2%以下。檢驗(yàn)這一結(jié)論是否成立

16、建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: 2% H1: 2%雙側(cè)檢驗(yàn)(原假設(shè)與備擇假設(shè)的確定)例如,某種零件的尺寸,要求其平均長(zhǎng)度為10cm,大于或小于10cm均屬于不合格建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: = 10 H1: 10雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn) (假設(shè)的形式)假設(shè)研究的問(wèn)題雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)H0m = m0m m0m m0H1m m0m m02.確定檢驗(yàn)統(tǒng)計(jì)量,給出拒絕域形式檢驗(yàn):利用樣本信息,依據(jù)一定的準(zhǔn)則,對(duì)原假設(shè)做出是否成立的判斷。檢驗(yàn)統(tǒng)計(jì)量:用于做決策的統(tǒng)計(jì)量一個(gè)檢驗(yàn)實(shí)際上就是對(duì)樣本空間的一次劃分:三、假設(shè)檢驗(yàn)的一般步驟2. 確定檢驗(yàn)統(tǒng)計(jì)量以及拒絕域形式;假設(shè)檢驗(yàn)基本思想(補(bǔ)充)反

17、證法小概率原理概率事件發(fā)生,則否認(rèn)假設(shè)H0 ;否則,不拒絕假設(shè)H0 .小概率推斷原理:小概率事件2. 基本思想方法采用概率性質(zhì)的反證法: 1. 基本原理(概率接近0的事件),在一次試驗(yàn)中,實(shí)際上可認(rèn)為不會(huì)發(fā)生(這是人們長(zhǎng)期積累起的普遍經(jīng)驗(yàn)!).據(jù)一次抽樣所得到的樣本值進(jìn)行計(jì)算. 若導(dǎo)致小先假設(shè)H0 成立, 再根第二節(jié) 正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)均值的檢驗(yàn)方差的檢驗(yàn)一、正態(tài)總體的檢驗(yàn)(2 已知)1. H0 : 0 ; H1 : 0 4.求出臨界值和拒絕域P(拒絕H0|H0為真)所以本檢驗(yàn)的拒絕域?yàn)閃 :U 檢驗(yàn)法H0 : 0 ; H1 : 00a/2za/2a/2-za/2 0 0 0 0 0U 檢

18、驗(yàn)法 (2 已知)原假設(shè) H0備擇假設(shè) H1檢驗(yàn)統(tǒng)計(jì)量及其H0為真時(shí)的分布拒絕域2azUazU-azU 0 0 0 0 0T 檢驗(yàn)法 (2 未知)原假設(shè) H0備擇假設(shè) H1檢驗(yàn)統(tǒng)計(jì)量及其H0為真時(shí)的分布拒絕域)1(0-=ntnSXTm2atTatT-atT 表: 一個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)(顯著性水平為) 表: 一個(gè)正態(tài)總體方差的假設(shè)檢驗(yàn)(顯著性水平為)表: 兩個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)(顯著性水平為) 表: 兩個(gè)正態(tài)總體方差的假設(shè)檢驗(yàn)(顯著性水平為) 解 建立假設(shè) 拒絕域應(yīng)取作 由樣本求得 故應(yīng)拒絕H0,不能接受這批玻璃紙. 定義 在一個(gè)假設(shè)檢驗(yàn)問(wèn)題中,利用觀測(cè)值能夠做出拒絕原假設(shè)的最小顯著性水平稱(chēng)為檢驗(yàn)的p 值。 如果 p,則在顯著性水平 下拒絕 H0; 如果 9.78,故我們可認(rèn)為各水平間有顯著差異。 第 5章 相關(guān)與回歸分析PowerPoint統(tǒng)計(jì)學(xué)相關(guān)系數(shù) (計(jì)算公式) 樣本相關(guān)系數(shù)的計(jì)算公式或化簡(jiǎn)為相關(guān)系數(shù)(取值及其意義) r 的取值范圍是 -1,1 -1r0,為負(fù)相關(guān) 0r1,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論