參數(shù)估計(jì)基礎(chǔ)_第1頁(yè)
參數(shù)估計(jì)基礎(chǔ)_第2頁(yè)
參數(shù)估計(jì)基礎(chǔ)_第3頁(yè)
參數(shù)估計(jì)基礎(chǔ)_第4頁(yè)
參數(shù)估計(jì)基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn)

第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤第二節(jié)t分布第三節(jié)總體均數(shù)的估計(jì)第四節(jié)假設(shè)檢驗(yàn)的一般步驟第五節(jié)均數(shù)的t檢驗(yàn)和z檢驗(yàn)第六節(jié)均數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的關(guān)系第七節(jié)假設(shè)檢驗(yàn)的兩型錯(cuò)誤和檢驗(yàn)功效第五章總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn)第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤第二節(jié)t分布第三節(jié)總體均數(shù)的估計(jì)第四節(jié)假設(shè)檢驗(yàn)的一般步驟第五節(jié)均數(shù)的t檢驗(yàn)和z檢驗(yàn)第六節(jié)均數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的關(guān)系第七節(jié)假設(shè)檢驗(yàn)的兩型錯(cuò)誤和檢驗(yàn)功效第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

常用的統(tǒng)計(jì)推斷方法:參數(shù)估計(jì)和假設(shè)檢驗(yàn)

總體μσ樣本統(tǒng)計(jì)推斷?隨機(jī)抽樣

N(155.4,5.32)156.7158.1155.6155.2…4.985.206.355.64…156.66.35Sii100個(gè)n=30假定某年某地所有13歲女學(xué)生身高服從正態(tài)分布N(155.4,5.32)圖5-1某年某地13歲女生身高N(155.4,5.32)的抽樣示意圖

第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

抽樣誤差

由于個(gè)體間存在差異及抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異。第一節(jié)抽樣分布與抽樣誤差

表5-2從N(155.4,5.32)抽樣得到中的100個(gè)樣本均數(shù)的頻數(shù)分布(ni=30)第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

將此100個(gè)樣本均數(shù)看成新變量值,則這100個(gè)樣本均數(shù)構(gòu)成一新分布,繪制直方圖。圖5-2從正態(tài)分布總體N(155.4,5.32)隨機(jī)抽樣所得樣本均數(shù)分布151152153154155156157158159160根據(jù)正態(tài)分布原理,若隨機(jī)變量X服從正態(tài)分布,則樣本均數(shù)也服從正態(tài)分布1.各樣本均數(shù)未必等于總體均數(shù);2.樣本均數(shù)之間存在差異;3.樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù)(155.4cm),中間多、兩邊少,左右基本對(duì)稱(chēng),也服從正態(tài)分布。4.樣本均數(shù)的變異較之原變量的變異大大縮小樣本均數(shù)的抽樣分布具有以下特點(diǎn):第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

用于表示均數(shù)抽樣誤差大小的指標(biāo),也叫樣本均數(shù)的標(biāo)準(zhǔn)差,通常稱(chēng)為樣本均數(shù)的標(biāo)準(zhǔn)誤。用于衡量抽樣誤差的大小。標(biāo)準(zhǔn)誤(SE)

第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

標(biāo)準(zhǔn)誤的計(jì)算公式因通常σ未知,計(jì)算標(biāo)準(zhǔn)誤采用下式:均數(shù)的標(biāo)準(zhǔn)誤意義:反映抽樣誤差的大小。標(biāo)準(zhǔn)誤越小,抽樣誤差越小,用樣本均數(shù)估計(jì)總體均數(shù)的可靠性越大。與樣本量的關(guān)系:

S一定,n↑,標(biāo)準(zhǔn)誤↓第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

X1S1X2

S2

XiSiXnSnxσN(μσ2)

標(biāo)準(zhǔn)誤示意圖X服從什么分布?例5-1

為了解某地13歲女生的身高,在該地隨機(jī)抽取了30名13歲女生測(cè)量身高,結(jié)果算出均數(shù)=156.70cm,標(biāo)準(zhǔn)差=4.98cm。求其標(biāo)準(zhǔn)誤的大小。

第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

中心極限定理:第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤

均數(shù)隨機(jī)變量XN(μ,σ2)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Z變換標(biāo)準(zhǔn)正態(tài)分布N(0,12)Studentt分布自由度:n-1第二節(jié)

t分布又稱(chēng)Studentt分布。實(shí)際上,t分布十分有用,它是總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)的理論基礎(chǔ)。英國(guó)統(tǒng)計(jì)學(xué)家W.S.Gosset于1908年以“Student”筆名發(fā)表論文,證明它服從自由度

=n

1的t分布,即t分布,

=n

1(5-7)

第二節(jié)

t分布一、t分布的概念從前述實(shí)驗(yàn)4.1的13歲女學(xué)生身高這個(gè)正態(tài)總體中分別作樣本量為3和50的隨機(jī)抽樣,各抽取1000份樣本,并分別得到1000個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤。對(duì)它們分別作(5-6)式的t轉(zhuǎn)變換,并將t值繪制相應(yīng)的直方圖(見(jiàn)實(shí)驗(yàn)5-4)。二、t分布的圖形和t界值表第二節(jié)

t分布第二節(jié)

t分布第二節(jié)

t分布υ=∞(標(biāo)準(zhǔn)正態(tài)分布)υ=5υ=1012345-1-2-3-4-5f(t)0.10.20.3圖5-3不同自由度下的t分布圖第二節(jié)

t分布

t值的分布與自由度

有關(guān)(實(shí)際是樣本含量n不同)。t

分布的圖形不是一條曲線,而是一簇曲線。二、t分布的圖形和t界值表①單峰分布,以0為中心,左右對(duì)稱(chēng),類(lèi)似于標(biāo)準(zhǔn)正態(tài)分布。②自由度

越小,t值越分散,曲線的峰部越矮,尾部越高;③隨著自由度

逐漸增大,t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)趨于時(shí),t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布,故標(biāo)準(zhǔn)正態(tài)分布是t分布的特例。υ=∞(標(biāo)準(zhǔn)正態(tài)分布)υ=5υ=1012345-1-2-3-4-5f(t)0.10.20.3圖5-3不同自由度下的t分布圖第二節(jié)

t分布t分布的特征:二、t分布的圖形和t界值表統(tǒng)計(jì)學(xué)家將t分布曲線下的尾部面積(即概率P)與橫軸t值間的關(guān)系編制了不同自由度下的t界值表(附表2)。單側(cè)概率:用t,υ表示雙側(cè)概率:用t/2,υ表示第二節(jié)

t分布二、t分布的圖形和t界值表-tt0當(dāng)

=10,單側(cè)概率P=0.05時(shí),由表中查得單側(cè)t0.05,10=2.228當(dāng)

=10,雙側(cè)概率P=0.05時(shí),由表中查得雙側(cè)t0.05/2,10=1.812二、t分布的圖形和t界值表單側(cè):P(t

t0.05,10)=0.05

和P(t

t0.05,10)=0.05雙側(cè):P(t

t0.05/2,10)+P(t

t0.05/2,10)=0.051.8122.228-2.228tν=10的t分布圖二、t分布的圖形和t界值表單側(cè):P(t

t,)=

和P(t

t,)=雙側(cè):P(t

t/2,)+P(t

t/2,)=二、t分布的圖形和t界值表從t界值表中或表的右上角圖列亦可看出:①在相同自由度時(shí),│t│值越大,概率P越?。虎诙谙嗤瑃值時(shí),雙側(cè)概率P為單側(cè)概率P的兩倍,即t0.10/2,16=t0.05,16=1.746。-tt0二、t分布的圖形和t界值表t分布又稱(chēng)Studentt分布,實(shí)際上十分有用,它是總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)的理論基礎(chǔ)。第二節(jié)

t分布第三節(jié)總體均數(shù)的估計(jì)參數(shù)估計(jì):指用樣本指標(biāo)(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)(參數(shù))。參數(shù)估計(jì)點(diǎn)估計(jì)區(qū)間估計(jì)缺點(diǎn):沒(méi)有考慮抽樣誤差根據(jù)樣本均數(shù)計(jì)算出有(1)把握的包含總體均數(shù)的一個(gè)數(shù)值范圍稱(chēng)為總體均數(shù)的置信區(qū)間(CI),1

稱(chēng)為置信度。第三節(jié)總體均數(shù)的估計(jì)總體均數(shù)的95%(或99%)置信區(qū)間置信度:

值一般取0.05或0.01,故1

為0.95或0.99。區(qū)間估計(jì):第三節(jié)總體均數(shù)的估計(jì)當(dāng)我們據(jù)一份樣本對(duì)總體均數(shù)只作一次區(qū)間估計(jì)時(shí),我們宣布“總體均數(shù)μ在此可信區(qū)間范圍內(nèi)”,這句話可信的程度為95%區(qū)間估計(jì):總體均數(shù)的95%置信區(qū)間的確切含義為:第三節(jié)總體均數(shù)的估計(jì)

例5-1

為了解某地13歲女生的身高,在該地隨機(jī)抽取了30名13歲女生測(cè)量身高,結(jié)果算出均數(shù)=156.70cm,標(biāo)準(zhǔn)差=4.98cm。求該地13歲女生平均身高的置信區(qū)間。

例5-2

均數(shù)=156.70cm,總體標(biāo)準(zhǔn)差=5.3cm。求該地13歲女生平均身高的置信區(qū)間。

例5-3

在某市成人中隨機(jī)抽取400人測(cè)脈搏,計(jì)算得到均數(shù)=74.5次/分,標(biāo)準(zhǔn)差=6次/分。求該市成人平均脈搏的置信區(qū)間。

第三節(jié)總體均數(shù)的估計(jì)總體均數(shù)的置信區(qū)間的計(jì)算

未知,且n較小-------t分布法

已知,或

未知但n足夠大--Z分布法1.t分布方法(未知,且n較小)第三節(jié)總體均數(shù)的估計(jì)總體均數(shù)的置信區(qū)間的計(jì)算解:本例n=30,

=30–1=29,查t界值表,

=0.05,t0.05/2,29=2.045,95%CL:156.72.045=(154.8,158.6)g/L第三節(jié)總體均數(shù)的估計(jì)

例5-1為了解某地13歲女生的身高,在該地隨機(jī)抽取了30名13歲女生測(cè)量身高,結(jié)果算出均數(shù)=156.70cm,標(biāo)準(zhǔn)差=4.98cm。求該地13歲女生平均身高的置信區(qū)間。

該地13歲女生平均身高的95%置信區(qū)間:

(154.8,158.6)cm,第三節(jié)總體均數(shù)的估計(jì)2.正態(tài)分布近似方法(

已知,或

未知但n足夠大)

z/2

總體均數(shù)的置信區(qū)間的計(jì)算總體均數(shù)的雙側(cè)(1-α)置信區(qū)間為

z/2

Z0.05/2=1.96Z0.05=1.645第三節(jié)總體均數(shù)的估計(jì)2.正態(tài)分布近似方法(

已知,或

未知但n足夠大)總體均數(shù)的置信區(qū)間的計(jì)算Z0.05/2=1.96Z0.05=1.645

例5-3

在某市成人中隨機(jī)抽取400人測(cè)脈搏,計(jì)算得到均數(shù)=74.5次/分,標(biāo)準(zhǔn)差=6次/分。求該市成人平均脈搏的置信區(qū)間。

第三節(jié)總體均數(shù)的估計(jì)1.96=74.51.96(73.9,75.1)例5-4某市2000年隨機(jī)測(cè)量了90名19歲健康男大學(xué)生的身高,其均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm,試估計(jì)該市2000年19歲健康男大學(xué)生平均身高的95%置信區(qū)間。第三節(jié)總體均數(shù)的估計(jì)該市2000年19歲健康男大學(xué)生平均身高的95%置信區(qū)間為(171.3,173.1)cm。1.96=172.21.96(171.3,173.1)Z0.05/2=1.96Z0.05=1.645可信區(qū)間的確切涵義(1)所要估計(jì)的總體參數(shù)有95%的可能在我們所估計(jì)的可信區(qū)間內(nèi)。(2)從正態(tài)總體中隨機(jī)抽取100個(gè)樣本,可算得100個(gè)樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個(gè)均數(shù)的可信區(qū)間,平均約有95個(gè)可信區(qū)間包含了總體均數(shù)。(3)但在實(shí)際工作中,只能根據(jù)一次試驗(yàn)結(jié)果估計(jì)可信區(qū)間,我們就認(rèn)為該區(qū)間包含了總體均數(shù)。1.95%的可信區(qū)間的理解:(1)準(zhǔn)確度:用可信度(1)表示:即區(qū)間包含總體均數(shù)的理論概率大小。當(dāng)然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好。(2)精確度:即區(qū)間的寬度區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好。可信區(qū)間的確切涵義2.可信區(qū)間的兩個(gè)要素可信區(qū)間的確切涵義2.可信區(qū)間的兩個(gè)要素當(dāng)n確定時(shí),上述兩者互相矛盾。在實(shí)際應(yīng)用中,95%可信區(qū)間更為常用。在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度??傮w均數(shù)可信區(qū)間與參考值范圍的區(qū)別區(qū)別點(diǎn)總體均數(shù)可信區(qū)間參考值范圍含義按預(yù)先給定的概率,確定未知參數(shù)

的可能范圍。實(shí)際上,一次抽樣算得的可信區(qū)間要么包含了總體均數(shù),要么不包含。但可以說(shuō):當(dāng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論