從樣本統(tǒng)計量估計整體參數(shù)

上傳人：t*** IP屬地：天津上傳時間：2022-05-03 格式：DOCX 頁數(shù)：7 大?。?3.94KB 積分：18 舉報 版權(quán)申訴

免費預(yù)覽已結(jié)束，剩余2頁可下載查看

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第六章從樣本統(tǒng)計量估計整體參數(shù)學(xué)習(xí)要點第一節(jié)點估計第二節(jié)區(qū)間估計第三節(jié)總體均數(shù)的估計第四節(jié)其他總體參數(shù)的估計本章小結(jié)學(xué)習(xí)要點掌握推斷統(tǒng)計的內(nèi)容和前提條件理解統(tǒng)計估計的原理，掌握統(tǒng)計估計的方法能夠運用總體均數(shù)估計的方法解決實際問題第一節(jié)點估計當(dāng)總休平均數(shù)或比例未知時，我們可以直接把樣本平均數(shù)或比例用作它的估計值。由于樣本統(tǒng)計量為數(shù)軸上的一個點，所以稱為“點估計值” ?？茖W(xué)研究不僅需要對事物特征作出一般性的描述，而且更要根據(jù)樣本提供的信息去推測相應(yīng)總體的情況，統(tǒng)計內(nèi)容中的推斷統(tǒng)計則是專門研究如何用樣本去推斷總體的方法。一、什么是推斷統(tǒng)計一般情況下，樣本統(tǒng)計量是不會和相應(yīng)的總體參數(shù)完全相同的，兩者多

2、少都會有一定的差距，但是如果用無限多個樣本的統(tǒng)計量來估計總體參數(shù)，平均估計誤差將會等于0。具有這一特征的統(tǒng)計量就無偏估計值。例如，用樣本平均數(shù)估計總體平均數(shù)時，總會有些誤差，在有些樣本中，它可能會大于總體平均數(shù)，而在另一些樣本中它又可能會小于總體平均數(shù)，而且對于不同的樣本估計誤差的大小也是不同的，但是無限多個樣本平均數(shù)的平均估計誤差為0。換句話說，樣本平均數(shù)的平均數(shù)將會等于總體平均數(shù)。推斷統(tǒng)計就是指由樣本資料去推測相應(yīng)總體情況的理論與方法。也就是由部分推全體，由已知推未知的過程。推斷統(tǒng)計根據(jù)推測的性質(zhì)不同而分為參數(shù)估計和假設(shè)檢驗兩方面。參數(shù)估計（parameterestimation）就是

3、用樣本去估計相應(yīng)總體的狀況，其具體方法有點估計和區(qū)間估計。假設(shè)檢驗（hypothesis test）的主要用途是對出現(xiàn)差異的兩個或多個現(xiàn)象或事物進(jìn)行真實性情況的檢驗，又稱統(tǒng)計檢驗（statistical test）。在檢驗中又根據(jù)是否需要依賴于對總體分布形態(tài)和總體參數(shù)檢驗的假設(shè)而分為參數(shù)檢驗和非參數(shù)檢驗。參數(shù)檢驗法在檢驗時對總體分布和總體參數(shù)（N,仃2）有所要求，而非參數(shù)檢驗法在檢驗時則不依賴于總體的分布形態(tài)和總體參數(shù)的情況。參數(shù)檢驗法主要有 Z檢驗、t檢驗、F檢驗和q檢驗等，非參數(shù)檢驗（non-parameter test）主要有。檢驗、符號檢驗法、符號等級檢驗法、秩和檢驗、中位數(shù)檢驗

4、等。二、統(tǒng)計推斷的基本問題沒有系統(tǒng)學(xué)過統(tǒng)計學(xué)的人往往有一種誤解，以為只要搜集了數(shù)據(jù)資料，就可以用統(tǒng)計方法來處理數(shù)據(jù)。殊不知統(tǒng)計學(xué)是建立在概率論基礎(chǔ)上的，而概率論是專門研究隨機事件的。因此，在做統(tǒng)計推斷之前必須考慮你所獲得的資料是否能夠用統(tǒng)計的方法來分析。通常，進(jìn)行統(tǒng)計推斷時應(yīng)首先考慮以下三個方面的問題。一是關(guān)于統(tǒng)計推斷的基本前提。統(tǒng)計推斷的前提是隨機抽樣。因此當(dāng)我們利用樣本統(tǒng)計量進(jìn)行總體推斷時，首先要了解抽樣的方式，即了解樣本是如何得來的，是隨機抽取的，還是人為抽取的。隨機抽樣的均等性和獨立性，避免了入樣個體只來自總體的某一部分，從而也就避免了樣本的偏倚性。可以說，樣本的抽取直接關(guān)系著統(tǒng)計研

5、究結(jié)果的科學(xué)性。二是樣本的規(guī)模與樣本的代表性。抽樣研究需要有一定的樣本規(guī)模，而樣本要具有代表性也需要有一定的樣本規(guī)模來保證，以減少抽樣誤差。一般來說，在其它條件相同的情況下，樣本越小，抽樣的誤差越大；樣本越大，抽樣的誤差就越小。當(dāng)樣本增至包括總體的全部個體（即n = N ）時，抽樣的誤差為 0。因此，只要條件允許，盡可能地采用大樣本，以增強樣本對總體的代表性和可靠性。值得注意的樣本規(guī)模和樣本代表性是建立在隨機抽樣基礎(chǔ)之上的，否則即使樣本再大也是無意義的。三是統(tǒng)計推斷的錯誤要有一定限度。統(tǒng)計推斷是在特定的時間、空間和條件下得出的結(jié) 論，加上抽樣誤差的影響，在用樣本推測總體時總會犯一定的錯

6、誤。這種錯誤在統(tǒng)計推斷中是不可避免的，也是允許的。不過這種錯誤要有一定的限度，超過一定限度的錯誤是不允許的。統(tǒng)計推斷中允許犯錯誤的限度是用小概率事件來表示。第二節(jié) 區(qū)間估計一、參數(shù)估計的定義所謂參數(shù)估計就是根據(jù)樣本統(tǒng)計量去估計相應(yīng)總體的參數(shù)。譬如我們可以根據(jù)樣本均數(shù)（X）去估計總體的均數(shù)（k）,根據(jù)樣本方差（S2）去估計總體方差（仃2）,根據(jù)樣本的相關(guān)系數(shù)（r ）去估計總體相關(guān)系數(shù)（P ）等等。二、參數(shù)估計的方法參數(shù)估計有點估計和區(qū)間估計兩種。譬如，某學(xué)區(qū)期末時抽取所管轄的小學(xué)四年級的數(shù)學(xué)測驗成績，求得平均分70分，標(biāo)準(zhǔn)差10分，于是一個管理者認(rèn)為全區(qū)四年級的數(shù)學(xué)平均分可能是70分

7、，而另一個管理者則認(rèn)為全區(qū)四年級數(shù)學(xué)平均分可能性在6575之間。因前者是用數(shù)軸上的一點做估計，稱為點估計。后者是用數(shù)軸上的一段距離做估計，稱區(qū)間估計。（一）點估計點估計（point estimation ）是在參數(shù)估計中直接以樣本的統(tǒng)計量（數(shù)軸上的一個點）作為總體參數(shù)的估計值。譬如用樣本統(tǒng)計量：X, S、 r等作為總體參數(shù) N、仃、P等的估計值。但是作為良好點估計的統(tǒng)計量必須具備一定的前提條件。1 .無偏性用統(tǒng)計量估計總體參數(shù)必然會存在一定的誤差，而恰好相等的情形是極少見的。當(dāng)然，無偏性并不是說沒有一點誤差，而是要求用各個樣本的統(tǒng)計量作為估計值時，其偏差為0,即V X - 1 - 0這時的

8、統(tǒng)計量被稱為無偏估計量（unbiased estimator）。譬如，根據(jù)中心極限定理二有u _ u _ X 一，即樣本均數(shù)的均數(shù)是總體均數(shù)的無偏估計量，亦即我們可以用樣本均數(shù)的均數(shù)作為總體均數(shù)的點估計值。假設(shè)我們從某市四個區(qū)的六歲男童中隨機抽取四個樣本，對每個樣本測量其身高的平均數(shù)，再求得四個樣本均數(shù)的均數(shù)為110.70公分，并此值作為該市所有六歲男孩的平均身高就是一個點估計。如果，Z（X -"）大于0或小于0,那么這時的統(tǒng)計量就為有偏估計量。作為總體參數(shù)的良好估計值是應(yīng)當(dāng)具備無偏性的。當(dāng)樣本容量足夠大的時候，用樣本均數(shù)或樣本標(biāo)準(zhǔn)差作為總體相應(yīng)參數(shù)的估計量都可視為無偏估計量。

9、正因為如此，在大樣本統(tǒng)計分析中，常用樣本標(biāo)準(zhǔn)差（&/）去代替總體標(biāo)準(zhǔn)差（仃）。當(dāng)總體分布呈正態(tài)時，中數(shù)也是總體均數(shù)的無偏估計量。然而由于抽樣誤差的普遍存在，我們不能期待一次抽樣就能對總體參數(shù)作出精確的估計。加之點估計不能給出估計誤差及其可靠性有關(guān)信息，因此采用點估計時應(yīng)特別注意樣本統(tǒng)計量所具有的特性。2 . 一致性總體參數(shù)的估計量隨樣本容量的無限增大，應(yīng)當(dāng)能越來越接近它所估計的總體參數(shù)。例如正態(tài)總體的總體均數(shù)為R,標(biāo)準(zhǔn)差為仃，如果X是從總體中隨機抽取樣本獲得的平均數(shù)，其容量為n ,則當(dāng)N -8日, X - N ； Sn，一仃。這時樣本統(tǒng)計量的均數(shù) X就是總體參數(shù) N 的一個估計值，或

10、者說 X與是一致的。3 .有效性當(dāng)總體參數(shù)的無偏估計量不止一個統(tǒng)計量時，則要分析無偏估計量的變異大小的情況。無偏估計量變異性小的，有效性較高；無偏估計量變異性大的，則有效性較低。例如作為總體均數(shù)N的估計值來說，樣本均數(shù)X、中數(shù)Mdn和眾數(shù)Mo等都是無偏估計量。這時選誰作為估計值最恰當(dāng)則要看誰的變異性最小。在 X , Mdn和Mo中只有X的變異性最小，即X的方差最小。所以用統(tǒng)計量一一樣本均數(shù)作為總體參數(shù) N的估計值是最佳選擇。這也同時說明為什么在統(tǒng)計推斷中不常使用中數(shù)和眾數(shù)。4 .充分性充分性是指一個容量為 n的樣本統(tǒng)計量是否充分地反映了全部n個數(shù)所反映的總體信息。從X , Mdn和

11、Mo的比較中我們已知，只有在求均數(shù)X時n個數(shù)據(jù)全部參與計算，它充分地反映所有數(shù)據(jù)所要反映的總體信息，而在計算Mdn和Mo時只有部分?jǐn)?shù)據(jù)參與計算，是用部分?jǐn)?shù)據(jù)反映的總體信息。因此平均數(shù)的充分性最高，中數(shù)和眾數(shù)的充分性較低。同理，在差異量數(shù)中方差 S2和標(biāo)準(zhǔn)差S要比平均差A(yù)D、四分位差Q更具有充分性。一個好的點估計應(yīng)當(dāng)具備以上四個條件。但是無論如何，抽樣誤差總是存在，加上點估計不能提供正確估計的概率，所以應(yīng)用時受到局限。例如，我們只能大體上知道樣本容量比較大時，多數(shù)的 X靠近R,但是樣本容量究竟大到什么程度，多數(shù)“、靠近”到什么程度，多數(shù)”到底是多少等等都是很模糊的。點估計的這些不足以及缺陷可

12、以用區(qū)間估計的方法來彌補。第三節(jié)總體均數(shù)的估計一、均數(shù)估計的標(biāo)準(zhǔn)誤均數(shù)估計就是用樣本均數(shù)去估計總體均數(shù)。在用樣本均數(shù)（X ）對總體均數(shù)（N）進(jìn)行區(qū)間估計時，樣本均數(shù)的標(biāo)準(zhǔn)誤（SEX ）是衡量抽樣誤差大小的重要指標(biāo)，而樣本均數(shù)的抽樣分布則是進(jìn)行這種估計的理論依據(jù)。 2.（一）標(biāo)準(zhǔn)誤的定義式一一仃已知當(dāng)總體（T 2已知時，根據(jù)中心極限定理三有V X . J2二 X SEX 二一二'n n. n因為標(biāo)準(zhǔn)誤與總體標(biāo)準(zhǔn)差成正比，與樣本容量的平方根成反比，所以總體標(biāo)準(zhǔn)差越小，標(biāo)準(zhǔn)誤越小；樣本容量越大，標(biāo)準(zhǔn)誤也越小。對于一個指定的總體來說，其總體標(biāo)準(zhǔn)差仃是一個確定的數(shù)。因此，在實際工作中，增

13、大樣本容量可以減小均數(shù)的標(biāo)準(zhǔn)誤，這是提高估計精度的重要手段。對于總體均數(shù)N進(jìn)行估計時，如果。已知，那么只需從總體中抽取一個容量為n的隨機樣本，就可以求出SEX而對其區(qū)間作出估叱，其區(qū)間估計公式為二=1 -1.96r-X二=1 -2.58 二 X X2 .（二）標(biāo)準(zhǔn)誤的近似式一一仃未知在實際工作中，總體方差及總體標(biāo)準(zhǔn)差往往是未知的。這時我們只能根據(jù)樣本的標(biāo)準(zhǔn)差去估計總體的標(biāo)準(zhǔn)差。用樣本標(biāo)準(zhǔn)差去估計總體標(biāo)準(zhǔn)差時必須考慮其無偏估計量的問題。數(shù)理統(tǒng)計學(xué)已證明樣本標(biāo)準(zhǔn)差&不是總體標(biāo)準(zhǔn)差仃的無偏估計量。因此，以 Sn作為。的點估計是不恰當(dāng)?shù)摹５菢颖镜臒o偏標(biāo)準(zhǔn)差卻是總體標(biāo)準(zhǔn)差。的無偏估計量

14、，即統(tǒng)計量Sn抽樣分布的平均數(shù)恰好等于仃。因此，這里的樣本無偏標(biāo)準(zhǔn)差定義為_（X-XfSn 1， n由于是的無偏估計量，且當(dāng) n 一定時，Sn抽樣分布的標(biāo)準(zhǔn)誤小于 SEX ,所以當(dāng)n足夠大且一定時，Sn比*的近似程度高于 X定N。于是，有了樣本平均數(shù)標(biāo)準(zhǔn)誤的近似公式Sn n -1當(dāng)總體b未知時，即可采用這一公式計算均數(shù)的標(biāo)準(zhǔn)誤。二、總體均數(shù)的估計方法總體均數(shù)的估計方法大致有三種，一種以正態(tài)分布理論為依據(jù)的估計法，稱正態(tài)估計法。一種是以t分布理論為依據(jù)的估計方法，稱 t分布估計法。三是以漸近正態(tài)分布為依據(jù)的估計方法，稱近似正態(tài)估計法。三種方法適用于不同的資料形式。（一）正態(tài)估計法正態(tài)估計法

15、適用于總體方差 b2已知的數(shù)據(jù)資料。其具體應(yīng)用情形有二，一是總體呈正態(tài)時，不論樣本容量的大小，樣本均數(shù)的分布都呈正態(tài)分布。因為，中心極限定理一指出，總體正態(tài)時，從總體抽取的容量為 n一切可能樣本的均數(shù)呈正態(tài)分布。二是總體呈非正態(tài)時，只要樣本容量大于 30,樣本均數(shù)的分布呈近似正態(tài)分布。因為，中心極限定理一指出，當(dāng)n足夠大時，無論總體分布形態(tài)如何，樣本均數(shù)的分布服從或接近正態(tài)分布。第四節(jié)其他總體參數(shù)的估計參數(shù)估計除總體均數(shù)的估計外，還有總體方差和標(biāo)準(zhǔn)差的估計、總體相關(guān)系數(shù)的估計和總體比例的估計等等。這種參數(shù)估計過程大致相同，主要區(qū)別在于標(biāo)準(zhǔn)誤的計算不同。、總體方差和總體標(biāo)準(zhǔn)差的估計（一）總

16、體方差的估計2由于樣本方差與總體方差比值的分布呈'分布，所以有22nn-1 S2,n-1Snjn 1SnI- 2，、， n1 :2. n ：-（2t2, wctw （主，或（匕 wcrwl例8-5 :從某校初三學(xué)生中隨機抽取10份物理成績，計算得平均分為71.2,標(biāo)準(zhǔn)差（Sn）為14.46。試估計物理成績的方差在什么范圍之內(nèi)。選擇顯著性水平口。假設(shè)本例選口 = 0.05計算自由度。本例，df = n-1 =10-1 = 95)22 .2顯著性臨界值表，確定,力291-2代入公式,結(jié)果解釋2 0.975 = 2.7作出估計29 14.4622.7696.97 < a2 <2

17、 .和C 2 ,本例有9 0.025 = 19 .029 14.462仃2 w 19.099.04,或 26.40 w。2 <9.957 / 7該校初三學(xué)生物理成績的方差有98%的可能會落在86.86901.20之間或標(biāo)準(zhǔn)差會落在9.3230.02之間，超出這一范圍的可能只有2%。從這一結(jié)果看，物理成績標(biāo)準(zhǔn)差的區(qū)間較大，若增加樣本容量可縮小區(qū)間差距。（二）總體標(biāo)準(zhǔn)差的估計標(biāo)準(zhǔn)差的估計既可以采用上述總體方差估計區(qū)間的平方根，也可以直接利用樣本標(biāo)準(zhǔn)差進(jìn)行估計。樣本標(biāo)準(zhǔn)差抽樣分布的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)誤，其公式為_ Sn JSEs （或。S）J27因其近似正態(tài)分布，所以總體標(biāo)準(zhǔn)差的置信區(qū)間為S

18、n-1.96SES；=Sn4 -2.58SES用此法對例8-5進(jìn)行總體標(biāo)準(zhǔn)的估計，則有SEs =14.46,2 1014.464.47= 3.23；=14.46 1.96 3.23 =8.13 20.79、總體相關(guān)系數(shù)的估計由樣本相關(guān)系數(shù)r形成的分布形式較多，因此計算樣本相關(guān)系數(shù)標(biāo)準(zhǔn)誤的及置信限的方法也較為復(fù)雜。這里只介紹常用方法一一 Fisher的Z函數(shù)分布法。Fisher的Z函數(shù)分布法是通過將樣本相關(guān)系數(shù)轉(zhuǎn)換為乙值（因Zr的樣本分布近似正態(tài)分布），并以乙值進(jìn)行估計，然后再將乙值還原為r值的做法。這種既無需考慮樣本容量大小，也無需顧忌總體相關(guān)系例8-6:某教師經(jīng)研究發(fā)現(xiàn)，其所教班級學(xué)生（55人）的數(shù)學(xué)成績與物理成績的相關(guān)系數(shù)為0.66。試以95%的置信度估計全年級數(shù)學(xué)和物理的相關(guān)系數(shù)。1)2)將r轉(zhuǎn)換為Zr函數(shù)。查求Zr的標(biāo)準(zhǔn)誤Fisher 函數(shù)轉(zhuǎn)換表，當(dāng) r = 0.66 時，Zr = 0.

人人文庫> 全部分類> 應(yīng)用文書 > 工作計劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

從樣本統(tǒng)計量估計整體參數(shù)

文檔簡介

溫馨提示

最新文檔

評論

從樣本統(tǒng)計量估計整體參數(shù)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔