應(yīng)用統(tǒng)計學(xué) 課件 第5、6章 參數(shù)估計、假設(shè)檢驗_第1頁
應(yīng)用統(tǒng)計學(xué) 課件 第5、6章 參數(shù)估計、假設(shè)檢驗_第2頁
應(yīng)用統(tǒng)計學(xué) 課件 第5、6章 參數(shù)估計、假設(shè)檢驗_第3頁
應(yīng)用統(tǒng)計學(xué) 課件 第5、6章 參數(shù)估計、假設(shè)檢驗_第4頁
應(yīng)用統(tǒng)計學(xué) 課件 第5、6章 參數(shù)估計、假設(shè)檢驗_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

《應(yīng)用統(tǒng)計學(xué)》第五章參數(shù)估計應(yīng)用統(tǒng)計學(xué)第一節(jié)參數(shù)估計的基本概念第二節(jié)統(tǒng)計量與抽樣分布第三節(jié)參數(shù)估計第四節(jié)樣本容量的確定應(yīng)用統(tǒng)計學(xué)CONTENTS目錄第一節(jié)參數(shù)估計的基本概念應(yīng)用統(tǒng)計學(xué)全及總體和抽樣總體全及總體:研究對象的全體稱為全及總體,簡稱總體,總體容量用N表示抽樣總體:從全及總體中按隨機(jī)原則抽取一部分單位所構(gòu)成的集合體,簡稱子樣或樣本,樣本容量用n表示。當(dāng)n>30時,稱為大樣本,當(dāng)n<30時,稱為小樣本,n/N稱為抽樣比例。無特殊說明,以下所說的樣本都是指簡單隨機(jī)樣本應(yīng)用統(tǒng)計學(xué)總體指標(biāo)和樣本指標(biāo)總體指標(biāo):根據(jù)全及總體計算的綜合指標(biāo)稱為總體指標(biāo),主要有全及平均數(shù)全及成數(shù)、全及方差和全及標(biāo)準(zhǔn)差樣本指標(biāo):根據(jù)抽樣總體計算的綜合指標(biāo)稱為抽樣指標(biāo)主要有樣本平均數(shù)、樣本成數(shù)、樣本方差和樣本標(biāo)準(zhǔn)差應(yīng)用統(tǒng)計學(xué)總體指標(biāo)和樣本指標(biāo)的關(guān)系總體指標(biāo)是唯一確定的,但往往是未知的,稱為總體參數(shù)樣本指標(biāo)不是唯一的,是隨樣本不同而變化的隨機(jī)變量,但抽取出樣本后可以計算其數(shù)值.應(yīng)用統(tǒng)計學(xué)重復(fù)抽樣與不重復(fù)抽樣重復(fù)抽樣:指從總體中隨機(jī)抽出一個單位記錄其特征后,再放回總體參加下一次抽選,每次抽取時總體單位數(shù)相同不重復(fù)抽樣:從總體中隨機(jī)抽出一個單位記錄其特征后,不再放回總體中,下一個樣本單位再從余下的總體單位中抽取,每次抽取時總體單位數(shù)不相同應(yīng)用統(tǒng)計學(xué)第二節(jié)統(tǒng)計量與抽樣分布應(yīng)用統(tǒng)計學(xué)

應(yīng)用統(tǒng)計學(xué)統(tǒng)計量:設(shè)是總體的樣本,

是一個連續(xù)函數(shù),若此函數(shù)不含任何未知參數(shù),則稱函數(shù)

為一個統(tǒng)計量典型舉例:樣本均值:

樣本方差:

應(yīng)用統(tǒng)計學(xué)抽樣分布:統(tǒng)計量的概率分布稱為抽樣分布經(jīng)典分布:0-1分布、二項分布、泊松分布、均勻分布、正態(tài)分布、指數(shù)分布要點回顧:若統(tǒng)計量的概率密度函數(shù)可表示為:

則稱該統(tǒng)計量服從均值為,方差為的正態(tài)分布,記作

分布:設(shè)是相互獨立的,且服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量,令:,則稱服從自由度為n的分布,記作

分布的特性:1.可加性:若,且相互獨立,則有: 2.分布曲線形狀隨僅隨n變化(自由度)應(yīng)用統(tǒng)計學(xué)不同自由度條件下的分布圖示應(yīng)用統(tǒng)計學(xué)分布:若,且和是相互獨立的,則稱:

服從自由度為n的分布,記作:

分布性質(zhì):1.分布關(guān)于對稱 2.分布曲線的形狀隨自由度n的變化而變化應(yīng)用統(tǒng)計學(xué)分布:若,且和是相互獨立的,則稱:

服從自由度為

的分布,記作:

分布性質(zhì):1.若,則

2.分布曲線是右偏型,隨自由度變化

應(yīng)用統(tǒng)計學(xué)設(shè)是獨立同分布的隨機(jī)變量,且每個隨機(jī)變量都滿足均值為、方差為,則有當(dāng)充分大時,近似的服從。該定理說明,只要充分大,不論總體是否服從正態(tài)分布,其樣本均值都近似的服從正態(tài)分布。中心極限定理應(yīng)用統(tǒng)計學(xué)中心極限定理證明了只要樣本容量充分大,不論全及總體的變量分布是否屬于正態(tài)分布,其抽樣平均數(shù)趨于正態(tài)分布,為抽樣推斷和估計提供了重要的理論依據(jù)。應(yīng)用統(tǒng)計學(xué)設(shè)是獨立同分布的隨機(jī)變量,且每個隨機(jī)變量都服從正態(tài)分布,即,則有:(1)

(2)(3)

(4)抽樣分布定理應(yīng)用統(tǒng)計學(xué)第三節(jié)參數(shù)估計應(yīng)用統(tǒng)計學(xué)參數(shù)估計是抽樣推斷的重要內(nèi)容之一,參數(shù)估計是如何用樣本統(tǒng)計量來估計總體參數(shù),如利用樣本均值去估計總體均值、利用樣本方差去估計總體方差。參數(shù)估計有兩種基本方法,一種是點估計,另一種是區(qū)間估計。應(yīng)用統(tǒng)計學(xué)基于總體的一個樣本來估計總體分布中未知參數(shù)的值的問題稱為參數(shù)的點估計符號聲明::待估計的參數(shù)

:稱為的估計量

:稱為的估計值

估計量是一個隨機(jī)變量,估計值是一個數(shù)值一、點估計應(yīng)用統(tǒng)計學(xué)二、區(qū)間估計設(shè)總體的分布函數(shù)為,其中為未知參數(shù),是來自總體

的樣本,對于給定值,確定兩個統(tǒng)計量以及

,其中,若滿足:則稱區(qū)間是總體參數(shù)的置信水平為的置信區(qū)間(區(qū)間估計),其中和分別稱為置信下限和置信上限,稱為置信水平應(yīng)用統(tǒng)計學(xué)區(qū)間估計的類型(1)總體服從從正態(tài)分布,當(dāng)已知時,求的置信區(qū)間(2)總體服從從正態(tài)分布,當(dāng)未知時,求的置信區(qū)間(3)非正態(tài)總體或總體分布未知時,求的置信區(qū)間(4)大樣本容量下的總體成數(shù)的區(qū)間估計(5)正態(tài)分布總體條件下的總體方差區(qū)間估計應(yīng)用統(tǒng)計學(xué)設(shè)是來自總體的樣本,且總體,其中已知,則對于給定的置信度,的置信區(qū)間為:

簡記為:總體服從從正態(tài)分布,當(dāng)已知時,求的置信區(qū)間應(yīng)用統(tǒng)計學(xué)設(shè)是來自總體的樣本,且總體,其中未知,則對于給定的置信度,的置信區(qū)間為:

簡記為:總體服從從正態(tài)分布,當(dāng)未知時,求的置信區(qū)間應(yīng)用統(tǒng)計學(xué)為了估計一分鐘一次廣告的平均費用,抽出了35家電視媒體的隨機(jī)樣本。樣本均值為20000元,樣本標(biāo)準(zhǔn)差為3000元。假定電視臺一分鐘一次的廣告費近似服從正態(tài)分布,試計算總體均值的置信度為95%的置信區(qū)間。課堂練習(xí)應(yīng)用統(tǒng)計學(xué)解:應(yīng)用統(tǒng)計學(xué)當(dāng)總體分布未知,僅知道總體方差時,根據(jù)中心極限定理,當(dāng)充分大時,樣本均值近似服從正態(tài)分布,此時,對于給定的置信度,總體均值的置信區(qū)間為:非正態(tài)總體或總體分布未知時,求的置信區(qū)間應(yīng)用統(tǒng)計學(xué)總體成數(shù)的區(qū)間估計實際工作中,需要估計某種特征的單位數(shù)占總體全部單位數(shù)的比例,被成為總體成數(shù),記為P。例:一批電子元件的合格率,中央電視臺某電視欄目的收視率,某城鎮(zhèn)全部家庭中夫妻不和家庭數(shù)所占的比例等等。把樣本中某種特征的單位數(shù)占樣本全部單位數(shù)的比例稱為樣本成數(shù),記為p.應(yīng)用統(tǒng)計學(xué)總體成數(shù)的區(qū)間估計1. 假定條件總體服從二項分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計量z3.總體比例

在1-

置信水平下的置信區(qū)間為應(yīng)用統(tǒng)計學(xué)正態(tài)分布總體條件下的總體方差區(qū)間估計設(shè)總體服從或近似服從正態(tài)分布,是來自總體的樣本,則可知統(tǒng)計量,對于給定的置信度,總體方差的置信區(qū)間為:簡化可得:應(yīng)用統(tǒng)計學(xué)第四節(jié)樣本容量的確定應(yīng)用統(tǒng)計學(xué)當(dāng)利用樣本統(tǒng)計量估計總體參數(shù)時,第一步需要確定的就是樣本容量,正確的確定樣本容量,不但能節(jié)約抽樣調(diào)查消耗,而且能有效地控制抽樣誤差應(yīng)用統(tǒng)計學(xué)影響樣本容量的因素1.被研究總體的標(biāo)志值變動程度:體現(xiàn)為總體的方差較大,則需要進(jìn)行較大樣本容量的抽樣2.允許的誤差范圍:若要求推斷的精度較高,則需要較大樣本容量的抽樣3.抽樣推斷的可信程度:可以理解為置信度應(yīng)用統(tǒng)計學(xué)測定均值的樣本單位數(shù)在重復(fù)抽樣時,當(dāng),已知時,或非正態(tài)總體、總體分布未知時的大樣本情形,總體均值的置信區(qū)間可表示為:

或此時允許誤差的公式可表示為:進(jìn)而可推出測定均值的樣本單位數(shù)應(yīng)為:應(yīng)用統(tǒng)計學(xué)測定成數(shù)的樣本單位數(shù)在重復(fù)抽樣時,大樣本條件下,總體成數(shù)π的置信區(qū)間可表示為:

此時允許誤差的公式可表示為:進(jìn)而可推出測定均值的樣本單位數(shù)應(yīng)為:應(yīng)用統(tǒng)計學(xué)現(xiàn)實中總體成數(shù)π往往是未知的,可采用以下替代方法:(1)

用類似的同類資料或歷史資料作為近似值,若同時有多個,應(yīng)選擇最接近0.5的比率;

(2)用樣本成數(shù)來代替;(3)在缺乏總體成數(shù)π的情況下,可選擇π=0.5。應(yīng)用統(tǒng)計學(xué)測定成數(shù)的樣本單位數(shù)例題分析某食品廠要檢查本月生產(chǎn)的10000袋產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。要求在95.45%的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應(yīng)抽查多少袋產(chǎn)品。應(yīng)用統(tǒng)計學(xué)解答:

應(yīng)用統(tǒng)計學(xué)應(yīng)用統(tǒng)計學(xué)謝謝《應(yīng)用統(tǒng)計學(xué)》第六章假設(shè)檢驗應(yīng)用統(tǒng)計學(xué)CONTENTS目錄第一節(jié)假設(shè)檢驗的基本概念第二節(jié)總體均值的假設(shè)檢驗第三節(jié)總體成數(shù)的假設(shè)檢驗第四節(jié)總體方差的假設(shè)檢驗CONTENTS目錄應(yīng)用統(tǒng)計學(xué)假設(shè)檢驗的過程

該產(chǎn)品的平均壽

命為3190小時!拒絕假設(shè)!別無選擇.應(yīng)用統(tǒng)計學(xué)第一節(jié)假設(shè)檢驗的基本概念應(yīng)用統(tǒng)計學(xué)一、基本概念假設(shè)檢驗是事先對總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來判斷原假設(shè)是否成立。參數(shù)假設(shè)檢驗:已知總體分布,猜出(或用樣本估計出)總體的某個參數(shù)非參數(shù)假設(shè)檢驗:猜出總體分布應(yīng)用統(tǒng)計學(xué)二、原假設(shè)與備選假設(shè)假設(shè)是對總體參數(shù)的的數(shù)值所作的一種陳述總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述原假設(shè)是要進(jìn)行檢驗的假設(shè),又稱“0假設(shè)”。備擇假設(shè)是與原假設(shè)對立的假設(shè),也稱“替換假設(shè)”應(yīng)用統(tǒng)計學(xué)三、雙側(cè)檢驗與單側(cè)檢驗假設(shè)研究的問題雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗H0

=

H1

<

>

應(yīng)用統(tǒng)計學(xué)假設(shè)檢驗的基本原理:小概率原理和小概率事件,在一次觀測中幾乎不至于發(fā)生。進(jìn)行檢驗的規(guī)則:設(shè)零假設(shè)為真,如果由此得出在一次觀察中發(fā)生小概率事件,那么就拒絕零假設(shè);如果在一次觀察中沒有發(fā)生小概率事件,那么就接受零假設(shè)。應(yīng)用統(tǒng)計學(xué)四、假設(shè)檢驗的基本原理五、顯著性水平是一個概率值原假設(shè)為真時,拒絕原假設(shè)的概率被稱為抽樣分布的拒絕域表示為,常用的值有0.01,0.05,0.10由研究者事先確定應(yīng)用統(tǒng)計學(xué)六、拒絕域和接受域以正態(tài)分布為例:先確定顯著性水平,然后根據(jù)統(tǒng)計量在正態(tài)分布的情況下找出臨界點,這臨界點把整個樣本的取值區(qū)間分為兩大部分,一部分是接受域,另一部分是拒絕域。-Z

/2Z

/2

/2Z

應(yīng)用統(tǒng)計學(xué)七、P值P值是一個與統(tǒng)計假設(shè)檢驗相聯(lián)系的概率,國際通用的幾個統(tǒng)計軟件SPSS、SAS等在某種計算的結(jié)果中都有一個p值。P值即為否定H0的最小顯著性水平判斷規(guī)則:當(dāng)p<(給定的顯著性水平)時,拒絕H0,否則接受應(yīng)用統(tǒng)計學(xué)八、假設(shè)檢驗的兩類錯誤你不能同時減少兩類錯誤!習(xí)慣上,采用“棄真”錯誤的概率很小的準(zhǔn)則,即控制

的大小,通常取為0.05或0.01棄真錯誤:P{拒絕H0/

H0為真}=

存?zhèn)五e誤:P{接受H0/

H0為假}=

應(yīng)用統(tǒng)計學(xué)九、假設(shè)檢驗的一般步驟1.提出原假設(shè)和備擇假設(shè)2.找出適當(dāng)?shù)臋z驗統(tǒng)計量及其分布3.計算檢驗統(tǒng)計量的數(shù)值4.給定顯著性水平,確定臨界值5.統(tǒng)計決策應(yīng)用統(tǒng)計學(xué)第二節(jié)總體均值的假設(shè)檢驗應(yīng)用統(tǒng)計學(xué)單個均值的假設(shè)檢驗

應(yīng)用統(tǒng)計學(xué)總體服從從正態(tài)分布,當(dāng)已知時,的假設(shè)檢驗1.建立假設(shè)2.選擇檢驗統(tǒng)計量,由于已知,選擇:3.計算檢驗統(tǒng)計量數(shù)值:4.給定顯著性水平,確定臨界值,從而確定拒絕域為和,接受域為:5.統(tǒng)計決策,若,拒絕,否則接受某機(jī)床廠加工一種零件,根據(jù)經(jīng)驗知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為0.081mm,總體標(biāo)準(zhǔn)差為0.025mm。今換一種新機(jī)床進(jìn)行加工,抽取200個零件進(jìn)行檢驗,得到的橢圓度的均值為0.076mm。試問新機(jī)床加工零件的橢圓度的均值與以前有無顯著差異?(=0.05)例題分析應(yīng)用統(tǒng)計學(xué)例題分析H0:

=

0.081H1:

0.081

=

0.05n

=

200臨界值(s):

=0.05的水平上拒絕H0單個總體均值的假設(shè)檢驗總體服從從正態(tài)分布,當(dāng)已知時,的假設(shè)檢驗1.建立假設(shè)2.選擇檢驗統(tǒng)計量,由于已知,選擇:3.計算檢驗統(tǒng)計量數(shù)值:4.給定顯著性水平,確定臨界值5.統(tǒng)計決策,若,拒絕,否則接受應(yīng)用統(tǒng)計學(xué)正態(tài)總體均值的假設(shè)檢驗(檢驗水平)1原假設(shè)H0H0下的檢驗統(tǒng)計量及分布備擇假設(shè)H1H0的拒絕域方差

2已知方差

2未知~

N(0,1)

nZ

X

0~

t(n

1)s

nX

0T

0

00

0

0

0Z

Z

Z

Z

Z

Z2T

t

(n

1)T

t

(n

1)7T

t

(n

1)2

0

00

000

應(yīng)用統(tǒng)計學(xué)單個總體均值的假設(shè)檢驗非正態(tài)總體或總體分布未知時,總體方差已知為,的假設(shè)檢驗1.建立假設(shè)2.選擇檢驗統(tǒng)計量,由于已知,選擇:3.計算檢驗統(tǒng)計量數(shù)值:4.給定顯著性水平,確定臨界值5.統(tǒng)計決策,若,拒絕,否則接受應(yīng)用統(tǒng)計學(xué)課堂練習(xí)某旅館的經(jīng)理認(rèn)為其客人平均每天的花費至少為1000元,假如抽取了一組50張帳單作為樣本資料,樣本平均數(shù)為950元,且已知=200元。試以5%的顯著水平檢驗該經(jīng)理的說法。應(yīng)用統(tǒng)計學(xué)課堂練習(xí)H1

:

1000H0

:

1000

0.05

,

Z

1.645Z

Z

拒絕H0

,接受H1Z

x

0

950

1000

1.77

200

n 50解:應(yīng)用統(tǒng)計學(xué)兩個總體均值差異的假設(shè)檢驗兩個總體為正態(tài)分布,已知總體方差分別為和,總體均值差異的假設(shè)檢驗設(shè),,則可知,,進(jìn)一步由正態(tài)分布性質(zhì)可知:思考:如何將上述式子轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布形式?即中的函數(shù)關(guān)系式如何表達(dá)。應(yīng)用統(tǒng)計學(xué)兩個總體均值差異的假設(shè)檢驗兩個總體為正態(tài)分布,已知總體方差分別為和,總體均值差異的假設(shè)檢驗1.建立假設(shè);2.選擇檢驗統(tǒng)計量:3.計算檢驗統(tǒng)計量數(shù)值;4.給定顯著性水平;5.統(tǒng)計決策。應(yīng)用統(tǒng)計學(xué)兩個總體均值差異的假設(shè)檢驗兩個總體為正態(tài)分布,未知總體方差和的數(shù)值,但已知總體均值差異的假設(shè)檢驗1.建立假設(shè);2.選擇檢驗統(tǒng)計量:3.計算檢驗統(tǒng)計量數(shù)值;4.給定顯著性水平;5.統(tǒng)計決策。思考:如何將上述統(tǒng)計量表達(dá)符合何種分布?自由度是多少?應(yīng)用統(tǒng)計學(xué)兩個總體均值差異的假設(shè)檢驗總體分布未知,大樣本情形下(),當(dāng)和已知時,總體均值差異的假設(shè)檢驗1.建立假設(shè);2.選擇檢驗統(tǒng)計量:3.計算檢驗統(tǒng)計量數(shù)值;4.給定顯著性水平;5.統(tǒng)計決策。應(yīng)用統(tǒng)計學(xué)配對樣本的T檢驗當(dāng)統(tǒng)計樣本數(shù)據(jù)成對出現(xiàn)時,對兩個總體均值進(jìn)行的檢驗稱為T檢驗1.新建統(tǒng)計量:2.建立假設(shè);2.選擇檢驗統(tǒng)計量;3.計算檢驗統(tǒng)計量數(shù)值;4.給定顯著性水平;5.統(tǒng)計決策。應(yīng)用統(tǒng)計學(xué)課堂練習(xí)一個以減肥為主要目標(biāo)的健美俱樂部聲稱,參加其訓(xùn)練班至少可以使減肥者平均體重減重8.5kg以上。為了驗證該宣稱是否可信,調(diào)查人員隨機(jī)抽取了10名參加者,得到他們的體重記錄如下表:訓(xùn)練前94.5101110103.59788.596.5101104116.5訓(xùn)練后8589.5101.5968680.58793.593102應(yīng)用統(tǒng)計學(xué)課堂練習(xí)樣本差值計算表訓(xùn)練前訓(xùn)練后差值ui94.5859.510189.511.5110101.58.5103.5967.597861188.580.5896.5879.510193.57.51049311116.510214.5合計—98.5應(yīng)用統(tǒng)計學(xué)H0:

1

2

8.5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論