參數(shù)估計與假設檢驗_第1頁
參數(shù)估計與假設檢驗_第2頁
參數(shù)估計與假設檢驗_第3頁
參數(shù)估計與假設檢驗_第4頁
參數(shù)估計與假設檢驗_第5頁
已閱讀5頁,還剩114頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第五章參數(shù)估計與假設檢驗樣本總體樣本統(tǒng)計量如:樣本均值、比例、方差總體均值、比例、方差等2/1/20231統(tǒng)計推斷(Statisticalinference)

統(tǒng)計推斷就是根據(jù)隨機樣本的實際數(shù)據(jù),對總體的數(shù)量特征作出具有一定可靠程度的估計和判斷。統(tǒng)計推斷的基本內(nèi)容有參數(shù)估計和假設檢驗兩方面。概括地說,研究一個隨機變量,推斷它具有什么樣的數(shù)量特征,按什么樣的模式來變動,這屬于估計理論的內(nèi)容,而推測這些隨機變量的數(shù)量特征和變動模式是否符合我們事先所作的假設,這屬于檢驗理論的內(nèi)容。參數(shù)估計和假設檢驗的共同點是它們都對總體無知或不很了解,都是利用樣本觀察值所提供的信息,對總體的數(shù)量特征作出估計和判斷,但兩者所要解決問題的著重點及所用方法有所不同。█2/1/20232主要內(nèi)容5.1

參數(shù)估計的一般問題

5.2一個總體參數(shù)的區(qū)間估計5.3必要抽樣數(shù)目的確定5.4假設檢驗的基本問題5.5一個總體參數(shù)的假設檢驗2/1/202335.1參數(shù)估計的一般問題

5.1.1參數(shù)估計的含義5.1.2估計量與估計值5.1.3點估計與區(qū)間估計5.1.4評價估計量的標準2/1/20234所謂參數(shù)估計,就是以樣本統(tǒng)計量(即樣本數(shù)字特征)來估計未知的總體參數(shù)(或參數(shù)的函數(shù))。實際工作中一般首先進行概率抽樣得到隨機樣本,然后通過對樣本單位的實際觀察取得樣本數(shù)據(jù),最后計算樣本統(tǒng)計量的取值對未知的總體參數(shù)進行估計。5.1.1參數(shù)估計的含義1、什么是參數(shù)估計2/1/202352、參數(shù)估計的特點和邏輯思想(1)以隨機樣本為基礎;(2)以分布理論為依據(jù);(3)推斷的只是一種可能的結果;(4)是歸納推理和演繹推理的結合。

歸納推理

從樣本總體

大前提小前提(分布規(guī)律)(樣本信息)結果演繹推理5.1.1參數(shù)估計的含義2/1/202363、參數(shù)估計的主要問題(1)如何得到總體參數(shù)的估計值?(解決估計方法問題)(2)如何在保證樣本對總體具有充分代表性的前提下,使樣本的調(diào)查成本最低?(解決樣本容量問題)5.1.1參數(shù)估計的含義2/1/20237

1)估計量:用于估計總體參數(shù)的統(tǒng)計量如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個估計量

2)參數(shù)用表示,估計量用表示

3)估計值:估計參數(shù)時計算出來的估計量的具體數(shù)值如果樣本均值x=80,則80就是的估計值1、什么是估計量與估計值

(estimator&estimatedvalue)5.1.2估計量與估計值2/1/202382、統(tǒng)計估計的基本過程

1)首先對所要研究的總體進行概率抽樣,通過隨機樣本獲取相關統(tǒng)計量,然后利用這些統(tǒng)計量與總體參數(shù)之間的聯(lián)系(獲得統(tǒng)計量的分布),利用有關統(tǒng)計方法計算估計量,估計總體參數(shù)。

2)由此可以看出,統(tǒng)計量與總體參數(shù)、估計量的不同:總體參數(shù)通常是未知的常數(shù),是待估計的量;統(tǒng)計量是根據(jù)樣本計算的函數(shù),通常是隨機變量(對于總體而言);估計量是用來對總體參數(shù)進行估計的統(tǒng)計量。5.1.2估計量與估計值2/1/202391、參數(shù)估計的方法矩估計法最小二乘法最大似然法順序統(tǒng)計量法估計方法點估計區(qū)間估計5.1.3點估計量與區(qū)間估計2/1/2023102、點估計(pointestimate)用樣本統(tǒng)計量的某個取值直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計例如:用兩個樣本均值之差直接作為總體均值之差的估計2) 沒有給出估計值接近總體參數(shù)程度的信息點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等5.1.3點估計量與區(qū)間估計2/1/2023113、區(qū)間估計(intervalestimate)

(1)有關概念點估計是通過樣本估計量的某一次估計值來推斷總體參數(shù)的可能取值;區(qū)間估計則是根據(jù)樣本估計量以一定的可靠程度推斷總體參數(shù)所在的區(qū)間范圍。人們在得到點估計值的同時,自然希望知道與到底相差多少?這就引出了區(qū)間估計問題。即希望對的取值估計出一個范圍,并希望知道這個范圍包含的可靠程度。即P{}=1-

其中[]是置信區(qū)間;是置信區(qū)間下、上限;1-

是置信水平、置信度或置信系數(shù);是估計不準的概率,通常取=0.05,或0.01。由上式可知,要想求出被估計參數(shù)的置信區(qū)間,必須找到一個和被估計參數(shù)相關聯(lián)的統(tǒng)計量,并知其概率分布。5.1.3點估計量與區(qū)間估計2/1/202312

(2)置信區(qū)間的構造

當總體服從正態(tài)分布N(μ,σ2)時(σ2已知),來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學期望為μ,方差為σ2/n。即x~N(μ,σ2/n)

0臨界值-z值a/2a/2

統(tǒng)計量1-置信水平5.1.3點估計量與區(qū)間估計3、區(qū)間估計2/1/202313(3)區(qū)間估計的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x5.1.3點估計量與區(qū)間估計3、區(qū)間估計2/1/202314

2)

1-

可以認為是用樣本估計值代替總體真值時誤差在某一范圍內(nèi)的“可能性”,則可認為是用代替時誤差超過這一范圍的“可能性”。

3)用一個具體的樣本所構造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值。我們只能希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個。總體參數(shù)以一定的概率落在這一區(qū)間的表述是錯誤的。

1)置信區(qū)間的直觀意義為:n次抽樣形成的n個置信區(qū)間中,有n(1-)

個區(qū)間包含總體參數(shù)真值。5.1.3點估計量與區(qū)間估計3、區(qū)間估計注意:(3)區(qū)間估計的圖示2/1/202315

5.1.3點估計量與區(qū)間估計3、區(qū)間估計(3)區(qū)間估計的圖示2/1/202316(4)影響區(qū)間寬度的因素1. 總體數(shù)據(jù)的離散程度,用來測度樣本容量n置信水平(1-),影響

z/2的大小抽樣方法抽樣的組織方式5.1.3點估計量與區(qū)間估計3、區(qū)間估計2/1/202317置信區(qū)間與置信水平(1-)的關系70%80%90%95%99%置信區(qū)間寬度5.1.3點估計量與區(qū)間估計3、區(qū)間估計(4)影響區(qū)間寬度的因素Neyman原則:即在保證置信度的前提下,盡可能提高估計的精確度。2/1/2023181、點估計以樣本指標直接估計總體參數(shù)。評價準則的數(shù)學期望等于總體參數(shù),即該估計量稱為無偏估計。無偏性有效性當為的無偏估計時,方差越小,無偏估計越有效。一致性對于無限總體,如果對任意,則稱的一致估計。是充分性估計量如能包含樣本中關于未知參數(shù)的全部信息,即為充分量。估計量5.1.4評價估計量的標準2/1/2023192、區(qū)間估計估計未知參數(shù)所在的可能區(qū)間。評價準則隨機區(qū)間置信度精確度隨機區(qū)間包含(即可靠程度)越大越好。的概率的平均長度(誤差范圍)越小越好。5.1.4評價估計量的標準█2/1/202320

5.2一個總體參數(shù)的區(qū)間估計

5.2.1一個總體均值的區(qū)間估計5.2.2一個總體比例的區(qū)間估計5.2.3一個總體方差的區(qū)間估計2/1/2023211、有關符號總體參數(shù)樣本統(tǒng)計量均值比例方差5.2.1一個總體均值的區(qū)間估計2/1/202322(1)總體服從正態(tài)分布,且方差(2)

已知;或者總體不是正態(tài)分布但大樣本(n30)時總體均值的區(qū)間估計該條件下使用標準正態(tài)分布統(tǒng)計量z下面通過標準正態(tài)分布構造總體均值的置信區(qū)間5.2.1一個總體均值的區(qū)間估計2、一個總體均值的置信區(qū)間2/1/202323給定置信度1-,可由標準正態(tài)分布表查得臨界值Z/2,使得從而可得置信度為1-時總體均值的置信區(qū)間:

在大樣本(n≥30)條件下,不論總體分布形式如何,均可用上述方法進行總體均值的區(qū)間估計。如果總體方差未知,則直接用樣本方差代替。

▼注意:5.2.1一個總體均值的區(qū)間估計2/1/202324

(2)小樣本下總體方差未知時,正態(tài)分布總體均值的區(qū)間估計

如果是小樣本,但總體為正態(tài)分布,在總體方差未知而需用樣本方差代替時,則下式服從自由度為n-1的t分布。5.2.1一個總體均值的區(qū)間估計2、一個總體均值的置信區(qū)間2/1/202325

▼注意:如果小樣本下總體分布非正態(tài),則無法進行區(qū)間估計,唯一的解決方法就是增大樣本。從而可得置信度為1-時總體均值的置信區(qū)間:

于是,給定置信度為1-,可由t分布表查得臨界值t/2(n-1),使得5.2.1一個總體均值的區(qū)間估計2/1/202326指在一定的置信水平下,抽樣誤差不允許超過的最大給定范圍,也稱作允許誤差、誤差范圍等。5.2.1一個總體均值的區(qū)間估計3、極限誤差(允許誤差)(1)含義(大樣本條件下)(2)極限誤差的計算公式樣本平均數(shù)的極限誤差:①邊際誤差樣本成數(shù)的極限誤差:②2/1/202327

Z與相應的置信水平存在一一對應關系,常用的置信水平及相應的Z值如下:

z值置信水平

1.000.68271.650.90001.960.95002.000.95452.580.99003.000.99735.2.1一個總體均值的區(qū)間估計3、極限誤差2/1/202328計算樣本統(tǒng)計量確定樣本統(tǒng)計量分布由置信水平求臨界值確定置信區(qū)間4、區(qū)間估計步驟(以大樣本下估計為例)其中:5.2.1一個總體均值的區(qū)間估計2/1/202329【例】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復抽樣從中隨機抽取100人調(diào)查他們的當日產(chǎn)量(數(shù)據(jù)見下張幻燈片),要求在95﹪的置信水平下,估計該廠全部工人的日平均產(chǎn)量和日總產(chǎn)量的置信區(qū)間。5.2.1一個總體均值的區(qū)間估計5、例題分析2/1/202330按日產(chǎn)量分組(件)工人數(shù)(人)組中值(件)110~114114~118118~122122~126126~130130~134134~138138~14237182321186411211612012412813213614033681221602852268823768165605887006489284648600784合計100—126004144100名工人的日產(chǎn)量分組資料5.2.1一個總體均值的區(qū)間估計5、例題分析2/1/2023315.2.1一個總體均值的區(qū)間估計5、例題分析2/1/202332即在95﹪置信水平下,該企業(yè)工人人均產(chǎn)量在124.80至127.20件之間,其日總產(chǎn)量在124797至127303件之間。則該廠全部工人日平均產(chǎn)量和日總產(chǎn)量的置信區(qū)間分別為5.2.1一個總體均值的區(qū)間估計5、例題分析2/1/202333例:由532名《商業(yè)周刊》訂閱者組成的樣本表明,其每周使用因特網(wǎng)的平均時間為6.7小時。如果總體標準差為5.8小時,求該周刊訂閱者總體每周平均花費在因特網(wǎng)上時間的95%置信區(qū)間。則該置信區(qū)間為:5.2.1一個總體均值的區(qū)間估計5、例題分析2/1/2023345、例題分析8.2.1一個總體均值的區(qū)間估計從某證券市場抽取一個由10只股票組成的樣本,其市盈率分別為:

5791014232015326試求該市場全部股票平均市盈率的置信度為95%的置信區(qū)間(假定股票市盈率近似服從正態(tài)分布)。查表總體均值95%置信區(qū)間為:即:2/1/202335n是否為大樣本是否已知是否正態(tài)總體是否已知用S估計用S估計增大樣本容量到30以上是是是是否否否否5.2.1一個總體均值的區(qū)間估計6、小結2/1/2023361)假定條件總體服從二項分布當樣本容量很大時,可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計量z3)總體比例在1-置信水平下的置信區(qū)間為5.2.2一個總體比例(成數(shù))的區(qū)間估計1、一個總體比例(成數(shù))的置信區(qū)間2/1/202337

【例】某城市想要估計職工中女性所占的比例,隨機地抽取了100名職工,其中65人為女性職工。試以95%的置信水平估計該城市職工中女性比例的置信區(qū)間。該城市職工中女性比例的置信區(qū)間為55.65%~74.35%

解:已知n=100,p=65%,1-=95%,z/2=1.965.2.2一個總體比例的區(qū)間估計2、例題分析2/1/2023381)估計一個總體的方差或標準差2)假設總體服從正態(tài)分布3)總體方差

2

的點估計量為S2,且4)總體方差在1-置信水平下的置信區(qū)間為1、一個總體方差的置信區(qū)間5.2.3一個總體方差的區(qū)間估計2/1/202339221-2總體方差1-的置信區(qū)間自由度為n-1的2分布2、一個總體方差置信區(qū)間圖示5.2.3一個總體方差的區(qū)間估計2/1/202340【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,以95%的置信水平建立該種食品重量標準差的置信區(qū)間。25袋食品的重量

112.5101.0103.0102.0100.5102.6107.5

95.0108.8115.6100.0123.5102.0101.6102.2116.6

95.4

97.8108.6105.0136.8102.8101.5

98.4

93.33、例題分析5.2.3一個總體方差的區(qū)間估計2/1/202341解:已知n=25,1-=95%,根據(jù)樣本數(shù)據(jù)計算得

s2=93.21

2置信度為95%的置信區(qū)間為

該種食品總體重量標準差的置信區(qū)間為7.54~13.43g3、例題分析5.2.3一個總體方差的區(qū)間估計2/1/202342一、從某一總體中隨機抽取一個容量為100的樣本,其均值為81,標準差為12。要求:1、構造總體均值95%置信水平下的置信區(qū)間;2、構造總體均值99%置信水平下的置信區(qū)間。二、一個容量為400的隨機樣本取自均值和標準差均未知的總體。已經(jīng)計算出下列值:

=38532要求:1、構造總體均值95.45%置信水平下的置信區(qū)間;2、構造總體均值99.73%置信水平下的置信區(qū)間。

4、區(qū)間估計練習5.2.3一個總體方差的區(qū)間估計█2/1/2023435.3必要抽樣數(shù)目的確定

5.3.1確定樣本容量的意義5.3.2推斷總體均值所需的樣本容量5.3.3推斷總體成數(shù)所需的樣本容量5.3.4必要樣本容量的影響因素2/1/202344樣本容量調(diào)查誤差調(diào)查費用小樣本容量節(jié)省費用但調(diào)查誤差大大樣本容量調(diào)查精度高但費用較大找出在規(guī)定誤差范圍內(nèi)的最小樣本容量找出在限定費用范圍內(nèi)的最大樣本容量5.3.1確定樣本容量的意義2/1/202345確定方法⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。通常未知。一般按以下方法確定其估計值:①過去的經(jīng)驗數(shù)據(jù);②試驗調(diào)查樣本的S。計算結果通常向上進位5.3.2推斷總體均值所需的樣本容量2/1/202346⑵不重復抽樣條件下:確定方法5.3.2推斷總體均值所需的樣本容量2/1/202347【例】某食品廠要檢驗本月生產(chǎn)的10000袋某種產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標準差為25克。要求在95.45﹪的置信水平下,平均每袋重量的誤差范圍不超過5克,應抽查多少袋產(chǎn)品?5.3.2推斷總體均值所需的樣本容量例題分析2/1/2023485.3.2推斷總體均值所需的樣本容量例題分析2/1/202349確定方法⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。計算結果通常向上進位通常未知。一般按以下方法確定其估計值:①過去的經(jīng)驗數(shù)據(jù);②試驗調(diào)查樣本的;③取方差的最大值0.25。5.3.3推斷總體成數(shù)所需的樣本容量2/1/202350⑵不重復抽樣條件下:確定方法5.3.3推斷總體成數(shù)所需的樣本容量2/1/202351【例】某企業(yè)對一批總數(shù)為5000件的產(chǎn)品進行質量檢查,過去幾次同類調(diào)查所得的產(chǎn)品合格率分別為93﹪、95﹪、96﹪,為了使合格率的允許誤差不超過3﹪,在99.73﹪的置信水平下,應抽查多少件產(chǎn)品?【分析】因為共有三個過去的合格率的資料,為保證推斷的把握程度,應選擇其中方差最大者,即P=93﹪。例題分析5.3.3推斷總體成數(shù)所需的樣本容量2/1/202352例題分析5.3.3推斷總體成數(shù)所需的樣本容量2/1/202353總體方差的大??;極限誤差的大?。恢眯潘?;抽樣方法;抽樣的組織方式。重復抽樣條件下:不重復抽樣條件下:5.3.4必要樣本容量的影響因素█2/1/202354一、假設檢驗(HypothesisTesting)問題的提出二、假設檢驗的基本思想三、有關概念四、兩類錯誤與顯著性水平五、檢驗統(tǒng)計量與拒絕域六、利用P值進行決策

七、假設檢驗的步驟5.4假設檢驗的基本問題2/1/202355有許多實際問題,需要通過部分信息量,對某種看法進行判定或估計。

例1、某企業(yè)生產(chǎn)一種零件,以往的資料顯示零件平均長度為4cm,標準差為0.1cm。工藝改革后,抽查100個零件發(fā)現(xiàn)其平均長度為3.94cm。問:工藝改革后零件長度是否發(fā)生了顯著變化?

例2、某廠有一天共生產(chǎn)了2000件產(chǎn)品,按國家標準,次品率不得超過3%才能出廠?,F(xiàn)從該批產(chǎn)品中隨機抽取100件,發(fā)現(xiàn)其中有2件次品,問這批產(chǎn)品能否出廠。

一、假設檢驗(HypothesisTesting)問題的提出2/1/202356例1要判明工藝改革后零件平均長度是否仍為4cm;

例2要判明該批產(chǎn)品的次品率是否低于3%。進行這種判斷的信息來自所抽取的樣本這兩個例子中都是要對某種“陳述”做出判斷:所謂假設檢驗,就是事先對總體參數(shù)或總體分布形式作出一個假設,然后利用樣本信息來判斷原假設是否合理,即判斷樣本信息與原假設是否有顯著差異,從而決定是否拒絕原假設。

假設檢驗分兩類:(1)參數(shù)假設檢驗;(2)非參數(shù)檢驗或自由分布檢驗。一、假設檢驗(HypothesisTesting)問題的提出2/1/202357

通過提出假設,利用“小概率原理”和“概率反證法”,論證假設真?zhèn)蔚囊环N統(tǒng)計分析方法。

1、小概率原理:也就是實際推斷原理,它認為在一次實驗中,概率很小的事件,實際上幾乎是不可能發(fā)生的。

2、概率反證法:如果在其他因素給定的前提下,要證明某一事實(比如對總體參數(shù)的假定)是否成立,首先假設該事實成立,然后在該事實成立的前提下,計算由該事實和樣本構造的統(tǒng)計量的取值,再根據(jù)該統(tǒng)計量的分布,判斷已經(jīng)觀測到的樣本信息出現(xiàn)的概率是否為小概率,以此來證明該事實是否成立。二、假設檢驗的基本思想2/1/202358因此,置信度大小的不同,有可能做出不同的判斷。

3、假設檢驗是基于樣本資料來推斷總體特征的,而這種推斷是在一定概率置信度下進行的,而非嚴格的邏輯證明。在例1中,要判斷工藝改革后零件平均長度是否仍為4cm,可先假設仍為4cm,根據(jù)樣本平均數(shù)的抽樣分布理論,則樣本點應以較大的可能性(置信度)落在以4為中心的某一范圍內(nèi)。二、假設檢驗的基本思想2/1/202359在給定置信度1-下(比如99%):其中:0為所要檢驗的假設(這里為4cm)

為總體標準差(這里為0.1cm)n為樣本容量(這里為100)Z/2為置信度1-下,標準正態(tài)分布對應的右尾臨界值二、假設檢驗的基本思想2/1/202360

如果取置信度為0.99,則顯著性水平=0.01,對應的臨界值為Z/2=2.58

換言之,如果原假設為真,則樣本測算值將以99%的可能性落在[-2.58,2.58]區(qū)間內(nèi)。

通過一組(實際)樣本計算得:說明小概率事件(標準化后的樣本均值只有1%的可能性落在[-2.58,2.58]區(qū)間外)發(fā)生了。

這是不合理的,應拒絕原假設。二、假設檢驗的基本思想2/1/202361(一)原假設(nullhypothesis)研究者想收集證據(jù)予以反對的假設又稱“零假設”總是有符號,或表示為H0H0:

=某一數(shù)值指定為符號=,或例如,H0:

10cm三、有關概念2/1/202362研究者想收集證據(jù)予以支持的假設也稱“研究假設”總是有符號

,

或表示為

H1H1:

<某一數(shù)值,或某一數(shù)值例如,H1:

<10cm,或

10cm(二)備擇假設(alternativehypothesis)三、有關概念2/1/202363原假設和備擇假設是一個完備事件組,而且相互對立在一項假設檢驗中,原假設和備擇假設必有一個成立,而且只有一個成立先確定備擇假設,再確定原假設

含有等號“=”的符號總是放在原假設上因研究目的不同,對同一問題可能提出不同的假設如何提出假設三、有關概念2/1/202364【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發(fā),有關研究人員要通過抽檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試陳述用于檢驗的原假設與備擇假設如何提出假設(例題分析)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設和備擇假設為

H0:

500H1:

<500500g三、有關概念2/1/202365【例】一家研究機構估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設與備擇假設解:研究者想收集證據(jù)予以支持的假設是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設和備擇假設為

H0:π30%H1:π30%如何提出假設(例題分析)三、有關概念2/1/2023661、備擇假設沒有特定的方向性,并含有符號“”的假設檢驗,稱為雙側檢驗或雙尾檢驗(two-tailedtest)

2、備擇假設具有特定的方向性,并含有符號“>”或“<”的假設檢驗,稱為單側檢驗或單尾檢驗(one-tailedtest)備擇假設的方向為“<”,稱為左側檢驗

備擇假設的方向為“>”,稱為右側檢驗

(三)雙側檢驗與單側檢驗三、有關概念2/1/202367注:研究者感興趣的是備擇假設,單側假設的方向是按備側假設的方向來說的。假設雙側檢驗單側檢驗左側檢驗右側檢驗原假設H0:m

=m0H0:m

m0H0:m

m0備擇假設H1:m

≠m0H1:m

<m0H1:m

>m0(三)雙側檢驗與單側檢驗三、有關概念2/1/202368

由于假設檢驗是根據(jù)有限的隨機樣本信息來推斷總體特征,而樣本的隨機性可能致使判斷出錯。

1、第I類錯誤當原假設為真時,而拒絕原假設所犯的錯誤,稱為第I類錯誤或棄真錯誤。易知犯第I類錯誤的概率就是顯著性水平:

2、第II類錯誤當原假設為假時,不拒絕原假設所犯的錯誤,稱為第II類錯誤或采偽錯誤。犯第II類錯誤的概率常用表示:四、假設檢驗中的兩類錯誤與顯著性水平2/1/2023691)犯第I類錯誤與犯第II類錯誤的概率存在此消彼長的關系;

2)若要同時減少與,須增大樣本容量n;

3)通常的作法是,取較小顯著性水平,即控制犯第I類錯誤的概率在較小的范圍內(nèi);

4)在犯第II類錯誤的概率不好控制時,將“接受原假設”更傾向于說成“不拒絕原假設”。注意:四、假設檢驗中的兩類錯誤與顯著性水平2/1/2023703、假設檢驗中的四種可能情況

H0為真H0不真不拒絕H0GoodBad/TypeIIerror

拒絕H0Bad/TypeIerrorGood4、影響錯誤的因素1.顯著性水平當減少時增大2.總體標準差當增大時增大3.樣本容量n當n減少時增大4.總體參數(shù)的真值四、假設檢驗中的兩類錯誤與顯著性水平2/1/2023715、檢驗能力(poweroftest)拒絕一個錯誤的原假設的能力根據(jù)的定義,是指沒有拒絕一個錯誤的原假設的概率。這也就是說,1-

則是指拒絕一個錯誤的原假設的概率,這個概率被稱為檢驗能力,也被稱為檢驗的勢或檢驗的功效(power)可解釋為正確地拒絕一個錯誤的原假設的概率四、假設檢驗中的兩類錯誤與顯著性水平2/1/2023726、顯著性水平(significantlevel)1)是一個概率值2)原假設為真時,拒絕原假設的概率被稱為抽樣分布的拒絕域3)表示為

(alpha)常用的

值有0.01,0.05,0.104)由研究者事先確定四、假設檢驗中的兩類錯誤與顯著性水平2/1/202373significant(顯著的)一詞的意義在這里并不是“重要的”,而是指“非偶然的”在假設檢驗中,如果樣本提供的證據(jù)拒絕原假設,我們說檢驗的結果是顯著的,如果不拒絕原假設,我們則說結果是不顯著的一項檢驗在統(tǒng)計上是“顯著的”,意思是指:這樣的(樣本)結果不是偶然得到的,或者說,不是靠機遇能夠得到的在假設檢驗時,如果拒絕原假設,則稱檢驗結果“在統(tǒng)計上是顯著的”;如果不拒絕原假設,則稱檢驗結果“在統(tǒng)計上是不顯著的”。7、統(tǒng)計顯著性

(significant)四、假設檢驗中的兩類錯誤與顯著性水平2/1/202374五、檢驗統(tǒng)計量與拒絕域1、根據(jù)樣本觀測結果計算得到的,并據(jù)以對原假設和備擇假設作出決策的某個樣本統(tǒng)計量,稱為檢驗統(tǒng)計量2、樣本估計量標準化的依據(jù):①原假設H0為真②點估計量的抽樣分布

3、對于一個總體均值和比例的檢驗,標準化的檢驗統(tǒng)計量可表示為2/1/2023753、顯著性水平和拒絕域(1)

雙側檢驗

H0:m

=m0H1:m

≠m0抽樣分布0臨界值臨界值a/2a/2

樣本統(tǒng)計量拒絕H0拒絕H01-置信水平五、檢驗統(tǒng)計量與拒絕域2/1/2023763、顯著性水平和拒絕域(2)

左側檢驗

H0:m

m0H1:m

<m00臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平五、檢驗統(tǒng)計量與拒絕域2/1/2023773、顯著性水平和拒絕域(3)

右側檢驗

H0:m

m0H1:m

>m00臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平五、檢驗統(tǒng)計量與拒絕域2/1/2023785、總結決策規(guī)則給定顯著性水平,查表得出相應的臨界值z或z/2,t或t/2將檢驗統(tǒng)計量的值與水平的臨界值進行比較作出決策雙側檢驗:I統(tǒng)計量I≥臨界值,拒絕H0左側檢驗:統(tǒng)計量≤臨界值,拒絕H0右側檢驗:統(tǒng)計量≥臨界值,拒絕H0五、檢驗統(tǒng)計量與拒絕域2/1/202379在零假設為真的條件下,檢驗統(tǒng)計量取其計算值或更加極端值(沿著備擇假設的方向)的概率稱為p值(p-value)。反映實際觀測到的數(shù)據(jù)與原假設H0之間不一致的程度也稱為觀察到的(或實測的)顯著性水平?jīng)Q策規(guī)則:若p值≤,拒絕H0六、利用P值進行決策1、P值及決策規(guī)則2/1/202380/

2

/

2

Z拒絕H0拒絕H00臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2P值1/2P值六、利用P值進行決策2、各種檢驗的P值(1)雙側檢驗的P值2/1/2023810臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平計算出的樣本統(tǒng)計量P值六、利用P值進行決策2、各種檢驗的P值(2)左側檢驗的P值2/1/2023820臨界值a拒絕H0抽樣分布1-置信水平計算出的樣本統(tǒng)計量P值六、利用P值進行決策2、各種檢驗的P值(3)右側檢驗的P值2/1/202383有了P值,我們并不需要用5%或1%這類傳統(tǒng)的顯著性水平。P值提供了更多的信息,它讓我們可以選擇任意水平來評估結果是否具有統(tǒng)計上的顯著性,從而可根據(jù)我們的需要來決定是否要拒絕原假設只要你認為這么大的P值就算是顯著了,你就可以在這樣的P值水平上拒絕原假設傳統(tǒng)的顯著性水平,如1%、5%、10%等等,已經(jīng)被人們普遍接受為“有足夠證據(jù)拒絕原假設”的標準,我們大概可以說:10%代表有“一些證據(jù)”不利于原假設;5%代表有“適度證據(jù)”不利于原假設;1%代表有“很強證據(jù)”不利于原假設。六、利用P值進行決策3、固定顯著性水平是否有意義2/1/202384用P值進行檢驗比根據(jù)統(tǒng)計量檢驗提供更多的信息統(tǒng)計量檢驗是我們事先給出的一個顯著性水平,以此為標準進行決策,無法知道實際的顯著性水平究竟是多少比如,根據(jù)統(tǒng)計量進行檢驗時,只要統(tǒng)計量的值落在拒絕域,我們拒絕原假設得出的結論都是一樣的,即結果顯著。但實際上,統(tǒng)計量落在拒絕域不同的地方,實際的顯著性是不同的。比如,統(tǒng)計量落在臨界值附近與落在遠離臨界值的地方,實際的顯著性就有較大差異。而P值給出的是實際算出的顯著水平,它告訴我們實際的顯著性水平是多少。六、利用P值進行決策4、

P值決策與統(tǒng)計量的比較2/1/202385拒絕H0拒絕H0的兩個統(tǒng)計量的不同顯著性Z拒絕H00統(tǒng)計量1

P1

值統(tǒng)計量2

P2

值拒絕H0臨界值六、利用P值進行決策4、

P值決策與統(tǒng)計量的比較2/1/202386

1、提出原假設和備擇假設

原假設(或稱零假設)為正待檢驗的假設:H0

備擇假設(研究假設)為可供選擇的假設:H1

一般地,假設有三種形式:

(1)雙側檢驗:

H0:0;H1:0

(2)左側檢驗:

H0:0;H1:<0

(3)右側檢驗:

H0:≤0;H1:>0

七、假設檢驗的步驟2/1/202387

2、選擇適當?shù)慕y(tǒng)計量,并確定其分布形式

統(tǒng)計量是根據(jù)所涉及的問題而定的,如總體均值、比例可選取正態(tài)分布的Z統(tǒng)計量等。

3、選擇顯著性水平或置信度,確定臨界值

顯著性水平為原假設為真時,樣本點落在臨界值外的概率(即抽樣結果遠離中心點的概率,它為小概率),也是原假設為真時,拒絕原假設所冒的風險。

臨界值將樣本點所落區(qū)域分為拒絕域與非拒絕域,臨界值“外”為拒絕域,“內(nèi)”為非拒絕域。七、假設檢驗的步驟2/1/202388通過樣本計算統(tǒng)計量的具體值,與臨界值比較,根據(jù)是否落入拒絕域來拒絕或不拒絕原假設?!y(tǒng)計量的值落在拒絕域,拒絕H0,否則不拒絕H0—也可以直接利用P值作出決策

4、作出結論2a

2a

a

a

拒絕域

拒絕域

拒絕域

(a)雙側檢驗

(b)左側檢驗

(c)右側檢驗七、假設檢驗的步驟█2/1/2023895.5一個總體參數(shù)的假設檢驗一、一個總體參數(shù)檢驗主要內(nèi)容二、一個總體均值的假設檢驗三、一個總體比例的假設檢驗四、一個總體方差的假設檢驗2/1/202390z檢驗(單尾和雙尾)

t檢驗(單尾和雙尾)z

檢驗(單尾和雙尾)

2檢驗(單尾和雙尾)均值一個總體比例方差一、一個總體參數(shù)檢驗主要內(nèi)容2/1/202391① 假定條件正態(tài)總體或非正態(tài)總體大樣本(n30)②使用z檢驗統(tǒng)計量2

已知:2

未知:二、一個總體均值的假設檢驗1、大樣本的檢驗方法(1)假定條件及檢驗統(tǒng)計量2/1/202392【例】一種罐裝飲料采用自動生產(chǎn)線生產(chǎn),每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質檢人員在某天生產(chǎn)的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平=0.05,檢驗該天生產(chǎn)的飲料容量是否符合標準要求?雙側檢驗綠色健康飲品綠色健康飲品255255二、一個總體均值的假設檢驗1、大樣本的檢驗方法(2)例題分析(2

已知)2/1/202393H0

=255H1

255=0.05,n

=40臨界值(c):檢驗統(tǒng)計量:z01.96-1.960.025拒絕H0拒絕H00.025決策:結論:

不拒絕H0樣本提供的證據(jù)表明:該天生產(chǎn)的飲料符合標準要求

解:作假設二、一個總體均值的假設檢驗1、大樣本的檢驗方法(2)例題分析(2

已知)2/1/202394第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“NORMSDIST”,然后確定第3步:將z的絕對值1.01錄入,得到的函數(shù)值為

0.843752345

P值=2(1-0.843752345)=0.312495

P值遠遠大于,故不拒絕H0二、一個總體均值的假設檢驗1、大樣本的檢驗方法(2)例題分析(用Excel計算正態(tài)分布P值

)2/1/202395【例】一種機床加工的零件尺寸絕對平均誤差允許值為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機抽取50個進行檢驗。利用這些樣本數(shù)據(jù),檢驗新機床加工的零件尺寸的平均誤差與舊機床相比是否有顯著降低?(=0.01)左側檢驗50個零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86二、一個總體均值的假設檢驗1、大樣本的檢驗方法(2)例題分析(2

未知)2/1/202396H0

1.35H1

<1.35=0.01,n

=50臨界值(c):檢驗統(tǒng)計量:

拒絕H0新機床加工的零件尺寸的平均誤差與舊機床相比有顯著降低決策:結論:-2.33z0拒絕H00.01解:作假設左側檢驗二、一個總體均值的假設檢驗1、大樣本的檢驗方法(2)例題分析(2

未知)2/1/202397第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“ZTEST”,然后確定第3步:在所出現(xiàn)的對話框Array框中,輸入原始數(shù)據(jù)所在區(qū)域;在X后輸入?yún)?shù)的某一假定值(這里為1.35);在

Sigma后輸入已知的總體標準差(若總體標準差未知則可忽略不填,系統(tǒng)將自動使用樣本標準差代替)第4步:用1減去得到的函數(shù)值0.995421023

即為P值

P值=1-0.995421023=0.004579

P值<=0.01,拒絕H0二、一個總體均值的假設檢驗1、大樣本的檢驗方法(2)例題分析(用Excel計算正態(tài)分布P值

)2/1/2023980-2.33a=0.05z拒絕H0抽樣分布1-計算出的樣本統(tǒng)計量——-2.6061P值P=0.004579

二、一個總體均值的假設檢驗1、大樣本的檢驗方法(2)例題分析(拒絕域與P值圖示

)2/1/202399【例】某一小麥品種的平均產(chǎn)量為5200kg/hm2

。一家研究機構對小麥品種進行了改良以期提高產(chǎn)量。為檢驗改良后的新品種產(chǎn)量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標準差為120kg/hm2

。試檢驗改良后的新品種產(chǎn)量是否有顯著提高?(=0.05)右側檢驗二、一個總體均值的假設檢驗1、大樣本的檢驗方法(2)例題分析(2

未知)2/1/2023100H0

5200H1

>5200=0.05,n

=36臨界值(c):檢驗統(tǒng)計量:

拒絕H0(P=0.000088<

=0.05)改良后的新品種產(chǎn)量有顯著提高決策:結論:z0拒絕H00.051.645解:作假設右側檢驗二、一個總體均值的假設檢驗1、大樣本的檢驗方法(2)例題分析(2

未知)2/1/2023101P=0.000088

01.645a=0.05拒絕H01-計算出的樣本統(tǒng)計量=3.75P值右側檢驗二、一個總體均值的假設檢驗1、大樣本的檢驗方法(2)例題分析(拒絕域與P值圖示

)抽樣分布2/1/2023102假設雙側檢驗左側檢驗右側檢驗假設形式H0:m=m0H1:

mm0H0:mm0H1:m<m0H0:

m

m0

H1:

m>m0統(tǒng)計量已知:未知:拒絕域P值決策拒絕H0二、一個總體均值的假設檢驗1、大樣本的檢驗方法(3)大樣本檢驗方法小結2/1/20231031. 假定條件總體服從正態(tài)分布小樣本(n<

30)檢驗統(tǒng)計量2

已知:2

未知:二、一個總體均值的假設檢驗2、小樣本的檢驗方法(1)假定條件及檢驗統(tǒng)計量2/1/2023104【例】一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產(chǎn)企業(yè)在購進配件時,通常是經(jīng)過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進。現(xiàn)對一個配件提供商提供的10個零件進行了檢驗。假定該供貨商生產(chǎn)的配件長度服從正態(tài)分布,在0.05的顯著性水平下,檢驗該供貨商提供的配件是否符合要求?10個零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.3樣本二、一個總體均值的假設檢驗2、小樣本的檢驗方法(2)例題分析2/1/2023105H0

=12H1

12=0.05df

=10-1=9臨界值(c):檢驗統(tǒng)計量:

不拒絕H0該供貨商提供的零件符合要求

決策:結論:t02.262-2.2620.025拒絕

H0拒絕H00.025解:二、一個總體均值的假設檢驗2、小樣本的檢驗方法(2)例題分析2/1/2023106第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“TDIST”,然后確定第3步:在出現(xiàn)對話框的X欄中輸入計算出的t的絕對值

0.7053,在Deg-freedom(自由度)欄中輸入本例的自由度9,在Tails欄中輸入2(表明是雙側檢驗,如果是單側檢驗則在該欄輸入1)第4步:P值=0.498469786

P值>=0.05,故不拒絕H0

二、一個總體均值的假設檢驗2、小樣本的檢驗方法(2)例題分析(用Excel計算t分布P值)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論