第四講估計(jì)與檢驗(yàn)_第1頁(yè)
第四講估計(jì)與檢驗(yàn)_第2頁(yè)
第四講估計(jì)與檢驗(yàn)_第3頁(yè)
第四講估計(jì)與檢驗(yàn)_第4頁(yè)
第四講估計(jì)與檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四講估計(jì)與檢驗(yàn)第1頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月一、區(qū)間估計(jì)第2頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月總體均值區(qū)間估計(jì)總體均值置信水平為100(1-α)%的置信區(qū)間為:注意:1、估計(jì)成立的條件是:樣本必須是隨機(jī)、獨(dú)立的;2、使用t分布表時(shí),要求總體必須是近似正態(tài)的,需對(duì)樣本作正態(tài)性檢驗(yàn);3、置信水平不是概率(置信區(qū)間是確定的而不是隨機(jī)的),可以認(rèn)為以置信水平(如95%)相信總體均值在執(zhí)行區(qū)間內(nèi);或是說(shuō),置信水平這一計(jì)算方法可以使得置信區(qū)間以95%的概率覆蓋總體均值。大樣本下:方差未知:或小樣本下第3頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例1某小組隨機(jī)抽樣調(diào)查了250戶家庭的年收入,樣本均值為9.8萬(wàn),樣本標(biāo)準(zhǔn)差為4.8萬(wàn)。小組給出一個(gè)置信區(qū)間(9.2,10.4),但未給出置信水平。1、問(wèn)該區(qū)間的置信水平?(試比較兩種分布的情形)2、小組給出解釋:該地區(qū)家庭平均年收入為9.2~10.4的概率為95%,這種說(shuō)法對(duì)嗎?3、若同時(shí)有10個(gè)小組在進(jìn)行相同的獨(dú)立調(diào)查,問(wèn)9個(gè)或以上小組得出的95%置信區(qū)間都覆蓋總體均值的概率是多少?提示:可以將每一個(gè)區(qū)間是否覆蓋總體均值作為一次Bernoulli試驗(yàn)。令Y為覆蓋總體均值的全金屬區(qū)間數(shù),顯然Y~Bin(10,0.95)第4頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月單側(cè)置信區(qū)間總體均值100(1-α)%的置信區(qū)間:下限為:上限為:第5頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例21、同例1,問(wèn)總體均值95%置信區(qū)間的下限?當(dāng)置信水平提高時(shí),估計(jì)的可靠性將(提高or降低)?精確性將(提高or降低)?第6頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月比例置信區(qū)間若X~Bin(n,p),由中心極限定理傳統(tǒng)方法是以樣本p代替總體p進(jìn)行區(qū)間估計(jì),最近的研究表明,Agresti–Coull區(qū)間有改進(jìn),置信水平為100(1-α)%的置信區(qū)間計(jì)算公式如下:若下限小于0則用0代替,上限大于1則用1代替。第7頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例3:某企業(yè)從所購(gòu)買的元件中隨機(jī)抽檢了150份,有5份不合格,估計(jì)不合格品率95%置信區(qū)間。(試用傳統(tǒng)方法和Agresti–Coull方法分別計(jì)算比較)第8頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月根據(jù)指定精度確定所需樣本數(shù)為獲得總體平均100(1-α)%的置信區(qū)間,且要求區(qū)間寬度不超過(guò)D時(shí),則需從這個(gè)總體中抽取隨機(jī)樣本數(shù)為:總體方差未知的兩階段法:階段1:從總體中抽取n1個(gè)先期樣本(如n1=30),計(jì)算這個(gè)樣本的方差S2;階段2:以S2替代總體未知方差計(jì)算所需樣本數(shù)n,若n>n1,再補(bǔ)抽n–n1

份樣本。另:請(qǐng)同學(xué)們自行計(jì)算確定總體比例所需樣本數(shù)。第9頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例4例1中,若要求所獲得總體均值99%置信區(qū)間的偏差為(+-)0.5萬(wàn)元,問(wèn)至少要調(diào)查多少樣本?例3中,若要求所獲得總體不合格品率99%置信區(qū)間的偏差為(+-)0.5%萬(wàn)元,問(wèn)至少要抽取多少樣本?第10頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月兩個(gè)總體均值之差的置信區(qū)間根據(jù)第三講的知識(shí),請(qǐng)同學(xué)們自行給出大樣本情形下的計(jì)算公式。小樣本不能使用中心極限定理,可以使用t分布,計(jì)算公式:第11頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例5欲比較A、B兩醫(yī)院住院病人的住院天數(shù)。隨機(jī)抽取A醫(yī)院64個(gè)住院病歷,計(jì)算平均住院天數(shù)為6.54天,標(biāo)準(zhǔn)差為1.2;隨機(jī)抽取B醫(yī)院81個(gè)住院病歷,計(jì)算平均住院天數(shù)為6.24天,標(biāo)準(zhǔn)差為0.96。則兩個(gè)醫(yī)院住院病人平均住院天數(shù)差的95%置信區(qū)間是多少?有人認(rèn)為兩個(gè)醫(yī)院病人的住院時(shí)間沒(méi)有差異,與上述數(shù)據(jù)矛盾嗎?為什么?第12頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例6隨機(jī)抽取A、B兩地空氣污染指數(shù)PSI,如下表所示A150146132164126128B9510411299109假設(shè)兩地空氣污染指數(shù)都服從正態(tài)分布,試估計(jì)兩地PSI平均差95%置信區(qū)間。第13頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例7有文獻(xiàn)給出一項(xiàng)對(duì)睡眠習(xí)慣的研究結(jié)果。在一個(gè)由87個(gè)成年人組成的樣本中,每天躺在床上的平均時(shí)間為7.70小時(shí)(不管處于清醒狀態(tài)還是睡眠狀態(tài)),標(biāo)準(zhǔn)差為1.02小時(shí),其中處于睡眠狀態(tài)的平均時(shí)間為7.06小時(shí),標(biāo)準(zhǔn)差為1.11小時(shí)。所以躺在床上的平均清醒時(shí)間為7.70-7.06=0.64小時(shí)。有可能建立平均清醒時(shí)間95%的置信區(qū)間嗎?如果行,是多少?如不行,為什么?第14頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例8:數(shù)據(jù)對(duì)的置信區(qū)間某輪胎制造商希望比較新、舊材料制成的輪胎的磨損情況。從每種輪胎中各選一個(gè)隨機(jī)安裝在10輛前驅(qū)汽車左、右前輪上。4萬(wàn)公里后測(cè)量磨損情況如下(單位:mm):12345678910新材料4.355.004.215.035.714.614.706.033.804.70舊材料4.194.624.044.725.524.264.276.243.464.50差值0.160.380.170.310.190.350.43-0.210.340.2問(wèn)新、舊材料輪胎磨損差值95%的置信區(qū)間。第15頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月兩個(gè)總體比例之差的置信區(qū)間若X~Bin(nx,px),Y~Bin(ny,py),則px-py

置信水平為100(1-α)%的置信區(qū)間的計(jì)算方法為:傳統(tǒng)方法:改進(jìn)方法:第16頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例9重復(fù)交易次數(shù)是顧客滿意度的一個(gè)很好的度量。某企業(yè)隨機(jī)抽取了今年的120個(gè)交易賬戶,有56個(gè)訂購(gòu)次數(shù)在2次以上。從去年抽取80個(gè)樣本,有30個(gè)訂購(gòu)次數(shù)在2次以上。試計(jì)算這兩年中訂購(gòu)次數(shù)在2次以上顧客的比例之差的置信水平為95%的置信區(qū)間。第17頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月二、假設(shè)檢驗(yàn)第18頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月問(wèn)題1某校新入學(xué)學(xué)生被隨機(jī)分配進(jìn)入高一兩個(gè)班,人數(shù)都是70人,化學(xué)課分別由2個(gè)老師任教。期末考試的平均分分別是70.5和72.4分,標(biāo)準(zhǔn)差都為5.4分。其中第一個(gè)班有一個(gè)學(xué)生想找第2個(gè)班的老師補(bǔ)課,他的選擇有道理嗎?第19頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月分析每一次考試都包含很多隨機(jī)因素;老師1可以認(rèn)為自己的教學(xué)水平(以學(xué)生考試平均分來(lái)測(cè)量)為72.4分;老師1可以認(rèn)為老師2的教學(xué)水平其實(shí)和自己是一樣的,這次考試的結(jié)果是因?yàn)樽约喊嗉?jí)發(fā)揮不好而對(duì)方班級(jí)發(fā)揮的好。對(duì)于這種具有隨機(jī)性的結(jié)果的證明只能尋求統(tǒng)計(jì)意義上的檢驗(yàn)。第20頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月統(tǒng)計(jì)檢驗(yàn)檢驗(yàn)1:老師1的教學(xué)水平達(dá)不到72.4。零假設(shè)(nullhypothesis,也稱原假設(shè))H0:

1≥72.4,備擇假設(shè)(alternatehypothesis)

H1:

1<72.4。檢驗(yàn)2:老師1與老師2的教學(xué)水平有差異。零假設(shè)H0:

1

-

2=0,備擇假設(shè)H1:

1–

2

≠0。第21頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月假設(shè)檢驗(yàn)的概念假設(shè):對(duì)總體參數(shù)包括總體均值、比例、方差等的一種看法。假設(shè)檢驗(yàn):事先對(duì)總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來(lái)判斷原假設(shè)是否成立。通常依據(jù)統(tǒng)計(jì)上的小概率不顯著原理而對(duì)0假設(shè)作反證。0假設(shè):待檢驗(yàn)的假設(shè),表示為H0備擇假設(shè):與0假設(shè)對(duì)立的假設(shè)表示為H1第22頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月假設(shè)檢驗(yàn)思想示例圖因此我們拒絕假設(shè)

=50樣本均值抽樣分布這個(gè)值不像我們應(yīng)該得到的樣本均值20H0如果這是總體的真實(shí)均值

μ=50第23頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月P-值(P-Value)首先我們假設(shè)0假設(shè)成立,P-值是觀測(cè)到的隨機(jī)樣本與0假設(shè)不一致的強(qiáng)度的度量。計(jì)算步驟(以均值檢驗(yàn)為例):在0假設(shè)H0為真的條件下,求樣本均值的分布,這個(gè)分布稱為的0分布;在0假設(shè)為真的條件下,計(jì)算觀察值與H0不一致(大于、小于或不等于)的概率即為P-值。當(dāng)P-值充分?。ㄈ?/p>

),我們就放棄H0,而認(rèn)為H1成立。判斷閾值

稱為顯著水平(significantlevel),當(dāng)P<,此時(shí)我們稱在顯著水平

下拒絕原假設(shè)。第24頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月總體均值統(tǒng)計(jì)檢驗(yàn)對(duì)總體和樣本的假設(shè)同前。對(duì)形如H0:

0,或H0:

0,或H0:

=

0的0假設(shè)進(jìn)行檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量為:P-值就是對(duì)應(yīng)分布密度曲線下某一區(qū)域的面積,分別對(duì)應(yīng)的是單尾檢驗(yàn)(右側(cè)面積),單尾檢驗(yàn)(左側(cè)面積),雙尾檢驗(yàn)(雙側(cè)面積)。大樣本下:方差未知:或小樣本下第25頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月總體比例的統(tǒng)計(jì)檢驗(yàn)對(duì)總體和樣本的假設(shè)同前。對(duì)形如H0:p

p0,或H0:p

≥p0

,或H0:p

=p0

的0假設(shè)進(jìn)行檢驗(yàn),若np0和n(1-p0)都大于10,則有檢驗(yàn)統(tǒng)計(jì)量為:P-值計(jì)算同上。第26頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例10某有線電視服務(wù)商在免費(fèi)提供了一個(gè)月的某付費(fèi)頻道后進(jìn)行了調(diào)查。他們隨機(jī)抽取了400個(gè)家庭組成樣本,其中25個(gè)家庭愿意付費(fèi)續(xù)訂該頻道。該公司能夠得出結(jié)論認(rèn)為該地區(qū)有超過(guò)5%的家庭愿意付費(fèi)觀看該頻道嗎?第27頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月兩個(gè)總體均值差的檢驗(yàn)對(duì)總體和樣本的假設(shè)同前。對(duì)形如H0:

X-Y

≤D0

,或H0:

X-Y≥D0

,或

H0:

X-Y=D0

的0假設(shè)進(jìn)行檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量為:大樣本下:方差未知:或小樣本下或當(dāng)兩總體方差近似相等時(shí),可以采用合并樣本方差的方法:第28頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月續(xù)P-值計(jì)算同上。第29頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月兩個(gè)總體比例差的檢驗(yàn)設(shè)X~Bin(nx,px)和Y~Bin(ny,py)相互獨(dú)立且nx和ny都很大。對(duì)形如H0:pX-pY

≤0,或H0:pX-pY≥0,或

H0:pX-pY=0

的0假設(shè)進(jìn)行檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量為:P-值計(jì)算同上。第30頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例11為確定某燃油添加劑是否具有節(jié)油的功能,某司機(jī)記錄了自己的油耗。6箱油的平均油耗為7.4升/百公里,標(biāo)準(zhǔn)差為0.63;使用添加劑后的4箱油平均油耗為7.0升/百公里,標(biāo)準(zhǔn)差為0.75。添加劑價(jià)格為200元,問(wèn)是否有必要使用該添加劑?此外,該實(shí)驗(yàn)是否存在瑕疵?第31頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月例12某課題組調(diào)查企業(yè)項(xiàng)目風(fēng)險(xiǎn)管理的方法。45個(gè)建筑企業(yè)樣本中有17家企業(yè)采用了風(fēng)險(xiǎn)轉(zhuǎn)移的方法,38個(gè)IT類企業(yè)中有16家企業(yè)采用了風(fēng)險(xiǎn)轉(zhuǎn)移的方法。你能認(rèn)為IT企業(yè)風(fēng)險(xiǎn)轉(zhuǎn)移比例高于建筑企業(yè)嗎?第32頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月關(guān)于P-值P-值不能證明0假設(shè)的真實(shí)性;(科學(xué)方法本質(zhì)上是否定虛假)例:某建筑工程師要為橋墩混凝土選定水泥,其抗壓強(qiáng)度必須大于

0

,在對(duì)某一品牌水泥進(jìn)行多次試驗(yàn)后測(cè)度平均值和方差,然后進(jìn)行假設(shè)檢驗(yàn)。若他采用的假設(shè)檢驗(yàn)為:H0:

0,H1:

<

0

,計(jì)算得到P-值為0.168,他能否采用這一品牌水泥?P-值顯著也不一定有現(xiàn)實(shí)的意義。例:調(diào)查2X200個(gè)某一學(xué)校兩個(gè)專業(yè)學(xué)生畢業(yè)一年后平均月工資分別為1587元和1590元,方差都為100,這兩個(gè)專業(yè)的畢業(yè)生工資差異顯著嗎?這種差異有實(shí)際意義嗎?第33頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月關(guān)于顯著性水平a的值在固定的a水平下所作判斷可能導(dǎo)致兩類錯(cuò)誤:第I類錯(cuò)誤H0為真時(shí)拒絕了H0第II類錯(cuò)誤H0為假時(shí)接受了H0犯第I類錯(cuò)誤的概率不會(huì)大于a。通常我們選取a足夠小,但我們也希望確定第II類錯(cuò)誤是可控的,于是定義功效(Power)如下:功效=1-P(第II類錯(cuò)誤)功效需在采樣之前確定。第34頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月多項(xiàng)分布與c2檢驗(yàn)頻數(shù)分析以下資料是從某工廠搜集而來(lái)的缺勤數(shù)。在0.05的顯著水平之下,試判定一周內(nèi)每天的缺勤率是否有差異。星期次數(shù)期望星期一12089星期二

4589星期三

6089星期四

9089星期五13089合計(jì)445445第35頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月檢驗(yàn)H0:p1=p2=……p5=1/5,當(dāng)各單元格的期望次數(shù)﹙或理論次數(shù)﹚不小于5時(shí),在0假設(shè)下有統(tǒng)計(jì)量其中:Oi為觀察值,Ei為期望值第36頁(yè),課件共41頁(yè),創(chuàng)作于2023年2月列聯(lián)表(contingencytab

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論