版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)、模型與決策第四部分檢驗(yàn)問題數(shù)據(jù)挖掘
大量的甚至“海量般”的觀察數(shù)據(jù)呈現(xiàn)在我們面前。這些數(shù)據(jù)中有著大量有用的信息。把這些有用的信息挖掘出來的工作至關(guān)重要。礦石里含有很多的雜質(zhì),剔除了雜質(zhì)才能把礦提煉出來。雜亂無章的原始數(shù)據(jù)中既包含著有用的信息,也包含著無用的,甚至誤導(dǎo)我們的信息。識(shí)別并剔除或校正這些無用的、甚至誤導(dǎo)我們的信息的工作至關(guān)重要。格朗特及其《觀察》
格朗特(1620–1674)NaturalandPolitical服裝店主ObservationsMadeupon英國(guó)皇家學(xué)會(huì)會(huì)員theBillsofMortality,1662關(guān)于死亡表的自然觀察與政治觀察,簡(jiǎn)稱觀察。格朗特的《觀察》《關(guān)于死亡表的自然觀察與政治觀察,簡(jiǎn)稱觀察》有12章,8個(gè)表。
數(shù)據(jù)資料:自1604年起倫敦教會(huì)每周一本“死亡公報(bào)”。公報(bào)記錄了一周內(nèi)死亡和出生者的名單。死者按81種死因(內(nèi)含63種病因)分類。公報(bào)中男女和不同地區(qū)分開統(tǒng)計(jì)。
格郎特開創(chuàng)性地分析了3000多期公報(bào)。格朗特的開創(chuàng)性工作格朗特做了前人沒有想到,沒有做的事。格朗特做的這件事對(duì)學(xué)術(shù)發(fā)展有重大影響,在應(yīng)用上有重大意義。
1997年當(dāng)代統(tǒng)計(jì)學(xué)家休伯畫了一條螺旋線,表示統(tǒng)計(jì)的發(fā)展歷程。螺旋線的起點(diǎn)就是格朗特,由他開始向外擴(kuò)展,按時(shí)間先后次序一一列舉了對(duì)統(tǒng)計(jì)發(fā)展作出貢獻(xiàn)的統(tǒng)計(jì)學(xué)家。格朗特的《觀察》關(guān)于
出生與死亡的一些結(jié)論新生兒的男女性別比為14∕13。新生男嬰的比例為0.5185,新生女嬰的比例為0.4815。出生100個(gè)女孩,平均來說出生107.108個(gè)男孩;在各年齡組男性死亡率皆高于女性;新生兒和大城市的死亡率較高;一般疾病和事故的死亡率較穩(wěn)定;傳染病的死亡率波動(dòng)較大;性別比
新生兒的性別比為107到108(出生100個(gè)女嬰,平均來說出生107到108個(gè)男嬰);如果只經(jīng)過為數(shù)不多的觀察,我們是得不出“新生兒的男女性別比為14∕13”這個(gè)規(guī)律的;只有經(jīng)過很多次的觀察,才能看到這樣的一個(gè)規(guī)律。這就是統(tǒng)計(jì)學(xué)的“大數(shù)法則”。
正常情況:1)新生男嬰的比例為2)新生女嬰的比例為某城市當(dāng)年有10萬個(gè)新生嬰兒,其中女嬰4.75萬,比例為0.475,低于正常比例0.4815。很可能有人說,當(dāng)年生男生女沒有人為因素的干涉,新生女嬰的比例僅較正常比例小了0.0065,看來這是偶然偏低,不足為怪。當(dāng)年新生女嬰的出生比例究竟是正常,還是超乎尋常的低?統(tǒng)計(jì)檢驗(yàn)問題——“反證法”當(dāng)年新生女嬰的比例究竟是正常,還是超乎尋常的低?這一類問題就是所謂的統(tǒng)計(jì)檢驗(yàn)問題。檢驗(yàn)問題的解決方法有點(diǎn)類似于大家熟悉的“反證法”。數(shù)學(xué)問題的反證法,是在假設(shè)條件下尋找矛盾(不可能發(fā)生的事情),反過來說明假設(shè)不會(huì)成立。統(tǒng)計(jì)檢驗(yàn)問題使用的反證法是在假設(shè)條件下尋找?guī)缀趺?幾乎不大可能發(fā)生的事情),反過來懷疑假設(shè)成立。小概率事件
通常稱幾乎不大可能發(fā)生的事為小概率事件。小概率事件并不是不可能發(fā)生,只是發(fā)生的可能性比較小。必須指出的是,有的時(shí)候有些場(chǎng)合,尤其是長(zhǎng)時(shí)間的實(shí)踐,應(yīng)認(rèn)為小概率事件還是有可能發(fā)生的,而且它一定會(huì)發(fā)生。這就是所謂的墨菲定律。會(huì)出錯(cuò)的,終將出錯(cuò)
工程師墨菲曾參加美國(guó)空軍1949年的一項(xiàng)實(shí)驗(yàn),需要將16個(gè)火箭加速度計(jì)懸空裝在受試者的上方。支架上固定火箭加速度計(jì)的有兩個(gè)位置。按實(shí)驗(yàn)要求,其中的一個(gè)位置是正確的,而另一個(gè)是錯(cuò)誤的。不可思議的是,竟然有人有條不紊地將16個(gè)火箭加速度計(jì)全部安裝在錯(cuò)誤的位置。于是墨菲說,如果有兩種選擇,其中的一種將導(dǎo)致災(zāi)難,則必定有人會(huì)選擇它。后來墨菲的這一句話演變?yōu)槿藗兪熘倪@樣一句話:“會(huì)出錯(cuò)的,終將出錯(cuò)”。墨菲定律
“會(huì)出錯(cuò)的,終將出錯(cuò)”。這一句話,不同的人,不同的場(chǎng)合,有不同的含意。對(duì)于使用電腦的人來說,重要的資料應(yīng)做好備份。這是因?yàn)樵俸玫碾娔X也有可能出問題。人,尤其是老年人要把重要的事情用筆記下來。記性再好的人也可能會(huì)忘事。常規(guī)的肺炎,大多是左心衰竭導(dǎo)致死亡
觀察到的情況:連續(xù)3位患兒都因右心衰竭而死。圖
經(jīng)估算:倘若是常規(guī)的肺炎,連續(xù)3位患兒都因右心衰竭而死的可能性非常小。判斷:懷疑他們患的不是常規(guī)的肺炎,而是手足口病。劉曉琳醫(yī)生的推斷過程
劉曉琳醫(yī)生的推斷過程的改進(jìn)圖
經(jīng)估算:倘若是常規(guī)的肺炎,連續(xù)3位、4位和更多位患兒都因右心衰竭而死的概率非常小。判斷:懷疑他們患的不是常規(guī)的肺炎,而是手足口病。推斷原則:在連續(xù)有比較多的患兒都因右心衰竭而死時(shí),才說他們患的不是常規(guī)的肺炎。觀察到的情況:連續(xù)3位患兒都因右心衰竭而死。新生女嬰的比例究竟是正常,還是超乎尋常的低?圖
經(jīng)計(jì)算:倘若女嬰出生比例正常,等于0.4815,10萬個(gè)新生嬰兒中有4.75萬和更少個(gè)女嬰的可能性等于???。判斷:???推斷原則:新生的10萬個(gè)女嬰中女嬰很少的時(shí)候,才認(rèn)為新生女嬰的比例超乎尋常的低。觀察到的情況:10萬個(gè)新生嬰兒中有4.75萬個(gè)女嬰用反證法解統(tǒng)計(jì)檢驗(yàn)問題的關(guān)鍵
——計(jì)算概率在這一年女嬰出生的比例正常,等于公認(rèn)的0.4815的時(shí)候,計(jì)算該城市這一年10萬新生嬰兒中女嬰的人數(shù)等于小于4.75萬的概率。倘若這一年女嬰出生的比例等于0.4815,那么這一年新生女嬰的人數(shù)應(yīng)該是二項(xiàng)分布。從而使用Excel,輸入“=binomdist(47500,100000,0.4815,1)”就可算得,倘若這一年女嬰出生的比例正常,10萬個(gè)新生嬰兒中有4.75萬和更少個(gè)女嬰的可能性僅等于0.0000197。新生女嬰的比例究竟是正常,還是超乎尋常的低?圖
經(jīng)計(jì)算:倘若女嬰出生比例正常,等于0.4815,10萬個(gè)新生嬰兒中有4.75萬和更少個(gè)女嬰的可能性僅等于0.0000197,低于10萬分之2。判斷:可能性如此的小,這說明在女嬰出生比例正常時(shí),有4.75萬個(gè)女嬰出生是幾乎不可能發(fā)生的事。因而認(rèn)為這一年女嬰出生比例超乎尋常的低。推斷原則:新生的10萬個(gè)女嬰中女嬰很少的時(shí)候,才認(rèn)為新生女嬰的比例超乎尋常的低。觀察到的情況:10萬個(gè)新生嬰兒中有4.75萬個(gè)女嬰檢驗(yàn)問題——兩個(gè)假設(shè)
檢驗(yàn)患兒患的是否是常規(guī)的肺炎;檢驗(yàn)女嬰出生比例是否超乎尋常的低;檢驗(yàn)額定標(biāo)準(zhǔn)為每袋凈重0.5公斤的袋裝葡萄糖的平均糖重是否是0.5公斤;檢驗(yàn)治療心血管病的藥是否損傷腎功能;檢驗(yàn)吸煙是否危害人體健康。這些檢驗(yàn)問題都有互相對(duì)立的兩個(gè)假設(shè)。“有罪推定”與“無罪推定”
審訊嫌疑人時(shí)有兩個(gè)假設(shè):“嫌疑人有罪”和“嫌疑人無罪”。有罪推定將“嫌疑人有罪”作為原假設(shè),即首先認(rèn)為嫌疑人有罪,然后尋找證據(jù)證明他無罪。倘若有充分、確鑿、有效的證據(jù)證明嫌疑人無罪,則認(rèn)為他無罪。反之,倘若沒有充分、確鑿、有效的證據(jù)證明嫌疑人無罪,則認(rèn)為他有罪。無罪推定將“嫌疑人無罪”作為原假設(shè),即首先認(rèn)為嫌疑人無罪,然后尋找證據(jù)證明他有罪。倘若有充分、確鑿、有效的證據(jù)證明犯罪嫌疑人有罪,則認(rèn)為他有罪。反之,則認(rèn)為他無罪。“有罪推定”與“無罪推定”
有罪推定論保護(hù)(也就是不輕易否定)“嫌疑人有罪”的假設(shè)。這意味著有罪推定論不輕易說嫌疑人無罪。寧枉勿縱。無罪推定論保護(hù)(也就是不輕易否定)“嫌疑人無罪”的假設(shè)。這意味著無罪推定論不輕易說嫌疑人有罪。寧縱勿枉。檢驗(yàn)問題:原假設(shè)和備擇假設(shè)原假設(shè):不輕易否定的假設(shè),也就是說有了充分、確鑿、有效的證據(jù)后才能拒絕的假設(shè)。原假設(shè)記為備擇假設(shè):不輕易肯定的假設(shè),也就是說有了充分、確鑿、有效的證據(jù)后才能接受的假設(shè)。備擇假設(shè)記為
“有罪推定”與“無罪推定”
有罪推定論:原假設(shè):嫌疑人有罪;備擇假設(shè):嫌疑人無罪。無罪推定論:原假設(shè):嫌疑人無罪;備擇假設(shè):嫌疑人有罪。原假設(shè)和備擇假設(shè)女嬰出生比例是否超乎尋常低的檢驗(yàn)問題原假設(shè):女嬰出生比例正常;備擇假設(shè):女嬰出生比例超乎尋常的低。額定標(biāo)準(zhǔn)為每袋凈重0.5公斤的袋裝葡萄糖的平均糖重是否有0.5公斤的檢驗(yàn)問題原假設(shè):平均糖重0.5公斤;備擇假設(shè):平均糖重不是0.5公斤。
無罪推定原假設(shè)和備擇假設(shè)檢驗(yàn)治療心血管病的藥是否損傷腎功能原假設(shè):藥損傷腎功能;備擇假設(shè):藥沒有損傷腎功能。有罪推定吸煙是否危害人體健康的檢驗(yàn)問題原假設(shè):吸煙無害;備擇假設(shè):吸煙有害。
無罪推定實(shí)際問題中確定
原假設(shè)與備擇假設(shè)的通常方法首先確定備擇假設(shè)。將有了充分、確鑿、有效的證據(jù)后才認(rèn)為它正確的假設(shè)確定為備擇假設(shè);然后將備擇假設(shè)的對(duì)立假設(shè)確定為原假設(shè)。檢驗(yàn)法則檢驗(yàn)問題:女嬰出生比例是否低了?原假設(shè):女嬰出生比例p=0.4815;備擇假設(shè):女嬰出生比例p<0.4815。檢驗(yàn)法則:在新生女嬰比較少的時(shí)候拒絕原假設(shè),認(rèn)為新生女嬰的比例p<0.4815。“什么時(shí)候拒絕原假設(shè)”稱為是檢驗(yàn)法則
確定檢驗(yàn)法則是解統(tǒng)計(jì)檢驗(yàn)問題的第一個(gè)關(guān)鍵。p值—概率(probability)值
“計(jì)算什么樣的概率”,是解統(tǒng)計(jì)檢驗(yàn)問題的第二個(gè)關(guān)鍵。檢驗(yàn)法則:在新生女嬰很少的時(shí)候認(rèn)為女嬰出生比例低于0.4815觀察到的數(shù)據(jù):當(dāng)年10萬個(gè)新生嬰兒中有4.75萬個(gè)女嬰。在女嬰出生比例等于0.4815時(shí),計(jì)算10萬個(gè)新生嬰兒中有4.75萬和更少個(gè)女嬰的的概率。p值
“計(jì)算p值”,是解統(tǒng)計(jì)檢驗(yàn)問題的第二個(gè)關(guān)鍵。若p值比較小,這意味著在原假設(shè)成立時(shí)觀察到的這件事基本上是不大可能發(fā)生的,則就有了充分、確鑿、有效的證據(jù)拒絕原假設(shè),從而認(rèn)為備擇假設(shè)是正確的。若p值不小,則意味著還沒有找到充分、確鑿、有效的證據(jù),因而不能拒絕原假設(shè),只得認(rèn)為原假設(shè)是正確的。檢驗(yàn)的水平
若p值不比0.01大,則說p值很小。我們?cè)谒较?高度顯著地)拒絕原假設(shè);若p值比0.01大,但不比0.05大,則說p值比較小。我們?cè)谒较?顯著地)拒絕原假設(shè),但在水平下不能(高度顯著地)拒絕原假設(shè)。若p值比0.05大,則說p值不小,這說明沒有充分、確鑿、有效的證據(jù)認(rèn)為備擇假設(shè)是正確的,我們?cè)谒较虏荒芫芙^原假設(shè),只得認(rèn)為原假設(shè)是正確的。假設(shè)檢驗(yàn)問題的4個(gè)步驟1)建立原假設(shè)
和備擇假設(shè)
。2)確定檢驗(yàn)法則。3)計(jì)算p值。4)①
p值
,則在水平
下高度顯著地拒絕原假設(shè);②
p值
,則不能在水平
下高度顯著地拒絕原假設(shè),能在水平
下顯著地拒絕原假設(shè);③
p值
,則不能拒絕原假設(shè)。
犯第一、第二類錯(cuò)誤的概率分別為
在檢驗(yàn)問題中,犯“棄真”和“取偽”兩類錯(cuò)誤都總是不可避免的。一個(gè)好的檢驗(yàn)方法,應(yīng)該是使檢驗(yàn)結(jié)果犯這兩類錯(cuò)誤的概率都盡量地小。但當(dāng)樣本容量一定時(shí),若減少犯某類錯(cuò)誤的概率,則犯另一類錯(cuò)誤的概率往往增大。若要使犯兩類錯(cuò)誤的概率都減少,只能增加樣本容量。比例的檢驗(yàn)問題—第1種類型
女嬰出生比例(proportion)p是否超乎尋常低的檢驗(yàn)問題原假設(shè):,女嬰出生比例正常;備擇假設(shè):,女嬰出生比例超乎尋常的低。
檢驗(yàn)法則:在新生女嬰比較少的時(shí)候拒絕原假設(shè),認(rèn)為新生女嬰的比例p超乎尋常的低。產(chǎn)品是否合格?
某個(gè)產(chǎn)品的質(zhì)量標(biāo)準(zhǔn):不合格品的比例不超過1%。隨機(jī)檢驗(yàn)100個(gè)產(chǎn)品,倘若其中沒有發(fā)現(xiàn)不合格品,或僅發(fā)現(xiàn)1個(gè)不合格品,可想而知質(zhì)量檢驗(yàn)員肯定認(rèn)為產(chǎn)品合格。倘若發(fā)現(xiàn)2個(gè)不合格品那應(yīng)如何判斷?依據(jù)估計(jì)方法,不合格率的估計(jì)為2%,超過了所允許的不合格率的上限1%??紤]到估計(jì)有誤差,因而絕不能就此就說產(chǎn)品不合格。產(chǎn)品很可能是合格的,僅僅是由于隨機(jī)因素的影響,樣本比例偶然偏高了。產(chǎn)品是否合格?
某個(gè)產(chǎn)品的質(zhì)量標(biāo)準(zhǔn):不合格品的比例不超過1%。在隨機(jī)檢驗(yàn)的100個(gè)產(chǎn)品中倘若發(fā)現(xiàn)了2個(gè)不合格品,則判斷產(chǎn)品是否合格的問題,顯然是下面這樣一個(gè)統(tǒng)計(jì)檢驗(yàn)問題::產(chǎn)品不合格率:
比例的檢驗(yàn)問題——第2種類型
產(chǎn)品是否合格的檢驗(yàn)問題原假設(shè):,產(chǎn)品合格;備擇假設(shè):,產(chǎn)品不合格。這個(gè)檢驗(yàn)問題相當(dāng)于
:
:
檢驗(yàn)法則:不合格品比較多的時(shí)候拒絕原假設(shè),認(rèn)為產(chǎn)品不合格。比例的檢驗(yàn)——單邊拒絕
—總體中具有某種特性的個(gè)體所占的比例(proportion)。從總體中隨機(jī)抽取個(gè)個(gè)體,假設(shè)其中有個(gè)個(gè)體具有這種特性。單邊拒絕檢驗(yàn)問題的第1種類型①
::②
::?jiǎn)芜吘芙^檢驗(yàn)問題的第2種類型①
::②
::比例的檢驗(yàn)——單邊拒絕(1)
單邊拒絕檢驗(yàn)問題的第1種類型①
:,:②
:,:隨機(jī)抽取個(gè)個(gè)體,假設(shè)其中有個(gè)個(gè)體具有這種特性。在比較小的時(shí)候拒絕,認(rèn)為。檢驗(yàn)的p值(概率(probability)值)等于個(gè)個(gè)體中有和更少個(gè)個(gè)體具有這種特性的概率輸入“”比例的檢驗(yàn)——單邊拒絕(2)
單邊拒絕檢驗(yàn)問題的第2種類型①
::②
::隨機(jī)抽取個(gè)個(gè)體,假設(shè)其中有個(gè)個(gè)體具有這種特性。在比較大的時(shí)候拒絕,認(rèn)為。檢驗(yàn)的p值(概率(probability)值)等于個(gè)個(gè)體中有和更多個(gè)個(gè)體具有這種特性的概率。輸入“”
產(chǎn)品是否合格?
產(chǎn)品是否合格的檢驗(yàn)問題原假設(shè):,產(chǎn)品合格;備擇假設(shè):
,產(chǎn)品不合格。在隨機(jī)檢驗(yàn)的100個(gè)產(chǎn)品中倘若發(fā)現(xiàn)了2個(gè)不合格品。檢驗(yàn)p
值:在時(shí),100個(gè)產(chǎn)品中有2和更多個(gè)不合格品的概率。
輸入“=1-binomdist(1,100,0.01,1)”p值。判斷:產(chǎn)品合格。產(chǎn)品合格與否的檢驗(yàn)問題的檢驗(yàn)過程圖
經(jīng)計(jì)算:在產(chǎn)品合格,不合格率p達(dá)到上限0.01時(shí),100個(gè)產(chǎn)品中有2個(gè)和更多個(gè)不合格品的概率,也就是檢驗(yàn)的p值等于26.42%。p值大于0.05,這說明在產(chǎn)品合格時(shí),檢驗(yàn)100個(gè)產(chǎn)品,有可能發(fā)現(xiàn)2個(gè)和更多個(gè)不合格品。因而不能認(rèn)為產(chǎn)品不合格。故判斷產(chǎn)品合格。檢驗(yàn),觀察到的情況:100個(gè)產(chǎn)品中有2個(gè)不合格品。檢驗(yàn)法則:在檢驗(yàn)的100個(gè)產(chǎn)品中,如果發(fā)現(xiàn)比較多的不合格品,則認(rèn)為,產(chǎn)品不合格。為什么判斷產(chǎn)品合格?
既然p值是在產(chǎn)品合格,時(shí),100個(gè)產(chǎn)品中有2和更多個(gè)不合格品的概率,所以在隨機(jī)檢驗(yàn)的100個(gè)產(chǎn)品中發(fā)現(xiàn)了2個(gè)不合格品的時(shí)候,倘若認(rèn)為,判斷產(chǎn)品不合格,則犯錯(cuò)誤的概率就等于26.42%。顯然,人們是不愿意冒這么大的風(fēng)險(xiǎn)作出“產(chǎn)品不合格”的判斷。p值告訴我們倘若根據(jù)現(xiàn)有的樣本觀察值拒絕原假設(shè),則在原假設(shè)成立時(shí)我們承受的風(fēng)險(xiǎn),犯錯(cuò)誤的概率就如p值那么大。水平(或0.01)意味著在原假設(shè)成立時(shí)我們?nèi)艟芙^原假設(shè),則承受的風(fēng)險(xiǎn),犯錯(cuò)誤的概率不會(huì)比(或0.01)大。
新生女嬰的比例究竟是正常,還是超乎尋常的低?圖
經(jīng)計(jì)算:倘若女嬰出生比例正常,等于0.4815,10萬個(gè)新生嬰兒中有4.75萬和更少個(gè)女嬰的可能性僅等于0.0000197,低于10萬分之2??赡苄匀绱说男?,這說明在女嬰出生比例正常時(shí),有4.75萬個(gè)女嬰出生是幾乎不可能發(fā)生的事。因而認(rèn)為這一年女嬰出生比例超乎尋常的低。這樣一個(gè)判斷有0.0000197的可能性出錯(cuò)。人們顯然愿意冒如此小的風(fēng)險(xiǎn),判斷這一年女嬰出生比例超乎尋常的低。推斷原則:新生的10萬個(gè)女嬰中女嬰很少的時(shí)候,才認(rèn)為新生女嬰的比例超乎尋常的低。觀察到的情況:10萬個(gè)新生嬰兒中有4.75萬個(gè)女嬰比例的檢驗(yàn)——第3種類型
拋擲圖釘,“釘尖朝上”的概率是否等于0.65的檢驗(yàn)問題原假設(shè):;備擇假設(shè):。檢驗(yàn)法則:在拋擲顆圖釘中,如果釘尖朝上的圖釘比較多或比較少則拒絕原假設(shè),認(rèn)為釘尖朝上出現(xiàn)的概率。拋擲103顆圖釘,倘若釘尖朝上63顆,則該如何判斷,“釘尖朝上”的概率是否等于0.65。比例的檢驗(yàn)——雙邊拒絕
—總體中具有某種特性的個(gè)體所占的比例(proportion)。從總體中隨機(jī)抽取個(gè)個(gè)體,假設(shè)其中有個(gè)個(gè)體具有這種特性。雙邊拒絕檢驗(yàn)問題
::檢驗(yàn)法則:在比較小或比較大的時(shí)候拒絕原假設(shè),認(rèn)為。
比例的檢驗(yàn)——雙邊拒絕
—總體中具有某種特性的個(gè)體所占的比例。雙邊拒絕檢驗(yàn)問題
::隨機(jī)抽取個(gè)個(gè)體,假設(shè)其中有個(gè)個(gè)體具有這種特性。①若,則認(rèn)為在小的一邊,檢驗(yàn)的p值個(gè)個(gè)體中有和更少個(gè)個(gè)體具有這種特性的概率)輸入“”比例的檢驗(yàn)——雙邊拒絕
—總體中具有某種特性的個(gè)體所占的比例。雙邊拒絕檢驗(yàn)問題
::隨機(jī)抽取個(gè)個(gè)體,假設(shè)其中有個(gè)個(gè)體具有這種特性。②
若,則認(rèn)為在大的一邊,檢驗(yàn)的p值個(gè)個(gè)體中有和更多個(gè)個(gè)體具有這種特性的概率)輸入“”釘尖朝上”的概率是否等于0.65?
“釘尖朝上”的概率是否等于0.65?::,拋擲103顆圖釘,釘尖朝上63顆。倘若釘尖朝上的概率,平均來說釘尖朝上應(yīng)該有顆。拋擲103顆釘尖朝上63顆。63顆應(yīng)理解為在小的一邊。輸入“=binomdist(63,103,0.65,1)”,得單邊拒絕的值等于0.2365,從而有雙邊拒絕檢驗(yàn)的值等于2*0.2365=0.4730。判斷:不能拒絕原假設(shè),認(rèn)為“釘尖朝上”的概率等于0.65。倘若拒絕原假設(shè),認(rèn)為“釘尖朝上”的概率不等于0.65,則有47.30%的可能性犯錯(cuò)誤。大瓶咖啡容量是否低于標(biāo)簽上標(biāo)值質(zhì)檢部門定期對(duì)某型號(hào)大瓶咖啡的容量進(jìn)行檢驗(yàn),檢驗(yàn)其容量是否低于標(biāo)簽上標(biāo)明的容量1000克。設(shè)隨機(jī)抽取的瓶咖啡樣本的觀察數(shù)值為。在樣本均值大于,或正好等于1000克時(shí),可想而知質(zhì)檢部門肯定不會(huì)因咖啡重量不足而進(jìn)行投訴。而倘若樣本均值小于1000克,當(dāng)然也不會(huì)立即投訴。能不能投訴需要檢驗(yàn)。大瓶咖啡容量是否低于標(biāo)簽上標(biāo)值大瓶咖啡的容量的分布是正態(tài)分布。檢驗(yàn)問題:;。瓶咖啡的隨機(jī)樣本的觀察數(shù)值為9951023984989997100610489949799891026103298998510029931007102196098398896910079749849831044991985101310089939521012992998經(jīng)計(jì)算:樣本均值(克);樣本方差(平方克);樣本標(biāo)準(zhǔn)差(克)。大瓶咖啡容量是否低于標(biāo)簽上標(biāo)值由于樣本均值是總體均值的估計(jì),所以人們很自然地想到,在比較小的時(shí)候拒絕原假設(shè),認(rèn)為大瓶咖啡的平均容量低于1000克,可因重量不足進(jìn)行投訴。根據(jù)瓶咖啡樣本算得的樣本均值是不是比較???這就需要利用反證法,在原假設(shè)成立,均值時(shí)計(jì)算小于等于997.08的概率,也就是檢驗(yàn)的值。人們發(fā)現(xiàn),由于樣本均值的大小與量綱(單位)有關(guān)系,這個(gè)值的計(jì)算不太方便。樣本t值計(jì)算樣本
t值:樣本t值的大小與量綱(單位)沒有關(guān)系。檢驗(yàn)法則:在樣本t值:是一個(gè)比較小的負(fù)數(shù)的時(shí)候,拒絕原假設(shè),認(rèn)為備擇假設(shè)是正確的,可因重量不足進(jìn)行投訴。
t檢驗(yàn)是不是一個(gè)比較小的負(fù)數(shù)?看一個(gè)人長(zhǎng)得矮不矮,就看周圍比他矮的人多不多。如果周圍比他矮的人不多,我們就說這個(gè)人比較矮??匆粋€(gè)數(shù)是不是比較小,就看比他小的概率大不大。如果這個(gè)概率比較小,我們就認(rèn)為這個(gè)數(shù)比較小。檢驗(yàn)p
值為單尾(下)概率:。如果p
值比較小,則認(rèn)為是比較小的負(fù)數(shù)。
t分布的對(duì)稱性檢驗(yàn)p
值為單尾(下)概率:。由于t分布是對(duì)稱分布,所以檢驗(yàn)p
值也等于單尾(上)概率:。
t分布的Excel函數(shù)命令
輸入“=tdist(a,m,1)”,則得自由度為的分布單尾(上)概率的值:,其中a必須是正數(shù)。輸入“=tdist(0.8335,35,1)”,得檢驗(yàn)的p
值
p值不小,我們不能投訴。倘若投訴,出錯(cuò)的可能性有20.51%正態(tài)均值的t檢驗(yàn)—單邊拒絕
從正態(tài)總體中隨機(jī)抽取n個(gè)個(gè)體,計(jì)算:樣本均值,樣本標(biāo)準(zhǔn)差,樣本t
值:?jiǎn)芜吘芙^檢驗(yàn)問題的第1種類型①
::②
::?jiǎn)芜吘芙^檢驗(yàn)問題的第2種類型①
::②
::正態(tài)均值的t檢驗(yàn)—單邊拒絕(1)
單邊拒絕檢驗(yàn)問題的第1種類型①::②
::從正態(tài)總體中隨機(jī)抽取n個(gè)個(gè)體,計(jì)算:樣本均值,樣本標(biāo)準(zhǔn)差,樣本值:檢驗(yàn)法則:在樣本值是一個(gè)比較小的負(fù)數(shù)的時(shí)候拒絕原假設(shè),認(rèn)為
檢驗(yàn)的p值為單尾(下)概率:輸入“”正態(tài)均值的t檢驗(yàn)—單邊拒絕(2)
單邊拒絕檢驗(yàn)問題的第1種類型①::②
::從正態(tài)總體中隨機(jī)抽取n個(gè)個(gè)體,計(jì)算:樣本均值,樣本標(biāo)準(zhǔn)差,樣本值:檢驗(yàn)法則:在樣本值是一個(gè)比較大的正數(shù)的時(shí)候拒絕原假設(shè),認(rèn)為
檢驗(yàn)的p值為單尾(上)概率:輸入“”袋裝葡萄糖糖重包裝機(jī)包裝葡萄糖,額定標(biāo)準(zhǔn)為每袋凈重0.5公斤。袋裝葡萄糖糖重是正態(tài)分布。包裝機(jī)工作是否正常的檢驗(yàn)問題:原假設(shè);備擇假設(shè)。稱重袋葡萄糖,計(jì)算樣本均值,樣本標(biāo)準(zhǔn)差和樣本值:在樣本值是一個(gè)比較小的負(fù)數(shù)或比較大的正數(shù)時(shí)拒絕原假設(shè),認(rèn)為,包裝機(jī)工作不正常。雙邊拒絕p
值=單邊拒絕p值的2倍袋裝葡萄糖糖重袋葡萄糖的稱重為
0.4970.4960.5130.5050.4980.5180.5020.4770.4890.482經(jīng)計(jì)算:,樣本值,故輸入“”。檢驗(yàn)的值等于。因而不拒絕原假設(shè),認(rèn)為,包裝機(jī)工作正常。倘若認(rèn)為包裝機(jī)工作不正常,出錯(cuò)的可能性高達(dá)63.79%正態(tài)均值的t檢驗(yàn)—雙邊拒絕
雙邊拒絕檢驗(yàn)問題
:,:。從總體中隨機(jī)抽取n個(gè)個(gè)體,計(jì)算樣本均值,樣本標(biāo)準(zhǔn)差與樣本t
值
檢驗(yàn)法則:在是一個(gè)比較小的負(fù)數(shù)或比較大的正數(shù)的時(shí)候拒絕原假設(shè),認(rèn)為。計(jì)算p
值:①在時(shí),輸入“”②在時(shí),輸入“”城市公共汽車公司城市公共汽車公司在某個(gè)汽車站測(cè)量公共汽車延誤時(shí)間(到達(dá)時(shí)間與應(yīng)到達(dá)時(shí)間的差)?,F(xiàn)有輛公共汽車的測(cè)量值(單位:分):1.8,–1.6,–1.2,–0.5,–0.3,–1.0,2.9,1.1,0.0,–1.1。經(jīng)計(jì)算樣本均值;樣本方差;樣本標(biāo)準(zhǔn)差。公共汽車是否準(zhǔn)點(diǎn)到達(dá)?假設(shè)延誤時(shí)間有正態(tài)分布
首先檢驗(yàn)均值是否等于0,也就是公共汽車是否準(zhǔn)點(diǎn)到達(dá)。檢驗(yàn)。
表4-1一個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)(顯著性水平為α)
延誤時(shí)間的波動(dòng)幅度是否過大?假設(shè)延誤時(shí)間有正態(tài)分布公司要求公共汽車的延誤時(shí)間的波動(dòng)幅度不能太大,規(guī)定其標(biāo)準(zhǔn)差小于或等于1分鐘。標(biāo)準(zhǔn)差的檢驗(yàn)問題原假設(shè),備擇假設(shè)。通常將關(guān)于標(biāo)準(zhǔn)差的檢驗(yàn)問題改寫成方差的形式:原假設(shè),備擇假設(shè)。方差的檢驗(yàn)—單邊拒絕假設(shè)總體有正態(tài)分布。方差的下面兩個(gè)檢驗(yàn)問題的處理方法相同:①,備擇假設(shè)②,備擇假設(shè)計(jì)算樣本值:
在值比較大的時(shí)候拒絕原假設(shè),認(rèn)為方差。注意:離差平方和延誤時(shí)間的波動(dòng)幅度是否過大?延誤時(shí)間有正態(tài)分布。原假設(shè),備擇假設(shè)。輛公共汽車的樣本方差。樣本值,
是不是一個(gè)比較大的數(shù)?檢驗(yàn)的p
值等于自由度為樣本容量的分布(記為)大于等于19.4094的概率,它是分布的上尾概率。
卡方檢驗(yàn)是不是一個(gè)比較大的數(shù)?看一個(gè)人長(zhǎng)得高不高,就看周圍比他高的人多不多。如果周圍比他高的人不多,我們就說這個(gè)人比較高。看一個(gè)數(shù)是不是比較大,就看比他大的概率大不大。如果這個(gè)概率比較小,我們就認(rèn)為這個(gè)數(shù)比較大。
p
值等于分布的上尾概率。如果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 復(fù)學(xué)一周工作總結(jié)
- 企業(yè)員工崗前安全培訓(xùn)試題含答案(典型題)
- 機(jī)房改造合同
- 一年級(jí)語文課程綠色評(píng)價(jià)方案
- 車間安全培訓(xùn)試題附答案可下載
- 新學(xué)期學(xué)習(xí)計(jì)劃范文集錦五篇
- 文明主題的演講稿14篇
- 護(hù)理應(yīng)急預(yù)案
- 幻夜東野圭吾的讀后感
- 養(yǎng)老機(jī)構(gòu)投訴管理制度
- DL∕T 1919-2018 發(fā)電企業(yè)應(yīng)急能力建設(shè)評(píng)估規(guī)范
- 小學(xué)作文稿紙語文作文作業(yè)格子模板(可打印編輯)
- 青島版六年級(jí)上冊(cè)《比的認(rèn)識(shí)》.ppt
- 個(gè)人簡(jiǎn)歷模板(word表格)
- 裝飾裝修竣工自評(píng)報(bào)告(精編版)
- 渣土車輛駕駛員管理制度
- 四川省物業(yè)管理承接查驗(yàn)辦法
- SQL-Server基礎(chǔ)培訓(xùn)PPT優(yōu)秀課件
- 乳腺癌英文相關(guān)
- 團(tuán)隊(duì)管理經(jīng)典案例分析
- 李燕璇植樹問題卡通版5
評(píng)論
0/150
提交評(píng)論