統(tǒng)計學之總體參數(shù)的假設檢驗_第1頁
統(tǒng)計學之總體參數(shù)的假設檢驗_第2頁
統(tǒng)計學之總體參數(shù)的假設檢驗_第3頁
統(tǒng)計學之總體參數(shù)的假設檢驗_第4頁
統(tǒng)計學之總體參數(shù)的假設檢驗_第5頁
已閱讀5頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統(tǒng)計學─從數(shù)據(jù)到結論第六章總體參數(shù)的假設檢驗如果一個人說他從來沒有罵過人。他能夠證明嗎?要證明他沒有罵過人,他必須出示他從小到大每一時刻的錄音錄像,所有書寫的東西等等,還要證明這些物證是完全的、真實的、沒有間斷的。這簡直是不可能的。即使他找到一些證人,比如他的同學、家人和同事,那也只能夠證明在那些證人在場的某些片刻,他沒有被聽到罵人。反過來,如果要證明這個人罵過人很容易,只要有一次被抓住就足夠了??磥恚髨D肯定什么事物很難,而否定卻要相對容易得多。這就是假設檢驗背后的哲學。科學總往往是在否定中發(fā)展在假設檢驗中,一般要設立一個原假設(上面的“從來沒罵過人”就是一個例子);而設立該假設的動機主要是企圖利用人們掌握的反映現(xiàn)實世界的數(shù)據(jù)來找出假設與現(xiàn)實之間的矛盾,從而否定這個假設。在多數(shù)統(tǒng)計教科書中(除理論探討外)假設檢驗都是以否定原假設為目標。如否定不了,說明證據(jù)不足,無法否定原假設。但不能說明原假設正確。就像一兩次沒有聽過他罵人還遠不能證明他從來沒有罵過人?!?.1假設檢驗的過程和邏輯先要提出個原假設,比如某正態(tài)總體的均值等于5(m=5)。這種原假設也稱為零假設(nullhypothesis),記為H0。與此同時必須提出備選假設(或稱為備擇假設,alternativehypothesis),比如總體均值大于5(m>5)。備選假設記為H1或Ha。形式上,這個關于總體均值的H0相對于H1的檢驗記為§6.1假設檢驗的過程和邏輯備選假設應該按照實際世界所代表的方向來確定,即它通常是被認為可能比零假設更符合數(shù)據(jù)所代表的現(xiàn)實。比如上面的H1為m>5;這意味著,至少樣本均值應該大于5;至于是否顯著,依檢驗結果而定。檢驗結果顯著(significant)意味著有理由拒絕零假設。因此,假設檢驗也被稱為顯著性檢驗(significanttest)?!?.1假設檢驗的過程和邏輯有了兩個假設,就要根據(jù)數(shù)據(jù)來對它們進行判斷。數(shù)據(jù)的代表是作為其函數(shù)的統(tǒng)計量;它在檢驗中被稱為檢驗統(tǒng)計量(teststatistic)。根據(jù)零假設(不是備選假設?。?,可得到該檢驗統(tǒng)計量的分布;再看這個統(tǒng)計量的數(shù)據(jù)實現(xiàn)值(realization)屬不屬于小概率事件?!?.1假設檢驗的過程和邏輯也就是說把數(shù)據(jù)代入檢驗統(tǒng)計量,看其值是否落入零假設下的小概率范疇;如果的確是小概率事件,那么就有可能拒絕零假設,或者說“該檢驗顯著,”否則說“沒有足夠證據(jù)拒絕零假設”,或者“該檢驗不顯著?!薄?.1假假設設檢驗驗的過過程和和邏輯輯注意::在我們們所涉涉及的的問題題中,,零假假設和和備選選假設設在假假設檢檢驗中中并不不對稱稱。因檢驗驗統(tǒng)計計量的的分布布是從從零假假設導導出的的,因因此,,如果果發(fā)生生矛盾盾,就就對零零假設設不利利了。。不發(fā)生生矛盾盾也不不能說說明零零假設設沒有有問題題?!?.1假假設設檢驗驗的過過程和和邏輯輯在零假假設下下,檢檢驗統(tǒng)統(tǒng)計量量取其其實現(xiàn)現(xiàn)值及及(沿沿著備備選假假設的的方向向)更更加極極端值值的概概率稱稱為p-值((p-value))。如果得得到很很小的的p-值,,就意意味著著在零零假設設下小小概率率事件件發(fā)生生了。。如果小小概率率事件件發(fā)生生,是是相信信零假假設,,還是是相信信數(shù)據(jù)據(jù)呢??當然多多半是是相信信數(shù)據(jù)據(jù),拒拒絕零零假設設。§6.1假假設設檢驗驗的過過程和和邏輯輯但小概概率并并不能能說明明不會會發(fā)生生,僅僅僅發(fā)發(fā)生的的概率率很小小罷了了。拒拒絕正正確零零假設設的錯錯誤常常被稱稱為第一類類錯誤誤(typeIerror))。在備選選假設設正確確時反反而說說零假假設正正確的的錯誤誤,稱稱為第二類類錯誤誤(typeIIerror)。在本本書的的假設設檢驗驗問題題中,,由于于備選選假設設不是是一個個點,,所以以無法法算出出犯第第二類類錯誤誤的概概率。?!?.1假假設設檢驗驗的過過程和和邏輯輯零假設設和備備選假假設哪哪一個個正確確,是是確定定性的的,沒沒有概概率可可言。。而可可能犯犯錯誤誤的是是人。。涉及假假設檢檢驗的的犯錯錯誤的的概率率就是是犯第第一類類錯誤誤的概概率和和犯第第二類類錯誤誤的概概率。。負責任任的態(tài)態(tài)度是是無論論做出出什么么決策策,都都應該該給出出該決決策可可能犯犯錯誤誤的概概率。?!?.1假假設設檢驗驗的過過程和和邏輯輯到底p-值是是多小小時才才能夠夠拒絕絕零假假設呢呢?也也就是是說,,需要要有什什么是是小概概率的的標準準。這要看看具體體應用用的需需要。。但在在一般般的統(tǒng)統(tǒng)計書書和軟軟件中中,使使用最最多的的標準準是在在零假假設下下(或或零假假設正正確時時)根根據(jù)樣樣本所所得的的數(shù)據(jù)據(jù)來拒拒絕零零假設設的概概率應應小于于0.05,當當然也也可能能是0.01,,0.005,,0.001等等等。。這種事事先規(guī)規(guī)定的的概率率稱為為顯著性性水平平(significantlevel),用字母a來表示。§6.1假假設檢驗驗的過程和和邏輯a并不一定越越小越好,,因為這很很可能導致致不容易拒拒絕零假設設,使得犯犯第二類錯錯誤的概率率增大。當p-值小于或等等于a時,就拒絕絕零假設。。所以,a是所允許的的犯第一類類錯誤概率率的最大值值。當p-值小于或等等于a時,就說這這個檢驗是是顯著的。。無論統(tǒng)計學學家用多大大的a作為顯著性性水平都不不能脫離實實際問題的的背景。統(tǒng)統(tǒng)計顯著不不一定等價價于實際顯顯著。反過過來也一樣樣。§6.1假假設檢驗驗的過程和和邏輯歸納起來,,假設檢驗驗的邏輯步步驟為:1.寫出出零假設和和備選假設設;2.確定定檢驗統(tǒng)計計量;3.確定定顯著性水水平a;4.根據(jù)據(jù)數(shù)據(jù)計算算檢驗統(tǒng)計計量的實現(xiàn)現(xiàn)值;5.根據(jù)據(jù)這個實現(xiàn)現(xiàn)值計算p-值;6.進行行判斷:如如果p-值小于或等等于a,就拒絕零零假設,這這時犯(第第一類)錯錯誤的概率率最多為a;如果p-值大于a,就不拒絕絕零假設,,因為證據(jù)據(jù)不足?!?.1假假設檢驗驗的過程和和邏輯實際上,多多數(shù)計算機機軟件僅僅僅給出p-值,而不給給出a。這有很多多方便之處處。比如a=0.05,而假定定所得到的的p-值等于0.001。。這時如果果采用p-值作為新的的顯著性水水平,即新新的a=0.001,于是是就可以說說,在顯著著性水平為為0.001時,拒拒絕零假設設。這樣,拒絕絕零假設時時犯錯誤的的概率實際際只是千分分之一而不不是舊的a所表明的百百分之五。。在這個意意義上,p-值又稱為觀測的顯著著性水平((observedsignificantlevel)。§6.1假假設檢驗驗的過程和和邏輯在統(tǒng)計軟件件輸出p-值的位置,,有的用““p-value”,有的的用significant的縮寫““Sig””就是這個個道理。根據(jù)數(shù)據(jù)產產生的p-值來減少a的值以展示示結果的精精確性總是是沒有害處處的。這好比一個個身高180厘米的的男生,可可能愿意被被認為高于于或等于180厘米米,而不愿愿意說他高高于或等于于155厘厘米,雖然然這第二種種說法數(shù)學學上沒有絲絲毫錯誤。?!?.1假假設檢驗驗的過程和和邏輯關于“臨界界值”的注注:作為概率的的顯著性水水平a實際上相應應于一個檢檢驗統(tǒng)計量量取值范圍圍的一個臨界值(criticalvalue),它定義為為,統(tǒng)計量量取該值或更更極端的值值的概率等于于a。也就是說說,“統(tǒng)計量的的實現(xiàn)值比比臨界值更更極端”等等價于“p-值小于a”。使用臨臨界值的概概念進行的的檢驗不計計算p-值。只比較較統(tǒng)計量的的取值和臨臨界值的大大小?!?.1假假設檢驗驗的過程和和邏輯使用臨界值值而不是p-值來判斷拒拒絕與否是是前計算機時時代的產物物。當時計算算p-值不易,只只采用臨界界值的概念念。但從給給定的a求臨界值同同樣也不容容易,好在在習慣上僅僅僅在教科科書中列出出相應于特特定分布的的幾個有限限的a臨界值(比比如a=0.05,a=0.025,a=0.01,a=0.005,a=0.001等等)),或者根根據(jù)分布表表反過來查查臨界值((很不方便便也很粗糙糙)。現(xiàn)在計算機機軟件大都都不給出a和臨界值,,但都給出出p-值和統(tǒng)計量量的實現(xiàn)值值,讓用戶戶自己決定定顯著性水水平是多少少?!?.1假假設檢驗驗的過程和和邏輯在一些統(tǒng)計計教科書中中會有不能能拒絕零假假設就“接接受零假設設”的說法法。這種說說法是不嚴嚴格的。首先,如果果你說“接接受零假設設”,那么么就應該負負責任地提提供接受零零假設時可可能犯第二二類錯誤的的概率。這這就要算出出在備選假假設正確的的情況下錯錯誤接受零零假設的概概率。但是是,這只有有在備選假假設僅僅是是一個與零零假設不同同的確定值值(而不是是范圍)時時才有可能能。多數(shù)基本統(tǒng)統(tǒng)計教科書書的備選假假設是一個個范圍而根根本無法確確定犯第二二類錯誤的的概率?!?.1假假設檢驗驗的過程和和邏輯在許多統(tǒng)計計教科書中中,往往把把一系列不不能拒絕零零假設的檢檢驗當成接接受這些假假設的通行行證。比如不能拒拒絕某樣本本的正態(tài)性性就變成了了證明了該該樣本是正正態(tài)的等等等。不能拒絕這這些零假設設,僅僅說說明根據(jù)所所使用的檢檢驗方法((或檢驗統(tǒng)統(tǒng)計量)和和當前的數(shù)數(shù)據(jù)沒有足足夠證據(jù)拒拒絕這些假假設而已。?!?.1假假設檢驗驗的過程和和邏輯對于同一個個假設檢驗驗問題,往往往都有多多個檢驗統(tǒng)統(tǒng)計量;而而且人們還還在構造更更優(yōu)良的檢檢驗統(tǒng)計量量。人們不可能能把所有的的目前存在在的和將來來可能存在在的檢驗都都實施。因此,只只能夠說說,按照照目前的的證據(jù),,不足以以拒絕零零假設而而已。后后面將會會用例子子說明““接受零零假設””的說法法是不妥妥當?shù)?。?!?.2對于于正態(tài)總總體均值值的檢驗驗§6.2.1根根據(jù)一一個樣本本對其總總體均值值大小進進行檢驗驗例6.1一個顧顧客買了了一包標標有500g重重的一包包紅糖,,覺得份份量不足足,于是是找到監(jiān)監(jiān)督部門門;當然然他們會會覺得一一包份量量不夠可可能是隨隨機的。。于是監(jiān)監(jiān)督部門門就去商商店稱了了50包包紅糖((數(shù)據(jù)在在sugar.txt);其其中均值值(平均均重量))是498.35g;;這的確確比500g少少,但這這是否能能夠說明明廠家生生產的這這批紅糖糖平均起起來不夠夠份量呢呢?于于是需要要統(tǒng)計檢檢驗??煽梢援嫵龀鲞@些重重量的直直方圖50包紅紅糖重量量的直方方圖§6.2.1根根據(jù)一一個樣本本對其總總體均值值大小進進行檢驗驗這個直方方圖看上上去象是是正態(tài)分分布的樣樣本。不不妨假定定這一批批袋裝紅紅糖有正正態(tài)分布布。由于廠家家聲稱每每袋500g((標明重重量),,因此零零假設為為總體均均值等于于500g(被被懷疑對對象總是是放在零零假設));而且由于于樣本均均值少于于500g(這這是懷疑疑的根據(jù)據(jù)),把把備選假假設定為為總體均均值少于于500g(備備選假設設為單向向不等式式的檢驗驗稱為單單尾檢驗驗,為不不等號““≠”的的稱為雙雙尾檢驗驗)§6.2.1根根據(jù)一一個樣本本對其總總體均值值大小進進行檢驗驗檢驗統(tǒng)計計量就是是第四章章引進的的作為對對均值的的某種標標準化的的符號中的的m0通常表示示為零假假設中的的均值((這里是是500)。在在零假設設之下,,它有自自由度為為n-1=49的t分布。。當然實實際上不不必代入入這個公公式去手手工計算算了,讓讓計算機機去代勞勞好了。?!?.2.1根根據(jù)一一個樣本本對其總總體均值值大小進進行檢驗驗計算結果果是t=-2.696(也稱為為t值),同時時得到p-值為0.005(由于計計算機輸出的的為雙尾檢驗驗的p-值,比單尾的的大一倍,應應該除以2))??磥砜梢砸赃x擇顯著性性水平為0.005,并并宣稱拒絕零零假設,而錯錯誤拒絕的概概率為0.005。統(tǒng)計量t=-2.696相應于左邊邊尾概率(p-值)0.005§6.2.1根據(jù)一個個樣本對其總總體均值大小小進行檢驗上面例子的備備選假設為小小于(“<””)某個值。。同樣也可能能有備選假設設為均值大于于(“>”))某個值的情情況。取備選假設為為均值大于或或小于某個值值的檢驗稱為為單尾檢驗(one-tailedtest,也稱為單側檢驗或單單邊檢驗)。。下面舉一個選選假設為均值值大于(“>”)某個值值的例子。§6.2.1根據(jù)一個個樣本對其總總體均值大小小進行檢驗例6.2(exh.txt)汽車廠廠商聲稱其發(fā)發(fā)動機排放標標準的一個指指標平均低于于20個單位位。在抽查了了10臺發(fā)動動機之后,得得到下面的排排放數(shù)據(jù):17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。該該樣本均值為為21.13。究竟能否否由此認為該該指標均值超超過20?這這次的假設檢檢驗問題就是是§6.2.1根據(jù)一個個樣本對其總總體均值大小小進行檢驗和前面的例子子的方法類似似,可以發(fā)現(xiàn)現(xiàn)p-值為0.1243(計算算機輸出的雙雙尾檢驗的p-值除以2),,因此,沒有有證據(jù)否定零零假設。這時時的檢驗統(tǒng)計計量t=1.2336。也可以以畫出類似于于圖6.2的的圖(圖6.3)這時的的t分布的自自由度為9。。下面是結果果的計算機輸輸出:統(tǒng)計量t=1.2336相應于右邊邊尾概率(p-值)0.1243§6.2.1根據(jù)一個個樣本對其總總體均值大小小進行檢驗注意:在假設設檢驗中往往往也用帶等號號的不等式來來表示零假設設,比如上述述的檢驗記為為但這里用于計計算p-值的零假設設還是m=20;但如如果能夠拒絕絕零假設m=20,那么么對于任何m小于20的零零假設就更有有理由拒絕了了。這和以拒拒絕零假設為為初衷的假設設檢驗思維方方式是一致的的?!?.2.1根據(jù)一個個樣本對其總總體均值大小小進行檢驗還有所謂的雙尾檢驗(twotailedtest,也稱為雙側檢驗或雙邊檢驗)問題,即在這種情況下下,尾概率不不僅是左邊或或右邊的一個個尾概率,而而是兩邊尾概概率之和。因因此如果是一一個單尾檢驗驗問題,用了了雙尾檢驗的的模式,p-值就比用單尾尾檢驗時大了了一倍?!?.2.1根據(jù)一個個樣本對其總總體均值大小小進行檢驗如果上面發(fā)動動機排放指標標例子的檢驗驗問題改為是是否該發(fā)動機機的排放指標標均值等于20。即這時t統(tǒng)計量量還是取原來來的值1.2336,但但p-值為0.1243×2=0.2486。圖6.3就變成圖圖6.4的樣樣子統(tǒng)計量t=1.2336,而p-值等于左右尾尾概率之和,,即0.2486§6.2.2根據(jù)來自自兩個總體的的獨立樣本對對其總體均值值的檢驗例6.3(數(shù)據(jù):drug.txt)為檢測測某種藥物對對攻擊性情緒緒的影響,對對處理組的100名服藥藥者和對照組組的150名名非服藥者進進行心理測試試,得到相應應的某指標。。要檢驗處理理組指標的總總體均值m1是否等于對照照組指標的總總體均值m2。相應的假設設檢驗問題為為:或§6.2.2根據(jù)來自自兩個總體的的獨立樣本對對其總體均值值的檢驗通過計算,t統(tǒng)計量等于0.942,,p-值為0.1735(輸出出中的雙尾檢檢驗p-值的一半)。。因此無法拒拒絕零假設,,即不能得出出處理組的平平均指標大于于對照組的結結論。計算機機輸出的相應應表格(部分分,刪除了置置信區(qū)間部分分)為:§6.2.2根據(jù)來自自兩個總體的的獨立樣本對對其總體均值值的檢驗注意:這個輸輸出的前面三三列用Levene的F-檢驗來看看這兩個樣本本所代表的總總體之方差是是否相等(零零假設為相等等)。第一行行是該檢驗的的零假設:兩兩個總體方差差相等,而第第二行為備選選假設:兩個個總體方差不不等。如果該該檢驗顯著,,即在Sig列中的該Levene檢驗p-值很?。ㄟ@里里是0.008),就應應該看第二行行備選假設的的t檢驗輸出出,這里是0.347;;由于是單邊邊檢驗,p-值=0.347/2=0.1735;如果Levene檢檢驗的p-值較大(本例例并不大),,則看第一行行原假設下的的結果。之所所以要檢驗總總體方差,是是因為總體方方差相同時使使用的檢驗統(tǒng)統(tǒng)計量與方差差不同時使用用的不同。§6.2.3成對樣本本的問題例6.4減肥肥數(shù)據(jù)(diet.txt)。這里里有50對數(shù)數(shù)據(jù)。為50人是減肥前前后的重量要比較50個個人在減肥前前后的重量。。不能用前面的的獨立樣本均均值差的檢驗驗;這是因為為兩個樣本并并不獨立。每每一個人減肥肥后的重量都都和自己減肥肥前的重量有有關。但不同同人之間卻是是獨立的。令所有個體減減肥前后重量量差(減肥前前重量減去減減肥后重量))的均值為mD;這樣所要進進行的檢驗為為§6.2.3成對樣本本的問題我們可以把兩兩個樣本中配配對的觀測值值逐個相減,,形成一個由由獨立觀測值值組成的樣本本;然后用單單樣本檢驗方方法,看其均均值是否為零零。在相減之后公公式和單樣本本均值檢驗無無異。當然,,如果直接選選用軟件中成成對樣本均值值的檢驗,就就不用事先逐逐個相減了。。這里也有單單尾和雙尾檢檢驗。這里介紹的是是假定總體分分布為正態(tài)分分布時的t檢檢驗??傮w分分布未知時,,應該利用第第十六章的非非參數(shù)檢驗方方法?!?.2.3成對樣本本的問題再接著看例6.4。計算算機輸出了雙雙尾p-值0.002,這里的單單尾p-值于是為0.001。因因此在顯著性性水平為0.001時,,可以拒絕零零假設。也就就是說,減肥肥后和減肥前前相比,平均均重量顯著要要輕。下面是是這個檢驗的的SPSS的的部分計算機機輸出為(刪刪去了置信區(qū)區(qū)間):§6.3對對于比例的檢檢驗§6.3.1對于離散散變量總體比比例的檢驗例6.5(two.txt)為評價價電視的收視視率,電話調調查,在某一一節(jié)目播出的的時候,被訪訪的正在觀看看電視的人中中有23%的的正在觀看這這個節(jié)目?,F(xiàn)現(xiàn)在想知道,,這是否和該該節(jié)目的制作作人所期望的的p0=25%有顯顯著不足。這顯然是一個個參數(shù)為p的二項分布問問題。形式上上的假設檢驗驗問題是§6.3.1對于離散散變量總體比比例的檢驗如果n為訪問的正在在看電視的人人數(shù),x為其中觀看該該節(jié)目的人數(shù)數(shù),那么樣本本中的觀看比比例為檢驗統(tǒng)計量則則是在零假設設下當大樣本本時近似有標標準正態(tài)分布布的統(tǒng)計量§6.3.1對于離散散變量總體比比例的檢驗這個數(shù)值用手手算也不費力力氣。請注意意,前面第五章提提起過,即使使被訪者的百百分比一樣,,但樣本少的的信息就少。。對于假設檢檢驗也是一樣樣。樣本量對對于假設檢驗驗的結果就十十分重要。對于本例,現(xiàn)現(xiàn)在還未給出出樣本量n呢!下面看看看不同的樣本本量會得到什什么結果(假假定x/n=0.23不不變)§6.3.1對于離散散變量總體比比例的檢驗如樣本量為n=1500((和數(shù)據(jù)給的的一樣),那那么,上面的的檢驗得到的的p-值為0.0368。因此此,可以認為為(如果選顯顯著性水平為為0.05的的話)說收視視率有25%%是過分了。。即拒絕零假假設。如樣樣本本量量為為n=100,,那那么么,,上上面面的的檢檢驗驗得得到到的的p-值為為0.3221。。因因此此,,沒沒有有足足夠夠的的理理由由拒拒絕絕收收視視率率有有25%%的的零零假假設設((如如果果選選顯顯著著性性水水平平為為0.05的的話話))注意意,,利利用用軟軟件件時時,,上上面面的的p-值計計算算往往往往在在公公式式中中加加上上用用連連續(xù)續(xù)變變量量近近似似離離散散變變量量分分布布時時常常用用的的連連續(xù)續(xù)性性糾糾正正,,因因此此結結果果和和用用上上面面公公式式直直接接手手算算的的稍稍有有不不同同。。§6.3.1對對于于離離散散變變量量總總體體比比例例的的檢檢驗驗下面面是是對對于于n=1500時時,,例例6.5的的SPSS輸輸出出。。這這里里正正在在觀觀看看該該節(jié)節(jié)目目的的人人數(shù)數(shù)為為n1=345,,而而1500人人中中觀觀看看其其他他節(jié)節(jié)目目的的人人數(shù)數(shù)為為n2=1155。。樣樣本本中中收收視視比比例例為為n1/n=345/1500==0.23。?!?.3.1對對于于離離散散變變量量總總體體比比例例的的檢檢驗驗前面面對對總總體體比比例例的的檢檢驗驗所所用用的的公公式式利利用用了了二二項項分分布布的的大大樣樣本本正正態(tài)態(tài)近近似似;;怎怎樣樣才才是是大大樣樣本本呢呢??這這和和第第五五章章求求比比例例的的置置信信區(qū)區(qū)間間時時大大樣樣本本的的近近似似標標準準類類似似,,即即當當區(qū)區(qū)間間完全全包包含含在在((0,,1))區(qū)區(qū)間間內內部部時時,,可可以以認認為為樣樣本本足足夠夠大大,,能能夠夠用用正正態(tài)態(tài)近近似似。?!?.3.1對對于于離離散散變變量量總總體體比比例例的的檢檢驗驗對于于兩兩個個樣樣本本,,也也有有關關于于兩兩個個總總體體比比例例之之差差p1-p2的檢檢驗驗。。還還拿拿收收視視率率為為例例。。節(jié)節(jié)目目甲甲的的樣樣本本收收視視率率為為20%%,,節(jié)節(jié)目目乙乙為為21%%,,是是不不是是節(jié)節(jié)目目甲甲的的總總體體收收視視率率就就真真的的低低于于節(jié)節(jié)目目乙乙??即即檢檢驗驗這里的的零假假設意意味著著節(jié)目目甲和和節(jié)目目乙收收視率率相等等?!?.3.1對對于于離散散變量量總體體比例例的檢檢驗假定n1=1200,n2=1300,檢檢驗驗統(tǒng)計計量則則是在在零假假設下下當大大樣本本時有有近似似標準準正態(tài)態(tài)分布布的統(tǒng)統(tǒng)計量量得到p-值等于于0.2679。因因此,,在顯顯著性性水平平即使使是0.1時,,也沒沒有足足夠證證據(jù)可可以拒拒絕““節(jié)目目甲和和節(jié)目目乙收收視率率相等等”的的零假假設。?!?.3.2對對于于連續(xù)續(xù)變量量比例例的檢檢驗有時需需要檢檢驗收收入低低于某某個水水平的的人占占有的的比例例p是否和和預期期的p0一樣。。和6.3.1節(jié)一一樣,,只要要把大大于某某水平平的觀觀測值值看作作Bernoulli試試驗的的“成成功””,而而把小小于某某水平平的觀觀測值值看成成“失失敗””,就就回到到二項項分布布的問問題了了。當當然,,用不不著把把這些些連續(xù)續(xù)變量量的觀觀測值值都變變成““成功功”和和“失失敗””之后后,再再數(shù)各各有多多少。。統(tǒng)計計軟件件會替替我們們做所所有的的事情情。下面通通過一一個例例子來來說明明?!?.3.2對對于于連續(xù)續(xù)變量量比例例的檢檢驗例6.6某某微微生物物的壽壽命問問題(數(shù)據(jù)據(jù)life.txt)。。這里里有某某微生生物在在一種種污染染環(huán)境境下生生存的的壽命命數(shù)據(jù)據(jù)(單單位::小時時)§6.3.2對對于于連續(xù)續(xù)變量量比例例的檢檢驗問題是是存活活時間間低于于2小小時的的是否否少于于70%((存活活時間間多于于2小小時的的是否否多于于30%))?零零假設設為存存活時時間低低于2小時時的少少于或或等于于70%,,備選選假設設為存存活時時間低低于2小時時的多多于70%。該該檢驗驗用符符號表表示,,對于于p0=0.7,,§6.3.2對對于于連續(xù)續(xù)變量量比例例的檢檢驗由計算算機很很容易易得到到檢驗驗結果果這說明明,活活不過過2小小時的的有52個個觀測測值,,所占占的比比例為為90%。。檢驗驗的精精確p-值和和大樣樣本近近似的的p-值均為為0.002。。因此此,可可以拒拒絕““存活活時間間低于于2小小時的的少于于70%””的零零假設設?!?.3.2對對于于連續(xù)續(xù)變量量比例例的檢檢驗這個檢檢驗的的假設設還可可以有有另一一種等等價形形式。。前面面第三三、四四章介介紹過過樣本本和總總體的的a-分位位數(shù)的的概念念。例例6.6的的檢驗驗問題題等價價于檢檢驗0.7分位位數(shù)q是等于于2((q0=2))還是是小于于2;;即::該例的的結論論是實實際存存活時時間的的0.7分分位數(shù)數(shù)q小于2小時時。§6.3.2對對于于連續(xù)續(xù)變量量比例例的檢檢驗上面的的檢驗驗又稱稱為((推廣廣的))符號號檢驗驗(signtest)。。它用用不著著對總總體分分布進進行任任何假假定。。而狹狹義的的符號號檢驗驗是指指上面面的p0=0.5或或者((等價價地))q0等于中中位數(shù)數(shù)的情情況。。通常常把符符號檢檢驗歸歸于非非參數(shù)數(shù)檢驗驗范疇疇(參參見后后面介介紹非非參數(shù)數(shù)檢驗驗的一一章))?!?.4從從一一個例例子說說明““接受受零假假設””的說說法不不妥雖然前前面已已經(jīng)有有了一一些例例子說說明““接受受零假假設””說法法的不不妥,,但還還可能能會有有些人人對于于在檢檢驗結結果不不顯著著時只只能說說“不不能拒拒絕零零假設設”而而不能能說““接受受零假假設””感到到不解解。下下面用用一個個個描描述性性例子子來說說明。?!?.4從從一個例例子說明““接受零假假設”的說說法不妥例6.7((數(shù)據(jù)rice.txt)一個大大米加工廠廠賣給一個個超市一批批標明10kg重的的大米。而而該超市懷懷疑該廠家家缺斤短兩兩,對10包大米進進行了稱重重,得到下下面結果((單位:千千克)這里里假定打包包的大米重重量服從正正態(tài)分布。?!?.4從從一個例例子說明““接受零假假設”的說說法不妥由于發(fā)生分分歧,于是是各方同意意用這個數(shù)數(shù)據(jù)進行關關于大米重重量均值m的t檢驗;;以廠家所所說的平均均重量為10kg作作為零假設設,而以超超市懷疑的的份量不足足10kg作為備選選假設:于是,超市市、加工廠廠老板和該該老板的律律師都進行行了檢驗。。結果是::§6.4從從一個例例子說明““接受零假假設”的說說法不妥1.超市用用全部數(shù)據(jù)據(jù)進行t檢檢驗,得到到拒絕零假假設的結論論。他們根根據(jù)計算得得到:樣本本均值為9.92kg,而p-值為0.0106。因此超超市認為,,對于顯著著性水平a=0.05,應該拒拒絕零假設設?!?.4從從一個例例子說明““接受零假假設”的說說法不妥2.大米加加工廠老板板只用2個個數(shù)據(jù),得得到“接受受零假設””的結論。。大米加工工廠老板也也懂些統(tǒng)計計,他只取取了上面樣樣本的頭兩兩個個數(shù)目目9.93和9.83進行同同樣的t檢檢驗。通過過對這兩個個數(shù)進行計計算得到::樣本均值值為9.88kg,,而p-值為0.1257。雖然樣樣本均值不不如超市檢檢驗的大,,但p-值大大增增加。加工工廠老板于于是下了結結論:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論