管理統(tǒng)計學(xué)課件真齊了2014autumn 8非參數(shù)檢驗_第1頁
管理統(tǒng)計學(xué)課件真齊了2014autumn 8非參數(shù)檢驗_第2頁
管理統(tǒng)計學(xué)課件真齊了2014autumn 8非參數(shù)檢驗_第3頁
管理統(tǒng)計學(xué)課件真齊了2014autumn 8非參數(shù)檢驗_第4頁
管理統(tǒng)計學(xué)課件真齊了2014autumn 8非參數(shù)檢驗_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

管理統(tǒng)計學(xué)—非參數(shù)檢驗曹平Email:什么是非參數(shù)檢驗上一章的參數(shù)假設(shè)檢驗,都是假定總體分布類型已知,針對總體的未知參數(shù)所提的假設(shè)檢驗但有時分布類型是未知的χ2檢驗的應(yīng)用擬合優(yōu)度檢驗:檢驗數(shù)據(jù)總體是否來自于某個已知分布列聯(lián)表的獨立性檢驗:檢驗兩種屬性是否有關(guān)聯(lián)χ2分布設(shè)一組相互獨立的隨機變量Xi都服從標準正態(tài)分布,則服從自由度為k的χ2分布,記為χ2k例子1觀察一個硬幣是否均勻。把它擲n次,結(jié)果正面出現(xiàn)n1次,反面出現(xiàn)n2次。若以{X=0}和{X=1}分別表示每次出現(xiàn)反面和正面這兩個事件,則硬幣均勻等價于P(X=0)=P(X=1)=1/2可提出如下的假設(shè)檢驗問題:H0:P(X=0)=P(X=1)=1/2?H1:P(X=1)≠1/2例子2工廠生產(chǎn)為三班制,本月出了15次事故,其中早班、中班和晚班分別發(fā)生了6次、3次和6次,問事故是否與班次有關(guān)?α=0.05假定事故與班次無關(guān),定義隨機變量X:{X=i}表示第i班次出事故,其中i=1,2,3分別表示早班、中班和晚班可提出如下假設(shè)檢驗問題:H0:P(X=i)=1/3(i=1,2,3)?H1:存在i,P(X=i)≠1/3例子3為了解吸煙是否與患肺癌有關(guān),一份調(diào)查報告如下:分別定義隨機變量X,Y如下:X=0,1分別表示不吸煙和吸煙,Y=0,1分別表示無肺癌和患肺癌假設(shè)檢驗問題:在水平α=0.001下,吸煙與否是否與患肺癌有關(guān)原假設(shè):H0:P(X=i,Y=j)=P(X=i)P(Y=j)(i=0,1,j=0,1)不吸煙吸煙無肺癌339725855982患肺癌31518340026006000例子4

調(diào)查戶主居住的房屋類型與每周去郵局次數(shù)有無關(guān)系每周去郵局次數(shù)房屋類型復(fù)式結(jié)構(gòu)公寓平房其他行和<1/周30541401/周11080822002/周51033250>2/周55000列和150100455300例子4(續(xù))假設(shè)居住房子的式樣與去郵局次數(shù)無關(guān),分別定義隨機變量X和Y如下X=1,2,3,4表示去郵局的4種頻率Y=1,2,3,4表示房子的4種類型假設(shè)檢驗問題:在水平α下檢驗H0:P(X=i,Y=j)=P(X=i)P(Y=j)(i=1,2,3,4,j=1,2,3,4)H1:兩件事有關(guān)聯(lián)例子5在過去的一年里,公司A,B,C的市場份額分別穩(wěn)定在30%,50%和20%。最近公司C開發(fā)了一種新產(chǎn)品。判斷新產(chǎn)品是否使市場份額發(fā)生變化對200個顧客進行調(diào)查,詢問對各個公司的購買偏好,分別是48,98,54H0:pA=0.3,pB=0.5,pC=0.2H1:總體比例不是pA=0.3,pB=0.5,pC=0.2χ2檢驗擬合優(yōu)度檢驗:例1,2列聯(lián)表獨立性檢驗:例3,4構(gòu)造χ2統(tǒng)計量當n充分大時χ2近似服從自由度為f的χ2分布,記為χ2f分組數(shù)據(jù):f=k-1列聯(lián)表:f=(行數(shù)-1)(列數(shù)-1)Oi是實際頻數(shù),Ei是理論頻數(shù),要求每組理論頻數(shù)≥5檢驗規(guī)則:時拒絕H0例子2(分析)理論值Ei=npi=15×1/3=5χ2統(tǒng)計量接受H0:沒有足夠的證據(jù)證明事故與班次有關(guān)若樣本大小為75,早班、中班和晚班事故的比例不變,為30:15:30,理論值Ei=npi=25則χ2統(tǒng)計量拒絕H0列聯(lián)表檢驗第(i,j)格的理論頻數(shù)Eij由下式定義例子3(分析)拒絕H0不吸煙吸煙無肺癌3397(3389.8)2585(2592.2)5982患肺癌3(10.2)15(7.8)18340026006000例子4(分析)將理論頻數(shù)<5的方格合并,使得合并后每小格的理論頻數(shù)≥5每周去郵局次數(shù)房屋類型復(fù)式結(jié)構(gòu)公寓平房其他行和<1/周30(20)5(13.33)4(6)1(0.67)401/周110(100)80(66.67)8(30)2(3.33)2002/周5(25)10(16.67)33(7.5)2(0.83)50>2/周5(5)5(3.33)0(1.5)0(0.17)0列和150100455300例子4(分析續(xù))拒絕H0每周去郵局次數(shù)房屋類型復(fù)式結(jié)構(gòu)公寓平房和其他行和<1/周30(20)5(13.33)5(6.67)401/周110(100)80(66.67)10(33.33)200≥2/周10(30)10(20.0)35(10.0)50列子5(分析)理論值EA=npA=200×0.3=60,EB=100,EC=40χ2統(tǒng)計量拒絕H0:市場份額發(fā)生變化關(guān)于χ2擬合優(yōu)度檢驗的一般問題研究的總體分布F未知,希望由樣本來檢驗這個總體分布F是否等于給定的分布F0H0:F(x)=F0(x)?H1:F(x)≠F0(x)F0(x)為已知的分布函數(shù)離散:均勻分布,二項分布,泊松分布連續(xù):正態(tài)分布,指數(shù)分布有些參數(shù)未知需要估計如果用樣本估計了r個參數(shù),那么當n充分大時χ2近似服從自由度為k-r-1的χ2分布,其中k是分組數(shù)要求每組中的理論頻數(shù)≥5例子1某生產(chǎn)線生產(chǎn)某種零件,檢查100天的次品數(shù)結(jié)果如下試檢驗每天的次品數(shù)是否服從二項分布?(α=0.01)次品數(shù)012345天數(shù)1262627128例子1(續(xù)1)以X記每天的次品數(shù),如果次品數(shù)服從二項分布B(5,p),即H0:H1:X分布不是正態(tài)分布樣本均值

例子1(續(xù)2)理論頻數(shù)表合并得次品數(shù)012345O1262627128E3.3216.1931.6230.8715.072.94O-E-2.329.81-5.61-3.87-3.075.06次品數(shù)≤123≥4O27262720E19.5131.6230.8718.01O-E7.49-5.61-3.871.99例子1(續(xù)3)接受H0例子2珠寶商希望對每天銷售的珠寶數(shù)建模,他記錄了100天的銷售結(jié)果,如下問是否可用泊松分布來擬合?(α=0.05)銷售珠寶數(shù)0123456天數(shù)71726221792例子2(續(xù)1)設(shè)X為每天銷售珠寶數(shù),則原假設(shè)為H0:售出珠寶數(shù)0123456O71726221792E7.4319.3125.1021.7614.147.364.90O-E-0.43-2.310.900.242.861.64-2.9例子2(續(xù)2)接受H0

售出珠寶數(shù)01234≥5O71726221711E7.4319.3125.1021.7614.1412.26O-E-0.43-2.310.900.242.86-1.26例子3調(diào)查745人的收入(元),結(jié)果如下能否用正態(tài)分布來擬合?(α=0.001)用X表示收入H0:X~N(μ,σ2)H1:X不服從正態(tài)分布每月收入≤300(300,500](500,700](700,1000](1000,1500]>1500人數(shù)1502002201005025例子3(續(xù))拒絕H0≤300(300,500](500,700](700,1000](1000,1500]>1500理論概率0.23790.18140.20090.23770.13260.0095理論頻數(shù)177.24135.14149.67177.0998.797.08實際頻數(shù)1502002201005025O-E-27.2464.8670.33-77.09-48.7917.92例子4Chemline公司每年為其遍布美國的4家工廠招聘大約400名新雇員。人事部主管想知道求職者的能力測試分數(shù)總體是否服從正態(tài)分布隨機抽取50名求職者,分數(shù)如下:71,66,61,65,54,93,60,86,70,70,73,73,55,63,56,62,76,54,82,79,76,68,53,58,85,80,56,61,61,64,65,62,90,69,76,79,77,54,64,74,65,65,61,56,63,80,56,71,79,84例子4(續(xù))樣本均值68.42,樣本標準差10.41假設(shè):H0:測試分數(shù)總體服從均值是68.42和標準差是10.41的正態(tài)分布H1:測試分數(shù)總體不服從均值是68.42和標準差是10.41的正態(tài)分布例子4(續(xù))利用測驗分數(shù)的區(qū)間定義類別每一類的理論頻數(shù)至少為5:將正態(tài)分布劃分為10個等概率區(qū)間例子4(續(xù))測驗分數(shù)區(qū)間觀察頻數(shù)期望頻數(shù)55.10以下5555.10~5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論