分布擬和檢驗法的基本原理與步驟_第1頁
分布擬和檢驗法的基本原理與步驟_第2頁
分布擬和檢驗法的基本原理與步驟_第3頁
分布擬和檢驗法的基本原理與步驟_第4頁
分布擬和檢驗法的基本原理與步驟_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

歡迎大家的到來

分布擬和檢驗法的基本原理與步驟分布擬和檢驗引言前面所介紹的各種檢驗法,是在總體分布類型已知的情況下,對其中的未知參數(shù)進(jìn)行檢驗統(tǒng)稱為參數(shù)檢驗.在實際問題中,有時我們并不能確切預(yù)知總體服從何種分布,這時就需要根據(jù)來自總體的樣本對總體分布進(jìn)行推斷,以判斷總體服從何種分這類統(tǒng)計檢驗稱為非參數(shù)檢驗.布,解決這類問題的工具是英國統(tǒng)計學(xué)家K.皮爾遜在1900年發(fā)表的一篇文章中引進(jìn)的所謂檢驗法不少人把此項工作視為近代統(tǒng)計學(xué)的開端.引例從1500到1931年的432年間,每年爆發(fā)戰(zhàn)爭的次數(shù)可以看作一個隨機變量,椐統(tǒng)計,這432年間共爆發(fā)了299次戰(zhàn)爭,具體數(shù)據(jù)如下:根據(jù)所學(xué)知識和經(jīng)驗,每年爆發(fā)戰(zhàn)爭的次數(shù)用一個泊松隨機變量來近似描述,即可以假設(shè)每年可以4415348214212230發(fā)生次戰(zhàn)爭的年數(shù)戰(zhàn)爭次數(shù)一結(jié)為:如何利用上述數(shù)據(jù)檢驗服從泊松分布的假設(shè).爆發(fā)戰(zhàn)爭次數(shù)的分布近似泊松分布.于是問題歸又如,某工廠制造一批骰子,聲稱它是均勻的,即在拋擲試驗中,出現(xiàn)1點,2點,…,6點的概率都應(yīng)是為檢驗骰子是否均勻,要重復(fù)地進(jìn)行拋擲骰子的試驗,并統(tǒng)計各點出現(xiàn)的頻率與的差距.問題歸結(jié)為:如何利用得到的統(tǒng)計數(shù)據(jù)對“骰子均勻”的假設(shè)進(jìn)行檢驗.檢驗法的基本思想檢驗法是在總體的分布未知時,根據(jù)來自總體的樣本,檢驗關(guān)于總體分布的假設(shè)的一種檢驗方法.具體進(jìn)行檢驗時,先提出原假設(shè):總體的分布函數(shù)為如果總體分布為離散型,則假設(shè)具體為總體的分布律為如果總體分布為連續(xù)型,則假設(shè)具體為總體的概率密度函數(shù)為二、然后根據(jù)樣本的經(jīng)驗分布和所假設(shè)的理論分布之間的吻合程度來決定是否接受原假設(shè),這種檢驗通常稱作擬合優(yōu)度檢驗,它是一種非參數(shù)檢驗.一般地,我們總是根據(jù)樣本觀察值用直方圖和經(jīng)驗分布函數(shù),推斷出可能服從的分布,然后作檢驗.檢驗法的基本原理和步驟(1)總體的分布函數(shù)為(2)區(qū)間,記為如可取為其中可取可取區(qū)間的劃分視具體情況而定,使每個小區(qū)間所含樣本值個數(shù)不小于5,而區(qū)間個數(shù)不要太大也不要太小.提出原假設(shè)的取值范圍分成個互不相交的小將總體(3)個小區(qū)間的樣本值的個數(shù)記作把落入第稱為組頻數(shù),所有組頻數(shù)之和三等于樣本容量(4)根據(jù)所假設(shè)的總體理論分布,算出總體的值落入第個小區(qū)間的概率于是就是落入第個小區(qū)間的樣本值的理論頻數(shù).(5)可為真時,當(dāng)為真時,當(dāng)區(qū)間的頻率與概率應(yīng)很接近,次試驗中樣本值落入第個小當(dāng)不真時,與相差較大.引入統(tǒng)計量皮爾遜證明了下列定理:定理當(dāng)充分大時,近似服從分布.(6)對給定的顯著性水平根據(jù)定理,確定值,使查分布表得,所以拒絕域為(7)的實測值落入拒絕域,則拒絕原假設(shè)否則就認(rèn)為差異不顯著而接受原假設(shè)算得統(tǒng)計量若由所給的樣本值例1將一顆骰子擲120次,所得數(shù)據(jù)見下表解則1~6點中每點出現(xiàn)的可能性相同,都為1/6.如果用表示第點出現(xiàn)則待檢假設(shè)在成立的條件下,理論概率問這顆骰子是否均勻、對稱(取若這顆骰子是均勻的、對稱的,由得頻率計算結(jié)果如下表.查表得因此分布不含未知參數(shù),又由上表,知123456231/6209/20261/62036/20211/6202020201/61/61/61/20201515025/2025/20合計1204.8由上表,知123456231/6209/20261/62036/20211/6202020201/61/61/61/20201515025/2025/20合計1204.8故接受認(rèn)為這顆骰子是均勻?qū)ΨQ的.四、總體含未知參數(shù)的情形在對總體分布的假設(shè)檢驗中,分布函數(shù)的形式,但其中還含有未知參數(shù),數(shù)為其中為未知參數(shù).設(shè)自總體的樣本,現(xiàn)要用此樣本函數(shù)來檢驗假設(shè):總體的分布函數(shù)為有時只知道總體的即分布函是取此類情況可按如下步驟進(jìn)行檢驗:利用樣本求出的最(1)大似然估計(2)則就變成完全已知的分布函數(shù)(3)中用代替在時,計算利用計算的估計值(4)計算要檢驗的統(tǒng)計量當(dāng)充分大時,統(tǒng)計量近似地服從分布;(5)得拒絕域?qū)o定的顯著性水平注:在使用皮爾遜檢驗法時,要求每個理論頻數(shù)否則應(yīng)適當(dāng)?shù)睾喜⑾噜彽男^(qū)間,使?jié)M足要求.以及例2參數(shù)為的泊松分布.根據(jù)觀察結(jié)果,得參數(shù)的最大似然估計為按參數(shù)為0.69的泊松分布,的估計是根據(jù)引例所給數(shù)表,將有關(guān)計算結(jié)果列表如下:檢驗引例中對戰(zhàn)爭次數(shù)提出的假設(shè)服從計算事件的概率戰(zhàn)爭次數(shù)實測頻數(shù)01234223142481540.50160.34600.1190.02780.05216.7149.551.612.02.160.1830.3760.2511.654例2參數(shù)為的泊松分布.根據(jù)引例所給數(shù)表,將有關(guān)計算結(jié)果列表如下:檢驗引例中對戰(zhàn)爭次數(shù)提出的假設(shè)服從戰(zhàn)爭次數(shù)實測頻數(shù)01234223142481540.50160.34600.1190.02780.05216.7149.551.612.02.160.1830.3760.2511.654將的組予以合并,即將以生3次及4次戰(zhàn)爭的組歸并為一組.因所假設(shè)的理論分布中有一個未知參數(shù),故自由度為按自由度為2查分布表得因統(tǒng)計量的觀察值未落入拒絕域.的泊松分布.故認(rèn)為每年發(fā)生戰(zhàn)爭的次數(shù)服從參數(shù)為0.69例3投放了四種魚:鮭魚、鱸魚、竹夾魚和鲇魚的魚苗.現(xiàn)在在魚塘里獲得一樣本如下:試取檢驗各類魚的數(shù)量的比例較10前是否有顯著改變.解按題意需檢驗假設(shè):的分布律為一農(nóng)場院10年前在一魚塘里按比例20:15:40:25序號種類1234鮭魚鱸魚竹夾魚鲇魚數(shù)量(條)132100200168以記魚種類的序號,12340.200.150.400.25按題意需檢驗假設(shè):的分布律為以記魚種類的序號,12340.200.150.400.25所需計算列在下表中.現(xiàn)在但故拒絕數(shù)量之比較10年前有顯著改變.認(rèn)為各魚類完例4在一實驗中,每隔一定時間觀察一次由某種鈾共觀察了100次,得結(jié)果如下表所示:其中是觀察到有個粒子的次數(shù).從理論上考慮所放射的到計數(shù)器上的粒子數(shù)應(yīng)服從泊松分布知試在水平0.05下檢驗假設(shè)總體服從泊松分布:解給出,估計由最大似然估計法在假設(shè)下,松分布的假設(shè)能取的值為所有可參數(shù)未具體所以先因在中得即在服從泊下,將其分成如表所示的兩兩不相交的子集解將其分成如表所示的兩兩不相交的子集則有估計計算結(jié)果如表所示,其中有些的組予以適當(dāng)合并,使得每組均有151617261199212100.0150.0630.1320.1850.1940.1630.1140.0690.0360.0170.0070.0030.021.56.313.218.519.416.311.46.93.61.70.70.30.2解計算結(jié)果如表所示,其中有些的組予以組均有151617261199212100.0150.0630.1320.1850.1940.1630.1140.0690.0360.0170.0070.0030.021.56.313.218.519.416.311.46.93.61.70.70.30.24.61519.39415.62234.8457.4237.10511.7395.538適當(dāng)合并,使得每如表中第四列花括號所示.此處,并組后因在計算概率時,估計了一個參數(shù)故的自由度為但查表得現(xiàn)在故在水平0.05下接受即認(rèn)為樣本來自泊松布總體.例5分布,從一批棉紗中隨機抽取300條進(jìn)行拉力試驗,果列在下表中,我們的問題是檢驗假設(shè)解可按以下四步來檢驗:(1)分成13組:將觀測值為檢驗棉紗的拉力強度(單位:公斤)服從正態(tài)結(jié)但是這樣分組后,前兩組和最后兩組的比較小,故(2)這里就是正態(tài)計算每個區(qū)間上的理論頻數(shù).把它們合并成為一個組(見分組數(shù)據(jù)表)棉紗拉力數(shù)據(jù)的分組表解可按以下四步來檢驗:(1)分成組將觀測值(2)這里就是正態(tài)計算每個區(qū)間上的理論頻數(shù).分別用它們的最大似然估計分布的分布函數(shù),含有兩個未知數(shù)和來代替.關(guān)于的計算作如下說明:因拉力數(shù)據(jù)表中的每個區(qū)間都很狹窄,然后將每個區(qū)間的中點值乘以該取這個區(qū)間的中點,區(qū)間的樣本數(shù),將這些值相加再除以總樣本數(shù)就得我們可認(rèn)為每個區(qū)間內(nèi)都和具體樣本均值計算得到:解(2)計算每個區(qū)間上的理論頻數(shù).分別用它們的最大似然估計兩個未知數(shù)和來代替.計算它在上面對于服從的隨機變量個區(qū)間上的概率第(3)如分組表中所列.中落在每個區(qū)間的實際頻數(shù)計算(4)計算統(tǒng)計量值:因為故的自由度為解(4)計算統(tǒng)計量值:因為故的自由度為查表得故拒絕原假設(shè),即認(rèn)為棉紗拉力強度不服從正態(tài)分布.內(nèi)容小結(jié)在實際問題中,有時我們并不能確切預(yù)知總體服從何種分布,這時就需要根據(jù)來自總體的樣本對總體的分布進(jìn)行推斷,以判斷總體服從何種分布,這類統(tǒng)計檢驗稱為非參數(shù)檢驗.本節(jié)介紹了一類非參數(shù)檢驗方法:檢驗法檢驗法的基本思想檢驗法的基本原理和步驟檢驗法--總體含未知參數(shù)的情形檢驗法是在總體的分布未知時,根據(jù)來自總體的樣本檢驗關(guān)于總體分布的假設(shè)的一種試驗方法.具體進(jìn)行檢驗時,先提出原假設(shè):總體的分布函數(shù)為如果總體分布為離散型,則假設(shè)具體為總體的分布律為如果總體分布為連續(xù)型,則假設(shè)具體為總體的概率密度函數(shù)為檢驗法的基本思想檢驗法的基本思想然后根據(jù)樣本的經(jīng)驗分布和所假設(shè)的理論分布之間的吻合程度來決定是否接受原假設(shè),這種檢驗通常稱為擬合優(yōu)度檢驗.它是一種非參數(shù)檢驗.一般地,我們總是根據(jù)樣本觀察值用直方圖和經(jīng)驗分布函數(shù),推斷出總體可能服從的分布,然后作檢驗.1.將總體的取值范圍分成個互不重迭的小區(qū)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論