版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、南京理工大學應用統(tǒng)計學假設檢驗 課程設計報告 課程名稱 課程設計 年 級 2013級 專 業(yè) 應用統(tǒng)計專業(yè) 學生姓名 xxx 成 績: 一引言 假設檢驗是一種實際應用非常廣泛的統(tǒng)計推斷方法,它是從對總體參數或總體的分布函數,相互關系等所作的某種假設開始,在假設成立的條件下構造出一種與假設有關且具有已知分布的統(tǒng)計量,進而通過樣本提供的信息,在一定的概率把握前提下,對所作的假設進行檢驗,以作出接受或拒絕假設的判斷或決策。假設檢驗在人們生活中已經有了廣泛的應用,它的意義也是巨大的。比如,在審計工作的實質性測試中,審計人員有時須形成賬戶余額或交易數值錯報金額的判斷,此過程中統(tǒng)計分析方法有其獨到用處。在
2、審計實際工作及有關審計文獻中,較多關注與使用的是對被審計單位相關經濟指標的參數估計法,而本文針對賬面余額與審計金額間的差異提出了新的統(tǒng)計檢驗方法假設檢驗。從實證結果看,利用假設檢驗不僅可以檢驗審計人員的判斷是否準確,還能度量審計人員做出錯誤結論的風險,有利于審計人員對審計事項的整體把握,提高工作效率。 1假設檢驗的分類: 雙側假設檢驗:在關于假設的檢驗中,當統(tǒng)計量Z的觀測值的絕對值大于臨界值時,拒絕原假設,由于這里的拒絕域分別位于接受域的兩側,因此稱這類假設檢驗為雙側檢驗。 單側假設檢驗:相應的將拒絕域只位于一側的假設檢驗稱為單側假設檢驗。 2假設檢驗的基本思想:小概率原理小概率事件在一次試驗
3、中基本不會發(fā)生。 假設檢驗中最關鍵的步驟就是要構造檢驗統(tǒng)計量,并利用該統(tǒng)計量給出拒絕域,拒絕域的形式一般就是檢驗統(tǒng)計量的取值范圍,完成這一步驟的基本的統(tǒng)計思想就是小概率原理,即小概率事件在一次試驗中基本不會發(fā)生。在原假設正確的條件下,合理的構造小概率事件W,再根據一次試驗的結果考察W有沒有出現,若W出現,則說明原假設正確的前提有問題,因為在這一前提下,根據小概率原理,W作為小概率事件是本來不應該出現的,因此W的出現便否定了;若W沒有出現,則沒有理由認為不正確。 這種推理方法可以說是一種“反證法”,但這種“反證法”使用的不是純數學中的邏輯推理,不同于一般的反證法,一般的反證法要求在原假設成立的條
4、件下導出的結論是絕對成立的,如果事實與之矛盾,那么完全絕對的否定原假設。而這里的“反證法”是帶概率性質的反證法,它的邏輯是:如果小概率事件在一次試驗中發(fā)生,我們就以很大的把握否定原假設。而這里的“小概率”則需要事先給定,一般記為,是很小的正數,通常取為0.01,0.05,0.1,在這里稱之為顯著性水平。我們記為在成立的條件下事件A的概率,同樣地,記為在成立的條件下事件A 的概率,則對拒絕域W應該有: 3 假設檢驗的基本原理: 假設檢驗的最基本原理是顯著性原理,是根據樣本觀測值來判斷是否有顯著差異,這個差異是由兩種可能因素引起的,一是系統(tǒng)性因素,一是偶然性因素。問題的關鍵在于:這個差異是否可以僅
5、以偶然性這個因素去解釋,也就是說是否有充分的理由去否定這種解釋。如果有,就否定原假設,如果沒有,就只能接受它。 4假設檢驗的一般步驟:1 根據研究問題的需要提出原假設和備擇假設,而提出原假設應本著“保守”或“不輕易拒絕原假設”的原則。通常原假設代表一種久已存在的狀況,故我們往往把有把握的、不輕易否定的命題作為原假設,其表達式需包括等號在內;而備擇假設反映一種改變,故我們往往把沒有把握的、不輕易肯定或需要強有力支持的命題(希望證實的假設)作為備擇假設。2 找出檢驗的統(tǒng)計量及其分布。提出假設以后,要作出拒絕還是接受原假設的決定。需根據樣本提供的信息,從概率意義上來判斷。由于樣本所含信息較為分散,因
6、此需要構造一個檢驗的統(tǒng)計量來判斷,許多因素(如總體是否服從正態(tài)分布;樣本容量的大?。槐粰z驗的參數是什么;總體的方差是否已知等)決定了如何構造統(tǒng)計量,統(tǒng)計量服從什么樣的精確(或漸進)分布。3 規(guī)定顯著性水平,確定臨界值、拒絕域。根據檢驗統(tǒng)計量的分布和顯著性水平可以得到檢驗的臨界值和拒絕域;4 根據實測的樣本值,具體計算出所用統(tǒng)計量的值。5 做出拒絕或接受原假設的判斷。若統(tǒng)計量的值落在拒絕域內,說明樣本描述的情況和原假設有顯著差異,應拒絕原假設而接受備擇假設;反之,若統(tǒng)計量的值落在接受域內,則接受原假設而拒絕備擇假設。 5假設檢驗的兩類錯誤: 假設檢驗中也存在犯兩類錯誤的可能。其中,由于犯第二類錯
7、誤的概率(記為)與總體參數的真實水平有關, 因而對它的研究和討論一直停留在理論上,難以在實踐中實現對它的控制。郭寶才(2010)、勵晶晶(2010)等都對該問題展開過有益的討論,但未能提出實際可行的控制方法。本文對于兩類錯誤的成因以及如何控制第二類錯誤進行了探討,希望對于第二類錯誤的控制提出一些解決的方法,本文主要針對單總體參數的假設檢驗來討論,涉及樣本均為簡單隨機樣本。同時,兩類錯誤與勢函數的關系十分密切,這也將是本文討論的一個方面。二兩類錯誤的定義 在假設檢驗中對原假設的真?zhèn)巫髋袛鄷r,如果我們給出了某個檢驗法則,也即給出了樣本空間的一個劃分與。當我們拒絕了原假設時,是因為在一次試驗中小概率
8、事件發(fā)生了,即樣本值落入拒絕域內了;當我們接受原假設時,是因為我們還不能從概率意義上找到拒絕它的依據(樣本值落入拒絕域)了。然而,由于樣本本身具有隨機性,因而當我們利用樣本信息進行推斷時,有可能犯以下兩類錯誤: 第一類(拒真)錯誤:當原假設為真時,而樣本值卻落入拒絕域內了,按照檢驗法則應拒絕。這時,我們把客觀上為真判為不真,稱這種錯誤為“第一類錯誤”或“拒真”錯誤。犯第一類錯誤的概率就是前面提及的小概率,即 第二類(采偽)錯誤:當原假設不真時,而樣本值落入了接受域內了,按照檢驗法則應接受。這時,我們把客觀上不真判為為真,稱這種錯誤為“第二類錯誤”或“采偽”錯誤。犯第二類錯誤的概率通常用表示,即
9、 為明確起見,將假設檢驗的兩類錯誤歸納在下表中。接受拒絕為真決策正確第一類(拒真)錯誤不真第二類(采偽)錯誤決策正確 犯第二類錯誤的概率計算比較復雜,它的數值跟參數的真值有關。三兩類錯誤的起因 第一類和第二類錯誤都是相對于假設而言的,下面通過一個例子來分別說明這兩類錯誤的起因。 例:一個公司有員工3000人,為了檢驗公司員工工資統(tǒng)計報表的真實性,研究者做了50人的大樣本隨機抽樣調查,人均收入的調查結果是:(樣本均值)=871元;S(標準差)=21元問能否認為統(tǒng)計報表中人均收入=880元的數據是真實的?(顯著性水平=0.05) 研究假設:調查數據871與報表數據880之間沒顯著差異,公司員工工資
10、均值的真實情況為880元。 :調查數據和報表數據之間有顯著性的差異,公司員工工資均值的真實情況不是880元。 完成以上統(tǒng)計檢驗遵循這樣的法則: A:樣本平均數的分布服從正態(tài)分布。如果被假設的真實情況880元確實為真,那么樣本平均數的區(qū)間估計為:,即874.18-885.82元; B:如果在這一次的抽樣調查中,樣本的平均數落在以上區(qū)間之內,那么就認為為真;反之,則拒絕。 C:由于在這次實際的抽樣調查中,樣本的平均數為871元,沒有超出以上估計區(qū)間,所以接受,即認為這個公司員工工資的實際平均數為880元。 從上面的邏輯和操作過程中,我們可以看到如下兩個方面的問題,正是由于這兩個問題分別產生了和錯誤
11、:第一個問題是,我們只抽了一個樣本,而個別的樣本可能是特殊的,不管抽樣多么符合科學抽樣的要求,理論上講,在3000個員工中隨機抽取50人作為調查樣本,有很多種構成樣本的可能性。如果一個樣本的平均數是880元,不代表任何一個樣本的平均數都是880元。按照正態(tài)分布理論,也有5%的樣本平均數不在874.18-885.82范圍之內,這樣的事件稱為小概率事件。由于實際上我們只做了一次調查,不知道是否這個樣本平均數就是小概率事件,如果這個調查的平均數超出了上述所說的范圍,而且是小概率事件發(fā)生的結果(由我們假設),并且根據小概率原理這樣的事件是基本不會發(fā)生的,那么我們必然要拒絕原假設,但是基本不會發(fā)生也就是
12、說還是可能發(fā)生,雖然錯誤發(fā)生的可能性比a小,但這樣的可能畢竟是存在的。也就是說當確屬為真時,檢驗統(tǒng)計量也有概率為的可能落人拒絕域,這一錯誤的概率就是,是為真的情況下計算出的統(tǒng)計量落入拒絕域的概率,這一概率也就是下圖陰影部分的面積。 第二個問題是,統(tǒng)計檢驗的邏輯犯了從結論推斷前提的錯誤。法則B是由法則A推斷出來的。即如果A是正確的,那么B可能是正確的。相反,如果結果B是真實的,A的正確與否我們還不能判斷。也就是說,如果一次調查的結果的樣本平均數落在上述區(qū)間之內,我們無法判斷所有員工平均工資為800元這一結論就是真。這就是第二類(納偽)錯誤出現的原因。也就是說,由于檢驗是在Ho:的前提下展開的,故
13、檢驗是在平均數為的正態(tài)分布中進行的,只要x落入接受域,就可能犯納偽錯誤,這一錯誤的產生不是以為為中心的正態(tài)曲線下在該區(qū)間的面積,不是,因為這時X實際所服從的是以()為中心的正態(tài)分布,因此納偽錯誤的概率就是落入后者接受域的概率,這一概率就是所服從的以為中心的正態(tài)分布曲線下在該區(qū)間的面積,見下圖。 四第二類錯誤的計算 1.設總體X,且方差已知時,,其中; 當為真時,有 由于,則犯第二類錯誤的概率為但實際上為假,即,即,則因此2.方差已知時,;可知改檢驗問題的拒絕域為,類似的有: (1)3.均值未知,其中當為真時,有故第二類錯誤的概率為:4.均值未知時,;可知該檢驗問題的拒絕域為類似的有,S為樣本標
14、準差五如何控制犯“二類”錯誤 1. 兩類錯誤間的關系: 很多時候,我們只注意到了的選取,都認為犯第一類錯誤的概率越小越好,但這是不正確的,我們可以從上面的犯第二類錯誤的概率值看出,在其他條件都不變的情況下,越小,越大;反之,。例如(1)式,當越小時,越大,由于分布函數是單調遞增的,因此越小,越大。 2. 與第二類錯誤有關的因素: (1)與顯著性水平有關,越小,越大。即之間存在“此消彼長”的關系。 (2)與真實值有關。同理從(1)式看出,越大,越小。也就是說,的差異越明顯,犯第二類錯誤的概率越小。 (3)與樣本值n有關。顯然,其他不變時,n越大,越大,也將越小。并且,其他量一定時,隨著n的增大,
15、為使減小一個相同的絕對量,需要增加的n 將越來越大。同時也可以這樣理解,增加了樣本量之后,均數的抽樣誤差小,樣本均數的代表性強,也就是樣本均數較接近總體均數,因而可使犯第一和第二類錯誤的概率減少。 i.下面舉例,給定參數計算第一種情況的二類錯誤,并說明如何確定樣本量n。例:設,均值只取兩值之一,記為樣本容量為n(n=36)的樣本均值,檢驗假設 由于總體X服從正態(tài)分布,樣本均值,拒絕或接受取決于隨機變量(或)落在什么區(qū)間。我們把樣本空間劃分成互不相交的兩部分,若檢驗的法則規(guī)定:,即;接受。于是有 (2) (3) 假設n一定,欲使小,則由(2)式知應增大,由于是嚴格增函數,故要求C增大,但從(3)
16、式知,C增大也會隨之增大;反之,欲使小必會導致增大。 取=0.05,查正態(tài)分布表得臨界值 即 =63.742 犯第二類錯誤的概率為 顯然這個概率是相當大的。 在其他條件不變的情況下,如果要降低第二類錯誤的概率(=0.05),且保持=0.05不變,此時只能增大樣本容量。 由 易得: 即 查表得 則n=271 ii.下面舉例,給定參數計算第三種情況的第二類錯誤: 例:均值未知,樣本容量n=16,顯著性水平,考慮檢驗問題: 由上面的理論推導知,“取偽”概率 3. 具體說明在不同情況下樣本容量的選擇 (1)均值檢驗的樣本容量選擇 假設為來自正態(tài)總體的簡單隨機樣本,樣本均值為,樣本容量為n,已知。 a
17、方差已知的情形。當方差已知時,重置抽樣下 若為真,;若為真,。 建立原假設為: : 在這樣的假定下,有 其中,c為臨界值,經標準化后服從N(0,1),所以 根據上面兩式分別解出c,有 可查表求得,于是解之可得 同理,對于左側檢驗和雙側檢驗,樣本容量的確定公式分別為: 左側檢驗 雙側檢驗 b 方差未知的情況。當方差未知時,其中,S=。建立原假設為: ,于是,與方差已知時分析思路相同得到:由,因而可用來分別替代,那么因此,樣本容量確定公式為同理,對于左側檢驗和雙側檢驗,兩類錯誤條件下的樣本容量確定公式為:左側檢驗雙側檢驗 (2)方差檢驗的樣本容量選擇 建立原假設為: 當為真時,; 當為真時,。 于
18、是: 同時 因此 從而解得: 那么對于左側檢驗和雙側檢驗,兩類錯誤條件下的樣本容量確定公式分別為:左側檢驗雙側檢驗六勢函數(功效函數) 1.定義:設某檢驗問題的拒絕域為W,則樣本觀測值X落在拒絕域W內的概率稱為該檢驗的功效函數,記為,為原假設和備擇假設中的參數。 2.勢函數的計算: 方差已知時,,其中; = (2)方差已知時,; = (3) 均值未知,其中; = (4)均值未知時,; = 7. 控制犯“二類”錯誤的重要性及應用 在生活和生產中的許多方面都需要用到假設檢驗,用到假設檢驗就不得不考慮兩類錯誤,為了盡量同時減少兩類錯誤的發(fā)生,人們往往會通過增大樣本容量的方法達到目的。但是有的時候,增
19、大樣本容量反而會使試驗成本增加得不償失。因此在有些應用上,需要在第一類和第二類錯誤中做出選擇,盡可能的減少損失。下面是控制假設檢驗二類錯誤的理論在體育學中的應用。 如果知道運動員挫傷的自然治愈率為0.25,為了試驗一種外用新藥是或否有效,把它給10個運動員使用。我們事先規(guī)定一個決策規(guī)劃:若這10個病人中至少有4人治愈過程加快,則認為這種藥有效,提高了治愈率;反之,則認為無效。下面我們來計算一下: (1)雖然新藥有效,并把治愈率提高到了0.35,但通過試驗卻被否定的概率(即犯第一類錯誤的概率) (2)新藥完全無效,但通過檢驗卻被判斷為有效的概率(即犯第二類錯誤的概率)先來看(1)。在每次試驗中,
20、此人治愈加快(“成功”)的概率P=0.35,治愈速度不變(“失敗”)的概率為1-0.35=0.65.而且10個人的治愈加快與否可以認為彼此不影響,這樣可以認為此問題為貝努里模型的10重貝努里試驗。于是“否定新藥”這一事件等價于P=0.35時,“10個人中至少有3個人治好”這一事件,故所求概率為P(否定新藥)=就是說犯第一類錯誤的概率為0.5136.再來算犯第二類錯誤的概率,這時須注意的是,現在新藥實際上是無效的,因而治愈加快率是自然治愈率0.25,而不是0.35.因此我們不能把(2)中的“判斷新藥有限”當成是(1)中的“否定新藥”的對立事件,此時有P(判斷新藥有效)=如果我們把決策規(guī)則修改為“
21、若10個病人使用了新藥后至少有三個人治好了,則認為這種藥有效,它提高了治愈率;反之則認為無效”。這時由此例看到,當由0.5136減小至0.2615,反而由0.2241增至0.4744.我們在試驗中應該正確認識這種的辯證關系,根據具體情況來決定是否應該增大而減小。拿此例來說,我們知道藥品德效用是關系到人身健康的問題,因此,如果選擇增大,即新藥有效而被否定,犯了第一類錯誤,這是可能造成經濟上的損失,但不會危機人的生命。如果新藥無效而被肯定,則可能危機人的生命,也就是說,對于此類問題,應盡量減少犯第二類錯誤的概率8 結論 假設檢驗是統(tǒng)計學中十分關鍵的部分,為了更加精確的進行假設檢驗,我們就要考慮到兩類錯誤的發(fā)生,一類是“棄真”錯誤,一類是“納偽”錯誤。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國國庫集中支付系統(tǒng)行業(yè)投資前景及策略咨詢研究報告
- 二零二五版智能小區(qū)門窗定制與物業(yè)智能化運營合同3篇
- 2025年消防設備設施檢測與總承包合同
- 二零二五版農產品出口合同食品安全標準規(guī)定3篇
- 2024-2030年中國超聲波清洗液行業(yè)市場全景監(jiān)測及投資前景展望報告
- 二零二五年度餐飲業(yè)節(jié)能改造工程合同6篇
- 二零二四年度專業(yè)技術人才引進與委托培養(yǎng)合同3篇
- 2025年中國電絕緣紙板行業(yè)市場深度分析及發(fā)展趨勢預測報告
- 2025年LED七粒頭燈項目投資可行性研究分析報告
- 2025年度零擔運輸合同電子簽章實施規(guī)范4篇
- 2019級水電站動力設備專業(yè)三年制人才培養(yǎng)方案
- 室內裝飾裝修施工組織設計方案
- 洗浴中心活動方案
- 送電線路工程施工流程及組織措施
- 肝素誘導的血小板減少癥培訓課件
- 韓國文化特征課件
- 抖音認證承諾函
- 清潔劑知識培訓課件
- 新技術知識及軍事應用教案
- 高等數學(第二版)
- 肺炎喘嗽的中醫(yī)護理常規(guī)
評論
0/150
提交評論