版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
胡雪梅QQ:182048520E-mail:huxuem@163.com
第三章
數學與統(tǒng)計學院單一樣本的推斷問題主要內容第一節(jié)符號檢驗和分位數推斷假設總體,是總體的中位數,對于假設檢驗問題:是待檢驗的中位數取值
定義:,則在零假設情況下,在顯著性水平為的拒絕域為其中k是滿足上式最大的k值。
例3.1.假設某地16座預出售的樓盤均價,單位(百元/平方米)如下表所示:
36323125283640324126353532873335
解一:用t檢驗法用T統(tǒng)計量結論:不能拒絕H0。解二:用符號檢驗法在顯著性水平0.05下,拒絕H0。符號檢驗與t檢驗得到了相反的結論,到底選擇哪一種結果呢?結論:符號檢驗在總體分布未知的情況下優(yōu)于t檢驗!補充:R中的t檢驗法的用法t-test(x)X1,X2,…,Xn~N(a,σ2),H0:a=a0,H1:a≠a0補充:R中的t檢驗法的用法例如,某食品廠用自動裝罐機裝罐頭食品,每罐質量為500g,現(xiàn)從每天生產的罐頭中隨機抽測9罐,其質量分別為:510,505,498,503,492,502,497,506,495(單位:g)欲檢驗H0:a=500,H1:a≠500>t.test(x-500)data:x-500t=0.46,df=8,p-value=0.6578alternativehypothesis:meanisnotequalto095percentconfidenceinterval:-3.5674715.345249sampleestimates:meanofx0.88888892)配對t檢驗法
X1,X2,…,Xn~N(a1,σ12),Y1,Y2,…,Yn~N(a2,σ22),H0:a1=a2,H1:a1<a2補充:R中的t檢驗法的用法例如,欲比較甲乙兩種輪胎的耐磨性,現(xiàn)抽取數據如下:甲:4900,5220,5500,6020,6340,7660,8650,4870乙:4930,4900,5140,5700,6110,6880,7930,5010欲檢驗H0:a1=a2,H1:a1<a2>x<-c(4900,5220,5500,6020,6340,7660,8650,4870)>y<-c(4930,4900,5140,5700,6110,6880,7930,5010)>t.test(x,y,alternative=“l(fā)ess”,paired=T)補充:R中的t檢驗法的用法Pairedt-Testdata:xandyt=2.8312,df=7,p-value=0.9873alternativehypothesis:meanofdifferencesislessthan095percentconfidenceinterval:NA534.1377sampleestimates:meanofx-y320接受H0,認為兩種輪胎無顯著性差異.結果討論k是滿足式子的最大值
單邊符號檢驗問題[例]生產過程是否需要調整。某企業(yè)生產一種鋼管,規(guī)定長度的中位數是l0米。現(xiàn)隨機地:從正在生產的生產線上選取10根進行測量,結果:
9.89.8,10.0,9.710.0,9.99.8分析:中位數是這個問題中所關心的一個位置參數。若產品長度真正的中位數大于或小于10米,則生產過程需要調整。這是一個雙側檢驗,應建立假設大樣本結論當n較大時:當n不夠大的時候可用修正公式進行調整。雙邊:,p-值左側:,p-值右側:,p-值
例3.2設某化妝品廠商有A和B兩個品牌,為了解顧客對A品牌和B品牌在使用上的差異,將A品牌和B品牌同時交給45個顧客使用,一個月后得到如下數據:喜歡A品牌的客戶人數:22人喜歡B品牌的客戶人數:18人不能區(qū)分的人數:5人解:假設檢驗問題:由給定的數據知:運用大樣本的性質,結論:不能拒絕零假設。符號檢驗在配對樣本比較中的應用
配對樣本(x1,y1),(x2,y2),…(xn,yn)
將記為“+”,記為“-”,記為“0”,記P+
為“+”比例,P-
為“-”比例,那么假設檢驗問題:可以用符號秩檢驗。H0:P+=P-
H1:P+=P-例3.4如右表是某種商品在12家超市促銷活動前后的銷售額對比表,用符號檢驗分析促銷活動的效果如何?連促銷前促銷后鎖銷售額銷售額符號店14240+25760-33838044947+56365-63639-74849-85850+947470105152-118372+122733-結論:不能拒絕零假設。
根據同樣原理,可以將中位數符號檢驗推廣為任意分位點的符號檢驗。例3.1.假設某地16座預出售的樓盤均價,單位(百元/平方米)
36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35
36323125283640324126353532873335------0-+----+--S+=2,S-=13,Pbinom(15,0.75){min{S+,S-}<2}=0因此,拒絕H0。>binom.test(sum(x>40),length(x)-1,0.75) Exactbinomialtestdata:sum(x>40)outoflength(x)-1numberofsuccesses=2,n=15,p-value=9.23e-07alternativehypothesis:pisnotequalto0.75
R編程計算:95percentconfidenceinterval:0.016575910.40460270sampleestimates:probabilityofsuccess0.1333333Cox-Staut趨勢存在性檢驗
檢驗原理:設數據序列:,雙邊假設檢驗問題:令:取數對,,為正的數目,為負的數目,當正號或者負號太多的時候,認為數據存在趨勢。在零假設情況下Di服從二項分布。從而轉化為符號檢驗問題。X1,X2,…,Xn例3.6某地區(qū)32年來的降雨量如下表問(1):該地區(qū)前10年來降雨量是否有變化?(2):該地區(qū)32年來降雨量是否有變化?年份19711972197319741975197619771978降雨量206223235264229217188204年份19791980198119821983198419851986降雨量182230223227242238207208年份19871988198919901991199219931994降雨量216233233274234227221214年份19951996199719981999200020012002降雨量226228235237243240231210=5,結論:不能拒絕零假設。>x<-c(206,223,235,264,229)>y<-c(217,188,204,182,230)>binom.test(sum(x<y),length(x),0.5) Exactbinomialtestdata:sum(x<y)outoflength(x)numberofsuccesses=2,n=5,p-value=1alternativehypothesis:pisnotequalto0.5>x<-c(206,223,235,264,229,217,188,204,182,230,223,227,242,238,207,208)>y<-c(216,233,233,274,234,227,221,214,226,228,235,237,243,240,231,210)>binom.test(sum(x>y),length(x-y),0.5) Exactbinomialtestdata:sum(x>y)outoflength(x-y)numberofsuccesses=2,n=16,p-value=0.004181alternativehypothesis:pisnotequalto0.5結論:拒絕H0,認為降雨量有明顯變化.>rain<-c(206,223,235,264,229,217,188,204,182,230,223,227,242,238,207,208,216,233,233,274,234,227,221,214,226,228,235,237,243,240,231,210)>year<-1971:2002>anova(lm(rain~(year)))AnalysisofVarianceTableResponse:rainTermsaddedsequentially(firsttolast)DfSumofSqMeanSqFValuePr(F)year1535.36535.36371.5792280.2185691Residuals3010170.11339.0035接受H0,認為降雨量線性趨勢并不顯著.隨機游程檢驗游程的概念一個總體,如按性別區(qū)分的人群,按產品是否有毛病區(qū)分的總體等等,隨機從中抽取一個樣本,樣本也可以分為兩類;類型I和類型E。若凡屬類型I的給以符號A,類型E的給以符號B,則當樣本按某種順序排列(如按抽取時間先后排列)時,一個或者一個以上相同符號連續(xù)出現(xiàn)的段,就被稱作游程,也就是說,游程是在一個兩種類型的符號的有序排列中,相同符號連續(xù)出現(xiàn)的段。例如,將某售票處排隊等候購票的人按性別區(qū)分,男以A表示,女以B表示。按到來的時間先后觀察序列為:AABABB。在這個序列中,AA為一個游程,連續(xù)出現(xiàn)兩個A;B是一個游程,A也是一個游程,BB也是一個游程。于是,在這個序列中,A的游程有2個,B的游程也有2個,序列共有4個游程。每一個游程所包含的符號的個數,稱為游程的長度。如上面的序列中,有一個長度為2的A游程、一個長度為2的B游程,長度為1的A游程、B游程也有1個。游程:01111為兩個游程游程長度:一個游程中數據的個數一個序列里游程個數記為R.例3.7序列1100001110110000111100R=8,游程長度分別為2,4,3,1,2,4,4,2極端情況:000001111111R=20101010101010R=2min(n0,n1)+1
所以,2≤R≤2min(n0,n1)+1極端情況都說明數據不具有隨機性。R服從什么分布呢?
檢驗原理和計算方法
設是由0或者1組成的序列,假設檢驗問題:
R為游程個數,假設有個0,個1,,這時R取任何一個值的概率都是,R的條件分布
建立了抽樣分布之后,在零假設成立時,可以計算或者的值,進行檢驗。
X1,X2,…,Xn小樣本的例子(p69例3.8)H0:樣本中的觀測是隨機產生的.Ha:樣本中的觀測是隨機產生的
=.05n1=18n2=8R=12由于7
R=1217,不能拒絕H0RunsTest:大樣本的例子經驗表明:如果n1或n2>20,R
的抽樣分布近似為正態(tài)RunsTest:大樣本例子(p70例3.10)H0:樣本中的觀測是隨機產生的.Ha:樣本中的觀測是隨機產生的
=.05n1=40n2=10如果-1.96
Z
1.96,不能拒絕H0否則拒絕H0.11
2
3
4
5
6
7
8
9
0
11NNNFNNNNNNNFNNFFNNNNNNFNNNNFNNNNN12
13FFFFNNNNNNNNNNNN
R=13RunsTest:大樣本例子-1.96
Z=-1.811.96,不能拒絕H0/web/packages/tseries/index.html>library(tseries)>run1=c(1,1,1,0,rep(1,7),0,1,1,0,0,rep(1,6),+0,rep(1,4),0,rep(1,5),rep(0,4),rep(1,13))>ff=as.factor(run1)>runs.test(ff)RunsTestdata:ffStandardNormal=-1.8074,p-value=0.0707alternativehypothesis:two.sidedWilcoxon符號秩檢驗
基本概念及性質
對稱分布的中心一定是中位數,在對稱分布情況下,中位數不唯一,研究對稱中心比中位數更有意義。
例:下面的數據中,O是對稱中心嗎?0稱連續(xù)分布F(x)關于對稱,如果稱是分布的對稱中心。Wilcoxon符號秩檢驗既考慮了Xi-M0的符號,又考慮其大小。Wilcoxon符號秩檢驗原理以及性質
如果數據關于0點對稱,那么對稱中心兩側的數據疏密程度應該一樣,取正值數據在絕對值樣本中的秩和與取負值在絕對值樣本中的秩和相近。用表示在絕對值樣本中的秩,Wilcoxon符號秩統(tǒng)計量定義為:
正等級的總和即正秩次總和
負等級的總和即負秩次總和Wilcoxon符號秩檢驗原理以及性質例3.11如果樣本值:9,13,-7,10,-18,4,計算符號秩統(tǒng)計量。X1X2X3X4X5X6913-710-184|X1||X2||X3||X4||X5||X6|R1+=3R2+=5R3+=2R4+=4R5+=6R6+=1Wilcoxon符號秩檢驗步驟:3.令表示和對應的的秩和,令表示和對應的的秩和。
2.找出的秩,打結時取平均秩。1.計算4.雙邊檢驗,取,當W很小時拒絕零假設;對,?。粚?,取。
5.根據W的值查Wilcoxon符號秩檢驗分布表。對n很大的時候,可以采用正態(tài)近似。
Wilcoxon符號秩統(tǒng)計量分布
在小樣本情況下可以計算Wilcoxon符號秩統(tǒng)計量的精確分布。在大樣本情況下可以使用正態(tài)近似:
計算出Z值以后,查正態(tài)分布表對應的p-值,如果p-值很小,則拒絕零假設。
在小樣本情況下,用連續(xù)性修正公式:
例3.12
為了解垃圾郵件對大型公司決策層工作發(fā)影響程度,某網站收集了19家大型公司的CEO郵箱里每天收到的垃圾郵件數,得到如下數據:(單位:封)310350370377389400415425440295325296250340298365375360385問收到垃圾郵件的數量的中心位置是否超出320封?使用Wilcoxon符號秩檢驗法計算如下:例3.121030505769809510512025-++++++++-2710121416171819652470202245554065+--+-++++151534911813結論:不拒絕原假設。例3.12用R的內置函數計算格式:wilcox.test(x,y,alternative="two.sided",mu=0,paired=F,exact=T,correct=T)alternative"two.sided“or"greater"or"less"
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2022年甘肅省甘南自治州公開招聘警務輔助人員筆試自考題2卷含答案
- 2022年四川省雅安市公開招聘警務輔助人員輔警筆試自考題2卷含答案
- 2022年浙江省湖州市公開招聘警務輔助人員輔警筆試自考題1卷含答案
- 晨會主持發(fā)言稿
- 廣西梧州市(2024年-2025年小學六年級語文)統(tǒng)編版隨堂測試(下學期)試卷及答案
- 2024年姿態(tài)控制推力器、推進劑貯箱項目資金需求報告代可行性研究報告
- 《應收款項新》課件
- 《稱贊教學》課件
- 2025年毛紡織、染整加工產品項目立項申請報告模范
- 2025年水乳型涂料項目提案報告模范
- 教育理念和教育方法
- 九小場所安全檢查表
- 第四代住宅百科知識講座
- 2022-2023學年佛山市禪城區(qū)六年級數學第一學期期末達標測試試題含解析
- 《廣聯(lián)達培訓教程》課件
- 揚州育才小學2023-2024六年級數學上冊期末復習試卷(一)及答案
- 蔚藍時代有限公司員工培訓現(xiàn)狀分析及改進措施研究
- 浙江省溫州市2022-2023學年五年級上學期語文期末試卷(含答案)3
- 軟件系統(tǒng)實施與質量保障方案
- 2023-2024學年度第一學期四年級數學寒假作業(yè)
- UV激光切割機市場需求分析報告
評論
0/150
提交評論