版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第八章 2檢驗(yàn) 孫海龍內(nèi)容 一、2檢驗(yàn)概述 二、總體分布的假設(shè)檢驗(yàn) 三 、獨(dú)立性檢驗(yàn)引言推斷統(tǒng)計(jì)參數(shù)檢驗(yàn)正態(tài)分布和方差同質(zhì)非參數(shù)檢驗(yàn)對分布較少有要求,也叫用于名義/順序型數(shù)據(jù)均值檢驗(yàn)方差分析2檢驗(yàn)其他非參數(shù)檢驗(yàn)參數(shù)統(tǒng)計(jì)和非參數(shù)統(tǒng)計(jì)優(yōu)缺點(diǎn) 參數(shù)統(tǒng)計(jì)優(yōu)點(diǎn): 對資料的分析利用充分 統(tǒng)計(jì)分析的效率高缺點(diǎn): 對資料的要求高 適用范圍有限 非參數(shù)統(tǒng)計(jì)優(yōu)點(diǎn):對資料的沒有特殊要求 不受分布的影響(偏態(tài)、分布不明的資料) 不受方差齊性的限制 不受變量類型的影響 不受樣本量的影響缺點(diǎn): 檢驗(yàn)效率低(易犯型錯(cuò)誤) 對信息的利用不充分。因此在二者都可用時(shí),總是用參數(shù)檢驗(yàn)因此在二者都可用時(shí),總是用參數(shù)檢驗(yàn)引言 實(shí)際應(yīng)用
2、情況:調(diào)查、問卷、訪談等方法中,按性質(zhì)劃分類別,然后將結(jié)果按類計(jì)點(diǎn)人數(shù)或個(gè)數(shù),得到計(jì)數(shù)數(shù)據(jù)。 類別變量(1)只能劃分為類別,如性別、民族;(2)人為劃分類別,如學(xué)習(xí)成績(連續(xù)數(shù)據(jù))分成優(yōu)、良、中、差。 這些計(jì)數(shù)數(shù)據(jù)不能使用前幾章所講的統(tǒng)計(jì)方法,需要用到計(jì)數(shù)數(shù)據(jù)專用的統(tǒng)計(jì)方法,這些分析方法主要是根據(jù)2(卡方)分布進(jìn)行的,故稱為卡方檢驗(yàn)。這類數(shù)據(jù)大都以表格形式表示,所以又稱列聯(lián)表分析。一、2檢驗(yàn)概述1.單變量的卡方檢驗(yàn):同時(shí)檢驗(yàn)一個(gè)因素兩項(xiàng)或多項(xiàng)分類的實(shí)際觀察數(shù)與某理論次數(shù)分布是否相一致的問題,或說有無顯著差異的問題。這種檢驗(yàn)又稱為擬合度檢驗(yàn)。理論次數(shù)是指根據(jù)概率原理、某種理論、某種理論次數(shù)分布或
3、經(jīng)驗(yàn)次數(shù)分布所計(jì)算出來的次數(shù)。3獨(dú)立類別的卡方檢驗(yàn):用于檢驗(yàn)兩個(gè)或兩個(gè)以上因素(變量)各有多項(xiàng)分類之間是否有關(guān)聯(lián)或是否具有獨(dú)立性的問題。如不同性別的人在態(tài)度上是否有差異。這類檢驗(yàn)又稱獨(dú)立性檢驗(yàn)。一、2檢驗(yàn)概述卡方檢驗(yàn)的基本公式實(shí)際觀察次數(shù)與某理論次數(shù)之差的平方再除以理論次數(shù),即 f0:觀察次數(shù) f e :期望次數(shù)其中,f e 期望次數(shù)越大(大于5),分布越接近卡方分布。 keefff20一、2檢驗(yàn)概述 指用樣本數(shù)據(jù)檢驗(yàn)總體分布的形狀或比率,以確定與假設(shè)的總體性質(zhì)的匹配度,是對次數(shù)分布的檢驗(yàn)。(一)研究情境主要用于實(shí)際觀察次數(shù)(f0)與某理論次數(shù)(fe)是否有差別的分析。例如,在醫(yī)生職業(yè)中,男的
4、多還是女的多?在三種咖啡中,哪種被國人最喜歡?在北京大學(xué)中,各國留學(xué)生的比例有代表性嗎?二、總體分布的擬合檢驗(yàn)(一)定義(二)統(tǒng)計(jì)假設(shè)及相關(guān)計(jì)算 H0: f0 = fe H1: f0 fe 運(yùn)用基本公式計(jì)算出卡方值查表,比較其與臨界卡方值的大小,如果注意注意:卡方值分布全部為正值,但f0-f e可能是負(fù)值,因此,卡方檢驗(yàn)是雙側(cè)檢驗(yàn),0.05和0.01是指雙側(cè)概率而言。擬合度檢驗(yàn)需要先計(jì)算理論次數(shù),這是計(jì)算卡方值的關(guān)鍵性步驟。(一般根據(jù)某種理論或經(jīng)驗(yàn))二、總體分布的擬合檢驗(yàn)實(shí)際觀察次數(shù)與某理論次數(shù)之差的平方再除以理論次數(shù),即 f0:觀察次數(shù) f e :期望次數(shù)其中,f e 期望次數(shù)(大于5)。
5、keefff20二、總體分布的擬合檢驗(yàn)(三)擬合檢驗(yàn)公式例1 某項(xiàng)民意測驗(yàn),答案有同意、不置可否和不同意三種,調(diào)查結(jié)果如下表:同意不置可否不同意Nfi24121248問:三種意見的人數(shù)是否有顯著不同?有顯著差異。即此項(xiàng)民意測驗(yàn)的態(tài)度所以,推翻原假設(shè),)(查表理論次數(shù)所以各類別概率皆為分類數(shù)是各分類的概率相等該題為檢驗(yàn)無差假設(shè)解 ,02. 0p , 99. 52 , 213df, 6161612161612161624,163148e , 1/3, 3,:H ,:205. 02205. 02222i0二、總體分布的擬合檢驗(yàn)例2 某班學(xué)生50人,體檢結(jié)果按一定標(biāo)準(zhǔn)劃分為甲、乙、丙三類,各類人數(shù)分別
6、為:甲類16人,乙類24人,丙類10人,問該班學(xué)生的身體狀況是否符合正態(tài)分布?正態(tài)分布。不符合,該班學(xué)生的身體狀態(tài)推翻,查表,各類別的理論次數(shù)為:。曲線下的面積應(yīng)為:之間,丙類:為:之間,曲線下的面積應(yīng)乙類:,曲線下的面積應(yīng)為:之間,甲類:為故各類人數(shù)應(yīng)占的比例。應(yīng)該相同,即且各類別所占的橫坐標(biāo)全體數(shù)據(jù),包括了在正態(tài)分布中可以認(rèn)為算。理論次數(shù)按正態(tài)分布計(jì)合正態(tài)分布該班學(xué)生的身體狀況符解丙乙甲02005. 022005. 031i222i2ii20H ,005. 0p , 6 .10 , 21-3df,44.1188103434248816ee-f 8500.1587e 34,500.6826e
7、 8,500.1587e0.15870.3413-0.50 -3-1- 6826. 023413. 0 11 1587. 03413. 050. 0 13 236 3 :H :例3 下表所列資料是552名中學(xué)生的身高次數(shù)分布,問這些學(xué)生的身高分布是否符合正態(tài)分布。身高分組組中值 Xc實(shí)際次數(shù)fiXc-X=xZ=x/S查正態(tài)分布表求yPi=y(組距) Sei=yN169-166-163-160-157-154-151-148-145-142-139-17016716416115815515214914614314027225711012411280258415.3812.389.386.383.
8、380.38-2.62-5.62-8.62-11.62-14.623.032.441.851.260.670.07-0.52-1.11-1.70-2.29-2.880.00400.00200.07200.18400.31870.39790.34840.21540.09400.02890.00670.002370.012010.042600.108880.188580.235440.206150.127460.055620.017100.003961724601041301147031920.1250.1670.1500.4710.2770.0351.4291.1610.090N=552, X=
9、154.62, S=5.072=3.905iiieef2ccciiiii29ii2i 1i:(1) XXx, xX -X;X -Xx(2) Z;SS(3) Zy(4) py;S(5) epN5 9f -e3.905,e解 計(jì)算理論次數(shù)的步驟求各組組中值與平均數(shù) 的離差即求各離差的標(biāo)準(zhǔn)分?jǐn)?shù)根據(jù)各 分?jǐn)?shù)查正態(tài)分布表求相應(yīng)的值;組距求 各分組的概率求各組的理論次數(shù)由于第一組和最后一組的理論次數(shù), 所以第一、二組合并,最后一組和前一組合并,總組數(shù)為 。20.05220.05 df9-36 (6)12.6, p0.05, 552在計(jì)算理論次數(shù)的過程中共用到平均數(shù),標(biāo)準(zhǔn)差和總數(shù)三個(gè)統(tǒng)計(jì)量,故本題的自由度為
10、 ,查卡方分布表,故差異不顯著,即名中學(xué)生的身高分布符合正態(tài)分布。二、總體分布的擬合檢驗(yàn)三、獨(dú)立性檢驗(yàn) 主要用于兩個(gè)或兩個(gè)以上因素多項(xiàng)分類的計(jì)數(shù)資料分析。如果要研究的兩個(gè)自變量之間是否具有獨(dú)立性或有無關(guān)聯(lián)或有無“交互作用”的存在,就要應(yīng)用卡方獨(dú)立性檢驗(yàn)。 如果兩個(gè)子變量是獨(dú)立的,無關(guān)聯(lián)的,就意味著對其中一個(gè)自變量來說,另一個(gè)自變量的多項(xiàng)分類次數(shù)上的變化是在取樣誤差的范圍之內(nèi)。假如兩個(gè)因素是非獨(dú)立,則稱兩變量有交互作用。(一)適用材料虛無假設(shè):兩變量(或多變量)之間是獨(dú)立的或無關(guān)聯(lián)的備擇假設(shè):兩變量之間有關(guān)聯(lián)或差異顯著,一般用文字?jǐn)⑹?,不用統(tǒng)計(jì)符號。例4:某學(xué)校對學(xué)生的課外活動內(nèi)容進(jìn)行調(diào)查,結(jié)果
11、整理成下表: 三、獨(dú)立性檢驗(yàn)(二)統(tǒng)計(jì)假設(shè) 虛無假設(shè):體重自我知覺與性別無關(guān)自我知覺總和過輕過重女性419(786.78)1995 (1627.22)2414男性959 (591.22)855 (1222.78)1814總和137828504228(二)統(tǒng)計(jì)假設(shè)三、獨(dú)立性檢驗(yàn)計(jì)算自我知覺過輕過重女性(419-786.78)2/786.78=171.92( 1995 -1627.22) 2 /1672.22=83.12男性228.78110.622 2 (1)=594.44 df=1 a= 0.05 臨界值臨界值3.84 因素Y因 素 X分類1分類2分類1aba+b分類2cdc+da+cb+dn
12、 1222dbcadcbabcadn(三) 22 列聯(lián)表 檢驗(yàn) 三、獨(dú)立性檢驗(yàn)2 觀察頻數(shù)觀察頻數(shù)a a對應(yīng)的理論頻數(shù)為:對應(yīng)的理論頻數(shù)為: 式中TRC為第R(row)行、第C(column)列的理論頻數(shù),nR為相應(yīng)行的合計(jì),nc為相應(yīng)列的合計(jì),n為總例數(shù).ncabaBAnPT)()(1111nnnTCRRC.三、獨(dú)立性檢驗(yàn)(三) 22 列聯(lián)表 檢驗(yàn) 2 檢驗(yàn)的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,自由度(df)=1,即在周邊合計(jì)數(shù)固定的情況下,4個(gè)基本數(shù)據(jù)當(dāng)中只有一個(gè)可以自由取值. 自由度=(行數(shù)-1)(列數(shù)-1) 自由度自由度三、獨(dú)立性檢驗(yàn)(三) 2
13、2 列聯(lián)表 檢驗(yàn) 2(三) 22 列聯(lián)表 檢驗(yàn) 1 、 當(dāng)n40, Tij 5的條件下 可用下列簡化公式21f ,)(22ddbcadcbabcadn三、獨(dú)立性檢驗(yàn) 例例5 工農(nóng)業(yè)高血壓患病率的比較(50歲以上男性),首鋼調(diào)查50-59歲男性工人1281人、高血壓患者386人,患病率為30.13%。石景山區(qū)農(nóng)民387人,血壓血患者65人,患病率為16.80%,從事工農(nóng)業(yè)生產(chǎn)的男性患病率有無差別。(三) 22 列聯(lián)表 檢驗(yàn) 三、獨(dú)立性檢驗(yàn)2患病未患病小計(jì)工人3868951281農(nóng)民65322387小計(jì)45112171668解: 建立檢驗(yàn)假設(shè) H0:1 =2 (工人與農(nóng)民的總體患病率相同) =0.
14、05 估計(jì)總體某現(xiàn)象的發(fā)生或存在的概率,假定高血壓的發(fā)生和這兩種工種眾彼此獨(dú)立無關(guān),因此,這兩組資料是一總體中的兩個(gè)隨機(jī)樣本,估計(jì) 總體患病率= 451/1668 =0.2704 未患率= 1217/1668=0.7296三、獨(dú)立性檢驗(yàn)(三) 22 列聯(lián)表 檢驗(yàn) 2 50-59 歲男性工人與農(nóng)民高血壓患病比較歲男性工人與農(nóng)民高血壓患病比較患高血壓人數(shù)患高血壓人數(shù) 合 計(jì)觀察數(shù)理論數(shù)觀察數(shù)理論數(shù)首鋼工人386346.4895934.61281石景山區(qū)農(nóng)民65104.6322282.4387合計(jì)451451121712171668(三) 22 列聯(lián)表 檢驗(yàn) 三、獨(dú)立性檢驗(yàn)2 計(jì)算檢驗(yàn)統(tǒng)計(jì)量 2 值
15、 查 2 分布界值表,作出統(tǒng)計(jì)結(jié)論。 df = (r-1)(c-1)=1; 故按 p0.01 水平拒絕Ho 接受H1 。 結(jié)合具體問題作出專業(yè)結(jié)論:不同職業(yè)的高血壓患病率極顯著意義,工人的高血壓患病率顯著高于農(nóng)民。26.7505.55314.9921.6784.5274 .2824 .2823226 .1046 .104656 .9346 .9348954 .3464 .34638622222 843 21050 6.63 21010(三)(三) 22 列聯(lián)表列聯(lián)表 檢驗(yàn)檢驗(yàn) 三、獨(dú)立性檢驗(yàn)(三) 22 列聯(lián)表 檢驗(yàn) 2應(yīng)用簡化公式計(jì)算:75.2612174513871281)65895322386(1668)(222dbcadcbabcadn(三) 22 列聯(lián)表 檢驗(yàn) 三、獨(dú)立性檢驗(yàn)2 2 n 40, 但有但有1 Tij 5時(shí),時(shí),需對上述公式進(jìn)行校正。需對上述公式進(jìn)行校正。dbcadcbanbcadn25 . 02(三) 22 列聯(lián)表 檢驗(yàn) 三、獨(dú)立性檢驗(yàn)2(四) 與 r系數(shù)(phi coeffi
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 印刷廠租賃合同印刷包裝租賃
- 科技館物業(yè)員工聘用合同
- 2025年度消防工程設(shè)計(jì)合同范本(含消防設(shè)施施工)2篇
- 2025年四城區(qū)住房保障家庭租賃補(bǔ)貼政策執(zhí)行監(jiān)督合同3篇
- 二零二五年度房屋產(chǎn)權(quán)轉(zhuǎn)讓及裝修工程合同3篇
- 2025年度養(yǎng)殖場廢棄物處理勞動合同3篇
- 二零二五年度旅游度假區(qū)承包經(jīng)營權(quán)變更合同3篇
- 二零二五年度電子商務(wù)公司整體轉(zhuǎn)讓合同3篇
- 2025年度林業(yè)科研合作樹木補(bǔ)償合同3篇
- 二零二五年度企業(yè)法人變更合同風(fēng)險(xiǎn)評估與應(yīng)對策略協(xié)議3篇
- 球磨機(jī)安全檢查表分析(SCL)+評價(jià)記錄
- 學(xué)習(xí)會計(jì)基礎(chǔ)工作規(guī)范課件
- 雙面埋弧焊螺旋鋼管公稱外公壁厚和每米理論重量
- 富士施樂VC2265打印機(jī)使用說明SPO
- 醫(yī)院工會經(jīng)費(fèi)使用與管理辦法、制度規(guī)則
- 服務(wù)態(tài)度決定客戶滿意度試題含答案
- 中學(xué)歷史教育中的德育狀況調(diào)查問卷
- 教科版四年級科學(xué)上冊全冊復(fù)習(xí)教學(xué)設(shè)計(jì)及知識點(diǎn)整理
- 重慶萬科渠道制度管理辦法2022
- 上海黃金交易所貴金屬交易員題庫
- 蒸汽管道設(shè)計(jì)表(1)
評論
0/150
提交評論