第九講卡方檢驗-課件_第1頁
第九講卡方檢驗-課件_第2頁
第九講卡方檢驗-課件_第3頁
第九講卡方檢驗-課件_第4頁
第九講卡方檢驗-課件_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第九講卡方檢驗2020/12/151一、檢驗的功能1、適用資料─計數(shù)數(shù)據(jù)計數(shù)數(shù)據(jù)的統(tǒng)計分析,測量數(shù)據(jù)的統(tǒng)計方法并不適用,卡方檢驗是較為常用的一種方法。2020/12/152精品資料3你怎么稱呼老師?如果老師最后沒有總結一節(jié)課的重點的難點,你是否會認為老師的教學方法需要改進?你所經(jīng)歷的課堂,是講座式還是討論式?教師的教鞭“不怕太陽曬,也不怕那風雨狂,只怕先生罵我笨,沒有學問無顏見爹娘……”“太陽當空照,花兒對我笑,小鳥說早早早……”4⑴擬合優(yōu)度檢驗[例]即通過實際調查與觀察所得到的一批數(shù)據(jù),其次數(shù)分布是否服從理論上所假定的某一概率分布;2、卡方檢驗的功能2020/12/155■例某廣播電視臺為了了解廣大兒童對其提供的6種兒童節(jié)目的偏好(態(tài)度),隨機抽取了300名兒童,問他們最喜歡哪一種節(jié)目(每人只能選一種),得到的數(shù)據(jù)如下表:節(jié)目1節(jié)目2節(jié)目3節(jié)目4節(jié)目5節(jié)目6858055104030問:就調查的300人而言,他們對6個節(jié)目的偏好(體現(xiàn)在人數(shù))是否存在顯著的差異?2020/12/1562020/12/157⑵變量間的獨立性檢驗在對一批觀察數(shù)據(jù)進行雙向多項分類之后,這兩個分類特征是獨立無關的還是具有連帶相關的關系?2020/12/158■例某師范大學為了了解廣大師生對實行“中期選撥”制度的態(tài)度。曾以問卷調查的形式對977名低年級學生、790名高年級學生和764名教師進行隨機調查,調查結果:2020/12/159主要用于檢驗不同人群母總體在某一個變量上的反應是否有顯著差異。[例]從四所幼兒園分別隨機抽出6歲兒童若干,各自組成一個實驗組,進行識記測驗。測驗材料是紅、綠、藍三種顏色書寫的字母,以單位時間內的識記數(shù)量為指標,結果如下。問四組數(shù)據(jù)是否可以合并分析。⑶同質性檢驗2020/12/1510分組紅色字母綠色字母藍色字母1241719215129320201441025282020/12/1511理論基礎是1899年皮爾遜的工作:在分布擬合優(yōu)度檢驗中,實際觀察次數(shù)與理論次數(shù)之差的平方除以理論次數(shù)近似服從分布,即:二、檢驗的基本原理2020/12/1512-如果實際觀察次數(shù)與理論次數(shù)的差異越大,卡方檢驗的結果就越可能拒絕無差虛無)假設接受備擇假設。-理論次數(shù)越大()擬合效果越好。

■注2020/12/1513■注

K為類別的數(shù)目;是實際觀察值;是理論(期待)次數(shù);是約束條件數(shù)或利用觀察數(shù)據(jù)時使用的樣本統(tǒng)計量的數(shù)目;1、卡方檢驗基本公式2020/12/1514⑴分類相互排斥,互不包容;⑵觀察值相互獨立;⑶期望次數(shù)的大小應大于或等于5(較好趨近卡方分布的前提);2、卡方檢驗的假設2020/12/1515①自由度小時,必須,否則利用卡方檢驗需要進行較正或用精確的分布進行檢驗;②自由度大時,可以有少許類別的理論次數(shù)少于5;③應用卡方檢驗時,應注意取樣設計,保證取樣的代表性,否則依據(jù)卡方檢驗的結果難以保證結論的科學性;■注2020/12/1516由于檢驗內容僅涉及一個變量多項分類的計數(shù)資料,也稱one-waytest)1、配合度檢驗的一般問題即檢驗實際觀察數(shù)據(jù)的分布與某理論分布是否有顯著的差別。三、卡方檢驗應用一——總體分布的擬合檢驗(goodnessoffittest配合度檢驗)2020/12/1517⑴統(tǒng)計假設2、檢驗過程即:實際觀察次數(shù)與某分布理論次數(shù)之間無差異;

2020/12/1518⑶依統(tǒng)計檢驗公式,計算實得卡方值⑵數(shù)理基礎⑷作出統(tǒng)計決斷N:總數(shù)Pe:具體類別理論概率2020/12/1519■例某項民意測驗,答案有同意、不置可否、不同意3種。調查了48人,結果同意的24人,不置可否的人12人,不同意的12人,問持這3種意見的人數(shù)是否存在顯著差異?3、離散型分布的擬合檢驗2020/12/1520對于連續(xù)隨機變量的測量數(shù)據(jù),有時不知道其總體分布,需要根據(jù)樣本的次數(shù)分布的信息判斷其是否服從某種確定的連續(xù)性分布。⑴檢驗方法①將連續(xù)性的測量數(shù)據(jù)整理成次數(shù)分布表②畫出相應的次數(shù)分布曲線;③選擇恰當?shù)睦碚摲植?;④進行擬合檢驗;4、連續(xù)型分布擬合檢驗(例)2020/12/1521■例:下表是552名學生的身高次數(shù)分布,問這些學生的身高分布是否符合正態(tài)分布?2020/12/1522169~170215.383.030.002371166~167712.382.440.012017163~164229.381.850.04260240.167160~161576.381.260.10888600.150157~1581103.380.670.188581040.471154~1551240.380.070.235441300.277151~152112-2.62-0.520.206151140.035148~14980-5.62-1.110.12746701.429145~14625-8.62-1.700.05562311.161142~1438-11.62-2.290.017109139~1404-14.62-2.880.003962身高組中值次數(shù)離均差Z分數(shù)P理論次數(shù)0.1250.092020/12/1523其一、分組數(shù)據(jù)第1組理論次數(shù)的計算

注:=組上限的Z值-組下限的Z值其二、擬合指標卡方值的計算■分析2020/12/15245、二項分類的配合度檢驗與比率顯著檢驗⑴設總體比率為,且時2020/12/1525■結論:Z檢驗與卡方檢驗一致(樣本比率p的真正分布是二項分布)2020/12/1526

男生女生

某班有100名學生,男生的有42人,問男生的比率是否與0.5有顯著差異?①比率顯著性檢驗

42585050■例②用卡方檢驗(配合度)2020/12/1527⑵當且時卡方檢驗公式2020/12/1528

當期望次數(shù)小于5時,卡方檢驗需要校正,Yates建議的校正公式為:■注:校正后的結果與二項分布的結果一致⑶的連續(xù)性校正(二項分類數(shù)據(jù)或比率)2020/12/15291、功能(例)主要通過對兩個或兩個以上因素多項分類的計數(shù)資料的分析,以研究兩變量或多個變量之間的關聯(lián)性與依存性。四、獨立性檢驗(testofindependence)2020/12/1530獨立性檢驗一般多采用表格的形式記錄觀察結果的計數(shù)資料,這種表格即列聯(lián)表。R×K型列聯(lián)表(二個因素:一個因素有R個分類,另一有K個分類)2、一個術語-列聯(lián)表2020/12/1531R×K型列聯(lián)表一般數(shù)據(jù)結構示意圖因素A因素BA1A2……..Aj……ARB1B2…Bi…Bk2020/12/1532⑴統(tǒng)計假設二因素或多因素之間是獨立;(數(shù)據(jù))⑵理論次數(shù)的計算3、獨立性檢驗的一般問題與步驟⑶自由度的確定2020/12/1533⑷卡方檢驗………(公式1)⑸統(tǒng)計推斷拒絕假設接受假設2020/12/1534◆R×C的卡方檢驗,允許有的格內的實計數(shù)為0,最小的理論次數(shù)為0.5;◆R×C的卡方檢驗中最小的理論次數(shù)小于0.5或1(2×C列聯(lián)表),一般采用合并項目的方法,而不用連續(xù)性校正公式;■注2020/12/1535

⑴檢驗公式(各單元格理論次數(shù)>5)⑵自由度因素A分類1分類2因素B分類1分類2ABCD4、獨立樣本四格表檢驗(列聯(lián)表特例)2020/12/1536■注:獨立樣本四格表檢驗相當于獨立樣本比率差異的顯著性檢驗。2020/12/1537隨機抽取90名學生,將學生按性別與學習成績進行分類,結果如下表,問男女大學生在學業(yè)成績上是否有關聯(lián)?或男女學生在成績中等以上的比率是否存在顯著差異?學業(yè)水平中等以上中等以下

性別男女23172822■例2020/12/1538⑴Fisher精確概率檢驗(略)⑵檢驗校正公式5、四格表中若有單元格理論次數(shù)<52020/12/1539⑴適用范圍分類變量數(shù)目多于2個■例:討論性別(男、女)、婚姻(未婚、已婚)及生活滿意狀況(刺激、規(guī)律、無聊)之間的關系。6、多重列聯(lián)表分析2020/12/1540①確定控制變量(分層變量)[例]性別②分別對在控制變量的每一水平下的另兩個變量形成的列聯(lián)表進行分析;[例]*男性婚姻狀況與生活滿意狀態(tài)關聯(lián)分析*女性婚姻狀況與生活滿意狀態(tài)關聯(lián)分析⑵多重列聯(lián)表的分析2020/12/1541③對于控制變量的不同水平所進行的單個列聯(lián)表分析ⅰ、如果值不顯著,此時可以將各個水平下的值相加,以推測列聯(lián)表中兩個變量總的值,并進行關聯(lián)性檢定。2020/12/1542ⅱ、當控制變量各水平不一致時,必須單獨就個別關聯(lián)表進行分析。2020/12/1543■例某通訊公司想了解大學生最喜歡的手機品牌,隨機抽取了72名大學生,調查性別、家庭經(jīng)濟水平以及最喜歡的手機品牌,來探討這三個變量之間的關系,調查結果如

下表。2020/12/1544甲乙丙經(jīng)濟水平低高甲乙丙手機品牌性男別女132341249378522020/12/15451、同質性檢驗(testforhomogeneity)◆幾個不同的因素之間是否有實質差異◆判斷幾次重復實驗的結果是否同質⑴單因素分類數(shù)據(jù)的同質性檢驗①樣例四、同質性檢驗與數(shù)據(jù)的合并2020/12/1546ⅰ、計算各個樣本組的值和自由度;ⅱ、累加各樣本組值,計算其總和及自由度的總和;ⅲ、將各個樣本組原始數(shù)據(jù)按相應類合并,產(chǎn)生一個總的數(shù)據(jù)表,并計算這個總數(shù)據(jù)表的值和自由度;②檢驗過程2020/12/1547iv、計算各樣本組的累計值與總測試次數(shù)合并獲得的值之差(異質性值),其自由度是各樣本組累計自由度與合并后總數(shù)據(jù)的自由度之差?!舢愘|性值大于臨界值,樣本組間數(shù)據(jù)異質;◆不顯著,則同質;2020/12/1548124171921512932020144102528■例

從四所幼兒園分別隨機抽出6歲兒童若干,各自組成一個實驗組,進行識記測驗。測驗材料是紅、綠、藍三種顏色書寫的字母,以單位時間內的識記數(shù)量為指標,結果:問四組數(shù)據(jù)是否可以合并分析?分組紅色字母綠色字母藍色字母2020/12/1549[例]對四所幼兒圓的幼兒顏色命名能力進行了調查,調查材料是15種顏色的彩色鉛筆。凡能正確命名8種及8種以上顏色者為達標,低于8種顏色則未達標。調查對象分4歲組、6歲組。四所幼兒園調查的數(shù)據(jù)見下表。問這四所幼兒園兒童顏色命名能力調查結果是否同質?顏色命名與年齡是否有關聯(lián)?

⑵列聯(lián)表形式的同質性檢驗2020/12/15504歲組49701106歲組6439103小計113109222達標未達標年齡組A幼兒園B幼兒園C幼兒園D幼兒園達標未達標達標未達標達標未達標達標未達標

4歲組11181015152013176歲組14917101691711年齡組顏色命名能力小計合并數(shù)據(jù)表變異原因自由P合并9.7051<.05異質0.1043>.05總計9.8094(值分析結果)2020/12/1551■注合并檢驗總表中兒童顏色命名能力與年齡是否有密切關聯(lián)時,因自由度為1,值需進行連續(xù)性校正。2020/12/1552⑴兩格表與四格表數(shù)據(jù)合并方法(例)①簡單合并法將所有數(shù)據(jù)合并成一個兩格表或四格表。適用條件:◆各分表同一分類特征比率接近;◆分表小樣本齊性(值不顯著)2、計數(shù)數(shù)據(jù)合并的方法2020/12/1553

值相加法男175220.773女65110.545231033ⅱ、例(四格表簡單合并法)不同研究者的取樣年齡性別某年齡特征A非AA特征比率3~4歲5~6歲男123150.800女75120.5832310331.7931.3391.5011.2257~8歲男113140.786女119200.5502212342.0041.4162020/12/155440112419A非A男女51436430942020/12/1555②相加法ⅰ、各分表值相加;ⅱ、df=分表的數(shù)目(各分表自由度之和)

缺點:不太靈敏,分辨力較差,沒有考慮各分表的方向。■例2020/12/1556③值相加法

ⅰ、適用條件

◆樣本容量相差不超過2倍◆表中各相應比率的取值在0.2-0.8之間ⅱ、檢驗公式(例)分表數(shù)目;各分表值的開方;2020/12/1557ⅰ、適用條件◆多個四格表中各相應的比率不在0.2-0.5間;

◆各樣本容量相差較大(超過2倍),樣本差異方向(即變化趨勢)相同;④加權法2020/12/1558ⅱ、顯著性檢驗公式(例)

分表數(shù)目;第i個四格表的比率第i個四格表邊際次數(shù)2020/12/1559■例加權法計算及各符號含義樣本組A非AA的比率男女5~91357700.1857323260.11541680960.16670.070318.960.8333男女10~122656820.31711129400.275037851220.30330.042126.890.6967男女13~151556710.2113227290.069017831000.17000.142320.590.83002020/12/1560■合并的條件◆各分表同一分類特征比率接近;◆分表小樣本齊性(值不顯著)◆無關因素控制相同,各分表相應比率變化相同;⑵R×C表數(shù)據(jù)合并2020/12/1561ⅰ、適用條件各分表比率接近且各樣本齊性年齡組ABC合計計算結果男女15~19121373218172358合計303030男女20~25151794126233179合計404040(0.3750)(0.4063)(0.2187)(0.3659)(0.4146)(0.2195)合并后結果①簡單合并法ⅱ、例2020/12/1562合并后結果性別ABC合計男27301673女434054137合計7070702102020/12/1563ⅰ、具體操作

◆先計算各分表中單元格的理論次數(shù),將各分表理論次數(shù)相加作為總表對應格理論次數(shù);

◆然后將各分表的實計數(shù)合并,作為總表的實計數(shù);

◆進行卡方檢驗[df=(R-1)×(K-1)]②分表理論次數(shù)合并法2020/12/1564ⅱ、例不同年級對學方法的評價樣本評價教法1教法2教法3合計計算結果初一年級很好9(10.5)6(7.0)6(3.5)21一般5(6.5)6(4.3)2(2.2)13不好16(13.0)8(8.7)2(4.3)26合計30201060初二年級很好14(15.5)9(10.3)8(5.2)31一般16(5.5)4(3.7)1(1.8)11不好10(9.0)7(6.0)1(3.0)18合計30201060初三年級很好5(9.7)8(6.2)6(3.1)19一般3(3.1)2(2.0)1(1.0)6不好20(15.2)8(9.8)2(4.9)30合計28189552020/12/15652823201412446235教法1教法2教法3很好一般不好(35.7)(23.5)(11.8)(15.1)(10)(5.0)(37.2)(24.5)(12.2)7130748858292020/12/15661、內涵R×C列聯(lián)表經(jīng)檢驗后A、B因素有關聯(lián),表明:

◆A因素的多項分類中有一項分類在B因素多項分類中有關聯(lián);◆或B因素多項分類中至少有一項分類在A因素多項分類中有關聯(lián)。這種關聯(lián)是體現(xiàn)在全體還是局部?對這個問題的進一步分析即相關源的分析。五、相關源的分析2020/12/1567⑴將2×C分解成獨立的2×2表進行分析2、2×C表的離析①離析過程ⅰ、首先將2×C表分解為C-1個四格表,

分解方法:據(jù)專業(yè)知識作直觀分析,先將估計關聯(lián)不明顯的四格表分解出來;2020/12/1568不顯著ⅱ、逐項進行卡方檢驗,若關聯(lián)不顯著則合并不顯著分解示意圖T1T2Tt2020/12/1569②分解的2×2表計算公式■注t=1,2,….,C;N為總表中的總次數(shù);為總表中邊緣次數(shù)-橫行;為總表中邊緣次數(shù)-縱列;為總表中各格的實計數(shù);2020/12/1570有一項調查結果如下,問二因素是否有關聯(lián),并進一步分析相關源,即究竟在哪種態(tài)度上有顯著差異?擁護不置可否反對男女121351817253030303060N=90■例2020/12/1571解:分析思路⑴整體分析(2×3)結果:(關聯(lián)不顯著)⑵是否在局部存在關聯(lián)?開始離析擁護不置可否男女12131817T1結果顯示:在擁護與不置可否上并不存在性別差異2020/12/1572不反對反對男女12+13518+1725T2T1結果顯示:在反對與不反對上存在性別明顯的差異2020/12/1573總體上不存在關聯(lián)2020/12/1574⑵將2×C列聯(lián)表分解為非獨立2×2表進行分析①主要應用領域研究涉及幾個對照組與控制組的比較②例評價原方法(對照組)新法1新法2新法3新法4好不好

812211519221891511四格表2020/12/1575評價原方法新法1好不好8122218評價原方法新法2好不好821229評價原方法新法3好不好

8152215評價原方法新法4好不好

81922112020/12/1576■注:因為每一實驗組都要與控制組比較,故此時各四格表間并不獨立。③在保證總檢驗顯著性水平為時,各分解四格表顯著性水平的確定:2020/12/1577[問題]上例各分解四格表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論