統(tǒng)計學(第四版賈俊平等)第九章列聯(lián)分析_第1頁
統(tǒng)計學(第四版賈俊平等)第九章列聯(lián)分析_第2頁
統(tǒng)計學(第四版賈俊平等)第九章列聯(lián)分析_第3頁
統(tǒng)計學(第四版賈俊平等)第九章列聯(lián)分析_第4頁
統(tǒng)計學(第四版賈俊平等)第九章列聯(lián)分析_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第9章列聯(lián)分析PowerPoint統(tǒng)計學第9章列聯(lián)分析§9.1分類數(shù)據(jù)與列聯(lián)表§9.2擬合優(yōu)度檢驗§9.3獨立性檢驗§9.4列聯(lián)表中的相關測量§9.5列聯(lián)分析中應注意的問題§9.1分類數(shù)據(jù)與列聯(lián)表9.1.1分類數(shù)據(jù)9.1.2列聯(lián)表的構造9.1.3列聯(lián)表的分布9.1.1分類數(shù)據(jù)1.分類變量的結果表現(xiàn)為類別例如:性別(男,女)2.各類別用符號或數(shù)字代碼來測度3.使用分類或順序尺度你吸煙嗎?(1).是;(2).否你贊成還是反對這一改革方案?(1).贊成;(2).反對4.對分類數(shù)據(jù)的描述和分析通常使用列聯(lián)表5.可使用

檢驗9.1.1數(shù)據(jù)的類型與列聯(lián)分析數(shù)據(jù)定量數(shù)據(jù)(數(shù)值型數(shù)據(jù))定性數(shù)據(jù)(品質數(shù)據(jù))離散數(shù)據(jù)連續(xù)數(shù)據(jù)列聯(lián)分析9.1.2列聯(lián)表的構造1.列聯(lián)表(contigencytable)是由兩個以上的變量交叉分類的頻數(shù)分布表。2.行(row)變量的類別用r表示,ri表示第i個類別3.列(column)變量的類別用c表示,cj表示第j個類別4.每種組合的觀察頻數(shù)用fij表示5.表中列出了行變量和列變量的所有可能的組合,所以稱為列聯(lián)表6.一個r行c列的列聯(lián)表稱為r

c列聯(lián)表9.1.2列聯(lián)表的結構(22列聯(lián)表)列(cj)合計j=1j=2i=1f11f12f11+f12i=2f21f22f21+f22合計f11+f21f12+f22n列(cj)行(ri)9.1.2列聯(lián)表的結構(r

c列聯(lián)表)列(cj)合計j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合計c1c2…n列(cj)行(ri)fij表示第i行第j列的觀察頻數(shù)9.1.2列聯(lián)表的結構(例題分析)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32453331141合計10012090110420【例9.1】一個集團公司在四個不同的地區(qū)設有分公司,現(xiàn)該集團公司欲進行一項改革,此項改革可能涉及到各分公司的利益,故采用抽樣調查方式,從四個分公司共抽取420個樣本單位(人),了解職工對此項改革的看法,調查結果如下表9.1.3列聯(lián)表的分布(觀察值的分布)1.邊緣分布(1).行邊緣分布:行觀察值的合計數(shù)的分布例如,贊成改革方案的共有279人,反對改革方案的141人(2).列邊緣分布:列觀察值的合計數(shù)的分布例如,四個分公司接受調查的人數(shù)分別為100人,120人,90人,110人2.條件分布與條件頻數(shù)變量X條件下變量Y的分布,或在變量Y條件下變量X的分布每個具體的觀察值稱為條件頻數(shù)觀察值的分布一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32753331141合計10012090110420行邊緣頻數(shù)列邊緣頻數(shù)條件頻數(shù)百分比分布1.條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合比照2.為在相同的基數(shù)上進行比較,可以計算相應的百分比,稱為百分比分布行百分比:行的每一個觀察頻數(shù)除以相應的行合計數(shù)(fij/ri)列百分比:列的每一個觀察頻數(shù)除以相應的列合計數(shù)(fij/cj)總百分比:每一個觀察值除以觀察值的總個數(shù)(fij/n)百分比分布一分公司二分公司三分公司四分公司合計贊成該方案68755779279%24.426.920.428.3—%68.062.563.3571.8—%16.217.813.618.866.4反對該方案32453331141%22.731.923.422.0—%32.037.536.728.2—%7.610.77.97.433.6合計10012090110420%23.828.621.426.2100總百分比列百分比行百分比期望頻數(shù)的分布

(例題分析)一分公司二分公司三分公司四分公司合計贊成該方案實際頻數(shù)68755779279期望頻數(shù)66806073反對該方案實際頻數(shù)32453331141期望頻數(shù)34403037合計10012090110§9.2

擬合優(yōu)度檢驗9.2.1

統(tǒng)計量9.2.2擬合優(yōu)度檢驗9.2.1

統(tǒng)計量1.c2統(tǒng)計量在列聯(lián)表中的應用:(1).用于檢驗列聯(lián)表中變量間擬合優(yōu)度和獨立性(2).用于測定兩個分類變量之間的相關程度2.c2統(tǒng)計量的構造

統(tǒng)計量(例題分析)實際頻數(shù)f0期望頻數(shù)fef0

-fe(f0

-fe)2(f0-fe)2fe687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合計:3.03199.2.1

統(tǒng)計量4.列聯(lián)表中c2自由度確實定:C1C2C3C4合計R1√√√*RT1R2√√√*RT2R3***ORT3合計CT1CT2CT3CT49.2.2擬合優(yōu)度檢驗1.如果樣本是從總體的不同類別中分別抽取,研究目的是對不同類別的目標量之間是否存在顯著性差異進行檢驗,我們把它稱為擬合優(yōu)度檢驗(goodnessoffittest)或一致性檢驗(testofhomogeneity)。2.擬合優(yōu)度檢驗可用于檢驗多個比例是否相等?!纠?.1】某集團公司欲進行一項改革,從所屬的四個分公司中共隨機抽取了420名職工,了解他們對改革方案的態(tài)度,以a=0.1的顯著性水平檢驗四個分公司對改革方案的看法是否存在差異。9.2.2擬合優(yōu)度檢驗拒絕H006.2519.2.2擬合優(yōu)度檢驗(例題分析)擬合優(yōu)度檢驗的另一種情況是利用樣本數(shù)據(jù)檢驗總體比例是否等于某個數(shù)值?!纠?.2】為了提高市場占有率,某行業(yè)兩個最主要的競爭對手A公司和B公司同時開展了廣告宣傳。在廣告宣傳戰(zhàn)之前,A公司的市場占有率為45%,B公司的市場占有率為40%,其他公司的市場占有率為15%。為了了解廣告戰(zhàn)之后A、B和其他公司的市場占有率是否發(fā)生變化,隨機抽取了200名消費者,其中102人表示準備購置A公司產(chǎn)品,82人表示準備購置B公司產(chǎn)品,另外16人表示準備購置其他公司產(chǎn)品。以0.05的顯著性水平檢驗廣告戰(zhàn)前后各公司的市場占有率是否發(fā)生了變化。9.2.2擬合優(yōu)度檢驗拒絕H005.999.2.2擬合優(yōu)度檢驗

(例題分析—用P值檢驗)第1步:將觀察值輸入一列,將期望值輸入一列第2步:選擇“函數(shù)〞選項第3步:在函數(shù)分類中選“統(tǒng)計〞,在函數(shù)名中選“CHITEST〞,點擊“確定〞第4步:在對話框“Actual_range〞輸入觀察數(shù)據(jù)區(qū)域在對話框“Expected_range〞輸入期望數(shù)據(jù)區(qū)域得到P值為0.016711,所以拒絕原假設用Excel計算P值9.3獨立性檢驗在研究問題時要求判斷兩個分類變量之間是否存在聯(lián)系的問題,可以使用檢驗,判斷兩組或多組的資料是否關聯(lián),如果不相關聯(lián),就稱為獨立,把這類問題的處理稱為獨立性檢驗(testofindependence)。即檢驗列聯(lián)表中的行變量與列變量之間是否獨立。檢驗的步驟為提出假設H0:行變量與列變量獨立H1:行變量與列變量不獨立計算檢驗的統(tǒng)計量9.3獨立性檢驗(例題分析)【例9.3】一種原料來自三個不同的地區(qū),原料質量被分成三個不同等級。從這批原料中隨機抽取500件進行檢驗,結果如下表。要求檢驗各地區(qū)與原料質量之間是否存在依賴關系(0.05)地區(qū)一級二級三級合計甲地區(qū)526424140乙地區(qū)605952171丙地區(qū)506574189合計1621881505009.3獨立性檢驗(例題分析)9.3獨立性檢驗(例題分析)地區(qū)一級二級三級合計甲地區(qū)526424140乙地區(qū)605952171丙地區(qū)506574189合計1621881505009.3獨立性檢驗(例題分析)拒絕H009.488獨立性檢驗與擬合優(yōu)度檢驗關系1.聯(lián)系:兩種檢驗在列聯(lián)表的形式上和計算公式上都相同。2.區(qū)別:(1).抽取樣本或對觀測值進行測定的方法不同。一致性檢驗抽自不同的類別;獨立性檢驗抽取后進行分類。(2).檢驗的內容不同。一致性檢驗是各類別總體比例是否等于某個期望概率;獨立性檢驗是變量之間是否獨立。(3).頻數(shù)期望的計算方法不同。一致性檢驗是利用假設得到期望頻數(shù);獨立性檢驗是利用假設的獨立性計算得到?!?.4列聯(lián)表中的相關測量9.4.1

相關系數(shù)9.4.2列聯(lián)相關系數(shù)9.4.3

V

相關系數(shù)9.4.4數(shù)值分析9.4列聯(lián)表中的相關測量1.主要研究變量之間存在聯(lián)系時的相關程度的大小。2.品質相關是指對品質數(shù)據(jù)(分類和順序數(shù)據(jù))之間相關程度的測度3.列聯(lián)表中變量的相關性屬于品質相關4.列聯(lián)表相關測量的統(tǒng)計量主要有

相關系數(shù)列聯(lián)相關系數(shù)V相關系數(shù)9.4.1

相關系數(shù)1.

相關系數(shù)(

correlationcoefficient)是描述22列聯(lián)表數(shù)據(jù)相關程度的一種相關系數(shù)。2.

相關系數(shù)計算公式為3.

系數(shù)適合22列聯(lián)表,因為計算出的

系數(shù)的值在0~1之間。9.4.1

相關系數(shù)一個簡化的22列聯(lián)表因素Y因素X合計x1x2y1aba+by2cdc+d合計a+cb+dn1.列聯(lián)表中每個單元格的期望頻數(shù)分別為2.將各期望頻數(shù)代入

的計算公式得9.4.1

相關系數(shù)3.將

代入

相關系數(shù)的計算公式得(1).當ad=bc時,有=0,說明變量X與Y之間相互獨立(2).假設b=0,c=0,或a=0,d=0,意味著各觀察頻數(shù)全部落在對角線上,此時||=1,說明變量X與Y之間完全相關(3).列聯(lián)表中變量的位置可以互換,的符號沒有實際意義,故取絕對值即可。9.4.1

相關系數(shù)9.4.1

相關系數(shù)完全相關時的22列聯(lián)表因素Y因素Xx1x2y1a0y20d完全相關時的另一種22列聯(lián)表因素Y因素Xx1x2y10by2c0表中含義:如用X表示性別(男,女),Y表示態(tài)度(贊成,反對)。|j|=1表示,男性全部贊同,女性全部反對;或者女性全部贊同,男性全部反對。注:行數(shù)或列數(shù)增大時,j相關系數(shù)也增大且無上限。9.4.2列聯(lián)相關系數(shù)1.列聯(lián)相關系數(shù)又稱列聯(lián)系數(shù)(coefficientofcontingency),簡稱c系數(shù),主要用于測度大于22列聯(lián)表中數(shù)據(jù)的相關程度。2.計算公式為(1).c的取值范圍是0c<1(2).c=0說明列聯(lián)表中的兩個變量相互獨立(3).c的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),并隨行數(shù)和列數(shù)的增大而增大(4).根據(jù)不同行和列的列聯(lián)表計算的列聯(lián)系數(shù)不便于比較9.4.3V相關系數(shù)1.計算公式為2.V的取值范圍是0V13.V=0說明列聯(lián)表中的兩個變量獨立4.V=1說明列聯(lián)表中的兩個變量完全相關5.不同行和列的列聯(lián)表計算的列聯(lián)系數(shù)不便于比較6.當列聯(lián)表中有一變量維數(shù)為2,min[(R-1),(C-1)]=1,此時V=9.4.4數(shù)值分析1.同一個列聯(lián)表,、C、V的結果會不同2.不同的列聯(lián)表,、C、V的結果也不同3.在對不同列聯(lián)表變量之間的相關程度進行比較時,不同列聯(lián)表中的行與行、列與列的個數(shù)要相同,并且采用同一種系數(shù)9.4.4數(shù)值分析(例題分析)【例9.3】一種原料來自三個不同地區(qū),原料質量被分成三個不同等級。從這批原料中隨機抽取500件進行檢驗,結果如下表。分別計算系數(shù)、C系數(shù)和V系數(shù),并分析相關程度地區(qū)一級二級三級合計甲地區(qū)526424140乙地區(qū)605952171丙地區(qū)506574189合計1621881505009.4.4數(shù)值分析(例題分析)結論:三個系數(shù)均不高,說明產(chǎn)地和原料等級之間的相關程度不高上節(jié)內容列(cj)合計j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合計c1c2…n列(cj)行(ri)fij表示第i行第j列的觀察頻數(shù)上節(jié)內容1.c2統(tǒng)計量在列聯(lián)表中的應用:(1).用于檢驗列聯(lián)表中變量間擬合優(yōu)度和獨立性(2).用于測定兩個分類變量之間的相關程度2.c2統(tǒng)計量的構造3.擬合優(yōu)度檢驗的步驟4.獨立性檢驗的步驟上節(jié)內容5.擬合優(yōu)度檢驗和獨立性檢驗的聯(lián)系和區(qū)別1).聯(lián)系:兩種檢驗在列聯(lián)表的形式上和計算公式上都相同。2).區(qū)別:(1).抽取樣本或對觀測值進行測定的方法不同。一致性檢驗抽自不同的類別;獨立性檢驗抽取后進行分類。(2).檢驗的內容不同。一致性檢驗是各類別總體比例是否等于某個期望概率;獨立性檢驗是變量之間是否獨立。(3).頻數(shù)期望的計算方法不同。一致性檢驗是利用假設得到期望頻數(shù);獨立性檢驗是利用假設的獨立性計算得到。上節(jié)內容6.品質相關系數(shù)9.5列聯(lián)分析中應注意的問題9.5.1條件百分表的方向9.5.2c2分布的期望值準那么9.5.1條件百分表的方向1.一般來講,列聯(lián)表中變量的位置是任意的。2.如果變量X(自變量、原因)與Y(因變量、結果)存在因果關系時,一般是把自變量X放在列的位置,條件百分數(shù)也按自變量的方向計算,因為這樣便于更好地表現(xiàn)原因對結果的影響。價值取向Y職業(yè)X制造業(yè)服務業(yè)物質報酬%105724556人情關系%40283544合計145100801009.5.1條件百分表的方向但是,也有例外情況,如果因變量在樣本內的分布不能代表其在總體內的分布,例如,為了滿足分析的需要,抽樣時擴大了因變量某項內容的樣本量,這時仍以自變量的方向計算百分表就會歪曲實際情況。青少年行為家庭狀況合計完整家庭離異家庭犯罪%3829378275-未犯罪%9271818100-合計13010045100175-9.5.1條件百分表的方向

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論