版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
演示文稿分類數(shù)據(jù)分析當(dāng)前1頁,總共87頁。(優(yōu)選)分類數(shù)據(jù)分析當(dāng)前2頁,總共87頁。概述
第七、八章介紹的估計和檢驗方法僅主要針對數(shù)值型變量。而列聯(lián)分析是針對分類變量進(jìn)行分析的方法。當(dāng)前3頁,總共87頁。第9章分類數(shù)據(jù)分析9.1分類數(shù)據(jù)與c2統(tǒng)計量9.2擬合優(yōu)度
檢驗9.3列聯(lián)分析:獨(dú)立性檢驗9.4列聯(lián)表中的相關(guān)測量9.5列聯(lián)分析中應(yīng)注意的問題當(dāng)前4頁,總共87頁。學(xué)習(xí)目標(biāo)1. 解釋列聯(lián)表進(jìn)行c2
檢驗擬合優(yōu)度檢驗獨(dú)立性檢驗3. 測度列聯(lián)表中的相關(guān)性當(dāng)前5頁,總共87頁。9.1
分類數(shù)據(jù)9.1.1分類數(shù)據(jù)補(bǔ)充:列聯(lián)表的構(gòu)造
列聯(lián)表的分布9.1.22統(tǒng)計量當(dāng)前6頁,總共87頁。分類數(shù)據(jù)分類變量的取值表現(xiàn)為類別例如:性別(男,女)各類別可用符號或數(shù)字代碼來測度例如:性別(男用1表示,女用0表示)順序數(shù)據(jù)也可以看作分類數(shù)據(jù)原料的質(zhì)量等級:一等品、二等品、三等品數(shù)值型數(shù)據(jù)也可以轉(zhuǎn)化為分類數(shù)據(jù)數(shù)學(xué)期末考試成績是一個數(shù)值型數(shù)據(jù),可以根據(jù)分?jǐn)?shù)段將成績?yōu)椤皟?yōu)秀”、“良好”、“及格”和“不及格”幾個類別對分類數(shù)據(jù)的描述和分析通常使用列聯(lián)表當(dāng)前7頁,總共87頁。列聯(lián)表的構(gòu)造當(dāng)前8頁,總共87頁。列聯(lián)表
(contingencytable)由兩個以上的變量交叉分類的頻數(shù)分布表行變量的類別用r
表示,ri
表示第i
個類別列變量的類別用c
表示,cj
表示第j
個類別每種組合的觀察頻數(shù)用fij
表示表中列出了行變量和列變量的所有可能的組合,所以稱為列聯(lián)表一個
R行C
列的列聯(lián)表稱為R
C
列聯(lián)表當(dāng)前9頁,總共87頁。列聯(lián)表的結(jié)構(gòu)
(22列聯(lián)表)列(cj)合計j=1j=1i=1f11f12f11+f12i=2f21f22f21+f22合計f11+f21f12+f22n列(cj)行(ri)當(dāng)前10頁,總共87頁。列聯(lián)表的結(jié)構(gòu)
(r
c
列聯(lián)表的一般表示)列(cj)合計j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合計c1c2…n列(cj)行(ri)fij
表示第i
行第j
列的觀察頻數(shù)當(dāng)前11頁,總共87頁。列聯(lián)表
(例題分析)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32753331141合計10012090110420【例】一個集團(tuán)公司在四個不同的地區(qū)設(shè)有分公司,現(xiàn)該集團(tuán)公司欲進(jìn)行一項改革,此項改革可能涉及到各分公司的利益,故采用抽樣調(diào)查方式,從四個分公司共抽取420個樣本單位(人),了解職工對此項改革的看法,調(diào)查結(jié)果如下表當(dāng)前12頁,總共87頁。列聯(lián)表的分布當(dāng)前13頁,總共87頁。觀察值的分布邊緣頻數(shù)行邊緣分布(頻數(shù))行觀察值的合計數(shù)的分布例如,贊成改革方案的共有279人,反對改革方案的141人列邊緣分布(頻數(shù))列觀察值的合計數(shù)的分布例如,四個分公司接受調(diào)查的人數(shù)分別為100人,120人,90人,110人條件分布與條件頻數(shù)表中每個具體的觀察值都是變量X條件下變量Y
的頻數(shù),或在變量Y
條件下變量X
的頻數(shù),稱為條件分布(頻數(shù))當(dāng)前14頁,總共87頁。觀察值的分布
(圖示)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32753331141合計10012090110420行邊緣分布列邊緣分布條件頻數(shù)當(dāng)前15頁,總共87頁。百分比分布
(概念要點(diǎn))條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對比如二分公司贊成人數(shù)比一分公司多,并不表明二分公司比一分公司更贊成該方案,因為兩公司調(diào)查人數(shù)不同。為在相同的基數(shù)上進(jìn)行比較,可以計算相應(yīng)的百分比,稱為百分比分布行百分比:行的每一個觀察頻數(shù)除以相應(yīng)的行合計數(shù)(fij
/ri)列百分比:列的每一個觀察頻數(shù)除以相應(yīng)的列合計數(shù)(fij
/cj)總百分比:每一個觀察值除以觀察值的總個數(shù)(fij
/n)當(dāng)前16頁,總共87頁。百分比分布
(圖示)一分公司二分公司三分公司四分公司合計贊成該方案6875577966.4%24.4%26.9%20.4%28.3%68.0%62.5%63.3571.8%—16.2%17.8%13.6%18.8%—反對該方案3245333133.6%22.7%31.9%23.4%22.0%32.0%37.5%36.7%28.2%—7.6%10.7%7.9%7.4%—合計23.8%28.6%21.4%26.2%100%總百分比列百分比行百分比當(dāng)前17頁,總共87頁。列聯(lián)分析是利用列聯(lián)表來研究:()A.兩個分類變量的關(guān)系B.兩個數(shù)值型變量的關(guān)系C.一個分類變量和一個數(shù)值型變量的關(guān)系D.兩個數(shù)值型變量的分布
以下列聯(lián)表中,最右邊一列稱為:()A.列邊緣頻數(shù);B.行邊緣頻數(shù);C.條件頻數(shù);D.總頻數(shù)練習(xí)(1)AB男學(xué)生女學(xué)生合計贊成454287反對10578183合計150120270當(dāng)前18頁,總共87頁。(3)對于學(xué)生宿舍上網(wǎng)收費(fèi)的新措施,男女學(xué)生的抽樣調(diào)查結(jié)果如下列聯(lián)表所示,在男女生贊成的比例相同的前提下,男女生贊成該措施的期望頻數(shù)分別為:()A.48和39B.102和81
C.15和14
D.25和19
A男學(xué)生女學(xué)生合計贊成454287反對10578183合計150120270當(dāng)前19頁,總共87頁。統(tǒng)計量當(dāng)前20頁,總共87頁。概述
2檢驗(Chi-squaretest)是現(xiàn)代統(tǒng)計學(xué)的創(chuàng)始人之一,英國人K.Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計方法,因此又稱為Pearson2檢驗??捎糜趦蓚€或多個率或構(gòu)成比間的比較,定性資料的關(guān)聯(lián)度分析,擬合優(yōu)度檢驗等等。
當(dāng)前21頁,總共87頁。
統(tǒng)計量用于檢驗列聯(lián)表中變量間擬合優(yōu)度和獨(dú)立性檢驗統(tǒng)計量為:或2統(tǒng)計量可以看作是檢驗真實值與期望值的接近程度。當(dāng)前22頁,總共87頁。
統(tǒng)計量分布與自由度的關(guān)系當(dāng)前23頁,總共87頁。9.2擬合優(yōu)度檢驗(goodnessoffittest)當(dāng)前24頁,總共87頁。
統(tǒng)計量擬合優(yōu)度檢驗:用于檢驗一個分類變量中各類別的期望頻數(shù)和觀察頻數(shù)是否有顯著差異。其實際為假設(shè)檢驗在原假設(shè)為觀察頻數(shù)和實際頻數(shù)一致的前提下,有如下檢驗統(tǒng)計量:當(dāng)前25頁,總共87頁。擬合優(yōu)度檢驗的期望頻數(shù)的計算
若可求出第i行第j列元素的期望概率pij,則一個實際頻數(shù)fij
的期望頻數(shù)eij
,是總頻數(shù)的個數(shù)n乘以該實際頻數(shù)fij
的期望概率pij當(dāng)前26頁,總共87頁。期望頻數(shù)的計算舉例
舉例:要檢驗各分公司對某項改革方案的看法是否相同?一分公司二分公司三分公司四分公司贊成該方案實際頻數(shù)68755779反對該方案實際頻數(shù)32453331當(dāng)前27頁,總共87頁。期望頻數(shù)的分布
(例題分析)一分公司二分公司三分公司四分公司贊成該方案實際頻數(shù)68755779期望頻數(shù)100*66.4%=66150*66.4%=8090*66.4%=60110*66.4%=73反對該方案實際頻數(shù)32753331期望頻數(shù)100*33.6%=34150*33.6%=4090*33.6%=30110*33.6%=37在全部420個樣本中,贊成改革方案的人數(shù)為279,占66.4%;反對的人數(shù)占33.6%。在各分公司對改革方案看法相同的前提下,各分公司贊成(反對)這項改革不同態(tài)度的期望頻數(shù)為分公司總樣本數(shù)*66.4%(33.6%)。等價于檢驗各分公司贊成方案的實際頻數(shù)與期望頻數(shù)是否一致。當(dāng)前28頁,總共87頁。期望頻數(shù)的分布
(例題分析)A公司B公司其它公司廣告后購買人數(shù)實際頻數(shù)1028216期望頻數(shù)200×0.45200×0.4200×0.15在廣告宣傳戰(zhàn)之前,A公司、B公司和其它公司的市場占有率分別為45%、40%和15%。上表給出了廣告后對200個消費(fèi)者購買意愿的調(diào)查的結(jié)果,檢驗廣告戰(zhàn)前后各公司的市場占有率是否發(fā)生了變化?
等價于檢驗三個公司的期望購買人數(shù)和實際購買人數(shù)是否一致。當(dāng)前29頁,總共87頁。擬合優(yōu)度檢驗
(例題分析1-1)【例9.1】1912年4月15日,豪華巨輪泰坦尼克號與冰山相撞沉沒。當(dāng)時船上共有共2208人,其中男性1738人,女性470人。海難發(fā)生后,幸存者為718人,其中男性374人,女性344人,以的顯著性水平(0.05)檢驗存活狀況與性別是否有關(guān)。當(dāng)前30頁,總共87頁。擬合優(yōu)度檢驗
(例題分析1-2)分析:在這次海難中,幸存者共718人,即總存活比例為718/2208=0.325。若存活狀況與性別無關(guān),則男性存活的期望人數(shù)為:0.3251738=565人,女性存活的期望人數(shù)為:0.325470=153人,若男女性期望的存活人數(shù)和實際的存活人數(shù)非常接近,則可以認(rèn)為存活率與性別無關(guān),反之,則認(rèn)為存狀況與性別相關(guān)。因此可以利用2統(tǒng)計量來檢驗。男女合計實際生存人數(shù)374344718總?cè)送嫒藬?shù)1738×0.325470×0.325當(dāng)前31頁,總共87頁。擬合優(yōu)度檢驗
(例題分析1-3)H0:生存狀況與性別無關(guān)(觀察頻數(shù)與期望頻數(shù)一致)H1:生存狀況與性別相關(guān)(觀察頻數(shù)與期望頻數(shù)不一致)
=0.05df=
(2-1)=1臨界值(s):統(tǒng)計量:
在
=0.05的水平上拒絕H0有較充分的理由認(rèn)為生存狀況與性別相關(guān)決策:結(jié)論:203.8415=0.1當(dāng)前32頁,總共87頁。擬合優(yōu)度檢驗
(例題分析2-1)【例】
一項統(tǒng)計結(jié)果聲稱:某市老年人口(年齡在65歲以上)所占的比例為14.7%,該市老年人口研究會為了檢驗該項統(tǒng)計是否可靠,隨機(jī)抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上。調(diào)查結(jié)果是否支持該市老年人口比例為14.7%的說法?(=0.05)。當(dāng)前33頁,總共87頁。擬合優(yōu)度檢驗
(例題分析2-2)解:要回答觀察的老年人數(shù)與期望的老年人數(shù)是否一致,檢驗如下假設(shè):
H0:老年人口比例為14.7%(觀察頻數(shù)與期望頻數(shù)一致)
H1:老年人口比例并非14.7%(觀察頻數(shù)與期望頻數(shù)不一致)老年人非老年人實際人數(shù)57343期望人數(shù)500×0.147=59500×0.853=341當(dāng)前34頁,總共87頁。擬合優(yōu)度檢驗
(例題分析2-3)
=0.05df=
(2-1)=1臨界值(s):注意:教材P223中作的雙側(cè)檢驗有誤。統(tǒng)計量:
在
=0.05的水平上接受H0有較充分的理由認(rèn)為老年人比比例為14.7%相關(guān)決策:結(jié)論:203.8415=0.1當(dāng)前35頁,總共87頁。擬合優(yōu)度檢驗
(例題分析2-1)注意:第8章介紹的總體比例檢驗只能用于二項分布,而2統(tǒng)計量可用于多項分布的比例檢驗。當(dāng)前36頁,總共87頁。9.3列聯(lián)分析:獨(dú)立性檢驗9.3.1列聯(lián)表(已講)9.3.2獨(dú)立性檢驗當(dāng)前37頁,總共87頁。兩個變量的獨(dú)立性檢驗當(dāng)前38頁,總共87頁。獨(dú)立變量檢驗
(goodnessoffittest)檢驗兩個分類變量是否獨(dú)立檢驗的步驟提出假設(shè)H0:變量X和Y獨(dú)立j;H1:X和Y
不獨(dú)立
在原假設(shè)成立的前提下,可得到以下檢驗統(tǒng)計量
進(jìn)行決策根據(jù)顯著性水平和自由度(r-1)(c-1)查出臨界值2
若2>2,拒絕H0;若2<2,接受H0當(dāng)前39頁,總共87頁。期望頻數(shù)的計算假定行變量和列變量是獨(dú)立的一個實際頻數(shù)fij
的期望頻數(shù)
eij
,是總頻數(shù)的個數(shù)n乘以該實際頻數(shù)fij
落入第i
行和第j列的概率,即當(dāng)前40頁,總共87頁。期望頻數(shù)的分布
(例題分析)由于觀察頻數(shù)的總數(shù)為n
,所以f11
的期望頻數(shù)e11應(yīng)為例如,第1行和第1列的實際頻數(shù)為f11
,它落在第1行的概率估計值為該行的頻數(shù)之和r1除以總頻數(shù)的個數(shù)n
,即:r1/n;它落在第1列的概率的估計值為該列的頻數(shù)之和c1除以總頻數(shù)的個數(shù)n
,即:c1/n。根據(jù)概率的乘法公式,該頻數(shù)落在第1行和第1列的概率應(yīng)為當(dāng)前41頁,總共87頁。獨(dú)立性檢驗
(例題分析1-1)【例9.2】一種原料來自三個不同的地區(qū),原料質(zhì)量被分成三個不同等級。從這批原料中隨機(jī)抽取500件進(jìn)行檢驗,結(jié)果如下表所示,要求檢驗各個地區(qū)和原料質(zhì)量之間是否存在依賴關(guān)系?(0.05)
一級二級三級合計甲地區(qū)526424140乙地區(qū)605952171丙地區(qū)506574189合計162188150500當(dāng)前42頁,總共87頁。獨(dú)立性檢驗
(例題分析1-2)解:(1)確定假設(shè)H0:地區(qū)和原料等級之間是獨(dú)立的(不存在依賴關(guān)系)
H1:地區(qū)和原料等級之間不獨(dú)立(存在依賴關(guān)系)(2)計算期望頻數(shù)以及
2統(tǒng)計量的值
一級二級三級合計甲地區(qū)526424140期望頻數(shù)(162/500)×(140/500)*500(188/500)×(140/500)*500(150/500)×(140/500)*500乙地區(qū)605952171丙地區(qū)506574189合計162188150500當(dāng)前43頁,總共87頁。獨(dú)立性檢驗
(例題分析1-3)當(dāng)前44頁,總共87頁。獨(dú)立性檢驗
(例題分析1-4)(3)作出判斷
19.82>0.05(4)=9.488故拒絕H0,接受H1
,即地區(qū)和原料等級之間存在依賴關(guān)系,原料的質(zhì)量受地區(qū)的影響當(dāng)前45頁,總共87頁。獨(dú)立性檢驗
(例題分析2-1)【例】某集團(tuán)公司欲進(jìn)行一項改革,從所屬的四個分公司中共隨機(jī)抽取了420名職工,了解它們對改革方案的態(tài)度(見下表),以=0.1的顯著性水平檢驗員工態(tài)度是否受所在分公司的影響。一分公司二分公司三分公司四分公司贊成該方案實際頻數(shù)68755779反對該方案實際頻數(shù)32753331當(dāng)前46頁,總共87頁。獨(dú)立性檢驗
(例題分析2-1)解:若員工態(tài)度不受影響,則所在分公司與對改革方案的態(tài)度是相互獨(dú)立的??稍O(shè)定原假設(shè)和備擇假設(shè)分別為
(1)確定假設(shè)H0:
員工所在分公司和對改革方案的態(tài)度是相互獨(dú)立的H1:員工所在分公司和對改革方案的態(tài)度并非相互獨(dú)立當(dāng)前47頁,總共87頁。獨(dú)立性檢驗
(例題分析2-3)實際頻數(shù)(fij)期望頻數(shù)(eij)fij-eij(fij-eij)2(fij-eij)2eij687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730(2)計算期望頻數(shù)及2統(tǒng)計量的值當(dāng)前48頁,總共87頁。獨(dú)立性檢驗
(例題分析2-4)(3)作出判斷
0.05(3)=7.8147.故接受H0。即員工所在分公司與其態(tài)度是相互獨(dú)立的。當(dāng)前49頁,總共87頁。2檢驗的實質(zhì)獨(dú)立性檢驗等價于檢驗多個比例是否相等或由期望的比例算出的期望頻數(shù)與實際頻數(shù)是否相等。檢驗的步驟提出假設(shè)H0:1=p1,2=p2,…j=pj;H11=p1,2=p2,…j=pj至少有一個不成立原假設(shè)意為在一個分類變量C的不同取值下,另一個分類變量R的某一類別的占該R比例是否等于某個期望比例當(dāng)前50頁,總共87頁。2檢驗的實質(zhì)在原假設(shè)成立的前提下,可得到以下檢驗統(tǒng)計量若列聯(lián)表中其中一個分類變量只是考慮的一個類別的觀測值,則使用以下統(tǒng)計量(擬合優(yōu)度檢驗)進(jìn)行決策根據(jù)顯著性水平和自由度(r-1)查出臨界值2
若2>2,拒絕H0;若2<2,接受H0若列聯(lián)表中兩個分類變量都考慮至少有兩個類別的觀測值,則使用以下統(tǒng)計量進(jìn)行決策根據(jù)顯著性水平和自由度(r-1)(c-1)查出臨界值2若2>2,拒絕H0;若2<2,接受H0當(dāng)前51頁,總共87頁。2檢驗舉例
(例題分析1-1)【例9.3】某集團(tuán)公司欲進(jìn)行一項改革,從所屬的四個分公司中共隨機(jī)抽取了420名職工,了解它們對改革方案的態(tài)度(見下表),以=0.1的顯著性水平檢驗員工態(tài)度是否受所在分公司的影響。一分公司二分公司三分公司四分公司贊成該方案實際頻數(shù)68755779反對該方案實際頻數(shù)32753331當(dāng)前52頁,總共87頁。2檢驗舉例
(例題分析1-2)解:若員工對改革方案的態(tài)度不受所在子公司的影響,四個分公司對贊成改革方案的比例是一致的。,設(shè)i為第i個分公司贊成改革方案的百分比)??稍O(shè)定原假設(shè)和備擇假設(shè)分別為:
H0:
1=2=3=4
H1:
1,2,3,4
不全相等當(dāng)前53頁,總共87頁。2檢驗舉例
(例題分析1-3)實際頻數(shù)(fij)期望頻數(shù)(eij)fij-eij(fij-eij)2(fij-eij)2eij687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合計:3.0319當(dāng)前54頁,總共87頁。擬合優(yōu)度檢驗
(例題分析1-3)H0:
1=2=3=4
H1:
1,2,3,4
不全相等
=0.1df=
(4-1)=3臨界值(s):統(tǒng)計量:
在
=0.1的水平上不能拒絕H0可以認(rèn)為四個分公司對改革方案的贊成比例是一致的決策:結(jié)論:206.2153.0319=0.1當(dāng)前55頁,總共87頁。2檢驗
(例題分析2-1)【例】
1912年4月15日,豪華巨輪泰坦尼克號與冰山相撞沉沒。當(dāng)時船上共有共2208人,其中男性1738人,女性470人。海難發(fā)生后,幸存者為718人,其中男性374人,女性344人,以的顯著性水平(0.05)檢驗存活狀況與性別是否有關(guān)。男女合計實際生存人數(shù)374344718實際死亡人前56頁,總共87頁。2檢驗
(例題分析2-2)分析:設(shè)男女存活率分別為1和2
若男女存活率相同,則均為718/2208=0.325
本問題等價于檢驗如下假定:H0:1=2H1:12男女合計實際生存人數(shù)374344718總?cè)送嫒藬?shù)1738×0.325470×0.325當(dāng)前57頁,總共87頁。2檢驗
(例題分析2-3)H0:1=2H1:12
=0.05df=
(2-1)=1臨界值(s):統(tǒng)計量:
在
=0.05的水平上拒絕H0有較充分的理由認(rèn)為生存狀況與性別相關(guān)決策:結(jié)論:203.8415=0.1當(dāng)前58頁,總共87頁。思考1問題1:為什么2檢驗采用右單側(cè)檢驗而不采用雙邊檢驗?答:因為應(yīng)用2檢驗時,原假設(shè)H0實際上可以概括為:觀測頻數(shù)=期望頻數(shù),備擇假設(shè)H1為:觀測頻數(shù)期望頻數(shù),而2統(tǒng)計量的值越小,表明觀測頻率與期望頻率越接近,越因該接受原假設(shè),因此,拒絕域應(yīng)該在2分布的右側(cè),故采用右單側(cè)檢驗。當(dāng)前59頁,總共87頁。思考2問題2:如何解釋2統(tǒng)計量的自由度為(R-1)(C-1)?C1C2C3C4合計R1RT1R2RT2R3RT3合計CT1CT2CT3CT4當(dāng)前60頁,總共87頁。品質(zhì)數(shù)據(jù)的假設(shè)檢驗品質(zhì)數(shù)據(jù)擬合優(yōu)度(比例)檢驗獨(dú)立性檢驗Z
檢驗一個總體
檢驗Z
檢驗
檢驗兩個以上總體兩個總體當(dāng)前61頁,總共87頁。(1)對于學(xué)生宿舍上網(wǎng)收費(fèi)的新措施,男女學(xué)生的抽樣調(diào)查結(jié)果如下列聯(lián)表所示,如果要檢驗?zāi)信澇缮暇W(wǎng)的比例(1
和2)是否相同,則提出的原假設(shè)為:()A.H0:1=2=0.678B.H0:1=2=45
C.H0:1=2=0.322
D.H0:1=2=42檢驗(1)所使用的2統(tǒng)計量的自由度為()
采用()(左側(cè),右側(cè),雙邊)檢驗
練習(xí)(2)C男學(xué)生女學(xué)生合計贊成454287反對10578183合計1501202701右側(cè)當(dāng)前62頁,總共87頁。(3)對于學(xué)生宿舍上網(wǎng)收費(fèi)的新措施,男女學(xué)生的抽樣調(diào)查結(jié)果如下列聯(lián)表所示,如果要檢驗?zāi)信澇缮暇W(wǎng)的比例是否相同,即檢驗H0:1=2=0.322,若給定=0.05,得出的結(jié)論是:()A.拒絕原假設(shè)B.不拒絕原假設(shè)C.可以拒絕也可以不拒絕原假設(shè)D.既不拒絕也不接收原假設(shè)
B男學(xué)生女學(xué)生合計贊成454287反對10578183合計150120270當(dāng)前63頁,總共87頁。9.4列聯(lián)表中的相關(guān)測量9.4.1
相關(guān)系數(shù)9.4.2列聯(lián)相關(guān)系數(shù)9.4.3V
相關(guān)系數(shù)當(dāng)前64頁,總共87頁。列聯(lián)表中的相關(guān)測量品質(zhì)相關(guān)對品質(zhì)數(shù)據(jù)(分類和順序數(shù)據(jù))之間相關(guān)程度的測度列聯(lián)表變量的相關(guān)屬于品質(zhì)相關(guān)列聯(lián)表相關(guān)測量的統(tǒng)計量主要有相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)V
相關(guān)系數(shù)當(dāng)前65頁,總共87頁。
相關(guān)系數(shù)
(correlationcoefficient)測度22列聯(lián)表中數(shù)據(jù)相關(guān)程度對于22列聯(lián)表,
系數(shù)的值在0~1之間
相關(guān)系數(shù)計算公式為當(dāng)前66頁,總共87頁。
相關(guān)系數(shù)
(原理分析)一個簡化的22列聯(lián)表因素Y因素X合計x1x2y1aba+by2cdc+d合計a+cb+dn當(dāng)前67頁,總共87頁。
相關(guān)系數(shù)
(原理分析)列聯(lián)表中每個單元格的期望頻數(shù)分別為將各期望頻數(shù)代入的計算公式得當(dāng)前68頁,總共87頁。
相關(guān)系數(shù)
(原理分析)將入
相關(guān)系數(shù)的計算公式得ad等于bc,=0,表明變量X與Y
之間獨(dú)立若b=0
,c=0,或a=0
,d=0,意味著各觀察頻數(shù)全部落在對角線上,此時||=1,表明變量X與Y
之間完全相關(guān),||
越接近1,相關(guān)程度越大,列聯(lián)表中變量的位置可以互換,的符號沒有實際意義,故取絕對值即可當(dāng)前69頁,總共87頁。
相關(guān)系數(shù)取值范圍
(原理分析)對2×2列聯(lián)表,-11對非2×2列聯(lián)表,故對非2×2列聯(lián)表,系數(shù)將隨著R或C的變大而增大,且值沒有上限,故不適合用系數(shù)測定兩個變量的相關(guān)程度。當(dāng)前70頁,總共87頁。列聯(lián)相關(guān)系數(shù)C
(coefficientofcontingency)列聯(lián)相關(guān)系數(shù)C用于測度大于22列聯(lián)表中數(shù)據(jù)的相關(guān)程度計算公式為C的取值范圍是,其中m=min(R,C)C=0表明列聯(lián)表中的兩個變量獨(dú)立C的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),并隨行數(shù)和列數(shù)的增大而增大當(dāng)前71頁,總共87頁。列聯(lián)相關(guān)系數(shù)
(優(yōu)缺點(diǎn))優(yōu)點(diǎn):計算簡單,對總體分布沒有任何要求。缺點(diǎn):根據(jù)不同行和列計算的列聯(lián)相關(guān)系數(shù)不便于比較。當(dāng)前72頁,總共87頁。V相關(guān)系數(shù)
(Vcorrelationcoefficient)由Gramer提出,計算公式為
V的取值范圍是0V1
V=0表明列聯(lián)表中的兩個變量獨(dú)立
V=1表明列聯(lián)表中的兩個變量完全相關(guān)不同行和列的列聯(lián)表計算的列聯(lián)系數(shù)不便于比較當(dāng)列聯(lián)表中有一維為2,min[(r-1),(c-1)]=1,此時V=當(dāng)前73頁,總共87頁。列聯(lián)表中的相關(guān)測量
(例題分析)【例9.2】一種原料來自三個不同地區(qū),原料質(zhì)量被分成三個不同等級。從這批原料中隨機(jī)抽取500件進(jìn)行檢驗,結(jié)果如下表。分別計算系數(shù)、C系數(shù)和V系數(shù),并分析相關(guān)程度(假設(shè)已檢驗得到地區(qū)和材料質(zhì)量相關(guān))地區(qū)一級二級三級合計甲地區(qū)526424140乙地區(qū)605952171丙地區(qū)506574189合計162188150500當(dāng)前74頁,總共87頁。列聯(lián)表中的相關(guān)測量
(例題分析)解:已知n=500,=19.82,列聯(lián)表為33結(jié)論:三個系數(shù)均不高,表明產(chǎn)地和原料等級之間的相關(guān)程度不高當(dāng)前75頁,總共87頁。、C、V的比較同一個列聯(lián)表,、C、V的結(jié)果會不同在對不同列聯(lián)表變量之間的相關(guān)程度進(jìn)行比較時,不同列聯(lián)表中的行與行、列與列的個數(shù)要相同,并且采用同一種系數(shù)當(dāng)前76頁,總共87頁。(1)對于學(xué)生宿舍上網(wǎng)收費(fèi)的新措施,男女學(xué)生的抽樣調(diào)查結(jié)果如下列聯(lián)表所示,如果要檢驗?zāi)信澇缮暇W(wǎng)的比例是否相同,若根據(jù)數(shù)據(jù)計算得到||=1,則:()A.男學(xué)生全部贊成,女學(xué)生全部反對
B.男女學(xué)生全部都贊成C.男女學(xué)生全部都反對
D.男學(xué)生全部贊成,女學(xué)生全部反對;或男學(xué)生全部反對,女學(xué)生全部贊成練習(xí)(3)D男學(xué)生女學(xué)生合計贊成454287反對10578183合計150120270當(dāng)前77頁,總共87頁。(2)以下測度列聯(lián)表中數(shù)據(jù)的相關(guān)程度的參數(shù),取值范圍有可能不在[0,1]范圍內(nèi)的是:()A.相關(guān)系數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年化療藥物供應(yīng)合同
- 2025年宇宙探索擔(dān)保協(xié)議
- 2025年商鋪抵押借款轉(zhuǎn)換托管協(xié)議
- 2025年度木地板施工與室內(nèi)裝修一體化合同4篇
- 2025年壁球館特許經(jīng)營合同
- 2025年體育館用水合同
- 二零二五版水資源合理化利用建議書范本3篇
- 2024云南公務(wù)員考試行測真題(行政執(zhí)法類)
- 2025版委托代理企業(yè)交稅及稅收籌劃與申報合同6篇
- 2024經(jīng)濟(jì)合同范本
- 《面神經(jīng)炎護(hù)理措施分析》3900字(論文)
- 城市微電網(wǎng)建設(shè)實施方案
- 企業(yè)文化融入中華傳統(tǒng)文化的實施方案
- 9.1增強(qiáng)安全意識 教學(xué)設(shè)計 2024-2025學(xué)年統(tǒng)編版道德與法治七年級上冊
- 《化工設(shè)備機(jī)械基礎(chǔ)(第8版)》全套教學(xué)課件
- 人教版八年級數(shù)學(xué)下冊舉一反三專題17.6勾股定理章末八大題型總結(jié)(培優(yōu)篇)(學(xué)生版+解析)
- 2024屆上海高考語文課內(nèi)古詩文背誦默寫篇目(精校版)
- DL-T5024-2020電力工程地基處理技術(shù)規(guī)程
- 初中數(shù)學(xué)要背誦記憶知識點(diǎn)(概念+公式)
- 駕照體檢表完整版本
- 農(nóng)產(chǎn)品農(nóng)藥殘留檢測及風(fēng)險評估
評論
0/150
提交評論