![第六章列聯(lián)分析_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/10/6a572622-079c-487e-8a0c-f63cd363c3fc/6a572622-079c-487e-8a0c-f63cd363c3fc1.gif)
![第六章列聯(lián)分析_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/10/6a572622-079c-487e-8a0c-f63cd363c3fc/6a572622-079c-487e-8a0c-f63cd363c3fc2.gif)
![第六章列聯(lián)分析_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/10/6a572622-079c-487e-8a0c-f63cd363c3fc/6a572622-079c-487e-8a0c-f63cd363c3fc3.gif)
![第六章列聯(lián)分析_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/10/6a572622-079c-487e-8a0c-f63cd363c3fc/6a572622-079c-487e-8a0c-f63cd363c3fc4.gif)
![第六章列聯(lián)分析_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/10/6a572622-079c-487e-8a0c-f63cd363c3fc/6a572622-079c-487e-8a0c-f63cd363c3fc5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、STATA 從入門到精通第六章第六章 列聯(lián)表分析列聯(lián)表分析Page 2STATA從入門到精通從入門到精通6.1列聯(lián)表分析列聯(lián)表分析n列聯(lián)表是分析兩個(gè)分類變量(名義變量或者定序變量)之間關(guān)系的基列聯(lián)表是分析兩個(gè)分類變量(名義變量或者定序變量)之間關(guān)系的基本統(tǒng)計(jì)方法。設(shè)兩個(gè)變量本統(tǒng)計(jì)方法。設(shè)兩個(gè)變量A和和B分別有分別有r和和c個(gè)類型,則他們可以構(gòu)成一個(gè)個(gè)類型,則他們可以構(gòu)成一個(gè)的列聯(lián)表。的列聯(lián)表。n獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量在對兩變量進(jìn)行列聯(lián)表分析時(shí),首先要檢驗(yàn)它們的獨(dú)立性,這就涉及到在對兩變量進(jìn)行列聯(lián)表分析時(shí),首先要檢驗(yàn)它們的獨(dú)立性,這就涉及到獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量,常用的統(tǒng)計(jì)量有皮爾遜卡方統(tǒng)計(jì)
2、量(獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量,常用的統(tǒng)計(jì)量有皮爾遜卡方統(tǒng)計(jì)量(Pearson Chi-Square)和似然比統(tǒng)計(jì)量()和似然比統(tǒng)計(jì)量(Likelihood Ratio)。)。Fisher精確檢驗(yàn)仍采用卡方統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量,只是在計(jì)算統(tǒng)計(jì)量精確檢驗(yàn)仍采用卡方統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量,只是在計(jì)算統(tǒng)計(jì)量的分布時(shí),利用概率論中的超幾何分布來計(jì)算每一種情況發(fā)生的概率,的分布時(shí),利用概率論中的超幾何分布來計(jì)算每一種情況發(fā)生的概率,然后才能得到然后才能得到P值。當(dāng)樣本量較大,或者列聯(lián)表的行數(shù)及列數(shù)較大時(shí),值。當(dāng)樣本量較大,或者列聯(lián)表的行數(shù)及列數(shù)較大時(shí),F(xiàn)isher檢驗(yàn)的計(jì)算量會變得很大,以至于無法承受。檢驗(yàn)的計(jì)算量
3、會變得很大,以至于無法承受。Page 3STATA從入門到精通從入門到精通n 列聯(lián)表中的相關(guān)測量統(tǒng)計(jì)量列聯(lián)表中的相關(guān)測量統(tǒng)計(jì)量n 對于名義變量,通常采用基于卡方統(tǒng)計(jì)量的各種統(tǒng)計(jì)量來進(jìn)行關(guān)聯(lián)性對于名義變量,通常采用基于卡方統(tǒng)計(jì)量的各種統(tǒng)計(jì)量來進(jìn)行關(guān)聯(lián)性度量,最常的是度量,最常的是Cramers V系數(shù)系數(shù)n 對于有序變量,關(guān)聯(lián)性度量的統(tǒng)計(jì)量通常是基于觀測中的一致對和不對于有序變量,關(guān)聯(lián)性度量的統(tǒng)計(jì)量通常是基于觀測中的一致對和不一致對的個(gè)數(shù)??梢远x以下統(tǒng)計(jì)量來描述有序變量之間的有序關(guān)聯(lián)一致對的個(gè)數(shù)。可以定義以下統(tǒng)計(jì)量來描述有序變量之間的有序關(guān)聯(lián)性的大?。盒缘拇笮。?統(tǒng)計(jì)量:統(tǒng)計(jì)量:gamma統(tǒng)計(jì)
4、量和統(tǒng)計(jì)量和 Kendall統(tǒng)計(jì)量統(tǒng)計(jì)量nPage 4STATA從入門到精通從入門到精通6.2 Stata的列聯(lián)表分析的列聯(lián)表分析table和和tabulate命令命令6.2.1使用使用table命令生成列聯(lián)表命令生成列聯(lián)表table命令可以用于生成一維到多維的列聯(lián)表,表中不僅可以包含常見的命令可以用于生成一維到多維的列聯(lián)表,表中不僅可以包含常見的頻數(shù),還可以包含任意其他變量的描述性統(tǒng)計(jì)量。頻數(shù),還可以包含任意其他變量的描述性統(tǒng)計(jì)量。table命令的格式如下:命令的格式如下: table rowvar colvar supercolvar if in weight , options其中其中r
5、owvar代表行變量,代表行變量,colvar代表列變量,代表列變量,supercolvar代表更高階代表更高階的列變量,同之前一樣,的列變量,同之前一樣,in和和if用于選擇樣本或者選擇范圍,用于選擇樣本或者選擇范圍,weight用用于添加權(quán)重。于添加權(quán)重。Page 5STATA從入門到精通從入門到精通 表表6-2 table命令可以報(bào)告的統(tǒng)計(jì)量命令可以報(bào)告的統(tǒng)計(jì)量n freq 頻數(shù)頻數(shù)n mean 平均數(shù)平均數(shù)n sd 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差n semean 標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 (sd/sqrt(n)n sum 總和總和n count、n 觀測值個(gè)數(shù)觀測值個(gè)數(shù)n max 最大值最大值n min 最小值最小
6、值n median 中位數(shù)中位數(shù)n p# 各種百分位數(shù)各種百分位數(shù)n iqr IQR四分位距四分位距Page 6STATA從入門到精通從入門到精通n 【例【例6.1】 數(shù)據(jù)集數(shù)據(jù)集auto.dta是是Stata系統(tǒng)自帶的關(guān)于系統(tǒng)自帶的關(guān)于1978年汽車市場年汽車市場的一個(gè)調(diào)查數(shù)據(jù),該數(shù)據(jù)集共有的一個(gè)調(diào)查數(shù)據(jù),該數(shù)據(jù)集共有74個(gè)觀測值,個(gè)觀測值,12個(gè)變量。變量的具個(gè)變量。變量的具體情況是:體情況是:make是字符型變量,表明生產(chǎn)廠商。其他均為數(shù)值型變是字符型變量,表明生產(chǎn)廠商。其他均為數(shù)值型變量,量,price是汽車的價(jià)格(萬元),是汽車的價(jià)格(萬元),mpg是行駛里程(英里),是行駛里程(英
7、里),rep78是在該年度修理次數(shù),是在該年度修理次數(shù),foreign是虛擬變量,賦值是虛擬變量,賦值1代表國外產(chǎn),代表國外產(chǎn),0代代表國產(chǎn)。數(shù)據(jù)用幾個(gè)變量揭示了汽車的重要特征:表國產(chǎn)。數(shù)據(jù)用幾個(gè)變量揭示了汽車的重要特征:headroom、trunk、length、turn、displacemen、gea_ratio依次代表汽車內(nèi)部依次代表汽車內(nèi)部空間大小、后備箱空間大小、身長、轉(zhuǎn)彎半徑、排氣量和變速比??臻g大小、后備箱空間大小、身長、轉(zhuǎn)彎半徑、排氣量和變速比。n 本例演示如何利用本例演示如何利用table命令完成如下兩個(gè)任務(wù):命令完成如下兩個(gè)任務(wù):n (1)使用)使用table命令創(chuàng)建關(guān)于命
8、令創(chuàng)建關(guān)于rep78的頻數(shù)表,并在表中顯示的頻數(shù)表,并在表中顯示mpg的的觀測值個(gè)數(shù)、平均數(shù)、標(biāo)準(zhǔn)差和中位數(shù)。觀測值個(gè)數(shù)、平均數(shù)、標(biāo)準(zhǔn)差和中位數(shù)。n (2)使用)使用table命令創(chuàng)建關(guān)于命令創(chuàng)建關(guān)于foreign和和rep78的二維表格,并在表中的二維表格,并在表中顯示顯示mpg的平均數(shù)。的平均數(shù)。Page 7STATA從入門到精通從入門到精通n 【例【例6.2】本例使用一個(gè)關(guān)于肺炎的調(diào)查數(shù)據(jù)集】本例使用一個(gè)關(guān)于肺炎的調(diào)查數(shù)據(jù)集byssin1.dta來說明來說明table命令創(chuàng)建多維表格。數(shù)據(jù)集中每個(gè)觀測值代表了一類人,變量命令創(chuàng)建多維表格。數(shù)據(jù)集中每個(gè)觀測值代表了一類人,變量prob是該類
9、人罹患肺炎的概率,是該類人罹患肺炎的概率,smokes是代表是否吸煙的虛擬變量,是代表是否吸煙的虛擬變量,race是關(guān)于是否是白人的虛擬變量,是關(guān)于是否是白人的虛擬變量,workplace按照工作場所的煙塵按照工作場所的煙塵等級劃分為三類,等級劃分為三類,1為最少,為最少,3為最多,為最多,sex是性別,是性別,1代表男性。最代表男性。最關(guān)鍵的變量是關(guān)鍵的變量是pop,表示具有該觀測值的個(gè)體的數(shù)量,比如,表示具有該觀測值的個(gè)體的數(shù)量,比如,pop=3,則意味著樣本中有則意味著樣本中有3個(gè)人具有該觀測值所揭示的性質(zhì)。在這個(gè)數(shù)據(jù)集個(gè)人具有該觀測值所揭示的性質(zhì)。在這個(gè)數(shù)據(jù)集中,中,pop的取值從的取
10、值從0到到507不等,其中不等,其中0說明沒有任何個(gè)體具有該觀測說明沒有任何個(gè)體具有該觀測值所揭示的性質(zhì),值所揭示的性質(zhì),507則說明有則說明有507個(gè)個(gè)體具有同樣的性質(zhì)。我們鼓個(gè)個(gè)體具有同樣的性質(zhì)。我們鼓勵(lì)讀者使用勵(lì)讀者使用codebook命令對這些變量的具體賦值更深入地考察。命令對這些變量的具體賦值更深入地考察。n 下面我們演示如何完成如下兩個(gè)創(chuàng)建多維表格的任務(wù)。下面我們演示如何完成如下兩個(gè)創(chuàng)建多維表格的任務(wù)。n (1)創(chuàng)建一個(gè)關(guān)于)創(chuàng)建一個(gè)關(guān)于workplace、smokes和和race的三維列聯(lián)表。的三維列聯(lián)表。n (2)創(chuàng)建一個(gè)關(guān)于)創(chuàng)建一個(gè)關(guān)于workplace、smokes、ra
11、ce和和sex的四維列聯(lián)表。的四維列聯(lián)表。Page 8STATA從入門到精通從入門到精通表6-4 數(shù)據(jù)集byssin1.dta(部分?jǐn)?shù)據(jù))smokesraceworkplacepopprobsexyeswhitemost400.075Maleyeswhiteless740Femaleyeswhiteleast2600.007692Maleyesothermost1640.152439Femaleyesothermost240.083333Femaleyesotherless1470.013605Femaleyesotherleast2630.011407Malenowhitemost160Ma
12、lenowhiteless350Malenowhiteleast1340Femalenoothermost810.074074Malenootherless480.020833Femalenootherleast1230.00813Femalenowhitemost40MalePage 9STATA從入門到精通從入門到精通6.2.2使用使用tabulate命令進(jìn)行列聯(lián)表分析命令進(jìn)行列聯(lián)表分析1 一維一維tabulate命令命令n tabulate的一維命令主要用于生成含有頻數(shù)的一維表格,使用比較簡的一維命令主要用于生成含有頻數(shù)的一維表格,使用比較簡單,當(dāng)我們想查看某個(gè)變量的賦值情況時(shí),也可以使
13、用單,當(dāng)我們想查看某個(gè)變量的賦值情況時(shí),也可以使用tabulate來得來得到大體的印象。下面是這個(gè)命令的標(biāo)準(zhǔn)結(jié)構(gòu):到大體的印象。下面是這個(gè)命令的標(biāo)準(zhǔn)結(jié)構(gòu):n tabulate varname if in weight , tabulate1_optionsn 同之前一樣,同之前一樣,in和和if用于選擇樣本或者選擇范圍,用于選擇樣本或者選擇范圍,weight用于添加權(quán)用于添加權(quán)重。重。n tabulate一維命令還有一個(gè)配套的方便工具一維命令還有一個(gè)配套的方便工具tab1,在其后可以添,在其后可以添加多個(gè)變量,然后加多個(gè)變量,然后stata會對每個(gè)變量創(chuàng)建以為表格,也就是相當(dāng)于會對每個(gè)變量創(chuàng)建
14、以為表格,也就是相當(dāng)于多次執(zhí)行多次執(zhí)行tabulate命令。命令。tab1的結(jié)構(gòu)如下:的結(jié)構(gòu)如下:n tab1 varlist if in weight , tab1_optionsPage 10STATA從入門到精通從入門到精通n 【例【例6.3】使用】使用auto.dta數(shù)據(jù)創(chuàng)建數(shù)據(jù)創(chuàng)建rep78和和foreign的一維頻數(shù)表。的一維頻數(shù)表。Page 11STATA從入門到精通從入門到精通2 二維二維tabulate命令命令n 二維二維tabulate命令在生成二維表格的同時(shí),可以計(jì)算多種獨(dú)立性檢驗(yàn)命令在生成二維表格的同時(shí),可以計(jì)算多種獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量和相關(guān)測量統(tǒng)計(jì)量,包括常用的統(tǒng)計(jì)量和相
15、關(guān)測量統(tǒng)計(jì)量,包括常用的Pearsons chi-squared、likelihood-ratio chi-squared、Cram s V、Fishers exact test、Goodman and Kruskals gamma、Kendalls tau-b,這些統(tǒng)計(jì)量,這些統(tǒng)計(jì)量在前面均介紹過。下面是該命令的標(biāo)準(zhǔn)格式:在前面均介紹過。下面是該命令的標(biāo)準(zhǔn)格式:n tabulate varname1 varname2 if in weight , optionsn 同之前一樣,同之前一樣,in和和if用于選擇樣本或者選擇范圍,用于選擇樣本或者選擇范圍,weight用于添加權(quán)用于添加權(quán)重。重。
16、n 同同tabulate的一維表格一樣,二維的一維表格一樣,二維tabulate命令也有命令也有tab2,可用于快,可用于快速生成速生成varlist中所羅列的變量所有可能的二維表格,中所羅列的變量所有可能的二維表格,tab2的標(biāo)準(zhǔn)格式的標(biāo)準(zhǔn)格式如下:如下:n tab2 varlist if in weight , optionsPage 12STATA從入門到精通從入門到精通n 【例【例6.4】利用關(guān)于肺炎的調(diào)查數(shù)據(jù)】利用關(guān)于肺炎的調(diào)查數(shù)據(jù)byssin1.dta來檢驗(yàn)得肺炎概率與來檢驗(yàn)得肺炎概率與是否抽煙、工作場所空氣質(zhì)量這兩個(gè)變量之間的獨(dú)立性(當(dāng)然,憑借是否抽煙、工作場所空氣質(zhì)量這兩個(gè)變量
17、之間的獨(dú)立性(當(dāng)然,憑借常識,它們應(yīng)該是有關(guān)系的),即分別對常識,它們應(yīng)該是有關(guān)系的),即分別對probcat和和smokes以及以及probcat和和workplace做標(biāo)準(zhǔn)的列聯(lián)分析。做標(biāo)準(zhǔn)的列聯(lián)分析。Page 13STATA從入門到精通從入門到精通6.3利用利用Stata生成包含描述性統(tǒng)計(jì)量的列表生成包含描述性統(tǒng)計(jì)量的列表6.3.1 tabstat命令命令n tabstat可以在一個(gè)表格中顯示多個(gè)變量的多種描述性統(tǒng)計(jì)量,這些可以在一個(gè)表格中顯示多個(gè)變量的多種描述性統(tǒng)計(jì)量,這些統(tǒng)計(jì)量包括平均數(shù)、最大最小值、極差、方差、標(biāo)準(zhǔn)差、偏度、峰度統(tǒng)計(jì)量包括平均數(shù)、最大最小值、極差、方差、標(biāo)準(zhǔn)差、偏度
18、、峰度以及各種百分位數(shù)。以及各種百分位數(shù)。tabstat是是summarize命令的替代選擇,前者比命令的替代選擇,前者比后者更加靈活,可以自由選擇表格中包含的統(tǒng)計(jì)量種類。通過添加后者更加靈活,可以自由選擇表格中包含的統(tǒng)計(jì)量種類。通過添加by(),tabstat對每類觀測值報(bào)告各自的統(tǒng)計(jì)量。對每類觀測值報(bào)告各自的統(tǒng)計(jì)量。n tabstat的標(biāo)準(zhǔn)格式如下:的標(biāo)準(zhǔn)格式如下:n tabstat varlist if in weight , optionsn 同之前一樣,同之前一樣,in和和if用于選擇樣本或者選擇范圍,用于選擇樣本或者選擇范圍,weight用于添加權(quán)用于添加權(quán)重。重。Page 14S
19、TATA從入門到精通從入門到精通n rangerange = max - minn mean平均數(shù)平均數(shù)n sd 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差n variance方差方差n semean 標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 (sd/sqrt(n)n sum 總和總和n count 觀測值個(gè)數(shù)觀測值個(gè)數(shù)n max min 最大值最大值 最小值最小值n median 中位數(shù)中位數(shù)n p# 各種百分位數(shù)各種百分位數(shù)n p 相當(dāng)于相當(dāng)于p25 p50 p75n iqr IQR四分位距四分位距Page 15STATA從入門到精通從入門到精通n 【例【例6-6】利用】利用auto.dta數(shù)據(jù)集完成如下兩個(gè)任務(wù):數(shù)據(jù)集完成如下兩個(gè)任務(wù):n (1)生成包含)生成包含price、weight、mpg、rep78的均值的表格。的均值的表格。n (2)對上述四個(gè)變量按照)對上述四個(gè)變量按照foreign分類報(bào)告平均數(shù)、標(biāo)準(zhǔn)差和最小值、分類報(bào)告平均數(shù)、標(biāo)準(zhǔn)差和最小值、最
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 部編版道德與法治九年級下冊第二單元第三課《與世界緊相連第2框與世界深度互動》聽課評課記錄
- 2022版新課標(biāo)七年級上冊道德與法治第五課交友的智慧2課時(shí)聽課評課記錄
- 人教版數(shù)學(xué)九年級上冊《直接開平方法解方程》聽評課記錄3
- 人教版地理八年級下冊7.1《自然特征與農(nóng)業(yè)》聽課評課記錄
- 環(huán)境評估服務(wù)合同(2篇)
- 湘教版數(shù)學(xué)八年級上冊2.2《命題的證明》聽評課記錄2
- 北師大版道德與法治九年級上冊6.2《弘揚(yáng)法治精神》聽課評課記錄
- 北京課改版歷史八年級上冊第10課《辛亥革命與中華民國建立》聽課評課記錄
- 湘教版數(shù)學(xué)七年級上冊《2.5整式的加法和減法(1)》聽評課記錄2
- 部編版八年級歷史上冊《第1課 鴉片戰(zhàn)爭》聽課評課記錄
- 2024年臨床醫(yī)師定期考核試題中醫(yī)知識題庫及答案(共330題) (二)
- 2025-2030年中國反滲透膜行業(yè)市場發(fā)展趨勢展望與投資策略分析報(bào)告
- 湖北省十堰市城區(qū)2024-2025學(xué)年九年級上學(xué)期期末質(zhì)量檢測道德與法治試題 (含答案)
- 山東省濰坊市2024-2025學(xué)年高三上學(xué)期1月期末 英語試題
- 春節(jié)節(jié)后收心會
- 《榜樣9》觀后感心得體會四
- 七年級下冊英語單詞表(人教版)-418個(gè)
- 2025年山東省濟(jì)寧高新區(qū)管委會“優(yōu)才”招聘20人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年中國社會科學(xué)評價(jià)研究院第一批專業(yè)技術(shù)人員招聘2人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 交警安全進(jìn)校園課件
- (2024年高考真題)2024年普通高等學(xué)校招生全國統(tǒng)一考試數(shù)學(xué)試卷-新課標(biāo)Ⅰ卷(含部分解析)
評論
0/150
提交評論