分類變量的重復(fù)測(cè)量_第1頁
分類變量的重復(fù)測(cè)量_第2頁
分類變量的重復(fù)測(cè)量_第3頁
分類變量的重復(fù)測(cè)量_第4頁
分類變量的重復(fù)測(cè)量_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

分類變量的重復(fù)測(cè)量第一頁,共五十一頁,2022年,8月28日

分類變量(categoricalvariable)又稱為定性變量(qualitativevariable),在工作中應(yīng)用甚廣。根據(jù)其不同的取值性質(zhì),又可分為3種類型:第一種是名義刻度(nominalscale)的分類變量,它是按事物屬性分類的變量,如性別、職業(yè)等。在統(tǒng)計(jì)學(xué)上為了計(jì)算方便,將這些不同的屬性進(jìn)行數(shù)量化處理,如男性賦值為1,女性賦值為2。這種數(shù)值只是作為屬性的代碼,其間并無大小之分。第二種為有序刻度(ordinalscale)的分類變量,它是根據(jù)事物呈現(xiàn)出的程度或水平不同進(jìn)行賦值。如臨床化驗(yàn)結(jié)果用符號(hào)“-、+、++、+++”,文化程度用“文盲、小學(xué)、中學(xué)、大學(xué)、研究生”來劃分等級(jí),在進(jìn)行數(shù)量化處理時(shí)賦值1、2、3、…。這里需要注意的是,1與2之差不一定等于2與3之差。第三種是區(qū)間刻度(intervalscale),如人口學(xué)統(tǒng)計(jì)中的年齡分組,“0-,10-,20-,…”就是典型的例子。根據(jù)資料的性質(zhì),區(qū)間跨度有等距的,也有不等距的。第二頁,共五十一頁,2022年,8月28日把分類變量作為反應(yīng)變量進(jìn)行重復(fù)觀察的情形在工作中應(yīng)用較廣。在本書第九章第五節(jié)中介紹了二分類反應(yīng)變量的重復(fù)測(cè)量資料分析方法。本章將介紹分類反應(yīng)變量重復(fù)測(cè)量資料的一般分析方法。主要介紹加權(quán)最小二乘法分析方法。第一節(jié)一個(gè)總體的二分類反應(yīng)重復(fù)測(cè)量資料的分析。第三頁,共五十一頁,2022年,8月28日第一節(jié)二分類反應(yīng)重復(fù)測(cè)量

資料的分析一、資料結(jié)構(gòu)設(shè)有n例受試者,反應(yīng)變量y,分為r水平(當(dāng)r=2時(shí)稱y為二分類反應(yīng)變量),有p個(gè)觀測(cè)時(shí)間點(diǎn),每一受試者可能出現(xiàn)的結(jié)果共有rp種。當(dāng)r=2、p=3時(shí)的所有可能結(jié)果共有8種。當(dāng)對(duì)y用(0,1)賦值方法時(shí),n例受試者在這8種組合情況下出現(xiàn)的邊際合計(jì)數(shù)為n000至n111。詳細(xì)分配情況見下面示意圖圖11.1。第四頁,共五十一頁,2022年,8月28日邊際合計(jì)數(shù)n000至n111是每種可能取值結(jié)果組合情況下的觀察例數(shù)。總例數(shù)n為邊際合計(jì)數(shù)之和。如果將上述示意圖資料按獨(dú)立觀察資料整理各時(shí)間點(diǎn)的頻數(shù)分布時(shí)(表11.1),每一時(shí)間點(diǎn)的合計(jì)數(shù)都為n=n1+=n2+=n3+,總例數(shù)變成了3n而不是n。但實(shí)際是觀察例數(shù)為n,觀察次數(shù)為3n。一般統(tǒng)計(jì)學(xué)方法是以表11.1的資料類型為出發(fā)點(diǎn)進(jìn)行分析的。而本章介紹的方法是以圖11.1的邊際合計(jì)數(shù)為出發(fā)點(diǎn)進(jìn)行分析的。第五頁,共五十一頁,2022年,8月28日二、模型結(jié)構(gòu)受試者i在時(shí)間點(diǎn)j的反應(yīng)變量為yij

,其取值概率為pj,(j=1,…,p)。單總體重復(fù)測(cè)量資料的任務(wù)為是要分析這p個(gè)概率p1,…,pp,是否相等。令反應(yīng)頻數(shù)的某種函數(shù)即反應(yīng)函數(shù)(responsefunction)F=f(m),建立的線性模型為:式中X為d×q維的設(shè)計(jì)矩陣,d=(r-1)p,為反應(yīng)函數(shù)。B為q維未知參數(shù)。第六頁,共五十一頁,2022年,8月28日由于每一個(gè)體在不同時(shí)間點(diǎn)的反應(yīng)變量的取值是相關(guān)的,因此,在配合模型時(shí)應(yīng)將這種相關(guān)性納入模型中。對(duì)式(11.1)求參數(shù)估計(jì)值的加權(quán)最小二乘解法就是在考慮到這種相關(guān)性的基礎(chǔ)上建立起來的。模型(11.1)的加權(quán)最小二乘解法求參數(shù)?的估計(jì)值的計(jì)算公式為第七頁,共五十一頁,2022年,8月28日例11.1一項(xiàng)藥物對(duì)風(fēng)濕性關(guān)節(jié)炎的治療效果觀察。用一種藥物對(duì)46名患風(fēng)濕性關(guān)節(jié)炎的病人進(jìn)行治療,共三個(gè)療程。每個(gè)療程結(jié)束后評(píng)價(jià)其治療效果。有效者記為yij=1,否則yij=0i=1,…,46;j=1,2,3。資料列于表11.2中。表中的T1,T2,T3分別代表三個(gè)療程。本項(xiàng)研究的目的是探討不同療程的療差別。第八頁,共五十一頁,2022年,8月28日三、配合線性模型的步驟

表11.2為資料的原始記錄形式,需要將其整理成邊際頻數(shù)表的格式后再配合模型。計(jì)算步驟介紹如下。

1.首先用下列SAS程序計(jì)算邊際合計(jì)數(shù)程序中的subj為受試者號(hào),time1、time2、time3代表3個(gè)療程。第九頁,共五十一頁,2022年,8月28日第十頁,共五十一頁,2022年,8月28日計(jì)算出的邊際頻數(shù)列于表11.3中。從而得到邊際頻數(shù)向量n及其函數(shù)邊際頻率向量m為:

n=(616242466)’M=(6/460.34780.04350.08700.04350.08700.13040.1304)’

用nj及mj表示向量n及m中的元素。

2.給出轉(zhuǎn)換矩陣A本例的轉(zhuǎn)換矩陣A的結(jié)構(gòu)為

A的作用是將反應(yīng)頻率M轉(zhuǎn)換成反應(yīng)函數(shù)F。第十一頁,共五十一頁,2022年,8月28日

3.求出反應(yīng)函數(shù)F它是每一時(shí)間點(diǎn)反應(yīng)變量各個(gè)水平的邊際概率。但它不包含該反應(yīng)變量最后一個(gè)水平的反應(yīng)概率。本例有3個(gè)時(shí)間點(diǎn)(time1time2time3),每個(gè)時(shí)間點(diǎn)的反應(yīng)變量為r=2水平,故每一時(shí)間點(diǎn)只有一個(gè)反應(yīng)函數(shù)。共有3個(gè)反應(yīng)函數(shù)為:如f1=0.6086957=0.1304348+0.3478261+0.0434783+0.0869565第十二頁,共五十一頁,2022年,8月28日第十三頁,共五十一頁,2022年,8月28日第十四頁,共五十一頁,2022年,8月28日第十五頁,共五十一頁,2022年,8月28日第十六頁,共五十一頁,2022年,8月28日以上分析可用SAS的CATMOD過程。程序如下:

PROCCATMODDATA=exmp11_1order=DATA;RESPONSEMARGINALS;MODELtime1*time2*time3=_RESPONSE_/ONEWAYCOV;REPEATEDtime3/_RESPONSE_=time;RUN;

程序中的RESPONSEMARGINALS語句是指定反應(yīng)函數(shù)為在MODEL中規(guī)定的反應(yīng)變量的邊際概率。輸出結(jié)果見表11.5、表11.6、表11.7。第十七頁,共五十一頁,2022年,8月28日

從輸出的表11.5反應(yīng)函數(shù)和協(xié)方差矩陣中看出,第一和第二療程的有效率都為0.6087(60.87%),第三療程的有效率為0.3478(34.78%)。從表11.6方差分析看,標(biāo)記‘time’的有效率分析,第三療程的效果顯著低于前兩個(gè)療程。對(duì)各療程療效一致性的假設(shè)檢驗(yàn)可用下列公式計(jì)算。令對(duì)比矩陣C為:

第十八頁,共五十一頁,2022年,8月28日從表11.7加權(quán)最小二乘估計(jì)值分析可見,有關(guān)TIME的兩個(gè)參數(shù)估計(jì)值都為正值,反映藥物在療程1、2期的效果優(yōu)于第3期的效果。第十九頁,共五十一頁,2022年,8月28日在程序中的REPEATED語句的下面加入CONTRAST語句:CONTRAST‘time1VStime3’_RESPONSE_21;

或CONTRAST‘time1VStime3’ALL_PARMS021;為了檢驗(yàn)第一療程與第三療程療效的相等性,所用的檢驗(yàn)假設(shè)為:Ho:2=-2-3或Ho:22+3=0;H1:22+30這是因?yàn)樵趨?shù)化時(shí)用了關(guān)系式4=-2-3(4代表第三療程療效),故有2=4等價(jià)于2=-2-3第二十頁,共五十一頁,2022年,8月28日

上述SAS程序是用每個(gè)病例的記錄建立數(shù)據(jù)集配合模型用的,也可以用頻數(shù)表資料(表11.3)配合模型。所用SAS程序?yàn)椋旱玫捷敵鼋Y(jié)果見表11.8。從表11.8對(duì)比分析看出,第一期的療效與第三期療效間有顯著差異(P=0.0161)。第二十一頁,共五十一頁,2022年,8月28日DATAexmpl1_1;INPUTtime1time2time3count;CARDS;111611016101210040112010400160006;PROCCATMODDATA=exmpl1_1ORDER=DATA;RESPONSEMARGINALS;WEIGHTcount;MODELtime1*time2*time3=_RESPONSE_/ONEWAYCOV;REPEATEDtime3/_RESPONSE_=time;RUN;第二十二頁,共五十一頁,2022年,8月28日第二節(jié)多組資料的分析方法

當(dāng)有多組資料時(shí),統(tǒng)計(jì)分析所要回答的問題有三點(diǎn):①資料是否存在組間差異。②反應(yīng)是否隨時(shí)間變化。③是否存在處理組與時(shí)間之間的交互效應(yīng)。分析所用公式以及計(jì)算步驟與單總體的情形基本一致。下面用一個(gè)具有二分類反應(yīng)變量的2組重復(fù)測(cè)量資料為例加以介紹。第二十三頁,共五十一頁,2022年,8月28日例11.2對(duì)65歲及以上老年人參與某項(xiàng)社會(huì)活動(dòng)的6年追蹤調(diào)查。樣本量為男性662人,女性1311人,分別在當(dāng)年、第3年和第6年調(diào)查他們參與社會(huì)活動(dòng)的情況。反應(yīng)變量y的賦值規(guī)則為:

y=1經(jīng)常參加該項(xiàng)社會(huì)活動(dòng)

0不經(jīng)常參加該項(xiàng)社會(huì)活動(dòng)資料列于表11.9中。本例的分組變量為性別,分組數(shù)a=2。反應(yīng)變量y的分類數(shù):r=2。重復(fù)測(cè)量時(shí)間點(diǎn)數(shù)p=3。計(jì)算步驟如下。第二十四頁,共五十一頁,2022年,8月28日第二十五頁,共五十一頁,2022年,8月28日

1.列出邊際頻數(shù)矩陣N及相應(yīng)的邊際頻率矩陣M每一組的邊際頻數(shù)占一列,即N=(n1’,n2)。與之對(duì)應(yīng),每一組的邊際頻率也占頻率矩陣中的一列,即M=(ml’,m2’)。第二十六頁,共五十一頁,2022年,8月28日同時(shí)可以建立一個(gè)16×1維的邊際頻率向量L為:

L=(0.690.070.020.040.030.020.020.120.590.050.020.040.020.030.030.22)’

2.建立轉(zhuǎn)換矩陣A由于每一組都是3個(gè)反應(yīng)變量,每一反應(yīng)變量具有2個(gè)水平,所以所建立的轉(zhuǎn)換矩陣A與例11.1的A完全相同。即第二十七頁,共五十一頁,2022年,8月28日3.計(jì)算反應(yīng)函數(shù)F第二十八頁,共五十一頁,2022年,8月28日

4.分組計(jì)算邊際頻率mg(g=1,2)的協(xié)方差矩陣V(ml)和V(m2)5.兩組反應(yīng)頻率的協(xié)方差矩陣V(M)本例的V(M)為16×16維矩陣,對(duì)角元素為V(mg),非主對(duì)角元素為0。第二十九頁,共五十一頁,2022年,8月28日

6.求F的協(xié)方差矩陣V(F)本例的V(F)為6×6維矩陣:7.定設(shè)計(jì)矩陣X例11.2資料的設(shè)計(jì)矩陣(含交互效應(yīng))見表11.11.第三十頁,共五十一頁,2022年,8月28日故本例含有交互作用項(xiàng)的設(shè)計(jì)矩陣為:第三十一頁,共五十一頁,2022年,8月28日

8.用式(11.2)計(jì)算參數(shù)估計(jì)值(表11.12)第三十二頁,共五十一頁,2022年,8月28日9.用對(duì)比矩陣C作兩組比較的假設(shè)檢驗(yàn)C的結(jié)構(gòu)為:利用式(11.6)得到2=31.38,自由度=3,查附表3:2界值表,有20.05(3)=7.81,反映兩組間的差異有統(tǒng)計(jì)學(xué)意義。以上計(jì)算過程所用SAS程序如下:第三十三頁,共五十一頁,2022年,8月28日DATAexmpl1_2;inputgender$year0year3year6count@@;CARDS;f111904f11088f10125f10051f01133f01022f00130f000158m111391m11036m10112m100143m01115m01021m00118m000143;PROCCATMODORDER=DATA;WEIGHTcount;RESPONSEmarginals;MODELyear0*year3*year6=gender|_RESPONSE_/PRED=FREQCOV;REPEATEDyear;RUN;第三十四頁,共五十一頁,2022年,8月28日輸出結(jié)果見表11.13-表11.17。第三十五頁,共五十一頁,2022年,8月28日第三十六頁,共五十一頁,2022年,8月28日第三十七頁,共五十一頁,2022年,8月28日第三十八頁,共五十一頁,2022年,8月28日第三十九頁,共五十一頁,2022年,8月28日

從輸出表11.17方差分析結(jié)果看,性別(gender)和年份(year)都有顯著的統(tǒng)計(jì)學(xué)意義(P<0.0001);但性別*年份(gender*year)間交互作用無顯著的統(tǒng)計(jì)學(xué)意義(P=0.6476)。因此,在模型中剔除交互作用項(xiàng)后從新配合下列模型:

MODELyear0*year3*year6=gender_RESPONSE_/FRED=FREQCOV;

得到輸出結(jié)果見表11.18,表11.19。第四十頁,共五十一頁,2022年,8月28日第四十一頁,共五十一頁,2022年,8月28日第四十二頁,共五十一頁,2022年,8月28日

輸出結(jié)果表11.19表明,性別間的差異和年份間的差異都具有統(tǒng)計(jì)學(xué)意義。由于無性別關(guān)年份交互作用,所以不同性別受試者對(duì)參與某項(xiàng)社會(huì)活動(dòng)的時(shí)間趨勢(shì)是類似的。為進(jìn)一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論