版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
結(jié)構(gòu)方程模型之遺漏值鄭中平翁儷禎國(guó)立臺(tái)灣大學(xué)心理學(xué)系實(shí)徵研究經(jīng)常遭遇資料遺漏,本研究即在探討資料遺漏機(jī)制為潛在變項(xiàng)組型混合模型時(shí),結(jié)構(gòu)方程模型的最大概似估計(jì),並利用模擬資料為範(fàn)例比較其與常用遺漏值處理法的差異。潛在變項(xiàng)組型混合模型為組型混合模型的延伸,此模型假設(shè)觀察變項(xiàng)的遺漏組型反映潛在變項(xiàng)之類別,而非外顯類別,且各類別可有相異的結(jié)構(gòu)方程模型。本研究建議以MonteCarloEM算則估計(jì)當(dāng)結(jié)構(gòu)方程模型的資料遺漏機(jī)制符合此模式時(shí)之參數(shù),並以模擬資料瞭解其與不同遺漏值處理法表現(xiàn)之差異。結(jié)果顯示,本研究建議的方法對(duì)因素負(fù)載量與潛在類別比率等參數(shù)之估計(jì)良好。關(guān)鍵詞:非隨機(jī)遺漏、組型混合模型、結(jié)構(gòu)方程模型、最大概似法、潛在變項(xiàng)#通訊作者:翁儷禎臺(tái)北市羅斯福路四段一號(hào)臺(tái)灣大學(xué)心理系(電子郵箱:jweng@.tw)調(diào)查研究需透過(guò)收集實(shí)徵資料以瞭解研究對(duì)象,但有時(shí)研究者除了對(duì)問(wèn)題反應(yīng)有興趣外,亦期待能深入探討多個(gè)測(cè)量變項(xiàng)間的相互關(guān)係,此時(shí)「結(jié)構(gòu)方程模型」structuralequationmodels,簡(jiǎn)稱SEM乃為適用方法之一。例如,Newcomb與Bentler(1988)在對(duì)青少年進(jìn)行八年長(zhǎng)期追蹤調(diào)查後,即利用該方法探討青少年毒品使用對(duì)其早期成年生活各方面的影響。結(jié)構(gòu)方程模型包括研究者無(wú)法直接觀察到的潛在變項(xiàng),早期結(jié)構(gòu)方程模型著重於研究連續(xù)潛在變項(xiàng),現(xiàn)在已有不少研究拓展到潛在類別變項(xiàng),本研究即在探討潛在類別影響資料遺漏組型時(shí)結(jié)構(gòu)方程模型的參數(shù)估計(jì)。組型混合模型Little與Rubin(1987)以及Little(1993)嘗試闡釋遺漏資料產(chǎn)生的機(jī)制。當(dāng)觀察變項(xiàng)的各種遺漏組型分別表示不同類的受試者組群,且觀察變項(xiàng)間的關(guān)係可能因不同組群而異時(shí),Little將此遺漏機(jī)制稱為組型混合模型(patternmixturemodel)組型混合模型所以得名係因不同的遺漏組型下形成不同分配,整個(gè)資料的邊際分配為有限混合模型(finitemixturemodel),因此稱為「組型混合模型」(Little,1993,1995)。以縱貫性的社會(huì)調(diào)查為例,該類研究常因受訪者搬家或?qū)φ蚊舾芯茉L而產(chǎn)生資料遺漏,不同遺漏原因可能造成相異的遺漏組型,同時(shí)亦反應(yīng)其社經(jīng)背景,進(jìn)而影響調(diào)查變項(xiàng)的分配,此等資料遺漏機(jī)制即屬組型混合模型。許多遺漏值處理方法無(wú)法直接處理組型混合模型下之結(jié)構(gòu)方程模型,Hedeker與Gibbons(1997)將多樣本結(jié)構(gòu)方程模型(multi-sampleSEM)處理遺漏值之分析方式視為組型混合模型遺漏情形下的結(jié)構(gòu)方程模型(例如Lee,1986;Muthen,Kaplan&Hollis,1987)組型混合模型假設(shè)遺漏組型反應(yīng)不同的受訪者類別,而不同類別可能有相異的結(jié)構(gòu)方程模型,因此不同遺漏組型者應(yīng)分開處理。多樣本結(jié)構(gòu)方程模型遺漏值處理法即將每個(gè)遺漏組型視為一個(gè)群體進(jìn)行分析,因此可處理組型混合模型遺漏情形下的結(jié)構(gòu)方程模型,然以此方法處理組型混合模型時(shí),組型個(gè)數(shù)不能太多。組型混合模型乃針對(duì)外顯類別變項(xiàng)討論資料遺漏機(jī)制,但此等討論對(duì)心理學(xué)研究而言可能不夠充足,而需進(jìn)一步引進(jìn)潛在類別變項(xiàng)。我們可從兩個(gè)角度瞭解為何需將潛在類別引進(jìn)遺漏機(jī)制模型。首先,可以從「理論構(gòu)念」的角度引入潛在變項(xiàng)。心理學(xué)研究常因理論構(gòu)念無(wú)法直接測(cè)量,而在理論模型中引進(jìn)潛在變項(xiàng)以表達(dá)理論構(gòu)念(如Everitt,1984;Joreskog&Sorbom,1993)例如,在較長(zhǎng)的政治議題問(wèn)卷上,受訪者可區(qū)分為「敏感受訪者」與「疲勞受訪者」兩類,其中「敏感受訪者」的特點(diǎn)是對(duì)敏感議題較易有拒答的傾向,而「疲勞受訪者」產(chǎn)生遺漏資料的原因則為因題目增多產(chǎn)生疲勞以致未填答。兩類受訪者的資料遺漏組型可能恰巧相同,但其資料遺漏的原因卻相異。因此,兩類受訪者無(wú)需對(duì)應(yīng)特定的資料遺漏組型,遺漏組型僅反應(yīng)受訪者隸屬於某類型的可能性。如果一受訪者在敏感題目上遺漏的機(jī)率較高,其他題目遺漏的機(jī)率較低,則此受訪者為「敏感受訪者」的機(jī)率較高。另一方面,若受訪者在各題的遺漏機(jī)率隨著題序增加而升高,則其可能為「疲勞受訪者」。此情形中,受訪者類別為潛在類別,反映研究者之理論概念,遺漏組型不用以界定潛在類別,而視作潛在類別的指標(biāo)變項(xiàng)(indicators)其次,可以從測(cè)量誤差的角度引入潛在變項(xiàng)。當(dāng)外顯變項(xiàng)有測(cè)量誤差時(shí),可引進(jìn)潛在變項(xiàng),將外顯變項(xiàng)視為潛在變項(xiàng)與測(cè)量誤差之和(例如Griliches,1974),遺漏機(jī)制模型中的潛在變項(xiàng)同樣也可以從這個(gè)角度來(lái)討論。以前述「敏感受訪者」與「疲勞受訪者」為例,兩者在問(wèn)卷各題產(chǎn)生資料遺漏的機(jī)率不同,但仍可能產(chǎn)生相同的遺漏組型,例如一個(gè)疲勞受訪者填答問(wèn)卷時(shí),可能恰巧都漏答敏感題目,因此遺漏組型未必完全決定受訪者之類別,而可能有誤差。將受訪者類別視為潛在分類變項(xiàng),遺漏組型作為潛在分類的指標(biāo)變項(xiàng),可以將誤差考慮在內(nèi)。本研究之目的即在組型混合模型遺漏機(jī)制中加入潛在類別變項(xiàng),以表達(dá)潛在類別對(duì)遺漏組型的影響,稱之為「潛在變項(xiàng)組型混合模型」(latentvariablepatternmixturemodel),並以最大概似法估計(jì)此遺漏機(jī)制之結(jié)構(gòu)方程模型參數(shù),最後以模擬資料作為範(fàn)例,初步評(píng)估本研究建議方法之表現(xiàn)。潛在變項(xiàng)組型混合模型遺漏機(jī)制的討論常引入遺漏指標(biāo)變項(xiàng),以指示外顯變項(xiàng)是否遺漏。假設(shè)有p
個(gè)外顯變項(xiàng),每一外顯變項(xiàng)對(duì)應(yīng)一遺漏指標(biāo)變項(xiàng)。令M為px1的遺漏指標(biāo)變項(xiàng)向量,M之變項(xiàng)皆為二元變項(xiàng),值0表示資料遺漏,值1表示資料完整,M之?dāng)?shù)值即反應(yīng)了外顯變項(xiàng)的遺漏組型。Mj若Y遺漏jY未遺漏
Mj若Y遺漏jY未遺漏
j1,2,(1)潛在變項(xiàng)組型混合模型假設(shè)遺漏組型反映的是受訪者隸屬各潛在類別的機(jī)率而非外顯類別,不同潛在類別可有個(gè)別的結(jié)構(gòu)方程模型,而外顯變項(xiàng)與遺漏指標(biāo)變項(xiàng)皆反映潛在類別。因此,外顯連續(xù)變項(xiàng)與潛在類別變項(xiàng)形成有限混合結(jié)構(gòu)方程模型(finitemixturesSEM),而遺漏指標(biāo)變項(xiàng)M與潛在類別變項(xiàng)則形成潛在類別模型(潛在類別分析,latentclassanalysis)。有限混合結(jié)構(gòu)方程模型有許多種描述法(例如,Jedidi,Jagpal&Desarbo,1997a,b),本研究以Dolan與vanderMaas(1998)之模型描述:TOC\o"1-5"\h\zY|g=v+Aq+s⑵ggggn=a+G(3)ggggg式(2)表示潛在類別為g時(shí)外顯連續(xù)變項(xiàng)與潛在變項(xiàng)的關(guān)係,其中YIg為px1的外顯變項(xiàng)向量,V為pX1的截距向量,n為kx1的潛在變項(xiàng)向量,Aggg為pXk的係數(shù)矩陣,s為pX1的殘差向量。式(3)表示潛在類別為g時(shí)潛在g變項(xiàng)間的關(guān)係,其中a為kX1的截距向量,B為kXk的係數(shù)矩陣,G為kXggg1的殘差向量。假設(shè)在給定潛在類別下,外顯變項(xiàng)的條件分配為多元常態(tài)分配,則外顯連續(xù)變項(xiàng)分配為多元常態(tài)有限混合分配。潛在變項(xiàng)組型混合模型的遺漏機(jī)制在形式上相當(dāng)於潛在類別模型,遺漏指標(biāo)變項(xiàng)間的關(guān)係為潛在類別所造成,若固定潛在類別,則遺漏指標(biāo)變項(xiàng)間彼此獨(dú)立,稱為局部獨(dú)立(localindependence,McCutcheon,1987)。在此假設(shè)下,當(dāng)潛在類別為g時(shí),M組型為m的機(jī)率為p(M=mIg)=np(M=mIg)=R九(1一九)—mj(4)jjjgjgj=1j=1其中p(M=mIg)與p(M=mIg)分別表示在給定潛在類別為第g類下,Mjj組型恰為m與第j個(gè)二元變項(xiàng)恰為m的機(jī)率,九為第g個(gè)潛在類別在第j題數(shù)jjg值為1(未遺漏)的機(jī)率。各潛在類別下都可能觀察到M為m,因此當(dāng)有n個(gè)c潛在類別時(shí),M組型為m的機(jī)率為p(M=m)=為冗*p(M=m11)=為冗*O九m;(1一九)】一m;(5)ttjtjtt=1t=1j=1其中冗為第t個(gè)潛在類別佔(zhàn)母體比率。假設(shè)潛在類別數(shù)已知(恰為n),待tc估計(jì)參數(shù)包括九與兀,前者為pXn的機(jī)率矩陣,表示每個(gè)潛在類別在每一題c的遺漏機(jī)率,而兀則為nX1維向量,表示各潛在類別比率,其元素和為1。c潛在變項(xiàng)組型混合模型下之結(jié)構(gòu)方程模型可以式(2)、(3)與(5)描述。如果僅考慮外顯連續(xù)變項(xiàng)(Y),包括式(2)與(3),則模型為有限混合結(jié)構(gòu)方程模型。若只考慮外顯二元變項(xiàng)(遺漏指標(biāo)變項(xiàng)M,式(5)),則為潛在類別模型。潛在變項(xiàng)組型混合模型的結(jié)構(gòu)方程模型形式上可以視為包含潛在類別模型與有限混合結(jié)構(gòu)方程模型,相當(dāng)於分析變項(xiàng)w,w=(y,M')'。在給定潛在類別時(shí),假設(shè)Y與M局部獨(dú)立,且Y為多元常態(tài)分配,則概似函數(shù)為(Bartholomew&Knott,1999;Muthen,2001a):TOC\o"1-5"\h\zL=門KC*f(Y)*f(M),(6)i,t1,ti2,tii=1t=1其中f(Y)=(U2兀)-p*(I力I)—.5*exp(-.5(Y-y)'*力-1*(Y-)),titittitf(M)=rfXMj(1—九)1-MjOtijtjtj=1f()表示潛在類別為t時(shí)之多元常態(tài)分配機(jī)率密度函數(shù),f()是多元二項(xiàng)1,t2,t分配機(jī)率函數(shù)。Muthen(2001b)的第二代結(jié)構(gòu)方程模型描述包含潛在連續(xù)變項(xiàng)與潛在類別的模型,其外顯變項(xiàng)則包括連續(xù)變項(xiàng)與類別變項(xiàng),並考慮連續(xù)的共變項(xiàng)(covariate),潛在變項(xiàng)組型混合模型下之結(jié)構(gòu)方程模型形式上相當(dāng)於沒有共變項(xiàng)且有遺漏值時(shí)的第二代結(jié)構(gòu)方程模型。本研究擬採(cǎi)MCEM算則(MonteCarloEMalgorithm)推導(dǎo)當(dāng)遺漏機(jī)制為潛在變項(xiàng)組型混合模型時(shí)結(jié)構(gòu)方程模型之最大概似估計(jì),以LVPM-ML稱之,完整資料之第二代結(jié)構(gòu)方程模型估計(jì)(Muthen,2001a,b)可作為MCEM算則的M步驟。潛在變項(xiàng)組型混合模型的估計(jì):MCEM算則MCEM算則為EM算則的變形。EM算則是一個(gè)疊代(iterative)程序,每次疊代分成E步驟(expectationstep)與M步驟(maximizationstep)E步驟推導(dǎo)給定觀察外顯變項(xiàng)下遺漏變項(xiàng)之條件機(jī)率密度函數(shù),用以計(jì)算在目前參數(shù)估計(jì)值下對(duì)數(shù)概似函數(shù)之期望值。M步驟則根據(jù)E步驟所得資料求參數(shù)之最大概似估計(jì)值,相當(dāng)於完整資料之最大概似估計(jì)(Dempster,Laird,&Rubin,1977;McLachlan&Krishnan,1997)。完整資料的最大概似估計(jì)多半較容易或已於過(guò)去研究中發(fā)展,因此研究者在分析遺漏資料時(shí),若使用EM算則常僅需考慮E步驟即可,故許多遺漏資料的處理都採(cǎi)用EM算則(McLachlan&Krishnan,1997)本研究潛在變項(xiàng)組型混合模型之結(jié)構(gòu)方程模型估計(jì)亦採(cǎi)EM類算則,在推導(dǎo)E步驟後,以Muth6n(2001a,b)之第二代結(jié)構(gòu)方程模型作為M步驟,估計(jì)相關(guān)參數(shù)。EM算則E步驟期望值之求取有時(shí)牽涉多元積分,致使其分析困難或計(jì)算耗時(shí),MCEM算則即可加以改善。MCEM算則以MCE步驟(MonteCarloEstep)取代E步驟,特點(diǎn)在於以模擬方法(MonteCarloMethod)計(jì)算E步驟中對(duì)數(shù)概似函數(shù)期望值之近似值,亦即藉由產(chǎn)生數(shù)個(gè)隨機(jī)向量,分別以之填補(bǔ)遺漏值,計(jì)算對(duì)應(yīng)之對(duì)數(shù)概似函數(shù)值,平均後作為對(duì)數(shù)概似函數(shù)期望值之估計(jì)(例如,Wei&Tanner,1990;Ruud,1991)MCEM算則不牽涉期望值,因此常能避免多元積分運(yùn)算,是對(duì)數(shù)概似函數(shù)期望值難以分析計(jì)算時(shí)極佳之替代方案(McLachlan&Krishnan,1997)本研究建議之MCEM算則,包含如下步驟:1.MCE步驟:僵件分配:求取條件機(jī)率密度函數(shù)。針對(duì)每筆具遺漏值資料(假設(shè)為第i筆),在給定觀察值,即給定未遺漏變項(xiàng)(Yy)與遺漏指標(biāo)變項(xiàng)i,obsi,obs(M=m)下,求取遺漏變項(xiàng)(Y)之分佈。固定潛在類別時(shí),Y與Y形iii,misi,misi,obs成多元常態(tài)分配,兩者並與M獨(dú)立,因此如進(jìn)一步給定y,Y仍呈多元常i,obsi,mis態(tài)分配,而M之分配未受影響。橫跨所有類別,給定Y,則Y為有限常態(tài)ii,obsi,mis混合模型,M呈潛在變項(xiàng)類別模型。如再給定M=m,並不直接影響遺漏變項(xiàng)iiiY之分配,而影響潛在類別隸屬變項(xiàng),遺漏變項(xiàng)仍呈有限常態(tài)混合模型:i,misTOC\o"1-5"\h\zf(YIY=y,M=m)=1LC'*f(YIY)(7)i,misi,obsi,obsiii,tti,misi,obst=1其中c=Ci*ft(Mi),其中細(xì)節(jié)請(qǐng)見附錄。i,tncEC*f(M)i,llil=11.2產(chǎn)生隨機(jī)向量,求取近似期望值:導(dǎo)出條件機(jī)率密度函數(shù)後,本研究建議採(cǎi)複合抽樣法(compositionmethod,又譯合成法,高惠璇,1995)產(chǎn)生隨機(jī)向量。複合抽樣法適用在欲抽取之分佈函數(shù)可表示為F(x)=EpF(x)之情ttt=1形,本研究欲抽樣之機(jī)率密度函數(shù)為常態(tài)混合分配,即符合複合抽樣法之要求。首先在給定M下計(jì)算對(duì)應(yīng)之C',產(chǎn)生隨機(jī)整數(shù)T,使p(T=t)=p=C'。假設(shè)ii,tti,tT=g,則依據(jù)多元常態(tài)機(jī)率密度函數(shù)N(中,口)產(chǎn)生隨機(jī)向量。重複前mis|obsmis|obs述步驟R次,則可得R組隨機(jī)向量,將其取代遺漏變項(xiàng)後可形成R筆完整資料,再計(jì)算該筆資料對(duì)數(shù)概似函數(shù)之平均值作為近似期望值。2.M步驟:以Muth6n(2001a,b)之作法估計(jì)參數(shù)。範(fàn)例本研究產(chǎn)生一模擬資料,以初步比較數(shù)種遺漏值處理法於潛在變項(xiàng)組型混合模型下之表現(xiàn)。此範(fàn)例之目的乃在探討如果資料遺漏機(jī)制為潛在變項(xiàng)組型混合模型,則本研究推導(dǎo)之估計(jì)的表現(xiàn)是否較其他遺漏值處理法為佳。探討的遺漏值處理法包括列刪除法、平均值插補(bǔ)法、迴歸插補(bǔ)法與本研究建議之LVPM-ML,由於本研究焦點(diǎn)在遺漏資料的處理,故乃假設(shè)外顯連續(xù)變項(xiàng)的結(jié)構(gòu)方程模型設(shè)定正確,即為有限混合結(jié)構(gòu)方程模型。進(jìn)行有限混合結(jié)構(gòu)方程模型分析時(shí),需以各個(gè)觀察值的個(gè)別資料進(jìn)行分析,因此,無(wú)法產(chǎn)生完整個(gè)別資料之遺漏值處理法皆不適用,此類方法包括對(duì)刪除法與全訊息最大概似估計(jì)(fullinformationML,Arbuckle,1996;Enders,2001),多樣本結(jié)構(gòu)方程模型遺漏值處理法則因本例遺漏組型過(guò)多而不適用。本範(fàn)例產(chǎn)生完整資料時(shí),設(shè)定樣本數(shù)為1000,並假定有「疲勞受訪者」與「敏感受訪者」兩個(gè)潛在類別,各佔(zhàn)全樣本之66.7%與33.3%。兩類受訪者的結(jié)構(gòu)方程模型皆為四變項(xiàng)之斜交二因素模型,各因素之平均數(shù)為0,標(biāo)準(zhǔn)差為1,因素間相關(guān)則為.5,前二變項(xiàng)在第一個(gè)因素上有非零負(fù)載量,後二變項(xiàng)則在第二因素上有非零負(fù)載量,其餘負(fù)載量為0。非零之因素負(fù)載量與變項(xiàng)平均數(shù)則依潛在類別不同而異,「疲勞受訪者」分別設(shè)定為.8與0,「敏感受訪者」則為.6與2。在產(chǎn)生資料遺漏上,為使遺漏機(jī)制符合潛在變項(xiàng)組型混合模型,乃假設(shè)疲勞類別受訪者各題遺漏機(jī)率隨題序而增加,分別為.05、.15、.25與.35,敏感類別受訪者對(duì)前二題較敏感,因此有較高遺漏機(jī)率(.35),對(duì)後二題遺漏機(jī)率則較低(.05)。此模擬資料產(chǎn)生歷程之參數(shù)數(shù)值整理於表一模型理論值一欄。產(chǎn)生遺漏資料後,即以不同遺漏值處理法分析,並估計(jì)結(jié)構(gòu)方程模型之參數(shù),同時(shí)亦分析完整資料,作為考量遺漏值處理法優(yōu)劣之參考。分析模型設(shè)為有限混合結(jié)構(gòu)方程模型,受訪者所屬類別未知,僅假設(shè)已知有二個(gè)潛在類別。列刪除法、平均值插補(bǔ)法與迴歸插補(bǔ)法是先處理遺漏值,再以最大概似法進(jìn)行有限混合結(jié)構(gòu)方程模型分析的二階段作法,LVPM-ML則同時(shí)處理遺漏值並進(jìn)行有限混合結(jié)構(gòu)方程模型分析。LVPM-ML之MCEM算則以研究者撰寫之SAS/IML程式控制主要流程,M步驟以Mplus2.02(Muthen&Muthen,2002)進(jìn)行,MCE步驟則以作者撰寫的讀取Mplus輸出之程式,得到M步驟每次疊代之參數(shù)估計(jì)值,再以SAS/IML求取條件機(jī)率密度函數(shù)及產(chǎn)生R個(gè)隨機(jī)向量。由於MCEM算則疊代過(guò)程牽涉隨機(jī)抽樣因素,估計(jì)值會(huì)在定值附近波動(dòng),因此可以參數(shù)估計(jì)穩(wěn)定後,最後數(shù)次估計(jì)值之平均作為估計(jì)值(例如,Bockenholt&Tsai,2001)本範(fàn)例之R初始值設(shè)為15,隨疊代次數(shù)每次增加5,上限設(shè)為100。隨著疊代次數(shù)的增加,對(duì)數(shù)概似函數(shù)估計(jì)值在第16次後,變化不超過(guò)對(duì)數(shù)概似函數(shù)數(shù)值之千分之一,任兩次疊代求得參數(shù)估計(jì)值之RMSD(rootmeansquareddifference)在第19次疊代後則不高於.01,且多在.005以下,參數(shù)估計(jì)趨於穩(wěn)定,為使所得之參數(shù)估計(jì)值較穩(wěn)定,本範(fàn)例再疊代50餘次,計(jì)疊代75次,以最後25次估計(jì)值平均作為L(zhǎng)VPM-ML之估計(jì)值。各種遺漏值處理法中除列刪除法採(cǎi)410筆完全未遺漏資料分析外,其餘各方法皆處理1000筆資料,各種遺漏值處理法與完整資料之參數(shù)估計(jì)值列於表一。四種遺漏值處理法中,因素負(fù)載量估計(jì)以本研究建議之LVPM-ML最佳,RMSD為.165,優(yōu)於列刪除法與迴歸插補(bǔ)法(RMSD為.227與.243),平均值插補(bǔ)法最差(.523)因素間相關(guān)以LVPM-ML與列刪除法估計(jì)最佳(.098與.105),迴歸插補(bǔ)法與平均值插補(bǔ)法最差(.173與.207)。變項(xiàng)的平均數(shù)以列刪除法與LVPM-ML估計(jì)最佳(.088與.108),迴歸插補(bǔ)法次之(.323),仍以平均值插補(bǔ)法最差(.406)潛在類別比率估計(jì)值以LVPM-ML與列刪除法估計(jì)較準(zhǔn)(RMSD為.009及.011),其他方法表現(xiàn)不佳。四種遺漏值處理法中,LVPM-ML納入遺漏指標(biāo)變項(xiàng),因此可估計(jì)不同潛在類別各變項(xiàng)之遺漏比率,由表一可看出遺漏組型如假設(shè)模式,疲勞類別之遺漏比率依題序增加而升高,敏感類別則在前二題有較高遺漏比率,LVPM-ML對(duì)各題遺漏機(jī)率估計(jì)之RMSD為.018。(置表一於此)如以完整資料為標(biāo)準(zhǔn),各遺漏值處理法在各類參數(shù)估計(jì)上的表現(xiàn)與前述類似,唯RMSD較低。因素負(fù)載量估計(jì)以LVPM-ML最佳(RMSD為.049),列刪除法次之(.106),平均值插補(bǔ)法與迴歸插補(bǔ)法表現(xiàn)較差(RMSD分別為.258與.476)因素間相關(guān)以LVPM-ML與列刪除法估計(jì)最佳(.035與.045),迴歸插補(bǔ)法與平均值插補(bǔ)法最差(.079與.118)變項(xiàng)的平均數(shù)以列刪除法與LVPM-ML估計(jì)最佳(.078與.086),迴歸插補(bǔ)法及平均值插補(bǔ)法最差(.307與.382)。潛在類別比率估計(jì)值以LVPM-ML與列刪除法估計(jì)較準(zhǔn)(RMSD皆為.002),優(yōu)於迴歸插補(bǔ)法及平均值插補(bǔ)法(.1497與.251)。綜合看來(lái),LVPM-ML表現(xiàn)最佳,除變項(xiàng)平均數(shù)外,對(duì)其餘參數(shù)的估計(jì)都優(yōu)於其他方法,同時(shí)亦提供各類別資料遺漏之訊息。列刪除法表現(xiàn)次之,特別對(duì)因素間相關(guān)的估計(jì)較準(zhǔn)確,平均值插補(bǔ)法與迴歸插補(bǔ)法的表現(xiàn)都相當(dāng)差。討論結(jié)構(gòu)方程模型分析需要實(shí)徵資料以驗(yàn)證研究者假設(shè)的理論模型,而資料發(fā)生遺漏是其收集過(guò)程經(jīng)常會(huì)遭遇到的情形。Littl(1993)提出的選擇模型(selectionmodel)與組型混合模型對(duì)心理學(xué)研究而言有其不足之處,因?yàn)榇藘深惸P途鶅H著眼於可觀察變項(xiàng)與資料遺漏間的關(guān)係,資料遺漏也可能與潛在變項(xiàng)有關(guān)。MuthOn等人(1987)將潛在連續(xù)變項(xiàng)加入選擇模型,鄭中平與翁儷禎(2002)則推導(dǎo)此時(shí)的最大概似估計(jì)。本研究則將潛在類別變項(xiàng)加入組型混合模型,稱之為潛在變項(xiàng)組型混合模型。潛在變項(xiàng)組型混合模型假設(shè)觀察變項(xiàng)的遺漏組型並非受訪者的分類,而是潛在類別的指標(biāo)變項(xiàng),此模型為L(zhǎng)ittle組型混合模型擴(kuò)充至潛在變項(xiàng)層次之延伸。簡(jiǎn)言之,潛在變項(xiàng)組型混合模型假設(shè)觀察變項(xiàng)的遺漏組型反映潛在變項(xiàng)之類別,且各類別有其結(jié)構(gòu)方程模型。本研究建議以MCEM算則估計(jì)資料遺漏機(jī)制為潛在變項(xiàng)組型混合模型時(shí)結(jié)構(gòu)方程模型的參數(shù),並以模擬資料為例,比較數(shù)種遺漏值處理法的表現(xiàn)。結(jié)果發(fā)現(xiàn)LVPM-ML最能回復(fù)資料產(chǎn)生歷程的因素負(fù)載量,對(duì)於不同潛在類別之遺漏機(jī)率與潛在類別比率估計(jì)亦表現(xiàn)良好,唯因素間相關(guān)估計(jì)略差。列刪除法對(duì)因素結(jié)構(gòu)的回復(fù)表現(xiàn)次於LVPM-ML,但優(yōu)於平均值插補(bǔ)法與迴歸插補(bǔ)法。本研究建議之LVPM-ML表現(xiàn)優(yōu)良,相較於完整資料,LVPM-ML估計(jì)時(shí)除利用連續(xù)資料訊息外,遺漏指標(biāo)亦作為潛在類別指標(biāo)變項(xiàng),可能因此使?jié)撛陬悇e比率之估計(jì)較準(zhǔn)確,進(jìn)而影響各類別因素負(fù)載量之估計(jì)。唯本範(fàn)例假設(shè)之遺漏比率較高,前述結(jié)論是否能運(yùn)用至一般情形,則宜以設(shè)計(jì)完整之模擬研究探究。LVPM-ML有賴兩個(gè)假設(shè),首先是資料遺漏組型受潛在類別影響,其次為研究者正確設(shè)定潛在類別個(gè)數(shù)。違反任一假設(shè)都可能使估計(jì)程序表現(xiàn)不如預(yù)期理想,未來(lái)如能發(fā)展檢定假設(shè)是否成立的方法,或瞭解假設(shè)未成立時(shí)估計(jì)方法之強(qiáng)韌性,均對(duì)LVPM-ML的實(shí)際運(yùn)用有所助益。兩個(gè)假設(shè)中,判定資料遺漏是否為潛在變項(xiàng)組型混合模型可能最為關(guān)鍵,此乃由於現(xiàn)行大多數(shù)遺漏值處理法皆在選擇模型假設(shè)下進(jìn)行,判定資料遺漏是否為潛在變項(xiàng)組型混合模型乃為不可忽視的議題。未來(lái)如能發(fā)展相關(guān)檢定程序,將更能協(xié)助研究者對(duì)資料遺漏機(jī)制之判斷,進(jìn)而選擇適當(dāng)?shù)倪z漏值處理法。LVPM-ML亦假設(shè)研究者正確設(shè)定遺漏機(jī)制模型,尤其是潛在類別的數(shù)目。但多數(shù)實(shí)徵研究的旨趣並不在遺漏機(jī)制,若研究者對(duì)其背後的潛在類別不清楚,則潛在變項(xiàng)組型混合模型分析中,遺漏機(jī)制模型設(shè)定正確與否對(duì)參數(shù)估計(jì)影響的研究便相當(dāng)重要,未來(lái)宜以模擬研究釐清。本研究以潛在變項(xiàng)組型混合模型嘗試探討潛在類別影響資料遺漏組型時(shí)結(jié)構(gòu)方程模型之參數(shù)估計(jì),初步研究發(fā)現(xiàn)推導(dǎo)之MCEM算則表現(xiàn)良好。此研究為一初探性研究,有關(guān)該模式假設(shè)與適用性之相關(guān)議題尚待後續(xù)研究進(jìn)一步探討瞭解。參考文獻(xiàn)高惠璇(編著)(1995)?!附y(tǒng)計(jì)計(jì)算」。北京:北京大學(xué)出版社。鄭中平與翁儷禎(2002年八月)。「潛在變項(xiàng)選擇模型下結(jié)構(gòu)方程模型之最大概似估計(jì)」。發(fā)表於第四屆調(diào)查研究方法與應(yīng)用學(xué)術(shù)研討會(huì),臺(tái)北。Arbuckle,J.L.(1996).Fullinformationestimationinthepresenceofincompletedata.InGA.Marcoulides&R.E.Schumacker(Eds.),Advancedstructuralequationmodeling:Issuesandtechniques(pp.243-277).Mahwah,NJ:LawrenceErlbaumAssociates,Inc.Bartholomew,D.J.&Knott,M.(1999).Latentvariablemodelsandfactoranalysis.London:Arnold.Bockenholt,U.,&Tsai,R.C.(2001).Individualdifferencesinpairedcomparisondata.BritishJournalofMathematicalandStatisticalPsychology,54,265-277.Dempster,A.P.,Laird,N.M.,&Rubin,D.B.(1977).MaximumLikelihoodfromincompletedataviatheEMalgorithm.JournaloftheRoyalStatisticalSociety,SeriesB,39,1-38.Dolan,V.C.,&vanderMaas,H.L.J.(1998).Fittingmultivariatenormalfinitemixturessubjecttostructuralequationmodeling.Psychometrika,63,227-253.Enders,C.K.(2001).Aprimeronmaximumlikelihoodalgorithmsavailableforusewithmissingdata,StructuralEquationModeling,8,128-141.Everitt,B.S.(1984).Anintroductiontolatentvariablemodels.NewYork:ChapmanandHall.Griliches,Z.(1974).Errorsinvariablesandotherunobservables.Econometrika,42,971-998.(ReprintedinD.J.Aigner,&A.S.Goldberger(Eds),1977,Latentvariablesinsocio-economicmodels.Amsterdam:North-Holland.)Hedeker,D.,&Gibbons,R.D.(1997).Applicationofrandom-effectpattern-mixturemodelsformissingdatainlongitudinalstudies,PsychologicalMethods,2,64-78.Jedidi,K.,Jagpal,H.S.,&Desarbo,W.S.(1997a).STEMM:Ageneralfinitemixturestructuralequationmodel.JournalofClassification,14,23-50.Jedidi,K.,Jagpal,H.S.,&Desarbo,W.S.(1997b).Finite-mixturestructuralequationmodelsforresponse-basedsegmentationandunobservedheterogeneity.MarketingScience,16,39-59.Johnson,N.L.,&Kotz,S.(1972)Distributionsinstatistics:continuousmultivariatedistributions.NewYork:JohnWiley&Sons.Joreskog,K.G.,&Sorbom,D.(1993).LISREL8:StructuralEquationModelingwiththeSIMPLIScommandlanguage.Mooresville,IN:ScientificSoftware,Inc.Lee,S.Y.(1986).Estimationforstructuralequationmodelswithmissingdata.Psychometrika,51,93-99.Little,R.J.A.(1993).Pattern-mixturemodelsformultivariateincompletedata.JournaloftheAmericanStatisticalAssociation,88,125-134.Little,R.J.A.(1994).Aclassofpattern-mixturemodelsfornormalincompletedata.Biometrika,81,471-483.Little,R.J.A.(1995).Modelingthedrop-outmechanisminrepeated-measuresstudies.JournaloftheAmericanStatisticalAssociation,90,1112-1121.Little,R.J.A.,&Rubin,D.B.(1987).Statisticalanalysiswithmissingdata.NewYork:JohnWiley&Sons.McCutcheon,A.L.(1987).Latentclassanalysis.SageUniversityPaperseriesonQuantitativeApplicationsinthesocialScience,seriesno.07-064.NewburyPark,CA:Sage.McLachlan,GJ.,&Krishnan,T.(1997).TheEMalgorithmandextensions.NewYork:JohnWiley&Sons.Muthen,B.(2001a).Latentvariablemixturemodeling.InGA.Marcoulides&R.E.Schumacker(Ed)Newdevelopmentsandtechniquesinstructuralequationmodeling,(pp.1-33).Mahwah,NJ:LawrenceErlbaumAssociates,Inc.Muthen,B.(2001b).Second-generationstructuralequationmodelingwithacombinationofcategoricalandcontinuouslatentvariables.InL.M.Collins&A.GSayer(Ed)Newmethodsfortheanalysisofchange,(pp.291-322).Washington,DC:AmericanPsychologicalAssociation.Muthen,B.,Kaplan,D.,&Hollis,M.(1987).Onstructuralequationmodelingwithdatathatarenotmissingcompletelyatrandom.Psychometrika,52,431-462.Muthen,L.,&Muthen,B.(2002).Mplus2.02[Computersoftware].Http://www.StatM.Newcomb,M.D.,&Bentler,P.M.(1988).Consequencesofadolescentdruguse:Impactonthelivesofyoungadults.NewburyPark,CA:Sage.Ruud,P.A.(1991).ExtensionsofestimationmethodsusingtheEMalgorithm.JournalofEconometrics,49,305-341.Wei,G.C.G.,&Tanner,M.A.(1990).AMonteCarloimplementationoftheEMalgorithmandthepoorman'sdataaugmentationalgorithm.JournaloftheAmericanStatisticalAssociation,85,699-704.附錄潛在變項(xiàng)組型混合模型之遺漏變項(xiàng)條件機(jī)率密度函數(shù)令Y為第i筆資料的外顯變項(xiàng)向量,維度為pX1,其中Y為Y中遺漏變TOC\o"1-5"\h\zii,misi項(xiàng)向量,Y為未遺漏變項(xiàng)向量,M為Y之遺漏指標(biāo)變項(xiàng)向量?,F(xiàn)欲在給定i,obsiiMCEM算則M步驟估計(jì)之第g個(gè)潛在類別Y的平均數(shù)向量X和共變數(shù)矩陣Yg,及隸屬變項(xiàng)C下,求得固定Y=y與M=m時(shí),Y之條件機(jī)率密i,gi,obsi,obsiii,mis度函數(shù)f(YIY=y,M=m)。i,misi,obsi,obsii為方便表達(dá),乃引進(jìn)選取變項(xiàng)並重排的運(yùn)算w,w為axp矩陣,a為選取變項(xiàng)數(shù)(Finkbeiner,1979)每筆資料的連續(xù)變項(xiàng)可分成二類:遺漏變項(xiàng)與未遺漏變項(xiàng),w之下標(biāo)依序標(biāo)示是否選取遺漏變項(xiàng)與未遺漏變項(xiàng),0表示不選取該類變項(xiàng),1表示選取該類變項(xiàng);例如,w表示不選取遺漏變項(xiàng),但選取未遺漏變01項(xiàng)。以Y'=[2.5..3為例(.表示遺漏值),(wy)'=[253],對(duì)應(yīng)之w如下所i01i01示。01000010000000000100001000000000同樣的,w則相當(dāng)於先選取遺漏變項(xiàng),再選取未遺漏變項(xiàng),(wY)'=[?…21111i53],對(duì)應(yīng)之w如下。1111010000100000001000010001000001101000010000000100001000100000000001在給定潛在類別下,Y的機(jī)率密度函數(shù)為(A1)i(A1)f(Y,Y)~N(卩g,Sgib)
gi,misi,obsmis,obsmis,obs其中卩gmis,obs=w其中卩gmis,obs=w卩g11Sgmis,obsmis,obswSgw'。1111進(jìn)一步給定Yi,obsYi,msi之條件機(jī)率密度函數(shù)仍為多元常態(tài)分配(Johnson&Kotz,1972&Kotz,1972):f(Ygf(Ygi,mis|Y)~i,obs,Sg)mis|obsmis|obs(A2)其中其中卩gmis|obsS卩gmis|obsSgmis,obsmis,obsobs)+卩gmis-1S-1Sgmis|obsSg-SgSgSgmismis,obsobsobs,misobs=wSgw'0101obs=w卩g01Sg=wSgwobs=wSgw'0101obs=w卩g01Sg=wSgw'mis1010J卩gmis=w卩go10給定Yi,obs,由於局度獨(dú)立,M之條件機(jī)率函數(shù)及Yiii,mis與M之條件
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 貴州大學(xué)《行政監(jiān)督學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 貴州財(cái)經(jīng)大學(xué)《生物制藥綜合實(shí)驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 貴陽(yáng)學(xué)院《裝飾材料構(gòu)造與人體工程學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025江西建筑安全員C證考試(專職安全員)題庫(kù)附答案
- 2025青海建筑安全員B證考試題庫(kù)及答案
- 2025年四川建筑安全員C證考試題庫(kù)
- 貴陽(yáng)信息科技學(xué)院《機(jī)械原理(實(shí)驗(yàn))》2023-2024學(xué)年第一學(xué)期期末試卷
- 硅湖職業(yè)技術(shù)學(xué)院《工業(yè)發(fā)酵分析》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025貴州省建筑安全員《A證》考試題庫(kù)
- 廣州新華學(xué)院《實(shí)驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理》2023-2024學(xué)年第一學(xué)期期末試卷
- 人教版六年級(jí)上冊(cè)道德與法治知識(shí)點(diǎn)
- 期貨從業(yè)資格(期貨基礎(chǔ)知識(shí))歷年真題試卷匯編27
- 人工智能學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 北師大版(2019)必修第二冊(cè)Unit 5 Humans and nature Lesson 3 Race to the pole教學(xué)設(shè)計(jì)
- 《毛概》23版學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 臨建工程量清單
- 宜賓五糧液股份有限公司招聘考試試卷及答案
- 2024CSCO胰腺癌診療指南解讀
- 窗簾采購(gòu)?fù)稑?biāo)方案(技術(shù)方案)
- 電力安全工作規(guī)程考試試題(答案)
- 2024-2030年串番茄行業(yè)市場(chǎng)發(fā)展分析及前景趨勢(shì)與投資研究報(bào)告
評(píng)論
0/150
提交評(píng)論