spss多水平模型簡介_第1頁
spss多水平模型簡介_第2頁
spss多水平模型簡介_第3頁
spss多水平模型簡介_第4頁
spss多水平模型簡介_第5頁
已閱讀5頁,還剩88頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多水平模型簡介四川大學華西公共衛(wèi)生學院衛(wèi)生統(tǒng)計學教研室李曉松概述層次結構數(shù)據(jù)的普遍性經典方法及其局限性基本多水平模型多水平模型的應用概述80年代中后期,英美等國教育統(tǒng)計學家開始探討分析層次結構數(shù)據(jù)(hierarchicallystructureddata)的統(tǒng)計方法,并相繼提出不同的模型理論和算法。多水平模型(multilevelmodels)最先應用于教育學領域,后用于心理學、社會學、經濟學、組織行為與管理科學等領域,逐步應用到醫(yī)學及公共衛(wèi)生等領域。HarveyGoldstein,UK,UniversityofLondon,InstituteofEducation《MultilevelModelsinEducationalandSocialResearch》1987AnthonyBryk,UniversityofChicagoStephenRaudenbush,MichiganStateUniversity,DepartmentofEducationalPsychology《HierarchicalLinearModels:ApplicationsandDataAnalysisMethods》1992NicholasLongford,PrincetonUniversity,EducationTestingService《RandomCoefficientModels》1993多水平主成分分析多水平因子分析多水平判別分析多水平logistic回歸多水平Cox模型多水平Poisson回歸多水平時間序列分析多元多水平模型多水平結構方程模型

ML3(1994)/MLN(1996)/MLwiN(1999)HLM(HierarchicalLinearModel)SAS(Mixed)SPSS(HLM)STATA(MLwiN)兩水平層次結構數(shù)據(jù)水平2

水平1

層次結構數(shù)據(jù)的普遍性“水平”(level):指數(shù)據(jù)層次結構中的某一層次。例如,子女為低水平即水平1,家庭為高水平即水平2?!皢挝弧?unit):指數(shù)據(jù)層次結構中某水平上的一個實體。例如,每個子女是一個水平1單位,每個家庭是一個水平2單位。臨床試驗和動物實驗的重復測量多中心臨床試驗研究縱向觀測如兒童生長發(fā)育研究流行病學現(xiàn)場調查如整群抽樣調查

遺傳學家系調查資料

meta分析資料

層次結構數(shù)據(jù)為一種非獨立數(shù)據(jù),即某觀察值在觀察單位間或同一觀察單位的各次觀察間不獨立或不完全獨立,其大小常用組內相關(intra-classcorrelation,ICC)度量。例如,來自同一家庭的子女,其生理和心理特征較從一般總體中隨機抽取的個體趨向于更為相似,即子女特征在家庭中具有相似性或聚集性(clustering),數(shù)據(jù)是非獨立的(nonindependent)。

非獨立數(shù)據(jù)不滿足經典方法的獨立性條件,采用經典方法可能失去參數(shù)估計的有效性并導致不合理的推斷結論。但非獨立數(shù)據(jù)的組內相關結構各異,理論上,不同的結構應采用相應的統(tǒng)計方法。如縱向觀測數(shù)據(jù)常用廣義估計方程(GEE),但有兩個局限性:一是對誤差方差的分解僅局限于2水平的情形,二是沒有考慮解釋變量對誤差方差的影響。當應變量的協(xié)差陣為分塊對角陣時,一般采用多水平模型。經典方法框架下的分析策略

經典的線性模型只對某一層數(shù)據(jù)的問題進行分析,而不能將涉及兩層或多層數(shù)據(jù)的問題進行綜合分析。但有時某個現(xiàn)象既受到水平1變量的影響,又受到水平2變量的影響,還受到兩個水平變量的交互影響(cross-levelinteraction)。

個體的某事件既受到其自身特征的影響,也受到其生活環(huán)境的影響,即既有個體效應,也有環(huán)境或背景效應(contexteffect)。

例如,個體發(fā)生某種牙病的危險可能與個體的遺傳傾向、個體所屬的社會階層(如飲食文化和口腔衛(wèi)生習慣)、環(huán)境因素(如飲水中氟濃度)等有關。分解(disaggregation)聚合(aggregation)組內-組間分析(within-betweenanalysis)

分解:不滿足模型獨立常方差的基本假定,回歸系數(shù)及其標準誤的估計無效,且未能區(qū)分個體效應與背景效應。一種分析策略是用啞變量擬合高水平單位的固定效應。聚合:損失大量水平1單位的信息,更嚴重的是可能導致“生態(tài)學謬誤”(ecologicalfallacy)。

組內-組間分析:每個水平2單位內進行分析,計算組內相關(組內效應);通過平均或整合得到每個水平2單位的數(shù)據(jù),計算組間相關(組間效應);忽略水平2的存在,在水平1上進行分析,計算水平1單位間的相關(總效應)。組內相關系數(shù)(intra-classcorrelation,ICC)被當作是總結多層次數(shù)據(jù)內部相關的最終統(tǒng)計量,但并沒有對誤差方差進行解釋。

多水平分析的概念為人們提供了這樣一個框架,即可將個體的結局聯(lián)系到個體特征以及個體所在環(huán)境或背景特征進行分析,從而實現(xiàn)研究的事物與其所在背景的統(tǒng)一。經典模型的基本假定是單一水平和單一的隨機誤差項,并假定隨機誤差項獨立、服從方差為常量的正態(tài)分布,代表不能用模型解釋的殘留的隨機成份?;镜亩嗨侥P?/p>

當數(shù)據(jù)存在層次結構時,隨機誤差項則不滿足獨立常方差的假定。模型的誤差項不僅包含了模型不能解釋的反應變量的殘差成份,也包含了高水平單位自身對反應變量的效應成份。

多水平模型將單一的隨機誤差項分解到與數(shù)據(jù)層次結構相應的各水平上,具有多個隨機誤差項并估計相應的殘差方差及協(xié)方差。構建與數(shù)據(jù)層次結構相適應的復雜誤差結構,這是多水平模型區(qū)別于經典模型的最主要特征。

多水平模型由固定與隨機兩部分構成,與一般的混合效應模型的不同之處在于,其隨機部分可以包含解釋變量,故又稱為隨機系數(shù)模型(randomcoefficientmodel),其組內相關也可為解釋變量的函數(shù)。換言之,多水平模型可對不同水平上的誤差方差進行深入和精細的分析。1.方差成份模型

(VarianceComponentModel)

假定一個兩水平的層次結構數(shù)據(jù),醫(yī)院為水平2單位,患者為水平1單位,醫(yī)院為相應總體的隨機樣本,模型中僅有一個解釋變量x。

和分別為第j個醫(yī)院中第i個患者的反應變量觀測值和解釋變量觀測值,和為參數(shù)估計,為通常的隨機誤差項。示水平2單位示水平1單位與經典模型的區(qū)別在于。經典模型中的估計為,僅一個估計值,表示固定的截距,而在方差成份模型中為隨機變量,可估計j個截距值。表示當x取0時,第j個醫(yī)院在基線水平時y的平均估計值。為平均截距,反映與的平均關系,即當x取0時,所有y的總平均估計值。亦為隨機變量,表示第j個醫(yī)院y之平均估計值與總均數(shù)的離差值,反映了第j個醫(yī)院對y的隨機效應。表示協(xié)變量x的固定效應估計值。即y與協(xié)變量x的關系在各醫(yī)院間是相同的,每個醫(yī)院間y的變異與協(xié)變量x的變化無關。方差成份模型擬合j條平行的回歸線,截距不同(),斜率相同()。它將醫(yī)院的參數(shù)估計作為隨機變量,并估計其隨機效應,提供了這些醫(yī)院所代表的醫(yī)院總體特征的信息。對醫(yī)院水平殘差的假定對患者水平殘差的假定與傳統(tǒng)模型一致

水平1上的殘差與水平2上的殘差相互獨立,,

反應變量可表達為固定部分與隨機部分之和。模型具有兩個殘差項,這是多水平模型區(qū)別于經典模型的關鍵部分。即水平2殘差,隨機效應、又稱潛變量(latentvariable)此模型需估計4個參數(shù),除兩個固定系數(shù)和,還需估計兩個隨機參數(shù)和。其中即為醫(yī)院水平的方差成份,為患者水平的方差成份。組內相關的度量方差成份模型中,反應變量方差為

此即水平2和水平1方差之和,同一醫(yī)院中兩個患者(用i1,i2表示)間的協(xié)方差為:組內相關(intra-classcorrelation,ICC)測量了醫(yī)院間方差占總方差的比例,實際上它反映了醫(yī)院內個體間相關,即水平1單位(患者)在水平2單位(醫(yī)院)中的聚集性或相似性。由于模型不止一個殘差項,就產生了非零的單位內相關。若為0,表明數(shù)據(jù)不具層次結構,可忽略醫(yī)院的存在,即簡化為傳統(tǒng)的單水平模型;反之,若存在非零的,則不能忽略醫(yī)院的存在。水平2單位中的水平1單位間存在相關,通常的“普通最小二乘法”(OrdinaryLeastSquaresOLS)進行參數(shù)估計是不適宜的。進一步,如數(shù)據(jù)具三個水平的層次結構,如醫(yī)院、醫(yī)生和患者三個水平,則將有兩個這樣的相關系數(shù),即反映醫(yī)院之間方差比例的醫(yī)院內相關,反映醫(yī)生之間方差比例的醫(yī)生內相關。隨機系數(shù)模型是指協(xié)變量的系數(shù)估計不是固定的而是隨機的,即協(xié)變量對反應變量的效應在不同的水平2單位間是不同的。仍以醫(yī)院與患者兩水平數(shù)據(jù)結構說明隨機系數(shù)模型基本結構與假設。隨機系數(shù)模型

(RandomCoefficientModel)與方差成份模型的區(qū)別在于。方差成份模型中協(xié)變量的系數(shù)估計為固定的,示協(xié)變量對反應變量的效應是固定不變的。在隨機系數(shù)模型中協(xié)變量的系數(shù)估計為,示每個醫(yī)院都有其自身的斜率估計,表明協(xié)變量對反應變量的效應在各個醫(yī)院間是不同的。的假定及其含義與方差成份模型一致?,F(xiàn)為隨機變量,假定:表示第j個醫(yī)院的y隨x變化的斜率;表示全部醫(yī)院的y隨x變化的斜率的平均值(平均斜率)。是指各醫(yī)院的y隨x變化的斜率的方差。示第j個醫(yī)院的斜率與平均斜率的離差值,指上述截距與斜率離差值的協(xié)方差,反映了它們之間的相關關系。即表達為固定部分與隨機部分之和。其中,固定效應用均數(shù)描述,它決定了全部醫(yī)院的平均回歸線,這條直線的截距即平均截距,直線的斜率即平均斜率。為隨機系數(shù)。將模型改記為:

隨機效應用方差描述,它反映了各醫(yī)院之間y的變異與協(xié)變量x的關系。模型隨機部分具多個殘差項,需估計4個隨機參數(shù),即方差、和以及協(xié)方差。模型的反應變量方差為:表明各醫(yī)院間y的變異與協(xié)變量x有關,即每條回歸線不僅截距不同,且斜率也不同。當x取0時每個醫(yī)院y的平均估計值不同,且每個醫(yī)院y隨x變化的斜率不同。組內相關與解釋變量有關為使模型中每個系數(shù)都有一個相應的解釋變量,可對截距及其殘差定義一個解釋變量,取值為1,為簡化模型,常省略該解釋變量。下面是包括隨機系數(shù)的一般形式的兩水平模型,即將模型擴展為納入其它固定部分解釋變量的形式:這里,對模型隨機部分采用了新的解釋變量,實際上,,。值得指出,模型隨機部分的解釋變量常為其固定部分的一個子集,但亦可以不是,即可以在任何水平上測量固定部分或隨機部分的解釋變量。反應變量向量的協(xié)方差結構從最基本的兩水平數(shù)據(jù)結構來考察反應變量向量的協(xié)方差結構,即只包括隨機參數(shù)和。對應于方差成份模型,反應變量方差為水平1和水平2方差之和:同一個醫(yī)院所診療的兩個患者(用,表示)間的協(xié)方差為:以下矩陣表示同一個醫(yī)院所診療的三名患者的協(xié)差陣對兩個醫(yī)院而言,若一個醫(yī)院診療了三名患者,另一個醫(yī)院診療了兩個患者,則具有2個水平2單位的反應變量向量Y總的協(xié)差陣可表達為:

矩陣的這種分塊對角結構表達了不同醫(yī)院所診療的患者間的協(xié)方差為0,它可進一步擴展到任意多的醫(yī)院數(shù)。將上述矩陣表達為另一種更簡略的形式:

為維的1矩陣,為維的單位陣,的下標2表明為兩水平模型,的維數(shù)即水平2單位數(shù),主對角線塊的維數(shù)即水平1單位數(shù),它們均為方陣。在傳統(tǒng)OLS估計中,為0,則該協(xié)差陣退化為標準形式的,即殘差方差??疾彀S機系數(shù)的一般形式的兩水平模型或簡記為對于具有隨機截距與斜率的兩水平模型,其反應變量協(xié)差陣具有以下典型的分塊結構:矩陣為水平2的隨機截距與斜率的協(xié)差陣,即隨機系數(shù)協(xié)差陣,矩陣為水平1的隨機系數(shù)協(xié)差陣。這里,水平1只有一個單一的方差項,可進一步采用表示這些協(xié)差陣集。將上述矩陣展開得到:這是具有分塊結構的一個具有2個水平1單位的水平2單位的反應變量協(xié)差陣。此即構造反應變量協(xié)差陣的一般模式,它同時也概括了擬合水平1復雜變異的可能性。固定與隨機參數(shù)估計固定和隨機參數(shù)的估計方法一般采用“迭代廣義最小二乘算法”(IterativeGeneralizedLeastSquares,IGLS)(Goldstein,1986)或“限制性迭代廣義最小二乘法”(RestrictedIterativeGeneralizedLeastSquares,RIGLS)(Goldstein,1989)?,F(xiàn)以最基本的兩水平方差成份模型來闡明固定與隨機參數(shù)估計的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論