(5.1.11)-第十一講 多變量分析-詳析模型_第1頁(yè)
(5.1.11)-第十一講 多變量分析-詳析模型_第2頁(yè)
(5.1.11)-第十一講 多變量分析-詳析模型_第3頁(yè)
(5.1.11)-第十一講 多變量分析-詳析模型_第4頁(yè)
(5.1.11)-第十一講 多變量分析-詳析模型_第5頁(yè)
已閱讀5頁(yè),還剩58頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十一講:多變量的統(tǒng)計(jì)分析

-詳析分析與統(tǒng)計(jì)控制1社會(huì)現(xiàn)象的復(fù)雜性決定了社會(huì)中各事物之間的關(guān)系并不是簡(jiǎn)單的兩兩相關(guān),兩個(gè)變量之間的關(guān)系也可能受到其他因素(如W、T)的影響。因此,當(dāng)前社會(huì)學(xué)的研究中不僅關(guān)注兩個(gè)變量的關(guān)系,更關(guān)注多個(gè)變量關(guān)系的分析。

2一、多變量分析的主要類型詳析分析多項(xiàng)分析多因分析

多項(xiàng)相關(guān)分析多變量的分析根據(jù)研究目的的不同,可以分為三類:詳析分析、多因分析和多項(xiàng)相關(guān)分析。31、詳析分析詳析分析是通過(guò)引進(jìn)第三個(gè)變量(如W、T),通過(guò)分析第三個(gè)變量與兩個(gè)變量(X,Y)的關(guān)系,進(jìn)一步加深對(duì)兩個(gè)變量之間關(guān)系的了解。4

詳析分析研究的是兩個(gè)變量之間的關(guān)系,引進(jìn)其他變量(W,T,C)的目的是要加深了解這兩個(gè)變量(X和Y)的相關(guān)關(guān)系XYW,T,C52、多因分析

X1X2YX3說(shuō)明的是多個(gè)自變量對(duì)某個(gè)因變量的共同影響和相對(duì)效果分析兩個(gè)或兩個(gè)以上的自變量對(duì)一個(gè)因變量的影響63、多項(xiàng)相關(guān)—多個(gè)變量之間是如何相互影響的X1X2X4X3簡(jiǎn)化眾多變量之間的相關(guān)關(guān)系—路徑分析7二、詳析分析詳析分析反映的是兩個(gè)變量之間的關(guān)系,根據(jù)作用的不同又可以分為三種模式:因果分析:X和Y是否真有因果關(guān)系?闡明分析:X為什么會(huì)影響Y?條件分析:在不同的情況下X與Y會(huì)有不同的關(guān)系嗎?8(一)因果分析要鑒定X和Y之間是否確實(shí)有因果關(guān)系1、做法:引進(jìn)其他變量w(通常稱為第三類變項(xiàng)),看看是否由于w既影響了x,又影響了y,而使x和y的關(guān)系發(fā)生了變化。9如:我們發(fā)現(xiàn)結(jié)婚年數(shù)(X)越多的人,發(fā)病率(Y)也越高;這是否表示二者有因果關(guān)系呢?顯然不一定.結(jié)婚年數(shù)(x)越多的人,發(fā)病率(y)越高年齡(w)兩者之間的因果關(guān)系不成立10在因果分析中,第三類變項(xiàng)(變量)稱為前置變項(xiàng)—因它在因果模型中是先于x和y的引進(jìn)若干w,辨別x和y的因果關(guān)系是不是虛假的:如果我們能控制w,使之不變,而x變化時(shí)y也起變化,那么,x和y的關(guān)系可能就是真實(shí)的。除了W的影響外,還會(huì)有其他因素的影響11如果控制W?簡(jiǎn)單地說(shuō)就是按W的取值分組,看每一組中x和y的關(guān)系.用分表法(p221李沛良).假設(shè)W有兩個(gè)值(1,2),而X與Y也是各二值,則原表與其分表的關(guān)系,如下圖所示:12

原表XY

W=1w=2xx分表Yy步驟:1.分析X與Y的關(guān)系;2.分析W1與X,W1與Y;然后控制W1來(lái)辯明X與Y的關(guān)系.3.分析W2與X,w2與Y,然后控制W2來(lái)辯明X與Y的因果關(guān)系13每個(gè)分表的作用就是在W不變的情況下分析X與Y的關(guān)系,而這就是統(tǒng)計(jì)控制的基本原理了.在原表中W是變項(xiàng),但在分表中卻受到控制而變?yōu)槌?shù).在控制W后,研究結(jié)果原則上有三種可能性:14第一.X與Y的關(guān)系消失,即在各分表中X與Y都沒(méi)有關(guān)系.表示原表中X與Y的因果關(guān)系是虛假的,它們?cè)瓉?lái)的關(guān)系其實(shí)是由于W所導(dǎo)致的.如圖所示:

WXY15第二.X與Y的關(guān)系維持原狀,即在各分表中X與Y的相關(guān)與原表中的相關(guān)是大致上相同的.這種情況,表示X與Y的因果關(guān)系可能是真實(shí)的,并非由W所導(dǎo)致。如圖所示:WXY16第三、X與Y雖然仍有關(guān)系,但其相關(guān)程度減弱了,即各分表中X與Y的關(guān)系不等于0,但相關(guān)程度卻低于原表中的相關(guān)。這種情況,表示所控制的第三類變項(xiàng)產(chǎn)生局部效應(yīng),即原表中X與Y的因果關(guān)系可能是真實(shí)的,但其中某些部分是由W所導(dǎo)致。如圖所示:WXY173、統(tǒng)計(jì)結(jié)果與研究狀況如果以R表示X與Y的原相關(guān),以R1和R2分別表示兩個(gè)分表中的X與Y的相關(guān),則上述的三種研究結(jié)果可用下表表示:18例:在某城鎮(zhèn)調(diào)查1000戶人家,目的是要研究住房的擁擠情況是否會(huì)引起夫妻之間的沖突是否能證明住戶擁擠是導(dǎo)致夫妻沖突的原因?19住戶擁擠(x)與夫妻沖突(y),可能與家庭的經(jīng)濟(jì)水平有關(guān)家庭經(jīng)濟(jì)水平住房擁擠夫妻沖突?20因此引進(jìn)經(jīng)濟(jì)水平變量,再進(jìn)行分析21住戶擁擠(x)與夫妻沖突(y),沒(méi)有顯著性關(guān)系,家庭經(jīng)濟(jì)水平影響了住房情況和夫妻沖突狀況家庭經(jīng)濟(jì)水平住房擁擠夫妻沖突22詳析分析的一般步驟:1、分析XY,2、分析WX與WY,3、控制W,分析XY的變化。23(二)闡明分析分析的問(wèn)題是:為什么X會(huì)影響Y?如:為什么較為貧困的家庭,少年犯罪率較高呢?是否由于較為貧困的家庭中父母的爭(zhēng)吵較多,因而使兒女的品性較為惡劣呢?闡明分析的作用,就是要以事實(shí)來(lái)驗(yàn)證:X是通過(guò)哪些因素(如T)來(lái)影響Y的?如下圖所示:24XYT介入變量25X通過(guò)T影響Y意味著:X變動(dòng)時(shí)引起T的變動(dòng),而T的變動(dòng)影響Y的變動(dòng)。如果控制T使之不變,結(jié)果是X變動(dòng)但Y不變,則說(shuō)明X是通過(guò)T影響Y;如果,在控制T以后X變而Y亦變,則證明T是無(wú)關(guān)緊要的,即X不是通過(guò)T而影響Y的。研究的方法:與因果分析相同,通過(guò)分解T比較X與Y的關(guān)系。

1、X-T-Y的關(guān)系:26例:調(diào)查了近300名年紀(jì)相近的婦女,發(fā)現(xiàn)教育水平(x)越高,子女?dāng)?shù)目(y)越少(G=-0.70)。為什么?(1)如果以晚婚來(lái)解釋,教育水平越高的婦女結(jié)婚越晚,因而生的孩子就較少。如要證明這種說(shuō)法,就要引進(jìn)“結(jié)婚年齡”作為介入變項(xiàng)(T),加以控制。27采用分表法的結(jié)果,發(fā)現(xiàn)在晚婚的婦女教育水平與生孩子數(shù)目的關(guān)系是G=-0.71,而在早婚的婦女中G=-0.68。分表的相關(guān)與原相關(guān)非常接近。因此,可以得出結(jié)論:晚婚的說(shuō)法,不能闡明教育水平與子女?dāng)?shù)目的反比關(guān)系。也就是說(shuō),教育水平較高的婦女所生的孩子比較少,不是由于她們結(jié)婚較晚。28(2)如果以“重男輕女”來(lái)解釋,認(rèn)為教育水平越低的婦女,越是重男輕女,結(jié)果會(huì)生很多孩子??刂啤爸啬休p女”這個(gè)介入變量之后,發(fā)現(xiàn)重男輕女的女性中教育水平與生育子女?dāng)?shù)量的G=-0.45,不重男輕女的女性中教育水平與生育子女?dāng)?shù)量的G=-0.50雖然教育水平與生育子女?dāng)?shù)目這兩個(gè)變量仍然維持反比關(guān)系,但在程度上弱于原相關(guān)(G=-0.70)結(jié)論:教育水平較低的婦女所生的子女比較多,部分是由于她們所具有的重男輕女的觀念。教育水平生育子女?dāng)?shù)重男輕女292、結(jié)果完全闡明:X完全是通過(guò)T影響Y的不能闡明:X完全不是通過(guò)T而影響Y部分闡明:X部分是通過(guò)T影響Y的30(三)條件分析與互動(dòng)效果關(guān)注的是在不同情況下,X和Y的關(guān)系會(huì)不同嗎?條件分析就是以第三類變項(xiàng)(如C)為基礎(chǔ)來(lái)了解X與Y在不同情況下的關(guān)系。故C也稱為條件變項(xiàng)。結(jié)果:如果在各組中X與Y的關(guān)系大致上相同,則表示X與Y的關(guān)系具有普遍性。相反,如果X與Y在不同的C組中有不同的關(guān)系,就表示X與Y的關(guān)系具有條件性,也稱為C變項(xiàng)產(chǎn)生互動(dòng)效果。31我們的假設(shè)是,隨著計(jì)劃生育政策的實(shí)施,城市獨(dú)生子女家庭的比例高于農(nóng)村,這會(huì)對(duì)人們的生育意愿產(chǎn)生影響,使得城市中的婦女更傾向于少生孩子,因此我們引進(jìn)“城鄉(xiāng)”作為條件變量,分析城市和農(nóng)村婦女文化程度與生育意愿的關(guān)系。結(jié)果發(fā)現(xiàn),城市婦女中文化程度與生育意愿的關(guān)系是G=-0.78,農(nóng)村是G=-0.76,兩者相差不大。文化程度與婦女生育意愿的關(guān)系是否存在城鄉(xiāng)(C)差異?32不同年齡段婦女的文化程度與生育意愿的關(guān)系,發(fā)現(xiàn)55歲以上婦女中,文化程度與生育意愿的關(guān)系是G=-0.18,45-55歲者為G=-0.35,35-45歲者為G=-0.68,35歲以下者為G=-0.89??梢?jiàn),年齡在婦女文化程度和生育意愿關(guān)系中所起的作用遠(yuǎn)大于城鄉(xiāng)的影響,說(shuō)明文化程度與生育意愿的關(guān)系在不同的條件下表現(xiàn)出不同的情況。33這里有幾種情況:1、壓抑分析:即X與Y本來(lái)是沒(méi)有關(guān)系的或關(guān)系很弱(如人口密度與精神病率),但在標(biāo)明了若干條件[就叫壓抑變項(xiàng)](如文化異同)以后,X與Y顯然是有關(guān)系或關(guān)系強(qiáng)大起來(lái)。2、曲解分析:即把原先的負(fù)相關(guān)(如教育水平與社區(qū)參與成反比,當(dāng)引入性別變量后發(fā)現(xiàn)男、女兩組的教育水平與社區(qū)參與均成正比)變?yōu)檎嚓P(guān),或把原先的正相關(guān)變?yōu)樨?fù)相關(guān)的分析。而所用的條件(如性別)就叫曲解變項(xiàng)。34二、凈相關(guān)(偏相關(guān)分析)在前面的分析中,要用分表法,然后再與原表相比,特別是當(dāng)分表很多時(shí)就很難作出結(jié)論。因此,如果能以一個(gè)統(tǒng)計(jì)值來(lái)綜合和簡(jiǎn)化所有的分表相關(guān),然后將之與原相關(guān)比較,問(wèn)題就清楚多了。凈相關(guān)分析(偏相關(guān)分析,partialanalysis),就是以一個(gè)系數(shù)值表示控制第三類變項(xiàng)(W、T)后X與Y的相關(guān)程度的分析方法,其系數(shù)稱為凈相關(guān)系數(shù)。(partialcorrelationcoefficient)35因?yàn)閮粝嚓P(guān)系數(shù)以積矩相關(guān)系數(shù)(r)為基礎(chǔ),因此屬于對(duì)稱相關(guān)測(cè)量法的一種,它要求變項(xiàng)間是直線關(guān)系,且所有變項(xiàng)都必須是定距變項(xiàng)。凈相關(guān)系數(shù)值是由-1至+1,表示在控制第三類變項(xiàng)以后X與Y這兩個(gè)變項(xiàng)的相關(guān)的程度與方向,而且其平方值具有消減誤差比例的意義。36如以R表示原關(guān)系的強(qiáng)弱,以Rp表示凈相關(guān)系數(shù)的大小,則在因果分析中,如果:Rp=0時(shí),表示原關(guān)系是虛假的;Rp=R時(shí),表示原關(guān)系可能真實(shí);Rp≠0且Rp<R時(shí),表示原關(guān)系是部分真實(shí)的.37同樣,在闡明分析中,Rp=0則表示原關(guān)系是完全闡明.即X完全是通過(guò)T影響Y的;Rp=R時(shí)則表示原關(guān)系是不能闡明.即X完全不是通過(guò)T而影響Y;Rp≠0且Rp<R時(shí)則表示原關(guān)系是部分闡明.即X部分是通過(guò)T影響Y的.38根據(jù)變量測(cè)量層次的不同,定類\定序和定距變量偏相關(guān)系數(shù)的計(jì)算方法也有所不同.39(一)定類變量:λp、tau-yp如果X和Y兩個(gè)變量中,至少有一個(gè)是定類變量(另一個(gè)為定類或定序變量)計(jì)算偏相關(guān)時(shí),通常采用的是偏Lambda系數(shù)(partialLambda,記為λp)和偏tau-y系數(shù)(partialtau-y,記為tau-yp)偏Lambda系數(shù)的計(jì)算方法是通過(guò)將樣本分組,分別計(jì)算各組的λ系數(shù),以各組的樣本數(shù)與全部樣本數(shù)的比作為權(quán)數(shù)計(jì)算加權(quán)平均,即:40λp表示偏Lambda系數(shù);ni表示每個(gè)組的樣本數(shù)量;λi表示每個(gè)組的X與Y的λ值;n表示全部樣本數(shù)。41同理,tau-y計(jì)算偏相關(guān)系數(shù)的公式為:tau-yp表示偏tau-y系數(shù);ni表示每個(gè)組的樣本數(shù)量;tau-yi表示每個(gè)組的X與Y的tau-y值;n表示全部樣本數(shù)。42性別與工作家庭沖突的相關(guān)系數(shù)λ=0.22,如果我們認(rèn)為工作時(shí)間可能影響青年的工作家庭沖突,而引進(jìn)每天工作時(shí)間變量,如下表,每天不同工作時(shí)間的青年,性別與工作家庭沖突的關(guān)系明顯減弱。

43控制每天工作時(shí)間后,性別與工作家庭沖突的偏相關(guān)程度如何?如果已知n1=54,n2=261,n3=38計(jì)算可知:性別與工作家庭沖突的原相關(guān)系數(shù)為0.22,控制每天工作時(shí)間后的偏相關(guān)系數(shù)為0.05,λp<λ,因此可以說(shuō)性別與工作家庭沖突的關(guān)系可能是部分真實(shí)關(guān)系(或者無(wú)相關(guān)),工作時(shí)間對(duì)青年工作家庭沖突產(chǎn)生了影響。

44(二)定序變量:Gp如果X和Y都是定序變量,在計(jì)算偏相關(guān)時(shí),常用的是偏Gamma系數(shù)(partialGamma,簡(jiǎn)寫(xiě)為Gp)。計(jì)算方法是根據(jù)控制變量的取值將樣本分組,然后分別計(jì)算各組的同序?qū)?shù)(Ns)和異序?qū)?shù)(Nd),將各組的同序?qū)εc異序?qū)Φ牟睿∟s-Nd)除以各組的同序?qū)εc異序?qū)χ停∟s+Nd)公式為:45如一次調(diào)查中,我們調(diào)查了400名青年,發(fā)現(xiàn)他們的收入和工作滿意度的相關(guān)系數(shù)G=0.265。假設(shè)我們認(rèn)為收入和工作滿意度的關(guān)系受文化程度的影響,文化程度高的青年可能收入高,但他們對(duì)自己的期望更高,從而對(duì)工作的滿意度并不高。因此,我們引進(jìn)文化程度變量,來(lái)計(jì)算收入和工作滿意度之間的偏相關(guān)系數(shù)。

46通過(guò)計(jì)算可知:在低教育程度組中,Ns1=5450,Nd1=3262在高教育程度組中,Ns2=5440,Nd2=3154所以偏相關(guān)系數(shù)與原相關(guān)系數(shù)0.265十分接近,因此可以說(shuō)收入和青年工作滿意度之間的相關(guān)關(guān)系可能是真實(shí)存在的。

47dy偏相關(guān)的原理與偏Gamma系數(shù)相同,其公式為:48(三)定距變量:rp=rxy.1如果X和Y都是定距變量,可采用偏相關(guān)系數(shù)rp(partialcorrelationcoefficient,簡(jiǎn)寫(xiě)為rxy·1或rp)來(lái)計(jì)算其偏相關(guān)程度。它以積矩相關(guān)系數(shù)(r)為基礎(chǔ)4950rp是控制一個(gè)變量以后X與Y的偏相關(guān)系數(shù),rxy是沒(méi)有控制之前X與Y的相關(guān)系數(shù),rx1是控制變量與X的相關(guān)系數(shù),ry1是控制變量與Y的相關(guān)系數(shù)。51如調(diào)查了300名青年職工,發(fā)現(xiàn)其開(kāi)始就業(yè)時(shí)的工資與現(xiàn)在工資的關(guān)系是r=0.88。進(jìn)一步分析發(fā)現(xiàn)兩者的關(guān)系可能受中間變量——受教育年數(shù)的影響,也就是說(shuō)受教育年數(shù)越多的青年,他們的初始工資和現(xiàn)在工資越高。于是控制受教育年數(shù),發(fā)現(xiàn):rxy=0.88(初始工資與現(xiàn)在工資的相關(guān)系數(shù))rx1=0.63(受教育年數(shù)與初始工資的相關(guān)系數(shù))ry1=0.66(受教育年數(shù)與現(xiàn)在工資的相關(guān)系數(shù))偏相關(guān)系數(shù)0.79小于原來(lái)的相關(guān)系數(shù)0.88,可見(jiàn)初始工資和現(xiàn)在工資的關(guān)系受教育年數(shù)的影響。

52三.偏相關(guān)系數(shù)的假設(shè)檢驗(yàn)rp凈相關(guān)系數(shù),n樣本數(shù)的大小,K是控制變量的數(shù)目.df1=1,df2=n-k-253如前面偏相關(guān)分析中的例題,調(diào)查300名青年職工的初始工資與現(xiàn)在工資的關(guān)系是r=0.88,受教育年數(shù)與初始工資的關(guān)系rx1=0.63,受教育年數(shù)與現(xiàn)在工資的關(guān)系ry1=0.66,控制了受教育年數(shù)后,初始工資與現(xiàn)在工資的關(guān)系r

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論