社會統(tǒng)計學(xué) 第四章 相關(guān)測量法與變量層次_第1頁
社會統(tǒng)計學(xué) 第四章 相關(guān)測量法與變量層次_第2頁
社會統(tǒng)計學(xué) 第四章 相關(guān)測量法與變量層次_第3頁
社會統(tǒng)計學(xué) 第四章 相關(guān)測量法與變量層次_第4頁
社會統(tǒng)計學(xué) 第四章 相關(guān)測量法與變量層次_第5頁
已閱讀5頁,還剩35頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1,第四章,相關(guān)測量法與測量層次,相關(guān)測量的六種情況,兩個定類變量 兩個定序變量 兩個定距變量 一個定類變量與定序變量 一個定類變量與定距變量 一個定序變量與定距變量,第一節(jié) 兩個定類變量,Lambda 相關(guān)測量法 基本邏輯是計算以一個定類變量的值來預(yù)測另一個定類變量的值時,如果以眾值作為預(yù)測的準則,可以減除多少誤差。消減的誤差在全部誤差中所占的比例愈大,就表示這兩個變量的相關(guān)越強。 Lambda 相關(guān)測量法有兩種形式。一種是對稱形式,簡寫是系數(shù),即不分自變量與因變量。另一種是不對稱形式,簡寫是y系數(shù),即要求一個是自變量,一個是因變量。,系數(shù),E1的定義: 未知y與x有關(guān)之前,如果預(yù)測y值,唯

2、一可資依據(jù)的就是y本身的分布。由于y與x無關(guān),所以只能根據(jù)y的行邊緣和(與x無關(guān))去預(yù)測y,也即由y的行邊緣和中最大者眾值,去預(yù)測y,可能性最大。 E1 = n max(n*j) (即總頻次n減去y的行邊緣和中最大者) 分析: (1)E1 = 0 (E1最?。┊?max(n*j) = n 時,E1 = 0。也即眾值極大,異眾比率為0,此時眾值代表性最高,故E1為0。 (2)E 1 = n (E1最大)當 max(n*j) = 0 時,E1 = n。也即眾值為0,異眾比率最大,此時眾值代表性最低,故E1為n。,E2的定義: 當已知y與x有關(guān)之后,如果再去預(yù)測y值,則可借助x預(yù)測y。即用各類x條件

3、下,y的條件分布中的眾值去預(yù)測y,可能性最大。 E2 = n max(nij) 分析: 1)E2 = 0 (即max(nij) = n,即各類x條件下的眾值皆為最大值) 2)E2 = n (即max(nij) = 0,即各類x條件下的眾值皆為最小值),系數(shù)計算公式,其中,My=Y變量的眾值次數(shù), Mx=X變量的眾值次數(shù) my=X變量的每個值(類別)之下Y變量的眾值次數(shù) mx=Y變量的每個值(類別)之下X變量的眾值次數(shù),例:對稱與不對稱系數(shù),表 青年人與其知心朋友的志愿,系數(shù)與尤拉Q系數(shù),系數(shù)的缺點,Lambda相關(guān)測量法的特點是以眾值作為預(yù)測的準則,不理會眾值以外的次數(shù)分布。因此,如果全部眾值

4、集中在條件次數(shù)表的同一列或同一行中,則Lambda系數(shù)便會等于0.,tau-y相關(guān)測量法,tau-y是不對稱相關(guān)測量法,這個方法是在計算系數(shù)值時會包括所有的邊緣次數(shù)和條件次數(shù)。,其中: n=全部個案書目, f=某條件次數(shù) Fy=Y變量的某個邊緣次數(shù) Fx=X變量的某個邊緣次數(shù),再以飲食習(xí)慣表為例:,練習(xí)題1,題:以下是某高校對高、低年級學(xué)生求職意愿的抽樣調(diào)查。問:(1)計算不對稱Lambda系數(shù);(2)計算tau-y系數(shù);(3)建立條件百分表。,第二節(jié) 兩個定序變量,Gamma系數(shù) 級序相關(guān)法的基本邏輯是要求出;根據(jù)任何兩個個案在某變量上的等級來預(yù)測他們在另一個變量上的等級時,可以減少的誤差是

5、多少。 同序?qū)εc異序?qū)Γ杭僭O(shè)樣本的全部個案數(shù)目是n,就會組成1/2n(n-1)對個案。某對個案在兩個變量上的相對等級時相同,則成為同序?qū)Γ蝗绻遣幌嗤?,則成為異序?qū)Α?同序?qū)εc異序?qū)?同分對,兩個個案在某變量上次序相對,無法分高低,即同分對。通常以Tx代表只在X變量上同分的對數(shù),以Ty代表只在Y變量上同分的對數(shù),而以Txy代表在兩個變量上都是同分的對數(shù)。,Gamma系數(shù),Gamma系數(shù)的計算公式如下: 其中:Ns 是同序?qū)?shù),Nd異序?qū)?shù)。 G的絕對值越大,就表示所犯的錯誤可能性越小,G是負值,則如果知道一對個案在某個變量的相對等級,就應(yīng)該估計他們在另一個變量上的相對等級是相反的。反之亦然。,

6、求下表G系數(shù),G系數(shù)是屬于對稱相關(guān)測量法。如果是非對稱,即一個是自變量,一個是因變量,則適宜于簡化不對稱關(guān)系的薩默斯dy系數(shù)。,薩默斯dy系數(shù),dy的計算公式如下: 其中:Ns 是同序?qū)?shù),Nd異序?qū)?shù),Ty是只在因變量上同分的對數(shù)。 假設(shè)積極性等級是x,產(chǎn)量是Y,求dy,計算列聯(lián)表的同序?qū)εc異序?qū)?同序?qū)Γ簄1(n5+n6+n8+n9)+n2(n6+n8)+n4(n8+n9)+n5(n9),異序?qū)Γ簄7(n2+n5+n3+n6)+n4(n2+n3)+n8(n3+n6)+n5(n3),計算列聯(lián)表的同分對,同分對:Tx=n1(n2+n3)+n2(n3)+n4(n5+n6)+n5(n6)+n7(n

7、8+n9)+n8(n9),同分對:,例:計算G系數(shù)與dy系數(shù),婚姻美滿,文化程度,同序?qū)Γ?(30+18+4+7)+8(4+7)+16(18+7)+30(7)=1229 異序?qū)Γ?(8+30+3+4)+18(3+4)+16(8+3)+30(3)=617 同分對:9(16+5)+16(5)+8(30+18)+30(18)+3(4+7)+4(7)=1254 G系數(shù)=0.33 dy系數(shù)=0.22,肯德爾的tau系數(shù),tau系數(shù)的基本邏輯是計算同序?qū)?shù)與異序?qū)?shù)之差在全部的可能對數(shù)中所占的比例。公式如下:,其中m是列聯(lián)表中行數(shù)與列數(shù)中的較小者。,斯皮爾曼rho系數(shù),斯皮爾曼rho系數(shù)的特點是計算每個個

8、案在兩個變量上的等級時,不僅要區(qū)別兩者的高低差異,而且還要計算二者差異的確切數(shù)值。 其中D表示每個個案在兩列級序上的差異值,n表示全部個案數(shù)目。D平方可以避免正負值抵消 rho系數(shù)是對稱相關(guān)測量法,要求同分情況不多,統(tǒng)計值在-1至1之間。其平方值可以有消減誤差比例的意義。,求斯皮爾曼rho系數(shù),第三節(jié) 兩個定距變量,簡單線性回歸分析法 簡單線性回歸時根據(jù)一個直線方程式,以一個自變量X的數(shù)值來預(yù)測一個因變量Y的數(shù)值。目的是要找出一個錯誤最小的方法來預(yù)測因變量的數(shù)值。 其中X是自變量數(shù)值;b成為回歸系數(shù),表示回歸線的斜率;a是截距,是回歸線與Y軸的交點;是根據(jù)回歸方程所預(yù)測的Y變量值。,最小二乘法

9、,回歸法在繪制回歸線時所根據(jù)的準則是最小二乘法。假定我們根據(jù)一條直線來以自變量X估計因變量的某個值,所估計的值是Y1,而實際上該值是Y2,則誤差便是:e=Y2-Y1 各個e相加起來就是誤差總數(shù),為防止正負值相抵消的問題,改為e的平方值相加起來,即直線應(yīng)使 最小。,計算公式,斜率 截距 其中X是自變量值, 是自變量的均值,Y是因變量值, 是因變量的均值,n是全部個案數(shù)目。,例1:計算回歸方程,回歸與相關(guān),線性回歸方程不僅具有簡化資料的作用,而且可以推廣應(yīng)用于預(yù)測或估計樣本之外個案的數(shù)值。 回歸系數(shù)(b)表示X對Y的影響有多少,指每增加一個單位的X值時Y值的變化有多大。 B值是表示自變量對因變量的

10、影響的大小與方向,它是不對稱關(guān)系的統(tǒng)計法。 回歸方程不具有消減誤差比例作用,一般在計算回歸方程時須進行相關(guān)系數(shù)測量。如果相關(guān)系數(shù)比較小,消減誤差比例太少,則不適合作線性回歸方程。,積矩相關(guān)測量法,b系數(shù)沒有上限,很少用來比較變量與變量之間的相關(guān)程度。而且容易受到統(tǒng)計單位的影響。 r系數(shù)與b系數(shù)的不同地方,是r系數(shù)假定X與Y的關(guān)系是對稱的,而且r的統(tǒng)計值是-1至1,同時r2具有消減誤差比例的意義。r2稱為決定系數(shù)。,r系數(shù),r系數(shù)計算公式如下: r系數(shù)與簡單線性回歸都是假定X與Y的關(guān)系具有直線的性質(zhì)。如果非直線,就會犯錯誤。,直線與非直線,第四節(jié) 定類變量與定距變量,相關(guān)比率,又稱為eta平方系數(shù)(E2),是以一個定類變量為自變量,來預(yù)測或估計以一個定距變量為因變量的值。 其中,Y是因變量的值, 是因變量的均值; 是自變量值(Xi)上各因變量的均值。,表1 20名學(xué)生的家庭職業(yè)背景對英文水平的影響,英文水平(得分),非線性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論