定量分析課件_第1頁
定量分析課件_第2頁
定量分析課件_第3頁
定量分析課件_第4頁
定量分析課件_第5頁
已閱讀5頁,還剩95頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第十一章定量資料分析第十一章-定量分析課件1主要內(nèi)容:資料的整理與錄入單變量統(tǒng)計(jì)分析雙變量統(tǒng)計(jì)分析多變量的統(tǒng)計(jì)分析主要內(nèi)容:2第一節(jié)資料的整理與錄入

一、資料的審核主要工作:審查資料的完整性、統(tǒng)一性和合格性。完整性:

資料總體的完整性;每份資料的完整性。統(tǒng)一性:

問卷或報(bào)表登記填報(bào)方法是否統(tǒng)一;對(duì)同一指標(biāo)的數(shù)字所使用的度量單位是否一致;不同表格對(duì)同一指標(biāo)的計(jì)算方法是否統(tǒng)一第一節(jié)資料的整理與錄入一、資料的審核3合格性:

提供資料者的身份是否符合所規(guī)定的調(diào)查對(duì)象的身份所提供的資料是否符合填報(bào)要求;所提供的資料是否正確無誤。資料審核的方式:(1)實(shí)地審核;(2)系統(tǒng)審核或集中審核合格性:4二、資料的分類和編碼將被調(diào)查者對(duì)問卷中問題的回答轉(zhuǎn)換成供計(jì)算機(jī)識(shí)別和統(tǒng)計(jì)的數(shù)字。轉(zhuǎn)換成的數(shù)字A1你的性別:①男√②女1A2你的年齡:28周歲28A3你的文化程度:3①小學(xué)及以下②初中③高中及中?!挞艽髮R陨螦4你的婚姻狀況2①未婚②已婚√③離婚④喪偶⑤其他二、資料的分類和編碼5對(duì)婚事花費(fèi)態(tài)度的調(diào)查

非常同意同意無所謂不同意很不同意①婚事應(yīng)該盡量辦得簡單一些√②結(jié)婚是人生一件大事,婚事應(yīng)該辦得隆重?zé)狒[、花再多的錢也值得√③就是沒錢婚事也不應(yīng)大操辦√三種看法的賦值非常同意同意無所謂不同意很不同意看法①看法②看法③151242333424515對(duì)婚事花費(fèi)態(tài)度的調(diào)查

非常同意同意無所謂不同意很不同意①婚事6編碼手冊(cè)項(xiàng)目名稱變量名含義寬度欄碼答案賦值區(qū)V城區(qū)111=東城2=西城3=海淀4=朝陽5=宣武6=石景山個(gè)案號(hào)ID個(gè)案號(hào)42-5根據(jù)問卷上的號(hào)碼填寫問題A1A1性別161=男2=女0=無回答問題A2A2年齡27-8按實(shí)際年齡填寫大于99歲的填99問題A3A3文化程度191=小學(xué)及以下2=初中3=高中及中專4=大專以上編碼手冊(cè)項(xiàng)目名稱變量名含義寬度欄碼答案賦值區(qū)V城區(qū)111=東7三、數(shù)據(jù)錄入主要的兩種方式:(1)直接從問卷上將編好碼的數(shù)據(jù)輸入計(jì)算機(jī);(2)先將問卷上編好碼的數(shù)據(jù)轉(zhuǎn)錄到的登錄表上,然后再從登錄表上將數(shù)據(jù)輸入計(jì)算機(jī)。三、數(shù)據(jù)錄入8數(shù)據(jù)登錄表城區(qū)個(gè)案號(hào)A1A2A3A4A5A61A62……12-567-8910111213個(gè)案11038723932211個(gè)案22038824023410個(gè)案34038915025221個(gè)案43040012817100…………………………………………………數(shù)據(jù)登錄表城區(qū)個(gè)案號(hào)A1A2A3A4A5A61A62……129四、數(shù)據(jù)清理1.有效范圍清理;2.邏輯一致性清理;3.數(shù)據(jù)質(zhì)量抽查。四、數(shù)據(jù)清理10全面調(diào)查抽樣調(diào)查單變量雙變量多變量單變量雙變量多變量其他非概率抽樣統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)描述+統(tǒng)計(jì)推論集中趨勢(shì)分析離散趨勢(shì)分析列聯(lián)表消減誤差比例相關(guān)分析一元方差分析一元回歸分析多元相關(guān)分析多元方差分析多元因果分析判別分析聚類分析因素分析最小空間分析統(tǒng)計(jì)推論參數(shù)估計(jì)假設(shè)檢驗(yàn)點(diǎn)估計(jì)區(qū)間估計(jì)參數(shù)檢驗(yàn)Z檢驗(yàn)t檢驗(yàn)F檢驗(yàn)非參數(shù)檢驗(yàn)檢驗(yàn)全面調(diào)查抽樣調(diào)查單變量雙變量多變量單變量雙變量多變量其他統(tǒng)計(jì)11第二節(jié)單變量統(tǒng)計(jì)分析一、單變量描述統(tǒng)計(jì)主要目的:用最簡單的概括形式反映出大量數(shù)據(jù)資料所容納的基本信息。基本方法:集中趨勢(shì)分析、離散趨勢(shì)分析等。第二節(jié)單變量統(tǒng)計(jì)分析一、單變量描述統(tǒng)計(jì)121.集中趨勢(shì)分析用一個(gè)典型值或代表值來反映一組數(shù)據(jù)的一般水平,或反映這組數(shù)據(jù)向這個(gè)典型值集中的情況。最常見的集中趨勢(shì):平均數(shù)、眾數(shù)和中位數(shù)。1.集中趨勢(shì)分析132.離散趨勢(shì)分析用一個(gè)特別的數(shù)值來反映一組數(shù)據(jù)相互之間的離散程度。常見的離散趨勢(shì)統(tǒng)計(jì)量:極差、異眾比率、四分位差、標(biāo)準(zhǔn)差與方差、離散系數(shù)與標(biāo)準(zhǔn)分?jǐn)?shù)等。(標(biāo)準(zhǔn)差——平均數(shù)、異眾比率——眾數(shù)、四分位差——中位數(shù))。

2.離散趨勢(shì)分析14標(biāo)準(zhǔn)差:一組數(shù)據(jù)對(duì)其平均數(shù)的偏差平方的算術(shù)平均數(shù)的平方根。標(biāo)準(zhǔn)差:一組數(shù)據(jù)對(duì)其平均數(shù)的偏差平方的算術(shù)平均數(shù)的平方根。15離散系數(shù):一種相對(duì)的離散趨勢(shì)統(tǒng)計(jì)量,能夠?qū)ν豢傮w中的兩種不同的離散趨勢(shì)統(tǒng)計(jì)量進(jìn)行比較,或?qū)蓚€(gè)不同總體中的同一離散趨勢(shì)統(tǒng)計(jì)量進(jìn)行比較。離散系數(shù):標(biāo)準(zhǔn)差與平均數(shù)之百分比。離散系數(shù):一種相對(duì)的離散趨勢(shì)統(tǒng)計(jì)量,能夠?qū)ν豢傮w中的兩種不16標(biāo)準(zhǔn)分?jǐn)?shù):用來確定原始數(shù)據(jù)在總體分布中的位置,或用來對(duì)不同分布的各原始數(shù)據(jù)進(jìn)行比較。標(biāo)準(zhǔn)分?jǐn)?shù):用來確定原始數(shù)據(jù)在總體分布中的位置,或用來對(duì)不同分17二、單變量統(tǒng)計(jì)推論統(tǒng)計(jì)推論主要分為兩類:參數(shù)估計(jì)(點(diǎn)估計(jì)、區(qū)間估計(jì))、假設(shè)檢驗(yàn)。二、單變量統(tǒng)計(jì)推論181.區(qū)間估計(jì)在一定的可信度(置信水平、置信度)下,用樣本統(tǒng)計(jì)值的某個(gè)范圍(置信區(qū)間)來估價(jià)總體的參數(shù)值。置信水平與置信區(qū)間成正比。常用的置信水平分別為90%、95%和99%,與它們所對(duì)應(yīng)的允許誤差(顯著性水平,)則分別為10%、5%和1%。在計(jì)算中,置信水平常用1-來表示。1.區(qū)間估計(jì)19(1)總體均值()的區(qū)間估計(jì)為樣本平均數(shù),S為樣本標(biāo)準(zhǔn)差;為置信度是1-的Z值;n為樣本規(guī)模。(2)總體成數(shù)的區(qū)間估計(jì)

其中,為樣本成數(shù),p為總體中某類所占百分比。(1)總體均值()的區(qū)間估計(jì)其中,為樣本成數(shù),p202.假設(shè)檢驗(yàn)先對(duì)總體某一參數(shù)作出假設(shè),然后用樣本的統(tǒng)計(jì)量去進(jìn)行驗(yàn)證,以決定假設(shè)是否為總體所接受。幾對(duì)概念:(1)原假設(shè)與被擇假設(shè)(與)(2)顯著性水平與否定域(接受域)(3)雙邊檢驗(yàn)與單邊檢驗(yàn)

2.假設(shè)檢驗(yàn)21假設(shè)檢驗(yàn)的步驟:(1)建立原假設(shè)(虛無假設(shè))和(備擇假設(shè))研究假設(shè);(2)根據(jù)需要選擇適當(dāng)?shù)娘@著性水平,通常有=0.05,=0.01,并確定拒絕域或接受域;(3)根據(jù)樣本數(shù)據(jù)計(jì)算出統(tǒng)計(jì)值,并根據(jù)顯著性水平查出對(duì)應(yīng)的臨界值;(4)將臨界值與統(tǒng)計(jì)值進(jìn)行比較,若臨界值大于統(tǒng)計(jì)值的絕對(duì)值,則接受虛無假設(shè);反之,則接受研究假設(shè)。假設(shè)檢驗(yàn)的步驟:22假設(shè)檢驗(yàn)的類型:參數(shù)檢驗(yàn)、非參數(shù)檢驗(yàn)參數(shù)檢驗(yàn):Z檢驗(yàn)、t檢驗(yàn)與F檢驗(yàn)非參數(shù)檢驗(yàn):假設(shè)檢驗(yàn)的類型:23第三節(jié)雙變量統(tǒng)計(jì)分析一、交互分類與檢驗(yàn)1.交互分類交互分類(cross-tabulation)它是將研究所得的一組數(shù)據(jù)按照兩個(gè)不同的變量進(jìn)行綜合的分類,其結(jié)果通常以交互分類表(又稱為列聯(lián)表)的形式反映出來。(適用于各種測(cè)量層次的變量)作用:(1)較為深入地描述樣本資料的分布狀況和內(nèi)在結(jié)構(gòu);(2)分組比較,同時(shí)也是分析變量間關(guān)系的基礎(chǔ)。

第三節(jié)雙變量統(tǒng)計(jì)分析一、交互分類與檢驗(yàn)24表1千戶家庭居住地與戶主從事的產(chǎn)業(yè)(條件次數(shù)表)表2千戶家庭居住地與戶主從事的產(chǎn)業(yè)(條件百分比)產(chǎn)業(yè)地區(qū)東部中部西部農(nóng)業(yè)工業(yè)商業(yè)服務(wù)業(yè)建筑業(yè)運(yùn)輸9.3%82.76.71.307.1%78.713.30.70.25.0%43.646.42.52.5總數(shù)(300)(420)(280)產(chǎn)業(yè)地區(qū)總數(shù)東部中部西部農(nóng)業(yè)工業(yè)商業(yè)服務(wù)業(yè)建筑業(yè)運(yùn)輸282482040303305631141221307772700206148總數(shù)3004202801000表1千戶家庭居住地與戶主從事的產(chǎn)業(yè)(條件次數(shù)表)表2252.檢驗(yàn)式中為交互分類表中每一格的觀察頻數(shù);為交互分類表中所對(duì)應(yīng)的期望頻數(shù)。2.檢驗(yàn)26檢驗(yàn)的具體步驟:(1)建立兩變量間無關(guān)系的假設(shè);然后計(jì)算出值;(2)根據(jù)自由度df=(r-1)(c-1)和給出的顯著性水平,即p值,查分布表,得到一臨界值(r和c分別為交互分類表的行數(shù)和列數(shù));(3)將計(jì)算出的值與查得的臨界值進(jìn)行比較。若值大于或等于臨界值,則稱差異顯著,并拒絕兩變量獨(dú)立的假設(shè),即承認(rèn)兩變量間有關(guān)系;若值小于臨界值,則稱差異不顯著,并接受兩變量獨(dú)立的假設(shè),即兩變量間無關(guān)系。檢驗(yàn)的具體步驟:27二、消減誤差比例消減誤差比例(proportionatereductioninerror,簡稱PRE),指的是知道X的值時(shí)所減少的誤差()與總誤差的比。PRE越大,表示以X值去預(yù)測(cè)Y值時(shí)能夠減少的誤差所占比例越大。換句話說,X與Y之間就越相關(guān),或者說X與Y的關(guān)系越強(qiáng)。(適用于各種測(cè)量層次的變量)二、消減誤差比例PRE越大,表示以X值去預(yù)測(cè)Y值時(shí)能夠減少的28

=Y(jié)變量眾數(shù)的頻次;=X變量眾數(shù)的頻次,=Y(jié)變量每個(gè)取值之下的X變量的眾數(shù)的頻次;=為X變量的每個(gè)取值之下的Y變量眾數(shù)的頻次;N=調(diào)查對(duì)象總數(shù)。三、相關(guān)分析與檢驗(yàn)1.定類變量與定類變量Lambda系數(shù)、Tau-y系數(shù)(1)系數(shù)(

以眾值作為預(yù)測(cè)的準(zhǔn)則)=Y(jié)變量眾數(shù)的頻次;=X變量眾數(shù)的頻次,29(2)Tau-Y系數(shù)(系數(shù),測(cè)量變量間非對(duì)稱關(guān)系)(2)Tau-Y系數(shù)(系數(shù),測(cè)量變量間非對(duì)稱關(guān)系302.定序變量與定序變量Gamma系數(shù)(G)、系數(shù)、斯皮爾曼等級(jí)相關(guān)系數(shù)(1)G系數(shù)取值范圍為:[-1,+1],適用于分析對(duì)稱關(guān)系,且既表示相關(guān)的方向性,又表示相關(guān)的程度。式中,表示同序?qū)?shù)目,表示異序?qū)?shù)目。(同序?qū)Γ鹤兞看笮№樞蛳嗤膬蓚€(gè)樣本點(diǎn),即其在變量X上的等級(jí)高低順序與在變量Y上的等級(jí)高低順序相同;否則就叫異序?qū)Γ?.定序變量與定序變量31Z檢驗(yàn)為了進(jìn)行Z檢驗(yàn),必須先將G值標(biāo)準(zhǔn)化為Z值。Z檢驗(yàn)32(2)系數(shù)(測(cè)量兩個(gè)變量間的關(guān)系為非對(duì)稱性的)(2)系數(shù)(測(cè)量兩個(gè)變量間的關(guān)系為非對(duì)稱性的)33(3)斯皮爾曼等級(jí)相關(guān)系數(shù)(一般用表示)測(cè)量兩變量間對(duì)等相關(guān)關(guān)系不僅對(duì)變量等級(jí)的高低做比較,而且還考慮等級(jí)的差異。取值[-1,+1](3)斯皮爾曼等級(jí)相關(guān)系數(shù)(一般用表示)343.定類變量(或定序變量)與定距變量當(dāng)兩個(gè)分析的變量一個(gè)為定類(或定序)變量,另一個(gè)為定距(以上)變量時(shí),可以用相關(guān)比率(Correlationratio)或eta系數(shù)來測(cè)量二者間的相關(guān)程度。相關(guān)比率又稱為eta平方系數(shù),記為,其數(shù)值范圍由0到1,也具有消減誤差比例的意義。其計(jì)算公式為:式中,y為因變量的數(shù)值,為因變量的均值;為在自變量x的每個(gè)取值上的因變量的均值。3.定類變量(或定序變量)與定距變量35為了計(jì)算方便,常將上述公式化為下面形式:式中,n為x變量每一取值的頻數(shù)合計(jì)值,n為總的頻數(shù)值,。為了計(jì)算方便,常將上述公式化為下面形式:36相比比率的檢驗(yàn)采用的是F檢驗(yàn)法,其計(jì)算公式為:式中,k為分組數(shù)目,n為樣本規(guī)模;相比比率的檢驗(yàn)采用的是F檢驗(yàn)法,其計(jì)算公式為:374.定距變量與定距變量皮爾遜相關(guān)系數(shù)(或稱皮爾遜積差相關(guān)系數(shù))r。皮爾遜相關(guān)系數(shù)的計(jì)算公式為:皮爾遜相關(guān)系數(shù)r的檢驗(yàn)既可采用F檢驗(yàn)的方法,也可采用t檢驗(yàn)的方法,因?yàn)镕=。F檢驗(yàn)的計(jì)算公式如下:4.定距變量與定距變量38總結(jié)各種層次變量之間的相關(guān)測(cè)量與檢驗(yàn)方法:(1)各種相關(guān)測(cè)量的方法,目的是理解兩個(gè)變量在“樣本”中相關(guān)程度的強(qiáng)弱或大小。(2)對(duì)各種相關(guān)系數(shù)所進(jìn)行的相應(yīng)的檢驗(yàn),目的是根據(jù)隨機(jī)樣本的資料推論兩個(gè)變量在“總體”中是否相關(guān)。(3)選擇何種相關(guān)測(cè)量方法和何種檢驗(yàn)方法,主要看兩變量的測(cè)量層次,要依據(jù)變量的測(cè)量層次來確定合適的相關(guān)檢驗(yàn)工具。

總結(jié)各種層次變量之間的相關(guān)測(cè)量與檢驗(yàn)方法:39兩變量關(guān)系的測(cè)量與檢驗(yàn)方法總結(jié)表兩變量層次相關(guān)系數(shù)取值范圍是否對(duì)稱有誤消減誤差比例意義檢驗(yàn)方法SPSS有無該系數(shù)定類-定類(定類-定序)[0,1]對(duì)稱有檢驗(yàn)有定序-定序G[-1,1]對(duì)稱有Z檢驗(yàn)有定類-定距(定序-定距)E[0,1]不對(duì)稱無有F檢驗(yàn)有有定距-定距r[-1,1][0,1]對(duì)稱無有F檢驗(yàn)(t檢驗(yàn))有有兩變量關(guān)系的測(cè)量與檢驗(yàn)方法總結(jié)表兩變量層次相關(guān)系數(shù)取值范圍是40四、一元回歸分析回歸分析是對(duì)有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其關(guān)系的形態(tài)找出一個(gè)合適的數(shù)學(xué)模型(即建立回歸方程),來近似地表達(dá)變量間的平均變化關(guān)系,以便依據(jù)回歸方程對(duì)未加的情況進(jìn)行估計(jì)和預(yù)測(cè)?;貧w分析的對(duì)象:定距層次的變量中心問題:建立回歸方程(建立回歸方程的基礎(chǔ)是最小二乘法)。四、一元回歸分析41一元線性方程是依據(jù)最小二乘法計(jì)算得到的,其標(biāo)方程為:y=a+bx。計(jì)算公式為:一元線性方程是依據(jù)最小二乘法計(jì)算得到的,其標(biāo)方程為:y=a+42回歸分析注意下述兩點(diǎn):一、注意時(shí)間條件,即回歸方程往往反映的是一定時(shí)期內(nèi)變量間的相互關(guān)系,當(dāng)時(shí)期不同時(shí),這種關(guān)系常常會(huì)發(fā)生變化;二、注意預(yù)測(cè)不能超過資料所適合的范圍,即回歸方程的預(yù)測(cè)在變量取值上有一定的臨界條件?;貧w分析注意下述兩點(diǎn):43第四章多變量的統(tǒng)計(jì)分析

一、闡釋模式(elaboration)闡釋模式所關(guān)心的是兩個(gè)變量之間的關(guān)系,它是一種通過引進(jìn)并控制第三變量,來進(jìn)一步了解和探討原來兩變量之間關(guān)系性質(zhì)的統(tǒng)計(jì)分析方法。統(tǒng)計(jì)分析方法:用分表法來控制第三變量,然后用分表的結(jié)果與原關(guān)系進(jìn)行比較。具體步驟:(1)制作x與y的交互分類表;(2)控制第三變量制作x與y的兩個(gè)列聯(lián)表;(3)可以加入更多的變量制作列聯(lián)表。第四章多變量的統(tǒng)計(jì)分析一、闡釋模式(elaboratio44X(氣溫)Y(自殺率)工作好工作差人際關(guān)系好中中差差好X(氣溫)Y(自殺率)工作好工作差人際關(guān)系好中中差差好45二、復(fù)相關(guān)分析復(fù)相關(guān)分析是一種以一個(gè)統(tǒng)計(jì)值來簡化多個(gè)自變量與一個(gè)因變量之間關(guān)系的統(tǒng)計(jì)分析方法。它要求所有的變量都是定距以上層次的變量。統(tǒng)計(jì)值R表示多個(gè)自變量與一個(gè)因變量之間相關(guān)的程度,其計(jì)算是以兩變量相關(guān)中的積矩相關(guān)系數(shù)r為基礎(chǔ)的。其大小在0與1之間,越是接近1,表示這些自變量與這一因變量之間的關(guān)系越強(qiáng);反之,R值越接近于0,則表示這些自變量與這一因變量的關(guān)系越弱。稱為決定系數(shù),具有消減誤差比例的意義。二、復(fù)相關(guān)分析46式中,表示與這兩個(gè)自變量與因變量y之間的復(fù)相關(guān)系數(shù);則表示決定系數(shù);、、分別表示與y、與y、

與之間的積矩相關(guān)系數(shù);、、則分別表示上述三個(gè)積矩相關(guān)系數(shù)的平方,即決定系數(shù)。式中,表示與這兩個(gè)自變量與因變量y之間的47三、多元回歸分析多元回歸分析:用多個(gè)自變量來估計(jì)或預(yù)測(cè)一個(gè)因變量的數(shù)值;以及分析不同的自變量對(duì)因變量所實(shí)際具有的影響力大小。

方程式中b值稱為凈回歸系數(shù),它表示的是在控制了其他自變量以后,某一自變量對(duì)因變量的單獨(dú)效果。式中B值稱為標(biāo)準(zhǔn)化凈回歸系數(shù),也成為B系數(shù),三、多元回歸分析式中B值稱為標(biāo)準(zhǔn)化凈回歸系數(shù),也成為B系數(shù),48在復(fù)相關(guān)系數(shù)與B系數(shù)之間、每一自變量的分別決定系數(shù)與總的決定系數(shù)之間,存在著下列關(guān)系:式中,,…,稱為分別決定系數(shù),表示在全部已解釋的方差中,有多少分別是由自變量所貢獻(xiàn)的。其總和就是總的決定系數(shù)。在復(fù)相關(guān)系數(shù)與B系數(shù)之間、每一自變量的分別決定系數(shù)與總的決定49多元回歸分析中需要注意的問題:統(tǒng)計(jì)累贅的問題如果某些自變量相互之間的關(guān)系特別強(qiáng),則在相互控制后它們每一個(gè)的效果會(huì)變得很弱,而其他自變量的效果會(huì)變得較大。在這種情況下來分析各自變量的相對(duì)效果就會(huì)犯錯(cuò)誤。所有的變量都是定距以上層次的變量。

多元回歸分析中需要注意的問題:50第十一章定量資料分析第十一章-定量分析課件51主要內(nèi)容:資料的整理與錄入單變量統(tǒng)計(jì)分析雙變量統(tǒng)計(jì)分析多變量的統(tǒng)計(jì)分析主要內(nèi)容:52第一節(jié)資料的整理與錄入

一、資料的審核主要工作:審查資料的完整性、統(tǒng)一性和合格性。完整性:

資料總體的完整性;每份資料的完整性。統(tǒng)一性:

問卷或報(bào)表登記填報(bào)方法是否統(tǒng)一;對(duì)同一指標(biāo)的數(shù)字所使用的度量單位是否一致;不同表格對(duì)同一指標(biāo)的計(jì)算方法是否統(tǒng)一第一節(jié)資料的整理與錄入一、資料的審核53合格性:

提供資料者的身份是否符合所規(guī)定的調(diào)查對(duì)象的身份所提供的資料是否符合填報(bào)要求;所提供的資料是否正確無誤。資料審核的方式:(1)實(shí)地審核;(2)系統(tǒng)審核或集中審核合格性:54二、資料的分類和編碼將被調(diào)查者對(duì)問卷中問題的回答轉(zhuǎn)換成供計(jì)算機(jī)識(shí)別和統(tǒng)計(jì)的數(shù)字。轉(zhuǎn)換成的數(shù)字A1你的性別:①男√②女1A2你的年齡:28周歲28A3你的文化程度:3①小學(xué)及以下②初中③高中及中專√④大專以上A4你的婚姻狀況2①未婚②已婚√③離婚④喪偶⑤其他二、資料的分類和編碼55對(duì)婚事花費(fèi)態(tài)度的調(diào)查

非常同意同意無所謂不同意很不同意①婚事應(yīng)該盡量辦得簡單一些√②結(jié)婚是人生一件大事,婚事應(yīng)該辦得隆重?zé)狒[、花再多的錢也值得√③就是沒錢婚事也不應(yīng)大操辦√三種看法的賦值非常同意同意無所謂不同意很不同意看法①看法②看法③151242333424515對(duì)婚事花費(fèi)態(tài)度的調(diào)查

非常同意同意無所謂不同意很不同意①婚事56編碼手冊(cè)項(xiàng)目名稱變量名含義寬度欄碼答案賦值區(qū)V城區(qū)111=東城2=西城3=海淀4=朝陽5=宣武6=石景山個(gè)案號(hào)ID個(gè)案號(hào)42-5根據(jù)問卷上的號(hào)碼填寫問題A1A1性別161=男2=女0=無回答問題A2A2年齡27-8按實(shí)際年齡填寫大于99歲的填99問題A3A3文化程度191=小學(xué)及以下2=初中3=高中及中專4=大專以上編碼手冊(cè)項(xiàng)目名稱變量名含義寬度欄碼答案賦值區(qū)V城區(qū)111=東57三、數(shù)據(jù)錄入主要的兩種方式:(1)直接從問卷上將編好碼的數(shù)據(jù)輸入計(jì)算機(jī);(2)先將問卷上編好碼的數(shù)據(jù)轉(zhuǎn)錄到的登錄表上,然后再從登錄表上將數(shù)據(jù)輸入計(jì)算機(jī)。三、數(shù)據(jù)錄入58數(shù)據(jù)登錄表城區(qū)個(gè)案號(hào)A1A2A3A4A5A61A62……12-567-8910111213個(gè)案11038723932211個(gè)案22038824023410個(gè)案34038915025221個(gè)案43040012817100…………………………………………………數(shù)據(jù)登錄表城區(qū)個(gè)案號(hào)A1A2A3A4A5A61A62……1259四、數(shù)據(jù)清理1.有效范圍清理;2.邏輯一致性清理;3.數(shù)據(jù)質(zhì)量抽查。四、數(shù)據(jù)清理60全面調(diào)查抽樣調(diào)查單變量雙變量多變量單變量雙變量多變量其他非概率抽樣統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)描述+統(tǒng)計(jì)推論集中趨勢(shì)分析離散趨勢(shì)分析列聯(lián)表消減誤差比例相關(guān)分析一元方差分析一元回歸分析多元相關(guān)分析多元方差分析多元因果分析判別分析聚類分析因素分析最小空間分析統(tǒng)計(jì)推論參數(shù)估計(jì)假設(shè)檢驗(yàn)點(diǎn)估計(jì)區(qū)間估計(jì)參數(shù)檢驗(yàn)Z檢驗(yàn)t檢驗(yàn)F檢驗(yàn)非參數(shù)檢驗(yàn)檢驗(yàn)全面調(diào)查抽樣調(diào)查單變量雙變量多變量單變量雙變量多變量其他統(tǒng)計(jì)61第二節(jié)單變量統(tǒng)計(jì)分析一、單變量描述統(tǒng)計(jì)主要目的:用最簡單的概括形式反映出大量數(shù)據(jù)資料所容納的基本信息?;痉椒ǎ杭汹厔?shì)分析、離散趨勢(shì)分析等。第二節(jié)單變量統(tǒng)計(jì)分析一、單變量描述統(tǒng)計(jì)621.集中趨勢(shì)分析用一個(gè)典型值或代表值來反映一組數(shù)據(jù)的一般水平,或反映這組數(shù)據(jù)向這個(gè)典型值集中的情況。最常見的集中趨勢(shì):平均數(shù)、眾數(shù)和中位數(shù)。1.集中趨勢(shì)分析632.離散趨勢(shì)分析用一個(gè)特別的數(shù)值來反映一組數(shù)據(jù)相互之間的離散程度。常見的離散趨勢(shì)統(tǒng)計(jì)量:極差、異眾比率、四分位差、標(biāo)準(zhǔn)差與方差、離散系數(shù)與標(biāo)準(zhǔn)分?jǐn)?shù)等。(標(biāo)準(zhǔn)差——平均數(shù)、異眾比率——眾數(shù)、四分位差——中位數(shù))。

2.離散趨勢(shì)分析64標(biāo)準(zhǔn)差:一組數(shù)據(jù)對(duì)其平均數(shù)的偏差平方的算術(shù)平均數(shù)的平方根。標(biāo)準(zhǔn)差:一組數(shù)據(jù)對(duì)其平均數(shù)的偏差平方的算術(shù)平均數(shù)的平方根。65離散系數(shù):一種相對(duì)的離散趨勢(shì)統(tǒng)計(jì)量,能夠?qū)ν豢傮w中的兩種不同的離散趨勢(shì)統(tǒng)計(jì)量進(jìn)行比較,或?qū)蓚€(gè)不同總體中的同一離散趨勢(shì)統(tǒng)計(jì)量進(jìn)行比較。離散系數(shù):標(biāo)準(zhǔn)差與平均數(shù)之百分比。離散系數(shù):一種相對(duì)的離散趨勢(shì)統(tǒng)計(jì)量,能夠?qū)ν豢傮w中的兩種不66標(biāo)準(zhǔn)分?jǐn)?shù):用來確定原始數(shù)據(jù)在總體分布中的位置,或用來對(duì)不同分布的各原始數(shù)據(jù)進(jìn)行比較。標(biāo)準(zhǔn)分?jǐn)?shù):用來確定原始數(shù)據(jù)在總體分布中的位置,或用來對(duì)不同分67二、單變量統(tǒng)計(jì)推論統(tǒng)計(jì)推論主要分為兩類:參數(shù)估計(jì)(點(diǎn)估計(jì)、區(qū)間估計(jì))、假設(shè)檢驗(yàn)。二、單變量統(tǒng)計(jì)推論681.區(qū)間估計(jì)在一定的可信度(置信水平、置信度)下,用樣本統(tǒng)計(jì)值的某個(gè)范圍(置信區(qū)間)來估價(jià)總體的參數(shù)值。置信水平與置信區(qū)間成正比。常用的置信水平分別為90%、95%和99%,與它們所對(duì)應(yīng)的允許誤差(顯著性水平,)則分別為10%、5%和1%。在計(jì)算中,置信水平常用1-來表示。1.區(qū)間估計(jì)69(1)總體均值()的區(qū)間估計(jì)為樣本平均數(shù),S為樣本標(biāo)準(zhǔn)差;為置信度是1-的Z值;n為樣本規(guī)模。(2)總體成數(shù)的區(qū)間估計(jì)

其中,為樣本成數(shù),p為總體中某類所占百分比。(1)總體均值()的區(qū)間估計(jì)其中,為樣本成數(shù),p702.假設(shè)檢驗(yàn)先對(duì)總體某一參數(shù)作出假設(shè),然后用樣本的統(tǒng)計(jì)量去進(jìn)行驗(yàn)證,以決定假設(shè)是否為總體所接受。幾對(duì)概念:(1)原假設(shè)與被擇假設(shè)(與)(2)顯著性水平與否定域(接受域)(3)雙邊檢驗(yàn)與單邊檢驗(yàn)

2.假設(shè)檢驗(yàn)71假設(shè)檢驗(yàn)的步驟:(1)建立原假設(shè)(虛無假設(shè))和(備擇假設(shè))研究假設(shè);(2)根據(jù)需要選擇適當(dāng)?shù)娘@著性水平,通常有=0.05,=0.01,并確定拒絕域或接受域;(3)根據(jù)樣本數(shù)據(jù)計(jì)算出統(tǒng)計(jì)值,并根據(jù)顯著性水平查出對(duì)應(yīng)的臨界值;(4)將臨界值與統(tǒng)計(jì)值進(jìn)行比較,若臨界值大于統(tǒng)計(jì)值的絕對(duì)值,則接受虛無假設(shè);反之,則接受研究假設(shè)。假設(shè)檢驗(yàn)的步驟:72假設(shè)檢驗(yàn)的類型:參數(shù)檢驗(yàn)、非參數(shù)檢驗(yàn)參數(shù)檢驗(yàn):Z檢驗(yàn)、t檢驗(yàn)與F檢驗(yàn)非參數(shù)檢驗(yàn):假設(shè)檢驗(yàn)的類型:73第三節(jié)雙變量統(tǒng)計(jì)分析一、交互分類與檢驗(yàn)1.交互分類交互分類(cross-tabulation)它是將研究所得的一組數(shù)據(jù)按照兩個(gè)不同的變量進(jìn)行綜合的分類,其結(jié)果通常以交互分類表(又稱為列聯(lián)表)的形式反映出來。(適用于各種測(cè)量層次的變量)作用:(1)較為深入地描述樣本資料的分布狀況和內(nèi)在結(jié)構(gòu);(2)分組比較,同時(shí)也是分析變量間關(guān)系的基礎(chǔ)。

第三節(jié)雙變量統(tǒng)計(jì)分析一、交互分類與檢驗(yàn)74表1千戶家庭居住地與戶主從事的產(chǎn)業(yè)(條件次數(shù)表)表2千戶家庭居住地與戶主從事的產(chǎn)業(yè)(條件百分比)產(chǎn)業(yè)地區(qū)東部中部西部農(nóng)業(yè)工業(yè)商業(yè)服務(wù)業(yè)建筑業(yè)運(yùn)輸9.3%82.76.71.307.1%78.713.30.70.25.0%43.646.42.52.5總數(shù)(300)(420)(280)產(chǎn)業(yè)地區(qū)總數(shù)東部中部西部農(nóng)業(yè)工業(yè)商業(yè)服務(wù)業(yè)建筑業(yè)運(yùn)輸282482040303305631141221307772700206148總數(shù)3004202801000表1千戶家庭居住地與戶主從事的產(chǎn)業(yè)(條件次數(shù)表)表2752.檢驗(yàn)式中為交互分類表中每一格的觀察頻數(shù);為交互分類表中所對(duì)應(yīng)的期望頻數(shù)。2.檢驗(yàn)76檢驗(yàn)的具體步驟:(1)建立兩變量間無關(guān)系的假設(shè);然后計(jì)算出值;(2)根據(jù)自由度df=(r-1)(c-1)和給出的顯著性水平,即p值,查分布表,得到一臨界值(r和c分別為交互分類表的行數(shù)和列數(shù));(3)將計(jì)算出的值與查得的臨界值進(jìn)行比較。若值大于或等于臨界值,則稱差異顯著,并拒絕兩變量獨(dú)立的假設(shè),即承認(rèn)兩變量間有關(guān)系;若值小于臨界值,則稱差異不顯著,并接受兩變量獨(dú)立的假設(shè),即兩變量間無關(guān)系。檢驗(yàn)的具體步驟:77二、消減誤差比例消減誤差比例(proportionatereductioninerror,簡稱PRE),指的是知道X的值時(shí)所減少的誤差()與總誤差的比。PRE越大,表示以X值去預(yù)測(cè)Y值時(shí)能夠減少的誤差所占比例越大。換句話說,X與Y之間就越相關(guān),或者說X與Y的關(guān)系越強(qiáng)。(適用于各種測(cè)量層次的變量)二、消減誤差比例PRE越大,表示以X值去預(yù)測(cè)Y值時(shí)能夠減少的78

=Y(jié)變量眾數(shù)的頻次;=X變量眾數(shù)的頻次,=Y(jié)變量每個(gè)取值之下的X變量的眾數(shù)的頻次;=為X變量的每個(gè)取值之下的Y變量眾數(shù)的頻次;N=調(diào)查對(duì)象總數(shù)。三、相關(guān)分析與檢驗(yàn)1.定類變量與定類變量Lambda系數(shù)、Tau-y系數(shù)(1)系數(shù)(

以眾值作為預(yù)測(cè)的準(zhǔn)則)=Y(jié)變量眾數(shù)的頻次;=X變量眾數(shù)的頻次,79(2)Tau-Y系數(shù)(系數(shù),測(cè)量變量間非對(duì)稱關(guān)系)(2)Tau-Y系數(shù)(系數(shù),測(cè)量變量間非對(duì)稱關(guān)系802.定序變量與定序變量Gamma系數(shù)(G)、系數(shù)、斯皮爾曼等級(jí)相關(guān)系數(shù)(1)G系數(shù)取值范圍為:[-1,+1],適用于分析對(duì)稱關(guān)系,且既表示相關(guān)的方向性,又表示相關(guān)的程度。式中,表示同序?qū)?shù)目,表示異序?qū)?shù)目。(同序?qū)Γ鹤兞看笮№樞蛳嗤膬蓚€(gè)樣本點(diǎn),即其在變量X上的等級(jí)高低順序與在變量Y上的等級(jí)高低順序相同;否則就叫異序?qū)Γ?.定序變量與定序變量81Z檢驗(yàn)為了進(jìn)行Z檢驗(yàn),必須先將G值標(biāo)準(zhǔn)化為Z值。Z檢驗(yàn)82(2)系數(shù)(測(cè)量兩個(gè)變量間的關(guān)系為非對(duì)稱性的)(2)系數(shù)(測(cè)量兩個(gè)變量間的關(guān)系為非對(duì)稱性的)83(3)斯皮爾曼等級(jí)相關(guān)系數(shù)(一般用表示)測(cè)量兩變量間對(duì)等相關(guān)關(guān)系不僅對(duì)變量等級(jí)的高低做比較,而且還考慮等級(jí)的差異。取值[-1,+1](3)斯皮爾曼等級(jí)相關(guān)系數(shù)(一般用表示)843.定類變量(或定序變量)與定距變量當(dāng)兩個(gè)分析的變量一個(gè)為定類(或定序)變量,另一個(gè)為定距(以上)變量時(shí),可以用相關(guān)比率(Correlationratio)或eta系數(shù)來測(cè)量二者間的相關(guān)程度。相關(guān)比率又稱為eta平方系數(shù),記為,其數(shù)值范圍由0到1,也具有消減誤差比例的意義。其計(jì)算公式為:式中,y為因變量的數(shù)值,為因變量的均值;為在自變量x的每個(gè)取值上的因變量的均值。3.定類變量(或定序變量)與定距變量85為了計(jì)算方便,常將上述公式化為下面形式:式中,n為x變量每一取值的頻數(shù)合計(jì)值,n為總的頻數(shù)值,。為了計(jì)算方便,常將上述公式化為下面形式:86相比比率的檢驗(yàn)采用的是F檢驗(yàn)法,其計(jì)算公式為:式中,k為分組數(shù)目,n為樣本規(guī)模;相比比率的檢驗(yàn)采用的是F檢驗(yàn)法,其計(jì)算公式為:874.定距變量與定距變量皮爾遜相關(guān)系數(shù)(或稱皮爾遜積差相關(guān)系數(shù))r。皮爾遜相關(guān)系數(shù)的計(jì)算公式為:皮爾遜相關(guān)系數(shù)r的檢驗(yàn)既可采用F檢驗(yàn)的方法,也可采用t檢驗(yàn)的方法,因?yàn)镕=。F檢驗(yàn)的計(jì)算公式如下:4.定距變量與定距變量88總結(jié)各種層次變量之間的相關(guān)測(cè)量與檢驗(yàn)方法:(1)各種相關(guān)測(cè)量的方法,目的是理解兩個(gè)變量在“樣本”中相關(guān)程度的強(qiáng)弱或大小。(2)對(duì)各種相關(guān)系數(shù)所進(jìn)行的相應(yīng)的檢驗(yàn),目的是根據(jù)隨機(jī)樣本的資料推論兩個(gè)變量在“總體”中是否相關(guān)。(3)選擇何種相關(guān)測(cè)量方法和何種檢驗(yàn)方法,主要看兩變量的測(cè)量層次,要依據(jù)變量的測(cè)量層次來確定合適的相關(guān)檢驗(yàn)工具。

總結(jié)各種層次變量之間的相關(guān)測(cè)量與檢驗(yàn)方法:89兩變量關(guān)系的測(cè)量與檢驗(yàn)方法總結(jié)表兩變量層次相關(guān)系數(shù)取值范圍是否對(duì)稱有誤消減誤差比例意義檢驗(yàn)方法SPSS有無該系數(shù)定類-定類(定類-定序)[0,1]對(duì)稱有檢驗(yàn)有定序-定序G[-1,1]對(duì)稱有Z檢驗(yàn)有定類-定距(定序-定距)E[0,1]不對(duì)稱無有F檢驗(yàn)有有定距-定距r[-1,1][0,1]對(duì)稱無有F檢驗(yàn)(t檢驗(yàn))有有兩變量關(guān)系的測(cè)量與檢驗(yàn)方法總結(jié)表兩變量層次相關(guān)系數(shù)取值范圍是90四、一元回歸分析回歸分析是對(duì)有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其關(guān)系的形態(tài)找出一個(gè)合適的數(shù)學(xué)模型(即建立回歸方程)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論