




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、附錄統(tǒng)計分析軟件SPSS的應(yīng)用一、SPSS簡介社會科學統(tǒng)計軟件包SPSS(Statistical Package for the Social Science)是非常重要的統(tǒng)計分析軟件之一。20世紀60年代末,美國斯坦福大學的三位研究生研制開發(fā)了最早的統(tǒng)計分析軟件SPSS,同時成立了SPSS公司,并于1975年在芝加哥組建了SPSS總部。20世紀80年代以前,SPSS統(tǒng)計軟件主要應(yīng)用于企事業(yè)單位。1984年SPSS總部首先推出了世界第一個統(tǒng)計分析軟件微機版本SPSS/PC+,開創(chuàng)了SPSS微機系列產(chǎn)品的開發(fā)方向,并迅速地開始應(yīng)用于自然科學、技術(shù)科學和社會科學的各個領(lǐng)域。隨著SPSS產(chǎn)品服務(wù)領(lǐng)域
2、的擴大和服務(wù)深度的增加,SPSS公司已于2000年正式改名為“統(tǒng)計產(chǎn)品與服務(wù)解決方案”,即“Statistical Product and Service Solutions(SPSS)”,這一名稱的改變標志著SPSS的戰(zhàn)略方向正在做出重大調(diào)整。SPSS for Windows的分析結(jié)果清晰、直觀、易學易用,而且可以直接讀取EXCEL及DBF數(shù)據(jù)文件,現(xiàn)已推廣到多種操作系統(tǒng)的計算機上,它和SAS、BMDP并稱為國際上最有影響的三大統(tǒng)計軟件。SPSS for Windows是一個組合式軟件包,它集數(shù)據(jù)整理、分析功能于一身。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等等。SPSS
3、統(tǒng)計分析過程包括描述性統(tǒng)計、均值比較、一般線性模型、相關(guān)分析、回歸分析、對數(shù)線性模型、聚類分析、數(shù)據(jù)降維、生存分析、時間序列分析、多重響應(yīng)等幾大類,每類中又分若干個統(tǒng)計過程,例如回歸分析中包括線性回歸分析、曲線估計、Logistic回歸、Probit回歸、加權(quán)估計、兩階段最小二乘法、非線性回歸等多個統(tǒng)計過程,而且每個過程中又允許用戶選擇不同的方法及參數(shù)。SPSS也有專門的繪圖系統(tǒng),可以根據(jù)數(shù)據(jù)繪制各種圖形。 (一)數(shù)據(jù)編輯窗口SPSS啟動后進入主窗口,即數(shù)據(jù)編輯窗口SPSS Data Editor。數(shù)據(jù)編輯窗口的主菜單包括10個選項,具體功能詳見表1。表1 數(shù)據(jù)編輯窗口中的菜單項及功能菜單項中
4、文含義包括的命令項File文件管理文件的打開、保存、另存和打印等Edit編輯撤銷/回復(fù)、剪切、復(fù)制、粘貼、清除、查找等View視圖顯示或隱藏狀態(tài)欄、工具欄、網(wǎng)絡(luò)線、值標簽和改變字體等Data數(shù)據(jù)管理定義變量、日期、模板;插入變量、觀測量;對觀測量定位、排序;對數(shù)據(jù)文件拆分、合并;對觀測量選擇、加權(quán)和正交設(shè)計等Transform數(shù)據(jù)轉(zhuǎn)換計算新變量、計數(shù)、重編碼、自動重編碼、排秩建立時間序列、重置缺失值等Analyze統(tǒng)計分析描述性分析、均值比較、方差分析、一般線性模型、相關(guān)、回歸、聚類與判別、降維分析、非參檢驗、時間序列和生存分析等Graphs統(tǒng)計制圖各種統(tǒng)計圖的制作Utilities用戶選項命
5、令解釋、字體選擇、文件信息、定義輸出標題、窗口設(shè)計等Windows窗口控制窗口的排列、查找、顯示等Help幫助主題、SPSS主頁、主句指南、統(tǒng)計學指導等點擊菜單選項即可激活菜單,這時彈出下拉式子菜單,用戶可根據(jù)自己的需要再點擊子菜單的選項,完成特定的功能。(二)建立數(shù)據(jù)文件建立數(shù)據(jù)文件的第一步是定義變量。點擊左下角的Variable View進入變量定義窗口,對變量進行定義。變量定義包括10項內(nèi)容,分別為Name、Type、Width、Decimal、Label、Values、Missing、Column、Align和Measure,如圖1所示。圖1(1)Name:定義變量名。變量名不能超過8
6、個字符,中英文以及數(shù)字都可以,但首字母不能為數(shù)字,同時不能使用與SPSS軟件運算符相同的一些字符串,如ALL,AND,BY,EQ,GE,GT,LE,LT,NE,NOT,OR,TO,WITH等以及(),/,?等符號,而且也不能以下劃線“ ”或圓點“.”作為變量名的最后一個字符。英文的變量名不區(qū)分大小寫。(2) Type:定義變量類型。SPSS變量有三種基本類型:數(shù)值型、字符型和日期型,數(shù)值型變量又分為5種,因此共可定義8種類型的變量。系統(tǒng)默認的變量類型為標準數(shù)值型變量(Numeric),其他7種為帶逗點的數(shù)值型(Comma),逗點作小數(shù)點的數(shù)值型(Dot),科學計數(shù)法(Scientific No
7、tation),日期型(Date),帶美元符號的數(shù)值型(Dollar),自定義型(Custom Currency)和字符(String),如圖2所示。 圖2(3)Width:設(shè)置數(shù)值值變量的長度,當變量為日期型時無效。小數(shù)點或其它分界符號包含在總長度之內(nèi)。變量長度的系統(tǒng)默認長度為8,但可以用Edit菜單中的Options命令重新設(shè)置。(4)Decimal:設(shè)置變量值小數(shù)點位數(shù),系統(tǒng)默認值為2。(5)Label:設(shè)置變量標簽。變量標簽是對變量名的進一步說明。變量名只能由不超過8個字符組成,而變量標簽可長達120個字符。變量標簽可以對變量名的含義加以解釋,在統(tǒng)計分析過程的輸出結(jié)果中會在與變量名相對
8、應(yīng)的位置顯示該變量的標簽。(6)Values:設(shè)置標量值標簽。標量值標簽是對變量值的進一步說明,對分類變量往往要定義其變量值標簽。單擊Values相應(yīng)單元即可展開設(shè)置變量值標簽的對話框,如圖3所示。如定義GENDER變量的值標簽,“1”為男性,“2”為女性。先在第一個Value框中輸入“1”,在第二個Value框中輸入“男”,按Add按鈕,列表框中增加一個值標簽,顯示1“男”。然后再重復(fù)上述操作,定義2“女”的值標簽。確認無誤后,按OK返回上一級對話框。 圖3(7)Missing:缺失值的定義方式。單擊Missing下的長方形框即可展開Missing Values對話框,如圖4所示。其中No
9、missing value為無缺失值選項,這也是系統(tǒng)的默認值;Discrete missing value為離散缺失值選項,選定此項即可在下面三個矩形框中填入數(shù)據(jù)(可少于3個);Range plus one optional discrete missing value為定義缺失值范圍并附加一個范圍外選項,選定此項可在Low和High兩個參數(shù)框中填入數(shù)值,同時還可以定義一個離散的缺失值。 圖4(8)Column:設(shè)置變量的顯示寬度。(9)Align:設(shè)置變量顯示的對齊方式。Left為左對齊,Right為右對齊,Center為居中對齊。(10)Measure:設(shè)置變量的測量尺度。SPSS將測量變
10、量分為三大類,定類變量Nominal,定序變量Ordinal和定距以及定比變量Scale。變量定義完成后,即可單擊左下角的Data View轉(zhuǎn)換到數(shù)據(jù)編輯窗口,將數(shù)據(jù)錄入,生成SPSS數(shù)據(jù)文件。(三)數(shù)據(jù)的整理1、觀測量數(shù)據(jù)的排序。在主菜單選擇DataSort cases,打開Sort Cases觀測量排序?qū)υ捒颍鐖D5所示。從左側(cè)的源變量框中選擇排序變量,通過箭頭按鈕選到sort by框中。如果選擇兩個以上的排序變量,觀測量排序的結(jié)果與排序變量在Sort by框中的順序有關(guān)。列于首位的稱為第一排序變量,其后的被依次稱為第二排序變量、第三排序變量等等。Sort order是確定排序的方式,選擇
11、Ascending是按升序排列;選擇Descending是按降序排列。 圖52、建立新變量。在主菜單選擇TransformCompute Variable,打開Compute Variable 對話框,如圖6所示。在Target目標變量框中輸入變量名,在Numeric Expression數(shù)學表達式框中輸入計算方法。在輸入數(shù)學表達式時,注意字符串常量必須用引號括起來,且每一個關(guān)系表達式必須單獨完成。如果需要選擇特定的觀測量計算新變量,可以選擇IF按鈕,并在Compute Variable: If cases對話框中設(shè)置條件表達式。 圖63、數(shù)據(jù)重分組。在主菜單選擇TransformRecode
12、 into same variable/Recode into different variable。從左側(cè)源變量框中選擇年齡A01.1,通過箭頭按鈕選到Numeric VariableOutput Variable欄,如圖7所示。圖7 單擊Old and New Values按鈕,打開Recode into different Variable: Old and New Values對話框,對A01.1變量重新進行分組。將“25歲以下”的賦值為“1”,“2535歲”的賦值為“2”,“35歲以上”的賦值為“3”,如圖8所示。 圖8單擊Continue按鈕,返回上一級對話框。在Output Va
13、riable欄對新輸出的變量進行命名并設(shè)置變量標簽后,單擊Change和OK按鈕,提交運行,在數(shù)據(jù)文件中即可生成一個新的分組年齡的變量Agegroup。4、從數(shù)據(jù)中抽取觀測量。在主菜單選擇DataSelect cases,打開Select cases對話框。右側(cè)的Select欄包括All cases為全選,這是系統(tǒng)默認的設(shè)置;If condition is satisfied為條件選擇抽取。單擊If按鈕,將顯示如圖9所示的條件設(shè)置對話框,在右側(cè)矩形欄中輸入條件設(shè)置,例如抽取性別為男性的觀測量。圖9Random sample of cases為隨機抽取。單擊Sample,將出現(xiàn)如圖10所示的隨機
14、抽取對話框,可以根據(jù)要求選擇觀測量。Approximately of all cases為抽取百分比,這種抽樣方式僅僅是一種近似的抽取;Exactly cases from the first cases則表示從總樣本數(shù)中精確抽取的觀測量數(shù),例如圖10所示的從582個觀測量中隨機抽取300個觀測量。 圖10Base on time or case range為指定抽取。單擊Range按鈕,將出現(xiàn)如圖11所示的指定范圍抽取對話框。 First case和Last case分別表示從第幾個觀測量到第幾個觀測量,確定范圍后將看到所指定范圍內(nèi)的觀測量被選中,例如選取從第100400的觀測量。圖11Us
15、e filter variable為過濾抽取,可以指定某一個變量作為過濾器變量,指定變量對應(yīng)各個觀測量的值如果為0,則表示該個案未被選中;不為0則表示選中。二、SPSS在描述性統(tǒng)計中的應(yīng)用描述性統(tǒng)計一般包括數(shù)據(jù)的頻數(shù)(率)分析、數(shù)據(jù)分布的集中趨勢和離散程度的分析,以及數(shù)據(jù)分布的偏斜度和峰度分析等。在SPSS的主菜單Analyze下的Descriptive statistics就可以完成對數(shù)據(jù)的描述性統(tǒng)計分析。(一) 描述性統(tǒng)計分析的步驟利用頻數(shù)分布表可以方便地對數(shù)據(jù)按組進行歸類整理,形成各變量的不同水平(分組)的頻數(shù)分布表和圖形,以便對各變量的數(shù)據(jù)特征和觀測量分布狀況有一個概括的認識。描述性統(tǒng)
16、計分析的步驟如下: 1.按AnalyzeDescriptive statisticsFrequencies順序逐一單擊按鈕,打開Frequencies頻數(shù)分布對話框。2.在左側(cè)的源變量框中選擇一個或多個變量,通過箭頭按鈕選入右側(cè)的Variable(s)框中。3.選中Display frequency table,將顯示頻數(shù)分布表。4.單擊Statistics按鈕,打開Frequency:Statistics對話框,在對話框中確定將要在輸出結(jié)果中出現(xiàn)的統(tǒng)計量。(1)Percentile Values為百分數(shù)值欄,選擇該欄中的選擇項,將輸出百分位數(shù)。其中Quartiles為輸出四分位數(shù),顯示25、
17、50和75的百分位數(shù);Cut points for equal groups是將數(shù)據(jù)平分為所設(shè)定的相等等分,在參數(shù)框所設(shè)置的數(shù)值范圍必須是2100間的整數(shù);Percentile(s)是由用戶定義的百分位數(shù),在參數(shù)框中鍵入數(shù)值的范圍在0100。(2)Central Tendency為集中趨勢欄,選擇該欄中的選擇項,將輸出集中趨勢統(tǒng)計量。其中Mean為算術(shù)平均數(shù);Median為中位數(shù);Mode為眾數(shù);Sum為算術(shù)和。(3)Dispersion為離散程度欄,選擇該欄中的選擇項,將輸出離散程度統(tǒng)計量。其中Std.Deviation為標準差;Variance為方差;Range為全距,即最大值與最小值之差
18、;Minimum為最小值;Maximum為最大值;S.E.mean為均值的標準誤。(4)Distribution為分布狀態(tài)欄,其中Skewness為正態(tài)分布的偏度,同時顯示偏度的標準誤;Kurtosis為正態(tài)分布的峰度,也同時顯示峰度的標準誤。(5)選中Values are group midpoints復(fù)選項,是在計算百分位數(shù)值或中位數(shù)時,假設(shè)數(shù)據(jù)已經(jīng)分組,且用各組的組中值代表各組數(shù)據(jù)。5.單擊Charts按鈕,展開Frequency:Chart對話框。在對話框中對圖形的類型及坐標軸等進行設(shè)置。(1)Chart type為選擇圖形類型欄。其中None為不輸出圖形,這是系統(tǒng)默認選項;Bar C
19、harts為輸出條形圖;Pie Charts為輸出餅圖;Histograms為輸出直方圖,這一選項只適用于連續(xù)的數(shù)值型變量。如果選擇了直方圖還可以選擇With normal curve,即輸出直方圖并帶有正態(tài)曲線。(2)Chart value欄,是指縱軸表達的統(tǒng)計量,只有選擇了條形圖和餅圖的選項才有效。其中Frequencies選項,縱軸表示頻數(shù);Percentage選項,縱軸表示百分比。6.單擊Format按鈕,打開Frequencies:Format對話框,在對話框中設(shè)置頻數(shù)表輸出的格式。(1)Order by為排序欄,在該欄中選擇頻數(shù)表中排列順序。其中Ascending Values選項
20、,按變量實際值的升序排列,這是系統(tǒng)默認的排列方式;Descending Values選項,按變量實際值的降序排列;Ascending counts選項,按變量各種取值發(fā)生的頻數(shù)的升序排列;Descending counts選項,按變量各種取值發(fā)生的頻數(shù)的降序排列。(2)Multiple Variables為多變量欄,選擇多變量輸出表格設(shè)置。其中Compare variables選項,將所有變量的結(jié)果在一個圖形中輸出,以便比較;Organize output by variable選項,為每一個變量單獨輸出一個圖像。(3)選中Suppress tables with more than cate
21、gories復(fù)選項,是控制頻數(shù)表輸出的分類數(shù)量。在參數(shù)框中的系統(tǒng)默認值為10。7.提交運行。所有選擇完成后,單擊OK按鈕提交運行,進行頻數(shù)分布分析。Reset按鈕為重新設(shè)置選擇項,Cancel按鈕為取消選擇設(shè)置并關(guān)閉對話框。Help按鈕可以獲得幫助信息,Paste按鈕可以將有關(guān)所設(shè)定的統(tǒng)計過程以及選擇項的語句粘貼到Syntax窗口中。(二)描述性統(tǒng)計分析的實例分析表2為某機關(guān)2008年回復(fù)107件群眾來信所用的天數(shù),請對表中數(shù)據(jù)進行描述性統(tǒng)計分析。表2 2008年××局回復(fù)群眾來信所用的天數(shù)916108129141571982110503794284491883971415
22、7284796724104179296412791539249220311893386371620269916531236118628358101120310168124691010916414118581197611978109111.在SPSS中錄入表2中的數(shù)據(jù),建立數(shù)據(jù)文件。在主菜單中選擇AnalyzeDescriptive statisticsFrequencies,打開Frequencies主對話框,如圖12所示。 圖122.將左側(cè)源變量框中的X即“回復(fù)群眾來信所用的天數(shù)”選入Variable(s)框中,并選中Display frequency table。3.單擊Statistic
23、s按鈕,打開Statistics對話框,做出如圖13所示的選擇,并單擊Continue。圖134.單擊Charts按鈕,打開Charts對話框,選中Histograms和With normal curve復(fù)選項,如圖14所示。圖145.在主對話框中,單擊OK按鈕,提交運行。輸出的主要結(jié)果如表3,表4和圖15所示。表3 描述性統(tǒng)計的Statistics表表4 描述性統(tǒng)計的頻數(shù)和頻率分布表 圖15 帶分布曲線的直方圖三、SPSS在相關(guān)分析中的應(yīng)用在主菜單Analyze的下拉菜單中的Correlate,包含了相關(guān)分析、偏相關(guān)分析和相似性測度。Bivariate是計算指定的兩個變量間的相關(guān)系數(shù),可以選
24、擇Pearson、Spearman和Kendall tau-b等相關(guān)系數(shù);Partial是計算兩個變量間在控制了其他變量的影響下的相關(guān)系數(shù),即偏相關(guān)系數(shù);Distance是對變量或觀測量進行相似性或不相似性測度。本文主要介紹SPSS在相關(guān)和偏相關(guān)分析中的應(yīng)用。(一) 雙變量相關(guān)分析的選項在菜單中按AnalyzeCorrelateBivarite順序逐一展開,打開Bivarite Correlation雙變量相關(guān)分析主對話框,如圖16所示。圖161、Correlation Coefficients是計算相關(guān)系數(shù)。主對話框中Correlation Coefficients欄中列出了三個相關(guān)系數(shù),對
25、應(yīng)著三種分析方法。其中Pearson(皮爾遜相關(guān))是系統(tǒng)默認設(shè)置,計算兩個定距(或定比)變量之間的積差相關(guān);Kendalls tau-b(肯德爾-b相關(guān))是計算分類變量間的秩相關(guān);Spearman(斯皮爾曼相關(guān))是計算兩個定序變量或一個定序與一個定距(或定比)變量之間的秩相關(guān)。2、Test of Significance是選擇顯著性檢驗類型。其中Two-tailed雙尾檢驗選項為系統(tǒng)默認設(shè)置,如果事先不知道相關(guān)方向(正相關(guān)還是負相關(guān))時選擇此項;One-tailed單尾檢驗選擇,如果事先知道相關(guān)方向可以選擇此項。3、Flag significant correlations復(fù)選項,選中此項為系
26、統(tǒng)默認設(shè)置,輸出結(jié)果中在相關(guān)系數(shù)右上方使用“*”表示其顯著性水平為5;用“*”表示其顯著性水平為1。4、Options選項。單擊Options按鈕,打開Options對話框,如圖17所示。在Statistics欄中有兩個有關(guān)統(tǒng)計量的選項,但只有在主對話框中選擇Pearson相關(guān)時才可以選擇這兩個選項。其中,Means and standard deviations為均值和標準差復(fù)選項;Cross-product deviations and covariances為積差離差陣和協(xié)方差離差陣復(fù)選項。在Missing value欄中有兩個關(guān)于缺失值處理方法的選項,其中Exclude cases p
27、airwise選項為系統(tǒng)默認選項,是僅剔除正在參與計算的兩個變量值是缺失值的觀測量。這樣有可能相關(guān)系數(shù)矩陣中的相關(guān)系數(shù)是根據(jù)不同數(shù)量的觀測量計算出來的;Exclude cases listwise選項,是剔除在主對話框中Variables矩形框中列出的變量帶有缺失值的所有觀測量。這樣計算出的相關(guān)系數(shù)矩陣,每個相關(guān)系數(shù)都是依據(jù)相同數(shù)量的觀測量計算出來的。圖17(二)雙變量Pearson相關(guān)的實例分析表5是關(guān)于我國19912002年的人均GDP和嬰兒死亡率的統(tǒng)計數(shù)據(jù),試分析兩變量之間的相關(guān)關(guān)系。表5 19912002年的人均GDP和嬰兒死亡率年份嬰兒死亡率人均GDP1991199219931994
28、1995199619971998199920002001200250.246.743.639.936.436.033.133.233.332.230.029.21879228729393923485455766054603865517086765181841、在SPSS中錄入原始數(shù)據(jù),建立SPSS數(shù)據(jù)文件。2、選擇AnalyzeCorrelateBivariate,打開Bivarite Correlation對話框。3、從左側(cè)源變量框中分別選擇“嬰兒死亡率(IMR)”和“人均GDP”進入右側(cè)的Variables欄。在Correlation Coefficients選中Pearson,Test
29、of Significance中選中Two-tailed。4、單擊OK按鈕,提交運行,輸出結(jié)果如表6所示。表6 Pearson相關(guān)分析輸出結(jié)果從輸出結(jié)果看,“嬰兒死亡率”和“人均GDP”兩變量之間的相關(guān)系數(shù)R0.980,p0.000,在0.01條件下達到統(tǒng)計顯著性相關(guān)。(三)偏相關(guān)分析的實例分析偏相關(guān)分析(Analysis of Partial Correlation)是在研究兩個變量之間的線性相關(guān)關(guān)系時控制可能對其產(chǎn)生影響的其他變量。表7為20個地區(qū)出口商品、國內(nèi)生產(chǎn)總值和實際利用外資的統(tǒng)計數(shù)據(jù)。表7 偏相關(guān)分析的原始數(shù)據(jù)表地區(qū)出口商品(億美元)國內(nèi)生產(chǎn)總值(億元)實際利用外資(萬美元123
30、4567891011121314151617181920205.6926208.517593.392640.344713.5447189.135117.147536.8069735.0526874.9423581.385439.3681293.947619.9475358.445241.746433.821931.06431915.7123.85596060.283110.978477.633571.373041.076672.03122.014750.68072.8315003.611648.74759.325763.353456.715021.848553.795633.245641.94
31、18864.623433.5255974.0172091.069954.09022.034297.0540677.019237.033917.0631087.0894830.0573256.042850.0192384.0204487.0866423.042211.0174441.0141803.01001158.029579.01、在SPSS中錄入原始數(shù)據(jù),建立SPSS數(shù)據(jù)文件。2、在菜單中按AnalyzeCorrelateBivariate逐一展開,打開Bivarite Correlation對話框,計算“出口商品總值”和“國內(nèi)生產(chǎn)總值”的Pearson相關(guān)系數(shù)。輸出結(jié)果如表8所示。表8
32、Pearson相關(guān)分析輸出結(jié)果從輸出結(jié)果看,“出口商品總值”和“國內(nèi)生產(chǎn)總值”之間的相關(guān)系數(shù)R0.826,p0.000,表明兩變量之間具有高度的統(tǒng)計顯著性相關(guān)。3、選擇AnalyzeCorrelationPartial逐一展開,打開Partial Correlations的主對話框,將“實際利用外資金額”送入Controlling for欄,如圖18所示。圖184、單擊OK按鈕,提交運行。輸出結(jié)果如表9 所示。從輸出結(jié)果看,在控制了“實際利用外資金額”這一變量后,“出口商品總額”和“國內(nèi)生產(chǎn)總值”之間的偏相關(guān)系數(shù)僅為0.358,而且不具有統(tǒng)計顯著性意義。表9 偏相關(guān)系數(shù)輸出結(jié)果(四) 低測量層
33、次變量相關(guān)的實例分析表10為在一次問卷調(diào)查中得出的某機關(guān)工作人員職務(wù)級別與工作滿意度的交叉表,請分析職務(wù)級別與工作滿意度之間的關(guān)系,并進行統(tǒng)計顯著性檢驗。表10 某機關(guān)工作人員工作滿意度與職務(wù)級別的交叉表工作滿意度職務(wù)級別合計低中高低1502040210中3020140190高2016020200合計2002002006001、將工作滿意度設(shè)為變量X1,并賦值1,2,3分別表示工作滿意度低、中、高。職務(wù)級別設(shè)為變量X2,并賦值1,2,3分別表示職務(wù)級別為低、中、高。表10中的數(shù)據(jù)設(shè)為變量W,從而將表10轉(zhuǎn)換為表11所示的數(shù)據(jù)結(jié)構(gòu)表,并在SPSS中根據(jù)表11錄入數(shù)據(jù),建立數(shù)據(jù)文件。表11 交叉表
34、輸入的數(shù)據(jù)結(jié)構(gòu)X1X2WX1X2W1115023140122031201340321602130332022202、選擇DataWeight Cases,打開Weight Cases對話框,選中Weight cases by并將W輸入Frequency Variable框中,如圖19所示。圖193、選擇AnalyzeDescriptive StatisticsCrosstabs逐一展開,打開Crosstabs對話框。將X1 、X2分別輸入Row(s)和Column(s)。如圖20所示。圖204、單擊Statistics按鈕,打開Crosstabs Statistics對話框,如圖21所示。在這
35、個對話框中,可以對不同測量水平的變量進行不同的相關(guān)分析。Chi-square是進行卡方檢驗,Nominal是計算兩個定類變量的相關(guān)系數(shù),包括Contingency coefficient系數(shù)、Phi and Gramers V系數(shù)、Lambda系數(shù)和Uncertainty coefficient系數(shù)。Ordinal是計算兩個定序變量的相關(guān)系數(shù),包括Gamma系數(shù)、Somerss系數(shù)、Kendalls tau-b系數(shù)和Kendalls tau-c系數(shù)。Nominal by Interval是計算定類定距(定比)變量的Eta相關(guān)系數(shù)。Kappa相關(guān)系數(shù)用于分析兩個等級相同的定序變量的相關(guān);Risk
36、相關(guān)系數(shù)用于分析某時間與某因素之間聯(lián)系的一致性的相關(guān);McNemar相關(guān)系數(shù)用于檢驗兩個有關(guān)聯(lián)的二分變量之間聯(lián)系的相關(guān);Cochrans and Mantel-Haenzel statistics相關(guān)系數(shù)用于檢驗兩個獨立的二分變量之間聯(lián)系的相關(guān)分析。圖215、單擊OK按鈕,提交運行。輸出結(jié)果如表12-表14所示。從輸出結(jié)果看,“工作滿意度”與“職務(wù)級別”之間的Somersd系數(shù)為0.202,=0.253,且均具有統(tǒng)計顯著性意義。表12 輸出結(jié)果中的Chi-Square Tests(卡方檢驗)表表13 輸出結(jié)果中的Directional Measures表表14 輸出結(jié)果中的Symmetric
37、Measures表四、 SPSS在回歸分析中的應(yīng)用SPSS軟件中包含了Liner(線性回歸)、Curve Estimation(曲線回歸)、Logistic(邏輯斯蒂回歸)、Probit(概率單位回歸)、Nonlinear(非線性回歸)、Weight Estimation (加權(quán)估計)以及Optimal Scaling(最有編碼回歸)等回歸分析。本文主要介紹SPSS在一元線性回歸、多元線性回歸和曲線回歸中的應(yīng)用。(一) 一元線性回歸的實例分析表5是關(guān)于我國19912002年的人均GDP和嬰兒死亡率的統(tǒng)計數(shù)據(jù),在上文中已經(jīng)計算出兩個變量間R0.980,p0.000,在0.01條件下達到統(tǒng)計顯著性
38、相關(guān)。而從“人均GDP”和“嬰兒死亡率”的散點圖來看,兩變量表現(xiàn)出比較明顯的線性相關(guān)關(guān)系。如圖22所示。 圖22 兩變量的散點圖1、選擇菜單中AnalyzeRegressionLinear逐一展開,打開Linear Regression主對話框。 2、從左側(cè)的源變量框中選定“嬰兒死亡率”作為因變量,輸入Dependent框;選定變量“人均GDP”作為自變量,輸入Independent(s)框。如圖23所示。圖233、單擊OK按鈕,輸出結(jié)果如表15表17所示。表15是關(guān)于一元線性回歸模型的總體參數(shù)表,給出了復(fù)相關(guān)系數(shù)、決定性系數(shù)(復(fù)相關(guān)系數(shù)平方)、調(diào)整后的復(fù)相關(guān)系數(shù)平方,以及回歸的標準誤差(未解
39、釋的標準差)。決定性系數(shù)是指被解釋的方差(回歸平方和)占總方差(總平方和)的百分比,是對回歸模型擬合程度的綜合度量。決定性系數(shù)越大,模型擬合程度越高,回歸方程的解釋能力越強。從表15來看,該模型的決定性系數(shù)為0.961,說明一元線性回歸方程對總平方和的解釋能力達到96.1。表15 一元線性回歸的Model Summary表表16是關(guān)于一元線性回歸方程的方差分析表,給出了回歸平方和、殘差平方和、總平方和及其自由度,以及F統(tǒng)計量值及其顯著性水平。F檢驗是對回歸總體線性關(guān)系是否顯著的一種假設(shè)檢驗。根據(jù)表16輸出結(jié)果可知,F(xiàn)246.121,p0.0000.05,所以回歸方程的線性關(guān)系是顯著的。表16
40、一元線性回歸的ANOVA(b)表表17是關(guān)于一元線性回歸模型的回歸系數(shù)及其顯著性檢驗表,給出了常數(shù)項和自變量的非標準化的回歸系數(shù)和標準化的回歸系數(shù),以及t統(tǒng)計量值及其顯著性水平。從表17的輸出結(jié)果看,常數(shù)項的非標準化值為53.528,自變量的系數(shù)非標準化的值為-0.003,且t檢驗的p0.0000.05,所以自變量“人均GDP”對因變量“嬰兒死亡率”具有顯著的影響。表17 一元線性回歸的Coefficients(a)表由此可知,以“嬰兒死亡率”為因變量,“人均GDP”為自變量的一元線性回歸方程為:y53.5280.003x(二)多元線性回歸的實例分析表18是19902003年出國回國人數(shù)及相關(guān)
41、指標的統(tǒng)計數(shù)據(jù),試建立以“回國人員”為因變量的多元線性回歸方程。表18 19902003年出國回國人數(shù)及相關(guān)指標的統(tǒng)計數(shù)據(jù)年份出國人數(shù)回國人數(shù)高校在校生人數(shù)科技投入(億元)GDP(億元)醫(yī)療機構(gòu)數(shù)1990199119921993199419951996199719981999200020012002200329502900654010742190712038120905224101762223749389898397312517911730715932069361151284230575065707130737977489121122431794520152206320442184253627
42、992906302131743409413455617191903411086139.12160.69189.26225.61268.25302.36348.63408.86438.6543.85575.62703.26816.22975.5418598.421662.526651.934560.546670.057494.966850.573142.776967.280579.488228.195727.9103935.3116603.2208734209036204787193586191742190057322566315033314097310996324771330348306038
43、2913231、在SPSS中錄入數(shù)據(jù),建立數(shù)據(jù)文件。定義“回國人數(shù)”為因變量Y,其他變量為自變量x1、x2、x3和x4。如圖24所示。圖242、在Method框中選擇一種回歸分析方法,在本例中選擇Stepwise,如圖24所示。(1)Enter為強行進入法,即所選擇的自變量全部進入回歸模型,該選擇是默認方式。(2)Remove為消去法,建立回歸方程時,根據(jù)設(shè)定的條件剔除部分自變量。(3)Forward為向前選擇法。根據(jù)在Option對話框中所設(shè)定的判據(jù),從無自變量開始。在擬合過程中,對被選擇的自變量進行方差分析,每次加入一個F值最大的變量,直至所有符合判據(jù)的變量都進入模型為止。第一個引入回歸模
44、型的變量應(yīng)該與因變量間相關(guān)系數(shù)絕對值最大。(4)Backward為向后提出法。根據(jù)在Option對話框中所設(shè)定的判據(jù),先建立全模型,然后根據(jù)設(shè)置的判據(jù),每次剔除一個F值最小的自變量,直至回歸方程中不再含有不符合判據(jù)的自變量為止。(5)Stepwise為逐步進入法,它是向前選擇變量法和向后剔除變量法的結(jié)合。根據(jù)在Option對話框中所設(shè)定的判據(jù),首先根據(jù)方差分析結(jié)果選擇符合判據(jù)的自變量且對因變量貢獻最大的進入回歸方程,根據(jù)向前選擇變量法選入變量,然后根據(jù)向后剔除法,將模型中F值最下的且符合剔除判據(jù)的變量剔除出模型,重復(fù)進行直到回歸方程中的自變量均進入模型的判據(jù),模型外的自變量都不符合進入模型的判
45、據(jù)為止。3、單擊Statistics按鈕,打開Statistics對話框,做出如圖25所示的選項。(1)Regression Coefficients是有關(guān)回歸系數(shù)的選擇欄,其中Estimates是輸出回歸系數(shù)B、B的標準誤、標準回歸系數(shù)、B的T值以及T值的雙側(cè)檢驗的顯著性水平sig.;Confidence intervals是輸出每一個非標準化回歸系數(shù)95的置信區(qū)間;Covariance matrix是輸出非標準化回歸系數(shù)的協(xié)方差矩陣、各變量的相關(guān)系數(shù)矩陣。(2)與模型擬合及其擬合效果有關(guān)的選擇項。其中Model fit是輸出引入模型與從模型中剔除的變量,提供復(fù)相關(guān)系數(shù)R,復(fù)相關(guān)系數(shù)平方R2
46、,及其修正值,估計值的標準誤,ANOVA方差分析表;R Square change是表示當回歸方程中引入或剔除一個自變量后R2的變化量。如果R2ch較大,那么說明進入和剔除回歸方程的自變量有可能是一個較好的回歸變量。選擇此項輸出R2ch、Fch、Sigch;Descriptive是輸出合法觀測量的數(shù)目,變量的平均數(shù)、標準差、相關(guān)系數(shù)矩陣和單側(cè)檢驗顯著性水平矩陣;Part and partial correlation是輸出部分相關(guān)系數(shù)(表明當一個自變量進入回歸方程后,R2增加了多少)、偏回歸系數(shù)(表明排斥了其他自變量對Y的影響后,與因變量Y的相關(guān)程度)與零階相關(guān)系數(shù)(變量之間的簡單相關(guān)系數(shù));
47、Collinearity diagnostics是輸出各變量的容限公差以及共線性診斷表。(3)Residuals為有關(guān)殘差分析的選擇項欄。其中Durbin-Watson是輸出Durbin-Watson統(tǒng)計量以及可能是奇異值的診斷表;Casewise diagnostics是輸出觀測量診斷表,診斷表既可以通過Outliers outside standard deviation選項,設(shè)置奇異值的判據(jù),系統(tǒng)默認值為3倍標準差,也可以選中All cases項,輸出所有觀測量的殘差值。圖254、單擊OK按鈕,提交運行,輸出結(jié)果如表19表22所示。表19是匯報運用Stepwise方法過程中被引入和剔除的
48、變量,第一列Model是回歸方程編號;第二列Variables Entered為引入回歸方程的自變量名稱;第三列Variables Removed為從回歸方程中被剔除的自變量名稱;第四列Method為自變量進入與被剔除回歸方程的判據(jù)。從表19看,在Model 1中,只進入一個自變量x1即“高校在校生人數(shù)”,在Model 2中,除了x1,還進入了x3即“GDP總量”。表19 多元線性回歸的Variables Entered/Removed表表20是多元回歸方程的常用統(tǒng)計量,第二列R為復(fù)相關(guān)系數(shù),第三列R Square即R2系數(shù)為決定性系數(shù)。隨著自變量個數(shù)的增加,R2系數(shù)的值隨之增加,但這并不意味
49、著自變量越多,模型的擬合度越好。第四列Adjusted R Square即修正R2系數(shù),為了盡可能地確切反映模型的擬合度,該參數(shù)試圖修正R2系數(shù)的偏差,修正R2系數(shù)未必隨自變量個數(shù)的增加而增加。第五列Std.Error of the Estimate為估計的標準誤,增加自變量的個數(shù)將增大R2系數(shù),但未必會減少估計的標準誤。在建立多元線性回歸方程時,除非必要,自變量數(shù)目不應(yīng)太多,因為一個包含多余自變量的模型可能會增加標準誤差。從表20看,兩個Model的R2系數(shù)以及修正的R2系數(shù)都表明,回歸方程存在高度線性相關(guān)。第六列Durbin-Watson是對回歸模型中的誤差項進行獨立性檢驗,Dw的取值范圍
50、是0 4,當殘差與自變量互為獨立時,Dw2;當相鄰兩點的殘差為正相關(guān)時,Dw2;當相鄰兩點的殘差為負相關(guān)時,Dw2。表20表明Dw1.613,比較接近于2,說明殘差項基本符合獨立性假設(shè)。表20 多元線性回歸的Model Summary表表21顯示回歸擬合過程中每一步的方差分析結(jié)果。Sum of Square為回歸平方和(Regression)、殘差平方和(Residual)和總平方和(Total);df為自由度。從表21看,Model 1和Model 2均通過了F檢驗,即在兩個回歸方程中,自變量對因變量的影響都是顯著的。表21 多元線性回歸的AVOVA(b)表表22是多元回歸方程的系數(shù)表,Un
51、standardized Coefficients為非標準化系數(shù),Standardized Coefficients為標準化系數(shù),t檢驗為偏回歸系數(shù)(或常數(shù)項)為0的假設(shè)檢驗的t值,Sig.為偏回歸系數(shù)(或常數(shù)項)為0的假設(shè)檢驗的顯著性水平值,Collinearity Statistics為共線性統(tǒng)計量,其中Tolerance為容忍度,VIF為方差膨脹因子。表22 多元線性回歸的Coefficients(a)表需要說明的是,偏回歸系數(shù)B是在控制了其他變量之后得到的。它的不足之處在于,當自變量的單位不一致時,比較它的大小沒有任何意義。也就是說只有當所有的自變量單位統(tǒng)一時,偏相關(guān)系數(shù)才有可比性。但在比較時還應(yīng)注意,在多元回歸分析中,方差分析是對整個回歸方程的顯著性檢驗,它與單獨地進行每一個偏回歸系數(shù)的顯著性檢驗不一定等效,就是說,由方差分析得出回歸方程有統(tǒng)計意義,而回歸方程的每一個偏回歸系數(shù)不一定都有顯著性,但至少有一個是顯著的。根據(jù)上
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第10課 《三峽》教學設(shè)計-2024-2025學年八年級語文上冊全新菜單型章節(jié)式同步備課(統(tǒng)編版)
- 第二單元活動4《保障信息安全》教學設(shè)計 2023-2024學年安徽版(2018)初中信息技術(shù)七年級上冊
- 第1課《初探數(shù)字化》教學設(shè)計 2023-2024學年 浙教版四年級下冊信息科技
- 第13課 現(xiàn)代交通運輸?shù)男伦兓?教學設(shè)計-2024-2025學年高中歷史統(tǒng)編版(2019)選擇性必修2
- 10 我們不亂扔 第二課時 教學設(shè)計-2024-2025學年道德與法治二年級上冊統(tǒng)編版
- 6《千人糕》教學設(shè)計-2023-2024學年統(tǒng)編版語文二年級下冊
- 第5課 古代非洲與美洲 教學設(shè)計-2023-2024學年高中歷史統(tǒng)編版(2019)必修中外歷史綱要下
- 高中信息技術(shù)浙教版:5-1 數(shù)據(jù)結(jié)構(gòu)與算法效率-教學設(shè)計
- Unit7 Whats the highest mountain in the world Section B 2a-2e Reading(教學設(shè)計) 2023-2024學年人教新目標八年級英語下冊
- 高中信息技術(shù)教科版必修教學設(shè)計- 5.1.2音頻信息的加工
- -情景交際-中考英語復(fù)習考點
- 安全隱患報告和舉報獎勵制度
- 地理標志培訓課件
- 2025年高壓電工作業(yè)考試國家總局題庫及答案(共280題)
- 2023行政主管年終工作報告五篇
- 印刷公司生產(chǎn)部2025年年度工作總結(jié)及2025年工作計劃
- 2025年中考語文一輪復(fù)習:八年級下冊知識點梳理
- GA/T 1003-2024銀行自助服務(wù)亭技術(shù)規(guī)范
- 糖尿病的麻醉管理
- 《商務(wù)溝通-策略、方法與案例》課件 第四章 非言語溝通
- 《金融衍生品》課件
評論
0/150
提交評論