




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第四章 數(shù)據(jù)特征的描述統(tǒng)計(jì)分析9/13/20221SPSS的主要分析工具Analyze菜單報(bào)告Reports描述性統(tǒng)計(jì)分析Descriptive Statistics菜單表格Tables均值間的比較Compare Means菜單一般線性模型General Linear Model菜單相關(guān)分析Correlate菜單多元線性回歸與曲線擬合 Regression菜單對(duì)數(shù)線性模型Loglinear菜單聚類分析與判別分析Classify菜單因子分析與對(duì)應(yīng)分析Data Reduction菜單信度分析與多維尺度分析Scale菜單非參數(shù)檢驗(yàn)Nonparametric Tests菜單時(shí)間序列分析Time ser
2、ies 9/13/20222 描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第一步,做好這第一步是下面進(jìn)行正確統(tǒng)計(jì)推斷的先決條件。SPSS的許多模塊均可完成描述性分析,但專門為該目的而設(shè)計(jì)的幾個(gè)模塊則集中在Descriptive Statistics菜單中,包括:Frequencies:頻數(shù)分析過程,特色是產(chǎn)生頻數(shù)表(主要針對(duì)分類變量)Descriptives:數(shù)據(jù)描述過程,進(jìn)行一般性的統(tǒng)計(jì)描述(主要針對(duì)數(shù)值型變量)Explore:數(shù)據(jù)探察過程,用于對(duì)數(shù)據(jù)概況不清時(shí)的探索性分析Crosstabs:多維頻數(shù)分布交叉表分析(列聯(lián)表分析)Ratio statistics:比率分析9/13/20223第一節(jié) 報(bào)告分析(R
3、eport)第二節(jié) 描述性統(tǒng)計(jì)分析第三節(jié) 比率分析第四節(jié) Means過程第五節(jié) 多選項(xiàng)分析主要內(nèi)容9/13/20224第一節(jié) 報(bào)告分析(Report)1、OLAP 在線分析處理過程2、Case Summaries 個(gè)案匯總分析過程3、報(bào)告摘要分析過程Report Summaries in Rows 行形式摘要報(bào)告Report Summaries in Columns 列形式摘要報(bào)告9/13/20225按AnalyzeReportsOLAP Cubes順序單擊打開如下對(duì)話框:摘要變量框:進(jìn)入此框變量為數(shù)值型變量分層變量框:進(jìn)入此框變量為數(shù)值型或字符型變量1、OLAP(在線分析處理過程)9/13/
4、20226可選擇的統(tǒng)計(jì)量:Sum 總和Number of Cases 個(gè)案數(shù)目Mean 均值 Standard Deviation 標(biāo)準(zhǔn)差Percent of Total Sum 占總和的百分比Percent of Total N 占觀察量總數(shù)的百分比Median 中位數(shù)Grouping Median 分組中位數(shù)Std.Error of Mean 均值標(biāo)準(zhǔn)誤Minimum 最小值Maximum 最大值Range 極差First 首值Last 尾值Variance 方差 Skewness 偏度Std.Error of Skewness 偏度的標(biāo)準(zhǔn)誤Kurtosis 峰度Std.Error of
5、Kurtosis 峰度的標(biāo)準(zhǔn)誤Harmonic Mean 調(diào)和平均數(shù)Geometric Mean 幾何平均數(shù)9/13/20227標(biāo)題對(duì)話框輸入統(tǒng)計(jì)量的標(biāo)題 輸入注解,這些注解將顯示在統(tǒng)計(jì)量輸出欄的下面04-1 下面舉例說明9/13/2022830名少兒身高數(shù)據(jù) 表4-19/13/20229(1)操作步驟:1)按AnalyzeReportsOLAP Cubes順序單擊打開OLAP Cubes對(duì)話框2)打開數(shù)據(jù)文件“少兒身高.sav”,將height變量選入Summary Variable框中,將sex變量作為分組變量選入Grouping Variable 框中;3)單擊Statistics按鈕,
6、在 Statistics框中選擇Sum、Mean、Median項(xiàng)作為要輸出的統(tǒng)計(jì)量;4)單擊Title按鈕,在Title框中輸入“少兒身高分層報(bào)告”,單擊Continue返回;單擊OK9/13/2022109/13/202211表4-3 個(gè)案處理摘要 表4-2說明個(gè)案的一些基本情況,包括總個(gè)數(shù)、有效值個(gè)數(shù)和缺省值個(gè)數(shù)。表4-3是分層報(bào)告,輸出了總和、均值和中位數(shù)。 表4-2(2)輸出結(jié)果及分析9/13/2022122 、個(gè)案匯總分析過程、主要功能 計(jì)算指定變量的分組統(tǒng)計(jì)量,分組變量可能是一個(gè),也可以有多個(gè)。如是多個(gè),則將所有水平進(jìn)行交叉分組。每個(gè)組中,變量值可以顯示或不顯示。、個(gè)案匯總分析 按
7、AnalyzeReportsCase Summaries順序單擊打開Case Summaries 對(duì)話框。9/13/202213可在參數(shù)框中輸入數(shù)值,該數(shù)值表示分析過程只對(duì)前幾個(gè)個(gè)案進(jìn)行帶有缺省值的個(gè)案不被顯示在列出個(gè)案的同時(shí),顯示個(gè)案的序號(hào)分組變量:可選擇一個(gè)或多個(gè)待分析變量:數(shù)值型或字符型變量。Summarize Cases 對(duì)話框見下圖9/13/202214輸入腳注在輸出結(jié)果中顯示各分組統(tǒng)計(jì)量的標(biāo)題在分析過程中剔除帶有缺失值的個(gè)案鍵入一個(gè)字符以便在輸出結(jié)果中標(biāo)記缺失值輸入標(biāo)題、例題分析: 對(duì)表4-1資料(數(shù)據(jù)文件為“04-1少兒身高.sav”)進(jìn)行個(gè)案匯總分析。Options 對(duì)話框9/
8、13/202215 1)打開數(shù)據(jù)文件“04-1少兒身高.sav” 2)打開Case Summaries對(duì)話框,將height選入 Variables框中,作為匯總分析的變量,將sex和grade選入Grouping Variables框中作為分組變量。 3)清除Display cases復(fù)選框。 4)單擊Statistics按鈕,在 Statistics框中選擇Number of cases、Mean、Median項(xiàng)作為要輸出的統(tǒng)計(jì)量;單擊Continue返回。 5)單擊OK(1)操作步驟9/13/2022169/13/202217表4-4 個(gè)案處理摘要 表4-4說明個(gè)案的總個(gè)數(shù)、有效值個(gè)數(shù)和
9、缺省值個(gè)數(shù)以及各占的百分比。(2)輸出結(jié)果及分析9/13/202218分組統(tǒng)計(jì)量 表4-5分三部分,1、男生身高的基本統(tǒng)計(jì)量,2、女生身高的基本統(tǒng)計(jì)量,3、全部身高的基本統(tǒng)計(jì)量。在每部分中又包括分年級(jí)進(jìn)行的統(tǒng)計(jì)和總的統(tǒng)計(jì),這就是交叉分組。 表4-59/13/202219、主要功能 把個(gè)案的統(tǒng)計(jì)結(jié)果用一種簡(jiǎn)單扼要的表格輸出,有助于更好地把握數(shù)據(jù)的分布特征。、行形式報(bào)告摘要按AnalyzeReportsReport Summaries in Rows順序,打開 Summaries in Rows 對(duì)話框。3、報(bào)告摘要分析過程9/13/2022209/13/202221輸入變量的列標(biāo)題,不輸入則將輸
10、出變量的標(biāo)簽或名稱選擇列標(biāo)題對(duì)齊的方式選擇變量值所處的位置以縮進(jìn)的形式輸出,可輸入縮進(jìn)數(shù)值;變量值位于列中央鍵入列寬數(shù)值,如不設(shè)列寬,則:如輸出數(shù)值標(biāo)簽,則列寬為數(shù)值標(biāo)簽中的最長(zhǎng)者;如輸出變量值,則列寬為變量所定義的寬度;如設(shè)置了列標(biāo)題,則列寬為標(biāo)題的最長(zhǎng)者;如未設(shè)置列標(biāo)題,則列寬為輸出的變量標(biāo)簽的最長(zhǎng)者。選擇輸出的內(nèi)容:將輸出變量值將輸出變量標(biāo)簽Format 對(duì)話框9/13/202222輸出列變量之和。輸出列變量的均值。輸出列變量中的最小值。輸出列變量中的最大值。輸出列變量中個(gè)案的數(shù)目。輸出列變量中高于Value框中設(shè)定值的個(gè)案占總數(shù)的百分比輸出列變量中低于Value框中設(shè)定值的個(gè)案占總數(shù)的
11、百分比輸出列變量中位于Low和Hight框中設(shè)定值之間的個(gè)案占總數(shù)的百分比輸出標(biāo)準(zhǔn)差。輸出輸出峰度。輸出方差。輸出偏度。Summary對(duì)話框9/13/202223Report欄的Option 對(duì)話框進(jìn)行缺失值和輸出頁(yè)碼的設(shè)置:剔除帶有缺失值的觀測(cè)量輸入一個(gè)代表系統(tǒng)的和用戶的缺失值字符設(shè)置報(bào)告的起始頁(yè)碼可進(jìn)行頁(yè)面設(shè)置:可輸入分組變量間的間距行數(shù)(不超過20)每個(gè)分組變量都在新的一頁(yè)輸出在新的一頁(yè)輸出下一個(gè)分組變量,并接著上一頁(yè)的頁(yè)碼輸出下一頁(yè)的頁(yè)碼輸入設(shè)置分組標(biāo)題和報(bào)告內(nèi)容之間的間距,最多可插入20行空白Break Column 中的Options對(duì)話框9/13/202224所輸數(shù)值表示報(bào)告的每
12、一頁(yè)輸出從第幾行開始所輸數(shù)值表示報(bào)告的每一頁(yè)輸出在第幾行結(jié)束規(guī)定每一頁(yè)輸出的左邊間距規(guī)定每一頁(yè)輸出的右邊間距選擇報(bào)告輸出內(nèi)容的對(duì)齊方式設(shè)置頁(yè)面的標(biāo)題、腳注和頁(yè)面的距離:設(shè)置標(biāo)題與報(bào)告的距離設(shè)置注腳與報(bào)告的距離決定分組變量顯示的位置:所有的分組變量值均位于第一列,激活I(lǐng)ndent an each break參數(shù)框在此框中設(shè)置分類變量值縮進(jìn)的位置。默認(rèn)為2空格設(shè)置列標(biāo)題的輸出格式:在標(biāo)題下添加下劃線設(shè)置列標(biāo)題下的空白行(默認(rèn)為2)選擇列標(biāo)題的對(duì)齊方式設(shè)置分組變量的顯示位置:顯示在統(tǒng)計(jì)量的上一行顯示于統(tǒng)計(jì)量的同一行,并覆蓋統(tǒng)計(jì)量標(biāo)題設(shè)置分組變量與統(tǒng)計(jì)量之間的空白行數(shù)Report欄的Layout對(duì)話框
13、9/13/202225按Next進(jìn)入下一行的設(shè)置,按 Previous返回上一行對(duì)齊方式選擇特殊變量的值作為標(biāo)題與注腳在此對(duì)話框可規(guī)定標(biāo)題與注腳的輸出內(nèi)容和格式,最多可設(shè)置10行Report欄的Titles 對(duì)話框9/13/202226、列形式報(bào)告摘要列形式報(bào)告摘要與行形式報(bào)告摘要不同之處在于:行形式報(bào)告摘要中匯總統(tǒng)計(jì)量位于行上,而列形式報(bào)告摘要中匯總統(tǒng)計(jì)量位于列上。按AnalyzeReportsReport Summaries in Columns 順序,打開Summaries in Columns 對(duì)話框。9/13/202227 Summaries in Columns對(duì)話框 將要分析的變
14、量選入此框,每選一個(gè)變量進(jìn)入框內(nèi),可以單擊Format按鈕,打開Format對(duì)話框(與前同),設(shè)置該變量輸出格式(其他方面設(shè)置見下圖)。9/13/2022281、Data Columns欄 1)Summary 對(duì)話框與行形式基本同,不同是只能選擇一個(gè)統(tǒng)計(jì)量 2) Format 對(duì)話框與行形式同 3) Insert Total按鈕按Summary按鈕,出現(xiàn)Summary對(duì)話框(如右)Insert Total按鈕的Summary 對(duì)話框至少挑選2個(gè)參與計(jì)算合計(jì)的變量,并將其移入右邊變量框。在Summaries in Columns 對(duì)話框中單擊Insert Total按鈕,新增Total變量9/1
15、3/202229 1)Options對(duì)話框(見下圖) 2)Format對(duì)話框與“行形式”同 3)Sort Sequence欄:確定分組變量升降排序規(guī)則 4)Data are already sorted復(fù)選框,已將分組變量排序2、Break Columns欄顯示每一類分組變量小計(jì)結(jié)果,在Label框中鍵入分組變量的標(biāo)簽在此欄中設(shè)置頁(yè)面:分組變量間的間距行數(shù),輸入值不超過20每個(gè)分組變量都在新的一頁(yè)輸出在新的一頁(yè)輸出下一個(gè)分組變量,并接著上一頁(yè)順序編寫頁(yè)碼在此欄中設(shè)置小計(jì)前的空白行數(shù)9/13/2022303、Preview復(fù)選框:只輸出報(bào)告的第一頁(yè),便于用戶預(yù)覽4、Report欄 Options
16、如下圖 Layout對(duì)話框與“行形式”同 Titles對(duì)話框與“行形式”同 Options對(duì)話框在每一頁(yè)的底部顯示該列的總和,在Label框中鍵入標(biāo)簽剔除帶有缺失值的個(gè)案輸入一個(gè)代表系統(tǒng)和用戶的缺失值的字符設(shè)置報(bào)告的起始頁(yè)9/13/202231將表4-1資料(數(shù)據(jù)文件“04-1少兒身高.sav”)進(jìn)行分析:先做行形式報(bào)告輸出,再做列形式報(bào)告輸出。(1)單個(gè)分組變量的行形式報(bào)告按AnalyzeReportsReport Summaries in Rows順序,打開Summaries in Rows 對(duì)話框。挑height變量進(jìn)入Data框,grade變量進(jìn)入Break框。單擊Break Colu
17、mns欄的 Summary按鈕,打開 Summary Lines for grade對(duì)話框,選中Mean of Values、Number of Cases復(fù)選框,再按Continue返回 Summaries in Rows對(duì)話框。選中Display cases復(fù)選框。單擊Titles 按鈕,打開Titles對(duì)話框,在標(biāo)題欄的Center 框中輸入標(biāo)題“少兒身高分組統(tǒng)計(jì)”,再按返回。單擊“OK”完成,輸出結(jié)果見表46。、例題分析9/13/2022329/13/202233個(gè)案分組報(bào)告 少兒身高分組統(tǒng)計(jì) 年級(jí) 身高- -四年級(jí) 121.40 134.10 135.80 135.50 133.40
18、 140.30 120.90 141.40Mean 132.85N 8五年級(jí) 131.50 132.60 140.40 137.40 128.20 129.00 129.30 132.70 130.10 139.70 133.00 124.00 138.80 138.60MEAN 133.24N 14六年級(jí) 129.20 136.00 132.20 140.90 136.70 137.50 125.40 137.50Mean 134.42N 8列出了個(gè)案按年級(jí)分組后的匯總表 表4-69/13/202234打開Summaries in Rows 對(duì)話框,挑選height變量進(jìn)入Data框,sex
19、、grade變量進(jìn)入Break框。單擊 Summary按鈕,選中Standard deviation、 Kurtosis、Skewness等。選中Break 欄中的sex變量,單擊 Summary按鈕,選中Mean of Values、 Number of Cases、Minimum Value和 Maximum Value ,再按Continue返回 。選中Break 欄中的grade 變量,單擊 Summary按鈕,選中Mean of Values、 Number of Cases復(fù)選框,再按Continue返回 。單擊“OK”完成, 輸出結(jié)果見表4-7。(2)兩個(gè)分組變量的行形式報(bào)告9/
20、13/2022359/13/202236 少兒身高分組統(tǒng)計(jì)性別 年級(jí) 身高- - -男 四年級(jí) Mean 131.70 N 4 五年級(jí) Mean 132.63 N 7 六年級(jí) Mean 134.57 N 4Mean 132.90Minimum 121.40Maximum 140.90N 15女 四年級(jí) Mean 134.00 N 4 五年級(jí) Mean 133.84 N 7 六年級(jí) Mean 134.27 N 4Mean 134.00Minimum 129.90 Maximum 141.40N 15Grand Total Std.Dev 5.70Kurtosis -.29Skewness -.6
21、3表分為3部分:1.男生統(tǒng)計(jì)量表:各年級(jí)的均值和個(gè)數(shù),全體男生的均值、個(gè)數(shù)、最大值和最小值;2.女生統(tǒng)計(jì)量表:各年級(jí)的均值和個(gè)數(shù),全體女生的均值、個(gè)數(shù)、最大值和最小值;3.全體的統(tǒng)計(jì)量:標(biāo)準(zhǔn)差、偏度和峰度。 兩個(gè)分組變量的行形式報(bào)告 表4-79/13/202237(3)兩個(gè)分組變量的列形式報(bào)告打開Summaries in Columns 對(duì)話框,挑height變量進(jìn)入Data框;單擊Report 欄中的Options對(duì)話框,選中Display grand total復(fù)選框,再按Continue返回;單擊 Summary按鈕,選中Mean of Values,再按Continue返回。 先后挑選
22、sex、grade變量進(jìn)入Break框。單擊Titles 按鈕,打開Titles對(duì)話框,在標(biāo)題欄的Center 框中輸入標(biāo)題“少兒身高分組統(tǒng)計(jì)”,再按Continue返回。單擊“OK”完成, 輸出結(jié)果見表48。9/13/2022389/13/202239 少兒身高分組統(tǒng)計(jì) 身高性別 年級(jí) Mean_ _ _男 4 133.4 5 131.3 6 134.6女 5 134.0Grand Total 133.5表分為3部分:1.男生的均值表,按各年級(jí)算出均值;2.女生的均值表,按各年級(jí)算出均值;3.全體的均值。兩個(gè)分組變量的列形式報(bào)告 表4-89/13/202240第二節(jié) 描述性統(tǒng)計(jì)分析(Desc
23、riptive Statistics)1、 Frequencies 頻數(shù)分析表2、 Descriptive 描述性統(tǒng)計(jì)分析過程3、 Explore 探索分析過程4、 Crosstabs 列聯(lián)表分析過程9/13/2022411、頻數(shù)分析表、主要功能 可對(duì)數(shù)據(jù)按組進(jìn)行歸類整理,形成變量不同水平的頻數(shù)分布表和圖形,對(duì)數(shù)據(jù)的分布趨勢(shì)進(jìn)行初步分析。、頻數(shù)分析 按Analyze-Descriptive Statistics-Frequencies順序,打開Frequencies對(duì)話框。9/13/202242將一個(gè)或多個(gè)變量向右移入Variable(s)框。按Statistics按鈕,打開Statistic
24、s對(duì)話框顯示頻數(shù)分布表按Chart按鈕,打開Chart 對(duì)話框按Format按鈕,打開Format 對(duì)話框 Frequences主對(duì)話框9/13/202243 輸出百分位數(shù):輸出四分位數(shù),顯示25%、50%、75%的百分位數(shù);將數(shù)據(jù)平均分為所設(shè)定的相等等份,可輸入2100 的整數(shù),如鍵入4則輸出第25、50、75百分位數(shù)自定義百分位數(shù),可輸入0100 的整數(shù)。輸入值后: 按Add:輸入值后按此鍵,可反復(fù)操作鍵入多個(gè)百分位數(shù); 按Remove:刪除已鍵入的數(shù)值 按Change:重新輸入新數(shù)離散趨勢(shì)欄分布形狀欄在計(jì)算百分位數(shù)值和中位數(shù)時(shí),假設(shè)數(shù)據(jù)已分組,且用各組的組中值代替各組數(shù)據(jù)集中趨勢(shì)欄輸出統(tǒng)
25、計(jì)量對(duì)話框9/13/202244Chart 對(duì)話框不輸出任何圖形,為默認(rèn) 輸出條形圖,各條高度代表變量各分類的頻數(shù)輸出圓圖,圓圖中各塊的數(shù)值表示各分類變量的頻數(shù)輸出直方圖,此圖僅適用于區(qū)間型數(shù)值變量。選擇此項(xiàng)后,還可選擇With normal curve,畫出的直方圖帶有正態(tài)曲線只有選擇了條形圖和圓圖項(xiàng)才有效,決定縱軸表示的統(tǒng)計(jì)量縱軸表示頻數(shù)縱軸表示百分比9/13/202245Format 對(duì)話框控制頻數(shù)表輸出的分類數(shù)量,默認(rèn)為10。多變量框中可設(shè)定多變量表格輸出的格式設(shè)置頻數(shù)表輸出的格式選擇頻數(shù)表中排列順序按變量升序排列,此為默認(rèn)按變量降序排列按變量各種取值發(fā)生的頻數(shù)的升序排列按變量各種取值
26、發(fā)生的頻數(shù)的降序排列9/13/202246表49 100名大學(xué)生血清蛋白含量(%)、例題分析04-2對(duì)某高校100名大學(xué)生血清蛋白含量(g%)做頻數(shù)分析,數(shù)據(jù)如表49 9/13/202247(1)具體步驟打開數(shù)據(jù)文件“大學(xué)生血清.sav”,按AnalyzeDescriptive StatisticFrequencies 順序,打開Frequencies對(duì)話框。將變量xdh移入Variable(s)框,選中Display frequency tables復(fù)選框,要求輸出頻數(shù)分布表。單擊Statistics按鈕,選擇要輸出的統(tǒng)計(jì)量。單擊Chart 按鈕,選擇Histogram項(xiàng),輸出直方圖,并選擇
27、With normal curve復(fù)選框,輸出正態(tài)曲線。單擊Format 按鈕,選Ascending項(xiàng)。單擊“OK”完成。9/13/202248血清蛋白含量的直方圖 血清蛋白含量的統(tǒng)計(jì)表(2)輸出結(jié)果及分析9/13/202249血清蛋白含量的頻數(shù)分布表9/13/202250、主要功能調(diào)用此過程對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算均值、標(biāo)準(zhǔn)差、全距和標(biāo)準(zhǔn)誤差等,并可將原始數(shù)據(jù)轉(zhuǎn)換成Z分?jǐn)?shù)。、描述統(tǒng)計(jì)量分析按Analyze / Descriptive Statistics / Descriptives順序單擊,打開 Descriptives主對(duì)話框。如圖在左邊框中選一個(gè)或多個(gè)變量移入如選中此框,將對(duì)Va
28、riables框中選擇的變量進(jìn)行標(biāo)準(zhǔn)化, 產(chǎn)生相應(yīng)的Z分?jǐn)?shù),并作為新變量保存到數(shù)據(jù)窗口,其變量名在原變量名前加z。Descriptives 對(duì)話框 2、描述性統(tǒng)計(jì)分析過程9/13/202251Options 對(duì)話框 基本統(tǒng)計(jì)量當(dāng)Variables框中有多個(gè)變量時(shí),此框確定其輸出順序:按Variables框中的排列順序輸出按各變量的字母順序輸出按均值的升序排列按均值的降序排列分布、例題分析 04-3已知20個(gè)初生嬰兒的體重?cái)?shù)據(jù)如下表,對(duì)其進(jìn)行描述統(tǒng)計(jì)分析。9/13/202252277029152795299528602970308731263125465422723503421834183921
29、2669370723102573388120個(gè)初生嬰兒的體重(g)(1)操作步驟:打開數(shù)據(jù)文件“嬰兒體重.sav”。打開 Descriptives主對(duì)話框,選定變量t進(jìn)入Variable(s)欄中。選中Save standardized values as variables 復(fù)選框,要求計(jì)算變量的z值,并保存結(jié)果到當(dāng)前數(shù)據(jù)集中。單擊Options 按鈕,選中Mean、Std.Deviation、Minimum、Maximum 、Variance 項(xiàng)。(2)輸出結(jié)果及分析9/13/202253嬰兒體重的描述統(tǒng)計(jì)量這時(shí)打開原數(shù)據(jù)集,可看到多了一列zt,這是t 的z 分?jǐn)?shù),如下圖所示:保存了z 分
30、數(shù)的數(shù)據(jù)集9/13/202254、主要功能 調(diào)用此過程可檢查數(shù)據(jù)是否有錯(cuò)誤、考察樣本分布特征及對(duì)樣本分布規(guī)律作初步考察,剔除奇異值和錯(cuò)誤數(shù)據(jù)。探索分析過程將提供在分組或不分組的情況下常用的統(tǒng)計(jì)量與圖形。、探索分析 按Analyze-Descriptive Statistics-Explore 順序單擊,打開 Explore 主對(duì)話框,如下圖:3、 探索分析過程9/13/202255選擇一個(gè)或多個(gè)變量進(jìn)入Dependent框作為因變量,單擊OK可獲得因變量的一系列基本統(tǒng)計(jì)量和圖形。此作為分組變量,可以是字符變量,對(duì)因變量的分析將按該變量的觀測(cè)值進(jìn)行分組分析??捎卸鄠€(gè)分組變量,這時(shí)會(huì)按多個(gè)變量的交
31、叉組合進(jìn)行分組。該框中的變量作為標(biāo)識(shí)符, 在輸出諸如異常值時(shí),用該變量進(jìn)行標(biāo)識(shí),只允許有一個(gè)標(biāo)識(shí)符??赏瑫r(shí)輸出基本統(tǒng)計(jì)量和圖形只輸出基本統(tǒng)計(jì)量只輸出圖形Explore 主對(duì)話框9/13/202256輸出基本統(tǒng)計(jì)量 均值的置信區(qū)間,可鍵入199%的任意值,根據(jù)該值算出置信區(qū)間的上下限。給出中心趨勢(shì)的最大似然比的穩(wěn)健估計(jì)量,當(dāng)數(shù)據(jù)分布均勻,且兩尾較長(zhǎng),或當(dāng)數(shù)據(jù)中存在極端值時(shí),可給出比均值或中位數(shù)更合理的估計(jì)。輸出最大和最小的5個(gè)數(shù),且在輸出窗口中加以標(biāo)明。輸出5%、10%、25%、50%、75%、90%和95%的百分位數(shù)。Statistics對(duì)話框9/13/202257只有指定分組變量才有效,可輸
32、出分布水平圖,同時(shí)輸出回歸直線斜率以及對(duì)方差的Levenes檢驗(yàn)不輸出分布水平圖對(duì)每組數(shù)據(jù)產(chǎn)生一個(gè)中位數(shù)與四分位數(shù)范圍的自然對(duì)數(shù)散點(diǎn)圖,同時(shí)在滿足每組數(shù)據(jù)方差相等的條件下對(duì)數(shù)據(jù)進(jìn)行冪變換的估計(jì)。根據(jù)在Power參數(shù)框中指定的變換對(duì)原始數(shù)據(jù)進(jìn)行變換。不對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換 Explore 欄中Plots對(duì)話框在此對(duì)話框中可選擇要輸出的統(tǒng)計(jì)圖形及其參數(shù)。Boxplots欄只有在主對(duì)話框中指定了一個(gè)以上變量時(shí),才有效。在該欄選擇箱線圖的輸出方式:每一個(gè)因變量生成一個(gè)箱線圖所有因變量生成一個(gè)箱線圖不顯示任何箱線圖生成莖葉圖(默認(rèn))生成直方圖輸出正態(tài)概率和離散正態(tài)概率圖,同時(shí)輸出K-S統(tǒng)計(jì)量中的Lillief
33、ors顯著水平檢驗(yàn),如果觀測(cè)數(shù)不超過20,將用W-S統(tǒng)計(jì)量代替K-S統(tǒng)計(jì)量。9/13/202258確定缺失值的處置:因變量或分組變量中帶有缺失值的觀測(cè)量都將在分析過程中被剔除。在分析過程中根據(jù)分組變量產(chǎn)生的組中帶缺失值的觀測(cè)量都將被剔除。分組變量的缺失值被單獨(dú)分為一組,輸出頻數(shù)時(shí)將標(biāo)出缺失組。Explore 欄中Options對(duì)話框、例:04-4下表為30名10歲少兒的身高(cm)數(shù)據(jù),對(duì)其進(jìn)行探索分析編號(hào)身高編號(hào)身高編號(hào)身高男女男女男女1131.5132.76135.5137.511132.2124.02137.4133.07121.4141.412129.0140.33128.2139.7
34、8129.2138.813132.6130.14136.0125.49135.4120.914140.9133.45140.4138.610135.8137.515129.3136.79/13/202259(1)操作步驟打開數(shù)據(jù)文件“04-4Explore分析.sav”,打開Explore主對(duì)話框,選變量height進(jìn)入Dependent List欄中,選sex變量進(jìn)入Factor List欄中;在Display欄中選擇 Both項(xiàng);打開Statistics對(duì)話框,選中Descriptives 、M-estimation、 Outliers復(fù)選項(xiàng),單擊Continue返回;打開Plots對(duì)話框
35、,選擇Boxplots欄中的Factor levels together項(xiàng),選擇Descriptives欄內(nèi)的 Stem-and-leaf復(fù)選項(xiàng),選擇Spread vs level with levene Test欄中的 Power estimation項(xiàng),單擊 Continue 返回。單擊OK。(2)輸出結(jié)果及分析 9/13/202260個(gè)案摘要表M估計(jì)量表表4-13表4-149/13/202261少兒身高的分組描述統(tǒng)計(jì)量表4-159/13/202262少兒身高的極端值方差一致性檢驗(yàn)表4-16表4-179/13/202263HIGHT Stem-and-Leaf Plot forSEX= 1
36、 Frequency Stem & Leaf 1.00 12 . 1 4.00 12 . 8999 3.00 13 . 122 5.00 13 . 55567 2.00 14 . 00 Stem width: 10.00 Each leaf: 1 case(s)少兒身高的莖葉圖少兒身高的箱線圖9/13/202264 結(jié)果分析表4-13摘要性地說明了數(shù)據(jù)的基本情況,包括總數(shù)、有效值數(shù)目和缺失值數(shù)。 表4-14是按性別分組后的統(tǒng)計(jì)量表,上半部分是男生,下半部分是女生的。 表4-15下面的a、b、c、d分別表示四種加權(quán)常數(shù),此表的結(jié)果是使用四種不同的方法計(jì)算出的M估計(jì)量的結(jié)果。 表4-16顯示分組后
37、少兒身高的極端值分布,最大值和最小值各取5個(gè)。 表4-17是方差的一致性檢驗(yàn),零假設(shè)是分組后的方差為相等的。表中四行是依據(jù)不同的統(tǒng)計(jì)量得到的檢驗(yàn),分別是基于均值、基于中位數(shù)、基于中位數(shù)與調(diào)整后的自由度和基于調(diào)整后的均值。由于其P值均大于0.05,不能否定零假設(shè),即可以認(rèn)為男生和女生的身高的方差是無差異的。9/13/202265莖葉圖從左到右分為三部分:頻數(shù)、莖和葉、莖是整數(shù)部分,葉是小數(shù)部分,Stem width表示莖寬。每行的莖和葉組成的數(shù)字再乘以莖寬,即得到實(shí)際數(shù)據(jù)的近似值,實(shí)際數(shù)據(jù)中與該近似值靠近的值的個(gè)數(shù)即為頻數(shù)表示的個(gè)數(shù)。箱線圖各部分的含義:方箱是箱線圖的主體,上下邊為四分位數(shù),中間
38、粗線為中位數(shù),變量的50%的觀測(cè)值落在這一區(qū)域中。方箱上下兩條縱向直線是觸須線,觸須線外的兩端線為本體的最大值和最小值。本體指除奇異值外的變量值。奇異值用“o”表出,本例中無奇異值。9/13/202266 4、列聯(lián)表分析過程 、主要功能 調(diào)用列聯(lián)表分析過程可進(jìn)行計(jì)數(shù)資料和某些等級(jí)資料的列聯(lián)表分析,一個(gè)行變量和一個(gè)列變量可組成一個(gè)二維列聯(lián)表,如再加一個(gè)控制變量則可組成一個(gè)三維列聯(lián)表。而多個(gè)行、列、控制變量就可組成一個(gè)復(fù)雜的多維列聯(lián)表。在分析中可對(duì)二維和多維列聯(lián)表資料進(jìn)行統(tǒng)計(jì)描述和2檢驗(yàn),并計(jì)算相應(yīng)的百分?jǐn)?shù)指標(biāo)。此外,還可計(jì)算四格表確切概率(Fishers Exact Test),且有單雙側(cè)(On
39、e-Tail、Two-Tail)、對(duì)數(shù)似然比檢驗(yàn)( Likelihood Ratio)以及線性關(guān)系的Mantel-Haenszel 2檢驗(yàn)。9/13/202267交叉列聯(lián)表分析統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:前面的分析都是對(duì)單個(gè)變量的數(shù)據(jù)分布情況進(jìn)行分析。但在實(shí)際分析中,還需要掌握多個(gè)變量在不同取值情況下的數(shù)據(jù)分布情況,從而進(jìn)一步深入分析變量之間的相互影響和關(guān)系,這種分析就稱為交叉列聯(lián)表分析。9/13/202268 交叉列聯(lián)表分析除了列出交叉分組下的頻數(shù)分布外,還需要分析兩個(gè)變量之間是否具有獨(dú)立性或一定的相關(guān)性。要獲得變量之間的相關(guān)性,僅僅靠頻數(shù)分布的數(shù)據(jù)是不夠的,還需要借助一些變量間相關(guān)程度
40、的統(tǒng)計(jì)量和一些非參數(shù)檢驗(yàn)的方法。9/13/202269常用的衡量變量間相關(guān)程度的統(tǒng)計(jì)量是簡(jiǎn)單相關(guān)系數(shù),但在交叉列聯(lián)表分析中,由于行列變量往往不是連續(xù)變量,不符合計(jì)算簡(jiǎn)單相關(guān)系數(shù)的前提條件。因此需要根據(jù)變量的性質(zhì),選擇其他的相關(guān)系數(shù),如Kendall等級(jí)相關(guān)系數(shù)、Eta值等。9/13/202270SPSS提供了多種適用于品質(zhì)變量數(shù)據(jù)的相關(guān)系數(shù),這些檢驗(yàn)的零假設(shè)是:行和列變量之間彼此獨(dú)立,不存在顯著的相關(guān)關(guān)系。SPSS將自動(dòng)給出檢驗(yàn)的相伴概率,如果相伴概率小于顯著性水平0.05,那么應(yīng)拒絕零假設(shè),認(rèn)為行列變量之間彼此相關(guān)。9/13/202271計(jì)算公式如下(1)卡方統(tǒng)計(jì)量檢驗(yàn)是常用的檢驗(yàn)行列變量之
41、間是否相關(guān)的方法。交叉列聯(lián)表的卡方檢驗(yàn)零假設(shè)是:行列變量之間獨(dú)立,計(jì)算公式為注:其自由度為(行數(shù)1)(列數(shù)1)。9/13/202272(2)Contingency coefficient:列聯(lián)系數(shù)。用于名義變量之間的相關(guān)系數(shù)計(jì)算。計(jì)算公式由卡方統(tǒng)計(jì)量修改而得,公式為 其中,N為有效個(gè)案數(shù)。(3) Phi相關(guān)系數(shù):9/13/202273 (4)Gramers V:V系數(shù)。用于名義變量之間的相關(guān)系數(shù)計(jì)算。計(jì)算公式由卡方統(tǒng)計(jì)量修改而得,公式為 數(shù)值界于01之間,其中K為行數(shù)和列數(shù)較小的實(shí)際數(shù)。9/13/202274列聯(lián)表分析過程、列聯(lián)表分析程序 按Analyze-Descriptive Statis
42、tics-Crosstabs 順序打開 Crosstabs 主對(duì)話框,見下頁(yè):9/13/202275該框中的變量作為分布表中的行(列)變量,必須是數(shù)值型或字符型分類變量。該框中的變量作為控制變量,決定頻數(shù)分布表中的層,可有多個(gè)控制變量,如要增加新的控制變量,按Next 鍵,要修改以前的變量按Previous 鍵顯示每一組中各變量的分類條形圖只輸出統(tǒng)計(jì)量,不輸出多維列聯(lián)表。Crosstabs 對(duì)話框9/13/202276行和列變量相互獨(dú)立的假設(shè)檢驗(yàn),有多種檢驗(yàn)法。進(jìn)行相關(guān)系數(shù)的檢驗(yàn),有兩項(xiàng)結(jié)果顯示:Pearson相關(guān)系數(shù)和 Spearman相關(guān)系數(shù)適用于定類變量的統(tǒng)計(jì)量:基于卡方檢驗(yàn)基礎(chǔ)上對(duì)相關(guān)
43、性的檢驗(yàn)用來描述相關(guān)性當(dāng)用自變量預(yù)測(cè)因變量時(shí),此系數(shù)反映這種預(yù)測(cè)降低錯(cuò)誤的比率。顯示不確定系數(shù),表示用一個(gè)變量來預(yù)測(cè)其他變量時(shí)降低錯(cuò)誤的比率適用于定序變量:Gamma系數(shù)反映兩個(gè)有序變量間的對(duì)稱相關(guān)性。是Gamma檢驗(yàn)的非對(duì)稱推廣。對(duì)有序變量和秩變量相關(guān)性的非參數(shù)檢驗(yàn)。與Kendalls tau-c相似適用于定序變量:用于檢驗(yàn)相關(guān)性用于檢驗(yàn)兩個(gè)評(píng)估人對(duì)同一對(duì)象的評(píng)估是否具有一致系。檢驗(yàn)?zāi)呈录l(fā)生和某因子之間的關(guān)系進(jìn)行兩個(gè)相關(guān)的二值變量的非參數(shù)檢驗(yàn)進(jìn)行一個(gè)二值因素變量和一個(gè)二值響應(yīng)變量的獨(dú)立性檢驗(yàn)。Crosstabs的Statistics 對(duì)話框9/13/202277Crosstabs的Cell
44、 Display 對(duì)話框選擇在列聯(lián)表中輸出的統(tǒng)計(jì)量,包括觀測(cè)量數(shù)、百分比、殘差輸出觀測(cè)值的實(shí)際數(shù)量如果行和列變量在統(tǒng)計(jì)上是獨(dú)立的或不相關(guān)的,那么會(huì)在單元格中輸出期望的觀測(cè)值的數(shù)量。輸出單元格中觀測(cè)量的數(shù)目占整行全部觀測(cè)量數(shù)目的百分比輸出單元格中觀測(cè)值的數(shù)目占整列全部觀測(cè)量數(shù)目的百分比輸出單元格中觀測(cè)量的數(shù)目占全部觀測(cè)量數(shù)目的百分比計(jì)算非標(biāo)準(zhǔn)化殘差計(jì)算標(biāo)準(zhǔn)化殘差計(jì)算調(diào)整后殘差9/13/202278Table Format 對(duì)話框決定各行的排列順序:各行的排列按升序各行的排列按降序、例題 04-5為了探討吸煙與慢性支氣管炎有無關(guān)系,調(diào)查了339人,情況如下:吸煙和慢性支氣管炎調(diào)查表患慢性支氣管炎未
45、患慢性支氣管炎吸煙43162不吸煙131219/13/202279輸入數(shù)據(jù):變量n為采得的數(shù)據(jù);變量x為是否吸煙:1為吸煙,2為不吸煙;變量h為是否患?。?為患病,2為不患病。數(shù)據(jù)文件名為“Crosstab.sav”。在Data菜單中選Weight Cases項(xiàng),打開Weight Cases對(duì)話框。 Weight Cases by,再將變量n選入Frequence Variable 框,單擊OK完成加權(quán)。按Analyze-Descriptive Statistics-Crosstabs 順序打開 Crosstabs 主對(duì)話框。將x 變量選入Row框作為行變量,將h變量選入Column 框作為列
46、變量。打開Statistics對(duì)話框,選中 Chi-square Contingency coefficient和Phi and Cramers V復(fù)選框,單擊Continue返回。單擊Cell按鈕,打開Cell display對(duì)話框,選中observed和Expected 復(fù)選框,單擊Continue返回;單擊OK。(1)操作步驟9/13/202280統(tǒng)計(jì)摘要表,列出觀測(cè)量有效值個(gè)數(shù)、缺失值個(gè)數(shù)和總的個(gè)數(shù)。 從下頁(yè)的列聯(lián)表中可看出,吸煙人中患病者有43人,比期望值33.9大,不吸煙人中患病者只有13人,比期望值22.1小。 (2)輸出結(jié)果及分析 輸出結(jié)果如表:吸煙與患病統(tǒng)計(jì)摘要表9/13/2
47、02281吸煙與患病列聯(lián)表卡方檢驗(yàn)9/13/202282卡方檢驗(yàn)表,從表中可看出,Chi-Square值為7.469,P值為0.0060.05,應(yīng)否定零假設(shè),即認(rèn)為吸煙與患慢性支氣管炎是不獨(dú)立的。由于使用卡方檢驗(yàn)要求每個(gè)單元格頻數(shù)不少于5,當(dāng)條件不滿足時(shí),還可用Fisher精確檢驗(yàn),其雙側(cè)檢驗(yàn)P值為0.007。列聯(lián)表中變量之間相關(guān)程度測(cè)量,主要通過計(jì)算品質(zhì)相關(guān)系數(shù)進(jìn)行檢驗(yàn)。品質(zhì)相關(guān)系數(shù)檢驗(yàn)表9/13/202283第三節(jié) 比率分析1. 比率分析的目的和主要指標(biāo) 比率分析用于對(duì)兩變量間變量值比率變化的描述分析,適用于數(shù)值型變量。 例如根據(jù)04-6各地區(qū)保險(xiǎn)業(yè)務(wù)保費(fèi)收入的數(shù)據(jù),分析各地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)
48、的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比例情況。9/13/202284 通常的分析可以生成各個(gè)地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比率變量,然后對(duì)該比率變量計(jì)算基本描述統(tǒng)計(jì)量(如均值、中位數(shù)、標(biāo)準(zhǔn)差、全距等),進(jìn)而刻畫比率變量的集中趨勢(shì)和離散程度。 SPSS的比率分析除能夠完成上述分析外,還提供了其他相對(duì)比描述指標(biāo),大致也屬于集中趨勢(shì)描述指標(biāo)和離散程度描述指標(biāo)的范疇,具體包括:9/13/202285(1)加權(quán)比率均值(Weighted mean):兩變量均值的比,屬集中趨勢(shì)描述指標(biāo)。(2)AAD(Average Absolute Deviation)平均絕對(duì)離差:是對(duì)比率變量離散程度的描述,
49、計(jì)算公式為: 其中, 是比率數(shù),M是比率變量的中位數(shù),N為樣本數(shù)9/13/202286(3)COD(Coefficient of Dispersion)離散系數(shù):也是對(duì)比率變量離散程度的描述,計(jì)算公式為:(4)PRD(Price-related Differential)相關(guān)價(jià)格微分:是比率均值與加權(quán)比率均值的比,也是比率變量離散程度的描述。9/13/202287(5)COV變異系數(shù):用于對(duì)比率變量離散程度的描述,分為基于均值的變異系數(shù)(Mean centered COV)和中位數(shù)的變異系數(shù)(Median centered COV )。前者是通常意義下的變異系數(shù),是標(biāo)準(zhǔn)差除以均值;后者定義為:
50、9/13/2022882. 比率分析的基本步驟(1)選擇菜單AnalyzeDescriptive StatisticsRatio,出現(xiàn)如下窗口9/13/202289(2)將比率變量的分子選擇到Numerator框中,將比率變量的分母選到Denominator框中。(3)如果做不同組間的比率比較,則將分組變量選擇到Group Variable框中。(4)單擊Statistics按鈕指定輸出哪些關(guān)于比率的描述統(tǒng)計(jì)量,出現(xiàn)如下窗口:至此,SPSS將自動(dòng)計(jì)算比率變量,并將相關(guān)指標(biāo)輸出到輸出窗口中。9/13/202290第四節(jié) Means過程一、 Means過程 該過程實(shí)際上更傾向于對(duì)樣本進(jìn)行描述,可以
51、對(duì)需要比較的各組數(shù)據(jù)計(jì)算描述指標(biāo),包括均值、標(biāo)準(zhǔn)差、總和、觀測(cè)量數(shù)、方差等一系列單變量統(tǒng)計(jì)量。二、完全窗口分析 按AnalyzeCompare MeansMeans順序,打開Means主對(duì)話框(如圖4-1)。9/13/202291圖41 Means主對(duì)話框該框的變量為因變量,即用于分析的變量。該框的變量為自變量,必須至少有一個(gè)變量單擊此按鈕,進(jìn)入下一層,返回則按Previous按鈕。見圖429/13/202292Statistics框:供選擇的統(tǒng)計(jì)量Statistics for First Layer復(fù)選框:Anova table and eta: 進(jìn)行分組變量的單因素方差分析并計(jì)算eta 統(tǒng)
52、計(jì)量。Test for linearity:產(chǎn)生因變量與第一層自變量的R和R2。 圖42 Options 對(duì)話框Cell Statistics框: 選入的描述統(tǒng)計(jì)量,默認(rèn)為均值、樣本數(shù)、標(biāo)準(zhǔn)差。9/13/202293三、04-7例題分析 某醫(yī)生測(cè)得如下血紅蛋白值(g%),用Means過程對(duì)其做基本的描述統(tǒng)計(jì)分析。表5-1血紅蛋白值(g%)編號(hào)性別年齡血紅蛋白值hb編號(hào)性別年齡血紅蛋白值hb編號(hào)性別年齡血紅蛋白值hb111813.661511610.88291167.88211810.57161189.653011812.35311612.56172168.363111613.6542179.8
53、71811811.66322169.8752178.99192188.543321810.09621711.35202177.783421812.55711714.562121611.363511816.04811612.402211612.783611813.7892168.052311815.093711711.671011814.03242188.673811710.981121812.83252178.56392168.781211615.502621812.564011611.351321812.252721711.561421710.062811614.679/13/2022941
54、、操作步驟 1) 打開數(shù)據(jù)文件“血紅蛋白.sav” 。2)按順序Analyze Compare Means Means打開主對(duì)話框(設(shè)置見圖4-3)。3)單擊Option, 打開Options對(duì)話框,選擇統(tǒng)計(jì)量(設(shè)置見圖4-5)。4)單擊OK完成。9/13/202295選hb選sex按Next,進(jìn)入layer 2of 2,選age圖43 在主對(duì)話框選送變量圖44 第二層變量框9/13/202296選擇統(tǒng)計(jì)量按此按鈕復(fù)選此2項(xiàng),對(duì)第一層次分組數(shù)據(jù)進(jìn)行方差分析和線性檢驗(yàn)圖45 Options對(duì)話框9/13/202297表418 個(gè)案概要表 表418 是個(gè)案概要表,個(gè)案總個(gè)數(shù)為40,其中有效值為40
55、個(gè)、無效值為0。2. 結(jié)果及分析9/13/202298表419 分組描述統(tǒng)計(jì)量 表419 分三部分:第一、二部分先按性別分組,再按年齡分組計(jì)算觀測(cè)值合計(jì)、均數(shù)、標(biāo)準(zhǔn)差、方差和個(gè)數(shù);第三部分只按年齡分組,最后一行為合計(jì)。9/13/202299表421 按年齡分組的描述統(tǒng)計(jì)量表420 按性別分組的描述性統(tǒng)計(jì)量 血紅蛋白* 性別 血紅蛋白* 年齡 表420、21是將sex和age一起放在layer 1of 1中,分別計(jì)算男、女(不作年齡分組)。年齡分三組(不作性別分組)的觀測(cè)值合計(jì)、均數(shù)、標(biāo)準(zhǔn)差、方差和個(gè)數(shù)。9/13/2022100表422 方差分析表 表422是方差分析表,共6列:第一列方差來源:
56、組間的、組內(nèi)的、總的方差;第二列為平方和;第三列為自由度;第四列為均方;第五列為F值;第六列為 F 統(tǒng)計(jì)量的P值,P值小于0.05,所以性別對(duì)血紅蛋白值有顯著影響。9/13/2022101表423 eta統(tǒng)計(jì)量 表423是eta統(tǒng)計(jì)量表,統(tǒng)計(jì)量表明因變量和自變量之間聯(lián)系的強(qiáng)度,0.567的值處于中等水平,2是因變量中不同組間差異所解釋的方差比,是組間平方和與總平方和之比,即由64.5256除以 200.787得到。9/13/2022102表424 按年齡分組的方差分析表 表424是將年齡作為第一層自變量得到的方差分析表,Linearity是假設(shè)因變量均值是第一層自變量值的線性函數(shù),Deviat
57、ion from Linearity是不能由線性模型解釋的部分。9/13/2022103表425 按年齡分組的eta統(tǒng)計(jì)量表425是將年齡作為第一層自變量得到的eta統(tǒng)計(jì)量表,R和R2測(cè)度線性擬合優(yōu)度,R是觀測(cè)值與預(yù)測(cè)值之間的相關(guān)系數(shù)。9/13/2022104第五節(jié) 多選項(xiàng)分析(頻數(shù)分析和交叉分析)多選項(xiàng)問題的概念:多選項(xiàng)問題是根據(jù)實(shí)際調(diào)查的需要,要求被調(diào)查者從問卷給出的若干個(gè)可選答案中選擇一個(gè)以上的答案。目前,市場(chǎng)研究或許多領(lǐng)域?qū)δ呈挛镌u(píng)價(jià)的研究中常常遇到這樣的問題??梢赃x多個(gè),分為限選和不限選:限選:如在11種工作種類中,選你喜歡的,最多可選4種(Var1-Var4);求所有人喜歡各種工作
58、的頻數(shù)或頻率。不限選:如在所列的20種電器中,你家所擁有的電器,不限選(Var1-Var20),求所有被調(diào)查家庭擁有各種電器的頻數(shù)或頻率。9/13/20221051. 多選項(xiàng)問題的分解多選項(xiàng)問題的分解通常有兩種方法:多選項(xiàng)二分法;多選項(xiàng)分類法。多選項(xiàng)二分法及其編碼(multiple dichotomies method):多選項(xiàng)二分法是將多選項(xiàng)問題中的每一個(gè)答案設(shè)為一個(gè)SPSS變量,每個(gè)變量值有0或1兩個(gè)取值,分別表示選擇該答案和不選擇該答案。如對(duì)下面問題有9個(gè)可能的答案,每個(gè)可選擇的答案由一個(gè)變量表示,每個(gè)變量的值只有表明“是”和“否”的兩個(gè)代碼0或1。編號(hào) 調(diào)查內(nèi)容 選 項(xiàng) 1 您喜歡紅色嗎 是 否 2 您喜歡橙色嗎 是 否 3 您喜歡黃色嗎 是 否 4 您喜歡綠色嗎 是 否 5 您喜歡青色嗎 是 否 6 您喜歡藍(lán)色嗎 是 否 7 您喜歡紫色嗎 是 否 8 您喜歡黑色嗎 是 否 9 您喜歡白色嗎 是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 無人值守的停車場(chǎng)管理系統(tǒng)
- 光伏發(fā)電項(xiàng)目社會(huì)效益
- 高效辦公空間設(shè)計(jì)建議報(bào)告
- 模板專項(xiàng)施工方案(完整版)
- 電子設(shè)備回收與再利用技術(shù)指南
- 倉(cāng)儲(chǔ)物流系統(tǒng)電商
- 面向員工的培訓(xùn)方案及實(shí)施計(jì)劃
- rdpac腫瘤復(fù)習(xí)試題附答案
- 人工智能算法及應(yīng)用試題及答案
- 往來文書操作指南
- 拘留所教育課件02
- 《網(wǎng)紅現(xiàn)象的研究背景、意義及文獻(xiàn)綜述(2100字)》
- 管接頭注塑模具設(shè)計(jì)開題報(bào)告
- 最新-駕駛員職業(yè)心理和生理健康知識(shí)二-課件
- 加氫裝置催化劑硫化方案
- 核電廠概率安全評(píng)價(jià)概述課件
- 2022“博學(xué)杯”全國(guó)幼兒識(shí)字與閱讀大賽選拔試卷
- 幼兒園硬筆專用字帖大寫數(shù)字描紅
- 滬教牛津版四年級(jí)上冊(cè)英語(yǔ)全冊(cè)課件
- 青島城園林綠化技術(shù)規(guī)范
- 2022年信息管理概論復(fù)習(xí)資料
評(píng)論
0/150
提交評(píng)論