薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編

上傳人：1*** IP屬地：浙江上傳時(shí)間：2021-10-09 格式：PPT 頁(yè)數(shù)：317 大?。?.10MB 積分：20 舉報(bào) 版權(quán)申訴

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第2頁(yè)

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第3頁(yè)

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第4頁(yè)

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第5頁(yè)

已閱讀5頁(yè)，還剩312頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章第一章 SPSS SPSS 概述概述 SPSS概述 SPSS: Statistical Package for Social Science Statistical Product and Service Solutions SPSS的發(fā)展： l 60年代：美國(guó)斯坦福大學(xué)三位研究生研制 l 70年代：SPSS總部成立于芝加哥，推出SPSSX中小型機(jī)版 l 80年代：SPSS公司（SPSS/PC+微機(jī)版13） l 90年代：SPSS公司（SPSS WINDOWS版514） SPSS 主要特點(diǎn) 操作簡(jiǎn)便。絕大多數(shù)操作是通過(guò)菜單、按鈕、對(duì)話框完成的。無(wú)需計(jì)算機(jī)編程、需記憶大量命令和參數(shù)。

2、分析方法豐富、分析結(jié)果清晰、直觀。可以直接讀取其他軟件格式的數(shù)據(jù)文件，如：dbf、xls、 sas等。最新版本采用分布式分析系統(tǒng)，適應(yīng)互聯(lián)網(wǎng)，支持動(dòng) 態(tài)收集、分析數(shù)據(jù)和HTML報(bào)告與一般的辦公軟件直接兼容不方便 SPSS主要窗口：數(shù)據(jù)編輯窗口窗口標(biāo)題：data editor 功能：對(duì)SPSS的數(shù)據(jù)文件數(shù)據(jù)文件進(jìn)行錄入、修改、管理等基本操作的窗口。組成：窗口主菜單、工具欄、數(shù)據(jù)編輯區(qū)、狀態(tài)顯示區(qū) 特點(diǎn)： SPSS運(yùn)行過(guò)程中自動(dòng)打開(kāi) SPSS中各統(tǒng)計(jì)分析功能都是針對(duì)該窗口中的數(shù)據(jù)進(jìn) 行的窗口中的數(shù)據(jù)文件以.sav存于磁盤(pán)上兩個(gè)視圖：數(shù)據(jù)視圖和變量視圖 SPSS主要窗口：數(shù)據(jù)輸

3、出窗口窗口標(biāo)題：viewer 功能：SPSS統(tǒng)計(jì)分析報(bào)表及圖形的輸出的窗口。組成：窗口主菜單、工具欄、結(jié)果顯示區(qū)、狀態(tài)顯示區(qū) 特點(diǎn)：在進(jìn)行第一次分析時(shí)自動(dòng)打開(kāi)，也可手工打開(kāi) 可以手工打開(kāi)若干個(gè)可相互切換若干個(gè)可相互切換的viewer窗口；狀態(tài)欄上的！表示當(dāng)前輸出窗口輸出窗口可以關(guān)閉，窗口內(nèi)容以.SPO存于磁盤(pán)上兩個(gè)視圖：目錄視圖和內(nèi)容視圖 SPSS主要窗口：數(shù)據(jù)輸出窗口駕馭數(shù)據(jù)出輸出窗口一般操作結(jié)果文件的打開(kāi)和保存加密保存窗口元素的移動(dòng)和刪除標(biāo)準(zhǔn)的拖放式操作在大綱視圖中操作最方便結(jié)果的導(dǎo)出以純文本格式導(dǎo)出、以HTML格式導(dǎo)出如何在WORD中引用分析結(jié)果統(tǒng)計(jì)表

4、格：拷貝或拷貝對(duì)象統(tǒng)計(jì)圖：拷貝對(duì)象表格的編輯表格狀態(tài)的確定單元格內(nèi)容編輯行列轉(zhuǎn)置 Autofit 表格樣式的變換 SPSS基本運(yùn)行方式完全窗口菜單方式: 所有分析操作過(guò)程都是通過(guò)菜單和按鈕及對(duì)話框方式進(jìn)行的. 是經(jīng)常使用的一種運(yùn)行方式,適用于一般分析和SPSS的初學(xué)者. SPSS基本運(yùn)行方式程序運(yùn)行方式: 手工編寫(xiě)SPSS命令程序一次性提交計(jì)算機(jī)運(yùn)行適用于大規(guī)模的分析工作和熟練的SPSS程序員. 實(shí)現(xiàn)方法: (1)打開(kāi)SYNTAX語(yǔ)句窗口并編寫(xiě)和修改SPSS程序 (2)點(diǎn)擊語(yǔ)句窗口中的RUN菜單項(xiàng)，選擇運(yùn)行方式運(yùn)行 Syntax語(yǔ)句窗口窗口標(biāo)題: syntax editer

5、功能：編寫(xiě)和修改SPSS程序的窗口. 特點(diǎn)：打開(kāi)： FILE - NEW - SYNTAX或FILE-OPEN- .SPS擴(kuò)展名窗口中的程序以.SPS存于磁盤(pán)上菜單項(xiàng)RUN中提供四種程序執(zhí)行方式：All、Selection、 Current、To end SPSS 基本運(yùn)行方式菜單程序混合運(yùn)行方式: 先通過(guò)菜單選擇分析過(guò)程和參數(shù),不立即提交（OK）執(zhí)行,而是按動(dòng)PASTE按鈕. 計(jì)算機(jī)自動(dòng)將用戶(hù)剛定義的分析過(guò)程和參數(shù)轉(zhuǎn)換成 SPSS的命令,并顯示到SYNTAX語(yǔ)句窗口中. 用戶(hù)可對(duì)其進(jìn)行必要的修改后再提交給計(jì)算機(jī)執(zhí)行. 一般適用于熟練的SPSS程序員. 利用SPSS進(jìn)行數(shù)據(jù)分析的步

6、驟建立SPSS數(shù)據(jù)文件定義數(shù)據(jù)文件結(jié)構(gòu) 錄入修改和編輯待分析數(shù)據(jù) 數(shù)據(jù)的統(tǒng)計(jì)分析統(tǒng)計(jì)分析之前的預(yù)處理統(tǒng)計(jì)分析數(shù)據(jù)和分析結(jié)果的保存結(jié)果的說(shuō)明和解釋思考復(fù)習(xí) SPSS有哪兩個(gè)主要窗口？功能是什么？有哪些特點(diǎn)？ SPSS有哪些運(yùn)行方式？特點(diǎn)是什么？第二章 SPSS數(shù)據(jù)文件的建立和管理一份簡(jiǎn)單的調(diào)查問(wèn)卷單項(xiàng)選擇題提供幾個(gè)備選擇答案，從其中選擇一個(gè)答案變量類(lèi)型：分類(lèi)數(shù)據(jù)、定序數(shù)據(jù) 數(shù)據(jù)類(lèi)型：字符型填空題變量類(lèi)型：定距數(shù)據(jù) 數(shù)據(jù)類(lèi)型：數(shù)值型如何利用SPSS組織數(shù)據(jù) SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件年級(jí) 性別問(wèn)題1問(wèn)題n 11. 4 222 . 文件結(jié)構(gòu) 數(shù)據(jù) 個(gè)案

7、 case 變量名變量用字符或數(shù)字表示字符型數(shù)據(jù) SPSS數(shù)據(jù)文件一般只能通過(guò)SPSS軟件打開(kāi) 一份簡(jiǎn)單的調(diào)查問(wèn)卷 l多項(xiàng)選擇題 l提供幾個(gè)備選擇答案，從其中選擇多個(gè)答案如：在下列品牌中您信任哪些品牌？被診斷為高血要后你采取了以下哪些輔助治療手段？如：高考時(shí)報(bào)考學(xué)校 (1)北京大學(xué) (2)清華大學(xué) (3)人民大學(xué) (4)北京理工大學(xué) (5)北京師范大學(xué) (6)北京外國(guó)語(yǔ)大學(xué) l多項(xiàng)選擇題不能在SPSS中直接存儲(chǔ)，因?yàn)镾PSS的一個(gè)變量只能有一個(gè)取值 l多項(xiàng)選擇題的處理方法 l思路：將一個(gè)問(wèn)題定義成幾個(gè)變量，用這幾個(gè)變量來(lái)描述該問(wèn)題的幾個(gè)可能被選擇的答案。 l編碼方式：多選項(xiàng)二

8、分法(multiple dichotomize method) 多選項(xiàng)分類(lèi)法(multiple category method) l多選項(xiàng)二分法將每個(gè)答案作為一個(gè)變量，每個(gè)變量只有兩個(gè)取值 (0或1)。例如: 變量名變量名標(biāo) 簽編碼方案 X 1北京大學(xué)01 X 2清華大學(xué)01 X 3人民大學(xué)01 X 4北京理工大學(xué)01 X 5北京師范大學(xué)01 X 6北京外國(guó) 語(yǔ) 大學(xué)01 如何利用SPSS組織數(shù)據(jù) l多選項(xiàng)分類(lèi)法: 預(yù)先估計(jì)多選項(xiàng)問(wèn)題可能被選擇的最多答案數(shù).為每個(gè) 答案建立一個(gè)變量,取值為多選項(xiàng)問(wèn)題的可選答案. 例如: 變量名

9、變量名標(biāo) 簽編碼方案 A第一選項(xiàng) (1 ) 北京大學(xué) (2 ) 清華大學(xué) (3 ) 人民大學(xué) (4 ) 北京理工大學(xué) (5 ) 北京師范大學(xué) (6 ) 北京外國(guó) 語(yǔ) 大學(xué) B第二選項(xiàng) (1 ) 北京大學(xué) (2 ) 清華大學(xué) (3 ) 人民大學(xué) (4 ) 北京理工大學(xué) (5 ) 北京師范大學(xué) (6 ) 北京外國(guó) 語(yǔ) 大學(xué) C第三選項(xiàng) (1 ) 北京大學(xué) (2 ) 清華大學(xué) (3 ) 人民大學(xué) (4 ) 北京理工大學(xué) (5 ) 北京師范大學(xué) (6

10、 ) 北京外國(guó) 語(yǔ) 大學(xué) 如何利用SPSS組織數(shù)據(jù) 頻數(shù)數(shù)據(jù)：男女統(tǒng)計(jì)1023 精算1220 如何利用SPSS組織數(shù)據(jù) 設(shè)置三個(gè)變量：專(zhuān)業(yè)方向、性別、人數(shù) SPSS數(shù)據(jù)文件的結(jié)構(gòu) （一）變量名變量名(Variable name): 變量名是變量存取的唯一標(biāo)志。起名規(guī)則：不多于8個(gè)字符組成不區(qū)分大小寫(xiě) 允許漢字作為變量名默認(rèn)變量名為VARn，如：var00001 SPSS數(shù)據(jù)文件的結(jié)構(gòu) （二）變量的類(lèi)型變量的類(lèi)型(type)和顯示寬度和顯示寬度(width) 1、數(shù)值型：標(biāo)準(zhǔn)數(shù)值型(Numeric):默認(rèn)類(lèi)型 8.2 如： 12345678、12345.67、-1234.

11、56 帶逗號(hào)的數(shù)值型(Comma): 從個(gè)位開(kāi)始三位一個(gè)逗號(hào)8.2 如：1,234.56 科學(xué)計(jì)數(shù)法(Scientific Notation):表示很大或很小的數(shù)據(jù) 8.2 如：1.2E+05 帶美元符號(hào)(Dollar):表示貨幣格式很多，如：$12.30 SPSS數(shù)據(jù)文件的結(jié)構(gòu) 2 、字符型(String): 存儲(chǔ)字符數(shù)據(jù) 8位如：beijing 處理時(shí)用雙引號(hào)擴(kuò)起來(lái) 3、日期型（Date):存儲(chǔ)日期數(shù)據(jù) 格式很多，如：20-AUG-1999 4、其他: 如：圓點(diǎn)數(shù)值型(dot)、用戶(hù)自定義型 (customer) 注意：顯示寬度不影響數(shù)據(jù)的存儲(chǔ) SPSS數(shù)據(jù)文件的結(jié)構(gòu) （三）變量名標(biāo)簽

12、變量名標(biāo)簽(Variable label) : 對(duì)變量名的一些解釋說(shuō)明，增強(qiáng)分析結(jié)果的可視性。可以省略。（四）變量值標(biāo)簽變量值標(biāo)簽(Value label) 對(duì)變量所取值的一些解釋說(shuō)明，增強(qiáng)分析結(jié)果的可視性。可以省略。一般用于品質(zhì)數(shù)據(jù) 如：1-男 2-女、1-高 2-中 3-低 SPSS數(shù)據(jù)文件的結(jié)構(gòu) （五）變量列格式變量列格式(Column Format) 對(duì)齊方式(Text Alignment) 左對(duì)齊(Left):字符型默認(rèn)。右對(duì)齊(Right):數(shù)值型默認(rèn)。居中對(duì)齊(Center) 列寬度(Column Width) 默認(rèn)值為變量的總長(zhǎng)度。 SPSS數(shù)據(jù)文件的結(jié)構(gòu) （六）缺

13、失值缺失值(Missing Values) 1、什么是缺失值？漏填數(shù)據(jù) 明顯錯(cuò)誤的數(shù)據(jù) 2、對(duì)缺失值的一般處理事先指定：指定某個(gè)特定值為缺失值（用戶(hù)缺失值）其他處理方法，如：以均值、眾數(shù)替代等 3、SPSS缺失值用戶(hù)缺失值系統(tǒng)缺失值：數(shù)值型：點(diǎn) () 字符型：空 SPSS數(shù)據(jù)文件的結(jié)構(gòu) （七）變量計(jì)量尺度（七）變量計(jì)量尺度(Measurement) scale: 定距數(shù)據(jù)，一般為數(shù)值型數(shù)據(jù)。如:收入、人數(shù)。 ordinal: 有固有順序的順序水準(zhǔn)的數(shù)值型或字符型數(shù) 據(jù)。如:職稱(chēng)、年齡段 nominal: 無(wú)固有順序的名義水準(zhǔn)的數(shù)值型或字符型數(shù) 據(jù)。如:性別、民族定義SPSS數(shù)

14、據(jù)文件結(jié)構(gòu) 操作方法：利用變量視圖如何查看變量定義的情況菜單選項(xiàng): Utilities - Variables SPSS數(shù)據(jù)的錄入與保存錄入時(shí)應(yīng)注意：黑框確定當(dāng)前數(shù)據(jù)單元錄入帶有變量值標(biāo)簽的數(shù)據(jù)：手工輸入代碼，屏幕顯示變量值標(biāo)簽凍結(jié)第一列數(shù)據(jù)保存：操作保存格式： (1)*.sav :SPSS數(shù)據(jù)文件(默認(rèn))。（2)*.dbf : dbase數(shù)據(jù)文件。（3)*.xls : Excel工作表文件。注意：有些信息會(huì)丟失 SPSS數(shù)據(jù)的編輯 (一)打開(kāi)數(shù)據(jù)文件菜單選項(xiàng):File - Open - .sav (二)數(shù)據(jù)定位按個(gè)案號(hào)碼定位菜單: Data - Go to c

15、ase - 輸入樣本號(hào) 按值定位光標(biāo)定位到某列變量上光標(biāo)定位到某列變量上 - Edit - Find. SPSS數(shù)據(jù)的編輯 (三)插入和刪除一個(gè)個(gè)案插入：data-insert case 刪除：選定待刪行，鼠標(biāo)右鍵找到Cut (四)插入和刪除一個(gè)變量插入：光標(biāo)定位到某列變量上光標(biāo)定位到某列變量上 - Data - Insert Variable (插到某列前) 或鼠標(biāo)右鍵刪除：選定列，鼠標(biāo)右鍵Cut項(xiàng) SPSS數(shù)據(jù)的編輯 (五)數(shù)據(jù)移動(dòng)、復(fù)制和刪除定義源數(shù)據(jù)塊鼠標(biāo)右鍵：cut copy clear 確定目標(biāo)單元鼠標(biāo)右鍵：paste 數(shù)據(jù)文件的合并目的: 將兩個(gè)SPSS數(shù)據(jù)文件合

16、并到一個(gè)數(shù)據(jù)文件中文件合并的方式: 縱向合并橫向合并 (一)縱向數(shù)據(jù)合并 (1)含義含義: 將磁盤(pán)上的一個(gè)SPSS數(shù)據(jù)文件追加追加到當(dāng)前data editor窗口中的數(shù)據(jù) 文件中。 (2)前提前提: 兩個(gè)SPSS數(shù)據(jù)文件應(yīng)可以合并的內(nèi)容可以合并的內(nèi)容，且最好有相同的相同的變量名和變量類(lèi)型。 (3)菜單選項(xiàng)菜單選項(xiàng): data - merge file - add cases 數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并 (二)橫向數(shù)據(jù)合并 (1)含義含義: 將磁盤(pán)上的一個(gè)SPSS數(shù)據(jù)文件中的若干個(gè)變量增加到當(dāng)前data editor窗口的數(shù)據(jù)文件中。 (2)前提前提: a.兩個(gè)數(shù)據(jù)文件必須必須有一

17、個(gè)共同的變量名為關(guān)鍵字段 -合并的依據(jù)； b. 兩個(gè)數(shù)據(jù)文件應(yīng)事先按關(guān)鍵字段升序排序。數(shù)據(jù)文件的合并 (二)橫向數(shù)據(jù)合并 (3)菜單選項(xiàng)菜單選項(xiàng): data - merge file - add variable (4)選項(xiàng)說(shuō)明選項(xiàng)說(shuō)明: math cases on key variables in sorted files:以關(guān)鍵字作為合并標(biāo)志。 Both files provide cases:合并后的文件的數(shù)據(jù)由兩個(gè) 文件共同提供。 External file is keyed table:以data editor的數(shù)據(jù)為基礎(chǔ)。 Working data file is keyed

18、table:以磁盤(pán)文件的數(shù)據(jù)為基礎(chǔ)。與其他軟件數(shù)據(jù)共享共享dbf和xls格式文件菜單選項(xiàng): Data - Open (1)*.dbf : dbase數(shù)據(jù)文件。字段名、字段類(lèi)型自動(dòng)轉(zhuǎn)成 SPSS數(shù)據(jù)文件中的變量名和類(lèi)型。一條記錄為一個(gè)個(gè) 案。 (2)*.xls : Excel文件 (Read variable name選項(xiàng)) 共享數(shù)據(jù)庫(kù)文件建立ODBC數(shù)據(jù)源第三章 SPSS數(shù)據(jù)文件的基本加工和處理 SPSS數(shù)據(jù)文件的基本加工和處理數(shù)據(jù)文件的整理個(gè)案排序、個(gè)案選取數(shù)據(jù)加工變量計(jì)算、計(jì)數(shù) 數(shù)據(jù)分組自動(dòng)分組、手工分組數(shù)據(jù)文件的其他處理功能指定加權(quán)變量目的：將所有個(gè)案按照

19、用戶(hù)指定的某一個(gè)或多個(gè)變量的變量值的升序或降序重新排列。菜單選項(xiàng): data - sort cases 注意: (1)Ascending:升序、Descending:降序。 (2)多重排序,選擇變量名的次序很關(guān)鍵。個(gè)案排序排序在數(shù)據(jù) 分析中的作用？個(gè)案選取目的：從現(xiàn)有數(shù)據(jù)中挑選出部分?jǐn)?shù)據(jù)。菜單選項(xiàng): data - select cases 選取個(gè)案的幾種不同方式 (1)選擇符合一定條件的個(gè)案(If condition is satisfied) (2)隨機(jī)選取個(gè)案(Random sample of cases) 近似選取、精確選取 (3)選取某一區(qū)域內(nèi)的個(gè)案(Based on

20、 time or case range) (4)使用過(guò)濾變量(use filter variable) 注意:以后的操作和分析都在該個(gè)案選取的基礎(chǔ)上進(jìn)行. 個(gè)案選取在數(shù) 據(jù)分析中的作用？變量計(jì)算目的：產(chǎn)生新變量或?qū)υ兞窟M(jìn)行必要的轉(zhuǎn)換處理 (如:預(yù)測(cè)問(wèn)題產(chǎn)生比率數(shù)據(jù) 偏態(tài)數(shù)據(jù)的正態(tài)處理時(shí)間序列的平穩(wěn)處理等) (1)含義: 根據(jù)用戶(hù)給出的SPSS算術(shù)表達(dá)式，對(duì)所有或部分樣本數(shù)據(jù)進(jìn)行加工。 (2)菜單選項(xiàng)： transform-compute if 按鈕 (3)SPSS算術(shù)表達(dá)式(Numeric Expression): 由算術(shù)運(yùn)算符(+ 、-、 *、 /、 *)、SPSS函數(shù)以及

21、SPSS 變量名組成的式子。變量計(jì)算算術(shù)函數(shù) 統(tǒng)計(jì)函數(shù) 分布函數(shù) 邏輯函數(shù) 字符串函數(shù) 缺失值函數(shù) 日期時(shí)間函數(shù) 其他函數(shù) (4) SPSS函數(shù) l算術(shù)函數(shù) lAbs()：求絕對(duì)值 lsqrt()：求平方根 lrnd()：四舍五入后取整 ltrunc()：截取小數(shù)部分取整 lmod()：取余 lLn()：自然對(duì)數(shù) lLg10()：以10為底的對(duì)數(shù) (4) SPSS函數(shù) 變量計(jì)算 l統(tǒng)計(jì)函數(shù)： lmean()：均值 lsd()：標(biāo)準(zhǔn)差 lsum()：求總和 lcfvar()：求變異系數(shù) lmax() min()：求最大最小值 (4) SPSS函數(shù) 變量計(jì)算 l分布函數(shù)： lnormal()：

22、產(chǎn)生服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù)序列 luniform()：產(chǎn)生均勻分布的隨機(jī)數(shù)序列 lrv.()：產(chǎn)生指定分布的隨機(jī)數(shù)序列，如：rv.t(10) lcdf.()：計(jì)算指定分布的累計(jì)概率值 lidf.()：計(jì)算指定分布的臨界值 (4) SPSS函數(shù) 變量計(jì)算 l邏輯函數(shù)： lrange()：判斷變量值是否在指定的區(qū)間內(nèi) lany()：判斷變量值是否為指定的若干值 l字符串函數(shù)： lindex(S1，S2)：判斷字符串S2在S1中首次出現(xiàn)的位置 llength()：求字符串長(zhǎng)度 llower() upcase()：字符串的大小寫(xiě)轉(zhuǎn)換 llpad()：用指定字符補(bǔ)齊字符串為指定長(zhǎng)度 lltrim()：

23、壓縮字符串空格 lsubstr()：取子串 (4) SPSS函數(shù) 變量計(jì)算 l缺失值函數(shù) lmissing()：判斷變量是否取系統(tǒng)或用戶(hù)缺失值 lsysmis()：判斷變量是否取系統(tǒng)缺失值 l其他函數(shù)： lLag()：便于進(jìn)行差分計(jì)算 (4) SPSS函數(shù) 變量計(jì)算變量轉(zhuǎn)換 (5)SPSS條件表達(dá)式條件表達(dá)式: 條件表達(dá)式:由SPSS關(guān)系運(yùn)算符、邏輯運(yùn)算符、SPSS函數(shù)以及SPSS變量名組成的式子。關(guān)系運(yùn)算符: (大于)、 =(大于等于)、 32、sr32) and (sr=700) (nl=32) | (sr700) not xb=1 計(jì)數(shù) (1)含義: 對(duì)所有或部分個(gè)案，計(jì)算若干個(gè)變

24、量中有幾個(gè) 變量的值落在指定的區(qū)域內(nèi)，并將結(jié)果存入新變量中。 (2)菜單選項(xiàng)菜單選項(xiàng): transform - count - define value 產(chǎn)生計(jì)數(shù)變量 (3)指定區(qū)域的定義 Value:指定一個(gè)值 system-missing:系統(tǒng)缺失值 system-or user missing:系統(tǒng)或用戶(hù)缺失值 range through:指定一個(gè)閉區(qū)域，給出最大和最小值 range: lowest through n:最小值到某個(gè)給定值 range: n through highest:某個(gè)給定值到最大值數(shù)據(jù)文件的分類(lèi)匯總 (1)含義：按指定的分類(lèi)變量的變量值對(duì)個(gè)案分組；計(jì)算

25、每組個(gè)案的匯總變量的基本統(tǒng)計(jì)量；將計(jì)算結(jié)果生成到一新文件中，即：在新文件中對(duì) 應(yīng)分類(lèi)變量的每一個(gè)分類(lèi)值產(chǎn)生一個(gè)個(gè)案。性別年齡獎(jiǎng)金男 401000 女 35550 男 20200性別_1年齡_1獎(jiǎng)金_1 男30600 女35550 原始數(shù)據(jù) 按性別變量匯總數(shù)據(jù) 數(shù)據(jù)文件的分類(lèi)匯總 (2)菜單選項(xiàng): data - aggregate (3)說(shuō)明: 多重分組時(shí)，變量名的選擇順序。生成的新文件名默認(rèn)為:aggr.sav。可修改。生成的新變量名默認(rèn)為原變量名后加_1?？尚?改。可以在新文件中存貯個(gè)分組個(gè)案數(shù). 數(shù)據(jù)分組目的:了解數(shù)據(jù)的總體分布狀況思路：指定按哪個(gè)變量分組，即：指定分組變

26、量定義分組變量的分組區(qū)間（不重、不漏）指定一個(gè)存放分組結(jié)果的標(biāo)志變量分組方法：自動(dòng)分組手工分組數(shù)據(jù)分組 (一)自動(dòng)分組單變量值分組 (1)含義: 分組變量值相同的個(gè)案分在同一組，同組中的標(biāo)志變量相同。標(biāo)志變量依照分組變量值的大小次序給定。（單變量分組，通常只適合于離散變量且變量值較少的情況） (2)菜單選項(xiàng)菜單選項(xiàng): transform - automatic recode 分位值自動(dòng)分組（1）含義：將定距型變量按分位數(shù)要求自動(dòng)劃分成相應(yīng)類(lèi) （2）菜單選項(xiàng)：transform-categorize variables 數(shù)據(jù)分組 (二)手工分組（組距分組） (1)含義：人工

27、定義分組區(qū)域，對(duì)所有個(gè)案或符合一定條件的個(gè)案進(jìn)行等距或非等距分組。 (2)方法：分組結(jié)果存入原變量、分組結(jié)果存入新變量數(shù)據(jù)分組 (3)分組結(jié)果存入原變量: 定義分組區(qū)域: 定義某一區(qū)間的原變量值分組后所對(duì)應(yīng) 的新值是什么.未定義的原變量值保持不變。菜單選項(xiàng): transform - recode - into same variables 說(shuō)明：可以指定對(duì)符合一定條件的個(gè)案進(jìn)行分組。數(shù)據(jù)分組 (4)分組結(jié)果存入新變量: 定義分組區(qū)域:定義某一區(qū)間的原變量值分組后所對(duì)應(yīng) 的新值是什么.未定義的原變量值在新變量中為系統(tǒng)缺失值。菜單選項(xiàng): transform - recode - i

28、nto different variables 定義原變量分組后產(chǎn)生的相應(yīng)新變量(CHANGE鈕) 可以指定對(duì)符合一定條件的個(gè)案進(jìn)行分組。單值區(qū)間可以實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換（問(wèn)卷分析中的反向題重新計(jì)分）問(wèn)卷分析中的反向題重新計(jì)分舉例性格打分（內(nèi)向、一般、外向） 1、與生人交往會(huì)“自來(lái)熟” （1）從不（2）偶爾（3）有時(shí) （4）經(jīng)常 2、與不熟悉的異性交往，會(huì)臉紅（1）從不（2）偶爾（3）有時(shí) （4）經(jīng)常 3、在公眾場(chǎng)合下你會(huì)大聲發(fā)表自己的意見(jiàn) （1）從不（2）偶爾（3）有時(shí) （4）經(jīng)常極為內(nèi)向：3分較為內(nèi)向：6分較為外向:9分極為外向：12分指定加權(quán)變量 (1)含義:

29、指定某一變量為加權(quán)變量。如：平均蔬菜價(jià)格、男足打分 (2)菜單選項(xiàng): data - weight case (3)說(shuō)明如果取消加權(quán)變量應(yīng)重新定義: data-weight case do not weight cases 作業(yè) 根據(jù)給定的兩個(gè)關(guān)于學(xué)生成績(jī)的SPSS數(shù)據(jù)文件做如下處理：合并兩個(gè)數(shù)據(jù)文件（數(shù)據(jù)不一定是一一對(duì)應(yīng)的）計(jì)算每個(gè)同學(xué)的總成績(jī)、平均成績(jī)、標(biāo)準(zhǔn)差計(jì)算每個(gè)同學(xué)的得優(yōu)率和得良率根據(jù)得優(yōu)率排名將各門(mén)課程的成績(jī)按優(yōu)、良、中、及格和不及格重新分組分別計(jì)算男生和女生的各科的平均成績(jī)、標(biāo)準(zhǔn)差，并保存計(jì)算結(jié)果到SPSS數(shù)據(jù)文件。第四章 SPSS的基本統(tǒng)計(jì)分析基本統(tǒng)計(jì)分析

30、頻數(shù)分析計(jì)算基本描述統(tǒng)計(jì)量（分布特征測(cè)度）圖形分析工具列聯(lián)分析頻數(shù)分析目的粗略把握變量值的分布狀況。例：研究被調(diào)查者的特征（如：性別、年齡、收入）研究被調(diào)查者對(duì)某個(gè)問(wèn)題的總體看法（如：教學(xué)方式、選修課程）研究被調(diào)查者某方面的狀態(tài)（如：購(gòu)買(mǎi)家電的類(lèi)型、居民月支出狀況）采用的方法計(jì)算頻分布表：包括計(jì)算頻數(shù)、百分比、累計(jì)百分比繪制統(tǒng)計(jì)圖形：條形圖、餅圖頻數(shù)分析基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-frequencies (2)選擇幾個(gè)待分析的變量到variables框. (3)chart選項(xiàng)，選擇所需要的圖形頻數(shù)分

31、析應(yīng)用舉例儲(chǔ)戶(hù)的職業(yè)分析特點(diǎn)：定類(lèi)數(shù)據(jù) 頻數(shù)分布表輸出按頻數(shù)升降序輸出儲(chǔ)戶(hù)收入水平分析特點(diǎn)：定序數(shù)據(jù) 除使用頻數(shù)、百分比、總數(shù)外，還可以充分使用累計(jì)百分比頻數(shù)分析頻數(shù)分析中的其他分析計(jì)算分位數(shù):適用于定距數(shù)據(jù) 數(shù)據(jù)按升序排序后，找到若干個(gè)分位點(diǎn)上的變量值 quartiles:計(jì)算四分位數(shù)25%(QL)、50%(中位數(shù))、75%(QU) cut points for n equal groups:n等份 percentile:自定義百分位點(diǎn) 分位數(shù)的應(yīng)用在排除極端值影響的條件下，通過(guò)計(jì)算分位數(shù)差，比較兩組樣本數(shù)據(jù)的離散程度例: ( QL=50,QU=80) 和 (QL=7

32、0,QU=75) 的比較分位數(shù)、中位數(shù)、眾數(shù)的應(yīng)用舉例不同戶(hù)口所在地的儲(chǔ)戶(hù)取款金額比較利用分位數(shù)（不顯示頻數(shù)分析表）計(jì)算描述統(tǒng)計(jì)量目的精確把握變量的總體分布狀況，了解數(shù)據(jù)的集中趨勢(shì)、離散趨勢(shì)、對(duì)稱(chēng)程度、陡峭程度。基本方法計(jì)算基本描述統(tǒng)計(jì)量計(jì)算描述統(tǒng)計(jì)量描述集中趨勢(shì)的統(tǒng)計(jì)量均值(mean):表示某變量所有變量值集中趨勢(shì)或平均水平的統(tǒng)計(jì)量。適用于定距數(shù)據(jù)。特點(diǎn)：利用了全部數(shù)據(jù)，易受極端值的影響。描述離散程度的統(tǒng)計(jì)量標(biāo)準(zhǔn)差(standard deviation-Std Dev):表示某變量的所有變量值離散程度的統(tǒng)計(jì)量。 SPSS中計(jì)算的是樣本標(biāo)準(zhǔn)差。方差(var

33、iance):標(biāo)準(zhǔn)差的平方。 SPSS中計(jì)算的是樣本方差。極差 (range):最大值(maximum)最小值(minimum) 計(jì)算描述統(tǒng)計(jì)量描述對(duì)稱(chēng)程度的統(tǒng)計(jì)量偏度(skewness):描述某變量分布形態(tài)的偏斜程度和方向的統(tǒng)計(jì)量. 偏度為0表示對(duì)稱(chēng); 大于0表示正偏差大(右偏),頻數(shù)最大的值比均值小,極值大于均值; 小于0表示負(fù)偏差大(左偏) 計(jì)算描述統(tǒng)計(jì)量描述陡峭程度的統(tǒng)計(jì)量峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩程度的統(tǒng)計(jì)量。峭度為0表示與標(biāo)準(zhǔn)正態(tài)分布峭度相同。大于0表示比標(biāo)準(zhǔn)正態(tài)分布陡，尖峰。小于0表示比標(biāo)準(zhǔn)正態(tài)分布緩；平峰。計(jì)算描述統(tǒng)計(jì)量

34、其他統(tǒng)計(jì)量標(biāo)準(zhǔn)誤差(standard error S.E):抽樣分布中的標(biāo)準(zhǔn)差，反映樣本誤差。均值標(biāo)準(zhǔn)誤差(means of S.E) 中心極限定理認(rèn)為：樣本均值N(u,2/n) 反映樣本均值與總體真值間的平均離散程度樣本數(shù)越大，樣本均值的離散程度越小，對(duì)真值的估計(jì)越準(zhǔn)確計(jì)算描述統(tǒng)計(jì)量基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-descripive (2)選擇將參加計(jì)算的數(shù)值型數(shù)值型變量名到variables框。分析比較不同戶(hù)口所在地儲(chǔ)戶(hù)取款情況比較集中趨勢(shì) 比較離散趨勢(shì) 比較偏斜程度比較陡峭程度實(shí)現(xiàn)方式：數(shù)據(jù)拆分其他功能

35、數(shù)據(jù)標(biāo)準(zhǔn)化處理新變量的均值為0,標(biāo)準(zhǔn)差為1; 小于0表示在平均水平下,大于0反之. 正態(tài)分布的數(shù)據(jù)標(biāo)準(zhǔn)化后呈標(biāo)準(zhǔn)正態(tài)分布（68.2%， 95.4%，99.7%） save standardized values as variables選項(xiàng) 將變量作標(biāo)準(zhǔn)化后,結(jié)果存入名為“Z+原變量名”的新變量中. 數(shù)據(jù)標(biāo)準(zhǔn)化處理應(yīng)用舉例你能以較簡(jiǎn)便的方法快速找到取款數(shù)目出眾的儲(chǔ)戶(hù)嗎？ SDxxz ii / )( 計(jì)算描述統(tǒng)計(jì)量基本統(tǒng)計(jì)分析的圖形工具以制作條形圖為例繪制簡(jiǎn)單條圖（單式條圖）繪制復(fù)式條圖繪制堆積條圖（分段條圖）定義統(tǒng)計(jì)圖中數(shù)據(jù)的表達(dá)類(lèi)型：同一變量若干條記錄的分組匯總條圖反

36、映了不同變量的匯總條圖反映了個(gè)體觀察值戶(hù)口所在地邊遠(yuǎn)郊區(qū)中心城市 Count 220 200 180 160 140 120 100 80 60 以制作條形圖為例第一種模式下的三種圖形第一種模式下的三種圖形：用于某變量在各分類(lèi)情況的比較用于某變量在各分類(lèi)情況的比較基本統(tǒng)計(jì)分析的圖形工具戶(hù)口所在地邊遠(yuǎn)郊區(qū)中心城市 Count 140 120 100 80 60 40 20 0 收入水平 1000元以下 10003000元 30005000元 1500元以上戶(hù)口所在地邊遠(yuǎn)郊區(qū)中心城市 Count 300 200 100 0 收入水平 1500元以上 30005000元 10003

37、000元 1000元以下以制作條形圖為例第二種模式下的三種圖形第二種模式下的三種圖形：用于若干變量的統(tǒng)計(jì)量的比較用于若干變量的統(tǒng)計(jì)量的比較未來(lái)收入情況收入情況 N 2 62 60 58 56 54 52 50 48 46 基本統(tǒng)計(jì)分析的圖形工具戶(hù)口所在地邊遠(yuǎn)郊區(qū)中心城市 N 2 50 40 30 20 10 0 收入情況未來(lái)收入情況戶(hù)口所在地邊遠(yuǎn)郊區(qū)中心城市 N descriptive statistics- crosstabs (2)選擇一個(gè)變量作為行變量到row框. (3)選擇一個(gè)變量作為列變量到column框. (4)可選一個(gè)或多個(gè)變量作為控制變量到layer框. 控制變

38、量的層次設(shè)置:同層為水平數(shù)加水平數(shù)加;不同層為水平數(shù)積水平數(shù)積. (5)是否顯示各分組的棒圖(display clustered bar charts ) 產(chǎn)生交叉列聯(lián)表應(yīng)用舉例戶(hù)口與收入水平有關(guān)聯(lián)嗎嗎？行變量：戶(hù)口；列變量：月收入不同戶(hù)口不同收入水平的儲(chǔ)戶(hù)對(duì)物價(jià)水平的看法一致嗎？行變量：收入水平；列變量：物價(jià)水平；控制變量：戶(hù)口產(chǎn)生交叉列聯(lián)表應(yīng)用舉例不同戶(hù)口不同收入水平的儲(chǔ)戶(hù)對(duì)物價(jià) 水平水平的看法一致嗎？產(chǎn)生交叉列聯(lián)表進(jìn)一步計(jì)算 cells選項(xiàng):選擇在頻數(shù)分析表中輸出各種百分比. row:行百分比(Row pct); column:列百分比(Col pct);

39、total:總百分比(Tot pct); 分析列聯(lián)表中變量間的關(guān)系目的：通過(guò)列聯(lián)表分析，檢驗(yàn)行列變量之間是否獨(dú)立。方法：卡方檢驗(yàn)：對(duì)品質(zhì)數(shù)據(jù)的相關(guān)性進(jìn)行度量分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn) 年齡與工資收入交叉列聯(lián)表低中高青 400 00 中 0 5000 老 0 0600 低中高青 0 0500 中 0 6000 老 400 00 分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)基本步驟 (1)H0:行列變量之間無(wú)關(guān)聯(lián)或相互獨(dú)立 (2)構(gòu)造卡方統(tǒng)計(jì)量統(tǒng)計(jì)量服從(r-1)*(c-1)個(gè)自由度的卡方分布 count:觀察(實(shí)際)頻數(shù) expected count:期望頻數(shù) (期望頻數(shù)

40、反映的是H0成立情況下的數(shù)據(jù)分布特征) Residual:剩余 (觀察頻數(shù)-期望頻數(shù)) e eo f ff 2 2 )( 分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)基本步驟 (3)計(jì)算卡方統(tǒng)計(jì)量的值，并得到該統(tǒng)計(jì)量值的概率P 值 (4)決策。概率P與顯著性水平比較，小于等于則拒絕 H0,否則不能拒絕實(shí)現(xiàn)步驟 statistics選項(xiàng) cells選項(xiàng) 分析列聯(lián)表中變量間的關(guān)系應(yīng)用舉例戶(hù)口對(duì)平均收入水平的分布會(huì)產(chǎn)生影響嗎？獨(dú)立性檢驗(yàn)：從一個(gè)總體中隨機(jī)抽樣。按某兩個(gè)屬性變量將樣本進(jìn)行分類(lèi) 不同行業(yè)人對(duì)的自己職業(yè)的選擇標(biāo)準(zhǔn)是否存在差異？一致性檢驗(yàn)：從兩個(gè)總體中獨(dú)立抽樣，根據(jù)一個(gè)屬性變量將樣本進(jìn)

41、行分類(lèi)。制造業(yè) 服務(wù)業(yè) 物質(zhì)報(bào)酬 105 45 穩(wěn)定性 40 35 分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)的要求: 一般要求列聯(lián)表中期望頻數(shù)小于5的格子數(shù)不超過(guò) 20%，否則會(huì)夸大卡方值，容易得出拒絕結(jié)論，可以合并單元格。卡方值會(huì)受樣本數(shù)的影響分析列聯(lián)表中變量間的關(guān)系行列變量相關(guān)性的其他測(cè)度指標(biāo) phi系數(shù)：適用于22列聯(lián)表當(dāng)行列變量獨(dú)立時(shí)：有：當(dāng)行列變量完全相關(guān)時(shí)：有：越接近于1，相關(guān)性越強(qiáng)。越接近0，相關(guān)性越弱 2 12 1 11 C A C A 2121 21122211 2 CCRR AAAA n 0 2211 AA 1 分析列聯(lián)表中變量間的關(guān)系行列變量相關(guān)性的其他測(cè)

42、度指標(biāo) 列聯(lián)C系數(shù)(contingency coefficient）, 通常為0,1),取值受到行列數(shù)的影響（見(jiàn)EXCEL） V系數(shù) 0,1 值越大表示行列變量的相關(guān)性越大 n C 2 2 )1(),1min( 2 crn V 多選項(xiàng)分析多選項(xiàng)分析的基本思路定義多選項(xiàng)變量集多選項(xiàng)頻數(shù)分析多選項(xiàng)交叉分組下的頻數(shù)分析多選項(xiàng)分析定義多選項(xiàng)變量集目的:將已分解的變量定義為一個(gè)集合,便于進(jìn)行多選項(xiàng)分析菜單選項(xiàng):analyze-multiple response-define sets 從原變量中選取被分解的變量(數(shù)值型)到variables in sets框指定被分解的變量是按多選

43、項(xiàng)二分法(dichotomize) 分解還是按多選項(xiàng)分類(lèi)法(categories)分解的為變量集命名。系統(tǒng)自動(dòng)在名字前加字符$. 多選項(xiàng)分析多選項(xiàng)頻數(shù)分析菜單選項(xiàng):analyze-multiple response-frequencies 多選項(xiàng)交叉分析下的頻數(shù)分析菜單選項(xiàng):analyze-multiple response-crosstabs 多選項(xiàng)分析多選項(xiàng)分析實(shí)例分析居民的儲(chǔ)蓄目的采用多選項(xiàng)分類(lèi)法組織數(shù)據(jù) 在某次市場(chǎng)調(diào)查中收集了北京、上海和廣州三個(gè)城市的受訪者對(duì)幾種常見(jiàn)飲料的喜好情況，可選的飲料有茶、牛奶、咖啡、果汁、礦泉水。（數(shù)據(jù)是從原始數(shù)據(jù)庫(kù)中抽出的一小部分資料）

44、，作以下分析：采用二分法組織數(shù)據(jù) 受訪人群中最受歡迎的飲料是哪種？男、女喜愛(ài)的飲料有無(wú)差異？三個(gè)城市的人群對(duì)飲料的喜好有無(wú)差異？作業(yè) 根據(jù)第三章的關(guān)于學(xué)生成績(jī)的合并后的 SPSS數(shù)據(jù)文件做以下處理：對(duì)各門(mén)課程分組后，做頻數(shù)分析，繪制某兩門(mén)課程成績(jī)的直方圖繪制男女生構(gòu)成的餅圖分別計(jì)算男女生各門(mén)成績(jī)的基本描述統(tǒng)計(jì)量，并對(duì)數(shù)據(jù)的集中趨勢(shì)、離散程度和偏度加以比較（數(shù)字和圖形的對(duì)比）第五章 SPSS參數(shù)檢驗(yàn) 假設(shè)檢驗(yàn)概述假設(shè)檢驗(yàn)是一種根據(jù)樣本數(shù)據(jù)來(lái)推斷總體的分布或均值、方差等總體統(tǒng)計(jì)參數(shù)的方法。根據(jù)樣本來(lái)推斷總體的原因：總體數(shù)據(jù)不可能全部收集到。如：質(zhì)量檢測(cè)問(wèn) 題收集到總

45、體全部數(shù)據(jù)要耗費(fèi)大量的人力和財(cái)力假設(shè)檢驗(yàn)包括：參數(shù)檢驗(yàn) 非參數(shù)檢驗(yàn) 假設(shè)檢驗(yàn)的基本原理基本信念：利用小概率原理進(jìn)行反證明。小概率事件在一次實(shí)驗(yàn)中不可能發(fā)生。例如：對(duì)人民大學(xué)男生平均身高進(jìn)行推斷 H0：平均身高為173 樣本平均身高為178，由于存在抽樣誤差，不能直接拒絕H0。而需要考慮：在H0成立的條件下，一次抽樣得到平均身高為 178的可能性有多大。如果可能性較大，是個(gè)大概率事件（與相比較），則不能認(rèn)為H0不正確。否則，如果可能性較小，是個(gè)小概率事件，但確實(shí)發(fā)生了，則只能認(rèn)為H0不正確。概率P值即為觀測(cè)結(jié)果或更極端現(xiàn)象在零假設(shè)成立時(shí)出現(xiàn)的概率假設(shè)檢驗(yàn)的基本步驟 (1)根

46、據(jù)檢驗(yàn)的目標(biāo)，對(duì)待推斷的總體參數(shù)或分布作一個(gè)基本假設(shè)H0 (2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,且該統(tǒng)計(jì)量服從某種已知分布. (3)利用收集到的樣本數(shù)據(jù)和基本假設(shè)計(jì)算檢驗(yàn)統(tǒng)計(jì) 量的值，并得到相應(yīng)的相伴概率P值，即：檢驗(yàn)統(tǒng)計(jì) 量在某個(gè)特定的極端區(qū)域取值在H0成立時(shí)的概率. (4)如果概率P值小于用戶(hù)給定的顯著性水平a，則拒絕H0 .否則，不拒絕H0 . SPSS中的參數(shù)檢驗(yàn)方法單樣本t檢驗(yàn) 兩獨(dú)立樣本t檢驗(yàn) 兩配對(duì)樣本t檢驗(yàn) SPSS單樣本t檢驗(yàn) (一)含義：檢驗(yàn)?zāi)匙兞康目傮w均值與指定的檢驗(yàn)值之間是否存在顯著差異。例如：周歲兒童的平均身高是否為75厘米 (二)要求：樣本來(lái)自的總體服從正態(tài)分布為什

47、么？ SPSS單樣本t檢驗(yàn) (三)基本思路： H0:u=u0,總體均值與檢驗(yàn)值之間不存在顯著差異. 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.從樣本均值的分布出發(fā),即:N(u0, 2/n).于是：總體方差未知時(shí)構(gòu)造t統(tǒng)計(jì)量 D=X- u0 t統(tǒng)計(jì)量服從n-1個(gè)自由度的t分布計(jì)算t統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率P(絕對(duì)值大于等于的雙側(cè)概率) 結(jié)論:P,則拒絕H0,認(rèn)為總體均值與檢驗(yàn)值之間有顯著差異.P ,不能拒絕H0. nS D t / SPSS單樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng): Analyze-compare means-one-samples T test (2).指定檢驗(yàn)值: 在test后的框

48、中輸入檢驗(yàn)值 SPSS單樣本t檢驗(yàn) (五)option選項(xiàng) confidence interval:指定輸出0的置信區(qū)間.默認(rèn)值為 95%. Missing values: 缺失值的處理(單樣本檢驗(yàn)時(shí)以下選項(xiàng)沒(méi) 有差別) exclude cases analysis by analysis:當(dāng)分析時(shí)涉及到有缺失值變量時(shí)再剔除相應(yīng)的個(gè)案 exclude cases listwise:剔除所有含缺失值的個(gè)案后再分析 SPSS單樣本t檢驗(yàn) (六)應(yīng)用舉例周歲兒童的平均身高為75厘米嗎？根據(jù)以前的大量調(diào)查，已知顧客對(duì)某產(chǎn)品的滿(mǎn)意度評(píng)分在72分左右，現(xiàn)該產(chǎn)品進(jìn)行了重新包裝，收集了一批顧客的滿(mǎn)

49、意度評(píng)分，現(xiàn) 在的評(píng)價(jià)是否顯著高于以前？ SPSS兩獨(dú)立樣本t檢驗(yàn) (一)含義: 根據(jù)兩獨(dú)立樣本的數(shù)據(jù),對(duì)兩總體均值是否有顯著差異進(jìn)行推斷。例如：男生和女生的計(jì)算機(jī)平均成績(jī)有顯著差異嗎？ (二)要求: 兩樣本必須相互獨(dú)立,即:抽取其中一批樣本對(duì)抽取另一批樣本沒(méi)有任何影響.(如:北京周歲兒童與上海兒童的平均身高) 兩總體服從正態(tài)分布為什么？ SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路： H0:u1-u2=0,兩總體均值無(wú)顯著差異. 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.從兩樣本均值差的分布出發(fā), 即:N(u1-u2, 2x1-x2).于是兩總體均方差未知時(shí)構(gòu)造t統(tǒng) 計(jì)量：兩總體均值差的抽樣分布標(biāo)準(zhǔn)差：方差

50、相等：用合并方差方差不等：計(jì)算t統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率P (絕對(duì)值大于等于該值的雙側(cè)概率) )2( / 21 2 2 1 2 21 nnt nSpnSp xx t )( / )( 2 2 21 2 1 21 ft nSnS xx t 1 )( 1 )( )( 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 n n S n n S n S n S f SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路：結(jié)論：方差齊性F檢驗(yàn) 利用Levene F檢驗(yàn)確定兩總體方差是否齊性.H0:兩總體方差無(wú)顯著差異. 該檢驗(yàn)首先計(jì)算每個(gè)個(gè)案與所屬組均值之差并取絕對(duì)值.然后對(duì)其進(jìn)行單因素方差分

51、析. SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路：結(jié)論：首先,如果F檢驗(yàn)的P,則拒絕F檢驗(yàn)的H0,認(rèn)為方差不齊性; 其次看Unequal行的t檢驗(yàn)概率.如果,則拒絕t檢驗(yàn)的H0, 認(rèn)為兩總體均值有顯著差異;如果,則不拒絕t檢驗(yàn)的H0. 首先,如果F檢驗(yàn)的P ,則不能拒絕F檢驗(yàn)的H0,認(rèn)為方差齊性;其次看equal行的t檢驗(yàn)概率.其余同上 SPSS兩獨(dú)立樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng):analyze-compare means-independent- samples T (2).選擇若干變量作為檢驗(yàn)變量到test variables框 (3).選擇代表不同總體的變量作為分

52、組變量到grouping variable 框 (4).定義分組變量的分組情況Define Groups.： use specified values:定義分組變量的分組標(biāo)志值分別是什么 cut point:分組變量為連續(xù)變量.輸入一個(gè)數(shù)字,將大于等于該值的分成一組,小于該值的分成另一組. SPSS兩獨(dú)立樣本t檢驗(yàn) 應(yīng)用舉例上海周歲兒童的平均身高與北京周歲兒童的平均身高有顯著差異嗎？某商場(chǎng)為某種產(chǎn)品進(jìn)行了促銷(xiāo)活動(dòng)，請(qǐng)比較前后數(shù)日的銷(xiāo)售額，以確認(rèn)促銷(xiāo)活動(dòng)對(duì)銷(xiāo)量有無(wú)作用。 A、B兩種減肥產(chǎn)品的作用有明顯差異嗎？隨機(jī)選了200名肥胖者服用A種減肥產(chǎn)品，其中： 92人體重明顯減輕了；另隨

53、機(jī)選了183名肥胖者服用B減肥產(chǎn)品，其中：161人體重明顯減輕了。 SPSS兩配對(duì)樣本t檢驗(yàn) (一) 含義: 根據(jù)配對(duì)樣本對(duì)兩總體均值是否有顯著差異進(jìn) 行推斷. 例如：某種減肥茶是否有效 (二)要求: 兩樣本數(shù)據(jù)必須兩兩配對(duì),即:樣本個(gè)數(shù)相同,個(gè) 案順序相同.如:減肥茶的效果、不同廣告形式對(duì)銷(xiāo)售額的影響.(控制了個(gè)案自身的影響) 兩總體服從正態(tài)分布 SPSS兩配對(duì)樣本t檢驗(yàn) (三)基本思路 H0:兩總體均值無(wú)顯著差異,差值序列的均值u0 =0. 構(gòu)造統(tǒng)計(jì)量：同單樣本均值檢驗(yàn) D=X- u0 S為差值序列的標(biāo)準(zhǔn)差實(shí)質(zhì)是先求出每對(duì)測(cè)量值的差值;然后檢驗(yàn)差值序列的均值是否與0有顯著差異.

54、如果差值的均值與0有顯著差異,則認(rèn)為兩總體均值存在顯著差異;否則,與0無(wú)顯著差異,則認(rèn)為兩總體均值不存在顯著差異. nS D t / SPSS兩配對(duì)樣本t檢驗(yàn) (三)基本思路計(jì)算t統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率P(絕對(duì)值大于等于的雙側(cè)概率) 結(jié)論:P,則拒絕H0,認(rèn)為兩總體均值有顯著差異.P , 不能拒絕H0. SPSS兩配對(duì)樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng): analyze-compare means-paired-samples T (2).選擇一對(duì)或若干對(duì)配對(duì)變量作為檢測(cè)變量到paired variables框. (3)option選項(xiàng) 同獨(dú)立樣本的T檢驗(yàn) SPSS兩配對(duì)

55、樣本t檢驗(yàn) 應(yīng)用舉例某種減肥茶真起到減肥作用了嗎？對(duì)促銷(xiāo)人員培訓(xùn)前和培訓(xùn)后銷(xiāo)售額的比較，以確認(rèn)業(yè)務(wù)培訓(xùn)有無(wú)效果。作業(yè) 一、給幼鼠以不同的飼料，研究每天鈣的留存量是否有顯著不同。以下兩種方法涉及實(shí)驗(yàn)樣本：方式1：同一鼠喂不同的飼料鼠號(hào) 1 2 3 4 5 6 7 8 9 飼料1 33.1 33.1 26.8 36.3 39.5 30.9 33.4 31.5 28.6 飼料2 36.7 28.8 35.1 35.2 43.8 25.7 36.5 37.9 28.7 方式2：甲組12只喂飼料1，乙組9只喂飼料2 甲組：29.7 26.7 28.9 31.1 31.1 26.8 26.3

56、 39.5 30.9 33.4 33.1 28.6 乙組：28.7 28.3 29.3 32.2 31.1 30.0 36.2 36.8 30.0 二、根據(jù)學(xué)生成績(jī)數(shù)據(jù)，分析：是否有男女生平均成績(jī)存在明顯差異的課程判斷學(xué)生在哪些課程上的平均成績(jī)差別不明顯第六章方差分析方差分析概述一、問(wèn)題的提出最優(yōu)方案的設(shè)計(jì) l如何獲得最佳的產(chǎn)品銷(xiāo)售量 l哪些因素是影響銷(xiāo)售量的主要因素 l哪些因素的那種情況更利于提高銷(xiāo)售量 l哪些因素的組合更利于提高銷(xiāo)售量 l可以利用方差分析的方法來(lái)實(shí)現(xiàn) 方差分析概述二、方差分析目的：方差分析從分析數(shù)據(jù)的差異入手，分析哪些因素是影響數(shù)據(jù)差異的眾多因素中的主要

57、因素. 相關(guān)概念： (1)觀測(cè)變量:作為觀測(cè)的對(duì)象(如：畝產(chǎn)量、推銷(xiāo)量等). (2)控制因素：人為可以控制的因素(如:施肥量、品種、推銷(xiāo)策略、價(jià)格、包裝方式等)，在方差分析中稱(chēng)為控制因素.將控制變量的不同情況稱(chēng)為控制變量的不同水平. (3)隨機(jī)因素：人為很難控制的因素(如:氣候、推銷(xiāo)人員的形象、抽樣誤差等)，方差分析中主要指抽樣誤差。方差分析概述三、核心問(wèn)題從數(shù)據(jù)差異角度看: 觀測(cè)變量的數(shù)據(jù)差異=控制因素造成+隨機(jī)因素造成當(dāng)控制因素對(duì)實(shí)驗(yàn)結(jié)果有顯著影響時(shí),和隨機(jī)因素共同作用必然使觀測(cè)變量產(chǎn)生顯著變動(dòng);反之,觀測(cè)變量的變動(dòng)較小,將歸結(jié)為隨機(jī)性造成的(這里指抽樣誤差造成的). 方

58、差分析概述四、方差分析的類(lèi)型單因素方差分析: 只考慮一個(gè)控制因素的影響多因素方差分析: 考慮兩個(gè)以上的控制因素和它們的交互作用對(duì)觀測(cè)變量的影響協(xié)方差分析：在盡量排除其他因素的影響下，分析單個(gè)或多個(gè)控制因素對(duì)觀測(cè)變量的影響.(引入?yún)f(xié)變量) 單因素方差分析 (一)目的檢驗(yàn)?zāi)骋粋€(gè)一個(gè)控制因素的改變是否會(huì)給觀察變量帶來(lái)顯著影響. 例如：應(yīng)用面很廣（科學(xué)試驗(yàn)，社會(huì)經(jīng)濟(jì)問(wèn)題）考察不同肥料對(duì)某農(nóng)作物畝產(chǎn)量是否有顯著差異. 考察不同溫度下某化工產(chǎn)品的獲得率考察婦女生育率在不同地區(qū)是否有顯著差異. 考察不同學(xué)歷是否對(duì)工資收入產(chǎn)生顯著影響. 單因素方差分析 (二)基本思路 (1)入手點(diǎn): 檢

59、驗(yàn)控制變量的不同水平下，各總體的分布是否存在顯著差異，進(jìn)而判斷控制變量是否對(duì)觀測(cè)變量產(chǎn) 生了顯著影響. (2)前提: 各組樣本獨(dú)立不同水平下各總體服從方差相等方差相等的正態(tài)分布正態(tài)分布. (3) H0:不同水平下,各總體均值無(wú)顯著差異.即:不同水平下控制因素的影響不顯著. 通過(guò)參數(shù)檢驗(yàn)可以解決兩兩總體均值的比較多個(gè)總體均值的檢驗(yàn)如何作？(如：北京、上海、廣州周歲兒童平均身高的比較）可以多次采用兩樣本t檢驗(yàn)方法實(shí)現(xiàn) 產(chǎn)生的問(wèn)題：犯第一類(lèi)錯(cuò)誤的概率明顯增大例如：K個(gè)變量?jī)蓛蛇M(jìn)行t檢驗(yàn)，需要作N=k! (2! (k-2)!)次，如果為 0.05，那么每次不犯錯(cuò)的概率為0.95。N次檢驗(yàn)

60、均不犯錯(cuò)的概率為 0.95N，而犯錯(cuò)的概率為1-0.95N，遠(yuǎn)遠(yuǎn)大于設(shè)定的0.05 可以利用方差分析的方法來(lái)實(shí)現(xiàn)多個(gè)總體的均值比較單因素方差分析單因素方差分析 (二)基本思路 (4) 構(gòu)造F統(tǒng)計(jì)量因?yàn)?總變差=組間差異+組內(nèi)差異可證明:SST= SSA+SSE(設(shè):k個(gè)水平，每個(gè)水平有ni 個(gè)數(shù)據(jù)) 考察平均的組間差異與平均的組內(nèi)差異的比值,于是: k i ii xxnSSA 1 2 )( k ii nj j iij xxSSE 1 2 )( MSE MSA knSSE kSSA F )/( ) 1/( k i nj j ij xxSST 11 2 )( F(k-1,n-k) 單因素方

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔