薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第1頁(yè)
薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第2頁(yè)
薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第3頁(yè)
薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第4頁(yè)
薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第5頁(yè)
已閱讀5頁(yè),還剩312頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 第一章第一章 SPSS SPSS 概述概述 SPSS概述 SPSS: Statistical Package for Social Science Statistical Product and Service Solutions SPSS的發(fā)展: l 60年代:美國(guó)斯坦福大學(xué)三位研究生研制 l 70年代:SPSS總部成立于芝加哥,推出SPSSX中小型機(jī)版 l 80年代:SPSS公司(SPSS/PC+微機(jī)版13) l 90年代:SPSS公司(SPSS WINDOWS版514) SPSS 主要特點(diǎn) 操作簡(jiǎn)便。絕大多數(shù)操作是通過(guò)菜單、按鈕、對(duì)話框 完成的。 無(wú)需計(jì)算機(jī)編程、需記憶大量命令和參數(shù)。

2、 分析方法豐富、分析結(jié)果清晰、直觀。 可以直接讀取其他軟件格式的數(shù)據(jù)文件,如:dbf、xls、 sas等。 最新版本采用分布式分析系統(tǒng),適應(yīng)互聯(lián)網(wǎng),支持動(dòng) 態(tài)收集、分析數(shù)據(jù)和HTML報(bào)告 與一般的辦公軟件直接兼容不方便 SPSS主要窗口:數(shù)據(jù)編輯窗口 窗口標(biāo)題:data editor 功能:對(duì)SPSS的數(shù)據(jù)文件數(shù)據(jù)文件進(jìn)行錄入、 修改、 管理等基本操作的窗口。 組成:窗口主菜單、工具欄、數(shù)據(jù)編輯區(qū)、狀態(tài)顯示 區(qū) 特點(diǎn): SPSS運(yùn)行過(guò)程中自動(dòng)打開(kāi) SPSS中各統(tǒng)計(jì)分析功能都是針對(duì)該窗口中的數(shù)據(jù)進(jìn) 行的 窗口中的數(shù)據(jù)文件以.sav存于磁盤(pán)上 兩個(gè)視圖:數(shù)據(jù)視圖和變量視圖 SPSS主要窗口:數(shù)據(jù)輸

3、出窗口 窗口標(biāo)題:viewer 功能:SPSS統(tǒng)計(jì)分析報(bào)表及圖形的輸出的窗口。 組成:窗口主菜單、工具欄、結(jié)果顯示區(qū)、狀態(tài)顯示 區(qū) 特點(diǎn): 在進(jìn)行第一次分析時(shí)自動(dòng)打開(kāi),也可手工打開(kāi) 可以手工打開(kāi)若干個(gè)可相互切換若干個(gè)可相互切換的viewer窗口;狀 態(tài)欄上的!表示當(dāng)前輸出窗口 輸出窗口可以關(guān)閉,窗口內(nèi)容以.SPO存于磁盤(pán)上 兩個(gè)視圖:目錄視圖和內(nèi)容視圖 SPSS主要窗口:數(shù)據(jù)輸出窗口 駕馭數(shù)據(jù)出輸出窗口 一般操作 結(jié)果文件的打開(kāi)和保存 加密保存 窗口元素的移動(dòng)和刪除 標(biāo)準(zhǔn)的拖放式操作 在大綱視圖中操作最方便 結(jié)果的導(dǎo)出 以純文本格式導(dǎo)出、以HTML格式導(dǎo)出 如何在WORD中引用分析結(jié)果 統(tǒng)計(jì)表

4、格:拷貝或拷貝對(duì)象 統(tǒng)計(jì)圖:拷貝對(duì)象 表格的編輯 表格狀態(tài)的確定 單元格內(nèi)容編輯 行列轉(zhuǎn)置 Autofit 表格樣式的變換 SPSS基本運(yùn)行方式 完全窗口菜單方式: 所有分析操作過(guò)程都是通過(guò)菜單和按鈕及對(duì)話框方式進(jìn)行的. 是經(jīng)常使用的一種運(yùn)行方式,適用于一般分析和SPSS的初學(xué)者. SPSS基本運(yùn)行方式 程序運(yùn)行方式: 手工編寫(xiě)SPSS命令程序 一次性提交計(jì)算機(jī)運(yùn)行 適用于大規(guī)模的分析工作和熟練的SPSS程序員. 實(shí)現(xiàn)方法: (1)打開(kāi)SYNTAX語(yǔ)句窗口并編寫(xiě)和修改SPSS程序 (2)點(diǎn)擊語(yǔ)句窗口中的RUN菜單項(xiàng),選擇運(yùn)行方式運(yùn)行 Syntax語(yǔ)句窗口 窗口標(biāo)題: syntax editer

5、 功能:編寫(xiě)和修改SPSS程序的窗口. 特點(diǎn): 打開(kāi): FILE - NEW - SYNTAX或FILE-OPEN- .SPS擴(kuò)展名 窗口中的程序以.SPS存于磁盤(pán)上 菜單項(xiàng)RUN中提供四種程序執(zhí)行方式:All、Selection、 Current、To end SPSS 基本運(yùn)行方式 菜單程序混合運(yùn)行方式: 先通過(guò)菜單選擇分析過(guò)程和參數(shù),不立即提交(OK) 執(zhí)行,而是按動(dòng)PASTE按鈕. 計(jì)算機(jī)自動(dòng)將用戶(hù)剛定義的分析過(guò)程和參數(shù)轉(zhuǎn)換成 SPSS的命令,并顯示到SYNTAX語(yǔ)句窗口中. 用戶(hù)可對(duì)其進(jìn)行必要的修改后再提交給計(jì)算機(jī)執(zhí)行. 一般適用于熟練的SPSS程序員. 利用SPSS進(jìn)行數(shù)據(jù)分析的步

6、驟 建立SPSS數(shù)據(jù)文件 定義數(shù)據(jù)文件結(jié)構(gòu) 錄入修改和編輯待分析數(shù)據(jù) 數(shù)據(jù)的統(tǒng)計(jì)分析 統(tǒng)計(jì)分析之前的預(yù)處理 統(tǒng)計(jì)分析 數(shù)據(jù)和分析結(jié)果的保存 結(jié)果的說(shuō)明和解釋 思考復(fù)習(xí) SPSS有哪兩個(gè)主要窗口?功能是什么? 有哪些特點(diǎn)? SPSS有哪些運(yùn)行方式?特點(diǎn)是什么? 第二章 SPSS數(shù)據(jù)文件的 建立和管理 一份簡(jiǎn)單的調(diào)查問(wèn)卷 單項(xiàng)選擇題 提供幾個(gè)備選擇答案,從其中選擇一個(gè)答案 變量類(lèi)型:分類(lèi)數(shù)據(jù)、定序數(shù)據(jù) 數(shù)據(jù)類(lèi)型:字符型 填空題 變量類(lèi)型:定距數(shù)據(jù) 數(shù)據(jù)類(lèi)型:數(shù)值型 如何利用SPSS組織數(shù)據(jù) SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件 年級(jí) 性別問(wèn)題1問(wèn)題n 11. 4 222 . 文件結(jié)構(gòu) 數(shù)據(jù) 個(gè)案

7、 case 變量名 變量 用字符或數(shù)字表示字符型數(shù)據(jù) SPSS數(shù)據(jù)文件一般只能通過(guò)SPSS軟件打開(kāi) 一份簡(jiǎn)單的調(diào)查問(wèn)卷 l多項(xiàng)選擇題 l提供幾個(gè)備選擇答案,從其中選擇多個(gè)答案 如:在下列品牌中您信任哪些品牌? 被診斷為高血要后你采取了以下哪些輔助治療手段? 如:高考時(shí)報(bào)考學(xué)校 (1)北京大學(xué) (2)清華大學(xué) (3)人民大學(xué) (4)北京理工大學(xué) (5)北京師范大學(xué) (6)北京外國(guó)語(yǔ)大學(xué) l多項(xiàng)選擇題不能在SPSS中直接存儲(chǔ),因?yàn)镾PSS的一個(gè)變 量只能有一個(gè)取值 l多項(xiàng)選擇題的處理方法 l思路: 將一個(gè)問(wèn)題定義成幾個(gè)變量,用這幾個(gè)變量來(lái)描述 該問(wèn)題的幾個(gè)可能被選擇的答案。 l編碼方式: 多選項(xiàng)二

8、分法(multiple dichotomize method) 多選項(xiàng)分類(lèi)法(multiple category method) l多選項(xiàng)二分法 將每個(gè)答案作為一個(gè)變量,每個(gè)變量只有兩個(gè)取值 (0或1)。 例如: 變 量 名變 量 名 標(biāo) 簽編碼 方 案 X 1北 京 大 學(xué)01 X 2清 華 大 學(xué)01 X 3人 民 大 學(xué)01 X 4北 京 理 工 大 學(xué)01 X 5北 京 師 范 大 學(xué)01 X 6北 京 外 國(guó) 語(yǔ) 大 學(xué)01 如何利用SPSS組織數(shù)據(jù) l多選項(xiàng)分類(lèi)法: 預(yù)先估計(jì)多選項(xiàng)問(wèn)題可能被選擇的最多答案數(shù).為每個(gè) 答案建立一個(gè)變量,取值為多選項(xiàng)問(wèn)題的可選答案. 例如: 變 量 名

9、 變量 名標(biāo) 簽 編 碼 方 案 A第一 選 項(xiàng) (1 ) 北 京 大 學(xué) (2 ) 清 華 大 學(xué) (3 ) 人 民 大 學(xué) (4 ) 北 京 理 工 大 學(xué) (5 ) 北 京 師 范 大 學(xué) (6 ) 北 京 外 國(guó) 語(yǔ) 大 學(xué) B第二 選 項(xiàng) (1 ) 北 京 大 學(xué) (2 ) 清 華 大 學(xué) (3 ) 人 民 大 學(xué) (4 ) 北 京 理 工 大 學(xué) (5 ) 北 京 師 范 大 學(xué) (6 ) 北 京 外 國(guó) 語(yǔ) 大 學(xué) C第三 選 項(xiàng) (1 ) 北 京 大 學(xué) (2 ) 清 華 大 學(xué) (3 ) 人 民 大 學(xué) (4 ) 北 京 理 工 大 學(xué) (5 ) 北 京 師 范 大 學(xué) (6

10、 ) 北 京 外 國(guó) 語(yǔ) 大 學(xué) 如何利用SPSS組織數(shù)據(jù) 頻數(shù)數(shù)據(jù): 男女 統(tǒng)計(jì)1023 精算1220 如何利用SPSS組織數(shù)據(jù) 設(shè)置三個(gè)變量: 專(zhuān)業(yè)方向、性別、人數(shù) SPSS數(shù)據(jù)文件的結(jié)構(gòu) (一)變量名變量名(Variable name): 變量名是變量存取的唯一標(biāo)志。 起名規(guī)則: 不多于8個(gè)字符組成 不區(qū)分大小寫(xiě) 允許漢字作為變量名 默認(rèn)變量名為VARn,如:var00001 SPSS數(shù)據(jù)文件的結(jié)構(gòu) (二)變量的類(lèi)型變量的類(lèi)型(type)和顯示寬度和顯示寬度(width) 1、數(shù)值型: 標(biāo)準(zhǔn)數(shù)值型(Numeric):默認(rèn)類(lèi)型 8.2 如: 12345678、12345.67、-1234.

11、56 帶逗號(hào)的數(shù)值型(Comma): 從個(gè)位開(kāi)始三位一個(gè)逗號(hào)8.2 如:1,234.56 科學(xué)計(jì)數(shù)法(Scientific Notation):表示很大或很小的數(shù)據(jù) 8.2 如:1.2E+05 帶美元符號(hào)(Dollar):表示貨幣 格式很多,如:$12.30 SPSS數(shù)據(jù)文件的結(jié)構(gòu) 2 、字符型(String): 存儲(chǔ)字符數(shù)據(jù) 8位 如:beijing 處理時(shí)用雙引號(hào)擴(kuò)起來(lái) 3、日期型(Date):存儲(chǔ)日期數(shù)據(jù) 格式很多,如:20-AUG-1999 4、其他: 如:圓點(diǎn)數(shù)值型(dot)、用戶(hù)自定義型 (customer) 注意:顯示寬度不影響數(shù)據(jù)的存儲(chǔ) SPSS數(shù)據(jù)文件的結(jié)構(gòu) (三)變量名標(biāo)簽

12、變量名標(biāo)簽(Variable label) : 對(duì)變量名的一些解釋說(shuō)明,增強(qiáng)分析結(jié)果的可視性。 可以省略。 (四)變量值標(biāo)簽變量值標(biāo)簽(Value label) 對(duì)變量所取值的一些解釋說(shuō)明,增強(qiáng)分析結(jié)果的可 視性。可以省略。 一般用于品質(zhì)數(shù)據(jù) 如:1-男 2-女、1-高 2-中 3-低 SPSS數(shù)據(jù)文件的結(jié)構(gòu) (五)變量列格式變量列格式(Column Format) 對(duì)齊方式(Text Alignment) 左對(duì)齊(Left):字符型默認(rèn)。 右對(duì)齊(Right):數(shù)值型默認(rèn)。 居中對(duì)齊(Center) 列寬度(Column Width) 默認(rèn)值為變量的總長(zhǎng)度。 SPSS數(shù)據(jù)文件的結(jié)構(gòu) (六)缺

13、失值缺失值(Missing Values) 1、什么是缺失值? 漏填數(shù)據(jù) 明顯錯(cuò)誤的數(shù)據(jù) 2、對(duì)缺失值的一般處理 事先指定:指定某個(gè)特定值為缺失值(用戶(hù)缺失值) 其他處理方法,如:以均值、眾數(shù)替代等 3、SPSS缺失值 用戶(hù)缺失值 系統(tǒng)缺失值:數(shù)值型:點(diǎn) () 字符型:空 SPSS數(shù)據(jù)文件的結(jié)構(gòu) (七)變量計(jì)量尺度(七)變量計(jì)量尺度(Measurement) scale: 定距數(shù)據(jù),一般為數(shù)值型數(shù)據(jù)。 如:收入、人數(shù)。 ordinal: 有固有順序的順序水準(zhǔn)的數(shù)值型或字符型數(shù) 據(jù)。 如:職稱(chēng)、年齡段 nominal: 無(wú)固有順序的名義水準(zhǔn)的數(shù)值型或字符型數(shù) 據(jù)。 如:性別、民族 定義SPSS數(shù)

14、據(jù)文件結(jié)構(gòu) 操作方法:利用變量視圖 如何查看變量定義的情況 菜單選項(xiàng): Utilities - Variables SPSS數(shù)據(jù)的錄入與保存 錄入時(shí)應(yīng)注意: 黑框確定當(dāng)前數(shù)據(jù)單元 錄入帶有變量值標(biāo)簽的數(shù)據(jù):手工輸入代碼,屏幕 顯示變量值標(biāo)簽 凍結(jié)第一列 數(shù)據(jù)保存: 操作 保存格式: (1)*.sav :SPSS數(shù)據(jù)文件(默認(rèn))。 (2)*.dbf : dbase數(shù)據(jù)文件。 (3)*.xls : Excel工作表文件。 注意:有些信息會(huì)丟失 SPSS數(shù)據(jù)的編輯 (一)打開(kāi)數(shù)據(jù)文件 菜單選項(xiàng):File - Open - .sav (二)數(shù)據(jù)定位 按個(gè)案號(hào)碼定位 菜單: Data - Go to c

15、ase - 輸入樣本號(hào) 按值定位 光標(biāo)定位到某列變量上光標(biāo)定位到某列變量上 - Edit - Find. SPSS數(shù)據(jù)的編輯 (三)插入和刪除一個(gè)個(gè)案 插入:data-insert case 刪除:選定待刪行,鼠標(biāo)右鍵找到Cut (四)插入和刪除一個(gè)變量 插入:光標(biāo)定位到某列變量上光標(biāo)定位到某列變量上 - Data - Insert Variable (插到某列前) 或鼠標(biāo)右鍵 刪除:選定列,鼠標(biāo)右鍵Cut項(xiàng) SPSS數(shù)據(jù)的編輯 (五)數(shù)據(jù)移動(dòng)、復(fù)制和刪除 定義源數(shù)據(jù)塊 鼠標(biāo)右鍵:cut copy clear 確定目標(biāo)單元 鼠標(biāo)右鍵:paste 數(shù)據(jù)文件的合并 目的: 將兩個(gè)SPSS數(shù)據(jù)文件合

16、并到一個(gè)數(shù)據(jù)文件 中 文件合并的方式: 縱向合并 橫向合并 (一)縱向數(shù)據(jù)合并 (1)含義含義: 將磁盤(pán)上的一個(gè)SPSS數(shù)據(jù)文件追加追加到當(dāng)前data editor窗口中的數(shù)據(jù) 文件中。 (2)前提前提: 兩個(gè)SPSS數(shù)據(jù)文件應(yīng)可以合并的內(nèi)容可以合并的內(nèi)容,且最好有相同的相同的變量名和 變量類(lèi)型。 (3)菜單選項(xiàng)菜單選項(xiàng): data - merge file - add cases 數(shù)據(jù)文件的合并 數(shù)據(jù)文件的合并 (二)橫向數(shù)據(jù)合并 (1)含義含義: 將磁盤(pán)上的一個(gè)SPSS數(shù)據(jù)文件中的若干個(gè)變量增加 到當(dāng)前data editor窗口的數(shù)據(jù)文件中。 (2)前提前提: a.兩個(gè)數(shù)據(jù)文件必須必須有一

17、個(gè)共同的變量名為關(guān)鍵字段 -合并的依據(jù); b. 兩個(gè)數(shù)據(jù)文件應(yīng)事先按關(guān)鍵字段升序排序。 數(shù)據(jù)文件的合并 (二)橫向數(shù)據(jù)合并 (3)菜單選項(xiàng)菜單選項(xiàng): data - merge file - add variable (4)選項(xiàng)說(shuō)明選項(xiàng)說(shuō)明: math cases on key variables in sorted files:以關(guān)鍵字作 為合并標(biāo)志。 Both files provide cases:合并后的文件的數(shù)據(jù)由兩個(gè) 文件共同提供。 External file is keyed table:以data editor的數(shù)據(jù)為基礎(chǔ)。 Working data file is keyed

18、table:以磁盤(pán)文件的數(shù)據(jù)為 基礎(chǔ)。 與其他軟件數(shù)據(jù)共享 共享dbf和xls格式文件 菜單選項(xiàng): Data - Open (1)*.dbf : dbase數(shù)據(jù)文件。字段名、字段類(lèi)型自動(dòng)轉(zhuǎn)成 SPSS數(shù)據(jù)文件中的變量名和類(lèi)型。一條記錄為一個(gè)個(gè) 案。 (2)*.xls : Excel文件 (Read variable name選項(xiàng)) 共享數(shù)據(jù)庫(kù)文件 建立ODBC數(shù)據(jù)源 第三章 SPSS數(shù)據(jù)文件的基本 加工和處理 SPSS數(shù)據(jù)文件的基本加工和處理 數(shù)據(jù)文件的整理 個(gè)案排序、個(gè)案選取 數(shù)據(jù)加工 變量計(jì)算、計(jì)數(shù) 數(shù)據(jù)分組 自動(dòng)分組、手工分組 數(shù)據(jù)文件的其他處理功能 指定加權(quán)變量 目的: 將所有個(gè)案按照

19、用戶(hù)指定的某一個(gè)或多個(gè)變量 的變量值的升序或降序重新排列。 菜單選項(xiàng): data - sort cases 注意: (1)Ascending:升序、Descending:降序。 (2)多重排序,選擇變量名的次序很關(guān)鍵。 個(gè)案排序 排序在數(shù)據(jù) 分析中的作 用? 個(gè)案選取 目的: 從現(xiàn)有數(shù)據(jù)中挑選出部分?jǐn)?shù)據(jù)。 菜單選項(xiàng): data - select cases 選取個(gè)案的幾種不同方式 (1)選擇符合一定條件的個(gè)案(If condition is satisfied) (2)隨機(jī)選取個(gè)案(Random sample of cases) 近似選取、精確選取 (3)選取某一區(qū)域內(nèi)的個(gè)案(Based on

20、 time or case range) (4)使用過(guò)濾變量(use filter variable) 注意:以后的操作和分析都在該個(gè)案選取的基礎(chǔ)上 進(jìn)行. 個(gè)案選取在數(shù) 據(jù)分析中的作 用? 變量計(jì)算 目的:產(chǎn)生新變量或?qū)υ兞窟M(jìn)行必要的轉(zhuǎn)換處理 (如:預(yù)測(cè)問(wèn)題 產(chǎn)生比率數(shù)據(jù) 偏態(tài)數(shù)據(jù)的正態(tài)處理 時(shí)間序列的平穩(wěn)處 理等) (1)含義: 根據(jù)用戶(hù)給出的SPSS算術(shù)表達(dá)式,對(duì)所有或部分樣本 數(shù)據(jù)進(jìn)行加工。 (2)菜單選項(xiàng): transform-compute if 按鈕 (3)SPSS算術(shù)表達(dá)式(Numeric Expression): 由算術(shù)運(yùn)算符(+ 、-、 *、 /、 *)、SPSS函數(shù)以及

21、SPSS 變量名組成的式子。 變量計(jì)算 算術(shù)函數(shù) 統(tǒng)計(jì)函數(shù) 分布函數(shù) 邏輯函數(shù) 字符串函數(shù) 缺失值函數(shù) 日期時(shí)間函數(shù) 其他函數(shù) (4) SPSS函數(shù) l算術(shù)函數(shù) lAbs():求絕對(duì)值 lsqrt():求平方根 lrnd():四舍五入后取整 ltrunc():截取小數(shù)部分取整 lmod():取余 lLn():自然對(duì)數(shù) lLg10():以10為底的對(duì)數(shù) (4) SPSS函數(shù) 變量計(jì)算 l統(tǒng)計(jì)函數(shù): lmean():均值 lsd():標(biāo)準(zhǔn)差 lsum():求總和 lcfvar():求變異系數(shù) lmax() min():求最大最小值 (4) SPSS函數(shù) 變量計(jì)算 l分布函數(shù): lnormal():

22、產(chǎn)生服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù)序列 luniform():產(chǎn)生均勻分布的隨機(jī)數(shù)序列 lrv.():產(chǎn)生指定分布的隨機(jī)數(shù)序列,如:rv.t(10) lcdf.():計(jì)算指定分布的累計(jì)概率值 lidf.():計(jì)算指定分布的臨界值 (4) SPSS函數(shù) 變量計(jì)算 l邏輯函數(shù): lrange():判斷變量值是否在指定的區(qū)間內(nèi) lany():判斷變量值是否為指定的若干值 l字符串函數(shù): lindex(S1,S2):判斷字符串S2在S1中首次出現(xiàn)的位置 llength():求字符串長(zhǎng)度 llower() upcase():字符串的大小寫(xiě)轉(zhuǎn)換 llpad():用指定字符補(bǔ)齊字符串為指定長(zhǎng)度 lltrim():

23、壓縮字符串空格 lsubstr():取子串 (4) SPSS函數(shù) 變量計(jì)算 l缺失值函數(shù) lmissing():判斷變量是否取系統(tǒng)或用戶(hù)缺失值 lsysmis():判斷變量是否取系統(tǒng)缺失值 l其他函數(shù): lLag():便于進(jìn)行差分計(jì)算 (4) SPSS函數(shù) 變量計(jì)算 變量轉(zhuǎn)換 (5)SPSS條件表達(dá)式條件表達(dá)式: 條件表達(dá)式:由SPSS關(guān)系運(yùn)算符、邏輯運(yùn)算符、SPSS函 數(shù)以及SPSS變量名組成的式子。 關(guān)系運(yùn)算符: (大于)、 =(大于等于)、 32、sr32) and (sr=700) (nl=32) | (sr700) not xb=1 計(jì)數(shù) (1)含義: 對(duì)所有或部分個(gè)案,計(jì)算若干個(gè)變

24、量中有幾個(gè) 變量的值落在指定的區(qū)域內(nèi),并將結(jié)果存入新 變量中。 (2)菜單選項(xiàng)菜單選項(xiàng): transform - count - define value 產(chǎn)生計(jì)數(shù)變量 (3)指定區(qū)域的定義 Value:指定一個(gè)值 system-missing:系統(tǒng)缺失值 system-or user missing:系統(tǒng)或用戶(hù)缺失值 range through:指定一個(gè)閉區(qū)域,給出最大和最 小值 range: lowest through n:最小值到某個(gè)給定值 range: n through highest:某個(gè)給定值到最大值 數(shù)據(jù)文件的分類(lèi)匯總 (1)含義: 按指定的分類(lèi)變量的變量值對(duì)個(gè)案分組; 計(jì)算

25、每組個(gè)案的匯總變量的基本統(tǒng)計(jì)量; 將計(jì)算結(jié)果生成到一新文件中,即:在新文件中對(duì) 應(yīng)分類(lèi)變量的每一個(gè)分類(lèi)值產(chǎn)生一個(gè)個(gè)案。 性別年齡獎(jiǎng)金 男 401000 女 35550 男 20200性別_1年齡_1獎(jiǎng)金_1 男30600 女35550 原始數(shù)據(jù) 按性別變量匯總數(shù)據(jù) 數(shù)據(jù)文件的分類(lèi)匯總 (2)菜單選項(xiàng): data - aggregate (3)說(shuō)明: 多重分組時(shí),變量名的選擇順序。 生成的新文件名默認(rèn)為:aggr.sav。可修改。 生成的新變量名默認(rèn)為原變量名后加_1??尚?改。 可以在新文件中存貯個(gè)分組個(gè)案數(shù). 數(shù)據(jù)分組 目的:了解數(shù)據(jù)的總體分布狀況 思路: 指定按哪個(gè)變量分組,即:指定分組變

26、量 定義分組變量的分組區(qū)間(不重、不漏) 指定一個(gè)存放分組結(jié)果的標(biāo)志變量 分組方法: 自動(dòng)分組 手工分組 數(shù)據(jù)分組 (一)自動(dòng)分組 單變量值分組 (1)含義: 分組變量值相同的個(gè)案分在同一組,同組中的標(biāo)志變量相同。 標(biāo)志變量依照分組變量值的大小次序給定。(單變量分組,通常 只適合于離散變量且變量值較少的情況) (2)菜單選項(xiàng)菜單選項(xiàng): transform - automatic recode 分位值自動(dòng)分組 (1)含義:將定距型變量按分位數(shù)要求自動(dòng)劃分成相應(yīng)類(lèi) (2)菜單選項(xiàng):transform-categorize variables 數(shù)據(jù)分組 (二)手工分組(組距分組) (1)含義: 人工

27、定義分組區(qū)域,對(duì)所有個(gè)案或符合一定條 件的個(gè)案進(jìn)行等距或非等距分組。 (2)方法: 分組結(jié)果存入原變量、分組結(jié)果存入新變量 數(shù)據(jù)分組 (3)分組結(jié)果存入原變量: 定義分組區(qū)域: 定義某一區(qū)間的原變量值分組后所對(duì)應(yīng) 的新值是什么.未定義的原變量值保持不變。 菜單選項(xiàng): transform - recode - into same variables 說(shuō)明: 可以指定對(duì)符合一定條件的個(gè)案進(jìn)行分組。 數(shù)據(jù)分組 (4)分組結(jié)果存入新變量: 定義分組區(qū)域:定義某一區(qū)間的原變量值分組后所對(duì)應(yīng) 的新值是什么.未定義的原變量值在新變量中為系統(tǒng)缺 失值。 菜單選項(xiàng): transform - recode - i

28、nto different variables 定義原變量分組后產(chǎn)生的相應(yīng)新變量(CHANGE鈕) 可以指定對(duì)符合一定條件的個(gè)案進(jìn)行分組。 單值區(qū)間可以實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換(問(wèn)卷分析中的反向題重新 計(jì)分) 問(wèn)卷分析中的反向題重新計(jì)分舉例 性格打分(內(nèi)向、一般、外向) 1、與生人交往會(huì)“自來(lái)熟” (1)從不 (2)偶爾 (3)有時(shí) (4)經(jīng)常 2、與不熟悉的異性交往,會(huì)臉紅 (1)從不 (2)偶爾 (3)有時(shí) (4)經(jīng)常 3、 在公眾場(chǎng)合下你會(huì)大聲發(fā)表自己的意見(jiàn) (1)從不 (2)偶爾 (3)有時(shí) (4)經(jīng)常 極為內(nèi)向:3分 較為內(nèi)向:6分 較為外向:9分 極為外向:12分 指定加權(quán)變量 (1)含義:

29、指定某一變量為加權(quán)變量。如:平均蔬菜價(jià)格、男足打分 (2)菜單選項(xiàng): data - weight case (3)說(shuō)明 如果取消加權(quán)變量應(yīng)重新定義: data-weight case do not weight cases 作業(yè) 根據(jù)給定的兩個(gè)關(guān)于學(xué)生成績(jī)的SPSS數(shù)據(jù)文件 做如下處理: 合并兩個(gè)數(shù)據(jù)文件(數(shù)據(jù)不一定是一一對(duì)應(yīng)的) 計(jì)算每個(gè)同學(xué)的總成績(jī)、平均成績(jī)、標(biāo)準(zhǔn)差 計(jì)算每個(gè)同學(xué)的得優(yōu)率和得良率 根據(jù)得優(yōu)率排名 將各門(mén)課程的成績(jī)按優(yōu)、良、中、及格和不及格重 新分組 分別計(jì)算男生和女生的各科的平均成績(jī)、標(biāo)準(zhǔn)差, 并保存計(jì)算結(jié)果到SPSS數(shù)據(jù)文件。 第四章 SPSS的基本統(tǒng)計(jì)分析 基本統(tǒng)計(jì)分析

30、 頻數(shù)分析 計(jì)算基本描述統(tǒng)計(jì)量(分布特征測(cè)度) 圖形分析工具 列聯(lián)分析 頻數(shù)分析 目的 粗略把握變量值的分布狀況。 例:研究被調(diào)查者的特征(如:性別、年齡、收入) 研究被調(diào)查者對(duì)某個(gè)問(wèn)題的總體看法(如:教學(xué)方式、選修課程) 研究被調(diào)查者某方面的狀態(tài)(如:購(gòu)買(mǎi)家電的類(lèi)型、居民月支出狀況) 采用的方法 計(jì)算頻分布表:包括計(jì)算頻數(shù)、百分比、累計(jì)百分比 繪制統(tǒng)計(jì)圖形:條形圖、餅圖 頻數(shù)分析 基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-frequencies (2)選擇幾個(gè)待分析的變量到variables框. (3)chart選項(xiàng),選擇所需要的圖形 頻數(shù)分

31、析 應(yīng)用舉例 儲(chǔ)戶(hù)的職業(yè)分析 特點(diǎn):定類(lèi)數(shù)據(jù) 頻數(shù)分布表輸出按頻數(shù)升降序輸出 儲(chǔ)戶(hù)收入水平分析 特點(diǎn):定序數(shù)據(jù) 除使用頻數(shù)、百分比、總數(shù)外,還可以充分使用 累計(jì)百分比 頻數(shù)分析 頻數(shù)分析中的其他分析 計(jì)算分位數(shù):適用于定距數(shù)據(jù) 數(shù)據(jù)按升序排序后,找到若干個(gè)分位點(diǎn)上的變量值 quartiles:計(jì)算四分位數(shù)25%(QL)、50%(中位數(shù))、75%(QU) cut points for n equal groups:n等份 percentile:自定義百分位點(diǎn) 分位數(shù)的應(yīng)用 在排除極端值影響的條件下,通過(guò)計(jì)算分位數(shù)差,比較兩 組樣本數(shù)據(jù)的離散程度 例: ( QL=50,QU=80) 和 (QL=7

32、0,QU=75) 的比 較 分位數(shù)、中位數(shù)、眾數(shù)的應(yīng)用舉例 不同戶(hù)口所在地的儲(chǔ)戶(hù)取款金額比較 利用分位數(shù)(不顯示頻數(shù)分析表) 計(jì)算描述統(tǒng)計(jì)量 目的 精確把握變量的總體分布狀況,了解數(shù)據(jù)的集中趨 勢(shì)、離散趨勢(shì)、對(duì)稱(chēng)程度、陡峭程度。 基本方法 計(jì)算基本描述統(tǒng)計(jì)量 計(jì)算描述統(tǒng)計(jì)量 描述集中趨勢(shì)的統(tǒng)計(jì)量 均值(mean):表示某變量所有變量值集中趨勢(shì)或平均水平的統(tǒng)計(jì)量。 適用于定距數(shù)據(jù)。 特點(diǎn):利用了全部數(shù)據(jù),易受極端值的影響。 描述離散程度的統(tǒng)計(jì)量 標(biāo)準(zhǔn)差(standard deviation-Std Dev):表示某變量的所有變量值離散程度的 統(tǒng)計(jì)量。 SPSS中計(jì)算的是樣本標(biāo)準(zhǔn)差。 方差(var

33、iance):標(biāo)準(zhǔn)差的平方。 SPSS中計(jì)算的是樣本方差。 極差 (range):最大值(maximum)最小值(minimum) 計(jì)算描述統(tǒng)計(jì)量 描述對(duì)稱(chēng)程度的統(tǒng)計(jì)量 偏度(skewness):描述某變量分布形態(tài)的偏斜程度和 方向的統(tǒng)計(jì)量. 偏度為0表示對(duì)稱(chēng); 大于0表示正偏差大(右偏),頻數(shù)最大的值比均值小,極值大 于均值; 小于0表示負(fù)偏差大(左偏) 計(jì)算描述統(tǒng)計(jì)量 描述陡峭程度的統(tǒng)計(jì)量 峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩 程度的統(tǒng)計(jì)量。 峭度為0表示與標(biāo)準(zhǔn)正態(tài)分布峭度相同。 大于0表示比標(biāo)準(zhǔn)正態(tài)分布陡,尖峰。 小于0表示比標(biāo)準(zhǔn)正態(tài)分布緩;平峰。 計(jì)算描述統(tǒng)計(jì)量

34、其他統(tǒng)計(jì)量 標(biāo)準(zhǔn)誤差(standard error S.E):抽樣分布中的標(biāo)準(zhǔn)差, 反映樣本誤差。 均值標(biāo)準(zhǔn)誤差(means of S.E) 中心極限定理認(rèn)為:樣本均值N(u,2/n) 反映樣本均值與總體真值間的平均離散程度 樣本數(shù)越大,樣本均值的離散程度越小,對(duì)真值的估計(jì)越 準(zhǔn)確 計(jì)算描述統(tǒng)計(jì)量 基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-descripive (2)選擇將參加計(jì)算的數(shù)值型數(shù)值型變量名到variables框。 分析比較不同戶(hù)口所在地儲(chǔ)戶(hù)取款情況 比較集中趨勢(shì) 比較離散趨勢(shì) 比較偏斜程度 比較陡峭程度 實(shí)現(xiàn)方式:數(shù)據(jù)拆分 其他功能

35、 數(shù)據(jù)標(biāo)準(zhǔn)化處理 新變量的均值為0,標(biāo)準(zhǔn)差為1; 小于0表示在平均水平下,大于0反之. 正態(tài)分布的數(shù)據(jù)標(biāo)準(zhǔn)化后呈標(biāo)準(zhǔn)正態(tài)分布(68.2%, 95.4%,99.7%) save standardized values as variables選項(xiàng) 將變量作標(biāo)準(zhǔn)化后,結(jié)果存入名為“Z+原變量名”的新變 量中. 數(shù)據(jù)標(biāo)準(zhǔn)化處理應(yīng)用舉例 你能以較簡(jiǎn)便的方法快速找到取款數(shù)目出眾的儲(chǔ)戶(hù)嗎? SDxxz ii / )( 計(jì)算描述統(tǒng)計(jì)量 基本統(tǒng)計(jì)分析的圖形工具 以制作條形圖為例 繪制簡(jiǎn)單條圖(單式條圖) 繪制復(fù)式條圖 繪制堆積條圖(分段條圖) 定義統(tǒng)計(jì)圖中數(shù)據(jù)的表達(dá)類(lèi)型: 同一變量若干條記錄的分組匯總 條圖反

36、映了不同變量的匯總 條圖反映了個(gè)體觀察值 戶(hù)口所在地 邊遠(yuǎn)郊區(qū)中心城市 Count 220 200 180 160 140 120 100 80 60 以制作條形圖為例 第一種模式下的三種圖形第一種模式下的三種圖形:用于某變量在各分類(lèi)情況的比較用于某變量在各分類(lèi)情況的比較 基本統(tǒng)計(jì)分析的圖形工具 戶(hù)口所在地 邊遠(yuǎn)郊區(qū)中心城市 Count 140 120 100 80 60 40 20 0 收入水平 1000元以下 10003000元 30005000元 1500元以上 戶(hù)口所在地 邊遠(yuǎn)郊區(qū)中心城市 Count 300 200 100 0 收入水平 1500元以上 30005000元 10003

37、000元 1000元以下 以制作條形圖為例 第二種模式下的三種圖形第二種模式下的三種圖形:用于若干變量的統(tǒng)計(jì)量的比較用于若干變量的統(tǒng)計(jì)量的比較 未來(lái)收入情況收入情況 N 2 62 60 58 56 54 52 50 48 46 基本統(tǒng)計(jì)分析的圖形工具 戶(hù)口所在地 邊遠(yuǎn)郊區(qū)中心城市 N 2 50 40 30 20 10 0 收入情況 未來(lái)收入情況 戶(hù)口所在地 邊遠(yuǎn)郊區(qū)中心城市 N descriptive statistics- crosstabs (2)選擇一個(gè)變量作為行變量到row框. (3)選擇一個(gè)變量作為列變量到column框. (4)可選一個(gè)或多個(gè)變量作為控制變量到layer框. 控制變

38、量的層次設(shè)置:同層為水平數(shù)加水平數(shù)加;不同層為水平數(shù)積水平數(shù)積. (5)是否顯示各分組的棒圖(display clustered bar charts ) 產(chǎn)生交叉列聯(lián)表 應(yīng)用舉例 戶(hù)口與收入水平有關(guān)聯(lián)嗎嗎? 行變量:戶(hù)口;列變量:月收入 不同戶(hù)口不同收入水平的儲(chǔ)戶(hù)對(duì)物價(jià)水平的看法一致 嗎? 行變量:收入水平; 列變量:物價(jià)水平; 控制變量:戶(hù)口 產(chǎn)生交叉列聯(lián)表 應(yīng)用舉例 不同戶(hù)口不同收入 水平的儲(chǔ)戶(hù)對(duì)物價(jià) 水平水平的看法一 致嗎? 產(chǎn)生交叉列聯(lián)表 進(jìn)一步計(jì)算 cells選項(xiàng):選擇在頻數(shù)分析表中輸出各種百分比. row:行百分比(Row pct); column:列百分比(Col pct);

39、total:總百分比(Tot pct); 分析列聯(lián)表中變量間的關(guān)系 目的: 通過(guò)列聯(lián)表分析,檢驗(yàn)行列變量之間是否獨(dú)立。 方法: 卡方檢驗(yàn):對(duì)品質(zhì)數(shù)據(jù)的相關(guān)性進(jìn)行度量 分析列聯(lián)表中變量間的關(guān)系 卡方檢驗(yàn) 年齡與工資收入交叉列聯(lián)表 低 中 高 青 400 00 中 0 5000 老 0 0600 低 中 高 青 0 0500 中 0 6000 老 400 00 分析列聯(lián)表中變量間的關(guān)系 卡方檢驗(yàn)基本步驟 (1)H0:行列變量之間無(wú)關(guān)聯(lián)或相互獨(dú)立 (2)構(gòu)造卡方統(tǒng)計(jì)量 統(tǒng)計(jì)量服從(r-1)*(c-1)個(gè)自由度的卡方分布 count:觀察(實(shí)際)頻數(shù) expected count:期望頻數(shù) (期望頻數(shù)

40、反映的是H0成立情況下的數(shù)據(jù)分布特 征) Residual:剩余 (觀察頻數(shù)-期望頻數(shù)) e eo f ff 2 2 )( 分析列聯(lián)表中變量間的關(guān)系 卡方檢驗(yàn)基本步驟 (3)計(jì)算卡方統(tǒng)計(jì)量的值,并得到該統(tǒng)計(jì)量值的概率P 值 (4)決策。概率P與顯著性水平比較,小于等于則拒絕 H0,否則不能拒絕 實(shí)現(xiàn)步驟 statistics選項(xiàng) cells選項(xiàng) 分析列聯(lián)表中變量間的關(guān)系 應(yīng)用舉例 戶(hù)口對(duì)平均收入水平的分布會(huì)產(chǎn)生影響嗎? 獨(dú)立性檢驗(yàn):從一個(gè)總體中隨機(jī)抽樣。按某兩個(gè)屬性變量 將樣本進(jìn)行分類(lèi) 不同行業(yè)人對(duì)的自己職業(yè)的選擇標(biāo)準(zhǔn)是否存在差異? 一致性檢驗(yàn):從兩個(gè)總體中獨(dú)立抽樣,根據(jù)一個(gè)屬性變量 將樣本進(jìn)

41、行分類(lèi)。 制造業(yè) 服務(wù)業(yè) 物質(zhì)報(bào)酬 105 45 穩(wěn)定性 40 35 分析列聯(lián)表中變量間的關(guān)系 卡方檢驗(yàn)的要求: 一般要求列聯(lián)表中期望頻數(shù)小于5的格子數(shù)不超過(guò) 20%,否則會(huì)夸大卡方值,容易得出拒絕結(jié)論,可 以合并單元格。 卡方值會(huì)受樣本數(shù)的影響 分析列聯(lián)表中變量間的關(guān)系 行列變量相關(guān)性的其他測(cè)度指標(biāo) phi系數(shù):適用于22列聯(lián)表 當(dāng)行列變量獨(dú)立時(shí): 有: 當(dāng)行列變量完全相關(guān)時(shí): 有: 越接近于1,相關(guān)性越強(qiáng)。越接近0,相關(guān)性越弱 2 12 1 11 C A C A 2121 21122211 2 CCRR AAAA n 0 2211 AA 1 分析列聯(lián)表中變量間的關(guān)系 行列變量相關(guān)性的其他測(cè)

42、度指標(biāo) 列聯(lián)C系數(shù)(contingency coefficient), 通常為0,1),取值受到行 列數(shù)的影響(見(jiàn)EXCEL) V系數(shù) 0,1 值越大表示行列變量的相關(guān)性越大 n C 2 2 )1(),1min( 2 crn V 多選項(xiàng)分析 多選項(xiàng)分析的基本思路 定義多選項(xiàng)變量集 多選項(xiàng)頻數(shù)分析 多選項(xiàng)交叉分組下的頻數(shù)分析 多選項(xiàng)分析 定義多選項(xiàng)變量集 目的:將已分解的變量定義為一個(gè)集合,便于進(jìn)行多選 項(xiàng)分析 菜單選項(xiàng):analyze-multiple response-define sets 從原變量中選取被分解的變量(數(shù)值型)到variables in sets框 指定被分解的變量是按多選

43、項(xiàng)二分法(dichotomize) 分解還是按多選項(xiàng)分類(lèi)法(categories)分解的 為變量集命名。系統(tǒng)自動(dòng)在名字前加字符$. 多選項(xiàng)分析 多選項(xiàng)頻數(shù)分析 菜單選項(xiàng):analyze-multiple response-frequencies 多選項(xiàng)交叉分析下的頻數(shù)分析 菜單選項(xiàng):analyze-multiple response-crosstabs 多選項(xiàng)分析 多選項(xiàng)分析實(shí)例 分析居民的儲(chǔ)蓄目的 采用多選項(xiàng)分類(lèi)法組織數(shù)據(jù) 在某次市場(chǎng)調(diào)查中收集了北京、上海和廣州三個(gè)城 市的受訪者對(duì)幾種常見(jiàn)飲料的喜好情況,可選的飲 料有茶、牛奶、咖啡、果汁、礦泉水。(數(shù)據(jù)是從 原始數(shù)據(jù)庫(kù)中抽出的一小部分資料)

44、,作以下分析: 采用二分法組織數(shù)據(jù) 受訪人群中最受歡迎的飲料是哪種? 男、女喜愛(ài)的飲料有無(wú)差異? 三個(gè)城市的人群對(duì)飲料的喜好有無(wú)差異? 作業(yè) 根據(jù)第三章的關(guān)于學(xué)生成績(jī)的合并后的 SPSS數(shù)據(jù)文件做以下處理: 對(duì)各門(mén)課程分組后,做頻數(shù)分析, 繪制某兩門(mén)課程成績(jī)的直方圖 繪制男女生構(gòu)成的餅圖 分別計(jì)算男女生各門(mén)成績(jī)的基本描述統(tǒng)計(jì)量, 并對(duì)數(shù)據(jù)的集中趨勢(shì)、離散程度和偏度加以 比較(數(shù)字和圖形的對(duì)比) 第五章 SPSS參數(shù)檢驗(yàn) 假設(shè)檢驗(yàn)概述 假設(shè)檢驗(yàn)是一種根據(jù)樣本數(shù)據(jù)來(lái)推斷總體的 分布或均值、方差等總體統(tǒng)計(jì)參數(shù)的方法。 根據(jù)樣本來(lái)推斷總體的原因: 總體數(shù)據(jù)不可能全部收集到。如:質(zhì)量檢測(cè)問(wèn) 題 收集到總

45、體全部數(shù)據(jù)要耗費(fèi)大量的人力和財(cái)力 假設(shè)檢驗(yàn)包括: 參數(shù)檢驗(yàn) 非參數(shù)檢驗(yàn) 假設(shè)檢驗(yàn)的基本原理 基本信念:利用小概率原理進(jìn)行反證明。小概 率事件在一次實(shí)驗(yàn)中不可能發(fā)生。 例如:對(duì)人民大學(xué)男生平均身高進(jìn)行推斷 H0:平均身高為173 樣本平均身高為178,由于存在抽樣誤差,不能直接拒絕H0。 而需要考慮:在H0成立的條件下,一次抽樣得到平均身高為 178的可能性有多大。如果可能性較大,是個(gè)大概率事件(與 相比較),則不能認(rèn)為H0不正確。否則,如果可能性較小, 是個(gè)小概率事件,但確實(shí)發(fā)生了,則只能認(rèn)為H0不正確。 概率P值即為觀測(cè)結(jié)果或更極端現(xiàn)象在零假設(shè)成立時(shí)出現(xiàn)的概 率 假設(shè)檢驗(yàn)的基本步驟 (1)根

46、據(jù)檢驗(yàn)的目標(biāo),對(duì)待推斷的總體參數(shù)或分布作 一個(gè)基本假設(shè)H0 (2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,且該統(tǒng)計(jì)量服從某種已知分布. (3)利用收集到的樣本數(shù)據(jù)和基本假設(shè)計(jì)算檢驗(yàn)統(tǒng)計(jì) 量的值,并得到相應(yīng)的相伴概率P值,即:檢驗(yàn)統(tǒng)計(jì) 量在某個(gè)特定的極端區(qū)域取值在H0成立時(shí)的概率. (4)如果概率P值小于用戶(hù)給定的顯著性水平a,則拒 絕H0 .否則,不拒絕H0 . SPSS中的參數(shù)檢驗(yàn)方法 單樣本t檢驗(yàn) 兩獨(dú)立樣本t檢驗(yàn) 兩配對(duì)樣本t檢驗(yàn) SPSS單樣本t檢驗(yàn) (一)含義: 檢驗(yàn)?zāi)匙兞康目傮w均值與指定的檢驗(yàn)值之間是 否存在顯著差異。 例如:周歲兒童的平均身高是否為75厘米 (二)要求: 樣本來(lái)自的總體服從正態(tài)分布 為什

47、 么? SPSS單樣本t檢驗(yàn) (三)基本思路: H0:u=u0,總體均值與檢驗(yàn)值之間不存在顯著差異. 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.從樣本均值的分布出發(fā),即:N(u0, 2/n).于 是: 總體方差未知時(shí)構(gòu)造t統(tǒng)計(jì)量 D=X- u0 t統(tǒng)計(jì)量服從n-1個(gè)自由度的t分布 計(jì)算t統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率P(絕對(duì)值大于等于的雙側(cè)概 率) 結(jié)論:P,則拒絕H0,認(rèn)為總體均值與檢驗(yàn)值之間有顯著差 異.P ,不能拒絕H0. nS D t / SPSS單樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng): Analyze-compare means-one-samples T test (2).指定檢驗(yàn)值: 在test后的框

48、中輸入檢驗(yàn)值 SPSS單樣本t檢驗(yàn) (五)option選項(xiàng) confidence interval:指定輸出0的置信區(qū)間.默認(rèn)值為 95%. Missing values: 缺失值的處理(單樣本檢驗(yàn)時(shí)以下選項(xiàng)沒(méi) 有差別) exclude cases analysis by analysis:當(dāng)分析時(shí)涉及到有 缺失值變量時(shí)再剔除相應(yīng)的個(gè)案 exclude cases listwise:剔除所有含缺失值的個(gè)案后再 分析 SPSS單樣本t檢驗(yàn) (六)應(yīng)用舉例 周歲兒童的平均身高為75厘米嗎? 根據(jù)以前的大量調(diào)查,已知顧客對(duì)某產(chǎn)品的 滿(mǎn)意度評(píng)分在72分左右,現(xiàn)該產(chǎn)品進(jìn)行了重 新包裝,收集了一批顧客的滿(mǎn)

49、意度評(píng)分,現(xiàn) 在的評(píng)價(jià)是否顯著高于以前? SPSS兩獨(dú)立樣本t檢驗(yàn) (一)含義: 根據(jù)兩獨(dú)立樣本的數(shù)據(jù),對(duì)兩總體均值是否有顯著差異 進(jìn)行推斷。 例如:男生和女生的計(jì)算機(jī)平均成績(jī)有顯著差異嗎? (二)要求: 兩樣本必須相互獨(dú)立,即:抽取其中一批樣本對(duì)抽取另一 批樣本沒(méi)有任何影響.(如:北京周歲兒童與上海兒童的平均身 高) 兩總體服從正態(tài)分布為什 么? SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路: H0:u1-u2=0,兩總體均值無(wú)顯著差異. 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.從兩樣本均值差的分布出發(fā), 即:N(u1-u2, 2x1-x2).于是兩總體均方差未知時(shí)構(gòu)造t統(tǒng) 計(jì)量: 兩總體均值差的抽樣分布標(biāo)準(zhǔn)差: 方差

50、相等:用合并方差 方差不等: 計(jì)算t統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率P (絕對(duì)值大于等于該值的雙側(cè)概率) )2( / 21 2 2 1 2 21 nnt nSpnSp xx t )( / )( 2 2 21 2 1 21 ft nSnS xx t 1 )( 1 )( )( 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 n n S n n S n S n S f SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路: 結(jié)論: 方差齊性F檢驗(yàn) 利用Levene F檢驗(yàn)確定兩總體方差是否齊性.H0:兩總 體方差無(wú)顯著差異. 該檢驗(yàn)首先計(jì)算每個(gè)個(gè)案與所屬組均值之差并取絕 對(duì)值.然后對(duì)其進(jìn)行單因素方差分

51、析. SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路: 結(jié)論: 首先,如果F檢驗(yàn)的P,則拒絕F檢驗(yàn)的H0,認(rèn)為方差不齊性; 其次看Unequal行的t檢驗(yàn)概率.如果,則拒絕t檢驗(yàn)的H0, 認(rèn)為兩總體均值有顯著差異;如果,則不拒絕t檢驗(yàn)的H0. 首先,如果F檢驗(yàn)的P ,則不能拒絕F檢驗(yàn)的H0,認(rèn)為方差 齊性;其次看equal行的t檢驗(yàn)概率.其余同上 SPSS兩獨(dú)立樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng):analyze-compare means-independent- samples T (2).選擇若干變量作為檢驗(yàn)變量到test variables框 (3).選擇代表不同總體的變量作為分

52、組變量到grouping variable 框 (4).定義分組變量的分組情況Define Groups.: use specified values:定義分組變量的分組標(biāo)志值分別是什么 cut point:分組變量為連續(xù)變量.輸入一個(gè)數(shù)字,將大于等于該值 的分成一組,小于該值的分成另一組. SPSS兩獨(dú)立樣本t檢驗(yàn) 應(yīng)用舉例 上海周歲兒童的平均身高與北京周歲兒童的 平均身高有顯著差異嗎? 某商場(chǎng)為某種產(chǎn)品進(jìn)行了促銷(xiāo)活動(dòng),請(qǐng)比較 前后數(shù)日的銷(xiāo)售額,以確認(rèn)促銷(xiāo)活動(dòng)對(duì)銷(xiāo)量 有無(wú)作用。 A、B兩種減肥產(chǎn)品的作用有明顯差異嗎? 隨機(jī)選了200名肥胖者服用A種減肥產(chǎn)品,其中: 92人體重明顯減輕了;另隨

53、機(jī)選了183名肥胖者 服用B減肥產(chǎn)品,其中:161人體重明顯減輕了。 SPSS兩配對(duì)樣本t檢驗(yàn) (一) 含義: 根據(jù)配對(duì)樣本對(duì)兩總體均值是否有顯著差異進(jìn) 行推斷. 例如: 某種減肥茶是否有效 (二)要求: 兩樣本數(shù)據(jù)必須兩兩配對(duì),即:樣本個(gè)數(shù)相同,個(gè) 案順序相同.如:減肥茶的效果、不同廣告形式 對(duì)銷(xiāo)售額的影響.(控制了個(gè)案自身的影響) 兩總體服從正態(tài)分布 SPSS兩配對(duì)樣本t檢驗(yàn) (三)基本思路 H0:兩總體均值無(wú)顯著差異,差值序列的均值u0 =0. 構(gòu)造統(tǒng)計(jì)量:同單樣本均值檢驗(yàn) D=X- u0 S為差值序列的標(biāo)準(zhǔn)差 實(shí)質(zhì)是先求出每對(duì)測(cè)量值的差值;然后檢驗(yàn)差值序列 的均值是否與0有顯著差異.

54、如果差值的均值與0有顯著差異,則認(rèn)為兩總體均值 存在顯著差異;否則,與0無(wú)顯著差異,則認(rèn)為兩總體均 值不存在顯著差異. nS D t / SPSS兩配對(duì)樣本t檢驗(yàn) (三)基本思路 計(jì)算t統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率P(絕對(duì)值大于等于的雙 側(cè)概率) 結(jié)論:P,則拒絕H0,認(rèn)為兩總體均值有顯著差異.P , 不能拒絕H0. SPSS兩配對(duì)樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng): analyze-compare means-paired-samples T (2).選擇一對(duì)或若干對(duì)配對(duì)變量作為檢測(cè)變量到paired variables框. (3)option選項(xiàng) 同獨(dú)立樣本的T檢驗(yàn) SPSS兩配對(duì)

55、樣本t檢驗(yàn) 應(yīng)用舉例 某種減肥茶真起到減肥作用了嗎? 對(duì)促銷(xiāo)人員培訓(xùn)前和培訓(xùn)后銷(xiāo)售額的比較, 以確認(rèn)業(yè)務(wù)培訓(xùn)有無(wú)效果。 作業(yè) 一、給幼鼠以不同的飼料,研究每天鈣的留存量是否有顯著不 同。以下兩種方法涉及實(shí)驗(yàn)樣本: 方式1:同一鼠喂不同的飼料 鼠號(hào) 1 2 3 4 5 6 7 8 9 飼料1 33.1 33.1 26.8 36.3 39.5 30.9 33.4 31.5 28.6 飼料2 36.7 28.8 35.1 35.2 43.8 25.7 36.5 37.9 28.7 方式2:甲組12只喂飼料1,乙組9只喂飼料2 甲組:29.7 26.7 28.9 31.1 31.1 26.8 26.3

56、 39.5 30.9 33.4 33.1 28.6 乙組:28.7 28.3 29.3 32.2 31.1 30.0 36.2 36.8 30.0 二、根據(jù)學(xué)生成績(jī)數(shù)據(jù),分析: 是否有男女生平均成績(jī)存在明顯差異的課程 判斷學(xué)生在哪些課程上的平均成績(jī)差別不明顯 第六章 方差分析 方差分析概述 一、問(wèn)題的提出 最優(yōu)方案的設(shè)計(jì) l如何獲得最佳的產(chǎn)品銷(xiāo)售量 l哪些因素是影響銷(xiāo)售量的主要因素 l哪些因素的那種情況更利于提高銷(xiāo)售量 l哪些因素的組合更利于提高銷(xiāo)售量 l可以利用方差分析的方法來(lái)實(shí)現(xiàn) 方差分析概述 二、方差分析 目的:方差分析從分析數(shù)據(jù)的差異入手,分析哪 些因素是影響數(shù)據(jù)差異的眾多因素中的主要

57、因素. 相關(guān)概念: (1)觀測(cè)變量:作為觀測(cè)的對(duì)象(如:畝產(chǎn)量、推銷(xiāo)量等). (2)控制因素:人為可以控制的因素(如:施肥量、品種、推 銷(xiāo)策略、價(jià)格、包裝方式等),在方差分析中稱(chēng)為控制 因素.將控制變量的不同情況稱(chēng)為控制變量的不同水平. (3)隨機(jī)因素:人為很難控制的因素(如:氣候、推銷(xiāo)人員的 形象、抽樣誤差等),方差分析中主要指抽樣誤差。 方差分析概述 三、核心問(wèn)題 從數(shù)據(jù)差異角度看: 觀測(cè)變量的數(shù)據(jù)差異=控制因素造成+隨機(jī)因素造成 當(dāng)控制因素對(duì)實(shí)驗(yàn)結(jié)果有顯著影響時(shí),和隨機(jī)因素共同作 用必然使觀測(cè)變量產(chǎn)生顯著變動(dòng);反之,觀測(cè)變量的變動(dòng)較 小,將歸結(jié)為隨機(jī)性造成的(這里指抽樣誤差造成的). 方

58、差分析概述 四、方差分析的類(lèi)型 單因素方差分析: 只考慮一個(gè)控制因素的影響 多因素方差分析: 考慮兩個(gè)以上的控制因素和它們的交互作用 對(duì)觀測(cè)變量的影響 協(xié)方差分析: 在盡量排除其他因素的影響下,分析單個(gè)或 多個(gè)控制因素對(duì)觀測(cè)變量的影響.(引入?yún)f(xié)變量) 單因素方差分析 (一)目的 檢驗(yàn)?zāi)骋粋€(gè)一個(gè)控制因素的改變是否會(huì)給觀察變量 帶來(lái)顯著影響. 例如:應(yīng)用面很廣(科學(xué)試驗(yàn),社會(huì)經(jīng)濟(jì)問(wèn)題) 考察不同肥料對(duì)某農(nóng)作物畝產(chǎn)量是否有顯著差異. 考察不同溫度下某化工產(chǎn)品的獲得率 考察婦女生育率在不同地區(qū)是否有顯著差異. 考察不同學(xué)歷是否對(duì)工資收入產(chǎn)生顯著影響. 單因素方差分析 (二)基本思路 (1)入手點(diǎn): 檢

59、驗(yàn)控制變量的不同水平下,各總體的分布是否存 在顯著差異,進(jìn)而判斷控制變量是否對(duì)觀測(cè)變量產(chǎn) 生了顯著影響. (2)前提: 各組樣本獨(dú)立 不同水平下各總體服從方差相等方差相等的正態(tài)分布正態(tài)分布. (3) H0:不同水平下,各總體均值無(wú)顯著差異.即:不同水平下 控制因素的影響不顯著. 通過(guò)參數(shù)檢驗(yàn)可以解決兩兩總體均值的比較 多個(gè)總體均值的檢驗(yàn)如何作?(如:北京、上海、廣州周歲兒童平均身 高的比較) 可以多次采用兩樣本t檢驗(yàn)方法實(shí)現(xiàn) 產(chǎn)生的問(wèn)題:犯第一類(lèi)錯(cuò)誤的概率明顯增大 例如:K個(gè)變量?jī)蓛蛇M(jìn)行t檢驗(yàn),需要作N=k! (2! (k-2)!)次,如果為 0.05,那么每次不犯錯(cuò)的概率為0.95。N次檢驗(yàn)

60、均不犯錯(cuò)的概率為 0.95N,而犯錯(cuò)的概率為1-0.95N,遠(yuǎn)遠(yuǎn)大于設(shè)定的0.05 可以利用方差分析的方法來(lái)實(shí)現(xiàn)多個(gè)總體的均值比較 單因素方差分析 單因素方差分析 (二)基本思路 (4) 構(gòu)造F統(tǒng)計(jì)量 因?yàn)?總變差=組間差異+組內(nèi)差異 可證明:SST= SSA+SSE(設(shè):k個(gè)水平,每個(gè)水平有ni 個(gè)數(shù)據(jù)) 考察平均的組間差異與平均的組內(nèi)差異的比值,于是: k i ii xxnSSA 1 2 )( k ii nj j iij xxSSE 1 2 )( MSE MSA knSSE kSSA F )/( ) 1/( k i nj j ij xxSST 11 2 )( F(k-1,n-k) 單因素方

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論