第二章 數(shù)據(jù)文件的建立和管理_第1頁
第二章 數(shù)據(jù)文件的建立和管理_第2頁
第二章 數(shù)據(jù)文件的建立和管理_第3頁
第二章 數(shù)據(jù)文件的建立和管理_第4頁
第二章 數(shù)據(jù)文件的建立和管理_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2021-7-41 第二章第二章 數(shù)據(jù)文件的建立和管理數(shù)據(jù)文件的建立和管理 2021-7-42 本章主要內(nèi)容本章主要內(nèi)容 第一節(jié) SPSS數(shù)據(jù)文件 第二節(jié) SPSS數(shù)據(jù)的結(jié)構(gòu)和定義方法 第三節(jié) SPSS數(shù)據(jù)的錄入和編輯 第四節(jié) SPSS數(shù)據(jù)的保存 第五節(jié) 讀取其他格式的數(shù)據(jù)文件 第六節(jié) SPSS數(shù)據(jù)文件的合并 2021-7-43 第一節(jié) SPSS數(shù)據(jù)文件 1、 SPSS數(shù)據(jù)文件的特點: SPSS數(shù)據(jù)文件有 別于其他文件,是一個有特殊格式的文件,它 是一種有結(jié)構(gòu)的數(shù)據(jù)文件,它由數(shù)據(jù)結(jié)構(gòu)和內(nèi) 容兩部分組成,其中,數(shù)據(jù)結(jié)構(gòu)記錄數(shù)據(jù)變量 的名稱、類型、變量寬度、小數(shù)位數(shù)、變量名 標簽、變量值標簽、缺失

2、值、顯示寬度、對齊 方式和度量尺度等必要信息,內(nèi)容才是那些待 分析的具體數(shù)據(jù)。 基于上述特點,建立SPSS數(shù)據(jù)文件時應(yīng)完成兩 項任務(wù),即描述數(shù)據(jù)的結(jié)構(gòu)和錄入編輯數(shù)據(jù)。 2021-7-44 數(shù)據(jù)編輯窗口中的一行稱為一個個案或記 錄(Case),所有個案組成SPSS數(shù)據(jù)文件 的內(nèi)容。數(shù)據(jù)編輯窗口的一列稱為一個變 量(Variable),每個變量都有一個名字, 稱為變量名,它是訪問和分析SPSS每個變 量的唯一標志。 SPSS數(shù)據(jù)文件的結(jié)構(gòu)就是 對每個變量及相關(guān)特征的描述。 2、SPSS數(shù)據(jù)的組織方式 (1)原始數(shù)據(jù)的組織方式 2021-7-45 (2)頻數(shù)數(shù)據(jù)的組織方式 例: 職職 稱稱 年齡段年

3、齡段 35歲以下歲以下 (1) 3649歲歲 (2) 50歲以上歲以上 (3) 教授(教授(1)0158 副教授(副教授(2)10202 講師(講師(3)20101 助教(助教(4)3520 2021-7-46 頻數(shù)數(shù)據(jù)的組織方式 職稱年齡段人數(shù) 110 1215 138 2110 2220 232 3120 3210 331 4135 422 430 2021-7-47 第二節(jié) SPSS數(shù)據(jù)的結(jié)構(gòu)和定義方法 SPSS數(shù)據(jù)的結(jié)構(gòu)是對SPSS每列變量及其 相關(guān)屬性的描述,主要包括變量名、數(shù) 據(jù)類型、變量寬度、小數(shù)位數(shù)、變量名 標簽、變量值標簽、顯示寬度、缺失值、 對齊方式、度量尺度等信息。 20

4、21-7-48 變量名(Variable name) 變量名是變量訪問和分析的唯一標志。在定義SPSS 數(shù)據(jù)結(jié)構(gòu)時應(yīng)首先給出每列變量的變量名。變量的命 名規(guī)則如下: 1. 應(yīng)以英文字母或漢字開頭,后面可跟除了!、?、* 之外的字母或數(shù)字,下劃線、圓點不能作為變量名的 最后一個字符。SPSS允許用漢字作為變量名。 2.變量名的字符個數(shù)最好不多于8個;變量名不區(qū)分大小 寫字母。 3. SPSS有默認的變量名,以字母“VAR”開頭,后面補足 5位數(shù)字,如VAR00001,VAR00002等。變量名不能與 SPSS內(nèi)部特有的具有特定含義的保留字同名,如ALL, BY,AND,NOT,OR等。 4.變量

5、名最好與其代表的數(shù)據(jù)含義相對應(yīng),每個變量名必 須具有唯一性。 2021-7-49 數(shù)據(jù)類型(Type) 數(shù)據(jù)類型是指每個變量取值的類型。SPSS 中有三種基本數(shù)據(jù)類型:數(shù)值型、字符型和日 期型。 數(shù)值型數(shù)值型 (1)標準型(Numeric) (2)科學記數(shù)法型(Scientific Notation) (3)逗號型(Comma) (4)圓點型(Dot) (5)美元符號型(Dollar) (6)用戶自定義型(Custom Currency) 字符型(字符型(String) 日期型(日期型(Date) 數(shù)據(jù)類型表數(shù)據(jù)類型表 SPSS變量變量 類型類型 系統(tǒng)默系統(tǒng)默 認長度認長度 小數(shù)小數(shù) 位數(shù)位數(shù)

6、 輸入方式輸入方式顯示方式顯示方式范例范例 輸入輸入顯示顯示 Numeric82標準格式或科學標準格式或科學 記數(shù)法記數(shù)法 標準格式數(shù)值變量圓標準格式數(shù)值變量圓 點表示小數(shù)點的數(shù)值點表示小數(shù)點的數(shù)值 38.4238.42 Comma82帶逗點的數(shù)值或帶逗點的數(shù)值或 科學記數(shù)法科學記數(shù)法 圓點做小數(shù)點,逗點圓點做小數(shù)點,逗點 做三位分割符的數(shù)值做三位分割符的數(shù)值 1,343,438.11,343,438.1 Dot82帶圓點的數(shù)值或帶圓點的數(shù)值或 科學記數(shù)法科學記數(shù)法 逗點做小數(shù)點,圓點逗點做小數(shù)點,圓點 做三位分割符的數(shù)值做三位分割符的數(shù)值 34,3434E23.434,34 Scietifi

7、c notation 82科學記數(shù)法科學記數(shù)法 或標準格式或標準格式 科學記數(shù)法科學記數(shù)法457.8E4457.8E4 Date日期格式非常多日期格式非常多顯示格式非常多顯示格式非常多 Dollar82可帶可帶$或不帶或不帶$輸輸 入或科學記數(shù)法入或科學記數(shù)法 有效數(shù)值前帶有效數(shù)值前帶$以逗以逗 點為分割符點為分割符 $12343$12343 Custom Currency String8無無一串字符串一串字符串一串字符串一串字符串BelieveBelieve 2021-7-411 數(shù)值型數(shù)值型 數(shù)值型是SPSS最常用的數(shù)據(jù)類型,通常 由阿拉伯數(shù)字和其它特殊符號等組成。 其中的標準型(nume

8、ric)是SPSS默認的 數(shù)據(jù)類型,默認的顯示寬度為8位,包括 正負符號位、小數(shù)點和小數(shù)位在內(nèi),小 數(shù)位默認為2位。如果數(shù)據(jù)的實際寬度大 于8位,spss將自動按照科學計數(shù)法顯示, 數(shù)據(jù)的顯示并不影響數(shù)據(jù)的存儲,也不 影響數(shù)據(jù)的計算。 2021-7-412 字符型字符型 字符型也是SPSS較常用的數(shù)據(jù)類型, 由一個字符串組成。如職工號碼、姓名、 地址等變量都可以定義為字符型數(shù)據(jù)。 字符型數(shù)據(jù)的默認顯示寬度為8個字符, 不能夠進行算術(shù)運算,并區(qū)分大小寫字 母。字符型數(shù)據(jù)在SPSS命令處理過程中 應(yīng)用一對雙引號括起來,但在輸入數(shù)據(jù) 時不應(yīng)輸入雙引號,否則雙引號將會作 為字符型數(shù)據(jù)的一部分。 202

9、1-7-413 日期型日期型 日期型數(shù)據(jù)用來表示日期或者時間, 如生日、成立日期等變量可以定義為日 期型數(shù)據(jù)。顯示格式:dd-mmm-yyyy; mm/dd/yyyy等等。 2021-7-414 變量寬度(Width)、列寬度(Columns) 每種類型的變量都有自己的變量寬 度、小數(shù)位和顯示寬度,其中變量寬度 是變量允許的最大字符位數(shù),列寬度是 數(shù)據(jù)編輯窗口中顯示每列的字符位數(shù)。 通常這兩個寬度是一致的。 2021-7-415 變量名標簽(Variable label) 變量名標簽是對變量名含義的進一 步解釋說明,它可以增強變量名的可視 性和統(tǒng)計分析結(jié)果的可讀性。變量名標 簽可用中文,總長度

10、可達120個字符,但 在統(tǒng)計分析結(jié)果的顯示中一般不能顯示 如此長的變量名標簽信息。 2021-7-416 變量值標簽(Value label) 變量值標簽是對變量取值含義的解釋說 明信息,對于品質(zhì)型數(shù)據(jù)尤為重要,比如1 代表男性,2代表女性,它不但明確了數(shù)據(jù) 的含義,也增強了最后統(tǒng)計分析結(jié)果的可讀 性,變量值標簽可以用中文。 2021-7-417 缺失數(shù)據(jù)(Missing values) 數(shù)據(jù)中存在明顯錯誤或明顯不合理的數(shù)據(jù)或漏 填數(shù)據(jù)項時統(tǒng)計學上稱為不完全數(shù)據(jù)或缺失數(shù)據(jù)。 數(shù)據(jù)中如果存在缺失數(shù)據(jù),分析時通常不能直接采 用,要進行說明。SPSS中說明缺失數(shù)據(jù)的方法是 指定用戶缺失值。這樣,sp

11、ss在分析時,就能夠?qū)?這些缺失值與正常的數(shù)據(jù)區(qū)分開來,并依據(jù)用戶指 定的缺失值處理策略對其進行處理或分析。Spss還 有一類默認的缺失值,稱為系統(tǒng)缺失值,數(shù)值及日 期型變量用圓點表示,字符型變量用空表示。 2021-7-418 SPSS中說明缺失數(shù)據(jù)的基本方法是指 定用戶缺失值。用戶缺失值可以是: G對字符型或數(shù)值型變量,用戶缺失值可以 是1至3個特定的離散值(Discrete missing values); G對一個數(shù)值型變量,用戶缺失值可以在一 個連續(xù)的閉區(qū)間內(nèi)并同時再附加一個區(qū)間 以外的離散值(Range plus one optional discrete)。 2021-7-419

12、 SPSS用戶缺失值定義窗口 2021-7-420 變量對齊格式(Align) 定義顯示對齊方式,對齊方式分為 右對齊、左對齊和中間對齊。系統(tǒng)中, 數(shù)值型變量默認為右對齊,字符型變量 默認為左對齊。 2021-7-421 計量尺度(Measure) 統(tǒng)計學依據(jù)數(shù)據(jù)的計量尺度將數(shù)據(jù)劃 分為三大類,即數(shù)值型數(shù)據(jù)(Scale),如 身高、體重;順序型數(shù)據(jù)(Ordinal),如職 稱、職務(wù)、對某事物的贊同程度;分類型數(shù) 據(jù)(Nominal),如民族、宗教信仰、性別、 黨派。數(shù)值型數(shù)據(jù)通常用數(shù)字表示;順序型 數(shù)據(jù)具有內(nèi)在固有大小或高低順序,但它又 不同于數(shù)值型數(shù)據(jù),一般用非數(shù)字表示;分 類型數(shù)據(jù)沒有內(nèi)在

13、固有大小或高低順序,一 般用非數(shù)字表示。 2021-7-422 SPSSSPSS中變量定義的操作中變量定義的操作 單擊單擊Variable View 進入:進入: 單擊單擊, 定義定義 變量變量 名名 單擊,定義單擊,定義 變量類型變量類型 定義變量標簽定義變量標簽 變量值變量值 標簽標簽 定義計量尺度定義計量尺度 定義變定義變 量寬度量寬度 定義定義 對齊對齊 方式方式 定義變量類定義變量類 型對話框型對話框 定義變量值定義變量值 標簽對話框標簽對話框 定義變量缺省定義變量缺省 值對話框值對話框 2021-7-423 通常建立SPSS數(shù)據(jù)文件時應(yīng)首先定義數(shù)據(jù) 的結(jié)構(gòu)部分,然后再輸入數(shù)據(jù),但實

14、際應(yīng) 用中,邊錄入、邊分析、邊修改數(shù)據(jù)結(jié)構(gòu) 的情況也是常見的。數(shù)據(jù)的結(jié)構(gòu)定義完成 之后,可以在Variable View卡片中瀏覽,也 可以通過菜單選項Utilities/Variable來實現(xiàn)。 2021-7-424 02-1 SPSS數(shù)據(jù)文件的建立舉例 根據(jù)居民儲蓄調(diào)查數(shù)據(jù),建立SPSS格式 的數(shù)據(jù)文件。 2021-7-425 第三節(jié) SPSS數(shù)據(jù)的錄入與編輯 1.錄入 定義好SPSS數(shù)據(jù)結(jié)構(gòu)后,可將具體的數(shù) 據(jù)輸入到SPSS中,最終形成SPSS數(shù)據(jù)文件。 SPSS數(shù)據(jù)的錄入操作在數(shù)據(jù)編輯窗口中的 Data View卡片中實現(xiàn)。其操作方法與Excel 基本類似,也是以電子表格的方式進行錄入

15、。 錄入帶有變量值標簽的數(shù)據(jù)時,可以在下拉 按鈕中的值標簽列表中選擇一個輸入。 2021-7-426 2.SPSS數(shù)據(jù)的編輯 數(shù)據(jù)必須輸入正確才能保證正確的分析 結(jié)果。但很難一次輸入正確,所以就需要進 行修改,一般包括數(shù)據(jù)的定位、插入、刪除、 修改、復制等。 2021-7-427 (1) SPSS數(shù)據(jù)的定位 數(shù)據(jù)的定位目的是將當前數(shù)據(jù)單元定位 到某個特定的單元中。有兩種定位方式: 1)按個案號碼定位:EditGo to Case 將當前單元格定位在任何單元格中,選擇菜 單EditGo to Case ,出現(xiàn)如下對話框, 輸入欲定位的個案號碼并確認。 輸入要尋找觀輸入要尋找觀 測量序號測量序號

16、2021-7-428 2)按變量值定位: EditFind 將當前單元定位在某變量列的任何一個個案上 選擇菜單 EditFind ,出現(xiàn)如下對話框 輸入定位變量值并確認 于是, SPSS自動對指定的變量進行搜索,并將當 前單元定位于定位變量值相等的第一個個案上。 2021-7-429 (2) 插入和刪除一個個案 插入一個個案,即在數(shù)據(jù)編輯窗口的 某個個案前插入一個新個案:將當前數(shù)據(jù)單 元確定在一個個案上,選擇菜單 Edit Insert Case(或工具欄插入個案圖標按鈕) 刪除一個個案,在欲刪除的個案號碼上 單擊鼠標左鍵,于是待刪除的個案數(shù)據(jù)全部 反向顯示;單擊鼠標右鍵,從彈出菜單中選 擇c

17、ut選項。 2021-7-430 (3)插入和刪除一個變量 插入一個變量,即在數(shù)據(jù)編輯窗口的 某個變量前插入一個新變量:將當前數(shù)據(jù)單 元確定在一個變量上,選擇菜單 Edit Insert Variable 刪除一個變量,在欲刪除的變量名上單 擊鼠標左鍵,于是待刪除的數(shù)據(jù)全部反向顯 示;單擊鼠標右鍵,從彈出菜單中選擇cut 選項。 2021-7-431 (4)數(shù)據(jù)的移動、復制和刪除 數(shù)據(jù)的移動、復制和刪除:與一般的 應(yīng)用程序相同 選擇操作對象(變量、個案、若干連續(xù)單元等) 剪切:Edit Cut(Ctrl+X) 復制:Edit Copy(Ctrl+C) 粘貼:Edit Paste(Ctrl+V)

18、 恢復刪除或修改前數(shù)據(jù) Edit Undo (或工具欄Undo圖標按鈕) 2021-7-432 插入變量與刪插入變量與刪 除變量除變量 插入個案與插入個案與 刪除個案刪除個案 數(shù)據(jù)的剪數(shù)據(jù)的剪 切、粘貼切、粘貼 與復制與復制 1.插入變量插入變量 在添加處單擊 Var,單擊右鼠 標鍵出現(xiàn)右側(cè) 對話框, 單擊 Insert Variables 2.刪除變量刪除變量 1.插入個案插入個案 在添加處單擊 觀測量,單擊 右鼠標鍵出現(xiàn) 右側(cè)對話框, 單 擊Insert Case 2.刪除個案刪除個案 剪切剪切復制復制 粘貼粘貼 若想恢復,打開若想恢復,打開EditUndo 2021-7-433 SPSS

19、支持的數(shù)據(jù)格式 1、SPSS文件格式,擴展名為.sav 2、Excel格式文件,擴展名為.xls 3、dbf格式文件,擴展名為.dbf 4、文本格式文件,擴展名為.dat 第四節(jié) SPSS數(shù)據(jù)的保存 2021-7-434 將數(shù)據(jù)保存為SPSS數(shù)據(jù)文件或其他格式的數(shù) 據(jù)文件的基本操作是: nFileSave, 對于新的:提示文件名和類型; 對于舊的,覆蓋原來的,不再提問; nFileSave As,另存一個數(shù)據(jù)文件,也有格式 (類型)問題; nVariable按鈕允許用戶指定保存哪些變量,不保 存哪些變量,變量名前畫叉的變量將被保存到 磁盤中。 n將數(shù)據(jù)保存為Excel文件格式時,Write v

20、ariables names to spreadsheet選項呈可用狀態(tài),它的作 用是指定是否將SPSS變量名寫入Excel工作表的 第一行上。 2021-7-435 第五節(jié) 讀取其他格式的數(shù)據(jù)文件 SPSS能夠直接讀取其他格式的數(shù)據(jù) 文件,并將其保存為SPSS格式的數(shù)據(jù)。 1.直接讀取其他格式的數(shù)據(jù)文件:(1)選 擇菜單File Open Data;(2)選擇 數(shù)據(jù)文件的類型,并輸入數(shù)據(jù)文件名。 2.使用數(shù)據(jù)庫查詢打開 利用通用數(shù)據(jù)庫ODBC接口讀取數(shù)據(jù)文件 在9.0及以前版本中非常重要 3.使用文本向?qū)ёx入文本文件:選擇菜單 File Read Text Data 2021-7-436 直

21、接打開直接打開 SPSS可以直接讀入許多格式的數(shù)據(jù)文件,其中就包括EXCEL各個版 本的數(shù)據(jù)文件。選擇菜單FileOpenData或直接單擊快捷工具 欄上的Open File按鈕,系統(tǒng)就會彈出Open File對話框,單擊“文 件類型”列表框,在里面能看到直接打開的數(shù)據(jù)文件格式,分別是: 2021-7-437 注:注:讀入Excel文件時,SPSS默認將 Excel工作表中的全部數(shù)據(jù)讀到SPSS數(shù)據(jù) 編輯窗口,但也可以指定僅讀取工作表中 某個區(qū)域內(nèi)的數(shù)據(jù)(如A5:B10)。工作 表上的一行數(shù)據(jù)為SPSS中的一個個案。 如果Excel工作表文件第一行或指定 讀取區(qū)域內(nèi)的第一行存儲了變量名信息,

22、則應(yīng)選擇Read variable names項,即以第 一行的文字信息作為SPSS的變量名,否則 不選。 2021-7-438 使用數(shù)據(jù)庫查詢打開 SPSS可以直接打開許多類型的數(shù)據(jù)文件,但這并不是說它可 以打開所有類型的數(shù)據(jù)文件,比如FoxPro 3.0以上版本的*.dbf 文件就不能直接打開。為此,SPSS還提供了另一個適用范圍更 廣、較為專業(yè)的數(shù)據(jù)接口數(shù)據(jù)庫查詢。 實際上,SPSS在這里使用的是一種叫ODBC(Open Database Capture)的數(shù)據(jù)接口,該接口被大多數(shù)數(shù)據(jù)庫軟件和辦公軟件 (如MS Office)支持,通過它,應(yīng)用程序可以直接訪問以結(jié)構(gòu) 化查詢語言(SQL)

23、做為數(shù)據(jù)訪問標準的數(shù)據(jù)庫管理系統(tǒng)。 選擇菜單File Open Database New Query,系統(tǒng)會彈出數(shù) 據(jù)庫向?qū)У牡谝粋€窗口,其中會列出你使用的機器上已安裝的 所有數(shù)據(jù)庫驅(qū)動程序,選中所需的數(shù)據(jù)源,然后單擊下一步, 向?qū)徊揭徊降奶崾灸闳绾巫?,直至將?shù)據(jù)讀入SPSS。 2021-7-439 使用文本導入向?qū)ёx入文本文件 選擇菜單FileRead Text Data,系統(tǒng)就會彈出 Open File對話框,和前面的情況完全一樣,只是 文件類型自動跳到了Text (*.txt)。實際上,該功能 在SPSS中已被整合到了Open File對話框中之所以 在菜單上保留該條目的原因是讀入純

24、文本的情況 非常普遍,放在這里更加醒目。 02-2舉例:創(chuàng)建一個以純文本的形式保存的數(shù)據(jù) 文件,且第一行為變量名,請將其讀入SPSS。 在 File Read Text Data對話框選中相應(yīng)的文件 名并單擊“確定”,系統(tǒng)會自動啟動文本導入向 導對話框如下: 2021-7-440 Spss是否已經(jīng)正確的識 別和分割了數(shù)據(jù)項 2021-7-441 數(shù)據(jù)間如何分割 數(shù)據(jù)文件的第一行上是否有變量名 2021-7-442 數(shù)據(jù)部分從文本文件的第幾行開始 個案數(shù)據(jù)在文本文件中是如何安排的 2021-7-443 指定文本文件的分割符號字符型數(shù)據(jù)表示方法 2021-7-444 2021-7-445 2021-7-446 第六節(jié) SPSS數(shù)據(jù)文件的合并 當數(shù)據(jù)量較多時經(jīng)常會把一份大的數(shù)據(jù)分成幾 個小的部分,有幾個錄入員分別錄入,以期加快數(shù) 據(jù)錄入速度,但一份完整的數(shù)據(jù)被分別存儲在幾個 數(shù)據(jù)文件中,如果要分析這份數(shù)據(jù)就必須首先將若 干個小的數(shù)據(jù)文件合并起來。要實現(xiàn)兩個或多個 SPSS數(shù)據(jù)文件的合并,應(yīng)首先將其中的某個數(shù)據(jù) 文件讀入數(shù)據(jù)編輯窗口中,然后依次與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論