版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三講:資料記錄描述(一):記錄制表描述性記錄概述描述性記錄重要對記錄數據構造和總體狀況進行描述,普通并不進一步理解記錄數據內部規(guī)律。重要分三方面內容:Reports(報表模塊)、DescriptiveStatistics(描述記錄)Tables(定制表格)。描述性記錄是記錄分析和記錄推斷基本,在后來每個過程中幾乎都會用到。本講將重要簡介Reports與Tables模塊中記錄制表1、Reports該命令共包括了4個過程,分別是OLAPCubes(OnlineAnalyticalProcessing在線分析),CaseSummaries(案例摘要),ReportSummariesinRows(行摘要),ReportSummariesinColumns(列摘要)。OLAPCubes:所謂在線分析指是用迅速簡樸方式對變量進行描述,并生成一種多層表,顧客可以按照需要組織分組變量某個/某些特定水平組合輸出,這在使用類別較多分組變量時將會非常節(jié)約輸出空間。例如研究者要對汽車重量按照其產地以及汽缸數計算平均數以及原則差。該窗口右側為當前數據中所有變量,summaryvariables為需要進行分析變量(本例中為weight),如果同步選入各種變量,系統(tǒng)將在同一張表格內一次對它們進行分析;groupingvariables為分組變量(本例為origin與cylinder),但是請注意:OLAP過程不會同步輸出分組變量所有組合水平下分析成果,而是用多層表格形式體現,在默認狀況僅僅顯示共計狀況;同步origin與cylinder兩個變量均未缺失case才可進入最后分析。Statistics子對話框中提供了幾種慣用記錄量,可依照研究目選取適當數值描述指標:Differences子對話框用于計算不同匯總變量間、同一變量在各組間差值或比例:定義要所需要記錄描述項目后,點擊OK:上表為進入分析記錄匯總,可見在所有406條記錄中,共有1條記錄由于有缺失值而未能入選。下表即為在線分析成果,可見總共405輛汽車總重量為1204910磅,均數為2975.09磅,原則差為843.546磅。注意該表僅僅是匯總成果,實際為一種多層表,請雙擊該表進入編輯狀態(tài)后,可以按照產地和汽缸數取值不同進行組合,得到不同weight平均值和原則差。如果研究者想進一步理解歐洲車與日本車在車重差別,可以使用differences子對話框指定typeofdifferences為arithmeticdiffernce,differencesbetweengroupsofcases中grouping為origin,category為2、minus為3,點擊pairs按鈕,OK即可得到下表:似乎和上表相比沒有任何差別,但是雙擊該表進入編輯狀態(tài),在countryorigin下拉選項中多余了European-Japanese選項,選取它即可。請注意該表中每一種指標都是單獨計算。CaseSummaries:與OLAP過程可以產生自定義簡潔分層表格不同是,該命令可以將指定分組變量所有組合所有列出。依然以上題為例,對車重按照產地與汽缸數分類記錄其平均數與原則差。該對話框與OLAP相似,將要分析weight移入variables中,cylinder與origin移入groupingvariables中;在statistics中選取需要指標,點擊OK即可。(最佳將displaycases前小勾去掉,使得成果輸出較為簡潔)。ReportSummariesinRows該命令是專門用于生成復雜表格,并且其輸出格式為.txt格式。例如研究者想將系統(tǒng)自帶數據Breastcancersurvey觀測對象,按照淋巴結與否轉移、組織學分級分別記錄患者生存時間與腫瘤大小平均數、原則差;并記錄在不同組織學分級中,計算腫瘤大小超過1.5公分所占比例。如果通過前面簡介命令,需要多步解決后才可以得到想要成果;但是通過該命令可以僅僅運營一次就得到想要成果。Datacolumns為需要對其進行匯總變量,breakcolumns為分組變量分別點擊datacolumns中time與size,定義其format,窗口如下:同理也可以在breakcolumns中定義淋巴結轉移狀況、組織學分級;此外可以定義如何對這兩個分組變量所相應time和size進行記錄描述:定義結束后直接點擊ok,系統(tǒng)運營后得出成果表格如下(節(jié)選),如果需要修改表格中數據可以直接雙擊該表格編輯。ReportSummariesinColumns該過程與reportsummariesinrows十分相似;但是輸出成果更快湊。例如上述例題,改用本命令:其操作環(huán)節(jié)同reportsummariesinrows,分別將time與size移入datacolumns,再將淋巴節(jié)轉移以及組織學分級移入breakcolumns;與reportsummariesinrows不同是在上述窗口中多了:inserttotal按鈕,以及summary按鈕被放在datacolumns框中。Inserttotal可以在輸出表格中加入一種名為total匯總變量。接著咱們可以對datacolumns中pathsize、time作匯總設定;點擊summary,分別設定size為超過1.5公分,time為取平均值:在format中設定其中文標目以及對其方式:同樣對breakcolumns中兩個分組變量也做類似設定,完畢上述設定后點擊OK得到成果:*試對系統(tǒng)自帶文獻cars按不同產地和汽缸數計算汽車平均功率,以及加速至60mph所需時間均數以及原則差;并給出在不同產地中該項時間為20秒以上車型所占比例。*試對系統(tǒng)自帶文獻cars按不同產地和汽缸數計算汽車平均功率以及平均車重;并計算平均車重與平均輸出動力比值。2、Tables上述Reports命令中匯總設立重要針對定量資料(從其statistics或summary選項中可以看出重要是計算平均數、原則差、最大值、最小值、偏度系數、峰度系數等專門針對計量資料記錄指標);而諸多時候咱們將要對分類變量進行匯總并制定相應表格,這時repots命令就無能為力了。Tables命令正是用于分類變量記錄匯總和分類變量記錄制表。BasicTables:該命令為最基本tables過程,但是已經可以對分類資料/計量資料(兩者中選取一種)進行各種復雜描述,只但是與tables中其她命令相比較為basic而已;此外它還具備一種特點,可以按照研究者需要定做恰當表格輸出。例如在某次高血壓調查中,收集了患者某些個人資料以及血壓控制狀況,詳見高血壓.sav。某研究者想按照不同性別、文化限度、和肥胖限度計算高血壓控制限度頻數分布;此外研究者僅僅想理解輕度肥胖、文化限度為初中及如下患者血壓控制限度。對話框中down為表格橫標目,across為表格縱標目;separatetables為分層變量(如果研究者僅僅想理解分組因素某個水平匯總狀況,從而簡化輸出成果,可以考慮將原先down中某些變量移入separatetables中)。表格輸出編排方式有兩種:allcombination[nested]嵌套式表格、eachseparately[stacked]分列式表格。系統(tǒng)默以為嵌套式。Statistics對話框為表格中數據記錄方式,本例僅僅要理解頻數分布狀況,因此選取count。Total中,可以選取在表格中加入共計欄/列。接著咱們定義如下如果表格中浮現頻數為0時應當如何顯示,系統(tǒng)默以為空格;咱們選取填0。點擊ok系統(tǒng)運營成果如下,固然也可以選取輸出eachseparately[stacked]分列式表格:該表為嵌套式表格,所有分組變量依次進入表格,后進入嵌套在先進入變量下一級。如果研究者僅僅想按照各分組變量單獨匯總成果,可以選取分列式表格輸出:表格中將分別按照性別、文化限度、肥胖限度各自輸出控制狀況頻數分布。此外研究者僅僅想理解輕度肥胖、文化限度為初中及如下患者血壓控制限度。則可以選取使用分層表:將肥胖限度與文化限度選入separatetables中,其她設立同前,點擊ok,系統(tǒng)將輸出如下表格:該表格為分層表,可以雙擊該表格,選取需要因素組合水平(本例中為輕度肥胖、文化限度為初中及如下),系統(tǒng)將給出針對性表格:GeneralTables:Basictables過程已經為咱們提供了良好制表功能,但是還是有些局限性;例如:它只能分別對分類或計量資料作匯總,如果要同步對兩者進行記錄則無能為力;它不支持對多選題數據進行匯總。為此SPSS提供了比basictables過程更強大generaltables命令。例如針對同一高血壓療效調查,研究者但愿對不同文化限度與性別匯總下列信息:血壓控制頻數分布輸出患者年齡均數與原則差輸出非藥物控制辦法實行狀況(非藥物辦法有飲食、運動、情緒和其她四種選項,一種患者也許同步選取其中各種),涉及頻數和構成比。如果將上述三個問題一一拆解也許需要不少時間,并且容易在匯總過程中出錯。使用generaltables過程可以一次性解決三個問題,并將三某些成果輸出在同一種表格中。對話框中rows為橫標目,columns為縱標目,multresponse選項框為多選題定義框在本例題中可以將性別、文化限度選入rows中(固然選入columns中也可以)作為分組根據;將血壓控制狀況、年齡、非藥物控制辦法(該變量存在于multresponse框中)選入columns中。但是在入選非藥物控制辦法之前,要對該選項作設定:先將setdefinition中method1至method4所有選上,移入variablesinset中。在下方variablesarecodedas可以定義變量集中變量取值:dichotomies表達變量采用二分法(即所謂二項分類),在之后countedvalues中填入入選變量值(例如本題中定義所有非藥物辦法中變量值為2表達有采用本辦法被系統(tǒng)選中);categories為多項分類法,如果采用本辦法最佳在分析開始前對變量進行恰當編排(例如在醫(yī)科大學研究生教誨過程中要開設20門選修課,現要分析研究生最喜歡3門選修課,如果將所有開設研究生課程一一列出,然后在每門課程變量取值中定義0為不喜歡,1為喜歡,則需要設定20個課程變量,而后再一一取值十分麻煩;可以考慮將每個同窗3次選取作為三個變量,錄入數據時直接輸入課程編碼即可,這種解決辦法就是多分類法)。在本例中由于不同觀測對象也許采用非藥物療法種類數不同,例如有采用兩種,有采用三種,有一種都不采用,因此本題采用對每個非藥物療法進行二分類辦法進行編碼。在multresponsesets中顯示多選題變量名,可以單擊該變量名進行修改,修改后點擊save保存設立回到generaltables主對話框:接著要對匯總變量(年齡、血壓控制狀況以及非藥物療法采用狀況)進行匯總記錄量設定。對于不同類型變量(計量或分類)必要先制定類型。Definescells用于分類變量(即血壓控制),Issummarized則用于計量資料(年齡);依照題意分別通過editstatistics設定匯總記錄量:定義后可以點擊OK系統(tǒng)輸出下列表格:該表格為分列式,即分組變量性別與文化限度分別并排列出;如果要得到嵌套式表格,必要將性別或文化限度中某個移入layers中,并在輸出成果中用pivotingtrays設定。先在成果輸出中用右鍵單擊——spsspivottableobject——open,在浮現窗口中選取pivot——pivotingtrays。系統(tǒng)將彈出如下對話框,其行與列含義與前面設立相似,將layers變量拖拽至column中即可。需要解釋是“比例%”;原先它含義為該數據占列共計比例;例如男性初中如下文化,調節(jié)飲食有11例,所占比例為31.4%(男性初中如下共有35人,其中有12人血壓控制狀況為缺失,因此從血壓控制狀況計算處共計人數只有7+6+10=23人;35人中采用調節(jié)飲食有11人,占該人群比例11/35=31.4%;由于同一種觀測對象也許同步選取兩種或各種辦法,因此該列比例之和超過100%)。MultipleResponseTables:該過程專門為多項選取題而設立。例如對上述例題咱們采用multipleresponsetables過程操作:變量放置同generaltables,與generaltables不同是在multipleresponse中系統(tǒng)已經自動定義好多選題,并已經生成一種為nodrug變量;此外該過程默認狀況下就已經輸出嵌套式表格,省去generaltables中復雜轉換過程。但是該命令也有局限性之處,那就是它只可以用于分類變量(由于多項選取自身就是分類成果),對于定量變量例如年齡等不再合用。因此只要將性別與文化限度放入rows中,將血壓控制狀況與非藥物控制辦法放入columns中,點擊statistics設定記錄指標;在本例中僅僅需要計數(count)與行比例(row%);表格輸出是默認是nesting(嵌套式),并且無論行或列均以嵌套方式輸出:如果覺得沒有必要對縱標目(columns)也按照嵌套式輸出,則可以將nesting下columns前勾去掉,得到如下表格:TablesofFrequencies:該過程最大特點是在一張表格中為各種分類變量提供其頻數分布狀況,其功能較前面幾種
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度商業(yè)活動場地借用及宣傳合同2篇
- 二零二五年度體育產業(yè)普通合伙企業(yè)合作協議范本4篇
- 2025年度5G產業(yè)投資理財協議
- 2025年三方知識產權轉讓還款協議書范本及內容說明3篇
- 個性化定制2024年版民間資金借貸協議范本版B版
- 2025年酒店住宿賠償協議范本
- 個人股份轉讓協議書
- 2025年標準植樹承包合同模板:森林碳匯項目專用3篇
- 個人汽車出租公司用協議細則(2024版)版B版
- 二零二五年度小微企業(yè)專項借貸合同
- 2024-2030年中國海泡石產業(yè)運行形勢及投資規(guī)模研究報告
- 動物醫(yī)學類專業(yè)生涯發(fā)展展示
- 2024年同等學力申碩英語考試真題
- 消除“艾梅乙”醫(yī)療歧視-從我做起
- 非遺文化走進數字展廳+大數據與互聯網系創(chuàng)業(yè)計劃書
- 2024山西省文化旅游投資控股集團有限公司招聘筆試參考題庫附帶答案詳解
- 科普知識進社區(qū)活動總結與反思
- 加油站廉潔培訓課件
- 現金日記賬模板(帶公式)
- 消化內科??票O(jiān)測指標匯總分析
- 混凝土結構工程施工質量驗收規(guī)范
評論
0/150
提交評論