spss軟件實(shí)驗(yàn)指導(dǎo)書_第1頁(yè)
spss軟件實(shí)驗(yàn)指導(dǎo)書_第2頁(yè)
spss軟件實(shí)驗(yàn)指導(dǎo)書_第3頁(yè)
spss軟件實(shí)驗(yàn)指導(dǎo)書_第4頁(yè)
spss軟件實(shí)驗(yàn)指導(dǎo)書_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS統(tǒng)計(jì)分析軟件實(shí)驗(yàn)指 導(dǎo) 書經(jīng)濟(jì)與管理學(xué)院工商管理系統(tǒng)計(jì)模擬實(shí)習(xí)課程組2011年2月目 錄1. 實(shí)驗(yàn)一 SPSS的數(shù)據(jù)基本操作2. 實(shí)驗(yàn)二 描述性統(tǒng)計(jì)分析3. 實(shí)驗(yàn)三 均值比較4. 實(shí)驗(yàn)四 相關(guān)分析和回歸分析5. 實(shí)驗(yàn)五 聚類分析和判別分析6. 實(shí)驗(yàn)六 因子分析和主成分分析SPSS統(tǒng)計(jì)分析軟件實(shí)驗(yàn)一、課程實(shí)驗(yàn)課所占學(xué)時(shí)30學(xué)時(shí)二、 實(shí)驗(yàn)適用專業(yè)經(jīng)濟(jì)管理類各專業(yè)三、 實(shí)驗(yàn)的任務(wù)、性質(zhì)和目的統(tǒng)計(jì)計(jì)算,尤其是多元統(tǒng)計(jì)計(jì)算往往是十分復(fù)雜的,因此需要借助統(tǒng)計(jì)軟件。本課程實(shí)驗(yàn)正是為了使學(xué)生系統(tǒng)地學(xué)習(xí)SPSS這一統(tǒng)計(jì)軟件,培養(yǎng)學(xué)生根據(jù)實(shí)際問題建立SPSS數(shù)據(jù)文件、利用SPSS軟件提供的各種統(tǒng)計(jì)功能進(jìn)行

2、統(tǒng)計(jì)分析,并結(jié)合一定專業(yè)知識(shí)對(duì)分析結(jié)果給出合理解釋的能力,從而為學(xué)生以后從事統(tǒng)計(jì)分析工作打下基礎(chǔ)。 四、 實(shí)驗(yàn)方式與基本要求1由授課教師講清上機(jī)實(shí)驗(yàn)的基本要求和注意事項(xiàng);2由授課教師事先布置上機(jī)實(shí)驗(yàn)的內(nèi)容,設(shè)計(jì)要求,操作步驟,并要求學(xué)生課前進(jìn)行準(zhǔn)備;3學(xué)生集中在機(jī)房上機(jī);4要求學(xué)生每次完成所布置的任務(wù),提交實(shí)驗(yàn)報(bào)告。五、 考核方式與評(píng)分辦法1. 實(shí)驗(yàn)報(bào)告(60%)2. 上機(jī)檢查(20%)3. 考勤(20%)實(shí)驗(yàn)一 SPSS基本操作一、 實(shí)驗(yàn)?zāi)康? 熟悉SPSS的菜單和窗口界面,熟悉SPSS各種參數(shù)的設(shè)置;2掌握SPSS的數(shù)據(jù)管理功能。二、 實(shí)驗(yàn)內(nèi)容及步驟(一) 數(shù)據(jù)的輸入和保存1. SPSS界

3、面當(dāng)打開SPSS后,展現(xiàn)在我們面前的界面如下:請(qǐng)注意窗口頂部顯示為“SPSS for Windows Data Editor”,表明現(xiàn)在所看到的是SPSS的數(shù)據(jù)管理窗口。這是一個(gè)典型的Windows軟件界面,有菜單欄、工具欄。該界面和EXCEL極為相似,很多操作也與EXCEL類似,同學(xué)們可以自己試試。2.定義變量選擇菜單Data=Define Variable。系統(tǒng)彈出定義變量對(duì)話框如下:對(duì)話框最上方為變量名,現(xiàn)在顯示為“VAR00001”,這是系統(tǒng)的默認(rèn)變量名;往下是變量情況描述,可以看到系統(tǒng)默認(rèn)該變量為數(shù)值型,長(zhǎng)度為8,有兩位小數(shù)位,尚無(wú)缺失值,顯示對(duì)齊方式為右對(duì)齊;第三部分為四個(gè)設(shè)置更改

4、按鈕,分別可以設(shè)定變量類型、標(biāo)簽、缺失值和列顯示格式;第四部分實(shí)際上是用來(lái)定義變量屬于數(shù)值變量、有序分類變量還是無(wú)序分類變量,現(xiàn)在系統(tǒng)默認(rèn)新變量為數(shù)值變量;最下方則依次是確定、取消和幫助按鈕。假如有兩組數(shù)據(jù)如下:GROUP 1: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11GROUP 2: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87先來(lái)建立分組變量GROUP。請(qǐng)將變量名改為GROUP,然后單擊OK按鈕。現(xiàn)在SPSS的數(shù)據(jù)管理窗口如下所示:第一列的

5、名稱已經(jīng)改為了“group”,這就是我們所定義的新變量“group”。現(xiàn)在我們來(lái)建立變量X。單擊第一行第二列的單元格,然后選擇菜單Data=Define Variable,同樣,將變量名改為X,然后確認(rèn)。此時(shí)SPSS的數(shù)據(jù)管理窗口如下所示:現(xiàn)在,第一、第二列的名稱均為深色顯示,表明這兩列已經(jīng)被定義為變量,其余各列的名稱仍為灰色的“var”,表示尚未使用。同樣地,各行的標(biāo)號(hào)也為灰色,表明現(xiàn)在還未輸入過數(shù)據(jù),即該數(shù)據(jù)集內(nèi)沒有記錄。3.輸入數(shù)據(jù)我們先來(lái)輸入變量X的值,請(qǐng)確認(rèn)一行二列單元格為當(dāng)前單元格,棄鼠標(biāo)而用鍵盤,輸入第一個(gè)數(shù)據(jù)0.84,此時(shí)界面顯示如圖A所示:請(qǐng)注意:在回車之前,你輸入的數(shù)據(jù)在數(shù)

6、據(jù)欄內(nèi)顯示,而不是在單元格內(nèi)顯示,現(xiàn)在回車,界面如圖B所示:首先,當(dāng)前單元格下移,變成了二行二列單元格,而一行二列單元格的內(nèi)容則被替換成了0.84;其次,第一行的標(biāo)號(hào)變黑,表明該行已輸入了數(shù)據(jù);第三,一行一列單元格因?yàn)闆]有輸入過數(shù)據(jù),顯示為“.”,這代表該數(shù)據(jù)為缺失值。4. 保存數(shù)據(jù)選擇菜單File=Save,由于該數(shù)據(jù)從來(lái)沒有被保存過,所以彈出Save as對(duì)話框如下:?jiǎn)螕舯4骖愋土斜砜?,可以看到SPSS所支持的各種數(shù)據(jù)類型,有DBF、FoxPro、EXCEL、ACCESS等,這里我們?nèi)匀粚⑵浯鏋镾PSS自己的數(shù)據(jù)格式(*.sav文件)。在文件名框內(nèi)鍵入Li1_1并回車,可以看到數(shù)據(jù)管理窗口

7、左上角由Untitled變?yōu)榱爽F(xiàn)在的變量名Li1_1。(二)數(shù)據(jù)的預(yù)分析1. 數(shù)據(jù)的簡(jiǎn)單描述首先我們需要知道數(shù)據(jù)的基本情況,如均數(shù)、標(biāo)準(zhǔn)差等。選擇Analyze=Descriptive Statistics=Descriptives菜單,系統(tǒng)彈出描述對(duì)話框如下:該對(duì)話框可分為左右兩大部分,左側(cè)為所有可用的侯選變量列表,右側(cè)為選入變量列表。我們只需要描述X,用鼠標(biāo)選中X,單擊中間的,變量X的標(biāo)簽就會(huì)移入右側(cè),注意這時(shí)OK按鈕變黑,表明已經(jīng)可以進(jìn)行分析了,單擊它,系統(tǒng)會(huì)彈出一個(gè)新的界面如下所示:該窗口上方的名稱為SPSS for Windows Viewer,即(結(jié)果)瀏覽窗口,整個(gè)的結(jié)構(gòu)和資源管

8、理器類似,左側(cè)為導(dǎo)航欄,右側(cè)為具體的輸出結(jié)果。結(jié)果表格給出了樣本數(shù)、最小值、最大值、均數(shù)和標(biāo)準(zhǔn)差這幾個(gè)常用的統(tǒng)計(jì)量。從中可以看到,24個(gè)數(shù)據(jù)總的均數(shù)為1.2846,標(biāo)準(zhǔn)差為0.4687。如果數(shù)據(jù)進(jìn)行了分組,還可以看看分組的描述情況。這里要用到文件分割功能,請(qǐng)切換回?cái)?shù)據(jù)管理窗口,選擇Data=Split File菜單,系統(tǒng)彈出文件分割對(duì)話框如下:選擇單選按鈕Organize output by groups,將變量GROUP選入右側(cè)的選入變量框,單擊OK鈕,此時(shí)界面不會(huì)有任何改變,但請(qǐng)?jiān)僮鲆淮螖?shù)據(jù)描述,你就可以看到現(xiàn)在數(shù)據(jù)是分Group=1和Group=2兩種情況在描述了!從描述可知兩組的均數(shù)和

9、標(biāo)準(zhǔn)差分別為1.5209、1.0846和0.4218、0.4221。2. 繪制直方圖統(tǒng)計(jì)指標(biāo)只能給出數(shù)據(jù)的大致情況,沒有直方圖那樣直觀,我們就來(lái)畫個(gè)直方圖瞧瞧!選擇Graphs=Histogram,系統(tǒng)會(huì)彈出繪制直方圖對(duì)話框如下:將變量X選入Variable選擇框內(nèi),單擊OK按鈕。此時(shí)結(jié)果瀏覽窗口內(nèi)將繪制出直方圖。最后,我們還要取消變量分割,免得它影響以后的統(tǒng)計(jì)分析,再次調(diào)出變量分割對(duì)話框,選擇單選按鈕中的“Analyze all cases, do not creat group”,單擊OK按鈕就可以了。(三)保存和導(dǎo)出分析結(jié)果1.保存結(jié)果文件在結(jié)果瀏覽窗口中(注意:一定要在結(jié)果瀏覽窗口中)

10、選擇菜單File=Save,由于該結(jié)果也從來(lái)沒有被保存過,所以彈出和前面保存數(shù)據(jù)時(shí)極為相似的一個(gè)Save as對(duì)話框,和前面相比,他唯一的區(qū)別就是文件的保存類型只有View Files(*.spo)一種。在文件名框中鍵入“Li1_1”并回車,該結(jié)果文件就會(huì)按文件名Li1_1.spo被存儲(chǔ)。2. 導(dǎo)出分析結(jié)果文件倒是保存了,但問題還沒有完全解決:我們從來(lái)寫文章什么的都用的是文字處理軟件,尤其是WORD,可WORD不能直接讀取SPO格式的文件,怎么辦呢?沒關(guān)系,SPSS提供了將結(jié)果導(dǎo)出為純文本格式或網(wǎng)頁(yè)格式的功能,在結(jié)果瀏覽窗口中選擇菜單File=Export,系統(tǒng)會(huì)彈出Exprot Output

11、對(duì)話框如下:最上方的Export下拉式列表可以選擇輸出的內(nèi)容,可以為含圖表的輸出文檔、無(wú)圖表的輸出文檔和只有統(tǒng)計(jì)圖表三種;中部的Export File對(duì)話框則填入輸出的目標(biāo)文件名;左下方的Export What單選框可以選擇輸出結(jié)果的哪些部分,可以是所有結(jié)果、所有可見結(jié)果或只輸出選擇的結(jié)果,一般選輸出所有可見結(jié)果;右下方的輸出文件類型下拉式列表已被我打開,可見里面有網(wǎng)頁(yè)格式和純文本格式兩種,在一切按所需選擇完畢后按OK鈕,則結(jié)果文件就會(huì)輸出為你想要的類型。實(shí)驗(yàn)二 描述性統(tǒng)計(jì)分析一、實(shí)驗(yàn)?zāi)康?、掌握數(shù)據(jù)集中趨勢(shì)和離中趨勢(shì)的分析方法;2、熟練掌握各個(gè)分析過程的基本步驟以及彼此之間的聯(lián)系和區(qū)別。二、

12、實(shí)驗(yàn)內(nèi)容及步驟(一)Frequencies過程頻數(shù)分布表是描述性統(tǒng)計(jì)中最常用的方法之一,F(xiàn)requencies過程就是專門為產(chǎn)生頻數(shù)表而設(shè)計(jì)的。它不僅可以產(chǎn)生詳細(xì)的頻數(shù)表,還可以按要求給出某百分位點(diǎn)的數(shù)值,以及常用的條圖,圓圖等統(tǒng)計(jì)圖。和國(guó)內(nèi)常用的頻數(shù)表不同,幾乎所有統(tǒng)計(jì)軟件給出的均是詳細(xì)頻數(shù)表,即并不按某種要求確定組段數(shù)和組距,而是按照數(shù)值精確列表。如果想用Frequencies過程得到我們所熟悉的頻數(shù)表,請(qǐng)先用第二章學(xué)過的Recode過程產(chǎn)生一個(gè)新變量來(lái)代表所需的各組段。1.界面說(shuō)明Frequencies對(duì)話框的界面如下所示:該界面在SPSS中實(shí)在太普通了,無(wú)須多言,重點(diǎn)介紹一下各部分的功

13、能如下:【Display frequency tables復(fù)選框】確定是否在結(jié)果中輸出頻數(shù)表?!維tatistics鈕】單擊后彈出Statistics對(duì)話框如下,用于定義需要計(jì)算的其他描述統(tǒng)計(jì)量?,F(xiàn)將各部分解釋如下:Percentile Values復(fù)選框組 定義需要輸出的百分位數(shù),可計(jì)算四分位數(shù)(Quartiles)、每隔指定百分位輸出當(dāng)前百分位數(shù)(Cut points for equal groups)、或直接指定某個(gè)百分位數(shù)(Percentiles),如直接指定輸出P2.5和P97.5。 Central tendency復(fù)選框組 用于定義描述集中趨勢(shì)的一組指標(biāo):均數(shù)(Mean)、中位數(shù)(

14、Median)、眾數(shù)(Mode)、總和(Sum)。 Dispersion復(fù)選框組 用于定義描述離散趨勢(shì)的一組指標(biāo):標(biāo)準(zhǔn)差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、標(biāo)準(zhǔn)誤(S.E.mean)。 Distribution復(fù)選框組 用于定義描述分布特征的兩個(gè)指標(biāo):偏度系數(shù)(Skewness)和峰度系數(shù)(Kurtosis)。 Values are group midpoints復(fù)選框 當(dāng)你輸出的數(shù)據(jù)是分組頻數(shù)數(shù)據(jù),并且具體數(shù)值是組中值時(shí),選中該復(fù)選框以通知SPSS,免得它犯錯(cuò)誤。眾數(shù)(Mode)指所有數(shù)值中出現(xiàn)頻

15、率最高的一個(gè)值,在國(guó)內(nèi)用的非常少?!綜harts鈕】彈出Charts對(duì)話框,用于設(shè)定所做的統(tǒng)計(jì)圖。Chart type單選鈕組 定義統(tǒng)計(jì)圖類型,有四種選擇:無(wú)、條圖(Bar chart)、圓圖(Pie chart)、直方圖Histogram),其中直方圖還可以選擇是否加上正態(tài)曲線(With normal curve)。 Chart Values單選鈕組 定義是按照頻數(shù)還是按百分比做圖(即影響縱坐標(biāo)刻度)。【Format鈕】彈出Format對(duì)話框,用于定義輸出頻數(shù)表的格式,不過用處不大,一般不管。Order by單選鈕組 定義頻數(shù)表的排列次序,有四個(gè)選項(xiàng):Ascending values為根據(jù)數(shù)

16、值大小按升序從小到大作頻數(shù)分布;Descending values為根據(jù)數(shù)值大小按降序從大到小作頻數(shù)分布;Ascending counts為根據(jù)頻數(shù)多少按升序從少到多作頻數(shù)分布;Descending counts為根據(jù)頻數(shù)多少按降序從多到少作頻數(shù)分布。 Multiple Variables單選鈕組 如果選擇了兩個(gè)以上變量做頻數(shù)表,則Compare variables可以將他們的結(jié)果在同一個(gè)頻數(shù)表過程輸出結(jié)果中顯示,便于互相比較,Organize output by variables則將結(jié)果在不同的頻數(shù)表過程輸出結(jié)果中顯示。 Suppress Tables more than.復(fù)選框 當(dāng)頻數(shù)表

17、的分組數(shù)大于下面設(shè)定數(shù)值時(shí)禁止它在結(jié)果中輸出,這樣可以避免產(chǎn)生巨型表格。2. 分析實(shí)例例1 某地101例健康男子血清總膽固醇值測(cè)定結(jié)果如下,請(qǐng)繪制頻數(shù)表、直方圖,計(jì)算均數(shù)、標(biāo)準(zhǔn)差、變異系數(shù)CV、中位數(shù)M、p2.5和p97.5。4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.

18、44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.

19、14 3.24 4.90 3.05解:為節(jié)省篇幅,這里只給出精確頻數(shù)表的做法,假設(shè)數(shù)據(jù)已經(jīng)輸好,變量名為X,具體解法如下:1. Analyze=Descriptive Statistics=Frequencies 2. Variables框:選入X 3. 單擊Statistics鈕: 4. 選中Mean、Std.deviation、Median復(fù)選框 5. 單擊Percentiles:輸入2.5:?jiǎn)螕鬉dd:輸入97.5:?jiǎn)螕鬉dd: 6. 單擊Continue鈕 7. 單擊Charts鈕: 8. 選中Bar charts 9. 單擊Continue鈕 10. 單擊OK得出結(jié)果后手工計(jì)算出CV

20、。上面做出的直方圖分組太多,需要進(jìn)一步編輯。3.結(jié)果解釋上題除直方圖外的的輸出結(jié)果如下:Frequencies最上方為表格名稱,左上方為分析變量名,可見樣本量N為101例,缺失值0例,均數(shù)Mean=4.69,中位數(shù)Median=4.61,標(biāo)準(zhǔn)差STD=0.8616,P2.5=3.04,P97.5=6.45。系統(tǒng)對(duì)變量x作頻數(shù)分布表(此處只列出了開頭部分),Vaild右側(cè)為原始值,F(xiàn)requency為頻數(shù),Percent為各組頻數(shù)占總例數(shù)的百分比(包括缺失記錄在內(nèi)),Valid percent為各組頻數(shù)占總例數(shù)的有效百分比,Cum Percent為各組頻數(shù)占總例數(shù)的累積百分比。(二)Descri

21、ptives過程Descriptives過程是連續(xù)資料統(tǒng)計(jì)描述應(yīng)用最多的一個(gè)過程,他可對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算并列出一系列相應(yīng)的統(tǒng)計(jì)指標(biāo)。這和其他過程相比并無(wú)不同。但該過程還有個(gè)特殊功能就是可將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)評(píng)分值并以變量的形式存入數(shù)據(jù)庫(kù)供以后分析。1.界面說(shuō)明【Save standardized values as variables復(fù)選框】確定是否將原始數(shù)據(jù)的標(biāo)準(zhǔn)正態(tài)評(píng)分存為新變量?!綩ptions鈕】彈出Options對(duì)話框,大部分內(nèi)容均在前面Frequences過程的Statistics對(duì)話框中見過,只有最下方的Display Order單選鈕組是新的,可以選擇為變量列表

22、順序、字母順序、均數(shù)升序或均數(shù)降序。2.結(jié)果解釋下面是一個(gè)典型的Descriptives過程結(jié)果統(tǒng)計(jì)表:一望可知,這里的大部分內(nèi)容都在上一節(jié)見過,因此就不再多解釋了。講了兩個(gè)過程,也許大家已經(jīng)發(fā)現(xiàn)了:結(jié)果中的統(tǒng)計(jì)專業(yè)單詞多數(shù)在對(duì)話框中就已經(jīng)出現(xiàn),因此我們以后會(huì)詳細(xì)解釋對(duì)話框的內(nèi)容,結(jié)果中相同的單詞不再重復(fù)解釋。(三)Explore過程Explore過程可對(duì)變量進(jìn)行更為深入詳盡的描述性統(tǒng)計(jì)分析,主要用于對(duì)資料的性質(zhì)、分布特點(diǎn)等完全不清楚時(shí),故又稱之為探索性分析。它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,如枝葉圖、箱圖等,顯得更加詳細(xì)、全面,有助于用戶制定繼續(xù)分析的方案

23、。1.界面說(shuō)明【Display單選鈕組】用于選擇輸出結(jié)果中是否包含統(tǒng)計(jì)描述、統(tǒng)計(jì)圖或兩者均包括。【Dependent List框】用于選入需要分析的變量?!綟actor List框】如果想讓所分析的變量按某種因素取值分組分析,則在這里選入分組變量。【Label cases by框】選擇一個(gè)變量,他的取值將作為每條記錄的標(biāo)簽。最典型的情況是使用記錄ID號(hào)的變量?!維tatistics鈕】彈出Statistics對(duì)話框,用于選擇所需要的描述統(tǒng)計(jì)量。有如下選項(xiàng):Descriptives復(fù)選框:輸出均數(shù)、中位數(shù)、眾數(shù)、5%修正均數(shù)、標(biāo)準(zhǔn)誤、方差、標(biāo)準(zhǔn)差、最小值、最大值、全距、四分位全距、峰度系數(shù)、峰度

24、系數(shù)的標(biāo)準(zhǔn)誤、偏度系數(shù)、偏度系數(shù)的標(biāo)準(zhǔn)誤及指定的均數(shù)可信區(qū)間。 M-estimators復(fù)選框:作中心趨勢(shì)的粗略最大似然確定,輸出四個(gè)不同權(quán)重的最大似然確定數(shù)。 Outliers復(fù)選框:輸出五個(gè)最大值與五個(gè)最小值。 Percentiles復(fù)選框:輸出第5%、10%、25%、50%、75%、90%、95%位數(shù)?!綪lot鈕】彈出Plot對(duì)話框,用于選擇所需要的統(tǒng)計(jì)圖。有如下選項(xiàng):Boxplots單選框組:確定箱式圖的繪制方式,可以是按組別分組繪制(Factor levels together),也可以不分組一起繪制(Depentends together),或者不繪制(None)。 Descri

25、ptive復(fù)選框組:可以選擇繪制莖葉圖(Stem-and-leaf)和直方圖(Histogram)。 Normality plots with test復(fù)選框:繪制正態(tài)分布圖并進(jìn)行變量是否符合正態(tài)分布的檢驗(yàn)。 Spread vs. Level with Levene Test單選框組:當(dāng)選擇了分組變量時(shí),繪制spread-versus-level圖(我還沒有找到他的中文名字該叫什么),設(shè)置繪圖時(shí)變量的轉(zhuǎn)換方式,并進(jìn)行組間方差齊性檢驗(yàn)?!綩ptions鈕】用于選擇對(duì)缺失值的處理方式,可以是不分析有任一缺失值的記錄、不分析計(jì)算某統(tǒng)計(jì)量時(shí)有缺失值的記錄,或報(bào)告缺失值。2.結(jié)果解釋以例6.1的數(shù)據(jù)為例

26、,按默認(rèn)方式下的選擇,Explore過程的輸出如下:Explore首先是例行的處理記錄缺失值情況報(bào)告,可見101例均為有效值。上表詳細(xì)列出了常用的描述統(tǒng)計(jì)量,如果有標(biāo)準(zhǔn)誤也會(huì)列出(如偏度和峰度系數(shù))。XX Stem-and-Leaf PlotFrequency Stem & Leaf 1.00 2 . 7 8.00 3 . 9.00 3 . 24.00 4 . 44 25.00 4 . 899 17.00 5 . 9.00 5 . 6.00 6 . 1.00 6 . 5 1.00 Extremes (=7.2)Stem width: 1.0000Each leaf: 1 case(s)以上是莖

27、葉圖,整數(shù)位為莖,小數(shù)位為葉。這樣可以非常直觀的看出數(shù)據(jù)的分布范圍及形態(tài),在國(guó)外非常流行。以上是箱式圖,中間的黑粗線為均數(shù),紅框?yàn)樗姆治婚g距的范圍,上下兩個(gè)細(xì)線為最大、最小值。(四)Crosstabs過程Crosstabs過程用于對(duì)計(jì)數(shù)資料和有序分類資料進(jìn)行統(tǒng)計(jì)描述和簡(jiǎn)單的統(tǒng)計(jì)推斷。在分析時(shí)可以產(chǎn)生二維至n維列聯(lián)表,并計(jì)算相應(yīng)的百分?jǐn)?shù)指標(biāo)。統(tǒng)計(jì)推斷則包括了我們常用的X2檢驗(yàn)、Kappa值,分層X2(X2M-H)。如果安裝了相應(yīng)模塊,還可計(jì)算n維列聯(lián)表的確切概率(Fishers Exact Test)值。Crosstabs過程不能產(chǎn)生一維頻數(shù)表(單變量頻數(shù)表),該功能由Frequencies過程

28、實(shí)現(xiàn)。1.界面說(shuō)明【Rows框】用于選擇行*列表中的行變量?!綜olumns框】用于選擇行*列表中的列變量?!綥ayer框】Layer指的是層,對(duì)話框中的許多設(shè)置都可以分層設(shè)定,在同一層中的變量使用相同的設(shè)置,而不同層中的變量分別使用各自層的設(shè)置。如果要讓不同的變量做不同的分析,則將其選入Layer框,并用Previous和Next鈕設(shè)為不同層。Layer在這里用的比較少,在多元回歸中我們將進(jìn)行詳細(xì)的解釋。【Display clustered bar charts復(fù)選框】顯示重疊條圖?!維uppress table復(fù)選框】禁止在結(jié)果中輸出行*列表?!綞xact鈕】針對(duì)2*2以上的行*列表設(shè)定計(jì)

29、算確切概率的方法,可以是不計(jì)算(Asymptotic only)、蒙特卡羅模擬(Monte Carlo)或確切計(jì)算(Exact)。蒙特卡羅模擬默認(rèn)進(jìn)行10000次模擬,給出99%可信區(qū)間;確切計(jì)算默認(rèn)計(jì)算時(shí)間限制在5分鐘內(nèi)。這些默認(rèn)值均可更改。如果你在安裝SPSS時(shí)沒有安裝EXACT模塊,則此處對(duì)話框中不會(huì)出現(xiàn)Exact鈕?!維tatistics鈕】彈出Statistics對(duì)話框,用于定義所需計(jì)算的統(tǒng)計(jì)量。Chi-square復(fù)選框:計(jì)算X2值。 Correlations復(fù)選框:計(jì)算行、列兩變量的Pearson相關(guān)系數(shù)和Spearman等級(jí)相關(guān)系數(shù)。 Norminal復(fù)選框組:選擇是否輸出反映

30、分類資料相關(guān)性的指標(biāo),很少使用。a. Contingency coefficient復(fù)選框:即列聯(lián)系數(shù),其值界于01之間;b. Phi and Cramers V復(fù)選框:這兩者也是基于X2值的,Phi在四格表X2檢驗(yàn)中界于-11之間,在R*C表X2檢驗(yàn)中界于01之間;Cramers V 則界于01之間;c. Lambda復(fù)選框:在自變量預(yù)測(cè)中用于反映比例縮減誤差,其值為1時(shí)表明自變量預(yù)測(cè)應(yīng)變量好,為0時(shí)表明自變量預(yù)測(cè)應(yīng)變量差;d. Uncertainty coefficient復(fù)選框:不確定系數(shù),以熵為標(biāo)準(zhǔn)的比例縮減誤差,其值接近1時(shí)表明后一變量的信息很大程度來(lái)自前一變量,其值接近0時(shí)表明后一

31、變量的信息與前一變量無(wú)關(guān)。Ordinal復(fù)選框組:選擇是否輸出反映有序分類資料相關(guān)性的指標(biāo),很少使用。a. Gamma復(fù)選框:界于01之間,所有觀察實(shí)際數(shù)集中于左上角和右下角時(shí),其值為1;b. Somersd復(fù)選框:為獨(dú)立變量上不存在同分的偶對(duì)中,同序?qū)ψ訑?shù)超過異序?qū)ψ訑?shù)的比例;c. Kendalls tau-b復(fù)選框:界于-11之間;d. Kendalls tau-c復(fù)選框:界于-11之間;Eta復(fù)選框:計(jì)算Eta值,其平方值可認(rèn)為是應(yīng)變量受不同因素影響所致方差的比例; Kappa復(fù)選框:計(jì)算Kappa值,即內(nèi)部一致性系數(shù); Risk復(fù)選框:計(jì)算比數(shù)比OR值; McNemanr復(fù)選框:進(jìn)行M

32、cNemanr檢驗(yàn)(一種非參檢驗(yàn)); Cochrans and Mantel-Haenszel statistics復(fù)選框:計(jì)算X2M-H統(tǒng)計(jì)量(分層X2,也有寫為X2CMH的),可在下方輸出H0假設(shè)的OR值,默認(rèn)為1?!綜ells鈕】彈出Cells對(duì)話框,用于定義列聯(lián)表單元格中需要計(jì)算的指標(biāo):Counts復(fù)選框組:是否輸出實(shí)際觀察數(shù)(Observed)和理論數(shù)(Expected); Percentages復(fù)選框組:是否輸出行百分?jǐn)?shù)(Row)、列百分?jǐn)?shù)(Column)以及合計(jì)百分?jǐn)?shù)(Total); Residuals復(fù)選框組:選擇殘差的顯示方式,可以是實(shí)際數(shù)與理論數(shù)的差值(Unstandard

33、ized)、標(biāo)化后的差值(Standardized,實(shí)際數(shù)與理論數(shù)的差值除理論數(shù)),或者由標(biāo)準(zhǔn)誤確立的單元格殘差(Adj. Standardized);【Format鈕】用于選擇行變量是升序還是降序排列。2.分析實(shí)例例2 某醫(yī)生用國(guó)產(chǎn)呋喃硝胺治療十二指腸潰瘍,以甲氰咪胍作對(duì)照組,問兩種方法治療效果有無(wú)差別?處 理愈 合未愈合合計(jì)呋喃硝胺54862甲氰咪胍442064合 計(jì)9828126解:由于此處給出的直接是頻數(shù)表,因此在建立數(shù)據(jù)集時(shí)可以直接輸入三個(gè)變量行變量、列變量和指示每個(gè)格子中頻數(shù)的變量,然后用Weight Cases對(duì)話框指定頻數(shù)變量,最后調(diào)用Crosstabs過程進(jìn)行X2檢驗(yàn)。假設(shè)三

34、個(gè)變量分別名為R、C和W,則數(shù)據(jù)集結(jié)構(gòu)和命令如下:RCW1.001.0054.001.002.0044.002.001.008.002.002.0020.001. Data=Weight Cases 2. Weight Cases by單選框:選中 3. Freqency Variable:選入W 4. 單擊OK鈕 5. Analyze=Descriptive Statistics=Crosstabs 6. Rows框:選入R 7. Columns框:C 8. Statistics鈕:Chi-square復(fù)選框:選中:?jiǎn)螕鬋ontinue鈕 9. 單擊OK鈕、3.結(jié)果解釋上題的結(jié)果如下:Cro

35、sstabs首先是處理記錄缺失值情況報(bào)告,可見126例均為有效值。上面為列出的四格表,實(shí)際使用時(shí)可以在其中加入變量值標(biāo)簽,使看起來(lái)更清楚。上表給出了一堆檢驗(yàn)結(jié)果,從左到右為:檢驗(yàn)統(tǒng)計(jì)量值(Value)、自由度(df)、雙側(cè)近似概率(Asymp.Sig.2-sided)、雙側(cè)精確概率(Exact Sig.2-sided)、單側(cè)精確概率(Exact Sig.1-sided);從上到下為:Pearson卡方(Pearson Chi-Square即常用的卡方檢驗(yàn))、連續(xù)性校正的卡方值(Continuity Correction)、對(duì)數(shù)似然比方法計(jì)算的卡方(Likelihood Ratio)、Fishe

36、rs確切概率法(Fishers Exact Test)、線性相關(guān)的卡方值(Linear by Linear Association)、有效記錄數(shù)(N of Valid Cases)。另外,Continuity Correction和Pearson卡方值處分別標(biāo)注有a和b,表格下方為相應(yīng)的注解:a.只為2*2表計(jì)算。b.0%個(gè)格子的期望頻數(shù)小于5,最小的期望頻數(shù)為13.78。因此,這里無(wú)須校正,直接采用第一行的檢驗(yàn)結(jié)果,即X2=6.133,P=0.013。實(shí)驗(yàn)三 均值比較一、 實(shí)驗(yàn)?zāi)康膶W(xué)習(xí)利用SPSS進(jìn)行單樣本、兩獨(dú)立樣本以及成對(duì)樣本的均值檢驗(yàn)。二、 實(shí)驗(yàn)內(nèi)容及步驟(一)描述統(tǒng)計(jì)(Means過程

37、)實(shí)驗(yàn)內(nèi)容:某醫(yī)師測(cè)得血紅蛋白值(g%)如表3.1,試?yán)肕eans過程作基本的描述性統(tǒng)計(jì)分析。表3.1對(duì)象編號(hào)性別年齡血紅蛋白值對(duì)象編號(hào)性別年齡血紅蛋白值1234567891011121314151617181920女男女女男男女男女女男男男女女女男男女男181618171618161818171818161717171716161812.8315.5012.2510.0610.889.658.3611.668.547.7813.6610.5712.569.878.9911.3514.5612.408.0514.0321222324252627282930313233343536373839

38、40女男男女女女女男男男男女女女男男男男女男161618181718171616181616181818181717161611.3612.7815.098.678.5612.5611.5614.677.8812.3513.659.8710.0912.5516.0413.7811.6710.988.7811.35實(shí)驗(yàn)步驟:1建立數(shù)據(jù)文件。定義4個(gè)變量:ID、Gender、Age和HB,分別表示編號(hào)、性別、年齡和血紅蛋白值。2. 選擇菜單“AnalyzeCompare MeansMeans”,彈出“Means”對(duì)話框。在對(duì)話框左側(cè)的變量列表中,選擇變量“血紅蛋白值”進(jìn)入“Dependent Li

39、st”列表框,選擇變量“性別”進(jìn)入“Independent List”,單擊“Next”按鈕,選擇變量“年齡”進(jìn)入“Independent List”。3單擊“Options”按鈕,在彈出的“選擇描述統(tǒng)計(jì)量”對(duì)話框中設(shè)置輸出的描述統(tǒng)計(jì)量。4單擊“OK”按鈕,得到輸出結(jié)果。(二)單樣本T檢驗(yàn)(One-Sample T Test過程)實(shí)驗(yàn)內(nèi)容:某地區(qū)10年測(cè)得16-18歲人口的平均血紅蛋白值為10.25?,F(xiàn)在抽查測(cè)量了該地區(qū)40個(gè)16-18歲人口的血紅蛋白如表1,試分析該地區(qū)現(xiàn)在16-18歲人口的血紅蛋白與10年前相比,是否有顯著的差異?實(shí)驗(yàn)步驟:1打開數(shù)據(jù)文件。2. 選擇菜單“AnalyzeCo

40、mpare MeansOne-Sample T Test”。彈出“One-Sample T Test”對(duì)話框。 3在對(duì)話框左側(cè)的變量列表中選擇變量“血紅蛋白”進(jìn)入“Test Variable(s)” 框;在“Test Value” 編輯框中輸入過去的平均血紅蛋白值10.25. 4單擊“OK”按鈕,得到輸出結(jié)果。(三)雙樣本T檢驗(yàn)(Independent-Samples T Test過程)實(shí)驗(yàn)內(nèi)容:分別測(cè)得14例老年性慢性支氣管炎病人及11例健康人的尿中17酮類固醇排出量(mg/dl)如下,試比較兩組均數(shù)有無(wú)差別。病 人2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.2

41、4 4.36 2.72 2.37 2.09 7.10 5.92健康人5.18 8.79 3.14 6.46 3.72 6.64 5.60 4.57 7.71 4.99 4.01實(shí)驗(yàn)步驟: 1建立數(shù)據(jù)文件。 定義變量名:把實(shí)際觀察值定義為x,再定義一個(gè)變量group來(lái)區(qū)分病人與健康人。輸入原始數(shù)據(jù),在變量group中,病人輸入1,健康人輸入2。 2. 選擇菜單“AnalyzeCompare MeansIndependent-samples T Test”項(xiàng),彈出“Independent- samples T Test”對(duì)話框。從對(duì)話框左側(cè)的變量列表中選x,進(jìn)入“Test Variable(s)”

42、框,選擇變量“group”,進(jìn)入“Grouping Variable”框,點(diǎn)擊“Define Groups”鈕彈出“Define Groups”定義框,在Group 1中輸入1,在Group 2中輸入2。3單擊“OK”按鈕,得到輸出結(jié)果。(四)成對(duì)樣本T檢驗(yàn)(Paired-Samples T Test過程)實(shí)驗(yàn)內(nèi)容:某單位研究飼料中缺乏維生素E與肝中維生素A含量的關(guān)系,將大白鼠按性別、體重等配為8對(duì),每對(duì)中兩只大白鼠分別喂給正常飼料和維生素E缺乏飼料,一段時(shí)期后將之宰殺,測(cè)定其肝中維生素A含量(mmol/L)如下,問飼料中缺乏維生素E對(duì)鼠肝中維生素A含量有無(wú)影響?大白鼠對(duì)別肝中維生素A含量(m

43、mol/L)正常飼料組維生素E缺乏飼料組1234567837.220.931.441.439.839.336.131.925.725.118.833.534.028.326.218.3實(shí)驗(yàn)步驟:1建立數(shù)據(jù)文件。定義變量名:正常飼料組測(cè)定值為x1,維生素E缺乏飼料組測(cè)定值為x2,輸入原始數(shù)據(jù)。2選擇菜單“AnalyzeCompare MeansPaired-samples T Test”項(xiàng),彈出“Paired - samples T Test”對(duì)話框。從對(duì)話框左側(cè)的變量列表中選擇變量x1、x2進(jìn)入Variables框。 3單擊“OK”按鈕,得到輸出結(jié)果。實(shí)驗(yàn)四 相關(guān)分析一、 實(shí)驗(yàn)?zāi)康膶W(xué)習(xí)利用SP

44、SS進(jìn)行相關(guān)分析、偏相關(guān)分析、距離分析、線性回歸分析和曲線回歸。二、實(shí)驗(yàn)內(nèi)容及實(shí)驗(yàn)步驟(一)兩變量的相關(guān)分析(Bivariate過程)實(shí)驗(yàn)內(nèi)容:某地區(qū)10名健康兒童頭發(fā)和全血中的硒含量(1000ppm)如下,試作發(fā)硒與血硒的相關(guān)分析。編號(hào)發(fā)硒血硒123456789107466886991736696587313101311169714510實(shí)驗(yàn)步驟:1建立數(shù)據(jù)文件。定義變量名:發(fā)硒為x,血硒為y,按順序輸入相應(yīng)數(shù)值。2選擇菜單“AnalyzeCorrelateBivariate” ,彈出“Bivariate Correlation”對(duì)話框。在對(duì)話框左側(cè)的變量列表中選x、y,使之進(jìn)入“Varia

45、bles”框;再在“Correlation Coefficients” 框中選擇Pearson相關(guān)系數(shù)(r);在“Test of Significance”框中選相關(guān)系數(shù)的 “Two-tailed”(雙側(cè))檢驗(yàn)。選中復(fù)選框“Flag significant correlations”設(shè)置是否突出顯示顯著相關(guān)。3單擊“Options”按鈕,彈出“Bivariate Correlation: Options”對(duì)話框,選擇“Means and standard deviations”和“Cross-product deviations and covariances”項(xiàng),輸出X、Y的均數(shù)與標(biāo)準(zhǔn)差以及

46、XY交叉乘積的標(biāo)準(zhǔn)差與協(xié)方差。4單擊“OK”按鈕,得到輸出結(jié)果。(二)偏相關(guān)分析(Partial 過程)實(shí)驗(yàn)內(nèi)容:某地29名13歲男童身高(cm)、體重(kg)和肺活量(ml)的數(shù)據(jù)如下表, 試對(duì)該資料作控制體重影響作用的身高與肺活量相關(guān)分析。編號(hào)身高(cm)體重(kg)肺活量(ml)編號(hào)身高(cm)體重(kg)肺活量(ml)123456789101112131415135.1139.9163.6146.5156.2156.4167.8149.7145.0148.5165.5135.0153.3152.0160.532.030.446.233.537.135.541.531.033.037.2

47、49.527.641.032.047.21750200027502500275020002750150025002250300012502750175022501617181920212223242526272829153.0147.6157.5155.1160.5143.0149.4160.8159.0158.2150.0144.5154.6156.547.240.543.344.737.531.533.940.438.537.536.034.739.532.017502000225027502000175022502750250020001750225025001750實(shí)驗(yàn)步驟:1建立數(shù)據(jù)

48、文件。定義變量名:身高為height,體重為weight,肺活量為vc,按順序輸入相應(yīng)數(shù)據(jù)。2選擇菜單“AnalyzeCorrelatePartial” ,彈出“Partial Correlations”對(duì)話框。在對(duì)話框左側(cè)的變量列表中選變量height、vc 進(jìn)入Variables框,選擇要控制的變量weight進(jìn)入“Controlling for”框中,以在控制體重的影響下對(duì)變量身高與肺活量進(jìn)行偏相關(guān)分析;在“Test of Significance”框中選雙側(cè)檢驗(yàn)。3單擊“Options”按鈕,彈出“Partial Correlations: Options”對(duì)話框。在“Statisti

49、cs”復(fù)選框組中選擇要輸出的統(tǒng)計(jì)量。4單擊“OK”按鈕,得到輸出結(jié)果。(三)距離分析(Distances過程)實(shí)驗(yàn)內(nèi)容:某醫(yī)師對(duì)10份標(biāo)準(zhǔn)血紅蛋白樣品作三次平行檢測(cè),結(jié)果如下,問檢測(cè)結(jié)果是否一致?樣品號(hào)12345678第一次第二次第三次12.3612.4012.1812.1412.2012.2212.3112.2812.3512.3212.2512.2112.1212.2212.1012.2812.3412.2512.2412.3112.2012.4112.3012.46實(shí)驗(yàn)步驟:1建立數(shù)據(jù)文件。定義變量名:第一次測(cè)量值為HB1,第二次測(cè)量值為HB2,第三次測(cè)量值為HB3,輸入相應(yīng)數(shù)據(jù)。2選擇

50、菜單“AnalyzeCorrelateDistance” ,彈出“Distance”對(duì)話框。在對(duì)話框左側(cè)的變量列表中選變量HB1、HB2、HB3,進(jìn)入“Variables” 框。在“Compute Distances”框中選擇“Between variables”,作變量之間的距離相關(guān)分析。在“Measure”欄中選擇“Similarities”相似性測(cè)距。單擊“Measure” 按鈕,系統(tǒng)彈出“Distance: Similarity Measure”對(duì)話框,選擇“Pearson correlation” 為測(cè)量距離。3單擊“OK”按鈕,得到輸出結(jié)果。(四)線性回歸分析(Linear過程)實(shí)

51、驗(yàn)內(nèi)容:某醫(yī)師測(cè)得10名3歲兒童的身高(cm)、體重(kg)和體表面積(cm2)資料如下。試用多元回歸方法確定以身高、體重為自變量,體表面積為應(yīng)變量的回歸方程。兒童編號(hào)體表面積(Y)身高(X1)體重(X2)123456789105.3825.2995.3585.2925.6026.0145.8306.1026.0756.41188.087.688.589.087.789.588.890.490.691.211.011.812.012.313.113.714.414.915.216.0實(shí)驗(yàn)步驟:1建立數(shù)據(jù)文件。定義變量名:體表面積為Y,保留3位小數(shù);身高、體重分別為X1、X2,1位小數(shù)。輸入原始

52、數(shù)據(jù)。2選擇菜單“AnalyzeRegressionLinear” ,彈出“Linear Regression”對(duì)話框。從對(duì)話框左側(cè)的變量列表中選擇變量y,使之進(jìn)入“Dependent”框,選擇變量x1、x2,進(jìn)入“Indepentdent(s)”框;在“Method”處下拉菜單,選用Enter法。3單擊“Statistics”按鈕選擇是否作變量的描述性統(tǒng)計(jì)、回歸方程應(yīng)變量的可信區(qū)間估計(jì)等分析;單擊“Plots”按鈕選擇對(duì)標(biāo)準(zhǔn)化Y預(yù)測(cè)值作變量分布圖;單擊“Save”按鈕選擇對(duì)根據(jù)所確定的回歸方程求得的未校正Y預(yù)測(cè)值和標(biāo)準(zhǔn)化Y預(yù)測(cè)值作保存;單擊“Options”按鈕選擇變量入選與剔除的、值和缺失值的處理方法。4單擊“OK”完成設(shè)置,得到輸出結(jié)果。(五)曲線回歸(Curve Estimation過程)實(shí)驗(yàn)內(nèi)容:某地1963年調(diào)查得兒童年齡(歲)X與錫克試驗(yàn)陰性率(%)Y的資料如下,試擬合對(duì)數(shù)曲線。年齡(歲)X錫克試驗(yàn)陰性率(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論