spss軟件實(shí)驗(yàn)指導(dǎo)書

上傳人：我*** IP屬地：貴州上傳時(shí)間：2021-06-08 格式：DOC 頁(yè)數(shù)：42 大?。?96KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩37頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS統(tǒng)計(jì)分析軟件實(shí)驗(yàn)指導(dǎo) 書經(jīng)濟(jì)與管理學(xué)院工商管理系統(tǒng)計(jì)模擬實(shí)習(xí)課程組2011年2月目錄1. 實(shí)驗(yàn)一 SPSS的數(shù)據(jù)基本操作2. 實(shí)驗(yàn)二描述性統(tǒng)計(jì)分析3. 實(shí)驗(yàn)三均值比較4. 實(shí)驗(yàn)四相關(guān)分析和回歸分析5. 實(shí)驗(yàn)五聚類分析和判別分析6. 實(shí)驗(yàn)六因子分析和主成分分析SPSS統(tǒng)計(jì)分析軟件實(shí)驗(yàn)一、課程實(shí)驗(yàn)課所占學(xué)時(shí)30學(xué)時(shí)二、實(shí)驗(yàn)適用專業(yè)經(jīng)濟(jì)管理類各專業(yè)三、實(shí)驗(yàn)的任務(wù)、性質(zhì)和目的統(tǒng)計(jì)計(jì)算，尤其是多元統(tǒng)計(jì)計(jì)算往往是十分復(fù)雜的，因此需要借助統(tǒng)計(jì)軟件。本課程實(shí)驗(yàn)正是為了使學(xué)生系統(tǒng)地學(xué)習(xí)SPSS這一統(tǒng)計(jì)軟件，培養(yǎng)學(xué)生根據(jù)實(shí)際問題建立SPSS數(shù)據(jù)文件、利用SPSS軟件提供的各種統(tǒng)計(jì)功能進(jìn)行

2、統(tǒng)計(jì)分析，并結(jié)合一定專業(yè)知識(shí)對(duì)分析結(jié)果給出合理解釋的能力，從而為學(xué)生以后從事統(tǒng)計(jì)分析工作打下基礎(chǔ)。四、實(shí)驗(yàn)方式與基本要求1由授課教師講清上機(jī)實(shí)驗(yàn)的基本要求和注意事項(xiàng)；2由授課教師事先布置上機(jī)實(shí)驗(yàn)的內(nèi)容，設(shè)計(jì)要求，操作步驟，并要求學(xué)生課前進(jìn)行準(zhǔn)備；3學(xué)生集中在機(jī)房上機(jī)；4要求學(xué)生每次完成所布置的任務(wù)，提交實(shí)驗(yàn)報(bào)告。五、考核方式與評(píng)分辦法1. 實(shí)驗(yàn)報(bào)告（60%）2. 上機(jī)檢查（20%）3. 考勤（20%）實(shí)驗(yàn)一 SPSS基本操作一、實(shí)驗(yàn)?zāi)康? 熟悉SPSS的菜單和窗口界面，熟悉SPSS各種參數(shù)的設(shè)置；2掌握SPSS的數(shù)據(jù)管理功能。二、實(shí)驗(yàn)內(nèi)容及步驟（一）數(shù)據(jù)的輸入和保存1. SPSS界

3、面當(dāng)打開SPSS后，展現(xiàn)在我們面前的界面如下：請(qǐng)注意窗口頂部顯示為“SPSS for Windows Data Editor”，表明現(xiàn)在所看到的是SPSS的數(shù)據(jù)管理窗口。這是一個(gè)典型的Windows軟件界面，有菜單欄、工具欄。該界面和EXCEL極為相似，很多操作也與EXCEL類似，同學(xué)們可以自己試試。2.定義變量選擇菜單Data=Define Variable。系統(tǒng)彈出定義變量對(duì)話框如下：對(duì)話框最上方為變量名，現(xiàn)在顯示為“VAR00001”，這是系統(tǒng)的默認(rèn)變量名；往下是變量情況描述，可以看到系統(tǒng)默認(rèn)該變量為數(shù)值型，長(zhǎng)度為8，有兩位小數(shù)位，尚無(wú)缺失值，顯示對(duì)齊方式為右對(duì)齊；第三部分為四個(gè)設(shè)置更改

4、按鈕，分別可以設(shè)定變量類型、標(biāo)簽、缺失值和列顯示格式；第四部分實(shí)際上是用來(lái)定義變量屬于數(shù)值變量、有序分類變量還是無(wú)序分類變量，現(xiàn)在系統(tǒng)默認(rèn)新變量為數(shù)值變量；最下方則依次是確定、取消和幫助按鈕。假如有兩組數(shù)據(jù)如下：GROUP 1: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11GROUP 2: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87先來(lái)建立分組變量GROUP。請(qǐng)將變量名改為GROUP，然后單擊OK按鈕。現(xiàn)在SPSS的數(shù)據(jù)管理窗口如下所示：第一列的

5、名稱已經(jīng)改為了“group”，這就是我們所定義的新變量“group”。現(xiàn)在我們來(lái)建立變量X。單擊第一行第二列的單元格，然后選擇菜單Data=Define Variable，同樣，將變量名改為X，然后確認(rèn)。此時(shí)SPSS的數(shù)據(jù)管理窗口如下所示：現(xiàn)在，第一、第二列的名稱均為深色顯示，表明這兩列已經(jīng)被定義為變量，其余各列的名稱仍為灰色的“var”，表示尚未使用。同樣地，各行的標(biāo)號(hào)也為灰色，表明現(xiàn)在還未輸入過數(shù)據(jù)，即該數(shù)據(jù)集內(nèi)沒有記錄。3.輸入數(shù)據(jù)我們先來(lái)輸入變量X的值，請(qǐng)確認(rèn)一行二列單元格為當(dāng)前單元格，棄鼠標(biāo)而用鍵盤，輸入第一個(gè)數(shù)據(jù)0.84，此時(shí)界面顯示如圖A所示：請(qǐng)注意：在回車之前，你輸入的數(shù)據(jù)在數(shù)

6、據(jù)欄內(nèi)顯示，而不是在單元格內(nèi)顯示，現(xiàn)在回車，界面如圖B所示：首先，當(dāng)前單元格下移，變成了二行二列單元格，而一行二列單元格的內(nèi)容則被替換成了0.84；其次，第一行的標(biāo)號(hào)變黑，表明該行已輸入了數(shù)據(jù)；第三，一行一列單元格因?yàn)闆]有輸入過數(shù)據(jù)，顯示為“.”，這代表該數(shù)據(jù)為缺失值。4. 保存數(shù)據(jù)選擇菜單File=Save，由于該數(shù)據(jù)從來(lái)沒有被保存過，所以彈出Save as對(duì)話框如下：?jiǎn)螕舯４骖愋土斜砜?，可以看到SPSS所支持的各種數(shù)據(jù)類型，有DBF、FoxPro、EXCEL、ACCESS等，這里我們?nèi)匀粚⑵浯鏋镾PSS自己的數(shù)據(jù)格式（*.sav文件）。在文件名框內(nèi)鍵入Li1_1并回車，可以看到數(shù)據(jù)管理窗口

7、左上角由Untitled變?yōu)榱爽F(xiàn)在的變量名Li1_1。（二）數(shù)據(jù)的預(yù)分析1. 數(shù)據(jù)的簡(jiǎn)單描述首先我們需要知道數(shù)據(jù)的基本情況，如均數(shù)、標(biāo)準(zhǔn)差等。選擇Analyze=Descriptive Statistics=Descriptives菜單，系統(tǒng)彈出描述對(duì)話框如下：該對(duì)話框可分為左右兩大部分，左側(cè)為所有可用的侯選變量列表，右側(cè)為選入變量列表。我們只需要描述X，用鼠標(biāo)選中X，單擊中間的，變量X的標(biāo)簽就會(huì)移入右側(cè)，注意這時(shí)OK按鈕變黑，表明已經(jīng)可以進(jìn)行分析了，單擊它，系統(tǒng)會(huì)彈出一個(gè)新的界面如下所示：該窗口上方的名稱為SPSS for Windows Viewer，即（結(jié)果）瀏覽窗口，整個(gè)的結(jié)構(gòu)和資源管

8、理器類似，左側(cè)為導(dǎo)航欄，右側(cè)為具體的輸出結(jié)果。結(jié)果表格給出了樣本數(shù)、最小值、最大值、均數(shù)和標(biāo)準(zhǔn)差這幾個(gè)常用的統(tǒng)計(jì)量。從中可以看到，24個(gè)數(shù)據(jù)總的均數(shù)為1.2846，標(biāo)準(zhǔn)差為0.4687。如果數(shù)據(jù)進(jìn)行了分組，還可以看看分組的描述情況。這里要用到文件分割功能，請(qǐng)切換回?cái)?shù)據(jù)管理窗口，選擇Data=Split File菜單，系統(tǒng)彈出文件分割對(duì)話框如下：選擇單選按鈕Organize output by groups，將變量GROUP選入右側(cè)的選入變量框，單擊OK鈕，此時(shí)界面不會(huì)有任何改變，但請(qǐng)?jiān)僮鲆淮螖?shù)據(jù)描述，你就可以看到現(xiàn)在數(shù)據(jù)是分Group=1和Group=2兩種情況在描述了！從描述可知兩組的均數(shù)和

9、標(biāo)準(zhǔn)差分別為1.5209、1.0846和0.4218、0.4221。2. 繪制直方圖統(tǒng)計(jì)指標(biāo)只能給出數(shù)據(jù)的大致情況，沒有直方圖那樣直觀，我們就來(lái)畫個(gè)直方圖瞧瞧！選擇Graphs=Histogram，系統(tǒng)會(huì)彈出繪制直方圖對(duì)話框如下：將變量X選入Variable選擇框內(nèi)，單擊OK按鈕。此時(shí)結(jié)果瀏覽窗口內(nèi)將繪制出直方圖。最后，我們還要取消變量分割，免得它影響以后的統(tǒng)計(jì)分析，再次調(diào)出變量分割對(duì)話框，選擇單選按鈕中的“Analyze all cases, do not creat group”，單擊OK按鈕就可以了。（三）保存和導(dǎo)出分析結(jié)果1.保存結(jié)果文件在結(jié)果瀏覽窗口中（注意：一定要在結(jié)果瀏覽窗口中）

10、選擇菜單File=Save，由于該結(jié)果也從來(lái)沒有被保存過，所以彈出和前面保存數(shù)據(jù)時(shí)極為相似的一個(gè)Save as對(duì)話框，和前面相比，他唯一的區(qū)別就是文件的保存類型只有View Files(*.spo)一種。在文件名框中鍵入“Li1_1”并回車，該結(jié)果文件就會(huì)按文件名Li1_1.spo被存儲(chǔ)。2. 導(dǎo)出分析結(jié)果文件倒是保存了，但問題還沒有完全解決：我們從來(lái)寫文章什么的都用的是文字處理軟件，尤其是WORD，可WORD不能直接讀取SPO格式的文件，怎么辦呢？沒關(guān)系，SPSS提供了將結(jié)果導(dǎo)出為純文本格式或網(wǎng)頁(yè)格式的功能，在結(jié)果瀏覽窗口中選擇菜單File=Export，系統(tǒng)會(huì)彈出Exprot Output

11、對(duì)話框如下：最上方的Export下拉式列表可以選擇輸出的內(nèi)容，可以為含圖表的輸出文檔、無(wú)圖表的輸出文檔和只有統(tǒng)計(jì)圖表三種；中部的Export File對(duì)話框則填入輸出的目標(biāo)文件名；左下方的Export What單選框可以選擇輸出結(jié)果的哪些部分，可以是所有結(jié)果、所有可見結(jié)果或只輸出選擇的結(jié)果，一般選輸出所有可見結(jié)果；右下方的輸出文件類型下拉式列表已被我打開，可見里面有網(wǎng)頁(yè)格式和純文本格式兩種，在一切按所需選擇完畢后按OK鈕，則結(jié)果文件就會(huì)輸出為你想要的類型。實(shí)驗(yàn)二描述性統(tǒng)計(jì)分析一、實(shí)驗(yàn)?zāi)康?、掌握數(shù)據(jù)集中趨勢(shì)和離中趨勢(shì)的分析方法；2、熟練掌握各個(gè)分析過程的基本步驟以及彼此之間的聯(lián)系和區(qū)別。二、

12、實(shí)驗(yàn)內(nèi)容及步驟（一）Frequencies過程頻數(shù)分布表是描述性統(tǒng)計(jì)中最常用的方法之一，F(xiàn)requencies過程就是專門為產(chǎn)生頻數(shù)表而設(shè)計(jì)的。它不僅可以產(chǎn)生詳細(xì)的頻數(shù)表，還可以按要求給出某百分位點(diǎn)的數(shù)值，以及常用的條圖，圓圖等統(tǒng)計(jì)圖。和國(guó)內(nèi)常用的頻數(shù)表不同，幾乎所有統(tǒng)計(jì)軟件給出的均是詳細(xì)頻數(shù)表，即并不按某種要求確定組段數(shù)和組距，而是按照數(shù)值精確列表。如果想用Frequencies過程得到我們所熟悉的頻數(shù)表，請(qǐng)先用第二章學(xué)過的Recode過程產(chǎn)生一個(gè)新變量來(lái)代表所需的各組段。1.界面說(shuō)明Frequencies對(duì)話框的界面如下所示：該界面在SPSS中實(shí)在太普通了，無(wú)須多言，重點(diǎn)介紹一下各部分的功

13、能如下：【Display frequency tables復(fù)選框】確定是否在結(jié)果中輸出頻數(shù)表?！維tatistics鈕】單擊后彈出Statistics對(duì)話框如下，用于定義需要計(jì)算的其他描述統(tǒng)計(jì)量?，F(xiàn)將各部分解釋如下：Percentile Values復(fù)選框組定義需要輸出的百分位數(shù)，可計(jì)算四分位數(shù)(Quartiles)、每隔指定百分位輸出當(dāng)前百分位數(shù)(Cut points for equal groups)、或直接指定某個(gè)百分位數(shù)(Percentiles)，如直接指定輸出P2.5和P97.5。 Central tendency復(fù)選框組用于定義描述集中趨勢(shì)的一組指標(biāo)：均數(shù)(Mean)、中位數(shù)(

14、Median)、眾數(shù)(Mode)、總和(Sum)。 Dispersion復(fù)選框組用于定義描述離散趨勢(shì)的一組指標(biāo)：標(biāo)準(zhǔn)差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、標(biāo)準(zhǔn)誤(S.E.mean)。 Distribution復(fù)選框組用于定義描述分布特征的兩個(gè)指標(biāo)：偏度系數(shù)（Skewness）和峰度系數(shù)(Kurtosis)。 Values are group midpoints復(fù)選框當(dāng)你輸出的數(shù)據(jù)是分組頻數(shù)數(shù)據(jù)，并且具體數(shù)值是組中值時(shí)，選中該復(fù)選框以通知SPSS，免得它犯錯(cuò)誤。眾數(shù)(Mode)指所有數(shù)值中出現(xiàn)頻

15、率最高的一個(gè)值，在國(guó)內(nèi)用的非常少?！綜harts鈕】彈出Charts對(duì)話框，用于設(shè)定所做的統(tǒng)計(jì)圖。Chart type單選鈕組定義統(tǒng)計(jì)圖類型，有四種選擇：無(wú)、條圖（Bar chart）、圓圖(Pie chart)、直方圖Histogram），其中直方圖還可以選擇是否加上正態(tài)曲線（With normal curve）。 Chart Values單選鈕組定義是按照頻數(shù)還是按百分比做圖（即影響縱坐標(biāo)刻度）。【Format鈕】彈出Format對(duì)話框，用于定義輸出頻數(shù)表的格式，不過用處不大，一般不管。Order by單選鈕組定義頻數(shù)表的排列次序，有四個(gè)選項(xiàng)：Ascending values為根據(jù)數(shù)

16、值大小按升序從小到大作頻數(shù)分布；Descending values為根據(jù)數(shù)值大小按降序從大到小作頻數(shù)分布；Ascending counts為根據(jù)頻數(shù)多少按升序從少到多作頻數(shù)分布；Descending counts為根據(jù)頻數(shù)多少按降序從多到少作頻數(shù)分布。 Multiple Variables單選鈕組如果選擇了兩個(gè)以上變量做頻數(shù)表，則Compare variables可以將他們的結(jié)果在同一個(gè)頻數(shù)表過程輸出結(jié)果中顯示，便于互相比較，Organize output by variables則將結(jié)果在不同的頻數(shù)表過程輸出結(jié)果中顯示。 Suppress Tables more than.復(fù)選框當(dāng)頻數(shù)表

17、的分組數(shù)大于下面設(shè)定數(shù)值時(shí)禁止它在結(jié)果中輸出，這樣可以避免產(chǎn)生巨型表格。2. 分析實(shí)例例1 某地101例健康男子血清總膽固醇值測(cè)定結(jié)果如下，請(qǐng)繪制頻數(shù)表、直方圖，計(jì)算均數(shù)、標(biāo)準(zhǔn)差、變異系數(shù)CV、中位數(shù)M、p2.5和p97.5。4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.

18、44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.

19、14 3.24 4.90 3.05解：為節(jié)省篇幅，這里只給出精確頻數(shù)表的做法，假設(shè)數(shù)據(jù)已經(jīng)輸好，變量名為X，具體解法如下：1. Analyze=Descriptive Statistics=Frequencies 2. Variables框：選入X 3. 單擊Statistics鈕： 4. 選中Mean、Std.deviation、Median復(fù)選框 5. 單擊Percentiles：輸入2.5：?jiǎn)螕鬉dd：輸入97.5：?jiǎn)螕鬉dd： 6. 單擊Continue鈕 7. 單擊Charts鈕： 8. 選中Bar charts 9. 單擊Continue鈕 10. 單擊OK得出結(jié)果后手工計(jì)算出CV

20、。上面做出的直方圖分組太多，需要進(jìn)一步編輯。3.結(jié)果解釋上題除直方圖外的的輸出結(jié)果如下：Frequencies最上方為表格名稱，左上方為分析變量名，可見樣本量N為101例，缺失值0例，均數(shù)Mean=4.69，中位數(shù)Median=4.61，標(biāo)準(zhǔn)差STD=0.8616，P2.5=3.04，P97.5=6.45。系統(tǒng)對(duì)變量x作頻數(shù)分布表（此處只列出了開頭部分），Vaild右側(cè)為原始值，F(xiàn)requency為頻數(shù)，Percent為各組頻數(shù)占總例數(shù)的百分比（包括缺失記錄在內(nèi)），Valid percent為各組頻數(shù)占總例數(shù)的有效百分比，Cum Percent為各組頻數(shù)占總例數(shù)的累積百分比。（二）Descri

21、ptives過程Descriptives過程是連續(xù)資料統(tǒng)計(jì)描述應(yīng)用最多的一個(gè)過程，他可對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析，計(jì)算并列出一系列相應(yīng)的統(tǒng)計(jì)指標(biāo)。這和其他過程相比并無(wú)不同。但該過程還有個(gè)特殊功能就是可將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)評(píng)分值并以變量的形式存入數(shù)據(jù)庫(kù)供以后分析。1.界面說(shuō)明【Save standardized values as variables復(fù)選框】確定是否將原始數(shù)據(jù)的標(biāo)準(zhǔn)正態(tài)評(píng)分存為新變量?！綩ptions鈕】彈出Options對(duì)話框，大部分內(nèi)容均在前面Frequences過程的Statistics對(duì)話框中見過，只有最下方的Display Order單選鈕組是新的，可以選擇為變量列表

22、順序、字母順序、均數(shù)升序或均數(shù)降序。2.結(jié)果解釋下面是一個(gè)典型的Descriptives過程結(jié)果統(tǒng)計(jì)表：一望可知，這里的大部分內(nèi)容都在上一節(jié)見過，因此就不再多解釋了。講了兩個(gè)過程，也許大家已經(jīng)發(fā)現(xiàn)了：結(jié)果中的統(tǒng)計(jì)專業(yè)單詞多數(shù)在對(duì)話框中就已經(jīng)出現(xiàn)，因此我們以后會(huì)詳細(xì)解釋對(duì)話框的內(nèi)容，結(jié)果中相同的單詞不再重復(fù)解釋。（三）Explore過程Explore過程可對(duì)變量進(jìn)行更為深入詳盡的描述性統(tǒng)計(jì)分析，主要用于對(duì)資料的性質(zhì)、分布特點(diǎn)等完全不清楚時(shí)，故又稱之為探索性分析。它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上，增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述，如枝葉圖、箱圖等，顯得更加詳細(xì)、全面，有助于用戶制定繼續(xù)分析的方案

23、。1.界面說(shuō)明【Display單選鈕組】用于選擇輸出結(jié)果中是否包含統(tǒng)計(jì)描述、統(tǒng)計(jì)圖或兩者均包括。【Dependent List框】用于選入需要分析的變量?！綟actor List框】如果想讓所分析的變量按某種因素取值分組分析，則在這里選入分組變量。【Label cases by框】選擇一個(gè)變量，他的取值將作為每條記錄的標(biāo)簽。最典型的情況是使用記錄ID號(hào)的變量?！維tatistics鈕】彈出Statistics對(duì)話框，用于選擇所需要的描述統(tǒng)計(jì)量。有如下選項(xiàng)：Descriptives復(fù)選框：輸出均數(shù)、中位數(shù)、眾數(shù)、5%修正均數(shù)、標(biāo)準(zhǔn)誤、方差、標(biāo)準(zhǔn)差、最小值、最大值、全距、四分位全距、峰度系數(shù)、峰度

24、系數(shù)的標(biāo)準(zhǔn)誤、偏度系數(shù)、偏度系數(shù)的標(biāo)準(zhǔn)誤及指定的均數(shù)可信區(qū)間。 M-estimators復(fù)選框：作中心趨勢(shì)的粗略最大似然確定，輸出四個(gè)不同權(quán)重的最大似然確定數(shù)。 Outliers復(fù)選框：輸出五個(gè)最大值與五個(gè)最小值。 Percentiles復(fù)選框：輸出第5%、10%、25%、50%、75%、90%、95%位數(shù)?！綪lot鈕】彈出Plot對(duì)話框，用于選擇所需要的統(tǒng)計(jì)圖。有如下選項(xiàng)：Boxplots單選框組：確定箱式圖的繪制方式，可以是按組別分組繪制(Factor levels together)，也可以不分組一起繪制(Depentends together)，或者不繪制(None)。 Descri

25、ptive復(fù)選框組：可以選擇繪制莖葉圖(Stem-and-leaf)和直方圖(Histogram)。 Normality plots with test復(fù)選框：繪制正態(tài)分布圖并進(jìn)行變量是否符合正態(tài)分布的檢驗(yàn)。 Spread vs. Level with Levene Test單選框組：當(dāng)選擇了分組變量時(shí)，繪制spread-versus-level圖（我還沒有找到他的中文名字該叫什么），設(shè)置繪圖時(shí)變量的轉(zhuǎn)換方式，并進(jìn)行組間方差齊性檢驗(yàn)?！綩ptions鈕】用于選擇對(duì)缺失值的處理方式，可以是不分析有任一缺失值的記錄、不分析計(jì)算某統(tǒng)計(jì)量時(shí)有缺失值的記錄，或報(bào)告缺失值。2.結(jié)果解釋以例6.1的數(shù)據(jù)為例

26、，按默認(rèn)方式下的選擇，Explore過程的輸出如下：Explore首先是例行的處理記錄缺失值情況報(bào)告，可見101例均為有效值。上表詳細(xì)列出了常用的描述統(tǒng)計(jì)量，如果有標(biāo)準(zhǔn)誤也會(huì)列出（如偏度和峰度系數(shù)）。XX Stem-and-Leaf PlotFrequency Stem & Leaf 1.00 2 . 7 8.00 3 . 9.00 3 . 24.00 4 . 44 25.00 4 . 899 17.00 5 . 9.00 5 . 6.00 6 . 1.00 6 . 5 1.00 Extremes (=7.2)Stem width: 1.0000Each leaf: 1 case(s)以上是莖

27、葉圖，整數(shù)位為莖，小數(shù)位為葉。這樣可以非常直觀的看出數(shù)據(jù)的分布范圍及形態(tài)，在國(guó)外非常流行。以上是箱式圖，中間的黑粗線為均數(shù)，紅框?yàn)樗姆治婚g距的范圍，上下兩個(gè)細(xì)線為最大、最小值。（四）Crosstabs過程Crosstabs過程用于對(duì)計(jì)數(shù)資料和有序分類資料進(jìn)行統(tǒng)計(jì)描述和簡(jiǎn)單的統(tǒng)計(jì)推斷。在分析時(shí)可以產(chǎn)生二維至n維列聯(lián)表，并計(jì)算相應(yīng)的百分?jǐn)?shù)指標(biāo)。統(tǒng)計(jì)推斷則包括了我們常用的X2檢驗(yàn)、Kappa值，分層X2（X2M-H）。如果安裝了相應(yīng)模塊，還可計(jì)算n維列聯(lián)表的確切概率（Fishers Exact Test）值。Crosstabs過程不能產(chǎn)生一維頻數(shù)表（單變量頻數(shù)表），該功能由Frequencies過程

28、實(shí)現(xiàn)。1.界面說(shuō)明【Rows框】用于選擇行*列表中的行變量?！綜olumns框】用于選擇行*列表中的列變量?！綥ayer框】Layer指的是層，對(duì)話框中的許多設(shè)置都可以分層設(shè)定，在同一層中的變量使用相同的設(shè)置，而不同層中的變量分別使用各自層的設(shè)置。如果要讓不同的變量做不同的分析，則將其選入Layer框，并用Previous和Next鈕設(shè)為不同層。Layer在這里用的比較少，在多元回歸中我們將進(jìn)行詳細(xì)的解釋。【Display clustered bar charts復(fù)選框】顯示重疊條圖?！維uppress table復(fù)選框】禁止在結(jié)果中輸出行*列表?！綞xact鈕】針對(duì)2*2以上的行*列表設(shè)定計(jì)

29、算確切概率的方法，可以是不計(jì)算（Asymptotic only）、蒙特卡羅模擬（Monte Carlo）或確切計(jì)算（Exact）。蒙特卡羅模擬默認(rèn)進(jìn)行10000次模擬，給出99%可信區(qū)間；確切計(jì)算默認(rèn)計(jì)算時(shí)間限制在5分鐘內(nèi)。這些默認(rèn)值均可更改。如果你在安裝SPSS時(shí)沒有安裝EXACT模塊，則此處對(duì)話框中不會(huì)出現(xiàn)Exact鈕?！維tatistics鈕】彈出Statistics對(duì)話框，用于定義所需計(jì)算的統(tǒng)計(jì)量。Chi-square復(fù)選框：計(jì)算X2值。 Correlations復(fù)選框：計(jì)算行、列兩變量的Pearson相關(guān)系數(shù)和Spearman等級(jí)相關(guān)系數(shù)。 Norminal復(fù)選框組：選擇是否輸出反映

30、分類資料相關(guān)性的指標(biāo)，很少使用。a. Contingency coefficient復(fù)選框：即列聯(lián)系數(shù)，其值界于01之間；b. Phi and Cramers V復(fù)選框：這兩者也是基于X2值的，Phi在四格表X2檢驗(yàn)中界于-11之間，在R*C表X2檢驗(yàn)中界于01之間；Cramers V 則界于01之間；c. Lambda復(fù)選框：在自變量預(yù)測(cè)中用于反映比例縮減誤差，其值為1時(shí)表明自變量預(yù)測(cè)應(yīng)變量好，為0時(shí)表明自變量預(yù)測(cè)應(yīng)變量差；d. Uncertainty coefficient復(fù)選框：不確定系數(shù)，以熵為標(biāo)準(zhǔn)的比例縮減誤差，其值接近1時(shí)表明后一變量的信息很大程度來(lái)自前一變量，其值接近0時(shí)表明后一

31、變量的信息與前一變量無(wú)關(guān)。Ordinal復(fù)選框組：選擇是否輸出反映有序分類資料相關(guān)性的指標(biāo)，很少使用。a. Gamma復(fù)選框：界于01之間，所有觀察實(shí)際數(shù)集中于左上角和右下角時(shí)，其值為1；b. Somersd復(fù)選框：為獨(dú)立變量上不存在同分的偶對(duì)中，同序?qū)ψ訑?shù)超過異序?qū)ψ訑?shù)的比例；c. Kendalls tau-b復(fù)選框：界于-11之間；d. Kendalls tau-c復(fù)選框：界于-11之間；Eta復(fù)選框：計(jì)算Eta值，其平方值可認(rèn)為是應(yīng)變量受不同因素影響所致方差的比例； Kappa復(fù)選框：計(jì)算Kappa值，即內(nèi)部一致性系數(shù)； Risk復(fù)選框：計(jì)算比數(shù)比OR值； McNemanr復(fù)選框：進(jìn)行M

32、cNemanr檢驗(yàn)（一種非參檢驗(yàn)）； Cochrans and Mantel-Haenszel statistics復(fù)選框：計(jì)算X2M-H統(tǒng)計(jì)量（分層X2，也有寫為X2CMH的），可在下方輸出H0假設(shè)的OR值，默認(rèn)為1?！綜ells鈕】彈出Cells對(duì)話框，用于定義列聯(lián)表單元格中需要計(jì)算的指標(biāo)：Counts復(fù)選框組：是否輸出實(shí)際觀察數(shù)(Observed)和理論數(shù)（Expected）； Percentages復(fù)選框組：是否輸出行百分?jǐn)?shù)（Row）、列百分?jǐn)?shù)（Column）以及合計(jì)百分?jǐn)?shù)（Total）； Residuals復(fù)選框組：選擇殘差的顯示方式，可以是實(shí)際數(shù)與理論數(shù)的差值（Unstandard

33、ized）、標(biāo)化后的差值（Standardized，實(shí)際數(shù)與理論數(shù)的差值除理論數(shù)），或者由標(biāo)準(zhǔn)誤確立的單元格殘差（Adj. Standardized）；【Format鈕】用于選擇行變量是升序還是降序排列。2.分析實(shí)例例2 某醫(yī)生用國(guó)產(chǎn)呋喃硝胺治療十二指腸潰瘍，以甲氰咪胍作對(duì)照組，問兩種方法治療效果有無(wú)差別？處理愈合未愈合合計(jì)呋喃硝胺54862甲氰咪胍442064合計(jì)9828126解：由于此處給出的直接是頻數(shù)表，因此在建立數(shù)據(jù)集時(shí)可以直接輸入三個(gè)變量行變量、列變量和指示每個(gè)格子中頻數(shù)的變量，然后用Weight Cases對(duì)話框指定頻數(shù)變量，最后調(diào)用Crosstabs過程進(jìn)行X2檢驗(yàn)。假設(shè)三

34、個(gè)變量分別名為R、C和W，則數(shù)據(jù)集結(jié)構(gòu)和命令如下：RCW1.001.0054.001.002.0044.002.001.008.002.002.0020.001. Data=Weight Cases 2. Weight Cases by單選框：選中 3. Freqency Variable：選入W 4. 單擊OK鈕 5. Analyze=Descriptive Statistics=Crosstabs 6. Rows框：選入R 7. Columns框：C 8. Statistics鈕：Chi-square復(fù)選框：選中：?jiǎn)螕鬋ontinue鈕 9. 單擊OK鈕、3.結(jié)果解釋上題的結(jié)果如下：Cro

35、sstabs首先是處理記錄缺失值情況報(bào)告，可見126例均為有效值。上面為列出的四格表，實(shí)際使用時(shí)可以在其中加入變量值標(biāo)簽，使看起來(lái)更清楚。上表給出了一堆檢驗(yàn)結(jié)果，從左到右為：檢驗(yàn)統(tǒng)計(jì)量值(Value)、自由度(df)、雙側(cè)近似概率(Asymp.Sig.2-sided)、雙側(cè)精確概率(Exact Sig.2-sided)、單側(cè)精確概率(Exact Sig.1-sided)；從上到下為：Pearson卡方（Pearson Chi-Square即常用的卡方檢驗(yàn)）、連續(xù)性校正的卡方值(Continuity Correction)、對(duì)數(shù)似然比方法計(jì)算的卡方(Likelihood Ratio)、Fishe

36、rs確切概率法(Fishers Exact Test)、線性相關(guān)的卡方值(Linear by Linear Association)、有效記錄數(shù)(N of Valid Cases)。另外，Continuity Correction和Pearson卡方值處分別標(biāo)注有a和b，表格下方為相應(yīng)的注解：a.只為2*2表計(jì)算。b.0%個(gè)格子的期望頻數(shù)小于5，最小的期望頻數(shù)為13.78。因此，這里無(wú)須校正，直接采用第一行的檢驗(yàn)結(jié)果，即X2=6.133，P=0.013。實(shí)驗(yàn)三均值比較一、實(shí)驗(yàn)?zāi)康膶W(xué)習(xí)利用SPSS進(jìn)行單樣本、兩獨(dú)立樣本以及成對(duì)樣本的均值檢驗(yàn)。二、實(shí)驗(yàn)內(nèi)容及步驟（一）描述統(tǒng)計(jì)(Means過程

37、)實(shí)驗(yàn)內(nèi)容：某醫(yī)師測(cè)得血紅蛋白值（g%）如表3.1，試?yán)肕eans過程作基本的描述性統(tǒng)計(jì)分析。表3.1對(duì)象編號(hào)性別年齡血紅蛋白值對(duì)象編號(hào)性別年齡血紅蛋白值1234567891011121314151617181920女男女女男男女男女女男男男女女女男男女男181618171618161818171818161717171716161812.8315.5012.2510.0610.889.658.3611.668.547.7813.6610.5712.569.878.9911.3514.5612.408.0514.0321222324252627282930313233343536373839

38、40女男男女女女女男男男男女女女男男男男女男161618181718171616181616181818181717161611.3612.7815.098.678.5612.5611.5614.677.8812.3513.659.8710.0912.5516.0413.7811.6710.988.7811.35實(shí)驗(yàn)步驟：1建立數(shù)據(jù)文件。定義4個(gè)變量：ID、Gender、Age和HB，分別表示編號(hào)、性別、年齡和血紅蛋白值。2. 選擇菜單“AnalyzeCompare MeansMeans”,彈出“Means”對(duì)話框。在對(duì)話框左側(cè)的變量列表中，選擇變量“血紅蛋白值”進(jìn)入“Dependent Li

39、st”列表框，選擇變量“性別”進(jìn)入“Independent List”，單擊“Next”按鈕，選擇變量“年齡”進(jìn)入“Independent List”。3單擊“Options”按鈕，在彈出的“選擇描述統(tǒng)計(jì)量”對(duì)話框中設(shè)置輸出的描述統(tǒng)計(jì)量。4單擊“OK”按鈕，得到輸出結(jié)果。（二）單樣本T檢驗(yàn)（One-Sample T Test過程）實(shí)驗(yàn)內(nèi)容：某地區(qū)10年測(cè)得16-18歲人口的平均血紅蛋白值為10.25?，F(xiàn)在抽查測(cè)量了該地區(qū)40個(gè)16-18歲人口的血紅蛋白如表1，試分析該地區(qū)現(xiàn)在16-18歲人口的血紅蛋白與10年前相比，是否有顯著的差異？實(shí)驗(yàn)步驟：1打開數(shù)據(jù)文件。2. 選擇菜單“AnalyzeCo

40、mpare MeansOne-Sample T Test”。彈出“One-Sample T Test”對(duì)話框。 3在對(duì)話框左側(cè)的變量列表中選擇變量“血紅蛋白”進(jìn)入“Test Variable(s)” 框；在“Test Value” 編輯框中輸入過去的平均血紅蛋白值10.25. 4單擊“OK”按鈕，得到輸出結(jié)果。（三）雙樣本T檢驗(yàn)（Independent-Samples T Test過程）實(shí)驗(yàn)內(nèi)容：分別測(cè)得14例老年性慢性支氣管炎病人及11例健康人的尿中17酮類固醇排出量（mg/dl）如下，試比較兩組均數(shù)有無(wú)差別。病人2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.2

41、4 4.36 2.72 2.37 2.09 7.10 5.92健康人5.18 8.79 3.14 6.46 3.72 6.64 5.60 4.57 7.71 4.99 4.01實(shí)驗(yàn)步驟： 1建立數(shù)據(jù)文件。定義變量名：把實(shí)際觀察值定義為x，再定義一個(gè)變量group來(lái)區(qū)分病人與健康人。輸入原始數(shù)據(jù)，在變量group中，病人輸入1，健康人輸入2。 2. 選擇菜單“AnalyzeCompare MeansIndependent-samples T Test”項(xiàng)，彈出“Independent- samples T Test”對(duì)話框。從對(duì)話框左側(cè)的變量列表中選x，進(jìn)入“Test Variable(s)”

42、框，選擇變量“group”，進(jìn)入“Grouping Variable”框，點(diǎn)擊“Define Groups”鈕彈出“Define Groups”定義框，在Group 1中輸入1，在Group 2中輸入2。3單擊“OK”按鈕，得到輸出結(jié)果。（四）成對(duì)樣本T檢驗(yàn)（Paired-Samples T Test過程）實(shí)驗(yàn)內(nèi)容：某單位研究飼料中缺乏維生素E與肝中維生素A含量的關(guān)系，將大白鼠按性別、體重等配為8對(duì)，每對(duì)中兩只大白鼠分別喂給正常飼料和維生素E缺乏飼料，一段時(shí)期后將之宰殺，測(cè)定其肝中維生素A含量（mmol/L）如下，問飼料中缺乏維生素E對(duì)鼠肝中維生素A含量有無(wú)影響？大白鼠對(duì)別肝中維生素A含量（m

43、mol/L）正常飼料組維生素E缺乏飼料組1234567837.220.931.441.439.839.336.131.925.725.118.833.534.028.326.218.3實(shí)驗(yàn)步驟：1建立數(shù)據(jù)文件。定義變量名：正常飼料組測(cè)定值為x1，維生素E缺乏飼料組測(cè)定值為x2，輸入原始數(shù)據(jù)。2選擇菜單“AnalyzeCompare MeansPaired-samples T Test”項(xiàng)，彈出“Paired - samples T Test”對(duì)話框。從對(duì)話框左側(cè)的變量列表中選擇變量x1、x2進(jìn)入Variables框。 3單擊“OK”按鈕，得到輸出結(jié)果。實(shí)驗(yàn)四相關(guān)分析一、實(shí)驗(yàn)?zāi)康膶W(xué)習(xí)利用SP

44、SS進(jìn)行相關(guān)分析、偏相關(guān)分析、距離分析、線性回歸分析和曲線回歸。二、實(shí)驗(yàn)內(nèi)容及實(shí)驗(yàn)步驟（一）兩變量的相關(guān)分析（Bivariate過程）實(shí)驗(yàn)內(nèi)容：某地區(qū)10名健康兒童頭發(fā)和全血中的硒含量（1000ppm）如下，試作發(fā)硒與血硒的相關(guān)分析。編號(hào)發(fā)硒血硒123456789107466886991736696587313101311169714510實(shí)驗(yàn)步驟：1建立數(shù)據(jù)文件。定義變量名：發(fā)硒為x，血硒為y，按順序輸入相應(yīng)數(shù)值。2選擇菜單“AnalyzeCorrelateBivariate” ，彈出“Bivariate Correlation”對(duì)話框。在對(duì)話框左側(cè)的變量列表中選x、y，使之進(jìn)入“Varia

45、bles”框；再在“Correlation Coefficients” 框中選擇Pearson相關(guān)系數(shù)（r）；在“Test of Significance”框中選相關(guān)系數(shù)的 “Two-tailed”（雙側(cè)）檢驗(yàn)。選中復(fù)選框“Flag significant correlations”設(shè)置是否突出顯示顯著相關(guān)。3單擊“Options”按鈕，彈出“Bivariate Correlation: Options”對(duì)話框，選擇“Means and standard deviations”和“Cross-product deviations and covariances”項(xiàng)，輸出X、Y的均數(shù)與標(biāo)準(zhǔn)差以及

46、XY交叉乘積的標(biāo)準(zhǔn)差與協(xié)方差。4單擊“OK”按鈕，得到輸出結(jié)果。（二）偏相關(guān)分析(Partial 過程)實(shí)驗(yàn)內(nèi)容：某地29名13歲男童身高（cm）、體重（kg）和肺活量（ml）的數(shù)據(jù)如下表, 試對(duì)該資料作控制體重影響作用的身高與肺活量相關(guān)分析。編號(hào)身高（cm）體重(kg)肺活量(ml)編號(hào)身高（cm）體重(kg)肺活量(ml)123456789101112131415135.1139.9163.6146.5156.2156.4167.8149.7145.0148.5165.5135.0153.3152.0160.532.030.446.233.537.135.541.531.033.037.2

47、49.527.641.032.047.21750200027502500275020002750150025002250300012502750175022501617181920212223242526272829153.0147.6157.5155.1160.5143.0149.4160.8159.0158.2150.0144.5154.6156.547.240.543.344.737.531.533.940.438.537.536.034.739.532.017502000225027502000175022502750250020001750225025001750實(shí)驗(yàn)步驟：1建立數(shù)據(jù)

48、文件。定義變量名：身高為height，體重為weight，肺活量為vc，按順序輸入相應(yīng)數(shù)據(jù)。2選擇菜單“AnalyzeCorrelatePartial” ，彈出“Partial Correlations”對(duì)話框。在對(duì)話框左側(cè)的變量列表中選變量height、vc 進(jìn)入Variables框，選擇要控制的變量weight進(jìn)入“Controlling for”框中，以在控制體重的影響下對(duì)變量身高與肺活量進(jìn)行偏相關(guān)分析；在“Test of Significance”框中選雙側(cè)檢驗(yàn)。3單擊“Options”按鈕，彈出“Partial Correlations: Options”對(duì)話框。在“Statisti

49、cs”復(fù)選框組中選擇要輸出的統(tǒng)計(jì)量。4單擊“OK”按鈕，得到輸出結(jié)果。(三)距離分析(Distances過程)實(shí)驗(yàn)內(nèi)容：某醫(yī)師對(duì)10份標(biāo)準(zhǔn)血紅蛋白樣品作三次平行檢測(cè)，結(jié)果如下，問檢測(cè)結(jié)果是否一致？樣品號(hào)12345678第一次第二次第三次12.3612.4012.1812.1412.2012.2212.3112.2812.3512.3212.2512.2112.1212.2212.1012.2812.3412.2512.2412.3112.2012.4112.3012.46實(shí)驗(yàn)步驟：1建立數(shù)據(jù)文件。定義變量名：第一次測(cè)量值為HB1，第二次測(cè)量值為HB2，第三次測(cè)量值為HB3，輸入相應(yīng)數(shù)據(jù)。2選擇

50、菜單“AnalyzeCorrelateDistance” ，彈出“Distance”對(duì)話框。在對(duì)話框左側(cè)的變量列表中選變量HB1、HB2、HB3，進(jìn)入“Variables” 框。在“Compute Distances”框中選擇“Between variables”，作變量之間的距離相關(guān)分析。在“Measure”欄中選擇“Similarities”相似性測(cè)距。單擊“Measure” 按鈕，系統(tǒng)彈出“Distance: Similarity Measure”對(duì)話框，選擇“Pearson correlation” 為測(cè)量距離。3單擊“OK”按鈕，得到輸出結(jié)果。(四)線性回歸分析(Linear過程)實(shí)

51、驗(yàn)內(nèi)容：某醫(yī)師測(cè)得10名3歲兒童的身高（cm）、體重（kg）和體表面積（cm2）資料如下。試用多元回歸方法確定以身高、體重為自變量，體表面積為應(yīng)變量的回歸方程。兒童編號(hào)體表面積（Y）身高（X1）體重（X2）123456789105.3825.2995.3585.2925.6026.0145.8306.1026.0756.41188.087.688.589.087.789.588.890.490.691.211.011.812.012.313.113.714.414.915.216.0實(shí)驗(yàn)步驟：1建立數(shù)據(jù)文件。定義變量名：體表面積為Y，保留3位小數(shù)；身高、體重分別為X1、X2，1位小數(shù)。輸入原始

52、數(shù)據(jù)。2選擇菜單“AnalyzeRegressionLinear” ，彈出“Linear Regression”對(duì)話框。從對(duì)話框左側(cè)的變量列表中選擇變量y，使之進(jìn)入“Dependent”框，選擇變量x1、x2，進(jìn)入“Indepentdent(s)”框；在“Method”處下拉菜單，選用Enter法。3單擊“Statistics”按鈕選擇是否作變量的描述性統(tǒng)計(jì)、回歸方程應(yīng)變量的可信區(qū)間估計(jì)等分析；單擊“Plots”按鈕選擇對(duì)標(biāo)準(zhǔn)化Y預(yù)測(cè)值作變量分布圖；單擊“Save”按鈕選擇對(duì)根據(jù)所確定的回歸方程求得的未校正Y預(yù)測(cè)值和標(biāo)準(zhǔn)化Y預(yù)測(cè)值作保存；單擊“Options”按鈕選擇變量入選與剔除的、值和缺失值的處理方法。4單擊“OK”完成設(shè)置，得到輸出結(jié)果。(五)曲線回歸(Curve Estimation過程)實(shí)驗(yàn)內(nèi)容：某地1963年調(diào)查得兒童年齡（歲）X與錫克試驗(yàn)陰性率（%）Y的資料如下，試擬合對(duì)數(shù)曲線。年齡（歲）X錫克試驗(yàn)陰性率（

人人文庫(kù)> 全部分類> 應(yīng)用文書 > 事務(wù)文書

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

spss軟件實(shí)驗(yàn)指導(dǎo)書

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

spss軟件實(shí)驗(yàn)指導(dǎo)書

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔