下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、.1-1、 SPSS運(yùn)行方式:菜單操作方式、程序運(yùn)行方式、Include 運(yùn)行方式、 Production Facility方式。1-2、 Spss 界面窗口:數(shù)據(jù)編輯窗口、結(jié)果管理窗口、結(jié)果編輯窗口、語法編輯窗口、腳本窗口。1-3、在數(shù)據(jù)預(yù)處理中應(yīng)用最廣泛的是計(jì)算變量。1-4、 Spss基本模塊不能直接實(shí)現(xiàn)的功能:統(tǒng)計(jì)分析、數(shù)據(jù)計(jì)劃、數(shù)據(jù)收集。1-6、 spss 不能直接打開 *.html 文件。2-1、 spss 數(shù)據(jù)文件格式:每一行的數(shù)據(jù)成為一個(gè)記錄;每一列為一個(gè)變量。2-2、 Spss數(shù)據(jù)編輯器界面為數(shù)據(jù)視圖界面和變量視圖界面(定義數(shù)據(jù)集的數(shù)據(jù)字典)。2-3、變量名命名準(zhǔn)則:必須以英文
2、字母開口,其他部分可以含有字母、數(shù)字、下劃線;變量名盡量避免和 spss已有的關(guān)鍵字重復(fù)( sum、compute 、anova);變量名最長為 64 個(gè)英文字符或者 32 個(gè)中文字符; spss 變量名不區(qū)分大小寫。2-4、變量的度量類型不是固定不變的,可以分局分析過程來改變變量的度量類型。2-5、 spss 中字符型數(shù)據(jù)值區(qū)分大小寫;字符型數(shù)據(jù)可以設(shè)置值標(biāo)簽。2-6、對于數(shù)據(jù)的處理缺省值默認(rèn)為 ”.”,字符串默認(rèn)為空,若空字符串有意義,需在變量是同對缺省值進(jìn)行定義。2-7、 spss 只讀入數(shù)據(jù)( excel)。2-8、添加變量合并文件:一對一合并,一對多合并;合并相同個(gè)案數(shù),不同屬性的數(shù)
3、據(jù)文件,為添加變量;合并數(shù)據(jù)之前,需按關(guān)鍵變量進(jìn)行排序,合并的詩句恩見必須是.sav 或已經(jīng)在 spss 中打開的文件,并確保兩個(gè)文件中需要合并的變量名稱不同。3-1、可視化分段方法:直接輸入分割點(diǎn);根據(jù)條件自動生成分割點(diǎn)。3-2、填補(bǔ)缺失數(shù)據(jù)方法:序列均值、臨近點(diǎn)均值、臨近點(diǎn)的中位數(shù)、線性插值法、點(diǎn)處線性趨勢。3-3、在做統(tǒng)計(jì)分析之前一般要做數(shù)據(jù)效驗(yàn),如果是錄入錯(cuò)誤則重新錄入;若數(shù)據(jù)確實(shí)錯(cuò)誤,則可將這些數(shù)據(jù)設(shè)置成缺失值。3-4、“標(biāo)記異常個(gè)案”過程基于個(gè)案偏離聚類組中心的大小來判斷異常個(gè)案,一般用于探索性數(shù)據(jù)分析步驟中。3-5、可視化變量分段是對連續(xù)數(shù)據(jù)進(jìn)行離散化。4-1、描述數(shù)據(jù)特征的統(tǒng)計(jì)
4、量,一類表示數(shù)據(jù)的中心位置(均值、中位數(shù)、眾數(shù)),一類表示數(shù)據(jù)的離散程度 (方差、 標(biāo)準(zhǔn)差、極差)。進(jìn)行數(shù)據(jù)分析第一步往往是進(jìn)行描述性統(tǒng)計(jì)分析。4-2、頻率分析:對于給定的類,落入這個(gè)類的個(gè)案數(shù)成為頻率,落入該類中的個(gè)案數(shù)和個(gè)案總數(shù)的比例成為相對頻率直方圖、 條形圖、集中趨勢和離散趨勢的統(tǒng)計(jì)量來描述數(shù)據(jù)的分布特征。4-3、餅圖和條形圖使用于分類變量類別個(gè)別數(shù)較少的情況,如果個(gè)別數(shù)較多,選擇直方圖。4-4、中心趨勢的描述:均值、中位數(shù)、眾數(shù)、5%截尾均值,指一組數(shù)據(jù)向某個(gè)中心值靠攏的傾向。對于連續(xù)變量(尺度變量)和定序變量,描述中心趨勢的有均值、中位數(shù)、眾數(shù)、5%截尾均值 (升序排序, 剔除最小
5、和最大的 5%后的算術(shù)均值) ;對于定性數(shù)據(jù) (名義數(shù)據(jù)),指標(biāo)只有眾數(shù)。 (尺度變量連續(xù)變量;名義變量定性數(shù)據(jù);名義變量和定序變量 分類變量)4-5、離散趨勢的描述:極差、方差、標(biāo)準(zhǔn)差、分位數(shù)、變異指標(biāo)。4-6、總結(jié)五數(shù):最小值、下四分位數(shù)、中位數(shù)、上四分位數(shù)、最大值。(箱圖)1 / 4.4-7、偏度:( -3,3), 0,左偏,在左拖尾。 =0 對稱分布。峰度: 3,高峰度,=0,正太峰。4-8、分析 / 描述統(tǒng)計(jì) / 頻率(條形圖、餅圖、直方圖)/ 描述 / 探索(箱圖、莖葉圖、直方圖、Q-Q 圖),輸出統(tǒng)計(jì)量(均值、中值、眾數(shù)、標(biāo)準(zhǔn)差、方差、偏度、峰度、全距、極值、百分位數(shù))4-9、定
6、性數(shù)據(jù)圖形的描述:條形圖、帕累托圖(從高到低排序條形圖)、餅圖。(首先加權(quán)個(gè)案)4-10、定量數(shù)據(jù)圖形的描述:直方圖(用于連續(xù)型數(shù)據(jù))、莖葉圖、箱圖。4-11、在探索圖里面勾選帶檢驗(yàn)的正態(tài)圖可以輸出選定變量的 QQ 圖、變量正態(tài)性的 K-S 檢驗(yàn)和 S-W 檢驗(yàn)。4-12、 IQR(四分位距)=Q3-Q1,最下面的短線Q1-1.5IQR,最上面短線Q3+1.5IQR,離群值(圓圈表示)落入 Q3+1.5IQR, Q3+3IQR)或者( Q1-3IQR,Q1-1.5IQR,極端值(表示)大于等于 Q3+3IQR或 Q1-3IQR。4-13、如果只有一個(gè)因變量,莖葉圖或者箱圖按因子各個(gè)水平輸出,選
7、擇不分組的輸出結(jié)果和選擇“按因子水平分組” 的輸出結(jié)果只在標(biāo)題的組織形式上略有不同, 如果有兩個(gè)因變量,則兩種選項(xiàng)的結(jié)果差異較大。5-1、 因?yàn)榧僭O(shè)檢驗(yàn)有何能犯兩類錯(cuò)誤:拒真、受偽。5-2、假設(shè)檢驗(yàn)的步驟:確定恰當(dāng)?shù)脑僭O(shè)和被擇假設(shè);選擇檢驗(yàn)統(tǒng)計(jì)量;計(jì)算檢驗(yàn)統(tǒng)計(jì)量觀測值發(fā)生個(gè)概率( P);給定顯著性水平,并作出決策。5-3、分析 / 比較均值 / 均值,輸出表格“案例處理摘要” (看缺失值)、“均值報(bào)告表” (看均值列,趨勢與增加幅度,如隨著工作年限增加,小時(shí)工資也增加,增加幅度不均勻,列舉每階段增加幅度) 、“方差分析表 ( ANOVA表)”(線性顯著性 0.05,非線性關(guān)系成分不顯著) 、
8、“相關(guān)性度量表” ( R 方值不大,線性關(guān)系不十分強(qiáng))5-4、雙因素分析:在均值對話框下一張,均值過程只對第一層的自變量進(jìn)行方差分析和線性相關(guān)檢驗(yàn)(只有描述性統(tǒng)計(jì)表,即均值分析報(bào)告不一樣,均值列分析:同等經(jīng)驗(yàn)下,病房護(hù)士小時(shí)工資比辦公室高,隨著工作經(jīng)驗(yàn)增加,差距變??; 標(biāo)準(zhǔn)差列分析:同等經(jīng)驗(yàn)的辦公室護(hù)士,小時(shí)工資差距大于同等經(jīng)驗(yàn)的醫(yī)院護(hù)士)。5-5、單樣本 T 檢驗(yàn)即檢驗(yàn)?zāi)硞€(gè)變量的總體均值和某指定值之間是否存在顯著性差異。T 檢驗(yàn)的穩(wěn)健性好。 數(shù)據(jù)準(zhǔn)備: 數(shù)據(jù)拆分文件分割文件比較組(完成分析之后要關(guān)閉文件分割)、單樣本 T 檢驗(yàn):分析 / 比較均值 / 單樣本 T 檢驗(yàn)(輸入檢驗(yàn)值) “單個(gè)樣
9、本統(tǒng)計(jì)量”均值,偏離檢驗(yàn)值、 “單個(gè)樣本檢驗(yàn)”t 為 T 統(tǒng)計(jì)量, df 為自由度, sig(雙側(cè))為 P值,均值差值為各數(shù)據(jù)減去檢驗(yàn)值,上限下限位該均值差95%的置信區(qū)間的上限和下限。sig值0.05,接受正態(tài)性假設(shè))判定是夠滿足T 檢驗(yàn)前提條件,滿足則進(jìn)行T 檢驗(yàn);分析 / 比較均值 / 獨(dú)立樣本 T 檢驗(yàn)(定義分組變量)“組統(tǒng)計(jì)量” (顯示均值、標(biāo)準(zhǔn)差及均值的標(biāo)準(zhǔn)誤,均值的標(biāo)準(zhǔn)誤即為標(biāo)準(zhǔn)差除以樣本N 的平方根)、“獨(dú)立樣本檢驗(yàn)” (方差方2 / 4.程的 Leven 檢驗(yàn),即方差齊性檢驗(yàn),和均值方程的t 檢驗(yàn), p0.05 接受方差齊性假設(shè),選擇“假設(shè)方差相等” ,sig(雙峰) 0.0
10、5,說明新促銷方法消費(fèi)金額顯著不同于標(biāo)準(zhǔn)促銷消費(fèi)金額,再比較均值大小,說明新方案有效) 。5-8配對樣本T 檢驗(yàn)配對設(shè)計(jì)方法:同一受試對象處理前后的數(shù)據(jù)/ 兩個(gè)部位數(shù)據(jù) / 兩種方法測試數(shù)據(jù) / 配對的兩個(gè)收拾對象分別接受兩種處理后的數(shù)據(jù)。5-9、配對樣本T 檢驗(yàn)的前提條件:兩個(gè)樣本配對、兩個(gè)樣本所來自的總體服從正太分布;分析 / 比較均值 / 配對樣本T 檢驗(yàn)“成對樣本統(tǒng)計(jì)量”(均值、標(biāo)準(zhǔn)量、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)誤),“成對樣本相關(guān)系數(shù)” (樣本量N、相關(guān)系數(shù)、相關(guān)系數(shù)P 值 sig0.05,相關(guān)系數(shù)明顯大于0,有強(qiáng)線性相關(guān)) ,“成對樣本檢驗(yàn)” (差值的均值、差值的標(biāo)準(zhǔn)差、差值均值的標(biāo)準(zhǔn)誤,
11、 t 統(tǒng)計(jì)量和相對應(yīng)的顯著性,t=差值的均值 / 均值的標(biāo)準(zhǔn)誤,分析:對1 的差值均值及為減輕量,由于對1 均值及均值的標(biāo)準(zhǔn)誤遠(yuǎn)遠(yuǎn)高于對2,所以對2 的 t 值遠(yuǎn)遠(yuǎn)大于對1 的 t值,從顯著性來看, 對 2 的減輕是顯著的,因此該計(jì)劃最終的評估結(jié)果為可以減輕體重但不確定可以減輕脂肪) 。注意:配對樣本T 檢驗(yàn)之前需要檢查兩樣本是否服從正態(tài)分布(直方圖、 QQ 圖、 k-s 檢驗(yàn),注意分析變量中的離群值,用箱圖檢驗(yàn))。6-1、非參數(shù)檢驗(yàn)的優(yōu)點(diǎn):穩(wěn)健性、使用范圍廣。缺點(diǎn):檢驗(yàn)?zāi)苄л^差。適用場合:參數(shù)檢驗(yàn)方法的條件不滿足, 研究定類變量和定序變量之間的關(guān)系。 單樣本非參檢驗(yàn)方法: 二項(xiàng)檢驗(yàn)、卡方檢驗(yàn)
12、、 k-s 檢驗(yàn)。6-2、卡方檢驗(yàn)對總體分布進(jìn)行檢驗(yàn)(心臟病猝死人數(shù)與日期關(guān)系、人口結(jié)構(gòu)、血型和性格等),原假設(shè):樣本來自的總體分布于假設(shè)的分布無顯著性差異。卡方統(tǒng)計(jì)量服從自由度為 k-1 的卡方分布,如果卡方值較大,說明期望頻數(shù)與觀測頻數(shù)分布差距較大,拒絕原假設(shè)。6-3、二項(xiàng)式檢驗(yàn)(首先定義成功或失敗的類別,默認(rèn)第一類為成功類)7-1、相關(guān)關(guān)系分為線性相關(guān)和非線性相關(guān),相關(guān)變量的研究根據(jù)變量的度量類型分為定類變量之間的相關(guān),定序變量之間的相關(guān),尺度變量之間的相關(guān)。7-2、相關(guān)分析在統(tǒng)計(jì)分析中的作用:判斷變量之間有無聯(lián)系、確定相關(guān)關(guān)系的表現(xiàn)形式及相關(guān)分析方法、 把握相關(guān)關(guān)系的方向與密切程度、
13、進(jìn)一步采取其他統(tǒng)計(jì)方法進(jìn)行分析提供依據(jù)、用來描述變量之間的關(guān)系狀況和進(jìn)行預(yù)測。7-3、相關(guān)分析的主要方法:圖示法(散點(diǎn)圖) 、計(jì)算相關(guān)系數(shù)法。圖形 / 散點(diǎn)圖 / 簡單散點(diǎn)圖,偏離大部分的點(diǎn)為離群值。7-4、相關(guān)系數(shù)為 0 只能說明沒有線性相關(guān)關(guān)系, 相關(guān)系數(shù)適用于樣本量大于 30 且兩個(gè)變量的總體是正態(tài)分布的情況。7-5、相關(guān)系數(shù)檢驗(yàn),原假設(shè)為=0;分析 / 相關(guān) / 雙變量“相關(guān)性” (相關(guān)系數(shù) ) 0.05,線性相關(guān)不顯著;剔除離群值:數(shù)據(jù) / 選擇個(gè)案 / 如果、分割文件:數(shù)據(jù) / 拆分文件、分析 / 相關(guān) / 雙變量“相關(guān)性” (相關(guān)系數(shù)、顯著性)(散點(diǎn)圖相關(guān)系數(shù)檢驗(yàn)回歸)8-1、確
14、定變量之間線性相關(guān)后,通過回歸分析找出線性關(guān)系。線性回歸是指回歸系數(shù)為線性,不是非相關(guān)變量和預(yù)測變量之間的的關(guān)系。8-2、回歸分析的步驟:寫出研究的問題和分析的目的、選擇潛在相關(guān)變量、收集數(shù)據(jù)、選擇合適擬合優(yōu)度、模型求解、模型驗(yàn)證和評價(jià)、應(yīng)用模型解決研究問題。8-3、簡單線性回歸: Y= 0+ 1X+( X 為預(yù)測變量,可控, Y 為因變量,隨機(jī),為隨機(jī)誤差, N(0, 2),且假設(shè) 2與 X 無關(guān))。3 / 4.8-4 、決定系數(shù)R2=SSR/SST=1-SSE/SST,殘差平方和SSE,回歸平方和SSR,總平方和SST=SSR+SSE,0=R2=1。決定系數(shù)越大,回歸方程的擬合程度越高,0
15、.6 以上即可以接受回歸直線。8-5、分析 / 回歸 / 線性“系數(shù)” ( B 列,寫出方程 Y=常量 B+UnitsBX,注意 Y 的帽子)、“模型摘要(匯總) ”(調(diào)整) R2小于 R2,一元看 R2,多元看調(diào)整 R2,分析: R2=0.978,說明該線性模型可以解釋自變量 97.8%的變差,擬合效果好、 “模型擬合優(yōu)度檢驗(yàn) Anova”( F=回歸平方和 / 殘差均方, sig0.05, 0.05 說明方差不齊,分析:在比較各個(gè)組別樣本量相差不大, 且各組分別的分布形態(tài)類似的情況下,方差分析對方差不等具有穩(wěn)健性,案例中內(nèi)個(gè)組個(gè)案數(shù)相等, 峰度和偏度相等,分布形態(tài)類似,可進(jìn)行方差分析,建議方差分析后進(jìn)行相應(yīng)非參檢驗(yàn)驗(yàn)證方差分析結(jié)果)“ANOVA 表”(均方 =相應(yīng)平方和 / 自由度, F=組間均方 / 組內(nèi)均方,一共三個(gè)組,組間自由度2,60 個(gè)個(gè)案, 3 個(gè)組,組內(nèi)自由度 57。分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版房屋租賃協(xié)議標(biāo)準(zhǔn)格式范本版
- 二零二五年度城市綜合體安防監(jiān)控設(shè)施升級改造合同3篇
- 2024版光伏發(fā)電項(xiàng)目建設(shè)與運(yùn)營合同
- 2025年滬科版選擇性必修1物理下冊月考試卷
- 2025年外研版九年級科學(xué)上冊月考試卷
- 2025年人教A版七年級地理下冊階段測試試卷含答案
- 二零二五年度貨車車輛買賣與二手車置換服務(wù)合同3篇
- 2024年運(yùn)城幼兒師范高等??茖W(xué)校高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 2025年北師大新版七年級物理下冊月考試卷
- 2025年冀教新版五年級數(shù)學(xué)上冊階段測試試卷
- 人大提案格式范文
- 《那一刻我長大了》五年級語文下冊作文12篇
- 南充化工碼頭管網(wǎng)施工方案(初稿)
- 2023年消防接警員崗位理論知識考試參考題庫(濃縮500題)
- GB/T 30285-2013信息安全技術(shù)災(zāi)難恢復(fù)中心建設(shè)與運(yùn)維管理規(guī)范
- 魯濱遜漂流記閱讀任務(wù)單
- 第一章 運(yùn)營管理概論1
- 主體結(jié)構(gòu)驗(yàn)收匯報(bào)材料T圖文并茂
- 管理學(xué)原理(南大馬工程)
- 過一個(gè)有意義的寒假課件
- 施工現(xiàn)場裝配式集裝箱活動板房驗(yàn)收表
評論
0/150
提交評論