![理學]SPSS統(tǒng)計與分析講稿第十二章利用SPSS進行相關(guān)分析課件_第1頁](http://file4.renrendoc.com/view/8ee57cc7c02b90ba227368b182a67de1/8ee57cc7c02b90ba227368b182a67de11.gif)
![理學]SPSS統(tǒng)計與分析講稿第十二章利用SPSS進行相關(guān)分析課件_第2頁](http://file4.renrendoc.com/view/8ee57cc7c02b90ba227368b182a67de1/8ee57cc7c02b90ba227368b182a67de12.gif)
![理學]SPSS統(tǒng)計與分析講稿第十二章利用SPSS進行相關(guān)分析課件_第3頁](http://file4.renrendoc.com/view/8ee57cc7c02b90ba227368b182a67de1/8ee57cc7c02b90ba227368b182a67de13.gif)
![理學]SPSS統(tǒng)計與分析講稿第十二章利用SPSS進行相關(guān)分析課件_第4頁](http://file4.renrendoc.com/view/8ee57cc7c02b90ba227368b182a67de1/8ee57cc7c02b90ba227368b182a67de14.gif)
![理學]SPSS統(tǒng)計與分析講稿第十二章利用SPSS進行相關(guān)分析課件_第5頁](http://file4.renrendoc.com/view/8ee57cc7c02b90ba227368b182a67de1/8ee57cc7c02b90ba227368b182a67de15.gif)
文檔簡介
1、第十二章 直線回歸與相關(guān) 客觀事物在發(fā)展過程中是相互聯(lián)系、相互影響,常常要研究兩個或兩個以上變量間的關(guān)系。 下一張 主 頁 退 出 上一張 下一張 主 頁 退 出 上一張 一、回歸與相關(guān)概述一類是完全確定性的關(guān)系,又稱函數(shù)關(guān)系,可以用精確的數(shù)學表達式來表示,即當變量x的值取定后,變量y有唯一確定的值與之對應(yīng)。 如長方形的面積(S) 與 長(a)和寬(b)的關(guān)系: S=ab。它們之間的關(guān)系是確定性的,只要知道了其中兩個變量的值就可以精確地計算出另一個變量的值,這類變量間的關(guān)系稱為函數(shù)關(guān)系。1、各種變量間的關(guān)系大致可分為兩類:確定性關(guān)系非確定性關(guān)系如人的身高與體重的關(guān)系,作物種植密度與產(chǎn)量的關(guān)系,
2、食品價格與需求量的關(guān)系等等,這些變量間都存在著十分密切的關(guān)系,但不能由一個或幾個變量的值精確地求出另一個變量的值。統(tǒng)計學中把這些變量間的關(guān)系稱為相關(guān)關(guān)系,把存在相關(guān)關(guān)系的變量稱為相關(guān)變量。 下一張 主 頁 退 出 上一張 另一類是 非確定性關(guān)系,不能用精確的數(shù)學公式來表示,當變量x的值取定后,y有若干種可能取值。 在一定范圍內(nèi),對一個變量的任意數(shù)值(Xi),雖然沒有另一個變量的確定數(shù)值yi與之對應(yīng),但是卻有一個特定yi的條件概率分布與之對應(yīng),這種變量的不確定關(guān)系,稱為相關(guān)關(guān)系。2、相關(guān)關(guān)系一些常用術(shù)語:直線相關(guān):是指兩個變量呈線性共同增大或者呈線性一增一減曲線相關(guān):兩變量存在相關(guān)趨勢,但并非線
3、性,而是呈曲線趨勢。正相關(guān):如A變量增加時,B變量也增加負相關(guān): A變量增加時,B變量減小完全相關(guān):兩變量的相關(guān)程度達到了親密無間的程度,即確定性的函數(shù)關(guān)系,當?shù)弥狝變量取值時,就可以準確推算出B變量的取值。下一張 主 頁 退 出 上一張 對多個變量進行相關(guān)分析時,研究一個變量與多個變量間的線性相關(guān)稱為復相關(guān)分析;研究其余變量保持不變的情況下兩個變量間的線性相關(guān)稱為偏相關(guān)分析。下一張 主 頁 退 出 上一張 統(tǒng)計學上采用相關(guān)分析 ( correlation analysis)來研究呈平行關(guān)系相關(guān)變量之間的關(guān)系。 對兩個變量間的直線關(guān)系進行相關(guān)分析稱為簡單相關(guān)分析(也叫直線相關(guān)分析); 回歸分析
4、是研究一個自變量或多個自變量(Independent)與一個依變量(Dependent)之間是否存在某種線性關(guān)系或非線性關(guān)系的一種統(tǒng)計學分析方法。下一張 主 頁 退 出 上一張 統(tǒng)計學上采用回歸分析 (regression analysis)方法研究呈因果關(guān)系的相關(guān)變量間的關(guān)系。表示原因的變量稱為自變量,表示結(jié)果的變量稱為依變量。 研究“一因一果”,即一個自變量與一個依變量的回歸分析稱為一元回歸分析; 研究“多因一果”,即多個自變量與一個依變量的回歸分析稱為多元回歸分析。 一元回歸分析又分為直線回歸分析與曲線回歸分析兩種;多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種。 下一張 主
5、 頁 退 出 上一張 回歸分析的任務(wù)就是揭示出呈因果關(guān)系的相關(guān)變量間的聯(lián)系形式,建立它們之間的回歸方程,利用所建立的回歸方程,由自變量(原因)來預測、控制依變量(結(jié)果)?;貧w分析主要包括:找出回歸方程;檢驗回歸方程是否顯著;通過回歸方程來預測或控制另一變量。SPSS的相關(guān)分析功能被集中在Statistic菜單的Correlate子菜單中,它包括以下3個過程:Bivariate過程:此程度用于進行兩個/多個變量之間的參數(shù)/無參數(shù)相關(guān)分析,如果是多個變量,則給出兩兩相關(guān)的分析結(jié)果,這是Correlate子菜單中最為常用的一個過程,實際上用戶對它的使用可能占到相關(guān)分析的95%以上。Partial過程
6、:就是偏相關(guān)分析。當需要進行相關(guān)分析的兩個變量取值均受到其他變量的影響時Distance過程:該過程一般不單獨使用,而是作為因素分析、聚類分析和多維尺度分析的預先分析過程,以協(xié)助了解復雜數(shù)據(jù)集的內(nèi)在結(jié)構(gòu),為進一步分析做準備下一張 主 頁 退 出 上一張 二、相關(guān)分析 ( correlation analysis)Bivariate過程是相關(guān)分析中用得最多的一個分析過程,用于進行兩個變量間的線性相關(guān)分析,結(jié)果中可以給出Pearson相關(guān)系數(shù)、Kendall等級相關(guān)系數(shù)和Spearman等級關(guān)系數(shù)值,下面用一個例子來說明Bivariate過程。例 某地一年級12名女大學生的體重與肺活量的數(shù)據(jù)如下,
7、試分析兩者有無直線相關(guān)關(guān)系?下一張 主 頁 退 出 上一張 (一)、Bivariate過程corr在進行相關(guān)分析之前必須做散點圖,以判斷兩變量之間有無相關(guān)趨勢,及趨勢是否呈線性(Line)關(guān)系,如果在圖形上兩個變量之間存在線性相關(guān)趨勢,才能繼續(xù)后面的分析。(1)、散點圖分析: Graphs Scatter Simple散點圖中可以看出,體重與肺活量有著非常明顯的直線相關(guān)趨勢,并且從圖中可以看出,沒有影響過強的異常點,因此可放心地進行相關(guān)分析;如果有過強點,可考慮曲線回歸分析或其它相關(guān)分析下一張 主 頁 退 出 上一張 (2)、Bivariate分析Analyze -Correlate -Biv
8、ariate打開Bivariate主對話框下一張 主 頁 退 出 上一張 用于選擇需要計算的相關(guān)分析指標:Pearson:進行積距相關(guān)分析,最常用的相關(guān)分析Kendalls tau-b:計算Kendalls等級相關(guān)系數(shù),只能在兩個變量均屬于有序分類時使用Spearman:計算Spearman相關(guān)系數(shù),即最常用的非參數(shù)相關(guān)分析用于確定是進行相關(guān)系數(shù)的單側(cè)或雙側(cè)檢驗,一般是雙側(cè)用于選入需要分析的變量,至少需要選入兩個,如果選入了多個,系統(tǒng)會給兩兩直線相關(guān)分析的結(jié)果要求在結(jié)果中用星號標記有統(tǒng)計學顯著性意義的相關(guān)系數(shù),一般選中Options對話框下一張 主 頁 退 出 上一張 用于選擇需要計算的描述統(tǒng)
9、計量和統(tǒng)計分析每個變量的平均值和標準差各變量的離均差平方和及變量方陣缺失值處理方法Analyze -Correlate -Bivariate打開Bivariate主對話框,將weight和lung變量選入Variables框;選擇Correlation Coefficients (選擇相關(guān)系數(shù)):一般要求計算Pearson和Spearman相關(guān)系數(shù)選擇Test of Significance (選擇相關(guān)系數(shù)的檢驗):一般選擇two-tailedFlag significant correlations:在結(jié)果中用星號標記有統(tǒng)計學顯著性意義的相關(guān)系數(shù)。單擊Options按鈕進入Options對話
10、框,選中Means and standard deviations和Cross-product deviations and covariances,Missing Values選擇系統(tǒng)默認下一張 主 頁 退 出 上一張 (3) 結(jié)果分析下一張 主 頁 退 出 上一張 這是散點圖,從中可以看出體重與肺活量有非常明顯的直線相關(guān)趨勢,并且從圖中也沒有發(fā)現(xiàn)影響過強的異常點,故可進行相關(guān)分析這是描述統(tǒng)計量,有平均值和標準差下一張 主 頁 退 出 上一張 Descriptive Statistics MeanStd. Deviation體重49.33335.28004肺活量2.9025.41442Cor
11、relations 體重肺活量體重Pearson Correlation1.749(*)Sig. (2-tailed).005Sum of Squares and Cross-products306.66718.040Covariance27.8791.640N1212肺活量Pearson Correlation.749(*)1Sig. (2-tailed).005Sum of Squares and Cross-products18.0401.889Covariance1.640.172N1212*Correlation is significant at the 0.01 level (2
12、-tailed).這是變量間兩兩Pearson相關(guān)系數(shù)方陣下一張 主 頁 退 出 上一張 Correlations 體重Spearmans rho體重Correlation Coefficient1.000Sig. (2-tailed).N12肺活量Correlation Coefficient.849(*)Sig. (2-tailed).000N12*Correlation is significant at the 0.01 level (2-tailed).這是變量間兩兩Spearmans相關(guān)系數(shù)方陣1、現(xiàn)抽取1963-1982年共20年的統(tǒng)計數(shù)據(jù)(見研究投資性變量),試分析投資性變量與
13、國民收入之間的相關(guān)關(guān)系。2、研究商品零售總額與收入間的相關(guān)關(guān)系(數(shù)據(jù)見商品零售總額與收入)3、試分析體重與進食量的關(guān)系(數(shù)據(jù)見體重與進食量)4、試分析高一與高二數(shù)學成績的關(guān)系(高一與高二數(shù)學成績)例題下一張 主 頁 退 出 上一張 當分析兩個變量之間相關(guān)關(guān)系時,往往會有其他變量的影響摻和在里面,使得計算出的相關(guān)系數(shù)難以體現(xiàn)出這兩個變量間的真實相關(guān)關(guān)系。這時就要用Parial過程進行偏相關(guān)分析。例 現(xiàn)已測得20名糖尿病人的血糖(y,mmol/L)、胰島素(x1,mU/L)及生長激素(x2,ug/L)的測量數(shù)據(jù)。請分析糖尿病人的血糖與生長激素濃度間有無相關(guān)關(guān)系。下一張 主 頁 退 出 上一張 (二
14、)、Parial過程pcorr1、Parial分析過程(1)、對話框介紹Analyze -Correlate-Partial順序打開Partial主對話框 下一張 主 頁 退 出 上一張 用于選入需要分析的變量,至少需要選入兩個,如果選入了多個,系統(tǒng)會給兩兩直線相關(guān)分析的結(jié)果用于選入需要在偏相關(guān)分析時進行控制的共變量,如果不選,即普通相關(guān)分析用于確定是進行相關(guān)系數(shù)的單側(cè)或雙側(cè)檢驗,一般是雙側(cè)要求在結(jié)果中用星號標記有統(tǒng)計學顯著性意義的相關(guān)系數(shù),一般選中Options對話框下一張 主 頁 退 出 上一張 用于選擇需要計算的描述統(tǒng)計量和統(tǒng)計分析每個變量的平均值和標準差包括協(xié)變量在內(nèi)所有變量的相關(guān)方陣
15、缺失值處理方法(1)、對話框介紹Analyze -Correlate-Partial順序打開Partial主對話框,將y和x2選入Variables框;將x1選入Controlling for框;選中Testtwo-tailed和Display actual significance level單擊Options按鈕進入Options對話框,選中Means and standard deviations和Zero-order correlation,Missing Values選擇系統(tǒng)默認單OK,輸出結(jié)果(2) Parial分析過程下一張 主 頁 退 出 上一張 這是描述統(tǒng)計量,有平均值和標準
16、差(3) 結(jié)果分析下一張 主 頁 退 出 上一張 Descriptive Statistics MeanStd. Deviation血糖(mmol/L)10.85002.92585生長素(ug/L)8.94404.35242胰島素(mU/L)17.33005.35862這是變量間兩兩Pearson相關(guān)系數(shù)方陣1、現(xiàn)測定30名13歲男童的身高、體重、肺活量數(shù)據(jù),試分析身高與肺活量的關(guān)系,以體重作為控制變量2、研究商品零售總額與收入間的相關(guān)關(guān)系(數(shù)據(jù)見商品零售總額與收入)3、試分析體重與進食量的關(guān)系(數(shù)據(jù)見體重與進食量)4、試分析高一與高二數(shù)學成績的關(guān)系(高一與高二數(shù)學成績)例題下一張 主 頁 退
17、 出 上一張 Distance過程是對觀察值之間或變量之間相似或不相似程度的一種測度,是計算一對變量之間或一對觀測值之間的廣義的距離例 在某體育比賽中,有中、英、法等7個國家的裁判對選手進行評分,評分結(jié)果見judges.sav。請根據(jù)評分高低判斷哪些國家的裁判比較類似,為以后的聚類分析提供信息。下一張 主 頁 退 出 上一張 (三)、Distances過程judges1、Distances分析過程(1)、對話框介紹Analyze-Correlate-Distance的順序打開主對話框。用于選入需要分析的變量,至少需要選入兩個,如果選入了多個,系統(tǒng)會給兩兩直線相關(guān)分析的結(jié)果計算距離:個案間距離變
18、量間距離選擇計算距離方法:相似性程度,數(shù)值越大,距離越遠不相似程度,數(shù)值越大,距離越近Measure對話框下一張 主 頁 退 出 上一張 用于確定測距方法,數(shù)據(jù)測量方法不同,測距的方法也不同有三類數(shù)據(jù):計量數(shù)據(jù)、計數(shù)數(shù)據(jù)和二值數(shù)據(jù),選中后點擊下拉菜單,可以選擇距離的計算方法用于確定在進行計算之前,是否對個案或變量進行標準化用于對距離測度的結(jié)果進行轉(zhuǎn)換絕對值,對距離取絕對值改變符號,把相似性測度值轉(zhuǎn)換成不相似性測度值或相反先減去最小值,然后除以范圍差值Measure對話框下一張 主 頁 退 出 上一張 用于確定測距方法,數(shù)據(jù)測量方法不同,測距的方法也不同有三類數(shù)據(jù):計量數(shù)據(jù)、計數(shù)數(shù)據(jù)和二值數(shù)據(jù),
19、選中后點擊下拉菜單,可以選擇距離的計算方法下一張 主 頁 退 出 上一張 Interval(計量數(shù)據(jù)):Euclidean distance:Euclidean距離,是兩變量之差的平方和的平方根,默認選 項Squared Euclidean distanc:Euclidean距離平方,是兩變量之差的平方和Chebychev:Chebychev距離,兩項之差的最大絕對值Block:區(qū)組距離,變量的兩個值之間差的絕對值之和Minkowski:Minkowski距離,兩變量值之差的p次冪絕對值之和的p次方根Customized:自定義距離,兩變量值之差的p次冪絕對值之和的r次方根,可以設(shè)定p和rMeasure對話框下一張 主 頁 退 出 上一張 用于確定測距方法,數(shù)據(jù)測量方法不同,測距的方法也不同有三類數(shù)據(jù):計量數(shù)據(jù)、計數(shù)數(shù)據(jù)和二值數(shù)據(jù),選中后點擊下拉菜單,可以選擇距離的計算方法Options對話框下一張 主 頁 退 出 上一張 用于選擇需要計算的描述統(tǒng)計量和統(tǒng)計分析每個變量的平均值和標準差包括協(xié)變量在內(nèi)所有變量的相關(guān)方陣缺失值處理方法(1)、對話框介紹Analyze-Co
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 促進社區(qū)居民參與社團活動的個人工作計劃
- 寧夏慶華煤化集團有限公司鹽池縣曹家灣煤礦礦山地質(zhì)環(huán)境保護與土地復墾方案評審表
- 人教版七年級歷史與社會下冊7.1-規(guī)則的演變教學設(shè)計001
- 距骨骨折護理
- 全國青島版信息技術(shù)七年級上冊專題一第3課一、《網(wǎng)絡(luò)信息安全現(xiàn)狀》教學設(shè)計
- 2025年孝感貨運上崗資格證模擬考試
- 保密法知識培訓講座
- 2025年濟南貨運從業(yè)資格證500道題目和答案
- 2025年青海道路客貨運輸從業(yè)資格證模擬考試下載
- 2025年西藏c1貨運從業(yè)資格證考試內(nèi)容
- 《草圖大師建?!肥谡n計劃+教案
- 地震英文課件
- 靈山縣城鄉(xiāng)融合發(fā)展奶水牛標準化養(yǎng)殖小區(qū)項目環(huán)境影響報告書
- 《普通心理學》第七章-思維
- 配電線路及設(shè)備巡視
- 詩詞大會訓練題庫-十二宮格
- 煤礦托管承包合同
- 專升本英語語法1
- 設(shè)備采購工程安裝進度計劃橫道圖
- 2023年黑龍江三江美術(shù)職業(yè)學院單招面試題庫及答案解析
- 110KV送出線路工程施工組織設(shè)計
評論
0/150
提交評論