《應(yīng)用統(tǒng)計分析》課件-第7章 相關(guān)分析與列聯(lián)表分析_第1頁
《應(yīng)用統(tǒng)計分析》課件-第7章 相關(guān)分析與列聯(lián)表分析_第2頁
《應(yīng)用統(tǒng)計分析》課件-第7章 相關(guān)分析與列聯(lián)表分析_第3頁
《應(yīng)用統(tǒng)計分析》課件-第7章 相關(guān)分析與列聯(lián)表分析_第4頁
《應(yīng)用統(tǒng)計分析》課件-第7章 相關(guān)分析與列聯(lián)表分析_第5頁
已閱讀5頁,還剩80頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第7章相關(guān)分析與列聯(lián)表分析1、概述2、定量數(shù)據(jù)相關(guān)3、定序數(shù)據(jù)相關(guān)分析—Spearman秩相關(guān)系數(shù)4、定類數(shù)據(jù)相關(guān)分析—列聯(lián)表分析5、SPSS使用舉例12短視頻獲贊數(shù)與發(fā)表時間之間的關(guān)系不可置疑的是,短視頻在獲貴的數(shù)量與其內(nèi)容和質(zhì)量密切相關(guān),除此之外,短視頻的獲贊數(shù)逐與什么因素有關(guān)呢?。本例將討論短視頻在24小時內(nèi)的獲贊總數(shù)與發(fā)表時間的相關(guān)關(guān)系,即研究這樣的問題∶短視頻在24小時內(nèi)的獲贊總數(shù)與其發(fā)表時間有關(guān)嗎?它們之間相關(guān)的程度有多大?為解決上連問題,我們從某短視頻播放平臺收集了30名作者的視頻獲贊記錄,這些作者的粉絲數(shù)量相近且發(fā)表的視頻類型均為人物隨拍引入案例3時刻獲贊總數(shù)時刻獲贊總數(shù)時刻獲贊總數(shù)10:2538915:4223820:18161711:0125416:1057720:34159711:3530316:3775120:56115212:3245616:59125621:17128312:5353318:17182921:38112013:1478218:42213421:46115613:4895118:55186022:09154514:3757619:26244522:39206714:4938019:52188823:19143215:2127420:08177323:491021觀察以上數(shù)據(jù),我們發(fā)現(xiàn),短視頻的獲贊數(shù)確實可能與發(fā)表的時間存在相關(guān)關(guān)系。為了科學(xué)地判斷兩者間的相關(guān)關(guān)系,需引入新的統(tǒng)計手段,即相關(guān)分析。引入案例第1節(jié)概述1、概念2、相關(guān)關(guān)系與函數(shù)關(guān)系47.1.1概念當(dāng)一個或幾個相互聯(lián)系的變量取一定的數(shù)值時,與之相對應(yīng)的另一變量的值雖然不能確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。變量間的這種相互關(guān)系,稱為具有不確定性的相關(guān)關(guān)系。5什么是相關(guān)關(guān)系?7.1.1概念因果關(guān)系是由于發(fā)生了某種原因,導(dǎo)致了特定的結(jié)果,而相關(guān)關(guān)系間不存在這樣的原因和結(jié)果關(guān)系。6相關(guān)關(guān)系與因果關(guān)系7.1.1概念相關(guān)分析是討論兩個以上處于同等地位的隨機變量間的相關(guān)關(guān)系的統(tǒng)計分析方法,其分析的對象為各個總體間具有某種聯(lián)系的標(biāo)志。按照被研究數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu),可將相關(guān)分析分為數(shù)值數(shù)據(jù)相關(guān)分析、定序數(shù)據(jù)相關(guān)分析以及定類數(shù)據(jù)相關(guān)分析。77.1.1概念根據(jù)變量特征以及研究背景的不同,可將數(shù)值數(shù)據(jù)相關(guān)分析大致分為簡單相關(guān)分析、復(fù)相關(guān)分析以及偏相關(guān)分析。簡單相關(guān)分析主要研究兩個變量之間的相關(guān)關(guān)系復(fù)相關(guān)分析主要用于研究一個變量與另外兩個以上變量之間的關(guān)系偏相關(guān)分析主要應(yīng)用于控制一個變量的條件下,研究其他變量之間的相關(guān)關(guān)系。87.1.2相關(guān)關(guān)系與函數(shù)關(guān)系

9函數(shù)關(guān)系7.1.2相關(guān)關(guān)系與函數(shù)關(guān)系

10函數(shù)關(guān)系7.1.2相關(guān)關(guān)系與函數(shù)關(guān)系

11相關(guān)關(guān)系7.1.2相關(guān)關(guān)系與函數(shù)關(guān)系在相關(guān)關(guān)系下的散點圖中,觀測點并不全落于某一可觀測的曲線之上,而將落于某一可觀測的曲線周圍。12相關(guān)關(guān)系第2節(jié)定量數(shù)據(jù)相關(guān)1、相關(guān)關(guān)系的描述與測度2、相關(guān)系數(shù)的顯著性檢驗3、偏相關(guān)系數(shù)137.2.1相關(guān)關(guān)系的描述與測度為了更好地對以上問題進行分析。在進行相關(guān)分析時有兩個假定:①變量之間呈線性關(guān)系;②研究的變量都是隨機變量。為了更加直觀地描述變量之間的相關(guān)關(guān)系,通常以散點圖的形式進行變量間關(guān)系的表達。按照觀測值的分布情況,散點圖大致可分為完全正線性相關(guān)、正線性相關(guān)、完全負線性相關(guān)、負線性相關(guān)、非線性相關(guān)和不相關(guān)。14相關(guān)關(guān)系的描述7.2.1相關(guān)關(guān)系的描述與測度157.2.1相關(guān)關(guān)系的描述與測度16【例7.1】銀行在全國各個省份設(shè)有分行,以貸款、咨詢、信托等為主要業(yè)務(wù)賺取營業(yè)收入。為了實現(xiàn)預(yù)期的營業(yè)額漲幅,管理者希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)進行定量分析,從而指定合理的方案,以增加營業(yè)收入。該銀行在30個地區(qū)的分行的年度營業(yè)數(shù)據(jù)。(單位∶百萬元)散點圖的應(yīng)用7.2.1相關(guān)關(guān)系的描述與測度1730家銀行部分?jǐn)?shù)據(jù)展示(教材圖7-4)7.2.1相關(guān)關(guān)系的描述與測度18作出散點圖,如下圖所示通過散點圖,可以清晰地得到營業(yè)收入與營業(yè)支出、營業(yè)收入與資本性支出之間存在的相關(guān)關(guān)系。7.2.1相關(guān)關(guān)系的描述與測度

19相關(guān)關(guān)系的測度7.2.1相關(guān)關(guān)系的描述與測度

20相關(guān)關(guān)系的測度7.2.1相關(guān)關(guān)系的描述與測度

21相關(guān)關(guān)系的測度7.2.1相關(guān)關(guān)系的描述與測度

22相關(guān)系數(shù)五個性質(zhì)7.2.1相關(guān)關(guān)系的描述與測度

237.2.1相關(guān)關(guān)系的描述與測度

247.2.1相關(guān)關(guān)系的描述與測度

25相關(guān)系數(shù)的經(jīng)驗解釋7.2.1相關(guān)關(guān)系的描述與測度【例7.2】例7-1已通過散點圖直觀地得到了銀行營業(yè)收入與營業(yè)支出、營業(yè)收入與資本性支出之間存在的相關(guān)關(guān)系,現(xiàn)我們通過計算相關(guān)系數(shù)來度量它們之間相關(guān)關(guān)系的強度。26相關(guān)系數(shù)的應(yīng)用7.2.1相關(guān)關(guān)系的描述與測度解通過公式可得到如圖所示的結(jié)果。可見,營業(yè)收入與營業(yè)支出的相關(guān)系數(shù)為0.934,營業(yè)收入與資本性支出的相關(guān)系數(shù)為0.975,因此可認(rèn)為營業(yè)收入與營業(yè)支出、資本性支出是密切相關(guān)的。27相關(guān)系數(shù)的應(yīng)用7.2.2相關(guān)系數(shù)的顯著性檢驗

287.2.2相關(guān)系數(shù)的顯著性檢驗

29相關(guān)系數(shù)的分布7.2.2相關(guān)系數(shù)的顯著性檢驗

307.2.2相關(guān)系數(shù)的顯著性檢驗

31分析步驟7.2.2相關(guān)系數(shù)的顯著性檢驗

32

7.2.3偏相關(guān)系數(shù)在一個含有多個要素的系統(tǒng)中,簡單相關(guān)系數(shù)不能夠準(zhǔn)確反映出變量間的相關(guān)關(guān)系,這時候采用偏相關(guān)系數(shù)往往可以得到理想的結(jié)果。例如,研究男性的體重與血壓收縮壓之間的關(guān)系,而血壓收縮壓不僅僅與男性的體重有關(guān),還與年齡、身高等諸多因素相關(guān),因此,在研究的過程中,要排除這些因素的干擾。在不考慮其他變量的基礎(chǔ)上對兩個要素之間的密切程度進行研究,這樣計算得到的數(shù)值稱為偏相關(guān)系數(shù),也稱部分相關(guān)系數(shù)。337.2.3偏相關(guān)系數(shù)

347.2.3偏相關(guān)系數(shù)35偏相關(guān)系數(shù)檢驗

7.2.3偏相關(guān)系數(shù)36偏相關(guān)系數(shù)應(yīng)用【例7.4】某減肥茶銷售商宣稱肥胖將更容易引發(fā)心血管疾病,以此來促進其產(chǎn)品的銷售。為獲得廣告宣傳的理論依據(jù),銷售商欲通過研究體重對收縮壓的影響來討論肥胖與心血管疾病發(fā)病之間的關(guān)系。一般經(jīng)驗認(rèn)為,在人的身高相同的情況下,收縮壓與人的體重和年齡都有關(guān)系?,F(xiàn)銷售商收集了12名身高相同的男子的收縮壓、體重及年齡數(shù)據(jù),7.2.3偏相關(guān)系數(shù)37偏相關(guān)系數(shù)應(yīng)用

78123298612936791213292145348112830671142474125431011574283135417111728851334264109267.2.3偏相關(guān)系數(shù)38偏相關(guān)系數(shù)應(yīng)用

第3節(jié)定序數(shù)據(jù)相關(guān)分析

—Spearman秩相關(guān)系數(shù)39

Spearman秩相關(guān)系數(shù)40它是一個非參數(shù)性質(zhì)(與總體分布無關(guān))的秩統(tǒng)計參數(shù)??捎糜诙攘扛訌V義的單調(diào)關(guān)系(不局限于線性關(guān)系)。斯皮爾曼秩相關(guān)系數(shù)分析定序數(shù)據(jù)的基本思想是在分析數(shù)據(jù)的過程中,將原始數(shù)據(jù)在計量尺度上進行降級,把數(shù)值型數(shù)據(jù)看作品質(zhì)型數(shù)據(jù)來分析,利用原始數(shù)據(jù)的秩來度量變量間的相關(guān)關(guān)系。Spearman秩相關(guān)系數(shù)41

Spearman秩相關(guān)系數(shù)42

Spearman秩相關(guān)系數(shù)檢驗43

Spearman秩相關(guān)系數(shù)應(yīng)用44

Spearman秩相關(guān)系數(shù)應(yīng)用45

第4節(jié)定類數(shù)據(jù)相關(guān)分析

—列聯(lián)表分析

467.4.1列聯(lián)表的定義47

7.4.1列聯(lián)表的定義48121212…1…2….??::?……

7.4.1列聯(lián)表的定義49【例7.6】現(xiàn)某高校欲對大一到大四年級進行教學(xué)改革,此改革將會在一定程度上造成教師的授課模式、學(xué)生的考核方式以及成績評定方法的改變,因此學(xué)校采用抽樣調(diào)查的方法,從大一到大四年級抽取了共500名學(xué)生,以此來了解學(xué)生對改革的看法。調(diào)查結(jié)果如表所示。態(tài)度年級大一大二大三大四合計贊成教學(xué)改革72748581312不贊成教學(xué)改革38465549188合計110120140130500

50

列聯(lián)表的分布

511.觀察值的分布列聯(lián)表的分布態(tài)度年級大一大二大三大四合計贊成教學(xué)改革72748581312行百分?jǐn)?shù)/%

23.123.727.226.062.4列百分?jǐn)?shù)/%65.461.760.762.3—總百分?jǐn)?shù)/%14.414.817.016.2—不贊成教學(xué)改革38465549188行百分?jǐn)?shù)/%0.2024.529.326.137.6列百分?jǐn)?shù)34.638.339.337.7—總百分?jǐn)?shù)/%7.69.211.09.8—合計/%11012014013050022.024.028.026.0100.0

52

列聯(lián)表的分布態(tài)度年級大一大二大三大四合計贊成教學(xué)改革實際頻數(shù)72748581312理論頻數(shù)69758781不贊成教學(xué)改革實際頻數(shù)38465549188理論頻數(shù)41455349合計110120140130500

53

列聯(lián)表獨立性檢驗

54

列聯(lián)表獨立性檢驗

55

列聯(lián)表獨立性檢驗

56【例7.7】某制衣廠商的棉花分別從三個不同地區(qū)采購,按照棉花的馬克隆值(棉花纖維細度與成熟度的綜合指標(biāo))將棉花分為a、b、c等,其中a等品質(zhì)最佳,b等次之,c等品質(zhì)最差?,F(xiàn)從這批棉花中隨機抽取50噸進行檢測,將滿足不同等級的棉花重量分別列入下表中。列聯(lián)表獨立性檢驗的應(yīng)用地區(qū)a等b等c等合計甲地區(qū)145322乙地區(qū)55414丙地區(qū)16714合計20161450

57

列聯(lián)表獨立性檢驗的應(yīng)用地區(qū)a等b等c等合計甲地區(qū)14(8.8)5(7.04)3(6.16)22乙地區(qū)5(5.6)5(4.48)4(3.92)14丙地區(qū)1(5.6)6(4.48)7(3.92)14合計20161450解

58

列聯(lián)表獨立性檢驗的應(yīng)用7.4.3列聯(lián)表中的定性相關(guān)系數(shù)59

60

7.4.3列聯(lián)表中的定性相關(guān)系數(shù)合計合計簡化的2×2列聯(lián)表61

7.4.3列聯(lián)表中的定性相關(guān)系數(shù)62

7.4.3列聯(lián)表中的定性相關(guān)系數(shù)63

7.4.3列聯(lián)表中的定性相關(guān)系數(shù)64

7.4.3列聯(lián)表中的定性相關(guān)系數(shù)65

7.4.3列聯(lián)表中的定性相關(guān)系數(shù)66

7.4.3列聯(lián)表中的定性相關(guān)系數(shù)67

7.4.3列聯(lián)表中的定性相關(guān)系數(shù)68

三個相關(guān)系數(shù)應(yīng)用7.4.3列聯(lián)表中的定性相關(guān)系數(shù)69

7.4.3列聯(lián)表中的定性相關(guān)系數(shù)70

7.4.4列聯(lián)分析應(yīng)注意的問題1.條件百分表的方向71

【例7.9】某教育結(jié)構(gòu)欲研究參加第二課堂對中小學(xué)生在創(chuàng)意大賽中獲獎情況的影響。設(shè)某創(chuàng)意大賽有5100名學(xué)生參加,獲獎的學(xué)生有100名。如果從未獲獎的學(xué)生中抽取2%,即對100名學(xué)生進行研究,則用相同比例從獲獎學(xué)生中抽取的樣本容量僅為2人。為滿足研究的需要,現(xiàn)對獲獎學(xué)生的抽樣比擴大到1/2,即抽取50人。目前調(diào)查結(jié)果如表所示。7.4.4列聯(lián)分析應(yīng)注意的問題1.條件百分表的方向727.4.4列聯(lián)分析應(yīng)注意的問題學(xué)生獲獎情況學(xué)生參加第二課堂的情況合計不曾參加第二課堂曾參加第二課堂獲獎173350未獲獎5446100合計7179150學(xué)生參加第二課堂與創(chuàng)意大賽獲獎情況學(xué)生獲獎情況學(xué)生參加第二課堂的情況合計不曾參加第二課堂曾參加第二課堂獲獎23.94%41.77%50未獲獎76.06%58.23%100合計7179150按學(xué)生參加第二課堂情況計算的百分表學(xué)生參加第二課堂的情況學(xué)生獲獎情況合計獲獎未獲獎不曾參加第二課堂34%54%71曾參加第二課堂66%46%79合計50100150按學(xué)生獲獎情況計算的條件百分表12737.4.4列聯(lián)分析應(yīng)注意的問題學(xué)生獲獎情況學(xué)生參加第二課堂的情況合計不曾參加第二課堂曾參加第二課堂獲獎23.94%41.77%50未獲獎76.06%58.23%100合計7179150按學(xué)生參加第二課堂情況計算的百分表學(xué)生參加第二課堂的情況學(xué)生獲獎情況合計獲獎未獲獎不曾參加第二課堂34%54%71曾參加第二課堂66%46%79合計50100150按學(xué)生獲獎情況計算的條件百分表1對比表1、表2可以發(fā)現(xiàn),學(xué)生參加第二課堂情況與獲獎情況應(yīng)存在因果關(guān)系,且學(xué)生參加第二課堂情況為自變量,學(xué)生獲獎情況為因變量。若單元中以自變量方向計算條件百分?jǐn)?shù),表2比表1更加能夠直觀地表現(xiàn)出參加第二課堂對學(xué)生獲獎情況的影響。274(1)當(dāng)數(shù)據(jù)劃分為兩類時,通常要求每一類別的理論頻數(shù)不少于5。例如,被調(diào)查者按照以往病史被分為未曾患過百日咳和患過百日咳兩類,其中,患過百日咳的人數(shù)的理論頻數(shù)小于5,因此不宜進行列聯(lián)分析。7.4.4列聯(lián)分析應(yīng)注意的問題

以往病史未曾患過百日咳532531患過百日咳5475(2)當(dāng)數(shù)據(jù)被劃分為兩個以上類別時,通常要求每一類別的理論頻數(shù)小于5的比例不應(yīng)超過20%,否則我們應(yīng)將理論頻數(shù)小于5的類別與相鄰的類別合并。

例如,數(shù)據(jù)分為A、B、C、D、E和F類,其中,D類數(shù)據(jù)的理論頻數(shù)為4小于5,但由于在該列聯(lián)表中理論頻數(shù)小于5的類別個數(shù)占比小于20%,因此我們依然可以對其直接進行分析。7.4.4列聯(lián)分析應(yīng)注意的問題

類別A2826B4947C1823D64E9288F2025合計21321376我們可以看到類別E、F和G類別的理論頻數(shù)小于5,且在該列聯(lián)表中,理論頻數(shù)小于5的類別個數(shù)占比超過20%,因此我們需要將類別E、F和G合并后再進行列聯(lián)分析。7.4.4列聯(lián)分析應(yīng)注意的問題

類別A3032B110113C8687D2324E52F54G41合計21321377第一步將時間以早上0點為原點進行排序并將排序后的序號代替每組中的時間數(shù)據(jù),寫入SPSS中,截取部分?jǐn)?shù)據(jù)如下。第5節(jié)SPSS使用舉例引入案例分析:短視頻獲贊數(shù)與發(fā)表時間之間的關(guān)系78第二步選擇【分析】→【相關(guān)】→【雙變量】,將左側(cè)框內(nèi)【時刻】及【獲贊總數(shù)】選入【變量】框中,在【相關(guān)系數(shù)】一欄選中【斯皮爾曼】,在【顯著性檢驗】一欄中選中雙尾】、并在最后勾選【標(biāo)記顯著性相關(guān)性】,點擊【確定】,即可得到如表所示的分析結(jié)果。第5節(jié)SPSS使用舉例79第二步選擇【分析】→【相關(guān)】→【雙變量】,將左側(cè)框內(nèi)【時刻】及【獲贊總數(shù)】選入【變量】框中,在【相關(guān)系數(shù)】一欄選中【斯皮爾曼】,在【顯著性檢驗】一欄中選中雙尾】、并在最后勾選【標(biāo)記顯著性相關(guān)性】,點擊【確定】,即可得到如表所示的分析結(jié)果。第5節(jié)SPSS使用舉例由輸出結(jié)果可知相關(guān)系數(shù)為0.664,且P值小于顯著性水平0.05,因此我們拒絕零假設(shè),認(rèn)為短視頻在24小時內(nèi)的獲贊數(shù)與發(fā)表時間顯著相關(guān),這與例7.4中的結(jié)論是一致的。時刻獲贊總數(shù)斯皮爾曼Rho時刻相關(guān)系數(shù)1.0000.664*Sig.(雙尾)0.0000.000N

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論