統(tǒng)計學原理( 相關分析)_第1頁
統(tǒng)計學原理( 相關分析)_第2頁
統(tǒng)計學原理( 相關分析)_第3頁
統(tǒng)計學原理( 相關分析)_第4頁
統(tǒng)計學原理( 相關分析)_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

統(tǒng)計學原理

第七章

相關分析1《統(tǒng)計學原理》劉鑫春法蘭西斯·高爾頓(FrancisGalton,1822.2.16-1911.1.17.)法蘭西斯·高爾頓是查爾斯·達爾文的的表兄,是一名英格蘭維多利亞時代的文藝復興人、人類學家、優(yōu)生學家、熱帶探險家、地理學家、發(fā)明家、氣象學家、統(tǒng)計學家、心理學家和遺傳學家。高爾頓一生中發(fā)表了超過340篇的報告和書籍,他在1909年被授與爵士。他在1883年率先使用“優(yōu)生學”(eugenics)一詞。在他于1869年的著作《遺傳的天才》(HereditaryGenius)中,高爾頓主張人類的才能是能夠透過遺傳延續(xù)的。他在統(tǒng)計學方面也有貢獻,高爾頓在1877年發(fā)表關于種子的研究結果,指出回歸到平均值(regressiontowardthemean)現(xiàn)象的存在,這個概念與現(xiàn)代統(tǒng)計學中的“回歸”并不相同,但是卻是回歸一詞的起源。在此后的研究中,高爾頓第一次使用了相關系數(shù)(correlationcoefficient)的概念。他使用字母“r”來表示相關系數(shù),這個傳統(tǒng)一直延續(xù)至今。同時他也發(fā)表了關于指紋的論文和書籍,被認為對于現(xiàn)代利用指紋進行犯罪搜查方面有很大的貢獻。2《統(tǒng)計學原理》劉鑫春卡爾.皮爾遜(Karl,Pearson,1857-1936)英國統(tǒng)計學家。他的座右銘“我們無知,因此讓我們努力”。他入劍橋大學學習數(shù)學、物理、哲學、宗教和法律,并取得律師資格,但以數(shù)學的優(yōu)異成績在該校畢業(yè)。任倫敦大學應用數(shù)學教授時出版了論彈性以及有關科學哲學的專著

因閱讀英國科學家f.高爾頓《自然遺傳》(1889)一書,使其深受影響,從而成為高勻頓的忠實學生,開始結合高爾頓關于人的變異、遺傳和優(yōu)生學等問題來發(fā)展統(tǒng)計學的理論和方法。1894年起研究生物分布的常態(tài)性。1901年與高爾頓、w.f.r.韋爾登聯(lián)合創(chuàng)辦《生物統(tǒng)計學》雜志,發(fā)表有關生物學及心理學的定量研究成果。1904年被任命為倫敦大學高爾頓實驗室的首任主任,且第一個開設優(yōu)生學講座。1914-1930年撰寫寫出四卷本的高爾頓傳記《弗朗西斯·高爾頓的生平、學問和勞作》。皮爾遜的統(tǒng)計學的分析技術和方法,體現(xiàn)在其《統(tǒng)計學者和生物統(tǒng)計學者用表》(1914)中,如頻率分布、偏差度和峭度測量、軸線擬合、標準差檢驗、相依系數(shù)、乘積動差相關系數(shù)r、類型的數(shù)學公式、雙行、多重、多變元非線性相關和概差偏差數(shù),以及各種統(tǒng)計學的抽樣分布等。他還發(fā)明了主要成分分析,后由c.e.斯皮爾曼發(fā)展成心理統(tǒng)計學的因素分析。皮爾遜被稱為統(tǒng)計科學的奠基者。他把數(shù)學和統(tǒng)計學方法運用于生物問題,創(chuàng)建了生物統(tǒng)計學,且與高爾頓共同確定了心理問題的統(tǒng)計法為心理學的基本方法之一。他對生物、行為和社會科學的研究作出了較重的貢獻。3《統(tǒng)計學原理》劉鑫春第七章第一節(jié)第一節(jié)相關分析的意義和種類一、相關關系的性質(zhì)

相關關系的概念和特點概念:相關關系是現(xiàn)象間客觀存在的,但其數(shù)值是不嚴格、不完全確定的相互依存關系。注意:現(xiàn)象間可測定關系一般分為兩種:一種為函數(shù)關系,另一種為相關關系。相關關系指現(xiàn)象之間客觀存在但又不具有確定性的依存關系。4《統(tǒng)計學原理》劉鑫春第七章第一節(jié)特點:現(xiàn)象之間確實存在數(shù)量上的相互依存關系。注意:在表現(xiàn)現(xiàn)象相互依存關系的兩個變量之中作為根據(jù)的變量叫做自變量,隨自變量變化發(fā)生對應變化的變量叫做因變量。

現(xiàn)象之間數(shù)量上不確定、不嚴格的依存關系。注意:相關關系的全稱為統(tǒng)計相關關系,相關關系中一個變量雖然受另一個(或一組)變量的影響,卻并不由這一個(或一組)變量完全確定。

5《統(tǒng)計學原理》劉鑫春第七章第一節(jié)相關關系與函數(shù)關系的區(qū)別和聯(lián)系

(教材312)區(qū)別:函數(shù)關系是變量之間的一種嚴格、完全確定性的關系,即一個變量的數(shù)值完全有另一個(或一組)變量的數(shù)值所決定、控制。通??梢杂脭?shù)學公式確切地表示出來。相關關系一般不是完全確定的,它很難用數(shù)學公式去進行表達。聯(lián)系:函數(shù)關系在實際工作中往往通過相關關系表現(xiàn)出來。當人們對某些現(xiàn)象內(nèi)部規(guī)律有較深刻認識時,相關關系可能變?yōu)楹瘮?shù)關系。為此,在研究相關關系時,又常常使用函數(shù)關系作為工具,用一定的函數(shù)關系表現(xiàn)相關關系的數(shù)量聯(lián)系。6《統(tǒng)計學原理》劉鑫春第七章第一節(jié)二、相關關系的種類

根據(jù)自變量的多少劃分,可分為單相關和復相關

根據(jù)變量間相互關系的表現(xiàn)形式劃分,直線相關(或線性相關)和曲線(或非線性)相關根據(jù)相關關系的方向劃分,可分為正相關和負相關

根據(jù)相關關系的程度劃分,可分為不相關、完全相關和不完全相關7《統(tǒng)計學原理》劉鑫春第七章第一節(jié)三、相關分析的主要內(nèi)容

揭示現(xiàn)象之間是否存在相關關系,以及相關關系的表現(xiàn)形式。確定現(xiàn)象變量間相關關系的密切程度和方向。選擇合適的數(shù)學模型測定變量估計值的可靠程度對計算出的相關系數(shù),進行顯著檢驗。8《統(tǒng)計學原理》劉鑫春第七章第二節(jié)第二節(jié)簡單線性相關分析一、定性分析定性分析是相關分析的起點,即研究者根據(jù)自己的專業(yè)知識,理論水平,實踐經(jīng)驗和邏輯推斷來分析和判斷事物之間有無相關,是何種相關。9《統(tǒng)計學原理》劉鑫春第七章第二節(jié)相關圖:相關圖又叫散布圖或散點圖,是利用直角坐標第一象限,用橫軸表示自變量,縱軸表示因變量,將兩變量對應的值用坐標點描繪出來,據(jù)以研究兩變量間有無相關關系,及相關的形態(tài),方向和密切程度。

利用EXCEL展示如何繪制散點圖10《統(tǒng)計學原理》劉鑫春第七章第二節(jié)

有8個企業(yè)生產(chǎn)某種產(chǎn)品,月產(chǎn)量和生產(chǎn)費用的資料如下:企業(yè)編號12345678月產(chǎn)量(千噸)x生產(chǎn)費用(萬元)y1.2622.0863.1803.81105.01156.11327.21358.016011《統(tǒng)計學原理》劉鑫春第七章第二節(jié)相關表是表現(xiàn)現(xiàn)象間相關關系的一種統(tǒng)計表。它一般以x為自變量,以y為因變量,將自變量和因變量的數(shù)值在表格中一一對應地排列,用以初步反映相關關系的形式,密切程度和相關方向。

簡單相關表:對于未分組資料,直接將自變量的數(shù)值按大小順序排列,并配合其相對應的因變量的數(shù)值所形成的相關表。12《統(tǒng)計學原理》劉鑫春

產(chǎn)品產(chǎn)量和生產(chǎn)費用相關表從上表看出,產(chǎn)品產(chǎn)量和生產(chǎn)費用之間的關系雖然不十分嚴格,但有直線相關的趨勢,而且大致可以看出關系比較密切第七章第二節(jié)序號產(chǎn)品產(chǎn)量(千噸)x生產(chǎn)費用(萬元)y123456781.22.03.13.85.06.17.28.0628680110115132135160合計36.488013《統(tǒng)計學原理》劉鑫春第七章第二節(jié)分組相關表:當原始資料很多,運用簡單相關表存在困難時,一般將資料進行分組,然后編制分組相關表

單變量分組表:對自變量進行分組,計算出各組次數(shù)和因變量組平均數(shù),并在此基礎是編制相關表。雙變量分組表:對自變量和因變量都進行分組,對兩變量的分組交叉形成棋盤表式,計算棋盤表式中每一組的次數(shù),將其填入表格。

14《統(tǒng)計學原理》劉鑫春第七章第二節(jié)

400個女大學生身高和體重相關表按體重分組(千克)人數(shù)(人)每組平均身高(厘米)62.5以上60~62.557.5~6055~57.552.5~5550~52.547.5~5045~47.545以下2325388712991241170167163162160158155154151合計400——15《統(tǒng)計學原理》劉鑫春第七章第二節(jié)400個女大學生身高和體重相關表按體重分組(千克)按身高分組(厘米)150以下150~154154~158158~162162~166166~170170及以上合計62.5以上60~62.557.5~6055~57.552.5~5550~52.547.5~5045~47.545以下322338243012420422861628452010714251210238842325388712991241合計597494125682540016《統(tǒng)計學原理》劉鑫春第七章第二節(jié)二、定量分析——測定與運用相關系數(shù)r積差法:其中:r——相關系數(shù)

——x和y的協(xié)方差17《統(tǒng)計學原理》劉鑫春第七章第二節(jié)簡捷計算公式:已知均值和標準差時:或:18《統(tǒng)計學原理》劉鑫春第七章第二節(jié)三、相關系數(shù)的密切程度相關系數(shù)的范圍在-1到1之間,即1≤r≤1,當r=1為完全正相關,r=-1,為完全負相關,r=0為不相關。r的范圍在0.3-0.5是低度相關;r的范圍在0.5-0.8是顯著相關;r的范圍在0.8以上是高度相關。19《統(tǒng)計學原理》劉鑫春第七章第三節(jié)第三節(jié)直線回歸分析一、回歸分析的概念概念:就是對具有相關關系的變量之間的數(shù)量關系進行測定,確定一個相應的數(shù)學表達式?;貧w分析的種類按自變量X的多少,可以分為一元回歸和多元回歸按Y與X曲線的形式,可以分為直線回歸和曲線回歸20《統(tǒng)計學原理》劉鑫春第七章第三節(jié)“回歸的淵源”“回歸”一詞是英國生物學家高爾登首先提出的。高爾登在研究父母親身高和子女身高的關系時發(fā)現(xiàn):身材特別高的父母所生的孩子其身材并非特別高,而身材特別矮的父母所生孩子的身材也并非特別矮,子輩身高有向父輩平均身高逼近的趨向,他把這種現(xiàn)象叫做“身高數(shù)值從一極端至另一極端的回歸”。以后,高爾頓的學生皮爾遜把回歸的概念同數(shù)學的方法聯(lián)系起來,把代表現(xiàn)象之間一般數(shù)量關系的統(tǒng)計模型叫做回歸直線或回歸曲線,從此誕生了統(tǒng)計上著名的回歸理論。21《統(tǒng)計學原理》劉鑫春第七章第三節(jié)二、簡單直線回歸分析簡單直線回歸分析的特點在兩個變量之間,必須確定哪個是自變量X,哪個是因變量Y回歸方程的主要作用是用自變量來推算因變量。在兩個現(xiàn)象互為根據(jù)的情況下,可以有兩個回歸方程-Y倚X回歸方程和X倚Y回歸方程。22《統(tǒng)計學原理》劉鑫春第七章第三節(jié)兩種情況下的回歸方程為:Y倚x回歸方程:X倚y回歸方程:其中:a和c式兩條直線的截距,b和d式兩條直線的回歸系數(shù)。23《統(tǒng)計學原理》劉鑫春第七章第三節(jié)簡單直線回歸方程的確定

設y為實際值,yc為估計值,現(xiàn)在要用一條直線

擬合實際值,而且要滿足

為最小。由最小平方原理,可得:24《統(tǒng)計學原理》劉鑫春第七章第三節(jié)注意:回顧動態(tài)數(shù)列中長期趨勢測定問題中用到的最小平方法在直線方程中,自變量為時間,因變量為各個時間上對應的指標值,得到方程組:通過巧取T值,使得∑T=0,講方程組簡化,得到:25《統(tǒng)計學原理》劉鑫春第七章第三節(jié)如果已用積差法計算了相關系數(shù),有相應的資料,也可以用以下公式:如果知道xy的協(xié)方差和自變量的標準差,b也可以:26《統(tǒng)計學原理》劉鑫春第七章第三節(jié)估計標準誤差概念:估計標準誤差就是用來說明回歸方程推算結果的準確程度的統(tǒng)計分析指標,或者說是反映回歸直線代表性大小的統(tǒng)計分析指標。

27《統(tǒng)計學原理》劉鑫春第七章第三節(jié)簡單直線回歸估計標準誤差的測定根據(jù)因變量實際值和估計值的離差計算根據(jù)a,b兩個參數(shù)值計算估計標準誤差

28《統(tǒng)計學原理》劉鑫春第七章

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論