統(tǒng)計學(xué)原理( 相關(guān)分析)_第1頁
統(tǒng)計學(xué)原理( 相關(guān)分析)_第2頁
統(tǒng)計學(xué)原理( 相關(guān)分析)_第3頁
統(tǒng)計學(xué)原理( 相關(guān)分析)_第4頁
統(tǒng)計學(xué)原理( 相關(guān)分析)_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學(xué)原理

第七章

相關(guān)分析1《統(tǒng)計學(xué)原理》劉鑫春法蘭西斯·高爾頓(FrancisGalton,1822.2.16-1911.1.17.)法蘭西斯·高爾頓是查爾斯·達爾文的的表兄,是一名英格蘭維多利亞時代的文藝復(fù)興人、人類學(xué)家、優(yōu)生學(xué)家、熱帶探險家、地理學(xué)家、發(fā)明家、氣象學(xué)家、統(tǒng)計學(xué)家、心理學(xué)家和遺傳學(xué)家。高爾頓一生中發(fā)表了超過340篇的報告和書籍,他在1909年被授與爵士。他在1883年率先使用“優(yōu)生學(xué)”(eugenics)一詞。在他于1869年的著作《遺傳的天才》(HereditaryGenius)中,高爾頓主張人類的才能是能夠透過遺傳延續(xù)的。他在統(tǒng)計學(xué)方面也有貢獻,高爾頓在1877年發(fā)表關(guān)于種子的研究結(jié)果,指出回歸到平均值(regressiontowardthemean)現(xiàn)象的存在,這個概念與現(xiàn)代統(tǒng)計學(xué)中的“回歸”并不相同,但是卻是回歸一詞的起源。在此后的研究中,高爾頓第一次使用了相關(guān)系數(shù)(correlationcoefficient)的概念。他使用字母“r”來表示相關(guān)系數(shù),這個傳統(tǒng)一直延續(xù)至今。同時他也發(fā)表了關(guān)于指紋的論文和書籍,被認為對于現(xiàn)代利用指紋進行犯罪搜查方面有很大的貢獻。2《統(tǒng)計學(xué)原理》劉鑫春卡爾.皮爾遜(Karl,Pearson,1857-1936)英國統(tǒng)計學(xué)家。他的座右銘“我們無知,因此讓我們努力”。他入劍橋大學(xué)學(xué)習(xí)數(shù)學(xué)、物理、哲學(xué)、宗教和法律,并取得律師資格,但以數(shù)學(xué)的優(yōu)異成績在該校畢業(yè)。任倫敦大學(xué)應(yīng)用數(shù)學(xué)教授時出版了論彈性以及有關(guān)科學(xué)哲學(xué)的專著

因閱讀英國科學(xué)家f.高爾頓《自然遺傳》(1889)一書,使其深受影響,從而成為高勻頓的忠實學(xué)生,開始結(jié)合高爾頓關(guān)于人的變異、遺傳和優(yōu)生學(xué)等問題來發(fā)展統(tǒng)計學(xué)的理論和方法。1894年起研究生物分布的常態(tài)性。1901年與高爾頓、w.f.r.韋爾登聯(lián)合創(chuàng)辦《生物統(tǒng)計學(xué)》雜志,發(fā)表有關(guān)生物學(xué)及心理學(xué)的定量研究成果。1904年被任命為倫敦大學(xué)高爾頓實驗室的首任主任,且第一個開設(shè)優(yōu)生學(xué)講座。1914-1930年撰寫寫出四卷本的高爾頓傳記《弗朗西斯·高爾頓的生平、學(xué)問和勞作》。皮爾遜的統(tǒng)計學(xué)的分析技術(shù)和方法,體現(xiàn)在其《統(tǒng)計學(xué)者和生物統(tǒng)計學(xué)者用表》(1914)中,如頻率分布、偏差度和峭度測量、軸線擬合、標準差檢驗、相依系數(shù)、乘積動差相關(guān)系數(shù)r、類型的數(shù)學(xué)公式、雙行、多重、多變元非線性相關(guān)和概差偏差數(shù),以及各種統(tǒng)計學(xué)的抽樣分布等。他還發(fā)明了主要成分分析,后由c.e.斯皮爾曼發(fā)展成心理統(tǒng)計學(xué)的因素分析。皮爾遜被稱為統(tǒng)計科學(xué)的奠基者。他把數(shù)學(xué)和統(tǒng)計學(xué)方法運用于生物問題,創(chuàng)建了生物統(tǒng)計學(xué),且與高爾頓共同確定了心理問題的統(tǒng)計法為心理學(xué)的基本方法之一。他對生物、行為和社會科學(xué)的研究作出了較重的貢獻。3《統(tǒng)計學(xué)原理》劉鑫春第七章第一節(jié)第一節(jié)相關(guān)分析的意義和種類一、相關(guān)關(guān)系的性質(zhì)

相關(guān)關(guān)系的概念和特點概念:相關(guān)關(guān)系是現(xiàn)象間客觀存在的,但其數(shù)值是不嚴格、不完全確定的相互依存關(guān)系。注意:現(xiàn)象間可測定關(guān)系一般分為兩種:一種為函數(shù)關(guān)系,另一種為相關(guān)關(guān)系。相關(guān)關(guān)系指現(xiàn)象之間客觀存在但又不具有確定性的依存關(guān)系。4《統(tǒng)計學(xué)原理》劉鑫春第七章第一節(jié)特點:現(xiàn)象之間確實存在數(shù)量上的相互依存關(guān)系。注意:在表現(xiàn)現(xiàn)象相互依存關(guān)系的兩個變量之中作為根據(jù)的變量叫做自變量,隨自變量變化發(fā)生對應(yīng)變化的變量叫做因變量。

現(xiàn)象之間數(shù)量上不確定、不嚴格的依存關(guān)系。注意:相關(guān)關(guān)系的全稱為統(tǒng)計相關(guān)關(guān)系,相關(guān)關(guān)系中一個變量雖然受另一個(或一組)變量的影響,卻并不由這一個(或一組)變量完全確定。

5《統(tǒng)計學(xué)原理》劉鑫春第七章第一節(jié)相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別和聯(lián)系

(教材312)區(qū)別:函數(shù)關(guān)系是變量之間的一種嚴格、完全確定性的關(guān)系,即一個變量的數(shù)值完全有另一個(或一組)變量的數(shù)值所決定、控制。通??梢杂脭?shù)學(xué)公式確切地表示出來。相關(guān)關(guān)系一般不是完全確定的,它很難用數(shù)學(xué)公式去進行表達。聯(lián)系:函數(shù)關(guān)系在實際工作中往往通過相關(guān)關(guān)系表現(xiàn)出來。當人們對某些現(xiàn)象內(nèi)部規(guī)律有較深刻認識時,相關(guān)關(guān)系可能變?yōu)楹瘮?shù)關(guān)系。為此,在研究相關(guān)關(guān)系時,又常常使用函數(shù)關(guān)系作為工具,用一定的函數(shù)關(guān)系表現(xiàn)相關(guān)關(guān)系的數(shù)量聯(lián)系。6《統(tǒng)計學(xué)原理》劉鑫春第七章第一節(jié)二、相關(guān)關(guān)系的種類

根據(jù)自變量的多少劃分,可分為單相關(guān)和復(fù)相關(guān)

根據(jù)變量間相互關(guān)系的表現(xiàn)形式劃分,直線相關(guān)(或線性相關(guān))和曲線(或非線性)相關(guān)根據(jù)相關(guān)關(guān)系的方向劃分,可分為正相關(guān)和負相關(guān)

根據(jù)相關(guān)關(guān)系的程度劃分,可分為不相關(guān)、完全相關(guān)和不完全相關(guān)7《統(tǒng)計學(xué)原理》劉鑫春第七章第一節(jié)三、相關(guān)分析的主要內(nèi)容

揭示現(xiàn)象之間是否存在相關(guān)關(guān)系,以及相關(guān)關(guān)系的表現(xiàn)形式。確定現(xiàn)象變量間相關(guān)關(guān)系的密切程度和方向。選擇合適的數(shù)學(xué)模型測定變量估計值的可靠程度對計算出的相關(guān)系數(shù),進行顯著檢驗。8《統(tǒng)計學(xué)原理》劉鑫春第七章第二節(jié)第二節(jié)簡單線性相關(guān)分析一、定性分析定性分析是相關(guān)分析的起點,即研究者根據(jù)自己的專業(yè)知識,理論水平,實踐經(jīng)驗和邏輯推斷來分析和判斷事物之間有無相關(guān),是何種相關(guān)。9《統(tǒng)計學(xué)原理》劉鑫春第七章第二節(jié)相關(guān)圖:相關(guān)圖又叫散布圖或散點圖,是利用直角坐標第一象限,用橫軸表示自變量,縱軸表示因變量,將兩變量對應(yīng)的值用坐標點描繪出來,據(jù)以研究兩變量間有無相關(guān)關(guān)系,及相關(guān)的形態(tài),方向和密切程度。

利用EXCEL展示如何繪制散點圖10《統(tǒng)計學(xué)原理》劉鑫春第七章第二節(jié)

有8個企業(yè)生產(chǎn)某種產(chǎn)品,月產(chǎn)量和生產(chǎn)費用的資料如下:企業(yè)編號12345678月產(chǎn)量(千噸)x生產(chǎn)費用(萬元)y1.2622.0863.1803.81105.01156.11327.21358.016011《統(tǒng)計學(xué)原理》劉鑫春第七章第二節(jié)相關(guān)表是表現(xiàn)現(xiàn)象間相關(guān)關(guān)系的一種統(tǒng)計表。它一般以x為自變量,以y為因變量,將自變量和因變量的數(shù)值在表格中一一對應(yīng)地排列,用以初步反映相關(guān)關(guān)系的形式,密切程度和相關(guān)方向。

簡單相關(guān)表:對于未分組資料,直接將自變量的數(shù)值按大小順序排列,并配合其相對應(yīng)的因變量的數(shù)值所形成的相關(guān)表。12《統(tǒng)計學(xué)原理》劉鑫春

產(chǎn)品產(chǎn)量和生產(chǎn)費用相關(guān)表從上表看出,產(chǎn)品產(chǎn)量和生產(chǎn)費用之間的關(guān)系雖然不十分嚴格,但有直線相關(guān)的趨勢,而且大致可以看出關(guān)系比較密切第七章第二節(jié)序號產(chǎn)品產(chǎn)量(千噸)x生產(chǎn)費用(萬元)y123456781.22.03.13.85.06.17.28.0628680110115132135160合計36.488013《統(tǒng)計學(xué)原理》劉鑫春第七章第二節(jié)分組相關(guān)表:當原始資料很多,運用簡單相關(guān)表存在困難時,一般將資料進行分組,然后編制分組相關(guān)表

單變量分組表:對自變量進行分組,計算出各組次數(shù)和因變量組平均數(shù),并在此基礎(chǔ)是編制相關(guān)表。雙變量分組表:對自變量和因變量都進行分組,對兩變量的分組交叉形成棋盤表式,計算棋盤表式中每一組的次數(shù),將其填入表格。

14《統(tǒng)計學(xué)原理》劉鑫春第七章第二節(jié)

400個女大學(xué)生身高和體重相關(guān)表按體重分組(千克)人數(shù)(人)每組平均身高(厘米)62.5以上60~62.557.5~6055~57.552.5~5550~52.547.5~5045~47.545以下2325388712991241170167163162160158155154151合計400——15《統(tǒng)計學(xué)原理》劉鑫春第七章第二節(jié)400個女大學(xué)生身高和體重相關(guān)表按體重分組(千克)按身高分組(厘米)150以下150~154154~158158~162162~166166~170170及以上合計62.5以上60~62.557.5~6055~57.552.5~5550~52.547.5~5045~47.545以下322338243012420422861628452010714251210238842325388712991241合計597494125682540016《統(tǒng)計學(xué)原理》劉鑫春第七章第二節(jié)二、定量分析——測定與運用相關(guān)系數(shù)r積差法:其中:r——相關(guān)系數(shù)

——x和y的協(xié)方差17《統(tǒng)計學(xué)原理》劉鑫春第七章第二節(jié)簡捷計算公式:已知均值和標準差時:或:18《統(tǒng)計學(xué)原理》劉鑫春第七章第二節(jié)三、相關(guān)系數(shù)的密切程度相關(guān)系數(shù)的范圍在-1到1之間,即1≤r≤1,當r=1為完全正相關(guān),r=-1,為完全負相關(guān),r=0為不相關(guān)。r的范圍在0.3-0.5是低度相關(guān);r的范圍在0.5-0.8是顯著相關(guān);r的范圍在0.8以上是高度相關(guān)。19《統(tǒng)計學(xué)原理》劉鑫春第七章第三節(jié)第三節(jié)直線回歸分析一、回歸分析的概念概念:就是對具有相關(guān)關(guān)系的變量之間的數(shù)量關(guān)系進行測定,確定一個相應(yīng)的數(shù)學(xué)表達式?;貧w分析的種類按自變量X的多少,可以分為一元回歸和多元回歸按Y與X曲線的形式,可以分為直線回歸和曲線回歸20《統(tǒng)計學(xué)原理》劉鑫春第七章第三節(jié)“回歸的淵源”“回歸”一詞是英國生物學(xué)家高爾登首先提出的。高爾登在研究父母親身高和子女身高的關(guān)系時發(fā)現(xiàn):身材特別高的父母所生的孩子其身材并非特別高,而身材特別矮的父母所生孩子的身材也并非特別矮,子輩身高有向父輩平均身高逼近的趨向,他把這種現(xiàn)象叫做“身高數(shù)值從一極端至另一極端的回歸”。以后,高爾頓的學(xué)生皮爾遜把回歸的概念同數(shù)學(xué)的方法聯(lián)系起來,把代表現(xiàn)象之間一般數(shù)量關(guān)系的統(tǒng)計模型叫做回歸直線或回歸曲線,從此誕生了統(tǒng)計上著名的回歸理論。21《統(tǒng)計學(xué)原理》劉鑫春第七章第三節(jié)二、簡單直線回歸分析簡單直線回歸分析的特點在兩個變量之間,必須確定哪個是自變量X,哪個是因變量Y回歸方程的主要作用是用自變量來推算因變量。在兩個現(xiàn)象互為根據(jù)的情況下,可以有兩個回歸方程-Y倚X回歸方程和X倚Y回歸方程。22《統(tǒng)計學(xué)原理》劉鑫春第七章第三節(jié)兩種情況下的回歸方程為:Y倚x回歸方程:X倚y回歸方程:其中:a和c式兩條直線的截距,b和d式兩條直線的回歸系數(shù)。23《統(tǒng)計學(xué)原理》劉鑫春第七章第三節(jié)簡單直線回歸方程的確定

設(shè)y為實際值,yc為估計值,現(xiàn)在要用一條直線

擬合實際值,而且要滿足

為最小。由最小平方原理,可得:24《統(tǒng)計學(xué)原理》劉鑫春第七章第三節(jié)注意:回顧動態(tài)數(shù)列中長期趨勢測定問題中用到的最小平方法在直線方程中,自變量為時間,因變量為各個時間上對應(yīng)的指標值,得到方程組:通過巧取T值,使得∑T=0,講方程組簡化,得到:25《統(tǒng)計學(xué)原理》劉鑫春第七章第三節(jié)如果已用積差法計算了相關(guān)系數(shù),有相應(yīng)的資料,也可以用以下公式:如果知道xy的協(xié)方差和自變量的標準差,b也可以:26《統(tǒng)計學(xué)原理》劉鑫春第七章第三節(jié)估計標準誤差概念:估計標準誤差就是用來說明回歸方程推算結(jié)果的準確程度的統(tǒng)計分析指標,或者說是反映回歸直線代表性大小的統(tǒng)計分析指標。

27《統(tǒng)計學(xué)原理》劉鑫春第七章第三節(jié)簡單直線回歸估計標準誤差的測定根據(jù)因變量實際值和估計值的離差計算根據(jù)a,b兩個參數(shù)值計算估計標準誤差

28《統(tǒng)計學(xué)原理》劉鑫春第七章

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論