第十二章相關與回歸分析_第1頁
第十二章相關與回歸分析_第2頁
第十二章相關與回歸分析_第3頁
第十二章相關與回歸分析_第4頁
第十二章相關與回歸分析_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第十二章 相關與回歸分析第一節(jié) 變量之間的相關關系相關程度與方向·因果關系與對稱關系第二節(jié) 定類變量的相關雙變量交互分類(列聯(lián)表)·削減誤差比例(PRE)·系數與系數第三節(jié) 定序變量的相關分析同序對、異序對和同分對·Gamma系數·肯德爾等級相關系數(a系數、b與c系數)·薩默斯系數(d系數)·斯皮爾曼等級相關(相關)·肯德爾和諧系數第四節(jié) 定距變量的相關分析相關表和相關圖·積差系數的導出和計算·積差系數的性質第五節(jié) 回歸分析線性回歸·積差系數的PRE性質·相關指數R第六節(jié)

2、曲線相關與回歸可線性化的非線性函數·實例分析(二次曲線指數曲線)一、填空1對于表現為因果關系的相關關系來說,自變量一般都是確定性變量,依變量則一般是(隨機性)變量。2變量間的相關程度,可以用不知Y與X有關系時預測Y的全部誤差E1,減去知道Y與X有關系時預測Y的聯(lián)系誤差E2,再將其化為比例來度量,這就是( 削減誤差比例 )。3依據數理統(tǒng)計原理,在樣本容量較大的情況下,可以作出以下兩個假定:(1)實際觀察值Y圍繞每個估計值是服從( );(2)分布中圍繞每個可能的值的( )是相同的。4在數量上表現為現象依存關系的兩個變量,通常稱為自變量和因變量。自變量是作為( 變化根據 )的變量,因變量是

3、隨( 自變量 )的變化而發(fā)生相應變化的變量。5根據資料,分析現象之間是否存在相關關系,其表現形式或類型如何,并對具有相關關系的現象之間數量變化的議案關系進行測定,即建立一個相關的數學表達式,稱為( 回歸方程 ),并據以進行估計和預測。這種分析方法,通常又稱為( 回歸分析 )。6積差系數r是( 協(xié)方差 )與X和Y的標準差的乘積之比。二、單項選擇1當x按一定數額增加時,y也近似地按一定數額隨之增加,那么可以說x與y之間存在(A)關系。A直線正相關 B直線負相關 C曲線正相關 D曲線負相關2評價直線相關關系的密切程度,當r在0.50.8之間時,表示( C )。A無相關B低度相關 C中等相關 D高度相

4、關3相關分析和回歸分析相輔相成,又各有特點,下面正確的描述有( D )。A在相關分析中,相關的兩變量都不是隨機的;B在回歸分析中,自變量是隨機的,因變量不是隨機的;C在回歸分析中,因變量和自變量都是隨機的;D在相關分析中,相關的兩變量都是隨機的。4關于相關系數,下面不正確的描述是(B)。A當01時,表示兩變量不完全相關;B當r=0時,表示兩變量間無相關;C兩變量之間的相關關系是單相關;D如果自變量增長引起因變量的相應增長,就形成正相關關系。5欲以圖形顯示兩變量X和Y的關系,最好創(chuàng)建(D)。A 直方圖 B 圓形圖C 柱形圖 D 散點圖6兩變量X和Y的相關系數為0.8,則其回歸直線的判定系數為(C

5、 )。A 0.50 B 0.80C 0.64 D 0.907在完成了構造與評價一個回歸模型后,我們可以(D)。A 估計未來所需樣本的容量B 計算相關系數和判定系數C 以給定的因變量的值估計自變量的值D 以給定的自變量的值估計因變量的值8兩變量的線性相關系數為0,表明兩變量之間(D)。A 完全相關B 無關系C 不完全相關D 不存在線性相關9身高和體重之間的關系是(C)。A 函數關系 B 無關系C 共變關系 D 嚴格的依存關系10在相關分析中,對兩個變量的要求是(A )。A 都是隨機變量B 都不是隨機變量C 其中一個是隨機變量,一個是常數D 都是常數11在回歸分析中,兩個變量(D)。A 都是隨機變

6、量 B 都不是隨機變量C 自變量是隨機變量 D 因變量是隨機變量12一元線性回歸模型和多元線性回歸模型的區(qū)別在于只有一個(B)。A 因變量 B 自變量 C 相關系數 D 判定系數13以下指標恒為正的是(D)。A 相關系數r B 截距a C 斜率b D 復相關系數14下列關系中,屬于正相關關系得是(A)。A 身高與體重 B 產品與單位成本C 正常商品的價格和需求量 D 商品的零售額和流通費率三、多項選擇1關于積差系數,下面正確的說法是(ABCD )。A積差系數是線性相關系數B積差系數具有PRE性質C在積差系數的計算公式中,變量X和Y是對等關系D在積差系數的計算公式中,變量X和Y都是隨機的2關于皮

7、爾遜相關系數,下面正確的說法是( )。 A皮爾遜相關系數是線性相關系數B積差系數能夠解釋兩變量間的因果關系 Cr公式中的兩個變量都是隨機的Dr的取值在1和0之間E皮爾遜相關系數具有PRE性質,但這要通過r2加以反映3簡單線性回歸分析的特點是(ABE)。A 兩個變量之間不是對等關系B 回歸系數有正負號C 兩個變量都是隨機的D 利用一個回歸方程,兩個變量可以互相推算E 有可能求出兩個回歸方程4反映某一線性回歸方程y=a+bx好壞的指標有(ABD)。A 相關系數 B 判定系數C b的大小 D 估計標準誤E a的大小5模擬回歸方程進行分析適用于(ACDE)。A 變量之間存在一定程度的相關系數B 不存在

8、任何關系的幾個變量之間C 變量之間存在線性相關D 變量之間存在曲線相關E 時間序列變量和時間之間6判定系數r2=80%和含義如下(ABC)。A 自變量和因變量之間的相關關系的密切程度B 因變量y的總變化中有80%可以由回歸直線來解釋和說明C 總偏差中有80%可以由回歸偏差來解釋D 相關系數一定為0.64 E 判定系數和相關系數無關7回歸分析和相關分析的關系是(ABE)。A 回歸分析可用于估計和預測B 相關分析是研究變量之間的相互依存關系的密切程度C 回歸分析中自變量和因變量可以互相推導并進行預測D 相關分析需區(qū)分自變量和因變量E 相關分析是回歸分析的基礎8以下指標恒為正的是(BC)。A 相關系

9、數 B 判定系數C 復相關系數 D 偏相關系數E 回歸方程的斜率9一元線性回歸分析中的回歸系數b可以表示為(BC)A 兩個變量之間相關關系的密切程度B 兩個變量之間相關關系的方向C 當自變量增減一個單位時,因變量平均增減的量D 當因變量增減一個單位時,自變量平均增減的量E 回歸模型的擬合優(yōu)度10關于回歸系數b,下面正確的說法是( )。 Ab也可以反映X和Y之間的關系強度。;B回歸系數不解釋兩變量間的因果關系; C b公式中的兩個變量都是隨機的;Db的取值在1和-1之間;Eb也有正負之分。四、名詞解釋1消減誤差比例變量間的相關程度,可以用不知Y與X有關系時預測Y的誤差,減去知道Y與X有關系時預測

10、Y的誤差,再將其化為比例來度量。將削減誤差比例記為PRE。2 確定性關系當一個變量值確定后,另一個變量值夜完全確定了。確定性關系往往表現成函數形式。3非確定性關系在非確定性關系中,給定了一個變量值,另一個變量值還可以在一定范圍內變化。4因果關系變量之間的關系滿足三個條件,才能斷定是因果關系。1)連個變量有共變關系,即一個變量的變化會伴隨著另一個變量的變化;2)兩個變量之間的關系不是由其他因素形成的,即因變量的變化是由自變量的變化引起的;3)兩個變量的產生和變化有明確的時間順序,即一個在前,另一個在后,前者稱為自變量,后者稱為因變量。5單相關和復相關單相關只涉及到兩個變量,所以又稱為二元相關。三

11、個或三個以上的變量之間的相關關系則稱為復相關,又稱多元相關。6正相關與負相關正相關與負相關:正相關是指一個變量的值增加時,另一變量的值也增加;負相關是指一個變量的值增加時,另一變量的值卻減少。7散點圖散點圖:將相關表所示的各個有對應關系的數據在直角坐標系上畫出來,以直觀地觀察X與Y的相互關系,即得相關圖,又稱散點圖。8皮爾遜相關系數r皮爾遜相關系數是協(xié)方差與兩個隨機變量X、Y的標準差乘積的比率。9同序對在觀察X序列時,如果看到,在Y中看到的是,則稱這一配對是同序對。10異序對在觀察X序列時,如果看到,在Y中看到的是,則稱這一配對是異序對。11同分對如果在X序列中,我們觀察到(此時Y序列中無),

12、則這個配對僅是X方向而非Y方向的同分對;如果在Y序列中,我們觀察到(此時X序列中無),則這個配對僅是Y方向而非X方向的同分對;我們觀察到,也觀察到,則稱這個配對為X與Y同分對。五、判斷題1由于削減誤差比例的概念不涉及變量的測量層次,因此它的優(yōu)點很明顯,用它來定義相關程度可適用于變量的各測量層次。 ( )2不管相關關系表現形式如何,當1時,變量X和變量Y都是完全相關。( )3不管相關關系表現形式如何,當0時,變量X和變量Y都是完全不相關。( ×)4通過列聯(lián)表研究定類變量之間的關聯(lián)性,這實際上是通過相對頻數條件分布的比較進行的。而如果兩變量間是相關的話,必然存在著Y的相對頻數條件分布相同

13、,且和它的相對頻數邊際分布相同。 ( ×) 5如果眾數頻數集中在條件頻數分布列聯(lián)表的同一行中,系數便會等于0,從而無法顯示兩變量之間的相關性。 ( )6從分析層次上講,相關分析更深刻一些。因為相關分析具有推理的性質,而回歸分析從本質上講只是對客觀事物的一種描述,知其然而不知其所以然。( ×)六、計算題1對某市市民按老中青進行喜歡民族音樂情況的調查,樣本容量為200人,調查結果示于下表,試把該頻數列聯(lián)表:轉化為相對頻數的聯(lián)合分布列聯(lián)表轉化為相對頻數的條件分布列聯(lián)表;指出對于民族音樂的態(tài)度與被調查者的年歲有無關系,并說明理由。對于民族音樂的態(tài)度(Y)年歲(X)老 中 青 喜歡

14、不喜歡38 38 3015 33 462已知十名學生身高和體重資料如下表,(1)根據下述資料算出身高和體重的皮爾遜相關系數和斯皮爾曼相關系數;(2)根據下述資料求出兩變量之間的回歸方程(設身高為自變量,體重為因變量)。身高(cm)171167177154169體重(kg)5356644955身高(cm)175163152172162體重(kg)6652475850【皮爾遜相關系數:0.889,斯皮爾曼相關系數:0.94,回歸方程:Y=-54.48+0.66X】3假定有不同文化程度的3545歲育齡婦女100人的生育情況如下表,求文化程度與平均生育數的相關系數r。序號一二三四五育齡婦女人數2020

15、202020文化程度(年)平均生育數04.7463.3193.08122.41161.944某市有12所大專院校,現組織一個評審委員會對各校校園及學生體質進行評價,結果如下,試求環(huán)境質量與學生體質的關系的斯皮爾曼相關系數和肯得爾等級相關系數。環(huán)境名次397512810211416體質名次596712811110324【斯皮爾曼相關系數:0.94,肯德爾等級相關系數:0.83】5以下是婚姻美滿與文化程度的抽樣調查的結果,請計算婚姻美滿與文化程度之Gamma系數和肯德爾相關系數c。 文化程度婚姻美滿大學中學小學美 滿9165一 般83018不美滿347【c=0.18】6以下為兩位評判員對10名參賽

16、人名次的打分。試用斯皮爾曼等級相關系數來描述兩評判員打分的接近程度。參賽人ABCDEFGHIJ評判員1評判員21122433455866778991010【斯皮爾曼相關系數:0.95】7某原始資料為:X65739188765396678285Y571313.574.5156.71011要求:(1)求回歸方程;(2)這是正相關還是負相關;(3)求估計標準誤差;(4)用積差法求相關系數?!綴=-11.48+0.27X】【正相關】【相關系數r=0.95】8兩變量X、Y之間的關系如下表,X24681012Y14109754(1)求回歸方程; (2)求相關系數?!綴=-0.957X+14.867】【r=

17、0.98】9試就下表所示資料,計算關于身高和體重的皮爾遜相關系數。N0身高(厘米)體重(千克)1 2 3 4 5 6 7 8 910 160 161 16516516717017217417618051565966637069738065【r=0.77】10青年歌手大獎賽評委會對10名決賽選手的演唱水平(X)和綜合素質(Y)進行打分,評價結果如下表(表中已先將選手按演唱水平作了次序排列)所示,試計算選手的演唱水平和綜合素質間的肯德爾等級相關系數及斯皮爾曼等級相關系數。 選手名 A B C D E F G H I J 演唱水平(X)綜合素質(Y) 1 2 3 4 5 6 7 8 9 10 3 1

18、 5 2 7 4 10 8 6 9 【肯德爾系數:0.56,斯皮爾曼系數:0.76】11青年歌手大獎賽,假設五位評委對10名決賽選手的演唱水平進行排序,他們的有關評價結果列于下表,試通過計算肯德爾和諧系數,檢驗專家意見的一致性和相關程度。五位評委10名決賽選手A B C D E F G H I J A B C D E 1 2 3 4 5 6 7 8 9 10 3 2 1 4 5 8 9 7 10 6 1 3 2 4 8 7 6 5 9 10 4 2 1 5 3 10 8 6 7 9 5 2 1 9 3 8 4 6 10 7【0.76】12某地區(qū)失業(yè)率與通貨膨脹率之間的資料如下表所示,試求:(1

19、)擬合指數回歸方程;(2)失業(yè)率與通貨膨脹率之間的相關系數。失業(yè)率(%)1.0 1.6 2.0 2.5 3.1 3.6 4.0 4.5 5.1 5.6 6.0 6.5通脹率(%)1.6 1.5 1.1 1.3 0.6 0.9 0.8 0.8 0.7 0.6 0.6 0.6【】【相關系數0.76】13試就下表所示資料,求算員工工作滿足感高與歸屬感之Gamma系數,并解釋Gamma系數具有削減誤差比例PRE性質。工作滿足感與歸屬感歸屬感(Y)工作滿足感(X) 低(1) 中(2) 高(3) 低(1) 中(2) 高(3) 8 4 3 6 5 1 4 4 5151213Fx 18 13 9 40【G=0

20、.092】14已知相關系數r0.6,估計標準誤差8,樣本容量為62。求: 1)剩余變差值;2)剩余變差占總變差的百分比;3)求總變差值。15在相關和回歸分析中,已知下列資料:16,25,19,a30。要求:1)計算相關系數r,說明相關程度;2)求出直線回歸方程。16在相關和回歸分析中,已知下列有關資料:5,10,n20,r0.9,2000。試計算:1)回歸系數b;2)回歸變差和剩余變差;3)估計標準誤差。17根據下述假設資料求回歸方程。X1234567Y23.023.424.125.226.126.927.318某10戶家庭樣本具有下列收入(元)和食品支出(元/周)數據:收入(X)203033

21、40151326382543支出(Y)7981154810910要求:1)寫出最小平方法計算的回歸直線方程; 2)在95.46把握下,當X45時,寫出Y的預測區(qū)間。19根據下述假設資料,試用積差法求相關系數。輸出X(億元)12106168910輸出Y(億元)1286111081120對40個企業(yè)的橫截面樣本數據進行一元回歸分析,因變量與其平均數的離差平方和為6000,而回歸直線擬合的剩余變差為2000,求:1)變量間的相關指數R;2)該方程的估計標準誤差。七、問答題1簡述積差系數的特性。2簡述回歸分析和相關分析之間的密切聯(lián)系。部分計算參考:(見計算題六)2. 已知十名學生身高和體重資料如下表,

22、(1)根據下述資料算出身高和體重的皮爾遜相關系數和斯皮爾曼相關系數;(2)根據下述資料求出兩變量之間的回歸方程(設身高為自變量,體重為因變量)。編號身高(cm)體重(kg)1171532167563177644154495169556175667163528152479172581016250皮爾遜相關系數與回歸方程編號身高(cm)x體重(kg)yxy117153292412809906321675627889313693523177643132940961132841544923716240175465169552856130259295617566306254356115507163522

23、6569270484768152472310422097144917258295843364997610162502624425008100合計16625502768623060091830斯皮爾曼相關系數編號身高(cm)次序體重(kg)次序d11714536-24216765642431771642-114154949900516955550061752661117163752700815210471000917235830010162850800合計104. 某市有12所大專院校,現組織一個評審委員會對各校校園及學生體質進行評價,結果如下,試求環(huán)境質量與學生體質的關系的斯皮爾曼相關系數和肯

24、得爾等級相關系數。環(huán)境名次397512810211416體質名次596712811110324斯皮爾曼等級相關系數環(huán)境名次體質名次d35-249900761157-2412120088001011-112111111011431112-116424合計18肯德爾等級相關系數ABCDEFGHIJKL環(huán)境名次(x)397512810211416體質名次(y)596712811110324 1) A: 同序對 AC AB AD AE AF AG AH AI AK 9 異序對 AJ AL 2 2) B: 同序對 BC BD BG BH BI BJ BK BLBE BF 10 3) C: 同序對 CE

25、CF CG CH CI CJ CK CL 8 異序對CD 1 4 D: 同序對 DE DF DG DH DI DJ DK 7 異序對 DL 1 5) E: 同序對 EG EH EI EJ EK EL EF 7 6) F: 同序對 FG FH FI FJ FK FL 6 7) G: 同序對 GH GJ GK GL 4 異序對GI 1 8) H: 同序對 HI HJ HK HL 4 9) I: 同序對 IJ IK IL 3 10)J: 同序對 JK JL 2 11)K: 同序對 KL 1合計:同序對 異序對5. 以下是婚姻美滿與文化程度的抽樣調查的結果,請計算婚姻美滿與文化程度Gamma系數和肯德

26、爾相關系數c。 文化程度婚姻美滿大學中學小學美 滿9165一 般83018不美滿347=9×(30+18+4+7)+16×(18+7)+8×(4+7)+30×7=1229=5×(30+8+3+4)+18×(3+4)+16×(8+3)+30×3=6170.186以下試兩位評判員對10名參賽人名次的打分。試用斯皮爾曼等級相關系數來描述兩評判員打分的接近程度。參賽人ABCDEFGHIJ評判員1評判員21122433455866778991010參賽人評審員1評審員2dA1100B2200C4311D34-11E5500F8624G67-11H78-11I9900J101000合計87某原始資料為:X65739188765396678285Y571313.574.5156.71011要求:(1)求回歸方程; (2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論